前言
第1章 大數(shù)據(jù)概述
1.1 大數(shù)據(jù)定義
1.1.1 初識大數(shù)據(jù)
1.1.2 大數(shù)據(jù)的特征
1.1.3 大數(shù)據(jù)技術(shù)
1.2 大數(shù)據(jù)的結(jié)構(gòu)類型
1.2.1 結(jié)構(gòu)化數(shù)據(jù)
1.2.2 半結(jié)構(gòu)化數(shù)據(jù)
1.2.3 非結(jié)構(gòu)化數(shù)據(jù)
1.2.4 其他分類方式下的數(shù)據(jù)類型
1.3 大數(shù)據(jù)發(fā)展
1.3.1 大數(shù)據(jù)概念發(fā)展
1.3.2 大數(shù)據(jù)浪潮下數(shù)據(jù)存儲的發(fā)展
1.4 大數(shù)據(jù)應(yīng)用及挑戰(zhàn)
1.4.1 大數(shù)據(jù)應(yīng)用
1.4.2 大數(shù)據(jù)發(fā)展面臨的挑戰(zhàn)
本章小結(jié)
思考題
第2章 大數(shù)據(jù)采集
2.1 大數(shù)據(jù)來源
2.2 大數(shù)據(jù)采集設(shè)備
2.2.1 科研數(shù)據(jù)采集設(shè)備
2.2.2 網(wǎng)絡(luò)數(shù)據(jù)采集設(shè)備
2.3 大數(shù)據(jù)采集方法
2.3.1 科研大數(shù)據(jù)采集方法
2.3.2 網(wǎng)絡(luò)大數(shù)據(jù)采集方法
2.3.3 系統(tǒng)日志采集方法
2.4 大數(shù)據(jù)預(yù)處理技術(shù)
2.4.1 數(shù)據(jù)預(yù)處理技術(shù)基本概述
2.4.2 數(shù)據(jù)清理
2.4.3 數(shù)據(jù)集成
2.4.4 數(shù)據(jù)變換與數(shù)據(jù)離散化
本章小結(jié)
思考題
第3章 大數(shù)據(jù)存儲
3.1 云存儲
3.1.1 云存儲簡介
3.1.2 云存儲技術(shù)
3.2 大數(shù)據(jù)存儲
3.2.1 大數(shù)據(jù)存儲的特點與挑戰(zhàn)
3.2.2 存儲系統(tǒng)架構(gòu)
3.2.3 新興數(shù)據(jù)庫技術(shù)
3.3 數(shù)據(jù)中心
3.3.1 數(shù)據(jù)中心概述
3.3.2 數(shù)據(jù)中心的演進
3.3.3 數(shù)據(jù)中心的分級
3.3.4 數(shù)據(jù)中心的體系結(jié)構(gòu)
3.4 數(shù)據(jù)倉庫
3.4.1 數(shù)據(jù)倉庫的基本概念
3.4.2 數(shù)據(jù)倉庫的體系結(jié)構(gòu)
本章小結(jié)
思考題
第4章 大數(shù)據(jù)計算平臺
4.1 云計算
4.1.1 云計算定義
4.1.2 云計算特點
4.1.3 云計算體系架構(gòu)
4.1.4 云計算與相關(guān)計算形式
4.1.5 云計算的機遇與挑戰(zhàn)
4.2 云計算平臺
4.2.1 主流分布式計算系統(tǒng)
4.2.2 主流分布式計算平臺
4.3 MapReduce平臺
4.3.1 數(shù)據(jù)存儲技術(shù)
4.3.2 數(shù)據(jù)管理技術(shù)
4.3.3 編程模型
4.4 Hadoop平臺
4.4.1 Hadoop概述
4.4.2 Hadoop結(jié)構(gòu)
4.4.3 Hadoop分布式文件系統(tǒng)HDFS
4.4.4 Hadoop中的M印Reduce
……
第5章 大數(shù)據(jù)分析
第6章 大數(shù)據(jù)挖掘
第7章 大數(shù)據(jù)下的機器學習算法
第8章 大數(shù)據(jù)可視化
第9章 社會大數(shù)據(jù)
第10章 交通大數(shù)據(jù)
第11章 醫(yī)療大數(shù)據(jù)
第12章 金融大數(shù)據(jù)
第13章 大數(shù)據(jù)教育