本書系統、全面地介紹了大數據技術的基礎知識,期望學生通過對本書的學習和實踐了解大數據技術的概貌,掌握Hadoop生態圈大數據技術中*為基礎和關鍵的知識。主要內容包括大數據概述、大數據軟件技術基礎、大數據存儲技術、MapReduce分布式編程、數據采集與預處理、數據倉庫與聯機分析技術、數據挖掘與分析技術、Spark分布式內存計算框架、數據可視化技術、大數據安全。
1.本書為教育部高等學校計算機類專業教學指導委員會-華為ICT產學結合項目的成果
2.提供系統完整的數據科學與大數據專業解決方案
3.名校名師打造大數據領域精品力作
4.全面介紹大數據技術概況
5.講解Hadoop生態圈平臺、工具與技術
薛志東,博士,研究員,現任華中科技大學軟件學院大數據研究室主任。1997年7月于原華中理工大學獲學士學位;2002年6月于華中科技大學計算機應用專業獲碩士學位;2006年6月于華中科技大學系統分析與集成專業獲博士學位;2006年9月于華中科技大學計算機科學與技術博士后流動站開展研究工作。在圖像處理及生物信息學領域發表論文10余篇,曾承擔國家自然科學