本書定位于大數據專業核心技術——實時計算,重點討論大數據應用場景中的數據特點和應用需求的實時流計算技術。
本書通過對分布式實時計算系統的分析,將學習部分按功能性質劃分成四個模塊,分別為Kafka數據流處理模塊、Strom實時計算模塊、HBase數據存儲模塊和Zookeeper分布式協調模塊。對此四個工作模塊進行教學化處理,形成HBase基礎操作、Zookeeper集群管理、配置Storm集群等核心課程體系,并配以實例使學習者便于理解,易于上手,掌握實時計算Storm相關的基礎知識和實際業務系統的開發能力。
本書主要針對具有一定軟件編程基礎(特別是數據技術)的學生和專業工程師,特別是數據科學、數據分析專業的高年級本科學生以及從事與數據相關的高級技術人員的讀者人群。