《Spark 3 x綜合項目實戰》分為基礎篇、案例篇兩部分。在基礎篇(第1-2章)中首先介紹了Spark運行環境的搭建、Spark的生態體系、編程模型、Scala基本語法、高階函數、集合等方面的基礎知識;在案例篇(第3-7章)中的5個綜合案例詳實的介紹了如何使用Spark實現音樂、房地產、氣象、電商等領域大數據分析與挖掘的技巧。主要目的是通過Spark綜合應用項目,幫助讀者食味知髓,領悟Spark項目的精妙而步步漸悟,修煉成Spark高手。同時,本書還提供了詳細的實訓指導、數據源和程序代碼等配套
隨著社交網絡等新型應用的興起和云計算等新技術的快速發展,人類獲取數據的規模正以前所未有的速度增長,數據中包含了大量有價值的信息,能夠有效助力社會、經濟、科技的發展,因此數據管理與分析方面的研究工作倍受關注。本書針對該領域的研究熱點和前沿技術進行了深入淺出的介紹,包括圖數據、云數據庫系統、時空數據、數據質量、數據庫智能化等,幫助讀者構建宏觀視野,把握領域前沿。本書適合數據管理與分析等相關領域的科研人員、年輕教師、研究生,以及從事相關工作的人員閱讀。
這是一部從企業架構視角系統講解企業級數據架構的著作,包含數據架構的原理、方法和實踐。本書擬分為四個部分共17個章節來系統性的闡述數據架構相關內容;第1部分 架構基礎主要包含1個章節1.數據架構與企業架構 其主要從宏觀的角度闡述企業架構與數據架構的關系以及重要性使讀者明白數據架構并不是孤立存在的且與企業架構息息相關第2部分 數據架構基礎主要包含5個章節從理論以及工具層面闡述數據架構的構成2.數據架構構成 介紹數據架構的主要組成以及框架3.數據存儲 數據架構落地中常見的存儲選型以及實用場景4.數據調
這是一本能為數字化轉型企業的數據治理提供全面指導的著作。它基于國際主流的數據治理框架和用友多年的數據治理經驗,從道、法、術、器4個維度全面而深入地展開,不僅有數據治理在戰略層面的頂層設計,還有數據治理在執行層面的實施方法,既可以作為數據治理的綱領性指南,又可以作為數據治理的實操手冊。從數據治理的戰略規劃到落地實施,本書將各環節的核心內容凝練為“3個戰略機制、8項關鍵舉措、7種技術能力、7個治理工具”。數據治理之道——3個戰略機制高屋建瓴地介紹了數據治理的數據戰略、組織機制和數據文化。這
作為人工智能的核心技術,機器學習在數據分析中具有舉足輕重的地位。本書在介紹機器學習相關知識的基礎上,主要介紹了如何對有噪聲的數據進行魯棒回歸分析。全書共6章,除第1章外,各章對異常點或重尾分布數據中的具體問題進行了詳細分析與建模,所涉及的問題包括權值選擇問題、變量相關性問題以及網絡數據問題等。本書對于構建具有魯棒性的機器學習模型具有很好的參考性,適用于含噪聲的數據分析與應用,可供數據分析、人工智能等相關專業師生及行業技術人員參考閱讀。
本書以 BI 負責人的視角介紹 BI 分析師的核心工作和應具備的核心技能,并分析 BI 創造價值的專題,理論和實例并重。全書分為四部分: 第一部分(第 1、2 章)為 BI 概述與團隊組建,從介紹 BI 分析的基本概念說起,包含BI 職責與數據驅動的概述,以及組建團隊時需要考慮的能力模 型、團隊選型、團隊管理。第二部分(第 3、4 章)為 BI 體系搭建基礎知識,包括數據獲取與管理,指標體系的概念、設計模型與使用場景。第三部分(第 5 ~ 9 章)為 BI 創造價值專題
本書匯總了數據科學中經常使用的數學知識,包括矩陣基礎、微積分、概率論和優化等,以矩陣和向量形式統一了幾個內容的符號體系,系統全面地介紹了數據科學的數學基礎。全書共7章,內容包括線性代數、向量空間、內積空間、矩陣分解、向量微積分、概率與分布和優化方法。本書兼顧數學表達的嚴謹性和知識描述的直觀性,減少了枯燥的證明過程,增加了易懂的幾何繪圖和運用示例,有助于讀者快速理解數據科學中必要的數學知識。本書適用于從事數據科學學術和應用研究,以及工程建設的教師、研究生和科技人員教學
本書介紹了代數結構、幾何結構、Lie群和Lie代數等基本理論,運用Lie對稱方法研究了光纖通信等領域中五個非線性系統的一些對稱性質和解析解。研究了GDNLS方程、DEGM系統、DR系統和Maccari系統的Lie點對稱、Lie對稱約化、對稱變換、非線性自伴性和守恒律。運用Painlevé截斷展開方法導出了GBK系統的非局部對稱,研究了CRE可積性,得到了單孤波解,雙共振孤波解和孤波-橢圓波相互作用解。
首席數據官(Chief Data Officer,CDO)是數字時代的產物,它在數字化轉型的過程中,以及在轉型成功后的數字經濟中,都會起到關鍵作用。本書旨在建立一套相對完整的關于首席數據官的知識體系,幫助讀者更好地參與數字時代的發展。本書分為5篇。第一篇 CDO概論介紹CDO產生的背景、發展趨勢、主要職責、技能和工作路徑等。第二篇 管好數據講解CDO如何管理好數據,涉及數據戰略、數據治理、數據制度、數據標準、數據架構、數據質量、數據安全、數據合規、數據建模、數據集成、數據存儲、
本書旨在盡可能系統而全面地向讀者展示多智能體協同控制相關的內容。首先簡要且清晰地介紹了學習多智能體協同控制必備的知識,包含圖論、矩陣理論和Lyapunov穩定性理論等,從第3章開始直至第17章,分別介紹了經典或熱門的多智能體系統協同控制問題,其中第3~13章所介紹的控制方案適用范圍較廣,而第14~17章則分別以具體的實際系統為例,介紹了常見多智能體系統協同控制方法。本書在編寫時盡量避免章節之間的交叉,因此讀者可根據興趣或需求閱讀部分章節,但并不會影響其對相關控制思想的學習和理解。本書可供