《深入淺出數據分析》以類似"章回小說”的活潑形式,生動地向讀者展現出色的數據分析人員應知應會的技術:數據分析基本步驟、實驗方法、優(yōu)化方法、假設檢驗方法、貝葉斯統(tǒng)計方法、主觀概率法、啟發(fā)法、直方圖法、回歸法、誤差處理、相關數據庫、數據整理技巧;正文之后,意猶未盡地以三篇附錄介紹數據分析十大要務、R工具及ToolPak工具,在充分展現目標知識以外,為讀者搭建了走向深入研究的橋梁。
《企業(yè)級大數據項目實戰(zhàn):用戶搜索行為分析系統(tǒng)從0到1》基于真實業(yè)務場景,以項目導向為主線,從0到1全面介紹“企業(yè)級大數據用戶搜索行為分析系統(tǒng)”的搭建過程。全書共6章,第1章講解項目需求與架構設計,詳細闡述項目數據流與系統(tǒng)架構;第2章介紹大數據項目開發(fā)環(huán)境配置,手把手帶領讀者配置操作系統(tǒng)、Hadoop集群與相關工具,為后續(xù)項目實施打下基礎;第3~5章逐步實現項目需求,第3章講解“用戶行為數據采集模塊”的開發(fā),第4章講解“用戶行為數據離線分析模塊”的開發(fā),第5章講解“用戶行為數據實時分析模塊”的開發(fā)
對于任何依賴經常性收入和重復銷售的企業(yè)來說,讓客戶保持活躍并持續(xù)購買是必不可少的。客戶流失(或“流失”),這種代價高昂且令人沮喪的事情是可以預防的。通過使用本書中介紹的技術,你可以識別客戶流失的預警信號,并學會在客戶離開之前識別并挽留他們。《客戶留存數據分析與預測》向開發(fā)人員和數據科學家傳授經過實踐證明的技術與方法,可以在客戶流失發(fā)生之前阻止其發(fā)生。本書包含很多來自現實中的示例,介紹如何將原始數據轉換為可衡量的行為指標、計算客戶生命周期價值,并使用人口統(tǒng)計數據改進客戶流失預測。通過遵循
《數據科學對社會科學轉型的重大影響研究》從數據科學發(fā)展引致的科研范式轉換視角,研究數據科學驅動社會科學轉型的問題,重點研究數據科學驅動下的社會科學將具有何種全新的特征,探索社會科學研究在數據科學驅動下的轉型路徑。《數據科學對社會科學轉型的重大影響研究》主要研究內容包括:數據科學的知識體系與方法工具、社會科學研究范式演化與數據科學在社會科學中的應用、社會科學研究的現實環(huán)境變遷與突出問題、數據科學驅動的社會科學認知體系重構、數據科學作用下的社會科學研究特征、數據驅動的社會科學轉型的條件與保障等。
本書主要圍繞數據權利體系,梳理數據及其權利內涵,把握全球數據主權發(fā)展態(tài)勢,關切國際數據權利體系演進、數據權利保護模式,并梳理我國數據權利發(fā)展現狀與建構路徑;分別圍繞主權視角下數據權利規(guī)制的關鍵場景——數據跨境、關鍵挑戰(zhàn)——數據壟斷、關鍵工具——數據產權,探討數據主權風險、國際治理進展、我國治理現狀,思考主權視角下我國數據權利治理進路與具體方案,并從個人數據、政府數據角度展開主權視角下數據權利治理實證研究。
大數據資源規(guī)劃與統(tǒng)籌發(fā)展是新技術背景下提出的重大命題。本書圍繞這一重大命題,將大數據置于國家戰(zhàn)略高度,詳細闡述了大數據資源規(guī)劃理論模型,以及如何建設大數據資源規(guī)劃與統(tǒng)籌發(fā)展保障體系。本書作為專著,具有很強的專業(yè)型、理論性和時代性,本書以“大數據資源規(guī)劃理論與統(tǒng)籌發(fā)展研究”為主題,以規(guī)劃理論與應用為切入點,形成大數據資源規(guī)劃理論,建立大數據資源規(guī)劃模型,理順基于規(guī)劃的大數據資源統(tǒng)籌發(fā)展路徑,并以面向公共文化服務的大數據資源規(guī)劃與統(tǒng)籌發(fā)展應用為案例進行剖析,促進大數據資源的多場景綜合應用、
Azure Databricks是一款基于云的大數據分析和機器學習平臺,用于實現基于Apache Spark的數據處理,為快速增長的海量數據的處理和決策需求分析提供了良好的支撐。《Apache Spark大數據分析:基于Azure Databricks云平臺》詳細介紹基于Azure Databricks云平臺來使用Apache Spark完成大規(guī)模數據處理和分析的方法。本書總計11章,首先介紹大規(guī)模數據分析相關的概念;然后介紹受管的Spark及其與Databricks的關系,以及Databric
本書基于大數據研究系統(tǒng)的能力評估框架與方法,針對傳統(tǒng)的能力評估理論和方法主要存在的缺陷,從大數據中挖掘有價值的信息來輔助評估,以提高評估的客觀性、科學性、可信性。本書借助魯棒有序回歸方法,構建了基于大數據的交互式能力評估新型框架;通過特征選擇算法分析了行動效果關鍵影響要素;將魯棒有序回歸方法用于確定評估模型的參數,并提出了認知最優(yōu)最劣方法、區(qū)間認知網絡過程和區(qū)間最優(yōu)最劣方法3種新的基于兩兩比較的方法,用于輔助專家提供評估的參考信息。本書提出的能力評估框架和方法可以推廣到多種評估
本書從博弈論基礎開始,系統(tǒng)地介紹了博弈論在數據安全中的應用,匯集了近年來基于博弈論研究數據安全的最新成果,重點探討了秘密共享的可公開驗證模型及博弈論分析、數據外包情況下的博弈模型、激勵相容機制和抗共謀機制以及隱私保護的博弈分析、基于信息論的理性委托攻防模型,為數據外包更新提出了有效策略。本書觀點新穎獨到,研究內容均為作者原創(chuàng)科研成果,對制定正確的數據安全策略,提高數據安全保障能力具有重要的參考價值。 本書概念清晰、結構合理、內容深入淺出、通俗易懂,不僅闡述了博弈論與數據安全的基本理論,同
? 為什么花更少的錢買更偏遠的房子不一定劃算?? 為什么得分最多的運動員不一定是好運動員?? 為什么癌癥發(fā)病率上升竟可能是一件好事?? 泰勒主義、績效管理、科學管理、關鍵績效指標等理論都建立在同一個假設之上:如果你考核員工并提供激勵,你就會得到理想的結果。但事實真的是這樣嗎?我們使用衡量指標來了解世界上許多重要的事:教育和醫(yī)療系統(tǒng)是否高效,一個國家是否比另一個國家更富裕,哪個城市的生活質量更高……在這本書中,作者分享了許多選用錯誤的衡量指標,進而帶來糟糕結果的案例,展示了衡量指標如何影