像數(shù)據(jù)達(dá)人一樣思考和溝通:數(shù)據(jù)科學(xué)、統(tǒng)計(jì)學(xué)與機(jī)器學(xué)習(xí)極簡入門
定 價(jià):¥68
中 教 價(jià):¥40.12 (5.90折)促銷
庫 存 數(shù): 0
《像數(shù)據(jù)達(dá)人一樣思考和溝通:數(shù)據(jù)科學(xué)、統(tǒng)計(jì)學(xué)與機(jī)器學(xué)習(xí)》是一本完備的數(shù)據(jù)科學(xué)指南,尤其適用于職場人。本書既包括了職場中應(yīng)用數(shù)據(jù)的場景介紹,也包括了算法背后的數(shù)學(xué)知識(shí)。兩位作者在數(shù)據(jù)科學(xué)普及領(lǐng)域深耕多年,立志打造一本有趣、貼近生活,且非常具有可讀性的數(shù)據(jù)科學(xué)入門書。每個(gè)人都能成為數(shù)據(jù)達(dá)人,積極地參與與數(shù)據(jù)科學(xué)、統(tǒng)計(jì)、機(jī)器學(xué)習(xí)相關(guān)的工作。本書適合作為商務(wù)專業(yè)人員、工程師、行政人員,以及有志成為數(shù)據(jù)科學(xué)家的研究人員的自學(xué)參考讀物,也可以作為數(shù)據(jù)科學(xué)相關(guān)培訓(xùn)機(jī)構(gòu)的教材。
在我們?nèi)缃竦纳詈吐殘鲋校瑹o可避免地要接觸大量的數(shù)據(jù)。數(shù)據(jù)是怎樣被用來講故事的?它又是如何說服,乃至有時(shí)欺騙我們的?資深數(shù)據(jù)科學(xué)家在《像數(shù)據(jù)達(dá)人一樣思考和溝通》中給你答案。
對(duì)于許多旁觀者而言,傳統(tǒng)數(shù)據(jù)分析、大數(shù)據(jù)和人工智能是全然不同,且毫不相關(guān)的事物。然而,《像數(shù)據(jù)達(dá)人一樣思考和溝通》這本書將要匡正這樣的認(rèn)知,并指出這3個(gè)領(lǐng)域事實(shí)上是高度相關(guān)的。它們都涉及統(tǒng)計(jì)思維,而一些傳統(tǒng)的分析方法,例如回歸分析、數(shù)據(jù)可視化技術(shù)等,對(duì)這3個(gè)領(lǐng)域同樣適用。統(tǒng)計(jì)學(xué)中的預(yù)測分析與人工智能領(lǐng)域的監(jiān)督式機(jī)器學(xué)習(xí)基本上就是一回事。而且,大多數(shù)的數(shù)據(jù)分析技術(shù)也適用于各種規(guī)模的數(shù)據(jù)集。簡而言之,一位優(yōu)秀的數(shù)據(jù)達(dá)人可以高效地處理好這3方面的工作,而花費(fèi)大量時(shí)間去細(xì)究它們之間的差異則往往是無用功。固有觀念2: 只有專業(yè)的數(shù)據(jù)科學(xué)家才能成為數(shù)據(jù)熱潮中的弄潮兒。人們有時(shí)對(duì)數(shù)據(jù)科學(xué)家盲目崇拜,認(rèn)為只有他們才有可能有效地處理和分析數(shù)據(jù)。然而,近來興起了一陣全新的、極為重要的潮流,旨在讓數(shù)據(jù)思維變得更加全民化。越來越多的機(jī)構(gòu)開始注重培養(yǎng)普通員工的數(shù)據(jù)思維和數(shù)據(jù)分析能力。自動(dòng)化機(jī)器學(xué)習(xí)工具使得人們可以更輕松地建立數(shù)學(xué)模型,并利用模型出色地完成預(yù)測工作。當(dāng)然,我們?nèi)孕枰獙I(yè)的數(shù)據(jù)科學(xué)家負(fù)責(zé)開發(fā)新算法,并為那些進(jìn)行復(fù)雜數(shù)據(jù)分析工作的普通員工把關(guān)。但是,一些單位選擇把與數(shù)據(jù)分析相關(guān)的工作交給單位中那些非科班出身的數(shù)據(jù)達(dá)人負(fù)責(zé),這樣做往往能夠讓數(shù)據(jù)科學(xué)家專注更重要的工作。固有觀念3: 數(shù)據(jù)科學(xué)家無所不能,他們掌握著從事數(shù)據(jù)活動(dòng)所需的全部技能。數(shù)據(jù)科學(xué)家是受過專業(yè)訓(xùn)練,從事模型開發(fā)和代碼編寫工作的人。人們往往想當(dāng)然地認(rèn)為,數(shù)據(jù)科學(xué)家同樣能夠包攬模型的實(shí)際應(yīng)用工作。換句話說,人們認(rèn)為數(shù)據(jù)科學(xué)家是無所不能的。但實(shí)際上這樣的人鳳毛麟角。對(duì)于一個(gè)數(shù)據(jù)科學(xué)項(xiàng)目來說,那些不僅了解數(shù)據(jù)科學(xué)的基礎(chǔ)知識(shí),而且了解所處行業(yè)、能夠有效地管理項(xiàng)目,并擅長建立業(yè)務(wù)關(guān)系的數(shù)據(jù)達(dá)人才是無價(jià)之寶。他們不但能夠勝任數(shù)據(jù)科學(xué)工作,還能提升數(shù)據(jù)科學(xué)項(xiàng)目的商業(yè)價(jià)值。固有觀念4: 人們需要具有非常高的數(shù)學(xué)天賦,并經(jīng)受大量訓(xùn)練,才有可能在數(shù)據(jù)和分析方面取得成功。一個(gè)相關(guān)的假設(shè)是,為了從事數(shù)據(jù)科學(xué)工作,人們必須在該領(lǐng)域接受過良好的培訓(xùn),因此一個(gè)數(shù)據(jù)達(dá)人也必須非常擅長和數(shù)字打交道。數(shù)據(jù)方面的天賦與訓(xùn)練固然對(duì)從事數(shù)據(jù)科學(xué)相關(guān)工作有幫助,但《像數(shù)據(jù)達(dá)人一樣思考和溝通》這本書中的一個(gè)觀點(diǎn)令我深感認(rèn)同: 一個(gè)擁有動(dòng)力的學(xué)習(xí)者能夠掌握數(shù)據(jù)和分析知識(shí),并在數(shù)據(jù)科學(xué)項(xiàng)目中貢獻(xiàn)力量。部分原因是,統(tǒng)計(jì)分析的基本概念遠(yuǎn)沒有那么深?yuàn)W;同時(shí),想要參與數(shù)據(jù)科學(xué)項(xiàng)目,也并不需要極高水平的數(shù)據(jù)和分析能力。與專業(yè)數(shù)據(jù)科學(xué)家協(xié)作,或是參與自動(dòng)化人工智能項(xiàng)目,需要的只是提出關(guān)鍵問題的能力和好奇心、在業(yè)務(wù)問題和定量結(jié)果之間建立聯(lián)系并識(shí)別出可疑假說的能力而已。固有觀念5: 如果你在大學(xué)或研究生階段的主要研究方向并非定量(quantitative)領(lǐng)域,那么現(xiàn)在學(xué)習(xí)數(shù)據(jù)和分析方法所需的知識(shí)就為時(shí)已晚。這一觀念甚至得到了調(diào)查數(shù)據(jù)的支持: 在Splunk公司于2019年對(duì)全球約1300名高管的調(diào)查報(bào)告中,幾乎所有受訪者 (98%) 都認(rèn)為數(shù)據(jù)技能對(duì)他們未來的工作很重要。81%的高管認(rèn)同數(shù)據(jù)技能是成為高級(jí)領(lǐng)導(dǎo)者所必需的,而85%的人認(rèn)為掌握數(shù)據(jù)技能會(huì)讓他們?cè)诠局凶兊酶袃r(jià)值。盡管如此,仍有67%的人表示他們不習(xí)慣自己獲取或使用數(shù)據(jù),73%的人認(rèn)為數(shù)據(jù)技能相較于其他業(yè)務(wù)技能更難習(xí)得,53%的人認(rèn)為自己年紀(jì)太大,已經(jīng)錯(cuò)過了學(xué)習(xí)數(shù)據(jù)技能的黃金時(shí)期。這種數(shù)據(jù)失敗主義(data defeatism)對(duì)個(gè)人和組織都是有害的,而本書作者和我都認(rèn)為這不過是無稽之談。仔細(xì)閱讀本書正文,你會(huì)發(fā)現(xiàn)其中不涉及任何艱深難懂的知識(shí)!因此,拋開這些固有的觀念吧,讓自己成為一個(gè)數(shù)據(jù)達(dá)人。你將成為職場上更有價(jià)值的員工,并幫助你所在的機(jī)構(gòu)變得更加成功。這就是世界的發(fā)展方向,是時(shí)候開始加入浪潮,更加深入地了解數(shù)據(jù)及其分析方法了。我相信,閱讀《像數(shù)據(jù)達(dá)人一樣思考和溝通》,探索數(shù)據(jù)科學(xué),你將會(huì)收獲一段富有價(jià)值且充滿樂趣的旅程。前言對(duì)于本書的讀者來說,無論主觀意愿如何,數(shù)據(jù)或許已經(jīng)成為你工作中最重要的一部分,沒有之一。而你之所以翻開這本書,大概是因?yàn)橄M軌蛄私鈹?shù)據(jù)究竟是怎么一回事。首先,有必要重復(fù)一個(gè)老生常談的問題: 在這個(gè)時(shí)代,每個(gè)人創(chuàng)造和接收的信息比以往任何時(shí)候都多。毫無疑問,現(xiàn)在是一個(gè)數(shù)字的時(shí)代。而這個(gè)數(shù)字時(shí)代也催生了一個(gè)充斥著承諾、行話和產(chǎn)品的行業(yè),其中許多是翻開本書的你,你的經(jīng)理、同事和下屬正在或?qū)⒁佑|的。但是,盡管與數(shù)據(jù)相關(guān)的承諾和產(chǎn)品不斷涌現(xiàn),數(shù)據(jù)科學(xué)方面的商業(yè)項(xiàng)目卻往往會(huì)很快就陷入失敗。美國科技博客VentureBeat在2019年進(jìn)行了一個(gè)調(diào)查,其中顯示87%以上的數(shù)據(jù)項(xiàng)目以失敗告終。這里需要澄清一下,我們并非暗示所有關(guān)于數(shù)據(jù)的承諾都言之無物,或所有的產(chǎn)品都糟糕透頂。相反,要真正了解這個(gè)領(lǐng)域,必須首先接受一個(gè)基本事實(shí): 事情遠(yuǎn)比我們想象的要復(fù)雜。從事數(shù)據(jù)方面的工作意味著與數(shù)字、細(xì)微差別和不確定性打交道。數(shù)據(jù)至關(guān)重要,這毫無疑問,但與此同時(shí),它并不簡單。然而,有一個(gè)行業(yè)卻在試圖讓人們忽視這一點(diǎn)這是一個(gè)在不確定的世界中試圖承諾確定性,并利用公司對(duì)落伍的恐懼而牟利的行業(yè)。我們?cè)诒緯袑⑵浞Q為數(shù)據(jù)科學(xué)工業(yè)復(fù)合體(Data Science Industrial Complex)。數(shù)據(jù)科學(xué)工業(yè)復(fù)合體對(duì)于身處其中的每個(gè)人來說,數(shù)據(jù)科學(xué)工業(yè)復(fù)合體都是一個(gè)有待關(guān)注的問題。企業(yè)不斷買入產(chǎn)品,期待它們能代替自己進(jìn)行思考;經(jīng)理們雇傭名不副實(shí)的專家;各種機(jī)構(gòu)都在招聘數(shù)據(jù)科學(xué)家,卻并沒有做好迎接他們的準(zhǔn)備;高管們不得不聆聽無窮無盡的行業(yè)黑話,并假裝理解。這樣的現(xiàn)狀造成了大量數(shù)據(jù)項(xiàng)目的停滯和資金的浪費(fèi)。
第1篇掌握數(shù)據(jù)達(dá)人的思維第1章定義問題31.1數(shù)據(jù)達(dá)人應(yīng)該掌握的問題41.2了解數(shù)據(jù)項(xiàng)目失敗的原因101.3解決重要的問題14本章小結(jié)15第2章何為數(shù)據(jù)162.1數(shù)據(jù)與信息172.2數(shù)據(jù)類型192.3數(shù)據(jù)的收集與組織方式202.4基本匯總統(tǒng)計(jì)23本章小結(jié)24第3章統(tǒng)計(jì)學(xué)思維253.1學(xué)會(huì)質(zhì)疑263.2無處不在的隨機(jī)波動(dòng)293.3概率與統(tǒng)計(jì)34本章小結(jié)41像數(shù)據(jù)達(dá)人一樣思考和溝通目錄第2篇掌握數(shù)據(jù)達(dá)人的語言第4章質(zhì)詢數(shù)據(jù)454.1你會(huì)怎么做?474.2數(shù)據(jù)的來源是什么?534.3數(shù)據(jù)是否具有代表性?564.4是否缺少某些數(shù)據(jù)?574.5數(shù)據(jù)集的大小59本章小結(jié)60第5章探索數(shù)據(jù)615.1探索性數(shù)據(jù)分析625.2培養(yǎng)探索心態(tài)645.3數(shù)據(jù)是否能解答問題?655.4你是否能從數(shù)據(jù)中發(fā)現(xiàn)某些相關(guān)性?715.5你是否從數(shù)據(jù)中發(fā)現(xiàn)了新的機(jī)會(huì)?76本章小結(jié)77第6章檢查概率786.1猜概率: 筆記本電腦是否感染病毒796.2游戲規(guī)則806.3概率思想實(shí)驗(yàn)876.4謹(jǐn)慎做出獨(dú)立性假設(shè)906.5一切概率都是條件概率926.6保證概率數(shù)字有意義96本章小結(jié)99第7章質(zhì)疑統(tǒng)計(jì)1007.1統(tǒng)計(jì)推斷的簡短討論1017.2統(tǒng)計(jì)推斷的過程1087.3用于質(zhì)疑統(tǒng)計(jì)結(jié)果的問題109本章小結(jié)118第3篇理解數(shù)據(jù)科學(xué)家的工具箱第8章尋找未知分組1218.1無監(jiān)督學(xué)習(xí)1238.2數(shù)據(jù)降維1238.3主成分分析法(PCA)1268.4聚類1318.5k均值聚類133本章小結(jié)137第9章理解回歸模型1399.1監(jiān)督學(xué)習(xí)1409.2線性回歸能做些什么1429.3線性回歸帶給我們什么1469.4線性回歸的隱患1499.5其他回歸模型155本章小結(jié)156第10章理解分類模型15710.1分類模型介紹15810.2邏輯回歸16010.3決策樹16510.4集成方法16910.5謹(jǐn)防陷阱17210.6準(zhǔn)確性的誤解174本章小結(jié)178第11章理解文本分析17911.1文本分析的期望18011.2文本如何變成數(shù)字18211.3主題建模19211.4文本分類19411.5實(shí)際處理文本分析的細(xì)節(jié)200本章小結(jié)203第12章解析深度學(xué)習(xí)概念20412.1神經(jīng)網(wǎng)絡(luò)20612.2深度學(xué)習(xí)的應(yīng)用21312.3深度學(xué)習(xí)的實(shí)踐22312.4人工智能與你227本章小結(jié)230第4篇確 保 成 功第13章注意陷阱23513.1數(shù)據(jù)中的偏差和怪象23613.2陷阱大清單242本章小結(jié)247第14章知人善任24814.1溝通中斷的7個(gè)場景24914.2數(shù)據(jù)個(gè)性255本章小結(jié)257第15章未完待續(xù)259術(shù)語表263