對(duì)于希望使用Python來(lái)完成數(shù)據(jù)分析工作的人來(lái)說(shuō),學(xué)習(xí)IPython、Numpy、pandas、Matplotlib這個(gè)組合是目前看來(lái)不錯(cuò)的方向。《Python數(shù)據(jù)分析從入門(mén)到精通》就是這樣一本循序漸進(jìn)的書(shū)。
《Python數(shù)據(jù)分析從入門(mén)到精通》共3篇14章。第1篇是Python數(shù)據(jù)分析語(yǔ)法入門(mén),將數(shù)據(jù)分析用到的一些語(yǔ)言的語(yǔ)法基礎(chǔ)講解清楚,為接下來(lái)的數(shù)據(jù)分析做鋪墊。第2篇是Python數(shù)據(jù)分析工具入門(mén),介紹了Python數(shù)據(jù)分析四劍客IPython、Numpy、pandas、Matplotlib。第3篇是Python數(shù)據(jù)分析案例實(shí)戰(zhàn),包括兩個(gè)案例,分別是數(shù)據(jù)挖掘和玩轉(zhuǎn)大數(shù)據(jù),為讀者能真正使用Python進(jìn)行數(shù)據(jù)分析奠定基礎(chǔ)。
《Python數(shù)據(jù)分析從入門(mén)到精通》內(nèi)容精練、重點(diǎn)突出、實(shí)例豐富,是廣大數(shù)據(jù)分析工作者必備的參考書(shū),同時(shí)也非常適合大、中專院校師生學(xué)習(xí)閱讀,還可作為高等院校統(tǒng)計(jì)分析及相關(guān)專業(yè)的教材。
一本書(shū)搞定Python數(shù)據(jù)分析四劍客:IPython、Numpy、Matplotlib、pandas
基于Python 3.6,兼容Python 3.x等眾多版本
以多小代碼案例、多動(dòng)手的方式,使讀者在實(shí)踐中成長(zhǎng)
前 言
由于Python具有簡(jiǎn)單、易學(xué)、免費(fèi)開(kāi)源、可移植性、可擴(kuò)展性等特點(diǎn),所以它的受歡迎程度扶搖直上。再加上Python擁有非常豐富的庫(kù),這也使得它在數(shù)據(jù)分析領(lǐng)域有著越來(lái)越廣泛的應(yīng)用。如果你已經(jīng)決定學(xué)習(xí)Python數(shù)據(jù)分析,但是之前沒(méi)有編程經(jīng)驗(yàn),那么本書(shū)將會(huì)是你的正確選擇。
本書(shū)的第1篇主要介紹學(xué)習(xí)數(shù)據(jù)分析必備的一些Python語(yǔ)法基礎(chǔ),包括Python的安裝、數(shù)據(jù)類型、數(shù)據(jù)結(jié)構(gòu)、模塊、類、異常處理、使用pip安裝Python需要的一些工具等;第2篇主要介紹Python在數(shù)據(jù)處理和科學(xué)計(jì)算方面的工具和方法,包括IPython交互式殼的使用、Jupyter Notebook的使用和Numpy的使用,還介紹了Python的核心數(shù)據(jù)分析處理庫(kù)pandas,以及Python著名的2D繪圖庫(kù)Matplotlib;第3篇通過(guò)數(shù)據(jù)挖掘和玩轉(zhuǎn)大數(shù)據(jù)兩個(gè)案例總結(jié)和應(yīng)用前面所學(xué)的知識(shí)。
這三篇的層進(jìn)正好是Python數(shù)據(jù)分析入門(mén)者的階梯,讀者通過(guò)學(xué)習(xí)這三部分內(nèi)容,即可邁入數(shù)據(jù)分析的門(mén)檻。
本書(shū)的特點(diǎn)
Python是當(dāng)前非常流行的面向?qū)ο缶幊陶Z(yǔ)言,本書(shū)將其在數(shù)據(jù)分析處理方面的特色發(fā)揮到極致。本書(shū)的主要特點(diǎn)如下:
.Python被大量應(yīng)用在數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域,其中使用極其廣泛的是IPython、Numpy、pandas、Matplotlib等庫(kù)。本書(shū)詳細(xì)地介紹了這些庫(kù)的組成與使用,為科學(xué)計(jì)算相關(guān)人員提供了有用的參考資料。
.本書(shū)采取循序漸進(jìn)的寫(xiě)作風(fēng)格,對(duì)于工具的安裝、使用步驟、方法技巧逐步展開(kāi),加以圖解和應(yīng)用場(chǎng)景,即使完全不懂Python和數(shù)據(jù)分析的人員,也可以流暢地讀完本書(shū)。
.無(wú)論哪種語(yǔ)言,編程的方法、模式、數(shù)據(jù)結(jié)構(gòu)、算法都是相通的。本書(shū)將科學(xué)計(jì)算、數(shù)據(jù)結(jié)構(gòu)與各種工具和方法完美結(jié)合,讓非Python讀者也能融會(huì)貫通,讓學(xué)習(xí)統(tǒng)計(jì)的人能找到更適合的統(tǒng)計(jì)方法和數(shù)據(jù)分析處理方法。
.本書(shū)最后的兩個(gè)實(shí)戰(zhàn)案例適合數(shù)據(jù)分析入門(mén)者,案例的步驟詳細(xì)、分析到位,能為讀者入手真實(shí)項(xiàng)目打下良好的基礎(chǔ)。
本書(shū)的內(nèi)容安排
本書(shū)共3篇14章,主要章節(jié)規(guī)劃如下:
第1章介紹了Python的發(fā)展歷程、特性,幫助讀者搭建最基礎(chǔ)的數(shù)據(jù)分析環(huán)境,下載開(kāi)發(fā)語(yǔ)言,選擇開(kāi)發(fā)工具,然后在此基礎(chǔ)上開(kāi)發(fā)自己的第一個(gè)Python程序。讀者在學(xué)完本章內(nèi)容后應(yīng)該對(duì)Python有一個(gè)基礎(chǔ)的認(rèn)識(shí),知道為什么選擇它來(lái)進(jìn)行數(shù)據(jù)分析。
第2章介紹了Python的基礎(chǔ)語(yǔ)法,包括它的代碼組織形式、如何縮進(jìn)、如何注釋等,以及輸入/輸出該如何處理,在中文環(huán)境下如何更好地使用Python是本章的重點(diǎn),最后還通過(guò)一個(gè)實(shí)例復(fù)習(xí)了Python的這些語(yǔ)法。讀者在學(xué)完本章內(nèi)容后可以輕松地編寫(xiě)一些簡(jiǎn)單的Python程序。
第3章介紹了Python的數(shù)據(jù)類型與流程控制語(yǔ)句。如果讀者已有編程基礎(chǔ),那么閱讀本章內(nèi)容不會(huì)有任何壓力。如果沒(méi)有編程基礎(chǔ),那么學(xué)習(xí)一門(mén)語(yǔ)言的流程控制最關(guān)鍵的就是這些知識(shí)。讀者在閱讀完本章后就能輕松閱讀更大的Python程序。
第4章介紹了可復(fù)用的函數(shù)與模塊。這些內(nèi)容較為復(fù)雜,但卻是進(jìn)行數(shù)據(jù)分析的關(guān)鍵。每個(gè)數(shù)據(jù)處理過(guò)程我們都會(huì)用到函數(shù)或模塊,而我們后期用到的數(shù)據(jù)分析庫(kù)也可以說(shuō)是一個(gè)大函數(shù)。所以學(xué)習(xí)完本章內(nèi)容,讀者應(yīng)該能夠看明白一個(gè)完整的Python庫(kù)。
第5章介紹了數(shù)據(jù)結(jié)構(gòu)與算法,這是數(shù)據(jù)分析的基礎(chǔ),也是人工智能的基礎(chǔ)。利用算法我們可以找到解決方案,也可以找到最優(yōu)路徑,還可以更高效地完成數(shù)據(jù)分析任務(wù)。讀者如果沒(méi)有看懂本章內(nèi)容,一定要反復(fù)閱讀,直到學(xué)會(huì)為止。
第6章介紹了面向?qū)ο蟮腜ython。面向?qū)ο笠呀?jīng)成為每門(mén)語(yǔ)言都具備的特性,類、對(duì)象、繼承這些概念都是面向?qū)ο蟮幕A(chǔ)。如果讀者沒(méi)有編程經(jīng)驗(yàn),則閱讀本章可能會(huì)有一定的難度,但是了解了對(duì)象的概念,就能學(xué)會(huì)如何編寫(xiě)更高效的代碼、如何讓代碼和代碼之間聯(lián)動(dòng)起來(lái)。
第7章介紹了異常處理與程序調(diào)試。機(jī)器畢竟不是人,如果出現(xiàn)錯(cuò)誤,則可能會(huì)導(dǎo)致死機(jī),或者數(shù)據(jù)出錯(cuò)。為了防止這些錯(cuò)誤的發(fā)生,或者防止程序的使用方能得到反饋,我們必須學(xué)會(huì)Python的異常處理功能。并且當(dāng)程序發(fā)生錯(cuò)誤時(shí),我們還要通過(guò)程序調(diào)試找到錯(cuò)誤所在。
第8章介紹了pip軟件包管理。既然在做數(shù)據(jù)分析時(shí)我們要用到很多數(shù)據(jù)分析庫(kù),那么如何下載、安裝或管理這些庫(kù)就成了數(shù)據(jù)分析的第一步。pip就是這樣一個(gè)工具,它能下載、安裝、更新、顯示、搜索我們需要的數(shù)據(jù)分析庫(kù)。
第9章介紹了IPython科學(xué)計(jì)算庫(kù),它是使用Python進(jìn)行數(shù)據(jù)分析、處理、呈現(xiàn)的重要選擇之一。本章主要介紹了Python科學(xué)計(jì)算庫(kù)的安裝方法、IPython殼的一些特性和基本功能、Jupyter Notebook的安裝和使用方法。IPython殼的使用是本章的重點(diǎn),也是數(shù)據(jù)分析處理的基礎(chǔ)工具,希望讀者能夠消化本章內(nèi)容,為真正做好數(shù)據(jù)項(xiàng)目打下基礎(chǔ)。
第10章介紹了Numpy科學(xué)計(jì)算庫(kù),主要介紹了它的數(shù)組對(duì)象及數(shù)組對(duì)象的一些基本屬性和生成數(shù)組的基本方法,還包括數(shù)組的索引和分片等基本操作,這部分內(nèi)容是Numpy數(shù)據(jù)處理的核心。本章介紹的代數(shù)運(yùn)算函數(shù)、線性代數(shù)、統(tǒng)計(jì)函數(shù)等內(nèi)容會(huì)讓讀者覺(jué)得有些困惑,但這已經(jīng)進(jìn)入了數(shù)據(jù)分析的關(guān)鍵時(shí)刻,所以仍建議讀者對(duì)本章的內(nèi)容融會(huì)貫通。
第11章介紹了pandas數(shù)據(jù)分析處理庫(kù),主要包括它的序列、數(shù)據(jù)框的基本操作,還包括pandas里處理默認(rèn)值、讀取常見(jiàn)格式的文本數(shù)據(jù),以及數(shù)據(jù)的組合和分組操作。最后介紹了pandas的時(shí)間序列和一個(gè)處理實(shí)際數(shù)據(jù)集的案例,讀者掌握了這些內(nèi)容,就可以更好地處理數(shù)據(jù)。
第12章介紹了Matplotlib的Pyplot和Artist模塊,以及pandas的繪圖功能。對(duì)于讀者來(lái)說(shuō),Pyplot模塊是需要掌握的,Artist模塊是需要了解的,pandas的繪圖功能在實(shí)際數(shù)據(jù)分析中要能熟練應(yīng)用。
第13章是數(shù)據(jù)挖掘的案例。首先介紹了著名的貝葉斯理論,然后實(shí)現(xiàn)了貝葉斯分類器,最后實(shí)現(xiàn)了協(xié)同過(guò)濾算法,這些都是數(shù)據(jù)挖掘、分析領(lǐng)域的基礎(chǔ)算法。建議讀者嘗試自己編寫(xiě)代碼,熟練掌握貝葉斯分類器和協(xié)同過(guò)濾算法的使用。
第14章是玩轉(zhuǎn)大數(shù)據(jù)的案例。鑒于本書(shū)主要針對(duì)數(shù)據(jù)分析入門(mén)者,所以本章也逐步實(shí)現(xiàn)了數(shù)據(jù)的分析過(guò)程,從了解數(shù)據(jù)到分析數(shù)據(jù),最后到代碼實(shí)現(xiàn),相信讀者學(xué)完本章內(nèi)容后,就能真正動(dòng)手分析大數(shù)據(jù)了。
本書(shū)由淺入深、從理論到實(shí)踐,尤其適合初學(xué)者逐步學(xué)習(xí)和完善自己的知識(shí)結(jié)構(gòu)。
適合閱讀本書(shū)的讀者
.希望從事數(shù)據(jù)分析相關(guān)工作的人員。
.數(shù)據(jù)分析工作人員。
.大數(shù)據(jù)從業(yè)人員。
.Python愛(ài)好者。
.人工智能從業(yè)人員。
.統(tǒng)計(jì)行業(yè)的人員。
.大、中專院校統(tǒng)計(jì)相關(guān)專業(yè)的學(xué)生。
張嘯宇:熱衷于一切計(jì)算機(jī)技術(shù),目前在搜狐公司從事數(shù)據(jù)分析、數(shù)據(jù)挖掘、深度學(xué)習(xí)、后端開(kāi)發(fā)等方面的工作。計(jì)劃做一個(gè)Python技術(shù)學(xué)習(xí)交流的網(wǎng)站,到時(shí)歡迎各位來(lái)閑逛。
李靜:天津大學(xué)軟件工程碩士畢業(yè),對(duì)利用Python進(jìn)行數(shù)據(jù)處理、整理、分析等有比較深入的研究,并在輔助教學(xué)實(shí)踐中積累了較為豐富的經(jīng)驗(yàn),廣受好評(píng)。本書(shū)也是結(jié)合實(shí)踐積累,以多小代碼案例、多動(dòng)手的方式,使讀者在實(shí)踐中成長(zhǎng)。
目 錄
第1篇 Python數(shù)據(jù)分析語(yǔ)法入門(mén)
第1章 初識(shí)Python1
1.1 Python是什么2
1.2 Python有什么優(yōu)點(diǎn)3
1.2.1 Python是自由開(kāi)源的軟件3
1.2.2 Python是跨平臺(tái)的3
1.2.3 Python功能強(qiáng)大4
1.2.4 Python是可擴(kuò)展的4
1.2.5 Python易學(xué)易用5
1.3 其他程序設(shè)計(jì)語(yǔ)言中的Python5
1.3.1 Jython5
1.3.2 Python for .NET6
1.3.3 IronPython6
1.4 快速搭建Python開(kāi)發(fā)環(huán)境7
1.4.1 Python的下載和安裝7
1.4.2 用Visual Studio編譯Python源代碼9
1.4.3 Python開(kāi)發(fā)工具:Vim10
1.4.4 Python開(kāi)發(fā)工具:Emacs15
1.4.5 Python開(kāi)發(fā)工具:PythonWin18
1.4.6 其他的Python開(kāi)發(fā)工具20
1.5 第一個(gè)Python程序22
1.5.1 從Hello, Python!開(kāi)始22
1.5.2 Python的交互式命令行24
1.6 本章小結(jié)25
第2章 Python起步必備27
2.1 Python代碼的組織形式和注釋方式27
2.1.1 用縮進(jìn)來(lái)分層28
2.1.2 代碼的兩種注釋方式29
2.1.3 Python語(yǔ)句的斷行30
2.2 Python的基本輸入/輸出函數(shù)31
2.2.1 接收輸入的input()函數(shù)31
2.2.2 輸出內(nèi)容的print()函數(shù)32
2.3 Python對(duì)中文的支持33
2.3.1 Python 3之前的版本如何使用中文33
2.3.2 更全面的中文支持36
2.4 簡(jiǎn)單實(shí)用的Python計(jì)算器37
2.4.1 直接進(jìn)行算術(shù)運(yùn)算37
2.4.2 math模塊提供豐富的數(shù)學(xué)函數(shù)38
2.4.3 Python對(duì)大整數(shù)的支持39
2.5 本章小結(jié)40
第3章 Python的數(shù)據(jù)類型與流程控制語(yǔ)句41
3.1 Python數(shù)據(jù)類型:數(shù)字42
3.1.1 整型和浮點(diǎn)型42
3.1.2 運(yùn)算符43
3.2 Python數(shù)據(jù)類型:字符串45
3.2.1 Python中的字符串45
3.2.2 字符串中的轉(zhuǎn)義字符46
3.2.3 操作字符串46
3.2.4 字符串的索引和分片49
3.2.5 格式化字符串50
3.2.6 字符串、數(shù)字類型的轉(zhuǎn)換50
3.2.7 原始字符串51
3.3 Python數(shù)據(jù)類型:列表和元組52
3.3.1 創(chuàng)建和操作列表52
3.3.2 創(chuàng)建和操作元組53
3.4 Python數(shù)據(jù)類型:字典54
3.5 Python數(shù)據(jù)類型:文件55
3.6 Python數(shù)據(jù)類型:布爾值56
3.7 Python的流程控制語(yǔ)句56
3.7.1 分支結(jié)構(gòu):if語(yǔ)句57
3.7.2 循環(huán)結(jié)構(gòu):for語(yǔ)句59
3.7.3 循環(huán)結(jié)構(gòu):while語(yǔ)句62
3.8 本章小結(jié)63
第4章 可復(fù)用的函數(shù)與模塊64
4.1 Python自定義函數(shù)65
4.1.1 函數(shù)的定義65
4.1.2 函數(shù)調(diào)用66
4.2 參數(shù)讓函數(shù)更有價(jià)值67
4.2.1 有默認(rèn)值的參數(shù)67
4.2.2 參數(shù)的傳遞方式69
4.2.3 如何傳遞任意數(shù)量的參數(shù)70
4.2.4 用參數(shù)返回計(jì)算結(jié)果70
4.3 變量的作用域71
4.4 最簡(jiǎn)單的函數(shù):使用lambda表達(dá)式定義函數(shù)72
4.5 可重用結(jié)構(gòu):Python模塊73
4.5.1 Python模塊的基本用法73
4.5.2 Python在哪里查找模塊75
4.5.3 是否需要編譯模塊77
4.5.4 模塊也可獨(dú)立運(yùn)行78
4.5.5 如何查看模塊提供的函數(shù)名79
4.6 用包來(lái)管理多個(gè)模塊80
4.6.1 包的組成80
4.6.2 包的內(nèi)部引用81
4.7 本章小結(jié)81
第5章 數(shù)據(jù)結(jié)構(gòu)與算法82
5.1 表、棧和隊(duì)列82
5.1.1 表83
5.1.2 棧84
5.1.3 隊(duì)列86
5.2 樹(shù)和圖88
5.2.1 樹(shù)88
5.2.2 二叉樹(shù)89
5.2.3 圖93
5.3 查找與排序95
5.3.1 查找96
5.3.2 排序97
5.4 本章小結(jié)100
第6章 面向?qū)ο蟮腜ython101
6.1 面向?qū)ο缶幊谈攀?01
6.1.1 Python中的面向?qū)ο笏枷?02
6.1.2 類和對(duì)象102
6.2 在Python中定義和使用類103
6.2.1 類的定義104
6.2.2 類的使用105
6.3 類的屬性和方法106
6.3.1 類的屬性107
6.3.2 類的方法108
6.4 類的繼承111
6.4.1 使用繼承111
6.4.2 Python的多重繼承112
6.5 在類中重載方法和運(yùn)算符114
6.5.1 方法重載114
6.5.2 運(yùn)算符重載115
6.6 在模塊中定義類117
6.7 本章小結(jié)119
第7章 異常處理與程序調(diào)試120
7.1 異常的處理120
7.1.1 使用try語(yǔ)句捕獲異常121
7.1.2 常見(jiàn)異常的處理123
7.1.3 多重異常的捕獲124
7.2 用代碼引發(fā)異常125
7.2.1 使用raise語(yǔ)句引發(fā)異常126
7.2.2 assert簡(jiǎn)化的raise語(yǔ)句127
7.2.3 自定義異常類128
7.3 使用pdb模塊調(diào)試Python腳本128
7.3.1 調(diào)試語(yǔ)句塊129
7.3.2 調(diào)試表達(dá)式129
7.3.3 調(diào)試函數(shù)130
7.3.4 設(shè)置斷點(diǎn)131
7.3.5 pdb調(diào)試命令131
7.4 在PythonWin中調(diào)試腳本134
7.5 本章小結(jié)136
第8章 pip軟件包管理137
8.1 安裝pip137
8.2 更新pip138
8.3 pip常用操作138
8.3.1 安裝軟件包138
8.3.2 卸載軟件包139
8.3.3 更新軟件包139
8.3.4 顯示本地所有已經(jīng)安裝的軟件包139
8.3.5 顯示軟件包的細(xì)節(jié)139
8.3.6 搜索軟件包140
8.3.7 通過(guò)wheel文件安裝軟件包141
8.4 本章小結(jié)141
第2篇 Python數(shù)據(jù)分析工具入門(mén)
第9章 IPython科學(xué)計(jì)算庫(kù)142
9.1 IPython簡(jiǎn)介143
9.2 安裝IPython及其他相關(guān)庫(kù)144
9.2.1 使用Anaconda安裝144
9.2.2 使用pip安裝145
9.3 IPython殼基礎(chǔ)146
9.3.1 自動(dòng)補(bǔ)全147
9.3.2 檢查149
9.3.3 %run命令150
9.3.4 快捷鍵150
9.3.5 異常和錯(cuò)誤定位151
9.3.6 魔法方法151
9.3.7 和操作系統(tǒng)交互152
9.3.8 代碼分析:%prun和%run153
9.3.9 目錄標(biāo)簽系統(tǒng)155
9.3.10 嵌入IPython155
9.4 融合Matplotlib庫(kù)和Pylab模型156
9.5 輸入和輸出變量157
9.6 交互式調(diào)試器158
9.7 計(jì)時(shí)功能159
9.8 重新載入模塊160
9.9 配置IPython161
9.10 Jupyter162
9.10.1 基于Qt的控制臺(tái)162
9.10.2 Jupyter Notebook165
9.11 IPython和Jupyter Notebook的關(guān)系170
9.12 本章小結(jié)173
第10章 Numpy科學(xué)計(jì)算庫(kù)174
10.1 Numpy基礎(chǔ)174
10.1.1 數(shù)組對(duì)象介紹175
10.1.2 生成數(shù)組176
10.1.3 數(shù)組對(duì)象數(shù)據(jù)類型180
10.1.4 打印數(shù)組182
10.2 數(shù)組的基本操作184
10.3 基本的分片和索引操作186
10.4 高級(jí)索引189
10.4.1 整數(shù)索引189
10.4.2 布爾索引190
10.4.3 布爾索引的簡(jiǎn)單應(yīng)用192
10.5 改變數(shù)組的形狀193
10.6 組裝、分割數(shù)組195
10.7 數(shù)組的基本函數(shù)196
10.8 復(fù)制和指代198
10.9 線性代數(shù)199
10.10 使用數(shù)組來(lái)處理數(shù)據(jù)201
10.11 Numpy的where()函數(shù)和統(tǒng)計(jì)函數(shù)203
10.11.1 where()函數(shù)203
10.11.2 統(tǒng)計(jì)函數(shù)205
10.12 輸入與輸出206
10.12.1 二進(jìn)制文件206
10.12.2 文本文件207
10.13 生成隨機(jī)數(shù)208
10.14 數(shù)組的排序和查找210
10.14.1 排序210
10.14.2 查找212
10.15 擴(kuò)充轉(zhuǎn)換213
10.16 本章小結(jié)215
第11章 pandas數(shù)據(jù)分析處理庫(kù)216
11.1 pandas數(shù)據(jù)結(jié)構(gòu)介紹217
11.1.1 序列217
11.1.2 數(shù)據(jù)框221
11.2 索引對(duì)象226
11.3 核心的基本函數(shù)227
11.4 索引和旋轉(zhuǎn)229
11.5 算術(shù)運(yùn)算與對(duì)齊232
11.6 處理默認(rèn)值233
11.7 多級(jí)索引237
11.8 讀/寫(xiě)數(shù)據(jù)239
11.9 組合數(shù)據(jù)243
11.10 數(shù)據(jù)分組操作247
11.11 時(shí)間序列249
11.11.1 時(shí)間序列介紹250
11.11.2 使用時(shí)間序列作圖253
11.12 本章小結(jié)259
第12章 Matplotlib數(shù)據(jù)可視化260
12.1 Pyplot模塊介紹261
12.1.1 plot()函數(shù)261
12.1.2 繪制子圖264
12.1.3 添加注釋266
12.1.4 其他的坐標(biāo)軸類型268
12.2 應(yīng)用Pyplot模塊269
12.3 Artist模塊275
12.3.1 Artist模塊概述275
12.3.2 Artist的屬性277
12.4 使用pandas繪圖283
12.5 本章小結(jié)287
第3篇 Python數(shù)據(jù)分析案例實(shí)戰(zhàn)
第13章 案例1:數(shù)據(jù)挖掘288
13.1 貝葉斯理論介紹288
13.2 貝葉斯分類器的實(shí)現(xiàn)290
13.3 協(xié)同過(guò)濾推薦系統(tǒng)295
13.3.1 相似度計(jì)算296
13.3.2 協(xié)同過(guò)濾推薦系統(tǒng)的實(shí)現(xiàn)300
13.4 本章小結(jié)304
第14章 案例2:玩轉(zhuǎn)大數(shù)據(jù)305
14.1 案例概述306
14.1.1 了解大數(shù)據(jù)的處理方式306
14.1.2 處理日志文件307
14.1.3 案例目標(biāo)308
14.2 日志文件的分割309
14.3 編寫(xiě)Map()函數(shù)處理小文件311
14.4 編寫(xiě)Reduce()函數(shù)313
14.5 本章小結(jié)315