本書分為10章。第1章介紹Python語言的起源和特性,以及安裝Python及其開發環境的方法;第2章介紹Python語言的基礎知識;第3章介紹Python數據組織結構,作為學習后續數據操作的基礎;第4~7章介紹為了能夠有效進行數據分析和數據挖掘所必須對數據進行的多種處理方法;第8章介紹使用不同的Python擴展庫,以不同的可視化方法和形式對數據進行探索和分析;第9章介紹數據分析方法;第10章介紹數據挖掘的關聯、分類和聚類算法。
本書配套以下教學資源:教學PPT、習題答案、數據分析支撐文件、程序代碼等,請選用本書作教材的教師登錄www.cmpedu.com注冊后下載,或發郵件至jinacmp@163.com索取(注明學校名+姓名)。
本書可作為普通高校計算機、大數據、人工智能、金融管理等專業的教材,也可供廣大從事數據分析、人工智能、機器學習等應用系統開發的技術人員參考。
本書配有電子課件和程序代碼,書中的程序代碼均在Python 3.8、Anaconda 3上調試通過,有些需要安裝第三方庫。選用本書作教材的老師請登錄www.cmpedu.com注冊下載課件等教學資源,或發郵件至jinacmp@163.com索取。
目錄
前言
第1章Python介紹及安裝1
1.1Python出現1
1.2Python的特性2
1.3安裝和使用Python3
單元練習13
第2章Python語言基礎14
2.1Python語句14
2.2基本數據類型17
2.3標識符與變量18
2.4運算及運算符20
2.5程序結構24
2.6面向對象28
2.7常用標準庫函數29
2.8自定義函數45
單元練習47
第3章Python數據組織
結構493.1字符串49
3.2列表54
3.3元組60
3.4集合61
3.5映射(字典)64
3.6數組67
3.7矩陣74
3.8系列78
3.9數據框架81
單元練習93
第4章數據生成和采集96
4.1數據生成和載入96
4.2數據文件訪問114
4.3數據庫訪問134
4.4網絡數據采集136
單元練習151
第5章數據整理153
5.1數據類型及精度轉換153
5.2數據抽樣154
5.3缺失值處理157
5.4重復值處理160
5.5異常值處理161
5.6排序162
5.7標準化163
5.8離散化165
5.9數值編碼167
5.10擬合與插值171
單元練習175
第6章數據變換177
6.1線性空間變換177
6.2域變換183
單元練習185
第7章數據規約186
7.1主成分分析186
7.2因子分析187
7.3獨立成分分析189
7.4多維標度分析190
7.5線性判別分析191
7.6TSNE193
7.7特征選擇194
單元練習197
第8章數據可視化分析198
8.1Matplotlib繪圖198
8.2Pandas繪圖229
8.3Seaborn繪圖241
8.4Networkx繪圖255
8.5Graphviz繪圖256
單元練習257
第9章數據分析261
9.1統計分析261
9.2回歸分析280
9.3時間序列分析288
單元練習301
第10章數據挖掘304
10.1關聯分析304
10.2分類歸納308
10.3聚類分析326
單元練習336
參考文獻338