編程語言是數據科學最重要的工具, 編程不是目的, 編程是為數據科學服務。我們希望通過處理數據來學習編程語言, 本書以目標導向的編程訓練方式, 引導讀者在使用軟件完成任務過程中學會編程。當然, 我們的目標是數據分析而不是諸如漫游、動畫、生成網頁等其他實踐, 因此, 這里的訓練內容也是基于數據處理及相關畫圖的需要。我們的訓練是從簡單的數字及邏輯運算、線性代數運算到機器學習模型擬合的由簡入繁、循序漸進的過程。
本書為沒有專門學過計算機軟件編程又要經常做數據分析的讀者所編寫, 讓人們學會用 Python 編程處理各種數據課題。本書的對象群體包括涉及統計或其延伸領域 (比如計量經濟等) 的師生及做數據分析的廣大讀者。
吳喜之,北京大學數學力學系本科畢業,北卡羅來納大學統計學博士。中國人民大學統計學院教授,博士生導師。曾在南開大學、北京大學、加利福尼亞大學、北卡羅來納大學等多所著名學府執教。
張敏,云南財經大學統計學博士, 現就職于重慶工商大學。以第一作者公開發表了CSSCI/CSCD/SCI 多篇文章, 主持或參與國家及省部級課題多項, 以第二作者出版關于數據科學的教材多部。
第一部分 訓練篇
第1章 初等編程訓練
第2章有監督學習概要
第3章以決策樹為載體的訓練
第4章交叉驗證及組合方法訓練
第5章以神經網略為載體的訓練
第二部分 Python基本參考
第6章 一些預備知識
第7章 Python 基本函數
第8章 類和子類簡介
第9章numpy 模塊
第10章pandas模塊
第11章matplotlib模塊
第12章seaborn模塊
第13章scipy模塊