本書是一部意外之作,也是一部驚喜之作。
這是一本非常簡(jiǎn)單的 Python 機(jī)器學(xué)習(xí)入門教程,具有以下特色。 獨(dú)創(chuàng)的黑箱教學(xué)模式,全書無(wú)任何抽象理論和深?yuàn)W的數(shù)學(xué)公式。 首次系統(tǒng)化融合 Sklearn 人工智能軟件和 Pandas 數(shù)據(jù)分析軟件,無(wú)須使用復(fù)雜的 Numpy 數(shù)學(xué)矩陣模塊。 三位一體的課件模式:圖書+開發(fā)平臺(tái)+成套的教學(xué)案例,系統(tǒng)講解,逐步深入。 系統(tǒng)化的Sklearn函數(shù)API接口中文文檔,可作為案頭工具書隨時(shí)查閱。 基于 Sklearn+Pandas 架構(gòu),全程采用 MBA 案例模式,無(wú)需任何理論基礎(chǔ),懂 Excel 就可看懂。 本書內(nèi)容原本是《零起點(diǎn) Python 足彩大數(shù)據(jù)與機(jī)器學(xué)習(xí)實(shí)盤分析》中的章節(jié),在我們內(nèi)部小范圍使用時(shí),深受學(xué)員喜愛,于是,將書中與機(jī)器學(xué)習(xí)相關(guān)的內(nèi)容和案例單獨(dú)抽取出來(lái),加入部分 Python 入門內(nèi)容,形成了《零起點(diǎn) Python 機(jī)器學(xué)習(xí)快速入門》一書。 Python 量化三部曲包括: 《零起點(diǎn) Python 大數(shù)據(jù)與量化交易》(入門教材) 《零起點(diǎn) Python 量化與機(jī)器學(xué)習(xí)實(shí)盤分析》(重點(diǎn)分析 Sklearn) 《零起點(diǎn) Python 量化與 TensorFlow 深度學(xué)習(xí)實(shí)盤分析》(重點(diǎn)分析 TensorFlow) 此外,還有兩部補(bǔ)充作品: 《零起點(diǎn) Python 足彩大數(shù)據(jù)與機(jī)器學(xué)習(xí)實(shí)盤分析》 《零起點(diǎn) Python 機(jī)器學(xué)習(xí)快速入門》 Python學(xué)習(xí)路線 機(jī)器學(xué)習(xí)、人工智能和金融量化基本原理都是相通的,本質(zhì)上都是數(shù)據(jù)分析。 本書雖然屬于“零起點(diǎn) Python”系列,但要更好地學(xué)習(xí)本書,掌握相關(guān)的配套程序,最好具備以下基礎(chǔ)。 Python 編程基礎(chǔ),不懂 Python 語(yǔ)言的讀者,先花一周時(shí)間學(xué)習(xí) Python基本知識(shí)以及 Pandas(潘達(dá)思)數(shù)據(jù)分析軟件基礎(chǔ)操作。 Top 極寬量化社區(qū)有“Python 量化與 zwQuant 學(xué)習(xí)路線圖”,大家可以參考。 先花一周時(shí)間學(xué)習(xí) Python 基礎(chǔ),再閱讀《zwPython 中文手冊(cè)》,可以少走很多彎路。
學(xué)好 Python、Pandas 基礎(chǔ)后,先將本書通讀 1~2 遍。通讀時(shí),碰到問(wèn)題沒(méi)關(guān)系,記錄一下跳過(guò)去,然后進(jìn)行精讀;正式學(xué)習(xí)每章的代碼時(shí),一定要將代碼運(yùn)行 1~2 遍,培養(yǎng)編程感覺(jué)。 根據(jù)代碼學(xué)習(xí)畫流程圖,有了流程圖就可以把握程序邏輯,重點(diǎn)是程序和策略的邏輯。 入門后,多看看配套的課件和程序源碼,全套 zwQuant 量化開源程序都帶有函數(shù)一級(jí)的中文注解。 在學(xué)習(xí)過(guò)程當(dāng)中一定要多問(wèn),可以在論壇提問(wèn),這樣大家都受益。 在群文件中有一個(gè)小軟件,即 Python流程圖繪制軟件 CODINGRAPH,使用該軟件,拷貝代碼就可以自動(dòng)繪制流程圖,對(duì)其他編程語(yǔ)言也適用。 網(wǎng)絡(luò)資源 與本書有關(guān)的程序和數(shù)據(jù)下載,請(qǐng)瀏覽網(wǎng)站,極寬量化社區(qū)中的【下載中心】欄目。本書在 TopQuant.vip 極寬量化社區(qū)設(shè)有專欄,對(duì)本書、人工智能和機(jī) 器學(xué)習(xí)有任何建議都可在社區(qū)相關(guān)欄目發(fā)布信息,我們會(huì)在第一時(shí)間進(jìn)行反饋和答復(fù)。
“零起點(diǎn)Python”系列叢書 本書繼續(xù)保持了“零起點(diǎn) Python”系列叢書的一貫風(fēng)格——簡(jiǎn)單實(shí)用。 書中配備了大量的圖表說(shuō)明,沒(méi)有枯燥的數(shù)學(xué)公式,只要懂 Word、Excel, 就能夠輕松閱讀全書。 IT 零起點(diǎn):無(wú)需任何電腦編程基礎(chǔ),只要會(huì)打字、會(huì)使用 Excel,就能看懂本書,利用本書配套的 Python 軟件包,輕松學(xué)會(huì)如何利用 Python對(duì)股票和足彩數(shù)據(jù)進(jìn)行專業(yè)分析和量化投資分析。 投資零起點(diǎn):無(wú)須購(gòu)買任何專業(yè)軟件,本書配套的 zwPython 軟件包,采用開源模式,提供 100%全功能、全免費(fèi)的工業(yè)級(jí)數(shù)據(jù)分析平臺(tái)。 配置零起點(diǎn):所有軟件、數(shù)據(jù)全部采用蘋果“開箱即用”模式,綠色版本,無(wú)須安裝,解壓縮后即可直接運(yùn)行系統(tǒng)。 理財(cái)零起點(diǎn):無(wú)需任何專業(yè)金融背景,采用通俗易懂的語(yǔ)言,配合大量專業(yè)的圖表和實(shí)盤操作案例,輕松掌握各種量化投資策略。 數(shù)學(xué)零起點(diǎn):全書沒(méi)有任何復(fù)雜的數(shù)學(xué)公式,只有最基本的加、減、乘、除,輕輕松松就能看懂全書。 致謝 本書的出版要特別感謝電子工業(yè)出版社的黃愛萍編輯,感謝她在選題策劃和稿件整理方面做出的大量工作。
在本書創(chuàng)作過(guò)程中,極寬開源量化團(tuán)隊(duì)和培訓(xùn)班的全體成員,也提出過(guò)很多寶貴的意見,并對(duì)部分內(nèi)容程序做了中文注解。特別是吳娜、余勤兩位同學(xué),為極寬開源量化文庫(kù)和 zwQuant 開源量化軟件編寫文檔,并在團(tuán)隊(duì)成員管理方面做了大量工作,為他們的付出表示感謝。 何海群(字王) 北京極寬科技有限公司 CTO 2017 年 2 月 25 日
何海群,網(wǎng)名:字王,CHRD前海智庫(kù)CTO,《中華大字庫(kù)》發(fā)明人,出版書籍20余部,在人工智能、數(shù)據(jù)分析等方面具有20年一線專業(yè)經(jīng)驗(yàn);zwPython開發(fā)平臺(tái)、zwQuant量化軟件設(shè)計(jì)師,中國(guó)“Python創(chuàng)客”項(xiàng)目和“Python產(chǎn)業(yè)聯(lián)盟”發(fā)起人,國(guó)內(nèi)**Python量化課程:《Python量化實(shí)盤·魔鬼訓(xùn)練營(yíng)》創(chuàng)始人,極寬量化開源團(tuán)隊(duì)的創(chuàng)始人。1990年,發(fā)明國(guó)內(nèi)**個(gè)VR數(shù)據(jù)手套并獲得專利授權(quán),被業(yè)界稱為“中國(guó)VR之父”;1992年,論文《人工智能與中文字型設(shè)計(jì)》入選《廣東青年科學(xué)家文集》,現(xiàn)已成為中文字庫(kù)行業(yè)三大基礎(chǔ)建模理論之一;1997年,出版國(guó)內(nèi)首部網(wǎng)絡(luò)經(jīng)濟(jì)專著《網(wǎng)絡(luò)商戰(zhàn)》;2008年,在北京聯(lián)合創(chuàng)辦國(guó)內(nèi)**4A級(jí)網(wǎng)絡(luò)公關(guān)公司,服務(wù)過(guò)200余家國(guó)際五百?gòu)?qiáng)企業(yè),被公關(guān)協(xié)會(huì)譽(yù)為:中國(guó)網(wǎng)絡(luò)公關(guān)事業(yè)的開創(chuàng)者與啟蒙者;2012年,發(fā)布國(guó)內(nèi)**自主研發(fā)的智能中文字庫(kù)設(shè)計(jì)軟件《x2ttf涂鴉造字》,全功能全免費(fèi)公益軟件;2016年,推出國(guó)內(nèi)首套純python開源量化軟件:zwQuant,以及國(guó)內(nèi)**Tick級(jí)別開源金融大數(shù)據(jù)項(xiàng)目:zwDat金融數(shù)據(jù)包。研究成果有:“小數(shù)據(jù)”理論,快數(shù)據(jù)模型,黑天鵝算法,GPU超算工作站、MTRD多節(jié)點(diǎn)超算集群算法、“1+N”網(wǎng)絡(luò)傳播模型、人工智能“足彩圖靈法則”等。
第 1 章 從阿爾法狗開始說(shuō)起1
1.1 阿爾法狗的前世今生.......1
1.2 機(jī)器學(xué)習(xí)是什么.....2
1.3 機(jī)器學(xué)習(xí)大史記.....3
1.4 機(jī)器學(xué)習(xí)經(jīng)典案例......... 11
第 2 章 開發(fā)環(huán)境......13
2.1 數(shù)據(jù)分析首選 Python.....13
2.2 用戶運(yùn)行平臺(tái).......18
2.3 程序目錄結(jié)構(gòu).......19
2.4 Spyder 編輯器界面設(shè)置.20
2.5 Python 命令行模式.........26
2.6 Notebook 模式......27
2.7 模塊庫(kù)控制面板...29
2.8 使用 pip 更新模塊庫(kù)......33
第 3 章 Python 入門案例....39
3.1 案例 3-1:第一次編程“hello,ziwang” ....39
3.2 案例 3-2:增強(qiáng)版“hello,ziwang” ..42
3.3 案例 3-3:列舉系統(tǒng)模塊庫(kù)清單.......44
3.4 案例 3-4:常用繪圖風(fēng)格.........45
3.5 案例 3-5:Pandas 常用繪圖風(fēng)格.......47
3.6 案例 3-6:常用顏色表 cors.....49
3.7 案例源碼.....50
第 4 章 Python 基本語(yǔ)法....58
4.1 數(shù)據(jù)類型.....58
案例 4-1:基本運(yùn)算.......59
4.2 字符串.........61
案例 4-2:字符串入門...61
案例 4-3:字符串常用方法.....63
4.3 List 列表......64
案例 4-4:列表操作.......65
4.4 Tuple 元組...66
案例 4-5:元組操作.......67
4.5 Dictionary 字典.....68
案例 4-6:字典操作.......68
4.6 數(shù)據(jù)類型轉(zhuǎn)換.......70
案例 4-7:控制語(yǔ)句.......71
案例 4-8:函數(shù)定義.......73
4.7 案例源碼.....75
第 5 章 Python 人工智能入門與實(shí)踐......85
5.1 從忘卻開始.85
5.2 Iris 經(jīng)典愛麗絲.....89
案例 5-1:Iris 愛麗絲 ....90
案例 5-2:愛麗絲進(jìn)化與文本矢量化.........92
5.3 AI 操作流程95
5.4 數(shù)據(jù)切割函數(shù).......98
案例 5-3:Iris 愛麗絲分解 ......99
案例 5-4:線性回歸算法.......103
5.5 案例源碼...109
第 6 章 機(jī)器學(xué)習(xí)經(jīng)典算法案例(上) . 116
6.1 線性回歸... 116
6.2 邏輯回歸算法.....124
案例 6-1:邏輯回歸算法.......125
6.3 樸素貝葉斯算法.127
案例 6-2:貝葉斯算法.129
6.4 KNN 近鄰算法 ...130
案例 6-3:KNN 近鄰算法.....133
6.5 隨機(jī)森林算法.....135
案例 6-4:隨機(jī)森林算法.......139
6.6 案例源碼...140
第 7 章 機(jī)器學(xué)習(xí)經(jīng)典算法案例(下) .149
7.1 決策樹算法.........149
案例 7-1:決策樹算法.151
7.2 GBDT 迭代決策樹算法.........153
案例 7-2:GBDT 迭代決策樹算法.154
7.3 SVM 向量機(jī) .......156
案例 7-3:SVM 向量機(jī)算法.157
7.4 SVM-cross 向量機(jī)交叉算法..159
案例 7-4:SVM-cross 向量機(jī)交叉算法....160
7.5 神經(jīng)網(wǎng)絡(luò)算法.....161
案例 7-5:MLP 神經(jīng)網(wǎng)絡(luò)算法........165
案例 7-6:MLP_reg 神經(jīng)網(wǎng)絡(luò)回歸算法...168
7.6 案例源碼...170
第 8 章 機(jī)器學(xué)習(xí)組合算法 .........183
8.1 CCPP 數(shù)據(jù)集......183
案例 8-1:CCPP 數(shù)據(jù)集........184
案例 8-2:CCPP 數(shù)據(jù)切割....186
案例 8-3:讀取 CCPP 數(shù)據(jù)集.........189
8.2 機(jī)器學(xué)習(xí)統(tǒng)一接口函數(shù).........192
案例 8-4:機(jī)器學(xué)習(xí)統(tǒng)一接口.........193
案例 8-5:批量調(diào)用機(jī)器學(xué)習(xí)算法.201
案例 8-6:一體化調(diào)用.205
8.3 模型預(yù)制與保存.208
案例 8-7:儲(chǔ)存算法模型.......210
案例 8-8:批量?jī)?chǔ)存算法模型.........213
案例 8-9:批量加載算法模型.........215
案例 8-10:機(jī)器學(xué)習(xí)組合算法.......219
8.4 案例源碼...224
附錄 A Sklearn 常用模塊和函數(shù).242
附錄 B 極寬量化系統(tǒng)模塊圖......266