Python商業(yè)數(shù)據(jù)挖掘(第6版)
定 價:¥118
中 教 價:¥69.62 (5.90折)促銷
庫 存 數(shù): 14
叢 書 名:大數(shù)據(jù)應(yīng)用與技術(shù)叢書
本書前5版好評如潮,作為第6版,本書首次使用了Python語言。本書除了介紹用于統(tǒng)計和機器學(xué)習(xí)等領(lǐng)域的預(yù)測、分類、可視化、降維、推薦系統(tǒng)、聚類、文本挖掘、網(wǎng)絡(luò)分析等方法之外,內(nèi)容還包括:
● 新加入的合著者Peter Gedeck擁有使用Python講解商業(yè)分析課程的豐富經(jīng)驗以及將機器學(xué)習(xí)應(yīng)用于新藥發(fā)現(xiàn)過程的專業(yè)技能。在本書中,他十分樂于將這些經(jīng)驗和技能與讀者分享。
● 討論數(shù)據(jù)挖掘中的倫理問題。
● 根據(jù)教師和學(xué)生的反饋意見對內(nèi)容做了更新。
● 通過多個案例展示數(shù)據(jù)挖掘技術(shù)的實際應(yīng)用。
● 每章后面的習(xí)題有助于讀者評估和加深對該章內(nèi)容的理解。
● 在線支持網(wǎng)站提供了數(shù)據(jù)集、教學(xué)資料、習(xí)題答案、PPT教案和案例解決方案。
通過學(xué)習(xí)《Python商業(yè)數(shù)據(jù)挖掘(第6版)》,讀者將掌握使用Python實現(xiàn)數(shù)據(jù)挖掘的各種方法,并深入理解在將這些方法應(yīng)用于數(shù)據(jù)挖掘的過程中存在的商業(yè)問題和機遇。
前 言
本書早出版于2007年年初,已被眾多學(xué)生、從業(yè)人員和任課老師采用,包括我本人,在過去15 年里,在線授課和面對面授課都以本書為重要參考書。本書的第1 版是基于Excel 加載項(加載程序是Analytic Solver Data Mining,早先的名稱是XLMiner)的,此后不斷推出JMP 版本、R 版本和現(xiàn)在的Python 版本,并推出了本書的合作站點www.dataminingbook.com。新推出的Python 版本使用了免費開源的Python 程序設(shè)計語言。本書提供了Python 程序的輸出結(jié)果以及生成這些結(jié)果的代碼,也包含相關(guān)程序包和函數(shù)的使用說明,其中的核心是scikit-learn 包。不同于計算機科學(xué)教材或統(tǒng)計學(xué)教材,本書的重點在于數(shù)據(jù)挖掘的基本概念以及如何用Python 實現(xiàn)相關(guān)算法。我們假設(shè)讀者基本熟悉Python 語言。對于新推出的Python 版本,增加了另一位共同作者Peter Gedeck,他在商業(yè)領(lǐng)域里具有豐富的數(shù)據(jù)科學(xué)經(jīng)驗。除了提供Python 代碼和輸出結(jié)果外,本書也增加了內(nèi)容和反饋意見。這些意見來自教授MBA 課程、MS 課程、本科生課程、文憑課程和經(jīng)理人培訓(xùn)課程的老師及學(xué)生。重要的是,本書首次引入了有關(guān)數(shù)據(jù)倫理的內(nèi)容(詳見2.9 節(jié))。本書還包含原書第3 版新增的如下內(nèi)容:● 社交網(wǎng)絡(luò)分析● 文本挖掘● 集成方法● 增益模型協(xié)同過濾自第2 版開始(基于Analytic Solver),以本書為教材的課程大量增加。初,本書主要用于一學(xué)期的MBA 選修課,現(xiàn)在已被用在許多商業(yè)分析學(xué)位課的教學(xué)大綱里和證書課程的教學(xué)計劃里。從本科生教學(xué)計劃到研究生和經(jīng)理人培訓(xùn)計劃,這些項目里的課程、時間長短不一,深淺不同。在很多情形下,本書可用在多門課程里。本書的設(shè)計思想是繼續(xù)支持通用的預(yù)測分析或數(shù)據(jù)挖掘課程,但是也支持專用的商業(yè)分析教學(xué)大綱。在專用的商業(yè)分析教學(xué)大綱中,以下課程曾使用本書。● 預(yù)測分析監(jiān)督學(xué)習(xí):在專用的商業(yè)分析項目里,對于預(yù)測分析主題,通常包括一系列課程。門課程包括本書的第Ⅰ部分至第Ⅳ部分內(nèi)容。教授這門課程的老師通常根據(jù)課時適當(dāng)?shù)剡x擇第Ⅳ部分的內(nèi)容。在這類課程中,建議包括第13 章的集成學(xué)習(xí)和第Ⅶ部分的數(shù)據(jù)分析。● 預(yù)測分析無監(jiān)督學(xué)習(xí):本課程介紹數(shù)據(jù)探索和可視化、降維、挖掘關(guān)系和聚類(第Ⅲ部分和第Ⅴ部分)。如果這門課程也按照預(yù)測分析監(jiān)督學(xué)習(xí)課程的教學(xué)計劃,那么有必要分析綜合應(yīng)用無監(jiān)督學(xué)習(xí)和監(jiān)督學(xué)習(xí)的例子和方法。● 預(yù)測分析:專門用于時間序列預(yù)測的課程需要用到第Ⅵ部分的內(nèi)容。● 高級分析:本課程綜合了全部的預(yù)測分析內(nèi)容(包括監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí))。這門課程的重點應(yīng)放在第Ⅶ部分。這部分包含了社交網(wǎng)絡(luò)分析和文本挖掘。有的老師也會在這類課程中選擇第21 章中的案例。在以上所有課程中,我們強烈建議增加課程設(shè)計項目,要求學(xué)生自己收集數(shù)據(jù),或利用老師提供的數(shù)據(jù)(例如,現(xiàn)在有很多供數(shù)據(jù)挖掘使用的數(shù)據(jù)集)。根據(jù)我們和其他老師的經(jīng)驗,這些項目可讓學(xué)生鞏固所學(xué)的知識,并且能給學(xué)生提供一個機會,以便更好地理解數(shù)據(jù)挖掘的強大功能以及在挖掘過程中遇到的問題。Galit Shmueli、Peter C. Bruce、Peter Gedeck 和Nitin R. Patel2019 年
Galit Shmueli博士自2004年以來,一直在美國馬里蘭大學(xué)、statistics.com統(tǒng)計網(wǎng)站、印度商學(xué)院設(shè)計并指導(dǎo)數(shù)據(jù)挖掘課程。Shmueli的研究領(lǐng)域包括信息系統(tǒng)的統(tǒng)計方法和數(shù)據(jù)挖掘,她以研究和擅長講授商業(yè)分析而聞名,并發(fā)表了100多篇文章。 Peter C. Bruce是statistics.com統(tǒng)計網(wǎng)站的統(tǒng)計教育研究院的主席和創(chuàng)辦人,他發(fā)表了多篇學(xué)術(shù)論文,還開發(fā)了Resampling Stats軟件。 Peter Gedeck博士是Collabrative Drug Discovery公司的高級數(shù)據(jù)科學(xué)家,他為這家公司開發(fā)了一款基于云的軟件來管理新藥發(fā)現(xiàn)過程中用到的海量數(shù)據(jù),他還在statistics.com統(tǒng)計網(wǎng)站上教授數(shù)據(jù)挖掘課程。 Nitin R. Patel博士是位于馬薩諸塞州劍橋市的Cytel公司的共同創(chuàng)始人和董事,是美國統(tǒng)計協(xié)會會員,同時還是麻省理工學(xué)院和哈佛大學(xué)的客座教授。
第I 部分 預(yù)備知識第1 章 引言............................................................31.1 商業(yè)分析簡介...........................................31.2 什么是數(shù)據(jù)挖掘......................................41.3 數(shù)據(jù)挖掘及相關(guān)術(shù)語..............................41.4 大數(shù)據(jù)........................................................51.5 數(shù)據(jù)科學(xué)...................................................61.6 為什么有這么多不同的方法.................61.7 術(shù)語與符號...............................................71.8 本書的線路圖...........................................8第2 章 數(shù)據(jù)挖掘過程概述................................112.1 引言..........................................................112.2 數(shù)據(jù)挖掘的核心思想............................112.2.1 分類.................................................112.2.2 預(yù)測.................................................122.2.3 關(guān)聯(lián)規(guī)則與推薦系統(tǒng)........................122.2.4 預(yù)測分析..........................................122.2.5 數(shù)據(jù)規(guī)約與降維技術(shù)........................122.2.6 數(shù)據(jù)探索和可視化...........................122.2.7 監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)....................132.3 數(shù)據(jù)挖掘步驟.........................................132.4 前期步驟.................................................152.4.1 數(shù)據(jù)集的組織...................................152.4.2 預(yù)測West Roxbury 小區(qū)的房價........152.4.3 在Python 程序中載入并瀏覽數(shù)據(jù)....162.4.4 Python 包的導(dǎo)入...............................182.4.5 從數(shù)據(jù)庫獲得采樣數(shù)據(jù)....................182.4.6 在分類任務(wù)中對小概率事件的過采樣.............................................192.4.7 數(shù)據(jù)預(yù)處理和數(shù)據(jù)清理....................192.5 預(yù)測力和過擬合.................................... 242.5.1 過擬合............................................. 242.5.2 數(shù)據(jù)分區(qū)的創(chuàng)建和使用.................... 262.6 建立預(yù)測模型........................................ 282.7 在本地計算機上用Python 實現(xiàn)數(shù)據(jù)挖掘................................................. 322.8 自動化數(shù)據(jù)挖掘解決方案................... 332.9 數(shù)據(jù)挖掘中的倫理規(guī)范....................... 332.10 習(xí)題........................................................ 37第Ⅱ部分 數(shù)據(jù)探索與降維技術(shù)第3 章 數(shù)據(jù)可視化.............................................433.1 引言.......................................................... 433.2 數(shù)據(jù)實例................................................. 453.3 基本圖形:條形圖、折線圖和散點圖..................................................... 463.3.1 分布圖:箱線圖和直方圖................ 483.3.2 熱圖:可視化相關(guān)性和缺失值......... 513.4 多維數(shù)據(jù)的可視化................................ 533.4.1 添加變量:顏色、大小、形狀、多面板和動畫.................................. 533.4.2 數(shù)據(jù)操作:重定標(biāo)、聚合與層次結(jié)構(gòu)、縮放與過濾........................... 563.4.3 趨勢線和標(biāo)簽.................................. 593.4.4 擴展到大型數(shù)據(jù)集........................... 603.4.5 多變量圖:平行坐標(biāo)圖.................... 623.4.6 交互式可視化.................................. 633.5 專用的可視化技術(shù)................................ 653.5.1 網(wǎng)絡(luò)數(shù)據(jù)可視化............................... 653.5.2 層次數(shù)據(jù)可視化:樹狀結(jié)構(gòu)圖......... 663.5.3 地理數(shù)據(jù)可視化:地圖.................... 683.6 小結(jié)..........................................................713.7 習(xí)題..........................................................71第4 章 降維.........................................................754.1 引言..........................................................754.2 維數(shù)的詛咒.............................................754.3 實際考慮..................................................764.4 數(shù)據(jù)摘要..................................................774.5 相關(guān)性分析.............................................804.6 減少分類變量的分類值個數(shù)...............814.7 把分類變量轉(zhuǎn)換為數(shù)值型變量..........824.8 主成分分析.............................................824.8.1 主成分..............................................874.8.2 數(shù)據(jù)歸一化......................................884.8.3 使用主成分進行分類和預(yù)測.............914.9 利用回歸模型實現(xiàn)降維.......................914.10 利用分類樹與回歸樹實現(xiàn)降維........914.11 習(xí)題........................................................91第Ⅲ部分 性能評價第5 章 評估預(yù)測性能........................................975.1 引言..........................................................975.2 評估預(yù)測性能.........................................985.3 評估分類器的性能............................. 1025.4 判斷排名性能.......................................1115.5 過采樣....................................................1155.6 習(xí)題........................................................119第Ⅳ部分 預(yù)測與分類方法第6 章 多元線性回歸......................................1256.1 引言....................................................... 1256.2 解釋模型和預(yù)測模型......................... 1266.3 估計回歸方程和預(yù)測結(jié)果................ 1276.4 線性回歸中的變量選擇.................... 1316.4.1 減少預(yù)測變量的數(shù)量..................... 1316.4.2 正則化(收縮模型).......................... 1366.5 statmodels 包的使用........................... 1386.6 習(xí)題....................................................... 139第7 章 k-近鄰算法...........................................1437.1 k-近鄰分類器(分類結(jié)果變量).......... 1437.1.1 確定近鄰記錄................................ 1437.1.2 分類規(guī)則........................................1447.1.3 實例:駕駛式割草機......................1447.1.4 設(shè)置臨界值....................................1487.1.5 多類別的k-近鄰算法.....................1497.1.6 把分類變量轉(zhuǎn)換為二元虛擬變量...............................................1497.2 將k-近鄰算法應(yīng)用于數(shù)值型結(jié)果變量...............................................1497.3 k-近鄰算法的優(yōu)缺點..........................1517.4 習(xí)題........................................................151第8 章 樸素貝葉斯分類器.............................1558.1 引言........................................................1558.1.1 臨界概率方法................................1558.1.2 條件概率........................................1568.2 使用完全或精準(zhǔn)的貝葉斯分類器....................................................1578.2.1 使用歸類為有可能的類別準(zhǔn)則...............................................1578.2.2 使用臨界概率方法.........................1578.2.3 精準(zhǔn)貝葉斯方法存在的實際問題...1578.2.4 樸素貝葉斯的獨立條件假設(shè)...........1588.3 樸素貝葉斯分類器的優(yōu)缺點............1648.4 習(xí)題........................................................165第9 章 分類樹與回歸樹.................................1679.1 引言........................................................1679.2 分類樹....................................................1699.3 評估分類樹的性能..............................1759.4 如何避免過擬合..................................1789.4.1 停止樹的生長................................1799.4.2 調(diào)節(jié)分類樹的參數(shù).........................1809.4.3 限制分類樹規(guī)模的其他方法...........1829.5 從分類樹推斷分類規(guī)則.....................1839.6 多于兩個類別的分類樹.....................1839.7 回歸樹....................................................1839.8 改進預(yù)測方法:隨機森林法和提升樹....................................................1869.8.1 隨機森林法....................................1869.8.2 提升樹...........................................1889.9 樹的優(yōu)缺點...........................................1899.10 習(xí)題......................................................190第10 章 Logistic 回歸.....................................19310.1 引言......................................................19310.2 Logistic 回歸模型..............................19410.3 實例:接受個人貸款申請...............19610.3.1 只有單個預(yù)測變量的模型..........19610.3.2 根據(jù)數(shù)據(jù)估計Logistic 模型:計算參數(shù)估計值.........................19710.3.3 用幾率解釋結(jié)果(用于分析目的)..........................................19910.4 評估分類性能.....................................20010.5 用于多類別分類的Logistic回歸......................................................20210.5.1 定序類別....................................20210.5.2 定類類別....................................20310.5.3 比較定序類別模型和定類類別模型...................................20410.6 分析實例:預(yù)測航班是否延誤......20610.6.1 訓(xùn)練模型....................................21010.6.2 模型的解釋................................21110.6.3 模型的性能................................21210.6.4 變量選擇....................................21310.7 statmodels 包的使用..........................21610.8 習(xí)題......................................................217第11 章 神經(jīng)網(wǎng)絡(luò)............................................22111.1 引言......................................................22111.2 神經(jīng)網(wǎng)絡(luò)的概念和結(jié)構(gòu)...................22211.3 在數(shù)據(jù)上擬合神經(jīng)網(wǎng)絡(luò)...................22211.3.1 計算節(jié)點的輸出結(jié)果..................22311.3.2 訓(xùn)練模型....................................22511.3.3 對事故的嚴重程度進行分類.......22911.3.4 避免過擬合................................23111.3.5 把神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果用于預(yù)測和分類................................23111.4 要求用戶輸入.....................................23111.5 探索預(yù)測變量與因變量的關(guān)系......23211.6 深度學(xué)習(xí).............................................23211.6.1 卷積神經(jīng)網(wǎng)絡(luò)............................23311.6.2 局部特征圖................................23411.6.3 層次特征....................................23411.6.4 學(xué)習(xí)過程....................................23511.6.5 無監(jiān)督學(xué)習(xí)................................23511.6.6 結(jié)論...........................................23611.7 神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點............................23611.8 習(xí)題......................................................237第12 章 判別分析............................................ 23912.1 引言......................................................23912.2 記錄與類別的距離...........................24112.3 Fisher 線性分類函數(shù)........................24212.4 判別分析的分類性能.......................24512.5 先驗概率.............................................24512.6 誤分類成本不均等...........................24612.7 多類別情形下的分類.......................24612.8 判別分析的優(yōu)缺點...........................24912.9 習(xí)題......................................................250第13 章 組合方法:集成學(xué)習(xí)和增益模型.................................................... 25313.1 集成學(xué)習(xí).............................................25313.1.1 為什么集成學(xué)習(xí)可以改進預(yù)測能力...................................25413.1.2 集成學(xué)習(xí)的優(yōu)缺點.....................25713.2 增益(說服)模型.................................25713.2.1 建立一個簡單的預(yù)測模型..........26013.2.2 建立增益模型............................26013.2.3 使用Python 程序計算增益.........26113.2.4 應(yīng)用增益模型的結(jié)果.................26213.3 小結(jié)......................................................26213.4 習(xí)題......................................................263第Ⅴ部分 挖掘記錄之間的關(guān)系第14 章 關(guān)聯(lián)規(guī)則和協(xié)同過濾...................... 26714.1 關(guān)聯(lián)規(guī)則.............................................26714.1.1 從交易數(shù)據(jù)庫中發(fā)現(xiàn)關(guān)聯(lián)規(guī)則...................................26814.1.2 生成候選規(guī)則............................26914.1.3 Apriori 算法...............................27014.1.4 選擇強規(guī)則................................27014.1.5 數(shù)據(jù)格式...................................27114.1.6 規(guī)則的選擇過程........................27314.1.7 解釋結(jié)果...................................27414.2 協(xié)同過濾.............................................27714.2.1 數(shù)據(jù)類型與數(shù)據(jù)格式................. 27814.2.2 基于用戶的協(xié)同過濾................. 27914.2.3 基于項的協(xié)同過濾.................... 28114.2.4 協(xié)同過濾的優(yōu)缺點.................... 28214.2.5 協(xié)同過濾與關(guān)聯(lián)規(guī)則................. 28314.3 小結(jié)..................................................... 28414.4 習(xí)題..................................................... 284第15 章 聚類分析............................................28915.1 引言..................................................... 28915.2 計算兩條記錄之間的距離.............. 29215.2.1 歐幾里得距離........................... 29215.2.2 數(shù)值型觀測值的歸一化處理...... 29315.2.3 數(shù)值型數(shù)據(jù)的其他距離度量方法.......................................... 29415.2.4 分類數(shù)據(jù)的距離度量................. 29515.2.5 混合數(shù)據(jù)的距離度量................. 29615.3 計算兩個簇之間的距離.................. 29615.4 (凝聚)層次聚類................................. 29815.4.1 樹狀圖:顯示聚類過程和結(jié)果.......................................... 29915.4.2 驗證簇...................................... 30115.4.3 層次聚類的局限性.................... 30315.5 非層次聚類:k-均值聚類............... 30415.6 習(xí)題..................................................... 308第Ⅵ部分 時間序列預(yù)測第16 章 時間序列分析...................................31316.1 引言..................................................... 31316.2 描述性模型與預(yù)測性模型.............. 31416.3 商業(yè)領(lǐng)域常用的預(yù)測方法.............. 31416.4 時間序列的主要成分....................... 31516.5 數(shù)據(jù)分割與性能評估....................... 31816.5.1 基準(zhǔn)性能:樸素預(yù)測................. 31816.5.2 生成未來預(yù)測結(jié)果.................... 32116.6 習(xí)題..................................................... 321第17 章 基于回歸的預(yù)測...............................32517.1 趨勢模型............................................ 32517.1.1 線性趨勢................................... 32517.1.2 指數(shù)趨勢................................... 32917.1.3 多項式趨勢............................... 33017.2 季節(jié)性效應(yīng)模型............................... 33017.3 趨勢和季節(jié)性效應(yīng)模型...................33317.4 自相關(guān)和ARIMA 模型...................33417.4.1 計算自相關(guān)性............................33417.4.2 加入自相關(guān)信息以提高預(yù)測準(zhǔn)確度.......................................33617.4.3 評估可預(yù)測性............................33917.5 習(xí)題......................................................339第18 章 平滑法................................................34918.1 引言......................................................34918.2 移動平均法.........................................35018.2.1 用于可視化的中心移動平均法.......................................35018.2.2 用于預(yù)測的尾移動平均法..........35218.2.3 時間窗口寬度的選擇.................35418.3 簡單的指數(shù)平滑法............................35418.3.1 平滑參數(shù) 的選擇.....................35518.3.2 移動平均法與簡單指數(shù)平滑法的關(guān)系.......................................35618.4 高級指數(shù)平滑法................................35618.4.1 包含趨勢的序列........................35618.4.2 包含趨勢和季節(jié)性效應(yīng)的序列..........................................35718.4.3 包含季節(jié)性效應(yīng)但不包含趨勢的序列.......................................35918.5 習(xí)題......................................................359第Ⅶ部分 數(shù)據(jù)分析第19 章 社交網(wǎng)絡(luò)分析...................................36919.1 引言......................................................36919.2 有向網(wǎng)絡(luò)與無向網(wǎng)絡(luò).......................37019.3 社交網(wǎng)絡(luò)的可視化和分析...............37119.3.1 網(wǎng)絡(luò)圖的布局............................37219.3.2 邊表...........................................37319.3.3 鄰接矩陣...................................37319.3.4 在分類和預(yù)測中使用社交網(wǎng)絡(luò)數(shù)據(jù)...................................37419.4 社交網(wǎng)絡(luò)指標(biāo)和分類法...................37419.4.1 節(jié)點級中心度指標(biāo).....................37419.4.2 自我中心網(wǎng)絡(luò)............................37519.4.3 社交網(wǎng)絡(luò)度量指標(biāo).....................37619.5 在分類和預(yù)測中應(yīng)用網(wǎng)絡(luò)指標(biāo)......37819.5.1 連接預(yù)測....................................37819.5.2 個體解析....................................37819.5.3 協(xié)同過濾....................................37919.6 使用Python 收集社交網(wǎng)絡(luò)數(shù)據(jù).....38119.7 社交網(wǎng)絡(luò)分析的優(yōu)缺點...................38219.8 習(xí)題......................................................383第20 章 文本挖掘............................................38520.1 引言......................................................38520.2 文本數(shù)據(jù)的表格表示法:項-文檔矩陣和詞袋.........................................38620.3 詞袋法與文檔級提取.......................38720.4 預(yù)處理文本.........................................38720.4.1 分詞...........................................38820.4.2 文本壓縮....................................38920.4.3 出現(xiàn)/不出現(xiàn)與詞頻....................39120.4.4 詞頻-逆文本頻率(TF-IDF)..........39120.4.5 從項到概念:隱性語義索引.......39220.4.6 提取語義....................................39320.5 數(shù)據(jù)挖掘方法的實現(xiàn).......................39320.6 實例:關(guān)于汽車和電子產(chǎn)品的在線討論.............................................39320.6.1 導(dǎo)入記錄并為記錄貼上標(biāo)簽.......39420.6.2 使用Python 程序?qū)ξ谋具M行預(yù)處理.......................................39420.6.3 生成概念矩陣............................39520.6.4 擬合預(yù)測模型............................39520.6.5 預(yù)測...........................................39620.7 小結(jié)......................................................39620.8 習(xí)題......................................................396第Ⅷ部分 案例第21 章 案例.....................................................40121.1 查爾斯圖書俱樂部............................40121.1.1 背景分析....................................40121.1.2 查爾斯圖書俱樂部的數(shù)據(jù)庫營銷手段...................................40221.1.3 數(shù)據(jù)挖掘技術(shù)............................40321.1.4 任務(wù)...........................................40421.2 德國信用卡.........................................40521.2.1 背景分析....................................40521.2.2 數(shù)據(jù)..........................................40521.2.3 任務(wù)..........................................40821.3 Tayko 軟件銷售公司........................40821.3.1 背景分析...................................40821.3.2 郵件發(fā)送實驗............................40921.3.3 數(shù)據(jù)..........................................40921.3.4 任務(wù)..........................................41021.4 政治游說.............................................41021.4.1 背景分析...................................41021.4.2 預(yù)測分析出現(xiàn)在美國總統(tǒng)大選中....................................... 41121.4.3 政治定位................................... 41121.4.4 增益.......................................... 41121.4.5 數(shù)據(jù)..........................................41221.4.6 任務(wù)..........................................41221.5 出租車取消問題................................41321.5.1 背景分析...................................41321.5.2 任務(wù)..........................................41321.6 香皂用戶的細分................................41321.6.1 背景分析...................................41321.6.2 關(guān)鍵問題...................................41421.6.3 數(shù)據(jù)..........................................41421.6.4 測試品牌忠誠度........................41521.6.5 任務(wù)..........................................41521.7 直郵捐贈.............................................41621.7.1 背景..........................................41621.7.2 數(shù)據(jù)..........................................41621.7.3 任務(wù)..........................................41721.8 產(chǎn)品目錄交叉銷售...........................41721.8.1 背景分析...................................41721.8.2 任務(wù)..........................................41821.9 預(yù)測公共交通需求...........................41821.9.1 背景分析...................................41821.9.2 問題描述...................................41821.9.3 數(shù)據(jù)..........................................41821.9.4 目標(biāo)..........................................41921.9.5 任務(wù)..........................................41921.9.6 提示和步驟................................419附錄 Python 工具函數(shù).................................... 421