《圖靈程序設(shè)計(jì)叢書·統(tǒng)計(jì)思維:程序員數(shù)學(xué)之概率統(tǒng)計(jì)》是一本以全新視角講解概率統(tǒng)計(jì)的入門圖書。拋開經(jīng)典的數(shù)學(xué)分析,Downey手把手教你用編程理解統(tǒng)計(jì)學(xué)。概率、分布、假設(shè)檢驗(yàn)、貝葉斯估計(jì)、相關(guān)性等,每個主題都充滿趣味性,經(jīng)編程解釋后變得更為清晰易懂。
《圖靈程序設(shè)計(jì)叢書·統(tǒng)計(jì)思維:程序員數(shù)學(xué)之概率統(tǒng)計(jì)》研究數(shù)據(jù)主要來源于美國全國家庭成長調(diào)查(NSFG)與行為風(fēng)險因素監(jiān)測系統(tǒng)(BRFSS),數(shù)據(jù)源及解決方案的相關(guān)代碼全部開放,具體章節(jié)列出了大量學(xué)習(xí)和進(jìn)階資料,方便讀者參考。
《圖靈程序設(shè)計(jì)叢書·統(tǒng)計(jì)思維:程序員數(shù)學(xué)之概率統(tǒng)計(jì)》面向廣大程序員和計(jì)算機(jī)專業(yè)的學(xué)生。
大數(shù)據(jù)革命風(fēng)起云涌。數(shù)據(jù)分析成為每個浪尖上的舞者的必殺技。而統(tǒng)計(jì)思維是數(shù)據(jù)分析和數(shù)據(jù)挖掘的根基。 每個程序員都應(yīng)該具備統(tǒng)計(jì)思維,看到本書你已經(jīng)比別人先行一步。這是一本極為獨(dú)特的統(tǒng)計(jì)思維入門圖書。 獨(dú)特的編程視角。對于主要的概率統(tǒng)計(jì)概念,作者都給出了開源的代碼示例,其新穎獨(dú)特的講解方法絕對可以讓程序員對概率統(tǒng)計(jì)產(chǎn)生更深刻的認(rèn)識。 幽默風(fēng)趣的示例。你是否一直無法理解蒙提霍爾問題?龐加萊是怎樣發(fā)現(xiàn)面包商的企圖的?作者援引經(jīng)典問題,幫你打開統(tǒng)計(jì)思維。 公共開源數(shù)據(jù)。拿來美國全國家庭成長調(diào)查(NSFG)與行為風(fēng)險因素監(jiān)測系統(tǒng)(BRFSS)中的數(shù)據(jù),重用參考代碼,立即讓自己的代碼跑起來。
Allen B.Downey是富蘭克林歐林工程學(xué)院的計(jì)算機(jī)科學(xué)副教授,曾執(zhí)教于韋爾斯利學(xué)院、科爾比學(xué)院和加州大學(xué)伯克利分校。他先后獲麻省理工學(xué)院計(jì)算機(jī)科學(xué)碩士學(xué)位和加州大學(xué)伯克利分校計(jì)算機(jī)科學(xué)博士學(xué)位。Downey已出版十余本技術(shù)書,內(nèi)容涉及Java、Python、C++、概率統(tǒng)計(jì)等,深受專業(yè)讀者喜愛。他的最新Think系列書還有ThinkComplexity: Complexity Science and Computational Modeling、ThinkPython。
前言
第1章 程序員的統(tǒng)計(jì)思維
1.1 第一個孩子出生晚嗎
1.2 統(tǒng)計(jì)方法
1.3 全國家庭成長調(diào)查
1.4 表和記錄
1.5 顯著性
1.6 術(shù)語
第2章 描述性統(tǒng)計(jì)量
2.1 均值和平均值
2.2 方差
2.3 分布
2.4 直方圖的表示
2.5 繪制直方圖
2.6 表示概率質(zhì)量函數(shù)
2.7 繪制概率質(zhì)量函數(shù)
2.8 異常值
2.9 其他可視化方法
2.10 相對風(fēng)險
2.11 條件概率
2.12 匯報結(jié)果
2.13 術(shù)語表
第3章 累積分布函數(shù)
3.1 選課人數(shù)之謎
3.2 PMF的不足
3.3 百分位數(shù)
3.4 累積分布函數(shù)
3.5 CDF的表示
3.6 回到調(diào)查數(shù)據(jù)
3.7 條件分布
3.8 隨機(jī)數(shù)
3.9 匯總統(tǒng)計(jì)量小結(jié)
3.10 術(shù)語表
第4章 連續(xù)分布
4.1 指數(shù)分布
4.2 帕累托分布
4.3 正態(tài)分布
4.4 正態(tài)概率圖
4.5 對數(shù)正態(tài)分布
4.6 為什么需要模型
4.7 生成隨機(jī)數(shù)
4.8 術(shù)語
第5章 概率
5.1 概率法則
5.2 蒙提霍爾問題
5.3 龐加萊
5.4 其他概率法則
5.5 二項(xiàng)分布
5.6 連勝和手感
5.7 貝葉斯定理
5.8 術(shù)語
第6章 分布的運(yùn)算
6.1 偏度
6.2 隨機(jī)變量
6.3 概率密度函數(shù)
6.4 卷積
6.5 正態(tài)分布的性質(zhì)
6.6 中心極限定理
6.7 分布函數(shù)之間的關(guān)系框架
6.8 術(shù)語表
第7章 假設(shè)檢驗(yàn)
7.1 均值差異的檢驗(yàn)
7.2 閾值的選擇
7.3 效應(yīng)的定義
7.4 解釋統(tǒng)計(jì)檢驗(yàn)結(jié)果
7.5 交叉驗(yàn)證
7.6 報道貝葉斯概率的結(jié)果
7.7 卡方檢驗(yàn)
7.8 高效再抽樣
7.9 功效
7.10 術(shù)語
第8章 估計(jì)
8.1 關(guān)于估計(jì)的游戲
8.2 方差估計(jì)
8.3 誤差
8.4 指數(shù)分布
8.5 置信區(qū)間
8.6 貝葉斯估計(jì)
8.7 貝葉斯估計(jì)的實(shí)現(xiàn)
8.8 刪失數(shù)據(jù)
8.9 火車頭問題
8.10 術(shù)語
第9章 相關(guān)性
9.1 標(biāo)準(zhǔn)分?jǐn)?shù)
9.2 協(xié)方差
9.3 相關(guān)性
9.4 用pyplot畫散點(diǎn)圖
9.5 斯皮爾曼秩相關(guān)
9.6 最小二乘擬合
9.7 擬合優(yōu)度
9.8 相關(guān)性和因果關(guān)系
9.9 術(shù)語
作者及封面簡介
索引