概率導(dǎo)論這本書產(chǎn)生于著名的哈佛統(tǒng)計(jì)學(xué)講座,該書提供了基本的理解統(tǒng)計(jì)學(xué)、*性和不確定性的語(yǔ)言和工具。它采用了多種多樣的應(yīng)用和實(shí)例,從偶然性與悖論到谷歌網(wǎng)頁(yè)排名與馬爾科夫鏈蒙特卡羅(MCMC)等。該書還探討了其他一些應(yīng)用領(lǐng)域諸如基因?qū)W、藥學(xué)、計(jì)算機(jī)科學(xué)和信息理論等。紙質(zhì)書版本還包括了提供免費(fèi)訪問電子書版本的代碼。作者通過采用真實(shí)世界的例子以一種易理解的方式和激發(fā)的理念來(lái)呈現(xiàn)內(nèi)容。整本書中,作者都采用故事來(lái)揭示統(tǒng)計(jì)學(xué)中的基本分布之間的聯(lián)系并通過條件化將復(fù)雜的問題歸約為易于掌控的若干小問題。本書包含了很多直觀的解釋、圖示和實(shí)踐問題。每一章的結(jié)尾部分都給出了如何利用R軟件來(lái)完成相關(guān)仿真和計(jì)算的方法,這里R是一種免費(fèi)的統(tǒng)計(jì)軟件。
美國(guó)哈佛大學(xué)、斯坦福大學(xué)概率論課程使用教材,作者在教學(xué)方面有獨(dú)到的想法,深受學(xué)生喜愛
本書通過現(xiàn)代的觀點(diǎn)來(lái)介紹概率論,為理解統(tǒng)計(jì)方法、隨機(jī)性和不確定性奠定了基礎(chǔ)。書中包含了豐富的應(yīng)用實(shí)例,從基本的拋硬幣問題和偶然性的研究到谷歌PageRank算法以及馬爾可夫鏈蒙特卡羅方法等。由于概率論是一門經(jīng)常被認(rèn)為是反直覺的學(xué)科,所以書中給出了很多可以憑直覺得到的解釋、圖示和實(shí)例以證明這個(gè)觀點(diǎn)的偏頗。每章的結(jié)尾部分還結(jié)合R軟件來(lái)更詳細(xì)地探討這一章的思想(R軟件是一種用于統(tǒng)計(jì)計(jì)算和仿真的免費(fèi)軟件)。
本書取材于哈佛大學(xué)的視頻公開課Stat110(從2006年起,這門課程每年均由Joseph講授),課程視頻可在stat110net網(wǎng)站上免費(fèi)獲取。其他附加的補(bǔ)充材料,諸如R代碼及標(biāo)記了 的練習(xí)題的解答均可在該網(wǎng)站獲取。
掌握微積分是學(xué)習(xí)本書的一個(gè)前提,而對(duì)統(tǒng)計(jì)學(xué)的基礎(chǔ)則沒有要求。數(shù)學(xué)方面的主要挑戰(zhàn)不在于完成微積分求解,而在于能夠在抽象的概念和具體的例子之間轉(zhuǎn)換。
本書的主要特征概括如下:
1實(shí)例。書中的定義、定理和證明都是通過實(shí)例來(lái)呈現(xiàn)的,這種呈現(xiàn)既保留了數(shù)學(xué)的精確性又概括性地對(duì)現(xiàn)實(shí)世界的一些現(xiàn)象做出了解釋。通過那些讓概率分布廣泛地在統(tǒng)計(jì)建模中使用的實(shí)例來(lái)探究概率分布。我們盡可能避免冗長(zhǎng)乏味的推導(dǎo),取而代之的是致力于給出解釋和直覺判斷來(lái)說明為什么那些主要結(jié)論是正確的。事實(shí)證明,通過深刻理解來(lái)替代死記硬背的方法可以提高學(xué)生對(duì)內(nèi)容的長(zhǎng)期記憶力。
2圖。由于圖本身就能表達(dá)很多內(nèi)容,所以我們通過圖來(lái)補(bǔ)充定義,使得那些主要概念與讓人印象深刻的圖相聯(lián)系。在很多領(lǐng)域中,一名初學(xué)者與一名專家的差距常被描述如下:初學(xué)者總是努力去記住大量看似不相關(guān)的事實(shí)和公式,而專家則會(huì)領(lǐng)悟出一個(gè)統(tǒng)一的結(jié)構(gòu),在這個(gè)結(jié)構(gòu)中僅通過少量的原理和思想就可將那些事實(shí)連貫地聯(lián)系在一起。為了幫助學(xué)生領(lǐng)會(huì)概率論的結(jié)構(gòu),我們特別強(qiáng)調(diào)了思想間的聯(lián)系(同時(shí)從語(yǔ)言上和視覺效果上加以鞏固),并在大多數(shù)章節(jié)的結(jié)尾部分給出了概念與分布的循環(huán)、擴(kuò)展圖。
3概念和策略的雙重教學(xué)。我們的目的在于讓學(xué)生在讀本書時(shí)不僅能夠?qū)W習(xí)概率論的概念,同時(shí)還能夠掌握廣泛適用于概率論之外的一系列解決問題的策略。對(duì)于書中的例子,由于經(jīng)常對(duì)相同的問題會(huì)給出多種不同的解答。我們對(duì)求解的每一步都進(jìn)行了解釋,同時(shí)也對(duì)如何思考并選擇采用的方法進(jìn)行了評(píng)述。
我們對(duì)諸如對(duì)稱性和模式識(shí)別這樣的重要策略進(jìn)行了明確的標(biāo)記和命名,并且通過給出了標(biāo)有(生物危害標(biāo)識(shí))的內(nèi)容來(lái)消除常見誤解。
4實(shí)踐問題。本書包含大約600道不同難度的練習(xí)題。目的是為了讓學(xué)生加強(qiáng)對(duì)內(nèi)容的理解,同時(shí)強(qiáng)化他們解決問題的能力。這些練習(xí)題中有些是策略實(shí)踐問題,根據(jù)主題進(jìn)行了分組以促進(jìn)對(duì)特定主題的實(shí)踐,而有些則是混合型實(shí)踐問題,在這些實(shí)踐問題中需要綜合一些前面章節(jié)中的內(nèi)容。大約250道練習(xí)題已有詳細(xì)的在線解答以供線下實(shí)踐及自學(xué)使用。
5仿真、蒙特卡羅方法和R軟件。很多概率問題都因計(jì)算太難而不能精確求解,并且在任何情況下,對(duì)所給答案進(jìn)行核查都是很重要的。我們介紹了通過仿真來(lái)研究概率論的方法,并證明了借助簡(jiǎn)短的幾行R軟件代碼就足以對(duì)一個(gè)看似復(fù)雜的問題進(jìn)行仿真。
6聚焦真實(shí)世界的關(guān)聯(lián)性和統(tǒng)計(jì)思維。書中所有的例子和練習(xí)題都有明確的現(xiàn)實(shí)背景,都聚焦于如何為進(jìn)一步學(xué)習(xí)統(tǒng)計(jì)推斷和統(tǒng)計(jì)建模打下堅(jiān)實(shí)的理論基礎(chǔ)。我們簡(jiǎn)要介紹了重要的統(tǒng)計(jì)思想,例如抽樣、仿真、貝葉斯推斷和馬爾可夫鏈蒙特卡羅方法,及其應(yīng)用領(lǐng)域,包括基因?qū)W、藥學(xué)、計(jì)算機(jī)科學(xué)和信息科學(xué)等。對(duì)例子和練習(xí)題的選擇都是為了突出概率思維的力量、適用性及其美之所在。
iv前言致謝感謝我們的同事、Stat110的教學(xué)助理和數(shù)千位Stat110的學(xué)生所給出的與這門課程和這本書相關(guān)的評(píng)論及想法。特別要感謝Alvin Siu、 Angela Fan、 Anji Tang、 Carolyn Stein、 David Jones、 David Rosengarten、 David Watson、 Johannes Ruf、 Kari Lock、 Keli Liu、 Kevin Bartz、 Lazhi Wang、 Martin Lysy、 Michele Zemplenyi、 Peng Ding、 Rob Phillips、 Sam Fisher、 Sebastian Chiu、 Sofia Hou、 Theresa Gebert、 Valeria Espinosa、 ViktoriiaLiublinska、 Viviana Garcia、 William Chen和Xander Marcus對(duì)本書的反饋。尤其感謝Bo Jiang、 Raj Bhuptani、 Shira Mitchell和那些匿名的審稿人針對(duì)本書草稿所給出的詳細(xì)評(píng)論,及Andrew Gelman、 Carl Morris、 PersiDiaconis、 Stephen Blyth、 Susan Holmes和XiaoLi Meng關(guān)于概率的無(wú)數(shù)次有深刻見解的討論。
CRC出版社的John Kimmel在本書的寫作過程中提供了極好的編輯上的專家意見,對(duì)他的支持深表感激。
最后,對(duì)我們的家人致以最深的謝意,感謝他們對(duì)我們的愛和鼓勵(lì)。
Joe Blitzstein和Jessica Hwang于Cambridge,MA and Stanford,CA2014年5月
[美]約瑟夫 K.布利茨斯坦 (Joseph KBlitzstein) 哈佛大學(xué)教授,主要研究領(lǐng)域?yàn)閺?fù)雜網(wǎng)絡(luò)*模型,蒙特卡羅方法,組合*結(jié)構(gòu)模型等,先后在斯坦福大學(xué)以及哈佛大學(xué)任教
vi前言
Prefacevii
前言(譯)
原書前言
1 概率與計(jì)數(shù)1
1.1為什么要學(xué)概率論?1
1.2樣本空間與鵝卵石世界3
1.3概率的樸素定義6
1.4如何計(jì)算概率8
1.5故事性證明19
1.6概率的非樸素定義20
1.7要點(diǎn)重述25
1.8R軟件應(yīng)用示例27
1.9練習(xí)題31
2 條件概率41
2.1有條件地思考問題的重要性41
2.2定義與直觀解釋42
2.3貝葉斯準(zhǔn)則與全概率公式47
2.4條件概率是概率53
2.5事件的獨(dú)立性56
2.6貝葉斯準(zhǔn)則的一致性59
2.7條件化作為一種解決問題的工具60
2.8陷阱與悖論66
2.9要點(diǎn)重述70
2.10R軟件應(yīng)用示例72
2.11練習(xí)題74
3 隨機(jī)變量及其分布91
3.1隨機(jī)變量91
3.2分布函數(shù)與概率質(zhì)量函數(shù)94
3.3伯努利分布及二項(xiàng)分布100
3.4超幾何分布103
3.5離散均勻分布106
3.6累積分布函數(shù)108
3.7隨機(jī)變量函數(shù)的分布110
3.8隨機(jī)變量的獨(dú)立性117
3.9二項(xiàng)分布與超幾何分布之間的聯(lián)系121
3.10要點(diǎn)重述124
3.11R軟件應(yīng)用示例126
3.12練習(xí)題128x目錄
4 數(shù)學(xué)期望137
4.1期望的定義137
4.2期望的線性性質(zhì)140
4.3幾何分布與負(fù)二項(xiàng)分布144
4.4示性隨機(jī)變量與基本橋梁151
4.5無(wú)意識(shí)的統(tǒng)計(jì)規(guī)律(LOTUS)156
4.6方差157
4.7泊松分布161
4.8泊松分布和二項(xiàng)分布之間的聯(lián)系165
4.9*采用概率與期望證明存在性168
4.10要點(diǎn)重述174
4.11R軟件應(yīng)用示例175
4.12練習(xí)題178
5 連續(xù)型隨機(jī)變量195
5.1概率密度函數(shù)195
5.2均勻分布201
5.3均勻分布的普適性205
5.4正態(tài)分布211
5.5指數(shù)分布217
5.6泊松過程222
5.7獨(dú)立同分布的連續(xù)型隨機(jī)變量的對(duì)稱性225
5.8要點(diǎn)重述226
5.9R軟件應(yīng)用示例228
5.10練習(xí)題231
6 矩243
6.1分布的數(shù)字特征243
6.2矩的解釋248
6.3樣本矩252
6.4矩量母函數(shù)255
6.5由矩量母函數(shù)得到生成矩259
6.6通過矩量母函數(shù)討論獨(dú)立隨機(jī)變量的和261
6.7*概率母函數(shù)262
6.8要點(diǎn)重述267
6.9R軟件應(yīng)用示例267
6.10練習(xí)題272
7 聯(lián)合分布277
7.1聯(lián)合、邊緣和條件分布278
7.2二維LOTUS298
7.3協(xié)方差與相關(guān)性300
7.4多項(xiàng)式分布306
7.5多元正態(tài)分布309
7.6要點(diǎn)重述316xii目錄
7.7R軟件應(yīng)用示例318
7.8練習(xí)題320
8 變換339
8.1變量的變換341
8.2卷積346
8.3貝塔分布351
8.4伽馬分布356
8.5貝塔分布與伽馬分布之間的聯(lián)系365
8.6順序統(tǒng)計(jì)量367
8.7要點(diǎn)重述370
8.8R軟件應(yīng)用示例373
8.9練習(xí)題375
9 條件期望383
9.1給定事件的條件期望383
9.2給定隨機(jī)變量的條件期望392
9.3條件期望的性質(zhì)394
9.4*條件期望的幾何解釋399
9.5條件方差400
9.6亞當(dāng)與夏娃的例子402
9.7要點(diǎn)重述407
9.8R軟件應(yīng)用示例408
9.9練習(xí)題410
10 不等式與極限定理421
10.1不等式422
10.2大數(shù)定理431
10.3中心極限定理435
10.4卡方分布與學(xué)生t分布441
10.5要點(diǎn)重述445
10.6R軟件應(yīng)用示例447
10.7練習(xí)題450
11 馬爾可夫鏈459
11.1馬爾可夫性質(zhì)與轉(zhuǎn)移矩陣459
11.2狀態(tài)分類465
11.3平穩(wěn)分布469
11.4可逆性475
11.5要點(diǎn)重述480
11.6R軟件應(yīng)用示例481
11.7練習(xí)題484
12 馬爾可夫鏈蒙特卡羅方法495
12.1MetropolisHastings方法496
12.2Gibbs采樣508
12.3要點(diǎn)重述515
12.4R軟件應(yīng)用示例515
12.5練習(xí)題517
13 泊松過程519
13.1一維泊松過程519
13.2條件化、疊加性、稀疏化521
13.3多維泊松過程532
13.4要點(diǎn)重述534
13.5R軟件應(yīng)用示例534
13.6練習(xí)題536
A數(shù)學(xué)基礎(chǔ)541
A.1集合541
A.2函數(shù)545
A.3矩陣550
A.4差分方程552
A.5微分方程553
A.6偏導(dǎo)數(shù)554
A.7多重積分554
A.8求和556
A.9模式識(shí)別558
A.10常識(shí)與核對(duì)答案558
B R軟件561
B.1向量561
B.2矩陣562
B.3數(shù)學(xué)運(yùn)算563
B.4抽樣與仿真563
B.5作圖564
B.6編程564
B.7統(tǒng)計(jì)量匯總564
B.8分布565
C 分布列表567
參考文獻(xiàn)569
索引571