統計學是一門關于數據的科學,它在多個學科領域有著廣泛的應用.本書內容涉及常用統計數據分析與統計方法的應用,包括統計與數據、R語言基礎、統計數據的描述性分析、總量指標和相對指標、概率論基礎、樣本與抽樣分布、參數估計、假設檢驗、方差分析、相關與回歸分析、多元回歸分析、時間序列分析等.另外,對R軟件的基本內容以及與以上內容有關的R語言實現過程做了簡介,以便于各種統計方法的實際應用.各章均有大量的有實際應用背景的例子的詳解和R代碼的實現過程,希望這些例子能使讀者對統計和R軟件產生興趣,當你用R軟件來學習統計時,你一定會愛上統計,也會愛上R軟件.
本書可作為理科、工科、經濟、管理、農林、醫學以及人文社會科學專業讀者的統計學入門教材,也可供實業界和從事經濟商務分析的各類人員參考.
統計學是研究不確定現象數量規律性的方法論科學,它在多個學科領域有著廣泛的應用.隨著大數據時代的到來,理科、工科、經濟、管理、農林、醫學以及人文社會科學對數據分析的需求在持續增長,相關行業需要處理大量的數據信息.將統計學的思想和方法應用于各個領域,并和強大的R軟件相結合,成為解決各領域實際問題的最有效的手段之一.
本書作為一本統計學的入門教材,主要講述數據分析與統計方法的應用.每一種統計方法的介紹都以一項實際應用來表述,并用統計結果給出決策的過程和問題的解答.
本書的一個特色是應用性強.書中主要介紹統計學的思想、方法在實際中的應用,以解決實際中存在的數據分析問題.本書介紹了大量以實際數據為基礎的例子,每一種統計方法的介紹都與一個實例相關聯,并在每一章配套大量的有實際應用背景的例題和練習,以便讀者熟練掌握相應的統計方法.
本書的另一個特色是通俗易懂.借助強大的R軟件,本書舍棄了煩瑣的數學推導和統計計算,采用深入淺出、循序漸進的方法系統地介紹了統計學的思想和方法,通過實例的介紹,幫助讀者理解并且能夠很容易地利用R軟件完成各種統計分析的計算.雖然R軟件是編程語言,但由于其簡單易懂,即使從未使用過R軟件的人也可以毫不費力地通過復制、粘貼書上的代碼重新實現書上的所有例題的計算.本書還穿插了歷史上的統計學家的生平、成就以及他們的貢獻的介紹,擴展讀者的視野,使讀者了解統計學發展和應用的歷史背景,既使得統計學的學習不再枯燥,又使得讀者能更全面地了解統計這個學科.
R軟件是伴隨著統計學的發展而興起的一種計算工具,具有自由、免費和開源的特點,自誕生以來,得到越來越多的統計學家和工程技術人員的使用.R軟件中內置了多種統計學及數值分析功能,其功能還可以通過安裝不斷更新的程序包得以擴展.國際上統計學術期刊最新發表的論文中介紹的高被引(高頻次被引用)統計方法絕大多數都可以從CRAN上自由下載,因此,R軟件被國外大量的學術科研機構使用,國外大學的統計系許多都將R軟件作為學生的必修課程,R軟件在國際上已經成為統計學教學與科研的主要軟件,其應用范圍涵蓋了幾乎所有的統計分支方向和許多交叉學科(如計量金融學、統計遺傳學、統計物理學等),統計學課程的教學與R軟件的緊密結合已成為發達國家統計教學的主流.
本書內容共12章,其中第1~3章及5~12章由朱彬編寫,第4章由薛文娟編寫,郭念枝和沈群也參與了本書習題部分的編寫工作中,最后由朱彬負責統稿.
本書編寫過程中,得到福建師范大學經濟學院的各位領導和同事的關心、鼓勵和支持,在此表示深深的謝意.本書的編寫得到福建師范大學經濟學院的資助,在此表示感謝.
希望本書能使讀者對統計和R軟件產生興趣,當你用R軟件來學習統計時,你一定會愛上統計,也會愛上R軟件.
由于編者水平有限,書中疏漏和錯誤之處在所難免,懇請讀者批評指正,以便再版時修改完善.
編者
前言
第1章統計與數據
1.1什么是統計
1.2統計學的基本概念
1.2.1總體與個體
1.2.2變量
1.2.3樣本
1.2.4參數與統計量
1.3數據的類型
1.3.1分類數據、順序數據、數值型
數據
1.3.2截面數據和時間序列數據
1.4統計數據的來源
1.4.1統計直接調查
1.4.2觀察與實驗
1.4.3間接獲取數據
1.5統計數據的質量
1.6統計學與R軟件
1.7初識R軟件
習題1
第2章R語言基礎
2.1向量
2.1.1基本運算
2.1.2賦值
2.1.3向量賦值
2.1.4向量運算
2.1.5作圖
2.1.6產生有規律的向量
2.1.7向量的類型
2.1.8向量的下標
2.2因子
2.3矩陣和數組
2.3.1生成矩陣
2.3.2矩陣下標
2.3.3矩陣的合并
2.3.4定義矩陣的行名和列名
2.3.5矩陣轉化為向量
2.3.6矩陣的維運算
2.3.7數組的生成
2.3.8數組下標
2.4列表
2.5數據框
2.5.1數據框的生成
2.5.2數據框的引用
2.5.3定義數據框的變量名
2.6創建R數據
2.6.1在R中錄入數據
2.6.2數據的使用和編輯
2.7生成隨機數和隨機樣本
2.7.1隨機數
2.7.2隨機樣本
2.8編寫自定義函數
2.8.1編寫函數
2.8.2循環函數
2.9繪制多圖
2.10腳本
2.11輸入數據與讀寫數據
習題2
第3章統計數據的描述性分析
3.1統計數據的整理與顯示
3.1.1統計數據的分組
3.1.2次數分配與頻數分布圖
3.1.3條形圖和餅圖
3.1.4Pareto圖
3.1.5直方圖
3.1.6莖葉圖
3.2集中趨勢的度量
3.3離中趨勢的度量
3.4分布形狀的度量
3.5數據分布的正態性檢驗和分布擬合
檢驗
3.6多元數據的可視化
習題3
第4章總量指標和相對指標
4.1總量指標
4.2相對指標
4.2.1相對指標的種類和計算方法
4.2.2運用相對數指標的原則
習題4
第5章概率論基礎
5.1隨機事件與概率
5.1.1隨機試驗與隨機事件
5.1.2概率
5.1.3古典概型
5.1.4幾何概型
5.1.5條件概率
5.1.6乘法公式、全概率公式、貝葉斯
公式
5.1.7事件的獨立性
5.2隨機變量及其分布
5.2.1隨機變量的定義及分布函數
5.2.2離散型隨機變量
5.3連續型隨機變量
5.4常用隨機變量分布的R實現
習題5
第6章樣本與抽樣分布
6.1樣本與統計量
6.1.1總體與樣本
6.1.2統計量
6.1.3經驗分布函數
6.2大數定律與中心極限定理
6.2.1大數定律
6.2.2中心極限定理
6.3中心極限定理在抽樣分布中的應用
6.3.1樣本均值的抽樣分布
6.3.2樣本比例p的抽樣分布
6.4常用統計量的抽樣分布
6.4.1三種常用統計分布
6.4.2正態總體下常用統計量的分布
6.4.3樣本比例的抽樣分布
習題6
第7章參數估計
7.1點估計
7.2估計量的評價標準
7.3區間估計
7.3.1單個正態總體的情況
7.3.2兩個正態總體參數的區間估計
7.4總體比例的區間估計
7.5樣本容量的確定
習題7
第8章假設檢驗
8.1假設檢驗的基本概念
8.2單個正態總體參數的假設檢驗
8.3兩個正態總體參數的假設檢驗
8.4總體比例的假設檢驗
8.5擬合優度檢驗
習題8
第9章方差分析
9.1單因素方差分析
9.2雙因素方差分析
習題9
第10章相關與回歸分析
10.1相關分析
10.2一元線性回歸分析
10.3利用回歸方程進行預測
10.4非線性回歸分析
習題10
第11章多元回歸分析
11.1數學模型
11.2多元回歸模型的擬合優度
11.3多元回歸模型的顯著性檢驗
11.4回歸診斷
11.5利用回歸模型進行預測
11.6定性變量的回歸模型
習題11
第12章時間序列分析
12.1時間序列的成分
12.2移動平均法與指數平滑法
12.3回歸預測分析
12.4時間序列的平穩性
習題12
參考文獻