全書共九章,內(nèi)容包括數(shù)據(jù)概述、聚類分析、判別分析、主成分分析、因子分析、線性模型、統(tǒng)計診斷、有偏估計、變量選擇。各章都有豐富的例題和案例,為加深每章內(nèi)容的理解,每章的練習(xí)也分為理論和實(shí)證部分,書后附有參考答案,為使書中案例貼近數(shù)據(jù)的應(yīng)用實(shí)際,采用了獲取方便的證券市場高頻數(shù)據(jù),并使用國際通用的R軟件進(jìn)行數(shù)據(jù)收集、處理、加工和分析,便于讀者自己動手和實(shí)際應(yīng)用需要。全書內(nèi)容講解簡明扼要,注重應(yīng)用,讓讀者收集數(shù)據(jù)開始,掌握數(shù)據(jù)收集、整理和大數(shù)據(jù)統(tǒng)計分析的全過程。
1952年,芝加哥大學(xué)的馬科維茲(Markowitz)首次采用股票收益率歷史數(shù)據(jù)的方差,作為風(fēng)險衡量指標(biāo),并指出與證券市場的整體運(yùn)行相關(guān)聯(lián)的宏觀系統(tǒng)風(fēng)險不能通過投資分散化加以消除,稱為不可分散風(fēng)險。馬科維茲在投資者效用的基礎(chǔ)上,將復(fù)雜的投資決策問題簡化為一個風(fēng)險(方差)-收益(均值)的二維問題,即在相同的期望收益條件下,投資者選擇投資風(fēng)險最小的證券(組合),或在相同的投資風(fēng)險下,選擇預(yù)期收益率證券(組合)。開統(tǒng)計方法應(yīng)用于金融市場之先河。1978年,西蒙斯(Simons)開發(fā)了許多數(shù)學(xué)模型用來進(jìn)行分析和交易,這些基本上是自動完成。他用計算機(jī)編程建立模型分析股票價格,從而能進(jìn)行很輕松的交易并獲利。這些模型是建立在海量的數(shù)據(jù)基礎(chǔ)上的,所以具有可靠性并可進(jìn)行實(shí)際預(yù)測,1989~2009年,他操盤的大獎?wù)禄鹌骄昊貓舐矢哌_(dá)35%,較同期標(biāo)普500指數(shù)年均回報率高20多個百分點(diǎn),比金融大鱷索羅斯和股神巴菲特的操盤表現(xiàn)都高出10余個百分點(diǎn)。即便是在次貸危機(jī)爆發(fā)的2007年,該基金的回報率仍高達(dá)85%。西蒙斯成就了世界上最偉大的對沖基金之一:大獎?wù)禄稹4髷?shù)據(jù)的歷史相對較晚一些。2008年年末,大數(shù)據(jù)才得到部分美國知名計算機(jī)科學(xué)研究人員的認(rèn)可,但在2013年,大數(shù)據(jù)就已經(jīng)風(fēng)靡全球,成為一個時代的符號。我們早在2002年開始從事金融數(shù)據(jù)挖掘研究和教學(xué),2011年正式給本科生開設(shè)證券數(shù)據(jù)統(tǒng)計建模與實(shí)證分析課程,2013年結(jié)合大數(shù)據(jù)發(fā)展,給碩士生和博士生開設(shè)了金融大數(shù)據(jù)統(tǒng)計方法與實(shí)證的課程。
前言
第1章 大數(shù)據(jù)概述
一、大數(shù)據(jù)的數(shù)字特征
二、大數(shù)據(jù)的圖表示
練習(xí)1
第2章 聚類分析
一、相似性度量
二、系統(tǒng)聚類法
三、變量聚類法
四、動態(tài)聚類法
練習(xí)2
第3章 判別分析
一、距離判別
二、費(fèi)歇判別
三、貝葉斯判別
練習(xí)3
第4章 主成分分析
一、基本思想
二、樣本主成分
三、特征值因子的篩選
四、主成分分類
練習(xí)4
第5章 因子分析
一、因子分析模型
二、因子旋轉(zhuǎn)
三、因子得分
練習(xí)5
第6章 線性模型
一、線性模型及參數(shù)的最小二乘估計
二、最小二乘估計的性質(zhì)
三、線性模型的顯著性檢驗(yàn)
四、正回歸
練習(xí)6
第7章 回歸診斷
一、殘差
二、殘差圖
三、異常點(diǎn)
練習(xí)7
第8章 有偏估計
一、均勻壓縮估計
二、主成分估計
三、嶺估計
練習(xí)8
第9章 變量選擇
一、變量選擇準(zhǔn)則
二、逐步回歸
三、絕對約束估計
四、彈性約束估計
五、非負(fù)約束估計
練習(xí)9
練習(xí)提示與參考答案
參考文獻(xiàn)
附錄R 應(yīng)用程序