《高等分層分位回歸建模理論》全面、系統(tǒng)、嚴(yán)格地闡明分層分位回歸建模理論與方法,并盡力反映復(fù)雜分層數(shù)據(jù)分析國際前沿研究. 內(nèi)容涉及分層線性分位回歸模型、分層廣義線性分位回歸模型、分層非線性分位回歸模型、分層半?yún)?shù)分位回歸模型等該領(lǐng)域前沿課題。
適讀人群 :《高等分層分位回歸建模理論》可作為統(tǒng)計學(xué)及其相關(guān)領(lǐng)域的本科生、研究生的教學(xué)參考書,也可供教師和科技人員參考.
《高等分層分位回歸建模理論》用嚴(yán)格的數(shù)學(xué)語言對分層分位模擬的現(xiàn)代面貌做較為詳細(xì)的介紹。
《高等分層分位回歸建模理論》的特點之一是內(nèi)容全新、理論性強(qiáng),介紹近年來國際上關(guān)于分層分位回歸建模理論與方法的許多新成果。其中不乏作者在該領(lǐng)域研究中取得的一些成果。另一個特點是取材全部來自于國際一流學(xué)術(shù)期刊雜志上的代表性文章,信息量大、內(nèi)容權(quán)威。
上篇 分層結(jié)構(gòu)數(shù)據(jù)均值建模理論、方法
第1章 分層線性模型
1.1 引言
1.1.1 背景
1.1.2 復(fù)雜數(shù)據(jù)概念
1.1.3 傳統(tǒng)模型
1.1.4 主要參考文獻(xiàn)
1.2 極大似然法
1.2.1 引言
1.2.2 EM算法的定義
1.2.3 一般性質(zhì)
1.2.4 主要參考文獻(xiàn)
1.3 EM算法
1.3.1 介紹
1.3.2 協(xié)方差已知情況下的理論
1.3.3 方差和協(xié)方差估計
1.3.4 計算
1.3.5 主要參考文獻(xiàn)
1.4 迭代廣義最小二乘法
1.4.1 引言
1.4.2 基本模型
1.4.3 估計
1.4.4 誤差方差、協(xié)方差及誤差協(xié)方差矩陣逆
1.4.5 隨機(jī)系數(shù)
1.4.6 參數(shù)限制
1.4.7 解釋變量有測量誤差的估計量
1.4.8 討論
1.4.9 主要參考文獻(xiàn)
1.5 得分算法
1.5.1 引言
1.5.2 模型
1.5.3 對數(shù)似然函數(shù)
1.5.4 二水平嵌套
1.5.5 期望信息陣、雅可比行列式以及對數(shù)似然
1.5.6 EM算法
1.5.7 多于兩水平嵌套
1.5.8 主要參考文獻(xiàn)
1.6 Newton-Raphson算法
1.6.1 引言
1.6.2 計算方法
1.6.3 對數(shù)似然的導(dǎo)數(shù)
1.6.4 矩陣分解
1.6.5 參數(shù)σ與D的估計
1.6.6 討論與延伸
1.6.7 主要參考文獻(xiàn)
1.7 貝葉斯法
1.7.1 引言
1.7.2 三種情況
1.7.3 協(xié)方差結(jié)構(gòu)未知時的估計
1.7.4 協(xié)方差結(jié)構(gòu)未知的例子
1.7.5 多元回歸方程間的可交換性
1.7.6 多元回歸方程中的可交換性
1.7.7 主要參考文獻(xiàn)
第2章 分層廣義線性模型
2.1 模型
2.1.1 介紹
2.1.2 分層廣義線性模型
2.1.3 典則連接模型
2.1.4 對數(shù)連接模型
2.1.5 典則連接模型
2.1.6 對數(shù)連接模型
2.1.7 最大h似然估計的性質(zhì)
2.1.8 估計過程
2.1.9 推廣
2.1.1 0 討論
2.1.1 1 主要參考文獻(xiàn)
2.2 抽樣方法
2.2.1 引言
2.2.2 隨機(jī)效應(yīng)廣義線性模型
2.2.3 貝葉斯公式
2.2.4 Gibbs抽樣
2.2.5 條件分布
2.2.6 討論
2.2.7 主要參考文獻(xiàn)
第3章 分層非線性模型
3.1 二階廣義估計方程
3.1.1 引言
3.1.2 模型
3.1.3 估計
3.1.4 條件方差一協(xié)方差的結(jié)構(gòu)
3.1.5 懲罰尾似然和懲罰擴(kuò)展最小二乘的關(guān)系
3.1.6 漸近性質(zhì)
3.1.7 討論
3.1.8 主要參考文獻(xiàn)
3.2 混合估計
3.2.1 引言
3.2.2 3個估計量
3.2.3 混合估計
3.2.4 漸近理論
3.2.5 推廣
3.2.6 討論
3.2.7 主要參考文獻(xiàn)
第4章 分層半?yún)?shù)模型
4.1 分層半?yún)?shù)非線性模型
4.1.1 引言
4.1.2 半?yún)⒎蔷性混合效應(yīng)模型
4.1.3 估計
4.1.4 計算
4.1.5 統(tǒng)計推斷
4.1.6 結(jié)論
4.1.7 主要參考文獻(xiàn)
4.2 聯(lián)合模型
4.2.1 背景
4.2.2 模型與估計方法
4.2.3 漸近性質(zhì)
4.2.4 穩(wěn)健性
4.2.5 討論
4.2.6 主要參考文獻(xiàn)
下篇 分層結(jié)構(gòu)數(shù)據(jù)的分位回歸模型理論、方法
第5章 分位回歸引論
5.1 引言
5.1.1 分位數(shù)
5.1.2 分位回歸
5.1.3 分位回歸方法的演變
5.2 估計方法和算法
5.2.1 參數(shù)分位回歸模型
5.2.2 Box-Cox變換分位數(shù)模型
5.2.3 非參分位回歸模型
5.2.4 窗寬選擇
5.2.5 半?yún)⒎治换貧w模型
5.2.6 兩步法
5.3 應(yīng)用領(lǐng)域
5.3.1 報酬與市場價值
5.3.2 分位數(shù)Engel曲線
5.3.3 嬰兒體重的決定因素
5.3.4 醫(yī)學(xué)中參考圖表
5.3.5 生存分析
5.3.6 風(fēng)險值與分布尾部
5.3.7 經(jīng)濟(jì)
5.3.8 環(huán)境
5.3.9 異方差性檢測
5.4 其他方面的進(jìn)展
5.4.1 時間序列
5.4.2 擬合優(yōu)度
5.4.3 貝葉斯分位回歸
5.5 主要參考文獻(xiàn)
第6章 分層樣條分位回歸模型
6.1 引言
6.2 非參估計
6.3 Wald型檢驗
6.4 實際應(yīng)用
6.4.1 第一層:時間序列模型
6.4.2 第二層:橫截面模型
6.4.3 條件分位數(shù)分層模型
6.5 結(jié)論
6.6 主要參考文獻(xiàn)
第7章 分層線性分位回歸模型
7.1 引言
7.2 模型界定
7.3 EQ算法
7.3.1 Q步
7.3.2 E步
7.3.3 迭代
7.3.4 初始值選取
7.4 大樣本性質(zhì)
7.5 主要參考文獻(xiàn)
第8章 分層半?yún)?shù)分位回歸模型
8.1 分層半?yún)?shù)分位回歸
8.2 引言
8.3 模型和估計
8.4 漸近結(jié)果
8.5 結(jié)論
8.6 主要參考文獻(xiàn)
第9章 復(fù)合分層線性分位回歸模型
9.1 復(fù)合分層線性分位回歸
9.2 引言
9.3 模型
9.4 估計
9.5 大樣本性質(zhì)
9.5.1 誤差項為正態(tài)分布情形
9.5.2 誤差項分布非正態(tài)情形
9.6 討論
9.7 主要參考文獻(xiàn)
第10章 復(fù)合分層半?yún)?shù)分位回歸模型
10.1 復(fù)合分層半?yún)?shù)分位回歸
10.2 引言
10.3 模型
10.4 估計與算法
10.5 大樣本性質(zhì)
10.6 討論
10.7 主要參考文獻(xiàn)
第11章 分層空間模型的逆問題
11.1 分位耦合
11.2 引言
11.3 分位耦合
11.4 分層序列空間模型
11.4.1 模型
11.4.2 耦合步驟
11.4.3 自適應(yīng)齊性診斷
11.5 非漸近神諭不等式
11.5.1 估計
11.5.2 權(quán)重序列的神諭性質(zhì)
11.5.3 數(shù)據(jù)驅(qū)動的權(quán)重序列的選擇
11.6 主要參考文獻(xiàn)
參考文獻(xiàn)
索引
《高等分層分位回歸建模理論》:
上篇
分層結(jié)構(gòu)數(shù)據(jù)均值建模理論、方法
第1章 分層線性模型
1.1 引言
1.1.1 背景
1.分層結(jié)構(gòu)數(shù)據(jù)很普遍
數(shù)據(jù)存在于特定的時間和空間中,其表現(xiàn)形式通常是復(fù)雜的分層結(jié)構(gòu),這是一種非常普遍的現(xiàn)象.比如,公司在制定決策以便提高勞動生產(chǎn)率方面,顯然工人和公司都是分析的對象.對這兩個層次的變化都必須進(jìn)行考量.其實這樣的數(shù)據(jù)就有著一種分層結(jié)構(gòu):工人嵌套在公司里.又如,在研究國家經(jīng)濟(jì)的發(fā)展與影響生育率的教育時,家庭和國家都是研究的對象,前者嵌套在后者之中,這基本的數(shù)據(jù)結(jié)構(gòu)也是分層的.再給出一個例子:關(guān)于教育方面的數(shù)據(jù),學(xué)生被分成班級,班級嵌套在學(xué)校里,學(xué)校上面有社區(qū),社區(qū)上面還有市、省、國家等。具有分層結(jié)構(gòu)的數(shù)據(jù)是一種普遍現(xiàn)象.隨著科學(xué)技術(shù)的飛速發(fā)展,當(dāng)今世界許多科學(xué)研究領(lǐng)域主要面臨的挑戰(zhàn)是急劇增長的高維多元復(fù)雜分層數(shù)據(jù),這種類型的數(shù)據(jù)普遍存在.有關(guān)這種類型的數(shù)據(jù)的有效分析無論是在理論研究方面還是在經(jīng)驗研究方面都引起了廣泛的關(guān)注.本書著力研究如下6大類型的高維空間里的分層結(jié)構(gòu)數(shù)據(jù):①空間分層數(shù)據(jù)(hierarchical data);②時間縱向數(shù)據(jù)(longitudinal data);③重復(fù)測量數(shù)據(jù)(repeated measurement data);④廣義聚類數(shù)據(jù)(generalized clustered data);⑤名義分類數(shù)據(jù)(nominal categorical data);以及⑥有序分類數(shù)據(jù)(ordinal categorical data)等.如何從中挖掘出有用的信息,找出數(shù)據(jù)掩蓋下的事物存在與發(fā)展的基本規(guī)律,促進(jìn)統(tǒng)計學(xué)學(xué)科的發(fā)展,推動若干重要的相關(guān)領(lǐng)域及某些科學(xué)前沿取得突破,這些正是本書研究的目的。2.模型名稱
由于分層數(shù)據(jù)分析在各學(xué)科領(lǐng)域越來越受到重視,所以相關(guān)的研究顯得異常活躍,文獻(xiàn)中出現(xiàn)了各種各樣的稱謂.在社會學(xué)研究方面,這些模型指分層線性模型(Goldstein,1995; Mason et al.,1983);在生物測定學(xué)方面,這些術(shù)語普遍指混合型效應(yīng)模型和隨機(jī)效應(yīng)模型(Elston和 Grizzle,1962; Laird和 Ware,1982; Singer,1998);在計量經(jīng)濟(jì)學(xué)文獻(xiàn)中,也稱之為隨機(jī)系數(shù)模型(Rosenberg,1973; Longford,1993);而在統(tǒng)計文獻(xiàn)中則稱之為協(xié)方差成分模型(Dempster et al.,1981; Longford,1987).本書之所以采用分層線性模型這個術(shù)語,是因為它表達(dá)了數(shù)據(jù)的一個重要結(jié)構(gòu)特點,這種數(shù)據(jù)使用范圍廣,常見于增長性研究、機(jī)構(gòu)效應(yīng)和綜合研究.這個術(shù)語是由 Lindley和 Smith(1972), Smith(1973)引進(jìn)的.在這種前提下, Lindley和 Smith詳細(xì)闡述了復(fù)雜的誤差結(jié)構(gòu)嵌入數(shù)據(jù)的普遍框架.不過后續(xù)的研究曾經(jīng)一度衰落,因為這些模型的使用需要對不平衡的數(shù)據(jù)進(jìn)行協(xié)方差成分的估計.除了一些非常簡單的問題之外,在20世紀(jì)70年代早期沒有一種全面的估計方法行得通. Dempster等(1977)研究了 EM的算法,結(jié)果使之有了必要的突破:一種概念上的可行和協(xié)方差成分估計的廣泛應(yīng)用方法. Dempster等(1981)證明了這種分層數(shù)據(jù)結(jié)構(gòu)方法的合理性. Laird和 Ware(1982), Strenio, Weisberg和 Bryk (1983)把這種方法應(yīng)用到增長性研究方面,而 Mason等(1983)則把它應(yīng)用到多層結(jié)構(gòu)橫截面數(shù)據(jù)方面.后來,通過對最小二層重新反復(fù)地廣泛使用和一種 Fisher得分算法,其他的多種協(xié)方差成分估計方法也就應(yīng)運(yùn)而生了(Goldstein,1986)。貝葉斯方法在這種情況下提供一種有意義的可選擇方法.標(biāo)準(zhǔn)誤差比在 ML(極大似然)下將趨向于更實際.而且,通過提供感興趣的每個參數(shù)的后驗分布,貝葉斯方法提供有關(guān)研究問題的多種有興趣的圖表與數(shù)量證據(jù)的總結(jié).貝葉斯方法的出現(xiàn)并不新鮮.比較新鮮的是較為方便的計算方法的出現(xiàn),尤其是在分層數(shù)據(jù)和模型的背景下.這些新方法的進(jìn)展是關(guān)于使用 Monte Carlo方法來估計在先前被當(dāng)作難處理的背景下后驗分布的規(guī)則系統(tǒng)族.這方法包括數(shù)據(jù)增廣(Tanner and Wong,1987)和 Gibbs取樣(Gelfand et al.,1990; Gelfand and Smith,1990)。3.分位回歸
關(guān)于傳統(tǒng)的分層模型所用的統(tǒng)計分析方法主要是均值回歸.該方法有許多不足之處. Koenker和 Bassett (1978)提出了分位回歸,它可以看成是將經(jīng)典的最小二乘方法從估計條件均值模型擴(kuò)展到估計條件分位函數(shù)組合的模型.一個重要特殊的情況就是中位數(shù)回歸估計量,它是最小化絕對誤差的和.其他的條件分位函數(shù)的估計方法是通過最小化絕對誤差的非對稱的加權(quán)和.簡單地講,均值回歸研究的是給定解釋變量后響應(yīng)變量的平均變化趨勢,而分位回歸則試圖全面刻畫條件隨機(jī)變量的各分位點隨解釋變量的變化情況,另外,它能估計出來的系數(shù)向量,即邊際效應(yīng),對響應(yīng)變量的離群觀測值來說,是穩(wěn)健的;給出在不同分位點上潛在的不同解,這具有很有用的解釋意義。1.1.2復(fù)雜數(shù)據(jù)概念
眾所周知,隨著現(xiàn)代科學(xué)技術(shù)的飛速發(fā)展,許多科學(xué)研究領(lǐng)域產(chǎn)生了多種復(fù)雜數(shù)據(jù).當(dāng)然復(fù)雜數(shù)據(jù)的統(tǒng)計建模涵蓋了許多當(dāng)代統(tǒng)計分支,推動了當(dāng)代統(tǒng)計學(xué)理論方法的進(jìn)步與發(fā)展,并且其應(yīng)用層面涉及生物信息學(xué)、流行病學(xué)和金融風(fēng)險等,意義十分重大深遠(yuǎn)。概念界定:本書所研究的復(fù)雜數(shù)據(jù)的明顯特征之一是:高維、高頻、多元、復(fù)雜的“時空”分層等性質(zhì).數(shù)據(jù)分析方面的主要挑戰(zhàn)來自:①在高維空間中直接進(jìn)行系統(tǒng)收縮變得非常困難; ②一般高維函數(shù)的精確逼近很棘手; ③高維函數(shù)積分的實現(xiàn)變得不可能; ④對感興趣的高維多元條件隨機(jī)變量分布的全面刻畫尚無先例可循; ⑤如果沒有考慮普遍存在的復(fù)雜“時空”分層數(shù)據(jù)的特征,常常使得傳統(tǒng)的統(tǒng)計方法表現(xiàn)不佳,甚至失效。高維多元復(fù)雜數(shù)據(jù)的統(tǒng)計分析是目前全世界統(tǒng)計學(xué)界面臨的最大挑戰(zhàn),這無疑是當(dāng)前統(tǒng)計學(xué)中的研究熱點問題.本書以此選題,針對復(fù)雜數(shù)據(jù)相關(guān)問題開展研究。……
……