本書(shū)圍繞數(shù)據(jù)降維技術(shù),分別針對(duì)線(xiàn)性降維和非線(xiàn)性降維兩種降維手段進(jìn)行廣泛而深入的討論。對(duì)于線(xiàn)性降維技術(shù),本書(shū)介紹了常用的降維算法,并對(duì)線(xiàn)性降維與矩陣分解的等價(jià)性進(jìn)行了分析,在此基礎(chǔ)上提出了semi-NMF、OCA、IOCA、EOCA等改進(jìn)算法并進(jìn)行詳細(xì)的理論分析和實(shí)驗(yàn)驗(yàn)證。對(duì)于非線(xiàn)性降維算法,本書(shū)介紹了常用算法,包括流形學(xué)習(xí)算法、基于核方法和基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)降維,并提出了改進(jìn)的基準(zhǔn)點(diǎn)選取SL-Isomap算法及基于拓?fù)鋵W(xué)習(xí)的流形學(xué)習(xí)算法TLE。
目錄
前言
第1章 緒論 1
1.1 數(shù)據(jù)降維算法分類(lèi) 4
1.2 本書(shū)主要內(nèi)容與組織結(jié)構(gòu) 6
第2章 經(jīng)典線(xiàn)性降維算法介紹 9
2.1 主成分分析 10
2.2 線(xiàn)性判別分析 14
2.3 獨(dú)立成分分析 16
2.4 隨機(jī)投影 18
2.5 非負(fù)矩陣分解 19
2.6 局部保持投影 24
2.7 增量式線(xiàn)性判別分析 25
2.8 無(wú)偏協(xié)方差無(wú)關(guān)增量主成分分析 30
2.9 典型相關(guān)分析 32
2.10 本章小結(jié) 34
第3章 線(xiàn)性降維中基本問(wèn)題的討論 35
3.1 線(xiàn)性降維與矩陣分解 36
3.2 數(shù)據(jù)選擇與自適應(yīng)閾值系統(tǒng) 38
3.3 線(xiàn)性方程組的求解問(wèn)題與矩陣條件數(shù) 41
3.4 本章小結(jié) 46
第4章 基于數(shù)據(jù)選擇的半非負(fù)矩陣分解 48
4.1 引言 49
4.2 相關(guān)工作介紹 50
4.3 基于數(shù)據(jù)選擇的 semi-NMF 算法 52
4.4 實(shí)驗(yàn) 55
4.4.1 在單張圖片上的矩陣分解實(shí)驗(yàn) 56
4.4.2 在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn) 58
4.5 本章小結(jié) 63
第5章 正交成分提取分析 64
5.1 引言 65
5.2 OCA算法描述 66
5.3 OCA算法分析 68
5.4 實(shí)驗(yàn) 71
5.4.1 在人工數(shù)據(jù)集上的實(shí)驗(yàn) 71
5.4.2 在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn) 74
5.5 本章小結(jié) 81
第6章 增量式正交成分分析 83
6.1 引言 84
6.2 IOCA算法描述 86
6.3 IOCA算法分析 88
6.3.1 關(guān)于 IOCA學(xué)習(xí)過(guò)程的分析 88
6.3.2 關(guān)于 IOCA有效性的分析 94
6.4 實(shí)驗(yàn) 96
6.4.1 在人工數(shù)據(jù)集上的實(shí)驗(yàn) 96
6.4.2 在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn) 99
6.5 本章小結(jié) 106
第7章 子空間正交基底在線(xiàn)調(diào)整算法 108
7.1 引言 109
7.2 子空間正交基底調(diào)整算法 110
7.2.1 子空間的 \對(duì)齊" 112
7.2.2 子空間的基底的更新 114
7.2.3 新子空間唯一性的證明 116
7.3 EOCA算法 119
7.4 實(shí)驗(yàn) 122
7.4.1 在人工數(shù)據(jù)集上的實(shí)驗(yàn) 122
7.4.2 在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn) 124
7.5 本章小結(jié) 127
第8章 經(jīng)典非線(xiàn)性降維算法 128
8.1 拉普拉斯特征映射 129
8.2 經(jīng)典多維尺度變換 130
8.3 等距特征映射 131
8.4 局部線(xiàn)性嵌入 132
8.5 局部切空間規(guī)整 133
8.6 隨機(jī)近鄰嵌入與對(duì)稱(chēng)隨機(jī)近鄰嵌入 135
8.7 基于核方法的數(shù)據(jù)降維 138
8.8 基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)降維 139
8.9 本章小結(jié) 141
第9章 改進(jìn)的基準(zhǔn)點(diǎn)選取 SL-Isomap 算法 142
9.1 引言 143
9.2 SOINN 147
9.3 SL-Isomap算法描述 150
9.3.1 基準(zhǔn)點(diǎn)選取 151
9.3.2 測(cè)地線(xiàn)距離計(jì)算 153
9.3.3 基準(zhǔn)點(diǎn)降維映射 154
9.3.4 基于基準(zhǔn)點(diǎn)對(duì)數(shù)據(jù)降維映射 154
9.3.5 坐標(biāo)標(biāo)準(zhǔn)化 155
9.4 拓?fù)浔3址治?155
9.4.1 算法分析 155
9.4.2 計(jì)算與空間復(fù)雜度分析 155
9.5 對(duì)比實(shí)驗(yàn)分析 156
9.5.1 Swiss roll data數(shù)據(jù)集 157
9.5.2 含噪聲的 Swiss roll data數(shù)據(jù)集 158
9.5.3 AT&T face數(shù)據(jù)集 160
9.5.4 誤差分析 162
9.6 本章小結(jié) 163
第10章 拓?fù)鋵W(xué)習(xí)與在線(xiàn)映射算法 164
10.1 引言 165
10.2 TLOE算法描述 166
10.2.1 基準(zhǔn)點(diǎn)近鄰圖構(gòu)造 167
10.2.2 基準(zhǔn)點(diǎn)測(cè)地線(xiàn)距離計(jì)算 167
10.2.3 基準(zhǔn)點(diǎn)降維映射 168
10.2.4 新數(shù)據(jù)點(diǎn)測(cè)地線(xiàn)距離計(jì)算 .169
10.2.5 新數(shù)據(jù)點(diǎn)降維映射 169
10.3 拓?fù)浔3址治?170
10.4 計(jì)算與空間復(fù)雜度分析 170
10.5 對(duì)比實(shí)驗(yàn)分析 171
10.5.1 Swiss roll data數(shù)據(jù)集的降維可視化 171
10.5.2 MNIST數(shù)據(jù)集的分類(lèi)任務(wù) 172
10.6 誤差分析 173
10.7 本章小結(jié) 174
第11章 基于拓?fù)鋵W(xué)習(xí)的流形學(xué)習(xí)算法 175
11.1 引言 176
11.2 拓?fù)鋵W(xué)習(xí)嵌入 178
11.2.1 拓?fù)鋵W(xué)習(xí) 179
11.2.2 數(shù)據(jù)嵌入 184
11.3 實(shí)驗(yàn) 185
11.3.1 在人工數(shù)據(jù)集上的實(shí)驗(yàn) 185
11.3.2 在手寫(xiě)數(shù)字?jǐn)?shù)據(jù)集上的實(shí)驗(yàn) 193
11.4 本章小結(jié) 195
第12章 總結(jié)與展望 196
12.1 主要工作內(nèi)容 197
12.2 工作展望 198
參考文獻(xiàn) .199
索引 207