近年來,人工智能已經從科幻走入現實。要理解并運用人工智能技術,需要熟悉并掌握相關的數學基礎知識。為此,本書整理了人工智能領域涉及的線性代數、矩陣理論、*優化、概率論、信息論以及多元統計分析等基礎知識,讀者可根據需求選取相應的章節進行學習。
通常,有意深入了解人工智能的讀者,往往已經具備微積分和線性代數等知識儲備。鑒于此,區別于同類教材,本書不再贅述這些初級知識,而是聚焦人工智能需要的實用數學工具,從而實現對人工智能領域核心數學理論的快速掌握。
本書可作為高等院校人工智能、工業智能、自動化與計算機等相關專業的本科生與研究生的教材或輔助參考書,也可作為從事相關領域的科研工作者和工程技術人員的數學基礎參考書。
配套資源:電子課件、習題與解答、教案、試卷
本書特色:
介紹人工智能領域涉及的線性代數、矩陣理論、*優化、概率論、信息論以及多元統計分析等基礎知識,聚焦人工智能需要的實用數學工具,從而實現對人工智能領域核心數學理論的快速掌握。
當今人類社會已經開啟并走進人工智能(Artificial Intelligence,AI)時代,智能家居、智能通信、智能電網、人機對弈、無人駕駛、人臉識別、語音識別、刷碼支付等,這些新生事物層出不窮,耳濡目染之下,已經或正在改變我們的生活方式。
科學家錢學森先生曾經指出:現代自然科學的基礎學科是數學和物理,其他自然科學的分支,是從這兩個基礎學科分化衍生出來的。所以,我們說,在炫目的人工智能時代,錢學森先生的論斷依然完全適用,這也是我們理解上述兩個問題的基礎依據。
對于什么是人工智能,從不同角度出發,會有不同的理解。但一般認為,人工智能是研究人類智能活動的規律,構造具有一定智能的人工系統,研究如何讓計算機去完成以往需要人的智力才能勝任的工作,也就是研究如何應用計算機的軟硬件來模擬人類某些智能行為的基本理論、方法和技術。
編者淺見:去繁就簡之后,人工智能從理論的角度,可以歸結為(大量的甚至巨量的)計算以及基于計算的模式判別,或者說是if-then,而后者也可以理解為廣義的計算。聯系人機對弈和人臉識別的通俗例子,我們很容易理解這一點,也再次印證了錢學森先生的論斷。
把各種不同背景的人工智能在理論上歸結為狹義的計算或廣義的計算,但通常是大量的計算之后,計算的效率也就成了關鍵的問題。一個顯而易見的事實是,即便目前芯片的計算能力和數據的存儲能力進步很快,但永遠趕不上人們的主客觀需求!這也襯托出計算效率的重要地位。
計算效率依賴于合理的算法,而合理的算法,自然要基于相關數學知識的組合運用。人工智能往往涉及大量數據,從基礎的表達方式來看,向量和矩陣當仁不讓;如何從數據中通過計算、分析、判別來獲取有價值的信息,概率論、信息論、統計分析這些分支也就自然而然走上前臺。
通常,有意深入了解人工智能的讀者,往往已經具備微積分和線性代數等知識儲備。鑒于此,區別于同類教材,本書不再贅述這些初級知識,而是聚焦人工智能需要的實用數學工具,從而實現對人工智能領域核心數學理論的快速掌握。
全書各章節由董久祥教授和石海彬副教授編寫,部分選取整合了矩陣理論、概率論、信息論、數理統計、多元統計分析的有關傳統內容,作為人工智能的數學基礎知識;既關注知識的典型性,又在知識的基礎和難度之間做了折中。本書參考了涉及以上知識領域的有關著作,在此向其作者一并表示敬意和衷心的感謝!由于編著水平有限,書中難免出現疏漏,敬請廣大讀者批評指正。
出版說明
前言
第1章矩陣理論
11線性空間
111向量的運算
112線性相關
113基
114直和
12內積和投影
121標準正交基
122投影
123格蘭姆-施密特正交化方法
124正交和
13分塊矩陣及其代數運算
131分塊矩陣的運算
132分塊矩陣的逆
133初等變換下的標準形
14特征根與特征向量
141跡
142哈密頓-凱萊定理
143譜分解
144冪等矩陣
15對稱矩陣的特征根與特征向量
151對稱矩陣的譜分解
152對稱矩陣的同時對角化
153對稱矩陣特征根的極值特性
16半正定矩陣
161同時對角化與相對特征根
162相對特征根的極值特性
163ATA與A,AT的關系
164投影矩陣
17矩陣的廣義逆
171A-
172A
173線性方程組的解
174投影
18計算方法
181(i,j)消去變換法
182求對稱矩陣的特征值、特征向量的
雅可比法
19矩陣微商
110矩陣的標準形
1101埃爾米特標準形
1102正交、三角分解
1103左正交分解
1104Cholesky分解
1105奇異值分解
第2章優化的基礎概念
21引言
22優化問題
221優化問題的數學模型
222優化問題舉例
23優化數學基礎
231序列的極限
232梯度、黑塞矩陣和泰勒展開
24凸集和凸函數
241凸集
242凸集分離定律
243凸函數
244凸規劃
第3章線性規劃
31線性規劃問題的數學模型
311線性規劃模型的標準形
312一般線性規劃化為標準形
32線性規劃解的基本概念和性質
321線性規劃解的概念
322線性規劃解的性質
33圖解法
34單純形法
341單純形法原理
342單純形法的算法步驟
35人工變量法
351大M法
352兩階段法
36退化情形
361循環現象
362攝動法
37修正單純形法
第4章線性規劃對偶理論
41對偶問題的提出
42原問題與對偶問題的關系
421對稱形式的對偶問題
422非對稱形式的對偶問題
423一般情形
43對偶問題的基本定理
44對偶單純形法
441基本對偶單純形法
442人工對偶單純形法
45靈敏度分析
451改變系數向量c
452改變右端向量b
453改變約束矩陣A
454增加新約束
第5章優性條件
51無約束問題的優性條件
511無約束問題的必要條件
512無約束問題的充分條件
513無約束問題的充要條件
52約束問題的優性條件
521不等式約束問題的優性條件
522一般約束問題的優性條件
第6章算法
61基本迭代公式
62算法的收斂性問題
621算法的收斂性
622收斂速率
623算法的二次終止性
63算法的終止準則
第7章二次規劃
71二次規劃的概念與性質
72等式約束二次規劃
721拉格朗日乘子法
722直接消元法
73有效集法
731有效集法的基本步驟
732有效集算法
74Lemke方法
第8章概率與信息論
81概述
82隨機變量
83概率分布
831離散型隨機變量和概率
質量函數
832連續型隨機變量和概率
密度函數
84邊緣概率
85條件概率
86條件概率的鏈式法則
87獨立性和條件獨立性
88期望、方差和協方差
89常用概率分布
891伯努力分布
892多項式分布
893高斯分布
894指數分布和拉普拉斯分布
895Dirac分布和經驗分布
896分布的混合
810幾個關鍵函數
811貝葉斯規則
812連續型隨機變量的技術細節
813信息論
814結構化概率模型
第9章多元正態分布
91多元分布的基本概念
911隨機向量
912分布函數與密度函數
913多元變量的獨立性
914隨機向量的數字特征
92統計距離
93多元正態分布的定義和性質
931多元正態分布的定義
932多元正態分布的性質
933條件分布和獨立性
94均值向量和協方差矩陣的估計
95常用分布及抽樣分布
9512分布與威沙特分布
952t分布與T2分布
953中心F分布與Wilks分布
第10章均值向量與協方差矩陣
的檢驗
101均值向量的檢驗
1011一個指標檢驗的回顧
1012多元均值檢驗
1013兩總體均值的比較
1014多總體均值的檢驗
102協方差矩陣的檢驗
1021檢驗=0
1022檢驗1=2=..=r
第11章聚類分析
111聚類分析的基本思想
1111概述
1112聚類的目的
112相似性度量
113類和類的特征
114系統聚類法
1141短距離法和長距離法
1142重心法和類平均法
1143離差平方和法(或稱Ward
方法)
1144分類數的確定
1145系統聚類法的統一
115模糊聚類分析
1151模糊聚類的幾個基本概念
1152模糊分類關系
1153模糊聚類分析計算步驟
第12章判別分析
121判別分析的基本思想
122距離判別
1221兩總體情況
1222多總體情況
123貝葉斯判別
124費希爾判別
第13章主成分分析
131主成分分析的基本原理
1311主成分分析的基本思想
1312主成分分析的基本理論
1313主成分分析的幾何意義
132總體主成分及其性質
1321從協方差矩陣出發求解
主成分
1322主成分的性質
1323從相關矩陣出發求解主成分
1324由相關矩陣求主成分時主成
分性質的簡單形式
133樣本主成分的導出
134有關問題的討論
1341關于由協方差矩陣或相關矩陣
出發求解主成分
1342主成分分析不要求數據來
自正態總體
1343主成分分析與重疊信息
135主成分分析步驟及框圖
1351主成分分析步驟
1352主成分分析的邏輯框圖
第14章因子分析
141因子分析的基本理論
1411因子分析的基本思想
1412因子分析的基本理論及模型
142因子載荷的求解
1421主成分法
1422主軸因子法
1423極大似然法
1424因子旋轉
1425因子得分
1426主成分分析與因子分析的
區別
143因子分析的步驟與邏輯框圖
1431因子分析的步驟
1432因子分析的邏輯框圖
第15章對應分析
151列聯表及列聯表分析
152對應分析的基本理論
1521有關概念
1522R型因子分析與Q型因子分析的
對等關系
1523對應分析應用于定量變量的
情況
1524需要注意的問題
153對應分析的步驟及邏輯框圖
1531對應分析的步驟
1532對應分析的邏輯框圖
第16章典型相關分析
161典型相關分析的基本理論
1611典型相關分析的統計思想
1612典型相關分析的基本理論
及方法
162典型相關分析的步驟及
邏輯框圖
參考文獻