《數據挖掘方法與應用》對數據挖掘中常用的建模算法進行系統介紹,內容涵蓋了數據預處理、關聯規則挖掘、聚類分析、決策樹及組合算法、貝葉斯分類、支持向量機、人工神經網絡等。在闡述每種算法基本理論的基礎上,同時給出基于R軟件的應用方法。這種理論與應用相結合的方式為讀者理解和運用這些方法提供了堅實的基礎,有助于讀者由淺入深、循序漸進地理解相關內容并用以解決實際問題。
目錄
第1章 數據挖掘導論 1
1.1 數據挖掘的概念 1
1.2 數據挖掘的產生背景及意義 2
1.3 數據挖掘的功能及步驟 3
1.4 數據挖掘的常用方法 5
1.5 小結 7
思考題與練習題 7
第2章 數據預處理 8
2.1 數據預處理簡介 8
2.2 數據清洗 9
2.3 數據集成 11
2.4 數據變換 11
2.5 數據規約 14
2.6 基于R語言的數據預處理 17
2.7 小結 28
思考題與練習題 29
第3章 關聯規則挖掘 30
3.1 關聯規則的基本概念 30
3.2 簡單關聯規則挖掘 32
3.3 序列關聯規則挖掘 36
3.4 基于R語言的關聯規則挖掘 40
3.5 小結 47
思考題與練習題 48
第4章 聚類分析 49
4.1 聚類分析的簡介 49
4.2 距離與相似度的度量 49
4.3 K均值聚類 53
4.4 密度聚類 56
4.5 層次聚類 58
4.6 基于R語言的聚類分析 60
4.7 小結 66
思考題與練習題 67
第5章 決策樹及組合算法 68
5.1 決策樹簡介 68
5.2 決策樹的生長 70
5.3 決策樹的剪枝 76
5.4 基于決策樹的組合算法 78
5.5 基于R語言的決策樹建模 81
5.6 小結 89
思考題與練習題 90
第6章 貝葉斯分類 91
6.1 貝葉斯定理 91
6.2 樸素貝葉斯 93
6.3 貝葉斯信念網絡 96
6.4 貝葉斯信念網絡特點及應用 100
6.5 基于R語言的貝葉斯分類建模 100
6.6 小結 105
思考題與練習題 105
第7章 支持向量機 107
7.1 支持向量機簡介 107
7.2 線性支持向量機 110
7.3 非線性支持向量機 116
7.4 基于R語言的支持向量機建模 121
7.5 小結 134
思考題與練習題 134
第8章 人工神經網絡 135
8.1 人工神經網絡概述 135
8.2 感知機模型 138
8.3 BP算法原理 140
8.4 BP神經網絡的R語言實現 145
8.5 小結 151
思考題與練習題 151