本書對數據挖掘的基本算法進行了系統介紹,每種算法不僅介紹了算法的基本原理,而且配有大量例題以及源代碼,并對源代碼進行了分析,這種理論和實踐相結合的方式有助于讀者較好地理解和掌握抽象的數據挖掘算法。
全書共分11章,內容同時涵蓋了數據預處理、關聯規則挖掘算法、分類算法和聚類算法,具體章節包括緒論、數據預處理、關聯規則挖掘、決策樹分類算法、貝葉斯分類算法、人工神經網絡算法、支持向量機、Kmeans聚類算法、K中心點聚類算法、神經網絡聚類算法以及數據挖掘的發展等內容。
本書可作為高等院校數據挖掘課程的教材,也可以作為從事數據挖掘工作以及其他相關工程技術工作人員的參考書。本書封面貼有清華大學出版社防偽標簽,無標簽者不得銷售。
數據挖掘涉及數據庫技術、人工智能、統計學、機器學習等多學科領域,并且已經在各行各業有了非常廣泛的應用。為適應我國數據挖掘的教學工作,作者在數據挖掘教學實踐的基礎上,參閱了多種國內外最新版本的教材,編寫了本書。本書可以作為高等院校研究生的教材,也可以為相關行業的工程技術人員提供有益的參考。
本書在第1版的基礎上對其中欠妥之處進行了修改,內容安排和第1版一致,循序漸進地對數據挖掘原理進行了通俗易懂的講解。本書最大的特點是理論與實踐相結合,全書幾乎所有的算法都配有實例和源程序,這種理論與實際相結合的方法克服了重理論輕實踐的內容組織方式,便于讀者理解和掌握其中知識。具體而言,本書11章內容之間的關系如下圖所示。
本書配有教學課件,讀者可登錄網站自行下載。由于編者水平有限,本書難免存在不少缺點和不足之處,懇請專家和讀者批評指正。
編者
2016年9月