科技的進(jìn)步,特別是信息產(chǎn)業(yè)的發(fā)展,把整個(gè)社會(huì)帶入一個(gè)嶄新的信息時(shí)代。隨著計(jì)算機(jī)應(yīng)用的普及和數(shù)據(jù)庫(kù)技術(shù)的不斷發(fā)展,數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)的應(yīng)用領(lǐng)域越來(lái)越廣泛。
《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘》第1章介紹數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘的一般知識(shí)和應(yīng)用領(lǐng)域。第2~8章介紹數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘的理論和技術(shù),其中第2、3章側(cè)重?cái)?shù)據(jù)倉(cāng)庫(kù),重點(diǎn)闡述了數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)、olap等內(nèi)容,第4~8章側(cè)重?cái)?shù)據(jù)挖掘,重點(diǎn)闡述了關(guān)聯(lián)規(guī)則、粗糙集、決策樹(shù)、聚類分析和興趣度量等內(nèi)容。第9章給出了數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘方面的應(yīng)用案例。
《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘》是為軟件工程碩士量身定做的教材,也可作為計(jì)算機(jī)專業(yè)、信息類專業(yè)、管理類專業(yè)相關(guān)課程的教材和教學(xué)參考書(shū)。
教學(xué)建議
第1章緒論
1.1引言
1.2數(shù)據(jù)倉(cāng)庫(kù)
1.2.1從數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)
1.2.2數(shù)據(jù)倉(cāng)庫(kù)的基本概念
1.2.3數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)
1.3數(shù)據(jù)挖掘
1.3.1 kdd與數(shù)據(jù)挖掘
1.3.2數(shù)據(jù)庫(kù)與數(shù)據(jù)挖掘發(fā)展歷程
1.3.3數(shù)據(jù)挖掘的特征與對(duì)象
1.3.4數(shù)據(jù)挖掘相關(guān)領(lǐng)域
1.4數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的關(guān)系
《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘》
前言
教學(xué)建議
第1章緒論
1.1引言
1.2數(shù)據(jù)倉(cāng)庫(kù)
1.2.1從數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)
1.2.2數(shù)據(jù)倉(cāng)庫(kù)的基本概念
1.2.3數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)
1.3數(shù)據(jù)挖掘
1.3.1 kdd與數(shù)據(jù)挖掘
1.3.2數(shù)據(jù)庫(kù)與數(shù)據(jù)挖掘發(fā)展歷程
1.3.3數(shù)據(jù)挖掘的特征與對(duì)象
1.3.4數(shù)據(jù)挖掘相關(guān)領(lǐng)域
1.4數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的關(guān)系
1.5應(yīng)用前景與發(fā)展趨勢(shì)
本章小結(jié)
習(xí)題
第2章聯(lián)機(jī)分析處理
2.1引言
2.2 olap的定義
2.3 olap的相關(guān)概念
2.4 olap與oltp的關(guān)系和比較
2.5 olap準(zhǔn)則
2.6多維數(shù)據(jù)分析方法
2.7關(guān)系數(shù)據(jù)的組織
2.8多維數(shù)據(jù)的存儲(chǔ)方式
2.9 olap體系結(jié)構(gòu)
2.10 olap的展現(xiàn)方式
2.11 olap工具的評(píng)價(jià)指標(biāo)
2.12 olap的局限性
本章小結(jié)
習(xí)題
第3章數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)與開(kāi)發(fā)
3.1引言
3.2數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型概述
3.3數(shù)據(jù)倉(cāng)庫(kù)的分析與設(shè)計(jì)
3.3.1需求分析
3.3.2概念模型設(shè)計(jì)
3.3.3邏輯模型設(shè)計(jì)
3.3.4物理模型設(shè)計(jì)
3.3.5數(shù)據(jù)倉(cāng)庫(kù)的索引技術(shù)
3.4數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)
3.4.1風(fēng)險(xiǎn)因素
3.4.2數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的生命周期
3.4.3建立數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的思維模式
3.4.4數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)的設(shè)計(jì)步驟
3.4.5數(shù)據(jù)質(zhì)量與數(shù)據(jù)清洗
3.4.6數(shù)據(jù)粒度與維度建模
3.4.7選擇數(shù)據(jù)倉(cāng)庫(kù)工具
3.4.8提高數(shù)據(jù)倉(cāng)庫(kù)性能
3.4.9數(shù)據(jù)倉(cāng)庫(kù)的安全性
3.5主要的數(shù)據(jù)倉(cāng)庫(kù)產(chǎn)品
本章小結(jié)
習(xí)題
第4章關(guān)聯(lián)規(guī)則
4.1引言
4.2關(guān)聯(lián)規(guī)則模型
4.3 apriori算法
4.3.1發(fā)現(xiàn)頻繁項(xiàng)集
4.3.2生成關(guān)聯(lián)規(guī)則
4.4頻繁模式增長(zhǎng)算法
4.4.1建樹(shù)方法
4.4.2用fp樹(shù)挖掘頻繁模式
4.5關(guān)聯(lián)規(guī)則模型擴(kuò)展
4.5.1多級(jí)關(guān)聯(lián)規(guī)則
4.5.2多維關(guān)聯(lián)規(guī)則
本章小結(jié)
習(xí)題
第5章粗糙集
5.1引言
5.2近似空間
5.2.1近似空間與不可分辨關(guān)系
5.2.2知識(shí)與知識(shí)庫(kù)
5.3近似與粗糙集
5.3.1基本概念
5.3.2基本性質(zhì)
5.4描述粗糙集的特征的方法
5.4.1近似精度
5.4.2拓?fù)涮卣?br />5.5信息系統(tǒng)
5.5.1信息系統(tǒng)的定義
5.5.2約簡(jiǎn)和核
5.5.3分辨矩陣與分辨函數(shù)
5.5.4信息系統(tǒng)約簡(jiǎn)
5.6決策表
5.6.1相對(duì)約簡(jiǎn)與知識(shí)依賴性
5.6.2決策表及其約簡(jiǎn)
5.6.3近似約簡(jiǎn)算法
5.6.4決策規(guī)則
本章小結(jié)
習(xí)題
第6章決策樹(shù)
6.1引言
6.2構(gòu)建決策樹(shù)的理論問(wèn)題
6.2.1為當(dāng)前結(jié)點(diǎn)選擇屬性
6.2.2過(guò)擬合問(wèn)題
6.3 id3算法
6.3.1生成決策樹(shù)的算法
6.3.2生成規(guī)則和決策
6.4決策樹(shù)的剪枝
6.4.1預(yù)剪枝
6.4.2后剪枝
6.5 c4.5算法
本章小結(jié)
習(xí)題6
第7章聚類分析
7.1引言
7.2聚類分析簡(jiǎn)介
7.2.1聚類分析
7.2.2聚類分析應(yīng)用領(lǐng)域與算法特征
7.3數(shù)據(jù)類型、距離和相似系數(shù)
7.3.1數(shù)據(jù)類型
7.3.2距離和相似系數(shù)
7.4聚類方法與聚類分類
7.4.1聚類方法
7.4.2聚類方法的分類
7.5劃分方法
7.5.1 k-均值算法
7.5.2 k-中心點(diǎn)算法
7.5.3關(guān)于參數(shù)k
7.5.4 em聚類
7.6層次方法
7.6.1層次聚類中的距離度量
7.6.2分裂方法
7.6.3凝聚方法
7.7基于密度的方法
7.7.1 dbscan算法
7.7.2矢量感應(yīng)聚類算法
7.8聚類評(píng)估
7.8.1假設(shè)檢驗(yàn)
7.8.2聚類評(píng)估中的假設(shè)檢驗(yàn)
7.8.3相對(duì)準(zhǔn)則
本章小結(jié)
習(xí)題7
第8章興趣度量
8.1引言
8.2用于關(guān)聯(lián)規(guī)則和分類規(guī)則的度量
8.2.1客觀度量
8.2.2主觀度量
8.2.3語(yǔ)義度量
8.3用于總結(jié)的度量
8.4分類器的興趣度
本章小結(jié)
習(xí)題8
第9章應(yīng)用案例
9.1數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用案例
9.1.1案例一:網(wǎng)絡(luò)購(gòu)物數(shù)據(jù)倉(cāng)庫(kù)
9.1.2案例二:社會(huì)保障卡數(shù)據(jù)倉(cāng)庫(kù)
9.1.3案例三:醫(yī)院信息系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)
9.2數(shù)據(jù)挖掘應(yīng)用案例
9.2.1案例一:零售商系統(tǒng)貨籃數(shù)據(jù)挖掘
9.2.2案例二:通信用戶滿意度指數(shù)評(píng)測(cè)
9.2.3案例三:城市環(huán)境質(zhì)量評(píng)價(jià)
本章小結(jié)
參考文獻(xiàn)
《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘》
前言
教學(xué)建議
第1章緒論
1.1引言
1.2數(shù)據(jù)倉(cāng)庫(kù)
1.2.1從數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)
1.2.2數(shù)據(jù)倉(cāng)庫(kù)的基本概念
1.2.3數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)
1.3數(shù)據(jù)挖掘
1.3.1 kdd與數(shù)據(jù)挖掘
1.3.2數(shù)據(jù)庫(kù)與數(shù)據(jù)挖掘發(fā)展歷程
1.3.3數(shù)據(jù)挖掘的特征與對(duì)象
1.3.4數(shù)據(jù)挖掘相關(guān)領(lǐng)域
1.4數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的關(guān)系
《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘》
前言
教學(xué)建議
第1章緒論
1.1引言
1.2數(shù)據(jù)倉(cāng)庫(kù)
1.2.1從數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)
1.2.2數(shù)據(jù)倉(cāng)庫(kù)的基本概念
1.2.3數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)
1.3數(shù)據(jù)挖掘
1.3.1 kdd與數(shù)據(jù)挖掘
1.3.2數(shù)據(jù)庫(kù)與數(shù)據(jù)挖掘發(fā)展歷程
1.3.3數(shù)據(jù)挖掘的特征與對(duì)象
1.3.4數(shù)據(jù)挖掘相關(guān)領(lǐng)域
1.4數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的關(guān)系
1.5應(yīng)用前景與發(fā)展趨勢(shì)
本章小結(jié)
習(xí)題
第2章聯(lián)機(jī)分析處理
2.1引言
2.2 olap的定義
2.3 olap的相關(guān)概念
2.4 olap與oltp的關(guān)系和比較
2.5 olap準(zhǔn)則
2.6多維數(shù)據(jù)分析方法
2.7關(guān)系數(shù)據(jù)的組織
2.8多維數(shù)據(jù)的存儲(chǔ)方式
2.9 olap體系結(jié)構(gòu)
2.10 olap的展現(xiàn)方式
2.11 olap工具的評(píng)價(jià)指標(biāo)
2.12 olap的局限性
本章小結(jié)
習(xí)題
第3章數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)與開(kāi)發(fā)
3.1引言
3.2數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型概述
3.3數(shù)據(jù)倉(cāng)庫(kù)的分析與設(shè)計(jì)
3.3.1需求分析
3.3.2概念模型設(shè)計(jì)
3.3.3邏輯模型設(shè)計(jì)
3.3.4物理模型設(shè)計(jì)
3.3.5數(shù)據(jù)倉(cāng)庫(kù)的索引技術(shù)
3.4數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)
3.4.1風(fēng)險(xiǎn)因素
3.4.2數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的生命周期
3.4.3建立數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的思維模式
3.4.4數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)的設(shè)計(jì)步驟
3.4.5數(shù)據(jù)質(zhì)量與數(shù)據(jù)清洗
3.4.6數(shù)據(jù)粒度與維度建模
3.4.7選擇數(shù)據(jù)倉(cāng)庫(kù)工具
3.4.8提高數(shù)據(jù)倉(cāng)庫(kù)性能
3.4.9數(shù)據(jù)倉(cāng)庫(kù)的安全性
3.5主要的數(shù)據(jù)倉(cāng)庫(kù)產(chǎn)品
本章小結(jié)
習(xí)題
第4章關(guān)聯(lián)規(guī)則
4.1引言
4.2關(guān)聯(lián)規(guī)則模型
4.3 apriori算法
4.3.1發(fā)現(xiàn)頻繁項(xiàng)集
4.3.2生成關(guān)聯(lián)規(guī)則
4.4頻繁模式增長(zhǎng)算法
4.4.1建樹(shù)方法
4.4.2用fp樹(shù)挖掘頻繁模式
4.5關(guān)聯(lián)規(guī)則模型擴(kuò)展
4.5.1多級(jí)關(guān)聯(lián)規(guī)則
4.5.2多維關(guān)聯(lián)規(guī)則
本章小結(jié)
習(xí)題
第5章粗糙集
5.1引言
5.2近似空間
5.2.1近似空間與不可分辨關(guān)系
5.2.2知識(shí)與知識(shí)庫(kù)
5.3近似與粗糙集
5.3.1基本概念
5.3.2基本性質(zhì)
5.4描述粗糙集的特征的方法
5.4.1近似精度
5.4.2拓?fù)涮卣?br />5.5信息系統(tǒng)
5.5.1信息系統(tǒng)的定義
5.5.2約簡(jiǎn)和核
5.5.3分辨矩陣與分辨函數(shù)
5.5.4信息系統(tǒng)約簡(jiǎn)
5.6決策表
5.6.1相對(duì)約簡(jiǎn)與知識(shí)依賴性
5.6.2決策表及其約簡(jiǎn)
5.6.3近似約簡(jiǎn)算法
5.6.4決策規(guī)則
本章小結(jié)
習(xí)題
第6章決策樹(shù)
6.1引言
6.2構(gòu)建決策樹(shù)的理論問(wèn)題
6.2.1為當(dāng)前結(jié)點(diǎn)選擇屬性
6.2.2過(guò)擬合問(wèn)題
6.3 id3算法
6.3.1生成決策樹(shù)的算法
6.3.2生成規(guī)則和決策
6.4決策樹(shù)的剪枝
6.4.1預(yù)剪枝
6.4.2后剪枝
6.5 c4.5算法
本章小結(jié)
習(xí)題6
第7章聚類分析
7.1引言
7.2聚類分析簡(jiǎn)介
7.2.1聚類分析
7.2.2聚類分析應(yīng)用領(lǐng)域與算法特征
7.3數(shù)據(jù)類型、距離和相似系數(shù)
7.3.1數(shù)據(jù)類型
7.3.2距離和相似系數(shù)
7.4聚類方法與聚類分類
7.4.1聚類方法
7.4.2聚類方法的分類
7.5劃分方法
7.5.1 k-均值算法
7.5.2 k-中心點(diǎn)算法
7.5.3關(guān)于參數(shù)k
7.5.4 em聚類
7.6層次方法
7.6.1層次聚類中的距離度量
7.6.2分裂方法
7.6.3凝聚方法
7.7基于密度的方法
7.7.1 dbscan算法
7.7.2矢量感應(yīng)聚類算法
7.8聚類評(píng)估
7.8.1假設(shè)檢驗(yàn)
7.8.2聚類評(píng)估中的假設(shè)檢驗(yàn)
7.8.3相對(duì)準(zhǔn)則
本章小結(jié)
習(xí)題7
第8章興趣度量
8.1引言
8.2用于關(guān)聯(lián)規(guī)則和分類規(guī)則的度量
8.2.1客觀度量
8.2.2主觀度量
8.2.3語(yǔ)義度量
8.3用于總結(jié)的度量
8.4分類器的興趣度
本章小結(jié)
習(xí)題8
第9章應(yīng)用案例
9.1數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用案例
9.1.1案例一:網(wǎng)絡(luò)購(gòu)物數(shù)據(jù)倉(cāng)庫(kù)
9.1.2案例二:社會(huì)保障卡數(shù)據(jù)倉(cāng)庫(kù)
9.1.3案例三:醫(yī)院信息系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)
9.2數(shù)據(jù)挖掘應(yīng)用案例
9.2.1案例一:零售商系統(tǒng)貨籃數(shù)據(jù)挖掘
9.2.2案例二:通信用戶滿意度指數(shù)評(píng)測(cè)
9.2.3案例三:城市環(huán)境質(zhì)量評(píng)價(jià)
本章小結(jié)
參考文獻(xiàn)