本書是商業數據流挖掘方面的一本學術專著,包括商業數據流數據管理模型、概念漂移模型、商業數據流關聯規則、分類、聚類方法,以及在銀行、網購等領域的應用等內容,從模型、方法及應用三個角度對面向商業數據流挖掘進行了系統論述。本書適合作為與數據挖掘和商業數據分析有關的學科如計算機技術、軟件工程、電子商務等的本科和研究生的教材,也可供相關領域的專業人員參考。
琚春華 浙江工商大學信息學院院長,教授/博士/博士生導師。琚春華(Ju ChunHua),男,1962年7月生,浙江常山縣人,中共黨員,浙江工商大學科技處處長,教授、博士,浙江工商大學工商管理學院博士生導師。浙江省“151人才工程”**層次人選,國務院特殊津貼獲得者,中國科學技術情報學會第七屆理事會理事、常務理事,全國新世紀優秀人才支持計劃學術帶頭人,浙江省重點學科(管理科學與工程)帶頭人,浙江省電子商務與物流優化創新團隊負責人,高等學校博士學科點專項科研基金獲得者,第十一屆“挑戰杯”全國大學生學術科技作品競賽優秀指導教師。
目錄
第1章緒論
1.1背景概述
1.1.1數據挖掘
1.1.2數據流挖掘
1.2商業數據流挖掘主要研究概況
1.2.1國外研究現狀
1.2.2國內研究現狀
1.3商業數據流挖掘的基本概念
1.3.1商業數據流的基本定義
1.3.2商業數據流挖掘的基本流程
1.3.3商業數據流挖掘的主要模型和方法
1.4商業數據流挖掘的典型應用
1.4.1分布式零售數據流挖掘應用
1.4.2網購數據流挖掘應用
1.5本書的主要內容和結構
參考文獻第2章商業數據流管理模型
2.1商業數據流特點
2.2商業數據流管理模型
2.2.1商業數據流描述模型
2.2.2商業數據流分層管理模型
2.3商業數據流預處理模型
2.3.1商業數據流降維模型
2.3.2商業數據流噪聲處理模型
2.4本章小結
參考文獻第3章商業數據流概念漂移模型
3.1商業數據流概念漂移描述模型
3.1.1商業數據流中的概念漂移概述
3.1.2基于粒計算的商業數據流概念模型
3.2商業數據流概念漂移特征提取模型
3.2.1商業數據流概念漂移特征發現模型
3.2.2商業數據流概念漂移特征抽取模型
3.3商業數據流概念漂移檢測模型
3.3.1基于概念格的數據流漂移檢測模型
3.3.2基于HSMM的用戶興趣漂移檢測模型
3.3.3融入簇強度的數據流漂移檢測模型
3.4本章小結
參考文獻第4章面向商業數據流的關聯規則方法
4.1Web數據流最大頻繁項集挖掘算法
4.1.1A?MFI算法相關定義
4.1.2算法描述
4.1.3算法小結
4.2基于時序輪盤模型的數據流頻繁模式挖掘算法
4.2.1時序輪盤TTLC算法
4.2.2MFS?HT算法
4.2.3實驗結果及分析
4.2.4算法小結
4.3分布式關聯規則同步算法和異步算法
4.3.1網狀分布式環境下同步算法NDMA
4.3.2星形分布式環境下異步算法SDMA
4.3.3算法小結
4.4分布式無冗余數據流關聯規則異步算法
4.4.1相關概念和定理
4.4.2算法描述與分析
4.4.3實驗結果及分析
4.4.4算法小結
4.5本章小結
參考文獻第5章面向商業數據流的分類方法
5.1基于模糊積分融合的數據流分類挖掘算法
5.1.1模糊測度與模糊積分理論
5.1.2基于Choquet模糊積分融合的多模糊ID3數據流分類算法
5.1.3算法描述及分析
5.1.4算法小結
5.2基于增量存儲樹的集成貝葉斯分類數據流挖掘算法
5.2.1集成貝葉斯分類器構建
5.2.2構建CMCD?ST算法模型
5.2.3實驗結果及分析
5.2.4算法小結
5.3基于相關度的數據流關聯分類算法
5.3.1基于相關度關聯分類算法的設計思想
5.3.2基于相關度的關聯分類算法
5.3.3實驗結果及分析
5.3.4算法小結
5.4基于情景特征的數據流前饋動態集成分類算法
5.4.1問題描述
5.4.2基于情景特征的前饋動態集成分類思想
5.4.3實驗結果及分析
5.4.4算法小結
5.5基于信息熵差異性度量的數據流增量集成分類算法
5.5.1問題描述
5.5.2基于信息熵差異性度量的增量集成分類算法
5.5.3算法小結
5.6基于MAPREDUCE技術的數據流并行集成分類算法
5.6.1問題描述
5.6.2相關理論研究
5.6.3基于云計算的并行集成分類器
5.6.4實驗結果及分析
5.6.5算法小結
5.7本章小結
參考文獻第6章面向商業數據流的聚類方法
6.1基于密度的數據流聚類算法
6.1.1問題描述
6.1.2數據流管理模型及算法架構
6.1.3主成分和密度融合的數據流聚類模型
6.1.4PDStream算法設計
6.1.5實驗結果及分析
6.1.6算法小結
6.2基于小波網絡的多維時間序列耦合特征聚類算法
6.2.1相關工作
6.2.2基于小波網絡的數據壓縮
6.2.3多維時間序列耦合特征提取
6.2.4聚類算法描述
6.2.5實驗結果及分析
6.2.6算法小結
6.3并行Web數據流聚類算法
6.3.1研究進展及相關模型
6.3.2JPStream算法描述
6.3.3實驗結果及分析
6.3.4算法小結
6.4融入簇存在強度的數據流聚類方法
6.4.1融入不確定性的Web用戶分析模型
6.4.2簇存在強度
6.4.3融入簇存在強度的數據流聚類算法
6.4.4實驗結果及分析
6.4.5算法小結
6.5本章小結
參考文獻第7章商業數據流挖掘應用――分布式零售數據
7.1實驗數據來源與實驗環境
7.1.1實驗數據來源
7.1.2挖掘實驗環境
7.2基于多支持向量機的分布式客戶流失預測應用
7.2.1單站點客戶流失預測分析
7.2.2多站點客戶流失預測分析
7.2.3結果分析
7.3基于分布式關聯分類的連鎖零售業客戶細分應用
7.3.1數據準備
7.3.2模型的訓練與測試
7.3.3結果分析
7.4本章小結
參考文獻第8章商業數據流挖掘應用――網購數據
8.1實驗數據來源與實驗環境
8.1.1實驗數據來源
8.1.2挖掘實驗環境
8.2基于行為特征分析的用戶聚類算法的應用分析
8.2.1聚類步驟
8.2.2聚類評估方法
8.2.3用戶聚類結果與分析
8.3概念漂移約束驅動的關聯規則挖掘算法的應用分析
8.3.1概念漂移約束驅動的關聯規則挖掘
8.3.2情境強度約束的模式挖掘與推薦
8.3.3基于推薦系統的算法評測與分析
8.4用戶興趣挖掘模型的應用分析
8.4.1用戶情境本體模型構建
8.4.2用戶興趣特征提取實驗分析
8.4.3用戶興趣漂移檢測實驗
8.5本章小結
參考文獻第9章總結與展望
9.1本書總結
9.2未來展望