隨著網絡信息資源的爆炸式增長,個性化推薦技術作為有效緩解信息過載的個性化推薦技術得到了廣泛應用,然而推薦系統開放性的特點使其易受托攻擊的影響。托攻擊者通過注入虛假信息操縱推薦結果,影響推薦系統的公正性。托攻擊研究中較少考慮攻擊時間方面的特性,針對此問題,本書完成了三方面工作:一是提出推薦系統中融合時間維度的托攻擊形式,并分析融合時間和評分兩個維度的托攻擊模型對推薦系統的影響;二是從項目評分序列的角度,提出基于項目類型及時間序列動態劃分的異常項目檢測方法和基于狄利克雷假設檢驗的異常項目檢測方法;三是結合項目評分時間序列進行異常用戶檢測,提出結合異常項目的檢測方法、基于單類分類器的檢測方法和半監督的檢測方法,以應對不同的推薦系統的應用場景。
目 錄
前言
第1章 緒論 1
1.1 推薦系統概述 1
1.2 推薦系統的托攻擊問題 3
1.3 托攻擊檢測的國內外研究現狀 3
1.4 本章小結 5
第2章 推薦算法與托攻擊檢測關鍵技術 6
2.1 推薦算法 6
2.2 托攻擊模型 10
2.3 托攻擊檢測算法 13
2.4 托攻擊的危害性分析及實例 14
2.5 數據集介紹 16
2.6 本章小結 17
第3章 融合時間維度的托攻擊模型及影響研究 19
3.1 融合時間維度的托攻擊模型 19
3.1.1 等時間注入托攻擊模型 20
3.1.2 隨機時間注入托攻擊模型 21
3.2 融合時間維度的托攻擊對平均預測偏移的影響 22
3.2.1 等時間注入托攻擊的實驗結果 22
3.2.2 隨機時間注入托攻擊的實驗結果 35
3.3 融合時間維度的托攻擊對時間區間評分分布相似性的影響 37
3.3.1 時間序列劃分方法 37
3.3.2 時間區間相似度度量方法 43
3.3.3 實驗結果及分析 43
3.4 本章小結 53
第4章 基于項目類型及時間序列的異常項目檢測 54
4.1 融合項目類型劃分的時間序列異常項目檢測 54
4.1.1 推薦系統中項目類型的界定 54
4.1.2 推薦系統中項目類型的劃分算法 56
4.1.3 實驗結果及分析 57
4.2 基于時間序列動態劃分的異常項目檢測 61
4.2.1 基于時間序列動態劃分的異常項目檢測方法 61
4.2.2 實驗結果及分析 63
4.3 本章小結 68
第5章 基于評分序列分布的項目異常檢測69
5.1 基礎知識 69
5.2 問題描述 72
5.3 算法描述 73
5.3.1 觀測值生成 73
5.3.2 參數估計 73
5.3.3 假設檢驗 74
5.4 實驗分析 75
5.4.1 實驗設置 76
5.4.2 實驗對比分析 76
5.4.3 參數分析 77
5.5 本章小結 78
第6章 融合時間特征和項目類別的虛假用戶檢測 79
6.1 基于平均評分偏移的檢測方法分析 79
6.2 融合時間維度的虛假用戶檢測方法R-RTS 80
6.2.1 融合時間維度的虛假用戶檢測實例 82
6.2.2 實驗結果和分析 84
6.3 本章小結 90
第7章 融合時間特征與單類分類器的虛假用戶檢測 91
7.1 推薦系統中面向時間的用戶行為特征分析 91
7.2 基于單類分類器的托攻擊檢測方法 92
7.2.1 基于密度的單類分類器 93
7.2.2 基于聚類的單類分類器 94
7.2.3 基于SVM的單類分類器 96
7.3 實驗結果及分析 98
7.3.1 實驗結果 98
7.3.2 實驗分析 99
7.4 本章小結 100
第8章 基于半監督學習的虛假用戶檢測 101
8.1 引言 101
8.2 混合檢測 101
8.3 半監督學習攻擊檢測 102
8.4 實驗分析 105
8.4.1 實驗設置 105
8.4.2 實驗對比分析 106
8.5 本章小結 109
參考文獻 110