網絡流量識別是網絡監控的關鍵環節,在網絡管理中起著至關重要的作用,機器學習作為一種技術手段已經應用到網絡流量識別過程中,并成為該領域的研究熱點。基于機器學習的網絡流量識別算法通過對流量行為測度的分析與度量來構建滿足不同應用場景的流量識別需求模型。《基于機器學習的網絡流量識別算法及其應用》共9章,首先分析機器學習在流量識別中的意義和應用;其次對行為特征進行分析;再次系統分析非對稱路由對流量識別算法的影響;最后對深度學習算法及模型進行分析研究。
目錄
“智能科學技術著作叢書”序
前言
第1章 緒論 1
1.1 研究背景、目的與意義 1
1.2 基于機器學習的流量識別算法研究現狀 2
1.2.1 屬性選擇算法研究 3
1.2.2 基于機器學習的流量識別算法研究 4
1.3 基于機器學習的流量識別算法存在的問題 6
1.4 本書主要內容 7
參考文獻 8
第2章 多選屬性選擇算法 14
2.1 引言 14
2.2 常用機器學習算法和屬性選擇算法概述 15
2.3 基于流記錄的流量識別模型 16
2.4 多選屬性選擇算法分析與描述 18
2.4.1 多測度間相關關系分析 20
2.4.2 FCBF算法描述 22
2.4.3 MSAS算法描述 22
2.4.4 機器學習分類算法評估 25
2.5 實驗 26
2.5.1 IPTrace數據 26
2.5.2 Moore_set數據 27
2.5.3 實驗結果與分析 28
2.6 本章小結 35
參考文獻 35
第3章 非對稱路由對流量識別算法的影響 38
3.1 引言 38
3.2 網絡流量識別算法相關問題 39
3.3 非對稱路由 39
3.4 自適應算法 42
3.5 實驗 44
3.5.1 數據集 44
3.5.2 非對稱路由對流量識別的影響 46
3.5.3 Noc_set數據集的流量識別結果比較 48
3.5.4 Caida_set數據集的流量識別結果比較 49
3.5.5 Lbnl_set數據集的流量識別結果比較 49
3.5.6 ε 對流量識別結果的影響 50
3.6 本章小結 51
參考文獻 51
第4章 基于SVM改進的流量識別算法 54
4.1 引言 54
4.2 已有流量識別算法 55
4.3 支持向量機 56
4.4 改進的SVM算法 58
4.4.1 NSVM 58
4.4.2 實驗結果與分析 62
4.5 基于主動學習的多分類SVM算法 69
4.5.1 CSVM 73
4.5.2 性能評估 75
4.5.3 實驗結果與分析 75
4.6 本章小結 84
參考文獻 84
第5章 基于多概率神經網絡的流量識別算法 86
5.1 引言 86
5.2 概率神經網絡 88
5.2.1 概率神經網絡簡介 88
5.2.2 最小風險貝葉斯算法 89
5.2.3 PNN函數 91
5.2.4 基于概率神經網絡的算法 91
5.3 MPNN應用協議識別算法 92
5.4 實驗 95
5.4.1 實驗環境及備選測度 95
5.4.2 MPNN算法評價分析 97
5.4.3 訓練集合大小對MPNN算法穩定性的影響 99
5.4.4 MPNN算法時空復雜度分析 102
5.5 本章小結 105
參考文獻 105
第6章 加密SKYPE流量在線識別算法 108
6.1 引言 108
6.2 傳統的機器學習加密流量識別算法 109
6.3 樸素貝葉斯算法 110
6.4 貝葉斯更新網絡模型 111
6.4.1 貝葉斯更新 111
6.4.2 算法流程 112
6.4.3 流抽樣對網絡流量行為特征的影響分析 114
6.5 實驗 117
6.5.1 實驗性能衡量 117
6.5.2 實驗數據集 118
6.5.3 報文抽樣對SKYPE網絡流量識別的影響 119
6.6 本章小結 126
參考文獻 126
第7章 基于聚類的流量分類識別算法 129
7.1 引言 129
7.2 聚類理論基礎 130
7.2.1 常見聚類算法 130
7.2.2 譜聚類概念 132
7.2.3 譜聚類原理 134
7.3 基于規范化的譜聚類分類識別算法描述 134
7.4 實驗 137
7.4.1 實驗環境及數據集 137
7.4.2 算法評估 137
7.4.3 Moore_set數據集分析 138
7.5 本章小結 140
參考文獻 141
第8章 基于半監督的流量識別算法 143
8.1 引言 143
8.2 半監督流量識別算法的相關研究工作 144
8.3 半監督流量識別算法描述 145
8.3.1 相關定義 145
8.3.2 問題描述 147
8.3.3 改進的KNN算法 147
8.4 實驗 149
8.5 其他半監督流量識別算法 151
8.5.1 基于改進K-means的半監督流量識別算法 151
8.5.2 基于距離的多中心半監督聚類算法 152
8.5.3 基于密度的多中心半監督聚類算法 153
8.5.4 實驗結果與分析 154
8.6 本章小結 155
參考文獻 155
第9章 基于深度學習的流量識別算法 158
9.1 引言 158
9.2 常見的深度學習模型 159
9.2.1 堆疊自動編碼器 159
9.2.2 深度置信網絡 160
9.2.3 深度玻爾茲曼機 163
9.2.4 卷積神經網絡 163
9.3 基于卷積神經網絡的流量識別算法 165
9.4 實驗 168
9.4.1 數據集 168
9.4.2 實驗軟硬件平臺 169
9.4.3 實驗訓練集 169
9.5 本章小結 171
參考文獻 172
附錄 174