本書基于理論結合實踐、基礎結合前沿的編寫原則,系統地講解了網絡流量分類技術的相關知識。在內容編排上注重夯實基礎、闡明技術、關注前沿、指導實踐。全書分基礎知識、技術原理和實踐驗證三大模塊,共12章。首先介紹了網絡協議、網絡流量數據集及其預處理技術、典型機器學習算法。在此基礎上,接著介紹了基于端口、基于網絡協議解析、基于深度包檢測和基于統計學習的網絡流量分類方法,闡述了各種方法的基本原理、技術挑戰,跟蹤分析了當前國內外研究進展。最后為增進知識理解和應用,安排了標準網絡電話協議和非標Skype網絡電話協議檢測分類實踐,在相關章節中亦特別注重提供網絡可用資源,方便閱讀者開展實驗或實踐。
本書既可以作為高等學校本科高年級或研究生專業網絡技術進階學習的參考書,或用作網絡管理、網絡安全、網絡設計或網絡運營技術人員的培訓教材,也可以用作相關方向科研人員的參考資料。
1.采用基礎知識、主要方法、技術實踐緊密結合的編排方式,便于研究生與研究人員進階學習。 2.力求理論與實踐相結合,使用了大量便于閱讀者理解的圖表,有利于相關知識的理解吸收。 3.適合本科高校學生和技術人員從事網絡流量分類、網絡協議解析、網絡安全等研究工作時參考 。
第1章 網絡協議
1.1 互聯網簡史
1.2 OSI參考模型
1.3 TCP/IP協議
1.3.1 TCP/IP協議模型
1.3.2 TCP與UDP
1.3.3 Ethernet II幀格式
1.3.4 IPv4地址
1.3.5 IPv4報文
1.3.6 TCP報文
1.3.7 UDP報文
1.3.8 ICMP報文
1.4 IPv6
1.4.1 IPv6地址
1.4.2 IPv6報文
第1章 網絡協議
1.1 互聯網簡史
1.2 OSI參考模型
1.3 TCP/IP協議
1.3.1 TCP/IP協議模型
1.3.2 TCP與UDP
1.3.3 Ethernet II幀格式
1.3.4 IPv4地址
1.3.5 IPv4報文
1.3.6 TCP報文
1.3.7 UDP報文
1.3.8 ICMP報文
1.4 IPv6
1.4.1 IPv6地址
1.4.2 IPv6報文
1.4.3 IPv6安全
第2章 網絡流量數據集
2.1 網絡數據集格式
2.1.1 PCAP文件格式
2.1.2 NetFlow格式
2.2 PCAP數據采集
2.2.1 數據采集方法
2.2.2 常用捕包分析工具
2.2.3 Libpcap庫
2.2.4 數據集標注
2.2.5 NetFlow和IPFIX處理工具
2.3 開放數據集
2.3.1 CAIDA數據集
2.3.2 UNIBS數據集
2.3.3 WIDE數據集
2.3.4 WITS數據集
2.4 其他輔助工具
2.4.1 匿名化處理工具
2.4.2 IP地址定位
第3章 數據預處理與評估
3.1 數據清洗
3.2 數據變換
3.2.1 規范化
3.2.2 離散化
3.3 數據歸約
3.4 維規約與特征選擇
3.5 數據抽樣
3.6 數據分布分析
3.6.1 簡單度量指標
3.6.2 數據分布評估方法
3.7 數據集評估指標
3.8 特征的相關性分析
3.8.1 散布圖
3.8.2 卡方檢驗
3.8.3 皮爾遜相關系數
第4章 機器學習方法
4.1 C4.5決策樹
4.2 貝葉斯方法
4.2.1 貝葉斯定理
4.2.2 樸素貝葉斯
4.2.3 隱馬爾可夫模型
4.2.4 貝葉斯網絡
4.3 K-最近鄰算法
4.4 支持向量機
4.4.1 SVM思想概述
4.4.2 線性支持向量機
4.4.3 非線性支持向量機與核函數
4.4.4 C-SVM、V-SVM與LS-SVM
4.4.5 LibSVM
4.5 K-均值聚類
4.6 分類器評估指標
4.6.1 關于分類器模型評估
4.6.2 關于分類結果評估
第5章 網絡流量分類技術概述
5.1 基本概念
5.2 方法與現狀
5.2.1 基于標準端口匹配
5.2.2 基于DPI
5.2.3 基于協議解析
5.2.4 基于統計學習
5.2.5 研究方法演進
5.3 流量分類方法比較評估
5.4 挑戰
第6章 互聯網流量特性分析
6.1 隨機過程
6.2 自相似性
6.3 長相關性
6.4 Hurst指數
6.4.1 R/S估計方法
6.4.2 Whittle最大似然估計方法
6.4.3 小波估計方法
6.5 重尾分布
6.6 突發性
6.7 特性計算及演進趨勢分析
第7章 基于端口的網絡流量分類
7.1 典型端口分配
7.2 CAIDA CoralReef軟件包
7.3 布隆過濾器
第8章 基于協議解析的網絡流量分類
8.1 標準開放協議解析
8.1.1 TCP協議狀態機
8.1.2 POP3協議狀態機
8.1.3 HTTP協議狀態機
8.2 協議行為分析
8.2.1 基于流量的分析方法
8.2.2 基于軟件逆向分析方法
第9章 基于DPI的網絡流量分類
9.1 DPI產品概述
9.2 多模式匹配算法
9.2.1 WM算法
9.2.2 AC算法
9.3 正則表達式
9.4 統計簽名
9.5 L7filter
第10章 基于統計學習的網絡流量分類方法
10.1 流統計特征
10.2 流特征生成工具
10.3 時間復雜度分析
10.3.1 學習算法的時間復雜度
10.3.2 流統計特征計算的時間復雜度
10.4 文獻方法列舉
10.5 機器學習軟件包WEKA
10.5.1 WEKA數據文件格式
10.5.2 WEKA GUI菜單
10.5.3 WEKA Explorer
10.5.4 WEKA預處理
10.5.5 WEKA分類
10.5.6 WEKA聚類
10.5.7 WEKA關聯分析
第11章 SIP和H.323 VoIP流量檢測
11.1 概述
11.1.1 簡介
11.1.2 發展歷程
11.1.3 協議體系
11.2 VoIP流量檢測
11.2.1 檢測分析功能
11.2.2 檢測分析原理
11.2.3 檢測分析系統
第12章 Skype流量識別分類方法
12.1 引言
12.2 Skype發展現狀
12.3 Skype流量識別方法
12.4 兩種方法測試結果
12.4.1 基于應用行為的Skype識別方法測試結果
12.4.2 基于關鍵字的Skype識別方法
12.4.3 Skype真的沒有官方服務器么?
12.5 小結
附錄:詞匯表
參考文獻