網絡信息內容安全技術是信息安全領域的一個研究方向,有著廣闊的應用前景。本書共8章,介紹與網絡信息內容安全技術相關的基本概念、理論方法和*研究進展。在編寫中著重闡述信息內容安全的若干關鍵技術信息過濾、話題檢測與跟蹤、社會網絡分析、網絡新聞評價、網絡輿情分析等技術。
本書內容全面,既有對網絡信息內容安全基礎知識和理論模型的介紹,也有對相關問題研究背景、實現方法和技術現狀的詳細闡述,可作為高等院校計算機、信息技術等相關專業高年級本科生的教材或參考書,也可供從事信息技術、數據挖掘、人工智能、管理科學、戰略研究等相關領域研究的教師、研究生和科研工作者參考,借以提供思路和技術支撐。
本書可作為新近開設《網絡信息內容安全》的高校本科教材,可以讓授課教師和學生迅速了解網絡信息內容安全的核心技術,同時還能讓大家了解網絡信息內容安全的實際應用。
本書可作為新近開設《網絡信息內容安全》的高校本科教材,可以讓授課教師和學生迅速了解網絡信息內容安全的核心技術,同時還能讓大家了解網絡信息內容安全的實際應用。 |
前言
互聯網已經成為人們獲取信息、相互交流、協同工作的重要途徑,但同時也帶來一些負面影響,如色情、反動等不良信息在網絡上大肆傳播,垃圾郵件、廣告等惡意營銷行為泛濫,網絡欺詐、釣魚以及網絡暴力、網絡恐怖主義等惡意行為層出不窮。這些惡意信息和行為完全背離了互聯網設計的初衷,也不符合廣大網民的意愿,并且影響到現實的正常秩序和規范。因此研究網絡信息內容安全,提供對互聯網中各種不利信息的檢測分析能力,是體現我國信息技術水平的重要環節,也是建設信息化社會的堅實保障;ヂ摼W上各種不良信息和行為的產生,其原因主要在于互聯網作為一個內容平臺,人們可以更便利地獲取、發布信息,而在互聯網爆發性發展過程中,相關的規范制度、安全技術研究卻未能同步發展。網絡信息內容安全作為信息安全領域的一個研究分支,是上述問題的解決方案,它主要研究如何從包含海量信息的網絡環境中,對特定安全主題的相關信息進行自動獲取、識別和分析的技術。該研究分支涉及的相關技術包括信息安全、自然語言處理、網絡理論、機器學習、模式識別等,直接或間接應用到這些研究領域的最新研究成果。結合網絡信息內容安全的具體需求,本書全面介紹面向信息內容安全的網絡信息處理技術的相關基本概念、理論方法和最新研究進展等,著重闡述網絡信息內容安全的若干關鍵技術信息過濾、話題檢測與跟蹤、社會網絡分析、網絡新聞評價、網絡輿情分析等。本書既有對基礎知識和理論模型的介紹,也有對相關問題研究背景、實現方法和技術現狀的詳細闡述。目前市面上缺乏對網絡信息內容等技術進行系統介紹的書籍,本教材以研究型課程為特征,著重培養學生的思考能力和初步的研究能力,可以讓授課教師和學生迅速了解網絡信息內容安全的核心技術,同時讓大家了解網絡信息內容安全的實際應用。本書主要面向高等院校本科生,理論與應用相結合是本書的一大特色。內容編排時兼顧學科前沿研究和實際應用背景。該書有助于發掘學生的科研興趣、提升學生的就業層次、滿足人才市場的需求。本書由楊黎斌擔任主編,各章編寫分工如下: 楊黎斌編寫第1、5章; 蔡曉妍編寫第2、3章; 戴航編寫第4章; 慕德俊編寫第6章; 李梅編寫第7章,張曉婷編寫第8章。楊黎斌負責全書的策劃、大綱的制定和統稿工作。在本書編寫過程中,參考了國內外許多公開發表的相關資料,在此對所涉及的各位專家、學者表示誠摯的感謝。研究生許紅波、李飛、由文浩和陳志濤同學對本書的圖表進行編輯,許晶晶、李敏、張嘉慧、韓亞敏、陳志濤和申昌同學對本書進行校對并提出寶貴的建議,特此表示感謝。由于編寫時間緊迫,加之編者理論水平和實踐經驗有限,書中難免有不當和疏漏之處,懇請廣大讀者批評指正。
編者2016年7月
目錄
第1章緒論
1.1網絡信息內容安全的背景
1.1.1我國互聯網發展現狀
1.1.2網絡信息內容特點
1.2網絡信息內容安全的概念
1.2.1網絡信息內容安全的定義
1.2.2網絡信息內容安全的特點
1.2.3網絡信息內容安全與相關學科的關系
1.3主流網絡信息安全產品簡介
1.3.1政府部門主導的項目
1.3.2科研院所或企業的項目與產品
1.4網絡信息內容安全研究的意義
1.5網絡信息內容安全的未來及發展趨勢
1.6本章小結
習題
第2章網絡信息的獲取
2.1互聯網信息分類
2.1.1網絡媒體信息
2.1.2網絡通信信息
2.2網絡媒體信息的獲取
2.2.1網絡媒體信息獲取的一般流程
2.2.2網絡媒體信息獲取的分類
2.2.3網絡媒體信息獲取的難點分析
2.2.4網絡媒體信息獲取的方法
2.3網絡通信信息的獲取
2.3.1網絡通信信息獲取的一般流程
2.3.2網絡通信信息獲取的分類
2.3.3網絡通信信息獲取的難點分析
2.3.4Linux和Windows環境下的通信信息獲取
2.4本章小結
習題
第3章網絡信息內容預處理技術
3.1網絡信息內容預處理概述
3.1.1中文分詞
3.1.2停用詞
3.2語義特征抽取
3.2.1詞級別語義特征
3.2.2亞詞級別語義特征
3.2.3語義與語用級別語義特征
3.2.4漢語的語義特征抽取
3.3特征子集選擇
3.3.1停用詞過濾
3.3.2文檔頻率閾值法
3.3.3TFIDF
3.3.4信噪比
3.4特 征 重 構
3.4.1詞干
3.4.2知識庫
3.4.3潛在語義索引
3.5向 量 生 成
3.5.1局部系數
3.5.2全局系數
3.5.3規范化系數
3.6文本內容分析
3.6.1文本語法分析方法
3.6.2文本語義分析方法
3.6.3文本語用分析方法
3.7本章小結
習題
第4章網絡信息內容過濾
4.1網絡信息內容過濾概述
4.1.1網絡信息內容過濾的定義
4.1.2網絡信息內容過濾的原理
4.1.3網絡信息內容過濾的意義
4.2網絡信息內容過濾技術的分類
4.2.1根據過濾方法分類
4.2.2根據操作的主動性分類
4.2.3根據過濾位置分類
4.2.4根據過濾的不同應用分類
4.3網絡信息內容過濾的一般流程
4.4網絡信息內容過濾模型
4.4.1布爾模型
4.4.2向量空間模型
4.4.3神經網絡模型
4.5網絡信息內容過濾的主要方法
4.5.1統計方法
4.5.2邏輯方法
4.6網絡信息內容過濾典型系統
4.6.1基于多Agents的過濾系統
4.6.2基于文本匹配的過濾系統
4.7本章小結
習題
第5章話題檢測與跟蹤
5.1話題檢測與跟蹤概述
5.1.1話題檢測與跟蹤的定義
5.1.2話題檢測與跟蹤的特點
5.1.3話題檢測與跟蹤的意義
5.2話題檢測與跟蹤的任務
5.2.1報道切分
5.2.2首次報道檢測
5.2.3關聯檢測
5.2.4話題檢測
5.2.5話題跟蹤
5.3話題檢測與跟蹤的研究體系
5.4相關研究現狀
5.4.1關聯檢測
5.4.2話題跟蹤
5.4.3話題檢測
5.4.4跨語言話題檢測與跟蹤
5.5話題檢測與跟蹤的一般系統模型
5.5.1話題/報道模型
5.5.2相似度計算
5.5.3聚類分析策略
5.6話題檢測與跟蹤的效果評價
5.6.1話題檢測與跟蹤使用的語料
5.6.2話題檢測與跟蹤的評測體系
5.7話題檢測與跟蹤的發展趨勢
5.8本章小結
習題
第6章社會網絡分析
6.1社會網絡分析概述
6.1.1社會網絡的定義
6.1.2社會網絡分析的含義及主要內容
6.1.3網絡信息中的社會網絡分析
6.1.4社會網絡分析的意義
6.2社會網絡分析的研究體系
6.2.1中心性分析
6.2.2凝聚子群分析
6.2.3核心邊緣結構分析
6.3社會網絡分析的一般模型
6.3.1社會網絡的構建
6.3.2社會網絡的發現
6.3.3節點地位評估
6.4社會網絡分析常用方法
6.4.1基于命名實體檢索結果的社會網絡構建
6.4.2基于內容分析的社會網絡構建
6.5社會網絡分析的安全應用
6.5.1社會挖掘和話題監控的互動模型研究
6.5.2不同實體間關系傾向性分析
6.5.3中文新聞文檔自動文摘
6.6社會網絡分析的發展趨勢
6.7本章小結
習題
第7章網絡輿情分析
7.1網絡輿情分析概述
7.1.1網絡輿情分析的概念
7.1.2網絡輿情的特點
7.1.3網絡輿情分析的意義
7.2網絡輿情分析的關鍵技術
7.2.1信息采集技術
7.2.2輿情熱點發現技術
7.2.3熱點評估和跟蹤
7.2.4輿情等級評估
7.3網絡輿情分析的系統框架
7.4網絡輿情分析常用方法
7.4.1高仿真網絡信息深度抽取
7.4.2高性能信息自動提取機器人技術
7.4.3基于語義的海量文本特征快速提取與分類
7.4.4多媒體群件理解技術
7.4.5非結構信息自組織聚合表達
7.5網絡輿情分析的典型應用
7.5.1面向互聯網論壇的定點站點深入挖掘機制
7.5.2異構數據歸一化存儲與目標站點熱點查詢
7.5.3監控目標熱點自動發現功能
7.6網絡輿情分析的發展趨勢
7.7本章小結
習題
第8章開源情報分析
8.1基本概念
8.1.1開源情報分析的概念
8.1.2開源情報分析的價值
8.2開源情報分析的發展和研究
8.3開源情報分析的指標
8.3.1信息源可靠度
8.3.2信息內容可靠度
8.4開源情報大數據分析方法
8.4.1數據定量分析
8.4.2多源數據融合
8.4.3相關性分析
8.5開源情報分析系統框架
8.5.1系統框架
8.5.2處理流程
8.6開源情報分析的發展趨勢
8.7本章小結
習題
參考文獻