《基于網絡大數據的社會經濟監測預警研究》針對網絡大數據具有時效性強、分布范圍廣的特點,提出一個基于網絡大數據的社會經濟監測預警的研究框架,對網絡大數據進行深入分析和挖掘,在此基礎上就社會轉型中的社會經濟關鍵指標進行實時監測和智能預測,為政府和相關管理部門提供有效的分析工具與決策支持!痘诰W絡大數據的社會經濟監測預警研究》結構完整,思路清晰,語言流暢,是網絡大數據應用于社會經濟預測的首本專著,同時也是大數據分析和監測預警等相關領域不可多得的一本體系性參考書。
《基于網絡大數據的社會經濟監測預警研究》可供從事預測科學、監測技術和大數據應用研究的科研人員,政府有關決策和管理部門的工作人員,金融公司、電子商務企業等的從業人員參考,也可供高等院校管理學院、信息學院、金融學院等相關專業的師生閱讀。
第1章 緒論
1.1 社會經濟監測預警研究意義
1.2 社會經濟監測預警國內外發展現狀
1.3 社會經濟監測預警研究發展動態分析
1.4 本書的技術路線
1.5 本書的內容結構
1.6 本書的特色與創新
第2章 網絡大數據挖掘
2.1 數據挖掘概述
2.2 大數據概述
2.3 網絡大數據
2.4 網絡大數據挖掘
2.5 網絡大數據挖掘技術
第3章 基于網絡大數據監測預警的一般框架
3.1 引言
3.2 社會經濟監測預警的一般框架
3.3 基于網絡大數據的社會經濟監測預警關鍵科學問題
3.4 本章小結
第4章 基于網絡搜索數據的失業率預測研究
4.1 引言
4.2 基于網絡搜索數據的失業率預測建模
4.3 實證分析
4.4 本章小結
第5章 基于網絡搜索數據的流行性感冒預測研究
5.1 引言
5.2 流感預測的數據挖掘方法
5.3 基于網絡搜索信息的流感預測
5.4 實證分析
5.5 本章小結
第6章 基于網絡新聞的混合模型的CPI預測
6.1 引言
6.2 方法介紹
6.3 混合模型的建立
6.4 實證分析
6.5 本章小結
第7章 基于雙語本體的匯率預測
7.1 引言
7.2 基于雙語本體網絡挖掘方法的外匯預測建模
7.3 實證分析
7.4 本章小結
第8章 基于網絡新聞的國際原油價格預測模型研究
8.1 引言
8.2 基于網絡新聞的國際原油價格預測建模
8.3 實證分析
8.4 本章小結
第9章 基于網絡信息傳導機制的黃金期貨市場價格聯動模型研究
9.1 引言
9.2 媒體源與媒體因素
9.3 黃金期貨信息傳導機制
9.4 本章小結
第10章 房地產價格指數預測研究
10.1 引言
10.2 數據挖掘方法介紹
10.3 房地產價格預測建模
10.4 實證分析
10.5 本章小結
第11章 基于評論的主體模型的電子商務銷售量預測研究
11.1 引言
……
第12章 基于網絡大數據的住宿行業監測預警研究
第13章 基于網絡大數據的餐飲市場景氣指數編制
第14章 基于網絡新聞的股票市場預測
第15章 基于多源媒體信息的股票市場預測
第16章 基于眾包的社會媒體情感分析研究
第17章 基于數據挖掘的金融微博情感分析研究
第18章 基于微博情感的股市預測
第19章 基于微博用戶的股市預測
第20章 基于網絡視頻的股市預測
第21章 基于網絡信息的股票自動交易系統
第22章 基于網絡大數據的社會經濟監測預警研究總結與展望
參考文獻
《基于網絡大數據的社會經濟監測預警研究》:
2.4.2網絡大數據挖掘的定義
最早的網絡數據挖掘概念是由OrenEtioni于1996年提出來的,他認為網絡數據挖掘是數據挖掘技術在網絡上的應用,這項技術綜合了數據挖掘、網絡、計算機技術、信息技術等諸多領域,是一種綜合性的數據挖掘技術。
國內外專家學者對于網絡數據挖掘的定義也是眾說紛紜,《基于網絡大數據的社會經濟監測預警研究》選取一個認同率較高的定義:網絡數據挖掘就是指從大量網絡數據集中找到隱藏的信息,如果將大量網絡數據作為這一過程的輸入,將隱藏信息作為這一過程的輸出,則整個網絡數據挖掘過程就是從輸入到輸出的一個映射,即從大量網絡數據集到隱藏信息的一個映射。
網絡數據挖掘是數據挖掘的一個重要分支,但是相比于數據挖掘,網絡數據挖掘有著一些特殊之處。
首先,網絡數據挖掘的對象是大量的網絡數據集,這些數據集大多是文檔形式,而且具有異質性及分散式的特點,如服務器上保存的日志文件、用戶發生行為留下的個人信息等,處理起來比傳統的數據挖掘更加困難。
其次,從邏輯上來講網絡可以看做一個文檔節點以及節點間的鏈接構成的圖,因此通過網絡數據挖掘可能會得到網絡內容,也可能會得到網絡結構,具有一定的不確定性。
另外,網絡數據本身不是結構化的(機器不容易理解),但是傳統的數據挖掘是基于結構化的數據進行的,是建立在關系數據庫的基礎上的。因此,有些時候數據挖掘技術與網絡數據挖掘技術并不通用,即便要用也需要預先對網絡數據進行處理,使其轉化為傳統數據挖掘技術可用的結構化數據結構,這也是網絡數據挖掘技術的發展方向之一。
由于數據不斷增長,類型不斷復雜,網絡數據具有了大數據特征,這時的網絡數據挖掘已成為網絡大數據挖掘了。2.4.3網絡大數據挖掘的分類由于網絡上的數據具有多樣性的特征,所以在進行網絡大數據挖掘時所面臨的任務也是多種多樣的,這里我們根據網絡大數據挖掘的對象不同進行分類,網絡大數據挖掘技術可以分為三類,即網絡結構挖掘、網絡內容挖掘和網絡應用挖掘。
網絡結構挖掘技術是指在挖掘過程中關注網絡上隱含的鏈接結構,根據網絡結構之間的關系(如鏈接間的關系與組織結構)得到隱含信息的過程。這種方式通過分析網頁之間的某個鏈接及與這個鏈接相關的網頁數和相關對象,建立起一個網絡鏈接結構模型。網絡結構挖掘可以用來對網頁進行分類,從而進一步得到網頁之間的相關聯程度及近似程度,同時還可以幫助用戶快速地找到與自己相關的網頁。前文已經說過,邏輯上網絡可以看做一張圖,一張龐大的有向圖。每個網絡網頁就是圖中的一個節點,而頁面之間的鏈接就是圖中的邊,可以是單向的,也可以是雙向的。這樣我們可以很方便、快捷地找到一個節點到另一個節點的最短路徑,應用到現實生活中就是可以花費最小的時間和精力從一個頁面訪問另一個目標頁面。
網絡內容挖掘技術是指對頁面的本身內容進行挖掘,頁面內容的主要形式有文本、圖片、多媒體音響等,我們要從多種形式的內容中挖掘出有價值的信息。目前,廣泛應用的一些搜索引擎與推薦系統都是網絡內容挖掘技術的現實應用,這些應用都是幫助用戶從大量數據中快速找到自己需要的信息。網絡內容挖掘技術的關鍵是對網絡頁面的分類及聚類。分類是指網絡頁面具有不同的特征,我們根據這些特征將網絡頁面劃分為不同的類別;聚類是指,由于不同類別的網絡頁面之間或多或少都有著某種聯系,我們將這些頁面聚合到一起,形成不同的簇,盡可能使得同一個簇內的網絡頁面有著最為相近的內容,而不同簇之間的網絡頁面內容沒有多大的相近性與關聯度。
……