本書綜合了大量國(guó)內(nèi)外的最新資料和作者的研究成果,介紹了社會(huì)計(jì)算的定義和研究?jī)?nèi)容,以社會(huì)化媒體大數(shù)據(jù)為例討論了數(shù)據(jù)獲取和知識(shí)表示,從社會(huì)化媒體的網(wǎng)絡(luò)結(jié)構(gòu)和內(nèi)容的角度研究了社區(qū)發(fā)現(xiàn)算法和興趣社區(qū)劃分方法,討論了社會(huì)化媒體網(wǎng)絡(luò)信息的傳播問(wèn)題、跨平臺(tái)挖掘以及群體智慧的一些相關(guān)研究成果。全書圍繞著三個(gè)層次展開(kāi)敘述:數(shù)據(jù)層研究社會(huì)化媒體以及社會(huì)化媒體的數(shù)據(jù)獲取和知識(shí)表示;模型層重點(diǎn)分析了社區(qū)發(fā)現(xiàn)和社會(huì)建模與分析,社區(qū)發(fā)現(xiàn)是進(jìn)行社區(qū)建模和分析的基礎(chǔ);應(yīng)用層研究社會(huì)媒體文本挖掘的情感分析、金融決策分析、跨平臺(tái)的知識(shí)發(fā)現(xiàn)、群體智慧方面的應(yīng)用。
本書面向社會(huì)化媒體大數(shù)據(jù),介紹了社會(huì)化媒體計(jì)算的一些典型算法及應(yīng)用。本書結(jié)合現(xiàn)階段社會(huì)計(jì)算的研究方向和熱點(diǎn),從社會(huì)計(jì)算的實(shí)驗(yàn)數(shù)據(jù)源出發(fā),在介紹社會(huì)化媒體的基礎(chǔ)上,討論了社會(huì)化媒體的集成技術(shù),并根據(jù)社會(huì)化媒體的特點(diǎn),將現(xiàn)有的研究分為基于社會(huì)化媒體網(wǎng)絡(luò)結(jié)構(gòu)和基于社會(huì)化媒體內(nèi)容兩類,依次分別闡述各相關(guān)研究。第1章為緒言,著重介紹社會(huì)計(jì)算的定義和研究?jī)?nèi)容。第2章介紹社會(huì)計(jì)算的實(shí)驗(yàn)資料來(lái)源,以社會(huì)化媒體為例著重介紹其數(shù)據(jù)獲取和知識(shí)表示。第3章研究了基于網(wǎng)絡(luò)結(jié)構(gòu)的社區(qū)發(fā)現(xiàn)。第4章討論了基于內(nèi)容的興趣社區(qū)發(fā)現(xiàn)。第5章主要研究了社會(huì)化媒體網(wǎng)絡(luò)中信息的傳播分析。第6章討論了社會(huì)化媒體計(jì)算應(yīng)用。第7章研究了社會(huì)化媒體跨平臺(tái)挖掘問(wèn)題。從更廣泛的角度來(lái)說(shuō),利用群體智慧的算法實(shí)際上是社會(huì)計(jì)算的特殊形式,即通過(guò)社會(huì)個(gè)體的合作或競(jìng)爭(zhēng)完成某一特定的任務(wù),所以第8章我們也介紹了群體智慧的相關(guān)研究成果。
本書的工作受到了中國(guó)人民大學(xué)科學(xué)研究基金項(xiàng)目(10XNI029)的支持。作者的學(xué)生也參加了本書的編寫,這些同學(xué)是朱浩然、林航、申華、施曉菁、周晨曦、紀(jì)陽(yáng)、李啟東、李曉菲、李亞平、柴若琪、鄭藝、馬超、王宇珩等。
由于作者水平和時(shí)間的限制,書中一定存在不少缺點(diǎn)和錯(cuò)誤,懇請(qǐng)讀者批評(píng)指正。
編者于2014年5月
第1章緒言
1.1社會(huì)計(jì)算定義
1.2社會(huì)計(jì)算研究?jī)?nèi)容
1.2.1數(shù)據(jù)集成
1.2.2社區(qū)發(fā)現(xiàn)
1.2.3群體智慧
1.2.4知識(shí)發(fā)現(xiàn)與決策支持
1.3本章小結(jié)
思考題
第2章社會(huì)化媒體及其知識(shí)表示
2.1社會(huì)化媒體定義
2.2社會(huì)化媒體分類
2.2.1博客
2.2.2社交網(wǎng)絡(luò)
2.2.3微博
2.2.4分享平臺(tái)
2.2.5論壇
2.2.6知識(shí)協(xié)作
2.2.7即時(shí)通信
2.2.8垂直社區(qū)
2.2.9搜索引擎
2.3主流社會(huì)化媒體
2.3.1維基百科
2.3.2新浪微博
2.4社會(huì)化媒體大數(shù)據(jù)
2.5社會(huì)化媒體大數(shù)據(jù)獲取方法
2.5.1維基百科數(shù)據(jù)獲取方法
2.5.2新浪微博數(shù)據(jù)獲取方法
2.6現(xiàn)有社會(huì)網(wǎng)絡(luò)分析軟件
2.6.1UCINET軟件
2.6.2NetDraw軟件
2.6.3Pajek軟件
2.6.4NetMiner軟件
2.6.5StOCNET軟件
2.7本章小結(jié)
思考題
第3章基于網(wǎng)絡(luò)結(jié)構(gòu)的社區(qū)發(fā)現(xiàn)
3.1非重疊社區(qū)發(fā)現(xiàn)
3.1.1傳統(tǒng)算法
3.1.2分裂算法
3.1.3基于模塊度的方法
3.1.4動(dòng)力學(xué)算法
3.1.5局部社區(qū)發(fā)現(xiàn)算法
3.1.6幾種經(jīng)典社區(qū)算法
3.2重疊社區(qū)發(fā)現(xiàn)
3.2.1重疊社區(qū)發(fā)現(xiàn)
3.2.2重疊社區(qū)發(fā)現(xiàn)算法分類
3.3本章小結(jié)
思考題
第4章基于內(nèi)容的社區(qū)聚類方法
4.1主題模型
4.1.1主題模型簡(jiǎn)介
4.1.2主題模型內(nèi)容
4.2LDA模型
4.2.1LDA模型簡(jiǎn)介
4.2.2LDA模型內(nèi)容
4.2.3LDA模型統(tǒng)計(jì)推斷
4.3LDA模型的變形
4.3.1AT模型
4.3.2ART模型
4.3.3CART模型
4.4主題模型在社區(qū)發(fā)現(xiàn)中的應(yīng)用
4.4.1簡(jiǎn)介
4.4.2網(wǎng)絡(luò)結(jié)構(gòu)挖掘
4.5本章小結(jié)
思考題
第5章社會(huì)網(wǎng)絡(luò)信息傳播分析
5.1社會(huì)網(wǎng)絡(luò)中的信息傳播
5.2社會(huì)網(wǎng)絡(luò)中的信息傳播模型
5.2.1病毒傳播模型
5.2.2影響力傳播模型
5.3社會(huì)網(wǎng)絡(luò)中的信息傳播的應(yīng)用
5.3.1影響最大化
5.3.2病毒營(yíng)銷
5.3.3謠言的防控
5.4本章小結(jié)
思考題
第6章社會(huì)化媒體計(jì)算應(yīng)用
6.1基于社會(huì)化媒體文本挖掘的情感分析
6.1.1情感分析研究概述
6.1.2情感分析文本預(yù)處理
6.1.3微博情感傾向分類模型
6.1.4情感分類評(píng)價(jià)指標(biāo)
6.2基于流形學(xué)習(xí)的社會(huì)化媒體金融復(fù)合數(shù)據(jù)的預(yù)測(cè)
6.2.1金融預(yù)測(cè)研究概述
6.2.2原始數(shù)據(jù)獲取及量化處理
6.2.3基于指標(biāo)與維度的數(shù)據(jù)優(yōu)化
6.2.4金融預(yù)測(cè)模型及評(píng)價(jià)指標(biāo)
6.3個(gè)性化服務(wù)
6.3.1國(guó)內(nèi)社交網(wǎng)站推薦系統(tǒng)的發(fā)展現(xiàn)狀
6.3.2推薦的相關(guān)技術(shù)
6.3.3一個(gè)例子:動(dòng)態(tài)信息推薦
6.4本章小結(jié)
思考題
第7章社會(huì)化媒體跨平臺(tái)挖掘
7.1基于用戶名的用戶識(shí)別
7.1.1記憶力受限因素
7.1.2知識(shí)受限因素
7.2基于網(wǎng)絡(luò)結(jié)構(gòu)的用戶識(shí)別
7.2.1種子結(jié)點(diǎn)識(shí)別
7.2.2迭代識(shí)別
7.3本章小結(jié)
思考題
第8章群體智慧
8.1蟻群算法
8.2粒子群算法
8.3人工魚群算法
8.4人工免疫算法
8.5人本計(jì)算
8.6補(bǔ)充材料:尋找潛艇“天蝎號(hào)”
8.7本章小結(jié)
思考題
參考文獻(xiàn)