圖強(qiáng)化學(xué)習(xí)--原理與實(shí)踐入門(mén)
定 價(jià):¥69
中 教 價(jià):¥41.40 (6.00折)
庫(kù) 存 數(shù): 7
圖強(qiáng)化學(xué)習(xí)是深度強(qiáng)化學(xué)習(xí)的重要分支領(lǐng)域。本書(shū)作為該領(lǐng)域的入門(mén)教材,在內(nèi)容上盡可能覆蓋圖強(qiáng)化學(xué)習(xí)的基礎(chǔ)知識(shí),并提供應(yīng)用實(shí)踐案例。全書(shū)共 10章,大致分為三部分:第一部分(第 1~3章)介紹圖強(qiáng)化學(xué)習(xí)研究對(duì)象(復(fù)雜系統(tǒng)、圖和復(fù)雜網(wǎng)絡(luò));第二部分(第 4~7章)介紹圖強(qiáng)化學(xué)習(xí)基礎(chǔ)知識(shí)(圖嵌入、圖神經(jīng)網(wǎng)絡(luò)和深度強(qiáng)化學(xué)習(xí));第三部分(第 8~10章)介紹圖強(qiáng)化學(xué)習(xí)模型框架和應(yīng)用實(shí)踐案例,并進(jìn)行總結(jié)和展望。每章都附有習(xí)題并介紹了相關(guān)閱讀材料,以便有興趣的讀者進(jìn)一步深入探索。
本書(shū)可作為高等院校計(jì)算機(jī)、圖數(shù)據(jù)挖掘及相關(guān)專業(yè)的本科生或研究生教材,也可供對(duì)圖強(qiáng)化學(xué)習(xí)感興趣的研究人員和工程技術(shù)人員閱讀參考。
本書(shū)從算法原理出發(fā),詳細(xì)介紹了圖強(qiáng)化學(xué)習(xí)的算法、原理和實(shí)踐,與各領(lǐng)域?qū)嶋H問(wèn)題相結(jié)合。
在現(xiàn)實(shí)世界和虛擬世界中,圖無(wú)處不在,網(wǎng)絡(luò)也無(wú)處不在。例如,人類社會(huì)關(guān)系圖、蛋白質(zhì)作用關(guān)系圖和化學(xué)分子圖等。在微觀尺度、介觀尺度和宏觀尺度上,圖和網(wǎng)絡(luò)都直接影響著人類的生活、工作和學(xué)習(xí),如與人類息息相關(guān)的社會(huì)網(wǎng)絡(luò)、交通網(wǎng)絡(luò)、貿(mào)易網(wǎng)絡(luò)和信息網(wǎng)絡(luò)等。人體包括生物神經(jīng)網(wǎng)絡(luò)和血液循環(huán)網(wǎng)絡(luò)等,這些網(wǎng)絡(luò)是人類身體的直接組成部分。因此,人類既是圖或網(wǎng)絡(luò)的集合體,也是其他網(wǎng)絡(luò)或系統(tǒng)的組成部分。從復(fù)雜系統(tǒng)角度看,人類本身就是一個(gè)極其復(fù)雜的系統(tǒng),或者是復(fù)雜系統(tǒng)的系統(tǒng)。同時(shí),人類處在復(fù)雜系統(tǒng)之中,或處在系統(tǒng)的系統(tǒng)之中。換而言之,人類處在網(wǎng)絡(luò)之中,或處在網(wǎng)絡(luò)的網(wǎng)絡(luò)之中。圖或網(wǎng)絡(luò)作為復(fù)雜系統(tǒng)的有效表示,也是復(fù)雜系統(tǒng)的常用分析工具和研究方法。圖數(shù)據(jù)和圖方法可以度量、預(yù)警、預(yù)測(cè)和控制復(fù)雜系統(tǒng)的脆弱性和穩(wěn)健性。新冠疫情和局部戰(zhàn)爭(zhēng)等不確定事件的頻頻發(fā)生,使人們的日常生活、學(xué)習(xí)和工作都受到了不同程度的沖擊。在信息社會(huì)中,網(wǎng)絡(luò)化和系統(tǒng)化為人類提供了基礎(chǔ)的生存設(shè)施和便利的生活環(huán)境,也使人類社會(huì)系統(tǒng)處在各種事件沖擊之中和災(zāi)難爆發(fā)的邊緣。在復(fù)雜系統(tǒng)中,一些微小的擾動(dòng)可以通過(guò)網(wǎng)絡(luò)進(jìn)行擴(kuò)散和放大,加劇系統(tǒng)脆弱性以及突發(fā)事件的危害和不確定性,正如人們所熟知的蝴蝶效應(yīng)和黑天鵝事件等。2013年,深度強(qiáng)化學(xué)習(xí)算法初露鋒芒,在Atari游戲中取得了驚人的成果,到2015年,深度強(qiáng)化學(xué)習(xí)智能體達(dá)到了人類的游戲控制水平。深度強(qiáng)化學(xué)習(xí)算法從原始圖像的像素信息中學(xué)習(xí)游戲控制的智能策略,其游戲控制水平在一些視頻游戲中超過(guò)了人類玩家。深度強(qiáng)化學(xué)習(xí)算法在智力游戲領(lǐng)域展現(xiàn)了強(qiáng)大的決策能力和學(xué)習(xí)能力。2016年,Google公司DeepMind團(tuán)隊(duì)的研究人員在頂級(jí)期刊Nature推出AlphaGo,該智能程序戰(zhàn)勝了圍棋世界冠軍,震撼了全世界。2022年,人工智能公司OpenAI通過(guò)自然語(yǔ)言處理工具和深度強(qiáng)化學(xué)習(xí)算法,學(xué)習(xí)和理解人類語(yǔ)言,研發(fā)的聊天機(jī)器人程序ChatGPT(Chat Generative Pre-trained Transformer)震驚了世界。ChatGPT能像人類一樣聊天交流、撰寫(xiě)郵件、翻譯語(yǔ)言、編寫(xiě)代碼、撰寫(xiě)論文等。人類為了處理所面對(duì)的諸多復(fù)雜系統(tǒng)問(wèn)題,寄希望于深度強(qiáng)化學(xué)習(xí),并設(shè)計(jì)出強(qiáng)大的決策智能體,輔助人類完成復(fù)雜智能決策,適應(yīng)多變、動(dòng)態(tài)且隨機(jī)的復(fù)雜環(huán)境。近年來(lái),人工智能技術(shù)和算法的蓬勃發(fā)展極大拓展了智能算法的應(yīng)用范圍。人們能夠更加便捷地分析和研究圖數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù),特別是機(jī)器學(xué)習(xí)算法能有效地挖掘圖數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù)的結(jié)構(gòu)信息和語(yǔ)義信息。圖嵌入、網(wǎng)絡(luò)嵌入、圖機(jī)器學(xué)習(xí)和圖深度學(xué)習(xí)等機(jī)器學(xué)習(xí)算法為復(fù)雜圖和復(fù)雜網(wǎng)絡(luò)相關(guān)的問(wèn)題和智能決策任務(wù)提供了強(qiáng)大的技術(shù)支持。圖神經(jīng)網(wǎng)絡(luò)算法融合諸多圖機(jī)器學(xué)習(xí)和圖深度學(xué)習(xí)技術(shù),是分析圖數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù)的高效且通用框架,是提取圖結(jié)構(gòu)信息和圖語(yǔ)義信息的有效工具,是探索復(fù)雜智能決策的重要工具和方法。圖神經(jīng)網(wǎng)絡(luò)模型針對(duì)圖數(shù)據(jù)專門(mén)設(shè)計(jì)了很多操作算子,處理和分析不同類型的圖數(shù)據(jù)和網(wǎng)絡(luò)動(dòng)力學(xué)過(guò)程,為度量、預(yù)警、預(yù)測(cè)和控制復(fù)雜系統(tǒng)結(jié)構(gòu)特征和演化特征提供新思路和新方法。圖強(qiáng)化學(xué)習(xí)融合圖神經(jīng)網(wǎng)絡(luò)模型和深度強(qiáng)化學(xué)習(xí)模型,拓展圖或網(wǎng)絡(luò)相關(guān)復(fù)雜問(wèn)題的求解思路和分析方法,具有較大的發(fā)展前景和應(yīng)用價(jià)值。本書(shū)內(nèi)容安排圖強(qiáng)化學(xué)習(xí)涵蓋了很多人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)相關(guān)理論、方法和技術(shù)。本書(shū)用三大部分簡(jiǎn)要介紹圖強(qiáng)化學(xué)習(xí)相關(guān)的理論、方法和應(yīng)用。第一部分:圖強(qiáng)化學(xué)習(xí)研究對(duì)象復(fù)雜系統(tǒng)、圖和網(wǎng)絡(luò)是圖強(qiáng)化學(xué)習(xí)的主要研究對(duì)象。復(fù)雜系統(tǒng)是復(fù)雜決策問(wèn)題的背景和來(lái)源。圖強(qiáng)化學(xué)習(xí)主要解決復(fù)雜系統(tǒng)中圖相關(guān)的決策問(wèn)題。一般而言,復(fù)雜問(wèn)題背后都有一個(gè)復(fù)雜系統(tǒng)。復(fù)雜系統(tǒng)相關(guān)的理論和方法對(duì)圖強(qiáng)化學(xué)習(xí)方法具有引導(dǎo)和啟示作用。復(fù)雜圖和復(fù)雜網(wǎng)絡(luò)方法是表示和研究復(fù)雜系統(tǒng)的常用方法。圖論作為古老的數(shù)學(xué)學(xué)科,一直以來(lái)都是專業(yè)人員的研究領(lǐng)域,科學(xué)家們積累了大量的圖理論和方法。圖論相關(guān)的理論和方法為復(fù)雜社會(huì)系統(tǒng)、復(fù)雜物理系統(tǒng)和復(fù)雜生物系統(tǒng)的研究提供了思想源泉。近年來(lái),復(fù)雜網(wǎng)絡(luò)方法飛速發(fā)展,在不同學(xué)科和領(lǐng)域取得了耀眼的成績(jī)。在一些復(fù)雜問(wèn)題和復(fù)雜系統(tǒng)中,復(fù)雜網(wǎng)絡(luò)分析占據(jù)重要地位,是大數(shù)據(jù)時(shí)代中多源異構(gòu)數(shù)據(jù)分析的有效方法,是各個(gè)領(lǐng)域?qū)<覍W(xué)者審視各自領(lǐng)域內(nèi)問(wèn)題的新工具和新視角。在現(xiàn)實(shí)世界中,圖相關(guān)和網(wǎng)絡(luò)相關(guān)的問(wèn)題很多,如網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)識(shí)別、網(wǎng)絡(luò)免疫、傳染病防控等,都能用圖或網(wǎng)絡(luò)方法高效地求解。第二部分:圖強(qiáng)化學(xué)習(xí)的基礎(chǔ)知識(shí)圖機(jī)器學(xué)習(xí)和強(qiáng)化學(xué)習(xí)方法是圖強(qiáng)化學(xué)習(xí)的基礎(chǔ)方法。我們介紹圖嵌入、圖神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)方法。圖強(qiáng)化學(xué)習(xí)方法并非一個(gè)全新的研究范式和研究方法,是深度強(qiáng)化學(xué)習(xí)方法在圖數(shù)據(jù)或圖問(wèn)題中的拓展應(yīng)用。圖強(qiáng)化學(xué)習(xí)融合圖神經(jīng)網(wǎng)絡(luò)模型和深度強(qiáng)化學(xué)習(xí)模型,在復(fù)雜智能決策任務(wù)中表現(xiàn)出了巨大潛力。圖神經(jīng)網(wǎng)絡(luò)方法是圖嵌入和網(wǎng)絡(luò)嵌入方法的拓展,深度強(qiáng)化學(xué)習(xí)方法是強(qiáng)化學(xué)習(xí)的拓展。圖神經(jīng)網(wǎng)絡(luò)模型和深度強(qiáng)化學(xué)習(xí)模型作為機(jī)器學(xué)習(xí)領(lǐng)域兩大熱門(mén)研究領(lǐng)域,是人工智能和機(jī)器學(xué)習(xí)的前沿技術(shù),具有較大的發(fā)展?jié)摿ΑI羁汤斫夂驼莆請(qǐng)D神經(jīng)網(wǎng)絡(luò)和深度強(qiáng)化學(xué)習(xí)方法,是入門(mén)圖強(qiáng)化學(xué)習(xí)方法的基礎(chǔ)。一般而言,圖嵌入和網(wǎng)絡(luò)嵌入是淺層學(xué)習(xí),是理解圖神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)。圖神經(jīng)網(wǎng)絡(luò)模型具有可擴(kuò)展性和普適性,是圖數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù)分析最具潛力的研究方向。圖嵌入和網(wǎng)絡(luò)嵌入是圖機(jī)器學(xué)習(xí)的研究?jī)?nèi)容,將學(xué)習(xí)機(jī)制引入圖上的搜索問(wèn)題或其他問(wèn)題。相較于經(jīng)典的圖理論和復(fù)雜網(wǎng)絡(luò)分析方法,圖機(jī)器學(xué)習(xí)算法更適用于大規(guī)模圖數(shù)據(jù)和復(fù)雜圖或復(fù)雜網(wǎng)絡(luò)決策問(wèn)題。在圖強(qiáng)化學(xué)習(xí)中,圖神經(jīng)網(wǎng)絡(luò)模型作為特征提取和表示學(xué)習(xí)的主要模塊,是智能決策優(yōu)劣的關(guān)鍵。圖神經(jīng)網(wǎng)絡(luò)模型具有大量的參數(shù),強(qiáng)化學(xué)習(xí)算法的主要任務(wù)是更新和學(xué)習(xí)模型參數(shù)。如何有效地融合兩者的優(yōu)勢(shì),解決復(fù)雜圖或復(fù)雜網(wǎng)絡(luò)相關(guān)決策問(wèn)題,是圖強(qiáng)化學(xué)習(xí)的核心內(nèi)容。第三部分:圖強(qiáng)化學(xué)習(xí)模型框架和應(yīng)用實(shí)踐案例圖強(qiáng)化學(xué)習(xí)方法融合圖神經(jīng)網(wǎng)絡(luò)模型和深度強(qiáng)化學(xué)習(xí)模型。第三部分包括圖強(qiáng)化學(xué)習(xí)模型構(gòu)建框架和實(shí)現(xiàn)細(xì)節(jié)。圖和網(wǎng)絡(luò)作為圖強(qiáng)化學(xué)習(xí)的研究對(duì)象,是圖強(qiáng)化學(xué)習(xí)的基礎(chǔ)。一些圖相關(guān)的組合優(yōu)化問(wèn)題因?yàn)榻M合爆炸,屬于NP難問(wèn)題。因此,如何找到有效的解決辦法具有重要的研究?jī)r(jià)值和實(shí)用價(jià)值。我們將圖或網(wǎng)絡(luò)數(shù)據(jù)分析看作5個(gè)層層進(jìn)階的過(guò)程,依次為圖理論方法、復(fù)雜網(wǎng)絡(luò)分析方法、圖嵌入和網(wǎng)絡(luò)嵌入方法、圖神經(jīng)網(wǎng)絡(luò)方法、圖強(qiáng)化學(xué)習(xí)方法。在圖數(shù)據(jù)或網(wǎng)絡(luò)數(shù)據(jù)相關(guān)的決策問(wèn)題上,圖強(qiáng)化學(xué)習(xí)融合圖神經(jīng)網(wǎng)絡(luò)模型的表示學(xué)習(xí)能力和深度強(qiáng)化學(xué)習(xí)的決策優(yōu)化能力,具有非常大的研究?jī)r(jià)值和應(yīng)用潛力。本書(shū)適合人群* 高年級(jí)本科生* 專業(yè)碩士研究生* 機(jī)器學(xué)習(xí)愛(ài)好者* 強(qiáng)化學(xué)習(xí)愛(ài)好者關(guān)于作者謝文杰,男,湖南瀏陽(yáng)人,應(yīng)用數(shù)學(xué)博士,上海市晨光學(xué)者。現(xiàn)任華東理工大學(xué)商學(xué)院金融學(xué)系副教授、碩士研究生導(dǎo)師、金融物理研究中心成員,主要研究復(fù)雜金融網(wǎng)絡(luò)、圖強(qiáng)化學(xué)習(xí)、深度強(qiáng)化學(xué)習(xí)、系統(tǒng)風(fēng)險(xiǎn)管理,發(fā)表SCI/SSCI收錄論文40多篇,被引800余次。2016年獲上海市自然科學(xué)獎(jiǎng)二等獎(jiǎng)(4/5),主持完成4項(xiàng)國(guó)家或省部級(jí)科研項(xiàng)目。周煒星,男,浙江諸暨人。青年長(zhǎng)江學(xué)者、上海領(lǐng)軍人才、新世紀(jì)優(yōu)秀人才、上海市曙光學(xué)者、上海市青年科技啟明星。現(xiàn)任職華東理工大學(xué)商學(xué)院、數(shù)學(xué)學(xué)院,二級(jí)教授,博士生導(dǎo)師,金融物理研究中心主任,兼任中國(guó)管理科學(xué)與工程學(xué)會(huì)理事、金融計(jì)量與風(fēng)險(xiǎn)管理分會(huì)副理事長(zhǎng),中國(guó)系統(tǒng)工程學(xué)會(huì)理事、金融系統(tǒng)工程專業(yè)委員會(huì)副主任,中國(guó)工業(yè)統(tǒng)計(jì)教學(xué)研究會(huì)金融科技大數(shù)據(jù)分會(huì)副理事長(zhǎng),中國(guó)數(shù)量經(jīng)濟(jì)學(xué)會(huì)經(jīng)濟(jì)復(fù)雜性專業(yè)委員會(huì)副理事長(zhǎng),中國(guó)雙法研究會(huì)理事、能源經(jīng)濟(jì)與管理研究分會(huì)常務(wù)理事,中國(guó)復(fù)雜性科學(xué)學(xué)會(huì)副理事長(zhǎng)。擔(dān)任《計(jì)量經(jīng)濟(jì)學(xué)報(bào)》、Journal of International Financial Markets, Institutions & Money(JIFMIM)、Financial Innovation、Fractals、Frontiers in Physics、 Fluctuation and Noise Letters、Entropy、Journal of Network Theory in Finance、Reports in Advances of Physical Sciences等國(guó)內(nèi)外期刊的編委。主要從事金融物理學(xué)、經(jīng)濟(jì)物理學(xué)和社會(huì)經(jīng)濟(jì)系統(tǒng)復(fù)雜性研究,以及相關(guān)領(lǐng)域的大數(shù)據(jù)分析。先后主持包括4項(xiàng)國(guó)家自然科學(xué)基金在內(nèi)的10余項(xiàng)國(guó)家級(jí)和省部級(jí)項(xiàng)目。出版學(xué)術(shù)專著《金融物理學(xué)導(dǎo)論》1部,發(fā)表SCI/SSCI收錄論文210多篇,他引7000余次,11篇論文入選ESI高被引論文,H指數(shù)47,連續(xù)8年進(jìn)入愛(ài)思唯爾發(fā)布的中國(guó)高被引學(xué)者(數(shù)學(xué))榜單。論文主要發(fā)表在JIFMIM、JEBO和QF等主流金融經(jīng)濟(jì)期刊及PNAS、Rep. Prog. Phys.等重要交叉學(xué)科期刊上。獲2016年度上海市自然科學(xué)二等獎(jiǎng)(1/5)。致謝本書(shū)模板來(lái)源于ElegantBook,感謝制作者的辛苦付出!感謝Open AI Baselines社區(qū),感謝Stable-Baselines社區(qū),感謝NetworkX社區(qū),感謝PyTorch-Geometric社區(qū)。感謝清華大學(xué)出版社編輯申美瑩老師和相關(guān)工作人員。本書(shū)的參考資料和參考文獻(xiàn)可掃描下方二維碼獲取。
謝文杰 周煒星2023.09
謝文杰,男,湖南瀏陽(yáng)人,應(yīng)用數(shù)學(xué)博士,上海市晨光學(xué)者。現(xiàn)任職華東理工大學(xué)商學(xué)院金融學(xué)系副教授、碩士研究生導(dǎo)師、金融物理研究中心成員,主要研究復(fù)雜金融網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)、深度強(qiáng)化學(xué)習(xí)、金融風(fēng)險(xiǎn)管理等。獲2016年度上海市自然科學(xué)獎(jiǎng)二等獎(jiǎng)(4/5),主持完成4項(xiàng)國(guó)家或省部級(jí)科研項(xiàng)目。
周煒星,男,浙江諸暨人。青年長(zhǎng)江學(xué)者、上海領(lǐng)軍人才、新世紀(jì)優(yōu)秀人才、上海市曙光學(xué)者、上海市青年科技啟明星。現(xiàn)任職于華東理工大學(xué)商學(xué)院、數(shù)學(xué)學(xué)院,二級(jí)教授,博士生導(dǎo)師,金融物理研究中心主任。現(xiàn)兼任中國(guó)優(yōu)選法統(tǒng)籌法與經(jīng)濟(jì)數(shù)學(xué)研究會(huì)理事、風(fēng)險(xiǎn)管理分會(huì)副理事長(zhǎng),中國(guó)系統(tǒng)工程學(xué)會(huì)理事、金融系統(tǒng)工程專業(yè)委員會(huì)副主任,管理科學(xué)與工程學(xué)會(huì)理事、金融計(jì)量與風(fēng)險(xiǎn)管理分會(huì)副理事長(zhǎng),中國(guó)工業(yè)統(tǒng)計(jì)教學(xué)研究會(huì)金融科技與大數(shù)據(jù)技術(shù)分會(huì)副理事長(zhǎng),中國(guó)數(shù)量經(jīng)濟(jì)學(xué)會(huì)經(jīng)濟(jì)復(fù)雜性專業(yè)委員會(huì)副理事長(zhǎng),中國(guó)復(fù)雜性科學(xué)學(xué)會(huì)副理事長(zhǎng)。主要從事金融物理學(xué)、經(jīng)濟(jì)物理學(xué)和社會(huì)經(jīng)濟(jì)系統(tǒng)復(fù)雜性研究,以及相關(guān)領(lǐng)域大數(shù)據(jù)分析。
第一部分 圖強(qiáng)化學(xué)習(xí)研究對(duì)象第1章 圖與復(fù)雜系統(tǒng) 31.1 為什么是圖 31.1.1 圖的普遍性 31.1.2 圖的表示性 41.1.3 圖的抽象性 41.2 圖與復(fù)雜系統(tǒng) 51.2.1 復(fù)雜系統(tǒng)定義 51.2.2 復(fù)雜系統(tǒng)的圖表示 61.2.3 復(fù)雜系統(tǒng)問(wèn)題與圖 71.3 復(fù)雜系統(tǒng)與強(qiáng)化學(xué)習(xí) 71.3.1 強(qiáng)化學(xué)習(xí) 81.3.2 智能決策 81.3.3 基于強(qiáng)化學(xué)習(xí)的智能決策 91.4 復(fù)雜系統(tǒng)與智能決策 91.4.1 復(fù)雜金融系統(tǒng)風(fēng)險(xiǎn)管理問(wèn)題 101.4.2 復(fù)雜社會(huì)系統(tǒng)輿情傳播和虛假信息防控問(wèn)題 121.5 應(yīng)用實(shí)踐 121.5.1 圖數(shù)據(jù)集 131.5.2 圖可視化和分析工具 13第1章習(xí)題 14第2章 圖論基礎(chǔ) 152.1 圖論的起源 152.1.1 提出問(wèn)題 162.1.2 形式化問(wèn)題 162.1.3 求解問(wèn)題 162.2 圖論的發(fā)展 172.2.1 隨機(jī)圖理論 172.2.2 拓?fù)鋱D論 172.2.3 幾何圖論 182.2.4 代數(shù)圖論 182.3 圖論的概念 182.3.1 圖定義 192.3.2 節(jié)點(diǎn) 192.3.3 連邊 192.3.4 鄰接矩陣 202.3.5 度 202.3.6 鄰域 202.3.7 途徑 212.3.8 最短路 222.3.9 帶自環(huán)圖 232.3.10 圈 232.3.11 子圖 242.3.12 連通分量 242.3.13 最大連通子圖 252.3.14 簡(jiǎn)單圖 252.3.15 平面圖 262.3.16 對(duì)偶圖 262.3.17 樹(shù) 282.4 經(jīng)典圖示例 292.4.1 完全圖 292.4.2 二部圖 302.4.3 彼得森圖 312.4.4 星狀圖 312.4.5 網(wǎng)格圖 322.4.6 正十二面體圖 332.5 經(jīng)典問(wèn)題示例 332.5.1 圖同構(gòu) 332.5.2 TSP問(wèn)題 342.5.3 最小點(diǎn)覆蓋問(wèn)題 352.5.4 最大割問(wèn)題 352.5.5 最大獨(dú)立集問(wèn)題 352.6 可視圖 352.6.1 可視圖算法 362.6.2 水平可視圖算法 362.6.3 水平可視圖度分布 372.6.4 有向水平可視圖度分布 392.7 應(yīng)用實(shí)踐 41第2章習(xí)題 42第3章 圖與復(fù)雜網(wǎng)絡(luò) 443.1 復(fù)雜網(wǎng)絡(luò)背景 443.1.1 復(fù)雜網(wǎng)絡(luò)簡(jiǎn)介 443.1.2 復(fù)雜網(wǎng)絡(luò)簡(jiǎn)史 453.1.3 復(fù)雜網(wǎng)絡(luò)應(yīng)用 453.1.4 復(fù)雜網(wǎng)絡(luò)分析概述 463.1.5 網(wǎng)絡(luò)表示 473.2 節(jié)點(diǎn)指標(biāo) 483.2.1 節(jié)點(diǎn)的度 483.2.2 節(jié)點(diǎn)的強(qiáng)度 493.2.3 聚簇系數(shù) 493.2.4 接近中心性 503.2.5 介數(shù)中心性 503.2.6 特性向量中心性 503.2.7 PageRank中心性 513.2.8 權(quán)威值得分和樞紐值得分 513.2.9 k核中心性 523.3 網(wǎng)絡(luò)連邊指標(biāo) 533.3.1 連邊權(quán)重 533.3.2 顯著性測(cè)度 533.3.3 邊介數(shù)中心性 553.3.4 共同鄰居數(shù) 553.3.5 網(wǎng)絡(luò)關(guān)系A(chǔ)damic/Adar量 563.3.6 網(wǎng)絡(luò)關(guān)系Resource Allocation量 563.4 網(wǎng)絡(luò)模體結(jié)構(gòu) 563.4.1 模體的定義 563.4.2 無(wú)向網(wǎng)絡(luò)的四元模體 563.4.3 有向網(wǎng)絡(luò)的三元模體 573.4.4 有向網(wǎng)絡(luò)三元模體與節(jié)點(diǎn)位置結(jié)構(gòu) 583.5 網(wǎng)絡(luò)模塊結(jié)構(gòu) 593.5.1 網(wǎng)絡(luò)模塊定義 603.5.2 模塊內(nèi)度 603.5.3 參與系數(shù) 613.5.4 模塊外度 613.5.5 模塊穩(wěn)定性 613.6 網(wǎng)絡(luò)全局結(jié)構(gòu) 623.6.1 網(wǎng)絡(luò)密度 623.6.2 網(wǎng)絡(luò)同配性和異配性 633.6.3 網(wǎng)絡(luò)穩(wěn)健性 633.6.4 網(wǎng)絡(luò)效率 643.7 復(fù)雜網(wǎng)絡(luò)分類 653.7.1 異質(zhì)網(wǎng)絡(luò) 653.7.2 多層網(wǎng)絡(luò) 663.7.3 多重網(wǎng)絡(luò) 663.7.4 超圖網(wǎng)絡(luò) 663.7.5 動(dòng)態(tài)網(wǎng)絡(luò) 673.8 復(fù)雜網(wǎng)絡(luò)任務(wù) 683.8.1 節(jié)點(diǎn)任務(wù) 683.8.2 網(wǎng)絡(luò)連邊任務(wù) 683.8.3 全局網(wǎng)絡(luò)任務(wù) 693.9 復(fù)雜網(wǎng)絡(luò)生成 693.9.1 隨機(jī)網(wǎng)絡(luò)模型 693.9.2 隨機(jī)模塊模型 703.9.3 優(yōu)先連接模型 723.9.4 同質(zhì)性偏好連接模型 733.9.5 異質(zhì)性或互補(bǔ)性偏好連接模型 743.9.6 機(jī)器學(xué)習(xí)或智能算法類模型 743.10 網(wǎng)絡(luò)建模實(shí)例 743.10.1 效用函數(shù) 753.10.2 成本函數(shù) 763.10.3 決策函數(shù) 773.11 應(yīng)用實(shí)踐 79第3章習(xí)題 81第二部分 圖強(qiáng)化學(xué)習(xí)基礎(chǔ)知識(shí)第4章 圖嵌入與網(wǎng)絡(luò)嵌入 854.1 圖的特征表示 854.1.1 多尺度圖特征表示 854.1.2 如何表示復(fù)雜系統(tǒng) 864.1.3 如何表示復(fù)雜圖或復(fù)雜網(wǎng)絡(luò) 864.1.4 如何表示圖節(jié)點(diǎn) 864.1.5 如何表示圖連邊 874.1.6 多層次的圖特征表示方法 874.2 圖與機(jī)器學(xué)習(xí) 884.2.1 機(jī)器學(xué)習(xí)簡(jiǎn)介 884.2.2 機(jī)器學(xué)習(xí)分類 884.3 機(jī)器學(xué)習(xí)框架 894.3.1 框架簡(jiǎn)介 894.3.2 目標(biāo)函數(shù) 894.3.3 優(yōu)化參數(shù) 904.4 自編碼器框架 904.4.1 自編碼器模型介紹 904.4.2 簡(jiǎn)單應(yīng)用 914.5 機(jī)器學(xué)習(xí)模型 914.5.1 典型的數(shù)據(jù)類型 924.5.2 多層感知機(jī)網(wǎng)絡(luò) 924.5.3 卷積神經(jīng)網(wǎng)絡(luò) 924.5.4 循環(huán)神經(jīng)網(wǎng)絡(luò) 944.6 圖表示學(xué)習(xí) 944.6.1 圖表示學(xué)習(xí)的一般框架 944.6.2 編碼-解碼框架 954.6.3 編碼器 954.6.4 解碼器 964.6.5 模型優(yōu)化 974.7 基于矩陣分解的圖嵌入 974.7.1 圖分解方法 984.7.2 GraRep方法 984.7.3 HOPE方法 994.8 基于隨機(jī)游走的圖嵌入 994.8.1 DeepWalk算法 994.8.2 Node2Vec方法 1024.9 可解釋性圖嵌入 1044.9.1 問(wèn)題背景介紹 1054.9.2 天然氣貿(mào)易決策模型 1054.9.3 效用函數(shù) 1064.9.4 收益函數(shù) 1064.9.5 成本函數(shù) 1064.9.6 機(jī)器學(xué)習(xí)模型損失函數(shù) 1074.9.7 模型優(yōu)化 1084.10 應(yīng)用實(shí)踐 108第4章習(xí)題 109第5章 圖神經(jīng)網(wǎng)絡(luò) 1105.1 圖神經(jīng)網(wǎng)絡(luò)介紹 1105.2 圖神經(jīng)網(wǎng)絡(luò)特征 1115.2.1 圖數(shù)據(jù)特征 1115.2.2 端到端學(xué)習(xí)特征 1125.2.3 歸納學(xué)習(xí)特征 1125.3 圖神經(jīng)網(wǎng)絡(luò)框架 1135.3.1 圖神經(jīng)網(wǎng)絡(luò)框架簡(jiǎn)介 1135.3.2 消息傳遞神經(jīng)網(wǎng)絡(luò)框架 1135.3.3 鄰域信息匯聚函數(shù) 1145.3.4 信息更新函數(shù) 1145.3.5 圖信息池化函數(shù) 1155.4 圖卷積神經(jīng)網(wǎng)絡(luò) 1155.4.1 譜圖理論介紹 1155.4.2 拉普拉斯矩陣定義 1165.4.3 隨機(jī)游走歸一化拉普拉斯矩陣 1165.4.4 對(duì)稱歸一化拉普拉斯矩陣 1165.4.5 拉普拉斯矩陣簡(jiǎn)單應(yīng)用 1175.4.6 圖信號(hào)處理 1185.4.7 圖傅里葉變換 1185.4.8 圖傅里葉逆變換 1195.4.9 圖濾波器 1205.4.10 圖譜濾波 1215.4.11 K階截?cái)喽囗?xiàng)式濾波算子 1235.4.12 切比雪夫多項(xiàng)式濾波算子 1245.4.13 圖卷積神經(jīng)網(wǎng)絡(luò) 1255.5 圖注意力神經(jīng)網(wǎng)絡(luò) 1275.5.1 注意力機(jī)制簡(jiǎn)介 1275.5.2 基于注意力機(jī)制的信息匯聚函數(shù) 1275.5.3 多頭注意力模型框架 1295.6 圖網(wǎng)絡(luò) 1295.6.1 更新連邊信息 1305.6.2 匯聚連邊信息 1305.6.3 更新節(jié)點(diǎn)信息 1305.6.4 匯聚全局信息 1305.7 應(yīng)用實(shí)踐 131第5章習(xí)題 133第6章 強(qiáng)化學(xué)習(xí)基礎(chǔ) 1346.1 強(qiáng)化學(xué)習(xí)背景 1346.1.1 強(qiáng)化學(xué)習(xí)與圖神經(jīng)網(wǎng)絡(luò) 1356.1.2 強(qiáng)化學(xué)習(xí)與序貫決策問(wèn)題 1356.1.3 強(qiáng)化學(xué)習(xí)求解序貫決策問(wèn)題 1356.1.4 強(qiáng)化學(xué)習(xí)特征 1366.2 強(qiáng)化學(xué)習(xí)與圖 1366.2.1 圖上決策問(wèn)題 1366.2.2 強(qiáng)化學(xué)習(xí)與圖上決策問(wèn)題 1376.3 強(qiáng)化學(xué)習(xí)概念 1386.3.1 馬爾可夫決策過(guò)程 1386.3.2 狀態(tài)和狀態(tài)空間 1396.3.3 動(dòng)作和動(dòng)作空間 1396.3.4 狀態(tài)轉(zhuǎn)移函數(shù) 1406.3.5 即時(shí)回報(bào)函數(shù) 1406.3.6 回報(bào)折扣系數(shù) 1406.3.7 策略函數(shù) 1416.3.8 狀態(tài)值函數(shù) 1416.3.9 狀態(tài)--動(dòng)作值函數(shù) 1426.4 蒙特卡洛方法 1426.4.1 蒙特卡洛采樣 1436.4.2 狀態(tài)值函數(shù)估計(jì) 1436.4.3 狀態(tài)--動(dòng)作值函數(shù)估計(jì) 1436.4.4 值函數(shù)增量更新方法 1446.4.5 蒙特卡洛強(qiáng)化學(xué)習(xí)偽代碼 1466.5 時(shí)序差分學(xué)習(xí) 1476.5.1 時(shí)序差分簡(jiǎn)介 1486.5.2 Q--learning算法簡(jiǎn)介 1496.5.3 Q--learning算法偽代碼 1506.5.4 SARSA算法簡(jiǎn)介 1516.5.5 SARSA算法偽代碼 1516.5.6 SARSA與Q--learning對(duì)比分析 1526.6 策略梯度方法 1536.6.1 軌跡概率 1536.6.2 策略梯度 1546.6.3 目標(biāo)函數(shù) 1546.6.4 蒙特卡洛策略梯度算法 1556.6.5 REINFORCE算法偽代碼 1566.7 強(qiáng)化學(xué)習(xí)分類 1566.7.1 值函數(shù)方法和策略函數(shù)方法 1576.7.2 On-policy 和 Off-policy強(qiáng)化學(xué)習(xí) 1576.7.3 Online 和 Offline強(qiáng)化學(xué)習(xí) 1576.7.4 Model-based 和 Model-free強(qiáng)化學(xué)習(xí) 1576.8 應(yīng)用實(shí)踐 1586.8.1 狀態(tài)空間 1586.8.2 動(dòng)作空間 1596.8.3 狀態(tài)轉(zhuǎn)換 1596.8.4 即時(shí)獎(jiǎng)勵(lì) 1596.8.5 折扣系數(shù) 1606.8.6 狀態(tài)價(jià)值函數(shù) 1606.8.7 最優(yōu)策略函數(shù) 161第6章習(xí)題 161第7章 深度強(qiáng)化學(xué)習(xí) 1637.1 深度強(qiáng)化學(xué)習(xí)背景 1637.1.1 深度學(xué)習(xí) 1637.1.2 深度強(qiáng)化學(xué)習(xí) 1647.2 深度Q網(wǎng)絡(luò)方法 1657.2.1 Q表格 1657.2.2 軌跡采樣 1657.2.3 深度神經(jīng)網(wǎng)絡(luò)近似策略函數(shù) 1667.2.4 TD目標(biāo) 1677.2.5 TD誤差 1677.2.6 目標(biāo)函數(shù) 1677.2.7 目標(biāo)函數(shù)梯度 1687.2.8 深度神經(jīng)網(wǎng)絡(luò)參數(shù)更新 1687.2.9 最優(yōu)策略 1697.3 深度Q網(wǎng)絡(luò)算法關(guān)鍵技術(shù) 1697.3.1 -貪心策略 1697.3.2 目標(biāo)網(wǎng)絡(luò) 1707.3.3 經(jīng)驗(yàn)回放 1707.3.4 DQN算法偽代碼 1707.4 深度Q網(wǎng)絡(luò)算法面臨的挑戰(zhàn) 1717.4.1 離策略 1727.4.2 自舉 1727.4.3 函數(shù)近似 1727.5 深度策略梯度方法 1727.5.1 深度Q神經(jīng)網(wǎng)絡(luò)算法的局限 1727.5.2 深度策略梯度算法簡(jiǎn)介 1737.6 深度策略梯度算法關(guān)鍵技術(shù) 1747.6.1 策略梯度估計(jì) 1747.6.2 策略函數(shù)參數(shù)更新 1757.6.3 優(yōu)勢(shì)函數(shù)估計(jì) 1757.6.4 狀態(tài)值函數(shù)估計(jì) 1767.6.5 深度策略梯度算法偽代碼 1777.7 行動(dòng)者--評(píng)論家方法 1787.7.1 AC(Actor--Critic)算法簡(jiǎn)介 1787.7.2 A2C算法簡(jiǎn)介 1787.7.3 A2C算法偽代碼 1797.8 應(yīng)用與實(shí)踐的通用框架 1807.8.1 馬爾可夫決策過(guò)程模型 1807.8.2 狀態(tài)空間 1817.8.3 動(dòng)作空間 1817.8.4 狀態(tài)轉(zhuǎn)移函數(shù) 1817.8.5 即時(shí)獎(jiǎng)勵(lì)函數(shù) 1817.8.6 折扣系數(shù) 1827.9 基于策略梯度算法的應(yīng)用與實(shí)踐 1827.9.1 復(fù)雜環(huán)境模型 1827.9.2 深度學(xué)習(xí)模型 1827.9.3 深度強(qiáng)化學(xué)習(xí)算法 1837.9.4 智能體模型 1857.9.5 深度強(qiáng)化學(xué)習(xí)模型訓(xùn)練結(jié)果 1867.10 基于深度Q網(wǎng)絡(luò)算法的應(yīng)用與實(shí)踐 1877.10.1 游戲環(huán)境狀態(tài)空間 1877.10.2 智能體動(dòng)作空間 1887.10.3 游戲即時(shí)獎(jiǎng)勵(lì) 1887.10.4 游戲狀態(tài)轉(zhuǎn)移模型 1897.10.5 游戲環(huán)境模型 1897.10.6 游戲策略模型 1897.10.7 深度強(qiáng)化學(xué)習(xí)算法 1897.10.8 模型訓(xùn)練分析 1907.10.9 模型結(jié)果分析 1917.10.10 模型改進(jìn)分析 192第7章習(xí)題 194第三部分 圖強(qiáng)化學(xué)習(xí)模型框架和應(yīng)用實(shí)踐第8章 圖強(qiáng)化學(xué)習(xí)基礎(chǔ) 1978.1 圖強(qiáng)化學(xué)習(xí)背景 1978.1.1 多學(xué)科交叉融合 1978.1.2 多學(xué)科關(guān)聯(lián)關(guān)系圖 1988.1.3 圖與網(wǎng)絡(luò)的基礎(chǔ)理論和方法 1998.1.4 圖與機(jī)器學(xué)習(xí)的基礎(chǔ)理論和方法 1998.1.5 圖神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)理論和方法 1998.1.6 深度強(qiáng)化學(xué)習(xí)的基礎(chǔ)理論和方法 1998.2 圖神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí) 2008.2.1 圖神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)的融合 2008.2.2 圖強(qiáng)化學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的區(qū)別 2018.2.3 圖神經(jīng)網(wǎng)絡(luò)提升強(qiáng)化學(xué)習(xí)性能 2018.2.4 強(qiáng)化學(xué)習(xí)提升圖神經(jīng)網(wǎng)絡(luò)性能 2028.3 圖強(qiáng)化學(xué)習(xí)模型概要 2028.3.1 復(fù)雜系統(tǒng) 2038.3.2 環(huán)境模型 2038.3.3 圖和網(wǎng)絡(luò) 2038.3.4 深度神經(jīng)網(wǎng)絡(luò) 2038.3.5 深度強(qiáng)化學(xué)習(xí) 2048.3.6 優(yōu)化算法 2048.3.7 圖強(qiáng)化學(xué)習(xí)框架概要 2058.4 圖強(qiáng)化學(xué)習(xí)框架硬件層 2068.4.1 中央處理器 2068.4.2 圖形處理器 2068.4.3 張量處理器 2068.4.4 其他處理器 2078.5 圖強(qiáng)化學(xué)習(xí)框架平臺(tái)層 2078.5.1 深度學(xué)習(xí)平臺(tái)簡(jiǎn)介 2078.5.2 深度學(xué)習(xí)平臺(tái):TensorFlow 2078.5.3 深度學(xué)習(xí)平臺(tái):PyTorch 2088.5.4 深度學(xué)習(xí)其他平臺(tái) 2088.6 圖強(qiáng)化學(xué)習(xí)框架算法層 2088.6.1 深度強(qiáng)化學(xué)習(xí)框架簡(jiǎn)介 2098.6.2 深度強(qiáng)化學(xué)習(xí)框架:Stable--baselines 2098.6.3 深度強(qiáng)化學(xué)習(xí)框架:Reinforcement Learning Coach 2108.6.4 深度圖神經(jīng)網(wǎng)絡(luò)框架簡(jiǎn)介 2108.6.5 深度圖神經(jīng)網(wǎng)絡(luò)框架:PyTorch Geometric 2108.6.6 深度圖神經(jīng)網(wǎng)絡(luò)框架:Deep Graph Library 2118.7 圖強(qiáng)化學(xué)習(xí)框架應(yīng)用層 2118.8 圖強(qiáng)化學(xué)習(xí)建模 2118.8.1 圖強(qiáng)化學(xué)習(xí)與馬爾可夫決策過(guò)程 2118.8.2 圖強(qiáng)化學(xué)習(xí)建模流程 2128.8.3 問(wèn)題提出 2128.8.4 環(huán)境建模 2138.8.5 智能體建模 2138.8.6 模型訓(xùn)練 2148.8.7 模型測(cè)試 2148.9 應(yīng)用實(shí)踐 2148.9.1 深度強(qiáng)化學(xué)習(xí)模塊 2148.9.2 圖神經(jīng)網(wǎng)絡(luò)模塊 2158.9.3 其他圖神經(jīng)網(wǎng)絡(luò)模塊 217第8章習(xí)題 218第9章 圖強(qiáng)化學(xué)習(xí)應(yīng)用 2199.1 圖強(qiáng)化學(xué)習(xí)模型框架 2199.2 圖強(qiáng)化學(xué)習(xí)模塊概述 2209.2.1 復(fù)雜環(huán)境模塊 2219.2.2 圖神經(jīng)網(wǎng)絡(luò)模塊 2219.2.3 強(qiáng)化學(xué)習(xí)模塊 2219.2.4 智能體模塊 2219.2.5 工具類模塊 2229.2.6 其他模塊 2229.3 復(fù)雜環(huán)境模塊 2229.3.1 環(huán)境模塊定義 2229.3.2 環(huán)境模塊定義代碼 2229.3.3 基于圖的環(huán)境模塊定義 2249.3.4 基于圖的環(huán)境模塊重置定義 2249.3.5 基于圖的環(huán)境狀態(tài)轉(zhuǎn)移定義 2249.4 圖神經(jīng)網(wǎng)絡(luò)模塊 2259.4.1 圖神經(jīng)網(wǎng)絡(luò)模型選擇 2259.4.2 圖神經(jīng)網(wǎng)絡(luò)模塊代碼示例 2259.4.3 圖神經(jīng)網(wǎng)絡(luò)模塊代碼解析 2269.5 強(qiáng)化學(xué)習(xí)模塊 2279.5.1 強(qiáng)化學(xué)習(xí)算法選擇 2279.5.2 強(qiáng)化學(xué)習(xí)算法示例代碼 2279.5.3 強(qiáng)化學(xué)習(xí)算法示例代碼解析 2289.6 智能體模塊 2299.6.1 智能體模塊示例代碼 2299.6.2 智能體模塊示例代碼解析 2309.6.3 模型訓(xùn)練結(jié)果 2319.7 工具類模塊 2329.8 圖強(qiáng)化學(xué)習(xí)模型改進(jìn) 2329.8.1 模型改進(jìn)目標(biāo) 2339.8.2 模型改進(jìn)方向 2339.8.3 圖神經(jīng)網(wǎng)絡(luò)模型改進(jìn)代碼示例 2349.8.4 圖神經(jīng)網(wǎng)絡(luò)模塊代碼解析 2349.8.5 強(qiáng)化學(xué)習(xí)算法改進(jìn) 234第9章習(xí)題 235第10章 圖強(qiáng)化學(xué)習(xí)展望 23710.1 圖強(qiáng)化學(xué)習(xí)概括 23710.1.1 方法的起源 23710.1.2 方法的發(fā)展 23810.1.3 層次關(guān)系 23810.2 圖強(qiáng)化學(xué)習(xí)特色 23810.2.1 學(xué)科交叉性 23910.2.2 系統(tǒng)復(fù)雜性 23910.2.3 框架普適性 23910.3 圖數(shù)據(jù)分析方法 23910.3.1 數(shù)值分析方法 24010.3.2 仿真模擬方法 24010.3.3 優(yōu)化方法 24110.3.4 數(shù)據(jù)驅(qū)動(dòng)方法 24110.3.5 圖強(qiáng)化學(xué)習(xí)方法 24110.4 圖強(qiáng)化學(xué)習(xí)應(yīng)用 24210.4.1 網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)識(shí)別 24210.4.2 網(wǎng)絡(luò)關(guān)鍵連邊識(shí)別 24210.4.3 知識(shí)圖譜 24310.4.4 組合優(yōu)化 24310.5 圖神經(jīng)網(wǎng)絡(luò)展望 24310.5.1 人工智能的新引擎 24310.5.2 圖神經(jīng)網(wǎng)絡(luò)進(jìn)展 24410.5.3 圖神經(jīng)網(wǎng)絡(luò)的可解釋性 24410.6 深度強(qiáng)化學(xué)習(xí)展望 24510.6.1 自動(dòng)強(qiáng)化學(xué)習(xí) 24610.6.2 分層強(qiáng)化學(xué)習(xí) 24610.6.3 多智能體強(qiáng)化學(xué)習(xí) 24610.7 圖強(qiáng)化學(xué)習(xí)前沿領(lǐng)域 24710.7.1 圖上的組合優(yōu)化 24710.7.2 圖理論應(yīng)用的前沿 24710.7.3 交叉研究的前沿 24810.8 人工智能三大學(xué)派融合 24810.8.1 人工智能的三大學(xué)派 24810.8.2 圖強(qiáng)化學(xué)習(xí)融合三大學(xué)派 249第10章習(xí)題 250