圖分析與圖機器學習:原理、算法與實踐 [美]維克多·李 [荷]阮福堅 [美]亞歷山大·托馬斯
定 價:¥89
中 教 價:¥53.40 (6.00折)
庫 存 數: 37
本書的目標是向你介紹圖數據結構、圖分析和圖機器學習的概念、技術和工具。每章的開頭都列出了目標,大致分為三個方面:學習圖分析和機器學習的概念;用圖分析解決特定問題;了解如何使用GSQL查詢語言和TigerGraph圖平臺。首先介紹圖數據的基本概念,然后通過連接、分析、學習三大部分深入講解一些圖算法和機器學習技術。
隨著圖形數據庫的迅速崛起,企業正在實施高級分析和機器學習解決方案,以幫助推動業務成果。本實用指南向數據科學家、數據工程師、架構師和業務分析師展示了如何使用領先的圖形數據庫模型TigerGraph開始使用圖形數據庫。你將探索從互聯數據中獲取價值的三階段方法:連接、分析和學習。三位作者介紹了涵蓋多種當代業務需求的真實使用案例。通過使用TigerGraph Cloud進行實踐練習,你將很快熟練掌握為企業設計和管理高級分析和機器學習解決方案的方法。
前言
目標本書的目標是向你介紹圖數據結構、圖分析和圖機器學習的概念、技術和工具。當你讀 完這本書時,我們希望你能理解如何使用圖分析來解決一系列現實世界的問題。我們希 望你能夠回答以下問題:圖是否適合任務?應該使用哪些工具和技術?數據中有哪些有 意義的關系,應該如何根據關系分析來制定任務?根據經驗,我們發現許多人能夠快速掌握圖的一般概念和結構,但要思考圖,要培 養如何最佳地將數據建模為圖的直覺,然后將分析型任務制定為圖查詢,則需要更多 的努力和經驗。幾乎每章的開頭都列出了對應的目標,它們大致分為三個方面:學習 圖分析和機器學習的概念;用圖分析解決特定問題;了解如何使用 GSQL 查詢語言和 TigerGraph 圖平臺。目標讀者和前提條件本書的目標讀者是對數據分析感興趣并想學習圖分析的人。你不必是一位嚴肅的程序員 或數據科學家,但了解一些數據庫和編程的概念肯定有助于你理解本書內容。當我們深 入講解一些圖算法和機器學習技術時,我們會給出一些涉及集合、求和與極限的數學方 程式。這些方程式只是本書文字和圖像的補充。在本書的案例部分,我們將在 TigerGraph Cloud 平臺上運行預先編寫好的 GSQL 代碼。 你只需要一臺可以訪問互聯網的計算機即可。如果你熟悉 SQL 數據庫查詢語言和任意主 流編程語言,那么你將能夠理解大部分的 GSQL 代碼。如果你不熟悉它們,也可以簡單 地按照說明并跟隨書中的注釋來運行預先編寫的案例示例。
閱讀方法和路線我們旨在以實際的數據分析需求(而不是理論原理)為導向來呈現內容。我們會嘗試使 用最簡單的術語來解釋事情,并盡量使用日常概念而不是難懂的技術術語。本書通過完整的示例來介紹 GSQL 語言。在本書開頭,我們逐行描述了每行示例代碼的 目的和功能。我們還對特別重要的語言結構、語法和語義進行了強調。若要獲得更全面 的 GSQL 教程,可以參閱本書之外的其他資源。
Victor Lee是TigerGraph機器學習和人工智能副總裁。他的博士論文是關于基于圖的相似性和排序的。Lee博士與他人合作撰寫了關于決策樹和密集子圖發現的書籍章節。 教學和培訓也是他職業生涯的核心工作,從開發芯片設計培訓材料到撰寫TigerGraph的第1版技術文檔,從擔任12年課堂講師到主持大量網絡研討會和現場研討會,他都參與其中。Phuc Kien Nguyen是荷蘭銀行反洗錢和恐怖主義融資領域的數據科學家。他擁有代爾夫特理工大學的信息架構碩士學位。Alexander Thomas是前TigerGraph技術作家,擁有語言學和教育背景。
黃凱,碩士研究生,畢業于北京理工大學,現任北京速通科技有限公司軟件研發中心總工程師,主要從事于高可用、高性能、高并發的后臺服務系統開發,對微服務架構、容器技術有一定的研究,對底層應用開發具有較深的了解,主導研發了多個ETC相關系統。
目錄前言1第1章 連接就是一切71.1 連接改變一切81.1.1 什么是圖81.1.2 圖的重要性91.1.3 邊連接優于表連接101.2 圖分析和機器學習131.3 本章小結14第一部分 連接第2章 連接并探索數據192.1 圖的結構202.1.1 圖的術語202.1.2 圖的模式242.2 圖的遍歷262.2.1 跳數和距離262.2.2 廣度和深度272.3 圖的建模272.3.1 圖模式選項和權衡272.3.2 表格轉換為圖312.3.3 模型演進332.4 圖的能力332.4.1 連接點342.4.2 360度視圖342.4.3 深入洞察352.4.4 尋找并發現模式372.4.5 匹配和合并382.4.6 加權和預測392.5 本章小結40第3章 更好地了解客戶和業務:360圖423.1 案例1:跟蹤和分析客戶旅程423.2 解決方案:Customer 360 旅程圖433.3 實現C360 旅程圖:一個GraphStudio教程453.3.1 創建TigerGraph Cloud賬戶453.3.2 獲取并安裝Customer 360入門套件463.3.3 GraphStudio概述483.3.4 設計圖模式483.3.5 加載數據503.3.6 查詢和分析503.4 案例2:藥物不良反應分析603.5 解決方案:藥物相互作用360圖603.6 實現613.6.1 圖模式613.6.2 查詢和分析623.7 本章小結69第4章 研究創業投資704.1 目標:找到有前途的創業公司704.2 解決方案:創業投資圖714.3 實現創業投資圖以及查詢724.3.1 Crunchbase入門套件724.3.2 圖模式724.3.3 查詢和分析744.4 本章小結88第5章 檢測欺詐和洗錢模式905.1 目標:檢測金融犯罪905.2 解決方案:將金融犯罪建模為網絡模式915.3 實施金融犯罪模式搜索925.3.1 欺詐和洗錢檢測入門套件925.3.2 圖模式925.3.3 查詢和分析935.4 本章小結102第二部分 分析第6章 深入洞察:分析連接的重要性1056.1 了解圖分析1056.1.1 分析要求1066.1.2 圖遍歷方法1066.1.3 并行處理1076.1.4 聚合1076.2 使用圖算法進行分析1096.2.1 將圖算法作為工具1096.2.2 圖算法分類1106.3 本章小結127第7章 更好的推薦和建議1287.1 案例1:改善醫療轉診1287.2 解決方案:構建和分析轉診圖1297.3 實現醫療專家轉診網絡1297.3.1 醫療轉診網絡入門套件1297.3.2 圖模式1307.3.3 查詢和分析1317.4 案例2:個性化推薦1397.5 解決方案:使用圖進行基于多關系的推薦1407.6 實現多關系推薦引擎1407.6.1 推薦引擎2.0入門套件1407.6.2 圖模式1407.6.3 查詢和分析1427.7 本章小結150第8章 加強網絡安全1518.1 網絡攻擊的代價1518.2 挑戰1528.3 解決方案1528.4 實現網絡安全圖1538.4.1 網絡安全威脅檢測入門套件1538.4.2 圖模式1538.4.3 查詢和分析1548.5 本章小結163第9章 航空公司航線分析1649.1 目標:分析航空公司航線1649.2 解決方案:航線網絡的圖算法1659.3 實現機場和航線分析器1659.3.1 圖算法入門套件1659.3.2 圖模式和數據集1659.3.3 安裝GDS庫中的算法1669.3.4 查詢和分析1679.4 本章小結178第三部分 學習第10章 圖驅動的機器學習算法18110.1 基于圖算法的無監督學習18210.1.1 通過相似性和社區結構來學習18210.1.2 尋找頻繁模式18310.2 提取圖特征18410.2.1 領域無關特征18510.2.2 領域相關特征18810.2.3 圖嵌入:一個全新的世界19110.3 圖神經網絡19910.3.1 圖卷積網絡19910.3.2 GraphSAGE20310.4 圖機器學習方法的比較20510.4.1 機器學習任務的用例20510.4.2 模式發現與特征提取方法20610.4.3 圖神經網絡:總結與應用20710.5 本章小結207第11章 重新審視實體解析20811.1 問題描述:識別現實世界的用戶及其品味20811.2 解決方案:基于圖的實體解析20911.2.1 確實哪些實體是相同的20911.2.2 實體解析21011.3 實現基于圖的實體解析21111.3.1 數據庫內實體解析入門套件21111.3.2 圖模式21111.3.3 查詢和分析21211.3.4 方法1:Jaccard 相似度21311.3.5 合并21911.3.6 方法2:評分精確和近似匹配22211.4 本章小結229第12章 改進欺詐檢測23012.1 目標:改進欺詐檢測23012.2 解決方案:使用關系創建更智能的模型23112.3 使用TigerGraph ML Workbench23212.3.1 設置ML Workbench23212.3.2 使用ML Workbench 和 Jupyter Notes23312.3.3 圖模式和數據集23412.3.4 圖特征工程23612.3.5 用圖特征訓練傳統模型23712.3.6 使用圖神經網絡23912.4 本章小結24212.5 與你聯系242