本書通過詳細的示例、樣本數據集、代碼和圖形教程,說明了如何:1為每個問題使用合適類型的圖2快速、高效且正確地收集、清洗和組織數據3為高可讀性設置可視化格式,而不損失精確性4掌握允許更深入地探索和解釋數據的工具5使用少量輕量級編程創建自定義可視化6選擇有效的圖分析技術來從數據中提取出最多信息7使用高級的可視化技術,包括動態圖、大數據工具和查詢。
作 者 簡 介Richard Brath是數據可視化的積極實踐者和先行者,其視覺分析的研究、設計與開發不僅涉及研究領域還用于商業領域。他創建的解決方案范圍很廣,從用于移動設備中豐富的交互式可視化,到用于商業應用的多點觸控、多屏幕裝置以及基于Web的可視化分析,涉及的應用領域也很廣,如貿易、職業體育和廣播電視等,每天都有成千上萬的人使用。 David Jonker是Uncharted(原來的Oculus Info Inc)公司的聯合創始人和高級合伙人。他是一名設計師和開發人員,為基于Web的、分布式的、移動的應用設計可視化分析工具和平臺。他在過去20多年做了大量可視化工作,其中包括位于時代廣場NASDAQ MarketSite實時廣播中心的可視化系統。目前,他是DARPA XDATA項目的帶頭人。Jonker和Brath是商業合作伙伴,兩個人也經常在領先的行業及研究論壇上發表演講,進行展示。 技術編輯簡介Scott Langevin是Uncharted的一位主管和研究人員,擁有超過12年的行業和學術界經驗。他在南卡羅來納大學獲得了計算機科學的博士學位,方向是機器學習、面向服務計算和軟件工程。Langevin的研究興趣包括概率圖建模、大規模可視化分析和適應性用戶界面。 Peter MacMurchy是擁有超過15年經驗的專業軟件開發人員,他關注UX、UI和交互式數據可視化工具。在卡爾加里大學讀計算機科學學位研究計算機圖形學時,課程作業激發了他對信息可視化的強烈興趣。自那之后,他就一直為金融、電影、能源等行業開發可視化和交互軟件。
目 錄
前言
作者簡介
第I部分 概述
第1章 為什么使用圖 2
1.1 商業中的可視化 3
1.2 商業中的圖 4
1.2.1 找出反常現象 5
1.2.2 管理網絡和供應鏈 7
1.2.3 辨別風險模式 9
1.2.4 優化資產組合 11
1.2.5 繪制社會等級分層圖 13
1.2.6 發現社區 15
1.3 圖的現狀 16
1.4 小結 17
第2章 圖的類型及其適用的問題 18
2.1 關系 18
2.2 分層 21
2.3 社區 23
2.4 流 27
2.5 空間網絡 30
2.6 小結 32
第Ⅱ部分 過程和工具
第3章 數據:收集、清洗和連接 35
3.1 了解目標 35
3.2 收集:識別數據 35
3.2.1 潛在的圖數據源 36
3.2.2 潛在的分層數據源 41
3.2.3 獲取數據 43
3.3 清洗:準備數據 44
3.4 連接:組織圖數據 45
3.4.1 計算圖 46
3.4.2 圖數據的文件格式 48
3.5 集中回顧 54
3.6 小結 54
第4章 統計數據和布局 55
4.1 基本的圖統計數據 55
4.1.1 大小(節點數和邊數) 55
4.1.2 密度 56
4.1.3 成分數 56
4.1.4 度和路徑 56
4.1.5 中心度 58
4.1.6 病毒式營銷示例 59
4.2 布局 60
4.2.1 節點–連接布局 60
4.2.2 其他布局 61
4.2.3 力導向布局 62
4.2.4 僅節點布局 66
4.2.5 時間布局 67
4.2.6 自頂向下和其他正交分層 68
4.2.7 輻射狀分層 71
4.2.8 地理布局和地圖 72
4.2.9 弦圖 74
4.2.10 鄰接矩陣 74
4.2.11 樹圖 76
4.2.12 分層餅圖 76
4.2.13 平行坐標 77
4.3 集中回顧 79
4.4 小結 79
第5章 視覺特性 80
5.1 基本視覺特性 81
5.2 關鍵的節點特性 82
5.2.1 節點大小 82
5.2.2 節點顏色 84
5.2.3 標簽 87
5.3 關鍵的邊特性 91
5.3.1 邊的權重 91
5.3.2 邊的顏色 91
5.3.3 邊的類型 92
5.4 組合基本特性 93
5.5 捆綁、形狀、圖片及更多 94
5.5.1 捆綁邊 94
5.5.2 形狀 95
5.5.3 節點圖片 95
5.5.4 節點邊框 96
5.5.5 更多特性 97
5.5.6 干擾與分隔 97
5.6 集中回顧 101
5.7 小結 101
第6章 探索和解釋 102
6.1 探索、解釋和導出 102
6.2 必要的探索性交互 104
6.2.1 縮放和搖動(以及比例縮放和旋轉) 105
6.2.2 識別 106
6.2.3 過濾器 107
6.2.4 隔離和重做布局 109
6.3 更多交互式探索 110
6.3.1 識別鄰近節點 111
6.3.2 路徑 111
6.3.3 刪除 112
6.3.4 分組 112
6.3.5 迭代分析 114
6.4 解釋 114
6.4.1 數據故事的順序 115
6.4.2 圖例 116
6.4.3 注釋 116
6.4.4 導出數據子集、圖和圖片 118
6.5 集中回顧 119
6.6 小結 120
第7章 鼠標點擊類圖工具 121
7.1 Excel 121
7.1.1 匯總連接 122
7.1.2 提取節點 122
7.1.3 Excel中的鄰接矩陣可視化 123
7.2 NodeXL 125
7.2.1 NodeXL基礎 125
7.2.2 社交網絡功能 127
7.3 Gephi 129
7.3.1 Gephi基礎 129
7.3.2 注意事項 131
7.4 Cytoscape 133
7.4.1 Cytoscape基礎 133
7.4.2 將數據導入Cytoscape 134
7.4.3 視覺特性 135
7.4.4 Apps菜單 139
7.5 yEd 139
7.6 小結 141
第8章 輕量級編程 143
8.1 Python 143
8.1.1 上手 143
8.1.2 清洗數據 144
8.1.3 從連接數據集中提取節點集合 145
8.1.4 將電子郵件數據轉換為圖 149
8.1.5 圖數據庫 154
8.2 JavaScript與圖的可視化 155
8.2.1 D3基礎 155
8.2.2 D3和圖 160
8.2.3 D3彈簧圖 169
8.3 小結 174
第Ⅲ部分 圖的可視化分析
第9章 關系 176
9.1 連接和關系 176
9.1.1 詐騙索賠中的相似性 177
9.1.2 網絡安全 179
9.2 電子郵件關系 181
空間分隔 181
9.3 演員與電影 184
9.4 將連接轉換為節點 186
9.5 小結 188
第10章 分層 189
10.1 組織結構圖 189
10.2 樹與圖 191
10.3 繪制分層 193
10.4 決策樹 198
10.5 網站樹及有效性 200
10.6 小結 203
第11章 社區 204
11.1 社區的定義特征 205
11.2 圖聚類 205
11.2.1 社交網絡案例分析 206
11.2.2 使用NodeXL和Gephi分析社交媒體 206
11.2.3 可聚類的布局 208
11.2.4 使用顏色描述簇的特征 210
11.2.5 社區發現 211
11.2.6 使用顏色來區分簇 212
11.2.7 社區話題分析 214
11.2.8 社區情感 216
11.3 團伙和其他組 219
11.3.1 社交媒體中的團伙 220
11.3.2 使用凸包的社區組 220
11.4 小結 223
第12章 流 224
12.1 桑基圖 225
12.2 構造一個桑基圖 229
12.2.1 創建頁面結構 229
12.2.2 處理和建模數據 230
12.2.3 可視化數據 231
12.2.4 高亮顯示通過節點的流 233
12.3 使用流的社區布局 235
12.4 弦圖 237
12.5 構造一個弦圖 238
12.5.1 準備數據 238
12.5.2 創建頁面結構 239
12.5.3 處理和建模數據 240
12.5.4 可視化數據 243
12.5.5 根據需要顯示交互細節 247
12.6 行為因子樹 248
12.7 小結 249
第13章 空間網絡 250
13.1 示意圖布局 250
13.2 小世界分組 255
13.3 連接玫瑰匯總 255
13.4 路線模式 263
13.4.1 可視化路線段 264
13.4.2 軌跡聚合 267
13.5 小結 268
第IV部分 高級技術
第14章 大數據 270
14.1 圖數據庫 271
14.1.1 產品營銷示例 271
14.1.2 創建和填充一個圖數據庫 273
14.2 圖查詢語言 275
14.2.1 使用Gremlin進行圖查詢 276
14.2.2 使用圖查詢來提取鄰域 278
14.3 分析鄰域 281
14.4 繪制網絡活動 287
14.5 社區可視化 289
14.6 小結 290
第15章 動態圖 291
15.1 圖的變化 291
15.1.1 有機動畫 292
15.1.2 完整時間跨度布局 293
15.1.3 重影 295
15.1.4 淡出 296
15.1.5 社區演化 297
15.2 交易圖 298
15.2.1 聚類交易分析 299
15.2.2 空間交易分析 304
15.3 小結 305
第16章 設計 307
16.1 節點 307
16.1.1 節點的形狀 308
16.1.2 節點大小 313
16.1.3 節點標簽 314
16.2 連接 314
16.3 顏色 318
16.4 小結 320
圖論術語表 322