《計算機視覺教程(第2版)》系統地介紹了計算機視覺的基本原理、典型方法和實用技術,內容包括圖像采集、圖像預處理、基元檢測、目標分割、目標表達和描述、紋理特性分析、形狀特性分析、立體視覺、三維景物恢復、運動特性分析、景物識別、廣義匹配、時空行為了解、場景解釋及計算機視覺系統。讀者可從中了解計算機視覺的基本原理和典型技術,并能據此解決計算機視覺應用中的一些具體問題。本書提供了許多講解例題,每章均有要點小結、參考文獻介紹和練習題(為部分練習題提供了解答)。
本書可作為信息科學、計算機科學、計算機應用、信號與信息處理、通信與信息系統、電子與通信工程、模式識別與智能系統等學科大學本科或研究生的專業基礎課教材,也可作為遠程教育或繼續教育中計算機應用、電子技術等專業的研究生課程教材,還可供涉及計算機視覺技術應用行業(如工業自動化、人機交互、辦公自動化、視覺導航和機器人、安全監控、生物醫學、遙感測繪、智能交通和軍事公安等)的科技工作者自學及科研參考。
1、創造性地把難度極大的計算機視覺課程講述地較為通俗,比第1版減少了大片的定義與公式推導。
2、書稿內容思路清晰,表述極其嚴謹,作者對計算機視覺的理解非常深刻,繪制了計算機視覺與相關學科的關系圖譜,讓讀者對該領域的構架一目了然。
3、增加了時空行為理解的章節,以較為通俗的語言介紹了貼近生活的行為理解內容。
4、本書作者章毓晉是該領域的國內**,多年在計算機視覺領域鉆研,在國內外發表眾多論文,出版了10多種專著及教材,領域影響力極大。
章毓晉,已承擔和完成了多項國家自然科學基金、國家高技術計劃及國家教委博士點基金等資助的研究項目,并在國內外發表了300余篇圖像工程研究論文,出版了專著《圖象分割》和《基于內容的視覺信息檢索》,主編出版了"Advances in Image and Video Segmentation"和"Semantic-Based Visual Information Retrieval" 。
1、 緒論 1
1.1 計算機視覺 1
1.1.1 視覺概述 1
1.1.2 計算機視覺的目標 2
1.1.3 相關學科 2
1.1.4 應用領域 4
1.2 圖像基礎 4
1.2.1 圖像及類別 4
1.2.2 圖像表達和顯示 6
1.2.3 圖像存儲 7
1.3 像素間聯系 10
1.3.1 像素鄰域 10
1.3.2 像素間距離 11
1.4 本書內容提要 14
1.4.1 計算機視覺系統及模塊 14
1.4.2 如何學習使用本書 15
總結和復習 17
2、 圖像采集 19
2.1 采集裝置 19
2.2 采集模型 20
2.2.1 幾何成像模型 21
2.2.2 亮度成像模型 26
2.2.3 空間和幅度分辨率 28
2.3 采集方式 29
2.3.1 成像方式一覽 29
2.3.2 結構光法 30
2.4 攝像機標定 32
2.4.1 標定程序和步驟 32
2.4.2 兩級標定法 34
總結和復習 37
3、 圖像預處理 39
3.1 坐標變換 39
3.1.1 基本坐標變換 39
3.1.2 幾何失真校正 41
3.2 灰度映射 43
3.2.1 灰度映射原理 43
3.2.2 灰度映射示例 43
3.3 直方圖修正 45
3.3.1 直方圖均衡化 45
3.3.2 直方圖規定化 47
3.4 空域濾波 50
3.4.1 原理和分類 50
3.4.2 線性平滑濾波 51
3.4.3 線性銳化濾波 53
3.4.4 非線性平滑濾波 53
3.4.5 非線性銳化濾波 56
總結和復習 57
4、 基元檢測 59
4.1 邊緣檢測 59
4.1.1 檢測原理 59
4.1.2 一階導數算子 60
4.1.3 二階導數算子 64
4.1.4 邊界閉合 68
4.1.5 邊界細化 68
4.2 SUSAN算子 69
4.2.1 USAN原理 69
4.2.2 角點和邊緣檢測 70
4.3 哈里斯興趣點算子 73
4.4 哈夫變換 75
4.3.1 基本哈夫變換 75
4.3.2 廣義哈夫變換 78
4.3.3 完整廣義哈夫變換 80
4.5 橢圓定位和檢測 81
4.6 位置直方圖技術 83
總結和復習 85
5、 目標分割 87
5.1 輪廓搜索 87
5.1.1 圖搜索 87
5.1.2 動態規劃 89
5.2 主動輪廓模型 90
5.2.1 主動輪廓 90
5.2.2 能量函數 91
5.3 基本閾值技術 93
5.3.1 原理和分類 93
5.3.2 全局閾值的選取 94
5.3.3 局部閾值的選取 96
5.3.4 動態閾值的選取 99
5.4 特色閾值方法 99
5.4.1 多分辨率閾值 99
5.4.2 過渡區閾值 101
5.5 特征空間聚類 103
5.5.1 基本聚類方法 103
5.5.2 均移確定聚類中心 104
總結和復習 105
6、 目標表達和描述 107
6.1 基于邊界的表達 107
6.1.1 鏈碼 107
6.1.2 邊界段和凸包 109
6.1.3 邊界標記 110
6.2 基于區域的表達 112
6.2.1 四叉樹 112
6.2.2 圍繞區域 113
6.2.3 骨架 113
6.3 基于邊界的描述 115
6.3.1 邊界長度和直徑 115
6.3.2 邊界形狀數 116
6.3.3 輪廓形狀矩陣 117
6.4 基于區域的描述 118
6.4.1 區域面積和密度 118
6.4.2 區域形狀數 119
6.4.3 區域不變矩 120
6.4.4 拓撲描述符 122
總結和復習 123
7、 紋理分析 125
7.1 統計描述方法 125
7.1.1 灰度共生矩陣 125
7.1.2 基于共生矩陣的描述 127
7.1.3 基于能量的描述 127
7.2 結構描述方法 129
7.2.1 結構描述原理 129
7.2.2 紋理鑲嵌 131
7.2.3 局部二值模式 131
7.3 頻譜描述方法 133
7.3.1 傅里葉頻譜描述 133
7.3.2 蓋伯頻譜描述 135
7.4 紋理圖像分割 136
7.4.1 有監督紋理分割 137
7.4.2 無監督紋理分割 139
總結和復習 141
8、 形狀分析 143
8.1 形狀緊湊性描述符 143
8.2 形狀復雜性描述符 149
8.3 基于多邊形的形狀分析 151
8.3.1 多邊形計算 151
8.3.2 多邊形描述 152
8.4 基于曲率的形狀分析 154
8.4.1 輪廓曲率 154
8.4.2 曲面曲率 157
總結和復習 158
9、 立體視覺 160
9.1 立體視覺模塊 160
9.2 雙目成像和視差 162
9.2.1 雙目橫向模式 162
9.2.2 雙目橫向會聚模式 164
9.2.3 雙目縱向模式 165
9.3 基于區域的立體匹配 166
9.3.1 模板匹配 166
9.3.2 雙目立體匹配 167
9.4 基于特征的立體匹配 173
9.4.1 點對點的方法 173
9.4.2 動態規劃匹配 175
總結和復習 176
10、三維景物恢復 179
10.1 由光移恢復表面朝向 179
10.1.1 表面反射特性 179
10.1.2 目標表面朝向 182
10.1.3 反射圖 183
10.1.4 光度立體學求解 184
10.2 從影調獲取形狀信息 186
10.2.1 影調與形狀 186
10.2.2 求解亮度方程 188
10.3 紋理變化與表面朝向 190
10.3.1 三種典型變化 190
10.3.2 確定線段的紋理消失點 192
10.4 根據焦距確定深度 195
總結和復習 196
11、運動分析 198
11.1 運動分類和表達 198
11.2 全局運動檢測 201
11.2.1 利用圖像差的檢測 202
11.2.2 基于模型的檢測 204
11.3 運動目標檢測和分割 206
11.3.1 背景建模 206
11.3.2 運動目標跟蹤 209
11.3.3 運動目標分割 213
11.4 運動光流和表面取向 214
11.4.1 光流約束方程 214
11.4.2 光流計算 214
11.4.3 光流與表面取向 218
總結和復習 221
12、景物識別 223
12.1 統計模式分類 223
12.1.1 模式分類原理 223
12.1.2 最小距離分類器 224
12.1.3 最優統計分類器 225
12.2 感知機 228
12.3 支持向量機 231
12.4 結構模式識別 234
12.4.1 字符串結構識別 234
12.4.2 樹結構識別 237
總結和復習 239
13、廣義匹配 241
13.1 目標匹配 241
13.1.1 匹配的度量 241
13.1.2 字符串匹配 244
13.1.3 慣量等效橢圓匹配 245
13.2 動態模式匹配 247
13.3 關系匹配 249
13.3.1 關系表達和距離 249
13.3.2 關系匹配模型 251
13.4 圖同構匹配 252
13.4.1 圖論基礎 252
13.4.2 圖同構和匹配 255
總結和復習 256
14、時空行為理解 259
14.1 時空技術 259
14.2 時空興趣點 260
14.3 動態軌跡學習和分析 262
14.3.1 自動場景建模 263
14.3.2 路徑學習 264
14.3.3 自動活動分析 266
14.4 動作分類和識別 267
14.4.1 動作分類 267
14.4.2 動作識別 268
14.5 活動和行為建模 272
14.5.1 動作建模 272
14.5.2 活動建模和識別 275
總結和復習 278
15、場景解釋 280
15.1 線條圖標記解釋 280
15.2 體育比賽視頻排序 283
15.3 計算機視覺系統模型 287
15.3.1 多層次串行結構 287
15.3.2 知識庫為中心的輻射結構 288
15.3.3 知識庫為根的樹結構 288
15.3.4 多模塊交叉配合結構 289
15.4 計算機視覺理論框架 290
15.4.1 馬爾視覺計算理論 290
15.4.2 對馬爾理論框架的改進 293
15.4.3 新理論框架的研究 294
總結和復習 296
部分練習題解答 298
參考文獻 304
索引 310