本書選取了十類當(dāng)前得到廣泛使用的圖像技術(shù)給予介紹。具體包括:噪聲消噪技術(shù),圖像修補(bǔ)技術(shù),數(shù)字水印技術(shù),圖像超分辨率技術(shù),圖像分割技術(shù),人臉識(shí)別技術(shù),表情分類技術(shù),圖像融合技術(shù),圖像檢索技術(shù)和時(shí)空技術(shù)。對(duì)每類技術(shù),先對(duì)其中的基本概念、工作的基本原理、過程的基本步驟給予概括介紹,以幫助了解和學(xué)習(xí)該類技術(shù);接下來介紹幾種具體實(shí)現(xiàn)技術(shù)功能的典型方法作為示例,以了解該類技術(shù)過程的特點(diǎn),幫助達(dá)到有效運(yùn)用該類技術(shù)進(jìn)行圖像加工的目的;最后介紹一些近年來在相關(guān)技術(shù)方面發(fā)表的文獻(xiàn),總結(jié)歸納它們的特點(diǎn),以幫助深入開展進(jìn)一步的工作。本書主要為電信行業(yè)、交通管理、電視廣播、媒體傳播、光學(xué)儀器、生物醫(yī)學(xué)工程、機(jī)器人自動(dòng)化、電子醫(yī)療設(shè)備、遙感、測(cè)繪、航天、公安和軍事偵察等涉及圖像領(lǐng)域的科技工作者及公司研發(fā)人員參考;也可供大學(xué)本科學(xué)生開展圖像相關(guān)科技活動(dòng)和科技制作的參考;還可作為信號(hào)與信息處理、通信與信息系統(tǒng)、電子與通信工程、模式識(shí)別與智能系統(tǒng)、計(jì)算機(jī)視覺等學(xué)科的相關(guān)課程的參考書。
本書是一本面向?qū)嶋H應(yīng)用介紹圖像工程技術(shù)的圖書。本書與教材和專著都有所不同,但又試圖結(jié)合它們的一些特點(diǎn)。本書的讀者定位于原先沒有很多圖像技術(shù)的基礎(chǔ)但又需要利用圖像技術(shù)解決特定工作任務(wù)的科技工作者。
本書正文的章均由三部分組成。第一部分介紹該技術(shù)的基本概念、基礎(chǔ)原理、用途、歷史和發(fā)展情況。這部分的深度比較接近教材,可以入門。第二部分是實(shí)現(xiàn)該技術(shù)的若干示例方法,每種方法均包括技術(shù)分析、算法描述、具體步驟、效果實(shí)例等。這部分的深度介于教材和專著之間,可以實(shí)用。第三部分是對(duì)近年一些與該技術(shù)相關(guān)文章的分析歸納,提煉其特點(diǎn)并分類,類似研究文章的綜述介紹。這部分的深度更接近專著,可提供新的相關(guān)信息,幫助讀者進(jìn)一步選擇特定的參考文獻(xiàn),了解該領(lǐng)域的進(jìn)展情況和發(fā)展趨勢(shì)。
本書是一本面向?qū)嶋H應(yīng)用介紹圖像工程技術(shù)的圖書。本書與教材和專著都有所不同,但又試圖結(jié)合它們的一些特點(diǎn)。本書的讀者定位于原先沒有很多圖像技術(shù)的基礎(chǔ),但又需要利用圖像技術(shù)解決特定工作任務(wù)的科技工作者。
本書除引言外正文共分為10章,分別介紹10種圖像技術(shù)。它們是: 噪聲消除技術(shù)、圖像修補(bǔ)技術(shù)、數(shù)字水印技術(shù)、超分辨率技術(shù)、圖像分割技術(shù)、人臉識(shí)別技術(shù)、表情分類技術(shù)、圖像融合技術(shù)、圖像檢索技術(shù)和時(shí)空理解技術(shù)。
本書正文各章均由三部分組成。第一部分介紹該技術(shù)的基本概念、基礎(chǔ)原理、用途、歷史和發(fā)展情況,這部分的深度比較接近教材,可以入門。第二部分是實(shí)現(xiàn)該技術(shù)的若干示例方法,每種方法均包括技術(shù)分析、算法描述、具體步驟和效果實(shí)例等,這部分的深度介于教材和專著之間,可以實(shí)用。第三部分是對(duì)近年來一些與該技術(shù)相關(guān)文章的分析歸納,提煉其特點(diǎn)并分類,類似研究文章的綜述介紹,這部分的深度更接近專著,可提供最新的相關(guān)信息,幫助讀者進(jìn)一步選擇特定的參考文獻(xiàn),了解該領(lǐng)域的進(jìn)展情況和發(fā)展趨勢(shì)。
本書各章共有49節(jié)(二級(jí)標(biāo)題),再下還有86小節(jié)(三級(jí)標(biāo)題),共有文字(也包括圖片、繪圖、表格、公式等折合)30多萬,共有編號(hào)的圖152個(gè)、表格29個(gè)、公式280個(gè)。本書在文中對(duì)436篇近年來的相關(guān)文章進(jìn)行了分類并歸納了它們的特點(diǎn),列表介紹給讀者。最后,書末列出了所引用的168篇參考文獻(xiàn)的目錄和用于索引的184個(gè)術(shù)語(同時(shí)給出對(duì)應(yīng)英文)。
本書的選材內(nèi)容和結(jié)構(gòu)方式都是新的嘗試,歡迎讀者提出寶貴意見和建議。
最后,要特別感謝我的妻子何蕓和女兒章荷銘,正是她們的理解和支持,使本書得以在節(jié)日中寫到本頁并完稿。
章毓晉,1989年獲比利時(shí)列日大學(xué)應(yīng)用科學(xué)博士學(xué)位。1989—1993年為荷蘭德爾夫特大學(xué)博士后及研究人員。從1993年到中國(guó)北京清華大學(xué)工作,1997年被聘為教授,1998年被評(píng)為博士生導(dǎo)師,2014年起成為長(zhǎng)聘教授。2003年學(xué)術(shù)休假期間同時(shí)被聘為新加坡南洋理工大學(xué)訪問教授。
在清華大學(xué),先后開出并講授10多門本科生和研究生課程,目前還在講“圖像處理”、“圖像分析”、“圖像理解”、“基于內(nèi)容的視覺信息檢索”等。在南洋理工大學(xué),開出并講授過研究生課程“Advanced Image Analysis”。已編寫出版了《圖像工程》(系列教材第1版、第2版和第3版)、《圖像處理和分析基礎(chǔ)》、《圖像處理和分析技術(shù)》(第2版和第3版)、《圖像處理和分析教程》(第1版和第2版)、《計(jì)算機(jī)視覺教程》、《圖像處理基礎(chǔ)教程》和Image Engineering: Processing, Analysis, and Understanding;研制出版了《“圖象處理和分析”多媒體計(jì)算機(jī)輔助教學(xué)課件》和電子版網(wǎng)絡(luò)課程教材《圖象處理和分析網(wǎng)絡(luò)課程》;翻譯出版了《彩色數(shù)字圖像處理》、《圖像處理基礎(chǔ)(第2版)》和《實(shí)用MATLAB圖像和視頻處理》。已在國(guó)內(nèi)外發(fā)表了30多篇教學(xué)研究論文。
主要科學(xué)研究領(lǐng)域?yàn)槠浞e極倡導(dǎo)的圖像工程(圖像處理、圖像分析、圖像理解及其技術(shù)應(yīng)用)和相關(guān)學(xué)科。從1996年起已連續(xù)二十一年對(duì)中國(guó)圖像工程的研究及主要文獻(xiàn)進(jìn)行了系統(tǒng)的年度分類總結(jié)綜述。已在國(guó)內(nèi)外發(fā)表了500篇圖像工程研究論文,出版了專著《圖象分割》、《基于內(nèi)容的視覺信息檢索》、《基于子空間的人臉識(shí)別》,編著了《英漢圖像工程辭典》(第1版和第2版),主持編著了Advances in Image and Video Segmentation,Semantic-Based Visual Information Retrieval, Advances in Face Image Analysis: Techniques and Technologies。
現(xiàn)為中國(guó)圖象圖形學(xué)學(xué)會(huì)副理事長(zhǎng),學(xué)術(shù)委員會(huì)主任;國(guó)際電氣電子工程師協(xié)會(huì)(IEEE)高級(jí)會(huì)員;國(guó)際光學(xué)工程協(xié)會(huì)(SPIE)會(huì)士(因在圖像工程方面的成就);第24屆國(guó)際圖像處理會(huì)議(ICIP’2017)程序委員會(huì)主席。
第0章引言
0.1圖像技術(shù)
0.1.1圖像工程
0.1.2圖像技術(shù)分類
0.2本書特點(diǎn)
0.2.1寫作動(dòng)機(jī)
0.2.2選材內(nèi)容
0.2.3結(jié)構(gòu)安排
第1章噪聲消除
1.1噪聲類型和特性
1.1.1噪聲類型
1.1.2噪聲特性描述
1.2圖像增強(qiáng)消噪
1.2.1空域噪聲濾波器
1.2.2頻域周期噪聲
濾波器
1.3圖像恢復(fù)消噪
1.3.1圖像退化模型
1.3.2逆濾波
1.3.3維納濾波
1.4選擇性濾波器
1.5近期文獻(xiàn)分類總結(jié)
第2章圖像修補(bǔ)
2.1圖像修補(bǔ)概述
2.1.1圖像修補(bǔ)辨析
2.1.2圖像修補(bǔ)原理
2.1.3面向小尺寸修補(bǔ)的
圖像修復(fù)
2.1.4面向大尺寸修補(bǔ)的
區(qū)域填充
2.2結(jié)合稀疏表達(dá)的算法
2.2.1稀疏表達(dá)的原理
2.2.2稀疏表達(dá)的基本算法
2.2.3稀疏表達(dá)算法的改進(jìn)
2.3加權(quán)稀疏非負(fù)矩陣分解
算法
2.4上下文驅(qū)動(dòng)的混合方法
2.5近期文獻(xiàn)分類總結(jié)
第3章數(shù)字水印
3.1水印概述
3.1.1水印的嵌入和檢測(cè)
3.1.2水印特性
3.1.3水印分類
3.2DCT域水印
3.2.1特點(diǎn)和原理
3.2.2無意義水印算法
3.2.3有意義水印算法
3.3DWT域水印
3.3.1特點(diǎn)和流程
3.3.2人眼視覺特性
3.3.3小波水印算法
3.4近期文獻(xiàn)分類總結(jié)
第4章超分辨率
4.1圖像超分辨率原理
4.1.1基本模型和技術(shù)分類
4.1.2基于單幅圖像的超
分辨率復(fù)原
4.1.3基于多幅圖像的超
分辨率重建
4.2基于學(xué)習(xí)的超分辨率技術(shù)
4.2.1常規(guī)流程
4.2.2基于示例的單幀超
分辨率
4.2.3基于示例的多幀超
分辨率
4.2.4結(jié)合全變分正則化
方法
4.2.5基于學(xué)習(xí)的方法
4.3基于局部約束線性編碼的
重建
4.3.1基于稀疏表示的重建
算法
4.3.2局部約束線性編碼
4.3.3基于局部約束線性
編碼的重建
4.3.4對(duì)多幀圖像的超
分辨率重建
4.4近期文獻(xiàn)分類總結(jié)
第5章圖像分割
5.1圖像分割基礎(chǔ)
5.1.1圖像分割定義
5.1.2圖像分割算法分類
5.1.3并行邊界類算法
5.1.4串行邊界類算法
5.1.5并行區(qū)域類算法
5.1.6串行區(qū)域類算法
5.2彩色圖像分割
5.2.1彩色圖像分割概況
5.2.2彩色圖像的序列分割
5.3醫(yī)學(xué)圖像分割
5.3.1醫(yī)學(xué)圖像分割算法
概述
5.3.2交互式水平集胸主動(dòng)脈
圖像分割
5.4近期文獻(xiàn)分類總結(jié)
第6章人臉識(shí)別
6.1人臉識(shí)別原理
6.1.1研究和應(yīng)用概況
6.1.2人臉識(shí)別流程
6.1.3人臉識(shí)別影響因素
6.2子空間方法
6.3基于豪斯多夫距離和
對(duì)稱性度量的人臉定位
6.4面向類依賴特征分析的
相關(guān)濾波器設(shè)計(jì)
6.5基于鑒別投影嵌入的有監(jiān)督
線性降維
6.6基于邊緣本征矢量加權(quán)的
人臉識(shí)別
6.7近期文獻(xiàn)分類總結(jié)
第7章表情分類
7.1表情分類原理
7.1.1表情類別
7.1.2表情分類流程
7.1.3表情特征提取
7.1.4表情分類方法
7.1.5表情分類系統(tǒng)性能
7.2臉部器官檢測(cè)
7.2.1眼睛定位
7.2.2眼睛跟蹤
7.2.3嘴唇檢測(cè)和跟蹤
7.3借助蓋伯變換的表情
特征提取
7.4向量輸入多類輸出
表情分類
7.5近期文獻(xiàn)分類總結(jié)
第8章圖像融合
8.1圖像融合原理
8.1.1圖像融合的主要步驟
8.1.2圖像融合的3個(gè)層次
8.1.3像素級(jí)融合示例
8.1.4圖像融合效果評(píng)價(jià)
8.2像素級(jí)融合
8.2.1基本融合方法
8.2.2融合方法的改進(jìn)
8.2.3融合方法的結(jié)合
8.3雙能透射和康普頓背
散射融合
8.3.1成像技術(shù)的互補(bǔ)性
分析
8.3.2互補(bǔ)融合
8.4近期文獻(xiàn)分類總結(jié)
第9章圖像檢索
9.1圖像檢索原理
9.2基于視覺特征的圖像檢索
9.2.1顏色特征
9.2.2紋理特征
9.2.3形狀特征
9.2.4空間關(guān)系特征
9.2.5運(yùn)動(dòng)特征
9.3基于分層匹配跟蹤的檢索
9.3.1基于分層匹配跟蹤的
檢索框圖
9.3.2單層圖像特征提取
9.3.3多層特征提取和圖像
檢索
9.3.4結(jié)合顏色直方圖
9.4近期文獻(xiàn)分類總結(jié)
第10章時(shí)空理解
10.1時(shí)空理解概述
10.1.1五個(gè)層次
10.1.2時(shí)空興趣點(diǎn)
10.1.3動(dòng)態(tài)軌跡學(xué)習(xí)和
分析
10.1.4動(dòng)作分類和識(shí)別
10.1.5活動(dòng)和行為建模
10.2基于均移的運(yùn)動(dòng)目標(biāo)
跟蹤
10.2.1均移算法
10.2.2尺度非各向同性的
均移算法
10.2.3均移算法結(jié)合粒子
濾波器
10.3移動(dòng)陰影檢測(cè)
10.4結(jié)合姿態(tài)和上下文的
動(dòng)作分類
10.5近期文獻(xiàn)分類總結(jié)
參考文獻(xiàn)
索引