本書系統(tǒng)地介紹了圖像處理技術(shù)中所涉及的數(shù)學(xué)基礎(chǔ)。在前四章中,筆者設(shè)法化繁為簡(jiǎn),從眾多繁冗的數(shù)學(xué)知識(shí)中萃取了在學(xué)習(xí)和研究圖像處理技術(shù)時(shí)所必須的內(nèi)容,以期有效地幫助讀者篩選出*為必要的理論基礎(chǔ),包括微積分、場(chǎng)論、變分法、復(fù)變函數(shù)、偏微分方程、泛函分析、概率論和統(tǒng)計(jì)學(xué)等。本書的后半部分每章圍繞一個(gè)主題詳盡地介紹了一些實(shí)際應(yīng)用中的技術(shù),這部分內(nèi)容涉及到的子話題和具體算法十分豐富,其中很多都是當(dāng)前研究的熱點(diǎn)。更重要的是,在后四章里,讀者將反復(fù)用到本書前半部分所介紹的數(shù)學(xué)原理。這不僅能幫助讀者夯實(shí)基礎(chǔ)、強(qiáng)化所學(xué),更能幫助讀者建立一條連接數(shù)學(xué)和圖像處理世界的橋梁,做到學(xué)以致用。本書可作為圖像處理和機(jī)器視覺等領(lǐng)域的從業(yè)人員的技術(shù)指導(dǎo)資料,也可作為大專院校相關(guān)專業(yè)師生研究或?qū)W習(xí)的參考書籍。
探索圖像處理中的數(shù)學(xué)問題,幫助讀者夯實(shí)基礎(chǔ)、強(qiáng)化所學(xué),更能幫助讀者建立一條連接數(shù)學(xué)和圖像處理世界的橋梁。
前言
2002年,國(guó)際計(jì)算機(jī)學(xué)會(huì)將當(dāng)年度的圖靈獎(jiǎng)?lì)C給了因提出RSA公鑰加密算法而聞名于世的羅納德·李維斯特、阿迪·薩莫爾和倫納德·阿德曼三人。與RSA公鑰加密體制密切相關(guān)的一個(gè)數(shù)學(xué)基礎(chǔ)就是中國(guó)剩余定理,這也是現(xiàn)代數(shù)學(xué)中唯一以中國(guó)之名命名的定理,在某種程度上它也成為了中國(guó)古代數(shù)學(xué)成就的一個(gè)重要代表。我國(guó)古代數(shù)學(xué)名著《孫子算經(jīng)》中記載的物不知數(shù)問題是中國(guó)剩余定理的一個(gè)典型算例。后來,南宋數(shù)學(xué)家秦九韶在他的《數(shù)書九章》中推廣了物不知數(shù)問題,提出了大衍求一術(shù),為求解中國(guó)剩余定理問題提供了系統(tǒng)化的數(shù)學(xué)理論。西方世界直到18世紀(jì),才對(duì)類似問題展開系統(tǒng)研究。德國(guó)的高斯得出類似大衍求一術(shù)的結(jié)論則到了19世紀(jì),比秦九韶晚了近700年。秦九韶曾在《數(shù)書九章》的序言中寫道: 其用本太虛生一,而周流無窮,大則可以通神明,順性命; 小則可以經(jīng)世務(wù),類萬物……若昔推策以迎日,定律而知?dú)。髀矩浚川,土圭度晷。天地之大,囿焉而不能外,況其間總總者乎?這段話譯成現(xiàn)代漢語就是: 為了應(yīng)用,人們要認(rèn)識(shí)世界的規(guī)律,因而產(chǎn)生了數(shù)學(xué)。數(shù)學(xué)具有廣泛的應(yīng)用性。從大的方面說,數(shù)學(xué)可以認(rèn)識(shí)自然,理解人生; 從小的方面說,數(shù)學(xué)可以經(jīng)營(yíng)事務(wù),分類萬物……過去,歷算家們用籌算推演,制定天文歷法; 發(fā)現(xiàn)自然規(guī)律,預(yù)測(cè)季節(jié)變化。用髀、矩測(cè)山高河深,用圭表量日影,以定時(shí)刻與節(jié)氣。宇宙如此之大,尚且不能置于數(shù)學(xué)之外,那么宇宙之中的各種各樣的事物,難道能離開數(shù)學(xué)嗎?由此可見,在古代,人們已經(jīng)意識(shí)到了數(shù)學(xué)的重要性。事實(shí)上,作為現(xiàn)代科學(xué)技術(shù)的重要基礎(chǔ),數(shù)學(xué)甚至也在直接或間接地影響著一個(gè)國(guó)家的綜合國(guó)力。古今中外,許多名流志士,甚至很多本來并非數(shù)學(xué)家出身的人,都在著述或談話中論及了數(shù)學(xué)之于國(guó)力的影響。例如,19世紀(jì)中國(guó)杰出的數(shù)學(xué)家李善蘭在列強(qiáng)環(huán)伺、國(guó)勢(shì)衰微的民族危難之際便感慨道: 嗚呼!今歐羅巴各國(guó)日益強(qiáng)盛,為中國(guó)邊患。推原其故,制器精也,推原制器之精,算學(xué)明也。無獨(dú)有偶,在萬里之外的西方世界,拿破侖則更為直接地指出: 一個(gè)國(guó)家只有數(shù)學(xué)蓬勃的發(fā)展,才能展現(xiàn)它國(guó)力的強(qiáng)大。數(shù)學(xué)的發(fā)展和至善與國(guó)家繁榮昌盛密切相關(guān);剡^頭來看我們要談的數(shù)字圖像處理技術(shù),數(shù)學(xué)對(duì)其的影響可能更為直接?偹苤瑪(shù)字圖像處理技術(shù)的研究與開發(fā)對(duì)數(shù)學(xué)基礎(chǔ)的要求很高,一些不斷涌現(xiàn)的新方法中,眼花繚亂的數(shù)學(xué)推導(dǎo)令很多期待深入研究的人望而卻步。一個(gè)正規(guī)理工科學(xué)生大致已經(jīng)具備了包括微積分、線性代數(shù)、概率論在內(nèi)的數(shù)學(xué)基礎(chǔ)。但在分析一些圖像處理算法的原理時(shí),好像感覺還是無從入手。實(shí)際中所涉及的問題主要?dú)w結(jié)為如下幾個(gè)原因: ①微積分、線性代數(shù)、概率論這些是非常重要的數(shù)學(xué)基礎(chǔ),但顯然不是這些課程中所有的內(nèi)容都在圖像處理算法中有直接應(yīng)用; ②當(dāng)你將圖像處理和數(shù)學(xué)分開來學(xué)的時(shí)候,其實(shí)并沒有設(shè)法建立它們二者的聯(lián)系; ③一些新方法或者所謂的高大上算法的基礎(chǔ)已經(jīng)超過了上面三個(gè)數(shù)學(xué)課程所探討的基本領(lǐng)域,這又涉及偏微分方程、變分法、復(fù)變函數(shù)、實(shí)變函數(shù)、泛函分析等; ④如果你不是數(shù)學(xué)科班出身,要想自學(xué)上面所談到所有內(nèi)容,工作量實(shí)在太過繁雜,恐怕精力也難以顧及。長(zhǎng)久以來,筆者結(jié)合自己對(duì)圖像處理的學(xué)習(xí)和實(shí)踐,大致總結(jié)了一部分圖像處理研究中所需的數(shù)學(xué)原理基礎(chǔ)。這些內(nèi)容主要涉及微積分、向量分析、場(chǎng)論、泛函分析、偏微分方程、復(fù)變函數(shù)、變分法等。正如前面所提到的,如果要系統(tǒng)地學(xué)習(xí)上述這些數(shù)學(xué)理論的全部?jī)?nèi)容,對(duì)于一個(gè)非數(shù)學(xué)專業(yè)出身的人來說可能并不現(xiàn)實(shí)。于是筆者嘗試總結(jié)、歸納、提取了上面這些數(shù)學(xué)課程在研究圖像處理時(shí)最容易碰到也最需要知道的一些知識(shí)點(diǎn),然后采取一種循序漸進(jìn)的方式將它們重新組織到了一起。并結(jié)合具體的圖像處理算法討論來講解這些數(shù)學(xué)知識(shí)的運(yùn)用。從而建立數(shù)學(xué)知識(shí)與圖像處理之間的一座橋梁。這部分內(nèi)容主要是筆者日常研究和學(xué)習(xí)的一個(gè)總結(jié)。最初筆者也只是把這部分文章發(fā)到了自己的技術(shù)博客上,而且盡管此前筆者僅是斷斷續(xù)續(xù)地?cái)X取了其中的一部分發(fā)到了網(wǎng)上,已經(jīng)有讀者表現(xiàn)出了濃厚的興趣。不知不覺中,這個(gè)系列專欄的文章日積月累,內(nèi)容漸漸豐富,個(gè)人感覺確實(shí)已經(jīng)形成了一個(gè)相對(duì)比較完整的體系,于是便有了各位現(xiàn)在看到的這本書。本書旨在對(duì)圖像處理技術(shù)中所涉及的數(shù)學(xué)原理給出一個(gè)相對(duì)系統(tǒng)的講述。全書共分8章,其中前4章主要是一些數(shù)學(xué)基礎(chǔ)方面的內(nèi)容,包括微積分、場(chǎng)論、變分法、復(fù)變函數(shù)、偏微分方程、泛函分析、概率論和統(tǒng)計(jì)學(xué)等。而這部分內(nèi)容所給出的正是筆者認(rèn)為在學(xué)習(xí)和研究圖像處理技術(shù)時(shí)所必須的數(shù)學(xué)知識(shí)。當(dāng)然,僅僅有理論仍然是不足的。本書的后半部分每章圍繞一個(gè)主題詳盡地介紹了一些實(shí)際應(yīng)用中的圖像處理技術(shù),這部分內(nèi)容也相當(dāng)?shù)啬,涉及的子話題和具體算法十分豐富,其中很多都是當(dāng)前研究的熱點(diǎn)。更重要的是,在后4章里,讀者將反復(fù)用到本書前半部分所介紹的數(shù)學(xué)原理。這樣一來不僅能幫助讀者夯實(shí)基礎(chǔ)、強(qiáng)化所學(xué),更能幫助讀者建立一條連接數(shù)學(xué)和圖像處理世界的橋梁,做到學(xué)以致用。在閱讀本書時(shí),有兩種方式可供讀者選擇。如果你數(shù)學(xué)基礎(chǔ)尚可,那么可以試著從第5章開始看起,如果對(duì)一些遇到的術(shù)語、公式不甚了解,可以再翻回前面的內(nèi)容,做有針對(duì)性的查閱。如果你的數(shù)學(xué)基礎(chǔ)略顯薄弱,或者曾經(jīng)學(xué)過,但眼下所剩無幾,那么你也可以從頭看起,幫助自己建立一個(gè)相對(duì)完整而扎實(shí)的數(shù)學(xué)思維體系。當(dāng)然由于本書的知識(shí)內(nèi)容是高度凝練的,無法做到包山包海,因此仍然建議那些有一定微積分基礎(chǔ)的人作為本書的目標(biāo)讀者。換言之,具有普通大專院校工科數(shù)學(xué)基礎(chǔ)的讀者就可以閱讀本書。萬丈高樓平地起,基礎(chǔ)不牢,地動(dòng)山搖。很多人在學(xué)習(xí)和研究圖像處理算法時(shí)都感覺有一道無形的屏障擋在眼前,總是力不從心。雖然自己也似乎看了很多資料,但是遇到一些實(shí)際問題時(shí),又不知道該從何入手;蛟S,你所欠缺的恰恰是一個(gè)夯實(shí)的理論基礎(chǔ)。正如筆者常說的一句玩笑話: 如果連基本的求導(dǎo)還不甚了解,那么即使傅立葉本人親自來給你講傅立葉變換,你也是無福消受的。但如果你是圖像處理的同道中人,或者你正在學(xué)習(xí)、研究和運(yùn)用圖像處理技術(shù),那么筆者相信,你一定能從本書中有所收獲!總的來說,我不太喜歡翻開一本信息技術(shù)相關(guān)的工具書,里面密密麻麻的全部都是代碼。所以,我希望能夠在我的書中留下更多空間去討論原理和思路。鑒于這并不是一本教導(dǎo)人們?nèi)绾伍_發(fā)圖像處理程序的書,或者更準(zhǔn)確地說這是一本介紹數(shù)學(xué)在圖像處理中的應(yīng)用的書,所以我們并不要求讀者閱讀本書前已經(jīng)掌握了某種特定的計(jì)算機(jī)語言。然而,在介紹某些比較晦澀的算法時(shí),使用一些必要的代碼來輔助解釋也是很有必要的,而且有時(shí)這也的確是最直截了當(dāng)最容易被接受的方式。所以本書中確實(shí)涉及某些用MATLAB編寫的代碼,但它們的占比是極其有限的。在有必要使用代碼來演示說明算法原理的時(shí)候,我們也僅是給出了算法核心部分的相關(guān)代碼。事實(shí)上,筆者更習(xí)慣于在博客中上傳代碼,而非把它們?nèi)苛_列到書中去擠占篇幅。如果讀者對(duì)書中所涉及的算法實(shí)現(xiàn)有需要,可以從筆者在CSDN上的技術(shù)博客中(http: //blog.csdn.net/baimafujinji)下載到相應(yīng)的源代碼。更重要的是,如果讀者在閱讀本書時(shí)遇到一些困難,或者有一些需要跟作者溝通的問題時(shí),都可以在該博客上通過留言的方式來跟筆者進(jìn)行交流。無冥冥之志者,無昭昭之明,無惛惛之事者,無赫赫之功。我衷心地希望本書的讀者能夠在圖像處理領(lǐng)域既有昭昭之明,亦有赫赫之功。最后雖然有點(diǎn)俗套,但筆者還是想說: 自知論道須思量,幾度無眠一文章。由于時(shí)間和能力有限,書中紕漏在所難免,真誠(chéng)地希望各位讀者和專家不吝批評(píng)、斧正。左飛
左飛,技術(shù)作家、譯者。他的著作涉及圖像處理、編程語言和數(shù)據(jù)挖掘等多個(gè)領(lǐng)域,并譯有《編碼》等計(jì)算機(jī)領(lǐng)域的經(jīng)典著作。曾榮獲最受讀者喜愛的IT圖書作譯者獎(jiǎng)。現(xiàn)在的研究興趣主要集中在圖像處理、數(shù)據(jù)挖掘等領(lǐng)域。在CSDN上的技術(shù)博客(http://blog.csdn.net/baimafujinji)非常受歡迎,擁有過百萬的訪問量。之前所出圖書銷量均在上萬冊(cè)左右。
目錄
第1章必不可少的數(shù)學(xué)基礎(chǔ)
1.1極限及其應(yīng)用
1.1.1數(shù)列的極限
1.1.2級(jí)數(shù)的斂散
1.1.3函數(shù)的極限
1.1.4極限的應(yīng)用
1.2微分中值定理
1.2.1羅爾中值定理
1.2.2拉格朗日中值定理
1.2.3柯西中值定理
1.2.4泰勒公式
1.2.5黑塞矩陣與多元函數(shù)極值
1.3向量代數(shù)與場(chǎng)論
1.3.1牛頓萊布尼茨公式
1.3.2內(nèi)積與外積
1.3.3方向?qū)?shù)與梯度
1.3.4曲線積分
1.3.5格林公式
1.3.6積分與路徑無關(guān)條件
1.3.7曲面積分
1.3.8高斯公式與散度
1.3.9斯托克斯公式與旋度
本章參考文獻(xiàn)
第2章更進(jìn)一步的數(shù)學(xué)內(nèi)容
2.1傅里葉級(jí)數(shù)展開
2.1.1函數(shù)項(xiàng)級(jí)數(shù)的概念
2.1.2函數(shù)項(xiàng)級(jí)數(shù)的性質(zhì)
2.1.3傅里葉級(jí)數(shù)的概念
2.1.4傅里葉變換的由來
2.1.5卷積定理及其證明
2.2復(fù)變函數(shù)論初步
2.2.1解析函數(shù)
2.2.2復(fù)變積分
2.2.3基本定理
2.2.4級(jí)數(shù)展開
2.3凸函數(shù)與詹森不等式
2.3.1凸函數(shù)的概念
2.3.2詹森不等式及其證明
2.3.3詹森不等式的應(yīng)用
2.4常用經(jīng)典數(shù)值解法
2.4.1牛頓迭代法
2.4.2雅可比迭代
2.4.3高斯迭代法
2.4.4托馬斯算法
本章參考文獻(xiàn)
第3章泛函分析及變分法
3.1勒貝格積分理論
3.1.1點(diǎn)集的勒貝格測(cè)度
3.1.2可測(cè)函數(shù)及其性質(zhì)
3.1.3勒貝格積分的定義
3.1.4積分序列極限定理
3.2泛函與抽象空間
3.2.1線性空間
3.2.2距離空間
3.2.3賦范空間
3.2.4巴拿赫空間
3.2.5內(nèi)積空間
3.2.6希爾伯特空間
3.2.7索伯列夫空間
3.3從泛函到變分法
3.3.1理解泛函的概念
3.3.2變分的概念
3.3.3變分法的基本方程
3.3.4理解哈密爾頓原理
3.3.5等式約束下的變分
3.3.6巴拿赫不動(dòng)點(diǎn)定理
3.3.7有界變差函數(shù)空間
本章參考文獻(xiàn)
第4章概率論與統(tǒng)計(jì)學(xué)基礎(chǔ)
4.1概率論的基本概念
4.2隨機(jī)變量數(shù)字特征
4.2.1期望
4.2.2方差
4.2.3矩與矩母函數(shù)
4.2.4協(xié)方差與協(xié)方差矩陣
4.3基本概率分布模型
4.3.1離散概率分布
4.3.2連續(xù)概率分布
4.4概率論中的重要定理
4.4.1大數(shù)定理
4.4.2中央極限定理
4.5隨機(jī)采樣
4.5.1隨機(jī)采樣分布
4.5.2蒙特卡羅采樣
4.6參數(shù)估計(jì)
4.6.1參數(shù)估計(jì)的基本原理
4.6.2單總體參數(shù)區(qū)間估計(jì)
4.6.3雙總體均值差的估計(jì)
4.6.4雙總體比例差的估計(jì)
4.7假設(shè)檢驗(yàn)
4.7.1基本概念
4.7.2兩類錯(cuò)誤
4.7.3均值檢驗(yàn)
4.8極大似然估計(jì)
4.8.1極大似然法的基本原理
4.8.2求極大似然估計(jì)的方法
4.9貝葉斯推斷
4.9.1先驗(yàn)概率與后驗(yàn)概率
4.9.2共軛分布
本章參考文獻(xiàn)
第5章子帶編碼與小波變換
5.1圖像編碼的理論基礎(chǔ)
5.1.1率失真函數(shù)
5.1.2香農(nóng)下邊界
5.1.3無記憶高斯信源
5.1.4有記憶高斯信源
5.2子帶編碼基本原理
5.2.1數(shù)字信號(hào)處理基礎(chǔ)
5.2.2多抽樣率信號(hào)處理
5.2.3圖像信息子帶分解
5.3哈爾函數(shù)及其變換
5.3.1哈爾函數(shù)的定義
5.3.2哈爾函數(shù)的性質(zhì)
5.3.3酉矩陣與酉變換
5.3.4二維離散線性變換
5.3.5哈爾基函數(shù)
5.3.6哈爾變換
5.4小波及其數(shù)學(xué)原理
5.4.1小波的歷史
5.4.2小波的概念
5.4.3多分辨率分析
5.4.4小波函數(shù)的構(gòu)建
5.4.5小波序列展開
5.4.6離散小波變換
5.4.7連續(xù)小波變換
5.4.8小波的容許條件與基本特征
5.5快速小波變換算法
5.5.1快速小波正變換
5.5.2快速小波逆變換
5.5.3圖像的小波變換
5.6小波在圖像處理中的應(yīng)用
本章參考文獻(xiàn)
第6章正交變換與圖像壓縮
6.1傅里葉變換
6.1.1信號(hào)處理中的傅里葉變換
6.1.2數(shù)字圖像中的傅里葉變換
6.1.3快速傅里葉變換的算法
6.2離散余弦變換
6.2.1基本概念及數(shù)學(xué)描述
6.2.2離散余弦變換的快速算法
6.2.3離散余弦變換的意義與應(yīng)用
6.3沃爾什阿達(dá)馬變換
6.3.1沃爾什函數(shù)
6.3.2離散沃爾什變換及其快速算法
6.3.3沃爾什變換的應(yīng)用
6.4卡洛南洛伊變換
6.4.1主成分變換的推導(dǎo)
6.4.2主成分變換的實(shí)現(xiàn)
6.4.3基于KL變換的圖像壓縮
本章參考文獻(xiàn)
第7章無所不在的高斯分布
7.1卷積積分與鄰域處理
7.1.1卷積積分的概念
7.1.2模板與鄰域處理
7.1.3圖像的高斯平滑
7.2邊緣檢測(cè)與微分算子
7.2.1哈密爾頓算子
7.2.2拉普拉斯算子
7.2.3高斯拉普拉斯算子
7.2.4高斯差分算子
7.3保持邊緣的平滑處理
7.3.1雙邊濾波算法應(yīng)用
7.3.2各向異性擴(kuò)散濾波
7.3.3基于全變差的方法
7.4數(shù)學(xué)物理方程的應(yīng)用
7.4.1泊松方程的推導(dǎo)
7.4.2圖像的泊松編輯
7.4.3離散化數(shù)值求解
7.4.4基于稀疏矩陣的解法
7.5多尺度空間及其構(gòu)建
7.5.1高斯濾波與多尺度空間的構(gòu)建
7.5.2基于各向異性擴(kuò)散的尺度空間
本章參考文獻(xiàn)
第8章處理彩色圖像
8.1從認(rèn)識(shí)色彩開始
8.1.1什么是顏色
8.1.2顏色的屬性
8.1.3光源能量分布圖
8.2CIE色度圖
8.2.1CIE色彩模型的建立
8.2.2CIE色度圖的理解
8.2.3CIE色度圖的后續(xù)發(fā)展
8.3常用的色彩空間
8.3.1RGB顏色空間
8.3.2CMY/CMYK顏色空間
8.3.3HSV/HSB顏色空間
8.3.4HSI/HSL顏色空間
8.3.5Lab顏色空間
8.3.6YUV/YCbCr顏色空間
8.4色彩空間的轉(zhuǎn)換方法
8.4.1RGB轉(zhuǎn)換到HSV的方法
8.4.2RGB轉(zhuǎn)換到HSI的方法
8.4.3RGB轉(zhuǎn)換到Y(jié)UV的方法
8.4.4RGB轉(zhuǎn)換到Y(jié)CbCr的方法
8.5基于直方圖的色彩增強(qiáng)
8.5.1普通直方圖均衡
8.5.2CLAHE算法
8.5.3直方圖規(guī)定化
8.6暗通道先驗(yàn)的去霧算法
8.6.1暗通道的概念與意義
8.6.2暗通道去霧霾的原理
8.6.3算法實(shí)現(xiàn)與應(yīng)用
本章參考文獻(xiàn)
附錄
法國(guó)數(shù)學(xué)家小傳
德國(guó)數(shù)學(xué)家小傳
英國(guó)數(shù)學(xué)家小傳
其他數(shù)學(xué)家小傳
本附錄參考文獻(xiàn)