本書用豐富的圖示和實(shí)驗(yàn),將物體的自動理解技術(shù)和機(jī)器學(xué)習(xí)的理論 相結(jié)合,以實(shí)現(xiàn)物體的自動理解技術(shù)為主線,以機(jī)器學(xué)習(xí)的理論作為主要 方法,結(jié)合實(shí)例逐步深入地介紹了機(jī)器學(xué)習(xí)相關(guān)理論。主要內(nèi)容包括特征 提取、三維網(wǎng)格分割、三維場景重建、三維模型功能性分析等,涵蓋了目 前常用的主流的各種學(xué)習(xí)方法。 本書結(jié)構(gòu)緊湊,內(nèi)容逐步深入,同時(shí)包含大量實(shí)驗(yàn)進(jìn)行講解說明。適 合相關(guān)領(lǐng)域的本科生、研究生以及工程技術(shù)人員閱讀。
物體自動理解是室內(nèi)機(jī)器人、無人駕駛汽車、無人飛行器面臨的一項(xiàng)復(fù)雜課題。理解的任務(wù)在于,利用搭載的深度傳感器、多視角相機(jī)、機(jī)載雷達(dá)等,主動識別場景中的物體,認(rèn)識物體與物體之間的結(jié)構(gòu)關(guān)系,明確場景中人作為活動對象與物體之間的交互作用。理解的實(shí)現(xiàn)方式為,將室內(nèi)場景、外部道路周邊環(huán)境、空間環(huán)境自動轉(zhuǎn)換為物體標(biāo)注,解析物體關(guān)系,建立人與物體的交互關(guān)系,重建三維環(huán)境。正確的場景感知可以實(shí)現(xiàn)自主認(rèn)知和適應(yīng)環(huán)境,有利于室內(nèi)機(jī)器人室內(nèi)定位和移動路徑規(guī)劃;有利于無人駕駛汽車實(shí)現(xiàn)在復(fù)雜道路上的安全自動駕駛;有利于無人飛行器實(shí)現(xiàn)空中搜救與環(huán)境監(jiān)測等無人值守的全自動任務(wù)。
機(jī)器學(xué)習(xí)也是近年來的研究熱點(diǎn),在機(jī)器學(xué)習(xí)領(lǐng)域,各種新型的算法層出不窮。本書將物體自動理解與機(jī)器學(xué)習(xí)相結(jié)合,從多個(gè)方面對基于機(jī)器學(xué)習(xí)的物體自動理解技術(shù)進(jìn)行了詳細(xì)的介紹。
本書由以下幾部分構(gòu)成:
第一部分?jǐn)⑹隽宋矬w自動理解技術(shù)的概念和研究意義,詳細(xì)闡述了本書的研究價(jià)值。
第二部分介紹了多種前沿的、有效的特征提取方法。針對圖像的場景解析,本書提出了一種全新的深度學(xué)習(xí)框架,能夠有效地進(jìn)行結(jié)構(gòu)化學(xué)習(xí)。設(shè)計(jì)了兩套構(gòu)建高層結(jié)構(gòu)化信息的三維信息學(xué)習(xí)框架:基于環(huán)特征的學(xué)習(xí)框架和基于詞包編碼的特征學(xué)習(xí)框架。同時(shí),提出了基于深度置信網(wǎng)絡(luò)的三維形狀高層特征提取方法,成功將深度學(xué)習(xí)方法應(yīng)用于三維形狀數(shù)據(jù)的理解中。
第三部分在分析研究主流三維網(wǎng)格分割算法的基礎(chǔ)上,提出了兩個(gè)新的基于多標(biāo)準(zhǔn)的三維網(wǎng)格評價(jià)度量手段,提供了一種更符合人類認(rèn)知的評價(jià)方法,解決了網(wǎng)格分割標(biāo)準(zhǔn)不唯一的問題。同時(shí),提出了一種基于凹陷區(qū)域探測和啟發(fā)式快速行進(jìn)二分類方法的三維模型自動分割算法,利用該方法提取三維模型的標(biāo)準(zhǔn)姿態(tài),實(shí)現(xiàn)了對非剛性三維模型的檢索。
第四部分在三維物體識別的基礎(chǔ)上,進(jìn)行了三維場景的重建。與傳統(tǒng)重建技術(shù)有著本質(zhì)區(qū)別,本書提出的三維重建方法不是簡單地將深度相機(jī)獲得的點(diǎn)云數(shù)據(jù)進(jìn)行配準(zhǔn)得到場景重建,而是對場景中的所有物體進(jìn)行識別并與數(shù)據(jù)庫中的模型進(jìn)行匹配,實(shí)現(xiàn)了三維場景的語義重建。本書利用隨機(jī)回歸森林法從數(shù)據(jù)庫中匹配出物體的最相似三維模型,并根據(jù)深度信息變換到場景中,得到單幅圖像的模型重建,利用改進(jìn)的迭代最近點(diǎn)方法進(jìn)行數(shù)據(jù)配準(zhǔn),得到多幅圖像之間的坐標(biāo)變換,從而將單幅圖像的重建結(jié)果融合到一個(gè)完整的場景。
第五部分對三維模型的功能性分析技術(shù)進(jìn)行了介紹。功能性檢測是最近幾年才被提出來的三維模型理解方法,本書將以基于人體骨架的三維模型功能性分析為主,對該類方法進(jìn)行詳細(xì)的論述。通過將特定的模型與待檢測的物體模型互相交互來判斷某物體是否具有某項(xiàng)功能,進(jìn)而找到該物體的功能位置;同時(shí),采用基于舒適性的姿態(tài)調(diào)整方法生成人體模型,通過舒適程度的大小來判斷當(dāng)前人體模型的姿態(tài)合理性。
查看全部↓
前言
第一部分 緒論
第1章 什么是物體自動理解技術(shù)
1.1 物體自動理解技術(shù)概念
1.2 研究意義
第二部分 特征提取
第2章 三維模型概述
2.1 三維模型的起源與發(fā)展
2.2 三維模型的獲取與存儲
2.3 國內(nèi)外三維模型特征提取的研究現(xiàn)狀
第3章 基于二維圖像的特征提取
3.1 深度學(xué)習(xí)的出現(xiàn)和發(fā)展
3.2 深度學(xué)習(xí)原理概述
3.3 基本的前饋神經(jīng)網(wǎng)絡(luò)模型
3.4 深度學(xué)習(xí)模型訓(xùn)練中的優(yōu)化方法和常用技巧
3.5 內(nèi)嵌推理的深度網(wǎng)絡(luò)框架
3.6 特征學(xué)習(xí)層
3.7 結(jié)構(gòu)學(xué)習(xí)層
3.8 特征融合層
3.9 實(shí)驗(yàn)分析
第4章 基于深度學(xué)習(xí)的三維模型特征提取
4.1 三維模型的底層特征提取
4.2 模型的中層特征提取
4.3 三維模型的高層特征提取
4.4 實(shí)驗(yàn)驗(yàn)證與分析
第5章 基于深度置信網(wǎng)絡(luò)的三維模型特性提取
5.1 相關(guān)算法理論
5.2 算法框架
5.3 數(shù)據(jù)預(yù)處理和視角圖像的生成
5.4 特征提取
5.5 實(shí)驗(yàn)驗(yàn)證與結(jié)果分析
5.6 小結(jié)
第三部分 三維網(wǎng)格分割與模型檢索
第6章 視覺分割技術(shù)概述
6.1 分割背景和意義
6.2 圖形分割的國內(nèi)外研究現(xiàn)狀
第7章 二維圖像分割算法研究
7.1 顏色空間及分析
7.2 紋理特征及分析
7.3 常用彩色圖像分割方法
7.4 小結(jié)
第8章 三維網(wǎng)格分割研究
8.1 網(wǎng)格分割概述
8.2 基于有監(jiān)督學(xué)習(xí)的三維模型分割
8.3 基于譜嵌入的三維模型共分割
8.4 基于用戶交互的快捷分割
8.5 基于凸度估計(jì)和快速行進(jìn)方法的三維模型自動分割算法
第9章 多標(biāo)準(zhǔn)三維物體分割評價(jià)
9.1 相似性漢明距離
9.2 熵增
9.3 自適應(yīng)熵增
9.4 評價(jià)實(shí)驗(yàn)
9.5 其他評價(jià)方法
第10章 非剛性單位模型檢索應(yīng)用
10.1 三維形狀分類方法簡介
10.2 形狀檢索定義
10.3 三維形狀檢索研究現(xiàn)狀
10.4 常用檢索評價(jià)方法
10.5 非剛性三維模型檢索
第四部分 三維場景重建
第11章 基于三維場景分割的三維重建
11.1 圖像預(yù)處理
11.2 基于邊緣檢測的RGBD圖像過分割
11.3 地面和墻的測定及對分割結(jié)果的處理
11.4 基于隨機(jī)回歸森林的場景區(qū)域識別
11.5 目標(biāo)提取
11.6 場景更新
11.7 實(shí)驗(yàn)結(jié)果
11.8 小結(jié)
第五部分 三維模型功能性分析
第12章 功能性分析相關(guān)理論
12.1 功能性分析的引入
12.2 基于舒適性的人體骨架模型姿態(tài)設(shè)計(jì)
12.3 研究現(xiàn)狀
第13章 基于人體骨架的三維模型功能性分析
13.1 三維模型功能性檢測及應(yīng)用
13.2 基于舒適性的人體模型生成
13.3 功能性分析實(shí)驗(yàn)驗(yàn)證
13.4 相關(guān)討論
參考文獻(xiàn)
查看全部↓