本書主要內(nèi)容包括語義圖像分割相關(guān)理論和具體事項(xiàng),在介紹語義圖像分割目的和相關(guān)技術(shù)及傳統(tǒng)分割算法的基礎(chǔ)上,講述了從神經(jīng)網(wǎng)絡(luò)到深度學(xué)習(xí)的發(fā)展過程,重點(diǎn)介紹了全卷積網(wǎng)絡(luò),通過采用卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了從圖像像素到像素類別的變換;從而進(jìn)一步介紹了基于全卷積網(wǎng)絡(luò)改進(jìn)的Unet網(wǎng)絡(luò),以及兩種基于全卷積網(wǎng)絡(luò)的 SegNet網(wǎng)絡(luò):正常版與貝葉斯版。另外,本書還介紹了圖像分割算法DeepLab v1、v2、v3和v3+以及圖卷積神經(jīng)網(wǎng)絡(luò),以及為實(shí)現(xiàn)性能與實(shí)時(shí)雙提高的輕量實(shí)時(shí)語義分割Enet網(wǎng)絡(luò)、殘差編碼器-解碼器網(wǎng)絡(luò)RED-Net、RefineNet,通過顯式利用了下采樣過程的所有信息,使用遠(yuǎn)程殘差連接來實(shí)現(xiàn)高分辨率的預(yù)測。
主持國家自然科學(xué)基金、廣東省自然科學(xué)基金等科研項(xiàng)目6項(xiàng),以第一發(fā)明人申請并授權(quán)國家發(fā)明專利2項(xiàng)