上部深度學習入門
第1章 深度學習基礎 002~017
1.1 深度學習的概念 003
1.1.1 深度學習的發展簡史 003
1.1.2 深度學習的特點 006
1.1.3 深度學習的應用 006
1.2 神經網絡的概念 007
1.2.1 人是如何識別數字的 008
1.2.2 感知機的提出 009
1.3 神經網絡的應用 012
1.3.1 感知機模型 013
1.3.2 能夠識別數字的神經網絡 015
1.4 本章小結與練習 017
本章練習 017
參考文獻 017
第2章 深度學習的算法基礎梯度下降法 018~026
2.1 梯度下降法的定義 018
2.2 梯度下降法的類型 021
2.2.1 批量梯度下降 021
2.2.2 隨機梯度下降 022
2.2.3 小批量隨機梯度下降 022
2.2.4 動量隨機梯度下降 023
2.3 自適應優化算法 024
2.3.1 AdaGrad算法 024
2.3.2 RMSProp算法 025
2.3.3 Adam算法 025
2.4 本章小結與練習 026
本章練習 026
參考文獻 026
第3章 深度學習的結構基礎卷積神經網絡 027~040
3.1 卷積神經網絡基礎 027
3.1.1 卷積神經網絡的發展 028
3.1.2 卷積神經網絡的組成 028
3.2 卷積的基本操作 030
3.2.1 互相關運算 030
3.2.2 特征圖和感受野 031
3.3 卷積操作中的填充和步長 032
3.3.1 填充 032
3.3.2 步長 034
3.4 多通道輸入的卷積與多通道輸出 034
3.4.1 卷積操作 035
3.4.2 多卷積操作 036
3.4.3 多通道輸出 036
3.5 卷積神經網絡的池化層和全連接層 037
3.5.1 池化層 037
3.5.2 全連接層 039
3.6 本章小結與練習 040
本章練習 040
參考文獻 040
第4章 搭建深度學習的運行環境 041~072
4.1 安裝開源軟件包和環境管理系統Anaconda 041
4.1.1 下載Anaconda 042
4.1.2 安裝Anaconda 045
4.1.3 配置國內的下載源 050
4.2 配置Anaconda的環境變量 052
4.3 創建和刪除虛擬環境 056
4.3.1 創建虛擬環境 056
4.3.2 刪除虛擬環境 061
4.4 安裝和配置PyCharm 063
4.4.1 安裝PyCharm 063
4.4.2 使用PyCharm 065
4.4.3 添加解釋器 069
4.5 本章小結 072
下部深度學習實戰
第5章 基于YOLOv8的黃花菜成熟度視覺檢測 074~096
5.1 數據的采集與處理 074
5.1.1 數據采集 075
5.1.2 圖像預處理 075
5.1.3 圖像標注 077
5.2 YOLOv8算法簡介 080
5.2.1 YOLO系列算法的發展歷程 080
5.2.2 YOLOv8算法 081
5.3 基于YOLOv8的黃花菜成熟度檢測實驗 084
5.3.1 搭建實驗環境 084
5.3.2代碼目錄結構 086
5.4 實驗過程及其結果 088
5.4.1 訓練網絡 088
5.4.2 測試模型 090
5.4.3 分析結果 091
5.5 本章小結與練習 095
本章練習 096
參考文獻 096
第6章 基于YOLOv8的帶鋼表面缺陷視覺檢測 097~112
6.1 對帶鋼表面缺陷檢測的研究 097
6.2 數據集的選取及預處理 098
6.2.1 幾類典型的帶鋼表面缺陷 099
6.2.2 帶鋼表面缺陷數據集的選取 101
6.2.3 數據集標簽的轉換與增強 101
6.3 帶鋼表面缺陷檢測模型的訓練 104
6.3.1 模型的訓練過程 104
6.3.2 實驗結果與分析 108
6.4 本章小結與練習 111
本章練習 112
參考文獻 112
第7章 基于YOLOv8的不規范駕駛行為檢測 113~126
7.1 不規范駕駛行為檢測的意義和主要研究方法 113
7.2 網絡優化與數據集 115
7.2.1 對YOLOv8的結構改進 115
7.2.2 數據集的選取與處理 119
7.3 實驗過程及其結果 120
7.3.1 模型的修改與訓練 120
7.3.2 不規范駕駛行為的檢測結果 124
7.4 本章小結與練習 125
本章練習 125
參考文獻 126
第8章 基于深度學習的城市街景語義分割 127~141
8.1 語義分割的概念 127
8.1.1 語義分割的研究 127
8.1.2 語義分割的常用數據集 128
8.2 語義分割的常用模型 129
8.2.1 FCN模型 129
8.2.2 U-Net模型 130
8.2.3 SegNet模型 131
8.2.4 DeepLab模型 132
8.2.5 PSPNet模型 132
8.3 城市街景圖像的語義分割 133
8.4 城市街景語義分割模型的訓練與實驗 134
8.4.1 數據集和語義分割工具的選取 134
8.4.2 網絡結構及其訓練過程 135
8.4.3 實驗驗證及其結果 138
8.5 本章小結與練習 140
本章練習 140
參考文獻 141
第9章 基于wespeaker的聲紋識別技術 142~160
9.1 聲紋識別技術概述 142
9.1.1 聲紋識別的發展歷程 143
9.1.2 wespeaker框架的特點與優勢 144
9.1.3 VoxCeleb數據集概述 145
9.2 基于wespeaker的聲紋識別技術細節 146
9.2.1 梅爾頻率倒譜系數(MFCC) 146
9.2.2 濾波器組特征filter bank 148
9.2.3 FBank的代碼實現 149
9.3 構建一個簡單的基于wespeaker的聲紋識別系統 151
9.3.1 聲紋特征模型的訓練 151
9.3.2 基于聲紋特征模型的聲紋對比程序 156
9.3.3 開發聲紋識別系統的界面 157
9.4 本章小結與練習 159
本章練習 160
第10章 深度學習在新能源發電預測領域中的應用 161~181
10.1 新能源發電預測的基礎知識 162
10.1.1 新能源發電技術及其發展與挑戰 162
10.1.2 構建基于深度學習的新能源功率預測模型 163
10.2 風力發電功率預測 168
10.2.1 風力發電原理 168
10.2.2 構建風力發電功率預測模型 170
10.3 光伏發電功率預測 174
10.3.1 光伏發電原理與影響因素 174
10.3.2 構建光伏發電功率預測模型 176
10.4 本章小結與練習 179
本章練習 180
參考文獻 181
附錄 書中的常用詞匯中英文對照表 182~183