深度學習是新一代人工智能所使用的主要技術,而大模型是新一代人工智能的最新成果,是走向通用人工智能的重要里程碑式產品。本書深入淺出地講解了深度學習和大模型的相關技術,含人工神經網絡與卷積神經網絡原理、神經網絡優化、損失函數設計、目標分類、目標檢測、實例分割、生成對抗網絡、長尾學習、Transformer、大模型等核心技術。對每種技術,本書均從原理和實現層面講解算法和技術的相關背景、主要思想、神經網絡模型結構、損失函數,并通過舉例等方式方便讀者的理解,使讀者能夠領會算法的精妙和關鍵之處,并掌握其技術細節。最后,本書深入剖析了Transformer架構及大語言模型的核心技術與應用,揭示了人工智能在自然語言處理領域的最新突破。