《生成式AI賦能一本通:編程、數據科學與專業寫作》全面介紹了生成式AI在編程、數據科學及專業寫作領域的廣泛應用與深刻影響。主要內容涵蓋生成式AI的核心原理、技術挑戰、治理策略,以及如何通過提示詞工程與AIGC方法論提升工作效率。讀者將從中獲得與AI高效溝通的技巧,掌握利用大模型進行Python程序設計、數據分析、數學與機器學習自學的方法,并通過豐富案例了解AIGC在科技論文寫作、金融數據分析及創建AI智能體等方面的實際應用。本書旨在幫助讀者理解使用大模型的方法和思路,以在AI時代保持競爭力,實現個人與組織的數字化轉型。
本書主要讀者群體包括計算機專業學生、AI從業者、程序員、數據分析師、科研人員及對未來科技感興趣的廣大讀者。
龔超,工學博士,深圳清華大學研究院下一代互聯網研發中心核心成員。中國高科技產業化研究會理事、中國自動化學會普及工作委員會委員、中國人工智能學會中小學工作委員會副主任委員、中國青少年宮協會特聘專家、中法人工智能協會(巴黎)特別顧問、海口經濟學院雅和設計工程學院客座教授、未來基因(北京)人工智能研究院首席專家、教育部教育信息化教學應用實踐共同體項目特聘專家,多家500強企業數字化轉型領域高級顧問。研究方向為人工智能優化算法、人工智能在數字化轉型中的應用等。著有18本人工智能相關圖書,在國內外期刊上發表文章共計70余篇。
夏小俊,博士,東南大學生物科學與醫學工程學院教師。中國計算機學會會員、中國人工智能學會青少年工作委員會講座專家、教育部國培計劃講座專家、教育部課程中心創新實驗室指導專家、全國大學生計算機大賽人工智能組專家評委等。主要研究方向是計算思維與人工智能教育、學習科學(神經教育學)、科學與STEAM教育等領域,著有《中小學人工智能教育實驗課程》等教材。
張鵬宇,未來基因(北京)人工智能研究院中級研究員。擔任由中國人工智能學會、中國自動化學會、中國科學院大學人工智能學院、中國人民大學高瓴人工智能學院聯合主辦的AI探學營機器學習方向、智能體方向實踐導師,中國自動化學會青少年人工智能核心素養測評特聘專家,北京科學中心人工智能高級研修營指導教師。《情感分析:人工智能如何洞察心理》《生成式AI繪畫:Stable Diffusion從基礎到實戰》圖書作者。
蔣戍榮,工學博士,IT咨詢顧問,信息系統開發專家。現專注于日本人工智能領域的數字化教育、學術研究及相關市場開發,致力于推動人工智能技術在企業中的應用。擁有豐富的大型企業信息系統開發與項目管理經驗,曾參與多個財務會計、銀行證券等系統的開發與實施,幫助企業實現數字化轉型與業務優化。多次在國際會議及生產管理學會上發表學術論文。
1 AI交流的探索時代:從對話到協作 001
1.1 大模型引發的技術浪潮與環境重塑 002
1.1.1 從開端到未來:OpenAI發展歷程的技術啟示與社會影響 002
1.1.2 大模型:AI時代的新起點 004
1.1.3 學習、生活與工作的新模式 006
1.1.4 技能不再稀缺,我們應該關注什么? 007
1.2 聊天機器人的那些事兒 010
1.2.1 聊天機器人的演化:從ELIZA到DeepSeek 010
1.2.2 揭開聊天機器人背后的理論淵源:從哲學到未來啟示 015
1.2.3 未來時代,人機協作的必由之路 018
1.3 自然語言處理的發展史 020
1.3.1 什么是自然語言處理 020
1.3.2 萌芽期(1950年代至1970年代):規則方法的探索與局限 022
1.3.3 統計方法的興起(1970年代至2000年代初):自然語言處理的革命性進步 023
1.3.4 深度學習時代(2000年代中期至2010年代):自然語言處理的轉折點 025
1.3.5 預訓練模型的出現(2018年至今) 026
2 解構智慧之源:生成式AI背后的核心原理 028
2.1 大模型的核心算法架構 029
2.1.1 Transformer:AI革命的基石 029
2.1.2 Transformer的擴展與優化模型 031
2.1.3 多模態大模型的崛起:人工智能的新前沿 033
2.2 語言數據與表示方法 035
2.2.1 語言數據的基礎表示:從獨熱編碼到詞袋模型 035
2.2.2 詞向量表示的演化:從Word2Vec到GloVe 037
2.2.3 Token化與語言建模:打開自然語言理解的大門 040
2.3 學習方式與技術突破 041
2.3.1 探索學習范式的多樣性:從傳統到創新 041
2.3.2 基于人類反饋的強化學習 044
2.3.3 規模法則:大模型發展的驅動力 045
2.3.4 涌現:生成式AI中的關鍵現象 047
2.3.5 大模型驅動的社會模擬:以斯坦福小鎮為例 049
3 AIGC的挑戰與治理 053
3.1 生成式AI技術與挑戰 054
3.1.1 大模型幻覺:挑戰、原因與應對策略 054
3.1.2 大模型“三角難題”的權衡與挑戰 056
3.1.3 合成數據:AIGC創作的基石與隱憂 058
3.1.4 大模型的能耗挑戰與綠色發展 060
3.2 AIGC信息與安全 061
3.2.1 內容創作中的隱私與安全 061
3.2.2 AIGC的知識產權挑戰:法律與技術的平衡之道 063
3.2.3 虛假信息與越獄:AIGC時代的挑戰與應對 064
3.3 AIGC與社會發展 066
3.3.1 AIGC時代的職業技能革命:從文字創作到全新崗位 066
3.3.2 跨越技術門檻:AIGC賦能創作與數字鴻溝的平衡之道 068
3.3.3 大模型偏見與AIGC創作:挑戰與共創未來 069
3.3.4 AI時代的素養與能力:從作文到計算思維 070
3.3.5 AIGC時代的教育:禁用還是引導 071
3.3.6 AI對齊:目標、價值觀與利益的平衡之道 073
3.3.7 AIGC倫理挑戰與全球治理探索 074
4 如何與AI有效溝通:提示詞工程 076
4.1 與大模型高效溝通:從提問到提示工程 077
4.1.1 學會提問很重要 077
4.1.2 理解與利用大模型 078
4.1.3 提示與提示工程 080
4.2 提示詞工程技巧 082
4.2.1 思路與原則 082
4.2.2 優化與提升 089
4.2.3 驗證與改進 096
4.3 BRIGHT法則 105
4.3.1 背景詞(background word) 105
4.3.2 角色詞(role word) 106
4.3.3 指令詞(instruction word) 106
4.3.4 引導詞(guided word) 106
4.3.5 啟發詞(heuristic word) 107
4.3.6 任務詞(task word) 107
4.3.7 舉例說明 107
5 AIGC賦能Python程序設計 111
5.1 G-KEEP-ART方法論 112
5.2 G-KEEP-ART方法論實踐 114
5.2.1 明目標,繪藍圖 114
5.2.2 分層次,列清單 115
5.2.3 細解答,舉實例 119
5.2.4 行于實,踐于知 132
5.2.5 活應用,妙理通 135
5.2.6 學需測,記方深 141
5.2.7 學為用,知轉能 145
5.3 人工智能賦能程序設計 148
5.3.1 基于大模型的Python程序入門優勢 148
5.3.2 未來展望:人工智能賦能編程教育 149
6 利用AIGC進行數據分析 150
6.1 AIGC賦能數字素養提升 151
6.1.1 數據素養:驅動創新與進步的核心力量 151
6.1.2 數據分析:提升數據素養的關鍵能力 152
6.1.3 為什么使用大模型進行數據分析? 153
6.2 數據準備與初步分析 154
6.2.1 數據分析準備 154
6.2.2 數據導入與預處理 155
6.2.3 數據理解與探索性分析 160
6.3 深入分析與可視化呈現 167
6.3.1 特征工程 167
6.3.2 假設檢驗 171
6.3.3 時間序列分析 176
6.3.4 可視化 183
7 跟著AIGC自學數學與機器學習 187
7.1 機器學習的數學基礎 188
7.1.1 為什么利用AIGC賦能數學 188
7.1.2 如何利用AIGC賦能數學:以微積分為例 189
7.2 機器學習基礎 196
7.2.1 什么是機器學習 196
7.2.2 機器學習的學習方式 197
7.2.3 機器學習下的四類問題 198
7.2.4 監督學習與無監督學習流程 200
7.3 大模型賦能下的機器學習 201
7.3.1 為何要用大模型學習機器學習 201
7.3.2 詢問學習算法的前置知識 202
7.3.3 一步一步“聊”懂算法原理與代碼 204
7.3.4 問出算法的步驟 208
7.3.5 小學生能懂的機器學習 213
8 AIGC賦能案例 216
8.1 AIGC賦能科技論文寫作 217
8.1.1 四大原則 217
8.1.2 初探:從選題到大綱撰寫 219
8.1.3 深耕:從正文撰寫到成果優化 226
8.2 AIGC賦能金融數據分析 235
8.2.1 金融數據的獲取與分析 235
8.2.2 股票價格預測 239
8.2.3 投資組合優化分析 242
8.3 AIGC賦能創建AI智能體 257
8.3.1 與大模型的協同創作 257
8.3.2 智能體開發全流程示例 257
8.3.3 對話開發的啟示 273
附錄 殊途同歸:大模型的演進 274