每本書都有一個背景故事,敘述作者的成書緣起。通常,背景故事是放在全書的最后幾頁,像事后想法一樣夾雜在一大堆致謝當中,似乎無關緊要。大多數科學著作會將背景故事,連同作者進行研究時腦海中冒出來的各種代名詞和想法完全省掉。科學著作應該是簡潔且客觀的事實羅列(仿佛任何事實都是無可爭辯的),就像寫給《自然》(Nature)雜志的長信那樣。
因此,本書不是一本科學著作。它探索性地講述了一些非正統科學家的思想、實驗和生活,他們正以許多超出你我認知的方式在塑造我們的未來。他們中的某些人認為自己正在掀起一場場革命。事實上,他們的確如此。我講述他們的故事和我自己的故事,因為作為一名新聞記者,我一直認為,記敘文能同議論文一樣向讀者傳遞大量信息,而且講得好的故事毫無例外地會帶有一定的觀點。希望諸位讀者能夠了解我的觀點,以及我的觀點的形成過程,這樣才能判斷我的敘述是否帶有偏見和不公正,抑或是客觀屬實的。如果你不知道我的所思所想的緣起,那么你就無法知道如何理解我所講的內容,以及我省略了什么。
追根溯源,這本書萌芽于我小時候,那時我大概九歲。那時我第一次開始問自己:什么是智能?誰又展現出了智能?
這些問題一直困擾著我,它們總是在我生命中的關鍵時刻出現。環境總是帶有個人觀點,并且總是很緊迫。我常常想知道:我聰明嗎?我夠聰明嗎?我的孩子聰明嗎?
在第一次問這些問題時,我確信自己很笨。我身邊重要的人看起來都那么聰明。我想要具備他們所擁有的那些特質,但那到底是什么呢?許多年之后,我才知道有一整套文獻專門研究這些問題。這些問題曾讓一些智者為之困惑和著迷,比如亞里士多德(Aristotle)和大衛·休謨(David Hume),特別是查爾斯·達爾文(Charles Darwin)和他的兒子弗朗西斯(Francis),以及達爾文的表弟弗朗西斯·高爾頓(Francis Galton)。19世紀以來,一代又一代的人類學家、動物行為學家、生態學家、心理學家、教育家、神經病學家和計算主義者奉獻了他們生命中最好的時光,試圖弄明白什么是智能。(我有沒有提到微生物學家和植物學家?)
他們的大多數沉思都聚焦于我們——智人。而我們得到這一分類學名稱是因為我們具備思考和解決問題的能力:智慧是我們的區別性特征,這一特質使我們超越了其他所有物種。現代計算機科學之父阿蘭·圖靈(Alan Turing)甚至把模仿人類智慧作為所有人工智能的目標。他說,人工智能必須能夠讓我們誤以為它們是我們的同類。
……
對人類故事的第一次重大修訂是由偉大的人類學家和古生物學家劉易斯·里基 (Louis Leakey) 發起的。他對人類的自然歷史很感興趣,因此想要知道復雜的社會行為始于何時,以及我們的哪些祖先首先展示出了這些行為。但古人的遺骨和古老灶臺能揭示的此類行為的信息也只有這么多而已。里基認為,我們可以通過研究類人猿“表親”來了解我們的史前史,因為我們從類人猿中分化出來的時間僅有數百萬年。他懷疑類人猿遠比我們想象的聰明,也更接近人類。
1959年,里基籌集到了足夠的資金,把他的第一位“天使”——簡·古道爾(Jane Goodall) 派遣到野生環境中研究黑猩猩的自然行為。他認為,在男人遭遇失敗的領域,女人會取得成功,因為女人比男人更善于觀察且更有耐心(與里基一起工作的女人必須要有耐心)
描述里基(Leakey)和他的家庭生活的一本奇妙的書是弗吉尼亞·莫萊爾、西蒙和舒斯特(Schuster)于1996年寫的《祖先的熱情》。里基試圖與所有三個天使發生關系,而且肯定與簡·古多爾(Jane Goodall)的母親關系密切,但他的妻子瑪麗(Mary)卻容忍了這些和更壞的事,同時自己也發現了許多重要的化石。
當古道爾報告稱野生黑猩猩制造工具時,世界各地的行為科學家都震驚了。直到那時,制造工具還一直被認為是人類的決定性特征——智能——的客觀產物。接下來,古道爾又將黑猩猩描述為生活在復雜社會中的社會性動物。她記錄了它們的權力階層、族群間戰爭和愛情、嫉妒、共享的能力,甚至收養行為,以及它們如何獵取比自己小的哺乳動物。古道爾讓貢貝 (Gombe) 的黑猩猩舉世聞名,她為每一個黑猩猩取名(這引起了保守派學者的恐慌),寫下它們的生活故事,就好像它們是人類一樣。
戴安·福西 (Dian Fossey) 的研究緊隨其后,她在剛果維龍加國家公園(Virunga National Park)研究山地大猩猩。這座公園位于剛果與盧旺達的邊境附近,后來被劃入盧旺達。她也給大猩猩取了名字,并讓它們出了名。就在我們制作《新荒野》系列的過程中,福西在保護大猩猩免受偷獵者和所謂保護旅游傷害的戰斗中被害。隨后,里基的第三位天使——加拿大人比魯特·高爾迪卡斯 (Birute Galdikas)開始對極其聰明的婆羅洲猩猩進行報道。而這些猩猩的生存卻受到了威脅,因為它們賴以生存的雨林遭到了砍伐和焚燒。
那時,其他科學家也在發表文章,介紹他們正在野外研究的其他物種所表現出的智能行為。他們常常拍攝電影來記錄自己的工作。《新荒野》購買了這些電影的播放權,而且我們把他們的照片變成了故事。
……
讓“人腦”走下神壇
韓鋒
智能是什么?
我曾問一位世界級的人工智能專家,他說沒有權威的定義。后來,我又嘗試與一位來清華大學訪問的美國專家討論智能的定義,他也沒有直接回答。但他的一番話值得人深思,他說:“要等30年,等到人類把大腦研究清楚才可以回答什么是智能。”我終于明白了他們不敢回答智能的關鍵:人類有一個天然的假設:只有人的大腦才可能有真正的智能。就像幾百年前我們相信地球是宇宙的中心一樣,我們把“人腦”放到了智能領域的中心位置,某個至高無上的位置。但可惜的是,在生物學領域,人在大腦的研究上進展甚微,我們至今也不清楚大腦運轉的機制,所以現在專家們都不敢回答“智能是什么”。
但本書的作者,伊萊恩·迪瓦,以其記者的敏銳、求真的渴望、智者的良知,用大量的采訪事實試圖告訴我們:認為“人腦”的智能至高無上,主要是由于人對于其他物種的無知,對于宇宙規律理解得膚淺,以及難以避免的偏見。其實智能大量存在于和人腦完全不同的事物中。因此,她想當“哥白尼第二”!
在研究區塊鏈是否具有分布式智能的時候,我查了許多文獻,發現在20世紀30年代,阿蘭·圖靈就石破天驚地提出:機器也可以(像人那樣)思考嗎?這也是他的一篇著名論文的標題。
眾所周知,阿蘭·圖靈是計算機之父,計算機界的圖靈獎可以與諾貝爾獎并駕齊驅。跨越一個世紀,我們再回到阿蘭·圖靈的問題,重新思考智能究竟如何產生,就會發現不光是生物大腦才可以產生智能,物理的圖靈機也可以產生智能,甚至已經做到了通過圖靈測試讓人無法識別機器和人腦的差別既然符合物理規律的機器也可以產生“智能”,那讓我們鼓足勇氣,用物理定律去探尋智能是什么吧:
第一,智能一定是一個低熵系統。熵代表系統的混亂和無知程度。產生智能的前提是要想辦法降低系統的熵,這樣才能產生確定的信息,這正是計算機現今在做的事情。
第二,智能要能夠產生信息的結構和秩序,沒有結構的信息沒法表達意義(比如語法)。
第三,目前人工智能最大的突破——產生概念和意識,也就是智能的整體收斂性。
接下來讓我們一步步分析。
第一,一個系統要想降低熵,就一定要有麥克斯韋妖。在麥克斯韋時代(100多年前,麥克斯韋剛剛為電磁學奠定基礎),熵最大原理處于統治地位。熵增原理能統治著幾乎所有的熱力學現象。但麥克斯韋設想系統中存在一種“妖”,它能把一個封閉盒子里的本來熱平衡的分子從一邊趕到另一邊,從而讓一個熱力學系統自動熵減,違反熵最大的原理。100多年來,這一設想讓世界物理學家迷惑不解。
直到1961年,IBM實驗室提出的Landauer原理,以及1982年C.Bennett才逐漸解釋了麥克斯韋妖的現象,但解釋得依舊不徹底。我認為,麥克斯韋妖必須要用量子不確定性來解答:① 它為什么存在;②它為什么不違反熵最大原理。
事實上,這并不違反熵增原理,由于系統中麥克斯韋妖的存在,熵才會減少。這個過程中,系統里的麥克斯韋妖把自己的信息給了系統,自己的熵增大了。所以整個過程并不違反熵最大原理。
……
先大概說一下重整化群,重整化群究竟是一個什么樣的方法?為什么它可以收斂到低熵?比如說這個自旋系統,它是可以自相似的,就是這個三角形可以無限小,就是每個格子還可以產生更小的三角形。你再看更小的三角形,就跟那個樹葉一樣,它還可以無限的小,就是這么一個結構。本來描述這樣一個自相似的分形結構需要的信息熵是無窮大!
那重整化群怎么處理呢?
既然它是自相似的,三個三角形又可以構成一個更大的三角形,它某種程度上自相似,而且規律是一樣的。這些所謂的三角形,這三個又能構成跟大的三角形,它是一個不同地層次,但是規律是一樣的。我讓這些無窮多的小積分積到一塊兒,做一個常數加進來,然后我只關注大的三角形就行了,可以幾次迭代下去,這樣我們就可以得到一個低熵有限的收斂結果,這是量子場論最早產生的重整化群,最早完全沒意識到它的意義,只不過當時就是為了回避所謂積分無窮大。
所謂深度學習網絡DNN的辦法,完全類似(如下圖所示):這個圖右上角那個就表示DNN的重整化群過程,本來最下面一層可視神經元收到的信息熵可以很大,然后第二層神經元和他們有一個相互作用J,但是只用了第一層三分之一的神經元(這對應于自相似結構的尺度放大三角形),但是只有這第二層的作用,基本無法做到讓DNN“學習差距”最小,所以還得多設這樣的神經網絡層,但每層的神經元數都遞減,都符合重整化群的變換規則,最后達到DNN“學習差距”最小的目的,也就是一個低熵收斂的結果。人工智能網絡的“概念”,誕生了!
重整化群的特點,我們總結一下,就是不斷通過信息的自相似來降低我們每層神經網絡的節點數,讓我們處理的信息熵越來越少,但又不失去信息的整體特征(概念)。
人工智能其實最難以突破的就是所謂模式識別。蔡維德教授說我們的計算都是快速地笨蛋,它是不能形成概念的,你要讓他識別貓,你把天下所有貓的照片給它了,它也不知道什么叫貓。它只能是暴力計算。
所以人工智能曾經停滯很多年,就是因為它只能用窮舉法。我就說了,最后你會發現,這些所謂的概念完全是一種自相似的概念,那個貓,那天下所有貓,最后你為什么能有貓的概念,你是完全忽略了每個個體的不同,它的毛不同、爪子不同、眼睛的顏色不同,你全忽略了,最后收斂到一個貓的感覺,一個完全跟重整化群類似的一個智能過程,它把大量地不同信息“卷積”重整掉,但是它找到了內在聯系和相似性,把細節都忽略掉。Google的神經網絡首先做到了這一點,2012年,它終于從千萬張貓的照片中形成了貓的概念(見下圖):
最近互聯網金融有個特火的概念,叫“區塊鏈”
區塊鏈目前還是一種很初級的人工智能,只是利用分布式節點記賬(麥克斯韋妖)來構建一個低熵的信用系統。即使以太坊區塊鏈的智能合約,也只是希望實現“自動執行”。但是以太坊實現了區塊鏈上的圖靈完備編程,未來可以設想區塊鏈的網絡可以向重整化群和深度學習方向發展。如此,多層次的區塊鏈將真正可能實現全球大腦的功能。
總而言之,人類終于到達了一個認知臨界點:我們可以完全以宇宙的普遍規律來理解智能,人腦只是宇宙萬物中智能現象的一部分,但它不是宇宙的唯一,也不是智能的中心!
讓我們和本書作者一起,開啟人類的第二次啟蒙運動之旅吧!