適讀人群 :高等院校人工智能和計算機科學等相關專業高年級本科生和研究生,研究機器學習、因果推理的技術人員 1.世上萬事萬物,有因就有果,有果必有因。事物為什么會發生,為什么會得到某種結果?根源就在于因果關系。
2.本書是世界知名學者十年來研究因果關系的總結,在因果推理和通用機器學習之間建立了牢固的聯系,使得我們和機器可以用數據更清晰地理解世界。
3.哥倫比亞大學David Blei教授、艾倫??圖靈研究所Ricardo Silva研究員傾情推薦。
4.本書提供了一個獨立且簡明的因果關系模型介紹,以及如何從數據中學習因果模型。
因果關系是一個有吸引力的研究領域。它的數學化才剛剛起步,許多概念問題仍然存在爭論——通常爭論比較激烈。
《因果推理:基礎與學習算法》總結了作者十年來分析因果關系所得到的結果,雖然有些人研究這一問題的時間比作者更長,也存在一些關于因果關系方面的圖書,包括Pearl(2009)、Spirtes等人(2000)以及Imbens和Rubin(2015)的綜述,但是作者希望本書能從兩方面補充現有的工作。
首先,《因果推理:基礎與學習算法》傾向于因果關系的子問題,認為因果關系是最基本的,也是最不現實的。這就是因果效應問題,在這個問題上,被分析的系統只包含兩個可觀測變量。在過去的十年里,作者對這個問題進行了較為詳細的研究。作者報告了這項工作的大部分內容,并試圖將其納入作者認為對因果關系問題有選擇性但深刻理解的基礎背景中。雖然按照章節順序先研究二元情況可能有一定的指導意義,但也可以直接開始閱讀多變量章節。
其次,《因果推理:基礎與學習算法》中的方法受到機器學習和計算統計領域的激勵和影響。本書感興趣的是這些方法如何幫助推斷因果結構,更感興趣的是因果推理是否能告訴人們機器學習的方式。事實上,作者認為,如果不把概率分布描述的隨機實驗作為出發點,而是考慮概率分布背后的因果結構,那么能很好理解機器學習的一些最深刻的開放性問題。
《因果推理:基礎與學習算法》試圖為具有概率論、統計和機器學習基礎的讀者提供一個系統的主題介紹(為了完整起見,附錄A.1和A.2給出了最重要的概念)。
雖然《因果推理:基礎與學習算法》建立在Pearl(2009)和 Spirtes等人(2000)的工作所代表的因果關系圖解的基礎上,但作者的個人品味影響了主題的選擇。為了保持本書的可讀性,并將注意力集中在概念性問題上,令人遺憾的是,不得不在因果關系的一些重大問題上投入較少的篇幅,無論是對特定背景的理論見解,還是對各種具有實際重要性的方法的深入了解。作者試圖為一些明顯的遺漏引用文獻,但可能忽略了一些重要的主題。
《因果推理:基礎與學習算法》也有一些缺點,其中一些內容是從該領域繼承而來的,例如理論結果往往局限于有無窮多的數據的情況。雖然本書提供了有限數據情況的算法和方法,但是沒有討論這些方法的統計性質。此外,在一些地方,本書忽略了測度理論問題,往往假設密度的存在。作者發現所有這些問題都是相關的和有趣的,但作者做出了這些選擇,以保持本書的簡潔和易讀性。
再一個是免責聲明。計算因果關系的方法仍處于起步階段,只是在有限的情況下,從數據中學習因果結構是可行的。《因果推理:基礎與學習算法》試圖在可能的情況下包括具體的算法,但作者清楚地意識到,因果推理的許多問題比典型的機器學習問題更困難,因此無法保證這些算法都能解決讀者的問題。請不要對這句話感到氣餒,因果學習是一個有趣的話題,作者希望閱讀本書可以說服讀者開始研究它。
如果沒有大家的支持,作者就無法完成《因果推理:基礎與學習算法》這本書。
作者非常感謝德國奧博沃爾法赫數學研究所對三位作者的支持,在該研究所工作期間,三位作者完成了《因果推理:基礎與學習算法》的大部分內容。
感謝Michel Besserve、Peter Bühlmann、Rune Christiansen、Frederick Eberhardt、Jan Ernest、 Philipp Geiger、Niels Richard Hansen、Alain Hauser、Biwei Huang、Marek Kaluba、Hansruedi Künsch、Steffen Lauritzen、Jan Lemeire、David Lopez-Paz、Marloes Maathuis、Nicolai Meinshausen、S.ren Wengel Mogensen、Joris Mooij、Krikamol Muandet、Judea Pearl、Niklas Pfister、Thomas Richardson、Mateo Rojas-Carulla、Eleni Sgouritsa、Carl Johann Simon-Gabriel、Xiaohai Sun、Ilya Tolstikhin、Kun Zhang和 Jakob Zscheischler,在作者寫《因果推理:基礎與學習算法》的過程中,提供了許多有用的評論和有趣的討論。特別是Joris和Kun參與了本書介紹的大部分研究。??
感謝德國卡爾斯魯厄理工學院、瑞士蘇黎世聯邦理工學院和德國圖賓根大學多位學生對《因果推理:基礎與學習算法》初稿的閱讀及校對,并提出許多令人鼓舞的問題。
最后,感謝來自Westchester出版服務公司的匿名評審專家和編輯團隊的有益建議,以及麻省理工學院出版社的工作人員,特別是Marie Lufkin Lee和Christine Bridget Savage,感謝他們在整個寫作過程中提供了良好的支持。
Jonas Peters、Dominik Janzing和 Bernhard Schölkopf
哥本哈根和圖賓根
??
自從1956年首次提出“人工智能”(AI)概念,AI一直處于爭議之中。AI或被稱作人類文明耀眼未來的預言,或被當成技術瘋子的狂想扔到垃圾堆里。直到2012年之前,這兩種聲音還同時存在。2012年以后,得益于數據量的上漲、運算力的提升和深度學習的出現,AI在理論研究及應用領域開始了大的爆發。
世上萬事萬物,有因就有果,有果必有因。事物為什么會發生、為什么會得到某種結果,都是通過論述事物的因果關系來完成的。然而,因果推理一直被視為機器學習理論中缺失的部分,除了執果索因的貝葉斯定理,很少有方法能對因果關系進行建模。目前,因果關系是一個極具吸引力的研究領域。其理論研究和應用試探才剛剛起步,許多概念問題仍然存在爭論。
因果推理是探討利用數據確定因果關系、度量因果效應的方法。近年來,包括哲學、統計學、計算機科學、社會學、醫學和公共衛生等領域的研究者對因果及其推理方法進行了廣泛的探討和研究。因果圖模型提供了一種用概率圖進行因果推理的框架。因為它能直觀表示因果知識,有效地對因果效應進行概率推斷,所以使得與它相關的方法成為統計學、機器學習、生物信息等領域的一個研究熱點。然而,利用數據,特別是觀察數據進行因果的學習和推理的方法還不完善,大多基于實際數據的因果分析很難得到理想的效果。
《因果推理:基礎與學習算法》的第1章從概率論與統計學入手,介紹了因果模型和因果學習。第2章分析了因果推理的假設,揭示這些假設所暗含的因果推理和學習的目的。第3~5章針對兩個變量的情況介紹結構因果模型、干預和反事實等概念,然后論述了學習因果模型,以及因果模型與機器學習之間的關系。第6~8章將第3~5章的概念和理論推廣到多變量情況。第9章分析因果推理中隱藏變量的相關問題。最后,第10章討論時間序列的因果推斷。
《因果推理:基礎與學習算法》的翻譯出版得到了機械工業出版社的大力支持,在此特致感謝。我們的研究生在全書的初稿形成、圖表編輯等諸多方面給予了幫助,在此一并致謝。
《因果推理:基礎與學習算法》第1~5章以及附錄部分由盧勝男博士翻譯,第6~10章由李小和博士翻譯,程國建教授對全書進行了通稿和校對并參與了部分內容的翻譯。在翻譯過程中,譯者力求忠實、準確地把握原著,同時保留原著風格。但由于譯者水平有限,書中難免有錯誤和不準確之處,懇請廣大讀者批評指正。
譯 者