幾年前,“數(shù)學(xué)之美”系列文章原刊載于谷歌黑板報(bào),獲得上百萬(wàn)次點(diǎn)擊,并被熱情的讀者廣為傳播,得到高度評(píng)價(jià)。讀者說(shuō),讀了“數(shù)學(xué)之美”,才發(fā)現(xiàn)大學(xué)時(shí)學(xué)的數(shù)學(xué)知識(shí),比如馬爾科夫鏈、矩陣計(jì)算,甚至余弦函數(shù)原來(lái)都如此親切,并且栩栩如生,才發(fā)現(xiàn)自然語(yǔ)言和信息處理這么有趣,才真正明白“數(shù)學(xué)是科學(xué)的皇后”這句名言。
今年,作者吳軍博士幾乎把所有的文章都重寫了一遍,為的是能把高深的原理講得更加通俗易懂,讓非專業(yè)讀者也能領(lǐng)略數(shù)學(xué)的魅力。經(jīng)過(guò)改寫和重構(gòu)后,《數(shù)學(xué)之美》在整體和細(xì)節(jié)的度上控制得更好。希望讀者通過(guò)具體的例子學(xué)到的是思考問(wèn)題的方式,學(xué)會(huì)如何化繁為簡(jiǎn),如何用數(shù)學(xué)去解決工程問(wèn)題,如何跳出固有思維不斷去思考創(chuàng)新。同時(shí)書中也留了很多問(wèn)題給愿意鉆研的人做進(jìn)一步深入思考。
相關(guān)視頻請(qǐng)點(diǎn)擊:
《浪潮之巔》作者、谷歌公司Principal Engineer吳軍博士最新力作《數(shù)學(xué)之美》由創(chuàng)新工場(chǎng)董事長(zhǎng)兼首席執(zhí)行官李開復(fù)傾力作序推薦。《數(shù)學(xué)之美》的創(chuàng)作源自點(diǎn)擊超百萬(wàn)的谷歌黑板報(bào)專題博客,吳軍應(yīng)出版要求幾乎改寫和重構(gòu)了所有的文章,既照顧了普通讀者的興趣,又兼顧了專業(yè)讀者對(duì)深度的要求。 在《數(shù)學(xué)之美》中,吳軍帶領(lǐng)您領(lǐng)略數(shù)學(xué)之美,架起從數(shù)學(xué)到應(yīng)用的橋梁,教會(huì)您如何化繁為簡(jiǎn),如何用數(shù)學(xué)解決工程問(wèn)題,如何打破思維定式不斷思考創(chuàng)新。 《數(shù)學(xué)之美》是獻(xiàn)給每一位對(duì)自然、科學(xué)、生活有興趣的朋友的禮物。本書榮獲第八屆文津圖書獎(jiǎng)。 更多相關(guān)暢銷好書請(qǐng)點(diǎn)擊: 《浪潮之巔(第2版)套裝上下冊(cè)》《浪潮之巔(上冊(cè))(第2版)》《浪潮之巔(下冊(cè))(第2版)》
序言
我去年曾經(jīng)給吳軍的《浪潮之巔》寫序,今年很高興得知他的《數(shù)學(xué)之美》也即將出版了!
和《浪潮之巔》一樣,《數(shù)學(xué)之美》也是當(dāng)年作為 Google 資深研究員的吳軍在 谷歌 黑板報(bào)上應(yīng)邀撰寫的一系列文章。說(shuō)實(shí)在的,剛開始,黑板報(bào)的版主還有點(diǎn)擔(dān)心這個(gè)系列會(huì)不會(huì)讓讀者覺得太理論而感到枯燥,但很快這個(gè)顧慮就被打消了。《數(shù)學(xué)之美》用生動(dòng)形象的語(yǔ)言,結(jié)合數(shù)學(xué)發(fā)展的歷史和實(shí)際的案例,談古論今,系統(tǒng)地闡述了與現(xiàn)代科技領(lǐng)域相關(guān)的重要的數(shù)學(xué)理論的起源、發(fā)展及其作用,深入淺出,受到廣大讀者尤其是科技類人士的喜愛。
之前就曾說(shuō)過(guò),在我認(rèn)識(shí)的頂尖研究員和工程師里,吳軍是極少數(shù)具有強(qiáng)大敘事能力和對(duì)科技、信息領(lǐng)域的發(fā)展變化有很深的縱向洞察力,并能有效歸納總結(jié)的人之一。在《數(shù)學(xué)之美》里,吳軍再次展示了這一特點(diǎn)。與《浪潮之巔》不同的是,這次吳軍集中闡述了他對(duì)數(shù)學(xué)和信息處理這些專業(yè)學(xué)科的理解,尤其是他在語(yǔ)音識(shí)別、自然語(yǔ)言處理和信息搜索領(lǐng)域多年來(lái)的積累 。 從數(shù)字和信息的由來(lái),到搜索引擎對(duì)信息處理的背后的數(shù)學(xué)原理,到與搜索相關(guān)的眾多領(lǐng)域后面的奇妙的數(shù)學(xué)應(yīng)用,吳軍都娓娓道來(lái)。他把數(shù)學(xué)后面的本質(zhì)思維寫得透徹、生動(dòng)。不得不說(shuō),他的文字,引人入勝,也確實(shí)讓我們體會(huì)到數(shù)學(xué)的美。在他的筆下,數(shù)學(xué)不是我們一般聯(lián)想到的枯燥深?yuàn)W的符號(hào),而是實(shí)實(shí)在在源于生活的有趣的現(xiàn)象和延伸。數(shù)學(xué),其實(shí)無(wú)處不在,而且有一種讓人驚嘆的韻律和美!
伽利略曾經(jīng)說(shuō)過(guò),“數(shù)學(xué)是上帝描寫自然的語(yǔ)言”;愛因斯坦也曾說(shuō)過(guò),“純數(shù)學(xué)使我們能夠發(fā)現(xiàn)概念和聯(lián)系這些概念的規(guī)律,這些概念和規(guī)律給了我們理解自然現(xiàn)象的鑰匙。”我多年來(lái)一直也對(duì)信息處理、語(yǔ)音識(shí)別領(lǐng)域有著一定的研究,深深體會(huì)到數(shù)學(xué)在所有科學(xué)領(lǐng)域起到的基礎(chǔ)和根本的作用。“哪里有數(shù),哪里就有美”。在這里,我把《數(shù)學(xué)之美》真誠(chéng)推薦給每一位對(duì)自然、科學(xué)、生活有興趣有熱情的朋友,不管你是搞理科還是搞文科的,讀一讀數(shù)學(xué)的東西,會(huì)讓你非常受益,同時(shí)能感受到宇宙和世界的美好與奇妙。
吳軍把之前谷歌黑板報(bào)上的“數(shù)學(xué)之美”系列文章編輯成現(xiàn)在的這本書,花費(fèi)了大量的心血和時(shí)間。他本著十分嚴(yán)謹(jǐn)?shù)膽B(tài)度,在繁忙的工作之余,補(bǔ)充了之前的系列,并幾乎重寫了所有的文章,既照顧了普通讀者的興趣,又兼顧了專業(yè)讀者對(duì)深度的要求,很讓人欽佩。
有時(shí)我在想,現(xiàn)在的社會(huì)多了一點(diǎn)壓力和浮躁,少了一點(diǎn)踏實(shí)和對(duì)自然科學(xué)本質(zhì)的好奇求知。吳軍的這本《數(shù)學(xué)之美》真的非常好。非常希望吳軍今后能寫出更多這樣深入淺出的好書,它們會(huì)是給這個(gè)社會(huì)和年輕人最好的禮物。
李開復(fù) 2012年 于創(chuàng)新工場(chǎng)
吳軍博士,畢業(yè)于清華大學(xué)和美國(guó)約翰·霍普金斯大學(xué)(博士),是著名自然語(yǔ)言處理和搜索專家,硅谷風(fēng)險(xiǎn)投資人。
吳軍博士,于2002年加入谷歌公司。在谷歌,他和Amit Singhal(谷歌院士,世界著名搜索專家)、Matt Cutts(谷歌反作弊官方發(fā)言人)等三位同事一起開創(chuàng)了網(wǎng)絡(luò)搜索反作弊的研究領(lǐng)域,并因此獲得谷歌工程獎(jiǎng)。2003年,他和谷歌全球架構(gòu)的總工程師朱會(huì)燦博士等共同成立了中日韓文搜索部門。吳軍博士是當(dāng)前谷歌中日韓文搜索算法的主要設(shè)計(jì)者。在谷歌期間,他還領(lǐng)導(dǎo)了許多研發(fā)項(xiàng)目,包括許多與中文相關(guān)的產(chǎn)品和自然語(yǔ)言處理的項(xiàng)目,并得到了當(dāng)時(shí)公司首席執(zhí)行官埃里克·施密特和創(chuàng)始人謝爾蓋·布林的高度評(píng)價(jià)。2010年加盟騰訊公司,出任負(fù)責(zé)搜索和搜索廣告的副總裁。2012年回到谷歌,領(lǐng)導(dǎo)創(chuàng)新項(xiàng)目。目前任谷歌公司的Principal Engineer(首席工程師)。
吳軍博士在國(guó)內(nèi)外發(fā)表過(guò)數(shù)十篇論文,曾獲得1995年全國(guó)人機(jī)語(yǔ)音智能接口會(huì)議的最佳論文獎(jiǎng)和2000年Eurospeech的最佳論文獎(jiǎng)。他還獲得和申請(qǐng)了十余項(xiàng)美國(guó)和國(guó)際專利。他撰寫的《浪潮之巔》(第一版)和《數(shù)學(xué)之美》深受業(yè)界的好評(píng)。
吳軍博士在美國(guó)兩家風(fēng)險(xiǎn)投資基金(中國(guó)世紀(jì)基金和ZPark風(fēng)險(xiǎn)基金)分別擔(dān)任董事和顧問(wèn),他還擔(dān)任約翰·霍普金斯大學(xué)工學(xué)院董事會(huì)董事,以及該校國(guó)際事務(wù)委員會(huì)的顧問(wèn)。他曾經(jīng)是國(guó)家重大專項(xiàng)“新一代搜索引擎和瀏覽器”項(xiàng)目的總負(fù)責(zé)人。從2012年起任職工業(yè)與信息化部的專家和顧問(wèn)。
出版說(shuō)明
序言1
序言2
前言
第1章 文字和語(yǔ)言 vs 數(shù)字和信息
文字和語(yǔ)言與數(shù)學(xué),從產(chǎn)生起原本就有相通性,雖然它們的發(fā)展一度分道揚(yáng)鑣,但是最終還是能走到一起。
1 信息
2 文字和數(shù)字
3 文字和語(yǔ)言背后的數(shù)學(xué)
4 小結(jié)
第2章 自然語(yǔ)言處理 — 從規(guī)則到統(tǒng)計(jì)人類對(duì)機(jī)器理解自然語(yǔ)言的認(rèn)識(shí)走了一條大彎路。早期的研究集中采用基于規(guī)則的方法,雖然解決了一些簡(jiǎn)單的問(wèn)題,但是無(wú)法從根本上將自然語(yǔ)言理解實(shí)用化。直到?多年后,人們開始嘗試用基于統(tǒng)計(jì)的方法進(jìn)行自然語(yǔ)言處理,才有了突破性進(jìn)展和實(shí)用的產(chǎn)品。
1 機(jī)器智能
2 從規(guī)則到統(tǒng)計(jì)
3 小結(jié)
第3章 統(tǒng)計(jì)語(yǔ)言模型
統(tǒng)計(jì)語(yǔ)言模型是自然語(yǔ)言處理的基礎(chǔ),并且被廣泛應(yīng)用于機(jī)器翻譯、語(yǔ)音識(shí)別、印刷體或手寫體識(shí)別、拼寫糾錯(cuò)、漢字輸入和文獻(xiàn)查詢。
1 用數(shù)學(xué)的方法描述語(yǔ)言規(guī)律
2 延伸閱讀:統(tǒng)計(jì)語(yǔ)言模型的工程訣竅
3 小結(jié)
第4章 談?wù)勚形姆衷~
中文分詞是中文信息處理的基礎(chǔ),它同樣走過(guò)了一段彎路,目前依靠統(tǒng)計(jì)語(yǔ)言模型已經(jīng)基本解決了這個(gè)問(wèn)題。
1 中文分詞方法的演變
2 延伸閱讀:工程上的細(xì)節(jié)問(wèn)題
3 小結(jié)
第5章 隱含馬爾可夫模型
隱含馬爾可夫模型最初應(yīng)用于通信領(lǐng)域,繼而推廣到語(yǔ)音和語(yǔ)言處理中,成為連接自然語(yǔ)言處理和通信的橋梁。同時(shí),隱含馬爾可夫模型也是機(jī)器學(xué)習(xí)的主要工具之一。
1 通信模型
2 隱含馬爾可夫模型
3 延伸閱讀:隱含馬爾可夫模型的訓(xùn)練
4 小結(jié)
第6章 信息的度量和作用
信息是可以量化度量的。信息熵不僅是對(duì)信息的量化度量,也是整個(gè)信息論的基礎(chǔ)。它對(duì)于通信、數(shù)據(jù)壓縮、自然語(yǔ)言處理都有很強(qiáng)的指導(dǎo)意義。
1 信息熵
2 信息的作用
3 延伸閱讀:信息論在信息處理中的應(yīng)用
4 小結(jié)
第7章 賈里尼克和現(xiàn)代語(yǔ)言處理
作為現(xiàn)代自然語(yǔ)言處理的奠基者,賈里尼克教授成功地將數(shù)學(xué)原理應(yīng)用于自然語(yǔ)言處理領(lǐng)域中,他的一生富于傳奇色彩。
1 早年生活
2 從水門事件到莫妮卡·萊溫斯基
3 一位老人的奇跡
第8章 簡(jiǎn)單之美 — 布爾代數(shù)和搜索引擎的索引布爾代數(shù)雖然非常簡(jiǎn)單,卻是計(jì)算機(jī)科學(xué)的基礎(chǔ),它不僅把邏輯和數(shù)學(xué)合二為一,而且給了我們一個(gè)全新的視角看待世界,開創(chuàng)了數(shù)字化時(shí)代。
1 布爾代數(shù)
2 索引
3 小結(jié)
第9章 圖論和網(wǎng)絡(luò)爬蟲
互聯(lián)網(wǎng)搜索引擎在建立索引前需要用一個(gè)程序自動(dòng)地將所有的網(wǎng)頁(yè)下載到服務(wù)器上,這個(gè)程序稱為網(wǎng)絡(luò)爬蟲,它的編寫是基于離散數(shù)學(xué)中圖論的原理。
1 圖論
2 網(wǎng)絡(luò)爬蟲
3 延伸閱讀:圖論的兩點(diǎn)補(bǔ)充說(shuō)明
4 小結(jié)
第10章 PageRank — Google的民主表決式網(wǎng)名
網(wǎng)頁(yè)排名技術(shù)是早期的殺手锏,它的出現(xiàn)使得網(wǎng)頁(yè)搜索的質(zhì)量上了一個(gè)大的臺(tái)階。它背后的原理是圖論和線性代數(shù)的矩陣運(yùn)算。
1 PageRank 算法的原理
2 延伸閱讀:PageRank 的計(jì)算方法
3 小結(jié)
第11章 如何確定網(wǎng)頁(yè)和查詢的相關(guān)性確定網(wǎng)頁(yè)和查詢的相關(guān)性是網(wǎng)頁(yè)搜索的根本問(wèn)題,其中確定查詢中每個(gè)關(guān)鍵詞的重要性有多高是關(guān)鍵。是目前通用的關(guān)鍵詞重要性的度量,其背后的原理是信息論。
1 搜索關(guān)鍵詞權(quán)重的科學(xué)度量TF-IDF頁(yè)排名技術(shù)
2 延伸閱讀:TF-IDF 的信息論依據(jù)
3 小結(jié)
第12章 地圖和本地搜索的最基本技術(shù)
有限劃地圖和本地服務(wù)中要用到有限狀態(tài)機(jī)和動(dòng)態(tài)規(guī)劃技術(shù)。
這兩項(xiàng)技術(shù)是機(jī)器智能和機(jī)器學(xué)習(xí)的工具,它們的應(yīng)用非常廣泛,還包括語(yǔ)音識(shí)別、拼寫和語(yǔ)法糾錯(cuò)、拼音輸入法、工業(yè)控制和生物的序列分析等。
1 地址分析和有限狀態(tài)機(jī)
2 全球?qū)Ш胶蛣?dòng)態(tài)規(guī)劃
3 延伸閱讀:有限狀態(tài)傳感器
4 小結(jié)
第13章 Google AK-47 的設(shè)計(jì)者 — 阿米特·士
在所有輕武器中最有名的是沖鋒槍,因?yàn)樗鼜牟豢ぃ灰讚p壞,可在任何環(huán)境下使用,可靠性好,殺傷力大并且操作簡(jiǎn)單。的產(chǎn)品就是按照上述原
則設(shè)計(jì)的。
第14章 余弦定理和新聞的分類
計(jì)算機(jī)雖然讀不懂新聞,卻可以準(zhǔn)確地對(duì)新聞進(jìn)行分類。
其數(shù)學(xué)工具是看似毫不相干的余弦定理。
1 新聞的特征向量
2 向量距離的度量
3 延伸閱讀:計(jì)算向量余弦的技巧
4 小結(jié)
第15章 矩陣運(yùn)算和文本處理中的兩個(gè)分類問(wèn)題無(wú)論是詞匯的聚類還是文本的分類,都可以通過(guò)線性代數(shù)中矩陣的奇異值分解來(lái)進(jìn)行。這樣一來(lái),自然語(yǔ)言處理的問(wèn)題就變成了一個(gè)數(shù)學(xué)問(wèn)題。
1 文本和詞匯的矩陣
2 延伸閱讀:奇異值分解的方法和應(yīng)用場(chǎng)景
3 小結(jié)
第16章 信息指紋及其應(yīng)用
世間萬(wàn)物都有一個(gè)唯一標(biāo)識(shí)的特征,信息也是如此。每一條信息都有它特定的指紋,通過(guò)這個(gè)指紋可以區(qū)別不同的信息。
1 信息指紋
2 信息指紋的用途
3 延伸閱讀:信息指紋的重復(fù)性和相似哈希
4 小結(jié)
第17章 由電視劇《暗算》所想到的 — 談?wù)勗?br />密碼學(xué)的根本是信息論和數(shù)學(xué)。沒(méi)有信息論指導(dǎo)的密碼是非常容易被破解的。只有在信息論被廣泛應(yīng)用于密碼學(xué)后,密碼才真正變得安全。
1 密碼學(xué)的自發(fā)時(shí)代
2 信息論時(shí)代的密碼學(xué)
3 小結(jié)
第18章 閃光的不一定是金子 — 談?wù)勊阉饕骖}
閃光的不一定是金子,搜索引擎中排名靠前的網(wǎng)頁(yè)也未必是有用的網(wǎng)頁(yè)。消除這些作弊網(wǎng)頁(yè)的原理和通信中過(guò)濾噪音的原理相同。這說(shuō)明信息處理和通信的很多原理是相通的。
第19章 談?wù)剶?shù)學(xué)模型的重要性
正確的數(shù)學(xué)模型在科學(xué)和工程中至關(guān)重要,而發(fā)現(xiàn)正確模型的途徑常常是曲折的。正確的模型在形式上通常是簡(jiǎn)單的。
第20章 不要把雞蛋放到一個(gè)籃子里 — 談?wù)勑?br />最大熵模型是一個(gè)完美的數(shù)學(xué)模型。它可以將各種信息整合到一個(gè)統(tǒng)一的模型中,在信息處理和機(jī)器學(xué)習(xí)中有反作弊問(wèn)題著廣泛的應(yīng)用。它在形式上非常簡(jiǎn)單、優(yōu)美,而在實(shí)現(xiàn)時(shí)需要有精深的數(shù)學(xué)基礎(chǔ)和高超的技巧。
1 最大熵原理和最大熵模型
2 最大熵模型的訓(xùn)練
3 小結(jié)
第21章 拼音輸入法的數(shù)學(xué)原理
漢字的輸入過(guò)程本身就是人和計(jì)算機(jī)之間的通信。好的輸入法會(huì)自覺或不自覺地遵循通信的數(shù)學(xué)模型。當(dāng)然要做出最有效的輸入法,應(yīng)當(dāng)自覺使用信息論做指導(dǎo)。
1 輸入法與編碼
2 輸入一個(gè)漢字需要敲多少個(gè)鍵 — 談?wù)勏戕r(nóng)
3 拼音轉(zhuǎn)漢字的算法
4 延伸閱讀:個(gè)性化的語(yǔ)言模型
5 小結(jié)
第22章 自然語(yǔ)言處理的教父馬庫(kù)斯和他的們
將自然語(yǔ)言處理從基于規(guī)則的研究方法轉(zhuǎn)到基于統(tǒng)計(jì)的研究方法上,賓夕法尼亞大學(xué)的教授米奇·馬庫(kù)斯功不可沒(méi)。他創(chuàng)立了今天在學(xué)術(shù)界廣泛使用的語(yǔ)料庫(kù),同時(shí)培養(yǎng)了一大批精英人物。
1 教父馬庫(kù)斯
2 從賓夕法尼亞大學(xué)走出的精英們
第23章 布隆過(guò)濾器
日常生活中,經(jīng)常要判斷一個(gè)元素是否在一個(gè)集合中。布隆過(guò)濾器是計(jì)算機(jī)工程中解決這個(gè)問(wèn)題最好的數(shù)學(xué)工具。
1 布隆過(guò)濾器的原理
2 延伸閱讀:布隆過(guò)濾器的誤識(shí)別問(wèn)題
3 小結(jié)
第24章 馬爾可夫鏈的擴(kuò)展 — 貝葉斯網(wǎng)絡(luò)
貝葉斯網(wǎng)絡(luò)是一個(gè)加權(quán)的有向圖,是馬爾可夫鏈的擴(kuò)展。而從認(rèn)識(shí)論的層面看:貝葉斯網(wǎng)絡(luò)克服了馬爾可夫鏈那種機(jī)械的線性約束,它可以把任何有關(guān)聯(lián)的事件統(tǒng)一到它的框架下面。它在生物統(tǒng)計(jì)、圖像處理、決策支持系統(tǒng)和博弈論中都有廣泛的使用。
1 貝葉斯網(wǎng)絡(luò)
2 貝葉斯網(wǎng)絡(luò)在詞分類中的應(yīng)用
3 延伸閱讀:貝葉斯網(wǎng)絡(luò)的訓(xùn)練
4 小結(jié)
第25章 條件隨機(jī)場(chǎng)和句法分析
條件隨機(jī)場(chǎng)是計(jì)算聯(lián)合概率分布的有效模型,而句法分析似乎是英文課上英語(yǔ)老師教的東西,這兩者有什么聯(lián)系呢?
1 句法分析計(jì)算機(jī)算法的演變
2 條件隨機(jī)場(chǎng)
3 小結(jié)
第26章 維特比和他的維特比算法
維特比算法是現(xiàn)代數(shù)字通信中使用最頻繁的算法,同時(shí)也是很多自然語(yǔ)言處理的解碼算法。可以毫不夸張地講,維特比是對(duì)我們今天生活的影響力最大的科學(xué)家之一,因?yàn)槿缃窕诘囊苿?dòng)通信標(biāo)準(zhǔn)主要就是他創(chuàng)辦的高通公司制定的。
1 維特比算法
2 CDMA 技術(shù) — 3G 移動(dòng)通信的基礎(chǔ)
3 小結(jié)
第27章 再談文本自動(dòng)分類問(wèn)題 — 期望最大化算法
只要有一些訓(xùn)練數(shù)據(jù),再定義一個(gè)最大化函數(shù),采用算法,利用計(jì)算機(jī)經(jīng)過(guò)若干次迭代,就可以得到所需要的模型。這實(shí)在是太美妙了,這也許是我們的造物主刻意安排的。所以我把它稱作上帝的算法。
1 文本的自收斂分類
2 延伸閱讀:期望最大化和收斂的必然性
3 小結(jié)
第28章 邏輯回歸和搜索廣告
邏輯回歸模型是一種將影響概率的不同因素結(jié)合在一起的指數(shù)模型,它不僅在搜索廣告中起著重要的作用,而且被廣泛應(yīng)用于信息處理和生物統(tǒng)計(jì)中。
1 搜索廣告的發(fā)展
2 邏輯回歸模型
3 小結(jié)
第29章 各個(gè)擊破算法和Google 云計(jì)算的基礎(chǔ)
Google頗為神秘的云計(jì)算中最重要的MapReduce工具,其原理就是計(jì)算機(jī)算法中常用的“各個(gè)擊破”算法,它的原理原來(lái)這么簡(jiǎn)單 — 將復(fù)雜的大問(wèn)題分解成很多小問(wèn)題分別求解,然后再把小問(wèn)題的解合并成原始問(wèn)題的解。由此可見,在生活中大量用到的、真正有用的方法
常常都是簡(jiǎn)單樸實(shí)的。
1 分治算法的原理
2 從分治算法到MapReduce
3 小結(jié)
附錄
后記
索引
世間萬(wàn)般表象的背后皆有規(guī)律。科學(xué)研究的真正目的,在于找到這些規(guī)律并能夠舉一反三地應(yīng)用這些規(guī)律。對(duì)于自然科學(xué)和工程學(xué),包括計(jì)算機(jī)科學(xué)和通信,數(shù)學(xué)是描述這些規(guī)律性最好的工具。做事情的方法有對(duì)與錯(cuò)、好和壞之分,從長(zhǎng)期看只有采用對(duì)的方法、好的方法才能做出好的產(chǎn)品和服務(wù)。而任何一個(gè)好的方法背后都有充分的理論依據(jù),都有正確的方法論。
本書的一個(gè)目的在于揭示信息和自然語(yǔ)言處理以及它們?cè)谕ㄐ藕突ヂ?lián)網(wǎng)各種應(yīng)用(語(yǔ)音識(shí)別、機(jī)器翻譯、搜索、分類等)中的數(shù)學(xué)原理,從而幫助讀者認(rèn)識(shí)到:解決這些問(wèn)題,好的方法是什么。毫無(wú)疑問(wèn),解決這些問(wèn)題需要智能,而計(jì)算機(jī)本身并沒(méi)有智能,它有的只是巨大的計(jì)算能力。只有找到描述這些問(wèn)題的數(shù)學(xué)模型,才能利用計(jì)算機(jī)解決這些需要智能的問(wèn)題,這樣,計(jì)算機(jī)看上去也似乎聰明起來(lái)了。
數(shù)學(xué)之美,首先在于其內(nèi)容或許復(fù)雜而深?yuàn)W,但形式常常很簡(jiǎn)單。簡(jiǎn)單=美,這不僅在科學(xué)和工程上成立,而且在產(chǎn)品開發(fā)和設(shè)計(jì)上也是如此,這和設(shè)計(jì)大師喬布斯“少即是多”的原則不謀而合。同時(shí),數(shù)學(xué)之美還在于數(shù)學(xué)原理的通用性和普遍性。一個(gè)好的數(shù)學(xué)模型,常常能解決一系列,甚至是許多看似毫不相干領(lǐng)域的實(shí)際問(wèn)題。在數(shù)學(xué)上的一點(diǎn)突破,可以帶動(dòng)很多領(lǐng)域和行業(yè)的進(jìn)步。
數(shù)學(xué)給人的印象常常是抽象而深?yuàn)W、難以理解和應(yīng)用不明確的。產(chǎn)生這個(gè)這個(gè)誤解的原因是缺乏從數(shù)學(xué)到應(yīng)用的橋梁,本書希望拋磚引玉,期待著能有更多的人一起來(lái)搭建這座橋梁。
……