生物密碼:基因組學新紀元
DNA(脫氧核糖核酸)是一種生物密碼,雖僅由A(腺嘌呤)、C(胞嘧啶)、G(鳥嘌呤)、T(胸腺嘧啶)四種堿基構成,但大道至簡,這份簡單卻是無數復雜生命的起點。本書想要傳遞的主旨是,盡管基因組學領域的研究已成就非凡,但該學科大時代的序幕才剛剛拉開。較之地球上不勝枚舉的復雜生命中所蘊含的深刻奧義,我們現在所發現的,僅僅是最初的螢火微光;所能解答的,也只是萬千謎題中的滄海一粟。此后的任務,是將地球從小到大,由內而外地徹底梳理清楚——小到基因組、大到地球生境;內至五臟六腑、外達四海五洲。
在本書的八個章節中,我們會全面地回顧過去、展望未來,從DNA雙螺旋結構的發現開始,一直介紹到未來有望以行星為規模的基因組研究。該領域的研究一路走來,突破不斷、驚喜連連。本書會將已取得的成果一一道來,充分展示其迅猛發展的全貌。
在此,我們要向許多人致謝。首先要感謝我們的編輯,可敬的拉莎?梅農(Latha Menon)女士。從最初的調研到最終的版式,她引導我們完成了本書出版的每一個環節,并常常在咖啡時間親切地和我們分享她的人生智慧。我們也同樣要感謝她的助理愛瑪?馬(Emma Ma),她也為我們提供了寶貴的幫助和建議。當然,牛津大學出版社(Oxford University Press)更是功不可沒,在此一并致謝。
其次,我們還要感謝本書初稿的讀者們。有見地的讀者是每位作者夢寐以求的,蘇塞?菲爾德(Suse Field)和約翰?菲爾德(John Field)正是其中的翹楚。在本書撰寫的過程中,他們提出了大量優質的反饋意見。安德魯?辛格(Andrew Singer)在我們撰寫“基因組故事”時幫忙出謀劃策,去蕪存菁。杰克?吉爾伯特(Jack Gilbert)和羅布?奈特(Rob Knight)對本書的初稿進行了閱讀和評論,但他們最大的貢獻還是作為我們的同事,用自己的學術成果為“生物多樣性基因組學”這門新興研究領域的形成添磚加瓦。此外,希拉里?吉爾伯特(Hillary Gilbert)和瑪莎?比曼(Martha Beeman)共同出色地承擔了本書的校對和評論工作。
當然,本書的一切疏漏與錯誤均由我們兩位作者負責。自1995年基因組研究起步至今,正是科學家們所發表的一篇篇開拓性的論文,才使得本領域激情四溢、精彩紛呈、碩果累累。當然,這一切還離不開各項基金的慷慨支持。本書的作者之一尼爾?戴維斯(Neil Davies)代表他個人,感謝戈登與貝蒂?摩爾基金會 (Gordon and Betty Moore Foundation) 對他在莫雷阿島所進行的研究之大力支持。最后,我們還要感謝基因組學領域所有其他方向的研究者們,他們的學術成果大力推動了我們的研究進展。感謝你們在過去幾年中與我們攜手合作,將一項又一項計劃從創意變為可能。你們才是尚未公布的行星基因組項目(Planetary Genome Project)真正的領導者。
道恩,菲爾德,尼爾?戴維斯
推薦序一
工業革命和互聯網技術的浪潮激蕩著人類文明和現代生活。摩爾定律在很長一段時間內定義了技術進步的速度,基因組技術卻以超摩爾定律的速度改變著人類的生活,迅速刷新了人類對自身的認識,延展了對長命百歲的憧憬。
1869年米歇爾發現核素,人類開始認識到我們細胞內存在著神奇的遺傳物質;1953年沃森和克里克發現了DNA的雙螺旋結構,奠定了基因組學的基礎;1995年第一個全基因組序列繪制完成,吹響了基因組革命的號角;2003年第一個人類基因組序列完成測序,我們開始窺探生命的密碼;2013年千人基因組測序完成,同年發起了百萬人基因組計劃,加速探索健康、疾病和遺傳物質的關系;而在作為精準醫學元年的2016年,人們開始提出“我的基因我知道,我的健康我做主”的生活主張,開始量化自我。
當然,基因組不是生命過程的全部,畢竟基因組要發揮作用,還要經過RNA、蛋白質、小分子、細胞、組織、系統和個體這樣從微觀到宏觀的轉錄和翻譯過程,這是利用分子生物學來進行健康疾病研究的路徑。通過測序、質譜、細胞生物學、影像學、生理學和免疫學等一系列方法對生命的不同表現尺度進行研究,可以通過測量或存儲不同生命過程中的樣本來進行,從而極度擴展人類活到120歲甚至永生不死的想象。想必大家都看過電影“侏羅紀公園”,隨著基因組技術的發展,從被固定在琥珀中的蚊子體內抽取恐龍血液,提取DNA樣本并進而復活恐龍也并非不可能。最近有個有趣的科學發現:科學家在西伯利亞的冰川下發現了一只猛犸象的冷凍樣本,并從樣本中發現了猛犸象的活細胞。科學家很快將這些活細胞進行了保存,并計劃通過無性手工克隆的方法,將猛犸象的細胞核注入到大象的卵細胞中重新復活猛犸象。如果大家有機會參觀深圳國家基因庫(全球第四個國家級基因庫,也是全球最大的集樣本庫、數據庫和活體庫為一體的生物資源庫),就可以感受到人類對永生這一夢想的向往是多么強烈!
現在不少人關注健康比較直接的指標是體重,畢竟這關系到外貌和健康。如果大家某一天起床后發現自己的BMI(身體質量指數)沒能及格,大可不必擔心,其實你的體重至少可以再減掉約2千克——減掉這2千克,你就可以及格啦!其實我們不僅有人類基因組這一套穩定的基因組,還有一套動態的基因組,那就是生活在我們體表、呼吸道、生殖道和腸道里的細菌的基因組,也就是我們常提到的宏基因組。這些細菌不僅增加了我們的體重,還左右了我們的生活習慣,甚至決定著我們的健康狀態,而我們顯然離不開它們。所以說細菌的基因組是我們的第二套基因組。這些細菌加上我們的心理因素,構成了我們的健康內環境。我們還有第三套基因組,也就是我們的生活環境,包括空氣、水和土壤中的生物體的基因組,這些生物體和我們生活于其中的社會構成了影響健康的外環境。
當我們擔心機器人在智力上是否可以戰勝人類的同時,我們自己其實也在造物上開始挑戰大自然。我們在解讀DNA序列的同時,開始設計和合成DNA序列,并且已經成功邁過合成原核生物,向合成真核生物努力。雖然目標還比較簡單,只是要合成酵母!合成DNA序列還有一個美好的前景,就是我們可以擁有更大容量的“硬盤”,要知道1克DNA可以存儲700TB的數據。撇開目前測序的速度,如果按現在600美元測序一個人類基因組的價格水平,讀一遍這個硬盤上的信息成本將高達420萬美元。加之目前合成DNA的成本約為測序成本的幾十萬倍,所以硬盤廠商們大可不必擔心:這塊“硬盤”的造價在今天可能只有極少數巨頭企業能夠承擔。當然,如果合成DNA的成本太高,我們還有一項壓箱底的技術,那就是DNA編輯,這項技術童叟無欺,不管是成本還是速度都令人滿意。
所有的技術都具有兩面性。基因組技術的革命,在改善我們的健康生活上具有不可想象的潛力,但也可能成為種族歧視的“幫兇”,淪為侵犯隱私的工具。就像我們討論原子能和人工智能技術一樣,只有通過合理的利用,它們才不會成為毀滅人類自己的武器。此書對這個命題進行了充分的討論,同時也闡述了基因組技術對人類自身、對環境、對地球,甚至對宇宙探索的深遠影響,是全面了解基因組技術的歷史、研究和應用的一本不可多得的書。
深圳華大基因研究院 方林
推薦序二
“人類基因組計劃”經常被拿來和阿波羅登月計劃相提并論,其重要性不言而喻。尤其是該計劃曾舉全球各國科學界之力,歷經多年大規模的跨國合作,花費政府和民間數十億美元的巨額資金,這些至今都被業內外人士津津樂道。科學界和產業界陸續從中挖掘出重要信息,并成功應用于生命科學、醫學、農業、環境保護等領域,這些都證實了該項目的高瞻遠矚,以及對生命科學和醫療健康領域發展的巨大推動力。但是我們也看到,對基因組科學來龍去脈的了解以及對其未來巨大價值的理解尚未深入人心,甚至還有偏見和誤解存在。《基因組革命》這本書的作者道恩?菲爾德和尼爾?戴維斯用一種深入淺出且饒有趣味的方式,帶領我們認識了人類發現DNA、解讀DNA、利用DNA以及進一步嘗試通過基因組科學了解和改善各種生態系統多樣性這一簡明卻又波瀾壯闊的基因組科學發展過程。
此書所展現的行業趨勢和動態讓人耳目一新,甚至有的觀點讓人拍案叫絕。大家不妨回顧一下:在生命科學領域,二十年前我們還在兢兢業業地在分子生物學實驗室內一個接一個地克隆基因,為發現每一個單基因的新功能而欣喜若狂;十余年前,我們還在為是否有必要開始人類基因組計劃爭論不休,甚至教科書上都偏執地認為人類基因組中存在所謂的“垃圾DNA”,毫無生物學意義;而到了今天,我們已經可以用極低的成本和極短的時間完成各種物種的全基因組測序和分析,我們甚至開始嘗試利用基因編輯、細胞免疫、DNA合成等新興技術和手段治療各種疾病,乃至創造新的生命體……這是一個多么讓人振奮的基因組學變革時代!
就在我作序之時,有媒體報道紐約基因組中心和哥倫比亞大學的研究人員已經實現了每克DNA存儲214PB數據的存儲密度,而這個密度是數年前科學家第一次嘗試用DNA存儲數據之時存儲密度的100多倍,可見這個前沿領域發展之迅猛。正如此書作者所描述的那樣,基因組科學的誕生和飛速發展,已經為我們對各種生命體、對人類自己、對地球的各級生態系統的多樣性,甚至對宇宙演化的理解打開了一個“潘多拉魔盒”。我們也看到,以往數百年、數千年來科學家對生命發展和地球演化史一些重大問題的困惑,都將在基因組科學的發展中一個個地得到解答。更重要的是,作者給我們描述了這樣一副生動的畫面:茫茫宇宙中的萬物生靈,不管是低等生物如以海洋領鞭毛蟲為代表的看不見的數量龐大的微生物菌群,還是高等生物如你我,在地球數十億年的發展過程中,始終共享著同一套生命密碼,而且彼此之間一直互相影響著,可以說是“你中有我,我中有你”。正如書中所提及的,我們這一代(或者數代)人的歷史使命,就是通過基因組測序等手段把這些彼此獨立又互相交錯的生命密碼“翻譯”出來,最終實現對個體生命的數字化,對細胞微生態系統的數字化,乃至對整個地球行星生態系統的數字化。
感謝詹姆斯?沃森、弗朗西斯?克里克、喬治?丘奇、克雷格?文特爾、弗朗西斯?科林斯等書中提及的諸多基因組學先驅的卓越付出和大膽嘗試,讓我們終于得以一窺這個藍色星球誕生以來數十億物種共享的生命密碼。更讓人激動的是,面對這部巨大的天書,我們正處在從被動閱讀到主動改造的角色轉變過程中。我們相信,諸多基于基因組學的奇跡都可能會在數年內發生。試著想一想,我們可能很快就可以: 用一湯勺的DNA儲存全球圖書館的書籍資料;用實驗室合成出的新的微生物生命體處理工業廢品、廢液或用于產生新的能源;用一顆小小的個人定制的微生物藥丸改變我們每個人的腸道亞健康狀況,甚至治療各種棘手的疾病;用一個精心設計的基于基因編輯技術的方案修復有遺傳缺陷的胚胎、改變病患體內致病性的特殊基因突變,甚至治愈癌癥……
不過,基因組學的革命之路目前依然面臨著諸多挑戰,一個典型的例子就體現在我本人長期關注和從事的精準醫療領域。目前我們對人類基因組數據的解讀依然不充分,我們對基因變異和疾病之間的聯系的了解還非常有限,我們對基因組上浩渺的非編碼區DNA的認識依舊寥寥可數,我們對個人基因組信息如何充分用于臨床決策還處于摸索階段,我們也缺乏足夠的臨床診斷、治療方案和藥物,甚至我們對表觀基因組和微生物組在人體這個微生態系統中的奇妙作用的認識也才剛剛開始……而要改變這些現狀,真正實現個性化導向的精準醫療,就需要我們摒棄傳統的作坊式的科研方式和封閉式的藥物開發流程,打開門來協作創新,比如書中提及的基因組數據的充分共享,以及支持開展針對數以萬計對象的基因組測序項目。這背后一個簡單的科學邏輯就是:只有開放更多,才能了解更多;只有了解更多,才能行動更多。此外不可忽視的是,基因組學本身也可能成為一柄“雙刃劍”,所以對安全、倫理、法規方面的規范和監管也要引起我們的足夠重視,并采取行動。我們需要科學界、產業界和大眾大范圍的共同努力,正確認識基因組學,改變傳統觀念,打破圍墻和羈絆,大力擁抱基因組革命帶來的偉大契機。
其實,我們對世界的認識,對這顆藍色星球的影響力,伴隨著基因組革命時代的到來,已經發生了翻天覆地的變化。一個偉大的基因組時代已經來臨。你,準備好了嗎?
英特爾公司亞太區精準醫療業務負責人 李健
推薦序三
1946年,美國軍方為了計算彈道,在賓夕法尼亞大學制造出世界上第一臺電子計算機,占地80英尺×8英尺,重達28噸,造價約48萬美元。68年后,蘋果公司發布智能手表Apple Watch,將個人計算機的部分功能安置在幾英寸寬的手腕上,云端的計算觸手可及。
1985年,美國能源部提出開創基因組大規模研究的“人類基因組計劃”(HGP),與曼哈頓計劃、阿波羅登月計劃并稱為20世紀三大科學計劃。1990年HGP啟動,計劃投入30億美元,歷時15年完成。2000年,參加HGP的美、英、日、法、德、中等國科學家宣布計劃草圖完成。單個基因組測序成本約100萬美元,15年后,單個基因組測序成本降至約1000美元。
基因是什么?
生物學家說,基因是記錄有遺傳信息的DNA片段;遺傳學家說,基因是遺傳的基本單位;化學家說,基因是脫氧核糖核酸;更多人說,基因是生命的密碼,是開啟未來人類健康之門的鑰匙。
基因和環境的共同作用構成生命體。生物世代繁衍,親代借助基因向子代傳遞含膚色、發色,以及疾病風險在內的種種遺傳特征信息。而通過基因檢測,人們能夠在身體尚未發生疾病癥狀前預測健康風險,實現“上醫治未病”。在面臨疑難雜癥時,基因診斷成為了醫生的好幫手,開辟了新的路徑。對于腫瘤等惡性疾病,基因技術可以發現新的致病因素,通過基因在個體上的量化差異,實現“異病同治”和“同病異治”。
基因技術已從科學殿堂緩步而下,進入醫院、體檢機構和保險領域,在不遠的將來極有可能走進千家萬戶。
機械化、電氣化、自動化分別造就了前三次工業革命,以生物技術和信息化為基礎的第四次工業革命初現端倪。生物技術和信息技術的重要結合點之一便是基因。
生命是復雜多樣的,代代相傳的密碼就是基因。基因作為遺傳的基本單位,通過復雜的機制,編譯著生命的狀態。
在20世紀90年代,我們對這些的理解還很膚淺。而近20年來,以高通量基因測序技術為核心的基因技術將基因信息轉化為數據,使得生命得以數字化、序列化地呈現。結合計算機平臺和數學建模,通過數據文件解析基因奧秘已經逐步深入,在臨床一線、農業、水產業、健康等方方面面得以應用,甚至有大型企業根據用戶的基因定制高價的啤酒。
故事到這還遠遠沒有結束。
讀基因是了解,是結合分子生物學與信息科學,對生命進行革命性的認知。通過基因識別身份、祖源甚至預測后代的外貌特征。寫基因是改造,是進入基因內部進行編輯,在基因層面改造生命,使之按照指定的方向發展。在未來,我們甚至有可能使用進行基因編輯后的動物培育用于移植的人類器官,減少術后患者的排斥。CRISPR-Cas9基因編輯技術專利案已受到整個行業的密切關注。
這還不夠。
合成生物是重構。Syn1.0(譯名:辛西婭)就是一個新物種,其“父母”是一臺計算機。人們根據絲狀支原體的基因組模板化學合成出一整套基因組,移植到去除了DNA的山羊支原體細胞內。這項科研成果登上了美國《新聞周刊》的封面報道,標題是“Playing God”(扮演上帝)。熟悉克隆羊“多利”的朋友對這個過程應有似曾相識的感覺。分子克隆技術問世40年后,已進步到幾乎可以使人類扮演“上帝”角色的程度:能夠通過基因重構,構造出從未存在過的生命形式。
此刻,您對生命的認知處于哪一層面?
這些還都不夠。從可知到可及,云計算和人工智能日新月異的發展正為基因大數據的厚積薄發做好鋪墊。未來,EB級別的基因大數據可通過云計算進行分析,人人皆可存儲、分析自己的DNA數據并借由智能終端讀取或分享。前有IBM和谷歌,后有BATH(百度公司、阿里巴巴公司、騰訊公司、華為公司),信息產業的領軍者們紛紛構建基因組云——云端基因組數據,促進從數據到信息再到知識的轉化,降低準入門檻和數據處理成本,促進高科技進入C端消費人群的市場革命。
通過豐富的臨床表型數據庫,賦予基因數據以活性,加載機器學習的新型技術,機器開始“看病”,診斷出結果,甚至因此獲得了臨床資質——基因組數據和人工智能、醫療信息技術的結合,將催動新的醫療革命和資源體制的升級。
基因技術以科學為源頭,以健康為宗旨,扎根政策和經濟大環境,落地于民生,是百年大計。基因技術現在正進入黃金的“少年時期”。《基因組革命》從DNA雙螺旋結構講起,將基因的魅力和動人的故事娓娓道來,是不多見的高水平科普讀物。
讓我們一起,在閱讀的同時真切地觸摸生命的實質。
基因慧創始人 汪亮
重聚
早在一部以人類的勇敢和機智為主題的西方海洋文學的開山之作——古希臘史詩《奧德賽》中,人類足跡就已遍布所有大陸。遺憾的是,真實世界中早期人類可媲美奇幻歷險的種種探索之舉卻無人記錄。沒關系,因為這些經歷已被烙印在我們的DNA深處,甚至是那些曾伴隨著早期人類一同“游歷”的各類物種的基因之中。早期人類探索世界之旅最先發生在太平洋,這是人類探索地球過程中最炫目的壯舉,除了現代人類的外太空之旅外,再無其他豐功偉績可以蓋過人類對太平洋的探索與發現。
源自非洲的人類逐漸遷移到這顆星球的各個角落。大約在距今6萬年前,現代人類從非洲遷出后分散在亞洲各地定居下來。約1.5萬年至2萬年前,其中一群人最終穿越了從西伯利亞到阿拉斯加之間長達1000英里(約合1600公里)的陸橋,一路來到了南美的巴塔戈尼亞地區(Patagonia)。隨后該陸橋被上升的海平面淹沒,形成了今天眾所周知的白令海峽(the Bering Straits)。美洲也自此成為一個巨大的島嶼,橫在太平洋和大西洋之間。
早期人類不僅擅長陸上遷移,對水路也不陌生,有時甚至可以進行一些短途的跨海旅行。但遠洋船舶和長距離航海,還是在造船術和航海知識發展較為成熟后才出現的。因此,人類歷史的大部分時間,太平洋、大西洋和印度洋上的島嶼都是無人居住的。直至公元前3000年,波利尼西亞人的足跡開始出現在太平洋各個角落。15—17世紀,歐洲進入“地理大發現時代”(又名“探索時代”或“大航海時代”),航海家們四處探險時,發現這些“無人島”也并非渺無人跡。
太平洋是世界上最大的地理構造單元,覆蓋了地球面積約三分之一。如果你在“谷歌地球”上將自己的視角定位于塔希提島(Tahiti,又稱“大溪地”,南太平洋波利尼西亞群島中最大的島嶼),就會發現太平洋寬廣得令人不可思議,除了美國加利福尼亞州、澳大利亞和南極洲的一些大型島嶼外,幾乎看不到任何陸地。不過只要把地圖放大,就會發現在廣袤無垠的太平洋上,鑲嵌著許多島嶼如繁星點點。順帶說一句,“波利尼西亞”正是“許多島嶼”的意思。
這些波利尼西亞人來自何方?一項尤為重要的物證顯示,這些島嶼的土著們是從南美洲遷移到這些太平洋的小島上的。該物證就 是——紅薯。紅薯原產于南美大陸,但現在太平洋各個島嶼都將其作為一種主食廣為培育。早在約8000年前,南美洲秘魯高地上的人們就會種植這種被馴化的農作物。專家們曾經猜測,該農作物是16世紀時來自西班牙和葡萄牙的探險家們從南美洲引入這些太平洋島嶼的。然而,數據顯示這種猜測可能是錯誤的。因為考古學家在太平洋地區發現的最古老的紅薯碳化樣本可以追溯到公元1000年——這一時間要比哥倫布首次航行至太平洋地區提前了約500年。此外,“紅薯”一詞在各種波利尼西亞語中的發音,都類似于“蓋丘亞族”(Quechua)語中“紅薯”的叫法,蓋丘亞族是南美印第安人的一大分支。
所以,紅薯是否是由史前的南美人自己引入到這些太平洋島嶼的呢?波利尼西亞人是不是(或至少部分屬于)美洲人的后裔?挪威人類學家托爾?海爾達爾(Thor Heyerdahl)認為答案是肯定的,并且為了證明這一論斷,他制作了大名鼎鼎的仿古木筏“康提基號”(the Kon-Tiki),試圖證明在公元五世紀,當時尚處于石器時代的南美洲印第安土著是能夠憑借木筏跨海遠航的。但我們現在知道,歷史真相往往更加離奇:波利尼西亞人憑借木筏橫渡了太平洋,而且他們不僅成功地到達了南美,最后竟然還順利返航了!
波利尼西亞這段真實的“史詩故事”,背后有幾項證據支持,最近還多了一條DNA證據。當時的波利尼西亞人縱橫于海上,憑借的是他們的“雙體獨木舟”,而為滿足航行時的飲食所需,這些獨木舟上往往有意或是隨意地攜帶了一些動植物,分子人類學家們將這些生物體統稱為“獨木舟生物系”(canoe biota),包括各種植物、老鼠、豬和雞等等。163通過對這些生物的基因分析,他們發現了一些迄今為止最有力的基因證據,能夠證明當時的波利尼西亞人不僅沖出亞洲,在最偏遠的太平洋群島上定居了下來,甚至走向了世界,遠航至南美海岸。
2013年,一群人類遺傳學、人口遷移和遠古DNA分析領域的專家們發表了一份研究報告,為該論斷提供了進一步的證據。164該團隊的研究對象是現已滅絕的巴西博托庫多印第安人(Botocudo Indians)。研究者從該人種的古代頭骨中小心翼翼地提取出DNA,并在隨后的報告中指出,其線粒體DNA序列屬于波利尼西亞人所特有的單倍型類群(haplogroup,簡稱為“單倍群”)。
此外,“紅薯之謎”也最終通過DNA分析被揭開了,解密者是由來自法國的“進化和功能生態學中心”(Centre for Evolutionary and Functional Ecology)與“法國農業研究與發展中心” (簡稱CIRAD)的科學家們組成的聯合研究團隊。165要完成這項研究,該團隊需要一種特殊的植物樣本——這種植物必須出現在現代貿易將植物的遺傳路徑打亂、背離史前遺傳模式之前。幸運的是,多虧了英國紳士、植物學家約瑟夫?班克斯(Joseph Banks,1743—1820),將符合這種條件的樣本在英國皇家植物園(別稱“邱園”)中找到了。
……