《生物信息學分析實踐》內容主要包括生物信息學簡介、三大數據庫檢索、引物設計及測序結果分析、核酸序列分析、蛋白質序列分析、蛋白質空間結構預測、系統發育分析、RNA分析、參考文獻管理。《生物信息學分析實踐》的一大特色在于豐富的實例和圖表,使讀者可以很直觀地了解和掌握書中的內容。
《生物信息學分析實踐》取材新穎,實踐性強,是一本實用的生物信息學分析手冊與操作指南,適用于生命科學、農學、醫學等相關專業學生使用,也可用于從事生物學相關的科研人員、教師參考使用。
寫法特點:原理、方法、操作相結合,從基礎理論出發,循序漸進,以漸進式實例引導讀者學習,適時闡述文中要點,讓讀者在實例中鞏固理論基礎。實例特點:實例取材自科研第一線背景的素材,實踐性強,覆蓋面廣,讓讀者在實例分析的過程中,不僅學會工具軟件的操作使用,更能學會思考與解決問題。操作演示:漸進式的實例演示,圖文并茂,簡單易學,花幾分鐘即可學會一個實例。對于生物信息學初學者或從事生命科學領域的科研工作者具有一定的指導意義。
隨著計算機科學、信息科學等飛速發展,一門以數據分析處理為本質的新學科——生物信息學悄然興起,它融合了數學、生命科學、計算機信息科學等多門學科,至今已經廣泛地滲透到科學研究的各個方面,成為一門用途極為廣泛的工具學科。核酸序列、蛋白質序列的分析,以及各類生物學軟件和數據庫的應用,已經成為科研作者必備的基本技能。然而,由于擅長專業領域的不同,研究人員面對大量的生物學軟件及數據庫常無所適從。目前國內外已有不少優秀的生物信息學教材與專著,但大多數以理論為主,或側重于算法研究,或傾向于網絡數據庫介紹,對于數據實例分析實踐的專著尚不多見。為此,本書編寫的目的就是為不同專業背景的讀者提供一本實用的生物信息學分析入門書,讓讀者在實例分析的過程中,不僅學會工具軟件的操作使用,更能學會思考與解決科研問題。
2008年夏,在福建農林大學植物病毒研究所的倡議下,編著者通過基因酷等論壇,向在生物信息學及相關領域教學與科研第一線的人員發出邀請,希望他們加入《生物信息學分析實踐》編委會,共同編寫本書。很快,中國科學院遺傳與發育生物學研究所喬楠和劉林川、中國科學院南京地質古生物研究所蓋永華、南京師范大學生命科學學院李鵬、西北農林科技大學林文超、福建省出入境檢驗檢疫局沈建國、浙江省農業科學院鹿連明、南方醫科大學郭玲等欣然同意共同編寫本書。本書由吳祖建、高芳鑾、沈建國擔任主編。
序
前言
第一章 生物信息學簡介
1.1 生物信息學基礎
1.1.1 什么是生物信息學
1.1.2 生物信息學的形成與發展
1.1.3 生物信息學的研究內容
1.2 生物信息學應用
1.2.1 生物信息學的熱點領域
1.2.2 信息技術與生物信息學
第二章 數據庫檢索
2.1 綜合性數據庫NCBI
2.1.1 NCBI簡介
2.1.2 NCBI數據庫介紹
2.1.3 Entrez簡介
2.1.4 Entrez檢索實例
2.2 綜合性數據庫EMBL-EBI
2.2.1 EBI簡介
2.2.2 EBI數據庫簡介
2.2.3 SRS簡介
2.2.4 SRS檢索實例
2.2.5 BioMart簡介
2.2.6 BioMart檢索實例
2.3 UCSC基因組瀏覽器
2.3.1 UCSC基因組瀏覽器簡介
2.3.2 UCSC基因組瀏覽器檢索實例
第三章 引物設計及測序結果分析
3.1 引物設計
3.1.1 概述
3.1.2 常規PCR引物設計實例分析
3.1.3 簡并引物設計
3.2 測序結果分析
3.3 序列拼接實例分析
第四章 核酸序列分析
4.1 常規分析
4.1.1 核酸序列的檢索
4.1.2 核酸序列組分分析
4.1.3 序列變換
4.1.4 限制性酶切分析
4.2 比對分析
4.2.1 BLAST比對
4.2.2 雙序列比對
4.2.3 多序列比對
4.3 基因結構識別
4.3.1 ORF識別及其可靠性驗證
4.3.2 啟動子及轉錄因子結合位點分析
4.3.3 重復序列分析
4.3.4 CpG island
4.3.5 3UTR區
第五章 蛋白質序列分析
5.1 蛋白質序列的基本性質分析
5.1.1 理化性質分析
5.1.2 疏水性分析
5.1.3 跨膜區分析
5.1.4 信號肽預測
5.1.5 Coil區分析
5.1.6 亞細胞定位“
5.2 結構域分析及motif搜索
5.2.1 結構域分析
5.2.2 motif搜索
5.3 空間結構預測
5.3.1 蛋白質二級結構預測
5.3.2 蛋白質三級結構預測
5.3.3 蛋白質結構預測方法評價
5.4 抗原表位預測分析
5.4.1 B淋巴細胞抗原表位預測分析
5.4.2 T淋巴細胞抗原表位預測分析
第六章 分子進化與系統發育分析
6.1 進化的分子基礎
6.1.1 進化樹與分子系統學
6.1.2 相似性與同源性
6.1.3 分子進化
6.2 系統發育分析
6.2.1 DNA和氨基酸序列的進化演變
6.2.2 系統發育樹的種類
6.2.3 用于系統發育分析的分子標記選擇
6.2.4 常用的構樹方法及其甄選
6.2.5 系統發育分析常用軟件
6.3 系統發育分析的檢驗
6.3.1 系統發育分析方法可靠性的評價
6.3.2 系統樹的誤差分析及消除方法
6.4 系統樹的評估
6.5 系統發育分析實例
6.5.1 使用MEGA軟件重建NJ樹
6.5.2 使用PAUP軟件重建NJ樹
6.5.3 使用MEGA軟件重建MP樹
6.5.4 使用PAUP軟件重建MP樹
6.5.5 使用PAUP軟件重建ML樹
6.5.6 貝葉斯樹
第七章 RNA分析
7.1 RNA簡介
7.1.1 RNA的結構
7.1.2 RNA的功能
7.1.3 RNA研究進展與展望
7.2 RNA二級結構
7.2.1 RNA的二級結構概述
7.2.2 RNA二級結構的預測方法
7.2.3 RNA結構預測實例分析
7.3 高效siRNA的設計
7.3.1 RNAi的作用機制
7.3.2 siRNA的設計原則
7.3.3 影響RNAi的其他因素
7.3.4 siRNA的設計步驟
7.3.5 siRNA的合成
7.3.6 siRNA干涉效果的評判
7.3.7 siRNA相關數據庫介紹
7.3.8 siRNA設計實例分析
7.4 microRNA分析
7.4.1 microRNA作用機制概述
7.4.2 miRNA功能與研究方法
7.4.3 miRNA生物信息學分析
7.4.4 miRNA及其靶基因預測的實例分析
主要參考文獻及網址
附錄
附錄1 常用生物學數據庫
附錄2 各種主要的RNA二級結構預測軟件比較
附錄3 名詞解釋
彩圖
人類基因組計劃的目的是解碼生命、了解生命的起源、了解生命體生長發育的規律、認識種屬之間和個體之間存在差異的起因、認識疾病產生的機制以及長壽與衰老等生命現象、為疾病的診治提供科學依據。人類基因組計劃的完成,為人類生命科學開辟了一個新紀元,它對生命本質、人類進化、生物遺傳、個體差異、發病機制、疾病防治、新藥開發、健康長壽等領域,以及對整個生物學都具有深遠的影響和重大的意義,標志著人類生命科學一個新時代的來臨。2.人類蛋白質組計劃事實上,HGP的正式完成只意味著邁出了萬里長征的第一步,僅僅測繪出基因組序列并非這一計劃的最終目的,也并不能解決困擾生物學家的所有難題。要想進一步了解生物世界的更多信息就必須對基因編碼產物——蛋白質進行系統深入的研究。針對這一重大的科學命題,多國科學家共同組織啟動了人類蛋白質組計劃(human proteome project,HPP)。早在20世紀90年代中期人類基因組計劃成形時,就有研究人員考慮過人類蛋白質組計劃,但由于蛋白質組的規模和復雜性而一直沒能實現。隨著基因大規模測序的結束,科學家們發現蛋白質編碼基因比估計數量大大減少。過去預測的數量是5萬~10萬個,而現在認為只有約2.1 萬個,這使得人類蛋白質組的規模變得更容易處理。基因組計劃中所積累的技術方法與合作體系也使得蛋白質組計劃得以實現,這是繼國際人類基因組計劃之后的又一項大規模的國際性科技工程,無論在科學目標、研究策略、技術體系,還是在跨國組織、實驗數據整合分析等方面,均較人類基因組計劃更具挑戰性和復雜性。首批行動計劃包括中國科學家牽頭的“人類肝臟蛋白質組計劃”和美國科學家牽頭的“人類血漿蛋白質組計劃”。由于中國在蛋白質研究方面的雄厚實力,HPP將總部設在中國北京,其中“人類肝臟蛋白質組計劃”由中國科學家領導執行,這是我國科學家第一次領導執行重大國際科技協作計劃。