生物信息學(xué)札記第4版_第1頁
生物信息學(xué)札記第4版_第2頁
生物信息學(xué)札記第4版_第3頁
生物信息學(xué)札記第4版_第4頁
生物信息學(xué)札記第4版_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、4 版)樊龍江浙江大學(xué)作物科學(xué)研究所浙江大學(xué)生物信息學(xué)研究所浙江大學(xué)IBM 生物計算實驗室2017 年 9 月本材料已由浙江大學(xué)出版社出版:生物信息學(xué),樊龍江主編,2017部分內(nèi)容可通過下列網(wǎng)址獲得:札記前言第一版這份材料是我學(xué)習(xí)和講授 生物信息學(xué) 課程時的備課筆記, 材料大多是根據(jù)當時收集的一 些外文資料翻譯編輯而成。學(xué)生在學(xué)習(xí)過程中經(jīng)常要求我給他們提供一些中文的講義或材料,這促使我把我的這份筆記整理并放到網(wǎng)上,供大家參考。要提醒使用者的是, 這份材料僅是根據(jù)我對生物信息學(xué)的一些浮淺的認識整理而成,其中的錯誤和偏頗只能請讀者自鑒 了。2001年6月第二版自1999年開始接觸生物信息學(xué)以來,一

2、晃已近六年,而本札記也近四歲了。2001和2002年中國科學(xué)院理論物理所的郝柏林院士在浙江大學(xué)首次開設(shè)生物信息學(xué)研究生課程,我作為他的助教系統(tǒng)地學(xué)習(xí)了生物信息學(xué);同時,借著我國水稻基因組測序計劃的機遇,在他的帶領(lǐng)下從2001年開始從事水稻基因組分析,從此自己便完全投入到這一嶄新、引人入勝的領(lǐng) 域中來。不斷有來信向我索要本札記的電子版文件,同時在不少網(wǎng)站上看到推薦該札記的內(nèi)容。生物信息學(xué)、基因組學(xué)等發(fā)展很快,現(xiàn)在再回頭審看該札記,有些部分已慘不忍讀,這促使我下決心更新它。但因時間和學(xué)識問題, 還是有不少部分自己不甚滿意,就只有待日后再努力了。歡迎告訴我札記中的 BUG,我的信箱fanlj 或bi

3、oinplant。2005年3月30日 第三版近年來高通量測序技術(shù)產(chǎn)生的序列數(shù)據(jù)大量出現(xiàn)(如小RNA和大規(guī)模群體 SNP數(shù)據(jù)),本次更新根據(jù)這一進展增加了兩章內(nèi)容,分別是第七章有關(guān)小RNA的分析和第八章遺傳多態(tài)性及正向選擇檢測。兩章內(nèi)容由我的博士生王煜為主編寫,李澤峰和劉云參與了文獻整理。 另外還更新了第四章有關(guān)水稻基因組分析一節(jié)。2010年1月 第四版2014年浙江大學(xué)開展本科生教材建設(shè)工作,我當時作為系主任要帶頭,就承諾編寫我主講 的生物信息學(xué)教材。編寫教材的確不是一件容易的事,經(jīng)過幾番掙扎和多方努力,總算 完成了編寫,算是了卻了一樁心思。該教材內(nèi)容比較完整,也跟蹤了生物信息學(xué)領(lǐng)域的最新

4、進展。我就權(quán)且把該教材內(nèi)容作為札記的第四版,也算給該札記一個完美的結(jié)尾。2017年9月II箝那高等院校農(nóng)學(xué)與生物技術(shù)專業(yè)現(xiàn)劃樊龍江主編生物信息學(xué)生物信息學(xué)Binformatics浙江大學(xué)出版社iii生物信息學(xué)前言自開始接觸生物信息學(xué)以來,一晃已近二十年了。我是在攻讀博士期間開始注意并學(xué)習(xí)生物信息學(xué)的。我的博士生導(dǎo)師胡秉民為應(yīng)用數(shù)學(xué)專業(yè)教授,主要從事生態(tài)系統(tǒng)模型模擬研究。雖然已具備一定數(shù)量統(tǒng)計和數(shù)量遺傳學(xué)基礎(chǔ),但當時對于生物信息學(xué),我還是非常陌生的,通過自學(xué)才開始一點點了解這門新興學(xué)科。2001-2003 年間,中國科學(xué)院理論物理所郝柏林院士在浙江大學(xué)首次開設(shè)“生物信息學(xué)”研究生課程,我作為他的

5、助教,系統(tǒng)地學(xué)習(xí)了生物信息學(xué);同時,在他的帶領(lǐng)下從事水稻基因組分析。自那時起,浙江大學(xué)生物信息學(xué)學(xué)科和相應(yīng)研究機構(gòu)也逐步建立起來。2004 年郝院士離開杭州加入復(fù)旦大學(xué),生物信息學(xué)研究生課程就由我和朱軍教授承擔下來?,F(xiàn)在該課程作為浙江大學(xué)全校性研究生公共課程,已成為一門重點建設(shè)課程,每年選課人數(shù)都在150 人左右。上個世紀末,我國生物信息學(xué)還處于起步階段,學(xué)習(xí)資料很少。學(xué)生時常索要學(xué)習(xí)材料,于是我整理了備課筆記,取名生物信息學(xué)札記,于 2001 年 6月掛到實驗室主頁上供學(xué)生參考。隨著生物信息學(xué)發(fā)展,分別于2005 年 3 月和2010 年 1 月更新札記兩次。由于網(wǎng)絡(luò)傳播的作用,許多生物信息

6、學(xué)初學(xué)者都讀過該札記,在國內(nèi)形成一定的影響。本書是在該札記框架基礎(chǔ)上,補充大量新材料編寫而成。生物信息學(xué)學(xué)科內(nèi)容涵蓋廣且發(fā)展很快。基于國內(nèi)外生物信息學(xué)相關(guān)教材,以及自身對生物信息學(xué)的粗淺理解,我把生物信息學(xué)大致分為四部分(篇) 內(nèi)容:第一部分即基礎(chǔ)篇,為生物信息學(xué)的基礎(chǔ)知識。這部分內(nèi)容總體變化不大(與10-15 年前比較),它是生物信息學(xué)的核心知識,生物信息學(xué)教學(xué)最重要部分,為應(yīng)為必講內(nèi)容;第二部分高通量測序數(shù)據(jù)分析篇,最近十年才出現(xiàn)的生物信息學(xué)新內(nèi)容。2005 年高通量測序技術(shù)突破后,針對該技術(shù)產(chǎn)生的序列數(shù)據(jù),出現(xiàn)大量生物信息學(xué)新算法和新工具;第三部分生物信息學(xué)外延與交叉,重點介紹與生物信息

7、學(xué)密切相關(guān)的其他生物學(xué)學(xué)科。生物信息學(xué)引入了這些學(xué)科的部分核心技術(shù)(或反過來被引入),如數(shù)量遺傳學(xué)、群體遺傳學(xué)和新興學(xué)科合成生物學(xué);第四部分為生物信息學(xué)資源與實踐篇。生物信息學(xué)數(shù)據(jù)庫和軟件工具對生物學(xué)學(xué)科至關(guān)重要,所以這部分也是生物信息學(xué)重要組成部分。同時, 該篇中以實踐為目的的生物信息學(xué)教學(xué)資源是課堂教學(xué)的一個很好補充。我重點編寫了本書第一部分基礎(chǔ)篇。我的學(xué)生參與撰寫了有關(guān)章節(jié),同時也邀請了相應(yīng)領(lǐng)域研究者參與部分章節(jié)撰寫(徐海明:數(shù)量遺傳學(xué);阮松林:蛋白質(zhì)組學(xué)) ,最后由我統(tǒng)稿。我們盡可能完整地列出參考書目,標注材料來源,但一定還會有所遺漏。本書受浙江大學(xué)本科專業(yè)核心課程教材建設(shè)專項經(jīng)費資助

8、出版。每次拿起書稿總是能發(fā)現(xiàn)一些錯誤或不準確的地方,但由于出版計劃一再拖延,只好交稿付印了。如果你發(fā)現(xiàn)書中問題,望賜教指正(fanlj ) ,以便我們再版時更正。樊龍江2016 年 9 月生物信息學(xué)簡要目錄及 PDFT載(二校稿,以出版為準)緒論PDF第一篇:生物信息學(xué)基礎(chǔ)第1-1章生物信息類型及其產(chǎn)生途徑PDF第1-2章分子數(shù)據(jù)庫和常見記錄格式第1-3章兩條序列聯(lián)配及其算法PDF第1-4章多條序列聯(lián)配及功能域分析PDF第1-5章基因預(yù)測與功能注釋PDF第1-6章系統(tǒng)發(fā)生樹構(gòu)建第1-7章蛋白質(zhì)結(jié)構(gòu)預(yù)測與藥物設(shè)計第1-8章生物信息學(xué)計算機基礎(chǔ)第二篇:高逋量測序數(shù)據(jù)分析第2-1章基因組拼接與分析P

9、DF第2-2章基因組變異與分析第2-3章轉(zhuǎn)錄組分析弟2-4早非編碼RN初析PDF第2-5章甲基化與組蛋白修飾一第2-6章宏基因組分析第2-7章蛋白質(zhì)組分析第三篇:生物信息學(xué)外延與交叉第3-1章系統(tǒng)生物學(xué)第3-2章群體遺傳學(xué)第3-3章數(shù)量遺傳學(xué)弟3-4早合成生物學(xué)第四篇:生物信息學(xué)資源與實踐弟4-1早生物信息學(xué)常用代碼和關(guān)鍵詞弟4-2早生物信息學(xué)常用英語術(shù)語及釋義弟4-3早生物信息學(xué)主要數(shù)據(jù)庫與工具PDF第4-4章生物信息學(xué)實驗PDF參考文獻詳細目錄序郝柏林院士前百緒論生物信息與生物信息學(xué)第F生物信息學(xué)簡史與展望第三節(jié)本書的組織和使用第一篇:生物信息學(xué)基礎(chǔ)第1-1章生物信息類型及其產(chǎn)生途徑ir-

10、n?生物估息的類型第FDNA測序技術(shù)一、測序技術(shù) 二、第二代測序技術(shù) 三、第三代測序技術(shù)第三節(jié)高通量測序技術(shù)的應(yīng)用一、DNA/RNAf 關(guān)測序二、蛋白質(zhì)-DNA/RNA互作三、甲基化/宏基因組第四節(jié)蛋白質(zhì)序列及其結(jié)構(gòu)測定一、蛋白質(zhì)序列與蛋白質(zhì)互作測定 二、蛋白質(zhì)結(jié)構(gòu)測定第1-2章分子數(shù)據(jù)庫和常見記錄格式分子序列數(shù)據(jù)庫概述一、分子數(shù)據(jù)庫概念二、數(shù)據(jù)庫記錄格式三、數(shù)據(jù)庫冗余、序列遞交和檢索第F核甘酸及其相關(guān)數(shù)據(jù)庫一、DNA/RN歸列數(shù)據(jù)庫二、基因組數(shù)據(jù)庫三、非編碼RNAa據(jù)庫第三節(jié)蛋白質(zhì)及其相關(guān)數(shù)據(jù)庫第四節(jié)代謝途徑等專業(yè)數(shù)據(jù)庫一、代謝途徑數(shù)據(jù)庫二、代謝組學(xué)等數(shù)據(jù)庫第1-3章兩條序列聯(lián)配及其算法序列

11、聯(lián)配基本概念第F計分矩陣一、計分矩陣的一般原理二、氨基酸替換矩陣四、位置特異性計分矩陣(PSSM第三節(jié)兩條序列聯(lián)配算法一、Needleman-Wunsch 算法二、Smith-Waterman 算法第四節(jié)BLAST算法及數(shù)據(jù)庫搜索一、BLAST算法二、利用BLAST進行數(shù)據(jù)庫序列搜索三、序列相似性的統(tǒng)計推斷第1-4章多條序列聯(lián)配及功能域分析多序列聯(lián)配概念及其算法一、多序列聯(lián)配概念二、多序列全局聯(lián)配算法 三、多序列局部聯(lián)配算法14第F蛋白質(zhì)序列功能域分析與模型一、功能域概念 二、功能域模型第三節(jié)嫡及矩陣信息量一、不確定性與信息量 二、信息嫡的應(yīng)用第1-5章基因預(yù)測與功能注釋基因組序列構(gòu)成與基因預(yù)

12、測一、基因組序列的基本構(gòu)成 二、基因預(yù)測及其基本方法 三、基因注釋流程第F從頭預(yù)測一一隱馬爾可夫模型(HMM方法一、馬爾可夫和隱馬爾可夫模型 二、隱馬爾可夫模型問題及其算法 三、HM疑因預(yù)測模型及其應(yīng)用第三節(jié)貝葉斯統(tǒng)計及其基因預(yù)測應(yīng)用一、貝葉斯統(tǒng)計與生物信息學(xué)二、利用貝葉斯統(tǒng)計進行基因預(yù)測第四節(jié)基因功能注釋一、利用序列和結(jié)構(gòu)域數(shù)據(jù)庫進行注釋二、利用功能分類和代謝途徑信息進行注釋第五節(jié)基因序列構(gòu)成分析一、堿基構(gòu)成與分布二、DNA亍走與Z曲線二、同向重復(fù)序列分析四、蛋白質(zhì)序列跨膜等特征分析第1-6章系統(tǒng)發(fā)生樹構(gòu)建系統(tǒng)發(fā)生樹與遺傳模型一、系統(tǒng)發(fā)生樹概述二、遺傳模型第F距離法一、非加權(quán)平均連接聚類法

13、(UPGMAt)二、Fitch-Margoliash 算法三、鄰接法第三節(jié)簡約法第四節(jié)似然法一、DNA列的似然模型二、兩條序列系統(tǒng)發(fā)生樹三、三條及多條序列系統(tǒng)發(fā)生樹第五節(jié)基因組組分矢量方法一、組分矢量方法(CVTree算法)二、基因組關(guān)聯(lián)“距離”與系統(tǒng)發(fā)生樹構(gòu)建第1-7章蛋白質(zhì)結(jié)構(gòu)預(yù)測與藥物設(shè)計蛋白質(zhì)結(jié)構(gòu)概述一、蛋白質(zhì)結(jié)構(gòu)及其預(yù)測二、蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫三、蛋白質(zhì)結(jié)構(gòu)主要預(yù)測工具第F蛋白質(zhì)二級結(jié)構(gòu)預(yù)測一、二級結(jié)構(gòu)預(yù)測方法 二、結(jié)構(gòu)預(yù)測實例第二節(jié)蛋白質(zhì)三級結(jié)構(gòu)預(yù)測一、同源建模法 二、折疊識別法第四節(jié)計算機輔助藥物設(shè)計一、間接藥物設(shè)計 二、直接藥物設(shè)計第1-8章生物信息學(xué)計算機基礎(chǔ)使用Unix/Lin

14、ux 操作平臺一、Unix/Linux操作系統(tǒng)及其結(jié)構(gòu)二、Linux Shell常用命令第F掌門計算機編程語言一、計算機編程語言二、Python語百簡介三、R語言四、MySQ酷言第三節(jié)并行與自動化一、并行式計算二、并行化模型及其實例第四節(jié)其他一、算法二、可視化與畫圖第二篇:高逋量測序數(shù)據(jù)分析第2-1章基因組拼接與分析基因組序列拼接概念一、基因組短序列拼接問題二、基因組從頭拼接主要方法三、利用遺傳圖譜等進行基因組組裝第F圖論及基于德布魯因圖拼接算法一、圖論二、基于德布魯因圖的拼接算法第三節(jié)第三代測序數(shù)據(jù)拼接方法第四節(jié)基于字符串(K-mer)的基因組調(diào)查與分析一、基因組大小估計二、基因組復(fù)雜度估計

15、三、基因組“肖像”及缺失字符串分析第2-2章基因組變異與分析基因組變異類型與檢測方法一、基因組變異類型二、基因組變異檢測方法第F基因組重測序及其應(yīng)用;一、基因組重測序應(yīng)用領(lǐng)域 二、基因組重測序數(shù)據(jù)分析第2-3章轉(zhuǎn)錄組分析轉(zhuǎn)錄組測序與拼接一、轉(zhuǎn)錄組及其技術(shù)平臺 二、轉(zhuǎn)錄組序列拼接第F基因表達分析一、差異表達基因的鑒定二、差異表達基因富集分析第三節(jié)可艾男切和基因融合分析一、基因可艾男切二、融合基因第2-4章非編碼RN初析非編碼RNA簡介一、非編碼RN砥型與功能二、非編碼RNAS化三、樣品采集及其測序方法四、非編碼RNAfe要數(shù)據(jù)庫第F小RNA十算識別與靶基因預(yù)測一、miRNA±要特征及計

16、算識別 二、siRNA主要特征及計算識別 三、miRN所口 siRNA靶基因預(yù)測第三節(jié)長非編碼RNA定與功能分析一、線性IncRNA鑒定二、環(huán)化RNA定三、IncRNA功能預(yù)測第2-5章甲基化與組蛋白修飾表觀遺傳機制第F甲基化測序與分析一、甲基化測序原理二、生物信息學(xué)分析方法第二節(jié)組蛋白修飾測定與分析一、組蛋白的樣品制備二、組蛋白修飾分析方法第2-6章宏基因組分析宏基因組及其分析方法一、宏基因組概述二、宏基因組學(xué)技術(shù)應(yīng)用第F16S rDNA序列分析一、技術(shù)方法與分析流程二、物種多樣性分析三、物種豐富度估計四、群落結(jié)構(gòu)分析第三節(jié)全基因組序列數(shù)據(jù)分析一、分析流程與內(nèi)容二、基因預(yù)測及功能注釋第2-7

17、章蛋白質(zhì)組分析蛋白質(zhì)組學(xué)概述一、蛋白質(zhì)組及其分析二、高通量分離和鑒定技術(shù)第F雙向電泳圖像與質(zhì)譜組合分析一、膠圖獲取與分析二、利用指紋圖譜鑒定蛋白質(zhì)第三節(jié)質(zhì)譜數(shù)據(jù)采集與分析一、質(zhì)譜數(shù)據(jù)米集策略二、肽段數(shù)據(jù)庫搜索與質(zhì)量控制第四節(jié)定量蛋白質(zhì)組分析一、同位素標記止里分析一、非同位素標記止里分析第三篇:生物信息學(xué)外延與交叉第3-1章系統(tǒng)生物學(xué)系統(tǒng)生物學(xué)概述第F網(wǎng)絡(luò)與生物網(wǎng)絡(luò)一、無標度和階層網(wǎng)絡(luò)二、生物網(wǎng)絡(luò)模塊及其算法工具第三節(jié)基因調(diào)控網(wǎng)絡(luò)一、布爾網(wǎng)絡(luò)模型二、貝葉斯網(wǎng)絡(luò)模型第3-2章群體遺傳學(xué)群體遺傳多態(tài)性與結(jié)構(gòu)一、遺傳多態(tài)性及其估計 二、群體結(jié)構(gòu)第一節(jié)止向選擇日勺統(tǒng)計檢驗一、自然選擇與中性檢驗二、基于種

18、內(nèi)多態(tài)性的檢驗方法三、基于種內(nèi)多態(tài)和種間分歧度的檢測方法第二節(jié)群體進化的溯祖測驗一、溯祖理論二、溯祖測驗應(yīng)用第四節(jié)統(tǒng)計測驗分析問題與策略第3-3章數(shù)量遺傳學(xué)數(shù)量性狀遺傳基本概念第F連鎖分析一、連鎖分析原理二、試驗群體的連鎖分析 三、常用連鎖分析軟件第三節(jié)關(guān)聯(lián)分析一、關(guān)聯(lián)分析基本原理 二、常用關(guān)聯(lián)分析軟件第3-4章合成生物學(xué)什么是合成生物學(xué)?一、合成生物學(xué)定義和研究內(nèi)容 二、合成生物學(xué)引發(fā)的爭議第F從“基因線路”開始:模塊化工程化一、基因線路的基本概念二、幾個經(jīng)典基因線路設(shè)計第三節(jié)從最小基因組開始:基因組人工合成一、基因組的人工合成和重構(gòu) 二、噬菌體基因組人工合成與重構(gòu) 三、細菌基因組人工合成與重構(gòu)第四篇:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論