![生物信息學第一章課件_第1頁](http://file4.renrendoc.com/view/b17a44cd1e772db0591e09ec7a8f5271/b17a44cd1e772db0591e09ec7a8f52711.gif)
![生物信息學第一章課件_第2頁](http://file4.renrendoc.com/view/b17a44cd1e772db0591e09ec7a8f5271/b17a44cd1e772db0591e09ec7a8f52712.gif)
![生物信息學第一章課件_第3頁](http://file4.renrendoc.com/view/b17a44cd1e772db0591e09ec7a8f5271/b17a44cd1e772db0591e09ec7a8f52713.gif)
![生物信息學第一章課件_第4頁](http://file4.renrendoc.com/view/b17a44cd1e772db0591e09ec7a8f5271/b17a44cd1e772db0591e09ec7a8f52714.gif)
![生物信息學第一章課件_第5頁](http://file4.renrendoc.com/view/b17a44cd1e772db0591e09ec7a8f5271/b17a44cd1e772db0591e09ec7a8f52715.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
杜娟2013.02.27生物信息學杜娟生物信息學課程簡介課程特點課程目標課程形式參考教材與文獻教師聯(lián)系方式成績構(gòu)成2課程簡介課程特點2生物、計算機、數(shù)學、化學等多學科交叉,知識覆蓋面廣;涉及從基因組序列分析直到藥物設計等眾多內(nèi)容,且應用領域?qū)拸V;生物信息數(shù)據(jù)資源與分析工具繁多,實踐環(huán)節(jié)非常重要;理論方法尚不系統(tǒng)成熟,處于迅速發(fā)展變化階段,知識更新快。缺乏合適的教材課程特點3生物、計算機、數(shù)學、化學等多學科交叉,知識覆蓋面廣;課程特點課程目標掌握生物信息學的基本知識與概念了解生物信息學網(wǎng)上資源針對核酸和蛋白質(zhì)的分析4課程目標掌握生物信息學的基本知識與概念4課程形式講授概念與知識點(Textbooks)自學與討論(Websites)理解(Literaturereferences)掌握與鞏固(ComputerExperiences)5課程形式講授概念與知識點(Textbooks)5主要的參考教材1《生物信息學》,陶士珩主編科學出版社,20072《生物信息學》,DavidW.Mount著,鐘揚、王莉、張亮等譯,高等教育出版社,2003。
3生物信息學——基因和蛋白質(zhì)分析的實用指南(AndreasD.BaxevanisAndB.F.FrancisOuellette著).李衍達、孫子榮等譯.北京:清華大學出版社,2000
4《簡明生物信息學》,鐘揚等主編.高等教育出版社,2001
5《探索基因組學、蛋白質(zhì)組學和生物信息學》,孫子榮譯.科學出版社,2004
6《生物信息學方法與實踐》,張成崗賀福初編著.科學出版社,20026主要的參考教材1《生物信息學》,陶士珩主編科參考文獻主要為英文原始文獻,鼓勵大家閱讀。課題的研究方法7參考文獻主要為英文原始文獻,鼓勵大家閱讀。7聯(lián)系方式及成績構(gòu)成杜娟
dujuannx@126.com
成績構(gòu)成隨堂測驗、課堂表現(xiàn)30%
作業(yè)30%
項目報告40%
8聯(lián)系方式及成績構(gòu)成杜娟
dujuannx@126.com89生物信息學——緒論一、生物信息學及其研究意義二、生物信息學的發(fā)展現(xiàn)狀三、生物信息學當前的主要研究內(nèi)容四、與生物信息學密切相關(guān)的學科五、生物信息學產(chǎn)業(yè)及前景9生物信息學——緒論一、生物信息學及其研究意義一、生物信息學及其研究意義生物信息學第一章課件背景1.
人類基因組計劃(HGP)投入30億美元,2003年完成精細圖,約30億個數(shù)據(jù)(堿基),相當于3000本每本1000頁每頁1000字的“天書”。曼哈頓原子彈計劃阿波羅登月計劃人類基因組計劃11背景1.人類基因組計劃(HGP)曼哈頓原子彈計劃阿波羅登2.模式生物基因組計劃模式生物基因組計劃是人類基因組計劃的一個重要組成部分。模式生物有:大腸桿菌、酵母、擬南芥、線蟲、果蠅和小鼠等
3.相關(guān)功能基因組計劃
轉(zhuǎn)錄組,基因表達譜,蛋白質(zhì)組……122.模式生物基因組計劃12生物學數(shù)據(jù)庫的增長情況至今1000多個13生物學數(shù)據(jù)庫的增長情況至今1000多個13序列數(shù)據(jù)增長趨勢14序列數(shù)據(jù)增長趨勢14生物數(shù)據(jù)爆炸性增長:生物數(shù)據(jù)量的積累已達到人類有史以來所說過的話的數(shù)百倍,而且還將以越來越快的速度增長。15生物數(shù)據(jù)爆炸性增長:生物數(shù)據(jù)量的積累已達到人類有史以來面對堆積如山的生物學數(shù)據(jù)……16面對堆積如山的生物學數(shù)據(jù)……16數(shù)據(jù)知識AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAACGT?17數(shù)據(jù)知識AGCATCGAAGTTGCATGACGATG多學科高度交叉
生物學醫(yī)學
數(shù)學、統(tǒng)計學物理學、化學信息、系統(tǒng)與計算科學高性能計算、數(shù)據(jù)庫、網(wǎng)格計算生物信息學與系統(tǒng)生物學18多學科高度交叉生物學醫(yī)學數(shù)學、統(tǒng)計學物理學、化學信息、多尺度數(shù)據(jù)的整合和模擬19多尺度數(shù)據(jù)的整合和模擬19什么是生物信息學
生物信息學(BIOINFORMATICS)是一門集數(shù)學,計算機科學和生物學的工具以及技術(shù)于一體的涵蓋了生物信息的獲取,處理,存儲,分配,分析和闡述等各個方面以理解海量的生物學數(shù)據(jù)為目的的學科UnderstandingOurGeneticInheritance.TheUSHumanGenomeProject:TheFirstFiveYears1991-1995.NIHPublicationNo.90-1590,April,1995生物信息技術(shù)是一個多學科交叉的前沿生物技術(shù)20什么是生物信息學生物信息學(BIOINFORMA生物信息學研究的意義科學意義:可望從海量生物學數(shù)據(jù)分析中獲得對生命運行機制和疾病機理等的深入理解。應用價值:在生物醫(yī)藥研究和相關(guān)生物技術(shù)相關(guān)產(chǎn)業(yè)(生物制藥、農(nóng)、林、牧、漁、環(huán)保等)的發(fā)展中將發(fā)揮越來越重要的作用。21生物信息學研究的意義科學意義:可望從海量生物學數(shù)據(jù)分析中獲得生物信息學是生命科學與信息技術(shù)交叉融合的新學科,也是當今全球最具發(fā)展前途的學科之一。
WhenIgivetalkstoyoungscientistsseekingadviceaboutareasoffutureintensescientificexcitement,computationalbiologyismynumberonerecommendation.FrancisCollins,DirectorofHGPatNIH生物信息學是生命科學與信息技術(shù)交叉融合的新學科,也是當今全球
生命科學已從一種以實驗為基礎的科學轉(zhuǎn)向以信息為基礎的科學,其成功將大大依靠信息科學與生命科學的聯(lián)姻、依賴于生物信息技術(shù)的發(fā)展?;蛐畔F(xiàn)在正推動著生物制藥革命。破譯人類基因組給我們帶來了打開這個星球上最有價值的圖書館的鑰匙,但我們現(xiàn)在閱讀這些圖書還處在非常初級的水平,科學家的下一步工作將是如何把信息從這些圖書中挖掘出來。目前美國缺少有能力閱讀這部人類基因“天書”并使用其中信息的人。這個領域有非常多的機會,有非常大的需要。據(jù)估計,這一領域所需要的研究人員數(shù)量將是現(xiàn)有人數(shù)的50倍。培養(yǎng)這種人才就像破譯人類基因組一樣重要。
EricLander,200223生命科學已從一種以實驗為基礎的科學轉(zhuǎn)向以信息為基礎的科學,二、生物信息學的發(fā)展現(xiàn)狀二、生物信息學的發(fā)展現(xiàn)狀生物信息學的萌芽1956年在美國召開過首次“生物學中的信息理論”討論會
60年代美國建立了手工搜集數(shù)據(jù)的蛋白質(zhì)數(shù)據(jù)庫,PIR
1962年Zuckerkandl基于序列變異分析的分子演化研究
1964年Davies開創(chuàng)了蛋白質(zhì)結(jié)構(gòu)預測的研究
1970年Needleman等發(fā)表了廣受重視的兩序列比較算法
1970年出現(xiàn)ComputerMethodsandProgramsinBiomedicine期刊
1974年Ratner首先對分子遺傳調(diào)控系統(tǒng)進行處理分析
1975年P(guān)ipas等首先提出用計算機技術(shù)預測RNA二級結(jié)構(gòu)
1979年美國洛斯阿拉莫斯國家實驗室建立GenBank25生物信息學的萌芽1956年在美國召開過首次“生物學中的信生物信息學的萌芽(續(xù))Science于1980年發(fā)表了關(guān)于計算分子生物學的綜述1982年歐洲分子生物學實驗室提供EMBL服務1984年日本著手建立國家級核酸序列數(shù)據(jù)庫DDBJ1985年出現(xiàn)ComputerApplicationintheBiosciences期刊2620世紀80年代末期,林華安博士compbio——bioinformatique——bio-informatics——bioinformatics“生物信息學之父”生物信息學的萌芽(續(xù))Science于1980年發(fā)表了關(guān)于計國外生物信息學的發(fā)展現(xiàn)狀各種專業(yè)研究機構(gòu)和公司如雨后春筍般涌現(xiàn)生物科技公司和制藥工業(yè)內(nèi)部生物信息學部門的數(shù)量與日俱增即使象美國這樣的發(fā)達國家也面臨生物信息人才匱乏的局面許多大學和研究機構(gòu)已經(jīng)成立自己的生物信息學中心1999年美國NIH專家委員會又建議迅速在大學和研究機構(gòu)中建立20個生物計算中心,給予每個中心每年800萬美元的支持,從事有關(guān)研究和人才培養(yǎng)英國所有主要研究資助機構(gòu)達成共識,認為應高度優(yōu)先滿足對生物信息學技術(shù)的需求,并已實現(xiàn)對相關(guān)人才培養(yǎng)的大力資助27國外生物信息學的發(fā)展現(xiàn)狀各種專業(yè)研究機構(gòu)和公司如雨后春筍般涌國外生物信息學的發(fā)展現(xiàn)狀(續(xù))美國于1988年成立國家生物技術(shù)信息中心(NCBI)歐洲于1993年著手建立歐洲生物信息學研究所(EBI)日本于1995年組建了自己的信息生物學中心(CIB)九十年代以來,生物數(shù)據(jù)分析技術(shù)獲得了突飛猛進的發(fā)展。生物信息專業(yè)期刊越來越多:如
Bioinformatics
JournalofComputationalBiology
BriefingsinBioinformatics
ActaBiotheoretica
BioInformaticsTechnology&Systems
BioinformNewsletter互聯(lián)網(wǎng)上的生物信息學網(wǎng)點非常繁多28國外生物信息學的發(fā)展現(xiàn)狀(續(xù))美國于1988年成立國家生物技國內(nèi)生物信息學的發(fā)展現(xiàn)狀國家非常重視:科技部,教育部,基金委,地方政府 特別是:863計劃設立了“生物信息技術(shù)”主題眾多高校與研究機構(gòu)參與:北京大學,中科院生物物理所、天津大學,中科院理論物理所,清華大學,內(nèi)蒙古大學、上海生命研究院,東南大學,華中科技大學,復旦大學等等成立了一批中心,如:北京大學于1997年成立了生物信息學中心上海生命科學研究院于2000年成立了生物信息學中心上海市于2002年成立生物信息技術(shù)工程研究中心取得了一些成績,如基因組測序與分析,數(shù)據(jù)庫,算法軟件29國內(nèi)生物信息學的發(fā)展現(xiàn)狀國家非常重視:科技部,教育部,基金委三、生物信息學當前的
主要研究內(nèi)容三、生物信息學當前的
主要研究內(nèi)容生物信息學的發(fā)展過程大致經(jīng)歷了3個階段:前基因組時代--生物數(shù)據(jù)庫的建立、檢索工具的開發(fā)、DNA和蛋白質(zhì)序列分析、全局和局部的序列對位排列;基因組時代--基因?qū)ふ液妥R別、網(wǎng)絡數(shù)據(jù)庫系統(tǒng)的建立、交互界面的開發(fā);后基因組時代--大規(guī)?;蚪M系統(tǒng)分析、蛋白質(zhì)組分析31生物信息學的發(fā)展過程大致經(jīng)歷了3個階段:31
生物信息服務平臺建設基因組序列分析蛋白質(zhì)結(jié)構(gòu)預測蛋白質(zhì)功能預測基因表達譜數(shù)據(jù)分析疾病基因的預測藥物設計中的應用32生物信息學的主要研究內(nèi)容生物信息服務平臺建設32生物信息學的主要研究內(nèi)容1.生物信息服務平臺建設生物信息數(shù)據(jù)的收集,建立生物信息一級數(shù)據(jù)庫和二級數(shù)據(jù)庫;建立生物信息傳輸?shù)膰H聯(lián)網(wǎng)系統(tǒng);建立生物信息數(shù)據(jù)質(zhì)量的評估與檢測系統(tǒng);建立生物信息的可視化和在線服務系統(tǒng);331.生物信息服務平臺建設332.基因組序列分析342.基因組序列分析342.基因組序列分析(續(xù))(1)蛋白編碼區(qū)與基因結(jié)構(gòu)預測(新基因的發(fā)現(xiàn))意義:得到DNA序列中蛋白編碼基因是認識基因組、了解其運作機理的第一步;利用計算機預測蛋白編碼基因是一種方便、快捷的方法?,F(xiàn)狀:經(jīng)過了10多年的研究,出現(xiàn)了眾多的方法與分析軟件,但效果仍難令人滿意。以人類基因組為例,目前對人類基因數(shù)量的估計仍是眾說紛紜。352.基因組序列分析(續(xù))(1)蛋白編碼區(qū)與基因結(jié)構(gòu)預測(
例:WHATISGENEPREDICTION?
GIVENANUNCHARACTERIZEDDNASEQUENCE,FINDOUT:
1.WHEREDOESTHEGENESTARTSANDENDS?
2.WHICHREGIONSCODEFORAPROTEIN?
AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCgene1gene2gene3exonintergenicregionintron36例:WHATISGENEPREDICTION?
2.基因組序列分析(續(xù))(2)基因調(diào)控序列的分析預測意義:了解基因調(diào)控序列是認識基因組、了解其運作機理的重要內(nèi)容?,F(xiàn)狀:對啟動子已經(jīng)過了10多年的研究,出現(xiàn)了眾多的方法與分析軟件,但預測效果仍然很差。
372.基因組序列分析(續(xù))(2)基因調(diào)控序列的分析預測372.基因組序列分析(續(xù))(3)非編碼序列的分析意義:對于人類基因組,非編碼序列約占95%以上,了解這些“垃圾DNA”的作用是認識基因組、了解其運作機理的重要內(nèi)容?,F(xiàn)狀:研究剛剛開始,普遍認為它們與基因在四維時空的表達調(diào)控有關(guān)。尋找這些區(qū)域的編碼特征,信息調(diào)節(jié)與表達規(guī)律是未來相當長時間內(nèi)的熱點。38JunkDNA2.基因組序列分析(續(xù))(3)非編碼序列的分析38Jun2.基因組序列分析(續(xù))(4)比較基因組研究意義:比較基因組學通過對代表性物種全基因組的比較分析,構(gòu)建系統(tǒng)發(fā)育的遺傳圖譜,尋找不同物種在基因組水平上的差異和共同點,揭示基因、基因家族的起源和功能及其在進化過程中復雜化和多樣化的機制,鑒定新的基因(包括人類疾病相關(guān)基因)?,F(xiàn)狀:研究剛剛開始。392.基因組序列分析(續(xù))(4)比較基因組研究3940403.蛋白質(zhì)結(jié)構(gòu)預測意義:結(jié)構(gòu)與功能密切聯(lián)系有助于闡明疾病機理,并進行藥物設計現(xiàn)狀:通過實驗的方法測定的蛋白質(zhì)結(jié)構(gòu)數(shù)量非常有限,基于計算機技術(shù)的結(jié)構(gòu)預測還處于起步階段,預測效果還不夠理想,且耗費時間較長。413.蛋白質(zhì)結(jié)構(gòu)預測意義:41
蛋白質(zhì)的空間構(gòu)象
一級結(jié)構(gòu):是蛋白質(zhì)空間構(gòu)象和特異生物學功能的基礎。42蛋白質(zhì)的空間構(gòu)象
一級二級結(jié)構(gòu):ALPHA-螺旋H-bondIndividualAminoacidα-螺旋:aresultofH-bondingbetweeneveryfourthpeptidebond(viaaminoandcarbonylgroups)alongthelengthofthepolypeptidechain43二級結(jié)構(gòu):ALPHA-螺旋H-bondIndividual二級結(jié)構(gòu):BETA折疊BETASHEET:aresultofH-bondingbetweenpolypeptidechains44二級結(jié)構(gòu):BETA折疊BETASHEET:aresLoopregionsα-Helixloopβ-Sheet45Loopregionsα-Helixloopβ-Sheet三級結(jié)構(gòu):多肽鏈中全部氨基酸殘基的相對空間位置。46三級結(jié)構(gòu):多肽鏈中全部氨基酸殘基的相對空間位置。46四級結(jié)構(gòu):蛋白質(zhì)分子中各個亞基的空間排布及亞基接觸部位的布局和相互作用。47四級結(jié)構(gòu):蛋白質(zhì)分子中各個亞基的空間排布及亞基接觸部位的布局
隨著DNA測序技術(shù)的發(fā)展,DNA序列數(shù)量急增,從而也產(chǎn)生大量的蛋白質(zhì)序列。目前,用實驗的方法測定蛋白質(zhì)結(jié)構(gòu)速度非常慢,這意味著已知序列的蛋白質(zhì)數(shù)量和已測定結(jié)構(gòu)的蛋白質(zhì)數(shù)量的差距將會越來越大。
48隨著DNA測序技術(shù)的發(fā)展,DNA序列數(shù)量NUMBEROFPROTEINENTRIESNumberoftheentries>53,9165now!49NUMBEROFPROTEINENTRIESNumbeThenumberofproteinstructuresinPDB.Lessthan90,000recently.NUMBEROFPROTEINSTRUCTURES50Thenumberofproteinstructur
…..那么如何縮小這種差距呢?51…..那么如何縮小這種差距呢?51蛋白質(zhì)二級結(jié)構(gòu)的預測:人工神經(jīng)網(wǎng)絡、遺傳算法等技術(shù)構(gòu)建預測方法(PHD、PSIPRED等)。有效預測率:75%左右二級結(jié)構(gòu)預測通常作為蛋白質(zhì)空間結(jié)構(gòu)預測的第一步。蛋白質(zhì)三維結(jié)構(gòu)的預測:同源性建模、線索化方法、從頭預測方法。根據(jù)數(shù)學計算,由100個氨基酸構(gòu)成的小蛋白質(zhì)的空間構(gòu)象可能會有1050種空間結(jié)構(gòu),一種氨基酸序列只可能有一種蛋白質(zhì)結(jié)構(gòu),這就是計算機預測蛋白質(zhì)結(jié)構(gòu)的意義所在。52蛋白質(zhì)二級結(jié)構(gòu)的預測:人工神經(jīng)網(wǎng)絡、遺傳算法等技術(shù)構(gòu)建預測方53534.蛋白質(zhì)功能預測闡明蛋白質(zhì)功能是后基因組時代最重要的內(nèi)容之一。蛋白質(zhì)功能的闡明將有助于疾病治療,藥物設計。蛋白質(zhì)序列數(shù)量飛速增長,而相應的功能注釋則遠遠滯后。544.蛋白質(zhì)功能預測闡明蛋白質(zhì)功能是后基因組時代最重要的內(nèi)
蛋白質(zhì)功能確定的思路及方法:
1.通過相似序列的數(shù)據(jù)庫比對確定功能;
2.確定序列特性:疏水性預測跨膜螺旋等
3.通過序列模體數(shù)據(jù)庫等的比對確定功能55蛋白質(zhì)功能確定的思路及方法:555.基因表達譜數(shù)據(jù)分析565.基因表達譜數(shù)據(jù)分析565.基因表達譜數(shù)據(jù)分析(續(xù))基因表達譜數(shù)據(jù)能夠從基因轉(zhuǎn)錄水平反映細胞的狀態(tài),對于從系統(tǒng)水平了解基因組的功能具有重要價值;基因表達譜數(shù)據(jù)可以用于篩選疾病相關(guān)基因,揭示疾病的分子機制;基因表達譜可以用于疾病的分型和診斷;575.基因表達譜數(shù)據(jù)分析(續(xù))基因表達譜數(shù)據(jù)能夠從基因轉(zhuǎn)錄水6.疾病基因的預測尋找疾病相關(guān)基因?qū)τ诮沂炯膊C理,研制疾病的基因診斷與防止手段具有重要意義,對于生物醫(yī)藥產(chǎn)業(yè)的發(fā)展具有重要作用;目前已經(jīng)找到約2000個人類遺傳疾病致病基因,據(jù)估計,人類疾病基因總數(shù)約7000~8000,尚有多余2/3的疾病基因有待發(fā)現(xiàn)迄今我國只發(fā)現(xiàn)了6個疾病基因;利用生物信息學方法預測疾病基因是有效發(fā)現(xiàn)疾病基因的重要途徑。586.疾病基因的預測尋找疾病相關(guān)基因?qū)τ诮沂炯膊C理,研制疾7.生物信息學與新藥研制未來的藥物研究過程將是基于生物信息知
識挖掘的過程數(shù)據(jù)處理和關(guān)聯(lián)分析發(fā)現(xiàn)藥物作用對象確定靶目標分子針對靶目標進行合理的藥物設計597.生物信息學與新藥研制數(shù)據(jù)處理和發(fā)現(xiàn)藥物確定靶目標針對靶基于生物信息學的新藥設計60基于生物信息學的新藥設計60藥物靶標識別現(xiàn)代新藥研究與開發(fā)關(guān)鍵首先是尋找、確定和制備藥物篩選靶標!藥物靶標是某種疾病起因或特定生化通路中的生物大分子,其活性直接或間接地和疾病或某種性狀相關(guān),每一種藥物都是通過藥物靶點發(fā)揮作用!新的藥物作用靶點一旦被發(fā)現(xiàn),往往成為一系列新藥發(fā)現(xiàn)的突破口;61藥物靶標識別現(xiàn)代新藥研究與開發(fā)關(guān)鍵首先是尋找、確定和制備藥物四、生物信息學密切相關(guān)的學科四、生物信息學密切相關(guān)的學科1.生物生物基礎理論知識(分子生物學、基因組學、蛋白質(zhì)組學…)對基本的生物學實驗有一定的了解(基因測序過程、芯片技術(shù)…)對數(shù)據(jù)的后續(xù)分析…同源比較、進化分析631.生物生物基礎理論知識(分子生物學、基因組學、蛋2.數(shù)學統(tǒng)計學,是生物信息學的數(shù)學基礎之一;概率論與隨機過程理論,如HMM--基因識別、藥物設計;運籌學,如動態(tài)規(guī)劃法--序列比對;最優(yōu)化理論與算法--蛋白質(zhì)空間結(jié)構(gòu)預測、分子對接;幾何拓撲學--DNA超螺旋研究、多肽鏈折疊;函數(shù)論,如傅里葉變換,小波變換;信息論,神經(jīng)網(wǎng)絡,計算數(shù)學;群論,組合數(shù)學等--
分子進化、蛋白質(zhì)結(jié)構(gòu)預測、序列比對;642.數(shù)學643.計算機科學技術(shù)首先是網(wǎng)絡技術(shù)和數(shù)據(jù)庫(特別是關(guān)系型數(shù)據(jù)庫)管理技術(shù),包括極為重要的實驗室數(shù)據(jù)信息管理系統(tǒng)(LIMS);數(shù)據(jù)整合和可視化;數(shù)據(jù)挖掘(DataMining)與人工智能算法設計;生物信息軟件研制計算機語言(C++,java,perl…)
653.計算機科學技術(shù)65五、生物信息學產(chǎn)業(yè)五、生物信息學產(chǎn)業(yè)生物信息學產(chǎn)業(yè)的潛力基礎與應用二者兼?zhèn)湓S多研究成果可以較快或立即產(chǎn)業(yè)化,成為價值很高的產(chǎn)品。是一個發(fā)展?jié)摿艽蟮男屡d高技術(shù)產(chǎn)業(yè)。67生物信息學產(chǎn)業(yè)的潛力67例子只有50名員工的德國Lion生物信息學公司,將通過掃描公共數(shù)據(jù)庫中的序列來發(fā)現(xiàn)500個可能的藥物作用靶點,以一億美元的價格預售給德國Bayer公司。美國出現(xiàn)了大批的基于生物信息學的公司,實施了許多生物信息學研究計劃,主要與藥物設計,基因工程藥物,生物芯片,代謝工程與化學工程密切相關(guān)。生物信息學工業(yè)是知識經(jīng)濟的一個典型,潛力巨大。68例子68
人類科學研究史表明,科學數(shù)據(jù)的大量積累將導致重大的科學規(guī)律的發(fā)現(xiàn)……69人類科學研究史表明,科學數(shù)據(jù)的大量IsaacNewton牛頓JohannesKepler開普勒TychoBrahe第谷第一次科學浪潮70天象觀測大量數(shù)據(jù)行星運動定律萬有引力定律航空航天技術(shù)IsaacNewtonJohannesKeplerTy元素與大量化合物
元素周期表
現(xiàn)代化學化工第二次科學浪潮DmitriMendeleev門捷列夫71元素與大量化合物元素周期表現(xiàn)代化學化工第二次科學大量原子光譜數(shù)據(jù)
量子論
量子力學
信息技術(shù)MaxKarlErnstLudwigPlanck普朗克AlbertEinstein愛因斯坦NielsBohr玻爾ErwinSchr?dinger薛定諤第三次科學浪潮………72大量原子光譜數(shù)據(jù)量子論量子力學信息技術(shù)Ma基因組超大量的序列和結(jié)構(gòu)數(shù)據(jù)
?重大的發(fā)現(xiàn)第四次科學浪潮?73基因組超大量的序列和結(jié)構(gòu)數(shù)據(jù)?重大的發(fā)現(xiàn)第四次科學浪潮謝謝大家!74謝謝大家!74杜娟2013.02.27生物信息學杜娟生物信息學課程簡介課程特點課程目標課程形式參考教材與文獻教師聯(lián)系方式成績構(gòu)成76課程簡介課程特點2生物、計算機、數(shù)學、化學等多學科交叉,知識覆蓋面廣;涉及從基因組序列分析直到藥物設計等眾多內(nèi)容,且應用領域?qū)拸V;生物信息數(shù)據(jù)資源與分析工具繁多,實踐環(huán)節(jié)非常重要;理論方法尚不系統(tǒng)成熟,處于迅速發(fā)展變化階段,知識更新快。缺乏合適的教材課程特點77生物、計算機、數(shù)學、化學等多學科交叉,知識覆蓋面廣;課程特點課程目標掌握生物信息學的基本知識與概念了解生物信息學網(wǎng)上資源針對核酸和蛋白質(zhì)的分析78課程目標掌握生物信息學的基本知識與概念4課程形式講授概念與知識點(Textbooks)自學與討論(Websites)理解(Literaturereferences)掌握與鞏固(ComputerExperiences)79課程形式講授概念與知識點(Textbooks)5主要的參考教材1《生物信息學》,陶士珩主編科學出版社,20072《生物信息學》,DavidW.Mount著,鐘揚、王莉、張亮等譯,高等教育出版社,2003。
3生物信息學——基因和蛋白質(zhì)分析的實用指南(AndreasD.BaxevanisAndB.F.FrancisOuellette著).李衍達、孫子榮等譯.北京:清華大學出版社,2000
4《簡明生物信息學》,鐘揚等主編.高等教育出版社,2001
5《探索基因組學、蛋白質(zhì)組學和生物信息學》,孫子榮譯.科學出版社,2004
6《生物信息學方法與實踐》,張成崗賀福初編著.科學出版社,200280主要的參考教材1《生物信息學》,陶士珩主編科參考文獻主要為英文原始文獻,鼓勵大家閱讀。課題的研究方法81參考文獻主要為英文原始文獻,鼓勵大家閱讀。7聯(lián)系方式及成績構(gòu)成杜娟
dujuannx@126.com
成績構(gòu)成隨堂測驗、課堂表現(xiàn)30%
作業(yè)30%
項目報告40%
82聯(lián)系方式及成績構(gòu)成杜娟
dujuannx@126.com883生物信息學——緒論一、生物信息學及其研究意義二、生物信息學的發(fā)展現(xiàn)狀三、生物信息學當前的主要研究內(nèi)容四、與生物信息學密切相關(guān)的學科五、生物信息學產(chǎn)業(yè)及前景9生物信息學——緒論一、生物信息學及其研究意義一、生物信息學及其研究意義生物信息學第一章課件背景1.
人類基因組計劃(HGP)投入30億美元,2003年完成精細圖,約30億個數(shù)據(jù)(堿基),相當于3000本每本1000頁每頁1000字的“天書”。曼哈頓原子彈計劃阿波羅登月計劃人類基因組計劃85背景1.人類基因組計劃(HGP)曼哈頓原子彈計劃阿波羅登2.模式生物基因組計劃模式生物基因組計劃是人類基因組計劃的一個重要組成部分。模式生物有:大腸桿菌、酵母、擬南芥、線蟲、果蠅和小鼠等
3.相關(guān)功能基因組計劃
轉(zhuǎn)錄組,基因表達譜,蛋白質(zhì)組……862.模式生物基因組計劃12生物學數(shù)據(jù)庫的增長情況至今1000多個87生物學數(shù)據(jù)庫的增長情況至今1000多個13序列數(shù)據(jù)增長趨勢88序列數(shù)據(jù)增長趨勢14生物數(shù)據(jù)爆炸性增長:生物數(shù)據(jù)量的積累已達到人類有史以來所說過的話的數(shù)百倍,而且還將以越來越快的速度增長。89生物數(shù)據(jù)爆炸性增長:生物數(shù)據(jù)量的積累已達到人類有史以來面對堆積如山的生物學數(shù)據(jù)……90面對堆積如山的生物學數(shù)據(jù)……16數(shù)據(jù)知識AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAACGT?91數(shù)據(jù)知識AGCATCGAAGTTGCATGACGATG多學科高度交叉
生物學醫(yī)學
數(shù)學、統(tǒng)計學物理學、化學信息、系統(tǒng)與計算科學高性能計算、數(shù)據(jù)庫、網(wǎng)格計算生物信息學與系統(tǒng)生物學92多學科高度交叉生物學醫(yī)學數(shù)學、統(tǒng)計學物理學、化學信息、多尺度數(shù)據(jù)的整合和模擬93多尺度數(shù)據(jù)的整合和模擬19什么是生物信息學
生物信息學(BIOINFORMATICS)是一門集數(shù)學,計算機科學和生物學的工具以及技術(shù)于一體的涵蓋了生物信息的獲取,處理,存儲,分配,分析和闡述等各個方面以理解海量的生物學數(shù)據(jù)為目的的學科UnderstandingOurGeneticInheritance.TheUSHumanGenomeProject:TheFirstFiveYears1991-1995.NIHPublicationNo.90-1590,April,1995生物信息技術(shù)是一個多學科交叉的前沿生物技術(shù)94什么是生物信息學生物信息學(BIOINFORMA生物信息學研究的意義科學意義:可望從海量生物學數(shù)據(jù)分析中獲得對生命運行機制和疾病機理等的深入理解。應用價值:在生物醫(yī)藥研究和相關(guān)生物技術(shù)相關(guān)產(chǎn)業(yè)(生物制藥、農(nóng)、林、牧、漁、環(huán)保等)的發(fā)展中將發(fā)揮越來越重要的作用。95生物信息學研究的意義科學意義:可望從海量生物學數(shù)據(jù)分析中獲得生物信息學是生命科學與信息技術(shù)交叉融合的新學科,也是當今全球最具發(fā)展前途的學科之一。
WhenIgivetalkstoyoungscientistsseekingadviceaboutareasoffutureintensescientificexcitement,computationalbiologyismynumberonerecommendation.FrancisCollins,DirectorofHGPatNIH生物信息學是生命科學與信息技術(shù)交叉融合的新學科,也是當今全球
生命科學已從一種以實驗為基礎的科學轉(zhuǎn)向以信息為基礎的科學,其成功將大大依靠信息科學與生命科學的聯(lián)姻、依賴于生物信息技術(shù)的發(fā)展?;蛐畔F(xiàn)在正推動著生物制藥革命。破譯人類基因組給我們帶來了打開這個星球上最有價值的圖書館的鑰匙,但我們現(xiàn)在閱讀這些圖書還處在非常初級的水平,科學家的下一步工作將是如何把信息從這些圖書中挖掘出來。目前美國缺少有能力閱讀這部人類基因“天書”并使用其中信息的人。這個領域有非常多的機會,有非常大的需要。據(jù)估計,這一領域所需要的研究人員數(shù)量將是現(xiàn)有人數(shù)的50倍。培養(yǎng)這種人才就像破譯人類基因組一樣重要。
EricLander,200297生命科學已從一種以實驗為基礎的科學轉(zhuǎn)向以信息為基礎的科學,二、生物信息學的發(fā)展現(xiàn)狀二、生物信息學的發(fā)展現(xiàn)狀生物信息學的萌芽1956年在美國召開過首次“生物學中的信息理論”討論會
60年代美國建立了手工搜集數(shù)據(jù)的蛋白質(zhì)數(shù)據(jù)庫,PIR
1962年Zuckerkandl基于序列變異分析的分子演化研究
1964年Davies開創(chuàng)了蛋白質(zhì)結(jié)構(gòu)預測的研究
1970年Needleman等發(fā)表了廣受重視的兩序列比較算法
1970年出現(xiàn)ComputerMethodsandProgramsinBiomedicine期刊
1974年Ratner首先對分子遺傳調(diào)控系統(tǒng)進行處理分析
1975年P(guān)ipas等首先提出用計算機技術(shù)預測RNA二級結(jié)構(gòu)
1979年美國洛斯阿拉莫斯國家實驗室建立GenBank99生物信息學的萌芽1956年在美國召開過首次“生物學中的信生物信息學的萌芽(續(xù))Science于1980年發(fā)表了關(guān)于計算分子生物學的綜述1982年歐洲分子生物學實驗室提供EMBL服務1984年日本著手建立國家級核酸序列數(shù)據(jù)庫DDBJ1985年出現(xiàn)ComputerApplicationintheBiosciences期刊10020世紀80年代末期,林華安博士compbio——bioinformatique——bio-informatics——bioinformatics“生物信息學之父”生物信息學的萌芽(續(xù))Science于1980年發(fā)表了關(guān)于計國外生物信息學的發(fā)展現(xiàn)狀各種專業(yè)研究機構(gòu)和公司如雨后春筍般涌現(xiàn)生物科技公司和制藥工業(yè)內(nèi)部生物信息學部門的數(shù)量與日俱增即使象美國這樣的發(fā)達國家也面臨生物信息人才匱乏的局面許多大學和研究機構(gòu)已經(jīng)成立自己的生物信息學中心1999年美國NIH專家委員會又建議迅速在大學和研究機構(gòu)中建立20個生物計算中心,給予每個中心每年800萬美元的支持,從事有關(guān)研究和人才培養(yǎng)英國所有主要研究資助機構(gòu)達成共識,認為應高度優(yōu)先滿足對生物信息學技術(shù)的需求,并已實現(xiàn)對相關(guān)人才培養(yǎng)的大力資助101國外生物信息學的發(fā)展現(xiàn)狀各種專業(yè)研究機構(gòu)和公司如雨后春筍般涌國外生物信息學的發(fā)展現(xiàn)狀(續(xù))美國于1988年成立國家生物技術(shù)信息中心(NCBI)歐洲于1993年著手建立歐洲生物信息學研究所(EBI)日本于1995年組建了自己的信息生物學中心(CIB)九十年代以來,生物數(shù)據(jù)分析技術(shù)獲得了突飛猛進的發(fā)展。生物信息專業(yè)期刊越來越多:如
Bioinformatics
JournalofComputationalBiology
BriefingsinBioinformatics
ActaBiotheoretica
BioInformaticsTechnology&Systems
BioinformNewsletter互聯(lián)網(wǎng)上的生物信息學網(wǎng)點非常繁多102國外生物信息學的發(fā)展現(xiàn)狀(續(xù))美國于1988年成立國家生物技國內(nèi)生物信息學的發(fā)展現(xiàn)狀國家非常重視:科技部,教育部,基金委,地方政府 特別是:863計劃設立了“生物信息技術(shù)”主題眾多高校與研究機構(gòu)參與:北京大學,中科院生物物理所、天津大學,中科院理論物理所,清華大學,內(nèi)蒙古大學、上海生命研究院,東南大學,華中科技大學,復旦大學等等成立了一批中心,如:北京大學于1997年成立了生物信息學中心上海生命科學研究院于2000年成立了生物信息學中心上海市于2002年成立生物信息技術(shù)工程研究中心取得了一些成績,如基因組測序與分析,數(shù)據(jù)庫,算法軟件103國內(nèi)生物信息學的發(fā)展現(xiàn)狀國家非常重視:科技部,教育部,基金委三、生物信息學當前的
主要研究內(nèi)容三、生物信息學當前的
主要研究內(nèi)容生物信息學的發(fā)展過程大致經(jīng)歷了3個階段:前基因組時代--生物數(shù)據(jù)庫的建立、檢索工具的開發(fā)、DNA和蛋白質(zhì)序列分析、全局和局部的序列對位排列;基因組時代--基因?qū)ふ液妥R別、網(wǎng)絡數(shù)據(jù)庫系統(tǒng)的建立、交互界面的開發(fā);后基因組時代--大規(guī)?;蚪M系統(tǒng)分析、蛋白質(zhì)組分析105生物信息學的發(fā)展過程大致經(jīng)歷了3個階段:31
生物信息服務平臺建設基因組序列分析蛋白質(zhì)結(jié)構(gòu)預測蛋白質(zhì)功能預測基因表達譜數(shù)據(jù)分析疾病基因的預測藥物設計中的應用106生物信息學的主要研究內(nèi)容生物信息服務平臺建設32生物信息學的主要研究內(nèi)容1.生物信息服務平臺建設生物信息數(shù)據(jù)的收集,建立生物信息一級數(shù)據(jù)庫和二級數(shù)據(jù)庫;建立生物信息傳輸?shù)膰H聯(lián)網(wǎng)系統(tǒng);建立生物信息數(shù)據(jù)質(zhì)量的評估與檢測系統(tǒng);建立生物信息的可視化和在線服務系統(tǒng);1071.生物信息服務平臺建設332.基因組序列分析1082.基因組序列分析342.基因組序列分析(續(xù))(1)蛋白編碼區(qū)與基因結(jié)構(gòu)預測(新基因的發(fā)現(xiàn))意義:得到DNA序列中蛋白編碼基因是認識基因組、了解其運作機理的第一步;利用計算機預測蛋白編碼基因是一種方便、快捷的方法?,F(xiàn)狀:經(jīng)過了10多年的研究,出現(xiàn)了眾多的方法與分析軟件,但效果仍難令人滿意。以人類基因組為例,目前對人類基因數(shù)量的估計仍是眾說紛紜。1092.基因組序列分析(續(xù))(1)蛋白編碼區(qū)與基因結(jié)構(gòu)預測(
例:WHATISGENEPREDICTION?
GIVENANUNCHARACTERIZEDDNASEQUENCE,FINDOUT:
1.WHEREDOESTHEGENESTARTSANDENDS?
2.WHICHREGIONSCODEFORAPROTEIN?
AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCgene1gene2gene3exonintergenicregionintron110例:WHATISGENEPREDICTION?
2.基因組序列分析(續(xù))(2)基因調(diào)控序列的分析預測意義:了解基因調(diào)控序列是認識基因組、了解其運作機理的重要內(nèi)容?,F(xiàn)狀:對啟動子已經(jīng)過了10多年的研究,出現(xiàn)了眾多的方法與分析軟件,但預測效果仍然很差。
1112.基因組序列分析(續(xù))(2)基因調(diào)控序列的分析預測372.基因組序列分析(續(xù))(3)非編碼序列的分析意義:對于人類基因組,非編碼序列約占95%以上,了解這些“垃圾DNA”的作用是認識基因組、了解其運作機理的重要內(nèi)容?,F(xiàn)狀:研究剛剛開始,普遍認為它們與基因在四維時空的表達調(diào)控有關(guān)。尋找這些區(qū)域的編碼特征,信息調(diào)節(jié)與表達規(guī)律是未來相當長時間內(nèi)的熱點。112JunkDNA2.基因組序列分析(續(xù))(3)非編碼序列的分析38Jun2.基因組序列分析(續(xù))(4)比較基因組研究意義:比較基因組學通過對代表性物種全基因組的比較分析,構(gòu)建系統(tǒng)發(fā)育的遺傳圖譜,尋找不同物種在基因組水平上的差異和共同點,揭示基因、基因家族的起源和功能及其在進化過程中復雜化和多樣化的機制,鑒定新的基因(包括人類疾病相關(guān)基因)?,F(xiàn)狀:研究剛剛開始。1132.基因組序列分析(續(xù))(4)比較基因組研究39114403.蛋白質(zhì)結(jié)構(gòu)預測意義:結(jié)構(gòu)與功能密切聯(lián)系有助于闡明疾病機理,并進行藥物設計現(xiàn)狀:通過實驗的方法測定的蛋白質(zhì)結(jié)構(gòu)數(shù)量非常有限,基于計算機技術(shù)的結(jié)構(gòu)預測還處于起步階段,預測效果還不夠理想,且耗費時間較長。1153.蛋白質(zhì)結(jié)構(gòu)預測意義:41
蛋白質(zhì)的空間構(gòu)象
一級結(jié)構(gòu):是蛋白質(zhì)空間構(gòu)象和特異生物學功能的基礎。116蛋白質(zhì)的空間構(gòu)象
一級二級結(jié)構(gòu):ALPHA-螺旋H-bondIndividualAminoacidα-螺旋:aresultofH-bondingbetweeneveryfourthpeptidebond(viaaminoandcarbonylgroups)alongthelengthofthepolypeptidechain117二級結(jié)構(gòu):ALPHA-螺旋H-bondIndividual二級結(jié)構(gòu):BETA折疊BETASHEET:aresultofH-bondingbetweenpolypeptidechains118二級結(jié)構(gòu):BETA折疊BETASHEET:aresLoopregionsα-Helixloopβ-Sheet119Loopregionsα-Helixloopβ-Sheet三級結(jié)構(gòu):多肽鏈中全部氨基酸殘基的相對空間位置。120三級結(jié)構(gòu):多肽鏈中全部氨基酸殘基的相對空間位置。46四級結(jié)構(gòu):蛋白質(zhì)分子中各個亞基的空間排布及亞基接觸部位的布局和相互作用。121四級結(jié)構(gòu):蛋白質(zhì)分子中各個亞基的空間排布及亞基接觸部位的布局
隨著DNA測序技術(shù)的發(fā)展,DNA序列數(shù)量急增,從而也產(chǎn)生大量的蛋白質(zhì)序列。目前,用實驗的方法測定蛋白質(zhì)結(jié)構(gòu)速度非常慢,這意味著已知序列的蛋白質(zhì)數(shù)量和已測定結(jié)構(gòu)的蛋白質(zhì)數(shù)量的差距將會越來越大。
122隨著DNA測序技術(shù)的發(fā)展,DNA序列數(shù)量NUMBEROFPROTEINENTRIESNumberoftheentries>53,9165now!123NUMBEROFPROTEINENTRIESNumbeThenumberofproteinstructuresinPDB.Lessthan90,000recently.NUMBEROFPROTEINSTRUCTURES124Thenumberofproteinstructur
…..那么如何縮小這種差距呢?125…..那么如何縮小這種差距呢?51蛋白質(zhì)二級結(jié)構(gòu)的預測:人工神經(jīng)網(wǎng)絡、遺傳算法等技術(shù)構(gòu)建預測方法(PHD、PSIPRED等)。有效預測率:75%左右二級結(jié)構(gòu)預測通常作為蛋白質(zhì)空間結(jié)構(gòu)預測的第一步。蛋白質(zhì)三維結(jié)構(gòu)的預測:同源性建模、線索化方法、從頭預測方法。根據(jù)數(shù)學計算,由100個氨基酸構(gòu)成的小蛋白質(zhì)的空間構(gòu)象可能會有1050種空間結(jié)構(gòu),一種氨基酸序列只可能有一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030全球溫濕度氣候試驗箱行業(yè)調(diào)研及趨勢分析報告
- 2025年全球及中國光學有機硅膠行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025-2030全球電子母豬喂料器行業(yè)調(diào)研及趨勢分析報告
- 2025年全球及中國熟食冷藏展示柜行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 房屋地基買賣合同
- 2025合同模板出國勞務合同范本
- 2025房屋借款合同范本
- 2025北京市前期物業(yè)服務合同模板
- 剪輯師聘用合同資訊
- 提升殘疾人的信息獲取與溝通能力
- 電力儲能用集裝箱技術(shù)規(guī)范
- 小學生雪豹課件
- 基礎護理常規(guī)制度
- 針灸治療動眼神經(jīng)麻痹
- 傾聽幼兒馬賽克方法培訓
- 設備日常維護及保養(yǎng)培訓
- 2024年安全生產(chǎn)月主題2024年學校安全生產(chǎn)月活動方案
- 2024年廣東佛山市中醫(yī)院三水醫(yī)院招聘61人歷年高頻考題難、易錯點模擬試題(共500題)附帶答案詳解
- 中級半導體分立器件和集成電路裝調(diào)工技能鑒定考試題庫(含答案)
- 固定資產(chǎn)培訓課件共-51張
- 2024年高考語文思辨類作文預測+考前模擬題+高分范文
評論
0/150
提交評論