實驗三基因組序列分析_第1頁
實驗三基因組序列分析_第2頁
實驗三基因組序列分析_第3頁
實驗三基因組序列分析_第4頁
實驗三基因組序列分析_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

實驗三基因組序列分析第一頁,共四十七頁,2022年,8月28日實驗項目三:基因序列分析

一、實驗?zāi)康暮鸵螅赫莆栈蚩勺x框的識別;掌握啟動子區(qū)域的預(yù)測掌握CpG島的預(yù)測掌握轉(zhuǎn)錄終止信號的預(yù)測采用mRNA序列預(yù)測基因:Spidey的使用掌握各預(yù)測服務(wù)器結(jié)果的分析第二頁,共四十七頁,2022年,8月28日原核生物基因結(jié)構(gòu)1長開放閱讀框2高基因密度3簡單的基因結(jié)構(gòu)4基因組中GC含量變化非常大特點:第三頁,共四十七頁,2022年,8月28日真核生物基因結(jié)構(gòu)特點:1基因結(jié)構(gòu)復(fù)雜2具有復(fù)雜的基因轉(zhuǎn)錄調(diào)控方式3具有豐富的可變剪接4有明顯的CpG島、密碼子使用具有偏好性第四頁,共四十七頁,2022年,8月28日基因組序列分析第五頁,共四十七頁,2022年,8月28日

例:WhatisGenePrediction?

GivenanuncharacterizedDNAsequence,findout:

1.Wheredoesthegenestartsandends?

2.Whichregionscodeforaprotein?

AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCgene1gene2gene3exonintergenicregionintron第六頁,共四十七頁,2022年,8月28日第七頁,共四十七頁,2022年,8月28日一開放讀碼框的識別開放讀碼框(openreadingframe,ORF)

是一段起始密碼子和終止密碼子之間的堿基序列ORF是潛在的蛋白質(zhì)編碼區(qū)基因預(yù)測第八頁,共四十七頁,2022年,8月28日基因開放閱讀框/基因結(jié)構(gòu)分析識別工具Getorfhttp://bioweb.pasteur.fr/seqanal/interfaces/getorf.htmlEMBOSS通用Plotorfhttp://bioweb.pasteur.fr/seqanal/interfaces/plotorf.htmlEMBOSS通用ORFFinder/gorf/gorf.htmlNCBI通用BestORF/all.htmSoftberry真核GENSCAN/GENSCAN.htmlMIT脊椎、擬南芥、玉米GeneFinder/tools/genefinder/Zhanglab人、小鼠、擬南芥、酵母FGENESH/all.htmSoftberry真核GeneMark/GeneMark/GIT原核GLIMMER/genomes/MICROBES/glimmer_3.cgi/software/glimmer

Maryland原核FgeneSB/all.htmSoftberry細菌FgeneSV/all.htmSoftberry病毒Generation/generation/ORNL原核FGENESH+/all.htmSoftberry原核GenomeScan

/genomescan.html

MIT脊椎、擬南芥、玉米GeneWise

http://www.ebi.ac.uk/Wise2/EBI人、蠕蟲GRAIL/grailexp/ORNL人、小鼠、擬南芥、果蠅第九頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結(jié)果分析第十頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結(jié)果分析第十一頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結(jié)果分析第十二頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結(jié)果分析第十三頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結(jié)果分析第十四頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結(jié)果分析Blast比對結(jié)果搜索到多個顯著相似的序列,故所預(yù)測的ORF的可信度較高。如果要獲取該ORF所編碼的蛋白質(zhì)序列,可以點擊“Accept”按鈕后,在“1GenBank”的下拉框中選擇“3Fasta”,并點擊“view”,即可獲取該ORF所編碼的蛋白質(zhì)序列。第十五頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結(jié)果分析第十六頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結(jié)果分析第十七頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結(jié)果分析第十八頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結(jié)果分析第十九頁,共四十七頁,2022年,8月28日提交序列提交序列文件運行GENSCAN選擇物種顯示氨基酸或CDS序列序列名稱(可選)是否顯示非最優(yōu)外顯子2.Genscan的使用及結(jié)果分析第二十頁,共四十七頁,2022年,8月28日基因、外顯子及類型正鏈、負鏈預(yù)測單元起始、終止及長度相位編碼區(qū)打分值可信概率、得分值2.Genscan的結(jié)果分析第二十一頁,共四十七頁,2022年,8月28日3.FGENESH的使用及結(jié)果分析輸入序列的Fasta文件第二十二頁,共四十七頁,2022年,8月28日3.FGENESH的使用及結(jié)果分析起始外顯子中間及末端外顯子PolyA位點起始堿基終止堿基打分長度第二十三頁,共四十七頁,2022年,8月28日3.FGENESH的使用及結(jié)果分析第二十四頁,共四十七頁,2022年,8月28日3.FGENESH的使用及結(jié)果分析第二十五頁,共四十七頁,2022年,8月28日二.原核和真核生物基因轉(zhuǎn)錄起始位點上游區(qū)結(jié)構(gòu)

原核生物真核生物TTGACATATAATAmRNA+1-10-35PyAPyTATAATGC區(qū)CAAT區(qū)mRNA+1-40-25-110增強子上游啟動子元件,UPE核心啟動子元件轉(zhuǎn)錄起始位點第二十六頁,共四十七頁,2022年,8月28日原核生物真核生物第二十七頁,共四十七頁,2022年,8月28日二.啟動子預(yù)測輸入序列的Fasta文件第二十八頁,共四十七頁,2022年,8月28日啟動子預(yù)測結(jié)果從預(yù)測結(jié)果可知,預(yù)測的啟動子區(qū)在32564至32783之間,啟動子閾值系統(tǒng)默認為53.00,預(yù)測的啟動子分值為84.69,高于閾值,分值越高,說明預(yù)測的準確性大。與該啟動子可能結(jié)合的轉(zhuǎn)錄因子如下所示第二十九頁,共四十七頁,2022年,8月28日三CpG島預(yù)測CpG島CpG島又稱為HTF島,是DNA上的一個區(qū)域,此區(qū)域富含GC,二者以磷酸酯鍵相連。位于真核生物基因轉(zhuǎn)錄起始位點上游,GC含>50%,長度>200bpCpG島常出現(xiàn)在管家基因或頻繁表達的基因的啟動子附近,在這些部位,CpG島具有阻止序列甲基化的作用,因此,搜索CpG島可以為基因及其啟動子的預(yù)測提供線索。CpGIsland分析CpGIsland/cpgislands2/cpg.aspxWebCpGfinder/berry.phtml?topic=cpgfinder&group=programs&subgroup=promoterWebCpGPlot/CpGReport/Isochorehttp://www.ebi.ac.uk/emboss/cpgplot/index.htmlWeb第三十頁,共四十七頁,2022年,8月28日輸入序列的Fasta文件第三十一頁,共四十七頁,2022年,8月28日從該序列的預(yù)測結(jié)果來看,找到兩個CpG島,分別位于501-727,長度為227個堿基,54380-54691,長度為312第三十二頁,共四十七頁,2022年,8月28日四轉(zhuǎn)錄終止信號加polyA信號:AAUAAA轉(zhuǎn)錄終止信號:GCrich二重對稱區(qū)、UUUUUUC-GC-GG-CG-CU-AG-CG-CC-GG-CUUUUUUUUURNA5’3’AAUAAACAAAAAAAAAAAAA成熟mRNA5’3’AAUAAACAGUmRNA前體5’3’第三十三頁,共四十七頁,2022年,8月28日第三十四頁,共四十七頁,2022年,8月28日轉(zhuǎn)錄終止信號預(yù)測Hcpolyar.it/~webgene/wwwHC_polya.htmlWebPOLYAH/berry.phtml?topic=polyah&group=programs&subgroup=promoterWebpolyadq/tools/polyadq/polyadq_form.htmlWeb第三十五頁,共四十七頁,2022年,8月28日POLYAH的使用及結(jié)果分析輸入序列的Fasta文件第三十六頁,共四十七頁,2022年,8月28日POLYAH的使用及結(jié)果分析預(yù)測的POLYA位點,LDF為權(quán)重第三十七頁,共四十七頁,2022年,8月28日內(nèi)含子/外顯子剪切位點識別對基因組序列的讀碼框區(qū)域進行預(yù)測內(nèi)含子5’端供體位點(donorsplicesite):GT內(nèi)含子3’端受體位點(acceptorsplicesite):AG預(yù)測工具:GENSCAN,GENEMARKNetGene2,SpliceView第三十八頁,共四十七頁,2022年,8月28日第三十九頁,共四十七頁,2022年,8月28日mRNA剪切位點識別:spideyNCBI開發(fā)的在線預(yù)測程序用于mRNA序列同基因組序列比對分析第四十頁,共四十七頁,2022年,8月28日第四十一頁,共四十七頁,2022年,8月28日序列在線提交形式:界面中有兩個窗口:上方窗口用于輸入基因組序列(直接粘貼序列或用GenbankID/AC號)下方窗口用于輸入cDNA/mRNA序列(直接粘貼序列或用GenbankID/AC號)可同時輸入多條cDNA/mRNA序列與同一條基因組序列進行分析Spidey序列提交頁面輸入基因組序列或序列數(shù)據(jù)庫號AC002390.1第四十二頁,共四十七頁,2022年,8月28日輸入相似mRNA序列判斷用于分析的序列間的差異,并調(diào)整比對參數(shù)不受默認內(nèi)含子長度限制,默認長度:內(nèi)部內(nèi)含子為35kb,末端內(nèi)含子為100kb輸出格式比對閾值選擇物種第四十三頁,共四十七頁,2022年,8月28日第一條藍色序列為基因組序列,橘黃色為外顯子第四十四頁,共四十七頁,2022年,8月28日外顯子對應(yīng)于基因組上的起始/結(jié)束位置外顯子對應(yīng)于mRNA/cDNA上的起始/結(jié)束位置供體、受體位點外顯子序號外顯子長度一致性百分比錯配和gap第四十五頁,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論