核苷酸序列分析_第1頁
核苷酸序列分析_第2頁
核苷酸序列分析_第3頁
核苷酸序列分析_第4頁
核苷酸序列分析_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

核苷酸序列分析第1頁,共67頁,2023年,2月20日,星期五第2頁,共67頁,2023年,2月20日,星期五重復(fù)序列分析開放讀碼框(openreadingframe,ORF)的識(shí)別基因結(jié)構(gòu)分析內(nèi)含子/外顯子剪切位點(diǎn)識(shí)別選擇性剪切分析CpG島的識(shí)別核心啟動(dòng)子/轉(zhuǎn)錄因子結(jié)合位點(diǎn)/轉(zhuǎn)錄啟始位點(diǎn)的識(shí)別轉(zhuǎn)錄終止信號(hào)的預(yù)測(cè)GC含量/密碼子偏好性分析核苷酸序列分析第3頁,共67頁,2023年,2月20日,星期五重復(fù)序列分析原核基因組中除rRNA、tRNA基因有多個(gè)拷貝外,重復(fù)序列(repetitivesequences)不多。哺乳動(dòng)物基因組中則存在大量重復(fù)序列,分為3類:高度重復(fù)序列。一般較短,長10~300bp,重復(fù)106次左右,占基因組10%~60%,在人類基因組中約占20%,功能還不明確。核苷酸序列分析ORF第4頁,共67頁,2023年,2月20日,星期五重復(fù)序列分析中度重復(fù)序列。長10~300bp,重復(fù)10~105次,占基因組10~40%。哺乳類中含量最多的一種稱為Alu的序列,長約300bp,重復(fù)3×105次,在人類基因組中約占7%,功能不是很清楚。單拷貝序列。這類序列基本上不重復(fù),占哺乳類基因組的50%~80%,在人類基因組中約占65%。由于大量重復(fù)序列影響序列分析,因此在對(duì)真核基因分析前,最好把重復(fù)序列屏蔽掉。核苷酸序列分析ORF第5頁,共67頁,2023年,2月20日,星期五/cgi-bin/WEBRepeatMaskerArabidopsisthalianachromosome2,partsequence(NC_003071.1)Output第6頁,共67頁,2023年,2月20日,星期五開放讀碼框的識(shí)別開放讀碼框(openreadingframe,ORF)

是一段起始密碼子(ATG)和終止密碼子(TAA,TAG,TGA)之間的堿基序列ORF是潛在的蛋白質(zhì)編碼區(qū)原核生物中多數(shù)基因的編碼序列在100氨基酸以上;真核生物的編碼區(qū)由內(nèi)含子和外顯子組成,其外顯子的平均長度約為50個(gè)氨基酸。預(yù)測(cè)ORF的方法有兩類:基于統(tǒng)計(jì)分析和模式識(shí)別(如GENSCAN,GeneMark,GRAILII等),基于同源比對(duì)。核苷酸序列分析ORF第7頁,共67頁,2023年,2月20日,星期五開放讀碼框的識(shí)別Kozak規(guī)則:

ORF中起始密碼子ATG前后的堿基具有特定的偏好性。若將第一個(gè)ATG中的堿基分別標(biāo)為1、2、3位,則Kozak規(guī)則可描述如下:第4位的偏好堿基為G;ATG的5’端的15bp范圍內(nèi)的側(cè)翼序列內(nèi)不含堿基T;第3、6、9位G為偏好堿基;除第3、6、9位,在整個(gè)側(cè)翼序列區(qū)中,C為偏好堿基。核苷酸序列分析ORF第8頁,共67頁,2023年,2月20日,星期五基因開放閱讀框/基因結(jié)構(gòu)分析識(shí)別工具Getorfhttp://bioweb.pasteur.fr/seqanal/interfaces/getorf.htmlWeb/LinuxPlotorfhttp://bioweb.pasteur.fr/seqanal/interfaces/plotorf.htmlWeb/LinuxORFFinder/gorf/gorf.htmlWebBestORF/all.htmWebGENSCAN/GENSCAN.htmlWeb/LinuxGeneMarkhttp://www.ebi.ac.uk/genemark//GeneMark/WebGeneFinder/tools/genefinder/(Dr.MichaelZhang)WebFGENESH/all.htmWeb/LinuxGlimmerM/tdb/glimmerm/glmr_form.htmlLinuxFgeneSB/FgeneSV/all.htmWebGeneration/generation/WebGeneBuilderr.it/~webgene/genebuilder.htmlWebFGENESH+/++/all.htmWeb/LinuxGenomeScan/genomescan.htmlWebGeneWisehttp://www.sanger.ac.uk/Software/Wise2/WebGRAIL/grailexp/Web/Linux/WindowsBCMGeneFinder/seq-search/gene-search.htmlWeb核苷酸序列分析ORF第9頁,共67頁,2023年,2月20日,星期五開放讀碼框的識(shí)別預(yù)測(cè)ORF的方法都是針對(duì)特定物種而設(shè)計(jì)的,如GENSCAN最初是針對(duì)人類的,后擴(kuò)展對(duì)脊椎動(dòng)物、果蠅、擬南芥、玉米基因的預(yù)測(cè)。GlimerM適于惡性瘧原蟲、擬南芥、曲霉菌和水稻對(duì)mRNA,cDNA,EST,宜用GetOrf,ORFFinder,Plotorf,BestORF等核苷酸序列分析ORF第10頁,共67頁,2023年,2月20日,星期五應(yīng)用ORFFinder預(yù)測(cè)水稻瘤矮病毒(RGDV)S8片斷的ORFORFFinder:/gorf/gorf.html水稻瘤矮病毒(ricegalldwarfvirus,RGDV)引起的水稻瘤矮病是中國及東南亞國家水稻上的一種重要病毒病害.為構(gòu)建融合蛋白的表達(dá)載體,需要對(duì)RGDVS8片斷的基因序列(GenBank登陸號(hào):AY216767)進(jìn)行ORF分析并確定其位置,為設(shè)計(jì)表達(dá)引物提供信息.提交序列:以登陸號(hào)或直接粘貼FASTA格式的序列.參數(shù)設(shè)置:可設(shè)置待分析序列片斷的起始和結(jié)束位置;ORFFinder提供了22種遺傳密碼表可供選擇。這里選擇默認(rèn)參數(shù).核苷酸序列分析ORF第11頁,共67頁,2023年,2月20日,星期五TheGeneticCodes第12頁,共67頁,2023年,2月20日,星期五第13頁,共67頁,2023年,2月20日,星期五點(diǎn)擊第14頁,共67頁,2023年,2月20日,星期五點(diǎn)擊第15頁,共67頁,2023年,2月20日,星期五結(jié)果驗(yàn)證采用數(shù)據(jù)庫搜索方法對(duì)選定的ORF進(jìn)行驗(yàn)證BLASTB比對(duì)搜索到多個(gè)顯著相似的序列,因此所預(yù)測(cè)的ORF可信度比較高第16頁,共67頁,2023年,2月20日,星期五點(diǎn)擊第17頁,共67頁,2023年,2月20日,星期五第18頁,共67頁,2023年,2月20日,星期五GetOrf

http://bioweb.pasteur.fr/seqanal/interfaces/getorf.htmlggccagatggaacatattgctttcgggagcacaaggatcgggtctactacgtctcggagcggattttgaagctgagcgagtgcttcggctacaagcagctggtgtgcgtgggcacctgcttcggcaagttctccaagaccaacaaactgaagttccatatcacggcgctctactacttggcgccctacgcccagtacaaggtgtgggtgaagccctccttcgagcagcagtttctctacg輸出結(jié)果第19頁,共67頁,2023年,2月20日,星期五GENSCAN

/GENSCAN.htmlggccagatggaacatattgctttcgggagcacaaggatcgggtctactacgtctcggagcggattttgaagctgagcgagtgcttcggctacaagcagctggtgtgcgtgggcacctgcttcggcaagttctccaagaccaacaaactgaagttccatatcacggcgctctactacttggcgccctacgcccagtacaaggtgtgggtgaagccctccttcgagcagcagtttctctacg輸出結(jié)果第20頁,共67頁,2023年,2月20日,星期五啟動(dòng)子及轉(zhuǎn)錄因子結(jié)合位點(diǎn)分析啟動(dòng)子(Promoter)是RNA聚合酶識(shí)別、結(jié)合并開始轉(zhuǎn)錄所必需的一段DNA序列。原核生物啟動(dòng)子序列包括:CAP序列(增強(qiáng)聚合酶的結(jié)合和轉(zhuǎn)錄的起始序列,-70~-40)-10序列:在-4到-13bp處,有保守序列TATAAT,稱為Pribnow框,各堿基頻率:T89A89T50A65A65T100-35序列:約在-35處有保守序列TTGACA,其中TTG十分保守,各堿基頻率:T85T83G81A61C69A52核苷酸序列分析ORF第21頁,共67頁,2023年,2月20日,星期五啟動(dòng)子及轉(zhuǎn)錄因子結(jié)合位點(diǎn)分析真核生物啟動(dòng)子是在基因轉(zhuǎn)錄起始位點(diǎn)(+1)及其5’上游大約100~200bp或下游100bp的一組具有獨(dú)立功能的DNA序列,包括:核心啟動(dòng)子(corepromoter):轉(zhuǎn)錄起始位點(diǎn)(+1)一般是A或G及轉(zhuǎn)錄起始位點(diǎn)上游-25~-30的TATA框上游啟動(dòng)子元件(upstreampromoterelement,UPE):包括通常-70bp附近的CAAT框(GGCCAATCT)和GC框(GGGCGG)等核苷酸序列分析ORF第22頁,共67頁,2023年,2月20日,星期五PromoterScan

:80/molbio/proscan粘貼AY684193輸出結(jié)果第23頁,共67頁,2023年,2月20日,星期五內(nèi)含子/外顯子剪切位點(diǎn)識(shí)別對(duì)基因組序列的讀碼框區(qū)域進(jìn)行預(yù)測(cè)內(nèi)含子5’端供體位點(diǎn)(donorsplicesite):GT內(nèi)含子3’端受體位點(diǎn)(acceptorsplicesite):AG內(nèi)含子區(qū)域核苷酸組分是識(shí)別編碼區(qū)的重要依據(jù)核苷酸序列分析GeneStructure不同的序列通常采用不同的分析方法NetGene2和SpliceView用于分析基因組核苷酸序列編碼區(qū)的剪切位點(diǎn)和內(nèi)含子mRNA/cDNA序列可用Spidey,SIM4,BLAT和BLAST等分析工具第24頁,共67頁,2023年,2月20日,星期五內(nèi)含子/外顯子剪切位點(diǎn)識(shí)別如何分析mRNA/cDNA的外顯子組成?RNASPL與相應(yīng)的基因組序列比對(duì),分析比對(duì)片段的分布位置預(yù)測(cè)工具:Spidey,SIM4,BLAT,BLAST,F(xiàn)ASTA核苷酸序列分析GeneStructure第25頁,共67頁,2023年,2月20日,星期五基因開放閱讀框/基因結(jié)構(gòu)分析工具對(duì)基因組序列的讀碼框區(qū)域進(jìn)行預(yù)測(cè)NNSplice/seq_tools/splice.htmlWebSpliceViewr.it/~webgene/wwwspliceview.htmlWebNetGene2http://www.cbs.dtu.dk/services/NetGene2/WebSPL/SPLM/RNASPL/FSPLICE/all.htmWebGeneSplicer/tdb/GeneSplicer/gene_spl.htmlWeb/LinuxMZEFSpliceProximalCheckhttp://www.ebi.ac.uk/~thanaraj/MZEF-SPC.htmlhttp://corba.ebi.ac.uk/cgi-bin/sp/wrapper.cgiWebSplicePredictor/cgi-bin/sp.cgiWeb分析mRNA/cDNA的外顯子組成GeneSeqer/cgi-bin/gs.cgiWeb/LinuxSpidey/spideyWebPROT_MAP/berry.phtml?topic=prot_map&group=programs&subgroup=xmapWebSim4http://gamay.univ-perp.fr/analyse_seq/sim4/Web/LinuxBLAT/~kent/src/unzipped/blat/LinuxBLAST/BLAST/ExecutablesWeb/Windows/LinuxFASTA/pub/fasta/win32_fasta/fasta34t21b5d.zipWeb/Windows/Linux核苷酸序列分析GeneStructure第26頁,共67頁,2023年,2月20日,星期五NetGene2

http://www.cbs.dtu.dk/services/NetGene2/用于人類、線蟲和擬南芥的基因序列分析報(bào)告受體位點(diǎn)和供體位點(diǎn)信息,對(duì)DNA正負(fù)兩條鏈分析圖形顯示可能的編碼區(qū)、受體位點(diǎn)和供體位點(diǎn)信息第27頁,共67頁,2023年,2月20日,星期五ATGGGAAACTGGGTGGTTAACCACTGGTTTTCAGTTTTGTTTCTGGTTGTTTGGTTAGGGCTGAATGTTTTCCTGTTTGTGGATGCCTTCCTGAAATATGAGAAGGCCGACAAATACTACTACACAAGAAAAATCCTTGGGTCAACATTGGCCTGTGCCCGAGCGTCTGCTCTCTGCTTGAATTTTAACAGCACGCTGATCCTGCTTCCTGTGTGTCGCAATCTGCTGTCCTTCCTGAGGGGCACCTGCTCATTTTGCAGCCGCACACTGAGAAAGCAATTGGATCACAACCTCACCTTCCACAAGCTGGTGGCCTATATGATCTGCCTACATACAGCTATTCACATCATTGCACACCTGTTTAACTTTGACTGCTATAGCAGAAGCCGACAGGCCACAGATGGCTCCCTTGCCTCCATTCTCTCCAGCCTATCTCATGATGAGAAAAAGGGGGGTTCTTGGCTAAATCCCATCCAGTCCCGAAACACGACAGTGGAGTATGTGACATTCACCAGCATTGCTGGTCTCACTGGAGTGATCATGACAATAGCCTTGATTCTCATGGTAACTTCAGCTACTGAGTTCATCCGGAGGAGTTATTTTGAAGTCTTCTGGTATACTCACCACCTTTTTATCTTCTATATCCTTGGCTTAGGGATTCACGGCATTGGTGGAATTGTCCGGGGTCAAACAGAGGAGAGCATGAATGAGAGTCATCCTCGCAAGTGTGCAGAGTCTTTTGAGATGTGGGATGATCGTGACTCCCACTGTAGGCGCCCTAAGTTTGAAGGGCATCCCCCTGAGTCTTGGAAGTGGATCCTTGCACCGGTCATTCTTTATATCTGTGAAAGGATCCTCCGGTTTTACCGCTCCCAGCAGAAGGTTGTGATTACCAAGGTTGTTATGCACCCATCCAAAGTTTTGGAAT第28頁,共67頁,2023年,2月20日,星期五第29頁,共67頁,2023年,2月20日,星期五第30頁,共67頁,2023年,2月20日,星期五Spidey

/IEB/Research/Ostell/Spidey/可對(duì)cDNA或EST序列分析NCBI開發(fā),基于BLAST和DotView局部比對(duì)算法優(yōu)勢(shì)在于能同時(shí)將多條mRNA/cDNA或EST序列與基因組序列進(jìn)行比對(duì)第31頁,共67頁,2023年,2月20日,星期五輸入基因組序列Z83819輸入序列:AF166326AF166327第32頁,共67頁,2023年,2月20日,星期五第33頁,共67頁,2023年,2月20日,星期五選擇性剪切(Alternativesplicing)分析核苷酸序列分析GeneStructure第34頁,共67頁,2023年,2月20日,星期五選擇性剪切(Alternativesplicing)分析選擇性剪接是調(diào)控基因表達(dá)的重要機(jī)制了解不同物種、細(xì)胞、發(fā)育階段、環(huán)境壓力下基因的調(diào)控表達(dá)機(jī)制分析方法:查詢選擇性剪切相關(guān)的網(wǎng)站多序列比對(duì)第35頁,共67頁,2023年,2月20日,星期五查詢選擇性剪切相關(guān)的網(wǎng)站http://www.ebi.ac.uk/asd/index.html綜合http://splicenest.molgen.mpg.de/綜合/new_alt_exon_db2/綜合5/AsMamDB/哺乳動(dòng)物/tigr-scripts/tgi/splnotes.pl?species=human.tw/.au/altExtron人/~kent/intronerator/altsplice.html線蟲/index.jsp植物/tdb/e2k1/ath1/altsplicing/splicing_variations.shtml擬南芥核苷酸序列分析GeneStructure

從已知基因的功能推測(cè)剪切機(jī)制第36頁,共67頁,2023年,2月20日,星期五分析EST序列的選擇性剪切>Seq1ATGGGAAACTGGGTGGTTAACCACTGGTTTTCAGTTTTGTTTCTGGTTGTTTGGTTAGGGCTGAATGTTTTCCTGTTTGTGGATGCCTTCCTGAAATATGAGAAGGCCGACAAATACTACTACACAAGAAAAATCCTTGGGTCAACATTGGCCTGTGCCCGAGCGTCTGCTCTCTGCTTGAATTTTAACAGCACGCTGATCCTGCTTCCTGTGTGTCGCAATCTGCTGTCCTTCCTGAGGGGCACCTGCTCATTTTGCAGCCGCACACTGAGAAAGCAATTGGATCACAACCTCACCTTCCACAAGCTGGTGGCCTATATGATCTGCCTACATACAGCTATTCACATCATTGCACACCTGTTTAACTTTGACTGCTATAGCAGAAGCCGACAGGCCACAGATGGCTCCCTTGCCTCCATTCTCTCCAGCCTATCTCATGATGAGAAAAAGGGGGGTTCTTGGCTAAATCCCATCCAGTCCCGAAACACGACAGTGGAGTATGTGACATTCACCAGCATTGCTGGTCTCACTGGAGTGATCATGACAATAGCCTTGATTCTCATGGTAACTTCAGCTACTGAGTTCATCCGGAGGAGTTATTTTGAAGTCTTCTGGTATACTCACCACCTTTTTATCTTCTATATCCTTGGCTTAGGGATTCACGGCATTGGTGGAATTGTCCGGGGTCAAACAGAGGAGAGCATGAATGAGAGTCATCCTCGCAAGTGTGCAGAGTCTTTTGAGATGTGGGATGATCGTGACTCCCACTGTAGGCGCCCTAAGTTTGAAGGGCATCCCCCTGAGTCTTGGAAGTGGATCCTTGCACCGGTCATTCTTTATATCTGTGAAAGGATCCTCCGGTTTTACCGCTCCCAGCAGAAGGTTGTGATTACCAAGGTTGTTATGCACCCATCCAAAGTTTTGGAAT第37頁,共67頁,2023年,2月20日,星期五分析EST序列的選擇性剪切BLAST搜索Seq1,發(fā)現(xiàn)它與多條NOX1基因高度相似,因此它可能是NOX1基因的選擇性剪切產(chǎn)物第38頁,共67頁,2023年,2月20日,星期五分析EST序列的選擇性剪切在ProSplicer網(wǎng)站搜索NOX1基因,結(jié)果表明NOX1基因有不同的選擇性產(chǎn)物輸入NOX1第39頁,共67頁,2023年,2月20日,星期五Output第40頁,共67頁,2023年,2月20日,星期五分析EST序列的選擇性剪切收集不同剪切體的mRNA/cDNA/EST序列,如AF166316,AF166327,AF166328,NM_013955,與Seq1比對(duì),可判斷Seq1的剪切機(jī)制。Seq1與AF166327最為相似,與AF166327在基因的5’相匹配,而缺失了第10~13號(hào)外顯子區(qū)域。Seq1與AF166317比對(duì)結(jié)果第41頁,共67頁,2023年,2月20日,星期五基于序列比對(duì)分析選擇性剪切在序列上高度相似的mRNA/cDNA/EST序列相匹配的基因組序列序列比對(duì)對(duì)分布位置進(jìn)行分析cDNA/mRNA/EST序列比對(duì)收集序列核苷酸序列分析GeneStructure

評(píng)判的標(biāo)準(zhǔn):來自Unigene的高質(zhì)量數(shù)據(jù)Exon至少有3條ESTs覆蓋Exon周圍有GT-AG信號(hào)Blast比對(duì)Score值>100相似度>95%S.Guptaetal.,GenomewideidentificationandclassificationofalternativesplicingbasedonESTdata,Bioinformatics2004,20(16):2579-2585第42頁,共67頁,2023年,2月20日,星期五基因周圍調(diào)控序列分析

—CpG島位于真核生物基因轉(zhuǎn)錄起始位點(diǎn)上游,GC含>50%,長度幾百到幾千“p”表示“C”和“G”以磷酸二酯鍵連接一般CpG島出現(xiàn)在脊椎動(dòng)物看家基因(housekeepinggene)或頻繁表達(dá)基因中活性基因的CpG島具有抵抗序列甲基化的作用80%的人類基因的轉(zhuǎn)錄起始位點(diǎn)存在CpG島,因而搜索CpG島可為發(fā)現(xiàn)基因提供重要線索核苷酸序列分析GeneStructure

第43頁,共67頁,2023年,2月20日,星期五http://www.ebi.ac.uk/emboss/cpgplot/CpgplotCpgreportIsochoreAF129756.1第44頁,共67頁,2023年,2月20日,星期五ResultsForCpgplotCpgreportIsochoreExample第45頁,共67頁,2023年,2月20日,星期五基因周圍調(diào)控序列分析

—轉(zhuǎn)錄終止信號(hào)的預(yù)測(cè)真核生物編碼基因中,轉(zhuǎn)錄終止信號(hào)是在mRNA序列的3’端終止密碼子下游置上加尾的信號(hào),主要標(biāo)志為出現(xiàn)AATAAA序列,可以重復(fù)出現(xiàn),在其后的10-15bp處開始合成PolyA.在基因預(yù)測(cè)軟件中,轉(zhuǎn)錄終止信號(hào)也被化定基因的范圍,以便對(duì)ORF區(qū)域進(jìn)行更好的識(shí)別和分析核苷酸序列分析GeneStructure

轉(zhuǎn)錄終止信號(hào)預(yù)測(cè)Hcpolyar.it/~webgene/wwwHC_polya.htmlWebPOLYAH/berry.phtml?topic=polyah&group=programs&subgroup=promoterWebpolyadq

/tools/polyadq/polyadq_form.htmlWeb第46頁,共67頁,2023年,2月20日,星期五Polyadq

/tools/polyadq/polyadq_form.html粘貼AF129756.1.txt中的序列第47頁,共67頁,2023年,2月20日,星期五第48頁,共67頁,2023年,2月20日,星期五密碼子使用偏性分析—遺傳密碼子表UCAGU苯丙氨酸Phe絲氨酸Ser酪氨酸Tyr半胱氨酸CysU苯丙氨酸絲氨酸酪氨酸半胱氨酸C亮氨酸Leu絲氨酸終止子Ter終止子TerA亮氨酸絲氨酸終止子色氨酸TrpGC亮氨酸脯氨酸Pro組氨酸His精氨酸ArgU亮氨酸脯氨酸組氨酸精氨酸C亮氨酸脯氨酸谷氨酰胺Gln精氨酸A亮氨酸脯氨酸谷氨酰胺精氨酸GA異亮氨酸ILe蘇氨酸Thr天冬酰胺Asn絲氨酸SerU異亮氨酸蘇氨酸天冬酰胺絲氨酸C異亮氨酸蘇氨酸賴氨酸Lys精氨酸ArgA甲硫氨酸Met蘇氨酸賴氨酸精氨酸GG纈氨酸Val丙氨酸Ala天冬氨酸Asp甘氨酸GlyU纈氨酸丙氨酸天冬氨酸甘氨酸C纈氨酸丙氨酸谷氨酸Glu甘氨酸A纈氨酸丙氨酸谷氨酸甘氨酸GSecondPositionFirstPosition(5’end)ThirdPosition(3’end)第49頁,共67頁,2023年,2月20日,星期五密碼子使用偏性分析生物體內(nèi)普遍存在同義密碼子非均衡使用的現(xiàn)象,例如:某一物種或某一基因通常傾向于使用一種或幾種特定的同義密碼子,這些密碼子被稱為最優(yōu)密碼子(optimalcodon),此現(xiàn)象被稱為密碼子偏性(codonbias)。.不同物種的基因、不同功能的基因在密碼子使用上存在著明顯的偏性核苷酸序列分析GeneStructure

第50頁,共67頁,2023年,2月20日,星期五密碼子使用偏性分析—意義基因異源表達(dá)與某些物種的蛋白表達(dá)水平相關(guān)揭示有關(guān)物種間或某一物種的基因家族間的基因進(jìn)化規(guī)律基因的翻譯調(diào)控其他應(yīng)用密碼子偏性的分析也常對(duì)許多實(shí)驗(yàn)操作起指導(dǎo)和輔助作用,如:鑒定編碼區(qū),制備基因克隆的寡核苷酸探針,基因芯片設(shè)計(jì)等核苷酸序列分析GeneStructure

第51頁,共67頁,2023年,2月20日,星期五密碼子使用偏性分析

—密碼子使用指標(biāo)(Codonusageindices)

(1)密碼子適應(yīng)性指標(biāo)CAI(codonadaptionindex)

(2)最優(yōu)密碼子使用頻率FOP(frequencyofoptimalcodons)

(3)密碼子偏性指標(biāo)CBI(codonbiasindex)

(4)有效密碼子數(shù)ENC(effectivenumberofcodons)

(5)GC含量(GCcontentofgene)

(6)密碼子第三位GC含量(GCofsilent3rdcodonposition)核苷酸序列分析GeneStructure

第52頁,共67頁,2023年,2月20日,星期五密碼子使用偏性分析

—密碼子使用指標(biāo)(Codonusageindices)(7)密碼子第三位A、T、C、G含量(silentbasecomposition)

(8)同義密碼子數(shù)目(Numberofsynonymouscodons)

(9)序列氨基酸總數(shù)(Totalnumberofaminoacids)

(10)蛋白質(zhì)疏水性(Hydrophobicityofprotein)

(11)蛋白質(zhì)芳香性(Aromaticityofprotein)核苷酸序列分析GeneStructure

第53頁,共67頁,2023年,2月20日,星期五密碼子適應(yīng)性指標(biāo)CAI

(codonadaptionindex)CAIisameasurementoftherelativeadaptednessofthecodonusageofagenetowardsthecodonusageofhighlyexpressedgenes.Therelativeadaptedness(ω)ofeachcodonistheratiooftheusageofeachcodon,tothatofthemostabundantcodonwithinthesamesynonymousfamily.Listhenumberofsynonymouscodonsinthegene.常用于基因表達(dá)水平的測(cè)量,此值為0~1,越接近1表示基因的表達(dá)水平越高。第54頁,共67頁,2023年,2月20日,星期五最優(yōu)密碼子使用頻率FOP(frequencyofoptimalcodons)Fopisthefractionofsynonymouscodonswhichareoptimalcodons.Ifraresynonymouscodonshavebeenidentified,thereisachoiceofcalculatingtheoriginalFopindexoramodifiedFopindex第55頁,共67頁,2023年,2月20日,星期五密碼子偏性指標(biāo)CBI

(codonbiasindex)CBIisameasureofdirectionalcodonbias,andisameasureoftheextenttowhichageneusesasubsetofoptimalcodonsWhereNopt=numberofoptimalcodons;Ntot=numberofsynonymouscodons;Nran=expectednumberofoptimalcodonsifcodonswereassignedrandomly.第56頁,共67頁,2023年,2月20日,星期五有效密碼子數(shù)ENC

(effectivenumberofcodons)取值范圍在20~61之間,即如果每種氨基酸只使用一種密碼子則有效密碼子數(shù)為20,如果各種同義密碼子的使用機(jī)會(huì)完全均等,則有效密碼子數(shù)為61,越靠近20偏性越強(qiáng)。ENC值越小,基因的密碼子偏愛程度越大。

第57頁,共67頁,2023年,2月20日,星期五

單子葉植物玉米、高粱、大麥、小麥、水稻的ENC值均小于40,而雙子葉植物擬南芥、豌豆的ENC分別為52.33和51.39,表明5種單子葉植物的waxy基因具有較強(qiáng)的密碼子偏好,而雙子葉植物的偏好性則相對(duì)較低。

7個(gè)物種waxy基因密碼子的ENC值和GC3含量第58頁,共67頁,2023年,2月20日,星期五相對(duì)同義密碼子使用頻率RSCU(relativesynonymouscodonusage)xij表示編碼第i個(gè)氨基酸的第j個(gè)密碼子的出現(xiàn)次數(shù),ni表示編碼第i個(gè)氨基酸的同義密碼子的數(shù)量。

第59頁,共67頁,2023年,2月20日,星期五第60頁,共67頁,2023年,2月20日,星期五密碼子使用偏性分析工具CodonWhttp://www.molbiol.ox.ac.uk/cuWindows/Web/LinuxSYCOhttp://bioweb.pasteur.fr/seqanal/interfaces/syco/htmlWeb/LinuxCHIPhttp://bioweb.pasteur.fr/seqanal/interfaces/chips.htmlWeb/LinuxCodonusage/sms/index.htmlWeb第61頁,共67頁,2023年,2月20日,星期五密碼子使

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論