生物信息實(shí)驗(yàn)_第1頁
生物信息實(shí)驗(yàn)_第2頁
生物信息實(shí)驗(yàn)_第3頁
生物信息實(shí)驗(yàn)_第4頁
生物信息實(shí)驗(yàn)_第5頁
已閱讀5頁,還剩51頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

生物信息實(shí)驗(yàn)生物信息實(shí)驗(yàn)生物信息實(shí)驗(yàn)V:1.0精細(xì)整理,僅供參考生物信息實(shí)驗(yàn)日期:20xx年X月生物信息學(xué)實(shí)驗(yàn)講義

目錄實(shí)驗(yàn)1.計(jì)算機(jī)網(wǎng)上操作基本技能訓(xùn)練……………1實(shí)驗(yàn)2.常用分子生物學(xué)數(shù)據(jù)庫類型、文件格式及數(shù)據(jù)庫查詢…2實(shí)驗(yàn)3.核酸序列分析………………3實(shí)驗(yàn)4.多重序列比對(duì)及系統(tǒng)發(fā)生樹的構(gòu)建………5實(shí)驗(yàn)5.PCR引物設(shè)計(jì)及評(píng)價(jià)………7實(shí)驗(yàn)6.蛋白質(zhì)序列分析和結(jié)構(gòu)預(yù)測………………9

實(shí)驗(yàn)一計(jì)算機(jī)網(wǎng)上操作基本技能訓(xùn)練【實(shí)驗(yàn)?zāi)康摹?、熟練掌握上網(wǎng)操作基本方法及技能。2、掌握利用網(wǎng)絡(luò)進(jìn)行資料搜集的多種方法【實(shí)驗(yàn)內(nèi)容】1、熟悉InternetExporer的基本使用方法及相關(guān)技巧,熟悉InternetExporer網(wǎng)絡(luò)配置。2、掌握免費(fèi)電子郵箱的申請(qǐng)方法并且能收發(fā)電子郵件。3、掌握網(wǎng)上軟件下載及安裝方法。4、用IE或netscape等瀏覽工具瀏覽、搜索各類信息5、運(yùn)用FlashGet或網(wǎng)絡(luò)螞蟻等下載工具進(jìn)行網(wǎng)絡(luò)資料的下載以及運(yùn)用各種上傳工具上傳資料到網(wǎng)絡(luò)6、利用Winzip或Winrar等壓縮工具進(jìn)行文件的壓縮與解壓7、學(xué)習(xí)使用ftp8、在網(wǎng)上自主學(xué)習(xí)了解生物信息學(xué)知識(shí)【作業(yè)】1、在D盤建立一個(gè)以自己名字命名的文件夾。2、申請(qǐng)一個(gè)自已的免費(fèi)電子郵箱,并發(fā)一封電子郵件到liushunhui@。3、從網(wǎng)絡(luò)上下載任意一個(gè)軟件,并安裝到計(jì)算機(jī)上。4、用FTP獲取一個(gè)蛋白質(zhì)結(jié)構(gòu)分析軟件比如rasmol,下載后保存到你的文件夾中,以便以后運(yùn)用其進(jìn)行蛋白質(zhì)結(jié)構(gòu)分析。5、下載一個(gè)有關(guān)生物信息學(xué)的教程,并保存到你的文件夾中,進(jìn)行參考學(xué)習(xí)。附表:相關(guān)軟件及搜索工具網(wǎng)址搜索工具或軟件名稱參考網(wǎng)站地址Winrar/index.htmwinzip/index.htm網(wǎng)絡(luò)螞蟻Netants/index.htmFlashGet/index.htmrasmolftp://ftp.dcs.ed.ac.ukGoogle搜索引擎Yahoo搜索引擎新浪搜索引擎搜狐搜索引擎

實(shí)驗(yàn)二常用數(shù)據(jù)庫類型、文件格式及數(shù)據(jù)庫查詢【實(shí)驗(yàn)?zāi)康摹?、掌握序列檢索的操作方法;2、熟悉GenBank數(shù)據(jù)庫序列格式及其主要字段的含義;3、了解EBML數(shù)據(jù)庫序列格式及其主要字段的含義;4、熟悉GenBank數(shù)據(jù)庫序列格式的FASTA序列格式顯示與保存;5、熟悉分子生物學(xué)軟件的搜索與下載?!緦?shí)驗(yàn)內(nèi)容】1、使用Entrez信息查詢系統(tǒng)檢索核酸序列BC060830和NM_000230,連接提取該序列內(nèi)容,閱讀序列格式的解釋,理解其含義;2、GenBank數(shù)據(jù)庫序列格式的FASTA序列格式顯示與保存;3、使用SRS信息查詢系統(tǒng)檢索核酸序列BC060830,連接提取該序列內(nèi)容,閱讀序列格式的解釋,理解其含義;4、使用搜索引擎搜索并下載DNAClub和BioEdit軟件?!咀鳂I(yè)】寫出核酸序列BC060830在GenBank數(shù)據(jù)庫的主要字段的含義;寫出核酸序列NM_000230在EBML數(shù)據(jù)庫的主要字段的含義

實(shí)驗(yàn)三核酸序列分析【實(shí)驗(yàn)?zāi)康摹空莆找阎蛭粗蛄薪邮芴?hào)的核酸序列檢索的基本步驟;掌握使用BioEdit軟件進(jìn)行核酸序列的基本分析;熟悉基于核酸序列比對(duì)分析的真核基因結(jié)構(gòu)分析(內(nèi)含子/外顯子分析);了解基因的電子表達(dá)譜分析?!緦?shí)驗(yàn)原理】針對(duì)核酸序列的分析就是在核酸序列中尋找基因,找出基因的位置和功能位點(diǎn)的位置,以及標(biāo)記已知的序列模式等過程。在此過程中,確認(rèn)一段DNA序列是一個(gè)基因需要有多個(gè)證據(jù)的支持。一般而言,在重復(fù)片段頻繁出現(xiàn)的區(qū)域里,基因編碼區(qū)和調(diào)控區(qū)不太可能出現(xiàn);如果某段DNA片段的假想產(chǎn)物與某個(gè)已知的蛋白質(zhì)或其它基因的產(chǎn)物具有較高序列相似性的話,那么這個(gè)DNA片段就非常可能屬于外顯子片段;在一段DNA序列上出現(xiàn)統(tǒng)計(jì)上的規(guī)律性,即所謂的“密碼子偏好性”,也是說明這段DNA是蛋白質(zhì)編碼區(qū)的有力證據(jù);其它的證據(jù)包括與“模板”序列的模式相匹配、簡單序列模式如TATABox等相匹配等。一般而言,確定基因的位置和結(jié)構(gòu)需要多個(gè)方法綜合運(yùn)用,而且需要遵循一定的規(guī)則:對(duì)于真核生物序列,在進(jìn)行預(yù)測之前先要進(jìn)行重復(fù)序列分析,把重復(fù)序列標(biāo)記出來并除去;選用預(yù)測程序時(shí)要注意程序的物種特異性;要弄清程序適用的是基因組序列還是cDNA序列;很多程序?qū)π蛄虚L度也有要求,有的程序只適用于長序列,而對(duì)EST這類殘缺的序列則不適用。1.重復(fù)序列分析對(duì)于真核生物的核酸序列而言,在進(jìn)行基因辨識(shí)之前都應(yīng)該把簡單的大量的重復(fù)序列標(biāo)記出來并除去,因?yàn)楹芏嗲闆r下重復(fù)序列會(huì)對(duì)預(yù)測程序產(chǎn)生很大的擾亂,尤其是涉及數(shù)據(jù)庫搜索的程序。2.數(shù)據(jù)庫搜索把未知核酸序列作為查詢序列,在數(shù)據(jù)庫里搜索與之相似的已有序列是序列分析預(yù)測的有效手段。在理論課中已經(jīng)專門介紹了序列比對(duì)和搜索的原理和技術(shù)。但值得注意的是,由相似性分析作出的結(jié)論可能導(dǎo)致錯(cuò)誤的流傳;有一定比例的序列很難在數(shù)據(jù)庫里找到合適的同源伙伴。對(duì)于EST序列而言,序列搜索將是非常有效的預(yù)測手段。3.編碼區(qū)統(tǒng)計(jì)特性分析統(tǒng)計(jì)獲得的經(jīng)驗(yàn)說明,DNA中密碼子的使用頻率不是平均分布的,某些密碼子會(huì)以較高的頻率使用而另一些則較少出現(xiàn)。這樣就使得編碼區(qū)的序列呈現(xiàn)出可察覺的統(tǒng)計(jì)特異性,即所謂的“密碼子偏好性”。利用這一特性對(duì)未知序列進(jìn)行統(tǒng)計(jì)學(xué)分析可以發(fā)現(xiàn)編碼區(qū)的粗略位置。這一類技術(shù)包括:雙密碼子計(jì)數(shù)(統(tǒng)計(jì)連續(xù)兩個(gè)密碼子的出現(xiàn)頻率);核苷酸周期性分析(分析同一個(gè)核苷酸在3,6,9,...位置上周期性出現(xiàn)的規(guī)律);均一/復(fù)雜性分析(長同聚物的統(tǒng)計(jì)計(jì)數(shù));開放可讀框架分析等。4.啟動(dòng)子分析啟動(dòng)子是基因表達(dá)所必需的重要序列信號(hào),識(shí)別出啟動(dòng)子對(duì)于基因辨識(shí)十分重要。有一些程序根據(jù)實(shí)驗(yàn)獲得的轉(zhuǎn)錄因子結(jié)合特性來描述啟動(dòng)子的序列特征,并依次作為啟動(dòng)子預(yù)測的依據(jù),但實(shí)際的效果并不十分理想,遺漏和假陽性都比較嚴(yán)重。總的來說,啟動(dòng)子仍是值得繼續(xù)研究探索的難題。5.內(nèi)含子/外顯子剪接位點(diǎn)剪接位點(diǎn)一般具有較明顯的序列特征,但是要注意可變剪接的問題。由于可變剪接在數(shù)據(jù)庫里的注釋非常不完整,因此很難評(píng)估剪接位點(diǎn)識(shí)別程序預(yù)測剪接位點(diǎn)的敏感性和精度。如果把剪接位點(diǎn)和兩側(cè)的編碼特性結(jié)合起來分析則有助于提供剪接位點(diǎn)的識(shí)別效果。6.翻譯起始位點(diǎn)對(duì)于真核生物,如果已知轉(zhuǎn)錄起始點(diǎn),并且沒有內(nèi)含子打斷5'非翻譯區(qū)的話,“Kozak規(guī)則”可以在大多數(shù)情況下定位起始密碼子。原核生物一般沒有剪接過程,但在開放閱讀框中找正確的起始密碼子仍很困難。這時(shí)由于多順反操縱子的存在,啟動(dòng)子定位不象在真核生物中起關(guān)鍵作用。對(duì)于原核生物,關(guān)鍵是核糖體結(jié)合點(diǎn)的定位,可以由多個(gè)程序提供解決方案。7.翻譯終止信號(hào)PolyA和翻譯終止信號(hào)不象起始信號(hào)那么重要,但也可以輔助劃分基因的范圍。8.其它綜合基因預(yù)測工具除了上面提到的程序之外,還有許多用于基因預(yù)測的工具,它們大多把各個(gè)方面的分析綜合起來,對(duì)基因進(jìn)行整體的分析和預(yù)測。多種信息的綜合分析有助于提高預(yù)測的可靠性,但也有一些局限:物種適用范圍的局限;對(duì)多基因或部分基因,有的預(yù)測出的基因結(jié)構(gòu)不可靠;預(yù)測的精度對(duì)許多新發(fā)現(xiàn)基因比較低;對(duì)序列中的錯(cuò)誤很敏感;對(duì)可變剪接、重疊基因和啟動(dòng)子等復(fù)雜基因語法效果不佳。9.tRNA基因識(shí)別tRNA基因識(shí)別比編碼蛋白質(zhì)的基因識(shí)別簡單,目前基本已經(jīng)解決了用理論方法預(yù)測tRNA基因的問題。tRNAscan-SE工具中綜合了多個(gè)識(shí)別和分析程序,通過分析啟動(dòng)子元件的保守序列模式、tRNA二級(jí)結(jié)構(gòu)的分析、轉(zhuǎn)錄控制元件分析和除去絕大多數(shù)假陽性的篩選過程,據(jù)稱能識(shí)別99%的真tRNA基因。【實(shí)驗(yàn)內(nèi)容】1、使用Entrez或SRS信息查詢系統(tǒng)檢索人瘦素(leptin)的mRNA、基因組DNA、外顯子和5’調(diào)控區(qū)(promoter)等核酸序列,連接提取該序列內(nèi)容,閱讀序列格式的解釋,理解其含義;2、使用BioEdit軟件對(duì)上述核酸序列進(jìn)行分子質(zhì)量、堿基組成、堿基分布、序列變換以及限制性酶切分析等基本分析,并從BioEdit軟件的“help”欄了解該軟件的其它功能;3、使用BioEdit軟件對(duì)人瘦素(leptin)的mRNA序列進(jìn)行可讀框架分析;4、使用NCBI查詢系統(tǒng)進(jìn)行人瘦素(leptin)的基因組序列分析和基因的電子表達(dá)譜分析;5、使用Blast2進(jìn)行人瘦素(leptin)mRNA序列與其外顯子或基因組序列的比對(duì)分析。【實(shí)驗(yàn)方法】1、調(diào)用Internet瀏覽器,并在其地址欄輸入Entrez網(wǎng)址:/Entrez;2、在Search后的選擇欄中選擇nucleotide;3、在輸入欄輸入homosapiensleptin;4、點(diǎn)擊go后顯示序列接受號(hào)及序列名稱等;5、查找人leptin(obesityhomolog,mouse)mRNA序列(提示:NM_000230),點(diǎn)擊序列接受號(hào)后顯示序列詳細(xì)信息;6、將序列轉(zhuǎn)為FASTA格式保存7、根據(jù)從NM_000230了解的基因定位信息查找人瘦素的基因組DNA(Contig)的序列接受號(hào)及序列識(shí)別號(hào),點(diǎn)擊序列接受號(hào)顯示序列詳細(xì)信息;8、在輸入欄輸入homosapiensleptinexon查找人瘦素外顯子序列;9、在輸入欄輸入homosapiensleptinpromoter查找人瘦素5’調(diào)控區(qū)序列;10、按上述步驟用SRS信息查詢系統(tǒng)檢索人瘦素(leptin)的mRNA、基因組DNA、外顯子和5’調(diào)控區(qū)(promoter)等核酸序列;11、將上述核酸序列輸入BioEdit和DNAClub軟件進(jìn)行序列基本分析;12、打開BioEdit軟件,點(diǎn)擊“help”欄,閱讀“contents”;13、將人瘦素(leptin)的mRNA序列輸入BioEdit軟件進(jìn)行可讀框架分析:打開BioEdit軟件→將人瘦素(leptin)mRNA的FASTA格式序列輸入分析框→點(diǎn)擊左側(cè)序列說明框中的序列說明→點(diǎn)擊sequence欄→選擇nucleicacid→點(diǎn)擊findnextORF→查看起始密碼位置和編碼區(qū)范圍(57→557);14、參照教材使用NCBI查詢系統(tǒng)進(jìn)行人瘦素(leptin)的基因組序列分析和基因的電子表達(dá)譜分析;15、人瘦素(leptin)mRNA序列與其外顯子或基因組序列的比對(duì)分析:調(diào)用Internet瀏覽器并在其地址欄輸入Blast2網(wǎng)址(/Entrezgorf/bl2/html)→將人瘦素(leptin)mRNA和外顯子的FASTA格式序列分別輸入sequence2和sequence1分析框或?qū)⑷耸菟?leptin)mRNA和基因組序列的GI版本號(hào)輸入sequence2和sequence1的GI版本號(hào)框→點(diǎn)擊Align后顯示兩序列比對(duì)的詳細(xì)信息→查找mRNA序列上各外顯子的位置。【作業(yè)】1、歸納對(duì)人瘦素(leptin)的核酸序列分析的結(jié)果,列出主要的分析結(jié)果;2、總結(jié)核酸序列分析的基本步驟,相互對(duì)比結(jié)果,指出應(yīng)注意的事項(xiàng)。實(shí)驗(yàn)四多重序列比對(duì)及系統(tǒng)發(fā)生樹的構(gòu)建【實(shí)驗(yàn)?zāi)康摹?、熟悉構(gòu)建分子系統(tǒng)發(fā)生樹的基本過程,獲得使用不同建樹方法、建樹材料和建樹參數(shù)對(duì)建樹結(jié)果影響的正確認(rèn)識(shí);2、掌握使用Clustalx進(jìn)行序列多重比對(duì)的操作方法;3、掌握使用Phylip軟件構(gòu)建系統(tǒng)發(fā)生樹的操作方法?!緦?shí)驗(yàn)原理】在現(xiàn)代分子進(jìn)化研究中,根據(jù)現(xiàn)有生物基因或物種多樣性來重建生物的進(jìn)化史是一個(gè)非常重要的問題。一個(gè)可靠的系統(tǒng)發(fā)生的推斷,將揭示出有關(guān)生物進(jìn)化過程的順序,有助于我們了解生物進(jìn)化的歷史和進(jìn)化機(jī)制。對(duì)于一個(gè)完整的進(jìn)化樹分析需要以下幾個(gè)步驟:=1\*GB2⑴要對(duì)所分析的多序列目標(biāo)進(jìn)行比對(duì)(alignment)。=2\*GB2⑵要構(gòu)建一個(gè)進(jìn)化樹(phyligenetictree)。構(gòu)建進(jìn)化樹的算法主要分為兩類:獨(dú)立元素法(discretecharactermethods)和距離依靠法(distancemethods)。所謂獨(dú)立元素法是指進(jìn)化樹的拓?fù)湫螤钍怯尚蛄猩系拿總€(gè)堿基/氨基酸的狀態(tài)決定的(例如:一個(gè)序列上可能包含很多的酶切位點(diǎn),而每個(gè)酶切位點(diǎn)的存在與否是由幾個(gè)堿基的狀態(tài)決定的,也就是說一個(gè)序列堿基的狀態(tài)決定著它的酶切位點(diǎn)狀態(tài),當(dāng)多個(gè)序列進(jìn)行進(jìn)化樹分析時(shí),進(jìn)化樹的拓?fù)湫螤钜簿陀蛇@些堿基的狀態(tài)決定了)。而距離依靠法是指進(jìn)化樹的拓?fù)湫螤钣蓛蓛尚蛄械倪M(jìn)化距離決定的。進(jìn)化樹枝條的長度代表著進(jìn)化距離。獨(dú)立元素法包括最大簡約性法(MaximumParsimonymethods)和最大可能性法(MaximumLikelihoodmethods);距離依靠法包括除權(quán)配對(duì)法(UPGMAM)和鄰位相連法(Neighbor-joining)。=3\*GB2⑶對(duì)進(jìn)化樹進(jìn)行評(píng)估,主要采用Bootstraping法。進(jìn)化樹的構(gòu)建是一個(gè)統(tǒng)計(jì)學(xué)問題,我們所構(gòu)建出來的進(jìn)化樹只是對(duì)真實(shí)的進(jìn)化關(guān)系的評(píng)估或者模擬。如果我們采用了一個(gè)適當(dāng)?shù)姆椒?,那么所?gòu)建的進(jìn)化樹就會(huì)接近真實(shí)的“進(jìn)化樹”。模擬的進(jìn)化樹需要一種數(shù)學(xué)方法來對(duì)其進(jìn)行評(píng)估。不同的算法有不同的適用目標(biāo)。一般來說,最大簡約性法適用于符合以下條件的多序列:=1\*romani所要比較的序列的堿基差別小,=2\*romanii對(duì)于序列上的每一個(gè)堿基有近似相等的變異率,=3\*romaniii沒有過多的顛換/轉(zhuǎn)換的傾向,=4\*romaniv所檢驗(yàn)的序列的堿基數(shù)目較多(大于幾千個(gè)堿基);用最大可能性法分析序列則不需以上的諸多條件,但是此種方法計(jì)算極其耗時(shí)。如果分析的序列較多,有可能要花上幾天的時(shí)間才能計(jì)算完畢。UPGMAM(Unweightedpairgroupmethodwitharithmeticmean)假設(shè)在進(jìn)化過程中所有核苷酸/氨基酸都有相同的變異率,也就是存在著一個(gè)分子鐘。這種算法得到的進(jìn)化樹相對(duì)來說不是很準(zhǔn)確,現(xiàn)在已經(jīng)很少使用。鄰位相連法是一個(gè)經(jīng)常被使用的算法,它構(gòu)建的進(jìn)化樹相對(duì)準(zhǔn)確,而且計(jì)算快捷。其缺點(diǎn)是序列上的所有位點(diǎn)都被同等對(duì)待,而且,所分析的序列的進(jìn)化距離不能太大。另外,需要特別指出的是對(duì)于一些特定多序列對(duì)象來說可能沒有任何一個(gè)現(xiàn)存算法非常適合它。CLUSTALX和PHYLIP軟件能夠?qū)崿F(xiàn)上述的建樹步驟。CLUSTALX是Windows界面下的多重序列比對(duì)軟件。PHYLIP是多個(gè)軟件的壓縮包,功能極其強(qiáng)大,主要包括五個(gè)方面的功能軟件:=1\*romani,DNA和蛋白質(zhì)序列數(shù)據(jù)的分析軟件。=2\*romanii,序列數(shù)據(jù)轉(zhuǎn)變成距離數(shù)據(jù)后,對(duì)距離數(shù)據(jù)分析的軟件。=3\*romaniii,對(duì)基因頻率和連續(xù)的元素分析的軟件。=4\*romaniv,把序列的每個(gè)堿基/氨基酸獨(dú)立看待(堿基/氨基酸只有0和1的狀態(tài))時(shí),對(duì)序列進(jìn)行分析的軟件。=5\*romanv,按照DOLLO簡約性算法對(duì)序列進(jìn)行分析的軟件。=6\*romanvi,繪制和修改進(jìn)化樹的軟件?!緦?shí)驗(yàn)內(nèi)容】1、使用CLUSTALX軟件對(duì)已知八條DNA序列(如下)進(jìn)行多重序列比對(duì);M._mulattaAAGCTTTTCTGGCGCAACCATCCTCATGATTGCTCACGGACTCACCTCTTM._fascicuAAGCTTCTCCGGCGCAACCACCCTTATAATCGCCCACGGGCTCACCTCTTM._sylvanuAAGCTTCTCCGGTGCAACTATCCTTATAGTTGCCCATGGACTCACCTCTTHomo_sapieAAGCTTCACCGGCGCAGTCATTCTCATAATCGCCCACGGGCTTACATCCTGorillaAAGCTTCACCGGCGCAGTTGTTCTTATAATTGCCCACGGACTTACATCATPongoAAGCTTCACCGGCGCAACCACCCTCATGATTGCCCATGGACTCACATCCTSaimiri_scAAGCTTCACCGGCGCAATGATCCTAATAATCGCTCACGGGTTTACTTCGTLemur_cattAAGCTTCATAGGAGCAACCATTCTAATAATCGCACATGGCCTTACATCAT2、使用PHYLIP軟件包構(gòu)建上述DNA分子系統(tǒng)發(fā)生樹。【實(shí)驗(yàn)方法】一、用CLUSTALX軟件對(duì)已知DNA序列做多序列比對(duì)。操作步驟:1、以FASTA格式準(zhǔn)備8個(gè)DNA序列test.seq(或txt)文件。2、雙擊進(jìn)入CLUSTALX程序,點(diǎn)FILE進(jìn)入LOADSEQUENCE,打開test.seq(或txt)文件。3、點(diǎn)ALIGNMENT,在默認(rèn)alignmentparameters下,點(diǎn)擊DocompleteAlignment。在新出現(xiàn)的窗口中點(diǎn)擊ALIGN進(jìn)行比對(duì),這時(shí)輸出兩個(gè)文件(默認(rèn)輸出文件格式為Clustal格式):比對(duì)文件test.aln和向?qū)湮募est.dnd。4、點(diǎn)FILE進(jìn)入Savesequenceas,在format框中選PHYLIP,文件在PHYLIP軟件目錄下以test.phy存在,點(diǎn)擊OK。5、將PHYLIP軟件目錄下的test.phy文件拷貝到EXE文件夾中。用計(jì)事本方式打開的test.phy文件的部分序列如下:二、用PHYLIP軟件推導(dǎo)進(jìn)化樹。1、進(jìn)入EXE文件夾,點(diǎn)擊SEQBOOT軟件輸入test.phy文件名,回車。圖中的D、J、R、I、O、1、2代表可選擇的選項(xiàng),鍵入這些字母,程序的條件就會(huì)發(fā)生改變。D選項(xiàng)無須改變。J選項(xiàng)有三種條件可以選擇,分別是Bootstrap、Jackknife和Permute。文章上面提到用Bootstraping法對(duì)進(jìn)化樹進(jìn)行評(píng)估,所謂Bootstraping法就是從整個(gè)序列的堿基(氨基酸)中任意選取一半,剩下的一半序列隨機(jī)補(bǔ)齊組成一個(gè)新的序列。這樣,一個(gè)序列就可以變成了許多序列。一個(gè)多序列組也就可以變成許多個(gè)多序列組。根據(jù)某種算法(最大簡約性法、最大可能性法、除權(quán)配對(duì)法或鄰位相連法)每個(gè)多序列組都可以生成一個(gè)進(jìn)化樹。將生成的許多進(jìn)化樹進(jìn)行比較,按照多數(shù)規(guī)則(majority-rule)我們就會(huì)得到一個(gè)最“逼真”的進(jìn)化樹。Jackknife則是另外一種隨機(jī)選取序列的方法。它與Bootstrap法的區(qū)別是不將剩下的一半序列補(bǔ)齊,只生成一個(gè)縮短了一半的新序列。Permute是另外一種取樣方法,其目的與Bootstrap和Jackknife法不同,這里不再介紹。R選項(xiàng)讓使用者輸入republicate的數(shù)目。所謂republicate就是用Bootstrap法生成的一個(gè)多序列組。根據(jù)多序列中所含的序列的數(shù)目的不同可以選取不同的republicate,此處選200,輸入Y確認(rèn)參數(shù)并在Randomnumberseed(mustbeodd)

的下面輸入一個(gè)奇數(shù)(比如3)。當(dāng)我們?cè)O(shè)置好條件后按回車,程序開始運(yùn)行,并在EXE文件夾中產(chǎn)生一個(gè)文件outfile。文件outfile改為infile。點(diǎn)擊DNADIST程序。選項(xiàng)M是輸入剛才設(shè)置的republicate的數(shù)目,輸入D選擇datasets,輸入200。設(shè)置好條件后,輸入Y確認(rèn)參數(shù)。程序開始運(yùn)行,并在EXE文件夾中產(chǎn)生outfile,將outfile文件名改為infile,為避免與原先infile文件重復(fù),將原先文件名改為infile1。3、EXE文件夾中選擇通過距離矩陣推測進(jìn)化樹的算法,點(diǎn)擊NEIGHBOR程序。輸入M更改參數(shù),輸入D選擇datasets。輸入200。輸入奇數(shù)種子3。輸Y確認(rèn)參數(shù)。程序開始運(yùn)行,并在EXE文件夾中產(chǎn)生outfile和outtree兩個(gè)結(jié)果輸出。outtree文件是一個(gè)樹文件,可以用treeview等軟件打開。outfile是一個(gè)分析結(jié)果的輸出報(bào)告,包括了樹和其他一些分析報(bào)告,可以用記事本直接打開。部分內(nèi)容如下:4、將outtree文件名改為intree,點(diǎn)擊DRAWTREE程序,輸入font1文件名,作為參數(shù)。輸Y確認(rèn)參數(shù)。程序開始運(yùn)行,并出現(xiàn)TreePreview圖。5、點(diǎn)擊DRAWGRAM程序,輸入font1文件名,作為參數(shù)。輸Y確認(rèn)參數(shù)。程序開始運(yùn)行,并出現(xiàn)TreePreview圖。6、將EXE文件夾中的outfile文件名改為outfile1,以避免被新生成的outfile文件覆蓋。點(diǎn)擊CONSENSE程序。輸入Y確認(rèn)設(shè)置。EXE文件夾中新生成outfile和outtree。Outfile文件用記事本打開, 7

、將EXE文件夾中的intree文件名改為intree1,將outtree改intree。點(diǎn)擊DRAWTREE程序,輸入font1文件名,作為參數(shù)。輸Y確認(rèn)參數(shù)。程序開始運(yùn)行,并出現(xiàn)TreePreview圖。8、點(diǎn)擊DRAWGRAM程序,輸入font1文件名,作為參數(shù)。輸Y確認(rèn)參數(shù)。程序開始運(yùn)行,并出現(xiàn)TreePreview圖?!咀鳂I(yè)】1、提交使用CLUSTALX及PHYLIP軟件進(jìn)行多重序列比對(duì)及構(gòu)建系統(tǒng)發(fā)生樹的結(jié)果;2、總結(jié)多重序列比對(duì)及構(gòu)建系統(tǒng)發(fā)生樹的關(guān)鍵事項(xiàng)。

實(shí)驗(yàn)五PCR引物設(shè)計(jì)及評(píng)價(jià)【實(shí)驗(yàn)?zāi)康摹?、掌握引物設(shè)計(jì)的基本要求,并熟悉使用Primerpremier5.0軟件進(jìn)行引物搜索。2、掌握使用軟件oligo6.0對(duì)設(shè)計(jì)的引物進(jìn)行評(píng)價(jià)分析。【實(shí)驗(yàn)原理】一、引物設(shè)計(jì)原則聚合梅鏈?zhǔn)椒磻?yīng)(polymerasechainreaction)即PCR技術(shù),是一種在體外快速擴(kuò)增特定基因或DNA序列的方法,故又稱基因的體外擴(kuò)增法。PCR技術(shù)已成為分子生物學(xué)研究中使用最多,最廣泛的手段之一,而引物設(shè)計(jì)是PCR技術(shù)中至關(guān)重要的一環(huán),使用不合適的PCR引物容易導(dǎo)致實(shí)驗(yàn)失敗:表現(xiàn)為擴(kuò)增出目的帶之外的多條帶(如形成引物二聚體帶),不出帶或出帶很弱,等等?,F(xiàn)在PCR引物設(shè)計(jì)大都通過計(jì)算機(jī)軟件進(jìn)行,可以直接提交模板序列到特定網(wǎng)頁,得到設(shè)計(jì)好的引物,也可以在本地計(jì)算機(jī)上運(yùn)行引物設(shè)計(jì)專業(yè)軟件。引物設(shè)計(jì)原則如下:1、引物應(yīng)在序列的保守區(qū)域設(shè)計(jì)并具有特異性。引物序列應(yīng)位于基因組DNA的高度保守區(qū),且與非擴(kuò)增區(qū)無同源序列。這樣可以減少引物與基因組的非特異結(jié)合,提高反應(yīng)的特異性;2、引物的長度一般為15-30bp。常用的是18-27bp,但不應(yīng)大于38,因?yàn)檫^長會(huì)導(dǎo)致其延伸溫度大于74℃,不適于TaqDNA聚合酶進(jìn)行反應(yīng);3、引物不應(yīng)形成二級(jí)結(jié)構(gòu)。引物二聚體及發(fā)夾結(jié)構(gòu)的能值過高(超過4.5kcal/mol)易導(dǎo)致產(chǎn)生引物二聚體帶,并且降低引物有效濃度而使PCR反應(yīng)不能正常進(jìn)行;4、引物序列的GC含量一般為40-60%。過高或過低都不利于引發(fā)反應(yīng)。上下游引物的GC含量不能相差太大;5、引物所對(duì)應(yīng)模板位置序列的Tm值在72℃左右可使復(fù)性條件最佳。Tm值的計(jì)算有多種方法,如按公式Tm=4(G+C)+2(A+T);6、引物5'端序列對(duì)PCR影響不太大,因此常用來引進(jìn)修飾位點(diǎn)或標(biāo)記物。可根據(jù)下一步實(shí)驗(yàn)中要插入PCR產(chǎn)物的載體的相應(yīng)序列而確定。7、引物3’端不可修飾。引物3'端的末位堿基對(duì)Taq酶的DNA合成效率有較大的影響。不同的末位堿基在錯(cuò)配位置導(dǎo)致不同的擴(kuò)增效率,末位堿基為A的錯(cuò)配效率明顯高于其他3個(gè)堿基,因此應(yīng)當(dāng)避免在引物的3'端使用堿基A8、引物序列自身或者引物之間不能在出現(xiàn)3個(gè)以上的連續(xù)堿基,如GGG或CCC,也會(huì)使錯(cuò)誤引發(fā)機(jī)率增加;9、G值是指DNA雙鏈形成所需的自由能,該值反映了雙鏈結(jié)構(gòu)內(nèi)部堿基對(duì)的相對(duì)穩(wěn)定性。應(yīng)當(dāng)選用3'端G值較低(絕對(duì)值不超過9),而5’端和中間G值相對(duì)較高的引物。引物的3’端的G值過高,容易在錯(cuò)配位點(diǎn)形成雙鏈結(jié)構(gòu)并引發(fā)DNA聚合反應(yīng);值得一提的是,各種模板的引物設(shè)計(jì)難度不一。有的模板本身?xiàng)l件比較困難,例如GC含量偏高或偏低,導(dǎo)致找不到各種指標(biāo)都十分合適的引物;在用作克隆目的的PCR因?yàn)楫a(chǎn)物序列相對(duì)固定,引物設(shè)計(jì)的選擇自由度較低,在這種情況只能退而求其次,盡量去滿足條件。二、引物設(shè)計(jì)軟件Primerpremier5.0及oligo6.0“Premier”的主要功能分四大塊,其中有三種功能比較常用,即引物設(shè)計(jì)、限制性內(nèi)切酶位點(diǎn)分析和DNA基元(motif)查找?!癙remier”還具有同源性分析功能,但并非其特長,在此略過。此外,該軟件還有一些特殊功能,其中最重要的是設(shè)計(jì)簡并引物,另外還有序列“朗讀”、DNA與蛋白序列的互換、語音提示鍵盤輸入等等。有時(shí)需要根據(jù)一段氨基酸序列反推到DNA來設(shè)計(jì)引物,由于大多數(shù)氨基酸(20種常見結(jié)構(gòu)氨基酸中的18種)的遺傳密碼不只一種,因此,由氨基酸序列反推DNA序列時(shí),會(huì)遇到部分堿基的不確定性。這樣設(shè)計(jì)并合成的引物實(shí)際上是多個(gè)序列的混和物,它們的序列組成大部分相同,但在某些位點(diǎn)有所變化,稱之為簡并引物。遺傳密碼規(guī)則因物種或細(xì)胞亞結(jié)構(gòu)的不同而異,比如在線粒體內(nèi)的遺傳密碼與細(xì)胞核是不一樣的?!癙remier”可以針對(duì)模板DNA的來源以相應(yīng)的遺傳密碼規(guī)則轉(zhuǎn)換DNA和氨基酸序列。軟件共給出八種生物亞結(jié)構(gòu)的不同遺傳密碼規(guī)則供用戶選擇,有纖毛蟲大核(CiliateMacronuclear)、無脊椎動(dòng)物線粒體(InvertebrateMitochondrion)、支原體(Mycoplasma)、植物線粒體(PlantMitochondrion)、原生動(dòng)物線粒體(ProtozoanMitochondrion)、一般標(biāo)準(zhǔn)(Standard)、脊椎動(dòng)物線粒體(VertebrateMito-chondrion)和酵母線粒體(YeastMitochondrion)。對(duì)引物進(jìn)行分析評(píng)價(jià)的的軟件中,“oligo”是最著名的。它的使用并不十分復(fù)雜,Oligo6.0的界面是三個(gè)圖,Tm圖、ΔG圖和Frq圖。“Oligo”的功能比“Premier”還要單一,就是引物設(shè)計(jì)。但它的引物分析功能如此強(qiáng)大以至于能風(fēng)靡全世界。所以引物設(shè)計(jì)的最佳搭配是“Premier”進(jìn)行引物搜索“Oligo”對(duì)引物分析評(píng)價(jià)?!緦?shí)驗(yàn)內(nèi)容】1、使用Primerpremier5.0軟件進(jìn)行人瘦素(leptin)mRNA引物的設(shè)計(jì)。2、使用oligo6.0對(duì)引物進(jìn)行評(píng)價(jià)分析。

【實(shí)驗(yàn)方法】一、引物搜索1、打開Primerpremier5.0軟件,調(diào)入人瘦素(leptin)基因序列:點(diǎn)擊“file”“open”“DNAsequence”;或者直接點(diǎn)擊“file”“new”“DNAsequence”,彈出一對(duì)話框如下圖,然后將序列人瘦素(leptin)基因復(fù)制在空白框。2、序列文件顯示如圖,點(diǎn)擊“Primer”;3、進(jìn)一步點(diǎn)擊“search”按鈕,出現(xiàn)“searchcriteria”窗口,有多種參數(shù)可以調(diào)整。搜索目的(SeachFor)有三種選項(xiàng),PCR引物(PCRPrimers),測序引物(SequencingPrimers),雜交探針(HybridizationProbes)。搜索類型(SearchType)可選擇分別或同時(shí)查找上、下游引物(Sense/Anti-sensePrimer,或Both),或者成對(duì)查找(Pairs),或者分別以適合上、下游引物為主(CompatiblewithSense/Anti-sensePrimer)。另外還可改變選擇區(qū)域(SearchRanges),引物長度(PrimerLength),選擇方式(SearchMode),參數(shù)選擇(SearchParameters)等等。使用者可根據(jù)自己的需要設(shè)定各項(xiàng)參數(shù)。我們將ProductSize設(shè)置300-350,其他參數(shù)使用默認(rèn)值。然后點(diǎn)擊“OK”,隨之出現(xiàn)的SearchProgress窗口中顯示SearchCompleted時(shí),再點(diǎn)擊“OK”。4、這時(shí)搜索結(jié)果以表格的形式出現(xiàn),有三種顯示方式,上游引物(Sense),下游引物(Anti-sense),成對(duì)顯示(Pairs)。默認(rèn)顯示為成對(duì)方式,并按優(yōu)劣次序(Rating)排列,滿分為100,即各指標(biāo)基本都能達(dá)標(biāo)(如下圖)。5、按照搜尋結(jié)果顯示,在主窗口中檢查該引物對(duì)的二級(jí)結(jié)構(gòu)情況,逐條分析,依次篩選。下面進(jìn)行序列篩選:點(diǎn)擊其中一對(duì)引物,如第21#引物,在“PeimerPremier”主窗口,如圖所示:該圖分三部分,最上面是圖示PCR模板及產(chǎn)物位置,中間是所選的上下游引物的一些性質(zhì),最下面是四種重要指標(biāo)的分析,包括發(fā)夾結(jié)構(gòu)(Hairpin),二聚體(Dimer),錯(cuò)誤引發(fā)情況(FalsePriming),及上下游引物之間二聚體形成情況(CrossDimer)。當(dāng)所分析的引物有這四種結(jié)構(gòu)的形成可能時(shí),按鈕由“None”變成“Found”,點(diǎn)擊該按鈕,在左下角的窗口中就會(huì)出現(xiàn)該結(jié)構(gòu)的形成情況。一對(duì)理想的引物應(yīng)當(dāng)不存在任何一種上述結(jié)構(gòu),因此最好的情況是最下面的分析欄沒有“Found”,只有“None”。值得注意的是中間一欄的末尾給出該引物的最佳退火溫度,可參考應(yīng)用。二、引物分析1、打開oligo的頁面如下:2、單擊file菜單再點(diǎn)open或點(diǎn)擊“打開”快捷圖標(biāo)或者用快捷鍵“CTrl+O”可彈出一對(duì)話框,然后選擇序列人瘦素(leptin)基因。出現(xiàn)以下窗口。3、點(diǎn)擊“window”再點(diǎn)擊“Tile”,出現(xiàn)以下窗口,圖中顯示的三個(gè)指標(biāo)分別為Tm、ΔG和Frq,因?yàn)榉治鲆婕岸鄠€(gè)指標(biāo),起動(dòng)窗口的cascade排列方式不太方便,可從windows菜單改為tile方式。如果覺得太擁擠,可去掉一個(gè)指標(biāo)。?G值反映了序列與模板的結(jié)合強(qiáng)度,最好引物的?G值在5’端和中間值比較高,而在3’端相對(duì)低(如圖:)Tm值曲線以選取72℃附近為佳,5’到3’的下降形狀也有利于引物引發(fā)聚合反應(yīng)。Frq曲線為“Oligo6”新引進(jìn)的一個(gè)指標(biāo),揭示了序列片段存在的重復(fù)機(jī)率大小。選取引物時(shí),宜選用3’端Frq值相對(duì)較低的片段。4、在設(shè)計(jì)時(shí),可依據(jù)圖上三種指標(biāo)的信息選取序列,如果覺得合適,可點(diǎn)擊Tm圖塊上左下角的Upper按鈕,選好上游引物,此時(shí)該按鈕變成紅色,表示上游引物已選取好。下游引物的選取步驟基本同上,只是按鈕變成Lower。5、當(dāng)上下游引物全選好以后,需要對(duì)引物進(jìn)行評(píng)價(jià)??梢杂谩癆nalyse”菜單分析你的引物:比如有無引物二聚體、發(fā)卡結(jié)構(gòu)等等。首先檢查引物二聚體尤其是3’端二聚體形成的可能性。需要注意的是,引物二聚體有可能是上游或下游引物自身形成,也有可能是在上下游引物之間形成(crossdimer)。二聚體形成的能值越高,越不符合要求。一般的檢測(非克隆)性PCR,對(duì)引物位置、產(chǎn)物大小要求較低,因而應(yīng)盡可能選取不形成二聚體或其能值較低的引物。第二項(xiàng)檢查是發(fā)夾結(jié)構(gòu)(hairpin);與二聚體相同,發(fā)夾結(jié)構(gòu)的能值越低越好。一般來說,這兩項(xiàng)結(jié)構(gòu)的能值以不超過4.5為好。當(dāng)然,在設(shè)計(jì)克隆目的的PCR引物時(shí),引物兩端一般都添加酶切位點(diǎn),必然存在發(fā)夾結(jié)構(gòu),而且能值不會(huì)太低。這種PCR需要通過靈活調(diào)控退火溫度以達(dá)到最好效果,對(duì)引物的發(fā)夾結(jié)構(gòu)的檢測就不應(yīng)要求太高。第三項(xiàng)檢查為GC含量,以45-55%為宜。有一些模板本身的GC含量偏低或偏高,導(dǎo)致引物的GC含量不能被控制在上述范圍內(nèi),這時(shí)應(yīng)盡量使上下游引物的GC含量以及Tm值保持接近,以有利于退火溫度的選擇。當(dāng)我們結(jié)束以上三項(xiàng)檢測,按Alt+P鍵彈出PCR窗口,其中總結(jié)性地顯示該引物的位置、產(chǎn)物大小、Tm值等參數(shù),最有用的是還給出了推薦的最佳退火溫度和簡單的評(píng)價(jià)?!咀鳂I(yè)】1、提交使用Primerpremier5.0及oligo6.0軟件進(jìn)行人瘦素(leptin)mRNA引物的設(shè)計(jì)結(jié)果;2、總結(jié)引物設(shè)計(jì)應(yīng)注意的關(guān)鍵事項(xiàng)。

實(shí)驗(yàn)六蛋白質(zhì)序列分析和結(jié)構(gòu)預(yù)測【實(shí)驗(yàn)?zāi)康摹?、掌握蛋白質(zhì)序列檢索的操作方法;2、熟悉蛋白質(zhì)基本性質(zhì)分析;3、熟悉基于序列同源性分析的蛋白質(zhì)功能預(yù)測,了解基于motif、結(jié)構(gòu)位點(diǎn)、結(jié)構(gòu)功能域數(shù)據(jù)庫的蛋白質(zhì)功能預(yù)測;4、了解蛋白質(zhì)結(jié)構(gòu)預(yù)測。【實(shí)驗(yàn)內(nèi)容】1、使用Entrez或SRS信息查詢系統(tǒng)檢索人脂聯(lián)素(adiponectin)蛋白質(zhì)序列;2、使用BioEdit軟件對(duì)上述蛋白質(zhì)序列進(jìn)行分子質(zhì)量、氨基酸組成、和疏水性等基本性質(zhì)分析;3、對(duì)人脂聯(lián)素蛋白質(zhì)序列進(jìn)行基于NCBI/Blast軟件的蛋白質(zhì)同源性分析;4、對(duì)人脂聯(lián)素蛋白質(zhì)序列進(jìn)行motif結(jié)構(gòu)分析;5、對(duì)人脂聯(lián)素蛋白質(zhì)序列進(jìn)行二級(jí)結(jié)構(gòu)和三維結(jié)構(gòu)預(yù)測?!緦?shí)驗(yàn)方法】1、人脂聯(lián)素蛋白質(zhì)序列的檢索:(1)調(diào)用Internet瀏覽器并在其地址欄輸入Entrez網(wǎng)址(/Entrez);(2)在Search后的選擇欄中選擇protein;(3)在輸入欄輸入homosapiensadiponectin;(4)點(diǎn)擊go后顯示序列接受號(hào)及序列名稱;(5)點(diǎn)擊序列接受號(hào)NP_004788(adiponectinprecursor;adiposemostabundantgenetranscript1[Homosapiens])后顯示序列詳細(xì)信息;(6)將序列轉(zhuǎn)為FASTA格式保存(參考上述步驟使用SRS信息查詢系統(tǒng)檢索人脂聯(lián)素蛋白質(zhì)序列);2、使用BioEdit軟件對(duì)人脂聯(lián)素蛋白質(zhì)序列進(jìn)行分子質(zhì)量、氨基酸組成和疏水性等基本性質(zhì)分析:打開BioEdit軟件→將人脂聯(lián)素蛋白質(zhì)序列的FASTA格式序列輸入分析框→點(diǎn)擊左側(cè)序列說明框中的序列說明→點(diǎn)擊sequence欄→選擇protein→點(diǎn)擊AminoAcidComposition→查看該蛋白質(zhì)分子質(zhì)量和氨基酸組成;或者選擇protein后,點(diǎn)擊Kyte&DoolittleMeanHydrophobicityProfile→查看該蛋白質(zhì)分子疏水性水平;3、人脂聯(lián)素蛋白質(zhì)序列的蛋白質(zhì)同源性分析:(1)進(jìn)入NCBI/Blast網(wǎng)頁;(2)選擇HYPERLINK"/blast/Blast.cgi?CMD=Web&LAYOUT=TwoWindows&AUTO_FORMAT=Semiauto&ALI

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論