




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第六章 蛋白質(zhì)序列分析西北農(nóng)林科技大學(xué)農(nóng)學(xué)院遺傳組主講人:胡銀崗主講人:胡銀崗第一節(jié)第一節(jié) 蛋白質(zhì)數(shù)據(jù)庫蛋白質(zhì)數(shù)據(jù)庫1. 1.數(shù)據(jù)庫的分類數(shù)據(jù)庫的分類蛋白質(zhì)的功能主要是由它的構(gòu)造所決議的,蛋白蛋白質(zhì)的功能主要是由它的構(gòu)造所決議的,蛋白質(zhì)的構(gòu)造主要分為四級,根據(jù)這種構(gòu)造層次,質(zhì)的構(gòu)造主要分為四級,根據(jù)這種構(gòu)造層次,將蛋白質(zhì)數(shù)據(jù)庫分為:將蛋白質(zhì)數(shù)據(jù)庫分為:蛋白質(zhì)序列數(shù)據(jù)庫蛋白質(zhì)序列數(shù)據(jù)庫以蛋白質(zhì)的序列為主,并賦予相應(yīng)的注釋;如以蛋白質(zhì)的序列為主,并賦予相應(yīng)的注釋;如PIRPIRPSDPSD、SWISS-PROT/TrEMBL, NCBISWISS-PROT/TrEMBL, NCBI等等蛋白質(zhì)模體及
2、構(gòu)造域數(shù)據(jù)庫蛋白質(zhì)模體及構(gòu)造域數(shù)據(jù)庫搜集了蛋白質(zhì)的保守構(gòu)造域和功能域的特征序列;搜集了蛋白質(zhì)的保守構(gòu)造域和功能域的特征序列;如如PROSITEPROSITE,PfamPfam,PRINTSPRINTS,BLOCKSBLOCKS等等蛋白質(zhì)構(gòu)造數(shù)據(jù)庫蛋白質(zhì)構(gòu)造數(shù)據(jù)庫以蛋白質(zhì)的構(gòu)造丈量數(shù)據(jù)為主;如以蛋白質(zhì)的構(gòu)造丈量數(shù)據(jù)為主;如PDBPDB等等蛋白質(zhì)分類數(shù)據(jù)庫蛋白質(zhì)分類數(shù)據(jù)庫分為以序列比較為根底的序列分類數(shù)據(jù)庫和以構(gòu)分為以序列比較為根底的序列分類數(shù)據(jù)庫和以構(gòu)造比較為根底的構(gòu)造分類數(shù)據(jù)庫,如造比較為根底的構(gòu)造分類數(shù)據(jù)庫,如SCOPSCOP,CAHTCAHT,F(xiàn)SSPFSSP等等2. 蛋白質(zhì)序列數(shù)據(jù)庫pi
3、/ebi.ac.uk/swissprot/3. 蛋白質(zhì)模體及構(gòu)造域數(shù)據(jù)庫PROSITEPROSITE蛋白質(zhì)家族和構(gòu)造域數(shù)據(jù)庫蛋白質(zhì)家族和構(gòu)造域數(shù)據(jù)庫/prosite/ /prosite/ PROSITEPROSITE數(shù)據(jù)庫搜集了有顯著生物學(xué)意義的蛋白質(zhì)位點(diǎn)數(shù)據(jù)庫搜集了有顯著生物學(xué)意義的蛋白質(zhì)位點(diǎn)序列、蛋白質(zhì)特征序列譜庫以及序列模型,序列、蛋白質(zhì)特征序列譜庫以及序列模型,能根據(jù)這些特征、屬性快速可靠地鑒定出一個(gè)未知功能能根據(jù)這些特征、屬性快速可靠地鑒定出一個(gè)未知功能蛋白質(zhì)序列屬于哪個(gè)蛋白質(zhì)家族,蛋白質(zhì)序列屬于哪個(gè)蛋白質(zhì)家族,
4、即使在蛋白質(zhì)序列類似性很低的情況下,可以經(jīng)過搜索即使在蛋白質(zhì)序列類似性很低的情況下,可以經(jīng)過搜索隱含的功能構(gòu)造模體隱含的功能構(gòu)造模體motifmotif來鑒定來鑒定因此,是一個(gè)有效的序列分析數(shù)據(jù)庫。因此,是一個(gè)有效的序列分析數(shù)據(jù)庫。PROSITEPROSITE中涉及的序列方式中涉及的序列方式酶的催化位點(diǎn)酶的催化位點(diǎn)配體結(jié)合位點(diǎn)配體結(jié)合位點(diǎn)金屬離子結(jié)合位點(diǎn)金屬離子結(jié)合位點(diǎn)二硫鍵、小分子或者蛋白質(zhì)結(jié)合區(qū)域等二硫鍵、小分子或者蛋白質(zhì)結(jié)合區(qū)域等PROSITEPROSITE還包括由多序列比對構(gòu)建的序列特征譜還包括由多序列比對構(gòu)建的序列特征譜profileprofile,能更敏感地發(fā)現(xiàn)序列中的信息。,能更
5、敏感地發(fā)現(xiàn)序列中的信息。/prosite/PfamPfam蛋白質(zhì)家族序列比對以及蛋白質(zhì)家族序列比對以及HMMHMM方式數(shù)據(jù)庫方式數(shù)據(jù)庫pfam.sanger.ac.uk/pfam.sanger.ac.uk/4. 蛋白質(zhì)構(gòu)造數(shù)據(jù)庫PDB /pdb/home/home.doPDB包括蛋白質(zhì)、核酸、蛋白質(zhì)-核酸復(fù)合體以及病毒等生物大分子構(gòu)造數(shù)據(jù),主要是蛋白質(zhì)構(gòu)造數(shù)據(jù)5. 蛋白質(zhì)分類數(shù)據(jù)庫 SCOP蛋白質(zhì)構(gòu)造分類數(shù)據(jù)庫 Structural Classification of Protein database (scop.mrc-lmb.cam.ac.uk/scop
6、/index.html CATH蛋白質(zhì)構(gòu)造數(shù)據(jù)庫 CATH Protein Structure Classification cathdb/ FSSP 基于蛋白質(zhì)構(gòu)造構(gòu)造比對的折疊分類Fold classification based on Structure-Structure alignment of Proteins ekhidna.biocenter.helsinki.fi/daliscop.mrc-lmb.cam.ac.uk/scop/index.htmlcathdb/ekhidna.biocenter.helsinki.fi/dali6. 數(shù)據(jù)庫的利用 蛋白質(zhì)數(shù)據(jù)庫都具備三種功能蛋
7、白質(zhì)數(shù)據(jù)庫都具備三種功能 數(shù)據(jù)的注釋數(shù)據(jù)的注釋annotationannotation 一切提交到數(shù)據(jù)庫的數(shù)據(jù)都要由作者或一切提交到數(shù)據(jù)庫的數(shù)據(jù)都要由作者或數(shù)據(jù)庫管理人員進(jìn)展注釋方能發(fā)布;數(shù)據(jù)庫管理人員進(jìn)展注釋方能發(fā)布; 數(shù)據(jù)的檢索數(shù)據(jù)的檢索searchsearch 數(shù)據(jù)經(jīng)注釋之后,訪問者可以經(jīng)過數(shù)據(jù)數(shù)據(jù)經(jīng)注釋之后,訪問者可以經(jīng)過數(shù)據(jù)庫網(wǎng)頁上提供的搜索引擎進(jìn)展搜索,找?guī)炀W(wǎng)頁上提供的搜索引擎進(jìn)展搜索,找到本人所需的蛋白質(zhì)信息;到本人所需的蛋白質(zhì)信息; 數(shù)據(jù)的生物信息分析數(shù)據(jù)的生物信息分析analysisanalysis 訪問者一旦找到感興趣的蛋白質(zhì),就可訪問者一旦找到感興趣的蛋白質(zhì),就可以運(yùn)用數(shù)
8、據(jù)庫提供的生物信息分析工具以運(yùn)用數(shù)據(jù)庫提供的生物信息分析工具對蛋白質(zhì)序列的未知數(shù)據(jù)進(jìn)展預(yù)測,如對蛋白質(zhì)序列的未知數(shù)據(jù)進(jìn)展預(yù)測,如預(yù)測蛋白質(zhì)的理化性質(zhì)預(yù)測蛋白質(zhì)的理化性質(zhì), ,預(yù)測蛋白質(zhì)的二預(yù)測蛋白質(zhì)的二級構(gòu)造,多重序列比對等等。級構(gòu)造,多重序列比對等等。 PROSITE 內(nèi)容PROSITE PROSITE 主要保管兩類信息:主要保管兩類信息:方式方式patternpattern和譜和譜profileprofile,權(quán)重矩陣。,權(quán)重矩陣。方式可以了解為保守的氨基酸陳列方式,通常以氨基酸單字母方式方式可以了解為保守的氨基酸陳列方式,通常以氨基酸單字母方式陳列。陳列。例如酪氨酸激酶磷酸化位點(diǎn)方式例如
9、酪氨酸激酶磷酸化位點(diǎn)方式RK-x(2)-DE-x(3)-Y RK-x(2)-DE-x(3)-Y 或或 RK-x(3)-DE-x(2)-YRK-x(3)-DE-x(2)-Y其中擴(kuò)號表示擴(kuò)號中的各種氨基酸均可,其中擴(kuò)號表示擴(kuò)號中的各種氨基酸均可,X X表示恣意氨基酸,小擴(kuò)號表示恣意氨基酸,小擴(kuò)號中的數(shù)字表示氨基酸個(gè)數(shù)。中的數(shù)字表示氨基酸個(gè)數(shù)。AC-x-V-x(4)-EDThis pattern is translated as: AC-x-V-x(4)-EDThis pattern is translated as: Ala or Cys-any-Val-any-any-any-any-any b
10、ut Glu or AspAla or Cys-any-Val-any-any-any-any-any but Glu or AspPROSITE- profile 例如Profile 為對保守區(qū)域每一位置氨基酸保守情況為對保守區(qū)域每一位置氨基酸保守情況進(jìn)展打分構(gòu)建的權(quán)重矩陣。進(jìn)展打分構(gòu)建的權(quán)重矩陣。第一行為該區(qū)域出現(xiàn)的氨基酸,每一行為蛋白第一行為該區(qū)域出現(xiàn)的氨基酸,每一行為蛋白序列中一個(gè)位置,在該位置對各種氨基酸的保守序列中一個(gè)位置,在該位置對各種氨基酸的保守情況都給出一個(gè)分值,分值越高表示出現(xiàn)概率越情況都給出一個(gè)分值,分值越高表示出現(xiàn)概率越大大PROSITE 運(yùn)用本卷須知運(yùn)用本卷須知 Pa
11、ttern主要可以用來預(yù)測某些生物活性位主要可以用來預(yù)測某些生物活性位點(diǎn),如磷酸化位點(diǎn)、甲基化位點(diǎn)。點(diǎn),如磷酸化位點(diǎn)、甲基化位點(diǎn)。profile預(yù)測可靠性高,可以用來對新蛋白進(jìn)展分預(yù)測可靠性高,可以用來對新蛋白進(jìn)展分類和提供功能提示。類和提供功能提示。 蛋白的功能位點(diǎn)是與其三維構(gòu)造嚴(yán)密相關(guān)蛋白的功能位點(diǎn)是與其三維構(gòu)造嚴(yán)密相關(guān)的,部分區(qū)域符合某種的,部分區(qū)域符合某種pattern不能保證一不能保證一定會具有對應(yīng)的性質(zhì),要根據(jù)實(shí)踐情況,定會具有對應(yīng)的性質(zhì),要根據(jù)實(shí)踐情況,謹(jǐn)慎對待謹(jǐn)慎對待pattern 預(yù)測結(jié)果。預(yù)測結(jié)果。PROSITE 工具工具ScanProsite搜索蛋白序列能否含搜索蛋白序列
12、能否含PROSITE數(shù)據(jù)庫中存有的方式或是功能位點(diǎn);數(shù)據(jù)庫中存有的方式或是功能位點(diǎn);搜索搜索Swiss-Prot中符合某種方式的蛋白以及蛋白三維構(gòu)造數(shù)據(jù)庫中符合某種方式的蛋白以及蛋白三維構(gòu)造數(shù)據(jù)庫PDB中含有該方式的蛋白,可察看其三維構(gòu)造。中含有該方式的蛋白,可察看其三維構(gòu)造。 MotifScan 運(yùn)用運(yùn)用PROSITE 以及以及pfam 中的中的profile 對蛋白進(jìn)展搜索。對蛋白進(jìn)展搜索。PRATT 用于找出一系列序列中保守方式的程序,用戶可以提交本人的一組用于找出一系列序列中保守方式的程序,用戶可以提交本人的一組序列,生成共有的序列,生成共有的pattern。PROSITE還提供一些可
13、以下載到本地運(yùn)轉(zhuǎn)的程序還提供一些可以下載到本地運(yùn)轉(zhuǎn)的程序如如ps_scan,但需求安裝,但需求安裝perl 運(yùn)轉(zhuǎn)環(huán)境。運(yùn)轉(zhuǎn)環(huán)境。Pftools 同樣是可以本地同樣是可以本地運(yùn)轉(zhuǎn)的工具,可以搜索運(yùn)轉(zhuǎn)的工具,可以搜索PROSITE中的中的profile,也可以構(gòu)建用戶本,也可以構(gòu)建用戶本人的人的profile. 第二節(jié)第二節(jié) 蛋白質(zhì)序列分析及構(gòu)造預(yù)測戰(zhàn)蛋白質(zhì)序列分析及構(gòu)造預(yù)測戰(zhàn)略略蛋白質(zhì)的構(gòu)造預(yù)蛋白質(zhì)的構(gòu)造預(yù)測必需基于一定測必需基于一定的序列根底和實(shí)的序列根底和實(shí)驗(yàn)證據(jù),因此必驗(yàn)證據(jù),因此必需盡能夠搜集一需盡能夠搜集一切有關(guān)這個(gè)蛋白切有關(guān)這個(gè)蛋白質(zhì)能夠的理化性質(zhì)能夠的理化性質(zhì)和其它特性。質(zhì)和其它特
14、性。1. 根本流程根本流程實(shí)驗(yàn)數(shù)據(jù)實(shí)驗(yàn)數(shù)據(jù)蛋白質(zhì)序列蛋白質(zhì)序列理化特性分析理化特性分析跨膜區(qū)、等電點(diǎn)、親水性、疏水性、酶切跨膜區(qū)、等電點(diǎn)、親水性、疏水性、酶切特性、電荷等特性、電荷等數(shù)據(jù)庫檢索數(shù)據(jù)庫檢索多序列比對、構(gòu)造域搜索多序列比對、構(gòu)造域搜索二級構(gòu)造預(yù)測二級構(gòu)造預(yù)測如有如有PDB中同源體中同源體蛋白質(zhì)折疊識別蛋白質(zhì)折疊識別折疊家族分析折疊家族分析序列與構(gòu)造比對序列與構(gòu)造比對比較建模比較建模三級構(gòu)造預(yù)測三級構(gòu)造預(yù)測三維蛋白模型三維蛋白模型蛋白質(zhì)序列分析及構(gòu)造預(yù)測的根本流程蛋白質(zhì)序列分析及構(gòu)造預(yù)測的根本流程1.序列特征的初步分析序列特征的初步分析 理化特性的預(yù)測理化特性的預(yù)測 修飾位點(diǎn)的預(yù)測修
15、飾位點(diǎn)的預(yù)測 能否為跨膜蛋白或片段能否為跨膜蛋白或片段 能否包含螺旋卷曲構(gòu)造能否包含螺旋卷曲構(gòu)造 能否還有低復(fù)雜度序列等等能否還有低復(fù)雜度序列等等2.同源搜索同源搜索新序列最常用的分析,就是與知的序列等數(shù)據(jù)庫進(jìn)展比對,找到同新序列最常用的分析,就是與知的序列等數(shù)據(jù)庫進(jìn)展比對,找到同源的蛋白質(zhì)序列或類似性較高的序列。源的蛋白質(zhì)序列或類似性較高的序列。常用的工具:常用的工具:BLASTp、FASTA、BLITZ、PSIBLAST等等等等留意的問題留意的問題選擇矩陣:常見的矩陣有選擇矩陣:常見的矩陣有PAM和和BLOSUM。普通先用默許的。普通先用默許的BLOSUM62分析,假設(shè)類似性序列過多,選用
16、更嚴(yán)謹(jǐn)?shù)姆治?,假設(shè)類似性序列過多,選用更嚴(yán)謹(jǐn)?shù)腂LOSUM80,假設(shè)類似性序列很少,可選用假設(shè)類似性序列很少,可選用BLOSUM42,進(jìn)一步分析。,進(jìn)一步分析。PAM30和和PAM70適于分析近源短序列效果較好適于分析近源短序列效果較好空位罰分:普通有兩個(gè)參數(shù),對空位存在的扣除和對于延續(xù)空位的空位罰分:普通有兩個(gè)參數(shù),對空位存在的扣除和對于延續(xù)空位的延伸罰分??瘴涣P分大但延伸罰分少,適于空位少但長的序列;空延伸罰分。空位罰分大但延伸罰分少,適于空位少但長的序列;空位罰分小但延伸罰分重,適于在進(jìn)化上點(diǎn)突變或者突變短小的較近位罰分小但延伸罰分重,適于在進(jìn)化上點(diǎn)突變或者突變短小的較近同源序列。同源序
17、列。3.模體搜索模體搜索 模體是經(jīng)過對一個(gè)蛋白質(zhì)家族進(jìn)展多序列比對檢測出的模體是經(jīng)過對一個(gè)蛋白質(zhì)家族進(jìn)展多序列比對檢測出的高度保守元件,常對應(yīng)于一些構(gòu)造域和功能域,模體搜高度保守元件,常對應(yīng)于一些構(gòu)造域和功能域,模體搜索是找到序列中一些關(guān)鍵的保守氨基酸。索是找到序列中一些關(guān)鍵的保守氨基酸。 常用工具:常用工具:SCANPROSITE、SMART、Pfam、COGS、PRINTS、BLOCKS、SBASE 留意問題留意問題 假設(shè)不同源,搜索出的類似性很小假設(shè)不同源,搜索出的類似性很小 要將序列在三級構(gòu)造數(shù)據(jù)庫的序列進(jìn)展比對要將序列在三級構(gòu)造數(shù)據(jù)庫的序列進(jìn)展比對 很能夠是一些短序列,應(yīng)與類似性搜索
18、結(jié)果等配合運(yùn)用很能夠是一些短序列,應(yīng)與類似性搜索結(jié)果等配合運(yùn)用4.構(gòu)造域定位構(gòu)造域定位 經(jīng)過數(shù)據(jù)庫搜索得到的信息,進(jìn)展構(gòu)造域定位,經(jīng)過數(shù)據(jù)庫搜索得到的信息,進(jìn)展構(gòu)造域定位,對構(gòu)造預(yù)測提供根底對構(gòu)造預(yù)測提供根底 構(gòu)造域定位分析構(gòu)造域定位分析 探測序列與其它全序列之間的同源性關(guān)系探測序列與其它全序列之間的同源性關(guān)系 分析低復(fù)雜度區(qū)域如反復(fù)序列等,時(shí)常間隔構(gòu)分析低復(fù)雜度區(qū)域如反復(fù)序列等,時(shí)常間隔構(gòu)造域造域 跨膜區(qū)域跨膜區(qū)域 卷曲螺旋構(gòu)造卷曲螺旋構(gòu)造 二級構(gòu)造的不同折疊子二級構(gòu)造的不同折疊子 對分解成的構(gòu)造域反復(fù)進(jìn)展數(shù)據(jù)庫搜索和獨(dú)立比對分解成的構(gòu)造域反復(fù)進(jìn)展數(shù)據(jù)庫搜索和獨(dú)立比對對5.多重序列比對多重序
19、列比對 對搜索得到的數(shù)據(jù)進(jìn)展多重序列比對對搜索得到的數(shù)據(jù)進(jìn)展多重序列比對 多重序列比對可提供多重序列比對可提供 構(gòu)造域相應(yīng)信息構(gòu)造域相應(yīng)信息 功能位點(diǎn)的殘基功能位點(diǎn)的殘基 蛋白質(zhì)的親水面和疏水核的氨基酸殘基蛋白質(zhì)的親水面和疏水核的氨基酸殘基 為同源建模、二級構(gòu)造預(yù)測提供模板為同源建模、二級構(gòu)造預(yù)測提供模板 留意問題留意問題 不要把一切搜索結(jié)果用在比對中不要把一切搜索結(jié)果用在比對中 對搜索結(jié)果進(jìn)展手工校正,將顯著性不高的序列,對搜索結(jié)果進(jìn)展手工校正,將顯著性不高的序列,非蛋白質(zhì)家族的序列剔除掉。非蛋白質(zhì)家族的序列剔除掉。6. 同源建模同源建模 假設(shè)蛋白質(zhì)序列有顯著的同源序列類似假設(shè)蛋白質(zhì)序列有顯
20、著的同源序列類似性性50,尤其是與知構(gòu)造的蛋白質(zhì)之間有尤其是與知構(gòu)造的蛋白質(zhì)之間有顯著同源性時(shí),即可進(jìn)展同源建模顯著同源性時(shí),即可進(jìn)展同源建模 以知構(gòu)造的蛋白質(zhì)為模板進(jìn)展準(zhǔn)確的構(gòu)造以知構(gòu)造的蛋白質(zhì)為模板進(jìn)展準(zhǔn)確的構(gòu)造模型構(gòu)建模型構(gòu)建 假設(shè)類似性序列不是完好的,而是一段一假設(shè)類似性序列不是完好的,而是一段一段的構(gòu)造域,也可經(jīng)過二級構(gòu)造預(yù)測和折段的構(gòu)造域,也可經(jīng)過二級構(gòu)造預(yù)測和折疊識別,找到適宜的折疊子,在以這些知疊識別,找到適宜的折疊子,在以這些知構(gòu)造的折疊子為模板構(gòu)建模型構(gòu)造的折疊子為模板構(gòu)建模型7.二級構(gòu)造預(yù)測二級構(gòu)造預(yù)測 假設(shè)沒有搜索到具有知構(gòu)造的蛋白質(zhì)同源序列,假設(shè)沒有搜索到具有知構(gòu)造的
21、蛋白質(zhì)同源序列,也可采用相應(yīng)的方法進(jìn)展二級構(gòu)造預(yù)測也可采用相應(yīng)的方法進(jìn)展二級構(gòu)造預(yù)測 二級構(gòu)造預(yù)測的方法二級構(gòu)造預(yù)測的方法 GOR法法Chou等人和等人和Lim法法 根據(jù)單一序列分析準(zhǔn)確度約根據(jù)單一序列分析準(zhǔn)確度約56-60 中心構(gòu)造預(yù)測法中心構(gòu)造預(yù)測法 經(jīng)過同源蛋白質(zhì)家族的多重比對,發(fā)現(xiàn)二級構(gòu)造經(jīng)過同源蛋白質(zhì)家族的多重比對,發(fā)現(xiàn)二級構(gòu)造存在二級構(gòu)造中心,將序列與中心構(gòu)造相結(jié)合,存在二級構(gòu)造中心,將序列與中心構(gòu)造相結(jié)合,準(zhǔn)確度月準(zhǔn)確度月70 留意問題留意問題 適當(dāng)?shù)娜藶楦缮孢m當(dāng)?shù)娜藶楦缮?著重于二級構(gòu)造保守方式的預(yù)測著重于二級構(gòu)造保守方式的預(yù)測 盡能夠采用多個(gè)預(yù)測方法,構(gòu)建共同序列的構(gòu)造盡能夠
22、采用多個(gè)預(yù)測方法,構(gòu)建共同序列的構(gòu)造圖譜圖譜8.折疊子分析和二級構(gòu)造組分比對折疊子分析和二級構(gòu)造組分比對 對推測出的折疊子,進(jìn)一步確定其折疊方式,經(jīng)過多次對推測出的折疊子,進(jìn)一步確定其折疊方式,經(jīng)過多次比對,確定蛋白質(zhì)能夠?qū)儆谀囊活惖鞍踪|(zhì)比對,確定蛋白質(zhì)能夠?qū)儆谀囊活惖鞍踪|(zhì) 分析的幾個(gè)方面分析的幾個(gè)方面 存在極多類似序列時(shí),看其能否具有類似功能存在極多類似序列時(shí),看其能否具有類似功能 弱類似時(shí),只需構(gòu)造類似,而無序列同源,預(yù)測能夠的弱類似時(shí),只需構(gòu)造類似,而無序列同源,預(yù)測能夠的功能域,及與知折疊子內(nèi)部的中心二級構(gòu)造的類似區(qū)域。功能域,及與知折疊子內(nèi)部的中心二級構(gòu)造的類似區(qū)域。 假設(shè)不存在以上
23、情況,只能思索其中能否含有與知折疊假設(shè)不存在以上情況,只能思索其中能否含有與知折疊子中中心構(gòu)造元件以外的其它區(qū)域類似的區(qū)域子中中心構(gòu)造元件以外的其它區(qū)域類似的區(qū)域 中心二級構(gòu)造元件與二級構(gòu)造的中心區(qū)域中心二級構(gòu)造元件與二級構(gòu)造的中心區(qū)域 折疊子中起關(guān)鍵作用的二級構(gòu)造折疊子中起關(guān)鍵作用的二級構(gòu)造 二級構(gòu)造中起關(guān)鍵作用的氨基酸殘基二級構(gòu)造中起關(guān)鍵作用的氨基酸殘基 利用多重序列比對同時(shí)結(jié)合多個(gè)預(yù)測方法,是確定二級利用多重序列比對同時(shí)結(jié)合多個(gè)預(yù)測方法,是確定二級構(gòu)造中心序列常用的方法構(gòu)造中心序列常用的方法9.三級構(gòu)造與序列間的比對三級構(gòu)造與序列間的比對 折疊識別獲得的結(jié)果并不一定準(zhǔn)確,進(jìn)展折疊識折疊識
24、別獲得的結(jié)果并不一定準(zhǔn)確,進(jìn)展折疊識別前,最好進(jìn)展獨(dú)立比對,確定能夠組成折疊子別前,最好進(jìn)展獨(dú)立比對,確定能夠組成折疊子的二級構(gòu)造元件的二級構(gòu)造元件 分析的方法分析的方法 確認(rèn)預(yù)測的殘基中的包埋面和外露面的序列能否確認(rèn)預(yù)測的殘基中的包埋面和外露面的序列能否與知蛋白質(zhì)的模板構(gòu)造類似與知蛋白質(zhì)的模板構(gòu)造類似 確認(rèn)重要的氫鍵結(jié)合方式在預(yù)測確認(rèn)重要的氫鍵結(jié)合方式在預(yù)測折疊構(gòu)造沒折疊構(gòu)造沒有被打亂有被打亂 經(jīng)過對知構(gòu)造的研討,在預(yù)測的構(gòu)造中盡能夠保經(jīng)過對知構(gòu)造的研討,在預(yù)測的構(gòu)造中盡能夠保管與知構(gòu)造中殘基性質(zhì)類似大小、極性、疏水管與知構(gòu)造中殘基性質(zhì)類似大小、極性、疏水性等的保守氨基酸性等的保守氨基酸第三
25、節(jié)第三節(jié) 蛋白質(zhì)的構(gòu)造預(yù)測蛋白質(zhì)的構(gòu)造預(yù)測 1. 蛋白質(zhì)序列的來源蛋白質(zhì)序列的來源 直接測序獲得的直接測序獲得的 翻譯編碼的翻譯編碼的DNA或或cDNA序列序列 數(shù)據(jù)庫中搜索到的數(shù)據(jù)庫中搜索到的 蛋白質(zhì)序列的格式蛋白質(zhì)序列的格式 FASTA格式格式 SWISS-PROT格式格式 PDB格式格式2. 理化特性分析基于一級構(gòu)造的預(yù)測理化特性分析基于一級構(gòu)造的預(yù)測 理化特性分析理化特性分析 相對分子量、氨基酸組成、等電點(diǎn)、酶切特性、相對分子量、氨基酸組成、等電點(diǎn)、酶切特性、疏水性等、親水性,及消光系數(shù)等疏水性等、親水性,及消光系數(shù)等 常用工具常用工具 軟件軟件 Bioedit 網(wǎng)絡(luò)工具網(wǎng)絡(luò)工具 Pr
26、otP/tools/protparam.html Compute PI/tools/pi_tool.html3. 蛋白質(zhì)的鑒定蛋白質(zhì)的鑒定 蛋白質(zhì)的鑒定蛋白質(zhì)的鑒定 確定蛋白質(zhì)的根本性質(zhì)確定蛋白質(zhì)的根本性質(zhì) 常用工具常用工具 網(wǎng)絡(luò)工具網(wǎng)絡(luò)工具 多個(gè)多個(gè)/tools/4.數(shù)據(jù)庫搜索數(shù)據(jù)庫搜索 數(shù)據(jù)庫數(shù)據(jù)庫 序列序列 模體與構(gòu)造域模體與構(gòu)造域 構(gòu)造構(gòu)造 分類分類 運(yùn)用的程序運(yùn)用的程序 Blast PSI-Blast Fasta ScanProsite等等5. 二級構(gòu)造預(yù)測 預(yù)測蛋白質(zhì)二級構(gòu)造的算法大多以知三維構(gòu)造
27、和二級構(gòu)造的蛋白質(zhì)為根據(jù),用人工神經(jīng)網(wǎng)絡(luò)、遺傳算法等技術(shù)構(gòu)建預(yù)測方法。還有將多種預(yù)測方法結(jié)合起來,獲得“一致序列。 總的來說,二級構(gòu)造預(yù)測仍是未能完全處理的問題,普通對于螺旋預(yù)測精度較好,對折疊差些,而對除螺旋和折疊等之外的無規(guī)那么二級構(gòu)造那么效果很差。Jpredcompbio.dundee.ac.uk/www-jpred/index.htmlHNNnpsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_nn.htmlSOPMAnpsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_so
28、pma.html帶比對的自優(yōu)化預(yù)測方法,將幾種獨(dú)立二級構(gòu)造預(yù)測方法聚集成帶比對的自優(yōu)化預(yù)測方法,將幾種獨(dú)立二級構(gòu)造預(yù)測方法聚集成“一致預(yù)測結(jié)果,采用的二級構(gòu)造預(yù)測方法包括一致預(yù)測結(jié)果,采用的二級構(gòu)造預(yù)測方法包括GOR方法、方法、Levin同源預(yù)測方法、雙重預(yù)測方法、同源預(yù)測方法、雙重預(yù)測方法、PHD方法和方法和SOPMA方法。方法。多種方法的綜合運(yùn)用平均效果比單個(gè)方法更好。多種方法的綜合運(yùn)用平均效果比單個(gè)方法更好。6. 幾種重要構(gòu)造分析幾種重要構(gòu)造分析6. 1 疏水性分析疏水性分析為二級構(gòu)造預(yù)測提供參考為二級構(gòu)造預(yù)測提供參考為構(gòu)造域及功能域的劃分提供根據(jù)為構(gòu)造域及功能域的劃分提供根據(jù)常用工具常
29、用工具P/tools/protscale.htmlProtScale能計(jì)算超越能計(jì)算超越50種蛋白質(zhì)的特性。僅種蛋白質(zhì)的特性。僅一項(xiàng)需求額外設(shè)定的參數(shù)是輸入框的寬度,該參一項(xiàng)需求額外設(shè)定的參數(shù)是輸入框的寬度,該參數(shù)將指示系統(tǒng)每次運(yùn)轉(zhuǎn)計(jì)算和顯示的殘基數(shù),其數(shù)將指示系統(tǒng)每次運(yùn)轉(zhuǎn)計(jì)算和顯示的殘基數(shù),其缺省值為缺省值為9。假設(shè)想思索跨膜螺旋特性,該參數(shù)。假設(shè)想思索跨膜螺旋特性,該參數(shù)設(shè)置應(yīng)為設(shè)置應(yīng)為20,由于一個(gè)跨膜螺旋通常有,由于一個(gè)跨膜螺旋通常有20個(gè)氨個(gè)氨基酸長度基酸長度6.2 6.2 信號肽的識別信號肽的識別 信號肽的識別信號肽的識別 地址標(biāo)簽信號肽將
30、蛋白質(zhì)導(dǎo)向細(xì)胞的正確位置,地址標(biāo)簽信號肽將蛋白質(zhì)導(dǎo)向細(xì)胞的正確位置,并使其越過細(xì)胞器膜并使其越過細(xì)胞器膜 是新合成的蛋白質(zhì)的一部分,位于蛋白質(zhì)的一端是新合成的蛋白質(zhì)的一部分,位于蛋白質(zhì)的一端 信號肽分析有助于蛋白質(zhì)功能域的劃分及蛋白質(zhì)信號肽分析有助于蛋白質(zhì)功能域的劃分及蛋白質(zhì)的細(xì)胞定位的細(xì)胞定位 常用工具常用工具 SignaIPcbs.dtu.dk/services/SignalP/ 經(jīng)過神經(jīng)網(wǎng)絡(luò)方法的組合經(jīng)過神經(jīng)網(wǎng)絡(luò)方法的組合 預(yù)測信號肽的位置及相應(yīng)切點(diǎn)預(yù)測信號肽的位置及相應(yīng)切點(diǎn)6.3 6.3 跨膜構(gòu)造分析跨膜構(gòu)造分析n 跨膜構(gòu)造分析跨膜構(gòu)造分析n 跨膜構(gòu)造在蛋白質(zhì)構(gòu)造中普通序列類似性不大,
31、但跨膜構(gòu)造在蛋白質(zhì)構(gòu)造中普通序列類似性不大,但構(gòu)造極其類似。構(gòu)造極其類似。n 跨膜構(gòu)造可分為跨膜構(gòu)造可分為6 6種類型種類型n 跨膜構(gòu)造預(yù)測對認(rèn)識蛋白質(zhì)構(gòu)造及功能具有重要意跨膜構(gòu)造預(yù)測對認(rèn)識蛋白質(zhì)構(gòu)造及功能具有重要意義義n 預(yù)測工具預(yù)測工具n 依賴于一系列知跨膜螺旋特性的研討結(jié)果。最簡單依賴于一系列知跨膜螺旋特性的研討結(jié)果。最簡單的方法是經(jīng)過查找包含有的方法是經(jīng)過查找包含有2020個(gè)疏水殘基的區(qū)段,復(fù)個(gè)疏水殘基的區(qū)段,復(fù)雜的算法不僅可以預(yù)測跨膜螺旋的位置,還能確定雜的算法不僅可以預(yù)測跨膜螺旋的位置,還能確定其在膜上的方向,預(yù)測準(zhǔn)確率在其在膜上的方向,預(yù)測準(zhǔn)確率在808095%95%左右。左右。
32、n TmpredTmpredTMpred - Prediction of Transmembrane TMpred - Prediction of Transmembrane Regions and OrientationRegions and O/software/TMPRED_form.html /software/TMPRED_form.html 6.4 卷曲螺旋預(yù)測 卷曲螺旋卷曲螺旋 控制蛋白質(zhì)寡聚化的元件,存在于轉(zhuǎn)錄因控制蛋白質(zhì)寡聚化的元件,存在于轉(zhuǎn)錄因子、蛋白交融多肽等子、蛋白交融多肽等 一種很簡單的三級構(gòu)造,
33、容易預(yù)測一種很簡單的三級構(gòu)造,容易預(yù)測 常用工具常用工具 COILS - Prediction of Coiled Coil Regions in P/software/COILS_form.html6.5 糖基化、磷酸化位點(diǎn)預(yù)測 糖基化和磷酸化位點(diǎn) 糖基化位點(diǎn) 磷酸化位點(diǎn) 常用工具 CBS Prediction Servers cbs.dtu.dk/services/7. 三級構(gòu)造預(yù)測三級構(gòu)造預(yù)測 三級構(gòu)造預(yù)測三級構(gòu)造預(yù)測 蛋白質(zhì)的高級構(gòu)造決議蛋白質(zhì)的功能。要了蛋白質(zhì)的高級構(gòu)造決議蛋白質(zhì)的功能。要了解功能,構(gòu)造是根底,三級構(gòu)造預(yù)測有助于解功能,構(gòu)造是根
34、底,三級構(gòu)造預(yù)測有助于研討蛋白質(zhì)的生物活性中心研討蛋白質(zhì)的生物活性中心 三級構(gòu)造預(yù)測的方法三級構(gòu)造預(yù)測的方法 同源建模同源建模 先在蛋白質(zhì)構(gòu)造數(shù)據(jù)庫中尋覓未知構(gòu)造蛋白先在蛋白質(zhì)構(gòu)造數(shù)據(jù)庫中尋覓未知構(gòu)造蛋白的同源同伴,再利用一定計(jì)算方法把同源蛋的同源同伴,再利用一定計(jì)算方法把同源蛋白的構(gòu)造優(yōu)化構(gòu)建出預(yù)測的結(jié)果。白的構(gòu)造優(yōu)化構(gòu)建出預(yù)測的結(jié)果。 根本過程:目的序列與模板序列的匹配,確根本過程:目的序列與模板序列的匹配,確定蛋白質(zhì)構(gòu)造保守區(qū)及其構(gòu)造,目的構(gòu)造建定蛋白質(zhì)構(gòu)造保守區(qū)及其構(gòu)造,目的構(gòu)造建模,目的構(gòu)造變異區(qū)建模,側(cè)鏈安裝與優(yōu)化,模,目的構(gòu)造變異區(qū)建模,側(cè)鏈安裝與優(yōu)化,模型優(yōu)化與評價(jià)模型優(yōu)化與評
35、價(jià)c1tehaC1hldaD1teha1GRoESD1teha2GRoES第四節(jié)第四節(jié) 蛋白質(zhì)功能預(yù)測蛋白質(zhì)功能預(yù)測1. 根據(jù)序列預(yù)測功能的普經(jīng)過程根據(jù)序列預(yù)測功能的普經(jīng)過程雖然蛋白質(zhì)的許多特性可直接從序列上分析獲得,如雖然蛋白質(zhì)的許多特性可直接從序列上分析獲得,如疏水性,跨膜螺旋疏水性,跨膜螺旋(transmenbrane helix)(transmenbrane helix)或前導(dǎo)序列或前導(dǎo)序列(leader sequence)(leader sequence)等??偟膩碚f,根據(jù)序列預(yù)測蛋白等??偟膩碚f,根據(jù)序列預(yù)測蛋白質(zhì)功能的獨(dú)一方法是經(jīng)過數(shù)據(jù)庫搜索,比較該蛋白能否質(zhì)功能的獨(dú)一方法是經(jīng)過
36、數(shù)據(jù)庫搜索,比較該蛋白能否與知功能的蛋白質(zhì)類似。與知功能的蛋白質(zhì)類似。比較未知蛋白序列與知蛋白質(zhì)序列的類似性;比較未知蛋白序列與知蛋白質(zhì)序列的類似性;查找未知蛋白中能否包含與特定蛋白質(zhì)家族或功能域查找未知蛋白中能否包含與特定蛋白質(zhì)家族或功能域有關(guān)的亞序列或保守區(qū)段。有關(guān)的亞序列或保守區(qū)段。根據(jù)序列預(yù)測蛋白質(zhì)功能的技術(shù)道路根據(jù)序列預(yù)測蛋白質(zhì)功能的技術(shù)道路2. 經(jīng)過比對數(shù)據(jù)庫類似序列確定功能經(jīng)過比對數(shù)據(jù)庫類似序列確定功能 具有類似序列的蛋白質(zhì)具有類似的功能。最可靠確實(shí)定蛋白質(zhì)功能的方法是進(jìn)展數(shù)據(jù)庫的類似性搜索。一個(gè)顯著的匹配應(yīng)至少超越80個(gè)氨基酸的區(qū)段有25%的一樣序列。 普通戰(zhàn)略是先進(jìn)展BLAS
37、T檢索,如不能提供相關(guān)結(jié)果,再運(yùn)轉(zhuǎn)FASTA;如FASTA也不能得到有關(guān)蛋白質(zhì)功能的線索,可選用完全根據(jù)Smith-Waterman算法設(shè)計(jì)的搜索程序,例如BLITZ(ebi.ac.uk/searches/blitz.html)。BLITZ不做近似估計(jì)(BLAST和FASTA根據(jù)Smith-Waterman算法做近似估計(jì)),所以很花時(shí),但非常靈敏。通常BLITZ程序可以發(fā)現(xiàn)超越幾百個(gè)殘基但序列一樣比率低于2025%的匹配,這些匹配能夠到達(dá)顯著,但會被那些運(yùn)用近似估計(jì)的程序錯過。n選用計(jì)分矩陣選用計(jì)分矩陣(scoring matrix)(scoring matrix)非常關(guān)鍵非常關(guān)鍵n選用的矩陣必需與匹配程度相一致,例如,選用的矩陣必需與匹配程度相一致,例如,PAM250PAM250運(yùn)用于遠(yuǎn)間隔匹配運(yùn)用于遠(yuǎn)間隔匹配(25%(35%35%,并且具有很高的構(gòu)造,并且具有很高的構(gòu)造和功能類似性。和功能類似性。2. SCOP蛋白質(zhì)構(gòu)造分類n折疊子折疊子foldfold主要是構(gòu)造類似主要是構(gòu)造類似n假設(shè)蛋白質(zhì)在一樣的條件和一樣的拓?fù)潢P(guān)系下有一樣的二假設(shè)蛋白質(zhì)在一樣的條件和一樣的拓?fù)潢P(guān)系下有一樣的二級構(gòu)造,就以為是一樣的折疊子,有一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)作物種子買賣合同(蔬菜類)6篇
- 銷售業(yè)務(wù)外包合作協(xié)議
- 醫(yī)院信息保密承諾協(xié)議書
- 產(chǎn)品物流配送計(jì)劃書
- 智能電網(wǎng)改造合作協(xié)議
- 專業(yè)人力資源管理服務(wù)合同
- 招商代理委托協(xié)議書
- 2025年博爾塔拉道路貨運(yùn)輸從業(yè)資格證模擬考試題庫
- 小學(xué)英語試卷總體評價(jià)
- 高壓化成箔競爭策略分析報(bào)告
- 第一課+追求向上向善的道德【中職專用】中職思想政治《職業(yè)道德與法治》高效課堂(高教版2023·基礎(chǔ)模塊)
- 生豬屠宰獸醫(yī)衛(wèi)生檢驗(yàn)人員理論考試題庫及答案
- 教師的五重境界公開課教案教學(xué)設(shè)計(jì)課件案例試卷
- 尾礦庫安全檢查表
- 解除、終止勞動合同通知書范本
- 勞動定額定員標(biāo)準(zhǔn)化1(孫義敏)
- 深信服桌面云方案
- 2021年深圳實(shí)驗(yàn)學(xué)校初中部七年級入學(xué)分班考試數(shù)學(xué)試卷及答案解析
- ??怂箍等鴺?biāo)測量儀的使用課件
- 高血壓臨床路徑
- 鋁的陽極氧化和著色
評論
0/150
提交評論