版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
蛋白質(zhì)的序列分析及結(jié)構(gòu)預(yù)測1可編輯課件PPTDNAsequenceProteinsequenceProteinstructureProteinfunction2可編輯課件PPT一、蛋白質(zhì)數(shù)據(jù)庫介紹二、蛋白質(zhì)序列分析三、蛋白質(zhì)結(jié)構(gòu)預(yù)測四、應(yīng)用
分子設(shè)計3可編輯課件PPT一、蛋白質(zhì)數(shù)據(jù)庫介紹蛋白質(zhì)的結(jié)構(gòu)主要分為四級,一級結(jié)構(gòu)、二級結(jié)構(gòu)、三級結(jié)構(gòu)以及四級結(jié)構(gòu)。依據(jù)這種結(jié)構(gòu)層次,將蛋白質(zhì)數(shù)據(jù)庫分為:1.蛋白質(zhì)序列數(shù)據(jù)庫:如PIR、SWISS-PROT、NCBI,這些數(shù)據(jù)庫的數(shù)據(jù)主要以蛋白質(zhì)的序列為主,并賦予相應(yīng)的注釋;2.蛋白質(zhì)模體及結(jié)構(gòu)域數(shù)據(jù)庫:如PROSITE、Pfam,這些數(shù)據(jù)庫主要收集了蛋白質(zhì)的保守結(jié)構(gòu)域和功能域的特征序列;3.蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫:如PDB等,這些數(shù)據(jù)庫主要以蛋白質(zhì)的結(jié)構(gòu)測量數(shù)據(jù)為主;4.蛋白質(zhì)分類數(shù)據(jù)庫:如SCOP、CATH、FSSP等,這其中有以序列比較為基礎(chǔ)的序列分類數(shù)據(jù)庫以及以結(jié)構(gòu)比較為基礎(chǔ)的結(jié)構(gòu)分類數(shù)據(jù)庫之分。4可編輯課件PPT蛋白質(zhì)數(shù)據(jù)庫特征:
這些數(shù)據(jù)庫種類有差別,但內(nèi)部是相互聯(lián)系的.
每個數(shù)據(jù)庫都有指針指向其他數(shù)據(jù)庫,而且數(shù)據(jù)庫之間的序列以及相應(yīng)的結(jié)構(gòu)是共享的,同一種蛋白質(zhì)依次會出現(xiàn)在不同的數(shù)據(jù)庫.這樣的數(shù)據(jù)溝通有助于更深層地挖掘蛋白質(zhì)的內(nèi)在生物信息,這些數(shù)據(jù)庫是融序列信息的索取、處理、存儲、輸出于一身的。5可編輯課件PPT1.蛋白質(zhì)序列數(shù)據(jù)庫(1)PIR(proteininformationresource,PIR)和PSD(proteinsequencedatabase,PSD)
/pirwww
PIR-PSD是一個綜合全面的、非冗余的、專業(yè)注釋的、分類完整的蛋白質(zhì)序列數(shù)據(jù)庫。PIR-PSD的序列來自于將GenBank/EMBL/DDBJ三大數(shù)據(jù)庫的編碼序列的翻譯而成的蛋白質(zhì)序列、發(fā)表的文獻中的序列和用戶直接提交的序列。(2)SWISS-PROT/TrEMBL數(shù)據(jù)庫
/swissprot數(shù)據(jù)庫由蛋白質(zhì)序列條目構(gòu)成,每個條目包含蛋白質(zhì)序列、引用文獻信息、分類學(xué)信息、注釋等,注釋中包括蛋白質(zhì)的功能、轉(zhuǎn)錄后修飾位點、特殊位點和區(qū)域、二級結(jié)構(gòu)、四級結(jié)構(gòu)、與其他序列的相似性、序列殘缺與疾病的關(guān)系、序列變異體等信息。6可編輯課件PPT2.模體以及結(jié)構(gòu)域數(shù)據(jù)庫模體數(shù)據(jù)庫(1)PROSITE蛋白質(zhì)家族及結(jié)構(gòu)域數(shù)據(jù)庫(/prosite/)PROSITE數(shù)據(jù)庫收集了有顯著生物學(xué)意義的蛋白質(zhì)位點序列、蛋白質(zhì)特征序列譜庫以及序列模型,并能依據(jù)這些特征屬性快速可靠地鑒定出一個未知功能蛋白質(zhì)序列屬于哪個蛋白質(zhì)家族,即使在蛋白質(zhì)序列相似性很低的情況下,也可以通過搜索隱含的功能結(jié)構(gòu)模體(motif)來鑒定,因此是有效的序列分析數(shù)據(jù)庫。PROSITE中涉及的序列模式包括酶的催化位點、配體結(jié)合位點、金屬離子結(jié)合位點、二硫鍵、小分子或者蛋白質(zhì)結(jié)合區(qū)域等,此外PROSITE還包括由多序列比對構(gòu)建的序列表譜(profile),能更敏感地發(fā)現(xiàn)序列中的信息。7可編輯課件PPTPROSITE同時數(shù)據(jù)庫提供了序列分析工具:①ScanProsite
是用于搜索所提交的序列數(shù)據(jù)是否包含PROSITE數(shù)據(jù)庫中的序列模式或者SWISS-PROT數(shù)據(jù)庫中已提交的序列模式;②MotifScan
用于查找未知序列中所有可能的已知結(jié)構(gòu)組件,數(shù)據(jù)庫包括PROSITE序列表譜、PROSITE模式、Pfam收集的隱馬爾可夫模式(HMM)。8可編輯課件PPT(2)PRINTSFingerprintDatabase
www.bioinf.man.ac.uk/dbrowser/PRINTS/
這個數(shù)據(jù)庫包含1500個蛋白質(zhì)指紋圖譜,編碼9136個單一模體。(3)BLOCKS(
)BLOCKS是通過一些高度保守的蛋白質(zhì)區(qū)域比對出來的無空位的片段。模體數(shù)據(jù)庫9可編輯課件PPT蛋白質(zhì)結(jié)構(gòu)域數(shù)據(jù)庫
(1)蛋白質(zhì)家族序列比對以及隱馬爾可夫模式數(shù)據(jù)庫Pfam(proteinfamiliesdatabaseofalignmentsandHMMs)Pfam
是蛋白質(zhì)家族序列比對以及隱馬爾可夫模式數(shù)據(jù)庫,其網(wǎng)址是:www.sanger.ac.uk/Software/Pfam/index.shtml。(2)蛋白質(zhì)結(jié)構(gòu)域數(shù)據(jù)庫ProDom
http://prodes.toulouse.inra.fr/prodom/doc/prodom.html(3)SMARTSMART是一個簡單的結(jié)構(gòu)研究工具,可對可轉(zhuǎn)移的遺傳因子進行鑒定和注解,以及分析結(jié)構(gòu)域結(jié)構(gòu),可以檢測出500多個參與信號傳導(dǎo)、胞外和染色體相關(guān)蛋白質(zhì)的結(jié)構(gòu)域家族,對這些結(jié)構(gòu)域又在系統(tǒng)進化樹分布、功能分類、三級結(jié)構(gòu)和重要的功能殘基方面做了注解。
http://smart.embl-heidelberg.de/10可編輯課件PPT3.蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫PDB(proteindatabank,PDB)
/pdb/PDB包括了蛋白質(zhì)、核酸、蛋白質(zhì)-核酸復(fù)合體以及病毒等生物大分子結(jié)構(gòu)數(shù)據(jù),主要是蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù),這些數(shù)據(jù)來源于幾乎全世界所有從事生物大分子結(jié)構(gòu)研究的研究機構(gòu),并由RCSB維護和注釋。11可編輯課件PPT4.蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(1)CATH數(shù)據(jù)庫
www.biochem.ucl.ac.uk/bsm/cathnew/index.html(2)SCOP蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(structuralclassificationofproteindatabase,SCOP)
scop.mrclmb.cam.ac.uk/scop/index.html12可編輯課件PPT二、蛋白質(zhì)的序列分析1.蛋白質(zhì)序列信息的獲取
2.蛋白質(zhì)序列分析
13可編輯課件PPT1.蛋白質(zhì)序列信息的獲?。?)直接測序(2)翻譯編碼的DNA序列ORFFinder(3)在數(shù)據(jù)庫中搜索運用ID號、入口號、條目號等搜索。運用關(guān)鍵詞搜索其他方式搜索。如可以通過引用序列的文獻、序列的作者、序列提交的日期等進行搜索。14可編輯課件PPT(1)直接測序e.g.ProteinSequencingandIdentificationbyTandem
MassSpectrometry,即用串聯(lián)質(zhì)譜儀測序1.蛋白質(zhì)序列信息的獲取15可編輯課件PPT串聯(lián)質(zhì)譜及其作用兩個或更多的質(zhì)譜連接在一起,稱為串聯(lián)質(zhì)譜。最簡單的串聯(lián)質(zhì)譜(MS|MS)由兩個質(zhì)譜串聯(lián)而成,其中第一個質(zhì)量分析器(MS1)將離子預(yù)分離或加能量修飾,由第二級質(zhì)量分析器(MS2)分析結(jié)果。
16可編輯課件PPT
串聯(lián)質(zhì)譜儀的組合方式:(1)磁分析器-靜電分析器-磁分析器
(2)靜電分析器-磁分析器-靜電分析器
(3)三重四極濾質(zhì)器質(zhì)譜儀
(4)混合式串聯(lián)質(zhì)譜儀,如MA-ESA-Q-Q。實現(xiàn)串聯(lián)質(zhì)譜有空間串聯(lián)和時間串聯(lián)兩種方式。
17可編輯課件PPT
優(yōu)點:可以避免底物分子產(chǎn)生的干擾,大大降低背景噪音。其次,可使分子離子通過與反應(yīng)氣的碰撞來產(chǎn)生斷裂。因此能提供更多的結(jié)構(gòu)信息,所以串聯(lián)質(zhì)譜特別適合于復(fù)雜組分體系且干擾嚴(yán)重的樣品中低含量組分分析測定,具有比GC-MS和LC-MS等一級質(zhì)譜更高的選擇性和靈敏度。18可編輯課件PPTMassesofAminoAcidResidues19可編輯課件PPTProteinbackboneH...-HN-CH-CO-NH-CH-CO-NH-CH-CO-…OHRi-1RiRi+1AAresiduei-1AAresidueiAAresiduei+1N-terminusC-terminus20可編輯課件PPTBreakingProteinintoPeptidesandPeptidesintoFragmentIonsProteases,e.g.trypsin(胰蛋白酶),breakproteinintopeptides.ATandemMassSpectrometer(串聯(lián)式質(zhì)譜儀)furtherbreaksthepeptidesdownintofragmentionsandmeasuresthemassofeachpiece.Generalforsequencing21可編輯課件PPTBreakingProteinintoPeptidesandPeptidesintoFragmentIonsMassSpectrometeracceleratesthefragmentedions;heavierionsaccelerateslowerthanlighterones.MassSpectrometermeasuremass/chargeratioofanion.Generalforsequencing22可編輯課件PPTPeptideFragmentationPeptidestendtofragmentalongthebackbone.FragmentscanalsolooseneutralchemicalgroupslikeNH3andH2O.H...-HN-CH-CO
...
NH-CH-CO-NH-CH-CO-…OHRi-1RiRi+1H+PrefixFragmentSuffixFragmentCollisionInducedDissociation23可編輯課件PPTN-andC-terminalPeptidesGFPNAGFPNAGFPNAGFPNAGFPNAN-terminalpeptidesC-terminalpeptides24可編輯課件PPTTerminalpeptidesandiontypesGFPNPeptideMass(D)57+97+147+114=415H2OPeptideMass(D)57+97+147+114–18=397GFPNH2Owithout25可編輯課件PPTN-andC-terminalPeptidesGFPNAGFPNAGFPNAGFPNAGFPNAN-terminalpeptidesC-terminalpeptides415
486
30115457
7118533242926可編輯課件PPTN-andC-terminalPeptidesN-terminalpeptidesC-terminalpeptides415
486
30115457
7118533242927可編輯課件PPTPeptideFragmentationy3b2y2y1b3a2a3
HONH3+||
R1OR2OR3
OR4||||||||||H--NCCNCCNCCNC--COOH|||||||HHHHHHHb2-H2Oy3-H2Ob3-NH3y2-NH328可編輯課件PPTMassSpectraGVDLKmass057Da=‘G’
99Da=‘V’LK
DVGThepeaksinthemassspectrum:Prefix
Fragmentswithneutrallosses(-H2O,-NH3)Noiseandmissingpeaks.andSuffixFragments.DH2O29可編輯課件PPTProteinIdentificationwithMS/MSGVDLKmass0Intensitymass0MS/MSPeptideIdentification:30可編輯課件PPTTandemMass-Spectrometry31可編輯課件PPTBreakingProteinsintoPeptidespeptidesMPSER……GTDIMRPAKID……HPLCToMS/MSMPSERGTDIMRPAKIDprotein32可編輯課件PPTMassSpectrometryMatrix-AssistedLaserDesorption/Ionization(MALDI)基質(zhì)輔助激光解吸質(zhì)譜
33可編輯課件PPT基質(zhì)輔助激光解吸飛行時間質(zhì)譜儀
MALDI-TOF-MSMALDI-TOF-MS是近年來發(fā)展起來的一種軟電離新型有機質(zhì)譜。近年來已成為檢測和鑒定多肽、蛋白質(zhì)、多糖、核苷酸、糖蛋白、高聚物以及多種合成聚合物的強有力工具。原理:當(dāng)用一定強度的激光照射樣品與基質(zhì)形成的共結(jié)晶薄膜,基質(zhì)從激光中吸收能量,基質(zhì)-樣品之間發(fā)生電荷轉(zhuǎn)移使得樣品分子電離,電離的樣品在電場作用下加速飛過飛行管道,根據(jù)到達檢測器的飛行時間不同而被檢測,即測定離子的質(zhì)量電荷之比與離子的飛行時間成正比來檢測離子。MALDI-TOF-MS的中心技術(shù)就是依據(jù)樣品的質(zhì)荷比(m/z)的不同來進行檢測,并測得樣品分子的分子量。34可編輯課件PPTTandemMassSpectrometryScan1708LCScan1707MSMS/MSIonSourceMS-1collisioncellMS-235可編輯課件PPT多肽片段指紋圖譜(PFF)
步驟:用酶專一性酶解蛋白質(zhì),經(jīng)過分離,得到的肽段在質(zhì)譜中被選擇和破碎后得到MS/MS譜圖,與數(shù)據(jù)庫中的譜圖比較進行鑒定
代表方法:
LC-ESI-MS/MS2D-LC-MS/MS(shotgun)36可編輯課件PPT1.蛋白質(zhì)序列信息的獲?。?)翻譯編碼的DNA序列
e.g.用“ORFFinder”程序找到DNA的開放閱讀框。網(wǎng)址:/gorf/gorf.html37可編輯課件PPT38可編輯課件PPT39可編輯課件PPT1.蛋白質(zhì)序列信息的獲取(3)在數(shù)據(jù)庫中搜索e.g.PIR-PSDdatabase:
/pirwww
SWISS-PROT/TrEMBLdatabase
/swissprot40可編輯課件PPT目前大部分蛋白質(zhì)序列是通過DNA人工翻譯過來的,實際上很少有人能獲得真正的蛋白質(zhì),因而實驗證據(jù)就很難直接獲得,因此對蛋白質(zhì)序列初始分析是很有價值的。比如,通過一些序列分析工具進行蛋白質(zhì)理化特性的預(yù)測、修飾位點的預(yù)測等。2.蛋白質(zhì)序列分析41可編輯課件PPT1.蛋白質(zhì)序列的基本性質(zhì)分析理化性質(zhì)分析,疏水性分析,跨膜區(qū)分析,信號肽預(yù)測,Coil區(qū)分析,亞細胞定位2.序列數(shù)據(jù)庫搜索
相似性搜索,模體的搜索3.結(jié)構(gòu)域定位4.空間結(jié)構(gòu)預(yù)測二級結(jié)構(gòu)及三級結(jié)構(gòu)預(yù)測,結(jié)構(gòu)預(yù)測方法評價
蛋白質(zhì)序列分析主要內(nèi)容:42可編輯課件PPT1.蛋白質(zhì)序列的基本性質(zhì)分析(1)理化性質(zhì)分析分子質(zhì)量、分子式、理論等電點、氨基酸組成、消光系數(shù)、穩(wěn)定性等理化特性。例,利用ProtParam工具/tools/protparam.html
43可編輯課件PPT理化指標(biāo)CLCLAP分子式C1615H2420N428O535S16C1211H1951N319O364S3分子量36904.426899.9理論等電點pI4.476.20總原子數(shù)50143848消光系數(shù)(280nm)754555960半衰期(小時)哺乳動物,體外3030酵母,體內(nèi)>20>20大腸桿菌,體內(nèi)>10>10不穩(wěn)定性指數(shù)31.7229.59脂肪族指數(shù)63.73105.18總體親水性-0.5420.109CL和CLAP的理化性質(zhì)預(yù)測結(jié)果
CL:組織蛋白酶L
CLAP:組織蛋白酶L相關(guān)蛋白
44可編輯課件PPT(2)疏水性分析
氨基酸側(cè)鏈的疏水性用從各氨基酸減去甘氨酸疏水性之值來表示,蛋白質(zhì)的疏水性在保持蛋白質(zhì)三級結(jié)構(gòu)的形成和穩(wěn)定中起著重要作用。e.g.利用ProtScale工具/protscale/利用BioEdit軟件分析45可編輯課件PPT海參溶菌酶親水性/疏水性分析Score>0,表示疏水性;Score<0,表示親水性46可編輯課件PPT(3)跨膜區(qū)分析
蛋白質(zhì)含有跨膜區(qū)提示它可能作為膜受體起作用,也可能是定位在膜上的錨定蛋白或離子通道蛋白。例,使用TMHMMServerv.2.0在線分析http://www.cbs.dtu.dk/services/TMHMM/47可編輯課件PPT鋁激活蘋果酸的轉(zhuǎn)運蛋白(TaALMT1)跨膜結(jié)構(gòu)分析48可編輯課件PPT(4)信號肽預(yù)測信號肽:指分泌蛋白表達時氨基端的20余個氨基酸,將引導(dǎo)該蛋白質(zhì)最終分泌至細胞外,但這段信號肽會被信號肽酶切掉,所以成熟的分泌蛋白是不含這段信號肽的。用于指導(dǎo)蛋白質(zhì)的跨膜轉(zhuǎn)移(定位)的N末端的氨基酸序列,一般由15-30個氨基酸組成。使用SignalP在線分析http://www.cbs.dtu.dk/services/SignalP/49可編輯課件PPT海參溶菌酶信號肽預(yù)測Conclusion:cleavagesitebetweenpos.20and21:ASG-QV50可編輯課件PPT(5)Coil區(qū)分析蛋白質(zhì)中由2-7條α螺旋鏈相互纏繞形成類似麻花狀結(jié)構(gòu)的總稱;主要存在形式是2-5條相互纏繞形成的平行或反平行同寡聚體或異寡聚體;是控制蛋白質(zhì)寡聚化的元件,轉(zhuǎn)錄因子、骨架蛋白、動力蛋白、膜蛋白、酶等;七肽重復(fù)區(qū)。e.g.使用COILS服務(wù)器分析http:///software/COILS_form.html51可編輯課件PPT(6)亞細胞定位根據(jù)氨基酸組成可以進行亞細胞定位不同細胞器多具不同的理化環(huán)境,它會根據(jù)蛋白質(zhì)的結(jié)構(gòu)及表面理化特征選擇性容納蛋白質(zhì);蛋白質(zhì)表面直接暴露于細胞器環(huán)境中,它由序列折疊過程決定,而后者取決于氨基酸組成。亞細胞定位的步驟在線分析工具e.g.使用TargetPhttp://www.cbs.dtu.dk/services/TargetP/52可編輯課件PPT組織蛋白酶CL和相關(guān)蛋白CLAP的亞細胞定位蛋白質(zhì)各亞細胞位點出現(xiàn)可能性(%)細胞質(zhì)內(nèi)質(zhì)網(wǎng)線粒體細胞核空泡分泌性小囊泡高爾基體質(zhì)膜細胞支架CL34.834.88.78.74.34.34.3--CLAP26.14.313.013.04.317.44.313.04.3結(jié)果證明,CL和CLAP出現(xiàn)幾率最高的位點都為胞質(zhì),說明它們都為胞漿內(nèi)蛋白,這也為今年來在溶酶體內(nèi)外都發(fā)現(xiàn)組織蛋白酶活性提供了證據(jù)。53可編輯課件PPT(1)相似性搜索(或同源搜索)①一個新序列與序列數(shù)據(jù)庫中的序列比對,從而找到同源或者相似序列。②常用程序是BLASTp。2.序列數(shù)據(jù)庫搜索54可編輯課件PPT55可編輯課件PPT(2)模體(motif)的搜索這是另一種序列搜索方法,其目的是尋找蛋白質(zhì)中結(jié)構(gòu)域或者功能域。這個方法不是給每個位置的氨基酸打分,然后得到一個相似程度,而是直接描述關(guān)鍵的幾個保守殘基,同時忽略其他位置的氨基酸多態(tài)性,這些保守的序列有時會稱為“標(biāo)志”(signature),就是所謂的模式序列(pattern)。56可編輯課件PPTMotif搜索即模體搜索,是序列中局部的保守區(qū)域,或是一組序列中共有的一小段序列模式。使用PROSITE數(shù)據(jù)庫進行motif搜索
/prosite模式序列常表示為:
[AG]-x-V-x(2)-x-{YW}
[
]showseitheraminoacid
x
isanyaminoacid
x(2)anyaminoacidinthenext2positions
{
}showsanyaminoacidexceptthese57可編輯課件PPT模體的搜索舉例:有序列表示為:H-[FW]-x-[LIVM]-x-G-x(5)-[LV]-H-x(3)-[DE]這是描述一個DNA結(jié)合蛋白質(zhì)家族的,可以理解為組氨酸,接著是苯丙氨酸或者色氨酸,緊接一個氨基酸x,然后可以是亮氨酸、異亮氨酸、纈氨酸、或者甲硫氨酸??,這樣一段序列由于處于活性區(qū)域或者蛋白質(zhì)的重要結(jié)構(gòu)區(qū),所以特別保守,因此也是序列搜索的目標(biāo)之一。58可編輯課件PPT3.結(jié)構(gòu)域定位通過將序列在數(shù)據(jù)庫中搜索,可以了解到序列的一些信息,接下來就可以進行結(jié)構(gòu)域的定位,這樣就對以后的結(jié)構(gòu)預(yù)測有了一個比較清醒的認識。如果蛋白質(zhì)序列的長度大于500個氨基酸,就可以根據(jù)搜索的情況(比如按相似性高低或者結(jié)構(gòu)域多少等)將蛋白質(zhì)分割成多個不連續(xù)的區(qū)域,最好將這一段一段的序列分別鑒別。
59可編輯課件PPT什么是結(jié)構(gòu)域?結(jié)構(gòu)域是在二級結(jié)構(gòu)或超二級結(jié)構(gòu)的基礎(chǔ)上形成三級結(jié)構(gòu)的局部折疊區(qū),一條多肽鏈在這個域范圍內(nèi)來回折疊,但相鄰的域常被一個或兩個多肽片段連結(jié)。通常由50-300個氨基酸殘基組成,其特點是在三維空間可以明顯區(qū)分和相對獨立,并且具有一定的生物功能如結(jié)合小分子。模體(motif)是結(jié)構(gòu)域的亞單位,通常由2~3二級結(jié)構(gòu)單位組成,一般為α螺旋、β折疊和環(huán)(loop)。結(jié)構(gòu)域定位60可編輯課件PPT二聚體蛋白結(jié)構(gòu)域61可編輯課件PPT結(jié)構(gòu)域和功能域?qū)δ切┹^小的球狀蛋白質(zhì)分子或亞基來說,結(jié)構(gòu)域和三級結(jié)構(gòu)是一個意思,也就是說這些蛋白質(zhì)或亞基是單結(jié)構(gòu)域的,如紅氧還蛋白等;較大的蛋白質(zhì)分子或亞基其三級結(jié)構(gòu)一般含有兩個以上的結(jié)構(gòu)域,即多結(jié)構(gòu)域的,其間以柔性的鉸鏈(hinge)相連,以便相對運動。結(jié)構(gòu)域有時也指功能域。功能域是蛋白質(zhì)分子中能獨立存在的功能單位,它可以是一個結(jié)構(gòu)域,也可以是由兩個或兩個以上結(jié)構(gòu)域組成。結(jié)構(gòu)域定位62可編輯課件PPT結(jié)構(gòu)域定位結(jié)構(gòu)域是蛋白序列的功能、結(jié)構(gòu)和進化單元分析方法:序列比對單條蛋白質(zhì)序列可以包含一個或多個結(jié)構(gòu)域63可編輯課件PPT基本類型:
64α-螺旋型
全β-折疊型
α/β型α+β型64可編輯課件PPT結(jié)構(gòu)域定位分析一般流程:(1)探測序列與其他全序列之間有無同源性.如果有,那么這是該段序列為結(jié)構(gòu)域的很好證據(jù),然后進行結(jié)構(gòu)數(shù)據(jù)庫的搜索,也可以搜索注釋好的數(shù)據(jù)庫,從而得到一些有關(guān)結(jié)構(gòu)域的說明。
(2)分析低復(fù)雜度的區(qū)域。在多結(jié)構(gòu)域的蛋白質(zhì)中,這些低復(fù)雜度序列常常間隔結(jié)構(gòu)域,長的重復(fù)序列特別是pro、glu、ser、thr等常常是連接序列,也是很好的結(jié)構(gòu)域剪接位置。
結(jié)構(gòu)域定位65可編輯課件PPT結(jié)構(gòu)域定位分析一般流程:(3)跨膜區(qū)域。由于跨膜結(jié)構(gòu)是一個非常典型的結(jié)構(gòu),這種結(jié)構(gòu)連續(xù)性較強,而且預(yù)測容易,準(zhǔn)確性也比較高,因此也是一個分割的區(qū)域,這樣就很容易區(qū)分胞外和胞內(nèi)區(qū)域。(4)卷曲螺旋結(jié)構(gòu)(coiled-coil)。這個結(jié)構(gòu)有時也可能是蛋白質(zhì)結(jié)構(gòu)域之間的間隔區(qū),可以在COIL網(wǎng)站上預(yù)測coiled-coil結(jié)構(gòu)。
結(jié)構(gòu)域定位66可編輯課件PPT結(jié)構(gòu)域定位分析一般流程:(5)二級結(jié)構(gòu)預(yù)測。這個方法常常用來預(yù)測一個結(jié)構(gòu)中包含的不同折疊子。例如,一個序列中的一部分可能會被預(yù)測成只有α-螺旋,而另一個部分可能會被預(yù)測成只含有β-折疊,這些都可能預(yù)示有域的結(jié)構(gòu)存在。(6)如果序列已被成功地分解成成形的結(jié)構(gòu)域,那么重復(fù)進行數(shù)據(jù)庫搜索并且進行獨立比對是很重要的.結(jié)構(gòu)域定位67可編輯課件PPT結(jié)構(gòu)域定位68可編輯課件PPT結(jié)構(gòu)域分析工具介于二級和三級結(jié)構(gòu)之間可以明顯區(qū)分但又相對獨立的折疊單元,每個結(jié)構(gòu)域自身形成緊實的三維結(jié)構(gòu),可以獨立存在或折疊,但結(jié)構(gòu)域與結(jié)構(gòu)域之間關(guān)系較為松散。通常由25-300個氨基酸殘基組成;全平行結(jié)構(gòu)域、反平行結(jié)構(gòu)域、α+β結(jié)構(gòu)域、α/β結(jié)構(gòu)域及其他折疊類型。利用SMART服務(wù)器進行結(jié)構(gòu)與分析http://smart.embl-heidelberg.de/69可編輯課件PPT結(jié)構(gòu)域定位分析舉例實例分析:海參溶菌酶序列和其它i型溶菌酶保守區(qū)域的比對結(jié)果:高度保守的2個活性位點(E34和S50)和特有的氨基酸保守序列MDVGSLSCG(P\Y)(Y\F)QIK70可編輯課件PPTi-型溶菌酶含有兩個結(jié)構(gòu)域71可編輯課件PPT模體搜索和結(jié)構(gòu)域定位舉例實例分析:海參i-型溶菌酶3D結(jié)構(gòu)模式圖72可編輯課件PPT4.蛋白質(zhì)空間結(jié)構(gòu)預(yù)測(1)蛋白質(zhì)二級結(jié)構(gòu)預(yù)測
蛋白質(zhì)二級結(jié)構(gòu)是蛋白質(zhì)分子中重要的組成“部件”,是研究蛋白質(zhì)氨基酸序列和三級結(jié)構(gòu)之間的橋梁。
基本的二級結(jié)構(gòu):α螺旋,β折疊,β轉(zhuǎn)角,無規(guī)則卷曲(coils)以及模體(motif)等蛋白質(zhì)局部結(jié)構(gòu)組件73可編輯課件PPT
蛋白質(zhì)的二級結(jié)構(gòu)預(yù)測的基本依據(jù)是每一段相鄰的氨基酸殘基具有形成一定二級結(jié)構(gòu)的傾向。二級結(jié)構(gòu)預(yù)測問題是模式分類問題。二級結(jié)構(gòu)預(yù)測的目標(biāo):判斷每一段中心的殘基是否處于
螺旋、
折疊、轉(zhuǎn)角(或其它狀態(tài))之一的二級結(jié)構(gòu)態(tài),即三態(tài)。蛋白質(zhì)二級結(jié)構(gòu)預(yù)測74可編輯課件PPT二級結(jié)構(gòu)的預(yù)測方法:基于統(tǒng)計和機器學(xué)習(xí)方法進行預(yù)測Chou-Fasman算法GOR算法多序列列線預(yù)測基于神經(jīng)網(wǎng)絡(luò)的序列預(yù)測基于已有知識的預(yù)測方法(knowledgebasedmethod)混合方法(hybridsystemmethod)蛋白質(zhì)二級結(jié)構(gòu)預(yù)測75可編輯課件PPT二級結(jié)構(gòu)中氨基酸出現(xiàn)頻率的影響:
氨基酸殘基在二級結(jié)構(gòu)元件中出現(xiàn)頻率的研究揭示,某些殘基如Glu、Met、Ala和Leu在α螺旋中出現(xiàn)的頻率比在其他二級結(jié)構(gòu)元件中高。相反,Gly和Pro在α螺旋中頻率很低。但它們在β轉(zhuǎn)角中很高。另一些殘基包括Val、Ile和芳香族氨基酸在β折疊片中頻率很高,而Asp、Glu和Pro在β折疊片中則很低。這表明各種殘基形成各種二級結(jié)構(gòu)的傾向性是不同的。蛋白質(zhì)二級結(jié)構(gòu)預(yù)測76可編輯課件PPT工具網(wǎng)站備注BCMSearchLauncher/包括了常見的蛋白質(zhì)結(jié)構(gòu)分析程序入口,一般分析可以以此服務(wù)器作為起點HNNhttp://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_nn.html基于神經(jīng)網(wǎng)絡(luò)的分析工具,含序列到結(jié)構(gòu)過程和結(jié)構(gòu)到結(jié)構(gòu)處理Jpredpbio.dundee.ac.uk/~www-jpred/submit.html基于Jnet神經(jīng)網(wǎng)絡(luò)的分析程序,并采用PSI-BLAST來構(gòu)建序列Profile進行預(yù)測,對于序列較短、結(jié)構(gòu)單一的蛋白預(yù)測較好nnPredict/~nomi/nnpredict.html預(yù)測蛋白質(zhì)序列中潛在的亮氨酸拉鏈結(jié)構(gòu)和卷曲螺旋NNSSPhttp://bioweb.pasteur.fr/seqanal/interfaces/nnssp-simple.html基于雙層前反饋神經(jīng)網(wǎng)絡(luò)為算法,還考慮到蛋白質(zhì)結(jié)構(gòu)分類信息PREDATORhttp://bioweb.pasteur.fr/seqanal/interfaces/predator-simple.html預(yù)測時考慮了氨基酸殘基間的氫鍵蛋白質(zhì)二級結(jié)構(gòu)分析工具77可編輯課件PPT工具網(wǎng)站備注PredictProtein/提供多項蛋白質(zhì)性質(zhì)分析,并有較好準(zhǔn)確性Profhttp://www.aber.ac.uk/~phiwww/prof/基于多重序列比對預(yù)測工具PSIpredhttp://bioinf.cs.ucl.ac.uk/psipred/psiform.html提供跨膜蛋白拓撲結(jié)構(gòu)預(yù)測和蛋白profile折疊結(jié)構(gòu)識別工具SOPMAhttp://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html可以比較各種分析方法得到的結(jié)果,也可輸出“一致性結(jié)果”SSPREDhttp://coot.embl.de/~fmilpetz/SSPRED/sspred.html基于數(shù)據(jù)庫搜索相似蛋白并構(gòu)建多重序列比對蛋白質(zhì)二級結(jié)構(gòu)分析工具(續(xù))78可編輯課件PPTPredictProtein/可以獲得功能預(yù)測、二級結(jié)構(gòu)、基序、二硫鍵結(jié)構(gòu)、結(jié)構(gòu)域等許多蛋白質(zhì)序列的結(jié)構(gòu)信息該方法的平均準(zhǔn)確率超過72%,最佳殘基預(yù)測準(zhǔn)確率達90%以上。因此,被視為蛋白質(zhì)二級結(jié)構(gòu)預(yù)測的標(biāo)準(zhǔn)需要注冊帳號用于學(xué)術(shù)研究蛋白質(zhì)二級結(jié)構(gòu)預(yù)測79可編輯課件PPTPredictProtein提交界面詳解提交郵件地址(必填)蛋白名稱(可選)分析方法80可編輯課件PPT1D序列預(yù)測PROFsec(默認)基于輪廓(profile)神經(jīng)網(wǎng)絡(luò)預(yù)測蛋白質(zhì)二級結(jié)構(gòu)PROFacc(默認)基于輪廓(profile)神經(jīng)網(wǎng)絡(luò)預(yù)測殘基溶劑可及性PHDhtm(默認)基于多序列比對中預(yù)測跨膜區(qū)位置和拓撲結(jié)構(gòu)ASP(默認)識別二級結(jié)構(gòu)中構(gòu)型變化的氨基酸COILS(默認)識別卷曲螺旋PROFtmb識別細菌中Beta桶結(jié)構(gòu)序列基序識別ProSite(默認)搜索序列中保守基序SEG(默認)過濾序列中低復(fù)雜區(qū)域PredictNLS(默認)基于實驗數(shù)據(jù)預(yù)測序列核定位區(qū)域二硫鍵識別DISULFIND(默認)識別序列中二硫鍵位置無序結(jié)構(gòu)識別PROFbval識別序列標(biāo)準(zhǔn)骨架的B-value值UCON預(yù)測蛋白質(zhì)中非3D結(jié)構(gòu)區(qū)域折疊子識別AGAPE基于折疊結(jié)構(gòu)識別遠源蛋白序列殘基接觸預(yù)測PROFcon預(yù)測單鏈中原子殘基接觸性結(jié)構(gòu)域預(yù)測ProDom(默認)基于序列同源性來預(yù)測蛋白質(zhì)結(jié)構(gòu)域CHOP(comingsoon)預(yù)測蛋白質(zhì)結(jié)構(gòu)域結(jié)構(gòu)表面識別ConSeq(comingsoon)預(yù)測蛋白質(zhì)結(jié)構(gòu)表面結(jié)構(gòu)功能關(guān)鍵殘基分析方法程序詳解81可編輯課件PPT跨膜螺旋預(yù)測(PHDhtm)專家選項Ambivalent序列識別(ASP)專家選項CHOP結(jié)構(gòu)域分析工具專家選項82可編輯課件PPT比對內(nèi)容從SWISS-PROT數(shù)據(jù)庫返回BLAST搜索結(jié)果MaxHom參數(shù)選項最低序列比對一致性空位間隔罰分空位延伸罰分比對矩陣最大擊中值83可編輯課件PPT選擇保存分析結(jié)果是否返回多序列比對結(jié)果HTML結(jié)果形式AGAPE結(jié)果PROF/PHD結(jié)果形式以下拉框中所指定的輸入格式將待測序列粘貼此提交欄84可編輯課件PPT服務(wù)器運行程序信息ProSite模體搜索結(jié)果低復(fù)雜區(qū)域過濾程序ProDom結(jié)構(gòu)域搜索結(jié)果二硫鍵識別結(jié)果PHD程序信息PHD預(yù)測結(jié)果PROF預(yù)測結(jié)果球狀蛋白預(yù)測結(jié)果Ambivalent序列識別結(jié)果PredictProtein分析結(jié)果85可編輯課件PPTPredictProtein分析結(jié)果跨膜區(qū)非跨膜區(qū)LoopHelixSheet86可編輯課件PPT(2)蛋白質(zhì)三維結(jié)構(gòu)預(yù)測方法特點工具同源建模法(Homology/Comparativemodelling)基于序列同源比對,對于序列相似度>30%的序列模擬比較有效,最常用的方法SWISS-MODEL,CPHmodels串線法/折疊識別法
(Threading/Foldrecognition)“穿”入已知的各種蛋白質(zhì)折疊骨架內(nèi),適于對蛋白質(zhì)核心結(jié)構(gòu)進行預(yù)測,計算量大THREADER,3D-PSSM從頭預(yù)測法(Abinitio/Denovomethods)基于分子動力學(xué),尋找能量最低的構(gòu)象,計算量大,只能做小分子預(yù)測HMMSTR/ROSSETA87可編輯課件PPT方法一:同源模建comparativemodeling
1.同源模建的基礎(chǔ)蛋白質(zhì)的三級結(jié)構(gòu)比一級結(jié)構(gòu)更保守。研究表明如果兩個蛋白質(zhì)的同源性達到50%,二者90%的Ca的RMS
小于1埃。
2.原理:序列高度相似的蛋白質(zhì)具有相似的三維結(jié)構(gòu)。同源蛋白質(zhì)之間具有保守的結(jié)構(gòu)內(nèi)核,差異僅存在分子表面的回折區(qū)。當(dāng)一個蛋白質(zhì)的序列與一個已知結(jié)構(gòu)的蛋白質(zhì)序列相似的時候,該蛋白質(zhì)的結(jié)構(gòu)可以被模建。88可編輯課件PPT
3.同源模建的前提和條件:要模建的目標(biāo)蛋白必須有一個或多個已知結(jié)構(gòu)的與之同源(同源性不低于25%)的蛋白。數(shù)據(jù)庫:蛋白質(zhì)結(jié)構(gòu)、序列數(shù)據(jù)計算機:工作站分子模擬系統(tǒng):軟件系統(tǒng)4.同源模建的發(fā)展歷史
1969年,Browne利用溶菌酶的結(jié)構(gòu)手工模建了牛乳白蛋白的結(jié)構(gòu)。八十年代,Blundel發(fā)展了利用多種同源蛋白質(zhì)進行結(jié)構(gòu)預(yù)測的方法。隨著計算機技術(shù)的發(fā)展、結(jié)構(gòu)測定數(shù)據(jù)的增加,同源模建技術(shù)也在快速發(fā)展。89可編輯課件PPT5.同源模建的主要算法剛體裝配模建(modelingbyrigidbodyassembly)片段匹配模建(modelingbysegmentmatching)空間制約模建(modelingbysatisfactionofspatialrestraints)90可編輯課件PPT(1)剛體裝配模建從一些剛體包括核心區(qū)、環(huán)區(qū)和側(cè)鏈來構(gòu)造模型,這些剛體都來自分解的相關(guān)結(jié)構(gòu)(參考蛋白)。模型的裝配涉及計算一個框架,這個框架定義為折疊模式的保守區(qū)域的模板原子的平均,并把剛體裝進框架。(2)片段匹配模建依賴于從模板蛋白的保守原子的相近位置來計算其它原子的坐標(biāo)。它可以通過使用蛋白質(zhì)結(jié)構(gòu)的短片數(shù)據(jù)庫、能量或幾何規(guī)則、以及這些標(biāo)準(zhǔn)的某些聯(lián)合來完成。(3)空間制約滿足:首先從參考蛋白結(jié)構(gòu)中抽取出一些空間制約條件,將這些制約條件用幾率密度函數(shù)來表示,然后根據(jù)氨基酸類型、等位殘基的主鏈構(gòu)象和序列之間局部的相似程度而對空間制約條件施加以不同的權(quán)重因子。模建時將幾率密度函數(shù)應(yīng)用到未知結(jié)構(gòu)蛋白質(zhì)序列上,通過優(yōu)化分子的幾率密度函數(shù)使制約條件有最小的沖突而得到目標(biāo)蛋白的三維結(jié)構(gòu),整個優(yōu)化過程通過分子力學(xué)和分子動力學(xué)模擬來實現(xiàn)。
91可編輯課件PPT6.同源建模法分析步驟:多序列比對與已有晶體結(jié)構(gòu)的蛋白質(zhì)序列比對確定是否有可以使用的模板序列相似度>30%序列相似度<30%,結(jié)合功能,蛋白質(zhì)一級序列、二級結(jié)構(gòu)或結(jié)構(gòu)域信息構(gòu)建三維模型三維模型準(zhǔn)確性檢驗Whatcheck
程序Ramachandranplot計算檢驗手工調(diào)整多序列比對,重新擬和,構(gòu)建新的模型92可編輯課件PPT93可編輯課件PPT常用數(shù)據(jù)庫數(shù)據(jù)庫網(wǎng)站備注PDB/pdb/home/home.do主要的蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)庫MMDB/Structure/MMDB/mmdb.shtmlNCBI維護的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫Psdb/~deerfiel/PSdb/從PDB和NRL-3D數(shù)據(jù)庫中衍生出的數(shù)據(jù)庫,含二級結(jié)構(gòu)和三維結(jié)構(gòu)信息3DinSighthttp://gibk26.bse.kyutech.ac.jp/jouhou/3dinsight/3DinSight.html整合了結(jié)構(gòu)、性質(zhì)(氨基酸組成、熱力學(xué)參數(shù)等)、生物學(xué)功能(突變點,相互作用等)的綜合數(shù)據(jù)庫,F(xiàn)SSPhttp://www.ebi.ac.uk/dali//fssp/根據(jù)結(jié)構(gòu)比對的蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫SCOPhttp://scop.mrc-lmb.cam.ac.uk/scop/蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫,將已知結(jié)構(gòu)蛋白進行有層次地分類CATH/latest/index.html另一個有名的蛋白質(zhì)結(jié)構(gòu)和結(jié)構(gòu)域主要結(jié)構(gòu)分類庫MODBASE/modbase-cgi/index.cgi用同源比對法生成的模型結(jié)構(gòu)數(shù)據(jù)庫EnzymeStructurehttp://www.ebi.ac.uk/thornton-srv/databases/enzymes/從PDB數(shù)據(jù)庫中整理已知結(jié)構(gòu)的酶蛋白數(shù)據(jù)庫HSSPhttp://www.sander.ebi.ac.uk/hssp/根據(jù)同源性到處的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫94可編輯課件PPT模板搜索與比對工具網(wǎng)站備注PSI-BLAST/BLAST/位置特異性疊代BLAST,可用來搜索遠源家族序列FASTA3http://www.ebi.ac.uk/fasta33/位于EBI的序列比對工具SSEARCHrs.fr/bin/ssearch-guess.cgi采用Smith/Waterman法來進行序列比對ClustalWhttp://www.ebi.ac.uk/Tools/clustalw/index.html多序列比對工具,位于EBIT-Coffeehttp://www.ebi.ac.uk/t-coffee/用多種方法(如ClustalW、DIalign等)來構(gòu)建多序列比對Multalinhttp://bioinfo.genopole-toulouse.prd.fr/multalin/multalin.html一個老牌的多序列比對工具Dalihttp://www.ebi.ac.uk/dali/三維結(jié)構(gòu)比對網(wǎng)絡(luò)服務(wù)器VAST/Structure/VAST/vast.shtml基于向量并列分析算法的三維結(jié)構(gòu)比對工具SAM-T99/research/compbio/sam.html用HMM法搜索蛋白質(zhì)遠源同源序列95可編輯課件PPT同源建模法工具網(wǎng)站備注SWISS-MODEL/完整建模程序,采用同源性鑒定來確定模板蛋白,用戶也可以自定義模板進行分析CPHmodelshttp://www.cbs.dtu.dk/services/CPHmodels/基于神經(jīng)網(wǎng)絡(luò)的同源建模工具,用戶只需提交序列,無高級選項EsyPred3Dhttp://www.fundp.ac.be/urbm/bioinfo/esypred/采用神經(jīng)網(wǎng)絡(luò)來提高同源建模準(zhǔn)確性的預(yù)測工具3Djigsawhttp://www.bmm.icnet.uk/servers/3djigsaw/根據(jù)同源已知結(jié)構(gòu)蛋白來建模的預(yù)測工具MODELLER/modeller/一個廣泛使用的同源建模軟件,需要用戶對腳本有一定的了解96可編輯課件PPT串線法工具網(wǎng)站備注3D-PSSMhttp://www.sbg.bio.ic.ac.uk/~3dpssm/index2.html第一個運用1D-3D序列profile來預(yù)測蛋白質(zhì)折疊結(jié)構(gòu)的網(wǎng)絡(luò)服務(wù)器Fuguehttp://www-cryst.bioc.cam.ac.uk/~fugue/以序列—結(jié)構(gòu)比對搜索數(shù)據(jù)庫來預(yù)測蛋白質(zhì)折疊HHpredhttp://toolkit.tuebingen.mpg.de/hhpred基于HMM-HMM比對搜索多個數(shù)據(jù)庫來預(yù)測給定序列的的折疊結(jié)構(gòu)LOOPP/loopp.aspx學(xué)習(xí)、觀察和輸出蛋白質(zhì)模式和結(jié)構(gòu)工具THREADERhttp://bioinf.cs.ucl.ac.uk/threader/一個老牌的線索分析軟件,對搜索遠源蛋白序列較敏感PROSPECT/structure/prospect/index.html蛋白質(zhì)結(jié)構(gòu)預(yù)測和評價工具包,能以一種非常簡單的方式運行,對于高級用戶,也提供了很多的可選項123D+http://123/123D+.html結(jié)合了序列概形,二級結(jié)構(gòu)信息和接觸勢能來將待測蛋白“穿入”一系列結(jié)構(gòu)來預(yù)測結(jié)構(gòu)SAM-T02/research/compbio/HMM-apps/T02-query.html基于HMM方法的蛋白質(zhì)結(jié)構(gòu)預(yù)測GenThreaderhttp://bioinf.cs.ucl.ac.uk/psipred/psiform.html使用結(jié)構(gòu)評分和基于神經(jīng)網(wǎng)絡(luò)序列比對來也測蛋白折疊結(jié)構(gòu)97可編輯課件PPT蛋白質(zhì)三維結(jié)構(gòu)預(yù)測SWISS-MODEL工具http://www.expasy.ch/swissmod/SWISS-MODEL.html同源建模方法與PDB數(shù)據(jù)庫已知結(jié)構(gòu)的蛋白質(zhì)序列比對進行預(yù)測98可編輯課件PPT主要參數(shù)/選項粘貼protein.txt中一條蛋白質(zhì)序列輸入用戶Email(選填)比對e值參照模板序列數(shù)目99可編輯課件PPT輸出結(jié)果下載pdb格式文件100可編輯課件PPT與模板序列比對結(jié)果,并顯示二級結(jié)構(gòu)區(qū)域101可編輯課件PPT方法二:折疊識別/穿線方法對蛋白質(zhì)結(jié)構(gòu)的預(yù)測背景:序列比對后所擊中的相似序列不是完整的而是一段一段的結(jié)構(gòu)域,也可以通過二級結(jié)構(gòu)預(yù)測和折疊識別(foldrecognition)找到合適的折疊子,再以這些已知結(jié)構(gòu)的折疊子為模板來構(gòu)建模型。102可編輯課件PPT折疊識別/穿線方法
觀察:有限的蛋白質(zhì)折疊種類(~1,000?)與“從頭開始”來預(yù)測蛋白質(zhì)結(jié)構(gòu)不同,我們可以從有限的蛋白質(zhì)折疊條目中得到正確的結(jié)果?;谛蛄屑记煽梢宰龅竭@一點,或者通過穿線法將序列按順序投到模板上,并評價每一個匹配好壞程度103可編輯課件PPT折疊識別/穿線方法原理:將序列“穿”入已知的各種蛋白質(zhì)折疊子骨架內(nèi),通過目的蛋白序列與已知折疊子的逐一比對,計算出未知結(jié)構(gòu)序列折疊成各種已知折疊子的可能性;折疊子一般包括一個或多個蛋白質(zhì)超家族;每個折疊子的結(jié)構(gòu)內(nèi)核有確定的結(jié)構(gòu)特征;基于序列同源性很低的蛋白質(zhì)都可能存在結(jié)構(gòu)相同的折疊子進行預(yù)測。例如,通過PHYRE系統(tǒng)進行折疊識別預(yù)測http://www.sbg.bio.ic.ac.uk/~phyre/index.cgi104可編輯課件PPT折疊識別或穿線法目標(biāo)序列=SHPALTQLRALRYCKEIPALDPQLLDWLLLEDSMTKRFEQQ…可能折疊的庫(哪些具有已知序列和結(jié)構(gòu)):105可編輯課件PPT序列-結(jié)構(gòu)比對目標(biāo)序列=SHPALTQLRALRYCKEIPALDPQLLDWLLLEDSMTKRFEQQ…=t1t2t3t4t5…tn已知折疊結(jié)構(gòu)的序列=s1s2s3s4s5…sn已知折疊結(jié)構(gòu)的位置=p1p2p3p4p5…pn怎樣將目標(biāo)序列與結(jié)構(gòu)進行比對?106可編輯課件PPT同源模建與結(jié)構(gòu)類型識別方法的比較蛋白質(zhì)家族與蛋白質(zhì)結(jié)構(gòu)類型
Family蛋白質(zhì)家族依據(jù)序列同源性將蛋白質(zhì)分為不同的家族:一般將序列同源性大于30%的蛋白質(zhì)歸屬為一個家族。一個蛋白質(zhì)家族的成員可能由一個共同的祖先進化而來。自然界存在的可能蛋白質(zhì)家族數(shù)目大約為23100種。同一個家族的蛋白質(zhì)一般具有相近的功能和相同的結(jié)構(gòu)類型(折疊模式)。107可編輯課件PPT3D-PSSM工具http://www.sbg.bio.ic.ac.uk/~3dpssm/index2.html由英國倫敦帝國理工學(xué)院維護,其數(shù)據(jù)庫中含有9864個蛋白折疊結(jié)構(gòu)3D-PSSM先用PSI-BLAST標(biāo)準(zhǔn)方法通過多序列比對得到輪廓(profile),然后對家族中的一系列成員進行結(jié)構(gòu)比對得出該家族的結(jié)構(gòu)輪廓,接著用線串法將模板結(jié)構(gòu)輪廓和待測蛋白的序列輪廓進行1D-3D輪廓之間的比對,此外也考慮了溶劑可及性和二級結(jié)構(gòu)信息108可編輯課件PPT輸入用戶Email(學(xué)術(shù)郵箱,必需)蛋白質(zhì)描述(選填)序列提交框(氨基酸單字母)109可編輯課件PPT輸入用戶Email(必需)蛋白質(zhì)描述(選填)序列提交框(氨基酸單字母)Phyre
-http://www.sbg.bio.ic.ac.uk/~phyre/3d-PSSM的升級版,增加了fold數(shù)據(jù),并且性能上提高10%-15%,采用了新的分析界面110可編輯課件PPT二級結(jié)構(gòu)預(yù)測111可編輯課件PPT序列比對結(jié)果序列比對一致性模板長度靶標(biāo)蛋白模型模板蛋白結(jié)構(gòu)分類信息折疊子描述112可編輯課件PPT113可編輯課件PPT114可編輯課件PPT工具網(wǎng)站備注Swiss-PdbViewer/spdbv/一個界面非常友好的工具,可以分析蛋白質(zhì)的結(jié)構(gòu)性質(zhì),比較活性位點或突變點Jmol/一個基于Java語言開發(fā)的三維觀察工具,大多是作為一個內(nèi)嵌式網(wǎng)頁工具快速游覽結(jié)構(gòu)數(shù)據(jù)庫數(shù)據(jù)MolMolhttp://www.mol.biol.ethz.ch/wuthrich/software/molmol/免費的PDB三維分子觀察軟件,可以通過處理生成很漂亮的圖形文件PyMol/一個基于開源的三維觀察工具,有很多額外的插件來提升功能Rasmol/software/rasmol/很有名的三維觀察軟件,操作界面簡介,用命令行實現(xiàn)多種功能VMD/Research/vmd/用內(nèi)建的腳本來瀏覽、分析三維結(jié)構(gòu),還可以以動畫的形式模擬蛋白質(zhì)結(jié)構(gòu)Chime/products/framework/chime/index.jsp網(wǎng)絡(luò)游覽器插件,可以在網(wǎng)頁中直接觀察PDB格式的文件Chimera/chimera/index.html免費分子模擬顯示程序,還包括結(jié)構(gòu)比對、藥物篩選等功能ICM-Browser/icm_browser.html三維分子游覽工具,有序列比對顯示功能,由MolSodt公司免費推出常用蛋白質(zhì)三維結(jié)構(gòu)觀察和修改工具115可編輯課件PPTChime網(wǎng)絡(luò)游覽器插件Chime-/products/framework/chime/index.jsp基于游覽器的三維結(jié)構(gòu)觀察工具安裝后在InternetExplorer下的PLUGINS文件夾中會有:npchime.dll(pluginsfolder)npchime.zip(pluginsfolder,usedforLiveConnect)NOTE:Donotunzipthisfilechimepro.html(pluginsfolder,thereleasenotesforChime)chime26.isu(pluginsfolder,usedtouninstallChime)sculptapi.dll(WindowsSystemfolder,usedforSculpt)ChimeShim.dll(pluginsfolder,InternetExploreronly)116可編輯課件PPT117可編輯課件PPTSWISS-PdbView觀察三維模型SWISS-PdbView工具/spdbv/觀察和修改分子的三維結(jié)構(gòu)118可編輯課件PPT菜單欄/工具欄圖層窗口主窗口序列聯(lián)配窗口控制面板119可編輯課件PPTRamachandran圖結(jié)構(gòu)疊加120可編輯課件PPT蛋白質(zhì)序列分析蛋白質(zhì)一級序列蛋白質(zhì)基本理化性質(zhì)分析蛋白質(zhì)親疏水性分析跨膜區(qū)結(jié)構(gòu)預(yù)測卷曲螺旋預(yù)測翻譯后修飾位點預(yù)測蛋白質(zhì)二級結(jié)構(gòu)蛋白質(zhì)二級結(jié)構(gòu)預(yù)測蛋白質(zhì)序列信號位點分析蛋白質(zhì)超二級結(jié)構(gòu)蛋白質(zhì)結(jié)構(gòu)域分析蛋白質(zhì)三級結(jié)構(gòu)蛋白質(zhì)三維結(jié)構(gòu)模擬蛋白質(zhì)分類蛋白質(zhì)家族分析蛋白質(zhì)序列分析匯總表課程總結(jié)121可編輯課件PPT課程總結(jié)122可編輯課件PPT四、蛋白質(zhì)結(jié)構(gòu)預(yù)測的應(yīng)用蛋白質(zhì)的分子設(shè)計123可編輯課件PPT
蛋白質(zhì)分子設(shè)計與基因工程技術(shù)、多肽合成技術(shù)和化學(xué)合成技術(shù)一起開創(chuàng)了新藥設(shè)計和開發(fā)研究的新局面。這個領(lǐng)域的研究方向主要包括蛋白三維結(jié)構(gòu)預(yù)測、蛋白質(zhì)結(jié)構(gòu)功能關(guān)系研究、蛋白相互作用、蛋白與DNA相互作用、蛋白質(zhì)突變體的分子設(shè)計、全新蛋白質(zhì)設(shè)計等。124可編輯課件PPT1.分子設(shè)計的意義
分子生物學(xué)最激動人心的進展之一是能夠設(shè)計和生產(chǎn)新的蛋白質(zhì)分子。重組DNA技術(shù)使人們能夠定向改變蛋白質(zhì)中的氨基酸序列,包括氨基酸的取代、插入或缺失,甚至包括蛋白質(zhì)的融合等。
蛋白質(zhì)工程則是在深入了解蛋白質(zhì)結(jié)構(gòu)與功能關(guān)系的基礎(chǔ)上,利用分子生物學(xué)方法和手段有目的地改造蛋白質(zhì),使之性能得到改善。作為蛋白質(zhì)工程的組成部分,蛋白質(zhì)分子設(shè)計在其中起著十分重要的作用。
125可編輯課件PPT126可編輯課件PPT從預(yù)期的蛋白質(zhì)功能出發(fā)→設(shè)計預(yù)期的蛋白質(zhì)結(jié)構(gòu)→推測應(yīng)有的氨基酸序列→找到相對應(yīng)的脫氧核苷酸(基因)127可編輯課件PPT
2.分子設(shè)計的種類小改:少數(shù)殘基的替換,突變或修飾中改:分子拼接,肽段或結(jié)構(gòu)域的替換大改:從頭設(shè)計,全新蛋白質(zhì)的設(shè)計3.分子設(shè)計與蛋白質(zhì)結(jié)構(gòu)
蛋白質(zhì)分子內(nèi)部的電荷分布、相互作用有其特定的結(jié)構(gòu)特征,隨意選擇突變位點在蛋白質(zhì)分子中改變氨基酸,不僅達不到預(yù)期目的,反而可能影響蛋白質(zhì)分子的活性中心,使蛋白質(zhì)的活性降低或喪失。128可編輯課件PPT
4.蛋白質(zhì)分子設(shè)計的應(yīng)用
應(yīng)用1:酶穩(wěn)定性的改善酶的穩(wěn)定性
在蛋白質(zhì)工程的實踐中,一般可以通過在酶分子內(nèi)增加二硫鍵或靜電作用來提高酶分子的穩(wěn)定性。例1:核糖核酸酶的穩(wěn)定性的提高(1)已知條件:核糖核酸酶三維結(jié)構(gòu)已由晶體衍射方法測定。
分子內(nèi)有兩對二硫鍵:Tyr24與Asn84正對,二者的Ca之間的距離為6.0A,滿足二硫鍵的特征(二硫鍵的Ca的平均距離:4.5-6.8?),可能形成一個潛在的二硫鍵;二者附近沒有干擾形成二硫鍵的基團;二者離催化活性中心較遠,突變后不會影響活性。(2)設(shè)計方案:
將Tyr24與Asn84突變?yōu)镃ys
實驗結(jié)果:突變體的穩(wěn)定性大大提高
129可編輯課件PPT例2.葡萄糖異構(gòu)酶(GI)在工業(yè)上應(yīng)用廣泛,為提高其熱穩(wěn)定性,朱國萍等人在確定第138位甘氨酸(Gly138)為目標(biāo)氨基酸后,用雙引物法對GI基因進行體外定點誘變,以脯氨酸(Pro138)替代Gly138,含突變體的重組質(zhì)粒在大腸桿菌中表達,結(jié)果突變型GI比野生型的熱半衰期長一倍;最適反應(yīng)溫度提高10~12℃;酶比活相同。據(jù)分析,Pro替代Gly138后,可能由于引入了一個吡咯環(huán),該側(cè)鏈剛好能夠填充于Gly138附近的空洞,使蛋白質(zhì)空間結(jié)構(gòu)更具剛性,從而提高了酶的熱穩(wěn)定性。130
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年洗車店停車場管理承包合同3篇
- 韶關(guān)廣東韶關(guān)仁化縣政府安排工作退役士兵競聘事業(yè)單位管理崗位考試筆試歷年參考題庫附帶答案詳解
- 健康血壓的保持方法
- 介紹我們的學(xué)校
- 交通運輸行業(yè)的人力資源管理
- 高溫工作環(huán)境安全防護
- 行星式球磨儀行業(yè)行業(yè)發(fā)展趨勢及投資戰(zhàn)略研究分析報告
- 2025年中國彈性質(zhì)感涂料行業(yè)市場發(fā)展前景及發(fā)展趨勢與投資戰(zhàn)略研究報告
- 二零二五年度新型材料抹灰工程勞務(wù)分包技術(shù)合同3篇
- 2025年度家庭園藝設(shè)計與養(yǎng)護服務(wù)合同規(guī)范4篇
- 2024電子商務(wù)平臺用戶隱私保護協(xié)議3篇
- 安徽省蕪湖市2023-2024學(xué)年高一上學(xué)期期末考試 英語 含答案
- 電力工程施工安全風(fēng)險評估與防控
- 醫(yī)學(xué)教程 常見體表腫瘤與腫塊課件
- 內(nèi)分泌系統(tǒng)異常與虛勞病關(guān)系
- 智聯(lián)招聘在線測評題
- DB3418T 008-2019 宣紙潤墨性感官評判方法
- 【魔鏡洞察】2024藥食同源保健品滋補品行業(yè)分析報告
- 生豬屠宰獸醫(yī)衛(wèi)生檢驗人員理論考試題及答案
- 鋼筋桁架樓承板施工方案
- 2024年駐村第一書記工作總結(jié)干貨3篇
評論
0/150
提交評論