第11講 蛋白質(zhì)高級結(jié)構(gòu)預(yù)測_第1頁
第11講 蛋白質(zhì)高級結(jié)構(gòu)預(yù)測_第2頁
第11講 蛋白質(zhì)高級結(jié)構(gòu)預(yù)測_第3頁
第11講 蛋白質(zhì)高級結(jié)構(gòu)預(yù)測_第4頁
第11講 蛋白質(zhì)高級結(jié)構(gòu)預(yù)測_第5頁
已閱讀5頁,還剩89頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第十一講蛋白質(zhì)高級結(jié)構(gòu)預(yù)測Left:themodelwasgeneratedbyROSETTARight:themodelwasgeneratedbyI-TASSER蛋白質(zhì)高級結(jié)構(gòu)三維結(jié)構(gòu)功能作用機制分子間互作功能注釋指導(dǎo)實驗驗證功能確認功能位點設(shè)計和改造蛋白藥物靶標(biāo)設(shè)計同源建模法(Homologymodeling)線索化法/折疊識別法/串線法(Threading/Foldrecognition)從頭預(yù)測法(Abinitio/Denovomethods)蛋白質(zhì)三級結(jié)構(gòu)預(yù)測方法依據(jù):a、一個蛋白質(zhì)的結(jié)構(gòu)由其氨基酸序列唯一的決定。由一級結(jié)構(gòu),在理論上,足以獲取其二級、三級結(jié)構(gòu)。b、三級結(jié)構(gòu)的保守型遠遠大于一級結(jié)構(gòu)的保守型。主要思想:

對于一個未知結(jié)構(gòu)的蛋白質(zhì),找到一個已知結(jié)構(gòu)的同源蛋白質(zhì),以該蛋白質(zhì)的結(jié)構(gòu)為模板,為未知結(jié)構(gòu)的蛋白質(zhì)建立結(jié)構(gòu)模型。1.蛋白質(zhì)結(jié)構(gòu)預(yù)測之同源建模同源建模的過程2.將模板結(jié)構(gòu)的坐標(biāo)拷貝到目標(biāo)U,僅拷貝匹配殘基的坐標(biāo)PDB數(shù)據(jù)庫1.PDB數(shù)據(jù)庫、BLAST(或PSI-BLAST)3、模型優(yōu)化,主鏈生成、環(huán)區(qū)建模、加氫4.

合理性檢測同源建模方法特點繞過了二級結(jié)構(gòu)預(yù)測目前蛋白質(zhì)結(jié)構(gòu)預(yù)測方法中最成功、最準(zhǔn)確、使用最多局限是:僅僅是一種技術(shù)手段,而非理論應(yīng)用范圍收已有同源結(jié)構(gòu)的限制Loop區(qū)域準(zhǔn)確率差同源建模在線服務(wù)器和軟件Swiss-modelHOMCOS1.0ESyPred3DNameMethodDescription3D-JIGSAWFragmentassemblyAutomatedwebserverRaptorXremotehomologydetection,protein3Dmodeling,bindingsitepredictionAutomatedwebserverandDownloadableprogramBiskitwrapsexternalprogramsintoautomatedworkflowBLASTsearch,T-Coffeealignment,andMODELLERconstructionCABSReducedmodelingtoolDownloadableprogramCPHModelFragmentassemblyAutomatedwebserverEasyModellerGUItoMODELLERStandalonewindowsexecutableESyPred3DTemplatedetection,alignment,3DmodelingAutomatedwebserverGeneSilicoConsensustemplatesearch/fragmentassemblyWebserverGeno3DSatisfactionofspatialrestraintsAutomatedwebserverHHpredTemplatedetection,alignment,3DmodelingInteractivewebserverwithhelpfacilityLIBRAILIghtBalanceforRemoteAnalogousproteins,ver.IWebserverLOMETSLocalMetathreadingserverMeta-servercombining9differentprogramsMODELLERSatisfactionofspatialrestraintsStandaloneprogrammainlyinFortranandPythonProtinfoCMComparativemodellingofproteinstructureusingminimumperturbationandloopbuildingWebserverBHAGEERATH-HCombinationofabinitiofoldingandhomologymethodsProteintertiarystructurepredictionsSTRUCTUROPEDIAWebInterfacetoMODELLERHomologymodelingofproteinsinmonomericormultimericformsaloneandincomplexwithpeptidesandDNAaswellasintroductionofmutationsandpost-translationalmodifications(PTMs)intoproteinstructuresSWISS-MODELLocalsimilarity/fragmentassemblyAutomatedwebserver(basedonProModII)TIP-STRUCTFASTAutomatedComparativeModelingWebserverandknowledgebaseWHATIFPositionspecificrotamersStandaloneprogramandwebinterfaceYasaraDetectionoftemplates,alignment,modelingincl.ligandsandoligomers,hybridizationofmodelfragmentsGraphicalinterfaceortextmode(clusters)SWISS-MODELSWISS-MODEL:網(wǎng)址/非專業(yè)人士應(yīng)用最為廣泛的一個在線建模服務(wù)器。特點:簡單、自動化、對學(xué)術(shù)團隊免費。SWISS-MODEL:

//SWISS-MODEL.htmlAutomatedmodeAutomatedmode:自動模式,可以稱為是最傻瓜的方式提交自己的氨基酸序列+郵箱即可適用:一致性較高時郵箱模型命名氨基酸序列PDB登錄號PDB模板AlignmentmodeAlignmentmode:比對模式提交目標(biāo)蛋白與模板蛋白的序列比對結(jié)果(FASTA,MSF,ClustalW等格式)適用:a、較高的相似性b、利用Auto模式未必能找到最合適模板的情況

c、使用者有目的的使用特定的模板蛋白(比如具有更為相似的活性位點結(jié)果,而不是更為相似的整體結(jié)構(gòu))郵箱模型命名比對后的序列比對文件ProjectmodeProjectmode:項目模式:

難以直接通過序列比對獲得模板,需要人工插入調(diào)節(jié)(借助蛋白結(jié)構(gòu)編輯軟件deepview),可以將前兩種模式模建出的蛋白進行人為調(diào)整適用:相似性不高HOMCOS1.0HOMCOS1.0:tein.osaka-u.ac.jp/homcos/同源二聚體建模異源二聚體建模識別可能的互作蛋白ESyPred3DESyPred3D:http://www.unamur.be/sciences/biologie/urbm/bioinfo/esypred/評價:自動建模預(yù)測服務(wù)程序,ESyPred3D在目標(biāo)-模板比對這一步做出的結(jié)果較好,且在預(yù)測序列與模板序列相似度差時有較好的模型預(yù)測效果。Modeller該軟件由Salilab開發(fā),目前最新的版本是9.11,可在win下和linux運行,需要對應(yīng)版本的python(<3.0)。完全免費。主要功能包括:多聚體建模,二硫鍵建模,雜原子建模等(配體、輔酶等)。自帶一套模建結(jié)構(gòu)后的優(yōu)化、分析。But!該軟件完全是命令行模式,操作相對復(fù)雜,可控制的地方多。Easymodeller對于習(xí)慣于GUI的我們來說,modeller操作不太方便。于是。。。印度Hyderabad大學(xué)的KuntalKumarBhusan為其編寫了一個GUI界面,即為EasyModeller。EasyModeller,目前最新版本為4.0。之后,又有SWIFTMODELLER,UCSFChimerainterface2.蛋白質(zhì)三級結(jié)構(gòu)預(yù)測之線索化方法

Threading/foldrecognition線索化方法又稱蛋白質(zhì)折疊類型識別依據(jù):蛋白質(zhì)折疊模式的有限性:一些序列(小于25%,遠程同源)/功能不同的蛋白質(zhì)采用類似的結(jié)構(gòu),蛋白質(zhì)折疊模式的種類是有限的。序列中的殘基的結(jié)構(gòu)信息比殘基本身更加保守。Physicalforcesfavorcertainstructures.Structureisbetterconservedthansequence蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫SCOP(StructuralClassificationofProteins)CATH(Class,Architecture,Topology,Homology)Numberoffoldsislimited.Currently~700,Total:1,000~10,000CATH的結(jié)構(gòu)層次有限的蛋白質(zhì)折疊類型258種類型165種類型141種類型334種類型50種類型90%ofnewstructuressubmittedtoPDBinthepastthreeyearshavesimilarstructuralfoldsinPDB目標(biāo)序列與數(shù)據(jù)庫核心折疊比對取最佳核心折疊結(jié)構(gòu)模型主要思想:利用氨基酸的結(jié)構(gòu)傾向(如形成二級結(jié)構(gòu)的傾向、疏水性、極性等),評價一個序列所對應(yīng)的結(jié)構(gòu)是否能夠適配到一個給定的結(jié)構(gòu)環(huán)境中。建立序列到結(jié)構(gòu)的線索的過程稱為線索化,線索技術(shù)又稱折疊識別技術(shù)。具體做法是將結(jié)構(gòu)轉(zhuǎn)換為含有這三個結(jié)構(gòu)的字符串,然后對這些字符串進行比較(sequence-structure

alignment)。線索技術(shù)的首要任務(wù)是建立核心折疊數(shù)據(jù)庫在預(yù)測蛋白質(zhì)空間結(jié)構(gòu)時將一個待預(yù)測結(jié)構(gòu)的蛋白質(zhì)序列與數(shù)據(jù)庫中核心折疊進行比對,找出比對結(jié)果最好的核心折疊,作為構(gòu)造待預(yù)測蛋白質(zhì)結(jié)構(gòu)模型的根據(jù)。evaluationwithcompatibilityfunctionsthestructuremostcompatiblewiththesequence

ConceptofThreadingThread(alignorplace)aqueryproteinsequenceontoatemplatestructurein“optimal”wayGoodalignmentgivesapproximatebackboneQuerysequence:MTYKLILNGKTKGETTTEAVDAATAEKVFQYANDNGVDGEWTYTETemplatesetThreadingproblem

Threading:Givenasequence,andafold(template),computetheoptimalalignmentscorebetweenthesequenceandthefold.Ifwecansolvetheaboveproblem,thenGivenasequence,wecantryeachknownfold,andfindthebestfoldthatfitsthissequence.Becausethereareonlyafewthousandsfolds,wecanfindthecorrectfoldforthegivensequence.ThreadingisNP-hard.ProteinThreading–structuredatabaseBuildatemplatedatabaseProteinThreading–energyfunctionhowwellaresiduefitsastructuralenvironment:E_showpreferabletoputtwoparticularresiduesnearby:E_palignmentgappenalty:E_gtotalenergy:E_p+E_s+E_gfindasequence-structurealignmenttominimizetheenergyfunction序列-結(jié)構(gòu)最佳對齊方式,能量最小化MTYKLILNGKTKGETTTEAVDAATAEKVFQYANDNGVDGEWTYTEAssessingPredictionReliabilityPredictionofProteinStructuresExamples–afewgoodexamplesPredictionofProteinStructuresNotsogoodexampleExistingPredictionProgramsPROSPECT:/protein_pipelineFUGU:http://www-cryst.bioc.cam.ac.uk/~fugue/prfsearch.htmlTHREADER:http://bioinf.cs.ucl.ac.uk/threader/NameMethodDescriptionRaptorXRemotetemplatedetection,single-templateandmulti-templatethreading,totallydifferentfromandmuchbetterthantheoldprogramRAPTORdesignedbythesamegroupWebserverwithjobmanager,automaticallyupdatedfoldlibrary3D-PSSM3D-1Dsequenceprofiling(replacedbyPhyre)WebserverBioingbuEvolutionaryinformationrecognitionWebserverFALCON@homeSingle-templateandmulti-templatethreading,ahigh-throughputserverbasedonvolunteercomputingWebserverwithjobmanagerHHpredTemplatedetection,alignment,3DmodelingInteractivewebserverwithhelpfacilityNovaFoldCombinationofthreadingandabinitiofoldingCommercialproteinstructurepredictionapplicationI-TASSERCombinationofabinitiofoldingandthreadingmethodsStructuralandfunctionpredictionsLOOPPMultiplemethodsWebservermGenTHREADER/GenTHREADERSequenceprofileandpredictedsecondarystructureWebserverMUSTERprofile-profilealignmentWebserverPhyreandPhyre2Remotetemplatedetection,alignment,3Dmodeling,multi-templates,abinitioWebserverwithjobmanager,automaticallyupdatedfoldlibrary,genomesearchingandotherfacilitiesRAPTORIntegerprogrammingbasedfoldrecognitionFreedemoSelvitaProteinModelingPlatformPackageoftoolsforproteinmodelingFreedemo,interactivewebserverandstandaloneprogramincluding:3Dthreadingandflexible3dthreadingSUPERFAMILYHiddenMarkovmodelingWebserver/standaloneSPARKS-X3DstructuremodelingbyFoldrecognitionaccordingtoSequenceprofilesandstructuralprofilesWebserverBBSP-BuildingBlocksStructurePredictorHybridtemplate-basedFreeapplicationplusdatabase

I-TASSAR

I-TASSAR:/I-TASSER/也可以下載本地安裝包評價:根據(jù)結(jié)果質(zhì)量檢驗,該服務(wù)器應(yīng)該是自動建模的軟件里是結(jié)果最詳細的,二級結(jié)構(gòu)、top10模型、配體結(jié)合位點等等。缺點:計算結(jié)果時間比較長

結(jié)果需要進一步優(yōu)化FlowchartofI-TASSERproteinstructuremodelling3.蛋白質(zhì)三級結(jié)構(gòu)預(yù)測之從頭預(yù)測在既沒有已知結(jié)構(gòu)的同源蛋白質(zhì)、也沒有已知結(jié)構(gòu)的遠程同源蛋白質(zhì)的情況下使用根據(jù)序列本身來預(yù)測其結(jié)構(gòu)可以用來預(yù)測任何一種蛋白質(zhì)是三種方法中難度最大的基于一種假設(shè)-蛋白質(zhì)折疊為能量最低的形式準(zhǔn)確率較同源模建法要低(序列相似性>30%)能量函數(shù)和優(yōu)化需要考慮的相互作用:疏水作用氫鍵二硫橋靜電作用范德華力溶劑作用NameMethodDescriptionEVfoldEvolutionarycouplingscalculatedfromcorrelatedmutationsinaproteinfamily,usedtopredict3Dstructurefromsequencesaloneandtopredictfunctionalresiduesfromcouplingstrengths.Predictsbothglobularandtransmembraneproteins.WebserverFALCONAposition-specifichiddenMarkovmodeltopredictproteinstructurebyiterativelyrefiningthedistributionsofdihedralanglesWebserverQUARKMonteCarlofragmentassemblyOn-lineserverforproteinmodeling(bestforabinitiofoldinginCASP9)NovaFoldCombinationofthreadingandabinitiofoldingCommercialproteinstructurepredictionapplicationI-TASSERThreadingfragmentstructurereassemblyOn-lineserverforproteinmodelingROSETTARosettahomologymodelingandabinitiofragmentassemblywithGinzudomainpredictionWebserverRosetta@homeDistributed-computingimplementationofRosettaalgorithmDownloadableprogramCABSReducedmodelingtoolDownloadableprogramCABS-FOLDServerfordenovomodeling,canalsousealternativetemplates(consensusmodeling).WebserverBhageerathAcomputationalprotocolformodelingandpredictingproteinstructuresattheatomiclevel.WebserverAbaloneMolecularDynamicsfoldingProgramPEP-FOLDDenovoapproach,basedonaHMMstructuralalphabetOn-lineserverforpeptidestructurepredictionSelvitaProteinModelingPlatformPackageoftoolsforproteinmodelingInteractivewebserverandstandaloneprogramincluding:CABSabinitiomodelingFlowchartoftheROSETTAprotocol

方法特點工具同源建模法(Homology/Comparativemodelling)基于模板的蛋白結(jié)構(gòu)預(yù)測;對于序列相似度的序列模擬比較有效最常用的方法SWISS-MODEL線索化法/折疊識別法

(Threading/Foldrecognition)基于模板的蛋白結(jié)構(gòu)預(yù)測;“穿”入已知的各種蛋白質(zhì)折疊骨架內(nèi)適于對蛋白質(zhì)核心結(jié)構(gòu)進行預(yù)測計算量大PHYRETHREADER,從頭預(yù)測法(Abinitio/Denovomethods)不依賴模板的蛋白結(jié)構(gòu)預(yù)測,直接預(yù)測;基于分子動力學(xué),尋找能量最低的構(gòu)象;計算量大,目前只能做小分子預(yù)測;理論意義極大HMMSTR/ROSSETA4.蛋白質(zhì)三維結(jié)構(gòu)預(yù)測方法比較蛋白質(zhì)三維結(jié)構(gòu)預(yù)測方法比較二5.模型評估在模型使用前要對其進行評估!同源模建結(jié)果評價與改進策略PROCHECK、WHATCHECK、ERRAT、Verify_3D、PROVEUCLA-DOE的SAVES服務(wù)器包括了這五種常用的檢測,其網(wǎng)址為:/SAVES/除SAVES外,Molprobity也是一個常用的在線模型分析工具,其網(wǎng)址為:/index.php

PROCHECK:以PDB中高分辨的晶體結(jié)構(gòu)參數(shù)為參考,給出提交模型的一系列立體化學(xué)參數(shù)(主鏈)。其輸出的結(jié)果包括:拉氏圖,主鏈的鍵長與鍵角,二級結(jié)構(gòu)圖,平面?zhèn)孺溑c水平面之間的背離程度等。WHATCHECK:包含大量的檢測項,可以針對提交的蛋白結(jié)構(gòu)與正常結(jié)構(gòu)之間的差異,產(chǎn)生一個非常長而且詳細的報告。ERRAT:計算0.35nm范圍之內(nèi),不同原子類型對之間形成的非鍵相互作用的數(shù)目(側(cè)鏈)。原子按照C、N、O/S進行分類,所以有六種不同的相互作用類型:CC、CN、CO、NN、NO、OO。得分>85比較好。Verify_3D:比較模型和氨基酸一級結(jié)構(gòu)的關(guān)系,獲得PASS評價即可。PROVE:與預(yù)先計算好的一系列標(biāo)準(zhǔn)體積之間的差別。用Z-score

來表示。Z-score作為一個統(tǒng)計學(xué)值,可以顯示模板蛋白質(zhì)和待測蛋白之間的匹配程度,當(dāng)Z-score較低時,就意味著沒有匹配搜索的結(jié)構(gòu)模型提交SAVES服務(wù)器(StructuralAnalysisandVerificationServer)進行檢驗/SAVES/PROCHECKPROCHECK:本部分主要需要的是拉氏圖(RamachandranPlot),可下載ps格式、PDF格式以及JPG格式。落在核心區(qū)+允許區(qū)+最大允許區(qū)的堿基百分比大于95%的模型質(zhì)量很好。RamachandranplotVerify_3D78.74%oftheresidueshadanaveraged3D-1Dscore>0.2ERRATOverallqualityfactor值越高越好,一般高解析度的晶體結(jié)構(gòu)該值可以達到95,而對于解析度一般的來說該值只能到91左右。本例中的ERRAT值為68.280,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論