




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
蛋白質(zhì)結(jié)構(gòu)和功能預(yù)測(cè)Structureandfunctionpredictionofproteins李琬生物物理教研室分子生物學(xué)館212liwan@教學(xué)大綱掌握:DSSP編號(hào),Chou-Fasman方法,GOR方法,基于已有知識(shí)的預(yù)測(cè)方法了解:機(jī)器學(xué)習(xí)方法結(jié)構(gòu)預(yù)測(cè)功能預(yù)測(cè)△※※結(jié)構(gòu)預(yù)測(cè)二級(jí)結(jié)構(gòu)預(yù)測(cè)三級(jí)結(jié)構(gòu)預(yù)測(cè)△※△※△※蛋白質(zhì)二級(jí)結(jié)構(gòu)的預(yù)測(cè)通常被認(rèn)為是蛋白結(jié)構(gòu)預(yù)測(cè)的第一步。二級(jí)結(jié)構(gòu)預(yù)測(cè)(Secondarystructureprediction)α-螺旋β-折疊轉(zhuǎn)角無(wú)規(guī)則卷曲蛋白質(zhì)中約85%的氨基酸殘基處于3種基本二級(jí)結(jié)構(gòu)狀態(tài)(α螺旋、β折疊和轉(zhuǎn)角)二級(jí)結(jié)構(gòu)預(yù)測(cè)的目標(biāo)是判斷每一個(gè)氨基酸殘基是否處于α螺旋、β折疊和轉(zhuǎn)角(或其它狀態(tài))。最新方法的預(yù)測(cè)準(zhǔn)確性達(dá)到80%。(1)DSSP編號(hào)(2)CF方法(3)GOV方法(4)機(jī)器學(xué)習(xí)方法(5)基于已有知識(shí)的預(yù)測(cè)方法(6)多序列比對(duì)預(yù)測(cè)(7)二級(jí)結(jié)構(gòu)預(yù)測(cè)相關(guān)軟件(1)DSSP(DefineSecondaryStructureofProteins)編號(hào)G:3轉(zhuǎn)角螺旋,最短長(zhǎng)度為3個(gè)殘基。H:α螺旋,最短長(zhǎng)度為4個(gè)殘基。I:5轉(zhuǎn)角螺旋,最短長(zhǎng)度為5個(gè)殘基。E:平行的β折疊,最短長(zhǎng)度為2個(gè)殘基。B:一對(duì)β折疊氫鍵。T:氫鍵轉(zhuǎn)角(3、4或5個(gè)轉(zhuǎn)角)。S:彎曲(唯一非氫鍵的指定)。C:卷曲。空格:其他。H:H,GandI,螺旋E:BandE,折疊C:allotherstates,卷曲(2)Chou-Fasman(CF)方法每種氨基酸出現(xiàn)在各種二級(jí)結(jié)構(gòu)中傾向或者頻率是不同的谷氨酸Glu主要出現(xiàn)在α螺旋中天冬氨酸Asp和甘氨酸Gly主要分布在轉(zhuǎn)角中脯氨酸Pro也常出現(xiàn)在轉(zhuǎn)角中,但是絕不會(huì)出現(xiàn)在α螺旋中基于單個(gè)氨基酸殘基的經(jīng)驗(yàn)預(yù)測(cè)方法。通過(guò)統(tǒng)計(jì)分析,獲得每個(gè)殘基出現(xiàn)于特定二級(jí)結(jié)構(gòu)構(gòu)象的傾向性因子,預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu)。預(yù)測(cè)成功率并不高,僅有50%左右。傾向性因子
表示二級(jí)結(jié)構(gòu)狀態(tài)
是所有被統(tǒng)計(jì)殘基處于二級(jí)結(jié)構(gòu)的比例
是第A種殘基處于結(jié)構(gòu)的比例
大于1.0表示該殘基傾向于形成二級(jí)結(jié)構(gòu)參數(shù)在α螺旋、β折疊和轉(zhuǎn)角中出現(xiàn)頻率的大小轉(zhuǎn)角參數(shù)每種殘基出現(xiàn)在轉(zhuǎn)角第一~四位的頻率基本思想在序列中尋找規(guī)則二級(jí)結(jié)構(gòu)的成核位點(diǎn)和終止位點(diǎn)。延伸延伸成核區(qū)終止位點(diǎn)終止位點(diǎn)步驟α螺旋α螺旋核:相鄰的6個(gè)殘基中有至少4個(gè)殘基對(duì)應(yīng)的Pα>100。D
L
G
D
K
F
RL
VI
APα101121
57
101
114
113
98
121106
108
142Pβ54
130
7554
74
16083終止位點(diǎn):四肽α片段Pα的平均值小于100。D
L
G
D
K
F
RL
VI
APα101121
57
101
114
113
98
121106
108
142Pβ54
130
7554
74
16083片段長(zhǎng)度大于5,且Pα的平均值大于Pβ的平均值。D
L
G
D
K
F
RL
VI
APα101121
57
101
114
113
98
121106
108
142Pβ54
130
7554
74
16083107.5105.5β折疊β折疊核:相鄰5個(gè)殘基中有至少3個(gè)殘基對(duì)應(yīng)的Pβ>100。D
L
G
D
K
F
RL
VI
APβ54
130
7554
74
16083Pα101121
57
101
114
113
98
121106
108
142D
L
G
D
K
F
RL
VI
APβ54
130
7554
74
16083Pα101121
57
101
114
113
98
121106
108
142終止位點(diǎn):4個(gè)殘基Pβ的平均值小于100。片段的Pβ的平均值大于105,且Pβ的平均值大于Pα的平均值。114.6121.1D
L
G
D
K
F
RL
VI
APβ54
130
7554
74
16083Pα101121
57
101
114
113
98
121106
108
142重疊若重疊區(qū)域Pα的均值大于Pβ的均值,則預(yù)測(cè)為螺旋;反之,預(yù)測(cè)為折疊。
D
L
G
D
K
F
RL
VI
APα101121
57
101
114
113
98
121106
108
142Pβ
54
130
7554
74
16083如果折疊區(qū)域重新分配后,剩下的螺旋或者折疊的長(zhǎng)度小于5,則取消其分配的二級(jí)結(jié)果。
D
L
G
D
K
F
RL
VI
APα101121
57
101
114
113
98
121106
108
142Pβ
54
130
7554
74
16083轉(zhuǎn)角從第j個(gè)殘基開始的連續(xù)4個(gè)殘基片段 p(t)=f(j)f(j+1)f(j+2)f(j+3)p(t)>0.000075;0.000088LGDKf0.0610.0850.1790.095Pt59156146101Pα12157101114Pβ130755474四肽片段Pt的平均值大于100;且Pt的均值同時(shí)大于Pα的均值以及Pβ的均值。LGDKf0.0610.0850.1790.095Pt59156146101Pα12157101114Pβ130755474115.598.383.3
A
S
T
L
Y
E
DGT
Lα螺旋:Pα(4/相鄰6個(gè)殘基)>100。Pα(4)<100。長(zhǎng)度>5,Pα>Pβ。β折疊:Pβ(3/相鄰5個(gè)殘基)>100。Pβ(4)<100。Pβ>105,Pβ>Pα。重疊:Pα?Pβ。長(zhǎng)度>5。轉(zhuǎn)角:p(t)=f(j)f(j+1)f(j+2)f(j+3)>0.000075。Pt(4)>100,Pt>Pα,Pt>Pβ。/gor/(3)GOR方法基于信息論和貝葉斯統(tǒng)計(jì)學(xué)的方法。將蛋白質(zhì)序列當(dāng)作一連串的信息值來(lái)處理預(yù)測(cè)成功率65%。不僅考慮了被預(yù)測(cè)位置本身氨基酸殘基種類的影響,而且考慮了相鄰殘基種類對(duì)該位置構(gòu)象的影響。序列窗口中心殘基分析已知二級(jí)結(jié)構(gòu)的蛋白樣本,計(jì)算出中心殘基的二級(jí)結(jié)構(gòu)分別為螺旋、折疊和轉(zhuǎn)角時(shí)每種氨基酸出現(xiàn)在窗口中各個(gè)位置的頻率。表示α螺旋、β折疊或轉(zhuǎn)角表示一種氨基酸殘基
信息若和無(wú)關(guān),即,則若的發(fā)生有利于的發(fā)生,即,則若的發(fā)生不利于的發(fā)生,則,。產(chǎn)生17×20的得分矩陣?yán)镁仃囍械闹涤?jì)算待預(yù)測(cè)序列中每個(gè)殘基形成螺旋、折疊或轉(zhuǎn)角的概率。α螺旋β折疊轉(zhuǎn)角位置氨基酸處于二級(jí)結(jié)構(gòu)類型的信息值中心殘基r的二級(jí)結(jié)構(gòu)預(yù)測(cè)為最大的二級(jí)結(jié)構(gòu)類型。GORV加入進(jìn)化信息PSI-BLAST準(zhǔn)確率73.5%(4)機(jī)器學(xué)習(xí)(Machinelearning)方法最鄰近(nearestneighbor)方法將待預(yù)測(cè)的片段與數(shù)據(jù)庫(kù)中已知二級(jí)結(jié)構(gòu)的片段進(jìn)行相似性比較,利用打分矩陣計(jì)算出相似性得分,根據(jù)相似性得分,構(gòu)建出待預(yù)測(cè)片段的二級(jí)結(jié)構(gòu)。相似性大于30%的序列,預(yù)測(cè)準(zhǔn)確率高。神經(jīng)網(wǎng)絡(luò)(Neuralnetwork)方法使用已知結(jié)構(gòu)作為訓(xùn)練集,根據(jù)輸入的一級(jí)結(jié)構(gòu)和二級(jí)結(jié)構(gòu)的關(guān)系信息不斷調(diào)整各單元之間的權(quán)重,最終目標(biāo)是找到一種好的輸入與輸出的映象,并對(duì)未知二級(jí)結(jié)構(gòu)的蛋白進(jìn)行預(yù)測(cè)。準(zhǔn)確率約70%。ADeepLearningNetworkApproachtoabinitioProteinSecondaryStructurePrediction深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。支持向量機(jī)(Supportvectormachines,SVM)可以很好地預(yù)測(cè)轉(zhuǎn)角所需訓(xùn)練集較小SecondaryStructurePredictionbyChou-Fasman,GORandNeuralNetworkhttp://cib.cf.ocha.ac.jp/bitool/MIX/2F3IXXXXXXEEEEEEEEEEXXXXSSTTEEEEEEEESSSXXEEEEEEEXTTSSSTTXXXEEEEXSXXXXSSSSSTTTXSSSTTSTTSXTTTTSEEEXEEEEXXSSXXSSSSXXSSEEEEEEETTEEEEEEEXHHHHTXXSTTSTTSEEEEEXXXCFCEEHHHHHCCCCCCCCCHHHHEEEEHHHHHHCHHHHHHHEEEEEEEEEEEHHHHHEEEEEEEECCCEECCCCCCCCCCCCCCHHHHHCCEECEEEEECCCCCEEHHHHHCCEEEEECEEHHHHHHHCCCCCCCCCCEEEEEHHHHHHCCCGORHHHHHHHHHHHHHCCCHTTHHHHHHHTTHHHHHHHHHHHHHHHCCEECCCCCTCHHEEEEETEEETTTCCCTTTCCCCCCCTCTTTHHHHEHTTCEEEETTCTHHHHHHHHEEEEEETTCEEEEEHTTTTTTTTEEHHHHHHHHHHHHHHNNCCCCCCCCCCCCCCCCCCCCCCCCHHHHCCCCCCHHHHHHHHCCCCCCCCCCCCCCEEEEECCCCCCCCCCCCCCCCCCCCCCCCCHHHHHHHCCCEEEECCCCCCHHHHHHHEEHHCCCCEEHHCCCCCCCCCCHHHHHHHHHHHHHHH29%30%31%根據(jù)氨基酸殘基的物理化學(xué)性質(zhì):疏水性、親水性、帶電性以及體積大小等,考慮殘基之間的相互作用。對(duì)于小于50個(gè)氨基酸殘基的肽鏈,預(yù)測(cè)準(zhǔn)確率可以達(dá)到73%。(5)基于已有知識(shí)(knowledge)的預(yù)測(cè)方法Lim方法疏水氨基酸丙氨酸(A)纈氨酸(V)亮氨酸(L)異亮氨酸(I)脯氨酸(P)苯丙氨酸(F)色氨酸(W)甲硫氨酸(M)親水氨基酸甘氨酸(G)絲氨酸(S)蘇氨酸(T)半胱氨酸(C)酪氨酸(Y)天冬酰胺(N)谷氨酰胺(Q)賴氨酸(K)精氨酸(R)組氨酸(H)天冬氨酸(D)谷氨酸(E)α螺旋序列第i、i+3、i+4位(如1、4、5)是疏水殘基;第i、i+1、i+4位(如7,8,11)為疏水殘基。
D
L
G
D
K
F
R
L
VI
A疏水¤¤¤¤¤¤親水◎◎◎◎◎β折疊埋藏的β折疊通常由連續(xù)的疏水殘基組成一側(cè)暴露的β折疊則通常具有親水-疏水的兩殘基重復(fù)模式
D
L
G
D
K
F
R
L
VI
A疏水¤¤¤¤¤¤親水◎◎◎◎◎點(diǎn)模式(bitpattern)方法八殘基片段以一個(gè)二進(jìn)制位代表一個(gè)殘基,疏水為1,親水為0,共八位。八殘基片段的親疏水模式可用0
255的數(shù)值表示預(yù)測(cè)準(zhǔn)確率為55%左右當(dāng)序列長(zhǎng)度小于50時(shí),準(zhǔn)確率較高。
D
L
G
D
K
F
R
L
VI
A疏水¤¤¤¤¤¤親水◎◎◎◎◎
D
L
G
D
K
F
R
L
VI
A疏水111111親水0
0
0
0
0α螺旋的特征模式對(duì)應(yīng)的值:9,12,13,17,18,19,25,27,29,31,34,36,38,44,45,46,47,50,51,54,55,59,61,62,77,201,205,217,219,237β折疊的特征模式:由連續(xù)的1或交替的01構(gòu)成無(wú)規(guī)則卷曲其他
D
L
G
D
K
F
R
L
VI
A疏水
¤¤¤¤¤¤親水◎◎◎◎◎
D
L
G
D
K
F
R
L
VI
A疏水
0
100010111120212223242526271248163264128162209232244A
S
T
L
Y
E
DGT
L¤◎◎¤◎◎◎◎◎¤1001000001教學(xué)大綱掌握:二級(jí)結(jié)構(gòu)預(yù)測(cè)軟件,比較建模法,折疊識(shí)別法,從頭預(yù)測(cè)法,基于相似性的方法,基于三維基序的方法了解:多序列比對(duì)預(yù)測(cè),CASP和CAFASP實(shí)驗(yàn)及其發(fā)現(xiàn),蛋白質(zhì)功能預(yù)測(cè)的意義,基于表面的方法,基于機(jī)器學(xué)習(xí)的方法(6)多序列比對(duì)(multiplesequencealignment)預(yù)測(cè)假設(shè)序列家族中的同源區(qū)有同樣的二級(jí)結(jié)構(gòu)。對(duì)序列進(jìn)行多序列比對(duì),找到和未知序列相似的序列家族,其構(gòu)象由多個(gè)同源序列對(duì)應(yīng)位置的構(gòu)象決定取出現(xiàn)次數(shù)最多的構(gòu)象,或?qū)Ω鞣N可能的構(gòu)象給出得分值。結(jié)合神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)等方法準(zhǔn)確性80%單序列預(yù)測(cè)所提供的信息只是殘基的順序而沒(méi)有其空間分布的信息預(yù)測(cè)準(zhǔn)確率不高多序列比對(duì)預(yù)測(cè)提高了二級(jí)結(jié)構(gòu)預(yù)測(cè)的準(zhǔn)確度(7)二級(jí)結(jié)構(gòu)預(yù)測(cè)相關(guān)軟件NameMethoddescriptionLinkSPIDER2ThemostcomprehensiveandaccuratepredictionbyiterativeDeepNeuralNetwork(DNN)forproteinstructuralpropertiesincludingsecondarystructure,localbackboneangles,andaccessiblesurfacearea(ASA)serverRaptorX-SS8predictboth3-stateand8-statesecondarystructureusingconditionalneuralfieldsfrom
PSI-BLASTprofilesserverNetSurfPProfile-basedneuralnetworkserverGORInformationtheory/BayesianinferenceGORVJpredNeuralnetwork
assignmentserverMeta-PPConsensuspredictionofotherserversserverPREDATORKnowledge-baseddatabasecomparisonserverPredictProteinProfile-basedneuralnetworkserverPSIPREDtwofeed-forward
neuralnetworks
whichperformananalysisonoutputobtainedfrom
PSI-BLASTserverPSSpredMultiple
backpropagation
neuralnetwork
predictorsfrom
PSI-BLAST
profilesserverFrag1DPredictionofbothsecondarystructureandShapeStrings(discretestatesofdihedralangles)usingprofilebasedfragmentmatchingmainpageJpredpbio.dundee.ac.uk/jpred4/index.html基本原理通過(guò)DSC、PHD、NNSSP、PREDATOR、ZPRED和MULPRED六種預(yù)測(cè)方法進(jìn)行預(yù)測(cè),它們都采用了多重序列的進(jìn)化信息。NNSSP依據(jù)最大同源性PDH采用神經(jīng)網(wǎng)絡(luò)DSC根據(jù)線性識(shí)別MULPRED聯(lián)合不同的單一序列預(yù)測(cè)方法PREDATOR考慮氫鍵傾向性ZPRED加權(quán)預(yù)測(cè)最后將六個(gè)結(jié)果總結(jié)為一個(gè)簡(jiǎn)單的文件格式。PREDATORhttp://mobyle.pasteur.fr/cgi-bin/portal.py?#forms::predator基于知識(shí)的數(shù)據(jù)庫(kù)比較2F3IXXXXXXEEEEEEEEEEXXXXSSTTEEEEEEEESSSXXEEEEEEEXTTSSSTTXXXEEEEXSXXXXSSSSSTTTXSSSTTSTTSXTTTTSEEEXEEEEXXSSXXSSSSXXSSEEEEEEETTEEEEEEEXHHHHTXXSTTSTTSEEEEEXXXJpredXXXXEEEEEEEEEEXXXXXXEEEEEEEEEEEEXXXXEEEEEEEXXXXEXXXXXXEEEEEEEXXXXXXXXXXXXXXXXXXXXXXXXXXXXEEEEEEEEEEEEXXXXXXXXEEEEEEEEEXXXEEEEEXXXXXXXXXXXXXXEEEEEEXXXXPREDATORXXXXXXXXEEEEEEXXXXXXXXXXXXXXXXXXHHHHHHHHHHHHEEEEEXXXXXXEEEEEEXXXXXXXXXXXXXXXXXXXXXXXHHHHHHHXXXEEEEEEXXXHHHHHHHHHHHHHXXXXXEEEXXXXXXXXXXXXXXXXHHHHHHHXXX50%30%三級(jí)結(jié)構(gòu)預(yù)測(cè)(1)比較模建法(2)折疊識(shí)別法(3)從頭預(yù)測(cè)法(4)CASP、CAFASP實(shí)驗(yàn)及其發(fā)現(xiàn)△※(1)比較建模(comparativemodeling)
(同源建模)目前預(yù)測(cè)結(jié)構(gòu)最成功的方法主要思想對(duì)于一個(gè)未知結(jié)構(gòu)的蛋白質(zhì),找到一個(gè)已知結(jié)構(gòu)的同源蛋白質(zhì),以該蛋白質(zhì)的結(jié)構(gòu)為模板,為未知結(jié)構(gòu)的蛋白質(zhì)建立結(jié)構(gòu)模型。序列相似性越高,結(jié)構(gòu)正確性、可信度就越高。若序列的等同部分超過(guò)60%,則預(yù)測(cè)結(jié)果將接近于實(shí)驗(yàn)得到的測(cè)試結(jié)果。序列A150個(gè)氨基酸序列B300個(gè)氨基酸相似度50%若目標(biāo)蛋白質(zhì)分子所屬的系統(tǒng)中有一個(gè)以上的分子有已知結(jié)構(gòu),并且和參考分子的序列相似程度在25%以上時(shí),一般而言可用同源建模方法得到目標(biāo)分子的合理模型。若沒(méi)有精確結(jié)構(gòu)的蛋白質(zhì)分子可供參考,或序列相似程度低于25%,以比較建模方法來(lái)建立蛋白質(zhì)分子模型成功的機(jī)會(huì)就不高,此時(shí)需利用其它實(shí)驗(yàn)數(shù)據(jù)的協(xié)助。步驟模板識(shí)別和初始比對(duì)比對(duì)校正主鏈生成環(huán)區(qū)建模側(cè)鏈建模模型優(yōu)化模型確證模板識(shí)別和初始比對(duì)BLAST與PDB中所有已知結(jié)構(gòu)序列比較比對(duì)校正采用更精致的方法以取得更優(yōu)的比對(duì)。多序列比對(duì)CLUSTALW一致性比較高的蛋白質(zhì)結(jié)構(gòu);高分辨率和低R值的結(jié)構(gòu);結(jié)構(gòu)越完整越好。主鏈生成拷貝在與模型序列的比對(duì)結(jié)果中出現(xiàn)的模板殘基的坐標(biāo)。殘基不同,只拷貝主鏈原子的坐標(biāo)。殘基相同,拷貝側(cè)鏈坐標(biāo)。環(huán)區(qū)建模環(huán)區(qū):預(yù)測(cè)序列未能與模板結(jié)構(gòu)比對(duì)上的區(qū)域序列的缺失:略去模板中的殘基;模板的缺失:將模板的主鏈截?cái)啵迦肴鄙俚臍埢?。主鏈產(chǎn)生構(gòu)象變化。預(yù)測(cè)環(huán)區(qū)構(gòu)象。基于知識(shí):從PDB中搜索與將被插入的環(huán)區(qū)兩端能夠匹配的已知環(huán)區(qū),復(fù)制其構(gòu)象?;谀芰浚河媚芰亢瘮?shù)判別環(huán)區(qū)的質(zhì)量,最小化該函數(shù),獲得最好的環(huán)區(qū)構(gòu)象。側(cè)鏈建模從高分辨率晶體結(jié)構(gòu)中提取的常見構(gòu)象體庫(kù),各個(gè)構(gòu)象體被依次嘗試并由不同能量函數(shù)打分。模型優(yōu)化預(yù)測(cè)側(cè)鏈構(gòu)象體
引起主鏈移動(dòng)
新的主鏈下的側(cè)鏈構(gòu)象體…
過(guò)程收斂。對(duì)模型進(jìn)行分子動(dòng)力學(xué)模擬。模擬蛋白質(zhì)的運(yùn)動(dòng),仿真其實(shí)際折疊過(guò)程。模型確證質(zhì)量驗(yàn)證。NameDescriptionLinkRaptorXremotehomologydetection,protein3Dmodeling,bindingsitepredictionserverCPHModelFragmentassemblyserverESyPred3DTemplatedetection,alignment,3DmodelingserverGeno3DSatisfactionofspatialrestraintsserverHHpredTemplatedetection,alignment,3DmodelingServerLOMETSLocalMetathreadingserverServerMODELLERSatisfactionofspatialrestraintsServerPhyreandPhyre2Remotetemplatedetection,alignment,3Dmodeling,multi-templates,abinitioserverBHAGEERATH-HCombinationofabinitiofoldingandhomologymethodsserverSTRUCTUROPEDIAWebInterfacetoMODELLERserverSWISS-MODELLocalsimilarity/fragmentassemblyserverSWISS-MODEL/自動(dòng)蛋白質(zhì)同源建模服務(wù)器。先在ExPdb晶體圖像數(shù)據(jù)庫(kù)中搜索相似性足夠高的同源序列,建立最初的原子模型,再對(duì)這個(gè)模型進(jìn)行優(yōu)化產(chǎn)生預(yù)測(cè)的結(jié)構(gòu)模型。(2)折疊識(shí)別法(Threading)遠(yuǎn)程同源蛋白質(zhì)的氨基酸序列大不相同,但是卻擁有極為相似的折疊類型。折疊識(shí)別(foldrecognition)建立序列到結(jié)構(gòu)的線索的過(guò)程折疊(fold)無(wú)論有無(wú)共同的進(jìn)化起源,只要具有相同排列和拓?fù)浣Y(jié)構(gòu)的主要二級(jí)結(jié)構(gòu),即將蛋白質(zhì)分類為具有相同的折疊。具有相同折疊的不同蛋白質(zhì)具有不同大小和構(gòu)象的二級(jí)結(jié)構(gòu)和轉(zhuǎn)角區(qū)的外圍元件。主要思想利用氨基酸的結(jié)構(gòu)傾向(如二級(jí)結(jié)構(gòu)、疏水性、極性等),評(píng)價(jià)一個(gè)序列所對(duì)應(yīng)的結(jié)構(gòu)是否能夠適配到一個(gè)給定的結(jié)構(gòu)環(huán)境中。假定被預(yù)測(cè)蛋白質(zhì)序列的折疊類型與某一已知結(jié)構(gòu)的蛋白質(zhì)的折疊類型相同。與已知空間結(jié)構(gòu)的蛋白質(zhì)比對(duì)組成已知三維折疊結(jié)構(gòu)的數(shù)據(jù)庫(kù)一種適合于進(jìn)行序列-結(jié)構(gòu)比對(duì)的三維折疊信息的表示方法一個(gè)序列-結(jié)構(gòu)匹配函數(shù)對(duì)匹配程度進(jìn)行打分建立最優(yōu)線索的策略,或是進(jìn)行序列-結(jié)構(gòu)比對(duì)的策略一種評(píng)價(jià)序列-結(jié)構(gòu)比對(duì)顯著性的方法實(shí)現(xiàn)過(guò)程給定一個(gè)結(jié)構(gòu)未知的序列及一些蛋白質(zhì)的結(jié)構(gòu),目標(biāo)序列與已知折疊結(jié)構(gòu)進(jìn)行比較。使用評(píng)價(jià)序列與結(jié)構(gòu)匹配優(yōu)劣的函數(shù)作為判別標(biāo)準(zhǔn),找到目標(biāo)序列最佳的折疊結(jié)構(gòu)。以此預(yù)測(cè)目標(biāo)蛋白結(jié)構(gòu)。NameDescriptionLinkRaptorXRemotetemplatedetection,single-templateandmulti-templatethreading,totallydifferentfromandmuchbetterthantheoldprogramRAPTORdesignedbythesamegroupserverHHpredTemplatedetection,alignment,3DmodelingserverI-TASSERCombinationofabinitiofoldingandthreadingmethodsServermGenTHREADER/GenTHREADERSequenceprofileandpredictedsecondarystructuremainpageMUSTERprofile-profilealignmentServerPhyreandPhyre2Remotetemplatedetection,alignment,3Dmodeling,multi-templates,abinitioServerSUPERFAMILYHiddenMarkovmodelingmainpageSPARKS-X3DstructuremodelingbyFoldrecognitionaccordingtoSequenceprofilesandstructuralprofilesServerBBSP-BuildingBlocksStructurePredictorHybridtemplate-basedmainpagePhyre2http://www.sbg.bio.ic.ac.uk/~phyre2/html/page.cgi?id=index基于每個(gè)蛋白特異的位點(diǎn)打分矩陣進(jìn)行profile-profile比對(duì)。Template-basemodeling
TBM(3)從頭預(yù)測(cè)(Ab
initio)法沒(méi)有已知結(jié)構(gòu)的同源蛋白質(zhì)沒(méi)有已知結(jié)構(gòu)的遠(yuǎn)程同源蛋白質(zhì)組成一種蛋白質(zhì)的幾何表示方法對(duì)蛋白質(zhì)和溶劑的表示形式作近似處理,例如,使用一個(gè)或少數(shù)幾個(gè)原子代表一個(gè)氨基酸殘基一種能量函數(shù)及其參數(shù),或者一個(gè)合理的構(gòu)象得分函數(shù)計(jì)算各種構(gòu)象的能量通過(guò)對(duì)已知結(jié)構(gòu)的蛋白質(zhì)進(jìn)行統(tǒng)計(jì)分析,可以確定蛋白質(zhì)構(gòu)象能量函數(shù)中的各個(gè)參數(shù)或者得分函數(shù)一種構(gòu)象空間搜索技術(shù)選擇一個(gè)優(yōu)化方法,以便對(duì)構(gòu)象空間進(jìn)行快速搜索,迅速找到與某一全局最小能量相對(duì)應(yīng)的構(gòu)象關(guān)鍵構(gòu)象空間搜索能量函數(shù)的建立NameDescriptionLinkEVfoldEvolutionarycouplingscalculatedfromcorrelatedmutationsinaproteinfamily,usedtopredict3Dstructurefromsequencesaloneandtopredictfunctionalresiduesfromcouplingstrengths.PredictsbothglobularandtransmembraneproteinsServerQUARKMonteCarlofragmentassemblyServerI-TASSERThreadingfragmentstructurereassemblyServerCABS-FOLDServerfordenovomodeling,canalsousealternativetemplates(consensusmodeling)serverBhageerathAcomputationalprotocolformodelingandpredictingproteinstructuresattheatomiclevelServerPEP-FOLDDenovoapproach,basedonaHMMstructuralalphabetServerEVfold/evfold-web/evfold.do(4)CASP、CAFASP實(shí)驗(yàn)及其發(fā)現(xiàn)CASP:結(jié)構(gòu)預(yù)測(cè)評(píng)估,CriticalAssessmentofStructurePredictionCAFASP:全自動(dòng)結(jié)構(gòu)預(yù)測(cè)評(píng)估,CriticalAssessmentofFullyAutomatedStructurePrediction由一個(gè)或多個(gè)結(jié)構(gòu)域組成的,已測(cè)定但尚未發(fā)表、或有望得到NMR或X射線蛋白質(zhì)結(jié)構(gòu)的序列提供給CASP和CAFASP的研究組各研究組對(duì)序列的三維結(jié)構(gòu)進(jìn)行預(yù)測(cè),將結(jié)果提交服務(wù)器進(jìn)行獨(dú)立的評(píng)價(jià)。以定量方式衡量多個(gè)研究組在預(yù)測(cè)結(jié)構(gòu)中取得的成功。/TemplateBasedProteinStructureModelingbyGlobalOptimizationinCASP11CRFalign折疊識(shí)別能量折疊數(shù)據(jù)庫(kù)CD-HIT質(zhì)量評(píng)價(jià)過(guò)程QA1排秩模板模板分組ModCSA,生成8個(gè)模板列表用MSACSA對(duì)每個(gè)模板列表中的15個(gè)模板進(jìn)行多序列比對(duì)功能預(yù)測(cè)意義方法※蛋白質(zhì)是調(diào)控和實(shí)現(xiàn)所有生物功能的分子機(jī)器。結(jié)構(gòu)蛋白-膠原酶-維持和增強(qiáng)結(jié)締組織機(jī)械酶-肌漿球蛋白-實(shí)現(xiàn)宏觀和微觀上的運(yùn)動(dòng)各種酶-參與生理功能某些蛋白質(zhì)與DNA或RNA相互作用產(chǎn)生新的蛋白質(zhì)意義深入理解生命運(yùn)動(dòng)規(guī)律更好地理解疾病發(fā)生機(jī)制,用于治療和藥物設(shè)計(jì)GeneOntology(GO)方法實(shí)驗(yàn)方法計(jì)算方法※(1)基于結(jié)構(gòu)相似性的方法(2)基于三維基序的方法(3)基于表面的方法(4)基于機(jī)器學(xué)習(xí)的方法(1)基于結(jié)構(gòu)相似性(similarity)的方法在進(jìn)化中保守的蛋白質(zhì)高級(jí)結(jié)構(gòu)通常對(duì)應(yīng)某
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 煤礦定崗定員方案范本
- 課外英語(yǔ)實(shí)踐活動(dòng)組織方案
- 合肥固銹劑施工方案
- 紅旗路水管施工方案
- 江西省鷹潭市2025屆高三第一次模擬考試語(yǔ)文試題及參考答案
- 廠區(qū)大門圍墻施工方案
- 路政現(xiàn)場(chǎng)處置方案范本
- 環(huán)保項(xiàng)目質(zhì)量控制與創(chuàng)優(yōu)方案
- 韶關(guān)排水帶施工方案
- 教育心理學(xué)專業(yè)學(xué)生學(xué)習(xí)試題
- 心理咨詢保密協(xié)議(2024版)
- 土地整治項(xiàng)目工程復(fù)核工作流程
- 2024年民航安全知識(shí)培訓(xùn)考試題庫(kù)及答案(核心題)
- 水文資料在線整編規(guī)范
- (高清版)JTGT 3360-02-2020 公路橋梁抗撞設(shè)計(jì)規(guī)范
- 2024屆高考語(yǔ)言運(yùn)用之比較賞析句子的表達(dá)效果+
- GB/T 43933-2024金屬礦土地復(fù)墾與生態(tài)修復(fù)技術(shù)規(guī)范
- 施工現(xiàn)場(chǎng)動(dòng)火作業(yè)安全(旁站記錄)
- 《化妝品技術(shù)》課件-粉類修容遮瑕產(chǎn)品
- 工程變更通知單ECN模板-20220213
- 2024武漢六校聯(lián)考高一(下)期中數(shù)學(xué)試卷及解析
評(píng)論
0/150
提交評(píng)論