藥物分子設計第九講_第1頁
藥物分子設計第九講_第2頁
藥物分子設計第九講_第3頁
藥物分子設計第九講_第4頁
藥物分子設計第九講_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、蛋白質結構預測(一)Protein Structure Prediction (I)1Protein Structure PredictionFrom Sequence to Native Structure2Protein Structure PredictionPSI-BLAST3Protein Structure Prediction4Multiple Sequence AlignmentToolsClustalWMultiple sequence alignments reveal:conservation of individual residuesconservation of r

2、egionsdifferences within protein families5ToolsHMMerProfileFor each position along the sequence, tabulate how often each type of amino acid occur (include . for gap)The pro always of size Nx21, no matter how many sequences are considered6Protein Structure Prediction7Secondary Structure PredictionGiv

3、en a protein sequence a1a2aN, secondary structure prediction aims at defining the state of each amino acid ai as being either H (helix), E (extended strand), or O (other) (Some methods have 4 states: H, E, T for turns, and O for other).The quality of secondary structure prediction is measured with a

4、 Qindex (Qhelix, Qstrand, Qcoil) or Q3. Q3 is the percent of residues that match “reality” (X-ray structure). 8Secondary Structure PredictionAmino acid sequenceActual Secondary StructureQ3=22/29=76%Q3=22/29=76%ALHEASGPSVILFGSDVTVPPASNAEQAKhhhhhooooeeeeoooeeeooooohhhhhohhhooooeeeeoooooeeeooohhhhhhhhh

5、hhoooohhhhooohhhooooohhhhh(useful prediction)(terrible prediction) Q3 for random prediction is 33% Secondary structure assignment in real proteins is uncertain to about 10%. Therefore, a “perfect” prediction would have Q3=90%.Limitations of Q3 (Q3 = Npredicted100%/ Nobserved) 9Secondary Structure Pr

6、edictionChou-Fasman MethodStart by computing amino acids propensities to belong to a given type of secondary structure:Propensities 1 mean that the residue type i is likely to be found in the corresponding secondary structure type.10Chou-Fasman Method參數(shù)值P、P和Pt是分別在原有相應值的基礎上乘以100得到 Secondary Structure

7、 Prediction11Secondary Structure PredictionChou-Fasman MethodHelix prediction沿著蛋白質序列尋找螺旋核,相鄰的6個殘基中如果有至少4個殘基傾向于形成螺旋,即有4個殘基對應的P 100,則認為是螺旋核。然后從螺旋核向兩端延伸,直至四肽片段P 的平均值小于100為止。按上述方式找到的片段長度大于5,并且P 的平均值大于P 的平均值,那么這個片段的二級結構就被預測為螺旋。此外,不容許Pro在螺旋內部出現(xiàn),但可出現(xiàn)在C末端以及N端的前三位,這也用于終止螺旋的延伸。12Secondary Structure Prediction

8、Chou-Fasman MethodStrand Prediction如果相鄰6個殘基中若有4個傾向于形成折疊,即有4個殘基對應的P 100,則認為是折疊核。折疊核向兩端延伸直至4個殘基P 的平均值小于100為止。若延伸后片段的P 的平均值大于105,并且P 的平均值大于P 的平均值,則該片段被預測為折疊。13Secondary Structure PredictionChou-Fasman MethodTurn Prediction轉角的模型為四肽組合模型,要考慮每個位置上殘基的組合概率,即特定殘基在四肽模型中各個位置的概率。在計算過程中,對于從第i個殘基開始的連續(xù)4個殘基的片段,將上述概率

9、相乘,根據(jù)計算結果判斷是否是轉角。如果f(i)f(i+1)f(i+2)f(i+3)大于7.510-5,四肽片段Pt的平均值大于100,并且Pt 的均值同時大于P 的均值以及P 的均值,則可以預測這樣連續(xù)的4個殘基形成轉角。14Secondary Structure PredictionChou-Fasman MethodConflict 假如預測出的螺旋區(qū)域和折疊區(qū)域存在重疊,則按照重疊區(qū)域P 均值和P 均值的相對大小進行預測,若P 的均值大于P 的均值,則預測為螺旋;反之,預測為折疊。 15Secondary Structure PredictionGOR Method是一種基于信息論和貝葉

10、斯統(tǒng)計學的方法GOR將蛋白質序列當作一連串的信息值來處理GOR方法不僅考慮被預測位置本身氨基酸殘基種類的影響,而且考慮相鄰殘基種類對該位置構象的影響 16Secondary Structure PredictionGOR Method通過對已知二級結構的蛋白樣本集進行分析,計算出中心殘基的二級結構分別為螺旋、折疊和轉角時每種氨基酸出現(xiàn)在窗口中各個位置的頻率,從而產(chǎn)生一個1720的得分矩陣。然后利用矩陣中的值來計算待預測的序列中每個殘基形成螺旋、折疊或者轉角的概率。 17Secondary Structure PredictionGOR Method首先考慮兩個事件S和R的條件概率P(S|R),

11、即在R發(fā)生的條件下,S發(fā)生的概率P(S,R)是同時觀察到S 和R 的聯(lián)合概率,而P(R)是R 的出現(xiàn)概率。在二級結構預測過程中,S 表示特殊的二級結構類型,R 代表氨基酸殘基,P(S|R)就是殘基R 處于二級結構類型S 的概率。P(S)是在統(tǒng)計過程中觀察到二級結構類型S 的概率。Statistics: helices 29.7%, strands 19.7%, turns 12.2%, coils 38.3%18Secondary Structure PredictionLim Method 氨基酸的理化性質對二級結構影響較大在進行結構預測時考慮氨基酸殘基的物理化學性質。如疏水性、極性、側鏈基

12、團的大小等,根據(jù)殘基各方面的性質及殘基之間的組合預測可能形成的二級結構?!笆杷浴笔前被岬囊环N重要性質,疏水性的氨基酸傾向于遠離周圍水分子,將自己包埋進蛋白質的內部。19Secondary Structure PredictionLim MethodHelix prediction在一段序列中發(fā)現(xiàn)第i、i+3、i+4位(如1、4、5)是疏水殘基時,這一片段就被預測為螺旋; 當發(fā)現(xiàn)第i、i+1、i+4位(如7,8,11)為疏水殘基時,這一片段也被預測為螺旋。20Secondary Structure PredictionLim MethodStrand prediction 對于折疊,也存在著

13、一些特征的親疏水殘基間隔模式,埋藏的折疊通常由連續(xù)的疏水殘基組成,一側暴露的折疊則通常具有親水-疏水的兩殘基重復模式。原則上,通過在序列中搜尋特殊的親疏水殘基間隔模式,就可以預測螺旋和折疊。 21Secondary Structure PredictionNeural Network用于蛋白質二級結構預測的基本神經(jīng)網(wǎng)絡模型為三層的前饋網(wǎng)絡,包括輸入層、隱含層以及輸出層。22Neural Network預測結果是窗口所取的輸入樣本中心的殘基所在位置的二級結構。 例如: Pattern LSADQISTVQASFDK Target H沿蛋白質的氨基酸序列依次取一定大小的窗口,將窗口內的序列片段進行

14、編碼,窗口包括中心氨基酸殘基及左右m個(共2m+1個)殘基,每一個殘基用21個神經(jīng)元編碼,因此,輸入層共有21(2m+1)個神經(jīng)元。 例如:Alanine 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0輸出層有3個神經(jīng)元,分別對應于窗口中心殘基的H、E、C三態(tài)。結果由三個輸出中值最大的那個決定。 例如:輸出值為(0.2,0.1,0.1),則認為是螺旋結構。編碼為:1 0 0 Secondary Structure Prediction23Neural Network PHDsec (Pro neural network system from Heidelb

15、erg)Secondary Structure Prediction24Neural Network PHDsec (Pro neural network system from Heidelberg)Input25Neural Network PHDsec (Pro neural network system from Heidelberg)First Layer26Neural Network PHDsec (Pro neural network system from Heidelberg)Second Layer27Secondary Structure PredictionDSSP (Database of Secondary Structure in Proteins)H = alpha helixB = residue in isolated bata-bridgeE = extended strand, participates in beta ladderG = 3/10 helixI = pi helixT = hydrogen bonded turnS = bend28Secondary Structure PredictionAlpha helix, 3/10 helix and pi helix Alpha helixHydrogen bonds

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論