版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
熱點殘基預測的總結13級艾美樂相關背景
近年來,研究人員對蛋白質相互作用網(wǎng)絡的研究中發(fā)現(xiàn),在蛋白質相互作用界面上存在一種很特殊的殘基,當使用丙氨酸突變掃描技術將這類殘基誘發(fā)突變成丙氨酸后,會使結合自由能產(chǎn)生很大的變化,研究人員將這些殘基稱為熱點殘基。通過進一步的研究發(fā)現(xiàn),熱點殘基主要是集中在蛋白質相互作用界面的中心部位,它們對保持蛋白質的功能和相互作用結合的穩(wěn)定性起著非常重要的作用。因此對蛋白質相互作用界面中熱點殘基的研究不僅助于我們理解未知蛋白質的功能以及特定生物功能的生物特性,還能為研究人員探明致病微生物的致病機理,有助于新型藥物的研發(fā),從而提高人類的生活質量。1.研究意義2.研究技術目前研究蛋白質相互作用界面中熱點殘基的技術方法主要是丙氨酸突變掃描實驗,該方法就是把蛋白質結合界面的氨基酸殘基突變成丙氨酸,然后檢查這個過程中結合自由能的變化,如果超過某個值就被認定為熱點殘基。該方法的優(yōu)點是識別精度非常高,但缺點是本錢高,周期長,需要消耗大量的人力和物力。因為蛋白質結合界面中的氨基酸殘基數(shù)量非常大,但熱點殘基的數(shù)量往往很小,所以生物實驗中要找到熱點殘基是相當困難的,因此通過數(shù)據(jù)挖掘和機器學習的方法來預測蛋白質相互作用界面的熱點殘基的方法應運而生,通過預測模型可以找出大局部的熱點殘基,然后結合生物實驗進行驗證,不僅能大大降低發(fā)現(xiàn)熱點殘基的本錢,而且能縮短周期,提高效率。3.研究現(xiàn)狀
正因為熱點殘基在蛋白質相互作用中有著非常重要地位,研究人員對它的生物屬性進行了大量的研究。Bogan和Thorn的研究說明,熱點殘基和非熱點殘基在氨基酸組成上存在著明顯區(qū)別,色氨酸、酪氨酸和精氨酸在熱點殘基中出現(xiàn)的頻率較高,蘇氨酸、亮氨酸、纈氨酸和絲氨酸這些氨基酸在蛋白質結構中有著重要地位,但是它們在熱點殘基中出現(xiàn)卻很少,而天冬酰胺和天冬氨酸相比谷酰胺和谷氨酸,在熱點殘基中出現(xiàn)更加頻繁,原因可能是側鏈構象熵的不同。Li和Liu在研究中發(fā)現(xiàn),熱點殘基通常是被一些在結合自由能上奉獻不大的殘基環(huán)繞著,這些殘基在熱點殘基周圍形成了一個環(huán)形結構,這個結構被稱為“O〞環(huán),它的作用是使熱點殘基與周圍的水分子隔離開來而不能與之發(fā)生相互作用。另外一些研究說明,熱點殘基比非熱點殘基在進化過程中更加的保守。熱點殘基的相關介紹一般熱點殘基通常被定義為丙氨酸突變后引起結合自由能的變化值大于等于2.0kcal/mol的那些結合面上的殘基。其它:
??G>=2.0kcal/mol為熱點殘基,??G<2.0kcal/mol為非熱點殘基。
??G>=2.0kcal/mol為熱點殘基,??G<0.4kcal/mol為非熱點殘基。
??G>=1.0kcal/mol為熱點殘基,??G<1kcal/mol為非熱點殘基。界面殘基的定義:?ASA≥1?2的殘基?;蛘?,界面殘基是和其它鏈有原子連接的殘基。這里的原子連接可以用CSUprogram計算。熱點殘基數(shù)據(jù)庫ASEdb:丙氨酸掃描熱力學數(shù)據(jù)庫,就是實驗獲得的熱點殘基的數(shù)據(jù)庫。BID:結合界面數(shù)據(jù)庫,通過從文獻中挖掘經(jīng)過實驗驗證的熱點殘基數(shù)據(jù)庫。通常從ASEdb數(shù)據(jù)庫中獲得的數(shù)據(jù)作為訓練集,從BID數(shù)據(jù)庫中獲得的數(shù)據(jù)作為測試集熱點殘基的預測方法從策略和技術上面來說:
策略:1.基于能量的2.基于特征的3.基于綜合信息的1.經(jīng)驗公式a.能量函數(shù)b.經(jīng)驗函數(shù)2.機器學習a.遺傳算法b.人工神經(jīng)網(wǎng)絡c.決策樹d.支持向量機e.貝葉斯網(wǎng)絡技術:基于能量的策略需要計算?G,例如,計算丙氨酸掃描技術,就是利用結合自由能函數(shù)來計算丙氨酸突變效應引起的?G的變化,根據(jù)計算出的??G來標識熱點殘基。LetAandBdenotetheunboundmonomers
andABthecomplex
weassumethatthe
alaninemutationoccursonproteinA.Wefurtherdenote
with(wt)thewild-typemoleculesandwith(mut)the
mutatedmolecules
基于特征的策略,利用各種特征把特點殘基于界面上的其余殘基區(qū)分開來,主要包括:從序列提取的特征,從結構提取的特征,從分子相互作用信息提取特征?,F(xiàn)在大多數(shù)都是基于特征的。特征:序列:PSSM,sequenceentropy等結構:?ASA,Ca等分子相互作用:氫鍵,庫侖力等基于序列特征。從AAindex中提取154個特征,經(jīng)過提取去〔去冗余〕最終得到132個特征。提出了一個新的編碼方案;PSSM*AA1點乘。對這132個特征分別建立分類器,最終選出10個最好的特征。然后集成?;谛蛄泻徒Y構的特征,ASA,BC,Phy,ESE,SE,PSSM。本論文,首先分成兩組ASA,BC,Phy和Phy,ESE,SE,PSSM。sequence-basedsvm,structure-basedsvm和allfeaturessvm,分別進行預測。本論文也是多種特征,包含序列和結構信息,包含62個特征,然后利用特征選擇F-SCORE。然后獲得9個特征,構建9個基于ASA或PI的單特征SVM模型,然后通過投票來預測熱點殘基?;谀芰康奶卣?,vanderWaalspotentials,solvationenergy,hydrogenbonds,Coulombelectrostatics。3種類別,共12個特征。SVMx特征根據(jù)correlationofenergytermswithobserved??Gvalues.本論文利用108個序列,結構,能量特征。然后又分別計算兩結構相鄰的特征,Euclideandistance和Voronoidiagram一共324個特征。進行兩步特征選擇,隨機森林和序列向后消除。獲得38個優(yōu)秀特征,之后利用SVM進行分類,最后進行集成。thenearestcontactresidueintheotherface
andthenearestcontactresiduein
thesameface本論文也是利用序列,結構和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國裘皮手套數(shù)據(jù)監(jiān)測研究報告
- 基于數(shù)據(jù)融合的河道模型數(shù)據(jù)底板構建關鍵技術研究
- 2025年版注塑設備售后服務與技術支持合同范本3篇
- 2025年個人砌磚工程承包建筑材料采購與質量監(jiān)管合同2篇
- 2025年度美容院品牌形象設計及推廣合同8篇
- 二零二五年度成都離婚協(xié)議公證法律咨詢及服務合同3篇
- 二零二四年度醫(yī)療機構醫(yī)療器械質量控制合同3篇
- 二零二五年度果園承包與農(nóng)業(yè)廢棄物資源化利用合同7篇
- 二零二五版美團外賣商家知識產(chǎn)權保護與使用合同4篇
- 二零二五年度程序員入職知識產(chǎn)權保護合同4篇
- 2024年山東省泰安市高考物理一模試卷(含詳細答案解析)
- 護理指南手術器械臺擺放
- 腫瘤患者管理
- 2025年中國航空部附件維修行業(yè)市場競爭格局、行業(yè)政策及需求規(guī)模預測報告
- 2025春夏運動戶外行業(yè)趨勢白皮書
- 《法制宣傳之盜竊罪》課件
- 通信工程單位勞動合同
- 2024年醫(yī)療器械經(jīng)營質量管理規(guī)范培訓課件
- 零部件測繪與 CAD成圖技術(中職組)沖壓機任務書
- 2024年計算機二級WPS考試題庫380題(含答案)
- 高低壓配電柜產(chǎn)品營銷計劃書
評論
0/150
提交評論