




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、同源模建的方法與結(jié)果分析Version 1.0.2-序言:作為一個(gè)以實(shí)驗(yàn)為主的生化工作者來(lái)說(shuō),很多時(shí)候可以通過(guò)分子生物學(xué)手段獲取自己需要的目的基因,并在各種表達(dá)載體和宿主中進(jìn)行對(duì)應(yīng)蛋白的表達(dá),隨后對(duì)于這些蛋白的特性進(jìn)行研究,這也是一般酶學(xué)研究的特定套路。而近十幾年來(lái),人們開(kāi)始思考是否能夠?qū)⑻匦耘c蛋白質(zhì)的三級(jí)結(jié)構(gòu)進(jìn)行關(guān)聯(lián),從分子水平理解蛋白質(zhì)與底物之間的相互作用呢?于是類(lèi)似于蛋白結(jié)構(gòu)模建、分子對(duì)接、分子動(dòng)力學(xué)模擬、量化計(jì)算等多種手段相繼被創(chuàng)造以及應(yīng)用。在這些方法中,同源模建無(wú)疑是最基礎(chǔ)也是最重要的一個(gè)步驟,因?yàn)槠滟|(zhì)量的好壞直接決定了后續(xù)工作是否可信。因此,本文打算就同源模建的基本原理、常用軟件及
2、服務(wù)器以及結(jié)果分析與改進(jìn)提供一些個(gè)人的經(jīng)驗(yàn),并希望各位朋友能夠給予批評(píng)指正。1. 同源模建的原理及應(yīng)用限制兩點(diǎn)基本原理:1.一個(gè)蛋白質(zhì)的結(jié)構(gòu)由其氨基酸序列唯一的決定。知道其一級(jí)序列,至少在理論上足以獲取其結(jié)構(gòu)2. 結(jié)構(gòu)在進(jìn)化中更穩(wěn)定,變化比序列層面的變化要緩慢許多。應(yīng)用限制:模板蛋白和目標(biāo)蛋白的序列一致性需要大于30%,且越大建模準(zhǔn)確性越有保障。了解了基本的原理,我們需要知道在實(shí)際操作中,同源模建都需要怎么樣進(jìn)行。同源模建的過(guò)程從實(shí)踐中可分為以下7個(gè)步驟:1 模板識(shí)別和初始比對(duì)在序列一致性比較高的時(shí)候,可以通過(guò)簡(jiǎn)單的序列比對(duì)程序如BLAST獲取目標(biāo)蛋白的結(jié)構(gòu)(將比對(duì)的數(shù)據(jù)庫(kù)選擇為PDB數(shù)據(jù)庫(kù))
3、。2 比對(duì)結(jié)果的校正用以上的方法確定一個(gè)或多個(gè)建模模板后,應(yīng)該采用更為精確的方法已取得更優(yōu)的比對(duì)結(jié)果。有時(shí)在序列一致性較低的區(qū)域比對(duì)兩條序列可能會(huì)具有困難,這個(gè)時(shí)候,我們可以采取其他同源蛋白序列一起參與比對(duì)來(lái)找到解決的辦法。3 主鏈生成比對(duì)完成后,就可以開(kāi)始實(shí)際的建模過(guò)程了,相對(duì)與后面幾步來(lái)說(shuō),主鏈建模時(shí)最沒(méi)有難度的一步了,因?yàn)榇蟛糠周浖际峭ㄟ^(guò)簡(jiǎn)單的拷貝模板蛋白的主鏈坐標(biāo)來(lái)實(shí)現(xiàn)這一目的的。4 環(huán)區(qū)建模這一部分主要是目標(biāo)蛋白和模板蛋白的比對(duì)結(jié)果中存在缺口的部分如何處理的問(wèn)題。第一種解決的方式是略去模板蛋白存在的殘基,留下一個(gè)必須補(bǔ)上的缺口。另一種情況是將主鏈截?cái)啵迦肴鄙俚臍埢? 側(cè)鏈建模當(dāng)
4、我們比較結(jié)構(gòu)相似的蛋白質(zhì)中保守殘基的側(cè)鏈構(gòu)象時(shí),我們會(huì)發(fā)現(xiàn)他們的側(cè)鏈構(gòu)象通常會(huì)比較相似。這就告訴我們?nèi)绻颖J貧埢膫?cè)鏈構(gòu)象完整的拷貝到模建蛋白上時(shí),在某些時(shí)候比先拷貝主鏈構(gòu)象之后,再預(yù)測(cè)側(cè)鏈構(gòu)象來(lái)的可靠。但是這一經(jīng)驗(yàn)規(guī)則在實(shí)際運(yùn)用中僅在兩者序列一致性較高,并且保守殘基之間形成接觸的情況下才能實(shí)現(xiàn)。因此,在現(xiàn)有的測(cè)序中,都是構(gòu)造各種可能的構(gòu)象體,并利用基于能量的函數(shù)打分來(lái)實(shí)現(xiàn)側(cè)鏈構(gòu)象的選擇的。6 模型優(yōu)化模型優(yōu)化其實(shí)是一個(gè)比較復(fù)雜的問(wèn)題,其質(zhì)量依賴(lài)于高精確性的預(yù)測(cè)側(cè)鏈構(gòu)象體,而為了達(dá)到這種目的,我們需要正確的主鏈,這一步驟實(shí)際又依賴(lài)于側(cè)鏈構(gòu)象體正確的堆積。因此,這一優(yōu)化過(guò)程是迭代直至收斂的過(guò)程
5、。需要注意的是,對(duì)于結(jié)構(gòu)進(jìn)行能量?jī)?yōu)化需要十分謹(jǐn)慎。因此偏離正確結(jié)構(gòu)的途徑比指向正確結(jié)構(gòu)的途徑多很多。在優(yōu)化中的每一步可以排除一些大的誤差,但是也會(huì)引入很多小的誤差,這些小的誤差經(jīng)過(guò)多步積累,就有可能使你的結(jié)果更加偏離正確的結(jié)構(gòu)。7 模型驗(yàn)證所有的模型都包含誤差,誤差的多少主要依賴(lài)于兩方面的內(nèi)容:1.序列一致性的高低,越低的話引入誤差的可能性就越大。2. 模板蛋白中的誤差:如果這種誤差是局域性的,尤其是遠(yuǎn)離活性位點(diǎn)的,對(duì)于你最后進(jìn)行分子對(duì)接等研究室?guī)缀鯖](méi)有影響的。如果是蛋白整體的,則需要小心處理。2. 常用軟件、服務(wù)器2.1常用服務(wù)器:SWISS-MODEL: 網(wǎng)址http:/swissmode
6、/SWISS-MODEL可能是目前非專(zhuān)業(yè)人士應(yīng)用最為廣泛的一個(gè)在線建模服務(wù)器了。其常見(jiàn)的模式可分為:1. Automated mode:自動(dòng)模式,可以稱(chēng)為是最傻瓜的方式了進(jìn)去之后只需要填上你的email以及在底下的框框內(nèi)輸入你所想模建的蛋白序列,再點(diǎn)擊submit modeling request即可,底下還有高級(jí)選項(xiàng),支持自定義模板蛋白的pdb以及chain,或者自己上傳模板文件,簡(jiǎn)而言之,真是非常易于操作。這種方法適用于PDB數(shù)據(jù)庫(kù)中存在高度同源的蛋白結(jié)構(gòu)時(shí)的建模(蛋白序列一致性最好大于80%,個(gè)人經(jīng)驗(yàn))2. Alignment mode:比對(duì)模式基本的操作和自動(dòng)模
7、式類(lèi)似,但是其序列提交的時(shí)候可以提交目標(biāo)蛋白與模板蛋白的序列比對(duì)結(jié)果(FASTA,MSF,ClustalW等格式),如下所示:這種模式比較適合目標(biāo)蛋白與模板蛋白具有較高的相似性,但是利用自動(dòng)模式未必能找到最合適模板的情況,或者使用者有目的的使用特定的模板蛋白(比如具有更為相似的活性位點(diǎn)結(jié)果,而不是更為相似的整體結(jié)構(gòu))3. Project mode:項(xiàng)目模式項(xiàng)目模式主要是針對(duì)于目標(biāo)蛋白和模板蛋白序列的相似性不高,兩者的三級(jí)結(jié)構(gòu)相似程度難以直接通過(guò)序列比對(duì)獲得,需要人工插入調(diào)節(jié)(借助蛋白結(jié)構(gòu)編輯軟件deepview),這個(gè)模式能夠交互式的提高前面兩種模式的模型質(zhì)量(通過(guò)將前兩種模式模建出的蛋白進(jìn)行
8、人為調(diào)整)。屬于針對(duì)比較困難(序列一致性較低)的建模的一種有效途徑。 I-TASSAR: /I-TASSER/ (貌似被墻了?)*也可以下載本地安裝包個(gè)人使用評(píng)價(jià):根據(jù)結(jié)果質(zhì)量檢驗(yàn),貌似在用過(guò)的自動(dòng)建模的軟件里是結(jié)果最好的了不過(guò)缺點(diǎn)是給結(jié)果時(shí)間比較長(zhǎng)。 HOMER: http:/protein.cribi.unipd.it/homer/個(gè)人使用評(píng)價(jià):這個(gè)軟件需要序列蛋白與模板蛋白的結(jié)構(gòu)比對(duì)文件上傳(FASTA格式),可對(duì)模建的蛋白進(jìn)行l(wèi)oop區(qū)優(yōu)化以及側(cè)鏈優(yōu)化。尚未深入的研究 CPHmodels 3.2 Server: http
9、:/www.cbs.dtu.dk/services/CPHmodels/個(gè)人使用評(píng)價(jià):貌似沒(méi)有任何特色,只需要一條蛋白序列既可以完成自動(dòng)建模。2.2 常用軟件: Modeller:說(shuō)到同源模建,不得不提其中大名鼎鼎的modeller, 要是做同源模建的娃們沒(méi)有聽(tīng)過(guò)modeller, 實(shí)在是不好意思說(shuō)自己玩轉(zhuǎn)了同源模建的。哈哈該軟件由Sali lab開(kāi)發(fā),目前最新的版本是9.11,可在win下和linux運(yùn)行,需要對(duì)應(yīng)版本的python (<3.0)。該軟件好在什么地方呢?主要是可以自己控制的地方特別多,但這個(gè)也給新手帶來(lái)了不少困擾,比如究竟在特定的場(chǎng)合用什么參數(shù)等等。(本人將在自己以后的
10、學(xué)習(xí)過(guò)程中繼續(xù)分享對(duì)這個(gè)軟件的學(xué)習(xí)心得,真的是挺有意思的)可實(shí)現(xiàn)的功能包括:多聚體建模,二硫鍵建模,雜原子建模(配體、輔酶等)。具體的運(yùn)算流程稍后補(bǔ)充:其最成熟的GUI為 easymodeller,最新版本為4.0。使用方法稍后補(bǔ)充。3. 同源模建結(jié)果評(píng)價(jià)與改進(jìn)策略在我們通過(guò)各種軟件構(gòu)建出一個(gè)蛋白的同源模型后,我們?nèi)绾卧u(píng)價(jià)這一模型是否準(zhǔn)確?如果不準(zhǔn)確如何進(jìn)行進(jìn)一步的修飾能使其更好的應(yīng)用于我們的后續(xù)模擬中呢?這些問(wèn)題將在本節(jié)得以討論3.1 同源模建結(jié)果的評(píng)價(jià)本人最常使用的結(jié)構(gòu)檢測(cè)方法來(lái)源于UCLA-DOE的SAVES服務(wù)器,其網(wǎng)址為:/SAV
11、ES/提供的檢測(cè)工具包括5種方法:PROCHECK: 該程序可以給出特定蛋白質(zhì)模型的一系列立體化學(xué)參數(shù),并且能以直觀的彩圖輸出部分結(jié)果。該方法的原理主要是通過(guò)對(duì)蛋白質(zhì)數(shù)據(jù)庫(kù)中高分辨的蛋白晶體結(jié)構(gòu)的參數(shù)進(jìn)行整理,作為標(biāo)準(zhǔn)參數(shù)。將輸入蛋白結(jié)構(gòu)所具有的參數(shù)與標(biāo)準(zhǔn)參數(shù)進(jìn)行對(duì)比,如果兩者差異顯著,則說(shuō)明輸入的蛋白結(jié)構(gòu)存在明顯問(wèn)題。其輸出的結(jié)果包括:拉氏圖,主鏈的鍵長(zhǎng)與鍵角,二級(jí)結(jié)構(gòu)圖,平面?zhèn)孺溑c水平面之間的背離程度等。WHATCHECK:包含大量的檢測(cè)項(xiàng),可以針對(duì)給定的蛋白結(jié)構(gòu)與正常結(jié)構(gòu)之間的差異,產(chǎn)生一個(gè)非常長(zhǎng)而且詳細(xì)的報(bào)告。ERRAT: 計(jì)算0.35 nm范圍之內(nèi),不同原子類(lèi)型對(duì)之間形成的非鍵相互作
12、用的數(shù)目。原子按照C、N、O/S進(jìn)行分類(lèi),所以有六種不同的相互作用類(lèi)型:CC、CN、CO、 NN、 NO、 OO。如果這些相互作用類(lèi)型出現(xiàn)的頻率與正常值相比有較大的區(qū)別,蛋白質(zhì)模型的質(zhì)量就值得懷疑了通常使用9個(gè)氨基酸長(zhǎng)度的滑行窗口用于獲得每一個(gè)窗口的相互作用頻率。類(lèi)似的分析方法可以用于定位局部有問(wèn)題的區(qū)域。Verify_3D: PROVE: 該程序可以比較給定結(jié)構(gòu)的原子體積與預(yù)先計(jì)算好的一系列標(biāo)準(zhǔn)體積之間的差別。體積的計(jì)算方法采用Voronoi polyhedra幾何模型,通過(guò)在原子及其鄰近原子間放置一個(gè)個(gè)分散的平面來(lái)定義每一個(gè)原子占據(jù)的空間。以下以我研究的一個(gè)酶C-C鍵水解酶BphD的模型進(jìn)
13、行實(shí)例講解:背景:首先利用BLAST進(jìn)行蛋白一致性搜索,找出最合適的蛋白模板,經(jīng)確定為2OG1,以此蛋白結(jié)構(gòu)為模板,利用modeller進(jìn)行模建,得到我們的BphD的初始結(jié)構(gòu),提交到SAVES服務(wù)器進(jìn)行處理:1. PROCHECK結(jié)果:本部分主要需要的是拉氏圖,在第一行中可以點(diǎn)擊ps格式、PDF格式以及JPG格式進(jìn)行下載,我下載了個(gè)PDF文件,大家可以看看下面的截圖:這個(gè)服務(wù)器最好的一點(diǎn)就是可以提供處于各個(gè)區(qū)域的氨基酸殘基占總數(shù)的百分比。拉氏圖的結(jié)果主要分成4個(gè)區(qū)域:核心區(qū)域,允許區(qū),大致允許區(qū)以及禁阻區(qū)。從圖中可以看到大部分的氨基酸殘基均位于核心區(qū)域 (95.9%),落在允許區(qū)和大致允許區(qū)的
14、各有1個(gè)殘基,而處于禁阻區(qū)的只有殘基Ser112。通過(guò)我們對(duì)這個(gè)蛋白本身的了解可知,Ser112為該水解酶的催化三聯(lián)體,其模板蛋白的Ser112同樣處于禁阻區(qū)。 接下來(lái)我們看看ERRAT的結(jié)果,該結(jié)果中Overall quality factor值越高越好,一般高解析度的晶體結(jié)構(gòu)該值可以達(dá)到95,而對(duì)于解析度一般的來(lái)說(shuō)該值只能到91%左右。本例中的ERRAT值為89.928,已經(jīng)比較接近低解析度的晶體結(jié)構(gòu)了,但是應(yīng)該還有繼續(xù)改進(jìn)的空間。在圖中存在的兩條誤差限表示的是位于其線以上的區(qū)域有多大的可能性是有問(wèn)題的區(qū)域。根據(jù)這一結(jié)果,可以看出從殘基120-150之間是一個(gè)需要高度注意的區(qū)域,另一個(gè)需要注意的區(qū)域是250-255。從BphD的PDB結(jié)構(gòu)來(lái)看這兩段主要是loop區(qū),本身具有較大的彈性,因此再接下來(lái)的過(guò)程中可能需要重點(diǎn)關(guān)注這一段結(jié)構(gòu)的優(yōu)化。其他的參數(shù)如verify_3D等數(shù)值較好,在本例中未詳細(xì)給出,將在下一個(gè)修改版中放出首先,我們考慮采用計(jì)算量較少的chiron服務(wù)器對(duì)模建結(jié)構(gòu)的clash進(jìn)行處理。其結(jié)果給出原始蛋白結(jié)構(gòu)中存在的結(jié)構(gòu)間的沖突以及其修正后的結(jié)果與原始結(jié)構(gòu)的疊合結(jié)果。接下來(lái)我們利用SAVES對(duì)于經(jīng)過(guò)處理的蛋
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國(guó)多功能汽車(chē)電噴嘴電腦檢測(cè)儀數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)五星水壺?cái)?shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 統(tǒng)編版三年級(jí)語(yǔ)文下冊(cè)期中達(dá)標(biāo)測(cè)試卷(含答案)
- 吉林省長(zhǎng)春市榆樹(shù)市2024-2025學(xué)年九年級(jí)上學(xué)期期末化學(xué)試題(含答案)
- 園林施工員試題及答案
- 2025年消防設(shè)施操作員之消防設(shè)備中級(jí)技能每日一練試卷A卷含答案
- 2025年消防設(shè)施操作員之消防設(shè)備基礎(chǔ)知識(shí)通關(guān)提分題庫(kù)(考點(diǎn)梳理)
- 2020年遼寧省沈陽(yáng)市中考地理試卷(含答案)
- 2025年天津市專(zhuān)業(yè)技術(shù)人員公需考試試題-全面推動(dòng)經(jīng)濟(jì)與民生領(lǐng)域改革推動(dòng)中國(guó)經(jīng)濟(jì)高質(zhì)量發(fā)展
- 高等教育自學(xué)考試《00074中央銀行概論》模擬試卷二
- 數(shù)字化技術(shù)在中國(guó)會(huì)計(jì)師事務(wù)所中應(yīng)用的研究報(bào)告 2024
- 《富貴不能淫》知識(shí)點(diǎn)(譯文+主旨+問(wèn)答題+比較閱讀)
- 《中國(guó)傳統(tǒng)民居建筑》課件
- 電子公章申請(qǐng)請(qǐng)示范文2
- 2024-2030年中國(guó)合同能源管理(EMC)行業(yè)發(fā)展前景規(guī)劃分析報(bào)告
- 《中華人民共和國(guó)文物保護(hù)法》知識(shí)專(zhuān)題培訓(xùn)
- 2024年高考全國(guó)甲卷英語(yǔ)試卷(含答案)
- 四年級(jí)數(shù)學(xué)(四則混合運(yùn)算)計(jì)算題專(zhuān)項(xiàng)練習(xí)與答案匯編
- 8年級(jí)上冊(cè)(人教版)物理電子教材-初中8~9年級(jí)物理電子課本
- 人教版高中英語(yǔ)新教材必修2單詞默寫(xiě)表
- 項(xiàng)目資金管理統(tǒng)籌實(shí)施方案
評(píng)論
0/150
提交評(píng)論