蛋白質的序列分析及結構預測_第1頁
蛋白質的序列分析及結構預測_第2頁
蛋白質的序列分析及結構預測_第3頁
蛋白質的序列分析及結構預測_第4頁
蛋白質的序列分析及結構預測_第5頁
已閱讀5頁,還剩134頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

關于蛋白質的序列分析及結構預測第一頁,共一百三十九頁,編輯于2023年,星期三DNAsequenceProteinsequenceProteinstructureProteinfunction第二頁,共一百三十九頁,編輯于2023年,星期三一、蛋白質數(shù)據(jù)庫介紹二、蛋白質序列分析三、蛋白質結構預測四、應用分子設計第三頁,共一百三十九頁,編輯于2023年,星期三一、蛋白質數(shù)據(jù)庫介紹蛋白質的結構主要分為四級,一級結構、二級結構、三級結構以及四級結構。依據(jù)這種結構層次,將蛋白質數(shù)據(jù)庫分為:1.蛋白質序列數(shù)據(jù)庫:如PIR、SWISS-PROT、NCBI,這些數(shù)據(jù)庫的數(shù)據(jù)主要以蛋白質的序列為主,并賦予相應的注釋;2.蛋白質模體及結構域數(shù)據(jù)庫:如PROSITE、Pfam,這些數(shù)據(jù)庫主要收集了蛋白質的保守結構域和功能域的特征序列;3.蛋白質結構數(shù)據(jù)庫:如PDB等,這些數(shù)據(jù)庫主要以蛋白質的結構測量數(shù)據(jù)為主;4.蛋白質分類數(shù)據(jù)庫:如SCOP、CATH、FSSP等,這其中有以序列比較為基礎的序列分類數(shù)據(jù)庫以及以結構比較為基礎的結構分類數(shù)據(jù)庫之分。第四頁,共一百三十九頁,編輯于2023年,星期三蛋白質數(shù)據(jù)庫特征:

這些數(shù)據(jù)庫種類有差別,但內(nèi)部是相互聯(lián)系的.

每個數(shù)據(jù)庫都有指針指向其他數(shù)據(jù)庫,而且數(shù)據(jù)庫之間的序列以及相應的結構是共享的,同一種蛋白質依次會出現(xiàn)在不同的數(shù)據(jù)庫.這樣的數(shù)據(jù)溝通有助于更深層地挖掘蛋白質的內(nèi)在生物信息,這些數(shù)據(jù)庫是融序列信息的索取、處理、存儲、輸出于一身的。第五頁,共一百三十九頁,編輯于2023年,星期三1.蛋白質序列數(shù)據(jù)庫(1)PIR(proteininformationresource,PIR)和PSD(proteinsequencedatabase,PSD)

/pirwww

PIR-PSD是一個綜合全面的、非冗余的、專業(yè)注釋的、分類完整的蛋白質序列數(shù)據(jù)庫。PIR-PSD的序列來自于將GenBank/EMBL/DDBJ三大數(shù)據(jù)庫的編碼序列的翻譯而成的蛋白質序列、發(fā)表的文獻中的序列和用戶直接提交的序列。(2)SWISS-PROT/TrEMBL數(shù)據(jù)庫

/swissprot數(shù)據(jù)庫由蛋白質序列條目構成,每個條目包含蛋白質序列、引用文獻信息、分類學信息、注釋等,注釋中包括蛋白質的功能、轉錄后修飾位點、特殊位點和區(qū)域、二級結構、四級結構、與其他序列的相似性、序列殘缺與疾病的關系、序列變異體等信息。第六頁,共一百三十九頁,編輯于2023年,星期三2.模體以及結構域數(shù)據(jù)庫模體數(shù)據(jù)庫(1)PROSITE蛋白質家族及結構域數(shù)據(jù)庫(/prosite/)PROSITE數(shù)據(jù)庫收集了有顯著生物學意義的蛋白質位點序列、蛋白質特征序列譜庫以及序列模型,并能依據(jù)這些特征屬性快速可靠地鑒定出一個未知功能蛋白質序列屬于哪個蛋白質家族,即使在蛋白質序列相似性很低的情況下,也可以通過搜索隱含的功能結構模體(motif)來鑒定,因此是有效的序列分析數(shù)據(jù)庫。PROSITE中涉及的序列模式包括酶的催化位點、配體結合位點、金屬離子結合位點、二硫鍵、小分子或者蛋白質結合區(qū)域等,此外PROSITE還包括由多序列比對構建的序列表譜(profile),能更敏感地發(fā)現(xiàn)序列中的信息。第七頁,共一百三十九頁,編輯于2023年,星期三PROSITE同時數(shù)據(jù)庫提供了序列分析工具:①ScanProsite

是用于搜索所提交的序列數(shù)據(jù)是否包含PROSITE數(shù)據(jù)庫中的序列模式或者SWISS-PROT數(shù)據(jù)庫中已提交的序列模式;②MotifScan

用于查找未知序列中所有可能的已知結構組件,數(shù)據(jù)庫包括PROSITE序列表譜、PROSITE模式、Pfam收集的隱馬爾可夫模式(HMM)。第八頁,共一百三十九頁,編輯于2023年,星期三(2)PRINTSFingerprintDatabase

www.bioinf.man.ac.uk/dbrowser/PRINTS/

這個數(shù)據(jù)庫包含1500個蛋白質指紋圖譜,編碼9136個單一模體。(3)BLOCKS(

)BLOCKS是通過一些高度保守的蛋白質區(qū)域比對出來的無空位的片段。模體數(shù)據(jù)庫第九頁,共一百三十九頁,編輯于2023年,星期三蛋白質結構域數(shù)據(jù)庫

(1)蛋白質家族序列比對以及隱馬爾可夫模式數(shù)據(jù)庫Pfam(proteinfamiliesdatabaseofalignmentsandHMMs)Pfam是蛋白質家族序列比對以及隱馬爾可夫模式數(shù)據(jù)庫,其網(wǎng)址是:www.sanger.ac.uk/Software/Pfam/index.shtml。(2)蛋白質結構域數(shù)據(jù)庫ProDom

http://prodes.toulouse.inra.fr/prodom/doc/prodom.html(3)SMARTSMART是一個簡單的結構研究工具,可對可轉移的遺傳因子進行鑒定和注解,以及分析結構域結構,可以檢測出500多個參與信號傳導、胞外和染色體相關蛋白質的結構域家族,對這些結構域又在系統(tǒng)進化樹分布、功能分類、三級結構和重要的功能殘基方面做了注解。

http://smart.embl-heidelberg.de/第十頁,共一百三十九頁,編輯于2023年,星期三3.蛋白質結構數(shù)據(jù)庫PDB(proteindatabank,PDB)

/pdb/PDB包括了蛋白質、核酸、蛋白質-核酸復合體以及病毒等生物大分子結構數(shù)據(jù),主要是蛋白質結構數(shù)據(jù),這些數(shù)據(jù)來源于幾乎全世界所有從事生物大分子結構研究的研究機構,并由RCSB維護和注釋。第十一頁,共一百三十九頁,編輯于2023年,星期三4.蛋白質結構分類數(shù)據(jù)庫(1)CATH數(shù)據(jù)庫

www.biochem.ucl.ac.uk/bsm/cathnew/index.html(2)SCOP蛋白質結構分類數(shù)據(jù)庫(structuralclassificationofproteindatabase,SCOP)

scop.mrclmb.cam.ac.uk/scop/index.html第十二頁,共一百三十九頁,編輯于2023年,星期三二、蛋白質的序列分析1.蛋白質序列信息的獲取

2.蛋白質序列分析

第十三頁,共一百三十九頁,編輯于2023年,星期三1.蛋白質序列信息的獲取(1)直接測序(2)翻譯編碼的DNA序列ORFFinder(3)在數(shù)據(jù)庫中搜索運用ID號、入口號、條目號等搜索。運用關鍵詞搜索其他方式搜索。如可以通過引用序列的文獻、序列的作者、序列提交的日期等進行搜索。第十四頁,共一百三十九頁,編輯于2023年,星期三(1)直接測序e.g.ProteinSequencingandIdentificationbyTandem

MassSpectrometry,即用串聯(lián)質譜儀測序1.蛋白質序列信息的獲取第十五頁,共一百三十九頁,編輯于2023年,星期三串聯(lián)質譜及其作用兩個或更多的質譜連接在一起,稱為串聯(lián)質譜。最簡單的串聯(lián)質譜(MS|MS)由兩個質譜串聯(lián)而成,其中第一個質量分析器(MS1)將離子預分離或加能量修飾,由第二級質量分析器(MS2)分析結果。

第十六頁,共一百三十九頁,編輯于2023年,星期三

串聯(lián)質譜儀的組合方式:(1)磁分析器-靜電分析器-磁分析器

(2)靜電分析器-磁分析器-靜電分析器

(3)三重四極濾質器質譜儀

(4)混合式串聯(lián)質譜儀,如MA-ESA-Q-Q。實現(xiàn)串聯(lián)質譜有空間串聯(lián)和時間串聯(lián)兩種方式。

第十七頁,共一百三十九頁,編輯于2023年,星期三

優(yōu)點:可以避免底物分子產(chǎn)生的干擾,大大降低背景噪音。其次,可使分子離子通過與反應氣的碰撞來產(chǎn)生斷裂。因此能提供更多的結構信息,所以串聯(lián)質譜特別適合于復雜組分體系且干擾嚴重的樣品中低含量組分分析測定,具有比GC-MS和LC-MS等一級質譜更高的選擇性和靈敏度。第十八頁,共一百三十九頁,編輯于2023年,星期三MassesofAminoAcidResidues第十九頁,共一百三十九頁,編輯于2023年,星期三ProteinbackboneH...-HN-CH-CO-NH-CH-CO-NH-CH-CO-…OHRi-1RiRi+1AAresiduei-1AAresidueiAAresiduei+1N-terminusC-terminus第二十頁,共一百三十九頁,編輯于2023年,星期三BreakingProteinintoPeptidesandPeptidesintoFragmentIonsProteases,e.g.trypsin(胰蛋白酶),breakproteinintopeptides.ATandemMassSpectrometer(串聯(lián)式質譜儀)furtherbreaksthepeptidesdownintofragmentionsandmeasuresthemassofeachpiece.Generalforsequencing第二十一頁,共一百三十九頁,編輯于2023年,星期三BreakingProteinintoPeptidesandPeptidesintoFragmentIonsMassSpectrometeracceleratesthefragmentedions;heavierionsaccelerateslowerthanlighterones.MassSpectrometermeasuremass/chargeratioofanion.Generalforsequencing第二十二頁,共一百三十九頁,編輯于2023年,星期三PeptideFragmentationPeptidestendtofragmentalongthebackbone.FragmentscanalsolooseneutralchemicalgroupslikeNH3andH2O.H...-HN-CH-CO

...

NH-CH-CO-NH-CH-CO-…OHRi-1RiRi+1H+PrefixFragmentSuffixFragmentCollisionInducedDissociation第二十三頁,共一百三十九頁,編輯于2023年,星期三N-andC-terminalPeptidesGFPNAGFPNAGFPNAGFPNAGFPNAN-terminalpeptidesC-terminalpeptides第二十四頁,共一百三十九頁,編輯于2023年,星期三TerminalpeptidesandiontypesGFPNPeptideMass(D)57+97+147+114=415H2OPeptideMass(D)57+97+147+114–18=397GFPNH2Owithout第二十五頁,共一百三十九頁,編輯于2023年,星期三N-andC-terminalPeptidesGFPNAGFPNAGFPNAGFPNAGFPNAN-terminalpeptidesC-terminalpeptides415

486

30115457

71185332429第二十六頁,共一百三十九頁,編輯于2023年,星期三N-andC-terminalPeptidesN-terminalpeptidesC-terminalpeptides415

486

30115457

71185332429第二十七頁,共一百三十九頁,編輯于2023年,星期三PeptideFragmentationy3b2y2y1b3a2a3

HONH3+||

R1OR2OR3

OR4||||||||||H--NCCNCCNCCNC--COOH|||||||HHHHHHHb2-H2Oy3-H2Ob3-NH3y2-NH3第二十八頁,共一百三十九頁,編輯于2023年,星期三MassSpectraGVDLKmass057Da=‘G’

99Da=‘V’LK

DVGThepeaksinthemassspectrum:Prefix

Fragmentswithneutrallosses(-H2O,-NH3)Noiseandmissingpeaks.andSuffixFragments.DH2O第二十九頁,共一百三十九頁,編輯于2023年,星期三ProteinIdentificationwithMS/MSGVDLKmass0Intensitymass0MS/MSPeptideIdentification:第三十頁,共一百三十九頁,編輯于2023年,星期三TandemMass-Spectrometry第三十一頁,共一百三十九頁,編輯于2023年,星期三BreakingProteinsintoPeptidespeptidesMPSER……GTDIMRPAKID……HPLCToMS/MSMPSERGTDIMRPAKIDprotein第三十二頁,共一百三十九頁,編輯于2023年,星期三MassSpectrometryMatrix-AssistedLaserDesorption/Ionization(MALDI)基質輔助激光解吸質譜

第三十三頁,共一百三十九頁,編輯于2023年,星期三基質輔助激光解吸飛行時間質譜儀

MALDI-TOF-MSMALDI-TOF-MS是近年來發(fā)展起來的一種軟電離新型有機質譜。近年來已成為檢測和鑒定多肽、蛋白質、多糖、核苷酸、糖蛋白、高聚物以及多種合成聚合物的強有力工具。原理:當用一定強度的激光照射樣品與基質形成的共結晶薄膜,基質從激光中吸收能量,基質-樣品之間發(fā)生電荷轉移使得樣品分子電離,電離的樣品在電場作用下加速飛過飛行管道,根據(jù)到達檢測器的飛行時間不同而被檢測,即測定離子的質量電荷之比與離子的飛行時間成正比來檢測離子。MALDI-TOF-MS的中心技術就是依據(jù)樣品的質荷比(m/z)的不同來進行檢測,并測得樣品分子的分子量。第三十四頁,共一百三十九頁,編輯于2023年,星期三TandemMassSpectrometryScan1708LCScan1707MSMS/MSIonSourceMS-1collisioncellMS-2第三十五頁,共一百三十九頁,編輯于2023年,星期三多肽片段指紋圖譜(PFF)

步驟:用酶專一性酶解蛋白質,經(jīng)過分離,得到的肽段在質譜中被選擇和破碎后得到MS/MS譜圖,與數(shù)據(jù)庫中的譜圖比較進行鑒定

代表方法:

LC-ESI-MS/MS2D-LC-MS/MS(shotgun)第三十六頁,共一百三十九頁,編輯于2023年,星期三1.蛋白質序列信息的獲取(2)翻譯編碼的DNA序列

e.g.用“ORFFinder”程序找到DNA的開放閱讀框。網(wǎng)址:/gorf/gorf.html第三十七頁,共一百三十九頁,編輯于2023年,星期三第三十八頁,共一百三十九頁,編輯于2023年,星期三第三十九頁,共一百三十九頁,編輯于2023年,星期三1.蛋白質序列信息的獲?。?)在數(shù)據(jù)庫中搜索e.g.PIR-PSDdatabase:

/pirwww

SWISS-PROT/TrEMBLdatabase

/swissprot第四十頁,共一百三十九頁,編輯于2023年,星期三目前大部分蛋白質序列是通過DNA人工翻譯過來的,實際上很少有人能獲得真正的蛋白質,因而實驗證據(jù)就很難直接獲得,因此對蛋白質序列初始分析是很有價值的。比如,通過一些序列分析工具進行蛋白質理化特性的預測、修飾位點的預測等。2.蛋白質序列分析第四十一頁,共一百三十九頁,編輯于2023年,星期三1.蛋白質序列的基本性質分析理化性質分析,疏水性分析,跨膜區(qū)分析,信號肽預測,Coil區(qū)分析,亞細胞定位2.序列數(shù)據(jù)庫搜索

相似性搜索,模體的搜索3.結構域定位4.空間結構預測二級結構及三級結構預測,結構預測方法評價

蛋白質序列分析主要內(nèi)容:第四十二頁,共一百三十九頁,編輯于2023年,星期三1.蛋白質序列的基本性質分析(1)理化性質分析分子質量、分子式、理論等電點、氨基酸組成、消光系數(shù)、穩(wěn)定性等理化特性。例,利用ProtParam工具/tools/protparam.html

第四十三頁,共一百三十九頁,編輯于2023年,星期三理化指標CLCLAP分子式C1615H2420N428O535S16C1211H1951N319O364S3分子量36904.426899.9理論等電點pI4.476.20總原子數(shù)50143848消光系數(shù)(280nm)754555960半衰期(小時)哺乳動物,體外3030酵母,體內(nèi)>20>20大腸桿菌,體內(nèi)>10>10不穩(wěn)定性指數(shù)31.7229.59脂肪族指數(shù)63.73105.18總體親水性-0.5420.109CL和CLAP的理化性質預測結果

CL:組織蛋白酶L

CLAP:組織蛋白酶L相關蛋白

第四十四頁,共一百三十九頁,編輯于2023年,星期三(2)疏水性分析

氨基酸側鏈的疏水性用從各氨基酸減去甘氨酸疏水性之值來表示,蛋白質的疏水性在保持蛋白質三級結構的形成和穩(wěn)定中起著重要作用。e.g.利用ProtScale工具/protscale/利用BioEdit軟件分析第四十五頁,共一百三十九頁,編輯于2023年,星期三海參溶菌酶親水性/疏水性分析Score>0,表示疏水性;Score<0,表示親水性第四十六頁,共一百三十九頁,編輯于2023年,星期三(3)跨膜區(qū)分析

蛋白質含有跨膜區(qū)提示它可能作為膜受體起作用,也可能是定位在膜上的錨定蛋白或離子通道蛋白。例,使用TMHMMServerv.2.0在線分析http://www.cbs.dtu.dk/services/TMHMM/第四十七頁,共一百三十九頁,編輯于2023年,星期三鋁激活蘋果酸的轉運蛋白(TaALMT1)跨膜結構分析第四十八頁,共一百三十九頁,編輯于2023年,星期三(4)信號肽預測信號肽:指分泌蛋白表達時氨基端的20余個氨基酸,將引導該蛋白質最終分泌至細胞外,但這段信號肽會被信號肽酶切掉,所以成熟的分泌蛋白是不含這段信號肽的。用于指導蛋白質的跨膜轉移(定位)的N末端的氨基酸序列,一般由15-30個氨基酸組成。使用SignalP在線分析http://www.cbs.dtu.dk/services/SignalP/第四十九頁,共一百三十九頁,編輯于2023年,星期三海參溶菌酶信號肽預測Conclusion:cleavagesitebetweenpos.20and21:ASG-QV第五十頁,共一百三十九頁,編輯于2023年,星期三(5)Coil區(qū)分析蛋白質中由2-7條α螺旋鏈相互纏繞形成類似麻花狀結構的總稱;主要存在形式是2-5條相互纏繞形成的平行或反平行同寡聚體或異寡聚體;是控制蛋白質寡聚化的元件,轉錄因子、骨架蛋白、動力蛋白、膜蛋白、酶等;七肽重復區(qū)。e.g.使用COILS服務器分析/software/COILS_form.html第五十一頁,共一百三十九頁,編輯于2023年,星期三(6)亞細胞定位根據(jù)氨基酸組成可以進行亞細胞定位不同細胞器多具不同的理化環(huán)境,它會根據(jù)蛋白質的結構及表面理化特征選擇性容納蛋白質;蛋白質表面直接暴露于細胞器環(huán)境中,它由序列折疊過程決定,而后者取決于氨基酸組成。亞細胞定位的步驟在線分析工具e.g.使用TargetPhttp://www.cbs.dtu.dk/services/TargetP/第五十二頁,共一百三十九頁,編輯于2023年,星期三組織蛋白酶CL和相關蛋白CLAP的亞細胞定位蛋白質各亞細胞位點出現(xiàn)可能性(%)細胞質內(nèi)質網(wǎng)線粒體細胞核空泡分泌性小囊泡高爾基體質膜細胞支架CL34.8--CLAP26.14.313.013.04.317.44.313.04.3結果證明,CL和CLAP出現(xiàn)幾率最高的位點都為胞質,說明它們都為胞漿內(nèi)蛋白,這也為今年來在溶酶體內(nèi)外都發(fā)現(xiàn)組織蛋白酶活性提供了證據(jù)。第五十三頁,共一百三十九頁,編輯于2023年,星期三(1)相似性搜索(或同源搜索)①一個新序列與序列數(shù)據(jù)庫中的序列比對,從而找到同源或者相似序列。②常用程序是BLASTp。2.序列數(shù)據(jù)庫搜索第五十四頁,共一百三十九頁,編輯于2023年,星期三第五十五頁,共一百三十九頁,編輯于2023年,星期三(2)模體(motif)的搜索這是另一種序列搜索方法,其目的是尋找蛋白質中結構域或者功能域。這個方法不是給每個位置的氨基酸打分,然后得到一個相似程度,而是直接描述關鍵的幾個保守殘基,同時忽略其他位置的氨基酸多態(tài)性,這些保守的序列有時會稱為“標志”(signature),就是所謂的模式序列(pattern)。第五十六頁,共一百三十九頁,編輯于2023年,星期三Motif搜索即模體搜索,是序列中局部的保守區(qū)域,或是一組序列中共有的一小段序列模式。使用PROSITE數(shù)據(jù)庫進行motif搜索

/prosite模式序列常表示為:

[AG]-x-V-x(2)-x-{YW}

[

]showseitheraminoacid

x

isanyaminoacid

x(2)anyaminoacidinthenext2positions

{

}showsanyaminoacidexceptthese第五十七頁,共一百三十九頁,編輯于2023年,星期三模體的搜索舉例:有序列表示為:H-[FW]-x-[LIVM]-x-G-x(5)-[LV]-H-x(3)-[DE]這是描述一個DNA結合蛋白質家族的,可以理解為組氨酸,接著是苯丙氨酸或者色氨酸,緊接一個氨基酸x,然后可以是亮氨酸、異亮氨酸、纈氨酸、或者甲硫氨酸??,這樣一段序列由于處于活性區(qū)域或者蛋白質的重要結構區(qū),所以特別保守,因此也是序列搜索的目標之一。第五十八頁,共一百三十九頁,編輯于2023年,星期三3.結構域定位通過將序列在數(shù)據(jù)庫中搜索,可以了解到序列的一些信息,接下來就可以進行結構域的定位,這樣就對以后的結構預測有了一個比較清醒的認識。如果蛋白質序列的長度大于500個氨基酸,就可以根據(jù)搜索的情況(比如按相似性高低或者結構域多少等)將蛋白質分割成多個不連續(xù)的區(qū)域,最好將這一段一段的序列分別鑒別。

第五十九頁,共一百三十九頁,編輯于2023年,星期三什么是結構域?結構域是在二級結構或超二級結構的基礎上形成三級結構的局部折疊區(qū),一條多肽鏈在這個域范圍內(nèi)來回折疊,但相鄰的域常被一個或兩個多肽片段連結。通常由50-300個氨基酸殘基組成,其特點是在三維空間可以明顯區(qū)分和相對獨立,并且具有一定的生物功能如結合小分子。模體(motif)是結構域的亞單位,通常由2~3二級結構單位組成,一般為α螺旋、β折疊和環(huán)(loop)。結構域定位第六十頁,共一百三十九頁,編輯于2023年,星期三二聚體蛋白結構域第六十一頁,共一百三十九頁,編輯于2023年,星期三結構域和功能域對那些較小的球狀蛋白質分子或亞基來說,結構域和三級結構是一個意思,也就是說這些蛋白質或亞基是單結構域的,如紅氧還蛋白等;較大的蛋白質分子或亞基其三級結構一般含有兩個以上的結構域,即多結構域的,其間以柔性的鉸鏈(hinge)相連,以便相對運動。結構域有時也指功能域。功能域是蛋白質分子中能獨立存在的功能單位,它可以是一個結構域,也可以是由兩個或兩個以上結構域組成。結構域定位第六十二頁,共一百三十九頁,編輯于2023年,星期三結構域定位結構域是蛋白序列的功能、結構和進化單元分析方法:序列比對單條蛋白質序列可以包含一個或多個結構域第六十三頁,共一百三十九頁,編輯于2023年,星期三基本類型:

64α-螺旋型

全β-折疊型

α/β型α+β型第六十四頁,共一百三十九頁,編輯于2023年,星期三結構域定位分析一般流程:(1)探測序列與其他全序列之間有無同源性.如果有,那么這是該段序列為結構域的很好證據(jù),然后進行結構數(shù)據(jù)庫的搜索,也可以搜索注釋好的數(shù)據(jù)庫,從而得到一些有關結構域的說明。

(2)分析低復雜度的區(qū)域。在多結構域的蛋白質中,這些低復雜度序列常常間隔結構域,長的重復序列特別是pro、glu、ser、thr等常常是連接序列,也是很好的結構域剪接位置。

結構域定位第六十五頁,共一百三十九頁,編輯于2023年,星期三結構域定位分析一般流程:(3)跨膜區(qū)域。由于跨膜結構是一個非常典型的結構,這種結構連續(xù)性較強,而且預測容易,準確性也比較高,因此也是一個分割的區(qū)域,這樣就很容易區(qū)分胞外和胞內(nèi)區(qū)域。(4)卷曲螺旋結構(coiled-coil)。這個結構有時也可能是蛋白質結構域之間的間隔區(qū),可以在COIL網(wǎng)站上預測coiled-coil結構。

結構域定位第六十六頁,共一百三十九頁,編輯于2023年,星期三結構域定位分析一般流程:(5)二級結構預測。這個方法常常用來預測一個結構中包含的不同折疊子。例如,一個序列中的一部分可能會被預測成只有α-螺旋,而另一個部分可能會被預測成只含有β-折疊,這些都可能預示有域的結構存在。(6)如果序列已被成功地分解成成形的結構域,那么重復進行數(shù)據(jù)庫搜索并且進行獨立比對是很重要的.結構域定位第六十七頁,共一百三十九頁,編輯于2023年,星期三結構域定位第六十八頁,共一百三十九頁,編輯于2023年,星期三結構域分析工具介于二級和三級結構之間可以明顯區(qū)分但又相對獨立的折疊單元,每個結構域自身形成緊實的三維結構,可以獨立存在或折疊,但結構域與結構域之間關系較為松散。通常由25-300個氨基酸殘基組成;全平行結構域、反平行結構域、α+β結構域、α/β結構域及其他折疊類型。利用SMART服務器進行結構與分析http://smart.embl-heidelberg.de/第六十九頁,共一百三十九頁,編輯于2023年,星期三結構域定位分析舉例實例分析:海參溶菌酶序列和其它i型溶菌酶保守區(qū)域的比對結果:高度保守的2個活性位點(E34和S50)和特有的氨基酸保守序列MDVGSLSCG(P\Y)(Y\F)QIK第七十頁,共一百三十九頁,編輯于2023年,星期三i-型溶菌酶含有兩個結構域第七十一頁,共一百三十九頁,編輯于2023年,星期三模體搜索和結構域定位舉例實例分析:海參i-型溶菌酶3D結構模式圖第七十二頁,共一百三十九頁,編輯于2023年,星期三4.蛋白質空間結構預測(1)蛋白質二級結構預測

蛋白質二級結構是蛋白質分子中重要的組成“部件”,是研究蛋白質氨基酸序列和三級結構之間的橋梁。

基本的二級結構:α螺旋,β折疊,β轉角,無規(guī)則卷曲(coils)以及模體(motif)等蛋白質局部結構組件第七十三頁,共一百三十九頁,編輯于2023年,星期三

蛋白質的二級結構預測的基本依據(jù)是每一段相鄰的氨基酸殘基具有形成一定二級結構的傾向。二級結構預測問題是模式分類問題。二級結構預測的目標:判斷每一段中心的殘基是否處于螺旋、折疊、轉角(或其它狀態(tài))之一的二級結構態(tài),即三態(tài)。蛋白質二級結構預測第七十四頁,共一百三十九頁,編輯于2023年,星期三二級結構的預測方法:基于統(tǒng)計和機器學習方法進行預測Chou-Fasman算法GOR算法多序列列線預測基于神經(jīng)網(wǎng)絡的序列預測基于已有知識的預測方法(knowledgebasedmethod)混合方法(hybridsystemmethod)蛋白質二級結構預測第七十五頁,共一百三十九頁,編輯于2023年,星期三二級結構中氨基酸出現(xiàn)頻率的影響:

氨基酸殘基在二級結構元件中出現(xiàn)頻率的研究揭示,某些殘基如Glu、Met、Ala和Leu在α螺旋中出現(xiàn)的頻率比在其他二級結構元件中高。相反,Gly和Pro在α螺旋中頻率很低。但它們在β轉角中很高。另一些殘基包括Val、Ile和芳香族氨基酸在β折疊片中頻率很高,而Asp、Glu和Pro在β折疊片中則很低。這表明各種殘基形成各種二級結構的傾向性是不同的。蛋白質二級結構預測第七十六頁,共一百三十九頁,編輯于2023年,星期三工具網(wǎng)站備注BCMSearchLauncher/包括了常見的蛋白質結構分析程序入口,一般分析可以以此服務器作為起點HNNhttp://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_nn.html基于神經(jīng)網(wǎng)絡的分析工具,含序列到結構過程和結構到結構處理Jpredpbio.dundee.ac.uk/~www-jpred/submit.html基于Jnet神經(jīng)網(wǎng)絡的分析程序,并采用PSI-BLAST來構建序列Profile進行預測,對于序列較短、結構單一的蛋白預測較好nnPredict/~nomi/nnpredict.html預測蛋白質序列中潛在的亮氨酸拉鏈結構和卷曲螺旋NNSSPhttp://bioweb.pasteur.fr/seqanal/interfaces/nnssp-simple.html基于雙層前反饋神經(jīng)網(wǎng)絡為算法,還考慮到蛋白質結構分類信息PREDATORhttp://bioweb.pasteur.fr/seqanal/interfaces/predator-simple.html預測時考慮了氨基酸殘基間的氫鍵蛋白質二級結構分析工具第七十七頁,共一百三十九頁,編輯于2023年,星期三工具網(wǎng)站備注PredictProtein/提供多項蛋白質性質分析,并有較好準確性Profhttp://www.aber.ac.uk/~phiwww/prof/基于多重序列比對預測工具PSIpredhttp://bioinf.cs.ucl.ac.uk/psipred/psiform.html提供跨膜蛋白拓撲結構預測和蛋白profile折疊結構識別工具SOPMAhttp://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html可以比較各種分析方法得到的結果,也可輸出“一致性結果”SSPREDhttp://coot.embl.de/~fmilpetz/SSPRED/sspred.html基于數(shù)據(jù)庫搜索相似蛋白并構建多重序列比對蛋白質二級結構分析工具(續(xù))第七十八頁,共一百三十九頁,編輯于2023年,星期三PredictProtein/可以獲得功能預測、二級結構、基序、二硫鍵結構、結構域等許多蛋白質序列的結構信息該方法的平均準確率超過72%,最佳殘基預測準確率達90%以上。因此,被視為蛋白質二級結構預測的標準需要注冊帳號用于學術研究蛋白質二級結構預測第七十九頁,共一百三十九頁,編輯于2023年,星期三PredictProtein提交界面詳解提交郵件地址(必填)蛋白名稱(可選)分析方法第八十頁,共一百三十九頁,編輯于2023年,星期三1D序列預測PROFsec(默認)基于輪廓(profile)神經(jīng)網(wǎng)絡預測蛋白質二級結構PROFacc(默認)基于輪廓(profile)神經(jīng)網(wǎng)絡預測殘基溶劑可及性PHDhtm(默認)基于多序列比對中預測跨膜區(qū)位置和拓撲結構ASP(默認)識別二級結構中構型變化的氨基酸COILS(默認)識別卷曲螺旋PROFtmb識別細菌中Beta桶結構序列基序識別ProSite(默認)搜索序列中保守基序SEG(默認)過濾序列中低復雜區(qū)域PredictNLS(默認)基于實驗數(shù)據(jù)預測序列核定位區(qū)域二硫鍵識別DISULFIND(默認)識別序列中二硫鍵位置無序結構識別PROFbval識別序列標準骨架的B-value值UCON預測蛋白質中非3D結構區(qū)域折疊子識別AGAPE基于折疊結構識別遠源蛋白序列殘基接觸預測PROFcon預測單鏈中原子殘基接觸性結構域預測ProDom(默認)基于序列同源性來預測蛋白質結構域CHOP(comingsoon)預測蛋白質結構域結構表面識別ConSeq(comingsoon)預測蛋白質結構表面結構功能關鍵殘基分析方法程序詳解第八十一頁,共一百三十九頁,編輯于2023年,星期三跨膜螺旋預測(PHDhtm)專家選項Ambivalent序列識別(ASP)專家選項CHOP結構域分析工具專家選項第八十二頁,共一百三十九頁,編輯于2023年,星期三比對內(nèi)容從SWISS-PROT數(shù)據(jù)庫返回BLAST搜索結果MaxHom參數(shù)選項最低序列比對一致性空位間隔罰分空位延伸罰分比對矩陣最大擊中值第八十三頁,共一百三十九頁,編輯于2023年,星期三選擇保存分析結果是否返回多序列比對結果HTML結果形式AGAPE結果PROF/PHD結果形式以下拉框中所指定的輸入格式將待測序列粘貼此提交欄第八十四頁,共一百三十九頁,編輯于2023年,星期三服務器運行程序信息ProSite模體搜索結果低復雜區(qū)域過濾程序ProDom結構域搜索結果二硫鍵識別結果PHD程序信息PHD預測結果PROF預測結果球狀蛋白預測結果Ambivalent序列識別結果PredictProtein分析結果第八十五頁,共一百三十九頁,編輯于2023年,星期三PredictProtein分析結果跨膜區(qū)非跨膜區(qū)LoopHelixSheet第八十六頁,共一百三十九頁,編輯于2023年,星期三(2)蛋白質三維結構預測方法特點工具同源建模法(Homology/Comparativemodelling)基于序列同源比對,對于序列相似度>30%的序列模擬比較有效,最常用的方法SWISS-MODEL,CPHmodels

串線法/折疊識別法

(Threading/Foldrecognition)“穿”入已知的各種蛋白質折疊骨架內(nèi),適于對蛋白質核心結構進行預測,計算量大THREADER,3D-PSSM從頭預測法(Abinitio/Denovomethods)基于分子動力學,尋找能量最低的構象,計算量大,只能做小分子預測HMMSTR/ROSSETA第八十七頁,共一百三十九頁,編輯于2023年,星期三方法一:同源模建comparativemodeling

1.同源模建的基礎蛋白質的三級結構比一級結構更保守。研究表明如果兩個蛋白質的同源性達到50%,二者90%的Ca的RMS

小于1埃。

2.原理:序列高度相似的蛋白質具有相似的三維結構。同源蛋白質之間具有保守的結構內(nèi)核,差異僅存在分子表面的回折區(qū)。當一個蛋白質的序列與一個已知結構的蛋白質序列相似的時候,該蛋白質的結構可以被模建。第八十八頁,共一百三十九頁,編輯于2023年,星期三

3.同源模建的前提和條件:要模建的目標蛋白必須有一個或多個已知結構的與之同源(同源性不低于25%)的蛋白。數(shù)據(jù)庫:蛋白質結構、序列數(shù)據(jù)計算機:工作站分子模擬系統(tǒng):軟件系統(tǒng)4.同源模建的發(fā)展歷史

1969年,Browne利用溶菌酶的結構手工模建了牛乳白蛋白的結構。八十年代,Blundel發(fā)展了利用多種同源蛋白質進行結構預測的方法。隨著計算機技術的發(fā)展、結構測定數(shù)據(jù)的增加,同源模建技術也在快速發(fā)展。第八十九頁,共一百三十九頁,編輯于2023年,星期三5.同源模建的主要算法剛體裝配模建(modelingbyrigidbodyassembly)片段匹配模建(modelingbysegmentmatching)空間制約模建(modelingbysatisfactionofspatialrestraints)第九十頁,共一百三十九頁,編輯于2023年,星期三(1)剛體裝配模建從一些剛體包括核心區(qū)、環(huán)區(qū)和側鏈來構造模型,這些剛體都來自分解的相關結構(參考蛋白)。模型的裝配涉及計算一個框架,這個框架定義為折疊模式的保守區(qū)域的模板原子的平均,并把剛體裝進框架。(2)片段匹配模建依賴于從模板蛋白的保守原子的相近位置來計算其它原子的坐標。它可以通過使用蛋白質結構的短片數(shù)據(jù)庫、能量或幾何規(guī)則、以及這些標準的某些聯(lián)合來完成。(3)空間制約滿足:首先從參考蛋白結構中抽取出一些空間制約條件,將這些制約條件用幾率密度函數(shù)來表示,然后根據(jù)氨基酸類型、等位殘基的主鏈構象和序列之間局部的相似程度而對空間制約條件施加以不同的權重因子。模建時將幾率密度函數(shù)應用到未知結構蛋白質序列上,通過優(yōu)化分子的幾率密度函數(shù)使制約條件有最小的沖突而得到目標蛋白的三維結構,整個優(yōu)化過程通過分子力學和分子動力學模擬來實現(xiàn)。

第九十一頁,共一百三十九頁,編輯于2023年,星期三6.同源建模法分析步驟:多序列比對與已有晶體結構的蛋白質序列比對確定是否有可以使用的模板序列相似度>30%序列相似度<30%,結合功能,蛋白質一級序列、二級結構或結構域信息構建三維模型三維模型準確性檢驗Whatcheck程序Ramachandranplot計算檢驗手工調整多序列比對,重新擬和,構建新的模型第九十二頁,共一百三十九頁,編輯于2023年,星期三第九十三頁,共一百三十九頁,編輯于2023年,星期三常用數(shù)據(jù)庫數(shù)據(jù)庫網(wǎng)站備注PDB/pdb/home/home.do主要的蛋白質三維結構數(shù)據(jù)庫MMDB/Structure/MMDB/mmdb.shtmlNCBI維護的蛋白質結構數(shù)據(jù)庫Psdb/~deerfiel/PSdb/從PDB和NRL-3D數(shù)據(jù)庫中衍生出的數(shù)據(jù)庫,含二級結構和三維結構信息3DinSighthttp://gibk26.bse.kyutech.ac.jp/jouhou/3dinsight/3DinSight.html整合了結構、性質(氨基酸組成、熱力學參數(shù)等)、生物學功能(突變點,相互作用等)的綜合數(shù)據(jù)庫,F(xiàn)SSPhttp://www.ebi.ac.uk/dali//fssp/根據(jù)結構比對的蛋白質結構分類數(shù)據(jù)庫SCOPhttp://scop.mrc-lmb.cam.ac.uk/scop/蛋白質結構分類數(shù)據(jù)庫,將已知結構蛋白進行有層次地分類CATH/latest/index.html另一個有名的蛋白質結構和結構域主要結構分類庫MODBASE/modbase-cgi/index.cgi用同源比對法生成的模型結構數(shù)據(jù)庫EnzymeStructurehttp://www.ebi.ac.uk/thornton-srv/databases/enzymes/從PDB數(shù)據(jù)庫中整理已知結構的酶蛋白數(shù)據(jù)庫HSSPhttp://www.sander.ebi.ac.uk/hssp/根據(jù)同源性到處的蛋白質結構數(shù)據(jù)庫第九十四頁,共一百三十九頁,編輯于2023年,星期三模板搜索與比對工具網(wǎng)站備注PSI-BLAST/BLAST/位置特異性疊代BLAST,可用來搜索遠源家族序列FASTA3http://www.ebi.ac.uk/fasta33/位于EBI的序列比對工具SSEARCHrs.fr/bin/ssearch-guess.cgi采用Smith/Waterman法來進行序列比對ClustalWhttp://www.ebi.ac.uk/Tools/clustalw/index.html多序列比對工具,位于EBIT-Coffeehttp://www.ebi.ac.uk/t-coffee/用多種方法(如ClustalW、DIalign等)來構建多序列比對Multalinhttp://bioinfo.genopole-toulouse.prd.fr/multalin/multalin.html一個老牌的多序列比對工具Dalihttp://www.ebi.ac.uk/dali/三維結構比對網(wǎng)絡服務器VAST/Structure/VAST/vast.shtml基于向量并列分析算法的三維結構比對工具SAM-T99/research/compbio/sam.html用HMM法搜索蛋白質遠源同源序列第九十五頁,共一百三十九頁,編輯于2023年,星期三同源建模法工具網(wǎng)站備注SWISS-MODEL/完整建模程序,采用同源性鑒定來確定模板蛋白,用戶也可以自定義模板進行分析CPHmodelshttp://www.cbs.dtu.dk/services/CPHmodels/基于神經(jīng)網(wǎng)絡的同源建模工具,用戶只需提交序列,無高級選項EsyPred3Dhttp://www.fundp.ac.be/urbm/bioinfo/esypred/采用神經(jīng)網(wǎng)絡來提高同源建模準確性的預測工具3Djigsawhttp://www.bmm.icnet.uk/servers/3djigsaw/根據(jù)同源已知結構蛋白來建模的預測工具MODELLER/modeller/一個廣泛使用的同源建模軟件,需要用戶對腳本有一定的了解第九十六頁,共一百三十九頁,編輯于2023年,星期三串線法工具網(wǎng)站備注3D-PSSMhttp://www.sbg.bio.ic.ac.uk/~3dpssm/index2.html第一個運用1D-3D序列profile來預測蛋白質折疊結構的網(wǎng)絡服務器Fuguehttp://www-cryst.bioc.cam.ac.uk/~fugue/以序列—結構比對搜索數(shù)據(jù)庫來預測蛋白質折疊HHpredhttp://toolkit.tuebingen.mpg.de/hhpred基于HMM-HMM比對搜索多個數(shù)據(jù)庫來預測給定序列的的折疊結構LOOPP/loopp.aspx學習、觀察和輸出蛋白質模式和結構工具THREADERhttp://bioinf.cs.ucl.ac.uk/threader/一個老牌的線索分析軟件,對搜索遠源蛋白序列較敏感PROSPECT/structure/prospect/index.html蛋白質結構預測和評價工具包,能以一種非常簡單的方式運行,對于高級用戶,也提供了很多的可選項123D+http://123/123D+.html結合了序列概形,二級結構信息和接觸勢能來將待測蛋白“穿入”一系列結構來預測結構SAM-T02/research/compbio/HMM-apps/T02-query.html基于HMM方法的蛋白質結構預測GenThreaderhttp://bioinf.cs.ucl.ac.uk/psipred/psiform.html使用結構評分和基于神經(jīng)網(wǎng)絡序列比對來也測蛋白折疊結構第九十七頁,共一百三十九頁,編輯于2023年,星期三蛋白質三維結構預測SWISS-MODEL工具http://www.expasy.ch/swissmod/SWISS-MODEL.html同源建模方法與PDB數(shù)據(jù)庫已知結構的蛋白質序列比對進行預測第九十八頁,共一百三十九頁,編輯于2023年,星期三主要參數(shù)/選項粘貼protein.txt中一條蛋白質序列輸入用戶Email(選填)比對e值參照模板序列數(shù)目第九十九頁,共一百三十九頁,編輯于2023年,星期三輸出結果下載pdb格式文件第一百頁,共一百三十九頁,編輯于2023年,星期三與模板序列比對結果,并顯示二級結構區(qū)域第一百零一頁,共一百三十九頁,編輯于2023年,星期三方法二:折疊識別/穿線方法對蛋白質結構的預測背景:序列比對后所擊中的相似序列不是完整的而是一段一段的結構域,也可以通過二級結構預測和折疊識別(foldrecognition)找到合適的折疊子,再以這些已知結構的折疊子為模板來構建模型。第一百零二頁,共一百三十九頁,編輯于2023年,星期三折疊識別/穿線方法

觀察:有限的蛋白質折疊種類(~1,000?)與“從頭開始”來預測蛋白質結構不同,我們可以從有限的蛋白質折疊條目中得到正確的結果?;谛蛄屑记煽梢宰龅竭@一點,或者通過穿線法將序列按順序投到模板上,并評價每一個匹配好壞程度第一百零三頁,共一百三十九頁,編輯于2023年,星期三折疊識別/穿線方法原理:將序列“穿”入已知的各種蛋白質折疊子骨架內(nèi),通過目的蛋白序列與已知折疊子的逐一比對,計算出未知結構序列折疊成各種已知折疊子的可能性;折疊子一般包括一個或多個蛋白質超家族;每個折疊子的結構內(nèi)核有確定的結構特征;基于序列同源性很低的蛋白質都可能存在結構相同的折疊子進行預測。例如,通過PHYRE系統(tǒng)進行折疊識別預測http://www.sbg.bio.ic.ac.uk/~phyre/index.cgi第一百零四頁,共一百三十九頁,編輯于2023年,星期三折疊識別或穿線法目標序列=SHPALTQLRALRYCKEIPALDPQLLDWLLLEDSMTKRFEQQ…可能折疊的庫(哪些具有已知序列和結構):第一百零五頁,共一百三十九頁,編輯于2023年,星期三序列-結構比對目標序列=SHPALTQLRALRYCKEIPALDPQLLDWLLLEDSMTKRFEQQ…=t1t2t3t4t5…tn已知折疊結構的序列=s1s2s3s4s5…sn已知折疊結構的位置=p1p2p3p4p5…pn怎樣將目標序列與結構進行比對?第一百零六頁,共一百三十九頁,編輯于2023年,星期三同源模建與結構類型識別方法的比較蛋白質家族與蛋白質結構類型

Family蛋白質家族依據(jù)序列同源性將蛋白質分為不同的家族:一般將序列同源性大于30%的蛋白質歸屬為一個家族。一個蛋白質家族的成員可能由一個共同的祖先進化而來。自然界存在的可能蛋白質家族數(shù)目大約為23100種。同一個家族的蛋白質一般具有相近的功能和相同的結構類型(折疊模式)。第一百零七頁,共一百三十九頁,編輯于2023年,星期三3D-PSSM工具http://www.sbg.bio.ic.ac.uk/~3dpssm/index2.html由英國倫敦帝國理工學院維護,其數(shù)據(jù)庫中含有9864個蛋白折疊結構3D-PSSM先用PSI-BLAST標準方法通過多序列比對得到輪廓(profile),然后對家族中的一系列成員進行結構比對得出該家族的結構輪廓,接著用線串法將模板結構輪廓和待測蛋白的序列輪廓進行1D-3D輪廓之間的比對,此外也考慮了溶劑可及性和二級結構信息第一百零八頁,共一百三十九頁,編輯于2023年,星期三輸入用戶Email(學術郵箱,必需)蛋白質描述(選填)序列提交框(氨基酸單字母)第一百零九頁,共一百三十九頁,編輯于2023年,星期三輸入用戶Email(必需)蛋白質描述(選填)序列提交框(氨基酸單字母)Phyre

-http://www.sbg.bio.ic.ac.uk/~phyre/3d-PSSM的升級版,增加了fold數(shù)據(jù),并且性能上提高10%-15%,采用了新的分析界面第一百一十頁,共一百三十九頁,編輯于2023年,星期三二級結構預測第一百一十一頁,共一百三十九頁,編輯于2023年,星期三序列比對結果序列比對一致性模板長度靶標蛋白模型模板蛋白結構分類信息折疊子描述第一百一十二頁,共一百三十九頁,編輯于2023年,星期三第一百一十三頁,共一百三十九頁,編輯于2023年,星期三第一百一十四頁,共一百三十九頁,編輯于2023年,星期三工具網(wǎng)站備注Swiss-PdbViewer/spdbv/一個界面非常友好的工具,可以分析蛋白質的結構性質,比較活性位點或突變點Jmol/一個基于Java語言開發(fā)的三維觀察工具,大多是作為一個內(nèi)嵌式網(wǎng)頁工具快速游覽結構數(shù)據(jù)庫數(shù)據(jù)MolMolhttp://www.mol.biol.ethz.ch/wuthrich/software/molmol/免費的PDB三維分子觀察軟件,可以通過處理生成很漂亮的圖形文件PyMol/一個基于開源的三維觀察工具,有很多額外的插件來提升功能Rasmol/software/rasmol/很有名的三維觀察軟件,操作界面簡介,用命令行實現(xiàn)多種功能VMD/Research/vmd/用內(nèi)建的腳本來瀏覽、分析三維結構,還可以以動畫的形式模擬蛋白質結構Chime/products/framework/chime/index.jsp網(wǎng)絡游覽器插件,可以在網(wǎng)頁中直接觀察PDB格式的文件Chimera/chimera/index.html免費分子模擬顯示程序,還包括結構比對、藥物篩選等功能ICM-Browser/icm_browser.html三維分子游覽工具,有序列比對顯示功能,由MolSodt公司免費推出常用蛋白質三維結構觀察和修改工具第一百一十五頁,共一百三十九頁,編輯于2023年,星期三Chime網(wǎng)絡游覽器插件Chime-/products/framework/chime/index.jsp基于游覽器的三維結構觀察工具安裝后在InternetExplorer下的PLUGINS文件夾中會有:npchime.dll(pluginsfolder)npchime.zip(pluginsfolder,usedforLiveConnect)NOTE:Donotunzipthisfilechimepro.html(pluginsfolder,thereleasenotesforChime)chime26.isu(pluginsfolder,usedtouninstallChime)sculptapi.dll(WindowsSystemfolder,usedforSculpt)ChimeShim.dll(pluginsfolder,InternetExploreronly)第一百一十六頁,共一百三十九頁,編輯于2023年,星期三第一百一十七頁,共一百三十九頁,編輯于2023年,星期三SWISS-PdbView觀察三維模型SWISS-PdbView工具/spdbv/觀察和修改分子的三維結構第一百一十八頁,共一百三十九頁,編輯于2023年,星期三菜單欄/工具欄圖層窗口主窗口序列聯(lián)配窗口控制面板第一百一十九頁,共一百三十九頁,編輯于2023年,星期三Ramachandran圖結構疊加第一百二十頁,共一百三十九頁,編輯于2023年,星期三蛋白質序列分析蛋白質一級序列蛋白質基本理化性質分析蛋白質親疏水性分析跨膜區(qū)結構預測卷曲螺旋預測翻譯后修飾位點預測蛋白質二級結構蛋白質二級結構預測蛋白質序列信號位點分析蛋白質超二級結構蛋白質結構域分析蛋白質三級結構蛋白質三維結構模擬蛋白質分類蛋白質家族分析蛋白質序列分析匯總表課程總結第一百二十一頁,共一百三十九頁,編輯于2023年,星期三課程總結第一百二十二頁,共一百三十九頁,編輯于2023年,星期三四、蛋白質結構預測的應用蛋白質的分子設計第一百二十三頁,共一百三十九頁,編輯于2023年,星期三

蛋白質分子設計與基因工程技術、多肽合成技術和化學合成技術一起開創(chuàng)了新藥設計和開發(fā)研究的新局面。這個領域的研究方向主要包括蛋白三維結構預測、蛋白質結構功能關系研究、蛋白相互作用、蛋白與DNA相互作用、蛋白質突變體的分子設計、全新蛋白質設計等。第一百二十四頁,共一百三十九頁,編輯于2023年,星期三1.分子設計的意義

分子生物學最激動人心的進展之一是能夠設計和生產(chǎn)新的蛋白質分子。重組DNA技術使人們能夠定向改變蛋白質中的氨基酸序列,包括氨基酸的取代、插入或缺失,甚至包括蛋白質的融合等。

蛋白質工程則是在深入了解蛋白質結構與功能關系的基礎上,利用分子生物學方法和手段有目的地改造蛋白質,使之性能得到改善。作為蛋白質工程的組成部分,蛋白質分子設計在其中起著十分重要的作用。

第一百二十五頁,共一百三十九頁,編輯于2023年,星期三第一百二十六頁,共一百三十九頁,編輯于2023年,星期三從預期的蛋白質功能出發(fā)→設計預期的蛋白質結構→推測應有的氨基酸序列→找到相對應的脫氧核苷酸(基因)第一百二十七頁,共一百三十九頁,編輯于2023年,星期三

2.分子設計的種類小改:少數(shù)殘基的替換,突變或修飾中改:分子拼接,肽段或結構域的替換大改:從頭設計,全新蛋白質的設計3.分子設計與蛋白質結構

蛋白質分子內(nèi)部的電荷分布、相互作用有其特定的結構特征,隨意選擇突變位點在蛋白質分子中改變氨基酸,不僅達不到預期目的,反而可能影響蛋白質分子的活性中心,使蛋白質的活性降低或喪失。第一百二十八頁,共一百三十九頁,編輯于2023年,星期三

4.蛋白質分子設計的應用

應用1:酶穩(wěn)定性的改善酶的穩(wěn)定性

在蛋白質工程的實踐中,一般可以通過在酶分子內(nèi)增加二硫鍵或靜電作用來提高酶分子的穩(wěn)定性。例1:核糖核酸酶的穩(wěn)定性的提高(1)已知條件:核糖核酸酶三維結構已由晶體衍射方法測定。

分子內(nèi)有兩對二硫鍵:Tyr24與Asn84正對,二者的Ca之間的距離為6.0A,滿足二硫鍵的特征(二硫鍵的Ca的平均距離:4.5-6.8?),可能形成一個潛在的二硫鍵;二者附近沒有干擾形成二硫鍵的基團;二者離催化活性中心較遠,突變后不會影響活性。(2)設計方案:

將Tyr24與Asn84突變?yōu)镃ys

實驗結果:突變體的穩(wěn)定性大大提高

第一百二十九頁,共一百三十九頁,編輯于2023年,星期三例2.葡萄糖異構酶(GI)在工業(yè)上應用廣泛

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論