生物信息學(xué)畢業(yè)論文_第1頁
生物信息學(xué)畢業(yè)論文_第2頁
生物信息學(xué)畢業(yè)論文_第3頁
生物信息學(xué)畢業(yè)論文_第4頁
生物信息學(xué)畢業(yè)論文_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、湖 南 科 技 大 學(xué)畢 業(yè) 設(shè) 計(jì)( 論 文 )題目綿羊mhc class基因的生物信息學(xué)分析作者周麗萍學(xué)院生命科學(xué)學(xué)院專業(yè)生物科學(xué)學(xué)號(hào)0709010125指導(dǎo)教師金元昌二一一年 月 日湖 南 科 技 大 學(xué)畢業(yè)設(shè)計(jì)(論文)任務(wù)書 生命科學(xué)學(xué)院 院 生物工程 系(教研室)系(教研室)主任: (簽名) 2011 年 1 月 18 日學(xué)生姓名: 周麗萍 學(xué)號(hào): 07090101025 專業(yè): 生物科學(xué) 1 設(shè)計(jì)(論文)題目及專題: 綿羊 mhc classii基因的生物信息學(xué)分析 2 學(xué)生設(shè)計(jì)(論文)時(shí)間:自2011年 1月18日開始至 2011 年 6 月 10 日止3 設(shè)計(jì)(論文)所用資源和

2、參考資料:3.1所用資源:萬維網(wǎng)上的生物數(shù)據(jù)庫;學(xué)校所購(gòu)買的電子期刊;校圖書館;學(xué)院實(shí)驗(yàn)室網(wǎng)絡(luò);3.2 參考資料:張陽德編著.生物信息學(xué)m北京: 科學(xué)出版社,2004.9.金伯泉.細(xì)胞和分子免疫學(xué)m.科學(xué)出版社,2006,281-305. 許忠能.生物信息學(xué)m. 清華大學(xué)出版社,2008,1-4. 楊晶,胡剛,王奎,沈世鎰.生物計(jì)算生物序列的分析方法與應(yīng)用m.科學(xué)出版社,2010,105-111.4 設(shè)計(jì)(論文)應(yīng)完成的主要內(nèi)容:4.1獲取綿羊 mhc classii基因核酸與蛋白序列及與其同源的其它物種的序列,進(jìn)行多序列比對(duì),做出分子進(jìn)化樹,并分析; 4.2對(duì)綿羊 mhc clas

3、sii分子的疏水區(qū)、跨膜區(qū)、功能結(jié)構(gòu)域和生物活性位點(diǎn)分析; 4.3預(yù)測(cè)綿羊 mhc classii分子的二級(jí)結(jié)構(gòu)與三級(jí)結(jié)構(gòu)。 5 提交設(shè)計(jì)(論文)形式(設(shè)計(jì)說明與圖紙或論文等)及要求: 5.1嚴(yán)格按照<<湖南科技大學(xué)本科生畢業(yè)設(shè)計(jì)(論文)工作規(guī)范>>的寫作完成畢業(yè)論文,完成不少于8000字信息量的論文;格式正確,包括目錄、論文中英文題目及摘要、前言、正文、參考文獻(xiàn)、致謝詞和附錄; 5.2 在實(shí)驗(yàn)及論文寫作過程中,對(duì)數(shù)據(jù)和結(jié)果等要求實(shí)事求是,并且要在老師的指導(dǎo)下獨(dú)立完成。 6 發(fā)題時(shí)間: 2011 年 1 月 17 日指導(dǎo)教師: (簽名)學(xué) 生: (簽名)湖 南 科 技

4、大 學(xué)畢業(yè)設(shè)計(jì)(論文)指導(dǎo)人評(píng)語主要對(duì)學(xué)生畢業(yè)設(shè)計(jì)(論文)的工作態(tài)度,研究?jī)?nèi)容與方法,工作量,文獻(xiàn)應(yīng)用,創(chuàng)新性,實(shí)用性,科學(xué)性,文本(圖紙)規(guī)范程度,存在的不足等進(jìn)行綜合評(píng)價(jià)指導(dǎo)人: (簽名)年 月 日 指導(dǎo)人評(píng)定成績(jī): 湖 南 科 技 大 學(xué)畢業(yè)設(shè)計(jì)(論文)評(píng)閱人評(píng)語主要對(duì)學(xué)生畢業(yè)設(shè)計(jì)(論文)的文本格式、圖紙規(guī)范程度,工作量,研究?jī)?nèi)容與方法,實(shí)用性與科學(xué)性,結(jié)論和存在的不足等進(jìn)行綜合評(píng)價(jià)評(píng)閱人: (簽名)年 月 日 評(píng)閱人評(píng)定成績(jī): 湖 南 科 技 大 學(xué)畢業(yè)設(shè)計(jì)(論文)答辯記錄日期: 學(xué)生: 學(xué)號(hào): 班級(jí): 題目: 提交畢業(yè)設(shè)計(jì)(論文)答辯委員會(huì)下列材料:1 設(shè)計(jì)(論文)說明書共頁2 設(shè)計(jì)

5、(論文)圖 紙共頁3 指導(dǎo)人、評(píng)閱人評(píng)語共頁畢業(yè)設(shè)計(jì)(論文)答辯委員會(huì)評(píng)語:主要對(duì)學(xué)生畢業(yè)設(shè)計(jì)(論文)的研究思路,設(shè)計(jì)(論文)質(zhì)量,文本圖紙規(guī)范程度和對(duì)設(shè)計(jì)(論文)的介紹,回答問題情況等進(jìn)行綜合評(píng)價(jià)答辯委員會(huì)主任: (簽名)委員: (簽名)(簽名)(簽名)(簽名) 答辯成績(jī): 總評(píng)成績(jī): 摘 要從ncbi中獲取綿羊主要組織相容性復(fù)合體(major histocompatibility complex,mhc)的核苷酸與氨基酸序列,應(yīng)用生物信息學(xué)原理,對(duì)綿羊mhc分子疏水區(qū)、跨膜區(qū)、結(jié)構(gòu)功能域和生物活性位點(diǎn)等幾方面生物學(xué)特性進(jìn)行了分析,預(yù)測(cè)出該基因的二級(jí)結(jié)構(gòu)和三級(jí)結(jié)構(gòu),并將綿羊與其它動(dòng)物的核苷酸

6、和氨基酸序列進(jìn)行多序列對(duì)比,做出分子進(jìn)化樹。結(jié)果表明,綿羊mhc分子有一個(gè)疏水區(qū)和跨膜區(qū);該分子有主要組織相容性復(fù)合物蛋白免疫球蛋白信號(hào)及n-糖基化位點(diǎn)、蛋白質(zhì)激酶c磷酸化位點(diǎn)等多個(gè)生物活性位點(diǎn)。綿羊mhc class的氨基酸序列和核苷酸序列與成都麻羊的同源性最高,分別達(dá)66%和73%,其次與亞洲水牛和肩蜂牛的同源性也較高,與大黃魚的同源性最低,分別為25%和51%。關(guān)鍵詞:主要組織相容性復(fù)合體類;生物信息學(xué);序列分析abstractextract ovis aries from ncbi of nucleotides and major histocompatibility complex

7、class ii amino acid sequence, application bioinformatics principle, on ovis aries mhc class ii molecules succoth watershed and transmembrane area, the structure and function domain and biological activity sites aspects of biology characteristic was analyzed to predict the secondary structure and lev

8、el 3 genetic structure, and the ovis aries and other animals will be more nucleotide sequence of amino acid sequence and contrast, make more sequence phylogenetic tree. results show that, ovis aries mhc class ii molecules have a dredging watershed and transmembrane area, the molecules are major hist

9、ocompatibility complex protein immunoglobulin signal and n - glycosylation sites, protein kinase c phosphorylation sites such multiple bioactive loci sites, ovis aries mhc class ii the sequence of amino acids and nucleotide sequences and the capra hircus is highest homology of 66% and 73%. secondly

10、bubalus bubalis and bos indicus homology of higher, with the lowest, homology of larimichthys crocea for 25% and 51% respectively.keywords: major histocompatibility complex class ii molecules; bioinformatics; sequence analys目 錄第一章 前言11.1 生物信息學(xué)簡(jiǎn)介11.2 mhc的相關(guān)簡(jiǎn)介1第二章 材料來源4第三章 分析方法53.1 蛋白質(zhì)序列的獲取53.1.1 綿羊mh

11、c class基因的核酸和蛋白質(zhì)序列的獲得53.1.2 同源序列獲得53.2 蛋白質(zhì)的基本性質(zhì)分析53.2.1 疏水性分析53.2.2 跨膜區(qū)分析53.2.3 功能結(jié)構(gòu)域分析53.2.4 生物活性位點(diǎn)分析53.3 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)53.3.1 蛋白質(zhì)二級(jí)結(jié)構(gòu)的預(yù)測(cè)53.3.2 蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)53.4 綿羊mhc class系統(tǒng)進(jìn)化樹分析5第四章 結(jié)果與分析64.1 綿羊mhc class基因的核酸和蛋白質(zhì)序列64.2 綿羊mhc class蛋白質(zhì)的疏水性和跨膜區(qū)分析74.2.1綿羊mhc class蛋白質(zhì)的疏水性分析74.2.2綿羊mhc class蛋白質(zhì)的跨膜螺旋區(qū)分析84.3 綿羊mhc

12、 class蛋白質(zhì)的功能結(jié)構(gòu)域分析94.4 綿羊mhc class蛋白質(zhì)生物活性位點(diǎn)分析114.5 綿羊mhc class蛋白質(zhì)的二級(jí)結(jié)構(gòu)預(yù)測(cè)124.6 綿羊mhc class蛋白質(zhì)的三級(jí)結(jié)構(gòu)預(yù)測(cè)144.7 同源序列對(duì)比和系統(tǒng)發(fā)生分析15第五章 結(jié)論21參考文獻(xiàn)22致謝23-第一章 前 言1.1 生物信息學(xué)簡(jiǎn)介生物信息學(xué)是一門研究生物和生物相關(guān)系統(tǒng)中信息內(nèi)容和信息流向的綜合性系統(tǒng)科學(xué),它綜合運(yùn)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)和生物學(xué)的各種工具,來闡明和理解大量數(shù)據(jù)所包含的生物學(xué)意義1。它的研究?jī)?nèi)容包括生物信息的存儲(chǔ)于獲取、序列比對(duì)、測(cè)序與拼接、基因預(yù)測(cè)、生物進(jìn)化與系統(tǒng)發(fā)育分析、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、rna結(jié)構(gòu)預(yù)測(cè)

13、、分子設(shè)計(jì)與藥物設(shè)計(jì)、代謝網(wǎng)絡(luò)分析、基因芯片、dna計(jì)算等。它還是一門以信息知識(shí)為基礎(chǔ)的學(xué)科,關(guān)鍵資源是知識(shí),關(guān)鍵技術(shù)是信息處理。它為揭示人類及重要?jiǎng)又参锓N類的基因組信息,繼而進(jìn)行生物大分子結(jié)構(gòu)模擬和藥物設(shè)計(jì),以及天然生物大分子的改造和基于受體結(jié)構(gòu)的藥物分子設(shè)計(jì)提供依據(jù)。生物信息學(xué)不僅對(duì)認(rèn)識(shí)生物體和生物信息的起源、遺傳、發(fā)育與進(jìn)化的本質(zhì)具有重要意義,而且可為人類疾病的診斷和防治開辟全新的途徑,并為動(dòng)植物的物種改良提供了堅(jiān)實(shí)的理論基礎(chǔ)。此外通過對(duì)影響藥物代謝或效應(yīng)通路、相關(guān)基因編碼序列的再測(cè)序,很可能揭示個(gè)體對(duì)藥物差別的遺傳學(xué)基礎(chǔ)2。生物信息學(xué)作為生命科學(xué)研究所必需的研究工具,在生命科學(xué)實(shí)踐中越

14、來越顯示出它的重要作用,特別是在實(shí)驗(yàn)設(shè)計(jì)、結(jié)構(gòu)分析上,離不開生物信息學(xué)的指導(dǎo)3。而生物數(shù)據(jù)庫、相關(guān)軟件是生物信息學(xué)研究與應(yīng)用的重要資源。在生物信息學(xué)軟件中,生物學(xué)研究人員用得最多的軟件是搜索工具blast(basic local alignment search tool)1。本文則是對(duì)綿羊mhc class ii基因進(jìn)行了生物信息學(xué)分析,也多次使用了blast軟件。1.2 mhc的相關(guān)簡(jiǎn)介誘導(dǎo)強(qiáng)而迅速排斥反應(yīng)的抗原稱為主要組織相容性抗原或主要移植抗原, 編碼這種抗原的基因群稱為主要組織相容性復(fù)合體(major histocompatibility complex, mhc)。 主要組織相容性

15、復(fù)合體是存在于脊椎動(dòng)物某一染色體上的一群緊密連鎖的基因群,編碼主要組織相容性抗原,調(diào)控細(xì)胞間相互識(shí)別,并與免疫應(yīng)答和免疫調(diào)節(jié)有關(guān),呈高度多態(tài)性4。多態(tài)性是一個(gè)群體的概念,指mhc存在多個(gè)基因座位,染色體同一基因座有兩種以上的基因型,即可能編碼兩種以上的產(chǎn)物。mhc的高度多態(tài)基因區(qū),這些連鎖的免疫應(yīng)答基因控制著機(jī)體對(duì)抗原產(chǎn)生免疫應(yīng)答的能力。mhc高度多態(tài)性賦於物種極大的應(yīng)變能力造就了各式各樣對(duì)抗原(病原體)入侵反應(yīng)性和易感性不同的個(gè)體.使之能對(duì)付多變的環(huán)境條件及各種病原體的侵襲。在免疫應(yīng)答的t-b、t-t、t-apc細(xì)胞的相互作用中,t細(xì)胞除識(shí)別抗原物質(zhì)外,還必須同時(shí)識(shí)別與之作用細(xì)胞表面的mhc

16、分子,這一現(xiàn)象稱為mhc限制性。不同的物種,不同種屬動(dòng)物都有自身的mhc:如人的mhc通常稱hla基因(hunan leukocyte antigen,hla)或hla基因復(fù)合體, 稱其產(chǎn)物為hla分子或hla抗原;稱小鼠mhc為h-2;稱黑猩猩為chla;稱狗為dla;稱豬為sla;稱牛為bola。根據(jù)主要組織相容性抗原分子結(jié)構(gòu)、分布和功能不同分為、類分子。按所含基因的功能不同,一般可將mhc區(qū)域分為class區(qū)、class區(qū)和class區(qū)。其編碼基因也相應(yīng)地分成三類。類和類分子是結(jié)構(gòu)相似的細(xì)胞膜表面糖蛋白,除作為移植抗原外,還與抗原遞呈及某些疾病相關(guān)。類分子包括c2、c4、b因子和腫瘤壞死

17、因子等多種可溶性蛋白質(zhì)。mhc類分子:所有有核細(xì)胞及血小板、網(wǎng)織紅細(xì)胞。圖1.1 mhc分子結(jié)構(gòu)圖mhc-類分子是異源二聚體,它的分子的兩條鏈均由mhc-類分子基因編碼,由鏈和鏈以非共價(jià)鍵結(jié)合的多肽鏈構(gòu)成(如圖1.1所示),其中鏈分子量為3234kda,有兩個(gè)n連接寡糖;鏈為2730kda,有一個(gè)n連接寡糖。兩條鏈在整個(gè)結(jié)構(gòu)上彼此相似,由于糖基化作用,鏈比鏈略大,鏈、鏈胞膜外區(qū)各有兩個(gè)結(jié)構(gòu)域1、2及1、2,每個(gè)結(jié)構(gòu)域約含90個(gè)氨基酸殘基。鏈和鏈均是跨膜蛋白,c端為胞漿區(qū)。除1結(jié)構(gòu)域外,2、1和2每個(gè)結(jié)構(gòu)域均含一個(gè)二硫鍵。胞膜外區(qū)(跨膜區(qū)和胞漿區(qū))按功能進(jìn)一步分為肽結(jié)合區(qū)和免疫球蛋白樣區(qū)。mhc

18、-類分子的兩條鏈均由不同的mhc基因編碼,呈多態(tài)性。肽結(jié)合區(qū)mhc-類分子的1、1結(jié)構(gòu)域與免疫球蛋白樣區(qū)結(jié)構(gòu)域無相似性,是類分子結(jié)合抗原肽部位和高度多態(tài)性所在。每個(gè)結(jié)構(gòu)域都是有4條折疊和1個(gè)螺旋組成,1和1結(jié)構(gòu)域的片層共同形成肽結(jié)合溝槽的底部,1和1結(jié)構(gòu)域的螺旋共同形成肽結(jié)合溝槽的側(cè)壁。2和2結(jié)構(gòu)域?qū)儆诿庖咔虻鞍壮易錭1型結(jié)構(gòu),具非多態(tài)性,2和2結(jié)構(gòu)域是mhc-類分子的非多態(tài)部分,也是與cd4分子相互作用的位點(diǎn)。2和2結(jié)構(gòu)域c端側(cè)各有一個(gè)短的連接區(qū),分別連接2、2結(jié)構(gòu)域與跨膜區(qū)。跨膜區(qū)約含25個(gè)氨基酸殘基,形成螺旋將鏈和鏈固定在細(xì)胞膜上。胞漿區(qū)很短,有2530個(gè)氨基酸殘基,可能與信號(hào)轉(zhuǎn)導(dǎo)有關(guān)

19、5。在mhc基因內(nèi),第一外顯子編碼先導(dǎo)順序或信號(hào)順序,它將新生蛋白帶向內(nèi)質(zhì)網(wǎng)。每個(gè)約由90個(gè)氨基酸組成的細(xì)胞外區(qū)殘基各有一個(gè)大外顯子跨膜區(qū)和胞漿區(qū)由幾個(gè)小外顯子編碼。控制mhc基因轉(zhuǎn)錄的許多順式調(diào)節(jié)順序位于編碼mhc分子外顯子閱讀框架的5端,這些核苷酸順序是dna-結(jié)合蛋白的分子靶位,這些dna-結(jié)合蛋白事反式轉(zhuǎn)錄調(diào)節(jié)因子。mhc基因轉(zhuǎn)錄調(diào)節(jié)的一般原則與免疫球蛋白基因相似。mhc類基因啟動(dòng)子序列位于基因編碼區(qū)5端上游,轉(zhuǎn)錄起始點(diǎn)上游200bp范圍內(nèi)。mhc類基因進(jìn)側(cè)基因啟動(dòng)子部分存在多態(tài)性,表現(xiàn)為順式作用元件dq,dp的多基因家族,是類分子多樣性的分子基礎(chǔ),在免疫應(yīng)答中起關(guān)鍵作用5。本文是對(duì)綿

20、羊mhc class分子進(jìn)行生物信息學(xué)分析,應(yīng)用生物信息學(xué)方法找出綿羊mhc class的核酸和蛋白質(zhì)序列,對(duì)綿羊mhc class分子疏水區(qū)、跨膜區(qū)、結(jié)構(gòu)功能域和生物活性位點(diǎn)等幾方面生物學(xué)特性進(jìn)行了分析,預(yù)測(cè)出該基因的二級(jí)結(jié)構(gòu)和三級(jí)結(jié)構(gòu),并將綿羊與其它動(dòng)物的核苷酸和氨基酸序列進(jìn)行多序列對(duì)比和系統(tǒng)分子進(jìn)化樹分析,對(duì)綿羊mhc class的研究做一下基礎(chǔ)性工作。第二章 材料來源綿羊mhc class基因及其同源的其它物種的核酸和氨基酸序列編碼(表2.1)。 表2.1 不同物種mhc class基因的核酸和蛋白質(zhì)序列種類(species)蛋白質(zhì)編號(hào)(protein id)核酸編號(hào)(nucleoti

21、de id)綿羊np-001116870nm-001123398褐家鼠cad86939aj554216原雞aar14674ay357254小家鼠np-034508nm-010378非洲爪蟾蜍np-001079971nm-001086502家貓ack99138eu915361家馬xp-001493225xm-001493175野驢abm92287ef204945歐洲兔np-001164589nm-001171118歐洲野兔acn39186fj225345大熊貓xp-002914414xm-002914368鷦鷯aan87894ay169005成都麻羊aar97716aar97716亞洲水牛aay

22、40169dq016629肩峰牛cax17688fm986339大猩猩aau87999ay663403紅毛猩猩acl00582eu877227野豬aba42968dq159895大西洋鯡cam34665am492999三文魚cad27719aj438965大黃魚abv48907ef681863人np-002113nm-002122家犬cah61722aj630362第三章 分析方法3.1 蛋白質(zhì)序列的獲得3.1.1 綿羊mhc class基因的核酸和蛋白質(zhì)序列的獲得 在ncbi數(shù)據(jù)庫上搜索綿羊mhc class基因的核酸和蛋白質(zhì)序列。3.1.2 同源序列獲得 利用ncbi上的blast程序?qū)Ρ?/p>

23、直接獲取與綿羊mhc class基因同源的核酸和蛋白質(zhì)序列。3.2 蛋白質(zhì)的基本性質(zhì)分析3.2.1 疏水性分析 用位于expasyde的protscale6(/cgi-bin/protscale.pl) 程序?qū)ζ溥M(jìn)行疏水性分析。3.2.2 跨膜區(qū)分析 聯(lián)網(wǎng)至(http:/www.genome.cbs.dut.dk/services/tmhmm-2.0)使用服務(wù)器tmhmm-2.07 或聯(lián)網(wǎng)至(/software/tmpred_form.html)進(jìn)行跨膜區(qū)分析。3.2.3 功能結(jié)構(gòu)域分析 聯(lián)網(wǎng)至(http:/

24、www.ebi.ac.uk/interpro/index.html)用ebi開發(fā)的interproscan7進(jìn)行分析。3.2.4 生物活性位點(diǎn)分析 利用位于expasy的prosite6(/prosite/)對(duì)綿羊mhc class蛋白質(zhì)進(jìn)行活性位點(diǎn)分析。3.3 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)3.3.1 蛋白質(zhì)二級(jí)結(jié)構(gòu)的預(yù)測(cè) 聯(lián)網(wǎng)至(http:/www. p/)用phd8對(duì)綿羊mhc class進(jìn)行分析或聯(lián)網(wǎng)至psipred8的網(wǎng)址(http:/bioinf.cs.ucl.ac.uk/psipred)。3.3.2 蛋白質(zhì)三級(jí)結(jié)構(gòu)的預(yù)測(cè)

25、利用位于swiss-model5的automated mode服務(wù)器返回到郵件的結(jié)果,觀察蛋白質(zhì)的三級(jí)結(jié)構(gòu)。3.4 綿羊mhc class系統(tǒng)進(jìn)化樹分析聯(lián)網(wǎng)至(http:/www.ebi.ac.uk/clustalw/)6對(duì)所獲得的同源蛋白質(zhì)序列進(jìn)行比對(duì)分析并構(gòu)建系統(tǒng)進(jìn)化樹。第四章 結(jié)果與分析4.1 綿羊mhc class基因的核酸和蛋白質(zhì)序列在ncbi上獲取綿羊的蛋白質(zhì)序列(序列號(hào):np-001116870): 1 mkkalilral alaammslcg gedivadhvg tygtnvyqty gasgqftfef dgde

26、lfyvdl 61 rkketvwrlp efnnitmfei qsalrnivms krnldilmkn snftpatndi pevavfpkss 121 vilgipntli cqvdnifppv initwfyngq fvaegvaett fypksdhsfl kfsyltfvpa 181 sedfydcrve hwgleeplvk hwepkiptpt seltetvvca lglpmg

27、lmgi vvgtvlilrv 241 rcsgaasrrr ramshglkdg kerkvfisvf aaasgaqdhq phaawcfr  該蛋白質(zhì)序列由288個(gè)氨基酸殘基組成。在ncbi上獲取綿羊的核酸序列(序列號(hào):nm-001123398): 1 catgggctgc tccaacatga tttctccagc agttctcttt agaccacctt cctggtgagg 61 caccacttgg 

28、aacagccact cctgaggaaa cccttggagg aggaggagga tgaagaaagc 121 tctgattctg agggctctcg ctctggccgc catgatgagc ctgtgtggag gtgaagacat 181 cgtggcggac cacgtgggca cttacggcac aaatgtctac cagacgtacg gcgcctctgg 241 c

29、cagttcacg tttgaatttg atggagacga gctcttctac gtggacctga ggaaaaaaga 301 gactgtctgg aggctgcccg agtttaacaa tatcaccatg tttgaaattc agagtgccct 361 gagaaacatt gttatgtcaa aaagaaattt ggacatcttg atgaaaaatt ccaactttac&

30、#160;421 acctgccacc aatgacatcc ctgaagtggc tgtgtttccc aaatcctccg tgatcctggg 481 gattcccaac accctcatct gtcaggtgga caacatcttt cctcctgtga tcaacatcac 541 ttggttttac aatggacagt ttgttgcaga aggtgtcgct gagaccacct&#

31、160;tctaccccaa 601 gagtgaccac tccttcctca agttcagtta cctcaccttt gttcccgcca gtgaagactt 661 ctatgactgc agagtggagc actggggcct ggaagagccc ctcgtcaagc actgggagcc 721 caagattcca acccctacat cagagctgac agagactgtg

32、60;gtctgtgccc tggggctgcc 781 catgggcctc atgggcatcg tggtgggcac tgtcctcatc ctccgagtcc ggtgctcagg 841 tgctgcctcc agacgtcgaa gggccatgag tcatggcctg aaagatggga aggagaggaa 901 agtcttcatt tctgttttcg ctgcagcatc

33、0;gggagcacag gaccatcagc ctcatgctgc 961 ctggtgtttc aggtgatcag tctttacaag aaaagaaagg catggttcag gctccagttc 1021 cccatcttga ccttgactga gacgtgctcc ttggtccatt tcatcacaga gctccttcca 1081 cgccctcctg ctctccctgc

34、60;tggggcagac tttatggagg aattttcctt cgaagatcac 1141 tgaccctcac gaattctccc aacttagtct ttgattcatt gcctacctgt cacagagacc 1201 tggattgttc cacc      該核酸序列由1214個(gè)堿基組成。4.2 綿羊mhc class蛋白質(zhì)的疏水性和跨膜區(qū)分析4.2.1 綿羊mhc class蛋白質(zhì)的疏

35、水性分析疏水性是每個(gè)氨基酸所固有的特性,即每個(gè)氨基酸遠(yuǎn)離周圍水分子,將自己包埋進(jìn)蛋白質(zhì)核心的相對(duì)趨勢(shì)。疏水性氨基酸在蛋白質(zhì)內(nèi)部,由于其疏水性的相互作用,在保持蛋白質(zhì)三級(jí)結(jié)構(gòu)的形成和穩(wěn)定中起著重要作用。疏水性預(yù)測(cè)的方法依賴于疏水性的衡量尺度,每個(gè)氨基酸根據(jù)其一系列的物理特性(例如溶解性、跨越水-汽相時(shí)產(chǎn)生的自由能等),被賦予一個(gè)數(shù)值以代表其疏水性。組成蛋白質(zhì)的20種氨基酸各自帶有不同極性的側(cè)鏈基團(tuán),氨基酸側(cè)鏈的疏水性,用從各氨基酸的疏水性減去甘氨酸疏水性之值來表示。具有較高正值的氨基酸具有較強(qiáng)的疏水性;而具有較低負(fù)值的氨基酸則具有較強(qiáng)的輕水性6。利用位于expasy的protscale進(jìn)行疏水性

36、分析,當(dāng)window size設(shè)置為9時(shí),當(dāng)氨基酸殘基的疏水性值大于2.34時(shí),為明顯的疏水區(qū)。單個(gè)氨基酸疏水性值:ala: 1.800 arg: -4.500 asn: -3.500 asp: -3.500 cys: 2.500 gln: -3.500 glu: -3.500 gly: -0.400 his: -3.200 ile: 4.500 leu: 3.800 lys: -3.900 met: 1.900 phe: 2.800 pro: -1.600 ser: -0.800 thr: -0.700 trp: -0.900 tyr: -1.300 val: 4.200 : -3.500

37、: -3.500 : -0.490 min: -2.244max: 3.122圖4.1 用protscale對(duì)綿羊mhc class蛋白質(zhì)進(jìn)行疏水性分析結(jié)果從上圖返回的結(jié)果我們得知在第234位氨基酸處有最大值3.122,在第258位氨基酸處有最小值-2.244,在第位231至236位氨基酸的值分別為2.503,2.829,2.941,3.122,2.912,2.601這一區(qū)段氨基酸疏水性值大于2.34,所以我們得出結(jié)論:該蛋白質(zhì)序列在位于231236位殘基之間具有明顯的疏水性,從而說明該序列有一個(gè)疏水區(qū)。4.2.2 綿羊mhc class蛋白質(zhì)的跨膜螺旋區(qū)分析膜蛋白是一類結(jié)構(gòu)獨(dú)特的蛋白質(zhì),執(zhí)行

38、著重要的細(xì)胞生物學(xué)功能。蛋白質(zhì)序列含有跨膜區(qū),提示它可能作為膜受體起作用,也可能是定位在膜上的錨定蛋白或離子通道蛋白,所以含有跨膜區(qū)蛋白往往和細(xì)胞的功能狀態(tài)密切相關(guān),對(duì)膜蛋白的跨膜螺旋進(jìn)行預(yù)測(cè)是生物信息學(xué)的重要應(yīng)用9。通常使用單一的預(yù)測(cè)軟件分析的準(zhǔn)確性都不太高,綜合不同的軟件預(yù)測(cè)結(jié)果并結(jié)合疏水性圖,可獲得較好的預(yù)測(cè)結(jié)果。使用兩種在線網(wǎng)絡(luò)工具分析結(jié)果分別是:(1)利用tmhmm軟件分析結(jié)果如下:# sequence length: 288# sequence number of predicted tmhs: 1# sequence exp number of aas in tmhs: 21.8

39、3121# sequence exp number, first 60 aas: 0.52936# sequence total prob of n-in: 0.06765sequencetmhmm2.0outside 1 217sequencetmhmm2.0tmhelix 218 240sequencetmhmm2.0inside 241 288圖4.2 用tmhmm對(duì)綿羊mhc class蛋白質(zhì)的跨膜區(qū)分析結(jié)果根據(jù)以上數(shù)據(jù)和圖表顯示我們可以得出這樣的結(jié)論:在位于位于218240位氨基酸之間存在一個(gè)跨膜區(qū)。(2)利用tmpred軟件分析結(jié)果如下:possible models consid

40、ered, only significant tm-segments used-> strongly prefered model: n-terminus outside 3 strong transmembrane helices, total score : 3329 # from to length score orientation 1 4 25 (22) 742 o-i 2 121 143 (23) 542 i-o 3 217 240 (24) 2045 o-i-> alternative model 3 strong transmembrane helices, tot

41、al score : 2867 # from to length score orientation 1 6 24 (19) 899 i-o 2 114 133 (20) 505 o-i3 216 238 (23) 1463 i-o 圖4.3 用tmpred對(duì)綿羊mhc class蛋白質(zhì)的跨膜區(qū)分析結(jié)果由分析結(jié)果和圖像顯示,可得出這樣的結(jié)論:綿羊mhc class蛋白質(zhì)的跨膜區(qū)有兩種可能,它有三個(gè)明顯的跨膜區(qū)。一種可能為它的跨膜區(qū)一個(gè)位于 425 位氨基酸之間,一個(gè)位于121143位氨基酸之間,另一個(gè)位于217240位氨基酸之間。另一種可能為它的跨膜區(qū)一個(gè)位于624位氨基酸之間,一個(gè)位于114

42、133位氨基酸之間,另一個(gè)位于216238位氨基酸之間??傮w來看,tmpred軟件預(yù)測(cè)出三個(gè)跨膜區(qū),tmhmm預(yù)測(cè)出一個(gè)跨膜區(qū),顯然,對(duì)于同一蛋白,兩種不同的的方法給出了不同的預(yù)測(cè)結(jié)果,但部分預(yù)測(cè)結(jié)果大致相同。然而在多數(shù)情況下,tmpred的預(yù)測(cè)結(jié)果比實(shí)際情況會(huì)稍微長(zhǎng)一些或偏一些,基于綜上考慮,認(rèn)為該蛋白僅存在一個(gè)跨膜區(qū),位于218240位氨基酸殘基之間,這與疏水性的分析也基本吻合。4.3 綿羊mhc class蛋白質(zhì)的功能結(jié)構(gòu)域分析結(jié)構(gòu)域(structuraldomain)是生物大分子中具有特異結(jié)構(gòu)和獨(dú)立功能的區(qū)域,特別指蛋白質(zhì)中這樣的區(qū)域,是介于二級(jí)和三級(jí)結(jié)構(gòu)之間的另一種結(jié)構(gòu)層次。所謂結(jié)構(gòu)

43、域是指蛋白質(zhì)亞基結(jié)構(gòu)中明顯分開的緊密球狀結(jié)構(gòu)區(qū)域,又稱為轄區(qū)。在球形蛋白中,結(jié)構(gòu)域具有自己特定的四級(jí)結(jié)構(gòu),其功能部依賴于蛋白質(zhì)分子中的其余部分,但是同一種蛋白質(zhì)中不同結(jié)構(gòu)域間常可通過不具二級(jí)結(jié)構(gòu)的短序列連接起來。蛋白質(zhì)分子中不同的結(jié)構(gòu)域常由基因的不同外顯子所編碼。有些球形蛋白的一條肽鏈,或以共價(jià)鍵相連的兩條或多條肽鏈在空間結(jié)構(gòu)上可以區(qū)分為若干個(gè)球狀的子結(jié)構(gòu),其中的每一個(gè)球狀子結(jié)構(gòu)就被稱為一個(gè)結(jié)構(gòu)域。圖4.4 用interproscan對(duì)綿羊mhc class蛋白質(zhì)的功能結(jié)構(gòu)域分析結(jié)合prosite數(shù)據(jù)庫分析: hits by profiles: 1 hit (by 1 profile) on

44、1 sequencehits by ps50835   ig_like   ig-like domain profile :userseq1    (288 aa)111 - 191:score = 11.134pevavfp-kssvilgipntlicqvdnifppvinitwfyng-qfvaegvaettfypksdhsflkfsyltfvpasedfydcrveh-predicted feature:disulfid131187by similaritycondition: c-x*-chits by

45、patterns: 1 hit (by 1 pattern) on 1 sequencehits by ps00290   ig_mhc   immunoglobulins and major histocompatibility complex proteins signature :userseq1    (288 aa)185 - 191:  ydcrveh 圖4.5 用prosit對(duì)綿羊mhc class蛋白質(zhì)的功能結(jié)構(gòu)域分析通過兩種不同的數(shù)據(jù)庫發(fā)現(xiàn)該蛋白質(zhì)存在主要組織相容性復(fù)合物蛋白免

46、疫球蛋白信號(hào)、免疫球蛋白c1位點(diǎn)、免疫球蛋白樣結(jié)構(gòu)域、主要組織相容性復(fù)合體類樣識(shí)別抗原、主要組織相容性復(fù)合體類樣識(shí)別抗原蛋白、免疫球蛋白樣折疊以及未整合區(qū)段。通過prosite數(shù)據(jù)庫我們發(fā)現(xiàn)在111191位氨基酸之間存在一個(gè)免疫球蛋白樣結(jié)構(gòu)域,其期望值是11.134。其中131187位氨基酸之間存在二硫化物,起著重要的生理作用。在185191位氨基酸之間存在一個(gè)主要組織相容性復(fù)合物蛋白免疫球蛋白信號(hào)。在interproscan數(shù)據(jù)庫中發(fā)現(xiàn)于126197位氨基酸段為免疫球蛋白c1位點(diǎn),27104 位氨基酸段為主要組織相容性復(fù)合體類樣識(shí)別抗原,105221位氨基酸段為免疫球蛋白樣折疊。4.4 綿羊

47、mhc class蛋白質(zhì)生物活性位點(diǎn)分析pattern-id: asn_glycosylation ps00001 pdoc00001pattern-de: n-glycosylation sitepattern: npstp 74 nitm 142 nitwpattern-id: camp_phospho_site ps00004 pdoc00004pattern-de: camp- and cgmp-dependent protein kinase phosphorylation sitepattern: rk2.st 62 kketpattern-id: pkc_phospho_site

48、 ps00005 pdoc00005pattern-de: protein kinase c phosphorylation sitepattern: st.rk 90 skr 247 srrpattern-id: ck2_phospho_site ps00006 pdoc00006pattern-de: casein kinase ii phosphorylation sitepattern: st.2de 76 tmfepattern-id: myristyl ps00008 pdoc00008pattern-de: n-myristoylation sitepattern: gedrkh

49、pfyw.2stagcnp 30 gtygtn 124 gipntl 149 gqfvae 155 gvaett 222 glpmgl 229 givvgt 256 glkdgkpattern-id: ig_mhc ps00290 pdoc00262pattern-de: immunoglobulins and major histocompatibility complex proteins signaturepattern: fylcpgadvalch185 ydcrveh結(jié)果表明,該蛋白質(zhì)序列含有:2個(gè)n-糖基化位點(diǎn),位于7477和142145位氨基酸段;1個(gè)a激酶位點(diǎn),位于6265為氨

50、基酸段;2個(gè)蛋白質(zhì)激酶c磷酸化位點(diǎn),分別位于9092和247249位氨基酸段;1個(gè)酪蛋白激酶ii磷酸化位點(diǎn),分別位于7679位氨基酸段;7個(gè)n-肉豆蔻酰化作用位點(diǎn),分別位于3035、124129、149154、155160、222227、229234、256261位氨基酸段;1個(gè)主要組織相容性復(fù)合物蛋白免疫球蛋白信號(hào),位于185191位氨基酸段。4.5 綿羊mhc class蛋白質(zhì)的二級(jí)結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu)預(yù)測(cè)是聯(lián)系其一級(jí)結(jié)構(gòu)和三級(jí)結(jié)構(gòu)的橋梁和紐帶,并為蛋白質(zhì)三級(jí)結(jié)構(gòu)和功能提供了大量信息,有助于蛋白質(zhì)突變體的設(shè)計(jì),有助于確定蛋白質(zhì)空間結(jié)構(gòu)與功能。用phd預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu),如圖4.6。在

51、該蛋白質(zhì)序列中,螺旋結(jié)構(gòu)(h)占總序列的18.06% ,折疊結(jié)構(gòu)(e)占總序列的28.47% ,卷曲結(jié)構(gòu)(l)占總序列的53.47%。由此可見該蛋白質(zhì)卷曲程度較高。表4.1 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)組成結(jié)構(gòu)類型 螺旋(h) 折疊(e) 卷曲(l)所占比列(%) 18.06 28.47 53.47用phd方法預(yù)測(cè)如下:圖4.6 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)的prof結(jié)果圖中縮詞說明:aa:氨基酸序列obs _sec:觀察到的二級(jí)結(jié)構(gòu)(h=螺旋,e=折疊,l=環(huán)) prof _sec: prof預(yù)測(cè)的二級(jí)結(jié)構(gòu)rel _sec: prof的可靠性(0=低,9=高)sub _sec: prof預(yù)測(cè)的結(jié)果(“.”意味著

52、對(duì)應(yīng)殘基未給出預(yù)測(cè)結(jié)果,因?yàn)槠淇煽啃缘陀?%)o_3 _acc:所觀察到的具有相對(duì)溶解性的兩種情況:b=0-9% ,i=9-36% ,e=36-100%p_3 _acc: prof預(yù)測(cè)相對(duì)溶解性的三種情況:b=0-9%,i=9-36%,e=36-100%rel _acc:prof預(yù)測(cè)的可靠性(0=低,9=高)sub _acc: prof預(yù)測(cè)的子集,所有殘基期望的平均相關(guān)性>0.694.6 綿羊mhc class蛋白質(zhì)的三級(jí)結(jié)構(gòu)預(yù)測(cè)利用swiss-model對(duì)綿羊mhc class蛋白質(zhì)的模建結(jié)果如下:    model information: &

53、#160;   modelled residue range: 23 to 202     based on template: 1es0a (2.60 Å)     sequence identity %:67.222     evalue:5.45e-72 圖4.7 模建質(zhì)量評(píng)價(jià)分析圖4.8 模建的蛋白質(zhì)三級(jí)結(jié)構(gòu)圖(swiss-model)由以上分析結(jié)果和圖像可得出:綿羊mhc class ii蛋白質(zhì)三級(jí)結(jié)構(gòu)是基于1es0的a鏈模建的,兩者序列一致性達(dá)到67.222%。該模建的蛋白質(zhì)三級(jí)結(jié)構(gòu)是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論