生物信息學畢業(yè)論文_第1頁
生物信息學畢業(yè)論文_第2頁
生物信息學畢業(yè)論文_第3頁
生物信息學畢業(yè)論文_第4頁
生物信息學畢業(yè)論文_第5頁
已閱讀5頁,還剩27頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、湖 南 科 技 大 學畢 業(yè) 設 計( 論 文 )題目綿羊mhc class基因的生物信息學分析作者周麗萍學院生命科學學院專業(yè)生物科學學號0709010125指導教師金元昌二一一年 月 日湖 南 科 技 大 學畢業(yè)設計(論文)任務書 生命科學學院 院 生物工程 系(教研室)系(教研室)主任: (簽名) 2011 年 1 月 18 日學生姓名: 周麗萍 學號: 07090101025 專業(yè): 生物科學 1 設計(論文)題目及專題: 綿羊 mhc classii基因的生物信息學分析 2 學生設計(論文)時間:自2011年 1月18日開始至 2011 年 6 月 10 日止3 設計(論文)所用資源和

2、參考資料:3.1所用資源:萬維網(wǎng)上的生物數(shù)據(jù)庫;學校所購買的電子期刊;校圖書館;學院實驗室網(wǎng)絡;3.2 參考資料:張陽德編著.生物信息學m北京: 科學出版社,2004.9.金伯泉.細胞和分子免疫學m.科學出版社,2006,281-305. 許忠能.生物信息學m. 清華大學出版社,2008,1-4. 楊晶,胡剛,王奎,沈世鎰.生物計算生物序列的分析方法與應用m.科學出版社,2010,105-111.4 設計(論文)應完成的主要內容:4.1獲取綿羊 mhc classii基因核酸與蛋白序列及與其同源的其它物種的序列,進行多序列比對,做出分子進化樹,并分析; 4.2對綿羊 mhc clas

3、sii分子的疏水區(qū)、跨膜區(qū)、功能結構域和生物活性位點分析; 4.3預測綿羊 mhc classii分子的二級結構與三級結構。 5 提交設計(論文)形式(設計說明與圖紙或論文等)及要求: 5.1嚴格按照<<湖南科技大學本科生畢業(yè)設計(論文)工作規(guī)范>>的寫作完成畢業(yè)論文,完成不少于8000字信息量的論文;格式正確,包括目錄、論文中英文題目及摘要、前言、正文、參考文獻、致謝詞和附錄; 5.2 在實驗及論文寫作過程中,對數(shù)據(jù)和結果等要求實事求是,并且要在老師的指導下獨立完成。 6 發(fā)題時間: 2011 年 1 月 17 日指導教師: (簽名)學 生: (簽名)湖 南 科 技

4、大 學畢業(yè)設計(論文)指導人評語主要對學生畢業(yè)設計(論文)的工作態(tài)度,研究內容與方法,工作量,文獻應用,創(chuàng)新性,實用性,科學性,文本(圖紙)規(guī)范程度,存在的不足等進行綜合評價指導人: (簽名)年 月 日 指導人評定成績: 湖 南 科 技 大 學畢業(yè)設計(論文)評閱人評語主要對學生畢業(yè)設計(論文)的文本格式、圖紙規(guī)范程度,工作量,研究內容與方法,實用性與科學性,結論和存在的不足等進行綜合評價評閱人: (簽名)年 月 日 評閱人評定成績: 湖 南 科 技 大 學畢業(yè)設計(論文)答辯記錄日期: 學生: 學號: 班級: 題目: 提交畢業(yè)設計(論文)答辯委員會下列材料:1 設計(論文)說明書共頁2 設計

5、(論文)圖 紙共頁3 指導人、評閱人評語共頁畢業(yè)設計(論文)答辯委員會評語:主要對學生畢業(yè)設計(論文)的研究思路,設計(論文)質量,文本圖紙規(guī)范程度和對設計(論文)的介紹,回答問題情況等進行綜合評價答辯委員會主任: (簽名)委員: (簽名)(簽名)(簽名)(簽名) 答辯成績: 總評成績: 摘 要從ncbi中獲取綿羊主要組織相容性復合體(major histocompatibility complex,mhc)的核苷酸與氨基酸序列,應用生物信息學原理,對綿羊mhc分子疏水區(qū)、跨膜區(qū)、結構功能域和生物活性位點等幾方面生物學特性進行了分析,預測出該基因的二級結構和三級結構,并將綿羊與其它動物的核苷酸

6、和氨基酸序列進行多序列對比,做出分子進化樹。結果表明,綿羊mhc分子有一個疏水區(qū)和跨膜區(qū);該分子有主要組織相容性復合物蛋白免疫球蛋白信號及n-糖基化位點、蛋白質激酶c磷酸化位點等多個生物活性位點。綿羊mhc class的氨基酸序列和核苷酸序列與成都麻羊的同源性最高,分別達66%和73%,其次與亞洲水牛和肩蜂牛的同源性也較高,與大黃魚的同源性最低,分別為25%和51%。關鍵詞:主要組織相容性復合體類;生物信息學;序列分析abstractextract ovis aries from ncbi of nucleotides and major histocompatibility complex

7、class ii amino acid sequence, application bioinformatics principle, on ovis aries mhc class ii molecules succoth watershed and transmembrane area, the structure and function domain and biological activity sites aspects of biology characteristic was analyzed to predict the secondary structure and lev

8、el 3 genetic structure, and the ovis aries and other animals will be more nucleotide sequence of amino acid sequence and contrast, make more sequence phylogenetic tree. results show that, ovis aries mhc class ii molecules have a dredging watershed and transmembrane area, the molecules are major hist

9、ocompatibility complex protein immunoglobulin signal and n - glycosylation sites, protein kinase c phosphorylation sites such multiple bioactive loci sites, ovis aries mhc class ii the sequence of amino acids and nucleotide sequences and the capra hircus is highest homology of 66% and 73%. secondly

10、bubalus bubalis and bos indicus homology of higher, with the lowest, homology of larimichthys crocea for 25% and 51% respectively.keywords: major histocompatibility complex class ii molecules; bioinformatics; sequence analys目 錄第一章 前言11.1 生物信息學簡介11.2 mhc的相關簡介1第二章 材料來源4第三章 分析方法53.1 蛋白質序列的獲取53.1.1 綿羊mh

11、c class基因的核酸和蛋白質序列的獲得53.1.2 同源序列獲得53.2 蛋白質的基本性質分析53.2.1 疏水性分析53.2.2 跨膜區(qū)分析53.2.3 功能結構域分析53.2.4 生物活性位點分析53.3 蛋白質結構預測53.3.1 蛋白質二級結構的預測53.3.2 蛋白質三級結構預測53.4 綿羊mhc class系統(tǒng)進化樹分析5第四章 結果與分析64.1 綿羊mhc class基因的核酸和蛋白質序列64.2 綿羊mhc class蛋白質的疏水性和跨膜區(qū)分析74.2.1綿羊mhc class蛋白質的疏水性分析74.2.2綿羊mhc class蛋白質的跨膜螺旋區(qū)分析84.3 綿羊mhc

12、 class蛋白質的功能結構域分析94.4 綿羊mhc class蛋白質生物活性位點分析114.5 綿羊mhc class蛋白質的二級結構預測124.6 綿羊mhc class蛋白質的三級結構預測144.7 同源序列對比和系統(tǒng)發(fā)生分析15第五章 結論21參考文獻22致謝23-第一章 前 言1.1 生物信息學簡介生物信息學是一門研究生物和生物相關系統(tǒng)中信息內容和信息流向的綜合性系統(tǒng)科學,它綜合運用數(shù)學、計算機科學和生物學的各種工具,來闡明和理解大量數(shù)據(jù)所包含的生物學意義1。它的研究內容包括生物信息的存儲于獲取、序列比對、測序與拼接、基因預測、生物進化與系統(tǒng)發(fā)育分析、蛋白質結構預測、rna結構預測

13、、分子設計與藥物設計、代謝網(wǎng)絡分析、基因芯片、dna計算等。它還是一門以信息知識為基礎的學科,關鍵資源是知識,關鍵技術是信息處理。它為揭示人類及重要動植物種類的基因組信息,繼而進行生物大分子結構模擬和藥物設計,以及天然生物大分子的改造和基于受體結構的藥物分子設計提供依據(jù)。生物信息學不僅對認識生物體和生物信息的起源、遺傳、發(fā)育與進化的本質具有重要意義,而且可為人類疾病的診斷和防治開辟全新的途徑,并為動植物的物種改良提供了堅實的理論基礎。此外通過對影響藥物代謝或效應通路、相關基因編碼序列的再測序,很可能揭示個體對藥物差別的遺傳學基礎2。生物信息學作為生命科學研究所必需的研究工具,在生命科學實踐中越

14、來越顯示出它的重要作用,特別是在實驗設計、結構分析上,離不開生物信息學的指導3。而生物數(shù)據(jù)庫、相關軟件是生物信息學研究與應用的重要資源。在生物信息學軟件中,生物學研究人員用得最多的軟件是搜索工具blast(basic local alignment search tool)1。本文則是對綿羊mhc class ii基因進行了生物信息學分析,也多次使用了blast軟件。1.2 mhc的相關簡介誘導強而迅速排斥反應的抗原稱為主要組織相容性抗原或主要移植抗原, 編碼這種抗原的基因群稱為主要組織相容性復合體(major histocompatibility complex, mhc)。 主要組織相容性

15、復合體是存在于脊椎動物某一染色體上的一群緊密連鎖的基因群,編碼主要組織相容性抗原,調控細胞間相互識別,并與免疫應答和免疫調節(jié)有關,呈高度多態(tài)性4。多態(tài)性是一個群體的概念,指mhc存在多個基因座位,染色體同一基因座有兩種以上的基因型,即可能編碼兩種以上的產物。mhc的高度多態(tài)基因區(qū),這些連鎖的免疫應答基因控制著機體對抗原產生免疫應答的能力。mhc高度多態(tài)性賦於物種極大的應變能力造就了各式各樣對抗原(病原體)入侵反應性和易感性不同的個體.使之能對付多變的環(huán)境條件及各種病原體的侵襲。在免疫應答的t-b、t-t、t-apc細胞的相互作用中,t細胞除識別抗原物質外,還必須同時識別與之作用細胞表面的mhc

16、分子,這一現(xiàn)象稱為mhc限制性。不同的物種,不同種屬動物都有自身的mhc:如人的mhc通常稱hla基因(hunan leukocyte antigen,hla)或hla基因復合體, 稱其產物為hla分子或hla抗原;稱小鼠mhc為h-2;稱黑猩猩為chla;稱狗為dla;稱豬為sla;稱牛為bola。根據(jù)主要組織相容性抗原分子結構、分布和功能不同分為、類分子。按所含基因的功能不同,一般可將mhc區(qū)域分為class區(qū)、class區(qū)和class區(qū)。其編碼基因也相應地分成三類。類和類分子是結構相似的細胞膜表面糖蛋白,除作為移植抗原外,還與抗原遞呈及某些疾病相關。類分子包括c2、c4、b因子和腫瘤壞死

17、因子等多種可溶性蛋白質。mhc類分子:所有有核細胞及血小板、網(wǎng)織紅細胞。圖1.1 mhc分子結構圖mhc-類分子是異源二聚體,它的分子的兩條鏈均由mhc-類分子基因編碼,由鏈和鏈以非共價鍵結合的多肽鏈構成(如圖1.1所示),其中鏈分子量為3234kda,有兩個n連接寡糖;鏈為2730kda,有一個n連接寡糖。兩條鏈在整個結構上彼此相似,由于糖基化作用,鏈比鏈略大,鏈、鏈胞膜外區(qū)各有兩個結構域1、2及1、2,每個結構域約含90個氨基酸殘基。鏈和鏈均是跨膜蛋白,c端為胞漿區(qū)。除1結構域外,2、1和2每個結構域均含一個二硫鍵。胞膜外區(qū)(跨膜區(qū)和胞漿區(qū))按功能進一步分為肽結合區(qū)和免疫球蛋白樣區(qū)。mhc

18、-類分子的兩條鏈均由不同的mhc基因編碼,呈多態(tài)性。肽結合區(qū)mhc-類分子的1、1結構域與免疫球蛋白樣區(qū)結構域無相似性,是類分子結合抗原肽部位和高度多態(tài)性所在。每個結構域都是有4條折疊和1個螺旋組成,1和1結構域的片層共同形成肽結合溝槽的底部,1和1結構域的螺旋共同形成肽結合溝槽的側壁。2和2結構域屬于免疫球蛋白超家族c1型結構,具非多態(tài)性,2和2結構域是mhc-類分子的非多態(tài)部分,也是與cd4分子相互作用的位點。2和2結構域c端側各有一個短的連接區(qū),分別連接2、2結構域與跨膜區(qū)。跨膜區(qū)約含25個氨基酸殘基,形成螺旋將鏈和鏈固定在細胞膜上。胞漿區(qū)很短,有2530個氨基酸殘基,可能與信號轉導有關

19、5。在mhc基因內,第一外顯子編碼先導順序或信號順序,它將新生蛋白帶向內質網(wǎng)。每個約由90個氨基酸組成的細胞外區(qū)殘基各有一個大外顯子跨膜區(qū)和胞漿區(qū)由幾個小外顯子編碼。控制mhc基因轉錄的許多順式調節(jié)順序位于編碼mhc分子外顯子閱讀框架的5端,這些核苷酸順序是dna-結合蛋白的分子靶位,這些dna-結合蛋白事反式轉錄調節(jié)因子。mhc基因轉錄調節(jié)的一般原則與免疫球蛋白基因相似。mhc類基因啟動子序列位于基因編碼區(qū)5端上游,轉錄起始點上游200bp范圍內。mhc類基因進側基因啟動子部分存在多態(tài)性,表現(xiàn)為順式作用元件dq,dp的多基因家族,是類分子多樣性的分子基礎,在免疫應答中起關鍵作用5。本文是對綿

20、羊mhc class分子進行生物信息學分析,應用生物信息學方法找出綿羊mhc class的核酸和蛋白質序列,對綿羊mhc class分子疏水區(qū)、跨膜區(qū)、結構功能域和生物活性位點等幾方面生物學特性進行了分析,預測出該基因的二級結構和三級結構,并將綿羊與其它動物的核苷酸和氨基酸序列進行多序列對比和系統(tǒng)分子進化樹分析,對綿羊mhc class的研究做一下基礎性工作。第二章 材料來源綿羊mhc class基因及其同源的其它物種的核酸和氨基酸序列編碼(表2.1)。 表2.1 不同物種mhc class基因的核酸和蛋白質序列種類(species)蛋白質編號(protein id)核酸編號(nucleoti

21、de id)綿羊np-001116870nm-001123398褐家鼠cad86939aj554216原雞aar14674ay357254小家鼠np-034508nm-010378非洲爪蟾蜍np-001079971nm-001086502家貓ack99138eu915361家馬xp-001493225xm-001493175野驢abm92287ef204945歐洲兔np-001164589nm-001171118歐洲野兔acn39186fj225345大熊貓xp-002914414xm-002914368鷦鷯aan87894ay169005成都麻羊aar97716aar97716亞洲水牛aay

22、40169dq016629肩峰牛cax17688fm986339大猩猩aau87999ay663403紅毛猩猩acl00582eu877227野豬aba42968dq159895大西洋鯡cam34665am492999三文魚cad27719aj438965大黃魚abv48907ef681863人np-002113nm-002122家犬cah61722aj630362第三章 分析方法3.1 蛋白質序列的獲得3.1.1 綿羊mhc class基因的核酸和蛋白質序列的獲得 在ncbi數(shù)據(jù)庫上搜索綿羊mhc class基因的核酸和蛋白質序列。3.1.2 同源序列獲得 利用ncbi上的blast程序對比

23、直接獲取與綿羊mhc class基因同源的核酸和蛋白質序列。3.2 蛋白質的基本性質分析3.2.1 疏水性分析 用位于expasyde的protscale6(/cgi-bin/protscale.pl) 程序對其進行疏水性分析。3.2.2 跨膜區(qū)分析 聯(lián)網(wǎng)至(http:/www.genome.cbs.dut.dk/services/tmhmm-2.0)使用服務器tmhmm-2.07 或聯(lián)網(wǎng)至(/software/tmpred_form.html)進行跨膜區(qū)分析。3.2.3 功能結構域分析 聯(lián)網(wǎng)至(http:/

24、www.ebi.ac.uk/interpro/index.html)用ebi開發(fā)的interproscan7進行分析。3.2.4 生物活性位點分析 利用位于expasy的prosite6(/prosite/)對綿羊mhc class蛋白質進行活性位點分析。3.3 蛋白質結構預測3.3.1 蛋白質二級結構的預測 聯(lián)網(wǎng)至(http:/www. p/)用phd8對綿羊mhc class進行分析或聯(lián)網(wǎng)至psipred8的網(wǎng)址(http:/bioinf.cs.ucl.ac.uk/psipred)。3.3.2 蛋白質三級結構的預測

25、利用位于swiss-model5的automated mode服務器返回到郵件的結果,觀察蛋白質的三級結構。3.4 綿羊mhc class系統(tǒng)進化樹分析聯(lián)網(wǎng)至(http:/www.ebi.ac.uk/clustalw/)6對所獲得的同源蛋白質序列進行比對分析并構建系統(tǒng)進化樹。第四章 結果與分析4.1 綿羊mhc class基因的核酸和蛋白質序列在ncbi上獲取綿羊的蛋白質序列(序列號:np-001116870): 1 mkkalilral alaammslcg gedivadhvg tygtnvyqty gasgqftfef dgde

26、lfyvdl 61 rkketvwrlp efnnitmfei qsalrnivms krnldilmkn snftpatndi pevavfpkss 121 vilgipntli cqvdnifppv initwfyngq fvaegvaett fypksdhsfl kfsyltfvpa 181 sedfydcrve hwgleeplvk hwepkiptpt seltetvvca lglpmg

27、lmgi vvgtvlilrv 241 rcsgaasrrr ramshglkdg kerkvfisvf aaasgaqdhq phaawcfr  該蛋白質序列由288個氨基酸殘基組成。在ncbi上獲取綿羊的核酸序列(序列號:nm-001123398): 1 catgggctgc tccaacatga tttctccagc agttctcttt agaccacctt cctggtgagg 61 caccacttgg 

28、aacagccact cctgaggaaa cccttggagg aggaggagga tgaagaaagc 121 tctgattctg agggctctcg ctctggccgc catgatgagc ctgtgtggag gtgaagacat 181 cgtggcggac cacgtgggca cttacggcac aaatgtctac cagacgtacg gcgcctctgg 241 c

29、cagttcacg tttgaatttg atggagacga gctcttctac gtggacctga ggaaaaaaga 301 gactgtctgg aggctgcccg agtttaacaa tatcaccatg tttgaaattc agagtgccct 361 gagaaacatt gttatgtcaa aaagaaattt ggacatcttg atgaaaaatt ccaactttac&

30、#160;421 acctgccacc aatgacatcc ctgaagtggc tgtgtttccc aaatcctccg tgatcctggg 481 gattcccaac accctcatct gtcaggtgga caacatcttt cctcctgtga tcaacatcac 541 ttggttttac aatggacagt ttgttgcaga aggtgtcgct gagaccacct&#

31、160;tctaccccaa 601 gagtgaccac tccttcctca agttcagtta cctcaccttt gttcccgcca gtgaagactt 661 ctatgactgc agagtggagc actggggcct ggaagagccc ctcgtcaagc actgggagcc 721 caagattcca acccctacat cagagctgac agagactgtg

32、60;gtctgtgccc tggggctgcc 781 catgggcctc atgggcatcg tggtgggcac tgtcctcatc ctccgagtcc ggtgctcagg 841 tgctgcctcc agacgtcgaa gggccatgag tcatggcctg aaagatggga aggagaggaa 901 agtcttcatt tctgttttcg ctgcagcatc

33、0;gggagcacag gaccatcagc ctcatgctgc 961 ctggtgtttc aggtgatcag tctttacaag aaaagaaagg catggttcag gctccagttc 1021 cccatcttga ccttgactga gacgtgctcc ttggtccatt tcatcacaga gctccttcca 1081 cgccctcctg ctctccctgc

34、60;tggggcagac tttatggagg aattttcctt cgaagatcac 1141 tgaccctcac gaattctccc aacttagtct ttgattcatt gcctacctgt cacagagacc 1201 tggattgttc cacc      該核酸序列由1214個堿基組成。4.2 綿羊mhc class蛋白質的疏水性和跨膜區(qū)分析4.2.1 綿羊mhc class蛋白質的疏

35、水性分析疏水性是每個氨基酸所固有的特性,即每個氨基酸遠離周圍水分子,將自己包埋進蛋白質核心的相對趨勢。疏水性氨基酸在蛋白質內部,由于其疏水性的相互作用,在保持蛋白質三級結構的形成和穩(wěn)定中起著重要作用。疏水性預測的方法依賴于疏水性的衡量尺度,每個氨基酸根據(jù)其一系列的物理特性(例如溶解性、跨越水-汽相時產生的自由能等),被賦予一個數(shù)值以代表其疏水性。組成蛋白質的20種氨基酸各自帶有不同極性的側鏈基團,氨基酸側鏈的疏水性,用從各氨基酸的疏水性減去甘氨酸疏水性之值來表示。具有較高正值的氨基酸具有較強的疏水性;而具有較低負值的氨基酸則具有較強的輕水性6。利用位于expasy的protscale進行疏水性

36、分析,當window size設置為9時,當氨基酸殘基的疏水性值大于2.34時,為明顯的疏水區(qū)。單個氨基酸疏水性值:ala: 1.800 arg: -4.500 asn: -3.500 asp: -3.500 cys: 2.500 gln: -3.500 glu: -3.500 gly: -0.400 his: -3.200 ile: 4.500 leu: 3.800 lys: -3.900 met: 1.900 phe: 2.800 pro: -1.600 ser: -0.800 thr: -0.700 trp: -0.900 tyr: -1.300 val: 4.200 : -3.500

37、: -3.500 : -0.490 min: -2.244max: 3.122圖4.1 用protscale對綿羊mhc class蛋白質進行疏水性分析結果從上圖返回的結果我們得知在第234位氨基酸處有最大值3.122,在第258位氨基酸處有最小值-2.244,在第位231至236位氨基酸的值分別為2.503,2.829,2.941,3.122,2.912,2.601這一區(qū)段氨基酸疏水性值大于2.34,所以我們得出結論:該蛋白質序列在位于231236位殘基之間具有明顯的疏水性,從而說明該序列有一個疏水區(qū)。4.2.2 綿羊mhc class蛋白質的跨膜螺旋區(qū)分析膜蛋白是一類結構獨特的蛋白質,執(zhí)行

38、著重要的細胞生物學功能。蛋白質序列含有跨膜區(qū),提示它可能作為膜受體起作用,也可能是定位在膜上的錨定蛋白或離子通道蛋白,所以含有跨膜區(qū)蛋白往往和細胞的功能狀態(tài)密切相關,對膜蛋白的跨膜螺旋進行預測是生物信息學的重要應用9。通常使用單一的預測軟件分析的準確性都不太高,綜合不同的軟件預測結果并結合疏水性圖,可獲得較好的預測結果。使用兩種在線網(wǎng)絡工具分析結果分別是:(1)利用tmhmm軟件分析結果如下:# sequence length: 288# sequence number of predicted tmhs: 1# sequence exp number of aas in tmhs: 21.8

39、3121# sequence exp number, first 60 aas: 0.52936# sequence total prob of n-in: 0.06765sequencetmhmm2.0outside 1 217sequencetmhmm2.0tmhelix 218 240sequencetmhmm2.0inside 241 288圖4.2 用tmhmm對綿羊mhc class蛋白質的跨膜區(qū)分析結果根據(jù)以上數(shù)據(jù)和圖表顯示我們可以得出這樣的結論:在位于位于218240位氨基酸之間存在一個跨膜區(qū)。(2)利用tmpred軟件分析結果如下:possible models consid

40、ered, only significant tm-segments used-> strongly prefered model: n-terminus outside 3 strong transmembrane helices, total score : 3329 # from to length score orientation 1 4 25 (22) 742 o-i 2 121 143 (23) 542 i-o 3 217 240 (24) 2045 o-i-> alternative model 3 strong transmembrane helices, tot

41、al score : 2867 # from to length score orientation 1 6 24 (19) 899 i-o 2 114 133 (20) 505 o-i3 216 238 (23) 1463 i-o 圖4.3 用tmpred對綿羊mhc class蛋白質的跨膜區(qū)分析結果由分析結果和圖像顯示,可得出這樣的結論:綿羊mhc class蛋白質的跨膜區(qū)有兩種可能,它有三個明顯的跨膜區(qū)。一種可能為它的跨膜區(qū)一個位于 425 位氨基酸之間,一個位于121143位氨基酸之間,另一個位于217240位氨基酸之間。另一種可能為它的跨膜區(qū)一個位于624位氨基酸之間,一個位于114

42、133位氨基酸之間,另一個位于216238位氨基酸之間。總體來看,tmpred軟件預測出三個跨膜區(qū),tmhmm預測出一個跨膜區(qū),顯然,對于同一蛋白,兩種不同的的方法給出了不同的預測結果,但部分預測結果大致相同。然而在多數(shù)情況下,tmpred的預測結果比實際情況會稍微長一些或偏一些,基于綜上考慮,認為該蛋白僅存在一個跨膜區(qū),位于218240位氨基酸殘基之間,這與疏水性的分析也基本吻合。4.3 綿羊mhc class蛋白質的功能結構域分析結構域(structuraldomain)是生物大分子中具有特異結構和獨立功能的區(qū)域,特別指蛋白質中這樣的區(qū)域,是介于二級和三級結構之間的另一種結構層次。所謂結構

43、域是指蛋白質亞基結構中明顯分開的緊密球狀結構區(qū)域,又稱為轄區(qū)。在球形蛋白中,結構域具有自己特定的四級結構,其功能部依賴于蛋白質分子中的其余部分,但是同一種蛋白質中不同結構域間常可通過不具二級結構的短序列連接起來。蛋白質分子中不同的結構域常由基因的不同外顯子所編碼。有些球形蛋白的一條肽鏈,或以共價鍵相連的兩條或多條肽鏈在空間結構上可以區(qū)分為若干個球狀的子結構,其中的每一個球狀子結構就被稱為一個結構域。圖4.4 用interproscan對綿羊mhc class蛋白質的功能結構域分析結合prosite數(shù)據(jù)庫分析: hits by profiles: 1 hit (by 1 profile) on

44、1 sequencehits by ps50835   ig_like   ig-like domain profile :userseq1    (288 aa)111 - 191:score = 11.134pevavfp-kssvilgipntlicqvdnifppvinitwfyng-qfvaegvaettfypksdhsflkfsyltfvpasedfydcrveh-predicted feature:disulfid131187by similaritycondition: c-x*-chits by

45、patterns: 1 hit (by 1 pattern) on 1 sequencehits by ps00290   ig_mhc   immunoglobulins and major histocompatibility complex proteins signature :userseq1    (288 aa)185 - 191:  ydcrveh 圖4.5 用prosit對綿羊mhc class蛋白質的功能結構域分析通過兩種不同的數(shù)據(jù)庫發(fā)現(xiàn)該蛋白質存在主要組織相容性復合物蛋白免

46、疫球蛋白信號、免疫球蛋白c1位點、免疫球蛋白樣結構域、主要組織相容性復合體類樣識別抗原、主要組織相容性復合體類樣識別抗原蛋白、免疫球蛋白樣折疊以及未整合區(qū)段。通過prosite數(shù)據(jù)庫我們發(fā)現(xiàn)在111191位氨基酸之間存在一個免疫球蛋白樣結構域,其期望值是11.134。其中131187位氨基酸之間存在二硫化物,起著重要的生理作用。在185191位氨基酸之間存在一個主要組織相容性復合物蛋白免疫球蛋白信號。在interproscan數(shù)據(jù)庫中發(fā)現(xiàn)于126197位氨基酸段為免疫球蛋白c1位點,27104 位氨基酸段為主要組織相容性復合體類樣識別抗原,105221位氨基酸段為免疫球蛋白樣折疊。4.4 綿羊

47、mhc class蛋白質生物活性位點分析pattern-id: asn_glycosylation ps00001 pdoc00001pattern-de: n-glycosylation sitepattern: npstp 74 nitm 142 nitwpattern-id: camp_phospho_site ps00004 pdoc00004pattern-de: camp- and cgmp-dependent protein kinase phosphorylation sitepattern: rk2.st 62 kketpattern-id: pkc_phospho_site

48、 ps00005 pdoc00005pattern-de: protein kinase c phosphorylation sitepattern: st.rk 90 skr 247 srrpattern-id: ck2_phospho_site ps00006 pdoc00006pattern-de: casein kinase ii phosphorylation sitepattern: st.2de 76 tmfepattern-id: myristyl ps00008 pdoc00008pattern-de: n-myristoylation sitepattern: gedrkh

49、pfyw.2stagcnp 30 gtygtn 124 gipntl 149 gqfvae 155 gvaett 222 glpmgl 229 givvgt 256 glkdgkpattern-id: ig_mhc ps00290 pdoc00262pattern-de: immunoglobulins and major histocompatibility complex proteins signaturepattern: fylcpgadvalch185 ydcrveh結果表明,該蛋白質序列含有:2個n-糖基化位點,位于7477和142145位氨基酸段;1個a激酶位點,位于6265為氨

50、基酸段;2個蛋白質激酶c磷酸化位點,分別位于9092和247249位氨基酸段;1個酪蛋白激酶ii磷酸化位點,分別位于7679位氨基酸段;7個n-肉豆蔻酰化作用位點,分別位于3035、124129、149154、155160、222227、229234、256261位氨基酸段;1個主要組織相容性復合物蛋白免疫球蛋白信號,位于185191位氨基酸段。4.5 綿羊mhc class蛋白質的二級結構預測蛋白質的二級結構預測是聯(lián)系其一級結構和三級結構的橋梁和紐帶,并為蛋白質三級結構和功能提供了大量信息,有助于蛋白質突變體的設計,有助于確定蛋白質空間結構與功能。用phd預測蛋白質的二級結構,如圖4.6。在

51、該蛋白質序列中,螺旋結構(h)占總序列的18.06% ,折疊結構(e)占總序列的28.47% ,卷曲結構(l)占總序列的53.47%。由此可見該蛋白質卷曲程度較高。表4.1 蛋白質二級結構預測組成結構類型 螺旋(h) 折疊(e) 卷曲(l)所占比列(%) 18.06 28.47 53.47用phd方法預測如下:圖4.6 蛋白質二級結構預測的prof結果圖中縮詞說明:aa:氨基酸序列obs _sec:觀察到的二級結構(h=螺旋,e=折疊,l=環(huán)) prof _sec: prof預測的二級結構rel _sec: prof的可靠性(0=低,9=高)sub _sec: prof預測的結果(“.”意味著

52、對應殘基未給出預測結果,因為其可靠性低于5%)o_3 _acc:所觀察到的具有相對溶解性的兩種情況:b=0-9% ,i=9-36% ,e=36-100%p_3 _acc: prof預測相對溶解性的三種情況:b=0-9%,i=9-36%,e=36-100%rel _acc:prof預測的可靠性(0=低,9=高)sub _acc: prof預測的子集,所有殘基期望的平均相關性>0.694.6 綿羊mhc class蛋白質的三級結構預測利用swiss-model對綿羊mhc class蛋白質的模建結果如下:    model information: &

53、#160;   modelled residue range: 23 to 202     based on template: 1es0a (2.60 Å)     sequence identity %:67.222     evalue:5.45e-72 圖4.7 模建質量評價分析圖4.8 模建的蛋白質三級結構圖(swiss-model)由以上分析結果和圖像可得出:綿羊mhc class ii蛋白質三級結構是基于1es0的a鏈模建的,兩者序列一致性達到67.222%。該模建的蛋白質三級結構是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論