




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、中國地方雞種核酸數(shù)據(jù)庫建設(shè)與功能設(shè)計(jì)匯報(bào)人:白云峰 副研究員 單 位:江蘇省農(nóng)業(yè)科學(xué)院匯 報(bào) 內(nèi) 容研究意義與目的中國地方雞種核酸序列數(shù)據(jù)庫初步建設(shè)數(shù)據(jù)獲取數(shù)據(jù)庫構(gòu)成數(shù)據(jù)分析系統(tǒng)功能設(shè)計(jì)核酸序列特征一般分析核酸序列相似性搜索系統(tǒng)發(fā)生分析系統(tǒng)演示未來展望研 究 意 義中國是世界上生物多樣性最豐富國家之一,地方雞種是我國具有戰(zhàn)略意義的獨(dú)特資源。亟需構(gòu)建該領(lǐng)域擁有自身特色和自主知識產(chǎn)權(quán)的,與國際主流生物信息數(shù)據(jù)庫接軌的專業(yè)二級數(shù)據(jù)庫。當(dāng)前,農(nóng)業(yè)生物信息數(shù)據(jù)庫主要集中在英、美、日等發(fā)達(dá)國家。我國大多生物學(xué)數(shù)據(jù)庫只能提供鏡像和索引服務(wù),無自主知識產(chǎn)權(quán),獨(dú)立開發(fā)并能提供豐富資源和工具的生物信息數(shù)據(jù)庫平臺(tái)仍
2、很缺乏。目前國內(nèi)關(guān)于醫(yī)療和制藥領(lǐng)域的生物信息數(shù)據(jù)庫較多,而高質(zhì)量的農(nóng)業(yè)生物信息數(shù)據(jù)庫數(shù)量較少,尚無我國專門化的地方雞種生物信息數(shù)據(jù)庫系統(tǒng)。生物信息數(shù)據(jù)庫分布分散且格式不統(tǒng)一,將獨(dú)立的、分散的農(nóng)業(yè)生物信息數(shù)據(jù)庫信息整合,使農(nóng)業(yè)生物信息數(shù)據(jù)庫集成化和標(biāo)準(zhǔn)化。中國地方雞種核酸序列數(shù)據(jù)庫初步建設(shè)數(shù)據(jù)獲取方面基于Agent智能代理本地化數(shù)據(jù)獲取程序;863合作單位數(shù)據(jù)提供與數(shù)據(jù)校驗(yàn);數(shù)據(jù)分析數(shù)據(jù)完整性分析數(shù)據(jù)特征特征值掃描地方雞種數(shù)據(jù)篩選系 統(tǒng) 功 能 設(shè) 計(jì)目標(biāo)序列分析(以白銀耳雞1條序列AF128321作為本系統(tǒng)分析處理結(jié)果示例)功能設(shè)計(jì)3個(gè)層次:序列組成統(tǒng)計(jì)特征分析;本地化序列相似性搜索系統(tǒng)發(fā)生分
3、析核酸序列組成統(tǒng)計(jì)特征分析密碼子計(jì)數(shù)核苷酸統(tǒng)計(jì)轉(zhuǎn)換成互補(bǔ)序列互補(bǔ)統(tǒng)計(jì)核苷酸組成統(tǒng)計(jì)作圖二聚體統(tǒng)計(jì)密碼子使用偏性CpG島短序列匹配繪制熱紅外分布圖識別開發(fā)閱讀框ORFs翻譯成對應(yīng)氨基酸序列密碼子計(jì)數(shù)結(jié)果AAA: 1 AAC: 5 AAG: 0 AAT: 2 ACA: 7 ACC: 3 ACG: 1 ACT: 6 AGA: 2 AGC: 1 AGG: 1 AGT: 2 ATA: 4 ATC: 2 ATG: 4 ATT: 5 CAA: 1 CAC: 5 CAG: 0 CAT: 8 CCA: 8 CCC: 10 CCG: 1 CCT: 1 CGA: 1 CGC: 1 CGG: 0 CGT: 1 CTA
4、: 10 CTC: 2 CTG: 1 CTT: 2 GAA: 0 GAC: 0 GAG: 1 GAT: 1 GCA: 1 GCC: 3 GCG: 0 GCT: 2 GGA: 2 GGC: 1 GGG: 3 GGT: 2 GTA: 6 GTC: 2 GTG: 0 GTT: 2 TAA: 5 TAC: 4 TAG: 1 TAT: 9 TCA: 5 TCC: 3 TCG: 2 TCT: 6 TGA: 3 TGC: 2 TGG: 1 TGT: 2 TTA: 3 TTC: 4 TTG: 1 TTT: 4密碼子使用偏性由于密碼子的簡并性,每個(gè)氨基酸至少對應(yīng)1種密碼子,最多有6種對應(yīng)的密碼子。不同物種、不同
5、生物體的基因密碼子使用存在著很大的差異。各種生物體似乎更偏愛使用某些同義三聯(lián)密碼子(即編碼相同氨基酸的密碼子)。高表達(dá)的基因密碼子的使用偏性一般比較大。這些偏好可能與兩個(gè)原因有關(guān):一是避免使用類似終止密碼子的密碼子;二是這些偏好能夠有效地翻譯密碼子,因?yàn)檫@些密碼子對應(yīng)于生物體中非常豐富的tRNA。真實(shí)的外顯子一般能反映出這些偏好,而隨機(jī)選擇的三聯(lián)體序列卻不能。密碼子使用偏性研究結(jié)果表明,基因密碼子的使用也與基因編碼的蛋白的結(jié)構(gòu)和功能有關(guān)。mRNA中的稀有密碼子的使用與蛋白質(zhì)結(jié)構(gòu)域的連接區(qū)和規(guī)則二級結(jié)構(gòu)單元的連接區(qū)有關(guān),翻譯速率在連接區(qū)會(huì)降低,說明蛋白質(zhì)折疊方式與mRNA序列之間存在一定的相關(guān)性
6、。研究結(jié)果還表明,蛋白質(zhì)的三級結(jié)構(gòu)與密碼子使用概率有密切的關(guān)系,通過對密碼子的聚類分析,可以將具有不同三級結(jié)構(gòu)蛋白質(zhì)的編碼基因分成不同的類,而具有相似三級結(jié)構(gòu)蛋白的編碼基因則大致聚在同一類中。進(jìn)一步的研究發(fā)現(xiàn),在不同物種中,類型相同的基因具有相近的同義密碼子使用偏性,對于同一類型的基因由物種引起的同義密碼子使用偏性的差異較小。繪制熱紅外分布圖CpG島分析在人類基因組中有一半左右的CpG island 與已知管家基因(housekeeping gene)有關(guān)聯(lián);CpG island很少出現(xiàn)在不含基因的區(qū)域和那些發(fā)生多次突變的基因中;CpG與一種重要的化學(xué)修飾甲基化密切相關(guān)。短序列匹配在待分析序列
7、中查找特征短片段,如TATA BoxTATA Box,CAAT Box,終止子等中國地方雞種基因序列比對與相似性搜索意義與目的:通過搜索序列數(shù)據(jù)庫,找到與新序列同源的已知序列,并根據(jù)同源性推測未知序列的生物學(xué)功能;對于DNA序列,同源搜索還有助于確定編碼區(qū)域,確定基因;實(shí)現(xiàn)方法:中國地方雞種核酸序列庫+家禽基因組序列庫的比對搜索;設(shè)定全局最優(yōu)比對算法+局部最優(yōu)比對算法2種策略Smith-WatermanNeedleman-Wunsch中國地方雞種系統(tǒng)發(fā)生分析(開發(fā)中)由于國內(nèi)學(xué)者對國內(nèi)地方雞種mtDNA研究較多,數(shù)據(jù)庫收集到數(shù)據(jù)較豐富特點(diǎn)。構(gòu)建地方雞種mtDNA系統(tǒng)發(fā)生專門化分析組件。線粒體D
8、NA非常適合于系統(tǒng)發(fā)生分析,因?yàn)榫€粒體DNA從母體完全傳到子代,不與父代DNA重組。線粒體DNA具有易分離、進(jìn)化速度快、母系遺傳、缺乏重組和無內(nèi)含子等特點(diǎn)。使線粒體DNA成為分子系統(tǒng)發(fā)育學(xué)研究的一類重要的分子標(biāo)記。mtDNA的控制區(qū)即D-loop區(qū)為非編碼區(qū),不編碼蛋白質(zhì)線粒體DNA中,受到選擇壓力較小,因此積累了較多的突變,如堿基替換、插入、缺失,以及眾多的串聯(lián)重復(fù)序列等。系統(tǒng)采用非加權(quán)分組平均法(UPGMA,unweighted pair group method with arithmetic means)構(gòu)建進(jìn)化樹M文件編程示例function HeatMap(mitochondria
9、)for frame = 1:3 figure(color,1 1 1) subplot(2,1,1); codoncount(mitochondria,frame,frame,figure,true); title(sprintf(閱讀框%d密碼子,frame); subplot(2,1,2); codoncount(mitochondria,reverse,true,frame,frame,figure,true); title(sprintf(閱讀框%d反義密碼子, frame);end調(diào)用MATLAB生物信息學(xué)函數(shù)設(shè)計(jì)功能函數(shù)示例從GenBank獲取1條序列密碼子計(jì)數(shù)codoncoun
10、tcodoncount(mitochondria)核苷酸統(tǒng)計(jì)basecountbasecount(mitochondria)轉(zhuǎn)換成互補(bǔ)序列seqrcomplementseqrcomplement(mitochondria)互補(bǔ)統(tǒng)計(jì)basecount(seqrcomplement(mitochondria)統(tǒng)計(jì)作圖ntdensityMap = ntdensity(mitochondria)二聚體統(tǒng)計(jì)dimercountdimercount(mitochondria)核苷酸統(tǒng)計(jì)2aacountAacount(mitochondria)密碼子使用偏性codonbiascb = codonbias(m
11、itochondria,PIE,true)CpG島cpgislandcpgisland(mitochondria,PLOT,true)短序列匹配seqshowwordsseqshowwords(mitochondria,TATA)Matlab與.NET數(shù)據(jù)類型轉(zhuǎn)換Matlab類型.NET類型數(shù)據(jù)轉(zhuǎn)換類說明CellN/AMWCellArray單元和結(jié)構(gòu)數(shù)組沒有對應(yīng)的.NET類型StructureN/AMWstructArrayCharSystem.StringMWCharArrayDoubleSystem.DoubleMWNumericArray默認(rèn)為Double類型SingleMWNumeri
12、cArrayUint64MWNumericArray不支持Uint32MWNumericArray不支持Uint6MWNumericArray不支持引自蘇金明等Matlab高級編程北京,電子工業(yè)出版社,2008數(shù)據(jù)類型轉(zhuǎn)換實(shí)例 %利用MatLab構(gòu)建不同地方雞種親緣關(guān)系進(jìn)化樹;%定義數(shù)組二維data,存儲(chǔ)雞種名稱和mtDNA序列;function phylogenyanalysis(data,m)%data = 白銀耳雞 AF128320; 靈昆雞 AF128330; 壽光雞 AF512058; 絲羽烏骨雞 AF512060; 茶花雞 AF512078;%for ind = 1:5% seqs
13、(ind).Header = dataind,1;% seqs(ind).Sequence = getgenbank(dataind,2, sequenceonly, true);%end%進(jìn)化距離運(yùn)算;UPGMA,非加權(quán)分組平均法(unweighted pair group method with arithmetic means)Jukes-Cantor,for ind = 1:m seqs(ind).Header = dataind,1; seqs(ind).Sequence = dataind,2;enddistances = seqpdist(seqs,Method,Jukes-Cantor,Alphabet,DNA);tree = seqlinkage(distances,UPGMA,seqs); %畫出進(jìn)化樹;h = plot(tree,orient,bottom);set(findobj(gca,Type,line,Color,0 10 1),Color,red,LineWidth,2);ylabel(進(jìn)化距離)tit
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年視覺傳播設(shè)計(jì)知識考察試題及答案
- 現(xiàn)場檢驗(yàn)員試題及答案
- 宜興小語面試題及答案
- 商業(yè)分析師考試成果展示試題與答案
- 2024秋三年級英語上冊 Module 2 Introductions Unit 2 What's your name教學(xué)設(shè)計(jì) 外研版(三起)
- 初中物理中的熱平衡現(xiàn)象試題及答案
- 行政強(qiáng)制法考試題及答案
- 小自考漢語言文學(xué)趣味知識與試題及答案
- 26西門豹治鄴教學(xué)設(shè)計(jì)-2024-2025學(xué)年四年級上冊語文統(tǒng)編版
- 收納師職業(yè)發(fā)展趨勢分析試題及答案
- 統(tǒng)編版高中語文教材的“三種文化”內(nèi)容及價(jià)值實(shí)現(xiàn)
- 杜仲葉培訓(xùn)課件
- 【太陽能干燥箱設(shè)計(jì)15000字(論文)】
- 12D401-3 爆炸危險(xiǎn)環(huán)境電氣線路和電氣設(shè)備安裝
- DL∕ T 1129-2009 直流換流站二次電氣設(shè)備交接試驗(yàn)規(guī)程
- 2024江蘇無錫市濱湖區(qū)招聘專職網(wǎng)格員禁毒社工28人筆試歷年典型考題及考點(diǎn)剖析附答案帶詳解
- JGJ120-2012 建筑基坑支護(hù)技術(shù)規(guī)程
- DL-T+5220-2021-10kV及以下架空配電線路設(shè)計(jì)規(guī)范
- 第二單元 梨園風(fēng)采-兒行千里母擔(dān)憂 教案 2023-2024學(xué)年人教版初中音樂八年級下冊教案1000字
- 天然氣長輸管道HSE管理措施
- 2023年6月上海高考英語卷試題真題答案解析(含作文范文+聽力原文)
評論
0/150
提交評論