版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
作物分子身份證構建軟件idanalysis的設計與實現(xiàn)
0總結【研究意義】黑龍江省是中國的主要大豆產區(qū)。1986年至2010年,共試驗了275個大豆品種。1材料和方法1.1數據收集參試材料于2008年播種于黑龍江省農墾科研育種中心基地,選擇40對引物對40個大豆品種進行分析,參考陳慶山等1.2分子標記多態(tài)度其中,行對應的是n個材料,列對應的是m個標記,其中,a定義S定義V標記多態(tài)度:在分子標記中,單標記或標記組合的全部類型,叫作標記多態(tài)型,標記多態(tài)型的個數,叫作標記多態(tài)度,用d表示。1.3相鄰標記區(qū)分度相關系數計算作物分子身份證理論及逐步擴增法的算法由組陳慶山逐步擴增法的具體過程(圖1):首先標記按照等位基因多少進行排序,計算相鄰標記區(qū)分度相關系數,淘汰相關系數過高的引物。然后選擇V在實際的執(zhí)行過程中,為了降低運算量,每引入一個標記,都要計算各材料對應標記組合的等位基因頻率,若頻率為1,則對該材料從計算數組中剔除,加快了計算速度。1.4作物種質資源分子身份證編碼作物分子身份證是針對作物種質資源或品種品系,基于作物分子標記的多態(tài)性檢測手段,利用最簡引物組合實現(xiàn)作物種質資源最大區(qū)分,并以類似于身份證的等位基因編碼,作為標識和圖形化的理論和技術?;诜肿由矸葑C的概念和構建算法,結合實際應用的需要,建立分子身份證的實現(xiàn)策略。策略共分4個部分:全庫構建、部分構建、選擇分析和分子身份證判定(ID判定)。1.4.1分子身份證的構建全庫構建是分子身份證構建的基礎,是基于數據庫中的全部材料和標記信息,應用1.2、1.3算法,對全部材料進行分子身份證構建的策略。全庫構建的基本步驟如下:步驟1:不符合標記的剔除。剔除標準首先標記的缺失太多(默認不超過5%)其次是標記間相似系數太高(默認不高于0.8);步驟2:有效標記數量判別。若標記充足則轉入步驟3,否則轉入步驟4;步驟3:執(zhí)行算法,計算出材料(品種)分子身份證,包括標出特異性條帶;步驟4:以標記集能區(qū)分的材料數最多為依據,計算出材料的分子身份證。1.4.2分子身份證的計算在全庫構建的基礎上,可選擇性地對部分材料進行特異性引物條帶的篩選和分子身份證的構建。部分構建以全庫構建的材料、標記集為構建背景,選擇部分材料以全部引物為標記利用算法進行分子身份證計算。部分構建的基本步驟如下:步驟1:從全部材料中選擇部分材料集;步驟2:不符合標記的剔除。剔除標準首先標記的缺失太多(默認不超過5%)其次是標記間相似系數太高(默認不高于0.8);步驟3:執(zhí)行算法,計算出部分材料分子身份證,包括標出特異性條帶;步驟4:以標記集能區(qū)分的材料數最多為依據,計算出部分材料的分子身份證。1.4.3分子身份證編碼后部分標記方法在全庫構建的基礎上,可選擇部分標記對材料進行判別,主要用來考察部分標記(受關注的)在分子多態(tài)水平上區(qū)分材料的能力。由于選定了部分標記集,故算法上只需將供試材料的分子身份證編碼標出即可。選擇分析的結果可能會鎖定唯一分子身份證的材料,也可能有多個共享一個分子身份證的材料,還可能由于缺失導致的具有不完全身份證的材料等幾種可能。選擇分析的基本步驟如下:步驟1:從全部標記中選擇部分標記集;步驟3:將結果進行分類顯示,唯一識別材料、分組識別材料和不確定材料。1.4.4基于庫的構建在全庫構建的基礎上,選擇幾個標記,對待測材料進行基于選定標記的電泳試驗,將電泳帶型數字化,在全庫構建的背景下,基于所選定標記計算該待測材料與其他材料間的相似度,判別該材料的類別歸屬,從而達到品種識別和品種鑒定的目的。分子身份證判定分析步驟如下:步驟1:選定背景標記集;步驟2:測定待測材料的帶型;步驟3:在該標記集下,計算待測材料與數據庫中全材料的相似度,以判別該材料的歸屬。2結果2.1數據庫設計及軟件開發(fā)分子身份證軟件依據分子身份證的實現(xiàn)策略設計功能及界面(圖2),軟件功能包括:數據庫瀏覽及更新、全庫構建、部分構建、輸入構建、選擇分析和ID判定等功能。2.1.1ows軟件環(huán)境分析分子身份證軟件應用Microsoft公司VisualBasic6.0進行程序開發(fā),軟件在開發(fā)時充分考慮到使用的兼容性問題,軟件可以在Windows9X/me/2000/XP/winVista/win7等大部份Windows的32位或64位操作系統(tǒng)下運行,軟件的運行對計算機硬件環(huán)境要求不高,Intel奔騰CPU/512M內存/1G硬盤空間及以上機型都可運行。如果構建的標記及材料數量過多時,運算時間會相應增加,要想達到理想的運算效率,計算機的硬件配置不應過低。分子身份證軟件首發(fā)版本為IDAnalysis1.0,軟件登記號:2007SR11870a,通過應用完善了軟件的功能及操作界面,目前版本為IDAnalysis4.1,軟件具有功能豐富、界面友好(圖3)、操作簡單等優(yōu)點,一步即可達到以往需要多個軟件聯(lián)合使用才能完成的任務。軟件可以獲得方式:發(fā)送索取軟件的郵件給作者qshchen@126.com或訪問“大豆設計網”站進行下載。2.1.2主栽大豆品種分子身份證編碼標記統(tǒng)計是將電泳膠圖上的目標條帶數字化的過程,具體原則是根據擴增片段的分子量由大到小依次按1、2、3、4……N的順序進行記錄。其中,0表示零等位基因(即該泳道由于基因片段丟失而無帶),-1表示該品種數據由于試驗操作造成缺失,-2表示該泳道出現(xiàn)雜合帶型。圖3為黑龍江省主栽大豆品種分子身份證構建試驗中所獲得的一張比較理想的電泳圖,以此圖為例闡明標記統(tǒng)計原則。利用40對SSR引物對40份大豆品種進行電泳分析,共獲得1600個標記數據,將標記整理成軟件可識別的文本文檔(圖4)。數據文本的第1行第1個位置表示數據矩陣大小,其中“40/40”表示該數據文本中的數據矩陣為40行40列,第一個40表示有40個材料,第二個40表示有40對引物。向右接著是引物信息,引物需要用加引號,矩陣大小及引物間加一半角空格,以換行符結尾。例如“40/40”“Satt516”“Satt338”“Satt573”。從第2行開始每行表示1個材料,從左向右第1個位置表示材料名稱,中英文皆可,但要加用引號,向右接著是該資源使用40對不同引物的電泳標記數據,資源名及帶型標記間加一半角空格,以換行符結尾。例如:“合豐25”1133。2.1.3數據庫合并功能分子身份證構建的基礎是數據,數據是由引物和材料組成的二維標記矩陣集。由于數據缺失、引物更新和材料的變化而導致標記集數據的動態(tài)變化,而數據的改變進一步決定了分子身份證的構建也是動態(tài)可變的。因此軟件設計開始時就考慮到由于對缺失數據的補充、新品種材料的更新,高多態(tài)性引物的加入等問題而導致數據集更新的麻煩。為解決數據集更新的麻煩,軟件開發(fā)了數據庫合并功能(圖5)??梢愿鶕锖筒牧系牧斜韺Χ鄠€數據集進行整合,并可以對其發(fā)生改變的等位基因進行校驗和提示,這樣有利于整合最新的研究結果,開發(fā)全部材料最合適的分子身份證。合并后的數據結果以文本形式輸出(圖5),由結果文件可知,合并后的新數據集是由6份材料及4對引物組成,其中合并前二個數據集有1個差異數據,差異數據為“東農46,Satt516”,在a集中標記是1,在b集中標記是3,結果還顯示了合并到新數據集中的材料、引物的數量及名稱。2.2軟件認證2.2.1分子身份證構建將40對引物對40份大豆品種的標記數據導入軟件,具體如下:打開分子身份證軟件,點擊快捷工具欄的第三個圖標“全庫構建”,即可打開全庫構建窗口(圖6)。點擊文件下拉菜單-打開-瀏覽到數據文件-打開,導入數據文件,點擊“IDanalysis”按鈕即可完成分子身份證構建。構建完的數據會顯示在窗口的數據顯示區(qū),點擊窗口文件下拉菜單-輸出-瀏覽文件保存位置-命名文件名-保存,結果文件以文本形式保存。文件內容共分4部分,第1部分指明分析時的參數;第2部分指明不符合引物信息;第3部分指明特異引物信息;第4部分給出引物組合及每個材料的分子身份證的編號(圖6)。由分子身份證構建結果可知,在40對引物對40個大豆品種的分子身份證構建中:共有13對引物由于缺失過多,不符合標準被剔除,剔除引物為Sat_111、Sat_218、Satt231、Satt685、Satt514、Satt551、Satt077、Satt358、Satt424、Satt100、Satt838、Satt893和Satt891。共有7對引物由于與其他引物相似系數過高,不符合標準被剔除,剔除引物為Satt253、Satt192、Satt417、Sat_229、Satt127和Satt496。在分析的40個品種中,共有5個品種具有7個特異等位基因,因此,可以通過這些特異等位基因直接確定需要鑒定的品種,通過計算僅需要7對引物即可區(qū)分40個大豆品種,引物組合為Satt398、Satt380、Satt453、Satt288、Satt244、Sat_092和Satt206,例如北豆3號在該引物組合下的分子身份證編號為2411343。2.2.2開-觀看數據文件部分構建的具體操作如下:打開分子身份證軟件,點擊快捷工具欄的第四個圖標“部分構建”,即可打開部分構建窗口(圖7)。點擊文件下拉菜單-打開-瀏覽到數據文件-打開,導入數據文件。從材料欄里選擇一些材料到目標材料欄內,點擊“IDanalysis”按鈕即可完成部分材料的分子身份證構建。同時為了方便用戶使用,軟件還提供“輸入構建”窗口,在該窗口中將材料的選擇方式變?yōu)槿斯ぽ斎?其他功能相同。構建完的結果文件內容共分3部分,第1部分指明不符合引物信息;第2部分指明特異引物信息;第3部分給出引物組合及被選擇的部分材料的分子身份證的編號(圖7)。2.2.3分子身份證號碼ID判定的具體操作如下:打開分子身份證軟件,點擊快捷工具欄的第七個圖標“ID判定”,即可打開ID判定窗口(圖8)。點擊文件下拉菜單-打開-瀏覽到數據文件-打開,導入數據文件。在“引物及ID”欄內輸入引物名稱及分子身份證編號,其格式為“Satt338,Satt369,Satt453:314”,點擊“PossibleGP”按鈕即可計算出由引物組合以及身份證編號所確定的唯一材料名稱。有些時候可能需要考察部分受關注的引物在分子多態(tài)水平上區(qū)分材料的能力。此時可以使用“選擇分析”功能,其結果可能是被唯一區(qū)分的材料,也可能是多個共享一個分子身份證的材料,或是由于缺失導致的具有不完全身份證的材料等幾種可能。3討論3.1標記多態(tài)性和材料容量縮減關于尋找最優(yōu)引物組合,可以采用貪婪算法,窮舉法等多種方法。貪婪算法關于標記多態(tài)度排序,在計算中可以看出,調整標記的順序會直接影響結果,因此,可根據單個標記等位基因多態(tài)性大小進行排序,使區(qū)分能力較強的標記更早出現(xiàn),這樣就使標記組合的區(qū)分度迅速增加,從而加快算法搜索速度。關于材料容量縮減,每次有新標記引入都會重新計算當前標記多態(tài)型下的每個材料條帶碼頻數,而有部分材料在新標記入選前等位基因組合頻率已經為1,達到了區(qū)分目的,沒有重新計算的必要。因此,可以將被區(qū)分開的材料從計算的數據集中刪除,逐步縮減材料容量,達到加快算法目的。3.2web應用程序技術在作物上的應用到目前該軟件已經在大豆、水稻、花生、玉米、高粱、真菌、木耳等多種作物上得到廣泛應用相比VB程序語言,Java技術具有簡單、完全面向對象、屬于解釋執(zhí)行語言、安全性高、可移植性強、執(zhí)行性能高、多線程以及動態(tài)性等優(yōu)點3.3分子身份證的開發(fā)分子身份證軟件構建核心目標是為了利用最優(yōu)引物對組合完成對目標材料群體的唯一性區(qū)分,如果具有較為完善的品種資源數據庫系統(tǒng),便可以解決資源的鑒定,育種材料的分析和候選審定材料的創(chuàng)新性判定等很多現(xiàn)實存在的棘手問題。在軟件數據庫開發(fā)方面,可以基于研究對象特性開發(fā)的各類特殊分子標記來構建分子身份證。在標記開發(fā)方面,可以針對研究資源的特性,設計獨特的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 江西師范大學科學技術學院《建筑設備施工組織設計》2023-2024學年第一學期期末試卷
- 湖南中醫(yī)藥大學湘杏學院《水電站建筑物》2023-2024學年第一學期期末試卷
- 湖南工藝美術職業(yè)學院《多媒體信息處理與檢索技術》2023-2024學年第一學期期末試卷
- 衡陽科技職業(yè)學院《統(tǒng)計軟件操作》2023-2024學年第一學期期末試卷
- 浙江師范大學《能源與動力工程測試技術》2023-2024學年第一學期期末試卷
- 長春師范大學《衛(wèi)生檢驗綜合技術》2023-2024學年第一學期期末試卷
- 榆林職業(yè)技術學院《太陽能熱利用技術》2023-2024學年第一學期期末試卷
- 使用二手設備節(jié)約資本開支
- 實踐學習實施報告
- 業(yè)務操作-2018-2019年房地產經紀人《房地產經紀業(yè)務操作》真題匯編
- 生產車間工藝員年終總結
- 特色酒吧方案計劃書
- 重慶市南開中學2023-2024學年中考三模英語試題含答案
- 2023年上海高中物理合格考模擬試卷一含詳解
- 2022版義務教育(地理)課程標準(附課標解讀)
- 2024年滑雪用品行業(yè)分析報告及未來發(fā)展趨勢
- 經方治療腦梗塞的體會
- 新版DFMEA基礎知識解析與運用-培訓教材
- 制氮機操作安全規(guī)程
- 衡水市出租車駕駛員從業(yè)資格區(qū)域科目考試題庫(全真題庫)
- 護理安全用氧培訓課件
評論
0/150
提交評論