標(biāo)準(zhǔn)解讀
《GB/T 35890-2018 高通量測序數(shù)據(jù)序列格式規(guī)范》是由中國國家標(biāo)準(zhǔn)化管理委員會發(fā)布的一項(xiàng)國家標(biāo)準(zhǔn),主要針對高通量測序技術(shù)產(chǎn)生的大量生物信息數(shù)據(jù)如何進(jìn)行有效管理和存儲提出了一系列規(guī)定。該標(biāo)準(zhǔn)適用于基于DNA或RNA的高通量測序數(shù)據(jù)分析、處理以及交換過程中的數(shù)據(jù)格式要求。
標(biāo)準(zhǔn)首先明確了適用范圍,指出其適用于所有使用高通量測序技術(shù)的研究領(lǐng)域,包括但不限于醫(yī)學(xué)研究、農(nóng)業(yè)科學(xué)、環(huán)境監(jiān)測等。接著定義了一些關(guān)鍵術(shù)語,如“讀段”、“質(zhì)控標(biāo)簽”等,為后續(xù)內(nèi)容的理解奠定基礎(chǔ)。
在數(shù)據(jù)表示方面,《GB/T 35890-2018》詳細(xì)描述了FASTQ文件格式作為推薦使用的標(biāo)準(zhǔn)格式之一,用于存儲原始測序數(shù)據(jù)及其質(zhì)量評分。此外,還介紹了SAM/BAM格式用于比對結(jié)果的數(shù)據(jù)存儲,并且討論了VCF格式對于變異檢測結(jié)果的重要性。每種格式的具體結(jié)構(gòu)、字段含義及編碼方式都被逐一說明,確保了不同平臺間數(shù)據(jù)的一致性和可互操作性。
為了保證數(shù)據(jù)的質(zhì)量與完整性,《GB/T 35890-2018》還提出了關(guān)于元數(shù)據(jù)記錄的要求,建議包含實(shí)驗(yàn)設(shè)計(jì)、樣本信息、儀器型號、軟件版本等多個方面的詳細(xì)描述。這樣不僅有助于后續(xù)分析時能夠準(zhǔn)確理解數(shù)據(jù)來源,也有利于長期保存和重復(fù)利用這些寶貴的信息資源。
如需獲取更多詳盡信息,請直接參考下方經(jīng)官方授權(quán)發(fā)布的權(quán)威標(biāo)準(zhǔn)文檔。
....
查看全部
- 現(xiàn)行
- 正在執(zhí)行有效
- 2018-02-06 頒布
- 2018-09-01 實(shí)施
![GB/T 35890-2018高通量測序數(shù)據(jù)序列格式規(guī)范_第1頁](http://file4.renrendoc.com/view/c379cf09cdd2a46eabfda3d2c0da4626/c379cf09cdd2a46eabfda3d2c0da46261.gif)
![GB/T 35890-2018高通量測序數(shù)據(jù)序列格式規(guī)范_第2頁](http://file4.renrendoc.com/view/c379cf09cdd2a46eabfda3d2c0da4626/c379cf09cdd2a46eabfda3d2c0da46262.gif)
![GB/T 35890-2018高通量測序數(shù)據(jù)序列格式規(guī)范_第3頁](http://file4.renrendoc.com/view/c379cf09cdd2a46eabfda3d2c0da4626/c379cf09cdd2a46eabfda3d2c0da46263.gif)
文檔簡介
ICS07080
A40.
中華人民共和國國家標(biāo)準(zhǔn)
GB/T35890—2018
高通量測序數(shù)據(jù)序列格式規(guī)范
Technicalspecificationofhighthroughputsequencingdataformat
2018-02-06發(fā)布2018-09-01實(shí)施
中華人民共和國國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局發(fā)布
中國國家標(biāo)準(zhǔn)化管理委員會
GB/T35890—2018
前言
本標(biāo)準(zhǔn)按照給出的規(guī)則起草
GB/T1.1—2009。
本標(biāo)準(zhǔn)由全國生化檢測標(biāo)準(zhǔn)化技術(shù)委員會提出并歸口
(SAC/TC387)。
本標(biāo)準(zhǔn)起草單位深圳華大基因研究院中國計(jì)量科學(xué)研究院
:、。
本標(biāo)準(zhǔn)主要起草人梁鑫明劉心蔣慧杜佳婷謝強(qiáng)李倩一李岱怡王晶
:、、、、、、、。
Ⅰ
GB/T35890—2018
高通量測序數(shù)據(jù)序列格式規(guī)范
1范圍
本標(biāo)準(zhǔn)規(guī)定了高通量測序數(shù)據(jù)的序列格式包括序列描述格式規(guī)范和高通量測序數(shù)據(jù)整體格式
,
規(guī)范
。
本標(biāo)準(zhǔn)適用于規(guī)范生物體高通量測序數(shù)據(jù)序列格式
DNA。
2規(guī)范性引用文件
下列文件對于本文件的應(yīng)用是必不可少的凡是注日期的引用文件僅注日期的版本適用于本文
。,
件凡是不注日期的引用文件其最新版本包括所有的修改單適用于本文件
。,()。
高通量基因測序技術(shù)規(guī)程
GB/T30989
信息技術(shù)信息交換七位編碼字集
ISO/IEC646ISO(Informationtechnology—ISO7-bitcoded
charactersetforinformationinterchange)
3術(shù)語和定義
下列術(shù)語和定義適用于本文件
。
31
.
高通量測序high-throughputsequencing
以一次并行幾十萬到幾百萬條核酸分子序列測定和一般讀長較短等為標(biāo)志適用于的測序
,DNA
技術(shù)
。
注改寫定義
:GB/T30989—2014,3.1.9。
32
.
測序片段reads
高通量測序平臺產(chǎn)生的含有堿基序列和質(zhì)量值的序列片段
。
33
.
雙末端測序paired-endsequencing
對模板鏈和互補(bǔ)鏈分別測序并得到兩條鏈成對測序片段的測序技術(shù)
DNA,。
34
.
插入片段長度insertsize
雙末端測序中從模板鏈測序的測序片段左端到互補(bǔ)鏈測序的測序片段右端的距離
,。
35
.
測序片段識別碼readsidentifier
用以識別一段測序片段的具有唯一性的字符串
。
36
.
堿基序列basesequence
測序片段中記錄堿基排列的字符串堿基序列中的每個堿基應(yīng)使用大寫字母和或
,(A、T、C、GN)
小寫字母和其中字母和表示腺嘌呤字母和表示胸腺嘧啶字母和表示胞
溫馨提示
- 1. 本站所提供的標(biāo)準(zhǔn)文本僅供個人學(xué)習(xí)、研究之用,未經(jīng)授權(quán),嚴(yán)禁復(fù)制、發(fā)行、匯編、翻譯或網(wǎng)絡(luò)傳播等,侵權(quán)必究。
- 2. 本站所提供的標(biāo)準(zhǔn)均為PDF格式電子版文本(可閱讀打?。?,因數(shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務(wù)。
- 3. 標(biāo)準(zhǔn)文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質(zhì)量問題。
最新文檔
- 2025屆浙江省杭州市育才中學(xué)中考一模生物試題含解析
- 四川省涼山彝族自治州寧南三峽白鶴灘校2025屆中考生物考前最后一卷含解析
- 廣東省中學(xué)山市小欖鎮(zhèn)重點(diǎn)中學(xué)2025屆中考生物最后沖刺模擬試卷含解析
- 廣東省陽江市教育局教研究室重點(diǎn)名校2025屆中考四模生物試題含解析
- 湖南省株州市達(dá)標(biāo)名校2025屆中考生物適應(yīng)性模擬試題含解析
- 福建省福州十九中學(xué)2025屆中考生物五模試卷含解析
- 2025屆廣東省清遠(yuǎn)市市級名校畢業(yè)升學(xué)考試模擬卷生物卷含解析
- 企業(yè)正式員工聘用合同模板新
- 全新合同醫(yī)療器械
- 商品買賣及運(yùn)輸協(xié)議
- 2025大連機(jī)場招聘109人易考易錯模擬試題(共500題)試卷后附參考答案
- 2025-2030年中國電動高爾夫球車市場運(yùn)行狀況及未來發(fā)展趨勢分析報告
- 物流中心原材料入庫流程
- 河南省濮陽市2024-2025學(xué)年高一上學(xué)期1月期末考試語文試題(含答案)
- 長沙市2025屆中考生物押題試卷含解析
- 2024年08月北京中信銀行北京分行社會招考(826)筆試歷年參考題庫附帶答案詳解
- 2024年芽苗菜市場調(diào)查報告
- 2024年湖南高速鐵路職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫及答案解析
- 中藥炮制學(xué)教材
- 常見腫瘤AJCC分期手冊第八版(中文版)
- 電氣第一種第二種工作票講解pptx課件
評論
0/150
提交評論