標準解讀
《GB/T 19101-2003 建立術(shù)語語料庫的一般原則與方法》作為一項國家標準,為構(gòu)建和維護術(shù)語語料庫提供了一套規(guī)范性的框架。然而,您未直接提供另一個標準或版本以進行詳細的對比分析。不過,基于該標準本身的內(nèi)容,我們可以概述其關(guān)鍵要點,間接理解它可能相對于早期實踐或非標準化方法的改進之處。
該標準主要在以下幾個方面確立了原則與方法:
-
術(shù)語界定與收集:明確了術(shù)語選取的原則,強調(diào)應涵蓋專業(yè)領(lǐng)域內(nèi)的重要概念,并規(guī)定了術(shù)語收集的方法和來源,如專業(yè)文獻、標準、辭典等,這相比無系統(tǒng)方法的術(shù)語搜集更為科學和全面。
-
語料選取與處理:規(guī)定了語料的代表性、多樣性和時效性要求,以及如何對語料進行預處理,包括清洗、標注等步驟,確保語料庫的質(zhì)量與實用性。這改變了以往可能存在的隨意性或片面性問題。
-
數(shù)據(jù)結(jié)構(gòu)與管理:詳細說明了語料庫的數(shù)據(jù)結(jié)構(gòu)設(shè)計原則,包括元數(shù)據(jù)定義、術(shù)語條目結(jié)構(gòu)等,以及數(shù)據(jù)庫管理系統(tǒng)的選擇與維護策略,提升了語料庫的組織性和可訪問性。
-
技術(shù)要求:提出了語料庫建立過程中所需的技術(shù)支持,包括文本處理軟件、搜索引擎技術(shù)、自然語言處理技術(shù)的應用等,促進了信息技術(shù)在術(shù)語工作的融合與應用。
-
質(zhì)量控制:強調(diào)了在語料庫建設(shè)全過程中實施質(zhì)量控制的重要性,包括數(shù)據(jù)錄入的準確性驗證、定期審查更新機制等,確保語料庫的準確性和時效性。
-
共享與交流:提倡語料庫資源的開放共享原則,鼓勵建立跨領(lǐng)域、跨機構(gòu)的合作機制,推動了知識資源的廣泛傳播與利用。
如需獲取更多詳盡信息,請直接參考下方經(jīng)官方授權(quán)發(fā)布的權(quán)威標準文檔。
....
查看全部
- 現(xiàn)行
- 正在執(zhí)行有效
- 2003-05-14 頒布
- 2003-12-01 實施
文檔簡介
ICS01.020A22中華人民共和國國家標準GB/T19101-2003建立術(shù)語語料庫的一般原則與方法Generalprinciplesandmethodsofestablishingterminologycorpus2003-05-14發(fā)布2003-12-01實施中華人民共和國發(fā)布國家質(zhì)量監(jiān)督檢驗檢疫總局
GB/T19101-2003次前言L范圍2規(guī)范性引用文件3術(shù)語和定義4基本要求4.1語料的要求4.2置標語言的要求4.3術(shù)語語料庫系統(tǒng)的要求5術(shù)語語料庫的加工和組織5.1術(shù)語語料庫的加工層次5.2術(shù)語語料庫的加工流程5.3術(shù)語語料庫的組織6術(shù)語語料庫系統(tǒng)的建立和功能設(shè)計6.1術(shù)術(shù)語語料庫系統(tǒng)的建立…6.2術(shù)語語料庫系統(tǒng)的功能設(shè)計6.3術(shù)語語料庫系統(tǒng)的服務方式7術(shù)語語料庫系統(tǒng)的管理與維護附錄A(資料性附錄)建立術(shù)語語料庫的有關(guān)國家標準
GB/T19101-2003前本標準是術(shù)語數(shù)據(jù)庫的系列國家標準之一已經(jīng)發(fā)布的系列標準有:GB/T13726—1992術(shù)語與辭書條目的記錄交換用磁帶格式GB/T16785—1997術(shù)語工作概念與術(shù)語的協(xié)調(diào)GB/T16786—1997術(shù)語工作計算機應用數(shù)據(jù)類目GB/T17532—1998術(shù)語工作計算機應用詞匯GB/T18155-2000術(shù)語工作計算機應用機器可讀術(shù)語交換格式(MARTIF)協(xié)商交換GB/T13725—2001建立術(shù)語數(shù)據(jù)庫的一般原則與方法GB/T15387.1-2001術(shù)語數(shù)據(jù)庫開發(fā)文件編制指南GB/T15387.2—2001術(shù)語數(shù)據(jù)庫開發(fā)指南GB/T15625—2001術(shù)語數(shù)據(jù)庫技術(shù)評價指南GB/T19102—2003術(shù)語部件庫的信息描述規(guī)范本標準的附錄A是資料性附錄。本標準由全國術(shù)語標準化技術(shù)委員會提出本標準由中國標準研究中心歸口。本標準由中國標準研究中心、北京大學計算語言學研究所等單位起草本標準主要起草人:陳玉忠、宋敏、何燕、葉盛、穗志方、程永紅、肖玉敬
GB/T19101-2003建立術(shù)語語料庫的一般原則與方法1范圍本標準規(guī)定了建立術(shù)語語料庫的一般原則與方法本標準適用于術(shù)語語料庫的研究、開發(fā)、維護及有關(guān)管理工作。其他涉及語料庫建設(shè)的工作也可參照使用、規(guī)范性引用文件下列文件中的條款通過本標準的引用而成為本標準的條款。凡是注日期的引用文件.其隨后所有的修改單(不包括勒誤的內(nèi)容)或修訂版均不適用于本標準,然而,鼓勵根據(jù)本標準達成協(xié)議的各方研究是否可使用這些文件的最新版本。凡是不注日期的引用文件,其最新版本適用于本標準。GB/T13725—2001建立術(shù)語數(shù)據(jù)庫的一般原則與方法GB/T15237.1-2000術(shù)語工作詞匯第1部分:理論與應用(eqvISO1087-1:2000)術(shù)語和定義GB/T15237.1確立的術(shù)語和定義適用于本標準。為了便于使用.本標準重復了其中的部分術(shù)語和定義。3.1術(shù)語term在特定專業(yè)領(lǐng)域中一般概念的詞語指稱。。GB/T15237.1-2000.3.4.373.2語料庫COrpus集中起來供分析用的語言數(shù)據(jù)集合。LGB/T15237.1—2000.3.6.933術(shù)語語料庫1erminologycorpus分析和研究術(shù)語用的語料庫。3.4術(shù)語語料庫系統(tǒng)terminologycorpussystem包含管理框架的術(shù)語語料庫。往:改自GB/T17532-1998.7.7.4基本要求4.1語料的要求4.1.1一致性人庫語料應是格式一致、有效的4.1.2適用性語
溫馨提示
- 1. 本站所提供的標準文本僅供個人學習、研究之用,未經(jīng)授權(quán),嚴禁復制、發(fā)行、匯編、翻譯或網(wǎng)絡(luò)傳播等,侵權(quán)必究。
- 2. 本站所提供的標準均為PDF格式電子版文本(可閱讀打?。?,因數(shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務。
- 3. 標準文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質(zhì)量問題。
最新文檔
- 2025版市政工程挖掘機租賃及施工配合合同協(xié)議書3篇
- 2025版智能交通管理系統(tǒng)軟件開發(fā)與運營服務合同3篇
- 2025版城市綠地養(yǎng)護勞務分包合同模板4篇
- 企業(yè)人力資源管理概念
- 二零二五版知識產(chǎn)權(quán)保密與競業(yè)限制服務合同3篇
- 塑料薄膜光學性能研究考核試卷
- 2025版事業(yè)單位教師崗位聘用合同續(xù)簽協(xié)議書3篇
- 2025年度碼頭轉(zhuǎn)租及船舶??糠胀獍贤?篇
- 04毛首鞭形線蟲簡稱鞭蟲47課件講解
- 2025年食品行業(yè)食品安全風險評估合同范本3篇
- 垃圾處理廠工程施工組織設(shè)計
- 天皰瘡患者護理
- 2025年蛇年新年金蛇賀歲金蛇狂舞春添彩玉樹臨風福滿門模板
- 《建筑制圖及陰影透視(第2版)》課件 4-直線的投影
- 新生物醫(yī)藥產(chǎn)業(yè)中的人工智能藥物設(shè)計研究與應用
- 防打架毆斗安全教育課件
- 損失補償申請書范文
- 壓力與浮力的原理解析
- 鐵路損傷圖譜PDF
- 裝修家庭風水學入門基礎(chǔ)
- 移動商務內(nèi)容運營(吳洪貴)任務二 社群的種類與維護
評論
0/150
提交評論