標準解讀
《GB/T 21023-2007 中文語音識別系統(tǒng)通用技術規(guī)范》是中華人民共和國國家質量監(jiān)督檢驗檢疫總局和中國國家標準化管理委員會聯(lián)合發(fā)布的一項國家標準,旨在為中文語音識別系統(tǒng)的開發(fā)、評估及應用提供一套統(tǒng)一的技術要求和測試方法。此標準詳細規(guī)定了中文語音識別系統(tǒng)在性能、功能、數(shù)據(jù)格式、測試評估等方面應遵循的基本原則和技術指標,以促進該領域技術的規(guī)范化和產(chǎn)品質量的提升。以下是對該標準主要內容的概述:
-
范圍:明確了本標準適用于基于自動識別和處理漢語語音信號的中文語音識別系統(tǒng),包括但不限于連續(xù)語音、關鍵詞識別、語音命令識別等應用場景。
-
術語和定義:定義了一系列與中文語音識別相關的專業(yè)術語,如識別率、拒識率、誤識率等,為標準的后續(xù)內容奠定了語言基礎。
-
技術要求:
- 識別性能:規(guī)定了識別系統(tǒng)的準確度、響應時間、穩(wěn)定性等關鍵性能指標,要求系統(tǒng)能在不同環(huán)境條件下保持較高識別率。
- 功能要求:包括語音輸入處理、聲學模型、語言模型、語音數(shù)據(jù)庫管理、用戶界面及交互設計等方面的功能需求,確保系統(tǒng)具備良好的用戶體驗和實用性。
- 兼容性與可擴展性:要求系統(tǒng)能適應不同的軟硬件平臺,支持多種音頻格式和編碼方式,且易于升級和擴展以應對未來技術發(fā)展。
-
數(shù)據(jù)與格式:對語音數(shù)據(jù)庫的構建、標注、存儲及交換格式提出了具體要求,強調數(shù)據(jù)的代表性和多樣性,以支持系統(tǒng)的訓練和測試。
-
測試與評估方法:確立了一套詳細的測試流程和評價體系,包括測試環(huán)境設置、測試集選擇、性能指標計算方法等,用以客觀評價系統(tǒng)的實際表現(xiàn)。
-
安全與隱私保護:雖然該標準主要聚焦于技術層面,但也提及了在系統(tǒng)設計和實施過程中應考慮的數(shù)據(jù)安全和用戶隱私保護原則。
如需獲取更多詳盡信息,請直接參考下方經(jīng)官方授權發(fā)布的權威標準文檔。
....
查看全部
- 現(xiàn)行
- 正在執(zhí)行有效
- 2007-06-29 頒布
- 2007-11-01 實施
文檔簡介
ICS35.040L71中華人民共和國國家標準GB/T21023—2007中文語音識別系統(tǒng)通用技術規(guī)范GeneralspecificationforChinesespeechrecognitionsystem2007-06-29發(fā)布2007-11-01實施中華人民共和國國家質量監(jiān)督檢驗檢疫總局愛布中國國家標準化管理委員會
GB/T21023一2007三前言范圍2規(guī)范性引用文件3術語和定義4語音識別系統(tǒng)分類及表述4.1基于用途的分類4.2基于詞匯量的分類4.3基于所能識別的說話人群的分類4.4基于系統(tǒng)工作模式的分類4.5曙音識別系統(tǒng)的應用環(huán)境4.6語音識別系統(tǒng)使用背景環(huán)境4.7語音識別系統(tǒng)表述規(guī)范5語音識別系統(tǒng)性能指標5.2識別性能分類指標5.3應時間指標5.4系統(tǒng)分類指標要求6語音輸入和識別輸出6.1語音識別輸入準則6.2語音識別輸出準則7語音識別系統(tǒng)性能測試方法7.17.2測試語料設計7.3測試語音錄制7.4基于語音識別標準庫的測試方法7.5基于現(xiàn)場口呼的測試方法7.6測試報告內容8語音識別標準庫及規(guī)范8.1述8.2語音識別標準庫語音特性的描述8.3語語音識別標準庫的標注8.48.5語音識別標準庫的數(shù)據(jù)轉換附錄A(資料性附錄)聽寫系統(tǒng)有關符號讀法附錄B(資料性附錄)語音識別用無調漢語拼音表參考文獻
GB/T21023-2007前請注意本標準的某些內容有可能涉及專利。本標準的發(fā)布機構不承擔識別這些專利的責任本標準的附錄A、附錄B是資料性附錄。本標準由中華人民共和國信息產(chǎn)業(yè)部提出本標準由全國信息技術標準化技術委員會歸口本標準由中國電子技術標準化研究所、中國科學院白動化研究所、清華大學、中國社會科學院語言研究所起草。本標準主要起草人:徐波、孫甲松、李愛軍、徐明星、黃泰翼、鮑懷翹、尹波、吳志剛
GB/T21023-2007中文語音識別系統(tǒng)通用技術規(guī)范范圍本標準規(guī)定了中文語音識別系統(tǒng)的基本術語、分類、技術指標、測試方法、輸入/輸出以及中文語音識別標準庫等。本標準適用于各種計算機、網(wǎng)絡和終端設備配置的中文語音識別系統(tǒng)。本標準的制定和實施主要用于指導中文語音識別系統(tǒng)的研制、應用和測試。2規(guī)范性引用文件下列文件中的條款通過本標準的引用而成為本標準的條款。凡是注日期的引用文件,其隨后所有的修改單(不包括勒誤的內容)或修訂版均不適用于本標準,然而.鼓勵根據(jù)本標準達成協(xié)議的各方研究是否可使用這些文件的最新版本。凡是不注日期的引用文件,其最新版本適用于本標準。GB18030—2005信息技術中文編碼字符集3術語和定義下列術語和定義適用于本標準語音識別speechrecognition將人類的聲音信號轉化為文字或者指令的過程3.2語音識別系統(tǒng)speechrecognitionsystem具有語音識別功能的開發(fā)工具、軟件、裝置或應用3.3詞匯表vocabularylist語音識別系統(tǒng)所包含和處理的所有詞匯。3.4激活詞匯activeword語音識別系統(tǒng)在某個時間點能同時識別的所有詞匯。3.5發(fā)音lutterance用戶輸入的一個語音單位,可以是詞、短語或句子。。發(fā)音單元之間需有有意、明顯停頓。3.6孤立字語音isolatedwordspeech以字為發(fā)音單元,字與字之間需有有意、明顯停頓的語音連接詞語音connectedwordspeech以詞為發(fā)音單元.
溫馨提示
- 1. 本站所提供的標準文本僅供個人學習、研究之用,未經(jīng)授權,嚴禁復制、發(fā)行、匯編、翻譯或網(wǎng)絡傳播等,侵權必究。
- 2. 本站所提供的標準均為PDF格式電子版文本(可閱讀打?。?,因數(shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務。
- 3. 標準文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質量問題。
最新文檔
- 2024年大學學生會工作總結參考(三篇)
- 2024年工程車輛運輸合同標準范文(二篇)
- 2024年垃圾清運承包合同格式范文(二篇)
- 2024年委托代理協(xié)議參考樣本(五篇)
- 2024年學校車輛出入管理制度(六篇)
- 2024年工程合同格式范文(二篇)
- 2024年安全主管的崗位職責(三篇)
- 化債力度加碼城投債持續(xù)凈償還-2024年三季度城投債市場分析與展望 -聯(lián)合資信
- 2024年工資專項集體合同參考樣本(二篇)
- 2024年婦幼保健院核心制度(二篇)
- 工業(yè)污水處理廠項目經(jīng)濟效益和社會效益分析報告
- 安徽省阜陽市臨泉縣2023-2024學年六年級上學期期中英語試卷+
- 中醫(yī)養(yǎng)生的吃生姜養(yǎng)生法
- 馬克·吐溫及作品《哈克貝利·費恩歷險記》素材課件
- 【初中數(shù)學 】第五章 相交線與平行線 章節(jié)練習題 2023-2024學年人教版數(shù)學七年級下冊
- 工業(yè)產(chǎn)品質量安全風險監(jiān)測實施規(guī)范
- 482023年廣西職業(yè)院校技能大賽中職組《職業(yè)英語技能》賽項職場應用環(huán)節(jié)樣題
- 高中化學教學學生高階思維能力培養(yǎng)路徑分析
- 原始記錄書寫培訓課件
- 《數(shù)學家高斯》課件
- 2023年中國石化安慶石化公司校園招聘150人歷年高頻難易度、易錯點模擬試題(共500題)附帶答案詳解
評論
0/150
提交評論