標準解讀

《GB/T 21023-2007 中文語音識別系統(tǒng)通用技術規(guī)范》是中華人民共和國國家質量監(jiān)督檢驗檢疫總局和中國國家標準化管理委員會聯(lián)合發(fā)布的一項國家標準,旨在為中文語音識別系統(tǒng)的開發(fā)、評估及應用提供一套統(tǒng)一的技術要求和測試方法。此標準詳細規(guī)定了中文語音識別系統(tǒng)在性能、功能、數(shù)據(jù)格式、測試評估等方面應遵循的基本原則和技術指標,以促進該領域技術的規(guī)范化和產(chǎn)品質量的提升。以下是對該標準主要內容的概述:

  1. 范圍:明確了本標準適用于基于自動識別和處理漢語語音信號的中文語音識別系統(tǒng),包括但不限于連續(xù)語音、關鍵詞識別、語音命令識別等應用場景。

  2. 術語和定義:定義了一系列與中文語音識別相關的專業(yè)術語,如識別率、拒識率、誤識率等,為標準的后續(xù)內容奠定了語言基礎。

  3. 技術要求

    • 識別性能:規(guī)定了識別系統(tǒng)的準確度、響應時間、穩(wěn)定性等關鍵性能指標,要求系統(tǒng)能在不同環(huán)境條件下保持較高識別率。
    • 功能要求:包括語音輸入處理、聲學模型、語言模型、語音數(shù)據(jù)庫管理、用戶界面及交互設計等方面的功能需求,確保系統(tǒng)具備良好的用戶體驗和實用性。
    • 兼容性與可擴展性:要求系統(tǒng)能適應不同的軟硬件平臺,支持多種音頻格式和編碼方式,且易于升級和擴展以應對未來技術發(fā)展。
  4. 數(shù)據(jù)與格式:對語音數(shù)據(jù)庫的構建、標注、存儲及交換格式提出了具體要求,強調數(shù)據(jù)的代表性和多樣性,以支持系統(tǒng)的訓練和測試。

  5. 測試與評估方法:確立了一套詳細的測試流程和評價體系,包括測試環(huán)境設置、測試集選擇、性能指標計算方法等,用以客觀評價系統(tǒng)的實際表現(xiàn)。

  6. 安全與隱私保護:雖然該標準主要聚焦于技術層面,但也提及了在系統(tǒng)設計和實施過程中應考慮的數(shù)據(jù)安全和用戶隱私保護原則。


如需獲取更多詳盡信息,請直接參考下方經(jīng)官方授權發(fā)布的權威標準文檔。

....

查看全部

  • 現(xiàn)行
  • 正在執(zhí)行有效
  • 2007-06-29 頒布
  • 2007-11-01 實施
?正版授權
GB/T 21023-2007中文語音識別系統(tǒng)通用技術規(guī)范_第1頁
GB/T 21023-2007中文語音識別系統(tǒng)通用技術規(guī)范_第2頁
GB/T 21023-2007中文語音識別系統(tǒng)通用技術規(guī)范_第3頁
GB/T 21023-2007中文語音識別系統(tǒng)通用技術規(guī)范_第4頁
免費預覽已結束,剩余16頁可下載查看

下載本文檔

免費下載試讀頁

文檔簡介

ICS35.040L71中華人民共和國國家標準GB/T21023—2007中文語音識別系統(tǒng)通用技術規(guī)范GeneralspecificationforChinesespeechrecognitionsystem2007-06-29發(fā)布2007-11-01實施中華人民共和國國家質量監(jiān)督檢驗檢疫總局愛布中國國家標準化管理委員會

GB/T21023一2007三前言范圍2規(guī)范性引用文件3術語和定義4語音識別系統(tǒng)分類及表述4.1基于用途的分類4.2基于詞匯量的分類4.3基于所能識別的說話人群的分類4.4基于系統(tǒng)工作模式的分類4.5曙音識別系統(tǒng)的應用環(huán)境4.6語音識別系統(tǒng)使用背景環(huán)境4.7語音識別系統(tǒng)表述規(guī)范5語音識別系統(tǒng)性能指標5.2識別性能分類指標5.3應時間指標5.4系統(tǒng)分類指標要求6語音輸入和識別輸出6.1語音識別輸入準則6.2語音識別輸出準則7語音識別系統(tǒng)性能測試方法7.17.2測試語料設計7.3測試語音錄制7.4基于語音識別標準庫的測試方法7.5基于現(xiàn)場口呼的測試方法7.6測試報告內容8語音識別標準庫及規(guī)范8.1述8.2語音識別標準庫語音特性的描述8.3語語音識別標準庫的標注8.48.5語音識別標準庫的數(shù)據(jù)轉換附錄A(資料性附錄)聽寫系統(tǒng)有關符號讀法附錄B(資料性附錄)語音識別用無調漢語拼音表參考文獻

GB/T21023-2007前請注意本標準的某些內容有可能涉及專利。本標準的發(fā)布機構不承擔識別這些專利的責任本標準的附錄A、附錄B是資料性附錄。本標準由中華人民共和國信息產(chǎn)業(yè)部提出本標準由全國信息技術標準化技術委員會歸口本標準由中國電子技術標準化研究所、中國科學院白動化研究所、清華大學、中國社會科學院語言研究所起草。本標準主要起草人:徐波、孫甲松、李愛軍、徐明星、黃泰翼、鮑懷翹、尹波、吳志剛

GB/T21023-2007中文語音識別系統(tǒng)通用技術規(guī)范范圍本標準規(guī)定了中文語音識別系統(tǒng)的基本術語、分類、技術指標、測試方法、輸入/輸出以及中文語音識別標準庫等。本標準適用于各種計算機、網(wǎng)絡和終端設備配置的中文語音識別系統(tǒng)。本標準的制定和實施主要用于指導中文語音識別系統(tǒng)的研制、應用和測試。2規(guī)范性引用文件下列文件中的條款通過本標準的引用而成為本標準的條款。凡是注日期的引用文件,其隨后所有的修改單(不包括勒誤的內容)或修訂版均不適用于本標準,然而.鼓勵根據(jù)本標準達成協(xié)議的各方研究是否可使用這些文件的最新版本。凡是不注日期的引用文件,其最新版本適用于本標準。GB18030—2005信息技術中文編碼字符集3術語和定義下列術語和定義適用于本標準語音識別speechrecognition將人類的聲音信號轉化為文字或者指令的過程3.2語音識別系統(tǒng)speechrecognitionsystem具有語音識別功能的開發(fā)工具、軟件、裝置或應用3.3詞匯表vocabularylist語音識別系統(tǒng)所包含和處理的所有詞匯。3.4激活詞匯activeword語音識別系統(tǒng)在某個時間點能同時識別的所有詞匯。3.5發(fā)音lutterance用戶輸入的一個語音單位,可以是詞、短語或句子。。發(fā)音單元之間需有有意、明顯停頓。3.6孤立字語音isolatedwordspeech以字為發(fā)音單元,字與字之間需有有意、明顯停頓的語音連接詞語音connectedwordspeech以詞為發(fā)音單元.

溫馨提示

  • 1. 本站所提供的標準文本僅供個人學習、研究之用,未經(jīng)授權,嚴禁復制、發(fā)行、匯編、翻譯或網(wǎng)絡傳播等,侵權必究。
  • 2. 本站所提供的標準均為PDF格式電子版文本(可閱讀打?。?,因數(shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務。
  • 3. 標準文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質量問題。

評論

0/150

提交評論