T∕TAF 041-2019 智能產(chǎn)品語音識(shí)別測(cè)評(píng)方法 第一部分車載語音交互系統(tǒng)_第1頁
T∕TAF 041-2019 智能產(chǎn)品語音識(shí)別測(cè)評(píng)方法 第一部分車載語音交互系統(tǒng)_第2頁
T∕TAF 041-2019 智能產(chǎn)品語音識(shí)別測(cè)評(píng)方法 第一部分車載語音交互系統(tǒng)_第3頁
T∕TAF 041-2019 智能產(chǎn)品語音識(shí)別測(cè)評(píng)方法 第一部分車載語音交互系統(tǒng)_第4頁
T∕TAF 041-2019 智能產(chǎn)品語音識(shí)別測(cè)評(píng)方法 第一部分車載語音交互系統(tǒng)_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、ICS 33.050M 30團(tuán)體標(biāo)準(zhǔn)T/TAF 041-2019智能產(chǎn)品語音識(shí)別測(cè)評(píng)方法第一部分車載語音交互系統(tǒng)Testing Methods for Speech Recognition of Intelligent ProductsThe First Part Speech Interaction System in Vehicle201906-17 發(fā)布2019-06-17 實(shí)施電信終端產(chǎn)業(yè)協(xié)會(huì)發(fā) 布T/TAF 041-2019 PAGE * ROMAN III目錄 HYPERLINK l _bookmark0 目錄I HYPERLINK l _bookmark1 前言II HYPERL

2、INK l _bookmark2 引言III HYPERLINK l _bookmark3 智能產(chǎn)品語音識(shí)別測(cè)評(píng)方法第一部分車載語音交互系統(tǒng)1 HYPERLINK l _bookmark4 范圍1 HYPERLINK l _bookmark5 規(guī)范性引用文件1 HYPERLINK l _bookmark6 術(shù)語、定義和縮略語1 HYPERLINK l _bookmark7 術(shù)語和定義1 HYPERLINK l _bookmark8 縮略語2 HYPERLINK l _bookmark9 車載語音交互系統(tǒng)分類及表述2 HYPERLINK l _bookmark10 概述2 HYPERLINK l

3、 _bookmark11 基于應(yīng)用場(chǎng)景的分類2 HYPERLINK l _bookmark12 車載語音交互系統(tǒng)的結(jié)構(gòu)表述3 HYPERLINK l _bookmark13 車載語音交互系統(tǒng)的性能指標(biāo)要求3 HYPERLINK l _bookmark14 概述3 HYPERLINK l _bookmark15 字準(zhǔn)確率3 HYPERLINK l _bookmark16 識(shí)別成功率4 HYPERLINK l _bookmark17 平均響應(yīng)時(shí)間4 HYPERLINK l _bookmark18 喚醒率4 HYPERLINK l _bookmark19 誤喚醒率4 HYPERLINK l _boo

4、kmark20 車載語音交互系統(tǒng)測(cè)試方法4 HYPERLINK l _bookmark21 概述4 HYPERLINK l _bookmark22 測(cè)試語料設(shè)計(jì)4 HYPERLINK l _bookmark23 測(cè)試語音/環(huán)境噪聲錄制5 HYPERLINK l _bookmark24 基于語音標(biāo)準(zhǔn)庫的測(cè)試方法6 HYPERLINK l _bookmark25 測(cè)試步驟8 HYPERLINK l _bookmark26 測(cè)試報(bào)告內(nèi)容9 HYPERLINK l _bookmark27 附 錄 A (規(guī)范性附錄) 標(biāo)準(zhǔn)修訂歷史10 HYPERLINK l _bookmark28 附 錄 B (資料性

5、附錄) 附錄11 HYPERLINK l _bookmark29 參考文獻(xiàn)12前言本標(biāo)準(zhǔn)按照 GB/T 1.1-2009給出的規(guī)則編寫。本標(biāo)準(zhǔn)由電信終端產(chǎn)業(yè)協(xié)會(huì)提出并歸口。本標(biāo)準(zhǔn)起草單位:中國信息通信研究院。本標(biāo)準(zhǔn)主要起草人:張文奇、馬治國、趙興龍、胡景楠、朱紅葉、孫悅、盧玉平、李俊林引言近年來,語音識(shí)別技術(shù)廣泛應(yīng)用于終端的人機(jī)界面和應(yīng)用輸入中。特別是對(duì)于車載交互系統(tǒng)來說, 駕車過程中語音識(shí)別技術(shù)使得駕駛員可以在雙手不離開方向盤,視線不離開路面的情況下,完成對(duì)汽車輔助功能的操控,提高了安全性和快捷性。語音識(shí)別技術(shù)可以使傳統(tǒng)繁瑣的手動(dòng)控制變?yōu)檎Z音控制,極大提高了駕駛員操作的方便性。作為最人性化的

6、人機(jī)交互方式,語音識(shí)別技術(shù)在車載中的應(yīng)用得到了廣泛關(guān)注。大量已上市和開發(fā)中的車載交互系統(tǒng)產(chǎn)品都以語音識(shí)別作為重要功能。由于目前車載交互系統(tǒng)的語音識(shí)別性能參差不齊,沒有一個(gè)通用可參照的標(biāo)準(zhǔn)對(duì)車載設(shè)備的性能進(jìn)行評(píng)估,無法準(zhǔn)確衡量其性能,因此有必要對(duì)車載交互系統(tǒng)的語音識(shí)別提出相應(yīng)的技術(shù)要求和測(cè)試方法。T/TAF 041-2019 PAGE 12智能產(chǎn)品語音識(shí)別測(cè)評(píng)方法第一部分車載語音交互系統(tǒng)范圍本標(biāo)準(zhǔn)從影響車載交互系統(tǒng)的語音識(shí)別性能的各技術(shù)角度出發(fā),制定相應(yīng)的測(cè)試方法和技術(shù)要求。本標(biāo)準(zhǔn)適用于車載終端設(shè)備配置的中文語音識(shí)別系統(tǒng)。本標(biāo)準(zhǔn)的制定和實(shí)施主要用于指導(dǎo)前裝的車載語音交互系統(tǒng)。后裝的車載語音交互系

7、統(tǒng)可參考本標(biāo)準(zhǔn)。規(guī)范性引用文件下列文件中的條款通過本標(biāo)準(zhǔn)的引用而成為本標(biāo)準(zhǔn)的條款。凡是注明日期的引用文件,其隨后所有的修改版(不包括勘誤的內(nèi)容)或修訂版均不適用于本標(biāo)準(zhǔn),然而,鼓勵(lì)根據(jù)本標(biāo)準(zhǔn)達(dá)成協(xié)議的各方研究是否可使用這些文件的最新版本。凡是不注日期的引用文件,其最新版本適用于本標(biāo)準(zhǔn)。GB/T 21023(2007)中文語音識(shí)別系統(tǒng)通用技術(shù)規(guī)范ITU-T P.56(12/2011)激活語音電平的客觀測(cè)量(Objective measurement of active speechlevel)ITU-T P.581(2000)HATS在免提終端測(cè)試中的使用(Use of head and tor

8、so simulator (HATS)for hands-free terminal testing)ITU-T P.851基于口語對(duì)話系統(tǒng)的電話服務(wù)的主觀質(zhì)量評(píng)價(jià)(Subjective qualityevaluation of telephoneservices based on spoken dialogue systems)術(shù)語、定義和縮略語術(shù)語和定義下列術(shù)語和定義適用于本標(biāo)準(zhǔn)。語音識(shí)別 speech recognition將人類的聲音信號(hào)轉(zhuǎn)化為文字或者指令的過程。語音識(shí)別系統(tǒng) speech recognition system具有語音識(shí)別功能的開發(fā)工具、軟件、裝置或應(yīng)用。車載系統(tǒng) in

9、-vehicle system能產(chǎn)生人類智能行為的車載計(jì)算機(jī)系統(tǒng),可為用戶提供車輛控制、安全、信息、娛樂等方面的功能或服務(wù)。車載語音交互系統(tǒng) in-vehicle speech interaction system實(shí)現(xiàn)人類與車載系統(tǒng)間語音交互的系統(tǒng),以將人類的語音輸入轉(zhuǎn)化為車載系統(tǒng)可識(shí)別的控制指令, 同時(shí)將車載系統(tǒng)的反饋信息通過語音或文字輸出為主要目的。識(shí)別決策 recognition strategies根據(jù)客觀的可能性,以已知的信息和知識(shí)為基礎(chǔ),借助一定的方法對(duì)識(shí)別目標(biāo)的諸多可能情況進(jìn)行分析、計(jì)算和選優(yōu)后,做出的行動(dòng)決定。語音喚醒 speech wakeup車載語音識(shí)別系統(tǒng)在睡眠模式下自動(dòng)

10、檢測(cè)背景語音中的喚醒詞,在成功匹配的情況下轉(zhuǎn)入正常工作模式。響應(yīng)時(shí)間對(duì)于特定的語音識(shí)別任務(wù),若語音輸入的結(jié)束時(shí)刻為te ;車載語音識(shí)別系統(tǒng)的開始響應(yīng)時(shí)刻為tr 。則:響應(yīng)時(shí)間= tr-te縮略語下列縮略語適用于本標(biāo)準(zhǔn)。HATSHATS Head And Torso Simulator頭和軀干模擬器車載語音交互系統(tǒng)分類及表述概述車載語音交互系統(tǒng)根據(jù)基本屬性如應(yīng)用場(chǎng)景、詞匯量、應(yīng)用人群、工作模式、應(yīng)用環(huán)境等進(jìn)行分類。從用戶感受的角度觸發(fā),把車載語音交互系統(tǒng)當(dāng)作黑匣子,車載語音交互系統(tǒng)的性能指標(biāo)僅基于系統(tǒng)的應(yīng)用場(chǎng)景屬性提出?;趹?yīng)用場(chǎng)景的分類車載語音交互系統(tǒng)基于應(yīng)用場(chǎng)景可以分為:文字輸入類、聲音檢測(cè)

11、識(shí)別類和對(duì)話類三類系統(tǒng),或兼容三種應(yīng)用場(chǎng)景。文字輸入類以文字錄入為主要目的,要求把語音轉(zhuǎn)化成文字的系統(tǒng),如短消息功能。聲音檢測(cè)識(shí)別類是指根據(jù)用戶語音中發(fā)出的特定命令或者關(guān)鍵詞,完成特定操作和業(yè)務(wù)的應(yīng)用場(chǎng)景。如撥打電話、音樂命令控制等??谡Z對(duì)話類是指接受用戶以對(duì)話形式發(fā)出的自然的口頭語言,明白及理解用戶意圖及想要獲取的信息,并將以各種形式與用戶進(jìn)行反饋,以將對(duì)話繼續(xù)進(jìn)行的應(yīng)用。如地圖查詢,天氣查詢等。車載語音交互系統(tǒng)的結(jié)構(gòu)表述語意理解交互決策語音合成模塊模塊模塊圖1 車載語音交互系統(tǒng)結(jié)構(gòu)圖應(yīng)用模塊語音識(shí)別模塊語音預(yù)處理模塊語音交互系統(tǒng)可分為前端語音預(yù)處理模塊、語音識(shí)別模塊、語義理解模塊、交互決策

12、模塊和語音合成模塊。前端語音預(yù)處理模塊負(fù)責(zé)將語音輸入轉(zhuǎn)化為語音流,作為語音識(shí)別模塊的輸入。語音識(shí)別模塊負(fù)責(zé)將語音流轉(zhuǎn)換為人類可識(shí)別的文本信息直接輸出到相關(guān)的應(yīng)用模塊,或轉(zhuǎn)換為計(jì)算機(jī)可識(shí)別的字符串輸出到語義理解模塊。語義理解模塊負(fù)責(zé)對(duì)語音識(shí)別模塊的識(shí)別結(jié)果做語義解析。識(shí)別決策模塊負(fù)責(zé)根據(jù)語義理解模塊“理解的”的結(jié)果制定識(shí)別決策,并依此向相關(guān)應(yīng)用模塊下達(dá)控制指令及獲取反饋信息。語音合成模塊負(fù)責(zé)將識(shí)別決策模塊或應(yīng)用模塊提供的計(jì)算機(jī)可識(shí)別的文本信息轉(zhuǎn)換為語音信號(hào)輸出。某些子模塊可選擇在本地、云端或融合實(shí)現(xiàn)。車載語音交互系統(tǒng)的性能指標(biāo)要求概述車載語音交互系統(tǒng)的性能需滿足以下指標(biāo)要求,其中喚醒率和誤喚醒率

13、僅針對(duì)支持語音喚醒功能的車載語音交互系統(tǒng)。這些要求與系統(tǒng)的用途有關(guān),多用途的需求分別滿足多指標(biāo)的要求。系統(tǒng)給出的具體指標(biāo)應(yīng)明確在何種條件下成立。字準(zhǔn)確率字準(zhǔn)確率的性能指標(biāo)定義詳見 GB/T 21023 中 5.2.1 的內(nèi)容。該指標(biāo)用于評(píng)價(jià)車載語音交互系統(tǒng)輸出的人類可識(shí)別的文本信息的正確率。對(duì)于中文普通話車載語音交互系統(tǒng),該項(xiàng)指標(biāo)的評(píng)價(jià)分類如表 1 所示。表1 中文普通話感受效果分類識(shí)別率評(píng)價(jià)效果90%優(yōu)秀90%且70%可接受70%不可接受識(shí)別成功率若車載語音交互系統(tǒng)在既定的識(shí)別輪數(shù)內(nèi)完成了語音識(shí)別任務(wù),則此次語音識(shí)別成功。語音識(shí)別成功與否應(yīng)兼顧車載系統(tǒng)動(dòng)作的可靠性問題。若車載語音識(shí)別系統(tǒng)共進(jìn)

14、行了 R 次特定的語音識(shí)別任務(wù),其中 SR 次識(shí)別成功,F(xiàn)R 次識(shí)別出現(xiàn)誤操作(包括未在既定的識(shí)別輪數(shù)內(nèi)完成的識(shí)別、未完成識(shí)別前退出、識(shí)別無響應(yīng)和錯(cuò)誤識(shí)別)。則:識(shí)別成功率=SR/R100%; 誤操作率=FR/R100%; 識(shí)別成功率+誤操作率=1。該指標(biāo)用于評(píng)價(jià)車載語音交互系統(tǒng)對(duì)語音識(shí)別任務(wù)的正確響應(yīng)情況。對(duì)于中文普通話車載語音交互系統(tǒng),該項(xiàng)指標(biāo)的評(píng)價(jià)分類如表 1 所示。在如表 2 所述的測(cè)試環(huán)境下,具體要求如下:場(chǎng)景 1 的識(shí)別成功率應(yīng)80%;場(chǎng)景 2 的識(shí)別成功率應(yīng)75%;場(chǎng)景 3 的識(shí)別成功率應(yīng)70%。平均響應(yīng)時(shí)間該指標(biāo)用于評(píng)價(jià)車載語音交互系統(tǒng)對(duì)語音識(shí)別任務(wù)的響應(yīng)速度。離線車載語音交互

15、系統(tǒng)的平均響應(yīng)時(shí)間應(yīng)2s;在線車載語音交互系統(tǒng)的平均響應(yīng)時(shí)間應(yīng)3s。喚醒率若車載語音交互系統(tǒng)共進(jìn)行了W次喚醒,其中SW次成功喚醒。則: 喚醒率=SW/W100%。該指標(biāo)用于評(píng)價(jià)車載語音識(shí)別系統(tǒng)在疊加背景音樂的情況下,對(duì)語音喚醒操作的正確響應(yīng)情況。在表2所述的測(cè)試環(huán)境下疊加低檔背景音樂,場(chǎng)景1的喚醒率應(yīng)95%;場(chǎng)景2的喚醒率應(yīng)88%。誤喚醒率若車載語音交互系統(tǒng)在T小時(shí)內(nèi)出現(xiàn)FW次誤喚醒。則: 誤喚醒率=FW/T 次/小時(shí)。該指標(biāo)用于評(píng)價(jià)車載語音交互系統(tǒng)在疊加背景語音的情況下,對(duì)語音喚醒操作的錯(cuò)誤響應(yīng)情況。在表 2 所述的測(cè)試環(huán)境下疊加低檔背景音樂,誤喚醒率應(yīng)0.5 次/小時(shí)。車載語音交互系統(tǒng)測(cè)試

16、方法概述為保證車載語音交互系統(tǒng)測(cè)試的可重復(fù)性和性,應(yīng)采用基于車載語音識(shí)別系統(tǒng)測(cè)試標(biāo)準(zhǔn)庫的測(cè)試方法。語音識(shí)別標(biāo)準(zhǔn)庫的建立應(yīng)按照 GB/T 21023 中的要求進(jìn)行。車載語音識(shí)別系統(tǒng)測(cè)試標(biāo)準(zhǔn)庫應(yīng)同其開發(fā)庫獨(dú)立同分布。測(cè)試語料的設(shè)計(jì)與測(cè)試語音/環(huán)境噪聲的錄制應(yīng)保證與實(shí)際應(yīng)用場(chǎng)景的一致性。影響車載語音識(shí)別性能的因素包括不同用戶、語言種類、口音、發(fā)音、語速、詞匯量、語境、噪聲環(huán)境。測(cè)試時(shí)應(yīng)充分考慮車載語音交互系統(tǒng)的設(shè)計(jì)目標(biāo)和各因素下對(duì)性能指標(biāo)影響。測(cè)試語料設(shè)計(jì)車載語音交互系統(tǒng)測(cè)試語料設(shè)計(jì)原則應(yīng)符合語音識(shí)別系統(tǒng)輸入準(zhǔn)則:中文車載語音交互系統(tǒng)應(yīng)支持漢語通用語,從信息社會(huì)發(fā)展角度支持推廣普通話。語音輸入標(biāo)準(zhǔn)語

17、速為 180-300 字/min,時(shí)長一般不超過 30s,特殊情況下不超過 60s。發(fā)音單元的持續(xù)時(shí)間不應(yīng)小于 0.2s,發(fā)音單元間的間隔不超過 2s;停頓時(shí)間超過 2s,則認(rèn)為一次語音輸入結(jié)束。對(duì)于文本中的分漢字字符,包括數(shù)字、電話號(hào)碼、標(biāo)點(diǎn)符號(hào),其可參照 GB/T 21023-2007 附錄A 所定義的方法朗讀。測(cè)試語料應(yīng)從詞匯量覆蓋、開放業(yè)務(wù)覆蓋、音節(jié)覆蓋,以及常用性角度加以設(shè)計(jì),設(shè)計(jì)要求如下:對(duì)于命令詞識(shí)別車載語音識(shí)別系統(tǒng),測(cè)試語料應(yīng)覆蓋被測(cè)系統(tǒng)的所有詞匯。建議測(cè)試語料的規(guī)模不小于 200 句。對(duì)于連續(xù)語音識(shí)別車載語音識(shí)別系統(tǒng),測(cè)試語料應(yīng)盡量覆蓋被測(cè)系統(tǒng)的詞匯,對(duì)于每種開放業(yè)務(wù)從音節(jié)覆

18、蓋和常用性角度挑選典型語料。建議每種開放業(yè)務(wù)測(cè)試語料的規(guī)模為 500 句。測(cè)試語音/環(huán)境噪聲錄制測(cè)試語音/環(huán)境噪聲錄制要求如下:對(duì)于非特定人群車載語音識(shí)別系統(tǒng),特別強(qiáng)調(diào)對(duì)含有一定口音的漢語語音適應(yīng)能力和漢語聲調(diào)問題。測(cè)試語音至少應(yīng)由男女各 30 名以上的發(fā)音人錄制,用于語音喚醒功能的測(cè)試語音需要 50-100 名以上的發(fā)音人錄制。應(yīng)在符合系統(tǒng)對(duì)識(shí)別人群限制的條件下,盡量選擇具有代表性和統(tǒng)計(jì)分布規(guī)律的發(fā)音人,特別是應(yīng)考慮不同口音、不同的普通話等級(jí)、不同年齡、不同語速、不同教育背景、不同說話韻律等因素。對(duì)于命令詞識(shí)別車載語音識(shí)別系統(tǒng),應(yīng)盡量保證由各發(fā)音人分別錄制全部測(cè)試語料。對(duì)于連續(xù)語音識(shí)別車載語

19、音識(shí)別系統(tǒng),每組測(cè)試語料不應(yīng)超過 100 句, 盡量保證由不同的發(fā)音人錄制。測(cè)試語音可以是發(fā)音人的語音或通過高保真設(shè)備回放的測(cè)試語音。測(cè)試語音文件的錄制格式為.wav,純凈測(cè)試語音的錄制應(yīng)保證 44.1kHz 的采樣頻率和 16bit 的量化間隔,發(fā)音人和麥克風(fēng)間應(yīng)保持一定距離(如 15cm,避免風(fēng)噪的影響),并確保波形采樣范圍為 5000 10000smpl;錄制過程至少應(yīng)包括錄音、標(biāo)注和確認(rèn)三個(gè)步驟,以保證測(cè)試標(biāo)準(zhǔn)庫的正確性。錄制完成后需按測(cè)試語料完成測(cè)試語音文件的切分,進(jìn)入測(cè)試系統(tǒng)前需進(jìn)行語音處理,保證電平符合要求。背景噪聲的錄制在真車內(nèi)進(jìn)行,使用一個(gè)放置在靠近車載免提麥克風(fēng)處的測(cè)量傳聲

20、器來錄制背景噪聲,如果條件允許,也可以使用車載免提麥克風(fēng)來直接錄制。一般由測(cè)試實(shí)驗(yàn)室(與生產(chǎn)廠家)來共同決定使用背景噪聲的類型。環(huán)境噪聲文件的錄制格式為.wav,應(yīng)保證 44.1kHz 的采樣頻率和 16bit 的量化間隔,并記錄噪聲幅值,以便重放。環(huán)境噪聲應(yīng)考慮行車環(huán)境、車速、前車窗和空調(diào)的使用情況。典型的環(huán)境噪聲的錄制場(chǎng)景如表 2 所示。表2 典型的環(huán)境噪聲的場(chǎng)景場(chǎng)景編號(hào)行車環(huán)境車速車窗空調(diào)麥克風(fēng)處的環(huán)境噪聲聲壓級(jí)(僅供參考,以實(shí)際錄制結(jié)果為準(zhǔn))備注1安靜0km/h關(guān)關(guān)45-50dB(A)必選2鬧市40-60km/h關(guān)低檔50-65dB(A)必選3高速60-120km/h關(guān)中檔65-75d

21、B(A)必選4鬧市40-60km/h半開關(guān)65-75dB(A)可選5高速60-120km/h半開關(guān)70-85dB(A)可選基于語音標(biāo)準(zhǔn)庫的測(cè)試方法概況測(cè)試需要在可重復(fù)的、模擬真實(shí)場(chǎng)景下進(jìn)行。測(cè)試聲場(chǎng)景應(yīng)模擬行車使用環(huán)境,在真實(shí)汽車車殼或真實(shí)車輛內(nèi)進(jìn)行測(cè)試。推薦使用符合ITU-T P.581規(guī)定的HATS進(jìn)行聲音信號(hào)的重現(xiàn)與采集,使用前對(duì)HATS 進(jìn)行校準(zhǔn)和均衡。將語音標(biāo)準(zhǔn)庫中預(yù)先錄制好的語音輸入待測(cè)系統(tǒng),并統(tǒng)計(jì)系統(tǒng)輸出結(jié)果。車載系統(tǒng)的響應(yīng)可以錄像的方式記錄下來,作為測(cè)試結(jié)果之一。背景噪聲重放使用四個(gè)中音揚(yáng)聲器和一個(gè)低音揚(yáng)聲器組成的陣列來模擬行車噪聲場(chǎng)景,如圖2所示。使用揚(yáng)聲器陣列來重放放背景噪

22、聲時(shí),應(yīng)首先經(jīng)過均衡和校準(zhǔn),使得免提麥克風(fēng)位置處的聲功率譜密度和錄音信號(hào)一致。均衡既可以使用測(cè)量麥克風(fēng),也可以使用錄制背景噪聲時(shí)用過的車載免提麥克風(fēng)。比較錄音信號(hào)和模擬背景噪聲信號(hào),兩者的最大A計(jì)權(quán)聲壓級(jí)偏差應(yīng)不超過1dB,在100Hz10kHz頻率范圍內(nèi)的1/3 倍頻程功率譜密度偏差應(yīng)不超過3dB。為了使得揚(yáng)聲器、免提麥克風(fēng)和HATS的聲傳輸路徑間的干擾最小,應(yīng)仔細(xì)選擇揚(yáng)聲器的放置位置。低音揚(yáng)聲器放置在座位后面正中后備箱上面,后排兩個(gè)揚(yáng)聲器分別放置在后座靠枕與后窗玻璃之間靠近車殼的支架處,前面兩個(gè)揚(yáng)聲器分別放在儀表面板的上部兩邊。圖2 語音識(shí)別測(cè)量及背景噪聲重放設(shè)置車內(nèi)測(cè)試配置HATS 的放

23、置一般由廠家來指定HATS的放置位置(包括仿真嘴和仿真耳分別相對(duì)于麥克風(fēng)和揚(yáng)聲器的距離)。如沒有特別指定,測(cè)試時(shí)HATS應(yīng)放置在駕駛員的座位上,該具體位置應(yīng)和多數(shù)人的駕駛習(xí)慣位置一致,并且定義仿真嘴到麥克風(fēng)的距離。測(cè)試報(bào)告應(yīng)包含位置信息。為了保證每次車內(nèi)測(cè)試時(shí)HATS的位置相對(duì)固定,可以通過在車內(nèi)進(jìn)行標(biāo)注的方法來幫助定位(比如在車內(nèi)中標(biāo)出HATS相對(duì)于某一位置的距離,如左、右車門和車頂?shù)裙潭ㄎ矬w。注1:如有特殊測(cè)試要求,也可以放置在副駕駛位和乘客位。仿真嘴仿真嘴應(yīng)符合ITU-T P.58的規(guī)定,并依據(jù)ITU-T P.340在MRP處進(jìn)行均衡。在MRP校準(zhǔn)的聲壓級(jí)為-4.7dBPa。對(duì)于揚(yáng)聲式車

24、載免提終端,應(yīng)在HATS-HFRP(HATS 免提參考點(diǎn))處進(jìn)行聲壓校準(zhǔn),使得HATS-HFRP 處的平均聲壓級(jí)為-25.7 dBPa,此時(shí)MRP處的聲壓為發(fā)送方向源信號(hào)大小。以上過程的具體操作步驟見ITU-T P.581的相關(guān)部分。測(cè)試行車噪聲環(huán)境下時(shí),由于“倫巴效應(yīng)”,仿真嘴的輸出電平會(huì)增大。0I N 50for forN 5050 N 770.3 N8.0forN 77其中 I=仿真嘴輸出電平增大值N=靠近駕駛員頭部位置的長時(shí)A記權(quán)噪聲大小ITU-T P.340中規(guī)定,在免提裝置的發(fā)送測(cè)試中,0.3倍的語音電平增長應(yīng)單獨(dú)計(jì)算。仿真耳對(duì)于揚(yáng)聲免提終端,HATS左右耳的聲信號(hào)均被使用。HAT

25、S應(yīng)進(jìn)行自由場(chǎng)或擴(kuò)散場(chǎng)均衡,具體可參考ITU-T P.581。對(duì)于頭戴免提終端,使用的耳型和佩戴位置見ITU-T P.380。測(cè)試信號(hào)和電平測(cè)試可以使用提前錄制的真人語音信號(hào)。所有的測(cè)試信號(hào)電平都是指測(cè)試信號(hào)的激活語音電平(詳見ITU-T P.56)。語音識(shí)別測(cè)試在發(fā)送方向使用的是非限帶信號(hào)。測(cè)試信號(hào)的平均大小規(guī)定如下:發(fā)送方向(MRP):-4.7 dBPa(典型的講話平均聲壓級(jí),相當(dāng)于 HATS-HFRP 處聲壓級(jí)大小為-28.7 dBPa),這一水平適用于耳機(jī)的免提終端;發(fā)送方向(MRP):-1.7 dBPa 免提揚(yáng)聲器終端(典型的平均說話聲壓級(jí)) (相當(dāng)于 HATS-HFRP 處聲壓級(jí)大

26、小為-25.7 dBPa)。注:背景噪聲測(cè)試中要考慮“倫巴效應(yīng)”(由于高背景噪聲而增加說話者的說話聲壓級(jí))。測(cè)試步驟字準(zhǔn)確率人工頭按照 6.4.3.1 配置,背景噪聲系統(tǒng)按照 6.4.2 配置并均衡。測(cè)試信號(hào)為根據(jù) 6.2、6.3 錄制的語音信號(hào)。由人工嘴產(chǎn)生測(cè)試信號(hào)的頻譜在嘴參考點(diǎn)(MRP) 處在自由聲場(chǎng)的條件下進(jìn)行校準(zhǔn)。測(cè)試信號(hào)幅值見 6.4.3.4。同步播放測(cè)試信號(hào)和相應(yīng)背景噪聲場(chǎng)景。記錄字準(zhǔn)確率。注2:安靜情況下,不需播放背景噪聲。識(shí)別成功率人工頭按照 6.4.3.1 配置,背景噪聲系統(tǒng)按照 6.4.2 配置并均衡。測(cè)試信號(hào)為根據(jù) 6.2、6.3 錄制的語音信號(hào),即相應(yīng)命令詞語。由人工嘴產(chǎn)生測(cè)試信號(hào)的頻譜在嘴參考點(diǎn)(MRP)處

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論