版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 具體參見 P170 圖 11-1 § 11.8 語音編碼的性能指標(biāo)和質(zhì)量評(píng)價(jià) 一、語音編碼的基本性能指標(biāo)包括編碼速率和頑健性。 編碼速率:又稱比特率,是指一個(gè)編碼器的信息速率。 頑健性:通過取多種不同來源的語音信號(hào)進(jìn)行編碼解碼,并對(duì)輸出語音質(zhì)量進(jìn)行比 較測(cè)試得到的一種指標(biāo)。 二、編碼器的質(zhì)量評(píng)價(jià)方法,包括主觀評(píng)價(jià)法和客觀評(píng)價(jià)法。 客觀評(píng)價(jià)準(zhǔn)則:信噪比和譜失真測(cè)度。 主觀評(píng)價(jià)準(zhǔn)則:通過人的感覺器官來測(cè)試。 三、可懂度與自然度 語音編碼后,其再生語音質(zhì)量包括可懂度和自然度。 可懂度:是衡量語音中的字、單詞和句的可懂程度,反映了對(duì)語音輸出內(nèi)容的識(shí)別 程度。 自然度:指語音聽起來有多自然,
2、聽起來像是機(jī)器發(fā)出的,不能辨認(rèn)出說話人是誰。 四、常用的幾種語音主觀評(píng)價(jià)標(biāo)準(zhǔn)包括:平均評(píng)價(jià)測(cè)試法 MOS、押韻測(cè)試 DRT 和可接受程 度測(cè)試 DAM。 不同編碼對(duì)應(yīng)的 MOS 值 1、 64kbit/s PCM 4.2 2、 32kbit/s ADPCM4.0 3、 4.8kbit/s CELP 3.2 4、 2.4kbit/s LPC 聲碼器2.2 § 12.1 概述 一、語音合成的概念 26 由人工制作出來的語音稱為語音合成,即由機(jī)器產(chǎn)生出聲音,它是人機(jī)語聲通信的 重要組成部分。 二、用語音合成來傳遞語言的優(yōu)點(diǎn) 1、不用特別注意和專門訓(xùn)練,任何人都可以理解。 2、可以直接使用電
3、話網(wǎng)和電話機(jī)。 3、無需消耗紙張等資源 三、語音合成技術(shù)的兩個(gè)關(guān)鍵性能 一是正確,一是自然。 § 12.2 語音合成原理 一、語音合成的三個(gè)基本方法 1、語音合成的三種基本方法:波形合成法、參數(shù)合成法和規(guī)則合成法。 2、波形合成法、參數(shù)合成法和規(guī)則合成法的概念 (1)波形合成法:把人發(fā)音的語音波形直接存儲(chǔ)或者進(jìn)行波形編碼后存儲(chǔ),根據(jù)需 要編輯組合輸出。 ( 2)參數(shù)合成法:也稱分析-合成法,采用聲碼器技術(shù),是一種比較復(fù)雜的方法。 ( 3)規(guī)則合成法:通過語音學(xué)規(guī)則產(chǎn)生語音。 3、波形合成法、參數(shù)合成法和規(guī)則合成法三者在波形、特征參數(shù)、語言的符號(hào)組合 方面的比較 具體參見表 12-1
4、Ch13 語音識(shí)別 § 13.1 概述 一、語音識(shí)別的概念 語音識(shí)別是語音鏈中的一環(huán),它是研究使機(jī)器能準(zhǔn)確地聽出人的語音內(nèi)容的問題, 27 即準(zhǔn)確地識(shí)別所說的話。 二、用語音識(shí)別的優(yōu)點(diǎn) 1、語音是人們最自然、最方便的交互工具,不需要作專門訓(xùn)練; 2、操作簡(jiǎn)單,使用方便; 3、語音的反應(yīng)速度快; 4、同時(shí)利用手、腳等,在進(jìn)行其他工作的同時(shí)兼顧周圍動(dòng)作來輸入信息; 5、在輸入終端可使用麥克風(fēng)等,非常經(jīng)濟(jì),可直接利用電話網(wǎng)遙控輸入信息。 三、語音識(shí)別的 7 種分類方法 1、從所要識(shí)別的單位來分:孤立單詞語音識(shí)別、選詞語音識(shí)別、連續(xù)語音識(shí)別、語 音理解。 2、從識(shí)別的用詞量來分:小詞匯(10
5、-50 個(gè)) 、中詞匯(50-200 個(gè)) 、大詞匯(200 個(gè)以上) 。 3、從講話人的范圍來分:?jiǎn)蝹€(gè)特定講話人、多講話人、與講話者無關(guān)。 4、從識(shí)別的方法分:模板匹配法、隨機(jī)模型法、概率語法分析法。 (1)模板匹配法:將測(cè)試語音與模板的參數(shù)一一進(jìn)行比較與匹配,判決的依據(jù)是失 真測(cè)度最小準(zhǔn)則。 (2)隨機(jī)模型法:一種是用 HMM 的概率參數(shù)來對(duì)似然函數(shù)進(jìn)行估計(jì)與判決,從而得 到識(shí)別結(jié)果的方法。 (3)概率語法分析法:利用連續(xù)語言中的形式語法約束的知識(shí)來對(duì)似然函數(shù)進(jìn)行估 計(jì)和判決。 5、從識(shí)別的環(huán)境分:隔音室、計(jì)算機(jī)房、公共場(chǎng)合。 6、從傳輸系統(tǒng)分:高質(zhì)量話筒、電話、近講話筒。 7、從說話人的類型分:男聲、女聲、兒童聲。 28 § 13.2 語音識(shí)別原理 一、根據(jù)比較輸入模式與標(biāo)準(zhǔn)模式方法不同,模式識(shí)別被分為模式匹配法、統(tǒng)計(jì)模式識(shí) 別和句法模式
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 創(chuàng)作之旅:藝術(shù)與實(shí)踐
- 農(nóng)村地區(qū)流動(dòng)兒童、留守兒童和其他兒童教育機(jī)會(huì)比較研究
- 二零二五年度快遞行業(yè)服務(wù)質(zhì)量提升合作協(xié)議2篇
- “雙減”政策背景下教師工作負(fù)擔(dān)的風(fēng)險(xiǎn)分析及其化解
- 二零二五年度房地產(chǎn)項(xiàng)目招投標(biāo)顧問合同3篇
- 全國(guó)川教版信息技術(shù)七年級(jí)上冊(cè)第13課《個(gè)性化的桌面設(shè)置》說課稿
- 北京市昌平區(qū)2024-2025學(xué)年高二上學(xué)期期末考試地理試卷(含答案)
- 湖北省鄂州市(2024年-2025年小學(xué)六年級(jí)語文)統(tǒng)編版摸底考試((上下)學(xué)期)試卷及答案
- 泵車知識(shí)培訓(xùn)課件視頻
- 貴州盛華職業(yè)學(xué)院《傳熱學(xué)B》2023-2024學(xué)年第一學(xué)期期末試卷
- 《上海理工大學(xué)》課件
- 中職班主任培訓(xùn)
- 春節(jié)期間安全施工措施
- 建筑工地春節(jié)期間安全保障措施
- 2024-2030年中國(guó)觸摸顯示器商業(yè)計(jì)劃書
- 三只松鼠深度分析報(bào)告
- 公共關(guān)系理論與實(shí)務(wù)教程 課件 項(xiàng)目九-公共關(guān)系危機(jī)管理
- 《商務(wù)溝通-策略、方法與案例》課件 第一章 商務(wù)溝通概論
- 礦山安全生產(chǎn)法律法規(guī)
- 大創(chuàng)賽項(xiàng)目書
- 2024年江蘇省學(xué)業(yè)水平合格性考試全真模擬語文試題(解析版)
評(píng)論
0/150
提交評(píng)論