語音識別論文(語音識別技術(shù)論文)噪聲環(huán)境下漢語連續(xù)語音識別技術(shù)研究_第1頁
語音識別論文(語音識別技術(shù)論文)噪聲環(huán)境下漢語連續(xù)語音識別技術(shù)研究_第2頁
語音識別論文(語音識別技術(shù)論文)噪聲環(huán)境下漢語連續(xù)語音識別技術(shù)研究_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、語音識別論文(語音識別技術(shù)論文):噪聲環(huán)境下漢語連續(xù)語音識別技術(shù)研究 【摘要】: 語音識別已經(jīng)有了半個多世紀的研究歷史,取得了很大的進展。當(dāng)前的語音識別系統(tǒng)在純凈語音環(huán)境中已經(jīng)獲得了非常高的識別精度,但在現(xiàn)實應(yīng)用中,無處不在的噪聲使得系統(tǒng)的識別性能大幅度降低,抗噪聲問題是語音識別系統(tǒng)實用化的關(guān)鍵問題之一。 本文主要研究加性噪聲環(huán)境下的漢語連續(xù)語音識別技術(shù)。首先介紹了語音識別的基本原理、語音識別系統(tǒng)的組成及其關(guān)鍵技術(shù),隨后介紹了噪聲的分類和各種抗噪聲技術(shù),在此基礎(chǔ)上本文的主要工作有: 1)在個人電腦平臺上實現(xiàn)了一個中等詞匯量、非特定人的漢語連續(xù)語音識別系統(tǒng)。系統(tǒng)采用帶調(diào)音節(jié)作為識別基元

2、,Mel頻標倒譜系數(shù)作為特征參數(shù)、隱馬爾可夫模型作為識別模型,并對其進行實驗,分析系統(tǒng)的性能。 2)在漢語連續(xù)語音識別中,準確檢測出音節(jié)的始點和終點是很重要的一步?,F(xiàn)有的漢語連續(xù)語音端點檢測方法在純凈語音環(huán)境下檢測準確率很高,但在噪聲環(huán)境下準確率大幅度降低。本文根據(jù)漢語連續(xù)語音的特點以及噪聲的特性,提出了基于元音檢測的漢語連續(xù)語音端點檢測方法,有效提高了噪聲環(huán)境下端點檢測的準確率。 3)語音識別系統(tǒng)處理的對象是特征參數(shù),特征參數(shù)的抗噪性能對系統(tǒng)的抗噪性能影響很大。本文在分析傳統(tǒng)Mel頻標倒譜系數(shù)提取過程的基礎(chǔ)上,結(jié)合小波包分析和濾波器加權(quán)分析,提出了一種新的特征參數(shù)提取方法。實驗結(jié)果表明:改進

3、后的特征參數(shù)比傳統(tǒng)Mel頻標倒譜系數(shù)具有更高的識別率和更好的抗噪性能。【關(guān)鍵詞】:漢語連續(xù)語音識別 端點檢測 特征提取 隱馬爾可夫模型 抗噪 【學(xué)位授予單位】:西北大學(xué)【學(xué)位級別】:碩士【學(xué)位授予年份】:2010【作者】:王艷【索取該碩士論文全文(WORD文檔)】博碩教育網(wǎng)客服Q Q: 138113721 139938848【著作權(quán)益說明】本站僅為中國學(xué)術(shù)文獻總庫的合作代理商,作者如有異議請直接與總庫聯(lián)系【目錄】: · 摘要3-4· Abstract4-8· 第一章 緒論8-14· 1.1 語音識別簡介8-10· 1.1.1 語音識別技術(shù)概述8

4、-9· 1.1.2 國內(nèi)外語音識別技術(shù)研究與發(fā)展9-10· 1.2 噪聲環(huán)境下連續(xù)語音識別的意義10-11· 1.2.1 連續(xù)語音識別的意義10· 1.2.2 抗噪技術(shù)在語音識別中的意義10-11· 1.3 本文主要工作及創(chuàng)新11· 1.4 本文章節(jié)安排11-14· 第二章 語音識別系統(tǒng)構(gòu)成14-34· 2.1 語音識別基本原理14-15· 2.2 語音預(yù)處理15-18· 2.2.1 預(yù)濾波與數(shù)字化15· 2.2.2 預(yù)加重15· 2.2.3 加窗分幀15-16·

5、2.2.4 端點檢測16-18· 2.3 語音特征提取18-22· 2.3.1 線性預(yù)測倒譜系數(shù)19-21· 2.3.2 Mel頻標倒譜系數(shù)21-22· 2.4 識別模型22-23· 2.4.1 動態(tài)時間規(guī)整22-23· 2.4.2 人工神經(jīng)網(wǎng)絡(luò)23· 2.5 隱馬爾可夫模型23-32· 2.5.1 馬爾可夫鏈23-24· 2.5.2 隱馬爾可夫模型的定義24-25· 2.5.3 HMM的三個基本問題25· 2.5.4 HMM三個基本問題的解決方法25-29· 2.5.5 H

6、MM模型分類29-32· 2.6 小結(jié)32-34· 第三章 語音抗噪技術(shù)簡介34-42· 3.1 噪聲分類34-35· 3.1.1 加性噪聲與乘性噪聲34· 3.1.2 平穩(wěn)噪聲與時變噪聲34-35· 3.1.3 全頻帶噪聲與窄帶噪聲35· 3.2 噪聲對連續(xù)語音識別的影響35-36· 3.3 各種抗噪技術(shù)36-41· 3.3.1 抗噪聲語音增強技術(shù)36-39· 3.3.2 抗噪型語音特征提取技術(shù)39-40· 3.3.3 噪聲環(huán)境下的模型補償技術(shù)40-41· 3.4 小結(jié)41

7、-42· 第四章 噪聲環(huán)境下端點檢測技術(shù)研究42-48· 4.1 基于元音檢測的端點檢測方法42-47· 4.1.1 語音段檢測42-44· 4.1.2 元音段檢測44-45· 4.1.3 音節(jié)拆分45-46· 4.1.4 端點檢測的流程46-47· 4.2 實驗與結(jié)果分析47· 4.3 小結(jié)47-48· 第五章 噪聲環(huán)境下特征提取方法研究48-54· 5.1 小波包分析及Mel濾波器組加權(quán)分析思想48-49· 5.1.1 小波包分析48-49· 5.1.2 Mel濾波器組加

8、權(quán)分析思想49· 5.2 特征參數(shù)提取過程49-51· 5.2.1 傳統(tǒng)的MFCC提取過程49-50· 5.2.2 基于小波包分析及WFBA的MFCC參數(shù)提取過程50-51· 5.3 實驗結(jié)果及其分析51· 5.4 小結(jié)51-54· 第六章 實驗及結(jié)果分析54-60· 6.1 軟硬件環(huán)境54· 6.2 語音庫的建立54· 6.3 聲學(xué)模型54-55· 6.3.1 語音識別基元54-55· 6.3.2 特征參數(shù)55· 6.3.3 模型選取55· 6.4 語言模型55-56· 6.5 系統(tǒng)實現(xiàn)56-58· 6.6 實驗及分析58-59

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論