


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、語音識別論文(語音識別技術(shù)論文):噪聲環(huán)境下漢語連續(xù)語音識別技術(shù)研究 【摘要】: 語音識別已經(jīng)有了半個多世紀的研究歷史,取得了很大的進展。當(dāng)前的語音識別系統(tǒng)在純凈語音環(huán)境中已經(jīng)獲得了非常高的識別精度,但在現(xiàn)實應(yīng)用中,無處不在的噪聲使得系統(tǒng)的識別性能大幅度降低,抗噪聲問題是語音識別系統(tǒng)實用化的關(guān)鍵問題之一。 本文主要研究加性噪聲環(huán)境下的漢語連續(xù)語音識別技術(shù)。首先介紹了語音識別的基本原理、語音識別系統(tǒng)的組成及其關(guān)鍵技術(shù),隨后介紹了噪聲的分類和各種抗噪聲技術(shù),在此基礎(chǔ)上本文的主要工作有: 1)在個人電腦平臺上實現(xiàn)了一個中等詞匯量、非特定人的漢語連續(xù)語音識別系統(tǒng)。系統(tǒng)采用帶調(diào)音節(jié)作為識別基元
2、,Mel頻標倒譜系數(shù)作為特征參數(shù)、隱馬爾可夫模型作為識別模型,并對其進行實驗,分析系統(tǒng)的性能。 2)在漢語連續(xù)語音識別中,準確檢測出音節(jié)的始點和終點是很重要的一步?,F(xiàn)有的漢語連續(xù)語音端點檢測方法在純凈語音環(huán)境下檢測準確率很高,但在噪聲環(huán)境下準確率大幅度降低。本文根據(jù)漢語連續(xù)語音的特點以及噪聲的特性,提出了基于元音檢測的漢語連續(xù)語音端點檢測方法,有效提高了噪聲環(huán)境下端點檢測的準確率。 3)語音識別系統(tǒng)處理的對象是特征參數(shù),特征參數(shù)的抗噪性能對系統(tǒng)的抗噪性能影響很大。本文在分析傳統(tǒng)Mel頻標倒譜系數(shù)提取過程的基礎(chǔ)上,結(jié)合小波包分析和濾波器加權(quán)分析,提出了一種新的特征參數(shù)提取方法。實驗結(jié)果表明:改進
3、后的特征參數(shù)比傳統(tǒng)Mel頻標倒譜系數(shù)具有更高的識別率和更好的抗噪性能。【關(guān)鍵詞】:漢語連續(xù)語音識別 端點檢測 特征提取 隱馬爾可夫模型 抗噪 【學(xué)位授予單位】:西北大學(xué)【學(xué)位級別】:碩士【學(xué)位授予年份】:2010【作者】:王艷【索取該碩士論文全文(WORD文檔)】博碩教育網(wǎng)客服Q Q: 138113721 139938848【著作權(quán)益說明】本站僅為中國學(xué)術(shù)文獻總庫的合作代理商,作者如有異議請直接與總庫聯(lián)系【目錄】: · 摘要3-4· Abstract4-8· 第一章 緒論8-14· 1.1 語音識別簡介8-10· 1.1.1 語音識別技術(shù)概述8
4、-9· 1.1.2 國內(nèi)外語音識別技術(shù)研究與發(fā)展9-10· 1.2 噪聲環(huán)境下連續(xù)語音識別的意義10-11· 1.2.1 連續(xù)語音識別的意義10· 1.2.2 抗噪技術(shù)在語音識別中的意義10-11· 1.3 本文主要工作及創(chuàng)新11· 1.4 本文章節(jié)安排11-14· 第二章 語音識別系統(tǒng)構(gòu)成14-34· 2.1 語音識別基本原理14-15· 2.2 語音預(yù)處理15-18· 2.2.1 預(yù)濾波與數(shù)字化15· 2.2.2 預(yù)加重15· 2.2.3 加窗分幀15-16·
5、2.2.4 端點檢測16-18· 2.3 語音特征提取18-22· 2.3.1 線性預(yù)測倒譜系數(shù)19-21· 2.3.2 Mel頻標倒譜系數(shù)21-22· 2.4 識別模型22-23· 2.4.1 動態(tài)時間規(guī)整22-23· 2.4.2 人工神經(jīng)網(wǎng)絡(luò)23· 2.5 隱馬爾可夫模型23-32· 2.5.1 馬爾可夫鏈23-24· 2.5.2 隱馬爾可夫模型的定義24-25· 2.5.3 HMM的三個基本問題25· 2.5.4 HMM三個基本問題的解決方法25-29· 2.5.5 H
6、MM模型分類29-32· 2.6 小結(jié)32-34· 第三章 語音抗噪技術(shù)簡介34-42· 3.1 噪聲分類34-35· 3.1.1 加性噪聲與乘性噪聲34· 3.1.2 平穩(wěn)噪聲與時變噪聲34-35· 3.1.3 全頻帶噪聲與窄帶噪聲35· 3.2 噪聲對連續(xù)語音識別的影響35-36· 3.3 各種抗噪技術(shù)36-41· 3.3.1 抗噪聲語音增強技術(shù)36-39· 3.3.2 抗噪型語音特征提取技術(shù)39-40· 3.3.3 噪聲環(huán)境下的模型補償技術(shù)40-41· 3.4 小結(jié)41
7、-42· 第四章 噪聲環(huán)境下端點檢測技術(shù)研究42-48· 4.1 基于元音檢測的端點檢測方法42-47· 4.1.1 語音段檢測42-44· 4.1.2 元音段檢測44-45· 4.1.3 音節(jié)拆分45-46· 4.1.4 端點檢測的流程46-47· 4.2 實驗與結(jié)果分析47· 4.3 小結(jié)47-48· 第五章 噪聲環(huán)境下特征提取方法研究48-54· 5.1 小波包分析及Mel濾波器組加權(quán)分析思想48-49· 5.1.1 小波包分析48-49· 5.1.2 Mel濾波器組加
8、權(quán)分析思想49· 5.2 特征參數(shù)提取過程49-51· 5.2.1 傳統(tǒng)的MFCC提取過程49-50· 5.2.2 基于小波包分析及WFBA的MFCC參數(shù)提取過程50-51· 5.3 實驗結(jié)果及其分析51· 5.4 小結(jié)51-54· 第六章 實驗及結(jié)果分析54-60· 6.1 軟硬件環(huán)境54· 6.2 語音庫的建立54· 6.3 聲學(xué)模型54-55· 6.3.1 語音識別基元54-55· 6.3.2 特征參數(shù)55· 6.3.3 模型選取55· 6.4 語言模型55-56· 6.5 系統(tǒng)實現(xiàn)56-58· 6.6 實驗及分析58-59
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 叉車租賃服務(wù)及設(shè)備定期檢查協(xié)議
- 新能源車輛抵押融資合作協(xié)議
- 場項目投標失利后的競爭對手情報收集與應(yīng)對合同
- 2025年導(dǎo)游資格證考試筆試模擬試卷:全面解析歷史文化景點試題
- 車輛質(zhì)押貸款及租賃服務(wù)協(xié)議
- 財務(wù)報表編制保密及使用規(guī)范合同
- 時尚購物中心門面租賃及品牌引進合同
- 柴油銷售企業(yè)加盟合作協(xié)議
- 互聯(lián)網(wǎng)企業(yè)財務(wù)代理與數(shù)據(jù)安全合同
- 采購合同風(fēng)險控制與風(fēng)險應(yīng)對指南
- 鉆越保阜高速公路施工方案
- GMS基礎(chǔ)知識的教案
- 第5章 鋼梁計算原理
- 西南科技大學(xué)機械原理期末考試復(fù)習(xí)題及答案
- 讀后續(xù)寫:騎馬迷路 遇困難不放棄 課件 【知識建構(gòu)+點播拓展】高考英語作文備考
- 2023年宜興市云湖茶禪文旅發(fā)展有限公司招聘筆試題庫及答案解析
- Unit2Reading2知識點課件-高中英語牛津譯林版(2020)選擇性必修第一冊
- 交通協(xié)管員勞務(wù)外包服務(wù)方案
- 頂管工程頂進記錄表
- 呼吸道病原體抗體檢測及臨床應(yīng)用課件
- 戰(zhàn)略管理教學(xué)ppt課件(完整版)
評論
0/150
提交評論