



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、西南林學(xué)院 2009 屆本(專)科畢業(yè)生畢業(yè)論文(設(shè)計(jì))畢業(yè)實(shí)習(xí)計(jì)劃表(本表由指導(dǎo)教師填寫)論文(設(shè)計(jì))題目基于GMM的語(yǔ)者辨識(shí)系統(tǒng)的設(shè)計(jì)Speaker Identification using GMM類別科研 設(shè)計(jì) 調(diào)查 其它性質(zhì)自選題 計(jì)劃任務(wù) 橫向任務(wù) 其它指導(dǎo)教師呂丹桔職稱講 師學(xué) 號(hào)學(xué)生姓名主 要 完 成 工 作論文指導(dǎo)工作計(jì)劃:(包括以下7個(gè)部分:1. 目的意義。2. 簡(jiǎn)要內(nèi)容。3.重點(diǎn)解決的問題。4.預(yù)期結(jié)果或成果。5.所需軟件平臺(tái)或設(shè)備。6.時(shí)間進(jìn)度。7.要求學(xué)生的基礎(chǔ)。1、目的意義本課題擬采用人的語(yǔ)音特征進(jìn)行個(gè)人身份的辨識(shí)Speaker Identification(SI)。
2、采用語(yǔ)音識(shí)別方式與傳統(tǒng)方式(如證件、ATM卡等)和身份標(biāo)識(shí)知識(shí)(如用戶名和密碼)相比更具通用性(每個(gè)人都具有),獨(dú)特性(每個(gè)人都不一樣),恒定性(不隨時(shí)間變化而變化),可收集性(可定量測(cè)量),準(zhǔn)確性,高可采用性(易于授受)和低欺騙性。2、主要內(nèi)容本課題擬采用GMM(Gaussian Mixture Model)的方法實(shí)現(xiàn)簡(jiǎn)單的語(yǔ)者辨識(shí)(Speaker Identification)系統(tǒng)。其系統(tǒng)實(shí)現(xiàn)主要由兩個(gè)部分組成,即:訓(xùn)練階段(training)和識(shí)別階段(recognition)。訓(xùn)練階段(training)主要完成語(yǔ)音段的選取,以提取特征參數(shù),由于語(yǔ)音信號(hào)是十分復(fù)雜的非平穩(wěn)信號(hào),它不僅包
3、含語(yǔ)義信息,還有個(gè)人特征信息,因此特征參數(shù)應(yīng)能完全,準(zhǔn)確在表達(dá)語(yǔ)音信號(hào)所攜帶的全部信息。再完成特征參數(shù)選擇后將利用GMM技術(shù),在時(shí)間表上對(duì)其特征序列多次平均,形成每個(gè)說話人的參考模板,從而完成訓(xùn)練階段的任務(wù);識(shí)別階段(recognition)將針對(duì)語(yǔ)音信號(hào)進(jìn)行特征參數(shù)分析,計(jì)算與訓(xùn)練階段得出的參考模板的距離,進(jìn)行判決,從而實(shí)現(xiàn)對(duì)說話人的識(shí)別。3、重點(diǎn)解決的問題:Training:(1)完成對(duì)語(yǔ)音信號(hào)的采集,收集工作,建立語(yǔ)音庫(kù):選取一定數(shù)量的樣本信號(hào)。 (2)主要完成特征參數(shù)的提取,主要選取目前世界上最常采用的參數(shù):Mel Frequency Cepstrum Coefficient, MFC
4、C , 該參數(shù)考慮了人耳的聽覺特性,將頻譜轉(zhuǎn)化為基于Mel頻率的非線性頻譜。由于充分考慮了人的聽覺特性,而且沒有任何的前提假設(shè),MFCC參數(shù)具有良好的識(shí)別性能和抗噪聲能力。同時(shí)對(duì)其它參數(shù)如LPCC ,PLP也進(jìn)行一定的對(duì)比研究;對(duì)于計(jì)算機(jī)性能有一定的要求;(3)運(yùn)用數(shù)據(jù)聚類方法,完成對(duì)特征參數(shù)的變換,以求最佳參考模板。由于語(yǔ)音信號(hào)的復(fù)雜性在特定語(yǔ)音識(shí)別系統(tǒng)中要求把語(yǔ)音信號(hào)的某些特征突現(xiàn)出來,進(jìn)行分類。該SI系統(tǒng)主要采用線性判別分析(LDA)與主分量分析方法(PCA),實(shí)現(xiàn)對(duì)特征參數(shù)的抽取,建立說話人與文本無關(guān)(Text-Independent)的參考模板;對(duì)于計(jì)算機(jī)性能有一定的要求;(4)識(shí)別
5、模型的選擇高斯混合模型(GMM):多維概率密度函數(shù),在矢量聚類的基礎(chǔ)上,把每一類視為一個(gè)多維高斯分布函數(shù)。求出每一類的均值,協(xié)方差矩陣和出現(xiàn)的概率,將此作為每個(gè)人的訓(xùn)練模板;Recognition:(1)待識(shí)別人語(yǔ)音信號(hào)的提取:進(jìn)行8kHz采樣,每樣點(diǎn)8bit量化;(2)完成該信號(hào)特征參數(shù)的提取,與訓(xùn)練階段類似,在此不再重復(fù);(3)運(yùn)用識(shí)別模型進(jìn)行識(shí)別,判決;對(duì)于模型的選擇主要是:GMM與訓(xùn)練階段類似,在此不再重復(fù);4、預(yù)期結(jié)果:實(shí)現(xiàn)基于GMM的語(yǔ)者辨識(shí)系統(tǒng)(Speaker Identification System using GMM)Training:(1)完成語(yǔ)音信號(hào)的采集,建立語(yǔ)音庫(kù)(
6、2)完成特征參數(shù)MFCC的提?。?)采用Data Cluster 完成對(duì)MFCC的變換,建立訓(xùn)練模板(4)計(jì)算GMM識(shí)別模型Recognition:(1) 待識(shí)別人語(yǔ)音信號(hào)的采樣;(2) 完成該信號(hào)特征參數(shù)MFCC的提取;(3) 運(yùn)用GMM模型進(jìn)行識(shí)別,判決;(4) 統(tǒng)計(jì)識(shí)別率,進(jìn)行系統(tǒng)評(píng)定。5、所需軟件平臺(tái)或設(shè)備: 軟件平臺(tái): Matlab7.0 設(shè)備:能夠滿足開發(fā)需要的PC機(jī)。6、時(shí)間進(jìn)度2008.10.1511.15 學(xué)生選題2008.11.1612-31 學(xué)生收集論文相關(guān)資料,并指導(dǎo)學(xué)生撰寫開題報(bào)告2009.1.12008.3.10 熟練掌握Matlab語(yǔ)言的使用;信號(hào)的采集;系統(tǒng)預(yù)備
7、知識(shí)的準(zhǔn)備(數(shù)學(xué)概率論(Bayes),線性代數(shù)(矩陣變化),數(shù)字信號(hào)處理(付里葉變化),數(shù)據(jù)分類Data Cluster)2009.3.11 4.20 中期評(píng)估,系統(tǒng)實(shí)現(xiàn)2009. 4.215.15 學(xué)生整理資料,撰寫論文初稿2009 5.16答辯前 測(cè)試軟件,完善系統(tǒng),進(jìn)行論文修改與定稿7、要求學(xué)生基礎(chǔ):(1) 具有一定的模式識(shí)別與數(shù)據(jù)分類知識(shí)基礎(chǔ);(2) 了解信號(hào)與系統(tǒng)分析的知識(shí);(3) 掌握Matlab的運(yùn)用續(xù)表:畢業(yè)實(shí)習(xí)指導(dǎo)工作計(jì)劃:2008.10.1511.15 學(xué)生選題,確定論文方向2008.11.1612-31 指導(dǎo)學(xué)生收集課題相關(guān)資料,了解技術(shù)背景,特別是國(guó)內(nèi)研究現(xiàn)狀,確定系統(tǒng)解決方案,完成開題報(bào)告2009.1.108.3.10 參照課題需求,學(xué)習(xí)相關(guān)課題技術(shù)知識(shí),進(jìn)一步明確系統(tǒng)解決和實(shí)現(xiàn)方案,并完成系統(tǒng)總體方案設(shè)計(jì)和技術(shù)方案設(shè)計(jì),系統(tǒng)編程工作200
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 江蘇省泰州醫(yī)藥高新區(qū)六校聯(lián)考2025屆初三下學(xué)期9月月考語(yǔ)文試題試卷含解析
- 江蘇省泰州市泰興市西城2025年初三下學(xué)期第二次階段考試語(yǔ)文試題試卷含解析
- 湘贛粵名校2025年下學(xué)期第二次月考高三生物試題試卷含解析
- 肱骨外髁頸骨折的護(hù)理
- 2025年公共藝術(shù)設(shè)計(jì)專業(yè)畢業(yè)考試試題及答案
- 小兒流清鼻涕護(hù)理常規(guī)
- 中班數(shù)學(xué)《10以內(nèi)的點(diǎn)數(shù)》教學(xué)課件
- 消化內(nèi)科護(hù)理健康教育宣教
- 2025年中國(guó)木質(zhì)筆筒市場(chǎng)調(diào)查研究報(bào)告
- 2025年中國(guó)無磁鉆鋌市場(chǎng)調(diào)查研究報(bào)告
- 有限空間作業(yè)氣體檢測(cè)記錄表
- 2024至2030年中國(guó)汽車鋁輪轂行業(yè)市場(chǎng)現(xiàn)狀調(diào)研與發(fā)展趨勢(shì)分析報(bào)告
- 八年級(jí)語(yǔ)文上冊(cè) 第一單元 第3課《鄉(xiāng)愁 余光中》教案 冀教版
- 2024中考英語(yǔ)必考1600詞匯分類速記表
- 江蘇泰州市泰興經(jīng)濟(jì)開發(fā)區(qū)國(guó)有企業(yè)招聘筆試題庫(kù)2024
- 2024年風(fēng)力發(fā)電運(yùn)維值班員(技師)技能鑒定考試題庫(kù)-下(判斷題)
- DL∕T 1709.3-2017 智能電網(wǎng)調(diào)度控制系統(tǒng)技術(shù)規(guī)范 第3部分:基礎(chǔ)平臺(tái)
- 考核辦法和考核方案
- 化妝品生產(chǎn)OEM合同書
- 海上CANTITRAVEL平臺(tái)樁基施工關(guān)鍵技術(shù)應(yīng)用v7
- 有色金屬冶金概論課程教案
評(píng)論
0/150
提交評(píng)論