![數(shù)字信號(hào)處理課程設(shè)計(jì)基于聲音的說話人身份識(shí)別技術(shù)研究_第1頁](http://file4.renrendoc.com/view/7983106d6f277123e1ea42f4289ea56b/7983106d6f277123e1ea42f4289ea56b1.gif)
![數(shù)字信號(hào)處理課程設(shè)計(jì)基于聲音的說話人身份識(shí)別技術(shù)研究_第2頁](http://file4.renrendoc.com/view/7983106d6f277123e1ea42f4289ea56b/7983106d6f277123e1ea42f4289ea56b2.gif)
![數(shù)字信號(hào)處理課程設(shè)計(jì)基于聲音的說話人身份識(shí)別技術(shù)研究_第3頁](http://file4.renrendoc.com/view/7983106d6f277123e1ea42f4289ea56b/7983106d6f277123e1ea42f4289ea56b3.gif)
![數(shù)字信號(hào)處理課程設(shè)計(jì)基于聲音的說話人身份識(shí)別技術(shù)研究_第4頁](http://file4.renrendoc.com/view/7983106d6f277123e1ea42f4289ea56b/7983106d6f277123e1ea42f4289ea56b4.gif)
![數(shù)字信號(hào)處理課程設(shè)計(jì)基于聲音的說話人身份識(shí)別技術(shù)研究_第5頁](http://file4.renrendoc.com/view/7983106d6f277123e1ea42f4289ea56b/7983106d6f277123e1ea42f4289ea56b5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、數(shù) 字 信 號(hào) 處 理課程設(shè)計(jì)報(bào)告題目: 基于聲音的說話人身份識(shí)別技術(shù)研究 學(xué)院: 信 息 工 程 學(xué) 院 專業(yè): 通 信 工 程 指導(dǎo)教師: 指導(dǎo)時(shí)間: 2014.12 目錄 TOC o 1-3 h z u HYPERLINK l _Toc407745533 1、背景 PAGEREF _Toc407745533 h - 4 - HYPERLINK l _Toc407745534 2、設(shè)計(jì)目的 PAGEREF _Toc407745534 h - 4 - HYPERLINK l _Toc407745535 3、設(shè)計(jì)原理 PAGEREF _Toc407745535 h - 5 - HYPERLIN
2、K l _Toc407745536 3.1 語音識(shí)別技術(shù)的分類 PAGEREF _Toc407745536 h - 5 - HYPERLINK l _Toc407745537 3.2 Mel頻率倒譜系數(shù) PAGEREF _Toc407745537 h - 6 - HYPERLINK l _Toc407745538 3.2.1 Mel頻率倒譜系數(shù)基本原理 PAGEREF _Toc407745538 h - 6 - HYPERLINK l _Toc407745539 3.2.2 MFCC的提取流程 PAGEREF _Toc407745539 h - 7 - HYPERLINK l _Toc4077
3、45540 3.3 矢量量化 PAGEREF _Toc407745540 h - 9 - HYPERLINK l _Toc407745541 3.3.1 矢量量化的簡單介紹 PAGEREF _Toc407745541 h - 9 - HYPERLINK l _Toc407745542 3.3.2 矢量量化的定義 PAGEREF _Toc407745542 h - 9 - HYPERLINK l _Toc407745543 3.3.3 矢量量化的基本原理 PAGEREF _Toc407745543 h - 10 - HYPERLINK l _Toc407745544 3.4 矢量量化的失真測(cè)度
4、PAGEREF _Toc407745544 h - 11 - HYPERLINK l _Toc407745545 3.4.1 歐氏距離-均方誤差 PAGEREF _Toc407745545 h - 11 - HYPERLINK l _Toc407745546 3.5 識(shí)別失真度 PAGEREF _Toc407745546 h - 12 - HYPERLINK l _Toc407745547 4、設(shè)計(jì)過程 PAGEREF _Toc407745547 h - 13 - HYPERLINK l _Toc407745548 、實(shí)驗(yàn)技術(shù)路線圖 PAGEREF _Toc407745548 h - 13 -
5、 HYPERLINK l _Toc407745549 、實(shí)驗(yàn)結(jié)果測(cè)試圖 PAGEREF _Toc407745549 h - 14 - HYPERLINK l _Toc407745550 5、實(shí)驗(yàn)代碼與結(jié)果分析 PAGEREF _Toc407745550 h - 15 - HYPERLINK l _Toc407745551 、MATLAB源程序 PAGEREF _Toc407745551 h - 15 - HYPERLINK l _Toc407745552 GUI界面: PAGEREF _Toc407745552 h - 15 - HYPERLINK l _Toc407745553 測(cè)試程序 P
6、AGEREF _Toc407745553 h - 17 - HYPERLINK l _Toc407745554 Mel倒頻譜系數(shù)函數(shù) PAGEREF _Toc407745554 h - 18 - HYPERLINK l _Toc407745555 庫函數(shù) PAGEREF _Toc407745555 h - 19 - HYPERLINK l _Toc407745556 濾波程序 PAGEREF _Toc407745556 h - 20 - HYPERLINK l _Toc407745557 錄音程序 PAGEREF _Toc407745557 h - 20 - HYPERLINK l _Toc4
7、07745558 、實(shí)驗(yàn)結(jié)果分析 PAGEREF _Toc407745558 h - 21 - HYPERLINK l _Toc407745559 6、實(shí)驗(yàn)體會(huì)和總結(jié) PAGEREF _Toc407745559 h - 22 - HYPERLINK l _Toc407745560 7、文獻(xiàn) PAGEREF _Toc407745560 h - 23 -1、背景 隨著信息化的迅速發(fā)展,人們對(duì)身份識(shí)別技術(shù)的需求越來越多,并對(duì)其安全性和可靠性的要求也越來越高?;趥鹘y(tǒng)密碼認(rèn)證的身份識(shí)別技術(shù)在實(shí)際信息網(wǎng)絡(luò)應(yīng)用中已經(jīng)暴露出許多不足之處,而基于生物特征辨別的身份識(shí)別技術(shù)近年來也日益成熟并在實(shí)際應(yīng)用中展現(xiàn)出極
8、大的優(yōu)越性。作為生物特征認(rèn)證的一個(gè)重要分支,語音識(shí)別同指紋識(shí)別、人臉識(shí)別、虹膜識(shí)別一樣,一直以來都是研究者們關(guān)注和探索的熱點(diǎn)之一。 語音識(shí)別技術(shù)也成為了近年的研究熱點(diǎn),有不少實(shí)用化的技術(shù)成果被商家成功推向了市場(chǎng),讓人們看到了它在PDA、智能家電、工業(yè)控制等領(lǐng)域的廣闊發(fā)展前景。例如現(xiàn)在國內(nèi)在語音方面做的最好的就是科大訊飛股份,科大訊飛作為中國最大的智能語音技術(shù)提供商,在智能語音技術(shù)領(lǐng)域有著長期的研究積累,并在語音合成、語音識(shí)別、口語評(píng)測(cè)、自然語言處理等多項(xiàng)技術(shù)上擁有國際領(lǐng)先的成果。語音識(shí)別技術(shù)有很大可能產(chǎn)生新的服務(wù),給人們的工作和生活帶來非??捎^的方便。 我國語音識(shí)別研究工作起步于五十年代。近年
9、來國內(nèi)研究水平也從實(shí)驗(yàn)室逐步走向?qū)嵱?。我國語音識(shí)別技術(shù)的研究水平已經(jīng)基本上與國外同步,在漢語語音識(shí)別技術(shù)上還有自己的特點(diǎn)與優(yōu)勢(shì),并達(dá)到國際先進(jìn)水平。2、設(shè)計(jì)目的 每個(gè)人都有自己特有的發(fā)音器官和特有的說話習(xí)慣,這些差異都式反映在說話人語音信號(hào)的波形中,且比較復(fù)雜,使得每個(gè)人的發(fā)音都伴有濃重的個(gè)人色彩,這是說話人識(shí)別得以實(shí)現(xiàn)的客觀保證。說話入識(shí)別涉及到人的發(fā)音器官、說話習(xí)慣、語言構(gòu)造和發(fā)聲原理等多方面的內(nèi)容,它綜合了生理學(xué)、語音學(xué)、數(shù)字信號(hào)處理、模式識(shí)別、人工智能等學(xué)科知識(shí),有著廣闊的市場(chǎng)應(yīng)用前景。通過說話人識(shí)別技術(shù),可以實(shí)現(xiàn)用語音信息進(jìn)行說話人的身份鑒別。利用說話人識(shí)別技術(shù)還可以通過語音實(shí)現(xiàn)對(duì)一
10、些服務(wù)的控制,例如語音撥號(hào)、 銀行、數(shù)據(jù)庫訪問服務(wù)、信息服務(wù)和計(jì)算機(jī)的遠(yuǎn)程訪問等等。而且,說話人識(shí)別技術(shù)有很大可能產(chǎn)生新的服務(wù),給人們的工作和生活帶來非常可觀的方便,本次試驗(yàn)主要目的為提出和設(shè)計(jì)開發(fā)能夠快速準(zhǔn)確識(shí)別不同個(gè)體的可行方案。3、設(shè)計(jì)原理3.1 語音識(shí)別技術(shù)的分類語音識(shí)別系統(tǒng)可以根據(jù)對(duì)輸入語音的限制加以分類。從說話者與識(shí)別系統(tǒng)的相關(guān)性考慮可以將識(shí)別系統(tǒng)分為3類:特定人語音識(shí)別系統(tǒng):僅考慮對(duì)于特定人的語音進(jìn)行識(shí)別;非特定人語音系統(tǒng):識(shí)別的語音與人無關(guān),通常要用大量不同人的語音數(shù)據(jù)庫對(duì)識(shí)別系統(tǒng)進(jìn)行學(xué)習(xí);多人的識(shí)別系統(tǒng):通常能識(shí)別一組人的語音,或者成為特定組語音識(shí)別系統(tǒng),該系統(tǒng)僅要求對(duì)需要識(shí)
11、別的那組人的語音進(jìn)行訓(xùn)練。從說話的方式考慮也可以將識(shí)別系統(tǒng)分為3類:孤立詞語音識(shí)別系統(tǒng):孤立詞識(shí)別系統(tǒng)要求輸入每個(gè)詞后要停頓;連接詞語音識(shí)別系統(tǒng):連接詞輸入系統(tǒng)要求對(duì)每個(gè)詞都清楚發(fā)音,一些連音現(xiàn)象開始出現(xiàn);連續(xù)語音識(shí)別系統(tǒng):連續(xù)語音輸入是自然流利的連續(xù)語音輸入,大量連音和變音會(huì)出現(xiàn)。3.2 Mel頻率倒譜系數(shù)3.2.1 Mel頻率倒譜系數(shù)基本原理Mel頻率倒譜系數(shù)(MFCC),Mel頻率是基于人耳聽覺特性提出來的,它與Hz頻率成非線性對(duì)應(yīng)關(guān)系。Mel頻率倒譜系數(shù)(MFCC)就是是利用它們之間的非線性對(duì)應(yīng)關(guān)系,計(jì)算得到的Hz頻譜特征。LPC模型是基于發(fā)音模型建立的,LPCC系數(shù)是一種基于合成的參
12、數(shù),這種參數(shù)沒有充分利用人耳的聽覺性。心理學(xué)研究表明,無論是純音還是語音,人們對(duì)于聲音音調(diào)的感受都不是線性的,新的頻率單位的劃分方法,都應(yīng)該考慮到人耳聽覺的特性,這就應(yīng)該不同于物理學(xué)對(duì)頻率的描述。物理上的頻率是以Hz為單位的,而符合人聽覺特性的頻率是以Mel或Bark為單位的。臨界帶寬概念的引入是為了描述噪音對(duì)純音的遮蔽效應(yīng)(masking effect): 一個(gè)純音可以被以該純音為中心頻率并且具有一定頻帶寬度的噪音所遮蔽,條件是臨界帶寬內(nèi)噪聲的功率大于純音。在一個(gè)相同的臨界帶寬內(nèi),如果噪音的聲壓保持恒定,無論噪音的帶寬是否延伸到了整個(gè)臨界帶寬,其響度都是相同的,可一旦超過了這個(gè)臨界帶寬,就可
13、以察覺到響度的變化。從而得出結(jié)論:如果總功率相同,在一個(gè)相同臨界帶寬內(nèi),若干個(gè)不同頻率的聲音組成的混音,跟位于此臨界頻帶中央的單頻聲音具有相同的響度。如果混音聲音所處的頻帶范圍超過了相應(yīng)的臨界帶寬,混音會(huì)比純音聽起來更加響亮。通過實(shí)驗(yàn),我們已經(jīng)知道:當(dāng)中心頻率在1000Hz以下時(shí),臨界帶寬一般保持恒定,約為100Hz。且當(dāng)中心頻率超過1000Hz時(shí),隨著中心頻率的增長,臨界頻帶的帶寬呈線性增長。符合人的聽覺系統(tǒng)的頻率刻度劃分方法,應(yīng)該滿足在低頻上具有較高的分辨率、在高頻上具有較低的分辨率,符合臨界帶寬的特性,以Mel為單位的頻率刻度正是符合這種特性的一種頻率刻度。由于基于Mel頻率的倒譜系數(shù)(
14、Mel Frequency Cepstrum coefficient .簡稱MFCC)是將人耳的聽覺感知特性和語音的產(chǎn)生機(jī)制組合在一起,因此在語音識(shí)別和說話人識(shí)別系統(tǒng)中得到廣泛的應(yīng)用。Mel頻率尺度(mel-frequency scale),它的值大體上對(duì)應(yīng)于實(shí)際頻率的對(duì)數(shù)分布關(guān)系。Mel頻率與實(shí)際頻率的具體關(guān)系: (1) 圖3.1 Mel頻率與實(shí)際頻率的對(duì)應(yīng)關(guān)系3.2.2 MFCC的提取流程MFCC參數(shù)的提取包括以下幾個(gè)步驟: 預(yù)濾波:CODEC前端帶寬為300-3400Hz的抗混疊濾波器。 A/D變換:8kHz的采樣頻率,12bit的線性量化精度。 預(yù)加重:通過一個(gè)一階有限激勵(lì)響應(yīng)高通濾波
15、器,使信號(hào)的頻譜變得平坦,不易受到有限字長效應(yīng)的影響。 分幀:根據(jù)語音的短時(shí)平穩(wěn)特性,語音可以以幀為單位進(jìn)行處理,實(shí)驗(yàn)中選取的語音幀長為32ms,幀疊為16ms。 加窗:采用哈明窗對(duì)一幀語音加窗,以減小吉布斯效應(yīng)的影響。 快速傅立葉變換(Fast Fourier Transformation, FFT):將時(shí)域信號(hào)變換成為信號(hào)的功率譜。三角窗濾波:用一組Mel頻標(biāo)上線性分布的三角窗濾波器(共24個(gè)三角窗濾波器),對(duì)信號(hào)的功率譜濾波,每一個(gè)三角窗濾波器覆蓋的范圍都近似于人耳的一個(gè)臨界帶寬,以此來模擬人耳的掩蔽效應(yīng)。 求對(duì)數(shù):三角窗濾波器組的輸出求取對(duì)數(shù),可以得到近似于同態(tài)變換的結(jié)果。 離散余弦變
16、換(Discrete Cosine Transformation, DCT):去除各維信號(hào)之間的相關(guān)性,將信號(hào)映射到低維空間。 譜加權(quán):由于倒譜的低階參數(shù)易受說話人特性、信道特性等的影響,而高階參數(shù)的分辨能力比較低,所以需要進(jìn)行譜加權(quán),抑制其低階和高階參數(shù)。 倒譜均值減(Cepstrum Mean Subtraction, CMS):CMS可以有效地減小語音輸入信道對(duì)特征參數(shù)的影響。 差分參數(shù):大量實(shí)驗(yàn)表明,在語音特征中加入表征語音動(dòng)態(tài)特性的差分參數(shù),能夠提高系統(tǒng)的識(shí)別性能。在本系統(tǒng)中,我們也用到了MFCC參數(shù)的一階差分參數(shù)和二階差分參數(shù)。 短時(shí)能量:語音的短時(shí)能量也是重要的特征參數(shù),本系統(tǒng)中
17、我們采用了語音的短時(shí)歸一化對(duì)數(shù)能量及其一階差分、二階差分參數(shù)。 如下圖3.2 MFCC提取流程圖3.2 MFCC提取流程3.3 矢量量化3.3.1 矢量量化的簡單介紹矢量量化(VQ Vector Quantization)是70年代后期發(fā)展起來的一種數(shù)據(jù)壓縮技術(shù)基本思想:將若干個(gè)標(biāo)量數(shù)據(jù)組構(gòu)成一個(gè)矢量,然后在HYPERLINK :/baike.baidu /view/5845387.htm矢量空間給以整體量化,從而壓縮了數(shù)據(jù)而不損失多少信息。矢量量化編碼也是在圖像、語音信號(hào)編碼技術(shù)中研究得較多的新型量化編碼方法,它的出現(xiàn)并不僅僅是作為量化器設(shè)計(jì)而提出的,更多的是將它作為壓縮編碼方法來研究的。在
18、傳統(tǒng)的預(yù)測(cè)和變換編碼中,首先將信號(hào)經(jīng)某種映射變換變成一個(gè)數(shù)的序列,然后對(duì)其一個(gè)一個(gè)地進(jìn)行標(biāo)量量化編碼。而在矢量量化編碼中,則是把輸入數(shù)據(jù)幾個(gè)一組地分成許多組,成組地量化編碼,即將這些數(shù)看成一個(gè)k維矢量,然后以矢量為單位逐個(gè)矢量進(jìn)行量化。矢量量化是一種限失真編碼,其原理仍可用信息論中的率失真函數(shù)理論來分析。而率失真理論指出,即使對(duì)無記憶信源,矢量量化編碼也總是優(yōu)于標(biāo)量量化。3.3.2 矢量量化的定義矢量量化是先把信號(hào)序列的每個(gè)連續(xù)樣點(diǎn)分成一組,形成維歐氏空間的一個(gè)矢量,然后對(duì)此矢量進(jìn)行量化,具體定義如下:定義 3.3.2:維數(shù)為,尺寸為的矢量量化器定義為從維歐幾里德空間到一個(gè)包含個(gè)輸出(重構(gòu))點(diǎn)
19、的有限集合的映射, 即 , 其中 集合做碼書(codebook)或碼本,其尺寸(大小)為,碼書的個(gè)元素稱為碼字(codeword)或碼矢量(code vector)。輸入矢量空間通過尺寸為的量化器后,被分割成個(gè)互不重疊的區(qū)域或胞腔,這個(gè)過程被稱為輸入矢量空間的劃分。對(duì),胞腔定義為(2)3.3.3 矢量量化的基本原理對(duì)于任一信源或圖樣樣值,若有個(gè),我們可以把連續(xù)的一段樣值當(dāng)作為一個(gè)整體,如我們稱之為矢量。各個(gè)矢量的維數(shù)一樣,設(shè)為。因此信源將構(gòu)成矢量集:(維歐幾里德空間),為正整數(shù)。再把無遺漏的劃分成個(gè)互不相交的子空間,即滿足完備正交條件: (3)并求出每個(gè)子空間的質(zhì)心,所得到的恢復(fù)矢量集就是量化
20、器的輸出空間。在量化過程中,對(duì)于階維的矢量量化,實(shí)質(zhì)上是判斷輸入矢量屬于哪個(gè)子空間,然后輸出該子空間的代表矢量,也就是如下的映射關(guān)系: (4)從而我們用代替進(jìn)行編碼,這就是矢量量化的本質(zhì)。在矢量量化時(shí),將維空間劃分為個(gè)區(qū)域邊界,然后將輸出矢量與這些邊界進(jìn)行比較,并被量化為“距離”最小的區(qū)域邊界的中心矢量值。若要對(duì)一個(gè)矢量進(jìn)行量化,首先要抽取一個(gè)合適的失真測(cè)度,而后用最小失真原理,分別計(jì)算量化矢量所帶來的失真。其中最小失真值所對(duì)應(yīng)的那個(gè)量化矢量,就是矢量的重構(gòu)矢量(恢復(fù)矢量)?,F(xiàn)在主要有兩個(gè)問題:如何劃分個(gè)區(qū)域邊界。這需要用相當(dāng)數(shù)量的輸入信號(hào)矢量,經(jīng)過統(tǒng)計(jì)實(shí)驗(yàn)才能確定。此過程稱為“訓(xùn)練”或建立碼
21、書。如何確定兩個(gè)矢量在進(jìn)行比較時(shí)的測(cè)度。這個(gè)測(cè)度就是兩矢量之間的距離,或以其中的某一矢量為基準(zhǔn)時(shí)的失真度。它描述了當(dāng)輸入矢量用碼書所對(duì)應(yīng)的矢量來表征時(shí)所應(yīng)付出的代價(jià)。3.4 矢量量化的失真測(cè)度在矢量量化器的設(shè)計(jì)中,失真測(cè)度的選擇是很重要的,它是矢量量化和模式識(shí)別中一個(gè)相當(dāng)重要的問題。失真測(cè)度選用的合適與否,直接影響系統(tǒng)的性能。要使所選擇的失真測(cè)度有實(shí)際意義,必須具備下面幾個(gè)特征:必須在主觀評(píng)價(jià)上有意義,即小的失真應(yīng)該對(duì)應(yīng)于好的主觀語音質(zhì)量;必須是方便處理的,就是在數(shù)學(xué)上比較容易實(shí)現(xiàn),這樣可以用于實(shí)際的矢量量化器的設(shè)計(jì);平均失真存在并且是能夠計(jì)算的;方便硬件實(shí)現(xiàn)。失真測(cè)度主要有均方差失真測(cè)度(即
22、歐氏距離),加權(quán)的均方失真測(cè)度等。另外,還有人提出所謂的“主觀的”失真測(cè)度。3.4.1 歐氏距離-均方誤差設(shè)輸入信號(hào)的某個(gè)維矢量,與碼書中某個(gè)維矢量進(jìn)行比較,必分別表示和中的各元素(),則定義均方誤差為歐氏距離,即有: (5)這里的下標(biāo)2表示平方誤差。常用的歐氏距離有:方平均誤差。其定義為: (6)平均誤差。其定義為: (7)絕對(duì)值平均誤差。這相當(dāng)于時(shí)的平均誤差,其定義式為: (8)此失真測(cè)度的主要好處是計(jì)算簡單、硬件易于實(shí)現(xiàn)。最大平均誤差。相當(dāng)于是時(shí)的平均誤差,其定義式為: (9)歐氏距離測(cè)度是人們熟知的一種失真測(cè)度,它應(yīng)用的范圍很寬泛。3.5 識(shí)別失真度將矢量量化技術(shù)用于語音識(shí)別時(shí),對(duì)失真
23、測(cè)度還應(yīng)該有別的一些考慮。在此舉例說明,在使用LPC參數(shù)的似然比失真測(cè)度對(duì)兩矢量的功率譜進(jìn)行比較時(shí),還應(yīng)該考慮到能量。研究表明,頻譜與能量都攜帶有語音信號(hào)的信息,如果僅僅靠功率譜作為失真比較的參數(shù),則識(shí)別的性能將不夠理想。為此,可以采用如下的定義失真測(cè)度: (10)式中,及分別為輸入信號(hào)矢量和碼書重構(gòu)矢量的歸一化能量,可取為: (11)的作用是:當(dāng)兩矢量的能量接近時(shí),能量差引起的影響可以忽略不計(jì),當(dāng)兩矢量的能量差別比較大時(shí),就是進(jìn)行線性加權(quán),而當(dāng)能量差超過門限時(shí),則為某一固定值。式(10)中,為加權(quán)因子,這里、和要經(jīng)過測(cè)試來進(jìn)行確定。4、設(shè)計(jì)過程4.1、實(shí)驗(yàn)技術(shù)路線圖4.2、實(shí)驗(yàn)結(jié)果測(cè)試圖5、
24、實(shí)驗(yàn)代碼與結(jié)果分析5.1、MATLAB源程序GUI界面:function varargout = testGUI(varargin)% TESTGUI, by itself, creates a new TESTGUI or raises the existing% singleton*.% H = TESTGUI returns the handle to a new TESTGUI or the handle to% the existing singleton*.% TESTGUI(CALLBACK,hObject,eventData,handles,.) calls the local
25、% function named CALLBACK in TESTGUI.M with the given input arguments.% TESTGUI(Property,Value,.) creates a new TESTGUI or raises the% existing singleton*. Starting from the left, property value pairs are% applied to the GUI before testGUI_OpeningFcn gets called. An% unrecognized property name or in
26、valid value makes property application% stop. All inputs are passed to testGUI_OpeningFcn via varargin.% *See GUI Options on GUIDEs Tools menu. Choose GUI allows only one% instance to run (singleton).% See also: GUIDE, GUIDATA, GUIHANDLES % Edit the above text to modify the response to help testGUI
27、% Last Modified by GUIDE v2.5 27-Dec-2014 14:18:04 % Begin initialization code - DO NOT EDITgui_Singleton = 1;gui_State = struct(gui_Name, mfilename, . gui_Singleton, gui_Singleton, . gui_OpeningFcn, testGUI_OpeningFcn, . gui_OutputFcn, testGUI_OutputFcn, . gui_LayoutFcn, , . gui_Callback, );if narg
28、in & ischar(varargin1) gui_State.gui_Callback = str2func(varargin1);end if nargout varargout1:nargout = gui_mainfcn(gui_State, varargin:);else gui_mainfcn(gui_State, varargin:);end% End initialization code - DO NOT EDIT% Executes just before testGUI is made visible.function testGUI_OpeningFcn(hObjec
29、t, eventdata, handles, varargin)% This function has no output args, see OutputFcn.% hObject handle to figure% eventdata reserved - to be defined in a future version of MATLAB% handles structure with handles and user data (see GUIDATA)% varargin command line arguments to testGUI (see VARARGIN)% Choos
30、e default command line output for testGUIhandles.output = hObject;% Update handles structureguidata(hObject, handles);% UIWAIT makes testGUI wait for user response (see UIRESUME)% uiwait(handles.figure1);% Outputs from this function are returned to the command line.function varargout = testGUI_Outpu
31、tFcn(hObject, eventdata, handles) % varargout cell array for returning output args (see VARARGOUT);% hObject handle to figure% eventdata reserved - to be defined in a future version of MATLAB% handles structure with handles and user data (see GUIDATA)% Get default command line output from handles st
32、ructurevarargout1 = handles.output;ha=axes(units,normalized,position,0 0 1 1); uistack(ha,bottom) II=imread(1.jpg);image(II) colormap gray set(ha,handlevisibility,off,visible,off); % Executes on button press in pushbutton1.function pushbutton1_Callback(hObject, eventdata, handles)% hObject handle to
33、 pushbutton1 (see GCBO)% eventdata reserved - to be defined in a future version of MATLAB% handles structure with handles and user data (see GUIDATA)global s;global a;測(cè)試程序s, fs = wavread(165.wav); v2 = mfcc(s, fs); % 對(duì)找到的文件取mfcc變換 for j=2:80 v( :,j)=v2(:,(j-1)*3); end a=v; b= load(matlab.mat) ; b0=b
34、.yuyinku0; %姜昱涵 code1=b0; b1=b.yuyinku1; %李治龍 code2=b1; b2=b.yuyinku2; %楊帆 code3=b2; b3=b.yuyinku3; %劉洋洋 code4=b3; b4=b.yuyinku4; %劉怡 code5=b4; b5=b.yuyinku5; %張震 code6=b5; b6=b.yuyinku6; %陸瑤; code7=b6; b7=b.yuyinku7; %夏梁站 code8=b7; b8=b.yuyinku8; %朱清寧 code9=b8; b9=b.yuyinku9; %包雨晴; code10=b9; b10=b
35、.yuyinku10; %陳燕 code11=b10; b11=b.yuyinku11; %龔媛媛 code12=b11; b12=b.yuyinku12; %沈亞萍 code13=b12; b13=b.yuyinku13; %肖月霞 code14=b13; b14=b.yuyinku14; %張婷婷 code15=b14; b15=b.yuyinku15; %趙禮慧; code16=b15; b16=b.yuyinku16; %黃玉乾 code17=b16; b17=b.yuyinku17; %張帝 code18=b17; b18=b.yuyinku18; %雷超群 code19=b18;
36、dist = zeros(19,1);for i=1:19 dist(i,1) = dtwdist = zeros(19,1);for i=1:19 dist(i,1) = dtw2(a,codei) ; enddisp(結(jié)果為:)i,j= min(dist); if i3.0e+04 fprintf(測(cè)試人語音 %d 是庫內(nèi)人員編號(hào)為%d!n,165,j); else fprintf(測(cè)試人語音 %d 未被識(shí)別!n, 165); endguidata(hObject, handles); % Executes on mouse press over axes background.funct
37、ion axes1_ButtonDownFcn(hObject, eventdata, handles)% hObject handle to axes1 (see GCBO)% eventdata reserved - to be defined in a future version of MATLAB% handles structure with handles and user data (see GUIDATA)Mel倒頻譜系數(shù)函數(shù)function r = mfcc(s, fs)for i = 1:19 % 對(duì)數(shù)據(jù)庫中的代碼形成碼本 file = sprintf(%d.wav,i)
38、; disp(file); s,fs = wavread(file);m = 100;n = 256;l = length(s);p=20;nbFrame = floor(l - n) / m) + 1; %沿-方向取整 nbFrame=4;%for i = 1:n for j = 1:nbFrameM(i,j)=s(j-1)*m)+i);%對(duì)矩陣M賦值 endendh = hamming(n); %加 hamming 窗,以增加音框左端和右端的連續(xù)性M2 = diag(h)* M;for i = 1:nbFrameframe(:,i) = fft(M2(:, i); %對(duì)信號(hào)進(jìn)行快速傅里葉變
39、換FFT endt = n / 2;tmax = l / fs;m = melfb(20, n, fs); %將上述線性頻譜通過Mel 頻率濾波器組得到Mel 頻譜,下面在將其轉(zhuǎn)化成對(duì)數(shù)頻譜矩形濾波器組f0 = 700 / fs;fn2 = floor(n/2);lr = log(1 + 0.5/f0) / (p+1);bl = n * (f0 * (exp(0 1 p p+1 * lr) - 1);%直接轉(zhuǎn)換為FFT的數(shù)字模型b1 = floor(bl(1) + 1;b2 = ceil(bl(2);b3 = floor(bl(3);b4 = min(fn2, ceil(bl(4) - 1;p
40、f = log(1 + (b1:b4)/n/f0) / lr;fp = floor(pf); pm = pf - fp;r = fp(b2:b4) 1+fp(1:b3);c = b2:b4 1:b3 + 1;v = 2 * 1-pm(b2:b4) pm(1:b3);m = sparse(r, c, v, p, 1+fn2);n2 = 1 + floor(n / 2);z = m * abs(frame(1:n2, :).2;r = dct(log(z); %將上述對(duì)數(shù)頻譜,經(jīng)過離散余弦變換(DCT)變換 到倒譜域,即可得到Mel 倒譜系數(shù)(MFCC參數(shù))end庫函數(shù)for i = 102:11
41、0 % 對(duì)數(shù)據(jù)庫中的代碼形成碼本 file = sprintf(%d.wav,i); disp(file); s,fs = wavread(file); v1= mfcc(s, fs); % 計(jì)算 MFCCs 提取特征特征,返回值是Mel倒譜系數(shù), 是一個(gè)log的dct得到的 for j=2:80 v(:,j)=v1(:,(j-1)*3); end ku(:,:,i)= v; end yuyinku10(:,:,1)=(ku(:,:,102)+ku(:,:,103)+ ku(:,:,104)+ku(:,:,105)+ ku(:,:,106)+ku(:,:,107)+ ku(:,:,108)+k
42、u(:,:,109)+ ku(:,:,110)./9; figure(1); plot(yuyinku10);濾波程序function m = melfb(p, n, fs)f0 = 700 / fs;fn2 = floor(n/2);lr = log(1 + 0.5/f0) / (p+1);% convert to fft bin numbers with 0 for DC termbl = n * (f0 * (exp(0 1 p p+1 * lr) - 1);%直接轉(zhuǎn)換為FFT的數(shù)字模型b1 = floor(bl(1) + 1;b2 = ceil(bl(2);b3 = floor(bl(
43、3);b4 = min(fn2, ceil(bl(4) - 1;pf = log(1 + (b1:b4)/n/f0) / lr;fp = floor(pf);pm = pf - fp; r = fp(b2:b4) 1+fp(1:b3);c = b2:b4 1:b3 + 1;v = 2 * 1-pm(b2:b4) pm(1:b3);m = sparse(r, c, v, p, 1+fn2);錄音程序clear all%x = load(C:UserslenovoDesktopMATLAByuyinku.mat);fs=11025;fprintf(Press any key to start %g seconds of recording. n,5); pause; fprintf(Recording.n); y=wavrecord(5*fs, fs,uint8);fprintf(Finished recording.n); %plot(y);wavwrite(y,1.wav);%z = y(:,1);%z=fft(y);%stem(z,.);wavplay(y);5.2、實(shí)驗(yàn)結(jié)果分析人員編號(hào)12345678910111213141516171819測(cè)試次
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 酒店改造補(bǔ)貼合同協(xié)議書
- 2025年度科技園區(qū)辦公室租賃合同(科技企業(yè)版)
- 住宅精裝修合同書
- 循環(huán)經(jīng)濟(jì)與廢物資源化管理作業(yè)指導(dǎo)書
- 三農(nóng)村基層智慧城市建設(shè)與發(fā)展方案
- 網(wǎng)絡(luò)安全與數(shù)據(jù)保護(hù)技術(shù)作業(yè)指導(dǎo)書
- 房地產(chǎn)行業(yè)銷售與租賃管理系統(tǒng)方案
- 國際能源領(lǐng)域科技創(chuàng)新及投資協(xié)議
- 出租車承包合同協(xié)議書年
- 軟件能力評(píng)價(jià)與提升作業(yè)指導(dǎo)書
- 科室醫(yī)院感染風(fēng)險(xiǎn)評(píng)估表
- 山東省食用油(植物油)生產(chǎn)企業(yè)名錄496家
- 《智慧農(nóng)業(yè)》的ppt完整版
- GB∕T 33047.1-2016 塑料 聚合物熱重法(TG) 第1部分:通則
- 經(jīng)濟(jì)學(xué)市場(chǎng)失靈與政府失靈課件
- 電力業(yè)務(wù)許可證豁免證明
- 特發(fā)性肺纖維化IPF
- FIDIC國際合同條款中英文對(duì)照.doc
- 建筑工程資料歸檔立卷分類表(全)
- 個(gè)人勞動(dòng)仲裁申請(qǐng)書
- 國籍狀況聲明書
評(píng)論
0/150
提交評(píng)論