燕山大學畢業(yè)設計:基于特定說話人識別的門禁系統(tǒng)設計_第1頁
燕山大學畢業(yè)設計:基于特定說話人識別的門禁系統(tǒng)設計_第2頁
燕山大學畢業(yè)設計:基于特定說話人識別的門禁系統(tǒng)設計_第3頁
燕山大學畢業(yè)設計:基于特定說話人識別的門禁系統(tǒng)設計_第4頁
燕山大學畢業(yè)設計:基于特定說話人識別的門禁系統(tǒng)設計_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于特定說話人識別的門禁系統(tǒng)設計指導老師:學生姓名:日期:燕山大學目目錄錄第一章緒論

第二章說話人識別系統(tǒng)的理論研究

第三章門禁系統(tǒng)的整體設計

第四章說話人識別門禁系統(tǒng)的軟件設計

第五章門禁系統(tǒng)的仿真與結果分析一、研究背景及意義

對語音處理技術可以追溯到1876,該年貝爾創(chuàng)造了,他是人類有史以來的第一人將語音信號傳輸到遠處通過電訊號。在眾多的生物認證技術中,說話人識別技術表現出很多應用上的優(yōu)勢。聲紋識別有不會遺失無須記憶、使用方便具有獨特的方便性、經濟性和準確性國內外動態(tài)1966年,美國法院第一次采用語譜圖進行了取證70年代中期BSAtal研究了線性預測LPC(LinearPredictiveCoding)系數、倒譜系數等不同的特征參數,并論證了倒譜系數在進行說話人識別中是比較理想的特征參數清華大學在1988年創(chuàng)造了無限詞匯漢語聽寫機,四達公司等單位在90年代初使之產品化、商品化說話人識別原理說話人識別系統(tǒng)分為兩個階段,即訓練(學習)和識別階段。在訓練階段,系統(tǒng)根據每個使用者說出的假設干訓練語句建立相應的參考模板。而在識別階段,由待識別人說的語音中導出參量要與訓練過程中的參考參量集或模板加以比較。用VQ方法計算平均失真測度,選取距離最小者判斷說話人是誰。三、訓練識別過程中需要注意的問題對語音信號的預加重、分幀、加窗、端點檢測和特征提取建立說話人的參考模板和測試模板計算測試模板與參考模板的最小累計距離說話人識別原理圖預加重和端點檢測的作用中預加重作用:語音信號頻譜的高頻局部能量較小,容易受到干擾,以及信號的高頻局部在6dB/倍頻程下降800Hz。因此,在語音信號的分析時,先要以提高高頻局部。對聲音信號進行預加重,還有兩個好處:1、能夠將數字化的語音信號平滑過度,2、能夠降低在之后的聲音處理中受到精度的影響。端點檢測作用:除非在高信噪比的聲學環(huán)境中(如消聲室或隔音室)的語音外,從背景噪聲中鑒別語音不是一件簡單的事?,F實環(huán)境中,靜音段經常由于受到噪聲的污染能量值不為零,導致系統(tǒng)誤判,性能降低。對語音信號進行端點檢測,有利于降低系統(tǒng)運算量,提高系統(tǒng)性能。用信號的幅度作為特征,區(qū)分靜音段和語音段。只要設定一個門限,當信號的幅度超過該門限,就認為語音開始,幅度降低到門限以下就認為語音結束。特征提取的過程:在訓練過程中通過說話人說的語句,提取出惟一表現說話人身份的有效且穩(wěn)定可靠的特征,這些特征參數構成參考模板;在識別過程中將識別時說話人說的語句進行特征提取,構成一個待識別模板。模式匹配的過程:將待識別模板和訓練的參考模板進行匹配,計算平均失真測度〔采用歐氏距離〕,距離最小者為說話者。特征提取和模式匹配的過程美爾頻率倒譜參數〔MFCC〕MFCC參數是基于人的聽覺特性利用人耳聽覺的屏蔽效應,在Mel標度頻率域提取出來的倒譜特征參數。其提取流程圖如下:MFCC提取的具體步驟1、聲音信號舉行分幀、加窗,后做離散傅立葉變換,從而得到頻譜分布信息。2、計算頻譜的振幅的平方,就可以得到能量譜。3、將能量譜通過一組Mel尺度的三角形濾波器組。4、算出每一個濾波器組輸出的對數能量。5、通過離散弦變換〔DCT〕得到了MFCC系數。矢量量化方法介紹基于VQ的識別模型:基于VQ的說話人識別系統(tǒng),矢量量化起著雙重作用。在訓練階段,把每一個說話者所提取的特征參數進行分類,產生不同碼字組成的碼本。在識別(匹配)階段,用VQ方法計算平均失真測度(本系統(tǒng)在計算距離d時,采用歐氏距離測度),從而判斷說話人是誰。用矢量量化聚類法生成碼本:將每個待識的說話人看作是一個信源,用一個碼本來表征。碼本是從該說話人的訓練序列中提取的MFCC特征矢量聚類而生成。只要訓練的序列足夠長,可認為這個碼本有效地包含了說話人的個人特征,而與講話的內容無關。本文采用基于分裂的LBG的算法來設計VQ碼本,其流程圖如下:LBG的算法具體過程:1、從幀中提取出來的特征向量的均值作為第一碼字矢量2、將當前的碼本根據下面規(guī)那么分裂,形成2m個碼字3、根據得到的碼本把所有的訓練序列(特征矢量)進行分類,然后按照下面兩個公式計算訓練矢量量化失真量的總和以及相對失真。假設相對失真小于某一閾值ε,迭代結束,當前的碼書就是設計好的2m個碼字的碼書,轉5。否那么,轉下一步。4、重新計算各個區(qū)域的新型心,得到新的碼書,轉3。5、重復2,3和4步,直到形成有M個碼字的碼書(M是所要求的碼字數)。門禁系統(tǒng)的整體結構系統(tǒng)硬件布局如圖以下圖所示,主要包含6大板塊為:1.語音輸入板塊,利用采用麥克風來實現。2.音頻編解碼板塊,本系統(tǒng)用TLV320AIC23來實現對語音信號的采集與傳輸。3.DSP處理器有很多種,經過查閱多方資料,最后選擇了型號為TMS320VC5509A的,對語音信號進行處理。4.SDRAM模塊,這個版塊是存儲數據的。5.FLASH模塊,其功能是保存說話人識別的參考模板。6.無線模塊,其功能是負責用戶端與主機端之間的無線通信。電源電路時鐘電路音頻模塊TMS320VC5509與SDRAM接口圖TMS320VC5509與FLASH接口圖說話人識別的結構框圖時鐘初始化化系統(tǒng)上電期間,因為電壓波動等的原因,時鐘震蕩狀態(tài)是不穩(wěn)定的,為了讓TMS320VC5509APGE工作正常,就需要對時鐘進行初始化設置,等待時鐘穩(wěn)定后再操作,否那么會影響到其他模塊工作?;T禁系統(tǒng)的仿真與結果分析本文的識別方法確定為矢量量化方法,美爾倒譜參數〔MFCC〕被確定為特征參數。在軟件仿真下,把麥克風連接PC,將錄音軟件設成單聲道,采樣頻率被定為8KHz,量化精度被確定16位,預加重系數被定為,每幀的語音時間為30ms,240點是一個幀,幀移為80,窗函數使用漢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論