男女聲識別系統(tǒng)_第1頁
男女聲識別系統(tǒng)_第2頁
男女聲識別系統(tǒng)_第3頁
男女聲識別系統(tǒng)_第4頁
男女聲識別系統(tǒng)_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

男女聲識別系統(tǒng)摘要:本文通過對男性和女性聲音的語音特征的研究,發(fā)現(xiàn)男女聲的基音頻率存在較大的差異,并設計了基于基音頻率分析的男女聲識別系統(tǒng)。男女聲識別系統(tǒng)由以下三個模塊電路構成:話筒放大器,低通濾波器,半波整流電路,單片機測量控制模塊。話筒放大器采用NE5532P音前置芯片,對語音信號進行放大:八階低通濾波器MAX293完成基音信號的提取:單片機STC12C5410AD實現(xiàn)頻率測量和控制輸出功能。經(jīng)仿真與電路實測,男女聲的識別效果良好。關鍵詞:男女聲識別、基音頻率、低通濾波器、單片機。一、引言人類基音的范圍約為70?100 200 300平均基音頻率[Hz]圖一基音頻率的平均值和標準差100 200 300平均基音頻率[Hz]圖一基音頻率的平均值和標準差302007區(qū)%鬣11350Hz左右,由于生理結構的不同,40男性與女性的聲音呈現(xiàn)出不同的聽覺特征,男聲的基音頻率大都在100—200HZ之間,而女聲則在200—350HZ之間;在會話中,同一發(fā)音者的基音頻率變化的統(tǒng)計結果,如圖一所示。女聲與男聲相比,前者的平均值、標準差都為后者的兩倍左右。不同發(fā)音者的基音頻率分布如圖二所示,在對數(shù)頻率軸上男聲,女聲分別呈現(xiàn)正態(tài)分布,男聲的基音頻率的平均值和標準差分別為125Hz及其20HZ。女聲約為男聲的2倍。鑒于男女聲存在基音頻率的明顯差異,基音頻率可作為男女聲識別的依據(jù)。二、方案論證與比較基于男女聲基音頻率的差異,男女聲識別的實現(xiàn)可以通過基音頻率的測量來實現(xiàn)?;纛l率的實現(xiàn)有多種方法。如FFT分析、自相關分析等。方案一:基于FFT的短時頻譜分析。把語音信號數(shù)字化,即經(jīng)AD采樣量化之后,用FFT算法處理,得到信號的頻譜,從而獲得基音頻率。這種方法由于算法較復雜,數(shù)據(jù)處理量大,如用單片機來實現(xiàn),編程復雜,運算速度慢,難以滿足實時要求。方案二:濾波器基音提取技術。利用低通濾波器濾除多次諧波及共振峰等高頻成分,得到近似的基音信號,此法可以用硬件電路構成濾波器實現(xiàn)基音信號的粗略提取,避免了大量算法分析和數(shù)據(jù)處理,實現(xiàn)起來相當簡單。為了證明這種方法的有效性,我們用計算機聲卡錄制了近20名男女同學的單音、詞組和句子的WAV文件,在MATLAB上編寫程序進行仿真。.男女聲信號通過400Hz低通濾波后的仿真波形比較。我們將男女聲信號經(jīng)過八階低通濾波器,其截止頻率設定為400HZ。仿真結果如圖三所示。從圖形上我們可以看到:通過400Hz的低通濾波器后,男聲輸出為約120Hz左右周期性信號(非單頻正弦波):女聲輸出約250Hz左右周期性信號,其波形接近正弦波。這說明經(jīng)過400Hz低通濾波器后,女聲聲音主要由基音信號構成,而男性聲音的非正弦性是由于其二次諧波及共振峰的存在的結果。.男女聲信號通過200Hz低通濾波后的仿真波形比較。我們將男聲、女聲輸入信號經(jīng)過八階低通數(shù)字濾波器濾波,截止頻率設定為200HZ。男聲、女聲及其通過200HZ低通濾波后的波形如圖四所示:從上邊的圖形我們看出:經(jīng)過200Hz的低通濾波器,男聲輸出為較好的正弦波(基音信號),而女聲基本上沒有信號通過。從MATLAB數(shù)據(jù)處理軟件對采集信號分析的結果表明,用濾波器提取基音頻率的方法完全可行。我們在計算機上用這種方法編寫了男女聲識別軟件,對男女聲基音特征進行提取,實現(xiàn)了識別的仿真。實驗表明,在正常說話條件下,系統(tǒng)具有較高的識別率,仿真效果令人滿意。三、系統(tǒng)實現(xiàn).設計思想與系統(tǒng)構成:話筒產(chǎn)生的語音信號很微弱,大約50mV左右,必須經(jīng)過放大才能送往后級電路處理。兩個高階低通濾波器分別工作在400HZ的截止頻率和200HZ截止頻率。這主要是為了保證始終有一路信號是含諧波分量較少的近似基音信號。整形電路把正弦波轉(zhuǎn)化為矩形脈沖,送往單片機STC12c5010AD測量其周期。單片機完成多次測量后,進行統(tǒng)計,作出男聲還是女聲的判斷,送輸出顯示。.主要電路的設計與說明A、話筒放大電路通過用NE5532P芯片來實現(xiàn)語音放大,把微弱的語音信號放大的50倍左右。如圖所示,采用NE5532運算放大器作音頻前置放大電路。其優(yōu)點是體積小、功耗小、一致性較好。電路如下圖所示:B、低通濾波電路采用MAX293可控截止頻率8階巴特沃夫低通濾波器,如圖所示,則電路結構簡單,外圍元件少,截止頻率可由外部時鐘控制或由時鐘輸入端所接電容決定。截止頻率控制簡單,且濾波效果好。調(diào)試時,由外部時鐘控制截止頻率,調(diào)試完成后,可將濾波器的截止頻率固定,即在時鐘輸入端(CLK)接一個一定大小的電容。比較兩個方案,方案二實現(xiàn)濾波簡單方便,滿足系統(tǒng)要求。C、全整流電路如圖所示,U5A、U6A各組成一線性半波整流電路,而U5B、U6B各組成一加法電路。U5A和U5B,U6A和U6B構成一線性全波整流電路。D、單片機電路把經(jīng)過整流后的兩路頻率信號輸入STC12C5410AD進行AD轉(zhuǎn)換并采樣。再各求出兩組采樣好的數(shù)據(jù)的能量,以便來進行比較。若求出來的兩個結果較接近就為男聲,那么男聲的那個發(fā)光二極管就會亮起來。若兩個結果相差較大就為女聲,那么女聲的那個發(fā)光二極管就會亮起。電路如下:3.軟件設計A程序設計流程圖:B程序:#include<>sfrADC.L0W2=OxBE;〃定義STC12c5410AD特殊功能寄存器sfrADC_CONTR=OxC5;sfrADC_DATA=0xC6;sfrpOmO =0x93;sfrpOml =0x94;sfrplmO =0x91;sfrplml =0x92;sfrp2m0 =0x95;sfrp2ml =0x96;sfrp3m0 =Oxbl;sfrp3ml =0xb2;sbitgetv =P2A1;〃定義指示燈sbitmale =P2A6;sbitfemale=P2A7;^definedivgate4〃定義全局常量和全局變量社definecountgate185#defineon1社defineoff0unsignedchardiv;unsignedcharad200,ad400;unsignedchartest;unsignedchari,count;unsignedcharcodedisplay_AD_channel_ID[2]={0x00,0x01);voiddelay100us(charDelay)〃延時程序,延時時間=Dekly*100us{chard;for(;Delay>0:Delay—){fbr(d=0;d<12;d++){;}))voiddelay50ms(unsignedintt)〃延時程序,延時時間=t*50msunsignedintj;fbr(;t>O;t-)for(j=6245j>0j--))unsignedcharAd_Choiige(unsignedcharchannel)//AD轉(zhuǎn)換子程序{ADCLCONTR=ADC_CONTR&OxeO;//1110,0000清ADC_FLAG,ADC_START位和低3位ADC.CONTR=ADC_CONTR|(d】spby_AD_channel」D?Kinnel]&0x07);//設置當前通道號〃延時使輸入電壓達到穩(wěn)定ADJDATA=0; 〃清AD轉(zhuǎn)換結果寄存器delay100us(5);ADC.CONTR=ADC_CONTR|0x08;//0000,1000ADCS=1,啟動轉(zhuǎn)換d。{;}while((ADC_CONTR&0x10尸=0); //000L0000等待A/D轉(zhuǎn)換結束ADCLCONTR=ADC_CONTR&0xE7;//1110.0111清ADC_FLAG位,停止A/D轉(zhuǎn)換returnADCDATA;)voidget_result()〃聲音采集和處理子程序{count=0;getv=on;male=off;female=off;fot(i=0;i<250;i++)〃對400hz和2001iz信號各采樣250次并統(tǒng)計數(shù)據(jù){ad400=Ad_Change(0);ad200=Ad_Change(1);if(ad200!=0)(dn=ad400/ad200;if(div>divgate)count++;}elseif(ad200<0x01)count-H-;)if(count>countgate)〃判別男女并指示(female=on;niale=off;)else(male=on;feniale=off;)getv=off;delay50nls(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);〃返回等待下次測試)voidmainQ{SP=0x31;IE=0x85;〃開系統(tǒng)中斷getv=0;male=l;female=0;ADC.CONTR=0xe0;〃1110,0000打開A,D轉(zhuǎn)換電源。設定采樣速率為210個機器周期plmO=0x03; //0000,先設為開漏。斷開內(nèi)部上拉電阻plml=0x00;delay100us(10);while(1)〃循環(huán)等待聲音信號輸入{male=^male;female=female;delay50ms(50);test=Ad_Change(O);〃先不跟你聊了,寫好程序部分的實驗報告好給你們if(test>0x02){test=Ad_Change(O);1f(test>0x02)〃重復先不跟你聊了,寫好程序部分的實驗報告好給你們{test=Ad_Change(O);if(test>0x02)(

getjesult。;〃對聲音進行判別四、系統(tǒng)電路測試與分析.帶話筒放大器的測試:調(diào)整放大增益,使輸出幅度較大而不失真。.低通濾波器性能的測試:信號發(fā)生器產(chǎn)生200—400Hz正弦波作為400Hz截止頻率低通濾波器的輸入信號,用示波器觀察輸出信號,可看到輸出為正弦波,450HZ以上正弦波輸入時基本無輸出信號,可見濾波效果很好。信號發(fā)生器產(chǎn)生100—300Hz正弦波作為200Hz截止頻率低通濾波器的輸入信號,用示波器觀察輸出信號,同樣可看到很好的濾波效果。.單片機系統(tǒng)調(diào)試:用仿真器調(diào)試測量與處理程序。.整機測試:下面是對若卜位學生的測試結果。由測試結果得到,該系統(tǒng)測試聲音平均基音頻率(Hz)判定結果判斷準確率為70%。原因是,男聲男就一個說話者來說,基音頻率男聲男并不是固定不變的,不同聲音、男聲男不同聲調(diào)、說話者的情緒等都男聲男會影響基音頻率,另外輔音會男聲161男對測試結果有一定的影響。正女聲男因為如此,容易造成誤判。(如女聲男某位男同學發(fā)的某些音,用系女聲女統(tǒng)測試誤判為女聲)。女聲女五總結女聲男這個科技制作,我們從三月份開始著手找方案,并多次找鐘老師指導,一?開始,我們想嘗試用全軟件的ARM的開發(fā)板實現(xiàn),可是近半個月的時間,找的資料都沒能讓我們很好的了解ARM的使用,所以我們最后決定改變方案,使用硬件跟單片機軟件相結合的辦法,硬件部分,對所需的芯片不熟悉,經(jīng)過鐘老師指導,我們應用了MAX293的濾波器,經(jīng)網(wǎng)上找資料,學會MAX293的應用及其外圍電路的搭建,放大電路并沒有太大的問題,只是我們本來打算用一個具有自增益控制的芯片,但是在賽格找不到,所以只能單用運放實現(xiàn),放大跟濾波的電路完成后,整流部分則參考了《模擬電子線路》里而的一個圖。前而硬件部分基本完成,然后就開始制板,因為之前都沒有接觸過,所以只能從零開始,學著用PROTEI軟件,畫原理圖并畫PCB,然后去實驗室做板,做伴并沒有太大的問題,但是因為芯片是帖片封裝,所以焊帖片是很新的嘗試,還好有同學的指導才能掌握其中的訣竅。第一次制板,因為沒有經(jīng)驗,所以一口氣就把整個硬件電路做在一塊板上,結果調(diào)試的時候有問題,可是卻沒有辦法檢查哪里出問題,所以第一塊板就宣布廢掉,接下來,決定按模塊分開做,放大,濾波,整流,和單片機部分。放大部分我們用萬能板,其他三個部分都是用腐蝕板,濾波部分電路一次就完成,但是整流部分卻出現(xiàn)問題,檢查電路并沒有問題,可是就是沒有整流效果,所以最后只能重新用萬能板,最后終于完成整流部分的電路。單片機部分,主要是由另一個組員完成,所以單片機部分的程序設計我并沒有參與。這個科技制作中,我們遇到了很多很多的問題,大問題小問題都有,首先是怎么找資料,開始很茫然的在網(wǎng)上搜索,可是很多并沒有很完整,或者是沒有很規(guī)范,經(jīng)過鐘老師的推薦,我們很多

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論