




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
于B理第一章緒論Matab是矩陣實(shí)驗(yàn)室(MatrixLaboratory)的簡(jiǎn)稱(chēng),是美國(guó)MathWrs司高括Matlab和Simulink兩。1.1Matlab簡(jiǎn)介B是英文MATrixLABoratoy矩陣實(shí)驗(yàn)室的縮寫(xiě)早期的B用N語(yǔ)言編寫(xiě)的盡管功能十分簡(jiǎn)單但作為免費(fèi)軟件還是吸引了大批使用者。經(jīng)過(guò)幾年的校際流傳,在JohnLittle。CleveMoler和SteveBanger合作,于1984年成立s出B第一版版。從這時(shí)起B(yǎng)的核心采用C語(yǔ)言編寫(xiě),功能越來(lái)越強(qiáng)大,除原有的數(shù)值計(jì)算功能外,還新增了圖形處理功能。s于2的0;4年推出了4.2版擴(kuò)充了4.0版的功能,尤其在圖形界面設(shè)計(jì)方面提供了新方法1997年春5.0版問(wèn)世5.0程9的3版在很多方面又進(jìn)一步改進(jìn)了B語(yǔ)和Simulink3.0達(dá)到了高平;200年10月,0使界與C語(yǔ)言接口及性與的Simulink4.0版的新功能也特別引人注目2001年6月推出的1版及Simulink4.1版,功能已經(jīng)十分強(qiáng)大2002年6月推出的5版及Simulink5.0版,在計(jì)算方法圖形功能用戶界面設(shè)計(jì)編程手段和工具等方面都有了重大改進(jìn);2004年,s公司推出了最新的ML.0版,其中集成了最新的7編譯器Simumlink6.0仿很。Matab主要面科學(xué)算、可化以交互式序設(shè)計(jì)高科計(jì)算環(huán)。它將數(shù)分析陣計(jì)算科數(shù)據(jù)視化以非線性態(tài)系的建模仿真等諸多強(qiáng)功能集在一易于使的視環(huán)境中科學(xué)研程以必須行效計(jì)眾科領(lǐng)供一面決案代當(dāng)國(guó)1于B理。MATB的優(yōu)勢(shì)(1)工作平臺(tái)編程環(huán)境十分友好(2)編程語(yǔ)言簡(jiǎn)單易用3)(4(5用(6(7。語(yǔ)言的特點(diǎn)B語(yǔ)言被稱(chēng)為第四代計(jì)算機(jī)語(yǔ)言其利用豐富的函數(shù)資源,使程序員從繁瑣的程序代碼中解放出來(lái),其最突出的特點(diǎn)就是簡(jiǎn)潔。B了C和N言的冗長(zhǎng)代碼,給用戶帶來(lái)最直觀、最簡(jiǎn)潔的程序開(kāi)發(fā)環(huán)境,下面簡(jiǎn)單介紹一下B的主要特點(diǎn)。語(yǔ)言簡(jiǎn)潔緊湊,使用方便,庫(kù)函數(shù)十分豐富B程序書(shū)寫(xiě)的形式自由利用豐富的庫(kù)函數(shù)避開(kāi)了繁瑣的子程序編程任務(wù)由于庫(kù)函數(shù)都是由本領(lǐng)域的專(zhuān)家編寫(xiě),所以不必?fù)?dān)心函數(shù)的可靠性。高效方便的矩陣和數(shù)組運(yùn)算,B語(yǔ)言不需要定義數(shù)組的維數(shù),并給出了矩陣函數(shù)、特殊矩陣函數(shù)、特殊矩陣專(zhuān)門(mén)的庫(kù)函數(shù),使得在求解信號(hào)處理、這。B。B立M的的C語(yǔ)語(yǔ)的、C型。B的圖形功能強(qiáng)大。在C和N語(yǔ)言里,繪圖都很不容易,但在BB還具有較強(qiáng)的編輯圖形界面的能力。B擁有功能強(qiáng)大的工具箱,主要用來(lái)擴(kuò)充其符號(hào)計(jì)算功能、圖示建模仿真功能、文字處理功能以及與硬件實(shí)施交互功能。源程序的開(kāi)放性強(qiáng)。除內(nèi)部函數(shù)以外,所有B的核心文件和工具箱文件都是可讀可改變的源文件用戶可通過(guò)對(duì)源文件的修改以及加入自己的文件構(gòu)成新的工具箱。2于理自4成放不。1.2語(yǔ)音概述1.2.1語(yǔ)音簡(jiǎn)介負(fù)和進(jìn)行社會(huì)活動(dòng)的最基本手段,因此我們要對(duì)語(yǔ)音信號(hào)進(jìn)行處理分析,優(yōu)化人類(lèi)通人好音。目的是從包含語(yǔ)音的一段信號(hào)中找出語(yǔ)音的起始點(diǎn)及結(jié)束點(diǎn),從而只存儲(chǔ)和處理有效語(yǔ)音信號(hào)。有效的端點(diǎn)檢測(cè)不僅可以減少數(shù)據(jù)的存和處理時(shí)間而且能排除無(wú)聲段的噪聲干擾端點(diǎn)檢測(cè)的困難在于無(wú)聲段或者語(yǔ)音段前后人為呼吸等產(chǎn)生的雜音語(yǔ)音開(kāi)始處的弱摩擦音或弱爆破音以及終點(diǎn)處的鼻音,這些使得語(yǔ)音的端點(diǎn)比較模糊,需要綜合利用語(yǔ)音的各種信號(hào)特征從而確保定位的精確性避免包含噪音信號(hào)和丟失語(yǔ)音信號(hào)近年來(lái)出現(xiàn)了很多種端點(diǎn)檢測(cè)的方法如短時(shí)能量短時(shí)過(guò)零率、語(yǔ)用。安語(yǔ)端差,檢。3于理1.2.2研究背景及意義語(yǔ)音是語(yǔ)言的聲學(xué)表現(xiàn)形式語(yǔ)言是人類(lèi)特有的功能聲音是人類(lèi)常用的信自,機(jī)著、,。。辦的、事和、系,并領(lǐng),者。話些因?yàn)樵趯?shí)際環(huán)境中沒(méi)有完全純凈的語(yǔ)音信號(hào),一般都會(huì)伴有噪聲或其它干擾。語(yǔ)音檢測(cè)的任務(wù)就是判斷待處理信號(hào)是語(yǔ)音還是非語(yǔ)音從輸入信號(hào)中找到語(yǔ)音部分的起止點(diǎn)語(yǔ)音檢測(cè)是語(yǔ)音識(shí)別語(yǔ)音增強(qiáng)以及語(yǔ)音編碼等中的一個(gè)重要環(huán)節(jié)。有效的語(yǔ)音檢測(cè)技術(shù)不僅能減少系統(tǒng)的處理時(shí)間提高系統(tǒng)的處理實(shí)時(shí)性而且能排除無(wú)聲段的噪聲干擾,從而使后續(xù)工作的性能得以較大提高。4于B理第二章語(yǔ)音信號(hào)處理2.1語(yǔ)音信號(hào)特點(diǎn)語(yǔ)音信號(hào)是隨時(shí)間變化的一維信號(hào)由一連串的音組成各個(gè)音的排列有一音信號(hào)般在200H~350z將顯有3KHz~4KHz。從,動(dòng)。在5s的范圍內(nèi),音信的頻譜性和些物特征參基本保持變樣我就可將平過(guò)程的理方和理引入到音信的短時(shí)處中。此,“短時(shí)析技術(shù)”貫于語(yǔ)音析的過(guò)程。成音和音”果為“聲成“聲”濁音”、“清音”三類(lèi)。一個(gè)音節(jié)由元音和輔音構(gòu)成。元音在音節(jié)中占主要部分。所有元音都是濁音。在漢語(yǔ)普通話中,每個(gè)音節(jié)都是輔音一元構(gòu)成的。在信號(hào)處理中,語(yǔ)音按其激勵(lì)形式的不同可分為2類(lèi):(1)濁音當(dāng)氣流通過(guò)聲門(mén)時(shí)如果聲帶的張力剛好使聲帶發(fā)生張弛振蕩式的振蕩產(chǎn)生一股準(zhǔn)周期的氣是1規(guī)率的器。(2)清音當(dāng)氣流通過(guò)聲門(mén)時(shí),如果聲帶不振動(dòng),而在某處收縮,迫使氣流高速通過(guò)這一收縮部分而產(chǎn)生湍流就得到清音清音是由不規(guī)則的激勵(lì)產(chǎn)生的,發(fā)清音時(shí)聲帶不振動(dòng),其時(shí)域波形不具有周期性,自相關(guān)函數(shù)沒(méi)有很強(qiáng)率。5于B理2.1.1語(yǔ)音信號(hào)的“短時(shí)譜”對(duì)于非平穩(wěn)信號(hào),它是非周期的,頻譜隨時(shí)間連續(xù)變化,因此由傅里葉變換得到的頻譜無(wú)法獲知其在各個(gè)時(shí)刻的頻譜特性如果利用加窗的方法從語(yǔ)音流中取出其中一個(gè)短段,再進(jìn)行傅里葉變換,就可以得到該語(yǔ)音的短時(shí)譜。2.1.2基音周期濁為頻估計(jì)低于期在域取。2.2語(yǔ)音信號(hào)預(yù)處理為了消除因?yàn)槿祟?lèi)發(fā)聲器官本身和因一些采集語(yǔ)音信號(hào)的設(shè)備等所引起的,預(yù)能。2.2.1預(yù)加重在進(jìn)行語(yǔ)音信號(hào)數(shù)字處理時(shí)為了獲取一段語(yǔ)音信號(hào)的時(shí)域波形首先要將語(yǔ)音信號(hào)轉(zhuǎn)換成電信號(hào),再用A/D轉(zhuǎn)換器將其變?yōu)殡x散的字化采樣號(hào)。己經(jīng)數(shù)字化語(yǔ)音信號(hào)依次進(jìn)一個(gè)數(shù)據(jù)由于語(yǔ)音號(hào)的平功率受聲門(mén)激勵(lì)和口鼻輻射影響高頻端大約在800Hz以上按6/倍跌即6dBot2倍頻或20dBdc10倍頻),是的,中圖1的6于B理程語(yǔ)音 樣 化 重 窗幀 法理圖1語(yǔ)處理預(yù)加重一般是在語(yǔ)音信號(hào)數(shù)字化之后,用具有6/倍頻程的提升高頻特性的預(yù)加重?cái)?shù)字濾波器來(lái)實(shí)現(xiàn),它一般是一階的數(shù)字濾波器:H(1z (21)式中的值近于1。有要復(fù)信要做預(yù)重號(hào)譜求際頻時(shí)對(duì)測(cè)量值進(jìn)行去加重處理,即加上6/倍頻程的下降的頻率特性來(lái)還原成原來(lái)的特性。2.2.2幀語(yǔ)音信號(hào)檢測(cè)首先要進(jìn)行分幀處理,然后依次判斷每一幀是否為語(yǔ)音的端在窗窗以點(diǎn)。號(hào)同準(zhǔn)為10ms~20ms。圖2幀移7于B理圖2滑,值一為005窗數(shù)號(hào))號(hào):S)· (2-2)由于窗函數(shù)一般取為S(n)中間大兩頭小的光滑函數(shù)這樣的沖激響應(yīng)所對(duì)應(yīng)的濾波器具有低通特性其帶寬和頻率取決于窗函數(shù)的選取用得最多的三種窗函數(shù)是矩形窗、漢明(Hmmig)和漢窗(Hannig),它們的定義如下:矩形窗:,,
0nN1其他
(23)漢窗:40.46cs(n(NnN1,他漢窗: 51cosnN),0 ,其他
(24)(25)式中N數(shù)(n)度影響很大為此應(yīng)該選擇合適的窗口使其短時(shí)參數(shù)能更好地反映語(yǔ)音信號(hào)的特性變化以上這些窗函數(shù)的幅度頻率響應(yīng)都具有低通特性它們的主瓣寬度和旁瓣高度如表11所示。表1-11s長(zhǎng)的各種窗主瓣寬度旁瓣高度矩形 漢明 漢寧主瓣寬度 0.81Hz旁瓣寬度 -13dB
1.19Hz 1.87Hz-43dB -32dB從表中可知最瓣8于理信。2.3語(yǔ)音信號(hào)分析但性,板信。2.3.1時(shí)析語(yǔ)號(hào)是號(hào)時(shí)分析方法應(yīng)用最廣泛的一方法種方法直利用語(yǔ)音號(hào)的時(shí)波形時(shí)分析通常于最基的參數(shù)分均,參。。析特可信信。2.3.2析參預(yù)。1法和9于B理和音為。(1譜號(hào)(m)為X(ew)則Xew)與(m)的n n n n式1-6。X(ew)N1(m)em (26)n nm0語(yǔ)的譜為X(ew)有np(ew)X(ew) (27)n n語(yǔ)的時(shí)率的幅的方所短功譜算法為G(ew)n(2)譜離
X(ew)2 (28)n語(yǔ)信的譜析通同處來(lái)現(xiàn)同信處也為態(tài)濾波是非性題為性題處方由于語(yǔ)音信號(hào)可視為聲門(mén)激勵(lì)信號(hào)和聲道沖擊響應(yīng)的卷積可以對(duì)語(yǔ)音信號(hào)進(jìn)行解卷倒譜能很好表示語(yǔ)音的特征在強(qiáng)噪聲環(huán)境下可通過(guò)倒譜系數(shù)求得倒譜距離使用倒譜距離來(lái)作為端點(diǎn)檢測(cè)的特征。信號(hào)的倒譜也可以定義為信號(hào)的能量譜密度函數(shù)(叻的對(duì)數(shù)的傅里葉級(jí)數(shù)展開(kāi)式的系數(shù),logs(w)c(new (29)nc即倒系,過(guò)譜數(shù)倒距幾d為n ceppd4.3429cepp(3)熵
(c(n)c(n))22(c(n)c(n))2 (2-0)1 0 1 0n1熵(用H表示)物質(zhì)的雜程的一種映。熵H代表X的信息量,X的概率分布越模,越難斷,0于B理n則X為 Hplogp (1)iini12法,過(guò)語(yǔ)誤映。,的。原。1于B理第三章語(yǔ)音信號(hào)檢測(cè)3.1清音濁音檢測(cè)3.1.1信號(hào)采集該設(shè)計(jì)以本人的聲音為分析樣本。可得出聲音的采樣頻率為z且用d電子信息的音頻信sx對(duì)換)并畫(huà)出頻譜圖如圖1所示,程序如下:; %率xwara(i.a';; %讀號(hào)“息”fgr(1))po() %做形tite始音信波形;xlabel(樣點(diǎn)數(shù); %x軸是“樣點(diǎn)數(shù)”yae(幅值; %y軸名字是“幅值”gridon;N2;n=:-1;;a;f0lg())f/nhy;
%對(duì)x換%求值換fgr(1)sbo(2)la; %做圖xlabel(頻率(;yae(幅值');tte原始信號(hào)頻譜圖;grdon;2 n于B n圖1 圖集在200kHz到4.5kHz之間,從聲音頻譜的包絡(luò)來(lái)看,樣本聲音的能量集中在25Hz)以?xún)?nèi)0.4以外高分少所信度似為1.1Hz,由樣理得fs2fo2*2.55Z。3.1.2短時(shí)能量和短時(shí)平均幅度能量是語(yǔ)音的一個(gè)重要特性由于語(yǔ)音信號(hào)的能量隨時(shí)間變化清音和濁音短:E[x(m)(nm[x(m)(nmnm mnN1
(31)其,W(n)函,N窗特當(dāng)形,為:E(m)nm
(32)由此表明,窗口加權(quán)短時(shí)平均能量En相當(dāng)于將“語(yǔ)音平方”信號(hào)通過(guò)一個(gè)單位函數(shù)響應(yīng)為h(n)的線性濾波器的輸出。本次語(yǔ)音信號(hào)的短時(shí)平均能量和短時(shí)平均幅度如下圖2所示及程序如下:N4;Y=aved(inwv';LetY;3于B理LLlnghY)N;fgr(2)E=s(-*0;frii1(L1*40,t=(i0;E(ismtm.ep;dj[(-*4;)ptj,m,'; %繪制短時(shí)平均能量線xlabel(幀數(shù)');ylae(短時(shí)能量';tte時(shí)平均能量;grdon;短度Mns(s)NMnzeo(,L-)20;frii1(L1*40,t=(i0;M()s(b(m)N;dfgr(2)j[(-*4;sbo(2)poj,Mnb); %繪線xlabel(幀數(shù)');yae(短時(shí)平幅度';tte時(shí)平均幅度;grdon;4于B理圖2度由上圖發(fā)現(xiàn),語(yǔ)音濁音段的短時(shí)平均能量遠(yuǎn)遠(yuǎn)大于清音段的短時(shí)平均能量。因,短時(shí)平均能量En的計(jì)算給出了區(qū)分清音段與濁音段的依,即En濁)>En清。根據(jù)En由高到低的跳變可定出濁音變?yōu)榍逡粽Z(yǔ)音的時(shí),En由低向高的跳變可定出清音變?yōu)闈嵋粽Z(yǔ)音的時(shí)刻,而只有濁音才有基音周期,清音的基音周期為零。故清濁音判斷是基音檢測(cè)的第一步。該算法中窗口選擇漢明窗,選擇漢明窗的理由是窗函數(shù)的選取原則為窗函數(shù)截取后的x(n)盡量是中間大兩頭小的光滑函,沖激響應(yīng)對(duì)應(yīng)的濾波器具有低通特性。從漢明窗的構(gòu)成及頻率響應(yīng)特性上看,漢明窗具有這種特性,而矩形窗及漢寧窗則稍遜之。漢明窗雖然主瓣最帶寬大),但旁瓣最通帶外的衰減大),可以有效地克服泄露現(xiàn)象,具有更好的低通特性。故選擇漢明窗而不選擇別的窗函,能使短時(shí)平均能量En更能反映語(yǔ)音信號(hào)的幅度變化。短時(shí)能量函數(shù)的應(yīng):1)可用于區(qū)分清音段與濁音段En值大對(duì)應(yīng)濁音,En值小對(duì)于清音段。2)可用于區(qū)分濁音變?yōu)榍逡艋蚯逡糇優(yōu)闈嵋舻臅r(shí)間(根據(jù)En值的變化趨勢(shì)。3)對(duì)高信噪比的語(yǔ)音信號(hào),也可以用來(lái)區(qū)分有無(wú)語(yǔ)音(語(yǔ)音信號(hào)的開(kāi)始點(diǎn)5于B理En顯。3.1.3短時(shí)過(guò)零率過(guò)零率可以反映信號(hào)的頻譜特性對(duì)于連續(xù)語(yǔ)音信號(hào)可以考察其時(shí)域波形我為“零”。過(guò)數(shù)特別是用來(lái)估計(jì)清音的起始位置和結(jié)束位置。短時(shí)平均過(guò)零率定義為:Zs[[ms[x(mw(nm)nm
(33)在形條下可簡(jiǎn)為2NnZ1 [x(m)[x(mn2NnmnN1
(34)短過(guò)率以略計(jì)的譜性語(yǔ)的??蓾嵋魰r(shí)聲振,管道個(gè)振,由聲波了譜高衰,因濁能集于3Z以下清由聲不動(dòng)聲某部阻塞頻。.為息”的短時(shí)過(guò)零率的波形圖如下圖3所示及程序如下:Znzeo(1(L1)20);frii2(L1*40,tm1=inYi:i20);tpsnYi:+01;Ziua(ptp;dfgr(3)j=1(L-)24];pt,nb; %繪制短率線6于B理xlabel('幀數(shù)');ylabel(短時(shí)過(guò)零率');tte時(shí)過(guò)零率;grdon;圖3 率率為5為1左右,兩但者分布之間有相互交疊的區(qū)域所以單純依賴(lài)于平均過(guò)零率來(lái)準(zhǔn)確判斷清濁音是不可能的在實(shí)際應(yīng)用中往往是采用語(yǔ)音的多個(gè)特征參數(shù)進(jìn)行綜合判決。短時(shí)過(guò)零率的應(yīng)用:1)區(qū)別清音和濁音。清音的過(guò)零率高,濁音的過(guò)零率低。此外,清音和濁音的兩種過(guò)零分布都與高斯分布曲線比較吻合。2)從背景噪聲中找出語(yǔ)音信號(hào)。語(yǔ)音處理領(lǐng)域中的一個(gè)基本問(wèn)題是,如何將一串連續(xù)的語(yǔ)音信號(hào)進(jìn)行適當(dāng)?shù)姆指钜源_定每個(gè)單詞語(yǔ)音的信號(hào)亦即找出每個(gè)單詞的開(kāi)始和終止位置。3)在孤立詞的語(yǔ)音識(shí)別中,可利用能量和過(guò)零作為有話無(wú)話的鑒別。7于B理3.2語(yǔ)音信號(hào)端點(diǎn)檢測(cè)3.2.1基于短時(shí)能量和短時(shí)過(guò)零率的雙門(mén)限端點(diǎn)檢測(cè)原理雙門(mén)限法是利用短時(shí)能量和過(guò)零率的乘積進(jìn)行檢測(cè)的在基于短時(shí)能量和過(guò)零率的雙門(mén)限端點(diǎn)檢測(cè)算法中首先為短時(shí)能量和過(guò)零率分別確定兩個(gè)門(mén)限一個(gè)過(guò)過(guò)。:,由于采集的聲音信號(hào)中最初的短時(shí)段多為無(wú)聲或背景噪聲,這樣就可以利用已知為“靜態(tài)”的最初幾幀(一般取10幀信計(jì)算過(guò)零閥值z(mì)r及高值amp(低量閥)和amp1高能閥)。過(guò)零率公式:r(i)N1x(n)x(n) (35)i in1計(jì)算amp2和am1時(shí)首計(jì)最初10幀信號(hào)每的短平能或均幅度E,最大記為max,小為min。本文在計(jì)算短時(shí)能量之前濾擾是z或z言,代為)量:;;。過(guò)限ap1、am2、zr1、zc2,其中am2、zc2分別為短易外amp1、zr1是比高門(mén),數(shù)比大信必達(dá)一定的強(qiáng)該限可被過(guò)低限超未就語(yǔ)信的始可能是時(shí)間很短的噪聲引起的。高門(mén)限被超過(guò)則可以基本確信是由于語(yǔ)音信號(hào)引起的。8于B理程量s率的到個(gè)。能通到續(xù)。3.2.2雙析1、置雙在B軟件環(huán)境下進(jìn)行仿真實(shí)驗(yàn)。文中語(yǔ)音信號(hào)樣本是在實(shí)驗(yàn)室安靜環(huán)境下采用麥克風(fēng)進(jìn)行錄音,以wav格式存儲(chǔ)為較純凈的語(yǔ)音樣本實(shí)驗(yàn)所加的噪聲為偽隨機(jī)加性高斯白噪聲實(shí)驗(yàn)中對(duì)較純凈語(yǔ)音樣本進(jìn)行加噪,形成不同SNR的帶噪語(yǔ)音樣本,然后分別對(duì)較純凈的語(yǔ)音樣本和加噪后的語(yǔ)音樣本進(jìn)行語(yǔ)音端點(diǎn)檢測(cè)并對(duì)它們的檢測(cè)結(jié)果進(jìn)行比較在語(yǔ)音端點(diǎn)檢測(cè)之前首先要對(duì)被測(cè)的語(yǔ)音信號(hào)進(jìn)行預(yù)處理等,包括分幀加窗等。文中加Hmmaing窗通過(guò)特性為(1-0941的波預(yù)加對(duì)他數(shù)進(jìn)設(shè)置如設(shè)置音幀度,移長(zhǎng),T取2,門(mén)限閥值設(shè)置等。2、性能準(zhǔn)則在各種各樣的信號(hào)處理系統(tǒng)中噪聲信號(hào)相對(duì)于有用信號(hào)而言所造成的都是干擾和破壞作用但是噪聲卻是普遍存在的噪聲信號(hào)一般分為加性噪聲和非況。(1聲。態(tài)分布,記為N(,2),其中和2為分布的參數(shù),分別為高斯分布的期望和方差特別當(dāng)=0,2=1時(shí),X的分布為標(biāo)準(zhǔn)正態(tài)分布。(2)信噪比比,,:92s(于B2s(SNR10gSN其中S、N分別表示原始信號(hào)功率與噪聲信號(hào)功.而波形信號(hào)計(jì)算式為:R10(e(n)2)中I為原始語(yǔ)音信號(hào),n;p1為原始信號(hào)功率p2為噪聲信號(hào)功率。文中采用的端點(diǎn)檢測(cè)通過(guò)在較純凈語(yǔ)音信號(hào)中加入加性高斯噪聲然后對(duì)其進(jìn)行語(yǔ)音端點(diǎn)檢測(cè)改變信噪比值觀察在高信噪比和低信噪比條件下雙門(mén)限語(yǔ)音端點(diǎn)檢測(cè)結(jié)果通過(guò)實(shí)驗(yàn)仿真圖比較和分析噪聲對(duì)各算法語(yǔ)音端點(diǎn)檢測(cè)結(jié)果的影響。3、分析基于短時(shí)能量和短時(shí)過(guò)零率的雙門(mén)限語(yǔ)音端點(diǎn)檢測(cè)算法是結(jié)合短時(shí)能量和過(guò)零率各自?xún)?yōu)點(diǎn)來(lái)進(jìn)行檢測(cè),雙門(mén)限端點(diǎn)檢測(cè)圖中紅色豎線用來(lái)表示語(yǔ)音起點(diǎn)線,綠色豎線表示語(yǔ)音終點(diǎn)線,其檢測(cè)的實(shí)驗(yàn)仿真圖如3.7所示:functionsnr=SNR(I,In)p1=1/length(I)*norm(I)^2;p2=1/length(I)*norm(In-I)^2;snr=10*log(p1/p2);endtm1efaexllnt(x-),F(xiàn)rmLn,F(xiàn)ramln);tmp=enrae(x2:engh()),F(xiàn)rmen,F(xiàn)raee;sgs(p.tp<;difs=(mp1tmp)>002;zrsmsin.dfs,2);圖4端檢測(cè)音語(yǔ)測(cè)圖0于B理圖5SN=2.7圖圖6SN=2.7圖圖4從語(yǔ)成。圖5比S7測(cè)。圖6可比7終。圖4圖5圖6純(7比(7信,,,率容。1于B理3.3基于倒譜特征的語(yǔ)音端點(diǎn)檢測(cè)3.3.1征倒譜能很好表示語(yǔ)音的特征,因此在大多數(shù)語(yǔ)音識(shí)別系統(tǒng)中選擇倒譜系數(shù)作為輸入特征矢量在噪聲環(huán)境下短時(shí)能量與其它特征參數(shù)都不能很好地區(qū)分語(yǔ)音段與非語(yǔ)音段,因此可采用倒譜系數(shù)來(lái)作為端點(diǎn)檢測(cè)的參數(shù),運(yùn)用倒譜特征來(lái)檢測(cè)語(yǔ)音端點(diǎn)也是目前語(yǔ)音識(shí)別系統(tǒng)中比較典型的方法之一。3.3.2離號(hào)),倒換為c(n。信號(hào)倒的一種義是信號(hào)能量信倒譜的一種定義是信號(hào)能量譜密度函數(shù)S()的對(duì)數(shù)的傅里葉反變換,或者可以將號(hào)s(n的倒譜c(n)看成是gS()即gS()c(nen (36)n式,c(n)為倒系,且c(n)=c(n),c(0)算2=1gS() (7)23.3.3理如何很好地提取語(yǔ)音信號(hào)聲道特性的譜包絡(luò),并用少量參數(shù)表示出來(lái),在語(yǔ)音識(shí)別、語(yǔ)音合成和語(yǔ)音編碼中都是最重要的問(wèn)題。按照語(yǔ)音產(chǎn)生模型的理論,語(yǔ)音信號(hào)是由激勵(lì)信號(hào)與聲道響應(yīng)相卷積產(chǎn)生的要想提取反映聲道特性的譜包,只取。根據(jù)Parseval定理,對(duì)于兩個(gè)不同信號(hào)(n)和s(n)其倒譜差異的均方值0 1用倒譜距離表示:2 d2 1gS()gS()2dcep 1 2 =(c(n)c(n))2 (38)1 0ncS式中d為倒譜距離,(n)和c(n)分別是對(duì)應(yīng)于譜密度函數(shù)()和S()cScep 0 1 0 1的倒譜系數(shù)。信號(hào)與其倒譜是一一對(duì)應(yīng)的變換,因此倒譜的均方距離可以反映兩個(gè)信號(hào)比如語(yǔ)音與背景噪)譜的,譜離作端測(cè)判參屬于2于B理。1算用C中避免了復(fù)對(duì)數(shù)中相位卷繞的繁瑣處理C譜中用C。C倒數(shù)(8~32)后可較好地表征道特性但它是按實(shí)際頻率尺度的倒譜系數(shù)C美爾倒譜系數(shù)算法效率較高,既考慮了聲道激勵(lì),又兼顧人耳聽(tīng)覺(jué),理論上具有一定的可行性。(1)線性預(yù)測(cè)系數(shù)LPC通過(guò)用C特干語(yǔ)樣的性合近計(jì)按某析幀(時(shí))內(nèi)實(shí)際的各語(yǔ)音樣本與各預(yù)測(cè)得到的樣本間差值的平方和最小準(zhǔn)則,可以決定唯一的一組預(yù)測(cè)系數(shù),即C。(2)C譜C性預(yù)測(cè)分析推定的聲道模型系統(tǒng)函數(shù)為語(yǔ)音信號(hào)的倒譜指的是信號(hào)能量譜密度函數(shù)S()的對(duì)數(shù)的傅立葉變換用測(cè)量倒譜距離的方法來(lái)判斷每一幀信號(hào)是語(yǔ)音信號(hào)還是噪聲信號(hào)根據(jù)每一幀信號(hào)與噪聲的倒譜距離的軌跡就可以進(jìn)行語(yǔ)音端點(diǎn)檢測(cè)C(LC于線測(cè)系數(shù)相,避相,復(fù)且C用T算在B中采用迭代算法計(jì)算C:n%算C數(shù);;;;當(dāng)n<n_lpc時(shí),采用下述算法來(lái)計(jì)算c譜rc;r1;endend3于B理;;rk;r1ifi=1%對(duì)于階數(shù)為1,2要特殊處理MC(1,j)=lpcc1(j)+a*MC(1,j+1);endifi==2MC(2,j)=(1-a^2)*MC(1,j+1)+a*MC(2,j+1);endendendlpcM(,);圖7圖2驟的C譜出:(1)預(yù)處理。對(duì)z采樣信號(hào)進(jìn)行預(yù)加重處理,然后分幀加窗,幀長(zhǎng)取30msS(240個(gè)采樣點(diǎn)),移1,對(duì)加20點(diǎn)hg窗。(2離d。數(shù)p取1,抽樣信號(hào)起始10幀cepsi是背景噪聲,利用這10幀的前5幀倒譜系數(shù)的統(tǒng)計(jì)平均值作為背景嗓聲倒譜系數(shù)的估計(jì)值用向C表(315計(jì)這10幀后5幀譜平0中c(n)表,c(n)1 0為對(duì)應(yīng)于C的。0(3)算d值逐計(jì)倒系數(shù),然由幀號(hào)倒系和噪cep4于B理過(guò)(3-15)式計(jì)算倒譜距離。(4)確定判決門(mén)限。采用類(lèi)似于短時(shí)能里檢測(cè)法的動(dòng)態(tài)門(mén)限判決準(zhǔn)則,設(shè)定兩個(gè)門(mén)限1
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 【勞動(dòng)合同】計(jì)量工程技術(shù)人員勞動(dòng)合同8篇
- 2024年度民主生活會(huì)點(diǎn)評(píng)模板
- 小學(xué)六年級(jí)下英語(yǔ)試卷
- 英語(yǔ)小學(xué)試卷模板
- 醫(yī)院投藥合同范本
- 汽車(chē)電子控制技術(shù)??荚囶}+答案
- N2級(jí)護(hù)理??荚囶}含答案
- 農(nóng)資化肥合同范本
- 中醫(yī)康復(fù)治療技術(shù)模擬考試題+參考答案
- 開(kāi)荒保潔租房合同范本
- 新聞采訪與寫(xiě)作課件第十五章其他報(bào)道樣式的寫(xiě)作
- 小學(xué)語(yǔ)文單元整體作業(yè)設(shè)計(jì)案例(五年級(jí)下冊(cè)第六單元)
- 解讀 國(guó)家數(shù)據(jù)局首批20個(gè)“數(shù)據(jù)要素x”典型案例-31正式版-WN8
- 《跨境直播運(yùn)營(yíng)》課件-跨境直播的意義和要素
- 3 學(xué)會(huì)反思(教學(xué)設(shè)計(jì))部編版道德與法治六年級(jí)下冊(cè)
- 第一單元 歌唱祖國(guó)-《 中華人民共和國(guó)國(guó)歌》課件 2023-2024學(xué)年人音版初中音樂(lè)七年級(jí)上冊(cè)
- 2024-2030年中國(guó)腎性貧血療法行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略分析報(bào)告
- DL∕T 1281-2013 燃煤電廠固體廢物貯存處置場(chǎng)污染控制技術(shù)規(guī)范
- 辦公家具采購(gòu)項(xiàng)目質(zhì)量保證售后服務(wù)承諾書(shū)
- 2024年時(shí)政試題庫(kù)(b卷)
- 2024助貸委托服務(wù)協(xié)議合同模板
評(píng)論
0/150
提交評(píng)論