3.2語(yǔ)音信號(hào)處理第章ppt課件_第1頁(yè)
3.2語(yǔ)音信號(hào)處理第章ppt課件_第2頁(yè)
3.2語(yǔ)音信號(hào)處理第章ppt課件_第3頁(yè)
3.2語(yǔ)音信號(hào)處理第章ppt課件_第4頁(yè)
3.2語(yǔ)音信號(hào)處理第章ppt課件_第5頁(yè)
已閱讀5頁(yè),還剩42頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、14.114.1概述概述14.214.2語(yǔ)音特性、人耳感知特性及噪聲特性語(yǔ)音特性、人耳感知特性及噪聲特性14.314.3濾波法語(yǔ)音增強(qiáng)技術(shù)濾波法語(yǔ)音增強(qiáng)技術(shù)14.414.4利用相關(guān)特性的語(yǔ)音增強(qiáng)技術(shù)利用相關(guān)特性的語(yǔ)音增強(qiáng)技術(shù)14.514.5非線性處理法語(yǔ)音增強(qiáng)技術(shù)非線性處理法語(yǔ)音增強(qiáng)技術(shù)14.614.6減譜法語(yǔ)音增強(qiáng)技術(shù)減譜法語(yǔ)音增強(qiáng)技術(shù)14.714.7利用利用WeinerWeiner濾波法的語(yǔ)音增強(qiáng)技術(shù)濾波法的語(yǔ)音增強(qiáng)技術(shù)14.1 14.1 概述概述v語(yǔ)音信號(hào)作為信息的最普遍最直接的表達(dá)方式,在許多領(lǐng)域語(yǔ)音信號(hào)作為信息的最普遍最直接的表達(dá)方式,在許多領(lǐng)域具有廣泛的應(yīng)用前景。現(xiàn)實(shí)生活中的語(yǔ)音不

2、可避免的要受到具有廣泛的應(yīng)用前景。現(xiàn)實(shí)生活中的語(yǔ)音不可避免的要受到環(huán)境的影響。環(huán)境的影響。v噪聲分類:噪聲分類:v 按類別:可分為環(huán)境噪聲等的加性噪聲和殘響及電器線路按類別:可分為環(huán)境噪聲等的加性噪聲和殘響及電器線路干擾等的乘法性噪聲干擾等的乘法性噪聲v 按性質(zhì):平穩(wěn)噪聲和非平穩(wěn)噪聲按性質(zhì):平穩(wěn)噪聲和非平穩(wěn)噪聲vLomBardLomBard現(xiàn)象:在噪聲環(huán)境下,說(shuō)話者情緒會(huì)發(fā)生變化,從現(xiàn)象:在噪聲環(huán)境下,說(shuō)話者情緒會(huì)發(fā)生變化,從而引起聲帶的變化對(duì)語(yǔ)音處理系統(tǒng)的影響相對(duì)較?。┒鹇晭У淖兓瘜?duì)語(yǔ)音處理系統(tǒng)的影響相對(duì)較?。﹪?guó)內(nèi)外語(yǔ)音信號(hào)處理研究成果國(guó)內(nèi)外語(yǔ)音信號(hào)處理研究成果 目前國(guó)內(nèi)外的研究成果從增

3、強(qiáng)思想上主要分為以下三類:1采用語(yǔ)音增強(qiáng)算法,提高語(yǔ)音識(shí)別系統(tǒng)前端預(yù)處理的抗噪聲能力,提高輸入信號(hào)的信噪比。(與后端應(yīng)用無(wú)關(guān))2第二類方法是尋找穩(wěn)健的耐噪聲的語(yǔ)音特征參數(shù)。 如采用短時(shí)修正的相干系數(shù)Short-Time Modified Coherence Coefficient,簡(jiǎn)稱為SMC作為語(yǔ)音特征參數(shù)。3第三類方法是基于模型參數(shù)適應(yīng)化的噪聲補(bǔ)償算法,如針對(duì)加法性噪聲的HMM合成法,和針對(duì)乘法性噪聲的Stochastic Matching法等。通常只考慮到噪聲環(huán)境是平穩(wěn)的,在低信噪比語(yǔ)音以及非平穩(wěn)噪聲環(huán)境中的效果并不理想。14.214.2語(yǔ)音特性、人耳感知特性及噪語(yǔ)音特性、人耳感知特性及

4、噪聲特性聲特性14.2.114.2.1語(yǔ)音特性語(yǔ)音特性語(yǔ)音信號(hào)是一種非平穩(wěn)的隨機(jī)信號(hào)語(yǔ)音信號(hào)是一種非平穩(wěn)的隨機(jī)信號(hào)任何語(yǔ)言的語(yǔ)音都有元音和輔音兩種音素,根據(jù)發(fā)音任何語(yǔ)言的語(yǔ)音都有元音和輔音兩種音素,根據(jù)發(fā)音機(jī)理的不同,輔音又可以分為清輔音和濁輔音。機(jī)理的不同,輔音又可以分為清輔音和濁輔音。語(yǔ)音信號(hào),作為非平穩(wěn)、非遍歷隨機(jī)過(guò)程的樣本函數(shù),語(yǔ)音信號(hào),作為非平穩(wěn)、非遍歷隨機(jī)過(guò)程的樣本函數(shù),其短時(shí)譜的統(tǒng)計(jì)特性在語(yǔ)音增強(qiáng)中又著舉足輕重的其短時(shí)譜的統(tǒng)計(jì)特性在語(yǔ)音增強(qiáng)中又著舉足輕重的作用。(據(jù)中心極限定理,語(yǔ)音的短時(shí)譜的統(tǒng)計(jì)特作用。(據(jù)中心極限定理,語(yǔ)音的短時(shí)譜的統(tǒng)計(jì)特性服從高斯分布。)性服從高斯分布。)1

5、4.2.2 人耳感知特性對(duì)于聲波頻率高低的感覺(jué)與實(shí)際頻率的高低不呈線性關(guān)系,而近似為對(duì)數(shù)關(guān)系;對(duì)頻率的分辨能力受聲強(qiáng)的影響;對(duì)語(yǔ)音信號(hào)的幅度譜較為敏感,對(duì)相位不敏感。人耳掩蔽效應(yīng):產(chǎn)生一個(gè)聲音由于另外一個(gè)聲音的出現(xiàn)而導(dǎo)致該聲音能被感知的閥值提高的現(xiàn)象。 語(yǔ)音增強(qiáng)的最終效果度量是人耳的主觀感覺(jué),所以在語(yǔ)音增強(qiáng)中可以利用人耳感知特性來(lái)減少運(yùn)算代價(jià)。v14.2.3 噪聲特性噪聲特性v噪聲可分為:噪聲可分為:v平穩(wěn)和非平穩(wěn)噪聲平穩(wěn)和非平穩(wěn)噪聲v加法性噪聲:沖激噪聲、周期噪聲、寬帶噪聲、語(yǔ)加法性噪聲:沖激噪聲、周期噪聲、寬帶噪聲、語(yǔ)音干擾音干擾v乘法性噪聲:殘響及傳輸網(wǎng)絡(luò)的電路噪聲非加性乘法性噪聲:殘響

6、及傳輸網(wǎng)絡(luò)的電路噪聲非加性噪聲往往可以通過(guò)某種變換,如同態(tài)濾波,轉(zhuǎn)為加噪聲往往可以通過(guò)某種變換,如同態(tài)濾波,轉(zhuǎn)為加性噪聲)性噪聲)v(1沖激噪聲:例如放電,打火,爆炸都會(huì)引起沖激噪聲,它的時(shí)域波形是類似于沖激函數(shù)的窄脈沖。消除沖激噪聲影響的方法通常有兩種:對(duì)帶噪語(yǔ)音信號(hào)的幅度求均值,將該均值做為判斷閾,凡是超過(guò)該閾值的均判為沖激噪聲,在時(shí)域中將其濾除;當(dāng)沖激脈沖不太密集時(shí),也可以通過(guò)某些點(diǎn)內(nèi)插的方法避開或者平滑掉沖激點(diǎn),從而能在重建語(yǔ)音信號(hào)去掉沖激噪聲。v(2周期噪聲:最常見(jiàn)的有電動(dòng)機(jī),風(fēng)扇之類周期運(yùn)轉(zhuǎn)的機(jī)械所發(fā)出的周期噪聲,50Hz交流電源哼哼聲也是周期噪聲。在頻譜圖上它們表現(xiàn)為離散的窄譜,

7、通??梢圆捎孟莶ㄆ鞣椒ㄓ枰詾V除。v3寬帶噪聲:說(shuō)話時(shí)同時(shí)伴隨著呼吸引起的噪聲,隨機(jī)噪聲源產(chǎn)生的噪聲,以及量化噪聲等都可以視為寬帶噪聲,應(yīng)用中常近似為Gauss噪聲或白噪聲。其顯著特點(diǎn)是噪聲頻譜遍布于語(yǔ)音信號(hào)頻譜之中,導(dǎo)致消除噪聲較為困難。一般需要采取非線性處理方法。v(4語(yǔ)音干擾:干擾語(yǔ)音信號(hào)和待傳語(yǔ)音信號(hào)同時(shí)在一個(gè)信道中傳輸所造成語(yǔ)音干擾稱為語(yǔ)音干擾。區(qū)別有用語(yǔ)音和干擾語(yǔ)音的基本方法是利用它們的基音差別??紤]到一般情況下兩種語(yǔ)音的基音不同,也不成整數(shù)倍,這樣可以用梳狀濾波器提取基音和各次諧波,再恢復(fù)出有用語(yǔ)音信號(hào)。v(5傳輸噪聲:這是傳輸系統(tǒng)的電路噪聲。與背景噪聲不同,它在時(shí)間域里是語(yǔ)音和噪

8、聲的卷積。處理這種噪聲可以采用同態(tài)處理的方法,把非加性噪聲變換為加性噪聲來(lái)處理。v通過(guò)語(yǔ)音增強(qiáng)技術(shù)來(lái)改善語(yǔ)音質(zhì)量的過(guò)程如圖14-1所示14.314.3濾波法語(yǔ)音增強(qiáng)技術(shù)濾波法語(yǔ)音增強(qiáng)技術(shù)14.3.1 陷波器法陷波器法 對(duì)于周期噪聲采用陷波器是較為簡(jiǎn)便和對(duì)于周期噪聲采用陷波器是較為簡(jiǎn)便和有效的方法,其基本思路和要求是設(shè)計(jì)的陷有效的方法,其基本思路和要求是設(shè)計(jì)的陷波器的幅頻曲線的凹處對(duì)應(yīng)于周期噪聲的基波器的幅頻曲線的凹處對(duì)應(yīng)于周期噪聲的基頻和各次諧波如圖頻和各次諧波如圖14.2所示,并通過(guò)合理設(shè)所示,并通過(guò)合理設(shè)計(jì)使這些基頻處的陷波寬度足夠窄。計(jì)使這些基頻處的陷波寬度足夠窄。v簡(jiǎn)單的數(shù)字陷波器的傳

9、遞函數(shù)如下:簡(jiǎn)單的數(shù)字陷波器的傳遞函數(shù)如下:v 由由 可以看出可以看出 的頻率將的頻率將被濾除掉。根據(jù)數(shù)字信號(hào)處理的基本知識(shí)可以知道,數(shù)字濾被濾除掉。根據(jù)數(shù)字信號(hào)處理的基本知識(shí)可以知道,數(shù)字濾波器的極零點(diǎn)接近時(shí),信號(hào)頻譜變化較為緩慢,而在陷波頻波器的極零點(diǎn)接近時(shí),信號(hào)頻譜變化較為緩慢,而在陷波頻率處急劇衰減,故引入反饋:率處急劇衰減,故引入反饋:v 當(dāng)當(dāng) 越接近越接近1時(shí),分母在零點(diǎn)附近處由抵消作用,梳齒帶時(shí),分母在零點(diǎn)附近處由抵消作用,梳齒帶寬變得越窄,通帶較為平坦,陷波效果越好。其模擬框圖如寬變得越窄,通帶較為平坦,陷波效果越好。其模擬框圖如圖圖14-3所示所示TzzH1)(jwTjwee

10、H1)()(/為正整數(shù)TTNf TTbzzzH11)(bv14.3.2 自適應(yīng)濾波器v1.基本型v 自適應(yīng)濾波器最重要的特性是能有效地在未知環(huán)境中跟蹤時(shí)變的輸入信號(hào),使輸出信號(hào)達(dá)到最優(yōu),因此可以用來(lái)構(gòu)成自適應(yīng)的噪聲消除器,其基本原理框圖如圖14-4所示。v圖中s(t)為語(yǔ)音信號(hào),n(t)為未知噪聲信號(hào),y(t)帶噪語(yǔ)音信號(hào),r(t)為參考噪聲輸入, r(t)與s(t)無(wú)關(guān),而與n(t)相關(guān)。v圖14-4中將 看作是r(t) 估計(jì)y(t)而得到的誤差,據(jù)最小均方準(zhǔn)則,當(dāng) 為最小時(shí)的誤差 也就是降噪后的 。這里采用LMS遞推算法簡(jiǎn)要說(shuō)明橫向?yàn)V波器系數(shù)的求法。)(t)(,ts| )()(|2,trt

11、yE)(,ts設(shè)橫向?yàn)V波器的加權(quán)向量記為 ,誤差信號(hào) ,則有: 為噪聲 的輸入向量。設(shè)代價(jià)函數(shù)為: 對(duì)上式求導(dǎo),可以得到最小均方意義下的最佳系數(shù)向量為:下面不加證明的給出Widrow-Hoff的LMS算法加權(quán)系數(shù)遞推公式:W)(k)()()()()()(,kRkWkykrkykT)(kR)()(),()(kykRERkRkRERryTrr| )()()(|2kRkWkyEJTXYrroptRRW1)1(),()() 1()(總輸出功率kRkkWkWv2對(duì)稱自適應(yīng)去相關(guān)的改進(jìn)型v 實(shí)際應(yīng)用中,參考輸入 r(t)除包含與噪聲相關(guān)的參考噪聲外,還可能含有低電平的信號(hào)分量。圖14-5給出了原始語(yǔ)音信號(hào)

12、 s(t)通過(guò)一個(gè)傳輸函數(shù)為 J(t)的信道泄露到參考輸入中的情景。為了解決信號(hào)分量的泄露導(dǎo)致系統(tǒng)性能惡化的問(wèn)題,D.Van Compernolle 提出了對(duì)稱自適應(yīng)去相關(guān)SAD算法,其基本原理如圖14-6所示。v3 用延遲的改進(jìn)型v 從圖14-4和圖14-6中可以看出自適應(yīng)濾波器需要有與n(t)相關(guān)的參考噪聲r(shí)(t)輸入,這在實(shí)際應(yīng)用中往往比較困難,如果噪聲相關(guān)性較弱時(shí)例如白噪聲),有如圖14-7所示的改進(jìn)型。14.414.4利用相關(guān)特性的語(yǔ)音增強(qiáng)技術(shù)利用相關(guān)特性的語(yǔ)音增強(qiáng)技術(shù)v14.4.1 自相關(guān)處理抗噪法語(yǔ)音增強(qiáng)技術(shù)自相關(guān)處理抗噪法語(yǔ)音增強(qiáng)技術(shù)v 此方法利用語(yǔ)音信號(hào)本身相關(guān),而語(yǔ)音與噪聲

13、、此方法利用語(yǔ)音信號(hào)本身相關(guān),而語(yǔ)音與噪聲、噪聲與噪聲可認(rèn)為互不相關(guān)的性質(zhì),對(duì)帶噪語(yǔ)音信噪聲與噪聲可認(rèn)為互不相關(guān)的性質(zhì),對(duì)帶噪語(yǔ)音信號(hào)作自相關(guān)處理,可以得到與不帶噪語(yǔ)音信號(hào)同樣號(hào)作自相關(guān)處理,可以得到與不帶噪語(yǔ)音信號(hào)同樣的自相關(guān)幀序列。下面說(shuō)明:的自相關(guān)幀序列。下面說(shuō)明:v設(shè)帶噪語(yǔ)音為:設(shè)帶噪語(yǔ)音為:)()()(tntsty其中, 為純凈語(yǔ)音信號(hào), 為近似白噪聲的噪聲信號(hào)??紤]到他們的短時(shí)平穩(wěn)的特性,計(jì)算 的自相關(guān)函數(shù) 式中 為短時(shí)平穩(wěn)所加的時(shí)間窗函數(shù)。上式第一項(xiàng)為純凈語(yǔ)音信號(hào)的自相關(guān),第二項(xiàng)到第四項(xiàng)分別為語(yǔ)音與噪聲、噪聲與噪聲的相關(guān)函數(shù)。由于語(yǔ)音信號(hào)與噪聲、噪聲與噪聲可認(rèn)為互相不相關(guān)。所以上

14、式第二項(xiàng)到第四項(xiàng)的積分結(jié)果可認(rèn)為是近似為零或甚小。這樣就有:tydttwtytyTR)()()(1)(tdttwtntstntsT)()()()()(1tdttwtntntstntntststsT)()()()()()()()()(1)(ty)(ts)(tn)(tw)()()()(1)()()(1)(sttyRdttwtstsTdttwtytyTR 即 與噪聲無(wú)關(guān),只約等于純凈語(yǔ)音的自相關(guān)函數(shù) 。所以,如果將自相關(guān)系數(shù)作為識(shí)別系統(tǒng)的特征,就可以達(dá)到抗噪的目的。 由于自相關(guān)處理時(shí)會(huì)產(chǎn)生二次諧波,因此不宜直接用帶噪語(yǔ)音信號(hào)y(t)的自相關(guān)系數(shù)作為識(shí)別特征,而應(yīng)采用幀信號(hào)平方的自相關(guān)系數(shù)作為識(shí)別特征

15、。即如圖14-8所示。 )(sR)(yRv14.4.2 利用復(fù)數(shù)幀段主分量特征的降噪方法利用復(fù)數(shù)幀段主分量特征的降噪方法v 復(fù)數(shù)幀段特征量就是采用相繼的復(fù)數(shù)幀組成的特復(fù)數(shù)幀段特征量就是采用相繼的復(fù)數(shù)幀組成的特征參數(shù)矢量作為語(yǔ)音識(shí)別輸入特征量的方法,它是征參數(shù)矢量作為語(yǔ)音識(shí)別輸入特征量的方法,它是在語(yǔ)音識(shí)別中利用語(yǔ)音幀間相關(guān)信息最直接最簡(jiǎn)便在語(yǔ)音識(shí)別中利用語(yǔ)音幀間相關(guān)信息最直接最簡(jiǎn)便的方法。的方法。v v 為了在復(fù)數(shù)幀特征中進(jìn)一步加強(qiáng)降噪措施,可利為了在復(fù)數(shù)幀特征中進(jìn)一步加強(qiáng)降噪措施,可利用主分量分析方法,求取復(fù)數(shù)幀段參數(shù)特征的主分用主分量分析方法,求取復(fù)數(shù)幀段參數(shù)特征的主分量特征。方法如下:量

16、特征。方法如下:v 設(shè)有設(shè)有N個(gè)個(gè)D維樣本維樣本 ,則根據(jù)這些抽樣樣本,由,則根據(jù)這些抽樣樣本,由14-11和和14-14兩式求取相關(guān)矩陣兩式求取相關(guān)矩陣R。),.,2 , 1(,.,11NiyyyYtiDiiiDDDDDrrrrrrrrR12222111211NyyyyyyNssssrNnnddNnjnjiniijjjiiijij11)(1 這里, 是相關(guān)系數(shù), 是樣本的方差或協(xié)方差, 是樣本各維變量的均值。然后求出滿足式14-13的矩陣R的本征值 和本征向量 這里,D維的本征向量 又被稱為主分量基向量。ijrijsdyi),.,2 , 1(DiAiAAR),.,2 , 1(DiAi14.5

17、14.5非線性處理法語(yǔ)音增強(qiáng)技術(shù)非線性處理法語(yǔ)音增強(qiáng)技術(shù)v14.5.1 中心削波法v 對(duì)于噪聲頻譜遍布于語(yǔ)音信號(hào)頻譜之中的寬帶噪聲,如果噪聲振幅比大部分的語(yǔ)音信號(hào)低,則削去低振幅成分也就削去了寬帶噪聲。v 我們?cè)陬l域中采用中心限幅的方法,即讓帶噪語(yǔ)音信號(hào)通過(guò)一限幅濾波器,高幅度頻譜可以通過(guò)而低幅不允許通過(guò),實(shí)現(xiàn)抗噪。v14.5.2 通態(tài)濾波法通態(tài)濾波法v 加性噪聲適用線性濾波,非加性則適用同態(tài)濾波加性噪聲適用線性濾波,非加性則適用同態(tài)濾波法,其降噪過(guò)程的原理框圖如圖法,其降噪過(guò)程的原理框圖如圖14-9所示。所示。 同臺(tái)濾波器可以用于識(shí)別系統(tǒng)的預(yù)處理,常適用倒譜這一特征,所以求出帶非加性噪聲的語(yǔ)

18、音信號(hào)的倒譜以后,可以利用倒譜均值規(guī)整CMN降噪聲技術(shù),清楚帶非加性噪聲的語(yǔ)音信號(hào)的倒譜的噪聲成分,從而獲得語(yǔ)音增強(qiáng)的倒譜。 利用CMN方法抑制由輸入和傳輸電路系統(tǒng)引起的乘法性噪聲的原理是: 設(shè)對(duì)于第t幀語(yǔ)音,帶噪語(yǔ)音的倒譜是 、純凈語(yǔ)音的倒譜是 、噪聲的倒譜是 、除噪后增強(qiáng)語(yǔ)音的倒譜是 ,則有關(guān)系:)(tCsn)(tCs)(tCn)(tCs)()()(tCtCtCnssn 設(shè) 為整個(gè)帶噪語(yǔ)音輸入語(yǔ)句共N幀的倒譜平均值,由于每一幀的噪聲的倒譜相同,則有: 利用CMN法處理得到的語(yǔ)音增強(qiáng)的倒譜為:NtsNtsnsnssnsnstCNtCtCtCNtCtCtCtCtC11)(1)()()(1)()

19、()()()()()(1)(1tCtCNtCnNtssn)(tCsn 以上的方法是傳統(tǒng)的CMN方法,由于它用整個(gè)帶噪語(yǔ)音輸入語(yǔ)句共N幀來(lái)求倒譜平均值 ,所以又稱為長(zhǎng)時(shí)CMN方法。 這種方法存在兩個(gè)問(wèn)題,一是由于輸入語(yǔ)句中音素的出現(xiàn)頻率會(huì)改變 的大小,直接影響規(guī)整的效果。二是必須到終點(diǎn)為止計(jì)算完成以后,才能算出 ,影響了實(shí)時(shí)性。為此,可以仿照HMM參數(shù)的最大后驗(yàn)概率MAP學(xué)習(xí)算法,利用MAP算法來(lái)提高計(jì)算 的精度,即:MAP算法是漸進(jìn)自適應(yīng)方式,樣本是逐個(gè)輸入的,k隨著逐個(gè)輸入而增加。式中 是自適應(yīng)訓(xùn)練系數(shù),可由實(shí)驗(yàn)確定。是表示先驗(yàn)部分的初始估計(jì)值,可由學(xué)習(xí)數(shù)據(jù)確定。)(tCsn)(tCsn)(

20、tCsn)(tCsnktCCtCtCktsnsnsnsn10)()()(0snC14.614.6減譜法語(yǔ)音增強(qiáng)技術(shù)減譜法語(yǔ)音增強(qiáng)技術(shù)v14.6.1 基本原理基本原理v 減譜法是處理寬帶噪聲較為傳統(tǒng)和有效的方法,減譜法是處理寬帶噪聲較為傳統(tǒng)和有效的方法,其基本思想是在假定加性噪聲與短時(shí)平穩(wěn)的語(yǔ)音信其基本思想是在假定加性噪聲與短時(shí)平穩(wěn)的語(yǔ)音信號(hào)相互獨(dú)立的條件下,從帶噪語(yǔ)音的功率譜中減去號(hào)相互獨(dú)立的條件下,從帶噪語(yǔ)音的功率譜中減去噪聲功率譜,從而得到較為純凈的語(yǔ)音功率譜。噪聲功率譜,從而得到較為純凈的語(yǔ)音功率譜。v 如果設(shè)如果設(shè) 為純凈語(yǔ)音信號(hào),為純凈語(yǔ)音信號(hào), 為噪聲信號(hào),為噪聲信號(hào), 為帶噪語(yǔ)音

21、信號(hào),則有:為帶噪語(yǔ)音信號(hào),則有:)()()(tntsty)(ty)(ts)(tn用 分別表示 的傅里葉變換,可得下式:由于假定語(yǔ)音信號(hào)與加性噪聲是相互獨(dú)立的,因此有:因而,如果用 分別表示 的功率譜,則有:而由于平穩(wěn)噪聲的功率譜在發(fā)聲前和發(fā)聲期間可以認(rèn)為基本沒(méi)有變化,這樣可以通過(guò)發(fā)聲前的所謂的“寂靜段”(認(rèn)為在這一段里沒(méi)有語(yǔ)音只有噪聲來(lái)估計(jì)噪聲的功率譜 ,從而有:)()()(NSY)()()(NSY、)()()(tntsty、222)()()(NSY)()()(nsyPPP、)()()(tntsty、)()()(nsyPPP)()()(nysPPP)(nP 這樣減出來(lái)的功率譜可以認(rèn)為是較為純

22、凈的語(yǔ)音功率譜,然后,從這個(gè)功率譜可以恢復(fù)降噪后的語(yǔ)音時(shí)域信號(hào)。 在具體計(jì)算時(shí),為防止出現(xiàn)負(fù)功率譜的情況,減譜時(shí)當(dāng) 時(shí),令 ,即完整的減譜公式如下: 減譜法語(yǔ)音增強(qiáng)技術(shù)的基本原理圖如圖14-10所示。圖中處理頻域過(guò)程只考慮了功率譜的變換,而最后IFFT變換中需要借助相位譜來(lái)恢復(fù)降噪后的語(yǔ)音時(shí)域信號(hào)。依據(jù)人耳對(duì)相位不敏感之一特點(diǎn),這時(shí)可用原帶噪語(yǔ)音 的相位譜來(lái)代替估計(jì)之后的語(yǔ)音信號(hào)的相位譜來(lái)恢復(fù)降噪后的語(yǔ)音時(shí)域信號(hào)。)()(, 0)()(),()()(nynynysPPPPPPP)()(nyPP0)(sP)(tyv14.6.2 基本減譜法的改進(jìn)基本減譜法的改進(jìn)v 1.被減項(xiàng)加權(quán)值處理被減項(xiàng)加權(quán)值

23、處理v 如式如式14-23的基本減譜法對(duì)于整個(gè)語(yǔ)音段采的基本減譜法對(duì)于整個(gè)語(yǔ)音段采用減去相同噪聲功率譜用減去相同噪聲功率譜 的辦法,實(shí)際處理效果的辦法,實(shí)際處理效果不是很理想,原因:不是很理想,原因:v語(yǔ)音能量集中于某些頻段,其幅度相對(duì)較高,尤其語(yǔ)音能量集中于某些頻段,其幅度相對(duì)較高,尤其是共振峰處的幅度一般遠(yuǎn)大于噪聲,不應(yīng)用同一標(biāo)是共振峰處的幅度一般遠(yuǎn)大于噪聲,不應(yīng)用同一標(biāo)準(zhǔn)處理。準(zhǔn)處理。v有時(shí)減譜后仍然會(huì)有較大的殘余噪聲。有時(shí)減譜后仍然會(huì)有較大的殘余噪聲。v改進(jìn)的方法是在幅度較高的時(shí)幀處減去改進(jìn)的方法是在幅度較高的時(shí)幀處減去 ,這樣可以更好的突出語(yǔ)音譜,抑制純音噪聲,改,這樣可以更好的突出

24、語(yǔ)音譜,抑制純音噪聲,改善降噪性能;其次,在語(yǔ)音譜中保留少量的寬帶噪善降噪性能;其次,在語(yǔ)音譜中保留少量的寬帶噪聲,在聽(tīng)覺(jué)上可以起到掩蔽純音的作用。聲,在聽(tīng)覺(jué)上可以起到掩蔽純音的作用。)(nP) 1)(aaPn 考慮到這兩個(gè)方面,改進(jìn)后的減譜公式如下:2.功率譜修正處理 將圖14-10中的功率譜計(jì)算 和 改進(jìn)為 和 可以得到新的更據(jù)一般性的減譜法形式。這種方法稱為功率譜修正處理,它可以增加靈活性,修正后的功率譜為:) 1, 1()()(),()()(),()()(baaPPbPaPPaPPPnynnynyskkkNSY)()()(k )0(1kk2 21 令 代入公式14-23或式14-24即

25、得減譜法的改進(jìn)形式。適當(dāng)調(diào)節(jié)式14-24中的a b k取值可以得到更佳的增強(qiáng)效果,其靈活性也不言而喻。 3.具有輸入幅值譜自適應(yīng)的減譜法 傳統(tǒng)的減譜法考慮噪聲為平穩(wěn)噪聲,a一般取相同的值,而在非平穩(wěn)噪聲的實(shí)際環(huán)境下,采用相同的權(quán)值a有可能發(fā)生減除過(guò)多或過(guò)少的問(wèn)題,使得有的區(qū)段要么噪聲消除不夠,要么減除過(guò)多產(chǎn)生 失真。為此,應(yīng)該對(duì)傳統(tǒng)的減譜法坐如下修改。首先,對(duì)于噪聲功率估計(jì),采用如下式,在整個(gè)區(qū)域用語(yǔ)音以外的當(dāng)前輸入幀 對(duì)噪聲功率進(jìn)行逐幀逐次更新:、kyYP)()(、ksSP)()(knNP)()()(sP) 10()()()1 ()(2212tttXNN其次,讓權(quán)值a和輸入語(yǔ)音功率相適應(yīng),即

26、按如下式隨輸入語(yǔ)音功率譜值改變。式中 和 為門限閥值, 和 為常數(shù),可有實(shí)驗(yàn)確定。)()()()()(222221121212121ttttYCYCYCCYCta 對(duì)噪聲功率進(jìn)行逐幀逐次更新時(shí),噪聲功率估計(jì)采用語(yǔ)音段開始的前幾幀來(lái)估計(jì),可以采用帶噪語(yǔ)音前后能量比來(lái)確定語(yǔ)音段和寂靜段: (幀長(zhǎng)是N是第i幀處理后的值, 為處理前的值。 NitNitisNiyNtD1212)(1)(1)()(iSt)(iyt 以上介紹了減譜法語(yǔ)音增強(qiáng)以及它的幾種改進(jìn)形式。在減譜法語(yǔ)音增強(qiáng)的實(shí)際應(yīng)用中還需要注意:減譜法假定語(yǔ)音信號(hào)是短時(shí)平穩(wěn)的,因此需要輸入語(yǔ)音信號(hào)加窗后再予以處理。這樣前式就應(yīng)寫成 其下標(biāo)t表示加窗分幀后的第t幀。222)()()(tttNSY14.714.7利用利用Weine

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論