語(yǔ)音降噪技術(shù)簡(jiǎn)介_第1頁(yè)
語(yǔ)音降噪技術(shù)簡(jiǎn)介_第2頁(yè)
語(yǔ)音降噪技術(shù)簡(jiǎn)介_第3頁(yè)
語(yǔ)音降噪技術(shù)簡(jiǎn)介_第4頁(yè)
語(yǔ)音降噪技術(shù)簡(jiǎn)介_第5頁(yè)
已閱讀5頁(yè),還剩19頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、語(yǔ)音增強(qiáng)原理及應(yīng)用的討論內(nèi)容內(nèi)容l語(yǔ)音增強(qiáng)相關(guān)概念語(yǔ)音增強(qiáng)相關(guān)概念l語(yǔ)音增強(qiáng)基本原理及應(yīng)用語(yǔ)音增強(qiáng)基本原理及應(yīng)用語(yǔ)音增強(qiáng)的定義語(yǔ)音增強(qiáng)的定義 語(yǔ)音增強(qiáng)是指當(dāng)語(yǔ)音信號(hào)被各種各樣的噪聲干擾、甚至淹沒后,從噪聲背景中提取有用的語(yǔ)音信號(hào),抑制、降低噪聲干擾的技術(shù)。一句話,從含噪語(yǔ)音中提取盡可能純凈的原始語(yǔ)音。語(yǔ)音增強(qiáng)的目標(biāo)語(yǔ)音增強(qiáng)的目標(biāo)u改進(jìn)語(yǔ)音質(zhì)量,消除背景噪音;u提高語(yǔ)音可懂度!兩者往往不能兼得,所以實(shí)際應(yīng)用中總是視具體情況而有所側(cè)重的!語(yǔ)音噪聲語(yǔ)音噪聲類型類型 帶噪語(yǔ)音的噪聲類型按與信號(hào)關(guān)系可以分為加性噪聲加性噪聲和非加性噪聲非加性噪聲。加性噪聲有寬帶的,窄帶的,平穩(wěn)的,非平穩(wěn)的,白噪聲,有色噪

2、聲,等;非加性噪聲如乘性噪聲,卷積噪聲等。語(yǔ)音噪聲類型語(yǔ)音噪聲類型加性噪聲:加性噪聲:一般指熱噪聲、散彈噪聲等,它們與信號(hào)的關(guān)系是相加,不管有沒有信號(hào),噪聲都存在,信號(hào)與噪聲是相互獨(dú)立的信號(hào)與噪聲是相互獨(dú)立的!加性噪聲來(lái)源一殷可以分為三方面:(1)人為噪聲;(2)自然噪聲;(3)內(nèi)部噪聲。語(yǔ)音噪聲類型語(yǔ)音噪聲類型乘性噪聲:乘性噪聲:一般由信道不理想引起,它們與信號(hào)的關(guān)系是相乘,信號(hào)在它在,信號(hào)不在他也就不在。一般通信中把加性隨機(jī)性看成是系統(tǒng)的背景噪聲; 而乘性隨機(jī)性看成系統(tǒng)的時(shí)變性(如衰落或者多普勒)或者非線性所造成的。其他常見噪聲名詞其他常見噪聲名詞白噪聲白噪聲:表示在全頻域內(nèi)單位頻域下都分

3、布有相同的能量密度,在線性空間內(nèi)它具有平坦的頻譜。換句話說,一定頻域內(nèi)的白噪聲在其中任意給定的帶寬內(nèi)都具有相等的功率。隨機(jī)噪聲:隨機(jī)噪聲:噪聲波形是隨機(jī)的,不可預(yù)測(cè)的。平穩(wěn)噪聲:平穩(wěn)噪聲:是指分布參數(shù)或者分布律隨時(shí)間不發(fā)生變化的噪聲。 語(yǔ)音噪聲特性語(yǔ)音噪聲特性一般,語(yǔ)音增強(qiáng)處理的噪聲指環(huán)境中的噪聲,而這些噪聲主要是高斯白噪聲,這種噪聲一般符合如下的假設(shè):(1)噪聲是加性加性的。(2)噪聲是局部平穩(wěn)局部平穩(wěn)的。局部平穩(wěn)是指一段加噪語(yǔ)音中的噪聲,具有和語(yǔ)音段開始前那段噪聲相同的統(tǒng)計(jì)特性,且在整個(gè)語(yǔ)音段中保持不變。也就是說,可以根據(jù)語(yǔ)音開始前那段噪聲來(lái)估計(jì)語(yǔ)音中所疊加的噪聲統(tǒng)計(jì)特性。(3)噪聲與語(yǔ)音

4、統(tǒng)計(jì)獨(dú)立獨(dú)立或不相關(guān)。到底什么是傅立葉變換?到底什么是傅立葉變換?有時(shí)信號(hào)在時(shí)域特征不明顯,我們通常的將它變換到頻域,這時(shí)會(huì)用到傅里葉變換,那么傅里葉變換到底是什么呢?傅里葉變換是將時(shí)域信號(hào)分解為不同頻率的正弦信號(hào)或余弦函數(shù)疊加之和。連續(xù)情況下要求原始信號(hào)在一個(gè)周期內(nèi)滿足絕對(duì)可積條件。離散情況下,傅里葉變換一定存在。 到底什么是傅立葉變換?到底什么是傅立葉變換?一個(gè)恰當(dāng)?shù)谋扔魇菍⒏道锶~變換比作一個(gè)玻璃棱鏡。棱鏡是可以將光分解為不同顏色的物理儀器,每個(gè)成分的顏色由波長(zhǎng)(或頻率)來(lái)決定。傅里葉變換可以看作是數(shù)學(xué)上的棱鏡,將函數(shù)基于頻率分解為不同的成分。當(dāng)我們考慮光時(shí),討論它的光譜或頻率譜。同樣,

5、傅立葉變換使我們能通過頻率成分來(lái)分析一個(gè)函數(shù)。到底什么是傅立葉變換?到底什么是傅立葉變換?在頻域中,頻率越大說明原始信號(hào)變化速度越快;頻率越小說明原始信號(hào)越平緩。當(dāng)頻率為0時(shí),表示直流信號(hào),沒有變化。因此,頻率的大小反應(yīng)了信號(hào)的變化快慢。高頻分量解釋信號(hào)的突變部分,而低頻分量決定信號(hào)的整體形象。 l語(yǔ)音增強(qiáng)常用方法語(yǔ)音增強(qiáng)常用方法根據(jù)語(yǔ)音和噪聲的特點(diǎn),出現(xiàn)了很多種語(yǔ)音增強(qiáng)算法。語(yǔ)音增強(qiáng)方法有噪聲對(duì)消法、譜相減法、維納濾波法、卡爾曼濾波法,F(xiàn)IR自適應(yīng)濾波等。其中譜相減法、wiener濾波,卡爾曼濾波是常用增強(qiáng)方法,下面簡(jiǎn)單介紹下其原理。維納濾波維納濾波維納濾波維納濾波卡爾曼濾波卡爾曼濾波卡爾曼

6、濾波的基本思想:采用信號(hào)與噪聲的狀態(tài)空間模型,利用前一時(shí)刻的估計(jì)值和當(dāng)前時(shí)刻的觀察值來(lái)更新對(duì)狀態(tài)變量的估計(jì), 以求現(xiàn)時(shí)刻的估計(jì)值。其特點(diǎn):(1) 無(wú)需采用全部過去的觀察值進(jìn)行估計(jì), 適合于實(shí)時(shí)處理。(2) 用狀態(tài)方程和量測(cè)方程表示信號(hào)和噪聲, 采用遞推法進(jìn)行計(jì)算, 適合于計(jì)算機(jī)求解。適用范圍廣:平穩(wěn)或非平穩(wěn), 時(shí)變或非時(shí)變系統(tǒng)。譜減法的譜減法的基本原理基本原理將含噪語(yǔ)音信號(hào)和有聲/無(wú)聲判別得到的純?cè)肼曅盘?hào)進(jìn)行FFT變化,從含噪語(yǔ)音幅度譜的平方中減去純?cè)肼暤姆茸V的平方,然后開方,得原始語(yǔ)音譜幅度的估值,再借用含噪語(yǔ)音的相位,進(jìn)行IFFT變化,得到增強(qiáng)的語(yǔ)音。含噪語(yǔ)音含噪語(yǔ)音純?cè)肼暭冊(cè)肼曉颊Z(yǔ)音

7、譜幅度的估值原始語(yǔ)音譜幅度的估值()jX e( )d n( )s n()jD earg()jjX ee22()()jjX eD e22()()()jjjX eD eS e( )x nDFTDFT2()jX e插入相位插入相位DFTDFT2()jD eIDFTIDFTarg()()jjjX eS ee原始語(yǔ)音的頻譜的估值原始語(yǔ)音的頻譜的估值譜減法譜減法流程圖流程圖譜減法譜減法假設(shè)假設(shè)u噪聲疊加;u噪聲與語(yǔ)音不相關(guān);u對(duì)純凈語(yǔ)音無(wú)先驗(yàn)知識(shí);u對(duì)統(tǒng)計(jì)噪聲有先驗(yàn)知識(shí)。 帶噪語(yǔ)音模型:y(n)=s(n)+v(n)式中,y(n)是帶噪語(yǔ)音,s(n)是純凈語(yǔ)音,v(n)是噪聲。譜減法譜減法對(duì)語(yǔ)音模型公式兩邊

8、進(jìn)行傅立葉變換,得Y(k)=X(k)+N(k)由于對(duì)噪聲的統(tǒng)計(jì)參數(shù)的未知,所以在實(shí)際應(yīng)用中,通常使用非語(yǔ)音段噪聲譜的均值來(lái)作為對(duì)噪聲譜N(k)的估計(jì),譜減法譜減法則對(duì)純凈語(yǔ)音幅度譜的估量表示為譜減法實(shí)現(xiàn)步驟譜減法實(shí)現(xiàn)步驟根據(jù)已知的平臺(tái)噪聲進(jìn)行FFT,計(jì)算噪聲功率譜譜平均值N(k);對(duì)含噪語(yǔ)音進(jìn)行FFT計(jì)算得到其功率譜X(k),保留含噪語(yǔ)音相位;用含噪語(yǔ)音功率譜X(k)減去噪聲功率譜N(k),得到原始語(yǔ)音的功率譜估計(jì)值S(k);利用S(k)以及含噪語(yǔ)音相位進(jìn)行IFFT,這樣就得到原始語(yǔ)音的估計(jì)值。譜減法缺點(diǎn)譜減法缺點(diǎn)由于噪聲的隨機(jī)分布的范圍廣,因此相減時(shí),若該幀某頻率點(diǎn)上的噪聲幅度譜分量大時(shí),就會(huì)有很大一部分殘留,在頻譜上呈現(xiàn)隨機(jī)起伏的尖峰。在聽覺上形成類似音樂的殘留噪聲,又稱為背景音樂噪聲背景音樂噪聲。背景音樂噪聲損傷了語(yǔ)音的質(zhì)量,降低了可懂度和清晰度,是該類方法最大的缺點(diǎn)最大的缺點(diǎn)。0100020003000400050006000700080009000-0.500.5010002000300040005000600070008000900002004006000100020003000400050006000700080009000020040

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論