版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第14章語音增強(qiáng)§14.1概述§14.2語音特性、人耳感知特性及噪聲特性§14.3濾波法語音增強(qiáng)技術(shù)§14.4利用相關(guān)特性的語音增強(qiáng)技術(shù)§14.5非線性處理法語音增強(qiáng)技術(shù)§14.6減譜法語音增強(qiáng)技術(shù)§14.7利用Weiner濾波法的語音增強(qiáng)技術(shù)§14.1概述
語音增強(qiáng)是指語音質(zhì)量的改善或提高。因?yàn)閷?shí)際語音都是在有噪聲和干擾的情況下產(chǎn)生的,所以語音增強(qiáng)的目的就是去掉語音信號(hào)中的噪聲和干擾。語音增強(qiáng)技術(shù)有廣泛的應(yīng)用,如作為語音編碼和語音識(shí)別的預(yù)處理,消除語音中的混響,從錄音中恢復(fù)出高質(zhì)量的語音。應(yīng)用于研究的語音數(shù)據(jù)大都在無噪環(huán)境下采集的。?1)實(shí)際環(huán)境存在各種各樣的干擾噪聲,最常見的是背景噪聲,噪聲干擾下的語音,其特征參數(shù)發(fā)生了很大的扭曲,噪聲干擾下的語音識(shí)別率大大降低、合成語音質(zhì)量急劇惡化等。?2)語音增強(qiáng)的目的:從帶噪語音中提取盡可能純凈的原始語音,從主觀度量上講,就是改善語音質(zhì)量、消除背景噪聲,從客觀度量講,即提高語音可懂度。?3)針對(duì)不同的噪聲,采用不同的語音增強(qiáng)方法,因噪聲種類繁多,不可能有通用的語音增強(qiáng)方案?!?4.1語音特性、人耳感知特性及噪聲特性?1語音特性:前已述及,這里簡單回顧A、是時(shí)變的、非平穩(wěn)、非遍歷的隨機(jī)過程,短時(shí)相對(duì)平穩(wěn);B、分濁音和清音,前者表現(xiàn)出周期性,在頻域有共振峰,能量大都集中在較低頻段內(nèi);后者類于白噪聲,無明顯的時(shí)域和頻域特性。C、可用統(tǒng)計(jì)分析特性描述。2.人耳感知特性目前,用于語音增強(qiáng)的語音感知方面的一些結(jié)論:A、幅度譜對(duì)感知起決定性影響,相位譜對(duì)不敏感;B、人耳對(duì)頻率高低的感受近似與該頻率的對(duì)數(shù)成正比;C、人耳有掩蔽效應(yīng),即強(qiáng)信號(hào)對(duì)弱信號(hào)起抑制作用。人耳有掩蔽效應(yīng):即指一個(gè)聲音的存在會(huì)影響對(duì)另一個(gè)較弱聲音的聽覺,另外,當(dāng)一個(gè)聲音突然停止時(shí),人耳約在150ms內(nèi)對(duì)其它弱音聽不清楚,甚至聽不見。因此提高語音的SNR,就可在語音與噪聲共存時(shí),感覺不到噪聲的存在。D、共振峰對(duì)語音感知非常重要,特別是第二共振峰比第一共振峰更為重要,因此對(duì)語音信號(hào)進(jìn)行一定的高通濾波不會(huì)對(duì)可懂度產(chǎn)生影響。E、人耳在多人的說話環(huán)境中,能分辨出所需聲音。3.噪聲特性:
(a)加性噪聲(1)沖激噪聲:例如打火、放電都會(huì)引起沖激噪聲。它的時(shí)域波形是類似于沖激函數(shù)的窄脈沖。消除沖激噪聲的方法通常有兩種:對(duì)帶噪語音信號(hào)的幅度求均值,將該均值作為閾值,超過該閾值則判斷為噪聲,在時(shí)域?yàn)V除;當(dāng)沖激脈沖不太密的時(shí)候,也可以通過內(nèi)插的方法避開或平滑掉沖激點(diǎn),從而在重建語音時(shí)去掉沖激噪聲。(2)周期噪聲:例如發(fā)動(dòng)機(jī)產(chǎn)生的干擾、市電干擾都是周期性的干擾。在頻譜上表現(xiàn)為離散的窄譜,通??梢圆捎孟莶ㄆ鞣椒ㄟM(jìn)行消除。(3)寬帶噪聲:例如說話時(shí)同時(shí)伴隨著呼吸引起的噪聲,隨機(jī)噪聲源產(chǎn)生的噪聲,以及量化噪聲等。應(yīng)用中常近似為高斯噪聲或白噪聲。噪聲頻譜遍布于語音信號(hào)頻譜中,消除比較困難,一般需要采用非線性處理方法,減譜法,Weiner濾波法。(4)語音干擾:干擾語音信號(hào)和待傳語音信號(hào)同時(shí)在一個(gè)信道中傳輸所造成的干擾(如在通信中串話引起的)。區(qū)別它們的方法是利用基音差別。可以用梳狀濾波器提取基音和各次諧波,再恢復(fù)出有用的信號(hào)。(b)非加性噪聲傳輸噪聲:傳輸系統(tǒng)的電路噪聲。與背景噪聲不同,它在時(shí)域中是語音和噪聲的卷積。處理這種噪聲可以用同態(tài)處理的方法,把非加性噪聲變換為加性噪聲來處理。干擾語音背景噪聲純凈語音+信道傳輸噪聲語音增強(qiáng)增強(qiáng)語音§14.3濾波法語音增強(qiáng)技術(shù)1陷波器法對(duì)于周期噪聲采用陷波器是比較簡便和有效的方法,設(shè)計(jì)的陷波器的幅頻曲線的凹處對(duì)應(yīng)于周期噪聲的基頻和各次諧波,并使這些頻率處的限波寬度足夠窄。帶噪語音DFTIDFT頻譜整形器增強(qiáng)語音2自適應(yīng)濾波器自適應(yīng)濾波器能有效地在未知環(huán)境中跟蹤時(shí)變的輸入信號(hào)。使輸出信號(hào)達(dá)到最優(yōu),所以可以用來構(gòu)成自適應(yīng)的噪聲消除器。+自適應(yīng)濾波器r(t)-+r’(t)s’(t)y(t)=s(t)+n(t)s(t)為語音信號(hào),n(t)為未知噪聲信號(hào),y(t)為帶噪語音信號(hào),r(t)為參考噪聲輸入,與語音信號(hào)無關(guān),與噪聲有關(guān)。該濾波器的實(shí)質(zhì)是實(shí)現(xiàn)帶噪信號(hào)中的噪聲估計(jì),并用原始信號(hào)y(t)減去估計(jì)值r’(t),達(dá)到語音增強(qiáng)的目的?!?4.4利用相關(guān)特性的語音增強(qiáng)技術(shù)1自相關(guān)處理抗噪法語音增強(qiáng)技術(shù)該方法利用語音信號(hào)本身相關(guān),而語音與噪聲、噪聲與噪聲可認(rèn)為互不相關(guān)的性質(zhì),對(duì)帶噪語音信號(hào)做自相關(guān)處理,可以得到與不帶噪語音信號(hào)同樣的自相關(guān)序列。即帶噪語音的自相關(guān)函數(shù)近似等于純凈語音信號(hào)的自相關(guān)函數(shù)。將自相關(guān)系數(shù)作為識(shí)別系統(tǒng)的特征,可以達(dá)到抗噪聲的目的。開方器移動(dòng)Tp自相關(guān)系數(shù)確定Tp一周期波形切除相關(guān)波形連接輸出帶噪語音信號(hào)自相關(guān)處理抗噪法的流程2利用復(fù)數(shù)幀段主分量特征的降噪方法來自環(huán)境的噪聲具有幀間相關(guān)性小,能量分布頻率范圍廣且數(shù)值較小,在語音信號(hào)主分量特征中對(duì)應(yīng)于貢獻(xiàn)率較小的分量的特點(diǎn)。因此可以利用復(fù)數(shù)幀段主分量特征提高抗噪性。復(fù)數(shù)幀段特征是采用相繼的復(fù)數(shù)幀組成的特征參數(shù)矢量作為語音識(shí)別輸入特征量,由于噪聲成分具有幀間相關(guān)性小的特征,所以利用復(fù)數(shù)幀段特征量等于相應(yīng)的減弱了噪聲的影響。為了進(jìn)一步降噪,可以求取復(fù)數(shù)幀段參數(shù)特征的主分量特征,由于噪聲對(duì)應(yīng)于較小的分量,所以貢獻(xiàn)率較大的主分量作為語音識(shí)別特征,而舍棄較小的分量,這樣既可以降低噪聲,也可以解決輸入特征矢量維數(shù)增加時(shí),計(jì)算量增大的問題。主分量是N個(gè)D維樣本的自相關(guān)矩陣的本征向量,每一個(gè)本征向量對(duì)應(yīng)一個(gè)本征值,本征值小的重要性也小,小本征值部分往往對(duì)應(yīng)噪聲,所以可以從特征量中去除小本征值對(duì)應(yīng)的主分量,達(dá)到降低噪聲的影響。§14.5非線性處理法語音增強(qiáng)技術(shù)1中心削波法對(duì)于噪聲頻譜遍布于語音信號(hào)頻譜中的寬帶噪聲,如果噪聲振幅比大部分的語音信號(hào)振幅低,則削去低幅度成分也就削去了寬帶噪聲。所以我們可以在頻域中采取中心限幅的方法,高幅度的頻譜可以通過而低幅成分不允許通過,從而實(shí)現(xiàn)噪聲抑制。2同態(tài)濾波法對(duì)于乘性或卷積性噪聲可以采用同態(tài)濾波的方法。帶噪語音FFTln[]IFFT音調(diào)提取FFT頻譜分析合成輸出復(fù)倒譜串脈沖同態(tài)濾波法原理框圖同態(tài)濾波可以用于識(shí)別系統(tǒng)的預(yù)處理。卷積信號(hào)經(jīng)過同態(tài)濾波器后由卷積運(yùn)算變成了相應(yīng)的復(fù)倒譜求和運(yùn)算,這樣可以分離出乘性噪聲。再由復(fù)倒譜提取音調(diào)參數(shù),經(jīng)過頻譜分析獲取降噪處理之后的共振峰,最后合成為降噪后的語音信號(hào)?!?4.6減譜法語音增強(qiáng)技術(shù)
減譜法是假定加性噪聲與短時(shí)平穩(wěn)的語音信號(hào)相互獨(dú)立的條件下,從帶噪語音的功率譜中減去噪聲功率譜,從而得到較為純凈的語音頻譜。減譜法假定語音信號(hào)短時(shí)平穩(wěn),所以需要對(duì)輸入語音加窗后處理。y(t)=s(t)+n(t)FFT|?|2
Pn(ω)
+-(?)1/2
相位恢復(fù)Ψ(ω)IFFTs(t)Py(ω)=Ps(ω)+Pn(ω)設(shè)s(t)為純凈語音信號(hào),n(t)為噪聲信號(hào),y(t)為帶噪信號(hào),有y(t)=s(t)+n(t)其傅立葉變換為Y(ω)=S(ω)+N(ω)假定語音信號(hào)與加性噪聲獨(dú)立,則有|Y(ω)|2=|S(ω)|2+|N(ω)|2即功率譜的關(guān)系為:Py(ω)=Ps(ω)+Pn(ω)Ps(ω)=Py(ω)-Pn(ω)噪聲功率譜Pn(ω)可以通過發(fā)聲前的靜音段的功率譜來估計(jì)。帶噪語音功率譜和噪聲功率譜相減就可以認(rèn)為是純凈語音功率譜。由于在傅立葉變換后只考慮了功率譜,沒有考慮相位的變化,所以在傅立葉反變換時(shí),還要考慮相位的變化,即Ψ(ω)?!?4.7利用Weiner濾波法的語音增強(qiáng)技術(shù)該方法是在最小均方準(zhǔn)則下用Weiner濾波器實(shí)現(xiàn)對(duì)語音信號(hào)的估計(jì),即對(duì)于帶噪語音信號(hào),確定濾波器的沖激響應(yīng),使帶噪語音信號(hào)經(jīng)過該濾波器的輸出能夠滿足均方誤差最小。設(shè)s(t)為純凈語音信號(hào),n(t)為噪聲信號(hào),y(t)為帶噪信號(hào),有y(t)=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《電路分析基礎(chǔ)試題》課件
- 《微觀經(jīng)濟(jì)學(xué)》考試試卷試題及參考答案
- 《專業(yè)英語(計(jì)算機(jī)英語)》復(fù)習(xí)題
- 八下期末考拔高測(cè)試卷(5)(原卷版)
- 《誠邀創(chuàng)業(yè)伙伴》課件
- 2012年高考語文試卷(安徽)(解析卷)
- 父母課堂與教育理念分享計(jì)劃
- 購物中心導(dǎo)購員服務(wù)總結(jié)
- 水產(chǎn)養(yǎng)殖行業(yè)銷售工作總結(jié)
- 娛樂場館衛(wèi)生要素
- 潛水泵安裝方案73853
- 安全操作規(guī)程(供參考)(公示牌)
- 2022年公司出納個(gè)人年度工作總結(jié)
- 蓄電池檢查和維護(hù)
- 口袋妖怪白金二周目圖文攻略(精編版)
- 安全風(fēng)險(xiǎn)研判與承諾公告制度管理辦法(最新)
- 體育與健康課一年級(jí)(水平一)課時(shí)教案全冊(cè)
- SAP-ABAP-實(shí)用培訓(xùn)教程
- 配電房施工組織設(shè)計(jì)方案(土建部分)
- 國家開放大學(xué)電大??啤队⒄Z教學(xué)法》2023-2024期末試題及答案(試卷代號(hào):2145)
- 管樁水平承載力計(jì)算
評(píng)論
0/150
提交評(píng)論