




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上 基于線形神經(jīng)網(wǎng)絡(luò)的語音去噪技術(shù) 龍宇 王忠 (四川大學(xué)電氣信息學(xué)院通信工程系,成都)摘要:針對傳統(tǒng)意義上的FIR濾波器所存在的缺陷,本文采用線性神經(jīng)網(wǎng)絡(luò)構(gòu)成自適應(yīng)濾波器解決特定情況下的噪聲去除問題。在神經(jīng)網(wǎng)絡(luò)訓(xùn)練的過程中利用“對消”的思想,可以很好地逼近原始語音信號。整個過程采用MATLAB編程實現(xiàn),它可以在一定程度上彌補(bǔ)FIR濾波器的不足。關(guān)鍵詞:線性神經(jīng)網(wǎng)絡(luò) 自適應(yīng)濾波 “對消”法語音去噪1.引 言 語音技術(shù)歷來是人們關(guān)注的熱點。特別是在語音信號的噪聲去除方面,既是研究的一個重點,同時也是一個難點。如何采取一種功能強(qiáng)大且適用范圍廣泛的去噪系統(tǒng)進(jìn)行去噪處理便顯得尤
2、為重要。由于噪聲來源于各種實際的應(yīng)用環(huán)境,故不同的噪聲其特性差別很大。噪聲可以是加性的,也可以是乘性的。對于非加性噪聲,有些可以通過變換轉(zhuǎn)變?yōu)榧有栽肼?。(例如,乘積性噪聲或卷積性噪聲可以通過同態(tài)變換而成為加性噪聲)從譜分析的角度來看,噪聲大致可以分為以下三類:周期性噪聲,沖激噪聲,帶寬噪聲和語音干擾。神經(jīng)網(wǎng)絡(luò)是當(dāng)今研究的一個熱點課題,在人工智能,生物工程以及心理學(xué)等方面均具有廣闊的應(yīng)用前景。針對含有固定噪聲源的語音信號,通過頻譜分析發(fā)現(xiàn),噪聲與有用信號頻譜會在同一頻段發(fā)生重疊。在這種情況下,利用傳統(tǒng)的FIR經(jīng)典濾波器將無法對噪聲進(jìn)行有效的濾除。故考慮采用線性神經(jīng)元的網(wǎng)絡(luò)結(jié)構(gòu)來構(gòu)成自適應(yīng)濾波器,
3、因為神經(jīng)網(wǎng)絡(luò)濾波器在自動調(diào)節(jié)本身系統(tǒng)以達(dá)到人們的預(yù)想目的方面具有其它傳統(tǒng)的經(jīng)典濾波器所不可比擬的優(yōu)越性,在解決混雜特定噪聲的語音濾波問題中會顯示出較大的優(yōu)勢。本文試圖通過解決對含特定情況下的去噪問題,以展現(xiàn)神經(jīng)元網(wǎng)絡(luò)在現(xiàn)代科學(xué)各個領(lǐng)域中的良好發(fā)展前景。2.基本概念神經(jīng)網(wǎng)絡(luò)的基本單元為神經(jīng)元,它是對生物神經(jīng)元的簡化與模擬,與神經(jīng)網(wǎng)絡(luò)之間是個體和整體的關(guān)系。大量神經(jīng)元的相互連接即構(gòu)成了神經(jīng)網(wǎng)絡(luò)。一個典型的具有R維輸入的神經(jīng)元模型可以用下圖來描述: 輸 入 神 經(jīng) 元 f P1 W1,1 n a P3 W1,R b 圖1 神經(jīng)元網(wǎng)絡(luò)的基本結(jié)構(gòu)它主要由以下的五部分組成:(1)輸入p1,p2,pR代表神
4、經(jīng)元的R個輸入,用R1維的列矢量P來表示(其中T表示取轉(zhuǎn)置)P=p1,p2, , pRT (1) (2)網(wǎng)絡(luò)權(quán)值和閾值w1,1,w1,2,w1,R為網(wǎng)絡(luò)權(quán)值,表示輸入與神經(jīng)元之間的鏈接強(qiáng)度;b為神經(jīng)元閾值,它可以被看作是一個輸入恒為1的網(wǎng)絡(luò)權(quán)值。網(wǎng)絡(luò)權(quán)值可以用一個1R的行矢量W來表示:W=w1,1 , w1,2, ,w1,R (2)閾值b為11的標(biāo)量。 網(wǎng)絡(luò)的權(quán)值和閾值都是動態(tài)可調(diào)的,而神經(jīng)元的智能特性也正在于通過訓(xùn)練和學(xué)習(xí)來不斷地調(diào)節(jié)其本身的權(quán)值和閾值,使得訓(xùn)練后輸出的結(jié)果盡量逼近于我們預(yù)計的理想目標(biāo)。因此從這個意義上可以說,網(wǎng)絡(luò)權(quán)值和閾值的可調(diào)性是神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)特性的基本內(nèi)涵之一。(3)求和
5、單元 求和單元完成對輸入信號的加權(quán)求和,即n=piw1,I+b (3) 這是神經(jīng)元對輸入信號所進(jìn)行的第一個處理過程。用MATLAB語言表示為:n=w*p+b (4)(4)傳遞函數(shù)在上圖中,f表示神經(jīng)元的傳遞函數(shù)或激發(fā)函數(shù),它用于對求和單元的計算結(jié)果進(jìn)行函數(shù)計算,得到神經(jīng)元的輸出。此為神經(jīng)元對輸入信號的第二個處理過程。傳遞函數(shù)的形式多種多樣,應(yīng)該根據(jù)要解決的具體問題的不同而靈活選用。典型的有閾值函數(shù),線性函數(shù),對數(shù)Sigmoid函數(shù),正切Sigmoid函數(shù)等。在本文中是利用線性神經(jīng)元網(wǎng)絡(luò)去噪的,故采用線性函數(shù)。(5)輸出輸入信號神經(jīng)元加權(quán)求和及傳遞函數(shù)作用后,得到最終的輸出為a=f(wp+b)
6、(5)若取傳遞函數(shù)為purelin函數(shù),則神經(jīng)元的輸出用MATLAB語句表示即為a=purelin(w*p+b) (6)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)會因解決問題的難易程度的增大而變得很復(fù)雜,但都是在這個簡單關(guān)系上的擴(kuò)展。3.問題描述在實際生活中,我們常常會遇到語音信號中含有固定噪聲源的情況。如在學(xué)校的廣播室里,節(jié)目主持人正在對著話筒說話,聲音將通過麥克風(fēng)傳到外面學(xué)校廣場上的擴(kuò)音器播放出去。如果在停電的情況下要保持正常播音,需用小型發(fā)電機(jī)發(fā)電。然而這時發(fā)電機(jī)工作時所發(fā)出的轟鳴聲也會通過麥克風(fēng)傳出去,使得廣場上的同學(xué)根本不能聽清主持人的話。又如,醫(yī)院里用于給病人檢查身體的一些儀器,如心電圖,CT儀等,可能會受到
7、內(nèi)部一些固定頻率信號的干擾,從而使得在儀器顯示頻上顯示出的心電圖信號不純。對這些混雜的噪聲信號進(jìn)行分析不難發(fā)現(xiàn)它們具有以下特點:第一,噪聲源相對比較固定,這為我們通過采樣的方法提取一個較為單純的噪聲樣本提供了可能;第二,這些噪聲與我們所發(fā)出的語音信號比較,是相對獨立的,也就是說,它們屬于加性噪聲,與原始的語音信號并不相關(guān),但是卻會始終干擾有用信號。第三,它們和語音信號一樣,也要通過通信信道傳輸,在這個過程中,噪聲信號將發(fā)生一個線性變換,其線性關(guān)系將由通信信道的性質(zhì)決定。4.去噪模型的建立利用線性神經(jīng)元網(wǎng)絡(luò)構(gòu)成自適應(yīng)濾波器來解決上述問題。當(dāng)輸入矢量與目標(biāo)矢量之間是線性關(guān)系時,通過線性神經(jīng)網(wǎng)絡(luò)就可
8、以得到一個完全的線性擬合;如果是非線性關(guān)系,則只能得到輸入、輸出間的最大線性擬合解。而我們已經(jīng)知道,當(dāng)噪聲被錄入麥克風(fēng),經(jīng)過傳輸信道,最后通過擴(kuò)音器輸出,其間經(jīng)過的是一個線性變換,至于這個線性變換具體的表達(dá)形式則完全由傳輸信道而定,甚至它還可以隨著傳輸信道的改變而改變。但不管其具體的形式如何,通過線性神經(jīng)網(wǎng)絡(luò),都可以實現(xiàn)由輸入向目標(biāo)的逼近。當(dāng)然,在這個過程中,原始的語音信號經(jīng)過傳輸信道后也會發(fā)生線性變化,(如:通過擴(kuò)音器后,其頻譜幅度將會被放大)不過,它與發(fā)電機(jī)發(fā)出的噪聲之間仍然不存在相關(guān)關(guān)系。所以,我們可以這樣來確定神經(jīng)網(wǎng)絡(luò)的各個參數(shù):首先對噪聲信號進(jìn)行采樣,得到一個原始噪聲信號的樣本作為輸
9、入的參考信號,設(shè)為r(t)。將經(jīng)過信道傳輸,由擴(kuò)音器輸出的混雜有噪聲的語音信號也進(jìn)行采樣得到一個樣本,設(shè)為x(t),令x(t)=s(t)n(t).其中,s(t)表示通過信道后的原始話音,n(t)表示通過信道后的話音中混雜的噪聲。r(t)與s(t)不相關(guān),但與n(t)相關(guān)。經(jīng)過神經(jīng)網(wǎng)絡(luò)訓(xùn)練后,得到一個輸出a(t),使得a(t)盡量與x(t)中的n(t)相匹配,那么網(wǎng)絡(luò)的“誤差值”,即e(t)x(t)a(t) (7)即為我們所需要的有用信號,它是盡量逼近于原始語音信號s(t)的。利用這種“對消”思想,可得到較為純正的原始話音。去噪模型可用下面的框圖來表示:z(t)x(t)=s(t)+n(t) +自
10、適應(yīng)濾波器r(t)a(t) 控 制 - 圖 2 去噪模型框圖5.程序示例用一個人工合成的噪聲環(huán)境來模擬實際環(huán)境,檢驗這種濾波器的性能。原始話音信號為錄制的一段新聞播報,時間大概在5秒鐘左右。對其進(jìn)行離散化處理,采樣頻率為8KHZ。然后取得噪聲的一個樣本:自定義一個零均值的高斯白噪聲離散信號,其長度和原始語音信號相同將其作一個線性變換以模擬實際中通過通信信道傳輸?shù)倪^程,加到原始語音信號上,這就合成了一個含噪的語音信號,且滿足噪聲來源固定,加性,經(jīng)過線性變換這三個條件。創(chuàng)建線性神經(jīng)元網(wǎng)絡(luò)。由于采用自適應(yīng)濾波,故需定義延遲階數(shù)。從理論上來說,階數(shù)越高,對目標(biāo)信號的逼近程度就越高,濾波的效果就越好。但
11、同時網(wǎng)絡(luò)的計算量也就越大,耗時越多,這與實際應(yīng)用中實時處理的要求是不相符合的。所以在調(diào)試過程中要把兩種因素要綜合起來考慮。程序流程框圖如下所示:混合語音原始語音確定神經(jīng)網(wǎng)絡(luò)輸入矢量和目標(biāo)矢量創(chuàng)建線性神經(jīng)網(wǎng)絡(luò)分段,逐段進(jìn)行仿真和訓(xùn)練判斷是否為第一斷前后兩段數(shù)據(jù)結(jié)果首尾相加達(dá)到循環(huán)輸出處理后的語音信號開 始 圖3 程序流程框圖專心-專注-專業(yè)6.頻譜分析 這里列出信號在處理過程中各個階段的頻譜分析,以反映濾波器在噪聲去除過程中的頻譜變化過程:原始的純凈語音信號頻譜如下所示: 圖4 原始語音信號頻譜加入零均值高斯白噪聲后的混合語音信號頻譜如下所示: 圖5 混音信號頻譜圖由圖可見,高斯白噪聲對話音的影
12、響相當(dāng)大,語音信號和噪聲信號的頻譜完全重疊.從實際的聽覺情況來看,它幾乎把原始話音完全湮沒。經(jīng)過線性神經(jīng)網(wǎng)絡(luò)處理后的語音信號頻譜如下所示: 圖6 去噪后輸出語音信號頻譜可見,經(jīng)過線性神經(jīng)網(wǎng)羅自適應(yīng)濾波器濾波后,得到的信號頻譜圖與原始語音信號頻譜相似,可以聽到較為清晰的原始話音,表明濾波效果是比較理想的。7.結(jié)語去噪問題一直是語音處理技術(shù)中的一個重要方面,對現(xiàn)實應(yīng)用具有很重大的意義,而神經(jīng)網(wǎng)絡(luò)又是當(dāng)今智能科學(xué)中的研究熱點。本文把這兩個重要的方面相結(jié)合,討論了在特定的噪聲環(huán)境中利用線性神經(jīng)網(wǎng)絡(luò)去噪的方法,并利用MATLAB給出示例程序?qū)崿F(xiàn)之。由于噪聲的形式是多種多樣的,產(chǎn)生方式各有不同,每一種噪聲
13、都有其特點,所以這也造成了去噪的困難。本文也僅僅是針對實際中出現(xiàn)的含有固定的,通過通信信道發(fā)生線性變換的加性噪聲的語音信號的去噪問題做出一些討論,希望籍此能加深對噪聲特性的理解,為從更廣泛的層面上去除其它類型的噪聲作一個鋪墊。參考文獻(xiàn)【1】 朱明雄. 計算機(jī)語音技術(shù). 北京航空航天大學(xué)出版社. 1992【2】 胡守仁,余少波,戴葵. 神經(jīng)網(wǎng)絡(luò)導(dǎo)論. 國防科技大學(xué)出版社. 1993【3】 R.維得羅,S.D.史蒂恩斯編,王永德,龍憲惠譯校. 四川大學(xué)出版社. 1989【4】胡航. 語音信號處理. 哈爾濱工業(yè)大學(xué)出版社. 2000【5】易克初,田斌,付強(qiáng). 語音信號處理. 國防工業(yè)出版社. 200
14、1【6】陳懷堔. 吳大正. 高西全. MATLAB及在電子信息課程中的應(yīng)用.(第二版). 2003【7】從爽. 面向MATLAB工具箱的神經(jīng)網(wǎng)絡(luò)理論與應(yīng)用(第二版). 中國科學(xué)技術(shù)大學(xué)出版社. 2003The technology of Noise Cancellation by linear neuron Long Yu Wang Zhong(Communication Engineering Department,SiChuan University,Chengdu.)Abstract: Neural networks are composed of simple elements ope
15、rating in parallel. These elements are inspired by biological nervous systems. As in nature, the network function is determined largely by the connections between elements. We can train a neural network to perform a particular function by adjusting the values of the connections (weights) between ele
16、ments.The operation of a linear adaptive filtering algorithm involves two basic processes:A filtering process designed to produce an output in response to a sequence of input data.An adaptive process, the purpose of which is to provide a mechanism for the adaptive control of an adjustable set of parameters u
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度專業(yè)游泳池租賃與水質(zhì)改善服務(wù)協(xié)議
- 二零二五年度農(nóng)村土地經(jīng)營權(quán)流轉(zhuǎn)與農(nóng)業(yè)人才培養(yǎng)合同
- 勞務(wù)派遣公司協(xié)議書(二零二五年度)餐飲服務(wù)領(lǐng)域
- 二零二五年度教育機(jī)構(gòu)勞動合同模板(含教師職稱)
- 隧道工程綜合維護(hù)保養(yǎng)2025年度承包合同
- 二零二五年度金融行業(yè)勞務(wù)派遣服務(wù)合同
- 2025年度桉樹砍伐與林業(yè)科技推廣應(yīng)用合同
- 浙江國企招聘2024麗水經(jīng)濟(jì)技術(shù)開發(fā)區(qū)國有企業(yè)公開招聘19人筆試參考題庫附帶答案詳解
- 平法識圖周宏業(yè)66課件
- 2025遼寧省能源控股集團(tuán)所屬遼能股份公司招聘665人筆試參考題庫附帶答案詳解
- cjj/t135-2009《透水水泥混凝土路面技術(shù)規(guī)程》
- 短時耐受電流
- 社保人事專員績效考核表
- 河北省自然科學(xué)基金資助項目申請書模板
- 上海世博會對上海城市競爭力影響的評估模型
- 常用標(biāo)準(zhǔn)波導(dǎo)和法蘭尺寸
- 河南書法家協(xié)會入會申請表
- 鄉(xiāng)村獸醫(yī)登記申請表(共1頁)
- 旋挖樁主要施工方法及技術(shù)措施(全護(hù)筒)
- GB∕T 12810-2021 實驗室玻璃儀器 玻璃量器的容量校準(zhǔn)和使用方法
- Q∕GDW 13155.1-2018 變電站時間同步系統(tǒng)采購標(biāo)準(zhǔn) 第1部分:通用技術(shù)規(guī)范
評論
0/150
提交評論