版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、學(xué)院畢業(yè)設(shè)計學(xué)院畢業(yè)論文設(shè)計 盲信號處理 院 (系):電子信息系 專業(yè):電程技術(shù) 班級:班 學(xué)號:030 姓名: 指導(dǎo)教師: 目錄摘要4abstract5第一章 語音信號及噪聲概述1 1.1 語音信號的概述1 1.1.1 語音特性分析1 1.1.2 語音信號的基本特征 2 1.2語音噪聲特性分析3 1.2.1 信噪比(signal noise ratio,snr) 3 1.2.2 信干比(signal-to-interference ratio,sir)4 第二章 盲信號處理5 2.1盲信號處理的概述 52.1.1 盲信號處理的基本概念5 2.1.2 盲信號處理的方法和分類5 2.1.3 盲信
2、號處理技術(shù)的研究應(yīng)用62.2 盲源分離法7 2.2.1 盲源分離技術(shù)7 2.2.2 盲分離算法實(shí)現(xiàn) 7 2.2.3 盲源分離技術(shù)的研究發(fā)展和應(yīng)用8 2.3 獨(dú)立成分分析 9 2.3.1 獨(dú)立成分分析的定義 9 2.3.2 ica的基本原理102.3.3 本文對ica的研究目的及實(shí)現(xiàn)12第三章 盲語音信號分離的實(shí)現(xiàn)及抑噪分析 15 3.1 盲語音信號分離的實(shí)現(xiàn) 15 3.1.1 盲信號分離的三種算法 15 3.1.2 不同算法的分離性能比較 17 3.2 抑制噪聲的算法仿真及結(jié)果分析 173.2.1 抑噪算法仿真實(shí)現(xiàn) 17 3.2.2分離結(jié)果分析 20 3.2.2 不同算法的分離性能比較28第四
3、章 結(jié)論與展望35 致 謝 37 參考文獻(xiàn) 38附 錄 39盲信號處理摘要語音信號盲分離處理的含義是指利用bss技術(shù)對麥克風(fēng)檢測到的一段語音信號進(jìn)行處理?;旌险Z音信號的分離是盲分離的重要內(nèi)容,目前的混疊語音分離大多是建立在無噪環(huán)境中的混疊情形下,主要以盲源分離(blind source separation,bss),根據(jù)信號的統(tǒng)計特性從幾個觀測信號中恢復(fù)出未知的獨(dú)立源成分。本文重點(diǎn)研究了以語音信號為背景的盲處理方法,在語音和聽覺信號處理領(lǐng)域中,如何從混有噪聲的的混疊語音信號中分離出各個語音源信號,來模仿人類的語音分離能力,成為一個重要的研究問題。具體實(shí)現(xiàn)主要結(jié)合ica技術(shù),將語音去噪作為一個
4、預(yù)處理過程,對帶噪聲的混疊語音盲分離進(jìn)行了研究,本文詳細(xì)了介紹三種fastica算法:sobi算法以及cica算法,將三種算法應(yīng)用于實(shí)際的語音信號噪聲分離中,并比較了傳統(tǒng)算法和基于ica/bss算法在語音消噪和增強(qiáng)方面的差異,文章最后還介紹了分離效果評價準(zhǔn)則,并比較了snr和sir參數(shù)。關(guān)鍵詞: 語音信號,語音信號噪聲,盲源分離,獨(dú)立成分分析abstractblind separation of speech signal processing means is the use of bss techniques microphone detects a voice signal proces
5、sing. separation of mixed speech signals is important for blind separation, the current separation of overlapping speech is built mostly in the absence of aliasing noise in the environment, under the circumstances, mainly in blind source separation (blind source separation, bss), the statistical cha
6、racteristics of signal several observations from the unknown signal to recover the independent source components; this article focuses on the background to the blind speech signal processing method, signal processing, speech and hearing, how the noise from a mixture of overlapping speech signal to s
7、eparate the various audio source signals to mimic human speech separation ability become an important research question. combination of concrete realization of the main ica technology, speech denoising as a preprocessing of speech with noise-aliasing blind separation were studied, the paper introduc
8、es three kinds of fastica algorithm: sobi algorithm and the cica algorithm, three kinds of algorithm application the actual noise in speech signal separation, and compared the traditional algorithm and the ica / bss algorithm in speech denoising and enhancement of the differences, the paper finally
9、describes the separation evaluation criteria, and compared the snr and sir parameters.keywords: voice signal, voice signal noise, blind source separation, independent component analysis41第一章 語音信號及噪聲概述 1.1 語音信號的概述 1.1.1 語音特性分析1.語音產(chǎn)生機(jī)理發(fā)聲器官分為三部分:肺、喉(聲門)和聲道。肺的作用相當(dāng)于一個動力源,將氣流輸送到喉部。喉將來自肺部的氣流調(diào)制為周期脈沖或類似隨機(jī)噪聲的
10、激勵聲源,并送入聲道。喉在發(fā)聲中的作用是控制聲帶的開啟和閉合,使得氣流形成一系列脈沖,聲帶振動的頻率決定了聲音頻率的高低。由聲帶振動產(chǎn)生的音統(tǒng)稱為濁音,而不由聲帶振動產(chǎn)生的音統(tǒng)稱為清音。聲道包括口腔、鼻腔和咽腔,它們對聲源的頻譜進(jìn)行整形而產(chǎn)生不同音色的聲音。聲道的諧振頻率稱為共振峰頻率,它與聲道的形狀和大小有關(guān),每種形狀都有一套共振峰頻率作為其特征,改變聲道的形狀就產(chǎn)生不同的語音,因而,當(dāng)聲道形狀改變時,語音信號的頻譜特性就隨之改變。聲源經(jīng)過聲道潤色頻譜后,最后從嘴唇或鼻孔或同時從嘴唇和鼻孔輻射出來,形成可傳播的聲波,被人感知為語音。綜上所述,語音由空氣流經(jīng)過聲門激勵,經(jīng)由聲道調(diào)制,經(jīng)過嘴輻射
11、出去,完整的語音信號產(chǎn)生的數(shù)學(xué)模型可以用三個子模型:激勵模型、聲道模型和輻射模型的串連來表示。2語音的特性(1)短時平穩(wěn)性根據(jù)對語音信號的研究,語音是一種時變的、非平穩(wěn)的隨機(jī)過程,但另一方面,由于人類發(fā)聲系統(tǒng)的生理結(jié)構(gòu)的變化速度是有一定限度的,在一段短時間內(nèi)(1030ms)人的聲帶和聲道形狀基本穩(wěn)定,并且大部分情況下,激勵源參數(shù)也是如此,因此可認(rèn)為短時間內(nèi)語音特征是不變的,語音的短時性特點(diǎn)是對語音信號進(jìn)行分析和處理的基礎(chǔ)。(2)濁音和清音語音分為濁音和清音兩大類,二者從語音產(chǎn)生的機(jī)理上有明顯的差異,前者由周期性脈沖產(chǎn)生,后者由隨機(jī)噪聲產(chǎn)生,因而在特征上也有明顯的區(qū)別。濁音在時域上呈現(xiàn)出明顯的周
12、期性,在頻域上具有共振峰結(jié)構(gòu)而且能量大部分集中在較低頻段內(nèi)。清音則完全不同,它沒有明顯的時域和頻域特征,類似于白噪聲。濁音在頻譜上有共振峰結(jié)構(gòu),能量重要集中在低頻區(qū)(1000hz)。1.1.2 語音信號的基本特征(1)語音信號的時域特征由于說話人在不同時刻的說話內(nèi)容千變?nèi)f化,而且沒有確定的規(guī)律性,因此語音信號是時變的。但由于人類的發(fā)聲器官的變化速率有限,聲道在短時間內(nèi)(5500ms)處于平穩(wěn)狀態(tài),因此語音信號具有短時平穩(wěn)性。而這種短時平穩(wěn)性,也是語音處理中許多理論和算法的必要前提。由于人們在說話時,各個音節(jié)或單詞之間總會存在著時間上的間隔,因此語音信號在時域上存在著有音段和無音段。通過有音段和
13、無音段的檢測,可用去除帶噪語音中平穩(wěn)的噪聲。此外,無音段所占比例越大,語音的稀疏性越好,利用這一特點(diǎn),產(chǎn)生了許多基于語音稀疏性的增強(qiáng)算法。(2)語音信號的頻域特征語音信號的頻譜能量主要集中在300-3400hz范圍內(nèi)。語音本身由濁音和清音組成,濁音含有語音信號的大部分能量,其頻譜分布主要集中在低頻段中的基音頻率及其各次諧波上,呈現(xiàn)出明顯的周期性;清音則表現(xiàn)出隨機(jī)性,在頻譜上類似于白噪聲。(3)語音信號的統(tǒng)計特征語音信號可以看作是一個遍歷性隨機(jī)過程的樣本函數(shù),其統(tǒng)計特性可用其幅度的概率密度函數(shù)來描述。對語音信號的統(tǒng)計特性的研究表明,其幅度分布的概率密度函數(shù)可以用兩種近似的表達(dá)式來較好地描述,其中
14、一種是伽馬(gamma)分布 (1-1)式中k是一個常數(shù),與標(biāo)準(zhǔn)差仃,有下列關(guān)系 (1-2) 另一種是拉普拉斯分布(laplacian)分布 (1-3)式中,口是一個由標(biāo)準(zhǔn)差仃。決定的常數(shù),即 (1-4)相對說來,伽馬分布對語音信號的幅度分布描述更為精確一點(diǎn),而拉普拉斯分布的函數(shù)形式則更加簡潔。1.2語音噪聲特性分析1.2.1 信噪比(signal noise ratio,snr)最常用的一種客觀評價方法就是計算增強(qiáng)后的語音信號的信噪比,又稱為訊噪比,狹義來講是指放大器的輸出信號的電壓與同時輸出的噪聲電壓的比,常常用分貝數(shù)表示。設(shè)備的信噪比越高表明它產(chǎn)生的雜音越少。一般來說,信噪比越大,說明混
15、在信號里的噪聲越小,聲音回放的音質(zhì)量越高,否則相反。信噪比一般不應(yīng)該低于 70db,高保真音箱的信噪比應(yīng)達(dá)到110db以上。其計算公式如下: (1-5)式中,是未失真的理想信號,對應(yīng)于原始純凈語音;是失真后的信號,對應(yīng)于經(jīng)過語音增強(qiáng)后的信號。1.2.2 信干比(signal-to-interference ratio,sir)為了說明盲分離的效果,提出的信號干擾比sir(signal interference ratio)的概念:分離性能是通過將每一個估計出的源信號和相應(yīng)的真實(shí)源信號的對比計算出來的。計算分2個步驟進(jìn)行,首先是將進(jìn)行分解: (1-6)其中是經(jīng)某一允許的變形(allowed di
16、stortion)修正之后的版本,這里所謂允許的變形是指:例如,對于線性瞬時混合的盲源分離算法,我們可以接受時不變增益的變形(itime-invariant gains allowed distortions);對于卷積混合的盲源分離算法,我們可以接受時不變?yōu)V波的變形(time-invariant filters allowed distortions)。而和分別表示干擾、噪聲和人工因素帶來的誤差(artifacts error)。式子(215)右邊的4個項(xiàng)分別代表了,如下各部分:來自于期望(wanted)源的部分、來自于不想要的(unwanted)源的部分、來自于傳感器噪聲的部分咀及來自于其
17、它因素的部分(例如來自于源的禁止變形)。接下來的第2步就是要計算能量比來評估上面4個項(xiàng)的相對數(shù)量大小。我們主要關(guān)注的是信干比(sir): (1-7)第二章 盲信號處理2.1盲信號處理的概述2.1.1 盲信號處理的基本概念盲信號處理是現(xiàn)代數(shù)學(xué)信號處理、算智能學(xué)近年來迅速發(fā)展的重要方向。電子信息、通信、生物醫(yī)學(xué)、圖像增強(qiáng)、雷達(dá)、地球物理信號處理等眾多領(lǐng)域有廣泛的應(yīng)用前景。盲信號處理就是利用系統(tǒng)(如無線信道、通信系統(tǒng)等)的輸出觀測數(shù)據(jù),通過某種信號處理的手段, 獲得我們感興趣的有關(guān)信息(如原來獨(dú)立發(fā)射的信號等)。盲信號的研究是當(dāng)前學(xué)術(shù)界的一個研究熱點(diǎn),而盲信號分離則是盲信號研究中的一個重要的課題。b
18、ss是指從觀測到的混合信號中分離出未知的源信號。盲信號中的“盲”意味著兩個方面:第一,對源信號一無所知或只有少許的先驗(yàn)知識。第二,混合本身是未知的。這看似是一個不可能的任務(wù),然而理論和實(shí)際都證實(shí)了只需要相當(dāng)簡單的假設(shè),就可以得到該問題的解。這一特點(diǎn)使得bss成為一種功能相當(dāng)強(qiáng)大的信息處理方法?;旌暇仃嚪蛛x矩陣噪聲向量s(t)x(t)y(t)圖2.1.1 盲處理原理框圖2.1.2 盲信號處理的方法和分類在盲信號處理中,就源信號進(jìn)過傳輸通道的混合方式而言,其處理方法可分為線性瞬時混合信號盲處理、線性卷積混合信號盲處理和非線性混合信號盲處理三類。根據(jù)通道傳輸特性中是否含有噪聲、噪聲特性(白噪聲、有色
19、噪聲等)、噪聲混合形式,可分為有噪聲、無噪聲盲處理,含加性噪聲和乘性噪聲混合信號盲處理等。按源信號和觀測信號數(shù)目的不同可以將混合方式分為欠定 、適定和超定情況 ;按源信號特性的不同分為 : 平穩(wěn) 、非平穩(wěn) 、超高斯 、亞高斯 、超高斯和亞高斯混合分離等 。盲處理的目的可分為盲辨識和盲源分離兩大類。盲辨識的目的是求得傳輸通道混合矩陣(新型混合矩陣、卷積混合矩陣、非線性混合矩陣等)。盲源分離的目的是求得源信號的最佳估計。當(dāng)盲源分離的各分量相互獨(dú)立時,就稱為獨(dú)立分量分析,即獨(dú)立分量分析是盲源分離的一種特殊情況。2.1.3 盲信號處理技術(shù)的研究應(yīng)用近年來,盲信號處理逐漸成為當(dāng)今信息處理領(lǐng)域中熱門的課題
20、之一,并且已經(jīng)在尤其在生物醫(yī)學(xué)工程、醫(yī)學(xué)圖像、語音增強(qiáng)、遙感、通信系統(tǒng)、地震探測、地球物理學(xué)、計量經(jīng)濟(jì)學(xué)和數(shù)據(jù)挖掘等領(lǐng)域顯示出誘人的前景,特別是盲源分離技術(shù)、ica的不斷發(fā)展和應(yīng)用最為引人注目。下面介紹盲處理應(yīng)用中的兩個主要方面:1.語音識別領(lǐng)域語音信號分離、語音識別是盲處理應(yīng)用的一個重要領(lǐng)域。最典型的應(yīng)用就是聲控計算機(jī),計算機(jī)所接受到的語音指令肯定是肯定是帶有各種環(huán)境噪聲的,還可能存在其他的語音信號(如有其他人說話),而且這些信號源與接收器的相對位置也未知,計算機(jī)需要在這種情況下識別出正確的語音命令。在移動通信中,往往存在通信質(zhì)量問題,極大的影響了通話效果,而盲源分離或盲均衡技術(shù)能夠消除噪聲
21、、抑制干擾及增強(qiáng)語音,提高通話質(zhì)量。2.生物醫(yī)學(xué)信號處理在生物醫(yī)學(xué)領(lǐng)域,盲信號處理可應(yīng)用于心電圖(ecg)、腦電圖(eeg)信號分離、聽覺信號分析、功能磁共振圖像(fmri)分析等。例如人們常常需要從肌電圖中確定神經(jīng)元細(xì)胞信號的觸發(fā)模式,而emg信號通常由多個特殊的傳感器在人體表處測得,從信號源到傳感器之間的信號傳輸介質(zhì)參數(shù)是未知的,而人們之間各不相同。目前已經(jīng)有一些學(xué)者將盲源分離技術(shù)成功地夠應(yīng)用于腦電圖等信號的數(shù)據(jù)處理。2.2 盲源分離法2.2.1 盲源分離技術(shù)盲源信號分離(blind source separation, bss) 是20世紀(jì)90年代迅速發(fā)展起來的一個研究領(lǐng)域 。它具有可靠
22、的理論基礎(chǔ)和許多方面的應(yīng)用潛力。其在生物醫(yī)學(xué)工程 、醫(yī)學(xué)圖像 、語音增強(qiáng) 、遙感 、通信系統(tǒng) 、地震探測等領(lǐng)域有著廣泛而誘人的前景 ,盲源分離成為信號處理和神經(jīng)網(wǎng)絡(luò)領(lǐng)域的研究熱點(diǎn) 。盲源分離是針對從檢測的混合信號中估計或恢復(fù)源信號的問題提出的,是指源信號、傳輸通道特性未知的情況下,僅由觀測信號和源信號的一些先驗(yàn)知識(如概率密度)估計出源信號各個分量的過程。例如最著名的雞尾酒會問題,僅根據(jù)多個麥克風(fēng)檢測信號分離或恢復(fù)出某種語音源信號。2.2.2 盲分離算法實(shí)現(xiàn)在實(shí)際的ica盲分離算法應(yīng)用中,一般有時是必需的對觀測數(shù)據(jù)做一些預(yù)處理技術(shù),如用主成分分析 ( pca )降維和白化,用濾波器進(jìn)行濾波降噪
23、處理等。另外,由于恢復(fù)準(zhǔn)則的局限以及先驗(yàn)知識的缺乏,盲信號分離方法只能得到源信號的波形,而無法確定信號的幅值以及信號之間的順序。這兩點(diǎn)都需要人為的制定規(guī)則(如規(guī)定信號的方差為1來確定幅值)來確定。 圖2.2.1 盲信號分離基本原理框圖2.2.3 盲源分離技術(shù)的研究發(fā)展和應(yīng)用1986 年,法國學(xué)者jeanny herault和christian jutten提出了遞歸神經(jīng)網(wǎng)絡(luò)模型和基于hebb學(xué)習(xí)律的學(xué)習(xí)算法,以實(shí)現(xiàn)2個獨(dú)立源信號混合的分離。這一開創(chuàng)性的論文在信號處理領(lǐng)域中揭開了新的一章,即盲源分離問題的研究。其后二十幾年來,對于盲信號分離問題,學(xué)者們提出了很多的算法,每種算法都 在一定程度上取
24、得了成功。從算法的角度而言,bss算法可分為批處理算法和自適應(yīng)算法;從代數(shù)函數(shù)和準(zhǔn)則而言,又分為基于神經(jīng)網(wǎng)絡(luò)的方法、基于高階統(tǒng)計量的方法、基于互信息量的方法、基于非線性函數(shù)的方法等。盡管國內(nèi)對盲信號分離問題的研究相對較晚,但在理論和應(yīng)用方面也取得很大的進(jìn)展。清華大學(xué)的張賢達(dá)教授在其 1996 年出版的時間序列分析高階統(tǒng)計量方法一書中,介紹了有關(guān)盲分離的理論基礎(chǔ),其后關(guān)于盲分離的研究才逐漸多起來。近年來國內(nèi)各類基金支持了盲信號處理理論和應(yīng)用的項(xiàng)目,也成立了一些研究小組。雖然盲源分離理論方法在最近20年已經(jīng)取得了長足的發(fā)展,但是還有許多問題有待進(jìn)一步研究和解決。首先是理論體系有待完善。實(shí)際采用的處
25、理算法或多或少都帶有一些經(jīng)驗(yàn)知識,對于算法的穩(wěn)定性和收斂性的證明不夠充分。盲源分 離尚有大量的理論和實(shí)際問題有待解決,例如多維ica問題、帶噪聲信號的有效分離方法、如何更有效地利用各種先驗(yàn)知識成功分離或提取出源信號、一般性 的非線性混合信號的盲分離、如何與神經(jīng)網(wǎng)絡(luò)有效地結(jié)合、源信號的數(shù)目大于觀察信號的數(shù)目時ica方法等。另外,盲源分離可同其他學(xué)科有機(jī)結(jié)合,如模糊系 統(tǒng)理論在盲分離技術(shù)中的應(yīng)用可能是一個有前途的研究方向;盲源分離技術(shù)與遺傳算法相結(jié)合,可以減少計算復(fù)雜度,提高收斂速度。如何有效提高算法對源信號統(tǒng)計特性的學(xué)習(xí)和利用也需要進(jìn)行深入研究。在硬件實(shí)現(xiàn)方面,盲分離問題也存在著極大的發(fā)展空間,
26、例如用fpga實(shí)現(xiàn)等。經(jīng)過人們將近20年的共同努力,有關(guān)盲分離的理論和算法得到了較快發(fā)展,包括 盲分離問題本身的可解性,以及求解原理等方面的基本理論問題在一定程度上得到了解決,并提出了一些在分離能力、內(nèi)存需求、計算速度等方面性能各異的 算 法。由于該問題的理論研究深度和算法實(shí)現(xiàn)難度都較大,目前對于盲分離的研究 仍然很不成熟,難以滿足許多實(shí)際應(yīng)用需求,許多理論問題和算法實(shí)現(xiàn)的相應(yīng)技術(shù)也有待進(jìn)一步探索。2.3 獨(dú)立成分分析獨(dú)立分量分析 ( independent component analy2sis , ica)是由herault和j utten在1983年提出,該方法不依賴與源信號類型相關(guān)的詳
27、細(xì)知識或信號傳輸系統(tǒng)特性的精確辨識,是一種有效的冗余取消技術(shù),被廣泛應(yīng)用于盲源分離 ( blind source separation bss)、特征提取和盲解卷、生理學(xué)數(shù)據(jù)分析語音信號處理、圖像處理及人臉識別等領(lǐng)域。該方法根據(jù)代價函數(shù)的不同 ,可以得到不同的ica算法,如信息最大化(infomax)算法、fast ica算法、最大熵( m e)和最小互信息( mm i)算法、極大似然(ml)算法等。在統(tǒng)計學(xué)中,獨(dú)立成分分析或獨(dú)立分量分析(independent components analysis,縮寫:ica)是一種利用統(tǒng)計原理進(jìn)行計算的方法。它是一個線性變換。這個變換把數(shù)據(jù)或信號分離成
28、統(tǒng)計獨(dú)立的非高斯的信號源的線性組合。獨(dú)立成分分析是盲信號分離(blind source separation)的一種特例。2.3.1 獨(dú)立成分分析的定義ica是一種用來從多變量(多維)統(tǒng)計數(shù)據(jù)里找到隱含的因素或成分的方法,被認(rèn)為是主成分分析(principal component analysis, pca)和因子分析(factor analysis)的一種擴(kuò)展。對于盲源分離問題,ica是指在只知道混合信號,而不知道源信號、噪聲以及混合機(jī)制的情況下,分離或近似地分離出源信號的一種分析過程。獨(dú)立成分分析(independent component analysis, ica)是近年來出現(xiàn)的一種強(qiáng)
29、有力的數(shù)據(jù)分析工具(hyvarinen a, karhunen j, oja e, 2001; roberts s j, everson r, 2001)。1994年由comon給出了ica的一個較為嚴(yán)格的數(shù)學(xué)定義,其思想最早是由heranlt和jutten于1986年提出來的。ica從出現(xiàn)到現(xiàn)在雖然時間不長,然而無論從理論上還是應(yīng)用上,它正受到越來越多的關(guān)注,成為國內(nèi)外研究的一個熱點(diǎn)。特別是從應(yīng)用角度看,它的應(yīng)用領(lǐng)域與應(yīng)用前景都是非常廣闊的,目前主要應(yīng)用于盲源分離、圖像處理、語言識別、通信、生物醫(yī)學(xué)信號處理、腦功能成像研究、故障診斷、特征提取、金融時間序列分析和數(shù)據(jù)挖掘等。盲源分離技術(shù)是近二
30、十年發(fā)展起來的一門新型科學(xué),在各國科學(xué)家和研究人員的努力下獲得了充分的發(fā)展,但是ica的研究方興未艾,它畢竟是一個涉及面廣并且仍處于發(fā)展前沿的課題,在理論上還遠(yuǎn)沒有成熟,許多問題有待進(jìn)一步研究和解決。(1)帶噪混合信號的盲分離問題。盲信號處理中的未知條件太多,混合信號含有噪聲的情況下的盲源分離問題解決起來是相當(dāng)困難的。盡管目前已有部分算法對存在噪聲的情況表現(xiàn)出了良好的性能,但由于噪聲種類繁多,因此處理起來仍很棘手?,F(xiàn)有的大多數(shù)盲源分離或盲解卷積算法都假設(shè)不含噪聲或者把噪聲看作是一個獨(dú)立的信源信號來處理。(2)非平穩(wěn)混合信號的盲源分離算法。許多情況下源信號可能是非平穩(wěn)的,如何利用信號的非平穩(wěn)特性
31、進(jìn)行盲源分離是擺在廣大研究人員面前的一個現(xiàn)實(shí)問題。(3)卷積混合信號的盲源分離算法。在實(shí)際中,系統(tǒng)接收到的混合輸入信號是源信號經(jīng)過不同的傳播途徑到達(dá)接收器。在這個過程中,不可避免的存在信號的時延和反射。針對這種情況的盲源分離算法還很不成熟。(4)ica的推廣應(yīng)用。在算法應(yīng)用方面,ica可以取得進(jìn)一步的發(fā)展,如可以在語音識別、圖像處理、特征提取、醫(yī)學(xué)信號處理方面作進(jìn)一步的研究。目前的關(guān)鍵的問題是如何將理論算法轉(zhuǎn)化為實(shí)際應(yīng)用,以及如何建立更加符合實(shí)際情況的模型等。(5)算法的收斂性。算法全局收斂性的研究,可以考慮將遺傳算法、混沌算法等具有全局收斂性的優(yōu)化算法和ica結(jié)合起來,提高算法的全局收斂性。
32、2.3.2 ica的基本原理(1)無噪聲的ica模型ica作為生成模型的估計給定隨即變量的一組觀測,其中是時間或者樣本標(biāo)號,假設(shè)它們有獨(dú)立成分線性混合而產(chǎn)生:=a (2-1)式中,是某個未知矩陣。用向量-矩陣符號方式表示通常比上面的求和表達(dá)式更為方便。用隨機(jī)向量x來表示混合向量,其元素分別為,同樣地,用來表示元素,用矩陣表示那些混合系數(shù)。所有的向量都理解為列向量;這樣或者稱的轉(zhuǎn)置就是一個行向量。利用向量和矩陣符號表示,混合模型可以寫為: (2-2)有時我們需要使用矩陣a中的列向量,如果將其表示為,則模型也可以寫為: (2-3)(2)有噪聲的ica模型將基本的ica模型擴(kuò)展到有噪聲的情形,并且假
33、設(shè)噪聲是以加性噪聲形式存在的。這是一個相當(dāng)現(xiàn)實(shí)的假設(shè),因?yàn)榧有栽肼暿且蜃臃治龊托盘柼幚碇型ǔQ芯康臉?biāo)準(zhǔn)形式,具有簡單的噪聲模型表達(dá)方式。因此,噪聲ica模型可表示為: (2-4)式中,是噪聲向量。信號源噪聲,即直接添加到獨(dú)立成分(即信號源)上的噪聲。信號源噪聲可用與式(2.1)稍有差別的下式來表示: (2-5)實(shí)際上,如果可以直接考慮帶噪聲的獨(dú)立成分,那么可將此模型寫為: (2-6)可以看出,這就是基本的ica模型,只是獨(dú)立成分本身變了。2.3.3 本文對ica的研究目的及實(shí)現(xiàn)獨(dú)立分量分析的含義是把信號分解成若干個互相獨(dú)立的成分,它是為了解決盲信號分離的問題而發(fā)展起來的。如果信號本來就是由若干
34、獨(dú)立信源混合而成的,ica就能恰好把這些信源分解開來。故在一般的文獻(xiàn)中通常把ica等同于bss,ica不同于主分量分析把目光投注于信號的二階統(tǒng)計量,研究信號間的相關(guān)關(guān)系,而是基于信號的高階統(tǒng)計量,研究信號間的獨(dú)立關(guān)系。作為一個形象的圖示,我們可以借鑒下面的波形,原始的語言信號是類似圖(2.1)中的信號,而混合信號是如圖(2.3)樣子的數(shù)據(jù)。需要解決的問題是,如何僅使用圖(2.3)中的數(shù)據(jù)還原的到圖(2.1)的“源”信號。圖2.3.1 源信號s圖2.3.2 混合矩陣a圖2.3.3 混合信號x獨(dú)立成分分析方法能夠基于信息的的獨(dú)立性來估計,這樣我們就能從混合信號中分離出三個原始信號。第三章 盲語音信
35、號分離的實(shí)現(xiàn)及抑噪分析3.1 盲語音信號分離的實(shí)現(xiàn)3.1.1 盲信號分離的三種算法(1)二階盲辨識(sobi)sobi先對觀測信號作白化處理,得到。定義和的時延相關(guān)矩陣為 (3-1) (3-2)由易知: (3-3) 又因?yàn)?,所?(3-4) (3-5)由各分量相互獨(dú)立可知,是對角矩陣。由此可見,矩陣可以將對角化。在sobi算法中,取一組不同的值,要求能同時使得各個盡可能的對角化,其中。(2)fastica算法fastica算法是芬蘭赫爾辛基工業(yè)大學(xué)計算機(jī)及信息科學(xué)實(shí)驗(yàn)室hyvarinen等人1997年首先提出并發(fā)展起來的,在1999年進(jìn)一步提出了改進(jìn)基于負(fù)熵的ica固定點(diǎn)算法。該算法基于非高斯
36、性最大化原理,使用固定點(diǎn)(fixed-point)迭代理論尋我w1x非高斯性最大值,采用牛頓迭代算法對觀測變量x的大量采樣點(diǎn)進(jìn)行批處理,每次從觀測信號中分離出一個獨(dú)立分量,是獨(dú)立分量分析的一種快速算法。fastica算法,由于采用了定點(diǎn)迭代的思想,所以又稱固定點(diǎn)(fixed-point)算法或定點(diǎn)算法,是一種快速尋優(yōu)神經(jīng)網(wǎng)絡(luò)算法。與普通的神經(jīng)網(wǎng)絡(luò)算法不同的是這種算法采用了牛頓迭代的思想對采樣點(diǎn)采用批處理的方式,在每一步迭代中有大量的樣本數(shù)據(jù)參與運(yùn)算?;谀繕?biāo)函數(shù)的選擇不同,從而產(chǎn)生了fastica算法的基于負(fù)熵最大、峭度、互信息最小、最大似然估計等的多種形式。fastica算法的優(yōu)點(diǎn):1.收斂
37、速度快,fastica收斂速度為2次以上,普通的ica算法收斂僅為1次(線性)的。2.和梯度算法不同,無須選步長參數(shù),易于使用。3.能利用任何的非線性函數(shù)直接找出任何非高斯分布的獨(dú)立分量,而對于其他的算法來說,概率密度函數(shù)的估計不得不首先進(jìn)行。4.它的性能能夠通過選擇適當(dāng)?shù)姆蔷€性函數(shù)來最佳化。5.獨(dú)立分量可被逐個估計出來,類似于做投影追蹤,這在僅需要估計幾個(不是全部)獨(dú)立分量的情況下,能減小計算量。6.fastica算法有許多神經(jīng)算法的優(yōu)點(diǎn),它是并行、分布式的且計算簡單,內(nèi)存要求很少。然而fastica算法也尤其自身的缺點(diǎn),首先是它對初值的選擇較自然梯度算法敏感,當(dāng)初值的選擇不是很合適的時候
38、,算法的分離性能急劇的下降,其次算法的迭代步長有待進(jìn)行自適應(yīng)的優(yōu)化。(3)cica(constrained independent component analysis,clca)算法本文所使用的約束獨(dú)立分量分析(constrained independent component analysis,cica)算法倒是一種改良的fastlca算法。在clca提取過程中,通過引入簡單的約束參考信號來幫助分離某特定目標(biāo)分量,從而有利于去除干擾信號。clca算法的基本原理與fastlca相同,每次提取一個獨(dú)立分量。文中所選用的cica算法,實(shí)際上是一種加入了約束參數(shù)的fastica算法,從而使ica算
39、法不用再進(jìn)行特征提取與目標(biāo)判定,就可以容易的分離出所需要的目標(biāo)分量。雖然cica算法對信號分離具有良好的效果,但在實(shí)際應(yīng)用過程中,cica還需要進(jìn)一步的探討研究。如閾值與學(xué)習(xí)率的選擇不當(dāng),就會很容易引起輸出結(jié)果發(fā)散。同時收斂速度與誤差函數(shù)的選擇也有關(guān)系,誤差函數(shù)的形式要根據(jù)輸入數(shù)據(jù)和參考信號來進(jìn)行選擇。3.1.2 不同算法的分離性能比較sobi算法利用了源信號的頻譜差異性來分離源信號,當(dāng)源信號中存在頻譜結(jié)構(gòu)相似的分量時,分離性能便會較差,這是sobi算法的缺點(diǎn)。fastica算法的特點(diǎn):1在1ca模型中,fastica算的收斂速度是二次以上的,而梯度搜索法只是一次收斂。2與梯度搜索法相比,fa
40、stlca的步長參數(shù)容易確定。3該算法適用于任何非高斯信號。4可以通過選擇不同的非線性函數(shù)g(y)使算法的獲得不同的性能。基f獨(dú)立分量分析的混合語音信號自分離系統(tǒng)的研究5可以逐個的估計獨(dú)立分量。6該算法是并行的、分布的,且計算簡單,需要的內(nèi)存較少。fastlca算法和其他的ica算法相比,有著許多我們期望的特性:收斂速度快;和梯度算法不同,無需選擇步長參數(shù),易于使用;該算法能適用于任何非高斯信號;可以通過使用不同的非線性函數(shù)g-(y)使算法獲得不同的性能;獨(dú)立分量可被逐個估計出來,這在僅需要估計幾個獨(dú)立分量的情況下,能減小計算量:fastica算法有許多神經(jīng)算法的優(yōu)點(diǎn):并行、分布、計算簡單,內(nèi)
41、存要求小。3.2 抑制噪聲的算法仿真及結(jié)果分析3.2.1 抑噪算法仿真實(shí)現(xiàn)下面仿真中所使用的語音源信號是在干擾噪聲很小的環(huán)境下用麥克風(fēng)錄制的4段不同的語音文件,保存成*.wav文件dkumar1.wav, ganesh1.wav, ganesh2.wav, kath2.wav,四個男聲采樣率均為44100hz,持續(xù)時間為7s,采樣點(diǎn)數(shù)為5000。圖41是這4個語音源信號的時域波形,圖中的橫坐標(biāo)表示樣本點(diǎn)數(shù),縱坐標(biāo)表不語音信號的幅度水平。原始的語音信號如下: 圖3.2.1 原始語音信號s該仿真的混合矩陣是由計算機(jī)在icalab工具箱環(huán)境下產(chǎn)生的,參數(shù)見下圖:圖3.2.2 矩陣a參數(shù)即該矩陣為一個
42、4x4的方陣: 混合后的語音信號: 圖3.2.2 混合信號xsobi算法將觀察信號x1,x2,x3,x4分離,得到分離后信號y1,y2,y3,y4,分別對應(yīng)源得到的分離信號y: 圖3.2.3 分離信號x從試驗(yàn)結(jié)果,我們可以看出分離語音信號從波形上看很好地保持了原始信號的波形,而且實(shí)際分離的語音信號在聽覺上也很好的實(shí)現(xiàn)了分離,而且?guī)缀鯖]有什么失真效果。3.2.2分離結(jié)果分析我們分別使用sobi、fastica和cica算法對dkumar1.wav ,ganesh1.wav, ganesh2.wav, kath2.wav 作為源信號的混疊進(jìn)行盲分離試驗(yàn),且每種算法分別加入5db、10db、15db
43、的高斯噪聲,從中分離出的四個源信號的近似值y1,y2,y3和y4,我們分別用三種上述的盲分離的算法針對本文給出的混合語音信號進(jìn)行分離并比較每個算法分離后的波形圖。下面采用sobi法、fastica法和cica法對混合信號進(jìn)行分離sobi法的分離結(jié)果如圖441所示,fastica法的分離結(jié)果如圖442所示,cica法的分離結(jié)果如圖4 43所示。圖3.2.1 sobi算法在ica工具箱的實(shí)現(xiàn)圖3.2.2 fpica算法在ica工具箱的實(shí)現(xiàn)圖3.2.3 cica算法在ica工具箱的實(shí)現(xiàn)(1)未加噪聲的分離信號:圖3.2.4 無噪聲的分離結(jié)果 (2) 加入噪聲為5db的分離信號y:圖3.2.5 利用s
44、obi法的分離結(jié)果圖3.2.6 利用fpica法的分離結(jié)果圖3.2.7 利用cica法的分離結(jié)果(3) 加入噪聲為10db的分離信號y:圖3.2.8 利用sobi法的分離結(jié)果圖3.2.9 利用fpica法的分離結(jié)果圖3.2.10 利用cica法的分離結(jié)果(3) 加入噪聲為15db的分離信號y:圖3.2.11 利用sobi法的分離結(jié)果圖3.2.12 利用fpica法的分離結(jié)果圖3.2.13 利用cica法的分離結(jié)果比較三種算法得到的分離信號后的波形圖4.9圖4.10圖4.11與原始信號的波形圖4.7可以看出三種算法也都較好地恢復(fù)除了原始信號的波形雖然在兩個源信號中白噪聲并不滿足非平穩(wěn)和有色的特性
45、這三種算法也都較好地恢復(fù)出了原始信號的波形為了定量地比較三個算法的優(yōu)劣性我們依然再進(jìn)行分離前后的信號干擾比的比較。3.2.2 不同算法的分離性能比較 比較三種算法得到的分離信號后的波形圖4.4圖4.5圖4.6與原始信號的波形圖4.2可以看出三種算法都較好地恢復(fù)了原始信號的波形為了定量地比較三個算法的優(yōu)劣性下面將對分離前后的信噪比和信號干擾比進(jìn)行比較。(1)信噪比三種方法信噪比snr對比結(jié)果:表3.1 加入噪聲為5db的snr對比輸出信號算法y1y2y3y4平均snr原始snr3.19488.35280.21460.49543.0644sobi算法42.862638.689027.479128.
46、130934.2904fpica算法37.735838.705028.615833.428134.4673cica算法321.6893325.5677323.2908322.1231323.1677圖3.2.14信噪比snr折線圖比較一般來說,信噪比越大,說明混在信號里的噪聲越小,聲音回放的音質(zhì)量越高,否則相反。由混入5db噪聲的語音信號信噪比snr折線圖比較可知,經(jīng)過獨(dú)立成分分析的三種算法,混入聲音信號的噪聲已經(jīng)被大大的降低,即信噪比大大的提高,尤其是cica算法的抑噪效果相對其他兩種方法的要明顯,分離效果好一些。表3.2 加入噪聲為10db的snr對比輸出信號算法y1y2y3y4平均snr
47、原始snr4.97530.87870.17614.98072.7522sobi算法42.867248.883840.169427.352039.8180fpica算法39.676132.644035.212032.912835.1112cica算法38.298639.789633.159036.906537.0384圖3.2.15 信噪比snr折線圖比較從表3.2上可以看到,三種算法獲得的snr值基本在40個db左右,有良好的分離性能。由混入10db噪聲的語音信號信噪比snr折線圖比較可知,經(jīng)過獨(dú)立成分分析的三種算法,混入聲音信號的噪聲已經(jīng)被大大的降低,即信噪比大大的提高。表3.3 加入噪聲為
48、15db的三種方法snr對比輸出信號算法y1y2y3y4平均snr原始snr5.48060.02463.49323.98153.2449sobi算法47.909646.617944.696438.290744.3786fpica算法40.854537.189940.594141.088939.9318cica算法44.663546.663534.333135.027540.1716圖3.2.15 信噪比snr折線圖比較參數(shù)snr的值越大,說明結(jié)果中分離信號受到相對信號的干擾越小,抗噪聲能力也越好,即算法的分離效果越好。(2)信干比三種方法信噪比sir對比結(jié)果:sir (5db) y1y2 y3
49、 y4sobi 2.125214.0057 8.904721.8739 fpica 5.1505 9.8687 20.6370 6.0484 cica 13.0533 31.477619.8908 12.2678表3.4 加入噪聲為15db的三種方法snr對比圖3.2.16 三種算法的信干比sir折線圖比較sir可確定分離效果的好壞,sir越大,分離效果越好。由混入5db噪聲的語音信號信干比sir折線圖比較可知,經(jīng)過獨(dú)立成分分析的三種算法,混入聲音信號的噪聲已經(jīng)被大大的降低,信干比大大的提高,尤其是cica算法的抑噪效果相對其他兩種方法的要明顯,分離效果好一些。sir (10db) y1y2
50、y3 y4sobi0.381420.8609 12.297019.8839 fpica 7.1565 13.9021 3.2482 3.1075 cica 13.8781 3.73120.2918 16.8656表3.5 加入噪聲為15db的三種方法snr對比圖3.2.17 三種算法的信干比sir折線圖比較sir (15db) y1y2 y3 y4sobi18.662720.8026 6.801221.4230 fpica 5.7287 10.12345.4084 1.7941 cica 10.0285 5.85228.5043 17.8183表3.6 加入噪聲為15db的三種方法snr對比圖
51、3.2.18 三種算法的信干比sir折線圖比較sir可確定分離效果的好壞,sir越大,分離效果越好,由上面的折線圖可知,混入15db噪聲的語音信號信干比sobi分離法分離效果較其他兩種好一些。第四章 結(jié)論與展望 盲源分離算法是盲源分離問題的核心,本文研究了現(xiàn)有的幾種盲源分離算法,并在這些算法的基礎(chǔ)上結(jié)合具體應(yīng)用于語音信號的噪聲處理,對其加以改進(jìn),給出了新的算法。論文的主要工作如下:1研究獨(dú)立成分分析的原理及其基本模型。傳統(tǒng)的選取盲源分離算法只適用于單純超高斯信號(或者亞高斯信號)混合系統(tǒng)的分離,不適用于雜系混合(超高斯和亞高斯信號)系統(tǒng)的分離。論文中的ica主要應(yīng)用于語音信號噪聲的實(shí)現(xiàn)算法,及
52、目前的去除或抑制噪聲方法分析,引出獨(dú)立成分分析不能應(yīng)用于高斯信號和非獨(dú)立信號,可用來抑制高斯噪聲。2語音信號是一種非平穩(wěn)信號,本文研究了二階盲辨識(sobi)盲源分離算法,快速定點(diǎn)(fastica)算法以及約束獨(dú)立分量分析(cica)算法,利用這三種算法有效地解決了噪聲在語音信號中的分離問題,可以在不需要白化過程的情況下,得到良好的分離效果。對算法進(jìn)行了計算機(jī)仿真,并將三種算法在不同噪聲環(huán)境下的仿真結(jié)果進(jìn)行了比較。盲源分離技術(shù)正在不斷的發(fā)展,新的問題和算法層出不窮。雖然已經(jīng)有很多成熟的盲源分離算法,但是,作者認(rèn)為還是有很多問題待于進(jìn)一步的研究和解決:(1)帶噪聲混合信號的盲分離問題。由于在盲信號處理中,存在太多的未知條件,帶噪聲的混迭信號的盲分離是十分困難的?,F(xiàn)在研究的大部分盲源分離或者盲反卷積算法,都假設(shè)無噪聲的情況或者把噪聲看作一個獨(dú)立的源信號,在高階統(tǒng)計方法中,由于高斯信號高階累計量為零,所以可以假設(shè)加性高斯噪聲的存在,但是對于已有的盲源分離算法在什么情況下可以應(yīng)用到一般的噪聲混迭模型,是有待解決的問題。(2)欠完備情形的盲源分離問題。無論是盲源分離還是盲解卷積,現(xiàn)存的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第2單元 社會主義制度的建立與社會主義建設(shè)的探索 測試卷-2021-2022學(xué)年部編版八年級歷史下冊
- 八年級下冊期末考試模擬卷03(答案及解析)
- 《客戶經(jīng)理分享》課件
- 婚慶行業(yè)前臺服務(wù)工作總結(jié)
- 七年級下《鶴群》語文版-課件
- 2024員工三級安全培訓(xùn)考試題及答案考試直接用
- 小學(xué)生演講稿(15篇)
- 《社會工作概論概述》課件
- 季度成績梳理
- 皮膚護(hù)理QC課題
- 2024午托承包合同-校園內(nèi)學(xué)生午休服務(wù)協(xié)議3篇
- 馬克思主義基本原理+2024秋+試題 答案 國開
- 蘇州大學(xué)《線性代數(shù)與解析幾何》2023-2024學(xué)年第一學(xué)期期末試卷
- 《地震災(zāi)害及其防治》課件
- 2024年版電商平臺入駐商家服務(wù)與銷售分成合同
- 蜜雪冰城合同范例
- 小紅書種草營銷師(初級)認(rèn)證考試真題試題庫(含答案)
- LPG液化氣充裝站介質(zhì)分析操作規(guī)程 202412
- 養(yǎng)老院環(huán)境衛(wèi)生保潔方案
- 如何高效學(xué)習(xí)學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 2024-2025學(xué)年六年級科學(xué)上冊第二單元《地球的運(yùn)動》測試卷(教科版)
評論
0/150
提交評論