語音信號的盲分離范文參考

上傳人：A*** IP屬地：山東上傳時(shí)間：2023-04-29 格式：DOC 頁數(shù)：30 大小：1.21MB 積分：14 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩25頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

課程設(shè)計(jì)任務(wù)書題目: 語音信號的盲分離初始條件①matlab軟件②盲信號處理知識要求完成的主要任務(wù):根據(jù)盲信號分離原理，用matlab采集兩路以上的語音信號，選擇合適的混合矩陣生成若干混合信號。選取合適的盲信號分離算法（如獨(dú)立成分分析 ICA等）進(jìn)行訓(xùn)練學(xué)習(xí)，求出分離矩陣和分離后的語音信號。設(shè)計(jì)要求1）用matlab做出采樣之后語音信號的時(shí)域和頻域波形圖2）選擇合適的混合矩陣，得到混合信號，并做出其時(shí)域波形和頻譜圖3）采用混合聲音信號進(jìn)行訓(xùn)練學(xué)習(xí)，求出分離矩陣，編寫出相應(yīng)的確matlab代碼。4）用求出的分離矩陣從混合信號中分離出原語音信號，并畫出各分離信號的時(shí)域波形和頻譜圖。5）對結(jié)果進(jìn)行對比分析。時(shí)間安排17周，仿真設(shè)計(jì)18周，完成（答辯，提交報(bào)告，演示）指導(dǎo)教師簽名：年月日系主任（或責(zé)任教師）簽名：年月日word文檔可自由復(fù)制編輯目錄3Abstract............................................................41語音信號..........................................................51.1語音特性分析................................................51.2語音信號的基本特征..........................................62盲信號處理........................................................82.1盲信號處理的概述.............................................82.1.1盲信號處理的基本概念..................................82.1.2盲信號處理的方法和分類.................................92.1.3盲信號處理技術(shù)的研究應(yīng)用...............................92.2盲源分離法..................................................102.2.1盲源分離技術(shù)..........................................102.2.2盲分離算法實(shí)現(xiàn)........................................102.3獨(dú)立成分分析................................................112.3.1獨(dú)立成分分析的定義....................................112.3.2ICA的基本原理.......................................133語音信號盲分離的實(shí)現(xiàn).............................................153.1盲信號分離的三種算法........................................153.1.1二階盲辨識（SOBI）....................................153.1.2FastICA算法..........................................153.1.3CICA算法.............................................163.2不同算法的分離性能比較......................................173.3FastlCA的算法仿真及結(jié)果分析...............................174結(jié)論.............................................................225參考文獻(xiàn).........................................................23附錄...........................................................24word文檔可自由復(fù)制編輯摘要語音信號盲分離處理的含義是指利用 BSS技術(shù)對麥克風(fēng)檢測到的一段語音信號進(jìn)行處理。混合語音信號的分離是盲分離的重要內(nèi)容，目前的混疊語音分離大多是建立在無噪環(huán)境中的混疊情形下，主要以盲源分離(BlindSourceSeparation，BSS)，根據(jù)信號的統(tǒng)計(jì)特性從幾個(gè)觀測信號中恢復(fù)出未知的獨(dú)立源成分。本文重點(diǎn)研究了以語音信號為背景的盲處理方法，在語音和聽覺信號處理領(lǐng)域中，如何從混疊語音信號中分離出各個(gè)語音源信號，來模仿人類的語音分離能力，成為一個(gè)重要的研究問題。我們所要研究的混合語音信號盲分離問題就是用麥克風(fēng)陣列或多個(gè)麥克風(fēng)陣列來模仿人的耳朵,采集得到相互干擾的混疊語音信號,然后通過分離算法將混疊的語音信號相互分離開來,提取我們所感興趣的信號?！半u尾酒會(huì)”問題是語音盲分離問題的典型描述。它描述了在多人同時(shí)說話的嘈雜環(huán)境下,我們能夠辨識感興趣人的說話聲的能力。本文主要用ICA算法進(jìn)行盲分離。關(guān)鍵詞：語音信號，盲源分離，獨(dú)立成分分析word文檔可自由復(fù)制編輯AbstractBlindseparationofspeechsignalprocessingmeansistheuseofBSStechniquesmicrophonedetectsavoicesignalprocessing.Separationofmixedspeechsignalsisimportantforblindseparation,thecurrentseparationofoverlappingspeechisbuiltmostlyintheabsenceofaliasingnoiseintheenvironment,underthecircumstances,mainlyinblindsourceseparation(BlindSourceSeparation,BSS),thestatisticalcharacteristicsofsignalSeveralobservationsfromtheunknownsignaltorecovertheindependentsourcecomponents;Thisarticlefocusesonthebackgroundtotheblindspeechsignalprocessingmethod,signalprocessing,speechandhearing,howthenoisefromamixtureofoverlappingspeechsignaltoseparatethevariousaudiosourcesignalstomimichumanspeechseparationabilitybecomeanimportantresearchquestion.wewillstudymixofspeechsignalisblindsourceseparationwithamicrophonearrayormoremicrophonearraytoimitatehumanears,acquisitiongeteachotherinterferencealiasingspeechsignal,andthenthroughtheseparationalgorithmwillaliasingvoicesignalmutualseparated,extractionweareinterestedinsignal."Cocktail"problemisblindsourceseparationoftypicalproblemsspeechdescription.Itdescribesthepeoplespeakatthesametimeinthenoisyenvironment,wecanidentifyinterestedintheabilityofthehumanvoice.ThispapermainlyICAalgorithmwithblindseparation.keywords:speechsignal,blindsourceseparation,independentcomponentanalysisword文檔可自由復(fù)制編輯語音信號語音特性分析1.語音產(chǎn)生機(jī)理發(fā)聲器官分為三部分：肺、喉(聲門)和聲道。肺的作用相當(dāng)于一個(gè)動(dòng)力源，將氣流輸送到喉部。喉將來自肺部的氣流調(diào)制為周期脈沖或類似隨機(jī)噪聲的激勵(lì)聲源，并送入聲道。喉在發(fā)聲中的作用是控制聲帶的開啟和閉合，使得氣流形成一系列脈沖，聲帶振動(dòng)的頻率決定了聲音頻率的高低。由聲帶振動(dòng)產(chǎn)生的音統(tǒng)稱為濁音，而不由聲帶振動(dòng)產(chǎn)生的音統(tǒng)稱為清音。聲道包括口腔、鼻腔和咽腔，它們對聲源的頻譜進(jìn)行整形而產(chǎn)生不同音色的聲音。聲道的諧振頻率稱為共振峰頻率，它與聲道的形狀和大小有關(guān)，每種形狀都有一套共振峰頻率作為其特征，改變聲道的形狀就產(chǎn)生不同的語音，因而，當(dāng)聲道形狀改變時(shí)，語音信號的頻譜特性就隨之改變。聲源經(jīng)過聲道潤色頻譜后，最后從嘴唇或鼻孔或同時(shí)從嘴唇和鼻孔輻射出來，形成可傳播的聲波，被人感知為語音。綜上所述，語音由空氣流經(jīng)過聲門激勵(lì)，經(jīng)由聲道調(diào)制，經(jīng)過嘴輻射出去，完整的語音信號產(chǎn)生的數(shù)學(xué)模型可以用三個(gè)子模型：激勵(lì)模型、聲道模型和輻射模型的串連來表示。2．語音的特性(1)短時(shí)平穩(wěn)性根據(jù)對語音信號的研究，語音是一種時(shí)變的、非平穩(wěn)的隨機(jī)過程，但另一方面，由于人類發(fā)聲系統(tǒng)的生理結(jié)構(gòu)的變化速度是有一定限度的，在一段短時(shí)間內(nèi)(10～30ms)人的聲帶和聲道形狀基本穩(wěn)定，并且大部分情況下，激勵(lì)源參數(shù)也是如此，因此可認(rèn)為短時(shí)間內(nèi)語音特征是不變的，語音的短時(shí)性特點(diǎn)是對語音信號進(jìn)行分析和處理的基礎(chǔ)。(2)濁音和清音語音分為濁音和清音兩大類，二者從語音產(chǎn)生的機(jī)理上有明顯的差異，前者由周期性脈沖產(chǎn)生，后者由隨機(jī)噪聲產(chǎn)生，因而在特征上也有明顯的區(qū)別。濁音在時(shí)域上呈現(xiàn)出明顯的周期性，在頻域上具有共振峰結(jié)構(gòu)而且能量大部分集中在較低頻段內(nèi)。清音則完全不同，它沒有明顯的時(shí)域和頻域特征，類似于白噪聲。濁音在頻譜上有共振峰結(jié)構(gòu)，能量重要集中在低頻區(qū) (<1000Hz)，清音沒有共振峰結(jié)構(gòu)，能量小且主要集中在高頻段 (>1000Hz)。語音信號的基本特征（1）語音信號的時(shí)域特征由于說話人在不同時(shí)刻的說話內(nèi)容千變?nèi)f化，而且沒有確定的規(guī)律性，因此語音信號是時(shí)變的。但由于人類的發(fā)聲器官的變化速率有限，聲道在短時(shí)間內(nèi)(5．500ms)處于平穩(wěn)狀態(tài)，因此語音信號具有短時(shí)平穩(wěn)性。而這種短時(shí)平穩(wěn)性，也是語音處理中許多理論和算法的必要前提。由于人們在說話時(shí)，各個(gè)音節(jié)或單詞之間總會(huì)存在著時(shí)間上的間隔，因此語音信號在時(shí)域上存在著有音段和無音段。通過有音段和無音段的檢測，可用去除帶噪語音中平穩(wěn)的噪聲。此外，無音段所占比例越大，語音的稀疏性越好，利用這一特點(diǎn)，產(chǎn)生了許多基于語音稀疏性的增強(qiáng)算法。（2）語音信號的頻域特征語音信號的頻譜能量主要集中在300-3400Hz范圍內(nèi)。語音本身由濁音和清音組成，濁音含有語音信號的大部分能量，其頻譜分布主要集中在低頻段中的基音頻率及其各次諧波上，呈現(xiàn)出明顯的周期性；清音則表現(xiàn)出隨機(jī)性，在頻譜上類似于白噪聲。（3）語音信號的統(tǒng)計(jì)特征語音信號可以看作是一個(gè)遍歷性隨機(jī)過程的樣本函數(shù)，其統(tǒng)計(jì)特性可用其幅度的概率密度函數(shù)來描述。對語音信號的統(tǒng)計(jì)特性的研究表明，其幅度分布的概率密度函數(shù)可以用兩種近似的表達(dá)式來較好地描述，其中一種是伽馬(Gamma)分布p(x)kekx(1-1)2xx式中k是一個(gè)常數(shù)，與標(biāo)準(zhǔn)差仃，有下列關(guān)系word文檔可自由復(fù)制編輯k3(1-2)2x另一種是拉普拉斯分布(Laplacian) 分布()0.5ex(1-3)px式中，口是一個(gè)由標(biāo)準(zhǔn)差仃。決定的常數(shù)，即2(1-4)x相對說來，伽馬分布對語音信號的幅度分布描述更為精確一點(diǎn)，而拉普拉斯分布的函數(shù)形式則更加簡潔。word文檔可自由復(fù)制編輯2盲信號處理2.1 盲信號處理的概述盲信號處理的基本概念盲信號處理是現(xiàn)代數(shù)學(xué)信號處理、算智能學(xué)近年來迅速發(fā)展的重要方向。電子信息、通信、生物醫(yī)學(xué)、圖像增強(qiáng)、雷達(dá)、地球物理信號處理等眾多領(lǐng)域有廣泛的應(yīng)用前景。盲信號處理就是利用系統(tǒng)(如無線信道、通信系統(tǒng)等)的輸出觀測數(shù)據(jù),通過某種信號處理的手段,獲得我們感興趣的有關(guān)信息(如原來獨(dú)立發(fā)射的信號等)。盲信號的研究是當(dāng)前學(xué)術(shù)界的一個(gè)研究熱點(diǎn)，而盲信號分離則是盲信號研究中的一個(gè)重要的課題。BSS是指從觀測到的混合信號中分離出未知的源信號。盲信號中的“盲”意味著兩個(gè)方面：第一，對源信號一無所知或只有少許的先驗(yàn)知識。第二，混合本身是未知的。這看似是一個(gè)不可能的任務(wù)，然而理論和實(shí)際都證實(shí)了只需要相當(dāng)簡單的假設(shè)，就可以得到該問題的解。這一特點(diǎn)使得BSS成為一種功能相當(dāng)強(qiáng)大的信息處理方法。S(t) X(t) Y(t)混合矩陣分離矩陣噪聲向量圖2.1 盲處理原理框圖盲信號處理的方法和分類在盲信號處理中，就源信號進(jìn)過傳輸通道的混合方式而言，其處理方法可分為線性瞬時(shí)混合信號盲處理、線性卷積混合信號盲處理和非線性混合信號盲處理三類。根據(jù)通道傳輸特性中是否含有噪聲、噪聲特性（白噪聲、有色噪聲等）、噪聲混合形式，可分為有噪聲、無噪聲盲處理，含加性噪聲和乘性噪聲混合信號盲處理等。按源信號和觀測信號數(shù)目的不同可以將混合方式分為欠定、適定和超定情況;按源信號特性的不同分為:平穩(wěn)、非平穩(wěn)、超高斯、亞高斯、超高斯和亞高斯混合分離等。盲處理的目的可分為盲辨識和盲源分離兩大類。盲辨識的目的是求得傳輸通道混合矩陣（新型混合矩陣、卷積混合矩陣、非線性混合矩陣等）。盲源分離的目的是求得源信號的最佳估計(jì)。當(dāng)盲源分離的各分量相互獨(dú)立時(shí)，就稱為獨(dú)立分量分析，即獨(dú)立分量分析是盲源分離的一種特殊情況。盲信號處理技術(shù)的研究應(yīng)用近年來，盲信號處理逐漸成為當(dāng)今信息處理領(lǐng)域中熱門的課題之一，并且已經(jīng)在尤其在生物醫(yī)學(xué)工程、醫(yī)學(xué)圖像、語音增強(qiáng)、遙感、通信系統(tǒng)、地震探測、地球物理學(xué)、計(jì)量經(jīng)濟(jì)學(xué)和數(shù)據(jù)挖掘等領(lǐng)域顯示出誘人的前景，特別是盲源分離技術(shù)、ICA的不斷發(fā)展和應(yīng)用最為引人注目。下面介紹盲處理應(yīng)用中的兩個(gè)主要方面：1.語音識別領(lǐng)域語音信號分離、語音識別是盲處理應(yīng)用的一個(gè)重要領(lǐng)域。最典型的應(yīng)用就是聲控計(jì)算機(jī)，計(jì)算機(jī)所接受到的語音指令肯定是肯定是帶有各種環(huán)境噪聲的，還可能存在其他的語音信號（如有其他人說話），而且這些信號源與接收器的相對位置也未知，計(jì)算機(jī)需要在這種情況下識別出正確的語音命令。在移動(dòng)通信中，往往存在通信質(zhì)量問題，極大的影響了通話效果，而盲源分離或盲均衡技術(shù)能夠消除噪聲、抑制干擾及增強(qiáng)語音，提高通話質(zhì)量。2.生物醫(yī)學(xué)信號處理在生物醫(yī)學(xué)領(lǐng)域，盲信號處理可應(yīng)用于心電圖（ ECG）、腦電圖（EEG）信號分離、聽覺信號分析、功能磁共振圖像（ FMRI）分析等。例如人們常常需要從肌電圖中確定神經(jīng)元細(xì)胞信號的觸發(fā)模式，而EMG信號通常由多個(gè)特殊的傳感器在人體表處測得，從信號源到傳感器之間的信號傳輸介質(zhì)參數(shù)是未知的，而人們之間各不相同。目前已經(jīng)有一些學(xué)者將盲源分離技術(shù)成功地夠應(yīng)用于腦電圖等信號的數(shù)據(jù)處理。2.2 盲源分離法盲源分離技術(shù)盲源信號分離(BlindSourceSeparation,BSS) 是20世紀(jì)90年代迅速發(fā)展起來的一個(gè)研究領(lǐng)域。它具有可靠的理論基礎(chǔ)和許多方面的應(yīng)用潛力。其在生物醫(yī)學(xué)工程、醫(yī)學(xué)圖像、語音增強(qiáng) 、遙感、通信系統(tǒng) 、地震探測等領(lǐng)域有著廣泛而誘人的前景 ,盲源分離成為信號處理和神經(jīng)網(wǎng)絡(luò)領(lǐng)域的研究熱點(diǎn) 。盲源分離是針對從檢測的混合信號中估計(jì)或恢復(fù)源信號的問題提出的，是指源信號、傳輸通道特性未知的情況下，僅由觀測信號和源信號的一些先驗(yàn)知識（如概率密度）估計(jì)出源信號各個(gè)分量的過程。例如最著名的雞尾酒會(huì)問題，僅根據(jù)多個(gè)麥克風(fēng)檢測信號分離或恢復(fù)出某種語音源信號。盲分離算法實(shí)現(xiàn)在實(shí)際的ICA盲分離算法應(yīng)用中,一般有時(shí)是必需的對觀測數(shù)據(jù)做一些預(yù)處理技術(shù)，如用主成分分析 (PCA)降維和白化,用濾波器進(jìn)行濾波降噪處理等。另外,由于恢復(fù)準(zhǔn)則的局限以及先驗(yàn)知識的缺乏 ,盲信號分離方法只能得到源信號的波形,而無法確定信號的幅值以及信號之間的順序。這兩點(diǎn)都需要人為的制定規(guī)則(如規(guī)定信號的方差為 1來確定幅值)來確定。圖2.2 盲信號分離基本原理框圖2.3 獨(dú)立成分分析獨(dú)立分量分析(IndependentComponentAnaly2sis,ICA) 是由Herault 和Jutten 在1983年提出,該方法不依賴與源信號類型相關(guān)的詳細(xì)知識或信號傳輸系統(tǒng)特性的精確辨識 ,是一種有效的冗余取消技術(shù) ,被廣泛應(yīng)用于盲源分離(blindsourceseparationBSS) 、特征提取和盲解卷、生理學(xué)數(shù)據(jù)分析語音信號處理、圖像處理及人臉識別等領(lǐng)域。該方法根據(jù)代價(jià)函數(shù)的不同 ,可以得到不同的 ICA算法,如信息最大化(infomax)算法、FastICA 算法、最大熵(ME)和最小互信息(MMI)算法、極大似然(ML)算法等。在統(tǒng)計(jì)學(xué)中，獨(dú)立成分分析或獨(dú)立分量分析（ Independentcomponentsanalysis，縮寫：ICA）是一種利用統(tǒng)計(jì)原理進(jìn)行計(jì)算的方法。它是一個(gè)線性變換。這個(gè)變換把數(shù)據(jù)或信號分離成統(tǒng)計(jì)獨(dú)立的非高斯的信號源的線性組合。獨(dú)立成分分析是盲信號分離（ Blindsourceseparation ）的一種特例。獨(dú)立成分分析的定義ICA是一種用來從多變量（多維）統(tǒng)計(jì)數(shù)據(jù)里找到隱含的因素或成分的方法，被認(rèn)為是主成分分析（Principal ComponentAnalysis, PCA）和因子分析（FactorAnalysis）的一種擴(kuò)展。對于盲源分離問題， ICA是指在只知道混合信號，而不知道源信號、噪聲以及混合機(jī)制的情況下，分離或近似地分離出源信號的一種分析過程。獨(dú)立成分分析（IndependentComponentAnalysis,ICA ）是近年來出現(xiàn)的一種強(qiáng)有力的數(shù)據(jù)分析工具（ HyvarinenA,KarhunenJ,OjaE,2001;RobertsSJ,EversonR,2001 ）。1994年由Comon給出了ICA的一個(gè)較為嚴(yán)格的數(shù)學(xué)定義，其思想最早是由 Heranlt 和Jutten于1986年提出來的。ICA從出現(xiàn)到現(xiàn)在雖然時(shí)間不長，然而無論從理論上還是應(yīng)用上，它正受到越來越多的關(guān)注，成為國內(nèi)外研究的一個(gè)熱點(diǎn)。特別是從應(yīng)用角度看，它的應(yīng)用領(lǐng)域與應(yīng)用前景都是非常廣闊的，目前主要應(yīng)用于盲源分離、圖像處理、語言識別、通信、生物醫(yī)學(xué)信號處理、腦功能成像研究、故障診斷、特征提取、金融時(shí)間序列分析和數(shù)據(jù)挖掘等。盲源分離技術(shù)是近二十年發(fā)展起來的一門新型科學(xué)，在各國科學(xué)家和研究人員的努力下獲得了充分的發(fā)展，但是ICA的研究方興未艾，它畢竟是一個(gè)涉及面廣并且仍處于發(fā)展前沿的課題，在理論上還遠(yuǎn)沒有成熟，許多問題有待進(jìn)一步研究和解決。帶噪混合信號的盲分離問題。盲信號處理中的未知條件太多，混合信號含有噪聲的情況下的盲源分離問題解決起來是相當(dāng)困難的。盡管目前已有部分算法對存在噪聲的情況表現(xiàn)出了良好的性能，但由于噪聲種類繁多，因此處理起來仍很棘手?，F(xiàn)有的大多數(shù)盲源分離或盲解卷積算法都假設(shè)不含噪聲或者把噪聲看作是一個(gè)獨(dú)立的信源信號來處理。非平穩(wěn)混合信號的盲源分離算法。許多情況下源信號可能是非平穩(wěn)的，如何利用信號的非平穩(wěn)特性進(jìn)行盲源分離是擺在廣大研究人員面前的一個(gè)現(xiàn)實(shí)問題。卷積混合信號的盲源分離算法。在實(shí)際中，系統(tǒng)接收到的混合輸入信號是源信號經(jīng)過不同的傳播途徑到達(dá)接收器。在這個(gè)過程中，不可避免的存在信號的時(shí)延和反射。針對這種情況的盲源分離算法還很不成熟。(4)ICA的推廣應(yīng)用。在算法應(yīng)用方面，ICA可以取得進(jìn)一步的發(fā)展，如可以在語音識別、圖像處理、特征提取、醫(yī)學(xué)信號處理方面作進(jìn)一步的研究。目前的關(guān)鍵的問題是如何將理論算法轉(zhuǎn)化為實(shí)際應(yīng)用，以及如何建立更加符合實(shí)際情況的模型等。(5)算法的收斂性。算法全局收斂性的研究，可以考慮將遺傳算法、混沌算法等具有全局收斂性的優(yōu)化算法和 ICA結(jié)合起來，提高算法的全局收斂性。2.3.2ICA 的基本原理（1）無噪聲的ICA模型ICA作為生成模型的估計(jì)給定隨即變量的一組觀測x1(t),x2(t),x3(t),xn(t)，其中t是時(shí)間或者樣本標(biāo)號，假設(shè)它們有獨(dú)立成分線性混合而產(chǎn)生：x1(t)s1(t)x2(t)s2(t)x3(t)s3(t)x4(t)s4(t)=A(2-1)式中，A是某個(gè)未知矩陣。用向量-矩陣符號方式表示通常比上面的求和表達(dá)式更為方便。用隨機(jī)向量x來表示混合向量，其元素分別為x1,...,xn，同樣地，用s來表示元素s1,...sn，用矩陣A表示那些混合系數(shù)aij。所有的向量都理解為列向量；這樣xT或者稱x的轉(zhuǎn)置就是一個(gè)行向量。利用向量和矩陣符號表示，混合模型可以寫為：xAs(2-2)有時(shí)我們需要使用矩陣A中的列向量，如果將其表示為,則模型也可以寫為：nxaisii1(2-3)（2）有噪聲的 ICA模型將基本的 ICA模型擴(kuò)展到有噪聲的情形，并且假設(shè)噪聲是以加性噪聲形式存在的。這是一個(gè)相當(dāng)現(xiàn)實(shí)的假設(shè)，因?yàn)榧有栽肼暿且蜃臃治龊托盘柼幚碇型ǔＱ芯康臉?biāo)準(zhǔn)形式，具有簡單的噪聲模型表達(dá)方式。因此，噪聲 ICA模型可表示為：xAsn(2-4)T式中，n n1,...nn是噪聲向量。信號源噪聲，即直接添加到獨(dú)立成分（即信號源）上的噪聲。信號源噪聲可用與式（2.1）稍有差別的下式來表示：x A(s n)(2-5)實(shí)際上，如果可以直接考慮帶噪聲的獨(dú)立成分，那么可將此模型寫為：~xAs(2-6)可以看出，這就是基本的ICA模型，只是獨(dú)立成分本身變了。word文檔可自由復(fù)制編輯3語音信號盲分離的實(shí)現(xiàn)3.1 盲信號分離的三種算法二階盲辨識（SOBI）SOBI先對觀測信號x(t)作白化處理，得到 z(t)。定義z(t)和s(t)的時(shí)延相關(guān)矩陣為Rz()Ez(t)zTt(3-1)Rs()Es(t)sTt(3-2)由z(t)Vs(t)易知：Rz()VRs()VT(3-3)又因?yàn)閂VTVTVIn，所以(3-4)RS()VTRz()V(3-5)由s(t)各分量相互獨(dú)立可知，RS()是對角矩陣。由此可見，矩陣V可以將Rz()對角化。在SOBI算法中，取一組不同的值1,2,...,q，要求V能同時(shí)使得各個(gè)Rz(i)盡可能的對角化，其中 1 i q。3.1.2FastICA 算法FastICA算法是芬蘭赫爾辛基工業(yè)大學(xué)計(jì)算機(jī)及信息科學(xué)實(shí)驗(yàn)室 Hyvarinen等人1997年首先提出并發(fā)展起來的，在1999年進(jìn)一步提出了改進(jìn)——基于負(fù)熵的ICA固定點(diǎn)算法。該算法基于非高斯性最大化原理，使用固定點(diǎn)(Fixed-point)迭代理論尋我W1x非高斯性最大值，采用牛頓迭代算法對觀測變量 x的大量采樣點(diǎn)進(jìn)行批處理，每次從觀測信號中分離出一個(gè)獨(dú)立分量，是獨(dú)立分量分析的一種快速算法。FastICA算法，由于采用了定點(diǎn)迭代的思想，所以又稱固定點(diǎn)(Fixed-Point)算法或定點(diǎn)算法，是一種快速尋優(yōu)神經(jīng)網(wǎng)絡(luò)算法。與普通的神經(jīng)網(wǎng)絡(luò)算法不同的是這種算法采用了牛頓迭代的思想對采樣點(diǎn)采用批處理的方式，在每一步迭代中有大量的樣本數(shù)據(jù)參與運(yùn)算?；谀繕?biāo)函數(shù)的選擇不同，從而產(chǎn)生了FastICA算法的基于負(fù)熵最大、峭度、互信息最小、最大似然估計(jì)等的多種形式。FastICA算法的基本步驟：1.對觀測數(shù)據(jù)X進(jìn)行中心化，使它的均值為0；2.對數(shù)據(jù)進(jìn)行白化，XZ。3.選擇需要估計(jì)的分量的個(gè)數(shù)m，設(shè)迭代次數(shù)p14.選擇一個(gè)初始權(quán)矢量（隨機(jī)的）Wp。5.令WpEZgWpTZEg'WpTZW,非線性函數(shù)g的選取見前文。p16.WpWpWpTWjWj。j17.令WpWp/Wp。8. 假如Wp不收斂的話，返回第 5步。9．令p p 1，如果p m，返回第4步。然而FastICA算法也尤其自身的缺點(diǎn)，首先是它對初值的選擇較自然梯度算法敏感，當(dāng)初值的選擇不是很合適的時(shí)候，算法的分離性能急劇的下降，其次算法的迭代步長有待進(jìn)行自適應(yīng)的優(yōu)化。3.1.3CICA算法約束獨(dú)立分量分析(Constrained independent componentanalysis，CICA)算法倒是一種改良的 FastlCA算法。在ClCA提取過程中，通過引入簡單的約束參考信號來幫助分離某特定目標(biāo)分量，從而有利于去除干擾信號。 ClCA算法的基本原理與FastlCA相同，每次提取一個(gè)獨(dú)立分量。文中所選用的 CICA算法，實(shí)際上是一種加入了約束參數(shù)的 FastICA算法，從而使ICA算法不用再進(jìn)行特征提取與目標(biāo)判定，就可以容易的分離出所需要的目標(biāo)分量。雖然 CICA算法對信號分離具有良好的效果，但在實(shí)際應(yīng)用過程中， CICA還需要進(jìn)一步的探討研究。如閾值與學(xué)習(xí)率的選擇不當(dāng)，就會(huì)很容易引起輸出結(jié)果發(fā)散。同時(shí)收斂速度與誤差函數(shù) (y,r)的選擇也有關(guān)系，誤差函數(shù)的形式要根據(jù)輸入數(shù)據(jù)和參考信號來進(jìn)行選擇。3.2 不同算法的分離性能比較SOBI算法利用了源信號的頻譜差異性來分離源信號，當(dāng)源信號中存在頻譜結(jié)構(gòu)相似的分量時(shí)，分離性能便會(huì)較差，這是 SOBI算法的缺點(diǎn)。FastICA算法的特點(diǎn):1．在1CA模型中，F(xiàn)astICA算的收斂速度是二次以上的，而梯度搜索法只是一次收斂。2．與梯度搜索法相比，F(xiàn)astlCA的步長參數(shù)容易確定。3該算法適用于任何非高斯信號。4．可以通過選擇不同的非線性函數(shù) G(Y)使算法的獲得不同的性能?；?F獨(dú)立分量分析的混合語音信號自分離系統(tǒng)的研究5．可以逐個(gè)的估計(jì)獨(dú)立分量。6該算法是并行的、分布的，且計(jì)算簡單，需要的內(nèi)存較少。FastlCA算法和其他的ICA算法相比，有著許多我們期望的特性：收斂速度快；和梯度算法不同，無需選擇步長參數(shù)，易于使用；該算法能適用于任何非高斯信號；可以通過使用不同的非線性函數(shù) G-(y)使算法獲得不同的性能；獨(dú)立分量可被逐個(gè)估計(jì)出來，這在僅需要估計(jì)幾個(gè)獨(dú)立分量的情況下，能減小計(jì)算量：FastICA算法有許多神經(jīng)算法的優(yōu)點(diǎn)：并行、分布、計(jì)算簡單，內(nèi)存要求小。FastlCA的算法仿真及結(jié)果分析下面仿真中所使用的語音源信號是在干擾噪聲很小的環(huán)境下用麥克風(fēng)錄制的 3段不同的語音文件，保存成*.wav文件sound1.wav,sound3.wav,sound4.wav, 三個(gè)聲音采樣頻率均為 44100Hz，持續(xù)時(shí)間為3s。圖3.1是這3個(gè)原始語音信號的時(shí)域波形 ,圖3.2為原始語音信號的頻域波形。原始的語音信號如下:圖3.1原始信號時(shí)域波形圖圖3.2 原始信號頻域波形圖word文檔可自由復(fù)制編輯混合后的語音信號:圖3.3 混合信號的時(shí)域波形圖圖3.4混合信號的頻域波形圖word文檔可自由復(fù)制編輯FastlCA算法將混合信號 MixedS1，MixedS2，MixedS 3分離，得到分離后信號ICAedS1，ICAedS2，ICAedS3，圖3.5為分離信號的時(shí)域波形圖，圖 3.6為分離信號的頻域波形圖:圖3.5分離信號的時(shí)域波形圖圖3.6 分離信號的頻域波形圖從試驗(yàn)結(jié)果，我們可以看出分離語音信號從波形上看很好地保持了原始信號的波形，而且實(shí)際分離的語音信號在聽覺上也很好的實(shí)現(xiàn)了分離，而且?guī)缀鯖]有什么失真效果。4結(jié)論盲源分離算法是盲源分離問題的核心，語音信號是一種非平穩(wěn)信號，本文研究了二階盲辨識（SOBI）盲源分離算法，快速定點(diǎn) (FastICA)算法以及約束獨(dú)立分量分析（CICA）算法，選取了其中一種算法，求混合信號和分離信號，比較原始信號和分離信號。ICA算法的研究可分為基于信息論準(zhǔn)則的迭代估計(jì)方法和基于統(tǒng)計(jì)學(xué)的代數(shù)方法兩大類，從原理上來說，它們都是利用了源信號的獨(dú)立性和非高斯性?；谛畔⒄摰姆椒ㄑ芯恐?，各國學(xué)者從最大熵、最小互信息、最大似然和負(fù)熵最大化等角度提出了一系列估計(jì)算法。如 FastICA算法,Infomax 算法，最大似然估計(jì)算法等?；诮y(tǒng)計(jì)學(xué)的方法主要有二階累積量、四階累積量等高階累積量方法。本實(shí)驗(yàn)主要運(yùn)用了 FastICA算法來進(jìn)行信號的分離。為了完成本次課程設(shè)計(jì)，我查找了一些資料，更多地了解和熟悉了 matlab的使用，了解了語音信號的盲分離的原理及應(yīng)用。雖然遇到了困難，尤其是程序有問題，最后一步步慢慢來，終于做出來了。這次課設(shè)也使我認(rèn)識到了自己的不足，我還有很多的東西需要學(xué)習(xí)。總的來說，還是很有收獲的。5參考文獻(xiàn)石慶研，黃建宇，吳仁彪.盲源分離及盲信號提取的研究進(jìn)展[J].中國民航大學(xué)學(xué)報(bào)，2007,25(03):1-7.趙艷.盲源分離與盲信號提取問題研究[D].西安:西安理工大學(xué);2004.方元．Hands．free系統(tǒng)噪聲抵消的研究．南京大學(xué)博士學(xué)位論文．2003．4張徽強(qiáng)．帶噪語音信號的端點(diǎn)檢測和聲韻分離．國防科學(xué)技術(shù)大學(xué)碩士學(xué)位論文，2005．4楊福生，洪波．獨(dú)立分量分析的原理與應(yīng)用嗍．北京：清華大學(xué)出版社，2003．王舒猻，方勇，梁越．基于盲源分離的語音識別前端語音凈化處理研究[J]．電子技術(shù)應(yīng)用，2005，(10)，5—8．焦衛(wèi)東,楊世錫,吳昭同.基于獨(dú)立分量分析的噪聲消除技術(shù)研究[J].浙江大學(xué)學(xué)報(bào)工學(xué)版,2004,387:8722876.附錄源程序：%（1）獲取錄音文件pausefs=44100; %聲音的采樣頻率為 44.1Khzduration=3; %錄音時(shí)間為 3sfprintf('按任意鍵開始錄音 1：\n');pausefprintf('錄音中···\n');sd1=wavrecord(duration*fs,fs); %總的采樣數(shù)為 132300，保存聲音文件名為 sd1fprintf('放音中···\n');wavplay(sd1,fs);fprintf('錄音1播放完畢。\n');wavwrite(sd1,fs,'sound1.wav'); %將錄音文件保存為 WAV格式的聲音文件fprintf('按任意鍵開始錄音 2：\n');pausefprintf('錄音中···\n');sd2=wavrecord(duration*fs,fs);fprintf('放音中···\n');wavplay(sd2,fs);fprintf('錄音2播放完畢。\n');wavwrite(sd2,fs,'sound2.wav');fprintf('按任意鍵開始錄音 3：\n');pausefprintf('錄音中···\n');sd3=wavrecord(duration*fs,fs);fprintf('放音中···\n');wavplay(sd3,fs);fprintf('錄音3播放完畢。\n');wavwrite(sd3,fs,'sound3.wav');fprintf('按任意鍵開始錄音 4：\n');pausefprintf('錄音中···\n');sd4=wavrecord(duration*fs,fs);fprintf('放音中···\n');wavplay(sd4,fs);fprintf('錄音4播放完畢。\n');wavwrite(sd4,fs,'sound4.wav');%語音信號的盲分離程序clc;clearall;closeall;[sd1,fs1,bit1]=wavread('sound1.wav');%打開保存的錄音文件[sd2,fs2,bit2]=wavread('sound3.wav');[sd3,fs3,bit3]=wavread('sound4.wav');sd1=sd1';sd2=sd2';sd3=sd3';wavplay(sd1,fs1);wavplay(sd2,fs2);wavplay(sd3,fs3);N1=length(sd1);N2=length(sd2);N3=length(sd3);T1=N1/fs1;T2=N2/fs2;T3=N3/fs3;t1=linspace(0,T1-1/fs1,N1);t2=linspace(0,T2-1/fs2,N2);t3=linspace(0,T3-1/fs3,N3);figure(1)subplot(3,1,1);plot(t1,sd1);title('原始信號的時(shí)域分析');subplot(3,1,2);plot(t2,sd2);subplot(3,1,3);plot(t3,sd3);f1=linspace(0,fs1-1/T1,N1);f2=linspace(0,fs2-1/T2,N2);f3=linspace(0,fs3-1/T3,N3);figure(2)%原始信號的頻譜分析subplot(3,1,1);plot(f1,abs(fft(sd1)),'.');%fft對聲音信號進(jìn)行快速傅里葉變換xlabel('單位：Hz');ylabel('幅度');title('原始信號的頻譜分析');subplot(3,1,2);plot(f2,abs(fft(sd2)),'.');xlabel('單位：Hz');ylabel('幅度');subplot(3,1,3);plot(f3,abs(fft(sd3)),'.');xlabel('單位：Hz');ylabel('幅度');S=[sd1;sd2;sd3];%將其組成矩陣Sweight=rand(size(S,1));MixedS=Sweight*S;%將混合矩陣重新排列并輸出figure(3)subplot(3,1,1);plot(MixedS(1,:));title('混合信號的時(shí)域分析');subplot(3,1,2);plot(MixedS(2,:));subplot(3,1,3);plot(MixedS(3,:));figure(4)%混合信號的頻譜分析subplot(3,1,1);plot(f1,abs(fft(MixedS(1,:))),'.');%fft對聲音信號進(jìn)行快速傅里葉變換xlabel('單位：Hz');ylabel('幅度');title('混合信號的頻譜分析');word文檔可自由復(fù)制編輯subplot(3,1,2);plot(f2,abs(fft(MixedS(2,:))), '.' );xlabel( '單位：Hz');ylabel( '幅度');subplot(3,1,3);plot(f3,abs(fft(MixedS(3,:))), '.' );xlabel( '單位：Hz');ylabel( '幅度');MixedS_bak=MixedS; %%%%%%%%%%標(biāo)準(zhǔn)化 %%%%%%%%%%%%%%%%MixedS_mean=zeros(3,1);for i=1:3MixedS_mean(i)=mean(MixedS(i,:));end %計(jì)算MixedS的均值for i=1:3for j=1:size(MixedS,2)MixedS(i,j)=MixedS(i,j)-MixedS_mean(i);endend%%%%%%%%%%%%%%%%%%%%%%%%%%% 白化%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%MixedS_cov=cov(MixedS'); %cov為求協(xié)方差的函數(shù)[E,D]=eig(MixedS_cov); %對信號矩陣的協(xié)方差函數(shù)進(jìn)行特征值分解Q=inv(sqrt(D))*(E)'; %Q為白化矩陣MixedS_white=Q*MixedS; %MixedS_white 為白化后的信號矩陣IsI=cov(MixedS_white'); %IsI 應(yīng)為單位陣%%%%%%%%%%%%%%%%%%%%%%%% FASTICA 算法%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%X=MixedS_white; %以下算法將對X進(jìn)行操作[VariableNum,SampleNum]=size(X);numofIC=VariableNum; %在此應(yīng)用中，獨(dú)立元個(gè)數(shù)等于變量個(gè)數(shù)B=zeros(numofIC,VariableNum); %初始化列向量w的寄存矩陣,B=[b1b2...bd]for r=1:numofICi=1;maxIterationsNum=100; %設(shè)置最大迭代次數(shù)（即對于每個(gè)獨(dú)立分量而言迭代均不超過此次數(shù)）IterationsNum=0;b=rand(numofIC,1)-.5; %隨機(jī)設(shè)置b初值b=b/norm(b); %對b標(biāo)準(zhǔn)化norm(b): 向量元素平方和開根號while i<=maxIterationsNum+1if i==maxIterationsNum %循環(huán)結(jié)束處理fprintf( '\n 第 %d分量在 %d次迭代內(nèi) 并不收斂。 ',r,maxIterationsNum);break ;endbOld=b;a2=1;u=1;t=X'*b;g=t.*exp(-a2*t.^2/2);dg=(1-a2*t.^2).*exp(-a2*t.^2/2);b=((1-u)*t'*g*b+u*X*g)/SampleNum-mean(dg)*b;%核心公式，參見理論部分公式 2.52b=b-B*B'*b; %對b正交化b=b/norm(b);if abs(abs(b'*bOld)-1)<1e-9 %如果收斂，則B(:,r)=b; %保存所得向量 bbreak ;endi=i+1;end% B(:,r)=b;% 保存所得向量bend%%%%%%%%%%%%%%%%%%%%%%%%ICA 計(jì) 算的數(shù) 據(jù) 復(fù) 原并構(gòu)圖%%%%%%%%%%%%%%%%%%%%%ICAedS=B'*Q*MixedS_bak;%計(jì)算ICA后的矩陣%將混合矩陣重

人人文庫> 全部分類> 辦公材料 > 辦公文檔

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

語音信號的盲分離范文參考

文檔簡介

溫馨提示

最新文檔

評論

語音信號的盲分離范文參考

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔