語音信號的盲分離要點_第1頁
語音信號的盲分離要點_第2頁
語音信號的盲分離要點_第3頁
語音信號的盲分離要點_第4頁
語音信號的盲分離要點_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

目錄TOC\o"1-2"\h\z\u摘要 第一章語音信號概述1.1忙語音信號分離技術(shù)的背景及意義近些年來,混合語音信號分離成為信號處理領(lǐng)域的一個研究熱點。在信號處理中我們經(jīng)常遇到這樣的問題,如何從一組未知的隨機信號經(jīng)過一組混合系統(tǒng)得到的觀測信號中恢復出這些原始信號,如果重構(gòu)過程中沒有混合系統(tǒng)和原始信號的先驗知識,我們就城該過程為盲分離。其理論也不斷運用到圖像、通訊、醫(yī)學等領(lǐng)域1.1.1語音產(chǎn)生機理發(fā)聲器官分為三部分:肺、喉(聲門)和聲道。肺的作用相當于一個動力源,將氣流輸送到喉部。喉將來自肺部的氣流調(diào)制為周期脈沖或類似隨機噪聲的激勵聲源,并送入聲道。喉在發(fā)聲中的作用是控制聲帶的開啟和閉合,使得氣流形成一系列脈沖,聲帶振動的頻率決定了聲音頻率的高低。由聲帶振動產(chǎn)生的音統(tǒng)稱為濁音,而不由聲帶振動產(chǎn)生的音統(tǒng)稱為清音。聲道包括口腔、鼻腔和咽腔,它們對聲源的頻譜進行整形而產(chǎn)生不同音色的聲音。聲道的諧振頻率稱為共振峰頻率,它與聲道的形狀和大小有關(guān),每種形狀都有一套共振峰頻率作為其特征,改變聲道的形狀就產(chǎn)生不同的語音,因而,當聲道形狀改變時,語音信號的頻譜特性就隨之改變。聲源經(jīng)過聲道潤色頻譜后,最后從嘴唇或鼻孔或同時從嘴唇和鼻孔輻射出來,形成可傳播的聲波,被人感知為語音。綜上所述,語音由空氣流經(jīng)過聲門激勵,經(jīng)由聲道調(diào)制,經(jīng)過嘴輻射出去,完整的語音信號產(chǎn)生的數(shù)學模型可以用三個子模型:激勵模型、聲道模型和輻射模型的串連來表示。圖1.1語音信號產(chǎn)生模型1.1.2語音的特性(1)短時平穩(wěn)性根據(jù)對語音信號的研究,語音是一種時變的、非平穩(wěn)的隨機過程,但另一方面,由于人類發(fā)聲系統(tǒng)的生理結(jié)構(gòu)的變化速度是有一定限度的,在一段短時間內(nèi)(10~30ms)人的聲帶和聲道形狀基本穩(wěn)定,并且大部分情況下,激勵源參數(shù)也是如此,因此可認為短時間內(nèi)語音特征是不變的,語音的短時性特點是對語音信號進行分析和處理的基礎(chǔ)。(2)濁音和清音語音分為濁音和清音兩大類,二者從語音產(chǎn)生的機理上有明顯的差異,前者由周期性脈沖產(chǎn)生,后者由隨機噪聲產(chǎn)生,因而在特征上也有明顯的區(qū)別。濁音在時域上呈現(xiàn)出明顯的周期性,在頻域上具有共振峰結(jié)構(gòu)而且能量大部分集中在較低頻段內(nèi)。清音則完全不同,它沒有明顯的時域和頻域特征,類似于白噪聲。濁音在頻譜上有共振峰結(jié)構(gòu),能量重要集中在低頻區(qū)(<1000Hz),清音沒有共振峰結(jié)構(gòu),能量小且主要集中在高頻段(>1000Hz)。1.2語音信號的基本特征(1)語音信號的時域特征由于說話人在不同時刻的說話內(nèi)容千變?nèi)f化,而且沒有確定的規(guī)律性,因此語音信號是時變的。但由于人類的發(fā)聲器官的變化速率有限,聲道在短時間內(nèi)(5.500ms)處于平穩(wěn)狀態(tài),因此語音信號具有短時平穩(wěn)性。而這種短時平穩(wěn)性,也是語音處理中許多理論和算法的必要前提。由于人們在說話時,各個音節(jié)或單詞之間總會存在著時間上的間隔,因此語音信號在時域上存在著有音段和無音段。通過有音段和無音段的檢測,可用去除帶噪語音中平穩(wěn)的噪聲。此外,無音段所占比例越大,語音的稀疏性越好,利用這一特點,產(chǎn)生了許多基于語音稀疏性的增強算法。(2)語音信號的頻域特征語音信號的頻譜能量主要集中在300-3400Hz范圍內(nèi)。語音本身由濁音和清音組成,濁音含有語音信號的大部分能量,其頻譜分布主要集中在低頻段中的基音頻率及其各次諧波上,呈現(xiàn)出明顯的周期性;清音則表現(xiàn)出隨機性,在頻譜上類似于白噪聲。(3)語音信號的統(tǒng)計特征語音信號可以看作是一個遍歷性隨機過程的樣本函數(shù),其統(tǒng)計特性可用其幅度的概率密度函數(shù)來描述。對語音信號的統(tǒng)計特性的研究表明,其幅度分布的概率密度函數(shù)可以用兩種近似的表達式來較好地描述,其中一種是伽馬(Gamma)分布(1-1)式中k是一個常數(shù),與標準差仃,有下列關(guān)系(1-2)另一種是拉普拉斯分布(Laplacian)分布(1-3)式中,口是一個由標準差仃。決定的常數(shù),即(1-4)相對說來,伽馬分布對語音信號的幅度分布描述更為精確一點,而拉普拉斯分布的函數(shù)形式則更加簡潔。1.3語音信號處理的理論基礎(chǔ)進行頻譜分析時,在時域數(shù)據(jù)進行短時FFT處理之前都要進行加窗處理。在FFT處理之后,普通頻譜分析可以進行頻域上的濾波處理,從而使頻譜更加平滑。為了得到各種音頻信號的特技效果,也需要對各種變聲算法進行研究。(1)窗的選擇一般來講,一個好的窗函數(shù)的標準是:在時域因為是語音波形乘以窗函數(shù),所以要減小時間窗兩端的坡度,使窗口邊緣兩端不引起急劇變化而平滑過渡到零,這樣可以使截出的語音波形緩慢降為零,減小語音幀的階段效應;在頻域要有較寬的3dB帶寬以及較小的邊帶最大值。另外一方面,不同人的基音周期變化很大,主要集中在70Hz~1000Hz。所以窗一般選擇在10ms~20ms之間。此外,為了避免在加窗時加入多余的高頻信號,應該使用平滑窗,例如漢明窗。(2)變聲算法的討論語聲可以分為聲帶振動的濁音部分、聲帶不振動的清音部分以及靜音部分。在這里,我們主要是改變原始話音的基音頻率,以達到變聲的目的。第一種方法是不修改采樣數(shù)據(jù),僅改變Fs。這種方法操作非常簡便。第二種方法是直接乘以一個余弦函數(shù),把語音信號頻段搬移到較高頻段,以達到變聲的目的。第三種方法是插值以后重新抽樣?;具^程是這樣的:已知當前幀幀長FL(采樣)點,采樣頻率Fs,目標變換幀頻率Fs’,則目標變換幀幀長FL’=FL*Fs’/Fs。記Rate=Fs’/Fs,那么FL’=FL*Rate,其中Rate為基頻變化率。變換開始時,先求得FL和FL’的最小公倍數(shù)AL,再將原音頻幀插值為AL點,最后將插值后的語音段重新抽樣,得到長FL’點的變聲后的數(shù)據(jù)。三種方法操作起來都還比較簡單,但為了便于分析時域、頻域特效,本設(shè)計選擇了通信中常用的調(diào)制方法,即方案二。(3)Matlab基礎(chǔ)MATLAB是MatrixLaboratory的縮寫,由MathWorks公司于1984年正式推出,內(nèi)核采用C語言編寫。MATLAB是一個包括數(shù)值計算,高級圖形和可視化的集成科技計算環(huán)境,也是一種高級程序設(shè)計語言。靈活的MATLAB語言可使工程師和科學家簡練地表達他們的思想,其強有力的數(shù)值計算方法和圖形便于測試和探索新的思想,而集成的計算環(huán)境便于產(chǎn)生快速的實時結(jié)果。MATLAB得到了各個領(lǐng)域?qū)<覍W者的廣泛關(guān)注,其強大的擴展功能為用戶提供了強有力的支持;它集數(shù)學計算、圖形計算、語言設(shè)計和神經(jīng)網(wǎng)絡等30多個工具箱于一體,具有極高的編程效率,極大地方便了科學研究和工程應用。語音處理中往往把數(shù)字化的語音信號表示為一維或二維(對應于雙聲道立體聲數(shù)據(jù))矩陣,因此基于矩陣運算的MATLAB就很自然地應用到語音處理領(lǐng)域。MATLAB提供了語音文件的讀寫函數(shù)以及錄音和放音功能,如表1所示,使用時只需按照函數(shù)的語法規(guī)則正確輸入?yún)?shù)即可。通過這些函數(shù)可以得到語音的采樣頻率、量化精度和通道數(shù)等參數(shù)。同時,MATLAB提供了語音的和、差等線性運算,以及卷積、相關(guān)等非線性運算。對于語音處理中常用到的各種窗函數(shù),MATLAB也都提供了相應的函數(shù),比如hamming(n)即長度為n點的漢明窗。MATLAB一個重要的特點是易擴展性。近幾年來,有許多科學家、數(shù)學家、工程師等開發(fā)了一些新的、有價值的應用程序,這些應用程序都可以被納入MATLAB工具箱。比如voicebox工具箱,其中包含了很多與語音信號處理相關(guān)的函數(shù),可以在有關(guān)網(wǎng)站上下載,將其加入到MATLAB的搜索路徑,就可以作為MATLAB的庫函數(shù)來方便地調(diào)用了。 表1與語音輸入輸出相關(guān)的函數(shù)函數(shù)名功能描述wavreadauread讀語音文件wavwriteauwrite寫語音文件soundwavplay放音soundsc歸一化放音soundview可視化語音輸出wavrecord錄音第二章盲分離的基本概念2.1盲分離的數(shù)學模型盲源分離原理可用如下圖所示的數(shù)學模型來描述:x(t)n(t)混合系統(tǒng)A+y(t)s(t)x(t)n(t)混合系統(tǒng)A+y(t)s(t)分離系統(tǒng)w圖圖2.1盲源分離原理圖BBS的數(shù)學模型如圖2-1所示,其中是n維未知源信號向量,A為未知混合系統(tǒng),是m維的觀測信號矢量,它們均是源信號矢量的組合,并受到噪聲矢量的干擾.盲源分離的目的就是在源信號s和混合系統(tǒng)A均未知的情況下,僅由觀測數(shù)據(jù)向量x通過調(diào)整分離系統(tǒng)W,使得輸出y是源信號s的估計,即:(2-1)2.2盲源分離的基本方法盲源分離包含了線性瞬時混合和卷積混合兩種盲源分離問題。解決盲源分離問題的重要方法一獨立分量分析(IndependentComponentAnalysis,ICA)通常以線性瞬時混合為模型,而盲解卷積則是一種更為實際的盲源分離問題,其混合模型是一種卷積混合,線性卷積混合模型比較接近實際,這是因為:(1)實際中每一個源信號不會同時到達所有的傳感器,每一個傳感器對不同的源延時不同,延時值的大小取決于傳感器與源信號間的相對位置以及信號的傳播速度;(2)源信號到達傳感器是經(jīng)過多途傳播的,即多徑效應。假設(shè)信號是線性組合的,則從傳感器觀測到的信號是源信號各種延時值的線性組合。解決此類問題的盲信號處理方法就是盲解卷積。特別地,ICA方法也可被用于盲解卷積或盲均衡。此外,盲信號處理還包括許多重要內(nèi)容,例如非線性BSS或非線性ICA問題、盲多用戶檢測以及盲波束形成等等。盡管有許多不同的盲源分離算法可用,但它們的原理卻都可以歸納為以下四個方法如圖2.2:相互獨立、非高斯、ICA 相互獨立、非高斯、ICA 時序結(jié)構(gòu)、線性可預測時頻、譜和空間多樣性非穩(wěn)態(tài)、時變方差圖圖2.2盲源分離算法種類(1)最普遍的方法就是使用代價函數(shù)來衡量信號獨立性和非高斯性或者稀疏性。當假信號具有統(tǒng)計獨立性,且沒有時間結(jié)構(gòu)時,高階統(tǒng)計量方法是求解盲源分離問題的基段(間接或直接的),這種方法對多于一個高斯分布的源信號不適用。(2)如果源信號具有時序結(jié)構(gòu),則其有非零的時序相關(guān)數(shù),從而可以降低對統(tǒng)計獨立性的限制條件,用二階統(tǒng)計量方法(SOS)就足以估計混合矩陣和源信號。這種(SOS)方法不允許分離功率譜形狀相同或i.id(獨立同分布)的源信號。(3)第三種方法即采用非平穩(wěn)性(Ns)和二階統(tǒng)計量(SOS)。由于源信號主要隨時間有不同的變化,就可以考慮利用二階非平穩(wěn)性。Matsuoka等人首先考慮了非平穩(wěn)性,并證‘明在盲源分離中可以應用簡單的解相關(guān)技術(shù)。與其他方法相比,基于非平穩(wěn)性信息的方法能夠分離具有相同功率譜形狀的有色高斯源,然而,卻不能夠分離具有相同非平穩(wěn)特性的源信號。(4)第四種方法運用了信號的不同多樣性,典型的是時域多樣性、頻域多樣性(譜或時間相干性”)或者時頻域多樣性,更一般的,即聯(lián)合空間一時間一頻率(STF)多樣性。自從BSS和ICA的概念產(chǎn)生以來,人們幾乎是不加區(qū)分地使用這兩個概念。但是,如果深入研究BSS和ICA的基本原理和作用對象,兩者之間的區(qū)別和聯(lián)系是顯而易見的。Comon對ICA給出了較嚴格的定義:對于觀測信號矢量,存在一個線性變換,使得觀測信號在線性變換下各分量的統(tǒng)計獨立性最大化。這一過程稱之為ICA過程。與此對應,可以給出BSS的如下定義:對于觀測信號矢量,存在線性變換w,使得全局矩陣G的各行及各列中只有一個非零元素(不妨稱之為廣義對角矩陣),即G=PD。其中P為置換陣;D為對角陣,從而實現(xiàn)信號分離。ICA的目的是通過線性變換使得觀測信號的各個分量的統(tǒng)計獨立性最大化。通常用輸出信號的互信息、熵等作為統(tǒng)計獨立性的量度,如基于信息論的Informax算法、Amari的自然梯度算法等。如果源信號之間具有統(tǒng)計獨立性,那么可以通過ICA實現(xiàn)信號的分離。BSS考察的是在什么條件下可以使全局矩陣實現(xiàn)廣義對角化,而不去衡量輸出信號的統(tǒng)計獨立性是否達到最大化。因此BSS并不一定要求源信號是統(tǒng)計獨立的。例如AMUSE、GED算法只要求源信號具有統(tǒng)計不相關(guān)性。如果源信號是統(tǒng)計獨立的,那么BSS的輸出信號也一定是統(tǒng)計獨立的,這時BSS和ICA等價。從作用對象看,ICA除了可以用于多源信號的分離外,還可以用于其它多維數(shù)據(jù)的分析,例如圖像的特征提取、經(jīng)濟數(shù)據(jù)分析等。而BSS不僅僅局限于瞬時混合信號的分離,還包括實際應用中更重要的卷積混合信號的分離??梢哉fICA是實現(xiàn)BSS的一種方法,而BSS是ICA的一個具體的應用。2.3盲分離的目標準則根據(jù)源信號不同的特征,盲源分離的實現(xiàn)方法有很多,但它們的原理可以歸納為以下四種準則:(1)獨立分量分析(IndependentComponentAnalysis,ICA):當假設(shè)源信號各分量間彼此統(tǒng)計獨立,且沒有時間結(jié)構(gòu)時,在某一分離準則下通過對神經(jīng)網(wǎng)絡權(quán)值的反饋調(diào)整,使得變換后信號的不同分量之間的相依性最小,也即輸出達到盡可能的獨立。這種方法對多于一個高斯分布的源信號不適用(因為高斯信號的線性疊加仍是高斯信號),這是近年來盲源分離的主要解決方法。(2)主分量分析(PrincipalComponentAnalysis,PCA)的方法:在盡可能保持原始變量更多信息的前提下,導出一組零均值隨機變量相對少的不相關(guān)線性組合(主分量),并由此恢復出對源信號的估計。(3)二階非平穩(wěn)性:即采用非平穩(wěn)性和二階統(tǒng)計量。由于源信號隨時間有不同的變化,所以可以考慮利用二階非平穩(wěn)性,應用簡單的解相關(guān)技術(shù)實現(xiàn)盲源分離。與其他方法相比,它能夠分離具有相同功率譜形狀的有色高斯源,然而卻不能分離具有相同非平穩(wěn)特性的源信號。(4)運用信號的不同多樣性,典型的是時域多樣性、頻域多樣性或時頻域多樣性,更一般的,即聯(lián)合空間-時間-頻率多樣性,如果源信號具有不同的時頻域多樣性,信號的時頻域特征不完全重疊,那么可以通過屏蔽時頻域的單個源信號或干擾信號,并從一個(或多個)傳感器信號中提取源信號,然后再在時頻域中合成,然而這些情況下,通常需要一些源信號的先驗知識,所以這種分離只能是一種半盲分離。2.4盲分離的研究領(lǐng)域在BSS問題的研究和發(fā)展過程中,基于其不同的應用環(huán)境,進行了不同角度的擴展,形成了不同的研究領(lǐng)域,可以對BSS的研究領(lǐng)域做如下的分類:依據(jù)信號混合方式不同,盲信號的混合方式有瞬態(tài)線性混合、卷積混合、非線性混合等方式,針對不同的混合方式需要采用不同的分離方法。在瞬態(tài)線性混合方式下,觀測信號是原始信號在相同時刻的線性疊加,即不同信號到達各個傳感器的時間差別可以忽略不計,此時混合矩陣是實矩陣,盲分離過程等價于尋找混合矩陣的逆矩陣過程。如果信道的傳輸延遲等對觀測信號的影響較大,觀測信號是原始信號在過去不同時刻的線性疊加,則屬于卷積混合方式,此時的傳遞通道矩陣可以用有限長沖激響應濾波器模型來構(gòu)造,盲解卷過程就需要利用相應的解卷濾波器實現(xiàn)。如果信號所處的環(huán)境是動態(tài)變化的且具有非線性特征,則需要利用非線性特征函數(shù)實現(xiàn)盲分離。對信號的處理角度不同,BSS可在時域、頻域或時頻域進行研究。時域盲分離比較直觀,但不能利用信號的頻譜特征,在瞬態(tài)線性混合情況下應用較多;頻域盲分離可以將時域上的卷積運算轉(zhuǎn)化為頻域上的直接乘積形式,從而可以利用時域盲分離算法解決盲解卷/盲均衡問題,但頻域上的尺度與交互不確定性問題以及較大的計算量是阻礙信號進行頻域盲分離的主要障礙。利用信號的時頻特性進行盲分離,可以充分利用時域和頻域分析的優(yōu)點,其主要困難在于時頻點的合理選擇。信號本身的屬性有平穩(wěn)信號與非平穩(wěn)信號之分、窄帶信號與寬帶信號的差別。平穩(wěn)信號的盲分離,常需要利用信號的高階統(tǒng)計量信息;而對于非平穩(wěn)信號,如語音信號,則利用信號的二階時間相關(guān)屬性實現(xiàn)盲分離;寬帶信號通常要先分解為多個窄帶信號,逐個進行盲分離。根據(jù)源信號數(shù)目與觀測信號數(shù)目的關(guān)系,可分為適定盲分離、超定盲分離、欠定盲分離。當前很多算法都是在適定條件下推導得到的,它是指源信號數(shù)目和觀測信號數(shù)目相等的情況;當觀測信號數(shù)目大于源信號數(shù)目時,稱為超定盲分離,超定盲分離通常采用降低觀測信號維數(shù),進而進行適定條件下盲分離的方法;欠定盲分離,又稱超完備盲分離,是近年來的研究熱點和重點,它是源信號數(shù)目大于觀測信號數(shù)目的情況,這相當于信源在經(jīng)過混合信道后,發(fā)生了有損壓縮,因此采用傳統(tǒng)的ICA通過對混合系統(tǒng)求偽逆的過程已無法恢復出源信號,這些丟失的信息只能通過一些先驗、假設(shè)或限制條件(如:獨立性、稀疏性等)進行彌補。根據(jù)對算法的性能要求,盲分離可以分為離線批處理和自適應在線處理等方式。離線批處理方式可以利用信號的各階統(tǒng)計量信息,通過特征值分解等運算獲得盲信號的分離矩陣,其優(yōu)點是可以充分利用觀測信號的樣本數(shù)據(jù),能夠獲得較為精確的解,缺點是計算量大,分離時間長,且對信息的存儲空間要求高;而自適應的在線處理方式是基于單次觀測樣本進行盲分離系統(tǒng)的更新迭代,計算量低,適用于實時性要求較高的場合,如在線故障診斷等。2.5盲分離的研究內(nèi)容盲源分離的基本框架是根據(jù)某種優(yōu)化準則,先選出合適的目標函數(shù),然后通過某種優(yōu)化算法來搜索目標函數(shù)的極值點,其中優(yōu)化準則保證了算法實現(xiàn)的可能性和實現(xiàn)途徑;具體的目標函數(shù)決定了算法的統(tǒng)計性能,優(yōu)化算法則決定了算法的搜索性能。因此BSS的研究內(nèi)容涉及優(yōu)化準則及目標函數(shù)的確定、信源概率密度函數(shù)(Probabilitydensityfunction,pdf)的估計、各種優(yōu)化算法、算法的性能評價指標等多個方面。(1).優(yōu)化準則獨立分量分析(ICA)是目前解決BSS問題的主要方法,而ICA的目的在于確定一非線性變換使得輸出各分量間盡可能的相互獨立,因此一般采用輸出各分量間的最大化獨立性作為算法的優(yōu)化準則。信號分量間的獨立性程度可以采用非高斯性、高階統(tǒng)計量、熵、互信息、概率密度函數(shù)(pdf)以及兩種pdf距離的Kullback-Leibler散度等函數(shù)進行度量。(2).信源概率密度函數(shù)的估計目標函數(shù)最優(yōu)解的迭代計算通常需要知道信源s的概率分布,這顯然不切實際,所以需要對輸出矢量的概率密度函數(shù)進行估計。常用的方法有采用級數(shù)展開的方法對概率密度函數(shù)進行逼近、或通過估計概率模型中未知參數(shù)的方法估計概率密度函數(shù)、核函數(shù)法等方法,以及正在興起的結(jié)合神經(jīng)網(wǎng)絡和機器學習理論的支持向量機(SVM)回歸估計方法等,本文正是在這個理論的基礎(chǔ)上對原有算法提出了新的改進,并取得而來良好的效果。(3).優(yōu)化算法及其性能分析根據(jù)算法的迭代和搜索最優(yōu)點的過程是基于單次觀測樣本還是全部樣本,可以將算法分為在線自適應算法和離線批處理算法。評價算法性能的指標一般有收斂速度、分離精度、局部(全局)穩(wěn)定性、算法的復雜性以及適用范圍等,常用的具體函數(shù)有系統(tǒng)矩陣的串音誤差、與對角陣的距離,范數(shù)誤差等。第三章獨立分量分析的基本算法3.1ICA的線性模型YY3Y2Y1X3X2X1SnS2S1AW圖3.1ICA的線性模型如圖3.1,設(shè)x1,x2,…xn為t為n維隨機觀測混合信號,由m個未知源信號(或稱獨立源)s1,s2,…sm線性組合而成,忽略時間下標t,并假設(shè)每個混合信號xi都是一個隨機變量,而不是時間信號。每個觀測值xi(t),為該隨機變量的一次抽樣。不失一般性,設(shè)混合的隨機變量和獨立源都具有零均值。下面用矩陣形式來定義ICA模型。令X=(x1,x2,…xn)T為n維隨機向量,S=(s1,s2,…sm)T是m維未知源信號,則ICA的線性模型可表示為:,i=1,2,…m(3-1)式中,si稱為獨立分量,A=[a1,a2,…am]是一滿秩的n*m矩陣,稱為混合矩陣,ai是混合矩陣的基向量。由方程可知,各觀測數(shù)據(jù)xi是由獨立源si經(jīng)過不同的aij線性加權(quán)得到的。獨立源si是隱含變量,不能被直接測量;混合矩陣A也是未知矩陣,唯一可利用的信息只剩觀測的隨機矢量X。若沒有任何限制條件,要僅由X估計出S和A,方程的解必為多解。而ICA正是在某些限制條件下,根據(jù)X的統(tǒng)計特性,給出方程唯一解,實現(xiàn)獨立分量的提取。如上所述,ICA的一個重要基本假設(shè)就是對未知源信號獨立性的要求。針對ICA具體模型,未知源信號間相互獨立即要求:(3-2)在ICA模型中,除了要求源信號相互獨立外,還必須滿足非高斯分布的特性。此外為簡化模型,假設(shè)未知混合矩陣A是方陣,即m=n。那么ICA的目的就是尋找一個變換矩陣,對X進行線性變換,得n維輸出向量(3-3)當允許存在比例不定性和順序不定性的前提下,Y成為對獨立分量si的一個估計.以上,從盲源分離觀點闡述了ICA的模型,下面給出從多維信號的線性描述觀點論述的ICA模型。設(shè)X=(x1,x2,…,xn)T為n維觀測數(shù)據(jù),ICA的目的即尋找一個坐標系統(tǒng),使得當X中各分量x1,x2,…,xn在該坐標系下投影時:,i=1,2,…,n(3-4)投影系數(shù)s1,s2,…,sn相互獨立。若令Y=WX,在ICA實現(xiàn)算法中,系統(tǒng)目標是尋找一最優(yōu)矩陣W使使出yi相互統(tǒng)計獨立,即Y互信息為零??梢宰C明,此時為ICA線性描述模型中的坐標系統(tǒng)。3.2ICA研究中的主要問題及限制條件1)對ICA問題的研究有許多方面,但歸納起來主要有以下九個方面:(1)關(guān)于源信號不同pdf,如高斯、次高斯pdf的特性描述。給出不同特性pdf隨機變量的特征參數(shù):矩(moment)、累積矩(cumulant)和峰起度(kurtosis)。研究解的等價性,去除二階相關(guān)及去除高階相關(guān)等問題。(2)ICA的目標函數(shù)。(3)ICA的學習算法。與其他神經(jīng)網(wǎng)絡學習算法相同,學習可取批處理方式(針對平穩(wěn)環(huán)境)或在線自適應方式(針對在線或平穩(wěn)環(huán)境)。為了求得使目標函數(shù)達到極值的W,所用的算法一般為迭代算法,應盡量簡單、收斂快。(4)ICA算法的穩(wěn)定性。穩(wěn)定性是指ICA迭代計算中達到正確源信號分離的解可能是一個平衡點而不是穩(wěn)定點。(5)ICA算法實現(xiàn)的源信號分離精度,即相鄰源信號的干擾問題。(6)ICA中源信號pdf的確定。如果關(guān)于源信號pdf的先驗知識很少甚至完全沒有時,必須在學習過程中加以確定,否則將進行反復嘗試,可能會浪費大量時間而且使分離效果不佳。(7)ICA的各種模擬實驗和具體應用研究。(8)盲解卷/均衡和多道盲解卷/均衡問題。(9)有噪聲和M≠N的情況下,ICA的問題求解。2)ICA的任務是根據(jù)觀測記錄X=AS,在矩陣A未知且對S除獨立性外無其它先驗知識的情況下,求解混合矩陣W,使得變換結(jié)果Y=WX中各分量盡可能相互獨立,且逼近S。從數(shù)學角度說,該方程的解并不是唯一的,至少會存在以下一些問題:(1)分離結(jié)果的幅度存在不確定性由于在X=AS中,A和S均未知,如果將S中任一分量Si擴大a倍,只需將A中相應的混合系數(shù)乘以1/a,上式仍成立。在觀測信號幅度不變的前提下,源信號的幅度存在不確定性。因此,在求解獨立分量時,往往事先假設(shè)S具有單位方差,且各分量均值為零。(2)分離結(jié)果的排列存在不確定性由于A和S的未知,公式中獨立分量的順序很容易調(diào)換。在X=AS中插入一個置換矩陣P和它的逆矩陣P-1,得到X=AP﹒P-1S,將AP-1看成新的混合矩陣,則PS中的各分量便成為新的已調(diào)換順序的獨立源si。這表明ICA分離結(jié)果存在排序上的不確定性。但是幅度和排序的不確定性不會對ICA算法的分離過程產(chǎn)生影響。3.3ICA的基本算法ICA是在某一判據(jù)意義下進行的尋優(yōu)算法,所以問題實際包含兩個部分:首先是采用什么判據(jù)作為一組信號是否接近互相獨立的準則(即目標函數(shù));其次是用怎樣的算法來達到這個目標(即優(yōu)化算法)。ICA算法=目標函數(shù)+優(yōu)化算法一般來說,不同的目標函數(shù)是由不同的估計準則得到得,然后通過恰當?shù)膬?yōu)化方法來實現(xiàn)獨立分量分析,也就是求出混合矩陣A和獨立分量S,其中這些優(yōu)化方法大多是基于梯度的方法。為了更清楚的描述實現(xiàn)獨立分量分析的方法,假設(shè)由不同的估計準則得到的目標函數(shù)表示為F(W)且W的第n行表示為wn,則這個優(yōu)化問題就是(以極大化為例,極小化是與其等價的):(3-5)實際獨立分量分析的算法主要就是利用最優(yōu)化的思想和技術(shù)。主要包括信息極大化、非高斯性極大化、極大似然估計和互信息極小化等。3.3.1信息極大化Nadal和Parga發(fā)現(xiàn)在低噪聲的情況下,對神經(jīng)網(wǎng)絡的輸入和輸出信號之間的互信息化暗含了輸出分布是可因式化的。即,非線性神經(jīng)網(wǎng)絡中的最大化信息變換可以將輸出信號之間的互信息最小化。Roth、Baram、Bell以及Seinowski分別獨立的導出了這種最大化方法的隨機梯度學習規(guī)則,并將該規(guī)則分別運用到預測,時間序列分析和盲源分析中。Bell和Sqnowslki提出了一種簡單的前饋神經(jīng)網(wǎng)絡算法,如下圖所示:能使用信息最大化法對相互獨立的源信號S的線性混合信號X進行分離。他們指出將神經(jīng)處理器輸出信號的聯(lián)合熵最大化可以將輸出分量yi=g(ui)之間的互信息幾乎降至最小,這里g(ui)是一個可逆的單調(diào)非線性函數(shù),且U=WX。神經(jīng)網(wǎng)絡輸出信號的聯(lián)合熵是(3-6)這里,H(y1)是輸出信號的邊緣熵,I(y1,…,yN)是輸出信號之間的互信息。將H(y1,…,yN)最大化等于將邊緣熵的和H(y1)+…+H(yN)最大化并同時使I(y1,…,yN)降至最小。輸出信號Y是振幅有界的隨機變量,因此,當輸出信號yi服從均勻分布時H(y1)+…+H(yN)最大。當I(y1,…,yN)=0時,聯(lián)合熵等于邊緣熵的和,即:(3-7)當有界隨機變量的互信息等于0,且他們的邊緣分布為均勻分布時,可取得最大值。這時具有源信號分布的累計密度函數(shù)形式。Bell和Sejnowski選擇了一個非線性函數(shù)作為固定邏輯函數(shù),等于假定所有的源信號都服從超高斯分布,通過調(diào)整權(quán)矩陣W使聯(lián)合熵最大化,使聯(lián)合熵取得最大值的權(quán)矩陣W就是我們所要求得的。上式兩端對W求導得:(3-8)其中,是多元均勻分布與其估計值之間的KL散度。當變換函數(shù)和權(quán)矩陣W取得最優(yōu)值時,聯(lián)合熵取得最大值,且。如果是從到的可逆映射,則因為KL散度在可逆變換的情況下是不變的,所以KL散度等于源信號估計分布與源信號分布之間的KL散度,即:=(3-9)如果輸出信號之間的互信息,則在非線性變換之前的互信息,因為非線性變換不產(chǎn)生任何相關(guān)性。與有如下關(guān)系:(3-10)如果服從均勻分布,則有:(3-11)這表示是一個獨立的隨機變量,它的分布近似于一個非線性函數(shù)的導數(shù)。Bell和Sejnowski用信息最大化法分離了幾個音樂信號和語音信號的混合信號,不過如果源信號的概率密度函數(shù)與非線性函數(shù)的斜率不相等,聯(lián)合熵取得最大值時,互信息。在這樣的情況下,信息最大化法不能將互信息最小化,不過這樣的情況只有在非線性函數(shù)與真實源信號的累計密度函數(shù)很不相同時才會發(fā)生。非線性函數(shù)是將互信息最小化的關(guān)鍵。與之間有如下關(guān)系:(3-12)則:兩邊對W求導得:(3-13)上式第一部分。第二部分.這里是對數(shù)似然的梯度,(3-14)所以,通用學習規(guī)則即:Amari等人提出了一個高效的學習規(guī)則使負熵最大化:(3-15)這里,改變了梯度比例,簡化了學習規(guī)則并大大的提高了收斂速度。3.3.2負熵最大化另一種使之間的互信息最笑話的方法是負熵最大化法。由負熵定義可得,負熵的概率密度和高斯分布之間的KL散度,且與有相同的數(shù)學期望和協(xié)方差。即:(3-16)這里,U是由參數(shù)W給出的源信號的估計值。輸出的參數(shù)形式可因式化的。且只有當輸出信號之間相互獨立,才有,這時輸出信號之間的互信息,且假設(shè)之間取出了相關(guān)性,可因式化,但。則有:(3-17)上式還可進一步展開成:(3-18),.因為我們假設(shè)之間是去相關(guān)性的,所以它們的協(xié)方差矩陣相同,因而行列式等于1.上式可進一步簡化為:(3-19)可以使用隨機梯度搜索使負熵最大化:(3-20)這實際上導出了與信息最大化相同的學習規(guī)則:(3-21)3.3.3最大似然估計法最大似然估計(MaxilIlumLikelihoodEstimation,MLE)是將觀測信號模式化。在低噪聲情況下,我們使用參數(shù)化概率密度估計找到參數(shù)向量a,使生成模式與觀測分布p(x)之間的差別最小。這種差別可以用KL散度來度量:(3-22)這里,是觀測信號X的概率密度函數(shù),是的參數(shù)估計,只有當估計與相等時,才等于0.信息最大化法與MLE從ICA的角度來看是相同的。簡要推導如下:對似然估計取對數(shù)并歸一化得:(3-23)這里,N是X樣本的個數(shù),根據(jù)大數(shù)定理,對數(shù)似然概率收斂于它的數(shù)學期望。(3-24)因為與W無關(guān),所以最大化對數(shù)似然可將與的KL散度最小化,即:(3-25)因為A是可逆矩陣,且KL散度在可逆變換下是不變的,所以最小化式中的KL散度等價與最小化源估計信號與真實源信號之間的散度。(3-26)3.4FastICA算法原理獨立分量分析(ICA)的過程如下圖所示:在信源中各分量相互獨立的假設(shè)下,由觀察通過解混系統(tǒng)把他們分離開來,使輸出逼近。圖3.3ICA的一般過程ICA算法的研究可分為基于信息論準則的迭代估計方法和基于統(tǒng)計學的代數(shù)方法兩大類,從原理上來說,它們都是利用了源信號的獨立性和非高斯性?;谛畔⒄摰姆椒ㄑ芯恐校鲊鴮W者從最大熵、最小互信息、最大似然和負熵最大化等角度提出了一系列估計算法。如FastICA算法,Infomax算法,最大似然估計算法等?;诮y(tǒng)計學的方法主要有二階累積量、四階累積量等高階累積量方法。本次課設(shè)主要討論FastICA算法。3.4.1數(shù)據(jù)的預處理一般情況下,所獲得的數(shù)據(jù)都具有相關(guān)性,所以通常都要求對數(shù)據(jù)進行初步的白化或球化處理,因為白化處理可去除各觀測信號之間的相關(guān)性,從而簡化了后續(xù)獨立分量的提取過程,而且,通常情況下,數(shù)據(jù)進行白化處理與不對數(shù)據(jù)進行白化處理相比,算法的收斂性較好。 若一零均值的隨機向量滿足,其中:為單位矩陣,我們稱這個向量為白化向量。白化的本質(zhì)在于去相關(guān),這同主分量分析的目標是一樣的。在ICA中,對于為零均值的獨立源信號,有:,且協(xié)方差矩陣是單位陣,因此,源信號是白色的。對觀測信號,我們應該尋找一個線性變換,使投影到新的子空間后變成白化向量,即:(3-27)其中,為白化矩陣,為白化向量。利用主分量分析,我們通過計算樣本向量得到一個變換其中和分別代表協(xié)方差矩陣的特征向量矩陣和特征值矩陣。可以證明,線性變換滿足白化變換的要求。通過正交變換,可以保證。因此,協(xié)方差矩陣:(3-28)再將式代入,且令,有(3-29) 由于線性變換連接的是兩個白色隨機矢量和,可以得出一定是一個正交變換。如果把上式中的看作新的觀測信號,那么可以說,白化使原來的混合矩陣簡化成一個新的正交矩陣。證明也是簡單的:(3-30)其實正交變換相當于對多維矢量所在的坐標系進行一個旋轉(zhuǎn)。 在多維情況下,混合矩陣是的,白化后新的混合矩陣由于是正交矩陣,其自由度降為,所以說白化使得ICA問題的工作量幾乎減少了一半。 白化這種常規(guī)的方法作為ICA的預處理可以有效地降低問題的復雜度,而且算法簡單,用傳統(tǒng)的PCA就可完成。用PCA對觀測信號進行白化的預處理使得原來所求的解混合矩陣退化成一個正交陣,減少了ICA的工作量。此外,PCA本身具有降維功能,當觀測信號的個數(shù)大于源信號個數(shù)時,經(jīng)過白化可以自動將觀測信號數(shù)目降到與源信號維數(shù)相同。3.4.2FastICA算法FastICA算法,又稱固定點(Fixed-Point)算法,是由芬蘭赫爾辛基大學Hyv?rinen等人提出來的。是一種快速尋優(yōu)迭代算法,與普通的神經(jīng)網(wǎng)絡算法不同的是這種算法采用了批處理的方式,即在每一步迭代中有大量的樣本數(shù)據(jù)參與運算。但是從分布式并行處理的觀點看該算法仍可稱之為是一種神經(jīng)網(wǎng)絡算法。FastICA算法有基于峭度、基于似然最大、基于負熵最大等形式,這里,我們介紹基于負熵最大的FastICA算法。它以負熵最大作為一個搜尋方向,可以實現(xiàn)順序地提取獨立源,充分體現(xiàn)了投影追蹤(ProjectionPursuit)這種傳統(tǒng)線性變換的思想。此外,該算法采用了定點迭代的優(yōu)化算法,使得收斂更加快速、穩(wěn)健。因為FastICA算法以負熵最大作為一個搜尋方向,因此先討論一下負熵判決準則。由信息論理論可知:在所有等方差的隨機變量中,高斯變量的熵最大,因而我們可以利用熵來度量非高斯性,常用熵的修正形式,即負熵。根據(jù)中心極限定理,若一隨機變量由許多相互獨立的隨機變量之和組成,只要具有有限的均值和方差,則不論其為何種分布,隨機變量較更接近高斯分布。換言之,較的非高斯性更強。因此,在分離過程中,可通過對分離結(jié)果的非高斯性度量來表示分離結(jié)果間的相互獨立性,當非高斯性度量達到最大時,則表明已完成對各獨立分量的分離。負熵的定義:(3-31)式中,是一與具有相同方差的高斯隨機變量,為隨機變量的微分熵(3-32)根據(jù)信息理論,在具有相同方差的隨機變量中,高斯分布的隨機變量具有最大的微分熵。當具有高斯分布時,;的非高斯性越強,其微分熵越小,值越大,所以可以作為隨機變量非高斯性的測度。由于根據(jù)式(3.6)計算微分熵需要知道的概率密度分布函數(shù),這顯然不切實際,于是采用如下近似公式:(3-33)其中,為均值運算;為非線性函數(shù),可取,或或等非線性函數(shù),這里,,通常我們?nèi)???焖買CA學習規(guī)則是找一個方向以便具有最大的非高斯性。這里,非高斯性用式(3.7)給出的負熵的近似值來度量,的方差約束為1,對于白化數(shù)據(jù)而言,這等于約束的范數(shù)為1。FastICA算法的推導如下。首先,的負熵的最大近似值能通過對進行優(yōu)化來獲得。根據(jù)Kuhn-Tucker條件,在的約束下,的最優(yōu)值能在滿足下式的點上獲得。(3-34)這里,是一個恒定值,,是優(yōu)化后的值。下面我們利用牛頓迭代法解方程(3.8)。用表示式(3.8)左邊的函數(shù),可得的雅可比矩陣如下:(3-35)為了簡化矩陣的求逆,可以近似為(3.9)式的第一項。由于數(shù)據(jù)被球化,,所以,。因而雅可比矩陣變成了對角陣,并且能比較容易地求逆。因而可以得到下面的近似牛頓迭代公式:(3-36)這里,是的新值,,規(guī)格化能提高解的穩(wěn)定性。簡化后就可以得到FastICA算法的迭代公式:(3-37)實踐中,F(xiàn)astICA算法中用的期望必須用它們的估計值代替。當然最好的估計是相應的樣本平均。理想情況下,所有的有效數(shù)據(jù)都應該參與計算,但這會降低計算速度。所以通常用一部分樣本的平均來估計,樣本數(shù)目的多少對最后估計的精確度有很大影響。迭代中的樣本點應該分別選取,假如收斂不理想的話,可以增加樣本的數(shù)量。第四章語音信號盲分離仿真及分析4.1ICA算法實現(xiàn)下面仿真中所使用的語音源信號是在干擾噪聲很小的環(huán)境下用麥克風錄制的3段不同的語音文件,保存成*.wav文件dragon.wav,man.wav,music.wav,四個男聲采樣率均為25600Hz,持續(xù)時間為10s。圖4.1是這3個語音源信號的時域波形,圖中的橫坐標表示樣本點數(shù),縱坐標表不語音信號的幅度水平。原始的語音信號如下:圖4.1原始語音信號該仿真的混合矩陣是由隨機函數(shù)rand產(chǎn)生的,即該矩陣為一個4x3的方陣,參數(shù)見下圖:圖4.2混合矩陣混合后的語音信號:圖4.3混合信號采用混合信號進行訓練學習,求出分離矩陣:圖4.4分離矩陣FastICA算法分別求出三路分離信號,信號如圖4.5:圖4.5分離信號從試驗結(jié)果,我們可以看出分離語音信號從波形上看很好地保持了原始信號的波形,而且實際分離的語音信號在聽覺上也很好的實現(xiàn)了分離,而且?guī)缀鯖]有什么失真效果。但是三幅圖像的順序產(chǎn)生了變化:原始輸入信號1對應分離信號3,原始輸入信號2對應分離信號1,原始輸入信號3仍然對應分離信號2。4.2頻譜分析本仿真針對原始輸入信號,混合信號,分離信號分別進行了頻譜分析。圖像主要顯示了福祉,相位,頻譜等信息。原始三路輸入信號頻譜圖如圖4.64.8所示:圖4.6輸入信號1頻譜圖圖4.7輸入信號7頻譜圖圖4.8輸入信號3頻譜圖混合信號頻譜圖如圖4.94.11所示:圖4.9混合信號1頻譜圖圖4.10混合信號2頻譜圖圖4.11混合信號3頻譜圖分離信號頻譜圖如圖4.124.14所示:圖4.12分離信號1頻譜圖圖4.13分離信號2頻譜圖圖4.14分離信號3頻譜圖僅對各圖像進行頻譜分析得:圖4.15綜合頻譜分析由上圖可知:在用FastICA實現(xiàn)語音信號的盲分離過程中,原始輸入信號和分離信號形狀相同,但是幅度和相位產(chǎn)生了一些變化。對頻譜觀察可知,頻譜形狀也未變化,只是幅度相應提高。說明FastICA僅改變信號幅度和相位,并不改變頻率分量。

第五章總結(jié)盲源分離技術(shù)是近二十年發(fā)展起來的一門新型科學,在各國科學家和研究人員的努力下獲得了長足的發(fā)展,但是它畢竟是一個涉及面廣并且仍處在發(fā)展前沿的課題,在理論上還遠沒有成熟,許多問題有待進一步研究和解決。(1)非線性混合信號的盲源分離算法。現(xiàn)有的算法研究大部分集中線性領(lǐng)域,僅有的對非線性混合的研究也只是基于在特殊情況下的假設(shè)之上。因此,對更一般的非線性混合信號的盲分離需作進一步的研究。(2)非平穩(wěn)混合信號的盲源分離算法。許多情況下源信號可能是非平穩(wěn)的,如何利用信號的非平穩(wěn)特性進行盲源分離是擺在廣大研究人員面前的一個現(xiàn)實問題。(3)卷積混合信號的盲源分離算法。在實際中,系統(tǒng)接收到的混合輸入信號是源信號經(jīng)過不同的傳播途徑到達接收器.在這個過程中,不可避免的存在信號的時延和反射。針對這種情況的盲源分離算法還很不成熟。本次課程設(shè)計所涉及到的主要知識是數(shù)字信號處理、MATLAB方面的。我將把本次畢業(yè)設(shè)計的心得和體會簡述如下:(1)系統(tǒng)思維。必須有系統(tǒng)的設(shè)計思維,把每一個細節(jié)都放到整個系統(tǒng)中考慮,考慮整個系統(tǒng)設(shè)計的可行性、完整性、穩(wěn)定性和功能的實現(xiàn),這樣才不會局限在細節(jié)上,才能快速的完成性能優(yōu)越的軟件設(shè)計。(2) 把握細節(jié)。系統(tǒng)也是由細節(jié)構(gòu)成的,在把握整個系統(tǒng)思維的基礎(chǔ)上把握每一個細節(jié),因為每一個細節(jié)都有可能決定整個系統(tǒng)的性能。在寫代碼時,把每一個變量與過程考慮清楚才可能完成整個程序。(3) 勇于嘗試。系統(tǒng)即使經(jīng)過了非常嚴格的論證也仍然可能存在問題,或許面對問題一時沒有很好的解決方案,但是有一個或許可行的大膽的想法,不要猶豫,試一試吧。勇于嘗試往往能夠找到更好的解決方法。(4) 保持自信。無論遇到什么困難,我都相信自己一定能夠找到解決的方法,有的時候只要稍微再用一點力、使一點勁,結(jié)果就會不一樣。參考文獻[1]胥永剛,張發(fā)啟,何正嘉.獨立分量分析及其在故障診斷中的應用[J]2004(03)[2]陳華富,堯德中.獨立成分分析及其應用的研究進展[J]2003(02)[3]楊世錫,焦衛(wèi)東,吳昭同.基于獨立分量分析特征提取的復合神經(jīng)網(wǎng)絡故障診斷法[J].2004(04)[4]譚北海,楊祖元.欠定盲分離中源的個數(shù)估計和分離算法[J].2009(03)[5]申永軍,楊紹普,孔德順.基于奇異值分解的欠定盲信號分離新方法及應用[J]2009(08)[6]張赟,李本威,王永華.基于位勢函數(shù)的欠定盲源分離識別診斷方法[J].2010(01)[7]彭煊基于獨立分量分析的語音增強[期刊論文]2002(05)[8]張智林.皮亦鳴基于獨立分量分析的降噪技術(shù)[期刊論文]2005(03)[9]周成.劉釗基于獨立分量分析的單通道語音降噪算法研究2005(05)[10]馬建芬盲源分離在單通道語音增強算法中的應用[期刊論文]2006(11)[11]徐靜波子帶頻譜分析的語音增強[期刊論文]2006(03)[12]鐘靜.傅彥基于快速ICA的混合語音信號分離[期刊論文]2005(05)[13]徐巖基于譜相減改進算法的語音增強研究[期刊論文]2004(01)[14]楊福生.洪波獨立分量分析的原理與應用2006[15]洪歐麥克風陣列語音增強技術(shù)及其應用[期刊論文]2006

附錄%%%%%%%%%%%%%%%%初始化%%%%%%%%%%%%%clc;clearall;closeall;%%%%%讀入原始圖像,混合,并輸出混合圖像%%%%%fs=25600;%語音信號采樣頻率為25600f=fs*(0:2047)/4096;%讀入混合前的原始圖片并顯示I1=wavread('man.wav')';I2=wavread('dragen.wav')';I3=wavread('music.wav')';subplot(6,3,1);plot(I1);title('輸入聲音1');subplot(6,3,4);a=I1;y1=fft(a,4096);%對信號做4096點FFT變換plot(f,abs(y1(1:2048)));title('原始語音信號1頻譜');axis([015000100]);subplot(6,3,2);plot(I2);title('輸入聲音2');subplot(6,3,5);b=I2;y1=fft(b,4096);%對信號做4096點FFT變換plot(f,abs(y1(1:2048)));title('原始語音信號2頻譜');axis([015000100]);subplot(6,3,3);plot(I3);title('輸入聲音3');subplot(6,3,6);c=I3;y1=fft(c,4096);%對信號做4096點FFT變換plot(f,abs(y1(1:2048)));title('原始語音信號3頻譜');axis([015000100])%將其組成矩陣S=[I1;I2;I3];%因此S_all是一個變量個數(shù)*采樣個數(shù)的矩陣Sweight=rand(size(S,1));%取一隨機矩陣,作為信號混合的權(quán)矩陣MixedS=Sweight*S;%得到三個聲音的混合信號矩陣%將混合矩陣重新排列并輸出subplot(6,3,7),plot(MixedS(1,:)),title('混合聲音1'),subplot(6,3,10);d=MixedS(1,:);y1=fft(d,4096);%對信號做4096點FFT變換plot(f,abs(y1(1:2048)));title('混合語音信號1頻譜');axis([015000100]);subplot(6,3,8),plot(MixedS(2,:)),title('混合聲音2'),subplot(6,3,11);e=MixedS(2,:);y1=fft(e,4096);%對信號做4096點FFT變換plot(f,abs(y1(1:2048)));title('混合語音信號2頻譜');axis([015000100]);subplot(6,3,9),plot(MixedS(3,:)),title('混合聲音3'),subplot(6,3,12);f1=MixedS(3,:);y1=fft(f1,4096);%對信號做4096點FFT變換plot(f,abs(y1(1:2048)));title('混合語音信號3頻譜');axis([015000100]);MixedS_bak=MixedS;%將混合后的數(shù)據(jù)備份,以便在恢復時直接調(diào)用%%%%%%%%%%%%%%%%標準化%%%%%%%%%%%%%MixedS_mean=zeros(3,1);fori=1:3MixedS_mean(i)=mean(MixedS(i,:));end

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論