非負(fù)矩陣分解技術(shù)應(yīng)用于簡單的音源分離場景中_第1頁
非負(fù)矩陣分解技術(shù)應(yīng)用于簡單的音源分離場景中_第2頁
非負(fù)矩陣分解技術(shù)應(yīng)用于簡單的音源分離場景中_第3頁
非負(fù)矩陣分解技術(shù)應(yīng)用于簡單的音源分離場景中_第4頁
非負(fù)矩陣分解技術(shù)應(yīng)用于簡單的音源分離場景中_第5頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、非負(fù)矩陣分解(NMF)技術(shù)在音源分離中應(yīng)用研究一、 研究目的1. 了解非負(fù)矩陣分解技術(shù)的發(fā)展歷程。2. 掌握非負(fù)矩陣分解技術(shù)的基本原理。3. 掌握非負(fù)矩陣分解技術(shù)在音源分離中的應(yīng)用原理。4. 結(jié)合非負(fù)矩陣分解技術(shù)及聚類技術(shù)對簡單語音進(jìn)行特征分離,畫出相應(yīng)的聚類圖或或分離后的頻譜圖。二、研究背景1NMF簡介在信號處理 、神經(jīng)網(wǎng)絡(luò) 、模式識別 、計算機(jī)視覺和圖像工程的研究中 ,如何構(gòu)造一個能使多維觀測數(shù)據(jù)被更好描述的變換方法始終是一個非常重要的問題。通常,一個好的變換方法應(yīng)具備兩個基本的特性:( 1 ) 可使數(shù)據(jù)的某種潛在結(jié)構(gòu)變得清晰;( 2 ) 能使數(shù)據(jù)的維數(shù)得到一定程度的約減。主分量分析 、

2、線性鑒別分析 、 矢量量化和獨立分量分析是一些最常用的變換方法它們因被施加的限制不同而有著本質(zhì)的區(qū)別,然而,它們有兩個共同的特點:( 1 )允許負(fù)的分解量存在(允許有減性的描述);( 2 )實現(xiàn)線性的維數(shù)約減. 區(qū)別于它們,一種新的變換方法非負(fù)矩陣分解( Nonngative Matrix Factor ,NMF)由Lee和seung在Nature上提出,它使分解后的所有分量均為非負(fù)值( 要求純加性的描述 ),并且同時實現(xiàn)非線性的維數(shù)約減。它在矩陣分解過程中加入了矩陣元素均為為非負(fù)的約束條件,從而得到了完全不同的結(jié)果。NMF一經(jīng)提出便引起了各個領(lǐng)域中科研人員的廣泛重視:一方面,NMF通過全新的

3、矩陣分解模式為處理大規(guī)模數(shù)據(jù)提供了新的途徑;另一方面,NMF算法相比一些傳統(tǒng)的算法,具有實現(xiàn)簡便,分解形式和分解結(jié)果可解釋性強(qiáng)、占用存儲空間少等諸多優(yōu)點。因此,隨著研究的不斷深入,NMF已經(jīng)逐漸成為信號處理、生物醫(yī)學(xué)工程、模式識別、計算機(jī)視覺和圖像工程等研究領(lǐng)域最受歡迎的多維數(shù)據(jù)處理工具之一。NMF理論實質(zhì)上是利用非負(fù)約束條件來獲取數(shù)據(jù)表示的一種方法。其理論問題可以描述為:對于任意給定的一個非負(fù)矩陣V,NMF算法能夠找到一非負(fù)矩陣W和一個非負(fù)矩陣H,滿足VWH,從而將一個非負(fù)矩陣分解為兩個非負(fù)矩陣的乘積。由于分解前后的矩陣中僅包含非負(fù)的元素,因此原矩陣V中的列向量可以解釋為對基矩陣W中所有列向

4、量(基向量)的加權(quán)和,而權(quán)重系數(shù)為系數(shù)矩陣H中對應(yīng)列向量中的元素。這種基于基向量組合的表示形式具有很直觀的解釋。三、非負(fù)矩陣技術(shù)基本原理及演化技術(shù)1、NMF的數(shù)學(xué)模型NMF理論的數(shù)學(xué)模型如下:已知非負(fù)矩陣V(觀測數(shù)據(jù)矩陣),尋找適當(dāng)?shù)姆秦?fù)矩陣因子W和H(因子矩陣),使得 V=WH+E,VRnm,WRnr,HRrm (1)其中n為數(shù)據(jù)向量的維數(shù),m為集合中數(shù)據(jù)樣本的個數(shù),r為主成分?jǐn)?shù),矩陣V可以分解為基矩陣W和權(quán)系數(shù)矩陣H的乘積與誤差矩陣E之和。但為了簡單起見,一般不考慮誤差的因素,此時模型可以修改為 VWH (2)或者VijWHij=k=1rWikHkj (3)一般情況下,式(1)、(2)和(

5、3)中r的選取比n和m都要小得多,而且r應(yīng)該滿足條件(n+m)rnm,即用很少的基來描述大量的數(shù)據(jù),這樣就得到了原始數(shù)據(jù)矩陣的一個壓縮模型。如果假設(shè)Vj和Hj是矩陣V和H所對應(yīng)的列向量,則是(3)還可以寫成列向量的形式:VjWHj,也就是說,每一個樣本vj可近似的看作是非負(fù)矩陣W的列向量的非負(fù)線性組合,組合系數(shù)是Hj的分量。所以矩陣W可以看做是對數(shù)據(jù)矩陣V進(jìn)行線性逼近的一組基,而H則是樣本集V在基W上的非負(fù)投影系數(shù)。通??梢杂蒙倭康幕蛄拷M來表征大量的數(shù)據(jù)向量,如果找到合適的基向量組,使其能夠代表數(shù)據(jù)之間潛在的結(jié)構(gòu)關(guān)系,則會獲得很好的逼近與表示效果。2、NMF算法根據(jù)NMF模型中對分解結(jié)果的限

6、制是否僅限于非負(fù)性,可將現(xiàn)有算法分為基本NMF算法(Basic NMF,BNMF,基于基本NMF模型)和改進(jìn)NMF算法(Improved NMF,INMF,基于改進(jìn)NMF模型要依具體的期望特性對分解結(jié)果施加除非負(fù)外的其他的限制)兩大類。1.1 、BNMF算法實現(xiàn)NMF的過程是一個優(yōu)化求解的過程,Donoho等從理論上分析了BNMF存在唯一解的條件,這個條件的苛刻性告訴 我們:合理地構(gòu)造一個目標(biāo)函數(shù),以此交替地優(yōu)化W和H從而得到BNMF的一個局部最優(yōu)解才是進(jìn)行BNMF的可行方法這也是目前BNMF算法構(gòu)造的基本思想 根據(jù)NMF理論的數(shù)學(xué)模型,必須尋找到一個分解過程VWH,使得WH盡量逼近V,也就是

7、要使誤差盡可能小,就必須定義相應(yīng)的衡量標(biāo)準(zhǔn),即必須定義目標(biāo)函數(shù)來評價逼近的效果。根據(jù)算法基于的目標(biāo)函數(shù)的特點不同,BNMF算法可分為基于極大似然的NMF算法、基于歐式距離的NMF算法、基于散度偏差的NMF算法。1)基于極大似然的NMF算法1999年Lee等最早在Nature上提出了NMF的概念,其假設(shè)矩陣的每個元素間是統(tǒng)計獨立的,其Vij服從以(WH)ij為參數(shù)的泊松分布,在此假設(shè)下以似然函數(shù)為目標(biāo)函數(shù),用極大似然估計的思路構(gòu)造NMF算法。該算法的目標(biāo)函數(shù)定義為:F=i=1nj=1mVijlog2WHij-(WH)ij (4)其迭代規(guī)則為:WiaWiajVij(WH)ijHaj(對W的列向量進(jìn)

8、行歸一化),HajHajjWiaVij(WH)ij算法按照上述迭代規(guī)則進(jìn)行迭代,目標(biāo)函數(shù)達(dá)到局部最大時算法收斂。此算法為先驅(qū)算法。2)基于歐氏距離的NMF算法2001年Lee等提出了利用V和WH間的歐氏距離的平方作為目標(biāo)函數(shù)的基準(zhǔn)算法。此算法實現(xiàn)簡單、效率高、是目前研究中應(yīng)用最多的基準(zhǔn)算法。該算法的目標(biāo)函數(shù)為:V-WH2=i,jVij-(WH)ij2 (5)當(dāng)V=WH時,目標(biāo)函數(shù)才取得最小值0。該算法的優(yōu)化問題為:最小化V-WH2,W,H矩陣元素為負(fù)。其迭代規(guī)則為:HkjHkj(WTV)kj(WTWH)kj,WikWik(VHT)kj(WHHT)kj算法按照上述迭代規(guī)則進(jìn)行迭代,目標(biāo)函數(shù)達(dá)到最

9、小時算法收斂。3)基于散度偏差的NMF算法2001年Lee等提出了基于散度偏差的基準(zhǔn)算法。此算法優(yōu)于以似然函數(shù)作為目標(biāo)函數(shù)的算法。直接通過查看所得結(jié)果對應(yīng)的目標(biāo)函數(shù)值大小就可以知道算法的優(yōu)劣,對優(yōu)化算法的評價更為簡單。此算法是迭代步長自學(xué)習(xí)的梯度下降算法(?)。該算法的目標(biāo)函數(shù)(KL散度)為:D(V|WH=i,jVijlog2VijWHij-Vij+(WH)ij (6)該目標(biāo)函數(shù)與距離測度不同,它無對稱性。當(dāng)且僅當(dāng)V=WH時,式(6)才取得最小值0。所以優(yōu)化問題為:最小化D(V|WH,其中W,H矩陣元素非負(fù)。散度偏差D(V|WH單調(diào)不增,W和H在某個局部最優(yōu)點時,算法收斂。此算法具有效率高、實

10、現(xiàn)簡單的優(yōu)點。2.2、改進(jìn)的非負(fù)矩陣算法(INMF)上面討論的基本NMF算法對分解結(jié)果僅施加非負(fù)限制。NMF算法被提出來后,為了適應(yīng)不同應(yīng)用領(lǐng)域的需求,研究者在基本算法基礎(chǔ)上,從多個角度對NMF算法提出了一系列的改進(jìn)和推廣。這些新算法按照實現(xiàn)功能的不同大體分為三類:基于稀疏性的NMF算法,基于加權(quán)的NMF算法,基于分類的NMF算法。1) 基于稀疏性的NMF算法基本NMF算法能夠無監(jiān)督地得到觀測信號基于部分的相對稀疏化描述,但有時稀疏度并不令人滿意,因此以稀疏性為目的的NMF算法研究成為熱點,它是NMF算法改進(jìn)研究中最為活躍的方向。基于稀疏性的NMF算法主要有LNMF、非負(fù)稀疏編碼(NNSC)、

11、稀疏非負(fù)矩陣分解(SNMF)、稀疏受限非負(fù)矩陣分解(NMFSC)、非平滑非負(fù)矩陣分解(NSNMF)。這些算法都是在BNMF的基礎(chǔ)上,增加了稀疏性限制,將BNMF的目標(biāo)函數(shù)進(jìn)行改進(jìn)從而得到新的目標(biāo)函數(shù)。LNMF算法2002年Feng等人在研究局部空間時引入LNMF理論,其目的是通過引入稀疏性限制獲得編碼矢量(矩陣H)真正的局部分解對象,并使基本組件(矩陣W)局部稀疏化,加強(qiáng)基成分的局部化特征,使算法適用局部特征非常重要的應(yīng)用。該算法附加定義了U=uij=WTW,V=vij=HHT;U,VRrr,并增加了以下3個稀疏性限制:A使H最大稀疏化。H必須包含盡可能多的零元素。一個基成分應(yīng)該分解到不能再分

12、解為基成分為止,這樣就能保證V所需要的基向量個數(shù)最小化。令wj=wijij2是其中一個基向量,對于給定的約束wj=i=1nwij=1,針對所有j,目標(biāo)是最小化i=1nwij2=ujj,以使每一個Wi都包含盡可能多的零,使其更富有表現(xiàn)局部的能力。當(dāng)且僅當(dāng)i=1nwij2=ujj=min時,H達(dá)到最大稀疏化。B最大化W的局部表現(xiàn)能力。這種思想就是只有那些包含更多訓(xùn)練樣本信息的基成分才能被保留。對于樣本Vj,基成分Wi包含的信息量有樣本在基成分上的“活性”來衡量,定義為hij2,所有樣本在Wi上的總活性定義為j=1mhij2。在所有基成分上的總活性定義為i=1mj=1rhij2=ivii。當(dāng)且僅當(dāng)i

13、vii=max時,W的局部表現(xiàn)能力最強(qiáng)。C最大化W的正交性。不同的基之間應(yīng)該盡可能地正交,以使基向量的冗余盡可能達(dá)到最小。這可以通過加約束i,juij=min來實現(xiàn)。因此,可將如下散度約束作為目標(biāo)函數(shù):FV,WH=i,jVijInVijWHij-Vij+WHij+i,juij-ivii (7)其中,是大于零的常量,這些常量可以通過最小化算法進(jìn)行消除。其迭代規(guī)則為: hkl=hkliVilWikkWikhkl, Wkl=WklWkljVkjhljkWklhljjhlj (8)Wkl=WklkWkl按照上述迭代規(guī)則進(jìn)行迭代,目標(biāo)函數(shù)達(dá)到局部最小值時算法收斂。2)基于加權(quán)的NMF算法加權(quán)NMF是NM

14、F的另一種改進(jìn)算法,現(xiàn)有的加權(quán)算法可以歸結(jié)為不均衡性加權(quán)、重要性加權(quán)、不確定性加權(quán)。a.不均衡性加權(quán):Guillamet等提出的不均衡性加權(quán)的目的是在訓(xùn)練樣本不均衡時減少基的冗余。實驗表明,如果訓(xùn)練樣本是不均衡的(即:存在某類樣本遠(yuǎn)多于另一類的情況),那 么得到的基就會更多地體現(xiàn)樣本數(shù)量占優(yōu)的類的特性。該算法的加權(quán)方式是:(1)統(tǒng)計各類 樣本在訓(xùn)練集中占的比重;(2)優(yōu)化過程中對每類樣本的重建錯誤按其所占比重的倒數(shù)加權(quán)。該算法引入對角矩陣Q,該矩陣中對角線上的元素qu定義了各個樣本向量的重要程度,u=1mqu=1。算法目標(biāo)函數(shù)定義為FQ=u=1mqui=1nViulog2WHiuqu-(WH)

15、iu (9)迭代規(guī)則定義為Wia(WiauquHau)uquViu(WH)iuHau WiaWia/jWja (10)HauHauiWiaViu(WH)iu按照上述迭代規(guī)則進(jìn)行迭代,目標(biāo)函數(shù)達(dá)到局部最大值時算法收斂。b. 重要區(qū)域加權(quán):Blondel等提出的重要區(qū)域加權(quán)算法的加權(quán)目的是使數(shù)據(jù)中的重要區(qū)域被更好地描述。他們的加權(quán)方式是:( 1 )定義數(shù)據(jù)中的重要區(qū)域,根據(jù)數(shù)據(jù)的重要程度確定加權(quán)矩陣;( 2 )在優(yōu)化過程中給重要區(qū)域上的重建錯誤以更多的權(quán)重。C不確定性加權(quán):Wang等人提出的不確定性加權(quán)的加權(quán)目的是消除訓(xùn)練樣本的不確定性對NMF結(jié)果的影響。他們的加權(quán)方式是:( 1 )估計每個訓(xùn)練樣

16、本的每個元素的不確定度; ( 2 )優(yōu)化過程中對每個樣本的每個元素的重建錯誤按其不確定度的倒數(shù)加權(quán)。3)基于分類的NMF算法傳統(tǒng)的NMF算法不帶有任何類別信息,因此加入鑒別性信息的NMF算法對于分類問題很重要。FNMF算法將鑒別信息(類內(nèi)散度和類間散度)作為罰函數(shù)加入傳統(tǒng)的KL散度型目標(biāo)函數(shù)中,最小化類內(nèi)散度和最大化類間散度,從而使分解結(jié)果蘊涵較多的類別信息。實驗結(jié)果表明,F(xiàn)NMF算法性能優(yōu)于LNMF算法。3NMF在音源分離中的簡單建模3.1).單通道模型在STFT域,單信道的混合模型為:xfn=j=1Jsj,fn其中xfn,sj,fn分別是觀測信號和第j個信源信號的短時傅里葉變換系數(shù),J為信

17、源個f=1,F為頻率窗指標(biāo),n=1,N為幀指標(biāo)。定義vfn為混合信號的功率譜,即vfn=xfn2,非負(fù)矩陣分解就是要將FN的矩陣V=vfnfn分解為VV=WH,W,H分別為FK,KN的非負(fù)矩陣。假設(shè)信源的STFT系數(shù)服從零均值的高斯分布,Sj,fnNc(0,vj,fn),vj,fn=W(j)H(j)fn,W(j)和H(j)分別為FKj和KjN的矩陣,以此對第j個信源的分布建立數(shù)學(xué)模型。由線性vfn=jvj,fn可得:W=W(1),W(J),H=H(1)T,H(J)TT。定義目標(biāo)函數(shù)為:C1=fndis(vfn|vfn), (3.1) 其中=W,H。優(yōu)化問題:最小化C1.迭代規(guī)則為: (3.2)

18、得到最優(yōu)化的W,H后,則可以根據(jù)sj,fn=vj,fnvfnxfn得到第j個信源的STFT系數(shù),在經(jīng)過逆STFT變換就可得到第j個信源。3.2).多通道模型在STFT域中,多通道的混合模型表示為xfn=j=1Jaijsj,fn+bi,fn (3.3)表示成矩陣形式為: Xfn=Afsfn+bfn (3.4) 其中Xfn=x1,fn,xI,fnT,sfn=s1,fn,sJ,fnT,bfn=b1,fn,bI,fnT, Af=aij,fijIJ一個關(guān)鍵的要素是將信源j用非負(fù)矩陣Wj和Hj建立FN的功率譜模型也就是|Sj|2WjHj (3.5)給定觀測到的混合信號的STFTs X=xi,fnifn,我

19、們的目標(biāo)是估計信源頻率譜因子Wj,Hjj和混合系統(tǒng)Aff,如figure1所示該問題可以被分為兩個子任務(wù):1)定義合適的估計準(zhǔn)則;2)設(shè)計算法來優(yōu)化這一準(zhǔn)則。在這里,我們采用一種算法,該方法使用期望最大化算法來最大化多通道數(shù)據(jù)的聯(lián)合對數(shù)似然。3.2.1)建模(1)信源讓K且Kjj=1J是K=1,K的不重疊的子集,則可以對信源建立模型sj,fn=kKjck,fn 其中 ck,fnNc(0,wfkhkn) (3.6) Ncx;,=1|exp-x-H-1(x-)這里的sj,fn和ck,fn分別代表“信源”和“成分”,最后得到信源的模型為:sj,fnNc(0,kKjwfkhkn) (3.7)最后我們得

20、到描述信源j的參數(shù)的對數(shù)似然函數(shù)-logpSjWj,Hj=fndIS(sj,fn2|WjHjfn) (3.8)其中 dISxy=xy-logxy-1(2).噪聲一般情況下,我們假設(shè)噪聲模型為bi,fnNc(0,i,f2) (3.9)以及b,f=diag(i,f2) (3)卷積混合模型的改寫根據(jù)建立的信源模型,可以將混合模型改寫為:Xfn=Afcfn+bfn (3.10) 其中cfn=c1,fn,cK,fnT,Af是所謂的“增大混合矩陣”,其維數(shù)為IK,當(dāng)且僅當(dāng)kKj時其元素aik,f=aij,f。3.3.一種多通道NMF算法首先,令=A,W,H,b為所有參數(shù)的集合,A是IJF的矩陣,W為FK的

21、矩陣,H為KN的矩陣,b是噪聲協(xié)方差參數(shù)。ML算法的目標(biāo)函數(shù)為C1=fntrace(XfnXfnHx,fn-1)+logdetx,fn (3.11)其中x,fn=Afs,fnAfH+b,f 以及s,fn=diag(pj,fnj),通過最小化上式可以得到相應(yīng)的參數(shù),從而實現(xiàn)分離。然而該準(zhǔn)則得到的參數(shù)會發(fā)生明顯的大小、相位和排列順序的不確定性。后來研究者們提出了一種基于完備數(shù)據(jù)集的X,C的EM算法。其定義了一個概率密度函數(shù)p(X,C|)和數(shù)據(jù)集Rxx,f,Rxs,f,Rss,f,k,fnknf稱為自然統(tǒng)計量Rxx,f=1NnxfnxfnH, Rxs,f=1NnxfnsfnH Rss,f=1NnsfnsfnH, k,fn=|ck,fn| 2 該算法在E步根據(jù)當(dāng)前的參數(shù)計算自然統(tǒng)計量的期望,在M步通過最大化完備數(shù)據(jù)集的對數(shù)似然Q=logp(X,C|)p(C|X,)dC來更新參數(shù)集。具體步驟如下:在E步計算條件期望:在M步更新參數(shù)信源重構(gòu):在求的最優(yōu)的參數(shù)后,就可以利用維納濾波來得到信源STFT值的最小均方誤差估計值。時域信號可以通過逆STFT變換得到。4. 實驗仿真實驗所用的數(shù)據(jù)是合成立體聲信號,由三個信源卷積混合而成,分別是鼓,主唱和鋼琴。通過合成房間脈沖響應(yīng)對靜態(tài)信源進(jìn)行濾波,通過Roomsim工具箱模擬一對無指向的麥克風(fēng)得到合成卷積信號。卷積合成

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論