獨(dú)立成分分析IndependentComponentAnalysis(ICA)

上傳人：闖*** IP屬地：廣東上傳時(shí)間：2021-11-30 格式：PPT 頁數(shù)：31 大?。?73KB 積分：25 舉報(bào) 版權(quán)申訴

獨(dú)立成分分析IndependentComponentAnalysis(ICA)_第2頁

獨(dú)立成分分析IndependentComponentAnalysis(ICA)_第3頁

獨(dú)立成分分析IndependentComponentAnalysis(ICA)_第4頁

獨(dú)立成分分析IndependentComponentAnalysis(ICA)_第5頁

已閱讀5頁，還剩26頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、.獨(dú)立成分分析Independent Component Analysis（ICA）齊娟 2007-5-29.主要內(nèi)容 ICA定義 ICA模型 ICA原理 ICA算法 ICA應(yīng)用 PCA&ICA.ICA定義定義一：利用很少的先驗(yàn)知識將混合信息分離成獨(dú)立分量的一種重要方法。定義二：找到事物的一種合理表示，使得各分量最大化地獨(dú)立。 20世紀(jì)八十年代才被提出。 .cocktail-party problem 例子：cocktail-party problemSourcesObservationss1s2x1x2Mixing matrix Ax = Asn sources, m=n ob

2、servations.cocktail-party problemTwo Independent SourcesMixture at two Mics22212122121111)()(sasatxsasatx. xj = aj1s1 + aj2s2 + . + ajnsn, 對于每一個(gè) jx = As 條件：s和A均是未知的，只有x已知目標(biāo): 通過x估計(jì)出A和s 每一個(gè)si成分統(tǒng)計(jì)獨(dú)立限制：每一個(gè)成分都不是Gaussian分布（實(shí)際上未知）混合矩陣A為方陣且可逆（這個(gè)限制可以放松）結(jié)論：估計(jì)出A之后，我們就可以得到s（s= A-1x）.Ambiguities of ICAls和A均

3、是未知的，s乘一個(gè)標(biāo)量k，總可以用A乘以 1/k所抵消，即不能唯一確定s和A。作如下約束：lS中各個(gè)分量的次序不確定21iE s.Illustration of ICA統(tǒng)計(jì)意義下說明xAsoxA sS各分量相互獨(dú)立x各分量不相互獨(dú)立判斷方法：能否從一個(gè)分量估計(jì)出另一分量的值。邊的方向即A0列向量。.Illustration of ICA 通過x的統(tǒng)計(jì)性質(zhì)，作一些假設(shè)的條件下,可以估計(jì)出A和s. 獨(dú)立：兩個(gè)隨機(jī)變量y1和y2是相互獨(dú)立的，如果y1的值不能為y2提供任何信息，反之亦成立。用概率密度函數(shù)描述：性質(zhì)：給定兩函數(shù)h1和h2有：不相關(guān)：兩隨機(jī)變量是不相關(guān)的，如果獨(dú)立的肯定不相關(guān)，不

4、相關(guān)的未必獨(dú)立，即獨(dú)立是比不相關(guān)更強(qiáng)的約束。121122(,)()()p y yp y py11221122 ()() () ()E h y h yE h yE h y1212 E y yE y E y. 在假設(shè)條件中，各分量不允許是Gaussian分布 X1和x2都是標(biāo)準(zhǔn)Gaussian分布，聯(lián)合概率密度函數(shù)：沒有邊緣信息，即不包含A的列向量的信息。2212121( ,)exp22xxp x x. 根據(jù)中心極限定理，獨(dú)立隨機(jī)變量的和在一定條件下趨近于高斯分布。即獨(dú)立隨機(jī)變量的和比原獨(dú)立隨機(jī)變量更接近高斯分布。可以認(rèn)為越具有高斯性，其獨(dú)立性越差反之， non-Gaussianity越強(qiáng)

5、，獨(dú)立性越強(qiáng). ICA 模型：x = As s=A-1x 令y=wTx.z=ATw, 則 y=wTx=wT As=zTs 這樣的話y 是s的線性組合，y應(yīng)該比s更具有高斯性，除非wT接近A-1。此時(shí)，y=wTx=A-1x=s。也就是說y=s時(shí)，y具有最大非高斯性。問題轉(zhuǎn)化為求解w，它最大化wTx的non-Gaussianity性。 ICA 數(shù)值優(yōu)化問題。.non-Gaussianity的度量為了在ICA估計(jì)中使用non-Gaussianity，我們必須有一個(gè)對它的定性度量。常用的有三種： Kurtosis Negentropy Approximations of negentropy.

6、Kurtosis定義：y為隨機(jī)變量，則對于高斯分布， Kurtosis為零，大部分非高斯分布 Kurtosis不為零。性質(zhì)：優(yōu)點(diǎn)：計(jì)算和理論簡單缺點(diǎn)：對outliers敏感，不具有魯棒性.Negentropyl 基于信息論中熵的概念l 定理：在所有隨機(jī)變量，高斯分布的變量有最大熵。l 定義Negentropy J為：yGauss是和y有相同協(xié)方差矩陣的高斯隨機(jī)變量。y為高斯分布時(shí)， Negentropy為零，其它分布時(shí)不為零。l 計(jì)算起來太復(fù)雜，需要引入其近似值。.Negentropy的近似l 經(jīng)典近似：和Kurtosis有同樣的缺點(diǎn)：不魯棒。l 另一種近似：V是均值為零，方差為1的高斯隨機(jī)變

7、量，G是非二次函數(shù)常取為：計(jì)算簡單快速，而且具有魯棒性。后面介紹的算法即采用此種近似。 22311( )1248J yE ykurt y2( )( )( )J yc E G yE G v1111( )logcosG ua ua22()e x p2uGu .預(yù)處理Centering 為了使算法更簡單，一般會(huì)在采用具體算法前進(jìn)行預(yù)處理。 Centering：使x變?yōu)榫禐榱愕碾S機(jī)變量，減去m=Ex即可。純粹為了簡化計(jì)算，估計(jì)完A后，可以將s的均值補(bǔ)償回去。s的均值向量為A1 s。.預(yù)處理whitening對x進(jìn)行線性變化，使變換后的x是white的，即各分量不相關(guān)且，I為單位矩陣。方法：特征值

8、分解（EVD）變換后A為正交矩陣A：根據(jù)正交矩陣性質(zhì)，正交矩陣自由度為n(n-1)/2，將需要估計(jì)的矩陣系數(shù)減少了一半。TExxI TTE x xEDE1/2TxEDE x1TTTTEx xA EssAA A.小結(jié) 前面給出了測量函數(shù)，也已證明ICA問題實(shí)際上就是求解函數(shù)的最值問題。現(xiàn)在需要的是求解最值的優(yōu)化算法。有很多，梯度下降法，EM算法等。應(yīng)用最廣泛的為FastICA算法，它基于固定點(diǎn)迭代的方法.補(bǔ)充：固定點(diǎn)迭代法用于求解方程（線性、非線性、差分）函數(shù)的固定點(diǎn)：函數(shù)g(x)的固定點(diǎn)是數(shù)p，如果p=g(p)幾何上的表述是Y=g(x)和Y=x的交點(diǎn)固定點(diǎn)迭代：選擇初始值p0，然后將函數(shù)

9、迭代作用于自身的輸出，直到輸入和輸出差別很小為止。 p1=g(p0) p2=g(p1) . pn=g(pn) .FastICA算法(一個(gè)分量） FastICA算法目前應(yīng)用最為廣泛。采用度量函數(shù)為：基于固定點(diǎn)迭代的方法找到WTx度量函數(shù)的最大值。隨機(jī)選擇初始向量W 令：令：如果不收斂，轉(zhuǎn)到2 2( )( )( )J yc E G yE G v()()TTWE xg W xE g W xw/ |WWW.FastICA算法(多個(gè)分量）使用上面的算法可以求出一個(gè)獨(dú)立分量，重復(fù)使用上面的算法即可求出多個(gè)獨(dú)立分量，為避免所有調(diào)用趨近一個(gè)值，需充分利用獨(dú)立性的特點(diǎn)，在此使用的是輕級獨(dú)立性不相關(guān)。類

10、似于Gram-Schmidt正交化得到前q個(gè)向量w1.w2.wp后，再次調(diào)用上算法得到wp1令：令： 1111pTpppjjjWWWW W1111/TppppWWWW.擴(kuò)展 ICA模型前面只給出了經(jīng)典ICA模型，實(shí)際現(xiàn)在發(fā)展起來很多模型，如噪聲模型，非線性模型等等。 ICA 方法前面解決ICA的方法是，最大化non-Gaussianity度量函數(shù)，轉(zhuǎn)化為數(shù)值優(yōu)化問題。除了non-Gaussianity度量函數(shù)外，還有很多其它函數(shù)如互信息量，也有各種不同的優(yōu)化算法，梯度、EM等。其實(shí)所有的ICA算法可以表示為： ICA算法 = 度量函數(shù) + 優(yōu)化算法.應(yīng)用聲音源分離 (”cocktail-

11、party problem”) 生物信號處理經(jīng)濟(jì)及其它時(shí)間序列無線通信，如CDMA 特征提取.應(yīng)用生物信號處理。如EEG(腦電圖）將一些電極放在頭皮上記錄腦的活動(dòng)。一些人為動(dòng)作會(huì)造成噪聲（如眨眼、張嘴等）。ICA可以用于去除這些噪聲。經(jīng)濟(jì)及其它時(shí)間序列。對于一些并列的序列，如外匯兌換和股票交易，可能有相同的潛在因素，一些連鎖店的銷售情況可能有共同的影響因素，如假期。.無線通信CDMA (Code Division Multiple Access)碼分多路復(fù)用 3G標(biāo)準(zhǔn)之一。用戶共享相同的帶寬，同時(shí)傳送信號。CDMA通信系統(tǒng)給每個(gè)用戶分配一個(gè)唯一的光正交碼的碼字作為該用戶的地址碼，但由

12、于傳輸?shù)奶攸c(diǎn)會(huì)喪失正交性。如何恢復(fù)原信號。信道用戶用戶.特征提取x=As ,如果我們把A的每一列Ai 當(dāng)作一個(gè)特征，s是系數(shù)向量，則可以用于特征提取。很多人臉識別的方法是使用統(tǒng)計(jì)方法得到一些基圖像，人臉被認(rèn)為是這些基圖像的線性組合，多用PCA得到這些基圖像。有人將其用于人臉識別，代替PCA做特征提取，發(fā)現(xiàn)識別效果要好。研究標(biāo)明ICA提取的特征和人的大腦皮層感知的特征很相近。在數(shù)據(jù)壓縮和模式識別中應(yīng)用很廣。i ixAs.多媒體中的應(yīng)用MediumTopicImage/VideoFeature extraction, noise reductionWatermark detectionConte

13、nt based retrievalAudioAuditory perceptionSource separation, scene analysisTextDocument filtering, retrievalCombined mediaCross-language document retrievalCombined text/image content extractionAudio-visual segmentation.PCA&ICA兩者都是線性變換都可以看作一些分量的組合。不同的是 PCA而言，各分量不相關(guān) ICA而言，各分量獨(dú)立PCA的目的是找到這樣一組分量表示，使得重構(gòu)誤差最小，即最能代表原事物的特征。ICA的目的是找到這樣一組分量表示，使得個(gè)分量最大化獨(dú)立，能夠發(fā)現(xiàn)一些隱藏因素。ICA是PCA的增強(qiáng)

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

獨(dú)立成分分析IndependentComponentAnalysis(ICA)

文檔簡介

溫馨提示

最新文檔

評論

獨(dú)立成分分析IndependentComponentAnalysis(ICA)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔