![混合高斯模型(Mixtures-of-Gaussians)和EM算法_第1頁(yè)](http://file4.renrendoc.com/view5/M00/02/0D/wKhkGGZo8pWAahpRAABEgrc8l1M562.jpg)
![混合高斯模型(Mixtures-of-Gaussians)和EM算法_第2頁(yè)](http://file4.renrendoc.com/view5/M00/02/0D/wKhkGGZo8pWAahpRAABEgrc8l1M5622.jpg)
![混合高斯模型(Mixtures-of-Gaussians)和EM算法_第3頁(yè)](http://file4.renrendoc.com/view5/M00/02/0D/wKhkGGZo8pWAahpRAABEgrc8l1M5623.jpg)
![混合高斯模型(Mixtures-of-Gaussians)和EM算法_第4頁(yè)](http://file4.renrendoc.com/view5/M00/02/0D/wKhkGGZo8pWAahpRAABEgrc8l1M5624.jpg)
![混合高斯模型(Mixtures-of-Gaussians)和EM算法_第5頁(yè)](http://file4.renrendoc.com/view5/M00/02/0D/wKhkGGZo8pWAahpRAABEgrc8l1M5625.jpg)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
混合高斯模型(Mixtures-of-Gaussians)和EM算法混合高斯模型(MixturesofGaussians)和EM算法
這篇討論使用期望最大化算法(Expectation-Maximization)來(lái)進(jìn)行密度估計(jì)(densityestimation)。
與k-means一樣,給定的訓(xùn)練樣本是,我們將隱含類別標(biāo)簽用表示。與k-means的硬指定不同,我們首先認(rèn)為是滿足一定的概率分布的,這里我們認(rèn)為滿足多項(xiàng)式分布,,其中,有k個(gè)值{1,…,k}可以選取。而且我們認(rèn)為在給定后,滿足多值高斯分布,即。由此可以得到聯(lián)合分布。
整個(gè)模型簡(jiǎn)單描述為對(duì)于每個(gè)樣例,我們先從k個(gè)類別中按多項(xiàng)式分布抽取一個(gè),然后根據(jù)所對(duì)應(yīng)的k個(gè)多值高斯分布中的一個(gè)生成樣例,。整個(gè)過(guò)程稱作混合高斯模型。注意的是這里的仍然是隱含隨機(jī)變量。模型中還有三個(gè)變量和。最大似然估計(jì)為。對(duì)數(shù)化后如下:
這個(gè)式子的最大值是不能通過(guò)前面使用的求導(dǎo)數(shù)為0的方法解決的,因?yàn)榍蟮慕Y(jié)果不是closeform。但是假設(shè)我們知道了每個(gè)樣例的,那么上式可以簡(jiǎn)化為:
這時(shí)候我們?cè)賮?lái)對(duì)和進(jìn)行求導(dǎo)得到:
就是樣本類別中的比率。是類別為j的樣本特征均值,是類別為j的樣例的特征的協(xié)方差矩陣。實(shí)際上,當(dāng)知道后,最大似然估計(jì)就近似于高斯判別分析模型(Gaussiandiscriminantanalysismodel)了。所不同的是GDA中類別y是伯努利分布,而這里的z是多項(xiàng)式分布,還有這里的每個(gè)樣例都有不同的協(xié)方差矩陣,而GDA中認(rèn)為只有一個(gè)。
之前我們是假設(shè)給定了,實(shí)際上是不知道的。那么怎么辦呢?考慮之前提到的EM的思想,第一步是猜測(cè)隱含類別變量z,第二步是更新其他參數(shù),以獲得最大的最大似然估計(jì)。用到這里就是:循環(huán)下面步驟,直到收斂:{
(E步)對(duì)于每一個(gè)i和j,計(jì)算
(M步),更新參數(shù):
}
對(duì)應(yīng)于上述問(wèn)題,Y是,X是,是,g是到的映射。這樣解釋了式子(2)中的期望,再根據(jù)凹函數(shù)時(shí)的Jensen不等式:
可以得到(3)。
這個(gè)過(guò)程可以看作是對(duì)求了下界。對(duì)于的選擇,有多種可能,那種更好的?假設(shè)已經(jīng)給定,那么的值就決定于和了。我們可以通過(guò)調(diào)整這兩個(gè)概率使下界不斷上升,以逼近的真實(shí)值,那么什么時(shí)候算是調(diào)整好了呢?當(dāng)不等式變成等式時(shí),說(shuō)明我們調(diào)整后的概率能夠等價(jià)于了。按照這個(gè)思路,我們要找到等式成立的條件。根據(jù)Jensen不等式,要想讓等式成立,需要讓隨機(jī)變量變成常數(shù)值,這里得到:
c為常數(shù),不依賴于。對(duì)此式子做進(jìn)一步推導(dǎo),我們知道,那么也就有,(多個(gè)等式分子分母相加不變,這個(gè)認(rèn)為每個(gè)樣例的兩個(gè)概率比值都是c),那么有下式:
至此,我們推出了在固定其他參數(shù)后,的計(jì)算公式就是后驗(yàn)概率,解決了如何選擇的問(wèn)題。這一步就是E步,建立的下界。接下來(lái)的M步,就是在給定后,調(diào)整,去極大化的下界(在固定后,下界還可以調(diào)整的更大)。那么一般的EM算法的步驟如下:循環(huán)重復(fù)直到收斂{
(E步)對(duì)于每一個(gè)i,計(jì)算
(M步)計(jì)算
那么究竟怎么確保EM收斂?假定和是EM第t次和t+1次迭代后的結(jié)果。如果我們證明了,也就是說(shuō)極大似然估計(jì)單調(diào)增加,那么最終我們會(huì)到達(dá)最大似然估計(jì)的最大值。下面來(lái)證明,選定后,我們得到E步
這一步保證了在給定時(shí),Jensen不等式中的等式成立,也就是
然后進(jìn)行M步,固定,并將視作變量,對(duì)上面的求導(dǎo)后,得到,這樣經(jīng)過(guò)一些推導(dǎo)會(huì)有以下式子成立:
解釋第(4)步,得到時(shí),只是最大化,也就是的下界,而沒有使等式成立,等式成立只有是在固定,并按E步得到時(shí)才能成立。
況且根據(jù)我們前面得到的下式,對(duì)于所有的和都成立
第(5)步利用了M步的定義,M步就是將調(diào)整到,使得下界最大化。因此(5)成立,(6)是之前的等式結(jié)果。
這樣就證明了會(huì)單調(diào)增加。一種收斂方法是不再變化,還有一種就是變化幅度很小。
再次解釋一下(4)、(5)、(6)。首先(4)對(duì)所有的參數(shù)都滿足,而其等式成立條件只是在固定,并調(diào)整好Q時(shí)成立,而第(4)步只是固定Q,調(diào)整,不能保證等式一定成立。(4)到(5)就是M步的定義,(5)到(6)是前面E步所保證等式成立條件。也就是說(shuō)E步會(huì)將下界拉到與一個(gè)特定值(這里)一樣的高度,而此時(shí)發(fā)現(xiàn)下界仍然可以上升,因此經(jīng)過(guò)M步后,下界又被拉升,但達(dá)不到與另外一個(gè)特定值一樣的高度,之后E步又將下界拉到與這個(gè)特定值一樣的高度,重復(fù)下去,直到最大值。
如果我們定義
從前面的推導(dǎo)中我們知道,EM可以看作是J的坐標(biāo)上升法,E步固定,優(yōu)化,M步固定優(yōu)化。3.重新審視混合高斯模型
我們已經(jīng)知道了EM的精髓和推導(dǎo)過(guò)程,再次審視一下混合高斯模型。之前提到的混合高斯模型的參數(shù)和計(jì)算公式都是根據(jù)很多假定得出的,有些沒有說(shuō)明來(lái)由。為了簡(jiǎn)單,這里在M步只給出和的推導(dǎo)方法。E步很簡(jiǎn)單,按照一般EM公式得到:
簡(jiǎn)單解釋就是每個(gè)樣例i的隱含類別為j的概率可以通過(guò)后驗(yàn)概率計(jì)算得到。
在M步中,我們需要在固定后最大化最大似然估計(jì),也就是
這是將的k種情況展開后的樣子,未知參數(shù)和。
固定和,對(duì)求導(dǎo)得
等于0時(shí),得到
這就是我們之前模型中的的更新公式。
然后推導(dǎo)的更新公式??粗暗玫降?/p>
在和確定后,分子上面的一串都是常數(shù)了,實(shí)際上需要優(yōu)化的公式是:
需要知道的是,還需要滿足一定的約束條件就是。
這個(gè)優(yōu)化問(wèn)題我們很熟悉了,直接構(gòu)造拉格朗日乘子。
還有一點(diǎn)就是,但這一點(diǎn)會(huì)在得到的公式里自動(dòng)滿足。
求導(dǎo)得,
等于0,得到
也就是說(shuō)再次使用,得到
這樣就神奇地得到了。
那么就順勢(shì)得到M步中的更新公式:
的推導(dǎo)也類似,不過(guò)稍微復(fù)雜一些,畢竟是矩陣。結(jié)果在之前的混合高斯模型中已經(jīng)給出。4.總結(jié)
如果將樣本看作觀察值,潛在類別看作是隱藏變量,那么聚類問(wèn)題也就是參數(shù)估計(jì)問(wèn)題,只不過(guò)聚類問(wèn)題中參數(shù)分為隱含類別變量和其他參數(shù),這猶如在x-y坐標(biāo)系中找一個(gè)曲線的極值,然而曲線函數(shù)不能直接求導(dǎo),因此什么梯度下降方法就不適用了。但固定一個(gè)變量后,另外一個(gè)可以通過(guò)求導(dǎo)得到,因此可以使用坐標(biāo)上升法,一次固定一個(gè)變量,對(duì)另外的求極值,最后逐步逼近極值。對(duì)應(yīng)到EM上,E步估計(jì)隱含變量,M步估計(jì)其他參數(shù),交替將極值推向最大。EM中還有“硬”指定和“軟”指定的概念,“軟”指定看似更為合理,但計(jì)算量要大,“硬”指定在某些場(chǎng)合如K-means中更為實(shí)用(要是保持一個(gè)樣本點(diǎn)到其他所有中心的概率,就會(huì)很麻煩)。
另外,EM的收斂性證明方法確實(shí)很牛,能夠利用log的凹函數(shù)性質(zhì),還能夠想到利用創(chuàng)造下界,拉平函數(shù)下界,優(yōu)化下界的方法來(lái)逐步逼近極大值。而且每一步迭代都能保證是單調(diào)的。最重要的是證明的數(shù)學(xué)公式非常精妙,硬是分子分母都乘以z的概率變成期望來(lái)套上Jensen不等式,前人都是怎么想到
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 金屬鋼絲骨架施工方案
- 石家莊工程圍墻施工方案
- 蘇科版數(shù)學(xué)七年級(jí)上冊(cè)2.5《有理數(shù)的加法與減法》(第4課時(shí))聽評(píng)課記錄
- 關(guān)于投資協(xié)議書范本5篇
- 部編版八年級(jí)歷史上冊(cè)《第2課 第二次鴉片戰(zhàn)爭(zhēng)》聽課評(píng)課記錄
- 2025年度生物科技研發(fā)與產(chǎn)業(yè)化合作協(xié)議
- 2025年度勞動(dòng)爭(zhēng)議經(jīng)濟(jì)補(bǔ)償協(xié)議書模板編制與法律咨詢合同
- 2025年度能源公司股東與子公司間并購(gòu)資金借款合同
- 2025年度互換商鋪的租賃合同范本
- 江蘇省沭陽(yáng)縣八年級(jí)地理下冊(cè) 5.3青藏地區(qū)和西北地區(qū)說(shuō)課稿 (新版)湘教版
- 藥品集采培訓(xùn)課件
- 股骨干骨折教學(xué)演示課件
- 高中物理考試成績(jī)分析報(bào)告
- 動(dòng)靜脈內(nèi)瘺血栓
- 部編版小學(xué)語(yǔ)文三年級(jí)上冊(cè)同步練習(xí)試題含答案(全冊(cè))
- 朗誦《詩(shī)頌風(fēng)華》
- 血性胸水的護(hù)理課件
- 醫(yī)共體人財(cái)物管理系統(tǒng)需求說(shuō)明
- 臨時(shí)占用城市道路申請(qǐng)表
- 四年級(jí)數(shù)學(xué)下冊(cè)口算天天練45
- 雕塑采購(gòu)?fù)稑?biāo)方案(技術(shù)標(biāo))
評(píng)論
0/150
提交評(píng)論