人工智能經(jīng)典電子書5.支持向量機(jī)-SMO算法實(shí)現(xiàn)

上傳人：w*** IP屬地：浙江上傳時間：2024-11-20 格式：PPT 頁數(shù)：45 大小：3.79MB 積分：12 舉報 版權(quán)申訴

人工智能經(jīng)典電子書5.支持向量機(jī)-SMO算法實(shí)現(xiàn)_第2頁

人工智能經(jīng)典電子書5.支持向量機(jī)-SMO算法實(shí)現(xiàn)_第3頁

人工智能經(jīng)典電子書5.支持向量機(jī)-SMO算法實(shí)現(xiàn)_第4頁

人工智能經(jīng)典電子書5.支持向量機(jī)-SMO算法實(shí)現(xiàn)_第5頁

已閱讀5頁，還剩40頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

SMO算法內(nèi)容提要線性可分支持向量機(jī)線性不可分支持向量機(jī)支持向量機(jī)回歸實(shí)現(xiàn)策略多分類報告內(nèi)容SVM簡介求解算法-SMO優(yōu)化算法多分類問題系統(tǒng)演示SeparatingSurface:A+A-SVM算法特點(diǎn)SVM有如下主要幾個特點(diǎn)：(1)非線性映射是SVM方法的理論基礎(chǔ),SVM利用內(nèi)積核函數(shù)代替向高維空間的非線性映射；(2)對特征空間劃分的最優(yōu)超平面是SVM的目標(biāo),最大化分類邊際的思想是SVM方法的核心；(3)支持向量是SVM的訓(xùn)練結(jié)果,在SVM分類決策中起決定作用的是支持向量。因此，模型需要存儲空間小，算法魯棒性強(qiáng)；(4)無序任何前提假設(shè)，不涉及概率測度；(1)SVM算法對大規(guī)模訓(xùn)練樣本難以實(shí)施由于SVM是借助二次規(guī)劃來求解支持向量，而求解二次規(guī)劃將涉及m階矩陣的計算（m為樣本的個數(shù)），當(dāng)m數(shù)目很大時該矩陣的存儲和計算將耗費(fèi)大量的機(jī)器內(nèi)存和運(yùn)算時間。針對以上問題的主要改進(jìn)有有J.Platt的SMO算法、T.Joachims的SVM、C.J.C.Burges等的PCGC、張學(xué)工的CSVM以及O.L.Mangasarian等的SOR算法(2)用SVM解決多分類問題存在困難經(jīng)典的支持向量機(jī)算法只給出了二類分類的算法，而在數(shù)據(jù)挖掘的實(shí)際應(yīng)用中，一般要解決多類的分類問題?？梢酝ㄟ^多個二類支持向量機(jī)的組合來解決。主要有一對多組合模式、一對一組合模式和SVM決策樹；再就是通過構(gòu)造多個分類器的組合來解決。主要原理是克服SVM固有的缺點(diǎn)，結(jié)合其他算法的優(yōu)勢，解決多類問題的分類精度。如：與粗集理論結(jié)合，形成一種優(yōu)勢互補(bǔ)的多類問題的組合分類器。問題提出線性可分的分類問題：（令黑色的點(diǎn)=-1，白色的點(diǎn)=+1）所以當(dāng)有一個新的點(diǎn)x需要預(yù)測屬于哪個分類的時候，我們用sgn(f(x))，就可以預(yù)測了，sgn表示符號函數(shù)，當(dāng)f(x)>0的時候，sgn(f(x))=+1,當(dāng)f(x)<0的時候sgn(f(x))=–1。+1-1我們怎樣才能取得一個最優(yōu)的劃分直線f(x)呢？最大距離MaximumMarginal選擇使得間隙最大的函數(shù)作為分割平面是由很多道理的，比如說從概率的角度上來說，就是使得置信度最小的點(diǎn)置信度最大（聽起來很拗口），從實(shí)踐的角度來說，這樣的效果非常好，等等。最大距離f(x)=wx+b=0wx+b=1wx+b=-1(x,y)M目標(biāo)函數(shù)：等價于：因?yàn)閱握{(diào)，并且為了計算方便：求解問題數(shù)據(jù)集合：優(yōu)化目標(biāo)：x，y為已知數(shù)求解建立拉格朗日公式：求偏導(dǎo)數(shù)：求解：對偶問題求解將兩式帶回L(w,b,a)得到對偶問題的表達(dá)式求解問題數(shù)據(jù)集合：優(yōu)化目標(biāo)：x，y為已知數(shù)核函數(shù)線性不可分的情況我們可以為分錯的點(diǎn)加上一點(diǎn)懲罰，對一個分錯的點(diǎn)的懲罰函數(shù)就是這個點(diǎn)到其正確位置的距離：軟間隔C-SVMC是一個由用戶去指定的系數(shù)，表示對分錯的點(diǎn)加入多少的懲罰，當(dāng)C很大的時候，分錯的點(diǎn)就會更少，但是過擬合的情況可能會比較嚴(yán)重，當(dāng)C很小的時候，分錯的點(diǎn)可能會很多，不過可能由此得到的模型也會不太正確軟支持向量機(jī)求解構(gòu)造拉格朗日公式：求偏導(dǎo)數(shù)：求解問題數(shù)據(jù)集合：優(yōu)化目標(biāo)：其中C為人為設(shè)定，x，y為已知數(shù)問題？實(shí)際上在處理大型問題時，由于存儲和計算兩方面的要求，這些算法往往會失效。這些算法都要存儲與訓(xùn)練集相應(yīng)的核矩陣，然而存儲核矩陣所需要的內(nèi)存是隨著訓(xùn)練集中訓(xùn)練點(diǎn)數(shù)L的平凡增長的。例如，當(dāng)訓(xùn)練點(diǎn)數(shù)目超過4000時，存儲核函數(shù)矩陣需要多達(dá)128兆。求解方法：坐標(biāo)上升法固定除之外的所有參數(shù)，這時W可看作只是關(guān)于的函數(shù)，那么直接對求導(dǎo)優(yōu)化即可?？梢酝ㄟ^更改優(yōu)化順序來使W能夠更快地增加并收斂。如果W在內(nèi)循環(huán)中能夠很快地達(dá)到最優(yōu)，那么坐標(biāo)上升法會是一個很高效的求極值方法。問題？固定以外的所有參數(shù)，那么將不再是變量（可以由其他值推出），因?yàn)閱栴}中規(guī)定了因此，我們最少一次需要選取兩個參數(shù)做優(yōu)化，比如

和，此時可以由和其他參數(shù)表示出來。=>SMO算法SMO算法由MicrosoftResearch的JohnC.Platt在1998年提出，并成為最快的二次規(guī)劃優(yōu)化算法，特別針對線性SVM和數(shù)據(jù)稀疏時性能更優(yōu)。第一步選取一對參數(shù)，選取方法使用啟發(fā)式方法（Maximalviolatingpair）。第二步，固定除被選取的參數(shù)之外的其他參數(shù)，確定W極值。SMO算法設(shè)我們選取了初始值滿足了問題中的約束條件。接下來，我們固定其余參數(shù)，這樣W就是和的函數(shù)。并且和滿足條件：由于其余參數(shù)都是已知固定，因此為了方便，可將等式右邊標(biāo)記成實(shí)數(shù)值。SMO算法進(jìn)而其中：目標(biāo)函數(shù)：求偏導(dǎo)：帶入w,v：求得：參數(shù)的求解最終參數(shù)的解為：其中：和？a的取值范圍當(dāng)a1和a2異號時，也就是一個為1，一個為-1時，他們可以表示成一條直線，斜率為1。如下圖：橫軸是

，縱軸是

，

和

既要在矩形方框內(nèi)，也要在直線上，因此同理，當(dāng)和同號時a2a1CCa1-a2=E(0,-E)(C,C-E){{參數(shù)求解參數(shù)計算：參數(shù)b計算：？b的求解設(shè)在界內(nèi)，則有，帶入上式得：兩邊同乘以，得b的求解在界內(nèi)，則在界內(nèi)，則、都在界內(nèi)，則情況1和情況2的B值相等，任取一個；都不在界內(nèi)，則取值為情況1和情況2之間的任意值。問題？算法如何終止？對于SMO算法，其中的兩個參數(shù)如何選擇呢？隨機(jī)？啟發(fā)式規(guī)則一個自然的想法是那些違反KKT最嚴(yán)重的點(diǎn)，他們對間距貢獻(xiàn)最大，因此可以通過該啟發(fā)規(guī)則來完成調(diào)整參數(shù)的選取。（并且此種啟發(fā)規(guī)則

人人文庫> 全部分類> 應(yīng)用文書 > 研究報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

人工智能經(jīng)典電子書5.支持向量機(jī)-SMO算法實(shí)現(xiàn)

文檔簡介

溫馨提示

最新文檔

評論

人工智能經(jīng)典電子書5.支持向量機(jī)-SMO算法實(shí)現(xiàn)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔