![用糾錯(cuò)編碼改進(jìn)Mry支持向量機(jī)多類分類算法_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/28/17aeddee-8a5c-4541-a047-2951061a9856/17aeddee-8a5c-4541-a047-2951061a98561.gif)
![用糾錯(cuò)編碼改進(jìn)Mry支持向量機(jī)多類分類算法_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/28/17aeddee-8a5c-4541-a047-2951061a9856/17aeddee-8a5c-4541-a047-2951061a98562.gif)
![用糾錯(cuò)編碼改進(jìn)Mry支持向量機(jī)多類分類算法_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/28/17aeddee-8a5c-4541-a047-2951061a9856/17aeddee-8a5c-4541-a047-2951061a98563.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、用糾錯(cuò)編碼改進(jìn)的 M-ry 支持向量機(jī)多類分類算法摘要:針對(duì)m-ary支持向量機(jī)(svm)多類分類算法結(jié)構(gòu)簡單,但泛 化能力較弱的特點(diǎn) , 提出了與糾錯(cuò)編碼理論相結(jié)合的改進(jìn)的 m-ary svm算法。首先,將原始類別信息編碼作為信息碼;然后結(jié)合糾錯(cuò)編 碼理論及期望的糾錯(cuò)能力 , 產(chǎn)生一定程度上性能最佳的編碼 , 作為 分類器訓(xùn)練的依據(jù) ; 最后, 對(duì)于識(shí)別階段輸出編碼中的錯(cuò)誤分類利 用檢錯(cuò)糾錯(cuò)原理進(jìn)行校正。實(shí)驗(yàn)結(jié)果表明 , 改進(jìn)的算法通過引入盡 可能少的冗余子分類器增強(qiáng)了標(biāo)準(zhǔn) m-ary svm 多類分類算法的性 能。關(guān)鍵詞:m-ary;支持向量機(jī);糾錯(cuò)編碼;多類分類;最小碼間距離;輸 出校正
2、碼enhanced m-ary support vector machine byerror correction coding for multi-category classification 英文作者名 bao jian, liu ran* 英文地址 (school of computer science, hangzhou dianzi university, hangzhou zhejiang 310018, china) abstract: m-ary support vector machine (m-ary svm) for multi-category classificat
3、ion has the advantage of simple structure, but the disadvantage of weak generalization ability. this paper presented an enhanced m-ary svm algorithm in combination with error correction coding theory. the main idea of the approach was to generate a group of best codesbased on information codes deriv
4、ed from the original category flags information, then utilize such codes as the basis for training the classifier, while in the final feed-forward phase the output codes composedof each sub-classifier could be corrected by error detection and correction principle if there exists any identifying erro
5、r. the experimental results confirm the effectiveness of the improved algorithm brought about by introducing as few sub-classifiers as possible. key words: m-ary; support vector machine (svm); error correction coding; multi-category classification; minimum code distance; output correction code0 引言 作
6、為機(jī)器學(xué)習(xí)實(shí)現(xiàn)方法之一的統(tǒng)計(jì)學(xué)習(xí)理論 (statistical learning theory, slt), 以及基于此理論的支持向量機(jī) 1-2(support vector machine, svm) 憑借其顯著的性能優(yōu)勢(shì) , 近 年來得到廣大研究人員的關(guān)注 ,并已取得了大量的研究成果 , 而此 前作為研究熱點(diǎn)的人工神經(jīng)網(wǎng)絡(luò) (artificial neural networks, ann)雖然在工程實(shí)踐中得到廣泛的應(yīng)用,但由于其建立在大數(shù)定理 的漸近理論之上 , 要求學(xué)習(xí)樣本足夠多 , 且容易陷入局部極值或過 學(xué)習(xí)的困境,并且在實(shí)際應(yīng)用中隱含層的層數(shù)及每層神經(jīng)元數(shù)目如 何確定仍無規(guī)律可循
7、, 只能憑借使用者的經(jīng)驗(yàn)進(jìn)行實(shí)驗(yàn)試湊。正是 由于神經(jīng)網(wǎng)絡(luò)自身存在的這些不足 , 導(dǎo)致了支持向量機(jī)算法研究的興起標(biāo)準(zhǔn)支持向量機(jī)是針對(duì)兩類分類問題提出的 , 根據(jù)有限樣本信息在 模型復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折中 , 即通過最大化分類間隔 得到最大的泛化能力 , 但是現(xiàn)實(shí)中的大多數(shù)模式識(shí)別問題都是多類 分類問題,對(duì)此,通常的解決方法主要有 4種: 一類對(duì)一類 (one-against-one, oao) 、一類對(duì)其余 (one-against-rest, oar) 、 有向無環(huán)圖 svm3(decision directed acyclic graph svm,ddagsvm)和m-ary sv
8、m4。此外,一些學(xué)者研究了其他一些針 對(duì)特定多類分類問題的解決方法 , 如針對(duì)多類分類情況下可能會(huì)出 現(xiàn)不可分區(qū)域及訓(xùn)練樣本中存在噪聲的情況,李廣麗等5在svm的 輸入端通過引入模糊隸屬度函數(shù)對(duì)輸入數(shù)據(jù)進(jìn)行轉(zhuǎn)換并對(duì)利用改 進(jìn)的序列最小優(yōu)化算法求解模糊多類分類支持向量機(jī) , 從而獲得較 好的性能;于清等提出了一種被稱作2_a_2的多類分類方法,將 最少數(shù)量的子分類器結(jié)合在一起并分利用每個(gè)子分類器的識(shí)別結(jié) 果來實(shí)現(xiàn)多類分類,但是 , 這些算法通常存在著針對(duì)性強(qiáng)、泛化能 力弱、訓(xùn)練速度慢等不足。文獻(xiàn) 7 對(duì) oao、oar 和 dagsvm 3 種多 分類svm模型結(jié)構(gòu)和性能進(jìn)行了分析比較,并且指出
9、第一種和第三 種方法更加實(shí)用;文獻(xiàn)8對(duì)5種多類分類svm方法(oao、oar、二 叉樹法、糾錯(cuò)輸出編碼 (error correction output code, ecoc)法和ddagsvm)的原理和實(shí)現(xiàn)方法進(jìn)行了介紹和分析,從速度和精度兩 方面對(duì)這些方法的優(yōu)缺點(diǎn)進(jìn)行了歸納和總結(jié),研究如何用精簡的結(jié) 構(gòu)模型充分發(fā)揮支持向量機(jī)算法的優(yōu)勢(shì)對(duì)于工程實(shí)踐應(yīng)用有著深刻的意義。嵌入式系統(tǒng)近年來得到廣泛的普及 , 但是由于其小存儲(chǔ)容量、低功 耗以及軟硬件精簡等限制 , 如何將高效的算法應(yīng)用于嵌入式系統(tǒng)也 成為研究的一大熱點(diǎn) , 支持向量機(jī)作為最新且較有潛力的機(jī)器學(xué)習(xí) 算法, 在嵌入式系統(tǒng)中的理論研究和應(yīng)
10、用也已有了一定的發(fā) 展,anguita等9-10將普通支持向量機(jī)算法中的參數(shù)表示利用分 枝定界法轉(zhuǎn)化為整型 , 從而使得在資源有限的嵌入式系統(tǒng)中能夠?qū)?現(xiàn)svm算法,并對(duì)經(jīng)典算法實(shí)現(xiàn)時(shí)又引入了區(qū)間算術(shù)法,簡化了搜索 空間的上下界,并且提出了硬件友好型svm的實(shí)現(xiàn)方法。國內(nèi)也有 不少這方面探索研究,文獻(xiàn)11對(duì)bp神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的優(yōu)化 過程進(jìn)行了詳細(xì)的研究 ,并給出了兩種算法在嵌入式系統(tǒng)中實(shí)現(xiàn)的 改進(jìn)措施,并采用基于迭代的選擇策略 12 逐步減小問題規(guī)模以利 于在嵌入式系統(tǒng)下訓(xùn)練svm;文獻(xiàn)13-15針對(duì)不同的平臺(tái)將支持向 量機(jī)應(yīng)用于解決具體的模式識(shí)別問題,這些研究和實(shí)現(xiàn)對(duì)支持向量 機(jī)在嵌入
11、式系統(tǒng)中的應(yīng)用有著指導(dǎo)意義。本文以 m-ary 支持向量機(jī)算法為基礎(chǔ) , 結(jié)合檢錯(cuò)糾錯(cuò)理論提出了改 進(jìn)的具有糾錯(cuò)能力的 m-ary 支持向量機(jī)算法 , 分析了其原理和實(shí)現(xiàn) 方法,并以pc和嵌入式系統(tǒng)為平臺(tái),以手寫數(shù)字識(shí)別程序來驗(yàn)證其 性能。第3期 包健等: 用糾錯(cuò)編碼改進(jìn)的 m-ary 支持向量機(jī)多類分類算法計(jì)算機(jī)應(yīng)用 第 32 卷 1m-ary svm 模型1.1 標(biāo)準(zhǔn) m-ary svm 算法m-ary 支持向量機(jī)是在 2000 年由 sebald 和 buchlew 等提出的 , 由 于精簡的結(jié)構(gòu)模型和較少的子分類器數(shù)量 , 使得問題求解規(guī)模得到 較大的簡化。標(biāo)準(zhǔn) m-ary 支持向量機(jī)
12、的結(jié)構(gòu)如圖 1 所示。 與其他多類分類方法相比 , 此算法大大減少了子分類器數(shù)量 ,因此 簡化了求解模型 , 但是其最大的缺陷就是容錯(cuò)性較差 , 若在計(jì)算過 程中,某個(gè)子分類器的判別失誤造成符號(hào)取反 , 則會(huì)導(dǎo)致整個(gè)判別 結(jié)果錯(cuò)誤 , 因此其泛化能力受到了較大影響 ,這也是影響其實(shí)際應(yīng) 用的主要因素 ,關(guān)于該算法的應(yīng)用研究及改進(jìn)方案 , 也在逐漸被研 究人員所關(guān)注 16-18 。1.2m-ary svm 的性能研究和應(yīng)用較多的 oao 和 oar 多類分類支持向量機(jī)算法 , 主要缺點(diǎn) 是需要構(gòu)造較多的子支持向量機(jī) ,不僅浪費(fèi)了較多的系統(tǒng)資源 , 而 且增加了訓(xùn)練時(shí)間 , 因此對(duì)于軟硬件條件要求
13、苛刻的嵌入式系統(tǒng)并 不適用 , 而對(duì)于性能相對(duì)優(yōu)越的 m-ary svm 的性能分析的文獻(xiàn)不多 , 從直觀上來分析,假設(shè)訓(xùn)練集t中共有p個(gè)不同的類別和n個(gè)訓(xùn)練 樣本, 按照上述多分類支持向量機(jī)的構(gòu)造方法 , 各算法應(yīng)有的子 svm 數(shù)目(nclass)、需訓(xùn)練的參數(shù)數(shù)量(nparam)以及訓(xùn)練時(shí)間(ntime) 如表1所示,其中m為子分類器數(shù)量,r是與訓(xùn)練算法有關(guān)的系數(shù), 如采用smo算法時(shí),r 2。表格(有表名)表14種多類分類器性能比較-p (p-1)/svmnclassnparamntimeoaop(p-1)/2(p-1)no(2n/p)r2) oarp-1p no(p nr)ddagp
14、(p-1)/2(p-1)no(2r-1 p2-r nr)m-arylb pn lb po(m n2)從表 1 可看出: m-ary svm 僅需要構(gòu)造對(duì)數(shù)級(jí)數(shù)量的子分類器 , 不 僅使求解規(guī)模得到簡化 ,同時(shí)大大降低了問題的復(fù)雜性 , 且訓(xùn)練速 度得到較大的提高,使得其成為最快的svm算法,從理論上講,只要 對(duì)其子分類器的參數(shù)選擇得當(dāng) , 其整體性能會(huì)有較大的改進(jìn)。2 改進(jìn)的 m-ary 算法2.1 改進(jìn)算法的提出一些學(xué)者提出的糾錯(cuò)輸出編碼 (error correcting output code, ecoc) 支持向量機(jī) 19-20, 將常規(guī)的支持向量機(jī)算法與糾錯(cuò)編碼相 結(jié)合, 通過糾錯(cuò)編
15、碼來對(duì)子分類器的輸出進(jìn)行糾錯(cuò) , 從而增強(qiáng)了模 型的泛化性 , 通常的 ecoc svm 是利用某種糾錯(cuò)碼構(gòu)造方法 ( 如文獻(xiàn) 19 中提到的詳盡編碼法、列選擇法、爬山法等 )得到合適的碼字 , 然后將不同的碼字分配給不同的類別作為訓(xùn)練的依據(jù) , 每個(gè)子分類 器分別對(duì)應(yīng)碼字的不同位 , 也就是碼字的位數(shù)對(duì)應(yīng)于分類器中子分 類器的數(shù)量,這種方法不僅充分利用了支持向量機(jī)的兩類特性 ,同 時(shí)也降低了問題的復(fù)雜性 , 但是并沒有將原始信息碼作為構(gòu)造碼字 的依據(jù),選取的碼字直接影響了分類器的性能。針對(duì)這一問題 ,本文 提出了改進(jìn)的 m-ary 支持向量機(jī)算法。以手寫數(shù)字識(shí)別程序?yàn)槟繕?biāo) , 待識(shí)別的目標(biāo)類
16、也因此有 10類(即待 識(shí)別的10個(gè)數(shù)字:0,1,,9),則所使用的m-ary子分類器數(shù)目應(yīng)為lb 10=4,根據(jù)上面所提到的子svm類別劃分規(guī)則,4個(gè)分類器中的類別標(biāo)識(shí)如表2所示。2.2輸出校正m-ary算法本文以標(biāo)準(zhǔn)m-ary svm類別劃分編碼為信息碼,采用糾錯(cuò)能力可控 的編碼方法,加入適當(dāng)?shù)男r?yàn)位,共同構(gòu)成碼字,稱為校驗(yàn)碼。訓(xùn)練 后通過檢錯(cuò)糾錯(cuò)原理對(duì)實(shí)際輸出進(jìn)行校驗(yàn),進(jìn)而對(duì)出錯(cuò)的分類模式 進(jìn)行校正,可把該算法稱為輸出校正 m-ary支持向量機(jī)(output correcting m-ary svm, oc-msvm),將其應(yīng)用于 pc禾口嵌入式系統(tǒng)下的多類模式識(shí)別問題,并用手寫數(shù)字識(shí)別
17、程序來驗(yàn)證該實(shí)現(xiàn)。此處 將m-ary svm與糾錯(cuò)編碼相結(jié)合,使其校驗(yàn)法能夠檢測(cè)模型中子分 類器輸出中的錯(cuò)誤分類并糾正該錯(cuò)誤,以期獲得比標(biāo)準(zhǔn)算法更高的 泛化能力。限于具體的應(yīng)用要求,以及簡化解碼的復(fù)雜性要求,可比較分析線 性循環(huán)碼中的系統(tǒng)碼的碼長及設(shè)計(jì)最小距離在m-ary svm性能改進(jìn)方面的影響,進(jìn)而設(shè)計(jì)能夠滿足性能要求的輸出校正m-ary svm模型。由糾錯(cuò)編碼原理可知,當(dāng)設(shè)計(jì)編碼的最小碼間距離為 dmin時(shí): 若dmine+1,則碼組內(nèi)可檢出不多于 e個(gè)錯(cuò)誤;若dmin2t+1,則 碼組內(nèi)可糾正不多于t個(gè)錯(cuò)誤;若dmint+e+1,其中e>t,則碼組內(nèi) 可糾正不多于t個(gè)錯(cuò)誤,同時(shí)檢
18、測(cè)e個(gè)錯(cuò)誤。由于bch碼是糾錯(cuò)能力可控的循環(huán)碼,能夠糾正多個(gè)隨機(jī)錯(cuò)誤,并且可以根據(jù)期望糾錯(cuò)的個(gè)數(shù)構(gòu)造出理想碼字。本文選用bch編碼方法進(jìn)行校正m-ary svm的輸出,針對(duì)l,m,d碼(l為碼長,m為信息 位長,d為編碼的最小距離),設(shè)計(jì)具有不同糾錯(cuò)能力的碼字t,并作 為訓(xùn)練m-ary svm的輸入特征分類向量,則原信息碼對(duì)應(yīng)于糾錯(cuò)編 碼的高m位。假設(shè)原訓(xùn)練樣本為(xi,yi), 其中xi為樣本特征向量,yi為類標(biāo)簽(即yi=O,9),并表示為表3所示的編碼,利用糾錯(cuò)編碼方法編碼 后碼字的二進(jìn)制位數(shù)為I,則輸出校正m-ary算法描述如下:1)利用式(1)和式類別劃分規(guī)則及2.1節(jié)中類別編碼方法
19、將yi 編碼為表3所示碼字ci,其中ci 0,14。2)以ci為信息碼,利用選定的編碼規(guī)則進(jìn)行編碼,生成對(duì)應(yīng)碼長為l、最小碼距為d的碼字ci*,其中ci* 0,1l, 高4位即為ci; 為提高訓(xùn)練過程計(jì)算效率,在算法實(shí)現(xiàn)時(shí)引入了掩碼技術(shù),即為每 個(gè)子分類器svmj分配掩碼maskj二2j-1,其中j=1,2,l。3)將編碼后的訓(xùn)練樣本即(xi,ci*)輸入各個(gè)子分類器svmj(其中j=1,2,,l)進(jìn)行訓(xùn)練:將該訓(xùn)練樣本的類別編碼ci*與maskj進(jìn)行 位與操作,即ci* maskj,若結(jié)果為0,則將該樣本作為負(fù)類樣本; 否則,若結(jié)果為非0,則將該樣本作為正類樣本,用輸入的樣本訓(xùn)練 該兩類分類
20、svm。4)將待識(shí)別樣本輸入已訓(xùn)練好的分類器模型中各個(gè)子分類器svmj,并得到其輸出yj,按照子分類器編號(hào)組成編碼ti,即ti=ylyl-1 y1, 其中 yj 0,1。5)利用檢錯(cuò)原理檢查編碼ti是否合法,如果合法,則可直接利用所 得編碼的高k位得到分類結(jié)果ci*:此處可直接將ti右移l-4位得 到4位信息碼,即ci* = ti >> (1-4); 否則,利用糾錯(cuò)原理對(duì)ti進(jìn) 行校正,然后再對(duì)ti右移1-4位得到分類結(jié)果。因此,在預(yù)測(cè)新的樣本時(shí),第5)步對(duì)實(shí)際分類器分類編碼利用檢錯(cuò) 糾錯(cuò)原理進(jìn)行必要的檢錯(cuò)糾錯(cuò)后得到其所屬類別,該算法可在一定 程度上克服標(biāo)準(zhǔn)m-ary支持向量機(jī)容錯(cuò)
21、性較差的缺點(diǎn)。從上述過程可以看出,由于生成的碼字長度直接決定分類器的復(fù)雜 度,因此輸出糾錯(cuò)m-ary支持向量機(jī)算法的目標(biāo)明確,即把長度為lb k的原貽類別編訓(xùn)作為信息碼,根據(jù)選定的編碼方法編碼為具有最小距離可控的碼字,因此得到的類別編碼不論是在編碼難易 程度方面還是追求最小碼間距離方面,實(shí)際是在一定程度上最優(yōu)的 文獻(xiàn)19中提到的ecoc編碼方法如詳盡編碼法和列選擇法由于是 針對(duì)長度為指數(shù)級(jí)的編碼進(jìn)行操作的,在類別稍多時(shí)工作量太大而 不再實(shí)用,爬山法追求的是編碼矩陣的行最小距離與列最小距離之 和最大,雖然可以碼字長度可控,但碼間最小距離并不能保證是最 優(yōu)的,且其中的隨機(jī)性較大。在下面的實(shí)驗(yàn)中將用
22、爬山法與bch法獲得等長的碼字,并對(duì)兩者的性能進(jìn)行比較。3實(shí)驗(yàn)設(shè)計(jì)及分析本實(shí)驗(yàn)中用到的訓(xùn)練樣本為28X 28像素的手寫數(shù)字圖片經(jīng)過預(yù)處 理、二值化、去除邊界像素并按照灰度級(jí)進(jìn)行規(guī)范化后 ,從中提取 12X 12個(gè)的特征,按照一行一行首尾相連形成一個(gè) 144維的輸入向 量,實(shí)驗(yàn)的樣本如圖2所示。圖片圖 2 實(shí)驗(yàn)中樣本示例 在此基礎(chǔ)上 , 對(duì)于實(shí)際輸出的分類編碼進(jìn)行解碼后 ,通過糾錯(cuò)程序 對(duì)輸出進(jìn)行必要的糾錯(cuò) ,然后用編碼的高 k 位信息碼獲得實(shí)際的類 別輸出。實(shí)際用到的模型如圖 3 所示。圖片圖 3 改進(jìn)的 m-ary svm 模型結(jié)構(gòu)圖3中:x為輸入訓(xùn)練樣本,yj為子分類器svmj的輸出(j=
23、1,2,1 且yj=0或I),ylyl-1yl為各個(gè)子分類器分類輸出按照子分類器 序號(hào)遞減順序組成的二進(jìn)制碼串。從 10000個(gè)圖片中隨機(jī)選取 5組數(shù)據(jù)作為訓(xùn)練樣本和測(cè)試樣本 (每 組數(shù)據(jù)包括2000個(gè)訓(xùn)練樣本和1000個(gè)測(cè)試樣本),在pc上對(duì)標(biāo)準(zhǔn) m-ary算法和本文提出的輸出糾錯(cuò) m-ary算法進(jìn)行實(shí)驗(yàn),并以5次實(shí) 驗(yàn)的平均值作為結(jié)果。同時(shí) , 為進(jìn)一步比較分析輸出糾錯(cuò) m-ary svm 算法的性能,實(shí)驗(yàn)中對(duì)隨機(jī)編碼法ecoc svm進(jìn)行了實(shí)驗(yàn),得出兩種 算法的性能比較結(jié)果,如表4所示,其中oc代表輸出糾錯(cuò)m-ary svm,ecoc 代表 ecoc svm, dmin 為對(duì)應(yīng)碼長碼組的
24、最小距離 ,prec 為各組 1000個(gè)測(cè)試樣本分類正確率的平均值 ,ttime 為各組測(cè)試樣 本的總的分類時(shí)間的平均值。表格(有表名)表4pc上oc_msvm與 ecoc svm 性能比較碼長oc-msvmdminprec/%ttime/secoc-svmdminprec/%ttime/s4188.565 .77188.577.347392.2010.78290.4312.918391.8812.04391.2514.7312594.2217.83593.3722.5114796.5622.78593.2527.03! 根據(jù)情 況左右加注:碼長為4時(shí)的oc-msvm為標(biāo)準(zhǔn) m-ary svm
25、。從表 4 容易看出 : 無論是 oc-msvm 還是 ecoc svm, 隨著糾錯(cuò)編碼碼 長的增加,分類器的分類精度都有不同程度的提高。同時(shí) ,由于所需 要的子分類器數(shù)量的增加 , 所需要的分類時(shí)間也會(huì)明顯的增加,并 且在相同的條件下本文提出的輸出糾錯(cuò) m-ary svm 的性能要優(yōu)于隨 機(jī)編碼法 ecoc svm。由于此研究的目標(biāo)是支持向量機(jī)能夠在嵌入式系統(tǒng)下的應(yīng)用實(shí)現(xiàn) , 因此在嵌入式系統(tǒng)環(huán)境中對(duì)兩者的性能進(jìn)行了相同的實(shí)驗(yàn) , 得到的 性能結(jié)果如表 5 所示(參數(shù)含義同表 4)。表格(有表名)表5嵌入式系統(tǒng)下oc-msvm與ecoc svm性能比較 碼長 oc-msvmdminprec/
26、%ttime/secoc-svmdminprec/%ttime/s4185.107 .34185.047.387387.3213.66286.2613.548387.0615.82386.7215.8812589.7223.04589.3623.1614792.5427.41588.9227.43! 根據(jù)情 況左右加注:碼長為4時(shí)的oc-msvm為標(biāo)準(zhǔn) m-ary svm。同樣,在嵌入式系統(tǒng)下,本文提出的輸出校正m-ary svm的性能比標(biāo) 準(zhǔn) m-ary svm 性能有了一定的改善。在訓(xùn)練速度方面 , 由于 m-ary 算法的時(shí)間復(fù)雜度為o(m n2),而對(duì)于各種碼長的svm訓(xùn)練過程中 訓(xùn)練
27、樣本數(shù)量n均相同,不同的是子分類器數(shù)量 m,因此隨著碼長I 的增加,相應(yīng)的子分類器數(shù)量增加 ,因此算法的訓(xùn)練時(shí)間也就相應(yīng) 地增加 , 從實(shí)驗(yàn)結(jié)果中不難看出這一結(jié)論。此外, 與編碼相關(guān)的因素即最小碼距 dmin 也反映在了上述數(shù)據(jù)中 最小碼距直接影響分類器的性能 ,表 45中碼長為 7,12,14 的碼字 最小距離分別為 3,5,7, 其分類精度隨最小距離的增加依次提高 , 但 同時(shí)可以看出 , 對(duì)于長度相同的編碼 , 由隨機(jī)編碼法得到的碼字并 不是最佳的 , 兩種方法對(duì)于長度為 7 和 14 的編碼的最小距離不同 , 因此其性能也就存在一定的差別 , 并且改進(jìn)算法的性能要優(yōu)于 ecoc svm
28、;另外,oc-msvm中碼長為7和8的碼字最小碼距均為3,雖然后 者增加了一位的碼長 , 這也增加了判錯(cuò)的概率 , 可以看出后者的分 類精度較前者略低,對(duì)于ecoc svm,由于最小距離相同,碼長為12和 14 的編碼對(duì)應(yīng)的分類器分類精度并不隨碼長增加而增加 , 反而隨碼 長增加其精度下降 , 因此碼長越長并非意味著分類器的性能越好。4 結(jié)語本文針對(duì)m-ary svm泛化性不足的缺陷,利用糾錯(cuò)編碼原理,充分結(jié) 合了支持向量機(jī)二類分類問題的特點(diǎn) , 將訓(xùn)練樣本的初始類別利用 糾錯(cuò)編碼技術(shù)編碼為二進(jìn)制碼串 , 使得標(biāo)準(zhǔn) m-ary 支持向量機(jī)算法 通過引入適當(dāng)?shù)娜哂嘧臃诸惼鱽磉_(dá)到提高該算法泛化性的
29、目的。本 文詳細(xì)地闡述了輸出糾錯(cuò) m-ary svm 算法實(shí)現(xiàn)過程 , 并從實(shí)驗(yàn)結(jié)果 驗(yàn)證了此改進(jìn)算法的可行性 ,同時(shí)也得到在性能改進(jìn)方面的一些結(jié) 論, 碼長和最小碼距成為 m-ary svm 算法改進(jìn)方面兩個(gè)必須考慮的 因素, 這也成為分類精度和分類時(shí)間兩者折中考慮的結(jié)合點(diǎn)。進(jìn)一 步的工作是定量分析碼長及碼間最小距離在 m-ary svm 性能改進(jìn)上 的影響,從而尋求碼長及最小距離在算法改進(jìn)上的最佳折中。 參考文獻(xiàn) :1 vapnik v n.統(tǒng)計(jì)學(xué)習(xí)理論的本質(zhì)m.張學(xué)工,譯.北京:清華大學(xué)出版社,2000.2 cortesc, vapnik v n. support vector netw
30、orksj.machinelearni ng,1995,20(3):273-297.3 platt j c, cristia nini n, taylor j s. large margin dagsfor multiclass classificati on c n ips99: proceedi ngsof neural informationprocessing systems. cambridge, ma: mitpress,2000:547-553.4 sebald d j,bucklew j a. support vector mach ines and themultiple h
31、ypothesis test problemj. ieee tran sacti ons onsig nal process ing, 2001,49(11): 2865-2872.5 李廣麗,崔廣順.一種改進(jìn)的模糊多類支持向量機(jī)算法j. 計(jì)算機(jī)測(cè)量與控制,2011,19(4):908-914. 于清,趙暉.一種2_a_2支持向量機(jī)多類分類新方法j. 計(jì)算 機(jī)工程與應(yīng)用,2008,44(25):186-188.7 hsu c,l in c. a comparis on of methods for multiclasssupport vector machi nesj. ieee tran s
32、acti ons on n euraln etworks,2002, 13(2):415-425.8 茍博,黃賢武.支持向量機(jī)多類分類方法j.數(shù)據(jù)采集與處理,2006, 21(3):334-339.9 anguitad, ghio a, pischiutta s. a support vector machine with in teger parametersj. n eurocomput ing, 2008,72(1/2/3):480-489.10 anguita d, ghio a,pischiutta s. a hardware-friendlysupport vector machine for embedded automotive applicationsc/ proceedings of internat
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度月子中心產(chǎn)后恢復(fù)中心合作框架協(xié)議
- 中國廣電手機(jī)產(chǎn)品白皮書2025年版
- 2025年度儲(chǔ)能設(shè)備箱涵項(xiàng)目施工臨時(shí)照明勞務(wù)分包合同
- 2025年發(fā)酵類制品項(xiàng)目建議書
- 2025年鉆采裝備項(xiàng)目發(fā)展計(jì)劃
- 2025年青霉素類抗菌藥物合作協(xié)議書
- 如何將個(gè)人成長納入月度工作計(jì)劃
- 學(xué)生發(fā)展報(bào)告與個(gè)案分析計(jì)劃
- 如何開展班級(jí)傳統(tǒng)文化教育計(jì)劃
- 幼兒閱讀推廣計(jì)劃
- GB/T 11982.1-2005聚氯乙烯卷材地板第1部分:帶基材的聚氯乙烯卷材地板
- GB 5009.76-2014食品安全國家標(biāo)準(zhǔn)食品添加劑中砷的測(cè)定
- GB 4094-2016汽車操縱件、指示器及信號(hào)裝置的標(biāo)志
- 燃?xì)忮仩t安裝施工方案5
- 2023年湖北成人學(xué)位英語考試真題
- 睡眠中心課件
- 小兒急性喉炎-課件
- 醫(yī)院難免壓瘡申報(bào)表
- 中小學(xué)教師師德師風(fēng)警示教育培訓(xùn)PPT
- 全文《中國式現(xiàn)代化》PPT
- SJG 112-2022 既有建筑幕墻安全性鑒定技術(shù)標(biāo)準(zhǔn)高清最新版
評(píng)論
0/150
提交評(píng)論