




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
格拉斯曼流形上點(diǎn)的識(shí)別
0子空間局部感知結(jié)構(gòu)和局部識(shí)別傳統(tǒng)的圖像識(shí)別領(lǐng)域通常以單幅靜態(tài)圖像作為研究對(duì)象,并在可控場(chǎng)景中獲得良好的性能。然而,基于單幅靜態(tài)圖像學(xué)習(xí)算法在很多實(shí)際應(yīng)用場(chǎng)景中效果不佳。隨著數(shù)字成像和海量存儲(chǔ)設(shè)備等硬件設(shè)備快速發(fā)展以及互聯(lián)網(wǎng)資源的觸手可及,人們能夠獲取的圖像涵蓋了物體的各種表觀變化,如姿態(tài)、表情、光照角度等,從而為基于圖像集合學(xué)習(xí)問(wèn)題提供了豐富的數(shù)據(jù)。在這類問(wèn)題中,每個(gè)圖像集合通常包含同一類別的多個(gè)圖像樣本,利用了圖像樣本綜合信息提取特征,提升算法的性能,因此,基于圖像集合的識(shí)別問(wèn)題受到越來(lái)越廣泛的關(guān)注。研究表明,將圖像集合建模為子空間,可以達(dá)到更好的性能。Yamaguchi等人提出了針對(duì)人臉識(shí)別問(wèn)題的互子空間方法(MSM),開(kāi)創(chuàng)了利用子空間對(duì)圖像集合非參數(shù)建模方法研究的先河,引起各領(lǐng)域科學(xué)研究者的廣泛關(guān)注,衍生出一系列改進(jìn)算法。Fukui等人提出約束互子空間方法(CMSM),通過(guò)把圖像集合投影到一個(gè)對(duì)分類最有利的子空間上,然后計(jì)算投影后的圖像集合之間的相似性,算法的不足之處在于需人為設(shè)置子空間的維數(shù)及其相應(yīng)的參數(shù),在無(wú)監(jiān)督情況下進(jìn)行參數(shù)的選擇還沒(méi)有可靠的理論依據(jù)。Kim對(duì)Fukui的工作做了進(jìn)一步的發(fā)展,提出了基于典型相關(guān)的圖像集合判別(DCC)學(xué)習(xí)和識(shí)別算法,采用主角作為子空間相似性度量,并期望尋求投影方向,使得數(shù)據(jù)映射到低維空間后,類間樣本盡可能“分開(kāi)”。Chu等人提出基于圖像集的核判別變換(KDT),該算法是DCC算法的非線性拓展。Li等人把集成策略用于圖像集合的分類,提出了提升的全局和局部主角方法(BGLPA)。Wang等人提出了基于流形-流形距離框架的圖像集合人臉識(shí)別方法,將流形表示為一組局部線性模型的組合,采用子空間刻畫(huà)各局部模型。監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)是降維算法的兩種重要形式。通常,對(duì)無(wú)標(biāo)簽數(shù)據(jù)進(jìn)行大量的標(biāo)定工作會(huì)耗費(fèi)很大的代價(jià)。如果只使用少量的標(biāo)記樣本,那么所訓(xùn)練出的學(xué)習(xí)系統(tǒng)很難具有良好的泛化能力,如果只使用未標(biāo)記樣本則浪費(fèi)了標(biāo)記樣本中所提供的有用信息。因此,無(wú)論是監(jiān)督算法還是無(wú)督算法都不能獲得令人滿意的結(jié)果。半監(jiān)督學(xué)習(xí)是介于監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)之間,它利用少量帶標(biāo)簽樣本來(lái)指導(dǎo)降維,同時(shí)又利用大量的不帶標(biāo)簽樣本來(lái)刻畫(huà)并保持樣本的局部幾何結(jié)構(gòu)。處理子空間問(wèn)題的一種變通的方法是將子空間表示為格拉斯曼流形(Grassmannmanifold)上的點(diǎn)。近年來(lái),一些研究者探討了在格拉斯曼流形上實(shí)現(xiàn)判別分析。這類算法的基本出發(fā)點(diǎn)是把格拉斯曼流形上松散分布的樣本,通過(guò)非線性變換壓縮到一個(gè)低維的格拉斯曼流形中,使樣本在該低維格拉斯曼流形中分布更緊湊,更利于分類,降低計(jì)算復(fù)雜度。Hamm等人提出了格拉斯曼流形判別分析(GDA),該方法將子空間表示成格拉斯曼流形上的點(diǎn),利用格拉斯曼核度量子空間的相似度,實(shí)現(xiàn)格拉斯曼流形上數(shù)據(jù)非線性判別分析。盡管GDA表現(xiàn)出優(yōu)越的性能,然而該方法并沒(méi)有明確考慮數(shù)據(jù)分布的內(nèi)蘊(yùn)幾何結(jié)構(gòu),從而影響樣本的判別性和模型的泛化能力。鑒于此,Harandi等人在圖嵌入框架的基礎(chǔ)上,提出了一種基于格拉斯曼流形局部判別分析方法(GEDAGM),采用在格拉斯曼流形上構(gòu)建類內(nèi)圖和類間圖刻畫(huà)類內(nèi)緊致性與類間可分性,以此獲取流形上數(shù)據(jù)的幾何結(jié)構(gòu)和局部信息。在全局方法無(wú)法奏效的情況下,局部學(xué)習(xí)方法提供了有效的解決方案。本文提出一種新穎的格拉斯曼流形上的半監(jiān)督判別分析方法(SDAGM),通過(guò)在格拉斯曼流形上構(gòu)建所有樣本(有標(biāo)簽和無(wú)標(biāo)簽)的近鄰圖來(lái)估計(jì)樣本分布的幾何結(jié)構(gòu),然后將其作為正則化項(xiàng)整合到GDA目標(biāo)函數(shù)中,在此正則化項(xiàng)的作用就是用來(lái)估計(jì)樣本空間的內(nèi)蘊(yùn)幾何結(jié)構(gòu),從而學(xué)習(xí)更為有效的投影矩陣。本文方法具有以下優(yōu)點(diǎn):1)以圖像集合為輸入單位,將子空間表示為格拉斯曼流形上的點(diǎn),由此,圖像集合的判別分析問(wèn)題轉(zhuǎn)化為格拉斯曼流形上數(shù)據(jù)的判別分析問(wèn)題;2)引入投影核度量格拉斯曼流形之間距離,提升算法時(shí)間效率;3)在圖嵌入框架基礎(chǔ)上,通過(guò)引入“局部保持”正則化項(xiàng),將格拉斯曼流形上的判別分析與正則化項(xiàng)整合于單個(gè)目標(biāo)函數(shù)。1莎拉斯曼流型及其初步分析1.1空間的線性子空間3g解釋格拉斯曼流形已成功應(yīng)用于控制領(lǐng)域和信號(hào)處理,近年來(lái)才逐步用于機(jī)器學(xué)習(xí)和模式識(shí)別領(lǐng)域。以下為格拉斯曼流形的定義。定義假設(shè)樣本均勻采樣于D維歐氏空間中的m維流形上,格拉斯曼流形GD,m是D×m正交矩陣等價(jià)類集合,即GD,m={Y|Y=XV,?V∈Ok},式中,X、Y是D×m正交矩陣,V是m×m正交矩陣,Ok為正交群的一個(gè)特例,即有Ok={Q|QTQ=I,det(Q)=1}。依據(jù)定義,如果格拉斯曼流形上的兩個(gè)點(diǎn)能夠通過(guò)正交變換相互獲得時(shí),那么這兩個(gè)點(diǎn)是等價(jià)的。即矩陣W1=W2Q,式中,Q是r×r正交矩陣,并且列空間span(W1)=span(W2),從而W1和W2等價(jià)。由此可見(jiàn),格拉斯曼流形GD,m直觀解釋為格拉斯曼流形是空間RD中所有m維線性子空間的集合,GD,m上的每個(gè)點(diǎn)是一個(gè)D×m維正交矩陣列空間所張成的子空間。如果圖像集合用線性子空間描述,則它們之間的距離可以用兩個(gè)子空間的主角來(lái)表示。事實(shí)上,格拉斯曼流形上兩點(diǎn)之間的距離可以由格拉斯曼核來(lái)表示。采用投影核來(lái)表示格拉斯曼流形上兩點(diǎn)之間的距離。1.2類間散度矩陣格拉斯曼流形上的判別分析基本思想是通過(guò)非線性映射將格拉斯曼流形M上數(shù)據(jù)點(diǎn)映射到一個(gè)新的格拉斯曼流形M′上,使各類內(nèi)樣本盡可能“緊湊”,類間樣本盡可能“分開(kāi)”。所以使得最大化判別準(zhǔn)則為J=argmaxSΜ′BSΜ′WJ=argmaxSM′BSM′W(1)假設(shè)樣本集X來(lái)自格拉斯曼流行M上,M是D×m正交矩陣等價(jià)類集合。設(shè)帶標(biāo)簽的樣本集為XL={Xi}li=1li=1?M,樣本分別屬c個(gè)類別;不帶標(biāo)簽樣本集為XU={Xi}l+ui=l+1?M,式中,l+u=n。樣本集全體為X=XL∪XU={Xi}ni=1ni=1,Xi∈RD×m,i=1,2,…,n。X(i)j表示第i個(gè)類中第j個(gè)樣本。ni表示第i類中元素的個(gè)數(shù)。存在非線性映射Φ:M→M′,Xi→Yi把樣本映射到新的格拉斯曼流M′上。定義流形M′上的類間散度矩陣SΜ′B和類內(nèi)散度SΜ′W矩陣為SΜ′B=c∑i=1ni(mΜ′i-mΜ′)(mΜ′i-mΜ′)ΤSΜ′W=c∑i=1ni∑j=1(Y(i)j-mΜ′i)(X(i)j-mΜ′i)ΤmΜ′i=1nini∑j=1Y(i)jmΜ′=1cc∑i=1nimΜ′i=1lc∑i=1ni∑j=1Y(i)j與核學(xué)習(xí)方法相類似,假設(shè)流形M所嵌入的高維特征空間的特征向量為αi,αi一定位于所有的訓(xùn)練樣本X所張成的子空間中,即存在系數(shù)aij(j=1,…,l)使αi=l∑j=1aijXj,有Yi=[〈α1,Xi〉,〈α2,Xi〉,…,〈αd,Xi〉]T(2)式中,d為G′上子空間的維數(shù),即G′為RD上d維子空間所在的格拉斯曼流形,假設(shè)d個(gè)特征向量構(gòu)成投影矩陣α=[α1,…,αd]。由?αs,Xi?=?l∑j=1asjXj,Xi?=l∑j=1asj?Xj,Xi?=l∑j=1asjkLij=AΤsΚLi(3)式中,As=[as1,as2,…,asl]T,KLi=[kLi1,kLi2,…,kLil]T。把式(3)代入式(2)得Yi=[AΤ1KLi,AΤ2KLi,…,ATdKLi]T=ATKLi(4)式中,A=[A1|A2|…|Ad]。將式(4)代入式(1),經(jīng)過(guò)簡(jiǎn)單數(shù)學(xué)推導(dǎo),得J=argmaxAΤΚLW(ΚL)ΤAAΤΚL(Ι-W)(ΚL)ΤA式中,核矩陣KL=[KL1|KL2|…|KLl],W是分塊對(duì)角矩陣。第i塊的矩陣W(i)=1ni1Tni/ni(1ni表示1的個(gè)數(shù)是ni個(gè)全1向量)。記所有帶標(biāo)簽數(shù)據(jù)的樣本矩陣為XL=[X(1),X(2),…,X(c)],定義L×L矩陣W=[W(1)0?00W(2)?0???00?W(c)](5)投影矩陣可通過(guò)廣義特征值問(wèn)題KLW(KL)TA=λKL(I-W)(KL)TA求得。2基于內(nèi)涵幾何結(jié)構(gòu)的分類方法格拉斯曼判別分析是一種監(jiān)督判別分析方法,其目的是降維之后不同類樣本之間的可分性最大,然而該方法并沒(méi)有明確考慮對(duì)分類問(wèn)題尤為重要的內(nèi)蘊(yùn)幾何結(jié)構(gòu)。SDAGM包括一個(gè)正則化項(xiàng),能夠更好地保持和優(yōu)化數(shù)據(jù)點(diǎn)之間的幾何結(jié)構(gòu)和判別信息。2.1注意點(diǎn)及分類參數(shù)的確定基于圖的半監(jiān)督降維算法的關(guān)鍵之處是一致性先驗(yàn)假設(shè)。也就是說(shuō)近鄰圖像集合在投影低維流形時(shí)有相似的嵌入。具體而言,已知n個(gè)數(shù)據(jù)點(diǎn)X={X1,X2,…,Xn}分布在格拉斯曼流形上,如果數(shù)據(jù)點(diǎn)Xi屬于Xj的k-近鄰,或者Xj屬于Xi的k-近鄰,則稱Xi和Xj為近鄰點(diǎn),并在圖上以邊相連,并附上相應(yīng)的權(quán)重Sij,其定義如下:Sij={exp(-∥Xi-Xj∥2/2σ2)Xi∈Νk(Xj)且Xj∈Νk(Xi)0其他(6)式中,Nk(Xi)和Nk(Xj)分別表示Xi和Xj的k-最近鄰,σ和k為自由參數(shù)。依據(jù)流形假設(shè),如果數(shù)據(jù)點(diǎn)之間有邊連接,則被投影到低維流形時(shí),數(shù)據(jù)點(diǎn)依然保持近鄰。定義局部保持正則化項(xiàng)R=12∑i,j(Yi-Yj)2Sij=12∑i,j(ΑΤΚi-ΑΤΚj)2Sij=∑iΑΤΚiΚΤiΑSij-∑ijΑΤΚiΚΤjΑSij=AΤΚDΚΤΑ-ΑΤΚSΚΤΑ=ΑTΚLΚTΑ(7)式中,A=[A1|A2|…|Ad]為投影矩陣;K=[K1|K2|…|Kn]為核矩陣;矩陣D為一對(duì)角矩陣,且Dii=∑jSij,S為權(quán)矩陣,L=D-S為圖拉普拉斯矩陣。最小化正則化項(xiàng)式(7)意味著,如果圖中有權(quán)相連的兩點(diǎn)Xi和Xj被映射后反而遠(yuǎn)離時(shí),S的損失函數(shù)會(huì)產(chǎn)生很大的補(bǔ)償。因此,最小化正則化項(xiàng)就是試圖確保如果Xi和Xj近鄰,那么Yi和Yj同樣近鄰。在格拉斯曼流上的判別分析的基礎(chǔ)上,考慮當(dāng)數(shù)據(jù)取樣于嵌入在高維空間低維流形數(shù)據(jù)的幾何結(jié)構(gòu),最大化目標(biāo)函數(shù)J=argmaxAΤΚLW(ΚL)ΤAAΤΚL(Ι-W)(ΚL)ΤA+βAΤΚLΚΤA(8)式中,β為正則化參數(shù),用于折中目標(biāo)函數(shù)中兩項(xiàng)的重要程度;易知,若β=0,則SDAGM就退化為GDA。最大化準(zhǔn)則函數(shù)可以通過(guò)求解廣義特征值問(wèn)題,即KLW(KL)TA=λ(KL(I-W)(KL)T+βKLKT)A(9)如果Α1,A2,…,Ad為式(9)廣義特征方程的前d個(gè)最大特征值所對(duì)應(yīng)的特征向量,定義投影矩陣A=[A1|A2|…|Ad]。對(duì)于一個(gè)新的圖像集Xq在αk上的投影為Vkq=?αk,Xq?=?n∑j=1akjXj,Xq?=n∑j=1akj?Xj,Xq?=AΤkΚq(10)式中,Kq=[〈X1,Xq〉,…,〈Xn,Xq〉]T。獲取降維后樣本的特征向量之后,采取最近鄰分類器進(jìn)行分類。設(shè)有n訓(xùn)練圖像集合{X1,X2,…,Xn},這些圖像樣本集是由N個(gè)單圖像組成的,共有c類,經(jīng)過(guò)SDAGM算法提取的特征向量為{V1,V2,…,Vn},每一個(gè)圖像集合都屬于一個(gè)類別ωk,k=1,…,c。測(cè)試圖像集合Xtest的經(jīng)變換后的特征向量為Vtest,如果滿足d(Vtest,Vi)=minid(Vtest,Vi),Vi∈ωki=1,…,N;k=1,…,c則測(cè)試圖像集合Xtest∈ωk。2.2缺失標(biāo)簽樣本的降維為了不失一般性,假設(shè)帶標(biāo)簽樣本集XL={X1,X2,…,Xl}中的樣本點(diǎn)是按照它們的標(biāo)簽順序排列的。SDAGM算法描述如下:數(shù)據(jù)X={X1,X2,…,Xl,Xl+1,…,Xn}?M,式中,l表示帶標(biāo)簽的樣本的個(gè)數(shù),n表示X中全部樣本的個(gè)數(shù)。帶標(biāo)簽的樣本Xi|li=1∈RD×m,無(wú)標(biāo)簽樣本Xi|ni=l+1∈RD×m,降維后的維數(shù)為d。1)在XL上,按照式(5)構(gòu)造Wl×l。定義矩陣W∈Rn×n如下W=[Wl×l000]對(duì)Xi∈XL和Xj∈XL,計(jì)算核矩陣Kl×l。定義核矩陣ΚL=[Κl×l000],ΚL∈Rn×n定義矩陣?Ι為?Ι=[Ι000]式中,I為l×l階單位矩陣。2)在X上依據(jù)近鄰數(shù),構(gòu)建近鄰圖,按照式(6)計(jì)算權(quán)值矩陣S,并求出拉普拉斯矩陣L=D-S。對(duì)所有Xi∈X和Xj∈X,計(jì)算核矩陣K。3)求解廣義特征值問(wèn)題ΚLW(ΚL)ΤA=λ(ΚL(?Ι-W)(ΚL)Τ+βΚLΚΤ)A得到最優(yōu)投影矩陣A=[A1|A2|…|Ad],式中,Ai為前d個(gè)最大特征值對(duì)應(yīng)的特征向量。3傳統(tǒng)圖像降維方法為了全面驗(yàn)證SDAGM有效性,針對(duì)本文算法與其他相關(guān)算法的關(guān)系,做了一系列對(duì)比實(shí)驗(yàn)。對(duì)比的算法包括邊界費(fèi)舍爾分析(MFA)、線性判別分析(LDA)、核費(fèi)舍爾判別分析(KFDA)、GEDAGM、黎曼局部保持映射(RLPP)、GDA。其中,MFA、LDA和KFDA是經(jīng)典的基于單圖像降維方法,而GEDAGM、RLPP和GDA是近年提出的基于圖像集合的方法。為了保證對(duì)比實(shí)驗(yàn)的充分性與廣泛性,選用了4個(gè)具有不同特點(diǎn)的數(shù)據(jù)集,包括3個(gè)基準(zhǔn)人臉數(shù)據(jù)集CMUPIE、ExtendedYaleB和Honda/UCSD與一個(gè)物體識(shí)別ETH-80數(shù)據(jù)集。3.1人臉圖像的調(diào)整CMUPIE數(shù)據(jù)集包括68個(gè)人的41368幅人臉圖像。這些圖像具有變化的13種姿態(tài)、43種不同光照和4種面部表情,平均每人約為170張圖像。在實(shí)驗(yàn)中,僅選取接近正面視角的人臉圖像構(gòu)成的子集,該子集包括不同光照和表情變化下的5個(gè)poses(C05、C07、C09、C27、C29)人臉圖像,圖1給出了某人的部分人臉圖像。把圖像調(diào)整為32×32大小,并將像素灰度值歸一化處理(零均值、單位方差)。ExtendedYaleB數(shù)據(jù)集包括38個(gè)人的2414幅正面人臉圖像,其中每個(gè)人大約64張圖像。這些圖像均在實(shí)驗(yàn)室控制光照的條件下拍攝。把圖像調(diào)整為32×32像素大小,并將像素灰度值做歸一化處理。圖2顯示了來(lái)自某個(gè)人的部分人臉圖像。實(shí)驗(yàn)選取Honda/UCSD數(shù)據(jù)集的第一個(gè)子集,其中包括20個(gè)對(duì)象的59段視頻,每人有2~5段視頻,每段視頻大約含有300~500幀圖像,圖像大小為486×640,人臉發(fā)生2維或3維的姿態(tài)變化、表情變化、光照變化和尺度變化。把圖像調(diào)整為32×32像素大小,并將像素灰度值歸一化到單位區(qū)間。部分實(shí)驗(yàn)人臉圖像如圖3所示。ETH-80數(shù)據(jù)集包括8類不同對(duì)象,每類物體包括10組不同的子類,如圖4所示,每個(gè)子類包含該子類不同視角下的41幅圖像。實(shí)驗(yàn)中把圖像調(diào)整為32×32像素大小,并將像素灰度值作歸一化處理。3.2實(shí)驗(yàn)環(huán)境配置3.2.1低維特征空間的檢測(cè)隨機(jī)地從每類中選擇一半圖像作為訓(xùn)練集,剩余部分用于測(cè)試集。首先基于訓(xùn)練樣本,并分別利用MFA、LDA、KFDA算法獲取從高維空間到低維特征空間顯式線性映射,然后將訓(xùn)練和測(cè)試樣本通過(guò)線性映射投影至各自的低維特征空間,最終基于測(cè)試樣本,采用最近鄰分類器計(jì)算識(shí)別率。實(shí)驗(yàn)重復(fù)執(zhí)行20遍,平均識(shí)別率作為最終性能的評(píng)價(jià)指標(biāo)。為了避免小樣本問(wèn)題,在執(zhí)行算法之前,采用了主成分分析(PCA)算法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,在降維過(guò)程中保留95%的數(shù)據(jù)能量。KFDA中的核函數(shù)選擇通用的高斯核,根據(jù)經(jīng)驗(yàn)將σ固定為訓(xùn)練樣本的平均范數(shù)σ0,近鄰參數(shù)k設(shè)置搜索范圍為{1,2,…,l-1},l為每類中訓(xùn)練樣本個(gè)數(shù)。3.2.2測(cè)試集和測(cè)點(diǎn)布置對(duì)于CMUPIE,取20個(gè)人做實(shí)驗(yàn),每次采用無(wú)放回隨機(jī)地選擇每個(gè)人的10幅人臉圖像組成一個(gè)圖像集合,這樣每個(gè)人可構(gòu)成17個(gè)圖像集合,其中10個(gè)圖像集合作為訓(xùn)練集,7個(gè)圖像集合作為測(cè)試集,訓(xùn)練集中4個(gè)圖像集合無(wú)標(biāo)簽。對(duì)于ExtendedYaleB,取20人做實(shí)驗(yàn),同樣采用無(wú)放回隨機(jī)地選擇每個(gè)人的6幅人臉圖像組成一個(gè)圖像集合,這樣每個(gè)人可構(gòu)成10個(gè)圖像集,其中6個(gè)圖像集合作為訓(xùn)練集,4個(gè)圖像集合作為測(cè)試集,訓(xùn)練集中2個(gè)圖像集合無(wú)標(biāo)簽。對(duì)于Honda/UCSD,選擇一個(gè)視頻段中100幅圖像構(gòu)成訓(xùn)練集,每個(gè)圖像集合是由10幅圖像構(gòu)成,這樣每個(gè)人有10個(gè)訓(xùn)練圖像集合,其中2個(gè)是無(wú)標(biāo)簽的圖像集合;選擇另外一個(gè)視頻100幅圖像構(gòu)成測(cè)試集,同樣每個(gè)測(cè)試圖像集合是由10幅圖像構(gòu)成的。對(duì)于ETH-80數(shù)據(jù)集,采用每個(gè)子類不同視角下的41幅圖像組成一個(gè)圖像集,這樣每個(gè)物體可構(gòu)成10個(gè)圖像集合,其中3個(gè)圖像集合作為訓(xùn)練集,7個(gè)圖像集合作為測(cè)試集,在訓(xùn)練集中1個(gè)圖像集未帶標(biāo)簽。近鄰參數(shù)k設(shè)置搜索范圍為{1,2,…,l-1},l為每類中訓(xùn)練樣本個(gè)數(shù);核函數(shù)均使用投影核。實(shí)驗(yàn)重復(fù)執(zhí)行20遍,平均識(shí)別率作為最終性能的評(píng)價(jià)指標(biāo)。3.3不同方法對(duì)應(yīng)的結(jié)果及維數(shù)通過(guò)最近鄰分類器來(lái)評(píng)價(jià)和比較不同降維算法的性能。表1給出了各種方法對(duì)應(yīng)的最好結(jié)果及其對(duì)應(yīng)的維數(shù)。針對(duì)圖像集合方法,圖5給出了各種降維算法的平均識(shí)別率對(duì)特征維數(shù)的變化曲線。3.4sdagm的實(shí)驗(yàn)針對(duì)不同的數(shù)據(jù)集,配置恰當(dāng)?shù)膮?shù),能夠提升算法的識(shí)別性能。然而,為參數(shù)選擇合適的值是不容易的。通常采用交叉驗(yàn)證的方式進(jìn)行參數(shù)選擇,但非常耗時(shí),并需要大量的訓(xùn)練樣本,在實(shí)際中難以實(shí)現(xiàn)。參數(shù)選擇對(duì)于帶標(biāo)號(hào)數(shù)據(jù)很少的機(jī)器學(xué)習(xí)算法而言,目前還沒(méi)有非常有效的方法。圖6顯示了對(duì)應(yīng)的不同近鄰參數(shù)k所構(gòu)建的近鄰圖,SDAGM在4個(gè)數(shù)據(jù)集上的識(shí)別率對(duì)比。具體地,固定低維子空間維數(shù)d=20和正則化參數(shù)β=20,遍歷不同近鄰數(shù)k對(duì)應(yīng)的識(shí)別率,參數(shù)β用于折中類內(nèi)方差和樣本的正則化項(xiàng)。如果β選取較小,則意味著正則化項(xiàng)在目標(biāo)函數(shù)中所占的比重少,這樣,對(duì)樣本內(nèi)蘊(yùn)幾何結(jié)構(gòu)的影響也較小,極端情形是β取0時(shí),算法退化為GDA方法;相反,如果參數(shù)β選取較大,則正則化項(xiàng)在目標(biāo)函數(shù)中所占的比重較大,突出了數(shù)據(jù)的幾蘊(yùn)幾何結(jié)構(gòu)作用,弱化了樣本的類內(nèi)方差。為了提高算法的時(shí)間效率,β大多采用經(jīng)驗(yàn)選取。圖7顯示固定低維子空間維數(shù)取d=20和近鄰數(shù)k=5,不
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 四年級(jí)數(shù)學(xué)特色教學(xué)活動(dòng)計(jì)劃
- 五年級(jí)下科學(xué)教學(xué)設(shè)計(jì)-擺的研究-教科版
- 蘇教版一年級(jí)上冊(cè)科學(xué)創(chuàng)新思維計(jì)劃
- 國(guó)際鎂礦市場(chǎng)格局演變-全面剖析
- 小學(xué)田徑隊(duì)健康飲食計(jì)劃
- 水文災(zāi)害風(fēng)險(xiǎn)評(píng)估-全面剖析
- 《做最好的自己》(教學(xué)設(shè)計(jì))-小學(xué)生心理健康主題班會(huì)
- 游戲測(cè)試流程自動(dòng)化的研究與應(yīng)用-全面剖析
- 五年級(jí)語(yǔ)文下冊(cè) 第一單元 4 梅花魂教學(xué)設(shè)計(jì) 新人教版
- 2025工廠車間安全培訓(xùn)考試試題及答案(新)
- 《肌力訓(xùn)練》課件
- 全媒體運(yùn)營(yíng)師-國(guó)家職業(yè)標(biāo)準(zhǔn)(2023年版)
- 招標(biāo)投標(biāo)法培訓(xùn)課件
- GLB-2防孤島保護(hù)裝置試驗(yàn)報(bào)告
- 中鐵員工內(nèi)退管理辦法
- 皮膚科玫瑰痤瘡的臨床表現(xiàn)和診斷學(xué)習(xí)培訓(xùn)課件
- 高考日語(yǔ)復(fù)習(xí):日語(yǔ)形容詞用法專項(xiàng)課件
- 馬克思主義與社會(huì)科學(xué)方法論概述(課件)
- 城市道路養(yǎng)護(hù)技術(shù)規(guī)程
- 2023年國(guó)家藥監(jiān)局直屬單位公開(kāi)招聘筆試參考題庫(kù)(共500題)答案詳解版
- JGT116-2012 聚碳酸酯(PC)中空板
評(píng)論
0/150
提交評(píng)論