




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、目錄1引言:32理論準(zhǔn)備:32.1 模糊集合理論32.2 模糊C均值聚類(FCM)42.3 加權(quán)模糊C均值聚類(WFCM)43聚類分析實(shí)例53.1 數(shù)據(jù)準(zhǔn)備53.1.1 數(shù)據(jù)表示53.1.2 數(shù)據(jù)預(yù)處理53.1.3 確定聚類個(gè)數(shù)63.2 借助clementine軟件進(jìn)行K-means聚類73.2.1 樣本在各類中集中程度83.2.2 原始數(shù)據(jù)的分類結(jié)果83.2.3 結(jié)果分析93.3 模糊C均值聚類103.3.1 數(shù)據(jù)集白模糊C劃分103.3.2 模®C均值聚類的目標(biāo)函數(shù)求解方法103.3.3 MATLAB軟件輔助求解參數(shù)設(shè)置113.3.4 符號(hào)表木113.3.5 代碼實(shí)現(xiàn)過程113.
2、3.6 FCM聚類分析113. 4WFCIM法143.1.1 WFCM聚類結(jié)果展示143.1.2 樣本歸類163.1.3 歸類代碼實(shí)現(xiàn)164.結(jié)論175參考文獻(xiàn)186附錄18模糊聚類與非模糊聚類比較分析摘要:聚類分析是根據(jù)樣本間的相似度實(shí)現(xiàn)對(duì)樣本的劃分,屬于無監(jiān)督分類。傳統(tǒng)的聚類分析是研究“非此即彼”的分類問題,分類結(jié)果樣本屬于哪一類很明確,而很多實(shí)際的分類問題常伴有模糊性,即它不僅僅是屬于一個(gè)特定的類,而是“既此又彼”。因此為了探究模糊聚類與非模糊聚類之間聚類結(jié)果的差別,本文首先采用系統(tǒng)聚類方法對(duì)上市公司132支股票數(shù)據(jù)進(jìn)行聚類,確定比較合理的聚類數(shù)目為11類,然后分別采用K-means聚類
3、與模糊聚類方法對(duì)股票數(shù)據(jù)進(jìn)行聚類分析,最終得出模糊聚類在本案例中比K-means聚類更符合實(shí)際。關(guān)鍵字:模糊集合,K-means聚類,F(xiàn)C婢類,WFC臊類1引言:聚類分析是多元統(tǒng)計(jì)分析的方法之一,屬于無監(jiān)督分類,是根據(jù)樣本集的內(nèi)在結(jié)構(gòu),按照樣本之間相似度進(jìn)行劃分,使得同類樣本之間相似性盡可能大,不同類樣本之間差異性盡可能大。傳統(tǒng)的聚類分析屬于硬化分,研究對(duì)象的性質(zhì)是非此即彼的,然而,現(xiàn)實(shí)生活中大多數(shù)事物具有亦此亦彼的性質(zhì)。因此傳統(tǒng)的聚類分析方法往往不能很好的解決具有模糊性的聚類問題。為此,模糊集合理論開始被應(yīng)用到分類領(lǐng)域,并取得不錯(cuò)成果。本文的研究目的是通過對(duì)比傳統(tǒng)聚類和模糊聚類的聚類結(jié)果,找
4、出二者之間的不同之處,并說明兩種聚類分析方法在實(shí)例中應(yīng)用的優(yōu)缺點(diǎn)。2理論準(zhǔn)備:2.1 模糊集合理論模糊集合定義:設(shè)U為論域,則稱由如下實(shí)值函數(shù)艮A:UT0,1,uTna(u)所確定白集合A為U上的模糊集合,而稱NA為模糊集合A的隸屬函數(shù),A(u)稱為元素u對(duì)于A的隸屬度。若Na(u)=1,則認(rèn)為u完全屬于A;若Na(u)=0,則認(rèn)為u完全不屬于A,模糊集合是經(jīng)典集合的推廣。2.2 模糊C均值聚類(FCM)預(yù)先給定類別數(shù)c,把含有n個(gè)樣本的數(shù)據(jù)集分成c個(gè)模糊類,用每個(gè)類的類別中心?行代表該類,通過反復(fù)迭代運(yùn)算,逐步降低目標(biāo)函數(shù)的誤差值,當(dāng)目標(biāo)函數(shù)收斂時(shí),聚類完成。目標(biāo)函數(shù):cnm2minJfcm
5、U,Pxj.jdij(1)一j二j約束條件:cij=1(2)?0,1,?i,j2.3 加權(quán)模糊C均值聚類(WFCM)算法過程與FC般似,只是目標(biāo)函數(shù)不同,WFCMJ法考慮了各樣本點(diǎn)對(duì)分類的重要性,在FCMMT法中加入了權(quán)值?蟹為樣本點(diǎn)的密度,本文中?氨用徑向基函數(shù)方法來確定,當(dāng)樣本點(diǎn)x遠(yuǎn)離類中心?粉寸函數(shù)取值很小,此時(shí)該樣本點(diǎn)對(duì)分類的重要性比較小。最常用的徑向基函數(shù)是高斯核函數(shù),形式為k(|x-Xc|)=exp1-|x-xc|A2/(2*<T-2)(3)目標(biāo)函數(shù):cnm2minJFCMU,P='"piijdij(4)iTjWij約束條件:c?0,1,?.=1(5)i1U
6、3聚類分析實(shí)例3.1 數(shù)據(jù)準(zhǔn)備3.1.1 數(shù)據(jù)表示本文采用數(shù)據(jù)是上市公司2000-2003年共4年132支股票31個(gè)變量的數(shù)據(jù)進(jìn)行聚類分析,表1是各變量所代表的含義。表1數(shù)據(jù)表示X1每股收益X2每股凈資產(chǎn),X30凈利潤(rùn)X31未分配利潤(rùn)3.1.2 數(shù)據(jù)預(yù)處理為了排除各因素變量的單位不同以及數(shù)量級(jí)間的懸殊差別帶來的影響,盡可能的反映實(shí)際情況,需要對(duì)數(shù)據(jù)進(jìn)行無量綱化處理。常用的處理方法有:標(biāo)準(zhǔn)化處理方法和極值處理方法。以下均采用“標(biāo)準(zhǔn)化”處理法。即取率XijXjXjSj(6)(i=1,2,,528;j=1,2,,31)其中x?為標(biāo)準(zhǔn)觀測(cè)值,其平均值和均方差分別為0和1。式中N(j=1,2SI)為第j
7、項(xiàng)指標(biāo)原始觀測(cè)值的平均值,Sj(j=1,2,,31)為第j項(xiàng)指標(biāo)原始觀測(cè)值的均方差。3.1.3 確定聚類個(gè)數(shù)如前文所述,聚類分析是無監(jiān)督分類,分類之前并不知道聚多少類是合適的,所以為了保證分類的合理性,首先借助SPS欹件對(duì)數(shù)據(jù)進(jìn)行系統(tǒng)聚類以確定合理的分類數(shù)。譜系聚類圖結(jié)果顯示如下,我們初步選擇在距離為5處截取,確定合理聚類數(shù)為11類。E3回立物。鵬文件星置蚣硯元35例助圖1系統(tǒng)聚類譜系圖3.2 借助clementine軟件進(jìn)行K-means聚類為了實(shí)現(xiàn)傳統(tǒng)聚類與模糊聚類結(jié)果的對(duì)比,這里首先對(duì)數(shù)據(jù)做了傳統(tǒng)的K均值聚類,具體的操作流程如下圖2所示50流1”-Clementirie12.0X號(hào)文件編
8、輯般視圖工具超節(jié)點(diǎn)街口幫助口口瑪過國(guó),Q5料r*向笨收喊爽源L臟勞量:本地加勢(shì)器蒙自定父商槍矩即記錄這項(xiàng)享段選項(xiàng)州折敷第官國(guó)變鈍穌計(jì)量舊慎95M日門61MB1報(bào)吉呢直也扇地|建模|輸出圖2clementine實(shí)現(xiàn)K-means過程3.2.1 樣本在各類中集中程度對(duì)模型結(jié)果進(jìn)行查看,得到各類中所包含的樣本個(gè)數(shù)如下圖3所示,發(fā)現(xiàn)樣本主要集中在第5,7,8,9,10類。甲逐裝類記錄由電果會(huì))對(duì)記錄®*魁3:4記錄i鑫X:12記錄申欣聚委5"記錄由原肥士近75記錄由鬣案類r93記錄4說累生火記錄宙點(diǎn)翳類丹筑記錄由由聚類一WT了記錄由益鬃類-11;I記錄圖3樣本在各類中集中程度3.2
9、.2 原始數(shù)據(jù)的分類結(jié)果圖4的最后兩列分別是樣本所屬類別和樣本與該類別的類中心之間的距離,如對(duì)于第1個(gè)樣本,屬于第1類,與類中心的距離是0.394。國(guó)文件輸iD生成畫互愿事壯160C2B00.3eoc.4一E00.5282.B282.7282.e303.S536.10636.11229.12229.135QL.14501.15501.16501.17248.10248.192*0.20248.口置業(yè)破.IwilJS?"./1.567O3EO12.3.2665290.O.85ie6fEO0.1.3058014.3.314147361,.1142B7;895.2.9040IE065.1.
10、84065(74,r4/T的吟上141989CO76.3.209721660.,-0,486653117,.Q35的4邰L-O482O4S832.4)342792938-3.6272636O.14715018.4.02614E216.107984154?.±?WJ.,U706史蟠070653858.4.62307343.7065368,.1351023915.359rEe?139.1341009710.206T50B937,.0474129004.3351767877.11566736.3.35614D069.0.263378090.0352301601.0230E9D712.Q54
11、1504753.32526633.1355764812.3.42570014571.323483045.【利或額左.1933213*15?3.5236434W.0.653175810.3.631643.1.955351981.£.5971211.1.923120537.4U?20糕:n.0.0470437372257J6E27J10.619001S68L7941理乳-0.O113994E1.12225E3967.-0.00305355.O.fl339231fiS.341斯53.2C15495332.4.3385272111.774445333.【親利甚萬元.昧分百瑞亞.Wk-Mean
12、sJKMD-K-Means5,加北機(jī).3.292129636.37413604.3.25828676.1.50005021.LB?838343.149621311.173433663.343166<.2.56238155.3S94U29A.-O6D90351J6.4.119J81365.1755351323.2095085783-4.23B79120b.3L16B47UOC126?9O1i21.16940513*1770759371927gSfl4C1.891640032.03342.05997722.1.053516139.-0,KU12O4.1334046661.095694432.
13、1017644870.*0,13078723.-1114699002.0.80733574.419676893.4.51788463.1054296192.2.157574311683045679.-1123050333.1.433375793.1.5d521292.1.89777231.B-BB85ci奧S-類類類S-S-S-奏類類盤類類權(quán)1.口4亢口54400300439O.S750.45505430532neJ3U43i055310361117OBJ6083003330316U3NU325iiT制tn,情帽rm*fliiwrwnirt。岫小訝癡1力痛此的m部圖4K-means聚類結(jié)果3.
14、2.3 結(jié)果分析分析總結(jié)上述K-means聚類結(jié)果:對(duì)這528個(gè)記錄的聚類結(jié)果中,在第1,3,5,11類中,樣本的個(gè)數(shù)都比較少,其中第11類僅有一個(gè)樣本,而第7,8,9類中樣本數(shù)分別高達(dá)93,181,97個(gè),這些類中樣本過于集中,說明得到的結(jié)果不是很理想,因此嘗試模糊狀態(tài)下對(duì)數(shù)據(jù)進(jìn)行聚類分析。3.3 模糊C均值聚類3.3.1 數(shù)據(jù)集的模糊C劃分設(shè)待分?jǐn)?shù)據(jù)集X=?,?,?也表示對(duì)上市公司股票的528次觀測(cè)數(shù)據(jù),?=?,?&,?31是第k個(gè)樣本的31個(gè)指標(biāo)向量的取值集合。對(duì)數(shù)據(jù)集進(jìn)行模糊聚類首先要產(chǎn)生X的模糊c劃分,由于聚類屬于無監(jiān)督分析,需要事先設(shè)定好聚類個(gè)數(shù),這里為了和傳統(tǒng)聚類分析結(jié)果
15、做出比較,把數(shù)據(jù)模糊化為11個(gè)模糊子集?,?,?1,且滿足:?U?U?U?1=?n?=?,1<wj<11;?W?,?W?1<i<110?=?表示樣本?沏于模本子集??程度,其中??£0,1,因此模糊劃分可以用隸屬度矩陣U=?表示。3.3.2 模糊C均值聚類的目標(biāo)函數(shù)求解方法針對(duì)上述2.2部分中模糊C均值聚類算法的目標(biāo)函數(shù)和約束條件,本文采用拉格朗日乘數(shù)法求解該數(shù)學(xué)規(guī)劃問題,分別求得隸屬度Uij和類中心vi表達(dá)式如下:”二一J(7)£y»k苴(dkj)VimUijXj(8)mUij調(diào)用MATLA飄件中自帶的fcm函數(shù)對(duì)上述數(shù)學(xué)規(guī)劃問題進(jìn)行求解
16、,其中fcm函數(shù)中一些參數(shù)設(shè)置如表2所示。表2參數(shù)設(shè)置參數(shù)設(shè)置最大迭代次數(shù)100終止誤差1.00E-05模糊度參數(shù)2聚類個(gè)數(shù)113.3.4 符號(hào)表示表3符號(hào)表示符號(hào)表小Center類中心U隸屬度矩陣obj_fcn目標(biāo)函數(shù)值Data樣本數(shù)據(jù)3.3.5 代碼實(shí)現(xiàn)過程導(dǎo)入數(shù)據(jù):Data1=xlsread('data')調(diào)用函數(shù):center,U,obj_fcn=fcm(data1,11)3.3.6 FCM聚類分析Matlab結(jié)果輸出如圖8,9,10,11所示,分別得到各樣本的初始化隸屬度矩陣,樣本各類的類中心,最終的樣本隸屬度,目標(biāo)函數(shù)的更新過程樣本模糊化1至心列0.02160.11
17、650.1C400.05030.03500.(6O.GOCS0.01921u6i0.1312O.tlo;0.0:OL。.幽D.09270門訥0.1U;o.osr0.102106721廢:喇iinso.crQ.:順0.U180,01500.11850.12200.26240,183:0.13&10.06240.0638二;工C.Q1730,C2969.11090.13510.11220.0549j.J6O40.119;fl.1U200371:231:.W1S0.1385O.tOcSo-osr0商tL陶0.11350,15050.15K0,0;130,0:9130.03310.053403
18、O.:63S0.1550|.13300,0344(U赫9。聞LD2T0.'3)0a.m0,14-50,咖;15334j.)63E0.1265t.0648丸佗耨0.0U00.0派0JW0.3541Q,噴1Q6:2。二而X一而。:期k%0,16200.13;90.01850.08:30,L1870.:4110,O724O.(i5450呢1口恒).11蛤0.C5150,C3440.138S0.0&44。門摭帕善0J短0.:1)00,17040J減1'0.03M0.2206CC9150J340小。湖0.0KLL班加13G90d.0i3S0.(9110照0.0939工的L:1)0
19、630.12530.V350.15450.(16240.US2D.09Q?0,0;30Q,陽3O.lliOq,購(gòu)0.:33o.om工收西O.kOQ(UI邢圖8初始化隸屬度矩陣截圖類中心(center)ffl11x91double12345E789100150.00190.02284330英-06-7.1758e-05-9,9971e-04-6.&456e04212B9e-O4-2.6923(2-26123e-043,3019e-04-0,0212-5.747-07-T1B43e-O5-1.7625e-04-1.1724&-M3739%-05465及3-aooio0.0013*0
20、.0222“2.9571405-49991e-05-7.02Me-C4-4.668;e-a414945自-8-1.8fl57(49.0295e-O4OW120-01932,S79Oe-O£43629e056.1口跳佻4,05211041.2971&-041,63&4(5QOO120.0016-0.019417536eOC5,77班-OS8,l323e-045.401Be-041.72B2e->4M760t6100130.00160.01933,85S4t*0£5,9978105845現(xiàn)狀5,6165eM1,7拈7b042,261曳7897MM0,CX&
21、gt;12-0.01932.0631c-Oe4337在-05砧“k-M4028沌-M12395十居1626913-2,91&k-M-3.776-04-0.02136.7041e-07-1338735-1,9634e-Q41,3O8?e-W4175加-05-5,2133(g43aHM5,688040-02041S6C06217厘052g6執(zhí)3L9630e-M6.31Q2e4006&102期短G2,fl&14e-04-0.02051.102注-061l,5O62e-OS2.0215e-041.c423e-044,3D91e-055.4fiB8(110.00190.00250
22、.02335S717e-Of3300e05-0.0013B.S867&-042.7524s04*3,4370(圖9類中心隸屬度矩陣(U)出11或8如他1234r3iFQIng10111009a,0.0&09-3D909。幽1080.090SO.QQOBM睢0D9aa1崛a,0.0&D9(i瞬3.09麗炳g網(wǎng)期009麗3幽0幅D.0909*3期9&M09網(wǎng)OjM«MM940.0909OlOTO010909BD9090JB1D(106100.09100.W1D-0.0909oos0.W1D5OTOaw®010909DJ0909W100.0910W
23、10。的1。).091000910廊&D.09090109MM909JJ09Q90J091Q0JB1O0.0910岫K期。(UH10MM1D70.0909ara-9090脆孤機(jī)00.09100.0910。.的W網(wǎng)城QOS0108OlDO0.09-M網(wǎng)0JQ9C9。碩9(L09K喇0.0909ojogogtk«09g9.0909Q109S0.09090J09O91D909O.K09D0M9AJ0909ftwogICD.V909麗Q腔網(wǎng)廁。曬9cmmM牌110.09Wmoo®009WojogogOJMO&0.0908(L蹴0,K-M。.伽aOJ0906IWOfi
24、圖10隸屬度矩陣圖8,9,10分別是模糊C均值聚類最終形成的類中心,隸屬度矩陣,目標(biāo)函數(shù)。由圖8可以看出各類的類中心相差不大,同時(shí)由圖9可以看出隸屬度矩陣幾乎沒有差別,從圖9中可以看出對(duì)目標(biāo)函數(shù),在3次迭代之后基本趨于平穩(wěn)狀態(tài),目標(biāo)函數(shù)值為1487.6,綜合上述分析認(rèn)為該聚類方法效果不好。在嘗試解決這個(gè)問題的過程中,嘗試修改fcm函數(shù)的模糊度參數(shù),迭代次數(shù),誤差項(xiàng)仍沒有取得較好結(jié)果,隨后為了避免單只股票4年的數(shù)據(jù)相似度太大而導(dǎo)致聚類效果差,分別抽取2000年到2003年各年的132只股票逐年進(jìn)行分析,仍舊沒有得出好的聚類結(jié)果,所以文中沒有進(jìn)行展示。考慮到各樣本點(diǎn)對(duì)聚類的結(jié)果產(chǎn)生的影響不同,下文
25、嘗試改進(jìn)的加權(quán)模糊C均值聚類方法。3. 4WFC算法由于MATLA呻沒有自帶WFCI®數(shù),需要自己進(jìn)行編程,數(shù)據(jù)的模糊化過程與模糊C均值聚類中相同,這里不再贅述。下面是WFC睚行的結(jié)果,具體代碼實(shí)現(xiàn)過程見附錄A3.1.1 WFCM聚類結(jié)果展示樣本模糊化1.1274Ql13K)0L1370XCOB50.0315Q.07KL0-54L舊50.06410L0H5LI熱0.038TL41EL比1G1UJ;工匚脛Q.幽叵轉(zhuǎn)J.L2610.03J4101744.0QQ;0J諭LaniL06SJ二不lL5il1陷o.m山。:井1CL630.1all(L師51m0.0j:0咫1.1220.12::O
26、.Osfi0.0532IO。湖(L喇11294(L0290LOS89口期口口國(guó)毋叮0.岡HE苒0.1791也UHltl?J0.10;:0.031$Q川;50JS510.0152LO5S1二面O.L"30.14;30.1126L版?LOS191L;ILC31511;141(1j40.1:341W二江四LCGS20.17250.0S?30121苻0.114511H30.0633o.in:0日511110CLOZH:U?2I(U瞄3GgXCi515011439XC-B?OAiJI2C5SXCJ1;010309:.L497L1L時(shí)工廠1工0.12:3j.L:JStu躺1W030.1245LW
27、0.1S16:/孤則加口洞VAt:八£:心3.U;1(Lil群LIE%:加Zl;13L府QJ*0琬:網(wǎng);:二端工LL以1(4150.11330LINE61:總(LOlLU4:'10;4;圖12樣本初始化隸屬度矩陣對(duì)比FCM聚類最終結(jié)果,可以得出在對(duì)目標(biāo)函數(shù)進(jìn)行加權(quán)之后,隸屬度矩陣和類中心都發(fā)生了明顯的改善,說明考慮了不同樣本對(duì)聚類結(jié)果的影響之后聚類結(jié)果更好。隸屬度矩陣data'dataluMobjfenX1cent笈h1k528double12w4567gg1ao9ic0.09100.0911ciogro.oeieo.oei70.0920omig0.09202aosn
28、0.09110.0912aO9120.09230,09210,09230.09210.09223Q09080.09090.0項(xiàng)7QO9O70.08980.09000.069770.09000.090240.09100.0911oiogr0,0924o.mio,n270,09230,092053591。0.09100,0910aogio0.09160.09150,09160.09150.09146009050.09090.0910aogog0.091&D.OT140,0918O.OQ150.05107oom0,03080.09兜QO9O80,08990,09020,08970,09000
29、.09038009060.09060.0934a09040.08830.08880,08810.08860.0887gaO9O60.09030.09)s|GOgOs10,09020.0MO.OSOlt。的03O.OMSj0aosio0.09100.0911Q0911D.091B0,09170,091910.09170.09151aom0.09080.0958QO9O80.09020.OT030.(»010.00020.0502圖13WFC廉屬度矩陣類中心datadatalU1|ohjfen1center:1:11x31double12345678g10.00700.00730.007
30、4-5.27*04口.020。0.0056-0.0143-0.00560.00892QQ197QJ240。值及-0.0015370515QQ179-o,cross2-0.0246-0.0309-0.0257-2.2722e-040.0065-0.01&E-0.0161-0.0061-0.005240XJ2B70.03780.03770.00230.028800208>0.0025氏869騙040.019850.01500,0140,0W0.00180.001?0-01040.0100O.GO385.14絲60.02450.03550.03600.00420.01800.019E0
31、.00890.00400.0119702500,0319-0.0318-0.00190.0161-0,0176L48O0e-O4-00108fl-0.0389心0539-0.05100.00305.8914-04-0.0257-041肺-0.004S-0.00749-0,OOB20.0133-0.01310.0016D.OO35-0.0056-0.00144.6867e-04-0.0010W0.01790.02380.022872742e-04-0,00&10.01300.01920.00640.002911-0.0112-0.0075goonai061e-M-0.0185-0.004
32、3-0.0013.4846e-04-0.0097圖14WFC跳中心3.1.2 樣本歸類計(jì)算出U,V,obj_fcn之后,對(duì)樣本進(jìn)行明確的歸類,這一過程可以通過下面兩個(gè)判定準(zhǔn)則來確定:判定準(zhǔn)則1如果??=min?(1<j<c),則將樣本??如屬于第i類。這個(gè)判定準(zhǔn)則的意義是樣本與哪一個(gè)聚類中心最接近,就將它歸到哪一類。判定準(zhǔn)則2如果??=max?(1<j<c),這個(gè)判定準(zhǔn)則的意義是樣本對(duì)哪一個(gè)類的隸屬度最大,就將它歸到哪一類。3.1.3 歸類代碼實(shí)現(xiàn)下面我們以判定準(zhǔn)則2來劃分樣本的類別,代碼過程如下:maxUmax(U):> >indexl-find(U(L:
33、)。maxU);inds2-findU(2)maxU);> >indexS=find見)=maxU);> >index4-find(J(4,)=maxU);> >indexB-findU(5,:)-maxU);> >index6-find(U£fi.:)=maxJ):> >in品x7=find<U(7,;)=皿能;>>indesS=finddlO,:J=maKW):>>index9=find(11(9,:)=maxU);irudexlO=fJLndwU'.1Q,:)=maxU.);>
34、;>ind&xll=find(11(11,:)戶m鄱U);圖15分類代碼3.4.4樣本歸類結(jié)果及分析運(yùn)行圖11中代碼,得到結(jié)果如圖16所示:工作區(qū)indejtlndexIOindexll-FindexSindsxSindej(4inde*5ind皆index7indexBindexPmayU名稱16樣本歸類結(jié)果值52,147p167,175r213x44t/cifb/e1j(6Qaoiibe102眼3股弱0.50IjflS/口“bJe1J7#7mdoMe-63J51J7621571.1jc63double打127doMe1y528d匕此0由圖16可以看出,最終樣本歸為10類,除了
35、第2和9類中樣本比較多,其他各類中樣本分布比較均勻,聚類結(jié)果可以接受。4.結(jié)論非模糊聚類直接根據(jù)樣本之間相似性進(jìn)行歸類,而模糊聚類是根據(jù)樣本的隸屬度矩陣和相似性矩陣進(jìn)行歸類,其中樣本??隸屬于i類的程度即隸屬度,可在0到1之間取值,而不是如傳統(tǒng)聚類算法中,樣本??隸屬于類的隸屬度只有兩種取值1或0,即屬于與不屬于。這樣,樣本??7不再明確地屬于某一類,而是對(duì)于每一個(gè)類別都有一個(gè)隸屬度,隸屬度的數(shù)值越大說明樣本隸屬于該類的程度越大反之則越小。模糊聚類的這種模糊劃分描述了樣本聚類過程中的模糊現(xiàn)象,從而可以獲得更為合理的聚類結(jié)果。對(duì)比K-means聚類結(jié)果圖3和WFC臊類結(jié)果圖13,圖16,發(fā)現(xiàn)非模
36、糊聚類結(jié)果中樣本集中在第6,7,8,9類中,而在加入了模糊隸屬度之后,模糊聚類結(jié)果有了各個(gè)樣本屬于11個(gè)類的程度,按隸屬度最大原則對(duì)樣本進(jìn)行歸類之后發(fā)現(xiàn)除了第5類之外,樣本在各類中的分布相對(duì)更加均勻,說明聚類目的基本達(dá)到.具體到本文所采用的股票數(shù)據(jù)的聚類結(jié)果,可以看出模糊聚類比傳統(tǒng)的聚類結(jié)果更為合理,因此模糊聚類的優(yōu)勢(shì)得到充分體現(xiàn)。5參考文獻(xiàn)1 ZadehLA.FuzzySets.InformationandControl.1965,8:338-353.2 ChanKP,CheungYS.ClusteringofclustersJ.PatternRecognition,1992,25(2):2
37、11-2173楊綸標(biāo),高英儀學(xué)原理及應(yīng)用華南理工大學(xué)出版社2005.652-774姚曉紅.模糊聚類分析方法在甘肅農(nóng)業(yè)經(jīng)濟(jì)類型劃分中的應(yīng)用D.蘭州交通大學(xué),2013.5廖芹,郝志峰數(shù)據(jù)挖掘與數(shù)學(xué)建模國(guó)防工業(yè)出版社20096高新波模糊聚類分析及其應(yīng)用西安電子科技大學(xué)也出版社20047葉海軍.模糊聚類分析技術(shù)及其應(yīng)用研究D.合肥工業(yè)大學(xué),20068張秀梅,王濤模糊聚類分析方法在學(xué)生成績(jī)?cè)u(píng)價(jià)中的應(yīng)用J渤海大學(xué)學(xué)報(bào):自然科學(xué)版,2007,28(2)169-172.9湯效琴,戴汝源數(shù)據(jù)挖掘中聚類分析的技術(shù)方法寧夏大學(xué)學(xué)報(bào)2006.76附錄附錄AWFCMHi碼functioncenter,U,obj_fcn
38、=KFCMClust(data,cluster_n,kernel_b,options)error(nargchk(2,4,nargin);%檢查輸入?yún)?shù)個(gè)數(shù)data_n=size(data,1);%求出data的第一維(rows)數(shù),即樣本個(gè)數(shù)in_n=size(data,2);%求出data的第二維(columns)數(shù),即特征值長(zhǎng)度,目前沒有用%默認(rèn)操作參數(shù)default_b=150;%圖斯核圖數(shù)參數(shù)default_options=2;%隸屬度矩陣U的指數(shù)100;%最大迭代次數(shù)1e-5;%隸屬度戢小變化量,迭代終止條件1;%每次迭代是否輸出信息標(biāo)志ifnargin=2,kernel_b=de
39、fault_b;options=default_options;elseifnargin=3,options=default_options;elseiflength(options)<4,tmp=default_options;tmp(1:length(options)=options;options=tmp;endnan_index=find(isnan(options)=1);%將denfault_options中對(duì)應(yīng)位置的參數(shù)賦值給options中不是數(shù)的位置.options(nan_index)=default_options(nan_index);ifoptions(1)&l
40、t;=1,%如果options中的指數(shù)m不超過1報(bào)錯(cuò)error('Theexponentshouldbegreaterthan1!');endend%等options中的分量分別賦值給四個(gè)變量expo=options(1);%max_iter=options(2);%min_impro=options(3);%display=options(4);%隸屬度矩陣U的指數(shù)最大迭代次數(shù)隸屬度最小變化量,迭代終止條件每次迭代是否輸出信息標(biāo)志obj_fcn=zeros(max_iter,1);%初始化輸出參數(shù)obj_fcnU=initkfcm(cluster_n,data_n)%初始化模
41、糊分配矩陣%初始化聚類中心:從樣本數(shù)據(jù)點(diǎn)中任意選取cluster_n個(gè)樣本作為聚類中心index=randperm(data_n);%對(duì)樣本序數(shù)隨機(jī)排列center_old=data(index(1:cluster_n),:);%選取隨機(jī)排列的序數(shù)的前cluster_n個(gè)fori=1:max_iter,%在第k步循環(huán)中改變聚類中心ceneter,和分配函數(shù)U的隸屬度值;U,center,obj_fcn(i)=stepkfcm(data,U,center_old,expo,kernel_b);ifdisplay,fprintf('KFCM:Iterationcount=%d,obj.fcn=%fn
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 九年級(jí)語文下冊(cè) 第1單元寫作學(xué)習(xí)擴(kuò)寫教學(xué)實(shí)錄(pdf) 新人教版
- 一年級(jí)道德與法治上冊(cè) 第一單元 我是小學(xué)生啦 2 認(rèn)識(shí)新朋友教學(xué)實(shí)錄設(shè)計(jì)1 鄂教版
- 五年級(jí)數(shù)學(xué)(小數(shù)除法)計(jì)算題專項(xiàng)練習(xí)及答案
- 一年級(jí)數(shù)學(xué)計(jì)算題專項(xiàng)練習(xí)1000題匯編
- 高中生物 第2章 動(dòng)物和人體生命活動(dòng)的調(diào)節(jié) 第2節(jié) 通過激素的調(diào)節(jié)教學(xué)實(shí)錄 新人教版必修3
- 山東省煙臺(tái)市黃務(wù)中學(xué)六年級(jí)生物下冊(cè) 開花和結(jié)果教學(xué)實(shí)錄 魯教版五四制
- 合租生意合同范例
- 勞動(dòng)個(gè)人合同范本版
- 印刷材料 合同范本
- 單位鏟車購(gòu)銷合同范例
- 影視作品的療愈效能與構(gòu)建路徑
- 電子公章申請(qǐng)請(qǐng)示范文2
- 2024-2030年中國(guó)合同能源管理(EMC)行業(yè)發(fā)展前景規(guī)劃分析報(bào)告
- 《中華人民共和國(guó)文物保護(hù)法》知識(shí)專題培訓(xùn)
- 2024年高考全國(guó)甲卷英語試卷(含答案)
- 四年級(jí)數(shù)學(xué)(四則混合運(yùn)算)計(jì)算題專項(xiàng)練習(xí)與答案匯編
- 8年級(jí)上冊(cè)(人教版)物理電子教材-初中8~9年級(jí)物理電子課本
- 人教版高中英語新教材必修2單詞默寫表
- 中金公司在線測(cè)評(píng)真題
- 項(xiàng)目資金管理統(tǒng)籌實(shí)施方案
- 2024年秋新滬科版物理八年級(jí)上冊(cè) 6.3來自地球的力 教學(xué)課件
評(píng)論
0/150
提交評(píng)論