




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、模糊聚類(lèi)分析方法 對(duì)所研究的事物按一定標(biāo)準(zhǔn)進(jìn)行分類(lèi)的數(shù)學(xué)方法稱(chēng)為聚類(lèi)分析,它是多元統(tǒng)計(jì)“物以類(lèi)聚”的一種分類(lèi)方法。載科學(xué)技術(shù)、經(jīng)濟(jì)管理中常常要按一定的標(biāo)準(zhǔn)(相似程度或親疏關(guān)系)進(jìn)行分類(lèi)。例如,根據(jù)生物的某些性狀可對(duì)生物分類(lèi),根據(jù)土壤的性質(zhì)可對(duì)土壤分類(lèi)等。由于科學(xué)技術(shù)、經(jīng)濟(jì)管理中的分類(lèi)界限往往不分明,因此采用模糊聚類(lèi)方法通常比較符合實(shí)際。一、模糊聚類(lèi)分析的一般步驟1、第一步:數(shù)據(jù)標(biāo)準(zhǔn)化9(1) 數(shù)據(jù)矩陣 設(shè)論域?yàn)楸环诸?lèi)對(duì)象,每個(gè)對(duì)象又有個(gè)指標(biāo)表示其性狀,即 ,于是,得到原始數(shù)據(jù)矩陣為 。其中表示第個(gè)分類(lèi)對(duì)象的第個(gè)指標(biāo)的原始數(shù)據(jù)。(2) 數(shù)據(jù)標(biāo)準(zhǔn)化 在實(shí)際問(wèn)題中,不同的數(shù)據(jù)一般有不同的量綱,為了使
2、不同的量綱也能進(jìn)行比較,通常需要對(duì)數(shù)據(jù)做適當(dāng)?shù)淖儞Q。但是,即使這樣,得到的數(shù)據(jù)也不一定在區(qū)間上。因此,這里說(shuō)的數(shù)據(jù)標(biāo)準(zhǔn)化,就是要根據(jù)模糊矩陣的要求,將數(shù)據(jù)壓縮到區(qū)間上。通常有以下幾種變換: 平移標(biāo)準(zhǔn)差變換 其中 , 。 經(jīng)過(guò)變換后,每個(gè)變量的均值為0,標(biāo)準(zhǔn)差為1,且消除了量綱的影響。但是,再用得到的還不一定在區(qū)間上。 平移極差變換 ,顯然有,而且也消除了量綱的影響。 對(duì)數(shù)變換 取對(duì)數(shù)以縮小變量間的數(shù)量級(jí)。2、第二步:標(biāo)定(建立模糊相似矩陣) 設(shè)論域,依照傳統(tǒng)聚類(lèi)方法確定相似系數(shù),建立模糊相似矩陣,與的相似程度。確定的方法主要借用傳統(tǒng)聚類(lèi)的相似系數(shù)法、距離法以及其他方法。具體用什么方法,可根據(jù)問(wèn)
3、題的性質(zhì),選取下列公式之一計(jì)算。(1) 相似系數(shù)法 夾角余弦法 。 最大最小法 。 算術(shù)平均最小法 。 幾何平均最小法 。以上3種方法中要求,否則也要做適當(dāng)變換。 數(shù)量積法 ,其中 。 相關(guān)系數(shù)法 ,其中 ,。 指數(shù)相似系數(shù)法 ,其中 ,而 。(2) 距離法 直接距離法 ,其中為適當(dāng)選取的參數(shù),使得,表示他們之間的距離。經(jīng)常用的距離有 海明距離 。 歐幾里得距離 。 切比雪夫距離 。 倒數(shù)距離法 。其中為適當(dāng)選取的參數(shù),使得。 指數(shù)距離法 。3、第三步:聚類(lèi)(求動(dòng)態(tài)聚類(lèi)圖)(1)基于模糊等價(jià)矩陣聚類(lèi)方法 傳遞閉包法 根據(jù)標(biāo)定所得的模糊矩陣還要將其改造稱(chēng)模糊等價(jià)矩陣。用二次方法求的傳遞閉包,即=
4、。再讓由大變小,就可形成動(dòng)態(tài)聚類(lèi)圖。 布爾矩陣法10 布爾矩陣法的理論依據(jù)是下面的定理: 定理2.2.1 設(shè)是上的一個(gè)相似的布爾矩陣,則具有傳遞性(當(dāng)是等價(jià)布爾矩陣時(shí))矩陣在任一排列下的矩陣都沒(méi)有形如的特殊子矩陣。 布爾矩陣法的具體步驟如下: 求模糊相似矩陣的截矩陣. 若按定理2.2.1判定為等價(jià)的,則由可得在水平上的分類(lèi),若判定為不等價(jià),則在某一排列下有上述形式的特殊子矩陣,此時(shí)只要將其中特殊子矩陣的0一律改成1直到不再產(chǎn)生上述形式的子矩陣即可。如此得到的為等價(jià)矩陣。因此,由可得水平上的分類(lèi) (2) 直接聚類(lèi)法 所謂直接聚類(lèi)法,是指在建立模糊相似矩陣之后,不去求傳遞閉包,也不用布爾矩陣法,而
5、是直接從模糊相似矩陣出發(fā)求得聚類(lèi)圖。其步驟如下: 取(最大值),對(duì)每個(gè)作相似類(lèi),且 =,即將滿(mǎn)足的與放在一類(lèi),構(gòu)成相似類(lèi)。相似類(lèi)與等價(jià)類(lèi)的不同之處是,不同的相似類(lèi)可能有公共元素,即可出現(xiàn) ,.此時(shí)只要將有公共元素的相似類(lèi)合并,即可得水平上的等價(jià)分類(lèi)。 取為次大值,從中直接找出相似度為的元素對(duì)(即),將對(duì)應(yīng)于的等價(jià)分類(lèi)中所在的類(lèi)與所在的類(lèi)合并,將所有的這些情況合并后,即得到對(duì)應(yīng)于的等價(jià)分類(lèi)。 取為第三大值,從中直接找出相似度為的元素對(duì)(即),將對(duì)應(yīng)于的等價(jià)分類(lèi)中所在的類(lèi)與所在的類(lèi)合并,將所有的這些情況合并后,即得到對(duì)應(yīng)于的等價(jià)分類(lèi)。 以此類(lèi)推,直到合并到成為一類(lèi)為止。二、最佳閾值的確定 在模糊聚
6、類(lèi)分析中對(duì)于各個(gè)不同的,可得到不同的分類(lèi),許多實(shí)際問(wèn)題需要選擇某個(gè)閾值,確定樣本的一個(gè)具體分類(lèi),這就提出了如何確定閾值的問(wèn)題。一般有以下兩個(gè)方法: 按實(shí)際需要,在動(dòng)態(tài)聚類(lèi)圖中,調(diào)整的值以得到適當(dāng)?shù)姆诸?lèi),而不需要事先準(zhǔn)確地估計(jì)好樣本應(yīng)分成幾類(lèi)。當(dāng)然,也可由具有豐富經(jīng)驗(yàn)的專(zhuān)家結(jié)合專(zhuān)業(yè)知識(shí)確定閾值,從而得出在水平上的等價(jià)分類(lèi) 用F統(tǒng)計(jì)量確定最佳值。11 設(shè)論域?yàn)闃颖究臻g(樣本總數(shù)為),而每個(gè)樣本有個(gè)特征:,。于是得到原始數(shù)據(jù)矩陣,如下表所示,其中,稱(chēng)為總體樣本的中心向量。 樣本 指 標(biāo)1 2 k m 設(shè)對(duì)應(yīng)于值的分類(lèi)數(shù)為,第類(lèi)的樣本數(shù)為,第類(lèi)的樣本記為:,第類(lèi)的聚類(lèi)中心為向量,其中為第個(gè)特征的平均值
7、,即 ,作統(tǒng)計(jì)量 ,其中 為與間的距離,為第類(lèi)中第個(gè)樣本與其中心間的距離。稱(chēng)為統(tǒng)計(jì)量,它是遵從自由度為,的分布。它的分子表征類(lèi)與類(lèi)之間的距離,分母表征類(lèi)內(nèi)樣本間的距離。因此,值越大,說(shuō)明類(lèi)與類(lèi)之間的距離越大;類(lèi)與類(lèi)間的差異越大,分類(lèi)就越好。 基于模糊聚類(lèi)分析的多屬性決策方法的實(shí)際應(yīng)用聚類(lèi)分析是將事物根據(jù)一定的特征,并按某種特定要求或規(guī)律分類(lèi)的方法。由于聚類(lèi)分析的對(duì)象必定是尚未分類(lèi)的群體,而且現(xiàn)實(shí)的分類(lèi)問(wèn)題往往帶有模糊性,對(duì)帶有模糊特征的事物進(jìn)行聚類(lèi)分析,分類(lèi)過(guò)程中不是僅僅考慮事物之間有無(wú)關(guān)系,而是考慮事物之間關(guān)系的深淺程度,顯然用模糊數(shù)學(xué)的方法處理更為自然,因此稱(chēng)為模糊聚類(lèi)分析。第一節(jié) 雨量站
8、問(wèn)題一、問(wèn)題的提出某地區(qū)設(shè)置有11個(gè)雨量站,其分布圖見(jiàn)圖1,10年來(lái)各雨量站所測(cè)得的年降雨量列入表1中?,F(xiàn)因經(jīng)費(fèi)問(wèn)題,希望撤銷(xiāo)幾個(gè)雨量站,問(wèn)撤銷(xiāo)那些雨量站,而不會(huì)太多的減少降雨信息? 圖1 雨量站分布圖表1 各雨量站10年間測(cè)得的降雨量年序號(hào)12763241594132922583113031752433202251287349344310454285451402307470319243329056347950222122032041123242462322432812673102733152853273525291311502388330410352267603290292646615822
9、417816420350232024027835072583274324013613813014134021994218453365357452384420482228360316252915827141030828341020117943034218510324406235520442520358343251282371二、問(wèn)題的分析應(yīng)該撤銷(xiāo)那些雨量站,涉及雨量站的分布,地形,地貌,人員,設(shè)備等眾多因素。我們僅考慮盡可能地減少降雨信息問(wèn)題。一個(gè)自然的想法是就10年來(lái)各雨量站所獲得的降雨信息之間的相似性,對(duì)全部雨量站進(jìn)行分類(lèi),撤去“同類(lèi)”(所獲降雨信息十分相似)的雨量站中“多余”的站。問(wèn)題求解
10、 假設(shè)為使問(wèn)題簡(jiǎn)化,特作如下假設(shè) 每個(gè)觀測(cè)站具有同等規(guī)模及儀器設(shè)備; 每個(gè)觀測(cè)站的經(jīng)費(fèi)開(kāi)支均等;具有相同的被裁可能性。分析:對(duì)上述撤銷(xiāo)觀測(cè)站的問(wèn)題用基于模糊等價(jià)矩陣的模糊聚類(lèi)方法進(jìn)行分析,原始數(shù)據(jù)如上。三、問(wèn)題的解決求解步驟:1、數(shù)據(jù)的收集 原始數(shù)據(jù)如表1所示。2、建立模糊相似矩陣?yán)孟嚓P(guān)系數(shù)法,構(gòu)造模糊相似關(guān)系矩陣,其中 其中,1,2,,11。 ,1,2,,11。 取,代入公式得=0.839,由于運(yùn)算量巨大用C語(yǔ)言編程計(jì)算出其余數(shù)值,得模糊相似關(guān)系矩陣,具體程序如下#include#includedouble r1111; double x11;void main() int i,j,k;
11、double fenzi=0,fenmu1=0,fenmu2=0,fenmu=0;int year1011=276,324,159,413,292,258,311,303,175,243,320,251,287,349,344,310,454,285,451,402,307,470,192,433,290,563,479,502,221,220,320,411,232,246,232,243,281,267,310,273,315,285,327,352,291,311,502,388,330,410,352,267,603,290,292,466,158,224,178,164,203,50
12、2,320,240,278,350,258,327,432,401,361,381,301,413,402,199,421,453,365,357,452,384,420,482,228,360,316,252,158,271,410,308,283,410,201,179,430,342,185,324,406,235,520,442,520,358,343,251,282,371;for(i=0;i11;i+) for(k=0;k10;k+) xi=xi+yearki; xi=xi/10;for(i=0;i11;i+)for(j=0;j11;j+) for(k=0;k10;k+) fenz
13、i=fenzi+fabs(yearki-xi)*(yearkj-xj); fenmu1=fenmu1+(yearki-xi)*(yearki-xi); fenmu2=fenmu2+(yearkj-xj)*(yearkj-xj); fenmu=sqrt(fenmu1)*sqrt(fenmu2);rij=fenzi/fenmu; fenmu=fenmu1=fenmu2=fenzi=0; for(i=0;i11;i+) for(j=0;j11;j+) printf(%6.3f,rij); printf(n);getchar();得到模糊相似矩陣1.000 0.839 0.528 0.844 0.82
14、8 0.702 0.995 0.671 0.431 0.573 0.712 0.839 1.000 0.542 0.996 0.989 0.899 0.855 0.510 0.475 0.617 0.572 0.528 0.542 1.000 0.562 0.585 0.697 0.571 0.551 0.962 0.642 0.568 0.844 0.996 0.562 1.000 0.992 0.908 0.861 0.542 0.499 0.639 0.607 0.828 0.989 0.585 0.992 1.000 0.922 0.843 0.526 0.512 0.686 0.58
15、4 0.702 0.899 0.697 0.908 0.922 1.000 0.726 0.455 0.667 0.596 0.511 0.995 0.855 0.571 0.861 0.843 0.726 1.000 0.676 0.489 0.587 0.719 0.671 0.510 0.551 0.542 0.526 0.455 0.676 1.000 0.467 0.678 0.994 0.431 0.475 0.962 0.499 0.512 0.667 0.489 0.467 1.000 0.487 0.485 0.573 0.617 0.642 0.639 0.686 0.59
16、6 0.587 0.678 0.487 1.000 0.688 0.712 0.572 0.568 0.607 0.584 0.511 0.719 0.994 0.485 0.688 1.000對(duì)這個(gè)模糊相似矩陣用平方法作傳遞閉包運(yùn)算,求 即。3、聚類(lèi)注:是對(duì)稱(chēng)矩陣,故只寫(xiě)出它的下三角矩陣取0.996,則在置信水平為0.996的閾值下相似度為1,故同屬一類(lèi),所以此時(shí)可以將觀測(cè)站分為9類(lèi),,,,,,。降低置信水平,對(duì)不同的作同樣分析,得到:0.995時(shí),可分為8類(lèi),即,,,,,,。=0.994時(shí),可分為7類(lèi),,, ,,,。=0.962時(shí),可分為6類(lèi),,, ,, ,。0.719時(shí),可分為5類(lèi),,,
17、 ,,,。第二節(jié) 成績(jī)?cè)u(píng)價(jià)問(wèn)題一、問(wèn)題的提出某高中高二有7個(gè)班級(jí),學(xué)生成績(jī)的好與差,沒(méi)有明確的評(píng)定界限,并且班級(jí)間成績(jī)好壞的表現(xiàn)具有一定的模糊不確定性。二、問(wèn)題的分析解決上述問(wèn)題可運(yùn)用模糊聚類(lèi)分析方法?,F(xiàn)以7個(gè)班級(jí)某次其中考試的四門(mén)主課成績(jī)?yōu)橐罁?jù),對(duì)7個(gè)班級(jí)成績(jī)好壞的相關(guān)程度分類(lèi)。設(shè)7個(gè)班級(jí)組成一個(gè)分類(lèi)集合:分別代表1班到7班。每個(gè)班級(jí)成績(jī)均是四門(mén)基礎(chǔ)課(語(yǔ)文、數(shù)學(xué)、英語(yǔ)、綜合)作為四項(xiàng)統(tǒng)計(jì)指標(biāo),即有這里表示為第個(gè)班級(jí)的第門(mén)基礎(chǔ)課指標(biāo)。這四項(xiàng)成績(jī)指標(biāo)為:語(yǔ)文平均成績(jī),數(shù)學(xué)平均成績(jī),英語(yǔ)平均成績(jī),綜合平均成績(jī)。各班級(jí)成績(jī)指標(biāo)值見(jiàn)表1。表1 7個(gè)班4門(mén)基礎(chǔ)課的成績(jī)指標(biāo) 三、問(wèn)題的解決1、數(shù)據(jù)標(biāo)準(zhǔn)化
18、12采用極差變換, (1)式中是第i個(gè)班級(jí)第門(mén)基礎(chǔ)課平均成績(jī)的原始數(shù)據(jù),和分別為不同班級(jí)的同一門(mén)基礎(chǔ)課平均成績(jī)的最大值和最小值。為第個(gè)班級(jí)第門(mén)基礎(chǔ)課平均成績(jī)指標(biāo)的標(biāo)準(zhǔn)化數(shù)值。當(dāng)時(shí),當(dāng) 時(shí),。 表2 平均成績(jī)指標(biāo)值的標(biāo)準(zhǔn)化數(shù)值2、用最大最小法建立相似矩陣 計(jì)算模糊相似矩陣R,根據(jù)標(biāo)準(zhǔn)化數(shù)值建立各班級(jí)之間四門(mén)基礎(chǔ)課成績(jī)指標(biāo)的相似關(guān)系矩陣,采用最大最小法來(lái)計(jì)算: 其中是表示第個(gè)班級(jí)與第個(gè)班級(jí)在四門(mén)基礎(chǔ)課成績(jī)指標(biāo)上的相似程度的量。取,=0,其余運(yùn)算量可以通過(guò)MATLAB編程運(yùn)算,程序如下:13clcclear allmeanp=0 0.0273 1 0.6119 0.7368 0.7229 0.2911; 0 0.2553 0.7791 0.8385 0.4587 0.5341 1; 0.4285 0 0.8492 1 0.3966 0.5439 0.9513;
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 民政行業(yè)扶貧管理辦法
- 自然觀察法在小學(xué)科學(xué)教育中的應(yīng)用研究
- 城市森林公園生態(tài)服務(wù)公眾偏好調(diào)查
- 語(yǔ)言接觸與習(xí)得模式-洞察及研究
- 安全生產(chǎn)事故報(bào)告內(nèi)容包括
- 清腦降壓市場(chǎng)分析-洞察及研究
- 網(wǎng)絡(luò)安全培訓(xùn)管理
- 角磨機(jī)安全事故報(bào)告
- 上海企業(yè)安全生產(chǎn)許可證怎么查詢(xún)
- 安全生產(chǎn)月個(gè)人工作總結(jié)
- 《中國(guó)特色社會(huì)主義理論體系的形成和發(fā)展》(課件)
- 職業(yè)技術(shù)學(xué)院嬰幼兒托育服務(wù)與管理專(zhuān)業(yè)人才培養(yǎng)方案
- 2025臺(tái)州市椒江區(qū)輔警考試試卷真題
- 中學(xué)生零食消費(fèi)情況調(diào)查與分析
- 國(guó)開(kāi)本科《管理英語(yǔ)4》機(jī)考總題庫(kù)及答案
- 軟裝行業(yè)競(jìng)品分析報(bào)告
- 公司收購(gòu)公司協(xié)議書(shū)
- 基于移動(dòng)端的互聯(lián)網(wǎng)金融服務(wù)創(chuàng)新研究
- T∕CACM 024-2017 中醫(yī)臨床實(shí)踐指南 穴位埋線(xiàn)減肥
- 小號(hào)獨(dú)奏名曲100首
- 電廠(chǎng)安全知識(shí)培訓(xùn)
評(píng)論
0/150
提交評(píng)論