模糊聚類分析方法_第1頁
模糊聚類分析方法_第2頁
模糊聚類分析方法_第3頁
模糊聚類分析方法_第4頁
模糊聚類分析方法_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、模糊聚類分析方法 對所研究的事物按一定標準進行分類的數(shù)學方法稱為聚類分析,它是多元統(tǒng)計“物以類聚”的一種分類方法。載科學技術(shù)、經(jīng)濟管理中常常要按一定的標準(相似程度或親疏關(guān)系)進行分類。例如,根據(jù)生物的某些性狀可對生物分類,根據(jù)土壤的性質(zhì)可對土壤分類等。由于科學技術(shù)、經(jīng)濟管理中的分類界限往往不分明,因此采用模糊聚類方法通常比較符合實際。一、模糊聚類分析的一般步驟1、第一步:數(shù)據(jù)標準化9(1) 數(shù)據(jù)矩陣 設(shè)論域為被分類對象,每個對象又有個指標表示其性狀,即 ,于是,得到原始數(shù)據(jù)矩陣為 。其中表示第個分類對象的第個指標的原始數(shù)據(jù)。(2) 數(shù)據(jù)標準化 在實際問題中,不同的數(shù)據(jù)一般有不同的量綱,為了使

2、不同的量綱也能進行比較,通常需要對數(shù)據(jù)做適當?shù)淖儞Q。但是,即使這樣,得到的數(shù)據(jù)也不一定在區(qū)間上。因此,這里說的數(shù)據(jù)標準化,就是要根據(jù)模糊矩陣的要求,將數(shù)據(jù)壓縮到區(qū)間上。通常有以下幾種變換: 平移標準差變換 其中 , 。 經(jīng)過變換后,每個變量的均值為0,標準差為1,且消除了量綱的影響。但是,再用得到的還不一定在區(qū)間上。 平移極差變換 ,顯然有,而且也消除了量綱的影響。 對數(shù)變換 取對數(shù)以縮小變量間的數(shù)量級。2、第二步:標定(建立模糊相似矩陣) 設(shè)論域,依照傳統(tǒng)聚類方法確定相似系數(shù),建立模糊相似矩陣,與的相似程度。確定的方法主要借用傳統(tǒng)聚類的相似系數(shù)法、距離法以及其他方法。具體用什么方法,可根據(jù)問

3、題的性質(zhì),選取下列公式之一計算。(1) 相似系數(shù)法 夾角余弦法 。 最大最小法 。 算術(shù)平均最小法 。 幾何平均最小法 。以上3種方法中要求,否則也要做適當變換。 數(shù)量積法 ,其中 。 相關(guān)系數(shù)法 ,其中 ,。 指數(shù)相似系數(shù)法 ,其中 ,而 。(2) 距離法 直接距離法 ,其中為適當選取的參數(shù),使得,表示他們之間的距離。經(jīng)常用的距離有 海明距離 。 歐幾里得距離 。 切比雪夫距離 。 倒數(shù)距離法 。其中為適當選取的參數(shù),使得。 指數(shù)距離法 。3、第三步:聚類(求動態(tài)聚類圖)(1)基于模糊等價矩陣聚類方法 傳遞閉包法 根據(jù)標定所得的模糊矩陣還要將其改造稱模糊等價矩陣。用二次方法求的傳遞閉包,即=

4、。再讓由大變小,就可形成動態(tài)聚類圖。 布爾矩陣法10 布爾矩陣法的理論依據(jù)是下面的定理: 定理2.2.1 設(shè)是上的一個相似的布爾矩陣,則具有傳遞性(當是等價布爾矩陣時)矩陣在任一排列下的矩陣都沒有形如的特殊子矩陣。 布爾矩陣法的具體步驟如下: 求模糊相似矩陣的截矩陣. 若按定理2.2.1判定為等價的,則由可得在水平上的分類,若判定為不等價,則在某一排列下有上述形式的特殊子矩陣,此時只要將其中特殊子矩陣的0一律改成1直到不再產(chǎn)生上述形式的子矩陣即可。如此得到的為等價矩陣。因此,由可得水平上的分類 (2) 直接聚類法 所謂直接聚類法,是指在建立模糊相似矩陣之后,不去求傳遞閉包,也不用布爾矩陣法,而

5、是直接從模糊相似矩陣出發(fā)求得聚類圖。其步驟如下: 取(最大值),對每個作相似類,且 =,即將滿足的與放在一類,構(gòu)成相似類。相似類與等價類的不同之處是,不同的相似類可能有公共元素,即可出現(xiàn) ,.此時只要將有公共元素的相似類合并,即可得水平上的等價分類。 取為次大值,從中直接找出相似度為的元素對(即),將對應(yīng)于的等價分類中所在的類與所在的類合并,將所有的這些情況合并后,即得到對應(yīng)于的等價分類。 取為第三大值,從中直接找出相似度為的元素對(即),將對應(yīng)于的等價分類中所在的類與所在的類合并,將所有的這些情況合并后,即得到對應(yīng)于的等價分類。 以此類推,直到合并到成為一類為止。二、最佳閾值的確定 在模糊聚

6、類分析中對于各個不同的,可得到不同的分類,許多實際問題需要選擇某個閾值,確定樣本的一個具體分類,這就提出了如何確定閾值的問題。一般有以下兩個方法: 按實際需要,在動態(tài)聚類圖中,調(diào)整的值以得到適當?shù)姆诸悾恍枰孪葴蚀_地估計好樣本應(yīng)分成幾類。當然,也可由具有豐富經(jīng)驗的專家結(jié)合專業(yè)知識確定閾值,從而得出在水平上的等價分類 用F統(tǒng)計量確定最佳值。11 設(shè)論域為樣本空間(樣本總數(shù)為),而每個樣本有個特征:,。于是得到原始數(shù)據(jù)矩陣,如下表所示,其中,稱為總體樣本的中心向量。 樣本 指 標1 2 k m 設(shè)對應(yīng)于值的分類數(shù)為,第類的樣本數(shù)為,第類的樣本記為:,第類的聚類中心為向量,其中為第個特征的平均值

7、,即 ,作統(tǒng)計量 ,其中 為與間的距離,為第類中第個樣本與其中心間的距離。稱為統(tǒng)計量,它是遵從自由度為,的分布。它的分子表征類與類之間的距離,分母表征類內(nèi)樣本間的距離。因此,值越大,說明類與類之間的距離越大;類與類間的差異越大,分類就越好。 基于模糊聚類分析的多屬性決策方法的實際應(yīng)用聚類分析是將事物根據(jù)一定的特征,并按某種特定要求或規(guī)律分類的方法。由于聚類分析的對象必定是尚未分類的群體,而且現(xiàn)實的分類問題往往帶有模糊性,對帶有模糊特征的事物進行聚類分析,分類過程中不是僅僅考慮事物之間有無關(guān)系,而是考慮事物之間關(guān)系的深淺程度,顯然用模糊數(shù)學的方法處理更為自然,因此稱為模糊聚類分析。第一節(jié) 雨量站

8、問題一、問題的提出某地區(qū)設(shè)置有11個雨量站,其分布圖見圖1,10年來各雨量站所測得的年降雨量列入表1中?,F(xiàn)因經(jīng)費問題,希望撤銷幾個雨量站,問撤銷那些雨量站,而不會太多的減少降雨信息? 圖1 雨量站分布圖表1 各雨量站10年間測得的降雨量年序號12763241594132922583113031752433202251287349344310454285451402307470319243329056347950222122032041123242462322432812673102733152853273525291311502388330410352267603290292646615822

9、417816420350232024027835072583274324013613813014134021994218453365357452384420482228360316252915827141030828341020117943034218510324406235520442520358343251282371二、問題的分析應(yīng)該撤銷那些雨量站,涉及雨量站的分布,地形,地貌,人員,設(shè)備等眾多因素。我們僅考慮盡可能地減少降雨信息問題。一個自然的想法是就10年來各雨量站所獲得的降雨信息之間的相似性,對全部雨量站進行分類,撤去“同類”(所獲降雨信息十分相似)的雨量站中“多余”的站。問題求解

10、 假設(shè)為使問題簡化,特作如下假設(shè) 每個觀測站具有同等規(guī)模及儀器設(shè)備; 每個觀測站的經(jīng)費開支均等;具有相同的被裁可能性。分析:對上述撤銷觀測站的問題用基于模糊等價矩陣的模糊聚類方法進行分析,原始數(shù)據(jù)如上。三、問題的解決求解步驟:1、數(shù)據(jù)的收集 原始數(shù)據(jù)如表1所示。2、建立模糊相似矩陣利用相關(guān)系數(shù)法,構(gòu)造模糊相似關(guān)系矩陣,其中 其中,1,2,,11。 ,1,2,,11。 取,代入公式得=0.839,由于運算量巨大用C語言編程計算出其余數(shù)值,得模糊相似關(guān)系矩陣,具體程序如下#include#includedouble r1111; double x11;void main() int i,j,k;

11、double fenzi=0,fenmu1=0,fenmu2=0,fenmu=0;int year1011=276,324,159,413,292,258,311,303,175,243,320,251,287,349,344,310,454,285,451,402,307,470,192,433,290,563,479,502,221,220,320,411,232,246,232,243,281,267,310,273,315,285,327,352,291,311,502,388,330,410,352,267,603,290,292,466,158,224,178,164,203,50

12、2,320,240,278,350,258,327,432,401,361,381,301,413,402,199,421,453,365,357,452,384,420,482,228,360,316,252,158,271,410,308,283,410,201,179,430,342,185,324,406,235,520,442,520,358,343,251,282,371;for(i=0;i11;i+) for(k=0;k10;k+) xi=xi+yearki; xi=xi/10;for(i=0;i11;i+)for(j=0;j11;j+) for(k=0;k10;k+) fenz

13、i=fenzi+fabs(yearki-xi)*(yearkj-xj); fenmu1=fenmu1+(yearki-xi)*(yearki-xi); fenmu2=fenmu2+(yearkj-xj)*(yearkj-xj); fenmu=sqrt(fenmu1)*sqrt(fenmu2);rij=fenzi/fenmu; fenmu=fenmu1=fenmu2=fenzi=0; for(i=0;i11;i+) for(j=0;j11;j+) printf(%6.3f,rij); printf(n);getchar();得到模糊相似矩陣1.000 0.839 0.528 0.844 0.82

14、8 0.702 0.995 0.671 0.431 0.573 0.712 0.839 1.000 0.542 0.996 0.989 0.899 0.855 0.510 0.475 0.617 0.572 0.528 0.542 1.000 0.562 0.585 0.697 0.571 0.551 0.962 0.642 0.568 0.844 0.996 0.562 1.000 0.992 0.908 0.861 0.542 0.499 0.639 0.607 0.828 0.989 0.585 0.992 1.000 0.922 0.843 0.526 0.512 0.686 0.58

15、4 0.702 0.899 0.697 0.908 0.922 1.000 0.726 0.455 0.667 0.596 0.511 0.995 0.855 0.571 0.861 0.843 0.726 1.000 0.676 0.489 0.587 0.719 0.671 0.510 0.551 0.542 0.526 0.455 0.676 1.000 0.467 0.678 0.994 0.431 0.475 0.962 0.499 0.512 0.667 0.489 0.467 1.000 0.487 0.485 0.573 0.617 0.642 0.639 0.686 0.59

16、6 0.587 0.678 0.487 1.000 0.688 0.712 0.572 0.568 0.607 0.584 0.511 0.719 0.994 0.485 0.688 1.000對這個模糊相似矩陣用平方法作傳遞閉包運算,求 即。3、聚類注:是對稱矩陣,故只寫出它的下三角矩陣取0.996,則在置信水平為0.996的閾值下相似度為1,故同屬一類,所以此時可以將觀測站分為9類,,,,,,。降低置信水平,對不同的作同樣分析,得到:0.995時,可分為8類,即,,,,,,。=0.994時,可分為7類,,, ,,,。=0.962時,可分為6類,,, ,, ,。0.719時,可分為5類,,,

17、 ,,,。第二節(jié) 成績評價問題一、問題的提出某高中高二有7個班級,學生成績的好與差,沒有明確的評定界限,并且班級間成績好壞的表現(xiàn)具有一定的模糊不確定性。二、問題的分析解決上述問題可運用模糊聚類分析方法。現(xiàn)以7個班級某次其中考試的四門主課成績?yōu)橐罁?jù),對7個班級成績好壞的相關(guān)程度分類。設(shè)7個班級組成一個分類集合:分別代表1班到7班。每個班級成績均是四門基礎(chǔ)課(語文、數(shù)學、英語、綜合)作為四項統(tǒng)計指標,即有這里表示為第個班級的第門基礎(chǔ)課指標。這四項成績指標為:語文平均成績,數(shù)學平均成績,英語平均成績,綜合平均成績。各班級成績指標值見表1。表1 7個班4門基礎(chǔ)課的成績指標 三、問題的解決1、數(shù)據(jù)標準化

18、12采用極差變換, (1)式中是第i個班級第門基礎(chǔ)課平均成績的原始數(shù)據(jù),和分別為不同班級的同一門基礎(chǔ)課平均成績的最大值和最小值。為第個班級第門基礎(chǔ)課平均成績指標的標準化數(shù)值。當時,當 時,。 表2 平均成績指標值的標準化數(shù)值2、用最大最小法建立相似矩陣 計算模糊相似矩陣R,根據(jù)標準化數(shù)值建立各班級之間四門基礎(chǔ)課成績指標的相似關(guān)系矩陣,采用最大最小法來計算: 其中是表示第個班級與第個班級在四門基礎(chǔ)課成績指標上的相似程度的量。取,=0,其余運算量可以通過MATLAB編程運算,程序如下:13clcclear allmeanp=0 0.0273 1 0.6119 0.7368 0.7229 0.2911; 0 0.2553 0.7791 0.8385 0.4587 0.5341 1; 0.4285 0 0.8492 1 0.3966 0.5439 0.9513;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論