聚類分析例子_第1頁
聚類分析例子_第2頁
聚類分析例子_第3頁
聚類分析例子_第4頁
聚類分析例子_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)專心-專注-專業(yè)精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)例題1:下表是我國16個地區(qū)農(nóng)民在1982年支出情況的抽樣調(diào)查數(shù)據(jù)的匯總資料,每個地區(qū)都調(diào)查了反映每人平均生活消費(fèi)支出情況的六個指標(biāo)。試?yán)谜{(diào)查資料對16個地區(qū)進(jìn)行分類。地區(qū)食品衣著燃料住房生活用品及其他文化生活服務(wù)支出北京190.3343.779.7360.5449.019.04天津135.236.410.4744.1636.493.94河北95.2122.839.322.4422.812.8山西104.7825.116.49.8918.173.25內(nèi)蒙古128.41

2、27.638.9412.5823.993.27遼寧145.6832.8317.1927.2939.093.47吉林159.3733.3818.3711.8125.295.52黑龍江116.2229.5713.2413.7621.756.04上海221.1138.6412.53115.6550.825.89江蘇144.9829.1211.6742.627.35.74浙江169.9232.7512.7247.1234.355安徽153.1123.0915.6223.5418.186.39福建144.9221.2616.9619.5221.756.73江西140.5121.517.6419.1915

3、.974.94山東115.8430.2612.233.6133.773.85河南101.1823.268.4620.220.54.3下面用統(tǒng)計(jì)學(xué)軟件 SAS(Statistical Analysis System)data dfdf;input city $ x1 x2 x3 x4 x5 x6;cards;beijing 190.33 43.77 9.73 60.54 49.01 9.04tianjing 135.20 36.40 10.47 44.16 36.49 3.94hebei 95.21 22.83 9.30 22.44 22.81 2.80shanxi 104.78 25.11 6

4、.40 9.89 18.17 3.25neimenggu 128.41 27.63 8.94 12.58 23.99 3.27liaoning 145.68 32.83 17.19 27.29 39.09 3.47jilin 159.37 33.38 18.37 11.81 25.29 5.22heilongjiang 116.22 29.57 13.24 13.76 21.75 6.04shanghai 221.11 38.64 12.53 115.65 50.82 5.89jiangsu 144.98 29.12 11.67 42.60 27.30 5.74zhejiang 169.92

5、32.75 12.72 47.12 34.35 5.00anhui 153.11 23.09 15.62 23.54 18.18 6.39fujian 144.92 21.26 16.96 19.52 21.75 6.73jiangxi 140.54 21.50 17.64 19.19 15.97 4.94shandong 115.84 30.26 12.20 33.61 33.77 3.85henan 101.18 23.26 8.46 20.20 20.50 4.30;run;proc cluster data=dfdf std outtree=tree method=ave pesudo

6、 rsq;id city;run; /*ward離差平方和法 war; 類平均法 ave; 重心法 cen;最長距離法 com;中間距離法 med; 最短距離法 sin;密度估計(jì)法 den;極大似然法 eml; 可變類平均 fle;相似分析法 mcq; 兩階段密度估計(jì) two; */proc tree data=tree out=new graphics horizontal; id city;run;ClusterHistoryNormRMSNCLClustersJoined-FREQSPRSQRSQPSFPST2Dist15anhuifujian20.00250.99828.7.0.193

7、14hebeihenan20.00550.99219.1.0.286913CL14shanxi30.00680.98516.71.20.311612CL15jiangxi30.00990.97514.440.348111jiangsuzhejiang20.00890.96614.4.0.36610CL13neimengg40.01060.95614.41.70.36929tianjingshandong20.00920.94715.5.0.37118CL9CL1140.02370.92313.72.60.49577liaoningjilin20.01890.90414.1.0.53296hei

8、longjCL1240.02670.87714.34.30.54635CL8CL760.05280.82412.93.50.66814CL5CL6100.12690.6989.26.60.78233CL4CL10140.19550.5026.67.80.87512beijingshanghai20.05620.44611.3.0.91841CL2CL3160.44580.11.31.5454(1)統(tǒng)計(jì)量(列標(biāo)題為)用于評價(jià)每次合并成個類時(shí)的聚類效果?,F(xiàn)考察的值隨的變化。比如,在分為四個類之前()的并類過程中的減少是逐漸的,改變不大;當(dāng)分為四個類時(shí)的,而下一次合并后分為三個類時(shí)下降較多(),由此

9、可以通過對統(tǒng)計(jì)量的變化分析可得出分為四個類是較合適的。(2)半偏(列標(biāo)題為)得到。根據(jù)半偏的值是上一步驟與該步驟的差值,故某步驟的半偏值越大,說明上一步驟合并的效果越好,此例半偏最大和次大分別為,說明根據(jù)半偏準(zhǔn)則分為兩個類,四個類和五個類是較合適的。(3)偽統(tǒng)計(jì)量(列標(biāo)題為)用于評價(jià)分為個類的聚類效果。偽值越大表示這些觀測樣品可以顯著地分為個類。此例中偽最大和次大分別為(當(dāng)),說明根據(jù)偽準(zhǔn)則分為五個類或兩個類較合適的。(4)偽統(tǒng)計(jì)量(列標(biāo)題為)用以評價(jià)此步驟合并的效果。由該統(tǒng)計(jì)量的定義知,偽大表明上一次合并的兩個類是很分開的,也就是上依次聚類的效果是好的。此例子中最大和次大分別為,說明根據(jù)偽準(zhǔn)

10、則分為兩個類,四個類和五個類是較合適的。綜合分析,認(rèn)為采用類平均法分類,將16個地區(qū)分為兩個類或五個類較合適。分為五個類的結(jié)果為:北京,上海,天津、山東、江蘇、浙江、遼寧、吉林,黑龍江、安徽、福建、江西,河北、河南、山西、內(nèi)蒙;若分為兩類,北京,上海,天津、山東、江蘇、浙江、遼寧、吉林,黑龍江、安徽、福建、江西,河北、河南、山西、內(nèi)蒙。類別第一類第二類第三類第四類第五類該類所包含的區(qū)域河北 河南山西 內(nèi)蒙黑龍江 安徽福建 江西天津 山東 江蘇 浙江 遼寧 吉林北京上海食品平均消費(fèi)107.395138.698145.165190.33221.11衣著平均消費(fèi)24.70823.85532.4574

11、3.7738.64燃料平均消費(fèi)8.27515.86513.8709.7312.53住房平均消費(fèi)16.27819.00034.43160.54115.65生活用品以及其他平均消費(fèi)21.36819.41332.71549.0150.82文化生活服務(wù)支出平均消費(fèi)3.4056.0254.5379.045.89例題2:對305名女中學(xué)生測量八個體型指標(biāo):身高 :體重 :手臂長 :頸圍上肢長 :胸圍 :下肢長 :胸寬相關(guān)矩陣如下表。我們用相關(guān)系數(shù)來度量各對變量之間的相似性。相應(yīng)于最長距離法,類與類之間的相似系數(shù)定義為兩類變量間的最小相關(guān)系數(shù),每次聚類時(shí)合并兩個相似系數(shù)最大的類。1.0000.8461.00

12、00.8050.8811.0000.8590.8260.8011.0000.4730.3760.3800.4361.0000.3980.3260.3190.3290.7621.0000.3010.2770.2370.3270.7300.5831.0000.3820.4150.3450.3650.6290.5770.5391.000/*用變量聚類過程varclus對變量進(jìn)行分類data jlfx (type=corr);input id x1 x2 x3 x4 x5 x6 x7 x8;_type_=corr;cards;1 1.000 . . . . . . .2 0.846 1.000 . . . . . .3 0.805 0.881 1.000 . . . . .4 0.859 0.826 0.801 1.000 . . . .5 0.473 0.376 0.380 0.436 1.000 . . .6 0.398 0.326 0.319 0.329 0.762 1.000 . . 7

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論