聚類分析實(shí)驗(yàn)PPT_第1頁(yè)
聚類分析實(shí)驗(yàn)PPT_第2頁(yè)
聚類分析實(shí)驗(yàn)PPT_第3頁(yè)
聚類分析實(shí)驗(yàn)PPT_第4頁(yè)
聚類分析實(shí)驗(yàn)PPT_第5頁(yè)
已閱讀5頁(yè),還剩11頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1,2,3,4,思考題,變量的測(cè)度類型有哪些,系統(tǒng)聚類法的思想是什么,短距離法是不是一種優(yōu)良的系統(tǒng)聚類方法,為什么?它適合于什么形態(tài)類的聚類,組間聯(lián)結(jié)法和組內(nèi)聯(lián)結(jié)法都是計(jì)算所有樣本對(duì)的平均距離,請(qǐng)說(shuō)明其區(qū)別,變量的測(cè)度類型有間隔尺度、順序尺度、名義尺度,基本思想:設(shè)有n個(gè)樣本,每個(gè)樣本有m個(gè)指標(biāo)。首先定義樣本間的距離。先將這n個(gè)樣本看成n類,然后將距離最近的兩類合并成為新類,并計(jì)算新類與其他類的距離,再按最小距離準(zhǔn)則并類。這樣每次縮小一類,直到并成一類為止,第一,第二,解答,解答,第三,第四,因?yàn)樽疃叹嚯x法的缺點(diǎn)是有鏈接聚合的趨勢(shì),合并之后,新類與其他類的距離縮短,會(huì)形成聚類延伸的情況。最短距

2、離法適用于樣品散點(diǎn)圖(即將每個(gè)樣品看成m維空間中的點(diǎn)所形成的圖形)是條形圖,甚至是S形的類,組間聯(lián)結(jié)法定義兩個(gè)小類之間的距離為所有樣本對(duì)間的平均距離,利用了所有樣本對(duì)距離的信息,克服了最短距離和最長(zhǎng)距離中的距離易受極端值影響的弱點(diǎn)。組內(nèi)聯(lián)結(jié)法是對(duì)所有樣本對(duì)的距離求平均值,包括小類之間的樣本對(duì)、小類內(nèi)的樣本對(duì),它與組間聯(lián)結(jié)法相比,它在聚類的每一步都考慮了小類內(nèi)部相似性的變化,1,2,1,2,實(shí)驗(yàn)6聚類分析,實(shí)驗(yàn)內(nèi)容一的步驟,將數(shù)據(jù)粘貼到SPSS中,選擇菜單AnalyzeClassifyHierarchical Cluster;,將call,movecall,fee,computer,mips,n

3、et 6個(gè)變量選到Variable(s)框中;再將gj-國(guó)家作為標(biāo)記變量,選到Label Cases by框中,在Cluster框中,選擇Cases進(jìn)行Q型聚類,在Display框中,選擇Statistics、Plots,單擊Method按鈕,聚類方法選擇組間連接法(within-group linkage),計(jì)算距離選擇平方歐氏距離,將原始變量標(biāo)準(zhǔn)化,在Transform Values的Standardize空白框內(nèi),選擇Z-Scores,步驟一,步驟二,步驟三,步驟四,輸出的樹(shù)狀圖,第三類,第二類,第一類,墨西哥,波蘭,泰國(guó),智利,巴西,俄羅斯,印度,匈牙利,馬來(lái)西亞,中國(guó)臺(tái)灣,韓國(guó)為一類

4、,它們大部分都是當(dāng)時(shí)的轉(zhuǎn)型國(guó)家和亞洲、拉美的發(fā)展中國(guó)家,屬于信息基礎(chǔ)設(shè)施比較落后的國(guó)家,美國(guó)為一類,作為世界第一強(qiáng)國(guó),它是信息基礎(chǔ)設(shè)施很發(fā)達(dá)的國(guó)家,瑞士,丹麥,瑞典,新加坡,英國(guó),德國(guó),法國(guó),日本為一類,它們大部分是歐洲發(fā)達(dá)國(guó)家,還有一些是亞洲經(jīng)濟(jì)比較發(fā)達(dá)的國(guó)家,所以它們的信息基礎(chǔ)設(shè)施相對(duì)發(fā)達(dá)一些,結(jié)果分析,between group法,within group法,ward method法,系統(tǒng)聚類法,考慮到分類與實(shí)際情況的出入和分類最優(yōu)問(wèn)題,這里通過(guò)分別用系統(tǒng)聚類法和K均值聚類分析,其中后者也分別分為兩類,三類,四類進(jìn)行比較。根據(jù)2008年全國(guó)各地區(qū)居民消費(fèi)數(shù)據(jù),將食品,衣著,居住,家庭設(shè)備

5、用品及服務(wù),醫(yī)療保健,交通和通訊,教育文化娛樂(lè)服務(wù),雜項(xiàng)商品和服務(wù)著八個(gè)項(xiàng)目選為指標(biāo),實(shí)驗(yàn)內(nèi)容二,說(shuō)明一,說(shuō)明二,實(shí)驗(yàn)內(nèi)容二,利用系統(tǒng)聚類方法的步驟與上題相似,這里重點(diǎn)說(shuō)一下K均值聚類分析的步驟,另外,上題中已有相似的已經(jīng)有相似的利用系統(tǒng)聚類分析方法的樹(shù)狀圖及結(jié)果,這里也重點(diǎn)展示K均值聚類分析的結(jié)果及其分析,操作步驟,步驟三,點(diǎn)擊Save按鈕,選擇Cluster membership和Distance from cluster center,單擊Continue按鈕返回,步驟一,將數(shù)據(jù)粘貼到SPSS中,選擇菜單AnalyzeClassifyK-Means Cluster,步驟四,點(diǎn)擊Optio

6、ns按鈕,選中Initial cluster centers和Cluster from cluster center,單擊Continue按鈕返回,步驟二,將這八個(gè)變量移入Variables框中,將標(biāo)志變量地區(qū)移入Label Case by框中,在Method框中選擇Iterate classify,在Number of Cluster,實(shí)驗(yàn)內(nèi)容二,結(jié)果及分析,結(jié)果及分析,結(jié)果及分析,結(jié)果及分析,三種系統(tǒng)聚類法的結(jié)果,分為三類:上海單獨(dú)為一類;天津,福建,北京,浙江,廣東為一類;剩下的省直轄市為一類,分為三類:上海單獨(dú)為一類;北京,浙江,廣東為一類;剩下的省市直轄市為一類,分為三類:北京,浙江,廣東,上海為一類;安徽,湖北,湖南,廣西,海南,四川,云南,西藏,天津,福建,遼寧,重慶,江蘇為一類;剩下的省市直轄市為一類,Between group法,Within group

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論