![SPSS數(shù)據(jù)分析教程-10-聚類分析-課件_第1頁](http://file4.renrendoc.com/view/1846b901cdf5eaeadaf22609cb72acee/1846b901cdf5eaeadaf22609cb72acee1.gif)
![SPSS數(shù)據(jù)分析教程-10-聚類分析-課件_第2頁](http://file4.renrendoc.com/view/1846b901cdf5eaeadaf22609cb72acee/1846b901cdf5eaeadaf22609cb72acee2.gif)
![SPSS數(shù)據(jù)分析教程-10-聚類分析-課件_第3頁](http://file4.renrendoc.com/view/1846b901cdf5eaeadaf22609cb72acee/1846b901cdf5eaeadaf22609cb72acee3.gif)
![SPSS數(shù)據(jù)分析教程-10-聚類分析-課件_第4頁](http://file4.renrendoc.com/view/1846b901cdf5eaeadaf22609cb72acee/1846b901cdf5eaeadaf22609cb72acee4.gif)
![SPSS數(shù)據(jù)分析教程-10-聚類分析-課件_第5頁](http://file4.renrendoc.com/view/1846b901cdf5eaeadaf22609cb72acee/1846b901cdf5eaeadaf22609cb72acee5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
SPSS數(shù)據(jù)分析教程—《SPSS數(shù)據(jù)分析教程》SPSS數(shù)據(jù)分析教程—《SPSS數(shù)據(jù)分析教程》第10章聚類分析第10章聚類分析目錄10.1聚類分析簡介10.2個案間的距離10.2.1定距數(shù)據(jù)(ScaleMearsurement)
距離定義方式10.2.2分類數(shù)據(jù)的頻數(shù)
數(shù)據(jù)(Count)10.2.3二分類數(shù)據(jù)10.3類之間的距離10.4系統(tǒng)聚類算法過程10.5系統(tǒng)聚類案例10.6
K-均值聚類10.6.1
K-均值法簡介10.5.2
K-均值法案例10.7兩步法聚類10.7.1兩步法簡介10.7.2兩步法案例分析10.8聚類分析注意事項目錄10.1聚類分析簡介本章學(xué)習(xí)目標理解聚類分析的基本概念;了解個案之間距離的定義方式;了解類之間距離的定義方式;掌握系統(tǒng)聚類方法;掌握兩步法聚類方法;掌握K均值聚類方法。本章學(xué)習(xí)目標理解聚類分析的基本概念;10.1聚類分析簡介根據(jù)對象的某些屬性把它們分到一些組中,使得同組內(nèi)的對象盡可能地相似,不同組中的對象盡可能地不一樣,即所謂的聚類分析。聚類分析方法被稱為“無監(jiān)督的分析方法”,意即沒有因變量。而另外一種分類的方法是判別分析,它是把樣本歸入到已知的事先已經(jīng)確定下來的類中去,它有因變量(即事先確定的類別),是“有監(jiān)督的分析方法”。
10.1聚類分析簡介根據(jù)對象的某些屬性把它們分到一些組中SPSS數(shù)據(jù)分析教程-10-聚類分析-課件聚類分析不必事先知道分類對象的結(jié)構(gòu),從一批樣品的多個觀測指標中,找出能度量樣品之間或指標(變量)之間相似程度或親疏關(guān)系的統(tǒng)計量,構(gòu)成一個對稱相似性矩陣,并按相似程度的大小,把樣品或變量逐一歸類。根據(jù)對樣品聚類還是對變量聚類,聚類分析分Q型聚類和R型聚類。對變量的聚類稱為R型聚類,而對樣品(即觀測值)聚類稱為Q型聚類。通俗講,R型聚類是對數(shù)據(jù)中的列分類,Q型聚類是對數(shù)據(jù)中的行分類。聚類分析不必事先知道分類對象的結(jié)構(gòu),從一批樣品的多個觀測指標SPSSStatistics提供了3種聚類方法,它們是系統(tǒng)聚類法(又稱層次聚類)、K-均值聚類(又稱快速聚類法)和兩步法聚類。SPSSStatistics提供了3種聚類方法,它們是系統(tǒng)10.2個案間的距離定距數(shù)據(jù)距離定義方式歐式(Euclidean)距離平方歐式距離余弦距離皮爾遜(Pearson)相關(guān)性距離切比雪夫(Chebychev)距離塊(Block)距離閔考斯基(Minkowski)距離冪(Power)距離10.2個案間的距離定距數(shù)據(jù)距離定義方式10.2.2分類數(shù)據(jù)之間的距離
卡方度量Phi方度量
10.2.2分類數(shù)據(jù)之間的距離
卡方度量10.3類之間的距離SPSS提供了7種計算兩個類距離的方法。組間連接法(Between-groupsLinkage)組內(nèi)連接法(Within-GroupsLinkage)最近鄰元素法(NearestNeighbor)最長距離法(FurthestNeighbor)質(zhì)心聚類法(CentroidClustering)中位數(shù)聚類法(MedianClustering)離差平方和法(Ward’sMethod)10.3類之間的距離SPSS提供了7種計算兩個類距離的方10.4系統(tǒng)聚類算法過程10.4系統(tǒng)聚類算法過程系統(tǒng)聚類的步驟
第1步:數(shù)據(jù)標準化。把原始數(shù)據(jù)標準化得到標準化數(shù)據(jù)矩陣。第2步:計算相似系數(shù)矩陣。這里以余弦距離為例。計算Q型聚類任意兩個樣品xj和xk的相似系數(shù)矩陣。系統(tǒng)聚類的步驟
第1步:數(shù)據(jù)標準化。把原始數(shù)據(jù)標準化得到標準第3步:選出有最大相似系數(shù)的樣品組。第4步:把該組樣品加權(quán)平均,這樣就形成了一個新的組合樣品。第5步:用新的樣品類代替原來的一對樣品點。第6步:對新形成的樣品與其余樣品數(shù)據(jù)重新計算相似系數(shù)矩陣。第7步:如此重復(fù)第2步到第5步的過程,直到把所有樣品都歸類完畢。第3步:選出有最大相似系數(shù)的樣品組。第8步:最后,按下列原則構(gòu)成類關(guān)系圖。若兩個樣品在已經(jīng)連接成的組中未出現(xiàn)過,則它們連接成一個新組。若兩個樣品中有一個在某組中出現(xiàn)過,則另一個就加入該組。若兩個樣品都在同一組中,則這對樣品不再分組。若兩個樣品都在不同組中出現(xiàn)過,則把這兩組連接在一起。第8步:最后,按下列原則構(gòu)成類關(guān)系圖。10.5系統(tǒng)聚類案例打開本章的數(shù)據(jù)文件Cluster_cars.sav。該數(shù)據(jù)是市場上一些品牌汽車的資料,它包括汽車制造商、型號、新車價錢、4年以后的二手車價錢,還有功率、引擎大小、車重、車體長、車體寬、車輪大小、油耗等諸多屬性。按照這些數(shù)據(jù)對當前市場上的車進行聚類,看看哪些品牌的車定位有類似之處,制造商可以據(jù)此制定相應(yīng)的策略。10.5系統(tǒng)聚類案例打開本章的數(shù)據(jù)文件Cluster_c選擇【分析】→【分類】→【系統(tǒng)聚類】把從“Priceinthousand”到“Fuelefficiency”的所有變量選入右邊的“變量框”。把“Model”變量選入“標注個案”框。依次單擊【統(tǒng)計量】、【繪制】、【方法】和【保存】按鈕選擇【分析】→【分類】→【系統(tǒng)聚類】SPSS數(shù)據(jù)分析教程-10-聚類分析-課件SPSS數(shù)據(jù)分析教程-10-聚類分析-課件SPSS數(shù)據(jù)分析教程-10-聚類分析-課件SPSS數(shù)據(jù)分析教程-10-聚類分析-課件SPSS數(shù)據(jù)分析教程-10-聚類分析-課件SPSS數(shù)據(jù)分析教程-10-聚類分析-課件10.6K-均值聚類
10.6K-均值聚類
K-均值聚類的算法過程第1步:用戶給定聚類個數(shù)K。第2步:給出初始類中心。第3步:計算所有個體到這K個類中心的距離,然后按照到K個類中心距離最短原則,把所有個體分別劃分到距最近的中心點所在的類中,這樣形成了K個類,完成一次迭代過程。第4步:重新計算K個類的類中心。第5步:重復(fù)進行第3步、第4步。直到迭代次數(shù)達到限制的次數(shù)或者類中心不再變化為止。K-均值聚類的算法過程第1步:用戶給定聚類個數(shù)K。K-均值法案例打開本章的數(shù)據(jù)文件Cluster_cars.sav。該數(shù)據(jù)是市場上一些品牌汽車的資料,它包括汽車制造商、型號、新車價錢、4年以后的二手車價錢,還有功率、引擎大小、車重、車體長、車體寬、車輪大小、油耗等諸多屬性。按照這些數(shù)據(jù)對當前市場上的車進行聚類,看看哪些品牌的車定位有類似之處,制造商可以據(jù)此制定相應(yīng)的策略。K-均值法案例打開本章的數(shù)據(jù)文件Cluster_cars.選擇【分析】→【分類】→【K-均值聚類】選擇【分析】→【分類】→【K-均值聚類】SPSS數(shù)據(jù)分析教程-10-聚類分析-課件SPSS數(shù)據(jù)分析教程-10-聚類分析-課件SPSS數(shù)據(jù)分析教程-10-聚類分析-課件SPSS數(shù)據(jù)分析教程-10-聚類分析-課件SPSS數(shù)據(jù)分析教程-10-聚類分析-課件10.7兩步法聚類10.7兩步法聚類兩步法聚類又稱兩階段聚類,它與系統(tǒng)聚類相似,是揭示數(shù)據(jù)所蘊含的自然組別的一種探索性分析方法。
兩步法聚類又稱兩階段聚類,它與系統(tǒng)聚類相似,是揭示數(shù)據(jù)所蘊含兩步法聚類的特點(1)聚類變量可以是連續(xù)變量,也可以是分類變量。兩步法聚類充分考慮到這兩種變量的不同性質(zhì),采用對數(shù)似然距離來衡量相似性。(2)它能自動確定出類的個數(shù)。(3)能夠有效地分析大數(shù)據(jù)集。兩步法聚類的特點(1)聚類變量可以是連續(xù)變量,也可以是分類變兩階段聚類算法的兩個階段第1步:建立一個聚類特性樹。第2步:應(yīng)用凝聚算法對聚類特性樹的葉節(jié)點進行分類。
兩階段聚類算法的兩個階段第1步:建立一個聚類特性樹。兩步法的距離度量兩步法的距離度量有兩種(1)對數(shù)似然(SPSS翻譯為對數(shù)相似值):這里由于聚類指標中含有分類變量,所以只能選擇該項。(2)歐式距離(Euclidean):當聚類指標不含有分類變量時可以選擇該距離。兩步法的距離度量兩步法的距離度量有兩種聚類數(shù)量(1)自動確定:可以選擇自動確定,這里可以限定類個數(shù)的上限。默認最多15個類。也可以據(jù)需要修改類個數(shù)的最大值。(2)指定固定值:如果很有把握,那么你可以輸入你想要的類個數(shù)。聚類數(shù)量(1)自動確定:可以選擇自動確定,這里可以限定類個聚類準則有AIC和BIC兩個準則,這兩個模型選擇準則在選擇模型方面基本類似,都是綜合考慮樣本數(shù)和模型的復(fù)雜程度。AIC或者BIC的值越小,模型越好。聚類準則有AIC和BIC兩個準則,這兩個模型選擇準則在選擇兩步法案例分析數(shù)據(jù)文件Twosteps_car.sav選擇【分析】→【分類】→【兩步聚類】
兩步法案例分析數(shù)據(jù)文件T
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 蘇州蘇教版三年級數(shù)學(xué)上冊第一單元《兩、三位數(shù)乘一位數(shù)》聽評課記錄
- 七年級數(shù)學(xué)上冊第5章一元一次方程5.4一元一次方程的應(yīng)用第4課時利率等其他問題聽評課記錄(新版浙教版)
- 人教版數(shù)學(xué)七年級下冊5.1.2《垂線》聽評課記錄2
- 統(tǒng)編版初中語文七年級下冊第四課《孫權(quán)勸學(xué)》聽評課記錄
- 新版湘教版秋八年級數(shù)學(xué)上冊第四章一元一次不等式組課題不等式聽評課記錄
- 聽評四年級音樂課記錄
- 聽評課記錄七年級歷史
- 七年級數(shù)學(xué)上冊第11課時有理數(shù)的乘法運算律聽評課記錄新湘教版
- 人教版七年級數(shù)學(xué)上冊:1.4.2 《有理數(shù)的除法》聽評課記錄
- 粵人版地理七年級下冊《第三節(jié) 巴西》聽課評課記錄2
- GB/T 44143-2024科技人才評價規(guī)范
- 對醫(yī)院領(lǐng)導(dǎo)的批評意見怎么寫更合適范文(6篇)
- 《網(wǎng)絡(luò)安全防護項目教程》課件項目4 網(wǎng)絡(luò)病毒和惡意代碼分析與防御
- 賬期協(xié)議書賬期合同書
- 信息技術(shù)課程標準2023版:義務(wù)教育小學(xué)階段
- 2024年常德職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫完整
- 天津市河?xùn)|區(qū)2023-2024學(xué)年九年級上學(xué)期期末數(shù)學(xué)試題
- 工程防滲漏培訓(xùn)課件
- 黑龍江省哈爾濱市2024年數(shù)學(xué)八年級下冊期末經(jīng)典試題含解析
- 克羅恩病的外科治療
- 牛津3000核心詞匯表注釋加音標1-4 完整版
評論
0/150
提交評論