第7講 聚類分析與判別分析_第1頁
第7講 聚類分析與判別分析_第2頁
第7講 聚類分析與判別分析_第3頁
第7講 聚類分析與判別分析_第4頁
第7講 聚類分析與判別分析_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

SPSS統計分析從基礎到實踐(第2版)聯系Email:第7講聚類分析與判別分析7.1K-均值聚類分析

聚類分析簡介做什么?把沒有分類信息的資料按照相似程度歸類怎么做?系統聚類法和非系統聚類法K-均值聚類法基本原理

K均值聚類法迭代終止條件兩次迭代計算的聚心之間距離的最大改變量小于初始聚心間最小距離的

倍到達迭代次數的上限K均值聚類的優(yōu)缺點優(yōu)點:占有內存少、計算量小、處理速度快,特別適合大樣本的聚類分析缺點:1、應用范圍有限,要求用戶指定分類數目;

2、只能對觀測量聚類,而不能對變量聚類;

3、所使用的聚類變量必須都是連續(xù)性變量。利用如下數據將以下城市按照空氣指標分類

執(zhí)行【Analyze】/【Classify】/【K-meansCluster】命令,彈出如圖所示對話框結果解讀初始聚類中心表迭代史表6次終止迭代最終聚類中心表7.2系統聚類法

系統聚類法的基本思想是:視觀測量(或者變量)各自成為一類;找性質最接近的兩個類合并成一個新類,計算在新的類別分劃下各類之間的距離;再將性質最接近的兩類合并,直到所有模式聚成一類為止。

系統聚類法優(yōu)點:既可以對觀測量也可以對變量進行聚類;所使用的變量既可以是連續(xù)變量也可以是分類變量;提供的距離計算方法和結果顯示方法也很豐富。觀測量聚類:按照交通情況對各地進行聚類

執(zhí)行【Analyze】/【Classify】/【HierarchicalCluster】命令,彈出如圖所示的對話框結果解讀聚類進度表龍骨圖變量聚類:按照日照數對月份進行聚類

結果解讀聚類進度表垂直冰柱圖從下往上看龍骨圖7.3判別分析——Discriminant過程

判別分析簡介干什么?判別樣品所屬類型的一種統計方法與聚類分析的關系相同點:解決分類問題不同點:判別分析是在已知研究對象分成若干類型,對未知類型的樣品進行判別分類判別分析的一般步驟

常用判別法距離判別法:根據已知分類的數據,分別計算各類的均值(重心),判別準則是任給一次觀測,若它與第i類的重心距離最近,就認為它來自第i類。

◆注意:

距離一般采用馬氏距離;距離判別適合對自變量均為連續(xù)變量的情況進行分類;距離判別對各類的分布無特定的要求。Fisher判別法:借助方差分析的思想構造一個判別函數,其中判別系數的確定原則是使得類間的區(qū)別最大,而且類內的離差最小,利用判別函數計算出待判樣品的判別指標,然后與判別臨界值進行比較,判別它的類屬。Fisher判別對各類分布、方差都沒有限制。但當總體個數較多時,計算比較麻煩。Bayes判別法:在考慮先驗概率的前提下,利用Bayes公式計算樣品來自第i類的后驗概率,使用錯判損失最小的概念作判別準則,建立判別函數,將待判樣品歸入來自概率最大類。Bayes判別主要用于多類判別,它要求總體呈多元正態(tài)分布.逐步判別法:逐步判別法與逐步回歸法的基本思想類似,都是逐步引入變量,每引入一個“最重要”的變量進入判別式,同時也考慮較早引入判別式的某些變量,若其判別能力不顯著了,應及時

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論