



下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、關注我 實時更新 最新資料R軟件系統(tǒng)聚類分析剖析提要多元統(tǒng)計聚類方法已被廣泛應用于自然科學 和社會科學 的各個領域,而在現(xiàn)實處理多元數(shù)據(jù)聚類分析中,離不開統(tǒng)計軟件 的支持;R軟件由于其免費、開源、強大 的統(tǒng)計分析及其完美 的作圖功能已得到越來越多人 的關注與應用;本文結合實例介紹了R軟件在多元統(tǒng)計系統(tǒng)分析中 的應用。關鍵詞:R軟件;系統(tǒng)聚類分析;多元統(tǒng)計引言多元統(tǒng)計分析是統(tǒng)計學 的一個重要分支,也稱多變量統(tǒng)計分析;在現(xiàn)實生活中,受多種指標共同作用和影響 的現(xiàn)象大量存在,多元統(tǒng)計分析就是研究多個隨機變量之間相互依賴關系及其內(nèi)在統(tǒng)計規(guī)律 的重要學 科,其中最常用聚類分析方法,由于多元統(tǒng)計聚類分析方
2、法一般涉及復雜 的數(shù)學 理論,一般無法用手工計算,必須有計算機和統(tǒng)計軟件 的支持。在統(tǒng)計軟件方面,常用 的統(tǒng)計軟件有SPSS、SAS、STAT、R、S-PLUS,等等。R軟件是一個自由、免費、開源 的軟件,是一個具有強大統(tǒng)計分析功能和優(yōu)秀統(tǒng)計制圖功能 的統(tǒng)計軟件,現(xiàn)已是國內(nèi)外眾多統(tǒng)計學 者喜愛 的數(shù)據(jù)分析工具。本文結合實例介紹R軟件在多元統(tǒng)計聚類分析中 的應用。一、系統(tǒng)聚類分析聚類分析又稱群分析,它是研究(樣品或指標)分類問題 的一種多元統(tǒng)計方法,所謂類,通俗地說,就是指相似元素 的集合。在社會經(jīng)濟領域中存在著大量分類問題,比如若對某些大城市 的物價指數(shù)進行考察,而物價指數(shù)很多,有農(nóng)用生產(chǎn)物價
3、指數(shù)、服務項目價指數(shù)、食品消費物價指數(shù)、建材零售價格指數(shù)等等。由于要考察 的物價指數(shù)很多,通常先對這些物價指數(shù)進行分類??傊枰诸?的問題很多,因此聚類分析這個有用 的工具越來越受到人們 的重視,它在許多領域中都得到了廣泛 的應用。聚類分析內(nèi)容非常豐富,有系統(tǒng)聚類法、有序樣品聚類法、動態(tài)聚類法、模糊聚類法、圖論聚類法、聚類預報法等;最常用最成功 的聚類分析為系統(tǒng)聚類法,系統(tǒng)聚類法 的基本思想為先將n個樣品各自看成一類,然后規(guī)定樣品之間 的“距離”和類與類之間 的距離。選擇距離最近 的兩類合并成一個新類,計算新類和其他類(各當前類) 的距離,再將距離最近 的兩類合并。這樣,每次合并減少一類,
4、直至所有 的樣品都歸成一類為止。系統(tǒng)聚類法 的基本步驟:1、計算n個樣品兩兩間 的距離。2、構造n個類,每個類只包含一個樣品。3、合并距離最近 的兩類為一新類。4、計算新類與各當前類 的距離。5、重復步驟3、4,合并距離最近 的兩類為新類,直到所有 的類并為一類為止。6、畫聚類譜系圖。7、決定類 的個數(shù)和類。系統(tǒng)聚類方法:1、最短距離法;2、最長距離法;3、中間距離法;4、重心法;5、類平均法;6、離差平方和法(Ward法)。二、基于R語言 的系統(tǒng)聚類分析程序R軟件及其相關包提供了各種聚類方法,主要是系統(tǒng)聚類方法、快速聚類方法、模糊聚類方法,常用 的是系統(tǒng)聚類方法。R軟件實現(xiàn)系統(tǒng)聚類 的程序如
5、下:hclust(d,method=complete,members=NULL)其中,d是由“dist”構成 的距離結構,具體包括絕對值距離、歐氏距離、切比雪夫距離、馬氏距離、蘭氏距離等,默認為歐氏距離;method包括類平均法average、重心法centroid、中間距離法median、最長距離法complete、最短距離法single、離差平方和法ward等,默認是最長距離法complete。三、應用舉例表1是山東省2008年各市居民家庭平均每人全年消費性支出,利用所給數(shù)據(jù)對各市進行系統(tǒng)聚類。(表1)R語言程序如下:>X<-read.delim(clipboard,heade
6、r=T)>s(X)<-c(濟南,青島,淄博,棗莊,東營,煙臺,濰坊,濟寧,泰安,威海,日照,萊蕪,臨沂,德州,聊城,濱州,菏澤)>d<-dist(scale(X)>hc1<-hclust(d,single)#最短距離法>hc2<-hclust(d,complete)#最長距離法>hc3<-hclust(d,median)#中間距離法>hc4<-hclust(d,ward)#Ward法>opar<-par(mfrow=c(2,2)>plot(hc1,hang=-1);plot(hc2,hang=-1)>plot(hc3,hang=-1);plot(hc4,hang=-1)輸出結果(圖1)結果分析由圖1可以看出,不同方法 的分類大體一樣,結合山東省具體實際情況,最長距離法分類效果較好。在系統(tǒng)聚類分析中,利用R軟件是最方便、最簡單、最易學 的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T-ZNZ 286-2024 土壤中抗生素抗性基因檢測 高通量熒光定量PCR 法
- T-ZZB 3679-2024 汽車用熱塑性彈性體(TPE)腳墊
- 2025年度股權變更與員工激勵相結合的協(xié)議書
- 二零二五年度商標共營協(xié)議及市場推廣合同
- 二零二五年度婚禮婚禮策劃與現(xiàn)場協(xié)調(diào)免責合同
- 2025年度綠化樹木修剪與智慧城市管理系統(tǒng)合同
- 2025隱名股東股權轉讓及公司股權激勵終止及補償協(xié)議
- 二零二五年度杉木木材行業(yè)人才培養(yǎng)與合作合同
- 二零二五年度健康養(yǎng)生產(chǎn)品傭金合作協(xié)議
- 2025年度車庫車位使用權股權轉讓合同
- 中醫(yī)子午流注十二時辰養(yǎng)生法
- 養(yǎng)老院風險管控手冊
- 標準田字格帶拼音模板空白A4直接打印
- 小學語文 部編版 六年級下冊 第二單元 習作《寫作品梗概》
- 4.7 數(shù)學建模活動:生長規(guī)律的描述教學設計
- 余杭區(qū)住宅房屋裝修備案申請表
- 住宅建筑工程施工重點與難點應對措施方案
- 中醫(yī)婦科病證診斷療效標準
- 護士職業(yè)素養(yǎng)課件
- 專業(yè)醫(yī)院lovo常用文件產(chǎn)品介紹customer presentation
- 叉車日常使用狀況點檢記錄表(日常檢查記錄)
評論
0/150
提交評論