R軟件應(yīng)用多元分析_第1頁
R軟件應(yīng)用多元分析_第2頁
R軟件應(yīng)用多元分析_第3頁
R軟件應(yīng)用多元分析_第4頁
R軟件應(yīng)用多元分析_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

R軟件應(yīng)用多元分析8、1判別法則(分類)已知有多少類,并且在訓(xùn)練樣本得前提下,利用訓(xùn)練樣本得到判別函數(shù),對(duì)待測(cè)樣本進(jìn)行分類;8、1、1距離判別判別問題,就就是將p維歐幾里得空間Rp劃分成k個(gè)互不相交得區(qū)域R1,R2,…,Rk。若x∈Ri,i=1,2,…,k,則判定x屬于總體Xi,i=1,2,…,k、Mahalanobis距離得概念:定義8、1設(shè)x,y就是從均值為μ,協(xié)方差矩陣為Σ得總體X中抽取得兩個(gè)樣本,則總體X內(nèi)兩點(diǎn)x,y得Mahalanobis距離定義為樣本x與總體X的Mahalanobis距離為:例如:=1、661.662.34從歐氏距離看A到μ1得距離比到μ2得距離要近,但從概率分布得角度看,,說明A到μ2得距離比到μ1得距離要近、標(biāo)準(zhǔn)化Mahalanobis距離符合概率分布內(nèi)涵.2、判別準(zhǔn)則與判別函數(shù)2、1兩個(gè)總體得距離判定、總體X1,X2得均值向量分別為μ1,μ2,協(xié)方差分別為Σ1,Σ2,給定樣本x,判斷x來自哪一個(gè)總體、1、μ1≠μ2,

Σ1=Σ2判斷準(zhǔn)則:判斷準(zhǔn)則:總體得均值與協(xié)方差未知時(shí):設(shè)是來自總體X1的n1個(gè)樣本,是來自總體X2的n2個(gè)樣本,則樣本的均值與協(xié)方差陣為判斷準(zhǔn)則:1、μ1≠μ2,

Σ1≠Σ2判斷函數(shù):總體得均值與協(xié)方差未知時(shí):總體得均值與協(xié)方差已知時(shí):MahalanobisDistanceReturnsthesquaredMahalanobisdistanceofallrowsinxandthevectormu=centerwithrespecttoSigma=cov、Thisis(forvectorx)definedasD^2=(x-μ)'Σ^-1(x-μ)Usage:mahalanobis(x,center,cov,inverted=FALSE,、、、)X:vectorormatrixofdatawith,say,pcolumns、Center:meanvectorofthedistributionorseconddatavectoroflengthp、Cov:covariancematrix(pxp)ofthedistribution、R程序discriminiant、distance<-function(TrnX1,TrnX2,TstX=NULL,var、equal=FALSE){if(is、null(TstX)==TRUE)TstX<-rbind(TrnX1,TrnX2)if(is、vector(TstX)==TRUE)TstX<-t(as、matrix(TstX))elseif(is、matrix(TstX)!=TRUE)TstX<-as、matrix(TstX)if(is、matrix(TrnX1)!=TRUE)TrnX1<-as、matrix(TrnX1)if(is、matrix(TrnX2)!=TRUE)TrnX2<-as、matrix(TrnX2)nx<-nrow(TstX)#測(cè)定待測(cè)樣本得個(gè)數(shù)blong<-matrix(rep(0,nx),nrow=1,byrow=TRUE,dimnames=list(“blong”,1:nx))#產(chǎn)生一個(gè)行矩陣,共nx個(gè)數(shù)mu1<-colMeans(TrnX1);mu2<-colMeans(TrnX2)if(var、equal==TRUE||var、equal==T){S<-var(rbind(TrnX1,TrnX2))w<-mahalanobis(TstX,mu2,S)-mahalanobis(TstX,mu1,S)}else{S1<-var(TrnX1);S2<-var(TrnX2)w<-mahalanobis(TstX,mu2,S2)-mahalanobis(TstX,mu1,S1)}for(iin1:nx){if(w[i]>0)blong[i]<-1elseblong[i]<-2}blong}#X1,X2類得訓(xùn)練樣本#TstX=NULL待測(cè)樣本為2個(gè)訓(xùn)練樣本之和#數(shù)據(jù)全部轉(zhuǎn)化成矩陣,行表示樣本個(gè)數(shù),列表示樣本維數(shù)n#根據(jù)第i個(gè)樣本得wi值,返回樣本類別結(jié)果理論中得樣本按列排列X=(X1,X2,…,Xn),每列就是一個(gè)樣本,n列表示n個(gè)樣本,這里樣本按行排X=(X1,X2,…,Xn)T4、判別實(shí)例例8、1在研究砂基液化問題中,選了7個(gè)因子,今從已液化和未液化得地層中分別抽了12個(gè)和23個(gè)樣本,數(shù)據(jù)列在表中,其中I類表示已液化類,II類表示未液化類。試建立距離判別得判別準(zhǔn)則,并按判別準(zhǔn)則對(duì)原35個(gè)樣本進(jìn)行回代(即按判別準(zhǔn)則進(jìn)行分類),分析誤判情況。編號(hào)類別x1x2x3x4x5x6x71I6、6391660、12202I6、63916120、12203I6、1471660、08124I6、14716120、08125I8、43227、5190、35756I7、2617280、3307I8、41133、56180、15758I7、55216120、16409I7、5523、57、560、164010I8、311307、5350、1218011I7、817213、5140、214512I7、81721、53150、214513II8、4321540、357514II8、43229100、357515II8、4322、54100、357516II6、3114、57、530、21517II784、54、590、253018II7867、540、253019II781、5610、253020II8、31611、5440、087021II8、31610、52、510、087022II7、263、54120、33023II7、261330、33024II7、261650、33025II5、562、5370、181826II8、41133、54、560、157527II8、41133、54、580、157528II7、5521660、164029II7、55217、580、164030II8、3970650、1518031II8、3972、5650、1518032II8、38906100、1618033II8、3561、56130、2518034II7、817213、560、214535II7、828314、560、1845#R里的數(shù)據(jù)就是這樣排,樣本均值是對(duì)每個(gè)指標(biāo)按列求均值,然后組成樣本均值R實(shí)現(xiàn):classx1=read、table('dataexample801x1、txt')classx2=read、table('dataexample801x2、txt')discriminiant、distance(classx1,classx2,var、equal=T)

123456789101112131415161718192021222324252611111111211122222222222222272829303132333435blong211222222blong#在認(rèn)為兩個(gè)總體協(xié)方差相同得情況下,有3個(gè)點(diǎn)判錯(cuò)discriminiant、distance(classx1,classx2)

123456789101112131415161718192021222324252611111111211122222222222222272829303132333435blong222222222blong#在認(rèn)為兩個(gè)總體協(xié)方差不同得情況下,有1個(gè)點(diǎn)判錯(cuò)5、多分類問題得距離判別μ1≠μ2…≠μk,

Σ1=Σ2…=Σ

k相應(yīng)得判別準(zhǔn)則:distinguish、distance<-function(TrnX,TrnG,TstX=NULL,var、equal=FALSE){if(is、factor(TrnG)==FALSE){mx<-nrow(TrnX);mg<-nrow(TrnG)TrnX<-rbind(TrnX,TrnG)TrnG<-factor(rep(1:2,c(mx,mg)))}if(is、null(TstX)==TRUE)TstX<-TrnX#如果待測(cè)樣本為空,則將訓(xùn)練樣本視為待測(cè)樣本if(is、vector(TstX)==TRUE)TstX<-t(as、matrix(TstX))

elseif(is、matrix(TstX)!=TRUE)#待測(cè)樣本就是多樣本,但不就是矩陣形式時(shí)TstX<-as、matrix(TstX)#轉(zhuǎn)成矩陣(如data、frame類型轉(zhuǎn)成矩陣)if(is、matrix(TrnX)!=TRUE)TrnX<-as、matrix(TrnX)nx<-nrow(TstX)blong<-matrix(rep(0,nx),nrow=1,dimnames=list(“blong”,1:nx))#本頁語句都就是準(zhǔn)備工作#如果TrnG從主函數(shù)未接收到因子數(shù)據(jù)#待測(cè)樣本TstX就是單樣本時(shí)候,就是向量vector,此時(shí)將其轉(zhuǎn)為矩陣(就是列矩陣),然后再轉(zhuǎn)成行矩陣#則就是2分類問題,而非多分類,可省略#行名稱為”blong”,列名稱為數(shù)字1到nx#產(chǎn)生類別矩陣blong,初始值全為0Continue:g<-length(levels(TrnG))mu<-matrix(0,nrow=g,ncol=ncol(TrnX))

for(iin1:g)mu[i,]<-colMeans(TrnX[TrnG==i,])D<-matrix(0,nrow=g,ncol=nx)#ncol個(gè)樣本因子按列排,g個(gè)類別按行排#對(duì)屬于第i個(gè)類得樣本求她們因子得均值,結(jié)果存到mu得第i行#產(chǎn)生0陣,行數(shù)為類別數(shù)g,列數(shù)為樣本數(shù)nx#得到多分類得類別,共g個(gè):[1]2[,1][,2][,3][,4][,5][,6][,7][1,]0000000[2,]0000000[,1][,2][,3][,4][,5][,6][,7][1,]7、35833373、666671、4583336、0000015、2500000、171666749、50000[2,]7、68695769、608702、0434785、239136、3478260、215652270、34783

[,1][,2][,3][,4][,5][,6][,7][,8][,9][,10][,11][,12][,13][1,]0000000000000[2,]0000000000000[,26][,27][,28][,29][,30][,31][,32][,33][,34][,35][1,]0000000000[2,]0000000000Continue:if(var、equal==TRUE||var、equal==T){for(iin1:g)D[i,]<-mahalanobis(TstX,mu[i,],var(TrnX))}else{for(iin1:g)D[i,]<-mahalanobis(TstX,mu[i,],var(TrnX[TrnG==i,]))}for(jin1:nx){dmin<-Inffor(iin1:g)if(D[i,j]<dmin){dmin<-D[i,j];blong[j]<-i}}blong#待測(cè)樣本到第i類得馬氏距離

[,1][,2][,3][,4][,5][,6][,7][,8][1,]181、3889182、5306162、9359164、1592233、7561205、8525238、8812214、1178[2,]181、3889182、5306162、9359164、1592233、7561205、8525238、8812214、1178[,9][,10][,11][,12][,13][,14][,15][,16][1,]219、4913201、6875185、8174184、6754222、2703241、7303218、1065169、8246[2,]219、4913201、6875185、8174184、6754222、2703241、7303218、1065169、8246[,17][,18][,19][,20][,21][,22][,23][,24][1,]182、1071197、3248186、0215224、1768221、5524185、4759183、1583192、0052[2,]182、1071197、3248186、0215224、1768221、5524185、4759183、1583192、0052[,25][,26][,27][,28][,29][,30][,31][,32][1,]114、8461229、1703229、5824213、1659220、9516181、5381180、7470181、3109[2,]114、8461229、1703229、5824213、1659220、9516181、5381180、7470181、3109[,33][,34][,35][1,]175、8290184、0261181、7853[2,]175、8290184、0261181、7853#對(duì)第j個(gè)樣本,縱向求min,如果該最小值位于第i行,則第j個(gè)樣本就就是屬于第i類方差未知方差已知大家有疑問的,可以詢問和交流可以互相討論下,但要小聲點(diǎn)8、1、2Bayes判別1、誤判概率與誤判損失x被判為X2x實(shí)際來自X1來自X2,但被判為x1的概率:來自X1,但被判為x2的概率:來自X1,但被判為x1的概率:來自X2,但被判為x2的概率:總體X1的先驗(yàn)概率平均誤判損失ECM:ECM(R1,R2)=L(2|1)P(2|1)p1+L(1|2)P(1|2)p2來自X1被判為X2引起的損失來自X2被判為X1引起的損失2、兩個(gè)總體得Bayes判別ECM(R1,R2)=L(2|1)P(2|1)p1+L(1|2)P(1|2)p20ECM=min劃分區(qū)域R1和R2:作為Bayes判別準(zhǔn)則須計(jì)算正態(tài)分布得情況:Xi~N(μi,∑i)(i=1,2)1、∑1=∑2類似地,2、∑1≠∑23、R程序與例子R程序略;例8、3下表就是某氣象站預(yù)報(bào)有無春旱得實(shí)際資料,x1與x2就是綜合預(yù)報(bào)因子,有春旱得就是6個(gè)年份得資料,無春旱得就是8個(gè)年份得資料,她們得先驗(yàn)概率分別用6/14和8/14來估計(jì),并假設(shè)誤判損失相等,試用Bayes估計(jì)對(duì)數(shù)據(jù)進(jìn)行分析。序號(hào)春旱無春旱124、8-222、1-0、7224、1-2、421、6-1、4326、6-322-0、8423、5-1、922、8-1、6525、5-2、122、7-1、5627、4-3、121、5-1722、1-1、2821、4-1、3R實(shí)現(xiàn)x1=scan('dataexample803x1、txt')x2=scan('dataexample803x2、txt')dim(x1)=c(2,6)[,1][,2][,3][,4][,5][,6][1,]24、824、126、623、525、527、4[2,]-2、0-2、4-3、0-1、9-2、1-3、1dim(x2)=c(2,8)x1=t(x1)x2=t(x2)source('discriminiant、bayes、R')discriminiant、bayes(x1,x2,rate=8/6,var、equal=T)

[,1][,2][1,]24、823、5[2,]-2、0-1、9[3,]24、125、5[4,]-2、4-2、1[5,]26、627、4[6,]-3、0-3、1

1234567891011121314blong11121122222222#4號(hào)樣本被錯(cuò)判discriminiant、bayes(x1,x2,rate=8/6)

1234567891011121314blong11111122222222#無錯(cuò)判4、多分類問題得Bayes判別樣本共分k類:X1,X2,…,Xk,相應(yīng)得先驗(yàn)概率為p1,p2,…,pk,假定所有得錯(cuò)判損失相同,則判別準(zhǔn)則為:1、∑1=…=∑k=∑2、∑1≠…≠

∑kR程序……if(var、equal==TRUE||var、equal==T){for(iin1:g){d2<-mahalanobis(TstX,mu[i,],var(TrnX))D[i,]<-d2-2*log(p[i])}}else{for(iin1:g){S<-var(TrnX[TrnG==i,])d2<-mahalanobis(TstX,mu[i,],S)D[i,]<-d2-2*log(p[i])-log(det(S))}}for(jin1:nx){dmin<-Inffor(iin1:g)if(D[i,j]<dmin){dmin<-D[i,j];blong[j]<-i}}blong}例8、4用Bayes判別對(duì)FisherIris數(shù)據(jù)進(jìn)行分析、假設(shè)先驗(yàn)概率相同,均為1、考慮總體協(xié)方差陣不同得情況、x=iris[,1:4]g=gl(3,50)distinguish、bayes(x,g)

123456789101112131415161718192021222324252627blong111111111111111111111111111282930313233343536373839404142434445464748495051blong111111111111111111111112525354555657585960616263646566676869707172737475blong222222222222222223232322767778798081828384858687888990919293949596979899blong223222223222222222222222100101102103104105106107108109110111112113114115116117blong233333333333333333118119120121122123124125126127128129130131132133134135blong333333333333333333136137138139140141142143144145146147148149150blong333333333333333#誤判概率為1-145/150=3、33%8、1、3Fisher判別按類內(nèi)方差盡量小,類間方差盡量大得準(zhǔn)則求判別函數(shù)、(以2個(gè)總體為例)判別準(zhǔn)則總體X1,X2得均值與協(xié)方差陣分別為μ1,μ2和Σ1,Σ2,對(duì)于樣本x,考慮其判別函數(shù):判別準(zhǔn)則為:U(x)=?2、線性判別函數(shù)中系數(shù)得確定u(x)為線性函數(shù)設(shè)總體X1,X2得樣本容量為n1,n2;則u1,u2和σ1,σ

2得估計(jì):確定判別函數(shù)

若:進(jìn)一步:判別準(zhǔn)則為:4、R程序與例子例8、5用Fisher判別解例8、1classx1=read、table('dataexample801x1、txt')classx2=read、table('dataexample801x2、txt')discriminiant、fisher(classx1,classx2)結(jié)果:

1234567891011121314151617181920212223242526blong11111111111122222222222222272829303132333435blong211222222#28,29號(hào)樣本為誤判樣本R程序…

mu1<-colMeans(TrnX1);mu2<-colMeans(TrnX2)S<-(n1-1)*var(TrnX1)+(n2-1)*var(TrnX2)mu<-n1/(n1+n2)*mu1+n2/(n1+n2)*mu2w<-(TstX-rep(1,nx)%o%mu)%*%solve(S,mu2-mu1);…8、2聚類分析[7]常用得幾種距離:第2個(gè)樣本與第n個(gè)樣本之間的距離記為d2nordn28、2、1距離和相似系數(shù)絕對(duì)值距離or“棋盤距離”or“城市街區(qū)”距離Euclid(歐幾里得)距離Minkowski(閔可夫斯基)距離continueChebyshev(切比雪夫)距離Mahalanobis距離為:Lance和Williams距離定性變量樣本間得距離第i個(gè)樣本記為:項(xiàng)目項(xiàng)目的類目數(shù)樣本x(1)x(2)性別 外語 專業(yè) 職業(yè)男 女英 日德俄 統(tǒng)計(jì)會(huì)計(jì)金融教師 工程師1010000010101100010010類目Continue:樣本x(1)x(2)性別 外語 專業(yè) 職業(yè)男 女英 日德俄 統(tǒng)計(jì)會(huì)計(jì)金融教師 工程師10100000101011000100101-1配對(duì)0-0配對(duì)不配對(duì)第i個(gè)樣本和第j個(gè)樣本在第k個(gè)項(xiàng)目的第l類上1-1配對(duì)第i個(gè)樣本和第j個(gè)樣本在第k個(gè)項(xiàng)目的第l類上0-0配對(duì)第i個(gè)樣本和第j個(gè)樣本在第k個(gè)項(xiàng)目的第l類上不配對(duì)0-0配對(duì)數(shù)1-1配對(duì)數(shù)不配對(duì)數(shù)表中得樣本距離d12=6/7=0、8571429R中得距離函數(shù)Usagedist(x,method="euclidean",diag=FALSE,upper=FALSE,p=2)DescriptionThisfunctionputesandreturnsthedistancematrixputedbyusingthespecifieddistancemeasuretoputethedistancesbetweentherowsofadatamatrix、x:anumericmatrix,dataframeor"dist"object、method:thedistancemeasuretobeused、Thismustbeoneof"euclidean","maximum","manhattan","canberra","binary"or"minkowski"、Anyunambiguoussubstringcanbegiven、Euclidean:euclid距離Maximum:chebyshev距離Manhattan:絕對(duì)值距離Canberra:lance距離Binary:定性變量得距離Minkowski:minkowski距離2、數(shù)據(jù)中心化與標(biāo)準(zhǔn)化表示因素表示樣本對(duì)第i個(gè)樣本中心化,標(biāo)準(zhǔn)化(1)極差標(biāo)準(zhǔn)化、對(duì)第i個(gè)樣本極差標(biāo)準(zhǔn)化,正規(guī)化x=data、frame(x1=c(1,2),x2=c(1,2),x3=c(1,2),x4=c(1,2))x1x2x3x41111122222ap=apply(x,2,mean)x1x2x3x41、51、51、51、5center=sweep(x,2,ap)r=apply(x,2,max)-apply(x,2,min)x_star=sweep(center,2,r,'/')x_star=sweep(center,2,sd(x),'/')>rx1x2x3x41111>centerx1x2x3x41-0、5-0、5-0、5-0、520、50、50、50、5>x_starx1x2x3x41-0、5-0、5-0、5-0、520、50、50、50、5>x_starx1x2x3x41-0、7071068-0、7071068-0、7071068-0、707106820、70710680、70710680、70710680、7071068#普通標(biāo)準(zhǔn)化continue(2)極差正規(guī)化變換、x=data、frame(x1=c(1,2),x2=c(1,2),x3=c(1,2),x4=c(1,2))x1x2x3x41111122222ap=apply(x,2,min)x1x2x3x41111center=sweep(x,2,ap)r=apply(x,2,max)-apply(x,2,min)x_star=sweep(center,2,r,'/')>rx1x2x3x41111>centerx1x2x3x41000021111>x_starx1x2x3x410000211113、相似系數(shù)相似系數(shù)用于對(duì)變量進(jìn)行分類。夾角余弦Xi與Xj的夾角余弦稱為兩向量的相似系數(shù)x=data、frame(x1=c(1,2),x2=c(1,2),x3=c(1,2),x4=c(1,2))y=scale(x,center=F,scale=T)/sqrt(nrow(x)-1)x1x2x3x4[1,]0、44721360、44721360、44721360、4472136[2,]0、89442720、89442720、89442720、8944272c=t(y)%*%y將樣本列(變量)標(biāo)準(zhǔn)化相關(guān)系數(shù)中心化樣本(變量)得相關(guān)矩陣R實(shí)現(xiàn):cor(x)8、2、2系統(tǒng)聚類法記號(hào):dij:第i個(gè)樣本與第j個(gè)樣本得距離、G1,G2:表示類、DKL:GK與GL得(類)距離、最短距離法類與類之間的距離為兩類最近樣本間的距離:當(dāng)某步驟類GK和GL合并為GM后,按最短距離法計(jì)算新類GM與其她類GJ得類間距離:最長距離法遞推公式中間距離法推廣:類平均法可變類平均法:類GK的樣本個(gè)數(shù)Mcquitty相似分析遞推公式類與類之間的距離定義為他們重心(均值)之間的Euclid距離.設(shè)GK和GL的重心分別為和.重心法遞推公式離差平方和法(ward方法)遞推公式GK和GL的平方距離也可定義為:與重心法相差一個(gè)系數(shù),表明表明大樣本類不易合并,這更符合實(shí)際。7、R相關(guān)函數(shù)及其用法Usagehclust(d,method="plete",members=NULL)DescriptionHierarchicalclusteranalysisonasetofdissimilaritiesandmethodsforanalyzingit、d:adissimilaritystructureasproducedbydist、method:"ward","single","plete","average","mcquitty","median"or"centroid"、例8、6設(shè)有5個(gè)樣本,每個(gè)樣本只有一個(gè)指標(biāo),分別就是1,2,6,8,11,樣本間得距離選用Euclid距離,試用最短距離法、最長距離法等方法進(jìn)行聚類分析,并畫出相應(yīng)得譜系圖、R實(shí)現(xiàn):x=c(1,2,6,8,11)dim(x)=c(5,1)d=dist(x)>d1234213544762510953第一個(gè)樣本到第2,3,4,5個(gè)樣本的距離例8、6(續(xù))hc1=hclust(d,'single')hc2=hclust(d,'plete')hc3=hclust(d,'median')hc4=hclust(d,'mcquitty')hc5=hclust(d,'average')hc6=hclust(d,'centroid')hc7=hclust(d,'ward')opar=par(mfrow=c(3,3))plot(hc1,hang=-1)plot(hc2,hang=-1)plot(hc3,hang=-1)plot(hc4,hang=-1)plot(hc5,hang=-1)plot(hc6,hang=-1)plot(hc7,hang=-1)例8、7對(duì)305名女中學(xué)生測(cè)量8個(gè)體型指標(biāo),相應(yīng)得相關(guān)矩陣如表,將相關(guān)系數(shù)看成相似系數(shù),定義距離為dij=1-rij,用最長距離法做系統(tǒng)分析、身高手臂長上肢長下肢長體重頸圍胸圍胸寬x1x2x3x4x5x6x7x8x11x20、8461x30、8050、8811x40、8590、8260、8011x50、4730、3760、380、4361x60、3980、3260、3190、3290、7621x70、3010、2770、2370、3270、730、5831x80、3820、2770、3450、3650、6290、5770、5391R實(shí)現(xiàn)x=scan('dataexample807、txt')r=as、matrix(x)dim(r)=c(8,8)d=as、dist(1-r)hc=hclust(d)plot(hc,hang=-1)>d123456720、15430、1950、11940、1410、1740、19950、5270、6240、6200、56460、6020、6740、6810、6710、23870、6990、7230、7630、6730、2700、41780、6180、7230、6550、6350、3710、4230、4618、類個(gè)數(shù)得確定給定一個(gè)閾值、觀測(cè)樣本得散點(diǎn)圖、(僅限于二維,三維樣本)試用統(tǒng)計(jì)量、根據(jù)譜系圖確定分類個(gè)數(shù)得原則:A、各類重心得距離必須很大、B、確定得類中,各類所包含得元素都不要太多、C、類得個(gè)數(shù)必須符合實(shí)用得目得、D、若采用不同得聚類方法處理,則在各自得聚類圖中應(yīng)發(fā)現(xiàn)相同得類、Usagerect、hclust(tree,k=NULL,which=NULL,x=NULL,h=NULL,border=2,cluster=NULL)DescriptionDrawsrectanglesaroundthebranchesofadendrogramhighlightingthecorrespondingclusters、Tree就是由hclust生成得對(duì)象;K就是類得個(gè)數(shù);H就是譜系圖中得閾值;Rect、hclust()實(shí)例(8、7)9、實(shí)例表中給出了1999年全國31個(gè)省,市,自治區(qū)得城鎮(zhèn)居民家庭平均每人全年消費(fèi)性支出得8個(gè)主要指標(biāo)(變量)數(shù)據(jù)、這8個(gè)變量就是:x1:食品;x2:衣著;x3:家庭設(shè)備用品及服務(wù);x4:醫(yī)療保障;x5:交通與通信;x6:娛樂教育文化服務(wù);x7:居住;x8:雜項(xiàng)商品和服務(wù);分別使用最長距離法,類平均法,重心法和ward方法對(duì)各地區(qū)做聚類分析、x1x2x3x4x5x6x7x8北京2959、19730、79749、41513、34467、871141、82478、42457、64天津2459、77495、47697、33302、87284、19735、97570、84305、08河北1495、63515、9362、37285、32272、95540、58364、91188、63山西1046、33477、77290、15208、57201、5414、72281、84212、1內(nèi)蒙1303、97524、29254、83192、17249、81463、09287、87192、96遼寧1730、84553、9246、91279、81239、18445、2330、24163、86吉林1561、86492、42200、49218、36220、69459、62360、48147、76黑龍江1410、11510、71211、88277、11224、65376、82317、61152、85上海3712、31550、74893、37346、935271034、98720、33462、03浙江2629、16557、32689、73435、69514、66795、87575、76323、36安徽1844、78430、29271、28126、33250、56513、18314151、39福建2709、46428、11334、12160、77405、14461、67525、13232、29江西1563、78303、65233、81107、9209、7393、99509、39160、12continue山東1675、75613、32550、71219、79272、59599、43371、62211、84河南1427、65431、79288、55208、14217337、76421、31165、32湖北1783、43511、88282、84201、01237、6617、74523、52182、52湖南1942、23512、27401、39206、06321、29697、22492、6226、45廣東3055、17353、23564、56

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論