![信息分析與預(yù)測(cè):聚類(lèi)分析_第1頁(yè)](http://file4.renrendoc.com/view/23e4553ea73cb64b582fb1d999155068/23e4553ea73cb64b582fb1d9991550681.gif)
![信息分析與預(yù)測(cè):聚類(lèi)分析_第2頁(yè)](http://file4.renrendoc.com/view/23e4553ea73cb64b582fb1d999155068/23e4553ea73cb64b582fb1d9991550682.gif)
![信息分析與預(yù)測(cè):聚類(lèi)分析_第3頁(yè)](http://file4.renrendoc.com/view/23e4553ea73cb64b582fb1d999155068/23e4553ea73cb64b582fb1d9991550683.gif)
![信息分析與預(yù)測(cè):聚類(lèi)分析_第4頁(yè)](http://file4.renrendoc.com/view/23e4553ea73cb64b582fb1d999155068/23e4553ea73cb64b582fb1d9991550684.gif)
![信息分析與預(yù)測(cè):聚類(lèi)分析_第5頁(yè)](http://file4.renrendoc.com/view/23e4553ea73cb64b582fb1d999155068/23e4553ea73cb64b582fb1d9991550685.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
定量分析(四)聚類(lèi)分析聚類(lèi)分析clusteranalysis聚類(lèi)分析概述距離與相似系數(shù)系統(tǒng)聚類(lèi)法(hierarchicalclustering
)快速聚類(lèi)法(k-meansclustering)聚類(lèi)分析是多元分析的主要方法之一,主要用來(lái)對(duì)大量的樣品或變量進(jìn)行分類(lèi),是初步數(shù)據(jù)分析的重要工具之一。
古語(yǔ):“物以類(lèi)聚,人以群分”,找出特征相似的類(lèi)別,研究其規(guī)律性。一、聚類(lèi)分析概述聚類(lèi)分析(ClausterAnalysis)數(shù)值分類(lèi)法的一種,在社會(huì)應(yīng)用中稱(chēng)類(lèi)型學(xué)。RobertTryon于1939年提出的一種心理學(xué)研究方法。目的:用數(shù)量關(guān)系對(duì)事物進(jìn)行分類(lèi)。對(duì)于可以用某些數(shù)量描述的事物,采用樣本間的距離來(lái)將性質(zhì)接近的事物歸為一類(lèi),從而達(dá)到對(duì)事物的分析和評(píng)價(jià)。聚類(lèi)分析作分類(lèi)時(shí)各類(lèi)群乃至類(lèi)群數(shù)事先未知,而是根據(jù)數(shù)據(jù)的特征確定的,又稱(chēng)為無(wú)師可循的分類(lèi)。一般分為逐步聚類(lèi)、系統(tǒng)聚類(lèi)和其它方法。一、聚類(lèi)分析概述聚類(lèi)的實(shí)質(zhì)根據(jù)樣本(變量)間的親疏關(guān)系將樣本(變量)分為類(lèi),相近的歸為一類(lèi),差別較大的歸為另一類(lèi)。所獲得的分類(lèi)應(yīng)有一定的意義。聚類(lèi)分析的關(guān)鍵親疏關(guān)系的判別:相似性與距離(不相似性)分類(lèi)數(shù)的確定:分多少類(lèi)合適聚類(lèi)分析的應(yīng)用不同地區(qū)城鎮(zhèn)居民收入和消費(fèi)狀況的分類(lèi)研究。
區(qū)域經(jīng)濟(jì)及社會(huì)發(fā)展水平的分析及全國(guó)區(qū)域經(jīng)濟(jì)綜合評(píng)價(jià)產(chǎn)品市場(chǎng)細(xì)分:按照消費(fèi)者的需求特征分成不同的細(xì)分市場(chǎng)在兒童生長(zhǎng)發(fā)育研究中,把以形態(tài)學(xué)為主的指標(biāo)歸于一類(lèi),以機(jī)能為主的指標(biāo)歸于另一類(lèi)聚類(lèi)分析的類(lèi)型根據(jù)分類(lèi)的對(duì)象Q型聚類(lèi)(即樣品聚類(lèi)clusteringforindividuals)R型聚類(lèi)(指標(biāo)聚類(lèi)clusteringforvariables)根據(jù)分類(lèi)的方法:系統(tǒng)聚類(lèi)(hierarchicalclustering
)快速聚類(lèi)(k-meansclustering)聚類(lèi)結(jié)果的輸出樹(shù)狀圖還表征出類(lèi)與類(lèi)之間的相對(duì)接近或距離程度。
162758103494321刷狀圖從上而下或從左而右,可分別反映出不同類(lèi)的情況。二、距離與相似系數(shù)樣本間的親疏關(guān)系通常用距離描述,變量間的親疏關(guān)系通常用相似系數(shù)或相關(guān)系數(shù)描述不同測(cè)量尺度的數(shù)據(jù),其距離的計(jì)算方法不同為了將樣本進(jìn)行分類(lèi),就需要研究樣品之間的關(guān)系;而為了將變量進(jìn)行分類(lèi),就需要研究變量之間的關(guān)系。但無(wú)論是樣品之間的關(guān)系,還是變量之間的關(guān)系,都是用變量來(lái)描述的,變量的類(lèi)型不同,描述方法也就不同。通常,變量按照測(cè)量它們的尺度不同,可以分為三類(lèi)。
(1)間隔尺度。指標(biāo)度量時(shí)用數(shù)量來(lái)表示,其數(shù)值由測(cè)量或計(jì)數(shù)、統(tǒng)計(jì)得到,如長(zhǎng)度、重量、收入、支出等。一般來(lái)說(shuō),計(jì)數(shù)得到的數(shù)量是離散數(shù)量,測(cè)量得到的數(shù)量是連續(xù)數(shù)量。在間隔尺度中如果存在絕對(duì)零點(diǎn),又稱(chēng)比例尺度。
(一)變量測(cè)量尺度的類(lèi)型
(2)順序尺度。指標(biāo)度量時(shí)沒(méi)有明確的數(shù)量表示,只有次序關(guān)系,或雖用數(shù)量表示,但相鄰兩數(shù)值之間的差距并不相等,它只表示一個(gè)有序狀態(tài)序列。如評(píng)價(jià)酒的味道,分成好、中、次三等,三等有次序關(guān)系,但沒(méi)有數(shù)量表示。
(一)變量測(cè)量尺度的類(lèi)型
(3)名義尺度。指標(biāo)度量時(shí)既沒(méi)有數(shù)量表示也沒(méi)有次序關(guān)系,只有一些特性狀態(tài),如眼睛的顏色,化學(xué)中催化劑的種類(lèi)等。在名義尺度中只取兩種特性狀態(tài)的變量是很重要的,如電路的開(kāi)和關(guān),天氣的有雨和無(wú)雨,人口性別的男和女,醫(yī)療診斷中的“十”和“一”,市場(chǎng)交易中的買(mǎi)和賣(mài)等都是此類(lèi)變量。
(一)變量測(cè)量尺度的類(lèi)型由于樣本數(shù)據(jù)受量綱和數(shù)量級(jí)影響,在聚類(lèi)分析處理過(guò)程中,首先應(yīng)對(duì)原始數(shù)據(jù)矩陣進(jìn)行變換處理,以便使不同量綱、不同數(shù)量級(jí)的數(shù)據(jù)能放在一起比較。數(shù)據(jù)變換就是將原始數(shù)據(jù)矩陣中的每個(gè)元素,按照某種特定的運(yùn)算把它變成為一個(gè)新值,而且數(shù)值的變化不依賴(lài)于原始數(shù)據(jù)集合中其它數(shù)據(jù)的新值。(二)數(shù)據(jù)的變換處理(二)數(shù)據(jù)的變換處理中心化變換中心化變換是一種坐標(biāo)軸平移處理方法,它是先求出每個(gè)變量的樣本平均值,再?gòu)脑紨?shù)據(jù)中減去該變量的均值,就得到中心化變換后的數(shù)據(jù)。設(shè)原始觀測(cè)數(shù)據(jù)矩陣為:中心化變換的結(jié)果是使每列數(shù)據(jù)之和均為0,即每個(gè)變量的均值為0,而且每列數(shù)據(jù)的平方和是該列變量樣本方差的(n—1)倍,任何不同兩列數(shù)據(jù)之交叉乘積是這兩列變量樣本協(xié)方差的(n—1)倍,所以這是一種很方便地計(jì)算方差與協(xié)方差的變換。中心化變換規(guī)格化變換是從數(shù)據(jù)矩陣的每一個(gè)變量中找出其最大值和最小值,這兩者之差稱(chēng)為極差,然后從每個(gè)變量的每個(gè)原始數(shù)據(jù)中減去該變量中的最小值,再除以極差,就得到規(guī)格化數(shù)據(jù)。即有:
極差規(guī)格化變換經(jīng)過(guò)規(guī)格化變換后,數(shù)據(jù)矩陣中每列即每個(gè)變量的最大數(shù)值為1,最小數(shù)值為0,其余數(shù)據(jù)取值均在0-1之間;并且變換后的數(shù)據(jù)都不再具有量綱,便于不同的變量之間的比較。
極差規(guī)格化變換標(biāo)準(zhǔn)化變換也是對(duì)變量的數(shù)值和量綱進(jìn)行類(lèi)似于規(guī)格化變換的一種數(shù)據(jù)處理方法。首先對(duì)每個(gè)變量進(jìn)行中心化變換,然后用該變量的標(biāo)準(zhǔn)差進(jìn)行標(biāo)準(zhǔn)化。即有:
標(biāo)準(zhǔn)化變換經(jīng)過(guò)標(biāo)準(zhǔn)化變換處理后,每個(gè)變量即數(shù)據(jù)矩陣中每列數(shù)據(jù)的平均值為0,方差為1,且也不再具有量綱,同樣也便于不同變量之間的比較。變換后,數(shù)據(jù)短陣中任何兩列數(shù)據(jù)乘積之和是兩個(gè)變量相關(guān)系數(shù)的(n-1)倍,所以這是一種很方便地計(jì)算相關(guān)矩陣的變換。
標(biāo)準(zhǔn)化變換對(duì)數(shù)變換是將各個(gè)原始數(shù)據(jù)取對(duì)數(shù),將原始數(shù)據(jù)的對(duì)數(shù)值作為變換后的新值。即:
對(duì)數(shù)變換(三)距離:樣本間的親疏關(guān)系距離的定義:假使每個(gè)樣品由p個(gè)變量描述,則每個(gè)樣品都可以看成p維空間中的一個(gè)點(diǎn),n個(gè)樣品就是p維空間中的n個(gè)點(diǎn),則第i樣品與第j樣品之間的距離記為dijdij滿足下列條件
dij≥0
dii=0
dij=dji
dij≤dik+dkj1.歐式(Euclidian
)距離x1x2①②x12x22x11x21x21-x11x22-x122.明氏(Minkowski
)距離q=1q=2q=∞當(dāng)q=1,為絕對(duì)值距離,SPSS稱(chēng)為block當(dāng)q=2,即為歐式距離當(dāng)q=∞,有,稱(chēng)為切比雪夫(Chebychev)距離實(shí)例計(jì)算品距離矩陣絕對(duì)值距離品Euclidian距離的平方2Euclidian距離明氏距離的缺點(diǎn)各指標(biāo)同等對(duì)待(權(quán)數(shù)相同),不能反映各指標(biāo)變異程度上的差異距離的大小與各指標(biāo)的觀測(cè)單位有關(guān),有時(shí)會(huì)出現(xiàn)不合理結(jié)果(p7,圖1-1例)沒(méi)有考慮指標(biāo)之間的相關(guān)性當(dāng)各指標(biāo)的測(cè)量值相差懸殊時(shí),可以先對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化,然后用標(biāo)準(zhǔn)化后的數(shù)據(jù)計(jì)算距離3.馬氏(Mahalanobis)
距離明氏距離沒(méi)有考慮數(shù)據(jù)中的協(xié)方差模式,馬氏距離則考慮了協(xié)方差,且不受指標(biāo)測(cè)量單位的影響:樣本之間的距離-馬氏距離馬氏距離考慮了各變量之間的相關(guān)性,且與各變量的單位無(wú)關(guān)。S難以確定,S不應(yīng)隨聚類(lèi)過(guò)程而變化。實(shí)際聚類(lèi)分析中,馬氏距離不理想。已知一二維正態(tài)總體G的分布為:G~N(,),其中分別求點(diǎn)A=(1,1)’,和點(diǎn)B=(1,-1)到均值的歐式距離和馬氏距離
歐式等距離線馬氏等距離線Mahalanobis
距離例AB4.Lance和Williams
距離對(duì)標(biāo)準(zhǔn)化變量:樣本之間的距離-蘭氏距離
蘭氏距離與各變量的單位無(wú)關(guān)。對(duì)大的異常值不敏感,故適用于高度偏斜的數(shù)據(jù)。明氏距離和蘭氏距離都沒(méi)有考慮變量之間的相關(guān)性,因此,這兩種距離更適合于變量之間互不相關(guān)的情形。1.夾角余弦(Cosine)(二)相似系數(shù):變量間的親疏關(guān)系受相似形的啟發(fā)而來(lái),AB和CD盡管長(zhǎng)度不一,但形狀相似ABDC2.Pearson相關(guān)系數(shù)(二)相似系數(shù)相似系數(shù):表示樣本之間的相似度
相關(guān)系數(shù):夾角余弦三、系統(tǒng)聚類(lèi)法聚合法分解法通常分為兩步:先做出類(lèi)別距離譜系圖,再根據(jù)譜系圖的特點(diǎn)確定分類(lèi)數(shù)并分類(lèi)系統(tǒng)聚類(lèi)法
在開(kāi)始時(shí)不選重心,而是令各樣本自成一類(lèi);
計(jì)算各樣本間的距離或相似度,使距離最近的,或相似度最大的兩個(gè)樣本并成一類(lèi);
計(jì)算合并后的各類(lèi)間的距離或相似度,使距離最小的或相似度最大的兩類(lèi)并成一類(lèi)。
重復(fù)進(jìn)行兩個(gè)最近類(lèi)的合并,每次減少一類(lèi),直至所有的樣本合并為一類(lèi),或直到滿意的分類(lèi)為止。判據(jù):距離最小或相似度最大。Agglomerative系統(tǒng)聚類(lèi)法基本步驟步驟1:將n個(gè)樣品各作為一類(lèi),共n類(lèi):C1、C2、…、Cn。計(jì)算各類(lèi)之間的距離,構(gòu)成距離矩陣:dcicj=dij步驟2:找到距離最近的兩類(lèi)合并為一新類(lèi)步驟3:計(jì)算新類(lèi)與當(dāng)前各類(lèi)的距離。重復(fù)步驟2、3,直至合并成一類(lèi)為止,形成譜系圖根據(jù)譜系圖確定如何分類(lèi)單樣本類(lèi),類(lèi)與類(lèi)之間的距離為樣品距離類(lèi)間距離類(lèi)與類(lèi)間距離
類(lèi)與類(lèi)之間的距離1.最短距離法(singlelinkage)2.最長(zhǎng)距離法(completelinkage)3.中間距離法(medianmethod)4.類(lèi)平均法(averagelinkage)5.可變類(lèi)平均法(flexible-betamethod)6.重心法(centroidmethod)7.Ward離差平方和法(Ward'sminimum-variancemethod)AgglomerativeMethods:各種不同方法的基本步驟相同,只是類(lèi)與類(lèi)之間距離的計(jì)算方法不同。類(lèi)間距離的計(jì)算
最大距離法:又稱(chēng)完全連接法,是以?xún)深?lèi)間最遠(yuǎn)的樣本間的距離為類(lèi)間距離;最小距離法:又稱(chēng)單連接法,是以?xún)深?lèi)間最近的樣本間距離為類(lèi)間距離;中間距離法:以?xún)深?lèi)間最大和最小距離之中值為類(lèi)間距離;重心法:類(lèi)與類(lèi)之間的距離定義為它們的重心(均值)之間的歐氏距離。類(lèi)平均法:以?xún)深?lèi)樣本間距離的平均值為類(lèi)間距離;離差平方和法:類(lèi)中各樣本到類(lèi)重心的歐氏距離平方之和稱(chēng)為離差平方和。反映了各類(lèi)內(nèi)樣本的分散程度。兩個(gè)較近的類(lèi)合并后所增加的離差平方和最小。(與樣本數(shù)有較大的關(guān)系)系統(tǒng)聚類(lèi)參數(shù)表(一)最短距離法類(lèi)與類(lèi)之間的距離是兩類(lèi)間兩兩樣品間的最短距離最短距離(NearestNeighbor)x21?x12?x22?x11?6個(gè)民族的粗死亡率與期望壽命哈薩克與藏族的距離最短,最先合并形成新類(lèi)CL7新類(lèi)CL7和其余四類(lèi)的距離第二次合并新類(lèi)和各類(lèi)的距離第三次合并第四次合并最后合并成一類(lèi)譜系圖不顯示實(shí)際距離,顯示0-25的比例距離樹(shù)狀圖冰柱圖12345融合在一起的為一類(lèi)(二)最長(zhǎng)距離法類(lèi)與類(lèi)之間的距離是兩類(lèi)間兩兩樣品間的最長(zhǎng)距離最長(zhǎng)距離(FurthestNeighbor
)???x11?x21????最長(zhǎng)距離法第1次合并仍取最短歐式距離新類(lèi)和各類(lèi)的距離:取最大值第2次合并新類(lèi)和各類(lèi)的距離:取最大值第3次合并第4次合并最后合并(三)中間距離法
(medianmethod)
最長(zhǎng)距離夸大了類(lèi)間距離,最短距離低估了類(lèi)間距離。介于兩者間的距離即為中間距離KLJM中間距離法最長(zhǎng)距離最短距離中間距離(四)類(lèi)平均法
(averagelinkagebetweengroup)SPSS作為默認(rèn)方法,稱(chēng)為between-groupslinkageKLJM
組內(nèi)平均連接法(Within-groupLinkage)x21?x12?x22?x11???????組間平均連接(Between-group
Linkage)(五)重心法(centroidmethod)
類(lèi)與類(lèi)間的距離用各自重心間的歐式距離表示
KLJM重心法(Centroidclustering):均值點(diǎn)的距離??(六)Ward最小方差法
(Ward’minimumvariancemethod)
源于方差分析。類(lèi)內(nèi)離差平方和:類(lèi)中各樣品到類(lèi)重心(均值)的平方歐式距離之和?;舅悸罚簝深?lèi)合并后,離差平方和就會(huì)增加。每次選擇使離差平方和增加(SSM-SSK-SSL)最小的兩類(lèi)進(jìn)行合并,直至所有的樣品歸為一類(lèi)。離差平方和法連接2,41,56,5(七)各種系統(tǒng)聚類(lèi)方法的統(tǒng)一
以上聚類(lèi)方法的計(jì)算步驟完全相同,僅類(lèi)與類(lèi)之間的定義不同。Lance和Williams于1967年將其統(tǒng)一為:八種系統(tǒng)聚類(lèi)法公式的參數(shù)
注意:幾種聚類(lèi)方法獲得的結(jié)果不一定相同最長(zhǎng)距離法最短距離法分類(lèi)數(shù)的確定及類(lèi)別的解釋系統(tǒng)聚類(lèi)法給我們提供了一個(gè)類(lèi)別距離譜系,最終樣本如何分類(lèi)、分成幾類(lèi)需要我們自己根據(jù)研究的目的確定。3類(lèi)2類(lèi)2類(lèi)系統(tǒng)聚類(lèi)的SPSS實(shí)現(xiàn)
指定參與聚類(lèi)的變量名和樣品號(hào)
存放標(biāo)識(shí)變量選擇聚類(lèi)類(lèi)型Statistics
聚類(lèi)狀態(tài)表相似矩陣類(lèi)成員:不顯示類(lèi)成員表顯示指定范圍中每一步類(lèi)成員列出指定類(lèi)數(shù)的類(lèi)成員Plot對(duì)話框
樹(shù)狀結(jié)構(gòu)圖冰柱圖冰柱的方向顯示聚類(lèi)的每一步指定顯示的聚類(lèi)范圍不生成冰柱圖Method對(duì)話框
距離測(cè)度方法:不同尺度變量選擇不同方法定距尺度變量定序尺度變量01變量確定標(biāo)準(zhǔn)化的方法:只有前兩種尺度的數(shù)據(jù)才能標(biāo)準(zhǔn)化測(cè)度轉(zhuǎn)換方法距離值取絕對(duì)值相似度變?yōu)椴幌嗨贫染嚯x標(biāo)準(zhǔn)化聚類(lèi)方法選項(xiàng)聚類(lèi)方法選項(xiàng)Between-grouplinkage:類(lèi)平均法,使兩兩項(xiàng)對(duì)之間的平均距離最小Within-grouplinkage:類(lèi)內(nèi)平均連鎖,合并后的類(lèi)中所有項(xiàng)之間的平均距離最小。兩類(lèi)間的距離即是合并后的類(lèi)中所有可能的觀測(cè)量對(duì)之間的距離平方。NearestneighborFartherstneighborCentroidclusteringMedianclusteringWard’smethod距離測(cè)度方法選項(xiàng)Interval:EuclideandistanceSquaredeuclideandistanceCosine:變量矢量的余弦ChebychevBlock:Manhattan距離,兩觀測(cè)單位間距離為其值差的絕對(duì)值和,用于Q型聚類(lèi)MinkowskiCustomized:距離是一個(gè)絕對(duì)冪的度量,即變量絕對(duì)值的第p次冪值和的第r次根數(shù)值標(biāo)準(zhǔn)化的方法選項(xiàng)None:不標(biāo)準(zhǔn)化Zscores:標(biāo)準(zhǔn)化Range-1to1:標(biāo)準(zhǔn)化到-1到+1范圍Maximummagnitude:標(biāo)準(zhǔn)化到最大值1Range0to1:標(biāo)準(zhǔn)化到0-1范圍Meanof1:標(biāo)準(zhǔn)化到一個(gè)均值范圍Standarddeviationof1:標(biāo)準(zhǔn)化到一個(gè)標(biāo)準(zhǔn)差Save對(duì)話框?qū)⒎诸?lèi)結(jié)果存入數(shù)據(jù)文件中生成一個(gè)新變量,表明每個(gè)個(gè)體所屬類(lèi)指定范圍內(nèi)的結(jié)果,生成若干個(gè)新變量四、快速聚類(lèi)法(k-means)
也叫動(dòng)態(tài)聚類(lèi)、逐步聚類(lèi)、迭代聚類(lèi)與系統(tǒng)聚類(lèi)的主要區(qū)別非層次性遞推過(guò)程從初始分類(lèi)開(kāi)始不斷優(yōu)化的過(guò)程當(dāng)樣本量很大時(shí),用系統(tǒng)聚類(lèi)法的計(jì)算工作量極大,作出的樹(shù)狀圖也十分復(fù)雜,不便于分析,用快速聚類(lèi)較好。系統(tǒng)聚類(lèi)分析實(shí)例1、根據(jù)樣品的特征,規(guī)定樣品之間的距離,共有個(gè)。將所有列表,記為D(0)表,該表是一張對(duì)稱(chēng)表。所有的樣本點(diǎn)各自為一類(lèi)。2、選擇D(0)表中最小的非零數(shù),不妨假設(shè),于是將和合并為一類(lèi),記為。(一)方法開(kāi)始各樣本自成一類(lèi)?!?…0┇┇┇0┇…0可以根據(jù)所選擇的距離構(gòu)成樣本點(diǎn)間的距離表,樣本點(diǎn)之間被連接起來(lái)。3、利用遞推公式計(jì)算新類(lèi)與其它類(lèi)之間的距離。分別刪除D(0)表的第p,q行和第p,q列,并新增一行和一列添上的結(jié)果,產(chǎn)生D(1)表。4、在D(1)表再選擇最小的非零數(shù),其對(duì)應(yīng)的兩類(lèi)又構(gòu)成新類(lèi),再利用遞推公式計(jì)算新類(lèi)與其它類(lèi)之間的距離。分別刪除D(1)表的相應(yīng)的行和列,并新增一行和一列添上的新類(lèi)和舊類(lèi)之間的距離。結(jié)果,產(chǎn)生D(2)表。類(lèi)推直至所有的樣本點(diǎn)歸為一類(lèi)為止。(二)常用的種類(lèi)1、最短距離法設(shè)抽取五個(gè)樣品,每個(gè)樣品只有一個(gè)變量,它們是1,2,3.5,7,9。用最短距離法對(duì)5個(gè)樣品進(jìn)行分類(lèi)。首先采用絕對(duì)距離計(jì)算距離矩陣:
0
10
2.51.50
653.50
875.520
然后和被聚為新類(lèi),得:
0
1.50
53.50
75.520
最短距離法的遞推公式
假設(shè)第p類(lèi)和第q類(lèi)合并成第類(lèi),第r類(lèi)與其它各舊類(lèi)的距離按最短距離法為:03.505.52003.50各步聚類(lèi)的結(jié)果:(1,2)(3)(4)(5)(1,2,3)(4)(5)(1,2,3)(4,5)(1,2,3,4,5)2、最長(zhǎng)距離法
0
10
2.51.50
653.50
875.520用最長(zhǎng)距離法對(duì)5個(gè)樣品進(jìn)行分類(lèi)。首先采用絕對(duì)距離計(jì)算距離矩陣:
然后和被聚為新類(lèi),得:
0
2.50
63.50
85.520
最長(zhǎng)距離法的遞推公式假設(shè)第p類(lèi)和第q類(lèi)合并成第類(lèi),第r類(lèi)與其它各舊類(lèi)的距離按最長(zhǎng)距離法為:3、重心法用重心法對(duì)5個(gè)樣品進(jìn)行分類(lèi)。首先采用絕對(duì)距離計(jì)算距離平方矩陣:
0
10
6.252.250
362512.250
644930.2540分別為Gp和Gq的重心,類(lèi)與類(lèi)之間的距離定義為兩個(gè)類(lèi)重心(類(lèi)內(nèi)樣品平均值)間的平方距離。重心法,也稱(chēng)為樣品的均值法。設(shè)Gp和Gq為兩個(gè)類(lèi)設(shè)某一步Gp和Gq的重心分別為和,類(lèi)內(nèi)的樣品數(shù)分別為和,如果要把Gp
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年公司年會(huì)老板致辭范文(17篇)
- 涉外購(gòu)貨合同(3篇)
- 設(shè)計(jì)車(chē)輛出入口流量與停車(chē)位布局方案
- 2024-2025學(xué)年四川省九校高二上學(xué)期12月聯(lián)考?xì)v史試卷
- 2025年協(xié)作資金合同解析
- 2025年中小型企業(yè)品牌共建合作協(xié)議書(shū)
- 2025年專(zhuān)利權(quán)許可與技術(shù)轉(zhuǎn)移合同分析
- 2025年住宅裝飾施工合同
- 2025年企業(yè)流動(dòng)資金貸款償還協(xié)議合同
- 2025年城市規(guī)劃策劃合作發(fā)展協(xié)議
- 人教版初中英語(yǔ)八年級(jí)下冊(cè) 單詞默寫(xiě)表 漢譯英
- 蘇教版六年級(jí)數(shù)學(xué)下冊(cè)《解決問(wèn)題的策略2》優(yōu)質(zhì)教案
- 《靜脈治療護(hù)理技術(shù)操作規(guī)范》考核試題及答案(共140題)
- 英國(guó)文學(xué)8.2講解Sonnet18
- 公民個(gè)人信息安全的刑法保護(hù)論文
- 人事測(cè)評(píng)理論與方法-課件
- 最新卷宗的整理、裝訂(全)課件
- 人教版部編道德與法治三年級(jí)下冊(cè)全冊(cè)全套課件
- 信訪事項(xiàng)受理、辦理、復(fù)查、復(fù)核、聽(tīng)證程序課件
- 【北京】施工現(xiàn)場(chǎng)安全生產(chǎn)標(biāo)準(zhǔn)化管理圖集
- 部編版小學(xué)道德與法治五年級(jí)下冊(cè)教案(全冊(cè))
評(píng)論
0/150
提交評(píng)論