聚類分析法預(yù)測_第1頁
聚類分析法預(yù)測_第2頁
聚類分析法預(yù)測_第3頁
聚類分析法預(yù)測_第4頁
聚類分析法預(yù)測_第5頁
已閱讀5頁,還剩83頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

聚類分析法預(yù)測第一頁,共八十八頁,2022年,8月28日聚類分析原理介紹什么是自然分組結(jié)構(gòu)Naturalgrouping?我們看看以下的例子:有16張牌如何將他們分為一組一組的牌呢?AKQJ第二頁,共八十八頁,2022年,8月28日聚類分析原理介紹分成四組每組里花色相同組與組之間花色相異AKQJ花色相同的牌為一副Individualsuits第三頁,共八十八頁,2022年,8月28日聚類分析原理介紹分成四組符號相同的牌為一組AKQJ符號相同的的牌Likefacecards第四頁,共八十八頁,2022年,8月28日聚類分析原理介紹分成兩組顏色相同的牌為一組AKQJ顏色相同的配對Blackandredsuits第五頁,共八十八頁,2022年,8月28日聚類分析原理介紹分成兩組大小程度相近的牌分到一組AKQJ大配對和小配對Majorandminorsuits第六頁,共八十八頁,2022年,8月28日聚類分析原理介紹這個(gè)例子告訴我們,分組的意義在于我們怎么定義并度量“相似性”Similar因此衍生出一系列度量相似性的算法AKQJ大配對和小配對Majorandminorsuits第七頁,共八十八頁,2022年,8月28日YOURSITEHERE第一節(jié)引言第二節(jié)聚類統(tǒng)計(jì)量第三節(jié)系統(tǒng)聚類法第四節(jié)動(dòng)態(tài)聚類法主要內(nèi)容第八頁,共八十八頁,2022年,8月28日YOURSITEHERE第一節(jié)引言第九頁,共八十八頁,2022年,8月28日YOURSITEHERE人類認(rèn)識事物、認(rèn)識世界,往往從分類開始。聚類分析和判別分析是研究事物分類的基本方法。在數(shù)學(xué)分類和模式識別中,有兩類問題:第一類問題:研究對象存在一個(gè)事前分類,將未知個(gè)體歸屬于其中的一類——判別分析(有監(jiān)督或稱有導(dǎo)師的Supervised,樣品的類別屬性是“被標(biāo)記了”的labeled)另一類問題:不存在一個(gè)事前分類,對數(shù)據(jù)結(jié)構(gòu)進(jìn)行分類(分組)——聚類分析(無監(jiān)督或稱無導(dǎo)師的Unsupervised)第十頁,共八十八頁,2022年,8月28日YOURSITEHERE判別分析數(shù)據(jù)格式第十一頁,共八十八頁,2022年,8月28日YOURSITEHERE聚類分析數(shù)據(jù)格式第十二頁,共八十八頁,2022年,8月28日YOURSITEHERE在地學(xué)領(lǐng)域中,經(jīng)常面臨著大量的分類問題,即對一定量的事物(如地質(zhì)體、樣品或變量)按其屬性進(jìn)行歸類。由于地質(zhì)對象的復(fù)雜性,單靠定性標(biāo)志或少數(shù)定量標(biāo)志進(jìn)行分類,常常不能揭示客觀事物內(nèi)在本質(zhì)的差別和聯(lián)系,難以確定地質(zhì)體本質(zhì)屬性的歸屬。同時(shí)也造成很多分類計(jì)算具有很大的主觀性和任意性,而且所得的結(jié)果因人而異,常不能反映客觀實(shí)際情況。地學(xué)研究中的分類問題較多,如巖石分類、礦物分類、構(gòu)造期次研究、古氣候古環(huán)境劃分等,這些都有可能需要利用聚類分析來研究。第十三頁,共八十八頁,2022年,8月28日YOURSITEHERE聚類分析是一種研究分類問題的多元統(tǒng)計(jì)方法。聚類分析的職能是建立一種分類方法,它將一批樣品或變量,按照它們在性質(zhì)上的親疏、相似程度進(jìn)行分類。聚類分析的出發(fā)點(diǎn)是研究對象之間可能存在的相似性和親疏關(guān)系。所以,根據(jù)研究對象之間各種特征標(biāo)志的相似程度或相關(guān)程度的大小,可將它們進(jìn)行分類歸組。物以類聚,人以群分第十四頁,共八十八頁,2022年,8月28日YOURSITEHERE聚類分析的分類原則是①同一類中的分類對象在某種意義上趨于彼此相似(有較大的相似性);②不同類中的分類對象趨于不相似(有很大的差異)。聚類分析的目的是把分類對象按一定規(guī)則分成若干類,這些類不是事先給定的,而是根據(jù)數(shù)據(jù)的特征而確定。第十五頁,共八十八頁,2022年,8月28日YOURSITEHERE根據(jù)已知數(shù)據(jù),計(jì)算各觀察個(gè)體或變量之間親疏關(guān)系的統(tǒng)計(jì)量(距離、相關(guān)系數(shù)等),根據(jù)某種準(zhǔn)則(最短距離法、最長距離法、中間距離法、重心法等),使同一類內(nèi)的差別較小,而類與類之間的差別較大,最終將觀察個(gè)體或變量分為若干類。聚類分析基本思想第十六頁,共八十八頁,2022年,8月28日YOURSITEHERE兩個(gè)“距離”概念按照遠(yuǎn)近程度來聚類需要明確兩個(gè)概念:一個(gè)是點(diǎn)和點(diǎn)之間的距離,一個(gè)是類和類之間的距離。點(diǎn)間距離有很多定義方式。最簡單的是歐氏距離,還有其他的距離。當(dāng)然還有一些和距離相反但起同樣作用的概念,比如相似性等,兩點(diǎn)越相似度越大,就相當(dāng)于距離越短。由一個(gè)點(diǎn)組成的類是最基本的類;如果每一類都由一個(gè)點(diǎn)組成,那么點(diǎn)間的距離就是類間距離。但是如果某一類包含不止一個(gè)點(diǎn),那么就要確定類間距離,第十七頁,共八十八頁,2022年,8月28日YOURSITEHERE類間距離是基于點(diǎn)間距離定義的:比如兩類之間最近點(diǎn)之間的距離可以作為這兩類之間的距離,也可以用兩類中最遠(yuǎn)點(diǎn)之間的距離作為這兩類之間的距離;當(dāng)然也可以用各類的中心之間的距離來作為類間距離。在計(jì)算時(shí),各種點(diǎn)間距離和類間距離的不同選擇,其結(jié)果會(huì)有所不同,但一般不會(huì)差太多。第十八頁,共八十八頁,2022年,8月28日YOURSITEHERE聚類分析的分類按聚類方法分系統(tǒng)聚類法,也叫分層聚類法,

hierarchicalcluster動(dòng)態(tài)聚類法,也叫快速聚類法quickcluster

逐步聚類、迭代聚類 k-均值聚類k-meanscluster最優(yōu)分割法(有序樣品聚類法)模糊聚類法圖論聚類法聚類預(yù)報(bào)法等第十九頁,共八十八頁,2022年,8月28日YOURSITEHERE按聚合方式分聚合法:分類開始時(shí)每個(gè)樣品自成一類。最常用,分類結(jié)果常用分類譜系圖表達(dá)。分裂法:分類開始將全部樣品看成一類。通常只能是求局部最優(yōu)解的方法。調(diào)優(yōu)法:首先對樣品進(jìn)行粗糙的分個(gè)類。動(dòng)態(tài)聚類法就是其中最典型的方法。加入法:業(yè)已存在一個(gè)分類結(jié)果,確定每個(gè)新加入樣品在分類結(jié)構(gòu)中最合適的位置。等聚類分析的分類第二十頁,共八十八頁,2022年,8月28日YOURSITEHERE聚類分析的分類按聚類對象Q型聚類:對樣品的聚類(cases)R型聚類:對變量的聚類(variables)R型聚類和Q型聚類這兩種聚類在數(shù)學(xué)處理上是對稱的,沒有什么不同。

第二十一頁,共八十八頁,2022年,8月28日YOURSITEHERER型聚類分析和Q型聚類分析研究變量之間的相似程度,對變量進(jìn)行分組。從幾何意義上說,是以N個(gè)樣品為坐標(biāo)軸,每個(gè)變量視為坐標(biāo)空間的一點(diǎn)或一個(gè)向量,研究樣本空間變量點(diǎn)之間的關(guān)系。1.R型聚類分析(對變量的聚類)如研究控礦地質(zhì)因素及礦化標(biāo)志間的相關(guān)關(guān)系,多用于礦物,化學(xué)元素等方面的分組,以助于礦床成因問題的研究。樣品2樣品3樣品1變量1變量2變量3是一種降維的方法第二十二頁,共八十八頁,2022年,8月28日YOURSITEHERER型聚類分析和Q型聚類分析研究樣品之間的相似程度,對樣品進(jìn)行分類。從幾何意義上說,是以P個(gè)變量為坐標(biāo)軸,每個(gè)樣品視為p維空間中一點(diǎn)或一個(gè)向量,研究樣本空間樣品點(diǎn)之間的關(guān)系。2.Q型聚類分析(對樣品的聚類)變量2變量3變量1樣品1樣品2樣品3第二十三頁,共八十八頁,2022年,8月28日YOURSITEHERE對礦床統(tǒng)計(jì)預(yù)測來說,主要是進(jìn)行Q型聚類。(1)對研究區(qū)所劃分的單元,可視為樣品,各單元所測定的各種地質(zhì)特征作為變量構(gòu)成原始數(shù)據(jù)組。(2)各單元成礦遠(yuǎn)景的好壞,決定于單元內(nèi)有利成礦地質(zhì)因素及礦化標(biāo)志的發(fā)育程度,根據(jù)這些地質(zhì)因素和標(biāo)志的相似程度對單元進(jìn)行歸類分組。這實(shí)際上是一種對地質(zhì)環(huán)境的分類。(3)然后,據(jù)分類中已知有礦和已知無礦單元的分類歸組,結(jié)合地質(zhì)條件分析,相對地評價(jià)各未知單元的成礦遠(yuǎn)景。第二十四頁,共八十八頁,2022年,8月28日YOURSITEHERE第二節(jié)聚類統(tǒng)計(jì)量樣品Case變量Variable第二十五頁,共八十八頁,2022年,8月28日YOURSITEHERE絕對值距離歐氏距離閔可夫斯基距離切比雪夫距離方差加權(quán)距離蘭氏距離馬哈拉諾比斯距離夾角余弦相似系數(shù)距離系數(shù)聚類統(tǒng)計(jì)量(也稱相似性統(tǒng)計(jì)量)dij|Cij|,|rij|越接近于1,相似程度越高Cij|dij|越小,相似程度越高Q型聚類統(tǒng)計(jì)量R型聚類統(tǒng)計(jì)量相關(guān)系數(shù)rij第二十六頁,共八十八頁,2022年,8月28日YOURSITEHERE樣品xi=(xi1,xi2,…,xip)樣品xj=(xi1,xi2,…,xip)間的距離絕對值距離歐氏距離閔可夫斯基距離切比雪夫距離第二十七頁,共八十八頁,2022年,8月28日YOURSITEHERE樣品xi=(xi1,xi2,…,xip)樣品xj=(xi1,xi2,…,xip)間的距離方差加權(quán)距離蘭氏距離馬氏距離(要求xij>0)第二十八頁,共八十八頁,2022年,8月28日YOURSITEHERE變量xi=(x1i,x2i,…,xni)T變量xj=(x1i,x2i,…,xnj)T間的相似系數(shù)夾角余弦相關(guān)系數(shù)第二十九頁,共八十八頁,2022年,8月28日YOURSITEHERE樣品2樣品3樣品1變量1變量2變量3變量2變量3變量1樣品1樣品2樣品3距離系數(shù)夾角余弦第三十頁,共八十八頁,2022年,8月28日

距離系數(shù)是一個(gè)衡量空間兩點(diǎn)之間相似程度的統(tǒng)計(jì)量,距離系數(shù)越小,兩點(diǎn)越相似。條件:直角坐標(biāo)系,要求變量是獨(dú)立的。距離系數(shù)在二維情況下第三十一頁,共八十八頁,2022年,8月28日第三十二頁,共八十八頁,2022年,8月28日N個(gè)樣品,P個(gè)指標(biāo)R型:變量P個(gè)指標(biāo)Q型:樣品N個(gè)指標(biāo)第三十三頁,共八十八頁,2022年,8月28日將N個(gè)樣品的兩兩間的距離系數(shù)求出來,可排一個(gè)距離系數(shù)矩陣第三十四頁,共八十八頁,2022年,8月28日

相似系數(shù)是衡量空間兩個(gè)向量相似性的一個(gè)指標(biāo),相似系數(shù)越大,兩個(gè)向量越相似。相似系數(shù)第三十五頁,共八十八頁,2022年,8月28日第三十六頁,共八十八頁,2022年,8月28日將N個(gè)樣品相似系數(shù)求出來,排成一個(gè)相似系數(shù)矩陣第三十七頁,共八十八頁,2022年,8月28日相關(guān)系數(shù)

相關(guān)系數(shù)是衡量變量之間相關(guān)程度的一個(gè)指標(biāo),變量xi與xj的相關(guān)系數(shù)定義為:

第三十八頁,共八十八頁,2022年,8月28日第三十九頁,共八十八頁,2022年,8月28日YOURSITEHERE距離和相似系數(shù)之間的轉(zhuǎn)換一般說來,距離越小,兩樣品之間關(guān)系越密切,而相似系數(shù)越大,兩變量之間關(guān)系越密切。為了聚類方便起見,可以用下面的公式從相關(guān)系數(shù)得到變量間的距離。dij2=1-rij2

第四十頁,共八十八頁,2022年,8月28日YOURSITEHERE第三節(jié)系統(tǒng)聚類法hierarchicalclusteringmethod系統(tǒng)聚類方式:聚合法:先視每個(gè)為一類,再合并為幾大類分裂法:先視為一大類,再分成幾類可用于Q型聚類和R型聚類第四十一頁,共八十八頁,2022年,8月28日YOURSITEHERE開始時(shí)將每個(gè)樣品(或變量)都視為一類,然后將各樣品(或變量)相互之間兩兩加以比較,根據(jù)聚類統(tǒng)計(jì)量逐步歸類,關(guān)系密切的聚合到一個(gè)小的分類單位,關(guān)系疏遠(yuǎn)的聚合到一個(gè)較大的分類單位,直到把所有樣品(或變量)都聚合并為一大類完畢為止,形成一個(gè)由小到大的分類系統(tǒng),并繪制聚類譜系圖,把樣品之間的親疏關(guān)系簡明直觀地展示出來。一、系統(tǒng)聚類的特點(diǎn)第四十二頁,共八十八頁,2022年,8月28日YOURSITEHERE二、系統(tǒng)聚類的基本思路和做法(1)先將待聚類的n個(gè)樣品(或者變量)各作為一類;(2)選定聚類統(tǒng)計(jì)量,計(jì)算每兩個(gè)類之間的聚類統(tǒng)計(jì)量,將關(guān)系最密切的兩類并為一類,其余不變,即得n-1類。再按前面的計(jì)算方法,計(jì)算新類與其它類之間的距離(或者相似系數(shù)),再將關(guān)系最密切的兩類并為一類,其余不變,即得n-2類;(3)如此繼續(xù)下去,每次重復(fù)都減少一類,直到最后所有所有樣品(或變量)歸為一類為止。第四十三頁,共八十八頁,2022年,8月28日YOURSITEHEREX=1.02.02.54.52.02.04.01.54.02.5x1x2相似性標(biāo)尺k=1k=2k=3k=4012345012345第四十四頁,共八十八頁,2022年,8月28日YOURSITEHERE任給兩類,Gk,Gl

,規(guī)定其類間距離為兩類樣品間的最短距離,若類Gk與Gl合并成一個(gè)新類Gm,則Gm與任一類Gr的距離為多少?GkGlGrGm記類Gk與類Gl之間的距離為Dkl

d(xi,xj)表示點(diǎn)xi∈Gk和xj∈Gl之間的距離最短距離三、類間距離問題:當(dāng)最親近的兩個(gè)樣品合并為一個(gè)類時(shí),則形成一個(gè)樣品集團(tuán),即p維空間中的一個(gè)點(diǎn)群。如何度量類與類之間的距離?第四十五頁,共八十八頁,2022年,8月28日YOURSITEHERE1.最短距離法(singlelinkage)2.最長距離法(completelinkage)3.中間距離法(medianlinkage)4.重心法(centroidmethod)5.類平均法(averagelinkage)6.可變類平均法(flexible-betamethod)7.可變法8.離差平方和法(亦稱Ward法,Ward'sminimum-variancemethod)等以上聚類方法的計(jì)算步驟完全相同,僅類與類之間的定義不同。四、系統(tǒng)聚類方法第四十六頁,共八十八頁,2022年,8月28日YOURSITEHERE四、譜系圖的形成和應(yīng)用聚類的原則(譜系圖的形成過程)一步形成法多步形成法第四十七頁,共八十八頁,2022年,8月28日YOURSITEHERE①若選出的一對樣品在已經(jīng)分好的組中都未出現(xiàn)過,則把它們形成一個(gè)新組。(形成新類)②若選出的一對樣品中,有一個(gè)出現(xiàn)在已經(jīng)分好的組里,則把另一個(gè)也加入到該組。(加入類中)③若選出的兩個(gè)樣品,它們分別出現(xiàn)在已經(jīng)分好的兩組中,則把這兩個(gè)組連在一起。(合并兩類)④若選出的兩個(gè)樣品都出現(xiàn)在同一組中,則不須再分組。(不再分類)聚合歸類時(shí)一般應(yīng)遵從以下四條原則:按上述四條原則反復(fù)進(jìn)行,直到將所有的樣品(或變量)都聚合完畢為止。最終可形成譜系圖,也稱樹狀圖。1.聚類的原則(譜系圖的形成過程)第四十八頁,共八十八頁,2022年,8月28日YOURSITEHERE2.一步形成法(一次計(jì)算分類法)一步形成法是一種最簡單的聚類方法,計(jì)算量不大。它由距離矩陣或相似性系數(shù)矩陣出發(fā)得到最終的分類結(jié)果。方法原理:根據(jù)距離或相似系數(shù)的大小,依次將諸樣品(或變量)歸類連接起來,形成一個(gè)從小類到大類的分類系統(tǒng)。在連接過程中,要遵循前述四條原則。第四十九頁,共八十八頁,2022年,8月28日YOURSITEHERE例:對鄂東7個(gè)矽卡巖體的化探資料的Q型聚類分析。距離矩陣連接表123456第五十頁,共八十八頁,2022年,8月28日YOURSITEHERE根據(jù)相似性水平的地質(zhì)意義對譜系圖進(jìn)行分組,并對每組作出地質(zhì)解釋。相似性水平的不同反映了要求精度的差別,其結(jié)果表現(xiàn)為分組的粗細(xì)不同。58795680839810200.20.40.60.81.0Cu/W/Mo型Cu型Cu礦化Cu第五十一頁,共八十八頁,2022年,8月28日一次形成法(相似系數(shù))1)對原始數(shù)據(jù)進(jìn)行變換2)計(jì)算相似系數(shù)

第五十二頁,共八十八頁,2022年,8月28日3)用一次形成法形成分群圖

1X1

X4

0.9907劃去4行4列X1X2X3X4X5X6X1X2X3X4X5X6第五十三頁,共八十八頁,2022年,8月28日1X1X40.99072X5

X6

0.9886劃去6行6列X1X2X3X4X5X6X1X2X3X4X5X6第五十四頁,共八十八頁,2022年,8月28日劃去3行3列X1X2X3X4X5X6X1X2X3X4X5X61X1X40.9907X5

X6

0.9886X2X30.9843第五十五頁,共八十八頁,2022年,8月28日劃去5行5列X1X2X3X4X5X6X1X2X3X4X5X61X1X40.9907X5

X6

0.9886X2X30.9843X2X3X5X60.9664第五十六頁,共八十八頁,2022年,8月28日劃去2行2列X1X2X3X4X5X6X1X2X3X4X5X61X1X40.9907X5

X6

0.9886X2X30.9843X2X3X5X60.9664X1X4X2X3X5X60.9624第五十七頁,共八十八頁,2022年,8月28日聚類譜系圖1X1X40.9907X5

X6

0.9886X2X30.9843X2X3X5X60.9664X1X4X2X3X5X60.9624第五十八頁,共八十八頁,2022年,8月28日優(yōu)點(diǎn):方法簡單,易于操作,工作量小。缺點(diǎn):一次形成法有缺點(diǎn),很可能把不相似的樣品歸入一類,如上例中第四次挑了X2和X5,按分類原則就把X2、X3和X5、X6劃為了一類,但X6是否與X2相似,X3是否與X5相似就沒有定量標(biāo)準(zhǔn)1X1X40.9907X5

X6

0.9886X2X30.9843X2X3X5X60.9664X1X4X2X3X5X60.9624第五十九頁,共八十八頁,2022年,8月28日第六十頁,共八十八頁,2022年,8月28日第六十一頁,共八十八頁,2022年,8月28日第六十二頁,共八十八頁,2022年,8月28日第六十三頁,共八十八頁,2022年,8月28日YOURSITEHERE2.多步形成法(逐步計(jì)算成群法)與一步形成法基本步驟相似,唯一的區(qū)別是每一步分類后,要把分過類變量合并成為一個(gè)新的變量,即在相關(guān)系數(shù)矩陣中劃出最大的元素,將相應(yīng)的變量合并,賦予新的記號,把合并的變量的數(shù)據(jù)加權(quán)平均作為新的變量的數(shù)據(jù),再計(jì)算合并后新變量與其余各變量的相關(guān)系數(shù),建立新的相關(guān)矩陣,再進(jìn)行下一步分類,重復(fù)這一過程直到把所有變量都合并為一類。最后按歸類作譜系圖。以距離作為聚類統(tǒng)計(jì)量(Q型聚類)情形: 見前關(guān)于類間距離的系統(tǒng)聚類方法以相關(guān)系數(shù)作為聚類統(tǒng)計(jì)量(R型聚類)情形:

(1)轉(zhuǎn)換成距離來處理

(2)連續(xù)計(jì)算相關(guān)系數(shù)矩陣第六十四頁,共八十八頁,2022年,8月28日(1)計(jì)算樣品(或變量)間的相似性系數(shù)矩陣,挑出關(guān)系最密切的樣品對(或變量對)(2)把挑出的成對樣品或樣品組(變量或變量組)的值做加權(quán)平均,形成一個(gè)新的樣品(或變量)數(shù)據(jù)(3)把原有兩個(gè)樣品或代表樣品組(變量或代表變量組)的數(shù)據(jù)刪除掉,一般習(xí)慣把新數(shù)據(jù)放在序號小的樣品數(shù)據(jù)上(4)對新形成的樣品(變量)數(shù)據(jù)與剩余樣品(變量)數(shù)據(jù)重新計(jì)算相似性系數(shù),再從中挑出關(guān)系最密切的樣品。重復(fù)(2)(3)(4)步驟,直到把所有樣品(變量)歸類完為止。第六十五頁,共八十八頁,2022年,8月28日第六十六頁,共八十八頁,2022年,8月28日第六十七頁,共八十八頁,2022年,8月28日第六十八頁,共八十八頁,2022年,8月28日第六十九頁,共八十八頁,2022年,8月28日第七十頁,共八十八頁,2022年,8月28日第七十一頁,共八十八頁,2022年,8月28日選擇滲透率、孔隙度、平均孔隙半徑、分選系數(shù)、特征結(jié)構(gòu)參數(shù)、排驅(qū)壓力、飽和度中值壓力7個(gè)參數(shù),儲(chǔ)層分成3類第七十二頁,共八十八頁,2022年,8月28日依據(jù)樣品間歐式距離系數(shù)相似性第七十三頁,共八十八頁,2022年,8月28日第七十四頁,共八十八頁,2022年,8月28日第七十五頁,共八十八頁,2022年,8月28日第七十六頁,共八十八頁,2022年,8月28日第七十七頁,共八十八頁,2022年,8月28日第七十八頁,共八十八頁,2022年,8月28日第七十九頁,共八十八頁,2022年,8月28日YOURSITEHERE第四節(jié)動(dòng)態(tài)聚類法也叫快速聚類法、逐步聚類、迭代聚類quickclustermethod,k-meansmodel樣本量很大,用系統(tǒng)聚類法計(jì)算的工作量極大,作出的樹狀圖也十分復(fù)雜,不便于分析第八十頁,共八十八頁,2022年,8月28日YOURSITEHERE(1)選取若干樣品作為初始凝聚點(diǎn)(給出允許分類的最大個(gè)數(shù)k);(2)計(jì)算各樣品與各凝聚點(diǎn)的距離,并作初始分類;(3)根據(jù)初始分類,計(jì)算各類重心,用重心代替初始凝聚點(diǎn),進(jìn)行第二次分類;(4)重復(fù)(2)步,直至所有樣品都不再調(diào)整,分類達(dá)到穩(wěn)定為止(稱為聚類過程收斂)動(dòng)態(tài)聚類的基本思想首先將樣品粗略地分為若干類,然后在按照某種原則逐步修改直到合理的分類為止。計(jì)算步驟:選凝聚點(diǎn),作初始分類調(diào)整不適合點(diǎn)——修改分類第八十一頁,共八十八頁,2022年,8月28日YOURSITEHERE小結(jié)第八十二頁,共八十八頁,2022年,8月28日YOURSITEHERE與多元分析的其他方法相比,盡管聚類分析較為粗糙,沒有明顯的理論性,但應(yīng)用方面取得了很大成功,確實(shí)是模式識別研究中非常有用的一類技術(shù)。(1)綜合性:Q型聚類分析可以利

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論