版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 聚類分析之 -譜系聚類法1類間距離及其遞推公式譜系聚類法的應用分析譜系聚類法的步驟譜系聚類2引言 譜系聚類法也稱為系統聚類法,是目前應用較為廣泛的一種聚類方法,它根據植物分類學的思想對研究對象進行分類。 在植物分類學中,分類的單位是:門、綱、目、科、屬、種,其中種是分類的基本單位。分類單位越小,它所包含的植物就越少,植物間的共同特征就越多。譜系聚類3 利用這種分類思想,譜系聚類法首先視各樣品自成一類,然后把最相似的樣品聚為小類,再將已聚合的小類按其相似性再聚合,隨著相似性的減弱,最后將一切子類都聚合成一個大類,從而得到一個按相近性大小聚結起來的譜系圖,再進一步根據實際情況確定合適的分類個數。
2、譜系聚類4問題判斷兩個樣品最相似的依據是什么?譜系聚類5類間距離及其遞推公式 常用的類間距離有四種: 最短距離 最長距離 類平均距離 重心距離類間距離譜系聚類6 以 分別表示樣品 ,以 簡記 與 的距離 ,設 分別表示兩個類,它們分別含有 個樣品.我們用 來表示類 與 之間的距離.最短距離 即用兩類中樣品之間距離最短者作為兩類間的距離.譜系聚類7最長距離 即用兩類中樣品之間距離最長者作為這兩類間的距離.類平均距離 即用兩類中所有兩兩樣品之間的距離的平均作為兩類之間的距離.或者 即用兩類中所有兩兩樣品之間的平方距離的平均作為兩類間的平方距離.譜系聚類8重心距離設類 中的樣品為 , , ,則其均值
3、稱為類 的重心. 其中, , 分別是 的重心 ,即用兩類的重心之間的距離作為兩類間的距離.譜系聚類9 按照譜系聚類的思想,先將樣品聚合成小類,再逐步聚為大類.設類 由類 合并所得,則 包含 個樣品. 為了更方便地實現譜系聚類,我們需要建立類間距離的遞推公式,即計算類 與其他類 之間的距離. 類間距離的遞推公式譜系聚類10常用的四種類間距離的遞推公式最短距離最長距離譜系聚類11類平均距離對于類平均距離的下列定義方式 同理可得遞推公式如下: 譜系聚類12重心距離由 的合并集 的重心是 而 由 , 有 譜系聚類13 若采用歐氏距離的距離,以上介紹的4種類間距離的遞推公式可統一表示為 計算樣品之間 譜
4、系聚類14各種類間距離的參數如下表所示譜系聚類15譜系聚類法的步驟(1) n個樣品開始時作為n個類,計算兩兩之間的距離, 構成一個對稱距離矩陣 此時, 譜系聚類16 (2) 選擇 中主對角線以下(或以上)的最小距離,設這個元素是 ,這時 ,首先將 合并為一個新類 .在 中消去 , 所對應的行與列,并加入由新類 與剩下的其他未聚合的類間的距離所組成的一行和一列,得到一個更新的距離矩陣 ,它是 階方陣. (3) 從 出發(fā)重復步驟(2)的做法得 ,再由 出發(fā)重復上述步驟,直到 個樣品聚為一個大類為止. (4)在合并過程中要記下合并樣品的編號及兩類合并時的距離(稱為距離水平),并繪制聚類譜系圖. 譜系
5、聚類17譜系聚類法的應用分析 核電企業(yè)對自身庫存的優(yōu)化管理 倉庫內存貨位置擺放的合適與否會直接影響到總搬運費用、大修工作效率以及倉庫人員的工作積極性。因此將備品備件正確地分類存放是非常重要的。 應用譜系聚類法中的最短距離法對核電企業(yè)的備品備件進行分類, 然后根據分類的結果對這些類之間的關系做總結歸納。譜系聚類18譜系聚類法的應用分析 將備品備件大致分為以下幾類:機械類: 緊固件、密封、軸承、過濾器、壓縮機、管道、 熱交換器等;電氣類: 熔斷器、斷路器、變壓器、電氣元件、電機、電纜等;儀表類: 電子元件、電路板、電源、工業(yè)計算機及備件、各種測量儀等;五金類: 金屬材料等;其他類: 焊接材料、潤滑
6、油、安全防護、消防器材等。譜系聚類19譜系聚類法的應用分析 為了便于說明, 列舉了部分變量指標, 對這五類備品備件的各項變量打分如下表( 滿分10 分) : 譜系聚類20譜系聚類法的應用分析 然后利用歐式距離公式,根據表內的打分計算各類之間的相互距離, 得到矩陣如下:譜系聚類21譜系聚類法的應用分析 由上述矩陣知, G4與G5之間距離最短, 所以組成一個新類G6。然后再用G6 與其他類再次比較,即用G6 里面的子類G4 與G5 分別與其他類的歐氏距離進行比較, 選擇其中距離小的為兩類之間的距離。故得到新矩陣如下:譜系聚類22譜系聚類法的應用分析 此時, G3 與G6 之間的距離最短, 所以G3
7、、G4 和G5 共同組成一個新類G7, 同上述步驟一樣, 得出新的矩陣如下:譜系聚類23譜系聚類法的應用分析 同理, G2 與G7 組成一個新類G8, G8 與G1 的歐氏距離為: 綜上所述, 我們在距離為11 的水平上首先合并五金類和其他類, 得到新類G6=G4, G5; 然后, 更新距離矩陣后又在距離為12 的水平上合并G3 與G6 得到新類G7=G3, G4, G5; 在距離為13 的水平上合并G2 與G7 為新類G8; 最后在距離為41 的水平上將G1 與G8 合并成一個大類。 譜系聚類24譜系聚類法的應用分析 將上述聚類過程連同合并時的水平用圖表示出來, 可以畫出譜系圖如下:譜系聚類25譜系聚類法的應用分析 由此可見, 這五類歸納為兩類比較合適, 即電氣類、儀表類、五金類和其他類為一類, 機械類自成一類。 把聚類結果按照現實中的具體情況再加
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年全球及中國常壓灌裝機行業(yè)供需狀況及前景趨勢預測報告
- 2024-2030年全球及中國半自動尿液化學分析儀行業(yè)需求前景及發(fā)展趨勢預測報告
- 2024-2030年全球及中國丙烯酸壓鑄板行業(yè)產銷需求及發(fā)展趨勢預測報告
- 幼兒園國際主題課程設計
- 2024-2030年依普利搬遷改造項目可行性研究報告
- 2024-2030年中國高頻焊管行業(yè)發(fā)展方向及投資策略分析報告
- 板栗開口刀課程設計
- 國風服飾課程設計思路
- 彎墊板沖壓模具課程設計
- 2024年社會服務合作合同
- 生物中考答題卡模板
- 宴會管家管理手冊
- 通信管道設計說明
- 口腔科診療常規(guī)(正文)
- 墜積性肺炎的護理體會論文
- 農村土地流轉審查備案表(雙方自愿達成協議)(共2頁)
- 小學英語社團教案(共19頁)
- 工作文檔有關于恐龍的資料以及有關于圖片的資料
- 0-15V直流穩(wěn)壓電源設計
- 《電力建設工程施工技術管理導則》
- 某高速公路路面改建工程施工監(jiān)理投標文件報價表
評論
0/150
提交評論