版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、機器學(xué)習(xí)聚類匯報人:楊光1. 1. 聚類任務(wù)聚類任務(wù)有一天老板給你一堆數(shù)據(jù),然后他說,你給我分類(聚類)出來21. 1. 聚類任務(wù)聚類任務(wù)聚類算法是一種無監(jiān)督學(xué)習(xí),我們區(qū)分監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的方法是看IN數(shù)據(jù)有無標(biāo)簽(Label)。31. 1. 聚類任務(wù)聚類任務(wù)4 在實際工作中,我們需要處理很多數(shù)據(jù),標(biāo)簽獲取需要極大的人工工作量。1. 1.聚類任務(wù)聚類任務(wù)引言聚類算法會將數(shù)據(jù)集中的樣本劃分成為若干個通常不相交的子集,每一個子集我們稱之為“簇”。在聚類過程自動形成簇結(jié)構(gòu)后,我們會發(fā)現(xiàn)每個簇里會存在一些潛在的概念,比如“黃種人”、“白種人”,“女性”、“男性”,這些是我們事先未知的,這些概念也是
2、由使用者來把握和命名的。51. 1.聚類任務(wù)聚類任務(wù)引言62. 2.性能度量性能度量引言目標(biāo):目標(biāo):盡量使聚類結(jié)果的“簇內(nèi)相似度高” 且“簇間相似度低”兩類指標(biāo):兩類指標(biāo):7外部指標(biāo):與某個“參考模型”比較內(nèi)部指標(biāo):直接考察聚類結(jié)果(不利用參考模型)2. 2.性能度量性能度量引言外部指標(biāo):外部指標(biāo): 82. 2.性能度量性能度量引言92. 2.性能度量性能度量引言10內(nèi)部指標(biāo):內(nèi)部指標(biāo): 2. 2.性能度量性能度量引言113. 3.距離計算距離計算引言距離度量dist(.,.)需要滿足一些性質(zhì):12非負(fù)性: dist( xi, xj)0同一性: dist( xi, xj)=0當(dāng)且僅當(dāng)xi=xj
3、對稱性: dist( xi, xj)= dist( xj, xi)直遞性: dist( xi, xj) dist( xi, xk)+dist( xk, xj)3. 3.距離計算距離計算引言閔可夫斯基距離:閔可夫斯基距離:當(dāng)給定樣本我們最常用的是“閔可夫斯基距離” p1時,“閔可夫斯基距離”公式滿足上述4個性質(zhì)。p=1時,“閔可夫斯基距離”即“曼哈頓距離”。p=2時,“閔可夫斯基距離”即“歐氏距離”。133. 3.距離計算距離計算引言有序?qū)傩裕?,2,3閔可夫斯基距離無序?qū)傩裕猴w機,火車,輪船 VDM143. 3.距離計算距離計算引言153. 3.距離計算距離計算引言164.4.原型聚類原型聚類
4、 k-meansk-means引言174.4.原型聚類原型聚類 k-meansk-means引言184.4.原型聚類原型聚類 k-meansk-means引言194.4.原型聚類原型聚類 k-meansk-means引言204.4.原型聚類原型聚類 LVQLVQ引言214.4.原型聚類原型聚類 LVQLVQ引言224.4.原型聚類原型聚類 LVQLVQ引言234.4.原型聚類原型聚類 LVQLVQ引言244.4.原型聚類原型聚類 LVQLVQ引言255. 5.密度聚類密度聚類引言265. 5.密度聚類密度聚類引言275. 5.密度聚類密度聚類引言285. 5.密度聚類密度聚類引言295. 5.密度聚類密度聚類引言305. 5.密度聚類密度聚類引言316. 6.層次聚類層次聚類引言32給定聚類簇Ci,Cj,可以通過下面的式子來計算距離:6. 6.層次聚類層次聚類引言336. 6.層次聚類層次聚類引言34以西瓜數(shù)據(jù)集4.0為例,令A(yù)GNES算法一直執(zhí)行到所有樣本出現(xiàn)在同一個簇中,即k=1,可以得到下面這個樹狀圖9.126. 6.層次聚
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于2025年度戰(zhàn)略規(guī)劃的市場開發(fā)合同2篇
- 股權(quán)轉(zhuǎn)讓與品牌授權(quán)2025年度協(xié)議(含品牌使用權(quán)和許可)2篇
- 2025年度茅臺酒定制酒生產(chǎn)及銷售合同3篇
- 2025年度鋁合金復(fù)合材料研發(fā)與應(yīng)用合同范本4篇
- 2025版冷鏈物流公司間資源共享合作協(xié)議3篇
- 2025年度高端商務(wù)酒店智能化升級改造工程合同3篇
- 2025年度消防車輛維修保養(yǎng)及消防器材供應(yīng)合同4篇
- 正德職業(yè)技術(shù)學(xué)院《園林植物栽培學(xué)實踐(一)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年度高端珠寶定制買賣合同范本4篇
- 2025版住宅小區(qū)快遞柜場地租賃及快遞配送服務(wù)協(xié)議3篇
- 山東鐵投集團招聘筆試沖刺題2025
- 真需求-打開商業(yè)世界的萬能鑰匙
- 2025年天津市政集團公司招聘筆試參考題庫含答案解析
- GB/T 44953-2024雷電災(zāi)害調(diào)查技術(shù)規(guī)范
- 2024-2025學(xué)年度第一學(xué)期三年級語文寒假作業(yè)第三天
- 心律失常介入治療
- 6S精益實戰(zhàn)手冊
- 展會場館保潔管理服務(wù)方案
- 監(jiān)理從業(yè)水平培訓(xùn)課件
- 廣東省惠州市實驗中學(xué)2025屆物理高二第一學(xué)期期末綜合測試試題含解析
- 搞笑朗誦我愛上班臺詞
評論
0/150
提交評論