![數(shù)據(jù)挖掘考試題目聚類(共3頁)_第1頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/9/5d70f287-b065-4580-99f5-e4c8fb8c041f/5d70f287-b065-4580-99f5-e4c8fb8c041f1.gif)
![數(shù)據(jù)挖掘考試題目聚類(共3頁)_第2頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/9/5d70f287-b065-4580-99f5-e4c8fb8c041f/5d70f287-b065-4580-99f5-e4c8fb8c041f2.gif)
![數(shù)據(jù)挖掘考試題目聚類(共3頁)_第3頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/9/5d70f287-b065-4580-99f5-e4c8fb8c041f/5d70f287-b065-4580-99f5-e4c8fb8c041f3.gif)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)挖掘考試題目聚類一 、填空題1、密度的基于中心的方法使得我們可以將點分類為:_、_ 、_。2、DBSCAN算法在最壞的情況下,時間復(fù)雜度是_、空間復(fù)雜度是_。3、DBSCAN算法的優(yōu)點是_、_。4、DBSCAN算法的缺點是處理_、_的數(shù)據(jù)效果不好。5、DBSCAN算法的參數(shù)有:_、_。6、簇的有效性的非監(jiān)督度量常??梢苑譃閮深悾篲、_,它常采用的指標(biāo)為_。7、簇的有效性的監(jiān)督度量通常稱為_,它度量簇標(biāo)號與外部提供的標(biāo)號的匹配程度主要借助_。8、在相似度矩陣評價的聚類中,如果有明顯分離的簇,則相似度矩陣應(yīng)當(dāng)粗略地是_。9、DBSCAN算法的參數(shù)確定的基本方法是觀察_的特性。10、不引用附加的
2、信息,評估聚類分析結(jié)果對數(shù)據(jù)擬合情況屬于_技術(shù)。答案:1、 核心點 邊界點 噪聲點2、 O(n2) O(n)3、 耐噪聲 能夠處理任意大小和形狀的簇4、 高維數(shù)據(jù) 變密度的5、 EPS MinPts6、 簇的凝聚性 簇的分離性 均方差(SSE)7、 外部指標(biāo) 監(jiān)督指標(biāo)的熵8、 塊對角的9、 點到它的第K個最近鄰的距離(K-距離)10、非監(jiān)督二、選擇題1、DBSCAN算法的過程是(B)。 刪除噪聲點。 每組連通的核心點形成一個簇。 將所有點標(biāo)記為核心點、邊界點和噪聲點。 將每個邊界點指派到一個與之關(guān)聯(lián)的核心點的簇中。 為距離在Eps之內(nèi)的所有核心點之間賦予一條邊。A:B:C:D:2、如果有m個點
3、,DBSCAN在最壞的情況下的時間復(fù)雜度度為(C)。A O(m) B O(mlogm) C O(m2) D O(logm)3、在基本DBSCAN的參數(shù)選擇方法中,點到它的K個最近鄰的距離中的K選作為哪一個參數(shù)(B)。A Eps B MinPts C 質(zhì)心 D 邊界4、當(dāng)采用K-距離的方法選擇DBSCAN的Eps和MinPts參數(shù)時,如果設(shè)置的K的值太大,則小簇(尺寸小于K的簇)可能會被標(biāo)記為(A)。A 噪聲 B 核心簇 C 邊界簇 D以上都不對5、如果處理以下形狀的數(shù)據(jù)時,適宜采用DBSCAN的是(B)A 球形 B SS形 C 橢球形 D 方形6、DBSCAN之所以難以有效處理高維數(shù)據(jù),其主要
4、原因是(D)A 數(shù)據(jù)的形狀太復(fù)雜 B 簇的大小未知 C 噪聲點過多 D 開銷過大7、簇評估能夠做到(D)確定數(shù)據(jù)集的聚類趨勢。確定正確的簇個數(shù)。比較兩個簇集,確定那個更好。不引用附加信息,評估聚類分析結(jié)果對數(shù)據(jù)擬合情況A B C D8、如果不考慮外部信息,聚類結(jié)構(gòu)的有良性度量應(yīng)當(dāng)采用(A)。A 均方差 B 方差 C 中位數(shù) D 均值9、比較不同的聚類或簇時,通常采用相對的簇評估度量,相對的簇評估以()來評價不同的聚類或簇。A SSE或熵 B 簇的大小 C 簇的形狀 D 簇的密度10、對于DBSCAN,參數(shù)Eps固定,當(dāng)MinPts取值較大時,會導(dǎo)致(B)A 能很好的區(qū)分各類簇B 只有高密度的點
5、的聚集區(qū)劃為簇,其余劃為噪聲C 低密度的點的聚集區(qū)劃為簇,其余的劃為噪聲D 無影響三、判斷題1、DBSCAN的參數(shù)Eps固定時,MinPts的值越大越好。(錯)2、DBSCAN會把所有點劃分到各自的簇中。(錯)3、在所有核心點的Eps半徑鄰域內(nèi)的點數(shù)都不少于MinPts閾值。(對)4、SSE在無監(jiān)督的簇評估中能起到很好的作用。(對)5、在通過相似度矩陣評估簇時,如果相似度矩陣是塊對角的,說明具有明顯分離的簇(對)。6、DBSCAN能夠很好的區(qū)分原始數(shù)據(jù)的形狀,但受限于用戶指定的參數(shù)。(對)7、判斷簇的個數(shù)不屬于簇評估。(錯)8、在做聚類時,DBSCAN會刪掉它認(rèn)為是噪聲點的數(shù)據(jù)點。(對)9、D
6、BSCAN的空間復(fù)雜度始終都是O(m)。(對)10、K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會合并有重疊的簇。(對)四、簡答題1、描述DBSCAN的算法過程。將所有點標(biāo)記為核心點、邊界點和噪聲點。刪除噪聲點。為距離在Eps之內(nèi)的所有核心點之間賦予一條邊。每組連通的核心點形成一個簇。將每個邊界點指派到一個與之關(guān)聯(lián)的核心點的簇中。2、簡答DBSCAN的優(yōu)點與不足。答,優(yōu)點:DBSCAN是相對抗噪聲的,并且能夠處理任意形狀和大小的簇,缺點:當(dāng)簇的密度變化過大時,DBSCAN就很難敏感的發(fā)現(xiàn)數(shù)據(jù)集中的簇。同時, DBSCAN在處理高維數(shù)據(jù)時,會有很大的開銷。3、簡述DBSCAN算法的核心思想。DBSCAN算法的核心思想是一個簇中除了邊界點,每個點在給定的半徑Eps內(nèi)必須包含不少于PinPts個數(shù)據(jù)點,這樣的點稱為核心點。4、確定DBSCAN參數(shù)的基本的方法是什么。答:觀察點到它的K個最近鄰的距離的特性。對于某個K,計算所有點的K距離,以遞增的次序排序,繪制排序后的值。在圖中找到曲線拐點,拐點處的函
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 環(huán)境設(shè)計的藝術(shù)性與審美培養(yǎng)探討
- 生產(chǎn)線作業(yè)計劃與實時調(diào)度分析
- 班級紀(jì)律執(zhí)行與校園文化建設(shè)的互動關(guān)系
- 生態(tài)城市規(guī)劃中的綠色交通系統(tǒng)建設(shè)
- 現(xiàn)代辦公中的網(wǎng)絡(luò)教育平臺應(yīng)用
- Unit 6 My family(說課稿)-2024-2025學(xué)年滬教版(五四制)(2024)英語一年級上冊
- 2024年二年級品生下冊《大自然的奧秘》說課稿 冀教版001
- 2024-2025學(xué)年高中歷史 專題一 古代中國經(jīng)濟(jì)的基本結(jié)構(gòu)與特點 1.3 古代中國的商業(yè)經(jīng)濟(jì)說課稿 人民版必修2
- 10的認(rèn)識和加減法(說課稿)-2024-2025學(xué)年一年級上冊數(shù)學(xué)人教版(2024)001
- 14《圓明園的毀滅》第二課時(說課稿)2024-2025學(xué)年語文五年級上冊統(tǒng)編版
- 中國人口研究專題報告-中國2025-2100年人口預(yù)測與政策建議-西南財經(jīng)大學(xué)x清華大學(xué)-202501
- 2025年度廚師職業(yè)培訓(xùn)學(xué)院合作辦學(xué)合同4篇
- 《組織行為學(xué)》第1章-組織行為學(xué)概述
- 25版六年級寒假特色作業(yè)
- 浙江省杭州市9+1高中聯(lián)盟2025屆高三一診考試英語試卷含解析
- 市場營銷試題(含參考答案)
- 2024年山東省泰安市高考物理一模試卷(含詳細(xì)答案解析)
- 護(hù)理指南手術(shù)器械臺擺放
- GB/T 19228.1-2024不銹鋼卡壓式管件組件第1部分:卡壓式管件
- 2024年計算機(jī)二級WPS考試題庫380題(含答案)
- (高清版)DZT 0399-2022 礦山資源儲量管理規(guī)范
評論
0/150
提交評論