![大學(xué)數(shù)據(jù)挖掘期末考試題_第1頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-6/7/523a751c-4b89-47f8-8ef4-1afabaffd584/523a751c-4b89-47f8-8ef4-1afabaffd5841.gif)
![大學(xué)數(shù)據(jù)挖掘期末考試題_第2頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-6/7/523a751c-4b89-47f8-8ef4-1afabaffd584/523a751c-4b89-47f8-8ef4-1afabaffd5842.gif)
![大學(xué)數(shù)據(jù)挖掘期末考試題_第3頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-6/7/523a751c-4b89-47f8-8ef4-1afabaffd584/523a751c-4b89-47f8-8ef4-1afabaffd5843.gif)
![大學(xué)數(shù)據(jù)挖掘期末考試題_第4頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-6/7/523a751c-4b89-47f8-8ef4-1afabaffd584/523a751c-4b89-47f8-8ef4-1afabaffd5844.gif)
![大學(xué)數(shù)據(jù)挖掘期末考試題_第5頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-6/7/523a751c-4b89-47f8-8ef4-1afabaffd584/523a751c-4b89-47f8-8ef4-1afabaffd5845.gif)
下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、、判斷題(每題1分,10分)號(hào)學(xué) Z:名姓班業(yè)專數(shù)據(jù)挖掘試卷課程代碼:C0204413 課程: 數(shù)據(jù)挖掘A卷院學(xué)院學(xué)學(xué)科息信與學(xué)數(shù)題目-一-二二三四五六七八九十總成績(jī)復(fù)核得分閱卷教師1. 從點(diǎn)作為個(gè)體簇開始,每一步合并兩個(gè)最接近的簇,這是一種分裂的層次聚類方法。()2. 數(shù)據(jù)挖掘的目標(biāo)不在于數(shù)據(jù)采集策略,而在于對(duì)已經(jīng)存在的數(shù)據(jù)進(jìn)行模式的發(fā)掘。()3. 在聚類分析當(dāng)中,簇內(nèi)的相似性越大,簇間的差別越大,聚類的效果就越差。()4. 當(dāng)兩個(gè)點(diǎn)之間的鄰近度取它們之間距離的平方時(shí),Ward方法與組平均非常相似。()5. DBSCAN是相對(duì)抗噪聲的,并且能夠處理任意形狀和大小的簇。()6. 屬性的性質(zhì)不必
2、與用來(lái)度量他的值的性質(zhì)相同。()7. 全鏈對(duì)噪聲點(diǎn)和離群點(diǎn)很敏感。()8. 對(duì)于非對(duì)稱的屬性,只有非零值才是重要的。()9. K均值可以很好的處理不同密度的數(shù)據(jù)。()10. 單鏈技術(shù)擅長(zhǎng)處理橢圓形狀的簇。()二、選擇題(每題2分,30分)1. 當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離?()A.分類B.聚類C.關(guān)聯(lián)分析D.主成分分析2. ()將兩個(gè)簇的鄰近度定義為不同簇的所有點(diǎn)對(duì)鄰近度的平均值,它是一種凝聚層次聚類技術(shù)。A.MIN(單鏈)B.MAX(全鏈) C.組平均 D.Ward方法3. 數(shù)據(jù)挖掘的經(jīng)典案例“啤酒與尿布試驗(yàn)”最主要是應(yīng)用了()數(shù)據(jù)挖掘
3、方法。A分類B預(yù)測(cè)C關(guān)聯(lián)規(guī)則分析D聚類4關(guān)于K均值和DBSCAN的比較,以下說(shuō)法不正確的是 ()A. K均值丟棄被它識(shí)別為噪聲的對(duì)象,而DBSCAN 一般聚類所有對(duì)象。B. K均值使用簇的基于原型的概念,DBSCAN使用基于密度的概念。C. K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同形狀的簇D. K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會(huì)合并有重疊的簇5.下列關(guān)于 Ward Method說(shuō)法錯(cuò)誤的是:()第-4 -頁(yè)共4頁(yè)TID項(xiàng)集1面包,牛奶2面包,尿布,啤酒,雞蛋 3牛奶,尿布,啤酒,可樂4面包,牛奶,尿布,啤酒 5面包,牛奶
4、,尿布,可樂C.0.4,0.67D.0.67,0.4A.在 和1,2合并 B.3和4,5合并 C.2,3和4,5合并 D. 2,3和4,5形成簇和3合并11. 將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個(gè)步驟的任務(wù)?()A.頻繁模式挖掘B.分類和預(yù)測(cè)C.數(shù)據(jù)預(yù)處理D.數(shù)據(jù)流挖掘12. 決策樹中不包含一下哪種結(jié)點(diǎn)()A,根結(jié)點(diǎn)(root node) B,內(nèi)部結(jié)點(diǎn)(internal node)C,外部結(jié)點(diǎn)(external node) D,葉結(jié)點(diǎn)(leaf node)13. 建立一個(gè)模型,通過(guò)這個(gè)模型根據(jù)已知的變量值來(lái)預(yù)測(cè)其他某個(gè)變量值屬于數(shù)據(jù)挖掘的哪一類任務(wù)?()C.預(yù)測(cè)建模D.尋找
5、模式和規(guī)則B、分類和聚類都是無(wú)指導(dǎo)的學(xué)習(xí)D、分類是無(wú)指導(dǎo)的學(xué)習(xí),聚類是有指導(dǎo)的學(xué)習(xí))ID購(gòu)買項(xiàng)1牛奶,啤酒,尿布2面包,黃油,牛奶3牛奶,尿布,餅干4面包,黃油,餅干5啤酒,餅干,尿布6牛奶,尿布,面包,黃油7面包,黃油,尿布8啤酒,尿布9牛奶,尿布,面包,黃油10啤酒,餅干15.下面購(gòu)物籃能夠提取的3-項(xiàng)集的最大數(shù)量是多少A.1B.2C.3D 4A. 對(duì)噪聲點(diǎn)和離群點(diǎn)敏感度比較小B. 擅長(zhǎng)處理球狀的簇C對(duì)于Ward方法,兩個(gè)簇的鄰近度定義為兩個(gè)簇合并時(shí)導(dǎo)致的平方誤差D.當(dāng)兩個(gè)點(diǎn)之間的鄰近度取它們之間距離的平方時(shí),Ward方法與組平均非常相似6下列關(guān)于層次聚類存在的問(wèn)題說(shuō)法正確的是:()A.
6、具有全局優(yōu)化目標(biāo)函數(shù)B. Group Average擅長(zhǎng)處理球狀的簇C. 可以處理不同大小簇的能力D. Max對(duì)噪聲點(diǎn)和離群點(diǎn)很敏感7. 下列關(guān)于凝聚層次聚類的說(shuō)法中,說(shuō)法錯(cuò)誤的事:()A. 一旦兩個(gè)簇合并,該操作就不能撤銷B. 算法的終止條件是僅剩下一個(gè)簇C. 空間復(fù)雜度為0 m2D. 具有全局優(yōu)化目標(biāo)函數(shù)8. 規(guī)則牛奶,尿布 t 啤酒的支持度和置信度分別為:()A.0.4,0.4B.0.67,0.679. 下列()是屬于分裂層次聚類的方法。A.Mi nB.MaxC.Group AverageD.MST10. 對(duì)下圖數(shù)據(jù)進(jìn)行凝聚聚類操作,簇間相似度使用MAX計(jì)算,第二步是哪兩個(gè)簇合并:()1
7、1I2I3I4I511too0,900.100.650.20I20.901.000.700.600.50I30.100701.000.400.30I40.650.600.401.000.80I50.200.500300.80tooA.根據(jù)內(nèi)容檢索 B.建模描述14.下列哪個(gè)描述是正確的?()A、分類和聚類都是有指導(dǎo)的學(xué)習(xí)C、分類是有指導(dǎo)的學(xué)習(xí),聚類是無(wú)指導(dǎo)的學(xué)習(xí)三、簡(jiǎn)答題(每題8分,40分)i.何謂數(shù)據(jù)挖掘?它有哪些方面的功能?5.簡(jiǎn)述ID3算法的基本思想及其主算法的基本步驟2.簡(jiǎn)述數(shù)據(jù)預(yù)處理方法和內(nèi)容。3何謂聚類?它與分類有什么異同?四、算法題(每題10分,20分)1.由下圖已給出的距離矩陣,將 Max用于6個(gè)點(diǎn)樣本數(shù)據(jù)集,畫出層次聚類的樹狀圖?P1P2P3P4P5P6P1:0.000.240.220.370.34 :0.23P20.240.000.140.200.130.25P3r 0.220.140.000.150.28 10.11P40.370.200.150.000.290.22P5:0.340.130.280.290.00 :0.39P60.230.250.110.220.390.004.什么是決策樹?如何用決策樹進(jìn)行分類?2.假設(shè)數(shù)據(jù)挖掘的任務(wù)是將如下的 8個(gè)點(diǎn)(用 (x,y)代表位置)聚類為3個(gè)類:X1(2,10)、X2(2,5)、X3(
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 云南旅游職業(yè)學(xué)院《大數(shù)據(jù)理論與應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 蘇州高博軟件技術(shù)職業(yè)學(xué)院《經(jīng)貿(mào)數(shù)據(jù)搜集與處理》2023-2024學(xué)年第二學(xué)期期末試卷
- 山西電力職業(yè)技術(shù)學(xué)院《信號(hào)與系統(tǒng)A》2023-2024學(xué)年第二學(xué)期期末試卷
- 集美大學(xué)誠(chéng)毅學(xué)院《廣告創(chuàng)意》2023-2024學(xué)年第二學(xué)期期末試卷
- 東北大學(xué)《操作系統(tǒng)B》2023-2024學(xué)年第二學(xué)期期末試卷
- 重慶海聯(lián)職業(yè)技術(shù)學(xué)院《電子系統(tǒng)課程設(shè)計(jì)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年液晶聚合物L(fēng)CP合作協(xié)議書
- 溫州浙江溫州泰順縣面向2025年醫(yī)學(xué)類普通高等院校應(yīng)屆畢業(yè)生提前招聘筆試歷年參考題庫(kù)附帶答案詳解
- 電火鍋電蒸鍋市場(chǎng)前景預(yù)測(cè)
- 湖北大學(xué)知行學(xué)院《web應(yīng)用開發(fā)基礎(chǔ)課程設(shè)計(jì)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2015-2022年湖南高速鐵路職業(yè)技術(shù)學(xué)院高職單招語(yǔ)文/數(shù)學(xué)/英語(yǔ)筆試參考題庫(kù)含答案解析
- 2023年菏澤醫(yī)學(xué)??茖W(xué)校單招綜合素質(zhì)模擬試題及答案解析
- 鋁合金門窗設(shè)計(jì)說(shuō)明
- 常見食物的嘌呤含量表匯總
- 小學(xué)數(shù)學(xué)-三角形面積計(jì)算公式的推導(dǎo)教學(xué)設(shè)計(jì)學(xué)情分析教材分析課后反思
- 人教版數(shù)學(xué)八年級(jí)下冊(cè)同步練習(xí)(含答案)
- SB/T 10752-2012馬鈴薯雪花全粉
- 2023年湖南高速鐵路職業(yè)技術(shù)學(xué)院高職單招(英語(yǔ))試題庫(kù)含答案解析
- 秦暉社會(huì)主義思想史課件
- 積累運(yùn)用表示動(dòng)作的詞語(yǔ)課件
- 機(jī)動(dòng)車登記證書英文證書模板
評(píng)論
0/150
提交評(píng)論