下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)挖掘計(jì)算題參考答案數(shù)據(jù)倉庫與數(shù)據(jù)挖掘復(fù)習(xí)題1. 假設(shè)數(shù)據(jù)挖掘的任務(wù)是將如下的8個(gè)點(diǎn)(用(x,y)代表位置)聚類為3個(gè)類:X1(2,10)、X2(2,5)、X3(8,4)、X4(5,8)、X5(7,5)、X6(6,4)、X7(1,2)、X8(4,9),距離選擇歐幾里德距離。假設(shè)初始選擇X1(2,10)、X4(5,8)、X7(1,2)為每個(gè)聚類的中心,請(qǐng)用 K_means算法來計(jì)算:(1)在第一次循環(huán)執(zhí)行后的3個(gè)聚類中心;答:第一次迭代:中心點(diǎn)1:X1(2,10),2:X4(5,8),X7(1,2)X1X2X3X4X5X6X7X8102536+369+425+2516+361+644+129+
2、49+99+1604+91+1616+361+131+641+95316+364529058答案:在第一次循環(huán)執(zhí)行后的3個(gè)聚類中心:1:X1(2,10) 2:X3,X4,X5,X6,X8 (6,6)3:X2,X7 (1.5,3.5)(2)經(jīng)過兩次循環(huán)后,最后的3個(gè)族分別是什么?第二次迭代:dX1X2X3X4X5X6X7X8102536+369+425+2516+361+644+1232178524411+135+6.55+1.56.5+0.53.5+4.55.5+1.54.5+0.50.5+1.52.5+5.5答案:1:X1,X8 (3.5,9.5) 2:X3,X4,X5,X6 (6.5,5.
3、25) 3:X2,X7 (1.5,3.5)2. 數(shù)據(jù)庫有4個(gè)事務(wù)。設(shè)min_sup=60%,min_conf=80%。TIDdataTransactionT1006/6/2007K,A,D,BT2006/6/2007D,A,C,E,BT3006/7/2007C,A,B,ET4006/10/2007B,A,Da. 使用Apriori算法找出頻繁項(xiàng)集,并寫出具體過程。答:(a) Apriori算法: K 1 A 4 A,B 4 A,B,D 3 A 4 B 4 A,D 3 B 4 D 3 B,D 3D 3 C 2 E 2 頻繁項(xiàng)集為3項(xiàng)集A,B,D:3 b.列出所有的強(qiáng)關(guān)聯(lián)規(guī)則,使它們與下面的元規(guī)則
4、匹配,其中,X是代表顧客的變量,是表示項(xiàng)的變量(例如,“A”、“B”等): s,c答:所有頻繁子項(xiàng)集有A,B,D,A,B,A,D,B,D AB=D conf=3/4=75% AD=B conf=3/3=100% BD=A conf=3/3=100% 因此,滿足條件的強(qiáng)關(guān)聯(lián)規(guī)則有: AD=Bsupp=75%,conf=100% BD=Asupp=75%,conf=100% 1.給定如下的數(shù)據(jù)庫表:IDSkyAirTempHumidityWindWaterForecastEnjoysport1SunnyWarmNormalStrongWarmSameYes2SunnyWarmHighStrongW
5、armSameYes3RainyColdHighStrongWarmChangeNo4SunnyWarmHighStrongCoolChangeyes請(qǐng)計(jì)算屬性Sky的信息增益。答:C1 :Enjoysport=yes=3C2 :Enjoysport=no=1I(yes,no)=-3/4log2 3/4-1/4log2 1/4=0.811skyC1C2rainy01sunny30I(sky)=1/4I(0,1)+3/4I(3,0)=0Gain(sky)=0.811習(xí)題:1. 以汽車保險(xiǎn)為例:假定訓(xùn)練數(shù)據(jù)庫具有兩個(gè)屬性:年齡和汽車類型。年齡序數(shù)屬性汽車類型分類屬性類L:低(風(fēng)險(xiǎn)) ,H:高(風(fēng)險(xiǎn)
6、)年齡汽車類型類21MarutiL21HyundaiH21MarutiH21MarutiL21HyundaiH使用ID3算法得到一個(gè)決策樹。2. 下面是一個(gè)超市某商品連續(xù)24個(gè)月的銷售數(shù)據(jù)(單位:百萬元):21,16,21, 19, 24, 27, 23, 22, 21, 20, 17, 16, 20, 23, 22, 18, 24, 26, 25, 20, 26, 23, 21, 15, 17。請(qǐng)使用等深、等寬和自定義區(qū)間的方法對(duì)數(shù)據(jù)進(jìn)行分箱,做出利用各種分箱方法得到的直方圖。3. 數(shù)據(jù)庫有4 個(gè)事務(wù)。設(shè)min_sup = 60%,min_conf = 80%。使用Apriori 算法找出所有的頻繁項(xiàng)集,并針對(duì)每個(gè)頻繁項(xiàng)集構(gòu)造強(qiáng)關(guān)聯(lián)規(guī)則,列出每個(gè)規(guī)則的支持度和置信度。答:(b) Apriori算法: K 1 A 4 A,B 4 A,B,D 3 A 4 B 4 A,D 3 B 4 D 3 B,D 3D 3 C 2 E 2 頻繁項(xiàng)集為3項(xiàng)集A,B,D:3 所有頻繁子項(xiàng)集有A,B,D,A,B,A,D,B,D AB=D conf=3/4=75% AD=B co
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 豪華大廈租賃合同三篇
- 五彩繽紛的成長路幼兒園工作總結(jié)
- 電競行業(yè)服務(wù)員工作總結(jié)
- 表達(dá)能力培養(yǎng)方案計(jì)劃
- 學(xué)會(huì)如何有效地分配學(xué)習(xí)時(shí)間
- 二零二五年度海洋資源項(xiàng)目融資合作協(xié)議書3篇
- 金融行業(yè)顧問工作總結(jié)
- 紡織行業(yè)安全隱患排查
- 二零二五年度個(gè)人抵押貸款風(fēng)險(xiǎn)評(píng)估合同
- 二零二五個(gè)人分紅協(xié)議范本適用于互聯(lián)網(wǎng)平臺(tái)分紅合作2篇
- 現(xiàn)代科學(xué)技術(shù)概論智慧樹知到期末考試答案章節(jié)答案2024年成都師范學(xué)院
- 軟件模塊化設(shè)計(jì)與開發(fā)標(biāo)準(zhǔn)與規(guī)范
- 網(wǎng)絡(luò)安全基礎(chǔ)知識(shí)入門教程
- AI智慧物流園區(qū)整體建設(shè)方案
- 2024年遼寧鐵道職業(yè)技術(shù)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 無痛人工流產(chǎn)術(shù)課件
- 有機(jī)農(nóng)業(yè)種植模式
- 勞務(wù)派遣招標(biāo)文件
- 法醫(yī)病理學(xué)課件
- 介紹uppc技術(shù)特點(diǎn)
- 采空區(qū)穩(wěn)定性可靠度分析
評(píng)論
0/150
提交評(píng)論