下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、數(shù)據(jù)挖掘考試題目一一關(guān)聯(lián)分析、10個選擇1 .以下屬于關(guān)聯(lián)分析的是()A. CPU生能預(yù)測C.自動判斷鶯尾花類別B.購物籃分析D.股票趨勢建模2.維克托?邁爾-舍恩伯格在大數(shù)據(jù)時代:生活、工作與思維的大變革一書中,持續(xù)強調(diào) 了一個觀點:大數(shù)據(jù)時代的到來,使我們無法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奧妙,與此同時,我們更應(yīng)該注重數(shù)據(jù)中的相關(guān)關(guān)系,而不是因果關(guān)系。其中,數(shù)據(jù)之間的相關(guān)關(guān)系可以通過以下哪個算法直接挖掘()A. K-meansC. C4.5B. Bayes NetworkD. Apriori3.置信度(confidence)是衡量興趣度度量()的指標(biāo)。A.簡潔性C.實用性B.確定性D.新穎性4.Ap
2、riori算法的加速過程依賴于以下哪個策略()A.抽樣C.緩沖B.剪枝D.并行5.以下哪個會降低Apriori算法的挖掘效率()A.支持度閾值增大C.事務(wù)數(shù)減少6 .Apriori算法使用到以下哪些東東(A.格結(jié)構(gòu)、后向無外圖C.格結(jié)構(gòu)、哈希樹7 .非頻繁模式()A.其置信度小于閾值C.包含負模式和負相關(guān)模式B.項數(shù)減少D.減小硬盤讀寫速率)B.二叉樹、哈希樹D.多叉樹、有向無環(huán)圖B.令人不感興趣D.對異常數(shù)據(jù)項敏感8.對頻繁項集、頻繁閉項集、極大頻繁項集的關(guān)系描述正確的是()注:分別以1、2、3代表之A. 3可以還原出無損的1C. 3與2是完全等價的B. 2可以還原出無損的1D. 2與1是完
3、全等價的9.Hash tree 在Apriori算法中所起的作用是()A.存儲數(shù)據(jù)C.加速查找10.以卜小屬十?dāng)?shù)據(jù)挖掘軟件的是(A. SPSS ModelerC. Apache SparkB.查找D.剪枝)B. WekaD. Knime二、10個填空1 .關(guān)聯(lián)分析中表示關(guān)聯(lián)關(guān)系的方法主要有: 和 2 .關(guān)聯(lián)規(guī)則的評價度量主要有: 和 。3 .關(guān)聯(lián)規(guī)則挖掘的算法主要有: 和。4 .購物籃分析中,數(shù)據(jù)是以 的形式呈現(xiàn)。5 .一個項集滿足最小支持度,我們稱之為 。6 .一個關(guān)聯(lián)規(guī)則同時滿足最小支持度和最小置信度,我們稱之為 7 .在回歸與相關(guān)分析中,因變量值隨自變量值的增大(減小)而減小(增大)的現(xiàn)
4、象叫 做。8 .極大頻繁項集不能無損還原出頻繁項集,是因為它不包含頻繁項集的 信息。9 .經(jīng)典的Apriori算法是逐層掃描的,也就是說它是(選:深度/寬度)優(yōu)先的。10 .數(shù)據(jù)挖掘大概步驟包括:輸入數(shù)據(jù)預(yù)處理 挖掘 后處理 輸出知識。其中,輸出的知識可以有很多種表示形式,兩種極端的形式是:內(nèi)部結(jié)構(gòu)難以被理解的黑匣子, 比如說 人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練得出的網(wǎng)絡(luò); 模式結(jié)構(gòu)清晰的匣子,這種結(jié)構(gòu)容易被人理解,比如說決 策樹產(chǎn)生的樹。那么,關(guān)聯(lián)分析中輸出的知識的表示形式主要是(選:黑匣子/清晰結(jié)構(gòu))。三、10個判斷()1.啤酒與尿布的故事是聚類分析的典型實例。()2.Apriori 算法是一種典型的關(guān)聯(lián)規(guī)
5、則挖掘算法。()3.支持度是衡量關(guān)聯(lián)規(guī)則重要性的一個指標(biāo)。()4.可信度是對關(guān)聯(lián)規(guī)則的準(zhǔn)確度的衡量。()5.給定關(guān)聯(lián)規(guī)則 A B,意味著:若 A發(fā)生,B也會發(fā)生。()6.頻繁閉項集可用來無損壓縮頻繁項集。()7.關(guān)聯(lián)規(guī)則可以用枚舉的方法產(chǎn)生。()8.Apriori 算法產(chǎn)生的關(guān)聯(lián)規(guī)則總是確定的。()9.不滿足給定評價度量的關(guān)聯(lián)規(guī)則是無趣的。()10.對于項集來說,置信度沒有意義。四、5個簡答1 .簡述關(guān)聯(lián)規(guī)則產(chǎn)生的兩個基本步驟。2 .Apriori算法是從事務(wù)數(shù)據(jù)庫中挖掘布爾關(guān)聯(lián)規(guī)則的常用算法,該算法利用頻繁項集性質(zhì)的先驗知識,從候選項集中找到頻繁項集。請簡述 Apriori算法的基本原理。3
6、 .簡述Apriori算法的優(yōu)點和缺點。4 .針對Apriori算法的缺點,可以做哪些方面的改進?5 .強關(guān)聯(lián)規(guī)則一定是有趣的嗎?為什么?數(shù)據(jù)挖掘考試題目+參考答案、10個選擇1 .以下屬于關(guān)聯(lián)分析的是(B)A. CPU生能預(yù)測C.自動判斷鶯尾花類別B.購物籃分析D.股票趨勢建模2.維克托?邁爾-舍恩伯格在大數(shù)據(jù)時代:生活、工作與思維的大變革一書中,持續(xù)強調(diào) 了一個觀點:大數(shù)據(jù)時代的到來,使我們無法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奧妙,與此同時,我們更應(yīng)該注重數(shù)據(jù)中的相關(guān)關(guān)系,而不是因果關(guān)系。其中,數(shù)據(jù)之間的相關(guān)關(guān)系可以通過以下哪個算法直接挖掘(D )A. K-meansC. C4.5B. Bayes N
7、etworkD. Apriori3.置信度(confidence)是衡量興趣度度量(B )的指標(biāo)。A.簡潔性C.實用性B.確定性D.新穎性4.Apriori算法的加速過程依賴于以下哪個策略( B )A.抽樣C.緩沖B.剪枝D.并行5.以下哪個會降低Apriori算法的挖掘效率(D )A.支持度閾值增大C.事務(wù)數(shù)減少6 .Apriori算法使用到以下哪些東東(A.格結(jié)構(gòu)、后向無外圖C.格結(jié)構(gòu)、哈希樹7 .非頻繁模式(D )A.其置信度小于閾值C.包含負模式和負相關(guān)模式B.項數(shù)減少D.減小硬盤讀寫速率C )B.二叉樹、哈希樹D.多叉樹、有向無環(huán)圖B.令人不感興趣D.對異常數(shù)據(jù)項敏感8.對頻繁項集、
8、頻繁閉項集、極大頻繁項集的關(guān)系描述正確的是(B )注:分別以1、2、3代表之A. 3可以還原出無損的1C. 3與2是完全等價的B. 2可以還原出無損的1D. 2與1是完全等價的9.Hash tree 在Apriori算法中所起的作用是(C )A.存儲數(shù)據(jù)C.加速查找10.以下不屬于數(shù)據(jù)挖掘軟件的是( CA. SPSS ModelerC. Apache SparkB.查找D.剪枝)B. WekaD. Knime二、10個填空1 .關(guān)聯(lián)分析中表示關(guān)聯(lián)關(guān)系的方法主要有:項集 和關(guān)聯(lián)規(guī)則2 .關(guān)聯(lián)規(guī)則的評價度量主要有:支持度 和 置信度 。3 .關(guān)聯(lián)規(guī)則挖掘的算法主要有:Apriori 和FP-Gro
9、wth4 .購物籃分析中,數(shù)據(jù)是以不對稱二元變量的形式呈現(xiàn)。5 .一個項集滿足最小支持度,我們稱之為頻繁項集。強規(guī)則6 . 一個關(guān)聯(lián)規(guī)則同時滿足最小支持度和最小置信度,我們稱之為7 .在回歸與相關(guān)分析中, 因變量值隨自變量值的增大 (減小)而減小(增大)的現(xiàn)象叫做 負 相關(guān) 。8 .極大頻繁項集不能無損還原出頻繁項集,是因為它不包含頻繁項集的支持度信息。9 .經(jīng)典的Apriori算法是逐層掃描的,也就是說它是寬度(選:深度/寬度)優(yōu)先的。10 .數(shù)據(jù)挖掘大概步驟包括:輸入數(shù)據(jù)預(yù)處理 挖掘 后處理 輸出知識。其中,輸出的知識可以有很多種表示形式,兩種極端的形式是:內(nèi)部結(jié)構(gòu)難以被理解的黑匣子,比如
10、說人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練得出的網(wǎng)絡(luò);模式結(jié)構(gòu)清晰的匣子,這種結(jié)構(gòu)容易被人理解,比如說決策樹產(chǎn)生的樹。那么,關(guān)聯(lián)分析中輸出的知識的表示形式主要是清晰結(jié)構(gòu)(選:黑匣子/清晰結(jié)構(gòu))。三、10個判斷(? ) 1.啤酒與尿布的故事是聚類分析的典型實例。(? ) 2.Apriori算法是一種典型的關(guān)聯(lián)規(guī)則挖掘算法。(? ) 3.支持度是衡量關(guān)聯(lián)規(guī)則重要性的一個指標(biāo)。(? ) 4.可信度是對關(guān)聯(lián)規(guī)則的準(zhǔn)確度的衡量。(? ) 5.給定關(guān)聯(lián)規(guī)則 A B,意味著:若 A發(fā)生,B也會發(fā)生。(? ) 6.頻繁閉項集可用來無損壓縮頻繁項集。(? ) 7.關(guān)聯(lián)規(guī)則可以用枚舉的方法產(chǎn)生。(? ) 8.Apriori算法產(chǎn)生的關(guān)聯(lián)
11、規(guī)則總是確定的。(? ) 9.不滿足給定評價度量的關(guān)聯(lián)規(guī)則是無趣的。(? ) 10.對于項集來說,置信度沒有意義。四、5個簡答1 .簡述關(guān)聯(lián)規(guī)則產(chǎn)生的兩個基本步驟。答:關(guān)聯(lián)規(guī)則產(chǎn)生的兩個基本步驟為:根據(jù)給定的支持度從項集中產(chǎn)生頻繁項集;根據(jù)給定的置信度從頻繁項集中產(chǎn)生關(guān)聯(lián)規(guī)則。2 .Apriori算法是從事務(wù)數(shù)據(jù)庫中挖掘布爾關(guān)聯(lián)規(guī)則的常用算法,該算法利用頻繁項集性質(zhì)的先驗知識,從候選項集中找到頻繁項集。請簡述 Apriori算法的基本原理。 答:關(guān)聯(lián)規(guī)則的產(chǎn)生并不依賴于Apriori算法,Apriori算法用來加速規(guī)則的產(chǎn)生過程。Apriori算法的加速過程依賴于這樣一個先驗原理:“頻繁項集的子集是頻繁的”。3 .簡述Apriori算法的優(yōu)點和缺點。答:Apriori算法的優(yōu)點:結(jié)構(gòu)簡單、易于理解。Apriori算法的缺點:產(chǎn)生大量的候選項集,I/O開銷較大。4 .針對Apriori算法的缺點,可以做哪些方面的改進?答:Apriori算法的缺點主要是產(chǎn)生的候選項集較多,從而導(dǎo)致I/O開銷較大。由此,可以將龐大的數(shù)據(jù)集劃分為可以裝進內(nèi)存的數(shù)據(jù)塊,利用“頻繁項集至
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度倉儲物流倉單質(zhì)押信用擔(dān)保合作協(xié)議范本3篇
- 2025年度智能交通系統(tǒng)建設(shè)項目承包協(xié)議書模板4篇
- 2024版規(guī)范化技術(shù)服務(wù)協(xié)議樣本版
- 2025年度磚廠節(jié)能減排技術(shù)承包合同4篇
- 2025年度智能標(biāo)識技術(shù)采購合同范本匯編3篇
- 2025年棕櫚油項目可行性研究報告
- 《高頻波機培訓(xùn)教材》課件
- 2025年春季花卉展銷會鮮花采購合同3篇
- 2025年智能家居設(shè)備合作意向協(xié)議書3篇
- 2025年物業(yè)管理責(zé)任服務(wù)協(xié)議書(含垃圾分類)3篇
- 全國醫(yī)學(xué)博士英語統(tǒng)一考試詞匯表(10000詞全) - 打印版
- 最新《會計職業(yè)道德》課件
- 廣東省湛江市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名明細
- DB64∕T 1776-2021 水土保持生態(tài)監(jiān)測站點建設(shè)與監(jiān)測技術(shù)規(guī)范
- ?中醫(yī)院醫(yī)院等級復(fù)評實施方案
- 數(shù)學(xué)-九宮數(shù)獨100題(附答案)
- 理正深基坑之鋼板樁受力計算
- 學(xué)校年級組管理經(jīng)驗
- 10KV高壓環(huán)網(wǎng)柜(交接)試驗
- 未來水電工程建設(shè)抽水蓄能電站BIM項目解決方案
- 房屋出租家具電器清單
評論
0/150
提交評論