數(shù)據(jù)挖掘與數(shù)據(jù)分析常見測試題匯編_第1頁
數(shù)據(jù)挖掘與數(shù)據(jù)分析常見測試題匯編_第2頁
數(shù)據(jù)挖掘與數(shù)據(jù)分析常見測試題匯編_第3頁
數(shù)據(jù)挖掘與數(shù)據(jù)分析常見測試題匯編_第4頁
數(shù)據(jù)挖掘與數(shù)據(jù)分析常見測試題匯編_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

精品文檔-下載后可編輯數(shù)據(jù)挖掘與數(shù)據(jù)分析常見測試題匯編數(shù)據(jù)挖掘與數(shù)據(jù)分析常見測試題匯編

1.【單選題】2分|某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據(jù)挖掘的哪類問題()。

A關(guān)聯(lián)規(guī)則發(fā)現(xiàn)

B聚類

C分類

D自然語言處理

2.【單選題】2分|將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務(wù)()

A頻繁模式挖掘

B分類和預(yù)測

C數(shù)據(jù)預(yù)處理

D數(shù)據(jù)流挖掘

3.【單選題】2分|當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時,可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離()。

A分類

B聚類

C關(guān)聯(lián)分析

D隱馬爾可夫鏈

4.【單選題】2分|什么是KDD()。

A數(shù)據(jù)挖掘與知識發(fā)現(xiàn)

B領(lǐng)域知識發(fā)現(xiàn)

C文檔知識發(fā)現(xiàn)

D動態(tài)知識發(fā)現(xiàn)

5.【單選題】2分|為數(shù)據(jù)的總體分布建模;把多維空間劃分成組等問題屬于數(shù)據(jù)挖掘的哪一類任務(wù)()

A探索性數(shù)據(jù)分析

B建模描述

C預(yù)測建模

D尋找模式和規(guī)則

6.【單選題】2分|建立一個模型,通過這個模型根據(jù)已知的變量值來預(yù)測其他某個變量值屬于數(shù)據(jù)挖掘的哪一類任務(wù)()

A根據(jù)內(nèi)容檢索

B建模描述

C預(yù)測建模

D尋找模式和規(guī)則

7.【單選題】2分|用戶有一種感興趣的模式并且希望在數(shù)據(jù)集中找到相似的模式,屬于數(shù)據(jù)挖掘哪一類任務(wù)()

A根據(jù)內(nèi)容檢索

B建模描述

C預(yù)測建模

D尋找模式和規(guī)則

8.【單選題】2分|下面哪種不屬于數(shù)據(jù)預(yù)處理的方法()

A變量代換

B離散化

C聚集

D估計遺漏值

9.【單選題】2分|下面哪個不屬于數(shù)據(jù)的屬性類型:()

A標(biāo)稱

B序數(shù)

C區(qū)間

D相異

10.【單選題】2分|以下哪種方法不屬于特征選擇的標(biāo)準(zhǔn)方法:()

A嵌入

B過濾

C包裝

D抽樣

11.【單選題】2分|在抽樣方法中,當(dāng)合適的樣本容量很難確定時,可以使用的抽樣方法是:()

A有放回的簡單隨機(jī)抽樣

B無放回的簡單隨機(jī)抽樣

C分層抽樣

D漸進(jìn)抽樣

12.【多選題】4分|數(shù)據(jù)倉庫是隨著時間變化的,下面的描述正確的是()

A數(shù)據(jù)倉庫隨時間的變化不斷增加新的數(shù)據(jù)內(nèi)容;

B捕捉到的新數(shù)據(jù)會覆蓋原來的快照;

C數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容;

D數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會隨著時間的變化不斷地進(jìn)行重新綜合;

13.【單選題】2分|OLAP技術(shù)的核心是:()

A在線性;

B對用戶的快速響應(yīng);

C互操作性;

D多維分析;

14.【多選題】4分|有關(guān)數(shù)據(jù)倉庫的開發(fā)特點(diǎn),正確的描述是:()

A數(shù)據(jù)倉庫開發(fā)要從數(shù)據(jù)出發(fā);

B數(shù)據(jù)倉庫使用的需求在開發(fā)出去就要明確;

C數(shù)據(jù)倉庫的開發(fā)是一個不斷循環(huán)的過程,是啟發(fā)式的開發(fā);

D在數(shù)據(jù)倉庫環(huán)境中,并不存在操作型環(huán)境中所固定的和較確切的處理流,數(shù)據(jù)倉庫中數(shù)據(jù)分析和處理更靈活,且沒有固定的模式

15.【單選題】2分|關(guān)于OLAP的特性,下面正確的是:(1)快速性(2)可分析性(3)多維性(4)信息性(5)共享性()

A(1)(2)(3)

B(2)(3)(4)

C(1)(2)(3)(4)

D(1)(2)(3)(4)(5)

16.【多選題】4分|在有關(guān)數(shù)據(jù)倉庫測試,下列說法正確的是:()

A在完成數(shù)據(jù)倉庫的實(shí)施過程中,需要對數(shù)據(jù)倉庫進(jìn)行各種測試.測試工作中要包括單元測試和系統(tǒng)測試.

B當(dāng)數(shù)據(jù)倉庫的每個單獨(dú)組件完成后,就需要對他們進(jìn)行單元測試.

C系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進(jìn)行大量的功能測試和回歸測試.

D在測試之前沒必要制定詳細(xì)的測試計劃.

17.【單選題】2分|設(shè)X={1,2,3}是頻繁項(xiàng)集,則可由X產(chǎn)生()個關(guān)聯(lián)規(guī)則。

A4

B5

C6

D7

18.【單選題】2分|以下哪些算法是分類算法()

ADBSCAN

BC4.5

CK-Mean

DEM

19.【單選題】2分|以下哪些分類方法可以較好地避免樣本的不平衡問題()

AKNN

BSVM

CBayes

D神經(jīng)網(wǎng)絡(luò)

20.【多選題】4分|關(guān)于OLAP和OLTP的區(qū)別描述,正確的是:()

AOLAP主要是關(guān)于如何理解聚集的大量不同的數(shù)據(jù).它與OTAP應(yīng)用程序不同.

B與OLAP應(yīng)用程序不同,OLTP應(yīng)用程序包含大量相對簡單的事務(wù).

COLAP的特點(diǎn)在于事務(wù)量大,但事務(wù)內(nèi)容比較簡單且重復(fù)率高.

DOLAP是以數(shù)據(jù)倉庫為基礎(chǔ)的,但其最終數(shù)據(jù)來源與OLTP一樣均來自底層的數(shù)據(jù)庫系統(tǒng),兩者面對的用戶是相同的.

21.【單選題】2分|如果規(guī)則集中的規(guī)則按照優(yōu)先級降序排列,則稱規(guī)則集是()

A無序規(guī)則

B窮舉規(guī)則

C互斥規(guī)則

D有序規(guī)則

22.【單選題】2分|以下哪個聚類算法不是屬于基于原型的聚類()。

A模糊c均值

BEM算法

CSOM

DCLIQUE

23.【單選題】2分|一個對象的離群點(diǎn)得分是該對象周圍密度的逆。這是基于()的離群點(diǎn)定義。

A概率

B鄰近度

C密度

D聚類

24.【單選題】2分|下面關(guān)于Jarvis-Patrick(JP)聚類算法的說法不正確的是()。

AJP聚類擅長處理噪聲和離群點(diǎn),并且能夠處理不同大小、形狀和密度的簇。

BJP算法對高維數(shù)據(jù)效果良好,尤其擅長發(fā)現(xiàn)強(qiáng)相關(guān)對象的緊致簇。

CJP聚類是基于SNN相似度的概念。

DJP聚類的基本時間復(fù)雜度為O(m)。

25.【多選題】4分|關(guān)于決策樹的說法,正確的是()

A冗余屬性不會對決策樹的準(zhǔn)確率造成不利的影響

B子樹可能在決策樹中重復(fù)多次

C決策樹算法對于噪聲的干擾非常敏感

D尋找最佳決策樹是NP完全問題

26.【多選題】4分|以下關(guān)于人工神經(jīng)網(wǎng)絡(luò)(ANN)的描述正確的有()

A神經(jīng)網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)中的噪聲非常魯棒

B可以處理冗余特征

C訓(xùn)練ANN是一個很耗時的過程

D至少含有一個隱藏層的多層神經(jīng)網(wǎng)絡(luò)

27.【多選題】4分|關(guān)于混合模型聚類算法的優(yōu)缺點(diǎn),下面說法不正確的是()。

A當(dāng)簇只包含少量數(shù)據(jù)點(diǎn),或

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論