數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘試題11年_第1頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘試題11年_第2頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘試題11年_第3頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘試題11年_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、提示:務(wù)必寫(xiě)上學(xué)號(hào)和姓名數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘I.選擇題,為每個(gè)問(wèn)題選擇最合適的答案(10 x 2% = 20%)1. 數(shù)據(jù)倉(cāng)庫(kù)上的業(yè)務(wù)處理稱(chēng)作。A. 聯(lián)機(jī)事務(wù)處理B. 聯(lián)機(jī)分析處理C. 聯(lián)機(jī)輸入處理D. 聯(lián)機(jī)查詢處理2. 在自然演化體系結(jié)構(gòu)中,關(guān)于導(dǎo)致數(shù)據(jù)缺乏可信性的原因的說(shuō)法哪個(gè)不正確?A. 數(shù)據(jù)無(wú)時(shí)基B. 抽取程序的算法有差異C. 抽取的層次不同D. 缺乏集成性3. 下面哪項(xiàng)關(guān)于 OLTP與OLAP訪問(wèn)特點(diǎn)的說(shuō)法是不正確的。A. OLTP和OLAP對(duì)于響應(yīng)時(shí)間的要求都高B. OLTP訪問(wèn)頻率高,OLAP訪問(wèn)頻率低C. OLAP訪問(wèn)大量的歷史,執(zhí)行大量統(tǒng)計(jì)操作D. OLTP數(shù)據(jù)處理具有并發(fā)性4

2、. 下面關(guān)于數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的說(shuō)法錯(cuò)誤的是?A. 數(shù)據(jù)越詳細(xì),粒度越小,層次級(jí)別就越高。B. 在估計(jì)直接存儲(chǔ)設(shè)備數(shù)時(shí),如數(shù)據(jù)超過(guò)1000萬(wàn)行必須強(qiáng)制采取雙重粒度級(jí)。C. 數(shù)據(jù)倉(cāng)庫(kù)大部分分析是針對(duì)被壓縮的、存取效率高的輕度級(jí)數(shù)據(jù)進(jìn)行的。D. 數(shù)據(jù)分割便于數(shù)據(jù)的重構(gòu)、重組和恢復(fù),以提高創(chuàng)建索引和順序掃描的效率。5. 下面關(guān)于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)存儲(chǔ)方式的說(shuō)法哪個(gè)是不正確的?E. 虛擬存儲(chǔ)方式中,數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)仍然在源數(shù)據(jù)中。F. 星型模式下的維表規(guī)范化的,而雪花模式下的不需要規(guī)范化G. 在查詢效率方面,星型模式效率更高H. 在事實(shí)星座模式中有多個(gè)事實(shí)表,且它們共享相同的維表6. 下面關(guān)于星型模型的說(shuō)法哪個(gè)

3、是不正確的?I. 有一個(gè)包含大量數(shù)據(jù)的事實(shí)表J. 有一組小的附屬表,稱(chēng)為維表,每維一個(gè)。K. 事實(shí)表的每個(gè)字段都是事實(shí)度量字段L. 事實(shí)中每條元組都含有指向各個(gè)維表的外鍵和一些相應(yīng)的度量數(shù)據(jù)。7. 下面關(guān)于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)追加的說(shuō)法哪個(gè)是不正確的?A. 時(shí)標(biāo)法需要為記錄數(shù)據(jù)增加一個(gè)時(shí)間標(biāo)志。B. 前后映像文件方法需要掃描整個(gè)數(shù)據(jù)庫(kù),占用較多資源,對(duì)性能有較大影響C. DELTA不需要掃描整個(gè)數(shù)據(jù)庫(kù),效率較高,應(yīng)用普遍D. 日志文件法也不需要掃描整個(gè)數(shù)據(jù)庫(kù),是固有機(jī)制。8. 假設(shè)收入屬性的最小與最大分別是10000和90000,現(xiàn)在想把當(dāng)前值 30000映射到區(qū)間0,1,若采用最大一最小數(shù)據(jù)規(guī)范方

4、法,計(jì)算結(jié)果是多少?A.0.25B.0.375C.0.125D.0.59.卜面關(guān)于維的概忿哪個(gè)是/、止確的?A.維是人們觀察數(shù)據(jù)的特定角度。B.維的層次性是由觀察數(shù)據(jù)細(xì)致程度不同造成的。C.某E月某日”是時(shí)間維的層次。D.月、季、年”是時(shí)間維的層次。10.敏循倉(cāng)庫(kù)升友皿用同勘P(pán)J分為二個(gè)階段,卜外哪壩小是具甲呆個(gè)階段?A.規(guī)劃分析階段B.體系結(jié)構(gòu)設(shè)計(jì)階段C.設(shè)計(jì)實(shí)施階段D.使用維護(hù)階段II.簡(jiǎn)答題(4 X 5% = 20%)1.在現(xiàn)實(shí)世界的數(shù)據(jù)中,兀組在某些屬性上缺少值是常有的,描述處理該1可題的方法?少給出5種不同的方法)2. 簡(jiǎn)述數(shù)據(jù)倉(cāng)庫(kù)的四個(gè)基本特征?3. 簡(jiǎn)述輪轉(zhuǎn)綜合數(shù)據(jù)存儲(chǔ)的過(guò)程?4

5、. 簡(jiǎn)述數(shù)據(jù)庫(kù)數(shù)據(jù)與數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)的異同?II.設(shè)計(jì)題(5 X 12% = 60%)1、 假定大學(xué)的數(shù)據(jù)倉(cāng)庫(kù)包含4個(gè)維(student學(xué)生、course課程、semester學(xué)期、instructor 教師, 2個(gè)度量count和avg_grade。在最低的概念層(例如對(duì)于給定的學(xué)生、課程、學(xué)期和教師組合),度量avg_grade存放學(xué)生的實(shí)際成績(jī)。在較高概念層,avg_grade存放給定組合的平均成績(jī)。a)為數(shù)據(jù)倉(cāng)庫(kù)畫(huà)出雪花模式圖8%b)由基本立方體(學(xué)生、課程、學(xué)期、教師開(kāi)始,列出大學(xué)每個(gè)學(xué)生的計(jì)算機(jī)導(dǎo)論”課程的平均成績(jī),應(yīng)當(dāng)使用哪些OLAP操作(如由學(xué)期上卷到年)?4%2、 假定數(shù)據(jù)倉(cāng)庫(kù)包

6、含 4個(gè)維date時(shí)間,spectator觀眾,location地區(qū)和game節(jié)目,2個(gè)度量 count和chargeo其中,charge是觀眾在給定的日期觀看節(jié)目的付費(fèi)。觀眾可以是學(xué)生、成年人或老人,每類(lèi)觀眾有不同的收費(fèi)標(biāo)準(zhǔn)。a)畫(huà)出該數(shù)據(jù)倉(cāng)庫(kù)的星形模式圖8%b)由基本立方體date,spectator,location,game開(kāi)始,為列出 2011年觀眾在 GM-Place的總 付費(fèi),應(yīng)當(dāng)執(zhí)行哪些 OLAP操作? 4%3、假定下面的表從面向?qū)傩缘臍w納導(dǎo)出。類(lèi)出生地人數(shù)程序員江蘇 180其它 120江蘇20其它80a) 將該表轉(zhuǎn)換成顯示相關(guān) t-權(quán)和d-權(quán)的交叉表6%b) 將類(lèi)“程序員”轉(zhuǎn)

7、換成(雙向的)量化描述規(guī)則。例如銷(xiāo)售員VX ,Programmer(X) u (birth _ place(X)="江蘇"八.)t: x%,d : y%. v (.)(t : w%, d : z%4、數(shù)據(jù)庫(kù)有TIDT100T200T300T400a) 使用 Apriori事物。設(shè) min_sup=60%,min_conf=80%購(gòu)買(mǎi)的物品K,A,D,B D,A,C,E,B日期99/10/1599/10/1599/10/19C,A,B,E99/10/22B,A,D算法找出頻繁項(xiàng)集 6%b) 列出所有強(qiáng)關(guān)聯(lián)規(guī)則(帶支持度s和置信度表顧客的變量,item是表示項(xiàng)的變量(例如,c) ,它們與下面的元規(guī)則匹配,其中, X是代”A' , ” B” 等)6%x transaction, buys(X,item1) buys(X ,item2)= buys(X, item3)s,c5、假設(shè)數(shù)據(jù)集D含有9個(gè)數(shù)據(jù)對(duì)象(用2維空間的點(diǎn)表示):A(3,2), A 2(3,9), A 3(8,6), B i(9,5), B 2(2,4), B 3(3,10), C i(2,6), C 2(9,6), C 3(2,2) 采用k-均值方法進(jìn)行聚類(lèi),距離函數(shù)采用歐幾里德距離,取k=3,假設(shè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論