數(shù)據(jù)倉(cāng)庫(kù)習(xí)題答案_第1頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)習(xí)題答案_第2頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)習(xí)題答案_第3頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)習(xí)題答案_第4頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)習(xí)題答案_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上第一章1.為什么不能依靠傳統(tǒng)的業(yè)務(wù)處理系統(tǒng)進(jìn)行決策分析? (P1-3)2.在將數(shù)據(jù)源中的數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)之前需要完成那些工作?為什么要進(jìn)行這些工作?(數(shù)據(jù)準(zhǔn)備P13-14 另外加“抽取” )3.(選做)如果創(chuàng)建一個(gè)數(shù)據(jù)倉(cāng)庫(kù),主要是分析關(guān)于客戶的人口統(tǒng)計(jì)(收入、家庭人口、家庭位置、愛好等)。數(shù)據(jù)倉(cāng)庫(kù)的目的在于將特定的產(chǎn)品推銷給合適的潛在客戶群。這個(gè)數(shù)據(jù)倉(cāng)庫(kù)應(yīng)該從哪些地方獲取數(shù)據(jù)源,數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)應(yīng)該包含哪些部分。(P12, 8) 4.從數(shù)據(jù)挖掘與數(shù)據(jù)庫(kù)、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)的關(guān)系來(lái)討論什么是數(shù)據(jù)挖掘? 5.在數(shù)據(jù)挖掘過程中需要涉及到哪些過程?(P31-35) (1).

2、 確定挖掘?qū)ο笄逦囟x出業(yè)務(wù)問題,認(rèn)清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步.(2)數(shù)據(jù)準(zhǔn)備1) 數(shù)據(jù)的選擇:選擇出適用于數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù).2) 數(shù)據(jù)的預(yù)處理:研究數(shù)據(jù)的質(zhì)量, 并確定將要進(jìn)行的挖掘操作的類型.、(3) 模型的構(gòu)建:建立一個(gè)分析模型.這個(gè)分析模型是針對(duì)挖掘算法建立的。(4)數(shù)據(jù)挖掘:對(duì)所得到的經(jīng)過轉(zhuǎn)換的數(shù)據(jù)進(jìn)行挖掘.(5)結(jié)果分析:解釋并評(píng)估結(jié)果.其使用的分析方法一般應(yīng)作數(shù)據(jù)挖掘操作而定,通常會(huì)用到可視化技術(shù).(6)知識(shí)的應(yīng)用:將分析所得到的知識(shí)集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去,使其在實(shí)際的管理決策分析中得到應(yīng)用6.在現(xiàn)實(shí)中有哪些人需要使用數(shù)據(jù)挖掘技術(shù)來(lái)幫助他的工作? (P35

3、)第二章名詞解釋; 維 :關(guān)于一個(gè)組織想要記錄的透視或?qū)嶓w。 維表 :對(duì)維各個(gè)屬性的描述。 事實(shí) :數(shù)值的度量。 事實(shí)表: 包括事實(shí)的名稱或度量,以及每個(gè)相關(guān)維表的關(guān)鍵字。 元數(shù)據(jù): 數(shù)據(jù)的數(shù)據(jù),可以對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的各種數(shù)據(jù)進(jìn)行詳細(xì)的描述與說明,說明每個(gè)數(shù)據(jù)的上下關(guān)系,使每個(gè)數(shù)據(jù)具有符合現(xiàn)實(shí)的真實(shí)含義,使用戶可以了解這些數(shù)據(jù)之間的關(guān)系. 粒度 :數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)單元的詳細(xì)程度和級(jí)別.星型模型 : 最常用的數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)結(jié)構(gòu)的實(shí)現(xiàn)模式。使數(shù)據(jù)倉(cāng)庫(kù)形成了一個(gè)集成系統(tǒng),為用戶提供分析服務(wù)對(duì)象。核心是事實(shí)表,圍繞事實(shí)表的是維度表。通過事實(shí)表將各種不同的維度表連接起來(lái),各個(gè)維度表都連接到中央事實(shí)表。 雪花模型

4、: 對(duì)星型模型的冗余的維度表進(jìn)一步分解,對(duì)星型模型中的維度表進(jìn)行了規(guī)范化處理。問答:n 1.簡(jiǎn)述olap 與oltp的區(qū)別; Olap:在線分析處理;oltp:聯(lián)機(jī)事務(wù)處理。 n 2.在一般的信息管理中采用哪些概念模型來(lái)描述信息處理的對(duì)象,這些概念數(shù)據(jù)模型是否適合數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)環(huán)境?略答:一般的業(yè)務(wù)處理系統(tǒng)中廣泛采用實(shí)體-關(guān)系模型(ERD)來(lái)描述信息處理的對(duì)象,但 它無(wú)法表述數(shù)據(jù)倉(cāng)庫(kù)中所需要的分析數(shù)據(jù)、描述數(shù)據(jù)和細(xì)節(jié)數(shù)據(jù)之間的關(guān)系,無(wú)法反映出時(shí)間屬性的存在和作用,更無(wú)法表現(xiàn)出數(shù)據(jù)的導(dǎo)出關(guān)系,因要對(duì)其進(jìn)行修改,得到星型模型或雪花模型。(CRUD矩陣在數(shù)據(jù)倉(cāng)庫(kù)的高層模型中反應(yīng)實(shí)體的生成、引用、更新

5、和刪除不屬于概念模型的范疇)n 3.航空公司希望能夠分析在其服務(wù)旅客中的??吐眯汹厔?shì),這樣可以為公司正確定位航空市場(chǎng)中的??褪袌?chǎng)。并且希望能夠跟蹤不同航線上旅客的季節(jié)變化情況和增長(zhǎng),并跟蹤在不同航班上所消費(fèi)的食品和飲料情況,這樣可以幫助航空公司安排不同航線上的航班和食品供應(yīng)。現(xiàn)在所面對(duì)的任務(wù)是為其設(shè)計(jì)一個(gè)數(shù)據(jù)倉(cāng)庫(kù)的概念模型、邏輯模型和物理數(shù)據(jù)模型。航班旅客食物/飲料ERD模型雪花(概念)模型消費(fèi)事實(shí)表旅客編號(hào)ID航班編號(hào)ID食物編號(hào)ID飲料編號(hào)ID季節(jié)ID乘坐次數(shù)旅客類型食物消費(fèi)數(shù)量食品消費(fèi)金額初次乘坐時(shí)間旅客編號(hào)ID省、市、縣、街聯(lián)系方式郵編航班編號(hào)ID航線編號(hào)機(jī)票價(jià)格機(jī)艙類型飛行里程始發(fā)地

6、目的地食物編號(hào)ID食物類別食品價(jià)格飲料編號(hào)ID飲料類別飲料價(jià)格季節(jié)ID季節(jié)類型旅客編號(hào)ID姓名、年齡職業(yè)、收入地址、身份證旅客編號(hào) 姓名 證件類型 證件號(hào) 職業(yè) 收入 乘坐季節(jié)旅客類別旅客編號(hào) 省 市 縣 街道郵政編碼聯(lián)系方式航班狀況航班號(hào)航線號(hào)飛行里程始發(fā)地目的地乘坐次數(shù)食物消費(fèi)食物消費(fèi)狀況食物編號(hào)食物類別消費(fèi)數(shù)量旅客編號(hào)旅客邏輯模型食品消費(fèi)季節(jié)狀況季節(jié)ID季節(jié)類型飲料消費(fèi)飲料消費(fèi)狀況飲料編號(hào)飲料類別消費(fèi)數(shù)量事實(shí)表:消費(fèi)事實(shí)表(旅客編號(hào)ID int12,航班編號(hào)ID int12,食物編號(hào)ID int12,飲料編號(hào)ID int12,季節(jié)ID int12,乘坐次數(shù)int12,旅客類型char 2

7、,食物消費(fèi)數(shù)量int 4,食品消費(fèi)金額 float 8,初次乘坐時(shí)間datatime 8)維表:(1) 旅客基本情況表 (編號(hào) int12, 姓名 char12, 證件類型 chat12 , 證件號(hào) char18, 職業(yè) char12, 收入 smallmoney 4, 乘坐季節(jié) datatime 8)(2) 旅客變動(dòng)情況表(編號(hào) int12,省char20,市char20,縣char20,街道char20 ,郵編 int 6, 聯(lián)系方式 varchar 50)(3) 食品消費(fèi)情況表 (食品編號(hào) int12, 名稱 char12, 類別 char 2, 數(shù)量 int 4)(4) 飲料消費(fèi)情況表

8、 飲料編號(hào) int12, 名稱 char12, 類別 char 2, 數(shù)量 int 4)(5) 航班情況表 (航班號(hào) char12, 航線號(hào) char12, 飛行里程 int4, 始發(fā)站 char10, 目的地 char 10, 時(shí)間 datatime 8)n 4.為建立第3題中的數(shù)據(jù)倉(cāng)庫(kù),需要哪些元數(shù)據(jù)?這些元數(shù)據(jù)在不同的階段應(yīng)該發(fā)揮什么作用?略答:元數(shù)據(jù):旅客基本信息,初次乘坐時(shí)間,食品消費(fèi)情況,航班情況等 初次乘坐時(shí)記錄其編號(hào),便于以后查詢和修改 每次乘坐時(shí)記錄航班狀況和食品消費(fèi)狀況作用:p56-58 第三章1.為什么說數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)是一個(gè)不斷循環(huán)、逐步提升的開發(fā)過程? (P67)2.數(shù)

9、據(jù)倉(cāng)庫(kù)的生命周期應(yīng)該包含哪幾個(gè)階段?需要完成哪些工作?(P65)數(shù)據(jù)倉(cāng)庫(kù)的生命周期開發(fā)過程:(要求展開) 規(guī)劃分析階段:規(guī)劃與確定需求、開發(fā)概念模型、開發(fā)邏輯模型;設(shè)計(jì)實(shí)施階段:設(shè)計(jì)體系結(jié)構(gòu)、數(shù)據(jù)庫(kù)與元數(shù)據(jù)設(shè)計(jì)、數(shù)據(jù)抽取轉(zhuǎn)換與加載、開發(fā)中間件、填充與測(cè)試數(shù)據(jù)倉(cāng)庫(kù);使用維護(hù)階段:數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用、數(shù)據(jù)倉(cāng)庫(kù)維護(hù)、數(shù)據(jù)倉(cāng)庫(kù)評(píng)價(jià)。數(shù)據(jù)倉(cāng)庫(kù)的生命周期開發(fā)特點(diǎn):(1) 數(shù)據(jù)倉(cāng)庫(kù)開發(fā)是從數(shù)據(jù)出發(fā)的;(2) 數(shù)據(jù)倉(cāng)庫(kù)使用的需求不能在開發(fā)初期明確;(3) 數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)是一個(gè)不斷循環(huán)的啟發(fā)式過程。3.在數(shù)據(jù)倉(cāng)庫(kù)的需求分析中需要對(duì)哪些人員進(jìn)行需求調(diào)查,應(yīng)該調(diào)查哪些內(nèi)容?(P73)4.請(qǐng)為購(gòu)買商品趨勢(shì)分析設(shè)計(jì)一個(gè)數(shù)據(jù)倉(cāng)

10、庫(kù)的星型模型,并給出維表的層次結(jié)構(gòu)。(P78圖3.4,維表層次P75 表3-1 )5.在數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)過程中需要對(duì)哪些模型進(jìn)行評(píng)審,不同模型的評(píng)審內(nèi)容有哪些?(概念模型 P80,邏輯模型 P90,物理模型 P95)第四章 名詞解釋:維 (p106):決策分析的角度或出發(fā)點(diǎn)多維數(shù)據(jù)集(p107):數(shù)據(jù)立方體或超立方體。上卷(p110):從較低層次的數(shù)據(jù)開始沿某一個(gè)維的概念分層向上歸約 ,得到概括性的數(shù)據(jù)下鉆(p110):從較高層次的數(shù)據(jù)開始沿某一個(gè)維的概念分層向下或引入新的維來(lái)實(shí)現(xiàn),得到細(xì)節(jié)數(shù)據(jù);多維的切片(p109):在某兩個(gè)維上取一定區(qū)間的維成員或全部維成員,而其余的維上選定一個(gè)維成員的操作

11、。多維的切塊(p110): 在切片的基礎(chǔ)上,進(jìn)一步確定各個(gè)維成員的區(qū)間得到的片段體,即由多個(gè)切片疊合起來(lái)的。旋轉(zhuǎn)(p110): 對(duì)多維數(shù)據(jù)集改變其顯示得維方向,得到不同視角的數(shù)據(jù)多維OLAP(MOLAP) (p114):基于多維數(shù)據(jù)庫(kù)存儲(chǔ)方式建立起來(lái)的OLAP關(guān)系OLAP(ROLAP) (p118):基于關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)方式建立起來(lái)的OLAP問答:1.什么是OLAP?OLAP是一種技術(shù)?還是一種數(shù)據(jù)庫(kù)?(p105)在線分析處理或聯(lián)機(jī)分析處理 ,是一個(gè)應(yīng)用廣泛的數(shù)據(jù)倉(cāng)庫(kù)使用技術(shù)。它可以根據(jù)分析人員的要求,快速、靈活地對(duì)大量數(shù)據(jù)進(jìn)行復(fù)雜的查詢處理,并以直觀的、容易理解的形式將查詢結(jié)構(gòu)提供給決策人員。

12、2.OLAP的系統(tǒng)結(jié)構(gòu)是怎樣的?這種結(jié)構(gòu)在進(jìn)行在線分析時(shí)有什么特點(diǎn)?(p113-114)OLAP的系統(tǒng)結(jié)構(gòu)分為瘦客戶端系統(tǒng)和胖客戶端系統(tǒng)。胖客戶端系統(tǒng):將多維數(shù)據(jù)存儲(chǔ)于客戶端和OLAP服務(wù)器,這種系統(tǒng)由于客戶在進(jìn)行在線分析處理時(shí),需要將數(shù)據(jù)加載到客戶端,容易產(chǎn)生網(wǎng)絡(luò)瓶頸。瘦客戶端系統(tǒng):多維數(shù)據(jù)集不存儲(chǔ)在客戶端,存在OLAP服務(wù)器中,這在網(wǎng)絡(luò)中所需傳輸?shù)闹皇欠治鎏幚砗蟮慕Y(jié)果,而不是多維數(shù)據(jù)集。3.MOLAP和ROLAP在OLAP的數(shù)據(jù)存儲(chǔ)中各有什么特點(diǎn)?在什么情況下,選擇MOLAP?在什么情況下,選擇ROLAP?(p122-123 MOLAP:將數(shù)據(jù)和聚合都存儲(chǔ)于多維數(shù)據(jù)結(jié)構(gòu)中。ROLAP:將數(shù)據(jù)和聚合都存儲(chǔ)于關(guān)系數(shù)據(jù)結(jié)構(gòu)中;如果需要建立一個(gè)大型的,功

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論