數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)模型課件_第1頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)模型課件_第2頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)模型課件_第3頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)模型課件_第4頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)模型課件_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 DW的設(shè)計(jì)是一個(gè)復(fù)雜的過(guò)程:現(xiàn)實(shí)環(huán)境抽象模型具體實(shí)現(xiàn)。上述過(guò)程實(shí)現(xiàn)的期間,使用了諸多的數(shù)據(jù)模型, 1 引言 2 概念模型 3 邏輯模型 4 物理模型 5 元數(shù)據(jù)模型 6 粒度模型 7 聚集模型第二章 數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)模型1 引言 創(chuàng)建DW時(shí),需用各種數(shù)據(jù)模型對(duì)DW進(jìn)行描述。DW的開(kāi)發(fā)者依據(jù)這些數(shù)據(jù)模型,才能開(kāi)發(fā)出一個(gè)滿足用戶需求的DW。 為了使開(kāi)發(fā)人員能夠?qū)⒆⒁饬性跀?shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)的主要部分,模型要有很好的適應(yīng)性,更易于修改,且,當(dāng)用戶的需求改變時(shí),僅對(duì)模型做出相應(yīng)的變化就能反映這個(gè)改變。 CH2 模型是對(duì)現(xiàn)實(shí)世界進(jìn)行抽象的工具。 信息管理中,需要將現(xiàn)實(shí)世界的事物及其有關(guān)特征轉(zhuǎn)換為信息世界的數(shù)據(jù)

2、才能對(duì)信息進(jìn)行處理與管理,這就需要依靠數(shù)據(jù)模型作為這種轉(zhuǎn)換的橋梁。 上述的轉(zhuǎn)換一般需要經(jīng)歷從現(xiàn)實(shí)到概念模型,從概念模型到邏輯模型,從邏輯模型到物理模型的轉(zhuǎn)換過(guò)程。CH2現(xiàn)實(shí)世界概念世界邏輯世界計(jì)算機(jī)世界信用張三客戶客戶與產(chǎn)品特性屬性列(字段、數(shù)據(jù)項(xiàng))個(gè)體實(shí)體記錄整體同質(zhì)總體表文件整體間聯(lián)系異質(zhì)總體數(shù)據(jù)庫(kù)現(xiàn)實(shí)世界與各個(gè)數(shù)據(jù)模型之間的關(guān)系CH2 此外,數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)過(guò)程中,還要使用下述很重要的幾個(gè)數(shù)據(jù)模型元數(shù)據(jù)模型和數(shù)據(jù)粒度和聚集模型。DW開(kāi)發(fā)過(guò)程中,各個(gè)數(shù)據(jù)模型間的關(guān)系如下圖所示?,F(xiàn)實(shí)世界概念模型邏輯模型物理模型數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)模型聚 集 模 型數(shù)據(jù)粒度和DW的靈魂!指導(dǎo)DW開(kāi)發(fā)。CH22 概念模

3、型 概念模型是對(duì)真實(shí)世界中問(wèn)題域內(nèi)的事物的描述,包括:記號(hào)、內(nèi)涵、外延,其中記號(hào)和內(nèi)涵(視圖)最具實(shí)際意義。 和業(yè)務(wù)處理系統(tǒng)一樣,數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建過(guò)程中,也可以用E-R圖來(lái)表示概念模型這樣做的直接好處是,數(shù)據(jù)倉(cāng)庫(kù)與業(yè)務(wù)處理系統(tǒng)能夠得到很好的協(xié)調(diào)。 CH2 改進(jìn)的E-R圖 與業(yè)務(wù)處理系統(tǒng)中的數(shù)據(jù)庫(kù)概念設(shè)計(jì)一樣,數(shù)據(jù)倉(cāng)庫(kù)也可以用三個(gè)層次的數(shù)據(jù)模型來(lái)描述 高層模型(E-R圖)、中層模型(邏輯層)和底層模型(物理層)。但要注意兩者之間的差異: 數(shù)據(jù)類型的差異 DW中不包含操作型數(shù)據(jù),只包含用戶感興趣的分析數(shù)據(jù)(如,商品的銷(xiāo)量、企業(yè)的利潤(rùn)等)、描述數(shù)據(jù)(如,銷(xiāo)售時(shí)間、地點(diǎn))CH2以及細(xì)節(jié)數(shù)據(jù)(如,所銷(xiāo)售商品

4、的詳情、客戶詳情等)。 數(shù)據(jù)的歷史變遷性 業(yè)務(wù)處理系統(tǒng)中,一般只包含當(dāng)前數(shù)據(jù)而不含歷史數(shù)據(jù); 數(shù)據(jù)倉(cāng)庫(kù)中,為了反映出組織的歷史變遷、業(yè)務(wù)的發(fā)展等,需要增加時(shí)間屬性進(jìn)行描述(即把時(shí)間作為關(guān)鍵字的一部分)。 數(shù)據(jù)的概括性 為了提高使用的性能,往往在數(shù)據(jù)倉(cāng)庫(kù)中增加一些由基本數(shù)據(jù)導(dǎo)出的衍生數(shù)據(jù),它們?cè)跇I(yè)務(wù)處理系統(tǒng)中是不存在的。 為此,對(duì)傳統(tǒng)的E-R圖進(jìn)行了一些改進(jìn):把實(shí)體擴(kuò)展成三類指標(biāo)實(shí)體(事實(shí)實(shí)體)、維實(shí)體和詳細(xì)類別實(shí)體。CH2其中:指標(biāo)實(shí)體 指標(biāo)實(shí)體處于概念模型的中心,是DW活動(dòng)的中心; 是現(xiàn)實(shí)世界中的某一業(yè)務(wù)處理或某一事件(銷(xiāo)售、服務(wù)等)的邏輯表示; 體現(xiàn)了現(xiàn)實(shí)世界中的事務(wù)處理的值(從業(yè)務(wù)處理系

5、統(tǒng)獲取的),每個(gè)值只與每個(gè)相關(guān)維的一個(gè)點(diǎn)對(duì)應(yīng),是管理人員衡量業(yè)務(wù)好壞及其處理難度的基礎(chǔ)。CH2 隨著時(shí)間的推移,以及數(shù)據(jù)倉(cāng)庫(kù)需求的變化,指標(biāo)實(shí)體中的數(shù)據(jù)量會(huì)日益膨脹,因此,指標(biāo)實(shí)體是數(shù)據(jù)倉(cāng)庫(kù)管理的重點(diǎn)。 其主要特性如下:是分析中心,提供基本數(shù)據(jù);包含多個(gè)數(shù)據(jù)訪問(wèn)路徑;包含標(biāo)準(zhǔn)數(shù)據(jù);能擴(kuò)充成很大的表以容納日益增長(zhǎng)的數(shù)據(jù)。 CH2維實(shí)體 主要用于對(duì)實(shí)體的過(guò)濾和重新組織,可將用戶的查詢結(jié)果按維指標(biāo)進(jìn)行篩選,可在指標(biāo)實(shí)體之間以及指標(biāo)實(shí)體與詳細(xì)類別實(shí)體之間建立聯(lián)系,使用戶對(duì)DW的使用更輕松。 其主要特性:訪問(wèn)并過(guò)濾指標(biāo)實(shí)體;是非標(biāo)準(zhǔn)實(shí)體(含完整的維體系編碼、關(guān)鍵詞及相關(guān)運(yùn)算);引導(dǎo)用戶及進(jìn)行查詢分析等等

6、。CH2詳細(xì)類別實(shí)體 與現(xiàn)實(shí)世界的某一實(shí)體(一個(gè)客戶/一個(gè)產(chǎn)品/一個(gè)銷(xiāo)售點(diǎn))對(duì)應(yīng),為用戶提供更為詳細(xì)的分析數(shù)據(jù)。 其主要特性為:含參考數(shù)據(jù)及有助于完成指標(biāo)數(shù)據(jù)職能的支持信息;與事務(wù)結(jié)構(gòu)有映射關(guān)系;是標(biāo)準(zhǔn)的數(shù)據(jù)結(jié)構(gòu);數(shù)據(jù)量比指標(biāo)實(shí)體少,比維實(shí)體多。CH2 反規(guī)范化處理 業(yè)務(wù)處理系統(tǒng)中的數(shù)據(jù)庫(kù)設(shè)計(jì),是以規(guī)范化數(shù)據(jù)模型為目標(biāo)的,如,RDBMS中的3NF等,規(guī)范化數(shù)據(jù)模型具有存儲(chǔ)的高效性和靈活性的特點(diǎn)。 數(shù)據(jù)倉(cāng)庫(kù)中,若仍采用規(guī)范化數(shù)據(jù)模型的話,就會(huì)存在一系列“小”表,在進(jìn)行大量的數(shù)據(jù)處理時(shí),會(huì)頻繁地與這些小表進(jìn)行動(dòng)態(tài)連接,從而產(chǎn)生大量的I/O操作。CH2 反規(guī)范化處理,就是為了減少I(mǎi)/O次數(shù)而把上述的

7、諸多“小”表合并在一起的處理方法。 可見(jiàn), 反規(guī)范化處理是以增加數(shù)據(jù)的冗余為代價(jià)來(lái)減少I(mǎi)/O次數(shù)的由于數(shù)據(jù)倉(cāng)庫(kù)中要進(jìn)行海量的數(shù)據(jù)處理,因此,這種以“空間換時(shí)間”的嘗試,在數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用中是值得的,也是易于被用戶所接受的。CH2 星形模型 僅從概念設(shè)計(jì)的角度來(lái)看,右圖給出了一個(gè)簡(jiǎn)單的ER圖,其中的五個(gè)實(shí)體相互間是平等關(guān)系。 然而,從管理決策的角度看,這五個(gè)實(shí)體絕對(duì)不會(huì)是“平等關(guān)系”,例如,決策者真正關(guān)心的是“訂單”,其他實(shí)體(供應(yīng)商、產(chǎn)品、客戶等)只是針對(duì)“訂單”的諸多說(shuō)明。CH2 進(jìn)而,實(shí)際應(yīng)用中,會(huì)有大量數(shù)據(jù)載入訂單實(shí)體,其他實(shí)體只有少量數(shù)據(jù)載入因此需要一種有別于傳統(tǒng)ER圖的數(shù)據(jù)模型來(lái)描述某個(gè)

8、實(shí)體需載入大量數(shù)據(jù)的結(jié)構(gòu)星形模型就是這樣的模型之一。CH2 一個(gè)星形模型包含一個(gè)對(duì)應(yīng)于某個(gè)主題的事實(shí)表和若干個(gè)非正規(guī)化描述事實(shí)的維表。星形模型具有以下特性: 事實(shí)表的數(shù)據(jù)描述特定的商務(wù)事件,一 般可以添加不許修改; 維表存放事實(shí)表中數(shù)據(jù)的特征值,利用 維關(guān)鍵字通過(guò)事實(shí)表的外鍵約束于事實(shí) 表的某一行,因此,事實(shí)表的外鍵不許 為空(一般DB則可)優(yōu)點(diǎn)?; 每個(gè)維表通過(guò)一個(gè)主鍵與事實(shí)表鏈接; 通過(guò)事實(shí)表可以關(guān)聯(lián)各個(gè)維表。CH2 雪花模型 雪花模型是對(duì)星形模型的擴(kuò)展每個(gè)維表均可向外鏈接多個(gè)詳細(xì)類別表,以對(duì)事實(shí)表進(jìn)行詳細(xì)描述減小了事實(shí)表。CH2注: 雪花模型中, 維表被標(biāo)準(zhǔn)化、正規(guī)化了改善了 查詢的性能

9、; 由于采用了標(biāo)準(zhǔn)化以及低粒度,所以 雪花模型提高了數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用的靈活 性。CH23 邏輯模型 邏輯模型是三層模型中的中層模型,它是對(duì)高層模型(概念模型)的細(xì)化,如下圖。 CH2 邏輯模型的基本結(jié)構(gòu) 邏輯模型有四種基本結(jié)構(gòu):基本數(shù)據(jù)組、二級(jí)數(shù)據(jù)組、連接數(shù)據(jù)組和類型數(shù)據(jù)組。CH2基本數(shù)據(jù)組 其中存在著唯一的主要主題域?;緮?shù)據(jù)組在每個(gè)主題域中只出現(xiàn)一次,包含屬性和鍵碼。二級(jí)數(shù)據(jù)組 基本數(shù)據(jù)組中,有一組鏈接指向二級(jí)數(shù)據(jù)組,表示主要主題域所具有的屬性,有多少個(gè)屬性就有多少個(gè)二級(jí)數(shù)據(jù)組。CH2連接數(shù)據(jù)組 用于本組主要主題域與其他主要主題域間的關(guān)聯(lián),體現(xiàn)了概念模型中實(shí)體間的聯(lián)系。一般,它是一個(gè)主題的公共

10、碼主鍵。類型數(shù)據(jù)組 用于指明數(shù)據(jù)的類型,主要有超類型和子類型兩種。 除了連接數(shù)據(jù)組外,其他三類數(shù)據(jù)組的數(shù)據(jù)具有不同的穩(wěn)定性,由高到低依次為基本數(shù)據(jù)組、二級(jí)數(shù)據(jù)組、類型數(shù)據(jù)組。CH2 邏輯模型實(shí)例CH2可見(jiàn): 中層(邏輯)模型向用戶提供了更為詳細(xì)的設(shè)計(jì)結(jié)果,用戶能夠借此了解數(shù)據(jù)倉(cāng)庫(kù)可以給他提供一些什么信息; 邏輯模型設(shè)計(jì)中,DW開(kāi)發(fā)者關(guān)心的是DW結(jié)構(gòu)的完整性數(shù)據(jù)倉(cāng)庫(kù)中的所有數(shù)據(jù)元素都應(yīng)該包含在邏輯模型中至于如何獲取數(shù)據(jù),在此并不感興趣。CH2 事實(shí)表模型設(shè)計(jì)A.事實(shí)表的設(shè)計(jì) 確定了中層模型之后,就要設(shè)計(jì)事實(shí)表模型了。例如,根據(jù)上例,可以設(shè)計(jì)出以下事實(shí)模型: 客戶事實(shí)表客戶基本情況表(賬號(hào) int

11、 9,姓名 ch 12,客戶類型 ch 20, 初次交易時(shí)間 date 8,)客戶變動(dòng)情況表(賬號(hào) int 9,住址 ch 50,文化程度 ch 10, 電話 int 11,郵政編碼 ch 6,)CH2 客戶交易事實(shí)表商品交易情況表(賬號(hào) int 9,商品編號(hào) ch 10, 交易量 r 10.2,交易時(shí)間 date 8,)服務(wù)交易情況表(賬號(hào) int 9,服務(wù)時(shí)間 date 8, 服務(wù)編號(hào) int10,服務(wù)費(fèi)用,) 客戶反饋記錄表客戶反饋記錄表(賬號(hào) int 9,反饋類型 ch 5, 反饋內(nèi)容 memo,記錄人 ch 8,) 客戶信用狀況表客戶信用狀況表(賬號(hào) int 9,最大信用額 r 15

12、.2, 最近信用發(fā)生時(shí)間 date 8,)CH2B.事實(shí)表中的事實(shí)特性 事實(shí)指標(biāo)的可加性; 完全可加性,半可加性,非可加性 派生事實(shí) 可加性的派生事實(shí),不可加性的派生事實(shí) 總之,事實(shí)表是DW中的最大表,要盡可能設(shè)計(jì)得?。ㄋ伎迹耗男┓椒??),同時(shí)還要考慮數(shù)據(jù)的精度和粒度。CH2 維模型設(shè)計(jì) 維,是人們觀察某個(gè)數(shù)據(jù)集合的特定角度,是以對(duì)數(shù)據(jù)某個(gè)共性的提取為前提的。例如,前例中,可設(shè)計(jì)出客戶主題的維表模型如下: 時(shí)間維表(年 date,月 date,日 date); 地點(diǎn)維表(省 ch 20,市 ch 20,縣 ch 20,街道 ch 20); 交易維表(現(xiàn)金交易 ch 20,信用交易 ch 20)

13、 關(guān)于維的討論,將在OLAP一章進(jìn)行。CH24 物理模型所謂物理模型,就是中層(邏輯)模型(包括事實(shí)表和維表)的物理實(shí)現(xiàn)。具體包括以下內(nèi)容: 確定存儲(chǔ)結(jié)構(gòu)(一般用RAID); 確定索引類型(位圖/廣義索引); 物理模型的優(yōu)化(表合并,建立數(shù)據(jù)序列,引入冗余,表的物理分割,生成衍生數(shù)據(jù)等)。RAID是“Redundant Array of Independent Disk”的縮寫(xiě),中文意思是獨(dú)立冗余磁盤(pán)陣列。 CH2 實(shí)際應(yīng)用中,DW設(shè)計(jì)者不必直接設(shè)計(jì)物理模型,只需借助于現(xiàn)成的工具(如,某個(gè)DBMS)設(shè)計(jì)即可。此時(shí),需考慮的問(wèn)題有: 全面了解所選用的DBMS,特別是其存儲(chǔ)結(jié)構(gòu)和存取方法; 了解數(shù)

14、據(jù)環(huán)境、數(shù)據(jù)的使用頻度、使用方式、數(shù)據(jù)規(guī)模以及響應(yīng)時(shí)間要求等平衡、優(yōu)化時(shí)間和空間效率的重要依據(jù); 了解外部存儲(chǔ)設(shè)備的特性,如分塊原則,塊大小的規(guī)定,設(shè)備的IO特性等。 CH25 元數(shù)據(jù)模型 DW中元數(shù)據(jù)定義了許多對(duì)象表、列、查詢、商業(yè)規(guī)則以及DW內(nèi)部的數(shù)據(jù)轉(zhuǎn)移等。 元數(shù)據(jù)是DW的重要構(gòu)件,是DW的指示圖。 一般,元數(shù)據(jù)的來(lái)源有: 數(shù)據(jù)源的元數(shù)據(jù); 數(shù)據(jù)模型的元數(shù)據(jù); 數(shù)據(jù)源與數(shù)據(jù)倉(cāng)庫(kù)映射的元數(shù)據(jù); 數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用的元數(shù)據(jù)。CH2 元數(shù)據(jù)的類型與組成 元數(shù)據(jù)通常分為靜態(tài)元數(shù)據(jù)和動(dòng)態(tài)元數(shù)據(jù)兩類,其組成如下表所示: 靜態(tài)元數(shù)據(jù)名稱描述格式數(shù)據(jù)類型關(guān)系生成時(shí)間來(lái)源索引類別域業(yè)務(wù)規(guī)則動(dòng)態(tài)元數(shù)據(jù)入庫(kù)時(shí)間更新

15、周期數(shù)據(jù)質(zhì)量統(tǒng)計(jì)信息狀態(tài)處理存儲(chǔ)位置存儲(chǔ)大小引用處CH2 元數(shù)據(jù)的作用A.元數(shù)據(jù)的重要性 導(dǎo)航(DW的使用); 描述并記錄數(shù)據(jù)從業(yè)務(wù)系統(tǒng)的操作型環(huán)境到DW的轉(zhuǎn)換,以便利用其(靈活地、可變地)管理數(shù)據(jù)的轉(zhuǎn)換以及進(jìn)行數(shù)據(jù)回溯等。 管理數(shù)據(jù),包括:粒度劃分、數(shù)據(jù)分割、索引;不同時(shí)期的數(shù)據(jù)內(nèi)容及形式;主題的增加及刪除這些管理工作均需在元數(shù)據(jù)中有相應(yīng)的描述。CH2B.元數(shù)據(jù)在DW開(kāi)發(fā)期間的作用 DW的應(yīng)用管理,比如,捕獲數(shù)據(jù)轉(zhuǎn)化、凈化、概括、聚集的規(guī)則(商業(yè)規(guī)則與處理規(guī)則)等; 向用戶提供大量的數(shù)據(jù)關(guān)系; 從歷史數(shù)據(jù)抽取數(shù)據(jù)的規(guī)則; 存儲(chǔ)抽取、求精、重構(gòu)過(guò)程中數(shù)據(jù)源到DW的映射關(guān)系(以便確認(rèn)數(shù)據(jù)質(zhì)量、實(shí)

16、現(xiàn)同步化及刷新、建立數(shù)據(jù)與商業(yè)規(guī)則間的映射關(guān)系)。CH2C.元數(shù)據(jù)在數(shù)據(jù)抽取中的作用 確定數(shù)據(jù)源 每個(gè)主題源于哪些數(shù)據(jù)源; 跟蹤歷史數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)的變化 保證各個(gè)時(shí)期的歷史數(shù)據(jù)可以正確地轉(zhuǎn)換到DW中; 實(shí)現(xiàn)屬性到屬性的映射 元數(shù)據(jù)的屬性信息可以保證多個(gè)數(shù)據(jù)源的相同數(shù)據(jù)映射到一起; 屬性的轉(zhuǎn)換。CH2D.元數(shù)據(jù)在求精與重構(gòu)中的作用 數(shù)據(jù)的分割 以元數(shù)據(jù)形式(下同)保存分割方案; 數(shù)據(jù)的概括 保存概括中的數(shù)據(jù)關(guān)系; 預(yù)算與推導(dǎo) 保存預(yù)算與推導(dǎo)的算法; 轉(zhuǎn)換與再映射 保存(從關(guān)系模型到星形或雪花型模型的)轉(zhuǎn)換與再映射的方案。CH2 元數(shù)據(jù)的收集A.數(shù)據(jù)源元數(shù)據(jù) 可以通過(guò)程序自動(dòng)掃描(數(shù)據(jù)源物理結(jié)構(gòu)以

17、及表結(jié)構(gòu))或手工方式獲得。一般,手工獲得的量較少,可容易地編輯成文檔。B.數(shù)據(jù)模型元數(shù)據(jù) 元數(shù)據(jù)庫(kù)中保存DW數(shù)據(jù)模型; 保存企業(yè)數(shù)據(jù)模型及元數(shù)據(jù)與DW數(shù)據(jù)模型的映射關(guān)系; 把數(shù)據(jù)源元數(shù)據(jù)移入DW元數(shù)據(jù)庫(kù)。CH2 從數(shù)據(jù)模型收集元數(shù)據(jù),可借助于CASE工具自動(dòng)實(shí)現(xiàn),但重要的數(shù)據(jù)模型與元數(shù)據(jù)的對(duì)應(yīng)關(guān)系的確認(rèn),最好通過(guò)手工方式完成。C.數(shù)據(jù)源與數(shù)據(jù)倉(cāng)庫(kù)映射的元數(shù)據(jù) 該映射包括抽取、轉(zhuǎn)換、加載等過(guò)程。 若手工完成,則需以數(shù)據(jù)庫(kù)或電子表格方式定義上述映射并存于元數(shù)據(jù)庫(kù)中; 若由DW開(kāi)發(fā)工具完成,則,除了把映射存于元數(shù)據(jù)庫(kù)之外,還要提供訪問(wèn)該映射的方式與工具。CH2D.數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用的元數(shù)據(jù) 元數(shù)據(jù)模型構(gòu)造

18、中最后、最困難、最重要的內(nèi)容。 其主要工作是:確定DW中各個(gè)使用對(duì)象被使用的頻率高頻率者,可建立數(shù)據(jù)集市或增加概括數(shù)據(jù);低頻率者,可釋放相應(yīng)的概括、聚集數(shù)據(jù),回收它們占據(jù)的磁盤(pán)空間。 上述工作一般通過(guò)手工方式完成。CH26 粒度模型 所謂粒度,可定義成DW記錄數(shù)據(jù)/對(duì)數(shù)據(jù)進(jìn)行綜合時(shí)使用的時(shí)間段參數(shù) 該參數(shù)越小,粒度級(jí)別越低,數(shù)據(jù)越詳細(xì); 反之,粒度級(jí)別越高, 數(shù)據(jù)也越綜合(細(xì)節(jié)損失得也越多)。 根據(jù)粒度的劃分標(biāo)準(zhǔn), 可以將數(shù)據(jù)劃分為:詳細(xì)數(shù)據(jù)、輕度總結(jié)、高度總結(jié) 三級(jí)或更多級(jí)粒度。 粒度的具體劃分將直接影響到數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)量以及查詢質(zhì)量。 CH2 數(shù)據(jù)粒度的劃分 最低級(jí)別的粒度可定義成數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)細(xì)節(jié)的最低層次,如事務(wù)層次。這種數(shù)據(jù)層次是高度細(xì)節(jié)化的,能使用戶按所需的任何層次進(jìn)行匯總,但它受外存空間以及響應(yīng)時(shí)間的制約。 涉及到時(shí)間和空間,自然與各個(gè)表的“體積”以及索引文

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論