數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)方式及其比較_第1頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)方式及其比較_第2頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)方式及其比較_第3頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)方式及其比較_第4頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)方式及其比較_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)方式及其比較數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)方式及其比較傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)一般采用二維數(shù)表的形式來(lái)表示數(shù)據(jù),一個(gè)維是行,另一個(gè)維是列,行和列的交叉處就是數(shù)據(jù)元素。關(guān)系數(shù)據(jù)的基礎(chǔ)是關(guān)系數(shù)據(jù)庫(kù)模型,通過(guò)標(biāo)準(zhǔn)的SQL語(yǔ)言來(lái)加以實(shí)現(xiàn)。數(shù)據(jù)倉(cāng)庫(kù)是多維維數(shù)據(jù)庫(kù),它它擴(kuò)展了關(guān)系系數(shù)據(jù)庫(kù)模型型,以星形架架構(gòu)為主要結(jié)結(jié)構(gòu)方式的,并并在它的基礎(chǔ)礎(chǔ)上,擴(kuò)展出出理論雪花形形架構(gòu)和數(shù)據(jù)據(jù)星座等方式式,但不管是是哪一種架構(gòu)構(gòu),維度表、事事實(shí)表和事實(shí)實(shí)表中的量度度都是必不可可少的組成要要素。下面解解析由這些要要素構(gòu)成的數(shù)數(shù)據(jù)倉(cāng)庫(kù)的架架構(gòu)方式。1星形架構(gòu)星形模型是最常常用的數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)設(shè)計(jì)結(jié)構(gòu)構(gòu)的實(shí)現(xiàn)模式式,它使數(shù)據(jù)據(jù)倉(cāng)庫(kù)形成了了一

2、個(gè)集成系系統(tǒng),為最終終用戶提供報(bào)報(bào)表服務(wù),為為用戶提供分分析服務(wù)對(duì)象象。星形模式式通過(guò) 使用用一個(gè)包含主主題的事實(shí)表表和多個(gè)包含含事實(shí)的非正正規(guī)化描述的的維度表來(lái)支支持各種決策策查詢。星形形模型可以采采用關(guān)系型數(shù)數(shù)據(jù)庫(kù)結(jié)構(gòu),模模型的核心是是事實(shí)表,圍圍繞事實(shí)表 的是維度表表。通過(guò)事實(shí)實(shí)表將各種不不同的維度表表連接起來(lái),各各個(gè)維度表都都連接到中央央事實(shí)表。維維度表中的對(duì)對(duì)象通過(guò)事實(shí)實(shí)表與另一維維度表中的對(duì)對(duì)象相關(guān)聯(lián)這這樣就能建立立各 個(gè)維度度表對(duì)象之間間的聯(lián)系。每每一個(gè)維度表表通過(guò)一個(gè)主主鍵與事實(shí)表表進(jìn)行連接,如如圖3-100所示。圖3-10 星形架構(gòu)示示意圖事實(shí)表主要包含含了描述特定定商業(yè)事件

3、的的數(shù)據(jù),即某某些特定商業(yè)業(yè)事件的度量量值。一般情情況下,事實(shí)實(shí)表中的數(shù)據(jù)據(jù)不允許修改改,新的數(shù)據(jù)據(jù)只是簡(jiǎn)單地地添加進(jìn)事實(shí)實(shí)表 中,維維度表主要包包含了存儲(chǔ)在在事實(shí)表中數(shù)數(shù)據(jù)的特征數(shù)數(shù)據(jù)。每一個(gè)個(gè)維度表利用用維度關(guān)鍵字字通過(guò)事實(shí)表表中的外鍵約約束于事實(shí)表表中的某一行行,實(shí)現(xiàn)與事事實(shí)表的關(guān)聯(lián)聯(lián),這就要 求事實(shí)表中中的外鍵不能能為空,這與與一般數(shù)據(jù)庫(kù)庫(kù)中外鍵允許許為空是不同同的。這種結(jié)結(jié)構(gòu)使用戶能能夠很容易地地從維度表中中的數(shù)據(jù)分析析開(kāi)始,獲得得維度關(guān)鍵字字,以便連接接到中 心的的事實(shí)表,進(jìn)進(jìn)行查詢,這這樣就可以減減少在事實(shí)表表中掃描的數(shù)數(shù)據(jù)量,以提提高查詢性能能。在AdventtureWoork

4、sDWW數(shù)據(jù)倉(cāng)庫(kù)中中,若以網(wǎng)絡(luò)絡(luò)銷售數(shù)據(jù)為為事實(shí)表,把把與網(wǎng)絡(luò)銷售售相關(guān)的多個(gè)個(gè)商業(yè)角度(如如產(chǎn)品、時(shí)間間、顧客、銷銷售區(qū)域和促促銷 手段等等)作為維度度來(lái)衡量銷售售狀況,則這這些表在數(shù)據(jù)據(jù)倉(cāng)庫(kù)中的構(gòu)構(gòu)成如圖3-11所示,可可見(jiàn)這幾個(gè)表表在數(shù)據(jù)倉(cāng)庫(kù)庫(kù)中是以星形形模型來(lái)架構(gòu)構(gòu)的。星形模式雖然是是一個(gè)關(guān)系模模型,但是它它不是一個(gè)規(guī)規(guī)范化的模型型。在星形模模式中,維度度表被故意地地非規(guī)范化了了,這是星形形模式與OLLTP系統(tǒng)中中關(guān)系模式的的基本區(qū)別。 使用星形模式主主要有兩方面面的原因:提提高查詢的效效率。采用星星形模式設(shè)計(jì)計(jì)的數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的優(yōu)點(diǎn)是由由于數(shù)據(jù)的組組織已經(jīng)過(guò)預(yù)預(yù)處理,主要要數(shù)據(jù)都在龐龐大

5、的事實(shí)表表中, 所以以只要掃描事事實(shí)表就可以以進(jìn)行查詢,而而不必把多個(gè)個(gè)龐大的表聯(lián)聯(lián)接起來(lái),查查詢?cè)L問(wèn)效率率較高,同時(shí)時(shí)由于維表一一般都很小,甚甚至可以放在在高速緩存中中,與事實(shí)表表進(jìn)行連 接接時(shí)其速度較較快,便于用用戶理解;對(duì)對(duì)于非計(jì)算機(jī)機(jī)專業(yè)的用戶戶而言,星形形模式比較直直觀,通過(guò)分分析星形模式式,很容易組組合出各種查查詢。圖3-11 AdvenntureWWorksDDW數(shù)據(jù)倉(cāng)庫(kù)庫(kù)中部分表構(gòu)構(gòu)成的星形架架構(gòu)2雪花形架構(gòu)構(gòu)雪花模型是對(duì)星星形模型的擴(kuò)擴(kuò)展,每一個(gè)個(gè)維度都可以以向外連接多多個(gè)詳細(xì)類別別表。在這種種模式中,維維度表除了具具有星形模型型中維度表的的功能外,還還連接對(duì)事實(shí)實(shí)表進(jìn) 行詳

6、詳細(xì)描述的詳詳細(xì)類別表,詳詳細(xì)類別表通通過(guò)對(duì)事實(shí)表表在有關(guān)維上上的詳細(xì)描述述達(dá)到了縮小小事實(shí)表和提提高查詢效率率的目的,如如圖3-122所示。雪花模型對(duì)星形形模型的維度度表進(jìn)一步標(biāo)標(biāo)準(zhǔn)化,對(duì)星星形模型中的的維度表進(jìn)行行了規(guī)范化處處理。雪花模模型的維度表表中存儲(chǔ)了正正規(guī)化的數(shù)據(jù)據(jù),這種結(jié)構(gòu)構(gòu)通過(guò)把多個(gè)個(gè)較小 的標(biāo)標(biāo)準(zhǔn)化表(而而不是星形模模型中的大的的非標(biāo)準(zhǔn)化表表)聯(lián)合在一一起來(lái)改善查查詢性能。由由于采取了標(biāo)標(biāo)準(zhǔn)化及維的的低粒度,雪雪花模型提高高了數(shù)據(jù)倉(cāng)庫(kù)庫(kù)應(yīng)用的靈活活性。這些連接需要花花費(fèi)相當(dāng)多的的時(shí)間。一般般來(lái)說(shuō),一個(gè)個(gè)雪花形圖表表要比一個(gè)星星形圖表效率率低。在AdventtureWoorks

7、DWW數(shù)據(jù)倉(cāng)庫(kù)中中,以圖3-11的架構(gòu)構(gòu)圖為基礎(chǔ),可可以擴(kuò)展出雪雪花模型的架架構(gòu),“DiimProdduct”表表有一個(gè)詳細(xì)細(xì)類 別表“DimProductSubcategory”,而“DimCustomer”表也有一個(gè)表示客戶地區(qū)的表“DimGeograph”表作為其詳細(xì) 類別表,將它們加入數(shù)據(jù)倉(cāng)庫(kù)后,整個(gè)數(shù)據(jù)倉(cāng)庫(kù)就是雪花形架構(gòu),如圖3-13所示。 錯(cuò)誤!圖3-12 雪花模型架架構(gòu)示意圖圖3-13 AdvenntureWWorksDDW數(shù)據(jù)倉(cāng)庫(kù)庫(kù)中部分表構(gòu)構(gòu)成的雪花形形架構(gòu)3星形與雪花花形架構(gòu)的比比較在3.1節(jié)的討討論中可以得得知,在數(shù)據(jù)據(jù)倉(cāng)庫(kù)中表與與表之間是不不必滿足3個(gè)個(gè)范式的,也也不必

8、考慮數(shù)數(shù)據(jù)冗余,相相反,為了在在分析型查詢?cè)冎蝎@得較好好的性能,數(shù)數(shù)據(jù)倉(cāng) 庫(kù)中中的表還應(yīng)該該盡量集中同同類型的數(shù)據(jù)據(jù),同時(shí)把有有些常見(jiàn)的統(tǒng)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行行合并。按照照這種思想,圖圖3-13中中的“DimmProduuctSubbcateggory” 表和“DiimGeoggraph”表表可以并入“DimProduct”表和“DimGeograph”表中使整個(gè)數(shù)據(jù)倉(cāng)庫(kù)呈現(xiàn)星形架構(gòu),但是微軟在設(shè)計(jì) AdventureWorksDW數(shù)據(jù)倉(cāng)庫(kù)時(shí)并沒(méi)有這樣做,反而在“DimProductSubcategory”表和“DimProduct”表及 “DimGeograph”表和“DimGeograph”表之間

9、設(shè)計(jì)成滿足一定范式要求的結(jié)構(gòu),下面將解釋其原因。標(biāo)準(zhǔn)的關(guān)系數(shù)據(jù)據(jù)表不能滿足足數(shù)據(jù)的分析析能力,所以以對(duì)表進(jìn)行非非標(biāo)準(zhǔn)化處理理以形成數(shù)據(jù)據(jù)倉(cāng)庫(kù)中特有有的星形架構(gòu)構(gòu)方式,但這這樣一來(lái),如如果所有的分分析維度都作作為事 實(shí)表表的一個(gè)直接接維度,數(shù)據(jù)據(jù)的冗余是相相當(dāng)大的,比比如將“DiimProdductSuubcateegory”表表合并到“DDimProoduct”表表中,的確能能形成一 個(gè)個(gè)關(guān)于產(chǎn)品所所有屬性的維維度,但要在在一張表中表表達(dá)產(chǎn)品類別別屬性和產(chǎn)品品的屬性,需需要的存儲(chǔ)空空間是相當(dāng)大大的。由此可可以看出,在在星形架構(gòu)的的基礎(chǔ)上擴(kuò)展展出雪花形架架 構(gòu),實(shí)質(zhì)質(zhì)上是在分析析查詢的性能能和數(shù)

10、據(jù)倉(cāng)庫(kù)庫(kù)的存儲(chǔ)容量量2方面進(jìn)行行權(quán)衡的結(jié)果果。表3-33具體比較了了2種類型的的架構(gòu)差異。只只有明確了這這些差異,才才能在設(shè)計(jì)數(shù)數(shù)據(jù)倉(cāng) 庫(kù)時(shí)時(shí)選擇最合適適的架構(gòu)方式式。表3-3 雪雪花形與星形形層次結(jié)構(gòu)的的差異星 形雪 花 形形行數(shù)多少可讀性容易難表格數(shù)量少多搜索維的時(shí)間快慢4星座模式一個(gè)復(fù)雜的商業(yè)業(yè)智能應(yīng)用往往往會(huì)在數(shù)據(jù)據(jù)倉(cāng)庫(kù)中存放放多個(gè)事實(shí)表表,這時(shí)就會(huì)會(huì)出現(xiàn)多個(gè)事事實(shí)表共享某某一個(gè)或多個(gè)個(gè)維表的情況況,這就是事事實(shí)星座,也也稱為星系模模式(gallaxy sschemaa)。在 AdveentureeWorkssDW數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中有多個(gè)個(gè)事實(shí),為了了便于顯示,取取最重要的22個(gè)事實(shí)表“Fa

11、ctInternetSales”和 “FactResellerSales”作為星座模式的例子。由于對(duì)網(wǎng)絡(luò)銷售和批發(fā)商銷售的分析有很多觀察視角都是相同的,因而這2個(gè)事實(shí)表共享的維度表 較多,比如促銷手段、時(shí)間和產(chǎn)品等。在數(shù)據(jù)庫(kù)關(guān)系圖中把它們的關(guān)系表現(xiàn)出來(lái)后,如圖3-14所示。圖3-14 數(shù)據(jù)倉(cāng)庫(kù)的的事實(shí)星座模模式示例5數(shù)據(jù)集市數(shù)據(jù)集市是在構(gòu)構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的時(shí)候經(jīng)常常用到的一個(gè)個(gè)詞匯。如果果說(shuō)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)是企業(yè)范圍圍的,收集的的是關(guān)于整個(gè)個(gè)組織的主題題,如顧客、商商品、銷售、資資產(chǎn)和人員等等 方面的信信息,那么數(shù)數(shù)據(jù)集市則是是包含企業(yè)范范圍數(shù)據(jù)的一一個(gè)子集,例例如只包含銷銷售主題的信信息,這樣數(shù)數(shù)據(jù)集市只對(duì)對(duì)特定的用戶戶是有用的,其其范圍限于選選定的主題。數(shù)據(jù)集市面向企企業(yè)中的某個(gè)個(gè)部門(或某某個(gè)主題)是是從數(shù)據(jù)倉(cāng)庫(kù)庫(kù)中劃分出來(lái)來(lái)的,這種劃劃分可以是邏邏輯上的,也也可以是物理理上的。例如如在AdveentureeWorkssDW數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中就是邏邏輯上劃分的的數(shù)據(jù)集市。數(shù)據(jù)倉(cāng)庫(kù)中存放放了企業(yè)的整整體信息,而而數(shù)據(jù)集市只只存放了某個(gè)個(gè)主題需要的的信息,其目目的是減少數(shù)數(shù)據(jù)處理量,使使信息的利用用更加快捷和和靈活。數(shù)據(jù)倉(cāng)庫(kù)由于是是企業(yè)范圍的的,能對(duì)多個(gè)個(gè)相關(guān)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論