《聯(lián)機(jī)分析處理OLA》PPT課件_第1頁
《聯(lián)機(jī)分析處理OLA》PPT課件_第2頁
《聯(lián)機(jī)分析處理OLA》PPT課件_第3頁
《聯(lián)機(jī)分析處理OLA》PPT課件_第4頁
《聯(lián)機(jī)分析處理OLA》PPT課件_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1,第3章聯(lián)機(jī)分析處理-OLAP,本章學(xué)習(xí)目標(biāo):通過OLAP技術(shù)概念介紹了解OLAP的發(fā)展和特點(diǎn)。通過多維分析學(xué)習(xí)掌握多維的基本概念。通過OLAP的實(shí)施掌握OLAP實(shí)施方法。通過MOLAP與ROLAP的學(xué)習(xí)掌握MOLAP與ROLAP的概念。通過OLAP技術(shù)評價(jià)學(xué)習(xí)掌握對OLAP技術(shù)的評價(jià)。,2,3.1概述3.2OLAP定義和基本概念3.3OLAP的數(shù)據(jù)模型3.4多維數(shù)據(jù)分析3.5OLAP的結(jié)構(gòu)與分析工具,第3章聯(lián)機(jī)分析處理-OLAP,3,3.1概述,60年代,關(guān)系數(shù)據(jù)庫之父E.F.Codd提出了關(guān)系模型,促進(jìn)了聯(lián)機(jī)事務(wù)處理(OLTP)的發(fā)展(數(shù)據(jù)以表格的形式而非文件方式存儲)。1993年,E.

2、F.Codd提出了多維數(shù)據(jù)庫和多維分析的概念,即OLAP。,4,OLTPVS.OLAP,5,OLAP基本思想,聯(lián)機(jī)分析處理(OnLineAnalysisProcessing,OLAP)在數(shù)據(jù)倉庫系統(tǒng)中,聯(lián)機(jī)分析處理是重要的數(shù)據(jù)分析工具。OLAP的基本思想是從多方面和多角度以多維的形式來觀察企業(yè)的狀態(tài)和了解企業(yè)的變化。OLAP是獨(dú)立于數(shù)據(jù)倉庫的一種技術(shù)概念當(dāng)OLAP與數(shù)據(jù)倉庫結(jié)合時,OLAP的數(shù)據(jù)源為數(shù)據(jù)倉庫,數(shù)據(jù)倉庫的大量數(shù)據(jù)是根據(jù)多維方式組織的。,6,3.2OLAP定義,聯(lián)機(jī)分析處理(OLAP)是一種軟件技術(shù),它使分析人員能夠迅速、一致、交互地從各個方面觀察信息,以達(dá)到深入理解數(shù)據(jù)的目的。這

3、些信息是從原始數(shù)據(jù)轉(zhuǎn)換過來的,按照用戶的理解,它反映了企業(yè)真實(shí)的方方面面。(OLAP理事會),7,OLAP目標(biāo),是滿足決策支持或多維環(huán)境特定的查詢和報(bào)表需求,它的技術(shù)核心是“維”這個概念,因此OLAP也可以說是多維數(shù)據(jù)分析工具的集合。,8,OLAP基本概念,變量:從現(xiàn)實(shí)系統(tǒng)抽象出來的,用于描述數(shù)據(jù)的實(shí)際含義,即描述數(shù)據(jù)“是什么”維:是與某一事件相關(guān)的因素在關(guān)系模型的抽象,是人們觀察數(shù)據(jù)的特定角度。如產(chǎn)品維、顧客維、時間維等。維的層次性:是由觀察數(shù)據(jù)細(xì)致程度不同造成的。如日、月、季、年是時間維的層次。維的取值:即維的成員。如“某年某月某日”是時間維的一個成員。,9,OLAP基本概念,維的分類:按

4、照一定的劃分標(biāo)準(zhǔn)對維的所有取值集合的一個分類劃分,用于數(shù)據(jù)鉆取和聚合。如上半年、下半年是對時間維的劃分。事實(shí):不同維度在某個取值下的交叉點(diǎn),是對事件的度量。如(牙膏,上海,1998年12月,批發(fā),銷售額為100000)多維數(shù)據(jù)立方體,10,維的例子,一個電子公司的銷售一般從三個方面分析銷售額:時間:在某一段時間內(nèi)的銷售情況,其度量為(年、季度、月、旬、天)地區(qū):在某個地區(qū)的銷售情況,度量可分為(地區(qū)、國家、省、市)產(chǎn)品:某類或某型號產(chǎn)品的銷售情況,度量可分為(類別、型號等)此處,(時間,地區(qū),產(chǎn)品)就構(gòu)成了三個維。維有層次結(jié)構(gòu),可以在某個層上察看數(shù)據(jù)。,11,維的例子,地區(qū)的層次,全國,江蘇,

5、北京,上海,蘇州市,揚(yáng)州市,寶應(yīng)縣,12,維的例子,正好構(gòu)成一個數(shù)據(jù)立方體,可以有更高階的維,但仍然稱為數(shù)據(jù)立方體。,時間,地區(qū),產(chǎn)品,原點(diǎn),13,OLAP數(shù)據(jù)立方體的計(jì)算(物化),數(shù)據(jù)立方體的個數(shù)有產(chǎn)品(type)、城市(city)、日期(date)三個維,則:,0-D(頂點(diǎn))方體,1-D方體,2-D方體,3-D(基本)方體,14,OLAP數(shù)據(jù)立方體的計(jì)算(物化),一般,若有n個維,則立方體個數(shù)是,(city,item,date),(city,item),(city,date),(item,date),(city),(item),(date),all,all表示不對任何維分組,這組形成了該數(shù)

6、據(jù)立方體的方體格,15,OLAP數(shù)據(jù)立方體的計(jì)算(物化),實(shí)際維上有分層,如(年、季度、月、星期、日),所以實(shí)際的立方體個數(shù)是極大的。所以,實(shí)時計(jì)算的工作量極大,但全部事先計(jì)算,則存儲量又極大。方體的選擇計(jì)算:不物化:即不預(yù)先計(jì)算任何“非基本”方體全物化:預(yù)先計(jì)算所有的方體部分物化:在整個可能的方體集中,有選擇地物化一個適當(dāng)?shù)淖蛹贠LAP中一般采用部分物化,應(yīng)考慮三個因素:(1)確定要物化的方體子集;(2)利用查詢處理時物化的方體;(3)在裝入和刷新時,有效地更新物化的方體。,16,3.3OLAP的數(shù)據(jù)模型,3.3.1MOLAP數(shù)據(jù)模型3.3.2ROLAP數(shù)據(jù)模型3.3.3MOLAP與ROL

7、AP的比較3.3.4HOLAP數(shù)據(jù)模型,17,3.3.1MOLAP的數(shù)據(jù)模型,MOLAP是基于多維數(shù)據(jù)庫存儲方式建立的OLAP;表現(xiàn)為“超立方”結(jié)構(gòu),采用類似于多維數(shù)組的結(jié)構(gòu)。例如,二維MDDB(數(shù)組,即矩陣)的數(shù)據(jù)組織見下表,18,3.3.2ROLAP數(shù)據(jù)模型,ROLAP是基于關(guān)系數(shù)據(jù)庫的OLAP。它是一個平面結(jié)構(gòu),用關(guān)系數(shù)據(jù)庫表示多維數(shù)據(jù)時,采用星型模型。,19,3.3.3MOLAP與ROLAP的比較,1.數(shù)據(jù)存取速度2.數(shù)據(jù)存儲的容量3.多維計(jì)算的能力4.維度變化的適應(yīng)性5.數(shù)據(jù)變化的適應(yīng)性6.軟硬件平臺的適應(yīng)性7.元數(shù)據(jù)管理,20,1.數(shù)據(jù)存取速度,ROLAP服務(wù)器需要將SQL語句轉(zhuǎn)化

8、為多維存儲語句,臨時“拼合”出多維數(shù)據(jù)立方體。因此,ROLAP的響應(yīng)時間較長。MOLAP在數(shù)據(jù)存儲速度上性能好,響應(yīng)速度快。,21,2.數(shù)據(jù)存儲的容量,ROLAP使用的傳統(tǒng)關(guān)系數(shù)據(jù)庫的存儲方法,在存儲容量上基本沒有限制。MOLAP通常采用多平面疊加成立體的方式存放數(shù)據(jù)。MOLAP受操作系統(tǒng)平臺中文件大小的限制,當(dāng)數(shù)據(jù)量超過操作系統(tǒng)最大文件長度時,需要進(jìn)行數(shù)據(jù)分割。多維數(shù)據(jù)庫的數(shù)據(jù)量級難以達(dá)到TB級(只能1020G),22,3.多維計(jì)算的能力,MOLAP能夠支持高性能的決策支持計(jì)算。ROLAP無法完成多行的計(jì)算和維之間的計(jì)算。,23,4.維度變化的適應(yīng)性,MOLAP增加新的維度,則多維數(shù)據(jù)庫通常

9、需要重新建立。ROLAP對于維表的變更有很好的適應(yīng)性。,24,5.數(shù)據(jù)變化的適應(yīng)性,當(dāng)數(shù)據(jù)頻繁的變化時,MOLAP需要進(jìn)行大量的重新計(jì)算,甚至重新建立索引乃至重構(gòu)多維數(shù)據(jù)庫。在ROLAP中靈活性較好,對于數(shù)據(jù)變化的適應(yīng)性高。,25,MOLAPVSROLAP,26,3.3.4HOLAP數(shù)據(jù)模型,HOLAP(HybridOLAP),即混和型OLAP介于MOLAP和ROLAP之間。在HOLAP中,對最常用的維度和維層次,使用多維數(shù)據(jù)表來存儲,對于用戶不常用的維度和數(shù)據(jù),采用ROLAP星型結(jié)構(gòu)來存儲。HOLAP得宜于ROLAP的可伸縮性,和MOLAP的快速計(jì)算。(如MSSQLSERVER)在HOLAP

10、的多維數(shù)據(jù)表中的數(shù)據(jù)維度少于MOLAP中的維度表,數(shù)據(jù)存儲容量也少于MOLAP方式。HOLAP在數(shù)據(jù)存取速度上又低于MOLAP。,27,3.4OLAP的基本操作,數(shù)據(jù)切片:多維數(shù)據(jù)是由多個維度組成的,如果在某個維度上選定一個取值,則多維數(shù)據(jù)從n維下降成n-1維數(shù)據(jù)切塊:將完整的數(shù)據(jù)立方體切取一部分?jǐn)?shù)據(jù)而得到的新的數(shù)據(jù)立方體。數(shù)據(jù)鉆取(下鉆):從較高的維度層次下降到較低的維度層次上來觀察多維數(shù)據(jù)數(shù)據(jù)聚合(上卷):對數(shù)據(jù)進(jìn)行高層次綜合的操作數(shù)據(jù)旋轉(zhuǎn):改變維度的位置關(guān)系,使最終用戶可從其他視角來觀察多維數(shù)據(jù)。,28,基本操作示例,以“城市、產(chǎn)品、時間”三維數(shù)據(jù)為例,如下圖,29,20,29,40,3

11、5,時間,產(chǎn)品,地區(qū),一季度,二季度,三季度,四季度,北京,上海,南京,廣州,VCD,手機(jī),電腦,空調(diào),69,(北京,二季度,電腦的銷售額),30,1.切片,對三維數(shù)據(jù),通過“切片”,分別從產(chǎn)品和城市等不同的角度觀察銷售情況:,31,切片示例1,切片(slice):地區(qū)=“北京”意義:北京地區(qū)四個季度空調(diào)、電腦、手機(jī)、VCD的銷售金額,32,切片示例2,切片:產(chǎn)品=“空調(diào)”意義:空調(diào)產(chǎn)品在四個季度中各地區(qū)的銷售金額,33,2.切塊,(1)在多維數(shù)組的某一個維上選定某一區(qū)間的維成員的操作切塊可以看成是在切片的基礎(chǔ)上,確定某一個維成員的區(qū)間得到的片段,也即由多個切片疊合起來。(2)選定多維數(shù)組的一個三維子集的操作在多維數(shù)組(維1,維2,維n,變量)中選定3個維,維i、維j、維k,在這3個維上分別取一個區(qū)間,或任意維成員,而其它維都取定一個維成員。,34,切塊示例,分塊(dice):地區(qū)=“南京”AND“廣州”產(chǎn)品“空調(diào)”AND“手機(jī)”,35,3.鉆取,鉆取有向下鉆?。╠rilldown)和向上鉆取(drillup)操作。向下鉆取是使用戶在多層數(shù)據(jù)中能通過導(dǎo)航信息而獲得更多的細(xì)節(jié)性數(shù)據(jù)。向上鉆取獲取概括性的數(shù)據(jù)。,36,下鉆(drill_down):按時間分到月、甚至天為單位,下鉆,37,上卷(roll_up):按時間上卷到半年為單位,20,29,40,35,時間,產(chǎn)品,地

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論