版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)2023/6/5第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)什么是數(shù)據(jù)倉庫1、需求產(chǎn)生DW使顧客滿意,不斷增加利潤,提高市場份額,這些是目前商業(yè)競爭的基本目標(biāo)。利用IT可以使我們獲得成功。答案之一就是DW:公司的目標(biāo)如何與信息系統(tǒng)結(jié)合;如何建立具有交叉功能的信息系統(tǒng);數(shù)據(jù)的合理組織和利用。
2第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)2、數(shù)據(jù)處理分為兩大類事務(wù)處理:DB聯(lián)機(jī)的日常操作,對一個(gè)或一組記錄的查詢和修改,為企業(yè)服務(wù)。分析型處理:用于管理人員的決策分析。例如DSS、EIS和多維分析,經(jīng)常要訪問大量的歷史數(shù)據(jù)。3第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)3、事務(wù)處理環(huán)境不適宜DSS應(yīng)
用的原因事務(wù)處理和分析處理的性能特性不同數(shù)據(jù)集成問題(DSS需要集成的數(shù)據(jù))a.事務(wù)處理應(yīng)用的分散;b.蜘蛛網(wǎng)問題;
c.數(shù)據(jù)不一致問題;d.外部數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。
數(shù)據(jù)動態(tài)集成問題:數(shù)據(jù)必須以一定的周期進(jìn)行刷新。歷史數(shù)據(jù)問題。在DB中存在大量的歷史數(shù)據(jù),沒有充分利用。
4第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)DW的主要驅(qū)動力是市場競爭要求捕獲和分析事務(wù)的業(yè)務(wù)數(shù)據(jù),必須把分析型數(shù)據(jù)從事務(wù)處理環(huán)境中提取出來;DW是為了建立這種新的分析處理環(huán)境而出現(xiàn)的一種數(shù)據(jù)存儲和組織技術(shù)。4、數(shù)據(jù)綜合5第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)“數(shù)據(jù)倉庫是一個(gè)面向主題的、集成的、時(shí)變的、非易失的數(shù)據(jù)集合,支持管理部門的決策過程”—W.H.Inmon什么是建立數(shù)據(jù)倉庫 我們把建立數(shù)據(jù)倉庫看作是構(gòu)造和使用數(shù)據(jù)倉庫的過程6第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫的面向主題性數(shù)據(jù)倉庫是面向在數(shù)據(jù)模型中已定義好的公司的主要主題領(lǐng)域的,典型的例子有顧客、產(chǎn)品、銷售等數(shù)據(jù)倉庫主要關(guān)注DSS分析員的數(shù)據(jù)建模與分析,而不是集中于組織機(jī)構(gòu)的日常操作和事務(wù)處理數(shù)據(jù)倉庫排除對于決策無用的數(shù)據(jù),提供特定主題的簡明的視圖7第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫的集成性數(shù)據(jù)倉庫是將多個(gè)異種數(shù)據(jù)源的數(shù)據(jù)集成在一起a.異種數(shù)據(jù)源包括有關(guān)系數(shù)據(jù)庫、一般文件和聯(lián)機(jī)事務(wù)處理記錄等數(shù)據(jù)倉庫使用數(shù)據(jù)清理和數(shù)據(jù)集成技術(shù)a.數(shù)據(jù)清理和數(shù)據(jù)集成技術(shù)確保多個(gè)異種數(shù)據(jù)源中命名約定、編碼結(jié)構(gòu)、屬性度量等的一致性b.當(dāng)數(shù)據(jù)從操作型環(huán)境進(jìn)入到數(shù)據(jù)倉庫,已經(jīng)被進(jìn)行過清理和轉(zhuǎn)換8第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫的時(shí)變性數(shù)據(jù)倉庫中的數(shù)據(jù)時(shí)間期限要遠(yuǎn)遠(yuǎn)長于操作型系統(tǒng)中的數(shù)據(jù)時(shí)間期限a.操作型系統(tǒng)含有“當(dāng)前值”數(shù)據(jù),時(shí)間期限一般是60-90天b.數(shù)據(jù)倉庫從歷史的角度提供信息,其中的數(shù)據(jù)僅僅是一系列某一時(shí)刻生成的復(fù)雜的快照,時(shí)間期限通常是5-10年數(shù)據(jù)倉庫中的鍵碼結(jié)構(gòu)a.數(shù)據(jù)倉庫中的關(guān)鍵結(jié)構(gòu),隱式或顯式地包含時(shí)間元素b.操作型系統(tǒng)的鍵碼結(jié)構(gòu)可能不包括時(shí)間元素9第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫是非易失的數(shù)據(jù)倉庫總是物理地、分離存放數(shù)據(jù)數(shù)據(jù)倉庫中不進(jìn)行操作型環(huán)境中的數(shù)據(jù)更新a.數(shù)據(jù)倉庫不需要事務(wù)處理、恢復(fù)和并發(fā)控制機(jī)制b.數(shù)據(jù)倉庫通常只需要兩種數(shù)據(jù)訪問:數(shù)據(jù)的初始化裝入和數(shù)據(jù)訪問10第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)怎樣建立數(shù)據(jù)倉庫
把建立數(shù)據(jù)倉庫看作是構(gòu)造和使用數(shù)據(jù)倉庫的過程主題是對應(yīng)某一分析領(lǐng)域的分析對象DW是一個(gè)用以更好地支持企業(yè)或組織的決策分析處理的、面向主題的、集成的、不可更新的、非易失的數(shù)據(jù)集合11第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)實(shí)現(xiàn)DW要做:
從不同數(shù)據(jù)來源中如何集成數(shù)據(jù)數(shù)據(jù)質(zhì)量:精確和簡煉數(shù)據(jù)的概括和聚集每當(dāng)數(shù)據(jù)源中創(chuàng)建了新數(shù)據(jù)時(shí),如何保證DW和數(shù)據(jù)源的同步更新在同一臺計(jì)算機(jī)和RDB的平臺上,當(dāng)DW的DB和工具共享時(shí)如何保證性能
12第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)DW中的數(shù)據(jù)組織在DW中的數(shù)據(jù)分為四個(gè)級別:早期細(xì)節(jié)級、當(dāng)前細(xì)節(jié)級、輕度綜合級、高度綜合級源數(shù)據(jù)經(jīng)過綜合后,首先進(jìn)入當(dāng)前細(xì)節(jié)級,并根據(jù)具體需要進(jìn)行進(jìn)一步的綜合從而進(jìn)入輕度綜合級及至高度綜合級(以DW中數(shù)據(jù)的四個(gè)基本特征為基礎(chǔ))13第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)14第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)15第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫主要用于集中存放用戶需要分析的歷史數(shù)據(jù)數(shù)據(jù)倉庫的邏輯結(jié)構(gòu):
a.近期基本數(shù)據(jù)層b.歷史數(shù)據(jù)層c.綜合數(shù)據(jù)層(為決策服務(wù))數(shù)據(jù)倉庫的物理結(jié)構(gòu):a.星型結(jié)構(gòu)(一般使用)b.雪花結(jié)構(gòu)16第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫的特征面向主題集成性時(shí)變的非易失的17第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫中的數(shù)據(jù)分類詳細(xì)型數(shù)據(jù)過去詳細(xì)數(shù)據(jù)當(dāng)前詳細(xì)數(shù)據(jù)匯總型數(shù)據(jù)輕度匯總數(shù)據(jù)高度匯總數(shù)據(jù)元數(shù)據(jù)18第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫的主要組成部分?jǐn)?shù)據(jù)源數(shù)據(jù)抽取(Extraction)、轉(zhuǎn)換(Transformation)和裝載(Load)工具。數(shù)據(jù)建模工具核心倉儲(CentralRepository)數(shù)據(jù)倉庫的目標(biāo)數(shù)據(jù)庫前端數(shù)據(jù)訪問和分析工具數(shù)據(jù)倉庫管理工具19第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫的主要特點(diǎn)數(shù)據(jù)倉庫容量可存放TB級別的數(shù)據(jù);獲得快速抽樣算法生成功能強(qiáng)大、容易使用的、高質(zhì)量的報(bào)表;實(shí)現(xiàn)海量數(shù)據(jù)的快速查詢功能;可視化分析良好的、模塊劃的多維分析模型多維模型升級快20第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)什么是OLAP基本概念a.變量b.維c.維的層次:d.維成員e.多維數(shù)組f.數(shù)據(jù)單元(單元格)多維分析的基本分析動作①切片(slice)②切塊(Dice)③旋轉(zhuǎn):改變一個(gè)報(bào)告或頁面顯示的維方向通過OLAP服務(wù)器,將DB中的數(shù)據(jù)抽取和轉(zhuǎn)換為多維數(shù)據(jù)結(jié)構(gòu),以反映用戶所能理解的企業(yè)的真實(shí)的維。21第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)OLTP與OLAP的關(guān)系級比較OLTP面對操作人員和低層管理人員,OLAP面對的決策人員和高層管理人員。數(shù)據(jù)的特點(diǎn):22第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)OLAP產(chǎn)品的十二條評價(jià)準(zhǔn)則準(zhǔn)則1OLAP模型必須提供多維概念視圖準(zhǔn)則2透明性準(zhǔn)則準(zhǔn)則3存取能力準(zhǔn)則準(zhǔn)則4穩(wěn)定的報(bào)表性能準(zhǔn)則5客戶/服務(wù)器體系結(jié)構(gòu)準(zhǔn)則6維的等同性準(zhǔn)則準(zhǔn)則7動態(tài)的稀疏矩陣處理準(zhǔn)則準(zhǔn)則8多用戶支持能力準(zhǔn)則準(zhǔn)則9非管理的跨維操作準(zhǔn)則10直觀的數(shù)據(jù)操縱準(zhǔn)則11靈活的報(bào)表生成準(zhǔn)則12不受限維與聚集層次23第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)OLAP的三層客戶/服務(wù)器24第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)基于多維數(shù)據(jù)庫的OLAP實(shí)現(xiàn)
多維數(shù)據(jù)
維的層次關(guān)系和類維類維的層次和類的區(qū)別:時(shí)間序列數(shù)據(jù)類型多維DB存儲MDDB存取25第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)基于RDB的OLAP實(shí)現(xiàn)OLAP數(shù)據(jù)處理的一般過程:即數(shù)據(jù)裝入、匯總、建索引和提供使用。OLAP的特點(diǎn)OLAP最重要的特點(diǎn)是具有多維概念視圖,這也常常被稱作多維數(shù)據(jù)模型MDM,把業(yè)務(wù)過程轉(zhuǎn)為一個(gè)多維模型的過程稱為多維建模。OLAP技術(shù)主要使用的是事實(shí)表、分維表、層次、稀疏性等概念和方法。26第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫和異種DBMS數(shù)據(jù)集成的區(qū)別傳統(tǒng)的異種數(shù)據(jù)庫的數(shù)據(jù)集成:在多個(gè)異種數(shù)據(jù)庫上建立一個(gè)包裝程序和一個(gè)集成程序(或中介程序)查詢驅(qū)動的方法數(shù)據(jù)倉庫使用高效的更新驅(qū)動方法將來自多個(gè)異種數(shù)據(jù)源的信息預(yù)先集成,并儲存在數(shù)據(jù)倉庫中,供直接查詢和分析27第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)OLTP系統(tǒng)和OLAP系統(tǒng)的比較28第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)為什么需要一個(gè)分離的數(shù)據(jù)倉庫?分離的主要原因是提高兩個(gè)系統(tǒng)的性能DBMS—適用于OLTP處理:數(shù)據(jù)倉庫—適用于OLAP處理:兩種系統(tǒng)中數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容和用法都不相同數(shù)據(jù)內(nèi)容:決策支持系統(tǒng)需要?dú)v史數(shù)據(jù),而操作數(shù)據(jù)庫一般不維護(hù)歷史數(shù)據(jù)數(shù)據(jù)的統(tǒng)一性:決策支持需要將來自異種數(shù)據(jù)源的數(shù)據(jù)統(tǒng)一(如聚集和匯總),產(chǎn)生高質(zhì)量的集成數(shù)據(jù)數(shù)據(jù)質(zhì)量:異種數(shù)據(jù)源中的數(shù)據(jù)通常具有不同的數(shù)據(jù)表示法,不同的編碼機(jī)制和格式,數(shù)據(jù)倉庫將其統(tǒng)一,能產(chǎn)生高質(zhì)量的、純凈的集成數(shù)據(jù)29第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)第2章 數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)什么是數(shù)據(jù)倉庫?
多維數(shù)據(jù)模型數(shù)據(jù)倉庫的系統(tǒng)結(jié)構(gòu)數(shù)據(jù)倉庫的實(shí)現(xiàn)數(shù)據(jù)立方體技術(shù)的進(jìn)一步發(fā)展從數(shù)據(jù)倉庫到數(shù)據(jù)挖掘30第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)由表和電子數(shù)據(jù)表到數(shù)據(jù)立方體數(shù)據(jù)倉庫和OLAP工具基于多維數(shù)據(jù)模型,該模型將數(shù)據(jù)看作數(shù)據(jù)立方體形式一個(gè)數(shù)據(jù)立方體,比如商店的銷售,允許以多維對數(shù)據(jù)建模和觀察例如item(item_name,brand,type),time(day,week,month,quarter,year)稱為維表,關(guān)聯(lián)維item和time事實(shí)表包括事實(shí)的名稱或度量(比如dollars_sold),以及每個(gè)相關(guān)維表的關(guān)鍵字在數(shù)據(jù)倉庫研究文獻(xiàn)中,存放最低層匯總數(shù)據(jù)的方體稱為基本方體。0-維方體存放最高層的匯總數(shù)據(jù),稱作頂點(diǎn)方體。方體的格稱為數(shù)據(jù)立方體31第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)立方體:方體的格alltimeitemlocationsuppliertime,itemtime,locationtime,supplieritem,locationitem,supplierlocation,suppliertime,item,locationtime,item,suppliertime,location,supplieritem,location,suppliertime,item,location,supplier0-D(頂點(diǎn))方體1-D方體2-D方體3-D方體4-D(基本)方體32第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫的概念建模數(shù)據(jù)倉庫的建模:按維和度量星型模式:模式圖很像星星爆發(fā),維表圍繞事實(shí)表顯示在射線上雪花模式:雪花模式是星型模式的變種,其中某些維表是規(guī)范化的,把數(shù)據(jù)進(jìn)一步分解到附加的表中,形成類似于雪花的形狀事實(shí)星座:多個(gè)事實(shí)表共享維表,這種模式可以看作星型模式集,因此也可以稱為星系模式,或者事實(shí)星座33第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)星型模式的例子
time_keydayday_of_the_weekmonthquarteryeartime維表location_keystreetcityprovince_or_streetcountrylocation維表Sales事實(shí)表time_keyitem_keybranch_keylocation_keyunits_solddollars_soldavg_sales各種度量item_keyitem_namebrandtypesupplier_typeitem維表branch_keybranch_namebranch_typebranch維表34第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)雪花模式的例子time_keydayday_of_the_weekmonthquarteryeartime維表location_keystreetcity_keylocation維表Sales事實(shí)表time_keyitem_keybranch_keylocation_keyunits_solddollars_soldavg_sales各種度量item_keyitem_namebrandtypesupplier_keyitem維表branch_keybranch_namebranch_typebranch維表supplier_keysupplier_typesupplier維表city_keycityprovince_or_streetcountrycity維表35第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)事實(shí)星座的度量time_keydayday_of_the_weekmonthquarteryeartime維表location_keystreetcityprovince_or_streetcountrylocation維表Sales事實(shí)表time_keyitem_keybranch_keylocation_keyunits_solddollars_soldavg_sales各種度量item_keyitem_namebrandtypesupplier_typeitem維表branch_keybranch_namebranch_typebranch維表Shipping事實(shí)表time_keyitem_keyshipper_keyfrom_locationto_locationdollars_costunits_shippedshipper_keyshipper_namelocation_keyshipper_typeshipper維表36第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)挖掘查詢語言DMQL立方體定義(對應(yīng)事實(shí)表)definecube<cube_name>[<dimension_list>]:<measure_list>維定義(對應(yīng)維表)definedimension<dimension_name>as(<attribute_or_subdimension_list>)特殊情況(共享的維表)先定義數(shù)據(jù)立方體definedimension<dimension_name>as<dimension_name_first_time>incube<cube_name_first_time>37第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)用DMQL定義星型模式definecubesales_star[time,item,branch,location]:dollars_sold=sum(sales_in_dollars),avg_sales=avg(sales_in_dollars),units_sold=count(*)definedimensiontimeas(time_key,day,day_of_week,month,quarter,year)definedimensionitemas(item_key,item_name,brand,type,supplier_type)definedimensionbranchas(branch_key,branch_name,branch_type)definedimensionlocationas(location_key,street,city,province_or_state,country)38第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)用DMQL定義雪花模式definecubesales_snowflake[time,item,branch,location]:dollars_sold=sum(sales_in_dollars),avg_sales=avg(sales_in_dollars),units_sold=count(*)definedimensiontimeas(time_key,day,day_of_week,month,quarter,year)definedimensionitemas(item_key,item_name,brand,type,supplier(supplier_key,supplier_type))definedimensionbranchas(branch_key,branch_name,branch_type)definedimensionlocationas(location_key,street,city(city_key,province_or_state,country))39第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)用DMQL定義事實(shí)星座definecubesales[time,item,branch,location]:dollars_sold=sum(sales_in_dollars),avg_sales=avg(sales_in_dollars),units_sold=count(*)definedimensiontimeas(time_key,day,day_of_week,month,quarter,year)definedimensionitemas(item_key,item_name,brand,type,supplier_type)definedimensionbranchas(branch_key,branch_name,branch_type)definedimensionlocationas(location_key,street,city,province_or_state,country)definecubeshipping[time,item,shipper,from_location,to_location]:dollar_cost=sum(cost_in_dollars),unit_shipped=count(*)definedimensiontimeastimeincubesalesdefinedimensionitemasitemincubesalesdefinedimensionshipperas(shipper_key,shipper_name,locationaslocationincubesales,shipper_type)definedimensionfrom_locationaslocationincubesalesdefinedimensionto_locationaslocationincubesales40第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)度量的分類和計(jì)算分布的:設(shè)數(shù)據(jù)被劃分為n個(gè)集合,函數(shù)在每一部分上的計(jì)算得到一個(gè)聚集值,如果將函數(shù)用于n個(gè)聚集值得到的結(jié)果,與將函數(shù)用于所有數(shù)據(jù)得到的結(jié)果一樣,則該函數(shù)可以用分布方式計(jì)算,該聚集函數(shù)是分布的E.g.,count(),sum(),min(),max().41第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)代數(shù)的:
一個(gè)聚集函數(shù)是代數(shù)的,如果它能夠由一個(gè)具有M個(gè)參數(shù)的代數(shù)函數(shù)計(jì)算(其中M是一個(gè)有界整數(shù)),而每個(gè)參數(shù)都可以用一個(gè)分布聚集函數(shù)得到E.g.,
avg(),min_N(),standard_deviation().42第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)整體的:一個(gè)聚集函數(shù)是整體的,如果描述它的子聚集所需的存儲沒有一個(gè)常數(shù)界E.g.,median(),mode(),rank().43第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)概念分層allEuropeNorth_AmericaMexicoCanadaSpainGermanyVancouverM.WindL.Chan..................allregionofficecountryTorontoFrankfurtcity44第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫概念分層視圖45第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)概念分層分類模式分層day<{month<quarter;week}<year集合分組分層{1..10}<inexpensive46第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)多維數(shù)據(jù)模型數(shù)據(jù)立方體sales中每格的度量可以看作是關(guān)聯(lián)Product、Region和Month的函數(shù)ProductRegionMonth涉及的維:Product,Location,Time屬性的層次結(jié)構(gòu)和格結(jié)構(gòu)IndustryRegionYearCategoryCountryQuarterProductCityMonthWeekOfficeDay47第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)立方體樣本全年度美國電視機(jī)的銷售量DateProductCountryAll,All,Allsumsum
TVVCRPC1Qtr2Qtr3Qtr4QtrU.S.ACanadaMexicosum48第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)立方體中不同匯總級相應(yīng)的方體allproductdatecountryproduct,dateproduct,countrydate,countryproduct,date,country0-D(頂點(diǎn))方體1-D方體2-D方體3-D(基本)方體49第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)立方體覽圖可視化適合OLAP操作交互式操作50第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)典型的OLAP操作上卷(上鉆):數(shù)據(jù)的匯總通過一個(gè)維的概念分層向上攀升或者通過維歸約來實(shí)現(xiàn)下鉆(下卷):上卷的逆操作通過沿維的概念分層由高粒度向下下鉆到低粒度的層次或者通過引入新的維來實(shí)現(xiàn)切片和切塊:
映射和選擇
51第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)轉(zhuǎn)軸(旋轉(zhuǎn)):
轉(zhuǎn)動數(shù)據(jù)的視角,是一種目視操作,如將3-D立方轉(zhuǎn)換成2-D平面序列其他OLAP操作鉆過:涉及多個(gè)事實(shí)表的查詢鉆透:鉆到數(shù)據(jù)立方體底層,到達(dá)后端關(guān)系表(使用SQL機(jī)制)52第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)星型網(wǎng)查詢模型
ShippingMethodAIR-EXPRESSTRUCKORDERCustomerOrdersCONTRACTSCustomerProductPRODUCTGROUPPRODUCTLINEPRODUCTITEMSALESPERSONDISTRICTDIVISIONOrganizationPromotionCITYCOUNTRYREGIONLocationDAILYQTRLYANNUALYTime每個(gè)圈稱為一個(gè)腳印53第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)第2章 數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)什么是數(shù)據(jù)倉庫?
多維數(shù)據(jù)模型數(shù)據(jù)倉庫的系統(tǒng)結(jié)構(gòu)數(shù)據(jù)倉庫的實(shí)現(xiàn)數(shù)據(jù)立方體技術(shù)的進(jìn)一步發(fā)展從數(shù)據(jù)倉庫到數(shù)據(jù)挖掘54第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫設(shè)計(jì):一個(gè)商務(wù)分析框架數(shù)據(jù)倉庫的設(shè)計(jì)必須考慮四種不同的視圖自頂向下視圖可以選擇數(shù)據(jù)倉庫所需的相關(guān)信息,這些信息能夠滿足當(dāng)前和未來商務(wù)的需求數(shù)據(jù)源視圖揭示被操作數(shù)據(jù)庫系統(tǒng)捕獲、存儲和管理的信息數(shù)據(jù)倉庫視圖包括事實(shí)表和維表,提供存放在數(shù)據(jù)倉庫內(nèi)部的信息商務(wù)查詢視圖
從最終用戶的角度透視數(shù)據(jù)倉庫中的數(shù)據(jù)55第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫設(shè)計(jì)過程采用自頂向下方法,或者自底向上方法,或者混合方法自頂向下:由總體規(guī)劃和設(shè)計(jì)開始(成熟)自底向上:由實(shí)驗(yàn)和原型開始(快速)從軟件工程的觀點(diǎn)看瀑布式方法:在進(jìn)行下一步之前,每一步都進(jìn)行結(jié)構(gòu)化和系統(tǒng)的分析,像瀑布一樣從一級落到下一級螺旋式方法:涉及功能漸增的系統(tǒng)的快速產(chǎn)生,相繼版本之間的間隔很短,對數(shù)據(jù)集市是一個(gè)好的選擇典型的數(shù)據(jù)倉庫設(shè)計(jì)過程選取待建模的商務(wù)處理,如訂單、發(fā)票、出貨、庫存、記帳等選取商務(wù)處理的粒度(數(shù)據(jù)的原子級),如一天的快照等選取用于每個(gè)事實(shí)表的維選取將安放在事實(shí)表中的度量56第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)多層數(shù)據(jù)倉庫體系結(jié)構(gòu)數(shù)據(jù)倉庫提取轉(zhuǎn)換裝入刷新OLAP服務(wù)器分析查詢報(bào)告數(shù)據(jù)挖掘監(jiān)控&匯總元數(shù)據(jù)前端工具輸出數(shù)據(jù)集市操作數(shù)據(jù)庫外部信息源數(shù)據(jù)源數(shù)據(jù)存儲器OLAP服務(wù)器57第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)三類數(shù)據(jù)倉庫模型企業(yè)倉庫搜集關(guān)于主題的所有信息,跨越整個(gè)組織,通常包括詳細(xì)數(shù)據(jù)和匯總數(shù)據(jù)數(shù)據(jù)集市包含對于特定用戶有用的企業(yè)范圍內(nèi)數(shù)據(jù)的一個(gè)子集,通常包括的數(shù)據(jù)是匯總的。其范圍限于選定的主題,例如商場的顧客、商品和銷售獨(dú)立數(shù)據(jù)集市和依賴數(shù)據(jù)集市(數(shù)據(jù)直接來自企業(yè)倉庫)的區(qū)別虛擬倉庫操作數(shù)據(jù)庫上視圖的集合只有一些可能的匯總視圖被物化58第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫開發(fā)的推薦方法定義高層數(shù)據(jù)模型數(shù)據(jù)集市數(shù)據(jù)集市分布式數(shù)據(jù)集市多層數(shù)據(jù)倉庫企業(yè)數(shù)據(jù)倉庫模型提煉模型提煉59第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)OLAP服務(wù)器類型關(guān)系OLAP(ROLAP)服務(wù)器使用關(guān)系或擴(kuò)充關(guān)系DBMS存放和管理數(shù)據(jù)倉庫,而OLAP中間件支持其余部分多維OLAP(MOLAP)
服務(wù)器通過基于數(shù)組的多維存儲引擎,支持?jǐn)?shù)據(jù)的多維視圖(采用稀疏矩陣技術(shù))混合OLAP(HOLAP)服務(wù)器ROLAP和MOLAP技術(shù)的結(jié)合,有較大的靈活性。特殊的SQL服務(wù)器在星型和雪花模式上支持的特殊SQL查詢60第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)第2章 數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)什么是數(shù)據(jù)倉庫?
多維數(shù)據(jù)模型數(shù)據(jù)倉庫的系統(tǒng)結(jié)構(gòu)數(shù)據(jù)倉庫的實(shí)現(xiàn)數(shù)據(jù)立方體技術(shù)的進(jìn)一步發(fā)展從數(shù)據(jù)倉庫到數(shù)據(jù)挖掘61第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)立方體的有效計(jì)算數(shù)據(jù)立方體可以看作是方體的格最底層的方體稱為基本方體最高層(頂點(diǎn))方體只包含一個(gè)單元一個(gè)具有L層的n維數(shù)據(jù)立方體一共有多少個(gè)方體?數(shù)據(jù)立方體的物化預(yù)先計(jì)算所有方體(全物化),不預(yù)先計(jì)算(不物化),或者有選擇的物化(部分物化)物化方體的選擇考慮存儲需求量、訪問頻率和開銷、工作負(fù)荷的特點(diǎn)等62第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)立方體的計(jì)算用DMQL定義和計(jì)算數(shù)據(jù)立方體definecubesales[item,city,year]:sum(sales_in_dollars)computecubesales轉(zhuǎn)換為類似SQL的語句(使用一種新的操作符cubeby(Grayetal.’96))SELECTitem,city,year,SUM(amount)FROMSALESCUBEBYitem,city,year需要計(jì)算下面的聚集子集
(date,product,customer),(date,product),(date,customer),(product,customer),(date),(product),(customer)()(item)(city)()(year)(city,item)(city,year)(item,year)(city,item,year)63第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)基于ROLAP的數(shù)據(jù)立方體
計(jì)算方法(1)有效率的數(shù)據(jù)立方體計(jì)算方法基于ROLAP的立方體算法(Agarwaletal’96)基于數(shù)組的立方體算法(Zhaoetal’97)自下向上的計(jì)算方法(Bayer&Ramarkrishnan’99)基于ROLAP的立方體算法排序、散列和分組操作用于維屬性,以便對相關(guān)元組重新排序和聚類在某些子聚集上分組,作為“部分分組步驟”可以由以前計(jì)算的聚集計(jì)算新的聚集,而不必由基本事實(shí)表計(jì)算64第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)基于ROLAP的數(shù)據(jù)立方體計(jì)算方法(2)基于散列、排序的方法(Agarwalet.al.
VLDB’96)挑選最小的“父方體”:從以前計(jì)算的方體中挑選最小的方體計(jì)算新的方體存儲計(jì)算結(jié)果:將方體計(jì)算結(jié)果存儲起來,用于其他方體的計(jì)算,有利于減少系統(tǒng)I/O減少掃描:同時(shí)計(jì)算盡可能多的方體,減少讀磁盤次數(shù)共享排序成本:當(dāng)使用基于排序的計(jì)算方法時(shí),合理分配多維立方體上的排序成本共享分割成本:當(dāng)使用基于散列的計(jì)算方法時(shí),合理分配多維立方體上的分割成本65第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)立方體計(jì)算中的
多路數(shù)組聚集(1)將數(shù)組分割成塊(可以放入內(nèi)存的子方)壓縮稀疏數(shù)組結(jié)構(gòu)(使用chunk_id+offset尋址)通過訪問立方體單元計(jì)算聚集??梢詢?yōu)化訪問單元的次序,使得每個(gè)單元必須重復(fù)訪問的次數(shù)最小化,從而減少存儲訪問開銷和存儲開銷在多路數(shù)組聚集中,怎樣確定立方體的最佳訪問途徑?AB29303132123459131415166463626148474645a1a0c3c2c1c0b3b2b1b0a2a3CB44285640245236206066第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)立方體計(jì)算中的
多路數(shù)組聚集(2)AB29303132123459131415166463626148474645a1a0c3c2c1c0b3b2b1b0a2a3C442856402452362060B67第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)立方體計(jì)算中的
多路數(shù)組聚集(3)AB29303132123459131415166463626148474645a1a0c3c2c1c0b3b2b1b0a2a3C442856402452362060B68第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)立方體計(jì)算中的
多路數(shù)組聚集(4)計(jì)算方法:數(shù)據(jù)立方體中各塊平面必須按它們的大小遞增排序和計(jì)算具體請參考P50-51例2.12主要思想:在內(nèi)存中存儲具有最小面積的塊平面,而對于具有最大面積的塊平面,每次只取其中的一塊進(jìn)行計(jì)算算法的局限性:只適合于具有少數(shù)維的數(shù)據(jù)立方體這種算法要計(jì)算的方體個(gè)數(shù)隨維數(shù)指數(shù)增長,為了避免維增長災(zāi)難,可以嘗試使用“自底向上”計(jì)算方法和冰山方計(jì)算方法69第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)索引OLAP數(shù)據(jù):位圖索引在給定的屬性上進(jìn)行索引屬性上的每個(gè)值都有一個(gè)對應(yīng)的位向量:位操作比較快速位向量的長度由基本表的記錄數(shù)量決定如果基本表中給定記錄的屬性值為v,則在位圖索引的對應(yīng)行,表示v的位為1,該行的其他位均為0不適合基數(shù)較大的域70第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)基本表Region位圖索引表Type位圖索引表71第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)索引OLAP數(shù)據(jù):連接索引連接索引:JI(R-id,S-id)whereR(R-id,…)S(S-id,…)傳統(tǒng)的索引將給定列上的值映射到具有該值的行表上必須物化JI中的關(guān)系連接,執(zhí)行有很大開銷的連接操作在數(shù)據(jù)倉庫的星型模式中,連接索引維護(hù)維的屬性值和事實(shí)表的對應(yīng)行之間的關(guān)系E.g.具有維city和product的事實(shí)表salescity維的連接索引維護(hù)了city維表上的值與sales事實(shí)表中的相應(yīng)元組的連接關(guān)系連接索引可以跨越多維72第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)OLAP查詢的有效處理確定哪些操作應(yīng)當(dāng)在可利用的方體上執(zhí)行這涉及將查詢中的選擇、投影、上卷(分組)和下鉆操作轉(zhuǎn)換為對應(yīng)的SQL和/或OLAP操作。例如,在數(shù)據(jù)立方體上,切片(切塊)=選擇+投影確定相關(guān)操作應(yīng)當(dāng)使用哪些物化的方體MOLAP查詢處理最好采用二級方法:對于稠密數(shù)組使用數(shù)組結(jié)構(gòu),對于稀疏數(shù)組使用稀疏矩陣結(jié)構(gòu)和數(shù)據(jù)壓縮技術(shù)。二維稠密數(shù)組可以用B樹索引73第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)元數(shù)據(jù)存儲元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)。它包括以下類型:數(shù)據(jù)倉庫結(jié)構(gòu)的描述操作元數(shù)據(jù)匯總用的算法由操作環(huán)境到數(shù)據(jù)倉庫的映射關(guān)于系統(tǒng)性能的數(shù)據(jù)數(shù)據(jù)倉庫模式、視圖和源數(shù)據(jù)定義商務(wù)元數(shù)據(jù)包括商務(wù)術(shù)語和定義、數(shù)據(jù)擁有者信息和收費(fèi)策略74第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫后端工具和實(shí)用程序數(shù)據(jù)提?。和ǔ亩鄠€(gè)異種的外部數(shù)據(jù)源收集數(shù)據(jù)數(shù)據(jù)清理:檢測數(shù)據(jù)中的錯(cuò)誤,可能是訂正它們數(shù)據(jù)變換:將數(shù)據(jù)由遺產(chǎn)或宿主格式轉(zhuǎn)換成數(shù)據(jù)倉庫格式裝入:排序、綜合、合并、計(jì)算視圖、檢查整體性,并建立索引和劃分刷新:傳播由數(shù)據(jù)源到數(shù)據(jù)倉庫的更新75第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)第2章 數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)什么是數(shù)據(jù)倉庫?
多維數(shù)據(jù)模型數(shù)據(jù)倉庫的系統(tǒng)結(jié)構(gòu)數(shù)據(jù)倉庫的實(shí)現(xiàn)數(shù)據(jù)立方體技術(shù)的進(jìn)一步發(fā)展從數(shù)據(jù)倉庫到數(shù)據(jù)挖掘76第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)立方體發(fā)現(xiàn)驅(qū)動的探查假定驅(qū)動:由用戶根據(jù)自己直覺去探查,搜索空間非常大發(fā)現(xiàn)驅(qū)動(Sarawagietal.’98)預(yù)計(jì)算的度量指出數(shù)據(jù)異常,在所有的聚集級知道用戶的數(shù)據(jù)分析過程異常:數(shù)據(jù)立方體的單元值,基于某種統(tǒng)計(jì)模型,顯著的不同于預(yù)期值可視提示(如背景色),異常指示符的計(jì)算(模型符合和計(jì)算SelfExp、InExp、PathExp度量)77第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)發(fā)現(xiàn)驅(qū)動數(shù)據(jù)立方體的例子78第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)多粒度上的復(fù)雜聚集:多特征方多特征方(Ross,etal.1998):計(jì)算復(fù)雜查詢,這些查詢涉及多粒度上多個(gè)依賴的聚集Ex.按{item,region,month}的所有子集分組,對每組找出2001年最高價(jià)格,以及所有具有最高價(jià)格的元組的總銷售額selectitem,region,month,max(price),sum(R.sales)frompurchaseswhereyear=2001cubebyitem,region,month:RsuchthatR.price=max(price)在上面的例子中,在最高價(jià)格的元組中,找出最小和最大的商品貨架壽命,并在所有最高價(jià)格的元組中,找出具有最小貨架壽命的元組的總銷售額部分79第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)第2章 數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)什么是數(shù)據(jù)倉庫?
多維數(shù)據(jù)模型數(shù)據(jù)倉庫的系統(tǒng)結(jié)構(gòu)數(shù)據(jù)倉庫的實(shí)現(xiàn)數(shù)據(jù)立方體技術(shù)的進(jìn)一步發(fā)展從數(shù)據(jù)倉庫到數(shù)據(jù)挖掘80第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫的使用三種數(shù)據(jù)倉庫應(yīng)用信息處理:支持查詢和基本的統(tǒng)計(jì)分析,并使用交叉表、表、圖表或圖進(jìn)行報(bào)告分析處理:支持?jǐn)?shù)據(jù)倉庫的多維數(shù)據(jù)分析;支持基本的OLAP操作,包括切片和切塊、下鉆、上卷和轉(zhuǎn)軸數(shù)據(jù)挖掘從隱藏的模式中發(fā)現(xiàn)知識;支持關(guān)聯(lián),構(gòu)造分析模型,進(jìn)行分類和預(yù)測,并用可視化工具提供挖掘結(jié)果81第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)從聯(lián)機(jī)分析處理到聯(lián)機(jī)分析挖掘(OLAM)為什么要進(jìn)行聯(lián)機(jī)分析挖掘?數(shù)據(jù)倉庫中數(shù)據(jù)的高質(zhì)量數(shù)據(jù)倉庫提供集成的、一致的和清理過的數(shù)據(jù)環(huán)繞數(shù)據(jù)倉庫的有價(jià)值的信息處理基礎(chǔ)設(shè)施ODBC/OLEDB連接、Web訪問和服務(wù)工具以及報(bào)表和OLAP分析工具等基于OLAP的探測式數(shù)據(jù)分析采用上卷、切片、旋轉(zhuǎn)等進(jìn)行挖掘數(shù)據(jù)挖掘功能的聯(lián)機(jī)選擇將多種數(shù)據(jù)挖掘功能集成在一起,并可靈活動態(tài)的變換挖掘的功能、方式、任務(wù)等OLAM的體系結(jié)構(gòu)82第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)一個(gè)集成的OLAM和OLAP結(jié)構(gòu)數(shù)據(jù)倉庫元數(shù)據(jù)MDDBOLAM引擎OLAP引擎用戶圖形界面API數(shù)據(jù)方API數(shù)據(jù)庫API數(shù)據(jù)清理數(shù)據(jù)集成第三層OLAP/OLAM第二層多維數(shù)據(jù)庫第一層數(shù)據(jù)存儲第四層用戶界面數(shù)據(jù)過濾和集成過濾數(shù)據(jù)庫挖掘查詢挖掘結(jié)果83第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)廣東移動計(jì)費(fèi)數(shù)據(jù)倉庫及在線分析服務(wù)對歷史信息數(shù)據(jù)進(jìn)行分析,得出各種信息之間的相互關(guān)系,分析不同用戶的行為特征,為移動決策提供數(shù)據(jù)依據(jù)。分析手段有:l
通過多維圖形和報(bào)表,了解業(yè)務(wù)發(fā)展情況。l
對歷史數(shù)據(jù)進(jìn)行挖掘分析,發(fā)現(xiàn)用戶的行為特征。l
根據(jù)用戶的行為特征,對用戶進(jìn)行分類。l
根據(jù)用戶對價(jià)格政策和優(yōu)惠政策的行為反映,優(yōu)化價(jià)格和優(yōu)惠政策。84第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)廣東移動計(jì)費(fèi)數(shù)據(jù)倉庫用于集中存放用戶需要分析的歷史數(shù)據(jù)。放在數(shù)據(jù)倉庫中的數(shù)據(jù)分成兩種類型:詳細(xì)歷史信息和統(tǒng)計(jì)中間結(jié)果。其中,統(tǒng)計(jì)中間結(jié)果是業(yè)務(wù)系統(tǒng)平時(shí)在運(yùn)行時(shí)生成的,中間表應(yīng)能盡量齊全,具有業(yè)務(wù)運(yùn)行時(shí)所關(guān)心的全部信息。85第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)深圳移動2000年7月到2001年3月的移動通話記錄以及
費(fèi)用,總共有約1600,000,000條記錄,生成表如下:
86第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)數(shù)據(jù)倉庫建立過程數(shù)據(jù)倉庫結(jié)構(gòu)分析原始數(shù)據(jù)分析數(shù)據(jù)倉庫主題確立數(shù)據(jù)倉據(jù)數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)數(shù)據(jù)的抽取,轉(zhuǎn)換和導(dǎo)入創(chuàng)建OLAP維,級別,成員和層次87第二章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的OLAP技術(shù)原始
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 保險(xiǎn)銷售季度報(bào)告模板
- 母親的俗語格言詩句
- 2024年掌上華醫(yī)(醫(yī)院版)考試題庫(附答案)
- 二零二五版幼兒園安全風(fēng)險(xiǎn)評估與應(yīng)急預(yù)案合同4篇
- 特許連鎖加盟協(xié)議(2025年版)3篇
- 2024年員工宿舍的管理規(guī)章制度守則
- 二零二五年度航空航天產(chǎn)業(yè)園區(qū)場地租賃合同范本4篇
- 二零二五年度旅游項(xiàng)目貸款擔(dān)保服務(wù)協(xié)議3篇
- 2025年度家庭式別墅租賃管理協(xié)議范本4篇
- 美甲店二零二五年度員工培訓(xùn)及技能提升服務(wù)合同4篇
- 《精密板料矯平機(jī) 第1部分:型式和基本參數(shù)》
- 舞蹈課家長會
- 自來水質(zhì)量提升技術(shù)方案
- 房地產(chǎn)銷售任務(wù)及激勵制度
- 并購指南(如何發(fā)現(xiàn)好公司)
- DL-T-1642-2016環(huán)形混凝土電桿用腳扣
- 銅礦成礦作用與地質(zhì)環(huán)境分析
- 30題紀(jì)檢監(jiān)察位崗位常見面試問題含HR問題考察點(diǎn)及參考回答
- 詢價(jià)函模板(非常詳盡)
- 《AI營銷畫布:數(shù)字化營銷的落地與實(shí)戰(zhàn)》
- 麻醉藥品、精神藥品、放射性藥品、醫(yī)療用毒性藥品及藥品類易制毒化學(xué)品等特殊管理藥品的使用與管理規(guī)章制度
評論
0/150
提交評論