數(shù)據(jù)倉庫技術(shù)與聯(lián)機分析處理_第1頁
數(shù)據(jù)倉庫技術(shù)與聯(lián)機分析處理_第2頁
數(shù)據(jù)倉庫技術(shù)與聯(lián)機分析處理_第3頁
數(shù)據(jù)倉庫技術(shù)與聯(lián)機分析處理_第4頁
數(shù)據(jù)倉庫技術(shù)與聯(lián)機分析處理_第5頁
已閱讀5頁,還剩58頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、數(shù)據(jù)倉庫技術(shù)與聯(lián)機分析處理數(shù)據(jù)倉庫技術(shù)與聯(lián)機分析處理Data Warehouse & OLAP 數(shù)據(jù)庫處理的兩大應(yīng)用數(shù)據(jù)庫處理的兩大應(yīng)用聯(lián)機事務(wù)處理聯(lián)機事務(wù)處理(OLTP)決策支持系統(tǒng)決策支持系統(tǒng)(DSS) 數(shù)據(jù)庫處理的兩大應(yīng)用數(shù)據(jù)庫處理的兩大應(yīng)用聯(lián)機事務(wù)處理聯(lián)機事務(wù)處理(OLTP) 操作型處理,為企業(yè)的特定應(yīng)用服務(wù)操作型處理,為企業(yè)的特定應(yīng)用服務(wù) 是對數(shù)據(jù)庫的聯(lián)機的日常操作,通常是對是對數(shù)據(jù)庫的聯(lián)機的日常操作,通常是對一個或一組記錄的查詢和修改一個或一組記錄的查詢和修改 人們關(guān)心的是響應(yīng)時間、數(shù)據(jù)的安全性和人們關(guān)心的是響應(yīng)時間、數(shù)據(jù)的安全性和完整性完整性決策支持系統(tǒng)決策支持系統(tǒng)(DSS) 數(shù)

2、據(jù)庫處理的兩大應(yīng)用數(shù)據(jù)庫處理的兩大應(yīng)用聯(lián)機事務(wù)處理聯(lián)機事務(wù)處理(OLTP)決策支持系統(tǒng)決策支持系統(tǒng)(DSS) 分析型處理,用于管理人員的決策分析分析型處理,用于管理人員的決策分析 經(jīng)常需要訪問大量的歷史數(shù)據(jù)經(jīng)常需要訪問大量的歷史數(shù)據(jù) 數(shù)據(jù)倉庫數(shù)據(jù)倉庫 + 聯(lián)機分析處理聯(lián)機分析處理 + 數(shù)據(jù)挖掘數(shù)據(jù)挖掘 ( DW + OLAP + DM ) DSS 數(shù)據(jù)倉庫數(shù)據(jù)倉庫是一個面向主題的、集成的、非易失的是一個面向主題的、集成的、非易失的(不可修改)且隨時間變化的數(shù)據(jù)集合,(不可修改)且隨時間變化的數(shù)據(jù)集合,用來支持管理人員的決策用來支持管理人員的決策 數(shù)據(jù)倉庫的特點數(shù)據(jù)倉庫的特點面向主題面向主題 主

3、題是在較高層次上對數(shù)據(jù)抽象主題是在較高層次上對數(shù)據(jù)抽象 面向主題的數(shù)據(jù)組織分為兩步驟面向主題的數(shù)據(jù)組織分為兩步驟抽取主題抽取主題確定每個主題所包含的數(shù)據(jù)內(nèi)容確定每個主題所包含的數(shù)據(jù)內(nèi)容 每個主題在數(shù)據(jù)倉庫中都是由每個主題在數(shù)據(jù)倉庫中都是由一組關(guān)系一組關(guān)系表實現(xiàn)的表實現(xiàn)的集成的集成的數(shù)據(jù)不可更改數(shù)據(jù)不可更改隨時間變化的隨時間變化的 數(shù)據(jù)倉庫的特點數(shù)據(jù)倉庫的特點 面向主題面向主題 數(shù)據(jù)倉庫的特點數(shù)據(jù)倉庫的特點面向主題面向主題集成的集成的 數(shù)據(jù)倉庫的數(shù)據(jù)是從原有的分散數(shù)據(jù)庫數(shù)據(jù)中抽數(shù)據(jù)倉庫的數(shù)據(jù)是從原有的分散數(shù)據(jù)庫數(shù)據(jù)中抽取來的取來的 消除數(shù)據(jù)表述的不一致性(數(shù)據(jù)的清洗)消除數(shù)據(jù)表述的不一致性(數(shù)據(jù)

4、的清洗) 數(shù)據(jù)的綜合數(shù)據(jù)的綜合數(shù)據(jù)不可更改數(shù)據(jù)不可更改隨時間變化的隨時間變化的 數(shù)據(jù)倉庫的特點數(shù)據(jù)倉庫的特點 集成集成 數(shù)據(jù)倉庫的特點數(shù)據(jù)倉庫的特點面向主題面向主題集成的集成的數(shù)據(jù)不可更改數(shù)據(jù)不可更改 數(shù)據(jù)倉庫的主要數(shù)據(jù)操作是查詢、分析數(shù)據(jù)倉庫的主要數(shù)據(jù)操作是查詢、分析 不進行一般意義上的數(shù)據(jù)更新(過期數(shù)據(jù)可能被不進行一般意義上的數(shù)據(jù)更新(過期數(shù)據(jù)可能被刪除)刪除) 數(shù)據(jù)倉庫強化查詢、淡化并發(fā)控制和完整性保護數(shù)據(jù)倉庫強化查詢、淡化并發(fā)控制和完整性保護等技術(shù)等技術(shù)隨時間變化的隨時間變化的 數(shù)據(jù)倉庫的特點數(shù)據(jù)倉庫的特點數(shù)據(jù)不可更改數(shù)據(jù)不可更改 數(shù)據(jù)倉庫的特點數(shù)據(jù)倉庫的特點面向主題面向主題集成的集成

5、的數(shù)據(jù)不可更改數(shù)據(jù)不可更改隨時間變化的隨時間變化的 不斷增加新的數(shù)據(jù)內(nèi)容不斷增加新的數(shù)據(jù)內(nèi)容 不斷刪除舊的數(shù)據(jù)內(nèi)容不斷刪除舊的數(shù)據(jù)內(nèi)容 定時綜合定時綜合 數(shù)據(jù)倉庫中數(shù)據(jù)表的數(shù)據(jù)倉庫中數(shù)據(jù)表的鍵碼鍵碼都包含時間項,以標明都包含時間項,以標明數(shù)據(jù)的歷史時期數(shù)據(jù)的歷史時期 數(shù)據(jù)倉庫的特點數(shù)據(jù)倉庫的特點 隨時間變化隨時間變化 數(shù)據(jù)倉庫的結(jié)構(gòu)數(shù)據(jù)倉庫的結(jié)構(gòu)OLTP系統(tǒng)系統(tǒng)RDBMSSybaseVSAMSAP/ERP5-10 年年過去過去詳細數(shù)據(jù)詳細數(shù)據(jù)當(dāng)前當(dāng)前詳細數(shù)據(jù)詳細數(shù)據(jù)輕度輕度匯總數(shù)據(jù)匯總數(shù)據(jù)高度高度匯總數(shù)據(jù)匯總數(shù)據(jù)數(shù)據(jù)集市數(shù)據(jù)集市分析型分析型CRM業(yè)務(wù)指標分析業(yè)務(wù)指標分析數(shù)據(jù)倉庫數(shù)據(jù)倉庫/決策分

6、析系統(tǒng)決策分析系統(tǒng)EXCEL 數(shù)據(jù)倉庫的結(jié)構(gòu)數(shù)據(jù)倉庫的結(jié)構(gòu) 數(shù)據(jù)由操作型環(huán)境(綜合)導(dǎo)入數(shù)據(jù)倉庫數(shù)據(jù)由操作型環(huán)境(綜合)導(dǎo)入數(shù)據(jù)倉庫 數(shù)據(jù)具有不同的細節(jié)級數(shù)據(jù)具有不同的細節(jié)級 早期細節(jié)級(過期數(shù)據(jù))早期細節(jié)級(過期數(shù)據(jù)) 當(dāng)前細節(jié)級當(dāng)前細節(jié)級 輕度綜合數(shù)據(jù)級(數(shù)據(jù)集市)輕度綜合數(shù)據(jù)級(數(shù)據(jù)集市) 高度綜合數(shù)據(jù)級高度綜合數(shù)據(jù)級 數(shù)據(jù)倉庫建立的過程數(shù)據(jù)倉庫建立的過程 粒度粒度 是指數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細化或綜合是指數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細化或綜合程度的級別程度的級別 粒度級越小,細節(jié)程度越高,綜合程度越低,回答粒度級越小,細節(jié)程度越高,綜合程度越低,回答查詢的種類越多查詢的種類越

7、多 粒度影響數(shù)據(jù)倉庫中數(shù)據(jù)量的大小粒度影響數(shù)據(jù)倉庫中數(shù)據(jù)量的大小 粒度問題是設(shè)計數(shù)據(jù)倉庫的一個重要方面粒度問題是設(shè)計數(shù)據(jù)倉庫的一個重要方面 雙重粒度雙重粒度 在數(shù)據(jù)倉庫的細節(jié)級上創(chuàng)建兩種粒度在數(shù)據(jù)倉庫的細節(jié)級上創(chuàng)建兩種粒度 短期儲存的低粒度(真實檔案),滿足細節(jié)查詢短期儲存的低粒度(真實檔案),滿足細節(jié)查詢 具有綜合的高粒度(輕度綜合),做分析具有綜合的高粒度(輕度綜合),做分析 分割分割 是指把數(shù)據(jù)分散到各自的物理單元中去,以便能分是指把數(shù)據(jù)分散到各自的物理單元中去,以便能分別獨立處理,提高數(shù)據(jù)處理效率別獨立處理,提高數(shù)據(jù)處理效率 是粒度之后的第二個主要設(shè)計問題是粒度之后的第二個主要設(shè)計問題

8、 兩個層次的分割兩個層次的分割 系統(tǒng)層:系統(tǒng)層:DBMS,一種定義,一種定義 應(yīng)用層:開發(fā)者,多種定義應(yīng)用層:開發(fā)者,多種定義 多種分割的標準多種分割的標準 日期:最常用的日期:最常用的 地理位置地理位置 組織單位組織單位. 數(shù)據(jù)倉庫中的數(shù)據(jù)組織形式數(shù)據(jù)倉庫中的數(shù)據(jù)組織形式 簡單堆積簡單堆積 輪轉(zhuǎn)綜合輪轉(zhuǎn)綜合 數(shù)據(jù)按一定的格式進行輪轉(zhuǎn)的累加數(shù)據(jù)按一定的格式進行輪轉(zhuǎn)的累加 簡化直接簡化直接 按一定的時間間隔,對數(shù)據(jù)進行提取,是操作型數(shù)據(jù)的按一定的時間間隔,對數(shù)據(jù)進行提取,是操作型數(shù)據(jù)的一個快照一個快照 連續(xù)連續(xù) 把新的快照追加到以前的連續(xù)數(shù)據(jù)上去把新的快照追加到以前的連續(xù)數(shù)據(jù)上去 數(shù)據(jù)倉庫中的數(shù)

9、據(jù)組織形式數(shù)據(jù)倉庫中的數(shù)據(jù)組織形式 簡單堆積簡單堆積 每日由數(shù)據(jù)庫中提取并加工的數(shù)據(jù)逐天積累堆積每日由數(shù)據(jù)庫中提取并加工的數(shù)據(jù)逐天積累堆積 數(shù)據(jù)倉庫中的數(shù)據(jù)組織形式數(shù)據(jù)倉庫中的數(shù)據(jù)組織形式 輪轉(zhuǎn)綜合輪轉(zhuǎn)綜合 數(shù)據(jù)按一定的格式進行輪轉(zhuǎn)的累加數(shù)據(jù)按一定的格式進行輪轉(zhuǎn)的累加 數(shù)據(jù)倉庫中的數(shù)據(jù)組織形式數(shù)據(jù)倉庫中的數(shù)據(jù)組織形式 簡單堆積與輪轉(zhuǎn)綜合的比較簡單堆積與輪轉(zhuǎn)綜合的比較 數(shù)據(jù)倉庫中的數(shù)據(jù)組織形式數(shù)據(jù)倉庫中的數(shù)據(jù)組織形式 簡化直接簡化直接 按一定的時間間隔,對數(shù)據(jù)進行提取,是操作型數(shù)據(jù)的按一定的時間間隔,對數(shù)據(jù)進行提取,是操作型數(shù)據(jù)的一個快照一個快照 數(shù)據(jù)倉庫中的數(shù)據(jù)組織形式數(shù)據(jù)倉庫中的數(shù)據(jù)組織形式

10、 連續(xù)連續(xù) 把新的快照追加到以前的連續(xù)數(shù)據(jù)上去把新的快照追加到以前的連續(xù)數(shù)據(jù)上去 數(shù)據(jù)倉庫的數(shù)據(jù)追加數(shù)據(jù)倉庫的數(shù)據(jù)追加 數(shù)據(jù)追加數(shù)據(jù)追加 數(shù)據(jù)倉庫的數(shù)據(jù)初裝完成以后,再向數(shù)據(jù)倉庫輸入數(shù)據(jù)數(shù)據(jù)倉庫的數(shù)據(jù)初裝完成以后,再向數(shù)據(jù)倉庫輸入數(shù)據(jù)的過程稱為的過程稱為數(shù)據(jù)追加數(shù)據(jù)追加 變化數(shù)據(jù)的捕獲變化數(shù)據(jù)的捕獲 時標法:加標識時標法:加標識 DELTA法:對更新作記錄法:對更新作記錄 前后映象法:兩次快照的對比前后映象法:兩次快照的對比 日志法日志法:利用:利用DBMS的日志,需改進的日志,需改進 數(shù)據(jù)庫的體系化環(huán)境數(shù)據(jù)庫的體系化環(huán)境 是在一個企業(yè)或組織內(nèi)部,由各面向應(yīng)用的是在一個企業(yè)或組織內(nèi)部,由各面向

11、應(yīng)用的OLTP數(shù)據(jù)庫及各級面向主題的數(shù)據(jù)倉庫所組成的完整的數(shù)據(jù)庫及各級面向主題的數(shù)據(jù)倉庫所組成的完整的數(shù)據(jù)環(huán)境數(shù)據(jù)環(huán)境 操作型環(huán)境、分析型環(huán)境操作型環(huán)境、分析型環(huán)境 四層體系化環(huán)境四層體系化環(huán)境 操作型環(huán)境操作型環(huán)境OLTP 全局級全局級數(shù)據(jù)倉庫數(shù)據(jù)倉庫 部門級部門級局部倉庫局部倉庫 個人級個人級個人倉庫,用于啟發(fā)式的分析個人倉庫,用于啟發(fā)式的分析 數(shù)據(jù)集市(數(shù)據(jù)集市(Data Mart) 特定的、面向部門的小型數(shù)據(jù)倉庫特定的、面向部門的小型數(shù)據(jù)倉庫 是為滿足用戶特定需求而創(chuàng)建的數(shù)據(jù)倉庫是為滿足用戶特定需求而創(chuàng)建的數(shù)據(jù)倉庫 是數(shù)據(jù)倉庫的子集是數(shù)據(jù)倉庫的子集 數(shù)據(jù)庫的體系化環(huán)境數(shù)據(jù)庫的體系化環(huán)境

12、 數(shù)據(jù)庫的體系化環(huán)境數(shù)據(jù)庫的體系化環(huán)境 數(shù)據(jù)倉庫的開發(fā)生命周期數(shù)據(jù)倉庫的開發(fā)生命周期 數(shù)據(jù)倉庫的基本數(shù)據(jù)模式數(shù)據(jù)倉庫的基本數(shù)據(jù)模式 星型模式星型模式(Star Schema) 事實表事實表(fact table),存放基本數(shù)據(jù),相關(guān)主題的數(shù),存放基本數(shù)據(jù),相關(guān)主題的數(shù)據(jù)主體(據(jù)主體(BCNF) 維維(dimension),影響、分析主體數(shù)據(jù)的因素,影響、分析主體數(shù)據(jù)的因素 量量(measure),事實表中的數(shù)據(jù)屬性,事實表中的數(shù)據(jù)屬性 維表維表(dimension table),表示維的各種表,表示維的各種表 維是量的取值條件,維用外鍵表示維是量的取值條件,維用外鍵表示 以事實表為中心,加上若

13、干維表,組成星型數(shù)據(jù)以事實表為中心,加上若干維表,組成星型數(shù)據(jù)模式模式 例:產(chǎn)品例:產(chǎn)品-商店商店-銷售額銷售額 數(shù)據(jù)倉庫的基本數(shù)據(jù)模式數(shù)據(jù)倉庫的基本數(shù)據(jù)模式CustSalesLocationSalesProdSalesTimeSalesSalestime idproduct idlocation idcustomer idsales revenueunits soldProductproduct idmakemodelTimetime iddateyearquartermonthweekLocationlocation idregiondistrictstoreCustomercustome

14、r idcategorygroupSales factSales measuresTime dimensionAttributes of the time dimension 數(shù)據(jù)倉庫的基本數(shù)據(jù)模式數(shù)據(jù)倉庫的基本數(shù)據(jù)模式雪花模式雪花模式(Snowflake Schema) 維一般是由若干層次組成維一般是由若干層次組成 把維按其把維按其層次層次結(jié)構(gòu)表示成若干個表結(jié)構(gòu)表示成若干個表 規(guī)范化、節(jié)省存儲空間規(guī)范化、節(jié)省存儲空間 但需多做連接操作但需多做連接操作 數(shù)據(jù)倉庫的解決方案數(shù)據(jù)倉庫的解決方案 通用的關(guān)系數(shù)據(jù)庫系統(tǒng)通用的關(guān)系數(shù)據(jù)庫系統(tǒng) 專門的數(shù)據(jù)倉庫服務(wù)器專門的數(shù)據(jù)倉庫服務(wù)器 數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)

15、構(gòu)數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu) 數(shù)據(jù)倉庫層數(shù)據(jù)倉庫層 數(shù)據(jù)倉庫工具層數(shù)據(jù)倉庫工具層 最終用戶最終用戶 數(shù)據(jù)倉庫系統(tǒng)數(shù)據(jù)倉庫系統(tǒng) 數(shù)據(jù)倉庫數(shù)據(jù)倉庫居系統(tǒng)的核心地位居系統(tǒng)的核心地位是信息挖掘的基礎(chǔ)是信息挖掘的基礎(chǔ) 數(shù)據(jù)倉庫管理系統(tǒng)數(shù)據(jù)倉庫管理系統(tǒng)是整個系統(tǒng)的引擎是整個系統(tǒng)的引擎負責(zé)管理整個系統(tǒng)的運轉(zhuǎn)負責(zé)管理整個系統(tǒng)的運轉(zhuǎn) 數(shù)據(jù)倉庫工具數(shù)據(jù)倉庫工具一般的查詢工具、功能強大的分析工具一般的查詢工具、功能強大的分析工具是整個系統(tǒng)發(fā)揮作用的關(guān)鍵是整個系統(tǒng)發(fā)揮作用的關(guān)鍵 數(shù)據(jù)倉庫系統(tǒng)數(shù)據(jù)倉庫系統(tǒng) 數(shù)據(jù)倉庫系統(tǒng)數(shù)據(jù)倉庫系統(tǒng)lDesignlWarehouse ArchitectlManagelSybase ASIQl

16、IntegratelInformatica lEnterprise ConnectlReplication ServerlVisualizelBriolCognoslAdministerlWarehouse Control Center 數(shù)據(jù)分析模型數(shù)據(jù)分析模型 早期早期靜態(tài)數(shù)據(jù)值的相互比較靜態(tài)數(shù)據(jù)值的相互比較 需求需求從多個不同的數(shù)據(jù)源中綜合數(shù)據(jù)從多個不同的數(shù)據(jù)源中綜合數(shù)據(jù)從不同的角度觀察數(shù)據(jù)從不同的角度觀察數(shù)據(jù)多變的主題、多維數(shù)據(jù)多變的主題、多維數(shù)據(jù)E-R不能完全支持不能完全支持 四種分析模型四種分析模型(Codd) 絕對模型絕對模型靜態(tài)數(shù)據(jù)分析靜態(tài)數(shù)據(jù)分析只能對歷史數(shù)據(jù)進行值的比較,描述

17、基本事實只能對歷史數(shù)據(jù)進行值的比較,描述基本事實用戶交互少用戶交互少 解釋模型解釋模型 思考模型思考模型 公式模型公式模型 四種分析模型四種分析模型(Codd) 絕對模型絕對模型 解釋模型解釋模型靜態(tài)數(shù)據(jù)分析靜態(tài)數(shù)據(jù)分析在當(dāng)前多維視圖的基礎(chǔ)上找出事件發(fā)生的原因在當(dāng)前多維視圖的基礎(chǔ)上找出事件發(fā)生的原因 思考模型思考模型 公式模型公式模型 四種分析模型四種分析模型(Codd) 絕對模型絕對模型 解釋模型解釋模型 思考模型思考模型動態(tài)數(shù)據(jù)分析動態(tài)數(shù)據(jù)分析多維分析多維分析在決策者的參與下,找出關(guān)鍵變量在決策者的參與下,找出關(guān)鍵變量需要高級數(shù)據(jù)分析人員的介入需要高級數(shù)據(jù)分析人員的介入 公式模型公式模型

18、四種分析模型四種分析模型(Codd) 絕對模型絕對模型 解釋模型解釋模型 思考模型思考模型 公式模型公式模型動態(tài)性最高的一類動態(tài)性最高的一類自動完成變量的引入工作自動完成變量的引入工作 數(shù)據(jù)倉庫系統(tǒng)的工具層數(shù)據(jù)倉庫系統(tǒng)的工具層 查詢工具查詢工具主要是對分析結(jié)果的查詢主要是對分析結(jié)果的查詢很少有對記錄級數(shù)據(jù)的查詢很少有對記錄級數(shù)據(jù)的查詢 驗證型工具驗證型工具多維分析工具多維分析工具用戶首先提出假設(shè),然后利用各種工具通過反復(fù)、用戶首先提出假設(shè),然后利用各種工具通過反復(fù)、遞歸的檢索查詢以驗證或否定假設(shè)遞歸的檢索查詢以驗證或否定假設(shè) 發(fā)掘型工具發(fā)掘型工具從大量數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)模式從大量數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)模式

19、預(yù)測趨勢和行為預(yù)測趨勢和行為 聯(lián)機分析處理聯(lián)機分析處理OLAPOLAP 是針對特定問題的聯(lián)機訪問和分析。是針對特定問題的聯(lián)機訪問和分析。 通過對信息的很多種可能的觀察形式進行快速、穩(wěn)通過對信息的很多種可能的觀察形式進行快速、穩(wěn)定一致和交互性的存取,允許分析人員對數(shù)據(jù)進行定一致和交互性的存取,允許分析人員對數(shù)據(jù)進行深入觀察深入觀察 一些概念一些概念變量變量是數(shù)據(jù)的實際意義,描述數(shù)據(jù)是什么是數(shù)據(jù)的實際意義,描述數(shù)據(jù)是什么維維是人們觀察數(shù)據(jù)的特定角度是人們觀察數(shù)據(jù)的特定角度維的層次維的層次是維在不同細節(jié)程度的描述是維在不同細節(jié)程度的描述維成員維成員是維的一個取值是維的一個取值 多層次維的維成員是各層

20、次取值的組合多層次維的維成員是各層次取值的組合 對應(yīng)一個數(shù)據(jù)項,維成員是該數(shù)據(jù)項在該維中位置的描述對應(yīng)一個數(shù)據(jù)項,維成員是該數(shù)據(jù)項在該維中位置的描述多維數(shù)組多維數(shù)組可以表示為(維可以表示為(維1,維維2,變量變量),如(地),如(地區(qū)區(qū),時間時間,銷售渠道銷售渠道,銷售額銷售額) 多維數(shù)組的取值稱為多維數(shù)組的取值稱為數(shù)據(jù)單元(單元格)數(shù)據(jù)單元(單元格) 可以理解為交叉表的數(shù)據(jù)格可以理解為交叉表的數(shù)據(jù)格 一些基本操作一些基本操作 在多維數(shù)組的某一維選定一個維成員的動作稱在多維數(shù)組的某一維選定一個維成員的動作稱為為切片切片。舍棄一些觀察角度舍棄一些觀察角度 在多維數(shù)組的某一維上選定某一區(qū)間的維成員

21、在多維數(shù)組的某一維上選定某一區(qū)間的維成員切塊切塊多個切片的疊加多個切片的疊加旋轉(zhuǎn)旋轉(zhuǎn)是改變一個報告或頁面顯示的維方向是改變一個報告或頁面顯示的維方向以用戶容易理解的角度來觀察數(shù)據(jù)以用戶容易理解的角度來觀察數(shù)據(jù) 基于多維數(shù)據(jù)庫的基于多維數(shù)據(jù)庫的OLAPMOLAP 以多維方式組織數(shù)據(jù)(以多維方式組織數(shù)據(jù)(綜合綜合數(shù)據(jù))數(shù)據(jù)) 以多維方式顯示(觀察)數(shù)據(jù)以多維方式顯示(觀察)數(shù)據(jù) 多維數(shù)據(jù)庫的形式類似于交叉表,可直觀地表多維數(shù)據(jù)庫的形式類似于交叉表,可直觀地表述一對多、多對多的關(guān)系述一對多、多對多的關(guān)系如:產(chǎn)品、地區(qū)、銷售額如:產(chǎn)品、地區(qū)、銷售額關(guān)系關(guān)系多維多維 多維數(shù)據(jù)庫由許多經(jīng)壓縮的、類似于數(shù)組

22、的對多維數(shù)據(jù)庫由許多經(jīng)壓縮的、類似于數(shù)組的對象構(gòu)成,帶有高度壓縮的索引及指針結(jié)構(gòu)象構(gòu)成,帶有高度壓縮的索引及指針結(jié)構(gòu) 以關(guān)系數(shù)據(jù)庫存放細節(jié)數(shù)據(jù)、以多維數(shù)據(jù)庫存以關(guān)系數(shù)據(jù)庫存放細節(jié)數(shù)據(jù)、以多維數(shù)據(jù)庫存放綜合數(shù)據(jù)放綜合數(shù)據(jù) 基于關(guān)系數(shù)據(jù)庫的基于關(guān)系數(shù)據(jù)庫的OLAPROLAP 以以二維表二維表與與多維聯(lián)系多維聯(lián)系來表達多維數(shù)據(jù)(來表達多維數(shù)據(jù)(綜合綜合數(shù)數(shù)據(jù))據(jù))星型結(jié)構(gòu)星型結(jié)構(gòu)事實表,存儲事實的量及各維的碼值(事實表,存儲事實的量及各維的碼值(BCNF)維表,對每一個維,至少有一個表用來保存該維維表,對每一個維,至少有一個表用來保存該維的元數(shù)據(jù)(多層次、冗余)的元數(shù)據(jù)(多層次、冗余)事實表通過外鍵

23、與每個維表相聯(lián)系事實表通過外鍵與每個維表相聯(lián)系雪花、星座、雪暴雪花、星座、雪暴 模擬多維方式顯示(觀察)數(shù)據(jù)模擬多維方式顯示(觀察)數(shù)據(jù) MOLAP與與ROLAPMOLAP計算速度較快計算速度較快支持的數(shù)據(jù)容量較小支持的數(shù)據(jù)容量較小缺乏細節(jié)數(shù)據(jù)的缺乏細節(jié)數(shù)據(jù)的OLAPROLAP結(jié)構(gòu)較復(fù)雜結(jié)構(gòu)較復(fù)雜以關(guān)系模擬多維以關(guān)系模擬多維支持適當(dāng)細節(jié)的支持適當(dāng)細節(jié)的OLAP較成熟較成熟HOLAP是以上兩種的綜合是以上兩種的綜合 桌面級工具桌面級工具 BrioQuery (ROLAP) Business Objects (ROLAP) Cognos Impromptu (ROLAP) Cognos Power

24、Play (MOLAP) 服務(wù)器級服務(wù)器級OLAP Arbor Software Essbase (MOLAP) MicroStrategy DSS Agent (ROLAP ) Oracles Express (hybrid MOLAP/ROLAP) SQL3對聚集的擴展對聚集的擴展(在在Group By中擴展中擴展)SP(S#,P#,QTY)S#P#QTYS1P1300S1P2200S2P1300S2P2400S3P2200S4P2200Select sum(QTY) as TOTQTYFromSP;Select S#,Sum(QTY) as TOTQTYFromSPGroup By S#

25、;. SQL3對聚集的擴展對聚集的擴展(在在Group By中擴展中擴展) Grouping Sets:支持多個分組同時運算:支持多個分組同時運算Select S#,P#,SUN(QTY) as TOTQTYFrom SPGroup By Grouping Sets (S#) , (P#)S#P#TOTQTYS1Null500S2Null 700S3Null 200S4Null 200NullP1600NullP21000 SQL3對聚集的擴展對聚集的擴展(在在Group By中擴展中擴展) Rollup:上卷:上卷Select S#,P#,SUN(QTY) as TOTQTYFrom SPG

26、roup By Rollup (S# , P#)等同于等同于Group By Grouping Sets (S#, P#) , (S#),( )S#P#TOTQTYS1P1300S1P2200S2P1300S2P2400S3P2200S4P2200S1Null500S2Null 700S3Null 200S4Null 200NullNull1600SQL3對聚集的擴展對聚集的擴展(在在Group By中擴展中擴展) Cube:立方體(交叉表):立方體(交叉表)Select S#,P#,SUN(QTY) as TOTQTYFrom SPGroup By Cube (S# , P#)等同于等同于Group By Grouping Sets (S#, P#) , (S#) , (P#) , ( )S#P#TOTQTYS1P1300S1P2200S2P1300S2P2400S3P2200S4P2200S1Null500S2Null 700S3Null 200S4Null 200NullP1600NullP21000NullNull1600 數(shù)據(jù)挖掘數(shù)據(jù)挖掘(Data Mining) 探測型的數(shù)據(jù)分析探測型的數(shù)據(jù)分析 發(fā)現(xiàn)信息、發(fā)現(xiàn)知識發(fā)現(xiàn)信息、發(fā)現(xiàn)知識 基于基于人工智能人工智能、機器學(xué)習(xí)機器學(xué)習(xí)、統(tǒng)計學(xué)統(tǒng)計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論