




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)倉(cāng)庫(kù)與OLAP
廣東工業(yè)大學(xué)艾丹祥數(shù)據(jù)倉(cāng)庫(kù)與OLAP
廣東工業(yè)大學(xué)艾丹祥數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例
數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例
案例背景Pub是美國(guó)的一家圖書出版公司,希望構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)。其中銷售部門的需求比較急迫,希望能在短時(shí)間內(nèi)實(shí)現(xiàn)對(duì)銷售業(yè)績(jī)的分析。根據(jù)Pub公司的情況,考慮采用金博爾的DMDW的開發(fā)模式,即先為銷售部門設(shè)計(jì)一個(gè)數(shù)據(jù)集市,其他部門數(shù)據(jù)集市的設(shè)計(jì)可參照此模型。案例背景Pub是美國(guó)的一家圖書出版公司,希望構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)。其收集項(xiàng)目需求準(zhǔn)備:研究選定的業(yè)務(wù)過程(術(shù)語、步驟、度量方法)采訪:鉆研選定的業(yè)務(wù)過程(理解使其運(yùn)作所需的分析、數(shù)據(jù)模型和技術(shù))分析:業(yè)務(wù)過程相關(guān)的數(shù)據(jù)資源歸檔對(duì)于Pub公司:選定“銷售”業(yè)務(wù)過程后,通過采訪了解其與銷售分析相關(guān)的問題,如通過什么方式銷售、有哪些銷售地區(qū)等。收集項(xiàng)目需求準(zhǔn)備:研究選定的業(yè)務(wù)過程(術(shù)語、步驟、度量方法)收集項(xiàng)目需求基本業(yè)務(wù)狀況Pub公司在美國(guó)各地均有出版社,出版社負(fù)責(zé)聯(lián)系作者、出版圖書,已出版的圖書將由各地的代銷書店進(jìn)行銷售。收集項(xiàng)目需求基本業(yè)務(wù)狀況收集項(xiàng)目需求業(yè)務(wù)分析需求銷售部門最關(guān)心銷售的業(yè)績(jī),主要通過銷售額和銷售量進(jìn)行考核。收集項(xiàng)目需求業(yè)務(wù)分析需求數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例業(yè)務(wù)分析需求希望針對(duì)每個(gè)出版社作圖書銷售業(yè)績(jī)分析。希望針對(duì)每個(gè)國(guó)家的出版社作圖書銷售業(yè)績(jī)分析。希望針對(duì)每個(gè)州的出版社作圖書銷售業(yè)績(jī)分析。希望針對(duì)每城市的出版社作圖書銷售業(yè)績(jī)分析。希望針對(duì)每本圖書作銷售業(yè)績(jī)分析。希望針對(duì)每類圖書做銷售業(yè)績(jī)分析。希望針對(duì)每年出版的圖書做銷售業(yè)績(jī)分析。希望針對(duì)每位作者所編寫的圖書做銷售業(yè)績(jī)分析。希望針對(duì)每個(gè)書店作圖書銷售業(yè)績(jī)分析。希望針對(duì)每個(gè)州的書店作圖書銷售業(yè)績(jī)分析。希望針對(duì)每個(gè)城市的書店作圖書銷售業(yè)績(jī)分析。希望針對(duì)年、月、日作銷售業(yè)績(jī)分析。數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例業(yè)務(wù)分析需求數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例銷售業(yè)務(wù)的總線矩陣業(yè)務(wù)實(shí)體業(yè)務(wù)過程出版社圖書書店出版日期銷售XXXX數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例銷售業(yè)務(wù)的總線矩陣業(yè)務(wù)實(shí)體業(yè)務(wù)過程出版社圖書收集項(xiàng)目需求數(shù)據(jù)資源狀況公司的業(yè)務(wù)數(shù)據(jù)庫(kù)為Pubs數(shù)據(jù)庫(kù)收集項(xiàng)目需求數(shù)據(jù)資源狀況收集項(xiàng)目需求數(shù)據(jù)資源狀況Pubs中與銷售業(yè)務(wù)有關(guān)的表收集項(xiàng)目需求數(shù)據(jù)資源狀況根據(jù)總線矩陣建立模型氣泡圖建立多維數(shù)據(jù)模型業(yè)務(wù)實(shí)體業(yè)務(wù)過程出版社圖書書店銷售日期銷售XXXX訂單銷售日期圖書書店出版社根據(jù)總線矩陣建立模型氣泡圖建立多維數(shù)據(jù)模型業(yè)務(wù)實(shí)體業(yè)務(wù)過程出銷售日期建立多維數(shù)據(jù)模型訂單銷售日期圖書書店出版社銷售日期建立多維數(shù)據(jù)模型訂單銷售日期圖書書店出版社銷售日期日期維度的粒度級(jí)別通常為一天日期維度表需要專門生成(如利用Excel工具)日期維度表中的時(shí)間范圍根據(jù)業(yè)務(wù)需求決定建立多維數(shù)據(jù)模型銷售日期建立多維數(shù)據(jù)模型銷售日期日期維度至少要包含年、月、日期三個(gè)屬性建立多維數(shù)據(jù)模型DimDate屬性名稱功能描述FullDate日期DateName日期名Month月MonthName月名Year年其中FullDate、Month、MonthName形成層次。銷售日期建立多維數(shù)據(jù)模型DimDate屬性名稱功能描述Ful出版社建立多維數(shù)據(jù)模型訂單銷售日期圖書書店出版社出版社建立多維數(shù)據(jù)模型訂單銷售日期圖書書店出版社出版社建立多維數(shù)據(jù)模型字段名稱說明pub_id出版社編號(hào)pub_name出版社名city所在市state所在州country所在國(guó)出版社建立多維數(shù)據(jù)模型字段名稱說明pub_id出版社編號(hào)pu出版社出版社維度可以直接包含出版社名、市、州、國(guó)家等屬性建立多維數(shù)據(jù)模型DimPublisher屬性名稱功能描述pub_id出版社編號(hào)pub_name出版社名稱pub_city城市pub_state州pub_country國(guó)家其中pub_name、pub_city、pub_state、pub_country形成層次。出版社建立多維數(shù)據(jù)模型DimPublisher屬性名稱功能描書店建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社書店建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社書店建立多維數(shù)據(jù)模型字段名稱說明stor_id書店編號(hào)stor_name書店名稱city所在市state所在州書店建立多維數(shù)據(jù)模型字段名稱說明stor_id書店編號(hào)sto書店書店維度可以直接包含書店名、市、州等屬性建立多維數(shù)據(jù)模型書店建立多維數(shù)據(jù)模型圖書建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社圖書建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社圖書建立多維數(shù)據(jù)模型字段名稱說明title_id圖書編號(hào)pub_id出版社編號(hào)title圖書名type圖書類型price圖書單價(jià)pubdate出版日期圖書建立多維數(shù)據(jù)模型字段名稱說明title_id圖書編號(hào)pu圖書圖書維度可以直接包含圖書名、類型、出版年等屬性建立多維數(shù)據(jù)模型DimBook屬性名稱功能描述book_id圖書編號(hào)book_name圖書名book_type圖書類型pubyear出版年其中book_name、book_type形成層次結(jié)構(gòu)。圖書建立多維數(shù)據(jù)模型DimBook屬性名稱功能描述book_圖書圖書維度無法直接包含作者屬性建立多維數(shù)據(jù)模型圖書建立多維數(shù)據(jù)模型作者建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社作者圖書作者關(guān)系作者建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社作者圖書作者關(guān)作者建立多維數(shù)據(jù)模型字段名稱說明au_id作者編號(hào)au_lname作者名au_fname作者姓作者建立多維數(shù)據(jù)模型字段名稱說明au_id作者編號(hào)au_ln作者作者維度可以直接包含作者名等屬性建立多維數(shù)據(jù)模型DimAuthor屬性名稱功能描述au_id作者編號(hào)au_name作者名au_fname+au_lname作者建立多維數(shù)據(jù)模型DimAuthor屬性名稱功能描述au_圖書作者關(guān)系建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社作者圖書作者關(guān)系圖書作者關(guān)系建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社作者圖圖書作者關(guān)系建立多維數(shù)據(jù)模型字段名稱說明au_id作者編號(hào)title_id圖書編號(hào)圖書作者關(guān)系建立多維數(shù)據(jù)模型字段名稱說明au_id作者編號(hào)t建立多維數(shù)據(jù)模型圖書作者關(guān)系圖書作者關(guān)系事實(shí)表只包含鍵值列,不包含度量值列,其目的是為了記錄圖書和作者之間的關(guān)系事實(shí)。FactBookAuthor(中間事實(shí)表)屬性名稱功能描述鍵值列book_id圖書編號(hào)au_id作者編號(hào)建立多維數(shù)據(jù)模型圖書作者關(guān)系FactBookAuthor(中訂單建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社作者圖書作者關(guān)系訂單建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社作者圖書作者關(guān)訂單建立多維數(shù)據(jù)模型字段名稱說明stor_id書店編號(hào)title_id圖書編號(hào)qty訂購(gòu)數(shù)量ord_date訂購(gòu)日期訂單建立多維數(shù)據(jù)模型字段名稱說明stor_id書店編號(hào)tit建立多維數(shù)據(jù)模型訂單訂單事實(shí)表中要包含日期、出版社、書店、圖書等鍵值列,還要包含銷售額、銷售量2個(gè)度量值列,其目的是為了記錄銷售事實(shí)。建立多維數(shù)據(jù)模型訂單建立多維數(shù)據(jù)模型訂單FactSales屬性名稱來源功能描述鍵值列pub_idpublishers表出版社編號(hào)stor_idstores表書店編號(hào)book_idtitles表圖書編號(hào)ord_datesales表銷售日期度量值列qtysales表銷售量amount計(jì)算生成(qty*price)銷售額建立多維數(shù)據(jù)模型訂單FactSales屬性名稱來源功能描述鍵建立多維數(shù)據(jù)模型最終,確定數(shù)據(jù)集市包括以下多維數(shù)據(jù)模型:主題——圖書銷售業(yè)績(jī)度量值——圖書銷售量圖書銷售額維度——出版社(國(guó)別-州-城市-出版社)作者(作者姓名)圖書(圖書類別-單一圖書,圖書出版年)書店(州-市-書店)銷售日期(年-月-日)建立多維數(shù)據(jù)模型最終,確定數(shù)據(jù)集市包括以下多維數(shù)據(jù)模型:主題Microsoft數(shù)據(jù)倉(cāng)庫(kù)工具集核心數(shù)據(jù)倉(cāng)庫(kù)工具集——SQLServer關(guān)系引擎(RDBMS):實(shí)現(xiàn)關(guān)系數(shù)據(jù)庫(kù)SQLServerIntegrationService(SSIS):實(shí)現(xiàn)ETL系統(tǒng)SQLServerAnalysisService(SSAS):實(shí)現(xiàn)多維數(shù)據(jù)庫(kù),支持OLAP查詢,實(shí)現(xiàn)數(shù)據(jù)挖掘SQLServerReportingService(SSRS):定義報(bào)表開發(fā)和管理工具:SQLServerBIDevelopmentStudio(BIDS)和SQLServerManagementStudio。Microsoft數(shù)據(jù)倉(cāng)庫(kù)工具集核心數(shù)據(jù)倉(cāng)庫(kù)工具集——SQMicrosoft數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的體系結(jié)構(gòu)源系統(tǒng)數(shù)據(jù)庫(kù)ETL聚合(支持OLAP)源系統(tǒng)數(shù)據(jù)庫(kù)源系統(tǒng)數(shù)據(jù)庫(kù)事實(shí)表和維度表度量和維度前端工具核心數(shù)據(jù)倉(cāng)庫(kù)RDBMSSSISSSASSSRSMicrosoft數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的體系結(jié)構(gòu)源系統(tǒng)數(shù)據(jù)庫(kù)ETLETL過程利用SQLServerIntegrationService對(duì)Pubs數(shù)據(jù)庫(kù)進(jìn)行抽取和整理,形成Pubs_DW數(shù)據(jù)倉(cāng)庫(kù)。先將數(shù)據(jù)從源事務(wù)數(shù)據(jù)中提取到中間數(shù)據(jù)庫(kù)Pubs_Stage再對(duì)中間數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行轉(zhuǎn)換并加載到目標(biāo)關(guān)系數(shù)據(jù)倉(cāng)庫(kù)Pubs_DWETL過程利用SQLServerIntegrationETL過程Pubs數(shù)據(jù)庫(kù)(業(yè)務(wù)數(shù)據(jù)庫(kù))PublishersPub_infoEmployeeJobsRoychedTitlesAuthorsTitleauthorSalesStoresDiscountsPubs_Stage(臨時(shí)數(shù)據(jù)庫(kù))PublishersTitlesTitleauthorAuthorSalesStoresDatePubs_DW(數(shù)據(jù)倉(cāng)庫(kù))FactSalesFactBookAuthorDimPublisherDimBookDimAuthorDimStoreDimDateDTSSSISDate.xlsETL過程Pubs數(shù)據(jù)庫(kù)Pubs_StagePubs_DWDETL過程利用DTS和SQLServerIntegrationService對(duì)Pubs數(shù)據(jù)庫(kù)進(jìn)行抽取和整理,形成Pubs_DW數(shù)據(jù)倉(cāng)庫(kù)。先將數(shù)據(jù)從源事務(wù)數(shù)據(jù)中提取到中間數(shù)據(jù)庫(kù)Pubs_Stage(DTS工具)再對(duì)中間數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行轉(zhuǎn)換并加載到目標(biāo)關(guān)系數(shù)據(jù)倉(cāng)庫(kù)Pubs_DW(SSIS工具)ETL過程利用DTS和SQLServerIntegratETL過程利用DTS將pubs數(shù)據(jù)庫(kù)和date.xls中的數(shù)據(jù)直接導(dǎo)出到pubs_stage數(shù)據(jù)庫(kù)中。Pubs_Stage的結(jié)構(gòu)ETL過程利用DTS將pubs數(shù)據(jù)庫(kù)和date.xls中的數(shù)ETL過程新建pubs_DW數(shù)據(jù)倉(cāng)庫(kù)ETL過程新建pubs_DW數(shù)據(jù)倉(cāng)庫(kù)ETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimDate表DimDate屬性名稱功能描述Sqlserver數(shù)據(jù)類型FullDate日期DatetimeDateName日期名varchar(20)Month月intMonthName月名varchar(20)Year年intETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimDate表DimDETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimPublisher表DimPublisher屬性名稱功能描述Sqlserver數(shù)據(jù)類型pub_id出版社編號(hào)Varchar(4)pub_name出版社名稱varchar(40)pub_city城市varchar(20)pub_state州varchar(2)pub_country國(guó)家varchar(30)ETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimPublisherETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimStore表DimStore屬性名稱功能描述Sqlserver數(shù)據(jù)類型store_id書店編號(hào)Varchar(4)store_name書店名稱varchar(40)store_city城市varchar(20)store_state州varchar(2)ETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimStore表DimETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimBook表DimBook屬性名稱功能描述Sqlserver數(shù)據(jù)類型book_id圖書編號(hào)Varchar(6)book_name圖書名varchar(80)book_type圖書類型varchar(12)pubyear出版年intETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimBook表DimBETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimAuthor表DimAuthor屬性名稱功能描述Sqlserver數(shù)據(jù)類型au_id作者編號(hào)varchar(11)au_name作者名au_fname+au_lnamevarchar(80)ETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimAuthor表DiETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的FactBookAuthor表FactBookAuthor屬性名稱功能描述Sqlserver數(shù)據(jù)類型book_id圖書編號(hào)Varchar(6)au_id作者編號(hào)varchar(11)ETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的FactBookAuthETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的FactSales表FactSales屬性名稱來源功能描述Sqlserver數(shù)據(jù)類型pub_idpublishers表出版社編號(hào)Varchar(4)stor_idstores表書店編號(hào)Varchar(4)book_idtitles表圖書編號(hào)Varchar(6)ord_datesales表銷售日期datetimeqtysales表銷售量smallintamount計(jì)算生成(qty*price)銷售額moneyETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的FactSales表FaETL過程新建SSIS項(xiàng)目,并將pubs_stage數(shù)據(jù)庫(kù)中的數(shù)據(jù)轉(zhuǎn)換并加載到pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中。SSIS項(xiàng)目由若干SSIS程序包的構(gòu)成,其中一個(gè)為主程序包(啟動(dòng))。SSIS程序包由一個(gè)控制流和若干個(gè)數(shù)據(jù)流構(gòu)成。ETL過程新建SSIS項(xiàng)目,并將pubs_stage數(shù)據(jù)庫(kù)中多維數(shù)據(jù)集和OLAPOLAP的提出(1993年)1981年圖靈獎(jiǎng)獲得者:埃德加·科德(EdgarFrankCodd)—“關(guān)系數(shù)據(jù)庫(kù)之父”多維數(shù)據(jù)集和OLAPOLAP的提出(1993年)1981年圖多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAPReport提出關(guān)于OLAP的簡(jiǎn)明定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。快速性(Fast)——OLAP系統(tǒng)必須能快速響應(yīng)用戶的分析查詢要求,對(duì)于用戶大部分分析要求在5秒鐘內(nèi)作出反應(yīng),否則超過30秒用戶可能會(huì)失去分析的主線索,影響分析質(zhì)量。多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAP多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAPReport提出關(guān)于OLAP的簡(jiǎn)明定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。分析性(Analysis)——OLAP系統(tǒng)能處理任何與用戶和應(yīng)用有關(guān)的邏輯分析和統(tǒng)計(jì)分析,在需要的情況下還允許用戶無需編程就可為分析和生成報(bào)表定義一些新的特殊運(yùn)算,將其作為分析的一部分,并以用戶理想的方式給出報(bào)告。用戶可以在OLAP平臺(tái)上進(jìn)行數(shù)據(jù)分析,也可以與其他外部分析工具交互信息,同時(shí)應(yīng)提供靈活開放的報(bào)表處理功能,保存分析結(jié)果。多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAP多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAPReport提出關(guān)于OLAP的簡(jiǎn)明定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。共享性(Shared)——OLAP系統(tǒng)應(yīng)能實(shí)現(xiàn)在多用戶環(huán)境下的安全保密要求和并發(fā)控制。多個(gè)用戶同時(shí)使用,能夠根據(jù)用戶所屬的安全級(jí)別,讓他們只能看到自身權(quán)限下的信息。多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAP多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAPReport提出關(guān)于OLAP的簡(jiǎn)明定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。多維性(Multidimensional)——OLAP系統(tǒng)能對(duì)數(shù)據(jù)進(jìn)行多維視圖和分析,是OLAP的關(guān)鍵屬性。多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAP多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAPReport提出關(guān)于OLAP的簡(jiǎn)明定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。信息性(Information)——OLAP系統(tǒng)具有管理數(shù)據(jù)和獲得信息的能力,能管理大量的數(shù)據(jù)并即時(shí)地獲得用戶所需信息。多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAP多維數(shù)據(jù)集和OLAPOLAP與數(shù)據(jù)倉(cāng)庫(kù)關(guān)系緊密OLAP分析與數(shù)據(jù)倉(cāng)庫(kù)的關(guān)系十分緊密。數(shù)據(jù)倉(cāng)庫(kù)的建立,解決了依據(jù)主題進(jìn)行數(shù)據(jù)存儲(chǔ)的問題,提高了數(shù)據(jù)的存取速度;而OLAP分析構(gòu)成了數(shù)據(jù)倉(cāng)庫(kù)的表現(xiàn)層,將數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)通過不同的維和指標(biāo),靈活地展現(xiàn)出來,提高了數(shù)據(jù)的展現(xiàn)能力,進(jìn)而提高了數(shù)據(jù)的分析能力。多維數(shù)據(jù)集和OLAPOLAP與數(shù)據(jù)倉(cāng)庫(kù)關(guān)系緊密OLAP分析與多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)集多維數(shù)據(jù)集(cube)——OLAP中的主要對(duì)象,通常也稱作多維立方體。cube是一個(gè)數(shù)據(jù)集合,通常由數(shù)據(jù)倉(cāng)庫(kù)的子集構(gòu)造,把一組維度和度量值合理組織,最后匯總成多維結(jié)構(gòu)。多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)集多維數(shù)據(jù)集(cube)——OL多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)集銷售數(shù)量10000玩具電器銷售地區(qū)北京上海江蘇1234服裝化妝品產(chǎn)品時(shí)間(月)以時(shí)間、銷售地區(qū)、產(chǎn)品三個(gè)維度構(gòu)成的多維數(shù)據(jù)集多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)集銷售數(shù)量玩具電器銷售地區(qū)北京多維數(shù)據(jù)集和OLAP的實(shí)現(xiàn)以Pubs_DW數(shù)據(jù)庫(kù)為基礎(chǔ),利用SQLServerAnalysisService開發(fā)PubsAS多維數(shù)據(jù)庫(kù)以支持OLAP分析。Pubs_DW(關(guān)系數(shù)據(jù)庫(kù))FactSalesFactBookAuthorDimPublisherDimBookDimAuthorDimStoreDimDateSSASPubs_AS(多維數(shù)據(jù)集)SalesCube(Sales多維數(shù)據(jù)集)Sales度量值組:SalesAmountSalesQtyBookAuthor中間度量值組維度:BookAuthorStorePublisherDate多維數(shù)據(jù)集和OLAP的實(shí)現(xiàn)以Pubs_DW數(shù)據(jù)庫(kù)為基礎(chǔ),利用60多維數(shù)據(jù)集和OLAP的實(shí)現(xiàn)多維數(shù)據(jù)庫(kù)的數(shù)據(jù)源(DS)pubs_DW數(shù)據(jù)源視圖(DSV)多維數(shù)據(jù)庫(kù)pubs_AS多維數(shù)據(jù)集(Cube)度量值和維度聚合SSAS多維數(shù)據(jù)庫(kù)體系結(jié)構(gòu)多維數(shù)據(jù)集和OLAP的實(shí)現(xiàn)多維數(shù)據(jù)庫(kù)的數(shù)據(jù)源(DS)數(shù)據(jù)源視61多維數(shù)據(jù)集和OLAP的實(shí)現(xiàn)分析服務(wù)項(xiàng)目開發(fā)步驟創(chuàng)建數(shù)據(jù)源創(chuàng)建數(shù)據(jù)源視圖創(chuàng)建維度(公共維度)創(chuàng)建多維數(shù)據(jù)集(度量值)處理、部署項(xiàng)目瀏覽多維數(shù)據(jù)集多維數(shù)據(jù)集和OLAP的實(shí)現(xiàn)分析服務(wù)項(xiàng)目開發(fā)步驟62多維數(shù)據(jù)集和OLAP的實(shí)現(xiàn)分析服務(wù)項(xiàng)目開發(fā)要點(diǎn)每個(gè)分析服務(wù)項(xiàng)目必須至少包含一個(gè)數(shù)據(jù)源每個(gè)分析服務(wù)項(xiàng)目必須至少包含一個(gè)數(shù)據(jù)源視圖每個(gè)分析服務(wù)項(xiàng)目必須包含至少一個(gè)維度和多維數(shù)據(jù)集多維數(shù)據(jù)集必須包含在一個(gè)分析服務(wù)項(xiàng)目中每個(gè)分析服務(wù)項(xiàng)目可以包含多個(gè)多維數(shù)據(jù)集多維數(shù)據(jù)集和OLAP的實(shí)現(xiàn)分析服務(wù)項(xiàng)目開發(fā)要點(diǎn)63多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法OLAP多維分析對(duì)多維數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行上卷、下鉆、切片、切塊、旋轉(zhuǎn)等各種分析操作,以便剖析數(shù)據(jù),使用戶從多個(gè)角度、多個(gè)側(cè)面、多個(gè)層次來觀察多維數(shù)據(jù),從而發(fā)掘數(shù)據(jù)中蘊(yùn)涵的對(duì)自己有用的信息。多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法OLAP多維分析對(duì)多維數(shù)多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——切片切片(Slice)——對(duì)多維數(shù)據(jù)集的某個(gè)維選定一個(gè)維成員,這種選擇操作就稱為切片。例如:Cube(維1,維2,…,維i,…,維n,度量值)對(duì)維i選定了某個(gè)維成員,則(維1,維2,…,維i成員,…,維n,度量值)就是該Cube在維i上的一個(gè)切片,切片的數(shù)量取決于維i上的維成員的個(gè)數(shù)。多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——切片切片(Slice多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——切片“時(shí)間=第1季度”
在三維立方體上切片的結(jié)果是得到一個(gè)二維的平面數(shù)據(jù)多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——切片“時(shí)間=第1季度4.1OLAP概述多維數(shù)據(jù)分析方法——切塊切塊(Dice)——在一個(gè)多維數(shù)據(jù)集中對(duì)兩個(gè)及兩個(gè)以上的維選定維成員的操作可以稱為切塊。例如:Cube(維1,維2,…,維i,…,維k,…,維n,度量值)對(duì)維i,…,維k,選定了維成員,則(維1,維2,…,維i成員,…,維k成員,…,維n,度量值)就是該Cube在維i,…,維k上的一個(gè)切塊。顯然,當(dāng)i=k時(shí),切塊操作就退化成切片操作。4.1OLAP概述多維數(shù)據(jù)分析方法——切塊切塊(Dice)多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——切塊(貸款=“正?!?/p>
or“次級(jí)”)And(時(shí)間=“1季度”
or“2季度”)And(經(jīng)濟(jì)性質(zhì)=“集體“or”個(gè)人”or”其它“)切塊的結(jié)果是得到了一個(gè)子立方體多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——切塊(貸款=“正?!倍嗑S數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——上卷上卷(Roll-up)——上卷是對(duì)數(shù)據(jù)進(jìn)行更為宏觀的觀察。通過在維的等級(jí)中上升或通過消除某個(gè)或某些維來觀察更概括的數(shù)據(jù)。多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——上卷上卷(Roll-多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——上卷上卷(1)——在維的等級(jí)中上升沿著時(shí)間維上卷,由“季度”上升到半年
多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——上卷上卷(1)——在4.1OLAP概述多維數(shù)據(jù)分析方法——上卷上卷(2)——消除一個(gè)或多個(gè)維消除“經(jīng)濟(jì)性質(zhì)”維度
4.1OLAP概述多維數(shù)據(jù)分析方法——上卷上卷(2)——消多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——下鉆下鉆(Drill-down)——下鉆是對(duì)數(shù)據(jù)進(jìn)行更為詳細(xì)的觀察。通過在維的等級(jí)中下降或通過引入某個(gè)或某些維來更細(xì)致的觀察數(shù)據(jù)。多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——下鉆下鉆(Drill多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——下鉆沿時(shí)間維下鉆多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——下鉆沿時(shí)間維下鉆多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——旋轉(zhuǎn)旋轉(zhuǎn)(Pivot)——旋轉(zhuǎn)又稱為轉(zhuǎn)軸(Rotate),將多維數(shù)據(jù)集中各個(gè)維的角度進(jìn)行轉(zhuǎn)動(dòng),將不同維進(jìn)行交換顯示,以使用戶更加直觀地觀察數(shù)據(jù)集中不同維之間的關(guān)系。多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——旋轉(zhuǎn)旋轉(zhuǎn)(Pivot多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——旋轉(zhuǎn)交換“時(shí)間”和“經(jīng)濟(jì)性質(zhì)”軸多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)分析方法——旋轉(zhuǎn)交換“時(shí)間”和“數(shù)據(jù)倉(cāng)庫(kù)與OLAP
廣東工業(yè)大學(xué)艾丹祥數(shù)據(jù)倉(cāng)庫(kù)與OLAP
廣東工業(yè)大學(xué)艾丹祥數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例
數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例
案例背景Pub是美國(guó)的一家圖書出版公司,希望構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)。其中銷售部門的需求比較急迫,希望能在短時(shí)間內(nèi)實(shí)現(xiàn)對(duì)銷售業(yè)績(jī)的分析。根據(jù)Pub公司的情況,考慮采用金博爾的DMDW的開發(fā)模式,即先為銷售部門設(shè)計(jì)一個(gè)數(shù)據(jù)集市,其他部門數(shù)據(jù)集市的設(shè)計(jì)可參照此模型。案例背景Pub是美國(guó)的一家圖書出版公司,希望構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)。其收集項(xiàng)目需求準(zhǔn)備:研究選定的業(yè)務(wù)過程(術(shù)語、步驟、度量方法)采訪:鉆研選定的業(yè)務(wù)過程(理解使其運(yùn)作所需的分析、數(shù)據(jù)模型和技術(shù))分析:業(yè)務(wù)過程相關(guān)的數(shù)據(jù)資源歸檔對(duì)于Pub公司:選定“銷售”業(yè)務(wù)過程后,通過采訪了解其與銷售分析相關(guān)的問題,如通過什么方式銷售、有哪些銷售地區(qū)等。收集項(xiàng)目需求準(zhǔn)備:研究選定的業(yè)務(wù)過程(術(shù)語、步驟、度量方法)收集項(xiàng)目需求基本業(yè)務(wù)狀況Pub公司在美國(guó)各地均有出版社,出版社負(fù)責(zé)聯(lián)系作者、出版圖書,已出版的圖書將由各地的代銷書店進(jìn)行銷售。收集項(xiàng)目需求基本業(yè)務(wù)狀況收集項(xiàng)目需求業(yè)務(wù)分析需求銷售部門最關(guān)心銷售的業(yè)績(jī),主要通過銷售額和銷售量進(jìn)行考核。收集項(xiàng)目需求業(yè)務(wù)分析需求數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例業(yè)務(wù)分析需求希望針對(duì)每個(gè)出版社作圖書銷售業(yè)績(jī)分析。希望針對(duì)每個(gè)國(guó)家的出版社作圖書銷售業(yè)績(jī)分析。希望針對(duì)每個(gè)州的出版社作圖書銷售業(yè)績(jī)分析。希望針對(duì)每城市的出版社作圖書銷售業(yè)績(jī)分析。希望針對(duì)每本圖書作銷售業(yè)績(jī)分析。希望針對(duì)每類圖書做銷售業(yè)績(jī)分析。希望針對(duì)每年出版的圖書做銷售業(yè)績(jī)分析。希望針對(duì)每位作者所編寫的圖書做銷售業(yè)績(jī)分析。希望針對(duì)每個(gè)書店作圖書銷售業(yè)績(jī)分析。希望針對(duì)每個(gè)州的書店作圖書銷售業(yè)績(jī)分析。希望針對(duì)每個(gè)城市的書店作圖書銷售業(yè)績(jī)分析。希望針對(duì)年、月、日作銷售業(yè)績(jī)分析。數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例業(yè)務(wù)分析需求數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例銷售業(yè)務(wù)的總線矩陣業(yè)務(wù)實(shí)體業(yè)務(wù)過程出版社圖書書店出版日期銷售XXXX數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例銷售業(yè)務(wù)的總線矩陣業(yè)務(wù)實(shí)體業(yè)務(wù)過程出版社圖書收集項(xiàng)目需求數(shù)據(jù)資源狀況公司的業(yè)務(wù)數(shù)據(jù)庫(kù)為Pubs數(shù)據(jù)庫(kù)收集項(xiàng)目需求數(shù)據(jù)資源狀況收集項(xiàng)目需求數(shù)據(jù)資源狀況Pubs中與銷售業(yè)務(wù)有關(guān)的表收集項(xiàng)目需求數(shù)據(jù)資源狀況根據(jù)總線矩陣建立模型氣泡圖建立多維數(shù)據(jù)模型業(yè)務(wù)實(shí)體業(yè)務(wù)過程出版社圖書書店銷售日期銷售XXXX訂單銷售日期圖書書店出版社根據(jù)總線矩陣建立模型氣泡圖建立多維數(shù)據(jù)模型業(yè)務(wù)實(shí)體業(yè)務(wù)過程出銷售日期建立多維數(shù)據(jù)模型訂單銷售日期圖書書店出版社銷售日期建立多維數(shù)據(jù)模型訂單銷售日期圖書書店出版社銷售日期日期維度的粒度級(jí)別通常為一天日期維度表需要專門生成(如利用Excel工具)日期維度表中的時(shí)間范圍根據(jù)業(yè)務(wù)需求決定建立多維數(shù)據(jù)模型銷售日期建立多維數(shù)據(jù)模型銷售日期日期維度至少要包含年、月、日期三個(gè)屬性建立多維數(shù)據(jù)模型DimDate屬性名稱功能描述FullDate日期DateName日期名Month月MonthName月名Year年其中FullDate、Month、MonthName形成層次。銷售日期建立多維數(shù)據(jù)模型DimDate屬性名稱功能描述Ful出版社建立多維數(shù)據(jù)模型訂單銷售日期圖書書店出版社出版社建立多維數(shù)據(jù)模型訂單銷售日期圖書書店出版社出版社建立多維數(shù)據(jù)模型字段名稱說明pub_id出版社編號(hào)pub_name出版社名city所在市state所在州country所在國(guó)出版社建立多維數(shù)據(jù)模型字段名稱說明pub_id出版社編號(hào)pu出版社出版社維度可以直接包含出版社名、市、州、國(guó)家等屬性建立多維數(shù)據(jù)模型DimPublisher屬性名稱功能描述pub_id出版社編號(hào)pub_name出版社名稱pub_city城市pub_state州pub_country國(guó)家其中pub_name、pub_city、pub_state、pub_country形成層次。出版社建立多維數(shù)據(jù)模型DimPublisher屬性名稱功能描書店建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社書店建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社書店建立多維數(shù)據(jù)模型字段名稱說明stor_id書店編號(hào)stor_name書店名稱city所在市state所在州書店建立多維數(shù)據(jù)模型字段名稱說明stor_id書店編號(hào)sto書店書店維度可以直接包含書店名、市、州等屬性建立多維數(shù)據(jù)模型書店建立多維數(shù)據(jù)模型圖書建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社圖書建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社圖書建立多維數(shù)據(jù)模型字段名稱說明title_id圖書編號(hào)pub_id出版社編號(hào)title圖書名type圖書類型price圖書單價(jià)pubdate出版日期圖書建立多維數(shù)據(jù)模型字段名稱說明title_id圖書編號(hào)pu圖書圖書維度可以直接包含圖書名、類型、出版年等屬性建立多維數(shù)據(jù)模型DimBook屬性名稱功能描述book_id圖書編號(hào)book_name圖書名book_type圖書類型pubyear出版年其中book_name、book_type形成層次結(jié)構(gòu)。圖書建立多維數(shù)據(jù)模型DimBook屬性名稱功能描述book_圖書圖書維度無法直接包含作者屬性建立多維數(shù)據(jù)模型圖書建立多維數(shù)據(jù)模型作者建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社作者圖書作者關(guān)系作者建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社作者圖書作者關(guān)作者建立多維數(shù)據(jù)模型字段名稱說明au_id作者編號(hào)au_lname作者名au_fname作者姓作者建立多維數(shù)據(jù)模型字段名稱說明au_id作者編號(hào)au_ln作者作者維度可以直接包含作者名等屬性建立多維數(shù)據(jù)模型DimAuthor屬性名稱功能描述au_id作者編號(hào)au_name作者名au_fname+au_lname作者建立多維數(shù)據(jù)模型DimAuthor屬性名稱功能描述au_圖書作者關(guān)系建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社作者圖書作者關(guān)系圖書作者關(guān)系建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社作者圖圖書作者關(guān)系建立多維數(shù)據(jù)模型字段名稱說明au_id作者編號(hào)title_id圖書編號(hào)圖書作者關(guān)系建立多維數(shù)據(jù)模型字段名稱說明au_id作者編號(hào)t建立多維數(shù)據(jù)模型圖書作者關(guān)系圖書作者關(guān)系事實(shí)表只包含鍵值列,不包含度量值列,其目的是為了記錄圖書和作者之間的關(guān)系事實(shí)。FactBookAuthor(中間事實(shí)表)屬性名稱功能描述鍵值列book_id圖書編號(hào)au_id作者編號(hào)建立多維數(shù)據(jù)模型圖書作者關(guān)系FactBookAuthor(中訂單建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社作者圖書作者關(guān)系訂單建立多維數(shù)據(jù)模型訂單出版日期圖書書店出版社作者圖書作者關(guān)訂單建立多維數(shù)據(jù)模型字段名稱說明stor_id書店編號(hào)title_id圖書編號(hào)qty訂購(gòu)數(shù)量ord_date訂購(gòu)日期訂單建立多維數(shù)據(jù)模型字段名稱說明stor_id書店編號(hào)tit建立多維數(shù)據(jù)模型訂單訂單事實(shí)表中要包含日期、出版社、書店、圖書等鍵值列,還要包含銷售額、銷售量2個(gè)度量值列,其目的是為了記錄銷售事實(shí)。建立多維數(shù)據(jù)模型訂單建立多維數(shù)據(jù)模型訂單FactSales屬性名稱來源功能描述鍵值列pub_idpublishers表出版社編號(hào)stor_idstores表書店編號(hào)book_idtitles表圖書編號(hào)ord_datesales表銷售日期度量值列qtysales表銷售量amount計(jì)算生成(qty*price)銷售額建立多維數(shù)據(jù)模型訂單FactSales屬性名稱來源功能描述鍵建立多維數(shù)據(jù)模型最終,確定數(shù)據(jù)集市包括以下多維數(shù)據(jù)模型:主題——圖書銷售業(yè)績(jī)度量值——圖書銷售量圖書銷售額維度——出版社(國(guó)別-州-城市-出版社)作者(作者姓名)圖書(圖書類別-單一圖書,圖書出版年)書店(州-市-書店)銷售日期(年-月-日)建立多維數(shù)據(jù)模型最終,確定數(shù)據(jù)集市包括以下多維數(shù)據(jù)模型:主題Microsoft數(shù)據(jù)倉(cāng)庫(kù)工具集核心數(shù)據(jù)倉(cāng)庫(kù)工具集——SQLServer關(guān)系引擎(RDBMS):實(shí)現(xiàn)關(guān)系數(shù)據(jù)庫(kù)SQLServerIntegrationService(SSIS):實(shí)現(xiàn)ETL系統(tǒng)SQLServerAnalysisService(SSAS):實(shí)現(xiàn)多維數(shù)據(jù)庫(kù),支持OLAP查詢,實(shí)現(xiàn)數(shù)據(jù)挖掘SQLServerReportingService(SSRS):定義報(bào)表開發(fā)和管理工具:SQLServerBIDevelopmentStudio(BIDS)和SQLServerManagementStudio。Microsoft數(shù)據(jù)倉(cāng)庫(kù)工具集核心數(shù)據(jù)倉(cāng)庫(kù)工具集——SQMicrosoft數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的體系結(jié)構(gòu)源系統(tǒng)數(shù)據(jù)庫(kù)ETL聚合(支持OLAP)源系統(tǒng)數(shù)據(jù)庫(kù)源系統(tǒng)數(shù)據(jù)庫(kù)事實(shí)表和維度表度量和維度前端工具核心數(shù)據(jù)倉(cāng)庫(kù)RDBMSSSISSSASSSRSMicrosoft數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的體系結(jié)構(gòu)源系統(tǒng)數(shù)據(jù)庫(kù)ETLETL過程利用SQLServerIntegrationService對(duì)Pubs數(shù)據(jù)庫(kù)進(jìn)行抽取和整理,形成Pubs_DW數(shù)據(jù)倉(cāng)庫(kù)。先將數(shù)據(jù)從源事務(wù)數(shù)據(jù)中提取到中間數(shù)據(jù)庫(kù)Pubs_Stage再對(duì)中間數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行轉(zhuǎn)換并加載到目標(biāo)關(guān)系數(shù)據(jù)倉(cāng)庫(kù)Pubs_DWETL過程利用SQLServerIntegrationETL過程Pubs數(shù)據(jù)庫(kù)(業(yè)務(wù)數(shù)據(jù)庫(kù))PublishersPub_infoEmployeeJobsRoychedTitlesAuthorsTitleauthorSalesStoresDiscountsPubs_Stage(臨時(shí)數(shù)據(jù)庫(kù))PublishersTitlesTitleauthorAuthorSalesStoresDatePubs_DW(數(shù)據(jù)倉(cāng)庫(kù))FactSalesFactBookAuthorDimPublisherDimBookDimAuthorDimStoreDimDateDTSSSISDate.xlsETL過程Pubs數(shù)據(jù)庫(kù)Pubs_StagePubs_DWDETL過程利用DTS和SQLServerIntegrationService對(duì)Pubs數(shù)據(jù)庫(kù)進(jìn)行抽取和整理,形成Pubs_DW數(shù)據(jù)倉(cāng)庫(kù)。先將數(shù)據(jù)從源事務(wù)數(shù)據(jù)中提取到中間數(shù)據(jù)庫(kù)Pubs_Stage(DTS工具)再對(duì)中間數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行轉(zhuǎn)換并加載到目標(biāo)關(guān)系數(shù)據(jù)倉(cāng)庫(kù)Pubs_DW(SSIS工具)ETL過程利用DTS和SQLServerIntegratETL過程利用DTS將pubs數(shù)據(jù)庫(kù)和date.xls中的數(shù)據(jù)直接導(dǎo)出到pubs_stage數(shù)據(jù)庫(kù)中。Pubs_Stage的結(jié)構(gòu)ETL過程利用DTS將pubs數(shù)據(jù)庫(kù)和date.xls中的數(shù)ETL過程新建pubs_DW數(shù)據(jù)倉(cāng)庫(kù)ETL過程新建pubs_DW數(shù)據(jù)倉(cāng)庫(kù)ETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimDate表DimDate屬性名稱功能描述Sqlserver數(shù)據(jù)類型FullDate日期DatetimeDateName日期名varchar(20)Month月intMonthName月名varchar(20)Year年intETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimDate表DimDETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimPublisher表DimPublisher屬性名稱功能描述Sqlserver數(shù)據(jù)類型pub_id出版社編號(hào)Varchar(4)pub_name出版社名稱varchar(40)pub_city城市varchar(20)pub_state州varchar(2)pub_country國(guó)家varchar(30)ETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimPublisherETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimStore表DimStore屬性名稱功能描述Sqlserver數(shù)據(jù)類型store_id書店編號(hào)Varchar(4)store_name書店名稱varchar(40)store_city城市varchar(20)store_state州varchar(2)ETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimStore表DimETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimBook表DimBook屬性名稱功能描述Sqlserver數(shù)據(jù)類型book_id圖書編號(hào)Varchar(6)book_name圖書名varchar(80)book_type圖書類型varchar(12)pubyear出版年intETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimBook表DimBETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimAuthor表DimAuthor屬性名稱功能描述Sqlserver數(shù)據(jù)類型au_id作者編號(hào)varchar(11)au_name作者名au_fname+au_lnamevarchar(80)ETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的DimAuthor表DiETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的FactBookAuthor表FactBookAuthor屬性名稱功能描述Sqlserver數(shù)據(jù)類型book_id圖書編號(hào)Varchar(6)au_id作者編號(hào)varchar(11)ETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的FactBookAuthETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的FactSales表FactSales屬性名稱來源功能描述Sqlserver數(shù)據(jù)類型pub_idpublishers表出版社編號(hào)Varchar(4)stor_idstores表書店編號(hào)Varchar(4)book_idtitles表圖書編號(hào)Varchar(6)ord_datesales表銷售日期datetimeqtysales表銷售量smallintamount計(jì)算生成(qty*price)銷售額moneyETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的FactSales表FaETL過程新建SSIS項(xiàng)目,并將pubs_stage數(shù)據(jù)庫(kù)中的數(shù)據(jù)轉(zhuǎn)換并加載到pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中。SSIS項(xiàng)目由若干SSIS程序包的構(gòu)成,其中一個(gè)為主程序包(啟動(dòng))。SSIS程序包由一個(gè)控制流和若干個(gè)數(shù)據(jù)流構(gòu)成。ETL過程新建SSIS項(xiàng)目,并將pubs_stage數(shù)據(jù)庫(kù)中多維數(shù)據(jù)集和OLAPOLAP的提出(1993年)1981年圖靈獎(jiǎng)獲得者:埃德加·科德(EdgarFrankCodd)—“關(guān)系數(shù)據(jù)庫(kù)之父”多維數(shù)據(jù)集和OLAPOLAP的提出(1993年)1981年圖多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAPReport提出關(guān)于OLAP的簡(jiǎn)明定義FASMI(FastAnalysisofSharedMultidimensionalInformation)??焖傩裕‵ast)——OLAP系統(tǒng)必須能快速響應(yīng)用戶的分析查詢要求,對(duì)于用戶大部分分析要求在5秒鐘內(nèi)作出反應(yīng),否則超過30秒用戶可能會(huì)失去分析的主線索,影響分析質(zhì)量。多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAP多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAPReport提出關(guān)于OLAP的簡(jiǎn)明定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。分析性(Analysis)——OLAP系統(tǒng)能處理任何與用戶和應(yīng)用有關(guān)的邏輯分析和統(tǒng)計(jì)分析,在需要的情況下還允許用戶無需編程就可為分析和生成報(bào)表定義一些新的特殊運(yùn)算,將其作為分析的一部分,并以用戶理想的方式給出報(bào)告。用戶可以在OLAP平臺(tái)上進(jìn)行數(shù)據(jù)分析,也可以與其他外部分析工具交互信息,同時(shí)應(yīng)提供靈活開放的報(bào)表處理功能,保存分析結(jié)果。多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAP多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAPReport提出關(guān)于OLAP的簡(jiǎn)明定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。共享性(Shared)——OLAP系統(tǒng)應(yīng)能實(shí)現(xiàn)在多用戶環(huán)境下的安全保密要求和并發(fā)控制。多個(gè)用戶同時(shí)使用,能夠根據(jù)用戶所屬的安全級(jí)別,讓他們只能看到自身權(quán)限下的信息。多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAP多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAPReport提出關(guān)于OLAP的簡(jiǎn)明定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。多維性(Multidimensional)——OLAP系統(tǒng)能對(duì)數(shù)據(jù)進(jìn)行多維視圖和分析,是OLAP的關(guān)鍵屬性。多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAP多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAPReport提出關(guān)于OLAP的簡(jiǎn)明定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。信息性(Information)——OLAP系統(tǒng)具有管理數(shù)據(jù)和獲得信息的能力,能管理大量的數(shù)據(jù)并即時(shí)地獲得用戶所需信息。多維數(shù)據(jù)集和OLAP1995年OLAP專門研究機(jī)構(gòu)OLAP多維數(shù)據(jù)集和OLAPOLAP與數(shù)據(jù)倉(cāng)庫(kù)關(guān)系緊密OLAP分析與數(shù)據(jù)倉(cāng)庫(kù)的關(guān)系十分緊密。數(shù)據(jù)倉(cāng)庫(kù)的建立,解決了依據(jù)主題進(jìn)行數(shù)據(jù)存儲(chǔ)的問題,提高了數(shù)據(jù)的存取速度;而OLAP分析構(gòu)成了數(shù)據(jù)倉(cāng)庫(kù)的表現(xiàn)層,將數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)通過不同的維和指標(biāo),靈活地展現(xiàn)出來,提高了數(shù)據(jù)的展現(xiàn)能力,進(jìn)而提高了數(shù)據(jù)的分析能力。多維數(shù)據(jù)集和OLAPOLAP與數(shù)據(jù)倉(cāng)庫(kù)關(guān)系緊密OLAP分析與多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)集多維數(shù)據(jù)集(cube)——OLAP中的主要對(duì)象,通常也稱作多維立方體。cube是一個(gè)數(shù)據(jù)集合,通常由數(shù)據(jù)倉(cāng)庫(kù)的子集構(gòu)造,把一組維度和度量值合理組織,最后匯總成多維結(jié)構(gòu)。多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)集多維數(shù)據(jù)集(cube)——OL多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)集銷售數(shù)量10000玩具電器銷售地區(qū)北京上海江蘇1234服裝化妝品產(chǎn)品時(shí)間(月)以時(shí)間、銷售地區(qū)、產(chǎn)品三個(gè)維度構(gòu)成的多維數(shù)據(jù)集多維數(shù)據(jù)集和OLAP多維數(shù)據(jù)集銷售數(shù)量玩具電器銷售地區(qū)北京多維數(shù)據(jù)集和OLAP的實(shí)現(xiàn)以Pubs_DW數(shù)據(jù)庫(kù)為基礎(chǔ),利用SQLServerAnalysisService開發(fā)PubsAS多維數(shù)據(jù)庫(kù)以支持OLAP分析。Pubs_DW(關(guān)系數(shù)據(jù)庫(kù))FactSalesFactBookAuthorDimPublisherDimBookDimAuthorDimStoreDimDateSSASPubs_AS(多維數(shù)據(jù)集)SalesCube(Sales多維數(shù)據(jù)集)Sales度量值組:SalesAmountSalesQtyBookAuthor中間度量值組維度:BookAuthorStorePubli
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 附著升降式腳手架培訓(xùn)
- 部門年度培訓(xùn)總結(jié)
- 艾滋病患者護(hù)理倫理
- 預(yù)防跌倒知識(shí)
- 幼兒教師骨干教師
- 廣告行業(yè)設(shè)計(jì)師簡(jiǎn)歷
- 住院患者健康教育的意義
- 轉(zhuǎn)租商鋪?zhàn)赓U合同
- 腎小球腎炎病理分型
- 山中雜居作者情感解讀教案
- 大學(xué)生心理健康 第3章-教學(xué)教案-自我意識(shí)
- 名著《駱駝祥子》中考真題及典型模擬題訓(xùn)練(原卷版)
- 女性健康知識(shí)講座超美的課件
- 2025年興安職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)匯編
- 2025年黑龍江職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)審定版
- 2025年湖南汽車工程職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)參考答案
- 中職高教版(2023)語文職業(yè)模塊-第一單元1.2寧夏閩寧鎮(zhèn):昔日干沙灘今日金沙灘【課件】
- 2025年春季1530安全教育記錄主題
- 2024年國(guó)家公務(wù)員考試行測(cè)真題附解析答案
- 基本藥物制度政策培訓(xùn)課件
- 《無人機(jī)測(cè)繪技術(shù)》項(xiàng)目1任務(wù)3無人機(jī)測(cè)繪基礎(chǔ)知識(shí)
評(píng)論
0/150
提交評(píng)論