版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第第3 3章章 設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)(2)(2)數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)n概念設(shè)計(jì)n實(shí)體關(guān)系圖(ERD)n邏輯設(shè)計(jì)n數(shù)據(jù)項(xiàng)集(DIS)n維度事實(shí)模型DFMn物理設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)倉(cāng)庫(kù)的概念設(shè)計(jì)n實(shí)體關(guān)系圖(ERD)n以實(shí)體和關(guān)系為特征n實(shí)體用橢圓表示n關(guān)系用箭頭表示n箭頭方向和數(shù)量表示關(guān)系的基數(shù)實(shí)體關(guān)系的表示實(shí)體關(guān)系的表示實(shí)體和屬性的建模慣例n唯一的名字n標(biāo)題風(fēng)格n完整、非縮寫(xiě)的單詞n單數(shù)名詞n企業(yè)ERD由企業(yè)內(nèi)各個(gè)反映不同群體觀點(diǎn)的高層數(shù)據(jù)模型組合而成。數(shù)據(jù)倉(cāng)庫(kù)的邏輯數(shù)據(jù)倉(cāng)庫(kù)的邏輯設(shè)計(jì)n對(duì)概念模型中標(biāo)識(shí)的每個(gè)主要主題域或?qū)嶓w,都要建立一個(gè)中間層模型n中間層數(shù)據(jù)模型包括四個(gè)基本構(gòu)造:n主要數(shù)據(jù)分組n每
2、個(gè)主要主題域只有一個(gè)主要數(shù)據(jù)分組,包含了只存在一次的屬性n二級(jí)數(shù)據(jù)分組n包含每個(gè)主要主題域可以存在多次的數(shù)據(jù)屬性n連接器n表示二個(gè)主要主題域間的關(guān)系n數(shù)據(jù)的“類型”n由指向數(shù)據(jù)分組右邊的的線段表示,左邊分組為超類型,右邊分組為子類型中間層數(shù)據(jù)模型中間層數(shù)據(jù)模型中間層數(shù)據(jù)模型例子中間層數(shù)據(jù)模型例子nERD層標(biāo)識(shí)了一個(gè)關(guān)系后,在DIS層需要用一對(duì)連接器關(guān)系來(lái)表現(xiàn)中間層數(shù)據(jù)模型例子中間層數(shù)據(jù)模型例子中間層數(shù)據(jù)模型例子中間層數(shù)據(jù)模型例子企業(yè)企業(yè)DISn企業(yè)DIS由企業(yè)內(nèi)各個(gè)反映不同群體觀點(diǎn)的DIS組合而成。維度事實(shí)模型DFMn事實(shí)是與決策相關(guān)的概念,通常是建模公司內(nèi)發(fā)生的一組事件n維度是范圍有限的事實(shí)
3、屬性,提供了事實(shí)的分析坐標(biāo)事實(shí)n通常對(duì)應(yīng)公司中動(dòng)態(tài)發(fā)生的事件n事實(shí)可能對(duì)應(yīng)一個(gè)實(shí)體或?qū)嶓w間的N元關(guān)系n經(jīng)常發(fā)生更新的實(shí)體是事實(shí)的上佳候選;而靜態(tài)的實(shí)體則不是nSALE-事實(shí)nSRORE-不是事實(shí)星型模型星型模型n主要包含3種邏輯實(shí)體:n事實(shí)表n維度表n聯(lián)系星型模型的特點(diǎn)n文本數(shù)據(jù)與數(shù)值數(shù)據(jù)分離n文本數(shù)據(jù)通常出現(xiàn)在維表中,而數(shù)值數(shù)據(jù)出現(xiàn)在事實(shí)表中n可以為決策支持系統(tǒng)的處理優(yōu)化數(shù)據(jù)事實(shí)表n一個(gè)星型模型只有一個(gè)事實(shí)表n事實(shí)表包括獨(dú)有的標(biāo)識(shí)數(shù)據(jù),同時(shí)包含其本身的獨(dú)有數(shù)據(jù)n事實(shí)表往往是數(shù)字度量,不歡迎描述性信息n事實(shí)表可達(dá)數(shù)百萬(wàn)行或更多n最小粒度原則n事實(shí)表同時(shí)包含指向周圍表(維表)的預(yù)先連接的外鍵n可
4、以有任意多個(gè)外鍵與維表相關(guān)事實(shí)表的內(nèi)容n事實(shí)表的主鍵是所有維度表主鍵的組合鍵n主要是數(shù)字屬性n表很長(zhǎng),但不寬n稀疏的數(shù)據(jù)n假期記錄可能為空n退化的維度n既不是事實(shí)也不是維屬性的數(shù)據(jù)元素n如發(fā)票號(hào)、訂單號(hào)等事實(shí)表設(shè)計(jì)n毛利潤(rùn)=銷售-成本;在已有銷售和成本字段的情況下,是否應(yīng)物理存儲(chǔ)毛利潤(rùn)字段?n應(yīng)存儲(chǔ)n減少用戶出錯(cuò)n便于生成報(bào)表維度表n維度表是事實(shí)表不可分割的伴侶n維度表傾向于將行數(shù)做得相當(dāng)少(通常100萬(wàn)行),而將列數(shù)做得特別大n數(shù)據(jù)倉(cāng)庫(kù)的能力與維度的質(zhì)量和深度成正比n一個(gè)用戶要按星期與商標(biāo)來(lái)查看銷售額,星期與商標(biāo)就必須是可的維度屬性維度內(nèi)容n維度屬性是查詢的約束條件、分組與報(bào)表標(biāo)簽生成的基本
5、來(lái)源n每個(gè)維度用單一的主關(guān)鍵字進(jìn)行定義,主關(guān)鍵字是確保與之相連的事實(shí)表存在完整性的基礎(chǔ)。n非直接相關(guān)屬性n產(chǎn)品:包裹大小與品牌n非規(guī)范化n很多維度變化很緩慢n多級(jí)層次結(jié)構(gòu)n維度表通常有多種多級(jí)層次結(jié)構(gòu)維度中的文本與數(shù)字n維度應(yīng)當(dāng)是文本和離散的n盡量使用詳細(xì)的文本信息取代編碼n數(shù)字屬性放入維度表還是事實(shí)表應(yīng)當(dāng)看它是一個(gè)含有許多取值并參與運(yùn)算的度量(應(yīng)放入事實(shí)表),還是變化不多并參與約束條件的離散取值(應(yīng)放入維度表)n產(chǎn)品尺寸-維度表n產(chǎn)品生產(chǎn)成本-事實(shí)表n例:業(yè)務(wù)數(shù)據(jù)的E-R圖銷售銷售日期商店號(hào)商品號(hào)銷售數(shù)量銷售單位商品商品號(hào)商品名商品類號(hào)存貨星期商店號(hào)商品號(hào)數(shù)量1m1m商店商店號(hào)商店名地址城市
6、省郵編地區(qū)號(hào)1mm11商品類商品類號(hào)商品類名部門號(hào)m1m地區(qū)地區(qū)號(hào)地區(qū)名nE-R圖向多維表的轉(zhuǎn)換n該問(wèn)題的多維表模型中,商品維包括部門、商品和商品大類,地點(diǎn)維包括地區(qū)和商店,忽略存貨,而只注意銷售事實(shí)。在E-R圖中不出現(xiàn)的時(shí)間,在多維模型中增加時(shí)間維。n在多維模型中,實(shí)體與維之間建立映射關(guān)系,聯(lián)系多個(gè)實(shí)體的實(shí)體就成為事實(shí),此處銷售實(shí)體作為事實(shí),其他實(shí)體作為維。然后用維關(guān)鍵字將它轉(zhuǎn)換為星型模型,如圖所示。商品維地區(qū)維時(shí)間維部門地區(qū)年商品大類商店月商品周日銷售事實(shí)E-R圖向多維模型的轉(zhuǎn)換圖向多維模型的轉(zhuǎn)換 時(shí)間 時(shí)間鍵 時(shí)間說(shuō)明 日期 星期 月 年 級(jí)別號(hào) 銷售事實(shí) 時(shí)間鍵 地理位置鍵 商品鍵 銷
7、售數(shù)量 銷售單位 地區(qū) 地理位置鍵 地理位置名 地區(qū)號(hào) 商店號(hào) 級(jí)別號(hào) 商品 商品鍵 商品名 部門號(hào) 商品類號(hào) 級(jí)別號(hào) 利用維關(guān)鍵字制定的星型模型利用維關(guān)鍵字制定的星型模型n在各維中,只有部門,商品類,地區(qū),商店的編號(hào)沒(méi)有具體的說(shuō)明。n為了打印報(bào)表將增加這些編號(hào)的名稱說(shuō)明,即部門名、商店名等,在維表中增加這些說(shuō)明,即修改該星型模型n 時(shí)間 時(shí)間鍵 時(shí)間說(shuō)明 日期 星期 月 年 級(jí)別號(hào) 銷售事實(shí) 時(shí)間鍵 地理位置鍵 商品鍵 銷售數(shù)量 銷售單位 地區(qū) 地理位置鍵 地理位置名 地區(qū)號(hào) 地區(qū)名 商店號(hào) 商店名 級(jí)別號(hào) 商品 商品鍵 商品名 部門號(hào) 部門名 商品類號(hào) 商品類名 級(jí)別號(hào) 修改后的星型模型修
8、改后的星型模型產(chǎn)品維度表n產(chǎn)品關(guān)鍵字(PK)、產(chǎn)品描述、商標(biāo)描述、分類描述、部門描述、包裝類型、包裝尺寸、重量、儲(chǔ)藏類型、貨架類型、貨架高度、貨架深度。n產(chǎn)品維度表每行都有與產(chǎn)品相關(guān)的商標(biāo)與分類,有冗余但易于使用n日期維度:日期關(guān)鍵字、日期描述、星期、年歷月、年歷周、年歷日、月編號(hào)、周編號(hào)、日編號(hào)、財(cái)政日、財(cái)政月、周末指示符、節(jié)假日指示符、銷售旺季、重點(diǎn)事件。n商場(chǎng)維度:商場(chǎng)關(guān)鍵字、名稱、街道、城市、省、郵編、面積、開(kāi)業(yè)時(shí)間。n促銷維度:促銷關(guān)鍵字、名稱、類型、媒體、廣告、優(yōu)惠卷、促銷價(jià)、開(kāi)始時(shí)間、結(jié)束時(shí)間。雪花模型雪花模型星型模型與雪花模型人有了知識(shí),就會(huì)具備各種分析能力,明辨是非的能力。所以我們要勤懇讀書(shū),廣泛閱讀
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度三維激光掃描測(cè)量服務(wù)合同4篇
- 順豐快遞2025年度物流人才培訓(xùn)與交流合同3篇
- 2025年木紋版行業(yè)深度研究分析報(bào)告
- 2025年度床上用品行業(yè)論壇組織與合作合同4篇
- 二零二五年度書(shū)店吧臺(tái)承包與銷售合作協(xié)議4篇
- 二零二五版牧業(yè)養(yǎng)殖廢棄物資源化利用承包協(xié)議4篇
- 【可行性報(bào)告】2025年電子經(jīng)緯儀相關(guān)項(xiàng)目可行性研究報(bào)告
- 2025年度股權(quán)代持與公司品牌建設(shè)及市場(chǎng)推廣協(xié)議4篇
- 2025年度商業(yè)地產(chǎn)瓷磚裝修工程承包合同4篇
- 2025年中國(guó)小青龍膠囊行業(yè)市場(chǎng)發(fā)展前景及發(fā)展趨勢(shì)與投資戰(zhàn)略研究報(bào)告
- 定額〔2025〕1號(hào)文-關(guān)于發(fā)布2018版電力建設(shè)工程概預(yù)算定額2024年度價(jià)格水平調(diào)整的通知
- 2024年城市軌道交通設(shè)備維保及安全檢查合同3篇
- 【教案】+同一直線上二力的合成(教學(xué)設(shè)計(jì))(人教版2024)八年級(jí)物理下冊(cè)
- 湖北省武漢市青山區(qū)2023-2024學(xué)年七年級(jí)上學(xué)期期末質(zhì)量檢測(cè)數(shù)學(xué)試卷(含解析)
- 單位往個(gè)人轉(zhuǎn)賬的合同(2篇)
- 科研倫理審查與違規(guī)處理考核試卷
- GB/T 44101-2024中國(guó)式摔跤課程學(xué)生運(yùn)動(dòng)能力測(cè)評(píng)規(guī)范
- 高危妊娠的評(píng)估和護(hù)理
- 2024年山東鐵投集團(tuán)招聘筆試參考題庫(kù)含答案解析
- 2023年高考全國(guó)甲卷數(shù)學(xué)(理)試卷【含答案】
- 數(shù)獨(dú)題目A4打印版無(wú)答案
評(píng)論
0/150
提交評(píng)論