數(shù)據(jù)倉庫與數(shù)據(jù)挖掘-數(shù)據(jù)倉庫的設(shè)計_第1頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘-數(shù)據(jù)倉庫的設(shè)計_第2頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘-數(shù)據(jù)倉庫的設(shè)計_第3頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘-數(shù)據(jù)倉庫的設(shè)計_第4頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘-數(shù)據(jù)倉庫的設(shè)計_第5頁
已閱讀5頁,還剩12頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)倉庫的設(shè)計(shj)1/16共十七頁2/16數(shù)據(jù)倉庫的需求(xqi)與規(guī)劃數(shù)據(jù)倉庫是企業(yè)信息系統(tǒng)中最為復(fù)雜的部分。從數(shù)據(jù)倉庫使用和構(gòu)建過程本身看,數(shù)據(jù)倉庫系統(tǒng)匯集了來自眾多業(yè)務(wù)系統(tǒng)的數(shù)據(jù),需要支持多個層次、不同用戶的決策需求需要適應(yīng)業(yè)務(wù)的不斷變化,數(shù)據(jù)倉庫的用戶一般是企業(yè)的中上層管理人員或幕僚,他們對決策分析的需求不能預(yù)先做出規(guī)范的說明,只能給設(shè)計人員一個(y )抽象的(模糊的)描述。共十七頁3/16數(shù)據(jù)倉庫的需求(xqi)與規(guī)劃從使用角度看,需要多方面的技巧商業(yè)技巧。業(yè)務(wù)技巧有助于了解數(shù)據(jù)倉庫中所含數(shù)據(jù)的意義和重要性。能夠更好地了解管理決策需要,并將這種需要轉(zhuǎn)換成數(shù)據(jù)倉庫要解決的問題領(lǐng)域

2、知識。與管理活動有關(guān),將決策觀點轉(zhuǎn)化成精確的管理需求,進而轉(zhuǎn)化成解決方案,并對數(shù)據(jù)查詢或挖掘的結(jié)果進行分析、利用。數(shù)據(jù)分析技巧。包括(boku)從大量數(shù)據(jù)中提煉出有價值的信息發(fā)現(xiàn)新的模式和趨勢、找出差異、展示管理上的可取之處。這些技巧部分來自數(shù)學(xué)、統(tǒng)計學(xué)、管理學(xué)、心理學(xué),部分來自直覺和經(jīng)驗。共十七頁4/16數(shù)據(jù)倉庫的需求(xqi)與規(guī)劃從涉及的技術(shù)角度各種( zhn)新技術(shù)商業(yè)平臺分析工具新型數(shù)學(xué)方法共十七頁5/16應(yīng)用需求(數(shù)據(jù)、處理)轉(zhuǎn)換規(guī)則、DBMS功能、優(yōu)化方法需求收集和分析設(shè)計概念結(jié)構(gòu)設(shè)計邏輯結(jié)構(gòu)數(shù)據(jù)模型優(yōu)化設(shè)計物理結(jié)構(gòu)評價設(shè)計,性能預(yù)測物理實現(xiàn)試驗性運行使用、維護數(shù)據(jù)庫應(yīng)用要求,D

3、BMS詳細(xì)特征需求分析階段概念設(shè)計階段邏輯設(shè)計階段物理設(shè)計階段數(shù)據(jù)庫實施階段數(shù)據(jù)庫運行、維護階段不滿意不滿意數(shù)據(jù)庫的開發(fā)(kif)流程共十七頁6/162. 數(shù)據(jù)倉庫的開發(fā)(kif)流程(1)數(shù)據(jù)倉庫規(guī)劃分析階段,在該階段的工作內(nèi)容主要包括(boku):分析數(shù)據(jù)倉庫應(yīng)用環(huán)境,調(diào)查數(shù)據(jù)倉庫開發(fā)需求,完成數(shù)據(jù)倉庫的開發(fā)規(guī)劃。建立包括實體關(guān)系圖、星型模型、雪花模型、元數(shù)據(jù)模型以及數(shù)據(jù)源分析的主題區(qū)數(shù)據(jù)模型,并根據(jù)主題區(qū)數(shù)據(jù)模型開發(fā)數(shù)據(jù)倉庫邏輯的模型。共十七頁7/162. 數(shù)據(jù)倉庫的開發(fā)(kif)流程(2)(2)數(shù)據(jù)倉庫設(shè)計實施階段(jidun),在該階段(jidun)的工作內(nèi)容主要包括:A.按照數(shù)據(jù)倉

4、庫的邏輯模型設(shè)計數(shù)據(jù)倉庫的體系結(jié)構(gòu)。B.設(shè)計數(shù)據(jù)倉庫的物理數(shù)據(jù)庫。C.用物理數(shù)據(jù)庫元數(shù)據(jù)填充面向最終用戶的元數(shù)據(jù)庫。D.對數(shù)據(jù)倉庫中每個目標(biāo)字段確認(rèn)其在業(yè)務(wù)系統(tǒng)或外部數(shù)據(jù)源中的數(shù)據(jù)來源。E.開發(fā)(或購買)用于抽取、清潔、交換和合并數(shù)據(jù)等中間件的程序。F.將數(shù)據(jù)從現(xiàn)有系統(tǒng)中傳送到倉庫中。共十七頁8/162. 數(shù)據(jù)倉庫的開發(fā)(kif)流程(3)(3)數(shù)據(jù)倉庫的使用維護階段,在該階段的工作內(nèi)容主要包括:A.將數(shù)據(jù)倉庫投入實際應(yīng)用,并在應(yīng)用中改進和維護數(shù)據(jù)倉庫。B.對數(shù)據(jù)倉庫進行效益評價(pngji),以為下一個循環(huán)提供依據(jù)。共十七頁9/16數(shù)據(jù)倉庫的生命周期開發(fā)(kif)應(yīng)用全過程開發(fā)(kif)概念

5、模型規(guī)劃與確定需求數(shù)據(jù)倉庫評價數(shù)據(jù)倉庫維護數(shù)據(jù)倉庫應(yīng)用填充與測試數(shù)據(jù)倉庫開發(fā)中間件確定數(shù)據(jù)抽取源數(shù)據(jù)庫與元數(shù)據(jù)設(shè)計設(shè)計體系結(jié)構(gòu)開發(fā)邏輯模型數(shù)據(jù)倉庫開發(fā)過程規(guī)劃分析階段設(shè)計實施階段使用維護階段共十七頁10/16數(shù)據(jù)倉庫的開發(fā)(kif)的需求分析(1)業(yè)主需求的分析數(shù)據(jù)倉庫的業(yè)主關(guān)心的是創(chuàng)建數(shù)據(jù)倉庫的目標(biāo),建立數(shù)據(jù)倉庫給組織戰(zhàn)略帶來的影響,創(chuàng)建數(shù)據(jù)倉庫所需的投資費用以及(yj)所具有的應(yīng)用前景。業(yè)主常常參與數(shù)據(jù)倉庫概念模型的認(rèn)可和評審,批準(zhǔn)開發(fā)方案,為系統(tǒng)以后的不斷升級和連續(xù)投資進行決策。共十七頁11/16數(shù)據(jù)倉庫的開發(fā)(kif)的需求分析(2)(2)設(shè)計者需求的分析數(shù)據(jù)倉庫設(shè)計者不但要收集業(yè)主對

6、數(shù)據(jù)倉庫的需求,還要收集實現(xiàn)這些(zhxi)需求所需的技術(shù)要求。設(shè)計者介于投資者和實現(xiàn)者之間。 企業(yè)結(jié)構(gòu)規(guī)劃(EAP)法是用于結(jié)構(gòu)設(shè)計的一種最有效的方法,在該法中,設(shè)計者可以實現(xiàn)以下3種結(jié)構(gòu)。A.數(shù)據(jù)結(jié)構(gòu)。B.應(yīng)用程序結(jié)構(gòu)。C.技術(shù)結(jié)構(gòu)。共十七頁12/16數(shù)據(jù)倉庫的開發(fā)(kif)的需求分析(3)(3)開發(fā)者需求的分析開發(fā)者負(fù)責(zé)數(shù)據(jù)倉庫各個構(gòu)件(gujin)的物理安裝和集成。 開發(fā)者需求進一步包括如下四個方面: A.技術(shù)需求 B.使用需求 C.數(shù)據(jù)倉庫產(chǎn)品就緒需求 D.開發(fā)與使用人員及其技術(shù)需求 共十七頁13/16數(shù)據(jù)倉庫的開發(fā)(kif)的需求分析(4)(4)最終用戶需求的分析數(shù)據(jù)倉庫相對(xi

7、ngdu)最終用戶而言是一個黑箱,他們只能通過查詢、報表工具和數(shù)據(jù)倉庫內(nèi)部信息的某種影射關(guān)系來訪問數(shù)據(jù)倉庫內(nèi)部數(shù)據(jù)。因而,最終用戶的需求主要體現(xiàn)在對工作流程的分析、決策的查詢需求、報表需求、操作需求和數(shù)據(jù)需求等方面。同時,在進行數(shù)據(jù)倉庫的最終用戶需求分析時,還需要對數(shù)據(jù)倉庫的主題域、信息的粒度、數(shù)據(jù)倉庫的維度進行分析。共十七頁14/16開發(fā)策略(cl)與目標(biāo)開發(fā)策略主要有:自頂向下:實際應(yīng)用比較困難 。自底向上:用于一個數(shù)據(jù)集市或一個部門的數(shù)據(jù)倉庫開發(fā) ,容易獲得成功 。兩種策略的聯(lián)合使用 :能夠快速地完成數(shù)據(jù)倉庫的開發(fā)與應(yīng)用,而且還可以建立具有長遠(yuǎn)價值的數(shù)據(jù)倉庫方案。在實際使用中難以操作 。

8、首要目標(biāo)(mbio)確定所需要信息的范圍,確定數(shù)據(jù)倉庫在為用戶提供決策幫助時,在主題和指標(biāo)領(lǐng)域需要哪些數(shù)據(jù)源。 另一個重要目標(biāo)是確定利用哪些方法和工具訪問和導(dǎo)航數(shù)據(jù)? 其它目標(biāo)是確定數(shù)據(jù)倉庫內(nèi)部數(shù)據(jù)的規(guī)模。 從用戶的角度分析 從技術(shù)的角度分析 共十七頁15/16數(shù)據(jù)倉庫設(shè)計(shj)需要考慮的主要內(nèi)容主題域最有價值的主題?相應(yīng)主題的維度?數(shù)據(jù)來源各個(gg)主題與相關(guān)的數(shù)據(jù)來源(操作型的)、結(jié)構(gòu)、位置、抽取策略和過程數(shù)據(jù)模型、存儲方式、決策分析需要的信息細(xì)節(jié)程度關(guān)鍵技術(shù)性能要求用途、數(shù)據(jù)量、數(shù)據(jù)更新頻率、索引技術(shù)、用戶要求、共十七頁16/16數(shù)據(jù)倉庫設(shè)計(shj)需要考慮的主要內(nèi)容數(shù)據(jù)模型事實表維度表元數(shù)據(jù)(shj)的設(shè)計與管理共十七頁內(nèi)容摘要數(shù)據(jù)倉庫的設(shè)計。數(shù)據(jù)倉庫系統(tǒng)匯集了來自眾多業(yè)務(wù)系統(tǒng)的數(shù)據(jù),。能夠更好地了解管理決策需要,并將這種需要轉(zhuǎn)換成數(shù)據(jù)倉庫要解決的問題。2. 數(shù)據(jù)倉庫的開發(fā)流程。2. 數(shù)據(jù)倉庫的開發(fā)流程(2)。(2)數(shù)據(jù)倉庫設(shè)計實施階段,在該階段的工作內(nèi)容主要包括:。C.用物理(wl)數(shù)據(jù)庫元數(shù)據(jù)填充面向最終用戶的元數(shù)據(jù)庫。D.對數(shù)據(jù)倉庫中每個目標(biāo)字段確認(rèn)其在業(yè)務(wù)系統(tǒng)或外部數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論