數(shù)據(jù)倉庫技術(shù)在企業(yè)信息化中的應(yīng)用研究_第1頁
數(shù)據(jù)倉庫技術(shù)在企業(yè)信息化中的應(yīng)用研究_第2頁
數(shù)據(jù)倉庫技術(shù)在企業(yè)信息化中的應(yīng)用研究_第3頁
數(shù)據(jù)倉庫技術(shù)在企業(yè)信息化中的應(yīng)用研究_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

精品文檔-下載后可編輯數(shù)據(jù)倉庫技術(shù)在企業(yè)信息化中的應(yīng)用研究隨著信息技術(shù)的發(fā)展,企業(yè)為了應(yīng)對來自市場和同行的挑戰(zhàn),紛紛上馬了各種形式管理信息系統(tǒng)(MIS),以求實現(xiàn)企業(yè)的信息化。管理信息系統(tǒng)可以規(guī)范企業(yè)的信息流程,進而影響企業(yè)的業(yè)務(wù)流程,使之朝著更加科學、規(guī)范的方向發(fā)展,從而大幅提高企業(yè)的效率和競爭力。管理信息系統(tǒng)還為企業(yè)的決策者和執(zhí)行者積累了大量的業(yè)務(wù)數(shù)據(jù)供其參考。但是隨著信息系統(tǒng)的使用,系統(tǒng)所積累的數(shù)據(jù)也會逐步增加,并超出人們能夠根據(jù)數(shù)據(jù)直接進行運用的階段。數(shù)據(jù)倉庫技術(shù)的出現(xiàn)使得人們可以從海量數(shù)據(jù)中提取有用信息用以支持決策。本文將就如何在企業(yè)信息化過程中利用數(shù)據(jù)倉庫技術(shù)進行探討。

一、數(shù)據(jù)倉庫技術(shù)

數(shù)據(jù)倉庫最早是由W.H.Inmon在《建立數(shù)據(jù)倉庫》一書中提出的。他對數(shù)據(jù)倉庫的定義是:數(shù)據(jù)倉庫是面向主體的、集成的、穩(wěn)定的(非易失性的)、隨時間不斷變化(不同時間)的數(shù)據(jù)集合,用以支持經(jīng)營管理中的決策制定過程。

數(shù)據(jù)倉庫的數(shù)據(jù)是面向主題的,與傳統(tǒng)的數(shù)據(jù)庫面向應(yīng)用相對應(yīng)。主題是一個在較高層次上將數(shù)據(jù)歸類的標準,每個主題對應(yīng)一個宏觀的分析領(lǐng)域。數(shù)據(jù)倉庫的集成特性是指在數(shù)據(jù)進入數(shù)據(jù)倉庫之前,必須經(jīng)過數(shù)據(jù)加工和集成,這是建立數(shù)據(jù)倉庫的關(guān)鍵步驟。數(shù)據(jù)倉庫最根本的特定是物理地存放數(shù)據(jù),而且這些數(shù)據(jù)并不是最新的、專有的,而是來源于其他數(shù)據(jù)庫的。數(shù)據(jù)倉庫并不是要取代數(shù)據(jù)庫,它是建立在一個較全面和完善的信息應(yīng)用的基礎(chǔ)上,用于支持高層決策分析,它是數(shù)據(jù)庫技術(shù)的一種應(yīng)用。

二、數(shù)據(jù)倉庫的應(yīng)用

1、在數(shù)據(jù)倉庫實施之前應(yīng)該確定數(shù)據(jù)倉庫的設(shè)計目標和需求。根據(jù)數(shù)據(jù)倉庫的定義和企業(yè)對數(shù)據(jù)倉庫的需要,數(shù)據(jù)倉庫應(yīng)該具有集成性、適應(yīng)性、可靠性和開放性的特點。

2、明確數(shù)據(jù)倉庫的主題。主題是一個在較高層次將數(shù)據(jù)歸類的標準,具體說就是確定決策說涉及的范圍和所要解決的問題。

3、關(guān)系型數(shù)據(jù)庫的設(shè)計模型。建模工具的發(fā)展為關(guān)系型數(shù)據(jù)庫的建模提供了很大的便利?,F(xiàn)在比較流行的數(shù)據(jù)建模工具主要有RationalRose、ERWIN、PowerDesigner、OracleDesigner等。這幾種建模工具各有自己的特點,在數(shù)據(jù)建模方法的選用上,筆者傾向于選擇IDEF1X方法。它是IDEF系列方法中IDEF1的擴展,在實體聯(lián)系方法的基礎(chǔ)上增加了一些規(guī)則,使語義更為豐富。

4、數(shù)據(jù)倉庫的實現(xiàn)技術(shù)過程。(1)根據(jù)數(shù)據(jù)倉庫的主題確定數(shù)據(jù)倉庫的結(jié)構(gòu)。在設(shè)計的過程中要注意保證數(shù)據(jù)倉庫的規(guī)范化和體現(xiàn)各元素之間的必要聯(lián)系。包括以下步驟:首先,定義該主題所需各種數(shù)據(jù)源的詳細情況,包括所在計算機平臺、擁有者、數(shù)據(jù)結(jié)構(gòu)、倉庫更新計劃等。其次,定義數(shù)據(jù)抽取規(guī)則,以便從每個數(shù)據(jù)源中抽取所需數(shù)據(jù)。最后,將一個主題細分為多個業(yè)務(wù)主題,形成主題表,據(jù)此從數(shù)據(jù)倉庫中選出多個數(shù)據(jù)子集,即數(shù)據(jù)集市(DataMart)。(2)設(shè)計數(shù)據(jù)抽取、轉(zhuǎn)換于集成模塊的設(shè)計。該模塊的設(shè)計主要是完成根據(jù)元數(shù)據(jù)庫中的主題定義表、數(shù)據(jù)源定義、數(shù)據(jù)抽取規(guī)則定義對異地異構(gòu)數(shù)據(jù)源進行清理、轉(zhuǎn)換,然后對數(shù)據(jù)進行重組和集成,裝載到數(shù)據(jù)倉庫中目標庫的任務(wù)。(3)設(shè)計數(shù)據(jù)管理維護模塊。該模塊可分為數(shù)據(jù)存儲管理和元數(shù)據(jù)的維護兩方面。數(shù)據(jù)存儲管理是根據(jù)元數(shù)據(jù)庫所定義的更新頻率、更新數(shù)據(jù)項等更新計劃任務(wù)來刷新數(shù)據(jù)倉庫,以反映數(shù)據(jù)源的變化,且對時間相關(guān)性進行處理。更新操作有兩種情況,即在倉庫的原有數(shù)據(jù)表中進行某些數(shù)據(jù)的更新和產(chǎn)生一個新的時間區(qū)間的數(shù)據(jù),因為匯總數(shù)據(jù)與數(shù)據(jù)倉庫中的許多信息元素是相關(guān)的,必須完整地匯總,這樣才能保證全體信息的一致性。

5、確定數(shù)據(jù)倉庫的開發(fā)和運行環(huán)境。根據(jù)數(shù)據(jù)倉庫的規(guī)模和企業(yè)規(guī)模數(shù)據(jù)倉庫的運行環(huán)境也會有所不同。一般情況下適當?shù)能浻布渲脼椋悍?wù)器級微機一臺,最低內(nèi)存512M,大容量硬盤(配有外置存儲設(shè)備),安裝WINDOWS2000SERVER操作系統(tǒng),SYABSEAdaptiveServerEnterprise12.0數(shù)據(jù)庫系統(tǒng)(服務(wù)器端和客戶端同時具備),對外接入業(yè)務(wù)系統(tǒng)和其他操作系統(tǒng)傳過來的數(shù)據(jù),對內(nèi)接入各服務(wù)器。

三、數(shù)據(jù)倉庫的深層應(yīng)用

數(shù)據(jù)倉庫的應(yīng)用是與聯(lián)機分析處理以及數(shù)據(jù)挖掘密切結(jié)合的。只有將三者密切的結(jié)合在一起才能發(fā)揮數(shù)據(jù)倉庫在數(shù)據(jù)存儲和應(yīng)用上的優(yōu)勢。使用數(shù)據(jù)倉庫數(shù)據(jù)的工具一般可分為三類:普通的報表查詢工具、驗證型工具和發(fā)掘型工具。而聯(lián)機分析處理和數(shù)據(jù)挖掘分別是驗證型工具和發(fā)掘型工具的代表。因此,在比較成熟的系統(tǒng)中,數(shù)據(jù)倉庫、聯(lián)機分析處理和數(shù)據(jù)挖掘往往融為一個以數(shù)據(jù)倉庫為基礎(chǔ)、聯(lián)機分析處理和數(shù)據(jù)挖掘相輔相成分析數(shù)據(jù)的模式。其中,數(shù)據(jù)倉庫負責把所需的數(shù)據(jù)面向主題按有助于聯(lián)機分析處理和數(shù)據(jù)挖掘分析的格式進行存儲,并對原始數(shù)據(jù)進行預(yù)處理。聯(lián)機分析處理和數(shù)據(jù)挖掘則負責從不同的角度和層次對經(jīng)過初步預(yù)處理的數(shù)據(jù)進行分析,發(fā)掘出人們所關(guān)心的模式。由于三者都旨在輔助決策,所以人們在此基礎(chǔ)上加入模型庫、知識庫和方法庫,從而構(gòu)建了基于數(shù)據(jù)倉庫+聯(lián)機分析處理+數(shù)據(jù)挖掘的決策支持系統(tǒng)。這種模式的決策支持系統(tǒng)成為決策支持系統(tǒng)發(fā)展的新模式,因其強大的輔助決策功能而得到了廣泛的應(yīng)用。

本文對在企業(yè)信息化建設(shè)中數(shù)據(jù)倉庫的應(yīng)用進行了研

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論