![迪比特數(shù)據(jù)倉庫方案書_第1頁](http://file4.renrendoc.com/view/a176be3d87732362e385b75ea1b090c5/a176be3d87732362e385b75ea1b090c51.gif)
![迪比特數(shù)據(jù)倉庫方案書_第2頁](http://file4.renrendoc.com/view/a176be3d87732362e385b75ea1b090c5/a176be3d87732362e385b75ea1b090c52.gif)
![迪比特數(shù)據(jù)倉庫方案書_第3頁](http://file4.renrendoc.com/view/a176be3d87732362e385b75ea1b090c5/a176be3d87732362e385b75ea1b090c53.gif)
![迪比特數(shù)據(jù)倉庫方案書_第4頁](http://file4.renrendoc.com/view/a176be3d87732362e385b75ea1b090c5/a176be3d87732362e385b75ea1b090c54.gif)
![迪比特數(shù)據(jù)倉庫方案書_第5頁](http://file4.renrendoc.com/view/a176be3d87732362e385b75ea1b090c5/a176be3d87732362e385b75ea1b090c55.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第一章 系統(tǒng)規(guī)劃 1.1 系統(tǒng)目標系統(tǒng)的目標是建立面向業(yè)務(宏觀)戰(zhàn)略的商務智能平臺,整合迪比特集團各業(yè)務系統(tǒng)。整個系統(tǒng)分為四個階段來完成:第一階段:靈活報表系統(tǒng)第二階段:大MIS系統(tǒng):流程再造第三階段:統(tǒng)一數(shù)據(jù)平臺:決策支持第四階段:優(yōu)化第四階段:優(yōu)化1.2 靈活報表系統(tǒng)1.2.1 系統(tǒng)目標迪比特在長期的生產(chǎn)經(jīng)營中,已經(jīng)積累了大量的歷史數(shù)據(jù);由于這些數(shù)據(jù)分布在不同的系統(tǒng)中,以及缺乏良好的工具手段,導致公司在日常的生產(chǎn)管理中,卻常常感到信息不夠,或數(shù)據(jù)提出非常困難。如何將這些歷史數(shù)據(jù)變成有價值的信息,如何提高信息的快速反饋能力,使企業(yè)有足夠的、及時的信息,來面對迅速變化的市場,以成為迪比特信息
2、應用的一個課題。通過靈活的報表與數(shù)據(jù)查詢功能,運用先進的績效和企業(yè)管理手段,力求搭建完整、穩(wěn)健、高效的自動化綜合統(tǒng)計信息展現(xiàn)平臺。靈活報表系統(tǒng)的具體設計目標主要有:1、最大限度地科學管理信息資源,以先進的數(shù)據(jù)庫管理系統(tǒng)為基礎,完成數(shù)據(jù)采集、整理、存儲、利用,提高信息資源的管理水平;2、充分挖掘信息的價值,借助計算機及網(wǎng)絡通信技術,通過系統(tǒng)自動生成各類管理報表和經(jīng)營管理統(tǒng)計分析指標,并提供強大的查詢系統(tǒng),輔助管理人員動態(tài)監(jiān)控的業(yè)務狀況、財務狀況;3、提高工作效率,幫助公司各層級管理人員擺脫煩瑣的數(shù)據(jù)整理工作,實現(xiàn)管理水平和管理質(zhì)量的飛躍;4、減少工作誤差,提供更加完善的指標校驗功能,自動驗證用戶
3、數(shù)據(jù)輸入是否正確,保證輸入數(shù)據(jù)的正確性、完整性。1.2.2 系統(tǒng)特點1 數(shù)據(jù)抽取ETL分別是三個單詞的首字母縮寫(Extract Transform Load)也就是抽取、轉(zhuǎn)換、裝載,但我們?nèi)粘M喎Q其為數(shù)據(jù)抽取。ETL包含了三方面,首先是抽?。簩?shù)據(jù)從各種原始的業(yè)務系統(tǒng)中讀取出來,這是所有工作的前提。其次轉(zhuǎn)換:按照預先設計好的規(guī)則將抽取得數(shù)據(jù)進行轉(zhuǎn)換,使本來異構(gòu)的數(shù)據(jù)格式能統(tǒng)一起來。最后的裝載:將轉(zhuǎn)換完的數(shù)據(jù)按計劃增量或全部的導入到數(shù)據(jù)倉庫中。ETL完成的工作主要包括三方面,其在數(shù)據(jù)倉庫和業(yè)務系統(tǒng)之間搭建了一座橋梁,確保新的業(yè)務數(shù)據(jù)能源源不斷進入數(shù)據(jù)倉庫,同時用戶的分析和應用也能反應出最新
4、的業(yè)務動態(tài)。如果從整體角度來看,ETL主要作用在于其屏蔽了復雜的業(yè)務邏輯從而為各種基于數(shù)據(jù)倉庫的分析和應用提供了統(tǒng)一的數(shù)據(jù)接口,這也可以說是構(gòu)建數(shù)據(jù)倉庫最重要的意義所在。2 數(shù)據(jù)存儲系統(tǒng)數(shù)據(jù)存儲采用關系型數(shù)據(jù)庫技術和ROLAP技術。存儲分為ODS層(操作型細節(jié)數(shù)據(jù)層)和數(shù)據(jù)集市層。具有以下特點:關系數(shù)據(jù)存儲模型直接ETL裝載保留數(shù)據(jù)細節(jié)同時建立必要的數(shù)據(jù)預聚合不丟棄業(yè)務信息3 業(yè)務特性:作為世界一流的商務智能平臺產(chǎn)品,MicroStrategy具有以下一些特點:1) 完美的客戶化展現(xiàn): 查詢、報表和圖表MicroStrategy產(chǎn)品具有非常強大的報表定制功能。通過GUI方式,只需簡單鼠標拖拽方
5、式就可以實現(xiàn)復雜報表的定制,并且報表的定義邏輯可以保存,以便于以后在此基礎上再次編輯加工。如下圖所示報表:MicroStrategy Report Service支持中國式報表格式2)可實現(xiàn)OLAP分析提供多維視圖的數(shù)據(jù)組織、管理與多維分析。提供增量匯總技術。提供分析作業(yè)調(diào)度管理。提供最優(yōu)/最差分析、例外分析、排名分析、比較分析等分析功能。具有豐富的圖形展現(xiàn)功能。能夠靈活地建立、定制不同的分析指標和各種指標計算公式,實現(xiàn)OLAP分析的動態(tài)化處理。并具有切片、切塊、旋轉(zhuǎn)、鉆取和鉆透等多維分析操作。能直接鉆取到詳細數(shù)據(jù),也能進行多維數(shù)據(jù)和詳細數(shù)據(jù)的混合分析。提供豐富的函數(shù),可自由擴展,便于二次開發(fā)
6、。OLAP分析結(jié)果可輸出為Excel、HTML、文本文件等多種類型的文件。對分析指標指定警告值的,在分析報表或圖形中以突出方式進行顯示。3)可實現(xiàn)即席查詢通過定義業(yè)務邏輯到數(shù)據(jù)庫結(jié)構(gòu)映射層,使最終用戶無需了解數(shù)據(jù)庫和SQL的復雜性,只需按業(yè)務邏輯規(guī)則即可快速簡潔地定義查詢需求,系統(tǒng)自動完成連接操作、條件定義等復雜的SQL定義操作。提供各種向?qū)浇缑?、圖形查詢生成器、提示窗口等,通過簡單的鼠標拖拉操作即可實現(xiàn)即席查詢、報告生成、圖表生成、深入分析和發(fā)布等功能。具備多表之間的鉆取訪問、具備主表與子表之間的鉆取訪問功能。提供資源控制機制。它能夠監(jiān)控查詢的運行進程,并停止長時間運行的查詢,控制資源使用
7、效率。而且還提供查詢預測能力,使分析人員在運行查詢之前,能夠預測查詢所需時間。能訪問各種數(shù)據(jù)源的數(shù)據(jù),訪問結(jié)果也能輸出到多種通用文件格式中??梢詫τ脩粼O立不同的查詢優(yōu)先級,實現(xiàn)數(shù)據(jù)倉庫資源的合理分配。信息發(fā)布默認情況下就已經(jīng)是發(fā)布到Web方式。還能夠以電子郵件、手機短信等方式發(fā)布。提供訂閱門戶,使用者可以在門戶中自定義發(fā)送方式。1.3 大MIS系統(tǒng)流程再造 作為業(yè)務決策人 (BDM) 或技術決策人 (TDM),您始終都在尋找能夠更好地分析、策略化并改善組織業(yè)務流程的方法。 了解 Microsoft 門戶和集成解決方案如何幫助您的公司簡化異種系統(tǒng)、提高雇員生產(chǎn)力、降低運營成本并改善整體 IT 基
8、礎結(jié)構(gòu)。 將企業(yè)資源計劃 (ERP)、供應鏈管理 (SCM) 和客戶關系管理 (CRM) 系統(tǒng)等內(nèi)部業(yè)務系列應用程序與客戶和貿(mào)易合作伙伴進行集成,從而實現(xiàn)實時協(xié)作。 實現(xiàn)訂單處理和合同管理業(yè)務流程自動化。是通過數(shù)據(jù)整合和報表整合以及未來的門戶(工作流整合)實現(xiàn)對原有分立系統(tǒng)的信息整合。這樣做既不需要“推倒重來”而且風險和投入都相對小業(yè)務流程管理 BPM(Business Process Management)是將生產(chǎn)流程、業(yè)務流程、各類行政申請流程、財務審批流程、人事處理流程、質(zhì)量控制及客服流程等70%以上需要兩人以上協(xié)作實施的任務全部或部分由計算機處理,并使其簡單化、自動化的業(yè)務過程。1.4
9、 統(tǒng)一數(shù)據(jù)平臺1.4.1 統(tǒng)一數(shù)據(jù)平臺特性統(tǒng)一數(shù)據(jù)平臺是面向主題的、綜合的、不同時間的、穩(wěn)定的數(shù)據(jù)集合,用于支持經(jīng)營管理中的決策制定過程。也就是說,數(shù)據(jù)平臺是一個大的數(shù)據(jù)庫,存儲了該公司所有業(yè)務數(shù)據(jù),從在線事務處理(OLTP)系統(tǒng)中獲取的綜合數(shù)據(jù),這些數(shù)據(jù)可能駐留在許多不同的數(shù)據(jù)源中。這些數(shù)據(jù)源可能是文檔、層次型數(shù)據(jù)庫、網(wǎng)絡結(jié)構(gòu)化的數(shù)據(jù)庫、反向列表數(shù)據(jù)庫、關系型數(shù)據(jù)庫,或者更常見的由上述系統(tǒng)組成的混合系統(tǒng)。 數(shù)據(jù)平臺為決策支持和在線分析提供數(shù)據(jù)。數(shù)據(jù)平臺除了具有傳統(tǒng)數(shù)據(jù)庫管理系統(tǒng)(DBMS)的共享性、完整性、數(shù)據(jù)獨立性外,還具有下列特征: * 統(tǒng)一性和一致性 * 面向主題 * 歷史性 * 只讀
10、性 統(tǒng)一性和一致性 數(shù)據(jù)平臺使用一致的命名規(guī)定、測度、物理屬性和語義來統(tǒng)一來自多種數(shù)據(jù)源的經(jīng)營數(shù)據(jù)。例如,在許多企業(yè)中,應用程序常常以不同的格式使用類似的數(shù)據(jù):日期按照Julian或者Gregorian格式存儲,真/假數(shù)據(jù)可能表示為1/0、ON/OFF、TRUE/FALSE、正/負等。不同的應用程序可能使用不同的術語來描述同樣的數(shù)據(jù),例如一個應用程序可能使用“平衡表”來描述銀行帳戶,另外一個應用程序可能使用“總量表”表示銀行的帳戶。在數(shù)據(jù)倉庫中存儲的數(shù)據(jù)需要一種單一的、可以由企業(yè)分析人員接受的格式存儲,而不考慮各種外部數(shù)據(jù)源。這種統(tǒng)一性允許數(shù)據(jù)來自跨組織和部門,例如企業(yè)以前保存的數(shù)據(jù)、表格中的
11、數(shù)據(jù)、甚至來自Internet上的數(shù)據(jù)。這些數(shù)據(jù)可以統(tǒng)一在數(shù)據(jù)倉庫中,使企業(yè)經(jīng)營人員更好地分析和理解企業(yè)的經(jīng)營狀況。 面向主題 傳統(tǒng)的數(shù)據(jù)庫是面向應用設計的,它的數(shù)據(jù)只是為處理具體應用而組織在一起的。應用是客觀世界既定的,它對于數(shù)據(jù)內(nèi)容的劃分未必適用于分析所需。而主題是一個在較高層次將數(shù)據(jù)歸類的標準,每一個主題基本對應一個宏觀的領域,基于主題組織的數(shù)據(jù)被劃分為各自獨立的領域,每一個領域都有自己的邏輯內(nèi)涵互不交叉。因此,在數(shù)據(jù)進入數(shù)據(jù)倉庫之前,必然要經(jīng)過加工和集成,將原始數(shù)據(jù)結(jié)構(gòu)做一個從面向應用到面向主題的大轉(zhuǎn)變??缃M織的經(jīng)營數(shù)據(jù)源保存著企業(yè)方方面面的大量數(shù)據(jù),例如客戶記錄、產(chǎn)品信息等等。而這些
12、數(shù)據(jù)沒有被用于對企業(yè)的全面經(jīng)營狀況相關分析。數(shù)據(jù)倉庫只是組織這些關鍵的企業(yè)信息,以便簡化對企業(yè)的分析過程。 歷史性 存儲在OLTP系統(tǒng)中的數(shù)據(jù)可以正確地表示現(xiàn)在時間的任何值。OLTP系統(tǒng)經(jīng)常只是包含當前的數(shù)據(jù)。例如,處理定單的應用程序總是顯示庫存的當前值,而不顯示在過去某一時間的庫存值。不同時間的查詢一般地會得到不同的查詢結(jié)果。然而,存儲在數(shù)據(jù)倉庫中的數(shù)據(jù),可以準確地表示過去某一時刻的數(shù)據(jù),因為這些存儲的數(shù)據(jù)表示了歷史信息。存儲在數(shù)據(jù)倉庫中的數(shù)據(jù)一般表示過了一段比較長的時間的數(shù)據(jù),一般是五年到十年。數(shù)據(jù)倉庫存儲了企業(yè)一段時間的快照形式。這些數(shù)據(jù)一般是不改變的。與此不同的是,業(yè)務數(shù)據(jù)庫通常只保存
13、有用事務數(shù)據(jù)30-90天。數(shù)據(jù)經(jīng)集成進入數(shù)據(jù)倉庫后是極少或者根本不更新的。因此,常用的操作是追加操作和歷史查詢。 只讀性 因為存儲在數(shù)據(jù)倉庫中的數(shù)據(jù)表示是某一時刻點的數(shù)據(jù),所以在數(shù)據(jù)倉庫中,不允許刪除、插入和修改。當數(shù)據(jù)移動到數(shù)據(jù)倉庫之后,一般是不改變的,除非存儲的數(shù)據(jù)是不正確的。一般地,在數(shù)據(jù)倉庫中發(fā)生的操作是建立數(shù)據(jù)倉庫時的加載數(shù)據(jù)和查詢數(shù)據(jù)。因為數(shù)據(jù)在加載之后不再修改,所以對數(shù)據(jù)倉庫的設計可以通過使用索引、預先計算的數(shù)據(jù)和物理的數(shù)據(jù)庫正規(guī)化來優(yōu)化查詢的性能。1.4.2 統(tǒng)一數(shù)據(jù)平臺建模數(shù)據(jù)模型是對現(xiàn)實世界進行抽象的工具。它描述了企業(yè)內(nèi)的實體和聯(lián)系,即主題域,是企業(yè)最高層次的抽象。數(shù)據(jù)模型
14、采用ERD(實體關系模型),整體ERD由各分ERD綜合而成,不僅消除了分ERD之間的不一致,而且消除了不必要的冗余。ERD在邏輯上實現(xiàn)了數(shù)據(jù)倉庫集成和面向主題的特點。數(shù)據(jù)平臺的建模首先是根據(jù)迪比特公司的業(yè)務,確定主題領域,然后擴充每個主題域,以得到主碼(包括時間主屬性)和各屬性,并實現(xiàn)主題域之間的聯(lián)系。生產(chǎn)制造也得主題領域有:機構(gòu)組織、產(chǎn)品、客戶、訂單、地區(qū)、倉庫、促銷、服務等。1.4.3 統(tǒng)一數(shù)據(jù)平臺應用在同一數(shù)據(jù)平臺基礎上,除了能產(chǎn)生各種報表,滿足日常生產(chǎn)管理需求外,還能支持各種決策支持系統(tǒng),和數(shù)據(jù)挖掘功能。決策支持應用如:經(jīng)營分析與計劃達成、kpi指標監(jiān)控、企業(yè)戰(zhàn)略管理平衡計分卡應用等等
15、。數(shù)據(jù)挖掘應用,如客戶貢獻度分析、客戶分類分析等等,為公司的產(chǎn)品設計提供更多的客戶信息。1 kpi指標監(jiān)控對于企業(yè)高層管理人員來說,可定義一些企業(yè)的關鍵績效指標,如企業(yè)銷售收入、稅后利潤等等,根據(jù)業(yè)務實際狀況推算出下一個年度合適的閥值,通過后臺存儲過程技術定時計算迪比特的實際數(shù)值,最后通過MicroStrategy產(chǎn)品的告警功能實現(xiàn)數(shù)據(jù)的push,刷新客戶端,使用戶及時了解監(jiān)管指標的當前狀況。2 經(jīng)營分析與計劃達成經(jīng)營分析會關注市場接受度指標集、服務水平指標集、生產(chǎn)費率科學性指標集等五個指標集,每個指標集里面都包括豐富的指標。如在市場接受度指標集中會有產(chǎn)品市場占有率、客戶滿意度等等。通過對這些
16、指標集多角度多手段的觀察,可以把握經(jīng)營的總體特征,如同期比、前期比、占比、TopN、絕對值分布等等數(shù)理統(tǒng)計。計劃達成主要包括業(yè)務收入人力資源計劃達成情況、業(yè)務收入計劃達成情況、業(yè)務支出計劃達成情況等幾個主要方面,以及其他五個方面的輔助方面。3 企業(yè)戰(zhàn)略管理平衡計分卡應用通過儀表板表現(xiàn)形式:靈活報表方案設計在開發(fā)靈活報表系統(tǒng)時,國天商業(yè)智能采用成熟的數(shù)據(jù)倉庫原理和方法,根據(jù)應用主題建立各種多維分析模型,使系統(tǒng)能靈活地生成各種報表和圖形等多種多樣的信息表現(xiàn)形式,為企業(yè)的經(jīng)營決策提供各種信息。系統(tǒng)邏輯設計系統(tǒng)分為三大模塊:數(shù)據(jù)抽取、數(shù)據(jù)存儲、數(shù)據(jù)展現(xiàn)。數(shù)據(jù)抽?。和ㄟ^此模塊,將生產(chǎn)系統(tǒng)或外部系統(tǒng)的數(shù)據(jù)
17、抽取到數(shù)據(jù)倉庫中。數(shù)據(jù)存儲:數(shù)據(jù)存儲包括數(shù)據(jù)倉庫和數(shù)據(jù)集市。數(shù)據(jù)倉庫為企業(yè)統(tǒng)一的信息平臺;數(shù)據(jù)集市為面向多維分析的數(shù)據(jù)存儲。 數(shù)據(jù)展現(xiàn):數(shù)據(jù)倉庫信息輸出部分,輸出方式可分為固定報表、即席查詢、多維分析。按功能可分為各種應用分析系統(tǒng),如:客戶關系管理系統(tǒng)、資產(chǎn)負債分析系統(tǒng)、管理會計、績效考核系統(tǒng)。2.2 系統(tǒng)部署拓撲結(jié)構(gòu)前面已經(jīng)提到過,分析展示層將全部采用MicroStrategy產(chǎn)品,作為前端應用系統(tǒng)支撐軟件的MicroStrategy產(chǎn)品將按如下方式部署:用戶用戶2.3 應用功能 詳見本方案1.1.2節(jié)的第三點:業(yè)務特性。2.4 軟件配置此次項目主要使用MicroStrategy產(chǎn)品作為前端
18、展現(xiàn)的解決方案,因此軟件配置主要為MicroStrategy產(chǎn)品的軟件配置。下表列出了MicroStrategy產(chǎn)品各組件所需的軟件配置MicroStrategy軟件操作系統(tǒng)其它BI服務器MicroStrategy Intelligence ServerWindows NT/2000 Server;Solaris;AIXWeb服務器(JSP版本)MicroStrategy Web UniversalWindows NT/2000或Unix(Sun Solaris, IBM AIX, HP-UX)或Linux需要J2EE中間件平臺,比如WebLogic, WebSphere, SunOne,To
19、mcat等應用建模MicroStrategy ArchitectWindows NT/2000 /98/XPC/S客戶端(查詢、報表、OLAP、高級分析)MicroStrategy Designer/AnalystWindows NT/2000 /98/XPWeb客戶端(查詢、報表、OLAP、高級分析)MicroStrategy Web Professional /Analyst /Reporter/report severseWindows NT/2000 /98/XP, Unix, Linux需Web瀏覽器2.5 硬件配置1 MicroStrategy各產(chǎn)品組件所需的硬件配置客戶端所需硬件
20、資源MicroStrategy軟件最小配置推薦配置CPU(1000M HZ)數(shù)目內(nèi)存CPU(1000M HZ)數(shù)目內(nèi)存應用建模MicroStrategy Architect1128M1256MC/S客戶端MicroStrategy Designer/Analyst1128M1256MWeb客戶端MicroStrategy Web Professional /Analyst /Reporter1128M1256M服務器端所需硬件資源基本假設:業(yè)務用戶并發(fā)操作率假設為50%;業(yè)務用戶全部使用B/S方式進行報表操作;服務器端的CPU主頻假設為1000MHZ。為了保證報表系統(tǒng)的高可用,報表應用服務器、
21、Web服務器采用群集。計算方法:根據(jù)MicroStrategy實驗室的測算結(jié)果及在世界各地的實施經(jīng)驗,在Intelligence Server上每1000MHZ的CPU可支撐40-50個并發(fā)操作用戶,如果Web服務器只用于支撐MicroStrategy Web/Web Universal應用,其支持容量與Intelligence Server相當。用戶數(shù)并發(fā)用戶數(shù)(50%并發(fā)率)MicroStrategy Intelligence ServerMicroStrategy Web服務器匯總2001002 CPU;2048M RAM2 CPU;2048M RAM4 CPU;4096M RAM100
22、501 CPU;1024M RAM1 CPU;1024M RAM2 CPU;2048M RAM50250.5 CPU;512M RAM0.5 CPU;512M RAM1CPU;1024+YM RAM2 數(shù)據(jù)庫與ETL硬件平臺配置此次項目數(shù)據(jù)庫與ETL服務硬件平臺的配置規(guī)格,我們給予以下三點意見:運維環(huán)境的硬件平臺可以根據(jù)開發(fā)環(huán)境的負載情況在系統(tǒng)切換上線前再作準確確定;鑒于客戶當前的IT狀況,我們認為不排除對“現(xiàn)有數(shù)據(jù)管理系統(tǒng)”的設備例舊的可能;根據(jù)我們的經(jīng)驗,至少的配置是:雙PU,4G內(nèi)存的配置;高載荷的配置可以達到4CPU,8內(nèi)存的配置;也可以更高。 第三章:靈活報表系統(tǒng)的實施我們將采用DW
23、M(Data Warehouse Method)為迪比特公司實施項目。DWM是我們經(jīng)過多年的數(shù)據(jù)倉庫系統(tǒng)實施而提煉、總結(jié)好的結(jié)構(gòu)化實施方法,詳細定義了用于構(gòu)造一個完善的、滿足業(yè)務功能的數(shù)據(jù)倉庫系統(tǒng)所不可缺少的步驟和任務。DWM是一組預定義好的、在整個數(shù)據(jù)倉庫項目中起指導作用的、可用多種方法管理的實施步驟。DWM可以幫助我們解決諸如確定正確的系統(tǒng)范圍和用戶需求、建立靈活的系統(tǒng)架構(gòu)以滿足不斷變化的應用需求以及不可預測的使用需求等等比較棘手的問題。采用DWM這不僅可以提高工作效率及項目實施質(zhì)量,而且可以盡可能的減少系統(tǒng)的實施風險。DWM是一個抽象的方法論,需要結(jié)合項目實際環(huán)境作定制。DWM把數(shù)據(jù)倉庫
24、系統(tǒng)的實施分為13個過程,7個階段。如下表所示:過程|階段實施策略系統(tǒng)定義系統(tǒng)分析系統(tǒng)設計系統(tǒng)建立系統(tǒng)應用系統(tǒng)維護業(yè)務需求定義34.6%9.3%13.3%數(shù)據(jù)獲取8.4%8.5%23.1%16.4%17.2%21.4%系統(tǒng)結(jié)構(gòu)定義11.5%22.2%14.3%5.4%14.5%數(shù)據(jù)質(zhì)量控制2.2%12.1%6.5%7.9%0.6%數(shù)據(jù)倉庫管理3.4%4.4%3.9%11%16.1%元數(shù)據(jù)管理3.7%4.7%4.9%數(shù)據(jù)訪問6.3%4.7%4.9%數(shù)據(jù)庫設計與建立4%2%文檔設置1%1.1%2%4.5%3.9%系統(tǒng)測試1.2%7.4%15%19.8%19.7%培訓0.5%7.7%2.7%4.1%
25、4.7%27.8%系統(tǒng)上線1.7%0.2%0.4%17.8%技術支持45%上表中各個過程中的陰影表示每個過程涉及到哪個實施階段,表中的百分比表示以一個中等規(guī)模的項目為例,每個過程在各個實施階段中所占的比例。3.1 DWM實施過程在不同的數(shù)據(jù)倉庫系統(tǒng)項目中,在7個實施階段中均會涉及上述大部分或全部的實施過程。1業(yè)務需求定義本過程主要通過了解客戶業(yè)務的策略性目標和建立系統(tǒng)的初衷,明確數(shù)據(jù)倉庫解決方案能夠滿足的業(yè)務需求,確定系統(tǒng)的實施范圍,初步建立系統(tǒng)實施的方向。2數(shù)據(jù)獲取本過程的目標是確定數(shù)據(jù)倉庫系統(tǒng)將要使用的數(shù)據(jù)的來源數(shù)據(jù)獲取過程會涉及數(shù)據(jù)倉庫的多個組成部分,包括內(nèi)部的業(yè)務處理系統(tǒng)和外部相關系統(tǒng)
26、。同時,需要確定從這些數(shù)據(jù)源抽取、轉(zhuǎn)換和傳遞原數(shù)據(jù)的方法,包括制定第一次數(shù)據(jù)裝載的方案、數(shù)據(jù)更新方案,以及確定數(shù)據(jù)獲取模塊的功能。3系統(tǒng)結(jié)構(gòu)定義本過程側(cè)重于定義數(shù)據(jù)倉庫的技術基礎的組成和結(jié)構(gòu)化設計,包括各種產(chǎn)品的集成方法、系統(tǒng)不同組成部分的集成方法,以便提供一個易擴展、可伸縮性好的系統(tǒng)結(jié)構(gòu)。從技術角度講,系統(tǒng)結(jié)構(gòu)決定了對下列技術性方案的選擇,包括數(shù)據(jù)庫環(huán)境是分布式的還是集中式的,以及數(shù)據(jù)獲取、基礎結(jié)構(gòu)優(yōu)化和平臺配置等方面對網(wǎng)絡、硬件平臺和軟件需求的定義和實施。在平臺配置中,包括了數(shù)據(jù)獲取的環(huán)境、服務器結(jié)構(gòu)、中間件的選擇、數(shù)據(jù)庫規(guī)模等方面。本過程中還需要確定數(shù)據(jù)訪問的安全性控制、數(shù)據(jù)備份與恢復等
27、方面的策略和方案。4數(shù)據(jù)質(zhì)量控制本過程用于保證數(shù)據(jù)倉庫中的數(shù)據(jù)的一致性、可靠性和準確性。在客戶認可了確定數(shù)據(jù)正確性和一致性方法的基礎上,制定出數(shù)據(jù)質(zhì)量控制策略,以及數(shù)據(jù)管理流程。同時,還需要對數(shù)據(jù)質(zhì)量控制工具進行評估和推薦。此外,本過程還需要確定用于識別和處理錯誤數(shù)據(jù)、數(shù)據(jù)清潔、監(jiān)測和控制臟數(shù)據(jù)的業(yè)務規(guī)則。數(shù)據(jù)質(zhì)量控制模塊還需要與數(shù)據(jù)獲取模塊集成在一起,用于檢查質(zhì)量控制功能在從源數(shù)據(jù)環(huán)境轉(zhuǎn)換到目的環(huán)境的全過程中是否按照正確的順序完成,以保證進入到數(shù)據(jù)倉庫中的數(shù)據(jù)是可靠的數(shù)據(jù)。5數(shù)據(jù)倉庫管理本過程用于定義維護、使用和修改數(shù)據(jù)倉庫的策略和需求,主要包括版本控制、數(shù)據(jù)使用方法和安全性控制,以及數(shù)據(jù)管
28、理。過程初期,需要確定管理流程、所用工具、評估和測試方案。過程期間,需要設計和建立數(shù)據(jù)倉庫管理模塊,用于實現(xiàn)版本控制、數(shù)據(jù)備份與恢復、數(shù)據(jù)歸檔、數(shù)據(jù)管理和監(jiān)測,以及建立其他管理和檢測任務,最終實現(xiàn)管理的自動化。6元數(shù)據(jù)管理本過程側(cè)重于確定元數(shù)據(jù)管理的策略,以及定義元數(shù)據(jù)類型、元數(shù)據(jù)庫、元數(shù)據(jù)集成和訪問的需求。其主要目標是如何形成和組織數(shù)據(jù)倉庫中涉及各個方面的元數(shù)據(jù),使之既滿足技術要求,又符合業(yè)務需求。技術要求的側(cè)重點在于,如何匯集在系統(tǒng)開發(fā)過程中創(chuàng)建的元數(shù)據(jù)和用于支持系統(tǒng)管理的元數(shù)據(jù)。技術性元數(shù)據(jù)包括,數(shù)據(jù)獲取規(guī)則,數(shù)據(jù)轉(zhuǎn)換方法,數(shù)據(jù)的時間,數(shù)據(jù)權限,數(shù)據(jù)刷新、歸檔、備份和恢復的計劃和結(jié)果,以
29、及被訪問的數(shù)據(jù),其中包括訪問頻率和訪問請求數(shù)量等因素。對技術人員而言,如何有效的管理數(shù)據(jù)倉庫是其最關心的問題。業(yè)務需求的側(cè)重點在于,最終用戶關心的是可以從數(shù)據(jù)倉庫中獲取什么樣的數(shù)據(jù),以及如何獲取這些數(shù)據(jù)。多數(shù)情況下,是通過為用戶提供有效的元數(shù)據(jù)訪問工具實現(xiàn)的。用戶使用這些簡單易用的工具,瀏覽創(chuàng)建對數(shù)據(jù)的查詢和編制報表,在元數(shù)據(jù)上完成drill-down/up分析。通過開發(fā)元數(shù)據(jù)管理模塊實現(xiàn)對元數(shù)據(jù)的獲取、集成和訪問。7 數(shù)據(jù)訪問本過程側(cè)重于對支持用戶訪問數(shù)據(jù)倉庫中數(shù)據(jù)的工具的確認、選擇和設計。根據(jù)用戶要訪問的數(shù)據(jù)的級別、數(shù)據(jù)決策的需求和用戶的技能水平,來評估、選擇、推薦和測試數(shù)據(jù)訪問工具。8數(shù)
30、據(jù)庫設計與建立本過程的目標是如何定義數(shù)據(jù)庫對象,既能滿足數(shù)據(jù)需求,又能滿足對數(shù)據(jù)有效訪問的需求。本過程包括對數(shù)據(jù)庫的邏輯設計和物理設計,關系型數(shù)據(jù)庫設計和多維數(shù)據(jù)庫設計,還包括對開發(fā)環(huán)境、測試環(huán)境和產(chǎn)品環(huán)境的建立。9文檔設置本過程涉及系統(tǒng)應用之前的各個實施階段,是系統(tǒng)設計、開發(fā)、運行和維護所不可缺少的一個重要環(huán)節(jié)。無論是系統(tǒng)需求文檔、還是技術文檔、用戶操作手冊等等,都是保證系統(tǒng)開發(fā)和運行正常進行的重要輔助手段。10 系統(tǒng)測試本過程是保證系統(tǒng)正確運行的重要環(huán)節(jié)。系統(tǒng)測試之前,需要制定測試策略、準備測試方案、測試步驟和測試數(shù)據(jù)。從功能角度講,系統(tǒng)測試包括各個模塊的單獨測試,系統(tǒng)集成測試;從數(shù)據(jù)角度
31、講,系統(tǒng)測試包括系統(tǒng)正確性測試,大數(shù)據(jù)量測試(即系統(tǒng)性能測試)。11 培訓本過程定義了開發(fā)人員和最終用戶的培訓需求,確定需要接受培訓的技術和業(yè)務人員,并估算出培訓計劃和實施培訓的時間表,設計和編制培訓資料。本過程的目標是通過提供適當有效的培訓,保證不同類型的人員更好地使用和維護已投入運行的系統(tǒng)。12 系統(tǒng)上線本過程的目標是把系統(tǒng)移植到產(chǎn)品環(huán)境中,包括制定安裝計劃,準備客戶維護和產(chǎn)品環(huán)境。13 技術支持系統(tǒng)上線之后,繼續(xù)為用戶提供在系統(tǒng)管理方面的技術支持3.2 DWM實施階段使用增量開發(fā)方法(Incremental Approach)開發(fā)的數(shù)據(jù)倉庫系統(tǒng),其實施過程分成下列7個階段。1實施策略本階
32、段以客戶策略性業(yè)務需求和目標為基礎,完成對系統(tǒng)目標、增量開發(fā)的優(yōu)先級和企業(yè)數(shù)據(jù)倉庫基礎結(jié)構(gòu)的定義,并對客戶組織結(jié)構(gòu)、成功的關鍵因素、主要的限制因素、事項、風險和由數(shù)據(jù)倉庫系統(tǒng)帶來的好處進行評估。此外,還完成對高層的技術實現(xiàn)結(jié)構(gòu)和數(shù)據(jù)倉庫結(jié)構(gòu)進行定義。2 系統(tǒng)定義本階段會明確定義增量開發(fā)過程的目標和范圍,確定數(shù)據(jù)源和數(shù)據(jù)質(zhì)量控制范圍,以及在已確定的解決方案實施范圍內(nèi)確定技術結(jié)構(gòu)和數(shù)據(jù)倉庫結(jié)構(gòu)。此外,在本階段還需建立在數(shù)據(jù)獲取、數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)倉庫管理、元數(shù)據(jù)管理、數(shù)據(jù)訪問和培訓等方面的策略性方案。3 系統(tǒng)分析在本階段中,在已確定的解決方案實施范圍內(nèi),明確詳細的業(yè)務需求,包括建立邏輯模型、收集源
33、于源數(shù)據(jù)的詳細需求,以及最終用戶對數(shù)據(jù)的訪問需求。在系統(tǒng)分析階段,確定數(shù)據(jù)獲取方案,包括從源系統(tǒng)中抽取什么數(shù)據(jù),以及數(shù)據(jù)量控制、數(shù)據(jù)校驗和轉(zhuǎn)換規(guī)則;確定業(yè)務數(shù)據(jù)處理周期、更新周期,以及提取、傳遞和裝載周期;完成源系統(tǒng)的分析,數(shù)據(jù)映射,源系統(tǒng)和目標系統(tǒng)的差異分析,源系統(tǒng)的變化,以及數(shù)據(jù)獲取工具的選擇。此外,建立與企業(yè)技術結(jié)構(gòu)相吻合的用于增量實施的技術結(jié)構(gòu),它是以支持增量實施的硬件、軟件、數(shù)據(jù)訪問工具、網(wǎng)絡、備份與恢復等方面為基礎的。同時,對用于數(shù)據(jù)訪問、數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)倉庫管理和元數(shù)據(jù)管理等數(shù)據(jù)倉庫解決方案中各部分的工具進行評估和選擇。4系統(tǒng)設計本階段的目標是使用在系統(tǒng)分析階段確定的信息建立滿
34、足需求的詳細技術定義。包括數(shù)據(jù)獲取和裝載模塊的設計,數(shù)據(jù)元素、數(shù)據(jù)匯總層次的驗證,數(shù)據(jù)一致性的檢查,元數(shù)據(jù)的定義,對數(shù)據(jù)訪問和查詢、編制報表等部分的詳細定義。此外,詳細定義邏輯模型、數(shù)據(jù)需求、來自系統(tǒng)分析階段的數(shù)據(jù)映射,以及關系型、多維數(shù)據(jù)和元數(shù)據(jù)庫對象的物理結(jié)構(gòu)設計。系統(tǒng)設計階段還完成平臺配置,制定測試方案,編制用戶使用和技術參考手冊、培訓資料,以及制定系統(tǒng)上線策略。5 系統(tǒng)建立本階段依據(jù)系統(tǒng)設計階段的方案,完成數(shù)據(jù)倉庫系統(tǒng)各組成部分的建立,包括數(shù)據(jù)庫、數(shù)據(jù)獲取模塊和數(shù)據(jù)訪問機制;構(gòu)造數(shù)據(jù)抽取、轉(zhuǎn)換、裝載、更新和集成模塊;安裝數(shù)據(jù)訪問工具,并于數(shù)據(jù)對象集成;構(gòu)造查詢、編制報表。此外,制定測試
35、計劃,準備測試環(huán)境;完成模塊的獨立和集成測試,系統(tǒng)正確性測試,系統(tǒng)性能測試。6 系統(tǒng)應用本階段完成數(shù)據(jù)倉庫解決方案的安裝,讓用戶具備使用和管理系統(tǒng)的能力,把系統(tǒng)移植到產(chǎn)品環(huán)境中。7 系統(tǒng)維護本階段完成對前一階段實施的評估和回顧,為下一階段的實施做好準備。3.3 項目實施計劃第四章 技術服務計劃、維護與承諾我方承諾項目交付后3年5天*8小時的技術支持服務,服務內(nèi)容包括免費和收費兩部分。4.1 免費服務內(nèi)容在線支持:使用在線支持,更新并記錄技術問題。電話支持:對于日常的操作問題,可以不限次數(shù)的電話咨詢。Email支持:對于客戶在工作中碰到的問題,我方在收到Email 請求后,將及時給予回復。傳真支
36、持:對于客戶通過傳真方式發(fā)出的問題請求,我方收到請求后及時給出回復。熱線電話我們可以做到8小時內(nèi)的做出服務回應,72小時內(nèi)的解決問題。我們還會安排不定期的客戶回訪。4.2 收費服務內(nèi)容對于不能通過免費維護服務實現(xiàn)的技術支持,安排資深技術人員赴現(xiàn)場進行問題處理。第五章 培訓計劃MicroStrategy產(chǎn)品培訓5.1.1培訓時間表培訓課程培訓時間參加培訓人員MicroStrategy: 基礎報表2天項目設計人員、高級報表開發(fā)人員、系統(tǒng)管理員MicroStrategy:系統(tǒng)管理2天系統(tǒng)管理人員MicroStrategy Desktop:高級報表4天高級報表開發(fā)人員Mic
37、roStrategy Architect:項目設計2天項目設計人員5.1.2培訓課程下列所有開設的培訓模塊全部本地化為中文。它們包括了所有要在迪比特環(huán)境下使用的MicroStrategy產(chǎn)品。所有的培訓皆基于MicroStrategy總部所發(fā)布的已有的培訓內(nèi)容。MicroStrategy:報表基礎時間2天先導課程熟練使用Windows操作界面培訓對象報表開發(fā)人員或設計人員分析人員高級報表用戶任何需要進一步的MicroStrategy課程培訓的人員所覆蓋的MicroStrategy產(chǎn)品MicroStrategy DesktopMicroStrategy Web課程描述兩天的課程將向?qū)W員介紹Mic
38、roStrategy Desktop和MicroStrategy Web的報表制作能力。學員將學會使用模板、篩選、度量、提示、搜索等對象構(gòu)建報表,還將學會組合多張報表、使用鉆取功能操作報表以及導出數(shù)據(jù)等。學員也將學會使用各種格式化選項比如排序、旋轉(zhuǎn)、分頁、大綱模式、以及顯示總計和小計等。培訓內(nèi)容MicroStrategy決策支持介紹MicroStrategy Desktop介紹在Desktop中創(chuàng)建、保存、查看報表在Desktop中操作報表創(chuàng)建、保存、編輯基本過濾器創(chuàng)建、格式化基本度量基本提示和搜索創(chuàng)建和查看文檔在MicroStrategy Web中操作報表MicroStrategy:系統(tǒng)管理
39、時間2天先導課程MicroStrategy:報表基礎培訓對象系統(tǒng)管理員開發(fā)人員咨詢?nèi)藛T項目經(jīng)理所覆蓋的MicroStrategy產(chǎn)品MicroStrategy Intelligence ServerMicroStrategy WebMicroStrategy Administrator課程描述兩天的課程將引導學員理解MicroStrategy Intelligence Server, MicroStrategy Web和MicroStrategy Administrator的基本工作原理。學員將學會服務器平臺的安裝、管理、故障排除。學員還將學會怎樣通過調(diào)整緩存、調(diào)度和群集來優(yōu)化服務器平臺。這些
40、培訓內(nèi)容將通過手工實驗和討論方式來進行。學員還將學會使用MicroStrategy Administrato中的一些工具軟件:Object Manager, Command Manager和Project Merge Wizard.通過這樣的培訓,學員將具備成功實施BI項目所需的設計、實施、調(diào)優(yōu)和維護平臺的知識。培訓內(nèi)容系統(tǒng)管理綜述系統(tǒng)架構(gòu)和查詢流程系統(tǒng)安裝配置和管理界面啟動和連接安全LDAP鑒權Intelligence Server系統(tǒng)管理緩存和調(diào)度數(shù)據(jù)集市群集Object Manager Command Manager項目及用戶合并向?qū)icroStrategy Web綜述MicroStr
41、ategy Web系統(tǒng)管理MicroStrategy Desktop:高級報表時間4天先導課程MicroStrategy:報表基礎培訓對象報表開發(fā)人員或設計人員需要創(chuàng)建高級報表并具有一定的SQL基礎知識的分析人員項目經(jīng)理咨詢?nèi)藛T高級用戶所覆蓋的MicroStrategy產(chǎn)品MicroStrategy Desktop培訓內(nèi)容高級度量(Metrics)事實層次擴展(Fact Level Extensions)復合型和自定義組(Consolidations and Custom Groups)高級提示(Prompts)高級篩選(Filters)鉆取地圖(Drill Maps)報表數(shù)據(jù)選項(Repor
42、t Data Options)Engine LogicVLDB屬性 報表實驗MicroStrategy Architect:項目設計時間2天先導課程MicroStrategy:報表基礎培訓對象Project DesignersProject or Data ArchitectsDatabase 系統(tǒng)管理員所覆蓋的MicroStrategy產(chǎn)品MicroStrategy Architect培訓內(nèi)容MicroStrategy Architect介紹決策支持架構(gòu)邏輯數(shù)據(jù)模型(Logical Data Model)數(shù)據(jù)倉庫物理框架(Physical Warehouse Schema)數(shù)據(jù)建模和框架設計
43、高級培訓在MicroStrategy Architect中創(chuàng)建項目MicroStrategy FactsMicroStrategy AttributesMicroStrategy Hierarchies項目創(chuàng)建和配置項目維護聚合表分區(qū)和分區(qū)映射轉(zhuǎn)換(Transformations) 培訓教師張吉,董寶明系統(tǒng)交付使用培訓5.2.1培訓時間表培訓課程培訓時間參加培訓人員最終用戶培訓2天迪比特中,負責今后對最終用戶進行培訓的業(yè)務或IT人員。系統(tǒng)維護培訓3天將要負責系統(tǒng)運維的IT人員5.2.2培訓內(nèi)容系統(tǒng)的登陸與退出;系統(tǒng)各功能模塊的使用方法;系統(tǒng)客戶端常規(guī)報錯/非經(jīng)驗現(xiàn)象的解釋與解決辦法;良好的系統(tǒng)
44、使用習慣。ETL調(diào)度管理;ETL與Modeling隨業(yè)務變化的調(diào)整開發(fā)方法;系統(tǒng)權限管理;系統(tǒng)遷移方法;系統(tǒng)Trouble Shooting;系統(tǒng)應用擴展開發(fā)方法。培訓教師儲冬冬、曾健民附錄資料:不需要的可以自行刪除如何構(gòu)建銀行數(shù)據(jù)倉庫數(shù)據(jù)倉庫技術作為一項數(shù)據(jù)管理領域的新技術,其精髓在于針對聯(lián)機分析處理(OLAP)提出了一種綜合的解決方案,與以往很多技術不同的是,它主要是一種概念,在此概念指導下完成系統(tǒng)的構(gòu)造。既沒有可以直接購買到的現(xiàn)成產(chǎn)品,也沒有具體的分析規(guī)范和實現(xiàn)方法,也就是說沒有成熟、可靠且被廣泛接受的數(shù)據(jù)倉庫標準。在以往關系數(shù)據(jù)庫的設計和實現(xiàn)中,不僅有詳細的理論推導,還有無數(shù)的設計實例
45、,無論你使用的是什么公司的數(shù)據(jù)庫產(chǎn)品、開發(fā)工具,只要按照規(guī)范做,那么實現(xiàn)同一業(yè)務需求的方案都會很相似。而現(xiàn)有數(shù)據(jù)倉庫的實現(xiàn)中,出現(xiàn)了MOLAP方案和ROLAP方案的區(qū)別,出現(xiàn)了形形色色的數(shù)據(jù)倉庫建模工具、表現(xiàn)工具,而設計人員的個人經(jīng)驗和素質(zhì)也會在其中扮演很重要的角色。 數(shù)據(jù)倉庫技術的實現(xiàn)方式 目前在數(shù)據(jù)倉庫技術的實際應用中主要包括如下幾種具體實現(xiàn)方式。 1、在關系數(shù)據(jù)庫上建立數(shù)據(jù)倉庫(ROLAP) 2、在多維數(shù)據(jù)庫上建立數(shù)據(jù)倉庫(MOLAP) MOLAP方案是以多維方式來組織數(shù)據(jù),以多維方式來存儲數(shù)據(jù);ROLAP方案則以二維關系表為核心表達多維概念,通過將多維結(jié)構(gòu)劃分為兩類表:維表和事實表,使
46、關系型結(jié)構(gòu)能較好地適應多維數(shù)據(jù)的表示和存儲。在多維數(shù)據(jù)模型的表達方面,多維矩陣比關系表更清晰且占用的存儲更少,而通過關系表間的連接來查詢數(shù)據(jù)的ROLAP系統(tǒng),系統(tǒng)性能成為最大問題。MOLAP方案比ROLAP方案要簡明,索引及數(shù)據(jù)聚合可以自動進行并自動管理,但同時喪失了一定的靈活性。ROLAP方案的實現(xiàn)較為復雜,但靈活性較好,用戶可以動態(tài)定義統(tǒng)計和計算方式,另外能保護在已有關系數(shù)據(jù)庫上的投資。 由于兩種方案各有優(yōu)劣,因此在實際應用中,往往將MOLAP和ROLAP結(jié)合使用,即所謂的混合模型。利用關系數(shù)據(jù)庫存儲歷史數(shù)據(jù)、細節(jié)數(shù)據(jù)或非數(shù)值型數(shù)據(jù),發(fā)揮關系數(shù)據(jù)庫技術成熟的優(yōu)勢,減少花費,而在多維數(shù)據(jù)庫中
47、存儲當前數(shù)據(jù)和常用統(tǒng)計數(shù)據(jù),以提高操作性能。 3、在原有關系庫上建立邏輯上的數(shù)據(jù)倉庫 由于目前正在運行的OLTP系統(tǒng)中已經(jīng)積累了海量數(shù)據(jù),如何從中提取出決策所需的有用信息就成為用戶最迫切的需要。新建數(shù)據(jù)倉庫固然能從功能、性能各方面給出一個完整的解決方案,但需要投入大量的人力、物力,并且數(shù)據(jù)倉庫的建設和分析數(shù)據(jù)的積累需要一段時間,無法及時滿足用戶對信息分析的迫切需要。因此在籌建數(shù)據(jù)倉庫的前期,可以采用一些合適的表現(xiàn)工具,在原有OLTP系統(tǒng)上建立起一個邏輯的數(shù)據(jù)倉庫系統(tǒng)。盡管由于原有OLTP系統(tǒng)設計上的局限性,這樣的系統(tǒng)可能無法實現(xiàn)很多分析功能,但這樣一個系統(tǒng)中數(shù)據(jù)結(jié)構(gòu)固定、信息分析需求相對穩(wěn)定成
48、熟,因此數(shù)據(jù)倉庫的建模、實現(xiàn)過程會相對容易、便捷;同時,這樣的系統(tǒng)也會成為將來真正數(shù)據(jù)倉庫建設的原型。 信息系統(tǒng)與數(shù)據(jù)倉庫的關系 由于數(shù)據(jù)量大、數(shù)據(jù)來源多樣化,在商業(yè)銀行構(gòu)建管理信息系統(tǒng)時,不可避免地會遇上如何管理這些浩如煙海的數(shù)據(jù),以及如何從中提取有用的信息的問題;而數(shù)據(jù)倉庫的最大優(yōu)點在于它能把企業(yè)網(wǎng)絡中不同信息島上的商業(yè)數(shù)據(jù)集中到一起,存儲在一個單一的集成的數(shù)據(jù)庫中,并提供各種手段對數(shù)據(jù)進行統(tǒng)計、分析。因此可以說,在銀行使用數(shù)據(jù)倉庫構(gòu)建管理信息系統(tǒng),既有壓力,又有數(shù)據(jù)基礎,它們之間的聯(lián)系是必然的,難以割舍的。 數(shù)據(jù)倉庫在商業(yè)銀行的應用范圍包括存款分析、貸款分析、客戶市場分析、相關金融業(yè)分析
49、決策(證券、外匯買賣)、風險預測、效益分析等。 在銀行信息系統(tǒng)構(gòu)建時,由于歷史情況和現(xiàn)實需求的不同,存在兩種途徑: 1、建設新系統(tǒng) 由于目前國內(nèi)商業(yè)銀行對銀行內(nèi)部運營的監(jiān)管,缺乏很好的數(shù)據(jù)搜集機制,因此可以在構(gòu)建管理信息系統(tǒng)時,分數(shù)據(jù)收集錄入和數(shù)據(jù)匯總分析兩部分來考慮。這樣的系統(tǒng)中由于不需考慮大量歷史數(shù)據(jù)的處理問題,同時考慮到搜集過程中可能存在多個數(shù)據(jù)來源,因此可以在系統(tǒng)建設的同時構(gòu)建數(shù)據(jù)倉庫,將搜集來的各種數(shù)據(jù)通過數(shù)據(jù)抽取整合到數(shù)據(jù)倉庫中。 2、完善原有系統(tǒng) 而對于已經(jīng)存在OLTP系統(tǒng),其中沉淀了大量歷史數(shù)據(jù),則可以先在原有系統(tǒng)上建立邏輯數(shù)據(jù)倉庫,即使用數(shù)據(jù)分析的表現(xiàn)工具,在關系模型上構(gòu)建一
50、個虛擬的多維模型。當系統(tǒng)需求穩(wěn)定后,再建立物理數(shù)據(jù)倉庫,這樣既節(jié)省投資,又縮短開發(fā)工期。 實現(xiàn)中需要注意的問題 一、模型設計中的問題 模型設計(包括邏輯模型設計和物理模型設計)是系統(tǒng)的基礎和成敗的關鍵,在實際操作中,視實現(xiàn)技術的不同應分別對下列問題引起注意。 1、直接構(gòu)建數(shù)據(jù)倉庫 直接構(gòu)建數(shù)據(jù)倉庫時,必須按業(yè)務分析的要求重組OLTP系統(tǒng)中的數(shù)據(jù),并要按不同側(cè)重點分別組織,使之便于使用。 *主題的確定 主題是一個邏輯概念,它應該能夠完整、統(tǒng)一地刻畫出分析對象所涉及的各項數(shù)據(jù)以及相互聯(lián)系。劃分主題的根據(jù)主要來源于兩方面:對原有固定報表的分析和對業(yè)務人員的訪談。原有固定報表能較好地反映出以往工作對數(shù)
51、據(jù)分析的需求,而且數(shù)據(jù)含義和格式相對成熟、穩(wěn)定,在模型設計中需要大量借鑒。但僅僅滿足于替代目前的手工報表還遠遠不應是構(gòu)建管理信息系統(tǒng)的目標,還應該通過業(yè)務訪談,進一步挖掘出日常工作中潛在的更廣、更深的分析需求。只有這樣,才能真正了解構(gòu)建數(shù)據(jù)倉庫模型所需的主題劃分。 *分析內(nèi)容的細化 主題的劃分實際上是與分析內(nèi)容的范圍直接相關的,一旦主題劃分清楚了,下一步就是細化分析的具體內(nèi)容以及根據(jù)分析內(nèi)容的性質(zhì)確定它在數(shù)據(jù)倉庫中的位置。通常維元素對應的是分析角度,而度量對應的是分析關心的具體指標。一個指標究竟是作為維元素、度量還是維屬性,取決于具體的業(yè)務需求,但從實際操作中可以總結(jié)出如下的概念性經(jīng)驗:作為維
52、元素或維屬性的通常是離散型的數(shù)據(jù),只允許有限的取值;作為度量的是連續(xù)型數(shù)據(jù),取值無限。如果一定要用連續(xù)型數(shù)據(jù)作為維元素,則必須對其按取值進行分段,以分段值作為實際的維元素。判斷分析指標是作為維元素還是維屬性時,則需要綜合考慮這個指標占用的存儲空間與相關查詢的使用頻度。 需要特別強調(diào)的是,在細化分析內(nèi)容的過程中,務必解決指標的歧義問題。在不同報表中以及在業(yè)務訪談中同一名稱的指標,是否是在同樣條件限定下,通過同樣方法提取或計算得到的,它們之間的相互關系是什么,這些問題都必須從熟悉業(yè)務的分析人員那里得到準確、清晰的答案,否則將會影響到模型設計、數(shù)據(jù)提取、數(shù)據(jù)展現(xiàn)等多個方面。 *粒度的設計 數(shù)據(jù)倉庫模
53、型中所存儲的數(shù)據(jù)的粒度將對信息系統(tǒng)的多方面產(chǎn)生影響。事實表中以各種維度的什么層次作為最細粒度,將決定存儲的數(shù)據(jù)能否滿足信息分析的功能需求,而粒度的層次劃分、以及聚合表中粒度的選擇將直接影響查詢的響應時間。 如果同一個信息系統(tǒng)要在大范圍、多層次上同時運行,如部門級和企業(yè)級,還應考慮不同層次的數(shù)據(jù)倉庫采用不同的粒度。 *模型設計中的技巧 復合指標尤其是比率類指標的定義,必須注意累加時是先加減后乘除,還是反之。戶數(shù)、筆數(shù)的計算,這類指標在分析或報表中經(jīng)常出現(xiàn),但不需要作為單獨的指標物理存在于數(shù)據(jù)庫中,但定義分析模型時一定應該準備。度量的時間特性,針對分析指標在時間維上的不同表現(xiàn),可分為可累加指標、半可累加指標和不可累加指標。 2、在原有數(shù)據(jù)基礎上構(gòu)建邏輯數(shù)據(jù)倉庫 如果直接使用OLTP系統(tǒng)中的數(shù)據(jù)進行數(shù)據(jù)分析處理,會遇到許多麻煩,有時甚至是不可能實現(xiàn)的。這并不是說關系數(shù)據(jù)庫不好,而是因為其設計思路不適應較大規(guī)模數(shù)據(jù)分析。因此在使用這種方法時
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2020五年級下冊應用題
- 2025年個人聘請合同(三篇)
- 2025年二氧化碳氣體保護焊設備租賃合同范文(2篇)
- 2025年個人的私有土地轉(zhuǎn)讓合同(2篇)
- 2025年個人工程承包合同范例(2篇)
- 2025年個人的抵押借款合同標準版本(2篇)
- 2025年二手房購房協(xié)議參考模板(2篇)
- 2025年人離婚協(xié)議例文(4篇)
- 2025年中介租賃合同(三篇)
- 湖南咖啡廳裝修合同范本
- 蔬菜采購項目投標書
- 肩周炎康復護理
- 2022年安徽管子文化旅游集團有限公司招聘筆試試題及答案解析
- SAPPM設備管理解決方案
- Q-HN-1-0000.08.004《風力發(fā)電場電能質(zhì)量監(jiān)督技術標準》
- 宗教與社會課件
- 3人-機-環(huán)-管理本質(zhì)安全化措施課件
- 生殖醫(yī)學中心建設驗收標準分析-講座課件PPT
- 慶陽煤炭資源開發(fā)調(diào)研報告
- 橋博常見問題
- 貴州省電梯日常維護保養(yǎng)合同范本
評論
0/150
提交評論