Oracle-SOA-主數(shù)據(jù)管理解決方案_第1頁
Oracle-SOA-主數(shù)據(jù)管理解決方案_第2頁
Oracle-SOA-主數(shù)據(jù)管理解決方案_第3頁
Oracle-SOA-主數(shù)據(jù)管理解決方案_第4頁
Oracle-SOA-主數(shù)據(jù)管理解決方案_第5頁
已閱讀5頁,還剩65頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Oracle技術(shù)解決方案

ORACLe

i錄

1.概述.........................................................................4

1.1背景......................................................................4

南方電網(wǎng)“十一五”信息化現(xiàn)狀................................................4

南方電網(wǎng)“十二五”信息化定位...............................錯(cuò)誤!未定義書簽。

1.2項(xiàng)目建設(shè)目標(biāo).............................................錯(cuò)誤!未定義書簽。

1.3項(xiàng)目建設(shè)范圍.............................................錯(cuò)誤!未定義書簽。

1.4項(xiàng)目建設(shè)內(nèi)容.............................................錯(cuò)誤!未定義書簽。

1.5需求分析.................................................錯(cuò)誤!未定義書簽。

2.Oracle主數(shù)據(jù)管理方案.......................................................4

2.1Oracle主數(shù)據(jù)管理設(shè)計(jì)......................................................7

Oracle主數(shù)據(jù)管理總體架構(gòu)設(shè)計(jì)................................................7

主數(shù)據(jù)方案設(shè)計(jì).............................................................15

交換數(shù)據(jù)方案設(shè)計(jì)...........................................................19

數(shù)據(jù)交換系統(tǒng)功能設(shè)計(jì).......................................................21

3.Oracle主數(shù)據(jù)管理設(shè)計(jì)產(chǎn)品介紹.............................................37

3.1OracleBPMSuite(業(yè)務(wù)流程).................................................37

BPM方案總體架構(gòu)...........................................................37

閉環(huán)的OracleBPM解決方案..................................................38

業(yè)務(wù)流程分析BPA階段.........................................................38

業(yè)務(wù)流程執(zhí)行BPE與業(yè)務(wù)流程監(jiān)視BAM階段.....................................40

OracleBPM平臺(tái)中主要模塊介紹..............................................42

3.1.3.lOracleBPM服務(wù)器......................................................42

業(yè)務(wù)規(guī)則42

流程建模與模擬工具...........................................................44

元數(shù)據(jù)資料庫(kù)44

OracleBPM解決方案的優(yōu)勢(shì)...................................................45

3.2OracleSOASuite(應(yīng)用集成)..................................................46

價(jià)值主見....................................................................46

倉(cāng)建月艮務(wù)....................................................................46

服務(wù)連通與轉(zhuǎn)換.............................................................46

流程編排和整合.............................................................47

服務(wù)發(fā)布與注冊(cè).............................................................48

服務(wù)的平安管理.............................................................49

用戶身份管理...............................................................50

SOA平臺(tái)的系統(tǒng)管理.........................................................50

3.3OracleDataIntegrator(批量數(shù)據(jù)抽?。?........................................54

產(chǎn)品概述....................................................................54

0DI產(chǎn)品體系結(jié)構(gòu)............................................................55

數(shù)據(jù)分發(fā)和傳輸.............................................................56

數(shù)據(jù)集成核心...............................................................58

數(shù)據(jù)質(zhì)量核心...............................................................58

數(shù)據(jù)連接....................................................................60

ODI主要優(yōu)勢(shì)...............................................................61

3.4GoldenGate(實(shí)時(shí)數(shù)據(jù)同步方案)............................................61

高可用和容災(zāi)解決方案.......................................................62

實(shí)時(shí)數(shù)據(jù)整合解決方案.......................................................62

復(fù)制模式....................................................................63

關(guān)鍵特性....................................................................65

應(yīng)用方式....................................................................66

4.軟件配置及部署方案.........................................................68

4.1軟件配置及硬件舉薦......................................................68

4.2部署架構(gòu)圖..............................................................69

L概述

i.i背景

1.1.1南方電網(wǎng)“十一五”信息化現(xiàn)狀

Oracle主數(shù)據(jù)管理方案

南方電網(wǎng)的數(shù)據(jù)質(zhì)量管理必需有一整套的用于生成和維護(hù)企業(yè)主數(shù)據(jù)的規(guī)范、技術(shù)和方

案,以保證主數(shù)據(jù)的完整性、一樣性和精確性。

(1)數(shù)據(jù)標(biāo)準(zhǔn)管理

數(shù)據(jù)標(biāo)準(zhǔn)包括各業(yè)務(wù)域的數(shù)據(jù)集標(biāo)準(zhǔn)、數(shù)據(jù)模型標(biāo)準(zhǔn)及信息分類編碼標(biāo)準(zhǔn)。這些標(biāo)準(zhǔn)用

于指導(dǎo)各業(yè)務(wù)系統(tǒng)建設(shè)與實(shí)施。

在標(biāo)準(zhǔn)管理上,數(shù)據(jù)資源管理工具應(yīng)能有效管控標(biāo)準(zhǔn)的變更與執(zhí)行。尤其是“十二五”

期間,如何管理網(wǎng)省兩級(jí)、省級(jí)集中的業(yè)務(wù)系統(tǒng)的統(tǒng)一版本問題是關(guān)鍵。

(2)主數(shù)據(jù)管理

通過企業(yè)范圍內(nèi)的統(tǒng)一視圖,即ECIM模型,實(shí)現(xiàn)主數(shù)據(jù)管理,促進(jìn)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)集

成與共享。

主數(shù)據(jù)管理須要解決主數(shù)據(jù)的定義、標(biāo)識(shí)、存儲(chǔ)、匯合、清洗、監(jiān)管與共享。主數(shù)據(jù)可

以為業(yè)務(wù)系統(tǒng)或數(shù)據(jù)中心服務(wù)。

(3)數(shù)據(jù)質(zhì)量管理

數(shù)據(jù)管理的最終的目標(biāo)是為了提升系統(tǒng)數(shù)據(jù)質(zhì)量。在主數(shù)據(jù)的清洗階段,通過數(shù)據(jù)質(zhì)量

管理工作,對(duì)數(shù)據(jù)進(jìn)行解析、標(biāo)準(zhǔn)化、匹配&去重、補(bǔ)充及驗(yàn)證建立牢靠的數(shù)據(jù)。對(duì)于核心

結(jié)構(gòu)化數(shù)據(jù)在加載到數(shù)據(jù)中心時(shí)也進(jìn)行相像的工作,提高決策支持水平。

南方電網(wǎng)的主數(shù)據(jù)管理系統(tǒng)從1T建設(shè)的角度而言都會(huì)是一個(gè)相對(duì)困難的系統(tǒng),往往會(huì)

和企業(yè)數(shù)據(jù)倉(cāng)庫(kù)/決策支持系統(tǒng)以及企業(yè)內(nèi)的各個(gè)業(yè)務(wù)系統(tǒng)發(fā)生關(guān)系,技術(shù)實(shí)現(xiàn)上也會(huì)涉

及到ETL、流程、SOA、企業(yè)服務(wù)總線等多個(gè)方面,一個(gè)典型的主數(shù)據(jù)管理的信息流為:

某個(gè)業(yè)務(wù)系統(tǒng)觸發(fā)對(duì)企業(yè)主數(shù)據(jù)的改動(dòng);

?主數(shù)據(jù)管理系統(tǒng)將整合之后完整、精確的主數(shù)據(jù)分發(fā)給全部有關(guān)的應(yīng)用系統(tǒng);

?主數(shù)據(jù)管理系統(tǒng)為業(yè)務(wù)系統(tǒng)和決策支持以及數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)供應(yīng)精確的數(shù)據(jù)源。

因此對(duì)于南方電網(wǎng)數(shù)據(jù)質(zhì)量管理的建設(shè),必需從項(xiàng)目建設(shè)初期就考慮整體的平臺(tái)框架和技術(shù)

實(shí)現(xiàn)。Oracle主數(shù)據(jù)管理(MasterDataManagement,MDM)是當(dāng)前業(yè)界最完整的是一種集

成的、完整的企業(yè)主數(shù)據(jù)(企業(yè)業(yè)務(wù)運(yùn)行和商務(wù)分析所依靠的關(guān)鍵性基礎(chǔ)數(shù)據(jù))管理平臺(tái),

具有企業(yè)級(jí)主數(shù)據(jù)存儲(chǔ)、主數(shù)據(jù)整合、主數(shù)據(jù)清洗、主數(shù)據(jù)監(jiān)管以及主數(shù)據(jù)共享等五大功能,

可全面連接企業(yè)數(shù)據(jù)內(nèi)容(廣泛運(yùn)用和在部門間共享的數(shù)據(jù))和實(shí)現(xiàn)企業(yè)范圍內(nèi)的主數(shù)據(jù)統(tǒng)

一、完整和一樣。作為企業(yè)的真實(shí)數(shù)據(jù)來源,Oracle主數(shù)據(jù)管理(MDM)平臺(tái)通過數(shù)據(jù)治理服

務(wù)以及對(duì)周邊應(yīng)用系統(tǒng)的集成和對(duì)商務(wù)智能系統(tǒng)的支持,來統(tǒng)一管理企業(yè)內(nèi)重要的基礎(chǔ)數(shù)據(jù)

信息,可以整合并維護(hù)企業(yè)范圍的全面、精確且權(quán)威的主數(shù)據(jù),并將這些主數(shù)據(jù)信息作為共

享服務(wù)分發(fā)到所需的業(yè)務(wù)和分析系統(tǒng)。

Oracle主數(shù)據(jù)管理解決方案具有以下特性:

?保證數(shù)據(jù)的唯一性和精確性:有效整理和集中分散在關(guān)鍵企業(yè)流程和應(yīng)用軟件中的

數(shù)據(jù)片斷,通過一系列匹配、整合和清洗規(guī)則使之形成單一真實(shí)數(shù)據(jù)源,并供應(yīng)基于工

作流的數(shù)據(jù)監(jiān)管流程來實(shí)現(xiàn)持續(xù)的數(shù)據(jù)質(zhì)量維護(hù)。最終將統(tǒng)一的數(shù)據(jù)資產(chǎn)作為Web服務(wù)

供應(yīng)應(yīng)周邊的業(yè)務(wù)系統(tǒng),實(shí)現(xiàn)企業(yè)范圍的主數(shù)據(jù)協(xié)同;

?有效降低數(shù)據(jù)管理成本:供應(yīng)統(tǒng)一的資源庫(kù)來集中管理企業(yè)重要的數(shù)據(jù)資產(chǎn),并能

將對(duì)這些數(shù)據(jù)資產(chǎn)的訪問以服務(wù)的方式供應(yīng)應(yīng)周邊應(yīng)用系統(tǒng),實(shí)時(shí)地供應(yīng)訪問主數(shù)據(jù)的

WEB服務(wù),包括匹配、申請(qǐng)全部信息以及申請(qǐng)所需信息等;

?實(shí)現(xiàn)更好的報(bào)表:精確、有效的數(shù)據(jù)是精確、有效的報(bào)表的基礎(chǔ),OracleMDM可以

將清洗、排重、整理之后的精確數(shù)據(jù)供應(yīng)應(yīng)企業(yè)的商務(wù)分析系統(tǒng),得到更加精確的決策

支持;

.供應(yīng)企業(yè)系統(tǒng)架構(gòu)敏捷性和創(chuàng)新性的基礎(chǔ):維護(hù)持續(xù)的、唯一而精確的主數(shù)據(jù)資產(chǎn),

能夠在不斷變更的業(yè)務(wù)環(huán)境中增加IT彈性,滿足爆炸式數(shù)據(jù)增長(zhǎng)的需求。

Oracle主數(shù)據(jù)管理能支持以下六大功能:

Govern

?指定每個(gè)特定主數(shù)據(jù)域的業(yè)務(wù)職責(zé),例如,產(chǎn)品、客戶、供應(yīng)商和組織結(jié)構(gòu)。

.嚴(yán)格履行職責(zé)可保證接入共享資源的系統(tǒng)始終保持高質(zhì)量主數(shù)據(jù)。

.提取分散在各個(gè)應(yīng)用系統(tǒng)中的主數(shù)據(jù)集中到主數(shù)據(jù)存儲(chǔ)庫(kù),主數(shù)據(jù)存儲(chǔ)庫(kù)一般采納

二維數(shù)據(jù)庫(kù)存儲(chǔ)主數(shù)據(jù)。

?依據(jù)企業(yè)業(yè)務(wù)規(guī)則和企業(yè)數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)對(duì)收集到的主數(shù)據(jù)進(jìn)行加工清理,從而形成

符合企業(yè)需求的主數(shù)據(jù)。

?制定主數(shù)據(jù)變更的流程審批機(jī)制,從而保證主數(shù)據(jù)修改的一樣性和穩(wěn)定性。

?實(shí)現(xiàn)各個(gè)數(shù)據(jù)利用系統(tǒng)與主數(shù)據(jù)存儲(chǔ)庫(kù)的數(shù)據(jù)同步,從而保證每個(gè)系統(tǒng)運(yùn)用的主數(shù)

據(jù)相同。)

隨著IT系統(tǒng)的建設(shè),主數(shù)據(jù)的修改動(dòng)作必定從現(xiàn)有分散的各個(gè)系統(tǒng)轉(zhuǎn)移到主數(shù)據(jù)存儲(chǔ)

庫(kù)集中進(jìn)行,因此必需保證當(dāng)前主數(shù)據(jù)管理系統(tǒng)的敏捷性,便利修改、監(jiān)控、更新關(guān)聯(lián)

系統(tǒng)主數(shù)據(jù)的變更。

Oracle主數(shù)據(jù)管理在企業(yè)范圍內(nèi)主數(shù)據(jù)協(xié)同方面完善了一套端到端的模式可滿足

客戶不同的實(shí)施須要,即''推動(dòng)模式”和“拉動(dòng)模式”,前者通過前端獨(dú)立應(yīng)用軟件(包

括Oracle應(yīng)用系統(tǒng)、企業(yè)自主開發(fā)以及第三方軟件)的主數(shù)據(jù)改動(dòng),經(jīng)過Oracle應(yīng)用

集成架構(gòu)自動(dòng)且快速地同步到OracleMDM主數(shù)據(jù)平臺(tái),可實(shí)現(xiàn)企業(yè)范圍內(nèi)的全面數(shù)據(jù)

整合,而后者則是由主數(shù)據(jù)平臺(tái)主動(dòng)對(duì)前端應(yīng)用軟件進(jìn)行實(shí)時(shí)的訪問,獲得新增、更改

和補(bǔ)充數(shù)據(jù),并經(jīng)過Oracle應(yīng)用集成架構(gòu)和內(nèi)部數(shù)據(jù)規(guī)則實(shí)現(xiàn)標(biāo)準(zhǔn)化,從而最終在主

數(shù)據(jù)平臺(tái)實(shí)現(xiàn)唯一精確地共享數(shù)據(jù)。

2.1Oracle主數(shù)據(jù)管理設(shè)計(jì)

2.1.1Oracle主數(shù)據(jù)管理總體架構(gòu)設(shè)計(jì)

Oracle主數(shù)據(jù)管理的主要功能可歸結(jié)為以下六大功能:

主數(shù)據(jù)存儲(chǔ)

主數(shù)據(jù)整合與連接

主數(shù)據(jù)質(zhì)量管理

主數(shù)據(jù)管理監(jiān)控

主數(shù)據(jù)共享

平安牢靠的平臺(tái)

主數(shù)據(jù)存儲(chǔ)

?一個(gè)具有無限可擴(kuò)展性的內(nèi)置、敏捷(隨時(shí)間變更)的開放數(shù)據(jù)模型可維護(hù)南方電網(wǎng)

主數(shù)據(jù)和全部須要的屬性(結(jié)構(gòu)化和非結(jié)構(gòu)化的)、相關(guān)實(shí)體、分類和關(guān)系;

?可跟蹤主數(shù)據(jù)屬性、審計(jì)跟蹤信息和歷史主數(shù)據(jù)剖析的來源

主要用于存儲(chǔ)整合后主數(shù)據(jù),將各系統(tǒng)的需求信息概括形成一條完整的記錄并進(jìn)行存儲(chǔ)供應(yīng),

供應(yīng)一個(gè)完整的數(shù)據(jù)模型。主數(shù)據(jù)的不同部分分布在不同的業(yè)務(wù)系統(tǒng)中,比如一個(gè)callcenter

系統(tǒng)須要保存客戶的全部聯(lián)系信息,但是一個(gè)計(jì)費(fèi)系統(tǒng)可能只須要保留客戶的與計(jì)費(fèi)相關(guān)的

信息,如何將客戶信息形成一條完整的記錄并進(jìn)行存儲(chǔ)供應(yīng),當(dāng)然是須要概括全部這些系統(tǒng)

的需求,供應(yīng)一個(gè)完整的數(shù)據(jù)模型。

數(shù)據(jù)整合與連接

■領(lǐng)先的嵌入式數(shù)據(jù)質(zhì)量管理工具及與第三方數(shù)據(jù)源的集成,用于驗(yàn)證和充溢數(shù)據(jù)

■可保持?jǐn)?shù)據(jù)最新的持續(xù)數(shù)據(jù)清理功能集

-快速平安的參數(shù)化搜尋引擎,能識(shí)別和避開重復(fù)數(shù)據(jù)

■智能合并和自動(dòng)合并功能,消退數(shù)據(jù)重復(fù),同時(shí)確保正確的數(shù)據(jù)屬性解除

■利用與外部?jī)?nèi)容供應(yīng)商的預(yù)建集成來充溢主數(shù)據(jù)內(nèi)容

■包括主數(shù)據(jù)生命周期管理工作流

主數(shù)據(jù)分散在不同的業(yè)務(wù)系統(tǒng)中,要進(jìn)行數(shù)據(jù)整合,第一步是實(shí)現(xiàn)這些異構(gòu)系統(tǒng)的互聯(lián)互通,

然后通過肯定的觸發(fā)機(jī)制將各個(gè)系統(tǒng)針對(duì)主數(shù)據(jù)的修改同步到主數(shù)據(jù)存儲(chǔ)庫(kù)。但是在實(shí)施數(shù)

據(jù)集成的過程中,由于不同系統(tǒng)供應(yīng)的數(shù)據(jù)內(nèi)容、數(shù)據(jù)格式和數(shù)據(jù)質(zhì)量千差萬別,甚至?xí)?/p>

到數(shù)據(jù)格式不能轉(zhuǎn)換或數(shù)據(jù)轉(zhuǎn)換格式后丟失信息等問題,將會(huì)嚴(yán)峻阻礙數(shù)據(jù)在各部門和各應(yīng)

用系統(tǒng)中的流淌與共享。因此,如何對(duì)數(shù)據(jù)進(jìn)行有效的集成管理是數(shù)據(jù)共享中心建設(shè)的一個(gè)

關(guān)鍵難點(diǎn)。

ETL是實(shí)現(xiàn)數(shù)據(jù)集成的主要技術(shù)。ETL中三個(gè)字母分別代表的是Extract、Transform、Load,

即抽取、轉(zhuǎn)換、加載。(1)數(shù)據(jù)抽?。簭脑磾?shù)據(jù)源系統(tǒng)抽取目的數(shù)據(jù)源系統(tǒng)須要的數(shù)據(jù);(2)

數(shù)據(jù)轉(zhuǎn)換:將從源數(shù)據(jù)源獲得的數(shù)據(jù)依據(jù)業(yè)務(wù)需求,轉(zhuǎn)換成目的數(shù)據(jù)源要求的形式,并對(duì)錯(cuò)

誤、不一樣的數(shù)據(jù)進(jìn)行清洗和加工。(3)數(shù)據(jù)加載:將轉(zhuǎn)換后的數(shù)據(jù)裝載到目的數(shù)據(jù)源。ETL

過程中的主要環(huán)節(jié)就是數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換和加工、數(shù)據(jù)裝載。

Oracle的主數(shù)據(jù)整合管理ETL基于ODI來實(shí)現(xiàn),運(yùn)用ODI設(shè)計(jì)和生成典型格式;利用已有

的元數(shù)據(jù)格式設(shè)計(jì)MDM應(yīng)用(實(shí)體,字段,關(guān)系);生成和維護(hù)主數(shù)據(jù)結(jié)構(gòu);生成和部署轉(zhuǎn)

換。

主數(shù)據(jù)質(zhì)量管理

?為每個(gè)主數(shù)據(jù)實(shí)體創(chuàng)建通用ID并構(gòu)建針對(duì)每個(gè)所連接記錄/系統(tǒng)對(duì)的交叉引用

-一個(gè)數(shù)據(jù)導(dǎo)入工作臺(tái)和用戶界面,以幫助數(shù)據(jù)管理員管理源系統(tǒng)的映射和數(shù)據(jù)加載

及主數(shù)據(jù)剖析

■運(yùn)用預(yù)建、符合標(biāo)準(zhǔn)的業(yè)務(wù)服務(wù)和適配器實(shí)現(xiàn)集成

'運(yùn)用可配置的屬性“解除”規(guī)則,依據(jù)多個(gè)數(shù)據(jù)源創(chuàng)建單一的記錄

■利用基礎(chǔ)服務(wù)框架的數(shù)據(jù)聯(lián)合功能

主數(shù)據(jù)維護(hù)著企業(yè)里該種類型數(shù)據(jù)的最值得信任的數(shù)據(jù),所以運(yùn)用質(zhì)量管理技術(shù)來保證這些

數(shù)據(jù)的精確是主數(shù)據(jù)管理里特別重要的一環(huán)。

數(shù)IK標(biāo)準(zhǔn)化K配則拿?復(fù)處理

?■以和標(biāo)漕化?件?使用定■的引擎送行大

BW??々芹鼻目把R以防止

?在主從0次中選b?分靈在產(chǎn)品卷據(jù)存儡中產(chǎn)

?以劇重復(fù)井用防重復(fù)發(fā)

?使用行上a公生“復(fù)

65

頓TO"

自動(dòng)產(chǎn)生和■認(rèn)xn?

?JAH條目另林福述,成銀功—?螳步執(zhí)行新條目定義

和審依廢程?去■不必要的肥

91遇行數(shù)祗螳格化豪M少鼓樵0

?在所有數(shù)據(jù)人”聲謫求刑R./7?產(chǎn)R變化拉切

戶自定義?4

1.數(shù)據(jù)清洗:數(shù)據(jù)清洗是對(duì)數(shù)據(jù)進(jìn)行校驗(yàn)和標(biāo)準(zhǔn)化,比如地址郵編是否存在等等。

2.數(shù)據(jù)匹配:數(shù)據(jù)匹配是找出有可能重復(fù)的記錄。比如MDM系統(tǒng)里有兩個(gè)閾值是用于限

制數(shù)據(jù)匹配的流程,第一個(gè)閾值是高分閾值,對(duì)于數(shù)據(jù)匹配分值高于高分閾值的記錄將會(huì)

運(yùn)用數(shù)據(jù)存活規(guī)則進(jìn)行自動(dòng)合并;其次個(gè)閾值是中分閾值,數(shù)據(jù)匹配得分在高分閾值和中分

閾值之間的記錄將會(huì)進(jìn)入人工推斷工作流,由管理員或者其他指定的人確定合并還是作為

新記錄。低于中分閾值的記錄都將會(huì)被作為新記錄。

數(shù)據(jù)存活規(guī)則(Survivorshiprules)

一般而言,企業(yè)里的主數(shù)據(jù)來源于企業(yè)里的各個(gè)系統(tǒng),當(dāng)不同系統(tǒng)的同一個(gè)屬性值有不同的

值的時(shí)候,就須要確定哪一個(gè)系統(tǒng)的值是精確的。數(shù)據(jù)存活規(guī)則指定各種規(guī)則來確定新的數(shù)

據(jù)進(jìn)入到主數(shù)據(jù)庫(kù)或者當(dāng)新數(shù)據(jù)和舊有主數(shù)據(jù)沖突的時(shí)候的處理方法。數(shù)據(jù)存活規(guī)則主要有

三種:

?Recent規(guī)則:當(dāng)相同的數(shù)據(jù)進(jìn)入主數(shù)據(jù)系統(tǒng)的時(shí)候,以后來的數(shù)據(jù)為準(zhǔn),后來數(shù)據(jù)

替換原來的數(shù)據(jù)。比如contact(聯(lián)系人)信息,缺省是以后來的更新為主。

?History規(guī)則:當(dāng)相同的數(shù)據(jù)進(jìn)入主數(shù)據(jù)系統(tǒng)的時(shí)候,以原來的數(shù)據(jù)為準(zhǔn),不接受后

來數(shù)據(jù)的更新。

?Source規(guī)則:當(dāng)相同的數(shù)據(jù)進(jìn)入主數(shù)據(jù)系統(tǒng)的時(shí)候,以數(shù)據(jù)來源系統(tǒng)的可信度為作

為運(yùn)用哪個(gè)數(shù)據(jù)最終存活的規(guī)則。比如當(dāng)源系統(tǒng)有A,B,C三個(gè)系統(tǒng)的時(shí)候,我們

須要在主數(shù)據(jù)管理系統(tǒng)里注冊(cè)這三個(gè)系統(tǒng)的時(shí)候,同時(shí)給這些源系統(tǒng)評(píng)分,則當(dāng)

運(yùn)用source規(guī)則的時(shí)候,則以后的數(shù)據(jù)將以評(píng)分高的系統(tǒng)為準(zhǔn)。比如有三個(gè)系統(tǒng),

CRM,財(cái)務(wù),物流,對(duì)于客戶信息而言,我們認(rèn)為CRM系統(tǒng)里的客戶信息應(yīng)當(dāng)是最

準(zhǔn)的,我們應(yīng)當(dāng)給于CRM系統(tǒng)較高的分值,則這個(gè)時(shí)候?qū)τ诳蛻魯?shù)據(jù)我們將運(yùn)用

Source規(guī)則,則以后全部的CRM系統(tǒng)相應(yīng)客戶的更新會(huì)覆蓋原來不是CRM系統(tǒng)的

更新。

3.數(shù)據(jù)質(zhì)量管理流程

數(shù)據(jù)質(zhì)量的大致限制流程,即當(dāng)記錄進(jìn)入主數(shù)據(jù)系統(tǒng)時(shí),先會(huì)在主數(shù)據(jù)系統(tǒng)里找尋可能匹配

的記錄,假如結(jié)果認(rèn)為是不匹配,則將進(jìn)入處理不匹配流程來增加一條新記錄;假如是分

值足夠高,則進(jìn)入自動(dòng)匹配流程把該記錄和原有記錄進(jìn)行數(shù)據(jù)存活規(guī)則處理并合并記錄;假

如是分值不足夠高,則須要人工來確定該記錄是新記錄還是須要和原有記錄合并。

主數(shù)據(jù)管理監(jiān)控

■最佳的工作流功能(例如針對(duì)南方電網(wǎng)主數(shù)據(jù)定義和審批路由的可配置工作流)響

應(yīng)整個(gè)主數(shù)據(jù)管理生命周期事務(wù);oracleBPEL規(guī)范制定自動(dòng)化業(yè)務(wù)處理流程,支

持用戶自定義變更類型

■確保堅(jiān)如磐石的平安性和法規(guī)遵守證明的完整歷史和審計(jì)跟蹤

■納稅人數(shù)據(jù)認(rèn)證,支持機(jī)構(gòu)創(chuàng)建數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn),遵守這些標(biāo)準(zhǔn)并提升用戶對(duì)數(shù)據(jù)的

信念

商務(wù)智能基礎(chǔ)架構(gòu),支持剖析、法規(guī)遵守和業(yè)務(wù)績(jī)效指標(biāo)

■自動(dòng)化、人工流程,供應(yīng)良好的用戶界面UI,多種通知方式

■自動(dòng)化、人工的審核和批準(zhǔn),逐級(jí)審批

-易于多組織的協(xié)同工作

主數(shù)據(jù)發(fā)布和共享

■面對(duì)終端用戶和數(shù)據(jù)管理員的直觀GUI,管理主數(shù)據(jù)的整個(gè)生命周期一一從創(chuàng)建或?qū)?/p>

入主數(shù)據(jù)信息到清理、匹配、增加和發(fā)布。運(yùn)用預(yù)建的流程使南方電網(wǎng)更輕松地管

理主數(shù)據(jù)

■對(duì)全部集成模式一一實(shí)時(shí)(緊耦合和松耦合)、近實(shí)時(shí)(松耦合)和批量一一的嚴(yán)格

的多模型支持

-供應(yīng)作為業(yè)務(wù)服務(wù)和Web服務(wù)的常用功能

■一個(gè)內(nèi)部觸發(fā)的機(jī)制,創(chuàng)建變更信息并向全部相連系統(tǒng)部署

■為全部的管理軟件和分析系統(tǒng)供應(yīng)主數(shù)據(jù)記錄和所選屬性

■在面對(duì)服務(wù)的架構(gòu)(SOA)和/或消息傳遞總線上的運(yùn)營(yíng)管理軟件和數(shù)據(jù)倉(cāng)庫(kù)雙向交互

'通過Oracle應(yīng)用集成架構(gòu)(AIA)流程集成包(PIP)預(yù)建的集成

?與。racle商務(wù)智能企業(yè)版(OBIEE)預(yù)建的集成

為了實(shí)現(xiàn)主數(shù)據(jù)共享,首先全網(wǎng)應(yīng)當(dāng)各個(gè)分散的業(yè)務(wù)系統(tǒng)連接起來,實(shí)現(xiàn)各個(gè)業(yè)務(wù)系統(tǒng)與主數(shù)據(jù)

存儲(chǔ)的互聯(lián)互通,目前的南網(wǎng)主數(shù)據(jù)管理解決方案主要采納兩種方式來實(shí)現(xiàn):基于ETL工具的方

式和基于SOA體系架構(gòu)的方式。

1.基于ODI的方式

MDM

Applications

Metadata

Management

DataWarehouse

DataMarts

ChangeData

Capture

Business

Intelligence

基于ODI這樣的ETL工具設(shè)計(jì)的架構(gòu)更適合全網(wǎng)業(yè)務(wù)系統(tǒng)中的非實(shí)時(shí)數(shù)據(jù)量大的主數(shù)據(jù)共享發(fā)布。

如上圖所示,采納基于ODI的ETL工具具有連接各種異構(gòu)數(shù)據(jù)源和變更捕獲的實(shí)力,采納它來實(shí)

現(xiàn)MDM中異構(gòu)系統(tǒng)的數(shù)據(jù)觸發(fā)、整合和發(fā)布應(yīng)當(dāng)是順理成章的事情,當(dāng)某個(gè)主數(shù)據(jù)的源發(fā)生變

更時(shí),ETL的CDC(變更數(shù)據(jù)捕獲)功能就會(huì)捕獲到變更,進(jìn)而將變更的數(shù)據(jù)傳輸?shù)街鲾?shù)據(jù)管理系

統(tǒng)的臨時(shí)存儲(chǔ)區(qū),然后ETL工具依據(jù)定義的數(shù)據(jù)轉(zhuǎn)化規(guī)則對(duì)數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)化,形成主數(shù)據(jù),進(jìn)

而ETL調(diào)用審批監(jiān)管流程,一旦獲得審批,ETL即可將主數(shù)據(jù)同步到主數(shù)據(jù)存儲(chǔ)系統(tǒng),同時(shí)分發(fā)

給各個(gè)訂閱該主數(shù)據(jù)的業(yè)務(wù)系統(tǒng)。同時(shí)ODI可以支撐流程的設(shè)計(jì)、運(yùn)行、監(jiān)控,否則ETL工具必

需可以調(diào)用其它的工作流引擎,ODI可以實(shí)現(xiàn)與SOA的無縫集成,既可以將數(shù)據(jù)或者轉(zhuǎn)化封裝為

WebService服務(wù),也可以調(diào)用外部的WebService服務(wù)。

2.基于SOA架構(gòu)的方式:

在該方案更適合實(shí)時(shí)的數(shù)據(jù)量小的主數(shù)據(jù)共享發(fā)布,采納OSB(企業(yè)服務(wù)總線)技術(shù)構(gòu)建應(yīng)用集

成平臺(tái),采納webservice方式實(shí)現(xiàn)在多個(gè)系統(tǒng)間應(yīng)用集成和互聯(lián)互通。應(yīng)用集成平臺(tái)是數(shù)據(jù)采

集、數(shù)據(jù)交換及服務(wù)供應(yīng)實(shí)力的干脆承載。數(shù)據(jù)的收集和分發(fā)采納各種應(yīng)用和適配器實(shí)現(xiàn),各種

應(yīng)用適配器一般供應(yīng)變更數(shù)據(jù)的的輪詢或者推送功能。監(jiān)控管理可以采納SOA中的工作流引擎

來實(shí)現(xiàn),同時(shí)SOA中的流程監(jiān)控系統(tǒng)可以對(duì)整個(gè)主數(shù)據(jù)的收集、轉(zhuǎn)化、審批分發(fā)供應(yīng)端到端的

監(jiān)控。采納SOA技術(shù)設(shè)計(jì)的主數(shù)據(jù)管理架構(gòu)基于J2EE的開放架構(gòu),會(huì)特別敏捷,同時(shí)便于和其

它系統(tǒng)集成,系統(tǒng)的擴(kuò)展性比較好,其問題在于假如主數(shù)據(jù)同步的量特別大,效率會(huì)有肯定問題。

平安牢靠的平臺(tái)

-基于標(biāo)準(zhǔn)的開放平臺(tái)

■多語言和多國(guó)家支持

■閱歷證的平臺(tái),全球各行業(yè)(包括公共部門)數(shù)千客戶的選擇

■面對(duì)混合的重工作負(fù)載一一Oracle擁有巨大數(shù)目的客戶一一下關(guān)鍵數(shù)據(jù)訪問的高度

可用和可伸縮的平臺(tái)。

■平安特性包括全而且敏捷的認(rèn)證、全面的審計(jì)和監(jiān)控以及全部架構(gòu)級(jí)別的加密。

Oracle己經(jīng)獲得了17項(xiàng)獨(dú)立平安性評(píng)估的擔(dān)保,確立了Oracle在該領(lǐng)域的領(lǐng)導(dǎo)地位。

這些評(píng)估包括TCSEC、ITSEC、FIPS和各種通用標(biāo)準(zhǔn)評(píng)估。

2.1.2主數(shù)據(jù)方案設(shè)計(jì)

主數(shù)據(jù)管理的核心是數(shù)據(jù)整合、數(shù)據(jù)管控和數(shù)據(jù)服務(wù)。在橫跨這三個(gè)層次須要進(jìn)行數(shù)據(jù)

平安管理、質(zhì)量管理和元數(shù)據(jù)管理。下面分別進(jìn)行介紹:

數(shù)據(jù)整合:數(shù)據(jù)整合就是將離散于各個(gè)業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)進(jìn)行集中化,統(tǒng)一整合集成至

數(shù)據(jù)中心。數(shù)據(jù)整合將通過ETL工具實(shí)現(xiàn)數(shù)據(jù)的抽取、轉(zhuǎn)換和加載等功能。

數(shù)據(jù)管控:主要包含數(shù)據(jù)中心物理模型、邏輯模型的設(shè)計(jì),數(shù)據(jù)的維護(hù)管理以及存儲(chǔ)管

理等管控功能。

數(shù)據(jù)服務(wù)管控:數(shù)據(jù)服務(wù)管控主要是對(duì)采集至數(shù)據(jù)中心的數(shù)據(jù)進(jìn)行數(shù)據(jù)交換和管控,主

要包括數(shù)據(jù)交換服務(wù)設(shè)計(jì),數(shù)據(jù)總線交換共享,以及數(shù)據(jù)交換管理等功能。

元數(shù)據(jù)管理:元數(shù)據(jù)管理是整個(gè)數(shù)據(jù)共享中心中基礎(chǔ)信息的管理,包括ETL元數(shù)據(jù)、接

口元數(shù)據(jù)、模型元數(shù)據(jù)和數(shù)據(jù)服務(wù)元數(shù)據(jù)等的管理功能。

質(zhì)量管理:在數(shù)據(jù)管理的不同階段,數(shù)據(jù)管理對(duì)數(shù)據(jù)質(zhì)量管理的側(cè)重點(diǎn)也有所不同。數(shù)

據(jù)質(zhì)量管理的目標(biāo),逐步從單純地提高數(shù)據(jù)精確性,延長(zhǎng)至保障數(shù)據(jù)的完整性、唯一性、合

法性、一樣性、剛好性等屬性;從單純以技術(shù)角度考慮數(shù)據(jù)質(zhì)量問題,發(fā)展至從用戶視角衡

量數(shù)據(jù)質(zhì)量問題,提高用戶對(duì)數(shù)據(jù)的滿足度;建立數(shù)據(jù)質(zhì)量監(jiān)控機(jī)制,剛好發(fā)覺、報(bào)告、處

理數(shù)據(jù)共享中心中的數(shù)據(jù)質(zhì)量問題。數(shù)據(jù)質(zhì)量管理子系統(tǒng)是數(shù)據(jù)共享中心中數(shù)據(jù)質(zhì)量管理體

系的重要組成部分。

平安管理:主要包括數(shù)據(jù)存儲(chǔ)平安、數(shù)據(jù)管控平安和數(shù)據(jù)交換等平安管理。

主數(shù)據(jù)方案設(shè)計(jì)原則

主數(shù)據(jù)方案設(shè)計(jì),遵循以下一般原則:

?每類業(yè)務(wù)數(shù)據(jù)實(shí)體的屬性有且僅有一個(gè)全部者(Owner),零個(gè)或多個(gè)消費(fèi)者

(Consumer);

?對(duì)數(shù)據(jù)的維護(hù)必需通過全部者進(jìn)行,消費(fèi)者對(duì)數(shù)據(jù)只有只讀功能;假如消費(fèi)者須要

對(duì)數(shù)據(jù)進(jìn)行維護(hù),必需調(diào)用全部者數(shù)據(jù)維護(hù)服務(wù);

?數(shù)據(jù)有且僅有一個(gè)主數(shù)據(jù)源(MasterLocation),主數(shù)據(jù)源可以是數(shù)據(jù)全部者的應(yīng)用

數(shù)據(jù)庫(kù)(ADB)或者數(shù)據(jù)中心數(shù)據(jù)庫(kù)?;谛阅艿目紤],消費(fèi)者可以在ADB保存

數(shù)據(jù)的備份,由主數(shù)據(jù)源實(shí)時(shí)或定時(shí)發(fā)起數(shù)據(jù)同步;

主數(shù)據(jù)源供應(yīng)相應(yīng)的數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)服務(wù);

主數(shù)據(jù)集成方案設(shè)計(jì)

依據(jù)主數(shù)據(jù)源位置(Location),數(shù)據(jù)冗余方式(Redundant)和數(shù)據(jù)維護(hù)的歸屬(Owner),

一般的主數(shù)據(jù)集成方案分析如下表:

方案123456

主數(shù)據(jù)源數(shù)據(jù)中心數(shù)據(jù)中心數(shù)據(jù)中心數(shù)據(jù)中心ADBADB

Owner數(shù)據(jù)中心數(shù)據(jù)中心ADBADBADBADB

Consumer

是否有備

份YNYNYN

干脆讀同1調(diào)用數(shù)據(jù)調(diào)用數(shù)據(jù)干脆讀干脆讀

OwnerADB中心數(shù)據(jù)中心數(shù)據(jù)OwnerADBOwnerADB

中的數(shù)據(jù)訪問服務(wù)訪問服務(wù)

Owner讀備份

Step1>在在一個(gè)交Step1、調(diào)用數(shù)據(jù)Step1、寫寫Owner

一個(gè)交易易內(nèi)寫調(diào)用數(shù)據(jù)中心數(shù)據(jù)OwnerADB

內(nèi)寫OwnerOwnerADB中心數(shù)據(jù)維護(hù)服務(wù)ADB;

數(shù)ADB和數(shù)據(jù)和數(shù)據(jù)中維護(hù)服Step2^通

據(jù)中心;心務(wù);過數(shù)據(jù)中

維Step2、通Step2、心或主數(shù)

護(hù)過數(shù)據(jù)中通過數(shù)據(jù)據(jù)源啟動(dòng)

方心啟動(dòng)對(duì)中心啟動(dòng)對(duì)

式Consumer對(duì)Consumer

ADB的數(shù)據(jù)ConsumerADB的數(shù)

同步ADB的數(shù)據(jù)同步

Owner寫據(jù)同步

干脆讀調(diào)用數(shù)據(jù)干脆讀調(diào)用數(shù)據(jù)干脆讀通過數(shù)據(jù)

Consumer中心數(shù)據(jù)Consumer中心數(shù)據(jù)Consumer中心的統(tǒng)

ConsumerADB中的數(shù)訪問服務(wù)ADB中的訪問服務(wù)ADB中的一視圖獲

讀據(jù)備份數(shù)據(jù)備份數(shù)據(jù)備份得數(shù)據(jù);

Optionl:Optionl:同1同2同1同2

在一個(gè)交Consumer

易內(nèi),調(diào)用Owner

Consumer的數(shù)據(jù)維

調(diào)用Owner護(hù)服務(wù);

的數(shù)據(jù)維0ption2:

護(hù)服務(wù),同集成Owner

時(shí)寫的數(shù)據(jù)維

Consumer護(hù)界面

ADB;

0ption2:

集成Owner

的數(shù)據(jù)維

護(hù)界面,由

數(shù)據(jù)中心

啟動(dòng)同步

ConsumerConsumer

寫ADB

下面就各個(gè)方案進(jìn)行分析,對(duì)于方案1和方案2:

集成方案2集成方案1

特點(diǎn)單點(diǎn)與循多點(diǎn)與儲(chǔ).蘭虻據(jù)牛心負(fù)責(zé)望囑的堤嚴(yán)1

Owner數(shù)援中心數(shù)超中心

Master蚊狗*心茲哥中心

各W丐系正和豉握中心紀(jì)矢存數(shù)電.但數(shù)據(jù)牛心作為這

豉再生牛到蛉援*心平金寺.其它系交不

簡(jiǎn)要搽至蓑嘈的master系筑.對(duì)主張贈(zèng)發(fā)亳更新必須亮運(yùn)忑張

述里公考,其它茶費(fèi)對(duì)豉售的訪W金主/氧

蚊再中心平臺(tái)上第士心上石.再皮坡挎*心發(fā)超習(xí)步充是同步體改結(jié)果

到垮關(guān)系史.各個(gè)專業(yè)系罡不輪對(duì)數(shù)相發(fā)起更擊.

優(yōu)點(diǎn)透過強(qiáng)勢(shì)歧求手轂達(dá)到對(duì)蛇樗m控的不恪對(duì)數(shù)據(jù)的更新龕*管控,能夠我好的控爸敢再的里至

統(tǒng)一和更量控全

缺點(diǎn)我禹*心平臺(tái)玉力跟大.風(fēng)受候哥.其它源系無仿有一定的改3室.卷要再蔽其它系交對(duì)這至數(shù)

系充數(shù)運(yùn)里喂大售的修改:豉再*?>¥£需營(yíng)建對(duì)這至豉需的3理前能

這兩種方案主要適用于尚無任何系統(tǒng)時(shí),進(jìn)行一體化系統(tǒng)建設(shè),如應(yīng)用于已有系統(tǒng)則改

造量較大。同時(shí),這兩種方案均以數(shù)據(jù)中心做為主數(shù)據(jù)的維護(hù)中心。

對(duì)于方案3、4和方案5、6:

'案3、4,案5、6

特點(diǎn)多點(diǎn)考完.=ADB會(huì)堂數(shù)雪的維數(shù)再豐心僅為數(shù)多點(diǎn)存儲(chǔ),*ADB費(fèi)夫或得的1交JADB佐為我W

得的主專憧系貌,支點(diǎn)對(duì)其三系貌的殺囑習(xí)步的主考愜系疣,發(fā)起對(duì)其三系吏的坡雋同步

OwnerADBADB

Master數(shù)福中心ADB

數(shù)零牛心作為數(shù)零的系靠.對(duì)主量/關(guān)后更赤三三三三三-Di三二三門髀:丁系三.-二三三三三三

簡(jiǎn)要排master

必須先在ADB對(duì)豉電牛心遂行更?再生數(shù)理*心發(fā)宏改完在對(duì)H的ADB系筑*三行.里主該ADB發(fā)金

述直可步充程習(xí)步貨改經(jīng)果到杓美系統(tǒng)可步充程可步氧數(shù)提中心和其它相關(guān)空號(hào).

對(duì)蓑雪的更冢矣*???勒笠取好的控芝數(shù)焉的生至

優(yōu)點(diǎn)系茨改造或j、.道合已有系空

逢告營(yíng)建系正

數(shù)電奧量之主管正巨分?jǐn)?shù)控基

統(tǒng)點(diǎn)對(duì)李婆至三二星餐《三形最西AD眨間的咫決生成方

之間案或呈可狀.較為復(fù)雜

式丸果鼓與之方案.改造H作呈皎大ADB

方案5、6較適合已有大量系統(tǒng)的狀況,帶來的系統(tǒng)改造量最小。方案3、4適合在主數(shù)

據(jù)維護(hù)職能不變的狀況下將主數(shù)據(jù)在數(shù)據(jù)中心中進(jìn)行集中,并供應(yīng)應(yīng)新建應(yīng)用。

主數(shù)據(jù)實(shí)施方案設(shè)計(jì)

1、主數(shù)據(jù)創(chuàng)建抽取設(shè)計(jì)

主數(shù)據(jù)創(chuàng)建抽取過程如下:

其一、先對(duì)現(xiàn)有業(yè)務(wù)系統(tǒng)進(jìn)行解耦,解決目前各業(yè)務(wù)系統(tǒng)間交叉訪問,耦合度過高的問

題。通過建設(shè)共享數(shù)據(jù)庫(kù),并將目前南方電網(wǎng)各系統(tǒng)交叉訪問的共享數(shù)據(jù)通過數(shù)據(jù)復(fù)制機(jī)制

同步或異步復(fù)制到共享數(shù)據(jù)庫(kù),然后再更改各業(yè)務(wù)系統(tǒng)現(xiàn)有的共享視圖或物化視圖定義,將

共享訪問數(shù)據(jù)源統(tǒng)一指向共享數(shù)據(jù)庫(kù)。通過共享數(shù)據(jù)庫(kù)的建設(shè)及數(shù)據(jù)復(fù)制機(jī)制的建立,可以

將目前網(wǎng)狀的交叉訪問接口平滑過渡到基于共享數(shù)據(jù)庫(kù)的星狀接口,有效解決各系統(tǒng)依靠度

過高的問題,同時(shí)也為下一步各系統(tǒng)的升級(jí)改造打下基礎(chǔ)。

這里的數(shù)據(jù)復(fù)制產(chǎn)品可以考慮Oracle的GoldenGate實(shí)時(shí)復(fù)制產(chǎn)品,先將數(shù)據(jù)復(fù)制到共

享數(shù)據(jù)庫(kù),完成“系統(tǒng)解耦”工作。

其二、是進(jìn)行數(shù)據(jù)共享協(xié)同平臺(tái)的建設(shè)。在進(jìn)行系統(tǒng)解耦時(shí),我們會(huì)構(gòu)建共享數(shù)據(jù)庫(kù),

但該共享庫(kù)僅僅是將當(dāng)前分散到各業(yè)務(wù)系統(tǒng)的共享數(shù)據(jù)進(jìn)行了集中,還缺乏統(tǒng)一的規(guī)劃,因

此還須要對(duì)共享庫(kù)進(jìn)行重新規(guī)劃設(shè)計(jì),同時(shí)也須要對(duì)共享協(xié)同平臺(tái)和外部交換庫(kù)進(jìn)行規(guī)劃設(shè)

計(jì)??傮w規(guī)劃設(shè)計(jì)完成后,即可起先構(gòu)建數(shù)據(jù)共享中心和業(yè)務(wù)協(xié)同平臺(tái),其中數(shù)據(jù)共享中心

構(gòu)建完成后,就可以逐步將各系統(tǒng)間原來基于視圖和物化視圖的數(shù)據(jù)共享訪問調(diào)整為基于數(shù)

據(jù)共享中心的訪問模式。

共享庫(kù)規(guī)劃生成主數(shù)據(jù)管理,可以考慮OracleDataIntegrator產(chǎn)品,實(shí)現(xiàn)數(shù)據(jù)ETL的工

作。

我,

的.?

?奇?■?靠一平?■中?r伶■■或?作??一11實(shí)?■

.

?UK配浦

?魚??會(huì)???管?

*?I

?區(qū)■Mr-,??4irw

V

?殳林?三力■■■

?艮19人/?盅重。

ATM?*再?法亶,???

2、主數(shù)據(jù)共享分發(fā)流程設(shè)計(jì)

主數(shù)據(jù)創(chuàng)建生成后,就是對(duì)主數(shù)據(jù)進(jìn)行有效管理和利用。同其他系統(tǒng)進(jìn)行可以進(jìn)行實(shí)時(shí)或半

實(shí)時(shí)的同步從多個(gè)源系統(tǒng)建立統(tǒng)一、完整的記錄,再將主數(shù)據(jù)信息同步到其他系統(tǒng)中。通過

內(nèi)嵌的集成服務(wù)同其他系統(tǒng)進(jìn)行集成,例如豐富的公共API和業(yè)務(wù)事務(wù)。通過不斷的數(shù)據(jù)清

理和轉(zhuǎn)換規(guī)則來確保同步數(shù)據(jù)的質(zhì)量。

主數(shù)據(jù)管理功能設(shè)計(jì)

主數(shù)據(jù)的管理功能基本與內(nèi)部交換數(shù)據(jù)、外部交換數(shù)據(jù)相像。

2.1.3交換數(shù)據(jù)方案設(shè)計(jì)

內(nèi)部數(shù)據(jù)、外部數(shù)據(jù)在數(shù)據(jù)交換上的業(yè)務(wù)功能和邏輯,以及技術(shù)實(shí)現(xiàn)都是相像的,可以

采納相同的數(shù)據(jù)交換方案框架。數(shù)據(jù)交換方案框架涵蓋了數(shù)據(jù)交換,質(zhì)量清洗,數(shù)據(jù)管控和

數(shù)據(jù)運(yùn)用,解決了如何在核心數(shù)據(jù)上實(shí)現(xiàn)統(tǒng)一的存儲(chǔ),維護(hù)和運(yùn)用的問題。

>數(shù)據(jù)集成:數(shù)據(jù)集成就是將離散于各個(gè)業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)進(jìn)行集中化,統(tǒng)一整合集

成至數(shù)據(jù)共享中心。數(shù)據(jù)集成須要對(duì)南方電網(wǎng)內(nèi)部系統(tǒng)以及外部系統(tǒng)進(jìn)行數(shù)據(jù)集成。

對(duì)于不同的數(shù)據(jù)集成場(chǎng)景,有不同的數(shù)據(jù)集成實(shí)現(xiàn)模式,比如有基于OracleODI

的“拉”數(shù)據(jù)集成模式和基于ESB總線的“推”數(shù)據(jù)集成模式等。

>質(zhì)量管理:在數(shù)據(jù)管理的不同階段,數(shù)據(jù)管理對(duì)數(shù)據(jù)質(zhì)量管理的側(cè)重點(diǎn)也有所不同。

數(shù)據(jù)質(zhì)量管理的目標(biāo),逐步從單純地提高數(shù)據(jù)精確性,延長(zhǎng)至保障數(shù)據(jù)的完整性、

唯一性、合法性、一樣性、剛好性等屬性;從單純以技術(shù)角度考慮數(shù)據(jù)質(zhì)量問題,

發(fā)展至從用戶視角衡量數(shù)據(jù)質(zhì)量問題,提高用戶對(duì)數(shù)據(jù)的滿足度;建立數(shù)據(jù)質(zhì)量監(jiān)

控機(jī)制,剛好發(fā)覺、報(bào)告、處理數(shù)據(jù)共享中心中的數(shù)據(jù)質(zhì)量問題。數(shù)據(jù)質(zhì)量管理子

系統(tǒng)是數(shù)據(jù)共享中心中數(shù)據(jù)質(zhì)量管理體系的重要組成部分。

數(shù)據(jù)標(biāo)準(zhǔn)化孔配杳重引華

?Eesd&?Und?f<WeMOulee?Runexhuutlrv*

?MorgoitemrvconHto

?CUBwfysMemMMerand

pravantdicAcMsn

proOxtdaurepotttory

?2必industry&cofrpanysttte

DataQualityToots

數(shù)據(jù)自動(dòng)校驗(yàn).格式化人工工作流數(shù)據(jù)潔理

?NomMAM08ta?and?Slep-by*?tepnewMm

?Removeorwsnled

(McnpOongenoraoon2ndon?ndapproval

rvcorcHtoraduca

'?Afipiyuwr-doftrwdvwldMcnprocesses

datavoMno

■ruinataldataentrypants?Productcfwtgecontrol

圖:數(shù)據(jù)質(zhì)量管理

>數(shù)據(jù)管控:數(shù)據(jù)管控不是純粹的技術(shù)問題,而是由技術(shù)、人、信息和流程4個(gè)方面

共同影響的綜合管理問題。數(shù)據(jù)管控的演進(jìn)思路劃分為4個(gè)步驟:提出管理需求、

制定管理流程框架、細(xì)化具體管理流程、與組織機(jī)構(gòu)具體角色進(jìn)行對(duì)應(yīng)。

>數(shù)據(jù)運(yùn)用:存在于數(shù)據(jù)共享中心中的數(shù)據(jù)主要有兩大方面的運(yùn)用,一是封裝成數(shù)據(jù)

服務(wù),并集成于業(yè)務(wù)協(xié)同平臺(tái)(服務(wù)總線平臺(tái))進(jìn)行數(shù)據(jù)服務(wù)共享,南方電網(wǎng)信息

內(nèi)部系統(tǒng)和其他外部系統(tǒng)統(tǒng)一通過業(yè)務(wù)協(xié)同平臺(tái)獲得所需業(yè)務(wù)數(shù)據(jù);二是基于數(shù)據(jù)

共享中心的集成化數(shù)據(jù)進(jìn)行綜合查詢分析的應(yīng)用,查詢分析統(tǒng)計(jì)功能不再基于核心

業(yè)務(wù)數(shù)據(jù)庫(kù),避開造成對(duì)核心業(yè)務(wù)系統(tǒng)的性能影響。

模式一看于鹿務(wù)管理平臺(tái)配?生成我據(jù)服務(wù)

S3

圖:數(shù)據(jù)服務(wù)共享

2.1.4數(shù)據(jù)交換系統(tǒng)功能設(shè)計(jì)

基于內(nèi)部數(shù)據(jù)交換方案框架,并結(jié)合南方電網(wǎng)數(shù)據(jù)共享協(xié)同平臺(tái)總體功能需求分析的基

礎(chǔ)上,梳理出南方電網(wǎng)共享中心的總體功能組織結(jié)構(gòu)如下圖所示:

以下將分別對(duì)數(shù)據(jù)共享中心數(shù)據(jù)集成域、數(shù)據(jù)管控域、質(zhì)量檢測(cè)域和數(shù)據(jù)運(yùn)用域的功能

規(guī)劃進(jìn)行具體介紹:

數(shù)據(jù)集成

數(shù)據(jù)集成引擎(DataIntegrationEngine)面對(duì)應(yīng)用系統(tǒng),在各個(gè)應(yīng)用系統(tǒng)的數(shù)據(jù)源中提

取數(shù)據(jù),是一個(gè)跨平臺(tái)的用于整合異構(gòu)系統(tǒng)數(shù)據(jù)的ETL工具,在數(shù)據(jù)共享中心中,數(shù)據(jù)集成

引擎實(shí)現(xiàn)了從各業(yè)務(wù)應(yīng)用系統(tǒng)的數(shù)據(jù)源中提取用于整合共享的數(shù)據(jù),經(jīng)過質(zhì)量檢查后,按新

的數(shù)據(jù)模型對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換和清洗,正確無誤后加載到目標(biāo)數(shù)據(jù)共享中心中。

數(shù)據(jù)集成引擎(DataIntegrationEngine)

目標(biāo)數(shù)據(jù)加載

(TargetDataLoading)元

數(shù)據(jù)轉(zhuǎn)換清洗(DataTransforming&Cleaning)數(shù)

據(jù)

數(shù)據(jù)質(zhì)量檢查(DataQualityCheck)

批量數(shù)據(jù)提取變化數(shù)據(jù)捕獲型

(BulkDataExtract)(ChangeDataCapture)

dblinkjdbctriggerslogminerjmswebservice

下面對(duì)數(shù)據(jù)集成引擎中的各個(gè)部分的功能進(jìn)行具體介紹。

元數(shù)據(jù)模型

為了可以自動(dòng)完數(shù)據(jù)提取、質(zhì)量檢查、數(shù)據(jù)轉(zhuǎn)換清洗和數(shù)據(jù)加載這個(gè)數(shù)據(jù)整合過程,數(shù)

據(jù)集成引擎須要知道源數(shù)據(jù)、目標(biāo)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu),源數(shù)據(jù)到目標(biāo)數(shù)據(jù)的轉(zhuǎn)換及清洗規(guī)則,

還有源數(shù)據(jù)的質(zhì)量檢查規(guī)則等數(shù)據(jù),這些用于描述數(shù)據(jù)本身的數(shù)據(jù)被稱為數(shù)據(jù)集成的元數(shù)據(jù),

而元數(shù)據(jù)模型是元數(shù)據(jù)的一個(gè)實(shí)例集合,描述了具體的數(shù)據(jù)結(jié)構(gòu)和規(guī)則,在數(shù)據(jù)進(jìn)行集成前,

必需先定義好元數(shù)據(jù)模型。

具體的元數(shù)據(jù)包括:

1)數(shù)據(jù)源定義

2)目標(biāo)庫(kù)定義

3)數(shù)據(jù)物理模型

4)數(shù)據(jù)檢查規(guī)則

5)數(shù)據(jù)轉(zhuǎn)換規(guī)則

6)數(shù)據(jù)清洗規(guī)則

批量數(shù)據(jù)提取

批量數(shù)據(jù)提取(BulkDataExtract)從數(shù)據(jù)源定時(shí)批量提取數(shù)據(jù)進(jìn)行整合,是數(shù)據(jù)集成引

擎的前端功能,與元數(shù)據(jù)模型中定義的各個(gè)數(shù)據(jù)源進(jìn)行連接,獲得須要整合的數(shù)據(jù),然后存

儲(chǔ)到中間數(shù)據(jù)庫(kù)(StagingDatabase)進(jìn)行后續(xù)的質(zhì)量檢查、清洗和轉(zhuǎn)換處理。

批量數(shù)據(jù)提取因?yàn)樘崛〉臄?shù)據(jù)量較多,對(duì)于性能的影響也較大,一般用于非實(shí)時(shí)的數(shù)據(jù)

整合,適用于時(shí)效性要求不高并且不希望過多影響源系統(tǒng)數(shù)據(jù)處理性能的狀況。

對(duì)于關(guān)系型數(shù)據(jù)庫(kù)的批量數(shù)據(jù)提取可以運(yùn)用兩種接口方式來進(jìn)實(shí)現(xiàn):

1)ORACLEDBLINK:

這種方式適用于目標(biāo)數(shù)據(jù)庫(kù)和數(shù)據(jù)源數(shù)據(jù)庫(kù)都是Oracle的狀況,干脆在目標(biāo)數(shù)據(jù)庫(kù)建

立源數(shù)據(jù)庫(kù)的DBLINK,通過DBLINK就可以像在一個(gè)數(shù)據(jù)庫(kù)一樣通過SQL干脆提取數(shù)據(jù)源

的數(shù)據(jù)。

2)JDBCDataSource:

這種方式適合源數(shù)據(jù)庫(kù)是非Oracle并且支持JDBC協(xié)議的數(shù)據(jù)庫(kù),目前大部分主流數(shù)據(jù)

庫(kù)都支持JDBC協(xié)議,在JDBC協(xié)議上建立DataSource,通過JDBC在源數(shù)據(jù)庫(kù)上執(zhí)行SQL進(jìn)

行數(shù)據(jù)提取。

運(yùn)用批量數(shù)據(jù)提取的方式來提取數(shù)據(jù)可以用于首次初始化加載全量數(shù)據(jù),也可在首次加

載數(shù)據(jù)后通過兩種方式實(shí)現(xiàn)非實(shí)時(shí)的增量更新,這兩種方式分別是:

1)基于時(shí)間戳的增量更新

這種方式提取數(shù)據(jù)速度較快,源數(shù)據(jù)庫(kù)通過物理表或者試圖的方式暴露數(shù)據(jù),但要求數(shù)

據(jù)源的表或者視圖必需有時(shí)間戳的字段并且不能對(duì)數(shù)據(jù)記錄進(jìn)行物理刪除。

2)基于主鍵比對(duì)的增量更新

這種方式須要每次都提取全部數(shù)據(jù),然后在目標(biāo)數(shù)據(jù)庫(kù)上按主鍵標(biāo)識(shí)對(duì)全部數(shù)據(jù)進(jìn)行全

量比對(duì)來識(shí)別增量更新的數(shù)據(jù)記錄,效率低,數(shù)據(jù)源的壓力較大,只適合小數(shù)據(jù)量的提取,

基于主鍵比對(duì)的更新對(duì)源數(shù)據(jù)的表或者視圖無特殊要求.

變更數(shù)據(jù)捕獲

和批量數(shù)據(jù)提取一樣,變更數(shù)據(jù)捕獲(ChangeDataCapture)同樣是數(shù)據(jù)集成引擎的前

端功能,和數(shù)據(jù)源進(jìn)行隊(duì)列:但顧名思義,變更數(shù)據(jù)捕獲只供應(yīng)增量數(shù)據(jù)提取的功能,通過

對(duì)源數(shù)據(jù)庫(kù)上變更數(shù)據(jù)的捕獲,數(shù)據(jù)集成引擎可以實(shí)現(xiàn)實(shí)時(shí)或準(zhǔn)實(shí)時(shí)數(shù)據(jù)同步,此方式適用

于整合有較高時(shí)效性要求的數(shù)據(jù)。

變更數(shù)據(jù)捕獲供應(yīng)多種技術(shù)實(shí)現(xiàn)方式,包括數(shù)據(jù)庫(kù)觸發(fā)器、數(shù)據(jù)庫(kù)日志采集器、基于消

息隊(duì)列的變更數(shù)據(jù)訂閱和基于WebService的數(shù)據(jù)變更通知,下面對(duì)兒種方式進(jìn)行描述:

集成數(shù)據(jù)引擎主動(dòng)捕獲數(shù)據(jù)變更的方式:

1)數(shù)據(jù)庫(kù)觸發(fā)器(DatabaseTriggers):

通過在源數(shù)據(jù)表上創(chuàng)建觸發(fā)器來獲得變更的數(shù)據(jù),此方式實(shí)時(shí)性高,但須要對(duì)源數(shù)據(jù)庫(kù)

進(jìn)行改動(dòng),對(duì)高負(fù)載應(yīng)用的性能有肯定的影響,此方式支持主流的關(guān)系數(shù)據(jù)庫(kù)。

2)數(shù)據(jù)庫(kù)日志采集器(LogMiner):

通過對(duì)源數(shù)據(jù)庫(kù)日志文件進(jìn)行分析,實(shí)時(shí)捕獲數(shù)據(jù)庫(kù)數(shù)據(jù)的變更狀況,此方式速度較快,

對(duì)源系統(tǒng)不會(huì)造成太大的壓力,但須要數(shù)據(jù)庫(kù)本身的功能進(jìn)行實(shí)現(xiàn),目前只支持Oracle和

DB2兩種數(shù)據(jù)庫(kù)類型。

上面兩種方式是數(shù)據(jù)集成引擎主動(dòng)捕獲變更數(shù)據(jù),而下面的兩種方式則是數(shù)據(jù)集成引擎

被動(dòng)接收源系統(tǒng)的通知:

1)變更數(shù)據(jù)訂閱(ChangeDataSubscriber):

通過消息隊(duì)列技術(shù),變更數(shù)據(jù)捕獲功能在數(shù)據(jù)源應(yīng)用供應(yīng)的基于JMS標(biāo)準(zhǔn)的消息

隊(duì)列上訂閱數(shù)據(jù)的變更消息,通過監(jiān)聽數(shù)據(jù)變更隊(duì)列,實(shí)時(shí)獲得數(shù)據(jù)源應(yīng)用放到隊(duì)列中

的數(shù)據(jù)變更消息,此方式的提取速度快,并且JMS消息隊(duì)列供應(yīng)了消息傳輸?shù)母呃慰?/p>

性,但實(shí)時(shí)性取決于數(shù)據(jù)源應(yīng)用,并且數(shù)據(jù)源應(yīng)用須要開發(fā)相應(yīng)的功能來實(shí)現(xiàn)。

2)數(shù)據(jù)變更通知(DataChangeNotification):

和變更數(shù)據(jù)訂閱相同的原理,數(shù)據(jù)變更通知技術(shù)是通過暴露數(shù)據(jù)變更通知的Web

Service接口給數(shù)據(jù)源應(yīng)用,當(dāng)數(shù)據(jù)的變更被數(shù)據(jù)源應(yīng)用捕獲后,數(shù)據(jù)源應(yīng)用調(diào)用通知接

口把變更的數(shù)據(jù)傳遞給數(shù)據(jù)變更捕獲功能,此方式提取速度快,并且可通過ESB統(tǒng)一

暴露服務(wù)接口,消息傳輸牢靠性也可以通過ESB的獲得支持(須要ESB的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論