版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 Informatica技術(shù)解決方案IInformaticaInformatica技術(shù)解決方案技術(shù)解決方案 提交人:閆東 聯(lián)系電話:提交日期:2022-01-22 版本號(hào):1.0 Informatica技術(shù)解決方案II目目 錄錄序言序言. 11.1INFORMATICA公司介紹. 11.2INFORMATICA公司針對(duì)各行業(yè)的解決方案及特點(diǎn).32設(shè)計(jì)理念設(shè)計(jì)理念. 92.1設(shè)計(jì)理念的先進(jìn)性. 92.2設(shè)計(jì)理念的符合性. 123基本功能基本功能. 143.1字段級(jí)的操作,主要包括:字段映射,映射的自動(dòng)匹配,字段的拆分,多字段的混合運(yùn)算,自動(dòng)完成時(shí)間類型的轉(zhuǎn)換. 143
2、.2記錄級(jí)的操作,主要包括:去重復(fù)記錄,記錄間合并或計(jì)算,記錄拆分等.153.3表級(jí)的操作,主要包括:代理鍵的生成,行列變換,排序,統(tǒng)計(jì),制造樣品數(shù)據(jù).163.4數(shù)據(jù)庫(kù)級(jí)的操作,主要包括:對(duì)各種碼表的支持包括GBK(必需)、UNICODE(必需)、ASCII(必需). 174技術(shù)特點(diǎn)技術(shù)特點(diǎn). 214.1跨異構(gòu)數(shù)據(jù)庫(kù)的關(guān)聯(lián)、支持關(guān)聯(lián)條件的復(fù)雜程度、自定義函數(shù)的實(shí)現(xiàn)、過(guò)濾條件的復(fù)雜程度.214.2支持的數(shù)據(jù)類型,包括BINARAY、DATE/TIME、DECIMAL、DOUBLE、INTEGER、STRING、TEXT、REAL、SMALL INTEGER等.214.3抽取斷點(diǎn),支持參數(shù)抽取的靈
3、活程度,如何抽取遠(yuǎn)程數(shù)據(jù),抽取數(shù)據(jù)的事務(wù)處理支持,抽取的字段是否可以動(dòng)態(tài)修改,對(duì)抽取的環(huán)境變量配置情況,環(huán)境變量是否可以動(dòng)態(tài)修改 .234.4是否支持臟讀,數(shù)據(jù)的提交方式,支持各種數(shù)據(jù)庫(kù)的批量裝載功能包括ORACLE(必需)、INFORMIX、DB2、SQL SERVER,針對(duì)不同數(shù)據(jù)庫(kù)是否具有批量加載能力包括ORACLE(必需),INFORMIX,DB2,SYBASE,TERADATA. 274.5在轉(zhuǎn)換過(guò)程中是否支持?jǐn)?shù)據(jù)比較的功能,在設(shè)計(jì)調(diào)試時(shí)能否對(duì)每個(gè)轉(zhuǎn)換環(huán)節(jié)進(jìn)行數(shù)據(jù)預(yù)覽,在設(shè)計(jì)調(diào)試時(shí)能否對(duì)每個(gè)轉(zhuǎn)換環(huán)節(jié)進(jìn)行性能監(jiān)控,在轉(zhuǎn)換過(guò)程中是否支持按行按列的分組聚合,能否提供直觀的視圖、靈活的配置以
4、及能否自定義功能,是否提供豐富的轉(zhuǎn)換函數(shù),是否支持諸如VALIDATE、 TRANSLATE、 HIERARCHY FLATTERN,MAP,MERGE 等轉(zhuǎn)換功能,ETL過(guò)程中數(shù)據(jù)轉(zhuǎn)換的可追溯能力.294.6不同類型運(yùn)算所耗的系統(tǒng)資源狀況,包括常見(jiàn)的JOIN、LOOKUP、MAPPING、AGGREAGATION、SORT、PIVOT、FILTER等 .404.7是否內(nèi)置提供數(shù)據(jù)預(yù)覽和數(shù)據(jù)質(zhì)量評(píng)估的功能 .414.8是否內(nèi)置提供具有強(qiáng)大的元數(shù)據(jù)管理功能 .454.9對(duì)于實(shí)時(shí)ETL及按需ETL的支持 . 515整體架構(gòu)整體架構(gòu). 535.1對(duì)平臺(tái)的支持,支持主流的操作系統(tǒng)平臺(tái)包括SUN SOL
5、ARIS,HP-UX(必需), IBM AIX(必需), LINUX, WINDOWS(必需)等。. 53 Informatica技術(shù)解決方案III5.2對(duì)數(shù)據(jù)源的支持,支持常見(jiàn)的數(shù)據(jù)源,包括ORACLE(必需),DB2(必需),INFORMIX(必需),SYBASE,SQL SERVER,TERADATA,SAS,TEXT(必需),EXCEL,SAP R/3,PEOPLESPFT,SIEBLE,IMS,VSAM,QSAM ON 390,用戶自定義文件,F(xiàn)TP(必需),XML(必需),MESSAGE QUEUE,EMAIL,WEBLOG,OLEDB,其它.545.3支持?jǐn)?shù)據(jù)庫(kù)的種類、連接方式、
6、配置方式及是否隨產(chǎn)品打包,包括ORACLE(必需),DB2(必需),INFORMIX(必需),SYBASE,SQL SERVER.565.4產(chǎn)品自身并行處理能力,對(duì)并行數(shù)據(jù)庫(kù)的支持情況如ORACLE RAC/OPS,系統(tǒng)的線性可擴(kuò)展性.565.5是否支持遠(yuǎn)端的數(shù)據(jù)抽取和加載功能. 595.6對(duì)錯(cuò)誤恢復(fù)邏輯的支持,對(duì)異常情況的處理是否得當(dāng),對(duì)于出現(xiàn)差錯(cuò)的流程是否支持異常控制、錯(cuò)誤告警以及錯(cuò)誤流程恢復(fù)的加載. 605.7對(duì)中間存儲(chǔ)的支持. 655.8產(chǎn)品可編程的靈活性如何,模塊化的設(shè)計(jì)能力 .655.9能否根據(jù)日志監(jiān)測(cè)源數(shù)據(jù)的變化,是否支持增量抽取,增量抽取的處理方式,增量加載的處理方式,是否提供
7、數(shù)據(jù)更新的時(shí)間點(diǎn)或周期,以便可以靈活處理.675.10對(duì)元數(shù)據(jù)的管理,主要包括:元數(shù)據(jù)存儲(chǔ)的提取方式、元數(shù)據(jù)存儲(chǔ)的開(kāi)放性、元數(shù)據(jù)存儲(chǔ)的可移植性、是否提供多種方式訪問(wèn)元數(shù)據(jù)、元數(shù)據(jù)的版本控制程度、是否支持開(kāi)放的元數(shù)據(jù)標(biāo)準(zhǔn)如CWM、是否支持XML進(jìn)行元數(shù)據(jù)交換、是否支持分布式的元數(shù)據(jù)訪問(wèn)和管理、是否生成元數(shù)據(jù)報(bào)表、是否支持ETL過(guò)程的沖突分析、是否支持基于元數(shù)據(jù)的查詢功能、是否支持ETL過(guò)程的流程分析等。.685.11可以實(shí)現(xiàn)對(duì)所有主流關(guān)系型數(shù)據(jù)庫(kù)的快速訪問(wèn)和,對(duì)本地?cái)?shù)據(jù)訪問(wèn)模式的支持(這里本地指NATIVE,如OCI等);通過(guò)利用本地?cái)?shù)據(jù)庫(kù)API高效實(shí)現(xiàn)ETL功能.755.12對(duì)基本處理(如SQ
8、L)的支持. 765.13提供友好界面. 765.14具有使用內(nèi)部函數(shù)或者用戶定義函數(shù)的強(qiáng)大轉(zhuǎn)換功能.805.15是否提供強(qiáng)大的腳本和用戶自定義函數(shù)開(kāi)發(fā)和轉(zhuǎn)化的功能.845.16是否提供數(shù)據(jù)校驗(yàn)的功能,如空值處理、流程異常處理、異常值的處理等手段.896接口與交換接口與交換. 906.1支持通用接口,如ODBC、數(shù)據(jù)庫(kù)本地接口等.906.2是否支持各種主流的消息中間件,可以通過(guò)消息中間件進(jìn)行數(shù)據(jù)抽取和加載,例如MQ SERIES,JMS等926.3是否支持WEB SERVICES接口. 926.4在調(diào)度時(shí)除了執(zhí)行ETL規(guī)則是否可以執(zhí)行其它任務(wù)如系統(tǒng)的可執(zhí)行程序、數(shù)據(jù)庫(kù)的存儲(chǔ)過(guò)程、動(dòng)態(tài)鏈接庫(kù)中的
9、程序、FTP命令、EMAIL任務(wù). 936.5是否調(diào)用各種外部應(yīng)用,包括存儲(chǔ)過(guò)程、各種流行語(yǔ)言開(kāi)發(fā)的應(yīng)用程序等.936.6是否支持客戶化定制的轉(zhuǎn)換過(guò)程,支持的編程語(yǔ)言種類例如C、C+、VC+、JAVA、PERL等.946.7與OLAP數(shù)據(jù)庫(kù),如HYPERION ESSBASE、ORACLE EXPRESS OLAP等的集成、與前端工具集如COGNOS、BUSINESS OBJECT、BRIO的集成 . 996.8是否有開(kāi)放的API可將產(chǎn)品集成到統(tǒng)一界面.996.9是否支持與統(tǒng)計(jì)分析工具如BUSINESSOBJECTS,SAS的集成等.996.10原廠商專用接口對(duì)不同數(shù)據(jù)源的支持 .1007項(xiàng)目
10、重點(diǎn)問(wèn)答項(xiàng)目重點(diǎn)問(wèn)答. 1017.1工具是否滿足無(wú)編碼開(kāi)發(fā). 101 Informatica技術(shù)解決方案IV7.2安裝調(diào)試時(shí),對(duì)系統(tǒng)環(huán)境是否有額外安裝要求 .1027.3在不改變系統(tǒng)內(nèi)核參數(shù)據(jù)前提下,能否順利完成產(chǎn)品的安裝及調(diào)試? 如需改變系統(tǒng)內(nèi)核參數(shù),請(qǐng)說(shuō)明。 . 1027.4REPOSITORY的移植性:在不改變?cè)O(shè)計(jì)和應(yīng)用的前提下,能否順利完成跨平臺(tái)、跨異構(gòu)數(shù)據(jù)庫(kù)和跨產(chǎn)品版本的移植。 如需更改設(shè)計(jì)等工作,請(qǐng)加以說(shuō)明。.1027.5REPOSITORY的開(kāi)放性?是否可建立在主流RDBMS基礎(chǔ)上,例如:ORACLE、DB2等?如果不支持,請(qǐng)加以說(shuō)明。. 1037.6詳細(xì)論述性能調(diào)優(yōu)及步驟.
11、1047.7ETL部分產(chǎn)品,廠家的發(fā)展策略和趨勢(shì),產(chǎn)品延續(xù)性如何?.1138元數(shù)據(jù)管理分析元數(shù)據(jù)管理分析. 1158.1元數(shù)據(jù)管理工具的架構(gòu)及工作原理. 1158.2元數(shù)據(jù)管理工具的功能模塊描述及工作流程 .1198.3元數(shù)據(jù)管理工具界面友好性如何. 1238.4元數(shù)據(jù)管理工具的平臺(tái)性. 1258.5元數(shù)據(jù)管理工具采集接口. 1258.6是否具有元數(shù)據(jù)脫機(jī)分析功能. 1278.7是否具有表級(jí)和字段級(jí)的血緣分析功能.1278.8是否可在一個(gè)分析視圖上,表現(xiàn)出跨不同工具的元數(shù)據(jù)血緣分析功能.1298.9是否有影響分析功能. 1308.10是否具有WEB 展現(xiàn)功能. 1308.11元數(shù)據(jù)管理工具的R
12、EPOSITORY的開(kāi)放性?是否支持主流的RDBMS?如不支持,請(qǐng)加以說(shuō)明。1328.12元數(shù)據(jù)分析報(bào)表,可導(dǎo)出為哪些種類的文件類型?.1328.13元數(shù)據(jù)檢索功能. 1338.14元數(shù)據(jù)同步及調(diào)度功能. 1338.15能否方便看到計(jì)算字段的元數(shù)據(jù)及計(jì)算公式.1358.16是否支持自定義元模型? 是否支持CWM 元數(shù)據(jù)標(biāo)準(zhǔn)?.1369產(chǎn)品供應(yīng)商資質(zhì)產(chǎn)品供應(yīng)商資質(zhì). 1399.1財(cái)務(wù)狀況和公司規(guī)模. 1399.2業(yè)界影響. 1399.3成功案例. 14110產(chǎn)品供應(yīng)商市場(chǎng)情況產(chǎn)品供應(yīng)商市場(chǎng)情況. 14710.1國(guó)內(nèi)客戶數(shù)量及全球客戶數(shù)量 . 14710.2市場(chǎng)準(zhǔn)入. 14810.3市場(chǎng)份額. 1
13、4911實(shí)施供應(yīng)商資質(zhì)和實(shí)施供應(yīng)商市場(chǎng)情況實(shí)施供應(yīng)商資質(zhì)和實(shí)施供應(yīng)商市場(chǎng)情況. 15112可實(shí)施能力可實(shí)施能力. 15212.1軟件安裝、配置的簡(jiǎn)單性和靈活性 .15212.2ETL性能監(jiān)控與調(diào)優(yōu)的能力. 152 Informatica技術(shù)解決方案V12.3如何從開(kāi)發(fā)環(huán)境遷移到生產(chǎn)環(huán)境 . 16112.4是否支持網(wǎng)格計(jì)算和負(fù)載均衡 . 16212.5是否支持ETL過(guò)程中的沖突分析. 16412.6是否支持流程分析. 16512.7是否有簡(jiǎn)體中文版本的軟件 . 16512.8開(kāi)放文檔的自動(dòng)生成. 16613實(shí)施方法論論及咨詢團(tuán)隊(duì)實(shí)施方法論論及咨詢團(tuán)隊(duì). 16813.1實(shí)施方法論. 16813.2
14、咨詢團(tuán)隊(duì). 17514售后維護(hù)售后維護(hù). 17614.1是否有本地支持,支持工程師是否充足.17614.2本地支持方式如是分公司還是代理(總代理或是什么級(jí)別的代理).17614.3產(chǎn)品升級(jí). 17715運(yùn)營(yíng)維護(hù)運(yùn)營(yíng)維護(hù). 17815.1資料庫(kù)的備份、恢復(fù). 17815.2是否支持SNMP管理,可與網(wǎng)管軟件集成.18015.3是否支持基于WEB的運(yùn)行管理和監(jiān)控,以及元數(shù)據(jù)報(bào)告.18115.4方便的系統(tǒng)部署功能和良好的系統(tǒng)監(jiān)控功能,是否支持未完成任務(wù)的監(jiān)控、報(bào)告和恢復(fù)功能18415.5是否提供版本控制和管理的功能 . 19215.6是否支持統(tǒng)一以及自定義的管理平臺(tái) .19215.7在調(diào)度時(shí)是否支持
15、時(shí)間觸發(fā)方式,在調(diào)度時(shí)是否支持事件觸發(fā)方式.19715.8是否支持命令行執(zhí)行方式 . 198附件、附件、INFORMATICA公司售后服務(wù)內(nèi)容介紹公司售后服務(wù)內(nèi)容介紹.202 Informatica技術(shù)解決方案1序言序言1.1 Informatica公司介紹公司介紹Informatica Co. Ltd 1993年創(chuàng)立于美國(guó)并于1999年登陸納斯達(dá)克。Informatica一直致力于為客戶提供具有強(qiáng)大的元數(shù)據(jù)管理、數(shù)據(jù)集成和個(gè)性化分析遞送功能的世界通行標(biāo)準(zhǔn)的統(tǒng)一數(shù)據(jù)服務(wù)平臺(tái)。Informatica的基礎(chǔ)設(shè)施產(chǎn)品以可伸縮的、可擴(kuò)展的企業(yè)級(jí)數(shù)據(jù)集成平臺(tái)為特點(diǎn),并廣泛支持來(lái)自Informatica和
16、其他的領(lǐng)先商務(wù)智能提供商的數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)設(shè)施和分析型應(yīng)用軟件的開(kāi)發(fā)和管理,提供元數(shù)據(jù)管理解決方案,幫助企業(yè)集成、優(yōu)化、審核信息資產(chǎn)以提高運(yùn)營(yíng)效率,增加客戶收益,取得競(jìng)爭(zhēng)優(yōu)勢(shì)。 作為數(shù)據(jù)整合軟件產(chǎn)業(yè)的領(lǐng)導(dǎo)者,Informatica擁有遍布全球的客戶,客戶范圍涵蓋金融、電信、制造、政府、能源、保險(xiǎn)、公眾服務(wù)等多種行業(yè)。Informatica的客戶:超過(guò)82的Fortune 100客戶80% 的道 瓊斯工業(yè)指數(shù)客戶全球 500 強(qiáng)企業(yè)中5個(gè)最大的的娛樂(lè)和媒體機(jī)構(gòu) 15 個(gè)最大的 電信公司中的13個(gè)31 個(gè)最大的 金融服務(wù)/銀行機(jī)構(gòu) 中的24個(gè)13 個(gè)最大的 制藥公司 中的12個(gè)18 個(gè)最大的 能源公司
17、 中的12個(gè)20 個(gè)最大的 制造企業(yè) 中的16個(gè) 20 個(gè)最大的 保險(xiǎn)公司 中的15個(gè) Informatica技術(shù)解決方案2所有四兵種的 美國(guó)軍隊(duì) (陸軍、海軍、海軍陸戰(zhàn)隊(duì)和空軍)作為數(shù)據(jù)整合方面的專家,更先進(jìn)的技術(shù)和更完善的服務(wù)一直是我們追究的目標(biāo)。為了給客戶提供系統(tǒng)是全方位服務(wù),我們擁有大量專業(yè)級(jí)的資源,來(lái)滿足客戶各個(gè)方面的需求。從自身來(lái)說(shuō),我們有高品質(zhì)專家提供豐富的資源為客戶服務(wù);從合作伙伴來(lái)說(shuō),我們有最好的戰(zhàn)略合作伙伴,企業(yè)的硬件提供商,第三方發(fā)展公司以及全球150多家系統(tǒng)整合商來(lái)幫助解決客戶復(fù)雜的數(shù)據(jù)整合難題。通過(guò)這些系統(tǒng)服務(wù),我們確保將客戶IT投資回報(bào)率最大化,為協(xié)助客戶成功做出不
18、懈的努力。 Informatica技術(shù)解決方案3正是在這種精益求精的企業(yè)精神之下,Informatica公司作為世界一級(jí)的專業(yè)生產(chǎn)商在數(shù)據(jù)集成領(lǐng)域中做出了突出的貢獻(xiàn),并且為此獲得業(yè)界和客戶等多方面的肯定和嘉獎(jiǎng)。2005年5月11日,Gartner,Magic Quadrant for ETL, 1H05, Informatica公司是ETL領(lǐng)域的技術(shù)領(lǐng)導(dǎo)者。2005年,Informatica的主打產(chǎn)品之一PowerExchange 5.2.1 獲得每周電腦報(bào)的最佳選手獎(jiǎng)。2004年12月,在Forrester資訊公司的關(guān)于“如何評(píng)估企業(yè)ETL”的調(diào)查中,名列整合解決方案提供商的前列。2004年
19、,設(shè)計(jì)手冊(cè)回顧(DM Review)根據(jù)其讀者的調(diào)查反饋,將Informatica列為數(shù)據(jù)整合方面的最好供應(yīng)商。同時(shí),Informatica作為商業(yè)智能和數(shù)據(jù)整合的解決方案提供商名列前12名。 2004年,聰明企業(yè)的讀者評(píng)選中,獲得最好數(shù)據(jù)整合供應(yīng)商的稱號(hào),同時(shí)公司的PowerCenter數(shù)據(jù)整合平臺(tái)在雜志的80,000個(gè)讀者的評(píng)選中成為最好的ETL工具。2004年,計(jì)算機(jī)商業(yè)評(píng)論雜志將Informatica公司評(píng)為在數(shù)據(jù)整合及數(shù)據(jù)應(yīng)用軟件領(lǐng)域的最有影響力的10家廠家之一,名列第五。2004年,加拿大核協(xié)會(huì)和英國(guó)的普天壽公司由于使用了Informatica公司的PowerCenter和Powe
20、rExchange產(chǎn)品,奪得設(shè)計(jì)手冊(cè)回顧評(píng)選的世界級(jí)解決方案獎(jiǎng)。2004年,Deutsche Brse Group 由于使用了Informatica公司的PowerCenter數(shù)據(jù)集成平臺(tái)而獲得了由TDMI頒發(fā)的最佳實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用獎(jiǎng)。2004年,Informatica公司被CMP傳媒評(píng)為最有影響力IT解決方案提供商之一。 Informatica技術(shù)解決方案41.2 Informatica公司針對(duì)行業(yè)的解決方案及特點(diǎn)公司針對(duì)行業(yè)的解決方案及特點(diǎn)在20世紀(jì)90年代,隨著企業(yè)對(duì)業(yè)務(wù)過(guò)程處理的卓越追求和對(duì)市場(chǎng)需要的及時(shí)響應(yīng),出現(xiàn)了一系列的以“產(chǎn)品”為中心的業(yè)務(wù)系統(tǒng)。這些業(yè)務(wù)系統(tǒng)在一定程度上滿足了當(dāng)時(shí)
21、企業(yè)發(fā)展的需要,但同時(shí)也對(duì)企業(yè)未來(lái)的發(fā)展埋下了一定的隱患。這些以“產(chǎn)品”為中心的業(yè)務(wù)系統(tǒng),由于其業(yè)務(wù)特點(diǎn)的各異性,往往采用了不同的技術(shù)實(shí)現(xiàn)、系統(tǒng)和數(shù)據(jù)規(guī)范,這不僅增加了企業(yè)信息化環(huán)境的復(fù)雜性、業(yè)務(wù)信息的不對(duì)稱和不一致性、業(yè)務(wù)信息的分散性和無(wú)全局性,還增加了運(yùn)行和維護(hù)部門的負(fù)擔(dān),最終還分散了企業(yè)關(guān)注支持新業(yè)務(wù)需求的精力。尤其是當(dāng)企業(yè)面臨從“以產(chǎn)品為中心”到“以客戶為中心”的經(jīng)營(yíng)模式轉(zhuǎn)變時(shí),這些隱患變更發(fā)的顯現(xiàn)出來(lái)。無(wú)論是政府還是各個(gè)行業(yè)的企業(yè),都已經(jīng)深深的意識(shí)到了以上隱患,從全局規(guī)劃角度出發(fā)的各種類型的標(biāo)準(zhǔn)化和流程化工作應(yīng)運(yùn)而生,并且被提到了企業(yè)發(fā)展的戰(zhàn)略高度。在具體實(shí)現(xiàn)方式上,“一個(gè)平臺(tái),多個(gè)
22、子系統(tǒng)”的概念逐漸深入政府、電信、金融服務(wù)和制造等各個(gè)行業(yè),統(tǒng)一數(shù)據(jù)服務(wù)平臺(tái)和與之相關(guān)聯(lián)的資源和服務(wù)目錄便是其中之一。UDS(Universal Data Services) 架構(gòu)是Informatica在新的形勢(shì)下提出的統(tǒng)一數(shù)據(jù)服務(wù)平臺(tái)。它支持企業(yè)各種類型的業(yè)務(wù)系統(tǒng)數(shù)據(jù)的整合、交換和共享,從而形成一套準(zhǔn)確、干凈、完整的數(shù)據(jù)集合,增強(qiáng)對(duì)企業(yè)決策者對(duì)商業(yè)活動(dòng)的敏感度,從而提升自身的競(jìng)爭(zhēng)力。在UDS服務(wù)體系中,提供了訪問(wèn)、整合、質(zhì)量控制、審核和監(jiān)控等數(shù)據(jù)服務(wù),具體架構(gòu)如下: Informatica技術(shù)解決方案5 PowerExchange:按照需求,可以很容易地訪問(wèn)分離、復(fù)雜的系統(tǒng),并從中得到數(shù)據(jù)
23、PowerCenter:目前業(yè)界最佳的集成元數(shù)據(jù)管理的數(shù)據(jù)整合、交換和共享平臺(tái)Informatica PowerCenter, 可以從任何數(shù)據(jù)源獲取數(shù)據(jù), 包括各種關(guān)系數(shù)據(jù)庫(kù),ERP應(yīng)用、以及各種文件系統(tǒng);同時(shí),利用它的圖形界面控制臺(tái)可以容易定義任何數(shù)據(jù)的抽取、匯總和計(jì)算, 整個(gè)數(shù)據(jù)集成的過(guò)程不需要進(jìn)行腳本的編寫; 利用它的計(jì)劃執(zhí)行能力,可以在正確的時(shí)間調(diào)度正確的作業(yè), 來(lái)完成數(shù)據(jù)的轉(zhuǎn)換; 利用數(shù)據(jù)庫(kù)的觸發(fā)機(jī)制, 可以完成實(shí)時(shí)的數(shù)據(jù)復(fù)制和增量備份等工作;實(shí)現(xiàn)加載流程 Informatica技術(shù)解決方案6合理化(Workflow);高性能的加載(Load Partition);極大的減輕了日后系
24、統(tǒng)的維護(hù)量。SuperGlue:審核數(shù)據(jù)血統(tǒng)、文檔過(guò)程、沖突分析,管理數(shù)據(jù)變化PowerAnalyzer:監(jiān)控:驗(yàn)證數(shù)據(jù)、過(guò)程報(bào)告、積極的傳遞洞察力借助Informatica公司產(chǎn)品和解決方案,通過(guò)建立統(tǒng)一數(shù)據(jù)交換和共享平臺(tái),行業(yè)可以獲得以下收益:實(shí)現(xiàn)對(duì)以業(yè)務(wù)系統(tǒng)為數(shù)據(jù)采集點(diǎn)的數(shù)據(jù)整合、交換和共享;提供對(duì)歷史系統(tǒng)數(shù)據(jù)、私有系統(tǒng)數(shù)據(jù)的訪問(wèn),充分利用企業(yè)信息化進(jìn)程積累的歷史數(shù)據(jù);降低數(shù)據(jù)冗余度、降低數(shù)據(jù)不一致性和提高數(shù)據(jù)準(zhǔn)確性,提高作為企業(yè)戰(zhàn)略資源的各種信息和歷史數(shù)據(jù)的使用率和使用準(zhǔn)確率;建立統(tǒng)一數(shù)據(jù)服務(wù)平臺(tái),支持現(xiàn)有和未來(lái)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)服務(wù);助力企業(yè)數(shù)據(jù)標(biāo)準(zhǔn)化和企業(yè)統(tǒng)一客戶視圖的建設(shè)工作,為建立
25、以客戶為中心,以服務(wù)為導(dǎo)向的新型服務(wù)企業(yè)提供底層信息流動(dòng)支撐;助力企業(yè)實(shí)現(xiàn)跨地域的、跨業(yè)務(wù)系統(tǒng)的客戶一致化服務(wù)水平,提高企業(yè)客戶滿意度和企業(yè)競(jìng)爭(zhēng)能力;助力企業(yè)全局?jǐn)?shù)據(jù)倉(cāng)庫(kù)和特定主題數(shù)據(jù)集市的建立; Informatica技術(shù)解決方案7圖形化的部署、控制和管理統(tǒng)一數(shù)據(jù)服務(wù)平臺(tái),簡(jiǎn)化系統(tǒng)變化、升級(jí)和部署的復(fù)雜度,從而更加快速的應(yīng)對(duì)整合和市場(chǎng)變化;隨著企業(yè)的發(fā)展,支持新業(yè)務(wù)系統(tǒng)的平滑、快速接入。1.2.1 解決方案特點(diǎn)解決方案特點(diǎn)靈活開(kāi)發(fā)和部署現(xiàn)今許多集成項(xiàng)目常??缭綍r(shí)間和地理分區(qū),為了有效管理本地和全球開(kāi)發(fā)隊(duì)伍,企業(yè)需要集成支持協(xié)作開(kāi)發(fā)和部署的軟件。PowerCenter提供一整套高度復(fù)用性的產(chǎn)品
26、工具,用于加速開(kāi)發(fā)、簡(jiǎn)化管理、降低當(dāng)前的維護(hù)成本。使用PowerCenter,不同區(qū)域的開(kāi)發(fā)者能夠基于小組開(kāi)發(fā)和調(diào)試工具,迅速并容易地響應(yīng)集成需求。通過(guò)PowerCenter的Check-in和Check-out對(duì)象管理和版本控制,開(kāi)發(fā)者的小組們能夠同時(shí)工作在相同的項(xiàng)目上,提供與時(shí)間無(wú)關(guān)的部署。安全可靠的企業(yè)數(shù)據(jù)安全對(duì)于IT組織機(jī)構(gòu)來(lái)說(shuō),已經(jīng)成為一個(gè)最主要的關(guān)心點(diǎn)。通過(guò)LADP和其他目錄服務(wù)器驗(yàn)證支持,對(duì)于安全訪問(wèn)、加密數(shù)據(jù)傳輸,詳細(xì)的審計(jì)記錄的角色的許可,PowerCenter提供一個(gè)安全的環(huán)境貫穿集成的全過(guò)程。PowerCenter提供最大范圍的安全能力,為企業(yè)數(shù)據(jù)集成提供安全保障。無(wú)可比
27、擬的性能和可擴(kuò)展性提供無(wú)限制的可擴(kuò)展性、可測(cè)量性和吞吐量,適應(yīng)企業(yè)目前數(shù)據(jù)交換和共享的需要,并支持未來(lái)業(yè)務(wù)系統(tǒng)的平滑接入和擴(kuò)展。PowerCenter提供無(wú)可比擬的性能,不管環(huán)境如何,都能應(yīng)對(duì)當(dāng)前和未來(lái)數(shù)據(jù)主動(dòng)集成。PowerCenter的性能引擎提供: Informatica技術(shù)解決方案8管道,分區(qū),數(shù)據(jù)靈活的并行,有效地打破分離的集成通過(guò)異種環(huán)境進(jìn)行網(wǎng)格計(jì)算,最大化使用現(xiàn)存的基礎(chǔ)架構(gòu)批處理、變化、實(shí)時(shí)數(shù)據(jù)移動(dòng)有最好的適應(yīng)性 Informatica技術(shù)解決方案92 設(shè)計(jì)理念設(shè)計(jì)理念2.1 設(shè)計(jì)理念的先進(jìn)性設(shè)計(jì)理念的先進(jìn)性回答:滿足?;卮穑簼M足。2.1.1 產(chǎn)品體系結(jié)構(gòu)和工作原理產(chǎn)品體系結(jié)構(gòu)和
28、工作原理2.1.2 產(chǎn)品功能模塊描述產(chǎn)品功能模塊描述1個(gè)個(gè)(或多個(gè)或多個(gè))RepositoryPowerCenter數(shù)據(jù)整合引擎是基于元數(shù)據(jù)驅(qū)動(dòng)的,提供了基于元數(shù)據(jù)驅(qū)動(dòng)的元數(shù)據(jù)知識(shí)庫(kù)(Repository),該元數(shù)據(jù)知識(shí)庫(kù)可以在主流的關(guān)系型數(shù)據(jù)庫(kù)中部署。該元數(shù)據(jù)庫(kù)中存儲(chǔ)所有的ETL元數(shù)據(jù),包括:源、目標(biāo)表的物理和邏輯元數(shù)據(jù), ETL轉(zhuǎn)換規(guī)則,知識(shí)庫(kù)用戶權(quán)限,ETL任務(wù)運(yùn)行歷史信息等元數(shù)據(jù)。 Informatica技術(shù)解決方案102個(gè)個(gè)ServerInformatica Repository Server:資料庫(kù)Server,用來(lái)管理所有對(duì)資料庫(kù)中元數(shù)據(jù)的請(qǐng)求和操作。Informatica Se
29、rver:實(shí)際的ETL引擎5個(gè)個(gè)Client:PowerCenter Designer:設(shè)計(jì)開(kāi)發(fā)環(huán)境,定義源及目標(biāo)數(shù)據(jù)結(jié)構(gòu);設(shè)計(jì)轉(zhuǎn)換規(guī)則,生成ETL映射。Workflow Manager:對(duì)Workflow,Session等ETL任務(wù)作設(shè)計(jì),同時(shí)提供了對(duì)任務(wù)執(zhí)行的調(diào)度和管理功能。Workflow Monitor:監(jiān)控Workflow和Session運(yùn)行情況,生成日志和報(bào)告。Repository Manager:元數(shù)據(jù)維護(hù)和安全操作,如:元數(shù)據(jù)查找,用戶、組、權(quán)限管理等。下圖是Repository Manager的操作界面。Repository Server Administrator Cons
30、ole:對(duì)知識(shí)庫(kù)的操作,如:知識(shí)庫(kù)的創(chuàng)建、備份、恢復(fù)等。2.1.3 PowerCenter基本工作原理基本工作原理Informatica是基于元數(shù)據(jù)驅(qū)動(dòng)的,所有的元數(shù)據(jù)都保存在Repository(知識(shí)庫(kù))中,該知識(shí)庫(kù)可以創(chuàng)建在所有主流數(shù)據(jù)庫(kù)當(dāng)中,充分體現(xiàn)了它元數(shù)據(jù)的開(kāi)放性。Repository Server用來(lái)管理所有客戶端以及Informatica Server跟Repository的交互, 并且一個(gè)Repository Server可以管理多個(gè)Repository,而Repository Server可為每個(gè)Repository分配一個(gè)Repository A
31、gent來(lái)處理所對(duì)有元數(shù)據(jù)操作的響應(yīng)。 Informatica技術(shù)解決方案Informatica Server是實(shí)際處理ETL任務(wù)的后臺(tái)服務(wù),它是基于內(nèi)存運(yùn)行、高效的ETL服務(wù),不需要產(chǎn)生任何的代碼,每次執(zhí)行任務(wù)之前都會(huì)從Repository中讀取最新的ETL規(guī)則。Informatica的客戶端提供了無(wú)編碼、完全圖形化的設(shè)計(jì)和管理調(diào)度界面,可實(shí)現(xiàn)快速開(kāi)發(fā)和部署。一個(gè)基本的ETL任務(wù)設(shè)計(jì)和部署的大致步驟如下:A) 使用Designer客戶端,獲取源數(shù)據(jù)表的元數(shù)據(jù)。B) 使用Designer客戶端,獲取目標(biāo)數(shù)據(jù)表的元數(shù)據(jù)。C) 使用Designer客戶
32、端,設(shè)計(jì)一個(gè)Mapping,其中就是源-目標(biāo)的ETL規(guī)則。D) 使用Workflow Manager客戶端,針對(duì)上面實(shí)現(xiàn)的Mapping,實(shí)例化為一個(gè)Session,為其指定實(shí)際的數(shù)據(jù)源、目標(biāo)連接,以及其他屬性。E)使用Workflow Manager客戶端,創(chuàng)建一個(gè)Workflow,其中包含上述的Session以及其他的Task,在Workflow中可實(shí)現(xiàn)復(fù)雜的流程控制。F)運(yùn)行上述Workflow,使用Workflow Monitor客戶端,監(jiān)測(cè)最終的任務(wù)運(yùn)行結(jié)果。2.1.4 Informatica PowerCenter核心技術(shù)核心技術(shù)Informatica 是數(shù)據(jù)集成領(lǐng)域的領(lǐng)先者,無(wú)論
33、在客戶群及市場(chǎng)占有率上,一直名列前茅。就其核心技術(shù)來(lái)說(shuō),可分為以下幾點(diǎn):可擴(kuò)展和分布式的產(chǎn)品體系,以元數(shù)據(jù)為核心驅(qū)動(dòng)(Metadata Driven)。開(kāi)放性,PowerCenter元數(shù)據(jù)可構(gòu)建在DB2、Oracle、Informix、Sybase、MS SQL Informatica技術(shù)解決方案12SERVER、Teradata 主流關(guān)系型數(shù)據(jù)庫(kù)上,并提供PowerCenter元數(shù)據(jù)描述,真正的作到高開(kāi)放性。國(guó)際化支持,可處理任何字符集遵守CWM的元數(shù)據(jù)標(biāo)準(zhǔn),可完全真正開(kāi)放的作到元數(shù)據(jù)交換。合理的體系結(jié)構(gòu)劃分,可適應(yīng)分步式的部署。高性能的管道技術(shù),使數(shù)據(jù)在轉(zhuǎn)換過(guò)程,達(dá)到完全內(nèi)存操作。并行作業(yè)
34、控制,可最大化的利用系統(tǒng)資源,達(dá)到高并行性的效果。服務(wù)器集群,真正的Server級(jí)并行、負(fù)載均衡。對(duì)實(shí)時(shí)數(shù)據(jù)源的支持,例如IBM MQ、Tibco、WebMethod、JMS、WebService、SAP R/3(IDOC)。先進(jìn)的會(huì)話管理,工作流機(jī)制。支持Workflow機(jī)制,通過(guò)多種工作流調(diào)度方法,可以將ETL Session,外部命令,Email,以及數(shù)據(jù)庫(kù)腳本等任務(wù)有機(jī)的結(jié)合在一起,從而定制復(fù)雜的工作流。2.2 設(shè)計(jì)理念的符合性設(shè)計(jì)理念的符合性回答:滿足?;卮穑簼M足。Informatica PowerCenter 分布式的體系結(jié)構(gòu),可適合企業(yè)快速部署生產(chǎn)環(huán)境。作業(yè)設(shè)計(jì)分為邏輯設(shè)計(jì)、知識(shí)
35、庫(kù)管理、物理作業(yè)的執(zhí)行。從設(shè)計(jì)的角度,將開(kāi)發(fā)分成三層結(jié)構(gòu),符合現(xiàn)代主流的技術(shù)特性。 Informatica技術(shù)解決方案13開(kāi)放的元數(shù)據(jù)知識(shí)庫(kù),存在主流的關(guān)系型數(shù)據(jù)庫(kù)中,且元數(shù)據(jù)遵守CWM元數(shù)據(jù)標(biāo)準(zhǔn),可為企業(yè)元數(shù)據(jù)交換,提供國(guó)際先進(jìn)的標(biāo)準(zhǔn)。因元數(shù)據(jù)是單獨(dú)由知識(shí)庫(kù)進(jìn)行管理,且作業(yè)可跨平臺(tái)。在作系統(tǒng)移植時(shí),可不分存儲(chǔ)的數(shù)據(jù)庫(kù),其科學(xué)的可移植性極大方便了企業(yè)的部署要求。強(qiáng)大的工作流調(diào)度,可按時(shí)間、事件、參數(shù)、指示文件等進(jìn)行觸發(fā),從邏輯設(shè)計(jì)上,滿足企業(yè)多任務(wù)流程設(shè)計(jì)。高性能的ETL服務(wù)引擎,完全的內(nèi)存線程,并集成了數(shù)據(jù)庫(kù)的性能特點(diǎn),是企業(yè)ETL高性能的保障圖形化的開(kāi)發(fā),極大提高了開(kāi)發(fā)效率,縮短項(xiàng)目周期。
36、等等。 Informatica技術(shù)解決方案143 基本功能基本功能3.1 字段級(jí)的操作,主要包括:字段映射,映射的自動(dòng)匹配,字字段級(jí)的操作,主要包括:字段映射,映射的自動(dòng)匹配,字段的拆分,多字段的混合運(yùn)算,自動(dòng)完成時(shí)間類型的轉(zhuǎn)換段的拆分,多字段的混合運(yùn)算,自動(dòng)完成時(shí)間類型的轉(zhuǎn)換回答:滿足。回答:滿足。Informatica PowerCenter是完全圖形化的開(kāi)發(fā),可通過(guò)簡(jiǎn)單的操作,完成此需求:1) 通過(guò)簡(jiǎn)單的拖拽操作實(shí)現(xiàn)2) 映射的自動(dòng)匹配:在Designer的設(shè)計(jì)中,有“Auto-link”的自動(dòng)匹配功能,具有高級(jí)匹配功能,可進(jìn)行前綴、后綴和位置的自動(dòng)匹配。3) 字段的拆分,內(nèi)置眾多的字符
37、串函數(shù),例如SUBSTR, Instr等,可完成字段的拆分、合并等操作。4) 多字段的混合運(yùn)算,內(nèi)部具有Expression組件,可增加復(fù)雜的多字段混合計(jì)算,同時(shí)可嵌入100多種函數(shù)和參數(shù),極大的提高了計(jì)算表達(dá)式的靈活性。 Informatica技術(shù)解決方案155) 自動(dòng)完成時(shí)間類型的轉(zhuǎn)換,如在記錄中,符合時(shí)間格式,可自動(dòng)進(jìn)行字符型和時(shí)間類型的轉(zhuǎn)換,并且提供to_char,to_date等強(qiáng)制轉(zhuǎn)換函數(shù)。3.2 記錄級(jí)的操作,主要包括:去重復(fù)記錄,記錄間合并或計(jì)記錄級(jí)的操作,主要包括:去重復(fù)記錄,記錄間合并或計(jì)算,記錄拆分等算,記錄拆分等回答:滿足?;卮穑簼M足。1)去重記錄A) 組件內(nèi)部設(shè)有變量
38、,可模擬數(shù)據(jù)庫(kù)游標(biāo)操作,進(jìn)行數(shù)據(jù)記錄的前后比對(duì),即可識(shí)別重復(fù)記錄。B) 動(dòng)態(tài)Lookup組件,此組件可理解為子查詢,針對(duì)目標(biāo)庫(kù)或文件進(jìn)行所需字段的查詢,將查詢結(jié)果放入內(nèi)存中。這樣從數(shù)據(jù)源中讀取的數(shù)據(jù),在此內(nèi)存中與歷史記錄的主鍵進(jìn)行比對(duì),可發(fā)現(xiàn)此記錄是否重復(fù),并可將重復(fù)數(shù)據(jù)單獨(dú)輸出到另外的文件或數(shù)據(jù)庫(kù)表中。此組件,還有一特點(diǎn),就是將數(shù)據(jù)源流入的主鍵在讀入的過(guò)程中,將新主鍵,也保留在Lookup內(nèi)存中,實(shí)現(xiàn)所有數(shù)據(jù)記錄主鍵的內(nèi)存存儲(chǔ),方便數(shù)據(jù)的比對(duì)操作。C) Informatica PowerCenter內(nèi)置緩慢變化維向?qū)В诖藢⒃敿?xì)描述其過(guò)程。緩慢變化維原理論述對(duì)于導(dǎo)入的數(shù)據(jù)源,針對(duì)主鍵和驗(yàn)證字
39、段,同目標(biāo)進(jìn)行比對(duì):a)主鍵不存在,為新增數(shù)據(jù);b)主鍵存在,驗(yàn)證字段相同無(wú)變化,為重復(fù)數(shù)據(jù); Informatica技術(shù)解決方案16c)主鍵存在,驗(yàn)證字段發(fā)生變化,為變化數(shù)據(jù)。以上三類文件,可將數(shù)據(jù)情況劃為三類,再分別作相應(yīng)類SQL操作:Insert, Update, reject, delete。2)記錄合并和計(jì)算A) Informatica PowerCenter提供Joiner和Union等組件可實(shí)現(xiàn)多個(gè)流入源的記錄join和union的操作。實(shí)現(xiàn)記錄的合并B) Informatica PowerCenter提供Expression和匯總組件,實(shí)現(xiàn)記錄內(nèi)的計(jì)算表達(dá)式和記錄集的匯總計(jì)算等
40、操作。3)記錄拆分A) Informatica PowerCenter提供Filter和Router等組件可實(shí)現(xiàn)流入源的記錄過(guò)濾和分組等的操作。實(shí)現(xiàn)記錄的拆分和流向控制。B) Informatica PowerCenter內(nèi)部設(shè)計(jì),很容易進(jìn)行數(shù)據(jù)的分支設(shè)計(jì),方便的實(shí)現(xiàn)記錄按條件和需求的拆分。3.3 表級(jí)的操作,主要包括:代理鍵的生成表級(jí)的操作,主要包括:代理鍵的生成,行列變換行列變換,排序排序,統(tǒng)計(jì)統(tǒng)計(jì),制造樣品數(shù)據(jù)制造樣品數(shù)據(jù)回答:滿足?;卮穑簼M足。代理鍵的生成:PowerCenter提供Sequence Generator 組件,可生成唯一序列號(hào),作為代理鍵。行列變換: PowerCent
41、er提供Normalizer組件,專門用來(lái)作行列轉(zhuǎn)換這類操作。排序: PowerCenter提供Sorter組件,可圖形化的選取字段,進(jìn)行升序或降序的操作。 Informatica技術(shù)解決方案17統(tǒng)計(jì): PowerCenter提供統(tǒng)計(jì)學(xué)的Rank組件,可快速得到前幾名和后幾名的統(tǒng)計(jì)操作。制造樣品數(shù)據(jù): PowerCenter提供存儲(chǔ)過(guò)程和外部程序包組件,可將一定規(guī)則的設(shè)計(jì),生成程序包,在PowerCenter設(shè)計(jì)中加以調(diào)用。3.4 數(shù)據(jù)庫(kù)級(jí)的操作,主要包括:對(duì)各種碼表的支持包括數(shù)據(jù)庫(kù)級(jí)的操作,主要包括:對(duì)各種碼表的支持包括GBK(必需)、(必需)、Unicode(必需)、(必需)、ASCII(
42、必需)(必需)回答:滿足?;卮穑簼M足。PowerCenter產(chǎn)品作為業(yè)界領(lǐng)先的提供商,支持國(guó)際化碼制。支持簡(jiǎn)體中文MS936 MS Windows Simplified Chinese, superset of GB 2312-80, EUC encoding支持Unicode和ASCII模式的數(shù)據(jù)移動(dòng)。以下是支持的碼表:Code Page DescriptionsNameDescriptionIDEuroShift-JISTest code page, Shift-JIS with European characters9999IBM037IBM EBCDIC US English2028I
43、BM273IBM EBCDIC German2030IBM280IBM EBCDIC Italian2035IBM285IBM EBCDIC UK English2038 Informatica技術(shù)解決方案18IBM297IBM EBCDIC French2040IBM500IBM EBCDIC International Latin-12044IBM930IBM EBCDIC Japanese930IBM935IBM EBCDIC Simplified Chinese935IBM937IBM EBCDIC Traditional Chinese937IBM939IBM EBCDIC Japa
44、nese CP939939ISO-8859-10ISO 8859-10 Latin 6 (Nordic)13ISO-8859-15ISO 8859-15 Latin 9 (Western European)201ISO-8859-2ISO 8859-2 Eastern European5ISO-8859-3ISO 8859-3 Southeast European6ISO-8859-4ISO 8859-4 Baltic7ISO-8859-5ISO 8859-5 Cyrillic8ISO-8859-6ISO 8859-6 Arabic9ISO-8859-7ISO 8859-7 Greek10IS
45、O-8859-8ISO 8859-8 Hebrew11ISO-8859-9ISO 8859-9 Latin 5 (Turkish)12JapanEUC*Japanese Extended UNIX Code (including JIS X 0212)18 Informatica技術(shù)解決方案19JEFJapanese EBCDIC Fujitsu9000JEF-kanaJapanese EBCDIC-Kana Fujitsu9005JIPSENEC ACOS JIPSE Japanese9002JIPSE-kanaNEC ACOS JIPSE-Kana Japanese9007KEISHITA
46、CHI KEIS Japanese9001KEIS-kanaHITACHI KEIS-Kana Japanese9006Latin1*ISO 8859-1 Western European4MELCOMMITSUBISHI MELCOM Japanese9004MELCOM-kanaMITSUBISHI MELCOM-Kana Japanese9009MS1250MS Windows Latin 2 (Central Europe) 2250MS1251MS Windows Cyrillic (Slavic)2251MS1252*MS Windows Latin1 (ANSI), supers
47、et of Latin12252MS1253MS Windows Greek2253MS1254MS Windows Latin 5 (Turkish), superset of ISO 8859-92254MS1255MS Windows Hebrew2255MS1256MS Windows Arabic 2256 Informatica技術(shù)解決方案20MS1257MS Windows Baltic Rim2257MS1258MS Windows Vietnamese2258MS1361MS Windows Korean (Johab)1361MS874MS-DOS Thai, supers
48、et of TIS 620874MS932*MS Windows Japanese, Shift-JIS2024MS936MS Windows Simplified Chinese, superset of GB 2312-80, EUC encoding936MS949MS Windows Korean, superset of KS C 5601-1992949MS950MS Windows Traditional Chinese, superset of Big 5950UNISYSUNISYS Japanese9003UNISYS-kanaUNISYS-Kana Japanese900
49、8US-ASCII*7-bit ASCII1UTF-8UTF-8 encoding of Unicode106* PowerCenter uses these code pages. Informatica技術(shù)解決方案214 技術(shù)特點(diǎn)技術(shù)特點(diǎn)4.1 跨異構(gòu)數(shù)據(jù)庫(kù)的關(guān)聯(lián)、支持關(guān)聯(lián)條件的復(fù)雜程度、自定義函跨異構(gòu)數(shù)據(jù)庫(kù)的關(guān)聯(lián)、支持關(guān)聯(lián)條件的復(fù)雜程度、自定義函數(shù)的實(shí)現(xiàn)、過(guò)濾條件的復(fù)雜程度數(shù)的實(shí)現(xiàn)、過(guò)濾條件的復(fù)雜程度回答:滿足?;卮穑簼M足??绠悩?gòu)數(shù)據(jù)庫(kù)的關(guān)聯(lián):PowerCenter 有joiner組件,可實(shí)現(xiàn)異構(gòu)數(shù)據(jù)源的關(guān)聯(lián)操作。支持關(guān)聯(lián)條件的復(fù)雜程度:可支持左關(guān)聯(lián)、右關(guān)聯(lián)、直等關(guān)聯(lián)、全關(guān)聯(lián)。自定義函數(shù)
50、的實(shí)現(xiàn):PowerCener 有Stored Procedure和External Procedure組件,可調(diào)用數(shù)據(jù)庫(kù)存儲(chǔ)過(guò)程和調(diào)用外部程序包,例如VB、VC、C、C+、Perl等等過(guò)濾條件的復(fù)雜程度:在PowerCenter中有Filter組件,可完成類SQL中的where子句的操作。一般的用法是將多過(guò)濾條件先生成一個(gè)標(biāo)識(shí)位,在Filter中,進(jìn)行這些標(biāo)識(shí)位的判斷。同時(shí)也支持復(fù)雜邏輯表達(dá)式的過(guò)濾。4.2 支持的數(shù)據(jù)類型,包括支持的數(shù)據(jù)類型,包括Binaray、Date/Time、Decimal、Double、Integer、String、Text、Real、Small Integer等等回
51、答:滿足?;卮穑簼M足。Informatica產(chǎn)品支持UNICODE和ASCII 兩種數(shù)據(jù)傳輸模式(Informatica Server Setup-Configuration 設(shè)置頁(yè) - Unicode or ASCII),支持中文的雙字節(jié)傳輸 Informatica技術(shù)解決方案22下圖為Informatica 對(duì)Oracle 數(shù)據(jù)類型的支持列表. 可支持上述問(wèn)題中的數(shù)據(jù)類型,同時(shí)也支持其他主流關(guān)系數(shù)據(jù)庫(kù)的絕大部分?jǐn)?shù)據(jù)類型。Oracle and Transformation TypesOracleRangeTransformationRangeBLobUp to 4 GBBinary1 to
52、104,857,600 bytesChar(L)1 to 2,000 bytesString1 to 104,857,600 charactersClobUp to 4 GBText1 to 104,857,600 charactersDateJan. 1, 4712 BC to Dec. 31, 4712 ADDate/TimeJan 1, 1753 AD to Dec 31, 9999 ADLongUp to 2 GBText1 to 104,857,600 charactersIf you include Long data in a mapping, the PowerCenter S
53、erver converts it to the transformation String datatype, and truncates it to 104,857,600 characters.Long RawUp to 2 GBBinary1 to 104,857,600 bytesNchar1 to 2,000 bytesNstring1 to 104,857,600 characters Informatica技術(shù)解決方案23NclobUp to 4 GBNtext1 to 104,857,600 charactersNumberPrecision of 1 to 38Double
54、Precision of 15Number(P,S)Precision of 1 to 38; scale of 0 to 38DecimalPrecision of 1 to 28; scale of 0 to 28Nvarchar21 to 4,000 bytesNstring1 to 104,857,600 charactersRaw(L)1 to 2,000 bytesBinary1 to 104,857,600 bytesVarchar(L)1 to 4,000 bytesString1 to 104,857,600 charactersVarchar2(L)1 to 4,000 b
55、ytesString1 to 104,857,600 charactersXMLTypeUp to 4 GBText1 to 104,857,600 characters4.3 抽取斷點(diǎn)抽取斷點(diǎn),支持參數(shù)抽取的靈活程度支持參數(shù)抽取的靈活程度,如何抽取遠(yuǎn)程數(shù)據(jù),抽取如何抽取遠(yuǎn)程數(shù)據(jù),抽取數(shù)據(jù)的事務(wù)處理支持,抽取的字段是否可以動(dòng)態(tài)修改,對(duì)抽數(shù)據(jù)的事務(wù)處理支持,抽取的字段是否可以動(dòng)態(tài)修改,對(duì)抽取的環(huán)境變量配置情況,環(huán)境變量是否可以動(dòng)態(tài)修改取的環(huán)境變量配置情況,環(huán)境變量是否可以動(dòng)態(tài)修改回答:滿足?;卮穑簼M足。1) 抽取斷點(diǎn)斷點(diǎn)續(xù)傳(recovery): 如果選擇了Session的“Session Re
56、covery”屬性,Informatica在每次提交數(shù)據(jù)到目標(biāo)庫(kù)時(shí),都會(huì)將最新的總提交數(shù)記錄到資料庫(kù)中。尤其 Informatica技術(shù)解決方案24在源數(shù)據(jù)記錄特別龐大時(shí),如果由于某種原因而導(dǎo)致Session失敗,已經(jīng)入庫(kù)的數(shù)據(jù)雖然無(wú)法回滾,但是由于在資料庫(kù)中有已入庫(kù)的總數(shù)目,在失敗后,該Session可直接重新執(zhí)行,從而跳過(guò)了已經(jīng)裝載的數(shù)據(jù),實(shí)現(xiàn)真正的斷點(diǎn)續(xù)傳功能。 注意,使用該功能的前提:Session前后兩次執(zhí)行獲得的數(shù)據(jù)的個(gè)數(shù)、數(shù)據(jù)的先后次序必須一致,見(jiàn)下面的Session Recovery屬性設(shè)置:2)支持參數(shù)抽取的靈活程度PowerCenter對(duì)于參數(shù),分為不同級(jí)別:組件級(jí)、Map
57、ping級(jí)、Session級(jí)、Workflow級(jí)。這幾級(jí)的參數(shù)可極大的提高作業(yè)和流程的靈活性。例如:在抽取時(shí),可定義SQL:Select product_id, product_name, product_desc from $table_name where product_date= $begin_date 。以”$”為開(kāi)頭的是 Informatica技術(shù)解決方案25PowerCenter的變量或參數(shù)的標(biāo)識(shí),只要在參數(shù)文件給出具體的值,即可。這幾級(jí)的變量或參數(shù),可參與整個(gè)作業(yè)的設(shè)計(jì)和流程的設(shè)計(jì),包括輸入的源的定位,是哪個(gè)數(shù)據(jù)庫(kù)連接或文本文件,使開(kāi)發(fā)具有極高靈活性。3)如何抽取遠(yuǎn)程數(shù)據(jù)對(duì)于遠(yuǎn)
58、程抽取,按網(wǎng)絡(luò)情況,分為兩種:網(wǎng)絡(luò)情況良好:可通過(guò)直連數(shù)據(jù)庫(kù),進(jìn)行遠(yuǎn)程抽取。對(duì)于網(wǎng)絡(luò)情況不好或經(jīng)常斷網(wǎng)、丟包的情況,建議先用專業(yè)的FTP軟件,將數(shù)據(jù)集中到ETL服務(wù)器,再集中處理。PowerCenter也內(nèi)置了FTP協(xié)議的功能傳輸。這樣避免了當(dāng)作業(yè)運(yùn)行,因網(wǎng)絡(luò)原因斷掉,對(duì)數(shù)據(jù)庫(kù)造成的影響。 Informatica技術(shù)解決方案264)抽取數(shù)據(jù)的事務(wù)處理支持ETL過(guò)程是指處理批量數(shù)據(jù),對(duì)于海量數(shù)據(jù),不可能事務(wù)方式處理,因?yàn)殡S著作業(yè)的執(zhí)行,數(shù)據(jù)要交給數(shù)據(jù)庫(kù)的回滾段,如果不作提交操作,數(shù)據(jù)庫(kù)首先就承受不了。但此點(diǎn),可通過(guò)幾種情況,加以論述:PowerCenter在作業(yè)設(shè)置時(shí),有commit inter
59、val的設(shè)置,也就是在PowerCenter內(nèi)部設(shè)置,當(dāng)提交數(shù)據(jù)庫(kù)多少條數(shù)據(jù)commit一次。這樣如果數(shù)據(jù)量較少,可設(shè)置此參數(shù)為3萬(wàn)或更高,這樣就可以將此批數(shù)據(jù)作為一個(gè)事務(wù)進(jìn)行處理和提交。但數(shù)據(jù)量越多,提交時(shí),對(duì)數(shù)據(jù)庫(kù)回滾段要求比較高,因?yàn)檫@部分?jǐn)?shù)據(jù)是要存在數(shù)據(jù)庫(kù)回滾段中的。當(dāng)因數(shù)據(jù)量極大,不可能完成事務(wù)控制時(shí),一般可在目標(biāo)庫(kù),建立一個(gè)結(jié)構(gòu)相同的目標(biāo)臨時(shí)表。每次執(zhí)行時(shí), Informatica技術(shù)解決方案27清空這張表,作業(yè)執(zhí)行完,發(fā)出SQL去更改表名成真正的目標(biāo)表或交換到表分區(qū)上。這樣就不會(huì)因作業(yè)執(zhí)行一半出錯(cuò),而出現(xiàn)的數(shù)據(jù)不容易回滾刪除的問(wèn)題了。PowerCenter內(nèi)置了Transacti
60、on Control組件,對(duì)裝載數(shù)據(jù)按條件分組,進(jìn)行事務(wù)控制。5)抽取的字段是否可以動(dòng)態(tài)修改圖形化的工具對(duì)于動(dòng)態(tài)更改抽取字段,一般是采用變量或參數(shù)的方式,例如定義PowerCenter變量 $col_name,其抽取的SQL為:select $col_name, product_type from product_his,只要在參數(shù)文件中,定義此字段的具體名字即可。但需注意之處在于,因?yàn)槭菆D形化的工具,變量對(duì)應(yīng)的那個(gè)字段,需在數(shù)據(jù)類型上兼容才可。6)對(duì)抽取的環(huán)境變量配置情況利用Mapping級(jí)參數(shù)和變量:實(shí)現(xiàn)動(dòng)態(tài)的SQL語(yǔ)句;關(guān)鍵轉(zhuǎn)換指標(biāo)可實(shí)現(xiàn)外部參數(shù)化控制利用Session級(jí)變量:實(shí)現(xiàn) 數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 南昌工程學(xué)院《發(fā)酵工程大實(shí)驗(yàn)(實(shí)驗(yàn))》2023-2024學(xué)年第一學(xué)期期末試卷
- 牡丹江師范學(xué)院《光環(huán)境規(guī)劃與設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 民辦合肥財(cái)經(jīng)職業(yè)學(xué)院《現(xiàn)代食品加工技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 魯迅美術(shù)學(xué)院《空氣理化檢驗(yàn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年校園安全應(yīng)急處置與保安人員聘用協(xié)議3篇
- 臨沂職業(yè)學(xué)院《歌唱語(yǔ)音(2)》2023-2024學(xué)年第一學(xué)期期末試卷
- 臨夏現(xiàn)代職業(yè)學(xué)院《道路工程概預(yù)算》2023-2024學(xué)年第一學(xué)期期末試卷
- 遼寧政法職業(yè)學(xué)院《土地信息系統(tǒng)原理與應(yīng)用》2023-2024學(xué)年第一學(xué)期期末試卷
- 二零二五年度高速鐵路工程質(zhì)量擔(dān)保合同2篇
- 遼寧商貿(mào)職業(yè)學(xué)院《工程材料與機(jī)械制造基礎(chǔ)雙語(yǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年08月云南省農(nóng)村信用社秋季校園招考750名工作人員筆試歷年參考題庫(kù)附帶答案詳解
- 防詐騙安全知識(shí)培訓(xùn)課件
- 心肺復(fù)蘇課件2024
- 2024年股東股權(quán)繼承轉(zhuǎn)讓協(xié)議3篇
- 2024-2025學(xué)年江蘇省南京市高二上冊(cè)期末數(shù)學(xué)檢測(cè)試卷(含解析)
- 四川省名校2025屆高三第二次模擬考試英語(yǔ)試卷含解析
- 《城鎮(zhèn)燃?xì)忸I(lǐng)域重大隱患判定指導(dǎo)手冊(cè)》專題培訓(xùn)
- 湖南財(cái)政經(jīng)濟(jì)學(xué)院專升本管理學(xué)真題
- 考研有機(jī)化學(xué)重點(diǎn)
- 全國(guó)身份證前六位、區(qū)號(hào)、郵編-編碼大全
- 《GPU體系結(jié)構(gòu)》課件2
評(píng)論
0/150
提交評(píng)論