


下載本文檔
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
ETL數(shù)據(jù)加載策略本文所提到的數(shù)據(jù)加載策略為OLTP系統(tǒng)作為源系統(tǒng),并進(jìn)行ETL數(shù)據(jù)加載到OLAP系統(tǒng)中所采用的一般數(shù)據(jù)加載策略。根據(jù)該方式的特定性,此時(shí)ETL數(shù)據(jù)加載一般存在以下四種方案:時(shí)戳方式需要在OLTP系統(tǒng)中業(yè)務(wù)表中統(tǒng)一添加時(shí)間字段作為時(shí)戳(如表中已有相應(yīng)的時(shí)間字段,可以不必添加),每當(dāng)OLTP系統(tǒng)中更新修改業(yè)務(wù)數(shù)據(jù)時(shí),同時(shí)修改時(shí)戳字段值。當(dāng)作ETL加載時(shí),通過(guò)系統(tǒng)時(shí)間與時(shí)戳字段的比較來(lái)決定進(jìn)行何種數(shù)據(jù)抽取。優(yōu)點(diǎn):ETL系統(tǒng)設(shè)計(jì)清晰,源數(shù)據(jù)抽取相對(duì)清楚簡(jiǎn)單,速度快??梢詫?shí)現(xiàn)數(shù)據(jù)的遞增加載。缺點(diǎn):時(shí)戳維護(hù)需要由OLTP系統(tǒng)完成,需要修改原OLTP系統(tǒng)中業(yè)務(wù)表結(jié)構(gòu);且所有添加時(shí)戳的表,在業(yè)務(wù)系統(tǒng)中,數(shù)據(jù)發(fā)生變化時(shí),同時(shí)更新時(shí)戳字段,需要對(duì)原OLTP系統(tǒng)業(yè)務(wù)操作程序作修改,工作量大,改動(dòng)面大,風(fēng)險(xiǎn)大。日志表方式在OLTP系統(tǒng)中添加系統(tǒng)日志表,當(dāng)業(yè)務(wù)數(shù)據(jù)發(fā)生變化時(shí),更新維護(hù)日志表內(nèi)容,當(dāng)作ETL加載時(shí),通過(guò)讀日志表數(shù)據(jù)決定加載那些數(shù)據(jù)及如何加載。優(yōu)點(diǎn):不需要修改OLTP表結(jié)構(gòu),源數(shù)據(jù)抽取清楚,速度較快??梢詫?shí)現(xiàn)數(shù)據(jù)的遞增加載。缺點(diǎn):日志表維護(hù)需要由OLTP系統(tǒng)完成,需要對(duì)OLTP系統(tǒng)業(yè)務(wù)操作程序作修改,記錄日志信息。日志表維護(hù)較為麻煩,對(duì)原有系統(tǒng)有較大影響。工作量較大,改動(dòng)較大。有一定風(fēng)險(xiǎn)。全表比對(duì)方式在ETL過(guò)程中,抽取所有源數(shù)據(jù),并進(jìn)行相應(yīng)規(guī)則轉(zhuǎn)換,完成后先不插入目標(biāo),而對(duì)每條數(shù)據(jù)進(jìn)行目標(biāo)表比對(duì)。根據(jù)主鍵值進(jìn)行插入與更新的判定,目標(biāo)表已存在該主鍵值的,表示該記錄已有,并進(jìn)行其余字段比對(duì),如有不同,進(jìn)行Update操作,如目標(biāo)表沒(méi)有存在該主鍵值,表示該記錄還沒(méi)有,即進(jìn)行Insert操作。優(yōu)點(diǎn):對(duì)已有系統(tǒng)表結(jié)構(gòu)不產(chǎn)生影響,不需要修改業(yè)務(wù)操作程序,所有抽取規(guī)則由ETL完成,管理維護(hù)統(tǒng)一,可以實(shí)現(xiàn)數(shù)據(jù)的遞增加載。沒(méi)有風(fēng)險(xiǎn)。缺點(diǎn):ETL比對(duì)較復(fù)雜,設(shè)計(jì)較為復(fù)雜,速度較慢全表刪除插入方式每次ETL操作均刪除目標(biāo)表數(shù)據(jù),由ETL全新加載數(shù)據(jù)。優(yōu)點(diǎn):ETL加載規(guī)則簡(jiǎn)單,速度快缺點(diǎn):對(duì)于維表加代理鍵不適應(yīng),當(dāng)OLTP系統(tǒng)產(chǎn)生刪除數(shù)據(jù)操作時(shí),OLAP層將不會(huì)記錄到所刪除的歷史數(shù)據(jù)。不可以實(shí)現(xiàn)數(shù)據(jù)的遞增加載。當(dāng)作系統(tǒng)數(shù)據(jù)加載策略方案時(shí),基于以上所列方法,及現(xiàn)有系統(tǒng)考慮:(1)、如果所集成OLTP系統(tǒng)為其他產(chǎn)商產(chǎn)品,則應(yīng)盡量的降低因ETL而對(duì)現(xiàn)有系統(tǒng)產(chǎn)生的影響,及系統(tǒng)風(fēng)險(xiǎn)性。而性能的影響則可以通過(guò)兩方面解決,一部分由硬件的升級(jí)進(jìn)行解決,因?yàn)镋TL除讀表及寫(xiě)表操作外,所有轉(zhuǎn)換均由ETL服務(wù)器在內(nèi)存中完成,故高配置服務(wù)器將大大提升ETL運(yùn)行速度;一部分由加載時(shí)機(jī)進(jìn)行控制,加載時(shí)機(jī)采取在系統(tǒng)較為空閑時(shí)加載,同時(shí)并行多個(gè)加載等,可以降低對(duì)運(yùn)行系統(tǒng)的影響。所以可以使用全表比對(duì)遞增加載數(shù)據(jù)的方式作為此類(lèi)系統(tǒng)的ETL數(shù)據(jù)加載規(guī)則。(2)、如果原OLTP系統(tǒng)為自己開(kāi)發(fā)產(chǎn)品,此次所作OLAP系統(tǒng)為在原系統(tǒng)上的系統(tǒng),則可以考慮使用時(shí)輟或日志表方式,區(qū)別僅為對(duì)原系統(tǒng)的影響大小。(3)、當(dāng)數(shù)據(jù)實(shí)現(xiàn)遞增加載時(shí),OLAP系統(tǒng)中的聚合表,可由OLAP中的事實(shí)表數(shù)據(jù)二次ETL產(chǎn)生,此時(shí)由于OLAP數(shù)據(jù)的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 胸肌最快鍛煉計(jì)劃
- 人教版高中物理選擇性必修第二冊(cè)楞次定律的理解及推論課件
- 2025年小班語(yǔ)言標(biāo)準(zhǔn)教案《小老鼠睡覺(jué)》 2
- 2025至2030年中國(guó)山梨酸鉀食品添加劑數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)涼肉車(chē)數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)全自動(dòng)后踵按摩機(jī)數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)中小辦公環(huán)境解決方案數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)不干膠底紙數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 制劑處方篩選行業(yè)跨境出海戰(zhàn)略研究報(bào)告
- 醇酸樹(shù)脂類(lèi)型絕緣水性涂料企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級(jí)戰(zhàn)略研究報(bào)告
- 2025海南省交通投資控股限公司招聘30人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 宋代美學(xué)研究
- 行政管理學(xué)知識(shí)點(diǎn)全套
- 船舶安全管理培訓(xùn)課件
- 《工業(yè)機(jī)器人現(xiàn)場(chǎng)編程》課件-任務(wù)3.涂膠機(jī)器人工作站
- 供應(yīng)鏈管理(第2版)課件:常用的供應(yīng)鏈管理方法
- 腰椎手術(shù)的疑難討論
- 中英文對(duì)照版 ASTM B594 2019 鋁合金形變產(chǎn)品超聲波檢測(cè)標(biāo)準(zhǔn)慣例
- 五年級(jí)下冊(cè)道德與法治教學(xué)計(jì)劃
- 2025屆高考數(shù)學(xué)專(zhuān)項(xiàng)復(fù)習(xí):阿基米德三角形【六大題型】含答案
- 高中語(yǔ)文2021學(xué)年專(zhuān)題復(fù)習(xí)-外國(guó)文學(xué)訓(xùn)練題【含詳解】
評(píng)論
0/150
提交評(píng)論