版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
KETTLE基本知識(shí)講義1精品課件內(nèi)容KETTLE介紹KETTLE的要求環(huán)境(JDK版本)、安裝、基本操作。KETTLE的組件的類型基本說(shuō)明(作業(yè)與轉(zhuǎn)換)案例JAVASCRIPT的基本應(yīng)用KETTLE輸出日志說(shuō)明啟動(dòng)腳本說(shuō)明。2精品課件簡(jiǎn)介Kettle是一款國(guó)外開源的etl工具,純java編寫,可以在Window、Linux、Unix上運(yùn)行,綠色無(wú)需安裝,數(shù)據(jù)抽取高效穩(wěn)定。ETL是數(shù)據(jù)抽?。‥xtract)、清洗(Cleaning)、轉(zhuǎn)換(Transform)、裝載(Load)的過(guò)程。3精品課件ETL實(shí)現(xiàn)方式手工編碼,編寫腳本,Java,Python商業(yè)ETL工具軟件InformaticaIBMDataStageMicrosoftSSISOracleODI開源ETL工具軟件KettleTalendCloverETLKetl,Octopus…4精品課件Kettle基本情況源代碼下載地址:svn:///svnkettleroot/Kettle/trunk官方文檔:Bug報(bào)告地址:/browse/PDI官方論壇:/forumdisplay.php?f=135中文論壇:當(dāng)前版本:Version5.2原作者:MattLicense:4.3以前LGPL,4.3以后改為Apache25精品課件Kettle歷史2006年Kettle2.2,Kettle2.3(Kettle開源,License為L(zhǎng)GPL)2007年Kettle2.4,Kettle2.5(被Pentaho公司收購(gòu),更名為PDI)2008年Kettle3.0,Kettle3.12009年Kettle3.2(一個(gè)使用時(shí)間較長(zhǎng)的穩(wěn)定版本)2010年Kettle4.0,Kettle4.12011年Kettle4.22012年Kettle4.3,Kettle4.4(License變更為Apache2,支持大數(shù)據(jù))2013年Kettle5.02014年Kettle5.1、5.26精品課件KETTLE學(xué)習(xí)資料1./、/2.3.《KettleCookBook》4.《Pentaho3.2DataIntegrationBeginner’sGuide》5.《KettleSolution》6.Kettle源代碼7精品課件KETTLE的安裝運(yùn)行KETTLE要求先安裝JDK1.5版本或以上下載地址:http://sourceforge.jp/projects/sfnet_pentaho/releases/無(wú)需安裝下載后直接運(yùn)行spoon.bat即可8精品課件Kettle資源庫(kù)–-元數(shù)據(jù)元數(shù)據(jù)的通用概念:“描述性數(shù)據(jù)”或“數(shù)據(jù)的數(shù)據(jù)”ETL的元數(shù)據(jù):
描述ETL要執(zhí)行的任務(wù)在Kettle里元數(shù)據(jù)的存儲(chǔ)方式:資源庫(kù)資源庫(kù)包括文件資源庫(kù)、數(shù)據(jù)庫(kù)資源庫(kù)Kettle4.0以后資源庫(kù)類型可以插件擴(kuò)展XML文件ktr轉(zhuǎn)換文件的XML的根節(jié)點(diǎn)必須是<transformation>kjb作業(yè)XML的根節(jié)點(diǎn)是<job>9精品課件KETTLE的組件的類型基本說(shuō)明(作業(yè)與轉(zhuǎn)換)Kettle中有兩種腳本文件,transformation(轉(zhuǎn)換,后綴為.ktr)和job(作業(yè),后綴為.kjb),transformation完成針對(duì)數(shù)據(jù)的基礎(chǔ)轉(zhuǎn)換,好比工廠里的生產(chǎn)流水線,每個(gè)組件相當(dāng)于一個(gè)員工;job則完成整個(gè)工作流的控制,好比工廠里的管理。如果用記事本打開文件可發(fā)現(xiàn)轉(zhuǎn)換和作業(yè)都是xml類型文件。10精品課件Kettle的幾個(gè)子程序Spoon.bat:圖形界面方式啟動(dòng)作業(yè)和轉(zhuǎn)換設(shè)計(jì)器。Pan.bat:命令行方式執(zhí)行轉(zhuǎn)換。Kitchen.bat:命令行方式執(zhí)行作業(yè)。Carte.bat:啟動(dòng)web服務(wù),用于Kettle的遠(yuǎn)程運(yùn)行或集群運(yùn)行。Encr.bat:密碼加密11精品課件KETTLE的組件的類型基本說(shuō)明(作業(yè)與轉(zhuǎn)換)作業(yè):分串行執(zhí)行和并行執(zhí)行,串行執(zhí)行是先執(zhí)行完其中一條線再執(zhí)行另一條線,并行是兩條線同時(shí)執(zhí)行,同一條線上的兩個(gè)步聚會(huì)先執(zhí)行前面的再執(zhí)行后面的,每個(gè)步驟執(zhí)行結(jié)果分兩種:true(成功)/false(失敗),根據(jù)返回結(jié)果可以控制流程走向。12精品課件轉(zhuǎn)換和作業(yè)Kettle的Spoon設(shè)計(jì)器用來(lái)設(shè)計(jì)轉(zhuǎn)換(Transformation)和作業(yè)(Job)。轉(zhuǎn)換主要是針對(duì)數(shù)據(jù)的各種處理,一個(gè)轉(zhuǎn)換里可以包含多個(gè)步驟(Step)。作業(yè)是比轉(zhuǎn)換更高一級(jí)的處理流程,一個(gè)作業(yè)里包括多個(gè)作業(yè)項(xiàng)(JobEntry),一個(gè)作業(yè)項(xiàng)代表了一項(xiàng)工作,轉(zhuǎn)換也是一個(gè)作業(yè)項(xiàng)。用戶通過(guò)Spoon創(chuàng)建的轉(zhuǎn)換、作業(yè)、數(shù)據(jù)庫(kù)連接等可以保存在資源庫(kù)和XML文件中。轉(zhuǎn)換文件以ktr為擴(kuò)展名,作業(yè)文件以kjb為擴(kuò)展名資源庫(kù)可以是各種常見的數(shù)據(jù)庫(kù)。可以在Spoon中自動(dòng)創(chuàng)建資源庫(kù),資源庫(kù)默認(rèn)用戶名和密碼是admin/admin13精品課件KETTLE的組件的類型基本說(shuō)明(作業(yè)與轉(zhuǎn)換)作業(yè)流程圖說(shuō)明14精品課件KETTLE的組件的類型基本說(shuō)明(作業(yè)與轉(zhuǎn)換)轉(zhuǎn)換:一開始所有步驟同時(shí)運(yùn)行,記錄會(huì)從最前端的步驟向后傳遞,傳遞到相應(yīng)步驟則該記錄被該步驟作相應(yīng)處理,處理完成再把記錄往后傳遞,記錄傳遞分復(fù)制和分發(fā)兩種模式。15精品課件KETTLE的組件的類型基本說(shuō)明(作業(yè)與轉(zhuǎn)換)復(fù)制:把一份數(shù)據(jù)復(fù)制成多份,后面步驟各占一份。分發(fā):把一份數(shù)據(jù)平均分配給后面步驟。16精品課件KETTLE的組件的類型基本說(shuō)明(作業(yè)與轉(zhuǎn)換)在轉(zhuǎn)換組件上右鍵->顯示輸入字段(顯示輸出字段)可以查看前面步驟流過(guò)來(lái)的記錄字段情況和該字段是后面步驟傳遞的字段信息情況。17精品課件基于表對(duì)表的同步表對(duì)表同步是最基本的同步方式之一實(shí)現(xiàn)步驟:一、建立源庫(kù)連接和目標(biāo)庫(kù)連接二、使用表輸入組件進(jìn)行源表數(shù)據(jù)讀取三、對(duì)記錄進(jìn)行適配整理四、使用表輸出組件輸出到目標(biāo)表18精品課件基于表對(duì)表的同步新建一個(gè)轉(zhuǎn)換:文件->新建->轉(zhuǎn)換19精品課件基于表對(duì)表的同步20精品課件基于表對(duì)表的同步21精品課件基于表對(duì)表的同步22精品課件基于表對(duì)表的同步23精品課件基于文件到表的同步新建一個(gè)轉(zhuǎn)換流程:從文件讀取記錄插入到數(shù)據(jù)庫(kù)中24精品課件基于文件到表的同步25精品課件基于文件到表的同步26精品課件基于文件到表的同步27精品課件基于表到文件的同步新建一個(gè)轉(zhuǎn)換實(shí)現(xiàn)從表里讀取記錄生成文件28精品課件基于表到文件的同步29精品課件基于表到文件的同步30精品課件基于表到文件的同步31精品課件JAVASCRIPT的基本應(yīng)用JAVASCRIPT基本語(yǔ)法:varjsStr=“hellokello”;//定義一個(gè)字符串變量varjavaStr=newjava.lang.String(“javaString”);//java.lang.String實(shí)例writeToLog(“m”,str);//打印字符串到日志輸出varnum=1;//定義一個(gè)整型vararr=newArray();//定義一個(gè)數(shù)組無(wú)任何元素arr.push(“添加一個(gè)元素到數(shù)組未位”);vararr1=newArray(3,“FTP補(bǔ)采”);//定義一個(gè)數(shù)組
32精品課件JAVASCRIPT的基本應(yīng)用If…else語(yǔ)句varbool=true;if(bool){//bool值為trueAlert(“正確”);}else{//bool值為falseAlert(“錯(cuò)誤”);}33精品課件JAVASCRIPT的基本應(yīng)用
for語(yǔ)句vararr=newArray(1,“2”,“thisisstring”);for(vari=0;i<arr.length;i++){if(arr[i]==2){Alert(“thevalueis”+arr[i]);}}34精品課件JAVASCRIPT的基本應(yīng)用方法定義varstr=“whj”;//全局變量functionsayHello(name){
//帶一個(gè)參數(shù)的方法if(name==null)return“hello“+str;elsereturn“hello“+name;//返回一個(gè)字符串}writeToLog(“m”,sayHello());//方法調(diào)用35精品課件JAVASCRIPT的基本應(yīng)用異常處理try…catch…try{varvalue=100/0;}catch(e){thrownewjava.lang.Exception(“除數(shù)不能為0:"+e);}異常處理通常是防止未知錯(cuò)誤產(chǎn)生所采取的處理措施。異常處理的好處是你不用再絞盡腦汁去考慮各種錯(cuò)誤,這為處理某一類錯(cuò)誤提供了一個(gè)很有效的方法,使編程效率大大提高。36精品課件JAVASCRIPT的基本應(yīng)用37精品課件作業(yè)調(diào)用作業(yè)、轉(zhuǎn)換文件->新建->作業(yè)作業(yè)可以調(diào)用作業(yè),這樣方便流程控制。38精品課件作業(yè)調(diào)用作業(yè)、轉(zhuǎn)換39精品課件作業(yè)調(diào)用作業(yè)、轉(zhuǎn)換作業(yè)也可以調(diào)用轉(zhuǎn)換40精品課件作業(yè)調(diào)用作業(yè)、轉(zhuǎn)換41精品課件KETTLE自帶例子菜單:文件->從URL打開文件->samples也可以直接到KETTLE工具下的samples目錄打開42精品課件KETTLE輸出日志說(shuō)明日志輸出是檢查程序運(yùn)行情況的重要手段,也是程序維護(hù)必不可少的環(huán)節(jié)。KETTLE在日志輸出方面也有很好的控制功能。KETTLE日志輸出共分七個(gè)等級(jí):沒有日志(Nothing)、錯(cuò)誤日志(Error)、最小日志(Minimal)、基本日志(Basic)、詳細(xì)日志(Detailed)、調(diào)試日志(Debug)、行級(jí)日志(Rowlevel)。默認(rèn)為基本日志。43精品課件KETTLE輸出日志說(shuō)明Nothing:不顯示任何輸出Error:僅僅顯示錯(cuò)誤信息Minimal:使用最小的日志Basic:缺省的日志級(jí)別Detailed:給出日志輸出的細(xì)節(jié)Debug:調(diào)試目的,調(diào)試輸出Rowlevel:打印出每一行記錄的信息44精品課件KETTLE輸出日志說(shuō)明作業(yè)日志輸出說(shuō)明作業(yè)運(yùn)行狀態(tài)有兩種:true(成功)/false(失敗)。注意:失敗不代表運(yùn)行異常、出錯(cuò)。有時(shí)只是用來(lái)控制流程的一種決策、一種手段。45精品課件KETTLE輸出日志說(shuō)明程序異常退出情況46精品課件KETTLE輸出日志說(shuō)明轉(zhuǎn)換日志輸出說(shuō)明I:當(dāng)前步驟生成的記錄數(shù)(從表輸入、文件讀入)O:當(dāng)前步驟輸出的記錄數(shù)(輸出到文件、表)R:當(dāng)前步驟從前一步聚讀取的記錄數(shù)W:當(dāng)前步驟向后面步驟拋出的記錄數(shù)U:當(dāng)前步驟更新過(guò)的記錄數(shù)E:當(dāng)前步驟處理出錯(cuò)的記錄數(shù)47精品課件啟動(dòng)腳本說(shuō)明KETTLE程序啟動(dòng)分兩種,一種是作業(yè)、一種是轉(zhuǎn)換。作業(yè)調(diào)用啟動(dòng)腳本:kitchen.sh(kitchen.bat)轉(zhuǎn)換調(diào)用啟動(dòng)腳本:pan.sh(pan.bat)48精品課件Kettle運(yùn)行方式–Pan命令行參數(shù)名列表:/rep:資源庫(kù)名稱/user:資源庫(kù)用戶名/pass:資源庫(kù)密碼/trans:要啟動(dòng)的轉(zhuǎn)換名稱/dir:目錄(不要忘了前綴/)/file:要啟動(dòng)的文件名(轉(zhuǎn)換文件)/level:日志級(jí)別(Error,Nothing,Minimal,Basic,Detailed,Debug,Rowlevel)/logfile:要寫入的日志文件/listdir:列出資源庫(kù)里的目錄/listtrans:列出指定目錄下的轉(zhuǎn)換/listrep:列出可用資源庫(kù)/exprep:將資源庫(kù)里的所有對(duì)象導(dǎo)出到XML文件中/norep:不要將日志寫到資源庫(kù)中/safemode:安全模式下運(yùn)行:有額外的檢查/version:顯示轉(zhuǎn)換的版本,校訂和創(chuàng)建日期/param:設(shè)置參數(shù),參數(shù)格式<NAME>=<VALUE>,例如-param:FOO=bar/listparam:列出轉(zhuǎn)換里已經(jīng)設(shè)置好的參數(shù)。/maxloglines:內(nèi)存中保存日志的最大日志行數(shù)/maxlogtimeout:內(nèi)存中保存日志的最長(zhǎng)時(shí)間49精品課件Kettle運(yùn)行方式–Kitchen命令行參數(shù)名列表:/rep:資源庫(kù)名稱/user:資源庫(kù)用戶名/pass:資源庫(kù)密碼/job:要啟動(dòng)的作業(yè)名稱/dir:目錄(不要忘了前綴/)/file:要啟動(dòng)的文件名(轉(zhuǎn)換文件)/level:日志級(jí)別(Error,Nothing,Minimal,Basic,Detailed,Debug,Rowlevel)/logfile:要寫入的日志文件/listdir:列出資源庫(kù)里的目錄/l
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025縫紉機(jī)機(jī)器租賃合同
- 蘭州市政府2025年度合同管理創(chuàng)新試點(diǎn)合同3篇
- 2025年度酒店客房?jī)?nèi)墻乳膠漆翻新服務(wù)合同3篇
- 2025年度知識(shí)產(chǎn)權(quán)交易及投資合作協(xié)議3篇
- 二零二五年度競(jìng)業(yè)禁止機(jī)械租賃與節(jié)能技術(shù)合同3篇
- 二零二五年度跨國(guó)公司股東合伙人戰(zhàn)略合作協(xié)議3篇
- 二零二五年度航空航天出資入股協(xié)議
- 2025年度生態(tài)園林景觀設(shè)計(jì)-特色樹苗訂購(gòu)與施工合同
- 二零二五年度生物醫(yī)藥研發(fā)項(xiàng)目轉(zhuǎn)讓合同3篇
- 二零二五年度房產(chǎn)轉(zhuǎn)讓合同中的稅務(wù)籌劃及優(yōu)惠條款協(xié)議3篇
- 土地生態(tài)學(xué)智慧樹知到期末考試答案章節(jié)答案2024年?yáng)|北農(nóng)業(yè)大學(xué)
- 新概念第二冊(cè)課文和單詞
- 吾悅廣場(chǎng)商場(chǎng)開業(yè)儀式開業(yè)慶典周年慶活動(dòng)方案
- JJG 393-2018便攜式X、γ輻射周圍劑量當(dāng)量(率)儀和監(jiān)測(cè)儀
- 2023年6月新高考?xì)v史浙江卷試題真題答案解析版
- 人教新起點(diǎn)(一起)五年級(jí)英語(yǔ)上冊(cè)全冊(cè)知識(shí)點(diǎn)
- 幼兒園小班教案《墊子多玩》
- 2024年等離子切割機(jī)市場(chǎng)需求分析報(bào)告
- 高速公路服務(wù)區(qū)業(yè)態(tài)創(chuàng)新策劃書
- 市紀(jì)委跟班學(xué)習(xí)工作總結(jié)
- 速賣通運(yùn)營(yíng)工作總結(jié)
評(píng)論
0/150
提交評(píng)論