2023學(xué)年完整公開(kāi)課版實(shí)驗(yàn)2kettle的安裝_第1頁(yè)
2023學(xué)年完整公開(kāi)課版實(shí)驗(yàn)2kettle的安裝_第2頁(yè)
2023學(xué)年完整公開(kāi)課版實(shí)驗(yàn)2kettle的安裝_第3頁(yè)
2023學(xué)年完整公開(kāi)課版實(shí)驗(yàn)2kettle的安裝_第4頁(yè)
2023學(xué)年完整公開(kāi)課版實(shí)驗(yàn)2kettle的安裝_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

負(fù)責(zé)人:鄭美容01目錄Kettle的安裝02Kettle的四大塊0304轉(zhuǎn)換Job實(shí)驗(yàn)2:kettle的安裝1Kettle的安裝1.Kettle下載我們可以找到Kettle的官網(wǎng)找到對(duì)應(yīng)的版本進(jìn)行下載。2.安裝JDK(因?yàn)镵ettle工具是建立在有JDK基礎(chǔ)之上才能運(yùn)行的)3.解壓安裝包,將其解壓得到data-integration文件夾;4.找到spoot.bat文件雙擊打開(kāi)在kettle跟目錄中找到spoon.bat文件,找到后,并雙擊運(yùn)行即可因?yàn)閗ettle是免安裝的,所以可以直接運(yùn)行即可。5.建立轉(zhuǎn)換左上角點(diǎn)擊”文件-新建-轉(zhuǎn)換“保存為demo.ktr,新建轉(zhuǎn)換后在左邊的主對(duì)象樹(shù)中建立DB連接用以連接數(shù)據(jù)庫(kù)。建立數(shù)據(jù)庫(kù)連接的過(guò)程與其他數(shù)據(jù)庫(kù)管理軟件連接數(shù)據(jù)庫(kù)類似。測(cè)試連接時(shí)報(bào)錯(cuò)時(shí),拷貝jar包:mysql-connector-java-5.1.44-bin.jar到D:\data-integration\lib目錄下。關(guān)閉spoon,重新啟動(dòng),以讓其重新加載配置。測(cè)試連接,可以正常連接。Kettle的安裝Kettle使用Kettle提供了資源庫(kù)的方式來(lái)整合所有的工作:1.創(chuàng)建一個(gè)新的transformation,點(diǎn)擊保存到本地路徑,例如保存到D:/kettle-data下,保存文件名為Trans,kettle默認(rèn)transformation文件保存后后綴名為ktr;2.創(chuàng)建一個(gè)新的job,點(diǎn)擊保存到本地路徑,例如保存到D:/kettle-data下,保存文件名為Job,kettle默認(rèn)job文件保存后后綴名為kjb;Kettle的四大塊1.Carte:Carte是一個(gè)輕量級(jí)的Web容器,用于建立專用、遠(yuǎn)程的ETLServer。2.Kitchen:工作(job)執(zhí)行器(命令行方式),一個(gè)獨(dú)立的命令行程序,用于執(zhí)行由Spoon編輯的作業(yè)。3.Spoon:轉(zhuǎn)換(transform)設(shè)計(jì)工具(GUI方式),通過(guò)圖形接口,用于編輯作業(yè)和轉(zhuǎn)換的桌面應(yīng)用。4.Span:轉(zhuǎn)換(trasform)執(zhí)行器(命令行方式),一個(gè)獨(dú)立的命令行程序,用于執(zhí)行由Spoon編輯的轉(zhuǎn)換和作業(yè)。kettle中有兩種腳本文件,transformation和job。transformation完成針對(duì)數(shù)據(jù)的基礎(chǔ)轉(zhuǎn)換,job則完成整個(gè)工作流的控制。轉(zhuǎn)換轉(zhuǎn)換的兩個(gè)相關(guān)的主要組成部分是step(步驟)和hops(節(jié)點(diǎn)連接)。轉(zhuǎn)換文件的擴(kuò)展名是.ktr。轉(zhuǎn)換(transaformation)是ETL解決方案中最主要的部分,它處理抽取、轉(zhuǎn)換、加載各種對(duì)數(shù)據(jù)行的操作。轉(zhuǎn)換包含一個(gè)或多個(gè)步驟(step),如讀取文件、過(guò)濾數(shù)據(jù)行、數(shù)據(jù)清洗或?qū)?shù)據(jù)加載到數(shù)據(jù)庫(kù)。轉(zhuǎn)換里的步驟通過(guò)跳(hop)來(lái)連接,跳定義一個(gè)單向通道,允許數(shù)據(jù)從一個(gè)步驟向另一個(gè)步驟流動(dòng)。在Kettle里,數(shù)據(jù)的單位是行,數(shù)據(jù)流就是數(shù)據(jù)行從一個(gè)步驟到另一個(gè)步驟的移動(dòng)。數(shù)據(jù)流有的時(shí)候也被稱之為記錄流。JobJobs(工作)是基于工作流模型的,協(xié)調(diào)數(shù)據(jù)源、執(zhí)行過(guò)程和相關(guān)依賴性的ETL活動(dòng)。Jobs(工作)將功能性和實(shí)體過(guò)程聚合在了一起。一個(gè)工作中展示的任務(wù)有從FTP獲取文件、核查一個(gè)必須存在的數(shù)據(jù)庫(kù)表是否存在、執(zhí)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論