




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
負(fù)責(zé)人:鄭美容01目錄Kettle的安裝02Kettle的四大塊0304轉(zhuǎn)換Job實(shí)驗(yàn)2:kettle的安裝1Kettle的安裝1.Kettle下載我們可以找到Kettle的官網(wǎng)找到對(duì)應(yīng)的版本進(jìn)行下載。2.安裝JDK(因?yàn)镵ettle工具是建立在有JDK基礎(chǔ)之上才能運(yùn)行的)3.解壓安裝包,將其解壓得到data-integration文件夾;4.找到spoot.bat文件雙擊打開(kāi)在kettle跟目錄中找到spoon.bat文件,找到后,并雙擊運(yùn)行即可因?yàn)閗ettle是免安裝的,所以可以直接運(yùn)行即可。5.建立轉(zhuǎn)換左上角點(diǎn)擊”文件-新建-轉(zhuǎn)換“保存為demo.ktr,新建轉(zhuǎn)換后在左邊的主對(duì)象樹(shù)中建立DB連接用以連接數(shù)據(jù)庫(kù)。建立數(shù)據(jù)庫(kù)連接的過(guò)程與其他數(shù)據(jù)庫(kù)管理軟件連接數(shù)據(jù)庫(kù)類似。測(cè)試連接時(shí)報(bào)錯(cuò)時(shí),拷貝jar包:mysql-connector-java-5.1.44-bin.jar到D:\data-integration\lib目錄下。關(guān)閉spoon,重新啟動(dòng),以讓其重新加載配置。測(cè)試連接,可以正常連接。Kettle的安裝Kettle使用Kettle提供了資源庫(kù)的方式來(lái)整合所有的工作:1.創(chuàng)建一個(gè)新的transformation,點(diǎn)擊保存到本地路徑,例如保存到D:/kettle-data下,保存文件名為Trans,kettle默認(rèn)transformation文件保存后后綴名為ktr;2.創(chuàng)建一個(gè)新的job,點(diǎn)擊保存到本地路徑,例如保存到D:/kettle-data下,保存文件名為Job,kettle默認(rèn)job文件保存后后綴名為kjb;Kettle的四大塊1.Carte:Carte是一個(gè)輕量級(jí)的Web容器,用于建立專用、遠(yuǎn)程的ETLServer。2.Kitchen:工作(job)執(zhí)行器(命令行方式),一個(gè)獨(dú)立的命令行程序,用于執(zhí)行由Spoon編輯的作業(yè)。3.Spoon:轉(zhuǎn)換(transform)設(shè)計(jì)工具(GUI方式),通過(guò)圖形接口,用于編輯作業(yè)和轉(zhuǎn)換的桌面應(yīng)用。4.Span:轉(zhuǎn)換(trasform)執(zhí)行器(命令行方式),一個(gè)獨(dú)立的命令行程序,用于執(zhí)行由Spoon編輯的轉(zhuǎn)換和作業(yè)。kettle中有兩種腳本文件,transformation和job。transformation完成針對(duì)數(shù)據(jù)的基礎(chǔ)轉(zhuǎn)換,job則完成整個(gè)工作流的控制。轉(zhuǎn)換轉(zhuǎn)換的兩個(gè)相關(guān)的主要組成部分是step(步驟)和hops(節(jié)點(diǎn)連接)。轉(zhuǎn)換文件的擴(kuò)展名是.ktr。轉(zhuǎn)換(transaformation)是ETL解決方案中最主要的部分,它處理抽取、轉(zhuǎn)換、加載各種對(duì)數(shù)據(jù)行的操作。轉(zhuǎn)換包含一個(gè)或多個(gè)步驟(step),如讀取文件、過(guò)濾數(shù)據(jù)行、數(shù)據(jù)清洗或?qū)?shù)據(jù)加載到數(shù)據(jù)庫(kù)。轉(zhuǎn)換里的步驟通過(guò)跳(hop)來(lái)連接,跳定義一個(gè)單向通道,允許數(shù)據(jù)從一個(gè)步驟向另一個(gè)步驟流動(dòng)。在Kettle里,數(shù)據(jù)的單位是行,數(shù)據(jù)流就是數(shù)據(jù)行從一個(gè)步驟到另一個(gè)步驟的移動(dòng)。數(shù)據(jù)流有的時(shí)候也被稱之為記錄流。JobJobs(工作)是基于工作流模型的,協(xié)調(diào)數(shù)據(jù)源、執(zhí)行過(guò)程和相關(guān)依賴性的ETL活動(dòng)。Jobs(工作)將功能性和實(shí)體過(guò)程聚合在了一起。一個(gè)工作中展示的任務(wù)有從FTP獲取文件、核查一個(gè)必須存在的數(shù)據(jù)庫(kù)表是否存在、執(zhí)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 天津市東麗區(qū)2025年初三聯(lián)測(cè)促改英語(yǔ)試題含答案
- 江蘇省南京信息工程大學(xué)附屬小學(xué)2025年五年級(jí)數(shù)學(xué)第二學(xué)期期末檢測(cè)模擬試題含答案
- 云南省紅河市達(dá)標(biāo)名校2024-2025學(xué)年初三第五次月考化學(xué)試題試卷化學(xué)試題含解析
- 江蘇省蘇州市高新區(qū)達(dá)標(biāo)名校2025年初三下學(xué)期學(xué)習(xí)能力診斷生物試題含解析
- 浙江省寧波鄞州區(qū)重點(diǎn)中學(xué)2025年初三下學(xué)期第二次統(tǒng)測(cè)化學(xué)試題含解析
- 康平縣2025屆四年級(jí)數(shù)學(xué)第二學(xué)期期末經(jīng)典模擬試題含解析
- 智慧農(nóng)業(yè)開(kāi)啟農(nóng)業(yè)生產(chǎn)新紀(jì)元
- 天然氣運(yùn)輸合同2025年
- 住房公積金貸款合同書
- 鋁墻面板采購(gòu)合同樣本
- 2025-2030中國(guó)磁懸浮發(fā)電機(jī)行業(yè)市場(chǎng)現(xiàn)狀分析及競(jìng)爭(zhēng)格局與投資發(fā)展研究報(bào)告
- 2024年四川宜賓環(huán)球集團(tuán)有限公司招聘考試真題
- 腦出血病人護(hù)理新進(jìn)展
- SL631水利水電工程單元工程施工質(zhì)量驗(yàn)收標(biāo)準(zhǔn)第3部分:地基處理與基礎(chǔ)工程
- 2024-2025學(xué)年統(tǒng)編版七年級(jí)語(yǔ)文下冊(cè)第四單元檢測(cè)A卷(原卷+答案)
- 醫(yī)療器械操作規(guī)范與安全知識(shí)培訓(xùn)試題庫(kù)
- 安全閥培訓(xùn)課件
- 市場(chǎng)集中度與消費(fèi)者行為-全面剖析
- 2025年詩(shī)詞大賽考試指導(dǎo)題庫(kù)300題(含答案)
- 2025年河南職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)帶答案
- DB65-T 4850-2024 工貿(mào)行業(yè)企業(yè)重大安全風(fēng)險(xiǎn)認(rèn)定
評(píng)論
0/150
提交評(píng)論