版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Kettle使用基礎(chǔ)
1.什么是ETL
ETL,是英文Extract-Transform-Load的縮寫(xiě),用來(lái)描述將數(shù)據(jù)從來(lái)源端經(jīng)過(guò)萃?。╡xtract)、
轉(zhuǎn)置(transform),加載(load)至目的端的過(guò)程。通俗點(diǎn)講就是一大堆數(shù)據(jù),經(jīng)過(guò)ETL工
具處理之后,轉(zhuǎn)換成你需要的。
2.ETL主流的工具有哪些
?OWB(OracleWarehouseBuilder)
?ODI(OracleDataIntegrator)
?InformaticPowerCenter(Informatica公司)
?RepositoryExplorer
?AICIoudETL
?Kettle
3.Kettle簡(jiǎn)要介紹
?Kettle是?款國(guó)外開(kāi)源的ETL工具,純java編寫(xiě),可以在Window、Linux、Unix上運(yùn)
行,綠色無(wú)需安裝,數(shù)據(jù)抽取高效穩(wěn)定。
?Kettle中文名稱(chēng)叫水壺,該項(xiàng)目的主程序員MATT希望把各種數(shù)據(jù)放到一個(gè)壺里,
然后以一種指定的格式流出。
?Kettle這個(gè)ETL工具集,它允許你管理來(lái)自不同數(shù)據(jù)庫(kù)的數(shù)據(jù),通過(guò)提供一個(gè)圖形化
的用戶(hù)環(huán)境來(lái)描述你想做什么,而不是你想怎么做。
?Kettle中有兩種腳本文件,transformation和job,transformation完成針對(duì)數(shù)據(jù)的基
礎(chǔ)轉(zhuǎn)換,job則完成整個(gè)工作流的控制。
?Kettle家族目前包括4個(gè)產(chǎn)品:SpoonPan、CHEF、Kitcheno
1.Spoon:一個(gè)圖形用戶(hù)界面,用來(lái)運(yùn)行transformation(轉(zhuǎn)換)和job(任務(wù)),其
^transformation是用Pan工具來(lái)運(yùn)行,任務(wù)是用Kitchen來(lái)運(yùn)行°
2.Pan:一個(gè)數(shù)據(jù)轉(zhuǎn)換引擎,主要用來(lái)執(zhí)行數(shù)據(jù)源讀取,操作和寫(xiě)入數(shù)據(jù)等等功能。
3.Kitchen:一個(gè)運(yùn)行任務(wù)(利用XML或數(shù)據(jù)資源庫(kù)描述)的工具。
?SPOON允許你通過(guò)圖形界面來(lái)設(shè)計(jì)ETL轉(zhuǎn)換過(guò)程(Transformation)。
?我們主要介紹的就是kettle中spoon這款產(chǎn)品應(yīng)用。
4.Kettle常見(jiàn)用途及特點(diǎn)
Kettle是一款非常靈活的產(chǎn)品,可以幫用戶(hù)做很多事,包括:
>不同數(shù)據(jù)庫(kù)或應(yīng)用之間的數(shù)據(jù)遷移。
>可以充分利用云、齊群、并行處理向數(shù)據(jù)庫(kù)中插入大數(shù)據(jù)集。
>復(fù)雜的數(shù)據(jù)清洗。
>支持Hadoop(非關(guān)系型數(shù)據(jù)庫(kù))功能,包括hadoop工作計(jì)劃和執(zhí)行,簡(jiǎn)單hadoop
mapreduce設(shè)計(jì)。
Kettle作為一款開(kāi)源產(chǎn)品,有其本身的特點(diǎn),包括:
>安全簡(jiǎn)單,只需要配置jdk環(huán)境,然后將下載的文件解壓即可
>純java實(shí)現(xiàn),可以跨平臺(tái)應(yīng)用
>數(shù)據(jù)處理效率非常高,平均可以到達(dá)4000條/秒以上。
>使用簡(jiǎn)單,提供界面組件的形式,用戶(hù)只需要拖動(dòng)頁(yè)面上面的組件,根據(jù)自己的思
路進(jìn)行組合即可。因此對(duì)于了解計(jì)算機(jī)而非開(kāi)發(fā)人員,也可以使用此工具進(jìn)行數(shù)據(jù)
處理。
>支持插件,用戶(hù)可以自己擴(kuò)充功能。
>企業(yè)數(shù)據(jù)集成服務(wù),提供包括job和轉(zhuǎn)換的歷史版本管理以及安全的集成、計(jì)劃及
內(nèi)容管理。
>基于流的引擎架構(gòu)為我們處理大數(shù)據(jù)量提供了可能性。
5.Kettle的安裝
?要運(yùn)行kettle工具必須安裝Sun公司的JAVA運(yùn)行環(huán)境,kettle4.2.0需要運(yùn)行java1.6
或者更高版本,Kettle的卜.載可以到http:〃/取得最新版本°kettle
不需要安裝,安裝好java環(huán)境后,在操作系統(tǒng)環(huán)境變量path中配置jre路徑,把kettle
工具壓縮包解壓后可直接使用。
?要注意的是如果您的系統(tǒng)是64位,那么對(duì)應(yīng)的jdk版本也要是64位,否則將無(wú)法
運(yùn)行kettle。而kettle本身已經(jīng)做到windows與linux、32位與64位兼容。
6.運(yùn)行Spoon
?找到解壓后的這個(gè)目錄pdi-ce-4.4.0-stable\data-integration
?下面是在不同的平臺(tái)上運(yùn)行Spoon所支持的腳本:Spoon.bat:在windows平臺(tái)運(yùn)行
SpoonoSpoon.sh:在Linux、AppleOSX、Solaris平臺(tái)運(yùn)行Spcon。
7.資源庫(kù)介紹
?資源庫(kù)是用來(lái)保存轉(zhuǎn)換任務(wù)的,用戶(hù)通過(guò)圖形界面創(chuàng)建的的轉(zhuǎn)換任務(wù)可以保存在
資源庫(kù)中。資源庫(kù)可以使多用戶(hù)共享轉(zhuǎn)換任務(wù),轉(zhuǎn)換任務(wù)在資源庫(kù)中是以文件夾形
式分組管理的,用戶(hù)可以自定義文件夾名稱(chēng)。資源庫(kù)有兩種形式:
?一、Kettledatabaserepository,即保存在各種常見(jiàn)的數(shù)據(jù)庫(kù)資源庫(kù)類(lèi)型,用戶(hù)通過(guò)
用戶(hù)名/密碼來(lái)訪(fǎng)問(wèn)資源庫(kù)中的資源,默認(rèn)的用戶(hù)名/密碼是admin/adminguest/guest
?二、Kettlefilerepository,保存在服務(wù)器硬盤(pán)文件夾內(nèi)的資源庫(kù)類(lèi)型,此類(lèi)型的資源
庫(kù)無(wú)需用戶(hù)進(jìn)行登錄,直接進(jìn)行操作。
8.創(chuàng)建資源庫(kù)
?在此我以文件資源庫(kù)為例,給大家介紹一下如何創(chuàng)建文件資源庫(kù)。在上圖中點(diǎn)擊創(chuàng)
建文件資源的欄目。在basedirectory對(duì)應(yīng)的欄目。
?點(diǎn)擊確定,再點(diǎn)擊。k將進(jìn)入到spoon的主界面,他是一個(gè)圖形化的操作界面,用起
來(lái)非常的簡(jiǎn)單。主界面如下圖:
?Spoon(jftWXWJ
文件MWBT??l,停於
”口Z?XM?O?QP■■?<*1—r?twX“?
9.轉(zhuǎn)換和任務(wù)介紹
?一、轉(zhuǎn)換轉(zhuǎn)換其實(shí)就是一個(gè)數(shù)據(jù)清洗的過(guò)程,在轉(zhuǎn)換過(guò)程中包含的主要元素有:
1.輸入(excel、文本、數(shù)據(jù)庫(kù)、xmkcvs等輸入)
2.輸出(excel、文本、數(shù)據(jù)庫(kù)、xmkcvs等輸入)
3.轉(zhuǎn)換(字符處理、添加字段、值映射、字段拆分、字段選擇等)
?二、任務(wù)就是類(lèi)似與。rade中的job,我們只要將任務(wù)關(guān)聯(lián)到轉(zhuǎn)換,然后設(shè)置任務(wù)
的執(zhí)行情況,這樣spoon就可以進(jìn)行自動(dòng)化處理了。
10.轉(zhuǎn)換
10.1.輸入
輸入
木
CSVfile
癡
入
型cub
尸
DataGrid
凹
Emailmessagesinput
會(huì)
1Excel輸入
Fixedfileinput
$
Generaterandomcreditcard
兮
Generaterandomvalue
GetdatafromXML
堂
GetFileNames
GetFilesRowsCount
氈
Getrepositorynames
稔
-GetSubFoldernames
Gettablenames
JGoogleAnalytics
QGZIPCSVInput
QHL7Input
IJsonInput
TDAPTnpn?
喧
LDIFInput
1Loadfilecontentinmemory
金
2MicrosoftAccessInput
3MondrianInput
4OLAPInput
PropertyInput
里
RSSInput
:S3CSV輸入
於
SalesforceInput
6SAPInput
SASInput
次
XBase輸入
琮
XMLInputStream6tAX)
乂
2YamiInput
寸木卡性蛤入
如上圖,kettle可以支持很多方式的輸入,但這里主要講解一下幾個(gè)常用的輸入,其它
輸入大同小異。
>文本輸入
1)■文本文件輸入將比圖標(biāo)拖到右邊空白處,雙擊此圖標(biāo)將彈出下面這個(gè)界面,
按下面四個(gè)步驟進(jìn)行配置,即可將文本文件輸入。
[aw/
A表輸入
表輸入是指以其它數(shù)據(jù)庫(kù)為數(shù)據(jù)源,再對(duì)這叱數(shù)據(jù)源的數(shù)據(jù)進(jìn)行清洗.將變表輸入
拖入到右邊空白處,對(duì)于表輸入可以分為下面幾個(gè)步驟:
1)查看是否將輸入表的數(shù)據(jù)驅(qū)動(dòng)包放到
pdi-ce-4.4.0-stable\data-integration\libext\JDBC這個(gè)目錄下面,如果沒(méi)有,則需要下
載對(duì)應(yīng)數(shù)據(jù)庫(kù)的驅(qū)動(dòng)包到此目錄下面。
>Excel輸入
Excel導(dǎo)入,是以excel作為數(shù)據(jù)源,通過(guò)kettle數(shù)據(jù)處理后,導(dǎo)出到其它存儲(chǔ)格式中。
將&Excel輸入拖入到右邊空白處,并雙擊,得到的結(jié)果如下圖:
因Excel*人
Addslutt(t)[17京*excel文|
文伸,工作取內(nèi)gt*快處理人心肉衣耽麥頭f'SL
…I
s?\長(zhǎng)反去除空格類(lèi)as格式苜而符號(hào)小數(shù)分蛆
虹所鈾士中教職工花名冊(cè)20kliStringng*
Stringnone
—“SFtErinBenone
3、
[喉9)I[取清(C)]
10.2.輸出
輸出就是源輸入的目的地,最后我們可以將數(shù)據(jù)輸出到文件、數(shù)據(jù)庫(kù)表、json格式輸出
等等。支持的輸出有:
日。輸出
AutomaticDocumentationOutput
/Cube輸出
@Jsonoutput
期LDAPOutput
#MicrosoftAccessOutput
MicrosoftExcelOutput
用JMicrosoftExcelWriter
CPentahoReportingOutput
步PropertiesOutput
S)RSSOutput
包SalesforceDelete
私SalesforceInsert
&SalesforceUpdate
&SalesforceUpsert
SQLFileOutput
Synchronizeaftermerge
況XM刪*
除
插
入
o/更新
文
本
文
更
…c新
表
輸
L.出
由于輸出與輸入具有相似性,所以在這里就不介紹具體的用法了。
10.3.連接
連接主要的用法,將不同的數(shù)據(jù)源的數(shù)據(jù)進(jìn)行合并,可以大大的降低異構(gòu)系統(tǒng)的差異性,
給我們數(shù)據(jù)清洗帶來(lái)極大的方便。
>Merge
連接字段#連接字段
1
“第一個(gè)步驟”選擇導(dǎo)入的“輸入表”或“輸入文件”
“第二個(gè)步驟”選擇導(dǎo)入的“輸入表”或“輸入文件”
“連接類(lèi)型”是內(nèi)連接外連接做連接有連接。
安得連接字段]I獲得連接字段
[確定Q)]|取消?]
“獲得連接字段”是根據(jù)什么字段進(jìn)行連接,結(jié)果和數(shù)據(jù)庫(kù)的連接結(jié)果一樣,(如果結(jié)
果多了,可能是連接的字段那邊有幾個(gè)樣的行是相同的)
>SortedMerge(儲(chǔ)存合并)
把兩個(gè)表一樣的列,合并到一起(一樣的列他自己就接到后邊了,不用去設(shè)置,他根據(jù)你
的字段名自己去找),輸出時(shí)候可以輸出多出來(lái)的字段,一個(gè)表的字段與
另一個(gè)表的字段內(nèi)容接到一起時(shí)候,輸出列的沒(méi)有同名的話(huà),輸出null;
reFere;name;code;method
22;22
23;23
44
55;55
66;66
77;77
88;88
99;99
1();1010;10
50;1;1;1
原圖1;
reFere;name;code;method
2222
2323
4444
5555
6666
7777
8888
9999
10;1010;10
50;1;1;1
原圖2;
b*eFere;nanecode;method
02:020202
02;030203
02;020202
02;030203
04;040404
04;040404
05;050565
05;050505
06;060606
06;060606
07;070707
07;070707
08;080808
08;080808
09;090909
09;090909
10;101010
10;101010
50;010101
結(jié)果:50;010101
文本文件輸入2
Fi<14?
Asctndinc
reftrt
Fieldname”哪個(gè)字段排序。
文本輸出設(shè)置
文本文件侯出口回向
步驟名標(biāo)—a
文件內(nèi)容物
,名林類(lèi)型格式長(zhǎng)度質(zhì)度貨市小數(shù)分坦TrimTypeSull
1r?f?r?Integer20不去披空格
2n?*?Integer20本去拉空格
3codeInteger20木去接空格
4nethodInteger20本去拉空格
>合并記錄
這個(gè)和上邊的基本一樣,但是效率沒(méi)上邊的高,不同點(diǎn)是,這個(gè)合并時(shí)候進(jìn)行比較,會(huì)多
出來(lái)個(gè)字段,并判斷數(shù)據(jù)是否有變更
refere;name;code;method
2222
2323
4444
5555
6666
7777
8888
9999
1("1010;10
(舊的)原圖1:50;1;1;1
refere;name;code;method
2222
2323
4444
5555
6666
7777
8888
9999
1(J;101O;10
50;1;1;1
(新的)原圖2:70;1;1;1
refere;namecode;method;FlagField
02;02;0202;identical
02;63;0203;identical
04;04;0404;identical
05;05;0505;identical
06;06;0606identical
07;07;07071identical
08;08;0808;identical
09;09;0909;identical|
10;10;101O;identical
50;01;0101identical
70;01;0101;new
結(jié)果:
文本文件輸入2
■公并行
EME2
關(guān)鍵字段和數(shù)據(jù)字段試了幾個(gè)效果一樣,有待在深入研究。
>記錄關(guān)聯(lián)(笛卡爾輸出)
reFere;name;code;method
22;22
23;23
44;,4
55;55
66;66
77;77
88;88
99;99
1();1010;10
原圖1:
reFere;name;code;nethod
2;2;2;2
2:3:2:3
4;4;4;4
5;5;5;5
6;6;6;6
7;7;7;7
8;8;8;8
9;9;9;9
10;10;10;10
50;1;1;1
原圖2:
reFere;namecode;method
50;01;0101
50;01;0101
50;01;0101
50;01;0101
50;01;0101
50;01;0101
SO;01;0101
50;01;0101
50;01;0101
50;01;0101
50;01;0101
結(jié)果:
文本文件輸入2
■joinrows□0?
步驟名稱(chēng)
曲目錄avaiotnpdir%%
Il刷文件前嫌
確定9)]|取洎?|
“Mainsteptoreadfrom,,這個(gè)我測(cè)試,選擇文件大小小點(diǎn)的文件速度快些。
條件:”可■以加一些輸出的條件。
10.4.轉(zhuǎn)換
1?.r-1j.z4USplitfieldtorows\
io.4.i.splitfieldtorows(:-..)(這個(gè)的功能就是把一列【必
須是string型的】按標(biāo)點(diǎn)或字符拆分開(kāi),拆分成的生成新的列)原圖
id;name
1;sunchao,sishen,moshou
2;sunchaosishen,moshou
|v
結(jié)果
|id;name;split_name
1;sunchao,sishen.moshou;sunchao
1;sunchao,sishen,moshou;sishen
1;sunchao,sishen,moshou;moshou
2;sunchao,sishen,moshou;sunchao
2;sunchao,sishen.moshou;sishen
2;sunchao,sishen,moshou;moshou
Includerownuminoutput?|~|Kiwnwnfieldname|Splitnamesplitname?
ResetRownumateachinputrow?[
"Fieldtosplit”選擇要的拆分字段
delimiter"定界符一按什么去拆分這個(gè)字段
"newfieldname”拆分出來(lái)的字段的名字
10.4.2.去掉重復(fù)記錄(》去除重復(fù)記錄)
文件3)
(id;name
11
22
33
44
原圖4
“增加計(jì)數(shù)器到輸出”調(diào)勾的話(huà)時(shí)就增加計(jì)數(shù)器,把字段的重自:的數(shù)量輸出出來(lái)
“計(jì)算器字段”給字?jǐn)?shù)器起名
#字段名稱(chēng)忽略大小寫(xiě)
1nameN
“字段名稱(chēng)”選擇要去重復(fù)的字段,這個(gè)輸出的原理是選擇了就把這?列重復(fù)的都去掉,在
這行的別的列不重復(fù)的也去掉,增加計(jì)數(shù)器的話(huà),在后邊在多出來(lái)一列,顯示
去掉的行數(shù)的幾個(gè)
10.4.3.增加常量(口!增加常量)(就是增加一列,列的值是自己給定的,
行數(shù)是按別的列的最大行數(shù)給出的)
|id;name
1;1
2;2
3:3
原圖
idname;test
11;a
22;a
33;a
結(jié)果
步驟名稱(chēng)增加常量
*▲名稱(chēng)類(lèi)型格式長(zhǎng)度精確當(dāng)???10進(jìn)制的祖值
1testString1a
“名稱(chēng)”增加常量的字段名
“類(lèi)型”得到的結(jié)果的類(lèi)型
“值”增加的常量是什么
10.4.4.增加序列(帝增加序列)(就是加個(gè)序列1一一n)
id;name
1;1
2;2
3:3
原圖
name;ualuename
1
22
33
步驟名稱(chēng)隔
值的名稱(chēng)valuenaine
使用數(shù)據(jù)庫(kù)來(lái)生成序列
使用DB來(lái)獲取sequence?口
數(shù)據(jù)庫(kù)連接—|
模式名稱(chēng)
Sequeuee名稱(chēng)S.Qw
使用轉(zhuǎn)換計(jì)數(shù)器來(lái)生成序列
計(jì)數(shù)器名稱(chēng)可選)
起始值
增長(zhǎng)根據(jù)
最大值
這個(gè)沒(méi)什么說(shuō)的我用的都是“使用轉(zhuǎn)換計(jì)數(shù)器來(lái)生成序列”基本都不行調(diào)
10.4.5.字段選擇
22
3:3
原圖"
IDNAME
11
22
33
4
結(jié)果
步驟名稱(chēng)
選擇和修改、一移除元數(shù)據(jù)
字段
獲取選擇的字段
|列映射
包含未指定的列,按名稱(chēng)排序□
“選擇和修改”選擇你要改名的字段。
“改名成”修改成你想要的名稱(chēng)
這個(gè)只能輸出你選擇了的字段,如果不寫(xiě)name的話(huà)出的時(shí)候就只能得到id的字段
10.4.6.拆分字段
id;name
1;sunchao/sishen/moshou
原圖2;sunchao/sishen/moshou
|id;1;2;4;5
1;sunchao;sishen;noshou;
2;sunchao;sishen;noshou;
結(jié)果
步舞名麻:國(guó)賓。i
需要折分的字段*9.
分隔符/
TG_________________________________
*新的字段ID移除IS類(lèi)型長(zhǎng)度格式分娼D.CI.UCurr.n<y缺省期蚯格類(lèi)型
Strine不去撞空格
String木去技68
Striae不去楂空格
Strine不去拉空柘
“需要拆分的字段"你要分的字段
“分隔符”按什么去拆分
?新的手段ID移除ID?類(lèi)21長(zhǎng)精度格分DecimalCuN4去除空格類(lèi)型
HI..........H”…蟹哂........................................................不去腔格…
22NString不去拍空格
34XString不去掉空格
45NString不去撞空格
“新的字段”你拆分出來(lái)的字段給其起個(gè)名,拆分出來(lái)幾個(gè)字段就起幾個(gè)名,(注意:
類(lèi)型一定要填寫(xiě),要不會(huì)報(bào)錯(cuò))
10.4.7.排序記錄(給記錄按升序降序排列的)
id;name
1;sunchao/sishen/moshou
2;sunchao/sishen/moshou
原圖
id;name
2;sunchao/sishen/moshou
結(jié)果1;sunchao/sishen/moshou
步驟名稱(chēng)陶曜R(shí)______________________________________________________________
排序目錄|陽(yáng)i。、tmpdirOi1?[瀏覽?…
臨時(shí)文件前頻|out
排序緩存大?。▋?nèi)存里存放的記錄數(shù))150000伶
未使用內(nèi)存限值⑹|25HopinfectionUtn:!傳
壓縮臨時(shí)文件?金口+沈考?支磐需出4
僅僅傳遞非重復(fù)的記錄?(僅僅校驗(yàn)關(guān)鍵字)口Status:Enabled
字段:
字段名稱(chēng)升序大小寫(xiě)敏感
id否否
“僅僅傳遞非重復(fù)的記錄”就是去掉這個(gè)字段的重復(fù)的記錄,(只要是這個(gè)字段的重復(fù)記
錄就去掉,同行的不是重
復(fù)的也去掉)
字段名稱(chēng)升序大小寫(xiě)破期
id否否
“字段名稱(chēng)”你要排序的字段
“升序”就是你要排序的方式
10.4.8.換轉(zhuǎn)列
groupString
keyInteger
unit_nameString
unitid
下邊的列
0USCars1100
1USTrucks1200
2USBoats1300
3USConstruction1400
4USAero1500
5USSpace1600
6USMedical1700
8EMEA0EMEACars2105
9EMEA1EMEATrucks2205
10EMEA2EMEABoats2305
11EMEA3EMEAConstruction2405
12EMEA4EMEAAero2505
13EMEA5EMEASpace2605
14EMEA6EMEAMedical2705
15Asi&0AsiaCars3101
16Asia1AsiaTrucks3201
17Asia2AsiaBoats3301
18Asia3AsiaConstruction3401
19Asia4AsiaAero3501
20Asia5AsiaSpace3601
原圖21Asia6AsiaMedical3701
group;Haiel;Kaiel;H)ne2;Haar3;相觸;NaneS;H謝;UnitIH;UnitlM;Unit叱Unit匾;UnitWh;UnitiOS;毗M
fisia;AsuCars;AsiaTricks;AsiaBoats;AsiaConstructioi;AsiaHero;isiaSpace;AsiaHedical;BDN101;00113211;BOO;8993W;BOI的II;MSfiUI;HQ聊QI
ElfA;EIUCars;EtfAMs;EKHBoats州AConstructioi;EKAAero:EHEASpace;ENEiMedical;BNC1K;SIN22K;0805;蜩根;膩哪;Q愀也ms
US;U$Urs;USTncts;DSBoats;IISConstructin;U$Hero;l$Space;IKMini;NB11H;㈣2加;姍㈣NtlUt;㈣酒帆1刪0881700
步驟名痂F;>wd,non?』iKil
關(guān)粳字段ky
構(gòu)成分蛆的字段:
分蛆字段[與取字段|
1group
目標(biāo)手段
目存字段Value美援字值類(lèi)型格式化長(zhǎng)度精度c[圓a-誨字段]
Sti
-nr
1ManeOansSui3So
-nr35
2ManelsStio
-nr3S
3Stio
35堯
-nr
4Hane3ftnStio
nr堯
5NonM-AnsSo
ntri
6Nso5-^Sto
nri357
7N,”下-dIno
idte7
8VnitIDOInte70
dG
9VnitIDlItc70
10VnitlDS,-dI0
idnte7
11VnitUGiIt0
-dAe7
12VnitID4iIt0
_dne7
13Un久IDSInt40
1
14UxutlDS.0
“關(guān)鍵字”一般為主見(jiàn),唯一的。
“分組字段”按什么分組
“目標(biāo)字段”輸出的結(jié)果的字段名
wvaluefieldname**把哪列進(jìn)行轉(zhuǎn)列
“關(guān)鍵字”根據(jù)什么去分的(可能是另一個(gè)有規(guī)律的列去劃分的,“目標(biāo)字段”就包含
這個(gè)列的值)
“類(lèi)型”定義一個(gè)輸出類(lèi)型
10.4.9.計(jì)算器
p.d;name;code;number
11;12;13;1U
21;22;23;24
31;32;33;34
原圖41必力
id;name;code;number;sun
11;12;13;14;36.0
21;22;23;24;66.0
31;32;33;34;96.0
結(jié)果41;42;43:44;126.0
字段:
#新字段計(jì)篁字段A字段B字段C值類(lèi)型長(zhǎng)度精確度移除
1sunA+B+CidnamecodeNumber否
“新字段”計(jì)算后的輸出的字段名
“計(jì)算”里邊寫(xiě)好的算法,選擇就行了
“字段a/字段b/字段c”你要操作的字段
“移除”是的話(huà)就是刪除你計(jì)算出來(lái)的字段,否的話(huà)就能輸出。
10.4.10.值映射(當(dāng)你要對(duì)一列進(jìn)行整理:比如month字段1到12月,你要看每
月屬于哪個(gè)季度就可以用這個(gè),然后會(huì)在表里邊多出來(lái)1列是你要的)
id1namel;code1;month
1111
2222
3333
4444
5555
6666
7777
8888
9999
1(010;10
11111;11
12;1212;12
原圖
id1;name1;code1;month;Q
01;01;0101;1
02;02;0202;1
03;03;0303;1
04;04;0404;2
05;05;0505;2
06;06;0606;2
07;07;0707;3
08;08;0808;3
09;09;0909;3
10;10;1010;4
11;11;1111;4
12;12;1212;4
結(jié)果
a
文本文件輸出
錄/:
oI碓m11。/g~I3I
“使用字段名”就是month
“目標(biāo)字段名”映射出來(lái)的新的字段的名
“源值”就是month要被映射的字段,
“目標(biāo)值”就是映射出來(lái)的值(例子:只要是前邊的值是的就映射成1)
10.4.11.numberrange(數(shù)字的范圍)比較一個(gè)字段的數(shù)字的范圍,在這個(gè)范
圍的話(huà)就在一個(gè)新的列,打印出來(lái)你定好的結(jié)果,如果不在打印出來(lái)unkonw,
找不到的打印出來(lái)的自己也可以定義是什么。
口d
namel;code1;month
1:
2
3
4
5
6:6:66
7:7:77
8
9
10;1010;10
11;1111;11
12;1212;12
原圖
id1;name1;code1;nonth;range
01;0101;01;<、于5
02;0202;92;/、于5
03;0303;03;/、于5
04;0404;04;/、于5
0
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度財(cái)務(wù)審核合同中的審計(jì)質(zhì)量控制與改進(jìn)措施
- 安徽無(wú)為尚文校2025屆中考沖刺卷生物試題含解析
- 南昌理工學(xué)院《現(xiàn)代園林生產(chǎn)技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 洛陽(yáng)商業(yè)職業(yè)學(xué)院《品牌形象設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 羅定職業(yè)技術(shù)學(xué)院《大數(shù)據(jù)綜合項(xiàng)目開(kāi)發(fā)實(shí)踐》2023-2024學(xué)年第一學(xué)期期末試卷
- 遼寧石化職業(yè)技術(shù)學(xué)院《大數(shù)據(jù)分析hadoop應(yīng)用》2023-2024學(xué)年第一學(xué)期期末試卷
- 遼寧理工學(xué)院《唐史專(zhuān)題》2023-2024學(xué)年第一學(xué)期期末試卷
- 遼寧特殊教育師范高等專(zhuān)科學(xué)校《社群傳播研究》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年上半年鄂州臨空人力資源限公司招聘工作人員【25人】易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年上半年郯城縣縣屬?lài)?guó)企業(yè)秋季招聘工作人員14人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- DLT 572-2021 電力變壓器運(yùn)行規(guī)程
- 公司沒(méi)繳社保勞動(dòng)仲裁申請(qǐng)書(shū)
- 重慶育才中學(xué)2025屆化學(xué)九上期末教學(xué)質(zhì)量檢測(cè)試題含解析
- 成都市2022級(jí)(2025屆)高中畢業(yè)班摸底測(cè)試(零診)數(shù)學(xué)試卷(含答案)
- 【云南省中藥材出口現(xiàn)狀、問(wèn)題及對(duì)策11000字(論文)】
- 服裝板房管理制度
- 河北省興隆縣盛嘉恒信礦業(yè)有限公司李杖子硅石礦礦山地質(zhì)環(huán)境保護(hù)與治理恢復(fù)方案
- 第七章力與運(yùn)動(dòng)第八章壓強(qiáng)第九章浮力綜合檢測(cè)題(一)-2023-2024學(xué)年滬科版物理八年級(jí)下學(xué)期
- 微視頻基地策劃方案
- 光伏項(xiàng)目質(zhì)量評(píng)估報(bào)告
評(píng)論
0/150
提交評(píng)論