Kettle的使用基礎(chǔ)手冊(cè)_第1頁(yè)
Kettle的使用基礎(chǔ)手冊(cè)_第2頁(yè)
Kettle的使用基礎(chǔ)手冊(cè)_第3頁(yè)
Kettle的使用基礎(chǔ)手冊(cè)_第4頁(yè)
Kettle的使用基礎(chǔ)手冊(cè)_第5頁(yè)
已閱讀5頁(yè),還剩20頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Kettle使用基礎(chǔ)

1.什么是ETL

ETL,是英文Extract-Transform-Load的縮寫(xiě),用來(lái)描述將數(shù)據(jù)從來(lái)源端經(jīng)過(guò)萃?。╡xtract)、

轉(zhuǎn)置(transform),加載(load)至目的端的過(guò)程。通俗點(diǎn)講就是一大堆數(shù)據(jù),經(jīng)過(guò)ETL工

具處理之后,轉(zhuǎn)換成你需要的。

2.ETL主流的工具有哪些

?OWB(OracleWarehouseBuilder)

?ODI(OracleDataIntegrator)

?InformaticPowerCenter(Informatica公司)

?RepositoryExplorer

?AICIoudETL

?Kettle

3.Kettle簡(jiǎn)要介紹

?Kettle是?款國(guó)外開(kāi)源的ETL工具,純java編寫(xiě),可以在Window、Linux、Unix上運(yùn)

行,綠色無(wú)需安裝,數(shù)據(jù)抽取高效穩(wěn)定。

?Kettle中文名稱(chēng)叫水壺,該項(xiàng)目的主程序員MATT希望把各種數(shù)據(jù)放到一個(gè)壺里,

然后以一種指定的格式流出。

?Kettle這個(gè)ETL工具集,它允許你管理來(lái)自不同數(shù)據(jù)庫(kù)的數(shù)據(jù),通過(guò)提供一個(gè)圖形化

的用戶(hù)環(huán)境來(lái)描述你想做什么,而不是你想怎么做。

?Kettle中有兩種腳本文件,transformation和job,transformation完成針對(duì)數(shù)據(jù)的基

礎(chǔ)轉(zhuǎn)換,job則完成整個(gè)工作流的控制。

?Kettle家族目前包括4個(gè)產(chǎn)品:SpoonPan、CHEF、Kitcheno

1.Spoon:一個(gè)圖形用戶(hù)界面,用來(lái)運(yùn)行transformation(轉(zhuǎn)換)和job(任務(wù)),其

^transformation是用Pan工具來(lái)運(yùn)行,任務(wù)是用Kitchen來(lái)運(yùn)行°

2.Pan:一個(gè)數(shù)據(jù)轉(zhuǎn)換引擎,主要用來(lái)執(zhí)行數(shù)據(jù)源讀取,操作和寫(xiě)入數(shù)據(jù)等等功能。

3.Kitchen:一個(gè)運(yùn)行任務(wù)(利用XML或數(shù)據(jù)資源庫(kù)描述)的工具。

?SPOON允許你通過(guò)圖形界面來(lái)設(shè)計(jì)ETL轉(zhuǎn)換過(guò)程(Transformation)。

?我們主要介紹的就是kettle中spoon這款產(chǎn)品應(yīng)用。

4.Kettle常見(jiàn)用途及特點(diǎn)

Kettle是一款非常靈活的產(chǎn)品,可以幫用戶(hù)做很多事,包括:

>不同數(shù)據(jù)庫(kù)或應(yīng)用之間的數(shù)據(jù)遷移。

>可以充分利用云、齊群、并行處理向數(shù)據(jù)庫(kù)中插入大數(shù)據(jù)集。

>復(fù)雜的數(shù)據(jù)清洗。

>支持Hadoop(非關(guān)系型數(shù)據(jù)庫(kù))功能,包括hadoop工作計(jì)劃和執(zhí)行,簡(jiǎn)單hadoop

mapreduce設(shè)計(jì)。

Kettle作為一款開(kāi)源產(chǎn)品,有其本身的特點(diǎn),包括:

>安全簡(jiǎn)單,只需要配置jdk環(huán)境,然后將下載的文件解壓即可

>純java實(shí)現(xiàn),可以跨平臺(tái)應(yīng)用

>數(shù)據(jù)處理效率非常高,平均可以到達(dá)4000條/秒以上。

>使用簡(jiǎn)單,提供界面組件的形式,用戶(hù)只需要拖動(dòng)頁(yè)面上面的組件,根據(jù)自己的思

路進(jìn)行組合即可。因此對(duì)于了解計(jì)算機(jī)而非開(kāi)發(fā)人員,也可以使用此工具進(jìn)行數(shù)據(jù)

處理。

>支持插件,用戶(hù)可以自己擴(kuò)充功能。

>企業(yè)數(shù)據(jù)集成服務(wù),提供包括job和轉(zhuǎn)換的歷史版本管理以及安全的集成、計(jì)劃及

內(nèi)容管理。

>基于流的引擎架構(gòu)為我們處理大數(shù)據(jù)量提供了可能性。

5.Kettle的安裝

?要運(yùn)行kettle工具必須安裝Sun公司的JAVA運(yùn)行環(huán)境,kettle4.2.0需要運(yùn)行java1.6

或者更高版本,Kettle的卜.載可以到http:〃/取得最新版本°kettle

不需要安裝,安裝好java環(huán)境后,在操作系統(tǒng)環(huán)境變量path中配置jre路徑,把kettle

工具壓縮包解壓后可直接使用。

?要注意的是如果您的系統(tǒng)是64位,那么對(duì)應(yīng)的jdk版本也要是64位,否則將無(wú)法

運(yùn)行kettle。而kettle本身已經(jīng)做到windows與linux、32位與64位兼容。

6.運(yùn)行Spoon

?找到解壓后的這個(gè)目錄pdi-ce-4.4.0-stable\data-integration

?下面是在不同的平臺(tái)上運(yùn)行Spoon所支持的腳本:Spoon.bat:在windows平臺(tái)運(yùn)行

SpoonoSpoon.sh:在Linux、AppleOSX、Solaris平臺(tái)運(yùn)行Spcon。

7.資源庫(kù)介紹

?資源庫(kù)是用來(lái)保存轉(zhuǎn)換任務(wù)的,用戶(hù)通過(guò)圖形界面創(chuàng)建的的轉(zhuǎn)換任務(wù)可以保存在

資源庫(kù)中。資源庫(kù)可以使多用戶(hù)共享轉(zhuǎn)換任務(wù),轉(zhuǎn)換任務(wù)在資源庫(kù)中是以文件夾形

式分組管理的,用戶(hù)可以自定義文件夾名稱(chēng)。資源庫(kù)有兩種形式:

?一、Kettledatabaserepository,即保存在各種常見(jiàn)的數(shù)據(jù)庫(kù)資源庫(kù)類(lèi)型,用戶(hù)通過(guò)

用戶(hù)名/密碼來(lái)訪(fǎng)問(wèn)資源庫(kù)中的資源,默認(rèn)的用戶(hù)名/密碼是admin/adminguest/guest

?二、Kettlefilerepository,保存在服務(wù)器硬盤(pán)文件夾內(nèi)的資源庫(kù)類(lèi)型,此類(lèi)型的資源

庫(kù)無(wú)需用戶(hù)進(jìn)行登錄,直接進(jìn)行操作。

8.創(chuàng)建資源庫(kù)

?在此我以文件資源庫(kù)為例,給大家介紹一下如何創(chuàng)建文件資源庫(kù)。在上圖中點(diǎn)擊創(chuàng)

建文件資源的欄目。在basedirectory對(duì)應(yīng)的欄目。

?點(diǎn)擊確定,再點(diǎn)擊。k將進(jìn)入到spoon的主界面,他是一個(gè)圖形化的操作界面,用起

來(lái)非常的簡(jiǎn)單。主界面如下圖:

?Spoon(jftWXWJ

文件MWBT??l,停於

”口Z?XM?O?QP■■?<*1—r?twX“?

9.轉(zhuǎn)換和任務(wù)介紹

?一、轉(zhuǎn)換轉(zhuǎn)換其實(shí)就是一個(gè)數(shù)據(jù)清洗的過(guò)程,在轉(zhuǎn)換過(guò)程中包含的主要元素有:

1.輸入(excel、文本、數(shù)據(jù)庫(kù)、xmkcvs等輸入)

2.輸出(excel、文本、數(shù)據(jù)庫(kù)、xmkcvs等輸入)

3.轉(zhuǎn)換(字符處理、添加字段、值映射、字段拆分、字段選擇等)

?二、任務(wù)就是類(lèi)似與。rade中的job,我們只要將任務(wù)關(guān)聯(lián)到轉(zhuǎn)換,然后設(shè)置任務(wù)

的執(zhí)行情況,這樣spoon就可以進(jìn)行自動(dòng)化處理了。

10.轉(zhuǎn)換

10.1.輸入

輸入

CSVfile

型cub

DataGrid

Emailmessagesinput

會(huì)

1Excel輸入

Fixedfileinput

$

Generaterandomcreditcard

Generaterandomvalue

GetdatafromXML

GetFileNames

GetFilesRowsCount

Getrepositorynames

-GetSubFoldernames

Gettablenames

JGoogleAnalytics

QGZIPCSVInput

QHL7Input

IJsonInput

TDAPTnpn?

LDIFInput

1Loadfilecontentinmemory

2MicrosoftAccessInput

3MondrianInput

4OLAPInput

PropertyInput

RSSInput

:S3CSV輸入

SalesforceInput

6SAPInput

SASInput

XBase輸入

XMLInputStream6tAX)

2YamiInput

寸木卡性蛤入

如上圖,kettle可以支持很多方式的輸入,但這里主要講解一下幾個(gè)常用的輸入,其它

輸入大同小異。

>文本輸入

1)■文本文件輸入將比圖標(biāo)拖到右邊空白處,雙擊此圖標(biāo)將彈出下面這個(gè)界面,

按下面四個(gè)步驟進(jìn)行配置,即可將文本文件輸入。

[aw/

A表輸入

表輸入是指以其它數(shù)據(jù)庫(kù)為數(shù)據(jù)源,再對(duì)這叱數(shù)據(jù)源的數(shù)據(jù)進(jìn)行清洗.將變表輸入

拖入到右邊空白處,對(duì)于表輸入可以分為下面幾個(gè)步驟:

1)查看是否將輸入表的數(shù)據(jù)驅(qū)動(dòng)包放到

pdi-ce-4.4.0-stable\data-integration\libext\JDBC這個(gè)目錄下面,如果沒(méi)有,則需要下

載對(duì)應(yīng)數(shù)據(jù)庫(kù)的驅(qū)動(dòng)包到此目錄下面。

>Excel輸入

Excel導(dǎo)入,是以excel作為數(shù)據(jù)源,通過(guò)kettle數(shù)據(jù)處理后,導(dǎo)出到其它存儲(chǔ)格式中。

將&Excel輸入拖入到右邊空白處,并雙擊,得到的結(jié)果如下圖:

因Excel*人

Addslutt(t)[17京*excel文|

文伸,工作取內(nèi)gt*快處理人心肉衣耽麥頭f'SL

…I

s?\長(zhǎng)反去除空格類(lèi)as格式苜而符號(hào)小數(shù)分蛆

虹所鈾士中教職工花名冊(cè)20kliStringng*

Stringnone

—“SFtErinBenone

3、

[喉9)I[取清(C)]

10.2.輸出

輸出就是源輸入的目的地,最后我們可以將數(shù)據(jù)輸出到文件、數(shù)據(jù)庫(kù)表、json格式輸出

等等。支持的輸出有:

日。輸出

AutomaticDocumentationOutput

/Cube輸出

@Jsonoutput

期LDAPOutput

#MicrosoftAccessOutput

MicrosoftExcelOutput

用JMicrosoftExcelWriter

CPentahoReportingOutput

步PropertiesOutput

S)RSSOutput

包SalesforceDelete

私SalesforceInsert

&SalesforceUpdate

&SalesforceUpsert

SQLFileOutput

Synchronizeaftermerge

況XM刪*

o/更新

…c新

L.出

由于輸出與輸入具有相似性,所以在這里就不介紹具體的用法了。

10.3.連接

連接主要的用法,將不同的數(shù)據(jù)源的數(shù)據(jù)進(jìn)行合并,可以大大的降低異構(gòu)系統(tǒng)的差異性,

給我們數(shù)據(jù)清洗帶來(lái)極大的方便。

>Merge

連接字段#連接字段

1

“第一個(gè)步驟”選擇導(dǎo)入的“輸入表”或“輸入文件”

“第二個(gè)步驟”選擇導(dǎo)入的“輸入表”或“輸入文件”

“連接類(lèi)型”是內(nèi)連接外連接做連接有連接。

安得連接字段]I獲得連接字段

[確定Q)]|取消?]

“獲得連接字段”是根據(jù)什么字段進(jìn)行連接,結(jié)果和數(shù)據(jù)庫(kù)的連接結(jié)果一樣,(如果結(jié)

果多了,可能是連接的字段那邊有幾個(gè)樣的行是相同的)

>SortedMerge(儲(chǔ)存合并)

把兩個(gè)表一樣的列,合并到一起(一樣的列他自己就接到后邊了,不用去設(shè)置,他根據(jù)你

的字段名自己去找),輸出時(shí)候可以輸出多出來(lái)的字段,一個(gè)表的字段與

另一個(gè)表的字段內(nèi)容接到一起時(shí)候,輸出列的沒(méi)有同名的話(huà),輸出null;

reFere;name;code;method

22;22

23;23

44

55;55

66;66

77;77

88;88

99;99

1();1010;10

50;1;1;1

原圖1;

reFere;name;code;method

2222

2323

4444

5555

6666

7777

8888

9999

10;1010;10

50;1;1;1

原圖2;

b*eFere;nanecode;method

02:020202

02;030203

02;020202

02;030203

04;040404

04;040404

05;050565

05;050505

06;060606

06;060606

07;070707

07;070707

08;080808

08;080808

09;090909

09;090909

10;101010

10;101010

50;010101

結(jié)果:50;010101

文本文件輸入2

Fi<14?

Asctndinc

reftrt

Fieldname”哪個(gè)字段排序。

文本輸出設(shè)置

文本文件侯出口回向

步驟名標(biāo)—a

文件內(nèi)容物

,名林類(lèi)型格式長(zhǎng)度質(zhì)度貨市小數(shù)分坦TrimTypeSull

1r?f?r?Integer20不去披空格

2n?*?Integer20本去拉空格

3codeInteger20木去接空格

4nethodInteger20本去拉空格

>合并記錄

這個(gè)和上邊的基本一樣,但是效率沒(méi)上邊的高,不同點(diǎn)是,這個(gè)合并時(shí)候進(jìn)行比較,會(huì)多

出來(lái)個(gè)字段,并判斷數(shù)據(jù)是否有變更

refere;name;code;method

2222

2323

4444

5555

6666

7777

8888

9999

1("1010;10

(舊的)原圖1:50;1;1;1

refere;name;code;method

2222

2323

4444

5555

6666

7777

8888

9999

1(J;101O;10

50;1;1;1

(新的)原圖2:70;1;1;1

refere;namecode;method;FlagField

02;02;0202;identical

02;63;0203;identical

04;04;0404;identical

05;05;0505;identical

06;06;0606identical

07;07;07071identical

08;08;0808;identical

09;09;0909;identical|

10;10;101O;identical

50;01;0101identical

70;01;0101;new

結(jié)果:

文本文件輸入2

■公并行

EME2

關(guān)鍵字段和數(shù)據(jù)字段試了幾個(gè)效果一樣,有待在深入研究。

>記錄關(guān)聯(lián)(笛卡爾輸出)

reFere;name;code;method

22;22

23;23

44;,4

55;55

66;66

77;77

88;88

99;99

1();1010;10

原圖1:

reFere;name;code;nethod

2;2;2;2

2:3:2:3

4;4;4;4

5;5;5;5

6;6;6;6

7;7;7;7

8;8;8;8

9;9;9;9

10;10;10;10

50;1;1;1

原圖2:

reFere;namecode;method

50;01;0101

50;01;0101

50;01;0101

50;01;0101

50;01;0101

50;01;0101

SO;01;0101

50;01;0101

50;01;0101

50;01;0101

50;01;0101

結(jié)果:

文本文件輸入2

■joinrows□0?

步驟名稱(chēng)

曲目錄avaiotnpdir%%

Il刷文件前嫌

確定9)]|取洎?|

“Mainsteptoreadfrom,,這個(gè)我測(cè)試,選擇文件大小小點(diǎn)的文件速度快些。

條件:”可■以加一些輸出的條件。

10.4.轉(zhuǎn)換

1?.r-1j.z4USplitfieldtorows\

io.4.i.splitfieldtorows(:-..)(這個(gè)的功能就是把一列【必

須是string型的】按標(biāo)點(diǎn)或字符拆分開(kāi),拆分成的生成新的列)原圖

id;name

1;sunchao,sishen,moshou

2;sunchaosishen,moshou

|v

結(jié)果

|id;name;split_name

1;sunchao,sishen.moshou;sunchao

1;sunchao,sishen,moshou;sishen

1;sunchao,sishen,moshou;moshou

2;sunchao,sishen,moshou;sunchao

2;sunchao,sishen.moshou;sishen

2;sunchao,sishen,moshou;moshou

Includerownuminoutput?|~|Kiwnwnfieldname|Splitnamesplitname?

ResetRownumateachinputrow?[

"Fieldtosplit”選擇要的拆分字段

delimiter"定界符一按什么去拆分這個(gè)字段

"newfieldname”拆分出來(lái)的字段的名字

10.4.2.去掉重復(fù)記錄(》去除重復(fù)記錄)

文件3)

(id;name

11

22

33

44

原圖4

“增加計(jì)數(shù)器到輸出”調(diào)勾的話(huà)時(shí)就增加計(jì)數(shù)器,把字段的重自:的數(shù)量輸出出來(lái)

“計(jì)算器字段”給字?jǐn)?shù)器起名

#字段名稱(chēng)忽略大小寫(xiě)

1nameN

“字段名稱(chēng)”選擇要去重復(fù)的字段,這個(gè)輸出的原理是選擇了就把這?列重復(fù)的都去掉,在

這行的別的列不重復(fù)的也去掉,增加計(jì)數(shù)器的話(huà),在后邊在多出來(lái)一列,顯示

去掉的行數(shù)的幾個(gè)

10.4.3.增加常量(口!增加常量)(就是增加一列,列的值是自己給定的,

行數(shù)是按別的列的最大行數(shù)給出的)

|id;name

1;1

2;2

3:3

原圖

idname;test

11;a

22;a

33;a

結(jié)果

步驟名稱(chēng)增加常量

*▲名稱(chēng)類(lèi)型格式長(zhǎng)度精確當(dāng)???10進(jìn)制的祖值

1testString1a

“名稱(chēng)”增加常量的字段名

“類(lèi)型”得到的結(jié)果的類(lèi)型

“值”增加的常量是什么

10.4.4.增加序列(帝增加序列)(就是加個(gè)序列1一一n)

id;name

1;1

2;2

3:3

原圖

name;ualuename

1

22

33

步驟名稱(chēng)隔

值的名稱(chēng)valuenaine

使用數(shù)據(jù)庫(kù)來(lái)生成序列

使用DB來(lái)獲取sequence?口

數(shù)據(jù)庫(kù)連接—|

模式名稱(chēng)

Sequeuee名稱(chēng)S.Qw

使用轉(zhuǎn)換計(jì)數(shù)器來(lái)生成序列

計(jì)數(shù)器名稱(chēng)可選)

起始值

增長(zhǎng)根據(jù)

最大值

這個(gè)沒(méi)什么說(shuō)的我用的都是“使用轉(zhuǎn)換計(jì)數(shù)器來(lái)生成序列”基本都不行調(diào)

10.4.5.字段選擇

22

3:3

原圖"

IDNAME

11

22

33

4

結(jié)果

步驟名稱(chēng)

選擇和修改、一移除元數(shù)據(jù)

字段

獲取選擇的字段

|列映射

包含未指定的列,按名稱(chēng)排序□

“選擇和修改”選擇你要改名的字段。

“改名成”修改成你想要的名稱(chēng)

這個(gè)只能輸出你選擇了的字段,如果不寫(xiě)name的話(huà)出的時(shí)候就只能得到id的字段

10.4.6.拆分字段

id;name

1;sunchao/sishen/moshou

原圖2;sunchao/sishen/moshou

|id;1;2;4;5

1;sunchao;sishen;noshou;

2;sunchao;sishen;noshou;

結(jié)果

步舞名麻:國(guó)賓。i

需要折分的字段*9.

分隔符/

TG_________________________________

*新的字段ID移除IS類(lèi)型長(zhǎng)度格式分娼D.CI.UCurr.n<y缺省期蚯格類(lèi)型

Strine不去撞空格

String木去技68

Striae不去楂空格

Strine不去拉空柘

“需要拆分的字段"你要分的字段

“分隔符”按什么去拆分

?新的手段ID移除ID?類(lèi)21長(zhǎng)精度格分DecimalCuN4去除空格類(lèi)型

HI..........H”…蟹哂........................................................不去腔格…

22NString不去拍空格

34XString不去掉空格

45NString不去撞空格

“新的字段”你拆分出來(lái)的字段給其起個(gè)名,拆分出來(lái)幾個(gè)字段就起幾個(gè)名,(注意:

類(lèi)型一定要填寫(xiě),要不會(huì)報(bào)錯(cuò))

10.4.7.排序記錄(給記錄按升序降序排列的)

id;name

1;sunchao/sishen/moshou

2;sunchao/sishen/moshou

原圖

id;name

2;sunchao/sishen/moshou

結(jié)果1;sunchao/sishen/moshou

步驟名稱(chēng)陶曜R(shí)______________________________________________________________

排序目錄|陽(yáng)i。、tmpdirOi1?[瀏覽?…

臨時(shí)文件前頻|out

排序緩存大?。▋?nèi)存里存放的記錄數(shù))150000伶

未使用內(nèi)存限值⑹|25HopinfectionUtn:!傳

壓縮臨時(shí)文件?金口+沈考?支磐需出4

僅僅傳遞非重復(fù)的記錄?(僅僅校驗(yàn)關(guān)鍵字)口Status:Enabled

字段:

字段名稱(chēng)升序大小寫(xiě)敏感

id否否

“僅僅傳遞非重復(fù)的記錄”就是去掉這個(gè)字段的重復(fù)的記錄,(只要是這個(gè)字段的重復(fù)記

錄就去掉,同行的不是重

復(fù)的也去掉)

字段名稱(chēng)升序大小寫(xiě)破期

id否否

“字段名稱(chēng)”你要排序的字段

“升序”就是你要排序的方式

10.4.8.換轉(zhuǎn)列

groupString

keyInteger

unit_nameString

unitid

下邊的列

0USCars1100

1USTrucks1200

2USBoats1300

3USConstruction1400

4USAero1500

5USSpace1600

6USMedical1700

8EMEA0EMEACars2105

9EMEA1EMEATrucks2205

10EMEA2EMEABoats2305

11EMEA3EMEAConstruction2405

12EMEA4EMEAAero2505

13EMEA5EMEASpace2605

14EMEA6EMEAMedical2705

15Asi&0AsiaCars3101

16Asia1AsiaTrucks3201

17Asia2AsiaBoats3301

18Asia3AsiaConstruction3401

19Asia4AsiaAero3501

20Asia5AsiaSpace3601

原圖21Asia6AsiaMedical3701

group;Haiel;Kaiel;H)ne2;Haar3;相觸;NaneS;H謝;UnitIH;UnitlM;Unit叱Unit匾;UnitWh;UnitiOS;毗M

fisia;AsuCars;AsiaTricks;AsiaBoats;AsiaConstructioi;AsiaHero;isiaSpace;AsiaHedical;BDN101;00113211;BOO;8993W;BOI的II;MSfiUI;HQ聊QI

ElfA;EIUCars;EtfAMs;EKHBoats州AConstructioi;EKAAero:EHEASpace;ENEiMedical;BNC1K;SIN22K;0805;蜩根;膩哪;Q愀也ms

US;U$Urs;USTncts;DSBoats;IISConstructin;U$Hero;l$Space;IKMini;NB11H;㈣2加;姍㈣NtlUt;㈣酒帆1刪0881700

步驟名痂F;>wd,non?』iKil

關(guān)粳字段ky

構(gòu)成分蛆的字段:

分蛆字段[與取字段|

1group

目標(biāo)手段

目存字段Value美援字值類(lèi)型格式化長(zhǎng)度精度c[圓a-誨字段]

Sti

-nr

1ManeOansSui3So

-nr35

2ManelsStio

-nr3S

3Stio

35堯

-nr

4Hane3ftnStio

nr堯

5NonM-AnsSo

ntri

6Nso5-^Sto

nri357

7N,”下-dIno

idte7

8VnitIDOInte70

dG

9VnitIDlItc70

10VnitlDS,-dI0

idnte7

11VnitUGiIt0

-dAe7

12VnitID4iIt0

_dne7

13Un久IDSInt40

1

14UxutlDS.0

“關(guān)鍵字”一般為主見(jiàn),唯一的。

“分組字段”按什么分組

“目標(biāo)字段”輸出的結(jié)果的字段名

wvaluefieldname**把哪列進(jìn)行轉(zhuǎn)列

“關(guān)鍵字”根據(jù)什么去分的(可能是另一個(gè)有規(guī)律的列去劃分的,“目標(biāo)字段”就包含

這個(gè)列的值)

“類(lèi)型”定義一個(gè)輸出類(lèi)型

10.4.9.計(jì)算器

p.d;name;code;number

11;12;13;1U

21;22;23;24

31;32;33;34

原圖41必力

id;name;code;number;sun

11;12;13;14;36.0

21;22;23;24;66.0

31;32;33;34;96.0

結(jié)果41;42;43:44;126.0

字段:

#新字段計(jì)篁字段A字段B字段C值類(lèi)型長(zhǎng)度精確度移除

1sunA+B+CidnamecodeNumber否

“新字段”計(jì)算后的輸出的字段名

“計(jì)算”里邊寫(xiě)好的算法,選擇就行了

“字段a/字段b/字段c”你要操作的字段

“移除”是的話(huà)就是刪除你計(jì)算出來(lái)的字段,否的話(huà)就能輸出。

10.4.10.值映射(當(dāng)你要對(duì)一列進(jìn)行整理:比如month字段1到12月,你要看每

月屬于哪個(gè)季度就可以用這個(gè),然后會(huì)在表里邊多出來(lái)1列是你要的)

id1namel;code1;month

1111

2222

3333

4444

5555

6666

7777

8888

9999

1(010;10

11111;11

12;1212;12

原圖

id1;name1;code1;month;Q

01;01;0101;1

02;02;0202;1

03;03;0303;1

04;04;0404;2

05;05;0505;2

06;06;0606;2

07;07;0707;3

08;08;0808;3

09;09;0909;3

10;10;1010;4

11;11;1111;4

12;12;1212;4

結(jié)果

a

文本文件輸出

錄/:

oI碓m11。/g~I3I

“使用字段名”就是month

“目標(biāo)字段名”映射出來(lái)的新的字段的名

“源值”就是month要被映射的字段,

“目標(biāo)值”就是映射出來(lái)的值(例子:只要是前邊的值是的就映射成1)

10.4.11.numberrange(數(shù)字的范圍)比較一個(gè)字段的數(shù)字的范圍,在這個(gè)范

圍的話(huà)就在一個(gè)新的列,打印出來(lái)你定好的結(jié)果,如果不在打印出來(lái)unkonw,

找不到的打印出來(lái)的自己也可以定義是什么。

口d

namel;code1;month

1:

2

3

4

5

6:6:66

7:7:77

8

9

10;1010;10

11;1111;11

12;1212;12

原圖

id1;name1;code1;nonth;range

01;0101;01;<、于5

02;0202;92;/、于5

03;0303;03;/、于5

04;0404;04;/、于5

0

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論