數(shù)據(jù)計(jì)算數(shù)據(jù)分組日期處理_第1頁(yè)
數(shù)據(jù)計(jì)算數(shù)據(jù)分組日期處理_第2頁(yè)
數(shù)據(jù)計(jì)算數(shù)據(jù)分組日期處理_第3頁(yè)
數(shù)據(jù)計(jì)算數(shù)據(jù)分組日期處理_第4頁(yè)
數(shù)據(jù)計(jì)算數(shù)據(jù)分組日期處理_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)計(jì)算、數(shù)據(jù)分組、日期處理教師:亢華愛(ài)北京信息職業(yè)技術(shù)學(xué)院商務(wù)數(shù)據(jù)分析與應(yīng)用專業(yè)教學(xué)資源庫(kù)目錄Contents數(shù)據(jù)計(jì)算數(shù)據(jù)分組日期處理1PART數(shù)據(jù)計(jì)算數(shù)據(jù)計(jì)算簡(jiǎn)單計(jì)算通過(guò)對(duì)各字段進(jìn)行加、減、乘、除等四則算術(shù)運(yùn)算,計(jì)算出的結(jié)果作為新的字段,如表4-4所示。表4-4字段之間的運(yùn)算結(jié)果作為新的字段例如:數(shù)據(jù)計(jì)算數(shù)據(jù)計(jì)算數(shù)據(jù)標(biāo)準(zhǔn)化指將數(shù)據(jù)按照比例縮放,使之落入特定的區(qū)間,一般使用0-1的區(qū)間來(lái)標(biāo)準(zhǔn)化X*=(x-min)/(max-min)例如:數(shù)據(jù)計(jì)算2PART數(shù)據(jù)分組數(shù)據(jù)分組數(shù)據(jù)分組是根據(jù)數(shù)據(jù)分析對(duì)象的特征,按照一定的數(shù)據(jù)指標(biāo),把數(shù)據(jù)劃分為不同的區(qū)間來(lái)進(jìn)行研宄,以揭示其內(nèi)在的聯(lián)系和規(guī)律性。簡(jiǎn)單地說(shuō):就是新增一列,將原來(lái)的數(shù)據(jù)按照其性質(zhì)歸入新的類別中。數(shù)據(jù)分組語(yǔ)法series為需要分組的數(shù)據(jù)。bins為分組的依據(jù)數(shù)據(jù)。right為分組的時(shí)候右邊是否閉合。labels為分組的自定義標(biāo)簽,可以不自定義。cut(series,bins,right=True,labels=NULL)數(shù)據(jù)分組現(xiàn)有數(shù)據(jù)如表4-5所示,將數(shù)據(jù)進(jìn)行分組。表4-5數(shù)據(jù)分組現(xiàn)有數(shù)據(jù)如表4-5所示,將數(shù)據(jù)進(jìn)行分組數(shù)據(jù)分組3PART日期處理日期處理日期轉(zhuǎn)換是指將字符型的日期格式轉(zhuǎn)換為日期格式數(shù)據(jù)的過(guò)程to_datetime(datestring,format)format格式如下:?%Y:年份。

?%m:月份。?%d:日期。

?%H:小時(shí)。?%M:分鐘。

?%S:秒?!纠?-21】使用to_datetime(df.注冊(cè)時(shí)間,format=‘%Y/%m/%d’)轉(zhuǎn)換日期處理注意CSV的格式是否是utfB格式,否則會(huì)報(bào)錯(cuò)。另外,CSV里date的格式是文本(字符串)格式。日期處理日期格式化是指將日期型的數(shù)據(jù)按照給定的格式轉(zhuǎn)化為字符型的數(shù)據(jù)apply(lambdax:處理邏輯)處理邏輯即datetime.strftime(x,format)?!纠?-22】日期型數(shù)據(jù)轉(zhuǎn)化為字符型數(shù)據(jù)日期處理注意:當(dāng)希望將函數(shù)f應(yīng)用到DataFrame對(duì)象的行或列時(shí),可以使用.apply(f,axis=0,args=(),**kwds)方法,axis=0表示按列運(yùn)算,axis=1表示按行運(yùn)算。例如:日期處理日期處理日期抽取是指從日期格式里面抽取出需要的部分屬性。Data_perty屬性取值的相關(guān)含義如下。Second1?60秒,從1開(kāi)始到60。Minute1?60分,從1開(kāi)始到60。hour 1?24小時(shí),從1開(kāi)始到24。day 1?31日,一個(gè)月中第幾天,從1開(kāi)始到31。Month1?12月,從1開(kāi)始到12。year 年份。Weekday1?7,一周中的第幾天,從1開(kāi)始,最大為7?!纠?-23】對(duì)日期進(jìn)行抽取日期處理參考文獻(xiàn)

[1]余本國(guó).

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論