




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
引入案例任務(wù)分析知識(shí)解析案例解析任務(wù)實(shí)訓(xùn)實(shí)訓(xùn)評(píng)價(jià)5.2.1數(shù)值型字段的統(tǒng)計(jì)與描述5.2.2分類型字段的統(tǒng)計(jì)與描述任務(wù)5.2利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述分析任務(wù)5.2利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述分析引入案例美創(chuàng)科技有限公司的財(cái)務(wù)人員小王想要根據(jù)企業(yè)費(fèi)用支出表.xlsx(位置:E:\file\)中的數(shù)據(jù)計(jì)算辦公費(fèi)的合計(jì)數(shù)、平均值、最大值、最小值、標(biāo)準(zhǔn)差等統(tǒng)計(jì)指標(biāo),那么小王如何利用Pandas快速計(jì)算出這些統(tǒng)計(jì)值呢?任務(wù)分析利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述,首先要確定分析數(shù)據(jù)的類型,如果是數(shù)值類型,可以直接利用統(tǒng)計(jì)指標(biāo)函數(shù)(如求和函數(shù)sum()、平均數(shù)函數(shù)mean()、最大值函數(shù)max()等),或者利用describe()函數(shù)直接進(jìn)行描述性統(tǒng)計(jì);如果是分類型數(shù)據(jù),可以利用value_counts()函數(shù)進(jìn)行統(tǒng)計(jì),或者使用describe()函數(shù)進(jìn)行統(tǒng)計(jì)分析。任務(wù)5.2利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述分析知識(shí)解析數(shù)據(jù)的統(tǒng)計(jì)與描述可以用來概括和表示數(shù)據(jù)的分布狀況,通過這些統(tǒng)計(jì)指標(biāo)可以方便的表示一組數(shù)據(jù)的集中趨勢(shì)、離散趨勢(shì)、頻數(shù)分布等特征。5.2.1數(shù)值型字段的統(tǒng)計(jì)與描述數(shù)值型字段是指該字段是用數(shù)值來描述的,如營(yíng)業(yè)收入、營(yíng)業(yè)成本、凈利潤(rùn)等。數(shù)值型字段的描述性統(tǒng)計(jì)主要包括計(jì)算最小值、最大值、均值、中位數(shù)、四分位數(shù)、極差、方差、標(biāo)準(zhǔn)差等統(tǒng)計(jì)指標(biāo)。任務(wù)5.2利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述分析一、直接利用統(tǒng)計(jì)指標(biāo)進(jìn)行計(jì)算Pandas提供了很多方法來計(jì)算數(shù)值型字段的各類指標(biāo),常用統(tǒng)計(jì)指標(biāo)如下表所示。方法名稱說明方法名稱說明mean均值max最大值median中位數(shù)min最小值mode眾數(shù)ptp極差quantile四分位數(shù)std標(biāo)準(zhǔn)差sum總和cumsum累加和skew偏度kurt峰度直接利用統(tǒng)計(jì)指標(biāo)進(jìn)行計(jì)算的語法格式:DataFrame[column].統(tǒng)計(jì)指標(biāo)任務(wù)5.2利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述分析【做中學(xué)5.2.1】讀入期間費(fèi)用表.xlsx(位置:E:\file\),實(shí)現(xiàn)如下操作:(1)對(duì)銷售費(fèi)用求和;(2)對(duì)管理費(fèi)用求平均值;(3)對(duì)財(cái)務(wù)費(fèi)用求標(biāo)準(zhǔn)差。importpandasaspd#引入Pandas模塊#讀取Excel表格數(shù)據(jù)df=pd.read_excel(r'E:\file\期間費(fèi)用表.xlsx')print('銷售費(fèi)用的和為:',df['銷售費(fèi)用'].sum())print('管理費(fèi)用的平均值為:',df['管理費(fèi)用'].mean())print('財(cái)務(wù)費(fèi)用的標(biāo)準(zhǔn)差為:',df['財(cái)務(wù)費(fèi)用'].std())【做中學(xué)5.2.1】程序如下:銷售費(fèi)用的和為:75355管理費(fèi)用的平均值為:23267.5財(cái)務(wù)費(fèi)用的標(biāo)準(zhǔn)差為:1611.3278732621475程序輸出結(jié)果如下所示:任務(wù)5.2利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述分析二、利用describe()函數(shù)進(jìn)行計(jì)算Pandas模塊提供了describe()函數(shù)用來一次性計(jì)算數(shù)值型字段的8個(gè)統(tǒng)計(jì)指標(biāo),如下表所示。方法名稱說明count非空個(gè)數(shù)mean均值std標(biāo)準(zhǔn)差min最小值25%25%分位數(shù)50%50%分位數(shù),即中位數(shù)75%75%分位數(shù)max最大值在調(diào)用describe()函數(shù)計(jì)算統(tǒng)計(jì)指標(biāo)時(shí),還可以采用describe()[i](i=0,1,2,…)的方法調(diào)用某個(gè)統(tǒng)計(jì)指標(biāo),如用describe()[0]調(diào)用第1個(gè)統(tǒng)計(jì)指標(biāo)count,如用describe()[1]調(diào)用第2個(gè)統(tǒng)計(jì)指標(biāo)mean。同時(shí),還可以用指標(biāo)名稱來調(diào)用指標(biāo),如describe()['25%'],表示調(diào)用25%分位數(shù),即調(diào)用下四分位數(shù)。任務(wù)5.2利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述分析【做中學(xué)5.2.2】讀入期間費(fèi)用表.xlsx(位置:E:\file\),使用describe()函數(shù)實(shí)現(xiàn)對(duì)財(cái)務(wù)費(fèi)用的描述性統(tǒng)計(jì)分析。importpandasaspd#引入Pandas模塊#讀取Excel表格數(shù)據(jù)df=pd.read_excel(r'E:\file\期間費(fèi)用表.xlsx')print('財(cái)務(wù)費(fèi)用的描述性統(tǒng)計(jì)指標(biāo)如下:')print(df['財(cái)務(wù)費(fèi)用'].describe())print('采用位置獲取標(biāo)準(zhǔn)差:',df['財(cái)務(wù)費(fèi)用'].describe()[2])print('采用名稱獲取標(biāo)準(zhǔn)差:',df['財(cái)務(wù)費(fèi)用'].describe()['std'])print('采用名稱獲取下四分位數(shù):',df['財(cái)務(wù)費(fèi)用'].describe()['25%'])【做中學(xué)5.2.2】程序如下:財(cái)務(wù)費(fèi)用的描述性統(tǒng)計(jì)指標(biāo)如下:count12.000000mean3963.666667std1611.327873min2047.00000025%2581.25000050%3959.50000075%5335.000000max6163.000000Name:財(cái)務(wù)費(fèi)用,dtype:float64采用位置獲取標(biāo)準(zhǔn)差:1611.3278732621475采用名稱獲取標(biāo)準(zhǔn)差:1611.3278732621475采用名稱獲取下四分位數(shù):2581.25程序輸出結(jié)果如下所示:任務(wù)5.2利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述分析5.2.2分類型字段的統(tǒng)計(jì)與描述一、利用value_counts()函數(shù)進(jìn)行統(tǒng)計(jì)分析參數(shù)說明normalize接收布爾型。表示是否按頻率顯示,默認(rèn)為False,則按頻數(shù)顯示。sort接收布爾型。表示是否對(duì)結(jié)果排序,默認(rèn)為True,會(huì)對(duì)結(jié)果進(jìn)行排序。ascending接收布爾型。表示按降序排列,還是升序排序,默認(rèn)為False,表示降序。bins接收整數(shù)。表示可以自定義分組區(qū)間,默認(rèn)為None,只適用于數(shù)值型數(shù)據(jù)。dropna接收布爾型。表示是否刪除缺失值NaN,默認(rèn)為Ture,表示刪除缺失值。任務(wù)5.2利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述分析Pandas提供了value_counts()函數(shù)用來統(tǒng)計(jì)分類型字段的頻數(shù)。value_counts()函數(shù)的語法格式如下:Series.value_counts(normalize=False,sort=True,ascending=False,bins=None,dropna=True)【做中學(xué)5.2.3】讀入銷售統(tǒng)計(jì)表.xlsx(位置:E:\file\),使用value_counts()函數(shù)統(tǒng)計(jì)不同銷售部門的員工人數(shù)?!咀鲋袑W(xué)5.2.3】解析如下:導(dǎo)入Pandas模塊和Excel表格數(shù)據(jù)。程序如下:importpandasaspd#引入Pandas模塊#讀取Excel表格數(shù)據(jù)df=pd.read_excel(r'E:\file\銷售統(tǒng)計(jì)表.xlsx')df.head()#查看前5行數(shù)據(jù)STEP01對(duì)銷售部門列的不同取值進(jìn)行頻數(shù)統(tǒng)計(jì),并按降序進(jìn)行排列。程序如下:df['銷售部門'].value_counts(ascending=False)STEP02銷售3部14銷售2部13銷售1部11Name:銷售部門,dtype:int64程序輸出結(jié)果如下所示:程序輸出結(jié)果如下所示:任務(wù)5.2利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述分析對(duì)銷售部門列的不同取值進(jìn)行頻率統(tǒng)計(jì),并按升序進(jìn)行排列。程序如下:df['銷售部門'].value_counts(normalize=True,ascending=True)STEP03銷售1部0.289474銷售2部0.342105銷售3部0.368421Name:銷售部門,dtype:float64程序輸出結(jié)果如下所示:二、利用describe()函數(shù)進(jìn)行統(tǒng)計(jì)分析Pandas中describe()函數(shù)除了可以對(duì)數(shù)值型字段進(jìn)行統(tǒng)計(jì)描述,還可以對(duì)分類型字段進(jìn)行統(tǒng)計(jì)描述。對(duì)于分類型字段,describe()函數(shù)可以統(tǒng)計(jì)分類數(shù)目、最多頻數(shù)類別等結(jié)果。describe()函數(shù)統(tǒng)計(jì)結(jié)果的含義如右表所示。方法名稱含義count表示非空數(shù)目unique表示數(shù)據(jù)的種類top表示出現(xiàn)最多的類型freq表示出現(xiàn)最多的類型的數(shù)目任務(wù)5.2利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述分析【做中學(xué)5.2.4】讀入銷售統(tǒng)計(jì)表.xlsx(位置:E:\file\),使用describe()函數(shù)對(duì)銷售部門列進(jìn)行描述統(tǒng)計(jì)。importpandasaspd#引入Pandas#讀取Excel表格數(shù)據(jù)df=pd.read_excel(r'E:\file\銷售統(tǒng)計(jì)表.xlsx')sale=df['銷售部門'].describe()sale#查看sale【做中學(xué)5.2.4】程序如下:count38unique3top銷售3部freq14Name:銷售部門,dtype:object程序輸出結(jié)果如下所示:
從程序運(yùn)行結(jié)果可以看出,對(duì)于銷售部門列有38個(gè)非空元素值,分為3個(gè)種類,分別為:銷售1部、銷售2部、銷售3部,其中出現(xiàn)非空值最多的是銷售3部,共計(jì)有14個(gè)。任務(wù)5.2利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述分析通過讀取企業(yè)費(fèi)用支出表.xlsx(位置:E:\file\)獲取數(shù)據(jù)。程序如下:importpandasaspd#導(dǎo)入Pandas模塊#讀入Excel表格數(shù)據(jù)df=pd.read_excel(r'E:\file\企業(yè)費(fèi)用支出表.xlsx')STEP01案例解析對(duì)辦公費(fèi)采用sum()、mean()、max()、min()、std()函數(shù)統(tǒng)計(jì)合計(jì)數(shù)、平均值、最大值、最小值和標(biāo)準(zhǔn)差。程序如下:print('辦公費(fèi)的合計(jì)數(shù)為:',df['辦公費(fèi)'].sum())print('辦公費(fèi)的平均值為:',df['辦公費(fèi)'].mean())print('辦公費(fèi)的最大值為:',df['辦公費(fèi)'].max())print('辦公費(fèi)的最小值為:',df['辦公費(fèi)'].min())print('辦公費(fèi)的標(biāo)準(zhǔn)差為:',df['辦公費(fèi)'].std())STEP02辦公費(fèi)的合計(jì)數(shù)為:299000辦公費(fèi)的平均值為:24916.666666666668辦公費(fèi)的最大值為:49000辦公費(fèi)的最小值為:8000辦公費(fèi)的標(biāo)準(zhǔn)差為:14100.021491494475程序輸出結(jié)果如下所示:任務(wù)5.2利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述分析任務(wù)實(shí)訓(xùn)請(qǐng)上機(jī)編寫程序?qū)崿F(xiàn)以下要求:讀取企業(yè)費(fèi)用支出表.xlsx(位置:E:\file\),對(duì)研發(fā)費(fèi)用計(jì)算平
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023-2024學(xué)年人教版高中信息技術(shù)必修二第三章第三節(jié)《 信息系統(tǒng)中的軟件》教學(xué)設(shè)計(jì)
- 大型礦山爆破拆除作業(yè)合同
- 跨區(qū)域藝術(shù)表演團(tuán)體巡回演出合同標(biāo)準(zhǔn)文本
- 跨境流動(dòng)資金借款合同書
- 購(gòu)銷合同權(quán)利義務(wù)轉(zhuǎn)讓協(xié)議
- 1認(rèn)識(shí)光 教學(xué)設(shè)計(jì)-2023-2024學(xué)年科學(xué)五年級(jí)上冊(cè)青島版
- 10 牛郎織女(一)第二課時(shí) 教學(xué)設(shè)計(jì)-2024-2025學(xué)年語文五年級(jí)上冊(cè)統(tǒng)編版
- 住酒店合同范本
- Module 2 public holidays unit 2 教學(xué)設(shè)計(jì)- 2024-2025學(xué)年外研版九年級(jí)英語上冊(cè)
- 沐足合同范本
- 核安全與核安全文化課件
- 《“健康中國(guó)2030”規(guī)劃綱要》全文健康中國(guó)2030規(guī)劃綱要全文
- 有限公司章程范本
- 培訓(xùn)山地光伏電站設(shè)計(jì)
- 第4課 視覺中的紅屋頂 課件 2022-2023學(xué)年湘美版初中美術(shù)八年級(jí)下冊(cè)
- 蛇的介紹課件
- 水磨石地面驗(yàn)收標(biāo)準(zhǔn)
- MMPI14個(gè)量表得分題目號(hào)碼
- 龍虎山正一日誦早晚課
- 2023版教科版二年級(jí)下冊(cè)科學(xué)課堂作業(yè)本參考答案
- 護(hù)士條例及相關(guān)法律法規(guī)課件
評(píng)論
0/150
提交評(píng)論