Python程序設(shè)計(jì)與財(cái)務(wù)應(yīng)用(微課版)課件 第6章 數(shù)據(jù)分析與可視化_第1頁(yè)
Python程序設(shè)計(jì)與財(cái)務(wù)應(yīng)用(微課版)課件 第6章 數(shù)據(jù)分析與可視化_第2頁(yè)
Python程序設(shè)計(jì)與財(cái)務(wù)應(yīng)用(微課版)課件 第6章 數(shù)據(jù)分析與可視化_第3頁(yè)
Python程序設(shè)計(jì)與財(cái)務(wù)應(yīng)用(微課版)課件 第6章 數(shù)據(jù)分析與可視化_第4頁(yè)
Python程序設(shè)計(jì)與財(cái)務(wù)應(yīng)用(微課版)課件 第6章 數(shù)據(jù)分析與可視化_第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Python程序設(shè)計(jì)與財(cái)務(wù)應(yīng)用(微課版)第6章

數(shù)據(jù)分析與可視化知識(shí)目標(biāo)1.掌握簡(jiǎn)單的5種數(shù)據(jù)分析方法;2.掌握使用Matplotlib繪制單個(gè)圖形的方法;3.掌握使用Matplotlib繪制組合圖和子圖的方法。技能目標(biāo)1.能夠用簡(jiǎn)單的5種數(shù)據(jù)分析方法完成相關(guān)財(cái)務(wù)數(shù)據(jù)分析;2.能夠?qū)⒂嘘P(guān)財(cái)務(wù)數(shù)據(jù)以單個(gè)圖形的形式直觀地呈現(xiàn)出來(lái);3.能夠通過(guò)組合圖或子圖的形式,將多個(gè)(有關(guān)聯(lián)的)圖形同時(shí)在一個(gè)屏幕內(nèi)有序展示,以便更直觀地把握財(cái)務(wù)數(shù)據(jù)整體情況。學(xué)習(xí)目標(biāo)章節(jié)導(dǎo)圖思考題1.如何使用Python做簡(jiǎn)單的數(shù)據(jù)分析?2.對(duì)于表格型財(cái)務(wù)數(shù)據(jù),使用Python也可以像Excel一樣做出漂亮的圖形嗎?章節(jié)導(dǎo)讀CONTENTS數(shù)據(jù)分析01.02.Matplotlib繪圖基礎(chǔ)03.繪圖進(jìn)階數(shù)據(jù)分析01.使用pandas進(jìn)行簡(jiǎn)單數(shù)據(jù)分析的方法包括分組分析、分布分析、交叉分析、結(jié)構(gòu)分析和相關(guān)分析等,下面分別介紹。6.1.1分組分析6分組分析是根據(jù)分組的列的值,將分析對(duì)象劃分成不同的部分,以對(duì)比分析各部分之間的差異性的一種數(shù)據(jù)分析方法。分組分析有以下兩種常用的語(yǔ)法格式。6.1.1分組分析7【例6-1】先按部門和員工類別分組統(tǒng)計(jì)獎(jiǎng)金和實(shí)發(fā)合計(jì)的平均值,再按部門統(tǒng)計(jì)獎(jiǎng)金的總和、標(biāo)準(zhǔn)差和中位數(shù)。(代碼位置:資源\第6章)6.1.2分布分析8分布分析是先將定量數(shù)據(jù)進(jìn)行等距或者不等距的分組,然后研究各組分布規(guī)律的一種數(shù)據(jù)分析方法。分布分析的語(yǔ)法格式如下。【例6-2】首先對(duì)公司所有員工的獎(jiǎng)金進(jìn)行分段,將其分成'2000元以下'、'2001~3000元'、'3001~4000元'、'4001~5000元'及'5000元以上'5個(gè)區(qū)間,然后顯示每個(gè)人獎(jiǎng)金所處的區(qū)間及各區(qū)間的人數(shù)。(代碼位置:資源\第6章)6.1.3交叉分析9交叉分析是用于分析兩個(gè)或兩個(gè)以上分組變量之間的關(guān)系,以交叉表形式表示變量間關(guān)系的一種數(shù)據(jù)分析方法。常用的交叉分析的語(yǔ)法格式如下。其參數(shù)說(shuō)明如下。values:表示數(shù)據(jù)透視表中對(duì)指定列進(jìn)行透視(交叉統(tǒng)計(jì)分析)。index:表示數(shù)據(jù)透視表中以指定列的值作為行分組。columns:表示數(shù)據(jù)透視表中以指定列的值作為列分組。aggfunc:表示用于交叉分析的統(tǒng)計(jì)函數(shù)。fill_value:表示對(duì)統(tǒng)計(jì)產(chǎn)生的NaN用指定值統(tǒng)一替換?!纠?-3】首先統(tǒng)計(jì)公司各部門、各員工類別中男、女員工的人數(shù),然后統(tǒng)計(jì)公司各部門中男、女員工獎(jiǎng)金的平均值和中位數(shù)。(代碼位置:資源\第6章)6.1.4結(jié)構(gòu)分析10結(jié)構(gòu)分析是在分組分析以及交叉分析的基礎(chǔ)上,計(jì)算各組成部分所占比例的一種數(shù)據(jù)分析方法。常用的結(jié)構(gòu)分析的語(yǔ)法格式如下?!纠?-4】統(tǒng)計(jì)各門店中每種產(chǎn)品的銷售額相對(duì)于該產(chǎn)品銷售總額的占比(按行計(jì)算占比),以及各門店中每種產(chǎn)品的銷售額相對(duì)于該門店中所有產(chǎn)品銷售額的占比(按列計(jì)算占比)。(代碼位置:資源\第6章)6.1.5相關(guān)分析11相關(guān)分析是研究變量(字段、列)之間是否存在某種依存關(guān)系,并對(duì)具有依存關(guān)系的變量分析其相關(guān)方向以及相關(guān)程度的一種數(shù)據(jù)分析方法。為了更準(zhǔn)確地度量變量之間的相關(guān)程度,我們引入相關(guān)系數(shù)。相關(guān)系數(shù)是一種可以用來(lái)描述變量之間的相關(guān)程度的值。相關(guān)系數(shù)與相關(guān)程度之間的關(guān)系如表6-1所示。6.1.5相關(guān)分析12常用的相關(guān)分析的語(yǔ)法格式如下?!纠?-5】現(xiàn)有某公司某段時(shí)間內(nèi)廣告曝光量和費(fèi)用成本的數(shù)據(jù)表,通過(guò)相關(guān)分析計(jì)算其廣告曝光量與費(fèi)用成本之間的相關(guān)系數(shù)。(代碼位置:資源\第6章)6.1.6課堂實(shí)驗(yàn)——電商數(shù)據(jù)分析13【實(shí)驗(yàn)內(nèi)容】現(xiàn)有電商銷售數(shù)據(jù)工作簿,統(tǒng)計(jì)各銷售區(qū)域中每個(gè)銷售渠道的銷售額相對(duì)于該銷售渠道銷售總額的占比,并統(tǒng)計(jì)各銷售區(qū)域中每個(gè)銷售渠道的銷售額相對(duì)于該銷售區(qū)域中所有銷售渠道的銷售總額的占比。(代碼位置:資源\第6章)【實(shí)驗(yàn)思路】①使用數(shù)據(jù)透視表統(tǒng)計(jì)各銷售區(qū)域、銷售渠道的銷售額;②統(tǒng)計(jì)各銷售區(qū)域中,每個(gè)銷售渠道的銷售額相對(duì)于該銷售渠道銷售總額的占比;③統(tǒng)計(jì)各銷售區(qū)域中,每個(gè)銷售渠道的銷售額相對(duì)于該銷售區(qū)域中所有銷售渠道的銷售總額的占比。Matplotlib繪圖基礎(chǔ)02.Matplotlib是一個(gè)功能非常強(qiáng)大的Python繪圖庫(kù),使用它可以將數(shù)據(jù)以圖形的形式更直觀地呈現(xiàn)出來(lái)。它含有很多子模塊,其中pyplot子模塊是Matplotlib的核心繪圖子模塊,使用它可以繪制折線圖、餅圖、柱形圖及散點(diǎn)圖等各種常見(jiàn)的圖表。需要注意的是:Matplotlib不是Python內(nèi)置庫(kù),調(diào)用前需手動(dòng)安裝。6.2.1繪制折線圖15當(dāng)我們想觀察數(shù)據(jù)指標(biāo)隨著時(shí)間的變化而變化的趨勢(shì)時(shí),例如,每周、每月、每年的變化趨勢(shì)是增加、減少、上下波動(dòng)還是基本不變,首選折線圖。在Matplotlib中使用pyplot子模塊的plot()函數(shù)繪制折線圖,其常用的語(yǔ)法格式如下。其中,x、y分別表示x軸和y軸的數(shù)據(jù)?!纠?-6】根據(jù)某公司的月度支出表繪制折線圖,觀察各月的支出變化情況。(代碼位置:資源\第6章)6.2.2繪制柱形圖16當(dāng)我們想觀察數(shù)據(jù)指標(biāo)之間的差異時(shí),采用柱形圖是很好的選擇。因?yàn)槔谩爸印钡母叩涂梢院苤庇^地反映數(shù)據(jù)的大小,人眼對(duì)高度差異很敏感,辨識(shí)效果非常好。在Matplotlib中使用pyplot子模塊的bar()函數(shù)繪制柱形圖,其常用的語(yǔ)法格式如下。其中,x、y分別表示x軸和y軸的數(shù)據(jù)?!纠?-7】現(xiàn)有某公司的城市投資額表,繪制柱形圖,觀察各城市投資額的差異。(代碼位置:資源\第6章)6.2.3繪制餅圖17當(dāng)我們想觀察各數(shù)據(jù)指標(biāo)占總體的比例時(shí),采用餅圖是很好的選擇。在Matplotlib中使用pyplot子模塊的pie()函數(shù)繪制餅圖,其常用的語(yǔ)法格式如下。【例6-8】現(xiàn)有某公司各門店銷售數(shù)據(jù)表,繪制餅圖,觀察各門店的銷售額占比情況。(代碼位置:資源\第6章)6.2.4課堂實(shí)驗(yàn)——繪制銷售凈利潤(rùn)折線圖18【實(shí)驗(yàn)內(nèi)容】現(xiàn)有某公司12個(gè)月的銷售凈利潤(rùn)工作簿,繪制銷售凈利潤(rùn)折線圖。(代碼位置:資源\第6章)【實(shí)驗(yàn)思路】①將銷售凈利潤(rùn)工作簿中的數(shù)據(jù)導(dǎo)入DataFrame;②通過(guò)df.columns返回DataFrame對(duì)象的列索引(即所有列標(biāo)簽),再通過(guò)tolist()函數(shù)將列索引轉(zhuǎn)換為列表;③通過(guò)df.iloc[0]獲得由第一行數(shù)據(jù)組成的Series,再通過(guò)tolist()函數(shù)將Series轉(zhuǎn)換為列表;④Matplotlib是不支持顯示中文的,添加一行代plt.rcParams['font.family']='simhei'就可以正常顯示中文了;plt.rcParams['axes.unicode_minus']=False這行代碼能使坐標(biāo)軸負(fù)數(shù)的負(fù)號(hào)在中文狀態(tài)下正常顯示;⑤通過(guò)plot()函數(shù)繪制折線圖。繪圖進(jìn)階03.當(dāng)我們需要把握數(shù)據(jù)整體情況時(shí),一個(gè)屏幕內(nèi)展示單個(gè)圖表的形式就不能滿足要求了。此時(shí),通過(guò)組合圖或子圖的形式,將多個(gè)(有關(guān)聯(lián)的)圖表同時(shí)在一個(gè)屏幕內(nèi)有序展示,就能讓我們更直觀地把握數(shù)據(jù)整體情況,從而做出相應(yīng)的決策。6.3.1繪制組合圖20繪制組合圖的代碼比較簡(jiǎn)單,將需要組合的圖表的代碼放在一起即可?!纠?-9】根據(jù)某公司電視機(jī)和冰箱兩種產(chǎn)品1~6月的銷售收入表,繪制組合折線圖,對(duì)比展示兩種產(chǎn)品的銷售收入情況。(代碼位置:資源\第6章)6.3.2繪制子圖21在介紹子圖之前,先介紹畫布(figure)。畫布類似于畫畫時(shí)預(yù)先準(zhǔn)備的圖紙,Matplotlib的所有圖表都是在畫布中繪制的。也就是說(shuō),單個(gè)折線圖、柱形圖及餅圖都是在畫布中繪制的,如圖6-1所示。6.3.2繪制子圖22前面我們之所以沒(méi)有介紹畫布這個(gè)概念,是因?yàn)樵谑褂肕atplotlib繪制圖表時(shí),畫布是默認(rèn)存在的,且有默認(rèn)尺寸。畫布的默認(rèn)尺寸(寬、高)為[6.4,4.8](單位為英寸),通常對(duì)于繪制單個(gè)且不超過(guò)默認(rèn)尺寸大小的圖表,不用設(shè)置畫布尺寸。但是對(duì)于繪制多個(gè)圖表或者超過(guò)默認(rèn)尺寸大小的圖表,例如,繪制多個(gè)子圖,就需要設(shè)置畫布尺寸。設(shè)置畫布尺寸的語(yǔ)法格式如下。6.3.2繪制子圖23前面我們之所以沒(méi)有介紹畫布這個(gè)概念,是因?yàn)樵谑褂肕atplotlib繪制圖表時(shí),畫布是默認(rèn)存在的,且有默認(rèn)尺寸。畫布的默認(rèn)尺寸(寬、高)為[6.4,4.8](單位為英寸),通常對(duì)于繪制單個(gè)且不超過(guò)默認(rèn)尺寸大小的圖表,不用設(shè)置畫布尺寸。但是對(duì)于繪制多個(gè)圖表或者超過(guò)默認(rèn)尺寸大小的圖表,例如,繪制多個(gè)子圖,就需要設(shè)置畫布尺寸。設(shè)置畫布尺寸的語(yǔ)法格式如下。6.3.2繪制子圖246.3.3課堂實(shí)驗(yàn)——繪制毛利率和凈利率組合圖25【實(shí)驗(yàn)內(nèi)容】根據(jù)某公司12個(gè)月的毛利率和凈利率表工作簿,繪制毛利率和凈利率組合圖。(代碼位置:資源\第6章)【實(shí)驗(yàn)思路】①將毛利率和凈利率工作簿中的數(shù)據(jù)導(dǎo)入DataFrame;②從月份列獲?。▁軸)月份數(shù)據(jù)列表;③從毛利率列獲取(y軸)各月份毛利率列表;④從凈利率列獲?。▂軸)各月份凈利率列表;⑤使用虛線繪制毛利率折線圖;⑥使用實(shí)線繪制凈利率折線圖;⑦為了能讓y軸按百分?jǐn)?shù)顯示,需要從Matplotlib.ticker模塊中導(dǎo)入子模塊PercentFormatter,它可將比例(如0.45)顯示為百分?jǐn)?shù)(45%),還需要執(zhí)行plt.gca().yaxis.set_major_formatter(PercentFormatter(xmax=1,decimals=0))語(yǔ)句。實(shí)訓(xùn)1繪制應(yīng)收賬款、應(yīng)付賬款組合圖【實(shí)訓(xùn)目標(biāo)】根據(jù)某公司1~12月的應(yīng)收應(yīng)付賬款表,繪制組合折線圖,對(duì)比展示應(yīng)收應(yīng)付賬款走勢(shì)。(代碼位置:資源\第6章)【實(shí)訓(xùn)思路】①?gòu)脑路萘蝎@?。▁軸)月份數(shù)據(jù)列表;②從應(yīng)收賬款列獲?。▂軸)各月份應(yīng)收賬款列表;③從應(yīng)付賬款列獲?。▂軸)各月份應(yīng)付賬款列表;④使用虛線繪制應(yīng)收賬款折線圖;⑤使用實(shí)線繪制應(yīng)付賬款折線圖。項(xiàng)目實(shí)訓(xùn)實(shí)訓(xùn)2繪制應(yīng)付賬款分析子圖項(xiàng)目實(shí)訓(xùn)【實(shí)訓(xùn)目標(biāo)】根據(jù)某公司4個(gè)季度的應(yīng)付賬款表,繪制子圖,通過(guò)柱形圖和餅圖

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論