《Python數(shù)據(jù)分析與應(yīng)用案例教程》(李兆延)教案 第13課 數(shù)據(jù)的表格分析_第1頁(yè)
《Python數(shù)據(jù)分析與應(yīng)用案例教程》(李兆延)教案 第13課 數(shù)據(jù)的表格分析_第2頁(yè)
《Python數(shù)據(jù)分析與應(yīng)用案例教程》(李兆延)教案 第13課 數(shù)據(jù)的表格分析_第3頁(yè)
《Python數(shù)據(jù)分析與應(yīng)用案例教程》(李兆延)教案 第13課 數(shù)據(jù)的表格分析_第4頁(yè)
《Python數(shù)據(jù)分析與應(yīng)用案例教程》(李兆延)教案 第13課 數(shù)據(jù)的表格分析_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

課題第13課數(shù)據(jù)的表格分析與正態(tài)分析課時(shí)2課時(shí)(90min)教學(xué)目標(biāo)知識(shí)技能目標(biāo):(1)掌握數(shù)據(jù)交叉表和透視表分析的方法(2)掌握數(shù)據(jù)正態(tài)性分析的方法(3)能對(duì)數(shù)據(jù)進(jìn)行交叉表與透視表、正態(tài)性等分析素質(zhì)目標(biāo):強(qiáng)化數(shù)據(jù)安全意識(shí),提高信息技術(shù)應(yīng)用能力教學(xué)重難點(diǎn)教學(xué)重點(diǎn):數(shù)據(jù)交叉表和透視表分析的方法教學(xué)難點(diǎn):對(duì)數(shù)據(jù)進(jìn)行交叉表與透視表、正態(tài)性等分析教學(xué)方法案例分析法、問(wèn)答法、討論法、講授法教學(xué)用具電腦、投影儀、多媒體課件、教材、文旌課堂APP教學(xué)設(shè)計(jì)第1節(jié)課:→→傳授新知(28min)→課堂實(shí)踐(10min)第2節(jié)課:→傳授新知(20min)→課堂討論(12min)→課堂小結(jié)(3min)→作業(yè)布置(2min)教學(xué)過(guò)程主要教學(xué)內(nèi)容及步驟設(shè)計(jì)意圖第一節(jié)課考勤

(2min)【教師】使用文旌課堂APP進(jìn)行簽到【學(xué)生】按照老師要求簽到培養(yǎng)學(xué)生的組織紀(jì)律性,掌握學(xué)生的出勤情況問(wèn)題導(dǎo)入(5min)【教師】提出問(wèn)題我們已經(jīng)學(xué)習(xí)了數(shù)據(jù)的統(tǒng)計(jì)分析,那么數(shù)據(jù)表格如何分析呢?【學(xué)生】思考、舉手回答通過(guò)提問(wèn)的方法,了解學(xué)生對(duì)上節(jié)課知識(shí)的掌握程度,進(jìn)而引出新知傳授新知

(28min)【教師】總結(jié)學(xué)生的回答,并引入新知,講解數(shù)據(jù)表格分析的相關(guān)知識(shí)?【教師】請(qǐng)同學(xué)們掃描二維碼學(xué)習(xí)數(shù)據(jù)表格分析,并回答以下問(wèn)題:表格分析包含哪些常用方法??【學(xué)生】掃描二維碼、思考、回答問(wèn)題?【教師】總結(jié)學(xué)生的回答,并講解新知數(shù)據(jù)的交叉表和透視表是數(shù)據(jù)分析中常用的方法。通過(guò)交叉表和透視表可以分析數(shù)據(jù)的不同變量之間存在的關(guān)系。4.3.1數(shù)據(jù)交叉表分析?【教師】提出問(wèn)題什么是數(shù)據(jù)交叉表??【學(xué)生】聆聽(tīng)、思考、主動(dòng)回答問(wèn)題?【教師】總結(jié)學(xué)生的回答,并講解新知交叉表是一種常用的分類匯總表格,可以統(tǒng)計(jì)變量交叉出現(xiàn)的頻數(shù),幫助分析變量之間的相互關(guān)系。最簡(jiǎn)單也最常用的是2×2交叉表,即兩個(gè)變量的交叉表,如性別與商品類型的關(guān)系、年齡與商品類型的關(guān)系等。?【教師】多媒體出示了crosstab()函數(shù)的一般格式(詳見(jiàn)教材),并詳細(xì)講解各部分表示的內(nèi)容Pandas提供了crosstab()函數(shù)用于制作數(shù)據(jù)交叉表,其一般格式如下。pandas.crosstab(index,columns,margins=False,margins_name='All',normalize=False)其中,index表示交叉表行字段的列;columns表示交叉表列字段的列;margins表示是否匯總交叉表的行和列,如果為True表示匯總,如果為False表示不匯總,默認(rèn)為False;margins_name表示匯總行和列的標(biāo)簽,默認(rèn)為“All”;normalize表示是否對(duì)統(tǒng)計(jì)的頻數(shù)標(biāo)準(zhǔn)化,即統(tǒng)計(jì)頻率,取True或“all”表示以總樣本數(shù)統(tǒng)計(jì)頻率,取“index”表示以行的樣本總數(shù)統(tǒng)計(jì)頻率,且只顯示列的匯總,取“columns”表示以列的樣本總數(shù)統(tǒng)計(jì)頻率,且只顯示行的匯總,取False表示不標(biāo)準(zhǔn)化,默認(rèn)為False。?【教師】按照教材步驟進(jìn)行問(wèn)題分析并進(jìn)行演示例4-7(詳見(jiàn)教材)的程序編寫步驟:首先導(dǎo)入“產(chǎn)品訂單信息表.xlsx”文件中的數(shù)據(jù);然后統(tǒng)計(jì)并匯總性別和產(chǎn)品類型的交叉頻數(shù);最后統(tǒng)計(jì)并匯總性別和產(chǎn)品類型的交叉頻率。importpandasaspdpd.set_option('display.unicode.east_asian_width',True)df=pd.read_excel('產(chǎn)品訂單信息表.xlsx')df1=pd.crosstab(index=df['性別'],columns=df['產(chǎn)品類型'])print('統(tǒng)計(jì)性別和商品類型交叉頻數(shù)的數(shù)據(jù)df1:\n',df1)df2=pd.crosstab(index=df['性別'],columns=df['產(chǎn)品類型'],margins=True)print('統(tǒng)計(jì)和匯總性別和商品類型交叉頻數(shù)的數(shù)據(jù)df2:\n',df2)df3=pd.crosstab(index=df['性別'],columns=df['產(chǎn)品類型'],margins=True,normalize=True)print('統(tǒng)計(jì)和匯總性別和商品類型交叉頻率的數(shù)據(jù)df3:\n',df3)df4=pd.crosstab(index=df['性別'],columns=df['產(chǎn)品類型'],margins=True,margins_name='總數(shù)',normalize='index')print('按行統(tǒng)計(jì)和匯總性別和商品類型交叉頻數(shù)的數(shù)據(jù)df4:\n',df4)(詳見(jiàn)教材)?【學(xué)生】觀察、記錄、理解?【學(xué)生】教師演示完成后,學(xué)生按照教材提示和教師演示進(jìn)行實(shí)際操作,并對(duì)比程序運(yùn)行結(jié)果(詳見(jiàn)教材)?【教師】巡視課堂記錄,對(duì)學(xué)生進(jìn)行個(gè)別指導(dǎo)?【教師】提出學(xué)習(xí)任務(wù):對(duì)比程序結(jié)果,進(jìn)行程序分析和結(jié)果分析。?【學(xué)生】觀察、記錄、理解、分析?【教師】總結(jié)學(xué)生的分析結(jié)果df3統(tǒng)計(jì)和匯總性別和產(chǎn)品類型的交叉頻率,與df2對(duì)比會(huì)發(fā)現(xiàn),df3計(jì)算的是基于樣本總數(shù)的頻率,如第1行第1列的數(shù)據(jù)0.4=6/15;df4按行統(tǒng)計(jì)并匯總性別和產(chǎn)品類型的交叉頻率,與df2對(duì)比會(huì)發(fā)現(xiàn),df4計(jì)算的是基于所在行樣本總數(shù)的頻率,如第1行第1列的數(shù)據(jù)0.666667=6/9。結(jié)果分析:購(gòu)買手機(jī)的客戶中,女性客戶多于男性客戶;購(gòu)買電腦的客戶中,男性客戶和女性客戶一樣多。4.3.2數(shù)據(jù)透視表分析?【教師】提出問(wèn)題什么是數(shù)據(jù)透視表??【學(xué)生】聆聽(tīng)、思考、主動(dòng)回答問(wèn)題?【教師】總結(jié)學(xué)生的回答,并講解新知透視表是一種交互式的表,它可以統(tǒng)計(jì)行字段和列字段與第3個(gè)字段的關(guān)系,如不同性別的人在不同商品上的消費(fèi)程度。?【教師】多媒體出示了pivot_table()函數(shù)的一般格式(詳見(jiàn)教材),并詳細(xì)講解各部分表示的內(nèi)容Pandas提供了pivot_table()函數(shù)用于制作數(shù)據(jù)透視表,其一般格式如下。pandas.pivot_table(data,values=None,index=None,columns=None,aggfunc='mean',margins=False,margins_name='All')其中,data表示需要分析的數(shù)據(jù);values、index和columns表示data的列標(biāo)簽,分別作為透視表的統(tǒng)計(jì)字段、行字段和列字段;aggfunc表示統(tǒng)計(jì)指標(biāo),可以取“sum”(求和)、“mean”(求均值)、“max”(求最大值)等,默認(rèn)為“mean”。【學(xué)生】聆聽(tīng)、思考、理解、記憶通過(guò)教師講解、課堂討論、多媒體演示等方式,使學(xué)生了解數(shù)據(jù)表格分析的相關(guān)內(nèi)容課堂實(shí)踐

(10min)【教師】布置實(shí)踐任務(wù)基于原始數(shù)據(jù)的產(chǎn)品訂單信息,使用透視表分析其中性別、產(chǎn)品類型和總消費(fèi)及平均消費(fèi)的關(guān)系。【學(xué)生】聆聽(tīng)、思考、討論、實(shí)踐練習(xí)【教師】總結(jié)學(xué)生實(shí)踐過(guò)程中遇到的問(wèn)題,進(jìn)行問(wèn)題分析及程序說(shuō)明問(wèn)題分析:將性別與商品類型分別作為透視表的行字段和列字段,消費(fèi)金額作為統(tǒng)計(jì)字段,并分別使用“sum”和“mean”作為統(tǒng)計(jì)指標(biāo)。參考代碼:importpandasaspdpd.set_option('display.unicode.east_asian_width',True)df=pd.read_excel('產(chǎn)品訂單信息表.xlsx')df1=pd.pivot_table(df,values='消費(fèi)金額',index='性別',columns='產(chǎn)品類型',aggfunc='sum',margins=True,margins_name='總消費(fèi)')print('統(tǒng)計(jì)和匯總性別、產(chǎn)品類型及總消費(fèi)的數(shù)據(jù)df1:\n',df1)df2=pd.pivot_table(df,values='消費(fèi)金額',index='性別',columns='產(chǎn)品類型')print('統(tǒng)計(jì)和匯總性別、產(chǎn)品類型及平均消費(fèi)的數(shù)據(jù)df2:\n',df2)。通過(guò)課堂實(shí)踐,加深學(xué)生對(duì)數(shù)據(jù)交叉表分析的理解第二節(jié)課問(wèn)題導(dǎo)入(8min)【教師】提出問(wèn)題我們已經(jīng)學(xué)習(xí)了數(shù)據(jù)排序的相關(guān)知識(shí),那么數(shù)據(jù)的正態(tài)性如何進(jìn)行分析呢?【學(xué)生】聆聽(tīng)、思考、回答問(wèn)題通過(guò)提問(wèn)的方法,引導(dǎo)學(xué)生主動(dòng)思考,激發(fā)學(xué)生的學(xué)習(xí)興趣傳授新知(20min)【教師】總結(jié)學(xué)生的回答,并引入新知,講解數(shù)據(jù)正態(tài)性分析的相關(guān)知識(shí)4.4.1數(shù)據(jù)的正態(tài)分布?【教師】請(qǐng)同學(xué)們回答以下問(wèn)題:什么是正態(tài)分布??【學(xué)生】聆聽(tīng)、思考、回答問(wèn)題?【教師】總結(jié)學(xué)生的回答,并講解新知正態(tài)分布正態(tài)分布是指隨機(jī)變量服從一個(gè)位置參數(shù)(即均值μ)和尺度參數(shù)(即標(biāo)準(zhǔn)差σ)的概率分布。正態(tài)分布在幾何上的表現(xiàn)就是正態(tài)曲線,理論上是一條中間高、兩端逐漸下降的完全對(duì)稱的鐘形曲線。?【教師】多媒體出示正態(tài)分布曲線圖(詳見(jiàn)教材),并詳細(xì)講解均值及中心位置等內(nèi)容從圖中可以看出,符合正態(tài)分布的隨機(jī)變量在μ?σ~μ+σ取值的概率為68.2%,在μ?2σ~μ+2σ取值的概率為95.4%,在μ?3σ~μ+3σ取值的概率為99.7%。當(dāng)μ為0,σ為1時(shí)為標(biāo)準(zhǔn)正態(tài)分布。正態(tài)分布的均值決定了曲線的中心位置,當(dāng)均值為0時(shí),中心位置在x軸為0的位置;當(dāng)均值大于0且絕對(duì)值越大時(shí),曲線整體右偏且離y軸越遠(yuǎn);當(dāng)均值小于0且絕對(duì)值越大時(shí),曲線整體左偏且離y軸越遠(yuǎn)。正態(tài)分布的標(biāo)準(zhǔn)差決定了曲線的形狀,標(biāo)準(zhǔn)差越大,數(shù)據(jù)分布越分散,曲線越“矮胖”;標(biāo)準(zhǔn)差越小,數(shù)據(jù)分布越集中,曲線越“高瘦”。4.4.2正態(tài)性分析數(shù)據(jù)的正態(tài)性分析可以通過(guò)偏度和峰度,以及直方圖實(shí)現(xiàn)。1.偏度和峰度?【教師】多媒體出示不同偏度的分布曲線圖(詳見(jiàn)教材),并詳細(xì)講解偏度大小對(duì)曲線的影響數(shù)據(jù)的偏度和峰度是描述數(shù)據(jù)分布與正態(tài)分布偏離程度的兩個(gè)常用統(tǒng)計(jì)指標(biāo)。(1)偏度用于描述數(shù)據(jù)分布的對(duì)稱性,正態(tài)分布的偏度為0。當(dāng)偏度大于0時(shí),稱為正偏態(tài),分布曲線出現(xiàn)右側(cè)長(zhǎng)尾;當(dāng)偏度小于0時(shí),稱為負(fù)偏態(tài),分布曲線出現(xiàn)左側(cè)長(zhǎng)尾。不同偏度的分布曲線如圖所示。?【教師】多媒體出示skew()函數(shù)格式(詳見(jiàn)教材),并詳細(xì)講解各部分的內(nèi)容Pandas提供了skew()函數(shù)用于計(jì)算數(shù)據(jù)的偏度,其一般格式如下。DataFrame.skew()?【教師】多媒體出示不同峰度的分布曲線圖(詳見(jiàn)教材),并詳細(xì)講解峰度大小對(duì)曲線的影響(2)峰度用于描述數(shù)據(jù)分布形態(tài)的陡緩程度。在實(shí)際應(yīng)用中,正態(tài)分布的峰度為0(正態(tài)分布的峰度常數(shù)為3,通常做減3處理),當(dāng)峰度大于0時(shí),為尖頂峰,分布曲線較陡峭;當(dāng)峰度小于0時(shí),為平頂峰,分布曲線較平坦。不同峰度的分布曲線如圖所示。?【教師】多媒體出示kurt()函數(shù)格式(詳見(jiàn)教材),并詳細(xì)講解各部分的內(nèi)容Pandas提供了kurt()函數(shù)用于計(jì)算數(shù)據(jù)的峰度,其一般格式如下。DataFrame.kurt()?【教師】按照教材步驟逐步分析并進(jìn)行演示例4-9(詳見(jiàn)教材)的程序編寫步驟:首先通過(guò)隨機(jī)生成兩個(gè)1~6的整數(shù)模擬拋擲骰子(10000次);然后統(tǒng)計(jì)兩個(gè)骰子拋擲數(shù)字的和,并按行標(biāo)簽升序排序;最后計(jì)算其偏度和峰度。importnumpyasnpimportpandasaspddata1=np.random.randint(1,7,10000)data2=np.random.randint(1,7,10000)arr=data1+data2df=pd.DataFrame(data1+data2)count=df.value_counts().sort_index()print('兩個(gè)骰子拋擲數(shù)字和的統(tǒng)計(jì)結(jié)果:\n',count)print('偏度:',df.skew().iloc[0])print('峰度:',df.kurt().iloc[0])(詳見(jiàn)教材)?【學(xué)生】觀察、記錄、理解?【學(xué)生】教師演示完成后,學(xué)生按照教材提示和教師演示進(jìn)行實(shí)際操作,并對(duì)比程序運(yùn)行結(jié)果(詳見(jiàn)教材)?【教師】巡視課堂記錄,對(duì)學(xué)生進(jìn)行個(gè)別指導(dǎo)?【教師】提出學(xué)習(xí)任務(wù):對(duì)比程序結(jié)果,進(jìn)行結(jié)果分析。?【學(xué)生】觀察、記錄、理解、分析?【教師】總結(jié)學(xué)生的分析結(jié)果偏度接近0,說(shuō)明沒(méi)有正偏或負(fù)偏的趨勢(shì),從統(tǒng)計(jì)頻數(shù)也可以大致看出分布是比較對(duì)稱的,分別向左右兩側(cè)逐漸均勻下降;峰度小于0,說(shuō)明中間的數(shù)據(jù)并不是非常集中,而是比較分散,是平頂曲線,從統(tǒng)計(jì)頻數(shù)也可以看出和為7的中間位置頻數(shù)最高,且兩邊的頻數(shù)慢慢減少。2.直方圖?【教師】請(qǐng)同學(xué)們回答以下問(wèn)題:什么是直方圖??【學(xué)生】聆聽(tīng)、思考、回答問(wèn)題?【教師】總結(jié)學(xué)生的回答,并講解新知正態(tài)分布直方圖是一種統(tǒng)計(jì)報(bào)告圖,由一系列高度不等的矩形柱表示數(shù)據(jù)的分布情況,通常用于分析數(shù)據(jù)是否符合正態(tài)分布,例4-9中兩個(gè)骰子拋擲的數(shù)字之和的直方圖如圖所示。從圖中可以看出,該數(shù)據(jù)符合正態(tài)分布,且分布曲線較為平坦,與例4-9計(jì)算的偏度和峰度的結(jié)果一致。?【提示】直方圖的具體內(nèi)容可參見(jiàn)第5章【學(xué)生】聆聽(tīng)、思考、理解、記錄通過(guò)教師講解和課堂討論,使學(xué)生了解數(shù)據(jù)統(tǒng)計(jì)分析的相關(guān)知識(shí),包括數(shù)值型數(shù)據(jù)統(tǒng)計(jì)分析和字符型數(shù)據(jù)統(tǒng)計(jì)分析課堂實(shí)踐(12min)【教師】提出問(wèn)題,請(qǐng)同學(xué)們分小組實(shí)踐:統(tǒng)計(jì)班級(jí)最近一次考試成績(jī),計(jì)算其偏度和峰度。聆聽(tīng)、結(jié)組、思考、討論、寫代碼、展示程序代碼及運(yùn)行結(jié)果【教師】聆聽(tīng)學(xué)生的討論結(jié)果,并查看程序運(yùn)行結(jié)果通過(guò)課堂實(shí)踐,使學(xué)生能夠了解更多關(guān)于數(shù)據(jù)正態(tài)性分析的知識(shí)課堂小結(jié)

(3

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論