4.3pandas處理數(shù)據(jù)與matplotlib模塊繪圖-【新教材】浙教版高中信息技術(shù)必修第一冊課件_第1頁
4.3pandas處理數(shù)據(jù)與matplotlib模塊繪圖-【新教材】浙教版高中信息技術(shù)必修第一冊課件_第2頁
4.3pandas處理數(shù)據(jù)與matplotlib模塊繪圖-【新教材】浙教版高中信息技術(shù)必修第一冊課件_第3頁
4.3pandas處理數(shù)據(jù)與matplotlib模塊繪圖-【新教材】浙教版高中信息技術(shù)必修第一冊課件_第4頁
4.3pandas處理數(shù)據(jù)與matplotlib模塊繪圖-【新教材】浙教版高中信息技術(shù)必修第一冊課件_第5頁
已閱讀5頁,還剩24頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第四章

數(shù)據(jù)處理與應(yīng)用1、常用表格數(shù)據(jù)的處理2、大數(shù)據(jù)處理3、大數(shù)據(jù)典型應(yīng)用人生苦短我用python學(xué)習(xí)目標(biāo):

1、了解Python常用擴(kuò)展模塊的功能。2、掌握pandas模塊的調(diào)用方法、數(shù)據(jù)結(jié)構(gòu)等基本知識(shí)。3、能使用pandas模塊對數(shù)據(jù)進(jìn)行編輯、計(jì)算和統(tǒng)計(jì)分析,并能從中提取有用信息形成結(jié)論。4、掌握matplotlib模塊的調(diào)用方法和使用matplotlib模塊對數(shù)據(jù)進(jìn)行可視化的基本方法。還記得嗎?python模塊的導(dǎo)入——import一個(gè)程序中已出現(xiàn)的一個(gè)或多個(gè)函數(shù)或模塊,引入到另一個(gè)python代碼中,從而實(shí)現(xiàn)代碼的復(fù)用。語法如下:import模塊名模塊名.函數(shù)名from模塊名import函數(shù)名python模塊的小名兒import還有更多詳細(xì)的用法,主要有以下兩種:導(dǎo)入整個(gè)模塊時(shí),也可以為模塊指定別名。

import模塊名1[as別名1]…例如:importsysassprint(s.argv[0])

from模塊名import成員名1[as別名1],…例如:fromsysimportargvasvprint(v[0])pandas處理數(shù)據(jù)

數(shù)據(jù)處理可以使用現(xiàn)成的軟件或平臺(tái),也可以通過編寫程序?qū)崿F(xiàn)。Python語言豐富的標(biāo)準(zhǔn)模塊和擴(kuò)展庫提供了許多高效靈活的函數(shù),可以幫助我們較好地進(jìn)行數(shù)據(jù)整理。

pandas數(shù)據(jù)結(jié)構(gòu)

1.Series(序列)Series類似于一維數(shù)組,由一個(gè)數(shù)組的數(shù)據(jù)和一個(gè)與數(shù)據(jù)關(guān)聯(lián)的索引(index),索引值默認(rèn)是從0起遞增的整數(shù)。frompandasimportSeries#導(dǎo)入pandas庫中Series模塊pds1=Series([1,2,3,4])pds101122334左列:index右列:valuespandas數(shù)據(jù)結(jié)構(gòu)通過指定索引的方式pds2=Series([1,2,3,4],index=['a','b','c','d'])pds2a

1b2c3d4pandas數(shù)據(jù)結(jié)構(gòu)通過字典方式創(chuàng)建data={"i1":1,"i2":2,"i3":3,"i4":4}#由于字典是無序的,因此指定索引排列順序ps3=Series(data,index=['i1','i2','i3','i4'])ps3i11i22i33i44pandas數(shù)據(jù)結(jié)構(gòu)

2.DataFrame(數(shù)據(jù)框)

DataFrame是一種類似于關(guān)系表的表格型數(shù)據(jù)結(jié)構(gòu),DataFrame對象是一個(gè)二維表格,由1個(gè)索引列(index)和若干個(gè)數(shù)據(jù)列組成。其中,每列中的元素類型必須一致,而不同的列可以擁有不同的元素類型。使用DataFrame前,需要導(dǎo)入pandas庫中的DataFrame模塊frompandasimportDataFrame

pandas數(shù)據(jù)結(jié)構(gòu)data={"name":["王曉明","李靜","田海"],"sex":["男","女","男"],"aged":[20,19,21]}#字典是無序的,因此需要通過columns指定列索引的排列順序df=DataFrame(data,columns=["name","sex","aged"])dfindexpandas數(shù)據(jù)結(jié)構(gòu)

DataFrame數(shù)據(jù)有列索引和行索引,行索引類似于關(guān)系表中每行的編號(未指定行索引的情況下,會(huì)使用0到N-1作為行索引),列索引類似于表格的列名(也稱為字段)。df1=DataFrame(data,columns=["name","sex","aged"],index=["L1","L2","L3"])df1data={"name":("張三","李四","王五","趙六"),"sex":("男","女","女","男"),"aged":(20,19,20,21),"score":(80,60,70,90)}df=DataFrame(data)#使用字典創(chuàng)建DataFrame對象dfpandas數(shù)據(jù)結(jié)構(gòu)

pandas數(shù)據(jù)結(jié)構(gòu)

DataFrame模塊提供了豐富的函數(shù),這些函數(shù)可以用來進(jìn)行行、列編輯和統(tǒng)計(jì)計(jì)算等。1.增加行增加行數(shù)據(jù)可以通過append()函數(shù)傳入字典數(shù)據(jù)即可。append_data={"name":"朱八","sex":"男","aged":23,"score":65}new_df=df.append(append_data)new_df

pandas數(shù)據(jù)結(jié)構(gòu)

2.增加列增加列可以直接通過標(biāo)簽索引方式進(jìn)行,當(dāng)新增的列中的數(shù)值不一樣時(shí),可以傳入列表或者數(shù)組結(jié)構(gòu)進(jìn)行賦值。new_df["city"]=["北京","西安","長春","珠海","昆明"]new_df

pandas數(shù)據(jù)結(jié)構(gòu)

3.刪除使用drop()函數(shù)可以刪除指定軸上的信息,原來的DataFrame數(shù)據(jù)不會(huì)刪除。new_df.drop(2)#刪除行索引是2的信息

pandas數(shù)據(jù)結(jié)構(gòu)

4.修改標(biāo)簽

通過rename()函數(shù)完成行和列索引標(biāo)簽的修改,index參數(shù)指定要修改的行標(biāo)簽,columns參數(shù)指定要修改的列標(biāo)簽。new_df.rename(index={3:2,4:3},columns={"score":"grade"})#以字典形式指定修改信息

pandas數(shù)據(jù)結(jié)構(gòu)

Matplotlib——繪圖Matplotlib—繪制精美的圖表

Matplotlib——繪圖

matplotlib中的快速繪圖的函數(shù)庫可以通過如下語句載入:接下來調(diào)用figure創(chuàng)建一個(gè)繪圖對象,并且使它成為當(dāng)前的繪圖對象。通過figsize參數(shù)可以指定繪圖對象的寬度和高度,單位為英寸;dpi參數(shù)指定繪圖對象的分辨率,即每英寸多少個(gè)像素,缺省值為80。因此本例中所創(chuàng)建的圖表窗口的寬度為8*80=640像素。importmatplotlib.pyplotaspltplt.figure(figsize=(8,4))快速繪圖接下來通過一系列函數(shù)設(shè)置繪圖對象的各個(gè)屬性:?xlabel/ylabel:設(shè)置X軸/Y軸的文字?title:設(shè)置圖表的標(biāo)題?ylim:設(shè)置Y軸的范圍?legend:顯示圖示最后調(diào)用plt.show()顯示出創(chuàng)建的所有繪圖對象。21plt.xlabel("Time(s)")plt.ylabel("Volt")plt.title("PyPlotFirstExample")plt.ylim(-1.2,1.2)plt.legend()

Matplotlib——繪圖快速繪圖

22importnumpyasnpimportmatplotlib.pyplotasplt

x=np.linspace(0,10,1000)y=np.sin(x)z=np.cos(x**2)

plt.figure(figsize=(8,4))plt.plot(x,y,label="$sin(x)$",color="red",linewidth=2)plt.plot(x,z,"b--",label="$cos(x^2)$")plt.xlabel("Time(s)")plt.ylabel("Volt")plt.title("PyPlotFirstExample")plt.ylim(-1.2,1.2)plt.legend()plt.show()

Matplotlib——繪圖快速繪圖23

Matplotlib——繪圖課堂小結(jié)import模塊名1[as別名1]…from模塊名import成員名1[as別名1],…pandas數(shù)據(jù)結(jié)構(gòu)Series(序列)DataFrame(數(shù)據(jù)框)Matplotlib——繪圖1.下列Python的模塊中,主要用于數(shù)據(jù)的處理和分析的是()A.ImageB.pandasC.scipyD.matplotlib課堂練習(xí)B課堂練習(xí)2.有Python程序段如下:importpandasaspdser=pd.Series([1,3,5,7])print(ser.index)

該程序段運(yùn)行后輸出結(jié)果為()A課堂練習(xí)3.某Dat

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論