版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第四章
數(shù)據(jù)處理與應(yīng)用1、常用表格數(shù)據(jù)的處理2、大數(shù)據(jù)處理3、大數(shù)據(jù)典型應(yīng)用人生苦短我用python學(xué)習(xí)目標(biāo):
1、了解Python常用擴(kuò)展模塊的功能。2、掌握pandas模塊的調(diào)用方法、數(shù)據(jù)結(jié)構(gòu)等基本知識(shí)。3、能使用pandas模塊對數(shù)據(jù)進(jìn)行編輯、計(jì)算和統(tǒng)計(jì)分析,并能從中提取有用信息形成結(jié)論。4、掌握matplotlib模塊的調(diào)用方法和使用matplotlib模塊對數(shù)據(jù)進(jìn)行可視化的基本方法。還記得嗎?python模塊的導(dǎo)入——import一個(gè)程序中已出現(xiàn)的一個(gè)或多個(gè)函數(shù)或模塊,引入到另一個(gè)python代碼中,從而實(shí)現(xiàn)代碼的復(fù)用。語法如下:import模塊名模塊名.函數(shù)名from模塊名import函數(shù)名python模塊的小名兒import還有更多詳細(xì)的用法,主要有以下兩種:導(dǎo)入整個(gè)模塊時(shí),也可以為模塊指定別名。
import模塊名1[as別名1]…例如:importsysassprint(s.argv[0])
from模塊名import成員名1[as別名1],…例如:fromsysimportargvasvprint(v[0])pandas處理數(shù)據(jù)
數(shù)據(jù)處理可以使用現(xiàn)成的軟件或平臺(tái),也可以通過編寫程序?qū)崿F(xiàn)。Python語言豐富的標(biāo)準(zhǔn)模塊和擴(kuò)展庫提供了許多高效靈活的函數(shù),可以幫助我們較好地進(jìn)行數(shù)據(jù)整理。
pandas數(shù)據(jù)結(jié)構(gòu)
1.Series(序列)Series類似于一維數(shù)組,由一個(gè)數(shù)組的數(shù)據(jù)和一個(gè)與數(shù)據(jù)關(guān)聯(lián)的索引(index),索引值默認(rèn)是從0起遞增的整數(shù)。frompandasimportSeries#導(dǎo)入pandas庫中Series模塊pds1=Series([1,2,3,4])pds101122334左列:index右列:valuespandas數(shù)據(jù)結(jié)構(gòu)通過指定索引的方式pds2=Series([1,2,3,4],index=['a','b','c','d'])pds2a
1b2c3d4pandas數(shù)據(jù)結(jié)構(gòu)通過字典方式創(chuàng)建data={"i1":1,"i2":2,"i3":3,"i4":4}#由于字典是無序的,因此指定索引排列順序ps3=Series(data,index=['i1','i2','i3','i4'])ps3i11i22i33i44pandas數(shù)據(jù)結(jié)構(gòu)
2.DataFrame(數(shù)據(jù)框)
DataFrame是一種類似于關(guān)系表的表格型數(shù)據(jù)結(jié)構(gòu),DataFrame對象是一個(gè)二維表格,由1個(gè)索引列(index)和若干個(gè)數(shù)據(jù)列組成。其中,每列中的元素類型必須一致,而不同的列可以擁有不同的元素類型。使用DataFrame前,需要導(dǎo)入pandas庫中的DataFrame模塊frompandasimportDataFrame
pandas數(shù)據(jù)結(jié)構(gòu)data={"name":["王曉明","李靜","田海"],"sex":["男","女","男"],"aged":[20,19,21]}#字典是無序的,因此需要通過columns指定列索引的排列順序df=DataFrame(data,columns=["name","sex","aged"])dfindexpandas數(shù)據(jù)結(jié)構(gòu)
DataFrame數(shù)據(jù)有列索引和行索引,行索引類似于關(guān)系表中每行的編號(未指定行索引的情況下,會(huì)使用0到N-1作為行索引),列索引類似于表格的列名(也稱為字段)。df1=DataFrame(data,columns=["name","sex","aged"],index=["L1","L2","L3"])df1data={"name":("張三","李四","王五","趙六"),"sex":("男","女","女","男"),"aged":(20,19,20,21),"score":(80,60,70,90)}df=DataFrame(data)#使用字典創(chuàng)建DataFrame對象dfpandas數(shù)據(jù)結(jié)構(gòu)
pandas數(shù)據(jù)結(jié)構(gòu)
DataFrame模塊提供了豐富的函數(shù),這些函數(shù)可以用來進(jìn)行行、列編輯和統(tǒng)計(jì)計(jì)算等。1.增加行增加行數(shù)據(jù)可以通過append()函數(shù)傳入字典數(shù)據(jù)即可。append_data={"name":"朱八","sex":"男","aged":23,"score":65}new_df=df.append(append_data)new_df
pandas數(shù)據(jù)結(jié)構(gòu)
2.增加列增加列可以直接通過標(biāo)簽索引方式進(jìn)行,當(dāng)新增的列中的數(shù)值不一樣時(shí),可以傳入列表或者數(shù)組結(jié)構(gòu)進(jìn)行賦值。new_df["city"]=["北京","西安","長春","珠海","昆明"]new_df
pandas數(shù)據(jù)結(jié)構(gòu)
3.刪除使用drop()函數(shù)可以刪除指定軸上的信息,原來的DataFrame數(shù)據(jù)不會(huì)刪除。new_df.drop(2)#刪除行索引是2的信息
pandas數(shù)據(jù)結(jié)構(gòu)
4.修改標(biāo)簽
通過rename()函數(shù)完成行和列索引標(biāo)簽的修改,index參數(shù)指定要修改的行標(biāo)簽,columns參數(shù)指定要修改的列標(biāo)簽。new_df.rename(index={3:2,4:3},columns={"score":"grade"})#以字典形式指定修改信息
pandas數(shù)據(jù)結(jié)構(gòu)
Matplotlib——繪圖Matplotlib—繪制精美的圖表
Matplotlib——繪圖
matplotlib中的快速繪圖的函數(shù)庫可以通過如下語句載入:接下來調(diào)用figure創(chuàng)建一個(gè)繪圖對象,并且使它成為當(dāng)前的繪圖對象。通過figsize參數(shù)可以指定繪圖對象的寬度和高度,單位為英寸;dpi參數(shù)指定繪圖對象的分辨率,即每英寸多少個(gè)像素,缺省值為80。因此本例中所創(chuàng)建的圖表窗口的寬度為8*80=640像素。importmatplotlib.pyplotaspltplt.figure(figsize=(8,4))快速繪圖接下來通過一系列函數(shù)設(shè)置繪圖對象的各個(gè)屬性:?xlabel/ylabel:設(shè)置X軸/Y軸的文字?title:設(shè)置圖表的標(biāo)題?ylim:設(shè)置Y軸的范圍?legend:顯示圖示最后調(diào)用plt.show()顯示出創(chuàng)建的所有繪圖對象。21plt.xlabel("Time(s)")plt.ylabel("Volt")plt.title("PyPlotFirstExample")plt.ylim(-1.2,1.2)plt.legend()
Matplotlib——繪圖快速繪圖
22importnumpyasnpimportmatplotlib.pyplotasplt
x=np.linspace(0,10,1000)y=np.sin(x)z=np.cos(x**2)
plt.figure(figsize=(8,4))plt.plot(x,y,label="$sin(x)$",color="red",linewidth=2)plt.plot(x,z,"b--",label="$cos(x^2)$")plt.xlabel("Time(s)")plt.ylabel("Volt")plt.title("PyPlotFirstExample")plt.ylim(-1.2,1.2)plt.legend()plt.show()
Matplotlib——繪圖快速繪圖23
Matplotlib——繪圖課堂小結(jié)import模塊名1[as別名1]…from模塊名import成員名1[as別名1],…pandas數(shù)據(jù)結(jié)構(gòu)Series(序列)DataFrame(數(shù)據(jù)框)Matplotlib——繪圖1.下列Python的模塊中,主要用于數(shù)據(jù)的處理和分析的是()A.ImageB.pandasC.scipyD.matplotlib課堂練習(xí)B課堂練習(xí)2.有Python程序段如下:importpandasaspdser=pd.Series([1,3,5,7])print(ser.index)
該程序段運(yùn)行后輸出結(jié)果為()A課堂練習(xí)3.某Dat
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 安全生產(chǎn)技術(shù)服務(wù)合同范本
- 鐵路交通設(shè)施建設(shè)施工合同
- 物業(yè)保潔外包合同
- 2025園林綠化合作合同范本
- 2025年浙科版選修3地理上冊月考試卷
- 聘用合同補(bǔ)充協(xié)議
- 代加工的合同模板范本
- 簡單的鋁材購銷合同范本
- 培訓(xùn)租場地合同協(xié)議書范本
- 產(chǎn)品加工的簡單合同范本
- 合理使用手機(jī) 做自律好少年-合理使用手機(jī)主題班會(huì)(課件)
- 湖南財(cái)政經(jīng)濟(jì)學(xué)院《運(yùn)籌學(xué)》2022-2023學(xué)年第一學(xué)期期末試卷
- 河南省信陽市2024-2025學(xué)年高三上學(xué)期第一次質(zhì)量檢測試題 化學(xué) 含答案
- 公司企業(yè)標(biāo)準(zhǔn)模板版
- 2024中智集團(tuán)招聘重要崗位(高頻重點(diǎn)提升專題訓(xùn)練)共500題附帶答案詳解
- Unit 1 Cultural Heritage單元整體教學(xué)設(shè)計(jì) 人教版必修第二冊單元整體教學(xué)設(shè)計(jì)
- 養(yǎng)老護(hù)理員試題及答案
- 2024年山東省高中學(xué)業(yè)水平合格考生物試卷試題(含答案詳解)
- 2025年中考英語復(fù)習(xí)熱點(diǎn)話題作文范文
- 小學(xué)數(shù)學(xué)教學(xué)工作交流數(shù)學(xué)教學(xué)中的體會(huì)總結(jié)經(jīng)驗(yàn)交流會(huì)課件
- 2024年美國智能馬桶和馬桶蓋市場現(xiàn)狀及上下游分析報(bào)告
評論
0/150
提交評論