《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》課件項(xiàng)目二農(nóng)產(chǎn)品信息可視化分析-NumPy、pandas 與 Matplotlib 庫(kù)

上傳人：q*** IP屬地：山東上傳時(shí)間：2024-12-31 格式：PPTX 頁(yè)數(shù)：179 大小：29.75MB 積分：20 舉報(bào) 版權(quán)申訴

《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》課件項(xiàng)目二農(nóng)產(chǎn)品信息可視化分析-NumPy、pandas 與 Matplotlib 庫(kù)_第2頁(yè)

《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》課件項(xiàng)目二農(nóng)產(chǎn)品信息可視化分析-NumPy、pandas 與 Matplotlib 庫(kù)_第3頁(yè)

《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》課件項(xiàng)目二農(nóng)產(chǎn)品信息可視化分析-NumPy、pandas 與 Matplotlib 庫(kù)_第4頁(yè)

《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》課件項(xiàng)目二農(nóng)產(chǎn)品信息可視化分析-NumPy、pandas 與 Matplotlib 庫(kù)_第5頁(yè)

已閱讀5頁(yè)，還剩174頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

分析農(nóng)產(chǎn)品類型情況分析農(nóng)產(chǎn)品類型情況——NumPy庫(kù)任務(wù)描述通過(guò)對(duì)國(guó)家水稻數(shù)據(jù)中心網(wǎng)站的水稻審定樣品數(shù)據(jù)的分析，借助數(shù)組的常見(jiàn)操作，了解安徽省的水稻類型占比情況。通過(guò)對(duì)安徽省的水稻類型占比的分析比較，可以深入探究該省的水稻品種多樣性、適應(yīng)性和優(yōu)勢(shì)特點(diǎn)。具體的優(yōu)化方向需要決策者保持對(duì)農(nóng)業(yè)生產(chǎn)現(xiàn)狀和未來(lái)發(fā)展的高度關(guān)注和深入研究的科研精神，以不斷推進(jìn)和改善水稻種植業(yè)的發(fā)展。分析農(nóng)產(chǎn)品類型情況任務(wù)要求對(duì)安徽省的常見(jiàn)水稻類型進(jìn)行排序。分析水稻類型數(shù)量的占比情況。分析農(nóng)產(chǎn)品類型情況運(yùn)用Python進(jìn)行數(shù)組操作需用到Numpy庫(kù)創(chuàng)建數(shù)組對(duì)象數(shù)組基本操作創(chuàng)建數(shù)組對(duì)象什么是NumPy庫(kù)?分析農(nóng)產(chǎn)品類型情況NumPy是一個(gè)Python中科學(xué)計(jì)算的核心庫(kù)。提供了高性能的數(shù)組對(duì)象以及相關(guān)工具和函數(shù)。可以幫助開發(fā)者更加方便地進(jìn)行數(shù)組計(jì)算的相關(guān)操作。數(shù)組創(chuàng)建array函數(shù)用于創(chuàng)建一維數(shù)組，其基本使用格式如下。分析農(nóng)產(chǎn)品類型情況numpy.array(object,dtype=None,copy=True,order='K',subok=False,ndmin=0)array函數(shù)的常用參數(shù)說(shuō)明如下參數(shù)名稱參數(shù)說(shuō)明object接收array_like。表示所需創(chuàng)建的數(shù)組對(duì)象。無(wú)默認(rèn)值dtype接收data-type。表示數(shù)組所需的數(shù)據(jù)類型，如果未給定，那么選擇保存對(duì)象所需的最小類型。默認(rèn)為Nonecopy接收bool。表示是否在創(chuàng)建新數(shù)組時(shí)復(fù)制原始數(shù)組的數(shù)據(jù)。默認(rèn)值為Ture數(shù)組創(chuàng)建array函數(shù)用于創(chuàng)建一維數(shù)組，其基本使用格式如下。分析農(nóng)產(chǎn)品類型情況numpy.array(object,dtype=None,copy=True,order='K',subok=False,ndmin=0)array函數(shù)的常用參數(shù)說(shuō)明如下參數(shù)名稱參數(shù)說(shuō)明order接收str。表示表示數(shù)組的排序方式。默認(rèn)值為'K'subok接收bool。表示是否返回子類對(duì)象。默認(rèn)值為Falsendmin接收int。表示指定生成數(shù)組應(yīng)該具有的最小維數(shù)。默認(rèn)為0數(shù)組創(chuàng)建arange函數(shù)通過(guò)指定開始值、終值和步長(zhǎng)來(lái)創(chuàng)建一維數(shù)組，創(chuàng)建的數(shù)組不含終值，格式如下。arange函數(shù)的常用參數(shù)說(shuō)明如下。分析農(nóng)產(chǎn)品類型情況numpy.arange([start,]stop,[step,]dtype=None,*,like=None)參數(shù)名稱參數(shù)說(shuō)明start接收int或?qū)崝?shù)。表示數(shù)組的開始值，生成的區(qū)間包括該值。默認(rèn)為0stop接收int或?qū)崝?shù)。表示數(shù)組的終值，生成的區(qū)間不包括該值。無(wú)默認(rèn)值step接收int或?qū)崝?shù)。表示在數(shù)組中，值之間的間距。默認(rèn)為1dtype接收數(shù)據(jù)類型。表示輸出數(shù)組的類型。默認(rèn)為None數(shù)組創(chuàng)建zeros函數(shù)用于創(chuàng)建一個(gè)全部為0的數(shù)組，格式如下。shape參數(shù)指定數(shù)組的形狀，dtype參數(shù)指定數(shù)組的數(shù)據(jù)類型，order參數(shù)指定數(shù)組在內(nèi)存中的存儲(chǔ)順序。ones函數(shù)用于創(chuàng)建一個(gè)全部為1的數(shù)組，其基本使用格式如下。full函數(shù)用于創(chuàng)建相同元素的數(shù)組，其基本使用格式如下。分析農(nóng)產(chǎn)品類型情況numpy.zeros(shape,dtype=float,order='C')numpy.ones(shape,dtype=float,order='C')numpy.full(shape,fill_value,dtype=None,order='C')數(shù)組屬性分析農(nóng)產(chǎn)品類型情況數(shù)組的常用屬性及其說(shuō)明

屬性名稱屬性說(shuō)明ndim返回int。表示數(shù)組的維數(shù)shape返回tuple。表示數(shù)組形狀的陣列，對(duì)于n行m列的矩陣，形狀為(n,m)size返回int。表示數(shù)組的元素總數(shù)，等于數(shù)組形狀的乘積dtype返回data-type。表示數(shù)組中元素的數(shù)據(jù)類型itemsize返回int。表示數(shù)組的每個(gè)元素的大小（以字節(jié)為單位）。例如，一個(gè)元素類型為float64的數(shù)組的itemsiz屬性值為8（float64占用64個(gè)bits，每個(gè)字節(jié)長(zhǎng)度為8，所以64/8，占用8個(gè)字節(jié)）。一個(gè)元素類型為complex32的數(shù)組的itemsiz屬性值為4，即32/8生成隨機(jī)數(shù)分析農(nóng)產(chǎn)品類型情況random函數(shù)是最常見(jiàn)的生成隨機(jī)數(shù)的方法，格式如下。numpy.random.random(size=None)random()函數(shù)返回一個(gè)0到1之間的隨機(jī)浮點(diǎn)數(shù)，可以生成單個(gè)隨機(jī)數(shù)，也可以生成一個(gè)數(shù)組，其中的元素都是隨機(jī)數(shù)。參數(shù)size接收int，表示返回的隨機(jī)浮點(diǎn)數(shù)大小，默認(rèn)為None。生成隨機(jī)數(shù)分析農(nóng)產(chǎn)品類型情況randint函數(shù)可以生成給定上下限范圍的隨機(jī)數(shù)，其基本使用格式如下。randint函數(shù)的常用參數(shù)及其說(shuō)明。numpy.random.randint(low,high=None,size=None,dtype=int)參數(shù)名稱參數(shù)說(shuō)明low接收int或類似數(shù)組的整數(shù)。表示數(shù)組最小值。無(wú)默認(rèn)值high接收int或類似數(shù)組的整數(shù)。表示數(shù)組最大值。默認(rèn)Nonesize接收int或整數(shù)元組。表示輸出形狀。默認(rèn)為Nonedtype接收數(shù)據(jù)類型。表示輸出數(shù)組的類型。默認(rèn)為int數(shù)組基本操作什么是運(yùn)算符？運(yùn)算符是用于執(zhí)行各種數(shù)學(xué)、邏輯和比較操作的符號(hào)或符號(hào)組合。常用類型數(shù)學(xué)運(yùn)算符比較運(yùn)算符分析農(nóng)產(chǎn)品類型情況

用于比較兩個(gè)值的大小或是否相等，返回一個(gè)布爾值True或False。用于數(shù)學(xué)運(yùn)算，如加減乘除等。

數(shù)組基本操作分析農(nóng)產(chǎn)品類型情況運(yùn)算符描述示例常用的數(shù)學(xué)運(yùn)算符//取整除，返回商的整數(shù)部分23//10輸出結(jié)果是2**冪，即返回x的y次方2**3輸出結(jié)果是8%取模，即返回除法的余數(shù)23%10輸出結(jié)果是3/除，即兩個(gè)對(duì)象相除20/10輸出結(jié)果是2*乘，即兩個(gè)對(duì)象相乘10*20輸出結(jié)果是200-減，即得到負(fù)數(shù)或是兩個(gè)對(duì)象相減10-20輸出結(jié)果是-10+加，即兩個(gè)對(duì)象相加10+20輸出結(jié)果是30數(shù)組基本操作分析農(nóng)產(chǎn)品類型情況==等于，即比較對(duì)象是否相等除了數(shù)學(xué)運(yùn)算符，另一類常用運(yùn)算符是比較運(yùn)算符，Python的比較運(yùn)算符用于比較兩個(gè)值的大小或是否相等，返回一個(gè)布爾值True或False比較運(yùn)算符。運(yùn)算符描述<=小于等于，即返回x是否小于等于y>=大于等于，即返回x是否大于等于y<

小于，即返回x是否小于y>

大于，即返回x是否大于y!=不等于，即比較兩個(gè)對(duì)象是否不相等數(shù)組基本操作數(shù)組排序Sort函數(shù)返回值作用函數(shù)規(guī)則

是一個(gè)用于對(duì)數(shù)組進(jìn)行排序的函數(shù)

可以按照指定的軸和排序方式對(duì)數(shù)組元素進(jìn)行排序

返回一個(gè)已排序的數(shù)組，原數(shù)組不受影響分析農(nóng)產(chǎn)品類型情況數(shù)組基本操作分析農(nóng)產(chǎn)品類型情況使用sort函數(shù)對(duì)數(shù)組進(jìn)行排序，基本格式如下。numpy.sort(a,axis=-1,kind='quicksort',order=None)sort函數(shù)的常用參數(shù)及其說(shuō)明。參數(shù)名稱參數(shù)說(shuō)明axis接收int或str。表示排序數(shù)組的哪個(gè)軸。默認(rèn)值為-1kind接收str。表示使用的排序算法。默認(rèn)quicksortorder接收int或str。表示按指定的字段排序。默認(rèn)為None用水稻類型數(shù)量創(chuàng)建數(shù)組對(duì)品種數(shù)量進(jìn)行排序分析水稻類型數(shù)量的占比情況用水稻類型數(shù)量創(chuàng)建數(shù)組分析農(nóng)產(chǎn)品類型情況基于安徽省不同水稻類型數(shù)量，使用array函數(shù)創(chuàng)建一個(gè)數(shù)組。安徽省的數(shù)量最多七個(gè)水稻品種如下表。水稻類型粳型兩系雜交稻秈型兩系雜交稻秈型不育系秈型常規(guī)稻秈型三系雜交稻粳型常規(guī)稻粳型三系雜交稻數(shù)量743548820413029查看數(shù)組屬性分析農(nóng)產(chǎn)品類型情況思路分析查看哪些屬性如何查看

數(shù)組大小與數(shù)據(jù)類型。分別使用shape與dtype屬性。

對(duì)品種數(shù)量進(jìn)行排序分析農(nóng)產(chǎn)品類型情況創(chuàng)建好數(shù)組后，使用sort函數(shù)對(duì)不同品種數(shù)量進(jìn)行排序，分析安徽省不同水稻類型數(shù)量情況，結(jié)果如下。[472988130204435][435204130882974]

分析水稻類型數(shù)量占比情況分析農(nóng)產(chǎn)品類型情況計(jì)算安徽省數(shù)量最多的兩個(gè)水稻品種數(shù)量計(jì)算全部品種的數(shù)量計(jì)算安徽省數(shù)量最多的兩個(gè)水稻品種數(shù)量占全部品種數(shù)量的比例處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)農(nóng)產(chǎn)品信息可視化分析——NumPy、pandas與Matplotlib庫(kù)任務(wù)描述水稻是全球最重要的糧食作物之一，水稻審定數(shù)據(jù)可以為農(nóng)業(yè)科技創(chuàng)新提供重要的參考和依據(jù)，可以幫助選擇高產(chǎn)、優(yōu)質(zhì)、抗逆性強(qiáng)的水稻品種，促進(jìn)綠色、可持續(xù)的農(nóng)業(yè)生產(chǎn)方式，有助于推動(dòng)農(nóng)業(yè)的可持續(xù)發(fā)展。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)本任務(wù)先了解水稻信息數(shù)據(jù)的情況，根據(jù)數(shù)據(jù)檢測(cè)的內(nèi)容可知數(shù)據(jù)存在缺失值、重復(fù)值、異常值的情況，并對(duì)數(shù)據(jù)中的缺失值、重復(fù)值、異常值進(jìn)行處理，增強(qiáng)后續(xù)數(shù)據(jù)分析的效果。對(duì)數(shù)據(jù)進(jìn)行仔細(xì)的處理和清洗，確保數(shù)據(jù)的質(zhì)量可靠，為后續(xù)的數(shù)據(jù)分析和決策提供更可信的基礎(chǔ)，也展現(xiàn)了勞動(dòng)精神的價(jià)值和應(yīng)用。任務(wù)要求讀取農(nóng)產(chǎn)品基本信息數(shù)據(jù)。檢測(cè)數(shù)據(jù)缺失值的情況，并進(jìn)行缺失值處理。檢測(cè)數(shù)據(jù)異常值的情況，并進(jìn)行異常值處理。檢測(cè)數(shù)據(jù)重復(fù)值的情況，并進(jìn)行重復(fù)值處理。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)數(shù)據(jù)讀取與寫入pandas數(shù)據(jù)結(jié)構(gòu)pandas數(shù)據(jù)處理數(shù)據(jù)讀取與寫入處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)pandas是一個(gè)常用的Python數(shù)據(jù)處理庫(kù)，支持多種文件格式的讀取和寫入。通過(guò)引入pandas庫(kù)，可以使用read_csv()函數(shù)讀取CSV文件、read_excel()函數(shù)讀取Excel文件等。同時(shí)，pandas也提供了to_csv()方法將數(shù)據(jù)寫入CSV文件、to_excel()方法將數(shù)據(jù)寫入Excel文件等。這些函數(shù)、方法的使用使數(shù)據(jù)的讀取和寫入變得簡(jiǎn)單方便。讀寫文本文件CSV文件讀取處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)如果文本文件是字符分隔文件，那么可以使用讀取CSV文件的函數(shù)進(jìn)行讀取。pandas提供了read_csv函數(shù)讀取CSV文件。read_csv函數(shù)的基本使用格式如下。pandas.read_csv(filepath_or_buffer,sep=<no_default>,header='infer',names=<no_default>,index_col=None,dtype=None,engine=None,skiprows=None,nrows=None,……)讀寫文本文件處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)pandas提供了read_table函數(shù)讀取文本文件。read_table函數(shù)的基本使用格式如下。pandas.read_table(filepath_or_buffer,sep=<no_default>,header='infer',names=<no_default>,index_col=None,dtype=None,engine=None,skiprows=None,nrows=None,……)讀寫文本文件處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)read_table函數(shù)與read_csv函數(shù)的參數(shù)說(shuō)明如下。filepath_or_buffer接收str。表示文件路徑。無(wú)默認(rèn)值sep接收str。表示分隔符。read_csv函數(shù)默認(rèn)為“,”，read_table函數(shù)默認(rèn)為制表符“Tab”header接收int或列表形式的int。表示將某行數(shù)據(jù)作為列名。默認(rèn)為infernames接收array。表示列名。無(wú)默認(rèn)值index_col接收int、sequence或False。表示索引列的位置，取值為sequence則代表多重索引。默認(rèn)為None參數(shù)名稱參數(shù)說(shuō)明讀寫文本文件處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)read_table函數(shù)與read_csv函數(shù)的參數(shù)說(shuō)明如下。dtype接收字典形式的列名或類型名稱。表示寫入的數(shù)據(jù)類型（列名為key，數(shù)據(jù)格式為values）。默認(rèn)為Noneengine接收c語(yǔ)言或python語(yǔ)言。表示要使用的數(shù)據(jù)解析引擎。默認(rèn)為Nonenrows接收int。要讀取的文件行數(shù)。默認(rèn)為Noneskiprows接收l(shuí)ist或int或callable。表示讀取數(shù)據(jù)時(shí)跳過(guò)開頭的行數(shù)。默認(rèn)為None參數(shù)名稱參數(shù)說(shuō)明讀寫文本文件CSV文件寫入處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)文本文件的存儲(chǔ)和讀取類似，對(duì)于結(jié)構(gòu)化數(shù)據(jù)，可以通過(guò)pandas庫(kù)中的to_csv()方法實(shí)現(xiàn)以csv文件格式存儲(chǔ)。DataFrame.to_csv(path_or_buf=None,sep=',',na_rep='',float_format=None,columns=None,header=True,index=True,index_label=None,mode='w',encoding=None,compression='infer',quoting=None,quotechar='"',line_terminator=None,chunksize=None,date_format=None,doublequote=True,escapechar=None,decimal='.',errors='strict',storage_options=None)讀寫文本文件處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)to_csv()方法參數(shù)如下表所示。參數(shù)名稱參數(shù)說(shuō)明path_or_buf接收str。表示文件路徑。默認(rèn)為Nonesep接收str。表示分隔符。默認(rèn)為“,”na_rep接收str。表示缺失值。默認(rèn)為“”columns接收l(shuí)ist。表示寫出的列名。默認(rèn)為None讀寫文本文件處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)to_csv()方法參數(shù)如下表所示。header接收bool或列表形式的str。表示是否將列名寫出。默認(rèn)為Trueindex接收bool。表示是否將行名（索引）寫出。默認(rèn)為Trueindex_label接收sequence或str或false。表示索引名。默認(rèn)為Nonemode接收特定str。表示數(shù)據(jù)寫入模式。默認(rèn)為wencoding接收特定str。表示存儲(chǔ)文件的編碼格式。默認(rèn)為None參數(shù)名稱參數(shù)說(shuō)明讀寫Excel文件Excel文件讀取處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)pandas庫(kù)提供了read_excel函數(shù)讀取“xls”“xlsx”兩種Excel文件，其基本使用格式如下。pandas.read_excel(io,sheet_name=0,header=0,names=None,index_col=None,usecols=None,squeeze=False,dtype=None,engine=None,converters=None,true_values=None,false_values=None,skiprows=None,nrows=None,na_values=None,keep_default_na=True,na_filter=True,verbose=False,parse_dates=False,date_parser=None,thousands=None,comment=None,skipfooter=0,convert_float=True,mangle_dupe_cols=True,storage_options=None)讀寫Excel文件處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)read_excel函數(shù)的常用參數(shù)及其說(shuō)明如表所示。參數(shù)名稱參數(shù)說(shuō)明io接收str。表示文件路徑。無(wú)默認(rèn)值sheet_name接收str、int、list或None。表示Excel表內(nèi)數(shù)據(jù)的分表位置。默認(rèn)為0header接收int或列表形式的int。表示將某行數(shù)據(jù)作為列名。如果傳遞整數(shù)列表，那么行位置將合并為MultiIndex。如果沒(méi)有表頭，那么使用None。默認(rèn)為0讀寫Excel文件處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)參數(shù)名稱參數(shù)說(shuō)明names接收array。表示要使用的列名列表。默認(rèn)為Noneindex_col接收int或列表形式的int。表示將列索引用作dataframe的行索引。默認(rèn)為Nonedtype接收dict。表示寫入的數(shù)據(jù)類型（列名為key，數(shù)據(jù)格式為values）。默認(rèn)為Noneskiprows接收l(shuí)ist、int或callable。表示讀取數(shù)據(jù)開頭跳過(guò)的行數(shù)。默認(rèn)為Noneread_excel函數(shù)的常用參數(shù)及其說(shuō)明如表所示。讀寫Excel文件Excel文件寫入處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)將數(shù)據(jù)存儲(chǔ)至Excel文件，可以使用to_excel()方法，其基本使用格式如下。DataFrame.to_excel(excel_writer,sheet_name='Sheet1',na_rep='',float_format=None,columns=None,header=True,index=True,index_label=None,startrow=0,startcol=0,engine=None,merge_cells=True,encoding=None,inf_rep='inf',verbose=True,freeze_panes=None,storage_options=None)讀寫Excel文件to_excel()方法的常用參數(shù)及其說(shuō)明如下表。excel_writer接收str。表示文件路徑。無(wú)默認(rèn)值sheet_name接收str。表示Excel文件中工作簿的名稱。默認(rèn)為Sheet1na_rep接收str。表示缺失值。默認(rèn)為“”columns接收列表形式的str或sequence。表示寫出的列名。默認(rèn)為None參數(shù)名稱參數(shù)說(shuō)明處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)讀寫Excel文件to_excel()方法的常用參數(shù)及其說(shuō)明如下表。header接收bool或列表形式的str。表示是否將列名寫出。默認(rèn)為Trueindex接收bool。表示是否將行名（索引）寫出。默認(rèn)為Trueindex_label接收sequence或str。表示索引名。默認(rèn)為Noneencoding接收特定str。表示存儲(chǔ)文件的編碼格式。默認(rèn)為None參數(shù)名稱參數(shù)說(shuō)明處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)數(shù)據(jù)讀取與寫入處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)就業(yè)是最基本的民生，根據(jù)應(yīng)屆生招聘數(shù)據(jù)，可以全面地了解當(dāng)前就業(yè)市場(chǎng)的形勢(shì)和趨勢(shì)，為應(yīng)屆畢業(yè)生提供更準(zhǔn)確的就業(yè)指導(dǎo)和職業(yè)規(guī)劃建議，深入實(shí)施就業(yè)優(yōu)先戰(zhàn)略。崗位公司性質(zhì)行業(yè)地區(qū)學(xué)歷要求工資/元產(chǎn)品經(jīng)理民營(yíng)公司|少于50人通信/電信/網(wǎng)絡(luò)設(shè)備成都-高新區(qū)本科15000無(wú)線產(chǎn)品經(jīng)理（光谷）民營(yíng)公司|150-500人儀器儀表/工業(yè)自動(dòng)化西安-高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)本科10500產(chǎn)品經(jīng)理民營(yíng)公司|50-150人通信/電信/網(wǎng)絡(luò)設(shè)備成都-高新區(qū)本科22500若存儲(chǔ)為recruit.csv文件，利用read_csv函數(shù)讀取數(shù)據(jù)，使用to_csv()方法將應(yīng)屆生招聘數(shù)據(jù)寫入CSV文件。某招聘網(wǎng)站的三個(gè)城市的應(yīng)屆生招聘數(shù)據(jù)部分信息如下表所示。若存儲(chǔ)為recruit.xlsx文件，利用read_excel函數(shù)讀取數(shù)據(jù)，使用to_excel()方法將應(yīng)屆生招聘數(shù)據(jù)寫入CSV文件。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)農(nóng)產(chǎn)品信息可視化分析——NumPy、pandas與Matplotlib庫(kù)任務(wù)描述水稻是全球最重要的糧食作物之一，水稻審定數(shù)據(jù)可以為農(nóng)業(yè)科技創(chuàng)新提供重要的參考和依據(jù)，可以幫助選擇高產(chǎn)、優(yōu)質(zhì)、抗逆性強(qiáng)的水稻品種，促進(jìn)綠色、可持續(xù)的農(nóng)業(yè)生產(chǎn)方式，有助于推動(dòng)農(nóng)業(yè)的可持續(xù)發(fā)展。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)本任務(wù)先了解水稻信息數(shù)據(jù)的情況，根據(jù)數(shù)據(jù)檢測(cè)的內(nèi)容可知數(shù)據(jù)存在缺失值、重復(fù)值、異常值的情況，并對(duì)數(shù)據(jù)中的缺失值、重復(fù)值、異常值進(jìn)行處理，增強(qiáng)后續(xù)數(shù)據(jù)分析的效果。對(duì)數(shù)據(jù)進(jìn)行仔細(xì)的處理和清洗，確保數(shù)據(jù)的質(zhì)量可靠，為后續(xù)的數(shù)據(jù)分析和決策提供更可信的基礎(chǔ)，也展現(xiàn)了勞動(dòng)精神的價(jià)值和應(yīng)用。任務(wù)要求讀取農(nóng)產(chǎn)品基本信息數(shù)據(jù)。檢測(cè)數(shù)據(jù)缺失值的情況，并進(jìn)行缺失值處理。檢測(cè)數(shù)據(jù)異常值的情況，并進(jìn)行異常值處理。檢測(cè)數(shù)據(jù)重復(fù)值的情況，并進(jìn)行重復(fù)值處理。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)數(shù)據(jù)讀取與寫入pandas數(shù)據(jù)結(jié)構(gòu)pandas數(shù)據(jù)處理pandas數(shù)據(jù)結(jié)構(gòu)pandas是什么處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)pandas是一個(gè)基于Python的數(shù)據(jù)分析庫(kù)，它提供了兩種核心的數(shù)據(jù)結(jié)構(gòu)：Series和DataFrame。Series是一維的數(shù)據(jù)結(jié)構(gòu)，類似于數(shù)組和列表，它包含了一組數(shù)據(jù)以及與之相關(guān)的索引。Series可以通過(guò)多種方式創(chuàng)建，如從列表、數(shù)組、字典等數(shù)據(jù)類型中創(chuàng)建。pandas數(shù)據(jù)結(jié)構(gòu)pandas是什么處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)pandas是一個(gè)基于Python的數(shù)據(jù)分析庫(kù)，它提供了兩種核心的數(shù)據(jù)結(jié)構(gòu)：Series和DataFrame。DataFrame是二維的表格型數(shù)據(jù)結(jié)構(gòu)，類似于SQL數(shù)據(jù)庫(kù)中的表格，由多個(gè)Series組成，其中每個(gè)Series表示一列數(shù)據(jù)。DataFrame的列和行都可以有自己的名稱和索引。pandas還支持多個(gè)DataFrame之間的合并和拼接操作。創(chuàng)建DataFrame如何創(chuàng)建DataFrame？處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)DataFrame是一種二維表格數(shù)據(jù)結(jié)構(gòu)，通常用于數(shù)據(jù)分析和數(shù)據(jù)處理。DataFrame通常包含多個(gè)行和多個(gè)列，其中每列可以包含不同的數(shù)據(jù)類型，可以用于表示結(jié)構(gòu)化數(shù)據(jù)，如從數(shù)據(jù)庫(kù)或文件讀取的表格數(shù)據(jù)。在Python中可以使用pandas庫(kù)中的DataFrame函數(shù)創(chuàng)建DataFrame類型的數(shù)據(jù)。DataFrame的基本操作查看訪問(wèn)數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)DataFrame的單列數(shù)據(jù)為一個(gè)Series。根據(jù)DataFrame的定義可知，DataFrame是一個(gè)帶有標(biāo)簽的二維數(shù)組，每個(gè)標(biāo)簽相當(dāng)于每一列的列名。pandas提供了loc()和iloc()兩種更加靈活的方法來(lái)實(shí)現(xiàn)數(shù)據(jù)訪問(wèn)，也可以用head()方法訪問(wèn)。loc()方法是針對(duì)DataFrame索引名稱的切片方法，如果傳入的不是索引名稱，那么切片操作將無(wú)法執(zhí)行。利用loc()方法，能夠?qū)崿F(xiàn)所有單層索引切片操作，其使用方法如下。DataFrame.loc[行名或條件,列名]DataFrame的基本操作查看訪問(wèn)數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)iloc()方法和loc()方法的區(qū)別是，iloc()方法接收的必須是行索引和列索引的位置。iloc()方法的使用方法如下。DataFrame.iloc[行索引位置,列索引位置]DataFrame的單列數(shù)據(jù)為一個(gè)Series。根據(jù)DataFrame的定義可知，DataFrame是一個(gè)帶有標(biāo)簽的二維數(shù)組，每個(gè)標(biāo)簽相當(dāng)于每一列的列名。pandas提供了loc()和iloc()兩種更加靈活的方法來(lái)實(shí)現(xiàn)數(shù)據(jù)訪問(wèn)，也可以用head()方法訪問(wèn)。DataFrame的基本操作查看訪問(wèn)數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)DataFrame的單列數(shù)據(jù)為一個(gè)Series。根據(jù)DataFrame的定義可知，DataFrame是一個(gè)帶有標(biāo)簽的二維數(shù)組，每個(gè)標(biāo)簽相當(dāng)于每一列的列名。pandas提供了loc()和iloc()兩種更加靈活的方法來(lái)實(shí)現(xiàn)數(shù)據(jù)訪問(wèn)，也可以用head()方法訪問(wèn)。head()方法可以用于返回DataFrame或Series的前n行數(shù)據(jù)。DataFrame的基本操作更改與添加DataFrame中的數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)更改DataFrame中的數(shù)據(jù)的原理是將這部分?jǐn)?shù)據(jù)提取出來(lái)，重新賦值為新的數(shù)據(jù)。為DataFrame添加一列的方法非常簡(jiǎn)單，只需要新建一個(gè)列索引，并對(duì)該索引下的數(shù)據(jù)進(jìn)行賦值操作即可。DataFrame的基本操作刪除數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)在Python中可以使用pandas提供的drop()方法刪除某列或某行數(shù)據(jù)。drop()方法的基本使用格式如下。DataFrame.drop(labels=None,axis=0,index=None,columns=None,level=None,inplace=False,errors='raise')DataFrame的基本操作處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)drop()方法的常用參數(shù)及其說(shuō)明如表所示。參數(shù)名稱參數(shù)說(shuō)明labels接收單一標(biāo)簽。表示要?jiǎng)h除的索引或列標(biāo)簽。無(wú)默認(rèn)值axis接收0或1。表示操作的軸向。默認(rèn)為0inplace接收bool。表示操作是否對(duì)原數(shù)據(jù)生效。默認(rèn)為False數(shù)據(jù)類型轉(zhuǎn)換如何進(jìn)行轉(zhuǎn)化處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)數(shù)據(jù)類型轉(zhuǎn)換指的是將DataFrame中的某一列或多列的數(shù)據(jù)類型更改為其他類型，如從字符串類型轉(zhuǎn)換為數(shù)字類型等。在pandas庫(kù)中，可以使用astype()方法將DataFrame的一列或多列轉(zhuǎn)換為其他數(shù)據(jù)類型。pandas數(shù)據(jù)結(jié)構(gòu)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)現(xiàn)有4家公司的近三年?duì)I收數(shù)據(jù)如表所示。公司名稱2020年?duì)I收/億元2021年?duì)I收/億元2022年?duì)I收/億元甲265.6260.2274.5乙110.4125.8143丙232.9280.5386.1丁136.8161.9182.5pandas數(shù)據(jù)結(jié)構(gòu)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)創(chuàng)建DataFrame，將營(yíng)收數(shù)據(jù)存儲(chǔ)在DataFrame中。使用iloc()方法查看乙公司的2020年?duì)I收。使用head()方法可以提取第一行數(shù)據(jù)，查看甲公司這三年的營(yíng)收情況。使用loc()方法查看甲公司的2020營(yíng)收。pandas數(shù)據(jù)結(jié)構(gòu)添加“公司類型”數(shù)據(jù)。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)使用drop()方法刪除2020年的營(yíng)收數(shù)據(jù)。使用astype()方法將“2022年?duì)I收/億元”這一列數(shù)據(jù)更改為整型。發(fā)現(xiàn)數(shù)據(jù)中丙公司2020年的營(yíng)收數(shù)據(jù)有誤，進(jìn)行更改。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)農(nóng)產(chǎn)品信息可視化分析——NumPy、pandas與Matplotlib庫(kù)任務(wù)描述水稻是全球最重要的糧食作物之一，水稻審定數(shù)據(jù)可以為農(nóng)業(yè)科技創(chuàng)新提供重要的參考和依據(jù)，可以幫助選擇高產(chǎn)、優(yōu)質(zhì)、抗逆性強(qiáng)的水稻品種，促進(jìn)綠色、可持續(xù)的農(nóng)業(yè)生產(chǎn)方式，有助于推動(dòng)農(nóng)業(yè)的可持續(xù)發(fā)展。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)本任務(wù)先了解水稻信息數(shù)據(jù)的情況，根據(jù)數(shù)據(jù)檢測(cè)的內(nèi)容可知數(shù)據(jù)存在缺失值、重復(fù)值、異常值的情況，并對(duì)數(shù)據(jù)中的缺失值、重復(fù)值、異常值進(jìn)行處理，增強(qiáng)后續(xù)數(shù)據(jù)分析的效果。對(duì)數(shù)據(jù)進(jìn)行仔細(xì)的處理和清洗，確保數(shù)據(jù)的質(zhì)量可靠，為后續(xù)的數(shù)據(jù)分析和決策提供更可信的基礎(chǔ)，也展現(xiàn)了勞動(dòng)精神的價(jià)值和應(yīng)用。任務(wù)要求讀取農(nóng)產(chǎn)品基本信息數(shù)據(jù)。檢測(cè)數(shù)據(jù)缺失值的情況，并進(jìn)行缺失值處理。檢測(cè)數(shù)據(jù)異常值的情況，并進(jìn)行異常值處理。檢測(cè)數(shù)據(jù)重復(fù)值的情況，并進(jìn)行重復(fù)值處理。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)數(shù)據(jù)讀取與寫入pandas數(shù)據(jù)結(jié)構(gòu)pandas數(shù)據(jù)處理pandas數(shù)據(jù)處理pandas是一款用于數(shù)據(jù)處理和分析的Python，提供了強(qiáng)大的數(shù)據(jù)結(jié)構(gòu)和函數(shù)，用于清洗、轉(zhuǎn)換、分析和可視化數(shù)據(jù)。核心數(shù)據(jù)結(jié)構(gòu)是DataFrame，類似于Excel表格。pandas提供了豐富的數(shù)據(jù)清洗、數(shù)據(jù)合并和分組聚合等功能。數(shù)據(jù)清洗包含了重復(fù)值處理、缺失值處理、異常值處理等操作。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)數(shù)據(jù)清洗重復(fù)值處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)處理重復(fù)數(shù)據(jù)是數(shù)據(jù)分析經(jīng)常面對(duì)的問(wèn)題之一。對(duì)重復(fù)數(shù)據(jù)進(jìn)行處理前，需要分析重復(fù)數(shù)據(jù)產(chǎn)生的原因以及去除這部分?jǐn)?shù)據(jù)后可能造成的不良影響。pandas提供了drop_duplicates()方法可用于去重，使用該方法進(jìn)行去重不會(huì)改變數(shù)據(jù)原始排列，并且兼具代碼簡(jiǎn)潔和運(yùn)行穩(wěn)定的特點(diǎn)。數(shù)據(jù)清洗處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)drop_duplicates()方法的基本使用格式如下。pandas.DataFrame.drop_duplicates(subset=None,keep='first',inplace=False,ignore_index=False)數(shù)據(jù)清洗處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)ignore_index接收bool。表示是否忽略索引。默認(rèn)為False參數(shù)名稱參數(shù)說(shuō)明subset接收str或sequence。表示進(jìn)行去重的列。默認(rèn)為Nonekeep接收特定str。表示重復(fù)時(shí)保留第幾個(gè)數(shù)據(jù)，“first”表示保留第一個(gè)；“l(fā)ast”表示保留最后一個(gè)；False表示只要有重復(fù)都不保留。默認(rèn)為firstinplace接收bool。表示是否在原表上進(jìn)行操作。默認(rèn)為Falsedrop_dupilicates()方法的常用參數(shù)及其說(shuō)明如下。數(shù)據(jù)清洗缺失值處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)缺失值處理方法概念識(shí)別方法

在數(shù)據(jù)中的某個(gè)或某些特征的值是不完整的，這些值稱為缺失值

識(shí)別缺失值的isnull()方法以及識(shí)別非缺失值的notnull()方法，均返回布爾值

刪除法與替換法數(shù)據(jù)清洗處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)刪除法是指將含有缺失值的特征或記錄刪除。刪除法分為刪除觀測(cè)記錄和刪除特征兩種，它屬于通過(guò)減少樣本量來(lái)?yè)Q取信息完整度的一種方法，是一種較為簡(jiǎn)單的缺失值處理方法。pandas中提供了dropna()方法可簡(jiǎn)便的刪除缺失值，通過(guò)設(shè)置參數(shù)，既可以刪除觀測(cè)記錄，又可以刪除特征?；臼褂酶袷饺缦隆andas.DataFrame.dropna(axis=0,how='any',thresh=None,subset=None,inplace=False)數(shù)據(jù)清洗處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)inplace接收bool。表示是否在原表上進(jìn)行操作。默認(rèn)為False參數(shù)名稱參數(shù)說(shuō)明axis接收0或1。表示軸向，0為刪除觀測(cè)記錄（行），1為刪除特征（列）。默認(rèn)為0subset接收array。表示進(jìn)行去重的列/行。默認(rèn)為Nonehow接收特定str。表示刪除的形式，當(dāng)取值為any時(shí)，表示只要有缺失值存在就執(zhí)行刪除操作；當(dāng)取值為all時(shí)，表示當(dāng)且僅當(dāng)全部為缺失值時(shí)才執(zhí)行刪除操作。默認(rèn)為anydropna()方法的常用參數(shù)及其說(shuō)明如下。數(shù)據(jù)清洗處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)替換法是指用一個(gè)特定的值替換缺失值。特征可分為數(shù)值型和類別型，當(dāng)缺失值所在特征為數(shù)值型時(shí)，通常利用其均值、中位數(shù)或眾數(shù)等描述其集中趨勢(shì)的統(tǒng)計(jì)量來(lái)代替缺失值；pandas庫(kù)中提供了fillna()方法可用于缺失值替換，其基本使用格式如下。pandas.DataFrame.fillna(value=None,method=None,axis=None,inplace=False,limit=None,downcast=None)數(shù)據(jù)清洗處理農(nóng)產(chǎn)品基本信息情況inplace接收bool。表示是否在原表上進(jìn)行操作。默認(rèn)為False參數(shù)名稱參數(shù)說(shuō)明value接收scalar、dict、Series或DataFrame。表示用于替換缺失值的值。默認(rèn)為Noneaxis接收0或1。表示軸向。默認(rèn)為Nonemethod接收特定str。表示填補(bǔ)缺失值的方式。當(dāng)取值為“backfilll”或“bfill”時(shí)表示使用下一個(gè)非缺失值來(lái)填補(bǔ)缺失值；當(dāng)取值為“pad”或“ffill”時(shí)表示使用上一個(gè)非缺失值來(lái)填補(bǔ)缺失值。默認(rèn)為Nonefillna()方法的常用參數(shù)及其說(shuō)明downcast接收dict。表示轉(zhuǎn)換數(shù)據(jù)類型。默認(rèn)為Nonelimit接收int。表示填補(bǔ)缺失值個(gè)數(shù)上限，超過(guò)則不進(jìn)行填補(bǔ)。默認(rèn)為None數(shù)據(jù)清洗3σ原則處理異常值處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)3σ原則又稱為拉依達(dá)準(zhǔn)則，其原則就是先假設(shè)一組檢測(cè)數(shù)據(jù)只含有隨機(jī)誤差，對(duì)原始數(shù)據(jù)進(jìn)行計(jì)算處理得到標(biāo)準(zhǔn)差，然后按一定的概率確定一個(gè)區(qū)間，認(rèn)為誤差超過(guò)這個(gè)區(qū)間就屬于異常。這種判別處理方法僅適用于對(duì)正態(tài)或近似正態(tài)分布的樣本數(shù)據(jù)進(jìn)行處理。數(shù)據(jù)清洗處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)正態(tài)分布數(shù)據(jù)的3σ原則如表所示，其中σ代表標(biāo)準(zhǔn)差，μ代表均值。數(shù)值分布在數(shù)據(jù)中的占比(μ

σ,

σ)0.6827(μ

2σ,

2σ)0.9545(μ

3σ,

3σ)0.9973數(shù)據(jù)清洗箱線圖法處理異常值處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)箱線圖提供了識(shí)別異常值的一個(gè)標(biāo)準(zhǔn)，即異常值通常被定義為小于QL-1.5IQR或大于QU+1.5IQR的值。箱線圖依據(jù)實(shí)際數(shù)據(jù)繪制，真實(shí)、直觀地表現(xiàn)出了數(shù)據(jù)分布的本來(lái)面貌，且沒(méi)有對(duì)數(shù)據(jù)做任何限制性要求。箱線圖識(shí)別異常值的結(jié)果比較客觀，因此在識(shí)別異常值方面具有一定的優(yōu)越性。QL稱為下四分位數(shù)，表示全部觀察值中有四分之一的數(shù)據(jù)取值比它小。QU稱為上四分位數(shù)，表示全部觀察值中有四分之一的數(shù)據(jù)取值比它大。IQR稱為四分位數(shù)間距，是上四分位數(shù)QU與下四分位數(shù)QL之差，其間包含了全部觀察值的一半。數(shù)據(jù)清洗處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)對(duì)應(yīng)屆生招聘數(shù)據(jù)recruit_data進(jìn)行數(shù)據(jù)清洗步驟如下。用drop_duplicates()方法對(duì)應(yīng)屆生招聘數(shù)據(jù)中的重復(fù)值進(jìn)行去重操作對(duì)工資以外的缺失值進(jìn)行刪除處理，使用工資平均值替換應(yīng)屆生招聘數(shù)據(jù)“工資”屬性中的缺失值使用箱線圖法對(duì)應(yīng)屆生招聘數(shù)據(jù)中“薪資”進(jìn)行異常值識(shí)別并刪除異常值處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)農(nóng)產(chǎn)品信息可視化分析——NumPy、pandas與Matplotlib庫(kù)任務(wù)描述水稻是全球最重要的糧食作物之一，水稻審定數(shù)據(jù)可以為農(nóng)業(yè)科技創(chuàng)新提供重要的參考和依據(jù)，可以幫助選擇高產(chǎn)、優(yōu)質(zhì)、抗逆性強(qiáng)的水稻品種，促進(jìn)綠色、可持續(xù)的農(nóng)業(yè)生產(chǎn)方式，有助于推動(dòng)農(nóng)業(yè)的可持續(xù)發(fā)展。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)本任務(wù)先了解水稻信息數(shù)據(jù)的情況，根據(jù)數(shù)據(jù)檢測(cè)的內(nèi)容可知數(shù)據(jù)存在缺失值、重復(fù)值、異常值的情況，并對(duì)數(shù)據(jù)中的缺失值、重復(fù)值、異常值進(jìn)行處理，增強(qiáng)后續(xù)數(shù)據(jù)分析的效果。對(duì)數(shù)據(jù)進(jìn)行仔細(xì)的處理和清洗，確保數(shù)據(jù)的質(zhì)量可靠，為后續(xù)的數(shù)據(jù)分析和決策提供更可信的基礎(chǔ)，也展現(xiàn)了勞動(dòng)精神的價(jià)值和應(yīng)用。任務(wù)要求讀取農(nóng)產(chǎn)品基本信息數(shù)據(jù)。檢測(cè)數(shù)據(jù)缺失值的情況，并進(jìn)行缺失值處理。檢測(cè)數(shù)據(jù)異常值的情況，并進(jìn)行異常值處理。檢測(cè)數(shù)據(jù)重復(fù)值的情況，并進(jìn)行重復(fù)值處理。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)數(shù)據(jù)讀取與寫入pandas數(shù)據(jù)結(jié)構(gòu)pandas數(shù)據(jù)處理pandas數(shù)據(jù)處理處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)橫向堆疊縱向堆疊堆疊合并主鍵合并pandas數(shù)據(jù)處理數(shù)據(jù)清洗數(shù)據(jù)合并分組聚合堆疊就是簡(jiǎn)單地將兩個(gè)表拼在一起，也被稱作軸向連接、綁定或連接。主鍵合并，即通過(guò)一個(gè)或多個(gè)鍵將兩個(gè)數(shù)據(jù)集的行連接起來(lái).堆疊合并數(shù)據(jù)橫向堆疊處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)橫向堆疊，即將兩個(gè)表在x軸向拼接在一起，可以使用concat函數(shù)完成。concat函數(shù)的基本使用格式如下。pandas.concat(objs,axis=0,join='outer',ignore_index=False,keys=None,levels=None,names=None,verify_integrity=False,sort=False,copy=True)堆疊合并數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)concat函數(shù)的常用參數(shù)及其說(shuō)明如下。參數(shù)名稱參數(shù)說(shuō)明objs接收多個(gè)Series、DataFrame、Panel的組合。表示參與連接的pandas對(duì)象的列表的組合。無(wú)默認(rèn)值axis接收int。表示連接的軸向，可選0和1。默認(rèn)為0join接收str。表示其他軸向上的索引是按交集（inner）還是并集（outer）進(jìn)行合并。默認(rèn)為outerignore_index接收bool。表示是否不保留連接軸上的索引，產(chǎn)生一組新索引range(total_length)。默認(rèn)為Falsesort接收bool。表示對(duì)非連接軸進(jìn)行排序。默認(rèn)為False堆疊合并數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)當(dāng)參數(shù)axis=1時(shí)，concat函數(shù)可做行對(duì)齊，然后將不同列名稱的兩張或多張表合并。當(dāng)兩個(gè)表索引不完全一樣時(shí)，可以設(shè)置join參數(shù)選擇是內(nèi)連接還是外連接。橫向堆疊外連接示例如圖所示。堆疊合并數(shù)據(jù)concat函數(shù)實(shí)現(xiàn)縱向堆疊處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)對(duì)比橫向堆疊，縱向堆疊是將兩個(gè)數(shù)據(jù)表在y軸向上拼接，concat函數(shù)也可以實(shí)現(xiàn)縱向堆疊。當(dāng)使用concat函數(shù)時(shí)，在默認(rèn)情況下，axis=0，concat函數(shù)做列對(duì)齊，將不同行索引的兩張或多張表縱向合并。在兩張表的列名并不完全相同的情況下，可以使用join參數(shù)，當(dāng)join參數(shù)取值不同，返回的列不同。當(dāng)兩張表的列名完全相同時(shí)，不論join參數(shù)的取值是inner還是outer，結(jié)果都是將兩個(gè)表完全按照y軸拼接起來(lái)。堆疊合并數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)縱向堆疊外連接示例如圖所示。堆疊合并數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)除了concat函數(shù)之外，append()方法也可以用于縱向合并兩張表。但是使用append()方法實(shí)現(xiàn)縱向表堆疊的前提條件是兩張表的列名需要完全一致。append()方法的基本使用格式如下。pandas.DataFrame.append(other,ignore_index=False,verify_integrity=False,sort=False)append()方法實(shí)現(xiàn)縱向堆疊堆疊合并數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)append()方法的常用參數(shù)及其說(shuō)明如下。參數(shù)名稱參數(shù)說(shuō)明other接收DataFrame或Series。表示要添加的新數(shù)據(jù)。無(wú)默認(rèn)值ignore_index接收bool。如果輸入True，那么就會(huì)對(duì)新生成的DataFrame使用新的索引（自動(dòng)產(chǎn)生），而忽略原來(lái)數(shù)據(jù)的索引。默認(rèn)為Falseverify_integrity接收bool。如果輸入True，那么當(dāng)ignore_index為False時(shí)，會(huì)檢查添加的數(shù)據(jù)索引是否沖突，若沖突，則會(huì)添加失敗。默認(rèn)為Falsesort接收bool。如果輸入True，那么會(huì)對(duì)合并的兩個(gè)表的列進(jìn)行排序。默認(rèn)為False主鍵合并數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)針對(duì)兩張包含不同特征的表，將根據(jù)某幾個(gè)特征一一對(duì)應(yīng)拼接起來(lái)，合并后數(shù)據(jù)的列數(shù)為兩個(gè)原數(shù)據(jù)的列數(shù)和減去連接鍵的數(shù)量。主鍵合并的示意如圖所示。主鍵合并數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)pandas庫(kù)中的merge函數(shù)可以實(shí)現(xiàn)主鍵合并，merge函數(shù)的基本使用格式如下。pandas.merge(left,right,how='inner',on=None,left_on=None,right_on=None,left_index=False,right_index=False,sort=False,suffixes=('_x','_y'),copy=True,indicator=False,validate=None)主鍵合并數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)merge函數(shù)的常用參數(shù)及其說(shuō)明如下。left接收DataFrame或Series。表示要添加的新數(shù)據(jù)1。無(wú)默認(rèn)值right接收DataFrame或Series。表示要添加的新數(shù)據(jù)2。無(wú)默認(rèn)值how接收“inner”“outer”“l(fā)eft”或“right”。表示數(shù)據(jù)的連接方式。默認(rèn)為inneron接收str或sequence。表示兩個(gè)數(shù)據(jù)合并的主鍵（必須一致）。默認(rèn)為Noneleft_on接收str或sequence。表示left參數(shù)接收數(shù)據(jù)用于合并的主鍵。默認(rèn)為None參數(shù)名稱參數(shù)說(shuō)明主鍵合并數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)right_on接收str或sequence。表示right參數(shù)接收數(shù)據(jù)用于合并的主鍵。默認(rèn)為Noneleft_index接收bool。表示是否將left參數(shù)接收數(shù)據(jù)的index作為連接主鍵。默認(rèn)為Falseright_index接收bool。表示是否將right參數(shù)接收數(shù)據(jù)的index作為連接主鍵。默認(rèn)為Falsesort接收bool。表示是否根據(jù)連接鍵對(duì)合并后的數(shù)據(jù)進(jìn)行排序。默認(rèn)為Falsemerge函數(shù)的常用參數(shù)及其說(shuō)明如下。參數(shù)名稱參數(shù)說(shuō)明數(shù)據(jù)合并處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)某地區(qū)的幾所中學(xué)舉行聯(lián)考，其中三所學(xué)校的考試語(yǔ)文平均成績(jī)與數(shù)學(xué)平均成績(jī)分別如表所示。學(xué)校參加考試人數(shù)語(yǔ)文平均成績(jī)甲107690乙97886丙78492學(xué)校參加考試人數(shù)數(shù)學(xué)平均成績(jī)甲107695乙97888丙78489數(shù)據(jù)清洗處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)對(duì)成績(jī)進(jìn)行數(shù)據(jù)合并步驟如下。使用concat函數(shù)進(jìn)行橫向堆疊使用concat函數(shù)縱向堆疊數(shù)據(jù)使用append()方法進(jìn)行縱向堆疊使用merge函數(shù)進(jìn)行主鍵合并處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)農(nóng)產(chǎn)品信息可視化分析——NumPy、pandas與Matplotlib庫(kù)任務(wù)描述水稻是全球最重要的糧食作物之一，水稻審定數(shù)據(jù)可以為農(nóng)業(yè)科技創(chuàng)新提供重要的參考和依據(jù)，可以幫助選擇高產(chǎn)、優(yōu)質(zhì)、抗逆性強(qiáng)的水稻品種，促進(jìn)綠色、可持續(xù)的農(nóng)業(yè)生產(chǎn)方式，有助于推動(dòng)農(nóng)業(yè)的可持續(xù)發(fā)展。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)本任務(wù)先了解水稻信息數(shù)據(jù)的情況，根據(jù)數(shù)據(jù)檢測(cè)的內(nèi)容可知數(shù)據(jù)存在缺失值、重復(fù)值、異常值的情況，并對(duì)數(shù)據(jù)中的缺失值、重復(fù)值、異常值進(jìn)行處理，增強(qiáng)后續(xù)數(shù)據(jù)分析的效果。對(duì)數(shù)據(jù)進(jìn)行仔細(xì)的處理和清洗，確保數(shù)據(jù)的質(zhì)量可靠，為后續(xù)的數(shù)據(jù)分析和決策提供更可信的基礎(chǔ)，也展現(xiàn)了勞動(dòng)精神的價(jià)值和應(yīng)用。任務(wù)要求讀取農(nóng)產(chǎn)品基本信息數(shù)據(jù)。檢測(cè)數(shù)據(jù)缺失值的情況，并進(jìn)行缺失值處理。檢測(cè)數(shù)據(jù)異常值的情況，并進(jìn)行異常值處理。檢測(cè)數(shù)據(jù)重復(fù)值的情況，并進(jìn)行重復(fù)值處理。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)數(shù)據(jù)讀取與寫入pandas數(shù)據(jù)結(jié)構(gòu)pandas數(shù)據(jù)處理pandas數(shù)據(jù)處理處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)pandas數(shù)據(jù)處理數(shù)據(jù)清洗數(shù)據(jù)合并分組聚合分組聚合處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)依據(jù)某個(gè)或某幾個(gè)特征對(duì)數(shù)據(jù)集進(jìn)行分組，并對(duì)各組應(yīng)用一個(gè)函數(shù)，無(wú)論是聚合還是轉(zhuǎn)換，都是數(shù)據(jù)分析的常用操作。分組聚合處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)pandas提供了一個(gè)靈活高效的groupby()方法，配合agg()方法能夠?qū)崿F(xiàn)分組聚合的操作。groupby()方法提供的是分組聚合步驟中的拆分功能，能夠根據(jù)索引或特征對(duì)數(shù)據(jù)進(jìn)行分組，其基本使用格式如下。DataFrame.groupby(by=None,axis=0,level=None,as_index=True,sort=True,group_keys=True,squeeze=<no_default>,observed=False,dropna=True)分組聚合處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)groupby()方法常用參數(shù)及其說(shuō)明如下。參數(shù)名稱參數(shù)說(shuō)明by接收l(shuí)ist、str、mapping、function或generator。表示用于確定進(jìn)行分組的依據(jù)，若傳入的是一個(gè)函數(shù)，則對(duì)索引進(jìn)行計(jì)算并分組；若傳入的是一個(gè)字典或Series，則字典或Series的值用于作為分組依據(jù)；若傳入一個(gè)NumPy數(shù)組，則數(shù)據(jù)的元素作為分組依據(jù)；若傳入的是字符串或字符串列表，則使用這些字符串所代表的特征作為分組依據(jù)。默認(rèn)為Noneaxis接收0或1。表示操作的軸向。默認(rèn)為0分組聚合處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)groupby()方法常用參數(shù)及其說(shuō)明如下。參數(shù)名稱參數(shù)說(shuō)明level接收int或索引名。表示標(biāo)簽所在級(jí)別。默認(rèn)為Noneas_index接收bool。表示聚合后的聚合標(biāo)簽是否以DataFrame索引形式輸出。默認(rèn)為Truesort接收bool。表示是否對(duì)分組依據(jù)、分組標(biāo)簽進(jìn)行排序。默認(rèn)為Truegroup_keys接收bool。表示是否顯示分組標(biāo)簽的名稱。默認(rèn)為True分組聚合處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)分組后的結(jié)果并不能直接查看，而是被存在內(nèi)存中，輸出的是內(nèi)存地址。實(shí)際上，分組后的數(shù)據(jù)對(duì)象GroupBy類似于Series與DataFrame，是pandas提供的一種對(duì)象。GroupBy對(duì)象常用的描述性統(tǒng)計(jì)方法及說(shuō)明如右表所示。方法名稱方法說(shuō)明count返回各組的計(jì)數(shù)值，不包括缺失值head返回每組的前n個(gè)值max返回每組最大值mean返回每組的均值median返回每組的中位數(shù)分組聚合處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)分組后的結(jié)果并不能直接查看，而是被存在內(nèi)存中，輸出的是內(nèi)存地址。實(shí)際上，分組后的數(shù)據(jù)對(duì)象GroupBy類似于Series與DataFrame，是pandas提供的一種對(duì)象。GroupBy對(duì)象常用的描述性統(tǒng)計(jì)方法及說(shuō)明如右表所示。方法名稱方法說(shuō)明cumcount對(duì)每個(gè)分組中的組員進(jìn)行標(biāo)記，0～n-1size返回每組的大小min返回每組最小值std返回每組的標(biāo)準(zhǔn)差sum返回每組的和分組聚合處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)agg()方法和aggregate()方法都支持對(duì)每個(gè)分組應(yīng)用某函數(shù)，包括Python內(nèi)置函數(shù)或自定義函數(shù)。同時(shí)，這兩個(gè)方法也能夠直接對(duì)DataFrame進(jìn)行函數(shù)應(yīng)用操作。針對(duì)DataFrame的agg()方法與aggregate()方法的基本使用格式如下。DataFrame.agg(func,axis=0,*args,**kwargs)DataFrame.aggregate(func,axis=0,*args,**kwargs)agg()方法與aggregate()方法分組聚合處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)agg()方法與aggregate()方法常用參數(shù)及其說(shuō)明如下。參數(shù)名稱參數(shù)說(shuō)明func接收l(shuí)ist、dict、function或str。表示用于聚合數(shù)據(jù)的函數(shù)。無(wú)默認(rèn)值axis接收0或1。代表操作的軸向。默認(rèn)為0在正常使用過(guò)程中，agg()方法和aggregate()方法對(duì)DataFrame對(duì)象操作時(shí)的功能幾乎完全相同，因此只需要掌握其中一個(gè)方法即可。分組聚合處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)對(duì)應(yīng)屆生招聘數(shù)據(jù)進(jìn)行分組聚合的流程如下。使用groupby()方法根據(jù)學(xué)歷要求對(duì)招聘數(shù)據(jù)進(jìn)行分組結(jié)合agg()方法，計(jì)算應(yīng)屆生招聘數(shù)據(jù)中不同學(xué)歷要求的工資平均值讀取農(nóng)產(chǎn)品基本信息數(shù)據(jù)缺失值檢測(cè)與處理異常值檢測(cè)與處理重復(fù)值檢測(cè)與處理存儲(chǔ)數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)使用pandas庫(kù)中pd.read_csv函數(shù)讀取農(nóng)產(chǎn)品基本信息數(shù)據(jù)查看農(nóng)產(chǎn)品基本信息數(shù)據(jù)的基本屬性，大致了解水稻信息數(shù)據(jù)的情況使用isnull()方法和sum()方法對(duì)農(nóng)產(chǎn)品基本信息數(shù)據(jù)中缺失值進(jìn)行檢測(cè)使用dropna()方法對(duì)缺失值進(jìn)行刪除處理處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)的具體流程如下。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)的具體流程如下。水稻數(shù)據(jù)中可能存在“?”和“/”兩類異常值，使用isin()方法和sum()方法對(duì)其進(jìn)行檢測(cè)使用“!=”運(yùn)算符剔除包含異常字符的行數(shù)據(jù)使用duplicated()方法和sum()方法對(duì)農(nóng)產(chǎn)品基本信息數(shù)據(jù)中重復(fù)值進(jìn)行檢測(cè)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)的具體流程如下。使用drop_duplicates()方法刪除品種名稱和審定編號(hào)兩個(gè)字段均重復(fù)的水稻信息數(shù)據(jù)使用to_csv()方法將處理好的數(shù)據(jù)存儲(chǔ)為ricedata_clean.csv分析農(nóng)產(chǎn)品數(shù)量情況農(nóng)產(chǎn)品信息可視化分析——NumPy、pandas與Matplotlib庫(kù)任務(wù)描述數(shù)據(jù)可視化通過(guò)圖表直觀地展示數(shù)據(jù)間的量級(jí)關(guān)系，其目的是將抽象信息轉(zhuǎn)換為具體的圖形，將隱藏于數(shù)據(jù)中的規(guī)律直觀地展現(xiàn)出來(lái)。圖表是數(shù)據(jù)分析可視化最重要的工具，使用Python中的Matplotlib庫(kù)從水稻信息數(shù)據(jù)進(jìn)行可視化分析，以便于為水稻產(chǎn)業(yè)的發(fā)展提供一定的參考。要分析不同水稻品種的數(shù)量分布情況，不同品種的數(shù)量分布情況，不同審定部門對(duì)水稻品種的審定情況，對(duì)水稻品種的數(shù)量分布情況和審定部門的審定情況進(jìn)行分析。以上對(duì)水稻品種數(shù)量分布情況和審定情況的分析，可以通過(guò)科技手段和優(yōu)良品種的推廣來(lái)提高農(nóng)業(yè)生產(chǎn)效益，為優(yōu)化審定機(jī)制和提升品種審定效率提供參考。分析農(nóng)產(chǎn)品數(shù)量情況任務(wù)要求繪制柱形圖分析省級(jí)以上部門審定數(shù)量。繪制餅圖分析水稻品種數(shù)量。繪制柱形圖分析省級(jí)以上部門與水稻品種的關(guān)系。繪制折線圖分析農(nóng)業(yè)部審定數(shù)量。分析農(nóng)產(chǎn)品數(shù)量情況基礎(chǔ)語(yǔ)法與常用參數(shù)繪制基本圖形基礎(chǔ)語(yǔ)法與常用參數(shù)Matplotlib是用于數(shù)據(jù)可視化的最流行的Python包之一。它是一個(gè)跨平臺(tái)庫(kù)，用于根據(jù)數(shù)組中的數(shù)據(jù)制作2D圖。Matplotlib庫(kù)由各種可視化的類構(gòu)成，matplotlib.pyplot是繪制各類可視化圖形的命令子庫(kù)它提供了一個(gè)面向?qū)ο蟮腁PI，有助于使用PythonGUI工具包在應(yīng)用程序中嵌入繪圖。在使用Matplotlib庫(kù)繪制圖表前，需要先了解Matplotlib的基礎(chǔ)語(yǔ)法與常用參數(shù)。分析農(nóng)產(chǎn)品數(shù)量情況pyplot基礎(chǔ)語(yǔ)法分析農(nóng)產(chǎn)品數(shù)量情況創(chuàng)建畫布與創(chuàng)建子圖添加畫布內(nèi)容保存與顯示圖形創(chuàng)建畫布與創(chuàng)建子圖分析農(nóng)產(chǎn)品數(shù)量情況第一部分的主要作用是構(gòu)建出一張空白的畫布，并可以選擇是否將整個(gè)畫布劃分為多個(gè)部分，方便在同一幅圖上繪制多個(gè)圖形的情況。當(dāng)只需要繪制一幅簡(jiǎn)單的圖形時(shí)，這部分內(nèi)容可以省略。在pyplot中，創(chuàng)建畫布以及創(chuàng)建并選中子圖的函數(shù)/方法如下表所示。函數(shù)/方法名稱函數(shù)/方法作用plt.figure創(chuàng)建一個(gè)空白畫布，可以指定畫布大小、像素figure.add_subplot()創(chuàng)建并選中子圖，可以指定子圖的行數(shù)、列數(shù)和選中圖片的編號(hào)為了方便查看，將各類函數(shù)和方法中的matplotlib.pyplot簡(jiǎn)寫為plt添加畫布內(nèi)容分析農(nóng)產(chǎn)品數(shù)量情況第二部分是繪圖的主體部分。其中的添加標(biāo)題、添加坐標(biāo)軸名稱、繪制圖形等步驟是并列的，沒(méi)有先后順序，可以先繪制圖形，也可以先添加各類標(biāo)簽。添加圖例一定要在繪制圖形之后。在pyplot中添加各類標(biāo)簽和圖例的常用函數(shù)如表所示。函數(shù)名稱函數(shù)作用plt.title在當(dāng)前圖形中添加標(biāo)題，可以指定標(biāo)題的名稱、位置、顏色、字體大小等參數(shù)plt.xlabel在當(dāng)前圖形中添加x軸標(biāo)簽，可以指定位置、顏色、字體大小等參數(shù)plt.ylabel在當(dāng)前圖形中添加y軸標(biāo)簽，可以指定位置、顏色、字體大小等參數(shù)plt.xlim指定當(dāng)前圖形x軸的范圍，只能確定一個(gè)數(shù)值區(qū)間，而無(wú)法使用字符串標(biāo)識(shí)plt.ylim指定當(dāng)前圖形y軸的范圍，只能確定一個(gè)數(shù)值區(qū)間，而無(wú)法使用字符串標(biāo)識(shí)plt.xticks獲取或設(shè)置x軸的當(dāng)前刻度位置和標(biāo)簽plt.yticks獲取或設(shè)置y軸的當(dāng)前刻度位置和標(biāo)簽plt.legend指定當(dāng)前圖形的圖例，可以指定圖例的大小、位置、標(biāo)簽保存與顯示圖形分析農(nóng)產(chǎn)品數(shù)量情況第三部分主要用于保存和顯示圖形，這部分內(nèi)容的常用函數(shù)只有兩個(gè)，并且參數(shù)很少，如下表所示。函數(shù)名稱函數(shù)作用plt.savefig保存繪制的圖形，可以指定圖形的分辨率、邊緣的顏色等參數(shù)plt.show在本機(jī)顯示圖形pyplot的動(dòng)態(tài)rc參數(shù)分析農(nóng)產(chǎn)品數(shù)量情況pyplot使用rc配置文件來(lái)自定義圖形的各種默認(rèn)屬性，被稱為rc配置或rc參數(shù)。在pyplot中，幾乎所有的默認(rèn)屬性都是可以控制的，如視圖窗口大小、線條寬度、顏色與樣式、坐標(biāo)軸、坐標(biāo)與網(wǎng)格屬性、文本、字體等。默認(rèn)rc參數(shù)可以在Python交互式環(huán)境中動(dòng)態(tài)更改。所有存儲(chǔ)在字典變量中的rc參數(shù)，都被稱為rcParams。rc參數(shù)在修改后，繪圖時(shí)使用默認(rèn)的參數(shù)就會(huì)發(fā)生改變。線條rc參數(shù)修改前后對(duì)比分析農(nóng)產(chǎn)品數(shù)量情況pyplot的動(dòng)態(tài)rc參數(shù)rc參數(shù)修改前圖形修改rc參數(shù)后的圖形線條常用的rc參數(shù)名稱、解釋與取值分析農(nóng)產(chǎn)品數(shù)量情況pyplot的動(dòng)態(tài)rc參數(shù)rc參數(shù)名稱解釋取值lines.linewidth線條寬度取0～10之間的數(shù)值，默認(rèn)為1.5lines.markersize點(diǎn)的大小取0～10之間的數(shù)值，默認(rèn)為1lines.linestyle線條樣式可取“-”“--”“-.”“：”4種。默認(rèn)為“-”lines.marker線條上點(diǎn)的形狀可取“o”“D”“h”“.”“,”“S”等20種，默認(rèn)為Nonelines.linestyle參數(shù)取值及意義分析農(nóng)產(chǎn)品數(shù)量情況pyplot的動(dòng)態(tài)rc參數(shù)lines.linestyle取值意義lines.linestyle取值意義‘-’實(shí)線‘-.’點(diǎn)線‘--’長(zhǎng)虛線‘:’短虛線lines.marker參數(shù)取值及意義分析農(nóng)產(chǎn)品數(shù)量情況pyplot的動(dòng)態(tài)rc參數(shù)lines.marker取值意義lines.marker取值意義‘8’八邊形‘<’一角朝左的三角形‘p’五邊形‘>’一角朝右的三角形‘，’像素‘^’一角朝上的三角形‘+’加號(hào)‘\’豎線‘None’無(wú)‘x’Xpyplot的動(dòng)態(tài)rc參數(shù)如何使中文正常顯示？分析農(nóng)產(chǎn)品數(shù)量情況由于默認(rèn)的pyplot字體并不支持中文字符的顯示，因此需要通過(guò)設(shè)置font.sans-serif參數(shù)來(lái)改變繪圖時(shí)的字體，使得圖形可以正常顯示中文。由于更改字體后，會(huì)導(dǎo)致坐標(biāo)軸中的部分字符無(wú)法顯示，因此需要同時(shí)更改axes.unicode_minus參數(shù)。pyplot的動(dòng)態(tài)rc參數(shù)rc參數(shù)修改前后對(duì)比圖分析農(nóng)產(chǎn)品數(shù)量情況未設(shè)置rc參數(shù)顯示中文標(biāo)題設(shè)置rc參數(shù)后分析農(nóng)產(chǎn)品數(shù)量情況農(nóng)產(chǎn)品信息可視化分析——NumPy、pandas與Matplotlib庫(kù)任務(wù)描述數(shù)據(jù)可視化通過(guò)圖表直觀地展示數(shù)據(jù)間的量級(jí)關(guān)系，其目的是將抽象信息轉(zhuǎn)換為具體的圖形，將隱藏于數(shù)據(jù)中的規(guī)律直觀地展現(xiàn)出來(lái)。圖表是數(shù)據(jù)分析可視化最重要的工具，使用Python中的Matplotlib庫(kù)從水稻信息數(shù)據(jù)進(jìn)行可視化分析，以便于為水稻產(chǎn)業(yè)的發(fā)展提供一定的參考。要分析不同水稻品種的數(shù)量分布情況，不同品種的數(shù)量分布情況，不同審定部門對(duì)水稻品種的審定情況，對(duì)水稻品種的數(shù)量分布情況和審定部門的審定情況進(jìn)行分析。以上對(duì)水稻品種數(shù)量分布情況和審定情況的分析，可以通過(guò)科技手段和優(yōu)良品種的推廣來(lái)提高農(nóng)業(yè)生產(chǎn)效益，為優(yōu)化審定機(jī)制和提升品種審定效率提供參考。分析農(nóng)產(chǎn)品數(shù)量情況任務(wù)要求繪制柱形圖分析省級(jí)以上部門審定數(shù)量。繪制餅圖分析水稻品種數(shù)量。繪制柱形圖分析省級(jí)以上部門與水稻品種的關(guān)系。繪制折線圖分析農(nóng)業(yè)部審定數(shù)量。分析農(nóng)產(chǎn)品數(shù)量情況基礎(chǔ)語(yǔ)法與常用參數(shù)繪制基本圖形繪制基本圖形分析農(nóng)產(chǎn)品數(shù)量情況Matplotlib庫(kù)是用于可視化的繪圖庫(kù)，可以繪制常用的2D與3D圖形。折線圖散點(diǎn)圖柱形圖餅圖繪制散點(diǎn)圖什么是散點(diǎn)圖？分析農(nóng)產(chǎn)品數(shù)量情況散點(diǎn)圖又稱為散點(diǎn)分布圖，是以一個(gè)特征為橫坐標(biāo)，以另一個(gè)特征為縱坐標(biāo)，利用坐標(biāo)點(diǎn)（散點(diǎn)）的分布形態(tài)反映特征間的統(tǒng)計(jì)關(guān)系的一種圖形。值由點(diǎn)在圖表中的位置表示，類別由圖表中的不同標(biāo)記表示，通常用于比較跨類別的數(shù)據(jù)。繪制散點(diǎn)圖分析農(nóng)產(chǎn)品數(shù)量情況散點(diǎn)圖可以提供兩類關(guān)鍵信息，具體內(nèi)容如下。特征之間是否存在數(shù)值或數(shù)量的關(guān)聯(lián)趨勢(shì)，關(guān)聯(lián)趨勢(shì)是線性的還是非線性的。如果某一個(gè)點(diǎn)或某幾個(gè)點(diǎn)偏離大多數(shù)點(diǎn)，那么這些點(diǎn)就是離群值，通過(guò)散點(diǎn)圖可以一目了然，從而可以進(jìn)一步分析這些離群值是否在建模分析中產(chǎn)生較大的影響。散點(diǎn)圖可通過(guò)散點(diǎn)的疏密程度和變化趨勢(shì)表示兩個(gè)特征的數(shù)量關(guān)系。如果有3個(gè)特征，若其中一個(gè)特征為類別型，散點(diǎn)圖可改變不同特征的點(diǎn)的形狀或顏色，那么即可了解兩個(gè)數(shù)值型特征和這個(gè)類別型之間的關(guān)系。繪制散點(diǎn)圖分析農(nóng)產(chǎn)品數(shù)量情況pyplot中繪制散點(diǎn)圖的函數(shù)為scatter，scatter函數(shù)的基本使用格式如下。matplotlib.pyplot.scatter(x,y,s=None,c=None,marker=None,cmap=None,norm=None,vmin=None,vmax=None,alpha=None,linewidths=None,*,edgecolors=None,plotnonfinite=False,data=None,**kwargs)繪制散點(diǎn)圖scatter函數(shù)常用參數(shù)及其說(shuō)明如下。分析農(nóng)產(chǎn)品數(shù)量情況參數(shù)名稱參數(shù)說(shuō)明x，y接收f(shuō)loat或array。表示x軸和y軸對(duì)應(yīng)的數(shù)據(jù)。無(wú)默認(rèn)值s接收f(shuō)loat或array。表示指定點(diǎn)的大小，若傳入一維數(shù)組，則表示每個(gè)點(diǎn)的大小。默認(rèn)為Nonec接收顏色或array。表示指定點(diǎn)的顏色，若傳入一維數(shù)組，則表示每個(gè)點(diǎn)的顏色。默認(rèn)為Nonemarker接收特定str。表示繪制的點(diǎn)的類型。默認(rèn)為Nonealpha接收f(shuō)loat。表示點(diǎn)的透明度。默認(rèn)為None繪制散點(diǎn)圖分析農(nóng)產(chǎn)品數(shù)量情況現(xiàn)有2021年9月20日到10月20日某網(wǎng)站招聘信息數(shù)量數(shù)據(jù)，存儲(chǔ)為某網(wǎng)站招聘信息數(shù)量.csv，部分?jǐn)?shù)據(jù)如下所示。日期總招聘信息數(shù)量/個(gè)本科招聘信息數(shù)量/個(gè)大專及以下招聘信息數(shù)量/個(gè)碩士招聘信息數(shù)量/個(gè)2021/9/20533304189402021/9/21515363137152021/9/22531342166232021/9/23543332195162021/9/2459534919254繪制散點(diǎn)圖分析農(nóng)產(chǎn)品數(shù)量情況繪制隨時(shí)間變化的不同學(xué)歷要求的招聘數(shù)據(jù)量變化的散點(diǎn)圖。繪制折線圖分析農(nóng)產(chǎn)品數(shù)量情況折線圖（LineChart）是一種將數(shù)據(jù)點(diǎn)按照順序連接起來(lái)的圖形，可以看作是將散點(diǎn)圖按照x軸坐標(biāo)順序連接起來(lái)的圖形。折線圖的主要功能是查看因變量y隨著自變量x改變的趨勢(shì)，最適合用于顯示隨時(shí)間（根據(jù)常用比例設(shè)置）而變化的連續(xù)數(shù)據(jù)。同時(shí)還可以看出數(shù)量的差異，增長(zhǎng)趨勢(shì)的變化。繪制折線圖分析農(nóng)產(chǎn)品數(shù)量情況pyplot中繪制折線圖的函數(shù)為plot，plot函數(shù)的基本使用格式如下。matplotlib.pyplot.plot(*args,scalex=True,scaley=True,data=None,**kwargs)繪制折線圖分析農(nóng)產(chǎn)品數(shù)量情況plot函數(shù)常用參數(shù)及其說(shuō)明如下。參數(shù)名稱參數(shù)說(shuō)明color接收特定str。表示指定線條的顏色。默認(rèn)為Nonelinestyle接收特定str。表示指定線條類型。默認(rèn)為“-”marker接收特定str。表示繪制的點(diǎn)的類型。默認(rèn)為Nonealpha接收f(shuō)loat。表示點(diǎn)的透明度。默認(rèn)為Nonex，y接收array。表示x軸和y軸對(duì)應(yīng)的數(shù)據(jù)。無(wú)默認(rèn)值Scalex和s

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》課件項(xiàng)目二農(nóng)產(chǎn)品信息可視化分析-NumPy、pandas 與 Matplotlib 庫(kù)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》 課件 項(xiàng)目二 農(nóng)產(chǎn)品信息可視化分析-NumPy、pandas 與 Matplotlib 庫(kù)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》課件項(xiàng)目二農(nóng)產(chǎn)品信息可視化分析-NumPy、pandas 與 Matplotlib 庫(kù)