版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上用python進(jìn)行數(shù)據(jù)分析1、 樣本集本樣本集來源于某高中某班78位同學(xué)的一次月考的語文成績。因?yàn)槊课煌瑢W(xué)的成績都是獨(dú)立的隨機(jī)變量,遂可以保證得到的觀測值也是獨(dú)立且隨機(jī)的樣本如下:grades=131,131,127,123,126,129,116,114,115,116,123,122,118, 121,126,121,126,121,111,119,124,124,121,116,114,116, 116,118,112,109,114,116,116,118,112,109,114,110,114, 110,113,117,113,121,105,127,110
2、,105,111,112,104,103, 130,102,118,101,112,109,107,94,107,106,105,101,85,95, 97,99,83,87,82,79,99,90,78,86,75,66;2、 數(shù)據(jù)分析1. 中心位置(均值、中位數(shù)、眾數(shù))數(shù)據(jù)的中心位置是我們最容易想到的數(shù)據(jù)特征。借由中心位置,我們可以知道數(shù)據(jù)的一個(gè)平均情況,如果要對新數(shù)據(jù)進(jìn)行預(yù)測,那么平均情況是非常直觀地選擇。數(shù)據(jù)的中心位置可分為均值(Mean),中位數(shù)(Median),眾數(shù)(Mode)。其中均值和中位數(shù)用于定量的數(shù)據(jù),眾數(shù)用于定性的數(shù)據(jù)。均值:利用python編寫求平均值的函數(shù)很容易得到本
3、次樣本的平均值得到本次樣本均值為109.9中位數(shù):113眾數(shù):1162. 頻數(shù)分析2.1頻數(shù)分布直方圖柱狀圖是以柱的高度來指代某種類型的頻數(shù),使用Matplotlib對成績這一定性變量繪制柱狀圖的代碼如下:這里我主要使用matplotlib.pyplot as plt上的bar()函數(shù)畫出直方圖。這里所使用的text和title方法是用來給圖形加上標(biāo)注和題目的。運(yùn)行程序可得到如下頻率分布直方圖:這里我將數(shù)據(jù)分為八組:6070,7080,8090,90100,100110,110120,120130,130140;每組對應(yīng)中點(diǎn)為:66,77.3,84.6,95.6,105.2,114.4,123
4、.9,130.7每組對應(yīng)頻率:0.01,0.04,0.06,0.08,0.18,0.38,0.21,0.04從該頻率直方圖我們可以看出該班成績主要分布在100130區(qū)間,當(dāng)然也存在130多的高分和60多的低分。總體成績還算不錯,低于均分的同學(xué)要繼續(xù)努力。2.2相對頻率折線圖這里我主要使用matplotlib.pyplot as plt上的plot()函數(shù)畫出折線圖。程序代碼如下:運(yùn)行程序可得到如下折線圖:通過折線圖我們可以更加清楚的明白這個(gè)班級的成績分布,高于一百分的同學(xué)占絕大多數(shù),而低于一百分的也占有一定的比例。2.3箱須圖中位數(shù):113上四分位數(shù):Q1=124下四分位數(shù):Q2=105四分位
5、數(shù)差:IQR=19此時(shí)可以繪制該班的箱須圖進(jìn)行成績分析,這里使用Matplotlib中的boxplot繪制關(guān)于身高的箱形圖,程序如下:運(yùn)行程序后可以得到該班關(guān)于成績的箱須圖:從該箱須圖也可以清楚的看出本班的成績分布,以及中位數(shù)所在的位置所在。由于箱須圖的主要目的用來比較,而這里只有一組數(shù)據(jù),就不進(jìn)行比較了。但是仍要注意的是在下邊緣以外的異常值點(diǎn),這些同學(xué)的成績在本班處于墊底,應(yīng)格外注意這些同學(xué)的學(xué)習(xí)習(xí)慣,積極引導(dǎo)和教育。2.4經(jīng)驗(yàn)累積分布圖總體的分布函數(shù)稱為理論分布函數(shù)。經(jīng)驗(yàn)累積分布函數(shù)利用樣本來估計(jì)和推斷總體的分布函數(shù)F(x).這里主要利用我利用python的Matplotlib編寫了dra
6、wCumulativeHist函數(shù)進(jìn)行經(jīng)驗(yàn)累積分布圖的繪制,程序如下:可得到如下的經(jīng)驗(yàn)累積分布圖從該經(jīng)驗(yàn)累積圖上可以直觀的看出該樣本服從正態(tài)分布。此時(shí)我們可以畫出正態(tài)概率分布圖進(jìn)行驗(yàn)證。2.5正態(tài)概率分布圖在經(jīng)驗(yàn)累積分布圖上連接上四分位點(diǎn)和下四分位點(diǎn)并延長,可以得到正態(tài)概率分布圖,程序如下:運(yùn)行程序得到正態(tài)概率分布圖。可見畫出的樣本數(shù)據(jù)的圖成線性,故該組數(shù)據(jù)服從正態(tài)分布。3、 結(jié)論通過以上種種方法對該組樣本進(jìn)行分析,我們發(fā)現(xiàn)改組樣本數(shù)據(jù)服從正態(tài)分布。該班的成績分布主要集中在100130區(qū)間,其中不乏高分但也有低于邊緣值的異常點(diǎn)。總體來說該班成績較好,但要注意對低分段同學(xué)進(jìn)行積極的引導(dǎo)鼓勵。四總結(jié)描述性統(tǒng)計(jì)是容易操作,直觀簡潔的數(shù)據(jù)分析手段。我們組通過python進(jìn)行對本組數(shù)據(jù)的畫圖分析,學(xué)習(xí)并掌握
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 大學(xué)生職業(yè)生涯規(guī)劃創(chuàng)業(yè)計(jì)劃書模板30
- 《電氣控制原理圖》課件
- DB32T-建筑工程BIM規(guī)劃報(bào)建數(shù)據(jù)規(guī)范編制說明
- 給予是快樂的課件公開課專用
- 《口腔潔治課件》課件
- 基因工程的基本操作程序課件
- 《TA溝通分析課程》課件
- 《伊犁河大橋》課件
- 生活處處有哲學(xué)課件
- 單位管理制度展示匯編【員工管理篇】
- 慢阻肺GOLD指南解讀
- T-BIE 003-2023 通孔回流焊接技術(shù)規(guī)范
- 口腔頜面外科學(xué) 09顳下頜關(guān)節(jié)疾病
- 臺達(dá)變頻器說明書
- 2023年廣東羅浮山旅游集團(tuán)有限公司招聘筆試題庫及答案解析
- DB11-T1835-2021 給水排水管道工程施工技術(shù)規(guī)程高清最新版
- 解剖篇2-1內(nèi)臟系統(tǒng)消化呼吸生理學(xué)
- 《小學(xué)生錯別字原因及對策研究(論文)》
- 智慧水庫平臺建設(shè)方案
- 系統(tǒng)性紅斑狼瘡-第九版內(nèi)科學(xué)
- 糧食平房倉設(shè)計(jì)規(guī)范
評論
0/150
提交評論