《獸醫(yī)統(tǒng)計(jì)學(xué)》02資料整理_第1頁
《獸醫(yī)統(tǒng)計(jì)學(xué)》02資料整理_第2頁
《獸醫(yī)統(tǒng)計(jì)學(xué)》02資料整理_第3頁
《獸醫(yī)統(tǒng)計(jì)學(xué)》02資料整理_第4頁
《獸醫(yī)統(tǒng)計(jì)學(xué)》02資料整理_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2.1異常數(shù)據(jù)的判斷和處理2.2資料的分類2.3數(shù)據(jù)的頻率分布2.4統(tǒng)計(jì)表2.5統(tǒng)計(jì)圖2.6集中趨勢(shì)的度量2.7離散趨勢(shì)的度量

第二章資料的整理1.資料的整理原始資料常常經(jīng)過較長時(shí)間或較多人員的積累,量大且“雜亂無章”,不能直接用于統(tǒng)計(jì)分析,必須進(jìn)行整理1)審核與訂正(保證數(shù)據(jù)的可靠性)2)分組或匯總3)計(jì)算數(shù)字特征(描述性統(tǒng)計(jì))4)構(gòu)成統(tǒng)計(jì)圖表2.資料的分類資料的分類(一)連續(xù)性資料(continuousdata)

在一定范圍內(nèi)可取任何實(shí)數(shù)值的數(shù)據(jù)資料

例如動(dòng)物個(gè)體的重量等,又稱計(jì)量資料(quantitativedata)連續(xù)性資料

測(cè)量得到數(shù)據(jù)有度量衡單位連續(xù)性變異資料如某一患者的身高(cm)、體重(kg)、紅細(xì)胞計(jì)數(shù)(1012/L)、脈搏(次/分)、血壓(KPa)

(二)離散性資料(discretedata)

在一定范圍內(nèi)只取有限種可能值的數(shù)據(jù)資料1、計(jì)數(shù)資料(countingdata)7811141012111010710121110101191281012101011810810111310911121012991110111113111413101113111310109111189911107101312121310119表2-170頭經(jīng)產(chǎn)母豬窩產(chǎn)仔數(shù)資料單位:頭2、分類資料(categoricaldata)(1)一般分類資料(nominaldata)(2)等級(jí)資料(rankeddata)毛色次數(shù)(f)頻數(shù)(%)白色黑色花色332962273.7821.334.89合計(jì)450100.00白豬和黑豬子二代的毛色分離情況如調(diào)查某地某時(shí)的男、女性人口數(shù);治療一批患者,其治療效果為治愈、有效、無效的人數(shù);調(diào)查一批少數(shù)民族居民的A、B、AB、O四種血型的人數(shù)等。離散性資料計(jì)數(shù)得到數(shù)據(jù)整數(shù)間斷性資料連續(xù)性資料

測(cè)量得到數(shù)據(jù)有度量衡單位連續(xù)性變異資料2.3數(shù)據(jù)的頻率分布離散型資料:對(duì)于分類資料,其頻率分布就是屬于不同類別的觀測(cè)值出現(xiàn)的次數(shù)(頻數(shù))和所占的比例(頻率)。對(duì)于計(jì)數(shù)資料,則以每個(gè)自然值代表一類,計(jì)算各類中觀測(cè)值出現(xiàn)的頻數(shù)和頻率。產(chǎn)仔數(shù)頻數(shù)累計(jì)頻數(shù)頻率(%)7222.868577.14991612.8610203628.5711175324.291286111.431376810.00142702.86總和70

100.00表2-270頭經(jīng)產(chǎn)母豬窩產(chǎn)仔數(shù)資料的頻數(shù)分布表自然分組二、資料的整理(一)計(jì)數(shù)資料的整理2.3數(shù)據(jù)的頻率分布2.連續(xù)型資料:首先要將資料進(jìn)行分組,然后將各個(gè)觀測(cè)值歸入相應(yīng)的組中,計(jì)算各組中觀測(cè)值出現(xiàn)的頻數(shù)和頻率。17.011.014.313.015.510.013.516.011.514.512.016.513.012.815.511.513.013.012.09.011.819.314.015.014.011.515.013.513.012.314.815.513.015.017.59.013.514.513.09.510.314.017.512.014.512.511.512.815.018.013.514.314.58.515.317.510.512.59.013.010.512.515.58.912.517.514.513.013.511.017.913.013.516.515.315.013.514.59.010.519.012.513.014.512.513.012.516.513.012.59.512.010.012.011.012.511.011.510.012.59.312.011.511.011.510.511.512.09.516.511.311.58.811.59.513.012.513.012.514.511.011.514.514.012.512.511.513.09.013.513.310.012.517.511.510.010.011.011.59.016.615.015.816.813.512.59.010.515.014.016.315.512.311.014.013.017.012.017.011.516.512.011.513.511.516.09.011.015.011.511.017.014.515.011.018.812.013.514.011.515.012.015.515.011.317.016.012.015.511.812.59.810.014.512.512.010.513.016.011.8表2-3200頭金華豬二月齡體重資料單位:kg2.3數(shù)據(jù)的頻率分布1)數(shù)據(jù)分組:將觀測(cè)值的值域劃分為若干個(gè)互不相交且長度相同的區(qū)間。

求全距:計(jì)算最大值與最小值之差,本例為19.3-8.5=10.8;確定組數(shù):看樣本資料中數(shù)據(jù)的多少確定組距:每組的最大值與最小值之差,全距除以組數(shù)后取整,本例為10.8/12=0.9,取整數(shù)1為組距;計(jì)算各組中值、組下限與組上限:通常先確定第一組的組中值,使它與資料中的最小值相近,本例為8.5;

然后依次計(jì)算其它各組的組中值(本例為9.5,10.5,等等)及各組的組下限(本例為8,9,等等)與組上限(本例為9,10,等等);89101112131415161718198.59.5等等組中值8.99.9等等組限89等等組下限最后計(jì)算各組中觀測(cè)值出現(xiàn)的頻數(shù)和頻率。7.9左閉右開頻數(shù)分布表(frequencydistribution)組中值(classmid-value)問題:頻數(shù)分布表的目的?原始數(shù)據(jù)的轉(zhuǎn)換??分類資料的整理2011-09答10級(jí)動(dòng)科班問中位數(shù)到底是什么?P20E(XY)=E(X)*E(Y)嗎?P29中位數(shù)(第50百分位數(shù)、0.5分位數(shù))表示(呈偏態(tài)分布)數(shù)據(jù)的集中趨勢(shì)。直觀印象描述:一半比“我”小,一半比“我”大。定義:樣本觀測(cè)值按大小排序后位于中間的一個(gè)觀測(cè)值或兩個(gè)觀測(cè)值的算術(shù)平均數(shù)。(P21)(另見《大學(xué)數(shù)學(xué),概率論及試驗(yàn)統(tǒng)計(jì),第二版》,余家林/朱倩軍主編,高教出版社)也就是說:中位數(shù)可以在這組數(shù)據(jù)中,也可以不在其中。意義:反映了全體數(shù)據(jù)的一般水平,是樣本數(shù)據(jù)所占頻率的等分線,不受極端值的影響。中位數(shù)(舉例)2、3、4、5、6、7,median=(4+5)/2=4.5“張村有個(gè)張千萬,隔壁九個(gè)窮光蛋,平均起來算一算,人人都是張百萬”:1000、0、0、0、0、0、0、0、0、0:Mean=(1000+0+0+0+0+0+0+0+0+0)/10=100Median=(0+0)/2=01、4、4、4、4、6、6、6:med=(4+4)/2=41、4、4、4、4、6、6:med=41、4、4、4:med=(4+4)/2=4中位數(shù)涵義中位數(shù)指示的是(有序)數(shù)列中間位置的大小,也就是說中間這個(gè)位置應(yīng)該是多大才可以將數(shù)據(jù)盡量等分,而與數(shù)據(jù)本身沒有直接關(guān)系;1、2、3數(shù)列,Md=2,與數(shù)據(jù)本身的2沒有直接關(guān)系,意思是至少有一半的數(shù)小于等于2,有一半的數(shù)大于等于2;1、2、3、4數(shù)列,Md=2.5,可不在數(shù)列中;0、0、0、4極端偏態(tài)數(shù)列,Md=0,數(shù)據(jù)不可能被分為大致相等的兩半;中位數(shù)是“人大代表”,代表大多數(shù)的大?。话俜治粩?shù)(點(diǎn)):將一組n個(gè)數(shù)據(jù)由小到大排序后,如果小于某個(gè)數(shù)值的數(shù)據(jù)個(gè)數(shù)為(不少于)全體數(shù)據(jù)個(gè)數(shù)的x%,則稱該數(shù)為x%分位數(shù)(點(diǎn))。25%分位數(shù)又稱為下四分位數(shù),0.25n個(gè)數(shù)后一位50%分位數(shù)又稱為中位數(shù),0.50n個(gè)數(shù)后一位75%分位數(shù)又稱為上四分位數(shù)。0.75n個(gè)數(shù)后一位

8個(gè)數(shù)1、2、2、2、4、6、6、6Md=(2+4)/2=3,4≠3,問題在哪兒??百分位數(shù)percentile的“模糊”定義第p百分位數(shù)是這樣一個(gè)值,它使得至少有p%的數(shù)據(jù)項(xiàng)小于或等于這個(gè)值,且至少有(100-p)%的數(shù)據(jù)項(xiàng)大于或等于這個(gè)值。例子:高等院校的入學(xué)考試成績排名如某個(gè)考生的原始分?jǐn)?shù)為54分,相對(duì)于其他學(xué)生來說,他的成績?nèi)绾尾⒉蝗菀字溃侨绻?4分恰好對(duì)應(yīng)的是第70百分位數(shù),我們就能知道大約70%的學(xué)生的考分比他低,而約30%的學(xué)生考分比他高。常用的分位數(shù)是四分位數(shù)quartile第0個(gè)Quartile實(shí)際為通常所說的最小值第1個(gè)Quartile(1stQuartile)第2個(gè)Quartile實(shí)際為通常所說的中位數(shù)第3個(gè)Quartile(3rdQuartile)第4個(gè)Quartile實(shí)際為通常所說的最大值8個(gè)數(shù)1、2、2、2、4、6、6、6Q1Q3Q4Q0Q2證據(jù):/wiki/Percentile/wiki/Quartile分位數(shù)(包括中位數(shù))還沒有統(tǒng)一標(biāo)準(zhǔn),我們規(guī)定:Median:P21Percentile:P13異常數(shù)據(jù)答疑結(jié)束表1雖然在形式上構(gòu)成三線表,但并不符合三線表的原意;因?yàn)椤鞍疾凵疃取辈皇恰捌毓鈺r(shí)間”和“顯影時(shí)間”的屬性或特征,而“0.5、1、1.5、2、2.5、3”更不能單獨(dú)放在項(xiàng)目欄作為項(xiàng)目名稱。78910111213142592017872(頻數(shù))27163653616870(累計(jì)頻數(shù))2.91022.951.475.787.197.1100(累計(jì)頻率)25%分位數(shù)Q1為10,

50%分位數(shù)Med為10,75%分位數(shù)Q3為11。由小到大排序后三、常用統(tǒng)計(jì)表和統(tǒng)計(jì)圖編輯學(xué)報(bào)ACTAEDITOLOGICA2006-08-18(4)三線表使用中常見的2種錯(cuò)誤劉祥娥林琳(青島科技大學(xué)學(xué)報(bào)編輯部,266042,山東青島)摘要

三線表因其結(jié)構(gòu)簡明、排版方便等優(yōu)點(diǎn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論