平均數(shù)標(biāo)準(zhǔn)差與變異系數(shù)_第1頁(yè)
平均數(shù)標(biāo)準(zhǔn)差與變異系數(shù)_第2頁(yè)
平均數(shù)標(biāo)準(zhǔn)差與變異系數(shù)_第3頁(yè)
平均數(shù)標(biāo)準(zhǔn)差與變異系數(shù)_第4頁(yè)
平均數(shù)標(biāo)準(zhǔn)差與變異系數(shù)_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第三章 平均數(shù)、標(biāo)準(zhǔn)差與變異系數(shù)本章重點(diǎn)介紹平均數(shù)(mean)、標(biāo)準(zhǔn)差(standard deviation)與變異系數(shù)(variation coefficient)三個(gè)常用統(tǒng)計(jì)量,前者用于反映資料的集中性,即觀測(cè)值以某一數(shù)值為中心而分布的性質(zhì);后兩者用于反映資料的離散性,即觀測(cè)值離中分散變異的性質(zhì)。第一節(jié) 平均數(shù)平均數(shù)是統(tǒng)計(jì)學(xué)中最常用的統(tǒng)計(jì)量,用來(lái)表明資料中各觀測(cè)值相對(duì)集中較多的中心位置。在畜牧業(yè)、水產(chǎn)業(yè)生產(chǎn)實(shí)踐和科學(xué)研究中,平均數(shù)被廣泛用來(lái)描述或比較各種技術(shù)措施的效果、畜禽某些數(shù)量性狀的指標(biāo)等等。平均數(shù)主要包括有算術(shù)平均數(shù)(arithmetic mean)、中位數(shù)(median)、眾數(shù)(m

2、ode)、幾何平均數(shù)(geometric mean)及調(diào)和平均數(shù)(harmonic mean),現(xiàn)分別介紹如下。一、算術(shù)平均數(shù)算術(shù)平均數(shù)是指資料中各觀測(cè)值的總和除以觀測(cè)值個(gè)數(shù)所得的商,簡(jiǎn)稱平均數(shù)或均數(shù),記為。算術(shù)平均數(shù)可根據(jù)樣本大小及分組情況而采用直接法或加權(quán)法計(jì)算。(一)直接法 主要用于樣本含量n30以下、未經(jīng)分組資料平均數(shù)的計(jì)算。設(shè)某一資料包含n個(gè)觀測(cè)值:x1、x2、xn,則樣本平均數(shù)可通過(guò)下式計(jì)算: (3-1) 其中,為總和符號(hào);表示從第一個(gè)觀測(cè)值x1累加到第n個(gè)觀測(cè)值xn。當(dāng)在意義上已明確時(shí),可簡(jiǎn)寫(xiě)為x,(3-1)式即可改寫(xiě)為: 【例3.1】 某種公牛站測(cè)得10頭成年公牛的體重分別為5

3、00、520、535、560、585、600、480、510、505、490(kg),求其平均體重。 由于x=500+520+535+560+585+600+480+510+505+490=5285,n=10代入(31)式得: 即10頭種公牛平均體重為528.5 kg。 (二)加權(quán)法 對(duì)于樣本含量n30以上且已分組的資料,可以在次數(shù)分布表的基礎(chǔ)上采用加權(quán)法計(jì)算平均數(shù),計(jì)算公式為: (3-2)式中:第i組的組中值; 第i組的次數(shù); 分組數(shù)第i組的次數(shù)fi是權(quán)衡第i組組中值xi在資料中所占比重大小的數(shù)量,因此fi稱為是xi的“權(quán)”,加權(quán)法也由此而得名。【例3.2】 將100頭長(zhǎng)白母豬的仔豬一月窩重

4、(單位:kg)資料整理成次數(shù)分布表如下,求其加權(quán)數(shù)平均數(shù)。表31 100頭長(zhǎng)白母豬仔豬一月窩重次數(shù)分布表組別組中值(x)次數(shù)(f)f x101534520256150303526910404530135050552413206065852070753225合計(jì)1004520利用(32)式得:即這100頭長(zhǎng)白母豬仔豬一月齡平均窩重為45.2kg。計(jì)算若干個(gè)來(lái)自同一總體的樣本平均數(shù)的平均數(shù)時(shí),如果樣本含量不等,也應(yīng)采用加權(quán)法計(jì)算?!纠?.3】 某牛群有黑白花奶牛1500頭,其平均體重為750 kg,而另一牛群有黑白花奶牛1200頭,平均體重為725 kg,如果將這兩個(gè)牛群混合在一起,其混合后平均體

5、重為多少?此例兩個(gè)牛群所包含的牛的頭數(shù)不等,要計(jì)算兩個(gè)牛群混合后的平均體重,應(yīng)以兩個(gè)牛群牛的頭數(shù)為權(quán),求兩個(gè)牛群平均體重的加權(quán)平均數(shù),即即兩個(gè)牛群混合后平均體重為738.89 kg。 (三)平均數(shù)的基本性質(zhì) 1、樣本各觀測(cè)值與平均數(shù)之差的和為零,即離均差之和等于零。 或簡(jiǎn)寫(xiě)成2、樣本各觀測(cè)值與平均數(shù)之差的平方和為最小,即離均差平方和為最小。(xi-)2<(xi- a)2 (常數(shù)a)或簡(jiǎn)寫(xiě)為:<以上兩個(gè)性質(zhì)可用代數(shù)方法予以證明,這里從略。對(duì)于總體而言,通常用表示總體平均數(shù),有限總體的平均數(shù)為: (3-3) 式中,N表示總體所包含的個(gè)體數(shù)。當(dāng)一個(gè)統(tǒng)計(jì)量的數(shù)學(xué)期望等于所估計(jì)的總體參數(shù)時(shí),

6、則稱此統(tǒng)計(jì)量為該總體參數(shù)的無(wú)偏估計(jì)量。統(tǒng)計(jì)學(xué)中常用樣本平均數(shù)()作為總體平均數(shù)()的估計(jì)量,并已證明樣本平均數(shù)是總體平均數(shù)的無(wú)偏估計(jì)量。二、中位數(shù)將資料內(nèi)所有觀測(cè)值從小到大依次排列,位于中間的那個(gè)觀測(cè)值,稱為中位數(shù),記為Md。當(dāng)觀測(cè)值的個(gè)數(shù)是偶數(shù)時(shí),則以中間兩個(gè)觀測(cè)值的平均數(shù)作為中位數(shù)。中位數(shù)簡(jiǎn)稱中數(shù)。當(dāng)所獲得的數(shù)據(jù)資料呈偏態(tài)分布時(shí),中位數(shù)的代表性優(yōu)于算術(shù)平均數(shù)。中位數(shù)的計(jì)算方法因資料是否分組而有所不同。(一)未分組資料中位數(shù)的計(jì)算方法 對(duì)于未分組資料,先將各觀測(cè)值由小到大依次排列。1、當(dāng)觀測(cè)值個(gè)數(shù)n為奇數(shù)時(shí),(n+1)/2位置的觀測(cè)值,即x(n+1)/2為中位數(shù);Md=2、當(dāng)觀測(cè)值個(gè)數(shù)為偶數(shù)

7、時(shí),n/2和(n/2+1)位置的兩個(gè)觀測(cè)值之和的1/2為中位數(shù),即: (3-4)【例3.4】 觀察得9只西農(nóng)莎能奶山羊的妊娠天數(shù)為144、145、147、149、150、151、153、156、157,求其中位數(shù)。此例n=9,為奇數(shù),則:Md=150(天)即西農(nóng)莎能奶山羊妊娠天數(shù)的中位數(shù)為150天。 【例3.5】 某犬場(chǎng)發(fā)生犬瘟熱,觀察得10只仔犬發(fā)現(xiàn)癥狀到死亡分別為7、8、8、9、11、12、12、13、14、14天,求其中位數(shù)。此例n=10,為偶數(shù),則:(天)即10只仔犬從發(fā)現(xiàn)癥狀到死亡天數(shù)的中位數(shù)為11.5天。 (二)已分組資料中位數(shù)的計(jì)算方法 若資料已分組,編制成次數(shù)分布表,則可利用次

8、數(shù)分布表來(lái)計(jì)算中位數(shù),其計(jì)算公式為: (35)式中:L中位數(shù)所在組的下限; i組距; f中位數(shù)所在組的次數(shù); n總次數(shù); c小于中數(shù)所在組的累加次數(shù)。【例3.6】 某奶牛場(chǎng)68頭健康母牛從分娩到第一次發(fā)情間隔時(shí)間整理成次數(shù)分布表如表32所示,求中位數(shù)。表32 68頭母牛從分娩到第一次發(fā)情間隔時(shí)間次數(shù)分布表間隔時(shí)間(d)頭數(shù)(f)累加頭數(shù)122611274123425613165771203672861652871011264102116266117268由表32可見(jiàn):i=15,n=68,因而中位數(shù)只能在累加頭數(shù)為36所對(duì)應(yīng)的“5771”這一組,于是可確定L=57,f=20,C=16,代入公式(

9、35)得:(天)即奶牛頭胎分娩到第一次發(fā)情間隔時(shí)間的中位數(shù)為70.5天。三、幾何平均數(shù)n個(gè)觀測(cè)值相乘之積開(kāi)n次方所得的方根,稱為幾何平均數(shù),記為G。它主要應(yīng)用于畜牧業(yè)、水產(chǎn)業(yè)的生產(chǎn)動(dòng)態(tài)分析,畜禽疾病及藥物效價(jià)的統(tǒng)計(jì)分析。如畜禽、水產(chǎn)養(yǎng)殖的增長(zhǎng)率,抗體的滴度,藥物的效價(jià),畜禽疾病的潛伏期等,用幾何平均數(shù)比用算術(shù)平均數(shù)更能代表其平均水平。其計(jì)算公式如下: (36)為了計(jì)算方便,可將各觀測(cè)值取對(duì)數(shù)后相加除以n,得lgG,再求lgG的反對(duì)數(shù),即得G值,即 (37)【例3.7】 某波爾山羊群19972000年各年度的存欄數(shù)見(jiàn)表33,試求其年平均增長(zhǎng)率。表33 某波爾山羊群各年度存欄數(shù)與增長(zhǎng)率年度存欄數(shù)(

10、只)增長(zhǎng)率(x)Lgx199714019982000.429-0.36819992800.400-0.39820003500.250-0.602lgx=-1.368利用公式(37)求年平均增長(zhǎng)率 G= =lg-1(-0.368-0.3980.602) =lg-1(-0.456)=0.3501即年平均增長(zhǎng)率為0.3501或35.01%。四、眾 數(shù)資料中出現(xiàn)次數(shù)最多的那個(gè)觀測(cè)值或次數(shù)最多一組的組中值,稱為眾數(shù),記為M0。如表2-3所列的50枚受精種蛋出雛天數(shù)次數(shù)分布中,以22出現(xiàn)的次數(shù)最多,則該資料的眾數(shù)為22天。又如【例3.6】所列出的次數(shù)分布表中,5771這一組次數(shù)最多,其組中值為64天,則該

11、資料的眾數(shù)為64天。五、調(diào)和平均數(shù)資料中各觀測(cè)值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),稱為調(diào)和平均數(shù),記為H,即 (38)調(diào)和平均數(shù)主要用于反映畜群不同階段的平均增長(zhǎng)率或畜群不同規(guī)模的平均規(guī)模。 【例3.8】 某保種牛群不同世代牛群保種的規(guī)模分別為:0世代200頭,1世代220頭,2世代210頭;3世代190頭,4世代210頭,試求其平均規(guī)模。利用公式(39)求平均規(guī)模:(頭)即保種群平均規(guī)模為208.33頭。對(duì)于同一資料,算術(shù)平均數(shù)>幾何平均數(shù)>調(diào)和平均數(shù)。上述五種平均數(shù),最常用的是算術(shù)平均數(shù)。第二節(jié) 標(biāo)準(zhǔn)差一、標(biāo)準(zhǔn)差的意義用平均數(shù)作為樣本的代表,其代表性的強(qiáng)弱受樣本資料中各觀測(cè)值變異程度的影

12、響。如果各觀測(cè)值變異小,則平均數(shù)對(duì)樣本的代表性強(qiáng);如果各觀測(cè)值變異大,則平均數(shù)代表性弱。因而僅用平均數(shù)對(duì)一個(gè)資料的特征作統(tǒng)計(jì)描述是不全面的,還需引入一個(gè)表示資料中觀測(cè)值變異程度大小的統(tǒng)計(jì)量。全距(極差)是表示資料中各觀測(cè)值變異程度大小最簡(jiǎn)便的統(tǒng)計(jì)量。全距大,則資料中各觀測(cè)值變異程度大,全距小,則資料中各觀測(cè)值變異程度小。但是全距只利用了資料中的最大值和最小值,并不能準(zhǔn)確表達(dá)資料中各觀測(cè)值的變異程度,比較粗略。當(dāng)資料很多而又要迅速對(duì)資料的變異程度作出判斷時(shí),可以利用全距這個(gè)統(tǒng)計(jì)量。為了準(zhǔn)確地表示樣本內(nèi)各個(gè)觀測(cè)值的變異程度,人們首先會(huì)考慮到以平均數(shù)為標(biāo)準(zhǔn),求出各個(gè)觀測(cè)值與平均數(shù)的離差,即(),稱為

13、離均差。雖然離均差能表達(dá)一個(gè)觀測(cè)值偏離平均數(shù)的性質(zhì)和程度,但因?yàn)殡x均差有正、有負(fù),離均差之和為零,即()=0,因而不能用離均差之和()來(lái)表示資料中所有觀測(cè)值的總偏離程度。為了解決離均差有正、有負(fù),離均差之和為零的問(wèn)題,可先求離均差的絕對(duì)值并將各離均差絕對(duì)值之和除以觀測(cè)值n求得平均絕對(duì)離差,即|/n。雖然平均絕對(duì)離差可以表示資料中各觀測(cè)值的變異程度,但由于平均絕對(duì)離差包含絕對(duì)值符號(hào),使用很不方便,在統(tǒng)計(jì)學(xué)中未被采用。我們還可以采用將離均差平方的辦法來(lái)解決離均差有正、有負(fù),離均差之和為零的問(wèn)題。先將各個(gè)離均差平方,即 ()2,再求離均差平方和,即,簡(jiǎn)稱平方和,記為SS;由于離差平方和常隨樣本大小而

14、改變,為了消除樣本大小的影響,用平方和除以樣本大小,即,求出離均差平方和的平均數(shù);為了使所得的統(tǒng)計(jì)量是相應(yīng)總體參數(shù)的無(wú)偏估計(jì)量,統(tǒng)計(jì)學(xué)證明,在求離均差平方和的平均數(shù)時(shí),分母不用樣本含量n,而用自由度n-1,于是,我們采用統(tǒng)計(jì)量表示資料的變異程度。統(tǒng)計(jì)量稱為均方(mean square縮寫(xiě)為MS),又稱樣本方差,記為S2,即S2= (39)相應(yīng)的總體參數(shù)叫總體方差,記為2。對(duì)于有限總體而言,2的計(jì)算公式為: 2)2/N (310)由于樣本方差帶有原觀測(cè)單位的平方單位,在僅表示一個(gè)資料中各觀測(cè)值的變異程度而不作其它分析時(shí),常需要與平均數(shù)配合使用,這時(shí)應(yīng)將平方單位還原,即應(yīng)求出樣本方差的平方根。統(tǒng)計(jì)

15、學(xué)上把樣本方差S2的平方根叫做樣本標(biāo)準(zhǔn)差,記為S,即: (3-11)由于 所以(3-11)式可改寫(xiě)為: (3-12)相應(yīng)的總體參數(shù)叫總體標(biāo)準(zhǔn)差,記為。對(duì)于有限總體而言,的計(jì)算公式為:= (3-13)在統(tǒng)計(jì)學(xué)中,常用樣本標(biāo)準(zhǔn)差S估計(jì)總體標(biāo)準(zhǔn)差。二、標(biāo)準(zhǔn)差的計(jì)算方法(一)直接法 對(duì)于未分組或小樣本資料,可直接利用(311)或(3-12)式來(lái)計(jì)算標(biāo)準(zhǔn)差。 【例3.9】 計(jì)算10只遼寧絨山羊產(chǎn)絨量:450,450,500,500,500,550,550,550,600,600,650(g)的標(biāo)準(zhǔn)差。此例n=10,經(jīng)計(jì)算得:x=5400,x2=2955000,代入(312)式得:(g)即10只遼寧絨山羊

16、產(chǎn)絨量的標(biāo)準(zhǔn)差為65.828g。(二)加權(quán)法 對(duì)于已制成次數(shù)分布表的大樣本資料,可利用次數(shù)分布表,采用加權(quán)法計(jì)算標(biāo)準(zhǔn)差。計(jì)算公式為: (314)式中,f為各組次數(shù);x為各組的組中值;f = n為總次數(shù)。【例3.10】 利用某純系蛋雞200枚蛋重資料的次數(shù)分布表(見(jiàn)表3-4)計(jì)算標(biāo)準(zhǔn)差。將表3-4中的f、fx、fx2代入(314)式得:(g)即某純系蛋雞200枚蛋重的標(biāo)準(zhǔn)差為3.5524g。表34 某純系蛋雞200枚蛋重資料次數(shù)分布及標(biāo)準(zhǔn)差計(jì)算表組別組中值(x)次數(shù)(f)fxfx244.1545.03135.06075.045.8546.76280.213085.3447.5548.416774

17、.437480.9649.2550.1221102.255220.2250.9551.8301554.080497.2052.6553.5442354.0125939.0054.3555.2281545.085317.1256.0556.9301707.097128.3057.7558.612703.241207.5259.4560.35301.518180.4561.1562.04248.015376.00合計(jì) f=200 fx=10705.1 fx2=575507.11三、標(biāo)準(zhǔn)差的特性 (一)標(biāo)準(zhǔn)差的大小,受資料中每個(gè)觀測(cè)值的影響,如觀測(cè)值間變異大,求得的標(biāo)準(zhǔn)差也大,反之則小。(二)在計(jì)算

18、標(biāo)準(zhǔn)差時(shí),在各觀測(cè)值加上或減去一個(gè)常數(shù),其數(shù)值不變。(三)當(dāng)每個(gè)觀測(cè)值乘以或除以一個(gè)常數(shù)a,則所得的標(biāo)準(zhǔn)差是原來(lái)標(biāo)準(zhǔn)差的a倍或1/a倍。(四)在資料服從正態(tài)分布的條件下,資料中約有68.26%的觀測(cè)值在平均數(shù)左右一倍標(biāo)準(zhǔn)差(±S)范圍內(nèi);約有95.43%的觀測(cè)值在平均數(shù)左右兩倍標(biāo)準(zhǔn)差(±2S)范圍內(nèi);約有99.73%的觀測(cè)值在平均數(shù)左右三倍標(biāo)準(zhǔn)差(±3S)范圍內(nèi)。也就是說(shuō)全距近似地等于6倍標(biāo)準(zhǔn)差,可用()來(lái)粗略估計(jì)標(biāo)準(zhǔn)差。第三節(jié) 變異系數(shù)變異系數(shù)是衡量資料中各觀測(cè)值變異程度的另一個(gè)統(tǒng)計(jì)量。當(dāng)進(jìn)行兩個(gè)或多個(gè)資料變異程度的比較時(shí),如果度量單位與平均數(shù)相同,可以直接利用

19、標(biāo)準(zhǔn)差來(lái)比較。如果單位和(或)平均數(shù)不同時(shí),比較其變異程度就不能采用標(biāo)準(zhǔn)差,而需采用標(biāo)準(zhǔn)差與平均數(shù)的比值(相對(duì)值)來(lái)比較。標(biāo)準(zhǔn)差與平均數(shù)的比值稱為變異系數(shù),記為C·V。變異系數(shù)可以消除單位和(或)平均數(shù)不同對(duì)兩個(gè)或多個(gè)資料變異程度比較的影響。變異系數(shù)的計(jì)算公式為: (315)【例3.11】 已知某良種豬場(chǎng)長(zhǎng)白成年母豬平均體重為190kg,標(biāo)準(zhǔn)差為10.5kg,而大約克成年母豬平均體重為196kg,標(biāo)準(zhǔn)差為8.5kg,試問(wèn)兩個(gè)品種的成年母豬,那一個(gè)體重變異程度大。此例觀測(cè)值雖然都是體重,單位相同,但它們的平均數(shù)不相同,只能用變異系數(shù)來(lái)比較其變異程度的大小。由于,長(zhǎng)白成年母豬體重的變異系數(shù):大約克成年母豬體重的變異系數(shù):所以,長(zhǎng)白成年母豬體重的變異程度大于大約克成年母豬。注意,變異系數(shù)的大小,同時(shí)受平均數(shù)和標(biāo)準(zhǔn)差兩個(gè)統(tǒng)計(jì)量的影響,因而在利用變異系數(shù)表示資料的變異程度時(shí),最好將平均數(shù)和標(biāo)準(zhǔn)差也列出。習(xí) 題1、生物統(tǒng)計(jì)中常用的平均數(shù)有幾種?各在什么情況下應(yīng)用? 2、何謂算術(shù)平均數(shù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論