研究生統(tǒng)計學(xué)第三章總體均數(shù)估計與假設(shè)檢驗(4版)匯編_第1頁
研究生統(tǒng)計學(xué)第三章總體均數(shù)估計與假設(shè)檢驗(4版)匯編_第2頁
研究生統(tǒng)計學(xué)第三章總體均數(shù)估計與假設(shè)檢驗(4版)匯編_第3頁
研究生統(tǒng)計學(xué)第三章總體均數(shù)估計與假設(shè)檢驗(4版)匯編_第4頁
研究生統(tǒng)計學(xué)第三章總體均數(shù)估計與假設(shè)檢驗(4版)匯編_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、Lihui第三章第三章總體均數(shù)估計與假設(shè)檢驗總體均數(shù)估計與假設(shè)檢驗桂立輝桂立輝新鄉(xiāng)醫(yī)學(xué)院公共衛(wèi)生學(xué)院新鄉(xiāng)醫(yī)學(xué)院公共衛(wèi)生學(xué)院研究生醫(yī)學(xué)統(tǒng)計學(xué)(第四版)Lihui第三章第三章總體均數(shù)估計與假設(shè)檢驗總體均數(shù)估計與假設(shè)檢驗 均數(shù)的抽樣誤差與標準誤均數(shù)的抽樣誤差與標準誤 t 分布分布 總體均數(shù)的估計總體均數(shù)的估計 假設(shè)檢驗的基本原理和步驟假設(shè)檢驗的基本原理和步驟 t 檢驗檢驗 假設(shè)檢驗的注意事項假設(shè)檢驗的注意事項 正態(tài)性檢驗和兩樣本方差比較的正態(tài)性檢驗和兩樣本方差比較的F檢驗檢驗Lihui參數(shù)估計基礎(chǔ)參數(shù)估計基礎(chǔ) 統(tǒng)計學(xué)研究的目的通常是要了解總體的情況。如果統(tǒng)計學(xué)研究的目的通常是要了解總體的情況。如果要

2、了解總體情況,有兩種方法:要了解總體情況,有兩種方法: 全面研究在許多情況下難以辦到,因此,常用的方全面研究在許多情況下難以辦到,因此,常用的方法是抽樣研究,即從同質(zhì)總體中隨機抽取一部分觀察單位法是抽樣研究,即從同質(zhì)總體中隨機抽取一部分觀察單位作為樣本,并由樣本信息作為樣本,并由樣本信息(包括樣本變量值的分布及其用包括樣本變量值的分布及其用于描述的統(tǒng)計量于描述的統(tǒng)計量)來推斷總體情況,即來推斷總體情況,即統(tǒng)計推斷統(tǒng)計推斷(statistical inference)。Lihui第一節(jié)第一節(jié) 均數(shù)的抽樣誤差和標準誤均數(shù)的抽樣誤差和標準誤 由于所研究變量在總體中各觀察單位由于所研究變量在總體中各觀

3、察單位(個體)間存在變異,抽樣研究必然會導(dǎo)致(個體)間存在變異,抽樣研究必然會導(dǎo)致抽抽樣誤差樣誤差(sampling error) 。 抽樣誤差是不可避免的,但我們可以探抽樣誤差是不可避免的,但我們可以探究抽樣誤差的規(guī)律,控制抽樣誤差在允許的范究抽樣誤差的規(guī)律,控制抽樣誤差在允許的范圍內(nèi)。圍內(nèi)。Lihui第一節(jié)第一節(jié) 均數(shù)的抽樣誤差和標準誤均數(shù)的抽樣誤差和標準誤 為探討抽樣誤差的規(guī)律,我們做一個放回式隨機抽為探討抽樣誤差的規(guī)律,我們做一個放回式隨機抽樣實驗。假設(shè)某年某地樣實驗。假設(shè)某年某地13歲女學(xué)生身高(歲女學(xué)生身高(X)服從總體)服從總體均數(shù)均數(shù)=155.4cm,總體標準差,總體標準差=5

4、.3cm的正態(tài)分布的正態(tài)分布N(155.4,5.32)。每次抽取的)。每次抽取的30例構(gòu)成一個樣本,并計例構(gòu)成一個樣本,并計算出樣本均數(shù)。算出樣本均數(shù)。 如此共抽取如此共抽取100個樣本,計算得到個樣本,計算得到100個樣本均數(shù)。個樣本均數(shù)。Lihui總體總體=155.4cm = 5.3 cm.4 .156,300 .155,302 .155,306 .155,301 .158,307 .156,30665544332211cmxncmxncmxncmxncmxncmxnLihui表表5-1 從正態(tài)總體從正態(tài)總體N(155.4, 5.32)隨機抽取隨機抽取100份樣本份樣本(n=30)的算術(shù)均

5、數(shù)的算術(shù)均數(shù)156.7156.9156.1156.3155.1155.7153.6155.8154.9155.1158.1154.0155.0155.2155.3153.7155.6153.9154.6156.6155.6154.4154.7156.0156.3154.8155.2156.2154.6156.0155.2156.5154.5155.6156.6155.6156.7156.0157.5155.8155.0155.9155.2156.5155.4154.8154.7154.2155.9156.1156.4155.5154.6155.3155.9155.6155.1155.4156.

6、5152.7154.9156.9156.1155.2155.3158.2155.7156.6156.4155.1156.5156.9155.7155.5154.6154.9156.4155.6154.7155.3155.0153.4155.1155.0156.1153.4155.1156.8156.2154.6155.9154.8156.1155.5154.7156.4154.9155.3154.6156.6Lihui對對100100個樣本均個樣本均數(shù)組成的數(shù)據(jù)數(shù)組成的數(shù)據(jù)資料進行統(tǒng)計資料進行統(tǒng)計描述,結(jié)果:描述,結(jié)果:)( 96. 0)( 51.155cmScmXLihui圖圖5-1 100

7、個樣本均數(shù)的頻數(shù)分布圖個樣本均數(shù)的頻數(shù)分布圖Lihui第一節(jié)第一節(jié) 均數(shù)的抽樣誤差和標準誤均數(shù)的抽樣誤差和標準誤 從一個總體均數(shù)為從一個總體均數(shù)為 ,標準差為,標準差為 的總體中,隨機抽的總體中,隨機抽取若干個含量為取若干個含量為n 的樣本。那么,這若干個樣本的均數(shù)不會的樣本。那么,這若干個樣本的均數(shù)不會完全相同,其頻數(shù)分布是以總體均數(shù)完全相同,其頻數(shù)分布是以總體均數(shù)為中心的正態(tài)分布,為中心的正態(tài)分布,其變異程度可用這若干個樣本均數(shù)的標準差表示,稱樣本均其變異程度可用這若干個樣本均數(shù)的標準差表示,稱樣本均數(shù)的數(shù)的標準誤標準誤(standard error)。nxLihui第一節(jié)第一節(jié) 均數(shù)的抽

8、樣誤差和標準誤均數(shù)的抽樣誤差和標準誤 在前述放回式隨機抽樣實驗中,已知總體標準在前述放回式隨機抽樣實驗中,已知總體標準差差=5.3cm,每次抽樣的樣本含量,每次抽樣的樣本含量n=30,代入公式得:,代入公式得:)(98. 0303 . 5cmnx按實際抽取的按實際抽取的100個樣本均數(shù)計算,標準誤為個樣本均數(shù)計算,標準誤為0.96,與上述公式計算結(jié)果基本一致。與上述公式計算結(jié)果基本一致。Lihuix樣本均數(shù)的分布樣本均數(shù)的分布 Lihuix不同不同n樣本均數(shù)的分布樣本均數(shù)的分布 X ( =155.4 , =5.3 ) (n=5 , =2.37) (n=10 , =1.68 ) (n=30 ,

9、=0.98)xxxXXXLihui增大樣本量對標準誤的影響增大樣本量對標準誤的影響( =5.3)nSEn增加增加SE減少減少SE減少(減少(%)15.30-23.751-1.55-29.2933.061-0.69-18.4042.651-0.41-13.4052.371-0.28-10.56101.685-0.69-29.28201.1910-0.49-29.46300.9710-0.22-18.69400.8410-0.13-13.61500.7510-0.09-10.771000.5350-0.15-22.062000.37100-0.16-29.295000.24300-0.13-35.

10、9410000.17500-0.07-30.17LihuiLihuiLihuiLihui第一節(jié)第一節(jié) 均數(shù)的抽樣誤差和標準誤均數(shù)的抽樣誤差和標準誤實際工作中,往往不知道實際工作中,往往不知道 ,因此,通常用樣本,因此,通常用樣本標準差標準差s 來代替來代替 ,得到均數(shù)標準誤的估計值:,得到均數(shù)標準誤的估計值: /L)0.044(mmol12048. 0nSSX例例 調(diào)查某地調(diào)查某地120名正常成人的血糖值的均數(shù)為名正常成人的血糖值的均數(shù)為4.92mmol/L,標準差為,標準差為0.48mmol/L,試計算標準誤。,試計算標準誤。nSSXLihui第一節(jié)第一節(jié) 均數(shù)的抽樣誤差和標準誤均數(shù)的抽樣誤

11、差和標準誤均數(shù)標準誤的用途:均數(shù)標準誤的用途:v 衡量樣本均數(shù)的可靠性;衡量樣本均數(shù)的可靠性; 標準誤愈小,說明樣本均數(shù)與總體均數(shù)越接標準誤愈小,說明樣本均數(shù)與總體均數(shù)越接近,即抽樣誤差越小,用樣本均數(shù)推論總體均數(shù)近,即抽樣誤差越小,用樣本均數(shù)推論總體均數(shù)的真實性越好。反之,標準誤越大,抽樣誤差越的真實性越好。反之,標準誤越大,抽樣誤差越大,樣本均數(shù)對總體均數(shù)的代表性越差。大,樣本均數(shù)對總體均數(shù)的代表性越差。 v 估計總體均數(shù)的置信區(qū)間;估計總體均數(shù)的置信區(qū)間;v 用于均數(shù)的假設(shè)檢驗。用于均數(shù)的假設(shè)檢驗。Lihui第二節(jié)第二節(jié) t 分布分布一、一、 t 分布的概念分布的概念 對于任一正態(tài)分布對

12、于任一正態(tài)分布XN( , 2 ) ,經(jīng),經(jīng)u變換后都可以變換后都可以變成標準正態(tài)分布變成標準正態(tài)分布N(0 ,1)。 隨機抽取若干個含量為隨機抽取若干個含量為n 的樣本,這些樣本均數(shù)的的樣本,這些樣本均數(shù)的頻數(shù)分布是以總體均數(shù)頻數(shù)分布是以總體均數(shù)為中心的正態(tài)分布,其標準差為中心的正態(tài)分布,其標準差為為 ,即,即 N( , 2 )如果進行如果進行u變換,同樣可以變變換,同樣可以變成標準正態(tài)分布成標準正態(tài)分布N(0 ,1)。xXXuxXLihui第二節(jié)第二節(jié) t 分布分布 實際上實際上 往往未知,故用往往未知,故用 作為作為 的估計值,這時的估計值,這時可以對樣本均數(shù)作可以對樣本均數(shù)作 t 變換:

13、變換:XSXt 則則t 值的分布是以值的分布是以0為中心的正態(tài)分布,即為中心的正態(tài)分布,即t 分布分布(students t distribution)。1908年年W S Gosset以筆名以筆名student發(fā)表了他的研究論文,開創(chuàng)了小樣發(fā)表了他的研究論文,開創(chuàng)了小樣本統(tǒng)計推斷之先河。本統(tǒng)計推斷之先河。xxxsLihui第二節(jié)第二節(jié) t 分布分布二、二、t 分布的圖形和分布的圖形和t 分布表分布表 對前述對前述13歲女學(xué)生身高總體,分別做歲女學(xué)生身高總體,分別做n=3和和n=50的隨機的隨機抽樣,各抽取抽樣,各抽取1000個樣本,并分別計算得到個樣本,并分別計算得到1000個樣本均數(shù)個樣本

14、均數(shù)和標準誤。然后,分別做和標準誤。然后,分別做t變換,將變換,將t值繪直方圖如圖值繪直方圖如圖5-2。Lihui第二節(jié)第二節(jié) t 分布分布二、二、t 分布的圖形和分布的圖形和t 分布表分布表 t 分布與分布與u 分布一樣,都是以分布一樣,都是以0為中心,但為中心,但t分布分布不是不是1條曲線,而是無數(shù)條曲線。條曲線,而是無數(shù)條曲線。 t 分布的形態(tài)分布的形態(tài)(峰度)隨抽樣樣本量(嚴格地說是自由度(峰度)隨抽樣樣本量(嚴格地說是自由度n -1)而變化,自由度越小,曲線越低平,隨著自由度而變化,自由度越小,曲線越低平,隨著自由度增大,增大,t 分布逐漸接近于標準正態(tài)分布,當(dāng)自由度分布逐漸接近于標

15、準正態(tài)分布,當(dāng)自由度為無窮大時,為無窮大時,t 分布與分布與 u 分布完全重合。分布完全重合。Lihui圖圖5-3 不同自由度的不同自由度的t 分布曲線分布曲線 =2=2 =5=5 =Lihui第二節(jié)第二節(jié) t 分布分布 t 分布與分布與u分布一樣,曲線下的面積分布有一定分布一樣,曲線下的面積分布有一定規(guī)律:從雙側(cè)規(guī)律:從雙側(cè)-t /2, 到到t /2, 所對應(yīng)的曲線下的面積占所對應(yīng)的曲線下的面積占曲線下總面積的曲線下總面積的100(1-)%?;蛘?,從單側(cè)。或者,從單側(cè)t , 到到所所對應(yīng)的曲線下的面積占曲線下總面積的對應(yīng)的曲線下的面積占曲線下總面積的100(1- )%。 /2 /200-t

16、-t /2+t /21- 1- Lihui第二節(jié)第二節(jié) t 分布分布 由于由于t 分布的形態(tài)隨自由度而變化,分布的形態(tài)隨自由度而變化,t 也隨自由度而變化。不同自由度時的也隨自由度而變化。不同自由度時的t 值可查附表值可查附表2 t 界值表得到。界值表得到。LihuiLihui一、一、 t 分布分布Lihui第三節(jié)第三節(jié) 總體均數(shù)的估計總體均數(shù)的估計 一、一、 可信區(qū)間的概念可信區(qū)間的概念點值估計點值估計(point estimation)區(qū)間估計區(qū)間估計(interval estimation) 總體均數(shù)(總體均數(shù)( )的)的100(1- )%置信區(qū)間置信區(qū)間(confidential in

17、terval,簡記為,簡記為 CI)。 區(qū)間估計屬于概率估計,總體參數(shù)并非一定在區(qū)間估計屬于概率估計,總體參數(shù)并非一定在該置信區(qū)間內(nèi),只需要把總體參數(shù)不在該置信區(qū)間該置信區(qū)間內(nèi),只需要把總體參數(shù)不在該置信區(qū)間內(nèi)的概率內(nèi)的概率()控制在一定水平就可以了。控制在一定水平就可以了。 Lihui二、置信區(qū)間的計算二、置信區(qū)間的計算二、總體均數(shù)的置信區(qū)間的計算二、總體均數(shù)的置信區(qū)間的計算 的的100(1-)%置信區(qū)間置信區(qū)間(CI):v已知總體標準差已知總體標準差,按,按u分布原理,計算公式為:分布原理,計算公式為:v未知,未知,n較小,按較小,按t 分布原理計算:分布原理計算:v未知,未知,n足夠大足

18、夠大(如如n100),按,按u分布近似計算分布近似計算:X,StX2XuX2XSuX2Lihui總體均數(shù)置信區(qū)間的計算總體均數(shù)置信區(qū)間的計算 例例 測得某地健康男子測得某地健康男子20人收縮壓的均數(shù)為人收縮壓的均數(shù)為118.4mmHg,標準差為,標準差為10.8mmHg,試估計該地健,試估計該地健康男子收縮壓總體均數(shù)的康男子收縮壓總體均數(shù)的95%可信區(qū)間??尚艆^(qū)間。 本例本例v=20-1=19,查,查t 值表得值表得 t0.05,19 =2.093 。 代入公式得:代入公式得:)5 .123, 3 .113(20/8 .10093. 24 .1182X,StX 該地健康男子收縮壓總體均數(shù)的該地

19、健康男子收縮壓總體均數(shù)的95%可信區(qū)間可信區(qū)間為為113.3123.5mmHg。Lihui總體均數(shù)置信區(qū)間的計算總體均數(shù)置信區(qū)間的計算 例例 測得某地測得某地150名正常人脈搏的均數(shù)為名正常人脈搏的均數(shù)為73.53次次/分,分,標準差為標準差為11.30次次/分,試估計該地正常人脈搏總體均數(shù)的分,試估計該地正常人脈搏總體均數(shù)的95%可信區(qū)間??尚艆^(qū)間。 本例本例n100,可按正態(tài)分布原理近似計算:,可按正態(tài)分布原理近似計算: 該地正常人脈搏總體均數(shù)的該地正常人脈搏總體均數(shù)的95%可信區(qū)間為可信區(qū)間為71.7475.36次次/分。分。36.7574.7192. 096. 155.73X%95/9

20、2. 02,:分次XXSuCInSSLihui三、總體均數(shù)置信區(qū)間的解釋三、總體均數(shù)置信區(qū)間的解釋 總體均數(shù)可信區(qū)間的計算和解釋有兩種理論依據(jù),一是總體均數(shù)可信區(qū)間的計算和解釋有兩種理論依據(jù),一是是是Pearson、Fisher、Neyman等人的經(jīng)典理論,另一個等人的經(jīng)典理論,另一個是是Bayes理論。理論。 經(jīng)典理論假定樣本經(jīng)典理論假定樣本x1、x2 、 、xn來自正態(tài)分布來自正態(tài)分布N(,2),其中其中2已知已知,是一個客觀存在的是一個客觀存在的。對置信區(qū)間的解。對置信區(qū)間的解釋是:從總體中隨機抽樣,每個樣本可以算得一個置信釋是:從總體中隨機抽樣,每個樣本可以算得一個置信區(qū)間,該置信區(qū)間

21、包括總體均數(shù)區(qū)間,該置信區(qū)間包括總體均數(shù)(估計正確估計正確)的概率是的概率是1-。理論則認為參數(shù)理論則認為參數(shù)是是。對置信區(qū)間的解釋。對置信區(qū)間的解釋是:是:有有1-的可能性落在該區(qū)間,或者說的可能性落在該區(qū)間,或者說在這個區(qū)間在這個區(qū)間內(nèi)的概率是內(nèi)的概率是1-。Lihui總體均數(shù)總體均數(shù)置信區(qū)間置信區(qū)間的估計的估計 參數(shù)估計時,一方面要控制發(fā)生錯誤的概率(參數(shù)估計時,一方面要控制發(fā)生錯誤的概率(),),越小,估計的正確率就越高。另一方面,所定區(qū)間范圍不能越小,估計的正確率就越高。另一方面,所定區(qū)間范圍不能過寬,否則就失去了實際意義,也就是估計的精確程度要高,過寬,否則就失去了實際意義,也就是

22、估計的精確程度要高,估計的區(qū)間范圍越小,精密度就越高。估計的區(qū)間范圍越小,精密度就越高。 正確性和精密性是相互矛盾的,提高了準確度,則精正確性和精密性是相互矛盾的,提高了準確度,則精密度必然下降;如果提高精密度,則準確度又將隨之降低。密度必然下降;如果提高精密度,則準確度又將隨之降低。因此,通常把發(fā)生錯誤的概率(因此,通常把發(fā)生錯誤的概率()定在適當(dāng)?shù)乃?,如)定在適當(dāng)?shù)乃?,?0.05,即總體參數(shù)不在該范圍的概率不超過,即總體參數(shù)不在該范圍的概率不超過5%,即,即95%置信區(qū)間。置信區(qū)間。 增大樣本量可以在不影響正確性的情況下提高參數(shù)估增大樣本量可以在不影響正確性的情況下提高參數(shù)估計的精密

23、度。但并非樣本量越大越好。計的精密度。但并非樣本量越大越好。Lihui總體均數(shù)的估計總體均數(shù)的估計 例例9.2 某醫(yī)師隨機抽查了某地某醫(yī)師隨機抽查了某地20名正常成人,測得血糖值名正常成人,測得血糖值的均數(shù)為的均數(shù)為4.92mmol/L,標準差為,標準差為0.48mmol/L,試估計該地,試估計該地正常成人血糖值總體均數(shù)的正常成人血糖值總體均數(shù)的95%和和99%可信區(qū)間??尚艆^(qū)間。 本例:本例: 今今v=20-1=19,查查t值表得值表得t0.05,19=2.093,t0.01,19=2.861。 95%95%可信區(qū)間為:可信區(qū)間為: 99%99%可信區(qū)間為:可信區(qū)間為: L)5.14(mmol/4.700.224.92200.482.0934.92。20 ,0.48mmol/L ,4.92mmol/LnSXL)5.23(mmol/4.610.314.92200.482.8614.92Lihui總體均數(shù)的估計總體均數(shù)的估計 例例9.3 隨機抽查了某地隨機抽

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論