研究生醫(yī)學統(tǒng)計3 抽樣誤差t分布_第1頁
研究生醫(yī)學統(tǒng)計3 抽樣誤差t分布_第2頁
研究生醫(yī)學統(tǒng)計3 抽樣誤差t分布_第3頁
研究生醫(yī)學統(tǒng)計3 抽樣誤差t分布_第4頁
研究生醫(yī)學統(tǒng)計3 抽樣誤差t分布_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、均數(shù)的抽樣誤差,均數(shù)的抽樣誤差,t分布,參數(shù)估計分布,參數(shù)估計Sampling error of mean,t-distribution,parameters estimation 張建軍張建軍汕大醫(yī)學院預防醫(yī)學教研室汕大醫(yī)學院預防醫(yī)學教研室Tel:mail: 主要內(nèi)容主要內(nèi)容 均數(shù)的抽樣誤差均數(shù)的抽樣誤差 t分布分布 參數(shù)估計參數(shù)估計 概念:概念: 頻數(shù)分布以均數(shù)為中心,左右兩側(cè)基本對稱,頻數(shù)分布以均數(shù)為中心,左右兩側(cè)基本對稱,靠近均數(shù)兩側(cè)頻數(shù)較多,離均數(shù)愈遠,頻數(shù)愈少,靠近均數(shù)兩側(cè)頻數(shù)較多,離均數(shù)愈遠,頻數(shù)愈少,形成一個中間多,兩側(cè)逐漸減少的對稱分布。形成一個

2、中間多,兩側(cè)逐漸減少的對稱分布。 是一種連續(xù)型分布。又稱高斯分布是一種連續(xù)型分布。又稱高斯分布. 回顧:正態(tài)分布(normal distribution) 正態(tài)分布用正態(tài)分布用N(, )表示,其位置與均數(shù)有關(guān),表示,其位置與均數(shù)有關(guān),形狀與標準差有關(guān)。形狀與標準差有關(guān)。 醫(yī)學現(xiàn)象許多呈正態(tài)分布,或近似正態(tài)分布:如醫(yī)學現(xiàn)象許多呈正態(tài)分布,或近似正態(tài)分布:如正常人的生理,生化指標變量,等正常人的生理,生化指標變量,等2 正態(tài)分布的密度函數(shù):式中正態(tài)分布的密度函數(shù):式中為均數(shù);為均數(shù);為標為標準差;準差;為圓周率;為圓周率;為自然對數(shù)的底,即為自然對數(shù)的底,即2.71828。以上均為常數(shù),僅。以上均

3、為常數(shù),僅x為變量。為變量。x 2()1( )21( )2xf xe(1) 標準正態(tài)分布標準正態(tài)分布: 為了應用方便,常將式進行變量變換,即:為了應用方便,常將式進行變量變換,即:u變換變換. 所得到的新變量所得到的新變量u的分布即為標準正態(tài)的分布即為標準正態(tài)分布。分布。 u的含義:變量到均數(shù)間的距離相當于標準差的含義:變量到均數(shù)間的距離相當于標準差的倍數(shù)。的倍數(shù)。xux 標準正態(tài)分布的概率密度函數(shù):標準正態(tài)分布的概率密度函數(shù):(2)u 2()21( )2uue 正態(tài)分布的特征和分布規(guī)律:正態(tài)分布的特征和分布規(guī)律: (1)曲線在)曲線在x軸的上方,與軸的上方,與x軸不相交,當軸不相交,當x=時

4、,曲線位于最高點。時,曲線位于最高點。 f(u=0)=0.3989 (2)曲線關(guān)于直線)曲線關(guān)于直線x=左右對稱。左右對稱。 (3)正態(tài)分布有兩個參數(shù))正態(tài)分布有兩個參數(shù):均數(shù)均數(shù),標準差標準差;標準正標準正態(tài)的參數(shù)分別為態(tài)的參數(shù)分別為:0, 1 (4)正態(tài)分布的面積分布有一定規(guī)律。)正態(tài)分布的面積分布有一定規(guī)律。正態(tài)分布正態(tài)分布標準正態(tài)分布標準正態(tài)分布面積面積( (或概率或概率) ) -1_ +1 -1_ +1 -1_+1-1_+168.27%68.27%1.96_+1.961.96_+1.96-1.96_+1.96-1.96_+1.9695.00%95.00% 2.58_+2.58 2.5

5、8_+2.58-2.58_+2.58-2.58_+2.5899.00%99.00%正態(tài)分布和標準正態(tài)分布曲線下面積分布規(guī)律正態(tài)分布和標準正態(tài)分布曲線下面積分布規(guī)律(-1,1),68.27%(-1.96,1.96),95%(-2.58,2.58),99%雙側(cè)概率雙側(cè)概率單側(cè)概率單側(cè)概率請思考:請思考: 抽樣?抽樣? 統(tǒng)計量?統(tǒng)計量? 抽樣分布?抽樣分布?一、均數(shù)的抽樣誤差和標準誤一、均數(shù)的抽樣誤差和標準誤均數(shù)的抽樣誤差均數(shù)的抽樣誤差sampling error of mean 由于總體中存在個體變異,抽樣研究中由于總體中存在個體變異,抽樣研究中所抽取的樣本,只包含總體中一部分個體,所抽取的樣本,

6、只包含總體中一部分個體,因而樣本均數(shù)(或率)往往不等于總體均數(shù)因而樣本均數(shù)(或率)往往不等于總體均數(shù)(或率),樣本均數(shù)之間也互不相等,(或率),樣本均數(shù)之間也互不相等,這種這種由抽樣引起的差異稱為均數(shù)的抽樣誤差的體由抽樣引起的差異稱為均數(shù)的抽樣誤差的體現(xiàn)現(xiàn)。即:即:iXijXX 如何估計抽樣誤差如何估計抽樣誤差? 標準誤標準誤 standard error,SE 以樣本均數(shù)為例:以樣本均數(shù)為例: SE 越大,均數(shù)的抽樣誤差越大,樣本均數(shù)與越大,均數(shù)的抽樣誤差越大,樣本均數(shù)與總體均數(shù)間的差異越大。總體均數(shù)間的差異越大。XSSnXn 當樣本例數(shù)一定時,樣本均數(shù)的標準誤與原當樣本例數(shù)一定時,樣本均數(shù)

7、的標準誤與原始數(shù)據(jù)的標準差成正比;當標準差一定時,始數(shù)據(jù)的標準差成正比;當標準差一定時,標準誤與樣本含量標準誤與樣本含量 n 的平方根成反比。增加的平方根成反比。增加樣本含量可以減小抽樣誤差。樣本含量可以減小抽樣誤差。 與標準差的區(qū)別:與標準差的區(qū)別: 標準差:表示一般個體值的離散程度;標準差:表示一般個體值的離散程度; 標準誤:特別說明統(tǒng)計量的離散程度。標準誤:特別說明統(tǒng)計量的離散程度。再思考一個問題:再思考一個問題: 其它的統(tǒng)計量有抽樣誤差嗎?其它的統(tǒng)計量有抽樣誤差嗎? 它們的計算公式怎樣?它們的計算公式怎樣?XnXSSn標準誤的應用標準誤的應用1、用來衡量抽樣誤差的大小、用來衡量抽樣誤差

8、的大小: 標準誤越小,樣本均數(shù)與總體均數(shù)越接近,標準誤越小,樣本均數(shù)與總體均數(shù)越接近,樣本均數(shù)的可信度越高;樣本均數(shù)的可信度越高;2、結(jié)合標準正態(tài)分布與、結(jié)合標準正態(tài)分布與 t 分布曲線下的面積規(guī)分布曲線下的面積規(guī)律,估計總體均數(shù)的置信區(qū)間。律,估計總體均數(shù)的置信區(qū)間。3、用于假設檢驗。、用于假設檢驗。 假定假定2003年汕頭市年汕頭市15歲女學生的身高服從均歲女學生的身高服從均數(shù)數(shù)155.4cm、標準差、標準差5.3cm的正態(tài)分布。用計的正態(tài)分布。用計算機做抽樣模擬試驗,從算機做抽樣模擬試驗,從N(155.4, 5.32)的總體的總體中,每次抽出中,每次抽出10個數(shù)字(樣本含量為個數(shù)字(樣本

9、含量為10),),組成一個樣本,求出樣本均數(shù)組成一個樣本,求出樣本均數(shù) 、樣本標、樣本標準差準差 S。 再求得此再求得此100個樣本均數(shù)的均數(shù)、樣個樣本均數(shù)的均數(shù)、樣本均數(shù)的標準差。本均數(shù)的標準差。X抽樣分布抽樣分布 樣本均數(shù)的標準差是什么?樣本均數(shù)的標準差是什么?.標準誤標準誤 100個樣本均數(shù)構(gòu)成一個新的分布,也是個樣本均數(shù)構(gòu)成一個新的分布,也是正態(tài)分正態(tài)分布。布。 即使原分布為偏態(tài)分布,當樣本含量足夠大時,即使原分布為偏態(tài)分布,當樣本含量足夠大時,新分布也新分布也近似正態(tài)分布近似正態(tài)分布)。新分布的集中趨勢用)。新分布的集中趨勢用均數(shù)的均數(shù)均數(shù)的均數(shù)來表示,離散趨勢用來表示,離散趨勢用標

10、準誤標準誤表示表示N( , ) 。 各樣本均數(shù)的均數(shù)等于總體均數(shù)各樣本均數(shù)的均數(shù)等于總體均數(shù)。2X0501001502002503003504004502.082.342.612.873.143.403.663.934.194.464.724.985.25均數(shù)頻數(shù)0501001502002503003504004502.082.342.612.873.143.403.663.934.194.464.724.985.25均數(shù)頻數(shù)0501001502002503003504004505002.082.342.612.873.143.403.663.934.194.464.724.985.25均數(shù)頻

11、數(shù)正態(tài)總體中抽樣正態(tài)總體中抽樣(樣本量(樣本量5)正態(tài)總體中抽樣正態(tài)總體中抽樣(樣本量(樣本量10)正態(tài)總體中抽樣正態(tài)總體中抽樣(樣本量(樣本量30)抽樣時樣本量抽樣時樣本量大小決定了樣大小決定了樣本均數(shù)分布的本均數(shù)分布的形狀,當樣本形狀,當樣本量足夠大時,量足夠大時,均數(shù)分布趨向均數(shù)分布趨向正態(tài)分布。正態(tài)分布。二、二、t 分布(分布(t-distribution)還記得嗎?還記得嗎?xu u轉(zhuǎn)換將正態(tài)分布轉(zhuǎn)換為標準正態(tài)轉(zhuǎn)換將正態(tài)分布轉(zhuǎn)換為標準正態(tài), N(0, 1)。 同理:將樣本均數(shù)的分布也可以轉(zhuǎn)換為標準正態(tài)同理:將樣本均數(shù)的分布也可以轉(zhuǎn)換為標準正態(tài)分布分布 。 即:即:2,()(0,1)X

12、NNXXu 實際工作中,總體標準差往往未知,常用實際工作中,總體標準差往往未知,常用S代替代替 計算計算標準誤,因此:為了和標準誤,因此:為了和u分布區(qū)別,就變?yōu)椋悍植紖^(qū)別,就變?yōu)椋?/XXXtSSn均數(shù)的分布也是這樣均數(shù)的分布也是這樣 如果我們采用另一個正態(tài)變量如果我們采用另一個正態(tài)變量: 于是,均數(shù)的分布變成了標準正態(tài)分布于是,均數(shù)的分布變成了標準正態(tài)分布: XXu2,()(0,1)XNNxu但是,條件發(fā)生了變化 我們通常用代替我們通常用代替 然而,然而, 隨著樣本量的變化而變化,所以,我隨著樣本量的變化而變化,所以,我們稱之為們稱之為 t-分布,雖然它是正態(tài)分布,但只有分布,雖然它是正態(tài)

13、分布,但只有當樣本量(自由度)無窮大的時候,它才是標當樣本量(自由度)無窮大的時候,它才是標準正態(tài)分布,此時,準正態(tài)分布,此時,u=t/XXXtSSnXXuXXSXSt t分布曲線分布曲線 t t分布是一簇分布是一簇對稱于對稱于0的單峰分布曲線。的單峰分布曲線。 自由度越小(相當于標準差大),曲線的中間越自由度越小(相當于標準差大),曲線的中間越低,兩邊越高;隨自由度增大,低,兩邊越高;隨自由度增大, t t分布曲線逐漸分布曲線逐漸逼近于標準正態(tài)分布曲線。逼近于標準正態(tài)分布曲線。 當自由度無窮大時,當自由度無窮大時, t t分布就是標準正態(tài)分布曲分布就是標準正態(tài)分布曲線。線。 每一條每一條t

14、t分布曲線,都對應于相應的自由度。分布曲線,都對應于相應的自由度。 t t分布模擬試驗分布模擬試驗t t分布曲線下的面積規(guī)律分布曲線下的面積規(guī)律 與標準正態(tài)曲線下的面積規(guī)律相似:與標準正態(tài)曲線下的面積規(guī)律相似: 在某一個自由度下,兩側(cè)外部總面積為在某一個自由度下,兩側(cè)外部總面積為5%5%的界的界限的限的t t值稱為值稱為t t0.05/2()0.05/2(), ,把兩側(cè)外部總面積為把兩側(cè)外部總面積為1%1%的界限的的界限的t t值稱為值稱為t t0.01/2()0.01/2()。 因此,中部占因此,中部占95%95%面積的面積的t t值范圍:值范圍:- t t0.05/2()0.05/2()-

15、 t- t0.05/2()0.05/2(), ,- 中部占中部占99%99%面積的面積的t t值范圍:值范圍:- t- t0.01/2()0.01/2()- t- t0.01/2()0.01/2()。 當自由度確定時,占一定面積的當自由度確定時,占一定面積的t界限值,界限值,可以查表得出??梢圆楸淼贸?。 例如:查當自由度例如:查當自由度=20,兩側(cè)概率之和為,兩側(cè)概率之和為0.05時,對應的時,對應的t值:值: t0.05/2(20)=2.086, 單側(cè)概率為單側(cè)概率為0.05時,對應的時,對應的t值:值: t0.05(20)=1.725, 一般,一般, t 0.05/2(v)1.96 ,t

16、0.01/2(v) 2.58 自由度越小,曲線越低平,自由度越小,曲線越低平,t 比比1.96,2.58大大的多;自由度變大,的多;自由度變大,t接近于接近于1.96,2.58;自;自由度無窮大,由度無窮大,t=1.96,2.58 使用使用t值表注意:值表注意: 同一自由度下同一自由度下, P越小,越小,t值越大;值越大;P值相同時,自值相同時,自由度越大,由度越大,t越小;當自由度無窮大時,越??;當自由度無窮大時,t值與值與u值相等。這也是值相等。這也是u分布與分布與t分布的區(qū)別。分布的區(qū)別。t t分布的主要應用:分布的主要應用: 總體均數(shù)置信區(qū)間估計;總體均數(shù)置信區(qū)間估計; t t檢驗;檢

17、驗;三、總體均數(shù)置信區(qū)間的估計三、總體均數(shù)置信區(qū)間的估計 統(tǒng)計推斷:參數(shù)估計,假設檢驗統(tǒng)計推斷:參數(shù)估計,假設檢驗 參數(shù)估計:參數(shù)估計: 點估計(點估計(point estimation):用樣本統(tǒng)計量作為對用樣本統(tǒng)計量作為對總體參數(shù)的估計值總體參數(shù)的估計值() 。比如均數(shù)的估計。比如均數(shù)的估計。 區(qū)間估計區(qū)間估計(interval estimation):根據(jù)選定的置信:根據(jù)選定的置信度估計總體均數(shù)所在的區(qū)間(度估計總體均數(shù)所在的區(qū)間(a 50)足夠大足夠大 也可參考也可參考u分布進行分布進行 95%置信區(qū)間:置信區(qū)間: 99%置信區(qū)間:置信區(qū)間:2.58,2.58XXXSXS1.96,1.

18、96XXXSXS 3、總體標準差未知,樣本例數(shù)較小、總體標準差未知,樣本例數(shù)較小 按按t分布原理,依據(jù)自由度,查出某個概率相分布原理,依據(jù)自由度,查出某個概率相應的應的t界值,界值, 中部占中部占95%95%面積的面積的t t值范圍:值范圍: - t- t0.05/2()0.05/2()_ t_ t0.05/2()0.05/2(), , 占占99%99%面積的面積的t t值范圍:值范圍: - t- t0.01/2()0.01/2()_ t_ t0.01/2()0.01/2()進行估計。進行估計。 因為:因為: 95%95%的樣本滿足:的樣本滿足: 95%95%置信區(qū)間:置信區(qū)間: 99%99%置信區(qū)間:置信區(qū)間:XXtS0.05 / 2,0.05 / 2,XXXtSXtS0.01 / 2,0.01 / 2,XXXtSXtS0.05 / 2|,vXXtS 95%置信區(qū)間的意義:置信區(qū)間的意義: 理論上,用一次抽樣所得的樣本均數(shù)估計總體理論上,用一次抽樣所得的樣本均數(shù)估計總體均數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論