研究生醫(yī)學(xué)統(tǒng)計(jì)3 抽樣誤差t分布_第1頁(yè)
研究生醫(yī)學(xué)統(tǒng)計(jì)3 抽樣誤差t分布_第2頁(yè)
研究生醫(yī)學(xué)統(tǒng)計(jì)3 抽樣誤差t分布_第3頁(yè)
研究生醫(yī)學(xué)統(tǒng)計(jì)3 抽樣誤差t分布_第4頁(yè)
研究生醫(yī)學(xué)統(tǒng)計(jì)3 抽樣誤差t分布_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、均數(shù)的抽樣誤差,均數(shù)的抽樣誤差,t分布,參數(shù)估計(jì)分布,參數(shù)估計(jì)Sampling error of mean,t-distribution,parameters estimation 張建軍張建軍汕大醫(yī)學(xué)院預(yù)防醫(yī)學(xué)教研室汕大醫(yī)學(xué)院預(yù)防醫(yī)學(xué)教研室Tel:mail: 主要內(nèi)容主要內(nèi)容 均數(shù)的抽樣誤差均數(shù)的抽樣誤差 t分布分布 參數(shù)估計(jì)參數(shù)估計(jì) 概念:概念: 頻數(shù)分布以均數(shù)為中心,左右兩側(cè)基本對(duì)稱,頻數(shù)分布以均數(shù)為中心,左右兩側(cè)基本對(duì)稱,靠近均數(shù)兩側(cè)頻數(shù)較多,離均數(shù)愈遠(yuǎn),頻數(shù)愈少,靠近均數(shù)兩側(cè)頻數(shù)較多,離均數(shù)愈遠(yuǎn),頻數(shù)愈少,形成一個(gè)中間多,兩側(cè)逐漸減少的對(duì)稱分布。形成一個(gè)

2、中間多,兩側(cè)逐漸減少的對(duì)稱分布。 是一種連續(xù)型分布。又稱高斯分布是一種連續(xù)型分布。又稱高斯分布. 回顧:正態(tài)分布(normal distribution) 正態(tài)分布用正態(tài)分布用N(, )表示,其位置與均數(shù)有關(guān),表示,其位置與均數(shù)有關(guān),形狀與標(biāo)準(zhǔn)差有關(guān)。形狀與標(biāo)準(zhǔn)差有關(guān)。 醫(yī)學(xué)現(xiàn)象許多呈正態(tài)分布,或近似正態(tài)分布:如醫(yī)學(xué)現(xiàn)象許多呈正態(tài)分布,或近似正態(tài)分布:如正常人的生理,生化指標(biāo)變量,等正常人的生理,生化指標(biāo)變量,等2 正態(tài)分布的密度函數(shù):式中正態(tài)分布的密度函數(shù):式中為均數(shù);為均數(shù);為標(biāo)為標(biāo)準(zhǔn)差;準(zhǔn)差;為圓周率;為圓周率;為自然對(duì)數(shù)的底,即為自然對(duì)數(shù)的底,即2.71828。以上均為常數(shù),僅。以上均

3、為常數(shù),僅x為變量。為變量。x 2()1( )21( )2xf xe(1) 標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布: 為了應(yīng)用方便,常將式進(jìn)行變量變換,即:為了應(yīng)用方便,常將式進(jìn)行變量變換,即:u變換變換. 所得到的新變量所得到的新變量u的分布即為標(biāo)準(zhǔn)正態(tài)的分布即為標(biāo)準(zhǔn)正態(tài)分布。分布。 u的含義:變量到均數(shù)間的距離相當(dāng)于標(biāo)準(zhǔn)差的含義:變量到均數(shù)間的距離相當(dāng)于標(biāo)準(zhǔn)差的倍數(shù)。的倍數(shù)。xux 標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù):標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù):(2)u 2()21( )2uue 正態(tài)分布的特征和分布規(guī)律:正態(tài)分布的特征和分布規(guī)律: (1)曲線在)曲線在x軸的上方,與軸的上方,與x軸不相交,當(dāng)軸不相交,當(dāng)x=時(shí)

4、,曲線位于最高點(diǎn)。時(shí),曲線位于最高點(diǎn)。 f(u=0)=0.3989 (2)曲線關(guān)于直線)曲線關(guān)于直線x=左右對(duì)稱。左右對(duì)稱。 (3)正態(tài)分布有兩個(gè)參數(shù))正態(tài)分布有兩個(gè)參數(shù):均數(shù)均數(shù),標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差;標(biāo)準(zhǔn)正標(biāo)準(zhǔn)正態(tài)的參數(shù)分別為態(tài)的參數(shù)分別為:0, 1 (4)正態(tài)分布的面積分布有一定規(guī)律。)正態(tài)分布的面積分布有一定規(guī)律。正態(tài)分布正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布面積面積( (或概率或概率) ) -1_ +1 -1_ +1 -1_+1-1_+168.27%68.27%1.96_+1.961.96_+1.96-1.96_+1.96-1.96_+1.9695.00%95.00% 2.58_+2.58 2.5

5、8_+2.58-2.58_+2.58-2.58_+2.5899.00%99.00%正態(tài)分布和標(biāo)準(zhǔn)正態(tài)分布曲線下面積分布規(guī)律正態(tài)分布和標(biāo)準(zhǔn)正態(tài)分布曲線下面積分布規(guī)律(-1,1),68.27%(-1.96,1.96),95%(-2.58,2.58),99%雙側(cè)概率雙側(cè)概率單側(cè)概率單側(cè)概率請(qǐng)思考:請(qǐng)思考: 抽樣?抽樣? 統(tǒng)計(jì)量?統(tǒng)計(jì)量? 抽樣分布?抽樣分布?一、均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤一、均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤均數(shù)的抽樣誤差均數(shù)的抽樣誤差sampling error of mean 由于總體中存在個(gè)體變異,抽樣研究中由于總體中存在個(gè)體變異,抽樣研究中所抽取的樣本,只包含總體中一部分個(gè)體,所抽取的樣本,

6、只包含總體中一部分個(gè)體,因而樣本均數(shù)(或率)往往不等于總體均數(shù)因而樣本均數(shù)(或率)往往不等于總體均數(shù)(或率),樣本均數(shù)之間也互不相等,(或率),樣本均數(shù)之間也互不相等,這種這種由抽樣引起的差異稱為均數(shù)的抽樣誤差的體由抽樣引起的差異稱為均數(shù)的抽樣誤差的體現(xiàn)現(xiàn)。即:即:iXijXX 如何估計(jì)抽樣誤差如何估計(jì)抽樣誤差? 標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤 standard error,SE 以樣本均數(shù)為例:以樣本均數(shù)為例: SE 越大,均數(shù)的抽樣誤差越大,樣本均數(shù)與越大,均數(shù)的抽樣誤差越大,樣本均數(shù)與總體均數(shù)間的差異越大。總體均數(shù)間的差異越大。XSSnXn 當(dāng)樣本例數(shù)一定時(shí),樣本均數(shù)的標(biāo)準(zhǔn)誤與原當(dāng)樣本例數(shù)一定時(shí),樣本均數(shù)

7、的標(biāo)準(zhǔn)誤與原始數(shù)據(jù)的標(biāo)準(zhǔn)差成正比;當(dāng)標(biāo)準(zhǔn)差一定時(shí),始數(shù)據(jù)的標(biāo)準(zhǔn)差成正比;當(dāng)標(biāo)準(zhǔn)差一定時(shí),標(biāo)準(zhǔn)誤與樣本含量標(biāo)準(zhǔn)誤與樣本含量 n 的平方根成反比。增加的平方根成反比。增加樣本含量可以減小抽樣誤差。樣本含量可以減小抽樣誤差。 與標(biāo)準(zhǔn)差的區(qū)別:與標(biāo)準(zhǔn)差的區(qū)別: 標(biāo)準(zhǔn)差:表示一般個(gè)體值的離散程度;標(biāo)準(zhǔn)差:表示一般個(gè)體值的離散程度; 標(biāo)準(zhǔn)誤:特別說明統(tǒng)計(jì)量的離散程度。標(biāo)準(zhǔn)誤:特別說明統(tǒng)計(jì)量的離散程度。再思考一個(gè)問題:再思考一個(gè)問題: 其它的統(tǒng)計(jì)量有抽樣誤差嗎?其它的統(tǒng)計(jì)量有抽樣誤差嗎? 它們的計(jì)算公式怎樣?它們的計(jì)算公式怎樣?XnXSSn標(biāo)準(zhǔn)誤的應(yīng)用標(biāo)準(zhǔn)誤的應(yīng)用1、用來衡量抽樣誤差的大小、用來衡量抽樣誤差

8、的大小: 標(biāo)準(zhǔn)誤越小,樣本均數(shù)與總體均數(shù)越接近,標(biāo)準(zhǔn)誤越小,樣本均數(shù)與總體均數(shù)越接近,樣本均數(shù)的可信度越高;樣本均數(shù)的可信度越高;2、結(jié)合標(biāo)準(zhǔn)正態(tài)分布與、結(jié)合標(biāo)準(zhǔn)正態(tài)分布與 t 分布曲線下的面積規(guī)分布曲線下的面積規(guī)律,估計(jì)總體均數(shù)的置信區(qū)間。律,估計(jì)總體均數(shù)的置信區(qū)間。3、用于假設(shè)檢驗(yàn)。、用于假設(shè)檢驗(yàn)。 假定假定2003年汕頭市年汕頭市15歲女學(xué)生的身高服從均歲女學(xué)生的身高服從均數(shù)數(shù)155.4cm、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)差5.3cm的正態(tài)分布。用計(jì)的正態(tài)分布。用計(jì)算機(jī)做抽樣模擬試驗(yàn),從算機(jī)做抽樣模擬試驗(yàn),從N(155.4, 5.32)的總體的總體中,每次抽出中,每次抽出10個(gè)數(shù)字(樣本含量為個(gè)數(shù)字(樣本

9、含量為10),),組成一個(gè)樣本,求出樣本均數(shù)組成一個(gè)樣本,求出樣本均數(shù) 、樣本標(biāo)、樣本標(biāo)準(zhǔn)差準(zhǔn)差 S。 再求得此再求得此100個(gè)樣本均數(shù)的均數(shù)、樣個(gè)樣本均數(shù)的均數(shù)、樣本均數(shù)的標(biāo)準(zhǔn)差。本均數(shù)的標(biāo)準(zhǔn)差。X抽樣分布抽樣分布 樣本均數(shù)的標(biāo)準(zhǔn)差是什么?樣本均數(shù)的標(biāo)準(zhǔn)差是什么?.標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤 100個(gè)樣本均數(shù)構(gòu)成一個(gè)新的分布,也是個(gè)樣本均數(shù)構(gòu)成一個(gè)新的分布,也是正態(tài)分正態(tài)分布。布。 即使原分布為偏態(tài)分布,當(dāng)樣本含量足夠大時(shí),即使原分布為偏態(tài)分布,當(dāng)樣本含量足夠大時(shí),新分布也新分布也近似正態(tài)分布近似正態(tài)分布)。新分布的集中趨勢(shì)用)。新分布的集中趨勢(shì)用均數(shù)的均數(shù)均數(shù)的均數(shù)來表示,離散趨勢(shì)用來表示,離散趨勢(shì)用標(biāo)

10、準(zhǔn)誤標(biāo)準(zhǔn)誤表示表示N( , ) 。 各樣本均數(shù)的均數(shù)等于總體均數(shù)各樣本均數(shù)的均數(shù)等于總體均數(shù)。2X0501001502002503003504004502.082.342.612.873.143.403.663.934.194.464.724.985.25均數(shù)頻數(shù)0501001502002503003504004502.082.342.612.873.143.403.663.934.194.464.724.985.25均數(shù)頻數(shù)0501001502002503003504004505002.082.342.612.873.143.403.663.934.194.464.724.985.25均數(shù)頻

11、數(shù)正態(tài)總體中抽樣正態(tài)總體中抽樣(樣本量(樣本量5)正態(tài)總體中抽樣正態(tài)總體中抽樣(樣本量(樣本量10)正態(tài)總體中抽樣正態(tài)總體中抽樣(樣本量(樣本量30)抽樣時(shí)樣本量抽樣時(shí)樣本量大小決定了樣大小決定了樣本均數(shù)分布的本均數(shù)分布的形狀,當(dāng)樣本形狀,當(dāng)樣本量足夠大時(shí),量足夠大時(shí),均數(shù)分布趨向均數(shù)分布趨向正態(tài)分布。正態(tài)分布。二、二、t 分布(分布(t-distribution)還記得嗎?還記得嗎?xu u轉(zhuǎn)換將正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)轉(zhuǎn)換將正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài), N(0, 1)。 同理:將樣本均數(shù)的分布也可以轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)同理:將樣本均數(shù)的分布也可以轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布分布 。 即:即:2,()(0,1)X

12、NNXXu 實(shí)際工作中,總體標(biāo)準(zhǔn)差往往未知,常用實(shí)際工作中,總體標(biāo)準(zhǔn)差往往未知,常用S代替代替 計(jì)算計(jì)算標(biāo)準(zhǔn)誤,因此:為了和標(biāo)準(zhǔn)誤,因此:為了和u分布區(qū)別,就變?yōu)椋悍植紖^(qū)別,就變?yōu)椋?/XXXtSSn均數(shù)的分布也是這樣均數(shù)的分布也是這樣 如果我們采用另一個(gè)正態(tài)變量如果我們采用另一個(gè)正態(tài)變量: 于是,均數(shù)的分布變成了標(biāo)準(zhǔn)正態(tài)分布于是,均數(shù)的分布變成了標(biāo)準(zhǔn)正態(tài)分布: XXu2,()(0,1)XNNxu但是,條件發(fā)生了變化 我們通常用代替我們通常用代替 然而,然而, 隨著樣本量的變化而變化,所以,我隨著樣本量的變化而變化,所以,我們稱之為們稱之為 t-分布,雖然它是正態(tài)分布,但只有分布,雖然它是正態(tài)

13、分布,但只有當(dāng)樣本量(自由度)無窮大的時(shí)候,它才是標(biāo)當(dāng)樣本量(自由度)無窮大的時(shí)候,它才是標(biāo)準(zhǔn)正態(tài)分布,此時(shí),準(zhǔn)正態(tài)分布,此時(shí),u=t/XXXtSSnXXuXXSXSt t分布曲線分布曲線 t t分布是一簇分布是一簇對(duì)稱于對(duì)稱于0的單峰分布曲線。的單峰分布曲線。 自由度越?。ㄏ喈?dāng)于標(biāo)準(zhǔn)差大),曲線的中間越自由度越小(相當(dāng)于標(biāo)準(zhǔn)差大),曲線的中間越低,兩邊越高;隨自由度增大,低,兩邊越高;隨自由度增大, t t分布曲線逐漸分布曲線逐漸逼近于標(biāo)準(zhǔn)正態(tài)分布曲線。逼近于標(biāo)準(zhǔn)正態(tài)分布曲線。 當(dāng)自由度無窮大時(shí),當(dāng)自由度無窮大時(shí), t t分布就是標(biāo)準(zhǔn)正態(tài)分布曲分布就是標(biāo)準(zhǔn)正態(tài)分布曲線。線。 每一條每一條t

14、t分布曲線,都對(duì)應(yīng)于相應(yīng)的自由度。分布曲線,都對(duì)應(yīng)于相應(yīng)的自由度。 t t分布模擬試驗(yàn)分布模擬試驗(yàn)t t分布曲線下的面積規(guī)律分布曲線下的面積規(guī)律 與標(biāo)準(zhǔn)正態(tài)曲線下的面積規(guī)律相似:與標(biāo)準(zhǔn)正態(tài)曲線下的面積規(guī)律相似: 在某一個(gè)自由度下,兩側(cè)外部總面積為在某一個(gè)自由度下,兩側(cè)外部總面積為5%5%的界的界限的限的t t值稱為值稱為t t0.05/2()0.05/2(), ,把兩側(cè)外部總面積為把兩側(cè)外部總面積為1%1%的界限的的界限的t t值稱為值稱為t t0.01/2()0.01/2()。 因此,中部占因此,中部占95%95%面積的面積的t t值范圍:值范圍:- t t0.05/2()0.05/2()-

15、 t- t0.05/2()0.05/2(), ,- 中部占中部占99%99%面積的面積的t t值范圍:值范圍:- t- t0.01/2()0.01/2()- t- t0.01/2()0.01/2()。 當(dāng)自由度確定時(shí),占一定面積的當(dāng)自由度確定時(shí),占一定面積的t界限值,界限值,可以查表得出。可以查表得出。 例如:查當(dāng)自由度例如:查當(dāng)自由度=20,兩側(cè)概率之和為,兩側(cè)概率之和為0.05時(shí),對(duì)應(yīng)的時(shí),對(duì)應(yīng)的t值:值: t0.05/2(20)=2.086, 單側(cè)概率為單側(cè)概率為0.05時(shí),對(duì)應(yīng)的時(shí),對(duì)應(yīng)的t值:值: t0.05(20)=1.725, 一般,一般, t 0.05/2(v)1.96 ,t

16、0.01/2(v) 2.58 自由度越小,曲線越低平,自由度越小,曲線越低平,t 比比1.96,2.58大大的多;自由度變大,的多;自由度變大,t接近于接近于1.96,2.58;自;自由度無窮大,由度無窮大,t=1.96,2.58 使用使用t值表注意:值表注意: 同一自由度下同一自由度下, P越小,越小,t值越大;值越大;P值相同時(shí),自值相同時(shí),自由度越大,由度越大,t越?。划?dāng)自由度無窮大時(shí),越??;當(dāng)自由度無窮大時(shí),t值與值與u值相等。這也是值相等。這也是u分布與分布與t分布的區(qū)別。分布的區(qū)別。t t分布的主要應(yīng)用:分布的主要應(yīng)用: 總體均數(shù)置信區(qū)間估計(jì);總體均數(shù)置信區(qū)間估計(jì); t t檢驗(yàn);檢

17、驗(yàn);三、總體均數(shù)置信區(qū)間的估計(jì)三、總體均數(shù)置信區(qū)間的估計(jì) 統(tǒng)計(jì)推斷:參數(shù)估計(jì),假設(shè)檢驗(yàn)統(tǒng)計(jì)推斷:參數(shù)估計(jì),假設(shè)檢驗(yàn) 參數(shù)估計(jì):參數(shù)估計(jì): 點(diǎn)估計(jì)(點(diǎn)估計(jì)(point estimation):用樣本統(tǒng)計(jì)量作為對(duì)用樣本統(tǒng)計(jì)量作為對(duì)總體參數(shù)的估計(jì)值總體參數(shù)的估計(jì)值() 。比如均數(shù)的估計(jì)。比如均數(shù)的估計(jì)。 區(qū)間估計(jì)區(qū)間估計(jì)(interval estimation):根據(jù)選定的置信:根據(jù)選定的置信度估計(jì)總體均數(shù)所在的區(qū)間(度估計(jì)總體均數(shù)所在的區(qū)間(a 50)足夠大足夠大 也可參考也可參考u分布進(jìn)行分布進(jìn)行 95%置信區(qū)間:置信區(qū)間: 99%置信區(qū)間:置信區(qū)間:2.58,2.58XXXSXS1.96,1.

18、96XXXSXS 3、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)較小、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)較小 按按t分布原理,依據(jù)自由度,查出某個(gè)概率相分布原理,依據(jù)自由度,查出某個(gè)概率相應(yīng)的應(yīng)的t界值,界值, 中部占中部占95%95%面積的面積的t t值范圍:值范圍: - t- t0.05/2()0.05/2()_ t_ t0.05/2()0.05/2(), , 占占99%99%面積的面積的t t值范圍:值范圍: - t- t0.01/2()0.01/2()_ t_ t0.01/2()0.01/2()進(jìn)行估計(jì)。進(jìn)行估計(jì)。 因?yàn)椋阂驗(yàn)椋?95%95%的樣本滿足:的樣本滿足: 95%95%置信區(qū)間:置信區(qū)間: 99%99%置信區(qū)間:置信區(qū)間:XXtS0.05 / 2,0.05 / 2,XXXtSXtS0.01 / 2,0.01 / 2,XXXtSXtS0.05 / 2|,vXXtS 95%置信區(qū)間的意義:置信區(qū)間的意義: 理論上,用一次抽樣所得的樣本均數(shù)估計(jì)總體理論上,用一次抽樣所得的樣本均數(shù)估計(jì)總體均數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論