抽樣誤差精品課件_第1頁(yè)
抽樣誤差精品課件_第2頁(yè)
抽樣誤差精品課件_第3頁(yè)
抽樣誤差精品課件_第4頁(yè)
抽樣誤差精品課件_第5頁(yè)
已閱讀5頁(yè),還剩26頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、抽樣誤差第1頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三1、均數(shù)的抽樣誤差 在醫(yī)學(xué)研究中,絕大多數(shù)情況是由樣本信息研究總體。由于個(gè)體存在差異,因此通過(guò)樣本推論總體時(shí)會(huì)存在一定的誤差,如樣本均數(shù) 往往不等于總體均數(shù) ,這種由抽樣造成的樣本均數(shù)與總體均數(shù)的差異稱為抽樣誤差。對(duì)于抽樣研究,抽樣誤差不可避免。一、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤第2頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三2.均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤的概念從N(,2)的總體中做隨機(jī)抽樣,每次抽樣樣本含量為n,樣本均數(shù)為x,標(biāo)準(zhǔn)差為s。如下: 1 n x1 s1 sx1 t1 2 n x2 s2 sx2 t2 3 n

2、x3 s3 sx3 t3 4 n x4 s4 sx4 t4 100 n x100 s100 sx100 t100 標(biāo)準(zhǔn)誤用x表示,它是說(shuō)明均數(shù)抽樣誤差的大小可知:每一個(gè)樣本均數(shù)與不一定相等,它們之差別是由抽樣所造成的;另外,這100個(gè)樣本均數(shù)大小也不盡相同,它們之間的變異程度可以用樣本均數(shù)的標(biāo)準(zhǔn)差來(lái)表示,即標(biāo)準(zhǔn)誤(為了與反映個(gè)體變異的標(biāo)準(zhǔn)差相區(qū)別)第3頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三 3.抽樣誤差的分布 理論上可以證明:若從正態(tài)總體 中,反復(fù)多次隨機(jī)抽取樣本含量固定為n 的樣本,那么這些樣本均數(shù) 也服從正態(tài)分布,即 的總體均數(shù)仍為 ,樣本均數(shù)的標(biāo)準(zhǔn)差為 。抽樣分布 抽

3、樣分布示意圖第4頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三 中心極限定理: 當(dāng)樣本含量很大的情況下,無(wú)論原始測(cè)量變量服從什么分布, 的抽樣分布均近似正態(tài)。 抽樣分布 抽樣分布示意圖第5頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三 3.標(biāo)準(zhǔn)誤 樣本均數(shù)的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。樣本均數(shù)的變異越小說(shuō)明估計(jì)越精確,因此可以用標(biāo)準(zhǔn)誤表示抽樣誤差的大?。?實(shí)際中總體標(biāo)準(zhǔn)差 往往未知,故只能求得樣本均數(shù)標(biāo)準(zhǔn)誤的估計(jì)值 : 第6頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三標(biāo)準(zhǔn)誤的計(jì)算例:某地成年男子紅細(xì)胞的抽樣調(diào)查,n=144, X=5.381012/L,S=0.441

4、012/L,求其標(biāo)準(zhǔn)誤。 Sx =s/ =0.44/ =0.037(1012/L) n144第7頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三上述抽了100次樣,可以求得100個(gè)Sx,均是x的估計(jì)值。實(shí)際工作中,只能根據(jù)一個(gè)樣本計(jì)數(shù)出一個(gè)標(biāo)準(zhǔn)誤說(shuō)明抽樣誤差的大小,作為X估計(jì)的可靠程度。第8頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三4. 標(biāo)準(zhǔn)誤應(yīng)用 標(biāo)準(zhǔn)誤反映抽樣誤差的大小,Sx越大,抽樣誤差越大,用X估計(jì)的的可靠程度越差。參數(shù)的估計(jì)均數(shù)的假設(shè)檢驗(yàn)第9頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三二、t分布1. t分布的概念對(duì)于XN(,) 有 u=(X-)

5、/對(duì)于XN (,x) 有u=(X-)/x x 是未知,常用Sx來(lái)代替。對(duì)于XN (,x) 有 t=(X-)/sx u值的分布稱為u分布(標(biāo)準(zhǔn)正態(tài)分布) t值的分布稱t分布第10頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三100次抽樣,可以求得100個(gè)t值,100個(gè)t值編成頻數(shù)表,可以繪制成頻數(shù)分布圖。由于sx受 n的影響, 嚴(yán)格講,受(n-1)的影響,(n-1) 稱為自由度。 = n-1如下圖。第11頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三t分布的圖形第12頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三2. 分布的特征(與正態(tài)分布比較) 單峰分布,以

6、t=0為中點(diǎn),兩側(cè)對(duì)稱(高峰位置)樣本(自由度)越小,t分布曲線峰值越低,t值越分散(形狀指標(biāo))隨著自由度的增大,t分布逐漸接近標(biāo)準(zhǔn)正態(tài)分布,當(dāng)=時(shí),t分布的極限分布是標(biāo)準(zhǔn)正態(tài)分布(與標(biāo)準(zhǔn)正態(tài)分布相比,t分布曲線高峰低,尾部較高)第13頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三3. t界值表(P683)當(dāng)一定時(shí),t分布曲線下單側(cè)或雙側(cè)的尾部面積為指定值時(shí),橫軸上相對(duì)應(yīng)的t值記為 t,有單、雙側(cè)t,之區(qū)分。如圖。-t, 0 +t, /2/2 -t, 0第14頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三圖中陰影部分表示t,以外尾部面積占總面積的百分?jǐn)?shù)P 意思是從正態(tài)整

7、體中做隨機(jī)抽樣,得到樣本t值落在該區(qū)間的概率.t界值表中: 同一時(shí),t與P呈反向關(guān)系. t, u 當(dāng)相同時(shí),單側(cè)P與雙側(cè)2P對(duì)應(yīng)相同的t界值,即單側(cè)t, =雙側(cè)t2, 當(dāng)=時(shí),t=u第15頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三三、總體均數(shù)的估計(jì)點(diǎn)估計(jì)(point estimation):估計(jì)總體均數(shù)的具體數(shù)值大小,一般就用X代替的大小。該估計(jì)方法沒(méi)有考慮抽樣誤差的大小,較少用。 例:某抽樣得X=165.0cm, =165.0cm.第16頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三區(qū)間估計(jì)(interval estimation): 指用X和Sx按一定的概率估計(jì)

8、總體均數(shù)在哪一個(gè)范圍,該區(qū)間包含總體均數(shù)的概率為1-,稱為總體均數(shù)的1-可信區(qū)間。1-一般取0.95或0.99。第17頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三總體均數(shù)可信區(qū)間(confidence interval, CI)估計(jì)未知:按t分布未知,n較大時(shí)總體均數(shù)的可信區(qū)間已知第18頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三未知:按t分布 t - t, 和t t, 的概率為 P(- t, t t,)=1- P(- t, X- t,)=1- X - t,Sx X+ t,Sx 或X t,Sx Sx第19頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三例:

9、已知某樣本的X=5.04,s=0.44,n=10.試求該總體的正常成年男子平均紅細(xì)胞計(jì)數(shù)的95%可信區(qū)間。解:=9, =0.05(雙側(cè)),查t界值表t0.05,9 =2.262 X t, Sx =5.042.2620.44/10 =(4.73,5.35)第20頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三例 隨機(jī)抽取某地健康男子20名,測(cè)得該樣本的收縮壓均數(shù)x為118.4mmHg,標(biāo)準(zhǔn)差S為10.8mmHg,試估計(jì)該地男子總體均數(shù)的95%的置信區(qū)間。Xt,Sx=Xt0.05,19Sx =118.42.09310.8/20 =(113.3,123.5)第21頁(yè),共31頁(yè),2022年,

10、5月20日,14點(diǎn)34分,星期三 未知,n較大時(shí)總體均數(shù)的可信區(qū)間較大時(shí), t, = u ,t0.05,=u0.05=1.96的1- CI: XuSX第22頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三例已知某市112名14歲男生平均身高X=158.04cm,S=8.22cm。試計(jì)算該市14歲男生平均身高的95%可信區(qū)間。解:可按大樣本對(duì)待 158.041.968.22/112 =(156.52,159.56)第23頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三 已知1- CI: XuX的單側(cè)1- CI:X-t,SX X-uSX X-uX第24頁(yè),共31頁(yè),2022年,

11、5月20日,14點(diǎn)34分,星期三可信區(qū)間的解釋: 含義:從總體中做隨機(jī)抽樣,據(jù)每個(gè)樣本可算得一個(gè)可信區(qū)間,如95%可信區(qū)間意味著做100次抽樣,算得100個(gè)可信區(qū)間,平均有95個(gè)包括,只有5個(gè)不包括。 實(shí)際工作中,為估計(jì)總體均數(shù),我們只做一次抽樣,只算得一個(gè)可信區(qū)間,用以估計(jì)的范圍,理論上有95%的可能是正確的(1-),只有5%的可能發(fā)生錯(cuò)誤()。第25頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三CI的優(yōu)劣準(zhǔn)確度:由(1-)的大小反映,即區(qū)間包括的概率。精確度:由區(qū)間的寬度反映,越窄越好。在n確定的時(shí),二者無(wú)法兼顧,一般95%CI更為常用,可信度確定的情況下,增加n可減小區(qū)間寬度

12、,即提高精確度。第26頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三 均數(shù)置信區(qū)間與參考值范圍的區(qū)別意義:95%的參考值范圍指同質(zhì)的總體內(nèi)包括95%的個(gè)體值范圍,對(duì)于正態(tài)分布總體,按 X1.96S計(jì)算。 95%的CI指按95%的可信度估計(jì)總體均數(shù)的可能范圍,按Xt,Sx計(jì)算,若為大樣本,按 X1.96Sx 計(jì)算。思考!第27頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三計(jì)算上:置信區(qū)間用標(biāo)準(zhǔn)誤,參考值范圍用標(biāo)準(zhǔn)差。應(yīng)用:參考值范圍判斷某項(xiàng)指標(biāo)正常與否;均數(shù)的可信區(qū)間估計(jì)未知的總體均數(shù)所在的范圍第28頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三 標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別 1)概念不同:標(biāo)準(zhǔn)差是描述樣本中個(gè)體值間的變異程度的指標(biāo),標(biāo)準(zhǔn)差越小,表示變量值圍繞均數(shù)的波動(dòng)越小。標(biāo)準(zhǔn)誤是描述樣本均數(shù)間變異程度的指標(biāo),標(biāo)準(zhǔn)誤越小,表示樣本均數(shù)圍繞總體均數(shù)的波動(dòng)越小。思考!第29頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)34分,星期三2) 用途不同: 標(biāo)準(zhǔn)差常用于表示變量值對(duì)均數(shù)波動(dòng)的大小,當(dāng)資料呈正態(tài)分布時(shí),與均數(shù)結(jié)合可估計(jì)正常值范圍,計(jì)算變異系數(shù)等; 標(biāo)準(zhǔn)誤常用于表示樣本統(tǒng)計(jì)量(樣本均數(shù),樣本率)對(duì)總體參數(shù)(總體均數(shù),總體率)的波動(dòng)情況,可估計(jì)參數(shù)的可信區(qū)間,進(jìn)行假設(shè)檢驗(yàn)。第30頁(yè),共31頁(yè),2022年,5月20日,14點(diǎn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論