版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 第四章第四章 抽樣誤差與假設(shè)檢驗抽樣誤差與假設(shè)檢驗 (Sampling Sampling E Error and rror and H Hypothesis ypothesis T Testest) 哈爾濱醫(yī)科大學(xué)哈爾濱醫(yī)科大學(xué) 李康李康 第一節(jié)第一節(jié) 均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤 一、均數(shù)的抽樣誤差一、均數(shù)的抽樣誤差 在醫(yī)學(xué)研究中,絕大多數(shù)情況是由樣本信息研在醫(yī)學(xué)研究中,絕大多數(shù)情況是由樣本信息研究總體。由于個體存在差異,因此通過樣本推論究總體。由于個體存在差異,因此通過樣本推論總體時會存在一定的誤差,如樣本均數(shù)總體時會存在一定的誤差,如樣本均數(shù) 往往不往往不等于總體均數(shù)等
2、于總體均數(shù) ,這種由抽樣造成的樣本均數(shù)與總,這種由抽樣造成的樣本均數(shù)與總體均數(shù)的差異稱為抽樣誤差體均數(shù)的差異稱為抽樣誤差。對于抽樣研究,抽。對于抽樣研究,抽樣誤差不可避免。樣誤差不可避免。X 二、抽樣誤差的分布二、抽樣誤差的分布 理論上可以證明:若從正態(tài)總體理論上可以證明:若從正態(tài)總體 中,反中,反復(fù)多次隨機抽取樣本含量固定為復(fù)多次隨機抽取樣本含量固定為n 的樣本,那么的樣本,那么這些樣本均數(shù)這些樣本均數(shù) 也服從正態(tài)分布,即也服從正態(tài)分布,即 的總體均的總體均數(shù)仍為數(shù)仍為 ,樣本均數(shù)的標(biāo)準(zhǔn)差為,樣本均數(shù)的標(biāo)準(zhǔn)差為 。2N( ,) XX/n抽樣分布抽樣分布 抽樣分布示意圖抽樣分布示意圖 中心極限
3、定理中心極限定理: : 當(dāng)樣本含量很大的情況下,無論原始測量變量服當(dāng)樣本含量很大的情況下,無論原始測量變量服從什么分布,從什么分布, 的抽樣分布的抽樣分布均均近似正態(tài)。近似正態(tài)。 X抽樣分布抽樣分布 抽樣分布示意圖抽樣分布示意圖 三、標(biāo)準(zhǔn)誤(三、標(biāo)準(zhǔn)誤(Standard ErrorStandard Error) 樣本均數(shù)的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。樣本均數(shù)的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。樣本均數(shù)的樣本均數(shù)的變異越小說明估計越精確,變異越小說明估計越精確,因此可以用標(biāo)準(zhǔn)誤表因此可以用標(biāo)準(zhǔn)誤表示抽樣誤差的大?。菏境闃诱`差的大小: 實際中總體標(biāo)準(zhǔn)差實際中總體標(biāo)準(zhǔn)差 往往未知,故只能求往往未知,故只能求得樣本均數(shù)標(biāo)準(zhǔn)誤的
4、估計值得樣本均數(shù)標(biāo)準(zhǔn)誤的估計值 : nXXSnSSX 例例4.1 在某地隨機抽查成年男子在某地隨機抽查成年男子140人,計算得紅人,計算得紅細(xì)胞均數(shù)細(xì)胞均數(shù)4.771012/L,標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差0.38 1012/L ,試計,試計算均數(shù)的標(biāo)準(zhǔn)誤。算均數(shù)的標(biāo)準(zhǔn)誤。 標(biāo)準(zhǔn)誤是抽樣分布的重要特征之一,可用于衡標(biāo)準(zhǔn)誤是抽樣分布的重要特征之一,可用于衡量抽樣誤差的大小,更重要的是可以用于參數(shù)的區(qū)量抽樣誤差的大小,更重要的是可以用于參數(shù)的區(qū)間估計和對不同組之間的參數(shù)進(jìn)行比較。間估計和對不同組之間的參數(shù)進(jìn)行比較。120.380.032( 10 /L)140XSSn 第二節(jié)第二節(jié) 總體均數(shù)的估計總體均數(shù)的估計 一
5、、可信區(qū)間的概念一、可信區(qū)間的概念( (Confidence IntervalConfidence Interval) 區(qū)間估計:區(qū)間估計:指按預(yù)先給定的概率,計算出一個區(qū)間,指按預(yù)先給定的概率,計算出一個區(qū)間, 使它能夠包含未知的總體均數(shù)。事先給定的概率使它能夠包含未知的總體均數(shù)。事先給定的概率 稱為可信度,通常取稱為可信度,通常取 。 參數(shù)估計參數(shù)估計點估計:不考慮抽樣誤差,如點估計:不考慮抽樣誤差,如區(qū)間估計:考慮抽樣誤差區(qū)間估計:考慮抽樣誤差195. 01X二、可信區(qū)間的計算二、可信區(qū)間的計算 (一)(一) 已知已知nXu/95. 096. 1/96. 1nXP95. 096. 196
6、. 1nXnXP)96.1 ,96.1(XXXX),(2/2/XXuXuX一般情況一般情況其中其中 為標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)界值。為標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)界值。 2/u 可信區(qū)間:可信區(qū)間:v 5v 1v ( )f t標(biāo)準(zhǔn)正態(tài)分布(二)(二) 未知未知 通常未知,這時可以用其估計量通常未知,這時可以用其估計量S 代替,但代替,但 已不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服已不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從著名的從著名的 t 分布。分布。)/()(nSX 圖圖4-2 4-2 不同自由度的不同自由度的 t 分布圖分布圖 可信區(qū)間的計算可信區(qū)間的計算: : 計算可信區(qū)間的原理與前完全相同,僅僅是兩計算可信區(qū)間的原理與前完
7、全相同,僅僅是兩側(cè)概率的界值有些差別。即側(cè)概率的界值有些差別。即1)/()(2/)(2/tnSXtP). .()(2/)(2/XXStXStX,可信區(qū)間:可信區(qū)間: 需要注意:在小樣本情況下,應(yīng)用這一公式的需要注意:在小樣本情況下,應(yīng)用這一公式的條件是原始變量服從正態(tài)分布。在大樣本情況下條件是原始變量服從正態(tài)分布。在大樣本情況下(如(如n100),100),也可以用也可以用 替換替換 近似計算。近似計算。2/u2/t 例例4.2 4.2 某醫(yī)生測得某醫(yī)生測得2525名動脈粥樣硬化患者血漿名動脈粥樣硬化患者血漿纖維蛋白原含量的均數(shù)為纖維蛋白原含量的均數(shù)為3.32 3.32 g/Lg/L,標(biāo)準(zhǔn)差為
8、標(biāo)準(zhǔn)差為0.57 0.57 g/Lg/L,試計算該種病人血漿纖維蛋白原含量總體均試計算該種病人血漿纖維蛋白原含量總體均數(shù)的數(shù)的95%95%可信區(qū)間??尚艆^(qū)間。下限:下限:上限:上限:(g/L) 09. 325/57. 0064. 232. 3.)(2/XStX(g/L) 56. 325/57. 0064. 232. 3.)(2/XStX 例例4.3 4.3 試計算例試計算例4.14.1中該地成年男子紅細(xì)胞總體中該地成年男子紅細(xì)胞總體均數(shù)的均數(shù)的95%95%可信區(qū)間??尚艆^(qū)間。 本例屬于大樣本,可采用正態(tài)近似的方法計算本例屬于大樣本,可采用正態(tài)近似的方法計算可信區(qū)間。因為可信區(qū)間。因為 ,則,則
9、95%95%可可信區(qū)間為:信區(qū)間為:14038.077.4n,)L/10(71. 4140/38. 096. 177. 4.122/XSuX)L/10(83. 4140/38. 096. 177. 4.122/XSuX下限:下限:上限:上限: 三、模擬實驗三、模擬實驗 模擬抽樣成年男子紅細(xì)胞數(shù)。設(shè)定模擬抽樣成年男子紅細(xì)胞數(shù)。設(shè)定: : 產(chǎn)生產(chǎn)生100100個隨機樣本,分別計算其個隨機樣本,分別計算其95%95%的可信區(qū)間,的可信區(qū)間,結(jié)果用圖示的方法表示。從圖可以看出:絕大多數(shù)結(jié)果用圖示的方法表示。從圖可以看出:絕大多數(shù)可信區(qū)間包含總體參數(shù)可信區(qū)間包含總體參數(shù) ,只有,只有6 6個可信區(qū)間個可
10、信區(qū)間沒有包含總體參數(shù)(用星號標(biāo)記)。沒有包含總體參數(shù)(用星號標(biāo)記)。14039.075.4n,754. 圖圖4-4-2 2 模擬抽樣成年男子紅細(xì)胞數(shù)模擬抽樣成年男子紅細(xì)胞數(shù)100100次的次的95%95%可信區(qū)間示意圖可信區(qū)間示意圖 )14039.075.4(n,* 第三節(jié)第三節(jié) 假設(shè)檢驗的意義和步驟假設(shè)檢驗的意義和步驟 ( (H Hypothesis ypothesis T Test)est) 統(tǒng)計推斷的另一個重要內(nèi)容,目的是統(tǒng)計推斷的另一個重要內(nèi)容,目的是通過樣通過樣本數(shù)據(jù)本數(shù)據(jù)比較總體參數(shù)之間有無差別。比較總體參數(shù)之間有無差別。 一、假設(shè)檢驗的基本思想一、假設(shè)檢驗的基本思想 例例4.4
11、 4.4 使用使用黑加侖油軟膠囊黑加侖油軟膠囊治療治療高脂血癥高脂血癥,3030名名高脂血癥高脂血癥患者治療前后血清甘油三酯檢測結(jié)患者治療前后血清甘油三酯檢測結(jié)果的差值為果的差值為1.381.380.76 (0.76 (g/L)g/L),問治療后血清甘問治療后血清甘油三酯是否有所改善?油三酯是否有所改善? 樣樣 本本治療前后甘油三治療前后甘油三酯的變化(差值)酯的變化(差值)d38. 1 76. 0 30dSnd?0d問題歸納:問題歸納: 樣本療效樣本療效 藥物作用藥物作用 + 機遇機遇 ?d01.38d對上面問題可以作如下考慮:對上面問題可以作如下考慮: 問題:問題: 究竟多大能夠下究竟多大
12、能夠下“有效有效”的結(jié)論?的結(jié)論?|d|0 假定治療前后血清甘油三酯檢測結(jié)果的差值服從正態(tài)分布,假定治療前后血清甘油三酯檢測結(jié)果的差值服從正態(tài)分布,若若 則則 服從服從t t 分布。分布。 根據(jù)根據(jù) t 分布能夠計算出有如此大差異的概率分布能夠計算出有如此大差異的概率P P ,如果,如果P P 值很小,即計算出的值很小,即計算出的t t 值超出了給定的界限,則傾向于拒絕值超出了給定的界限,則傾向于拒絕H0 0,認(rèn)為治療前后有差別。認(rèn)為治療前后有差別。 0:0dHnSdtd/0圖圖4-4-3 3 利用利用t t 分布進(jìn)行假設(shè)檢驗原理示意圖分布進(jìn)行假設(shè)檢驗原理示意圖 二、假設(shè)檢驗的基本步驟二、假設(shè)
13、檢驗的基本步驟 1. 1.建立假設(shè)和確定檢驗水準(zhǔn)建立假設(shè)和確定檢驗水準(zhǔn) 無效假設(shè)無效假設(shè)H0 0( (null hypothesis)null hypothesis)指需要檢驗的假設(shè),指需要檢驗的假設(shè),備擇假設(shè)備擇假設(shè)H1 1( (alternative hypothesis)alternative hypothesis)指在指在H0 0成成立證據(jù)不足的情況下而被接受的假設(shè)。例如建立立證據(jù)不足的情況下而被接受的假設(shè)。例如建立治療前后血清甘油三酯療效的無效假設(shè)和備擇假治療前后血清甘油三酯療效的無效假設(shè)和備擇假設(shè)分別為設(shè)分別為 0:0dH0:1dH 檢驗水準(zhǔn)檢驗水準(zhǔn) 是預(yù)先規(guī)定的拒絕域的概率值,實
14、是預(yù)先規(guī)定的拒絕域的概率值,實際中一般取際中一般取 。 05. 0 說明說明 :備擇假設(shè)有雙側(cè)和單側(cè)兩種情況。雙側(cè):備擇假設(shè)有雙側(cè)和單側(cè)兩種情況。雙側(cè)檢驗指不論正方向還是負(fù)方向的誤差,若顯著地超出檢驗指不論正方向還是負(fù)方向的誤差,若顯著地超出檢驗水準(zhǔn)則拒絕檢驗水準(zhǔn)則拒絕H0 0, 即為雙側(cè)檢驗;單側(cè)即為雙側(cè)檢驗;單側(cè)檢驗指僅在出現(xiàn)正方向或負(fù)方向誤差超出規(guī)定的水準(zhǔn)檢驗指僅在出現(xiàn)正方向或負(fù)方向誤差超出規(guī)定的水準(zhǔn)時則拒絕時則拒絕H0 0 ,如治療后血清甘油三酯下降的假設(shè)可如治療后血清甘油三酯下降的假設(shè)可表示為表示為 ):H :Hd1d10(或 001d:H 雙側(cè)檢驗和單側(cè)檢驗應(yīng)如何選擇,需根據(jù)研究目
15、的雙側(cè)檢驗和單側(cè)檢驗應(yīng)如何選擇,需根據(jù)研究目的和專業(yè)知識而定。和專業(yè)知識而定。一般情況下,雙側(cè)檢驗更為穩(wěn)妥,一般情況下,雙側(cè)檢驗更為穩(wěn)妥,因為對相同的樣本,雙側(cè)檢驗得出有顯著性差別的結(jié)因為對相同的樣本,雙側(cè)檢驗得出有顯著性差別的結(jié)論,單側(cè)檢驗也一定是顯著的。論,單側(cè)檢驗也一定是顯著的。 2.2.選擇檢驗方法和計算檢驗統(tǒng)計量選擇檢驗方法和計算檢驗統(tǒng)計量 根據(jù)資料類型、研究設(shè)計方案和統(tǒng)計推斷的目的,根據(jù)資料類型、研究設(shè)計方案和統(tǒng)計推斷的目的,選擇適當(dāng)?shù)臋z驗方法,不同檢驗方法各有其相應(yīng)的檢選擇適當(dāng)?shù)臋z驗方法,不同檢驗方法各有其相應(yīng)的檢驗統(tǒng)計量及計算公式。許多假設(shè)檢驗方法是以檢驗統(tǒng)驗統(tǒng)計量及計算公式。
16、許多假設(shè)檢驗方法是以檢驗統(tǒng)計量來命名的,如計量來命名的,如 t 檢驗、檢驗、u檢驗、檢驗、F檢驗和檢驗和 檢驗檢驗等。等。 3. 3.確定確定P P 值并做出統(tǒng)計推斷結(jié)論值并做出統(tǒng)計推斷結(jié)論 查表得到檢驗用的臨界值,然后將算得的統(tǒng)計量查表得到檢驗用的臨界值,然后將算得的統(tǒng)計量與拒絕域的臨界值作比較,確定與拒絕域的臨界值作比較,確定P 值。如對雙側(cè)值。如對雙側(cè) t 檢檢驗驗 ,則,則 , ,按檢驗水準(zhǔn)按檢驗水準(zhǔn) 拒絕拒絕H0 0。 2/2()t| t |P 小小 結(jié)結(jié) 1.1.總體參數(shù)值在現(xiàn)實中通常不能獲得總體參數(shù)值在現(xiàn)實中通常不能獲得, ,而是通過而是通過隨機樣本來進(jìn)行估計。由于個體存在差異,
17、因此通隨機樣本來進(jìn)行估計。由于個體存在差異,因此通過樣本推論總體時會存在一定的誤差,這種由抽樣過樣本推論總體時會存在一定的誤差,這種由抽樣造成的樣本均數(shù)與總體均數(shù)的差異稱為抽樣誤差造成的樣本均數(shù)與總體均數(shù)的差異稱為抽樣誤差。抽樣誤差抽樣誤差的大小可以用標(biāo)準(zhǔn)誤進(jìn)行衡量。的大小可以用標(biāo)準(zhǔn)誤進(jìn)行衡量。 2. 2.參數(shù)估計有點估計和區(qū)間估計兩種方式。點估參數(shù)估計有點估計和區(qū)間估計兩種方式。點估計計的重要表達(dá)方式是平均值;的重要表達(dá)方式是平均值;區(qū)間估計是指按預(yù)先區(qū)間估計是指按預(yù)先給定的概率,計算出一個區(qū)間,使它能夠包含未知給定的概率,計算出一個區(qū)間,使它能夠包含未知的總體均數(shù)。區(qū)間的總體均數(shù)。區(qū)間越窄
18、說明估計的準(zhǔn)確度越高。越窄說明估計的準(zhǔn)確度越高。 3.3.總體均數(shù)可信區(qū)間的計算公式可以利用總體均數(shù)可信區(qū)間的計算公式可以利用 的的抽樣分布獲得。抽樣分布獲得。一種重要的方法是利用一種重要的方法是利用 t 分布計算分布計算區(qū)間兩端的可信限區(qū)間兩端的可信限 。單側(cè)可信區(qū)間只需單側(cè)可信區(qū)間只需將公式中的雙側(cè)界值換成單側(cè)界值將公式中的雙側(cè)界值換成單側(cè)界值。 4. 4.假設(shè)檢驗假設(shè)檢驗的的思想是,首先對所需要比較的總思想是,首先對所需要比較的總體提出一個體提出一個無差別的無差別的假設(shè),然后通過樣本數(shù)據(jù)去推假設(shè),然后通過樣本數(shù)據(jù)去推斷是否拒絕這一假設(shè)斷是否拒絕這一假設(shè)。其。其實質(zhì)是判斷觀察到的實質(zhì)是判斷觀察到的“差差別別”是抽樣誤差引起還是總體上的不同,目的是抽樣誤差引起還是總體上的不同,目的是評是評價兩個不同的參數(shù)或兩種不同處理引起效應(yīng)不同的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 資產(chǎn)評估學(xué)教程-練習(xí)答案6
- 上海市市轄區(qū)(2024年-2025年小學(xué)五年級語文)人教版開學(xué)考試(下學(xué)期)試卷及答案
- 2023-2024學(xué)年廣東省深圳市南山區(qū)七年級(上)期末英語試卷
- 三年級數(shù)學(xué)計算題專項練習(xí)及答案
- 二年級語文上冊第一單元教案
- HDPE波紋管技術(shù)規(guī)格書
- 《電氣控制系統(tǒng)設(shè)計與裝調(diào)》教案 項目三任務(wù)二:認(rèn)識熔斷器、熱繼電器
- 北京市北京匯文中學(xué)教育集團2024-2025學(xué)年高一上學(xué)期期中考試數(shù)學(xué)試題(含答案)
- 心電探頭市場發(fā)展預(yù)測和趨勢分析
- 指甲油筆產(chǎn)業(yè)運行及前景預(yù)測報告
- 二次預(yù)留預(yù)埋安裝技術(shù)交底(強、弱電部分)
- 醫(yī)院優(yōu)質(zhì)服務(wù)考核表
- 東北大學(xué)考試《結(jié)構(gòu)力學(xué)ⅠX》考核作業(yè)參考324
- 結(jié)業(yè)證書文檔模板可編輯
- 幼兒園、中小學(xué)、病愈復(fù)課證明
- 2023年5月-北京地區(qū)成人本科學(xué)士學(xué)位英語真題及答案
- 銳器傷應(yīng)急處理PPT
- 危險化學(xué)品MSDS氨水(12%)
- 酒店總經(jīng)理面試技巧
- 上海音樂出版社三年級上冊音樂教案全冊
- 外市電引入工程施工組織設(shè)計方案
評論
0/150
提交評論