抽樣誤差與假設檢驗_第1頁
抽樣誤差與假設檢驗_第2頁
抽樣誤差與假設檢驗_第3頁
抽樣誤差與假設檢驗_第4頁
抽樣誤差與假設檢驗_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

關于抽樣誤差與假設檢驗第1頁,共24頁,2023年,2月20日,星期四

第一節(jié)

均數(shù)的抽樣誤差與標準誤

一、均數(shù)的抽樣誤差

在醫(yī)學研究中,絕大多數(shù)情況是由樣本信息研究總體。由于個體存在差異,因此通過樣本推論總體時會存在一定的誤差,如樣本均數(shù)往往不等于總體均數(shù),這種由抽樣造成的樣本均數(shù)與總體均數(shù)的差異稱為抽樣誤差。對于抽樣研究,抽樣誤差不可避免。第2頁,共24頁,2023年,2月20日,星期四二、抽樣誤差的分布

理論上可以證明:若從正態(tài)總體中,反復多次隨機抽取樣本含量固定為n的樣本,那么這些樣本均數(shù)也服從正態(tài)分布,即的總體均數(shù)仍為,樣本均數(shù)的標準差為。抽樣分布抽樣分布示意圖第3頁,共24頁,2023年,2月20日,星期四

中心極限定理:當樣本含量很大的情況下,無論原始測量變量服從什么分布,的抽樣分布均近似正態(tài)。

抽樣分布抽樣分布示意圖第4頁,共24頁,2023年,2月20日,星期四三、標準誤(StandardError)

樣本均數(shù)的標準差稱為標準誤。樣本均數(shù)的變異越小說明估計越精確,因此可以用標準誤表示抽樣誤差的大小:

實際中總體標準差往往未知,故只能求得樣本均數(shù)標準誤的估計值:

第5頁,共24頁,2023年,2月20日,星期四例4.1在某地隨機抽查成年男子140人,計算得紅細胞均數(shù)4.77×1012/L,標準差0.38×1012/L,試計算均數(shù)的標準誤。

標準誤是抽樣分布的重要特征之一,可用于衡量抽樣誤差的大小,更重要的是可以用于參數(shù)的區(qū)間估計和對不同組之間的參數(shù)進行比較。第6頁,共24頁,2023年,2月20日,星期四

第二節(jié)總體均數(shù)的估計一、可信區(qū)間的概念(ConfidenceInterval)

區(qū)間估計:指按預先給定的概率,計算出一個區(qū)間,使它能夠包含未知的總體均數(shù)。事先給定的概率稱為可信度,通常取。

參數(shù)估計點估計:不考慮抽樣誤差,如區(qū)間估計:考慮抽樣誤差第7頁,共24頁,2023年,2月20日,星期四二、可信區(qū)間的計算

(一)已知一般情況其中為標準正態(tài)分布的雙側界值。

可信區(qū)間:第8頁,共24頁,2023年,2月20日,星期四標準正態(tài)分布(二)未知通常未知,這時可以用其估計量S代替,但

已不再服從標準正態(tài)分布,而是服從著名的t分布。

圖4-2不同自由度的t

分布圖

第9頁,共24頁,2023年,2月20日,星期四

可信區(qū)間的計算:計算可信區(qū)間的原理與前完全相同,僅僅是兩側概率的界值有些差別。即可信區(qū)間:需要注意:在小樣本情況下,應用這一公式的條件是原始變量服從正態(tài)分布。在大樣本情況下(如n>100),也可以用替換近似計算。第10頁,共24頁,2023年,2月20日,星期四

例4.2某醫(yī)生測得25名動脈粥樣硬化患者血漿纖維蛋白原含量的均數(shù)為3.32g/L,標準差為0.57g/L,試計算該種病人血漿纖維蛋白原含量總體均數(shù)的95%可信區(qū)間。下限:上限:第11頁,共24頁,2023年,2月20日,星期四例4.3試計算例4.1中該地成年男子紅細胞總體均數(shù)的95%可信區(qū)間。本例屬于大樣本,可采用正態(tài)近似的方法計算可信區(qū)間。因為,則95%可信區(qū)間為:下限:上限:第12頁,共24頁,2023年,2月20日,星期四三、模擬實驗模擬抽樣成年男子紅細胞數(shù)。設定:產(chǎn)生100個隨機樣本,分別計算其95%的可信區(qū)間,結果用圖示的方法表示。從圖可以看出:絕大多數(shù)可信區(qū)間包含總體參數(shù),只有6個可信區(qū)間沒有包含總體參數(shù)(用星號標記)。第13頁,共24頁,2023年,2月20日,星期四

圖4-2模擬抽樣成年男子紅細胞數(shù)100次的95%可信區(qū)間示意圖

******第14頁,共24頁,2023年,2月20日,星期四

第三節(jié)假設檢驗的意義和步驟

(HypothesisTest)

統(tǒng)計推斷的另一個重要內(nèi)容,目的是通過樣本數(shù)據(jù)比較總體參數(shù)之間有無差別。一、假設檢驗的基本思想例4.4使用黑加侖油軟膠囊治療高脂血癥,30名高脂血癥患者治療前后血清甘油三酯檢測結果的差值為1.38±0.76(g/L),問治療后血清甘油三酯是否有所改善?第15頁,共24頁,2023年,2月20日,星期四

樣本治療前后甘油三酯的變化(差值)問題歸納:樣本療效藥物作用+機遇對上面問題可以作如下考慮:

問題:究竟多大能夠下“有效”的結論?第16頁,共24頁,2023年,2月20日,星期四

假定治療前后血清甘油三酯檢測結果的差值服從正態(tài)分布,若則服從t分布。

根據(jù)t

分布能夠計算出有如此大差異的概率P,如果P值很小,即計算出的t值超出了給定的界限,則傾向于拒絕H0,認為治療前后有差別。

圖4-3

利用t分布進行假設檢驗原理示意圖

第17頁,共24頁,2023年,2月20日,星期四二、假設檢驗的基本步驟1.建立假設和確定檢驗水準無效假設H0(nullhypothesis)指需要檢驗的假設,備擇假設H1(alternativehypothesis)指在H0成立證據(jù)不足的情況下而被接受的假設。例如建立治療前后血清甘油三酯療效的無效假設和備擇假設分別為

檢驗水準是預先規(guī)定的拒絕域的概率值,實際中一般取。

第18頁,共24頁,2023年,2月20日,星期四

[說明]:備擇假設有雙側和單側兩種情況。雙側檢驗指不論正方向還是負方向的誤差,若顯著地超出檢驗水準則拒絕H0,即為雙側檢驗;單側檢驗指僅在出現(xiàn)正方向或負方向誤差超出規(guī)定的水準時則拒絕H0,如治療后血清甘油三酯下降的假設可表示為

雙側檢驗和單側檢驗應如何選擇,需根據(jù)研究目的和專業(yè)知識而定。一般情況下,雙側檢驗更為穩(wěn)妥,因為對相同的樣本,雙側檢驗得出有顯著性差別的結論,單側檢驗也一定是顯著的。

第19頁,共24頁,2023年,2月20日,星期四

2.選擇檢驗方法和計算檢驗統(tǒng)計量根據(jù)資料類型、研究設計方案和統(tǒng)計推斷的目的,選擇適當?shù)臋z驗方法,不同檢驗方法各有其相應的檢驗統(tǒng)計量及計算公式。許多假設檢驗方法是以檢驗統(tǒng)計量來命名的,如t檢驗、u檢驗、F檢驗和檢驗等。3.確定P值并做出統(tǒng)計推斷結論查表得到檢驗用的臨界值,然后將算得的統(tǒng)計量與拒絕域的臨界值作比較,確定P值。如對雙側t檢驗,則,按檢驗水準拒絕H0。第20頁,共24頁,2023年,2月20日,星期四

小結

1.總體參數(shù)值在現(xiàn)實中通常不能獲得,而是通過隨機樣本來進行估計。由于個體存在差異,因此通過樣本推論總體時會存在一定的誤差,這種由抽樣造成的樣本均數(shù)與總體均數(shù)的差異稱為抽樣誤差。抽樣誤差的大小可以用標準誤進行衡量。2.參數(shù)估計有點估計和區(qū)間估計兩種方式。點估計的重要表達方式是平均值;區(qū)間估計是指按預先給定的概率,計算出一個區(qū)間,使它能夠包含未知的總體均數(shù)。區(qū)間越窄說明估計的準確度越高。第21頁,共24頁,2023年,2月20日,星期四

3.總體均數(shù)可信區(qū)間的計算公式可以利用的抽樣分布獲得。一種重要的方法是利用t分布計算區(qū)間兩端的可信限

。單側可信區(qū)間只需將公式中的雙側界值換成單側界值。4.假設檢驗的思想是,首先對所需要比較的總體提出一個無差別的假設,然后通過樣本數(shù)據(jù)去推斷是否拒絕這一假設。其實質是判斷觀察到的“差別”是抽樣誤差引起還是總體上的不同,目的是評價兩個不同的參數(shù)或兩種不同處理引起效應不同的證據(jù)有多強,這種證據(jù)的強度用概率P度量和表示。

第22頁,共24頁,2023年,2月20

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論