抽樣誤差與假設(shè)檢驗.ppt_第1頁
抽樣誤差與假設(shè)檢驗.ppt_第2頁
抽樣誤差與假設(shè)檢驗.ppt_第3頁
抽樣誤差與假設(shè)檢驗.ppt_第4頁
抽樣誤差與假設(shè)檢驗.ppt_第5頁
已閱讀5頁,還剩65頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第四章 抽樣誤差與假設(shè)檢驗,第一節(jié) 均數(shù)的抽樣誤差與標準誤,100份樣本的均數(shù)和標準差,將這100份樣本的均數(shù)看成新變量值,按第二章的頻數(shù)分布方法,得到這100個樣本均數(shù)得直方圖見圖4-1。,圖4-1 隨機抽樣所得100個樣本均數(shù)的分布,100個樣本均數(shù)的抽樣分布特點: 100個樣本均數(shù)中,各樣本均數(shù)間存在差異,但各樣本均數(shù)在總體均數(shù)周圍波動。 樣本均數(shù)的分布曲線為中間高,兩邊低,左右對稱,近似服從正態(tài)分布。 樣本均數(shù)的標準差明顯變小:,即樣本均數(shù)的標準差,可用于衡量抽樣誤差的大小。 因通常未知,計算標準誤采用下式:,標準誤(standard error, SE),通過增加樣本含量n來降低抽樣

2、誤差。,3個抽樣實驗結(jié)果圖示,抽樣實驗小結(jié),均數(shù)的均數(shù)圍繞總體均數(shù)上下波動。 均數(shù)的標準差即標準誤 與總體標準差 相差一個常數(shù)的倍數(shù),即 樣本均數(shù)的標準誤(Standard Error) =樣本標準差/ 從正態(tài)總體N(m,s2)中抽取樣本,獲得均數(shù)的分布仍近似呈正態(tài)分布N(m,s2/n) 。,標準差與標準誤的區(qū)別,1、概念不同:標準差是描述樣本中個體值的變異程度的指標,其值越小,表示變量值圍繞均數(shù)的波動越?。?標準誤是描述樣本均數(shù)間變異度的指標,其值越小,表示樣本均數(shù)圍繞總體均數(shù)波動越小。 2、用途不同:標準差用于表示變量值對均數(shù)波動的大小,當資料呈正態(tài)分布時,與均數(shù)結(jié)合可估計正常值范圍,計算

3、變異系數(shù)等;標準誤用于表示樣本統(tǒng)計量(樣本均數(shù)、樣本率)對總體參數(shù)(總體均數(shù)、總體率)的波動情況,可估計參數(shù)的可信區(qū)間,進行假設(shè)檢驗。,3、與樣本例數(shù)關(guān)系不同:樣本量足夠大時,標準差趨向穩(wěn)定,標準誤隨例數(shù)增加而減小,甚至趨近于0,若樣本量趨向總例數(shù),則標準誤接近0; 4、二者聯(lián)系:均為變異指標,若把總體中各樣本均數(shù)看作一個變量,則標準誤可稱為樣本均數(shù)的標準差,當樣本量不變時,均數(shù)的標準誤與標準差成正比。二者均可與均數(shù)結(jié)合運用,但描述的內(nèi)容各不相同。,第二節(jié) t 分布(t-distribution),隨機變量X N(m,s2),標準正態(tài)分布 N(0,12),Z變換,均數(shù),標準正態(tài)分布 N(0,1

4、2),Student t分布 自由度:n-1,圖4-2 不同自由度下的t 分布圖,t分布的特征,以0為中心,左右對稱的單峰分布; t分布曲線是一簇曲線,其形態(tài)變化與自由度的大小有關(guān)。 自由度越小,則t值越分散,曲線越低平; 自由度逐漸增大時,t分布逐漸逼近Z分布(標準正態(tài)分布);當趨于時,t分布即為Z分布。,t 界值表,1.812,2.228,-2.228,t,f (t),=10的t分布圖,t分布曲線下面積(附表2),雙側(cè)t0.05/2,92.262 單側(cè)t0.025,9 單側(cè)t0.05,91.833 雙側(cè)t0.01/2,93.250 單側(cè)t0.005,9 單側(cè)t0.01,92.821 雙側(cè)t

5、0.05/2,1.96 單側(cè)t0.025, 單側(cè)t0.05, 1.64,總體均數(shù)的點估計(point estimation)與區(qū)間估計(interval estimation),參數(shù)的估計,點估計:由樣本統(tǒng)計量 直接估計 總體參數(shù),區(qū)間估計:在一定可信度(Confidence level)下,同時考慮抽樣誤差,第三節(jié) 總體均數(shù)的可信區(qū)間估計,按預先給定的概率(1), 確定一個包含未知總體參數(shù)的范圍。這一范圍稱為參數(shù)的可信區(qū)間或置信區(qū)間(confidence interval,CI),(1)稱為可信度或置信度(confidence level),常取95。 置信區(qū)間通常兩個數(shù)值即置信限(conf

6、idence limit,CL)構(gòu)成, 較小的稱為置信下限(lower limit,L), 較大的稱為置信上限(upper limit,U),,一、置信區(qū)間的有關(guān)概念,二、總體均數(shù)置信區(qū)間的計算,s未知,且 n較小,按t分布 s已知,或s未知但n足夠大,按Z分布,單一總體均數(shù)的置信區(qū)間,例6-3,Z0.05/2=1.96 Z0.05=1.645,Z0.05/2=1.96 Z0.05=1.645,三、可信區(qū)間估計的優(yōu)劣 一是可信度1(準確度),愈接近1愈好,如99%的可信度比95%的可信度要好; 二是區(qū)間的寬度(精密度),區(qū)間愈窄愈好。當樣本含量為定值時,上述兩者互相矛盾。 在可信度確定的情況下

7、,增加樣本含量可減小區(qū)間寬度。,四、總體均數(shù)可信區(qū)間與參考值范圍的區(qū)別,第五章 假設(shè)檢驗 (Hypothesis Testing),假設(shè)檢驗的基本概念,若對 參數(shù) 有所 了解,但有懷 疑猜測 需要證 實之時,用假設(shè) 檢驗的 方法來 處理,何為假設(shè)檢驗?,假設(shè)檢驗是指施加于一個或多個總體的概率分布或參數(shù)的假設(shè)。 所作假設(shè)可以是正確的,也可以是錯誤的。 為判斷所作的假設(shè)是否正確, 從總體中抽取樣本,根據(jù)樣本的取值,按一定原則進行檢驗, 然后作出接受或拒絕所作假設(shè)的決定。,假設(shè)檢驗的內(nèi)容,基本思想,參數(shù)的假設(shè)檢驗:已知總體的分布類型,對分布函數(shù)或密度函數(shù)中的某些參數(shù)提出假設(shè),并檢驗。 基本原則小概率

8、事件在一次試驗中是不可能發(fā)生的。,思想:如果原假設(shè)成立,那么某個分布已知的統(tǒng)計量在某個區(qū)域(拒絕域)內(nèi)取值的概率(檢驗水準)應(yīng)該較小,如果樣本的觀測數(shù)值落在這個小概率區(qū)域內(nèi),則原假設(shè)不正確,所以拒絕原假設(shè);否則,接受原假設(shè)。,一、小概率事件與假設(shè)檢驗,檢驗?zāi)康模?未知,只能比較樣本均數(shù) 與0,( 0)0有兩種可能: 1. 與0相等,差異由抽樣引起; 2. 與0本身不相等。,檢驗假設(shè):,如法官判定一個人是否犯罪,首先是假定他“無罪”(H0),然后通過偵察尋找證據(jù),如果證據(jù)充分則拒絕 “無罪”的假定(H0),判嫌疑人有罪;否則只能暫且認為“無罪”的假定(H0)成立。,小概率事件P0.05或P0.0

9、1,-1.96,1.96,-1.645,統(tǒng)計量Z 對應(yīng)的概率很小,如小于等于0.05,則認為事件不會發(fā)生,此時拒絕H0,有足夠證據(jù)推斷差異有統(tǒng)計學意義。,二、兩類錯誤,由于樣本的隨機性,假設(shè)檢驗中作出的結(jié)論可能會犯兩類不同類型的錯誤: (1)H0成立,但由于樣本的隨機性,拒絕了H0所犯的錯誤稱第一類錯誤或型錯誤或拒真錯誤。犯第一類錯誤的概率記作。,(2)H0不成立,但由于樣本的隨機性,不拒絕H0所犯的錯誤稱第二類錯誤或型錯誤或受偽錯誤。犯第二類錯誤的概率記作。,檢驗效能(power of a test):亦稱把握度,1-,它的意義是當兩總體確有差別,按規(guī)定檢驗水準所能發(fā)現(xiàn)該差異 的能力。,兩種

10、錯誤的關(guān)系,兩類錯誤,型錯誤(棄真):拒絕實際正確的H0, 型錯誤的概率記為。(1a)即可信度:重復抽樣時,樣本區(qū)間包含總體參數(shù)(m)的百分數(shù)。 型錯誤(納偽):不拒絕實際不正確的H0, 型錯誤的概率記為。(1)即把握度(或檢驗效能):兩總體確有差別,被檢出有差別的能力。,三、單、雙側(cè)檢驗,H1: 0,雙側(cè),0都有可能 H1: 0,單側(cè) H1: 0,單側(cè) 對于本例,根據(jù)醫(yī)學知識,經(jīng)常參加體育鍛煉 的中學男生心率不會高于一般中學男生的心率。所 以使用單側(cè)。即H0:0,H1:0 由專業(yè)知識確定單、雙側(cè)。,第二節(jié) 假設(shè)檢驗的基本步驟,一建立檢驗假設(shè),確定檢驗水準 H0:=0, 兩總體均數(shù)相等,差異僅

11、由抽樣誤差所致。 H1:0(或0 或,拒絕H0的樣本證據(jù)不足,就不拒絕H0,暫且認為H0成立 根據(jù)統(tǒng)計推斷結(jié)果,結(jié)合相應(yīng)的專業(yè)知識,給出一個專業(yè)的結(jié)論。,例4-1,一建立檢驗假設(shè),確定檢驗水準 H0:=0, 常鍛煉學生的心率與一般學生相等。 H1:0 ,常鍛煉學生的心率低于一般學生。 =0.05 二選擇檢驗方法和計算統(tǒng)計量 三確定概率P值和作出統(tǒng)計推斷 本例P0.05,則拒絕H0,接受H1,有足夠證據(jù)認為常鍛煉學生的心率低于一般學生。常年參加體育鍛煉有助于增強中學男生的心臟功能。,1. 對于H0只能說拒絕與不拒絕,而對H1只能說接受。2. P,則拒絕H0 ,接受H1 ,差異有統(tǒng)計學意義,(有足

12、夠的證據(jù))可認為不同或不等。3. P,則不拒絕H0 ,差異無統(tǒng)計學意義(“陰性”結(jié)果),尚不能認為不同或不等(或拒絕H0的證據(jù)尚不足) 4. 下統(tǒng)計檢驗結(jié)論只能說有、無統(tǒng)計學意義,而不能說明專業(yè)上的差異大小。P值越小只能說明:作出拒絕H0,接受H1的統(tǒng)計學證據(jù)越充分,推論時犯錯誤的機會越小,與專業(yè)上|0 |差異的大小無直接關(guān)系。5. 應(yīng)事先確定。選0.05只是一種習慣,而不是絕對的標準。,關(guān)于假設(shè)檢驗的幾個觀點,第三節(jié) 一個總體的推斷,總體方差已知,采用Z 檢驗,見例4-1。 總體方差未知,采用t 檢驗,一個總體的t 檢驗,4.65,0.0003,P值為H0成立的前提下,比樣本數(shù)據(jù)得到的統(tǒng)計量

13、(t)更極端值對應(yīng)的概率。,4.65,t,0,f (t),異源配對:將受試對象按某些混雜因素(如性別、年齡、窩別等)配成對子,然后將每對中的兩個個體隨機分配給兩種處理(如處理組與對照組) 同源配對:同一受試對象作兩次不同的處理,或一種處理的前后比較。 優(yōu)點:配對設(shè)計減少了比較對子間的個體差異。 特點:資料成對,每對數(shù)據(jù)不可拆分。,第四節(jié) 配對設(shè)計資料均數(shù)的比較,假設(shè)檢驗方法,H0:d0 H1:d0,表5-1 15對孿生兄弟的出生體重(kg),先出生者體重,后出生者體重,例53的假設(shè)檢驗,第五節(jié) 兩組完全隨機設(shè)計資料的方差齊性檢驗,使用條件,兩樣本均服從正態(tài)分布,例5-4 兩組病人服用降壓藥后的

14、降壓效果比較,第六節(jié) 完全隨機設(shè)計兩總體均數(shù)的比較,實驗設(shè)計:用完全隨機設(shè)計(completely random design) 方法,把受試對象隨機分為兩組,分別給予不同處理,然后比較獨立的兩組樣本均數(shù)。各組對象數(shù)不必嚴格相同。 調(diào)查設(shè)計:從兩組具有不同特征的人群中,分別隨機抽取一定數(shù)量的樣本,比較某一指標在不同特征人群中是否相等。,使用條件:假定資料來自獨立、隨機的正態(tài)總體,且12=22,一、兩總體均數(shù)的t 檢驗方法,有些研究的設(shè)計不能自身配對,也不便配對,只能將獨立的兩組均數(shù)作比較,如手術(shù)組與非手術(shù)組、新藥治療組與原用藥治療組。有的試驗要把動物殺死后才能獲得所需數(shù)據(jù),除非事先作好了配對設(shè)

15、計,一般只能作兩組間的比較,兩組例數(shù)可以不等,這是配對設(shè)計所不能做到的。 從兩總體中分別抽取容量為n1、n2的樣本,比較兩總體均數(shù)1和2有無差別。,計算公式:,其中,均數(shù)差的標準誤,當tt/2()時,P,拒絕H0,接受H1。 當t,不拒絕H0。,兩獨立樣本t 檢驗,二、兩總體均數(shù)的t,檢驗方法,t檢驗的應(yīng)用條件要求兩個總體方差相等,如不等時,可以: 1. 變量變換 2. 非參數(shù)檢驗 3. 近似t檢驗(即t檢驗),三、兩總體均數(shù)的Z 檢驗,大樣本時使用(兩組例數(shù)均50例),可用Z 檢驗,優(yōu)點:計算相對簡單。,t檢驗和Z檢驗的條件,t檢驗:要求樣本來自正態(tài)分布,且兩均數(shù)比較時還要求兩總體方差相等。

16、 Z檢驗:n較大。,第七節(jié) 正態(tài)性檢驗,單一總體t檢驗時,要求樣本相應(yīng)的總體為正態(tài)總體 配對t檢驗時,要求每對數(shù)據(jù)差值的總體為正態(tài)總體 兩樣本t檢驗時,要求相應(yīng)的兩總體為正態(tài)總體且兩總體方差相等,即方差齊性;如果方差不齊,則采用t檢驗,一、正態(tài)性檢驗(normality test),圖示法 直方圖、PP圖、QQ圖、箱圖、莖葉圖 2. 計算法 峰度系數(shù)、偏度系數(shù)、Shapiro-Wilk W法、Kolmogorov-Smirnov D法,置信區(qū)間可回答假設(shè)檢驗的問題,并能提供更多信息,但并不意味著置信區(qū)間能夠完全代替假設(shè)檢驗。因為置信區(qū)間只能在預先規(guī)定的概率前提下進行計算,而假設(shè)檢驗?zāi)軌颢@得確切的概率P值。,圖3-7 置信區(qū)間在統(tǒng)計推斷上提供的信息,假設(shè)檢驗應(yīng)注意的問題,1. 要有嚴密的抽樣研究計劃 要保證樣本是從同質(zhì)總體中隨機抽取。 除了對比的因素外,其它影響結(jié)果的因素應(yīng)一致。 2選用的假設(shè)檢驗方法應(yīng)符合其應(yīng)用條件 要了解變量的類型是計量的還是計數(shù)的,設(shè)計類型是配對設(shè)計還是成組設(shè)計,是大樣本還是小樣本。,3.結(jié)論不能絕對化 4.正確理解差別有無顯著性的統(tǒng)計意義 差別有顯著性,或有統(tǒng)計意義,指我們有很大的把握認為原假設(shè)不正確,并非是說它們有較大的差別。 差別無顯著性,或無統(tǒng)計意義,我們只是認為以很大的把握拒絕原假設(shè)的理由還不夠充分,并不意味著我們很相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論