終身模塊統(tǒng)計(jì)學(xué)抽樣誤差假設(shè)檢驗(yàn)課件_第1頁
終身模塊統(tǒng)計(jì)學(xué)抽樣誤差假設(shè)檢驗(yàn)課件_第2頁
終身模塊統(tǒng)計(jì)學(xué)抽樣誤差假設(shè)檢驗(yàn)課件_第3頁
終身模塊統(tǒng)計(jì)學(xué)抽樣誤差假設(shè)檢驗(yàn)課件_第4頁
終身模塊統(tǒng)計(jì)學(xué)抽樣誤差假設(shè)檢驗(yàn)課件_第5頁
已閱讀5頁,還剩145頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

計(jì)量資料的統(tǒng)計(jì)推斷

statisticalinferenceofmeasurementdata張建軍汕大醫(yī)學(xué)院預(yù)防醫(yī)學(xué)教研室Tel/p>

zhangjj@

計(jì)量資料的統(tǒng)計(jì)推斷

statisticalinferenc統(tǒng)計(jì)推斷:參數(shù)估計(jì),假設(shè)檢驗(yàn)“世上有三種哄人的東西:謊言、該死的謊言、統(tǒng)計(jì)數(shù)據(jù)”----英國政治家迪斯雷里?!笆郎嫌腥龢蛹?dòng)人心的東西:宣傳、要命的宣傳、統(tǒng)計(jì)數(shù)據(jù)”。統(tǒng)計(jì)推斷:參數(shù)估計(jì),假設(shè)檢驗(yàn)均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤均數(shù)的抽樣誤差samplingerrorofmean概念:由于總體中存在個(gè)體變異,抽樣研究中所抽取的樣本,只包含總體中一部分個(gè)體,因而樣本均數(shù)(或率)往往不等于總體均數(shù)(或率),樣本均數(shù)之間也互不相等,這種由抽樣引起的差異稱為均數(shù)的抽樣誤差。即:均數(shù)的抽樣誤差samplingerrorofmean12中心極限定理:如果隨機(jī)變量的總體均數(shù)及方差有限,當(dāng)樣本容量趨于無窮大時(shí),樣本均數(shù)的分布趨近于均數(shù)為總體均數(shù),方差為的正態(tài)分布。1如何估計(jì)?用樣本均數(shù)的標(biāo)準(zhǔn)差來估計(jì),稱標(biāo)準(zhǔn)誤(standarderror)。標(biāo)準(zhǔn)誤越大,均數(shù)的抽樣誤差越大,樣本均數(shù)與總體均數(shù)間的差異越大。計(jì)算公式:即:由總體標(biāo)準(zhǔn)差,樣本例數(shù)求得。但通常以樣本標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差的估計(jì)值。因此:如何估計(jì)?與標(biāo)準(zhǔn)差的區(qū)別:標(biāo)準(zhǔn)差:表示一般變量值的離散程度;均數(shù)標(biāo)準(zhǔn)誤特別說明樣本均數(shù)這一變量值離散程度的指標(biāo)。標(biāo)準(zhǔn)誤的應(yīng)用:(1)用來衡量抽樣誤差的大小,標(biāo)準(zhǔn)誤越小,樣本均數(shù)與總體均數(shù)越接近,樣本均數(shù)的可信度越高;(2)結(jié)合標(biāo)準(zhǔn)正態(tài)分布與t分布曲線下的面積規(guī)律,估計(jì)總體均數(shù)的置信區(qū)間。(3)用于假設(shè)檢驗(yàn)。與標(biāo)準(zhǔn)差的區(qū)別:假定2003年汕頭市15歲女學(xué)生的身高(cm)服從N(155.4,5.32)。用計(jì)算機(jī)做抽樣模擬試驗(yàn),每次抽出10個(gè)數(shù)字,組成一個(gè)樣本,求出樣本均數(shù)、樣本標(biāo)準(zhǔn)差S。再求得此100個(gè)樣本均數(shù)的均數(shù)、樣本均數(shù)的標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)誤)。100個(gè)樣本均數(shù)構(gòu)成一個(gè)新的分布,也是正態(tài)分布(即使原分布為偏態(tài)分布,當(dāng)樣本含量足夠大時(shí),新分布也近似正態(tài)分布)。新分布的集中趨勢用均數(shù)的均數(shù)來表示,離散趨勢用標(biāo)準(zhǔn)誤表示N(,)。各樣本均數(shù)的均數(shù)等于總體均數(shù)。假定2003年汕頭市15歲女學(xué)生的身高(cm)服從N(155正態(tài)總體中抽樣(樣本量5)正態(tài)總體中抽樣(樣本量10)正態(tài)總體中抽樣(樣本量30)抽樣時(shí)樣本量大小決定了樣本均數(shù)分布的形狀,當(dāng)樣本量足夠大時(shí),均數(shù)分布趨向正態(tài)分布。正態(tài)總體中抽樣(樣本量5)正態(tài)總體中抽樣(樣本量10)正態(tài)總t分布(t-distribution)t分布(t-distribution)u分布:u轉(zhuǎn)換將正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài),N(0,1)。同理:將樣本均數(shù)的分布也可以轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布即:實(shí)際工作中,總體標(biāo)準(zhǔn)差往往未知,常用S代替σ

計(jì)算標(biāo)準(zhǔn)誤,因此:就變?yōu)椋簎分布:u轉(zhuǎn)換也就是說:正態(tài)分布:標(biāo)準(zhǔn)正態(tài)分布正態(tài)變量實(shí)現(xiàn)這一轉(zhuǎn)變:也就是說:正態(tài)分布:均數(shù)的分布也是這樣如果我們采用另一個(gè)正態(tài)變量:于是,均數(shù)的分布變成了標(biāo)準(zhǔn)正態(tài)分布:均數(shù)的分布也是這樣如果我們采用另一個(gè)正態(tài)變量:但是,條件發(fā)生變化我們通常用代替

然而,

隨著樣本量的變化而變化,所以,我們稱之為

t-分布,雖然它是正態(tài)分布,但只有當(dāng)樣本量(自由度)無窮大的時(shí)候,它才是標(biāo)準(zhǔn)正態(tài)分布,此時(shí),u=t但是,條件發(fā)生變化我們通常用代替t分布是一簇對(duì)稱于0的單峰分布曲線。自由度越?。ㄏ喈?dāng)于標(biāo)準(zhǔn)差大),曲線的中間越低,兩邊越高;隨自由度增大,t分布曲線逐漸逼近于標(biāo)準(zhǔn)正態(tài)分布曲線。當(dāng)自由度無窮大時(shí),t分布就是標(biāo)準(zhǔn)正態(tài)分布曲線。每一條t分布曲線,都對(duì)應(yīng)于相應(yīng)的自由度。t分布是一簇對(duì)稱于0的單峰分布曲線。自由度越?。ㄏ喈?dāng)于標(biāo)準(zhǔn)差t分布曲線下的面積規(guī)律:與標(biāo)準(zhǔn)正態(tài)曲線下的面積規(guī)律相似:在某一個(gè)自由度下,兩側(cè)外部總面積為5%的界限的t值稱為t0.05/2(υ),把兩側(cè)外部總面積為1%的界限的t值稱為t0.01/2(υ)。中部占95%面積的t值范圍:t0.05/2(υ)--t0.05/2(υ),中部占99%面積的t值范圍:-t0.01/2(υ)--t0.01/2(υ)。t分布曲線下的面積規(guī)律:當(dāng)自由度確定時(shí),占一定面積的t界限值,可以查表得出。參考附表6(p436)。例如:查當(dāng)自由度=20,兩側(cè)概率之和為0.05時(shí),對(duì)應(yīng)的t值:t0.05/2(20)=2.086,單側(cè)概率為0.05時(shí),對(duì)應(yīng)的t值:t0.05(20)=1.725,當(dāng)自由度確定時(shí),占一定面積的t界限值,可以查表得出。參考附表t分布的主要應(yīng)用:(1)總體均數(shù)置信區(qū)間估計(jì);(2)t檢驗(yàn);t分布的主要應(yīng)用:使用t值表注意:同一自由度下,P越小,t值越大;P值相同時(shí),自由度越大,t越??;當(dāng)自由度無窮大時(shí),t值與u值相等。這也是u分布與t分布的區(qū)別。使用t值表注意:總體均數(shù)置信區(qū)間的估計(jì)總體均數(shù)置信區(qū)間的估計(jì)參數(shù)估計(jì):點(diǎn)估計(jì)(pointestimation):用樣本統(tǒng)計(jì)量作為對(duì)總體參數(shù)的估計(jì)值(μ)。比如均數(shù)的估計(jì)。區(qū)間估計(jì)(intervalestimation):根據(jù)選定的置信度估計(jì)總體均數(shù)所在的區(qū)間(a<μ<b).a,b為置信限(可信限)。參數(shù)估計(jì):為何要進(jìn)行區(qū)間估計(jì)?點(diǎn)估計(jì)是用樣本均數(shù)來估計(jì)總體均數(shù),簡單易行,但未考慮抽樣誤差,而后者又是不可避免的。故常按照一定的概率估計(jì)總體均數(shù)在哪個(gè)范圍。置信度(confidencelevel):在估計(jì)總體均數(shù)的置信區(qū)間時(shí),如果可能估計(jì)錯(cuò)誤的概率為α,那么估計(jì)正確的概率為1-α,即為置信度.常用:95%,99%.置信區(qū)間(confidenceinterval,CI)根據(jù)置信度估計(jì)得到的區(qū)間,稱為置信區(qū)間。為何要進(jìn)行區(qū)間估計(jì)?如何進(jìn)行區(qū)間估計(jì)?1、總體標(biāo)準(zhǔn)差已知參照u分布,正態(tài)曲線下95%的u值在+-1.96之間,即:總體均數(shù)的95%置信區(qū)間:99%置信區(qū)間:如何進(jìn)行區(qū)間估計(jì)?1、總體標(biāo)準(zhǔn)差已知2、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)(>50)足夠大也可參考u分布進(jìn)行95%置信區(qū)間:99%置信區(qū)間:2、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)(>50)足夠大3、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)較小按t分布原理,依據(jù)相應(yīng)的自由度,查出該自由度下某個(gè)概率相應(yīng)的界值,再按照中部占95%面積的t值范圍:-t0.05/2(υ)--t0.05/2(υ),中部占99%面積的t值范圍:-t0.01/2(υ)--t0.01/2(υ)進(jìn)行估計(jì)。因?yàn)椋核裕?5%置信區(qū)間:99%置信區(qū)間:3、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)較小例子:p236課堂練習(xí)95%置信區(qū)間的意義:理論上,用一次抽樣所得的樣本均數(shù)估計(jì)總體均數(shù),犯錯(cuò)誤的概率為5%.或進(jìn)行100次抽樣,可算得100個(gè)置信區(qū)間,平均有95個(gè)置信區(qū)間包括客觀存在的總體均數(shù),只有5個(gè)置信區(qū)間未包括總體均數(shù)。例子:p236課堂練習(xí)估計(jì)置信區(qū)間的注意事項(xiàng):(1)區(qū)間是以上、下可信限為界的一個(gè)范圍。通常用表示置信限,用表示置信區(qū)間(2)置信區(qū)間與正常值范圍的意義、算法不同:95%正常值范圍一般是指同質(zhì)總體內(nèi)包括95%個(gè)體值的估計(jì)范圍,若總體為正態(tài)分布,常用:計(jì)算;95%置信區(qū)間是指按照95%置信度估計(jì)的總體參數(shù)的可能范圍,按照下式計(jì)算。

前者用標(biāo)準(zhǔn)差,后者用標(biāo)準(zhǔn)誤。估計(jì)置信區(qū)間的注意事項(xiàng):假設(shè)檢驗(yàn)的基本思想和步驟假設(shè)檢驗(yàn)的基本思想和步驟假設(shè)檢驗(yàn)(hypothesistesting):亦稱顯著性檢驗(yàn)(significancetest).是統(tǒng)計(jì)推斷的另一個(gè)方面。

先對(duì)總體的參數(shù)或分布作出某種假設(shè),如假設(shè)總體均數(shù)(或總體率)為一定值,兩總體均數(shù)(或總體率)相等,總體服從正態(tài)分布或兩總體分布相同等。然后,用適當(dāng)方法根據(jù)樣本對(duì)總體提供的信息,推斷此假設(shè)應(yīng)當(dāng)拒絕或不拒絕。其結(jié)果將有助于研究者作出決策,采取措施。假設(shè)檢驗(yàn)(hypothesistesting):亦稱顯著性在實(shí)際情況下:由于抽樣誤差,從某總體中隨機(jī)抽得的樣本,得到的樣本均數(shù)與該總體的均數(shù)不同;同一總體中兩次抽樣的樣本均數(shù)也不相同。這種差別的原因在于:要么總體均數(shù)不同;要么總體均數(shù)相同,差別僅由抽樣誤差所致。那么,當(dāng)我們遇到這種情況時(shí),如何判斷?可以通過某種方法來判斷差別屬哪種情況,這種方法就是假設(shè)檢驗(yàn)。在實(shí)際情況下:假設(shè)檢驗(yàn)HypothesisTesting假設(shè)檢驗(yàn)的反證思想

兩種說法非A即B。要證明B真,只要證明A偽即可。無效假設(shè)Nullhypothesis(H0)

意在推翻的假設(shè)(說法A)。備擇假設(shè)Alternativehypothesis(H1)

意在接受的假設(shè)(說法B)。從無效假設(shè)出發(fā),找出不支持這一假設(shè)的證據(jù),從而推翻它。假設(shè)檢驗(yàn)HypothesisTesting假設(shè)檢驗(yàn)的反證小概率事件

smallprobabilityevent事件A發(fā)生的概率是如此之小,以至于在一次試驗(yàn)(抽樣)時(shí),我們往往認(rèn)為它(事件A)不會(huì)發(fā)生。統(tǒng)計(jì)學(xué)中,小概率事件一般是指發(fā)生概率<0.05(檢驗(yàn)水準(zhǔn))的事件。在假設(shè)檢驗(yàn)中,如果在無效假設(shè)的前提下出現(xiàn)了小概率事件,我們則懷疑無效假設(shè)的真實(shí)性。小概率事件

smallprobabilityevent事例:兩種不同處理結(jié)果之間的差異效果

A處理結(jié)果A,B處理結(jié)果B

效果Effect:=結(jié)果A-結(jié)果B對(duì)于總體

如果

=0,則A處理和B處理之間沒有差別。

如果0,則A處理和B處理之間有差別。對(duì)于樣本

即使

=0,由于存在抽樣變異,往往樣本結(jié)果A–樣本結(jié)果B=0。問題在于這個(gè)差異是否僅僅是由于抽樣變異造成的?例:兩種不同處理結(jié)果之間的差異效果

A處理結(jié)果A,B處進(jìn)行假設(shè)檢驗(yàn)的思路無效假設(shè):樣本結(jié)果A和B之間的差異僅僅是由于抽樣變異造成的。即H0:=0。備擇假設(shè):樣本結(jié)果A和B之間的差異不僅僅是由于抽樣變異造成的,還包含不同處理的效果。即H1:0。由無效假設(shè)出發(fā),我們可以計(jì)算出得到樣本差異或者更大差異的概率(P值)。如果P值小于檢驗(yàn)水準(zhǔn),則認(rèn)為由此無效假設(shè)不太可能出現(xiàn)這樣的結(jié)果,從而推翻它,接受備擇假設(shè)(差異顯著性)。反之,接受無效假設(shè)。進(jìn)行假設(shè)檢驗(yàn)的思路無效假設(shè):樣本結(jié)果A和B之間的差異僅僅是由檢驗(yàn)統(tǒng)計(jì)量

statisticfortesting在無效假設(shè)的前提下,檢驗(yàn)統(tǒng)計(jì)量的構(gòu)建是無效假設(shè)的關(guān)鍵。檢驗(yàn)統(tǒng)計(jì)量一般服從某種分布。這樣我們就可以利用這種分布計(jì)算出由無效假設(shè)出發(fā),得到觀察到的差異或更大的差異的概率,從而作出推斷。檢驗(yàn)統(tǒng)計(jì)量

statisticfortesting在無終身模塊統(tǒng)計(jì)學(xué)抽樣誤差假設(shè)檢驗(yàn)課件界值criticalvalue對(duì)應(yīng)于檢驗(yàn)水準(zhǔn)的分布上的某些數(shù)值。正態(tài)分布上的某些界值:單側(cè)0.05±1.645雙側(cè)0.05±1.96相同界值單側(cè)檢驗(yàn)概率是雙側(cè)檢驗(yàn)概率的一半界值criticalvalue對(duì)應(yīng)于檢驗(yàn)水準(zhǔn)的分布上的某例題:兩個(gè)血糖均數(shù)不同,其原因可能是由于抽樣誤差;也可能是男性管理人員的總體血糖均數(shù)與一般正常成年男性的均數(shù)不同。假設(shè)檢驗(yàn)過程:1、建立檢驗(yàn)假設(shè)和設(shè)定檢驗(yàn)水準(zhǔn)無效假設(shè)(nullhypothesis)H0,假設(shè)差異是由于抽樣誤差所致,而兩個(gè)總體參數(shù)相同。是從反證法的思想提出的。(μ=μ0)例題:兩個(gè)血糖均數(shù)不同,其原因可能是由于抽樣誤差;也可能是男備擇假設(shè)(alternativehypothesis),H1.即差別不僅是由抽樣誤差所致,而更是總體參數(shù)不同。H1是和H0相聯(lián)系的,對(duì)立的假設(shè)。(μ≠μ0,μ>μ0,μ<μ0)雙側(cè),單側(cè)檢驗(yàn):根據(jù)專業(yè)知識(shí),μ可能大于也可能小于μ0,稱雙側(cè)檢驗(yàn);若認(rèn)為μ大于、等于μ0(或相反),為單側(cè)檢驗(yàn)。若不能確定單側(cè)的情況,應(yīng)采用雙側(cè)檢驗(yàn)。備擇假設(shè)(alternativehypothesis),確定檢驗(yàn)水準(zhǔn)(sizeofatest),(也叫顯著性水準(zhǔn)significancelevel):用α表示。即:拒絕了實(shí)際上成立的H0的概率;一般取0.05,或0.01.本步驟一般寫成:H0:μ=μ0H1:μ≠μ0,(雙側(cè))或:H1:μ>μ0,(μ<μ0),(單側(cè))α=0.05確定檢驗(yàn)水準(zhǔn)(sizeofatest),(也叫顯著性水2、計(jì)算統(tǒng)計(jì)量根據(jù)研究設(shè)計(jì)類型,資料特征,統(tǒng)計(jì)方法的適用條件,選擇和計(jì)算統(tǒng)計(jì)量。本例:計(jì)算統(tǒng)計(jì)量t值。2、計(jì)算統(tǒng)計(jì)量3、確定概率P值,作出統(tǒng)計(jì)推斷計(jì)算統(tǒng)計(jì)量后,根據(jù)事先確定的單側(cè)或雙側(cè)檢驗(yàn)、自由度、檢驗(yàn)水準(zhǔn)在相應(yīng)的統(tǒng)計(jì)用表中查出相應(yīng)的界值。將該界值與所計(jì)算的統(tǒng)計(jì)量比較,得出相應(yīng)的概率P。對(duì)本例t檢驗(yàn):小于界值的范圍,P大于α,是不拒絕H0的區(qū)間;大于或等于界值的范圍,P小于α,是拒絕H0的區(qū)間。3、確定概率P值,作出統(tǒng)計(jì)推斷P值是在由H0所規(guī)定的總體中作隨機(jī)抽樣,獲得等于及大于(或等于及小于)現(xiàn)有統(tǒng)計(jì)量的概率。P值是在由H0所規(guī)定的總體中作隨機(jī)抽樣,獲得等于及大于(或等若P≤α,統(tǒng)計(jì)上認(rèn)為是小概率事件,一次抽樣不可能發(fā)生。而一旦發(fā)生,即認(rèn)為:造成兩個(gè)均數(shù)差異的原因是總體不同(試驗(yàn)因素所致,或相應(yīng)的因素導(dǎo)致等),無效假設(shè)是錯(cuò)誤的,因此,拒絕H0,接受H1。稱差異有統(tǒng)計(jì)學(xué)意義。若P>α,則認(rèn)為是大概率事件,本次的差異僅為抽樣誤差所致,因此,接受H0,拒絕H1,認(rèn)為兩均數(shù)來自同一總體。稱差異無統(tǒng)計(jì)學(xué)意義。若P≤α,統(tǒng)計(jì)上認(rèn)為是小概率事件,一次抽樣不可能發(fā)生。而一本例t=0.844,而相應(yīng)的t界值:t0.05/2,25=2.0640.844<2.064,所以P>0.05按照α=0.05水平,不拒絕H0,不能認(rèn)為男性健康管理人員的血糖均數(shù)與一般成年男性的血糖均數(shù)不同。本例t=0.844,而相應(yīng)的t界值:t0.05/2,25=2兩均數(shù)比較時(shí)常用的判斷標(biāo)準(zhǔn)統(tǒng)計(jì)量u:單側(cè):u<1.645,雙側(cè):u<1.96,P>0.05,不拒絕H0;單側(cè):u≥1.645,雙側(cè):u≥1.96,P≤0.05,拒絕H0;統(tǒng)計(jì)量t:單側(cè);雙側(cè)P>0.05,不拒絕H0;單側(cè):雙側(cè)P≤0.05,拒絕H0;兩均數(shù)比較時(shí)常用的判斷標(biāo)準(zhǔn)統(tǒng)計(jì)量u:單側(cè):u<1.645,第一類錯(cuò)誤與第二類錯(cuò)誤

typeIerror&typeIIerror

假設(shè)檢驗(yàn)的判斷,并非百分之百正確,有兩種可能錯(cuò)誤:假陽性錯(cuò)誤(falsepositiveerror),稱為第一類錯(cuò)誤(typeIerror),用α表示,即檢驗(yàn)水準(zhǔn)(levelofsignificance),

通常?。?.05。即:無效假設(shè)(H0:u=u0)原本是正確的,但被拒絕,誤判為有差別(棄真錯(cuò)誤)。當(dāng)無效假設(shè)正確時(shí),在100次抽樣中,可以有5次推斷是錯(cuò)誤的。統(tǒng)計(jì)上有意義的界限是允許犯第一類錯(cuò)誤的界限。第一類錯(cuò)誤與第二類錯(cuò)誤

typeIerror&typ假陰性錯(cuò)誤(falsenegativeerror),稱為第二類錯(cuò)誤(typeIIerror)。即,無效假設(shè)(H0:u=u0)原本是錯(cuò)誤的(實(shí)際上應(yīng)是H1:u=u1),但所得統(tǒng)計(jì)量t沒有超過t0.05的水平從而接受了無效假設(shè),錯(cuò)誤地得出無差別的結(jié)論(取偽錯(cuò)誤)。用表示。檢驗(yàn)效能(poweroftest):1-當(dāng)兩個(gè)總體存在差異時(shí),所使用的統(tǒng)計(jì)檢驗(yàn)?zāi)軌虬l(fā)現(xiàn)這種差異(拒絕H0)的能力。假陰性錯(cuò)誤(falsenegativeerror),稱為盡管是小概率事件,它還是有可能發(fā)生的。I型錯(cuò)誤:雖然無效假設(shè)為真,但由于抽到了較大檢驗(yàn)統(tǒng)計(jì)量的樣本,使得P值小于檢驗(yàn)水準(zhǔn)而導(dǎo)致被拒絕。是否為小概率事件是由檢驗(yàn)水準(zhǔn)而定,所以犯錯(cuò)誤的概率也由檢驗(yàn)水準(zhǔn)而定。II型錯(cuò)誤:雖然無效假設(shè)為假,但由于抽到了較小檢驗(yàn)統(tǒng)計(jì)量的樣本,使得P值大于檢驗(yàn)水準(zhǔn)而導(dǎo)致不被拒絕。盡管是小概率事件,它還是有可能發(fā)生的。選擇統(tǒng)計(jì)意義水平,應(yīng)考慮兩類錯(cuò)誤對(duì)所要研究的事物的影響哪一個(gè)重要。一般來說,定0.05為有統(tǒng)計(jì)學(xué)意義的水平是比較適宜的。兩類錯(cuò)誤的關(guān)系:在樣本含量固定的條件下,減少I類錯(cuò)誤,會(huì)增大II類錯(cuò)誤;增大I類錯(cuò)誤,會(huì)減少II類錯(cuò)誤。其他條件不變,增大樣本含量可使第二類錯(cuò)誤的概率減小。同時(shí)正確的實(shí)驗(yàn)設(shè)計(jì)能夠減少抽樣誤差,提高檢驗(yàn)效能。選擇統(tǒng)計(jì)意義水平,應(yīng)考慮兩類錯(cuò)誤對(duì)所要研究的事物的影響哪一個(gè)終身模塊統(tǒng)計(jì)學(xué)抽樣誤差假設(shè)檢驗(yàn)課件tata實(shí)際差別與統(tǒng)計(jì)意義統(tǒng)計(jì)意義:抽到這樣大統(tǒng)計(jì)量的可能性很小,可以拒絕H0。但并不意味兩總體均數(shù)差別很大。樣本量很大時(shí),即使均數(shù)差別不大,統(tǒng)計(jì)學(xué)意義卻顯著。樣本小時(shí),即使均數(shù)差別很大,統(tǒng)計(jì)學(xué)意義卻不顯著。實(shí)際差別與統(tǒng)計(jì)意義理解檢驗(yàn)統(tǒng)計(jì)量觀察到的量可以是一個(gè)樣本的均數(shù)、兩個(gè)樣本均數(shù)的差、一個(gè)樣本的百分構(gòu)成、兩個(gè)樣本百分構(gòu)成的差;檢驗(yàn)統(tǒng)計(jì)量所服從的分布不一定是正態(tài)分布。但只要是已知的理論分布,都可以通過該分布求得P值。理解檢驗(yàn)統(tǒng)計(jì)量觀察到的量可以是一個(gè)樣本的均數(shù)、兩個(gè)樣本均數(shù)的理解P值P值是指在無效假設(shè)的前提下,得到觀察到的量(或更極端的量)的概率。P值越小說明無效假設(shè)越不可靠。或者說,P值越小我們就越有理由推翻無效假設(shè)。至于P值是否屬于“小”,一般的,我們是根據(jù)事先確定的檢驗(yàn)水準(zhǔn)來判斷的。當(dāng)P<時(shí),我們就可以下諸如“差別有顯著性”的論斷。P值的大小與觀察到的量的大小之間沒有必然的聯(lián)系。理解P值P值是指在無效假設(shè)的前提下,得到觀察到的量(或更極端當(dāng)P>時(shí)非小概率事件

在無效假設(shè)的前提下,得到觀察到的量(或更極端的量)的可能性還是相當(dāng)大的,我們尚不能拒絕無效假設(shè)或者說拒絕無效假設(shè)的證據(jù)不足。具體問題,專業(yè)判斷

P=0.70與P=0.07當(dāng)P>時(shí)非小概率事件

在無效假設(shè)的前提下,得到觀察到的量(“差別有顯著性”與“差別顯著”“差別有高度顯著性”與“差別極為顯著”二者之間不存在必然的聯(lián)系。“差別顯著”不一定導(dǎo)致“差別有顯著性”,“差別不顯著”倒是有很大可能導(dǎo)致“差別有顯著性”。即使“差別有顯著性”,臨床上也不一定有意義?!安顒e有顯著性”與“差別顯著”“差別有高度顯著性”與“差別極單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)?

One-sidedortwo-sidedtest?雙側(cè)檢驗(yàn)永遠(yuǎn)是正確的單側(cè)檢驗(yàn)只有在少數(shù)情況下才是合適的即使要做單側(cè)檢驗(yàn),也必須事先確定單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)?

One-sidedortwo-st檢驗(yàn)和u檢驗(yàn)t檢驗(yàn)和u檢驗(yàn)是兩種常見的假設(shè)檢驗(yàn)的方法,因其統(tǒng)計(jì)量為t,u而得名。u檢驗(yàn)條件:總體標(biāo)準(zhǔn)差已知,資料服從正態(tài)分布情況下(1)樣本均數(shù)與總體均數(shù)比較(2)兩大樣本均數(shù)的比較;t檢驗(yàn)條件:用于樣本量小、總體標(biāo)準(zhǔn)差未知時(shí)(1)樣本與總體均數(shù)比較(2)配對(duì)設(shè)計(jì)資料比較(3)兩樣本均數(shù)比較(同時(shí)要求兩樣本的總體方差相同,服從正態(tài)分布)是兩種常見的假設(shè)檢驗(yàn)的方法,因其統(tǒng)計(jì)量為t,u而得名。一、樣本均數(shù)與總體均數(shù)的比較總體均數(shù):大量觀測得到的穩(wěn)定值或理論值,μ0

比較的目的是推斷樣本所代表的未知總體均數(shù)與已知總體均數(shù)是否相同。樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn)

P240例題14.10

注意步驟、符號(hào)寫法

一、樣本均數(shù)與總體均數(shù)的比較樣本均數(shù)與總體均數(shù)比較的u檢驗(yàn)例題:若通過以往大規(guī)模調(diào)查,已知某地嬰兒出生體重均數(shù)為3.20kg,標(biāo)準(zhǔn)差0.39kg,今隨機(jī)查得25名難產(chǎn)兒平均出生體重為3.42kg,問:出生體重與難產(chǎn)是否有關(guān)?假定難產(chǎn)兒出生體重的標(biāo)準(zhǔn)差與一般兒童相同。樣本均數(shù)與總體均數(shù)比較的u檢驗(yàn)例題:若通過以往大規(guī)模調(diào)查,已解題步驟據(jù)題意:要檢驗(yàn)的是,難產(chǎn)兒出生體重總體均數(shù)是否等于3.20kg(),0.39看作總體標(biāo)準(zhǔn)差,樣本均數(shù)3.42,樣本含量25。1.建立假設(shè):H0,假設(shè)難產(chǎn)兒出生體重總體均數(shù)和一般嬰兒出生體重總體均數(shù)相等,即:解題步驟據(jù)題意:要檢驗(yàn)的是,難產(chǎn)兒出生體重總體均數(shù)是否等于32.計(jì)算合適的統(tǒng)計(jì)量:在總體標(biāo)準(zhǔn)差已知,對(duì)樣本均數(shù)和總體均數(shù)的差別做統(tǒng)計(jì)意義檢驗(yàn),可用公式:

u值服從均數(shù)為0,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布。本例:2.計(jì)算合適的統(tǒng)計(jì)量:3.從正態(tài)分布表查臨界值:本例:所以:拒絕無效假設(shè),接受備擇假設(shè)。認(rèn)為難產(chǎn)和出生體重是有關(guān)的??梢詾?,難產(chǎn)兒的出生體重平均來說是比較大一些。3.從正態(tài)分布表查臨界值:如果本例總體標(biāo)準(zhǔn)差未知,只有從樣本中求得標(biāo)準(zhǔn)差0.42,則應(yīng)該用t檢驗(yàn)。公式:如果本例總體標(biāo)準(zhǔn)差未知,只有從樣本中求得標(biāo)準(zhǔn)差0.42,則應(yīng)二、配對(duì)資料的比較配對(duì)設(shè)計(jì):兩樣本中的觀察值由于存在某種聯(lián)系而一一對(duì)應(yīng)結(jié)成對(duì)子(matching)的情況.1、同一受試對(duì)象處理前后的比較:高血壓治療前后的血壓值,或每一名病人有一對(duì)數(shù)據(jù);2、同一對(duì)象身體不同部位測定值比較:如左右臂皮膚的敏感試驗(yàn),測得紅斑直徑;3、同一樣品兩種不同方法測定結(jié)果:兩種儀器,兩名化驗(yàn)員,兩種條件等;4、成對(duì)設(shè)計(jì):動(dòng)物配對(duì)后隨機(jī)分到兩組后的測定結(jié)果;二、配對(duì)資料的比較這些資料的均數(shù)比較用t檢驗(yàn)。目的是驗(yàn)證差值的總體均數(shù)是否為零的假設(shè)。

P241例14.11計(jì)算兩組資料的差值以及差值的均數(shù),標(biāo)準(zhǔn)差,并將其差值轉(zhuǎn)化為t分布,假設(shè)差值的總體均數(shù)為0,做配對(duì)t檢驗(yàn)。這些資料的均數(shù)比較用t檢驗(yàn)。目的是驗(yàn)證差值的總體均數(shù)是否為零三、兩樣本均數(shù)比較推斷兩樣本所代表的兩個(gè)總體均數(shù)是否相同。分兩種情況:1、大樣本。兩樣本含量均>50,用u檢驗(yàn)。

三、兩樣本均數(shù)比較2、兩個(gè)小樣本均數(shù)的比較(正態(tài)總體,方差齊)由專用公式計(jì)算合并方差,均數(shù)差值的標(biāo)準(zhǔn)誤,再計(jì)算t值。用合并自由度查t界值表。確定概率,作出統(tǒng)計(jì)推斷。

p243例14-122、兩個(gè)小樣本均數(shù)的比較(正態(tài)總體,方差齊)t檢驗(yàn)的條件:正態(tài)總體,兩總體方差相等。如果:兩樣本方差不齊,則應(yīng)該用t’檢驗(yàn)。3、方差不齊時(shí)均數(shù)差別的統(tǒng)計(jì)學(xué)意義檢查(t’檢驗(yàn))t檢驗(yàn)的條件:3、方差不齊時(shí)均數(shù)差別的統(tǒng)計(jì)學(xué)意義檢查(t’如何檢驗(yàn)方差齊性?方差齊性檢驗(yàn)查F界值表,若大于相應(yīng)的界值,則有統(tǒng)計(jì)學(xué)意義。方差齊性檢驗(yàn):p244例14-14,例14-15,檢驗(yàn)總體變異程度如何檢驗(yàn)方差齊性?方差齊性檢驗(yàn)t’檢驗(yàn)的過程1、計(jì)算兩個(gè)樣本均數(shù)之差的標(biāo)準(zhǔn)誤,t’值t’檢驗(yàn)的過程1、計(jì)算兩個(gè)樣本均數(shù)之差的標(biāo)準(zhǔn)誤,t’值2、計(jì)算臨界值:2、計(jì)算臨界值:3、將t’分別與兩個(gè)臨界值比較,大于臨界值,則P小于臨界概率。反之,大于臨界概率。4、做出兩均數(shù)是否有區(qū)別的判斷。3、將t’分別與兩個(gè)臨界值比較,大于臨界值,則P小于臨界概率計(jì)量資料的統(tǒng)計(jì)推斷

statisticalinferenceofmeasurementdata張建軍汕大醫(yī)學(xué)院預(yù)防醫(yī)學(xué)教研室Tel/p>

zhangjj@

計(jì)量資料的統(tǒng)計(jì)推斷

statisticalinferenc統(tǒng)計(jì)推斷:參數(shù)估計(jì),假設(shè)檢驗(yàn)“世上有三種哄人的東西:謊言、該死的謊言、統(tǒng)計(jì)數(shù)據(jù)”----英國政治家迪斯雷里。“世上有三樣激動(dòng)人心的東西:宣傳、要命的宣傳、統(tǒng)計(jì)數(shù)據(jù)”。統(tǒng)計(jì)推斷:參數(shù)估計(jì),假設(shè)檢驗(yàn)均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤均數(shù)的抽樣誤差samplingerrorofmean概念:由于總體中存在個(gè)體變異,抽樣研究中所抽取的樣本,只包含總體中一部分個(gè)體,因而樣本均數(shù)(或率)往往不等于總體均數(shù)(或率),樣本均數(shù)之間也互不相等,這種由抽樣引起的差異稱為均數(shù)的抽樣誤差。即:均數(shù)的抽樣誤差samplingerrorofmean12中心極限定理:如果隨機(jī)變量的總體均數(shù)及方差有限,當(dāng)樣本容量趨于無窮大時(shí),樣本均數(shù)的分布趨近于均數(shù)為總體均數(shù),方差為的正態(tài)分布。1如何估計(jì)?用樣本均數(shù)的標(biāo)準(zhǔn)差來估計(jì),稱標(biāo)準(zhǔn)誤(standarderror)。標(biāo)準(zhǔn)誤越大,均數(shù)的抽樣誤差越大,樣本均數(shù)與總體均數(shù)間的差異越大。計(jì)算公式:即:由總體標(biāo)準(zhǔn)差,樣本例數(shù)求得。但通常以樣本標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差的估計(jì)值。因此:如何估計(jì)?與標(biāo)準(zhǔn)差的區(qū)別:標(biāo)準(zhǔn)差:表示一般變量值的離散程度;均數(shù)標(biāo)準(zhǔn)誤特別說明樣本均數(shù)這一變量值離散程度的指標(biāo)。標(biāo)準(zhǔn)誤的應(yīng)用:(1)用來衡量抽樣誤差的大小,標(biāo)準(zhǔn)誤越小,樣本均數(shù)與總體均數(shù)越接近,樣本均數(shù)的可信度越高;(2)結(jié)合標(biāo)準(zhǔn)正態(tài)分布與t分布曲線下的面積規(guī)律,估計(jì)總體均數(shù)的置信區(qū)間。(3)用于假設(shè)檢驗(yàn)。與標(biāo)準(zhǔn)差的區(qū)別:假定2003年汕頭市15歲女學(xué)生的身高(cm)服從N(155.4,5.32)。用計(jì)算機(jī)做抽樣模擬試驗(yàn),每次抽出10個(gè)數(shù)字,組成一個(gè)樣本,求出樣本均數(shù)、樣本標(biāo)準(zhǔn)差S。再求得此100個(gè)樣本均數(shù)的均數(shù)、樣本均數(shù)的標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)誤)。100個(gè)樣本均數(shù)構(gòu)成一個(gè)新的分布,也是正態(tài)分布(即使原分布為偏態(tài)分布,當(dāng)樣本含量足夠大時(shí),新分布也近似正態(tài)分布)。新分布的集中趨勢用均數(shù)的均數(shù)來表示,離散趨勢用標(biāo)準(zhǔn)誤表示N(,)。各樣本均數(shù)的均數(shù)等于總體均數(shù)。假定2003年汕頭市15歲女學(xué)生的身高(cm)服從N(155正態(tài)總體中抽樣(樣本量5)正態(tài)總體中抽樣(樣本量10)正態(tài)總體中抽樣(樣本量30)抽樣時(shí)樣本量大小決定了樣本均數(shù)分布的形狀,當(dāng)樣本量足夠大時(shí),均數(shù)分布趨向正態(tài)分布。正態(tài)總體中抽樣(樣本量5)正態(tài)總體中抽樣(樣本量10)正態(tài)總t分布(t-distribution)t分布(t-distribution)u分布:u轉(zhuǎn)換將正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài),N(0,1)。同理:將樣本均數(shù)的分布也可以轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布即:實(shí)際工作中,總體標(biāo)準(zhǔn)差往往未知,常用S代替σ

計(jì)算標(biāo)準(zhǔn)誤,因此:就變?yōu)椋簎分布:u轉(zhuǎn)換也就是說:正態(tài)分布:標(biāo)準(zhǔn)正態(tài)分布正態(tài)變量實(shí)現(xiàn)這一轉(zhuǎn)變:也就是說:正態(tài)分布:均數(shù)的分布也是這樣如果我們采用另一個(gè)正態(tài)變量:于是,均數(shù)的分布變成了標(biāo)準(zhǔn)正態(tài)分布:均數(shù)的分布也是這樣如果我們采用另一個(gè)正態(tài)變量:但是,條件發(fā)生變化我們通常用代替

然而,

隨著樣本量的變化而變化,所以,我們稱之為

t-分布,雖然它是正態(tài)分布,但只有當(dāng)樣本量(自由度)無窮大的時(shí)候,它才是標(biāo)準(zhǔn)正態(tài)分布,此時(shí),u=t但是,條件發(fā)生變化我們通常用代替t分布是一簇對(duì)稱于0的單峰分布曲線。自由度越?。ㄏ喈?dāng)于標(biāo)準(zhǔn)差大),曲線的中間越低,兩邊越高;隨自由度增大,t分布曲線逐漸逼近于標(biāo)準(zhǔn)正態(tài)分布曲線。當(dāng)自由度無窮大時(shí),t分布就是標(biāo)準(zhǔn)正態(tài)分布曲線。每一條t分布曲線,都對(duì)應(yīng)于相應(yīng)的自由度。t分布是一簇對(duì)稱于0的單峰分布曲線。自由度越?。ㄏ喈?dāng)于標(biāo)準(zhǔn)差t分布曲線下的面積規(guī)律:與標(biāo)準(zhǔn)正態(tài)曲線下的面積規(guī)律相似:在某一個(gè)自由度下,兩側(cè)外部總面積為5%的界限的t值稱為t0.05/2(υ),把兩側(cè)外部總面積為1%的界限的t值稱為t0.01/2(υ)。中部占95%面積的t值范圍:t0.05/2(υ)--t0.05/2(υ),中部占99%面積的t值范圍:-t0.01/2(υ)--t0.01/2(υ)。t分布曲線下的面積規(guī)律:當(dāng)自由度確定時(shí),占一定面積的t界限值,可以查表得出。參考附表6(p436)。例如:查當(dāng)自由度=20,兩側(cè)概率之和為0.05時(shí),對(duì)應(yīng)的t值:t0.05/2(20)=2.086,單側(cè)概率為0.05時(shí),對(duì)應(yīng)的t值:t0.05(20)=1.725,當(dāng)自由度確定時(shí),占一定面積的t界限值,可以查表得出。參考附表t分布的主要應(yīng)用:(1)總體均數(shù)置信區(qū)間估計(jì);(2)t檢驗(yàn);t分布的主要應(yīng)用:使用t值表注意:同一自由度下,P越小,t值越大;P值相同時(shí),自由度越大,t越?。划?dāng)自由度無窮大時(shí),t值與u值相等。這也是u分布與t分布的區(qū)別。使用t值表注意:總體均數(shù)置信區(qū)間的估計(jì)總體均數(shù)置信區(qū)間的估計(jì)參數(shù)估計(jì):點(diǎn)估計(jì)(pointestimation):用樣本統(tǒng)計(jì)量作為對(duì)總體參數(shù)的估計(jì)值(μ)。比如均數(shù)的估計(jì)。區(qū)間估計(jì)(intervalestimation):根據(jù)選定的置信度估計(jì)總體均數(shù)所在的區(qū)間(a<μ<b).a,b為置信限(可信限)。參數(shù)估計(jì):為何要進(jìn)行區(qū)間估計(jì)?點(diǎn)估計(jì)是用樣本均數(shù)來估計(jì)總體均數(shù),簡單易行,但未考慮抽樣誤差,而后者又是不可避免的。故常按照一定的概率估計(jì)總體均數(shù)在哪個(gè)范圍。置信度(confidencelevel):在估計(jì)總體均數(shù)的置信區(qū)間時(shí),如果可能估計(jì)錯(cuò)誤的概率為α,那么估計(jì)正確的概率為1-α,即為置信度.常用:95%,99%.置信區(qū)間(confidenceinterval,CI)根據(jù)置信度估計(jì)得到的區(qū)間,稱為置信區(qū)間。為何要進(jìn)行區(qū)間估計(jì)?如何進(jìn)行區(qū)間估計(jì)?1、總體標(biāo)準(zhǔn)差已知參照u分布,正態(tài)曲線下95%的u值在+-1.96之間,即:總體均數(shù)的95%置信區(qū)間:99%置信區(qū)間:如何進(jìn)行區(qū)間估計(jì)?1、總體標(biāo)準(zhǔn)差已知2、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)(>50)足夠大也可參考u分布進(jìn)行95%置信區(qū)間:99%置信區(qū)間:2、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)(>50)足夠大3、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)較小按t分布原理,依據(jù)相應(yīng)的自由度,查出該自由度下某個(gè)概率相應(yīng)的界值,再按照中部占95%面積的t值范圍:-t0.05/2(υ)--t0.05/2(υ),中部占99%面積的t值范圍:-t0.01/2(υ)--t0.01/2(υ)進(jìn)行估計(jì)。因?yàn)椋核裕?5%置信區(qū)間:99%置信區(qū)間:3、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)較小例子:p236課堂練習(xí)95%置信區(qū)間的意義:理論上,用一次抽樣所得的樣本均數(shù)估計(jì)總體均數(shù),犯錯(cuò)誤的概率為5%.或進(jìn)行100次抽樣,可算得100個(gè)置信區(qū)間,平均有95個(gè)置信區(qū)間包括客觀存在的總體均數(shù),只有5個(gè)置信區(qū)間未包括總體均數(shù)。例子:p236課堂練習(xí)估計(jì)置信區(qū)間的注意事項(xiàng):(1)區(qū)間是以上、下可信限為界的一個(gè)范圍。通常用表示置信限,用表示置信區(qū)間(2)置信區(qū)間與正常值范圍的意義、算法不同:95%正常值范圍一般是指同質(zhì)總體內(nèi)包括95%個(gè)體值的估計(jì)范圍,若總體為正態(tài)分布,常用:計(jì)算;95%置信區(qū)間是指按照95%置信度估計(jì)的總體參數(shù)的可能范圍,按照下式計(jì)算。

前者用標(biāo)準(zhǔn)差,后者用標(biāo)準(zhǔn)誤。估計(jì)置信區(qū)間的注意事項(xiàng):假設(shè)檢驗(yàn)的基本思想和步驟假設(shè)檢驗(yàn)的基本思想和步驟假設(shè)檢驗(yàn)(hypothesistesting):亦稱顯著性檢驗(yàn)(significancetest).是統(tǒng)計(jì)推斷的另一個(gè)方面。

先對(duì)總體的參數(shù)或分布作出某種假設(shè),如假設(shè)總體均數(shù)(或總體率)為一定值,兩總體均數(shù)(或總體率)相等,總體服從正態(tài)分布或兩總體分布相同等。然后,用適當(dāng)方法根據(jù)樣本對(duì)總體提供的信息,推斷此假設(shè)應(yīng)當(dāng)拒絕或不拒絕。其結(jié)果將有助于研究者作出決策,采取措施。假設(shè)檢驗(yàn)(hypothesistesting):亦稱顯著性在實(shí)際情況下:由于抽樣誤差,從某總體中隨機(jī)抽得的樣本,得到的樣本均數(shù)與該總體的均數(shù)不同;同一總體中兩次抽樣的樣本均數(shù)也不相同。這種差別的原因在于:要么總體均數(shù)不同;要么總體均數(shù)相同,差別僅由抽樣誤差所致。那么,當(dāng)我們遇到這種情況時(shí),如何判斷?可以通過某種方法來判斷差別屬哪種情況,這種方法就是假設(shè)檢驗(yàn)。在實(shí)際情況下:假設(shè)檢驗(yàn)HypothesisTesting假設(shè)檢驗(yàn)的反證思想

兩種說法非A即B。要證明B真,只要證明A偽即可。無效假設(shè)Nullhypothesis(H0)

意在推翻的假設(shè)(說法A)。備擇假設(shè)Alternativehypothesis(H1)

意在接受的假設(shè)(說法B)。從無效假設(shè)出發(fā),找出不支持這一假設(shè)的證據(jù),從而推翻它。假設(shè)檢驗(yàn)HypothesisTesting假設(shè)檢驗(yàn)的反證小概率事件

smallprobabilityevent事件A發(fā)生的概率是如此之小,以至于在一次試驗(yàn)(抽樣)時(shí),我們往往認(rèn)為它(事件A)不會(huì)發(fā)生。統(tǒng)計(jì)學(xué)中,小概率事件一般是指發(fā)生概率<0.05(檢驗(yàn)水準(zhǔn))的事件。在假設(shè)檢驗(yàn)中,如果在無效假設(shè)的前提下出現(xiàn)了小概率事件,我們則懷疑無效假設(shè)的真實(shí)性。小概率事件

smallprobabilityevent事例:兩種不同處理結(jié)果之間的差異效果

A處理結(jié)果A,B處理結(jié)果B

效果Effect:=結(jié)果A-結(jié)果B對(duì)于總體

如果

=0,則A處理和B處理之間沒有差別。

如果0,則A處理和B處理之間有差別。對(duì)于樣本

即使

=0,由于存在抽樣變異,往往樣本結(jié)果A–樣本結(jié)果B=0。問題在于這個(gè)差異是否僅僅是由于抽樣變異造成的?例:兩種不同處理結(jié)果之間的差異效果

A處理結(jié)果A,B處進(jìn)行假設(shè)檢驗(yàn)的思路無效假設(shè):樣本結(jié)果A和B之間的差異僅僅是由于抽樣變異造成的。即H0:=0。備擇假設(shè):樣本結(jié)果A和B之間的差異不僅僅是由于抽樣變異造成的,還包含不同處理的效果。即H1:0。由無效假設(shè)出發(fā),我們可以計(jì)算出得到樣本差異或者更大差異的概率(P值)。如果P值小于檢驗(yàn)水準(zhǔn),則認(rèn)為由此無效假設(shè)不太可能出現(xiàn)這樣的結(jié)果,從而推翻它,接受備擇假設(shè)(差異顯著性)。反之,接受無效假設(shè)。進(jìn)行假設(shè)檢驗(yàn)的思路無效假設(shè):樣本結(jié)果A和B之間的差異僅僅是由檢驗(yàn)統(tǒng)計(jì)量

statisticfortesting在無效假設(shè)的前提下,檢驗(yàn)統(tǒng)計(jì)量的構(gòu)建是無效假設(shè)的關(guān)鍵。檢驗(yàn)統(tǒng)計(jì)量一般服從某種分布。這樣我們就可以利用這種分布計(jì)算出由無效假設(shè)出發(fā),得到觀察到的差異或更大的差異的概率,從而作出推斷。檢驗(yàn)統(tǒng)計(jì)量

statisticfortesting在無終身模塊統(tǒng)計(jì)學(xué)抽樣誤差假設(shè)檢驗(yàn)課件界值criticalvalue對(duì)應(yīng)于檢驗(yàn)水準(zhǔn)的分布上的某些數(shù)值。正態(tài)分布上的某些界值:單側(cè)0.05±1.645雙側(cè)0.05±1.96相同界值單側(cè)檢驗(yàn)概率是雙側(cè)檢驗(yàn)概率的一半界值criticalvalue對(duì)應(yīng)于檢驗(yàn)水準(zhǔn)的分布上的某例題:兩個(gè)血糖均數(shù)不同,其原因可能是由于抽樣誤差;也可能是男性管理人員的總體血糖均數(shù)與一般正常成年男性的均數(shù)不同。假設(shè)檢驗(yàn)過程:1、建立檢驗(yàn)假設(shè)和設(shè)定檢驗(yàn)水準(zhǔn)無效假設(shè)(nullhypothesis)H0,假設(shè)差異是由于抽樣誤差所致,而兩個(gè)總體參數(shù)相同。是從反證法的思想提出的。(μ=μ0)例題:兩個(gè)血糖均數(shù)不同,其原因可能是由于抽樣誤差;也可能是男備擇假設(shè)(alternativehypothesis),H1.即差別不僅是由抽樣誤差所致,而更是總體參數(shù)不同。H1是和H0相聯(lián)系的,對(duì)立的假設(shè)。(μ≠μ0,μ>μ0,μ<μ0)雙側(cè),單側(cè)檢驗(yàn):根據(jù)專業(yè)知識(shí),μ可能大于也可能小于μ0,稱雙側(cè)檢驗(yàn);若認(rèn)為μ大于、等于μ0(或相反),為單側(cè)檢驗(yàn)。若不能確定單側(cè)的情況,應(yīng)采用雙側(cè)檢驗(yàn)。備擇假設(shè)(alternativehypothesis),確定檢驗(yàn)水準(zhǔn)(sizeofatest),(也叫顯著性水準(zhǔn)significancelevel):用α表示。即:拒絕了實(shí)際上成立的H0的概率;一般取0.05,或0.01.本步驟一般寫成:H0:μ=μ0H1:μ≠μ0,(雙側(cè))或:H1:μ>μ0,(μ<μ0),(單側(cè))α=0.05確定檢驗(yàn)水準(zhǔn)(sizeofatest),(也叫顯著性水2、計(jì)算統(tǒng)計(jì)量根據(jù)研究設(shè)計(jì)類型,資料特征,統(tǒng)計(jì)方法的適用條件,選擇和計(jì)算統(tǒng)計(jì)量。本例:計(jì)算統(tǒng)計(jì)量t值。2、計(jì)算統(tǒng)計(jì)量3、確定概率P值,作出統(tǒng)計(jì)推斷計(jì)算統(tǒng)計(jì)量后,根據(jù)事先確定的單側(cè)或雙側(cè)檢驗(yàn)、自由度、檢驗(yàn)水準(zhǔn)在相應(yīng)的統(tǒng)計(jì)用表中查出相應(yīng)的界值。將該界值與所計(jì)算的統(tǒng)計(jì)量比較,得出相應(yīng)的概率P。對(duì)本例t檢驗(yàn):小于界值的范圍,P大于α,是不拒絕H0的區(qū)間;大于或等于界值的范圍,P小于α,是拒絕H0的區(qū)間。3、確定概率P值,作出統(tǒng)計(jì)推斷P值是在由H0所規(guī)定的總體中作隨機(jī)抽樣,獲得等于及大于(或等于及小于)現(xiàn)有統(tǒng)計(jì)量的概率。P值是在由H0所規(guī)定的總體中作隨機(jī)抽樣,獲得等于及大于(或等若P≤α,統(tǒng)計(jì)上認(rèn)為是小概率事件,一次抽樣不可能發(fā)生。而一旦發(fā)生,即認(rèn)為:造成兩個(gè)均數(shù)差異的原因是總體不同(試驗(yàn)因素所致,或相應(yīng)的因素導(dǎo)致等),無效假設(shè)是錯(cuò)誤的,因此,拒絕H0,接受H1。稱差異有統(tǒng)計(jì)學(xué)意義。若P>α,則認(rèn)為是大概率事件,本次的差異僅為抽樣誤差所致,因此,接受H0,拒絕H1,認(rèn)為兩均數(shù)來自同一總體。稱差異無統(tǒng)計(jì)學(xué)意義。若P≤α,統(tǒng)計(jì)上認(rèn)為是小概率事件,一次抽樣不可能發(fā)生。而一本例t=0.844,而相應(yīng)的t界值:t0.05/2,25=2.0640.844<2.064,所以P>0.05按照α=0.05水平,不拒絕H0,不能認(rèn)為男性健康管理人員的血糖均數(shù)與一般成年男性的血糖均數(shù)不同。本例t=0.844,而相應(yīng)的t界值:t0.05/2,25=2兩均數(shù)比較時(shí)常用的判斷標(biāo)準(zhǔn)統(tǒng)計(jì)量u:單側(cè):u<1.645,雙側(cè):u<1.96,P>0.05,不拒絕H0;單側(cè):u≥1.645,雙側(cè):u≥1.96,P≤0.05,拒絕H0;統(tǒng)計(jì)量t:單側(cè);雙側(cè)P>0.05,不拒絕H0;單側(cè):雙側(cè)P≤0.05,拒絕H0;兩均數(shù)比較時(shí)常用的判斷標(biāo)準(zhǔn)統(tǒng)計(jì)量u:單側(cè):u<1.645,第一類錯(cuò)誤與第二類錯(cuò)誤

typeIerror&typeIIerror

假設(shè)檢驗(yàn)的判斷,并非百分之百正確,有兩種可能錯(cuò)誤:假陽性錯(cuò)誤(falsepositiveerror),稱為第一類錯(cuò)誤(typeIerror),用α表示,即檢驗(yàn)水準(zhǔn)(levelofsignificance),

通常取:0.05。即:無效假設(shè)(H0:u=u0)原本是正確的,但被拒絕,誤判為有差別(棄真錯(cuò)誤)。當(dāng)無效假設(shè)正確時(shí),在100次抽樣中,可以有5次推斷是錯(cuò)誤的。統(tǒng)計(jì)上有意義的界限是允許犯第一類錯(cuò)誤的界限。第一類錯(cuò)誤與第二類錯(cuò)誤

typeIerror&typ假陰性錯(cuò)誤(falsenegativeerror),稱為第二類錯(cuò)誤(typeIIerror)。即,無效假設(shè)(H0:u=u0)原本是錯(cuò)誤的(實(shí)際上應(yīng)是H1:u=u1),但所得統(tǒng)計(jì)量t沒有超過t0.05的水平從而接受了無效假設(shè),錯(cuò)誤地得出無差別的結(jié)論(取偽錯(cuò)誤)。用表示。檢驗(yàn)效能(poweroftest):1-當(dāng)兩個(gè)總體存在差異時(shí),所使用的統(tǒng)計(jì)檢驗(yàn)?zāi)軌虬l(fā)現(xiàn)這種差異(拒絕H0)的能力。假陰性錯(cuò)誤(falsenegativeerror),稱為盡管是小概率事件,它還是有可能發(fā)生的。I型錯(cuò)誤:雖然無效假設(shè)為真,但由于抽到了較大檢驗(yàn)統(tǒng)計(jì)量的樣本,使得P值小于檢驗(yàn)水準(zhǔn)而導(dǎo)致被拒絕。是否為小概率事件是由檢驗(yàn)水準(zhǔn)而定,所以犯錯(cuò)誤的概率也由檢驗(yàn)水準(zhǔn)而定。II型錯(cuò)誤:雖然無效假設(shè)為假,但由于抽到了較小檢驗(yàn)統(tǒng)計(jì)量的樣本,使得P值大于檢驗(yàn)水準(zhǔn)而導(dǎo)致不被拒絕。盡管是小概率事件,它還是有可能發(fā)生的。選擇統(tǒng)計(jì)意義水平,應(yīng)考慮兩類錯(cuò)誤對(duì)所要研究的事物的影響哪一個(gè)重要。一般來說,定0.05為有統(tǒng)計(jì)學(xué)意義的水平是比較適宜的。兩類錯(cuò)誤的關(guān)系:在樣本含量固定的條件下,減少I類錯(cuò)誤,會(huì)增大II類錯(cuò)誤;增大I類錯(cuò)誤,會(huì)減少II類錯(cuò)誤。其他條件不變,增大樣本含量可使第二類錯(cuò)誤的概率減小。同時(shí)正確的實(shí)驗(yàn)設(shè)計(jì)能夠減少抽樣誤差,提高檢驗(yàn)效能。選擇統(tǒng)計(jì)意義水平,應(yīng)考慮兩類錯(cuò)誤對(duì)所要研究的事物的影響哪一個(gè)終身模塊統(tǒng)計(jì)學(xué)抽樣誤差假設(shè)檢驗(yàn)課件tata實(shí)際差別與統(tǒng)計(jì)意義統(tǒng)計(jì)意義:抽到這樣大統(tǒng)計(jì)量的可能性很小,可以拒絕H0。但并不意味兩總體均數(shù)差別很大。樣本量很大時(shí),即使均數(shù)差別不大,統(tǒng)計(jì)學(xué)意義卻顯著。樣本小時(shí),即使均數(shù)差別很大,統(tǒng)計(jì)學(xué)意義卻不顯著。實(shí)際差別與統(tǒng)計(jì)意義理解檢驗(yàn)統(tǒng)計(jì)量觀察到的量可以是一個(gè)樣本的均數(shù)、兩個(gè)樣本均數(shù)的差、一個(gè)樣本的百分構(gòu)成、兩個(gè)樣本百分構(gòu)成的差;檢驗(yàn)統(tǒng)計(jì)量所服從的分布不一定是正態(tài)分布。但只要是已知的理論分布,都可以通過該分布求得P值。理解檢驗(yàn)統(tǒng)計(jì)量觀察到的量可以是一個(gè)樣本的均數(shù)、兩個(gè)樣本均數(shù)的理解P值P值是指在無效假設(shè)的前提下,得到觀察到的量(或更極端的量)的概率。P值越小說明無效假設(shè)越不可靠?;蛘哒f,P值越小我們就越有理由推翻無效假設(shè)。至于P值是否屬于“小”,一般的,我們是根據(jù)事先確定的檢驗(yàn)水準(zhǔn)來判斷的。當(dāng)P<時(shí),我們就可以下諸如“差別有顯著性”的論斷。P值的大小與觀察到的量的大小之間沒有必然的聯(lián)系。理解P值P值是指在無效假設(shè)的前提下,得到觀察到的量(或更極端當(dāng)P>時(shí)非小概率事件

在無效假設(shè)的前提下,得到觀察到的量(或更極端的量)的可能性還是相當(dāng)大的,我們尚不能拒絕無效假設(shè)或者說拒絕無效假設(shè)的證據(jù)不足。具體問題,專業(yè)判斷

P=0.70與P=0.07當(dāng)P>時(shí)非小概率事件

在無效假設(shè)的前提下,得到觀察到的量(“差別有顯著性”與“差別顯著”“差別有高度顯著性”與“差別極為顯著”二者之間不存在必然的聯(lián)系?!安顒e顯著”不一定導(dǎo)致“差別有顯著性”,“差別不顯著”倒是有很大可能導(dǎo)致“

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論