第五章假設(shè)檢驗(yàn)_第1頁
第五章假設(shè)檢驗(yàn)_第2頁
第五章假設(shè)檢驗(yàn)_第3頁
第五章假設(shè)檢驗(yàn)_第4頁
第五章假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一節(jié)假設(shè)檢驗(yàn)的基本問題第二節(jié)幾種常見的假設(shè)檢驗(yàn)第三節(jié)假設(shè)檢驗(yàn)的兩類錯(cuò)誤與功效

第七章假設(shè)檢驗(yàn)第一節(jié)假設(shè)檢驗(yàn)的基本問題一、假設(shè)檢驗(yàn)的概念與種類二、原假設(shè)和備擇假設(shè)三、顯著性水平和拒絕域四、假設(shè)檢驗(yàn)的基本步驟所謂假設(shè)檢驗(yàn),就是事先對(duì)總體參數(shù)或總體分布形態(tài)做出一個(gè)規(guī)定或假設(shè),然后利用樣本提供的信息,以一定的概率來檢驗(yàn)假設(shè)是否成立(或是否合理),或者說判斷總體的真實(shí)情況是否與原假設(shè)存在顯著的系統(tǒng)性差異。

在統(tǒng)計(jì)中,常見的統(tǒng)計(jì)假設(shè)有:總體均值(或總體成數(shù)、總體方差等)等于(或大于、小于)某一數(shù)值,總體相關(guān)系數(shù)等于0,兩總體均值(或兩總體成數(shù)、兩總體方差)相等,總體分布服從正態(tài)分布等。

根據(jù)檢驗(yàn)的目的不同,假設(shè)檢驗(yàn)可以分為雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)兩類。雙側(cè)檢驗(yàn)是指同時(shí)注意總體參數(shù)估計(jì)值與其假設(shè)值相比的偏高和偏低傾向的檢驗(yàn)。單側(cè)檢驗(yàn)是指只注意總體參數(shù)估計(jì)值比其假設(shè)值偏高或偏低傾向的檢驗(yàn),它是單方向的。要進(jìn)行假設(shè)檢驗(yàn),必須設(shè)立原假設(shè)和備擇假設(shè)。原假設(shè)也稱零假設(shè)或虛無假設(shè),是研究者對(duì)總體參數(shù)值事先提出的假設(shè),是被檢驗(yàn)的假設(shè)。備擇假設(shè)也稱對(duì)立假設(shè),是研究者通過檢驗(yàn)希望能夠成立的假設(shè),是當(dāng)原假設(shè)不成立時(shí)供選擇的假設(shè)。

設(shè)總體參數(shù)的假設(shè)值為,那么原假設(shè)記為:它表示總體參數(shù)值與其假設(shè)值之間沒有顯著差異。備擇假設(shè)記為:(雙側(cè)檢驗(yàn)時(shí))或(右單側(cè)檢驗(yàn)時(shí))或(左單側(cè)檢驗(yàn)時(shí))假設(shè)檢驗(yàn)的實(shí)質(zhì)就是樣本信息是否有充分的理由來否定原假設(shè)。一方面原假設(shè)H0受到保護(hù)而不被輕易否定,使它處于有利地位;另一方面當(dāng)原假設(shè)H0被接收時(shí),又認(rèn)為它不一定正確。還須指出,備擇假設(shè)的表達(dá)式中是不含有等號(hào)的,即等號(hào)一定存在于原假設(shè)中。進(jìn)行假設(shè)檢驗(yàn),概率論中關(guān)于小概率事件在一次試驗(yàn)中是不可能事件的原則是其所要遵循的基本原則。由抽樣分布理論可知,若原假設(shè)成立,則樣本統(tǒng)計(jì)值與總體參數(shù)假設(shè)值偏差很大的事件是一個(gè)小概率事件。倘若在一次抽樣中,樣本統(tǒng)計(jì)值與總體參數(shù)假設(shè)值相差很大,那么在原假設(shè)成立的條件下,就是出現(xiàn)了一個(gè)小概率事件。一旦出現(xiàn)小概率事件,就要懷疑原假設(shè)的正確性,從而否定原假設(shè)。若一次抽樣的樣本統(tǒng)計(jì)值與總體參數(shù)假設(shè)值相差不大,那么就沒有理由拒絕原假設(shè),也就只好接受原假設(shè)?,F(xiàn)在的問題是,概率小到多少的事件為小概率事件?這個(gè)概率是在假設(shè)檢驗(yàn)之前由人們事先主觀選定的,用表示。究竟取多大為宜,應(yīng)視具體情況而定,通常取0.05或0.01,有時(shí)也取0.10,而把概率小于上述值的事件稱為小概率事件。越大,樣本統(tǒng)計(jì)值與總體參數(shù)假設(shè)值之間的差異成為顯著性差異的可能性越大;越小,這種差異成為顯著性差異的可能性越小。因此的大小就成了判定這種差異是否顯著的一個(gè)標(biāo)準(zhǔn),故稱為顯著性水平。1-,則是樣本統(tǒng)計(jì)值與總體參數(shù)假設(shè)值之差不超過一定范圍的概率。接受或拒絕原假設(shè),最終要以顯著性水平為依據(jù)確定評(píng)判的規(guī)則。評(píng)判規(guī)則有兩種;臨界值規(guī)則和P-值規(guī)則。所謂臨界值規(guī)則,就是先把值轉(zhuǎn)化為一定分布下的臨界值,然后計(jì)算檢驗(yàn)統(tǒng)計(jì)值,最后把檢驗(yàn)統(tǒng)計(jì)值與臨界值相比較來判斷是否拒絕原假設(shè)。所謂P-值規(guī)則,就是先計(jì)算檢驗(yàn)統(tǒng)計(jì)值,然后求出統(tǒng)計(jì)量分布曲線圖中與檢驗(yàn)統(tǒng)計(jì)值相對(duì)應(yīng)的、稱之為觀測(cè)到的顯著性水平P-值,最后把P-值與事先給定的顯著性水平值相比較來判斷是否拒絕原假設(shè)。檢驗(yàn)統(tǒng)計(jì)量是樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)化形式,其構(gòu)造公式為或。凡是檢驗(yàn)統(tǒng)計(jì)量之值的絕對(duì)值小于臨界值的絕對(duì)值,那么就接受原假設(shè);若檢驗(yàn)統(tǒng)計(jì)量之值的絕對(duì)值大于或等于臨界值的絕對(duì)值,那么就拒絕原假設(shè)。這樣,臨界值就把樣本統(tǒng)計(jì)量的概率分布區(qū)域分成了兩部分(即把檢驗(yàn)統(tǒng)計(jì)量的取值分成了兩個(gè)區(qū)域):不超過臨界值的區(qū)域和超過臨界值的區(qū)域。我們把不超過臨界值的區(qū)域稱為接受域,把超過臨界值的區(qū)域(含臨界值點(diǎn))稱為拒絕域。標(biāo)準(zhǔn)正態(tài)分布的拒絕域如圖5-1、圖5-2所示。接受域拒絕域拒絕域

0

圖5-1正態(tài)分布雙側(cè)檢驗(yàn)接受域與拒絕域示意圖

(a)左單側(cè)檢驗(yàn)(b)右單側(cè)檢驗(yàn)

圖5-2正態(tài)分布單側(cè)檢驗(yàn)接受域與拒絕域示意圖接受域拒絕域

0接受域拒絕域

0假設(shè)檢驗(yàn)的基本原理

(一)提出原假設(shè)和備擇假設(shè);(二)確定檢驗(yàn)的顯著性水平;(三)根據(jù)樣本統(tǒng)計(jì)量的概率分布確定出與相對(duì)應(yīng)的臨界值,即確定接受域和拒絕域;(四)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,并根據(jù)樣本觀測(cè)數(shù)據(jù)計(jì)算出檢驗(yàn)統(tǒng)計(jì)值;(五)比較檢驗(yàn)統(tǒng)計(jì)值與臨界值,做出接受或拒絕原假設(shè)的判斷。

第二節(jié)幾種常見的假設(shè)檢驗(yàn)一、總體均值的檢驗(yàn)二、兩個(gè)總體均值之差的檢驗(yàn)三、總體成數(shù)的檢驗(yàn)四、兩總體成數(shù)之差的檢驗(yàn)五、總體方差的檢驗(yàn)六、兩總體方差之比的檢驗(yàn)總體均值檢驗(yàn)的目的是總體均值是否等于(或大于,或小于)。我們可以建立假設(shè)如下:(雙側(cè)檢驗(yàn))或(左單側(cè)檢驗(yàn))或(右單側(cè)檢驗(yàn))下面我們分幾種情況加以介紹。(一)總體服從正態(tài)分布且方差已知根據(jù)抽樣分布原理,當(dāng)總體服從正態(tài)分布時(shí),那么從中抽取容量為n的樣本,其樣本均值服從正態(tài)分布(為了簡(jiǎn)便,只討論重復(fù)抽樣情況),而統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布。所以,當(dāng)原假設(shè)為真時(shí),我們可以構(gòu)造檢驗(yàn)統(tǒng)計(jì)量為:

對(duì)于雙側(cè)檢驗(yàn),針對(duì)給定的顯著性水平,當(dāng)時(shí),要接受H0;當(dāng)時(shí),則要拒絕H0而接受H1。(二)總體分布及其方差均未知但大樣本根據(jù)中心極限定理,當(dāng)樣本容量足夠大時(shí)(n>30),樣本均值也趨于服從數(shù)學(xué)期望為,方差為的正態(tài)分布。但由于未知,要以樣本方差來估計(jì),這時(shí)統(tǒng)計(jì)量趨于服從標(biāo)準(zhǔn)正態(tài)分布。所以,如果原假設(shè)成立,我們也可以構(gòu)造檢驗(yàn)統(tǒng)計(jì)量為:根據(jù)與(一)相同的規(guī)則,通過比較值與臨界值或,可以做出接受H0或拒絕H1的判斷,唯一不同之處,就是以代替了。(三)總體為正態(tài)分布,但方差未知且小樣本若總體服從正態(tài)分布,但未知而要用樣本方差估計(jì),那么當(dāng)時(shí),統(tǒng)計(jì)量服從自由度為n-1的t分布。如果原假設(shè)成立,則檢驗(yàn)統(tǒng)計(jì)量為:根據(jù)規(guī)定的顯著性水平來確定臨界值或,通過比較t和(或),來做出接受或拒絕原假設(shè)的判斷。這種檢驗(yàn)稱為小樣本t檢驗(yàn)。對(duì)于雙側(cè)檢驗(yàn),當(dāng),接受原假設(shè)而拒絕備擇假設(shè);若,則要拒絕H0而接受H1。同理,對(duì)于左單側(cè)檢驗(yàn),當(dāng)時(shí),拒絕而接受;若。則接受H0。對(duì)于右單側(cè)檢驗(yàn),當(dāng)時(shí),拒絕而接受若,則接受H0。

設(shè)兩個(gè)總體的均值分別為和,兩個(gè)總體的方差分別為和,來自兩個(gè)總體的樣本容量分別為n1和n2,樣本均值分別為和。檢驗(yàn)的目的是兩個(gè)總體的均值是否相等,或兩個(gè)總體的均值之差是否為零。我們可以建立假設(shè)如下:(雙側(cè)檢驗(yàn))或(左單側(cè)檢驗(yàn))

或(右單側(cè)檢驗(yàn))下面分幾種情況加以介紹。

(一)兩個(gè)總體服從正態(tài)分布且方差已知根據(jù)抽樣分布原理,統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布。如果原假設(shè)成立,我們可構(gòu)造檢驗(yàn)統(tǒng)計(jì)量為:對(duì)于雙側(cè)檢驗(yàn),當(dāng)時(shí)拒絕H0,當(dāng)時(shí)接受H0。對(duì)于左單側(cè)檢驗(yàn),當(dāng)時(shí)拒絕H0,當(dāng)時(shí)接受H0。對(duì)于右單側(cè)檢驗(yàn),當(dāng)時(shí)拒絕H0,當(dāng)時(shí)接受H0。

(二)兩個(gè)總體方差未知但大樣本若兩個(gè)總體方差和未知且不相等,要分別以樣本方差和來估計(jì),那么當(dāng)n1和n2都足夠大時(shí),統(tǒng)計(jì)量

趨于服從標(biāo)準(zhǔn)正態(tài)分布。當(dāng)原假設(shè)成立時(shí),我們可構(gòu)造檢驗(yàn)統(tǒng)計(jì)量為:

(三)兩個(gè)總體服從正態(tài)分布,但方差未知且小樣本若兩個(gè)總體服從正態(tài)分布,方差未知且相等,那么當(dāng)n1和n2都不夠大時(shí),那么下列統(tǒng)計(jì)量服從自由度為n1+n2-2的t分布,即:

其中為合并標(biāo)準(zhǔn)差。

當(dāng)原假設(shè)成立時(shí),檢驗(yàn)統(tǒng)計(jì)量為:對(duì)于雙側(cè)檢驗(yàn),當(dāng)時(shí)要拒絕H0,當(dāng)要接受H0。對(duì)于左單側(cè)檢驗(yàn),當(dāng)時(shí)要拒絕H0,當(dāng)時(shí)要接受H0。對(duì)于右單側(cè)檢驗(yàn),當(dāng)時(shí)要拒絕H0,當(dāng)要接受H0。

檢驗(yàn)的目的是判斷總體成數(shù)P是否等于P0,我們可以建立假設(shè)如下:(雙側(cè)檢驗(yàn))

或(左單側(cè)檢驗(yàn))或(右單側(cè)檢驗(yàn))根據(jù)抽樣分布定理可知,當(dāng)樣本容量足夠大,即nP和n(1-P)都大于5時(shí),樣本成數(shù)p的抽樣分布近似服從正態(tài)分布,而統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布。其中,由于N一般都很大,因此總體方差簡(jiǎn)化為。因此,當(dāng)原假設(shè)為真時(shí),我們可以構(gòu)造檢驗(yàn)統(tǒng)計(jì)量為:

對(duì)于給定的顯著性水平,可查得臨界值或。通過比較與或,可做出拒絕原假設(shè)H0或接受原假設(shè)H0的判斷。判斷規(guī)則與總體均值檢驗(yàn)相同。設(shè)兩個(gè)總體成數(shù)分別為P1和P2,來自兩個(gè)總體的樣本容量分別為n1和n2,樣本成數(shù)分別為p1和p2。檢驗(yàn)兩個(gè)總體成數(shù)是否相等,或兩個(gè)總體成數(shù)之差是否為零,我們可以建立假設(shè)如下:(雙側(cè)檢驗(yàn))或(左單側(cè)檢驗(yàn))或(右單側(cè)檢驗(yàn))

當(dāng)n1和n2都足夠大時(shí)(即n1P1、n1P1

(1-P1)、n2P2、n2P2(1-P2)均大于5),兩個(gè)樣本成數(shù)之差的抽樣分布漸近服從正態(tài)分布,即:由于P1、P2未知,要以p1和p2來估計(jì),因此在原假設(shè)H0為真時(shí),我們要以兩個(gè)樣本的合并成數(shù)作為兩個(gè)總體成數(shù)的共同的估計(jì)值,即:

這樣,當(dāng)原假設(shè)成立時(shí),檢驗(yàn)統(tǒng)計(jì)量就成為:

檢驗(yàn)?zāi)康氖桥袛嗾龖B(tài)總體方差S2是否S02等于,我們可建立假設(shè)為:(雙側(cè)檢驗(yàn))或(左單側(cè)檢驗(yàn))或(右單側(cè)檢驗(yàn))當(dāng)原假設(shè)為真時(shí),我們可構(gòu)造服從自由度為n-1的分布的檢驗(yàn)統(tǒng)計(jì)量:

對(duì)于給定的顯著性水平,在雙側(cè)檢驗(yàn)時(shí),分布的左臨界值為,右臨界值為。當(dāng),就接受原假設(shè)H0;若或,就要拒絕原假設(shè)H0。在左單側(cè)檢驗(yàn)時(shí),臨界值為,當(dāng)時(shí),就接受原假設(shè)H0;若,就拒絕原假設(shè)H0。在右單側(cè)檢驗(yàn)時(shí),臨界值為,當(dāng),就接受原假設(shè)H0;若,就拒絕原假設(shè)H0。分布檢驗(yàn)的拒絕域如圖5-3、圖5-4所示。

拒絕域接受域

拒絕域圖5-3分布雙側(cè)檢驗(yàn)接受域與拒絕域示意圖拒絕域接受域接受域拒絕域(a)左單側(cè)檢驗(yàn)

(b)右單側(cè)檢驗(yàn)圖5-4分布單側(cè)檢驗(yàn)接受域與拒絕域示意圖設(shè)兩個(gè)總體方差分別為S12和S22,相應(yīng)的樣本方差分別s12為和s22,檢驗(yàn)?zāi)康氖桥袛鄡蓚€(gè)總體方差是否相等,我們可建立假設(shè)為:(雙側(cè)檢驗(yàn))或(左單側(cè)檢驗(yàn))或(右單側(cè)檢驗(yàn))

如果原假設(shè)成立,那么來自兩個(gè)總體的兩個(gè)樣本方差之比應(yīng)接近于1。因此當(dāng)兩個(gè)總體為正態(tài)總體時(shí),我們可構(gòu)造檢驗(yàn)統(tǒng)計(jì)量為:它服從分子自由度為n1-1,分母自由度為n2-1的F分布。對(duì)于給定的顯著性水平,在雙側(cè)檢驗(yàn)時(shí),分布的左臨界值為右臨界值為。當(dāng)時(shí),接受原假設(shè)H0;若或,則要拒絕原假設(shè)H0而接受H1。在左單側(cè)檢驗(yàn)時(shí),臨界值為,若,要接受原假設(shè)H0;若,則拒絕原假設(shè)H0而接受H1。在右單側(cè)檢驗(yàn)時(shí),臨界值為,若,要接受H0;若,要拒絕H0而接受H1。分布檢驗(yàn)的拒絕域于圖5-3、圖5-4相似。第三節(jié)假設(shè)檢驗(yàn)的兩類錯(cuò)誤與功效一、假設(shè)檢驗(yàn)的兩類錯(cuò)誤二、犯第二類錯(cuò)誤的概率的計(jì)算三、假設(shè)檢驗(yàn)的功效第一類錯(cuò)誤是“以真為假”的錯(cuò)誤,即原假設(shè)正確但卻被拒絕的錯(cuò)誤,也稱為“棄真”錯(cuò)誤。產(chǎn)生第一類錯(cuò)誤的概率是由假設(shè)檢驗(yàn)的顯著性水平給出的,即是,因此它又稱為錯(cuò)誤。

第二類錯(cuò)誤是“以假為真”的錯(cuò)誤,即原假設(shè)不正確卻被接受的錯(cuò)誤,也稱為“納偽”錯(cuò)誤。犯第二類錯(cuò)誤的概率是當(dāng)備擇假設(shè)成立時(shí),檢驗(yàn)統(tǒng)計(jì)值落入接受域的概率,一般用表示,因此它又稱為錯(cuò)誤。

假設(shè)檢驗(yàn)的兩類錯(cuò)誤

接受域

圖5-5雙側(cè)檢驗(yàn)兩類錯(cuò)誤的關(guān)系

接受域

圖5-6單側(cè)檢驗(yàn)兩類錯(cuò)誤的關(guān)系

(一)在雙側(cè)檢驗(yàn)中的計(jì)算先求出當(dāng)原假設(shè)為真時(shí)的兩個(gè)臨界值:和其中抽樣標(biāo)準(zhǔn)誤通常要以來估計(jì)。然后求出當(dāng)備擇假設(shè)

為真時(shí),樣本均值落入?yún)^(qū)間內(nèi)的概率,此即為,計(jì)算公式為:

(二)在單側(cè)檢驗(yàn)中的計(jì)算對(duì)于左單側(cè)檢測(cè),先求出原假設(shè)為真時(shí)的臨界值,然后求出當(dāng)備擇假設(shè)為真時(shí),樣本均值落入?yún)^(qū)間

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論