




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、.第八章 假設(shè)檢驗第一節(jié) 概述統(tǒng)計推斷中的另一類重要問題是假設(shè)檢驗Hypothesis testing.當(dāng)總體的分布函數(shù)未知,或只知其形式而不知道它的參數(shù)的情況時,我們常需要判斷總體是否具有我們所感興趣的某些特性.這樣,我們就提出某些關(guān)于總體分布或關(guān)于總體參數(shù)的假設(shè),然后根據(jù)樣本對所提出的假設(shè)作出判斷:是承受還是回絕.這就是本章所要討論的假設(shè)檢驗問題.我們先從下面的例子來說明假設(shè)檢驗的一般提法.例8.1 某工廠用包裝機包裝奶粉,額定標(biāo)準(zhǔn)為每袋凈重0.5kg.設(shè)包裝機稱得奶粉重量X服從正態(tài)分布N,2.根據(jù)長期的經(jīng)歷知其標(biāo)準(zhǔn)差=0.015kg.為檢驗?zāi)撑_包裝機的工作是否正常;隨機抽取包裝的奶粉9袋
2、,稱得凈重單位:kg為0.499 0.515 0.508 0.512 0.4980.515 0.516 0.513 0.524問該包裝機的工作是否正常?由于長期理論說明標(biāo)準(zhǔn)差比較穩(wěn)定,于是我們假設(shè)XN,0.0152.假設(shè)奶粉重量X的均值等于0.5kg,我們說包裝機的工作是正常的.于是提出假設(shè):H0:=0=0.5;H1:0=0.5.這樣的假設(shè)叫統(tǒng)計假設(shè).1.統(tǒng)計假設(shè)關(guān)于總體X的分布或隨機事件之概率的各種論斷叫統(tǒng)計假設(shè),簡稱假設(shè),用“H表示,例如:1 對于檢驗?zāi)硞€總體X的分布,可以提出假設(shè):H0:X服從正態(tài)分布,H1: X不服從正態(tài)分布.H0:X服從泊松分布,H1: X不服從泊松分布.2 對于總體
3、X的分布的參數(shù),假設(shè)檢驗均值,可以提出假設(shè):H0:=0;H1:0.H0:0;H1:0.假設(shè)檢驗標(biāo)準(zhǔn)差,可提出假設(shè):H0:=0;H1:0.H0:0;H1:0.這里0,0是數(shù),而=EX,2=DX是未知參數(shù).上面對于總體X的每個論斷,我們都提出了兩個互相對立的統(tǒng)計假設(shè):H0和H1,顯然,H0與H1只有一個成立,或H0真H1假,或H0假H1真,其中假設(shè)H0,稱為原假設(shè)Original hypothesis又叫零假設(shè)、根本假設(shè),而H1稱為H0的對立假設(shè)又叫備擇假設(shè).在處理實際問題時,通常把希望得到的陳述視為備擇假設(shè),而把這一陳述的否認(rèn)作為原假設(shè).例如在上例中,H0:=0=0.5為原假設(shè),它的對立假設(shè)是H
4、1:0=0.5.統(tǒng)計假設(shè)提出之后,我們關(guān)心的是它的真?zhèn)?所謂對假設(shè)H0的檢驗,就是根據(jù)來自總體的樣本,按照一定的規(guī)那么對H0作出判斷:是承受,還是回絕,這個用來對假設(shè)作出判斷的規(guī)那么叫做檢驗準(zhǔn)那么,簡稱檢驗,如何對統(tǒng)計假設(shè)進(jìn)展檢驗?zāi)??我們結(jié)合上例來說明假設(shè)檢驗的根本思想和做法.2.假設(shè)檢驗的根本思想在例8.1中所提假設(shè)是H0:=0=0.5備擇假設(shè)H1:0.由于要檢驗的假設(shè)涉及總體均值,故首先想到是否可借助樣本均值這一統(tǒng)計量來進(jìn)展判斷.從抽樣的結(jié)果來看,樣本均值=0.499+0.515+0.508+0.512+0.498+0.515+0.516+0.513+0.524=0.5110,與=0.5之
5、間有差異.對于與0之間的差異可以有兩種不同的解釋.1 統(tǒng)計假設(shè)H0是正確的,即=0=0.5,只是由于抽樣的隨機性造成了與0之間的差異;2 統(tǒng)計假設(shè)H0是不正確的,即0=0.5,由于系統(tǒng)誤差,也就是包裝機工作不正常,造成了與0之間的差異.對于這兩種解釋到底哪一種比較合理呢?為了答復(fù)這個問題,我們適中選擇一個小正數(shù)=0.1,0.05等,叫做顯著性程度Level of significance.在假設(shè)H0成立的條件下,確定統(tǒng)計量 -0的臨界值,使得事件-0為小概率事件,即P-0=.8.1例如,取定顯著性程度=0.05.如今來確定臨界值0.05.因為XN,2,當(dāng)H0:=0=0.5為真時,有XN0,2,
6、于是,Z=N0,1,所以 PZz/2=.由8.1式,有=,因此0.05=z0.025×=1.96×0.015/3=0.0098.故有P-00.0098=0.05.因為=0.05很小,根據(jù)實際推斷原理,即“小概率事件在一次試驗中幾乎是不可能發(fā)生的原理,我們認(rèn)為當(dāng)H0為真時,事件-00.0098是小概率事件,實際上是不可能發(fā)生的.如今抽樣的結(jié)果是-0=0.5110-0.5=0.01100.0098.也就是說,小概率事件-00.0098居然在一次抽樣中發(fā)生了,這說明抽樣得到的結(jié)果與假設(shè)H0不相符,因此不能不使人疑心假設(shè)H0的正確性,所以在顯著性程度=0.05下, 我們回絕H0,承
7、受H1,即認(rèn)為這一天包裝機的工作是不正常的.通過上例的分析,我們知道假設(shè)檢驗的根本思想是小概率事件原理,檢驗的根本步驟是:1 根據(jù)實際問題的要求,提出原假設(shè)H0及備擇假設(shè)H1;2 選取適當(dāng)?shù)娘@著性程度通常=0.10,0.05等以及樣本容量n;3 構(gòu)造檢驗用的統(tǒng)計量U,當(dāng)H0為真時,U的分布要,找出臨界值使PU=.我們稱U所確定的區(qū)域為H0的回絕域Rejection region,記作W;4 取樣,根據(jù)樣本觀察值,計算統(tǒng)計量U的觀察值U0;5 作出判斷,將U的觀察值U0與臨界值比較,假設(shè)U0落入回絕域W內(nèi),那么回絕H0承受H1;否那么就說H0相容承受H0.3.兩類錯誤由于我們是根據(jù)樣本作出承受H
8、0或回絕H0的決定,而樣本具有隨機性,因此在進(jìn)展判斷時,我們可能會犯兩個方面的錯誤:一類錯誤是,當(dāng)H0為真時,而樣本的觀察值U0落入回絕域W中,按給定的法那么,我們回絕了H0,這種錯誤稱為第一類錯誤.其發(fā)生的概率稱為犯第一類錯誤的概率或稱棄真概率,通常記為,即P回絕H0H0為真=;另一種錯誤是,當(dāng)H0不真時,而樣本的觀察值落入回絕域W之外,按給定的檢驗法那么,我們卻承受了H0.這種錯誤稱為第二類錯誤,其發(fā)生的概率稱為犯第二類錯誤的概率或取偽概率,通常記為,即P承受H0H0不真=.顯然這里的就是檢驗的顯著性程度.總體與樣本各種情況的搭配見表8-1.表8-1H0判斷結(jié)論犯錯誤的概率真承受正確0回絕
9、犯第一類錯誤假承受犯第二類錯誤回絕正確0對給定的一對H0和H1,總可以找到許多回絕域W.當(dāng)然我們希望尋找這樣的回絕域W,使得犯兩類錯誤的概率與都很小.但是在樣本容量n固定時,要使與都很小是不可能的,一般情形下,減小犯其中一類錯誤的概率,會增加犯另一類錯誤的概率,它們之間的關(guān)系猶如區(qū)間估計問題中置信程度與置信區(qū)間的長度的關(guān)系那樣.通常的做法是控制犯第一類錯誤的概率不超過某個事先指定的顯著性程度01,而使犯第二類錯誤的概率也盡可能地小.詳細(xì)實行這個原那么會有許多困難,因此有時把這個原那么簡化成只要求犯第一類錯誤的概率等于,稱這類假設(shè)檢驗問題為顯著性檢驗問題,相應(yīng)的檢驗為顯著性檢驗.在一般情況下,顯
10、著性檢驗法那么是較容易找到的,我們將在以下各節(jié)中詳細(xì)討論.在實際問題中,要確定一個檢驗問題的原假設(shè),一方面要根據(jù)問題要求檢驗的是什么,另一方面要使原假設(shè)盡量簡單,這是因為在下面將講到的檢驗法中,必需要理解某統(tǒng)計量在原假設(shè)成立時的準(zhǔn)確分布或漸近分布.下面各節(jié)中,我們先介紹正態(tài)總體下參數(shù)的幾種顯著性檢驗,再介紹總體分布函數(shù)的假設(shè)檢驗.第二節(jié) 單個正態(tài)總體的假設(shè)檢驗1.單個正態(tài)總體數(shù)學(xué)期望的假設(shè)檢驗1 2關(guān)于的假設(shè)檢驗Z檢驗法Z-test設(shè)總體XN,2,方差2,檢驗假設(shè)H0:=0;H1:0 0為常數(shù)由N,N0,1,我們選取Z= 8.2作為此假設(shè)檢驗的統(tǒng)計量,顯然當(dāng)假設(shè)H0為真即=0正確時,ZN0,1
11、,所以對于給定的顯著性程度,可求z/2使PZz/2=,見圖8-1,即PZ-z/2+PZz/2=.從而有PZz/2=/2,PZz/2=1-/2.圖8-1利用概率1-/2,反查標(biāo)準(zhǔn)正態(tài)分布函數(shù)表,得雙側(cè)分位點即臨界值z/2.另一方面,利用樣本觀察值x1,x2,xn計算統(tǒng)計量Z的觀察值z0=. 8.3假設(shè):az0z/2,那么在顯著性程度下,回絕原假設(shè)H0承受備擇假設(shè)H1,所以z0z/2便是H0的回絕域.b z0z/2,那么在顯著性程度下,承受原假設(shè)H0,認(rèn)為H0正確.這里我們是利用H0為真時服從N0,1分布的統(tǒng)計量Z來確定回絕域的,這種檢驗法稱為Z檢驗法或稱U檢驗法.例8.1中所用的方法就是Z檢驗法
12、.為了熟悉這類假設(shè)檢驗的詳細(xì)作法,如今我們再舉一例.例8.2 根據(jù)長期經(jīng)歷和資料的分析,某磚廠消費的磚的“抗斷強度X服從正態(tài)分布,方差2=1.21.從該廠產(chǎn)品中隨機抽取6塊,測得抗斷強度如下單位:kg·cm-2:32.56 29.66 31.64 30.00 31.87 31.03檢驗這批磚的平均抗斷強度為32.50kg·cm-2是否成立取=0.05,并假設(shè)磚的抗斷強度的方差不會有什么變化?解 提出假設(shè)H0:=0=32.50;H1:0. 選取統(tǒng)計量Z=,假設(shè)H0為真,那么ZN0,1. 對給定的顯著性程度=0.05,求z/2使PZz/2=,這里z/2=z0.025=1.96.
13、 計算統(tǒng)計量Z的觀察值:z0= =3.05. 判斷:由于z0=3.05z0.025=1.96,所以在顯著性程度=0.05下否認(rèn)H0,即不能認(rèn)為這批產(chǎn)品的平均抗斷強度是32.50 kg·cm-2.把上面的檢驗過程加以概括,得到了關(guān)于方差的正態(tài)總體期望值的檢驗步驟:a 提出待檢驗的假設(shè)H0:=0;H1:0.b 構(gòu)造統(tǒng)計量Z,并計算其觀察值z0:Z=,z0=.c 對給定的顯著性程度,根據(jù)PZz/2=,PZz/2=/2,PZz/2=1-/2查標(biāo)準(zhǔn)正態(tài)分布表,得雙側(cè)分位點z/2.d 作出判斷:根據(jù)H0的回絕域假設(shè)z0z/2,那么回絕H0,承受H1;假設(shè)z0z/2,那么承受H0.2 方差2未知,
14、檢驗t檢驗法t-test設(shè)總體XN,2,方差2未知,檢驗H0:=0;H1:0.由于2未知,便不是統(tǒng)計量,這時我們自然想到用2的無偏估計量樣本方差S2代替2,由于tn-1,應(yīng)選取樣本的函數(shù)t= 8.4圖8-2作為統(tǒng)計量,當(dāng)H0為真=0時ttn-1,對給定的檢驗顯著性程度,由Ptt/2n-1=,Ptt/2n-1=/2,見圖8-2,直接查t分布表,得t分布分位點t/2n-1.利用樣本觀察值,計算統(tǒng)計量t的觀察值t0=,因此原假設(shè)H0的回絕域為t0=t/2n-1. 8.5所以,假設(shè)t0t/2n-1,那么回絕H0,承受H1;假設(shè)t0t/2n-1,那么承受原假設(shè)H0.上述利用t統(tǒng)計量得出的檢驗法稱為t檢驗
15、法.在實際中,正態(tài)總體的方差常為未知,所以我們常用t檢驗法來檢驗關(guān)于正態(tài)總體均值的問題.例8.3 用某儀器間接測量溫度,重復(fù)5次,所得的數(shù)據(jù)是1250°,1265°,1245°,1260°,1275°,而用別的準(zhǔn)確方法測得溫度為1277°可看作溫度的真值,試問此儀器間接測量有無系統(tǒng)偏向?這里假設(shè)測量值X服從N,2分布.解 問題是要檢驗H0:=0=1277;H1:0.由于2未知即儀器的精度不知道,我們選取統(tǒng)計量t=.當(dāng)H0為真時,ttn-1,t的觀察值為t0=3.對于給定的檢驗程度=0.05,由Ptt/2n-1=,Ptt/2n-1=/2
16、,Ptt0.0254=0.025,查t分布表得雙側(cè)分位點t/2n-1=t0.0254=2.776.因為t03t0.0254=2.776,故應(yīng)回絕H0,認(rèn)為該儀器間接測量有系統(tǒng)偏向.3 雙邊檢驗與單邊檢驗上面討論的假設(shè)檢驗中,H0為=0,而備擇假設(shè)H1:0意思是可能大于0,也可能小于0,稱為雙邊備擇假設(shè),而稱形如H0:=0,H1:0的假設(shè)檢驗為雙邊檢驗.有時我們只關(guān)心總體均值是否增大,例如,試驗新工藝以進(jìn)步材料的強度,這時所考慮的總體的均值應(yīng)該越大越好,假設(shè)我們能判斷在新工藝下總體均值較以往正常消費的大,那么可考慮采用新工藝.此時,我們需要檢驗假設(shè)H0:=0;H1:0. 8.6我們在這里作了不言
17、而喻的假定,即新工藝不可能比舊的更差,形如8.6的假設(shè)檢驗,稱為右邊檢驗,類似地,有時我們需要檢驗假設(shè)H0:=0;H1:0. 8.7形如8.7的假設(shè)檢驗,稱為左邊檢驗,右邊檢驗與左邊檢驗統(tǒng)稱為單邊檢驗.下面來討論單邊檢驗的回絕域.設(shè)總體XN,2,2為,x1,x2,xn是來自X的樣本觀察值.給定顯著性程度,我們先求檢驗問題H0:=0;H1:0.的回絕域.取檢驗統(tǒng)計量Z=,當(dāng)H0為真時,Z不應(yīng)太大,而在H1為真時,由于X是的無偏估計,當(dāng)偏大時,X也偏大,從而Z往往偏大,因此回絕域的形式為Z=k,k待定.因為當(dāng)H0為真時,N0,1,由P回絕H0H0為真=P=得k=z,故回絕域為Z=z. 8.8類似地
18、,左邊檢驗問題H0:=0;H1:0.的回絕域為Z=-z. 8.9例8.4 從甲地發(fā)送一個信號到乙地,設(shè)發(fā)送的信號值為,由于信號傳送時有噪聲迭加到信號上,這個噪聲是隨機的,它服從正態(tài)分布N0,22,從而乙地接到的信號值是一個服從正態(tài)分布N,22的隨機變量.設(shè)甲地發(fā)送某信號5次,乙地收到的信號值為:8.4 10.5 9.1 9.6 9.9由以往經(jīng)歷,信號值為8,于是乙方猜測甲地發(fā)送的信號值為8,能否承受這種猜測?取=0.05.解 按題意需檢驗假設(shè)H0:=8;H1:8.這是右邊檢驗問題,其回絕域如8.8式所示,即 Z= z0.05=1.645.而如今z0=1.681.645,所以回絕H0,認(rèn)為發(fā)出的
19、信號值8.2.單個正態(tài)總體方差的假設(shè)檢驗檢驗法-test1 雙邊檢驗設(shè)總體XN,2,未知,檢驗假設(shè)H0:2=02;H1:202.其中02為常數(shù).由于樣本方差S2是2的無偏估計,當(dāng)H0為真時,比值一般來說應(yīng)在1附近擺動,而不應(yīng)過分大于1或過分小于1,由第六章知當(dāng)H0為真時=n-1. 8.10所以對于給定的顯著性程度有圖8-3圖8-3Pn-1n-1=1-. 8.11對于給定的,查分布表可求得分布分位點n-1與n-1.由8.11知,H0的承受域是 n-1 n-1; 8.12H0的回絕域為n-1或n-1. 8.13這種用服從分布的統(tǒng)計量對個單正態(tài)總體方差進(jìn)展假設(shè)檢驗的方法,稱為檢驗法.例8.5 某廠消
20、費的某種型號的電池,其壽命長期以來服從方差2=5000小時2的正態(tài)分布,現(xiàn)有一批這種電池,從它的消費情況來看,壽命的波動性有所改變,現(xiàn)隨機抽取26只電池,測得其壽命的樣本方差s2=9200小時2.問根據(jù)這一數(shù)據(jù)能否推斷這批電池的壽命的波動性較以往有顯著的變化取=0.02?解 此題要求在=0.02下檢驗假設(shè)H0:2=5000;H1:25000.如今n=26,n-1=44.314, n-1= =11.524,02=5000.由8.13回絕域為44.314或11.524由觀察值s2=9200得=4644.314,所以回絕H0,認(rèn)為這批電池壽命的波動性較以往有顯著的變化.2 單邊檢驗右檢驗或左檢驗設(shè)總
21、體XN,2,未知,檢驗假設(shè)H0:202;H1:202.右檢驗由于XN,2,故隨機變量=n-1.當(dāng)H0為真時,統(tǒng)計量=.對于顯著性程度,有Pn-1=圖8-4圖8-4.于是有Pn-1Pn-1=.可見,當(dāng)很小時,n-1是小概率事件,在一次的抽樣中認(rèn)為不可能發(fā)生,所以H0的回絕域是:=n-1右檢驗. 8.14類似地,可得左檢驗假設(shè)H0:202,H1:202的回絕域為n-1左檢驗. 8.15例8.6 今進(jìn)展某項工藝革新,從革新后的產(chǎn)品中抽取25個零件,測量其直徑,計算得樣本方差為s2=0.00066,革新前零件直徑的方差2=0.0012,設(shè)零件直徑服從正態(tài)分布,問革新后消費的零件直徑的方差是否顯著減小?
22、=0.05解 1 提出假設(shè)H0:202=0.0012;H1:2<02.2 選取統(tǒng)計量=.=n-1,且當(dāng)H0為真時,3 對于顯著性程度=0.05,查分布表得n-1=13.848,當(dāng)H0為真時,P< n-1P=.故回絕域為< n-1=13.848.4 根據(jù)樣本觀察值計算的觀察值=13.2.5 作判斷:由于=13.2 n-1=13.848,即落入回絕域中,所以回絕H0:202,即認(rèn)為革新后消費的零件直徑的方差小于革新前消費的零件直徑的方差.最后我們指出,以上討論的是在均值未知的情況下,對方差的假設(shè)檢驗,這種情況在實際問題中較多.至于均值的情況下,對方差的假設(shè)檢驗,其方法類似,只是所
23、選的統(tǒng)計量為=.當(dāng)2=02為真時,n.關(guān)于單個正態(tài)總體的假設(shè)檢驗可列表8-2.表8-2檢驗參數(shù)條件H0H1H0的回絕域檢驗用的統(tǒng)計量自由度分位點數(shù)學(xué)期望2已知=000000|Z|z/2ZzZ-zZ=±z/2z-z2未知=000000tt/2ttt-tt=n-1±t/2t-t方差未知2=02202202202202202=n-1已知2=02202202202202202=n注:上表中H0中的不等號改成等號,所得的回絕域不變.第三節(jié) 兩個正態(tài)總體的假設(shè)檢驗上一節(jié)介紹了單個正態(tài)總體的數(shù)學(xué)期望與方差的檢驗問題,在實際工作中還常碰到兩個正態(tài)總體的比較問題.1.兩正態(tài)總體數(shù)學(xué)期望假設(shè)檢
24、驗1 方差,關(guān)于數(shù)學(xué)期望的假設(shè)檢驗Z檢驗法設(shè)XN1,12,YN2,22,且X,Y互相獨立,12與22,要檢驗的是H0:1=2;H1:12.雙邊檢驗怎樣尋找檢驗用的統(tǒng)計量呢?從總體X與Y中分別抽取容量為n1,n2的樣本X1,X2,及Y1,Y2,由于,E-=E-E=1-2,D-=D+D=,故隨機變量-也服從正態(tài)分布,即-N1-2,.從而N0,1.于是我們按如下步驟判斷.a 選取統(tǒng)計量 Z=, 8.16當(dāng)H0為真時,ZN0,1.b 對于給定的顯著性程度,查標(biāo)準(zhǔn)正態(tài)分布表求z/2使PZz/2=,或PZz/2=1-/2. 8.17c 由兩個樣本觀察值計算Z的觀察值z0:z0=.d 作出判斷:假設(shè)z0z/
25、2,那么回絕假設(shè)H0,承受H1;假設(shè)z0z/2,那么與H0相容,可以承受H0.例8.7 A,B兩臺車床加工同一種軸,如今要測量軸的橢圓度.設(shè)A車床加工的軸的橢圓度XN1,12,B車床加工的軸的橢圓度YN2,22,且12=0.0006mm2,22=0.0038mm2,現(xiàn)從A,B兩臺車床加工的軸中分別測量了n1=200,n2=150根軸的橢圓度,并計算得樣本均值分別為=0.081mm,=0.060mm.試問這兩臺車床加工的軸的橢圓度是否有顯著性差異?給定=0.05解 提出假設(shè)H0:1=2;H1:12. 選取統(tǒng)計量Z=,在H0為真時,ZN0,1. 給定=0.05,因為是雙邊檢驗,/2=0.025.P
26、Zz/2=0.05, PZz/2=0.025,PZz/2=1-0.025=0.975.查標(biāo)準(zhǔn)正態(tài)分布表,得z/2=z0.025=1.96. 計算統(tǒng)計量Z的觀察值zz0=3.95. 作判斷:由于z0=3.951.96=z/2,故回絕H0,即在顯著性程度=0.05下,認(rèn)為兩臺車床加工的軸的橢圓度有顯著差異.用Z檢驗法對兩正態(tài)總體的均值作假設(shè)檢驗時,必須知道總體的方差,但在許多實際問題中總體方差12與22往往是未知的,這時只能用如下的t檢驗法.2 方差12,22未知,關(guān)于均值的假設(shè)檢驗t檢驗法設(shè)兩正態(tài)總體X與Y互相獨立,XN1,12,YN2,22,12,22未知,但知12=22,檢驗假設(shè)H0:1=2
27、;H1:12.雙邊檢驗從總體X,Y中分別抽取樣本X1,X2,與Y1,Y2,那么隨機變量t=tn1+n2-2,式中Sw2=,S12,S22分別是X與Y的樣本方差.當(dāng)假設(shè)H0為真時,統(tǒng)計量t= tn1+n2-2. 8.18對給定的顯著性程度,查t分布得t/2n1+n2-2,使得Ptt/2n1+n2-2=. 8.19再由樣本觀察值計算t的觀察值t0=, 8.20最后作出判斷:假設(shè)t0t/2n1+n2-2,那么回絕H0;假設(shè)t0t/2n1+n2-2,那么承受H0.例8.8 在一臺自動車床上加工直徑為2.050毫米的軸,如今每相隔兩小時,各取容量都為10的樣本,所得數(shù)據(jù)列表如表8-3所示.表8-3零件加
28、工編號12345678910第一個樣本2.0662.0632.0682.0602.0672.0632.0592.0622.0622.060第二個樣本2.0632.0602.0572.0562.0592.0582.0622.0592.0592.057假設(shè)直徑的分布是正態(tài)的,由于樣本是取自同一臺車床,可以認(rèn)為12=22=2,而2是未知常數(shù).問這臺自動車床的工作是否穩(wěn)定?取=0.01解 這里實際上是12=22=2,但2未知的情況下檢驗假設(shè)H0:1=2;H1:12.我們用t檢驗法,由樣本觀察值算得:=2.063, =2.059,s12=0.00000956, s22=0.00000489,sw2=0.
29、0000072.由8.20式計算得t0=3.3.對于=0.01,查自由度為18的t分布表得t0.00518=2.878.由于t0=3.3t0.00518=2.878,于是回絕原假設(shè)H0:1=2.這說明兩個樣本在消費上是有差異的,可能這臺自動車床受時間的影響而消費不穩(wěn)定.2. 兩正態(tài)總體方差的假設(shè)檢驗F檢驗法F-test1 雙邊檢驗設(shè)兩正態(tài)總體XN1,12,YN2,22,X與Y獨立,X1,X2,與Y1,Y2,分別是來自這兩個總體的樣本,且1與2未知.如今要檢驗假設(shè)H0:12=22;H1:1222.在原假設(shè)H0成立下,兩個樣本方差的比應(yīng)該在1附近隨機地擺動,所以這個比不能太大又不能太小.于是我們選
30、取統(tǒng)計量F=. 8.21顯然,只有當(dāng)F接近1時,才認(rèn)為有12=22.由于隨機變量F*= Fn1-1,n2-1,所以當(dāng)假設(shè)H0:12=22成立時,統(tǒng)計量F= Fn1-1,n2-1.對于給定的顯著性程度,可以由F分布表求得臨界值n1-1,n2-1與F/2n1-1,n2-1使得 P n1-1,n2-1FF/2n1-1,n2-1=1-圖8-5,由此可知H0的承受區(qū)域是n1-1,n2-1FF/2n1-1,n2-1;而H0的回絕域為Fn1-1,n2-1,或 FF/2n1-1,n2-1.然后,根據(jù)樣本觀察值計算統(tǒng)計量F的觀察值,假設(shè)F的觀察值落在回絕域中,那么回絕H0,承受H1;假設(shè)F的觀察值落在承受域中,
31、那么承受H0.圖8-5例8.9 在例8.8中我們認(rèn)為兩個總體的方差12=22,它們是否真的相等呢?為此我們來檢驗假設(shè)H0:12=22給定=0.1.解 這里n1=n2=10,s12=0.00000956,s22=0.00000489,于是統(tǒng)計量F的觀察值為F=0.00000956/0.00000489=1.95.查F分布表得F/2n1-1,n2-1=F0.059,9=3.18,F(xiàn)1-/2n1-1,n2-1=F0.959,9=1/F0.059,9=1/3.18.由樣本觀察值算出的F滿足F0.959,9=1/3.18F=1.953.18=F0.059,9.可見它不落入回絕域,因此不能回絕原假設(shè)H0:
32、12=22,從而認(rèn)為兩個總體的方差無顯著差異.注意:在1與2時,要檢驗假設(shè)H0:12=22,其檢驗方法類同均值未知的情況,此時所采用的檢驗統(tǒng)計量是:F=Fn1,n2.其回絕域參看表8-4.表8-4檢驗參數(shù)條件H0H1H0的回絕域檢驗用的統(tǒng)計量自由度分位點均值12,22已知1=21212121212|Z|z/2ZzZ-zZ=±z/2z-z12,22未知12=221=21212121212tt/2ttt-tt=n1+n2-2±t/2t-t方差1,2未知12=2212221222122212221222FF/2或FF1-/2FFFF1-F=n1-1,n2-1F/2或F1-/2FF
33、F1-1,2已知12=221222122122212221222FF/2或FF1-/2FFFF1-F=n1,n2F/2或F1-/2FFF1- 2 單邊檢驗可作類似的討論,限于篇幅,這里不作介紹了.第四節(jié) 總體分布函數(shù)的假設(shè)檢驗上兩節(jié)中,我們在總體分布形式為的前提下,討論了參數(shù)的檢驗問題.然而在實際問題中,有時不能確知總體服從什么類型的分布,此時就要根據(jù)樣本來檢驗關(guān)于總體分布的假設(shè).例如檢驗假設(shè):“總體服從正態(tài)分布等.本節(jié)僅介紹檢驗法.所謂檢驗法是在總體的分布為未知時,根據(jù)樣本值x1,x2,xn來檢驗關(guān)于總體分布的假設(shè)H0:總體X的分布函數(shù)為Fx;H1:總體X的分布函數(shù)不是Fx 8.22的一種方
34、法這里的備擇假設(shè)H1可不必寫出.注意,假設(shè)總體X為離散型,那么假設(shè)8.22相當(dāng)于H0:總體X的分布律為PX=xi=pi,i=1,2,;8.23假設(shè)總體X為連續(xù)型,那么假設(shè)8.22相當(dāng)于H0:總體X的概率密度為fx. 8.24在用檢驗法檢驗假設(shè)H0時,假設(shè)在假設(shè)H0下Fx的形式,而其參數(shù)值未知,此時需先用極大似然估計法估計參數(shù),然后再作檢驗.檢驗法的根本思想與方法如下:1 將隨機試驗可能結(jié)果的全體分為k個互不相容的事件A1,A2,Ak=,AiAj=Æ,ij;i,j=1,2,k,于是在H0為真時,可以計算概率=PAii=1,2,k.2 尋找用于檢驗的統(tǒng)計量及相應(yīng)的分布,在n次試驗中,事件
35、Ai出現(xiàn)的頻率與概率往往有差異,但由大數(shù)定律可以知道,假設(shè)樣本容量n較大一般要求n至少為50,最好在100以上,在H0成立條件下的值應(yīng)該比較小,基于這種想法,皮爾遜使用= 8.25作為檢驗H0的統(tǒng)計量,并證明了如下的定理.定理8.1 假設(shè)n充分大n50,那么當(dāng)H0為真時不管H0中的分布屬什么分布,統(tǒng)計量8.25總是近似地服從自由度為k-r-1的分布,其中r是被估計的參數(shù)的個數(shù).3 對于給定的檢驗程度,查表確定臨界值使P=,從而得到H0的回絕域為.4由樣本值x1,x2,xn計算的值,并與比較.5 作結(jié)論:假設(shè),那么回絕H0,即不能認(rèn)為總體分布函數(shù)為Fx;否那么承受H0.例8.10 一本書的一頁中
36、印刷錯誤的個數(shù)X是一個隨機變量,現(xiàn)檢查了一本書的100頁,記錄每頁中印刷錯誤的個數(shù),其結(jié)果如表8-5所示.表8-5錯誤個數(shù)i01234567頁數(shù)fi36401920210AiA 0A 1A 2A 3A 4A 5A 6A7其中fi是觀察到有i個錯誤的頁數(shù).問能否認(rèn)為一頁書中的錯誤個數(shù)X服從泊松分布取=0.05?解 由題意首先提出假設(shè):H0:總體X服從泊松分布.PX=i=,i=0,1,2,這里H0中參數(shù)為未知,所以需先來估計參數(shù).由最大似然估計法得=1.將試驗結(jié)果的全體分為A0,A1,A7兩兩不相容的事件.假設(shè)H0為真,那么PX=i有估計,i=0,1,2,.例如計算結(jié)果如表8-6所示.將其中有些n
37、pi5的組予以適當(dāng)合并,使新的每一組內(nèi)有npi5,如表8-6所示,此處并組后k=4,但因在計算概率時,估計了一個未知參數(shù),故計算結(jié)果為=1.460表8-6.因為=5.9911.46,所以在顯著性程度為0.05下承受H0,即認(rèn)為總體服從泊松分布.表8-6AifiA036e-136.788-0.7880.017A140e-136.7883.2120.280A219e-1/218.3940.6060.020A3A4A5A6A720210e-1/6e-1/24e-1/120e-1/7206.1311.5330.3070.0510.008-3.031.1431.460例8.11 研究混凝土抗壓強度的分布
38、.200件混凝土制件的抗壓強度以分組形式列出表8-7.n=200.要求在給定的檢驗程度=0.05下檢驗假設(shè)H0:抗壓強度XN,2.表8-7壓強區(qū)間×98kPa頻數(shù)fi190200102002102621022056220230642302403024025014解 原假設(shè)所定的正態(tài)分布的參數(shù)是未知的,我們需先求與2的極大似然估計值.由第七章知,與2的極大似然估計值為,.設(shè)為第i組的組中值,我們有=221,=152,=12.33.原假設(shè)H0改寫成X是正態(tài)N221,12.332分布,計算每個區(qū)間的理論概率值, i=1,2,6,其中,.為了計算出統(tǒng)計量之值,我們把需要進(jìn)展的計算列表如下表8
39、-8.表8-8壓強區(qū)間X頻數(shù)fi標(biāo)準(zhǔn)化區(qū)間i,i+119020010-,-1.700.045910.1120021026-1.70,-0.890.14228.45.760.2021022056-0.89,-0.080.28156.20.040.0022023064-0.08,0.730.29959.817.640.29230240300.73,1.540.17134.217.640.52240250141.54,+0.06212.42.560.231.0002001.35從上面計算得出的觀察值為1.35.在檢驗程度=0.05下,查自由度m=6-2-1=3的分布表,得到臨界值=7.815.由于=
40、1.357.815=,不能回絕原假設(shè),所以認(rèn)為混凝土制件的抗壓強度的分布是正態(tài)分布N221,152.小 結(jié)有關(guān)總體分布的未知參數(shù)或未知分布形式的種種論斷叫做統(tǒng)計假設(shè).一般統(tǒng)計假設(shè)分為原假設(shè)H0在實際問題中至關(guān)重要的假設(shè)及與原假設(shè)H0對立假設(shè)即是備擇假設(shè)H1.假設(shè)檢驗就是人們根據(jù)樣本提供的信息作出“承受H0、回絕H1或“回絕H0、承受H1的判斷.假設(shè)檢驗的思想是小概率原理,即小概率事件在一次試驗中幾乎不會發(fā)生.這種原理是人們處理實際問題中公認(rèn)的原那么.由于樣本的隨機性,當(dāng)H0為真時,我們可能會作出回絕H0、承受H1的錯誤判斷棄真錯誤或當(dāng)H0不真時,我們可能會作出承受H0、回絕H1的錯誤判斷取偽錯
41、誤.假設(shè)檢驗的兩類錯誤真實情況未知所作決策承受H0回絕H0H0為真正確犯第一類錯誤H0不真犯第二類錯誤正確當(dāng)樣本容量n固定時,我們無法同時控制犯二類錯誤,即減小犯第一類錯誤的概率,就會增大犯第二類錯誤的概率,反之亦然.在假設(shè)檢驗中我們主要控制減小犯第一類錯誤的概率.使P回絕H0|H0為真,其中很小.0<<1,稱為檢驗的顯著性程度,這種只對犯第一類錯誤的概率加以控制而不考慮犯第二類錯誤的概率的檢驗稱為顯著性假設(shè)檢驗.單個、兩個正態(tài)總體的均值、方差的假設(shè)檢驗是本章重點問題,讀者需掌握Z檢驗法、檢驗法、t檢驗法等.這些檢驗法中原假設(shè)H0備擇假設(shè)H1及H0的回絕域分別見表8-2、表8-4. 重要術(shù)語及主題原假設(shè) 備擇假設(shè) 檢驗統(tǒng)計量 單邊檢驗 雙邊檢驗顯著性程度 回絕域 顯著性檢驗 一個正態(tài)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 羊只飼養(yǎng)與疫病防控策略考核試卷
- 建筑物節(jié)能環(huán)保技術(shù)考核試卷
- 租賃合同的設(shè)計與租賃結(jié)構(gòu)優(yōu)化考核試卷
- 航運物流與自然災(zāi)害應(yīng)對考核試卷
- 糧油市場新消費趨勢與產(chǎn)品創(chuàng)新考核試卷
- 珠寶首飾工藝技術(shù)創(chuàng)新與發(fā)展考核試卷
- 機器人運動控制與平衡調(diào)節(jié)考核試卷
- 航班乘客安全須知考核試卷
- 能效對標(biāo)與節(jié)能技術(shù)改進(jìn)考核試卷
- 生態(tài)環(huán)境保護(hù)法律咨詢考核試卷
- GA/T 751-2024公安視頻圖像屏幕顯示信息疊加規(guī)范
- 漢語方言與地方文化認(rèn)同的關(guān)系研究論文
- 2024年全國統(tǒng)一高考英語試卷(新課標(biāo)Ⅰ卷)含答案
- 2023學(xué)生食堂管理制度
- GB/T 7134-2008澆鑄型工業(yè)有機玻璃板材
- 工程竣工驗收報告及五方驗收表
- 部編版語文六年級下冊第四單元 復(fù)習(xí)課件
- 常用試敏藥品操作規(guī)程表
- 022旋翼干式塑料表殼水表
- 特殊旅客的航空服務(wù)文獻(xiàn)綜述
- 實驗?zāi)J絼游锇唏R魚左正宏
評論
0/150
提交評論