第7章假設檢驗_第1頁
第7章假設檢驗_第2頁
第7章假設檢驗_第3頁
第7章假設檢驗_第4頁
第7章假設檢驗_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第七章假設檢驗內容提要本章主要講述假設檢驗思想概述;正態(tài)總體參數(shù)檢驗(u檢驗,t檢驗,X2檢驗和F檢驗);非正態(tài)總體參數(shù)檢驗(非正態(tài)總體均值檢驗的大樣本方法,指數(shù)總體的參數(shù)檢驗);檢驗的實際意義及兩類錯誤(檢驗結果的實際意義,檢驗中的兩類錯誤,樣本容量確定問題)等內容.重點分析1、理解假設檢驗的基本思想,掌握假設檢驗的基本步驟,了解假設檢驗可能產生的兩類錯誤。2、了解單個和兩個正態(tài)總體的均值與方差的假設檢驗。3、了解總體分布假設的X2檢驗法。難點分析假設檢驗的基本思想、基本步驟及假設檢驗可能產生的兩類錯誤。習題布置習題7(1,3,5,7,10,13,16,18)備注#教學內容(Contents)ChapterSeven假設檢驗(HypothesisTests)§7.1假設檢驗思想概述(SummaryofHypothesisTestIdea)前一章講了對總體參數(shù)的估計問題,即是對樣本進行適當?shù)募庸ぃ酝茢喑鰠?shù)的值(或置信區(qū)間)。本章介紹的假設檢驗,是另一大類統(tǒng)計推斷問題。它是先假設總體具有某種特征(例如總體的參數(shù)為多少),然后再通過對樣本的加工,即構造統(tǒng)計量,推斷出假設的結論是否合理。從純粹邏輯上考慮,似乎對參數(shù)的估計與對參數(shù)的檢驗不應有實質性的差別,猶如說:“求某方程的根”與“驗證某數(shù)是否是某方程的根”這兩個問題不會得出矛盾的結論一樣。但從統(tǒng)計的角度看估計和檢驗,這兩種統(tǒng)計推斷是不同的,它們不是簡單的“計算”和“驗算”的關系。假設檢驗有它獨特的統(tǒng)計思想,也就是說引入假設檢驗是完全必要的。我們來考慮下面的例子。某廠家向一百貨商店長期供應某種貨物,雙方根據廠家的傳統(tǒng)生產水平,定出質量標準,即若次品率超過3%,則百貨商店拒收該批貨物。今有一批貨物,隨機抽43件檢驗,發(fā)現(xiàn)有次品2件,問應如何處理這批貨物?如果雙方商定用點估計方法作為驗收方法,顯然2/43>3%,這批貨物是要被拒收的。但是廠家有理由反對用這種方法驗收。他們認為,由于抽樣是隨機的,在這次抽樣中,次品的頻率超過3%,不等于說這批產品的次品率p(概率)超過了3%.就如同說擲一枚錢幣,正反兩面出現(xiàn)的概率各為1/2,但若擲兩次錢幣,不見得正、反面正好各出現(xiàn)一次一樣。就是說,即使該批貨的次品率為3%,仍有很大的概率使得在抽檢43件貨物時出現(xiàn)2個以上的次品,因此需要用別的方法。如果百貨商店也希望在維護自己利益的前提下,不輕易地失去一個有信譽的貨源,也會同意采用別的更合理的方法。事實上,對于這類問題,通常就是采用假設檢驗的方法。具體來說就是先假設次品率P<3%,然后從抽樣的結果來說明P<3%這一假設是否合理。注意,這里用的是“合理”一詞,而不是“正確”,粗略地說就是“認為P<3%”能否說得過去。具體如何做,下面再說。還有一類問題實際上很難用參數(shù)估計的方法去解決。某研究所推出一種感冒特效新藥,為證明其療效,選擇200名患者為志愿者。將他們均分為兩組,分別不服藥或服藥,觀察三日后痊愈的情況,得出下列數(shù)據。,、是否痊愈服何種藥痊愈者未痊愈者合計未服藥者4852100服藥者5644100合計10496200問新藥是否確有明顯療效?這個問題就不存在估計什么的問題。從數(shù)據來看,新藥似乎有一定療效,但效果不明顯,服藥者在這次試驗中的情況比未服藥者好,完全可能是隨機因素造成的。對于新藥上市這樣關系到千萬人健康的事,一定要采取慎重的態(tài)度。這就需要用一種統(tǒng)計方法來檢驗藥效,假設檢驗就是在這種場合下的常用手段。具體來說,我們先不輕易地相信新藥的作用,因此可以提出假設“新藥無效”,除非抽樣結果顯著地說明這假設不合理,否則,將不能認為新藥有明顯的療效。這種提出假設然后做出否定或不否定的判斷通常稱為顯著性檢驗(Significancetest)。假設檢驗也可分為參數(shù)檢驗(Parametrictest)和非參數(shù)檢驗(Nonparametrictest)。當總體分布形式已知,只對某些參數(shù)做出假設,進而做出的檢驗為參數(shù)檢驗;對其它假設做出的檢驗為非參數(shù)檢驗。如例7.1中,總體是兩點分布,只需對參數(shù)P做出假設檢驗,這是參數(shù)檢驗問題,而例7.2則是非參數(shù)檢驗的問題。與估計問題稍不同的是,一般來說非參數(shù)檢驗同參數(shù)檢驗一樣,在實際中經常要用到,因此,我們準備花一定的篇幅分別加以介紹。無論是參數(shù)檢驗還是非參數(shù)檢驗,其原理和步驟都有共同的地方,我們將通過下面的例子來闡述假設檢驗的一般原理和步驟。據報載,某商店為搞促銷,對購買一定數(shù)額商品的顧客給予一次摸球中獎的機會,規(guī)定從裝有紅、綠兩色球各10個的暗箱中連續(xù)摸10次(摸后放回),若10次都是摸得綠球,則中大獎。某人按規(guī)則去摸10次,皆為綠球,商店認定此人作弊,拒付大獎,此人不服,最后引出官司。我們在此并不關心此人是否真正作弊,也不關心官司的最后結果,但從統(tǒng)計的觀點看,商店的懷疑是有道理的。因為,如果此人摸球完全是隨機的,則要正好在10次摸球中均摸到綠球的概率為(2)10=-1-綠球的概率為(2)1024生的事件不應該是小概率事件?,F(xiàn)在既然這樣小概率的事件發(fā)生了,就應當推測出此人摸球不是隨機的,換句話說有作弊之嫌。上述的這一推斷,實際上就是假設檢驗的全部過程。它一般包含了這么幾步:提出假設,抽樣,并對樣本進行加工(構造統(tǒng)計量),定出一個合理性界限,得出假設是否合理的結論。為了便于操作,我們將結合例7.3,把這一過程步驟表述得更加形式化一點。這里要說明一點的是所謂“小概率事件”。究竟多大概率為小概率事件?在一個問題中,通常是指定一個正數(shù)a,0<a<1,認為概率不超過a的事件是在一次試驗中不會發(fā)生的事件,這個a稱為顯著性水平(Levelofsignificance)。對于實際問題應根據不同的需要和側重,指定不同的顯著性水平。但為了制表方便,通??蛇x取a=0.01,0.05,0.10等。下面我們用假設檢驗的語言來模擬商店的推斷:10提出假設:H:此人未作弊;H:此人作弊。01這里H0稱為原假設(Nullhypothesis),H]稱為備選假設(Alternativehypothesis)或對立假設(Oppositehypothesis),備選假設也可以不寫。20構造統(tǒng)計量,并由樣本算出其具體值:統(tǒng)計量取為10次模球中摸中綠球的個數(shù)N.由抽樣結果算出N=10.30求出在H下,統(tǒng)計量N的分布,構造對H不利的小概率事件:00易知,在H0下,即如果此人是完全隨機地摸球的話,統(tǒng)計量N服從二項分布B(10,1/2).其分布列為p=Ck(1)io,k=0,1,2,A,10.那么此人摸到的綠球數(shù)應該在平均數(shù)5k102個附近,所以對H不利的小概率事件是:“綠球數(shù)N大于某個較大的數(shù),或小于某個較小的0數(shù)?!痹诖藛栴}中,若此H0不成立,即此人作弊的話,不可能故意少摸綠球,因此只需考慮事件“N大于某個較大的數(shù)”,這個數(shù)常稱為臨界值,即某個分位數(shù)。40給定顯著性水平a,確定臨界值:即取一數(shù)n(a)使得p{N>n(a)}=a.如取a=0.01,由分布列算出:p=1/1024氏0.001,p=10/1024氏0.01,p+p氏0.011.10 9 9 10對于這種離散型概率分布,不一定能取到n(a).取最接近的n,使當H成立時,0P{N>n}<a,因此n=9,即該小概率事件是{N>9}.50得出結論:已算得N=10,即{N>9}發(fā)生了,而{N>9}被視為對H0不利的小概率事件,它在一次試驗中是不應該發(fā)生的,現(xiàn)在{N>9}居然發(fā)生了,只能認為H是不成立的,即H:“此01

人作弊”成立。這一推斷過程,也是假設檢驗的一般步驟,在這些步驟中,關鍵的技術問題是確定一個適當?shù)挠靡詸z驗假設的統(tǒng)計量,這個統(tǒng)計量至少應該滿足在H0成立的情況下,其抽樣分布易于計算(查到)。當然還應該盡量滿足一些優(yōu)良性條件,特別是在參數(shù)檢驗中。限于篇幅,我們不準備在本書中仔細討論這些優(yōu)良性條件。在統(tǒng)計量選定以后,便可構造出由該統(tǒng)計量T描述某個顯著性水平下的一小概率事件{TgB},我們稱使得這一小概率事件發(fā)生的樣本空間a的點的全體V={(X,X,A,X)gX:T(X,X,A,X;6)gB}12 n 12 n a為H的否定域(Negationregion)或拒絕域(Rejectionregion),通常也簡記為V={TgB}.最0a后的檢驗即是判斷所給的樣本是否落在V內,或者是TgB是否成立。因此,從這個意義上a可以說設計一個檢驗,本質上就是找到一個恰當?shù)姆穸ㄓ騐,使得在H下,它的概率0P(VIH)=(或<)a0今后我們總是把統(tǒng)計檢驗中提到的“小概率事件”視為與否定域V是等價的概念。另外,稱V的余集X-V為H的接受域。0§7.2正態(tài)總體參數(shù)檢驗(ParameterTestofNormalCollectivity)對于正態(tài)總體,其參數(shù)無非是兩個:期望N和方差o2,如果加上兩總體的參數(shù)比較,概括起來,對參數(shù)的假設一般只有如下四種情形:(i)對N,(五)對o2,(皿)對口-日,12(iv)對o2/o2.其中情形(i)、(iii)又分為o2(或o2,02)已知和未知的兩種情況。1 2 12下面我們將分別予以討論。如前所提到的,對于設計一個檢驗,關鍵是構造一個統(tǒng)計量T=T(6),它需滿足的一個必要條件是在H成立時,分布為已知(有表可查),同時它00對于需要檢驗的參數(shù)來說應該是“較好”的,這一點與參數(shù)的區(qū)間估計很相似。在正態(tài)總體參數(shù)的區(qū)間估計中,我們正好也是討論了上述四種情形的置信區(qū)間。在區(qū)間估計中,我們曾提到過,構造參數(shù)6的置信區(qū)間的關鍵一步是從6的點估計出發(fā),構造一個分布已知的含未知參數(shù)6的隨機變量T(6),針對四種情況,當時我們構造的T(6)分別是X—LI X—L1C1.C2.對口:T⑴)=——竺,(o已知),T⑴)=——2L,(o未知)onn S7n—1C1.C2.nS2T(o2)= o2C3.對口一日:C3.對口一日:12T(N,N)=12T(N1,N2)=(X-Y)—(N-N) i-2-,Co,o已知)o2o2 12'^-+—2-

nn

1 1 2,nn(n+n—2)(X—Y)—(N—N),12——1 2 1 2\n+nnnS2+nS21 2 %11 22(o1=o未知)2o2 n(n—1)S2o2C4.對:T(o2,o2)=T_1 2-1-C4.o2 1 2n(n—1)S2o22 12 12對于正態(tài)參數(shù)檢驗,我們也將針對不同情況,采用形式與上述隨機變量T(6)完全一樣的統(tǒng)計量T(60),來作為檢驗統(tǒng)計量。但這里需要說明的是,作為區(qū)間估計中的T(6)與檢驗中的T(9)是有所不同的,第一,T(9)中含有待估的未知參數(shù)°,因此,它不是統(tǒng)計量,只是一0般的隨機變量;而T(9)中的參數(shù)9為一已知數(shù),因此它是統(tǒng)計量。第二,T(9)的分布是已00知的,這是因為其中的9與總體中的參數(shù)9是相一致的;而T(9)的分布則需在假設總體參數(shù)09明確時分布才已知。除此之外,它們的分布形式是完全一樣的。上述統(tǒng)計量T(9)在H成立時通常有4種分布:00D1.N(0,1)情形C1.、C3.中,o(或o,o)已知;12D2.t分布情形,C1.、C3.中,o(或o,o)未知;12D3.X2分布,情形C2.;D4.F分布,情形C4.我們分別稱以它們?yōu)闄z驗統(tǒng)計量的檢驗為u檢驗、t檢驗、X2檢驗和F檢驗。下面將分別討論這幾種檢驗所適應的具體問題和檢驗的方法。一、u檢驗(utest)u檢驗適應在方差已知的情況下,對期望的檢驗(單總體或雙總體)。(一)單總體情形考察下面的例子:Example7.4一臺包裝機裝洗衣粉,額定標準重量為500g,根據以往經驗,包裝機的實際裝袋重量服從正態(tài)N(N,o2),其中o=15g,為檢驗包裝機工作是否正常,隨機抽取900袋,稱得洗衣粉凈重數(shù)據如下(單位:g)497 506 518 524 488 517 510 515 516若取顯著性水平a=0.01,問這包裝機工作是否正常?所謂包裝機工作正常,即是包裝機包裝洗衣粉的份量的期望值應為額定份量500g,多裝了廠家要虧損,少裝了損害消費者利益。因此要檢驗包裝機工作是否正常,用參數(shù)表示就是日=500是否成立。首先,我們根據以往的經驗認為,在沒有特殊情況下,包裝機工作應該是正常的,由此提出原假設和備選假設:H:旦二500;H:旦W50001然后對給定的顯著性水平a=0.01,構造統(tǒng)計量和小概率事件,來進行檢驗。一般地,可將例7.4表述如下:設X?N(艮o2),o2已知,X,X,A.,X,為X的0 0 12 n一子樣,求對問題H:日=從;H:"從

00 1 0的顯著水平為a(0<a<1)的檢驗。這個問題就歸結為,總體服從N(N,o2),o2已知,需檢驗口,由前所述,用u檢驗法。00我們仿照例7.3的步驟來解這個問題。Solution10提出假設(已有,略)。20構造統(tǒng)計量。此問題屬情形CL的u檢驗,故用統(tǒng)計量X—^u二——onn0并計算其具體值。在例7.4中u=(9(497+506+518+524+488+517+510+515+516)—500)/(15八9)=2.0230易知,在H0成立的條件下;u服從正態(tài)分布N(01),因此根據正態(tài)分布的特點,在H0成立的條件下,u的值應以較大的概率出現(xiàn)在0的附近,因此對H不利的小概率事件是u的0值出現(xiàn)在遠離。的地方。即u大于某個較大的數(shù),或小于某個較小的數(shù)。這一小概率事件對應的否定域為V={u<u}u{u>u}={{u\>u}五 1—五 1―72 2 2滿足P(VIH)=a.構造這一否定域利用了u的概率密度曲線兩側尾部面積(圖7-1),故02 1一2 250從u的值判斷小概率事件是否發(fā)生,并由此得出接受或拒絕H0的結論。對于例7.4,因為在2。中算出的u值,其絕對值小于2.575,樣本點在否定域V之外:即小概率事件未發(fā)生,故接受H,亦即認為包裝機工作正常。0(二)雙總體情形TOC\o"1-5"\h\z雙總體u檢驗適應的問題的一般提法如下:設X,X,A.,X為出自N(從,。2)的樣本,1 2 n 11y,r,a.,r為出自n(從,。2)的樣本,o,o已知,兩個總體的樣本之間獨立,求對于12 n 22 1 2N-N的顯著水平為a的檢驗。例如假設具有下列形式:12H:從一旦<0;H:從一旦>001 2 11 2此問題屬情形C3.的u檢驗,故用統(tǒng)計量(X-r)

u=, o2o21—U+~^-InnTOC\o"1-5"\h\z1 1 2當H成立時,總體所服從的是一族分布,因此u的分布也無法確定,通常我們是先取H成00立時的邊界值N-日=0,這時u~N(0,1),據此來確定否定域。易知,此時若H:12 1日-日>0成立,則u的值應有變大的趨勢。于是對H不利的小概率事件應為12 0V-{u>u}1-a顯然當N-N-0時,P(VIN-N-0)-a;而當日一日-a<0時,u-a~N(0,1),12 12 12此時P(VIN-N-a)-P{u>u}-P{u-a>u-a}<a1 2 1-a 1-a如圖7-2所示。圖7-2總之,當H成立時,P(VIH)<a.它被認為是在一次試驗中實際上不出現(xiàn)的事件。這00一否定域的構造利用了N(0,1)概率密度單側的尾部面積,故稱這種形式的檢驗為單側檢驗

(One-sidedtest)。最后通過計算u的具體值,觀察小概率事件是否發(fā)生,未發(fā)生接受H0,發(fā)生了則拒絕H.0一般地,檢驗統(tǒng)計量若為正態(tài)或t分布,采用雙側或單側檢驗僅與假設的形式有關,當備選假設中的參數(shù)區(qū)域在原假設的參數(shù)區(qū)域的兩側時,用雙側檢驗,在一側時,用對應于該側的單側檢驗。二、t檢驗(ttest)t檢驗用于當方差未知時對期望的檢驗,可以是單總體,也可是雙總體。當然對于雙總體,它們的樣本之間應該是獨立的。(一)單總體情形考察如下例子:Example7.5某部門對當前市場的價格情況進行調查。以雞蛋為例,所抽查的全省20個集市上,售價分別為(單位:元/500克)3.05 3.31 3.34 3.82 3.30 3.16 3.84 3.10 3.90 3.183.88 3.22 3.28 3.34 3.62 3.28 3.30 3.22 3.54 3.30已知往年的平均售價一直穩(wěn)定在3.25元/500克左右,能否認為全省當前的雞蛋售價明顯高于往年?對于這樣的實際問題,通常可以補充下列條件,首先,一般可認為全省雞蛋價格服從正態(tài)分布N(也o2),其次,我們定出一個顯著水平如a=0.05.針對這一問題,提出一個合理的假設是HH:日=3.25;0

將這一問題一般化就是:設X,X,A,X

12題H:^>3.251為出自N(也o2)的樣本,o2未知,求對問H:旦=從;H:旦>從

00 10的顯著水平為a(0<a<1)的檢驗。這屬于情形CLo2未知的情況,可用t檢驗。即取檢驗統(tǒng)計量為在H成立的條件下,t~t(n—1);又當H成立時,t有變大的趨勢,因此用單側檢驗,即取01否定域為V={t>t (n—1)}1—a最后根據計算出來的t值,看樣本是否落在V內,若落在V內,則拒絕H,否則,接受H.TOC\o"1-5"\h\z_ 0 0具體到例7.5,可算出n=20,X=3.399,S=0.2622,由此計算出t=2.477.另外查表可得t(n—1)=t (19)=2.093<2.477,故拒絕H,即雞蛋的價格較往年明顯上漲。1—a 0.975 0(二)雙總體的情形對于雙總體,一般地討論比較麻煩,通??紤]兩種特殊情況,一種是o=o=o(未12知)的情形,這一情形問題的一般提法是:設X,X,A,X為出自N⑴,o2)的樣本,12 n1 1Y,Y,A,Y為出自N(日,o2)的樣本,兩個總體的樣本之間獨立,求問題12 n2 2H:從—從=0;H:從—從豐0(或>0,或<0)o12 11 2的顯著水平為a的檢驗。這是情形C3。中o2未知的場合,用統(tǒng)計量nn(n+n一2) (X一Y)(7.1)112——1 2 (7.1)'n+nJnS2+nS21 2 ill22TOC\o"1-5"\h\z其中S2=-1E(X一X)2,S2=—2(Y一Y)2.在H成立時,/服從自由度為1n i 2n i 01i=1 2i=1n+n-2的t分布.否定域則依照H的具體內容來構造,即依照H決定采用雙側或單側12 1 1檢驗。第二種情形是o,o未知,但n=n=n,則可考慮所謂配對檢驗法(Methodof12 1 2paired-sampletest)。此時令Z=X一Y,i=12A,n,iiiZ=12z,S2=12(Z一Z)2

nini

i=1 i=1由于當日=日時,Z~N(0,o2+o2),且相互獨立,則12 i 12o2+o2 nS2Z~N(0,^), ~X2(n-1)no2+o2 1 2zo+o2且Z與S2獨立,故t= ':n =—~1Z~t(n-1)\o"CurrentDocument"■nS2 1S, ' 0o2+o2n一11 1 2t可作為H:從-從=0的檢驗統(tǒng)計量。01 2Example7.6某工廠生產某種電器材料。要檢驗原來使用的材料與一種新研制的材料的疲勞壽命有無顯著性差異,各取若干樣品,做疲勞壽命試驗,所得數(shù)據如下(單位:小時):原材料: 40 110 150 6590210270新材料: 60 150 220 310380350250 450110175一般認為,材料的疲勞壽命服從對數(shù)正態(tài)分布,并可以假定原材料疲勞壽命的對數(shù)ln己與新材料疲勞壽命的對數(shù)lnn有相同的方差,即可設ln己?N⑴,o2),lnn?N(日,o2).12Solution問題歸結為下述檢驗:H:從=N;H:從w日TOC\o"1-5"\h\z0 12 1 1 2當h成立時,in己與inn就有相同的分布,從而自與n有相同的分布,即兩種材料的疲勞壽0命沒有顯著性差異。將前面的試驗數(shù)據取對數(shù):inm: 1.602 2.041 2.176 1.813 1.954 2.322 2.431lnn: 1.778 2.176 2.342 2.491 2.560 2.544 2.398 2.6532.0412.243記in己的樣本為X,X,A,X,inn的樣本為Y,Y,A,Y,則可算出2勺 12 n2X=2.0484,S2=0.501氏0.072,n=717 1Y=2.3246,S2=0.663=0.0663,n=102 10 2對此問題可用式(7.1)中的統(tǒng)計量t,具體算出:t=一2.01顯然,這個問題須用雙側檢驗,若給顯著性水平a=0.05,否定域V應為

{111>t (7+10—2)=t(15)x2.13}.,005 0.9752計算結果表明|t<2.{111>t (7+10—2)=t(15)x2.13}.,005 0.9752計算結果表明|t<2.13,因此不能否定H0,即認為兩種材料的疲勞壽命沒有顯著性差異。、X2檢驗和F檢驗(X2testandFtest)X2檢驗和F檢驗都是對于方差的檢驗,前者用于單參數(shù)的情形C2數(shù)的情形C4.后者往往用于兩參(一)X2檢驗設X,X,A,X為出自N(也o2)的樣本,12要對參數(shù)O2進行檢驗這里N往往是未知的。假設的形式通常如H:o2=o2;00H:o2<o2;00(H:o2>o2;00都可選擇統(tǒng)計量H:1H:O2<O2類似)對于(i),nS2X2二一O20當H成立時,式(7.1)右邊服從X20(7.2)n(n-1)分布。由于一-S2是O2的無

n—1比值太大或太小都不利于H,自然地,可以來用雙側檢驗,取否定域為0如圖7-3所示。v={X2<X2(n—1)}u{X2>X2(n—1)}如圖7-3所示。a 1_a2 2圖7-3aa此時尸(VIH)=—+—=a.對于(ii)當H成立時,O2<o2,令

0 22 0 0?X?X~2nS2O2則X2~X2(n-1),且22>x2.注意到此時,不利于H0的事件是統(tǒng)計量X2變大,因此,采用單側檢驗,即取否定域為v={X2>X2(n—1)}

1—a可知此時有0(二)F檢驗P(VIH可知此時有0(二)F檢驗P(VIH)=P{X2>X21—a(n—1)}<P”2>X21—a(n—1)}二a設X,X,A,X為出自N(從,o2)的樣本,Y,Y,A,Y為出自N(從,o2)的樣本,12 n且樣本之間獨立??紤]1假設111 2 n222H:O2=o201H:o201對此可采用統(tǒng)計量H:o2wo211 2H:H:o2wo211 2H:O2>o21122<O2;(7.3)TOC\o"1-5"\h\z\o"CurrentDocument"F=-U——2 1-n(n—1)S221 2進行檢驗,易知,對于(i),12在H下,F(xiàn)~F(n-1,n-4,我們可取否定域為進行檢驗,易知,對于(i),12V={F<F(n—1,n—1)}u{F>F(n—1,n—1)]-1 2 1—-1 222此時P(VIH)=a.0對于(ii),類似前面的討論,可取否定域為V={F>F(n—1,n—1)}1—- 1 2此時P(VIH)<a,0Example7.7一臺機床大修前曾加工一批零件,共n1=10件,加工尺寸的樣本方差為S2=2500(從2).大修后加工一批零件,共n=12件,加工尺寸的樣本方差為S2=400(從2).TOC\o"1-5"\h\z1 22問此機床大修后,精度有明顯提高的最小顯著性水平大致有多大?Solution對此實際問題,可設加工尺寸服從正態(tài)分布,即機床大修前后加工尺寸分別服從N(從,o2)和N(從,o2).于是由題意有11 22H:o2=o2; H:o2>o201 2 11 2用F統(tǒng)計量廠n(n—1)S2 10x11x2500…F=t2 1-= p6.36n(n—1)S2 12x9x40021 2否定域為{F>F(9,11)},從表上查得1—-當a=0.005時,F(xiàn)(9,11)=5.54<6.36;1—-當a=0.001時,F(xiàn)(9,11)=8.12>6.36;1—-由此可知,在否定H的前提下,最小顯著性水平在0.001到0.005之間。0§7.3檢驗的實際意義及兩類錯誤(PracticalSignificanceofTestsandTwoTypesError)前面對參數(shù)的假設檢驗的方法進行了較詳盡的討論,但讀者可能有不少疑問,如這些檢驗方法對于相應的問題是不是唯一的方法?若不是唯一的,是不是最優(yōu)的方法?最優(yōu)的標準又是什么?檢驗的優(yōu)劣與顯著性水平-的關系如何?下面我們將研究一下這方面的問題。為了不涉及過多的概念和理論推證,我們的討論只是較為簡略的。一、檢驗結果的實際意義(Practicalsignificanceofresultsoftests)a)檢驗的原理是“小概率事件在一次試驗中不發(fā)生”,以此作為推斷的依據,決定是接受H或拒絕H.但是這一原理只是在概率意義下成立,并不是嚴格成立的,即不能說小概00率事件在一次試驗中絕對不可能發(fā)生。仍以例7.3來說,盡管按統(tǒng)計推斷結論,認為摸球人作弊,但事實上也完全可能沒有作弊。試想如果在不作弊的情況下,10次全部摸中綠球絕對不可能的話,那么開設摸獎就沒有意義了。因此,當摸獎人事實上的確是未作弊的話,商店的統(tǒng)計推斷就犯了錯誤,關于犯檢驗的錯誤我們放到后面再講。b)在假設檢驗中,原假設H與備選假設H的地位是不對等的。一般來說-是較小的,01

因而檢驗推斷是“偏向”原假設,而“歧視”備選假設的。因為,通常若要否定原假設,需要有顯著性的事實,即小概率事件發(fā)生,否則就認為原假設成立。因此在檢驗中接受H0,并不等于從邏輯上證明了H的成立,只是找不到H不成立的有力證據。在應用中,對同一問00題若提出不同的原假設,甚至可以有完全不同的結論,為了理解這一點,舉例如下:Example7.8設總體X~N⑴,),樣本均值X=X=0.5,樣本容量n=1,取a=0.05,欲檢驗旦=0,還是旦=1. 1這里有兩種提出假設的方法,分別如下:H:旦=0; H:旦=101H:旦=1; H:旦=001如果按一般邏輯論證的想法,當然認為無論怎樣提假設,日的最終結果應該是一樣的。但事實不然,計算如下: _X—u對于(i)顯然應取否定域為V={u>u=1.645},其中u=——=,當H成立時,0.95 o/yn0u~N(0,1),實際算得0500 .、一u=——=0.5<1.645,或X<1.645il接受H,即認為U=0.0對于(ii)應取否定域為V={u<u =—1.645}.此時0.05u=05—1=—0.5>—1.645,或X>—1.645+1111接受H,即認為U=1.0這種矛盾現(xiàn)象可以解釋為,試驗結果既不否定U=0,也不否定U=1,究竟應認為U=0,還是U=1,就要看你要“保護”誰,即怎樣取原假設。這一結果的幾何解釋如圖7-4.在圖7-4中,X=0.5既不在N(0,1)密度函數(shù)的陰影部分所對應的區(qū)間里,也不在N(1,1)密度函數(shù)的陰影部分所對應的區(qū)間內。所以無論怎樣提出H都否定不了。N(K1>0N(K1>圖7-4這一事實提醒了我們,在應用中一定要慎重提出原假設,它應該是有一定背景依據的。因為它一經提出,通常在檢驗中是受到保護的,受保護的程度取決于顯著性水平a的大小,a越小,以a為概率的小概率事件就越難發(fā)生,H就越難被否定。在實際問題中,這種保護是0必要的,如對一個有傳統(tǒng)生產工藝和良好信譽的廠家的商品檢驗,我們就應該取原假設為產品合格來加以保護,并通過檢驗來印證,以免因抽樣的隨機性而輕易否定該廠商品的質量。C)從另一個角度看,既然H是受保護的,則對于H的肯定相對來說是較缺乏說服力的,充其量不過是原假設與試驗結果沒有明顯矛盾;反之,對于H0的否定則是有力的,且a越小,小概率事件越難于發(fā)生,一旦發(fā)生了,這種否定就越有力,也就越能說明問題。在應用中,如果要用假設檢驗說明某個結論成立,那么最好設H0為該結論不成立。若通過檢驗拒

絕了H,則說明該結論的成立是很具有說服力的,如例7.3那樣。而且a取得較小,如果仍0拒絕H的話,結論成立的說服力越強。0二、檢驗中的兩類錯誤(Twotypeserroroftests)前面已說到檢驗可能犯錯誤,所謂犯錯誤就是檢驗的結論與實際情況不符,這里有兩種情況:一是實際情況是H成立,而檢驗的結果表明H不成立,即拒絕了H,這時稱該檢0 00驗犯了第一類錯誤(typeIerror)或“棄真”的錯誤;二是實際情況是H0不成立,H1成立,而檢驗的結果表明H0成立,即接受了H0,這時稱該檢驗犯了第二類錯誤(typeIIerror),或稱“取偽”的錯誤。我們來研究一下,對于一個檢驗,這兩類錯誤有多大。我們知道,一個檢驗本質上就是一個否定域V,所謂拒絕H0,就是通過構造V的統(tǒng)計量計算,得出樣本點落在V內的結論。所以,第一類錯誤的概率就是在H0成立的條件下V的概率P(VIH).從前幾節(jié)的具體例子可知,一般地當H形如6=6時,P(VIH)=a.當0 00 0H形如6<6或6>6時,P(VIH)<a.由此可知,顯著性水平a也就是檢驗V犯第一0 00 0類錯誤的概率。同樣,接受H,即是指樣本點落在接受域X-V中,因此犯第二類錯誤的概率是0p=P{X-VIH} (7.9)1當H中包含的參數(shù)不止一個時,一般P的具體計算是較困難的。1我們來看一個具體例子,加深對兩類錯誤概念的理解。Example7.9設總體X?N(從,。2),o02已知,樣本容量為n,求對問題H:旦=從; H:旦=從>口0 0 1 10的u檢驗的兩類錯誤的概率。Solution在此檢驗中,否定域應為V={u>u}1—aX—u …在H1成立時服其中u=——Q,a為某一顯著性水平,易知u在H成立時服從N(0,1),在H1成立時服0從N(凹二匕,Yn,1).于是,犯第一類錯誤的概率為o0P{VIu=u}=a0犯第二類錯誤的概率為p=P{X—VIu=u}=P{u<u Iu=u}1 1—a 1u—u—u—u—=P{u—-u o-*n<uo 1—a0U—u-U !o0(7.10)=①u1—aV=①u1—aV-u 0Jno)0其中①(X)為標準正態(tài)分布函數(shù)。u上述兩類錯誤概率的大小可用圖7-5中的陰影面積表示。圖中a=F,i=0,1,io/nn

0L=a+u.由圖7-5或式(7.10)可以看出,若要第一類錯誤概率a變小,則u 變大,0 1—a 1—a從而第二類錯誤的概率P=①(u-出』n))也隨之變大。1-a o00圖7-5設計一個檢驗,當然最理想的是犯兩類錯誤的概率都盡可能地小,但由例7.12可以看出,在樣本容量n一定的情況下,要使兩者都達到最小是不可能的??紤]到H的提出既然是慎重0的,否定它也要比較慎重。因此,在設計檢驗時,一般采取控制第一類錯誤的概率在某一顯著性水平a內,對于固定的n,使第二類錯誤盡可能地小,并以此來建立評價檢驗是否最優(yōu)的標準。關于這一點我們不準備深入討論,只強調一點,在7.2節(jié)末表中所列出的檢驗都是某種意義下的最優(yōu)檢驗,作為一個實例,可參看習題7.9,這也是對于正態(tài)總體參數(shù)的檢驗為什么要采用7.2節(jié)所介紹的那些方法的原因。三、樣本容量確定問題(Determinateproblemofsamplecapacity)對于固定的樣本容量n,若要控制第一類錯誤的概率a,就不可能使第二類錯誤的概率P盡可能地小。但另一方面,從(7.10)式可以看出,在例7.12中,如果保持a不變,使n增大,則P=①(u—生二匕)n)減?。ㄗ⒁鈴?gt;口),當n-8時,pf0.也就是說,1-a o 1 00通過增大樣本容量,犯第二類錯誤的概率可以小于任給的正數(shù)。在實際問題中,樣本容量是不可能無限制擴大的,因為做試驗需要成本,抽樣數(shù)量太大,既做不起,又沒有必要。另一方面,若樣本容量太小,又不能使犯兩類錯誤的概率同時都令人滿意地小。由此引出這樣的問題,即能否確定一個最小的樣本容量,使得檢驗的兩類錯誤概率都在預先控制的范圍內?這就是樣本容量確定問題。我們討論兩種具體的檢驗。(一)對于正態(tài)總體N

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論