概率統(tǒng)計-假設(shè)檢驗_第1頁
概率統(tǒng)計-假設(shè)檢驗_第2頁
概率統(tǒng)計-假設(shè)檢驗_第3頁
概率統(tǒng)計-假設(shè)檢驗_第4頁
概率統(tǒng)計-假設(shè)檢驗_第5頁
已閱讀5頁,還剩132頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第一節(jié) 假設(shè)檢驗問題 第二節(jié) 正態(tài)總體均值的假設(shè)檢驗 第三節(jié) 正態(tài)總體方差的檢驗 第四節(jié) 大樣本檢驗法 第五節(jié) 假設(shè)檢驗的兩類錯誤 第六節(jié) 非參數(shù)假設(shè)檢驗 第八章第八章 假設(shè)檢驗假設(shè)檢驗第一節(jié) 假設(shè)檢驗問題 前一章我們討論了統(tǒng)計推斷中的參數(shù)估計問題,本章將討論另一類統(tǒng)計推斷問題假設(shè)檢驗.在參數(shù)估計中我們按照參數(shù)的點估計方法建立了參數(shù) 的估計公式,并利用樣本值確定了一個估計值 ,認(rèn)為參數(shù)真值 。由于參數(shù) 是未知的, 只是一個假設(shè)(假說,假想),它可能是真,也可能是假,是真是假有待于用樣本進(jìn)行驗證(檢驗).下面我們先對幾個問題進(jìn)行分析,給出假設(shè)檢驗的有關(guān)概念,然后總結(jié)給出檢驗假設(shè)的思想和方法.一、

2、 統(tǒng)計假設(shè) 某大米加工廠用自動包裝機將大米裝袋,每袋的標(biāo)準(zhǔn)重量規(guī)定為10kg,每天開工時,需要先檢驗一下包裝機工作是否正常. 根據(jù)以往的經(jīng)驗知道,自動包裝機裝袋重量X服從正態(tài)分布N( )。某日開工后,抽取了8袋,如何根據(jù)這8袋的重量判斷“自動包裝機工作是正常的”這個命題是否成立?2,請看以下幾個問題:問題問題1 引號內(nèi)的命題可能是真,也可能是假,只有通過驗證才能確定。如果根據(jù)抽樣結(jié)果判斷它是真,則我們接受這個命題,否則就拒絕接受它,此時實際上我們接受了“機器工作不正?!边@樣一個命題。10101010若用H0表示“ ”,用H1表示其對立面,即“ ”,則問題等價于檢驗H0: 是否成立,若H0不成立

3、,則H1: 成立。 一架天平標(biāo)定的誤差方差為10-4(克2),重量為的物體用它稱得的重量X服從N( )。某人懷疑天平的精度,拿一物體稱n次,得n個數(shù)據(jù),由這些數(shù)據(jù)(樣本)如何判斷“這架天平的精度是10-4(克2)”這個命題是否成立? 2,問題224210記H0: =10-4,其H1: 。則問題等價于檢驗H0成立,還是H1成立。 某種電子元件的使用壽命X服從參數(shù)為 的指數(shù)分布,現(xiàn)從一批元件中任取n個測得其壽命值(樣本)如何判定“元件的平均壽命不小于5000小時”這個命題是否成立? 記500010H50001:1H問題3則問題等價于檢驗H0成立,還是H1成立。 某種疾病,不用藥時其康復(fù)率為 ,現(xiàn)發(fā)

4、明一種新藥(無不良反應(yīng)),為此抽查n位病人用新藥的治療效果,設(shè)其中有s人康復(fù),根據(jù)這些信息,能否斷定“該新藥有效”?0記00:H01:H問題4則問題等價于檢驗H0成立,還是H1成立。 自1965年1月1日至1971年2月9日共2231天中,全世界記錄到震級4級及以上的地震共計162次,問相繼兩次地震間隔的天數(shù)X是否服從指數(shù)分布?問題5XH :0XH :1記 服從指數(shù)分布, 不服從指數(shù)分布。則問題也等價于檢驗H0成立,還是H1成立。在很多實際問題中,我們常常需要對關(guān)于總體的分布形式或分布中的未知參數(shù)的某個陳述或命題進(jìn)行判斷,數(shù)理統(tǒng)計學(xué)中將這些有待驗證的陳述或命題稱為統(tǒng)計假設(shè),簡稱假設(shè).如上述各問

5、題中的H0和H1都是假設(shè).利用樣本對假設(shè)的真假進(jìn)行判斷稱為假設(shè)檢驗。在總體的概率分布已知情形下,對分布中的未知參數(shù)作假設(shè)并進(jìn)行檢驗,稱為參數(shù)假設(shè)檢驗若總體的分布未知,對總體的分布形式或參數(shù)作假設(shè)并進(jìn)行檢驗,稱為非參數(shù)假設(shè)檢驗。如上述問題14為參數(shù)假設(shè)檢驗問題,問題5為非參數(shù)假設(shè)檢驗問題.值得注意的是,當(dāng)給定原假設(shè)后,其對立假設(shè)的形式可能有多個,如H0: 其對立形式有 010:H02:H03:H 在假設(shè)檢驗問題中,常把一個被檢驗的假設(shè)稱為原假設(shè)原假設(shè)或零假設(shè)零假設(shè),而其對立面就稱為對立假設(shè)對立假設(shè)。上述各問題中,H0為原假設(shè),H1為對立假設(shè)。當(dāng)H0不成立時,就拒絕接受H0而接受其對立假設(shè)H1。

6、選擇哪一種需根據(jù)實際問題確定,因而對立假設(shè)往往也稱為備選假設(shè)備選假設(shè),即在拒絕原假設(shè)后可供選擇的假設(shè).在假設(shè)檢驗問題中,必須同時給出原假設(shè)和對立假設(shè).在參數(shù)假設(shè)中,不論是原假設(shè)還是對立假設(shè),若其中只含有一個參數(shù)值,則稱為簡單假設(shè)簡單假設(shè),否則稱為復(fù)合假設(shè)復(fù)合假設(shè),如H0: , H1: 為簡單假設(shè);而H0: , H1: 為復(fù)合假設(shè)。0000二、假設(shè)檢驗的思想方法 如何利用從總體中抽取的樣本來檢驗一個關(guān)于總體的假設(shè)是否成立呢?由于樣本與總體同分布,樣本包含了總體分布的信息,因而也包含了假設(shè)H0是否成立的信息,如何來獲取并利用樣本信息是解決問題的關(guān)鍵.統(tǒng)計學(xué)中常用“概率反證法”和“小概率原理”來解決

7、這個問題。小概率原理概率很小的事件在一次試驗中不會發(fā)生.如果小概率事件在一次試驗中竟然發(fā)生了,則事屬反常,定有導(dǎo)致反常的特別原因,有理由懷疑試驗的原定條件不成立。概率反證法欲判斷假設(shè)H0的真假,先假定H0真,在此前提下構(gòu)造一個能說明問題的小概率事件A。試驗取樣,由樣本信息確定A是否發(fā)生,若A發(fā)生,這與小概率原理相違背,說明試驗的前定條件H0不成立,拒絕H0,接受H1;若小概率事件A沒有發(fā)生,沒有理由拒絕H0,只好接受H0。 反證法的關(guān)鍵是通過推理,得到一個與常理(定理、公式、原理)相違背的結(jié)論。“概率反證法”依據(jù)的是“小概率原理”。那么多小的概率才算小概率呢?這要由實際問題的不同需要來決定。以

8、后用符號 記小概率,一般取 等。在假設(shè)檢驗中,若小概率事件的概率不超過 ,則稱 為檢驗水平檢驗水平或顯著性水平顯著性水平。1 . 0 ,05. 0 ,01. 0 已知某煉鐵廠的鐵水含碳量XN(4.55,0.06),現(xiàn)改變了工藝條件,又測得10爐鐵水的平均含碳量 ,假設(shè)方差無變化,問總體的均值 是否有明顯改變?(取 =0.05) 57. 4x下面舉例說明以上檢驗的思想與方法。例1則 與4.55應(yīng)很接近事件 較大,待定)不太可能發(fā)生0(|55. 4:|ddXA解55. 455. 4由問題提出假設(shè)H0: ,H1:若H0成立由于 未知X用其無偏估計 來代替|55. 4|X用 來衡量 與4.55之間的差

9、異|55. 4|X如果 較大55. 4則可認(rèn)為所以在H0成立的前提下即P(A)很小令P(A)=,確定d是解決問題的關(guān)鍵由此確定了小概率事件2|:|uUA),(2nNX) 1 , 0(/NnX由 可知) 1 , 0(/55. 4NnXU因此在H0成立的前提下,統(tǒng)計量ndUdX/|55. 4|顯然ndUPndUPdXP/2/|)|55. 4(|因此2/ndUP即2/und由標(biāo)準(zhǔn)正態(tài)分布上分位點的定義可知054.110/06.055.457.4/55.4nxu96. 1025. 02uu由 =0.05,得 2|uu 由于說明小概率事件A未發(fā)生,因此接受假設(shè)H0即認(rèn)為總體均值 等于4.55在隨機試驗中

10、,小概率事件有許多,關(guān)鍵是要找一個能說明問題的小概率事件。由P(A)= 同樣可確定ddXA|55. 4:|本例中,若取最后的檢驗將出現(xiàn)這樣一種傾向0:4.55H越與4.55接近,越要拒絕這樣的判別方法顯然不合理,錯誤在于:在H0成立的前提下,這樣取小概率事件A不合理。1102(,)|Dxxuu在本例中,若設(shè)D則A:( X1,X2,X10)D是使小概率事件A發(fā)生的所有10維樣本值(x1,x10)構(gòu)成的集合10RD則拒絕接受H0等價于0H一般,若拒絕接受其中D是n維空間Rn中的區(qū)域,則稱D為假設(shè)H0的拒絕域或否定域、臨界域DRDn稱D的補集 為H0的接受域檢驗中所用的統(tǒng)計量稱為檢驗統(tǒng)計量D樣本觀測

11、值(x1,x2,x10) D樣本觀測值(x1,x2,xn)執(zhí)行統(tǒng)計判決:求統(tǒng)計量的值,并查表求出有關(guān)數(shù)據(jù),判斷小概率事件是否發(fā)生,由此作出判決提出假設(shè):根據(jù)問題的要求,提出原假設(shè)H0與對立假設(shè)H1,給定顯著水平 及樣本容量n??偨Y(jié)例8.1處理問題的思想與方法,可得處理參數(shù)假設(shè)檢驗問題的步驟如下:(1)(2)(3)確定拒絕域:用參數(shù)的一個好的估計量 (通常取為 的無偏估計)來代替 ,分析拒絕域D的形式,構(gòu)造檢驗統(tǒng)計量g( ),在H0成立的前提下確定g( )的概率分布,通過等式 確定D ),(1DXXPn其中確定拒絕域是關(guān)鍵.拒絕域的形式一般由原假設(shè)與對立假設(shè)共同確定,對同一原假設(shè)H0,不同的對立

12、假設(shè),所得到的H0的拒絕域可能不同。請看下例。例2數(shù)據(jù)同例8.1,問總體的均值 是否明顯大于4.55?在統(tǒng)計學(xué)中,只有當(dāng) 與4.55的偏差大到一定程度時才可認(rèn)為X55. 4在本例中,拒絕H0時接受的是 ,因而H0的拒絕取為 較合理55. 4:1HdX55. 401:4.55,:4.55HH此問題的合理假設(shè)為解X的無偏估計 是 的一個很好的近似值X用代替55. 4在例8.1中,拒絕H0時接受的是H1:兩個數(shù)的偏差用其差的絕對值來衡量dX|55. 4|因而其拒絕域設(shè)為較合理與例8.1中的拒絕域 不同2|uu ndUPdXP/)55. 4(und/054. 1/06. 055. 457. 4/55.

13、 4nnxu645.105.0 u:4.55A Xd在H0成立的條件下,事件發(fā)生的概率應(yīng)很小).1 , 0(/55. 4NnXU設(shè)P(A)= ,統(tǒng)計量由得uu 所以拒絕域為所以判決結(jié)果為:接受H0三、 參數(shù)假設(shè)檢驗與區(qū)間估計的關(guān)系 nRD 參數(shù)的區(qū)間估計則是找一個隨機區(qū)間I,使I包含待估參數(shù) 是個大概率事件參數(shù)假設(shè)檢驗的關(guān)鍵是要找一個確定性的區(qū)域(拒絕域),使得當(dāng)H0成立時,事件DXXn ),(1是一個小概率事件一旦抽樣結(jié)果使小概率事件發(fā)生,就否定原假設(shè)H0對此兩類問題,都是利用樣本對參數(shù)作判斷:一個是由小概率事件否定參數(shù) 屬于某范圍,另一個則是依大概率事件確信某區(qū)域包含參數(shù) 的真值.兩者本質(zhì)

14、上殊途同歸,一類問題的解決,導(dǎo)致解決另一類問題類比方案的形成。2unx20|unx20|unx為 的置信區(qū)間1),(2NX如設(shè)總體已知,給定容量n的樣本則參數(shù) 的置信度為x1樣本均值為的置信區(qū)間為0100:,:HH假設(shè)檢驗問題的拒絕域為接受域為時,接受20unx00:H也就是說,當(dāng)2unx即 在區(qū)間內(nèi),此區(qū)間正是 的置信度習(xí)題811何謂統(tǒng)計假設(shè)、復(fù)合假設(shè)?2試述普通反證法與概率反證法的異同點。3試述檢驗統(tǒng)計假設(shè)的步驟。4設(shè)總體 , 為未知參數(shù), 為其一個樣本,對下述假設(shè)檢驗問題 取拒絕域為: 試求常數(shù)c,使得該檢驗的顯著水平為0.05。 )9 ,(NX),.,(2521XXX0100:,:HH

15、.: ),.(0252, 1cxxxxC第二節(jié) 正態(tài)總體均值的假設(shè)檢驗 本節(jié)討論有關(guān)正態(tài)總體的均值與方差的假設(shè)檢驗問題構(gòu)造合適的檢驗統(tǒng)計量并確定其概率分布是解決檢驗問題的關(guān)鍵2若檢驗統(tǒng)計量服從標(biāo)準(zhǔn)正態(tài)分布( 分布,F(xiàn)分布)則所得到的相應(yīng)檢驗法稱為2U檢驗法( 檢驗法,F(xiàn)檢驗法)一、 U檢驗法(方差已知) 001:H011:H002:H012:H003:H013:H在方差已知的條件下,對一個正態(tài)總體的均值或兩個正態(tài)總體均值差的假設(shè)檢驗常用U檢驗法。若X1,X2,Xn為取自總體X的樣本),(2NX2設(shè)總體已知,給定顯著水平 檢驗以下不同形式的假設(shè)問題:下面我們來求H03的拒絕域前兩個為簡單假設(shè)檢驗

16、問題,我們已在例8.1及例8.2中求出其拒絕域分別為2|uu uu 和nxu/0其中(1))1 ,0(/NnxknnXPknXP/00knXP/10kxH03的拒絕域形式為knx/0等價形式為 (k待定)00若H03成立,則knXP/要控制knXP/只需令uk 由此得nxu/0此處uu 所以H03的拒絕域為(2)012002:,:HH013003:,:HH比較兩種假設(shè)檢驗問題:可以看出盡管兩 者原假設(shè)形式不同,實際意義也不一樣,但對于相同的顯著水平,它們的拒絕域是相同的。因此,遇到H03與H13的檢驗問題,可歸結(jié)為H02與H12來討論。對于后面將要討論的有關(guān)正態(tài)總體的參數(shù)假設(shè)檢驗問題也有類似結(jié)

17、果下面求兩個正態(tài)總體均值差檢驗的拒絕域。),(211NX),(222NY設(shè)總體2122X與Y相互獨立 已知從兩總體中分別取容量為n1、n2的樣本XY用 、 分別表示樣本均值給定顯著水平210:H211:H檢驗假設(shè)12XY的無偏估計分別為kyx|顯然,H0的拒絕形式應(yīng)為 (k待定)) 1 , 0()()(22212121NnnYX由于)1 ,0(222121NnnYXU若H0真,則統(tǒng)計量由222121/|)|(|nnkUPkYXP得2221212nnuk拒絕域為2222121/|unnyxu(3)例例1 一種燃料的辛烷等級服從正態(tài)分布 ,其平均等級 ,標(biāo)準(zhǔn)差 ?,F(xiàn)抽取25桶新油,測試其等級,算得

18、平均等級為97.7。假定標(biāo)準(zhǔn)差與原來一樣,問新油的辛烷平均等級是否比原燃料的辛烷平均等級偏低?( )),(2N0 .988 . 005. 00 .98:00H01:H解解 按題意需檢驗假設(shè)) 1 , 0(/0NnXU檢驗統(tǒng)計量uU拒絕域(參閱表81)645. 105. 0uu查正態(tài)分布表得875. 125/8 . 00 .987 .97/0nxu計算統(tǒng)計值uu645. 1875. 1執(zhí)行統(tǒng)計判決故拒絕H0,即認(rèn)為新油的辛烷平均等級比原燃料辛烷的平均等級確定偏低。00:H01:H二、 T檢驗法(方差未知) 22),(NX設(shè)總體未知對顯著水平 檢驗假設(shè)拒絕域形式kx|0(k待定)注意到S2是 的無

19、偏估計,用S代替22nX0由于 未知,現(xiàn)在不能用 來作為檢驗統(tǒng)計量nSXT/0采用作為檢驗統(tǒng)計量) 1(ntT當(dāng)H0真時,nSkTPkXP/|)|(|0由)1(2/ntnsk得)1(/|2/0ntnsxt所以拒絕域為(4)0100:,:HH類似可給出假設(shè))1(/0ntnsxt的拒絕域為(5)),(2N對正態(tài)總體關(guān)于 的各種形式的假設(shè)檢驗的拒絕域列于表81。 例例2一手機生產(chǎn)廠家在其宣傳廣告中聲稱他們生產(chǎn)的某種品牌的手機的待機時間的平均值至少為71.5小時,一質(zhì)檢部門檢查了該廠生產(chǎn)的這種品牌的手機6部,得到的待機時間為 69,68,72,70,66,75 設(shè)手機的待機時間 ,由這些數(shù)據(jù)能否說明其

20、廣告有欺騙消費者之嫌疑?( )),(2NX05.05 .71:0H5 .71:1H解解 問題可歸結(jié)為檢驗假設(shè)2由于方差 未知,用T檢驗。)1(/0ntnSXT檢驗統(tǒng)計量) 1(/0ntnsxt拒絕域70 x102s162. 1t計算統(tǒng)計值015. 2) 5() 1(05. 0tnt查t分布表,得) 1(015. 2162. 1ntt統(tǒng)計判決故接受H0,即不能認(rèn)為該廠廣告有欺騙消費者之嫌疑下面求兩個正態(tài)總體均值相等性檢驗的拒絕域。),(),(222211NYNX設(shè)總體22221獨立 未知YX,X1,Xn1取自總體XX21S樣本方差為其樣本均值為Y1,Yn2取自總體YY22S其樣本均值為 ,樣本方

21、差為210:H211:H給定顯著水平,檢驗假設(shè)) 2(11)()(212121nntnnSYXw2) 1() 1(212222112nnSnSnSwkyx|拒絕域形式為(k待定)由第六章第四節(jié)例2的結(jié)果知:) 2(112121nntnnSYXTw當(dāng)H0成立時,統(tǒng)計量2111nnSkTPkYXPaw由) 2(1121221nntnnSkaw得例例3 對用兩種不同熱處理方法加工的金屬材料做抗拉強度試驗,得到的試驗數(shù)據(jù)如下: 方法:31,34,29,26,32,35,38,34,30,29,32,31 方法:26,24,28,29,30,29,32,26,31,29,32,28 設(shè)兩種熱處理加工的金

22、屬材料的抗拉強度都服從正態(tài)分布,且方差相等。比較兩種方法所得金屬材料的平均抗拉強度有無顯著差異。( ) 05. 0),(),(2221NN解解 記兩總體的正態(tài)分布為211210:,:HH本題是要檢驗假設(shè)2111nnSYXTw檢驗統(tǒng)計量為) 2(11|21221nntnnSyxtw拒絕域為1221nn75.31x67.28y25.112) 1(211Sn64.66) 1(222 Sn85. 2wS647. 26185. 2|67.2875.31|11|21nnSyxtw計算統(tǒng)計值074. 2)22() 2(025. 0212tnnt查t分布表,得) 2(|212nntt統(tǒng)計判決:由于故拒絕H0即

23、認(rèn)為兩種熱處理方法加工的金屬材料的平均抗拉強度有顯著差異。第三節(jié) 正態(tài)總體方差的檢驗 2S),(2NX2,設(shè)總體未知,樣本方差為給定顯著性水平 ,檢驗假設(shè)20212020:HH2的無偏估計為 ,2S0H202S若 成立,則比值 一般來說應(yīng)在1附近擺動。若 與1的偏差較大,則拒絕 202S0H所以可取拒絕域形式為:1202kS2202kS或) 1() 1(22022nSn0H當(dāng) 成立時,統(tǒng)計量22021202kSkSP或設(shè) 2212) 1() 1(knPknP為計算方便,將 偏大或偏小的概率看作相等202S令2) 1() 1(2212knPknP由此得1) 1(2/121nnk1) 1(2/22

24、nnk拒絕域為:) 1() 1(2/122022nSn) 1(2/22n或習(xí)題821已知某煉鐵廠的鐵水含量在正常情況下服從正態(tài)分布N(4.55,10.82),現(xiàn)在測了5爐鐵水,其含碳量為 4.28, 4.40, 4,42, 4.35, 4.37 若方差沒有變,問總體均值是否有顯著變化?( ) 05. 02有一種新安眠劑,據(jù)說在一定劑量下能比某種舊安眠劑平均增加睡眠時間3小時.為了檢驗新安眠劑的這種說法是否正確,收集到一組使用新安眠劑的睡眠時間(單位:小時): 26.7, 22.0, 24.1, 21.0, 27.2, 25.0, 23.4 根據(jù)資料用某種舊安眠劑時平均睡眠時間為20.8小時,假

25、設(shè)用案眠劑后睡眠時間服從正態(tài)分布,試問這組數(shù)據(jù)能否說明新安眠劑已達(dá)到的療效?( ) 05. 03某單位上年度排出的污水中,某種有害物質(zhì)的平均含量為0.009%,污水經(jīng)處理后,本年度抽測16次,得這種有害物質(zhì)的含量(百分比)為 設(shè)有害物質(zhì)含量服從正態(tài)分布,問是否可認(rèn)為污水經(jīng)處理后,這種有害物質(zhì)的含量有顯著降低?( )0.008,0.007,0.006,0.008,0.009,0.007,0.004,0.007,0.003,0.009,0.010,0.005,0.007,0.009,0.011,0.008,1 .04某彈殼直徑 ,規(guī)定標(biāo)準(zhǔn)為 (毫米), (毫米)。某車間新生產(chǎn)一批這種彈殼,已知這批

26、彈殼直徑的方差為標(biāo)準(zhǔn)值,但其均值未知,為了檢驗這批彈殼是否符合要求,抽測9枚彈殼,得直徑數(shù)據(jù)為(單位:毫米): 試在水平 之下,檢驗這批彈殼是否合格。),(2NX809. 07.947.917.937.927.927.937.907.947.9205. 05如果一個矩形的寬與長之比等于0.618,稱這樣的矩形為黃金比矩形,這種矩形給人良好的感覺,現(xiàn)代的建筑物構(gòu)件(如窗架)、工藝品(如圖片鏡框),甚至司機的駕駛執(zhí)照、商品的信用卡等都常常采用黃金比矩形.下面列出某工藝品工廠隨機抽取的20個矩形的寬與長之比: 設(shè)這一工廠生產(chǎn)的矩形的寬與長的比值總體服從正態(tài)分布 ,試檢驗 H0:=0.618, 0.9

27、33,0.576,0.844,0.570,0.553,0.609,0.601,0.668,0.606,0.611,0.628,0.690,0.606,0.615,0.672,0.662,0.670,0.654,0.749,0.693,),(2NX)05. 0.(618. 0:1H6對某種物品在處理前與處理后取樣分析其含脂率如下: 假定處理前后含脂率都服從正態(tài)分布,且它們的方差相等,問處理后平均含脂率有無顯著降低?( ) 0.120.200.080.040.190.240.240.070.000.130.15處理后處理后0.270.300.120.080.420.660.300.210.180.

28、19處理前處理前05. 07從兩處煤礦各取一樣本,測得其含灰率分別為 設(shè)礦中含灰率服從正態(tài)分布,問甲、乙兩礦煤的含灰率有無顯著差異?( )16.720.216.918.2乙礦乙礦17.421.323.720.824.3甲礦甲礦05. 08為了鑒定兩種工藝方法對產(chǎn)品某性能指標(biāo)影響是否有差異,對9批材料分別用兩種工藝進(jìn)行生產(chǎn),得到該指標(biāo)的9對數(shù)據(jù)如下: 假定兩種工藝方法生產(chǎn)的產(chǎn)品的性能指標(biāo)致差服從正態(tài)分布.根據(jù)這些數(shù)據(jù)能否判定不同工藝對產(chǎn)品的該性能指標(biāo)影響有顯著差異?( )0.890.770.680.590.780.320.520.210.101.000.900.800.700.600.500.4

29、00.300.2005. 09甲、乙兩種稻種,為比較其產(chǎn)量,分別種在10塊試驗田中,每塊田甲、乙稻種各種一半。假定兩稻種產(chǎn)量之差服從正態(tài)分布,最后獲得產(chǎn)量如下(單位:公斤): 問兩種稻種產(chǎn)量是否有顯著差異?( )125133115130131128140115118135乙種乙種141144135140148145140136137140甲種甲種10987654321編號編號05. 010某食品廠生產(chǎn)袋裝食品中含有致癌物質(zhì)亞硝基二甲胺(NDMA),該廠開發(fā)了一種新生產(chǎn)工藝,下面給出了新老工藝下NDMA的含量(以10萬份中的份數(shù)計):設(shè)新老工藝下NDMA的含量服從正態(tài)分布試檢驗假設(shè)3101230

30、12212新工藝新工藝476465565546老工藝?yán)瞎に?05. 0(),(21N),(22N2:120H2:121H第四節(jié) 大樣本檢驗法 在前面討論的所有假設(shè)檢驗問題中,我們都已知有關(guān)統(tǒng)計量的分布,并由此確定拒絕域。但在許多問題中,很難求得檢驗統(tǒng)計量的分布,有時即使能求出,使用上也很不方便(如二項分布參數(shù)p的檢驗問題)實際應(yīng)用中往往求助于統(tǒng)計量的極限分布.若抽取大量樣本(大樣本),并用檢驗統(tǒng)計量的極限分布來近似作為其分布,由此得到的檢驗方法稱為大樣本檢驗法?,F(xiàn)從每一總體中各取一樣本,其樣本容量、樣本均值、樣本方差分別記為一、兩總體均值差的大樣本檢驗 210:H212:H設(shè)有兩個獨立總體X,

31、Y,其均值和方差分別為122122并且n1、 n2很大。給顯著水平檢驗假設(shè)X21S1nY22S2n若兩總體均為正態(tài)分布,由6.2.1的討論知2221,當(dāng) 已知時,可用U檢驗法來檢驗;22212221,當(dāng) 未知但 時,可用T檢驗法來檢驗此處總體分布未知,即使總體為正態(tài)分布,因而也不能用T檢驗。下面我們用大樣本方法給出此假設(shè)的近似檢驗法。未知且 與 不一定相等21222221,由于)1 , 0(11NnX近似2222,nNY近似當(dāng)n1很大時,由中心極限定理知1211,nNX近似即同理,當(dāng)n2很大時用 代替 ,用 代替21S2122S22YX ,) 1 , 0(/)()(22212121NnnYX近

32、似由于 獨立所以2221,SS2221,分別是 的很好近似值仍有2222121/|unSnSyxu由此可得拒絕域為) 1 , 0(/)()(22212121NnSnSYXU近似(n1,n2很大) (89) 設(shè)P(A)=p,在n次獨立試驗中事件A發(fā)生的次數(shù)為X則 XB(n, p)給定顯著水平檢驗假設(shè)H0:p = p0 H1:p p0 (0p01,p0已知)否則發(fā)生次試驗中第, 0, 1AiXi設(shè)則X1,X2,Xn獨立,且都服從參數(shù)p的(0-1)分布,X=X1+X2+Xn由中心極限定理,當(dāng) 時,n) 1 , 0()1 (NpnpnpXDXEXX當(dāng)H0真,且n很大時,upnpnpxu)1 (000由

33、此可得拒絕為) 1 , 0()1 (000NpnpnpXU近似(810)1從一大批產(chǎn)品中任取100個,得一級品60個,記p為這一大批產(chǎn)品的一級品率,試在水平 下檢驗假設(shè)05. 06 .0:,6 .0:10pHpH習(xí)題8-42為了比較兩種子彈A、B的速度(單位:米/秒),在相同條件下進(jìn)行速度測定。算得樣本平均值及標(biāo)準(zhǔn)差為 試用大樣本方法檢驗這兩子彈的平均速度有無顯著差異。 ( )S2=105.00n2=110子彈子彈BS1=120.41n1=110子彈子彈A05. 0第五節(jié) 假設(shè)檢驗的兩類錯誤 用概率反證法檢驗一個假設(shè)的推理依據(jù)是小概率原理在一次抽樣中,若小概率事件發(fā)生了,則拒絕原假設(shè);若小概率

34、事件沒有發(fā)生,拒絕原假設(shè)的理由不充分,因而只好接受原假設(shè)。這樣的檢驗結(jié)果可能出現(xiàn)以下兩種類型的錯誤。一、犯兩類錯誤的概率P(拒絕H0|H0真)=P(小概率事件) (8-12)第第類錯誤類錯誤(棄真)當(dāng)原假設(shè)H0真時,抽樣結(jié)果表明小概率事件發(fā)生了,按檢驗法將拒絕H0,這樣就犯了所謂“棄真”的錯誤。給定顯著水平 ,由于所以棄真概率不超過顯著水平棄真概率為P(拒絕H0 | H0真) (8-11)第第類錯誤類錯誤(取偽)當(dāng)H0假時,抽樣結(jié)果表明小概率事件沒有發(fā)生,按檢驗法將接受H0,這樣就犯了所謂“取偽”的錯誤。取偽概率為P(接受H0 | H1真) (8-13)例例1 設(shè)總體 , 未知,求關(guān)于假設(shè)的U

35、檢驗法的兩類錯誤概率。),(2NX200:H01:HnXU/0解解 檢驗統(tǒng)計量20|unxu拒絕域2u棄真概率P(拒絕H0|H0真)=P(|U| )= 20unnXP) 0(022unXuP)()(22uu2u取偽概率P(拒絕H0|H0真)=P(|U| |H1真),0n0其中的真值二、兩類錯誤概率的控制 前面我們處理參數(shù)假設(shè)檢驗問題時,實際上只考慮了控制第I類(棄真)錯誤概率不超過顯著水平 。在一些實際問題中,如果錯誤地接受了某個假設(shè)可能造成重大損失或由此帶來災(zāi)難性的結(jié)果,因而在接受這類假設(shè)時要特別慎重,也就是要控制第類(取偽)錯誤概率。自然希望選擇一個優(yōu)良的檢驗方法,使得出現(xiàn)兩類錯誤的概率都

36、很小。定義定義 若 是 參數(shù)的某檢驗問題的一個檢驗法,當(dāng)H0假時,1- 表示取偽的概率)(將兩類錯誤概率用統(tǒng)一的函數(shù)表示出來:P)(拒絕H0 (814))(稱 為檢驗法 的功效函數(shù))(當(dāng)H0真時, 表示棄真的概率一個優(yōu)良的檢驗法 ,應(yīng)使 在H0真時盡可能小,在H0假時盡可能大。)(這兩方面的要求是矛盾的,正如在區(qū)間估計問題中,“置信度高”與“估計精確”是矛盾的。那里,我們采用在保證一定的置信度下使區(qū)間長度盡可能小的原則。選擇一種優(yōu)良檢驗的策略思想與此類似,即先保證棄真的概率不超過指定值 ,再設(shè)法控制取偽概率。)|(|2uUP)|(|12UUP)()(122uu為便于說明,繼續(xù)例8.9的討論。檢

37、驗的功效函數(shù)P)(拒絕H0)(0n其中取偽概率(記為 ))(h)(棄真概率)()()()(122huu(8-15)22222)(exp2)(exp21)(uuh由于1)()(22maxuuh00)(h當(dāng) 時00)(h當(dāng) 時0)(h當(dāng) 時取最大值當(dāng) 與 的偏差越大,取偽的概率越小;0此時, 越小, 越大,見圖81 當(dāng) 與 非常接受時,取偽的概率幾乎等于10其含義為:由此可知,當(dāng) 與n都給定時不可能同時控制兩類錯誤概率都很小下面先控制棄真的概率為再來考慮如何減小取偽概率0)(limh由于)()(1h要控制取為偽概率( 很小)|0n只要使足夠大|有兩種方法可使 增大(1)減小試驗誤差;(2)取樣本數(shù)

38、目n很大。在實際中,試驗誤差不可能無限小,因而一般采用加大樣本容量n的方法來控制取偽概率,但這是以消耗大量人力、物力、財力為代價的。在實際應(yīng)用中,要根據(jù)“棄真”或“取偽”所造成的有害程度來確定 、 的值。習(xí)題851設(shè)總體服從 ,給定顯著水平 ,用U檢驗法來檢驗假設(shè) ,若 ,參數(shù) 的真值為1.3。試求: 當(dāng)樣本容量n=25時,此U檢驗法犯第二類錯誤的概率; 若要求犯第二類錯誤的概率不超過0.1,樣本容量應(yīng)至少取為多大?)1 ,(N05. 00100:,:HH9 . 002設(shè)總體服從參數(shù)為 的泊松分布,參數(shù)未知,(X1,X2,X20)為其一個樣本,對下述假設(shè)檢驗問題 取拒絕域為:C=(x1,x2,

39、x20):x1+x2+x20=0)求犯第一類錯誤與第二類錯誤的概率。1 . 0:, 2 . 0:10HH第六節(jié) 非參數(shù)假設(shè)檢驗 前面我們討論了參數(shù)假設(shè)檢驗問題,所檢驗的對象是總體分布中的未知參數(shù),而總體分布函數(shù)的函數(shù)形式是已知的.若總體分布未知,對總體分布或有關(guān)參數(shù)所作的檢驗稱為非參數(shù)假設(shè)檢驗本節(jié)將討論幾種重要的非參數(shù)檢驗問題一、分布擬合檢驗 問題問題對某對象(產(chǎn)品、元件,農(nóng)作物等)的某特性指標(biāo)進(jìn)行測試,獲得一大批實驗數(shù)據(jù),如何利用這些數(shù)據(jù)(樣本)確定此指標(biāo)(總體)的概率分布要解決此問題,一般需要做以下兩方面的工作用極大似然估計法求出 的估計值k,1 k,1 第一步擬合總體分布形式如果事先沒有

40、任何關(guān)于總體分布的經(jīng)驗或依據(jù),對連續(xù)型總體,一般先把抽樣所獲得的數(shù)據(jù)進(jìn)行整理,然后作出樣本分組頻數(shù)分布直方圖.),(10kxF 由此確定總體分布函數(shù)形式k,1 其中是未知參數(shù)),(210kxF 從而猜測總體的分布函數(shù)為),()(:100kxFxFH ),()(:101kxFxFH 第二步 擬合好壞的檢驗設(shè)總體的真實分布為F(x),給定顯著水平及樣本觀測值x1,x2,xn,檢驗假設(shè)1樣本頻率分布直方圖第六章已經(jīng)介紹了直方圖及其作法,為這里的討論方便起見,對此再作一些介紹設(shè)總體X為連續(xù)型,下面利用樣本數(shù)值來擬合總體分布密度函數(shù)f(x)根據(jù)樣本值的情況,將其分為l組,各組范圍為,),),12110l

41、laaaaaa laaaa210其中),1iiiaaXA記nmfiiiiaaidxxfp1)(li,2, 1 lllmmmaaaaaa,),),),2112110mi=落在ai-1,ai)內(nèi)的樣本數(shù),則事件Ai發(fā)生的頻率為Ai發(fā)生的概率為作表此表稱為樣本分組頻數(shù)分布表1iiiaaf在每個區(qū)間ai-1,ai)上,以此區(qū)間為底,以為高作一矩形(i=1,2,l),這樣的圖形稱為樣本組頻率分布直力圖,見圖8.2iiaaiidxxfpf1)(因而每個小區(qū)間上的小矩形的面積接近于概率密度曲線之下該區(qū)間之上的曲邊梯形的面積一般來說,n越大且分組越細(xì),則直方圖的外廓曲線越接近于總體的概率密度曲線對離散型總體,

42、雖然不能畫樣本分組頻率直方圖,但仍可給出樣本分組頻數(shù)分布表第i個小區(qū)上矩形的面積為 ,由大數(shù)定律可知,當(dāng)n很大時,頻率接近于概率if2擬合優(yōu)度檢驗要檢驗假設(shè)H0,必須利用樣本建立用以衡量F(x)與F0(x)差異的統(tǒng)計量這種統(tǒng)計量有多種選擇,下面介紹皮爾遜(Person)2檢驗法在H0為真的前提下,事件Ai的概率為),(),(10110kikiixFxFp npi稱為事件Ai的理論頻數(shù),作表 lllnpnpnpaaaaaa,),),),2112110此表稱為分組理論頻數(shù)分布表它與樣本分組頻數(shù)分布表的差異反映了F(x)與F0(x)的差異用統(tǒng)計量liiiinpnpm122)((8-16)來衡量 皮爾

43、遜證明了以下定理顯然,H0的拒絕域形式為k2(k待定)若n很大( ),則當(dāng)H0成立時,50n) 1(22 kl近似定理定理于是得到H0的拒絕域為2皮爾遜 檢驗法是基于上述定理得到的)1(22kl(8-17)5inp在使用時必須注意n要足夠大,以及每個否則應(yīng)適當(dāng)合并組,以滿足這一要求。例例1 自1965年1月1日至1971年2月9日共2231天中,全世界記錄到震級4級及以上的地震共計162次,統(tǒng)計如下: 試檢驗相繼兩次地震間隔的天數(shù)服從指數(shù)分布。( ) 86681017263150出現(xiàn)的頻數(shù)震間隔天地403539303425292024151910145904相繼兩次地05. 00, 00,)(

44、)(:00 xxexfxfHr)()(:01xfxfH0726.02231162/1X由于總體為連續(xù)型,我們將X的可能取值的區(qū)間 分為9個互不重疊的小區(qū)間),09,.,2,1),1iaaii解解 按題意需檢驗假設(shè)由于 未知,先用極大似然估計求得 的估計為0, 00,1),(0726. 00 xxexFx)(1iiiaXaA取9, 2 , 1)()()(100iaFaFAPpiiii若H0真,則計算結(jié)果列于表8.25inp有些組的5inp應(yīng)適當(dāng)合并組,使每組均有 如第四列花括號所示。并組后的組數(shù)l=8。 0.56330.04610.78080.05688A9:39.5x 0.2486A8:34.

45、5x39.50.00690.20045.79960.03586A7:29.5x34.50.0126-0.32688.32680.05148A6:24.5x29.50.3248-1.971811.97180.073910A5:19.5x24.50.0024-0.204417.20440.106217A4:14.5x19.50.06441.262624.73740.152726A3:9.5x14.50.5884-4.575235.57520.219631A2:4.5x9.50.51754.834445.16560.278850A1:0 xyi時,取“+”號;當(dāng)xi S0.05(9) 故接受H0即認(rèn)

46、為播放音樂對生產(chǎn)率沒有顯著影響 2秩和檢驗)()(:210yFxFH)()(:211yFxFH從兩總體X,Y中分別取容量為n1,n2的樣本檢驗假設(shè)將兩總體的n1+n2觀測值放在一起,按從小到大的順序排列。若H0成立,則總體X,Y同分布,兩總體的觀測值應(yīng)較均勻地分布在此排列中。若分布不均勻,則認(rèn)為H0不成立如何構(gòu)造統(tǒng)計量來描述這種均勻性呢?)1)(21212121nnnnRR每個觀測值在此排列中的序號稱為這個觀測值的秩秩若有幾個觀測值相同,則每個觀測值的秩取為這幾個數(shù)的序號的平均值.求出每個觀測值的秩.將屬于總體X的樣本觀測值的秩相加,其和記為R1,稱為總體X的樣本秩和.同理,將其余觀測值的秩相

47、加得總體Y的樣本秩和R2.顯然,R1,R2為離散型隨機變量,且有21nn 設(shè)取T=R1為統(tǒng)計量若H0成立,秩和R1一般來說不應(yīng)取太靠近上述不等式兩端的值.因而,當(dāng)R1的觀測值過大或過小時,我們就拒絕H0拒絕域為其中T1,T2可由附表7查得1TT 2TT 或2.363.147.523.482.765.436.547.414.384.256.543.287.216.54試問兩總體是否同分布?( )05. 0例例4 設(shè)由實驗獲得,兩組樣本值,列表如下:解解 采用秩和檢驗法檢驗假設(shè))()(:210yFxFH)()(:211yFxFH其中F1(x),F(xiàn)2(y)分別為總體,的分布函數(shù)將兩組樣本觀測值混在一

48、起,按從小到大排序,并計算相應(yīng)的秩,列表如下:編號12345678910111213142.362.763.143.485.436.547.417.523.284.254.386.546.547.21秩1234567891011121314其中觀測值6.54出現(xiàn)3次,序號分別為9,10,11因而其秩應(yīng)為1031110981n62n 統(tǒng)計量491210107642RT12) 1(,2) 1(2121211nnnnnnnNT近似05. 0查秩和檢驗表(附表7),得由T1=32 T2=5821TTT由于 ,故接受H0 。即認(rèn)為兩組樣本對應(yīng)的總體同分布。10,21nn注意:秩和檢驗表只列到 的情形當(dāng)其大于10時,統(tǒng)計量于是可用U檢驗法求拒絕域。三、獨立性檢驗 在研究隨機量的概率性質(zhì)時,我們常假設(shè)兩個隨機變量獨立;在對兩個正態(tài)總體的參數(shù)作有關(guān)假設(shè)檢驗時,我們也常假定它們獨立.獨立性有時從直觀上容易判斷,但有時很難從直觀上判斷.如地下水位的變化是否與地震的發(fā)生獨立,某種疾病是否與性別有關(guān)等,需要根據(jù)實際觀測結(jié)果來檢驗獨立性是否成立。這種假設(shè)是否合理呢?), 1;, 1(sjrimij 設(shè)有兩個總體X,Y,給定顯著水平檢驗非參數(shù)假設(shè)H0:X,Y相互獨立將X的所有可能取值分為r個不同組A1,A2,Ar將Y的所有可能取值分為s個不同組B1,B2,Bs對(X,Y)進(jìn)行n次獨立觀測jiBYAX,分別

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論