概率論第七章假設檢驗_第1頁
概率論第七章假設檢驗_第2頁
概率論第七章假設檢驗_第3頁
概率論第七章假設檢驗_第4頁
概率論第七章假設檢驗_第5頁
已閱讀5頁,還剩114頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

概率論第七章假設檢驗第1頁,共119頁,2023年,2月20日,星期五§7.1

假設檢驗的基本思想與概念

7.1.1假設檢驗問題

例7.1.1

某廠生產的合金強度服從,其中的設計值為不低于110(Pa)。為保證質量,該廠每天都要對生產情況做例行檢查,以判斷生產是否正常進行,即該合金的平均強度不低于

110(Pa)。某天從生產中隨機抽取25塊合金,

測得強度值為x1,x2

,

…,x25,其均值為

(Pa),問當日生產是否正常?

第2頁,共119頁,2023年,2月20日,星期五(1)是參數估計問題嗎?(2)回答“是”還是“否”

,假設檢驗問題。(3)命題“合金平均強度不低于110Pa”正確與否僅涉及如下兩個參數集合:

這兩個非空參數集合都稱作統(tǒng)計假設,簡稱假設。

(4)我們的任務是利用樣本去判斷假設(命題)

”是否成立。這里的“判斷”在統(tǒng)計學中稱為檢驗或檢驗法則。

第3頁,共119頁,2023年,2月20日,星期五7.1.2假設檢驗的基本步驟

一、建立假設

在假設檢驗中,常把一個被檢驗的假設稱為原假設,用

表示,通常將不應輕易加以否定的假設作為原假設。當

被拒絕時而接收的假設稱為備擇假設,用

表示,它們常常成對出現。在例7.1.1中,我們可建立如下兩個假設:

第4頁,共119頁,2023年,2月20日,星期五二、選擇檢驗統(tǒng)計量,給出拒絕域形式由樣本對原假設進行判斷總是通過一個統(tǒng)計量完成的,該統(tǒng)計量稱為檢驗統(tǒng)計量。使原假設被拒絕的樣本觀測值所在區(qū)域稱為拒絕域,一般用W表示,在例7.1.1中,樣本均值愈大,意味著總體均值

也大,因此,合理的拒絕域形如第5頁,共119頁,2023年,2月20日,星期五正如在數學上我們不能用一個例子去證明一個結論一樣,用一個樣本(例子)不能證明一個命題(假設)是成立的,但可以用一個例子(樣本)推翻一個命題。因此,從邏輯上看,注重拒絕域是適當的。事實上,在“拒絕原假設”和“拒絕備擇假設(從而接收原假設)”之間還有一個模糊域,如今我們把它并入接收域,所以接收域是復雜的,將之稱為保留域也許更恰當,但習慣上已把它稱為接收域,沒有必要再進行改變,只是應注意它的含義。第6頁,共119頁,2023年,2月20日,星期五三、選擇顯著性水平檢驗可能犯以下兩類錯誤:

其一是

為真但樣本觀測值落在拒絕域中,從而拒絕原假設

,這種錯誤稱為第一類錯誤,其發(fā)生的概率稱為犯第一類錯誤的概率,或稱拒真概率,通常記為

其二是

不真(即

為真)但樣本觀測值落在接受域中,從而接受原假設

,這種錯誤稱為第二類錯誤,其發(fā)生的概率稱為犯第二類錯誤的概率,或稱受偽概率,通常記為

。第7頁,共119頁,2023年,2月20日,星期五觀測數據情況總體情況犯第一類錯誤正確正確犯第二類錯誤為真為真第8頁,共119頁,2023年,2月20日,星期五犯第一類錯誤的概率

和犯第二類錯誤的概率

可以用同一個函數表示,即所謂的勢函數。勢函數是假設檢驗中最重要的概念之一,定義如下:

定義7.1.1

設檢驗問題的拒絕域為W,則樣本觀測值落在拒絕域內的概率稱為該檢驗的勢函數,記為(7.1.3)第9頁,共119頁,2023年,2月20日,星期五勢函數

是定義在參數空間

上的一個函數。犯兩類錯誤的概率都是參數的函數,并可由勢函數算得,即:對例7.1.1,其拒絕域為,由(7.1.3)可以算出該檢驗的勢函數第10頁,共119頁,2023年,2月20日,星期五這個勢函數是的減函數

第11頁,共119頁,2023年,2月20日,星期五由此可得如下結論:

利用這個勢函數容易寫出犯兩類錯誤的概率分別為和第12頁,共119頁,2023年,2月20日,星期五

減小時,c也隨之減小,必導致的增大;

減小時,c會增大,必導致

的增大;說明:在樣本量一定的條件下不可能找到一個使和

都小的檢驗。

英國統(tǒng)計學家

Neyman和

Pearson提出水平為

的顯著性檢驗的概念。

第13頁,共119頁,2023年,2月20日,星期五則稱該檢驗是顯著性水平為的顯著性檢驗,簡稱水平為的檢驗。

定義7.1.2

對檢驗問題對如果一個檢驗滿足對任意的

,都有

第14頁,共119頁,2023年,2月20日,星期五四、給出拒絕域確定顯著性水平后,可以定出檢驗的拒絕域W。

在例7.1.1中,若取=0.05,由于g()關于單調減,只需要成立即可。這給出c的值為=108.684檢驗的拒絕域為第15頁,共119頁,2023年,2月20日,星期五若令則拒絕域有另一種表示:第16頁,共119頁,2023年,2月20日,星期五五、作出判斷

在有了明確的拒絕域后,根據樣本觀測值我們可以做出判斷:

或時,則拒絕

即接收

;

時,則接收

在例7.1.1中,由于因此拒絕原假設,即認為該日生產不正常。第17頁,共119頁,2023年,2月20日,星期五§7.2正態(tài)總體參數假設檢驗

參數假設檢驗常見的有三種基本形式(1)(2)(3)當備擇假設

在原假設

一側時的檢驗稱為單側檢驗;當備擇假設

分散在原假設

兩側時的檢驗稱為雙側檢驗。

第18頁,共119頁,2023年,2月20日,星期五7.2.1

單個正態(tài)總體均值的檢驗一、已知時的u檢驗設

是來自

的樣本,考慮關于的檢驗問題。檢驗統(tǒng)計量可選為三種假設的拒絕域形式分別見下圖:第19頁,共119頁,2023年,2月20日,星期五(a)(b)(c)第20頁,共119頁,2023年,2月20日,星期五該檢驗用u檢驗統(tǒng)計量,故稱為u檢驗。

下面以為例說明:由可推出具體的拒絕域為該檢驗的勢函數是的函數,它可用正態(tài)分布寫出,具體為

第21頁,共119頁,2023年,2月20日,星期五勢函數是的增函數(見圖),只要

就可保證在

時有7.2.1(a)的圖形第22頁,共119頁,2023年,2月20日,星期五對單側檢驗是類似的,只是拒絕域變?yōu)?其勢函數為對雙側檢驗問題(7.2.3),拒絕域為其勢函數為第23頁,共119頁,2023年,2月20日,星期五7.2.1(b)(c)的圖形第24頁,共119頁,2023年,2月20日,星期五例7.2.1

從甲地發(fā)送一個訊號到乙地。設乙地接受到的訊號值服從正態(tài)分布

其中

為甲地發(fā)送的真實訊號值。現甲地重復發(fā)送同一訊號5次,乙地接收到的訊號值為

8.058.158.28.18.25設接受方有理由猜測甲地發(fā)送的訊號值為8,問能否接受這猜測?第25頁,共119頁,2023年,2月20日,星期五解:這是一個假設檢驗的問題,總體X~N(,0.22),檢驗假設:這個雙側檢驗問題的拒絕域為取置信水平=0.05,則查表知u0.975=1.96。用觀測值可計算得u值未落入拒絕域內,故不能拒絕原假設,即接受原假設,可認為猜測成立。第26頁,共119頁,2023年,2月20日,星期五二、未知時的t檢驗由于

未知,一個自然的想法是將(7.2.4)中未知的替換成樣本標準差s,這就形成t檢驗統(tǒng)計量(7.2.9)三種假設的檢驗拒絕域分別為第27頁,共119頁,2023年,2月20日,星期五例7.2.2

某廠生產的某種鋁材的長度服從正態(tài)分布,其均值設定為240厘米?,F從該廠抽取5件產品,測得其長度為(單位:厘米)239.7239.6239240239.2試判斷該廠此類鋁材的長度是否滿足設定要求?

解:這是一個關于正態(tài)均值的雙側假設檢驗問題。采用t檢驗,拒絕域為:第28頁,共119頁,2023年,2月20日,星期五現由樣本計算得到:t==2.7951由于2.7951>2.776,故拒絕原假設,認為該廠生產的鋁材的長度不滿足設定要求。

若取=0.05,則t0.975(4)=2.776.故第29頁,共119頁,2023年,2月20日,星期五檢驗法條件檢驗統(tǒng)計量拒絕域u

檢驗已知t

檢驗未知原假設備擇假設表7.2.1單個正態(tài)總體的均值的檢驗問題第30頁,共119頁,2023年,2月20日,星期五三、假設檢驗與置信區(qū)間的關系

這里用的檢驗統(tǒng)計量與6.5.5節(jié)中置信區(qū)間所用的樞軸量是相似的。這不是偶然的,兩者之間存在非常密切的關系。設

是來自正態(tài)總體

的樣本,現在未知場合討論關于均值的檢驗問題。考慮雙側檢驗問題:第31頁,共119頁,2023年,2月20日,星期五它可以改寫為并且有若讓0

在(-)內取值,就可得到的1-置信區(qū)間:

這里0并無限制.則水平為的檢驗接收域為

第32頁,共119頁,2023年,2月20日,星期五關于的水平為的顯著性檢驗。是一一對應的。

類似地,“參數的1-置信上限”與“關于

的單側檢驗問題的水平的檢驗”反之若有一個如上的1-置信區(qū)間,也可獲得所以:“正態(tài)均值的1-置信區(qū)間”與“關于

的雙側檢驗問題的水平的檢驗”參數的1-置信下限與另一個單側檢驗也是一一對應的。是一一對應的。

第33頁,共119頁,2023年,2月20日,星期五7.2.2兩個正態(tài)總體均值差的檢驗檢驗法條件原假設備擇假設檢驗統(tǒng)計量拒絕域u檢驗已知t檢驗未知第34頁,共119頁,2023年,2月20日,星期五大樣本檢u

未知m,n充分大近似t

檢驗未知m,n不很大第35頁,共119頁,2023年,2月20日,星期五例7.2.3

某廠鑄造車間為提高鑄件的耐磨性而試制了一種鎳合金鑄件以取代銅合金鑄件,為此,從兩種鑄件中各抽取一個容量分別為

8和9的樣本,測得其硬度為

鎳合金:76.4376.2173.5869.6965.2970.8382.7572.34銅合金:73.6664.2769.3471.3769.7768.1267.2768.0762.61根據經驗,硬度服從正態(tài)分布,且方差保持不變。試在顯著性水平下判斷鎳合金的硬度是否有明顯提高。第36頁,共119頁,2023年,2月20日,星期五解:用X表示鎳合金的硬度,Y表示銅合金的硬度,則由假定,

要檢驗的假設是:

經計算,

從而第37頁,共119頁,2023年,2月20日,星期五查表知由于故拒絕原假設,可判斷鎳合金硬度有顯著提高。第38頁,共119頁,2023年,2月20日,星期五7.2.3正態(tài)總體方差的檢驗一、單個正態(tài)總體方差的檢驗

是來自

的樣本,對方差亦可考慮如下三個檢驗問題:

通常假定未知,它們采用的檢驗統(tǒng)計量是第39頁,共119頁,2023年,2月20日,星期五相同的,均為

若取顯著性水平為,則對應三個檢驗問題的拒絕域依次分別為第40頁,共119頁,2023年,2月20日,星期五例7.2.4

某類鋼板每塊的重量X服從正態(tài)分布,其一項質量指標是鋼板重量的方差不得超過

0.016(kg2)?,F從某天生產的鋼板中隨機抽取

25塊,得其樣本方差S2=0.025(kg2),問該天生產的鋼板重量的方差是否滿足要求。解:原假設為備擇假設為此處n=25,若取=0.05,則查表知第41頁,共119頁,2023年,2月20日,星期五由此,在顯著性水平0.05下,我們拒絕原假設,認為該天生產的鋼板重量不符合要求。現計算可得第42頁,共119頁,2023年,2月20日,星期五二、兩個正態(tài)總體方差比的F檢驗

是來自

的樣本,

是來自

的樣本??紤]如下三個假設檢驗問題

通常,均未知,記,分別是由算得的

的無偏估計和由

算得的

的無偏估計.第43頁,共119頁,2023年,2月20日,星期五可建立檢驗統(tǒng)計量:三種檢驗問題對應的拒絕域依次為}。

或第44頁,共119頁,2023年,2月20日,星期五例7.2.5

甲、乙兩臺機床加工某種零件,零件的直徑服從正態(tài)分布,總體方差反映了加工精度,為比較兩臺機床的加工精度有無差別,現從各自加工的零件中分別抽取7件產品和8

件產品,測得其直徑為

X(機床甲)16.216.415.815.516.715.615.8Y(機床乙)15.916.016.416.116.515.815.715.0第45頁,共119頁,2023年,2月20日,星期五這就形成了一個雙側假設檢驗問題,原假設是

備擇假設為此處m=7,n=8,經計算查表知于是

,若取

=0.05,其拒絕域為第46頁,共119頁,2023年,2月20日,星期五由此可見,樣本未落入拒絕域,即在0.05水平下可以認為兩臺機床的加工精度一致。

第47頁,共119頁,2023年,2月20日,星期五§7.3其他分布參數的假設檢驗7.3.1指數分布參數的假設檢驗設x1,x2

,

…,xn是來自指數分布的樣本,關于的如下檢驗問題:

(7.3.1)拒絕域的形式是

,由于在=0時,所以拒絕域為第48頁,共119頁,2023年,2月20日,星期五例7.3.1

設我們要檢驗某種元件的平均壽命不小于6000小時,假定元件壽命為指數分布,現取

5個元件投入試驗,觀測到如下5個失效時間:395,4094,119,11572,6133。

解:由于待檢驗的假設為

若取=0.05,則檢驗拒絕域為:

第49頁,共119頁,2023年,2月20日,星期五故接受原假設,可以認為平均壽命不低于6000小時.經計算得第50頁,共119頁,2023年,2月20日,星期五7.3.2比例的檢驗比例

p可看作某事件發(fā)生的概率。作

n次獨立試驗,以

x記該事件發(fā)生的次數,則

。我們可以根據

x檢驗關于

p的一些假設:

(1)直觀上看拒絕域為:

,由于x只取整數值,故c可限制在非負整數中。第51頁,共119頁,2023年,2月20日,星期五這是在對離散總體作假設檢驗中普遍會遇到的問題.一般情況下,對給定的,不一定能正好取到一個正整數c使下式成立:第52頁,共119頁,2023年,2月20日,星期五一般較常見的是找一個c0,使得

(2)檢驗的拒絕域為:c為滿足的最大正整數。第53頁,共119頁,2023年,2月20日,星期五(3)檢驗的拒絕域為:或其中c1為滿足下式的最大正整數:c2為滿足下式的最小正整數:第54頁,共119頁,2023年,2月20日,星期五例7.3.2某廠生產的產品優(yōu)質品率一直保持在

40%,近期對該廠生產的該類產品抽檢20

件,其中優(yōu)質品7件,在下能否認為優(yōu)質品率仍保持在40%?

解:以p表示優(yōu)質品率,x表示20件產品中的優(yōu)質品件數,則

,待檢驗的假設為拒絕域為或第55頁,共119頁,2023年,2月20日,星期五由于下求c1與c2:故取c1=3,又因為從而c2=12,拒絕域為附帶指出,該拒絕域的顯著性水平實際上不是0.05,而是0.0160+0.021=0.0370。由于觀測值沒有落入拒絕域,故接受原假設。

或第56頁,共119頁,2023年,2月20日,星期五7.3.3大樣本檢驗

在二點分布參數p的檢驗問題中,臨界值的確定比較繁瑣,使用不太方便。如果樣本量較大,我們可用近似的檢驗方法——大樣本檢驗。大樣本檢驗一般思路如下:設是來自某總體的樣本,又設該總體均值為,方差為的函數,記為

,譬如,對二點分布b(1,),其方差(1-)是均值的函數,則在樣本容量n充分大時,

第57頁,共119頁,2023年,2月20日,星期五故可采用如下檢驗:由此近似地確定拒絕域。統(tǒng)計量

第58頁,共119頁,2023年,2月20日,星期五例7.3.3

某廠產品的不合格品率為10%,在一次例行檢查中,隨機抽取80件,發(fā)現有

11件不合格品,在=0.05下能否認為不合格品率仍為10%?解:這是關于不合格品率的檢驗,假設為:第59頁,共119頁,2023年,2月20日,星期五若取=0.05,則u0.975=1.96,故拒絕域為

故不能拒絕原假設。因為n=80比較大,可采用大樣本檢驗方法。檢驗統(tǒng)計量為第60頁,共119頁,2023年,2月20日,星期五例7.3.4

某建筑公司宣稱其麾下建筑工地平均每天發(fā)生事故數不超過0.6起,現記錄了該公司麾下建筑工地200天的安全生產情況,事故數記錄如下:天數10259308010200一天發(fā)生的事故數012345合計6試檢驗該建筑公司的宣稱是否成立(取=0.05)。

第61頁,共119頁,2023年,2月20日,星期五解:以X記建筑工地一天發(fā)生的事故數,可認為

,要檢驗的假設是:

由于n=200很大,可以采用大樣本檢驗,泊松分布的均值和方差都是,這里

,檢驗統(tǒng)計量為第62頁,共119頁,2023年,2月20日,星期五若取=0.05,則

u0.95=1.645,拒絕域為如今u=2.556已落入拒絕域,故拒絕原假設,認為該建筑公司的宣稱明顯不成立。

第63頁,共119頁,2023年,2月20日,星期五大樣本檢驗是近似的:近似的含義是指檢驗的實際顯著性水平與原先設

定的顯著性水平有差距,這是由于諸如(7.3.12)中

u的分布與N(0,1)有距離。如果n很大,則這種差異就很小。實用中我們一般并不清楚對一定的n,

u的分布與N(0,1)的差異有多大,因而也就不能確定檢驗的實際水平與設定水平究竟差多少。在區(qū)間估計中也有類似問題。因此,大樣本方法是一個“不得已而為之”的方法。只要有基于精確分布的方法一般總是首先要加以考慮的。第64頁,共119頁,2023年,2月20日,星期五7.3.4檢驗的p值假設檢驗的結論通常是簡單的:在給定的顯著水平下,不是拒絕原假設就是保留原假設。然而有時也會出現這樣的情況:在一個較大的顯著水平(=0.05)下得到拒絕原假設的結論,而在一個較小的顯著水平(=0.01)下卻會得到相反的結論。這種情況在理論上很容易解釋:第65頁,共119頁,2023年,2月20日,星期五因為顯著水平變小后會導致檢驗的拒絕域變小,于是原來落在拒絕域中的觀測值就可能落入接受域。但這種情況在應用中會帶來一些麻煩:假如這時一個人主張選擇顯著水平=0.05,而另一個人主張選=0.01,則第一個人的結論是拒絕H0,而后一個人的結論是接受H0,我們該如何處理這一問題呢?第66頁,共119頁,2023年,2月20日,星期五例7.3.5

一支香煙中的尼古丁含量X服從正態(tài)分布N(,1),質量標準規(guī)定不能超過1.5毫克。現從某廠生產的香煙中隨機抽取20支測得其中平均每支香煙的尼古丁含量為

毫克,試問該廠生產的香煙尼古丁含量是否符合質量標準的規(guī)定。這是一個假設檢驗問題:H0:1.5,H1:>1.5,采用u檢驗,計算得:第67頁,共119頁,2023年,2月20日,星期五對一些的顯著性水平,表7.3.1列出了相應的拒絕域和檢驗結論。表7.3.1例7.3.5中的拒絕域顯著性水平拒絕域u=2.10對應的結論=0.05u1.645拒絕H0=0.025u1.96拒絕H0=0.01u2.33接受H0=0.005u2.58接受H0我們看到,不同的有不同的結論。

第68頁,共119頁,2023年,2月20日,星期五現在換一個角度來看,在=1.5時,u的分布是N(0,1)。此時可算得,P(u2.10)=0.0179,若以0.0179為基準來看上述檢驗問題,可得

當<0.0179時,

>2.10。于是2.10就不在中,此時應接受原假設H0;

當0.0179時,

2.10。于是2.10就落在中,此時應拒絕H0。u由此可以看出,0.0179是能用觀測值2.10做出“拒絕H0”的最小的顯著性水平,這就是p值。u第69頁,共119頁,2023年,2月20日,星期五定義7.3.1

在一個假設檢驗問題中,利用觀測值能夠做出拒絕原假設的最小顯著性水平稱為檢驗的p值。

引進檢驗的p值的概念有明顯的好處:第一,它比較客觀,避免了事先確定顯著水平;其次,由檢驗的p值與人們心目中的顯著性水平進行比較可以很容易作出檢驗的結論:第70頁,共119頁,2023年,2月20日,星期五

如果

p,則在顯著性水平下拒絕H0;

如果<p,則在顯著性水平下保留H0.p值在應用中很方便,如今的統(tǒng)計軟件中對檢驗問題一般都會給出檢驗的p值。第71頁,共119頁,2023年,2月20日,星期五例7.3.6

是來自b(1,)的樣本,要檢驗如下假設:若取顯著性水平為,則在得到觀測值后,我們只需要計算概率:

這就是檢驗的p值。譬如若取=0.05,由于p<

,則應拒絕原假設。第72頁,共119頁,2023年,2月20日,星期五例7.3.7

某工廠兩位化驗員甲、乙分別獨立地用相同方法對某種聚合物的含氯量進行測定。甲測9次,樣本方差為0.7292;乙測11次,樣本方差為0.2114。假定測量數據服從正態(tài)分布,試對兩總體方差作一致性檢驗:第73頁,共119頁,2023年,2月20日,星期五檢驗統(tǒng)計量為,在原假設成立下,

F

F(8,10),拒絕域為

如今我們不是把拒絕域具體化,而是由觀測值算得F=0.7292/0.2114=3.4494,再去計算該檢驗的p

值。

或第74頁,共119頁,2023年,2月20日,星期五首先,我們用F分布算得其次考慮到雙側檢驗的拒絕域W分散在兩端,且兩端尾部概率相等(見圖7.3.2),據此可定出p值為

此p值不算很小,若=0.05,則接收兩方差相等的假設。在這種雙側檢驗情況下,如何由觀測值F=3.4494算得p值呢?第75頁,共119頁,2023年,2月20日,星期五圖7.3.2

觀測值F=3.4494對應的p值由兩端尾部概率之和確定第76頁,共119頁,2023年,2月20日,星期五§7.4分布擬合檢驗7.4.1總體分布只取有限個值的情況

設總體X可以分成k類,記為

,現對該總體作了n次觀測,k個類出現的頻數分別為:檢驗如下假設:n1,…,nk,且其中諸且第77頁,共119頁,2023年,2月20日,星期五一、諸pi均已知如果H0成立,則對每一類Ai,其頻率ni/n與概率pi應較接近。即觀測頻數ni

與理論頻數npi

應相差不大。據此,英國統(tǒng)計學家K.Pearson提出如下檢驗統(tǒng)計量:(7.4.2)并證明在H0成立時對充分大的n,(7.4.2)

給出的檢驗統(tǒng)計量近似服從自由度為k-1的分布。拒絕域為:第78頁,共119頁,2023年,2月20日,星期五例7.4.1

為募集社會福利基金,某地方政府發(fā)行福利彩票,中彩者用搖大轉盤的方法確定最后中獎金額。大轉盤均分為20份,其中金額為5萬、10萬、20萬、30萬、50萬、100萬的分別占2份、4份、6份、4份、2份、2份。假定大轉盤是均勻的,則每一點朝下是等可能的,于是搖出各個獎項的概率如下:

第79頁,共119頁,2023年,2月20日,星期五概率0.10.20.30.20.10.1額度5萬10萬20萬30萬50萬100萬現20人參加搖獎,搖得5萬、10萬、20萬、30萬、50萬和100萬的人數分別為2、6、6、3、3、0,由于沒有一個人搖到100萬,于是有人懷疑大轉盤是不均勻的,那么該懷疑是否成立呢?這就需要對轉盤的均勻性作檢驗。第80頁,共119頁,2023年,2月20日,星期五解:這是一個典型的分布擬合優(yōu)度檢驗,總體共有6類,其發(fā)生概率分別為0.1、0.2、0.3、

0.2、0.1和0.1,這里k=6,檢驗拒絕域為:由本例數據可以算出若取=0.05,則查附表3知=第81頁,共119頁,2023年,2月20日,星期五由于未落入拒絕域,故接受原假設,沒有理由認為轉盤不均勻。在分布擬合檢驗中使用p值也是方便的。本例中,以T記服從

(5)的隨機變量,則使用統(tǒng)計軟件可以算出這個p值就反映了數據與假設的分布擬合程度的高低,p值越大,擬合越好。第82頁,共119頁,2023年,2月20日,星期五二、諸pi不完全已知

若諸

由r(r<k)個未知參數

確定,即

首先給出

的極大似然估計然后給出諸

的極大似然估計Fisher證明了

在H0成立時近似服從自由度為k-r-1的

分布,于是檢驗拒絕域為第83頁,共119頁,2023年,2月20日,星期五例7.4.2

盧瑟福在2608個等時間間隔內觀測一枚放射性物質放射的粒子數X,表7.4.1是觀測結果的匯總,其中ni表示2608次觀測中放射粒子數為i的次數。

ni572033835255324082731394527106i012345678910

11試利用該組數據檢驗該放射物質在單位時間內放射出的粒子數是否服從泊松分布。

第84頁,共119頁,2023年,2月20日,星期五解:本例中,要檢驗總體是否服從泊松分布。

觀測到0,1,…,11共12個不同取值,這相當于把總體分成12類。這里有一個未知參數,采用極大似然估計,

=將

代入可以估計出諸

。于是可計算出第85頁,共119頁,2023年,2月20日,星期五列表如下。012345678910115720338352553240827313945271060.02090.08070.15620.20150.19500.15090.09730.05380.02600.01120.00430.002254.5210.5407.4525.5508.6393.5253.8140.367.829.211.25.70.11470.26721.46140.00051.07660.53431.45250.01207.66730.16580.12580.0158合計26081.00002068=12.8967i第86頁,共119頁,2023年,2月20日,星期五本例中

=12.8967<18.307,故接受原假設。使用統(tǒng)計軟件可以計算出此處檢驗的p值是0.2295。

若取=0.05,則第87頁,共119頁,2023年,2月20日,星期五列聯表是將觀測數據按兩個或更多屬性(定性變量)分類時所列出的頻數表。例如,對隨機抽取的1000人按性別(男或女)及色覺(正?;蛏?兩個屬性分類,得到如下二維列聯表,又稱2×2表或四格表。

7.4.2

列聯表的獨立性檢驗第88頁,共119頁,2023年,2月20日,星期五男53565女38218性別視覺正常色盲第89頁,共119頁,2023年,2月20日,星期五一般,若總體中的個體可按兩個屬性A與B分類,A有r個類,B有c個類從總體中抽取大小為n的樣本,設其中有個個體既屬于類又屬于類,稱為頻數,將rc個排列為一個r行c列的二維列聯表,簡稱rc表(表7.4.3)。

第90頁,共119頁,2023年,2月20日,星期五表7.4.3rc列聯表第91頁,共119頁,2023年,2月20日,星期五列聯表分析的基本問題是:考察各屬性之間有無關聯,即判別兩屬性是否獨立。如在前例中,問題是:一個人是否色盲與其性別是否有關?在rc表中,若以

分別表示總體中的個體僅屬于

,僅屬于

和同時屬于

的概率,可得一個二維離散分布表(表7.4.4),則“A、B兩屬性獨立”的假設可以表述為第92頁,共119頁,2023年,2月20日,星期五表7.4.4

二維離散分布表第93頁,共119頁,2023年,2月20日,星期五這就變?yōu)樯弦恍」?jié)中諸

不完全已知時的分布擬合檢驗。這里諸

共有rc個參數,在原假設H0成立時,這rc個參數

由r+c個參數

決定。在這r+c后個參數中存在兩個約束條件:

所以,此時

實際上由r+c-2個獨立參數所確定。據此,檢驗統(tǒng)計量為

第94頁,共119頁,2023年,2月20日,星期五在H0成立時,上式服從自由度為rc-(r+c-2)-1的

分布。其中諸

是在H0成立下得到的

的極大似然估計,其表達式為

對給定的顯著性水平,檢驗的拒絕域為:第95頁,共119頁,2023年,2月20日,星期五例7.4.3

為研究兒童智力發(fā)展與營養(yǎng)的關系,某研究機構調查了1436名兒童,得到如表7.4.5的數據,試在顯著性水平0.05下判斷智力發(fā)展與營養(yǎng)有無關系。

表7.4.5兒童智力與營養(yǎng)的調查數據營養(yǎng)良好營養(yǎng)不良合計

智商合計3423672663291304564020132164233822863451436<8080909099100第96頁,共119頁,2023年,2月20日,星期五解:用A表示營養(yǎng)狀況,它有兩個水平:表示

營養(yǎng)良好,

表示營養(yǎng)不良;B表示兒童智商,它有四個水平,

分別表示表中四種情況。沿用前面的記號,首先建立假設

H0:營養(yǎng)狀況與智商無關聯,即A與B獨立的。統(tǒng)計表示如下:

在原假設H0成立下,我們可以計算諸參數的極大似然估計值:

第97頁,共119頁,2023年,2月20日,星期五進而可給出諸

,如其它結果見表7.4.6第98頁,共119頁,2023年,2月20日,星期五表7.4.6

的計算結果

營養(yǎng)良好384.1677346.8724259.7631313.35880.90810.29460.26600.19920.2403營養(yǎng)不良38.877935.103626.288131.71200.0919<8080909099100由表7.4.5和表7.4.6可以計算檢驗統(tǒng)計量的值第99頁,共119頁,2023年,2月20日,星期五此處r=2,c=4,(r-1)(c-1)=3,若取=0.05,查表有

,由于19.2785>7.815,故拒絕原假設,認為營養(yǎng)狀況對智商有影響。本例中檢驗的p值為0.0002。第100頁,共119頁,2023年,2月20日,星期五7.4.3正態(tài)性檢驗正態(tài)分布是最常用的分布,用來判斷總體分布是否為正態(tài)分布的檢驗方法稱為正態(tài)性檢驗,它在實際問題中大量使用。一、正態(tài)概率紙正態(tài)概率紙可用來作正態(tài)性檢驗,方法如下:利用樣本數據在概率紙上描點,用目測方法看這些點是否在一條直線附近,若是的話,可以認為該數據來自正態(tài)總體,若明顯不在一條直線附近,則認為該數據來自非正態(tài)總體。第101頁,共119頁,2023年,2月20日,星期五例7.4.4

隨機選取10個零件,測得其直徑與標準尺寸的偏差如下:(單位:絲)

9.48.89.610.210.17.211.18.28.69.6在正態(tài)概率紙上作圖步驟如下:

(1)首先將數據排序:7.28.28.68.89.49.69.810.110.211.1;(2)對每一個i,計算修正頻率(i-0.375)/(n+0.25),i=1,2,…,n,第102頁,共119頁,2023年,2月20日,星期五(3)將點

逐一點在正態(tài)概率紙上,(4)觀察上述n個點的分布:

若諸點在一條直線附近,則認為該批數據來自正態(tài)總體;若諸點明顯不在一條直線附近,則認為該批數據的總體不是正態(tài)分布。

第103頁,共119頁,2023年,2月20日,星期五從圖7.4.2可以看到,10個點基本在一條直線附近,故可認為直徑與標準尺寸的偏差服從正態(tài)分布。

第104頁,共119頁,2023年,2月20日,星期五如果從正態(tài)概率紙上確認總體是非正態(tài)分布時,可對原始數據進行變換后再在正態(tài)概率紙上描點,若變換后的點在正態(tài)概率紙上近似在一條直線附近,則可以認為變換后的數據來自正態(tài)分布,這樣的變換稱為正態(tài)性變換。常用的正態(tài)性變換有如下三個:對數變換

、倒數變換

和根號變換

。

第105頁,共119頁,2023年,2月20日,星期五圖7.4.3給出這10個點在正態(tài)概率紙上的圖形,這10個點明顯不在一條直線附近,所以可以認為該電子元件的壽命的分布不是正態(tài)分布。例7.4.5

隨機抽取某種電子元件10個,測得其壽命數據如下:110.47,99.16,97.04,77.60,4269.82,539.35,179.49,782.93,561.10,286.80.第106頁,共119頁,2023年,2月20日,星期五

圖7.4.3例7.4.5的正態(tài)概率紙第107頁,共119頁,2023年,2月20日,星

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論