概統(tǒng)(茆詩松)第二版第七章假設(shè)檢驗_第1頁
概統(tǒng)(茆詩松)第二版第七章假設(shè)檢驗_第2頁
概統(tǒng)(茆詩松)第二版第七章假設(shè)檢驗_第3頁
概統(tǒng)(茆詩松)第二版第七章假設(shè)檢驗_第4頁
概統(tǒng)(茆詩松)第二版第七章假設(shè)檢驗_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

7.2.2兩個正態(tài)總體均值差的檢驗檢驗法條件原假設(shè)備擇假設(shè)檢驗統(tǒng)計量拒絕域u檢驗已知t檢驗未知大樣本檢u驗

未知m,n充分大近似t檢驗未知m,n不很大例7.2.3

某廠鑄造車間為提高鑄件的耐磨性而試制了一種鎳合金鑄件以取代銅合金鑄件,為此,從兩種鑄件中各抽取一個容量分別為

8和9的樣本,測得其硬度為

鎳合金:76.4376.2173.5869.6965.2970.8382.7572.34銅合金:73.6664.2769.3471.3769.7768.1267.2768.0762.61根據(jù)經(jīng)驗,硬度服從正態(tài)分布,且方差保持不變。試在顯著性水平下判斷鎳合金的硬度是否有明顯提高。解:用X表示鎳合金的硬度,Y表示銅合金的硬度,則由假定,

要檢驗的假設(shè)是:

經(jīng)計算,

從而二、兩個正態(tài)總體方差比的F檢驗

設(shè)

是來自

的樣本,

是來自

的樣本??紤]如下三個假設(shè)檢驗問題

通常

,均未知,記

,分別是由算得的

的無偏估計和由

算得的

的無偏估計.可建立檢驗統(tǒng)計量:三種檢驗問題對應(yīng)的拒絕域依次為}。

或例7.2.5

甲、乙兩臺機(jī)床加工某種零件,零件的直徑服從正態(tài)分布,總體方差反映了加工精度,為比較兩臺機(jī)床的加工精度有無差別,現(xiàn)從各自加工的零件中分別抽取7件產(chǎn)品和8

件產(chǎn)品,測得其直徑為

X(機(jī)床甲)16.216.415.815.516.715.615.8Y(機(jī)床乙)15.916.016.416.116.515.815.715.0這就形成了一個雙側(cè)假設(shè)檢驗問題,原假設(shè)是

備擇假設(shè)為此處m=7,n=8,經(jīng)計算查表知于是

,若取

=0.05,其拒絕域為由此可見,樣本未落入拒絕域,即在0.05水平下可以認(rèn)為兩臺機(jī)床的加工精度一致。

§7.3

其他分布參數(shù)的假設(shè)檢驗7.3.1指數(shù)分布參數(shù)的假設(shè)檢驗設(shè)x1,x2

,

…,xn

是來自指數(shù)分布的樣本,關(guān)于的如下檢驗問題:

(7.3.1)拒絕域的形式是

,由于在=0時,所以拒絕域為例7.3.1

設(shè)我們要檢驗?zāi)撤N元件的平均壽命不小于6000小時,假定元件壽命為指數(shù)分布,現(xiàn)取

5個元件投入試驗,觀測到如下5個失效時間:395,4094,119,11572,6133。

解:由于待檢驗的假設(shè)為

若取=0.05,則檢驗拒絕域為:

故接受原假設(shè),可以認(rèn)為平均壽命不低于6000小時.經(jīng)計算得7.3.2比例的檢驗比例

p可看作某事件發(fā)生的概率。作

n次獨立試驗,以

x記該事件發(fā)生的次數(shù),則

。我們可以根據(jù)

x檢驗關(guān)于

p的一些假設(shè):

(1)

直觀上看拒絕域為:

,由于x只取整數(shù)值,故c可限制在非負(fù)整數(shù)中。這是在對離散總體作假設(shè)檢驗中普遍會遇到的問題.一般情況下,對給定的a,不一定能正好取到一個正整數(shù)c使下式成立:一般較常見的是找一個c0,使得

(2)檢驗的拒絕域為:c為滿足的最大正整數(shù)。(3)檢驗的拒絕域為:或其中c1為滿足下式的最大正整數(shù):c2為滿足下式的最小正整數(shù):例7.3.2某廠生產(chǎn)的產(chǎn)品優(yōu)質(zhì)品率一直保持在

40%,近期對該廠生產(chǎn)的該類產(chǎn)品抽檢20

件,其中優(yōu)質(zhì)品7件,在下能否認(rèn)為優(yōu)質(zhì)品率仍保持在40%?

解:以p表示優(yōu)質(zhì)品率,x表示20件產(chǎn)品中的優(yōu)質(zhì)品件數(shù),則

,待檢驗的假設(shè)為拒絕域為或由于下求c1與c2:故取c1=3,又因為從而c2=12,拒絕域為附帶指出,該拒絕域的顯著性水平實際上不是0.05,而是0.0160+0.021=0.0370。由于觀測值沒有落入拒絕域,故接受原假設(shè)。

或7.3.3大樣本檢驗

在二點分布參數(shù)p的檢驗問題中,臨界值的確定比較繁瑣,使用不太方便。如果樣本量較大,我們可用近似的檢驗方法——大樣本檢驗。大樣本檢驗一般思路如下:設(shè)是來自某總體的樣本,又設(shè)該總體均值為,方差為的函數(shù),記為

,譬如,對二點分布b(1,),其方差(1-)是均值的函數(shù),則在樣本容量n充分大時,

故可采用如下檢驗:由此近似地確定拒絕域。統(tǒng)計量

例7.3.3

某廠產(chǎn)品的不合格品率為

10%,在一次例行檢查中,隨機(jī)抽取80件,發(fā)現(xiàn)有

11件不合格品,在=0.05下能否認(rèn)為不合格品率仍為10%?解:這是關(guān)于不合格品率的檢驗,假設(shè)為:若取=0.05,則u0.975=1.96,故拒絕域為

故不能拒絕原假設(shè)。因為n=80比較大,可采用大樣本檢驗方法。檢驗統(tǒng)計量為例

7.3.4

某建筑公司宣稱其麾下建筑工地平均每天發(fā)生事故數(shù)不超過0.6起,現(xiàn)記錄了該公司麾下建筑工地200天的安全生產(chǎn)情況,事故數(shù)記錄如下:天數(shù)10259308010200一天發(fā)生的事故數(shù)012345合計6試檢驗該建筑公司的宣稱是否成立(取=0.05)。

解:以X記建筑工地一天發(fā)生的事故數(shù),可認(rèn)為

,要檢驗的假設(shè)是:

由于n=200很大,可以采用大樣本檢驗,泊松分布的均值和方差都是,這里

,檢驗統(tǒng)計量為若取=0.05,則

u0.95=1.645,拒絕域為如今u=2.556已落入拒絕域,故拒絕原假設(shè),認(rèn)為該建筑公司的宣稱明顯不成立。

大樣本檢驗是近似的:

近似的含義是指檢驗的實際顯著性水平與原先設(shè)

定的顯著性水平有差距,這是由于諸如(7.3.12)中

u

的分布與N(0,1)有距離。如果n

很大,則這種差異就很小。實用中我們一般并不清楚對一定的n,

u

的分布與N(0,1)的差異有多大,因而也就不能確定檢驗的實際水平與設(shè)定水平究竟差多少。在區(qū)間估計中也有類似問題。因此,大樣本方法是一個“不得已而為之”的方法。只要有基于精確分布的方法一般總是首先要加以考慮的。7.3.4檢驗的p值假設(shè)檢驗的結(jié)論通常是簡單的:在給定的顯著水平下,不是拒絕原假設(shè)就是保留原假設(shè)。然而有時也會出現(xiàn)這樣的情況:在一個較大的顯著水平(=0.05)下得到拒絕原假設(shè)的結(jié)論,而在一個較小的顯著水平(=0.01)下卻會得到相反的結(jié)論。這種情況在理論上很容易解釋:因為顯著水平變小后會導(dǎo)致檢驗的拒絕域變小,于是原來落在拒絕域中的觀測值就可能落入接受域。但這種情況在應(yīng)用中會帶來一些麻煩:假如這時一個人主張選擇顯著水平=0.05,而另一個人主張選=0.01,則第一個人的結(jié)論是拒絕H0,而后一個人的結(jié)論是接受H0,我們該如何處理這一問題呢?例7.3.5

一支香煙中的尼古丁含量X服從正態(tài)分布N(,1),質(zhì)量標(biāo)準(zhǔn)規(guī)定不能超過1.5毫克?,F(xiàn)從某廠生產(chǎn)的香煙中隨機(jī)抽取20支測得其中平均每支香煙的尼古丁含量為

毫克,試問該廠生產(chǎn)的香煙尼古丁含量是否符合質(zhì)量標(biāo)準(zhǔn)的規(guī)定。這是一個假設(shè)檢驗問題:H0:1.5,H1:>1.5,采用u檢驗,計算得:對一些的顯著性水平,表7.3.1列出了相應(yīng)的拒絕域和檢驗結(jié)論。表7.3.1例7.3.5中的拒絕域顯著性水平拒絕域u=2.10對應(yīng)的結(jié)論

=0.05u1.645拒絕H0

=0.025u1.96拒絕H0

=0.01u2.33接受H0

=0.005u2.58接受H0我們看到,不同的有不同的結(jié)論。

現(xiàn)在換一個角度來看,在=1.5時,u的分布是N(0,1)。此時可算得,P(u2.10)=0.0179,若以0.0179為基準(zhǔn)來看上述檢驗問題,可得

當(dāng)

<0.0179時,

>2.10。于是2.10就不在中,此時應(yīng)接受原假設(shè)H0;

當(dāng)

0.0179時,

2.10。于是2.10就落在中,此時應(yīng)拒絕H0。u由此可以看出,0.0179是能用觀測值2.10做出“拒絕H0”的最小的顯著性水平,這就是p值。u定義7.3.1

在一個假設(shè)檢驗問題中,利用觀測值能夠做出拒絕原假設(shè)的最小顯著性水平稱為檢驗的p值。

引進(jìn)檢驗的p值的概念有明顯的好處:

第一,它比較客觀,避免了事先確定顯著水平;其次,由檢驗的p值與人們心目中的顯著性水平進(jìn)行比較可以很容易作出檢驗的結(jié)論:

如果

p,則在顯著性水平

下拒絕H0;

如果<p,則在顯著性水平

下保留H0.

p值在應(yīng)用中很方便,如今的統(tǒng)計軟件中對檢驗問題一般都會給出檢驗的p值。例7.3.6

設(shè)

是來自b(1,)的樣本,要檢驗如下假設(shè):若取顯著性水平為,則在得到觀測值后,我們只需要計算概率:

這就是檢驗的p值。譬如若取=0.05,由于p<

,則應(yīng)拒絕原假設(shè)。例7.3.7

某工廠兩位化驗員甲、乙分別獨立地用相同方法對某種聚合物的含氯量進(jìn)行測定。甲測9次,樣本方差為0.7292;乙測11次,樣本方差為0.2114。假定測量數(shù)據(jù)服從正態(tài)分布,試對兩總體方差作一致性檢驗:檢驗統(tǒng)計量為,在原假設(shè)成立下,

F

F(8,10),拒絕域為

如今我們不是把拒絕域具體化,而是由觀測值算得F=0.7292/0.2114=3.4494,再去計算該檢驗的p

值。

或首先,我們用F分布算得其次考慮到雙側(cè)檢驗的拒絕域W分散在兩端,且兩端尾部概率相等(見圖7.3.2),據(jù)此可定出p值為

此p值不算很小,若

=0.05,則接收兩方差相等的假設(shè)。在這種雙側(cè)檢驗情況下,如何由觀測值F=3.4494算得p值呢?圖7.3.2

觀測值F=3.4494對應(yīng)的p值由兩端尾部概率之和確定§7.4分布擬合檢驗7.4.1總體分布只取有限個值的情況

設(shè)總體X可以分成k類,記為

,現(xiàn)對該總體作了n次觀測,k個類出現(xiàn)的頻數(shù)分別為:檢驗如下假設(shè):n1,…,nk,且其中諸且一、諸pi

均已知如果H0成立,則對每一類Ai,其頻率ni/n與概率pi應(yīng)較接近。即觀測頻數(shù)ni

與理論頻數(shù)npi

應(yīng)相差不大。據(jù)此,英國統(tǒng)計學(xué)家K.Pearson提出如下檢驗統(tǒng)計量:(7.4.2)并證明在H0成立時對充分大的n,(7.4.2)

給出的檢驗統(tǒng)計量近似服從自由度為k-1的分布。拒絕域為:例7.4.1

為募集社會福利基金,某地方政府發(fā)行福利彩票,中彩者用搖大轉(zhuǎn)盤的方法確定最后中獎金額。大轉(zhuǎn)盤均分為20份,其中金額為5萬、10萬、20萬、30萬、50萬、100萬的分別占2份、4份、6份、4份、2份、2份。假定大轉(zhuǎn)盤是均勻的,則每一點朝下是等可能的,于是搖出各個獎項的概率如下:

概率0.10.20.30.20.10.1額度5萬10萬20萬30萬50萬100萬現(xiàn)20人參加搖獎,搖得5萬、10萬、20萬、30萬、50萬和100萬的人數(shù)分別為2、6、6、3、3、0,由于沒有一個人搖到100萬,于是有人懷疑大轉(zhuǎn)盤是不均勻的,那么該懷疑是否成立呢?這就需要對轉(zhuǎn)盤的均勻性作檢驗。解:這是一個典型的分布擬合優(yōu)度檢驗,總體共有6類,其發(fā)生概率分別為0.1、0.2、0.3、

0.2、0.1和0.1,這里k=6,檢驗拒絕域為:由本例數(shù)據(jù)可以算出若取=0.05,則查附表3知=由于未落入拒絕域,故接受原假設(shè),沒有理由認(rèn)為轉(zhuǎn)盤不均勻。在分布擬合檢驗中使用p值也是方便的。本例中,以T記服從

(5)的隨機(jī)變量,則使用統(tǒng)計軟件可以算出這個p值就反映了數(shù)據(jù)與假設(shè)的分布擬合程度的高低,p值越大,擬合越好。二、諸pi不完全已知

若諸

由r(r<k)個未知參數(shù)

確定,即

首先給出

的極大似然估計然后給出諸

的極大似然估計

Fisher證明了

在H0成立時近似服從自由度為k-r-1的

分布,于是檢驗拒絕域為例7.4.2

盧瑟福在2608個等時間間隔內(nèi)觀測一枚放射性物質(zhì)放射的粒子數(shù)X,表7.4.1是觀測結(jié)果的匯總,其中ni表示2608次觀測中放射粒子數(shù)為i的次數(shù)。

ni

572033835255324082731394527106i01234567891011試?yán)迷摻M數(shù)據(jù)檢驗該放射物質(zhì)在單位時間內(nèi)放射出的粒子數(shù)是否服從泊松分布。

解:本例中,要檢驗總體是否服從泊松分布。

觀測到0,1,…,11共12個不同取值,這相當(dāng)于把總體分成12類。這里有一個未知參數(shù),采用極大似然估計,

=將

代入可以估計出諸

。于是可計算出列表如下。012345678910115720338352553240827313945271060.02090.08070.15620.20150.19500.15090.09730.05380.02600.01120.00430.002254.5210.5407.4525.5508.6393.5253.8140.367.829.211.25.70.11470.26721.46140.00051.07660.53431.45250.01207.66730.16580.12580.0158合計26081.00002068

=12.8967i本例中

=12.8967<18.307,故接受原假設(shè)。使用統(tǒng)計軟件可以計算出此處檢驗的p值是0.2295。

若取

=0.05,則列聯(lián)表是將觀測數(shù)據(jù)按兩個或更多屬性(定性變量)分類時所列出的頻數(shù)表。例如,對隨機(jī)抽取的1000人按性別(男或女)及色覺(正?;蛏?兩個屬性分類,得到如下二維列聯(lián)表,又稱2×2表或四格表。

7.4.2

列聯(lián)表的獨立性檢驗?zāi)?3565女38218性別視覺正常色盲一般,若總體中的個體可按兩個屬性A與B分類,A有r個類,B有c個類從總體中抽取大小為n的樣本,設(shè)其中有個個體既屬于類又屬于類,稱為頻數(shù),將rc個排列為一個r行c列的二維列聯(lián)表,簡稱rc表(表7.4.3)。

表7.4.3rc列聯(lián)表列聯(lián)表分析的基本問題是:考察各屬性之間有無關(guān)聯(lián),即判別兩屬性是否獨立。如在前例中,問題是:一個人是否色盲與其性別是否有關(guān)?在rc表中,若以

分別表示總體中的個體僅屬于

,僅屬于

和同時屬于

的概率,可得一個二維離散分布表(表7.4.4),則“A、B兩屬性獨立”的假設(shè)可以表述為表7.4.4

二維離散分布表這就變?yōu)樯弦恍」?jié)中諸

不完全已知時的分布擬合檢驗。這里諸

共有rc個參數(shù),在原假設(shè)H0成立時,這rc個參數(shù)

由r+c個參數(shù)

決定。在這r+c后個參數(shù)中存在兩個約束條件:

所以,此時pij實際上由r+c-2個獨立參數(shù)所確定。據(jù)此,檢驗統(tǒng)計量為

在H0成立時,上式服從自由度為rc-(r+c-2)-1的

分布。其中諸

是在H0成立下得到的

的極大似然估計,其表達(dá)式為

對給定的顯著性水平

,檢驗的拒絕域為:例7.4.3

為研究兒童智力發(fā)展與營養(yǎng)的關(guān)系,某研究機(jī)構(gòu)調(diào)查了1436名兒童,得到如表7.4.5的數(shù)據(jù),試在顯著性水平0.05下判斷智力發(fā)展與營養(yǎng)有無關(guān)系。

表7.4.5兒童智力與營養(yǎng)的調(diào)查數(shù)據(jù)營養(yǎng)良好營養(yǎng)不良合計

智商合計3423672663291304564020132164233822863451436<8080909099100解:用A表示營養(yǎng)狀況,它有兩個水平:表示

營養(yǎng)良好,

表示營養(yǎng)不良;B表示兒童智商,

它有四個水平,

分別表示表中四種情況。沿用前面的記號,首先建立假設(shè)

H0:營養(yǎng)狀況與智商無關(guān)聯(lián),即A與B獨立的。統(tǒng)計表示如下:

在原假設(shè)H0成立下,我們可以計算諸參數(shù)的極大似然估計值:

進(jìn)而可給出諸

,如其它結(jié)果見表7.4.6表7.4.6

的計算結(jié)果

營養(yǎng)良好384.1677346.8724259.7631313.35880.90810.29460.26600.19920.2403營養(yǎng)不良38.877935.103626.288131.71200.0919<8080909099100由表7.4.5和表7.4.6可以計算檢驗統(tǒng)計量的值此處r=2,c=4,(r-1)(c-1)=3,若取

=0.05

,查表有

,由于19.2785>7.815,故拒絕原假設(shè),認(rèn)為營養(yǎng)狀況對智商有影響。本例中檢驗的p值為0.0002。7.4.3正態(tài)性檢驗正態(tài)分布是最常用的分布,用來判斷總體分布是否為正態(tài)分布的檢驗方法稱為正態(tài)性檢驗,它在實際問題中大量使用。一、正態(tài)概率紙正態(tài)概率紙可用來作正態(tài)性檢驗,方法如下:利用樣本數(shù)據(jù)在概率紙上描點,用目測方法看這些點是否在一條直線附近,若是的話,可以認(rèn)為該數(shù)據(jù)來自正態(tài)總體,若明顯不在一條直線附近,則認(rèn)為該數(shù)據(jù)來自非正態(tài)總體。例7.4.4

隨機(jī)選取10個零件,測得其直徑與標(biāo)準(zhǔn)尺寸的偏差如下:(單位:絲)

9.48.89.610.210.17.211.18.28.69.6在正態(tài)概率紙上作圖步驟如下:

(1)首先將數(shù)據(jù)排序:

7.28.28.68.89.49.69.810.110.211.1;(2)對每一個i,計算修正頻率

(i-0.375)/(n+0.25),i=1,2,…,n,

(3)將點

逐一點在正態(tài)概率紙上,(4)觀察上述n個點的分布:

若諸點在一條直線附近,則認(rèn)為該批數(shù)據(jù)來自正態(tài)總體;若諸點明顯不在一條直線附近,則認(rèn)為該批數(shù)據(jù)的總體不是正態(tài)分布。

從圖7.4.2可以看到,10個點基本在一條直線附近,故可認(rèn)為直徑與標(biāo)準(zhǔn)尺寸的偏差服從正態(tài)分布。

如果從正態(tài)概率紙上確認(rèn)總體是非正態(tài)分布時,可對原始數(shù)據(jù)進(jìn)行變換后再在正態(tài)概率紙上描點,若變換后的點在正態(tài)概率紙上近似在一條直線附近,則可以認(rèn)為變換后的數(shù)據(jù)來自正態(tài)分布,這樣的變換稱為正態(tài)性變換。常用的正態(tài)性變換有如下三個:對數(shù)變換

、倒數(shù)變換

和根號變換

。

圖7.4.3給出這10個點在正態(tài)概率紙上的圖形,這10個點明顯不在一條直線附近,所以可以認(rèn)為該電子元件的壽命的分布不是正態(tài)分布。例7.4.5

隨機(jī)抽取某種電子元件10個,測得其壽命數(shù)據(jù)如下:110.47,99.16,97.04,77.60,4269.82,539.35,179.49,782.93,561.10,286.80.

圖7.4.3例7.4.5的正態(tài)概率紙對該10個壽命數(shù)據(jù)作對數(shù)變換,結(jié)果見表7.4.8

表7.4.8對數(shù)變換后的數(shù)據(jù)

132.623.48490.0616286.805.65880.549297.044.57520.1597539.356.29040.646399.164.59670.2568561.106.32990.7434110.474.70480.3549782.936.66300.8415179.495.19010.451102269.827.72750.939ii利用表7.4.8中最后兩列上的數(shù)據(jù)在正態(tài)概率紙上描點,結(jié)果見圖7.4.4,從圖上可以看到10個點近似在一條直線附近,說明對數(shù)變換后的數(shù)據(jù)可以看成來自正態(tài)分布。這也意味著,原始數(shù)據(jù)服從對數(shù)正態(tài)分布圖7.4.4變換后數(shù)據(jù)的正態(tài)概率紙二、夏皮洛-威爾克(Shapiro-Wilk)檢驗

夏皮洛-威爾

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論