統(tǒng)計(jì)學(xué)第六章假設(shè)檢驗(yàn)_第1頁
統(tǒng)計(jì)學(xué)第六章假設(shè)檢驗(yàn)_第2頁
統(tǒng)計(jì)學(xué)第六章假設(shè)檢驗(yàn)_第3頁
統(tǒng)計(jì)學(xué)第六章假設(shè)檢驗(yàn)_第4頁
統(tǒng)計(jì)學(xué)第六章假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩66頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第6章假設(shè)檢驗(yàn)作者:中國人民大學(xué)統(tǒng)計(jì)學(xué)院賈俊平PowerPoint統(tǒng)計(jì)學(xué)第6章假設(shè)檢驗(yàn)6.1根本概念和步驟6.2總體均值檢驗(yàn)6.3總體比例的檢驗(yàn)假設(shè)檢驗(yàn)在統(tǒng)計(jì)方法中的地位統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)問題6.1根本概念和步驟什么是假設(shè)檢驗(yàn)?原假設(shè)與備擇假設(shè)拒絕域和檢驗(yàn)統(tǒng)計(jì)量兩類錯(cuò)誤和顯著性水平單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)根本步驟總結(jié)P值方法什么是假設(shè)檢驗(yàn)什么是假設(shè)?

(hypothesis)

對總體參數(shù)的具體數(shù)值所作的陳述總體參數(shù)包括總體均值、比例、方差等分析之前必需陳述我認(rèn)為這種新藥的療效比原有的藥物更有效!什么是假設(shè)檢驗(yàn)?

(hypothesistest)先對總體的參數(shù)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的過程有參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)邏輯上運(yùn)用反證法,統(tǒng)計(jì)上依據(jù)小概率原理什么是假設(shè)檢驗(yàn)?某廠商宣稱其次品率只有1%,如果隨機(jī)抽?。保凹a(chǎn)品,其中有2件是次品,那么如何進(jìn)行假設(shè)檢驗(yàn)?要檢驗(yàn)的假設(shè):全部產(chǎn)品的次品率為1%。來自總體的次品數(shù)服從二項(xiàng)分布b〔10,0.01〕,容易計(jì)算得到“抽取10件產(chǎn)品中有2件次品〞的概率只有0.42%。就是說,小概率事件發(fā)生了。在一次試驗(yàn)中小概率事件是不應(yīng)該發(fā)生的,這就讓人不得不疑心原有的“假設(shè)〞。假設(shè)檢驗(yàn)的根本思想...因此我們拒絕假設(shè)

=500...如果這是總體的真實(shí)均值樣本均值m=500抽樣分布H0這個(gè)值不像我們應(yīng)該得到的樣本均值...450總體

假設(shè)檢驗(yàn)的過程抽取隨機(jī)樣本均值

x

=450

規(guī)定的平均容量為500ml提出假設(shè)拒絕假設(shè)別無選擇!作出決策原假設(shè)與備擇假設(shè)原假設(shè)

(nullhypothesis)研究者想收集證據(jù)予以拒絕的假設(shè)又稱“0假設(shè)〞總是有符號,或4. 表示為H0H0:=某一數(shù)值指定為符號=,或例如,H0:10cm研究者想收集證據(jù)予以支持的假設(shè)也稱“研究假設(shè)〞總是有符號,或表示為H1H1:某一數(shù)值,或<某一數(shù)值,或某一數(shù)值例如,H1:10cm備擇假設(shè)(alternativehypothesis)【例】一種零件的生產(chǎn)標(biāo)準(zhǔn)是直徑應(yīng)為10cm,為對生產(chǎn)過程進(jìn)行控制,質(zhì)量監(jiān)測人員定期對一臺加工機(jī)床檢查,確定這臺機(jī)床生產(chǎn)的零件是否符合標(biāo)準(zhǔn)要求。如果零件的平均直徑大于或小于10cm,那么說明生產(chǎn)過程不正常,必須進(jìn)行調(diào)整。試陳述用來檢驗(yàn)生產(chǎn)過程是否正常的原假設(shè)和被擇假設(shè)提出假設(shè)(例題分析)解:研究者想收集證據(jù)予以證明的假設(shè)應(yīng)該是“生產(chǎn)過程不正常〞。建立的原假設(shè)和備擇假設(shè)為H0:10cmH1:10cm【例】某品牌洗滌劑在它的產(chǎn)品說明書中聲稱:平均凈含量不少于500克。從消費(fèi)者的利益出發(fā),有關(guān)研究人員要通過抽檢其中的一批產(chǎn)品來驗(yàn)證該產(chǎn)品制造商的說明是否屬實(shí)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)提出假設(shè)(例題分析)解:研究者抽檢的意圖是傾向于證實(shí)這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設(shè)和備擇假設(shè)為

H0:

500H1:

<500500g綠葉洗滌劑【例】一家研究機(jī)構(gòu)估計(jì),某城市中家庭擁有汽車的比例超過30%。為驗(yàn)證這一估計(jì)是否正確,該研究機(jī)構(gòu)隨機(jī)抽取了一個(gè)樣本進(jìn)行檢驗(yàn)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)提出假設(shè)(例題分析)解:研究者想收集證據(jù)予以支持的假設(shè)是“該城市中家庭擁有汽車的比例超過30%〞。建立的原假設(shè)和備擇假設(shè)為H0:30%H1:30%原假設(shè)和備擇假設(shè)是一個(gè)完備事件組,而且相互對立先確定備擇假設(shè),再確定原假設(shè)等號“=〞總是放在原假設(shè)上因研究目的不同,對同一問題可能提出不同的假設(shè)(也可能得出不同的結(jié)論)提出假設(shè)(結(jié)論與建議)雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)備擇假設(shè)沒有特定的方向性,并含有符號“〞的假設(shè)檢驗(yàn),稱為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn)(two-tailedtest)備擇假設(shè)具有特定的方向性,并含有符號“>〞或“<〞的假設(shè)檢驗(yàn),稱為單側(cè)檢驗(yàn)或單尾檢驗(yàn)(one-tailedtest)備擇假設(shè)的方向?yàn)椤?lt;〞,稱為左側(cè)檢驗(yàn)備擇假設(shè)的方向?yàn)椤?gt;〞,稱為右側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)

(假設(shè)的形式)假設(shè)雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)原假設(shè)H0:m

=m0H0:m

m0H0:m

m0備擇假設(shè)H1:m

≠m0H1:m

<m0H1:m

>m0兩類錯(cuò)誤與顯著性水平冤枉好人與放過壞人無罪推定原那么:在證明被告有罪之前先假設(shè)他無罪。原假設(shè):被告無罪。備選假設(shè):被告有罪。法官可能犯兩類錯(cuò)誤:第一類錯(cuò)誤是被告無罪卻被判有罪,這就“冤枉好人〞;第二類錯(cuò)誤是被告有罪卻被判無罪,這就“放過壞人〞在一定的證據(jù)下,犯兩類錯(cuò)誤的概率是相互消長的。假設(shè)檢驗(yàn)中的兩類錯(cuò)誤1. 第Ⅰ類錯(cuò)誤(棄真錯(cuò)誤)原假設(shè)為真時(shí)拒絕原假設(shè)第Ⅰ類錯(cuò)誤的概率為

被稱為顯著性水平2. 第Ⅱ類錯(cuò)誤(取偽錯(cuò)誤)原假設(shè)為假時(shí)未拒絕原假設(shè)第Ⅱ類錯(cuò)誤的概率為

H0:無罪假設(shè)檢驗(yàn)中的兩類錯(cuò)誤(決策結(jié)果)陪審團(tuán)審判裁決真實(shí)情況無罪有罪無罪正確錯(cuò)誤有罪錯(cuò)誤正確H0檢驗(yàn)決策真實(shí)情況H0為真H0為假未拒絕H0正確決策(1–a)第Ⅱ類錯(cuò)誤(b)拒絕H0第Ⅰ類錯(cuò)誤(a)正確決策(1-b)假設(shè)檢驗(yàn)就好似一場審判過程統(tǒng)計(jì)檢驗(yàn)過程

錯(cuò)誤和

錯(cuò)誤的關(guān)系

你不能同時(shí)減少兩類錯(cuò)誤!

的關(guān)系就像翹翹板,

就大,

就小顯著性水平

(significantlevel)1. 是一個(gè)概率值2. 原假設(shè)為真時(shí),拒絕原假設(shè)的概率被稱為抽樣分布的拒絕域3. 表示為

(alpha)常用的

值有0.01,0.05,0.104. 由研究者事先確定假設(shè)檢驗(yàn)中的小概率原理

什么小概率?1. 在一次試驗(yàn)中,一個(gè)幾乎不可能發(fā)生的事件發(fā)生的概率2. 在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)3. 小概率由研究者事先確定檢驗(yàn)統(tǒng)計(jì)量與拒絕域根據(jù)樣本觀測結(jié)果計(jì)算得到的,并據(jù)以對原假設(shè)和備擇假設(shè)作出決策的某個(gè)樣本統(tǒng)計(jì)量對樣本估計(jì)量的標(biāo)準(zhǔn)化結(jié)果原假設(shè)H0為真點(diǎn)估計(jì)量的抽樣分布檢驗(yàn)統(tǒng)計(jì)量(teststatistic)標(biāo)準(zhǔn)化的檢驗(yàn)統(tǒng)計(jì)量顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))抽樣分布0臨界值臨界值a/2a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H01-

置信水平顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))0臨界值臨界值a/2

a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H0抽樣分布1-

置信水平顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))0臨界值臨界值

a/2a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H0抽樣分布1-

置信水平顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))0臨界值臨界值a/2

a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H0抽樣分布1-

置信水平顯著性水平和拒絕域

(單側(cè)檢驗(yàn))0臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-

置信水平顯著性水平和拒絕域

(左側(cè)檢驗(yàn))0臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-

置信水平觀察到的樣本統(tǒng)計(jì)量顯著性水平和拒絕域

(左側(cè)檢驗(yàn))0臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-

置信水平顯著性水平和拒絕域

(右側(cè)檢驗(yàn))0臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-

置信水平觀察到的樣本統(tǒng)計(jì)量顯著性水平和拒絕域

(右側(cè)檢驗(yàn))0臨界值a樣本統(tǒng)計(jì)量抽樣分布1-

置信水平拒絕H0決策規(guī)那么給定顯著性水平,查表得出相應(yīng)的臨界值z或z/2,t或t/2將檢驗(yàn)統(tǒng)計(jì)量的值與水平的臨界值進(jìn)行比較作出決策雙側(cè)檢驗(yàn):I統(tǒng)計(jì)量I>臨界值,拒絕H0左側(cè)檢驗(yàn):統(tǒng)計(jì)量<-臨界值,拒絕H0右側(cè)檢驗(yàn):統(tǒng)計(jì)量>臨界值,拒絕H0假設(shè)檢驗(yàn)結(jié)論的表述假設(shè)檢驗(yàn)結(jié)論的表述假設(shè)檢驗(yàn)的目的在于找到拒絕原假設(shè)依據(jù),而不在于證明什么是正確的拒絕原假設(shè)時(shí)結(jié)論是清楚的例如,H0:=10,拒絕H0時(shí),我們可以說10當(dāng)不拒絕原假設(shè)時(shí)并未給出明確的結(jié)論不能說原假設(shè)是正確的,也不能說它不是正確的例如,當(dāng)不拒絕H0:=10,我們并未說它就是10,但也未說它不是10。我們只能說樣本提供的證據(jù)還缺乏以推翻原假設(shè)假設(shè)檢驗(yàn)步驟的總結(jié)陳述原假設(shè)和備擇假設(shè)從所研究的總體中抽出一個(gè)隨機(jī)樣本確定一個(gè)適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并利用樣本數(shù)據(jù)算出其具體數(shù)值確定一個(gè)適當(dāng)?shù)娘@著性水平,并計(jì)算出其臨界值,指定拒絕域?qū)⒔y(tǒng)計(jì)量的值與臨界值進(jìn)行比較,作出決策統(tǒng)計(jì)量的值落在拒絕域,拒絕H0,否那么不拒絕H0也可以直接利用P值作出決策什么是P值?

(P-value)是一個(gè)概率值如果原假設(shè)為真,P-值是抽樣分布中大于或小于樣本統(tǒng)計(jì)量的概率左側(cè)檢驗(yàn)時(shí),P-值為曲線上方小于等于檢驗(yàn)統(tǒng)計(jì)量局部的面積右側(cè)檢驗(yàn)時(shí),P-值為曲線上方大于等于檢驗(yàn)統(tǒng)計(jì)量局部的面積被稱為觀察到的(或?qū)崪y的)顯著性水平H0能被拒絕的最小值雙側(cè)檢驗(yàn)的P值

/

2

/

2Z拒絕拒絕H0值臨界值計(jì)算出的樣本統(tǒng)計(jì)量計(jì)算出的樣本統(tǒng)計(jì)量臨界值1/2P值1/2P值左側(cè)檢驗(yàn)的P值H0值臨界值a樣本統(tǒng)計(jì)量拒絕域抽樣分布1-

置信水平計(jì)算出的樣本統(tǒng)計(jì)量P值右側(cè)檢驗(yàn)的P值H0值臨界值a拒絕域抽樣分布1-

置信水平計(jì)算出的樣本統(tǒng)計(jì)量P值利用P值進(jìn)行檢驗(yàn)

(決策準(zhǔn)那么)單側(cè)檢驗(yàn)假設(shè)p值>,不拒絕H0假設(shè)p值<,拒絕H0雙側(cè)檢驗(yàn)假設(shè)p值>,不拒絕H0假設(shè)p值<,拒絕H06.2總體均值的檢驗(yàn)大樣本情形下總體均值的檢驗(yàn)小樣本情形下總體均值的檢驗(yàn)總體均值的檢驗(yàn)

(作出判斷)

是否已知小樣本容量n大

是否已知否t檢驗(yàn)否z檢驗(yàn)是z檢驗(yàn)

是z檢驗(yàn)總體均值的檢驗(yàn)

(大樣本)總體均值的檢驗(yàn)

(大樣本)1. 假定條件正態(tài)總體或非正態(tài)總體大樣本(n30)使用z檢驗(yàn)統(tǒng)計(jì)量2:2未知:總體均值的檢驗(yàn)(2)

(例題分析)雙側(cè)檢驗(yàn)綠色健康飲品綠色健康飲品255255總體均值的檢驗(yàn)(2)

(例題分析)H0

=255H1

255

=

0.05n

=

40臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:z01.96-1.960.025拒絕H0拒絕H00.025決策:結(jié)論:

不拒絕H0樣本提供的證據(jù)還缺乏以推翻“該天生產(chǎn)的飲料符合標(biāo)準(zhǔn)要求〞的看法總體均值的檢驗(yàn)(

2未知)

(例題分析)【例】一種機(jī)床加工的零件尺寸絕對平均誤差為1.35mm。生產(chǎn)廠家現(xiàn)采用一種新的機(jī)床進(jìn)行加工以期進(jìn)一步降低誤差。為檢驗(yàn)新機(jī)床加工的零件平均誤差與舊機(jī)床相比是否有顯著降低,從某天生產(chǎn)的零件中隨機(jī)抽取50個(gè)進(jìn)行檢驗(yàn)。利用這些樣本數(shù)據(jù),檢驗(yàn)新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)床相比是否有顯著降低?(

=0.01)

左側(cè)檢驗(yàn)50個(gè)零件尺寸的誤差數(shù)據(jù)(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86總體均值的檢驗(yàn)(

2未知)

(例題分析)H0

1.35H1

<1.35

=

0.01n

=

50臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:拒絕H0新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)床相比有顯著降低決策:結(jié)論:-2.33z0拒絕H00.01總體均值的檢驗(yàn)(

2未知)

(例題分析)【例】某一小麥品種的平均產(chǎn)量為5200kg/hm2。一家研究機(jī)構(gòu)對小麥品種進(jìn)行了改進(jìn)以期提高產(chǎn)量。為檢驗(yàn)改進(jìn)后的新品種產(chǎn)量是否有顯著提高,隨機(jī)抽取了36個(gè)地塊進(jìn)行試種,得到的樣本平均產(chǎn)量為5275kg/hm2,標(biāo)準(zhǔn)差為120/hm2。試檢驗(yàn)改進(jìn)后的新品種產(chǎn)量是否有顯著提高?(=0.05)右側(cè)檢驗(yàn)總體均值的檢驗(yàn)(

2未知)

(例題分析)H0

5200H1

>5200

=

0.05n

=

36臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:拒絕H0改進(jìn)后的新品種產(chǎn)量有顯著提高決策:結(jié)論:z0拒絕H00.051.645總體均值的檢驗(yàn)

(大樣本檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0:m=m0H1:

m

m0H0:m

m0H1:m<m0H0:

m

m0

H1:

m>m0統(tǒng)計(jì)量

已知:

未知:拒絕域P值決策拒絕H0總體均值的檢驗(yàn)

(小樣本)總體均值的檢驗(yàn)

(小樣本)1. 假定條件總體服從正態(tài)分布小樣本(n<30)檢驗(yàn)統(tǒng)計(jì)量2:2未知:總體均值的檢驗(yàn)

(小樣本檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0:m=m0H1:

m

m0H0:m

m0H1:

m<m0H0:

m

m0

H1:

m>m0統(tǒng)計(jì)量

已知:

未知:拒絕域P值決策拒絕H0注:的拒絕域同大樣本總體均值的檢驗(yàn)

(例題分析)【例】一種汽車配件的平均長度要求為12cm,高于或低于該標(biāo)準(zhǔn)均被認(rèn)為是不合格的。汽車生產(chǎn)企業(yè)在購進(jìn)配件時(shí),通常是經(jīng)過招標(biāo),然后對中標(biāo)的配件提供商提供的樣品進(jìn)行檢驗(yàn),以決定是否購進(jìn)?,F(xiàn)對一個(gè)配件提供商提供的10個(gè)樣本進(jìn)行了檢驗(yàn)。假定該供貨商生產(chǎn)的配件長度服從正態(tài)分布,在0.05的顯著性水平下,檢驗(yàn)該供貨商提供的配件是否符合要求?10個(gè)零件尺寸的長度(cm)12.210.812.011.811.912.411.312.212.012.3總體均值的檢驗(yàn)

(例題分析)H0

=12H1

12

=0.05df=10-1=9臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:不拒絕H0樣本提供的證據(jù)還缺乏以推翻“該供貨商提供的零件符合要求〞的看法決策:結(jié)論:t02.262-2.2620.025拒絕H0拒絕H00.0256.3總體比例的檢驗(yàn)總體比例檢驗(yàn)假定條件總體服從二項(xiàng)分布可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論