統(tǒng)計學(xué)假設(shè)檢驗_第1頁
統(tǒng)計學(xué)假設(shè)檢驗_第2頁
統(tǒng)計學(xué)假設(shè)檢驗_第3頁
統(tǒng)計學(xué)假設(shè)檢驗_第4頁
統(tǒng)計學(xué)假設(shè)檢驗_第5頁
已閱讀5頁,還剩93頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計學(xué)統(tǒng)計學(xué)第第7 7章章 假設(shè)檢驗假設(shè)檢驗 正如一個法庭宣告某一判決為“無罪(not guilty)”而不為“清白(innocent)”,統(tǒng)計檢驗的結(jié)論也應(yīng)為“不拒絕”而不為“接受”。 Jan KmentaJan Kmenta統(tǒng)計學(xué)假設(shè)檢驗 案例案例 辛普森殺妻案辛普森殺妻案統(tǒng)計學(xué)假設(shè)檢驗 辛普森案辛普森案 (英語:(英語:O. J. Simpson murder caseO. J. Simpson murder case,又稱加利福尼亞人民訴,又稱加利福尼亞人民訴辛普森案,英語:辛普森案,英語:People v.SimpsonPeople v.Simpson)是美國加利福尼亞州最高法院對)

2、是美國加利福尼亞州最高法院對前美式橄欖球明星、演員前美式橄欖球明星、演員OJOJ辛普森進(jìn)行的刑事訴訟,在該案中,辛普辛普森進(jìn)行的刑事訴訟,在該案中,辛普森被指控于森被指控于19941994年犯下兩宗謀殺罪,受害人為其前妻妮克爾年犯下兩宗謀殺罪,受害人為其前妻妮克爾 布朗布朗 辛普辛普森及其好友羅納德森及其好友羅納德 高曼。該案被稱為是美國歷史上最受公眾關(guān)注的刑事高曼。該案被稱為是美國歷史上最受公眾關(guān)注的刑事審判案件。審判案件。統(tǒng)計學(xué)假設(shè)檢驗 案發(fā)時間,1994年6月12日深夜 案發(fā)后凌晨,辛普森門外有血跡 現(xiàn)場滴落的血痕中有辛普森的血,辛普森家中血手套和辛普森的臟衣服都有被害人的血統(tǒng)計學(xué)假設(shè)檢

3、驗 法庭戰(zhàn)爭法庭戰(zhàn)爭檢方的檢方的“鐵證如山鐵證如山”與與“夢幻律師團(tuán)夢幻律師團(tuán)” 在檢方看來,本案可謂是在檢方看來,本案可謂是“鐵證如山鐵證如山”,本案中無論是證據(jù)數(shù),本案中無論是證據(jù)數(shù)量,還是證據(jù)的可信程度,在檢方看來,都達(dá)到了很高的標(biāo)準(zhǔn)。量,還是證據(jù)的可信程度,在檢方看來,都達(dá)到了很高的標(biāo)準(zhǔn)。統(tǒng)計學(xué)假設(shè)檢驗 控辯雙方幾個關(guān)鍵的地方 控方:檢方在審判的最初幾周出示證據(jù),證明辛普森曾有對妮可爾的家控方:檢方在審判的最初幾周出示證據(jù),證明辛普森曾有對妮可爾的家庭暴力史。庭暴力史。 辯方:時遭受丈夫家庭暴力中,遭受丈夫傷害的概率為辯方:時遭受丈夫家庭暴力中,遭受丈夫傷害的概率為1%1%統(tǒng)計學(xué)假設(shè)檢

4、驗 控方:鞋碼與辛普森的相似,辛普森手上有劃痕控方:鞋碼與辛普森的相似,辛普森手上有劃痕 辯方:世界上與辛普森鞋碼一樣的人數(shù)不勝數(shù),在左手有傷痕辯方:世界上與辛普森鞋碼一樣的人數(shù)不勝數(shù),在左手有傷痕的人也不盡其數(shù),所以這樣的證據(jù)對案件的判斷是沒有任何價的人也不盡其數(shù),所以這樣的證據(jù)對案件的判斷是沒有任何價值的。值的。統(tǒng)計學(xué)假設(shè)檢驗 控方:在犯罪現(xiàn)場發(fā)現(xiàn)的血液,控方:在犯罪現(xiàn)場發(fā)現(xiàn)的血液,DNADNA鑒定發(fā)現(xiàn)與辛普森是完全鑒定發(fā)現(xiàn)與辛普森是完全一致的,而一致的,而DNADNA鑒定兩個人一致的可能性只有萬分之。鑒定兩個人一致的可能性只有萬分之。 辯方:在洛杉磯辯方:在洛杉磯300300萬人口中,就

5、有萬人口中,就有300300個人個人DANDAN一致,辛普森一致,辛普森是洛杉磯人口的是洛杉磯人口的1 1人,所以,辛普森是殺人兇手的概率只有人,所以,辛普森是殺人兇手的概率只有0.03%0.03%。如果認(rèn)為新浦森有罪的話,那么誤判的概率將高達(dá)。如果認(rèn)為新浦森有罪的話,那么誤判的概率將高達(dá)99.97%.99.97%. 最終無罪釋放。最終無罪釋放。統(tǒng)計學(xué)假設(shè)檢驗 控方:平時遭受丈夫家庭暴力中,非正常死亡的,其兇手為丈夫的概率為控方:平時遭受丈夫家庭暴力中,非正常死亡的,其兇手為丈夫的概率為80%80%。 控方:可能會有很多與辛普森鞋碼一樣的人,但也會有很多左手有劃痕的控方:可能會有很多與辛普森鞋

6、碼一樣的人,但也會有很多左手有劃痕的人,但辛普森是一個嫌疑犯,人,但辛普森是一個嫌疑犯, 不能把他放在所有的人當(dāng)中去進(jìn)行歸類,不能把他放在所有的人當(dāng)中去進(jìn)行歸類,于是只能放在嫌疑犯中,在嫌疑犯中,跟辛普森鞋碼吻合的人的概率非常于是只能放在嫌疑犯中,在嫌疑犯中,跟辛普森鞋碼吻合的人的概率非常之小之小統(tǒng)計學(xué)假設(shè)檢驗 法庭宣判過程法庭宣判過程 法官假定辛普森無罪法官假定辛普森無罪控方搜集證據(jù)證明他有罪,只有當(dāng)證據(jù)充足的時控方搜集證據(jù)證明他有罪,只有當(dāng)證據(jù)充足的時候才能宣判有罪,否則要接受法官的假定。候才能宣判有罪,否則要接受法官的假定。統(tǒng)計學(xué)假設(shè)檢驗 辛浦森辛浦森(Simpsons Paradox)

7、悖論悖論案例案例1: 是否存在種族歧視是否存在種族歧視被告種族被告種族受害者受害者種族種族死刑判決死刑判決是是否否白人白人白人白人19132黑人黑人09黑人黑人白人白人1152黑人黑人697統(tǒng)計學(xué)假設(shè)檢驗 總的看總的看, 白人有白人有19/160=12% 的被告被判處死刑的被告被判處死刑, 與與之對應(yīng)之對應(yīng), 黑人只有黑人只有17/166=10% 的被告被判死刑的被告被判死刑, 白人死白人死刑率要高一些刑率要高一些. 但如果考慮受害者的種族但如果考慮受害者的種族, 結(jié)論就相反了結(jié)論就相反了. 當(dāng)受害者是白人時當(dāng)受害者是白人時, 有有11/63=17.5% 的黑人被告被判死的黑人被告被判死刑刑,

8、 而只有而只有 19/151=12.6% 的白人被告被判死刑的白人被告被判死刑. 當(dāng)受害當(dāng)受害者是黑人時者是黑人時, 白人被告沒一個人白人被告沒一個人( 0%)被判死刑被判死刑, 而黑人而黑人被告確有被告確有 6/103=5.8% 的被判死刑的被判死刑. 統(tǒng)計學(xué)假設(shè)檢驗 控方:DNA鑒定 辯方:把辛普森至于300萬人群當(dāng)中,但新浦是是嫌疑犯,所以應(yīng)把他放在嫌疑犯這個人群中,那么樣本與他一致的也就他一個人統(tǒng)計學(xué)假設(shè)檢驗 綜上,只有辛普森一個人符合三個條件第第 7 7 章章 假設(shè)檢驗假設(shè)檢驗7.1 7.1 假設(shè)檢驗的基本問題假設(shè)檢驗的基本問題 7.2 7.2 一個總體參數(shù)的檢驗一個總體參數(shù)的檢驗學(xué)

9、習(xí)目標(biāo) 1. 1.理解假設(shè)檢驗的基本思想和基本步驟理解假設(shè)檢驗的基本思想和基本步驟 ; 2. 2.理解假設(shè)檢驗的兩類錯誤及其關(guān)系;理解假設(shè)檢驗的兩類錯誤及其關(guān)系; 3. 3.熟練掌握一個總體平均數(shù)、總體成數(shù)各種假設(shè)檢驗方法;熟練掌握一個總體平均數(shù)、總體成數(shù)各種假設(shè)檢驗方法; 4. 4.利用利用P P - - 值進(jìn)行假設(shè)檢驗。值進(jìn)行假設(shè)檢驗。l用用ExcelExcel進(jìn)行檢驗進(jìn)行檢驗假設(shè)檢驗知識結(jié)構(gòu)總體參數(shù)檢總體參數(shù)檢驗驗均值均值比例比例方差方差均值差均值差比例差比例差方差比方差比獨(dú)立樣本獨(dú)立樣本匹配樣本匹配樣本大樣本大樣本F F檢驗檢驗Z Z檢驗檢驗大樣本大樣本小樣本小樣本Z Z檢驗檢驗 1

10、12 2 2 22 2已知已知 1 12 2 2 22 2未知未知Z Z檢驗檢驗t t檢驗檢驗大樣本大樣本小樣本小樣本Z Z檢驗檢驗 2 2已知已知Z Z檢驗檢驗 2 2未知未知t t檢驗檢驗Z Z檢驗檢驗卡方檢驗卡方檢驗第第 7 7 章章 假設(shè)檢驗假設(shè)檢驗7.1.1 怎樣提出假設(shè)?1.1.什么是假設(shè)?什么是假設(shè)? 假設(shè):定義為一個調(diào)研者或管假設(shè):定義為一個調(diào)研者或管理者對被調(diào)查總體的某些特征理者對被調(diào)查總體的某些特征所做的一種假定或猜想。是對所做的一種假定或猜想。是對總體參數(shù)的一種假設(shè)。總體參數(shù)的一種假設(shè)。 常見的是對總體均值或比例和常見的是對總體均值或比例和方差的檢驗;方差的檢驗; 在分析

11、之前,被檢驗的參數(shù)將在分析之前,被檢驗的參數(shù)將被假定取一確定值。被假定取一確定值。我認(rèn)為到KFC消費(fèi)的人平均花費(fèi)2.5美元!2、市場調(diào)研中常見的假設(shè)檢驗問題市場調(diào)研中常見的假設(shè)檢驗問題 一項跟蹤調(diào)查的結(jié)果表明,顧客對產(chǎn)品的了解程度比一項跟蹤調(diào)查的結(jié)果表明,顧客對產(chǎn)品的了解程度比6個月個月前所做的類似調(diào)查中的顯示要低。結(jié)果是否明顯降低?是前所做的類似調(diào)查中的顯示要低。結(jié)果是否明顯降低?是否低到需要改變廣告策略的程度?否低到需要改變廣告策略的程度? 一位產(chǎn)品經(jīng)理認(rèn)為其產(chǎn)品購買者的平均年齡為一位產(chǎn)品經(jīng)理認(rèn)為其產(chǎn)品購買者的平均年齡為35歲。為檢歲。為檢驗其假設(shè),他進(jìn)行了一項調(diào)查,調(diào)查表明購買者平均年齡

12、驗其假設(shè),他進(jìn)行了一項調(diào)查,調(diào)查表明購買者平均年齡為為38.5歲。調(diào)查結(jié)果與其觀點(diǎn)的差別是夠足以說明此經(jīng)理里歲。調(diào)查結(jié)果與其觀點(diǎn)的差別是夠足以說明此經(jīng)理里的觀點(diǎn)是不正確的的觀點(diǎn)是不正確的?3、問題在哪里?、問題在哪里? 某廣告商宣稱其代理的某廣告商宣稱其代理的A產(chǎn)品的合格率達(dá)到產(chǎn)品的合格率達(dá)到99%,質(zhì)檢人,質(zhì)檢人員為了驗證,隨機(jī)抽取了一件產(chǎn)品,發(fā)現(xiàn)是一件次品。質(zhì)員為了驗證,隨機(jī)抽取了一件產(chǎn)品,發(fā)現(xiàn)是一件次品。質(zhì)檢人員會是什么反應(yīng)呢?檢人員會是什么反應(yīng)呢?什么是假設(shè)檢驗什么是假設(shè)檢驗? ? (hypothesis test)(hypothesis test)先對總體的參數(shù)先對總體的參數(shù)( (或

13、分布形式或分布形式) )提出某種假設(shè),然后利用樣本提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的統(tǒng)計方法信息判斷假設(shè)是否成立的統(tǒng)計方法有參數(shù)檢驗和有參數(shù)檢驗和非非參數(shù)檢驗參數(shù)檢驗邏輯上運(yùn)用反證法,統(tǒng)計上依據(jù)小概率原理邏輯上運(yùn)用反證法,統(tǒng)計上依據(jù)小概率原理小概率是在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率小概率是在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)原假設(shè)原假設(shè)(null hypothesis)(null hypothesis)又稱又稱“0 0假設(shè)假設(shè)”,研,研究者想收集

14、證據(jù)予以反對的假設(shè),用究者想收集證據(jù)予以反對的假設(shè),用H H0 0表示表示所表達(dá)的含義總是指參數(shù)沒有變化或變量之間沒有關(guān)系所表達(dá)的含義總是指參數(shù)沒有變化或變量之間沒有關(guān)系 最初被假設(shè)是成立的,之后根據(jù)樣本數(shù)據(jù)確定是否有足夠的證據(jù)最初被假設(shè)是成立的,之后根據(jù)樣本數(shù)據(jù)確定是否有足夠的證據(jù)拒絕它拒絕它 總是有符號總是有符號 , , 或或 H H0 0 : = = 某一數(shù)值某一數(shù)值H H0 0 : 某一數(shù)值某一數(shù)值H H0 0 : 某一數(shù)值某一數(shù)值l例如例如, , H H0 0 : 10cm10cm也稱也稱“研究假設(shè)研究假設(shè)”, ,研究研究者想收集證據(jù)予以支持的假設(shè),用者想收集證據(jù)予以支持的假設(shè),用H

15、 H1 1或或H Ha a表示表示所表達(dá)的含義是總體參數(shù)發(fā)生了變化或變量之間有某種關(guān)系所表達(dá)的含義是總體參數(shù)發(fā)生了變化或變量之間有某種關(guān)系備擇假設(shè)通常用于表達(dá)研究者自己傾向于支持的看法,然后就是想辦法收備擇假設(shè)通常用于表達(dá)研究者自己傾向于支持的看法,然后就是想辦法收集證據(jù)拒絕原假設(shè),以支持備擇假設(shè)集證據(jù)拒絕原假設(shè),以支持備擇假設(shè) 總是有符號總是有符號 , , 或或 H H1 1 : 某一數(shù)值某一數(shù)值H H1 1 : 某一數(shù)值某一數(shù)值H H1 1 : 某一數(shù)值某一數(shù)值備擇假設(shè)備擇假設(shè)(alternative hypothesis)【例例】一種零件的生產(chǎn)標(biāo)準(zhǔn)是直徑應(yīng)為一種零件的生產(chǎn)標(biāo)準(zhǔn)是直徑應(yīng)為1

16、0cm10cm,為對生產(chǎn)過程進(jìn),為對生產(chǎn)過程進(jìn)行控制,質(zhì)量監(jiān)測人員定期對一臺加工機(jī)床檢查,確定這臺機(jī)床行控制,質(zhì)量監(jiān)測人員定期對一臺加工機(jī)床檢查,確定這臺機(jī)床生產(chǎn)的零件是否符合標(biāo)準(zhǔn)要求。如果零件的平均直徑大于或小于生產(chǎn)的零件是否符合標(biāo)準(zhǔn)要求。如果零件的平均直徑大于或小于10cm10cm,則表明生產(chǎn)過程不正常,必須進(jìn)行調(diào)整。試陳述用來檢,則表明生產(chǎn)過程不正常,必須進(jìn)行調(diào)整。試陳述用來檢驗生產(chǎn)過程是否正常的原假設(shè)和被擇假設(shè)驗生產(chǎn)過程是否正常的原假設(shè)和被擇假設(shè)提出假設(shè)提出假設(shè)(例題分析例題分析)解:研究者想收集證據(jù)予以證明的假設(shè)應(yīng)該是解:研究者想收集證據(jù)予以證明的假設(shè)應(yīng)該是“生產(chǎn)生產(chǎn)過程不正常過程不

17、正?!?。建立的原假設(shè)和備擇假設(shè)為。建立的原假設(shè)和備擇假設(shè)為 H0 : 10cm H1 : 10cm 【例例】某品牌洗滌劑在它的產(chǎn)品說明書中聲稱:平均凈含量某品牌洗滌劑在它的產(chǎn)品說明書中聲稱:平均凈含量不少于不少于500500克。從消費(fèi)者的利益出發(fā),有關(guān)研究人員要通過抽克。從消費(fèi)者的利益出發(fā),有關(guān)研究人員要通過抽檢其中的一批產(chǎn)品來驗證該產(chǎn)品制造商的說明是否屬實。試檢其中的一批產(chǎn)品來驗證該產(chǎn)品制造商的說明是否屬實。試陳述用于檢驗的原假設(shè)與備擇假設(shè)陳述用于檢驗的原假設(shè)與備擇假設(shè)提出假設(shè)提出假設(shè)(例題分析例題分析)解:研究者抽檢的意圖是傾向于證實這種洗滌劑的平均解:研究者抽檢的意圖是傾向于證實這種洗滌

18、劑的平均凈含量并不符合說明書中的陳述凈含量并不符合說明書中的陳述 。建立的原假設(shè)和備擇。建立的原假設(shè)和備擇假設(shè)為假設(shè)為 H0 : 500 H1 : 500【例例】一家研究機(jī)構(gòu)估計,某城市中家庭擁有汽車的比例超一家研究機(jī)構(gòu)估計,某城市中家庭擁有汽車的比例超過過30%30%。為驗證這一估計是否正確,該研究機(jī)構(gòu)隨機(jī)抽取了。為驗證這一估計是否正確,該研究機(jī)構(gòu)隨機(jī)抽取了一個樣本進(jìn)行檢驗。試陳述用于檢驗的原假設(shè)與備擇假設(shè)一個樣本進(jìn)行檢驗。試陳述用于檢驗的原假設(shè)與備擇假設(shè)提出假設(shè)提出假設(shè)(例題分析例題分析)解:研究者想收集證據(jù)予以支持的假設(shè)是解:研究者想收集證據(jù)予以支持的假設(shè)是“該該城市中家庭擁有汽車的比例

19、超過城市中家庭擁有汽車的比例超過30%”。建立的。建立的原假設(shè)和備擇假設(shè)為原假設(shè)和備擇假設(shè)為 H0 : 30% H1 : 30%統(tǒng)計學(xué)假設(shè)檢驗 提出假設(shè)提出假設(shè) 總結(jié)總結(jié)H H0 0: : 通常是將研究者不愿相信的、不認(rèn)可的、想拒絕的結(jié)論通常是將研究者不愿相信的、不認(rèn)可的、想拒絕的結(jié)論H H0 0 : = = 某一數(shù)值某一數(shù)值H H0 0 : 某一數(shù)值某一數(shù)值H H0 0 : 某一數(shù)值某一數(shù)值H H1 1: :與原假設(shè)是對立的,通常是研究者想要支持的、愿意相信的結(jié)果與原假設(shè)是對立的,通常是研究者想要支持的、愿意相信的結(jié)果H H1 1 : 某一數(shù)值某一數(shù)值H H1 1 : 某一數(shù)值某一數(shù)值H H

20、1 1 : ”或或“”的假的假設(shè)檢驗,稱為單側(cè)檢驗或單尾檢驗設(shè)檢驗,稱為單側(cè)檢驗或單尾檢驗(one-tailed test)(one-tailed test)備擇假設(shè)的方向為備擇假設(shè)的方向為“”,稱為,稱為右側(cè)檢驗右側(cè)檢驗 雙側(cè)檢驗與單側(cè)檢驗雙側(cè)檢驗與單側(cè)檢驗雙側(cè)檢驗與單側(cè)檢驗雙側(cè)檢驗與單側(cè)檢驗 ( (假設(shè)的形式假設(shè)的形式) )假設(shè)假設(shè)雙側(cè)檢驗雙側(cè)檢驗單側(cè)檢驗單側(cè)檢驗左側(cè)檢驗左側(cè)檢驗右側(cè)檢驗右側(cè)檢驗原假設(shè)原假設(shè)H H0 0 : : = = 0 0H H0 0 : : 0 0H H0 0 : : 0 0備擇假設(shè)備擇假設(shè)H H1 1 : : 0 0H H1 1 : : 0 0以總體均值的檢驗為例以

21、總體均值的檢驗為例7.1.2 怎樣做出決策?7.1 假設(shè)檢驗的基本原理假設(shè)檢驗的基本原理統(tǒng)計學(xué)假設(shè)檢驗 假設(shè)檢驗的步驟 1.提出原假設(shè)H0和備擇假設(shè)H1 2.構(gòu)造適當(dāng)?shù)臋z驗統(tǒng)計量 3.給定顯著性水平 0.01, 0.05, 0.100.01, 0.05, 0.10 4.計算檢驗統(tǒng)計量的值 5.做出判斷假設(shè)檢驗的基本思想假設(shè)檢驗的基本思想 因此我們拒絕假因此我們拒絕假設(shè)設(shè) = 50 如果這是總體的如果這是總體的假設(shè)均值假設(shè)均值樣本均值 = 50抽樣分布抽樣分布這個值不像我們應(yīng)這個值不像我們應(yīng)該得到的樣本均值該得到的樣本均值 .兩類錯誤與顯著性水平(了解)兩類錯誤與顯著性水平(了解) 研究者總是希

22、望能做出正確的決策,但由于決策是建立在樣本信息的基研究者總是希望能做出正確的決策,但由于決策是建立在樣本信息的基礎(chǔ)之上,而樣本又是隨機(jī)的,因而就有可能犯錯誤礎(chǔ)之上,而樣本又是隨機(jī)的,因而就有可能犯錯誤 原假設(shè)和備擇假設(shè)不能同時成立,決策的結(jié)果要么拒絕原假設(shè)和備擇假設(shè)不能同時成立,決策的結(jié)果要么拒絕H H0 0,要么不拒絕,要么不拒絕H H0 0。決策時總是希望當(dāng)原假設(shè)正確時沒有拒絕它,當(dāng)原假設(shè)不正確時拒。決策時總是希望當(dāng)原假設(shè)正確時沒有拒絕它,當(dāng)原假設(shè)不正確時拒絕它,但實際上很難保證不犯錯誤絕它,但實際上很難保證不犯錯誤 第第類錯誤類錯誤( ( 錯誤錯誤) )原假設(shè)為正確時拒絕原假設(shè)原假設(shè)為正

23、確時拒絕原假設(shè)第第類錯誤的概率記為類錯誤的概率記為 ,被稱為顯著性水平被稱為顯著性水平 2.2.第第類錯誤類錯誤( ( 錯誤錯誤) )原假設(shè)為錯誤時未拒絕原假設(shè)原假設(shè)為錯誤時未拒絕原假設(shè)第第類錯誤的概率記為類錯誤的概率記為 (Beta)(Beta)顯著性水平顯著性水平 (significant level)(significant level)事先確定的用于拒絕原假設(shè)事先確定的用于拒絕原假設(shè)H H0 0時所必須的證據(jù)時所必須的證據(jù)能夠容忍的犯第能夠容忍的犯第類錯誤的最大概率類錯誤的最大概率( (上限值上限值) )2.2.原假設(shè)為真時,拒絕原假設(shè)的概率原假設(shè)為真時,拒絕原假設(shè)的概率 抽樣分布的拒

24、絕域抽樣分布的拒絕域3.3.表示為表示為 (alpha)(alpha) 常用的常用的 值有值有0.01, 0.05, 0.100.01, 0.05, 0.104.4.由研究者事先確定由研究者事先確定 錯誤和錯誤和 錯誤的關(guān)系錯誤的關(guān)系你不能同時減少兩你不能同時減少兩類錯誤類錯誤!依據(jù)什么做出決策?依據(jù)什么做出決策?若假設(shè)為若假設(shè)為H H0 0=500=500, H H1 1500 I 臨界值,拒絕臨界值,拒絕H H0 0 /2 用統(tǒng)計量決策(左側(cè)檢驗 )H H1 1 : : 0 0,統(tǒng)計量統(tǒng)計量 - 0 0,統(tǒng)計量統(tǒng)計量 臨界值,拒絕臨界值,拒絕H H0 0 統(tǒng)計量決策規(guī)則統(tǒng)計量決策規(guī)則給定顯

25、著性水平給定顯著性水平 ,查表得出相應(yīng)的臨界值,查表得出相應(yīng)的臨界值z 或或z /2 /2, t 或或t /2 /2將檢驗統(tǒng)計量的值與將檢驗統(tǒng)計量的值與 水平的臨界值進(jìn)行比較水平的臨界值進(jìn)行比較作出決策作出決策雙側(cè)檢驗:雙側(cè)檢驗:H H1 1 : : 0 0,I I統(tǒng)計量統(tǒng)計量I I 臨界值,拒絕臨界值,拒絕H H0 0, 31.9631.96,拒絕,拒絕左側(cè)檢驗:左側(cè)檢驗:H H1 1 : : 0 0,統(tǒng)計量統(tǒng)計量 - -臨界值,拒絕臨界值,拒絕H H0 0, -3-1.96-3 0, 0,統(tǒng)計量統(tǒng)計量 臨界值,拒絕臨界值,拒絕H H0, 0, 31.9631.96,拒絕,拒絕當(dāng)單側(cè)檢驗時,

26、只要統(tǒng)計量與當(dāng)單側(cè)檢驗時,只要統(tǒng)計量與z 或或 t 大小比較比較方向與備擇假設(shè)符合一致時,拒絕拒絕不過,總而言之,無論是哪一種檢驗形式,只要不過,總而言之,無論是哪一種檢驗形式,只要I I統(tǒng)計量統(tǒng)計量I I 臨界值,臨界值,拒絕拒絕H H0 0用用P P 值決策值決策 軟件操作中的軟件操作中的sig.sig.即為即為P P值值 (P-value)如果原假設(shè)為真,所得到的樣本結(jié)果會像實際觀如果原假設(shè)為真,所得到的樣本結(jié)果會像實際觀測結(jié)果那么極端或更極端的概率,也就是我們拒測結(jié)果那么極端或更極端的概率,也就是我們拒絕原假設(shè)面臨的風(fēng)險絕原假設(shè)面臨的風(fēng)險P P值告訴我們:值告訴我們:如果原假設(shè)是正確的

27、話,我們?nèi)绻僭O(shè)是正確的話,我們得到得到目前這個樣本數(shù)據(jù)的可能性有多大,得到得到目前這個樣本數(shù)據(jù)的可能性有多大,如果這個可能性很小,就應(yīng)該拒絕原假設(shè)如果這個可能性很小,就應(yīng)該拒絕原假設(shè) 被稱為觀察到的被稱為觀察到的( (或?qū)崪y的或?qū)崪y的) )顯著性水平顯著性水平?jīng)Q策規(guī)則:若決策規(guī)則:若p p值值 |臨界值,拒絕原假設(shè),說明在統(tǒng)臨界值,拒絕原假設(shè),說明在統(tǒng)計上是顯著的計上是顯著的總體均值的檢驗總體均值的檢驗( ( 2 2 已知已知) )( (例題分析大樣本例題分析大樣本) )H0 : = 255= 255H1 : 255255 = 0.05 = 0.05 n = 40= 40 臨界值臨界值(

28、(c c): ):用用Excel中的中的【NORMSDIST】函數(shù)得到函數(shù)得到的雙尾檢驗的雙尾檢驗P=0.312945不拒絕不拒絕H0沒有證據(jù)表明該天生產(chǎn)的飲料不符合沒有證據(jù)表明該天生產(chǎn)的飲料不符合標(biāo)準(zhǔn)要求標(biāo)準(zhǔn)要求01.14052558 .2550nxz拒絕拒絕 H0拒絕拒絕 H0總體均值的檢驗總體均值的檢驗(z (z檢驗檢驗) ) ( (P P 值的計算與應(yīng)用值的計算與應(yīng)用) ) 第第1 1步:進(jìn)入步:進(jìn)入ExcelExcel表格界面,直接點(diǎn)擊表格界面,直接點(diǎn)擊【fx】 第第2 2步:在函數(shù)分類中點(diǎn)擊步:在函數(shù)分類中點(diǎn)擊【統(tǒng)計統(tǒng)計】,并在函數(shù)名,并在函數(shù)名 菜單下選擇菜單下選擇【NORMSD

29、ISTNORMSDIST】,然后,然后【確定確定】 第第3 3步:將步:將 z z 的絕對值的絕對值1.011.01錄入,得到的函數(shù)值為錄入,得到的函數(shù)值為 0.843752345 0.843752345 P P值值=2(1-0.843752345)=0.312495 =2(1-0.843752345)=0.312495 P P值遠(yuǎn)遠(yuǎn)大于值遠(yuǎn)遠(yuǎn)大于 ,故不拒絕,故不拒絕H H0 0總體均值的檢驗( 2 未知) (例題分析大樣本) 【例】一種機(jī)床加工的零件尺寸絕對【例】一種機(jī)床加工的零件尺寸絕對平均誤差為平均誤差為1.35mm1.35mm。生產(chǎn)廠家現(xiàn)采。生產(chǎn)廠家現(xiàn)采用一種新的機(jī)床進(jìn)行加工以期進(jìn)一

30、步用一種新的機(jī)床進(jìn)行加工以期進(jìn)一步降低誤差。為檢驗新機(jī)床加工的零件降低誤差。為檢驗新機(jī)床加工的零件平均誤差與舊機(jī)床相比是否有顯著降平均誤差與舊機(jī)床相比是否有顯著降低,從某天生產(chǎn)的零件中隨機(jī)抽取低,從某天生產(chǎn)的零件中隨機(jī)抽取5050個進(jìn)行檢驗。利用這些樣本數(shù)據(jù),檢個進(jìn)行檢驗。利用這些樣本數(shù)據(jù),檢驗新機(jī)床加工的零件尺寸的平均誤差驗新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)床相比是否有顯著降低?與舊機(jī)床相比是否有顯著降低? ( ( =0.01) =0.01) 樣本均值為樣本均值為1.31521.31525050個零件尺寸的誤差數(shù)據(jù)個零件尺寸的誤差數(shù)據(jù) (mm)1.261.261.191.191.311.3

31、10.970.971.811.811.131.130.960.961.061.061.001.000.940.940.980.981.101.101.121.121.031.031.161.161.121.121.121.120.950.951.021.021.131.131.231.230.740.741.501.500.500.500.590.590.990.991.451.451.241.241.011.012.032.031.981.981.971.970.910.911.221.221.061.061.111.111.541.541.081.081.101.101.641.641.7

32、01.702.372.371.381.381.601.601.261.261.171.171.121.121.231.230.820.820.860.86總體均值的檢驗總體均值的檢驗( (例題分析例題分析大樣本大樣本) )H0 : 1.351.35H1 : 1.351.35 = 0.01 = 0.01 n = = 5050 臨界值臨界值( (c c): ):檢驗統(tǒng)計量檢驗統(tǒng)計量: 新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)床相比有顯著降低床相比有顯著降低6061.250365749.035.13152.1z總體均值的檢驗總體均值的檢驗 ( (P P 值的計算與應(yīng)用

33、值的計算與應(yīng)用大樣本大樣本) ) 第第1 1步:進(jìn)入步:進(jìn)入ExcelExcel表格界面,直接點(diǎn)擊表格界面,直接點(diǎn)擊【f( (x) )】 第第2 2步:在函數(shù)分類中點(diǎn)擊步:在函數(shù)分類中點(diǎn)擊【統(tǒng)計統(tǒng)計】,并在函數(shù)名的菜單下選,并在函數(shù)名的菜單下選 擇擇【ZTESTZTEST】,然后,然后【確定確定】 第第3 3步:在所出現(xiàn)的對話框步:在所出現(xiàn)的對話框【ArrayArray】框中,輸入原始數(shù)據(jù)所框中,輸入原始數(shù)據(jù)所 在區(qū)域在區(qū)域 ;在;在【X】后輸入?yún)?shù)的某一假定值后輸入?yún)?shù)的某一假定值( (這里為這里為 1.35)1.35);在;在【SigmaSigma】后輸入已知的總體標(biāo)準(zhǔn)差后輸入已知的總體標(biāo)

34、準(zhǔn)差( (若總?cè)艨?體標(biāo)準(zhǔn)差未知則可忽略不填,系統(tǒng)將自動使用樣本體標(biāo)準(zhǔn)差未知則可忽略不填,系統(tǒng)將自動使用樣本 標(biāo)準(zhǔn)差代替標(biāo)準(zhǔn)差代替) ) 第第4 4步:用步:用1 1減去得到的函數(shù)值減去得到的函數(shù)值0.995421023 0.995421023 即為即為P P值值 P P值值=1-0.995421023=0.004579 =1-0.995421023=0.004579 P P值值 52005200 = 0.05 = 0.05 n = 36= 36 臨界值臨界值( (c c): ):75.33612052005275z總體均值的檢驗(z檢驗) (P 值的圖示)總體均值的檢驗 (小樣本)1.假定條

35、件總體服從正態(tài)分布小樣本(n 30)檢驗統(tǒng)計量 2 已知:2. 2 未知:)1 ,0(0Nnxz)1(0ntnsxt 例例7-27-2某市歷年來對某市歷年來對7 7歲男孩的統(tǒng)計資料表明,他們的身高服從均值為歲男孩的統(tǒng)計資料表明,他們的身高服從均值為1.321.32米、標(biāo)準(zhǔn)差為米、標(biāo)準(zhǔn)差為0.120.12米的正態(tài)分布?,F(xiàn)從各個學(xué)校隨機(jī)抽取米的正態(tài)分布?,F(xiàn)從各個學(xué)校隨機(jī)抽取2525個個7 7歲男學(xué)生,歲男學(xué)生,測得他們平均身高測得他們平均身高1.361.36米,若已知今年全市米,若已知今年全市7 7歲男孩身高的標(biāo)準(zhǔn)差仍為歲男孩身高的標(biāo)準(zhǔn)差仍為0.120.12米,米,問與歷年問與歷年7 7歲男孩的身

36、高相比是否有顯著差異歲男孩的身高相比是否有顯著差異( (取取 0.05)0.05)。解:從題意可知,解:從題意可知, 1.361.36米,米, 1. 321. 32米,米, 0.120.12米。米。 (1) (1)建立假設(shè):建立假設(shè):H H0 0: 1.321.32, H H1 1: 1.32 1.32 (2) (2)確定統(tǒng)計量:確定統(tǒng)計量: 1.361.321.67/0.12 /25XZnX0(3)Z(3)Z的分布:的分布:Z ZN(0,1)N(0,1)(4)(4)對給定的對給定的 0.050.05確定臨界值。因為是雙側(cè)備擇假設(shè)所以查表時要注意。確定臨界值。因為是雙側(cè)備擇假設(shè)所以查表時要注意

37、。因概率表是按雙側(cè)排列的,所以應(yīng)查因概率表是按雙側(cè)排列的,所以應(yīng)查1-0.051-0.050.950.95的值,查得臨界值的值,查得臨界值 1.961.96。(5)(5)檢驗準(zhǔn)則。檢驗準(zhǔn)則。|Z|1.96|Z|=0.05,故不拒絕H0 一個總體均值的檢驗一個總體均值的檢驗( (作出判斷作出判斷) ) 是否已知是否已知樣本量樣本量n 是否已知是否已知 t 檢驗檢驗nsxt0z 檢驗檢驗nsxz0z 檢驗檢驗 nxz0z 檢驗檢驗nxz07.2.1 7.2.1 總體比例的檢驗總體比例的檢驗總體比例檢驗假定條件總體服從二項分布可用正態(tài)分布來近似(大樣本)檢驗的 z 統(tǒng)計量)1 ,0()1(000Nn

38、pz總體比例的檢驗 (例題分析) 【例例】一種以休閑和娛樂為主題的雜志,聲稱其讀者群中有80%80%為女性。為驗證這一說法是否屬實,某研究部門抽取了由200200人組成的一個隨機(jī)樣本,發(fā)現(xiàn)有146146個女性經(jīng)常閱讀該雜志。分別取顯著性水平 =0.05=0.05和 =0.01=0.01 ,檢驗該雜志讀者群中女性的比例是否為80%?它們的P值各是多少?總體比例的檢驗 (例題分析)H0 : = 80%= 80%H1 : 80%80% = 0.05= 0.05 n = 200= 200 臨界值臨界值( (c c): ):475.2200)80.01(80.080.073.0z總體比例的檢驗 (例題分

39、析)H0 : = 80%= 80%H1 : 80%80% = 0.01 = 0.01 n = 200= 200 臨界值臨界值(c):(c):475.2200)80.01(80.080.073.0z 例例7-77-7某企業(yè)的產(chǎn)品暢銷國內(nèi)市場。據(jù)以往調(diào)查,購買該產(chǎn)品的顧客有某企業(yè)的產(chǎn)品暢銷國內(nèi)市場。據(jù)以往調(diào)查,購買該產(chǎn)品的顧客有5050是是3030歲以上的男子。該企業(yè)負(fù)責(zé)人關(guān)心這個比例是否發(fā)生了變化,而無論是歲以上的男子。該企業(yè)負(fù)責(zé)人關(guān)心這個比例是否發(fā)生了變化,而無論是增加還是減少。于是,該企業(yè)委托了一家咨詢機(jī)構(gòu)進(jìn)行調(diào)查,這家咨詢機(jī)構(gòu)從增加還是減少。于是,該企業(yè)委托了一家咨詢機(jī)構(gòu)進(jìn)行調(diào)查,這家咨詢

40、機(jī)構(gòu)從眾多的購買者中隨機(jī)抽選了眾多的購買者中隨機(jī)抽選了400400名進(jìn)行調(diào)查,結(jié)果有名進(jìn)行調(diào)查,結(jié)果有210210名為名為3030歲以上的男子。歲以上的男子。該廠負(fù)責(zé)人希望在顯著性水平該廠負(fù)責(zé)人希望在顯著性水平0.050.05下檢驗下檢驗“5050的顧客是的顧客是3030歲以上的男子歲以上的男子”這這個假設(shè)。個假設(shè)。解:(解:(1 1)建立假設(shè))建立假設(shè)由題意可知,這是雙側(cè)檢驗,故建立假設(shè)由題意可知,這是雙側(cè)檢驗,故建立假設(shè) H H0 0: 5050H1H1: 5050(2 2)計算統(tǒng)計量)計算統(tǒng)計量由于樣本容量由于樣本容量 4004003030, 4004005050200200, 2002

41、00,皆大于,皆大于5 5,所以可以使用正態(tài)分布進(jìn)行檢驗。,所以可以使用正態(tài)分布進(jìn)行檢驗。(3 3)Z ZN(0,1)N(0,1)(4 4)對應(yīng)于)對應(yīng)于0.050.05的顯著性水平,雙側(cè)檢驗臨界值為的顯著性水平,雙側(cè)檢驗臨界值為1.961.96。(5 5)若)若Z Z值不大于值不大于1.961.96,則接受原假設(shè),否則,拒絕之。,則接受原假設(shè),否則,拒絕之。(6 6)本例中,)本例中,Z=1Z=1,處于接受域,故接受,處于接受域,故接受“5050的顧客是的顧客是3030歲以上的男子歲以上的男子”這個假設(shè)。這個假設(shè)。0.5250.51(1)0.5(10.5) / 400pZnnn(1)n7.4

42、.1 7.4.1 總體方差的檢驗總體方差的檢驗總體方差的檢驗 ( 2檢驗) 檢驗一個總體的方差或標(biāo)準(zhǔn)差假設(shè)總體近似服從正態(tài)分布使用 2分布檢驗統(tǒng)計量) 1() 1(22022nsn總體方差的檢驗(例題分析) 【例例】啤酒生產(chǎn)企業(yè)采用自動生產(chǎn)線灌裝啤酒,每瓶的裝填量為640640ml,但由于受某些不可控因素的影響,每瓶的裝填量會有差異。此時,不僅每瓶的平均裝填量很重要,裝填量的方差同樣很重要。如果方差很大,會出現(xiàn)裝填量太多或太少的情況,這樣要么生產(chǎn)企業(yè)不劃算,要么消費(fèi)者不滿意。假定生產(chǎn)標(biāo)準(zhǔn)規(guī)定每瓶裝填量的標(biāo)準(zhǔn)差不應(yīng)超過4 4ml。企業(yè)質(zhì)檢部門抽取了1010瓶啤酒進(jìn)行檢驗,得到的樣本標(biāo)準(zhǔn)差為s s=3.8=3.8ml。試以0.050.05的顯著性水平檢驗裝填量的標(biāo)準(zhǔn)差是否符合要求?總體方差的檢驗(例題分析)H H0 0 : 2 2 4 42 2H H1 1 : 2 2 4 42 2 = 0.10 = 0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論