版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
數(shù)據(jù)分析
(方法與案例)
作者賈俊平統(tǒng)計學基礎(chǔ)
FundamentalStatistics第6章假設(shè)檢驗6.1
假設(shè)檢驗的基本原理6.2
總體均值的檢驗6.3
總體比例的檢驗hypothesistest2011年學習目標假設(shè)檢驗的基本思想和原理總體均值的檢驗總體比例的檢驗P值的計算與應用6.1假設(shè)檢驗的基本原理
一、假設(shè)的陳述二、兩類錯誤與顯著性水平三、檢驗統(tǒng)計量與拒絕域四、利用P值進行決策第6章假設(shè)檢驗一、假設(shè)的陳述6.1假設(shè)檢驗的基本原理2011年什么是假設(shè)?
(hypothesis)
在參數(shù)檢驗中,對總體參數(shù)的具體數(shù)值所作的陳述就一個總體而言,總體參數(shù)包括總體均值、比例、方差等分析之前必需陳述我認為這種新藥的療效比原有的藥物更有效!2011年什么是假設(shè)檢驗?
(hypothesistest)先對總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的統(tǒng)計方法有參數(shù)檢驗和非參數(shù)檢驗邏輯上運用反證法,統(tǒng)計上依據(jù)小概率原理小概率是在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)2011年原假設(shè)
(nullhypothesis)又稱“0假設(shè)”,研究者想收集證據(jù)予以反對的假設(shè),用H0表示所表達的含義總是指參數(shù)沒有變化或變量之間沒有關(guān)系
最初被假設(shè)是成立的,之后根據(jù)樣本數(shù)據(jù)確定是否有足夠的證據(jù)拒絕它總是有符號
,
或
H0:
=某一數(shù)值H0:
某一數(shù)值H0:
某一數(shù)值例如,H0:
10cmnull2011年也稱“研究假設(shè)”,研究者想收集證據(jù)予以支持的假設(shè),用H1或Ha表示所表達的含義是總體參數(shù)發(fā)生了變化或變量之間有某種關(guān)系備擇假設(shè)通常用于表達研究者自己傾向于支持的看法,然后就是想辦法收集證據(jù)拒絕原假設(shè),以支持備擇假設(shè)
總是有符號
,
或
H1:
某一數(shù)值H1:
某一數(shù)值H1:
<某一數(shù)值備擇假設(shè)(alternativehypothesis)2011年【例6.1】一種零件的生產(chǎn)標準是直徑應為10cm,為對生產(chǎn)過程進行控制,質(zhì)量監(jiān)測人員定期對一臺加工機床檢查,確定這臺機床生產(chǎn)的零件是否符合標準要求。如果零件的平均直徑大于或小于10cm,則表明生產(chǎn)過程不正常,必須進行調(diào)整。試陳述用來檢驗生產(chǎn)過程是否正常的原假設(shè)和被擇假設(shè)提出假設(shè)(例題分析)解:研究者想收集證據(jù)予以證明的假設(shè)應該是“生產(chǎn)過程不正?!?。建立的原假設(shè)和備擇假設(shè)為
H0:
10cmH1:
10cm
2011年【例6.2】某品牌洗滌劑在它的產(chǎn)品說明書中聲稱:平均凈含量不少于500克。從消費者的利益出發(fā),有關(guān)研究人員要通過抽檢其中的一批產(chǎn)品來驗證該產(chǎn)品制造商的說明是否屬實。試陳述用于檢驗的原假設(shè)與備擇假設(shè)提出假設(shè)(例題分析)解:研究者抽檢的意圖是傾向于證實這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設(shè)和備擇假設(shè)為
H0:
500H1:
<500500g綠葉洗滌劑2011年【例6.3】一家研究機構(gòu)估計,某城市中家庭擁有汽車的比例超過30%。為驗證這一估計是否正確,該研究機構(gòu)隨機抽取了一個樣本進行檢驗。試陳述用于檢驗的原假設(shè)與備擇假設(shè)提出假設(shè)(例題分析)解:研究者想收集證據(jù)予以支持的假設(shè)是“該城市中家庭擁有汽車的比例超過30%”。建立的原假設(shè)和備擇假設(shè)為
H0:
30%H1:
30%2011年原假設(shè)和備擇假設(shè)是一個完備事件組,而且相互對立在一項假設(shè)檢驗中,原假設(shè)和備擇假設(shè)必有一個成立,而且只有一個成立先確定備擇假設(shè),再確定原假設(shè)等號“=”總是放在原假設(shè)上因研究目的不同,對同一問題可能提出不同的假設(shè)(也可能得出不同的結(jié)論)提出假設(shè)(結(jié)論與建議)2011年備擇假設(shè)沒有特定的方向性,并含有符號“
”的假設(shè)檢驗,稱為雙側(cè)檢驗或雙尾檢驗(two-tailedtest)
備擇假設(shè)具有特定的方向性,并含有符號“>”或“<”的假設(shè)檢驗,稱為單側(cè)檢驗或單尾檢驗(one-tailedtest)備擇假設(shè)的方向為“<”,稱為左側(cè)檢驗
備擇假設(shè)的方向為“>”,稱為右側(cè)檢驗
雙側(cè)檢驗與單側(cè)檢驗2011年雙側(cè)檢驗與單側(cè)檢驗
(假設(shè)的形式)假設(shè)雙側(cè)檢驗單側(cè)檢驗左側(cè)檢驗右側(cè)檢驗原假設(shè)H0:m
=m0H0:m
m0H0:m
m0備擇假設(shè)H1:m
≠m0H1:m
<m0H1:m
>m0以總體均值的檢驗為例二、兩類錯誤與顯著性水平6.1假設(shè)檢驗的基本原理2011年兩類錯誤與顯著性水平研究者總是希望能做出正確的決策,但由于決策是建立在樣本信息的基礎(chǔ)之上,而樣本又是隨機的,因而就有可能犯錯誤原假設(shè)和備擇假設(shè)不能同時成立,決策的結(jié)果要么拒絕H0,要么不拒絕H0。決策時總是希望當原假設(shè)正確時沒有拒絕它,當原假設(shè)不正確時拒絕它,但實際上很難保證不犯錯誤第Ⅰ類錯誤(
錯誤)原假設(shè)為正確時拒絕原假設(shè)第Ⅰ類錯誤的概率記為
,被稱為顯著性水平2. 第Ⅱ類錯誤(
錯誤)原假設(shè)為錯誤時未拒絕原假設(shè)第Ⅱ類錯誤的概率記為
(Beta)
2011年
錯誤和
錯誤的關(guān)系你要同時減少兩類錯誤的惟一辦法是增加樣本量
和
的關(guān)系就像翹翹板,
小
就大,
大
就小2011年兩類錯誤的控制一般來說,對于一個給定的樣本,如果犯第Ι類錯誤的代價比犯第Ⅱ類錯誤的代價相對較高,則將犯第Ⅰ類錯誤的概率定得低些較為合理;反之,如果犯第Ι類錯誤的代價比犯第Ⅱ類錯誤的代價相對較低,則將犯第Ⅰ類錯誤的概率定得高些一般來說,發(fā)生哪一類錯誤的后果更為嚴重,就應該首要控制哪類錯誤發(fā)生的概率。但由于犯第Ι類錯誤的概率是可以由研究者控制的,因此在假設(shè)檢驗中,人們往往先控制第Ι類錯誤的發(fā)生概率2011年顯著性水平
(significantlevel)事先確定的用于拒絕原假設(shè)H0時所必須的證據(jù)能夠容忍的犯第Ⅰ類錯誤的最大概率(上限值)2. 原假設(shè)為真時,拒絕原假設(shè)的概率抽樣分布的拒絕域3. 表示為
(alpha)
常用的值有0.01,0.05,0.104. 由研究者事先確定三、檢驗統(tǒng)計量與拒絕域6.1假設(shè)檢驗的基本原理2011年依據(jù)什么做出決策?若假設(shè)為H0:
=500,H1:
<500。樣本均值為495,拒絕H0嗎?樣本均值為502,拒絕H0嗎?做出拒絕或不拒絕原假設(shè)的依據(jù)是什么?傳統(tǒng)上,做出決策所依據(jù)的是樣本統(tǒng)計量,現(xiàn)代檢驗中人們直接使用由統(tǒng)計量算出的犯第Ⅰ類錯誤的概率,即所謂的P值2011年根據(jù)樣本觀測結(jié)果計算出對原假設(shè)和備擇假設(shè)做出決策某個樣本統(tǒng)計量對樣本估計量的標準化結(jié)果原假設(shè)H0為真點估計量的抽樣分布檢驗統(tǒng)計量(teststatistic)
標準化的檢驗統(tǒng)計量
2011年用統(tǒng)計量決策
(雙側(cè)檢驗)抽樣分布H0臨界值臨界值a/2a/2拒絕H0拒絕H01-
置信水平RegionofRejectionRegionofNonrejectionRegionofRejection2011年用統(tǒng)計量決策
(左側(cè)檢驗)抽樣分布H0臨界值a拒絕H01-
置信水平RegionofRejectionRegionofNonrejection2011年用統(tǒng)計量決策
(右側(cè)檢驗)抽樣分布H0臨界值
拒絕H01-
置信水平RegionofNonrejectionRegionofRejection2011年統(tǒng)計量決策規(guī)則給定顯著性水平
,查表得出相應的臨界值z
或z
/2,t
或t
/2將檢驗統(tǒng)計量的值與
水平的臨界值進行比較作出決策雙側(cè)檢驗:I統(tǒng)計量I>臨界值,拒絕H0左側(cè)檢驗:統(tǒng)計量<-臨界值,拒絕H0右側(cè)檢驗:統(tǒng)計量>臨界值,拒絕H0四、利用P值進行決策6.1假設(shè)檢驗的基本原理2011年用P值決策
(P-value)如果原假設(shè)為真,所得到的樣本結(jié)果會像實際觀測結(jié)果那么極端或更極端的概率P值告訴我們:如果原假設(shè)是正確的話,我們得到得到目前這個樣本數(shù)據(jù)的可能性有多大,如果這個可能性很小,就應該拒絕原假設(shè)被稱為觀察到的(或?qū)崪y的)顯著性水平?jīng)Q策規(guī)則:若p值<
,拒絕H02011年雙側(cè)檢驗的P值
/
2
/
2Z拒絕H0拒絕H00臨界值計算出的樣本統(tǒng)計量計算出的樣本統(tǒng)計量臨界值1/2P值1/2P值2011年左側(cè)檢驗的P值
Z拒絕H00臨界值計算出的樣本統(tǒng)計量1/2P值2011年右側(cè)檢驗的P值
Z拒絕H00計算出的樣本統(tǒng)計量臨界值1/2P值2011年拒絕H0P值決策與統(tǒng)計量的比較拒絕H0的兩個統(tǒng)計量的不同顯著性
Z拒絕H00統(tǒng)計量1
P1
值統(tǒng)計量2
P2
值拒絕H0臨界值6.2總體均值的檢驗
一、大樣本的檢驗方法二、小樣本的檢驗方法第6章假設(shè)檢驗一、大樣本的檢驗方法6.2總體均值的檢驗2011年總體均值的檢驗
(大樣本)1. 假定條件大樣本(n
30)使用z檢驗統(tǒng)計量
2
已知:
2
未知:2011年總體均值的檢驗(
2
已知)
(例題分析—大樣本)【例6.4】一種罐裝飲料采用自動生產(chǎn)線生產(chǎn),每罐的容量是255ml,標準差為5ml。為檢驗每罐容量是否符合要求,質(zhì)檢人員在某天生產(chǎn)的飲料中隨機抽取了40罐進行檢驗,測得每罐平均容量為255.8ml。取顯著性水平
=0.05
,檢驗該天生產(chǎn)的飲料容量是否符合標準要求?雙側(cè)檢驗綠色健康飲品綠色健康飲品2552552011年總體均值的檢驗(
2
已知)
(例題分析-大樣本)H0
:
=255H1
:
255
=
0.05n
=
40臨界值(c):檢驗統(tǒng)計量:決策:結(jié)論:
用Excel中的【NORMSDIST】函數(shù)得到的雙尾檢驗P=0.312945不拒絕H0沒有證據(jù)表明該天生產(chǎn)的飲料不符合標準要求
z01.96-1.960.005拒絕H0拒絕H00.0052011年總體均值的檢驗(z檢驗)
(P值的計算與應用)第1步:進入Excel表格界面,直接點擊【fx】第2步:在函數(shù)分類中點擊【統(tǒng)計】,并在函數(shù)名菜單下選擇【NORM.S.DIST】,然后【確定】第3步:將z的絕對值1.01錄入,得到的函數(shù)值為
0.843752345
P值=2(1-0.843752345)=0.312495
P值遠遠大于
,故不拒絕H02011年總體均值的檢驗(
2
未知)
(例題分析—大樣本)【例6.5】一種機床加工的零件尺寸絕對平均誤差為1.35mm。生產(chǎn)廠家現(xiàn)采用一種新的機床進行加工以期進一步降低誤差。為檢驗新機床加工的零件平均誤差與舊機床相比是否有顯著降低,從某天生產(chǎn)的零件中隨機抽取50個進行檢驗。利用這些樣本數(shù)據(jù),檢驗新機床加工的零件尺寸的平均誤差與舊機床相比是否有顯著降低?(
=0.01)
左側(cè)檢驗50個零件尺寸的誤差數(shù)據(jù)(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.862011年總體均值的檢驗
(例題分析—大樣本)H0
:
1.35H1
:
<1.35
=
0.01n
=
50臨界值(c):檢驗統(tǒng)計量:拒絕H0新機床加工的零件尺寸的平均誤差與舊機床相比有顯著降低決策:結(jié)論:-2.33z0拒絕H00.012011年總體均值的檢驗
(P值的計算與應用—大樣本)第1步:進入Excel表格界面,直接點擊【fx】第2步:在函數(shù)分類中點擊【統(tǒng)計】,并在函數(shù)名的菜單下選擇【Z.TEST】,然后【確定】第3步:在所出現(xiàn)的對話框【Array】框中,輸入原始數(shù)據(jù)所在區(qū)域;在【X】后輸入?yún)?shù)的某一假定值(這里為
1.35);在【Sigma】后輸入已知的總體標準差(若總體標準差未知則可忽略不填,系統(tǒng)將自動使用樣本標準差代替)第4步:用1減去得到的函數(shù)值0.995421023
即為P值
P值=1-0.995421023=0.004579
P值<
=0.01,拒絕H0計算P值Excel2011年總體均值的檢驗
(P值的圖示)計算出的樣本統(tǒng)計量=2.6061P=0.004579
Z拒絕H00臨界值P值2011年總體均值的檢驗(
2
未知)
(例題分析)【例6.6】某一小麥品種的平均產(chǎn)量為5200kg/hm2
。一家研究機構(gòu)對小麥品種進行了改良以期提高產(chǎn)量。為檢驗改良后的新品種產(chǎn)量是否有顯著提高,隨機抽取了36個地塊進行試種,得到的樣本平均產(chǎn)量為5275kg/hm2,標準差為120/hm2
。試檢驗改良后的新品種產(chǎn)量是否有顯著提高?(
=0.05)
右側(cè)檢驗2011年總體均值的檢驗(
2
未知)
(例題分析)H0
:
5200H1
:
>5200
=
0.05n
=
36臨界值(c):檢驗統(tǒng)計量:拒絕H0
(P=0.000088<
=0.05)改良后的新品種產(chǎn)量有顯著提高
決策:結(jié)論:z0拒絕H00.051.6452011年總體均值的檢驗(z檢驗)
(P值的圖示)抽樣分布P=0.000088
01.645a=0.05拒絕H01-
計算出的樣本統(tǒng)計量=3.75P值2011年總體均值的檢驗
(大樣本檢驗方法的總結(jié))假設(shè)雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式H0
:m=m0H1:m
m0H0:m
m0H1:m<m0H0:m
m0H1:m>m0統(tǒng)計量
已知
未知拒絕域P值決策拒絕H0二、小樣本的檢驗方法6.2總體均值的檢驗2011年總體均值的檢驗
(小樣本)1. 假定條件總體服從正態(tài)分布小樣本(n<
30)檢驗統(tǒng)計量
2
已知:
2
未知:2011年總體均值的檢驗
(小樣本檢驗方法的總結(jié))假設(shè)雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式H0
:m=m0H1:m
m0H0
:m
m0H1:m<m0H0:m
m0H1:m>m0統(tǒng)計量
已知
未知拒絕域P值決策拒絕H0注:
已知的拒絕域同大樣本2011年總體均值的檢驗
(例題分析—小樣本)【例6.7】一種汽車配件的平均長度要求為12cm,高于或低于該標準均被認為是不合格的。汽車生產(chǎn)企業(yè)在購進配件時,通常是經(jīng)過招標,然后對中標的配件提供商提供的樣品進行檢驗,以決定是否購進?,F(xiàn)對一個配件提供商提供的10個樣本進行了檢驗。假定該供貨商生產(chǎn)的配件長度服從正態(tài)分布,在0.05的顯著性水平下,檢驗該供貨商提供的配件是否符合要求?10個零件尺寸的長度(cm)12.210.812.011.811.912.411.312.212.012.32011年總體均值的檢驗
(例題分析—小樣本)H0
:
=12H1
:
12
=0.05df=10-1=9臨界值(c):檢驗統(tǒng)計量:不拒絕H0沒有證據(jù)表明該供貨商提供的零件不符合要求
決策:結(jié)論:t02.262-2.2620.025拒絕
H0拒絕H00.0252011年總體均值的檢驗
(P值的計算與應用-t
檢驗)第1步:進入Excel表格界面,直接點擊【fx】第2步:在函數(shù)分類中點擊【統(tǒng)計】,并在函數(shù)名的菜單下選擇【T.DIST】,然后【確定】第3步:在出現(xiàn)對話框的【X】欄中輸入計算出的t的絕對值0.7053,在【Deg-freedom】(自由度)欄中輸入本例的自由度9,在【Tails】欄中輸入2(表明是雙側(cè)檢驗,如果是單測檢驗則在該欄輸入1)第4步:P值=0.498453
P值>
=0.05,故不拒絕H0
2011年一個總體均值的檢驗
(作出判斷)6.3總體比例的檢驗
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《游泳服務(wù)與管理》課件
- 《電力企業(yè)流程管理》課件
- 《電磁輻射及預防》課件
- 2024年高考生物一輪復習必修二第五單元遺傳的基本規(guī)律試題
- 單位管理制度集合大合集【人力資源管理】十篇
- 單位管理制度集粹匯編職員管理篇十篇
- 單位管理制度分享匯編【員工管理】十篇
- 單位管理制度分享大全【人員管理】十篇
- 單位管理制度呈現(xiàn)合集【員工管理】十篇
- 《團隊建設(shè)與發(fā)展》課件
- 2024-2025學年上學期深圳初中地理七年級期末模擬卷3
- 中國當代文學專題-003-國開機考復習資料
- 期末測試卷-2024-2025學年外研版(一起)英語六年級上冊(含答案含聽力原文無音頻)
- 上海市浦東新區(qū)2023-2024學年一年級上學期期末考試數(shù)學試題
- 中國馬克思主義與當代思考題(附答案)
- 化工儀表及自動化第六版-課后-答案
- 老化箱點檢表A3版本
- 消防設(shè)施驗收移交單
- 光伏發(fā)電項目并網(wǎng)調(diào)試方案
- 教師教學質(zhì)量評估表(學生用)
- 2022年自考4月英語真題帶解析
評論
0/150
提交評論