




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第4章假設檢驗1、假設檢驗概述2、假設檢驗的流程3、單總體參數檢驗4、雙總體參數檢驗5、假設檢驗的局限性6、SPSS應用舉例1第1節(jié)假設檢驗概述1、基本思想2、數據的適用范圍24.1.1基本思想參數估計是探索性統(tǒng)計推斷方法;假設檢驗是驗證性統(tǒng)計推斷方法;用樣本數據驗證對總體統(tǒng)計特征的某一觀點;這一觀點稱為假設。34.1.1基本思想對總體的統(tǒng)計特征所作的陳述總體統(tǒng)計特征跟參數有關,稱為參數假設檢驗,如:總體均值、比例、方差等總體統(tǒng)計特征跟參數無關,稱為參數假設檢驗,分析之前必須陳述4什么是假設?
(hypothesis)我認為這批新生產的燈泡的合格率達到了市場的規(guī)范要求4.1.1基本思想先對總體的統(tǒng)計特征提出某種假設,然后利用樣本信息判斷假設是否成立的過程有參數檢驗和非參數檢驗邏輯上運用反證法,統(tǒng)計上依據小概率原理5什么是假設檢驗?
(hypothesistest)4.1.1基本思想什么是小概率事件原理?在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率。在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設。小概率由研究者事先確定。6假設檢驗中的小概率事件原理4.1.2數據的適用范圍假設檢驗是對一組數據來源的總體的統(tǒng)計規(guī)律進行檢驗,包括一個總體或兩個總體的均值、比例和方差。從數據觀測值的特征來看,假設檢驗的方法對定性數據和定量數據的研究是通用的;從數據描述現(xiàn)象與時間的關系來看,假設檢驗適用于大多數截面數據而應用于分析時間序列數據的情形較少。對均值和方差的檢驗適用于定量數據,而對比例的檢驗適用于定性數據。7第2節(jié)假設檢驗的流程1、提出假設2、構造檢驗統(tǒng)計量3、計算檢驗統(tǒng)計量4、作出決策84.2.1提出假設研究者想收集證據予以反對的假設又稱“0假設”總是有符號
,
或
表示為H0H0:
=某一數值
指定為符號
=,
或
例如,
H0:
10cm9原假設
(nullhypothesis)null4.2.1提出假設之所以用零來修飾原假設,其原因是原假設的內容總是表示沒有差異或沒有改變,或變量間沒有關系等等零假設總是一個與總體參數有關的問題,所以總是用希臘字母表示。關于樣本統(tǒng)計量如樣本均值或樣本均值之差的零假設是沒有意義的,因為樣本統(tǒng)計量是已知的,當然能說出它們等于幾或是否相等10為什么叫0假設?
4.2.1提出假設研究者想收集證據予以支持的假設也稱“研究假設”總是有符號
,
或
表示為
H1H1:
<某一數值,或
某一數值例如,H1:
<10cm,或
10cm11備擇假設(alternativehypothesis)4.2.1提出假設【例4.1】一種零件的生產標準是直徑應為20cm。為對生產過程進行控制,質量監(jiān)測人員定期對一臺加工機床檢查,確定這臺機床生產的零件是否符合標準要求。如果零件的平均直徑大于或小于20cm,則表明生產過程不正常,必須進行調整。試陳述用來檢驗生產過程是否正常的原假設和備擇假設。12例題分析解:研究者是想收集證據來證明生產過程不正常。因此,建立的原假設和備擇假設分別為H0:
20cmH1:
20cm4.2.1提出假設(1)原假設與備擇假設是一對完備的事件組,且是一對完全互斥事件。一項檢驗中,原假設和備擇假設有且僅有一項成立。(2)原假設是假設總體參數未發(fā)生改變,備擇假設是假設總體參數發(fā)生了變化,所以"="總是在原假設上。(3)假設是基于研究者的角度和立場出發(fā)的,同樣的問題因立場不同會有完全不同方向的假設,也可能得出不同的結論。13原假設與備擇假設關系4.2.1提出假設14
假設檢驗的基本形式4.2.1提出假設邏輯上用了反證法,原假設與備擇假設的選擇至關重要從南京彭宇案與美國辛普森殺妻案的對比分析來看假設選擇的重要性。2018年上半年的“俄國間諜中毒案”引發(fā)的英俄外交風波法庭審判中的“疑點歸于被告”or“疑點歸于原告”,“無罪推定”or“有罪推定”在假設檢驗中,屬于“疑點歸于原假設”或“原假設推定”15原假設與備擇假設的選擇4.2.2構造檢驗統(tǒng)計量基于原假設構造檢驗統(tǒng)計量,即假設原假設為真時,檢驗統(tǒng)計量滿足一抽樣分布;根據樣本觀察值計算檢驗統(tǒng)計量的值;根據抽樣分布計算檢驗統(tǒng)計量值的概率;如果概率很小,拒絕原假設,說明備擇假設所述結論是顯著的;否則,不能拒絕原假設,說明備擇假設所述結論是不顯著。16檢驗的基本思想4.2.2構造檢驗統(tǒng)計量首先提出一個假設,如業(yè)主月收入的平均值為8000元。如果樣本數據中,某戶業(yè)主的月收入為7000元,顯然與8000元存在一定的差距。樣本(7000元)與假設(8000元)之間的差距有可能是由于抽樣誤差或系統(tǒng)誤差引起的。依據小概率事件原理,計算在假設成立的條件下,樣本值或更極端值發(fā)生的概率。如果7000元發(fā)生的概率較大,則沒有理由認為8000元的假設是不成立的,即不拒絕原假設;反之,如果7000元發(fā)生的概率極小,依據小概率事件在一次實驗中是幾乎不可能發(fā)生的原理。它應該是不該發(fā)生的事情。但事實是∶這件本不該發(fā)生的事件卻恰恰在這一次試驗中發(fā)生了。對此只能認為8000元的假設是不成立的,即拒絕原假設。17對某居民小區(qū)業(yè)主的月收入平均值進行假設檢驗4.2.3計算檢驗統(tǒng)計量在完成第二步檢驗統(tǒng)計量的選擇后,所選擇的不同檢驗統(tǒng)計量所對應的計算公式需要不同的參數,這些參數可以根據樣本數據得來,將參數帶入公式后即可計算得到小概率事件的概率。例如,引入案例中所對應的檢驗統(tǒng)計量為,根據樣本數據計算出和代入后即可得到相應的概率。184.2.4作出決策19假設檢驗中的兩類錯誤1. 第Ⅰ類錯誤(棄真錯誤)原假設為正確時拒絕原假設第Ⅰ類錯誤的概率記為
被稱為顯著性水平2. 第Ⅱ類錯誤(取偽錯誤)原假設為錯誤時未拒絕原假設第Ⅱ類錯誤的概率記為
(Beta)4.2.4作出決策20假設檢驗中的兩類錯誤(決策結果)H0:無罪假設檢驗就好像一場審判過程統(tǒng)計檢驗過程4.2.4作出決策21
和
的關系
你要同時減少兩類錯誤的唯一辦法是增加樣本容量!
和
的關系就像翹翹板,
小
就大,
大
就小4.2.4作出決策22兩類錯誤的控制1.一般來說,對于一個給定的樣本,如果犯第Ι類錯誤的代價比犯第Ⅱ類錯誤的代價相對較高,則將犯第Ⅰ類錯誤的概率定得低些較為合理;反之,如果犯第Ι類錯誤的代價比犯第Ⅱ類錯誤的代價相對較低,則將犯第Ⅰ類錯誤的概率定得高些2.一般來說,發(fā)生哪一類錯誤的后果更為嚴重,就應該首要控制哪類錯誤發(fā)生的概率。但由于犯第Ι類錯誤的概率是可以由研究者控制的,因此在假設檢驗中,人們往往先控制第Ι類錯誤的發(fā)生概率4.2.4作出決策23顯著性水平(significantlevel)假設檢驗中犯第Ⅰ類錯誤的概率,記為。1. 是一個概率值2. 原假設為真時,拒絕原假設的概率抽樣分布的拒絕域3. 表示為
(alpha)常用的
值有0.01,0.05,0.104. 由研究者事先確定4.2.4作出決策24統(tǒng)計顯著性在假設檢驗中,如果樣本提供的證據拒絕原假設,我們說檢驗的結果是顯著的,如果不拒絕原假設,我們則說結果是不顯著的。一項檢驗在統(tǒng)計上是“顯著的”,意思是指:這樣的(樣本)結果不是偶然得到的,或者說,不是靠機遇能夠得到的。拒絕原假設,表示這樣的樣本結果并不是偶然得到的;不拒絕原假設(拒絕原假設的證據不充分),則表示這樣的樣本結果只是偶然得到的。注:不拒絕不意味著原假設正確。4.2.4作出決策——利用檢驗統(tǒng)計量25檢驗統(tǒng)計量(teststatistic)根據樣本觀測結果計算得到的,并據以對原假設和備擇假設作出決策的某個樣本統(tǒng)計量對樣本估計量的標準化結果原假設H0為真點估計量的抽樣分布拒絕域:能夠拒絕原假設的檢驗統(tǒng)計量的所有取值組成的集合4.2.4作出決策——利用檢驗統(tǒng)計量26抽樣分布H0臨界值臨界值a/2a/2
拒絕H0拒絕H01-
置信水平拒絕域非拒絕域拒絕域顯著性水平和拒絕域(雙側檢驗)4.2.4作出決策——利用檢驗統(tǒng)計量27顯著性水平和拒絕域(雙側檢驗)H0臨界值臨界值a/2
a/2樣本統(tǒng)計量拒絕H0拒絕H0抽樣分布1-
置信水平4.2.4作出決策——利用檢驗統(tǒng)計量28顯著性水平和拒絕域(雙側檢驗)H0臨界值臨界值
a/2a/2樣本統(tǒng)計量拒絕H0拒絕H0抽樣分布1-
置信水平4.2.4作出決策——利用檢驗統(tǒng)計量29顯著性水平和拒絕域(雙側檢驗)H0臨界值臨界值a/2
a/2樣本統(tǒng)計量拒絕H0拒絕H0抽樣分布1-
置信水平4.2.4作出決策——利用檢驗統(tǒng)計量30顯著性水平和拒絕域(單側檢驗)H0臨界值a拒絕H0抽樣分布1-
置信水平RegionofRejectionRegionofNonrejection4.2.4作出決策——利用檢驗統(tǒng)計量31顯著性水平和拒絕域(左側檢驗)H0臨界值a拒絕H0抽樣分布1-
置信水平樣本統(tǒng)計量4.2.4作出決策——利用檢驗統(tǒng)計量32顯著性水平和拒絕域(左側檢驗)H0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-
置信水平4.2.4作出決策——利用檢驗統(tǒng)計量33顯著性水平和拒絕域(右側檢驗)H0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-
置信水平4.2.4作出決策——利用檢驗統(tǒng)計量34顯著性水平和拒絕域(右側檢驗)H0臨界值a樣本統(tǒng)計量抽樣分布1-
置信水平拒絕H04.2.4作出決策——利用檢驗統(tǒng)計量35決策規(guī)則給定顯著性水平
,查表得出相應的臨界值z
或z
/2,t
或t
/2將檢驗統(tǒng)計量的值與
水平的臨界值進行比較作出決策雙側檢驗:I統(tǒng)計量I>臨界值,拒絕H0左側檢驗:統(tǒng)計量<-臨界值,拒絕H0右側檢驗:統(tǒng)計量>臨界值,拒絕H04.2.4作出決策——利用P值進行決策36什么是P值?
(P-value)如果原假設為真,所得到的樣本結果會像實際觀測結果那么極端或更極端的概率P值告訴我們:如果原假設是正確的話,我們得到目前這個樣本數據的可能性有多大,如果這個可能性很小,就應該拒絕原假設被稱為觀察到的(或實測的)顯著性水平決策規(guī)則:若p值<
,拒絕H04.2.4作出決策——利用檢驗統(tǒng)計量37雙側檢驗的P值
/
2
/
2Z拒絕H0拒絕H00臨界值計算出的樣本統(tǒng)計量計算出的樣本統(tǒng)計量臨界值1/2P值1/2P值4.2.4作出決策——利用檢驗統(tǒng)計量38左側檢驗的P值0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-
置信水平計算出的樣本統(tǒng)計量P值4.2.4作出決策——利用檢驗統(tǒng)計量39右側檢驗的P值0臨界值a拒絕H0抽樣分布1-
置信水平計算出的樣本統(tǒng)計量P值4.2.4作出決策——利用P值進行決策40利用P值進行決策,需要計算出P值,將其與事先確定的顯著性水平進行比較,根據比較結果確定是否拒絕原假設。如果計算得到的P值小于顯著性水平,則說明此時拒絕原假設犯錯誤的概率小于預先設定的水平,不太可能犯錯誤,所以可以拒絕原假設;如果P值大于顯著性水平,則說明拒絕原假設犯錯誤的概率大于預先設定的水平,犯錯誤的可能性很大,所以不能拒絕原假設。當P≤時,拒絕原假設H0;當P>時,不拒絕原假設H0。4.2.5假設檢驗結論的表述41“顯著”與“不顯著”1.當拒絕原假設時,我們稱樣本結果是統(tǒng)計上顯著的拒絕原假設時結論是清楚的2.當不拒絕原假設時,我們稱樣本結果是統(tǒng)計上不顯著的不拒絕原假設時,并未給出明確的結論,不能說原假設是正確的,也不能說它不是正確的4.2.5假設檢驗結論的表述42“接受”與“不拒絕”假設檢驗的目的在于試圖找到證據拒絕原假設,而不在于證明什么是正確的當沒有足夠證據拒絕原假設時,不采用“接受原假設”的表述,而采用“不拒絕原假設”的表述?!安痪芙^”的表述實際上意味著并未給出明確的結論,我們沒有說原假設正確,也沒有說它不正確“接受”的說法有時會產生誤導,因為這種說法似乎暗示著原假設已經被證明是正確的了。但事實上,H0的真實值我們永遠也無法知道,H0只是對總體真實值的一個假定值,由樣本提供的信息也就自然無法證明它是否正確4.2.5假設檢驗結論的表述43假設檢驗的步驟根據描述和樣本信息確定原假設與備擇假設。選擇檢驗統(tǒng)計量并計算具體數值。確定顯著性水平。作出決策∶利用統(tǒng)計量檢驗或利用P值進行決策。利用統(tǒng)計量檢驗∶根據顯著性水平計算臨界值與拒絕域,統(tǒng)計量的值落在拒絕域則拒絕H0,否則不拒絕H0利用P值進行決策∶當P<時,拒絕原假設H0;當P>時,不拒絕原假設H0第3節(jié)單總體參數檢驗1、單總體均值的檢驗2、單總體比例的檢驗3、單總體方差的檢驗444.3.1單總體均值的檢驗45本方法用于檢驗單個總體的質量水平,它所適用的數據類型為定量數據,所選取的檢驗統(tǒng)計量與樣本大小、總體是否服從正態(tài)分布和總體方差是否已知有關。當樣本容量n<30時,為小樣本;當樣本容量n≥30時,為大樣本。檢驗方法分為大樣本數據的檢驗方法和小樣本數據的檢驗方法兩大類。4.3.1單總體均值的檢驗46大樣本數據的單總體均值檢驗1. 假定條件正態(tài)總體或非正態(tài)總體大樣本(n
30)使用z檢驗統(tǒng)計量
2
已知:
2
未知:4.3.1單總體均值的檢驗47例題分析【例4.2】為了解某屆考生的考試水平,某次考試后從中隨機抽取了49位考生的成績,通過計算得到這49位考生的平均成績?yōu)?2.5分,標準差為14,取顯著性水平為0.05,問∶是否可以認為在此次考試中全體考生的平均成績?yōu)?0分?雙側檢驗4.3.1單總體均值的檢驗48H0
:
=70H1
:
70
=0.05n
=49臨界值(c):檢驗統(tǒng)計量:決策:不拒絕H0結論:
不能證明該班級考生的水平與平均水平有差異。(總體方差已知)4.3.1單總體均值的檢驗49例題分析【例4.3】經調查研究,某工廠以前所使用的一種設備對零件進行加工時,其尺寸的絕對平均誤差為1.70mm。為使誤差降低,該工廠新進了一批設備來加工該零件。為了檢驗與舊設備相比,新設備對零件加工的誤差是否有顯著性地降低,該工廠從某批加工的零件中抽取了36個進行檢驗。36個零件所測得的絕對誤差數據如下∶那么,在顯著性水平為0.01的情況下,是否可以認為與舊設備相比新設備加工的零件尺寸的平均誤差有顯著降低?
單側檢驗(左側檢驗)4.3.1單總體均值的檢驗50H0
:
=1.70H1
:
<1.70
=0.01n
=36臨界值(c):z
=z0.01=-2.33z=-9.66<z=-2.33,檢驗統(tǒng)計量:決策:拒絕H0結論:
新設備加工的零件尺寸的平均誤差與舊設備相比有顯著降低。(總體方差未知)4.3.1單總體均值的檢驗51大樣本數據的單總體均值檢驗4.3.1單總體均值的檢驗52小樣本數據的單總體均值檢驗1. 假定條件總體服從正態(tài)分布小樣本(n<
30)檢驗統(tǒng)計量
2
已知:
2
未知:4.3.1單總體均值的檢驗53例題分析【例4.4】一種飛機配件的標準直徑為12cm,直徑大于或小于12cm的配件都被認為不合格。飛機制造企業(yè)在購進配件時,對供貨商提供的樣品進行抽樣檢驗。來決定是否采購?,F(xiàn)從樣品中抽取了10個樣本進行檢驗,樣本數據分別為(單位∶cm)∶12.2、10.8、11.8、12.0、12.4、11.9、12.2、11.3、12.3、12.0。假定供貨商生產的配件長度服從正態(tài)分布,在顯著性水平為0.05的情況下,能否確定該供貨商提供的配件符合要求?雙側檢驗4.3.1單總體均值的檢驗54H0
:
=12H1
:
12
=0.05df
=10-1=9臨界值(c):檢驗統(tǒng)計量:決策:不拒絕H0結論:
樣本提供的數據不足以推翻"供貨商提供的配件符合要求"的看法。4.3.1單總體均值的檢驗55小樣本數據的單總體均值檢驗4.3.2單總體比例的檢驗56假定條件總體服從二項分布可用正態(tài)分布來近似(大樣本)檢驗的z統(tǒng)計量
0為假設的總體比例4.3.2單總體比例的檢驗57例題分析【例4.5】某酒店主管經理估計顧客中20—30歲的會員占總人數的80%為了驗證該估計是否正確,研究人員隨機抽取了200位顧客,調查得知其中有146位是會員。分別取顯著性水平
=0.05和
=0.01,判斷該主管經理的估計是否正確。雙側檢驗4.3.2單總體比例的檢驗58H0
:
=80%H1
:
80%
=0.05n=40臨界值(c):z/2=z0.025=1.96|z|=2.475>z/2=1.96檢驗統(tǒng)計量:決策:拒絕H0結論:
在=0.05的顯著性水平下,該主管經理的估計不正確。4.3.2單總體比例的檢驗59H0
:
=80%H1
:
80%
=0.01n=40臨界值(c):z/2=z0.005=2.58|z|=2.475<z/2=2.58檢驗統(tǒng)計量:決策:不拒絕H0結論:
在=0.01的顯著性水平下,不能斷定該主管經理的估計不正確。4.3.2單總體比例的檢驗60總體比例的檢驗方法假設雙側檢驗左側檢驗右側檢驗假設形式H0:
=
0H1:
0H0
:
=
0H1:
<
0H0
:
=
0H1:
>
0統(tǒng)計量拒絕域P值決策拒絕H04.3.3單總體方差的檢驗61檢驗一個總體的方差或標準差假設總體近似服從正態(tài)分布使用
2分布檢驗統(tǒng)計量(
2檢驗)樣本方差假設的總體方差4.3.3單總體方差的檢驗62檢驗方法總結假設雙側檢驗左側檢驗右側檢驗假設形式H0
:
2=
02H1:
2
0H0
:
2=
02H1:
2
<
02H0:
2
=
02H1:
2
>
02統(tǒng)計量拒絕域P值決策
拒絕H04.3.3單總體方差的檢驗63例題分析【例4.6】公司生產的發(fā)動機部件的長度服從正態(tài)分布。該公司稱它的標準差為0.048cm,某調研部門現(xiàn)隨機抽取5個部件,測得它們的長度分別為1.44,1.40,1.36,1.55,1.32cm,取顯著性水平為=0.05。那么,能否認為該公司生產的發(fā)動機部件的長度的標準差確實為0.048cm?雙側檢驗4.3.3單總體方差的檢驗64檢驗統(tǒng)計量:決策:拒絕H0結論:
認為該發(fā)動機的部件長度標準差不是0.048cm。H0
:
2=0.0482H1
:
2
0.0482
=0.05df=5-1=4臨界值(s):第4節(jié)雙總體參數檢驗1、雙總體均值之差的檢驗2、雙總體比例之差的檢驗3、雙總體方差比的檢驗654.4.1雙總體均值之差的檢驗66(獨立大樣本)1. 假定條件兩個樣本是獨立的隨機樣本正態(tài)總體或非正態(tài)總體大樣本(n1
30和n2
30)檢驗統(tǒng)計量
12
,
22
已知:
12
,
22
未知:4.4.1雙總體均值之差的檢驗67例題分析【例4.7】手機的續(xù)航時間是消費者購買時考慮的一項重要因素。某手機品牌A為了了解其手機續(xù)航時間是否比市場上最受歡迎的手機品牌B的續(xù)航時間短,選擇了35款A品牌手機和40款B品牌手機作為樣本進行調查。數據顯示兩品牌手機的續(xù)航平均時間分別為33h、35h。已知兩個品牌的手機續(xù)航時間的標準差分別為12h、4h。在顯著性水平為=0.05的情況下,能否認為A品牌的手機續(xù)航時間小于B品牌的手機續(xù)航時間?4.4.1雙總體均值之差的檢驗68檢驗統(tǒng)計量:決策:不拒絕H0結論:
沒有證據表明男性與女性的睡眠時長有顯著差異。H0
:
1=
2H1
:
1≠
2
=0.05n1=13,n2
=11臨界值(c):(例題分析)抽取的樣本為小樣本,總體方差已知4.4.1雙總體均值之差的檢驗69小樣本的檢驗方法(
12,
22已知)假定條件兩個獨立的小樣本兩個總體都是正態(tài)分布
12,
22已知檢驗統(tǒng)計量4.4.1雙總體均值之差的檢驗70小樣本的檢驗方法(
12,
22未知但
12=
22)假定條件兩個獨立的小樣本兩個總體都是正態(tài)分布
12、
22未知但相等,即
12=
22檢驗統(tǒng)計量其中4.4.1雙總體均值之差的檢驗71小樣本的檢驗方法(
12,
22未知且不相等
12
22)假定條件兩個總體都是正態(tài)分布
12,
22未知且不相等,即
12
22樣本容量相等,即n1=n2=n檢驗統(tǒng)計量自由度為假定條件兩個總體都是正態(tài)分布
12,
22未知且不相等,即
12
22樣本容量不相等,即n1
n2檢驗統(tǒng)計量4.4.1雙總體均值之差的檢驗72小樣本的檢驗方法(
12,
22未知且不相等
12
22)自由度為4.4.1雙總體均值之差的檢驗73例題分析【例4.8】睡眠與人體健康息息相關,不少專家認為,成年人每天需要睡7~9h。有相關報告顯示,2020年我國人均睡眠時長為6.5h。想知道男性與女性的睡眠時長是否有差異,某研究機構隨機抽取了24人樣本,其中男性13人,女性11人。調查發(fā)現(xiàn)∶樣本中男性的平均睡眠時長為6.2h,標準差為2.4h;女性的平均睡眠時長為6.7h,標準差為1.5h。假定兩個總體的標準差無差異。試問∶在0.05的顯著性水平下,男性與女性的睡眠時長是否有差異?4.4.1雙總體均值之差的檢驗74檢驗統(tǒng)計量:決策:拒絕H0結論:
認為該發(fā)動機的部件長度標準差不是0.048cm。H0
:
2=0.0482H1
:
2
0.0482
=0.05df=5-1=4臨界值(s):4.4.1雙總體均值之差的檢驗75獨立大樣本總結76獨立小樣本總結4.4.1雙總體均值之差的檢驗77配對樣本假定條件兩個總體配對差值構成的總體服從正態(tài)分布配對差是由差值總體中隨機抽取的
數據配對或匹配(重復測量(前/后))檢驗統(tǒng)計量樣本差值均值樣本差值標準差4.4.1雙總體均值之差的檢驗78配對樣本匹配樣本情形下兩個總體均值之差的檢驗方法假設雙側檢驗左側檢驗右側檢驗假設形式H0
:d=0H1:d
0H0
:d=0H1:d<0H0:d=0
H1:d>0統(tǒng)計量拒絕域P值決策拒絕H04.4.1雙總體均值之差的檢驗79例題分析【例4.9】某一減肥產品的廣告宣稱其產品可以在一年內幫助用戶成功減肥10斤。為了檢驗該產品廣告是否可信,從該減肥產品的用戶中隨機抽取了16名,分別記錄其在使用產品前的初始體重和使用該產品一年后的體重,數據如下(單位∶斤)∶試在0.05的顯著性水平下,判斷該減肥廣告是否可信。4.4.1雙總體均值之差的檢驗80檢驗統(tǒng)計量:決策:拒絕H0結論:
在0.05的顯著性水平下,該減肥產品的廣告不可信。H0
:
1-
2=10H1
:
1-
2
<10
=0.05n=16臨界值(c):單側的t檢驗為-1.7534.4.1雙總體均值之差的檢驗814.4.2雙總體比例之差的檢驗821.假定條件兩個總體都服從二項分布可以用正態(tài)分布來近似2.檢驗統(tǒng)計量檢驗H0:
1-
2=0檢驗H0:
1-
2=d0獨立樣本下雙總體比例之差的檢驗4.4.2雙總體比例之差的檢驗83獨立樣本下雙總體比例之差的檢驗假設雙側檢驗左側檢驗右側檢驗假設形式H0
:
1-
2=0H1:
1-
2
0H0
:
1-
2=0
H1:
1-
2<0
H0:
1-
2=0
H1:
1-
2>0
統(tǒng)計量拒絕域P值決策拒絕H04.4.2雙總體比例之差的檢驗84例題分析【例4.10】某助聽器進口公司購進的助聽器全部來自兩個品牌。今年該公司又要大規(guī)模采購助聽器,希望在這兩個品牌中選擇維修率更低的。為了比較兩個品牌的助聽器的維修率,公司決定從已購買的兩種助聽器中進行抽樣調查,分別抽取24個品牌A助聽器和20個品牌B助聽器,抽樣的兩品牌維修率分別為31%和26%試問∶在0.05的顯著性水平下,該公司應該購進哪個品牌的助聽器?4.4.2雙總體比例之差的檢驗85檢驗統(tǒng)計量:決策:不拒絕H0結論:
在0.05的顯著性水平下,沒有證據表明兩個品牌的維修率有顯著差異。H0
:
1=
2H1
:
1
≠
2
=0.05n1=24,n2=20臨界值(c):在0.05的顯著性水平下,雙側檢驗的臨界值分別為-1.96和1.964.4.2雙總體比例之差的檢驗861.假定條件兩個總體配對差值構成的總體服從正態(tài)分布配對差是由差值總體中隨機抽取的
小樣本情況:配對差值經標準化后服從自由度為n-1的t分布。2.檢驗統(tǒng)計量配對樣本下雙總體比例之差的檢驗4.4.2雙總體比例之差的檢驗87例題分析【例4.11】為了比較兩種方法對某飲料中脂肪含量的測定結果是否有差異,某食品研究機構隨機抽取了10瓶飲料,分別用哥特里-羅紫法和脂肪酸水解法測定其結果如表4-11所示。問∶在顯著性水平為0.05的情況下,兩種方法的測定結果是否不同?【例4.11】問∶在顯著性水平為0.05的情況下,兩種方法的測定結果是否不同?4.4.2雙總體比例之差的檢驗88例題分析4.4.2雙總體比例之差的檢驗89檢驗統(tǒng)計量:決策:拒絕H0結論:
在0.05的顯著性水平下,兩種測量方法對脂肪含量的測量結果有差異。H0
:
1=
2H1
:
1
≠
2
=0.05n=10臨界值(c):例題分析4.4.3雙總體方差比的檢驗90(F檢驗)假定條件兩個總體都服從正態(tài)分布,且方差相等兩個獨立的隨機樣本檢驗統(tǒng)計量4.4.3雙總體方差比的檢驗91(F檢驗臨界值)FF1-
F
拒絕H0方差比F檢驗示意圖拒絕H04.4.3雙總體方差比的檢驗92(檢驗方法的總結)假設雙側檢驗左側檢驗右側檢驗假設形式H0:
12/
22=1H1:
12/
221H0:
12/
22=1H1:
12/
22<1H0:
12/
22=1H1:
12/
22>1統(tǒng)計量拒絕域P值決策拒絕H04.4.2雙總體比例之差的檢驗93例題分析【例4.12】某家具品牌想比較其旗下兩個零售店日銷售額的波動情況。從每家零售店記錄的銷售額中分別抽取8個獨立隨機的日銷售額樣本(單位:萬元),數據如下∶零售店1:12434618278947086351586274零售店2:10008459634187891450687592這些數據是否提供了充分的證據表明兩個零售店的日銷售額波動情況之間存在差異?(a=0.01)4.4.2雙總體比例之差的檢驗94檢驗統(tǒng)計量:零售店1和零售店2的銷售額標準差分別是421.63和311.31。決策:不拒絕H0結論:
在0.1的顯著性水平下,沒有證據表明兩個零售店日銷售額波動情況之間存在差異。H0
:H1
:
=0.01n1=8,n2=8臨界值(c):在顯著性水平為0.1的條件下,求得雙側檢驗的左側臨界值為0.264,右側臨界值為3.787例題分析第5節(jié)假設檢驗的局限性1、統(tǒng)計顯著與實際顯著2、樣本容量的問題3、檢驗方法的局限性4、小概率事件原理的局限性5、先驗概率和偽陽性反幾率帶來的錯誤推論9596當原假設被拒絕時,我們稱樣本結果在統(tǒng)計上是顯著的(statisticallysignificant);當不拒絕原假設時,我們稱樣本結果在統(tǒng)計上是不顯著的。在“顯著”和“不顯著”之間沒有清楚的界限,只是在P值越來越小時,我們就有越來越強的證據,檢驗的結果也就越來越顯著。4.5.1統(tǒng)計顯著與實際顯著4.5.1統(tǒng)計顯著與實際顯著97較大的樣本會讓顯著性檢驗比較敏感;用小樣本作的顯著性檢驗敏感度又常常不夠;在總體真值不變的情況下,大的樣本會使P值變小,而小的P值也不一定就有實際顯著性;無論總體的狀況如何,觀測值多一點,就可以把P值抓得更準些;在假設檢驗時,不僅要報告P值,而且也要報告樣本大小。樣本容量對檢驗結果的影響4.5.1統(tǒng)計顯著與實際顯著98投擲硬幣1000次、4040次和10000次時出現(xiàn)正面樣本比例的抽樣分布0.50.507這個結果出乎預料嗎?n=1000n=4040n=100004.5.1統(tǒng)計顯著與實際顯著99在實際檢驗中,不要把統(tǒng)計上的顯著性與實際上的顯著性混同起來;當我們設定一個原假設,比方說,H0:
=1,其意義很可能是接近于1,且接近到這樣一種程度,以至為了實際目的都可以把它看作是1;然而,1.1是否“實際上無異于”1?這在某種程度上已不是一個統(tǒng)計學問題,而是一個與你的研究相關聯(lián)的實際問題,因而不能靠假設檢驗來解決這個問題。4.5.2樣本容量的問題100在假設檢驗中檢驗結果是否顯著與樣本容量有著很大的關系。當樣本容量較大時,小概率事件發(fā)生的可能性較大,即使不大的效應值也能達到"顯著"水平。而當樣本容量足夠大時,小概率事件幾乎一定發(fā)生,即幾乎任何微小的效應值都能達到"顯著"水平。當樣本容量很小時,小概率事件發(fā)生的可能性變得非常小。即使較大的效應值也往往達不到"顯著"水平。因此,在報告假設檢驗結果時,除了報告顯著性水平,還需要報告樣本容量。4.5.2樣本容量的問題101研究者想要研究A、B兩個地區(qū)的中小學生智力水平是否存在顯著性差異,對兩個地區(qū)中小學生的智力情況進行了相關調查。A地區(qū)有兒童15000人測得平均智商是102.15分,標準差是15分。B地區(qū)有兒童195000,平均智商是101.85分,標準差也是15分。z檢驗結果表明組間差異顯著(z=2.36,P<0.05)。而實際上,兩地區(qū)兒童的智商平均值只相差0.3分,只有0.016個標準差,它們之間的差異顯然是微不足道的,而由于樣本容量較大,最終檢測出的結果是二者存在顯著性差異,這顯然是存在很大問題的。4.5.3檢驗方法的局限性102由前面提出假設的章節(jié)可知,"="都出現(xiàn)在原假設中,這是采用檢驗方法的局限性帶來的。因為雙側檢驗的P值是單側的2倍,所以會出現(xiàn)單側檢驗顯著而雙側檢驗不顯著的情況。例如,兩種方法沒有顯著差異(雙側檢驗),但有顯著提高(單側檢驗),這是悖論。單側檢驗采用假設是不完備的(如左側檢驗mm
),有一半的風險有可能被忽略了。因此,單側檢驗的應用條件是確保沒有考慮的風險一定是沒有的。進行左側檢驗時,一定要確保不會出現(xiàn)大于假設值。只可能出現(xiàn)小于假設值。4.5.4小概率事件原理的局限性103在實際使用假設檢驗的方法進行決策時,研究結果不顯著的通通沒有報告。數據做了多重分析,卻只報告特定部分的P值(一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 兼職會員合同標準文本
- 中介勞務差價合同標準文本
- 代理展覽合同標準文本
- 農村田畝出租合同標準文本
- 農夫山泉購銷合同范例
- 勞務保養(yǎng)合同標準文本
- 個人領養(yǎng)寵物合同標準文本
- 虧損平攤合同標準文本
- 預防校園恐怖事件班會
- 酒店公關危機處理試題及答案
- 司磅員崗位職責及課件
- 社區(qū)健康口腔知識講座
- 考試保密培訓課件教學
- 發(fā)電設備點檢定修管理
- 【高新技術企業(yè)所得稅稅務籌劃探析案例:以科大訊飛為例13000字(論文)】
- 2023年華僑、港澳、臺聯(lián)考高考數學試卷
- 宮頸病變課件
- JCT587-2012 玻璃纖維纏繞增強熱固性樹脂耐腐蝕立式貯罐
- 安全專項費用使用申請表
- IT設備維修申請表
- 液壓滑動模板施工技術規(guī)范
評論
0/150
提交評論