統(tǒng)計(jì)學(xué) 第3版 課件 ch8假設(shè)檢驗(yàn)_第1頁(yè)
統(tǒng)計(jì)學(xué) 第3版 課件 ch8假設(shè)檢驗(yàn)_第2頁(yè)
統(tǒng)計(jì)學(xué) 第3版 課件 ch8假設(shè)檢驗(yàn)_第3頁(yè)
統(tǒng)計(jì)學(xué) 第3版 課件 ch8假設(shè)檢驗(yàn)_第4頁(yè)
統(tǒng)計(jì)學(xué) 第3版 課件 ch8假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩106頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

8.1假設(shè)檢驗(yàn)的一般問(wèn)題8.2一個(gè)總體參數(shù)的假設(shè)檢驗(yàn)8.3兩個(gè)總體參數(shù)的假設(shè)檢驗(yàn)8.4多個(gè)總體均值的比較—單因素方差分析Ch8

假設(shè)檢驗(yàn)與方差分析一、假設(shè)檢驗(yàn)的基本思想二、假設(shè)檢驗(yàn)的一般步驟三、假設(shè)檢驗(yàn)的兩類錯(cuò)誤8.1假設(shè)檢驗(yàn)的一般問(wèn)題引例1

醫(yī)學(xué)檢測(cè)中經(jīng)常提到關(guān)于檢測(cè)結(jié)果存在“假陰”或“假陽(yáng)”的可能。從統(tǒng)計(jì)理論來(lái)看,這是為什么呢?根據(jù)樣本得出的結(jié)論可能存在哪些錯(cuò)誤呢?為什么要多種檢測(cè)方法結(jié)合?為什么須進(jìn)行多次檢測(cè)?新藥上市前一般需要經(jīng)歷三期臨床試驗(yàn)。嚴(yán)格的試驗(yàn)主要是采用隨機(jī)對(duì)照試驗(yàn)(Randomizedcontrolledtrial),即將研究對(duì)象按隨機(jī)化的方法分為試驗(yàn)組與對(duì)照組,試驗(yàn)組給予所要測(cè)試的藥品,對(duì)照組給予安慰劑,最后觀察兩組結(jié)果的差別是否具有統(tǒng)計(jì)意義。為什么必須要經(jīng)過(guò)大樣本的臨床試驗(yàn)?zāi)兀繛槭裁匆捎秒S機(jī)對(duì)照試驗(yàn)?zāi)?試驗(yàn)組與對(duì)照組的差異要多大才具有統(tǒng)計(jì)意義呢?

回答以上問(wèn)題,就需要運(yùn)用統(tǒng)計(jì)推斷中的假設(shè)檢驗(yàn)和方差分析。3實(shí)際中的假設(shè)檢驗(yàn)問(wèn)題產(chǎn)品生產(chǎn)線工作是否正常;廠商聲稱產(chǎn)品質(zhì)量符合標(biāo)準(zhǔn),是否可信;測(cè)試不同營(yíng)銷方式的效果有無(wú)顯著差異;學(xué)生考試成績(jī)是否服從正態(tài)分布兩個(gè)變量間是否存在相關(guān)性…………※假設(shè)檢驗(yàn)——關(guān)于總體某一數(shù)量特征事先作出一個(gè)假設(shè)命題,然后通過(guò)樣本信息來(lái)判斷該命題是否成立??煞譃椋?/p>

參數(shù)檢驗(yàn)(限定分布檢驗(yàn))

非參數(shù)檢驗(yàn)(自由分布檢驗(yàn))——本課程不講8--5小概率原理小概率事件:發(fā)生概率很小的隨機(jī)事件小概率原理:小概率事件在一次試驗(yàn)(觀察)中幾乎不可能發(fā)生。小概率原理在日常決策中廣泛運(yùn)用…什么樣的概率才算小概率?根據(jù)決策的風(fēng)險(xiǎn)要求來(lái)決定,沒(méi)有統(tǒng)一的界定標(biāo)準(zhǔn)。假設(shè)檢驗(yàn)中給“小概率”設(shè)定的具體水準(zhǔn)稱為顯著性水平(

——后面詳講。8--6【引例2】

銷售商從生產(chǎn)企業(yè)采購(gòu)了2000件產(chǎn)品,合同規(guī)定,若這批產(chǎn)品不合格率超過(guò)5%,銷售商就可以退貨并獲得相應(yīng)的賠償。驗(yàn)收時(shí),隨機(jī)抽取了10件進(jìn)行檢測(cè),查出3件不合格品。于是,銷售商要求退貨并賠償(理由:樣本不合格率p=30%>5%)但生產(chǎn)企業(yè)并買賬(理由:樣本不合格率超標(biāo)并不能說(shuō)明整批產(chǎn)品不合格率超標(biāo))應(yīng)該如何判定?待檢驗(yàn)的假設(shè):總體不合格率P≤5%8--7一、假設(shè)檢驗(yàn)的基本思想(續(xù))決策思路——假設(shè):總體不合格率P=5%如果這一假設(shè)成立,則根據(jù)二項(xiàng)分布理論可算得:所抽樣本出現(xiàn)的概率為0.01

——即在次品率為5%的總體中抽出10件產(chǎn)品就有3件次品的概率只有1%理論上這種小概率事件在一次抽樣中不會(huì)發(fā)生,但實(shí)際卻抽到了這樣的樣本,這顯然不合理。這種不合理性源于推論的假設(shè)前提,故上述假設(shè)不能接受,即可推斷這批產(chǎn)品的次品率大于5%。一、假設(shè)檢驗(yàn)的基本思想(續(xù))假如,抽查10件產(chǎn)品僅有1件不合格品呢?樣本不合格率10%。銷售商是否有權(quán)要求退貨?同理,先假設(shè)P=5%,則從總體中抽10件產(chǎn)品就有1件不合格的概率=0.315=也就是說(shuō),在“P=5%”假設(shè)前提下,隨機(jī)抽到這種樣本可能性不算小,比較“正常”,樣本信息與假設(shè)命題不矛盾,從而不能否定“P=5%”的假設(shè)命題,銷售商退貨索賠的理由不充分。8--8【例8-1】

某企業(yè)生產(chǎn)一種零件,過(guò)去的大量資料表明,零件長(zhǎng)度服從正態(tài)分布,平均長(zhǎng)度為4厘米,標(biāo)準(zhǔn)差為0.15厘米。現(xiàn)從改革工藝后生產(chǎn)的零件中隨機(jī)抽查100個(gè)零件,測(cè)得平均長(zhǎng)度為3.95厘米?,F(xiàn)問(wèn):工藝改革前后零件的長(zhǎng)度是否發(fā)生了顯著的變化呢?解:這是關(guān)于改革后零件的總體平均長(zhǎng)度是否等于4厘米的假設(shè)檢驗(yàn)問(wèn)題。樣本平均長(zhǎng)度與4厘米之差異不外乎兩種可能原因:一是總體平均長(zhǎng)度不變,但由于抽樣的隨機(jī)性使得樣本均值與總體均值之間存在抽樣誤差;二是總體平均長(zhǎng)度確實(shí)發(fā)生了變化,使得來(lái)自這一總體的樣本均值也不等于4厘米。98--10【例8-1】(續(xù))改革后的零件平均長(zhǎng)度是否為4cm?

8--11【例8-1】(續(xù))給定顯著性水平1‰,查臨界值Zα/2=3.29|Z|=3.333>Zα/2=3.29。這意味著,如果“μ=4”的假設(shè)成立,那么在這一次抽樣中就發(fā)生了“|Z|>Zα/2”這種小概率事件.或者說(shuō),P{|Z|≥3.333}=0.000858<α=0.001所以,應(yīng)否定“μ=4”這一假設(shè),推斷工藝改革后零件的長(zhǎng)度有了顯著的變化(即μ≠4)。8--12假設(shè)檢驗(yàn)的特點(diǎn)采用邏輯上的反證法先承認(rèn)要檢驗(yàn)的假設(shè)為真,觀察在此前提下樣本的出現(xiàn)是否合理。若不合理,則判斷假設(shè)不真,應(yīng)予以拒絕;反之則不能拒絕。判斷是否合理依據(jù)的是小概率原理即這里的反證法是具有概率性質(zhì)的反證法。8--13基本思想(續(xù))如果這個(gè)值是總體參數(shù)真值

統(tǒng)計(jì)量

總體參數(shù)的假設(shè)值θ0這樣的值在一次觀察中出現(xiàn)的可能性很小,...觀察值在抽樣觀察中統(tǒng)計(jì)量出現(xiàn)這樣的值是很正常...統(tǒng)計(jì)量的分布假設(shè)檢驗(yàn)必須以有關(guān)的抽樣分布理論為依據(jù)。8--14二、假設(shè)檢驗(yàn)的步驟(一)提出原假設(shè)和備擇假設(shè)(二)確定檢驗(yàn)統(tǒng)計(jì)量及其分布(三)規(guī)定顯著性水平α(四)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值(五)作出檢驗(yàn)結(jié)論8--15(一)提出假設(shè)包括原假設(shè)和備擇假設(shè)。原假設(shè)(NullHypothesis)——待檢驗(yàn)的假設(shè),也稱為零假設(shè),用H0表示。備擇假設(shè)(AlternativeHypothesis)——也稱對(duì)立假設(shè),與原假設(shè)內(nèi)容完全相反,準(zhǔn)備在拒絕原假設(shè)后應(yīng)接受的假設(shè)。用H1表示。事實(shí)上,提出了H0,也就同時(shí)給出H1。引例1中,H0:P≤5%,H1:P>5%例8-1中,H0:μ=4,H1:μ≠48--16假設(shè)的三種形式:θ~待檢驗(yàn)的總體參數(shù),θ0~具體的數(shù)值;原假設(shè)必須包括“=”;單側(cè)檢驗(yàn)的原假設(shè)也常常簡(jiǎn)寫(xiě)為

實(shí)際中往往只對(duì)其邊界值θ0進(jìn)行檢驗(yàn),該值能夠拒絕,其它值更有理由拒絕。單側(cè)檢驗(yàn)8--17檢驗(yàn)統(tǒng)計(jì)量及其分布是假設(shè)檢驗(yàn)的具體理論依據(jù)檢驗(yàn)統(tǒng)計(jì)量指用于檢驗(yàn)原假設(shè)是否成立的統(tǒng)計(jì)量它是一個(gè)隨機(jī)變量,其數(shù)值隨樣本不同而不同;不包含未知總體參數(shù)但要包含原假設(shè)中總體參數(shù)的假設(shè)值θ0;在原假設(shè)成立的前提下,檢驗(yàn)統(tǒng)計(jì)量的抽樣分布應(yīng)該是明確的。(二)確定檢驗(yàn)統(tǒng)計(jì)量及其分布8--18檢驗(yàn)統(tǒng)計(jì)量及其分布通??捎杀粰z驗(yàn)參數(shù)的點(diǎn)估計(jì)量經(jīng)過(guò)標(biāo)準(zhǔn)化來(lái)導(dǎo)出。

選擇統(tǒng)計(jì)量的方法與參數(shù)估計(jì)相同:是大樣本還是小樣本其他總體參數(shù)(如總體方差)已知還是未知常用的檢驗(yàn)統(tǒng)計(jì)量有:Z、t、卡方、F統(tǒng)計(jì)量等,假設(shè)檢驗(yàn)的具體方法通常以檢驗(yàn)統(tǒng)計(jì)量服從的分布來(lái)命名。如:(二)確定檢驗(yàn)統(tǒng)計(jì)量及其分布(續(xù))8--19(三)規(guī)定顯著性水平

顯著性水平

——小概率的標(biāo)準(zhǔn),如0.01,0.05,0.1給定了

,也就確定了臨界值,也就等于建立了檢驗(yàn)的具體規(guī)則。臨界值——原假設(shè)的拒絕區(qū)域與不能拒絕區(qū)域的分界點(diǎn)。根據(jù)檢驗(yàn)統(tǒng)計(jì)量的分布,給定的

查相應(yīng)的概率分布表,即得臨界值。臨界值還與檢驗(yàn)形式(單雙側(cè))有關(guān)8--20雙側(cè)檢驗(yàn)的顯著性水平與拒絕域檢驗(yàn)統(tǒng)計(jì)量的分布a/2a/2

(1-

)

θ0臨界值臨界值檢驗(yàn)統(tǒng)計(jì)量HO的拒絕區(qū)域HO的拒絕區(qū)域(不能拒絕HO的區(qū)域)8--21右側(cè)檢驗(yàn)中的顯著性水平與拒絕域檢驗(yàn)統(tǒng)計(jì)量的分布a(1-

)

θ0臨界值(不能拒絕HO的區(qū)域)H0的拒絕區(qū)域

檢驗(yàn)統(tǒng)計(jì)量8--22將樣本資料代入檢驗(yàn)統(tǒng)計(jì)量的公式,計(jì)算出檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值。(四)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值

及其對(duì)應(yīng)的P值如例8-1中,σ

=0.15,n=100H0:μ=250檢驗(yàn)統(tǒng)計(jì)量:8--23假設(shè)檢驗(yàn)的P值(P-value)什么是P值?在原假設(shè)為真的假定前提下,出現(xiàn)觀察到的樣本以及更極端(偏離原假設(shè))樣本的概率。P值表示所觀察到的樣本對(duì)原假設(shè)的支持程度。P值越小,說(shuō)明拒絕原假設(shè)的證據(jù)越強(qiáng)檢驗(yàn)統(tǒng)計(jì)量的觀察值P值θ0【右側(cè)檢驗(yàn)中】引例中的P值=8--24P值的計(jì)算P值的大小與檢驗(yàn)統(tǒng)計(jì)量的分布、檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值、檢驗(yàn)類型等因素都有關(guān)。

設(shè)檢驗(yàn)的統(tǒng)計(jì)量為ξ,c是計(jì)算得統(tǒng)計(jì)量的值。單側(cè)檢驗(yàn)中,P值通常為統(tǒng)計(jì)量分布曲線從檢驗(yàn)統(tǒng)計(jì)量的觀察值到拒絕區(qū)域這一側(cè)的面積。左側(cè)檢驗(yàn)時(shí),P值=P{ξ

c}右側(cè)檢驗(yàn)時(shí),P值=P{ξ

c}雙側(cè)檢驗(yàn)中,P值=單側(cè)P值的2倍。即:

P值=2P{ξ≥c},當(dāng)c在右側(cè)時(shí);或:P值=2P{ξ≤c},當(dāng)c在左側(cè)時(shí)。8--25P值的計(jì)算(續(xù))—【例8-1】檢驗(yàn)統(tǒng)計(jì)量的值:

P值=P(|Z|≥3.333)=2×P(Z≤-3.333)=2×0.000429=0.000858P值一般不可能手工計(jì)算,可查表或有軟件算出。03.333-3.333檢驗(yàn)統(tǒng)計(jì)量的觀察值8--26(五)作出檢驗(yàn)結(jié)論兩種判斷準(zhǔn)則:依據(jù)臨界值來(lái)判斷(以Z檢驗(yàn)為例):左側(cè)檢驗(yàn)時(shí),若Z≤-Zα,拒絕原假設(shè);右側(cè)檢驗(yàn)時(shí),若Z≥+Zα?xí)r,拒絕原假設(shè);雙側(cè)檢驗(yàn)時(shí),若|Z|≥Zα/2時(shí),拒絕原假設(shè)。依據(jù)P

值來(lái)判斷:若P

值<α,則拒絕原假設(shè);反之,則不能拒絕原假設(shè)。8--27雙側(cè)檢驗(yàn)中的結(jié)論(1)a/2a/2

(1-

)θ0臨界值臨界值檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量的觀察值結(jié)論:不能拒絕HO8--28雙側(cè)檢驗(yàn)中的結(jié)論(2)a/2a/2

(1-

)θ0臨界值臨界值檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量的觀察值結(jié)論:拒絕HO8--29右側(cè)檢驗(yàn)中的結(jié)論(1)a(1-

)θ0臨界值檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量的觀察值結(jié)論:不能拒絕HO8--30右側(cè)檢驗(yàn)中的結(jié)論(2)a(1-

)θ0臨界值檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量的觀察值結(jié)論:拒絕HO8--31(五)作出檢驗(yàn)結(jié)論(續(xù))例8-1中,

P值=0.000858結(jié)論:|Z|=3.333≥Zα/2=3.29,拒絕原假設(shè)或:P值<α=0.001,同樣應(yīng)拒絕原假設(shè)。8--32P值與α

的關(guān)系檢驗(yàn)的顯著性水平α是事先設(shè)定的拒絕原假設(shè)時(shí)所犯錯(cuò)誤的概率的最大允許值。P值是根據(jù)觀察樣本實(shí)際計(jì)算的拒絕原假設(shè)時(shí)所犯錯(cuò)誤的概率值。P值——觀察到的顯著性水平(實(shí)測(cè)的顯著性水平(observedsignificantlevel,縮寫(xiě)“Sig”);P值——也是拒絕原假設(shè)的最小顯著性水平。8--33“統(tǒng)計(jì)量的實(shí)現(xiàn)值比臨界值更極端”=“p值小于α”P(pán)值與α的關(guān)系(圖)表8-1

實(shí)際情況決策(結(jié)論)H0為真H0為不真拒絕H0第一類錯(cuò)誤(拒真)(概率=a

)正確不能拒絕H0(接受H0)正確第二類錯(cuò)誤(采偽)(

概率=b

)8--34決策結(jié)果與兩類錯(cuò)誤三、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤8--351.第一類錯(cuò)誤(“棄真”或“拒真”錯(cuò)誤)原假設(shè)為真時(shí)拒絕原假設(shè)(例1,當(dāng)產(chǎn)品本來(lái)合格時(shí))犯第一類錯(cuò)誤的概率為

(即顯著性水平)

=P(拒絕H0/H0為真)a

θ0拒絕域右側(cè)檢驗(yàn)中三、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤(續(xù))8--36三、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤(續(xù))2.第二類錯(cuò)誤(“取偽”或“采偽”錯(cuò)誤)原假設(shè)不真時(shí)未拒絕(接受)原假設(shè)例如,產(chǎn)品銷售方承諾次品率<5%,這是假的。但買方檢驗(yàn)時(shí)作出了信任賣方的錯(cuò)誤判斷第二類錯(cuò)誤的概率為

Prob(接受H0/H0不真)=

θ0拒絕域右側(cè)檢驗(yàn)中

θ1拒絕域β8--37兩類錯(cuò)誤概率的關(guān)系(右側(cè)檢驗(yàn)中)a

θ0拒絕域βθ18--38

的關(guān)系在檢驗(yàn)中人們總希望犯兩類錯(cuò)誤的可能性都很小,然而,在其它條件不變的情況下,和不可能同時(shí)減小,就象交易中買賣雙方各自承擔(dān)的風(fēng)險(xiǎn)一樣。

α和β的關(guān)系就好比翹翹板8--39確定α?xí)r應(yīng)考慮的因素視兩類錯(cuò)誤所產(chǎn)生的后果輕重而定當(dāng)犯第一類錯(cuò)誤的后果嚴(yán)重時(shí),則希望盡可能不犯第一類錯(cuò)誤,寧愿犯第二類錯(cuò)誤,此時(shí)α宜小。當(dāng)犯第二類錯(cuò)誤的后果嚴(yán)重時(shí),則希望盡可能不犯第二類錯(cuò)誤,寧愿犯第一類錯(cuò)誤,此時(shí)α不宜太小8--40【附】影響

大小的因素1.顯著性水平

隨減少而增大2.總體參數(shù)的真值隨著總體參數(shù)的假設(shè)值與真實(shí)值的差異縮小而增大3.樣本容量n隨著n增大,檢驗(yàn)統(tǒng)計(jì)量的分布曲線更集中,曲線尾端的面積則減少。4.總體標(biāo)準(zhǔn)差

當(dāng)

增大時(shí)

增大8--418.2一個(gè)總體參數(shù)的假設(shè)檢驗(yàn)8.2.1對(duì)一個(gè)正態(tài)總體均值的檢驗(yàn)一、總體方差已知時(shí)——

Z

檢驗(yàn)法二、總體方差未知時(shí)——t檢驗(yàn)法8.2.2對(duì)一個(gè)正態(tài)總體方差的檢驗(yàn)小樣本時(shí)——

卡方檢驗(yàn)法8.2.3一個(gè)總體成數(shù)的檢驗(yàn)大樣本時(shí)——Z

檢驗(yàn)法8--42§8.2.1對(duì)一個(gè)正態(tài)總體均值的檢驗(yàn)H0:

;H1:根據(jù)抽樣分布理論,總體方差已知時(shí),對(duì)均值的檢驗(yàn)統(tǒng)計(jì)量為:

臨界值—給定α后,查標(biāo)準(zhǔn)正態(tài)分布表而得.單側(cè)檢驗(yàn)時(shí),臨界值為-Zα

或Zα雙側(cè)檢驗(yàn)時(shí),臨界值為-Zα/2

和Zα/21.方差已知時(shí)對(duì)正態(tài)總體均值的檢驗(yàn)—z

檢驗(yàn)法過(guò)去大量資料表明,某酒廠生產(chǎn)的一種瓶裝酒的容量服從標(biāo)準(zhǔn)差為5毫升的正態(tài)分布,企業(yè)標(biāo)示的產(chǎn)品平均容量為250毫升。監(jiān)督機(jī)構(gòu)從市場(chǎng)上隨機(jī)抽取了該產(chǎn)品12瓶進(jìn)行檢測(cè),測(cè)得平均容量為246毫升。試在0.05的顯著性水平下,檢驗(yàn)該酒廠生產(chǎn)的這種瓶裝酒是否存在容量不足的問(wèn)題?43【例8-2】8--44【例8-2】檢驗(yàn)過(guò)程H0:;H1:n

=12,

0.05,Zα=1.645檢驗(yàn)統(tǒng)計(jì)量:P值=P(Z≤-2.771)=0.0028結(jié)論:拒絕H0

,即存在容量不足的問(wèn)題

。0.05

0-1.645P值-2.771若是雙側(cè)檢驗(yàn),P值=2×P{Z≤-2.771}=0.00568--45單側(cè)檢驗(yàn)(例+)【例+】根據(jù)過(guò)去大量資料,某廠產(chǎn)品的使用壽命X~N(1020,1002)?,F(xiàn)從該廠最近生產(chǎn)的一批產(chǎn)品中隨機(jī)抽取16件,測(cè)得樣本平均壽命為1080小時(shí)。試在0.05的顯著性水平下判斷這批產(chǎn)品的使用壽命是否有顯著提高?

8--46(檢驗(yàn)過(guò)程)H0:;H1:n

=16,

0.05,Zα=1.645檢驗(yàn)統(tǒng)計(jì)量:P值=P(Z≥2.4)=1-P(Z≤2.4)=1-0.991802=0.0081980.05

01.645結(jié)論:拒絕H0

,即這批元件的壽命有顯著提高。檢驗(yàn)統(tǒng)計(jì)量的觀察值P值8--47【小結(jié)】方差已知時(shí)對(duì)正態(tài)總體均值的檢驗(yàn)——z檢驗(yàn)法Z

檢驗(yàn)法——利用服從標(biāo)準(zhǔn)正態(tài)分布的Z

統(tǒng)計(jì)量進(jìn)行假設(shè)檢驗(yàn)的方法。對(duì)總體均值的Z檢驗(yàn),主要適用于:若總體呈正態(tài)分布,且總體方差已知時(shí);若總體非正態(tài)分布,但n

30時(shí),可近似采用Z

檢驗(yàn)8--482.總體方差未知對(duì)正態(tài)總體均值的檢驗(yàn)

——t

檢驗(yàn)法H0:

;H1:檢驗(yàn)統(tǒng)計(jì)量:給定顯著性水平α,查得t

分布表中自由度為(n-1)所對(duì)應(yīng)的臨界值。左側(cè)檢驗(yàn),臨界值為-tα(n-1),P值=右側(cè)檢驗(yàn),臨界值為tα(n-1)

,P值=雙側(cè)檢驗(yàn)時(shí),臨界值為

-tα/2(n-1)和tα/2(n-1)。其余步驟同前。8--49【例8-3】某企業(yè)生產(chǎn)的一種袋裝食品,按規(guī)定要求平均每袋重量為800克?,F(xiàn)從一批產(chǎn)品中隨機(jī)抽取10袋,測(cè)得每袋重量(單位:克)分別為789、780、794、762、802、813、770、785、810、806。假設(shè)重量服從正態(tài)分布,要求在5%的顯著性水平下,檢驗(yàn)這批產(chǎn)品的重量是否符合要求?H0:;H1:n=10,

0.05,tα/2(n-1)=t0.025(9)=2.2628--50【例8-3】檢驗(yàn)過(guò)程——雙側(cè)t檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量:即:該日生產(chǎn)的鋼管內(nèi)徑正常0.025

0.025

0-2.262.26結(jié)論:不能拒絕H0

檢驗(yàn)統(tǒng)計(jì)量的觀察值8--51【例8-3】續(xù)——t檢驗(yàn)的P值結(jié)論:P值>

=0.05,不能拒絕H0P值=2×P{t(9)≥1.473}=2×0.0874=0.1748單側(cè)P值0檢驗(yàn)統(tǒng)計(jì)量的觀察值1.473One-SampleTestTestValue=800tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpper重量-1.6429.135-8.9000-21.15863.3586【例8-3的SPSS輸出】8--52[小結(jié)]總體方差未知時(shí)對(duì)正態(tài)總體均值檢驗(yàn)——

t檢驗(yàn)法t檢驗(yàn)法——利用服從t分布的統(tǒng)計(jì)量進(jìn)行假設(shè)檢驗(yàn)的方法。對(duì)均值的t檢驗(yàn)主要適用于:若總體呈正態(tài)分布,且總體方差未知時(shí)(用S2代替

2,或用S代替

)當(dāng)n

30時(shí),t分布趨近于正態(tài)分布,故可近似采用Z檢驗(yàn)代替t檢驗(yàn)。8--538.2.2一個(gè)總體方差的檢驗(yàn)——卡方檢驗(yàn)

檢驗(yàn)統(tǒng)計(jì)量:利用服從

2分布的統(tǒng)計(jì)量來(lái)進(jìn)行的檢驗(yàn)—卡方(

2)檢驗(yàn);8--54一個(gè)正態(tài)總體方差的

2檢驗(yàn)(續(xù))對(duì)給定的顯著性水平

,可查得

2分布表中自由度為(n-1)所對(duì)應(yīng)的臨界值。左側(cè)檢驗(yàn),臨界值為右側(cè)檢驗(yàn),臨界值為雙側(cè)檢驗(yàn),臨界值為和P值=相應(yīng)的單尾P值的兩倍8--55【例8-4】在例8-3中,若按要求,產(chǎn)品重量的標(biāo)準(zhǔn)差應(yīng)不超過(guò)10克。試在0.05的顯著性水平下,檢驗(yàn)這批產(chǎn)品重量的波動(dòng)是否符合要求?解:提出假設(shè):H0:

2=100(或)H1:

2

>1008--56計(jì)算結(jié)果

=0.05n-1=10-1=9臨界值在

=0.05的顯著性水平上應(yīng)拒絕H0,即可認(rèn)為這批產(chǎn)品重量的波動(dòng)不符合要求。

20

=0.0516.92

不能拒絕拒絕域檢驗(yàn)統(tǒng)計(jì)量的值:決策和結(jié)論:8--57

2檢驗(yàn)(例+)【例+】根據(jù)長(zhǎng)期正常生產(chǎn)的資料可知,某廠所產(chǎn)維尼綸的纖度服從正態(tài)分布,其方差為0.0025?,F(xiàn)從某日產(chǎn)品中隨機(jī)抽出20根,測(cè)得樣本方差為0.0042。試判斷該日纖度的波動(dòng)與平時(shí)有無(wú)顯著差異(取α=0.10)?解:提出假設(shè):H0:

2=0.0025H1:

2

0.00258--58計(jì)算結(jié)果

=0.1n-1=20-1=19臨界值:在

=0.10的顯著性水平上拒絕H0,即有證據(jù)表明該日長(zhǎng)度的波動(dòng)比平時(shí)有顯著差異.

20

/2=0.0510.1230.14拒絕不能拒絕拒絕域檢驗(yàn)統(tǒng)計(jì)量的值:決策和結(jié)論:8--59

即:在

=0.1的顯著性水平上拒絕H0,有充足證據(jù)表明該日纖度的波動(dòng)比平時(shí)有顯著差異。檢驗(yàn)統(tǒng)計(jì)量的值:計(jì)算結(jié)果——P值

20/2=0.05檢驗(yàn)統(tǒng)計(jì)量的觀察值P值/2

P值=2×0.0319=0.0638

結(jié)論:P值<

=0.1,所以應(yīng)該拒絕H08--60正態(tài)總體標(biāo)準(zhǔn)差的Z檢驗(yàn)法(可略)原假設(shè)為H0:

=

0

,(

0

為一已知數(shù))檢驗(yàn)統(tǒng)計(jì)量:對(duì)總體標(biāo)準(zhǔn)差的Z

檢驗(yàn)適用于:總體服從(或近似服從)正態(tài)分布大樣本,即

n

30。大樣本條件下,樣本標(biāo)準(zhǔn)差近似服從正態(tài)分布,即:

8--618.2.3一個(gè)總體成數(shù)的檢驗(yàn)HO:P=P0,H1:P≠(或>,<)P0假定條件只有兩類結(jié)果(總體服從二點(diǎn)分布)大樣本下【n≥30,np≥5且n(1-p)≥5】,可用正態(tài)分布來(lái)近似3.檢驗(yàn)統(tǒng)計(jì)量——Z統(tǒng)計(jì)量或8--62[例8-5]

一醫(yī)學(xué)專家認(rèn)為,某地區(qū)居民亂用抗生素的情況比較嚴(yán)重,治療兒童感冒的過(guò)程中,亂用抗生素的病例高達(dá)1/5以上。

為了檢驗(yàn)這種說(shuō)法,某醫(yī)療機(jī)構(gòu)從該地區(qū)患感冒的兒童中隨機(jī)調(diào)查了100個(gè)病例,發(fā)現(xiàn)其中有26例亂用抗生素。試問(wèn)調(diào)查結(jié)果是否支持專家的看法(分別以0.05和0.10的顯著性水平進(jìn)行檢驗(yàn))?8--63[例8-5]解HO:P≤1/5,H1:P>1/5n>30且np=26>5,n(1-p)=74>5檢驗(yàn)統(tǒng)計(jì)量的值:P值=P{Z≥1.5}=0.067若α=0.1,應(yīng)拒絕原假設(shè)即支持經(jīng)理的看法。若α=0.05,則不能拒絕原假設(shè)即不能支持…8--64【附】怎樣提出假設(shè)

(怎樣提出原假設(shè)和備擇假設(shè)?)(1)明確所要檢驗(yàn)的總體參數(shù)是什么(2)根據(jù)研究問(wèn)題確定假設(shè)的形式(類型)—雙側(cè):關(guān)心總體參數(shù)與某值有無(wú)差異?!獑蝹?cè):關(guān)心總體參數(shù)是否比某值偏大或偏?。ú粌H在乎有無(wú)差異,也關(guān)心差異的方向)8--65怎樣提出假設(shè)(續(xù))(3)采用左側(cè)還是右側(cè)?(a)本著“保守”或“不輕易拒絕H0

”的原則H0代表一種久以存在的狀態(tài),一般是理論設(shè)計(jì)或是以前大量資料所證明了的。拒絕H0時(shí)所犯錯(cuò)誤的概率α是受控制的、明確的、通常是很小的,說(shuō)明H0是受保護(hù)的,不至于輕易被否定。8--66怎樣提出假設(shè)(續(xù))假設(shè)檢驗(yàn)與對(duì)被告是否犯罪的審判很相似—原假設(shè):被告是清白的——無(wú)罪推定的原則備擇假設(shè):被告是有罪的。本著不輕易冤枉人的原則進(jìn)行審判。樣本信息就象所獲取的證據(jù)和證詞。當(dāng)判有罪時(shí),必須有充足的證據(jù)或理由;當(dāng)證據(jù)不足時(shí),只能判無(wú)罪或重新搜集新的證據(jù)。8--67怎樣提出假設(shè)(續(xù))(b)檢驗(yàn)?zāi)稠?xiàng)權(quán)威聲明的有效性指導(dǎo)思想:除非我們有證據(jù)表明聲明無(wú)效,否則就應(yīng)認(rèn)為此項(xiàng)聲明是有效的具體方法:將權(quán)威聲明(或承諾)作為H0先確立H0,再將相反的陳述(對(duì)該聲明的質(zhì)疑)作為H18--68怎樣提出假設(shè)(續(xù))(c)

把希望證明的假設(shè)作為備擇假設(shè)先確定備擇假設(shè),再將相反的命題作為原假設(shè)H0例如,改進(jìn)生產(chǎn)工藝后,會(huì)使產(chǎn)品的平均成本降低到20元以下。相應(yīng)的原假設(shè)與備擇假設(shè)應(yīng)為:H0:平均成本≥20H1:平均成本<208--69怎樣提出假設(shè)(續(xù))(d)把樣本顯示的信息作為H1先確定H1,再將相反的命題作為原假設(shè)H0教材上的例題統(tǒng)計(jì)軟件計(jì)算P-值時(shí)一般自動(dòng)把樣本信息顯示的方向作為H1的方向.8--70【附】區(qū)間估計(jì)與假設(shè)檢驗(yàn)的關(guān)系聯(lián)系對(duì)同一參數(shù)的估計(jì)和檢驗(yàn),所依據(jù)的抽樣分布理論相同;推斷結(jié)果都有一定的可信程度或風(fēng)險(xiǎn);可相互轉(zhuǎn)化

——如利用置信區(qū)間可進(jìn)行假設(shè)檢驗(yàn)8--71【附】區(qū)間估計(jì)與假設(shè)檢驗(yàn)的關(guān)系區(qū)別區(qū)間估計(jì)——是根據(jù)樣本信息估計(jì)總體參數(shù)的置信區(qū)間;以樣本估計(jì)量為決策的主要參考點(diǎn)(置信區(qū)間以樣本估計(jì)值為中心);著眼于大概率;通常為雙側(cè)。假設(shè)檢驗(yàn)——根據(jù)樣本信息判斷原假設(shè)是否成立;以原假設(shè)為主要決策參考點(diǎn);著眼于小概率;有單側(cè)、也有雙側(cè)。8--72利用置信區(qū)間進(jìn)行假設(shè)檢驗(yàn)對(duì)總體均值進(jìn)行雙側(cè)檢驗(yàn):1.求出均值的置信區(qū)間

已知時(shí):若總體參數(shù)的原假設(shè)值μ0在置信區(qū)間外,則拒絕H0;反之則接受原假設(shè)。

未知時(shí):8--73t檢驗(yàn)與相應(yīng)的置信區(qū)間(例)【例+】某廠采用自動(dòng)包裝機(jī)分裝產(chǎn)品,假定每包產(chǎn)品的重量服從正態(tài)分布,每包標(biāo)準(zhǔn)重量為1000克。某日隨機(jī)抽查9包,測(cè)得樣本平均重量為986克,樣本標(biāo)準(zhǔn)差為24克。試問(wèn)在0.05的檢驗(yàn)水平上,能否認(rèn)為這天自動(dòng)包裝機(jī)工作正常?8--74(置信區(qū)間——雙側(cè)t檢驗(yàn))H0:;H1:n=9,

0.05,tα/2(n-1)=t0.025(9-1)=2.2306即:自動(dòng)包裝機(jī)運(yùn)轉(zhuǎn)正常0.025

0.025

0-2.232.23結(jié)論:不能拒絕H0

檢驗(yàn)統(tǒng)計(jì)量的值-1.75置信區(qū)間:8.3.1兩個(gè)正態(tài)總體均值之差的檢驗(yàn)兩個(gè)獨(dú)立樣本的情形方差已知時(shí)——z檢驗(yàn)方差未知時(shí)——t檢驗(yàn)兩個(gè)成對(duì)樣本的情形8.3.2兩個(gè)正態(tài)總體方差相等性的檢驗(yàn)—F檢驗(yàn)8.3.3兩個(gè)總體成數(shù)之差的檢驗(yàn)——z檢驗(yàn)8.3兩個(gè)總體參數(shù)的假設(shè)檢驗(yàn)【可略】

8--758.3.1兩個(gè)正態(tài)總體均值差的檢驗(yàn)(1)若兩個(gè)正態(tài)總體的方差已知,檢驗(yàn)統(tǒng)計(jì)量為:8--76EXCEL數(shù)據(jù)分析——Z檢驗(yàn):雙樣本平均差檢驗(yàn)1.兩個(gè)樣本相互獨(dú)立的情形兩個(gè)正態(tài)總體均值差的檢驗(yàn)(續(xù))8--77(2)若兩正態(tài)總體方差未知但相等,檢驗(yàn)統(tǒng)計(jì)量為:EXCEL數(shù)據(jù)分析——t檢驗(yàn):雙樣本等方差假設(shè)兩個(gè)正態(tài)總體均值差的檢驗(yàn)(續(xù))8--78(3)若兩個(gè)正態(tài)總體的方差未知且不一定相等,檢驗(yàn)統(tǒng)計(jì)量近似于t分布,其自由度為v:EXCEL數(shù)據(jù)分析——t檢驗(yàn):雙樣本異方差假設(shè)兩個(gè)正態(tài)總體均值差的檢驗(yàn)(續(xù))8--792.兩個(gè)樣本為成對(duì)樣本的情形EXCEL數(shù)據(jù)分析——t檢驗(yàn):平均值的成對(duì)二樣本分析檢驗(yàn)統(tǒng)計(jì)量為:8.3.2兩個(gè)正態(tài)總體方差相等性的檢驗(yàn)在原假設(shè)成立的條件下,檢驗(yàn)統(tǒng)計(jì)量及其分布為:雙側(cè)檢驗(yàn)的拒絕域?yàn)椋?--80右側(cè)檢驗(yàn)的拒絕域?yàn)椋篍XCEL數(shù)據(jù)分析——F檢驗(yàn):雙樣本方差分析8--81Excel中兩總體參數(shù)的假設(shè)檢驗(yàn)“數(shù)據(jù)”——“數(shù)據(jù)分析”——Z檢驗(yàn):雙樣本平均差檢驗(yàn)適用于兩個(gè)正態(tài)總體方差已知的情形;t檢驗(yàn):雙樣本等方差假設(shè)適用于兩個(gè)正態(tài)總體方差未知但相等的情形;t檢驗(yàn):雙樣本異方差假設(shè)適用于兩個(gè)正態(tài)總體方差未知且不相等的情形;t檢驗(yàn):平均值的成對(duì)二樣本分析適用于成對(duì)樣本時(shí)對(duì)兩正態(tài)總體均值差的檢驗(yàn)。F-檢驗(yàn):雙樣本方差分析適用于兩個(gè)正態(tài)總體方差相等性的檢驗(yàn)EXCEL假設(shè)檢驗(yàn)小結(jié)8--82假設(shè)檢驗(yàn)的基本概念:原假設(shè),備擇假設(shè),檢驗(yàn)統(tǒng)計(jì)量,單側(cè)(左側(cè),右側(cè))檢驗(yàn),雙側(cè)檢驗(yàn),臨界值,拒絕域,顯著性水平,P值,兩類錯(cuò)誤假設(shè)檢驗(yàn)基本思想,一般步驟,α和β的關(guān)系。參數(shù)檢驗(yàn)主要包括總體均值、總體方差和總體比例的檢驗(yàn)。檢驗(yàn)方法有Z檢驗(yàn)、t檢驗(yàn)、χ2檢驗(yàn)、F檢驗(yàn)等等要求:熟練掌握一個(gè)總體參數(shù)的假設(shè)檢驗(yàn)(了解)兩總體參數(shù)之差(或比)的檢驗(yàn)——利用EXCEL得出計(jì)算結(jié)果;注意它們與單總體參數(shù)的假設(shè)檢驗(yàn)之間的聯(lián)系與區(qū)別8.4--838.4多個(gè)總體均值的比較

——單因素方差分析8.4.1問(wèn)題的提出8.4.2單因素方差分析的基本原理8.4.3單因素方差分析的的應(yīng)用本節(jié)在推斷統(tǒng)計(jì)中的地位檢驗(yàn)一個(gè)總體的均值——————假設(shè)檢驗(yàn)檢驗(yàn)兩個(gè)總體的均值是否相等——假設(shè)檢驗(yàn)檢驗(yàn)多個(gè)總體的均值是否相等——方差分析從形式上看,方差分析法是同時(shí)對(duì)多個(gè)總體均值的比較實(shí)質(zhì)上,它是研究某個(gè)(或幾個(gè))定性變量對(duì)所觀測(cè)的定量變量有無(wú)顯著影響、鑒別因素效應(yīng)的一種常用方法。8.4--848.4.1問(wèn)題的提出8.4--85【例8-11】一研究小組為了研究三種不同施肥方案對(duì)某種農(nóng)作物收獲量的影響,在17個(gè)試驗(yàn)地塊上做了試驗(yàn)。每個(gè)地塊上的土質(zhì)、農(nóng)作物品種、播種量和播種方法等影響該農(nóng)作物收獲量的因素均相同。試根據(jù)表8-4的收獲量數(shù)據(jù)分析不同施肥方案是否對(duì)收獲量有顯著影響(顯著性水平為0.05)。

地塊編號(hào)施肥方案123456A1556276686063A27058625065A37880688275648.4--86檢驗(yàn)施肥方案對(duì)收獲量是否有影響,也就是檢驗(yàn)三種施肥方案的平均收獲量是否相同;設(shè)三種施肥方案的總體平均收獲量分別為:

1、

2、

3

,也就是檢驗(yàn)下面的假設(shè):H0:

1

2

3H1:

1

,

2

,

3

不全相等檢驗(yàn)上述假設(shè)就可采用方差分析。8.4.1問(wèn)題的提出(續(xù))8.4--87方差分析的幾個(gè)基本概念因素或因子——所要檢驗(yàn)的對(duì)象稱為因子,是定性變量如上例中的施肥方案。根據(jù)所涉及的因素多少,方差分析分為:?jiǎn)我蛩胤讲罘治鲭p因素方差分析——本課程略無(wú)交互影響有交互影響多因素方差分析——本課程略8.4--88方差分析的幾個(gè)基本概念(續(xù))

水平因素的具體表現(xiàn)稱為水平(也稱為類別或處理方案).在上例中三種施肥方案就是因素的三個(gè)水平。每個(gè)水平下的所有可能結(jié)果構(gòu)成一個(gè)總體。

觀察值樣本是分別從每個(gè)水平(總體)中隨機(jī)抽取的。在第i個(gè)水平下的j個(gè)觀察值,記為xij例8-11中,每種施肥方案中各個(gè)地塊的收獲量就是觀察值8.4--898.4.2單因素方差分析的基本原理設(shè)各水平下的觀察值表示為:該水平的總體均值

隨機(jī)項(xiàng)因此,所有觀察值

xij之間的差異,可能來(lái)源于兩個(gè)方面:8.4--90觀察值的兩種誤差

1.系統(tǒng)誤差(條件誤差)各水平的總體均值

μi不同導(dǎo)致的差異;它是由于所研究因素條件改變而產(chǎn)生的差異比如,對(duì)任一地塊來(lái)說(shuō),不同施肥方案的收獲量可能都有明顯差異,這可能是由于所研究因素——施肥方案不同而造成的

2.隨機(jī)誤差由于抽樣的隨機(jī)性或試驗(yàn)過(guò)程中各種隨機(jī)因素的影響所造成的;在同一水平下,觀察值之間總是存在隨機(jī)波動(dòng);

比如,同一種施肥方案的各個(gè)地塊的收獲量是有差異的8.4--91觀察值的兩種誤差(續(xù))方差分析就是要判斷有無(wú)系統(tǒng)誤差存在。若觀察值的差異不僅來(lái)源于隨機(jī)誤差,也包含系統(tǒng)誤差,則說(shuō)明不同水平下的總體均值存在顯著性差異(即所研究因素存在明顯的影響效應(yīng))。為此,要對(duì)觀察值的差異進(jìn)行分析。8.4--92總離差的分解樣本觀測(cè)值之間的差異大小可用離差來(lái)衡量,這個(gè)離差習(xí)慣上也稱為總離差,因?yàn)樗梢苑纸鉃閮蓚€(gè)離差之總和,即:其中,8.4--93離差平方總和的分解要對(duì)全部觀測(cè)值的離差進(jìn)行綜合分析,就需要計(jì)算全部觀測(cè)值的離差平方總和并對(duì)它進(jìn)行分解??傠x差平方和=組內(nèi)平方和+組間平方和簡(jiǎn)記為:SST=SSE+SSA8.4--94總離差平方和——全部觀察值與總平均數(shù)的離差平方和;反映全部觀察數(shù)據(jù)的差異程度。8.4--95組內(nèi)平方和——各水平內(nèi)部的觀察值與該水平均值的離差平方和。

反映同一水平下樣本觀察值的差異程度,所以不包含系統(tǒng)誤差,只包含隨機(jī)誤差。比如,同種施肥方案的各個(gè)地塊的收獲量的差異。8.4--96組間平方和——各組平均數(shù)與總平均數(shù)的離差平方和。反映因素的不同水平(不同總體)下各樣本均值之間的差異;既可能包括系統(tǒng)誤差,也包括隨機(jī)誤差;如三種施肥方案的樣本平均收獲量之間的差異8.4--97為了說(shuō)明觀測(cè)值中有無(wú)系統(tǒng)誤差,就需要對(duì)組間平方和與組內(nèi)平方和進(jìn)行比較。為此還需消除觀察值多少對(duì)離差平方和大小的影響,計(jì)算均方(MS,也稱方差,其分母為各自的自由度)??傠x差平方和SST=組內(nèi)平方和SSE+組間平方和SSA8.4--98方差分析的基本思想如果施肥方案對(duì)收獲量沒(méi)有影響,那么在組間方差中只包含有隨機(jī)誤差,而沒(méi)有系統(tǒng)誤差。這時(shí),組間方差與組內(nèi)方差就應(yīng)該很接近,兩個(gè)方差的比值

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論