統(tǒng)計(jì)學(xué)之假設(shè)檢驗(yàn)與方差分析課件_第1頁
統(tǒng)計(jì)學(xué)之假設(shè)檢驗(yàn)與方差分析課件_第2頁
統(tǒng)計(jì)學(xué)之假設(shè)檢驗(yàn)與方差分析課件_第3頁
統(tǒng)計(jì)學(xué)之假設(shè)檢驗(yàn)與方差分析課件_第4頁
統(tǒng)計(jì)學(xué)之假設(shè)檢驗(yàn)與方差分析課件_第5頁
已閱讀5頁,還剩191頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

6-1本資料來源6-1本資料來源6-2統(tǒng)計(jì)學(xué)導(dǎo)論曾五一肖紅葉主編6-2統(tǒng)計(jì)學(xué)導(dǎo)論曾五一肖紅葉主編6-3第六章假設(shè)檢驗(yàn)與方差分析第一節(jié)假設(shè)檢驗(yàn)的基本原理第二節(jié)總體均值的假設(shè)檢驗(yàn)第三節(jié)總體比例的假設(shè)檢驗(yàn)第四節(jié)單因子方差分析第五節(jié)雙因子方差分析第六節(jié)Excel在假設(shè)檢驗(yàn)與方差分析中的應(yīng)用6-3第六章假設(shè)檢驗(yàn)與方差分析第一節(jié)假設(shè)檢驗(yàn)的基本原6-4第一節(jié)假設(shè)檢驗(yàn)的基本原理一、什么是假設(shè)檢驗(yàn)二、原假設(shè)與備擇假設(shè)三、檢驗(yàn)統(tǒng)計(jì)量四、顯著性水平、P-值與臨界值五、雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)六、假設(shè)檢驗(yàn)的兩類錯(cuò)誤七、關(guān)于假設(shè)檢驗(yàn)結(jié)論的理解6-4第一節(jié)假設(shè)檢驗(yàn)的基本原理一、什么是假設(shè)檢驗(yàn)6-5一、什么是假設(shè)檢驗(yàn)【例6-1】假定咖啡的分袋包裝生產(chǎn)線的裝袋重量服從正態(tài)分布N(μ,σ2)。生產(chǎn)線按每袋凈重150克的技術(shù)標(biāo)準(zhǔn)控制操作?,F(xiàn)從生產(chǎn)線抽取簡單隨機(jī)樣本n=100袋,測得其平均重量為=149.8克,樣本標(biāo)準(zhǔn)差s=0.872克。問該生產(chǎn)線的裝袋凈重的期望值是否為150克(即問生產(chǎn)線是否處于控制狀態(tài))?6-5一、什么是假設(shè)檢驗(yàn)【例6-1】假定咖啡的分袋包裝生產(chǎn)線6-6

所謂假設(shè)檢驗(yàn),就是事先對總體的參數(shù)或總體分布形式做出一個(gè)假設(shè),然后利用抽取的樣本信息來判斷這個(gè)假設(shè)(原假設(shè))是否合理,即判斷總體的真實(shí)情況與原假設(shè)是否存在顯著的系統(tǒng)性差異,所以假設(shè)檢驗(yàn)又被稱為顯著性檢驗(yàn)。6-6所謂假設(shè)檢驗(yàn),就是事先對總體的參數(shù)或總6-7

一個(gè)完整的假設(shè)檢驗(yàn)過程,包括以下幾個(gè)步驟:(1)提出假設(shè);(2)構(gòu)造適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并根據(jù)樣本計(jì)算統(tǒng)計(jì)量的具體數(shù)值;(3)規(guī)定顯著性水平,建立檢驗(yàn)規(guī)則;(4)做出判斷。6-7一個(gè)完整的假設(shè)檢驗(yàn)過程,包括以下幾個(gè)步驟:6-8二、原假設(shè)與備擇假設(shè)原假設(shè)一般用H0表示,通常是設(shè)定總體參數(shù)等于某值,或服從某個(gè)分布函數(shù)等;備擇假設(shè)是與原假設(shè)互相排斥的假設(shè),原假設(shè)與備擇假設(shè)不可能同時(shí)成立。所謂假設(shè)檢驗(yàn)問題實(shí)質(zhì)上就是要判斷H0是否正確,若拒絕原假設(shè)H0

,則意味著接受備擇假設(shè)H1

。如在例6-1中,我們可以提出兩個(gè)假設(shè):假設(shè)平均袋裝咖啡重量與所要控制的標(biāo)準(zhǔn)沒有顯著差異,記為;假設(shè)平均袋裝咖啡重量與所要控制的標(biāo)準(zhǔn)有顯著差異,記為。6-8二、原假設(shè)與備擇假設(shè)原假設(shè)一般用H0表示,通常是設(shè)定總6-9三、檢驗(yàn)統(tǒng)計(jì)量所謂檢驗(yàn)統(tǒng)計(jì)量,就是根據(jù)所抽取的樣本計(jì)算的用于檢驗(yàn)原假設(shè)是否成立的隨機(jī)變量。檢驗(yàn)統(tǒng)計(jì)量中應(yīng)當(dāng)含有所要檢驗(yàn)的總體參數(shù),以便在“總體參數(shù)等于某數(shù)值”的假定下研究樣本統(tǒng)計(jì)量的觀測結(jié)果。檢驗(yàn)統(tǒng)計(jì)量還應(yīng)該在“H0成立”的前提下有已知的分布,從而便于計(jì)算出現(xiàn)某種特定的觀測結(jié)果的概率。6-9三、檢驗(yàn)統(tǒng)計(jì)量所謂檢驗(yàn)統(tǒng)計(jì)量,就是根據(jù)所抽取的樣本計(jì)算6-106-106-116-116-12四、顯著性水平、P-值與臨界值小概率事件在單獨(dú)一次的試驗(yàn)中基本上不會(huì)發(fā)生,可以不予考慮。在假設(shè)檢驗(yàn)中,我們做出判斷時(shí)所依據(jù)的邏輯是:如果在原假設(shè)正確的前提下,檢驗(yàn)統(tǒng)計(jì)量的樣本觀測值的出現(xiàn)屬于小概率事件,那么可以認(rèn)為原假設(shè)不可信,從而否定它,轉(zhuǎn)而接受備擇假設(shè)。6-12四、顯著性水平、P-值與臨界值小概率事件在單獨(dú)一次的6-13至于小概率的標(biāo)準(zhǔn)是多大?這要根據(jù)實(shí)際問題而定。假設(shè)檢驗(yàn)中,稱這一標(biāo)準(zhǔn)為顯著性水平,用來表示α,在應(yīng)用中,通常取α=0.01,α=0.05。一般來說,犯第一類錯(cuò)誤可能造成的損失越大,α的取值應(yīng)當(dāng)越小。對假設(shè)檢驗(yàn)問題做出判斷可依據(jù)兩種規(guī)則:一是P-值規(guī)則;二是臨界值規(guī)則。6-13至于小概率的標(biāo)準(zhǔn)是多大?這要根據(jù)實(shí)際問題而定。假設(shè)檢6-14(一)P-值規(guī)則所謂P-值,實(shí)際上是檢驗(yàn)統(tǒng)計(jì)量超過(大于或小于)具體樣本觀測值的概率。如果P-值小于所給定的顯著性水平,則認(rèn)為原假設(shè)不太可能成立;如果P-值大于所給定的標(biāo)準(zhǔn),則認(rèn)為沒有充分的證據(jù)否定原假設(shè)。6-14(一)P-值規(guī)則6-15【例6-3】假定,根據(jù)例6-2的結(jié)果,計(jì)算該問題的P-值,并做出判斷。解:查標(biāo)準(zhǔn)正態(tài)概率表,當(dāng)z=2.29時(shí),陰影面積為0.9890,尾部面積為1–0.9890=0.011,由對稱性可知,當(dāng)z=–2.29時(shí),左側(cè)面積為0.011。

0.011≤α/2=0.0250.011這個(gè)數(shù)字意味著,假若我們反復(fù)抽取n=100的樣本,在100個(gè)樣本中僅有可能出現(xiàn)一個(gè)使檢驗(yàn)統(tǒng)計(jì)量等于或小于–2.29的樣本。該事件發(fā)生的概率小于給定的顯著性水平,所以,可以判斷μ=150的假定是錯(cuò)誤的,也就是說,根據(jù)觀測的樣本,有理由表明總體的與150克的差異是顯著存在的。6-15【例6-3】假定,根據(jù)例6-2的結(jié)果,計(jì)算該問題的P6-16(二)臨界值規(guī)則假設(shè)檢驗(yàn)中,還有另外一種做出結(jié)論的方法:根據(jù)所提出的顯著性水平標(biāo)準(zhǔn)(它是概率密度曲線的尾部面積)查表得到相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量的數(shù)值,稱作臨界值,直接用檢驗(yàn)統(tǒng)計(jì)量的觀測值與臨界值作比較,觀測值落在臨界值所劃定的尾部(稱之為拒絕域)內(nèi),便拒絕原假設(shè);觀測值落在臨界值所劃定的尾部之外(稱之為不能拒絕域)的范圍內(nèi),則認(rèn)為拒絕原假設(shè)的證據(jù)不足。這種做出檢驗(yàn)結(jié)論的方法,我們稱之為臨界值規(guī)則。6-16(二)臨界值規(guī)則6-17顯然,P-值規(guī)則和臨界值規(guī)則是等價(jià)的。在做檢驗(yàn)的時(shí)候,只用其中一個(gè)規(guī)則即可。P-值規(guī)則較之臨界值規(guī)則具有更明顯的優(yōu)點(diǎn)。這主要是:第一,它更加簡捷;第二,在值規(guī)則的檢驗(yàn)結(jié)論中,對于犯第一類錯(cuò)誤的概率的表述更加精確。推薦使用P-值規(guī)則。6-17顯然,P-值規(guī)則和臨界值規(guī)則是等價(jià)的。在做檢驗(yàn)的時(shí)候6-18【例6-4】假定,根據(jù)例6-2的結(jié)果,用臨界值規(guī)則做出判斷。解:查表得到,臨界值z0.025=–1.96。由于

z=–2.29<–1.96,即,檢驗(yàn)統(tǒng)計(jì)量的觀測值落在臨界值所劃定的左側(cè)(即落在拒絕域),因而拒絕μ=150克的原假設(shè)。上面的檢驗(yàn)結(jié)果意味著,由樣本數(shù)據(jù)得到的觀測值的差異提醒我們:裝袋生產(chǎn)線的生產(chǎn)過程已經(jīng)偏離了控制狀態(tài),正在向裝袋重量低于技術(shù)標(biāo)準(zhǔn)的狀態(tài)傾斜。6-18【例6-4】假定,根據(jù)例6-2的結(jié)果,用臨界值規(guī)則做6-19五、雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)圖6-1雙側(cè)、單側(cè)檢驗(yàn)的拒絕域分配α/21–α

α/2–Zα/2

Zα/2

α–Zα0

α0Zα(a)雙側(cè)檢驗(yàn)(b)左側(cè)檢驗(yàn)(c)右側(cè)檢驗(yàn)6-19五、雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)圖6-1雙側(cè)、單側(cè)檢驗(yàn)6-20

表6-1拒絕域的單、雙側(cè)與備擇假設(shè)之間的對應(yīng)關(guān)系拒絕域位置P-值檢驗(yàn)的顯著性水平判斷標(biāo)準(zhǔn)原假設(shè)備擇假設(shè)雙側(cè)α/2H0:θ=θ0H1:θ≠θ0左單側(cè)αH0:θ≥θ0H1:θ<θ0右單側(cè)αH0:θ≤θ0H1:θ>θ06-20表6-1拒絕域的單、雙側(cè)與備擇6-21六、假設(shè)檢驗(yàn)的兩類錯(cuò)誤6-21六、假設(shè)檢驗(yàn)的兩類錯(cuò)誤6-226-226-236-236-24七、關(guān)于假設(shè)檢驗(yàn)結(jié)論的理解

這就是說,在假設(shè)檢驗(yàn)中,相對而言,當(dāng)原假設(shè)被拒絕時(shí),我們能夠以較大的把握肯定備擇假設(shè)的成立。而當(dāng)原假設(shè)未被拒絕時(shí),我們并不能認(rèn)為原假設(shè)確實(shí)成立。6-24七、關(guān)于假設(shè)檢驗(yàn)結(jié)論的理解6-25第二節(jié)總體均值的假設(shè)檢驗(yàn)一、單個(gè)總體均值的檢驗(yàn)二、雙總體均值是否相等的檢驗(yàn)6-25第二節(jié)總體均值的假設(shè)檢驗(yàn)一、單個(gè)總體均值的檢驗(yàn)6-26一、單個(gè)總體均值的檢驗(yàn)6-26一、單個(gè)總體均值的檢驗(yàn)6-276-276-286-286-296-296-306-306-316-316-326-326-33二、雙總體均值是否相等的檢驗(yàn)6-33二、雙總體均值是否相等的檢驗(yàn)6-346-346-356-356-366-366-376-376-38【例6-6】某工廠為了比較兩種裝配方法的效率,分別組織了兩組員工,每組9人,一組采用新的裝配方法,另外一組采用舊的裝配方法。假設(shè)兩組員工設(shè)備的裝配時(shí)間均服從正態(tài)分布,兩總體的方差相等但未知?,F(xiàn)有18個(gè)員工的設(shè)備裝配時(shí)間見表6-2,根據(jù)這些數(shù)據(jù),是否有理由認(rèn)為新的裝配方法更節(jié)約時(shí)間?(顯著性水平0.05)表6-2兩組員工設(shè)備的裝配時(shí)間單位:小時(shí)新方法(x2)353129253440273231舊方法(x1)3237353841443531346-38【例6-6】某工廠為了比較兩種裝配方法的效率,分別組6-396-396-406-406-416-416-42第三節(jié)總體比例的假設(shè)檢驗(yàn)一、單個(gè)總體比例的假設(shè)檢驗(yàn)二、兩個(gè)總體的比例是否相等的檢驗(yàn)6-42第三節(jié)總體比例的假設(shè)檢驗(yàn)一、單個(gè)總體比例的假設(shè)檢6-43一、單個(gè)總體比例的假設(shè)檢驗(yàn)6-43一、單個(gè)總體比例的假設(shè)檢驗(yàn)6-446-446-45

【例6-7】一項(xiàng)調(diào)查結(jié)果聲稱,某市小學(xué)生每月零花錢達(dá)到200元的比例為40%,某科研機(jī)構(gòu)為了檢驗(yàn)這個(gè)調(diào)查是否可靠,隨機(jī)抽選了100名小學(xué)生,發(fā)現(xiàn)有47人每月零花錢達(dá)到200元,調(diào)查結(jié)果能否證實(shí)早先調(diào)查40%的看法?()6-45【例6-7】一項(xiàng)調(diào)查結(jié)果聲稱,某市小學(xué)生每月零花錢6-466-466-47二、兩個(gè)總體的比例是否相等的檢驗(yàn)6-47二、兩個(gè)總體的比例是否相等的檢驗(yàn)6-486-486-49第四節(jié)單因子方差分析一、問題的提出二、方差分析的檢驗(yàn)統(tǒng)計(jì)量三、關(guān)于方差分析的兩點(diǎn)說明6-49第四節(jié)單因子方差分析一、問題的提出6-50一、問題的提出【例6-8】已知在一組給定的條件下飼養(yǎng)小雞所增加的體重服從正態(tài)分布。某養(yǎng)雞場欲檢驗(yàn)四種飼料配方對小雞增重的影響是否不相同(假定已經(jīng)經(jīng)過檢驗(yàn)表明不同飼料配方下的小雞增重方差相等)。為此,他們對四組初始條件完全相同的小雞,在完全相同的其他飼養(yǎng)條件下,分別使用四種不同的飼料配方進(jìn)行喂養(yǎng)。所得到的增重?cái)?shù)據(jù)如表6-3。表6-3四種不同飼料配方下小雞的增重情況飼料配方i小雞序號(hào)j38周后小雞個(gè)體增重yij(克)123456配方13704204504901730配方24903804003905004102570配方33303404003804701920配方441048040042038041025001600162016501680135082087206-50一、問題的提出【例6-8】已知在一組給定的條件下飼養(yǎng)6-51一、問題的提出【例6-8】已知在一組給定的條件下飼養(yǎng)小雞所增加的體重服從正態(tài)分布。某養(yǎng)雞場欲檢驗(yàn)四種飼料配方對小雞增重的影響是否不相同(假定已經(jīng)經(jīng)過檢驗(yàn)表明不同飼料配方下的小雞增重方差相等)。為此,他們對四組初始條件完全相同的小雞,在完全相同的其他飼養(yǎng)條件下,分別使用四種不同的飼料配方進(jìn)行喂養(yǎng)。所得到的增重?cái)?shù)據(jù)如表6-3。6-51一、問題的提出【例6-8】已知在一組給定的條件下飼養(yǎng)6-52對于類似本例的問題,一般地,把隨機(jī)變量分組的數(shù)目記作m,我們可建立下列假設(shè):6-52對于類似本例的問題,一般地,把隨機(jī)變量分組的數(shù)目記作6-53二、方差分析的檢驗(yàn)統(tǒng)計(jì)量6-53二、方差分析的檢驗(yàn)統(tǒng)計(jì)量6-546-546-556-556-566-566-57【例6-9】利用表6-3中的數(shù)據(jù)進(jìn)行單因子方差分析(顯著水平為α=0.05)。6-57【例6-9】利用表6-3中的數(shù)據(jù)進(jìn)行單因子方差分析(6-586-586-596-596-606-606-61

表6-4方差分析表變異來源離差平方和自由度均方差值P-值臨界值組間7112.1432370.7141.012320.4115733.196774組內(nèi)39811.67172341.863總計(jì)46923.81206-61表6-4方差分析表變異離差自由6-62(一)方差分析中變量的類型方差分析中的因變量是數(shù)量型變量。自變量可以是品質(zhì)型變量,也可以是數(shù)量型變量。當(dāng)自變量是數(shù)量型變量的時(shí)候,也要對其作統(tǒng)計(jì)分組設(shè)計(jì),也就是將它按品質(zhì)型變量來處理。(二)總體的正態(tài)性和同方差方差分析適用于多個(gè)正態(tài)總體Yi(i=1,2,…,m)均值的比較,且要求它們具有相同的方差。不過在實(shí)際應(yīng)用中,即使對于正態(tài)性和同方差性都存在很大背離的數(shù)據(jù),方差分析仍不失為一種提供有用的近似信息的技術(shù)。三、關(guān)于方差分析的兩點(diǎn)說明6-62(一)方差分析中變量的類型三、關(guān)于方差分析的兩點(diǎn)說明6-63第五節(jié)雙因子方差分析一、問題的提出二、有交互作用的雙因子方差分析6-63第五節(jié)雙因子方差分析一、問題的提出6-64一、問題的提出

方差分析中的“因子”,也稱因素。它是一個(gè)獨(dú)立的變量(自變量)。在上一節(jié)的例子中,我們要分析飼料是否為影響增重產(chǎn)生差異的原因,所以飼料是因子。該例中所考察的因子只有“飼料”一個(gè),而其他因子如雞的品種,飼養(yǎng)條件等保持不變,我們稱這種方差分析為單因子方差分析。如果要同時(shí)考察飼料和雞的品種兩個(gè)因子對小雞的增重是否有影響,則稱之為雙因子方差分析。6-64一、問題的提出方差分析中的“因子”,6-656-656-666-666-67

在這里要注意,不能把A的r個(gè)處理和B的c個(gè)處理看成“隨機(jī)樣本”?,F(xiàn)在的rc個(gè)處理是rc個(gè)總體,即Ai和Bj的每一種搭配形成的組格都是一個(gè)總體(隨機(jī)變量Yij)。對一個(gè)組格總體的nij個(gè)觀測yij1,yij2,…,yij才是隨機(jī)樣本。我們把Ai與Bj的搭配所形成的組格總體即隨機(jī)變量Yij的期望值記作,于是可以寫出與表6-5(樣本)相應(yīng)的總體期望值表如表6-6。6-67在這里要注意,不能把A的r個(gè)處理和B6-686-686-696-696-706-706-716-716-726-726-73二、有交互作用的雙因子方差分析

樣本數(shù)據(jù)的方差分析恒等式。SST=SSA+SSB+SSAB+SSE(6.24)

式中,SST是總離差平方和,

SSA是A因子處理間的離差平方和,

SSB是B因子處理間的離差平方和,

SSAB是AB交互作用處理間的離差平方和,

SSE是組格內(nèi)離差平方和。

6-73二、有交互作用的雙因子方差分析樣本數(shù)據(jù)的方差6-746-746-756-756-766-766-776-776-786-786-796-796-806-806-816-816-826-826-83第六節(jié)Excel在假設(shè)檢驗(yàn)與方差分析中的應(yīng)用一、假設(shè)檢驗(yàn)二、方差分析6-83第六節(jié)Excel在假設(shè)檢驗(yàn)與方差分析中的應(yīng)用一、6-84一、假設(shè)檢驗(yàn)【例6-11】使用例6-1的數(shù)據(jù)進(jìn)行假設(shè)檢驗(yàn)(顯著性水平0.05,雙側(cè)檢驗(yàn))。解:操作步驟如下。1.構(gòu)造工作表,見圖6-2。圖中方框內(nèi)為計(jì)算所得數(shù)據(jù),方框外為原始輸入數(shù)據(jù)。注意,如果給出了具體的樣本中每袋咖啡的重量,則樣本均值、標(biāo)準(zhǔn)差、樣本容量分別可以用AVERAGE函數(shù)、STDEV函數(shù)和COUNT函數(shù)進(jìn)行計(jì)算。2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量Z(由于樣本容量較大,所以使用Z統(tǒng)計(jì)量)。在B6單元格輸入公式“=(B1-B2)/(B3/SQRT(B4))”。3.計(jì)算臨界值。在B7中輸入公式“=ABS(NORMSINV(B5/2))”,由于是雙側(cè)檢驗(yàn),因此NORMSINV函數(shù)的參數(shù)必須是。6-84一、假設(shè)檢驗(yàn)【例6-11】使用例6-1的數(shù)據(jù)進(jìn)行6-854.計(jì)算p-值。在B8中輸入公式“=NORMSDIST(B6)”。5.根據(jù)以上的計(jì)算結(jié)果,使用臨界值規(guī)則或p-值規(guī)則進(jìn)行判斷,檢驗(yàn)統(tǒng)計(jì)量的觀測值落在拒絕域,因而拒絕μ=150克的原假設(shè)。圖6-26-854.計(jì)算p-值。在B8中輸入公式“=NORMSDIS6-86【例6-12】利用Excel求解例6-6的問題。6-86【例6-12】利用Excel求解例6-6的問題。6-876-876-88圖6-36-88圖6-36-89圖6-46-89圖6-46-906-906-91二、方差分析【例6-13】用Excel實(shí)現(xiàn)例6-8的計(jì)算過程。6-91二、方差分析【例6-13】用Excel實(shí)現(xiàn)例6-8的6-922.調(diào)出[方差分析:單因素方差分析]對話框,按圖6-6所示填寫。圖6-66-922.調(diào)出[方差分析:單因素方差分析]對話框,按圖6-6-936-936-946-946-95【例6-15】用Excel實(shí)現(xiàn)例6-10的計(jì)算過程1.輸入數(shù)據(jù),如圖6-7所示。其中,B2:B4單元格存放的是在“A1”與“B1”因素水平共同作用下,進(jìn)行3次試驗(yàn)所得的結(jié)果;D5:D7單元格存放的是在“A3”與“B2”因素水平共同作用下,進(jìn)行3次試驗(yàn)所得的結(jié)果,其余類推。圖6-76-95【例6-15】用Excel實(shí)現(xiàn)例6-10的計(jì)算過程16-962.調(diào)出[方差分析:可重復(fù)雙因素分析]對話框,其填寫如圖6-8所示。該分析工具對話框與單因素方差分析對話框基本相同,只是多了一個(gè)[每一樣本的行數(shù)]編輯框,其中輸入包含在每個(gè)樣本中的行數(shù)。本例中,在每種不同因素水平組合下,分別進(jìn)行了3次試驗(yàn),因此[每一樣本的行數(shù)]為“3”。每個(gè)樣本必須包含同樣的行數(shù)。另外,在該分析工具對話框中去掉了[標(biāo)志位于第一行]復(fù)選框,但要注意輸入?yún)^(qū)域必須包括因素水平標(biāo)志(“A1”、“B2”等)所在的單元格區(qū)域,也即,輸入?yún)^(qū)域?yàn)椤?A$1:$E$10”,而不是只包括數(shù)據(jù)的單元格區(qū)域“$B$2:$E$10”。6-962.調(diào)出[方差分析:可重復(fù)雙因素分析]對話框,其填寫6-973.單擊[確定]按鈕,得到方差分析表。圖6-86-973.單擊[確定]按鈕,得到方差分析表。圖6-86-98

本章小結(jié)6-98本章小結(jié)6-99本資料來源6-1本資料來源6-100統(tǒng)計(jì)學(xué)導(dǎo)論曾五一肖紅葉主編6-2統(tǒng)計(jì)學(xué)導(dǎo)論曾五一肖紅葉主編6-101第六章假設(shè)檢驗(yàn)與方差分析第一節(jié)假設(shè)檢驗(yàn)的基本原理第二節(jié)總體均值的假設(shè)檢驗(yàn)第三節(jié)總體比例的假設(shè)檢驗(yàn)第四節(jié)單因子方差分析第五節(jié)雙因子方差分析第六節(jié)Excel在假設(shè)檢驗(yàn)與方差分析中的應(yīng)用6-3第六章假設(shè)檢驗(yàn)與方差分析第一節(jié)假設(shè)檢驗(yàn)的基本原6-102第一節(jié)假設(shè)檢驗(yàn)的基本原理一、什么是假設(shè)檢驗(yàn)二、原假設(shè)與備擇假設(shè)三、檢驗(yàn)統(tǒng)計(jì)量四、顯著性水平、P-值與臨界值五、雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)六、假設(shè)檢驗(yàn)的兩類錯(cuò)誤七、關(guān)于假設(shè)檢驗(yàn)結(jié)論的理解6-4第一節(jié)假設(shè)檢驗(yàn)的基本原理一、什么是假設(shè)檢驗(yàn)6-103一、什么是假設(shè)檢驗(yàn)【例6-1】假定咖啡的分袋包裝生產(chǎn)線的裝袋重量服從正態(tài)分布N(μ,σ2)。生產(chǎn)線按每袋凈重150克的技術(shù)標(biāo)準(zhǔn)控制操作?,F(xiàn)從生產(chǎn)線抽取簡單隨機(jī)樣本n=100袋,測得其平均重量為=149.8克,樣本標(biāo)準(zhǔn)差s=0.872克。問該生產(chǎn)線的裝袋凈重的期望值是否為150克(即問生產(chǎn)線是否處于控制狀態(tài))?6-5一、什么是假設(shè)檢驗(yàn)【例6-1】假定咖啡的分袋包裝生產(chǎn)線6-104

所謂假設(shè)檢驗(yàn),就是事先對總體的參數(shù)或總體分布形式做出一個(gè)假設(shè),然后利用抽取的樣本信息來判斷這個(gè)假設(shè)(原假設(shè))是否合理,即判斷總體的真實(shí)情況與原假設(shè)是否存在顯著的系統(tǒng)性差異,所以假設(shè)檢驗(yàn)又被稱為顯著性檢驗(yàn)。6-6所謂假設(shè)檢驗(yàn),就是事先對總體的參數(shù)或總6-105

一個(gè)完整的假設(shè)檢驗(yàn)過程,包括以下幾個(gè)步驟:(1)提出假設(shè);(2)構(gòu)造適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并根據(jù)樣本計(jì)算統(tǒng)計(jì)量的具體數(shù)值;(3)規(guī)定顯著性水平,建立檢驗(yàn)規(guī)則;(4)做出判斷。6-7一個(gè)完整的假設(shè)檢驗(yàn)過程,包括以下幾個(gè)步驟:6-106二、原假設(shè)與備擇假設(shè)原假設(shè)一般用H0表示,通常是設(shè)定總體參數(shù)等于某值,或服從某個(gè)分布函數(shù)等;備擇假設(shè)是與原假設(shè)互相排斥的假設(shè),原假設(shè)與備擇假設(shè)不可能同時(shí)成立。所謂假設(shè)檢驗(yàn)問題實(shí)質(zhì)上就是要判斷H0是否正確,若拒絕原假設(shè)H0

,則意味著接受備擇假設(shè)H1

。如在例6-1中,我們可以提出兩個(gè)假設(shè):假設(shè)平均袋裝咖啡重量與所要控制的標(biāo)準(zhǔn)沒有顯著差異,記為;假設(shè)平均袋裝咖啡重量與所要控制的標(biāo)準(zhǔn)有顯著差異,記為。6-8二、原假設(shè)與備擇假設(shè)原假設(shè)一般用H0表示,通常是設(shè)定總6-107三、檢驗(yàn)統(tǒng)計(jì)量所謂檢驗(yàn)統(tǒng)計(jì)量,就是根據(jù)所抽取的樣本計(jì)算的用于檢驗(yàn)原假設(shè)是否成立的隨機(jī)變量。檢驗(yàn)統(tǒng)計(jì)量中應(yīng)當(dāng)含有所要檢驗(yàn)的總體參數(shù),以便在“總體參數(shù)等于某數(shù)值”的假定下研究樣本統(tǒng)計(jì)量的觀測結(jié)果。檢驗(yàn)統(tǒng)計(jì)量還應(yīng)該在“H0成立”的前提下有已知的分布,從而便于計(jì)算出現(xiàn)某種特定的觀測結(jié)果的概率。6-9三、檢驗(yàn)統(tǒng)計(jì)量所謂檢驗(yàn)統(tǒng)計(jì)量,就是根據(jù)所抽取的樣本計(jì)算6-1086-106-1096-116-110四、顯著性水平、P-值與臨界值小概率事件在單獨(dú)一次的試驗(yàn)中基本上不會(huì)發(fā)生,可以不予考慮。在假設(shè)檢驗(yàn)中,我們做出判斷時(shí)所依據(jù)的邏輯是:如果在原假設(shè)正確的前提下,檢驗(yàn)統(tǒng)計(jì)量的樣本觀測值的出現(xiàn)屬于小概率事件,那么可以認(rèn)為原假設(shè)不可信,從而否定它,轉(zhuǎn)而接受備擇假設(shè)。6-12四、顯著性水平、P-值與臨界值小概率事件在單獨(dú)一次的6-111至于小概率的標(biāo)準(zhǔn)是多大?這要根據(jù)實(shí)際問題而定。假設(shè)檢驗(yàn)中,稱這一標(biāo)準(zhǔn)為顯著性水平,用來表示α,在應(yīng)用中,通常取α=0.01,α=0.05。一般來說,犯第一類錯(cuò)誤可能造成的損失越大,α的取值應(yīng)當(dāng)越小。對假設(shè)檢驗(yàn)問題做出判斷可依據(jù)兩種規(guī)則:一是P-值規(guī)則;二是臨界值規(guī)則。6-13至于小概率的標(biāo)準(zhǔn)是多大?這要根據(jù)實(shí)際問題而定。假設(shè)檢6-112(一)P-值規(guī)則所謂P-值,實(shí)際上是檢驗(yàn)統(tǒng)計(jì)量超過(大于或小于)具體樣本觀測值的概率。如果P-值小于所給定的顯著性水平,則認(rèn)為原假設(shè)不太可能成立;如果P-值大于所給定的標(biāo)準(zhǔn),則認(rèn)為沒有充分的證據(jù)否定原假設(shè)。6-14(一)P-值規(guī)則6-113【例6-3】假定,根據(jù)例6-2的結(jié)果,計(jì)算該問題的P-值,并做出判斷。解:查標(biāo)準(zhǔn)正態(tài)概率表,當(dāng)z=2.29時(shí),陰影面積為0.9890,尾部面積為1–0.9890=0.011,由對稱性可知,當(dāng)z=–2.29時(shí),左側(cè)面積為0.011。

0.011≤α/2=0.0250.011這個(gè)數(shù)字意味著,假若我們反復(fù)抽取n=100的樣本,在100個(gè)樣本中僅有可能出現(xiàn)一個(gè)使檢驗(yàn)統(tǒng)計(jì)量等于或小于–2.29的樣本。該事件發(fā)生的概率小于給定的顯著性水平,所以,可以判斷μ=150的假定是錯(cuò)誤的,也就是說,根據(jù)觀測的樣本,有理由表明總體的與150克的差異是顯著存在的。6-15【例6-3】假定,根據(jù)例6-2的結(jié)果,計(jì)算該問題的P6-114(二)臨界值規(guī)則假設(shè)檢驗(yàn)中,還有另外一種做出結(jié)論的方法:根據(jù)所提出的顯著性水平標(biāo)準(zhǔn)(它是概率密度曲線的尾部面積)查表得到相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量的數(shù)值,稱作臨界值,直接用檢驗(yàn)統(tǒng)計(jì)量的觀測值與臨界值作比較,觀測值落在臨界值所劃定的尾部(稱之為拒絕域)內(nèi),便拒絕原假設(shè);觀測值落在臨界值所劃定的尾部之外(稱之為不能拒絕域)的范圍內(nèi),則認(rèn)為拒絕原假設(shè)的證據(jù)不足。這種做出檢驗(yàn)結(jié)論的方法,我們稱之為臨界值規(guī)則。6-16(二)臨界值規(guī)則6-115顯然,P-值規(guī)則和臨界值規(guī)則是等價(jià)的。在做檢驗(yàn)的時(shí)候,只用其中一個(gè)規(guī)則即可。P-值規(guī)則較之臨界值規(guī)則具有更明顯的優(yōu)點(diǎn)。這主要是:第一,它更加簡捷;第二,在值規(guī)則的檢驗(yàn)結(jié)論中,對于犯第一類錯(cuò)誤的概率的表述更加精確。推薦使用P-值規(guī)則。6-17顯然,P-值規(guī)則和臨界值規(guī)則是等價(jià)的。在做檢驗(yàn)的時(shí)候6-116【例6-4】假定,根據(jù)例6-2的結(jié)果,用臨界值規(guī)則做出判斷。解:查表得到,臨界值z0.025=–1.96。由于

z=–2.29<–1.96,即,檢驗(yàn)統(tǒng)計(jì)量的觀測值落在臨界值所劃定的左側(cè)(即落在拒絕域),因而拒絕μ=150克的原假設(shè)。上面的檢驗(yàn)結(jié)果意味著,由樣本數(shù)據(jù)得到的觀測值的差異提醒我們:裝袋生產(chǎn)線的生產(chǎn)過程已經(jīng)偏離了控制狀態(tài),正在向裝袋重量低于技術(shù)標(biāo)準(zhǔn)的狀態(tài)傾斜。6-18【例6-4】假定,根據(jù)例6-2的結(jié)果,用臨界值規(guī)則做6-117五、雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)圖6-1雙側(cè)、單側(cè)檢驗(yàn)的拒絕域分配α/21–α

α/2–Zα/2

Zα/2

α–Zα0

α0Zα(a)雙側(cè)檢驗(yàn)(b)左側(cè)檢驗(yàn)(c)右側(cè)檢驗(yàn)6-19五、雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)圖6-1雙側(cè)、單側(cè)檢驗(yàn)6-118

表6-1拒絕域的單、雙側(cè)與備擇假設(shè)之間的對應(yīng)關(guān)系拒絕域位置P-值檢驗(yàn)的顯著性水平判斷標(biāo)準(zhǔn)原假設(shè)備擇假設(shè)雙側(cè)α/2H0:θ=θ0H1:θ≠θ0左單側(cè)αH0:θ≥θ0H1:θ<θ0右單側(cè)αH0:θ≤θ0H1:θ>θ06-20表6-1拒絕域的單、雙側(cè)與備擇6-119六、假設(shè)檢驗(yàn)的兩類錯(cuò)誤6-21六、假設(shè)檢驗(yàn)的兩類錯(cuò)誤6-1206-226-1216-236-122七、關(guān)于假設(shè)檢驗(yàn)結(jié)論的理解

這就是說,在假設(shè)檢驗(yàn)中,相對而言,當(dāng)原假設(shè)被拒絕時(shí),我們能夠以較大的把握肯定備擇假設(shè)的成立。而當(dāng)原假設(shè)未被拒絕時(shí),我們并不能認(rèn)為原假設(shè)確實(shí)成立。6-24七、關(guān)于假設(shè)檢驗(yàn)結(jié)論的理解6-123第二節(jié)總體均值的假設(shè)檢驗(yàn)一、單個(gè)總體均值的檢驗(yàn)二、雙總體均值是否相等的檢驗(yàn)6-25第二節(jié)總體均值的假設(shè)檢驗(yàn)一、單個(gè)總體均值的檢驗(yàn)6-124一、單個(gè)總體均值的檢驗(yàn)6-26一、單個(gè)總體均值的檢驗(yàn)6-1256-276-1266-286-1276-296-1286-306-1296-316-1306-326-131二、雙總體均值是否相等的檢驗(yàn)6-33二、雙總體均值是否相等的檢驗(yàn)6-1326-346-1336-356-1346-366-1356-376-136【例6-6】某工廠為了比較兩種裝配方法的效率,分別組織了兩組員工,每組9人,一組采用新的裝配方法,另外一組采用舊的裝配方法。假設(shè)兩組員工設(shè)備的裝配時(shí)間均服從正態(tài)分布,兩總體的方差相等但未知?,F(xiàn)有18個(gè)員工的設(shè)備裝配時(shí)間見表6-2,根據(jù)這些數(shù)據(jù),是否有理由認(rèn)為新的裝配方法更節(jié)約時(shí)間?(顯著性水平0.05)表6-2兩組員工設(shè)備的裝配時(shí)間單位:小時(shí)新方法(x2)353129253440273231舊方法(x1)3237353841443531346-38【例6-6】某工廠為了比較兩種裝配方法的效率,分別組6-1376-396-1386-406-1396-416-140第三節(jié)總體比例的假設(shè)檢驗(yàn)一、單個(gè)總體比例的假設(shè)檢驗(yàn)二、兩個(gè)總體的比例是否相等的檢驗(yàn)6-42第三節(jié)總體比例的假設(shè)檢驗(yàn)一、單個(gè)總體比例的假設(shè)檢6-141一、單個(gè)總體比例的假設(shè)檢驗(yàn)6-43一、單個(gè)總體比例的假設(shè)檢驗(yàn)6-1426-446-143

【例6-7】一項(xiàng)調(diào)查結(jié)果聲稱,某市小學(xué)生每月零花錢達(dá)到200元的比例為40%,某科研機(jī)構(gòu)為了檢驗(yàn)這個(gè)調(diào)查是否可靠,隨機(jī)抽選了100名小學(xué)生,發(fā)現(xiàn)有47人每月零花錢達(dá)到200元,調(diào)查結(jié)果能否證實(shí)早先調(diào)查40%的看法?()6-45【例6-7】一項(xiàng)調(diào)查結(jié)果聲稱,某市小學(xué)生每月零花錢6-1446-466-145二、兩個(gè)總體的比例是否相等的檢驗(yàn)6-47二、兩個(gè)總體的比例是否相等的檢驗(yàn)6-1466-486-147第四節(jié)單因子方差分析一、問題的提出二、方差分析的檢驗(yàn)統(tǒng)計(jì)量三、關(guān)于方差分析的兩點(diǎn)說明6-49第四節(jié)單因子方差分析一、問題的提出6-148一、問題的提出【例6-8】已知在一組給定的條件下飼養(yǎng)小雞所增加的體重服從正態(tài)分布。某養(yǎng)雞場欲檢驗(yàn)四種飼料配方對小雞增重的影響是否不相同(假定已經(jīng)經(jīng)過檢驗(yàn)表明不同飼料配方下的小雞增重方差相等)。為此,他們對四組初始條件完全相同的小雞,在完全相同的其他飼養(yǎng)條件下,分別使用四種不同的飼料配方進(jìn)行喂養(yǎng)。所得到的增重?cái)?shù)據(jù)如表6-3。表6-3四種不同飼料配方下小雞的增重情況飼料配方i小雞序號(hào)j38周后小雞個(gè)體增重yij(克)123456配方13704204504901730配方24903804003905004102570配方33303404003804701920配方441048040042038041025001600162016501680135082087206-50一、問題的提出【例6-8】已知在一組給定的條件下飼養(yǎng)6-149一、問題的提出【例6-8】已知在一組給定的條件下飼養(yǎng)小雞所增加的體重服從正態(tài)分布。某養(yǎng)雞場欲檢驗(yàn)四種飼料配方對小雞增重的影響是否不相同(假定已經(jīng)經(jīng)過檢驗(yàn)表明不同飼料配方下的小雞增重方差相等)。為此,他們對四組初始條件完全相同的小雞,在完全相同的其他飼養(yǎng)條件下,分別使用四種不同的飼料配方進(jìn)行喂養(yǎng)。所得到的增重?cái)?shù)據(jù)如表6-3。6-51一、問題的提出【例6-8】已知在一組給定的條件下飼養(yǎng)6-150對于類似本例的問題,一般地,把隨機(jī)變量分組的數(shù)目記作m,我們可建立下列假設(shè):6-52對于類似本例的問題,一般地,把隨機(jī)變量分組的數(shù)目記作6-151二、方差分析的檢驗(yàn)統(tǒng)計(jì)量6-53二、方差分析的檢驗(yàn)統(tǒng)計(jì)量6-1526-546-1536-556-1546-566-155【例6-9】利用表6-3中的數(shù)據(jù)進(jìn)行單因子方差分析(顯著水平為α=0.05)。6-57【例6-9】利用表6-3中的數(shù)據(jù)進(jìn)行單因子方差分析(6-1566-586-1576-596-1586-606-159

表6-4方差分析表變異來源離差平方和自由度均方差值P-值臨界值組間7112.1432370.7141.012320.4115733.196774組內(nèi)39811.67172341.863總計(jì)46923.81206-61表6-4方差分析表變異離差自由6-160(一)方差分析中變量的類型方差分析中的因變量是數(shù)量型變量。自變量可以是品質(zhì)型變量,也可以是數(shù)量型變量。當(dāng)自變量是數(shù)量型變量的時(shí)候,也要對其作統(tǒng)計(jì)分組設(shè)計(jì),也就是將它按品質(zhì)型變量來處理。(二)總體的正態(tài)性和同方差方差分析適用于多個(gè)正態(tài)總體Yi(i=1,2,…,m)均值的比較,且要求它們具有相同的方差。不過在實(shí)際應(yīng)用中,即使對于正態(tài)性和同方差性都存在很大背離的數(shù)據(jù),方差分析仍不失為一種提供有用的近似信息的技術(shù)。三、關(guān)于方差分析的兩點(diǎn)說明6-62(一)方差分析中變量的類型三、關(guān)于方差分析的兩點(diǎn)說明6-161第五節(jié)雙因子方差分析一、問題的提出二、有交互作用的雙因子方差分析6-63第五節(jié)雙因子方差分析一、問題的提出6-162一、問題的提出

方差分析中的“因子”,也稱因素。它是一個(gè)獨(dú)立的變量(自變量)。在上一節(jié)的例子中,我們要分析飼料是否為影響增重產(chǎn)生差異的原因,所以飼料是因子。該例中所考察的因子只有“飼料”一個(gè),而其他因子如雞的品種,飼養(yǎng)條件等保持不變,我們稱這種方差分析為單因子方差分析。如果要同時(shí)考察飼料和雞的品種兩個(gè)因子對小雞的增重是否有影響,則稱之為雙因子方差分析。6-64一、問題的提出方差分析中的“因子”,6-1636-656-1646-666-165

在這里要注意,不能把A的r個(gè)處理和B的c個(gè)處理看成“隨機(jī)樣本”?,F(xiàn)在的rc個(gè)處理是rc個(gè)總體,即Ai和Bj的每一種搭配形成的組格都是一個(gè)總體(隨機(jī)變量Yij)。對一個(gè)組格總體的nij個(gè)觀測yij1,yij2,…,yij才是隨機(jī)樣本。我們把Ai與Bj的搭配所形成的組格總體即隨機(jī)變量Yij的期望值記作,于是可以寫出與表6-5(樣本)相應(yīng)的總體期望值表如表6-6。6-67在這里要注意,不能把A的r個(gè)處理和B6-1666-686-1676-696-1686-706-1696-716-1706-726-171二、有交互作用的雙因子方差分析

樣本數(shù)據(jù)的方差分析恒等式。SST=SSA+SSB+SSAB+SSE(6.24)

式中,SST是總離差平方和,

SSA是A因子處理間的離差平方和,

SSB是B因子處理間的離差平方和,

SSAB是AB交互作用處理間的離差平方和,

SSE是組格內(nèi)離差平方和。

6-73

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論