單因子方差分析_第1頁
單因子方差分析_第2頁
單因子方差分析_第3頁
單因子方差分析_第4頁
單因子方差分析_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第八章

方差分析與回歸分析

§8.1

方差分析§8.2

多重比較§8.3

方差齊性分析§8.4

一元線性回歸§8.5

一元非線性回歸

§8.1

單因子方差分析8.1.1

問題的提出

實(shí)際工作中我們經(jīng)常碰到多個(gè)正態(tài)總體均值的比較問題,處理這類問題通常采用所謂的方差分析方法。

例8.1.1

在飼料養(yǎng)雞增肥的研究中,某研究所提出三種飼料配方:A1是以魚粉為主的飼料,A2是以槐樹粉為主的飼料,A3是以苜蓿粉為主的飼料。為比較三種飼料的效果,特選24只相似的雛雞隨機(jī)均分為三組,每組各喂一種飼料,60天后觀察它們的重量。試驗(yàn)結(jié)果如下表所示:

表8.1.1

雞飼料試驗(yàn)數(shù)據(jù)

飼料A雞重(克)A110731009106010011002101210091028A21107109299011091090107411221001A310931029108010211022103210291048本例中,我們要比較的是三種飼料對(duì)雞的增肥作用是否相同。為此,把飼料稱為因子,記為A,三種不同的配方稱為因子A的三個(gè)水平,記為A1,A2,A3,使用配方Ai下第j只雞60天后的重量用yij表示,i=1,2,3,

j=1,2,,8。我們的目的是比較三種飼料配方下雞的平均重量是否相等,為此,需要做一些基本假定,把所研究的問題歸結(jié)為一個(gè)統(tǒng)計(jì)問題,然后用方差分析的方法進(jìn)行解決。

8.1.2

單因子方差分析的統(tǒng)計(jì)模型

在例8.1.1中我們只考察了一個(gè)因子,稱其為單因子試驗(yàn)。

通常,在單因子試驗(yàn)中,記因子為A,設(shè)其有r個(gè)水平,記為A1,A2,…,Ar,在每一水平下考察的指標(biāo)可以看成一個(gè)總體,現(xiàn)有r個(gè)水平,故有r個(gè)總體,

假定:每一總體均為正態(tài)總體,記為N(i

,

i2),

i=1,2,…,r;各總體的方差相同:1

2=22=…=

r2=

2

;從每一總體中抽取的樣本是相互獨(dú)立的,即所有的試驗(yàn)結(jié)果yij

都相互獨(dú)立。

我們要比較各水平下的均值是否相同,

即要對(duì)如下的一個(gè)假設(shè)進(jìn)行檢驗(yàn):H0

:1

=2=…=r

(8.1.1)

備擇假設(shè)為H1

:1,2,…,r

不全相等在不會(huì)引起誤解的情況下,H1通常可省略不寫。如果H0成立,因子A的r個(gè)水平均值相同,稱因子A的r個(gè)水平間沒有顯著差異,簡稱因子A不顯著;反之,當(dāng)H0不成立時(shí),因子A的r個(gè)水平均值不全相同,這時(shí)稱因子A的不同水平間有顯著差異,簡稱因子A顯著。

為對(duì)假設(shè)(8.1.1)進(jìn)行檢驗(yàn),需要從每一水平下的總體抽取樣本,設(shè)從第i個(gè)水平下的總體獲得m個(gè)試驗(yàn)結(jié)果,記yij

表示第i個(gè)總體的第j次重復(fù)試驗(yàn)結(jié)果。共得如下n=rm個(gè)試驗(yàn)結(jié)果:yij,

i=1,2,…,r,j=1,2,…,m,

其中r為水平數(shù),m為重復(fù)數(shù),i為水平編號(hào),

j為重復(fù)編號(hào)。

在水平Ai下的試驗(yàn)結(jié)果yij與該水平下的指標(biāo)均值i一般總是有差距的,記ij

=yiji,

ij

稱為隨機(jī)誤差。于是有

yij

=

i+ij

(8.1.2)(8.1.2)式稱為試驗(yàn)結(jié)果yij

的數(shù)據(jù)結(jié)構(gòu)式。

單因子方差分析的統(tǒng)計(jì)模型:(8.1.3)

總均值與效應(yīng):

稱諸i的平均為總均值.

稱第i水平下的均值i與總均值

的差:

ai=i-為Ai的效應(yīng)。

模型(8.1.3)可以改寫為

(8.1.8)

假設(shè)(8.1.1)可改寫為

H0

:a1

=a2=…=ar=0(8.1.9)

8.1.3

平方和分解

一、試驗(yàn)數(shù)據(jù)通常在單因子方差分析中可將試驗(yàn)數(shù)據(jù)列成如下頁表格形式。表8.1.2中的最后二列的和與平均的含義如下:表8.1.2

單因子方差分析試驗(yàn)數(shù)據(jù)

因子水平

試驗(yàn)數(shù)據(jù)

平均

A1y11

y12

…y1mT1A2y21

y22

…y2mT2┆┆┆┆Aryr1

yr2

…yrmTrT數(shù)據(jù)間是有差異的。數(shù)據(jù)yij與總平均間的偏差可用yij

表示,它可分解為二個(gè)偏差之和(8.1.10)記二、組內(nèi)偏差與組間偏差由于(8.1.11)所以yij-僅反映組內(nèi)數(shù)據(jù)與組內(nèi)平均的隨機(jī)誤差,稱為組內(nèi)偏差;而(8.1.12)除了反映隨機(jī)誤差外,還反映了第i個(gè)水平的效應(yīng),稱為組間偏差。在統(tǒng)計(jì)學(xué)中,把k個(gè)數(shù)據(jù)y1,y2,…,yk分別對(duì)其均值=(y1+…+yk

)/k的偏差平方和稱為k個(gè)數(shù)據(jù)的偏差平方和,它常用來度量若干個(gè)數(shù)據(jù)分散的程度。三、偏差平方和及其自由度在構(gòu)成偏差平方和Q的k個(gè)偏差y1

,…,yk

間有一個(gè)恒等式,這說明在Q中獨(dú)立的偏差只有k1個(gè)。在統(tǒng)計(jì)學(xué)中把平方和中獨(dú)立偏差個(gè)數(shù)稱為該平方和的自由度,常記為f,如Q的自由度為fQ=k1。自由度是偏差平方和的一個(gè)重要參數(shù)。

各yij間總的差異大小可用總偏差平方和

表示,其自由度為fT=n1;

四、總平方和分解公式僅由隨機(jī)誤差引起的數(shù)據(jù)間的差異可以用組內(nèi)偏差平方和表示,也稱為誤差偏差平方和,其自由度為fe=nr;由于組間差異除了隨機(jī)誤差外,還反映了效應(yīng)間的差異,故由效應(yīng)不同引起的數(shù)據(jù)差異可用組間偏差平方和表示,也稱為因子A的偏差平方和,其自由度為fA=r1;

定理8.1.1

在上述符號(hào)下,總平方和ST可以分解為因子平方和SA與誤差平方和Se之和,其自由度也有相應(yīng)分解公式,具體為:

ST=SA+Se,fT=fA+fe

(8.1.16)(8.1.16)式通常稱為總平方和分解式。

分析其中偏差平方和Q的大小與自由度有關(guān),為了便于在偏差平方和間進(jìn)行比較,統(tǒng)計(jì)上引入了均方和的概念,它定義為MS=Q/fQ

,其意為平均每個(gè)自由度上有多少平方和,它比較好地度量了一組數(shù)據(jù)的離散程度。如今要對(duì)因子平方和SA與誤差平方和Se之間進(jìn)行比較,用其均方和MSA=SA

/fA

,MSe=Se

/fe

進(jìn)行比較更為合理,故可用作為檢驗(yàn)H0的統(tǒng)計(jì)量。8.1.4檢驗(yàn)方法(2),進(jìn)一步,若H0成立,則有SA/

2~

2(r1)定理8.1.2

在單因子方差分析模型(8.1.8)及前述符號(hào)下,有(1)

Se/

2~

2(nr),從而E(Se)

=(nr)

2(3)SA與Se獨(dú)立。分析(1)自由度(2)當(dāng)成立時(shí),顯然(3)注意到與諸獨(dú)立為諸的函數(shù)故SA與Se獨(dú)立。由定理8.1.2,若H0成立,則檢驗(yàn)統(tǒng)計(jì)量F服從自由度為fA和fe的F分布,因此拒絕域?yàn)閃={FF1(fA

,fe)},通常將上述計(jì)算過程列成一張表格,稱為方差分析表。表8.1.3

單因子方差分析表來源平方和自由度均方和F比因子SAfA=r1MSA=SA/fAF=MSA/MSe誤差Sefe=nrMSe=Se/fe總和STfT=n1對(duì)給定的,可作如下判斷:若F

F1(fA

,fe)

,則說明因子A不顯著。該檢驗(yàn)的p值也可利用統(tǒng)計(jì)軟件求出,若以Y記服從F(fA

,fe)的隨機(jī)變量,則檢驗(yàn)的

p值為p=P(YF)。如果F>F1(fA

,fe),則認(rèn)為因子A顯著;常用的各偏差平方和的計(jì)算公式如下:

(8.1.19)

一般可將計(jì)算過程列表進(jìn)行。

例8.1.2

采用例8.1.1的數(shù)據(jù),將原始數(shù)據(jù)減去1000,列表給出計(jì)算過程:表8.1.4例8.1.2的計(jì)算表水平數(shù)據(jù)(原始數(shù)據(jù)-1000)TiTi2A17396012129281943763610024A210792-101099074122158534222560355A3932980212232294835412531620984113350517791363利用(8.1.19),可算得各偏差平方和為:把上述諸平方和及其自由度填入方差分析表表8.1.5例8.1.2的方差分析表

來源平方和自由度均方和F比因子9660.083324830.04173.5948

誤差28215.9584211343.6171總和37876.041723若取=0.05,則F0.95

(2

,21)=3.47

,由于F=3.5948>3.47,故認(rèn)為因子A(飼料)是顯著的,即三種飼料對(duì)雞的增肥作用有明顯的差別。

8.1.5參數(shù)估計(jì)

在檢驗(yàn)結(jié)果為顯著時(shí),我們可進(jìn)一步求出總均值

、各主效應(yīng)ai和誤差方差2的估計(jì)。

一、點(diǎn)估計(jì)由模型(8.1.8)知諸yij相互獨(dú)立,且yij~N(+ai

,2)

,因此,可使用極大似然方法求出一般平均

、各主效應(yīng)ai和誤差方差2的估計(jì):由極大似然估計(jì)的不變性,各水平均值i的極大似然估計(jì)為,由于不是2的無偏估計(jì),可修偏:

由于,可給出Ai的水平均值i的1-的置信區(qū)間為

其中。

二、置信區(qū)間例8.1.3

繼續(xù)例8.1.2,此處我們給出諸水平均值的估計(jì)。因子A的三個(gè)水平均值的估計(jì)分別為從點(diǎn)估計(jì)來看,水平2(以槐樹粉為主的飼料)是最優(yōu)的。

誤差方差的無偏估計(jì)為利用(8.1.23)可以給出諸水平均值的置信區(qū)間。此處,,若?。?.05

,則t1-

/2(fe

)=t0.95(21

)=2.0796,,于是三個(gè)水平均值的0.95置信區(qū)間分別為在單因子試驗(yàn)的數(shù)據(jù)分析中可得到如下三個(gè)結(jié)果:

因子是否顯著;

試驗(yàn)的誤差方差2的估計(jì);

諸水平均值i的點(diǎn)估計(jì)與區(qū)間估計(jì)。

在因子A顯著時(shí),通常只需對(duì)較優(yōu)的水平均值作參數(shù)估計(jì),在因子A不顯著場合,參數(shù)估計(jì)無需進(jìn)行。8.1.6重復(fù)數(shù)不等情形單因子方差分析并不要求每個(gè)水平下重復(fù)試驗(yàn)次數(shù)全相等,在重復(fù)數(shù)不等場合的方差分析與重復(fù)數(shù)相等情況下的方差分析極為相似,只在幾處略有差別。

數(shù)據(jù):設(shè)從第i個(gè)水平下的總體獲得mi個(gè)試驗(yàn)結(jié)果,記為yi1

,yi2…,yim

,i=1,2,…r,統(tǒng)計(jì)模型為:

(8.1.24)

總均值:諸i的加權(quán)平均(所有試驗(yàn)結(jié)果的均值的平均)(8.1.25)稱為總均值或一般平均。

效應(yīng)約束條件:

各平方和的計(jì)算:SA的計(jì)算公式略有不同

例8.1.4

某食品公司對(duì)一種食品設(shè)計(jì)了四種新包裝。為考察哪種包裝最受顧客歡迎,選了10個(gè)地段繁華程度相似、規(guī)模相近的商店做試驗(yàn),其中二種包裝各指

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論