版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第八章
方差分析與回歸分析
§8.1
方差分析§8.2
多重比較§8.3
方差齊性分析§8.4
一元線性回歸§8.5
一元非線性回歸
§8.1
單因子方差分析8.1.1
問(wèn)題的提出
實(shí)際工作中我們經(jīng)常碰到多個(gè)正態(tài)總體均值的比較問(wèn)題,處理這類(lèi)問(wèn)題通常采用所謂的方差分析方法。
例8.1.1
在飼料養(yǎng)雞增肥的研究中,某研究所提出三種飼料配方:A1是以魚(yú)粉為主的飼料,A2是以槐樹(shù)粉為主的飼料,A3是以苜蓿粉為主的飼料。為比較三種飼料的效果,特選24只相似的雛雞隨機(jī)均分為三組,每組各喂一種飼料,60天后觀察它們的重量。試驗(yàn)結(jié)果如下表所示:
表8.1.1
雞飼料試驗(yàn)數(shù)據(jù)
飼料A雞重(克)A110731009106010011002101210091028A21107109299011091090107411221001A310931029108010211022103210291048本例中,我們要比較的是三種飼料對(duì)雞的增肥作用是否相同。為此,把飼料稱為因子,記為A,三種不同的配方稱為因子A的三個(gè)水平,記為A1,A2,A3,使用配方Ai下第j只雞60天后的重量用yij表示,i=1,2,3,
j=1,2,,8。我們的目的是比較三種飼料配方下雞的平均重量是否相等,為此,需要做一些基本假定,把所研究的問(wèn)題歸結(jié)為一個(gè)統(tǒng)計(jì)問(wèn)題,然后用方差分析的方法進(jìn)行解決。
8.1.2
單因子方差分析的統(tǒng)計(jì)模型
在例8.1.1中我們只考察了一個(gè)因子,稱其為單因子試驗(yàn)。
通常,在單因子試驗(yàn)中,記因子為A,設(shè)其有r個(gè)水平,記為A1,A2,…,Ar,在每一水平下考察的指標(biāo)可以看成一個(gè)總體,現(xiàn)有r個(gè)水平,故有r個(gè)總體,
假定:每一總體均為正態(tài)總體,記為N(i
,
i2),
i=1,2,…,r;各總體的方差相同:1
2=22=…=
r2=
2
;從每一總體中抽取的樣本是相互獨(dú)立的,即所有的試驗(yàn)結(jié)果yij
都相互獨(dú)立。
我們要比較各水平下的均值是否相同,
即要對(duì)如下的一個(gè)假設(shè)進(jìn)行檢驗(yàn):H0
:1
=2=…=r
(8.1.1)
備擇假設(shè)為H1
:1,2,…,r
不全相等在不會(huì)引起誤解的情況下,H1通常可省略不寫(xiě)。如果H0成立,因子A的r個(gè)水平均值相同,稱因子A的r個(gè)水平間沒(méi)有顯著差異,簡(jiǎn)稱因子A不顯著;反之,當(dāng)H0不成立時(shí),因子A的r個(gè)水平均值不全相同,這時(shí)稱因子A的不同水平間有顯著差異,簡(jiǎn)稱因子A顯著。
為對(duì)假設(shè)(8.1.1)進(jìn)行檢驗(yàn),需要從每一水平下的總體抽取樣本,設(shè)從第i個(gè)水平下的總體獲得m個(gè)試驗(yàn)結(jié)果,記yij
表示第i個(gè)總體的第j次重復(fù)試驗(yàn)結(jié)果。共得如下n=rm個(gè)試驗(yàn)結(jié)果:yij,
i=1,2,…,r,j=1,2,…,m,
其中r為水平數(shù),m為重復(fù)數(shù),i為水平編號(hào),
j為重復(fù)編號(hào)。
在水平Ai下的試驗(yàn)結(jié)果yij與該水平下的指標(biāo)均值i一般總是有差距的,記ij
=yiji,
ij
稱為隨機(jī)誤差。于是有
yij
=
i+ij
(8.1.2)(8.1.2)式稱為試驗(yàn)結(jié)果yij
的數(shù)據(jù)結(jié)構(gòu)式。
單因子方差分析的統(tǒng)計(jì)模型:(8.1.3)
總均值與效應(yīng):
稱諸i的平均為總均值.
稱第i水平下的均值i與總均值
的差:
ai=i-為Ai的效應(yīng)。
模型(8.1.3)可以改寫(xiě)為
(8.1.8)
假設(shè)(8.1.1)可改寫(xiě)為
H0
:a1
=a2=…=ar=0(8.1.9)
8.1.3
平方和分解
一、試驗(yàn)數(shù)據(jù)通常在單因子方差分析中可將試驗(yàn)數(shù)據(jù)列成如下頁(yè)表格形式。表8.1.2中的最后二列的和與平均的含義如下:表8.1.2
單因子方差分析試驗(yàn)數(shù)據(jù)
因子水平
試驗(yàn)數(shù)據(jù)
和
平均
A1y11
y12
…y1mT1A2y21
y22
…y2mT2┆┆┆┆Aryr1
yr2
…yrmTrT數(shù)據(jù)間是有差異的。數(shù)據(jù)yij與總平均間的偏差可用yij
表示,它可分解為二個(gè)偏差之和(8.1.10)記二、組內(nèi)偏差與組間偏差由于(8.1.11)所以yij-僅反映組內(nèi)數(shù)據(jù)與組內(nèi)平均的隨機(jī)誤差,稱為組內(nèi)偏差;而(8.1.12)除了反映隨機(jī)誤差外,還反映了第i個(gè)水平的效應(yīng),稱為組間偏差。在統(tǒng)計(jì)學(xué)中,把k個(gè)數(shù)據(jù)y1,y2,…,yk分別對(duì)其均值=(y1+…+yk
)/k的偏差平方和稱為k個(gè)數(shù)據(jù)的偏差平方和,它常用來(lái)度量若干個(gè)數(shù)據(jù)分散的程度。三、偏差平方和及其自由度在構(gòu)成偏差平方和Q的k個(gè)偏差y1
,…,yk
間有一個(gè)恒等式,這說(shuō)明在Q中獨(dú)立的偏差只有k1個(gè)。在統(tǒng)計(jì)學(xué)中把平方和中獨(dú)立偏差個(gè)數(shù)稱為該平方和的自由度,常記為f,如Q的自由度為fQ=k1。自由度是偏差平方和的一個(gè)重要參數(shù)。
各yij間總的差異大小可用總偏差平方和
表示,其自由度為fT=n1;
四、總平方和分解公式僅由隨機(jī)誤差引起的數(shù)據(jù)間的差異可以用組內(nèi)偏差平方和表示,也稱為誤差偏差平方和,其自由度為fe=nr;由于組間差異除了隨機(jī)誤差外,還反映了效應(yīng)間的差異,故由效應(yīng)不同引起的數(shù)據(jù)差異可用組間偏差平方和表示,也稱為因子A的偏差平方和,其自由度為fA=r1;
定理8.1.1
在上述符號(hào)下,總平方和ST可以分解為因子平方和SA與誤差平方和Se之和,其自由度也有相應(yīng)分解公式,具體為:
ST=SA+Se,fT=fA+fe
(8.1.16)(8.1.16)式通常稱為總平方和分解式。
分析其中偏差平方和Q的大小與自由度有關(guān),為了便于在偏差平方和間進(jìn)行比較,統(tǒng)計(jì)上引入了均方和的概念,它定義為MS=Q/fQ
,其意為平均每個(gè)自由度上有多少平方和,它比較好地度量了一組數(shù)據(jù)的離散程度。如今要對(duì)因子平方和SA與誤差平方和Se之間進(jìn)行比較,用其均方和MSA=SA
/fA
,MSe=Se
/fe
進(jìn)行比較更為合理,故可用作為檢驗(yàn)H0的統(tǒng)計(jì)量。8.1.4檢驗(yàn)方法(2),進(jìn)一步,若H0成立,則有SA/
2~
2(r1)定理8.1.2
在單因子方差分析模型(8.1.8)及前述符號(hào)下,有(1)
Se/
2~
2(nr),從而E(Se)
=(nr)
2(3)SA與Se獨(dú)立。分析(1)自由度(2)當(dāng)成立時(shí),顯然(3)注意到與諸獨(dú)立為諸的函數(shù)故SA與Se獨(dú)立。由定理8.1.2,若H0成立,則檢驗(yàn)統(tǒng)計(jì)量F服從自由度為fA和fe的F分布,因此拒絕域?yàn)閃={FF1(fA
,fe)},通常將上述計(jì)算過(guò)程列成一張表格,稱為方差分析表。表8.1.3
單因子方差分析表來(lái)源平方和自由度均方和F比因子SAfA=r1MSA=SA/fAF=MSA/MSe誤差Sefe=nrMSe=Se/fe總和STfT=n1對(duì)給定的,可作如下判斷:若F
F1(fA
,fe)
,則說(shuō)明因子A不顯著。該檢驗(yàn)的p值也可利用統(tǒng)計(jì)軟件求出,若以Y記服從F(fA
,fe)的隨機(jī)變量,則檢驗(yàn)的
p值為p=P(YF)。如果F>F1(fA
,fe),則認(rèn)為因子A顯著;常用的各偏差平方和的計(jì)算公式如下:
(8.1.19)
一般可將計(jì)算過(guò)程列表進(jìn)行。
例8.1.2
采用例8.1.1的數(shù)據(jù),將原始數(shù)據(jù)減去1000,列表給出計(jì)算過(guò)程:表8.1.4例8.1.2的計(jì)算表水平數(shù)據(jù)(原始數(shù)據(jù)-1000)TiTi2A17396012129281943763610024A210792-101099074122158534222560355A3932980212232294835412531620984113350517791363利用(8.1.19),可算得各偏差平方和為:把上述諸平方和及其自由度填入方差分析表表8.1.5例8.1.2的方差分析表
來(lái)源平方和自由度均方和F比因子9660.083324830.04173.5948
誤差28215.9584211343.6171總和37876.041723若取=0.05,則F0.95
(2
,21)=3.47
,由于F=3.5948>3.47,故認(rèn)為因子A(飼料)是顯著的,即三種飼料對(duì)雞的增肥作用有明顯的差別。
8.1.5參數(shù)估計(jì)
在檢驗(yàn)結(jié)果為顯著時(shí),我們可進(jìn)一步求出總均值
、各主效應(yīng)ai和誤差方差2的估計(jì)。
一、點(diǎn)估計(jì)由模型(8.1.8)知諸yij相互獨(dú)立,且yij~N(+ai
,2)
,因此,可使用極大似然方法求出一般平均
、各主效應(yīng)ai和誤差方差2的估計(jì):由極大似然估計(jì)的不變性,各水平均值i的極大似然估計(jì)為,由于不是2的無(wú)偏估計(jì),可修偏:
由于,可給出Ai的水平均值i的1-的置信區(qū)間為
其中。
二、置信區(qū)間例8.1.3
繼續(xù)例8.1.2,此處我們給出諸水平均值的估計(jì)。因子A的三個(gè)水平均值的估計(jì)分別為從點(diǎn)估計(jì)來(lái)看,水平2(以槐樹(shù)粉為主的飼料)是最優(yōu)的。
誤差方差的無(wú)偏估計(jì)為利用(8.1.23)可以給出諸水平均值的置信區(qū)間。此處,,若?。?.05
,則t1-
/2(fe
)=t0.95(21
)=2.0796,,于是三個(gè)水平均值的0.95置信區(qū)間分別為在單因子試驗(yàn)的數(shù)據(jù)分析中可得到如下三個(gè)結(jié)果:
因子是否顯著;
試驗(yàn)的誤差方差2的估計(jì);
諸水平均值i的點(diǎn)估計(jì)與區(qū)間估計(jì)。
在因子A顯著時(shí),通常只需對(duì)較優(yōu)的水平均值作參數(shù)估計(jì),在因子A不顯著場(chǎng)合,參數(shù)估計(jì)無(wú)需進(jìn)行。8.1.6重復(fù)數(shù)不等情形單因子方差分析并不要求每個(gè)水平下重復(fù)試驗(yàn)次數(shù)全相等,在重復(fù)數(shù)不等場(chǎng)合的方差分析與重復(fù)數(shù)相等情況下的方差分析極為相似,只在幾處略有差別。
數(shù)據(jù):設(shè)從第i個(gè)水平下的總體獲得mi個(gè)試驗(yàn)結(jié)果,記為yi1
,yi2…,yim
,i=1,2,…r,統(tǒng)計(jì)模型為:
(8.1.24)
總均值:諸i的加權(quán)平均(所有試驗(yàn)結(jié)果的均值的平均)(8.1.25)稱為總均值或一般平均。
效應(yīng)約束條件:
各平方和的計(jì)算:SA的計(jì)算公式略有不同
例8.1.4
某食品公司對(duì)一種食品設(shè)計(jì)了四種新包裝。為考察哪種包裝最受顧客歡迎,選了10個(gè)地段繁華程度相似、規(guī)模相近的商店做試驗(yàn),其中二種包裝各指
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 河道填土施工方案
- 二零二五年度個(gè)人個(gè)人間環(huán)保項(xiàng)目借款合同模板3篇
- 2024年度醫(yī)療設(shè)備維保與售后服務(wù)綜合協(xié)議2篇
- 2025年度智能社區(qū)物業(yè)維修承包服務(wù)協(xié)議書(shū)3篇
- 二零二五年個(gè)人體育賽事贊助投資合同書(shū)3篇
- 2025版酒店客房用品采購(gòu)合同模板18篇
- 2025年度城市防洪排澇工程合同補(bǔ)充協(xié)議2篇
- 2025版梅縣區(qū)交通運(yùn)輸局道路客運(yùn)票價(jià)調(diào)整合同3篇
- 二零二五年度個(gè)人消費(fèi)貸款合同示范文本3篇
- 紅葉石楠施工方案
- 期末檢測(cè)(試題)-2024-2025學(xué)年三年級(jí)上冊(cè)數(shù)學(xué)人教版
- 低短路比場(chǎng)景下新能源場(chǎng)站構(gòu)網(wǎng)跟網(wǎng)變流器容量配比估算-
- 康復(fù)醫(yī)學(xué)治療技術(shù)士考試歷年真題
- JGJ/T 241-2011人工砂混凝土應(yīng)用技術(shù)規(guī)程
- 短視頻拍攝合作協(xié)議范本
- 2021-2022年云南省昆明市五華區(qū)人教版五年級(jí)上冊(cè)期末測(cè)試數(shù)學(xué)試卷
- 2024年《企業(yè)戰(zhàn)略管理》期末考試復(fù)習(xí)題庫(kù)(含答案)
- 部編人教版7-9年級(jí)語(yǔ)文目錄
- 人教版小學(xué)數(shù)學(xué)五年級(jí)上冊(cè)七單元《數(shù)學(xué)廣角-植樹(shù)問(wèn)題》單元集體備課整體設(shè)計(jì)
- 中國(guó)超重肥胖醫(yī)學(xué)營(yíng)養(yǎng)治療指南
- 嚴(yán)重精神障礙患者家屬護(hù)理教育
評(píng)論
0/150
提交評(píng)論