單因子方差分析_第1頁
單因子方差分析_第2頁
單因子方差分析_第3頁
單因子方差分析_第4頁
單因子方差分析_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、8.1 方差分析8.2 多重比較8.3 方差齊性分析8.4 一元線性回歸8.5 一元非線性回歸 8.1.1 問題的提出 實(shí)際工作中我們經(jīng)常碰到多個正態(tài)總體均值的比較問題,處理這類問題通常采用所謂的方差分析方法。 例8.1.1 在飼料養(yǎng)雞增肥的研究中,某研究所提出三種飼料配方:A1是以魚粉為主的飼料,A2是以槐樹粉為主的飼料,A3是以苜蓿粉為主的飼料。為比較三種飼料的效果,特選 24 只相似的雛雞隨機(jī)均分為三組,每組各喂一種飼料,60天后觀察它們的重量。試驗(yàn)結(jié)果如下表所示: 飼料A雞 重(克)A110731009106010011002101210091028A21107109299011091

2、090107411221001A310931029108010211022103210291048 本例中,我們要比較的是三種飼料對雞的增肥作用是否相同。為此,把飼料稱為因子,記為A,三種不同的配方稱為因子A的三個水平水平,記為A1, A2, A3,使用配方Ai下第 j 只雞60天后的重量用yij表示,i=1, 2, 3, j=1, 2, 8。我們的目的是比較三種飼料配方下雞的平均重量是否相等,為此,需要做一些基本假定,把所研究的問題歸結(jié)為一個統(tǒng)計問題,然后用方差分析的方法進(jìn)行解決。 在例8.1.1中我們只考察了一個因子,稱其為單因子試驗(yàn)。 通常,在單因子試驗(yàn)中,記因子為 A, 設(shè)其有r個水平

3、,記為A1, A2, Ar,在每一水平下考察的指標(biāo)可以看成一個總體 ,現(xiàn)有 r 個水平,故有 r 個總體, 假定:1)每一總體均為正態(tài)總體,記為 N(i , i 2), i1, 2, r ;2)各總體的方差相同: 1 2= 22= r2 = 2 ;3)從每一總體中抽取的樣本是相互獨(dú)立的, 即所有的試驗(yàn)結(jié)果 yij 都相互獨(dú)立。 我們要比較各水平下的均值是否相同, 即要對如下的一個假設(shè)進(jìn)行檢驗(yàn): H0 :1 =2 =r (8.1.1) 備擇假設(shè)為H1 :1, 2, , r 不全相等 在不會引起誤解的情況下, H1 通常可省略不寫。 如果H0成立,因子A的r個水平均值相同,稱因子A的r個水平間沒有

4、顯著差異,簡稱因子A不顯著;反之,當(dāng)H0不成立時,因子A的r個水平均值不全相同,這時稱因子A的不同水平間有顯著差異,簡稱因子A顯著。 為對假設(shè)(8.1.1)進(jìn)行檢驗(yàn),需要從每一水平下的總體抽取樣本,設(shè)從第i個水平下的總體獲得m個試驗(yàn)結(jié)果,記 yij 表示第i個總體的第j次重復(fù)試驗(yàn)結(jié)果。共得如下n=rm個試驗(yàn)結(jié)果:yij, i1, 2, r , j1, 2, , m, 其中r為水平數(shù),m為重復(fù)數(shù),i為水平編號, j 為重復(fù)編號。 在水平Ai下的試驗(yàn)結(jié)果yij與該水平下的指標(biāo)均值 i 一般總是有差距的,記 ij = yiji, ij 稱為隨機(jī)誤差。于是有 yij = i +ij (8.1.2) (

5、8.1.2)式稱為試驗(yàn)結(jié)果 yij 的數(shù)據(jù)結(jié)構(gòu)式。 單因子方差分析的統(tǒng)計模型: (8.1.3) 總均值與效應(yīng): 稱諸 i 的平均 為總均值. 稱第 i 水平下的均值 i 與總均值 的差: ai=i - 為 Ai 的效應(yīng)。 2,1,2,., ,1,2,.,(0,)ijiijijyir jmN諸相互獨(dú)立,且都服從1111(.)rriirr 模型(8.1.3)可以改寫為 (8.1.8) 假設(shè)(8.1.1)可改寫為 H0 :a1 =a2 =ar =0 (8.1.9) 12,1,2,., ,1,2,.,0N(0,)ijiijriiijyair jma相互獨(dú)立,且都服從一、試驗(yàn)數(shù)據(jù) 通常在單因子方差分析中

6、可將試驗(yàn)數(shù)據(jù)列成如下頁表格形式。表8.1.2中的最后二列的和與平均的含義如下:.111,2,miiijijriiTTyyirmTTTTyr mnnr m總試驗(yàn)次數(shù)因子水平 試 驗(yàn) 數(shù) 據(jù) 和 平均 A1y11 y12 y1m T1A2y21 y22 y2mT2Aryr1 yr2 yrmTrT1y2yyry 數(shù)據(jù)間是有差異的。數(shù)據(jù)yij與總平均 間的偏差可用yij 表示,它可分解為二個偏差之和 (8.1.10) 記二、組內(nèi)偏差與組間偏差.()()ijijiiyyyyyy.1111111,mrrmiijiijjiijmrnyy 由于 (8.1.11) 所以yij - 僅反映組內(nèi)數(shù)據(jù)與組內(nèi)平均的隨機(jī)

7、誤差,稱為組內(nèi)偏差;而 (8.1.12) 除了反映隨機(jī)誤差外,還反映了第i個水平的效應(yīng),稱為組間偏差。.()()ijiiijiiijiyyiy.()()iiiiiyya. iyy在統(tǒng)計學(xué)中,把k個數(shù)據(jù)y1 , y2 , , yk分別對其均值 =(y1+ + yk )/k 的偏差平方和 稱為k個數(shù)據(jù)的偏差平方和,它常用來度量若干個數(shù)據(jù)分散的程度。三、偏差平方和及其自由度y22211()()()kkiiQyyyyyy在構(gòu)成偏差平方和Q的k個偏差y1 , , yk 間有一個恒等式 ,這說明在Q中獨(dú)立的偏差只有k1個。在統(tǒng)計學(xué)中把平方和中獨(dú)立偏差個數(shù)稱為該平方和的自由度,常記為f,如Q的自由度為fQ=

8、k1。自由度是偏差平方和的一個重要參數(shù)。 yy1()0kiiyy各yij間總的差異大小可用總偏差平方和 表示,其自由度為fT=n1; 四、總平方和分解公式 僅由隨機(jī)誤差引起的數(shù)據(jù)間的差異可以用 組內(nèi)偏差平方和 表示, 也稱為誤差偏差平方和,其自由度為 fe=nr ;211()rmTijijSyy 2.11()rmeijiijSyy由于組間差異除了隨機(jī)誤差外,還反映了效應(yīng)間的差異,故由效應(yīng)不同引起的數(shù)據(jù)差異可用組間偏差平方和 表示,也稱為因子A的偏差平方和,其自由度為 fA=r1; 2.1()rAiiSmyy定理8.1.1 在上述符號下,總平方和ST可以分解為因子平方和SA與誤差平方和Se之和,

9、其自由度也有相應(yīng)分解公式,具體為: ST =SA +Se , fT =fA +fe (8.1.16) (8.1.16)式通常稱為總平方和分解式。 211()rmTijijSyy 2.1()rAiiSmyy2.11()rmeijiijSyy211()rmTijijSyy 分析211()rmijiiijyyyy 112()()rmAeijiiijSSyyyy 其中112()()rmijiiijyyyy 112()()rmiijiijyyyy0 偏差平方和Q的大小與自由度有關(guān),為了便于在偏差平方和間進(jìn)行比較,統(tǒng)計上引入了均方和的概念,它定義為MS=Q/fQ ,其意為平均每個自由度上有多少平方和,它比

10、較好地度量了一組數(shù)據(jù)的離散程度。 如今要對因子平方和 SA 與誤差平方和 Se 之間進(jìn)行比較,用其均方和 MSA= SA /fA , MSe= Se /fe 進(jìn)行比較更為合理,故可用 作為檢驗(yàn)H0的統(tǒng)計量。8.1.4 檢驗(yàn)方法/AAAeeeMSSfFMSSf(2) ,進(jìn)一步,若H0成立,則有SA/ 2 2(r1) 221()(1)rAiiE Srma定理8.1.2 在單因子方差分析模型 (8.1.8) 及前述符號下,有(1) Se / 2 2(nr) ,從而E(Se ) (nr) 2 (3) SA與Se獨(dú)立。.()()ijiiijiiijiyy2.11()rmeijiijSyy分析 (1)2.

11、11()rmieijijS自由度(1)r mnr22()eSnr(2).()()iiiiiyya2.1()rAiiSmyy2.1()() )riAiiE SmEa22.111() )2()rrriiiiiiimamEma E221(1)riimamrm221(1)riimar當(dāng) 成立時,顯然0H22.221()(1)rAiimSr(3) 注意到2.11()rmieijijS2.1()riAiSm與諸 獨(dú)立. i為諸 的函數(shù). i故SA與Se獨(dú)立。由定理8.1.2,若H0成立,則檢驗(yàn)統(tǒng)計量F服從自由度為fA和fe的F分布,因此拒絕域?yàn)閃=FF1 (fA ,fe),通常將上述計算過程列成一張表格,

12、稱為方差分析表。表8.1.3 單因子方差分析表來源平方和 自由度均方和F比因子SAfA=r1MSA= SA/fAF MSA/ MSe誤差Sefe=nrMSe= Se/fe總和STfT=n1對給定的,可作如下判斷: 若F F1 (fA ,fe) ,則說明因子A不顯著。 該檢驗(yàn)的p值也可利用統(tǒng)計軟件求出,若 以Y記服從F(fA ,fe)的隨機(jī)變量,則檢驗(yàn)的 p 值為 p=P(YF)。 如果 F F1 (fA ,fe),則認(rèn)為因子A顯著;常用的各偏差平方和的計算公式如下: (8.1.19) 一般可將計算過程列表進(jìn)行。 22112211rmTijijrAiieTATSynTSTmnSSS例8.1.2

13、采用例8.1.1的數(shù)據(jù),將原始數(shù)據(jù)減去1000, 列表給出計算過程: 表8.1.4 例8.1.2的計算表水平數(shù)據(jù)(原始數(shù)據(jù)-1000)TiTi2A173 96012129281943763610024A210792-101099074122158534222560355A393 298021223229483541253162098411335051779136321mijjy 利用(8.1.19),可算得各偏差平方和為: 把上述諸平方和及其自由度填入方差分析表2211339136337876.0417,24 1 2324505177 11339660.0833,3 1282437876.04

14、17 9660.0833 28215.9584,3(8 1) 21TTAAeTAeSfSfSSSf 表8.1.5 例8.1.2的方差分析表 來源平方和自由度均方和F比因子9660.083324830.04173.5948 誤差28215.9584211343.6171總和37876.041723若取=0.05,則F0.95 (2 ,21)=3.47 ,由于F=3.59483.47,故認(rèn)為因子A(飼料)是顯著的,即三種飼料對雞的增肥作用有明顯的差別。 在檢驗(yàn)結(jié)果為顯著時,我們可進(jìn)一步求出總均值 、各主效應(yīng)ai和誤差方差 2的估計。 一、點(diǎn)估計由模型(8.1.8)知諸yij相互獨(dú)立,且yij N(

15、+ ai , 2) ,因此, 可使用極大似然方法求出一般平均 、各主效應(yīng)ai和誤差方差 2的估計:由極大似然估計的不變性,各水平均值i的極大似然估計為 ,由于 不是 2的無偏估計,可修偏: .iiy2M2eMS.2211,1,1()iirmeMijijyayyirSyynn 由于 ,可給出Ai的水平均值i的1- 的置信區(qū)間為 其中 。 .() ()/iieeem yt fSf二、置信區(qū)間.1/2.1/2()/,()/ieieytfmytfm2eMS例8.1.3 繼續(xù)例8.1.2,此處我們給出諸水平均值的估計。因子A的三個水平均值的估計分別為 從點(diǎn)估計來看,水平2(以槐樹粉為主的飼料)是最優(yōu)的。

16、 12319410001024.25,858510001073.125,835410001044.25,8 誤差方差的無偏估計為 利用(8.1.23)可以給出諸水平均值的置信區(qū)間。此處, ,若取0.05 ,則t1- /2( fe )= t0.95( 21 )=2.0796, ,于是三個水平均值的0.95置信區(qū)間分別為21343.6171eMS1343.6171 36.65540.975(21)/8 26.9509t123:1024.25 26.9509 = 997.2891, 1051.2109,:1073.125 26.9509 = 1046.1741, 1100.0759,:1044.25

17、 26.9509 = 1017.2891, 1071.2109. 在單因子試驗(yàn)的數(shù)據(jù)分析中可得到如下三個結(jié)果: 因子是否顯著; 試驗(yàn)的誤差方差 2的估計; 諸水平均值i的點(diǎn)估計與區(qū)間估計。 在因子A顯著時,通常只需對較優(yōu)的水平均值作參數(shù)估計,在因子A不顯著場合,參數(shù)估計無需進(jìn)行。8.1.6 重復(fù)數(shù)不等情形 單因子方差分析并不要求每個水平下重復(fù)試驗(yàn)次數(shù)全相等,在重復(fù)數(shù)不等場合的方差分析與重復(fù)數(shù)相等情況下的方差分析極為相似,只在幾處略有差別。 數(shù)據(jù):設(shè)從第i個水平下的總體獲得mi個試驗(yàn)結(jié)果,記為yi1 , yi2 , yim ,i=1,2, r,統(tǒng)計模型為: (8.1.24) 2,1,2,., ,

18、1,2,.,(0,)ijiijiijyirjmN各相互獨(dú)立,且都服從總均值:諸i的加權(quán)平均(所有試驗(yàn)結(jié)果的均值的平均) (8.1.25) 稱為總均值或一般平均。 效應(yīng)約束條件: 各平方和的計算: SA的計算公式略有不同 222.11()rriAiiiiiTTSm yymn10riiima11111(.)rrriiimmmnn例8.1.4 某食品公司對一種食品設(shè)計了四種新包裝。為考察哪種包裝最受顧客歡迎,選了10個地段繁華程度相似、規(guī)模相近的商店做試驗(yàn),其中二種包裝各指定兩個商店銷售,另二個包裝各指定三個商店銷售。在試驗(yàn)期內(nèi)各店貨架排放的位置、空間都相同,營業(yè)員的促銷方法也基本相同,經(jīng)過一段時間,記錄其銷售量數(shù)據(jù),列于表8.1.6左半邊,其相應(yīng)的計算結(jié)果列于右側(cè)。 包裝類型 銷售量 miTiTi2 / miA112214 123

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論