




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第9章雙因素及多因素方差分析19.1雙因素方差分析中的一些基本概念9.2固定模型9.3隨機(jī)模型9.4混合模型9.5兩個(gè)以上因素的方差分析9.6缺失數(shù)據(jù)的估計(jì)9.7數(shù)據(jù)轉(zhuǎn)換9.8雙因素嵌套分組方差分析29.1雙因素方差分析中的一些基本概念9.1.1模型類型9.1.2主效應(yīng)與交互作用9.1.3雙因素交叉分組實(shí)驗(yàn)設(shè)計(jì)的一般格式34前一章講了單因素實(shí)驗(yàn)的方差分析。實(shí)際工作中常遇到兩個(gè)或兩個(gè)以上因素共同影響實(shí)驗(yàn)結(jié)果的情況。雙因素實(shí)驗(yàn)有交叉分組(crossedclassification)和嵌套分組(nestedclassification,也稱分層分組hierarchicalclassification)兩種形式。本章內(nèi)容以交叉分組為主。例如:一組患者同時(shí)服用同種藥物,每一種藥物有不同劑量(水平),通過(guò)實(shí)驗(yàn)選出這兩種藥物的最佳配伍劑量。假設(shè)A藥物有a水平,B藥物b水平,共有ab個(gè)劑量組合,每一組合重復(fù)n次(簡(jiǎn)便起見(jiàn),只介紹等重復(fù)情況)。共有abn名患者參加實(shí)驗(yàn)。這樣的實(shí)驗(yàn)設(shè)計(jì)稱為交叉分組設(shè)計(jì)。對(duì)于雙因素交叉分組設(shè)計(jì)的實(shí)驗(yàn)應(yīng)采用雙因素方差分析(two-wayANOVA)方法分析實(shí)驗(yàn)結(jié)果。59.1.1模型類型在雙因素實(shí)驗(yàn)中,當(dāng)兩個(gè)因素都是固定因素時(shí),稱為固定模型(fixedmodel);兩個(gè)因素均為隨機(jī)因素時(shí)稱為隨機(jī)模型(randommodel);兩個(gè)因素中一個(gè)是固定因素,另一個(gè)是隨機(jī)因素時(shí)稱為混合模型(mixedmodel)。這三種模型在計(jì)算時(shí)沒(méi)有多大不同,不同之處在于:(1)設(shè)計(jì)實(shí)驗(yàn)時(shí),特別是各因素水平的獲得時(shí)卻有很大區(qū)別;(2)它們的均方期望不同,因此檢驗(yàn)方法和對(duì)結(jié)果解釋都存在極大不同。9.1.2主效應(yīng)與交互作用雙因素實(shí)驗(yàn)中,出現(xiàn)了兩個(gè)新的名詞,即主效應(yīng)(maineffect)和交互作用(interaction)。例如一組實(shí)驗(yàn),A因素有兩個(gè)水平A1和A2,B因素也有兩個(gè)水平B1和B2,共4個(gè)水平組合,效應(yīng)值分別為18,24,37和44。
A1A2B11824B23844由于因素水平的改變而造成因素效應(yīng)的改變,稱為該因素的主效應(yīng)。根據(jù)定義,A因素的主效應(yīng)為A2水平的平均效應(yīng)減去A1水平的平均效應(yīng),即6同樣,B因素的主效應(yīng)為:當(dāng)A1B1+A2B2A1B2+A2B1時(shí),A,B
之間不存在交互作用。這里A1B1+A2B262,A1B2+A2B162。因此A,B之間不存在交互作用。有時(shí),某一因素在另一因素的不同水平上所產(chǎn)生的效應(yīng)不同。例如:
A1A2B11828B23022A(在B1水平上)A2B1-A1B128-1810A(在B2水平上)A2B2-A1B222-30-8可以明顯看出,A的效應(yīng)依B的水平不同而不同,即,在A和B兩素間存在交互作用。7交互作用的大小可用A1B1+A2B2-A1B2-A2B1來(lái)估計(jì)。上例的A,B
間的交互作用:AB18+22-30-28-18。
有時(shí)交互作用相當(dāng)大,因素的主效應(yīng)相對(duì)來(lái)說(shuō)變得相當(dāng)小。在上面例子中A的主效應(yīng):與交互作用的絕對(duì)值18相比已經(jīng)相當(dāng)小,這時(shí)可以認(rèn)為不存在A因素的主效應(yīng)。因素水平少時(shí)以上方法簡(jiǎn)單地直觀判定主效應(yīng)和交互作用,但因素水平多時(shí)不易計(jì)算,可通過(guò)圖形直觀判斷。8因素間存在交互作用時(shí),對(duì)因素間交互作用的了解比只了解因素的主效應(yīng)重要得多。因此,在雙因素方差分析中,分解出因素的交互作用十分必要,兩因素間是否存在交互作用,有專門的統(tǒng)計(jì)判斷方法。
一般情況下,可根據(jù)專業(yè)知識(shí)判斷。另外,作圖法也能提供一些幫助。將上兩表中的數(shù)據(jù),作成以下兩圖。9當(dāng)A,B之間不存在交互作用時(shí),從B1變化到B2是不依A水平的不同而改變的,所以B1-B1,B2-B2兩線平行(如圖9-1a)。當(dāng)A,B之間存在交互作用時(shí),A的效應(yīng)依B的水平而不同,所以B1-B1,B2-B2兩線不平行(如圖9-1b)。直觀圖可以幫助判斷因素之間是否存在交互作用,是two-wayANOWA的直觀理解。但在處理數(shù)據(jù)時(shí)只憑圖像是不行的。由于實(shí)驗(yàn)誤差的干擾,需要經(jīng)過(guò)嚴(yán)格的數(shù)據(jù)分析之后,才能最后斷定因素之間是否存在交互作用。109.1.3雙因素交叉分組實(shí)驗(yàn)設(shè)計(jì)的一般格式雙因素實(shí)驗(yàn)的典型設(shè)計(jì)是:假設(shè)A因素有a水平,B因素b水平,則每一次重復(fù)都包括ab次實(shí)驗(yàn),并設(shè)實(shí)驗(yàn)重復(fù)n次,則實(shí)驗(yàn)總次數(shù)為abn次。yijk表示A因素第i水平,B因素第j水平和第k次重復(fù)的觀測(cè)值。數(shù)據(jù)將以表9-1的形式出現(xiàn)。11表9-1雙因素交叉分組實(shí)驗(yàn)的一般格式因素B
j1,2,…,b和B1B2…BbA1y111y121…y1b1因y112y122y1b2素┆┆┆Ay11ny12n…y1bny1..iA2y211y221…y2b1‖y212y222y2b21,┆┆┆2,y21ny22n…y2bny2..┆,┆┆┆…┆aAaya11ya21…yab1ya12ya22yab2┆┆┆ya1nya2n…yabnya..
和y.1.y.2.…y.b.y…12符號(hào)說(shuō)明:yi..為A
因素第i水平的所有觀測(cè)值的和;y.j.為B因素第j水平所有觀測(cè)值的和;yij.為A的第i水平和B的第j水平(在實(shí)驗(yàn)中體現(xiàn)為一個(gè)處理)的所有觀測(cè)值(同一處理的所有重復(fù))的和;y…為全部觀測(cè)值的總和。即:上表中A
和B可以是固定型因素,也可以是隨機(jī)型因素,因而引出三種不同的統(tǒng)計(jì)模型。13在這里需要特別強(qiáng)調(diào)重復(fù)實(shí)驗(yàn)這一概念。看過(guò)表9-1之后往往給人一種印象,似乎用AB每一組合處理之后,重復(fù)測(cè)定n個(gè)數(shù)據(jù)即構(gòu)成n次重復(fù),這樣的認(rèn)識(shí)是不對(duì)的。為了更形象化地理解重復(fù),把表9-1這樣的表重復(fù)編制n張,每一張上只有一套水平組合,n張表重疊起來(lái)便構(gòu)成n次重復(fù)。換句話說(shuō),所謂重復(fù)實(shí)驗(yàn)應(yīng)當(dāng)是每一次實(shí)驗(yàn)都需從頭開始完整地做一遍(即為真重復(fù)),得到ab個(gè)結(jié)果,這樣的實(shí)驗(yàn)工作n遍得到abn個(gè)數(shù)據(jù)。重復(fù)實(shí)驗(yàn)的誤差均方反映了在整個(gè)實(shí)驗(yàn)過(guò)程中由于各種因素所引起的誤差;而重復(fù)測(cè)定的“誤差”均方只反映了由于不同次測(cè)定所引起的誤差。以重復(fù)測(cè)定代替重復(fù)實(shí)驗(yàn)(為假重復(fù)),會(huì)減少誤差均方,有可能使本來(lái)并不顯著的因素變得顯著了。149.2固定模型9.2.1線性統(tǒng)計(jì)模型9.2.2平方和與自由度的分解9.2.3均方期望與統(tǒng)計(jì)量F的確定9.2.4平方和的簡(jiǎn)易計(jì)算方法9.2.5無(wú)重復(fù)實(shí)驗(yàn)時(shí)的雙因素方差分析9.2.6交互作用的判斷9.2.7多重比較159.2.1線性統(tǒng)計(jì)模型Two-wayANOVA中觀測(cè)值用線性統(tǒng)計(jì)模型描述:其中,是總平均效應(yīng),i是A因素第i水平的處理效應(yīng),j是B因素第j水平上的處理效應(yīng),()ij是在A因素第i水平和B因素第j水平之間交互作用的效應(yīng),ijk是隨機(jī)誤差成分。對(duì)于固定因素,處理效應(yīng)是各處理平均數(shù)距總平均數(shù)的離差。因此,16固定模型的交互作用效應(yīng)也是固定的,即
ijk是相互獨(dú)立且服從N(0,2)的隨機(jī)變量。雙因素交叉分組設(shè)計(jì)中,固定模型方差分析的零假設(shè)為:179.2.2平方和與自由度的分解方差分析的基本思想,仍然是將總平方和分解。乘積項(xiàng)均為0。于是,總平方和被分解為4項(xiàng):由于A因素所引起的平方和SSA,B因素所引起的平方和SSB,A和B交互作用所引起的平方和SSAB及誤差平方和SSE。分別是:18從(9.13)式可以看出,為了得到誤差平方和,至少要重復(fù)兩次。有了誤差平方和,才能把誤差與交互作用分解開。19與每一平方和相應(yīng)的自由度為:Aa-1Bb-1AB交互作用(a-1)(b-1)誤差ab(n-1)總和abn-1其中總自由度、A
因素自由度和B因素自由度比較簡(jiǎn)單,分別為abn-1,a-1和b-1。交互作用的自由度,是兩因素全部水平的組合數(shù)減1,再減A,B主效應(yīng)自由度,即(ab-1)-(a-1)-(b-1)=(a-1)(b-1)。誤差自由度在每一因素組合內(nèi)是n-1。共有ab種組合,故為ab(n-1)。各項(xiàng)的均方分別為:209.2.3均方期望與統(tǒng)計(jì)量F的確定記21于是故零假設(shè)也可表示為:仍用F作為檢驗(yàn)H01,H02和H03的統(tǒng)計(jì)量。對(duì)于因素A使用做檢驗(yàn)。只有2等于0時(shí),MSA才是2的無(wú)偏估計(jì)量。若分子遠(yuǎn)遠(yuǎn)大于分母,即F>F時(shí),則20,從而拒絕H01。用類似的方法,做關(guān)于H02和H03的推斷。利用下述公式,可估計(jì)出,i,j,()ij。22雙因素固定模型方差分析表如下:表9-2固定模型方差分析表(因素A、B固定型)變差來(lái)源平方和自由度均方F均方期望A因素SSAa-1MSAB因素SSBb-1MSBAB交互作用SSAB(a-1)(b-1)MSAB誤差SSEab(n-1)MSE總和SSTabn-1
239.2.4平方和的簡(jiǎn)易計(jì)算方法實(shí)際計(jì)算平方和時(shí),可將(9.9~11)式轉(zhuǎn)化成:誤差平方和通過(guò)計(jì)算重復(fù)平方和得到。(9.13)可改寫為:由總平方和減去A因素、B因素及誤差平方和,殘余項(xiàng)即為交互作用平方和:稱為校正項(xiàng),用C表示。24例9.1
為了從3種不同原料(發(fā)酵助劑)和3種不同發(fā)酵溫度中選出最適宜的條件,設(shè)計(jì)了一個(gè)雙因素實(shí)驗(yàn),并得到以下結(jié)果(表9-3)。在這個(gè)實(shí)驗(yàn)中,各處理的發(fā)酵基質(zhì)完全相同。溫度有3個(gè)水平,原料有3個(gè)水平,且均為固定因素。每一處理重復(fù)4次。產(chǎn)量為mL數(shù)(終產(chǎn)物濃度調(diào)整至相同)。分析溫度和原料及其交互作用對(duì)產(chǎn)量的影響。解:這是一個(gè)有重復(fù)的雙因素交叉分組固定模型實(shí)驗(yàn)設(shè)計(jì)。可以使用two-wayANOVA處理數(shù)據(jù)(與one-wayANOVA一樣,先要進(jìn)行方差齊性(同質(zhì)性)檢驗(yàn),此處略,后面的有重復(fù)的例子也是這樣)。將表中每一數(shù)據(jù)減去30,編碼列成表9-4a,利用yij.列成表9-4b。25表9-3用不同原料與不同溫度發(fā)酵的乙醇產(chǎn)量(mL)原料種類(A)溫度B30oC35oC40oC141116491322232526252418247438593822503318403614343553035383353472650441926表9-4發(fā)酵實(shí)驗(yàn)方差分析計(jì)算表(a)原料A溫度Byij1yij2yij3yij4yij.yij.2
1301119-7-51832455635-19-17-5-6-47220971140-24-8-4-12-48230480023017292010765776163035138363090027840-22-8-12-16-5833649483301352320613721112335258171464409611744003-4-11-12144146
∑=84228387366(b)
溫度Byi..yi..2
303540原料A118-47-48-77592927630-5848230436164-1211312769y.j.15547-1188421002y.j.22402522091392440158
27列成方差分析表:由表9-4a,可以計(jì)算出:由表9-4b,可以計(jì)算出:28表9-5發(fā)酵實(shí)驗(yàn)方差分析表變差來(lái)源平方和自由度均方F原料A1554.172777.0912.67**溫度B3150.5021575.2525.68**AB808.834202.213.30*誤差1656.502761.35總和7170.0035
注:**0.01,*0.05。表9-5中數(shù)據(jù)顯示:原料和溫度在=0.01水平上拒絕H0,交互作用在0.05水平上拒絕H0。因此乙醇的產(chǎn)量,不僅與原料及發(fā)酵溫度有關(guān),而且與兩者的交互作用也有關(guān)。29圖9-2為原料與溫度的交互作用圖??梢钥闯鋈龡l折線的非平行關(guān)系。例如,30oC時(shí),原料2的產(chǎn)量高于原料3,而35
oC時(shí)原料2的產(chǎn)量反而低于原料3。因此,在選擇因素的最優(yōu)水平時(shí),一定要考慮交互作用產(chǎn)生的影響。30由于交互作用的存在,在固定模型中,每一處理都應(yīng)該設(shè)置重復(fù)。重復(fù)之間的平方和為誤差平方和。有了誤差平方和,才能把交互作用從總平方和中分解出來(lái)。SSABSST-SSA-SSB-SSE如果不設(shè)重復(fù),得到殘余(residual)項(xiàng)平方和:SS殘余SST-SSA-SSB包括由誤差及交互作用兩部分所引起的平方和,2和2混雜在一起無(wú)法分開。因此,在因素間存在交互作用時(shí),不設(shè)重復(fù)的實(shí)驗(yàn)是無(wú)意義的。319.2.5無(wú)重復(fù)實(shí)驗(yàn)時(shí)的雙因素方差分析如果根據(jù)經(jīng)驗(yàn)或?qū)I(yè)知識(shí),可以判斷兩因素間確實(shí)無(wú)交互作用,也可以不設(shè)重復(fù)(n1)。不設(shè)重復(fù)可以大大減少工作量,也可能達(dá)到同樣的效果。在交叉分組的雙因素實(shí)驗(yàn)中,若因素間不存在交互作用,觀測(cè)值的線性模型是:其中,ij為相互獨(dú)立且服從正態(tài)分布N(0,2)的隨機(jī)變量。零假設(shè)為:H01:i0;H02:j0均方的數(shù)學(xué)期望分別為:32檢驗(yàn)A因素使用的統(tǒng)計(jì)量:檢驗(yàn)B因素使用的統(tǒng)計(jì)量:下面舉一個(gè)無(wú)交互作用的雙因素方差分析的例子。33例9.2表9-6記載了4種種植密度和4種施肥量的小麥大區(qū)產(chǎn)量,現(xiàn)在需判斷不同施肥量,不同種植密度對(duì)產(chǎn)量是否有顯著的影響。表9-64種種植密度和4種施肥量的小麥產(chǎn)量方差分析計(jì)算表施肥量
1234密度1546578813815260070386185435486828158524551690831853解:密度和施肥量都是固定型因素。根據(jù)經(jīng)驗(yàn),密度與施肥量之間不存在交互作用。將表9-6中的每一個(gè)yij都減去700,列成表9-7。
3435方差分析結(jié)果列成下表:表9-8例9.2小麥種植密度和施肥量的方差分析表變差來(lái)源平方和自由度均方F密度9111.533037.175.08*施肥量222773.5374257.83124.25**誤差5379.09597.67總和237264.015
注:*0.05。**0.01。結(jié)論:密度間的產(chǎn)量差異在0.05水平上顯著,施肥量之間的產(chǎn)量差異在0.01水平上顯著。再經(jīng)多重比較,便可從選定的水平中選出最佳密度和最佳施肥量。369.2.6交互作用的判斷為了幫助確定因素間是否存在交互作用,可以用Tukey提供的方法判斷。做法是將殘余平方和(SST-SSA-SSB)分解為具1自由度的非累加(交互作用)的成分和具(a-1)(b-1)-1自由度的誤差成分。公式為:為了檢驗(yàn)交互作用的存在,計(jì)算37例9.3判斷例9.2中的密度與施肥量間是否存在交互作用。解:根據(jù)表9-7中的數(shù)據(jù)計(jì)算因此,沒(méi)有充分根據(jù)說(shuō)明數(shù)據(jù)間存在交互作用。389.2.7多重比較在固定效應(yīng)模型中,若主效應(yīng)顯著,還應(yīng)當(dāng)在每一因素的各水平的平均數(shù)之間做多重比較。仍然使用Duncan多重極差檢驗(yàn)。然而,如果交互作用顯著,那么某個(gè)因素(例如A)各水平的平均數(shù)之間的比較,由于AB交互作用的影響而難于進(jìn)行。解決這一問(wèn)題的一種方法是,將B固定在某一水平上,在那個(gè)特定水平上,比較A因素各水平的平均數(shù)。例如,將例9.1中的A因素(原料)固定在原料2上,比較不同溫度對(duì)產(chǎn)量的影響。把產(chǎn)量由高到低排列:39因?yàn)槊恳惶幚砭?次重復(fù),標(biāo)準(zhǔn)誤差分別求出r0.05和r0.01的Rk值列成下表:用平均數(shù)的差與Rk值做比較,得到多重比較結(jié)果:40可以看出,在原料2上,溫度1(30
oC)與溫度2(35
oC)產(chǎn)量的差異剛剛達(dá)到顯著,而溫度1(30
oC)與溫度3(40
oC)及溫度2(35
oC)與溫度3(40
oC),產(chǎn)量的差異均已達(dá)到極顯著。如果考慮交互作用的話,就要比較全部ab次處理,才能得出哪一些差異是顯著的。這樣比較的結(jié)果不僅包括主效應(yīng),而且包括交互作用。在上面的例子中,如果在9個(gè)處理的所有對(duì)之間做比較,將要做
36次。419.3隨機(jī)模型9.3.1線性統(tǒng)計(jì)模型9.3.2均方期望與統(tǒng)計(jì)量F的確定429.3.1線性統(tǒng)計(jì)模型如果因素A和因素B都是隨機(jī)因素,則構(gòu)成隨機(jī)模型。例如,將同一種作物種在地力條件均一的不同小區(qū)上,施以不同數(shù)量的農(nóng)家肥,由隨機(jī)抽出的三名農(nóng)工進(jìn)行管理??疾椴煌┓柿亢筒煌r(nóng)工對(duì)作物產(chǎn)量的影響。不同農(nóng)工是隨機(jī)抽出來(lái)的,屬隨機(jī)因素。農(nóng)家肥的肥力水平是很難人為控制的,即使施用相同的數(shù)量,其效應(yīng)值也不會(huì)完全相同,因此肥料也是隨機(jī)因素。隨機(jī)模型的每一觀測(cè)值,可用以下線性統(tǒng)計(jì)模型描述:43其中模型參數(shù)i,j,()ij和ijk都是隨機(jī)變量。i服從NID(0,2),j服從NID(0,2),()ij服從NID(0,2)和ijk服從NID(0,2)。因此任何觀測(cè)值的方差為:var(yijk)=2+2+2+2零假設(shè)分別是:H01:2=0,H02:2=0,H03:2=0449.3.2均方期望與統(tǒng)計(jì)量F的確定隨機(jī)模型的方差分析方法與固定模型一樣,分別計(jì)算出SST,SSA,SSB和SSE。為了得到統(tǒng)計(jì)量,必須求出各均方的數(shù)學(xué)期望:從均方的數(shù)學(xué)期望可以看出,對(duì)H03:20的檢驗(yàn)統(tǒng)計(jì)量應(yīng)當(dāng)是:45與F(a-1)(b-1),ab(n-1),做比較,當(dāng)FAB<F時(shí),MSAB與MSE都是2的無(wú)偏估計(jì)量,接受H03:20的假設(shè)。這時(shí)應(yīng)將SSAB和SSE合并,相應(yīng)的自由度也做同樣合并。用合并的平方和與合并的自由度求出合并后的均方,用合并后的均方檢驗(yàn)因素A和因素B的效應(yīng)。若FAB>F,MSAB不是2的無(wú)偏估計(jì)量,拒絕H03:20的假設(shè)。這時(shí),對(duì)于H01:20的假設(shè),使用統(tǒng)計(jì)量做檢驗(yàn)。使用統(tǒng)計(jì)量檢驗(yàn)H02:20的假設(shè)。注意:這里使用的統(tǒng)計(jì)量與固定效應(yīng)模型不同。隨機(jī)效應(yīng)模型的方差分析表如下:46表9-11隨機(jī)效應(yīng)模型的方差分析表(因素A、B隨機(jī)型)變差來(lái)源平方和自由度均方F均方期望A因素SSAa-1MSAB因素SSBb-1MSBAB交互作用SSAB(a-1)(b-1)MSAB誤差SSEab(n-1)MSE總和SSTabn-1
47例9.4為了研究施用不同數(shù)量的農(nóng)家肥及不同農(nóng)工的田間管理對(duì)作物產(chǎn)量的影響,設(shè)計(jì)了一個(gè)雙因素試驗(yàn),試驗(yàn)結(jié)果列于下表。分析農(nóng)家肥和農(nóng)工對(duì)作物產(chǎn)量的影響。解:前面已經(jīng)說(shuō)過(guò),這是一隨機(jī)模型。隨機(jī)模型的各項(xiàng)平方和的計(jì)算與固定模型是一樣的。將上表中的每一個(gè)yijk均減去9.5,列成表9-13a。利用yij.列,列成表9-13b。48yij1
yij2
yij.
yij.249yi..
yi..2y.j.
y.j.250列成方差分析表:表9-14作物產(chǎn)量方差分析表變差來(lái)源平方和自由度均方F施肥量A23.880837.960247.39**(F3,6,0.019.78)農(nóng)工B0.814920.40742.43(F2,6,0.055.14)AB1.007660.16801.08(F6,12,0.053.00)誤差1.8612120.1551總和27.564523
注:**0.01。51由方差分析表看出,不同農(nóng)工的田間管理對(duì)產(chǎn)量沒(méi)有顯著影響,但不同的施肥量對(duì)產(chǎn)量的影響極顯著。根據(jù)均方期望還能估計(jì)各方差分量:產(chǎn)量變異中,施肥量差異是主要原因,貢獻(xiàn)率100%1.2987/(0.1551+0.00645+0.0299+1.2987)87.15%隨機(jī)模型做多重比較無(wú)意義。529.4混合模型9.4.1線性統(tǒng)計(jì)模型9.4.2均方期望與統(tǒng)計(jì)量F的確定539.4.1線性統(tǒng)計(jì)模型在雙因素交叉分組實(shí)驗(yàn)中,若一個(gè)因素是固定型(如A因素),另一個(gè)因素是隨機(jī)型(如B因素),則稱為混合模型?;旌夏P椭校總€(gè)觀測(cè)值yijk的線性模型為:其中i是固定效應(yīng),j是隨機(jī)效應(yīng),交互作用()ij為隨機(jī)效應(yīng)。i是固定效應(yīng),所以。j是服從NID(0,2)的隨機(jī)變量。交互作用效應(yīng)是平均數(shù)為0、方差為的正態(tài)隨機(jī)變量。54因?yàn)楣潭ㄒ蛩氐娜拷换プ饔眯?yīng)之和為0,即所以,在固定因素的某個(gè)水平上,交互作用的成分不是獨(dú)立的。在這個(gè)模型內(nèi),()ij的方差定義為而不是2。因此,均方期望中的交互作用方差分量2是實(shí)際方差的(a-1)/a倍,這樣規(guī)定可以使均方期望簡(jiǎn)單化。559.4.2均方期望與統(tǒng)計(jì)量F的確定各項(xiàng)均方數(shù)學(xué)期望如下:以及56對(duì)于H01:i0或20的檢驗(yàn)統(tǒng)計(jì)量為:對(duì)于H02:20的檢驗(yàn)統(tǒng)計(jì)量為:對(duì)于H03:20的檢驗(yàn)統(tǒng)計(jì)量為:固定因素效應(yīng)的估計(jì)為:方差分量2,2和2的估計(jì)分別為:57據(jù)此得出混合模型方差分析表:表9-15混合模型方差分析表(A固定,B隨機(jī))變差來(lái)源平方和自由度均方F均方期望A因素SSAa-1MSAB因素SSBb-1MSBAB交互作用SSAB(a-1)(b-1)MSAB誤差SSEab(n-1)MSE總和SSTabn-1
58例9.5表9-16列出的數(shù)據(jù)是受試者在一天內(nèi)的4種不同時(shí)間、以4種不同速度工作(正常速度的60%,80%,100%,120%)得到的能量消耗值。實(shí)驗(yàn)共16個(gè)處理,每個(gè)處理重復(fù)2次,共做32次實(shí)驗(yàn)。解:首先看因素的類型。因素A是從60%-120%這個(gè)范圍內(nèi),人為選出的4個(gè)水平,這4個(gè)水平是可以嚴(yán)格控制的,所以因素A為固定型;因素B的4個(gè)水平,是從一天內(nèi)不同時(shí)間中隨機(jī)抽取的4個(gè)時(shí)間,所以因素B為隨機(jī)型。即本實(shí)驗(yàn)屬于混合模型。具體計(jì)算過(guò)程不再重復(fù),下面給出方差分析表(表9-17):59首先,檢驗(yàn)假設(shè)H03:20。再檢驗(yàn)H02:2=0。F<F3,16,
0.053.24,因此沒(méi)有足夠理由認(rèn)為2>0,也就是不同時(shí)間之間的差異不顯著。60最后,檢驗(yàn)H01:i0或20。假定錯(cuò)誤地使用作為檢驗(yàn)統(tǒng)計(jì)量。這時(shí)F>F3,16,0.053.24,于是我們有可靠的證據(jù)證明22+82
>0
,但不能確定這一結(jié)果是由于22>0還是82
>0或者兩者都大于0造成的。因此,檢驗(yàn)H01:i0的假設(shè),使用的統(tǒng)計(jì)量是:61F<F3,9,0.053.86,接受H01,因素A是不顯著的,即在選定的這4種速度下工作,能量的消耗沒(méi)有顯著不同。從以上計(jì)算可看出,正確區(qū)分因素的類型、正確使用檢驗(yàn)統(tǒng)計(jì)量很重要。在隨機(jī)模型和混合模型中,不設(shè)置重復(fù),同樣會(huì)有固定模型中的問(wèn)題,即因素間的交互作用與實(shí)驗(yàn)誤差無(wú)法區(qū)分,全部歸于誤差項(xiàng)。特別是在混合模型中,隨機(jī)因素的各水平之間實(shí)際存在的差異,往往檢驗(yàn)不出來(lái),結(jié)果降低了試驗(yàn)的可靠性。因而,在條件允許的情況下,不論哪一種模型,最好都設(shè)重復(fù)。629.5兩個(gè)以上因素的方差分析9.5.1平方和與自由度分解的一般規(guī)律9.5.2均方期望的推導(dǎo)(不作要求)9.5.3均方期望的表格化推演方法(不作要求)9.5.4統(tǒng)計(jì)量F的確定639.5.1平方和與自由度分解的一般規(guī)律
可以把雙因素交叉分組的方差分析,擴(kuò)展到一般情況。例如在一個(gè)實(shí)驗(yàn)中,A因素有a水平,B因素有b水平,C因素有c水平等。假設(shè)每一處理都有n次重復(fù)(n2),那么總觀測(cè)次數(shù)為abcn次,線性統(tǒng)計(jì)模型為:假設(shè)A,B,C都是固定因素,各因素的平方和為:64為了計(jì)算交互作用平方和,需要列出三個(gè)兩向表(two-waytable),交互作用由下列各式給出。誤差平方和是由三向表(three-waytable)中yijk.求出的:殘余項(xiàng)為三因素交互作用。65自由度的分解與雙因素方差分析類似:每一主效應(yīng)的自由度是該因素的水平數(shù)減1;每一交互作用的自由度是產(chǎn)生交互作用各因素的自由度乘積;誤差自由度是各因素水平數(shù)與重復(fù)數(shù)減1的乘積。即:66從雙因素交叉分組設(shè)計(jì)和三因素交叉分組設(shè)計(jì)的平方和分解公式可以看出,計(jì)算各項(xiàng)平方和的規(guī)律性是很強(qiáng)的。對(duì)于更多因素交叉分組設(shè)計(jì)的平方和都可以依這一規(guī)律寫出。有了平方和與自由度很容易得出各項(xiàng)均方。與雙因素方差分析一樣,檢驗(yàn)統(tǒng)計(jì)量的確定,取決于均方期望,而均方期望與模型類型有關(guān)。679.5.2均方期望的推導(dǎo)(不作要求)對(duì)于one-wayANOVA中MSA和MSE數(shù)學(xué)期望在上一章有作推導(dǎo)。one-wayANOVA均方期望的推導(dǎo)過(guò)程要復(fù)雜得多。同時(shí),需推導(dǎo)的均方期望的個(gè)數(shù)隨因素的增加而增加,進(jìn)一步加大了推導(dǎo)難度。下面以雙因素交叉分組設(shè)計(jì)的混合模型為例,來(lái)說(shuō)明推導(dǎo)均方期望的困難程度。在這里,因素A為固定因素,因素B為隨機(jī)因素。具體的推導(dǎo)過(guò)程見(jiàn)本書配套的數(shù)字課程,e9.5.2均方期望的推導(dǎo)。68
9.5.3均方期望的表格化推演方法(不作要求)單因素實(shí)驗(yàn)需推導(dǎo)2個(gè)均方期望,雙因素實(shí)驗(yàn)需推導(dǎo)4個(gè)均方期望。若因素?cái)?shù)為n,推導(dǎo)均方期望的個(gè)數(shù)就是2(n+1)-2n個(gè),工作量急劇增加。為了簡(jiǎn)化計(jì)算,下面介紹一種表格化的推演方法。在這里以雙因素交叉分組實(shí)驗(yàn)的方差分析為例,說(shuō)明推演方法。用表格法推演均方期望有以下規(guī)定:(1)在線性統(tǒng)計(jì)模型中誤差ijk的下標(biāo)寫為(ij)k。括號(hào)內(nèi)的下標(biāo)ij為不同處理水平組合的下標(biāo),稱為死下標(biāo)(deadsubscript);括號(hào)外的下標(biāo)為表示重復(fù)的下標(biāo),稱為活下標(biāo)(livesubscript)。I,j,()ij的下標(biāo)都是活下標(biāo)。69
(2)在固定模型中各因素的效應(yīng)分別用該模型分量的平方和除以自由度表示。如A因素的效應(yīng)為。AB交互作用的效應(yīng)記為。2,2和2稱為各因素的效應(yīng)分量。(3)隨機(jī)模型中各因素的效應(yīng)分別用以希臘分母為下標(biāo)的方差表示。如A因素的效應(yīng)記為2,AB交互作用的效應(yīng)記為2。
2
,2和2稱為各因素的方差分量。(4)混合模型中,交互作用的兩個(gè)因素中只要有一個(gè)是隨機(jī)的,則交互作用即是隨機(jī),其方差分量記2。(5)不論哪一種模型,誤差的方差一律記為2。70以固定模型為例,說(shuō)明推演步驟:(1)首先列出下表(表A)。模型中每個(gè)分量占據(jù)一行,每個(gè)下標(biāo)占據(jù)一列。在表頭寫上因素的類型,固定型記為F,隨機(jī)型記為R,重復(fù)都被認(rèn)做隨機(jī)的,記為R。寫上相應(yīng)于各因素的水平數(shù)a,b,n,以及每一模型分量的下標(biāo)I,j,k。(2)在行分量中,若某個(gè)死下標(biāo)與列中的該下標(biāo)一致,則寫上“1”(表A中已經(jīng)寫上)。(3)若每一行分量上的一個(gè)活下標(biāo)與列中的該下標(biāo)一致,且列是以固定因素為表頭的則寫上“0”,列是以隨機(jī)因素為表頭的寫上"1"(表B)。(4)在其余的空白行位置上寫上各列表頭所表明的水平數(shù)(表C)。71(5)為了求某一模型分量的均方期望,用紙條蓋上以其活下標(biāo)為表頭的那一列,然后找出包含該下標(biāo)的那些行。把末蓋上的字母和數(shù)字相乘,再乘上相應(yīng)的固定因素的效應(yīng)分量或隨機(jī)因素的方差分量,這些乘積的和即為該模型分量的均方期望。如求E(MSA),蓋上列i,剩下的列是列j和列k,包含i的行是4,3,1(習(xí)慣上從最后一行開始)。這三行中未蓋上的字母(數(shù)字)和數(shù)字(字母)的乘積為1,0,bn,由此得出因素A的均方期望:72同理可以推出一個(gè)完整的雙因素混合模型(A固定,B隨機(jī))均方期望的推演見(jiàn)下表:推演的結(jié)果與§9.5.2中所給出的均方期望一致。739.5.4統(tǒng)計(jì)量F的確定在前面講固定模型、隨機(jī)模型和混合模型時(shí),都特別強(qiáng)調(diào)統(tǒng)計(jì)量F一定要根據(jù)均方期望的構(gòu)成來(lái)確定。它的一般規(guī)律是:為了得到檢驗(yàn)?zāi)硞€(gè)因素或某個(gè)交互作用的統(tǒng)計(jì)量,在計(jì)算F時(shí),分子均方的組成比分母均方的組成僅多出欲檢驗(yàn)的效應(yīng)分量(固定因素)或方差分量(隨機(jī)因素),除此之外的其他成分應(yīng)完全相同。以三因素交叉分組實(shí)驗(yàn)的方差分析為例,說(shuō)明檢驗(yàn)統(tǒng)計(jì)量F的確定。其線性統(tǒng)計(jì)模型為:設(shè)A,C為固定因素,B為隨機(jī)因素,構(gòu)成混合模型,各均方期望由表9-19給出。7475交互作用的檢驗(yàn)統(tǒng)計(jì)量分別為:三個(gè)主效應(yīng)的檢驗(yàn)統(tǒng)計(jì)量分別為:769.6缺失數(shù)據(jù)的估計(jì)9.6.1缺失一個(gè)數(shù)據(jù)的彌補(bǔ)方法9.6.2缺失兩個(gè)數(shù)據(jù)的估計(jì)9.6.3缺失數(shù)據(jù)資料的方差分析779.6缺失數(shù)據(jù)的估計(jì)方差分析的數(shù)據(jù),一般都是根據(jù)實(shí)驗(yàn)設(shè)計(jì)事先安排好的,缺一不可。一旦由于意外原因,例如害蟲、鳥害、動(dòng)物死亡或數(shù)據(jù)丟失等,使全部數(shù)據(jù)中的一個(gè)或兩個(gè)缺失,又沒(méi)有重做實(shí)驗(yàn)的可能性,就可以采用缺失數(shù)據(jù)估計(jì)的方法補(bǔ)救。78
設(shè)表9-20中的y23是缺失的,需要填補(bǔ)上。彌補(bǔ)缺失數(shù)據(jù)的原則是:使補(bǔ)上缺失的數(shù)據(jù)之后,所得到的誤差平方和最小。誤差平方和:9.6.1缺失一個(gè)數(shù)據(jù)的彌補(bǔ)方法79為了使SSE達(dá)到最小,令,則80
9.6.2缺失兩個(gè)數(shù)據(jù)的估計(jì)如表9-21中的y23和y42缺失。彌補(bǔ)兩個(gè)數(shù)據(jù)缺失的原則也是使誤差平方和最小。81求出方程的解,即為y23和y42的估計(jì)值。82
彌補(bǔ)的缺失數(shù)據(jù)是估計(jì)值,因此當(dāng)缺失一個(gè)數(shù)據(jù)時(shí),總自由度應(yīng)減1。但A因素和B因素的自由度仍是(a-1)和(b-1),所以誤差項(xiàng)自由度應(yīng)減1。同樣,缺失兩個(gè)數(shù)據(jù)時(shí),總自由度與誤差自由度均應(yīng)減2。另外,缺失數(shù)據(jù)的估計(jì)值是使誤差平方和為最小的值。因此,處理項(xiàng)平方和是向上偏攲的。但如果缺失數(shù)據(jù)不是很多,對(duì)處理平均數(shù)之間的檢驗(yàn)不會(huì)有太大的影響。所以在缺失數(shù)據(jù)估計(jì)出來(lái)之后,將估計(jì)值填到缺失的位置上,然后,按一般方差分析方法進(jìn)行分析,只要把總自由度和誤差自由度減去缺失數(shù)據(jù)數(shù)即可。9.6.3缺失數(shù)據(jù)資料的方差分析839.7數(shù)據(jù)轉(zhuǎn)換9.7.1方差穩(wěn)定性轉(zhuǎn)換的一般原理9.7.2平方根變換9.7.3反正弦變換9.7.4對(duì)數(shù)變換84方差分析應(yīng)滿足:線性可加性、實(shí)驗(yàn)誤差應(yīng)為相互獨(dú)立的N(0,2)變量(正態(tài)性)、各處理項(xiàng)誤差的方差應(yīng)具備齊性。在某些情況下,上述3個(gè)條件往往不能滿足。例如,泊松分布及二項(xiàng)分布的平均數(shù)與標(biāo)準(zhǔn)差是有關(guān)聯(lián)的。在上述條件不能滿足時(shí)所做的方差分析,往往導(dǎo)致錯(cuò)誤的結(jié)論。這時(shí),必須采取適當(dāng)?shù)淖儞Q(transformation),使變換后的數(shù)值能滿足上述條件,用變換后的數(shù)值做方差分析。變換的目的主要是滿足方差齊性的要求。如果經(jīng)過(guò)檢驗(yàn)判定總體方差是不同質(zhì)的,在很多情況下可以對(duì)數(shù)據(jù)進(jìn)行變換,使變換后的數(shù)據(jù)的方差近似同質(zhì),故而稱這種數(shù)據(jù)變換為方差的穩(wěn)定性變換。9.7.1數(shù)據(jù)轉(zhuǎn)換的一般原理85很多情況下方差的異質(zhì)性表現(xiàn)為方差的大小隨平均數(shù)的大小而變化,即方差是平均數(shù)的函數(shù),因而不同總體的平均數(shù)有差異時(shí),總體方差也隨之出現(xiàn)差異。設(shè)隨機(jī)變量X的平均數(shù)為,方差為2,方差與平均數(shù)之間有函數(shù)關(guān)系(),在這里,是未知的,函數(shù)是已知的。例如,若X服從二項(xiàng)分布B(n,P),則E(X)nP,2var(X)nP(1-P),于是回到一般情況,我們欲對(duì)X作變換Y=f(X),使Y的方差等于或近似等于一個(gè)常量。86對(duì)Yf(X)在X附近用Taylor級(jí)數(shù)展開,取一次項(xiàng),得Yf()+f()(X-)Y的期望和方差分別為E(Y)f()[因?yàn)镋(X-)0]var(Y)E[Y-E()]2E[Y-f()]2[f()]2E(X-)2[f()]22欲使var(Y)[f()]22常量,必有等式兩邊求積分得:于是所求的變換函數(shù)為下面給出這個(gè)變換函數(shù)在某些情況下的應(yīng)用。879.7.2平方根變換若數(shù)據(jù)的方差與均數(shù)成正比(2),即,則由公式(9.49)得也就是說(shuō),對(duì)這類數(shù)據(jù),在方差分析前,應(yīng)對(duì)每個(gè)觀測(cè)值進(jìn)行平方根變換(squareroottransformation)。這類數(shù)據(jù)的典型例子有:?jiǎn)挝幻娣e內(nèi)的菌落數(shù),一定區(qū)域內(nèi)某種昆蟲或某種植物數(shù),放射性物質(zhì)在單位時(shí)間內(nèi)放射的次數(shù),單位數(shù)量的種子中混有的草籽數(shù)等。此類數(shù)據(jù)通常服從泊松分布,而泊松分布的基本特征是總體平均數(shù)等于總體方差。對(duì)于這類數(shù)據(jù),應(yīng)該將每個(gè)觀測(cè)值取其平方根,然后再計(jì)算。當(dāng)數(shù)值很小時(shí),如有幾個(gè)數(shù)小于10時(shí),為了矯正,可以使用以下變換:88例9.6以下是經(jīng)不同除草劑處理后在燕麥試驗(yàn)區(qū)中含某種雜草的株數(shù),欲比較不同除草劑對(duì)該種雜草的除草效果。從樣本數(shù)據(jù)看,隨著平均數(shù)的加大,標(biāo)準(zhǔn)差也加大。可以斷定總體方差是不同質(zhì)的。用平方根轉(zhuǎn)換后的數(shù)據(jù)為:
89由F檢驗(yàn)可知不同除草劑間的差異極顯著。從最后一行可知,各處理的方差非常接近,說(shuō)明轉(zhuǎn)換有效。用轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行方差分析。結(jié)果如下表:909.7.3反正弦變換如果方差和總體均數(shù)存在關(guān)系2(1-),由公式(9.49)可得變換公式為,如百分率為15.1,在excel中輸入ASIN(SQRT(15.1/100))/3.1416*18022.87。這種變換叫反正弦變換(arcsinetransformation),取每個(gè)觀測(cè)值的平方根的反正弦值,又叫角變換,一般用于服從二項(xiàng)分布的百分率數(shù)據(jù)[p2p(1-p)],特別是當(dāng)數(shù)據(jù)范圍很大時(shí),使用這種變換,使兩端的百分率向中間靠近,使數(shù)據(jù)的變異幅度變小,變換后的數(shù)據(jù)可以從附表10查出。
當(dāng)百分?jǐn)?shù)的范圍是在0~20%或80%~100%時(shí),可以用平方根變換,后者在變換之前應(yīng)先用100減去各百分?jǐn)?shù)。當(dāng)百分率都在30%~70%時(shí)不一定要做變換,因?yàn)樽儞Q后的數(shù)據(jù)與變換前相差不大。9192例9.7六個(gè)大豆品種的樣本中患莖癌腫的百分率如下。經(jīng)反正弦變換后,所得數(shù)據(jù)如下:變換后,數(shù)據(jù)范圍由36.5%~l%變?yōu)?7.2%~5.7%,變異幅度變小。對(duì)變換后的數(shù)據(jù)作方差分析,得結(jié)果如下:結(jié)果說(shuō)明6種大豆品種患莖癌腫的發(fā)病率差異極其顯著。939.7.4對(duì)數(shù)變換如果數(shù)據(jù)具有標(biāo)準(zhǔn)差和均數(shù)成正比()即方差與平均數(shù)的平方成正比時(shí)(2)的趨勢(shì),則由公式(9.49)可得即做對(duì)數(shù)變換(logarithmictransformation)。當(dāng)然也可以是YlgX。對(duì)數(shù)變換適用于大范圍的正整數(shù),對(duì)于一些小的數(shù)值,例如小于10、數(shù)據(jù)中含有0值,則用Ylg(X+l)。例9.8
為診斷某種疾病,需測(cè)定一個(gè)指標(biāo),為增加診斷的可靠性,用4人在4種不同條件下測(cè)定該指標(biāo),結(jié)果如下:94從上表的基本計(jì)算看到,標(biāo)準(zhǔn)差變異很大,但是變異系數(shù)相差不大,說(shuō)明標(biāo)準(zhǔn)差和平均數(shù)有成正比的趨勢(shì),所以考慮用對(duì)數(shù)變換,變換后的數(shù)據(jù)如下:對(duì)變換后的數(shù)據(jù)的方差分析,結(jié)果如下:另外,還有倒數(shù)變換,適合2的情形,常用于以反應(yīng)時(shí)間為指標(biāo)的數(shù)據(jù),例如某疾病患者的生存時(shí)間。959.8雙因素嵌套分組方差分析9.8.1雙因素嵌套分組方差分析的數(shù)據(jù)模式9.8.2雙因素嵌套分組方差分析的數(shù)學(xué)模型9.8.3平方和與自由度的剖分9.8.4假設(shè)檢驗(yàn)969.8.1雙因素嵌套分組方差分析的數(shù)據(jù)模式所謂嵌套分組,是指一個(gè)因子的不同水平分別與另一因子的不同水平發(fā)生組合,其數(shù)據(jù)模式如:A因子的第i(i
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 個(gè)人定制刀具合同范本
- 買賣礦粉合同范本
- 解除飯店合伙合同范本
- it外包開發(fā)合同范本
- 養(yǎng)殖小鳥出售合同范本
- 制造商供貨合同范本
- 協(xié)議股東合同范本
- 合伙生意分工合同范本
- 占他人土地建房合同范本
- 公租房 租房合同范本
- 經(jīng)營(yíng)性公墓建設(shè)標(biāo)準(zhǔn)
- 10KV系統(tǒng)短路電流整定計(jì)算表格
- 初中英語(yǔ) 滬教牛津版 8B U1-4 More Practice Success for Spring Buds 課件
- 壓水堆核電廠在役檢查課件
- 前房角鏡檢查法及其在眼科的應(yīng)用教學(xué)課件
- 2017年度項(xiàng)目生產(chǎn)部工作計(jì)劃推進(jìn)表甘特圖
- 地下室車庫(kù)綜合管線施工布置
- 采購(gòu)訂單模板
- 巴馬格紡絲控制系統(tǒng)軟件說(shuō)明書(共46頁(yè))
- 完整解讀2021年《建設(shè)工程抗震管理?xiàng)l例》PPT教學(xué)講座課件
- 肺結(jié)核患者管理ppt課件
評(píng)論
0/150
提交評(píng)論