第2章方差分析_第1頁
第2章方差分析_第2頁
第2章方差分析_第3頁
第2章方差分析_第4頁
第2章方差分析_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第2章 方差分析2.1 概述方差分析(analysis of variance)是數(shù)理統(tǒng)計的基本方法之一,是分析試驗(yàn)數(shù)據(jù)的一種有效工具。方差分析是在20世紀(jì)20年代初由英國統(tǒng)計學(xué)家費(fèi)歇爾(R.A.Fisher)所創(chuàng),最早用于生物學(xué)和農(nóng)業(yè)實(shí)驗(yàn),后在工業(yè)生產(chǎn)和科學(xué)研究中的許多領(lǐng)域廣泛應(yīng)用,取得良好的效果。一、方差分析的必要性在第1章中,我們已經(jīng)討論了兩個正態(tài)總體均值相等的假設(shè)檢驗(yàn)問題。但在實(shí)際生產(chǎn)中,經(jīng)常遇到檢驗(yàn)多個正態(tài)總體均值是否相等的問題。例2-1 以淀粉為原料生產(chǎn)葡萄糖的過程中,殘留有許多糖蜜,可作為生產(chǎn)醬色的原料。在生產(chǎn)醬色之前應(yīng)盡可能徹底除雜,以保證醬色質(zhì)量。為此,對除雜方法進(jìn)行選擇。在

2、試驗(yàn)中選用五種不同的除雜方法,每種方法做四次試驗(yàn),即重復(fù)四次,結(jié)果見表2-1。表2-1 不同除雜方法的除雜量(g/kg)除雜方法(Ai)除雜量(xij)平均()A125.622.228.029.826.4A224.430.029.027.527.7A325.027.723.032.227.0A428.828.031.525.928.6A520.621.222.021.221.3本試驗(yàn)的目的是判斷不同的除雜方法對除雜量是否有顯著影響,以便確定最佳除雜方法。我們可以認(rèn)為,同一除雜方法重復(fù)試驗(yàn)得到的4個數(shù)據(jù)的差異是由隨機(jī)誤差造成的,而隨機(jī)誤差常常是服從正態(tài)分布的,這時除雜量應(yīng)該有一個理論上的均值。而

3、對不同的除雜方法,除雜量應(yīng)該有不同的均值。這種均值之間的差異是由于除雜方法的不同造成的。于是我們可以認(rèn)為,五種除雜方法所得數(shù)據(jù)是來自五個均值不同的五個正態(tài)總體,且由于試驗(yàn)中其它條件相對穩(wěn)定,因而可以認(rèn)為每個總體的方差是相等的,即五個總體具有方差齊性。這樣,判斷除雜方法對除雜效果是否有顯著影響的問題,就轉(zhuǎn)化為檢驗(yàn)五個具有相同方差的正態(tài)總體均值是否相同的問題了,即檢驗(yàn)假設(shè)H0: 1=2=3=4=5對于這種多個總體樣本均值的假設(shè)檢驗(yàn),第1章介紹的方法不再適用,須采用方差分析方法。二、方差分析的基本思想方差分析的實(shí)質(zhì)就是檢驗(yàn)多個正態(tài)總體均值是否相等。那么,如何檢驗(yàn)?zāi)??從?-1可見,20個試驗(yàn)數(shù)據(jù)(除

4、雜量)是參差不齊的。數(shù)據(jù)波動的可能原因來自兩個方面:一是由于因素的水平(即除雜方法)不同造成的,事實(shí)上,5種除雜方法下的數(shù)據(jù)平均值之間確實(shí)有差異;二是偶然失誤造成的。從表中數(shù)據(jù)可見,每一種除雜方法下的4個數(shù)據(jù)雖然是相同條件下的試驗(yàn)結(jié)果,但仍然存在差異。這是由于試驗(yàn)中存在的偶然因素(如環(huán)境、原材料成分、測試技術(shù)等的微小而又隨機(jī)的變化)引起的。我們把由因素的水平變化引起的試驗(yàn)數(shù)據(jù)波動稱為條件誤差;把由隨機(jī)因素引起的試驗(yàn)數(shù)據(jù)波動稱為隨機(jī)誤差或試驗(yàn)誤差。方差分析的中心要點(diǎn)是:把實(shí)驗(yàn)數(shù)據(jù)的總波動分解為兩部分,一部分反映由條件誤差變化引起的波動;另一部分反映由實(shí)驗(yàn)誤差引起的波動。即把數(shù)據(jù)的總偏差平方和分解

5、為反映必然性的各個因素的偏差平方和(SA、SB)與反映偶然性的誤差偏差平方和(Se),并計算它們的平均偏差平方和,再將二者進(jìn)行比較,借助F檢驗(yàn)法,檢驗(yàn)假設(shè)H0:,從而確定因素對試驗(yàn)結(jié)果的影響是否顯著。換言之,找出對試驗(yàn)數(shù)據(jù)起決定性影響的因素(即顯著性或高度顯著性因素)作為進(jìn)行定量分析判斷的依據(jù)。2.2 單因素實(shí)驗(yàn)的方差分析一、問題的提出 在進(jìn)行一項(xiàng)實(shí)驗(yàn)中,如果只有一個因素在改變,而其他因素保持固定不變,就被稱為單因素實(shí)驗(yàn)。因素變化所劃分的等級(或條件)叫做水平(level),對每個水平都要進(jìn)行若干次重復(fù)實(shí)驗(yàn),通常當(dāng)作一個樣本來看待,稱為一個“處理”(treatment). 為了便于討論,我們先

6、給出單因素方差分析的一般提法:設(shè)實(shí)驗(yàn)所考察的因素A有m個水平:A1,A2,Am,在每個水平上重復(fù)進(jìn)行r次實(shí)驗(yàn),每次實(shí)驗(yàn)的可能結(jié)果都是一個隨機(jī)變量。同一條件下的r次重復(fù)實(shí)驗(yàn)的可能結(jié)果是同一總體的一個樣本。設(shè)水平的第j次實(shí)驗(yàn)值為xij(i1,2,m;j1,2,r),可得實(shí)驗(yàn)數(shù)據(jù)及計算表的模式如下:表2-2 單因素試驗(yàn)數(shù)據(jù)及計算表(水平重復(fù)數(shù)相等)水平重復(fù)試驗(yàn)序號xi.1 2 j rA1A2AiAm x1.x2.xi.xm.總和 表中(,)就是的一個容量為r的樣本。對應(yīng)于m個總體,有m個這樣的樣本值。試驗(yàn)之后就得到m個樣本值。問題就是要根據(jù)這m個樣本值,分析試驗(yàn)條件的變化對所考察的指標(biāo)有無顯著影響。

7、實(shí)際上,就是要考察m個總體的數(shù)學(xué)期望有無顯著差異,因而這是一個假設(shè)檢驗(yàn)的問題。在表2-2中, ,二、單因素方差分析的前提條件單因素方差分析是建立在下述假設(shè)的基礎(chǔ)上的:1、每一水平上的實(shí)驗(yàn)結(jié)果是一個隨機(jī)變量(i為第i個水平,j為第j次試驗(yàn)),且服從正態(tài)分布。(,)是第i個水平的正態(tài)總體中抽出的一個簡單隨機(jī)樣本,樣本容量為r。2、所有m個不同水平對應(yīng)的m個正態(tài)總體的方差是相等的,即具有方差齊性。N(,)3、m個總體相互獨(dú)立,樣本與樣本之間也相互獨(dú)立,要檢驗(yàn)的假設(shè)是:H0:1=2=若拒絕H0,則認(rèn)為至少兩個水平之間的差異是顯著的,因素A對實(shí)驗(yàn)結(jié)果有顯著影響;反之,若接受原假設(shè),則認(rèn)為因素A對試驗(yàn)結(jié)果

8、無顯著影響,試驗(yàn)結(jié)果在各水平之間的不同僅僅是由于隨機(jī)因素引起的。三、單因素方差分析的一般步驟1. 偏差平方和的分解把整個試驗(yàn)結(jié)果所得的每一觀測值xij對其總平均值的偏差進(jìn)行平方并求總和,就是總的偏差平方和,用ST表示,它反映了全部觀測值間的總的差異情況。ST= (2-1)將式(2-1)進(jìn)行分解ST= 其中 又 ST= (2-2) 令 SA (2-3)它表示各水平(條件)下的平均數(shù)與總平均數(shù)的偏差平方和,反映了因素A的水平變化所引起的波動,稱為組間偏差平方和或因素平方和。令 (2-4)它表示各條件(水平)下的試驗(yàn)值與該條件下的平均值之偏差的平方和。反映了隨機(jī)誤差引起的波動,稱為組內(nèi)偏差平方和或誤

9、差平方和。 ST = SA + Se (2-5)這樣,我們就將總的偏差平方和分解為組間偏差平方和與組內(nèi)偏差平方和之和。2. 偏差平方和的簡化計算為計算方便,在實(shí)際運(yùn)算中,常用下列簡便算法求ST、SA和Se。ST= 令 QT CT=則有 ST = QT - CT (2-7)式中:數(shù)據(jù)總和 CT修正項(xiàng)n數(shù)據(jù)總個數(shù) n=mrm水平數(shù), r每一水平重復(fù)試驗(yàn)次數(shù)QT各數(shù)據(jù)平方之和同理:令 QA則 SA = QA CT (2-8)一般先求出ST和SA,然后再利用Se = ST SA (2-9)求出Se。計算可在表2-2所示得數(shù)據(jù)計算表上進(jìn)行。3. 方差(平均偏差平方和)與自由度 偏差平方和的大小,與參加求

10、和的項(xiàng)數(shù)有關(guān),為了比較SA與Se的大小,應(yīng)消除求和項(xiàng)數(shù)的影響,用它們的平均值進(jìn)行比較。由理論推導(dǎo)可知,SA與Se的平均值,不是把SA和Se 分別除以相應(yīng)的參與求和的項(xiàng)數(shù),而應(yīng)除以它們的自由度。ST、SA、Se的自由度分別用fT、fA和fe表示.經(jīng)理論分析可知:fT=mr-1=n-1fA =m-1fe=mr-m=n-m顯然,有 fTfAfe (210)上式為偏差平方和自由度分解公式。因?yàn)榭傋杂啥?fT=n-1是總的數(shù)據(jù)個數(shù)減1,而組間自由度fAm1是因素的水平數(shù)減1,都很好計算。所以一般先求出fT和fA,然后再利用fefT(組內(nèi)自由度)fA(組間自由度) (2-11)求出組內(nèi)自由度fe。 偏差平

11、方和與相應(yīng)的自由度之比稱為平均偏差平方和,簡稱為均方和或均方或方差, 方差均方均方和偏差平方和/自由度=平均偏差平方和因此,組間方差VA和組內(nèi)方差Ve分別為組間方差VA=SA/fA (2-12)組內(nèi)方差Ve= Se/fe (2-13)4. 用F檢驗(yàn)法進(jìn)行顯著性檢驗(yàn)若假設(shè)H0為真,即1=2=m那么全體樣本可看作來自同一正態(tài)總體N(,2)。此時可證明ST/fT, SA/fA和Se/fe均為總體方差2的無偏估計值,所以比值F=VA/Ve應(yīng)接近于1,即各平均數(shù)之間不存在條件誤差,純屬試驗(yàn)誤差或隨機(jī)誤差。如果F值比1大得多,即VA顯著地大于Ve ,就有理由認(rèn)為原假設(shè)不成立,表明SA中不僅包括隨機(jī)誤差,而

12、且包括因素A的水平波動引起的數(shù)據(jù)波動(稱為因素誤差),即因素A對試驗(yàn)結(jié)果影響顯著。這種比較方差大小來判斷原假設(shè)H0是否成立的方法,就是“方差分析”名稱的由來。由前面的討論可知,只要知道此值F的概率分布,就可以用它作為檢驗(yàn)假設(shè)的統(tǒng)計量。事實(shí)上,可以證明:當(dāng)原假設(shè)H0成立時,SA和Se分別為自由度(m-1)和(n-m)的c2 變量,從而統(tǒng)計量F服從自由度f1=m-1和f2=n-m的分布。于是對給定的顯著水平,可查F分布表求得臨界值F,使P(F>F)=。若由樣本值求得FF,則認(rèn)為原假設(shè)H0成立,即認(rèn)為條件的改變對指標(biāo)無顯著影響;若F>F,則否定原假設(shè)H0,即認(rèn)為因素A的改變對指標(biāo)有顯著影

13、響。關(guān)于值的選取,視具體情況而定,通常取0.01或0.05,從F分布表查出F0.01和F0.05。若F>F0.01,判定因素A對指標(biāo)影響特別顯著。稱“某因素高度顯著”,在方差分析表的“顯著性”欄中記“*”;若F0.05<F<F0.01,判定因素A對指標(biāo)的影響顯著,稱“某因素顯著”,記為“*”;若FF0.05,則判定因素A對指標(biāo)無顯著性影響稱“某因素不顯著”,不作標(biāo)記。5. 制定方差分析表由以上討論可知,方差分析的步驟基本上就是假設(shè)檢驗(yàn)的步驟,特殊的只是檢驗(yàn)用的統(tǒng)計量是由兩個平均偏差平方和之比構(gòu)成。這兩個偏差平方和分別表示條件誤差與試驗(yàn)誤差,它們是由總的偏差平方和分解出來的。因

14、此,在具體進(jìn)行方差分析時,主要就是要計算這些偏差平方和。由于計算過程較繁,一般把計算結(jié)果列成簡明的方差分析表,其格式如表2-3所示。表2-3 方差分析表方差來源偏差平方和自由度方差F值F顯著性因素A(組間)誤差e(組內(nèi))SASefAfeVAVeF=VA/Ve查表F0.05F0.01總 和STfT四、單因素方差分析實(shí)例 現(xiàn)在仍以例2-1的試驗(yàn)數(shù)據(jù)為例,說明單因素方差分析的步驟,表2-1數(shù)據(jù)的計算表見表2-4。例:2-1 五種除雜方法 廢糖蜜利用解:1.計算偏差平方和及自由度=CT=(13707.85)=,如:= =25.6+22.2+28.0+29.8=105.6QT=ST=QT-CT=1395

15、4.72-13707.85=246.87fT =mr-1=4×5-119QA=SA=QA-CT=13839.81-13707.85=131.96fA =m-1=5-1=4 fe=n-m=20-5=15或fe=fT-fA=19-4=15Se=ST-SA=246.87-131.96114.912.計算方差和F值VA=SA/fA=131.96/4=32.99Ve=Se/fe=114.9/15=7.66F=VA/Ve=32.99/7.66=4.313.查F值 FF(fA, fe)F0.05(4,15)=3.06, F0.01(4,15)=4.894.列出方差分析表表2-5 方差分析表方差來源

16、偏差平方和自由度方差F值F顯著性因素A(組間)誤差e(組內(nèi))SA=131.96Se=114.91fA=4fe=15VA=32.99Ve=7.664.31查表F0.05(4,15)3.06F0.01(4,15)4.89*總 和ST=246.87fT=19由于F0.05(4,15)<F=4.31<F0.01(4,15)故拒絕原假設(shè)H0,即不同除雜方法對除雜效果有顯著影響。2.3 雙因素試驗(yàn)的方差分析 上面討論了單因素試驗(yàn)的方差分析,即考慮一個因素對試驗(yàn)結(jié)果是否有顯著影響的問題,但在實(shí)際中,影響實(shí)驗(yàn)結(jié)果的因素往往不只一個而是多個,這時要分析多個因素的作用。若同時考慮兩個因素對試驗(yàn)結(jié)果的影

17、響,就要對兩個因素試驗(yàn)進(jìn)行方差分析,稱雙因素試驗(yàn)的方差分析。對于雙因素試驗(yàn)的方差分析,其基本思想和方法與單因素試驗(yàn)的方差分析相似,關(guān)鍵在于如何把總的偏差平方和進(jìn)行分解。前提條件仍然是要滿足相互獨(dú)立、方差齊性和正態(tài)分布三個條件。所不同的是,在雙因素試驗(yàn)中,有可能出現(xiàn)交互作用。一、雙因素?zé)o重復(fù)試驗(yàn)的方差分析1. 問題的一般提法某項(xiàng)試驗(yàn)要同時考察因素A和B對試驗(yàn)結(jié)果的影響,因素A取A1, A2, Aa 共 a個水平,因素B取B1, B2 ,Bb 共 b個水平。A和B兩因素的每種水平搭配AiBj各進(jìn)行一次獨(dú)立試驗(yàn),共進(jìn)行a×bn次試驗(yàn),試驗(yàn)數(shù)據(jù)為xij,這n個試驗(yàn)數(shù)據(jù)如表2-7所示。水平搭配

18、 共進(jìn)行a×b=n次試驗(yàn)表2-7 雙因素?zé)o重復(fù)試驗(yàn)數(shù)據(jù)及計算表因素A因素BB1 B2 Bj Bbxi.A1A2AiAax11 x12 x1j x1bx21 x22 x2j x2bxi1 xi2 xij xibxa1 xa2 xaj xabx1.x2.xi.xa.x.jx.1 x.2 x.j x.b x.表中行求和: (i1,2,a)行平均數(shù):列求和: (j1,2,b)列平均數(shù):總數(shù)據(jù)和:總平均數(shù):=x./ab=x./n n=ab要求分別檢驗(yàn)A、B兩因素對試驗(yàn)結(jié)果有無顯著影響,即檢驗(yàn)假設(shè):H01:因素A 無顯著影響H02:因素B無顯著影響2. 雙因素?zé)o重復(fù)試驗(yàn)方差分析步驟(1) 偏差平方和的分解為了構(gòu)造檢驗(yàn)用的統(tǒng)計量,與單因素方差分析一樣,先對偏差平方和進(jìn)行分解。ST=不難證明,后三項(xiàng)交叉積均為零,例如(又)ST=令SA= SA為因素A各水平間(即各行間)的偏差平方和,反映了因素A對試驗(yàn)結(jié)果的影響;令SB= SB為因素B各水平間(即各列間)的偏差平方和,反映了因素B對試驗(yàn)結(jié)果的影響;Se=Se為誤差的偏差平方和,即組內(nèi)偏差平方和,反映了試驗(yàn)誤差的大小。因此,是(2-15)可簡記為ST=SASB +Se (2-16)(2)偏差平方和的簡化計算 ST=SA+SB+

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論