版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
方差分析簡(jiǎn)介引言方差分析(analysisofvariance,簡(jiǎn)稱ANOVA)是一種假設(shè)檢驗(yàn)方法,即基本思想可概述為:把全部數(shù)據(jù)的總方差分解成幾部分,每一部分表示某一影響因素或各影響因素之間的交互作用所產(chǎn)生的效應(yīng),將各部分方差與隨機(jī)誤差的方差相比較,依據(jù)F分布作出統(tǒng)計(jì)推斷,從而確定各因素或交互作用的效應(yīng)是否顯著。因?yàn)榉治鍪峭ㄟ^計(jì)算方差的估計(jì)值進(jìn)行的,所以稱為方差分析。方差分析的主要目標(biāo)是檢驗(yàn)均值間的差別是否在統(tǒng)計(jì)意義上顯著。如果只比較兩個(gè)均值,事實(shí)上方差分析的結(jié)果和t檢驗(yàn)完全相同。只所以很多情況下采用方差分析,是因?yàn)樗哂腥缦聝蓚€(gè)優(yōu)點(diǎn):(1)方差分析可以在一次分析中同時(shí)考察多個(gè)因素的顯著性,比t檢驗(yàn)所需的觀測(cè)值少;(2)方差分析可以考察多個(gè)因素的交互作用。方差分析的缺點(diǎn)是條件有些苛刻,需要滿足如下條件:(1)各樣本是相互獨(dú)立的;(2)各樣本數(shù)據(jù)來自正態(tài)總體(正態(tài)性:normality);(3)各處理組總體方差相等(方差齊性:homogeneityofvariance)。因此在作方差分析之前,要作正態(tài)性檢驗(yàn)和方差齊性檢驗(yàn),如不滿足上述要求,可考慮作變量變換。常用的變量變換方法有平方根變換,平方根反正弦變換、對(duì)數(shù)變換及倒數(shù)變換等。方差分析在醫(yī)藥、制造業(yè)、農(nóng)業(yè)等領(lǐng)域有重要應(yīng)用,多用于試驗(yàn)優(yōu)化和效果分析中。單因素方差分析2.1基本概念(1) 試驗(yàn)指標(biāo):在一項(xiàng)試驗(yàn)中,用來衡量試驗(yàn)效果的特征量稱為試驗(yàn)指標(biāo),有時(shí)簡(jiǎn)稱指標(biāo),也稱試驗(yàn)結(jié)果,通常用y表示。它類似于數(shù)學(xué)中的因變量或目標(biāo)函數(shù)。試驗(yàn)指標(biāo)用數(shù)量表示稱為定量指標(biāo),如速度、溫度、壓力、重量、尺寸、壽命、硬度、強(qiáng)度、產(chǎn)量和成本等。不能直接用數(shù)量表示的指標(biāo)稱為定性指標(biāo)。如顏色,人的性別等。定性指標(biāo)也可以轉(zhuǎn)化為定量指標(biāo),方法是用不同的數(shù)表示不同的指標(biāo)值。(2) 試驗(yàn)因素:試驗(yàn)中,凡對(duì)試驗(yàn)指標(biāo)可能產(chǎn)生影響的原因都稱為因素(factor),也稱因子或元,類似于數(shù)學(xué)中的自變量。需要在試驗(yàn)中考察研究的因素,稱為試驗(yàn)因素,有時(shí)也稱為因素,通常用大寫字母A、B、C、……表示。在試驗(yàn)中,有些因素能嚴(yán)格控制,稱為可控因素;有些因素難以控制,稱為不可控因素。試驗(yàn)因素是試驗(yàn)中的已知條件,能嚴(yán)格控制,所以是可控因素。通常把未被選作試驗(yàn)因素的可控因素和不可控因素都稱為條件因素,統(tǒng)稱為試驗(yàn)條件。(3) 因素水平:因素在試驗(yàn)中所處的各種狀態(tài)或所取的不同值,稱為該因素的水平(level),也簡(jiǎn)稱為水平或位級(jí),通常用下標(biāo)1、2、3、……表示。若一個(gè)因素取K種狀態(tài)或K個(gè)值,就稱該因素為K水平因素。因素的水平,有的可以取得具體值,如6Kg、10cm;有的只能取大致范圍或某個(gè)模糊概念,如軟、硬、大、小、好、較好等;但也有無法用數(shù)值表征的,如履帶的不同形式,輪胎花紋的不同種類,機(jī)器的不同操作方式,大豆的不同品種等。(4) 處理組:所有試驗(yàn)因素的水平組合所形成的試驗(yàn)點(diǎn)稱為處理組(treatmentgroup),也稱組合處理。三因素試驗(yàn)中,A1B2C3是一個(gè)組合處理,它表示由A因素1水平、B因素2水平和C因素3水平組合而形成的一個(gè)試驗(yàn)點(diǎn)。2.2主要步驟假設(shè)我們?cè)趯?shí)驗(yàn)中只考慮因素A,該因素有p個(gè)水平,每個(gè)水平做r次重復(fù)試驗(yàn),設(shè)第i個(gè)水平的第j次重
12jr表1試驗(yàn)數(shù)據(jù)根據(jù)這些數(shù)據(jù),可以計(jì)算全體數(shù)據(jù)的均值y和和各水平對(duì)應(yīng)數(shù)據(jù)的均值:復(fù)試驗(yàn)的數(shù)據(jù)為y,如表1所示。j-iyyy二yyy復(fù)試驗(yàn)的數(shù)據(jù)為y,如表1所示。j-iyyy二yyy,rp 耳i=1j=1i-r9j=i進(jìn)一步,可以計(jì)算全體數(shù)據(jù)的偏差平方和S]、因素A對(duì)應(yīng)的偏差平方和,以及誤差的偏差平方和S:下一步,需要計(jì)算這三個(gè)偏差平方和所對(duì)應(yīng)的自由度。之所以要計(jì)算自由度A,是因?yàn)槿绻闷钇椒胶统詫?duì)應(yīng)的數(shù)據(jù)項(xiàng)數(shù),得到的統(tǒng)計(jì)量并不是方差的無偏估計(jì)。而偏差平方和與對(duì)應(yīng)的自由度的商才是方差的無偏估計(jì)。設(shè)有n個(gè)數(shù)據(jù)X],x2,…,xn,它們的平方和S=yx2的自由度取決于{xj之間有多少個(gè)線性約束關(guān)系。設(shè)X=(X],x2,…,xn)T,若存在秩為m的矩陣A,滿足1=]則S的自由度是n-m。下面來求S的自由度。令x=y-y,i=1,2,...,p,j=1,2,...,r,k=(i-1)r+j,則{x.}之間存在一個(gè)T kij i線性約束即m=1,A=(1,1,...,1),故f=rp—1。同理可得f=p—1,f=rp—p。T A e可以證明(證明本文從略),對(duì)于偏差平方和與其對(duì)應(yīng)的自由度,如下關(guān)系成立:S=S+S,f=f+fTAeTAe這就是Fisher偏差平方和加性原理,它是全部方差分析的基礎(chǔ)。在得到偏差平方和及其對(duì)應(yīng)的自由度后,就可以得到因素A和誤差e對(duì)應(yīng)的平均偏差平方和S=S/f,S=S/fAAAeee平均偏差平方和是反映數(shù)據(jù)波動(dòng)大小的一個(gè)測(cè)度,比較S和S的大小可以看出因素A的不同水平帶來的試A e —— ——驗(yàn)指標(biāo)的波動(dòng)是否與隨機(jī)誤差相同,所以,可以由此判斷因素A對(duì)試驗(yàn)指標(biāo)是否有顯著影響。判斷S和S是否A e相同的方法采用F檢驗(yàn)(基于F分布的假設(shè)檢驗(yàn)),令則可認(rèn)為F服從自由度為f和f的F分布。用求出的F值查F分布表可得到對(duì)應(yīng)的P值,一般取置信水平a=Ae0.05,即當(dāng)P值小于0.05時(shí)拒絕原假設(shè),認(rèn)為因素A對(duì)試驗(yàn)指標(biāo)的影響顯著,否則維持原假設(shè),認(rèn)為影響不顯著。2.3數(shù)學(xué)模型設(shè)因素A取了p個(gè)水平,每個(gè)水平重復(fù)了r次試驗(yàn),在水平Ai下的第i次實(shí)驗(yàn)結(jié)果可以分解為其中,卩表示在水平Ai下的理論指標(biāo)值,£是試驗(yàn)誤差。我們把試驗(yàn)誤差£認(rèn)為是相互獨(dú)立的隨機(jī)變量,且i ij ij服從正態(tài)分布N(O,b2),這是方差的基本假設(shè)之一。為了看出因素各水平的影響大小,將卩再進(jìn)行分解,令i
a=卩一卩,i=1,2,…,piiya=卩一卩,i=1,2,…,piiy=P+a+e,i=1,2,…,p;j=1,2,…,rjiij顯然{a.}之間有關(guān)系a.表示水平A.對(duì)試驗(yàn)結(jié)果產(chǎn)生的影響,它稱作水平A.的效應(yīng)。111方差分析的數(shù)學(xué)模型就是建立在這么幾條假定的基礎(chǔ)上的:(1)y=P+a+e,i=1,2,…,p;j=1,2,…,rijij(2)Ya=0ii=1£相互獨(dú)立且都服從分布N(0,Q2)ij由這三條建立的模型叫做線性模型。建立模型以后,統(tǒng)計(jì)分析需要解決下列問題:1.(3)2.參數(shù)估計(jì)。即通過試驗(yàn)估計(jì)|J和{a.},它們的估計(jì)量用“和{a}表示。八 1 i可以證明(本文從略),“和{a}是》和{a.}的無偏估計(jì)。i 1假設(shè)檢驗(yàn)。如果因素A對(duì)指標(biāo)有影響,效應(yīng){a1}不全為0,如果因素A對(duì)指標(biāo)沒有影響,則效應(yīng){a1}全為0。因此,要檢驗(yàn)因素A對(duì)指標(biāo)影響是否顯著就是檢驗(yàn)假設(shè) 1這需要選擇一個(gè)合適的統(tǒng)計(jì)量。令e=1工「i-rij
j=1匕丄Y為erp 9i=1j=1如果原假設(shè)H0成立,則a1=a2=..=a=0,p因?yàn)椤阩相互獨(dú)立且都服從分布N(0Q2),由統(tǒng)計(jì)理論推知.92服從自由度為fA=(p-1)的咒2分布,S何2服從自由度為f=(n-p)的X2分布,而且兩者獨(dú)立,從而布,e e服從自由度為f,f的F分布。所以可以采用F統(tǒng)計(jì)量作為假設(shè)檢驗(yàn)的統(tǒng)計(jì)量(這種假設(shè)檢驗(yàn)稱為F檢驗(yàn)),Ae通過查F分布表確定拒絕域或P值,從而作出推斷結(jié)論。3.多因素方差分析所謂多因素方差分析,就是同時(shí)檢驗(yàn)多個(gè)因素影響是否顯著的方差分析方法。多因素方差分析。方差分析的一大優(yōu)勢(shì)就是可以同時(shí)考慮多個(gè)試驗(yàn)因素對(duì)試驗(yàn)指標(biāo)的影響,這樣,既節(jié)省了試驗(yàn)次數(shù),試驗(yàn)誤差也比進(jìn)行多次單因素方差分析要小。在多因素方差分析中,有一個(gè)很重要的問題,就是試驗(yàn)設(shè)計(jì)(DOE:DesignofExperiment)。其主要目的是通過設(shè)計(jì)每次試驗(yàn)中因素水平的搭配,用盡可能少的試驗(yàn)次數(shù)和試驗(yàn)數(shù)據(jù)滿足方差分析的要求,獲得較好的分析結(jié)果。最常用的試驗(yàn)設(shè)計(jì)有析因設(shè)計(jì)和正交設(shè)計(jì)。前者是對(duì)所有因素的所有水平組合都進(jìn)行試驗(yàn),因此又稱交叉分組設(shè)計(jì);后者是按照某種正交表設(shè)計(jì)試驗(yàn),以較少的試驗(yàn)次數(shù)即可接近析因設(shè)計(jì)的效果。因此,析因設(shè)計(jì)一般用于兩個(gè)因素且水平數(shù)較少的情況,而因素和水平較多時(shí)則多采用正交設(shè)計(jì)。除正交設(shè)計(jì)外,還有其它許多實(shí)驗(yàn)設(shè)計(jì)方法,如系統(tǒng)分組設(shè)計(jì)(嵌套設(shè)計(jì))、正交拉丁方設(shè)計(jì)、裂區(qū)設(shè)計(jì)等,它們一般用在并非任意組合都可以實(shí)現(xiàn)或找不到合適的正交表的情況。實(shí)驗(yàn)設(shè)計(jì)確定的一個(gè)水平組合,如A]B2A3,稱作一個(gè)處理組。如果在一個(gè)處理組內(nèi)做多次重復(fù)試驗(yàn)得到多個(gè)試驗(yàn)數(shù)據(jù),則稱為有重復(fù)試驗(yàn)的設(shè)計(jì),否則稱無重復(fù)試驗(yàn)的設(shè)計(jì)。在方差分析中,一般要求各處理組內(nèi)的重復(fù)試驗(yàn)數(shù)相等。對(duì)于不相等的情況,方差分析也可以計(jì)算,但公式略有差別,而且可靠性差,所以一般采用其它方法如通用線性模型(GLM:GeneralLinearModel)來計(jì)算。在多因素方差分析中,還有一個(gè)重要的概念,這就是因素間的交互作用(interaction),它是指幾個(gè)因素的某些水平互相增強(qiáng)或互相削弱的現(xiàn)象。表2中,當(dāng)A從A1變化到A2時(shí),指標(biāo)都增加,與B取B1或B2無關(guān);同樣,B從B]變到B2時(shí),指標(biāo)都增加,與A的水平無關(guān),此時(shí),我們說A和B之間沒有交互作用。而在表3中,因素A對(duì)指標(biāo)的影響與B的水平有關(guān),此時(shí)我們說A和B之間存在交互作用,記作AXBO表2無交互作用的試驗(yàn)數(shù)據(jù)A1A2B125A2710表3有交互作用的試驗(yàn)數(shù)據(jù)A1a225A2733?1析因設(shè)計(jì)的方差分析由于析因設(shè)計(jì)主要用于因素和水平數(shù)較少的情形,所以本文以雙因素試驗(yàn)為例,介紹析因設(shè)計(jì)的方差分析的主要步驟。設(shè)考慮兩個(gè)試驗(yàn)因素A和B,A有p個(gè)水平,B有q個(gè)水平,每個(gè)處理組內(nèi)做r次重復(fù)試驗(yàn),在A.B.條件下的第k次實(shí)驗(yàn)的數(shù)據(jù)記作y;在A.B.條件下做的全部試驗(yàn)數(shù)據(jù)之和記作Y?,顯然ijk 1j ij令Ka表示在A條件下試驗(yàn)數(shù)據(jù)之和,Kb表示在B條件下試驗(yàn)數(shù)據(jù)之和,即i i j j它們的平均值記為kA和kBij整個(gè)試驗(yàn)的總平均則總偏差平方和S,因素A和B的偏差平方和S,S,誤差的偏差平方和S,交互作用的偏差平方和S分T AB e AxB別計(jì)算如下S二qr才(kA-y)2,S=pr£(kB-y)2A i B ji=1 j=1它們的自由度分別為需要注意的是:如果各處理組中沒有重復(fù)試驗(yàn),即r=1,那么按上式計(jì)算出的S=0,這將導(dǎo)致后續(xù)步驟無法e開展。因此,在無重復(fù)試驗(yàn)的情形,應(yīng)該用下式計(jì)算S和fe e此時(shí),將無法計(jì)算S。因此,無重復(fù)試驗(yàn)的設(shè)計(jì)無法考察交互作用。AxB然后,計(jì)算平均偏差平方和和F值把這些F值查F表求得拒絕域或P值,即可做出統(tǒng)計(jì)推斷。類似于2.3節(jié),也可以得到雙因素方差分析的數(shù)學(xué)模型:其中,{a},{b},{(ab)}分別為因素A,B的主效應(yīng)以及A與B的交互效應(yīng),滿足i j j工a二工b=0,工(ab)二工(ab)=0ijijiji=1 j=1 i=1 j=1{£}為實(shí)驗(yàn)的隨機(jī)誤差,它們相互獨(dú)立且都服從正態(tài)分布N(0,b2)。ijk由這一模型,可以與2.3節(jié)類似地得出各參數(shù)的估計(jì),以及采用F檢驗(yàn)的原因。3.2正交設(shè)計(jì)的方差分析正交設(shè)計(jì)是利用一系列規(guī)格化的正交表來科學(xué)地安排多因素試驗(yàn)的一種十分有效的設(shè)計(jì)方法。其原理是從各因素各水平的全搭配中選擇一部分必不可少的搭配進(jìn)行試驗(yàn),從而大大減少試驗(yàn)次數(shù),又基本不降低研究效率。正交表是已經(jīng)制作好的規(guī)格化的表,可分為同水平的和混合水平的2大類。等水平表一般記作形如L(bc),a其中a表示正交表的行數(shù),即試驗(yàn)的次數(shù);b表示因素的水平數(shù),即每個(gè)因素有b個(gè)水平;c表示正交表的列數(shù)即因素?cái)?shù)。所以,正交表L(bc)用于c個(gè)因素,每個(gè)因素b個(gè)水平的情形,按該表設(shè)計(jì)共需做a次試驗(yàn)。表4所a示為等水平表L(23)。表5所示為一個(gè)混合正交表L(2ix33),這表示可以安排4個(gè)因素,其中一個(gè)因素有24 9水平,另外3個(gè)因素有3水平,共需9次試驗(yàn)。表4正交表L4(23)試驗(yàn)號(hào)-列號(hào)1231111212232124221列名ABAXB表5正交表L(2ix33)9試驗(yàn)號(hào)--列■號(hào)一1234111112122231333411235123161312721328221392321之所以選用正交表,是因?yàn)樗哂腥缦滦再|(zhì):在任何一列中各水平都出現(xiàn)且出現(xiàn)的次數(shù)相等,在任意兩列之間各種不同水平的所有可能組合都出現(xiàn),且出現(xiàn)的次數(shù)相等。這就使得部分試驗(yàn)中所有因素的所有水平信息即兩兩因素間的所有組合信息無一遺漏,且任一因素各水平的試驗(yàn)條件相同,從而能最大限度的反映該因素不同水平對(duì)試驗(yàn)指標(biāo)的影響。在3.1節(jié)中討論了雙因素情況下的交互作用,事實(shí)上,當(dāng)有多個(gè)因素時(shí),還存在多個(gè)因素的交互作用,稱為高級(jí)交互作用,記作AXBXC。在正交試驗(yàn)設(shè)計(jì)中,交互作用一律當(dāng)作因素看待,這是處理交互作用問題的一條總的原則。在正交表中,一般都為交互作用安排了相應(yīng)的列,如表4中的L(23)的第3列即用于安排交互作4用AXB,這意味著使用這一正交表時(shí),如果要考察交互作用,則只能考慮兩個(gè)因素,因?yàn)榈?列已經(jīng)被占用了。但和因素不同的是,用于考慮交互作用的列并不影響試驗(yàn)方案及其實(shí)施,也就是說不必在試驗(yàn)中刻意安排交互作用,只需計(jì)算時(shí)按第3列計(jì)算即可,而且一個(gè)交互作用不一定只占1列,也可能占有多列。
因?yàn)檎辉O(shè)計(jì)中把交互作用看作因素安排到正交表的列中,因此使得方差分析的計(jì)算過程更加簡(jiǎn)單了。設(shè)選用正交表L(bc)進(jìn)行正交試驗(yàn),即有c列,每列b個(gè)水平,共a個(gè)處理組,設(shè)每個(gè)處理組有r個(gè)數(shù)據(jù),第i個(gè)處a理組的第t個(gè)數(shù)據(jù)記為y,則全體的均值y和第j列第k個(gè)水平的均值y為二丄工藝ar二丄工藝ari=1t=1=l工Yy
]kr-C(j,k)g(i,心t=l 〃其中,c(j,k其中,c(j,k)表示第j列中第k個(gè)水平出現(xiàn)的次數(shù),g(i,j)=k表示第i個(gè)處理組中第j列的水平是k。由此,總偏差平方和St,各列的偏差平方和jST隹5—刃2,Sj=字(j刃2i=lk=l k=l其對(duì)應(yīng)的自由度分別為注意,第j列的偏差平方和S可能是因素的偏差平方和,可能是交互作用的偏差平方和,也可能是空列的偏差j平方和。如果正交表中留有空列,則令S=工S,f=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度PVC電工管材及配件批發(fā)合同范本3篇
- 科技引領(lǐng)下的旅游安保創(chuàng)新實(shí)踐
- 2025年度個(gè)人消費(fèi)貸款保證擔(dān)保協(xié)議范本4篇
- 2025年度個(gè)人二手房出售與貸款擔(dān)保合同2篇
- 小學(xué)生數(shù)學(xué)問題解決能力的多維度培養(yǎng)
- 2025年度個(gè)人公司股權(quán)代持爭(zhēng)議解決合同2篇
- 2025版施工現(xiàn)場(chǎng)消防安全保衛(wèi)與應(yīng)急管理合同3篇
- 小學(xué)生網(wǎng)絡(luò)安全意識(shí)的提升途徑
- 海南2025年海南醫(yī)科大學(xué)第一附屬醫(yī)院招聘206人筆試歷年參考題庫附帶答案詳解
- 2025年度智能農(nóng)業(yè)管理系統(tǒng)個(gè)人股東股權(quán)轉(zhuǎn)讓協(xié)議書3篇
- 2024年全國(guó)統(tǒng)一考試高考新課標(biāo)Ⅱ卷數(shù)學(xué)試題(真題+答案)
- 2024山西省文化旅游投資控股集團(tuán)有限公司招聘筆試參考題庫附帶答案詳解
- 科普知識(shí)進(jìn)社區(qū)活動(dòng)總結(jié)與反思
- 加油站廉潔培訓(xùn)課件
- 現(xiàn)金日記賬模板(帶公式)
- 消化內(nèi)科專科監(jiān)測(cè)指標(biāo)匯總分析
- 2023屆上海市松江區(qū)高三下學(xué)期二模英語試題(含答案)
- 深圳市物業(yè)專項(xiàng)維修資金管理系統(tǒng)操作手冊(cè)(電子票據(jù))
- 混凝土結(jié)構(gòu)工程施工質(zhì)量驗(yàn)收規(guī)范
- 2023年鐵嶺衛(wèi)生職業(yè)學(xué)院高職單招(數(shù)學(xué))試題庫含答案解析
- 起重機(jī)械安裝吊裝危險(xiǎn)源辨識(shí)、風(fēng)險(xiǎn)評(píng)價(jià)表
評(píng)論
0/150
提交評(píng)論