建模培訓(xùn)講座第二講方差分析及_第1頁(yè)
建模培訓(xùn)講座第二講方差分析及_第2頁(yè)
建模培訓(xùn)講座第二講方差分析及_第3頁(yè)
建模培訓(xùn)講座第二講方差分析及_第4頁(yè)
建模培訓(xùn)講座第二講方差分析及_第5頁(yè)
已閱讀5頁(yè),還剩95頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

建模培訓(xùn)講座第二講方差分析及第一頁(yè),共一百頁(yè),2022年,8月28日在現(xiàn)實(shí)的生產(chǎn)和經(jīng)營(yíng)管理中,經(jīng)常要分析各種因素對(duì)研究對(duì)象某些特征值的影響.方差分析(analysisofvariance)就是采用數(shù)理統(tǒng)計(jì)方法對(duì)數(shù)據(jù)進(jìn)行分析,以鑒別各種因素對(duì)研究對(duì)象的某些特征值影響大小的一種有效方法.研究對(duì)象的特征值,即所考察的試驗(yàn)(其涵義包括調(diào)查,收集等)結(jié)果(如產(chǎn)品質(zhì)量、數(shù)量、銷(xiāo)量、成本等)稱(chēng)為試驗(yàn)指標(biāo),簡(jiǎn)稱(chēng)指標(biāo),常用x表示.在試驗(yàn)中對(duì)所關(guān)心的“指標(biāo)”有影響的、要加以考察而改變狀態(tài)的原因稱(chēng)為因素,用A,B,C等大寫(xiě)英文字母表示.第2.1節(jié)方差分析的基本思想

第二頁(yè),共一百頁(yè),2022年,8月28日在科學(xué)實(shí)驗(yàn)中常常要探討不同實(shí)驗(yàn)條件或處理方法對(duì)實(shí)驗(yàn)結(jié)果的影響。通常是比較不同實(shí)驗(yàn)條件下樣本均值間的差異方差分析是檢驗(yàn)多組樣本均值間的差異是否具有統(tǒng)計(jì)意義的一種方法。例如醫(yī)學(xué)界研究幾種藥物對(duì)某種疾病的療效;農(nóng)業(yè)研究土壤、肥料、日照時(shí)間等因素對(duì)某種農(nóng)作物產(chǎn)量的影響不同飼料對(duì)牲畜體重增長(zhǎng)的效果等都可以使用方差分析方法去解決第三頁(yè),共一百頁(yè),2022年,8月28日因素在試驗(yàn)中所取的各種不同狀態(tài)稱(chēng)為因素的水平.因素A的r個(gè)水平常用A1,A2,…,Ar表示,其中r稱(chēng)為因素A的水平數(shù).若在試驗(yàn)中考慮了因素的全部水平,則該因素稱(chēng)為固定因素;若在試驗(yàn)中僅隨機(jī)選擇了因素的部分水平,則該因素稱(chēng)為隨機(jī)因素.若只考察一個(gè)因素對(duì)指標(biāo)的影響,這種試驗(yàn)稱(chēng)為單因素試驗(yàn),相應(yīng)的方差分析就稱(chēng)為單因素方差分析;若一個(gè)試驗(yàn)中同時(shí)考察兩個(gè)因素,則相應(yīng)的試驗(yàn)稱(chēng)為雙因素試驗(yàn),這時(shí)所作的方差分析稱(chēng)為雙因素方差分析,在多因素試驗(yàn)中要考察的因素多于兩個(gè),相應(yīng)的方差分析稱(chēng)為多因素方差分析.第四頁(yè),共一百頁(yè),2022年,8月28日

方差分析(ANOVA)又稱(chēng)

F

檢驗(yàn),其目的是推斷多組資料的總體均數(shù)是否相等。本章主要內(nèi)容包括單因素方差分析(即完全隨機(jī)設(shè)計(jì)資料的方差分析)、兩因素方差分析(即隨機(jī)區(qū)組設(shè)計(jì)資料的方差分析)和三因素方差分析(即拉丁方設(shè)計(jì)資料的方差分析)及多個(gè)樣本均數(shù)間的多重比較。第五頁(yè),共一百頁(yè),2022年,8月28日方差分析的基本思想

方差分析的基本思想借助以下例題予以說(shuō)明:

例9-1為研究煤礦粉塵作業(yè)環(huán)境對(duì)塵肺的影響,將18只大鼠隨機(jī)分到甲、乙、丙3個(gè)組,每組6只,分別在地面辦公樓、煤炭倉(cāng)庫(kù)和礦井下染塵,12周后測(cè)量大鼠全肺濕重(g),數(shù)據(jù)見(jiàn)表9—2,問(wèn)不同環(huán)境下大鼠全肺濕重有無(wú)差別?第六頁(yè),共一百頁(yè),2022年,8月28日甲組乙組丙組4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.7

ni666第七頁(yè),共一百頁(yè),2022年,8月28日

從以上資料可看出,三個(gè)組的數(shù)據(jù)各不相同,這種差異(總變異)可以分解成兩部分:即

(1)組間變異:甲、乙、丙三個(gè)組大鼠全肺濕重各不相等(此變異反映了處理因素的作用,以及隨機(jī)誤差的作用)

(2)組內(nèi)變異:各組內(nèi)部大鼠的全肺濕重各不相等(此變異主要反映的是隨機(jī)誤差的作用)第八頁(yè),共一百頁(yè),2022年,8月28日各部分變異的計(jì)算:

①總變異(全部試驗(yàn)數(shù)據(jù)間大小不等)用總離均差平方和來(lái)表示。

其中第九頁(yè),共一百頁(yè),2022年,8月28日甲組乙組丙組4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.7

ni666第十頁(yè),共一百頁(yè),2022年,8月28日

②組間變異(由于所接受的處理因素不同而致各組間大小不等)用組間離均差平方和來(lái)表示。

各組均數(shù)之間相差越大,它們與總均數(shù)的差值就越大,越大;反之,越小。第十一頁(yè),共一百頁(yè),2022年,8月28日甲組乙組丙組4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.7

ni666第十二頁(yè),共一百頁(yè),2022年,8月28日③組內(nèi)變異(同一處理組內(nèi)部試驗(yàn)數(shù)據(jù)大小不等)用組內(nèi)離均差平方和來(lái)表示。

第十三頁(yè),共一百頁(yè),2022年,8月28日三個(gè)變異之間的關(guān)系:

其中:

第十四頁(yè),共一百頁(yè),2022年,8月28日離均差平方和只能反映變異的絕對(duì)大小。變異程度除與離均差平方和的大小有關(guān)外,還與其自由度有關(guān),由于各部分自由度不相等,因此各部分離均差平方和不能直接比較,須除以相應(yīng)的自由度,該比值稱(chēng)均方差,簡(jiǎn)稱(chēng)均方(MS)。

的大小就反映了各部分變異的平均大小。第十五頁(yè),共一百頁(yè),2022年,8月28日

方差分析就是通過(guò)比較組內(nèi)均方和組間均方的大小關(guān)系來(lái)判斷處理因素有無(wú)效應(yīng)。

檢驗(yàn)統(tǒng)計(jì)量:

如果各組的總體均數(shù)相等,即無(wú)處理因素的作用,則組內(nèi)變異和組間變異都只反映隨機(jī)誤差的大小,此時(shí)組間均方和組內(nèi)均方大小相當(dāng),即F值則接近1,各組均數(shù)間的差異沒(méi)有統(tǒng)計(jì)學(xué)意義;反之,如果處理有作用,則組間變異不僅包含隨機(jī)誤差,還有處理因素引起的變異(組間變異主要反映處理因素的作用),此時(shí)組間均方遠(yuǎn)大于組內(nèi)均方,則F值遠(yuǎn)大于1,各組均數(shù)間的差異有統(tǒng)計(jì)學(xué)意義。故依據(jù)F值的大小可判斷各組之間有無(wú)差別。第十六頁(yè),共一百頁(yè),2022年,8月28日

可見(jiàn),方差分析的基本思想就是根據(jù)實(shí)驗(yàn)設(shè)計(jì)的類(lèi)型,將全部測(cè)量值總的變異分解成兩個(gè)或多個(gè)部分,每個(gè)部分的變異可由某個(gè)因素的作用(或某幾個(gè)因素的作用)加以解釋?zhuān)ㄟ^(guò)比較各部分的均方與隨機(jī)誤差項(xiàng)均方的大小,借助

F

分布來(lái)推斷各研究因素對(duì)實(shí)驗(yàn)結(jié)果有無(wú)影響。第十七頁(yè),共一百頁(yè),2022年,8月28日二、方差分析的應(yīng)用條件(1)各觀測(cè)值相互獨(dú)立,并且服從正態(tài)分布;(2)各組總體方差相等,即方差齊性。第十八頁(yè),共一百頁(yè),2022年,8月28日

某公司為了研究三種內(nèi)容的廣告宣傳對(duì)某種無(wú)季節(jié)性的大型機(jī)械銷(xiāo)售量的影響進(jìn)行了調(diào)查統(tǒng)計(jì).經(jīng)廣告廣泛宣傳后,按寄回的廣告上的訂購(gòu)數(shù)計(jì)算,一年四個(gè)季度的銷(xiāo)售量(單位:臺(tái))為:廣告類(lèi)型 第一季度 第二季度 第三季度 第四季度A1 163 176 170 185 A2 184 198 179 190 A3 206 191 218 224 A1是強(qiáng)調(diào)運(yùn)輸方便性的廣告,A2是強(qiáng)調(diào)節(jié)省燃料的經(jīng)濟(jì)性的廣告,A3是強(qiáng)調(diào)噪音低的優(yōu)良性的廣告.試判斷:新聞廣告的類(lèi)型對(duì)該種機(jī)械的銷(xiāo)售量是否有顯著影響?若影響顯著,哪一種廣告內(nèi)容為好?新聞廣告是所要檢驗(yàn)的因素,三種不同的內(nèi)容是三個(gè)水平,這是一個(gè)單因素三水平的試驗(yàn).第十九頁(yè),共一百頁(yè),2022年,8月28日試驗(yàn)過(guò)程中各種偶然性(隨機(jī)性)因素的干擾所致差異,稱(chēng)為試驗(yàn)誤差.如果差異單純是由誤差引起的,那么我們認(rèn)為廣告的不同類(lèi)型對(duì)銷(xiāo)售量沒(méi)有顯著影響,則可簡(jiǎn)稱(chēng)因素(新聞廣告)不顯著,如果不同廣告下銷(xiāo)售量的不同,除了誤差影響外,主要是由于廣告類(lèi)型(水平)不同所造成的,那么我們就認(rèn)為因素的不同水平對(duì)銷(xiāo)售量有顯著影響,簡(jiǎn)稱(chēng)因素顯著.方差分析就是通過(guò)對(duì)試驗(yàn)結(jié)果的分析去判斷因素本身及各因素間交互作用對(duì)指標(biāo)是否影響顯著的一種統(tǒng)計(jì)方法.第二十頁(yè),共一百頁(yè),2022年,8月28日單因素方差分析(singlefactoranalysisofvariance)是要判斷因素各水平對(duì)指標(biāo)是否有顯著影響,歸結(jié)為判斷不同總體是否有相同分布的問(wèn)題.由于實(shí)際中常遇到的是具有正態(tài)分布的總體,同時(shí),在進(jìn)行方差分析時(shí),除了所關(guān)心的因素外,其他條件總是盡可能使其保持一致,這樣就可以認(rèn)為每個(gè)總體的方差是相同的,因而,判斷幾個(gè)總體是否具有相同分布的問(wèn)題就簡(jiǎn)化為檢驗(yàn)幾個(gè)具有等方差的正態(tài)總體均值是否相等的問(wèn)題.第2.2節(jié)單因素方差分析第二十一頁(yè),共一百頁(yè),2022年,8月28日考慮的因素記為A,假定它有r個(gè)水平,并對(duì)水平Ai作了ni次觀察,第i水平的第j次觀察為,這樣可得觀察資料設(shè)是來(lái)自總體的簡(jiǎn)單隨機(jī)樣本,檢驗(yàn)其中1.數(shù)學(xué)模型

第二十二頁(yè),共一百頁(yè),2022年,8月28日記則等價(jià)于記總觀察次數(shù),組平均值,總平均值,則有平方和分解式:2.方差分析第二十三頁(yè),共一百頁(yè),2022年,8月28日Q稱(chēng)為總離差平方和,簡(jiǎn)稱(chēng)總平方和,它反映全部數(shù)據(jù)之間的差異;Q1稱(chēng)為誤差平方和或組內(nèi)平方和,反映了隨機(jī)誤差的影響;Q2稱(chēng)為組間平方和或因素A的平方和,反映了各總體的樣本平均值之間的差異,在一定程度上反映了間的差異程度,因而通過(guò)Q2與Q1的相對(duì)大小可以反映H0是否成立.若Q2顯著地大于Q1,說(shuō)明間的差異顯著地大于隨機(jī)誤差,那么H0可能不成立.第二十四頁(yè),共一百頁(yè),2022年,8月28日取也就是說(shuō)有的把握認(rèn)為因素對(duì)指標(biāo)有顯著影響,即間的差異是顯著的.給定顯著性水平時(shí),拒絕H0.第二十五頁(yè),共一百頁(yè),2022年,8月28日通常情況下要列出方差分析表(analysisofvariancetable):第二十六頁(yè),共一百頁(yè),2022年,8月28日

某公司為了研究三種內(nèi)容的廣告宣傳對(duì)某種無(wú)季節(jié)性的大型機(jī)械銷(xiāo)售量的影響進(jìn)行了調(diào)查統(tǒng)計(jì).經(jīng)廣告廣泛宣傳后,按寄回的廣告上的訂購(gòu)數(shù)計(jì)算,一年四個(gè)季度的銷(xiāo)售量(單位:臺(tái))為:廣告類(lèi)型 第一季度 第二季度 第三季度 第四季度A1 163 176 170 185 A2 184 198 179 190 A3 206 191 218 224 A1是強(qiáng)調(diào)運(yùn)輸方便性的廣告,A2是強(qiáng)調(diào)節(jié)省燃料的經(jīng)濟(jì)性的廣告,A3是強(qiáng)調(diào)噪音低的優(yōu)良性的廣告.試判斷:新聞廣告的類(lèi)型對(duì)該種機(jī)械的銷(xiāo)售量是否有顯著影響?若影響顯著,哪一種廣告內(nèi)容為好?第二十七頁(yè),共一百頁(yè),2022年,8月28日所以拒絕H0,即認(rèn)為廣告內(nèi)容不同對(duì)銷(xiāo)售量的影響是顯著.分析結(jié)果如下:第二十八頁(yè),共一百頁(yè),2022年,8月28日例2.設(shè)有三臺(tái)機(jī)器,用來(lái)生產(chǎn)規(guī)格相同的鋁合金薄板.取樣,測(cè)量薄板的厚度精確至千分之一厘米.得結(jié)果如表所示.問(wèn)不同機(jī)器對(duì)生產(chǎn)的鋁合金板的厚度有無(wú)影響請(qǐng)看分別用菜單系統(tǒng)和程序進(jìn)行討論程序名datalb給出了單因素方差分析的典型解法,進(jìn)行了方差分析同時(shí)又在各水平組間進(jìn)行了均值的比較,作了直方圖,菜單系統(tǒng)和程序中均有選項(xiàng)”Dunnett”進(jìn)行某一水平和其余水平的均值差異比較和檢驗(yàn),選項(xiàng)”snk”則進(jìn)行所有水平間均值差異的比較和檢驗(yàn).第二十九頁(yè),共一百頁(yè),2022年,8月28日例.設(shè)有三臺(tái)機(jī)器,用來(lái)生產(chǎn)規(guī)格相同的鋁合金薄板.取樣,測(cè)量薄板的厚度精確至千分之一厘米.得結(jié)果如表所示.問(wèn)不同機(jī)器對(duì)生產(chǎn)的鋁合金板的厚度有無(wú)影響?第三十頁(yè),共一百頁(yè),2022年,8月28日1.編程輸入數(shù)據(jù):DataE411;inputc$y@@;cards;10.23620.25730.25810.23820.25330.26410.24820.25530.25910.24520.25430.26710.24320.26130.262;procprint;RUN;第三十一頁(yè),共一百頁(yè),2022年,8月28日Solution→Analysis→Analyst(分析員系統(tǒng))(出現(xiàn)空白數(shù)據(jù)表)→File→OpenBySasName…

(在Makeoneselection窗口中)work選中數(shù)據(jù)名E411→(OK)→Statistics→ANOVA→One-WayANOVA…Independent填分類(lèi)變量c→Dependent因變量yPlots—可選擇分水平的盒形圖(Box-&-WhiskerPlot),條形圖(BarChart)及均值、標(biāo)準(zhǔn)差圖Means—ComparisonsMethods給出了10種多重比較的方法

α為選擇的顯著性水平,Breakdown可按水平分組出描述性統(tǒng)計(jì)量→OK(點(diǎn)擊運(yùn)行后的結(jié)果樹(shù)標(biāo)簽則會(huì)打開(kāi)相應(yīng)圖.第三十二頁(yè),共一百頁(yè),2022年,8月28日編程進(jìn)行單因素方差分析DataE411;inputc$y@@;cards;10.23620.25730.25810.23820.25330.26410.24820.25530.25910.24520.25430.26710.24320.26130.262;procglm

data=E411;/*glm為方差分析*/classc;/*分類(lèi)變量c*/modely=c;/*模型因變量=自變量*/lsmeansc;/*最小誤差法*/meansc;/*求c的均值*/RUN;第三十三頁(yè),共一百頁(yè),2022年,8月28日第三十四頁(yè),共一百頁(yè),2022年,8月28日自由度公式總自由度f(wàn)t=試驗(yàn)次數(shù)n-1;誤差自由度f(wàn)e=總自由度f(wàn)t-模型自由度f(wàn)模型方差分析中

(單因素模型)因素A(即模型)的自由度f(wàn)A=水平數(shù)-1(A,B雙因素考慮交互效應(yīng)模型)

因素A的自由度f(wàn)A=水平數(shù)-1

因素B的自由度f(wàn)B=水平數(shù)-1

交互效應(yīng)A*B的自由度f(wàn)A*B=fA*fB

模型自由度f(wàn)模型=fA+fB+fA*B

回歸分析中項(xiàng)自由度=1

模型自由度f(wàn)模型=項(xiàng)自由度之和第三十五頁(yè),共一百頁(yè),2022年,8月28日第2.3節(jié)雙因素方差分析雙因素方差分析的數(shù)據(jù)結(jié)構(gòu)為1.無(wú)交互作用的雙因素方差分析(doublefactoranalysisofvariance)因素第三十六頁(yè),共一百頁(yè),2022年,8月28日因素A的第i種效應(yīng)和因素B的第j種效應(yīng)分別記作,試驗(yàn)誤差記作,那么其中假定(1)數(shù)學(xué)模型ji,ba第三十七頁(yè),共一百頁(yè),2022年,8月28日判斷因素A是否顯著,等價(jià)于檢驗(yàn)假設(shè)判斷因素B是否顯著等價(jià)于檢驗(yàn)假設(shè)將總離差平方和Q進(jìn)行分解:選取檢驗(yàn)統(tǒng)計(jì)量:(2)方差分析第三十八頁(yè),共一百頁(yè),2022年,8月28日列出如下方差分析表:第三十九頁(yè),共一百頁(yè),2022年,8月28日為提高某種產(chǎn)品的合格率,考察原料用量和來(lái)源地對(duì)其是否有影響.原料來(lái)源地有三個(gè):甲、乙、丙.原料用量有三種:現(xiàn)用量、增加5%、增加8%.每個(gè)水平組合各做一次試驗(yàn),得到的數(shù)據(jù)如下:試分析原料用量及來(lái)源地對(duì)產(chǎn)品合格率的影響是否顯著.解:設(shè)原料來(lái)源地為因素A,三個(gè)地區(qū)為因素A的三個(gè)水平,第i個(gè)水平對(duì)合格率的特殊效應(yīng)為;原料用量為因素B,三種用料量為因素B的三個(gè)水平,第j個(gè)水平對(duì)合格率的特殊效應(yīng)為,原假設(shè)為第四十頁(yè),共一百頁(yè),2022年,8月28日雙因素試驗(yàn)的方差分析,案例第四十一頁(yè),共一百頁(yè),2022年,8月28日第四十二頁(yè),共一百頁(yè),2022年,8月28日因素和指標(biāo)之間的應(yīng)該是什么樣的模型是由它們之間的客觀關(guān)系確定的,譬如雙因素A、B數(shù)據(jù)表(類(lèi)似數(shù)據(jù)Rocket處數(shù)據(jù)表)進(jìn)行方差分析討論時(shí)可能的模型有以下幾種:1)主效應(yīng)A、B都顯著、交互效應(yīng)A*B顯著(有交互效應(yīng)的雙因素方差分析模型)2)只有主效應(yīng)A顯著、主效應(yīng)B顯著(只有主效應(yīng)的雙因素方差分析模型)3)只有主效應(yīng)A顯著(單因素方差分析模型)4)只有主效應(yīng)B顯著(單因素方差分析模型)第四十三頁(yè),共一百頁(yè),2022年,8月28日我們的研究是發(fā)現(xiàn)這樣的合適的模型.看下例分析過(guò)程.

例3分析下面數(shù)據(jù)表,說(shuō)明合適的模型是個(gè)單因素模型(數(shù)據(jù)名E632)

下表(數(shù)據(jù)名E632)給出某種化工過(guò)程在三種濃度、四種溫度水平下得率的數(shù)據(jù).第四十四頁(yè),共一百頁(yè),2022年,8月28日第四十五頁(yè),共一百頁(yè),2022年,8月28日

抗?fàn)坷瓘?qiáng)度是硬橡膠的一項(xiàng)重要的性能指標(biāo),現(xiàn)試驗(yàn)考察下列兩個(gè)因素對(duì)該指標(biāo)的影響.A(硫化時(shí)間):A1(40秒),A2(60秒).B(催化劑種類(lèi)):B1(甲種),B2(乙種),B3(丙種).六種組合水平下,各重復(fù)做了兩次試驗(yàn),測(cè)得數(shù)據(jù)(單位:kg/cm2)如下,試問(wèn)因素A,因素B對(duì)該指標(biāo)的影響是否顯著?2.有交互作用的雙因素方差分析

第四十六頁(yè),共一百頁(yè),2022年,8月28日第二節(jié)兩因素方差分析第四十七頁(yè),共一百頁(yè),2022年,8月28日

1.數(shù)據(jù)輸入:見(jiàn)DataRocket2.編程進(jìn)行:procglm

data=rocket;classfm;/*class語(yǔ)句說(shuō)明對(duì)分類(lèi)變量

f,m分析*/modelr=fmf*m;

/*模型:連續(xù)變量r;考慮因素f,m及交互f*m*/lsmeansfmf*m;run;說(shuō)明:如果要考慮交互效應(yīng),則每一水平組合必須做重復(fù)試驗(yàn),否則可以不做重復(fù)試驗(yàn).第四十八頁(yè),共一百頁(yè),2022年,8月28日3.應(yīng)用分析員應(yīng)用系統(tǒng):Solution→Analysis→Analyst(分析員系統(tǒng))→(出現(xiàn)空白數(shù)據(jù)表)→File→OpenBySas(在Makeoneselection窗口中)→work(選中數(shù)據(jù)名Datarocket)→(OK)Statistics→ANOVA→FactorialANOVA…→Independent填分類(lèi)變量f,m→Dependent填因變量R

→Model-----StandardModelsMaineffectsonly只考慮主效應(yīng);Effectsupto2-wayinteractions考慮交互效應(yīng)Plots—可選擇響應(yīng)變量的均值(主效應(yīng)或交互效應(yīng))連線圖Means—ComparisonsMethods給出了10種多重比較的方法

α為選擇的顯著性水平,Breakdown可按水平分組出描述性統(tǒng)計(jì)量→OK請(qǐng)看演示第四十九頁(yè),共一百頁(yè),2022年,8月28日第三節(jié)多因素(≥3)方差分析

指標(biāo)y(回收率),因素:XA(尿素量),XB(水量),XC(反應(yīng)時(shí)間),XD(溶劑量)(一)初步分析:從數(shù)據(jù)表(見(jiàn)dataQ98)看出各因素等間距取值,由正交多項(xiàng)式理論,此時(shí)因素的主效應(yīng)(在以下變換的前提下,注意未經(jīng)變換主效應(yīng)的線性部分和二次項(xiàng)部分無(wú)法有正交性分解)可以進(jìn)一步分解成線性部分和二次項(xiàng)部分.對(duì)于顯著因素,如果二次項(xiàng)部分不顯著,只是線性項(xiàng)部分顯著,那么因素與指標(biāo)呈線性關(guān)系;如果二次項(xiàng)部分顯著那么因素與指標(biāo)呈拋物線關(guān)系.因素等間距取值時(shí),因素的取值與水平數(shù)(自然數(shù)1,2,3)可以有線性變換關(guān)系

新變量(可看成水平序號(hào),已經(jīng)無(wú)量綱影響)=(原變量-左端點(diǎn))/步長(zhǎng)+1此時(shí)在SAS中應(yīng)先用水平數(shù)為自變量進(jìn)行項(xiàng)的刪選,刪選結(jié)束用水平數(shù)與原始變量進(jìn)行方差分析和回歸分析結(jié)論完全相同第五十頁(yè),共一百頁(yè),2022年,8月28日說(shuō)明:A,B,C,B分別是四個(gè)因素在正交表上的水平值(二)數(shù)據(jù)輸入dataQ98;inputnumber$ABCDXAXBXCXDy;A2=A**2;B2=B**2;C2=C**2;D2=D**2;XA2=XA**2;XB2=XB**2;XC2=XC**2;XD2=XD**2;cards;(數(shù)據(jù)略)procprint;run;第五十一頁(yè),共一百頁(yè),2022年,8月28日

(三)分析過(guò)程進(jìn)行分析時(shí)(1)當(dāng)因素很多或誤差自由度顯然不夠時(shí)可先只考察所有因素的主效應(yīng),如有可能再進(jìn)一步考慮主要因素的二次項(xiàng)和交互項(xiàng)或(2)當(dāng)試驗(yàn)次數(shù)相對(duì)較多時(shí)直接在進(jìn)行變量代換新變量(可看成水平序號(hào))=(原變量-左端點(diǎn))/步長(zhǎng)+1后,可考慮所有一次項(xiàng)和二次項(xiàng)采用逐步回歸刪去不顯著的項(xiàng)直接討論本例先采用方法(1)分步討論與直接采用方法(2)討論的結(jié)果是一致的方法(1)第一步得輸出表如下:第五十二頁(yè),共一百頁(yè),2022年,8月28日第五十三頁(yè),共一百頁(yè),2022年,8月28日分析:由于每個(gè)因素自由度2,合計(jì)模型自由度8,n-1-p=0即誤差自由度為0,從而無(wú)法產(chǎn)生統(tǒng)計(jì)量F和相應(yīng)概率Pr,但從平方和分解中可以看出因素效應(yīng)大小的順序,并看出因素D是不顯著的,故可以刪去因素D后進(jìn)入

StatisticsRegression-Linear重新分析(在選項(xiàng)Statistics中選擇Ⅰ型平方和SS)得表如下(從平方和比較中可以看出因素A只是線性效應(yīng)而因素B,C呈拋物線效應(yīng),):第五十四頁(yè),共一百頁(yè),2022年,8月28日刪除A2項(xiàng)重新上步工作得最終結(jié)果如表:

第五十五頁(yè),共一百頁(yè),2022年,8月28日項(xiàng)的刪選結(jié)束后當(dāng)采用原始數(shù)據(jù)進(jìn)行回歸可發(fā)現(xiàn)方差分析結(jié)束完成一致并且得原變量和指標(biāo)的回歸方程見(jiàn)下表方法(1)的以上過(guò)程與對(duì)新變量采用方法(2)直接利用逐步回歸直接完成的結(jié)論相同第五十六頁(yè),共一百頁(yè),2022年,8月28日第五十七頁(yè),共一百頁(yè),2022年,8月28日第五十八頁(yè),共一百頁(yè),2022年,8月28日多因素(≥3)方差分析(續(xù))五因素三水平安排在正交表L18(37)上,要考察每個(gè)因素和其平方對(duì)指標(biāo)y的影響的顯著性.數(shù)據(jù)見(jiàn)下程序dataQ146;inputnumber$ABCDEy;A2=A*A;B2=B*B;C2=C*C;D2=D*D;E2=E*E;cards;111111943.44212222975.06(…數(shù)據(jù)部分略);procprint;run;第五十九頁(yè),共一百頁(yè),2022年,8月28日Solution→Analysis→Analyst(“分析員應(yīng)用”)→File→OpenBySasName…→

(在Makeoneselection窗口中)work選中數(shù)據(jù)名Q146→(OK)→Statistics→Regression→Linear…線性回歸在線性回歸主窗口中Dependen填入因變量;Explanatory填入各自變量;(以下為返回式選項(xiàng)窗口,進(jìn)入該類(lèi)窗口并進(jìn)行選擇后→OK返回)→OK→Model選擇篩選變量的方法→逐步回歸stepwiseselection(如果對(duì)項(xiàng)的入選采取較寬容的態(tài)度可以適當(dāng)調(diào)大α值譬如0.1)→OK;→Statistics選擇Type1sumofsquares→OK→OK請(qǐng)看演示第六十頁(yè),共一百頁(yè),2022年,8月28日第六十一頁(yè),共一百頁(yè),2022年,8月28日總和T,修正項(xiàng)CT,以及各列的波動(dòng)平方和Si和總波動(dòng)平方和ST等可以用SAS求得:dataQ143;inputABCEmy;cards;11115.09/*數(shù)據(jù)前三列為正交表L9(34)前三列*/122220.39133324.56212316.8223123.23231218.94313221.01321315.59332122.34;procprint;run;第六十二頁(yè),共一百頁(yè),2022年,8月28日運(yùn)行數(shù)據(jù)后再利用SAS菜單系統(tǒng)進(jìn)行方差分析:Solution→Analysis→Analyst→(分析員系統(tǒng))(出現(xiàn)空白數(shù)據(jù)表)→File→OpenBySas(在Makeoneselection窗口中)

→work(選中數(shù)據(jù)名DataQ143)→(OK)→Statistics→ANOVA→LinearModels…→Independent填分類(lèi)變量A,B,C→Dependent因變量(響應(yīng)變量)填y→在選項(xiàng)Statistics→

Type1下打勾→OK→OK請(qǐng)看演示第六十三頁(yè),共一百頁(yè),2022年,8月28日發(fā)現(xiàn)因素A不顯著,準(zhǔn)備刪去因素A,重新進(jìn)入菜單系統(tǒng):Statistics→ANOVA→LinearModels…→Reset后→Independent填分類(lèi)變量B,C→Dependent因變量(響應(yīng)變量)填y在選項(xiàng)Statistics→Type1下打勾→OK→OK請(qǐng)看演示第六十四頁(yè),共一百頁(yè),2022年,8月28日第四節(jié)拉丁方設(shè)計(jì)資料的方差分析

一、拉丁方設(shè)計(jì)完全隨機(jī)設(shè)計(jì)只涉及到一個(gè)處理因素;隨機(jī)區(qū)組設(shè)計(jì)涉及一個(gè)處理因素和一個(gè)區(qū)組因素。若實(shí)驗(yàn)涉及一個(gè)處理因素和兩個(gè)控制因素,而且每個(gè)因素的水平數(shù)相等,此時(shí)可采用拉丁方設(shè)計(jì)來(lái)安排實(shí)驗(yàn),將兩個(gè)控制因素分別安排在拉丁方的行和列上。第六十五頁(yè),共一百頁(yè),2022年,8月28日4×4ABCDDABCCDABBCDA第六十六頁(yè),共一百頁(yè),2022年,8月28日拉丁方是由g個(gè)拉丁字母排成的g×g方陣,每行或每列中每個(gè)字母都只出現(xiàn)一次,這樣的方陣稱(chēng)為g階拉丁方。拉丁方設(shè)計(jì)是在隨機(jī)區(qū)組設(shè)計(jì)的基礎(chǔ)上發(fā)展的,它可多安排一個(gè)已知的對(duì)實(shí)驗(yàn)結(jié)果有影響的非處理因素,提高了效率。應(yīng)用時(shí),根據(jù)水平數(shù)g

來(lái)選定拉丁方大小。第六十七頁(yè),共一百頁(yè),2022年,8月28日3×34×45×5ABCCABBCAABCDDABCCDABBCDAABCDEEABCDDEABCCDEABBCDEA第六十八頁(yè),共一百頁(yè),2022年,8月28日

例9-3研究A、B、C、D四種食品,以及甲、乙、丙、丁四種加工方法對(duì)小白鼠增體重的影響。擬用4窩大鼠,每窩4只,每只小白鼠隨機(jī)喂養(yǎng)一種食品、隨機(jī)采用一種加工方法;8周后觀察大鼠增體重情況。實(shí)驗(yàn)結(jié)果如表9-9所示。問(wèn):(1)食品種類(lèi)是否影響大鼠體重增加?(2)食品加工方法是否影響大鼠增體重?(3)不同窩別的大鼠體重增加是否不同?區(qū)組號(hào)甲乙丙丁180(D)70(B)51(C)48(A)247(A)75(C)78(D)45(B)348(B)80(D)47(A)52(C)446(C)81(A)49(B)77(D)表9-9四種食品及四種加工方法喂養(yǎng)大鼠所增體重(g)第六十九頁(yè),共一百頁(yè),2022年,8月28日4×4ABCDDABCCDABBCDA第七十頁(yè),共一百頁(yè),2022年,8月28日二、變異分解表9-8拉丁方設(shè)計(jì)資料的方差分析表

表中C為校正數(shù),、、分別為不同處理、行區(qū)組、列區(qū)組的合計(jì)。第七十一頁(yè),共一百頁(yè),2022年,8月28日三、分析步驟例9-3問(wèn):(1)食品種類(lèi)是否影響大鼠體重增加?(2)食品加工方法是否影響大鼠增體重?(3)不同窩別的大鼠體重增加是否不同?表9-9四種食品及四種加工方法喂養(yǎng)大鼠所增體重(g)第七十二頁(yè),共一百頁(yè),2022年,8月28日解:

(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)H處理0:A=B=C=D

即四種食品對(duì)大鼠體重增加相同

H處理1:A,B,C,D不全相等即四種食品對(duì)大鼠體重增加不全相同H行0:1=2=3=4

即不同窩別大鼠體重增加相同

H行1:1,2,3,4不全相等即不同窩別大鼠體重增加不全相同H列0:甲=乙=丙=丁

即不同加工方法對(duì)大鼠體重增加相同

H列1:甲,乙,丙,丁不全相等即不同加工方法對(duì)大鼠體重增加不全相同

=0.05第七十三頁(yè),共一百頁(yè),2022年,8月28日(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量

=62772-59292.25=3479.75

(2232+2122+2242+3152)-59292.25=1726.25

(2492+2452+2272+2532)-59292.25=98.75(2212+3062+2252+2222)-59292.25=1304.25

==350.5

第七十四頁(yè),共一百頁(yè),2022年,8月28日表9-10例9-3方差分析表變異來(lái)源

SSV

MSFP處理間1726.253575.4179.85<0.01行區(qū)組98.75332.9170.56>0.05列區(qū)組1304.253434.7507.44<0.05誤差350.50658.417總3479.7515第七十五頁(yè),共一百頁(yè),2022年,8月28日(3)確定P值,作出推斷結(jié)論①對(duì)處理:以處理=3和誤差=6查F界值表,F(xiàn)0.05(3,6)=4.76,F(xiàn)0.01(3,6)=9.78,得P<0.01,按=0.05水準(zhǔn)拒絕H0,接受H1,差別有統(tǒng)計(jì)學(xué)意義,可認(rèn)為食品種類(lèi)能影響大鼠增重。②對(duì)行區(qū)組:以行=3和誤差=6查F界值表,F(xiàn)0.05(3,6)=4.76,F(xiàn)0.01(3,6)=9.78,得P>0.05,按=0.05水準(zhǔn)不拒絕H0,差別無(wú)統(tǒng)計(jì)學(xué)意義,尚不能認(rèn)為不同窩別可影響大鼠增重。③對(duì)列區(qū)組:以列=3和誤差=6查F界值表,F(xiàn)0.05(3,6)=4.76,F(xiàn)0.01(3,6)=9.78,得P<0.05,按=0.05水準(zhǔn)拒絕H0,接受H1,差別有統(tǒng)計(jì)學(xué)意義,可認(rèn)為食品加工方法會(huì)影響大鼠增重。第七十六頁(yè),共一百頁(yè),2022年,8月28日拉丁方設(shè)計(jì)的要求:

①一定是三因素,且三因素水平數(shù)相等;②行間、列間、處理間均無(wú)交互作用;③各行、列、處理的方差齊。拉丁方設(shè)計(jì)的優(yōu)缺點(diǎn):

優(yōu)點(diǎn)是可同時(shí)研究三個(gè)因素,減少實(shí)驗(yàn)次數(shù)。從組內(nèi)變異中不但分離出行區(qū)組變異,而且還分離出列區(qū)組變異,使誤差變異進(jìn)一步減小。缺點(diǎn)是要求處理組數(shù)與所要控制的兩個(gè)因素水平數(shù)相等,一般實(shí)驗(yàn)不容易滿足此條件,而且數(shù)據(jù)缺失會(huì)增加統(tǒng)計(jì)分析的難度。第七十七頁(yè),共一百頁(yè),2022年,8月28日第五節(jié)多個(gè)均數(shù)間的兩兩比較

經(jīng)過(guò)方差分析,若拒絕了檢驗(yàn)假設(shè)H0,只能說(shuō)明多個(gè)總體均數(shù)不等或不全相等。若要得到各組均數(shù)間更詳細(xì)的信息,應(yīng)在方差分析的基礎(chǔ)上進(jìn)行多個(gè)樣本均數(shù)的兩兩比較。多重比較常用的方法有:SNK-q檢驗(yàn)、LSD-t

檢驗(yàn)和Dunnett-t

檢驗(yàn)。第七十八頁(yè),共一百頁(yè),2022年,8月28日一、SNK-q檢驗(yàn)

SNK(Student-Newman-Keuls)檢驗(yàn),亦稱(chēng)q

檢驗(yàn),適用于多個(gè)均數(shù)兩兩之間的全面比較。檢驗(yàn)統(tǒng)計(jì)量q

的計(jì)算公式為:

第七十九頁(yè),共一百頁(yè),2022年,8月28日例9-4例9-1經(jīng)

F檢驗(yàn)結(jié)論有統(tǒng)計(jì)學(xué)意義,試用SNK-q檢驗(yàn)方法對(duì)三組均數(shù)進(jìn)行多重比較。解:

(1)建立假設(shè),確定檢驗(yàn)水準(zhǔn)。

H0

:(對(duì)比組總體均數(shù)相等);

H1

:(對(duì)比組總體均數(shù)不等);

第八十頁(yè),共一百頁(yè),2022年,8月28日(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量q值。

①計(jì)算差值的標(biāo)準(zhǔn)誤:本例nA=nB=6,MS誤差=MS組內(nèi)=0.269

②將三個(gè)樣本均數(shù)從小到大排序,并賦予秩次:均數(shù)3.8174.2334.733

組別甲組乙組丙組秩次(R)

123

③列表計(jì)算檢驗(yàn)統(tǒng)計(jì)量q

值:表9-12例9-1的3個(gè)樣本均數(shù)兩兩比較的q檢驗(yàn)

第八十一頁(yè),共一百頁(yè),2022年,8月28日(3)確定P值,作出推斷結(jié)論 以誤差=15及組數(shù)

a

q

界值表,并確定

P

值,填入表9-12。

結(jié)論:甲組與丙組(“1與3”)比較P<0.05,按=0.05水準(zhǔn)拒絕H0,接受H1,有統(tǒng)計(jì)學(xué)意義,可認(rèn)為甲組(辦公樓)全肺濕重小于丙組(礦井);其余對(duì)比組之間比較均P>0.05,按=0.05水準(zhǔn)不拒絕H0。因此,可認(rèn)為礦井下環(huán)境會(huì)造成肺功能損害。

第八十二頁(yè),共一百頁(yè),2022年,8月28日二、Dunnett-t

檢驗(yàn)

Dunnett–t檢驗(yàn)適用于多個(gè)實(shí)驗(yàn)組與一個(gè)對(duì)照組均數(shù)差別的多重比較。檢驗(yàn)統(tǒng)計(jì)量為:

第八十三頁(yè),共一百頁(yè),2022年,8月28日

例9-5例9-2中甲組是對(duì)照組,研究目的是比較乙營(yíng)養(yǎng)素和丙營(yíng)養(yǎng)素是否比甲營(yíng)養(yǎng)素多增加體重,經(jīng)F檢驗(yàn)結(jié)論有統(tǒng)計(jì)學(xué)意義,試用Dunnett-t檢驗(yàn)方法對(duì)三組均數(shù)進(jìn)行多重比較。解:

(1)建立假設(shè),確定檢驗(yàn)水準(zhǔn)。

H0:

(所比較實(shí)驗(yàn)組與對(duì)照組總體均數(shù)相等)

H1:(所比較實(shí)驗(yàn)組與對(duì)照組總體均數(shù)不等)

(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量Dunnett-t值。

①本例

nT=nC=6,MS誤差=16.122,則差值的標(biāo)準(zhǔn)誤為

2.318第八十四頁(yè),共一百頁(yè),2022年,8月28日

②列表計(jì)算tD統(tǒng)計(jì)量,如表9-13所示。

(3)確定P值,作出推斷結(jié)論。

以及處理數(shù)T=2查Dunnett-t檢驗(yàn)界值表,并確定P值,填入表9-13。丙組與甲組比較P<0.05,按=0.05水準(zhǔn)拒絕H0,接受H1,有統(tǒng)計(jì)學(xué)意義,可認(rèn)為丙營(yíng)養(yǎng)素比對(duì)照組體重增加更多。但乙組與甲組比較P>0.05,沒(méi)有統(tǒng)計(jì)學(xué)意義,按=0.05水準(zhǔn)不拒絕H0,尚不能認(rèn)為乙營(yíng)養(yǎng)素與對(duì)照組增加體重不同。

表9-13例9-2的2個(gè)處理組與對(duì)照組均數(shù)比較的tD檢驗(yàn)第八十五頁(yè),共一百頁(yè),2022年,8月28日三、LSD-t

檢驗(yàn)

LSD-t

檢驗(yàn)即最小顯著差異t

檢驗(yàn),適用于一對(duì)或幾對(duì)在專(zhuān)業(yè)上有特殊意義的樣本均數(shù)間的比較。檢驗(yàn)統(tǒng)計(jì)量

t

的計(jì)算公式為:

LSD-

第八十六頁(yè),共一百頁(yè),2022年,8月28日例9-6例9-3中食品種類(lèi)是否影響大鼠增體重,研究目的只為比較A食品與B食品,C食品與D食品便可;多組間經(jīng)F檢驗(yàn)結(jié)論有統(tǒng)計(jì)學(xué)意義,試用LSD-t檢驗(yàn)方法對(duì)這兩對(duì)均數(shù)進(jìn)行多重比較。 檢驗(yàn)步驟為:

(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)

H0:A=

B即所研究的兩個(gè)對(duì)比組的總體均數(shù)相等

H1:A≠

B即所研究的兩個(gè)對(duì)比組的總體均數(shù)不等

=0.05

(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量

①本例nA=nB=4,MS誤差=58.417,=誤差=6第八十七頁(yè),共一百頁(yè),2022年,8

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論