![用SAS軟件進(jìn)行方差分析_第1頁](http://file4.renrendoc.com/view/228098be8f7b0b95806f95c85bf41a0a/228098be8f7b0b95806f95c85bf41a0a1.gif)
![用SAS軟件進(jìn)行方差分析_第2頁](http://file4.renrendoc.com/view/228098be8f7b0b95806f95c85bf41a0a/228098be8f7b0b95806f95c85bf41a0a2.gif)
![用SAS軟件進(jìn)行方差分析_第3頁](http://file4.renrendoc.com/view/228098be8f7b0b95806f95c85bf41a0a/228098be8f7b0b95806f95c85bf41a0a3.gif)
![用SAS軟件進(jìn)行方差分析_第4頁](http://file4.renrendoc.com/view/228098be8f7b0b95806f95c85bf41a0a/228098be8f7b0b95806f95c85bf41a0a4.gif)
![用SAS軟件進(jìn)行方差分析_第5頁](http://file4.renrendoc.com/view/228098be8f7b0b95806f95c85bf41a0a/228098be8f7b0b95806f95c85bf41a0a5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第五章方差分析5.1單因子方差分析5.2兩因子方差分析本文檔共189頁;當(dāng)前第1頁;編輯于星期一\17點(diǎn)50分方差分析中的基本概念例5.1為比較五種牌子的合成木板的耐久性,對每種牌子取4個樣品做試驗(yàn),測量磨損量。推斷不同牌子的磨損量間有無顯著性差異。牌子磨損量A2.22.12.42.5B2.22.32.42.6C2.22.01.92.1D2.42.72.62.7E2.32.52.32.4本文檔共189頁;當(dāng)前第2頁;編輯于星期一\17點(diǎn)50分方差分析中的基本概念(續(xù)1)方差分析研究分組變量對數(shù)值型變量的影響。分組變量稱為因子,分組變量的每個取值稱為因子的一個水平。只考慮一個因子的方差分析稱單因子的方差分析,考慮兩個因子的方差分析稱兩因子的方差分析。例題中牌子是分組變量,磨損量為數(shù)值型變量,牌子是因子,A、B、C、D和E是因子的五個水平,屬于單因子的方差分析。研究牌子對磨損量的影響,即比較五種牌子的磨損量間有無顯著性差異,將每個牌子的磨損量看做一個總體,本題比較五個獨(dú)立總體的均值間有無顯著性差異,是多總體均值相等的假設(shè)檢驗(yàn)問題。本文檔共189頁;當(dāng)前第3頁;編輯于星期一\17點(diǎn)50分5.1.單因素方差分析1.數(shù)學(xué)模型設(shè)因子A有r個水平,在每個水平下進(jìn)行m次試驗(yàn),觀測數(shù)據(jù)yij表示第i個水平下第j次試驗(yàn)的觀測數(shù)據(jù),i=1,2,…,r;j=1,2,…,m。
每個水平的數(shù)量指標(biāo)是一個總體,如每個牌子的磨損量為一總體,每個水平下的所有試驗(yàn)數(shù)據(jù)構(gòu)成來自該總體的一個樣本,單因子的方差分析就是用r個樣本來檢驗(yàn)r個總體的均值是否相等。即H0:1=2=…=r,H1:1,2,…,r不全相等;本文檔共189頁;當(dāng)前第4頁;編輯于星期一\17點(diǎn)50分2.模型的假定條件單因子方差分析要求滿足下面的假定條件:a)所有觀測數(shù)據(jù)獨(dú)立;(可直觀判斷)b)每個總體均服從正態(tài)分布;(需要正態(tài)性檢驗(yàn))c)所有總體的方差相等。(需要方差齊性檢驗(yàn))在以上假定條件下,可設(shè)第i個水平對應(yīng)的總體服從正態(tài)分布,相應(yīng)樣本為。根據(jù)yij與總體同分布可設(shè)yij=i+ij,1≤i≤r,1≤j≤m。其中i表示第i個總體的均值,ij為隨機(jī)誤差,服從正態(tài)分布。本文檔共189頁;當(dāng)前第5頁;編輯于星期一\17點(diǎn)50分3.方差分析表
方差分析將總波動分解成誤差引起的波動和因子引起的波動,當(dāng)因子引起的波動相對于誤差引起的波動大時,說明因子是顯著的,即因子對數(shù)量指標(biāo)有顯著性影響??偟钠钇椒胶?,其中,它反映數(shù)據(jù)總的波動。因子A的偏差平方和其中。SST中第i個水平下的每個觀測數(shù)據(jù)都用其樣本均值替換得到SSM,因此SSM反映因子的不同引起的波動。誤差的偏差平方和,它反映誤差或其它隨機(jī)因素引起的波動。本文檔共189頁;當(dāng)前第6頁;編輯于星期一\17點(diǎn)50分在H0成立下可以證明:SST=SSM+SSE,,為排除自由度對波動的影響,對波動分別除以各自的自由度得到均方和:因子的均方和:誤差的均方和:兩均方和之比得檢驗(yàn)統(tǒng)計(jì)量:
由檢驗(yàn)統(tǒng)計(jì)量得概率p值,從而做出推斷。本文檔共189頁;當(dāng)前第7頁;編輯于星期一\17點(diǎn)50分方差分析表來源平方自由度均方和F比因子SSMfA=r-1MSA=SSM/fA
F=(MSA/MSE)~F(fA,fe)誤差SSEfe=n-rMSE=SSE/fe
總和SSTfT=n-1本文檔共189頁;當(dāng)前第8頁;編輯于星期一\17點(diǎn)50分4.方差分析的SAS編程第一步檢驗(yàn)?zāi)P偷募俣l件條件1:觀測數(shù)據(jù)的獨(dú)立性可直觀判斷;條件2:各樣本所來自總體的獨(dú)立性用univariate過程+normal選項(xiàng),并使用by語句來檢驗(yàn);程序如下:procsortdata=數(shù)據(jù)集名;by分組變量名;run;procunivariatedata=數(shù)據(jù)集名normal;
by分組變量名;var數(shù)值型變量名;run;本文檔共189頁;當(dāng)前第9頁;編輯于星期一\17點(diǎn)50分條件3:方差齊性,用anova過程中的means語句+hovest選項(xiàng)。程序如下:procanovadata=數(shù)據(jù)集名;class分組變量名;model數(shù)值型變量名=分組變量名;means分組變量名/hovest;/*或hovest=levene*/
run;第二步輸出方差分析表上面的方差齊性程序就可產(chǎn)生方差分析表。根據(jù)表中的概率p值可作出推斷。如果只需輸出方差分析表,不要求檢驗(yàn)方差相等,則上面的程序刪去means過程,保留其它語句則可。
本文檔共189頁;當(dāng)前第10頁;編輯于星期一\17點(diǎn)50分5.多重t檢驗(yàn)若方差分析的檢驗(yàn)結(jié)果表明均值間有顯著性差異,則可進(jìn)一步檢驗(yàn)?zāi)男┚甸g有顯著性差異,從而找到因子的最優(yōu)水平。這就需要做多重t檢驗(yàn),它對其中任何兩個總體均值都檢驗(yàn)是否相等。實(shí)際上,多重t檢驗(yàn)就是若干個兩獨(dú)立組的比較問題。多重t檢驗(yàn)的程序如下:procanovadata=數(shù)據(jù)集名;class分組變量名;model數(shù)值型變量名=分組變量名;means分組變量名/t;/*對means語句+選項(xiàng)t*/
run;
本文檔共189頁;當(dāng)前第11頁;編輯于星期一\17點(diǎn)50分6.非參數(shù)檢驗(yàn)當(dāng)方差分析的正態(tài)性或方差齊性的假定條件不能滿足時,使用kruskal-wallis非參數(shù)檢驗(yàn)。程序如下:procnpar1waydata=數(shù)據(jù)集名wilcoxon;class分組變量名;var數(shù)值型變量名;run;程序和兩獨(dú)立組比較的一樣,不過這時看kruskal-wallis檢驗(yàn),而不看wilcoxon秩和檢驗(yàn)。本文檔共189頁;當(dāng)前第12頁;編輯于星期一\17點(diǎn)50分7.單因子方差分析的應(yīng)用舉例例5.1為比較五種牌子的合成木板的耐久性,對每種牌子取4個樣品做試驗(yàn),測量磨損量,數(shù)據(jù)如下,試用編程的方法推斷不同牌子的磨損量間有無顯著性差異。牌子磨損量A2.22.12.42.5B2.22.32.42.6C2.22.01.92.1D2.42.72.62.7E2.32.52.32.4本文檔共189頁;當(dāng)前第13頁;編輯于星期一\17點(diǎn)50分5.2兩因子方差分析
兩因子的方差分析研究兩個分類變量對一個數(shù)值型變量的影響。兩因子的方差分析分為兩類:無交互作用的和有交互作用的方差分析。設(shè)有兩個分組變量即因子A和B,有一個數(shù)值型變量Y。
A:A1,
A2,…,Ar,即A有r個水平
B:B1,B2,…,Bs
,即B有s個水平若Y僅受Ai和Bj各自的影響,與組合(Ai,Bj
)無關(guān),則稱為無交互作用,否則稱有交互作用。本文檔共189頁;當(dāng)前第14頁;編輯于星期一\17點(diǎn)50分5.2.1無交互作用的方差分析(無重復(fù)試驗(yàn)的方差分析)1.模型的假定條件
設(shè)yij為組合(Ai,Bj
)下的試驗(yàn)結(jié)果。模型的假定條件為
a)觀測數(shù)據(jù)獨(dú)立;b)yij來自正態(tài)總體。含義:每種組合下的數(shù)量指標(biāo)看成一個總體,假定總體均服從正態(tài)分布,且方差均相等。對每種組合下只做一次試驗(yàn),故每個總體的樣本容量都是1。由樣本各分量均與總體同分布知:
從而可設(shè)yij=ij+ij,ij為總體均值,ij為隨機(jī)誤差,1≤i≤r,1≤j≤s,ij服從正態(tài)分布。本文檔共189頁;當(dāng)前第15頁;編輯于星期一\17點(diǎn)50分2.無交互作用的方差分析的數(shù)據(jù)模型為了便于描述引入一下定義:記
因子A的第i個水平效應(yīng)因子B的第j個水平效應(yīng)若,則稱無交互作用;若,則稱有交互作用。本文檔共189頁;當(dāng)前第16頁;編輯于星期一\17點(diǎn)50分2.無交互作用的方差分析的數(shù)據(jù)模型下證:同理可證證:本文檔共189頁;當(dāng)前第17頁;編輯于星期一\17點(diǎn)50分3.提假設(shè)方差分析的目的是檢驗(yàn)所有總體均值是否相等,對于無交互作用的方差分析,有,故檢驗(yàn)問題可轉(zhuǎn)化為兩個檢驗(yàn):H0A:1=2=…=r,H1A:1,2,…,r不全相等;H0B:β1=β2=…=βj,H1B:β1,β2,…,βj不全相等;第一個檢驗(yàn)因子A對數(shù)量指標(biāo)有無顯著性影響,第二個檢驗(yàn)因子B對數(shù)量指標(biāo)有無顯著性影響。而模型無顯著效應(yīng)(即接受原假設(shè))是指以上兩個假設(shè)的原假設(shè)同時成立。本文檔共189頁;當(dāng)前第18頁;編輯于星期一\17點(diǎn)50分4.檢驗(yàn)統(tǒng)計(jì)量平方和分解:總的偏差平方和
其中,它反映數(shù)據(jù)總的波動。因子A的偏差平方和其中。它反映因子A引起的波動。因子B的偏差平方和它反映因子B引起的波動。誤差的偏差平方和,它反映誤差或其它隨機(jī)因素引起的波動。本文檔共189頁;當(dāng)前第19頁;編輯于星期一\17點(diǎn)50分在H0成立下可以證明:SST=SSA+SSB+SSE,為排除自由度對波動的影響,對波動分別除以各自的自由度得到均方和:因子A的均方和:因子B的均方和:誤差的均方和:
本文檔共189頁;當(dāng)前第20頁;編輯于星期一\17點(diǎn)50分檢驗(yàn)統(tǒng)計(jì)量
兩均方和之比得檢驗(yàn)統(tǒng)計(jì)量。因子A的檢驗(yàn)統(tǒng)計(jì)量為
其中fA=r-1,fe=(r-1)(s-1).因子B的檢驗(yàn)統(tǒng)計(jì)量為
其中fB=s-1,fe=(r-1)(s-1).本文檔共189頁;當(dāng)前第21頁;編輯于星期一\17點(diǎn)50分無交互作用的兩因子方差分析表
來源平方自由度均方和F比ASSAfA=r-1MSA=SSA/fAF=(MSA/MSE)~F(fA,fe)
BSSBfB=s-1MSA=SSB/fBF=(MSB/MSE)~F(fB,fe)
誤差SSEfe=(r-1)(s-1)MSE=SSE/fe注:由方差分析表中的檢驗(yàn)統(tǒng)計(jì)量計(jì)算出概率p值,由此作出推斷。本文檔共189頁;當(dāng)前第22頁;編輯于星期一\17點(diǎn)50分5編程做無交互作用的兩因子方差分析首先檢驗(yàn)?zāi)P偷募俣l件條件1:觀測數(shù)據(jù)獨(dú)立,可直觀判斷;條件2:數(shù)據(jù)來自正態(tài)總體,且方差相等。由于每個總體僅有一個容量為1的樣本,故該條件無法檢驗(yàn)。
用anova過程編程做方差分析的推斷,程序如下:procanovadata=數(shù)據(jù)集名;class分組變量名列表;/*如ab;*/model數(shù)值型變量名=分組變量名列表;/*如y=ab*/[means分組變量名列表/t;]/*該句要求做多重t檢驗(yàn)*/run;本文檔共189頁;當(dāng)前第23頁;編輯于星期一\17點(diǎn)50分5.2.2有交互作用的多因素方差分析(有重復(fù)試驗(yàn))1.數(shù)據(jù)模型設(shè)觀測數(shù)據(jù)yijk為(Ai,Bj)組合下的第k次試驗(yàn)所得數(shù)值型變量y的觀測值,i=1,2,…,r;j=1,2,…,s;k=1,2,…,t。采用以下的數(shù)據(jù)模型:yijk=+i+βj+ij+ijk,1≤i≤r,1≤j≤s,1≤k≤t其中表示平均的效應(yīng),i和βj分別表示因素A的第i個水平和因素B的第j個水平的效應(yīng),ij表示因素A的第i個水平和因素B的第j個水平的交互效應(yīng)。ijk為隨機(jī)誤差,這里也假定它是獨(dú)立的并且服從等方差的正態(tài)分布。
本文檔共189頁;當(dāng)前第24頁;編輯于星期一\17點(diǎn)50分2.要檢驗(yàn)的假設(shè)H0(A*B):ij=0,Hl(A*B):ij不全為零
H0A:1=2=…=r,H1A:1,2,…,r不全相等
H0B:β
1=β
2=…=β
S,H1B:β
1=β
2=…=βs
不全相等;其中(1≤i≤r,1≤j≤s)。三個假設(shè)分別用于檢驗(yàn)搭配對數(shù)值型變量有無顯著性影響,因子A對數(shù)值型變量有無顯著性影響,因子B對數(shù)值型變量有無顯著性影響。
本文檔共189頁;當(dāng)前第25頁;編輯于星期一\17點(diǎn)50分3.檢驗(yàn)統(tǒng)計(jì)量在H0成立下可以證明:SST=SSA+SSB+SSAB+SSE,
其中fe=rs(t-1),fAB=(r-1)(s-1)
本文檔共189頁;當(dāng)前第26頁;編輯于星期一\17點(diǎn)50分
本文檔共189頁;當(dāng)前第27頁;編輯于星期一\17點(diǎn)50分4.有交互作用的方差分析表
本文檔共189頁;當(dāng)前第28頁;編輯于星期一\17點(diǎn)50分5.編程實(shí)現(xiàn)有交互作用的兩因子方差分析程序如下:procanovadata=數(shù)據(jù)集名;classAB;/*A和B分別是兩個分組變量名*/modelY=ABA*B;/*Y為數(shù)值型變量*/[meansaba*b/t;]/*模型顯著時means該語句用于多重t檢驗(yàn)*/run;
本文檔共189頁;當(dāng)前第29頁;編輯于星期一\17點(diǎn)50分6兩因子方差分析的應(yīng)用舉例1)單因子的2)兩因子的本文檔共189頁;當(dāng)前第30頁;編輯于星期一\17點(diǎn)50分有交互作用的雙因素方差分析表見表5-3。表5-3有交互作用的雙因素方差分析表其中MSA=SSMA/(l–1),MSB=SSMB/(m–1),MS(A*B)=SSM(A*B)/(l–1)(m–1),MSE=SSE/lm(n–l)。利用表中的信息,就可以對各個因素間交互作用是否顯著和每個因素各水平間的差異是否顯著做出判斷。來源Source自由度DF平方和SunofSquare平均平方和MeanSquareF統(tǒng)計(jì)量Fvaluep值Pr>F因素Al–1SSMASSMA/(l–1)MSA/MSEpA因素Bm–1SSMBSSMB/(m–1)MSB/MSEpBA*B(l–1)(m–1)SSM(A*B)SSM(A*B)/(l–1)(m–1)MS(A*B)/MSEp(A*B)隨機(jī)誤差lm(n–1)SSESSE/lm(n–l)全部lmn–1SSMA+SSMB+SSM(A*B)+SSE本文檔共189頁;當(dāng)前第31頁;編輯于星期一\17點(diǎn)50分5.1.3方差分析中的基本假定方差分析中常用的基本假定是:●正態(tài)性:每個總體均服從正態(tài)分布,也就是說,對于每一個水平,其觀測值是來自正態(tài)分布的簡單隨機(jī)樣本?!穹讲铨R性:各總體的方差相同?!癃?dú)立性:從每一總體中抽取的樣本是相互獨(dú)立的。在SAS中,正態(tài)性可用第3章介紹的方法來驗(yàn)證,也可通過本章介紹的“殘差的正態(tài)性檢驗(yàn)”來驗(yàn)證,方差齊性可以在方差分析的過程進(jìn)行驗(yàn)證,而獨(dú)立性可由試驗(yàn)的隨機(jī)化確定。本文檔共189頁;當(dāng)前第32頁;編輯于星期一\17點(diǎn)50分5.2單因素方差分析的SAS實(shí)現(xiàn)5.2.1用INSIGHT作單因素方差分析5.2.2用“分析家”作單因素方差分析5.2.3用過程進(jìn)行單因素方差分析本文檔共189頁;當(dāng)前第33頁;編輯于星期一\17點(diǎn)50分5.2.1用INSIGHT作單因素方差分析1.實(shí)例【例5-1】消費(fèi)者與產(chǎn)品生產(chǎn)者、銷售者或服務(wù)的提供者之間經(jīng)常發(fā)生糾紛。當(dāng)發(fā)生糾紛后,消費(fèi)者常常會向消費(fèi)者協(xié)會投訴。為了對幾個行業(yè)的服務(wù)質(zhì)量進(jìn)行評價,消費(fèi)者協(xié)會在零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)分別抽取了不同的企業(yè)作為樣本。每個行業(yè)各抽取5家企業(yè),所抽取的這些企業(yè)在服務(wù)對象、服務(wù)內(nèi)容、企業(yè)規(guī)模等方面基本上是相同的。然后統(tǒng)計(jì)出最近一年中消費(fèi)者對總共20家企業(yè)投訴的次數(shù),結(jié)果如表5-4。本文檔共189頁;當(dāng)前第34頁;編輯于星期一\17點(diǎn)50分表5-4消費(fèi)者對四個行業(yè)的投訴次數(shù)通常,受到投訴的次數(shù)越多,說明服務(wù)的質(zhì)量越差。消費(fèi)者協(xié)會想知道這幾個行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異,即在方差分析中檢驗(yàn)原假設(shè):四個行業(yè)被投訴次數(shù)的均值相等。零售業(yè)旅游業(yè)航空公司家電制造業(yè)5768314466394951492921654045347744564058本文檔共189頁;當(dāng)前第35頁;編輯于星期一\17點(diǎn)50分2.分析步驟1)將表5-4中數(shù)據(jù)整理成如圖左所示結(jié)構(gòu)的數(shù)據(jù)集,存放在Mylib.xfzts中;
2)在INSIGHT模塊中打開數(shù)據(jù)集Mylib.xfzts;3)選擇菜單“Analyze(分析)”→“Fit(擬合)”,在打開的“Fit(XY)”對話框中按圖(右)選擇分析變量;4)單擊“OK”按鈕,得到分析結(jié)果。
本文檔共189頁;當(dāng)前第36頁;編輯于星期一\17點(diǎn)50分3.結(jié)果分析第一張表提供擬合模型的一般信息:第二張表為列名型變量信息,即HANGYE為列名型的,有4個水平;第三張表提供參數(shù)信息,并且約定,P_2、P_3、P_4、P_5分別為航空、家電、零售和旅游4個行業(yè)的標(biāo)識變量(也稱啞變量)。如下圖所示。
本文檔共189頁;當(dāng)前第37頁;編輯于星期一\17點(diǎn)50分第四張表給出響應(yīng)變量均值關(guān)于自變量不同水平的模型方程,如圖5-6所示。其中,標(biāo)識變量取值:本文檔共189頁;當(dāng)前第38頁;編輯于星期一\17點(diǎn)50分第五張表(圖5-7)給出模型擬合的匯總信息,其中:R-Square(R2)是判定系數(shù)(coefficientofdetermination),闡明了自變量所能描述的變化(模型平方和)在全部變差平方和中的比例,它的值總在0和1之間,其值越大,說明自變量的信息對說明因變量信息的貢獻(xiàn)越大,即分類變量取不同的值對因變量的影響越顯著。AajR-Sq(校正R2)是類似于R2的,但它隨模型中的參數(shù)的個數(shù)而修正。本文檔共189頁;當(dāng)前第39頁;編輯于星期一\17點(diǎn)50分第六張為方差分析表,如圖5-8所示,其中各項(xiàng)含義可參見表5-1的說明。從方差分析表可以看出,p值小于0.05(顯著水平),所以拒絕原假設(shè),即不同行業(yè)的消費(fèi)者投訴次數(shù)有顯著差異。第七張表提供III型檢驗(yàn),它是方差分析表的細(xì)化,給出了各因素的平方和及F統(tǒng)計(jì)量,因?yàn)楸纠菃我蛩氐?,所以這一行與圖5-8的“Model”一行相同。如圖5-9所示。本文檔共189頁;當(dāng)前第40頁;編輯于星期一\17點(diǎn)50分第八張為參數(shù)估計(jì)表,其中有關(guān)于不同行業(yè)下投訴次數(shù)差異的估計(jì)和檢驗(yàn):1)根據(jù)標(biāo)識變量的定義,Intercept后的估計(jì)47.4是對應(yīng)于旅游業(yè)投訴次數(shù)的均值,其后的t檢驗(yàn)是檢驗(yàn)這一均值是否為0。這里p值<0.0001<0.05=α,故顯著非0。2)航空后的估計(jì)-12.4是航空業(yè)與旅游業(yè)投訴次數(shù)均值之差的估計(jì)值,其后的t檢驗(yàn)也是檢驗(yàn)這兩個投訴次數(shù)均值之差是否為0。由于p值的絕對值為0.1313>0.05,所以航空業(yè)與旅游業(yè)的被投訴次數(shù)沒有顯著差異的。其它分析類似。本文檔共189頁;當(dāng)前第41頁;編輯于星期一\17點(diǎn)50分4.檢驗(yàn)?zāi)P图俣榱蓑?yàn)證殘差為正態(tài)分布的假定,回到數(shù)據(jù)窗口??梢钥吹絉_TOUSU(殘差)和P_TOUSU(預(yù)測值)已加到數(shù)據(jù)集之中,下面用Distribufion(Y)來驗(yàn)證殘差的正態(tài)性。1)選擇菜單“Analyze”→“Distribution(Y)”;2)在打開的“Distribution(Y)”對話框中選定分析變量:R_TOUSU;單擊“OK”按鈕;本文檔共189頁;當(dāng)前第42頁;編輯于星期一\17點(diǎn)50分3)選擇菜單“Curves”→“TestforDistribution”;在打開的“TestforDistribution”對話框中直接單擊“OK”按鈕。在檢驗(yàn)結(jié)果的“TestforDistribution”表中看到,p值大于0.05,不能拒絕原假設(shè),表明可以認(rèn)為殘差是正態(tài)分布的(圖5-12)。本文檔共189頁;當(dāng)前第43頁;編輯于星期一\17點(diǎn)50分5.2.2用“分析家”作單因素方差分析1.分析步驟1)在“分析家”中,打開數(shù)據(jù)集Mylib.xfzts;2)選擇菜單“Statistics(統(tǒng)計(jì))”→“ANOVA(方差分析)”→“One-WayANOVA(單因素方差分析)”,打開“One-WayANOVA”對話框;本文檔共189頁;當(dāng)前第44頁;編輯于星期一\17點(diǎn)50分3)選中分類變量HANGYE,單擊“Independent”按鈕,將其移到“Independent(自變量)”框中;選中數(shù)值變量TOUSU,單擊按鈕“Dependent”,將其移到“Dependent(因變量)”框中,如圖5-13所示;本文檔共189頁;當(dāng)前第45頁;編輯于星期一\17點(diǎn)50分4)為了檢驗(yàn)方差分析中關(guān)于方差齊性的假定,單擊“Tests”按鈕,打開“One-WayANOVA:Tests”對話框,選中“Testsforequalvariance”欄下的“l(fā)evene'stest”復(fù)選框(常用),如圖左,單擊“OK”按鈕返回;
5)單擊“Plots”按鈕,打開“One-WayANOVA:Plots”對話框,可以選擇圖形類型,如選中“Typesofplots”欄下的“Box-&-whiskerplot”復(fù)選框,如圖右,單擊“OK”按鈕返回;再次單擊“OK”按鈕。
本文檔共189頁;當(dāng)前第46頁;編輯于星期一\17點(diǎn)50分2.結(jié)果分析在顯示的結(jié)果中,提供了自變量的各個水平和單因素方差分析表。
結(jié)果分為五個部分,第一部分(下圖左)是因素水平的信息,可以看到只有一個因素HANGYE,它的4個水平分別是航空、家電、零售、旅游,共有20個觀測。本文檔共189頁;當(dāng)前第47頁;編輯于星期一\17點(diǎn)50分第二部分就是經(jīng)典的方差分析表。由于這里p值小于0.05(顯著水平),所以模型是顯著的,即因素對指標(biāo)有顯著影響。第三部分是一些與模型有關(guān)的簡單統(tǒng)計(jì)量,第一個是復(fù)相關(guān)系數(shù)平方R2,代表總變差中能被模型解釋的比例,第二個是指標(biāo)的變異系數(shù),第三個是根均方誤差,第四個是均值。第四部分是方差分析表的細(xì)化,給出了各因素的平方和及F統(tǒng)計(jì)量,因?yàn)槭菃我蛩厮赃@一行與上面的“Model(模型)”一行相同。本文檔共189頁;當(dāng)前第48頁;編輯于星期一\17點(diǎn)50分第五部分是對方差齊性的假定檢驗(yàn)的結(jié)果,如圖5-16所示。結(jié)果表明使用Levene's檢驗(yàn)法的p值為0.6357,所以不同水平下觀測結(jié)果的方差無顯著差異。本文檔共189頁;當(dāng)前第49頁;編輯于星期一\17點(diǎn)50分在分析家窗口的項(xiàng)目管理器中雙擊“BoxplotofTOUSYbyHANGYE”選項(xiàng),得到響應(yīng)變量關(guān)于自變量各水平的盒形圖如圖5-17所示。圖中從左到右依次為航空、家電、零售、旅游等水平的盒形圖,可以從中對不同水平下均值的差異以及方差的差異有一個直觀的了解。本文檔共189頁;當(dāng)前第50頁;編輯于星期一\17點(diǎn)50分5.2.3用過程進(jìn)行單因素方差分析1.ANOVA過程和GLM過程的簡介(1)ANOVA過程ANOVA過程的一般格式包含許多選項(xiàng),其中最為常用的為如下格式:PROCANOVADATA=<數(shù)據(jù)集>;CLASS<自變量列表>;MODEL<因變量名>=<自變量表達(dá)式>[/<選項(xiàng)列表>];MEANS<自變量表達(dá)式>[/<選項(xiàng)>];RUN;本文檔共189頁;當(dāng)前第51頁;編輯于星期一\17點(diǎn)50分其中CLASS語句用來指定樣本分組的分類變量,CLASS語句是必需的,而且必需位于MODEL語句之前;MODEL語句給出模型表達(dá)式,可以用來表示三種不同的效應(yīng)模型:1)主效應(yīng)模型:y=abc2)交互效應(yīng)模型:y=abca*ba*cb*ca*b*c3)嵌套效應(yīng)模型:y=abc(ab)同一MODEL語句中三種效應(yīng)可以混合使用。MEANS語句指定ANOVA過程計(jì)算自變量各水平下因變量的均值、標(biāo)準(zhǔn)差,并進(jìn)行組間的多重比較。本文檔共189頁;當(dāng)前第52頁;編輯于星期一\17點(diǎn)50分(2)GLM過程PROCGLMDATA=<數(shù)據(jù)集>[ALPHA=<p>];CLASS<自變量列表>;MODEL<因變量名>=<自變量表達(dá)式>[/<選項(xiàng)列表>];MEANS<自變量表達(dá)式>[/<選項(xiàng)>];RUN;一般地,ANOVA過程中涉及的所有語句都包含在GLM過程所涉及的語句中,其用法和功能也都是基本相同的。本文檔共189頁;當(dāng)前第53頁;編輯于星期一\17點(diǎn)50分2.使用ANOVA過程作單因素方差分析使用ANOVA過程對例5-1作方差分析的方法:procanovadata=Mylib.xfzts;classhangye;modeltousu=hangye;run;分析結(jié)果與“分析家”相同。本文檔共189頁;當(dāng)前第54頁;編輯于星期一\17點(diǎn)50分3.使用GLM過程作單因素方差分析使用GLM過程對例5-1作方差分析的方法:procGLMdata=Mylib.xfzts;classhangye;modeltousu=hangye;run;分析結(jié)果與“分析家”相同。本文檔共189頁;當(dāng)前第55頁;編輯于星期一\17點(diǎn)50分5.3雙因素方差分析5.3.1用INSIGHT作雙因素方差分析5.3.2用“分析家”作雙因素方差分析5.3.3用GLM過程進(jìn)行雙因素方差分析本文檔共189頁;當(dāng)前第56頁;編輯于星期一\17點(diǎn)50分5.3.1用INSIGHT作雙因素方差分析1.不存在交互作用的雙因素方差分析【例5-2】為了提高一種橡膠的定強(qiáng),考慮三種不同的促進(jìn)劑(因素A)、四種不同分量的氧化鋅(因素B)對定強(qiáng)的影響,對配方的每種組合重復(fù)試驗(yàn)兩次,總共試驗(yàn)了24次,得到表5-5的結(jié)果。表5-5橡膠配方試驗(yàn)數(shù)據(jù)A:促進(jìn)劑B:氧化鋅1234131,3334,3635,3639,38233,3436,3737,3938,41335,3737,3839,4042,44本文檔共189頁;當(dāng)前第57頁;編輯于星期一\17點(diǎn)50分要用方差分析將不同促進(jìn)劑和不同份量氧化鋅的影響區(qū)分開來。即檢驗(yàn):H0A:不同促進(jìn)劑對定強(qiáng)無影響,H1A:不同促進(jìn)劑對定強(qiáng)有顯著影響H0B:氧化鋅的不同分量對定強(qiáng)無影響,H1B:氧化劑的不同分量對定強(qiáng)有顯著影響本文檔共189頁;當(dāng)前第58頁;編輯于星期一\17點(diǎn)50分(1)分析設(shè)置1)將表5-5中數(shù)據(jù)整理成如圖5-18左所示結(jié)構(gòu)的數(shù)據(jù)集,存放在Mylib.xjpf中;
本文檔共189頁;當(dāng)前第59頁;編輯于星期一\17點(diǎn)50分2)在INSIGHT模塊中打開數(shù)據(jù)集Mylib.xjpf。由于在Insight中,要求方差分析中的自變量必須是列名型的,故先把變量a和b的測量水平由區(qū)間型改為列名型;3)選擇菜單“Analyze(分析)”→“Fit(擬合)”,在打開的“Fit(XY)”對話框中選擇數(shù)值型變量作因變量,分類型變量作自變量:選擇變量stren,單擊“Y”按鈕,選擇變量a和b,單擊“X”按鈕,分別將變量移到列表框中,如圖5-18右所示;單擊“OK”,得到分析結(jié)果。本文檔共189頁;當(dāng)前第60頁;編輯于星期一\17點(diǎn)50分(2)分析結(jié)果1)第一張表提供了模型的一般信息;第二張表列舉了作為分類變量的a和b的水平的信息;第三張參數(shù)信息表給出了標(biāo)識變量P_i的定義;
其中,標(biāo)識變量取值:
本文檔共189頁;當(dāng)前第61頁;編輯于星期一\17點(diǎn)50分2)第四張表給出了方差分析模型,利用參數(shù)信息表中標(biāo)識變量的定義可以推算出在各個因素不同水平下變量stren均值的信息;第五張擬合匯總表中給出變量stren的均值為37.0417,判定系數(shù)R2為0.8945等,如圖5-20;圖5-20多因素方差分析第4、5張表本文檔共189頁;當(dāng)前第62頁;編輯于星期一\17點(diǎn)50分3)在第六張方差分析表中,檢驗(yàn)?zāi)P惋@著性的F統(tǒng)計(jì)量為30.53,相應(yīng)的p值小于0.05=,所以拒絕a和b對分析變量stren無顯著影響的假設(shè),即模型是顯著的;
在模型顯著的情況下常需要進(jìn)一步分析兩個因素是否都有顯著影響或者只有一個因素是顯著的,這時就需要用到第七張表提供的信息。在III型檢驗(yàn)表中,進(jìn)一步將模型平方和分解為屬于a和b的平方和。在這里兩個因素的p值都小于0.05,再一次說明了這兩個因素對分析變量stren都有顯著影響,如圖5-21。
本文檔共189頁;當(dāng)前第63頁;編輯于星期一\17點(diǎn)50分4)第八張是模型的參數(shù)估計(jì)表(圖5-22),參數(shù)估計(jì)表也是根據(jù)標(biāo)識變量的定義,對參數(shù)或?qū)Ω饕蛩夭煌较碌膮?shù)之差進(jìn)行估計(jì)和檢驗(yàn)??梢愿鶕?jù)t統(tǒng)計(jì)量的p值來檢驗(yàn)不同水平下均值是否有顯著差異。圖5-22多因素方差分析第8張表本文檔共189頁;當(dāng)前第64頁;編輯于星期一\17點(diǎn)50分模型方程提供了各個因素不同水平下變量stren均值的信息,利用參數(shù)信息表中標(biāo)識變量P_j的定義可以推算出:參數(shù)估計(jì)表根據(jù)標(biāo)識變量的定義,對參數(shù)或不同水平下參數(shù)之差進(jìn)行估計(jì)和檢驗(yàn)。如第一行是對a=3,b=4水平下均值的估計(jì)和檢驗(yàn),第二行是a=1,b=4水平下的均值與a=3,b=4水平下均值之差的估計(jì)與檢驗(yàn)。結(jié)果表明兩個因素的各水平下的均值都有顯著差異。本文檔共189頁;當(dāng)前第65頁;編輯于星期一\17點(diǎn)50分5)考察模型假定:在顯示窗的底部有一個殘差和預(yù)測值的散點(diǎn)圖(如圖5-23所示),可以像單因素分析一樣考察殘差分布的正態(tài)性假定。本文檔共189頁;當(dāng)前第66頁;編輯于星期一\17點(diǎn)50分2.存在交互作用的雙因素方差分析【例5-3】考慮合成纖維收縮率(因素A)和總拉伸倍數(shù)(因素B)對纖維彈性y的影響。收縮率取4個水平:A1=0,A2=4,A3=8,A4=12;因素B也取4個水平:B1=460,B2=520,B3=580,B4=640。在每個組合AiBj下重復(fù)做二次試驗(yàn),彈性數(shù)據(jù)如表5-6所示。表5-6合成纖維收縮率和總拉伸倍數(shù)對纖維彈性的影響A:收縮率B:拉伸倍數(shù)460520580640071,7372,7375,7377,75473,7576,7478,7774,74876,7379,7774,7574,731275,7373,7270,7169,69本文檔共189頁;當(dāng)前第67頁;編輯于星期一\17點(diǎn)50分考慮如下問題:1)收縮率(因素A)、拉伸倍數(shù)(因素B)對彈性y有無顯著性影響?2)因素A和因素B是否有交互作用?3)使纖維彈性達(dá)到最大的生產(chǎn)條件是什么?要用方差分析將不同收縮率和不同拉伸倍數(shù)的影響區(qū)分開來。即檢驗(yàn):H0A:不同收縮率對彈性無影響,H1A:不同收縮率對彈性有顯著影響H0B:不同拉伸倍數(shù)對彈性無影響,H1B:不同拉伸倍數(shù)對彈性有顯著影響本文檔共189頁;當(dāng)前第68頁;編輯于星期一\17點(diǎn)50分(1)分析設(shè)置1)將表5-6中數(shù)據(jù)整理成如圖所示結(jié)構(gòu)的數(shù)據(jù)集,存放在Mylib.xwtx中;2)在INSIGHT模塊中打開數(shù)據(jù)集Mylib.xwtx。由于在Insight中,要求方差分析中的自變量必須是列名型的,故先把變量a和b的測量水平由區(qū)間型改為列名型;本文檔共189頁;當(dāng)前第69頁;編輯于星期一\17點(diǎn)50分3)選擇菜單“Analyze(分析)”→“Fit(擬合)”,在打開的“Fit(XY)”對話框中選擇數(shù)值型變量作因變量,分類型變量作自變量,如圖所示。
圖5-24數(shù)據(jù)集xwtx與分析變量的選擇為了考慮變量a和b的交互作用,同時選上a、b,然后單擊“Cross”按鈕,注意到在右框中多了a*b一行,如圖5-24右所示。4)單擊“OK”按鈕,得到分析結(jié)果。本文檔共189頁;當(dāng)前第70頁;編輯于星期一\17點(diǎn)50分(2)分析結(jié)果1)在參數(shù)信息表中較無交互作用的情形多了表示兩個因素各個水平組合下的標(biāo)識變量,而在模型方程表中也就多了許多的參數(shù),如圖5-25所示;圖5-25多因素方差分析的前5張表
本文檔共189頁;當(dāng)前第71頁;編輯于星期一\17點(diǎn)50分2)在方差分析表中,檢驗(yàn)?zāi)P惋@著性的F統(tǒng)計(jì)量為7.87,相應(yīng)的p值為0.0001<0.05,所以模型的效應(yīng)是顯著的;3)在Ⅲ型檢驗(yàn)表中,將模型平方和分解為兩個因素和它們的交互作用,表中看出,檢驗(yàn)b變量效應(yīng)的p值為0.1363>0.05,所以從總體上看b變量的效應(yīng)不顯著;檢驗(yàn)a變量效應(yīng)的p值為<0.0001<0.05,所以變量a的效應(yīng)是顯著的;檢驗(yàn)兩者交互作用的p值為0.0006<0.05,所以交互作用的影響也是顯著的,如圖5-27。本文檔共189頁;當(dāng)前第72頁;編輯于星期一\17點(diǎn)50分4)在模型方程(圖5-25中)和參數(shù)估計(jì)表(圖5-28)中也提供了雙因素不同水平組合下因變量y均值的估計(jì)和比較的信息。因?yàn)檫@里是考慮存在交互作用的情形,所以較為復(fù)雜一些。本文檔共189頁;當(dāng)前第73頁;編輯于星期一\17點(diǎn)50分5.3.2用“分析家”作雙因素方差分析1.不存在交互作用的雙因素方差分析下面介紹在“分析家”中對例5-2作方差分析:1)在“分析家”中,打開數(shù)據(jù)集Mylib.xjpf;2)選擇菜單“Statistics(統(tǒng)計(jì))”→“ANOVA(方差分析)”→“FactorialANOVA(因素方差分析)”,打開“FactorialANOVA”對話框(如圖5-29);本文檔共189頁;當(dāng)前第74頁;編輯于星期一\17點(diǎn)50分
若要得到用圖形表示的兩個因素不同水平下均值和標(biāo)準(zhǔn)差的信息,可以單擊“Plots”按鈕,在打開的“FactorialANOVA:Plots”對話框中,選中“Meansplots”欄下的“PlotsDependentMeansforMainEffects(作主效應(yīng)響應(yīng)均值圖)”。
本文檔共189頁;當(dāng)前第75頁;編輯于星期一\17點(diǎn)50分4)分析結(jié)果如圖5-30所示,其中內(nèi)容前面已講,這里不再贅述。圖5-30無交互作用的多因素方差分析本文檔共189頁;當(dāng)前第76頁;編輯于星期一\17點(diǎn)50分5)在分析家窗口的項(xiàng)目管理器中依次雙擊“MeansPlots”下的兩個選項(xiàng),得到響應(yīng)變量關(guān)于自變量a、b的均值圖如圖5-31所示。
圖5-31響應(yīng)變量關(guān)于自變量a、b的均值圖圖中描述了變量a、b不同水平下的均值和標(biāo)準(zhǔn)差的圖形,從中可以對不同水平下均值的差異有一個直觀的了解。
本文檔共189頁;當(dāng)前第77頁;編輯于星期一\17點(diǎn)50分2.存在交互作用的雙因素方差分析下面介紹在“分析家”中對例5-3合成纖維的試驗(yàn)數(shù)據(jù)作方差分析。分析步驟如下:1)在“分析家”中,打開數(shù)據(jù)集Mylib.xwtx;2)選擇菜單“Statistics”→“ANOVA”→“FactorialANOVA”,打開“FactorialANOVA”對話框,按圖選擇參數(shù)與圖形;本文檔共189頁;當(dāng)前第78頁;編輯于星期一\17點(diǎn)50分輸出的方差分析表給出雙因素考慮交互作用的方差分析模型是顯著的(F=7.87,p=0.0001),最下面一張表給出兩個因素和交互作用的檢驗(yàn)結(jié)果。由最后一列“Pr>F”的三個p值可以看出因素A及因素A與B的交互作用(A*B)對指標(biāo)y的影響是高度顯著的,而因素B在=0.05的水平上對指標(biāo)y的影響是不顯著(p=0.1363>0.05)。本文檔共189頁;當(dāng)前第79頁;編輯于星期一\17點(diǎn)50分在分析家窗口的項(xiàng)目管理器中依次雙擊選項(xiàng)“MeansPlotofybyaandb”,得到雙因素不同水平下因變量均值差異的連線圖如圖5-35所示。直觀地可以看出使纖維彈性達(dá)最大的最佳生產(chǎn)條件是A3和B2;其次是A2和B3。本文檔共189頁;當(dāng)前第80頁;編輯于星期一\17點(diǎn)50分5.3.3用GLM過程進(jìn)行雙因素方差分析1.不考慮交互作用過程GLM也可用于多因素方差分析,其用法與單因素方差分析是相同的,只需要在class語句和model語句中分別填入表示因素的多個自變量。以數(shù)據(jù)集Mylib.xjpf為例,為了比較變量a和b不同水平下因變量stren均值的差異,可使用以下程序:procglmdata=Mylib.xjpf;classab;modelstren=ab;run;本文檔共189頁;當(dāng)前第81頁;編輯于星期一\17點(diǎn)50分提交上述程序后得到與上一節(jié)使用“分析家”有相似的結(jié)果,如圖5-36所示。有關(guān)的說明請參見上節(jié)的解釋。本文檔共189頁;當(dāng)前第82頁;編輯于星期一\17點(diǎn)50分2.考慮交互作用使用過程GLM于多因素方差分析時,若要考慮交互作用只需要在model語句中增加相應(yīng)的交互作用項(xiàng)即可。以數(shù)據(jù)集Mylib.xjpf為例,為了比較變量a和b不同水平組合下變量stren均值的差異,可使用以下的程序:procglmdata=Mylib.xjpf;classab;modelstren=aba*b;run;這里model語句中a*b就是指明要考慮交互作用。本文檔共189頁;當(dāng)前第83頁;編輯于星期一\17點(diǎn)50分提交這一程序后的輸出如圖5-37所示。圖5-37使用GLM過程作有交互作用的多因素方差分析本文檔共189頁;當(dāng)前第84頁;編輯于星期一\17點(diǎn)50分5.4均值估計(jì)與多重比較5.4.1概述5.4.2用“分析家”進(jìn)行均值比較本文檔共189頁;當(dāng)前第85頁;編輯于星期一\17點(diǎn)50分5.4.1概述在方差分析中,不論是單因素或多因素的實(shí)驗(yàn)結(jié)果,都是檢驗(yàn)關(guān)于參數(shù)的一個整體的假設(shè)。若原假設(shè)被拒絕,表明某個因素各個水平下的響應(yīng)有顯著差異或因素間存在交互影響,但并不了解某兩個水平下響應(yīng)是否有差異。所以在方差分析后,還常需要對各水平下響應(yīng)變量的均值進(jìn)行估計(jì)和比較。本文檔共189頁;當(dāng)前第86頁;編輯于星期一\17點(diǎn)50分5.4.2用“分析家”進(jìn)行均值比較1.對于單因素方差分析的均值比較下面介紹在“分析家”中對例5-1作均值比較。(1)分析設(shè)置1)在“分析家”中,打開數(shù)據(jù)集Mylib.xfzts;2)選擇菜單“Statistics”→“ANOVA”→“One-WayANOVA”,打開“One-WayANOVA”對話框,按圖所示設(shè)置;本文檔共189頁;當(dāng)前第87頁;編輯于星期一\17點(diǎn)50分3)單擊“Means(均值)”按鈕,在打開的“One-WayANOVA:Means”對話框中選中“Comparisons(比較)”選項(xiàng)卡。按圖設(shè)置。本文檔共189頁;當(dāng)前第88頁;編輯于星期一\17點(diǎn)50分(2)分析結(jié)果1)使用Tukey'sHSD檢驗(yàn)法的結(jié)果,如圖5-39所示。圖5-39Duncan'sMultipleRange檢驗(yàn)法它先提示這一檢驗(yàn)法是控制整體的第一類錯誤的,但它的第二類錯誤一般比REGWQ方法要高。本文檔共189頁;當(dāng)前第89頁;編輯于星期一\17點(diǎn)50分然后指出根據(jù)所用的方法,兩個均值間顯著差異最小值為20.362,即不同水平間均值之差超過20.362,就表明這兩個水平下的均值是有顯著差異的。最后,不同水平下響應(yīng)變量的均值自大至小排成一列,無顯著效應(yīng)的水平在左側(cè)用同一字母標(biāo)出。例如,航空業(yè)與旅游業(yè)、零售業(yè)無顯著差異,與家電制造業(yè)有顯著差異,家電制造業(yè)與零售業(yè)、旅游業(yè)無顯著差異,等等。本文檔共189頁;當(dāng)前第90頁;編輯于星期一\17點(diǎn)50分2)使用Dunnett'st-test檢驗(yàn)法的結(jié)果,如圖所示。圖5-40Dunnett'st-test檢驗(yàn)法用這一方法給出t的臨界值為2.34654,兩個均值間顯著差異最小值為18.297。以下顯示成組比較的結(jié)果,凡是達(dá)到0.08顯著性水平的則在最右邊一欄加標(biāo)三個星號***??梢钥闯?,家電制造業(yè)與航空業(yè)有顯著差異。其他行業(yè)之間均無顯著差異。本文檔共189頁;當(dāng)前第91頁;編輯于星期一\17點(diǎn)50分3)使用Fisher最小顯著差異(LSD)檢驗(yàn)法的結(jié)果,如圖所示。圖5-41Fisher最小顯著差異(LSD)檢驗(yàn)法用這一方法給出t的臨界值為1.86928,兩個均值間顯著差異最小值為14.576。以下顯示成組比較的結(jié)果,可以看出,航空業(yè)與旅游業(yè)無顯著差異,與其他行業(yè)均有顯著差異。其他行業(yè)之間均無顯著差異。本文檔共189頁;當(dāng)前第92頁;編輯于星期一\17點(diǎn)50分2.對于多因素方差分析的均值比較下面介紹在“分析家”中對例5-3合成纖維的試驗(yàn)數(shù)據(jù)作均值比較。(1)分析設(shè)置1)在“分析家”中,打開數(shù)據(jù)集Mylib.xwtx;2)選擇菜單“Statistics(統(tǒng)計(jì))”→“ANOVA(方差分析)”→“FactorialANOVA(因素方差分析)”,打開“FactorialANOVA”對話框;3)選中變量a、b,單擊“Independent(自變量)”按鈕,將其移到“Independent”框中;選中變量y,單擊按鈕“Dependent(因變量)”,將其移到“Dependent”框中;本文檔共189頁;當(dāng)前第93頁;編輯于星期一\17點(diǎn)50分4)考慮因素間的交互作用:單擊“Model”按鈕,打開“FactorialANOVAModel”對話框。單擊“StandardModels”按鈕,在彈出的菜單中選擇“Effectsupto2-wavinteractions”項(xiàng),表示交互作用的a*b加入了模型效應(yīng)欄,單擊“OK”按鈕返回;圖5-42設(shè)置模型和均值參數(shù)本文檔共189頁;當(dāng)前第94頁;編輯于星期一\17點(diǎn)50分5)單擊“Means(均值)”按鈕,在打開的“One-WayANOVA:Means”對話框中選中“Comparisons(比較)”選項(xiàng)卡。在“Comparisonmethod”下拉列表中選擇比較法Fisher'sLSD,在“Maineffects(主效應(yīng))”欄中選擇變量a、b,單擊“Add”按鈕,加到主效應(yīng)框中。再在“Comparisonmethod”下拉列表中選擇比較法Tuck'sHSD,在“Maineffects(主效應(yīng))”欄中選擇變量a,單擊“Add”按鈕,加到主效應(yīng)框中,如圖5-42;單擊“OK”,返回,再單擊“OK”得到分析結(jié)果。本文檔共189頁;當(dāng)前第95頁;編輯于星期一\17點(diǎn)50分(2)分析結(jié)果在顯示方差分析結(jié)果的后面,有關(guān)于均值比較的三張表,如圖5-43、4-44所示。用Fisher最小顯著差異檢驗(yàn)的結(jié)果表明(圖5-43),收縮率為4和8之間無顯著差異,而另兩個收縮率有顯著差異。拉伸倍數(shù)520和640之間有顯著差異,其余無顯著差異。本文檔共189頁;當(dāng)前第96頁;編輯于星期一\17點(diǎn)50分圖5-43Fisher最小顯著差異檢驗(yàn)本文檔共189頁;當(dāng)前第97頁;編輯于星期一\17點(diǎn)50分用Tucky誠實(shí)顯著差異檢驗(yàn)對收縮率的比較結(jié)果表明(圖5-44),收縮率12與其他收縮率之間有顯著差異。與Fisher最小顯著差異法的區(qū)別在于臨界點(diǎn),前者為1.6583,后者為1.2287。本文檔共189頁;當(dāng)前第98頁;編輯于星期一\17點(diǎn)50分第六章主成分分析與因子分析6.1主成分分析6.2因子分析本文檔共189頁;當(dāng)前第99頁;編輯于星期一\17點(diǎn)50分6.1主成分分析6.1.1主成分分析的概念與步驟6.1.2使用INSIGHT模塊作主成分分析6.1.3使用“分析家”作主成分分析6.1.4使用PRINCOMP過程進(jìn)行主成分分析本文檔共189頁;當(dāng)前第100頁;編輯于星期一\17點(diǎn)50分6.1.1主成分分析的概念與步驟1.主成分分析基本思想主成分分析是數(shù)學(xué)上對數(shù)據(jù)降維的一種方法。其基本思想是設(shè)法將原來眾多的具有一定相關(guān)性的指標(biāo)(比如p個指標(biāo)),重新組合成一組新的互不相關(guān)的綜合指標(biāo)來代替原來指標(biāo)。通常數(shù)學(xué)上的處理就是將原來p個指標(biāo)作線性組合,作為新的綜合指標(biāo)。但是這種線性組合,如果不加限制,則可以有很多,應(yīng)該如何去選取呢?本文檔共189頁;當(dāng)前第101頁;編輯于星期一\17點(diǎn)50分在所有的線性組合中所選取的F1應(yīng)該是方差最大的,故稱F1為第一主成分。如果第一主成分不足以代表原來p個指標(biāo)的信息,再考慮選取F2即選第二個線性組合。為了有效地反映原有信息,F(xiàn)1已有的信息就不需要再出現(xiàn)在F2中,用數(shù)學(xué)語言表達(dá)就是要求Cov(F1,F(xiàn)2)=0。稱F2為第二主成分,依此類推可以構(gòu)造出第三、第四、…、第p個主成分。本文檔共189頁;當(dāng)前第102頁;編輯于星期一\17點(diǎn)50分2.主成分分析的數(shù)學(xué)模型設(shè)有n個樣品(多元觀測值),每個樣品觀測p項(xiàng)指標(biāo)(變量):X1,X2,…,Xp,得到原始數(shù)據(jù)資料陣:其中Xi=(x1i,x2i,…,xni)',i=1,2,…,p。本文檔共189頁;當(dāng)前第103頁;編輯于星期一\17點(diǎn)50分用數(shù)據(jù)矩陣X的p個列向量(即p個指標(biāo)向量)X1,X2,…,Xp作線性組合,得綜合指標(biāo)向量:簡寫成:Fi=a1iX1+ai2X2+…+apiXp
i=1,2,…,p本文檔共189頁;當(dāng)前第104頁;編輯于星期一\17點(diǎn)50分為了加以限制,對組合系數(shù)ai'=(a1i,a2i,…,api)作如下要求:即:ai為單位向量:ai'ai=1,且由下列原則決定:1)Fi與Fj(ij,i,j=1,…,p)互不相關(guān),即Cov(Fi,F(xiàn)j)=ai'ai=0,其中Σ是X的協(xié)方差陣。2)F1是X1,X2,…,Xp的一切線性組合(系數(shù)滿足上述要求)中方差最大的,即,其中c=(c1,c2,…,cp)'
F2是與F1不相關(guān)的X1,X2,…,Xp一切線性組合中方差最大的,…,F(xiàn)p是與F1,F(xiàn)2,…,F(xiàn)p-1都不相關(guān)的X1,X2,…,Xp的一切線性組合中方差最大的。本文檔共189頁;當(dāng)前第105頁;編輯于星期一\17點(diǎn)50分滿足上述要求的綜合指標(biāo)向量F1,F(xiàn)2,…,F(xiàn)p就是主成分,這p個主成分從原始指標(biāo)所提供的信息總量中所提取的信息量依次遞減,每一個主成分所提取的信息量用方差來度量,主成分方差的貢獻(xiàn)就等于原指標(biāo)相關(guān)系數(shù)矩陣相應(yīng)的特征值i,每一個主成分的組合系數(shù)ai'=(a1i,a2i,…,api)就是相應(yīng)特征值i所對應(yīng)的單位特征向量ti。方差的貢獻(xiàn)率為,i越大,說明相應(yīng)的主成分反映綜合信息的能力越強(qiáng)。本文檔共189頁;當(dāng)前第106頁;編輯于星期一\17點(diǎn)50分3.主成分分析的步驟(1)計(jì)算協(xié)方差矩陣計(jì)算樣品數(shù)據(jù)的協(xié)方差矩陣:Σ=(sij)pp,其中
i,j=1,2,…,p(2)求出Σ的特征值及相應(yīng)的特征向量求出協(xié)方差矩陣Σ的特征值12…p>0及相應(yīng)的正交化單位特征向量:則X的第i個主成分為Fi=ai'X
i=1,2,…,p。本文檔共189頁;當(dāng)前第107頁;編輯于星期一\17點(diǎn)50分(3)選擇主成分在已確定的全部p個主成分中合理選擇m個來實(shí)現(xiàn)最終的評價分析。一般用方差貢獻(xiàn)率解釋主成分Fi所反映的信息量的大小,m的確定以累計(jì)貢獻(xiàn)率達(dá)到足夠大(一般在85%以上)為原則。本文檔共189頁;當(dāng)前第108頁;編輯于星期一\17點(diǎn)50分(4)計(jì)算主成分得分計(jì)算n個樣品在m個主成分上的得分:
i=1,2,…,m(5)標(biāo)準(zhǔn)化實(shí)際應(yīng)用時,指標(biāo)的量綱往往不同,所以在主成分計(jì)算之前應(yīng)先消除量綱的影響。消除數(shù)據(jù)的量綱有很多方法,常用方法是將原始數(shù)據(jù)標(biāo)準(zhǔn)化,即做如下數(shù)據(jù)變換:其中,,j=1,2,…,p。標(biāo)準(zhǔn)化后的數(shù)據(jù)陣記為X*,其中每個列向量(標(biāo)準(zhǔn)化變量)的均值為0,標(biāo)準(zhǔn)差為1,數(shù)據(jù)無量綱。本文檔共189頁;當(dāng)前第109頁;編輯于星期一\17點(diǎn)50分標(biāo)準(zhǔn)化后變量的協(xié)方差矩陣(CovarianceMatrix)Σ=(sij)pp,即原變量的相關(guān)系數(shù)矩陣(CorrelationMatrix)R=(rij)pp:i,j=1,2,…,p此時n個樣品在m個主成分上的得分應(yīng)為:Fj=a1jX1*+a2jX2*+...+apjXp*
j=1,2,…,m本文檔共189頁;當(dāng)前第110頁;編輯于星期一\17點(diǎn)50分6.1.2使用INSIGHT模塊作主成分分析【例6-1】全國沿海10個省市經(jīng)濟(jì)指標(biāo)的主成分分析表6-1全國沿海10個省市經(jīng)濟(jì)綜合指標(biāo)假設(shè)表6-1中數(shù)據(jù)已經(jīng)存放在數(shù)據(jù)集Mylib.jjzb中,試對各地區(qū)的經(jīng)濟(jì)發(fā)展水平進(jìn)行主成分分析。地區(qū)GDPx1人均GDPx2工業(yè)增加值x3第三產(chǎn)業(yè)增加值x4固定資產(chǎn)投資x5基本建設(shè)投資x6社會消費(fèi)品零售總額x7海關(guān)出口總額x8地方財政收入x9遼寧5458.2130001376.22258.41315.95292258.4123.7399.7山東10550116433502.538512288.71070.73181.9211.1610.2河北6076.690471406.72092.61161.6597.11968.345.9302.3天津2022.622068822.8960703.7361.9941.4115.7171.8江蘇10636.3143973536.33967.223201141.33215.8384.7643.7上海5408.8406272196.22755.81970.2779.32035.2320.5709浙江7670165702356.530652296.61180.62877.5294.2566.9福建4682135101047.11859964.5397.91663.3173.7272.9廣東11769.7150304224.64793.63022.91275.55013.61843.71201.6廣西2455.45062367995.7542.2352.71025.515.1186.7本文檔共189頁;當(dāng)前第111頁;編輯于星期一\17點(diǎn)50分1.使用INSIGHT模塊做主成分分析的步驟使用INSIGHT模塊做主成分分析的步驟如下:1)在INSIGHT模塊中打開數(shù)據(jù)集Mylib.jjzb;選擇菜單“Analyze”“Multivariate(YX)(多元分析)”,打開“Multivariate(YX)”對話框;2)將做主成分分析的變量x1~x9選為Y變量,將變量diqu選為Label變量,如圖所示。本文檔共189頁;當(dāng)前第112頁;編輯于星期一\17點(diǎn)50分圖6-1多元分析對話框3)單擊“Method”按鈕,在打開的對話框中可以選擇計(jì)算協(xié)方差矩陣的特征值或是計(jì)算相關(guān)系數(shù)矩陣的特征值。系統(tǒng)默認(rèn)計(jì)算相關(guān)系數(shù)矩陣的特征值和特征向量,單擊“OK”按鈕返回。本文檔共189頁;當(dāng)前第113頁;編輯于星期一\17點(diǎn)50分4)單擊“Output”按鈕,在打開的對話框(圖左)中包括“DescriptiveStatistics”選項(xiàng)、“BivariatePlots”選項(xiàng)以及各種多元分析的選項(xiàng)。選中“PrincipalComponentAnalysis”復(fù)選框,單擊下面的“PrincipalComponentOptions”按鈕,打開“PrincipalComponentOptions”對話框,選中“Eigenvectors”復(fù)選框,取消“Correlations(Structure)”復(fù)選框,如圖右所示。
本文檔共189頁;當(dāng)前第114頁;編輯于星期一\17點(diǎn)50分2.主成分的結(jié)果分析輸出的數(shù)字分析結(jié)果有4個部分:簡單統(tǒng)計(jì)量、相關(guān)系數(shù)矩陣、相關(guān)系數(shù)矩陣的特征值以及相關(guān)系數(shù)矩陣的特征向量。本文檔共189頁;當(dāng)前第115頁;編輯于星期一\17點(diǎn)50分3)圖6-5給出相關(guān)系數(shù)矩陣的特征值(Eigenvalue)、上下特征值之差(Difference)、各主成分的方差貢獻(xiàn)率(Proportion)以及累積貢獻(xiàn)率(Cumulative)。
相關(guān)系數(shù)矩陣的特征值即各主成分的方差,可以看出,第一主成分的方差貢獻(xiàn)率為80.11%,前兩個主成分的累積貢獻(xiàn)率已達(dá)92.33%,因此,只需用前面2個主成分就可以概括這組數(shù)據(jù)。
本文檔共189頁;當(dāng)前第116頁;編輯于星期一\17點(diǎn)50分4)圖6-6給出相關(guān)系數(shù)矩陣的兩個最大特征值的特征向量,據(jù)此可以寫出第一和第二主成分得分:PCR1=0.35x1*+0.04x2*+0.36x3*+0.37x4*+0.37x5*+0.35x6*+0.36x7*+0.30x8*+0.36x9*PCR2=-0.21x1*+0.94x2*–0.01x3*–0.05x4*+0.10x5*–0.02x6*–0.14x7*+0.05x8*+0.18x9*對于第一主成分而言,除了x2(人均GDP)外,各變量所占比重均在0.3左右以上,因此第一主成分(Prin1)主要由x1、x3~x9八個變量解釋;而第二主成分則主要由x2這一個變量解釋。本文檔共189頁;當(dāng)前第117頁;編輯于星期一\17點(diǎn)50分5)選擇菜單“Edit(編輯)”“Observations(觀測)”“LabelinPlots”,在彈出的對話框中選中所有diqu變量值,單擊“OK”按鈕返回,顯示結(jié)果中的散點(diǎn)圖上出現(xiàn)地區(qū)名;圖中看出,上海在第二主成分PCR2的得分遠(yuǎn)遠(yuǎn)高于其他省市,而在第一主成分PCR1的得分則處于中間。廣東、江蘇、山東和浙江則在第1主成分的得分上位于前列。本文檔共189頁;當(dāng)前第118頁;編輯于星期一\17點(diǎn)50分6)回到INSIGHT的數(shù)據(jù)窗口,可以看到前兩個主成分的得分情況(如圖6-8左)。單擊數(shù)據(jù)窗口左上角的箭頭,在彈出的菜單中選擇“Sort(排序)”選項(xiàng),在打開的對話框中選定排序變量PCR1,并單擊“Asc/Des”按鈕將其設(shè)為降序(Des),如圖6-8所示。
本文檔共189頁;當(dāng)前第119頁;編
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 現(xiàn)代小區(qū)火災(zāi)應(yīng)急救援隊(duì)伍的實(shí)戰(zhàn)化訓(xùn)練探討
- 現(xiàn)代企業(yè)員工激勵機(jī)制設(shè)計(jì)與實(shí)踐
- 班級環(huán)境衛(wèi)生與校園文化建設(shè)的結(jié)合
- 4《機(jī)械擺鐘》說課稿-2023-2024學(xué)年科學(xué)五年級上冊教科版
- 2023七年級數(shù)學(xué)上冊 第3章 一次方程與方程組3.2 一元一次方程的應(yīng)用第1課時 等積變形和行程問題說課稿 (新版)滬科版
- Unit 4 Plants around us Part A Let's learn(說課稿)-2024-2025學(xué)年人教PEP版(2024)英語三年級上冊
- 2024-2025學(xué)年新教材高中英語 Unit 3 The world meets China預(yù)習(xí) 新知早知道1(教用文檔)說課稿 外研版選擇性必修第四冊
- 2025日本食品業(yè)A公司特許合同樣本
- 2025年銀行擔(dān)保借款合同范本
- 1小蝌蚪找媽媽 說課稿-2024-2025學(xué)年語文二年級上冊統(tǒng)編版
- 潮汕民俗文化科普知識講座
- 睡眠障礙護(hù)理查房課件
- 金融工程.鄭振龍(全套課件560P)
- 英語演講技巧和欣賞課件
- 物流托運(yùn)單模板
- 【員工關(guān)系管理研究國內(nèi)外文獻(xiàn)綜述2800字】
- 六年級語文下冊閱讀及參考答案(12篇)
- 蘇教版(蘇少版)九年級美術(shù)下冊全冊課件
- 2022年江蘇省鹽城市中考英語試題及參考答案
- 中國文化簡介英文版(ChineseCultureintroduction)課件
- 文化差異與跨文化交際課件(完整版)
評論
0/150
提交評論