




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
本文格式為Word版,下載可任意編輯——《試驗設計與數據處理》lecture6Lecture6——方差分析
一、方差分析概述
.方差分析的概念
–在科學試驗中往往要探討不同試驗條件或處理方法對試驗結果的影響。尋常是比較不同試驗條件下樣本均值間的差異。
–方差分析是檢驗多組樣本均值間的差異是否具有統計意義的一種方法。
例如:.研究幾種藥物對某種疾病的療效;.農業(yè)研究土壤、肥料、日照時間等因素對某種農作物產量的影響;.不同飼料對牲畜體重增長的效果等。.方差分析的基本思想
–若被考察的因素對試驗結果沒有顯著的影響,即所探討的各正態(tài)總體的均值相等,則試驗數據的波動完全由隨機誤差引起;
–假使各正態(tài)總體均值不全相等,則說明試驗數據的波動除了隨機誤差的影響外,還包含被考察因素效應的影響。
–為此,需要構造一個適當的統計量,來描述數據的波動程度。將這個統計量分解為兩部分:
一部分是純隨機誤差造成的影響,另一部分是除隨機誤差的影響外來自于因素效應的影響。然后將這兩部分進行比較,假使后者明顯比前者大,就說明因素的效應是顯著的。.若方差分析只針對一個因素進行,稱為單因素方差分析。.假使同時針對多個因素進行,稱為多因素分析。在多因素方差分析中,雙因素方差分析里最常見的。.方差分析中進行檢驗假設的三個假定:–1、各個水平的觀測數據必需聽從正態(tài)分布:在水平Ai下的數據是來自正態(tài)總體的一個樣本,i=1,2…,r。
–2、方差一致或者叫方差齊性:r個正態(tài)總體的方差相等。–3、隨機性:所有數據都相互獨立。
–在上述三個假定條件下,判斷不同正態(tài)總體是否有顯著影響,實際上也就是檢驗具有同方差的正態(tài)總體的均值是否相等。–假使總體的均值相等,可以期望樣本的均值也會很接近:.樣本的均值越接近,推斷總體均值相等的證據也就越充分;.樣本均值越不同,推斷總體均值不同的證據就越充分。
.方差分析的假設檢驗–零假設H0:m組樣本均值都一致,即μ1=μ2==μm;
–若備擇假設成立,即H1:mi(i=1,2,……,m)不全相等。.至少有一個總體的均值是不同的;.樣本分別來自均值不同的正態(tài)總體。
.方差分析的目的是要檢驗各個水平的均值μ1,μ2……μm是否相等,實現這個目的的手段是通過方差的比較。
.假使n個總體的均值相等,然希望n個樣本的均值比較接近,事實上,n個樣本的均值愈接近,就愈有證據得出結論:總體均值相等,反之,若n個樣本均值的差異愈大,就得出結論,總體均值不相等。.樣本均值變動性小→支持H0,樣本均值變動性大→支持H1。.方差分析基本原理
–方差分析的關鍵是對全部數據的變異程度進行分解。
–總平均:–試驗總差異:.總平方和
–組內平均值:.
(sumofsquaresfortotal)
.表示了各試驗值與總平均值的偏差的平方和;.反映了試驗結果之間存在的總差異。–認為不同處理組的均值間的區(qū)別基本來源有兩個:
.(1)隨機誤差,如測量誤差造成的差異或個體間的差異,稱為組內差異,用變量在各組的均值與該組內變量值之偏差平方和的總和表示,記作SSe(sumofsquareforerror)。
.反映了在各水平內,各試驗值之間的差異程度.由于隨機
誤差的作用產生
.(2)試驗條件,即不同的處理造成的差異,稱為組間差異。用變量在各組的均值與總均值之偏差平方和表示,記作SSA,(sumofsquareforfactorA)
.反映了各組內平均值之間的差異程度;
.由于因素A不同水平的不同作用造成的。–三種離差平方和之間關系:
計算自由度(degreeoffreedom)–總自由度:dfT=n-1–組間自由度:dfA=r-1–組內自由度:dfe=n-r
–三者關系:dfT=dfA+dfe
–組內SSe、組間SSa除以各自的自由度(組內n-m,組間m-1,其中n為樣本總數,m為組數),得到其均方MSe和MSa。
–一種狀況是處理沒有作用,即各組樣本均來自同一總體,MSa/MSe≈1。另一種狀況是處理確實有作用,那么,MSa>>MSe。–MSa/MSe比值構成F分布,用F值與其臨界值比較,推斷各樣本是否來自一致的總體。
–假使經過計算結果組間均方遠遠大于組內均方(MSa>>MSe),F>F0.05(dfa,dfe),p0.05不能拒絕零假設,說明樣本來自一致的正態(tài)總體,處理間無差異。
二、單因素方差分析
.一、建立假設–方差分析的第一步是建立假設。針對我們關心的問題提出原假設和備擇假設。
–H0:μ1=μ2=……=μm各正態(tài)總體均數相等;–H1:μ1,μ2,……,μm各正態(tài)總體不全相等。
–注意:拒絕原假設,只說明至少有兩個總體的均值不相等,并不意味著所有的均值都不相等。
.二、計算水平均值
–令表示第j種水平的樣本均值,則:,式中:xij為第j種水平下
的第i個觀測值,nj第j種水平的觀測值個數。
–計算總均值(總均值:是所有觀測值的總和除以觀測值的總數)
(注:各個樣本容量相等)
.三、計算離差平方和
–1、總離差平方和SST(SumofSquaresforTotal)
.
–2、誤差項離差平方和(組內)SSE(SumofSquaresForError)
–3、水平項離差平方和(組間)SSA或SSb(SumofSquaresforfactorA)
–總離差平方和(SST)、誤差項離差平方和(SSE)、水平項離差平方和(SSA)之間的關系:即:
SST=SSA+SSE–三個平方和的作用
.SST反映全部數據總的誤差程度;SSE反映隨機誤差的大?。籗SA反映隨機誤差和系統誤差的大小
.假使原假設成立,則說明沒有系統誤差,組間平方和SSA除以自由度后的均方與組內平方和SSE和除以自由度后的均方差異就不會太大;假使組間均方顯著地大于組內均方,說明各水平(總體)之間的差異不僅有隨機誤差,還有系統誤差。
.判斷因素的水平是否對其觀測值有影響,實際上就是比較組間方差與組內方差之間差異的大小
.四、計算平均平方
–用離差平方和除以自由度即可得到平均平方
–SST、SSA、SSE之間的自由度存在著如下的關系:n-r=(r-1)+(n-r)
.五、方差分析表
–F分布與拒絕域
.六、統計結果分析
–把F值與Fa值比較:
.若FA>F0.01(dfA,dfe),稱因素A對試驗結果有十分顯著的影響,用“**〞號表示;
.若F0.05(dfA,dfe)<FA<F0.01(dfA,dfe),則因素A對試驗結果有顯著的影響,用“*〞號表示;.若FA<F0.05(dfA,dfe),則因素A對試驗結果的影響不顯著。.單因素方差分析應用實例
–為考察溫度對某種化工產品得率的影響,選取了五種不同的溫度,在同一溫度下各作三次試驗,試驗數據如表。試問溫度對得率有無明顯影響?
–yielddata.正態(tài)性檢驗
–shapiro.test(yield[temperature==\.方差齊性檢驗
–bartlett.test(yield~temperature,data=yielddata)
三、雙因素方差分析
.在大量實際問題中,需要考慮影響試驗數據的因素多于一個的情形。例如在化學合成反應中,幾種原料的用量、反應時間、溫度的控制等等都可能影響試驗結果,這就構成多因素試驗問題。
.雙因素試驗的方差分析
–探討兩個因素對試驗結果影響的顯著性,又稱為二元方差分析。根據每種組合水平上的試驗次數,可以將其分為無重復試驗和重復試驗的方差分析。.雙因素方差分析的基本假定
–每個總體都聽從正態(tài)分布.對于因素的每一個水平,其觀測值是來自正態(tài)分布總體的簡單隨機樣本
–各個總體的方差必需一致.對于各組觀測數據,是從具有一致方差的總體中抽取的–觀測值是獨立的。
雙因素無重復試驗的方差分析–數據結構
–分析步驟–1)提出假設
.對行因素提出的假設為:.H0:u1=u2=…=ui=…=uk(ui為第i個水平的均值);.H1:ui(i=1,2,…,k)不全相等
.對列因素提出的假設為:.H0:m1=m2=…=mj=…=mr(mj為第j個水平的均值).H1:mj(j=1,2,…,r)不全相等–2)構造檢驗的統計量.總誤差平方和
.因素A引起離差的平方和:
.因素B引起離差的平方和:
.誤差平方和:
.計算自由度
–SSA的自由度:dfA=r-1–SSB的自由度:dfB=s-1–SSe的自由度:dfe=(r-1)(s-1)–SST的自由度:dfT=n-1=rs-1–dfT=dfA+dfB+dfe.計算均方
.F檢驗
–3)統計決策.FA聽從自由度為(dfA,dfe)的F分布;.對于給定的顯著性水平a,查F分布表:Fa(dfA,dfe),Fa(dfB,dfe).若FA>Fa(dfA,dfe),則因素A對試驗結果有顯著影響,否則無顯著影響;.若FB>Fa(dfB,dfe),則因素B對試驗結果有顯著影響,否則無顯著影響;–(1)雙因素重復試驗方差分析試驗表
–(2)雙因素重復試驗方差分析的基本步驟.①計算平均值
.總平均:
.任一組合水平(Ai,Bj)上:
.Ai水平日:
.Bj水平日:.②計算離差平方和–總離差平方和:
–因素A引起離差的平方和:
–因素B引起離差的平方和:
–交互作用A×B引起離差的平方和:
.③計算自由度
–SSA的自由度:dfA=r-1–SSB的自由度:dfB=s-1–SSA×B的自由度:dfA×B=(r-1)(s-1)–SSe的自由度:dfe=rs(c-1)
–SST的自由度:dfT=n-1=rsc-1–dfT=dfA+dfB+dfA×B+dfe.④計算均方
.⑤F檢驗
–若FA>Fa(dfA,dfe),則認為因素A對試驗結果有顯著影響,否則無顯著影響;–若FB>Fa(dfB,dfe),則認為因素B對試驗結果有顯著影響,否則無顯著影響;–若FA×B>Fa(dfA×B,dfe),則認為交互作用A×B對試驗結果有顯著影響,否則無
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年機械制造企業(yè)服務化轉型政策環(huán)境解讀報告
- 2025年工業(yè)互聯網平臺網絡流量整形技術在能源領域的應用報告
- 2025年嬰幼兒配方食品營養(yǎng)配方中低敏配方研究與應用報告
- 2025年低碳城市規(guī)劃與青島實踐案例深度剖析報告
- 互聯網醫(yī)療平臺2025年在線問診與線下醫(yī)療服務銜接報告
- 2025年在線教育平臺教學質量評估中的課程資源整合策略報告
- 2025年工業(yè)互聯網平臺微服務架構性能測試:智慧校園建設報告
- 2025年網絡文學國際傳播路徑與效果分析報告
- 工業(yè)互聯網平臺數字水印技術在智能醫(yī)療中的應用:2025年數據保護與醫(yī)療信息化報告
- 2025年裝配式建筑部品部件標準化設計在裝配式建筑裝配式防腐中的應用報告
- 江蘇省南通市海安市2024-2025學年高二下學期4月期中生物試題(原卷版+解析版)
- 中國鐵路西安局招聘高校畢業(yè)生考試真題2024
- 2023北京初三一模數學試題匯編:代數綜合(第26題)
- 畢業(yè)設計產品包裝設計
- 安徽卷-2025屆高考化學全真模擬卷
- 河北省石家莊市2025屆普通高中高三教學質量檢測(三)英語試卷及答案
- 2025屆百師聯盟高三下學期二輪復習聯考(三)政治試題(含答案)
- 2024年云南省文山州第二人民醫(yī)院選調工作人員考試真題
- 《埃菲爾鐵塔》課件
- 深圳市城市規(guī)劃標準與準則2024版
- 2025年高考化學三輪沖刺:實驗綜合大題 刷題練習題(含答案解析)
評論
0/150
提交評論