第九章一方差分析_第1頁
第九章一方差分析_第2頁
第九章一方差分析_第3頁
第九章一方差分析_第4頁
第九章一方差分析_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第九章一方差分析第一頁,共五十九頁,編輯于2023年,星期四第一節(jié)方差分析的基本問題

一、方差分析的內(nèi)容

對多個總體均值是否相等進行檢驗(一)方差分析在科學實驗和生產(chǎn)實踐中,影響一事物的因素很多,每一個因素的改變都有可能影響產(chǎn)品的數(shù)量和質(zhì)量,有些影響較大,有些影響較小,怎么找出對產(chǎn)品有顯著影響的因素?我們需要進行試驗測量。將所有測量值間的總差異按照其差異的來源分解為多個部份,然后進行比較,評價由某種因素所引起的差異是否具有統(tǒng)計學意義。第二頁,共五十九頁,編輯于2023年,星期四例9.1某飲料生產(chǎn)企業(yè)研制出一種新型飲料。飲料的顏色共有四種,分別為橘黃色、粉色、綠色和無色透明。這四種飲料的營養(yǎng)含量、味道、價格、包裝等可能影響銷售量的因素全部相同?,F(xiàn)從地理位置相似、經(jīng)營規(guī)模相仿的五家超級市場上收集了前一期該種飲料的銷售量情況。見表9-1。問飲料的顏色是否對銷售量產(chǎn)生影響。超市無色粉色橘黃色綠色126.531.227.930.8228.728.325.129.6325.130.828.532.4429.127.924.231.7527.229.626.532.8表9-1該飲料在五家超市的銷售情況單位:箱第三頁,共五十九頁,編輯于2023年,星期四幾個基本概念

1.對銷售量是否有影響的那些(可以控制的)條件稱為因素;2.為了考察一個因素的影響,一般把它嚴格控制在幾個不同的狀態(tài)等級上,把因素的每一個狀態(tài)或等級稱為一個水平;3.只考察一個因素的方差分析,稱為單因素方差分析;4.同時考察兩個或兩個以上因素的方差分析,稱為多因素方差分析;5.假定各水平的數(shù)據(jù)是來自正態(tài)分布總體的隨機樣本,各水平的樣本互相獨立,且方差相等。第四頁,共五十九頁,編輯于2023年,星期四例9.1的分析1.檢驗飲料的顏色對銷售量是否有影響,即檢驗四種顏色飲料的平均銷售量是否相等。則飲料顏色就是考察的因素,而四種顏色就是四個水平2.用和分別表示無色、粉色、橘黃色和綠色飲料的平均銷售量,那么就是要檢驗如下的假設是否成立。而備選假設則為3.上述假設的檢驗方法就是方差分析和不全相等第五頁,共五十九頁,編輯于2023年,星期四二、方差分析原理

1.兩類誤差及兩類方差⑴.每個水平為一個總體;⑵.每個水平的一組觀察值為總體的一個隨機樣本,同一水平下樣本觀察值之間的差異稱為隨機誤差,用組內(nèi)方差來表示;⑶.不同水平下樣本觀察值之間的差異可能是由于不同水平引起的,這種誤差稱為系統(tǒng)誤差,但也包含隨機誤差。不同水平樣本觀察值之間差異用組間方差來表示,即組間方差包括隨機誤差,也包括系統(tǒng)誤差。第六頁,共五十九頁,編輯于2023年,星期四2.方差的比較⑴.如果不同水平對試驗結果沒有不同影響,那么組間方差中只包括隨機誤差,這時,組間方差與組內(nèi)方差應該相近,組間方差與組內(nèi)方差之比接近1;⑵.如果不同水平對試驗結果有不同影響,那么組間方差除了隨機誤差之外還包括系統(tǒng)誤差,這時,組間方差就會大于組內(nèi)方差,組間方差與組內(nèi)方差之比就會大于1;⑶.方差分析就是通過這種方差的比較,作出接受原假設或拒絕原假設的判斷。第七頁,共五十九頁,編輯于2023年,星期四三、F分布F服從F分布。F分布為正偏態(tài),隨著自由度的增加趨于對稱。當自由度很大時,F(xiàn)分布可用正態(tài)分布來近似。第八頁,共五十九頁,編輯于2023年,星期四第二節(jié)單因素方差分析

一、單因素方差分析的步驟

㈠、提出假設對于r個水平的單因素方差分析,原假設和備擇假設為不全相等對于例9.1,則不全相等第九頁,共五十九頁,編輯于2023年,星期四㈡、計算水平均值設第j水平有個觀察值,則第j個水平的樣本均值:第j水平下的第i個觀察值。而樣本總均值其中其中(9.2)(9.3)第十頁,共五十九頁,編輯于2023年,星期四觀察值i水平1234無色粉色橘黃色綠色126.531.227.930.8228.728.325.129.6325.130.828.532.4429.127.924.231.7527.229.626.532.8合計136.6147.8132.2157.3573.9水平均值四種顏色飲料銷售量及均值單位:箱表9-2第十一頁,共五十九頁,編輯于2023年,星期四㈢、計算離差平方和

1.總離差平方和

(總變異):用SST表示總離差平均和,反映全部數(shù)據(jù)的離散情況,即(9.4)例9.1的總離差平方和為第十二頁,共五十九頁,編輯于2023年,星期四2.誤差項離差平方和

(組內(nèi)變異):用SSE表示誤差項離差平方和,反映各水平數(shù)據(jù)的離散情況,即例9.1的1水平數(shù)據(jù)的平方和(9.5)第十三頁,共五十九頁,編輯于2023年,星期四類似可得從而第十四頁,共五十九頁,編輯于2023年,星期四3.水平項離差平方和

(組間變異)

:用SSA表示水平項離差平方和,反映各水平樣本數(shù)據(jù)之間的異差程度,即對于例9.1有(9.6)第十五頁,共五十九頁,編輯于2023年,星期四三個平方和的關系總離差平方和SST、誤差項離差平方和SSE及水平項離差平方和SSA之間的關系

SST=SSA+SSE證:(9.7)第十六頁,共五十九頁,編輯于2023年,星期四續(xù)(三個平方和的關系)由于從而在實際計算時,一般先計算SST和SSA,而

SSE=SST-SSA對于例9.1有115.9295=76.8455+39.084第十七頁,共五十九頁,編輯于2023年,星期四組間變異總變異組內(nèi)變異第十八頁,共五十九頁,編輯于2023年,星期四㈣、計算平均平方1.各個離差平方和的大小與數(shù)據(jù)的多少有關,各個離差平方和的平均稱為平均平方,也稱均方或方差,用MS表示;2.平均平方是離差平方和除以相應的自由度;3.三個平方和的自由度分別為:⑴SST的自由度為n-1⑵SSA的自由度為r-1⑶SSE的自由度為第十九頁,共五十九頁,編輯于2023年,星期四續(xù)(計算平均平方)4.SSA的平均平方記為MSA,即5.SSE的平均平方記為MSE,即(9.8)關于自由度,存在如下的關系式(9.9)對于例9.1第二十頁,共五十九頁,編輯于2023年,星期四三個平方和的作用1.SST反映了全部樣本數(shù)據(jù)的總離散程度,SSE反映了由于隨機性引起的變動部分,即隨機誤差;而SSA則反映了不同水平之間引起的變動部分,即可以同時反映隨機誤差和系統(tǒng)誤差的大小;2.如果成立,即為真,則表明沒有系統(tǒng)誤差,那么MSA和MSE都反映隨機誤差的大小,從而3.如果不成立,即不全相等,則SSA不僅反映了隨機誤差,同時還反映了系統(tǒng)誤差的大小,從而F有偏大的趨勢。應接近1;第二十一頁,共五十九頁,編輯于2023年,星期四㈤、方差分析表當為真,即時,則對于例9.1,計算得前面這些計算結果可以列成表格的形式,稱為方差分析表。第二十二頁,共五十九頁,編輯于2023年,星期四方差來源離差平方和自由度平均平方F值SS

dfMS組間SSAr-1MSAMSA/MSE組內(nèi)SSEn-rMSE-總差異SSTn-1

--方差分析表表9-3第二十三頁,共五十九頁,編輯于2023年,星期四㈥、統(tǒng)計決策對于規(guī)定的顯著性水平,由于根據(jù)小概率原理,若則拒絕。認為各水平均值不全相等。稱所考察因素的各水平間差異顯著,或各水平均值間有顯著差異,而當則不能拒絕。這時稱各水平之間無顯著差異,即認為成立,各水平的均值都相等。第二十四頁,共五十九頁,編輯于2023年,星期四續(xù)(統(tǒng)計決策)對于例9.1,若取,則由于從而拒絕。認為飲料的四種不同顏色的平均銷售量有顯著差異,即飲料的顏色對銷售量有顯著影響。第二十五頁,共五十九頁,編輯于2023年,星期四表9-4差異源SSdfmsFP-valueF-crit組間76.8455325.6151710.48620.0004663.23887組內(nèi)39.0840162.44275---總計115.929519----Excel輸出的方差分析表第二十六頁,共五十九頁,編輯于2023年,星期四二、方差分析中的多重比較1.方差分析拒絕,從而接受時,認為各水平均值不全相等。多重比較是通過對各均值之間的配對比較來進一步檢驗到底哪些均值之間有顯著差異;2.多重比較的方法有多種,這里介紹最小顯著差異法(LeastSignificantDifference-LSD)和q檢驗兩種方法.第二十七頁,共五十九頁,編輯于2023年,星期四㈠、最小顯著差異法(LSD)

LSD方法具有檢驗敏感性高的特點,即水平間的均值只要存在一定程度的微小差異就可能被檢驗出來。是一種檢驗兩個總體均值是否相等的t檢驗方法:(9.10)其中是由兩個樣本的數(shù)據(jù)求得。當對多個總體進行比較時,由于SSE的平均平方MSE是由r個水平的全部樣本數(shù)據(jù)求得,從而用MSE代替。于是統(tǒng)計量t為(9.11)第二十八頁,共五十九頁,編輯于2023年,星期四多重比較的步驟1.提出原假設和備擇假設3.若則拒絕,稱和有顯著差異,否則不能拒絕。即接受,稱和沒有顯著差異。2.檢驗統(tǒng)計量第二十九頁,共五十九頁,編輯于2023年,星期四LSD

方法

LSD方法通常并不按t值作檢驗,而是基于作檢驗。1.提出和3.若則拒絕,否則接受2.計算LSD第三十頁,共五十九頁,編輯于2023年,星期四例9.1的LSD方法已知取,則從而多重比較的結果可以列成表格形式,稱為多重比較表第三十一頁,共五十九頁,編輯于2023年,星期四例9.1的多重比較表(LSD法)=31.465.02*4.14*1.9=29.563.12*2.24*=27.320.88=26.44表中的差值右上角標者表示相應的第三十二頁,共五十九頁,編輯于2023年,星期四㈡、q檢驗

q檢驗要求各水平的觀察值個數(shù)相等,即。首先計算(9.13)然后查q表,q表值由和確定。由此計算臨界值(9.14)則認為,否則認為。若第三十三頁,共五十九頁,編輯于2023年,星期四q檢驗步驟1.提出原假設和備擇假設3.若2.計算D則拒絕,稱和有顯著差異。否則不能拒絕,即接受,稱和沒有顯著差異。第三十四頁,共五十九頁,編輯于2023年,星期四例9.1的q檢驗已知,則再按查q表得于是多重比較的結果列于多重比較表第三十五頁,共五十九頁,編輯于2023年,星期四例9.1的多重比較表(q檢驗)=31.465.02*4.14*1.9=29.563.12*2.24=27.320.88=26.44表中的差值右上角標者表示相應的第三十六頁,共五十九頁,編輯于2023年,星期四LSD法與q檢驗的說明1.LSD=2.096,D=2.83,從而兩種方法的結論有差別。由于按LSD法,則認為,但從而按q檢驗,又認為。一般認為q檢驗的結果更為可靠。第三十七頁,共五十九頁,編輯于2023年,星期四續(xù)(LSD法與q檢驗的說明)2.q檢驗要求,即,否則應按調(diào)和平均數(shù)計算m,即然后再按(9.13)式計算,對于LSD法各水平的觀察值個數(shù)可以相等,也可以不相等。(9.15)第三十八頁,共五十九頁,編輯于2023年,星期四第三節(jié)雙因素方差分析

一、雙因素方差分析的類型1.同時分析兩個因素(因素A和因素B)對試驗結果的影響;2.分別對兩個因素進行檢驗,考察各自的作用;3.如果因素A和因素B對試驗結果的影響是相互獨立的,則可以分別考察各自的影響,這種雙因素方差分析稱為無交互作用的雙因素方差分析;4.如果因素A和因素B除了各自對試驗結果的影響外,還產(chǎn)生額外的新影響,這種額外的影響稱為交互作用,這時的雙因素方差分析則稱為有交互作用的雙因素方差分析;(自學)5.無交互作用的雙因素方差分析,相當于對每個因素分別進行單因素方差分析.第三十九頁,共五十九頁,編輯于2023年,星期四二、數(shù)據(jù)結構

㈠、雙因素方差分析的基本假定1.對于各因素的每個水平的觀察值,是來自正態(tài)總體的簡單隨機樣本;2.各正態(tài)總體的方差都相等;3.各隨機樣本相互獨立。第四十頁,共五十九頁,編輯于2023年,星期四表9-8因素(A)A1A2…ArB1X11X12…X1rB2X21X22…X2r...............BBkXk1Xk2…Xkr…雙因素方差分析數(shù)據(jù)結構因素第四十一頁,共五十九頁,編輯于2023年,星期四㈡、各水平樣本均值與樣本總均值1.A因素第j水平的樣本均值2.B因素第i水平的樣本均值3.樣本總平均第四十二頁,共五十九頁,編輯于2023年,星期四三、雙因素方差分析的步驟

㈠、提出假設1.對因素A提出的假設為不全相等2.對因素B提出的假設為不全相等第四十三頁,共五十九頁,編輯于2023年,星期四㈡、計算離差平方和

1.總離差平方和反映全部數(shù)據(jù)的離散情況(9.16)第四十四頁,共五十九頁,編輯于2023年,星期四(9.17)2.因素A的離差平方和反映因素A各水平之間的差異第四十五頁,共五十九頁,編輯于2023年,星期四(9.18)3.因素B的離差平方和反映因素B各水平之間的差異第四十六頁,共五十九頁,編輯于2023年,星期四(9.19)4.誤差項離差平方和反映了隨機誤差的離散情況第四十七頁,共五十九頁,編輯于2023年,星期四(9.19)離差平方和的分離公式即

SST=SSA+SSB+SSE第四十八頁,共五十九頁,編輯于2023年,星期四㈢、計算平均平方1.各個離差平方和的大小與數(shù)據(jù)的多少有關,各個離差平方和的平均稱為平均平方2.平均平方是離差平方和除以相應的自由度3.各個平方和的自由度分別為⑴SST的自由度為n-1⑵SSA的自由度為r-1⑶SSB的自由度為k-1⑷SSE的自由度為且第四十九頁,共五十九頁,編輯于2023年,星期四續(xù)(計算平均平方)4.SSA的平均平方記為MSA,即5.SSB的平均平方記為MSB,即6.SSE的平均平方記為MSE,即(9.20)(9.21)(9.22)第五十頁,共五十九頁,編輯于2023年,星期四㈣、方差分析表1.檢驗因素A的各水平對試驗結果有無顯著影響,采用統(tǒng)計量2.檢驗因素B的各水平對試驗結果有無顯著影響,采用統(tǒng)計量第五十一頁,共五十九頁,編輯于2023年,星期四表9-9誤差來源離差平方和自由度均方差F值A因素SSAr-1MSA=SSA/(r-1)FA=MSA/MSEB因素SSBk-1MSB=SSB/(k-1)FB=MSB/MSE誤差SSE(r-1)(k-1)MSE=

SSE/(r-1)(k-1)-合計SSTn-1--雙因素方差分析表第五十二頁,共五十九頁,編輯于2023年,星期四㈤、統(tǒng)計決策1.對規(guī)定的顯著性水平

,由于則拒絕,認為因素A的各水平間有顯著差異2.對規(guī)定的

,由于根據(jù)小概率原理,若從而,若則拒絕,認為因素B的各水平間有顯著差異第五十三頁,共五十九頁,編輯于2023年,星期四四、應用實例

例9.3某商品有五種不同包裝方式(因素A),在五個不同地區(qū)銷售(因素B),現(xiàn)從每個地區(qū)隨機抽取一個規(guī)模相同的超級市場,得到該商品不同包裝的銷售資料

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論