




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、單因素方差分析培訓(xùn)培訓(xùn)時間:2012年5月培訓(xùn)部門:生產(chǎn)運(yùn)營部第1頁,共45頁。什么是方差?方差是各個數(shù)據(jù)與平均數(shù)之差的平方和的平均數(shù),即: s=(x1-x) +(x2-x) +.+(xn-x) 】/ n其中,x樣本的平均數(shù), n樣本的數(shù)量, xn個體; s方差。 方差反映的是數(shù)據(jù)的離散度222第2頁,共45頁。方差意義 方差也是比較數(shù)據(jù)的一個非常有用的工具,比較兩組數(shù)據(jù)大小一般用平均數(shù),但是有的時候平均數(shù)不能非常準(zhǔn)確的表示數(shù)據(jù)。例: 有現(xiàn)在有六只雞,每三只一組,每組雞的重量為: 第一組: 2.5,3,3.5 第二組: 1,3,5 兩組雞重量的平均數(shù)是一樣的,但是這兩組雞卻有明顯的差別,這是平
2、均數(shù)就不能體現(xiàn)二者的差別,所以我們引入了方差的概念。第3頁,共45頁。什么是方差分析(ANOVA)?檢驗多個總體均值是否相等通過分析觀察數(shù)據(jù)的誤差判斷各總體均值是否相等是從觀測變量的方差入手,研究諸多控制變量中哪些變量是對觀測變量有顯著影響的變量.一個或多個分類尺度的自變量2個或多個 (k 個) 處理水平或分類第4頁,共45頁。什么是方差分析? (例題分析)消費(fèi)者對四個行業(yè)的投訴次數(shù) 行業(yè)觀測值零售業(yè)旅游業(yè)航空公司家電制造業(yè)12345675766494034534468392945565131492134404451657758【例】為了對幾個行業(yè)的服務(wù)質(zhì)量進(jìn)行評價,消費(fèi)者協(xié)會在四個行業(yè)分別抽
3、取了不同的企業(yè)作為樣本。最近一年中消費(fèi)者對總共23家企業(yè)投訴的次數(shù)如下表第5頁,共45頁。什么是方差分析? (例題分析)分析四個行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異,也就是要判斷“行業(yè)”對“投訴次數(shù)”是否有顯著影響作出這種判斷最終被歸結(jié)為檢驗這四個行業(yè)被投訴次數(shù)的均值是否相等如果它們的均值相等,就意味著“行業(yè)”對投訴次數(shù)是沒有影響的,即它們之間的服務(wù)質(zhì)量沒有顯著差異;如果均值不全相等,則意味著“行業(yè)”對投訴次數(shù)是有影響的,它們之間的服務(wù)質(zhì)量有顯著差異第6頁,共45頁。方差分析中的有關(guān)術(shù)語因素或因子(factor):所要檢驗的對象要分析行業(yè)對投訴次數(shù)是否有影響,行業(yè)是要檢驗的因素或因子水平或處理(t
4、reatment):因子的不同表現(xiàn)零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)就是因子的水平觀察值:在每個因素水平下得到的樣本值每個行業(yè)被投訴的次數(shù)就是觀察值第7頁,共45頁。方差分析中的有關(guān)術(shù)語試驗這里只涉及一個因素,因此稱為單因素四水平的試驗總體因素的每一個水平可以看作是一個總體比如零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)可以看作是四個總體樣本數(shù)據(jù)被投訴次數(shù)可以看作是從這四個總體中抽取的樣本數(shù)據(jù)第8頁,共45頁。方差分析的基本思想和原理(圖形分析) 零售業(yè) 旅游業(yè) 航空公司 家電制造第9頁,共45頁。從散點(diǎn)圖上可以看出不同行業(yè)被投訴的次數(shù)是有明顯差異的即使是在同一個行業(yè),不同企業(yè)被投訴的次數(shù)也明顯不同
5、行業(yè)與被投訴次數(shù)之間有一定的關(guān)系如果行業(yè)與被投訴次數(shù)之間沒有關(guān)系,那么它們被投訴的次數(shù)應(yīng)該差不多相同,在散點(diǎn)圖上所呈現(xiàn)的模式也就應(yīng)該很接近方差分析的基本思想和原理(圖形分析)第10頁,共45頁。僅從散點(diǎn)圖上觀察還不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯著差異這種差異也可能是由于抽樣的隨機(jī)性所造成的需要有更準(zhǔn)確的方法來檢驗這種差異是否顯著,也就是進(jìn)行方差分析之所以叫方差分析,因為雖然我們感興趣的是均值,但在判斷均值之間是否有差異時則需要借助于方差它是通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等(不僅是數(shù)量層面的相等)。因此,進(jìn)行方差分析時,需要考察數(shù)據(jù)誤差的來源。 方差分析的基本
6、思想和原理方差體現(xiàn)的是一組數(shù)據(jù)的離散度第11頁,共45頁。1.比較兩類誤差,以檢驗均值是否相等2.比較的基礎(chǔ)是方差比3.如果系統(tǒng)(處理)誤差顯著地不同于隨機(jī)誤差,則均值就是不相等的;反之,均值就是相等的4.誤差是由各部分的誤差占總誤差的比例來測度的方差分析的基本思想和原理 兩類誤差:隨即誤差、系統(tǒng)誤差 兩類方差:組內(nèi)方差、組間方差第12頁,共45頁。方差分析的基本思想和原理(兩類誤差)隨機(jī)誤差因素的同一水平(總體)下,樣本各觀察值之間的差異比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)是不同的這種差異可以看成是隨機(jī)因素的影響,稱為隨機(jī)誤差 系統(tǒng)誤差因素的不同水平(不同總體)下,各觀察值之間的差異 如:不同
7、行業(yè)之間的被投訴次數(shù)之間的差異這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差第13頁,共45頁。方差分析的基本思想和原理(兩類方差)組內(nèi)方差(within groups):MSE因素的同一水平(同一個總體)下樣本數(shù)據(jù)的方差比如,零售業(yè)被投訴次數(shù)的方差組內(nèi)方差只包含隨機(jī)誤差組間方差(between groups):MSA因素的不同水平(不同總體)下各樣本之間的方差比如,四個行業(yè)被投訴次數(shù)之間的方差組間方差既包括隨機(jī)誤差,也包括系統(tǒng)誤差結(jié)合計算實(shí)例第14頁,共45頁。方差分析的基本思想和原理(F檢驗:方差的比較)1.若不同不
8、同行業(yè)對投訴次數(shù)沒有影響,則組間誤差中只包含隨機(jī)誤差,沒有系統(tǒng)誤差。 F = MSA / MSE 12.若不同行業(yè)對投訴次數(shù)有影響,在組間誤差中除了包含隨機(jī)誤差外,還會包含有系統(tǒng)誤差。 F = MSA / MSE 13.當(dāng)這個比值大到某種程度(臨界值Fa)時,就可以說不同水平之間存在著顯著差異,也就是自變量對因變量有影響第15頁,共45頁。方差分析的基本假定每個總體都應(yīng)服從正態(tài)分布對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機(jī)樣本比如,每個行業(yè)被投訴的次數(shù)必需服從正態(tài)分布各個總體的方差必須相同 需進(jìn)行方差齊性檢驗各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的比如,四個行業(yè)被投訴次數(shù)
9、的方差都相等觀察值是獨(dú)立的比如,每個行業(yè)被投訴的次數(shù)與其他行業(yè)被投訴的次數(shù)獨(dú)立第16頁,共45頁。F(X)-3 -2 - 2 368.26%95.45%99.73%X正態(tài)分布圖正態(tài)分布特點(diǎn)第17頁,共45頁。方差分析中基本假定 如果原假設(shè)成立,即H0: m1 = m2 = m3 = m4四個行業(yè)被投訴次數(shù)的均值都相等意味著每個樣本都來自均值為、方差為2的同 一正態(tài)總體 Xf(X)1 2 3 4 第18頁,共45頁。方差分析中基本假定若備擇假設(shè)成立,即H1: mi (i=1,2,3,4)不全相等至少有一個總體的均值是不同的四個樣本分別來自均值不同的四個正態(tài)總體 Xf(X)3 1 2 4 第19頁
10、,共45頁。問題的一般提法設(shè)因素有k個水平,每個水平的均值分別用1、2、k 表示要檢驗k個水平(總體)的均值是否相等,需要提出如下假設(shè): 原假設(shè)H0: 1 2 k 備擇假設(shè)H1: 1 , 2 , ,k 不全相等設(shè)1為零售業(yè)被投訴次數(shù)的均值,2為旅游業(yè)被投訴次數(shù)的均值,3為航空公司被投訴次數(shù)的均值,4為家電制造業(yè)被投訴次數(shù)的均值,提出的假設(shè)為 H0: 1 2 3 4 H1: 1 , 2 , 3 , 4 不全相等第20頁,共45頁。單因素方差分析數(shù)據(jù)結(jié)構(gòu)分析步驟關(guān)系強(qiáng)度的測量用Excel進(jìn)行方差分析第21頁,共45頁。單因素方差分析的數(shù)據(jù)結(jié)構(gòu)(one-way analysis of varianc
11、e) 觀察值 ( j )因素(A) i 水平A1 水平A2 水平Ak12:n x11 x21 xk1 x12 x22 xk2 : : : : : : : : x1n x2n xkn第22頁,共45頁。分析步驟:提出假設(shè)構(gòu)造檢驗統(tǒng)計量統(tǒng)計決策第23頁,共45頁。提出假設(shè)一般提法原假設(shè):H0: m1 = m2 = mk 自變量對因變量沒有顯著影響 備擇假設(shè):H1: m1 ,m2 , ,mk不全相等 自變量對因變量有顯著影響 注意: 拒絕原假設(shè),只表明至少有兩個總體的均值不相等,并不意味著所有的均值都不相等 第24頁,共45頁。構(gòu)造檢驗的統(tǒng)計量構(gòu)造統(tǒng)計量需要計算:水平的均值(組均值)全部觀察值的總均
12、值誤差平方和 總誤差平方和=組內(nèi)平方和+組間平方和均方(MS) :組內(nèi)方差、組間方差 結(jié)合實(shí)例計算演練講解第25頁,共45頁。構(gòu)造檢驗的統(tǒng)計量(計算水平的均值)假定從第i個總體中抽取一個容量為ni的簡單隨機(jī)樣本,第i個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數(shù)計算公式為 式中: ni為第 i 個總體的樣本觀察值個數(shù) xij 為第 i 個總體的第 j 個觀察值 第26頁,共45頁。構(gòu)造檢驗的統(tǒng)計量(計算全部觀察值的總均值)全部觀察值的總和除以觀察值的總個數(shù)計算公式為 第27頁,共45頁。構(gòu)造檢驗的統(tǒng)計量(例題分析)第28頁,共45頁。構(gòu)造檢驗的統(tǒng)計量(計算總誤差平方和 SST)全部觀
13、察值 與總平均值 的離差平方和反映全部觀察值的離散狀況其計算公式為 前例的計算結(jié)果: SST = (57-47.869565)2+(58-47.869565)2 =115.9295第29頁,共45頁。構(gòu)造檢驗的統(tǒng)計量(計算水平項平方和 SSA)各組平均值 與總平均值 的離差平方和反映各總體的樣本均值之間的差異程度,又稱組間平方和該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差計算公式為 前例的計算結(jié)果:SSA = 1456.608696第30頁,共45頁。構(gòu)造檢驗的統(tǒng)計量(計算誤差項平方和 SSE)每個水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個樣本各觀察值的離散狀況,又稱組內(nèi)平方和該平方和反映
14、的是隨機(jī)誤差的大小計算公式為 前例的計算結(jié)果:SSE = 2708第31頁,共45頁。構(gòu)造檢驗的統(tǒng)計量(三個平方和的關(guān)系)總離差平方和(SST)、誤差項離差平方和(SSE)、水平項離差平方和 (SSA) 之間的關(guān)系SST = SSA + SSE 前例的計算結(jié)果: 4164.608696=1456.608696+2708 第32頁,共45頁。構(gòu)造檢驗的統(tǒng)計量(三個平方和的作用) SST:反映全部數(shù)據(jù)總的誤差程度; SSE:反映隨機(jī)誤差的大?。?SSA:反映隨機(jī)誤差和系統(tǒng)誤差的大小 如果原假設(shè)成立,則表明沒有系統(tǒng)誤差,SSA除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會太大;
15、如果組間均方顯著地大于組內(nèi)均方,說明各水平(總體)之間的差異不僅有隨機(jī)誤差,還有系統(tǒng)誤差 判斷因素的水平是否對其觀察值有影響,實(shí)際上就是比較組間方差與組內(nèi)方差之間差異的大小第33頁,共45頁。構(gòu)造檢驗的統(tǒng)計量(計算均方MS)各誤差平方和的大小與觀察值的多少有關(guān),為消除觀察值多少對誤差平方和大小的影響,需要將其平均,這就是均方,又稱方差。計算方法:是用誤差平方和除以相應(yīng)的自由度三個平方和對應(yīng)的自由度分別是SST 的自由度為n-1,其中n為全部觀察值的個數(shù)SSA 的自由度為k-1,其中k為因素水平(總體)的個數(shù)SSE 的自由度為n-k第34頁,共45頁。構(gòu)造檢驗的統(tǒng)計量(計算均方 MS) 組間方差
16、:SSA的均方,記為MSA,計算公式為 組內(nèi)方差:SSE的均方,記為MSE,計算公式為第35頁,共45頁。構(gòu)造檢驗的統(tǒng)計量(計算檢驗統(tǒng)計量 F )將MSA和MSE進(jìn)行對比,即得到所需要的檢驗統(tǒng)計量F當(dāng)H0為真時,二者的比值服從分子自由度為k-1、分母自由度為 n-k 的 F 分布,即 隨即誤差 +系統(tǒng)誤差 隨即誤差 第36頁,共45頁。構(gòu)造檢驗的統(tǒng)計量(F分布與拒絕域)如果均值相等,F(xiàn)=MSA/MSE1a F 分布F(k-1,n-k)0拒絕H0不拒絕H0F:顯著性水平第37頁,共45頁。統(tǒng)計決策 將統(tǒng)計量的值F與給定的顯著性水平的臨界值F進(jìn)行比較,作出對原假設(shè)H0的決策根據(jù)給定的顯著性水平,在
17、F分布表中查找與第一自由度df1k-1、第二自由度df2=n-k 相應(yīng)的臨界值 F 若FF ,則拒絕原假設(shè)H0 ,表明均值之間的差異是顯著的,所檢驗的因素對觀察值有顯著影響若FF ,則不拒絕原假設(shè)H0 ,不能認(rèn)為所檢驗的因素對觀察值有顯著影響 第38頁,共45頁。單因素方差分析表(基本結(jié)構(gòu))第39頁,共45頁。單因素方差分析(例題分析)第40頁,共45頁。用Excel進(jìn)行方差分析第41頁,共45頁。用Excel進(jìn)行方差分析 第1步:選擇“工具”下拉菜單第2步:選擇“數(shù)據(jù)分析”選項第3步:在分析工具中選擇“單因素方差分析” ,然 后選擇“確定”第4步:當(dāng)對話框出現(xiàn)時 在“輸入?yún)^(qū)域”方框內(nèi)鍵入數(shù)據(jù)
18、單元格區(qū)域 在方框內(nèi)鍵入0.05(可根據(jù)需要確定) 在“輸出選項”中選擇輸出區(qū)域用Excel進(jìn)行方差分析第42頁,共45頁。單因素方差分析的進(jìn)一步分析方差齊性分析多重比較檢驗是對控制變量不同水平下各觀測變量總體方差是否相等進(jìn)行檢驗。滿足方差齊性是方差分析的前提 。經(jīng)分析如果控制變量確實(shí)對觀測變量產(chǎn)生了顯著影響,需進(jìn)一步確定控制變量的不同水平對觀測變量的影響程度如何 下次例會分享第43頁,共45頁。謝謝!第44頁,共45頁。激勵學(xué)生學(xué)習(xí)的名言格言220、每一個成功者都有一個開始。勇于開始,才能找到成功的路。221、世界會向那些有目標(biāo)和遠(yuǎn)見的人讓路(馮兩努香港著名推銷商)222、絆腳石乃是進(jìn)身之階。223、銷售世界上第一號的產(chǎn)品不是汽車,而是自己。在你成功地把自己推銷給別人之前,你必須百分之百的把自己推銷給自己。224、即使爬到最高的山上,一次也只能腳踏實(shí)地地邁一步。225、積極思考造成積極人生,消極思考造成消極人生。226、人之所以有一張嘴,而有兩只耳朵,原因是聽的要比說的多一倍。227、別想一下造出大海,必須先由小河川開始。228、有事者,事竟成;破釜沉舟,百二秦關(guān)終歸楚;苦心人,天不負(fù);臥薪嘗膽,三千越甲可吞吳。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工具制造工藝集成-深度研究
- 病歷信息抽取與語義理解-深度研究
- 物聯(lián)網(wǎng)設(shè)備融合-深度研究
- 遺產(chǎn)繼承中的代際公平性-深度研究
- 架構(gòu)彈性與容災(zāi)設(shè)計-深度研究
- 跨界融合室內(nèi)設(shè)計-深度研究
- 深度學(xué)習(xí)在視頻檢測中的應(yīng)用-深度研究
- 跨文化教學(xué)案例分析-深度研究
- 質(zhì)量服務(wù)提升路徑-深度研究
- 大連楓葉職業(yè)技術(shù)學(xué)院《環(huán)境生態(tài)工程CAD》2023-2024學(xué)年第二學(xué)期期末試卷
- 教科版六年級科學(xué)下冊全冊教學(xué)設(shè)計教案
- 2024年青島遠(yuǎn)洋船員職業(yè)學(xué)院高職單招語文歷年參考題庫含答案解析
- 定額〔2025〕1號文-關(guān)于發(fā)布2018版電力建設(shè)工程概預(yù)算定額2024年度價格水平調(diào)整的通知
- 2024建筑施工安全生產(chǎn)隱患識別圖合集
- 2025年江蘇南京技師學(xué)院招聘工作人員19人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024年吉安職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫附答案
- 2024阿里巴巴云計算云主機(jī)租賃及運(yùn)維服務(wù)合同2篇
- 高技能人才培訓(xùn)基地 建設(shè)項目實(shí)施方案
- 消毒供應(yīng)中心禮儀培訓(xùn)
- 微信公眾號運(yùn)營步驟
- 2024年河南省中職對口升學(xué)高考語文試題真題(解析版)
評論
0/150
提交評論