連續(xù)變量的統(tǒng)計(jì)推斷(二)-單因素方差分析_第1頁
連續(xù)變量的統(tǒng)計(jì)推斷(二)-單因素方差分析_第2頁
連續(xù)變量的統(tǒng)計(jì)推斷(二)-單因素方差分析_第3頁
連續(xù)變量的統(tǒng)計(jì)推斷(二)-單因素方差分析_第4頁
連續(xù)變量的統(tǒng)計(jì)推斷(二)-單因素方差分析_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

SPSS統(tǒng)計(jì)分析

基礎(chǔ)教程北京理工大學(xué)珠海學(xué)院1可編輯ppt什么是方差分析?2可編輯ppt什么是方差分析?

(概念要點(diǎn))1.檢驗(yàn)多個總體均值是否相等通過對各觀察數(shù)據(jù)誤差來源的分析來判斷多個總體均值是否相等2.變量一個定類尺度的自變量2個或多個(k個)處理水平或分類一個定距或定比尺度的因變量3什么是方差分析?

(一個例子)表8-1該飲料在五家超市的銷售情況超市無色粉色橘黃色綠色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8【例8.1】某飲料生產(chǎn)企業(yè)研制出一種新型飲料。飲料的顏色共有四種,分別為橘黃色、粉色、綠色和無色透明。這四種飲料的營養(yǎng)含量、味道、價格、包裝等可能影響銷售量的因素全部相同。現(xiàn)從地理位置相似、經(jīng)營規(guī)模相仿的五家超級市場上收集了前一時期該飲料的銷售情況,見表8-1。試分析飲料的顏色是否對銷售量產(chǎn)生影響。4什么是方差分析?

(例子的進(jìn)一步分析)檢驗(yàn)飲料的顏色對銷售量是否有影響,也就是檢驗(yàn)四種顏色飲料的平均銷售量是否相同設(shè)

1為無色飲料的平均銷售量,

2粉色飲料的平均銷售量,

3為橘黃色飲料的平均銷售量,

4為綠色飲料的平均銷售量,也就是檢驗(yàn)下面的假設(shè)H0:1

2

3

4

H1:1,2,3,4不全相等檢驗(yàn)上述假設(shè)所采用的方法就是方差分析5方差分析的基本思想和原理6可編輯ppt方差分析的基本思想和原理

(幾個基本概念)因素或因子所要檢驗(yàn)的對象稱為因子要分析飲料的顏色對銷售量是否有影響,顏色是要檢驗(yàn)的因素或因子水平因素的具體表現(xiàn)稱為水平A1、A2、A3、A4四種顏色就是因素的水平觀察值在每個因素水平下得到的樣本值每種顏色飲料的銷售量就是觀察值7方差分析的基本思想和原理

(幾個基本概念)試驗(yàn)這里只涉及一個因素,因此稱為單因素四水平的試驗(yàn)總體因素的每一個水平可以看作是一個總體比如A1、A2、A3、A4四種顏色可以看作是四個總體樣本數(shù)據(jù)上面的數(shù)據(jù)可以看作是從這四個總體中抽取的樣本數(shù)據(jù)81. 比較兩類誤差,以檢驗(yàn)均值是否相等2. 比較的基礎(chǔ)是方差比3. 如果系統(tǒng)(處理)誤差顯著地不同于隨機(jī)誤差,則均值就是不相等的;反之,均值就是相等的4. 誤差是由各部分的誤差占總誤差的比例來測度的方差分析的基本思想和原理9方差分析的基本思想和原理

(兩類誤差)隨機(jī)誤差在因素的同一水平(同一個總體)下,樣本的各觀察值之間的差異比如,同一種顏色的飲料在不同超市上的銷售量是不同的不同超市銷售量的差異可以看成是隨機(jī)因素的影響,或者說是由于抽樣的隨機(jī)性所造成的,稱為隨機(jī)誤差

系統(tǒng)誤差在因素的不同水平(不同總體)下,各觀察值之間的差異比如,同一家超市,不同顏色飲料的銷售量也是不同的這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于顏色本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差10方差分析的基本思想和原理

(兩類方差)組內(nèi)方差因素的同一水平(同一個總體)下樣本數(shù)據(jù)的方差比如,無色飲料A1在5家超市銷售數(shù)量的方差組內(nèi)方差只包含隨機(jī)誤差組間方差因素的不同水平(不同總體)下各樣本之間的方差比如,A1、A2、A3、A4四種顏色飲料銷售量之間的方差組間方差既包括隨機(jī)誤差,也包括系統(tǒng)誤差11方差分析的基本思想和原理

(方差的比較)如果不同顏色(水平)對銷售量(結(jié)果)沒有影響,那么在組間方差中只包含有隨機(jī)誤差,而沒有系統(tǒng)誤差。這時,組間方差與組內(nèi)方差就應(yīng)該很接近,兩個方差的比值就會接近1如果不同的水平對結(jié)果有影響,在組間方差中除了包含隨機(jī)誤差外,還會包含有系統(tǒng)誤差,這時組間方差就會大于組內(nèi)方差,組間方差與組內(nèi)方差的比值就會大于1當(dāng)這個比值大到某種程度時,就可以說不同水平之間存在著顯著差異12方差分析中的基本假定13可編輯ppt方差分析中的基本假定每個總體都應(yīng)服從正態(tài)分布對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機(jī)樣本比如,每種顏色飲料的銷售量必需服從正態(tài)分布各個總體的方差必須相同對于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的比如,四種顏色飲料的銷售量的方差都相同觀察值是獨(dú)立的比如,每個超市的銷售量都與其他超市的銷售量獨(dú)立14方差分析中的基本假定在上述假定條件下,判斷顏色對銷售量是否有顯著影響,實(shí)際上也就是檢驗(yàn)具有同方差的四個正態(tài)總體的均值是否相等的問題如果四個總體的均值相等,可以期望四個樣本的均值也會很接近四個樣本的均值越接近,我們推斷四個總體均值相等的證據(jù)也就越充分樣本均值越不同,我們推斷總體均值不同的證據(jù)就越充分15方差分析中基本假定

如果原假設(shè)成立,即H0:m1=m2=m3=m4四種顏色飲料銷售的均值都相等沒有系統(tǒng)誤差

這意味著每個樣本都來自均值為

、差為

2的同一正態(tài)總體

Xf(X)

1

2

3

4

16方差分析中基本假定

如果備擇假設(shè)成立,即H1:mi(i=1,2,3,4)不全相等至少有一個總體的均值是不同的有系統(tǒng)誤差這意味著四個樣本分別來自均值不同的四個正態(tài)總體

Xf(X)

3

1

2

4

17單因素方差分析的數(shù)據(jù)結(jié)構(gòu)

觀察值(j)因素(A)i

水平A1水平A2…水平Ak12::n

x11x12…x1kx21x22…x2k::::::::xn1

xn2…xnk18單因素方差分析的步驟提出假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量統(tǒng)計(jì)決策19可編輯ppt提出假設(shè)一般提法H0:m1=m2=…=

mk(因素有k個水平)H1:m1

,m2

,…,mk不全相等對前面的例子H0:m1=m2=m3=m4顏色對銷售量沒有影響H0:m1

,m2

,m3,m4不全相等顏色對銷售量有影響20構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量為檢驗(yàn)H0是否成立,需確定檢驗(yàn)的統(tǒng)計(jì)量

構(gòu)造統(tǒng)計(jì)量需要計(jì)算水平的均值全部觀察值的總均值離差平方和均方(MS)

21構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算水平的均值

)假定從第i個總體中抽取一個容量為ni的簡單隨機(jī)樣本,第i個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數(shù)計(jì)算公式為式中:ni為第i個總體的樣本觀察值個數(shù)

xij為第i個總體的第j個觀察值

22構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算全部觀察值的總均值

)全部觀察值的總和除以觀察值的總個數(shù)計(jì)算公式為23構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(前例計(jì)算結(jié)果

)表8-2四種顏色飲料的銷售量及均值超市(j)水平A(i)無色(A1)粉色(A2)橘黃色(A3)綠色(A4)1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8合計(jì)136.6147.8132.2157.3573.9水平均值觀察值個數(shù)

x1=27.32n1=5x2=29.56n2=5x3=26.44n3=5x4=31.46n4=5總均值x=28.69524構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算總離差平方和

SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況總離差平方和(總變異)其計(jì)算公式為前例的計(jì)算結(jié)果:

SST=(26.5-28.695)2+(28.7-28.695)2+…+(32.8-28.695)2=115.929525構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算誤差項(xiàng)平方和

SSW)每個水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個樣本各觀察值的離散狀況,又稱組內(nèi)離差平方和該平方和反映的是隨機(jī)誤差的大小誤差項(xiàng)平方和(組內(nèi)變異或是組內(nèi)平方和)計(jì)算公式為

前例的計(jì)算結(jié)果:SSW=39.08426構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算水平項(xiàng)平方和

SSB)各組平均值與總平均值的離差平方和反映各總體的樣本均值之間的差異程度,又稱組間平方和該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差計(jì)算公式為前例的計(jì)算結(jié)果:SSB=76.845527構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(三個平方和的關(guān)系)

總離差平方和(SST)、誤差項(xiàng)離差平方和(SSW)、水平項(xiàng)離差平方和(SSB)之間的關(guān)系SST=SSW+SSB28構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(三個平方和的作用)

SST反映了全部數(shù)據(jù)總的誤差程度;SSW反映了隨機(jī)誤差的大??;SSB反映了隨機(jī)誤差和系統(tǒng)誤差的大小.如果原假設(shè)成立,即H1=H2

=…=Hk為真,則表明沒有系統(tǒng)誤差,組間平方和SSB除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會太大;如果組間均方顯著地大于組內(nèi)均方,說明各水平(總體)之間的差異不僅有隨機(jī)誤差,還有系統(tǒng)誤差判斷因素的水平是否對其觀察值有影響,實(shí)際上就是比較組間方差與組內(nèi)方差之間差異的大小為檢驗(yàn)這種差異,需要構(gòu)造一個用于檢驗(yàn)的統(tǒng)計(jì)量29構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算均方

MS)各離差平方和的大小與觀察值的多少有關(guān),為了消除觀察值多少對離差平方和大小的影響,需要將其平均,這就是均方,也稱為方差計(jì)算方法是用離差平方和除以相應(yīng)的自由度三個平方和的自由度分別是SST的自由度為n-1,其中n為全部觀察值的個數(shù)SSB的自由度為k-1,其中k為因素水平(總體)的個數(shù)SSW的自由度為n-k30構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算均方

MS)

SSB的均方也稱組間方差,記為MSB,計(jì)算公式為

SSW的均方也稱組內(nèi)方差,記為MSW,計(jì)算公式為31構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算檢驗(yàn)的統(tǒng)計(jì)量

F)將MSB和MSW進(jìn)行對比,即得到所需要的檢驗(yàn)統(tǒng)計(jì)量F當(dāng)H0為真時,二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布,即32統(tǒng)計(jì)決策

將統(tǒng)計(jì)量的值F與給定的顯著性水平

的臨界值F

進(jìn)行比較,作出接受或拒絕原假設(shè)H0的決策根據(jù)給定的顯著性水平

,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應(yīng)的臨界值F

若F>F

,則拒絕原假設(shè)H0

,表明均值之間的差異是顯著的,所檢驗(yàn)的因素(A)對觀察值有顯著影響若F

F

,則不能拒絕原假設(shè)H0

,表明所檢驗(yàn)的因素(A)對觀察值沒有顯著影響【根據(jù)P值直接進(jìn)行決策】33單因素方差分析表

(基本結(jié)構(gòu))方差來源平方和SS自由度df均方MSF值組間(因素影響)

組內(nèi)(誤差)

總和SSBSSWSSTk-1n-kn-1MSBMSWMSBMSW34單因素方差分析實(shí)質(zhì)上采用了統(tǒng)計(jì)推斷的方法,由于方差

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論