《應(yīng)用統(tǒng)計學(xué)》(05)第5章-分類變量對數(shù)值變量的影響_第1頁
《應(yīng)用統(tǒng)計學(xué)》(05)第5章-分類變量對數(shù)值變量的影響_第2頁
《應(yīng)用統(tǒng)計學(xué)》(05)第5章-分類變量對數(shù)值變量的影響_第3頁
《應(yīng)用統(tǒng)計學(xué)》(05)第5章-分類變量對數(shù)值變量的影響_第4頁
《應(yīng)用統(tǒng)計學(xué)》(05)第5章-分類變量對數(shù)值變量的影響_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

*應(yīng)用統(tǒng)計應(yīng)

統(tǒng)

學(xué)

AppliedStatistics*警惕過多地檢驗。你對數(shù)據(jù)越苛求,數(shù)據(jù)會越多地向你供認,但在威逼下得到的供詞,在科學(xué)詢查的法庭上是不容許的。

StephenM.Stigler統(tǒng)計名言*怎樣解決下面的問題?來自不同地區(qū)的大學(xué)生每個月的平均生活費支出是否不同呢?家電的品牌對它們的銷售量是否有顯著影響呢?不同的路段和不同的時段對行車時間有影響嗎?超市的位置和它的銷售額有關(guān)系嗎?不同的小麥品種產(chǎn)量有差異嗎?5.1方差分析解決什么問題?5.2考慮一個分類變量的影響

5.3考慮兩個分類變量的影響

第5章分類變量對數(shù)值變量的影響5.1方差分析解決什么問題?5.1.1比較均值是否相同5.1.2從誤差分析入手5.1.3在什么樣的前提下分析?第5章分類變量對數(shù)值變量的影響5.1.1比較均值是否相同5.1方差分析解決什么問題?*方差分析解決什么問題?

(例題分析)【例】確定超市的位置和競爭者的數(shù)量對銷售額是否有顯著影響,獲得的年銷售額數(shù)據(jù)(單位:萬元)如下表因子水平樣本數(shù)據(jù)*什么是方差分析(ANOVA)?

(analysisofvariance)

比較多個總體均值是否相等例如:不同位置的超市銷售額均值是否一樣研究分類自變量(因子factor)對數(shù)值因變量(觀測結(jié)果)的影響例如:“超市位置”是一個分類自變量,“競爭者數(shù)量”也是一個分類自變量兩個或多個水平(level)或分類。例如:3個超市位置,4種競爭者一個數(shù)值型因變量,銷售額只考慮一個因子對觀測數(shù)據(jù)的影響稱為單因素方差分析(one-wayanalysisofvariance);考慮兩個因子對觀測數(shù)據(jù)的影響稱為雙因素方差分析(two-wayanalysisofvariance)5.1.2從誤差分析入手5.1方差分析解決什么問題?*誤差分解組內(nèi)誤差(withingroups)樣本數(shù)據(jù)內(nèi)部各觀察值之間的差異比方,同一位置下不同超市之間銷售額的差異反映隨機因素的影響,稱為隨機誤差組間誤差(betweengroups)不同樣本之間觀察值的差異比方,不同位置超市之間銷售額的差異可能是隨機誤差,也可能是超市位置本身所造成的系統(tǒng)性系統(tǒng)誤差總誤差(total)全部觀測數(shù)據(jù)的誤差大小*誤差表示

(平方和—SS)數(shù)據(jù)的誤差用平方和(sumofsquares)表示組內(nèi)平方和(sumofsquaresforerror)也稱誤差平方和或殘差平方和,記為SS殘差

不同因子(不同位置超市)的組內(nèi)誤差平方和組間平方和(sumofsquaresforfactor)也稱因子平方和,記為SS因子不同因子(不同位置超市)的組間誤差平方和總平方和(sumofsquaresfortotal)

反映全部數(shù)據(jù)誤差大小的平方和,記為SST誤差間的關(guān)系:SST=SS因子+SS殘差*誤差度量

(均方—MS)用均方(meansquare)表示誤差大小,以消除觀測數(shù)據(jù)的多少對平方和的影響用平方和除以相應(yīng)的自由度均方也稱方差(variance)組間均方也稱組間方差(between-groupsvariance),反映各因子間誤差的大小MS因子=SS因子÷自由度(因子個數(shù)-1)組內(nèi)均方也稱組內(nèi)方差(within-groupsvariance)

,反映隨機誤差的大小MS殘差=SS殘差÷自由度(數(shù)據(jù)個數(shù)-因子個數(shù))*誤差分析

(F-檢驗)將組間均方與組內(nèi)均方進行比較,分析差異是否顯著F=(MS因子÷MS殘差)~F(因子自由度,殘差自由度)用F分布作出決策,給定的顯著性水平假設(shè)F>F(或P<),那么拒絕原假設(shè)H0,說明均值之間的差異顯著,因素對觀察值有顯著影響*誤差分析

(F分布與拒絕域)如果均值相等,F(xiàn)=MS因子/MS殘差

1aF分布F

(k-1,n-k)0拒絕H0不拒絕H0F5.1.3在什么條件下進行分析?5.1方差分析解決什么問題?*方差分析的根本假定每個總體都應(yīng)服從正態(tài)分布對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機樣本各個總體的方差必須相同對于分類變量的k個水平有:這一假設(shè)也被稱為方差齊性(homogeneityvariance)觀察值是獨立的*方差分析中根本假定

原假設(shè)成立的情形

xf(x)

1

2

3*方差分析中根本假定

原假設(shè)不成立的極端情形xf(x)

3

1

25.2考慮一個分類自變量的影響

5.2.1只考慮一個因子

5.2.2關(guān)系有多強?第5章分類變量對數(shù)值變量的影響5.2.1只考慮一個因子5.2考慮一個分類自變量的影響(one-wayanalysisofvariance)*提出假設(shè)并進行檢驗設(shè)

1為商業(yè)區(qū)超市銷售額的均值,

2為居民小區(qū)超市銷售額的均值,

3為寫字樓超市銷售額的均值,提出的假設(shè)為H0:

1

2

3

H1:

1,

2,

3

不全相等計算檢驗統(tǒng)計量計算P值,作出決策*單因素方差分析表

(根本結(jié)構(gòu))誤差來源平方和(SS)自由度(df)均方(MS)F值P值F臨界值組間(因素影響)SSAk-1MSAMSAMSE組內(nèi)(誤差)SSEn-kMSE總和SSTn-1*用Excel進行方差分析

(Excel分析步驟)

第1步:選擇“工具”下拉菜單第2步:選擇【數(shù)據(jù)分析】選項第3步:在分析工具中選擇【單因素方差分析】

,然后選擇【確定】第4步:當(dāng)對話框出現(xiàn)時

在【輸入?yún)^(qū)域

】方框內(nèi)鍵入數(shù)據(jù)單元格區(qū)域在【】方框內(nèi)鍵入0.05(可根據(jù)需要確定)

在【輸出選項

】中選擇輸出區(qū)域

用Excel進行方差分析*用SPSS進行方差分析

(單因素方差分析)

用SPSS進行方差分析第1步:選擇【Analyze】【CompareMeans】【One-Way-ANOVA】進入主對話框第2步:在主對話框中將因變量(投訴次數(shù))選入【DependentList】,將自變量(行業(yè))選入【Factor)】第3步(需要多重比較時)點擊【Post-Hoc】從中選擇一種方法,如LSD;(需要均值圖時)在【Options】下選中【Meansplot】,(需要相關(guān)統(tǒng)計量時)選擇【Descriptive】,點擊【Continue】回到主對話框。點擊【OK】5.2.2關(guān)系有多強?5.2考慮一個分類自變量的影響*關(guān)系有多強?變量間關(guān)系的強度用自變量平方和(SS因子)占總平方和(SST)的比例大小來反映自變量平方和占總平方和的比例記為R2,即其平方根R就可以用來測量兩個變量之間的關(guān)系強度

5.3考慮兩個分類自變量的影響

5.3.1不考慮交互作用

5.3.2考慮交互作用第5章分類變量對數(shù)值變量的影響(two-wayanalysisofvariance)*考慮兩個分類變量的影響

(two-wayanalysisofvariance)

分析兩個因素(行因素Row和列因素Column)對試驗結(jié)果的影響如果兩個因素對試驗結(jié)果的影響是相互獨立的,分別判斷行因素和列因素對試驗數(shù)據(jù)的影響,這時的雙因素方差分析稱為無交互作用的雙因素方差分析或無重復(fù)雙因素方差分析(Two-factorwithoutreplication)如果除了行因素和列因素對試驗數(shù)據(jù)的單獨影響外,兩個因素的搭配還會對結(jié)果產(chǎn)生一種新的影響,這時的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復(fù)雙因素方差分析

(Two-factorwithreplication)5.3.1不考慮交互作用5.3考慮兩個分類自變量的影響(無重復(fù)雙因素分析)*誤差分解總誤差平方和(SST)被分解成3局部行因子平方和(SSR)列因子平方和(SSC)殘差平方和(SSE)各平方和的關(guān)系相應(yīng)的均方行因子均方(MSR)列因子均方(MSC)殘差均方(MSE)SST=SSR+SSC+SSE*檢驗檢驗統(tǒng)計量檢驗行因子檢驗列因子決策假設(shè)FR>F(或P<),拒絕H0假設(shè)FC>F(或P<),拒絕H0*不考慮交互作用

(例題分析)

提出假設(shè)對品牌因素提出的假設(shè)為H0:m1=m2=m3=m4(品牌對銷售量無顯著影響)H1:mi

(i=1,2,…,4)

不全相等(有顯著影響)對地區(qū)因素提出的假設(shè)為H0:m1=m2=m3=m4=m5(地區(qū)對銷售量無顯著影響)H1:mj

(j=1,2,…,5)

不全相等(有顯著影響)

用Excel進行無重復(fù)雙因素分析5.3.2考慮交互作用5.3考慮兩個分類自變量的影響(可重復(fù)雙因素分析)*誤差分解總誤差平方和(SST)被分解成4局部行因子平方和(SSR);列因子平方和(SSC);交互作用平方和(SSRC);殘差平方和(SSE)各平方和的關(guān)系相應(yīng)的均方行因子均方(MSR)列因子均方(MSC)交互作用均方(MSRC)殘差均方(MSE)SST=SSR+SSC+SSRC+SSE*檢驗檢驗統(tǒng)計量檢驗行因子檢驗列因子檢驗交互作用決策假設(shè)FR>F(或P<),拒絕H0假設(shè)FC>F(或P<),拒絕H0假設(shè)FRC>F(或P<),拒絕H0案例分析

地理位置與抑郁癥有關(guān)嗎1、案例背景 為了分析地理位置與患抑郁癥之間的關(guān)系,紐約洲北部地區(qū)的一家醫(yī)療中心的專家進行了調(diào)查研究。選擇了60個相當(dāng)健康的人組成一個樣本,其中20人居住在佛羅里達,20人居住在紐約,20人居住在北卡羅米納。另外還給出這三個地區(qū)患慢性病的人患抑郁癥的樣本數(shù)據(jù),以考慮地理位置與患有慢性病的人患抑郁癥之間的關(guān)系,這些慢性病諸如關(guān)節(jié)炎、高血壓、心臟失調(diào)等。同樣也給出60個樣本,三個地區(qū)的樣本數(shù)量各占三分之一。案例分析2、案例數(shù)據(jù)描述3、案例擬解決問題〔1〕比較地理因素對健康人患抑郁癥影響程度是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論