數(shù)據(jù)的參數(shù)檢驗和方差分析課件_第1頁
數(shù)據(jù)的參數(shù)檢驗和方差分析課件_第2頁
數(shù)據(jù)的參數(shù)檢驗和方差分析課件_第3頁
數(shù)據(jù)的參數(shù)檢驗和方差分析課件_第4頁
數(shù)據(jù)的參數(shù)檢驗和方差分析課件_第5頁
已閱讀5頁,還剩92頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、數(shù)據(jù)的參數(shù)檢驗和方差分析zf*zf優(yōu)選數(shù)據(jù)的參數(shù)檢驗和方差分析假設檢驗的基本問題假設檢驗的基本原理 小概率事件原理小概率思想是指小概率事件(P0.01或P160cm 或者 u160cm為右尾檢定( Upper-tailed Test ); u2或12,即兩樣本來自的總體均數(shù)不相等.1.2 兩樣本的t檢驗根據(jù)來自兩個總體的獨立樣本對其總體均值的檢驗 觀測樣本獨立且是服從正態(tài)分布的隨機樣本 與 已知時 構造統(tǒng)計量 與 未知但相等時 構造統(tǒng)計量 計算t統(tǒng)計量時是用兩樣本均數(shù)差值的絕對值除以兩樣本均數(shù)差值的標準誤分析(Analyze)比較均值(Compare mean)兩獨立樣本t檢驗(Indepen

2、dent-Samples T Test)(1)組內(nèi)變動(within groups),代表本組內(nèi)各樣本與該組平均值的離散程度,即水平內(nèi)部(組內(nèi))方差分別給第5和第6組賦值 -.奮斗的雙腳在踏碎自己的溫床時,卻開拓了一條創(chuàng)造之路。統(tǒng)計軟件輸出 p - 值的位置,有的用 “ p-value ” ,有的用 significant 的縮寫 “Sig”總體方差 已知,用統(tǒng)計量3 配對樣本的t檢驗針對同樣的樣本實驗前后均值的比較16個樣本的 weight 也平均下降 8 磅影響農(nóng)作物產(chǎn)量的因素,如品種、施肥量、土壤等。當計算時涉及的變量有缺失值,則剔除在該變量上為缺失的樣本即水平之間(組間)方差彈出Opt

3、ion對話框例4:為檢測某種藥物對攻擊性情緒的影響,對 100 名服藥者和 150 名非服藥者進行心理測試,得到相應的某指標。 相應的假設檢驗問題為: H0:1=2 H1: 1大于2 1 為第一組的總體均值,而2 為第二組的總體均值。 用SPSS 處理數(shù)據(jù): 分析(Analyze)比較均值(Compare mean)兩獨立樣本t檢驗(Independent-Samples T Test) SPSS 輸出結果:注意:這個輸出的前面三列( Levenes Test for Equality of Variances )為檢驗這兩個樣本所代表的總體之方差是否相等(零假設為相等)。如果顯著,即在 Si

4、g 列中的該 Levene 檢驗 p- 值很?。ㄟ@里是 0.008 ),說明兩總體的方差相等被拒絕。就應該看兩總體方差不等的結果,即最后一行的 t 檢驗輸出( p- 值 0.347/2 );否則看上面一行的結果。因為總體方差相同時使用的檢驗統(tǒng)計量與方差不同時使用的不一樣 結論:通過計算,t統(tǒng)計量等于0.942,p值為 0.1735 (輸出中的雙尾檢驗p值0.347的一半)。因此無法拒絕零假設,即服藥與未服藥的攻擊性情緒無差異。例5: 某商場的營銷部擬對某種信用卡購物促銷方式及效果進行評估。隨機抽取了500名持卡消費者。信用卡購物促銷方式之一:過去三個月消費實施降低利率的方式;方式之二:采取標準

5、的信用卡購物方式。(兩種方式各有250名消費者)。 (見數(shù)據(jù)文件: creditpromo.sav )(1) 分析的下拉菜單中選擇: 分析(Analyze)比較均值(Compare mean)兩獨立樣本t檢驗(Independent-Samples T Test)彈出對話框 SPSS操作過程:選擇檢測變量分組變量選擇分組取值定義選擇檢測變量:$ spent during promotional period. 選擇分組變量:Type of mail insert received.點擊 Define Groups對分組變量的取值進行定義. 第一組的分組取值第二組的分組取值運用分界點進行分組(2

6、) 輸出結果及分析: independent-samples statistic該表是描述性統(tǒng)計表:不同消費方式下樣本大小、消費金額的均值、標準差、均值的標準誤. 該表可看出從樣本平均值來看,接受利率優(yōu)惠的消費者的平均消費要高出接受標準方式的消費者有71美元.結論: 因計算的T統(tǒng)計量為-2.26,sig值為0.0240.05;所以,可得出新藥對triglyceride level 無影響。而實驗前后weight的t統(tǒng)計量為11.2;sig值0.0000.05;所以,可認為體重下降8.06絕非偶然,而是新藥起了作用。如何解決多元多總體的均值檢驗?不同型號的計算機的平均維修時間是相同?2 方差分析

7、首先計算各樣本平均數(shù)若按兩個總體平均值比較的檢驗法,把樣本平均數(shù)兩兩組成對: 將這15對平均數(shù)一一進行比較檢驗計算工作量太大即使每對都進行了比較,并且都以0.95的置信度得出每對均值都相等的結論,但是由此要得出這6個型號的維修時間的均值都相等這一結論的置信度僅是 估計的精確性和檢驗的靈敏度降低其他方法?方差分析(analysis of variance , ANOVA ):又稱變異數(shù)分析或F檢驗,其目的是推斷兩組或多組資料的總體均數(shù)是否相同,檢驗兩個或多個樣本均數(shù)的差異是否有統(tǒng)計學意義。方差分析中幾個重要概念:1)觀測因素或稱為觀測變量 如:考察農(nóng)作物產(chǎn)量的影響因素。農(nóng)作物產(chǎn)量就是觀測變量。2

8、)控制因素或稱控制變量:進行試驗(實驗)時,我們稱可控制的試驗條件為因素(Factor)。其中因素變化的各個等級為水平(Level)。 影響農(nóng)作物產(chǎn)量的因素,如品種、施肥量、土壤等。 如果在試驗中只有一個因素在變化,其他可控制的條件不變,稱它為單因素試驗; 若試驗中變化的因素有兩個或兩個以上,則稱為雙因素或多因素試驗 。 方差分析就是從觀測變量的方差入手,研究諸多控制變量(因素)中哪些變量是對觀測變量有顯著影響的變量方差分析的基本原理 設有r個總體,各總體分別服從 ,假定各總體方差相等?,F(xiàn)從各總體隨機抽取樣本。透過各總體的樣本數(shù)據(jù)推斷r個總體的均值是否相等? :至少有一組數(shù)據(jù)的平均值與其它組的

9、平均值有顯著性差異。 分析的思路:用離差平方和(SS)描述所有樣本總的變異情況,將總變異分為兩個來源: (1)組內(nèi)變動(within groups),代表本組內(nèi)各樣本與該組平均值的離散程度,即水平內(nèi)部(組內(nèi))方差 (2)組間變動(between groups),代表各組平均值關于總平均值的離散程度。即水平之間(組間)方差 即:SS總=SS組間+SS組內(nèi)消除各組樣本數(shù)不同的影響-離差平方和除以自由度(即均方差)。從而構造統(tǒng)計量:方差分析的基本思想就是通過組內(nèi)方差與組間方差的比值構造的F統(tǒng)計量,將其與給定顯著性水平、自由度下的F值相對比,判定各組均數(shù)間的差異有無統(tǒng)計學意義。零假設否定域:方差分析的

10、應用條件 (1)可比性,若資料中各組均數(shù)本身不具可比性則不適用方差分析。 (2)正態(tài)性,各組的觀察數(shù)據(jù),是從服從正態(tài)分布的總體中隨機抽取的樣本。即偏態(tài)分布資料不適用方差分析。對偏態(tài)分布的資料應考慮用對數(shù)變換、平方根變換、倒數(shù)變換、平方根反正弦變換等變量變換方法變?yōu)檎龖B(tài)或接近正態(tài)后再進行方差分析。 (3)方差齊性,各組的觀察數(shù)據(jù),是從具有相同方差的相互獨立的總體中抽取得到的。即若組間方差不齊則不適用方差分析。一元單因素方差分析:分析某一個因素A的不同水平是否對某一個觀測變量Y產(chǎn)生了顯著影響。一元多因素方差分析:分析某兩個或多個因素的不同水平是否對某一個觀測變量Y產(chǎn)生了顯著影響。2.1 一元方差分

11、析例1:某飲料生產(chǎn)企業(yè)研制出一種新型飲料. 飲料的顏色共有四種 : 橘黃色、粉色、綠色和無色透明。這四種飲料的營養(yǎng)含量、味道、價格、包裝等可能影響銷售量的因素全部相同?,F(xiàn)從地理位置相似、經(jīng)營規(guī)模相仿的五家超市上收集了該種飲料的銷售情況。 2.1.1 一元單因素方差分析問題:飲料的顏色是否對銷售量產(chǎn)生影響? 其中:飲料的顏色即是影響因素(控制因素、變量) 銷售量是觀測變量。在其他條件相同的情況下,上述問題就歸結為一個檢驗問題,即:差異的產(chǎn)生來自兩個方面: 一方面是由不同顏色的差異造成的,既不同的飲料顏色對銷售量產(chǎn)生了影響。用組間方差表示 另一方面是由于抽選樣本的隨機性而產(chǎn)生的差異,即各顏色內(nèi)的隨

12、機誤差,如相同顏色的飲料在不同的商場銷售量也不同。用組內(nèi)方差表示。一元單因素方差分析Spss 選項: 分析(Analyze) 比較均值( Compare Mean) 單因素ANOVA(One-Way ANOVA)SPSS 輸出結果:可看出F值為10.486,P值是0.000。推斷零假設不成立。表明顏色不同飲料的銷量也不同。如何用SPSS對方差分析的方差相等要求進行判定?(因正態(tài)分布的要求不是很嚴格 ,分析忽略)Spss 選項:在 One-Way ANOVA 中選擇Option ,選定 Homogeneity-of variance進一步考察: 究竟是哪一個水平對觀察變量產(chǎn)生了顯著影響,即那種顏

13、色的飲料對銷售量有顯著影響?運用單因素方差分析的多重比較檢驗SPSS窗口中Post Hoc選項進行選擇。 例2: 為了迎合消費者的需求,某音像公司擬推出一張新的DVD 專輯. 市場營銷部分收集不同年齡的消費者群體對新的DVD 專輯的評價等相關數(shù)據(jù)信息。(見數(shù)據(jù)文件 dvdplayer.sav ) 從該數(shù)據(jù)文件我們想知道 : 是否不同消費者群體對DVD的評價不一樣呢? 32-38歲與39-45歲兩個年齡段的消費者全體對DVD的評價是否一樣呢? 32歲以下與 45歲以上的消費者群體對DVD的評價是否一樣呢? SPSS的處理過程:(1) 一元單因素方差分析的菜單選擇: 分析(Analyze) 比較均

14、值(Compare Mean) 單因素方差分析(One-Way ANOVA) 彈出One-way ANOVA對話框選擇 Total DVD assessment 作為因變量.選擇 Age Group 作為影響因素.點擊選項Options按鈕. 多重比較檢驗 :兩兩比較看哪些水平之間存在均值差異. 先驗比較檢驗:事先設定因變量在因素的不同不平下是否有差異. 描述性統(tǒng)計量、均值圖、缺失值的處理觀測變量(因變量)輸入框影響因素(自變量)輸入框彈出Option對話框統(tǒng)計量選擇描述性統(tǒng)計.如:均值、方差等固定效應、隨機效應模型的標準差、標準誤、置信區(qū)間等方差同質(zhì)性(相等)檢驗 當F檢驗方差相等不成立時,

15、用Brown-Forsythe統(tǒng)計量或Welch統(tǒng)計量檢驗組間均值是否相等,比F檢驗更可取。 選擇均值圖Means plot. 點擊繼續(xù) Continue. 點擊一元單因素對話框中的兩兩比較 Post Hoc .均值示意圖可直觀看出組間均值差異彈出雙重比較檢驗對話框組均值示意圖缺失值處理假設組間方差相等時的多重比較檢驗假設組間方差不等時的多重比較檢驗確定顯著性水平選擇方差不等時的Tamhanes T2. 點擊繼續(xù) Continue.點擊一元單因素方差分析中的 對比Contrasts 按鈕. 彈出Contrasts 對話框第1組系數(shù)賦值為0,點擊 Add. 第二組系數(shù)賦值為0,點擊Add.緊接著

16、, 給第3和第4組系數(shù)賦值,要使兩系數(shù)和為0.給第3組賦值-1 ,點擊 Add.給第4組系數(shù)賦值為 1. 給第5和第6組賦值為0.點擊 Next 進入下一組先驗對比檢驗. 首先,比較第 3 和 第4個年齡段的消費者群體;其他年齡段的忽略不考慮,賦值為0.零假設為:兩組無差異 其次,對第1、2兩個年齡段的消費者與第5、6兩個年齡段的消費者進行先驗對比。第3和4兩個年齡段的消費者不考慮。 給第1組賦值 .5 ,點擊 Add.給第2組賦值 .5 ,點擊 Add. 分別給第3和第4組賦值為0,點擊Add. 分別給第5和第6組賦值 -.5, 點擊 Add.點擊Continue.點擊一元單因素對話框中的

17、OK,輸出分析結果output. (2) 結果分析:方差齊性(相等)檢驗 從上表可看出:各總體方差相等的零假設成立。因為統(tǒng)計量 Levene statistic為0.574 ,該統(tǒng)計量實現(xiàn)的可能性 sig. 值為 0.720,說明零假設發(fā)生可能性是很大的,我們沒有充分的理由拒絕它,由此接受零假設。差異表現(xiàn)如何,究竟來自哪兒 ? 由此表可看出,對DVD的評價的差異主要來自不同年齡的消費者群體的組間差異,因為F 統(tǒng)計量為4.601;同時依據(jù)sig值 0.001,也可說明我們最初的零假設不同年齡群體對DVD的評價無差異發(fā)生的可能性為0.001,我們沒有充分理由接受它. 方差分析表組均值示意圖 該圖給

18、我們較為直觀的印象:32-45 歲的消費者對 DVD 的評價高于其他消費者群體. 若要作更細致和精確的分析,可通過一元方差分析中的先驗比較和多重比較來完成。 對比系數(shù)表 檢驗 32-38 和39-45 兩個群體對DVD的評價是否有差異,零假設認為:二者無差異。其他年齡段的消費者群體忽略不考慮,所以分別賦值為0;而32-38 和39-45 兩個群體分別賦值-1 和 1類似地,若想對比32歲以下和45歲以上的消費者群體對DVD的評價是否有差異,零假設認為二者無差異,所以,分別給18-24、25-31賦值為.5,分別給46-52、53-59賦值為-.5,其他群體不考慮賦值為0。The signifi

19、cance values for the tests of the first contrast are both larger than 0.10. This indicates that the age 39-45 group is not significantly more favorable toward the DVD player than the age 32-38 group. Likewise, the significance values for the tests of the second contrast are larger than 0.10. Partici

20、pants under 32 and over 45 have statistically equivalent assessment scores. 假設方差不等時的檢驗結果假設方差相等時的檢驗結果Post Hoc Tests雙重假設檢驗2.1.2 一元多因素方差分析基本思想:研究兩個或兩個以上因素(控制變量)是否對某個觀測變量產(chǎn)生顯著性影響。如:飲料銷售,除了關心飲料顏色之外,還想了解銷售地區(qū)、銷售策略是否影響銷售量?若把飲料的顏色看作影響銷售量的因素A,飲料的銷售地區(qū)看作影響因素B,銷售策略看作影響因素C。對因素A和因素B同時進行分析,就屬于雙因素方差分析。對因素A、B以及C (或更多因

21、素)同時進行分析,就屬多因素方差分析。 雙(多)因素方差分析有兩種類型:1、無交互作用的雙(多)因素方差分析,它假定因素A和因素B的效應是相互獨立的,不存在相互關系;2、有交互作用的雙(多)因素方差分析,它假定因素A和因素B的結合會產(chǎn)生出一種新的效應(相互影響)。例如,若假定不同地區(qū)的消費者對某種顏色有與其他地區(qū)消費者不同的特殊偏愛,這就是兩個因素結合后產(chǎn)生的新效應,屬于有交互作用的背景;否則,就是無交互作用的背景。 案例分析:廣告城市與銷售額數(shù)據(jù)目標:企業(yè)對不同廣告形式在不同地區(qū)的廣告效果(銷售額)進行評估;例2: 某雜貨店對其消費者的購買習慣作了一項問卷調(diào)查。重要想關注:不同性別、不同的購

22、買習慣是否會影響到其在一個月內(nèi)的消費金額。 (數(shù)據(jù)見: grocery_1month.sav )因變量dependent variable: Amount spent自變量Independent variables: gender shopping style一元雙因素問題(1)建立假設:對于因素: gender 零假設 H0: 備擇假設 H1:對于因素: shopping style 零假設 H0: 備擇假設 H1:交互影響因素: 零假設 H0: 備擇假設 H1:(2) 一元多因素的 SPSS處理過程: 菜單選擇:分析(Analyze) 一般線性模型(General Linear Model

23、) 單變量(Univariate)彈出univariate對話框因變量選擇固定因素隨機因素(協(xié)方差分析時)協(xié)變量選擇(協(xié)方差分析時)權數(shù)變量選擇模型選擇按鈕實現(xiàn)先驗對比檢驗和趨勢檢驗圖形分析雙重比較檢驗將分析結果以變量的形式存入SPSS數(shù)據(jù)編輯窗口中置信水平和描述性統(tǒng)計等選擇 Amount spent as 作為因變量. 選擇 Gender and Shopping style 進入固定因素框. 點擊 Model按鈕. GenderShopping styleGenderShopping style飽和模型(考慮交互效應gender*Shopping style )非飽和模型(不考慮交互效應,

24、系統(tǒng)默認模型 )若選擇非飽和模型,則點擊custom.點擊作圖 Plots進入形象分析對話框.選擇 style作為橫坐標變量. 選擇 gender 作為縱坐標變量. 點擊 Add按鈕. 點擊Continue.按鈕再點擊 Post Hoc 按鈕進入雙重比較對話框.形象分析:用圖形直觀分析控制變量間是否存在交互作用假設方差相等雙重假設檢驗假設方差不等選擇 style 作為雙重比較檢驗的因素. 選擇方差相等中的 Tukey 統(tǒng)計量選項. 選擇方差不等中的 Tamhanes T2 統(tǒng)計量選項. 點擊 Continue. 再點擊 Options. 選擇 gender*style 顯示其均值情況. 選擇

25、Descriptive statistics, Homogeneity tests, Estimates of effect size, and Spread vs. level plot 等選項. 點擊Continue. 點擊Ok. (3)the results analysis (結果分析,略)多元單因素方差分析:分析某一個因素的不同水平是否對某個觀測向量Y產(chǎn)生了顯著影響多元多因素方差分析:分析某兩個或多個因素的不同水平是否對某個觀測向量Y產(chǎn)生了顯著影響2.2 多元方差分析例1:考察漢族、藏族、蒙古族三個民族的人均收入水平 INC、15歲及以上人口上學或畢業(yè)比例 EDU是否有差異。(多元單因素分析問題)需考察的影響因素為:民族觀測變量為:INC和EDU SPSS處理: 分析(Analyze) 一般線性模型(Genera

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論