均值方差檢驗_第1頁
均值方差檢驗_第2頁
均值方差檢驗_第3頁
均值方差檢驗_第4頁
均值方差檢驗_第5頁
已閱讀5頁,還剩96頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 第二章 均值向量和協(xié)方差陣的檢驗 假設(shè)檢驗的基本問題1、假設(shè)檢驗的基本原理 小概率事件原理小概率思想是指小概率事件(P0.01或P0,檢驗水準為單側(cè)0.05。b. 計算統(tǒng)計量 進行樣本均數(shù)與總體均數(shù)比較的t檢驗時t值為樣本均數(shù)與總體均數(shù)差值的絕對值除以標準誤的商,其中標準誤為標準差除以樣本含量算術(shù)平方根的商3. 確定概率,作出判斷 以自由度v(樣本含量n減1)查t界值表,0.025P2或10或d0,即差值的總體均數(shù)不為“0”,檢驗水平為 。B. 計算統(tǒng)計量 進行配對設(shè)計t檢驗時 t值為差值均數(shù)與0之差的絕對值除以差值標準誤的商,其中差值標準誤為差值標準差除以樣本含量算術(shù)平方根的商。C. 確定

2、概率,作出判斷 以自由度v(對子數(shù)減1)查t界值表,若P=,則還不能拒絕H0。例4:要比較50個人在減肥前和減肥后的重量。這樣就有了兩個樣本,每個都有50個數(shù)目。這里不能用前面的獨立樣本均值差的檢驗;這是因為兩個樣本并不獨立。每一個人減肥后的重量都和自己減肥前的重量有關(guān)。但不同人之間卻是獨立的。令減肥前的重量均值為 1 ,而減肥后的均值為2 ;這樣所要進行的檢驗為: H0: 12 H1: 1大于2也可以把兩個樣本中配對的觀測值逐個相減,形成一個由獨立觀測值組成的樣本;然后用單樣本檢驗方法,看其均值是否為零。在相減之后公式和單樣本均值檢驗無異。 用 SPSS 處理數(shù)據(jù): Spss 選項:Anal

3、yzeCompare Means Paired-Samples T Test SPSS輸出結(jié)果 : Spss 輸出結(jié)果得到雙尾 p- 值為 0.002 ,這里的單尾 p- 值于是為 0.001 因此減肥后和減肥前相比,平均重量顯著要輕。 (4)多元、多總體的均值檢驗?:各總體均值是否相等?各個總體之間的差異表現(xiàn)在哪兒?是由什么引起的?能否繼續(xù)采用前面的3種類型所選用的t檢驗?為什么? 不能,因為: a、計算工作量大 變量或總體兩兩檢驗 b、估計的精確性和檢驗的靈敏度降低如何解決?方差分析( analysis of variance , ANOVA )一、方差分析的基本思想1、定義 方差分析又稱

4、變異數(shù)分析或F檢驗,其目的是推斷兩組或多組資料的總體均數(shù)是否相同,檢驗兩個或多個樣本均數(shù)的差異是否有統(tǒng)計學意義。2、了解方差分析中幾個重要概念:(1)觀測因素或稱為觀測變量 如:考察農(nóng)作物產(chǎn)量的影響因素。農(nóng)作物產(chǎn)量就是觀測變量。(2)控制因素或稱控制變量 進行試驗(實驗)時,我們稱可控制的試驗條件為因素(Factor),因素變化的各個等級為水平(Level)。 影響農(nóng)作物產(chǎn)量的因素,如品種、施肥量、土壤等。 如果在試驗中只有一個因素在變化,其他可控制的條件不變,稱它為單因素試驗; 若試驗中變化的因素有兩個或兩個以上,則稱為雙因素或多因素試驗 。 方差分析就是從觀測變量的方差入手,研究諸多控制變

5、量(因素)中哪些變量是對觀測變量有顯著影響的變量3、方差分析的基本原理 設(shè)有r個總體,各總體分別服從 ,假定各總體方差相等?,F(xiàn)從各總體隨機抽取樣本。透過各總體的樣本數(shù)據(jù)推斷r個總體的均值是否相等? :至少有一組數(shù)據(jù)的平均值與其它組的平均值有顯著性差異。 分析的思路:用離差平方和(SS)描述所有樣本總的變異情況,將總變異分為兩個來源: (1)組內(nèi)變動(within groups),代表本組內(nèi)各樣本與該組平均值的離散程度,即水平內(nèi)部(組內(nèi))方差 (2)組間變動(between groups),代表各組平均值關(guān)于總平均值的離散程度。即水平之間(組間)方差即:SS總=SS組間+SS組內(nèi)消除各組樣本數(shù)不

6、同的影響-離差平方和除以自由度(即均方差)。從而構(gòu)造統(tǒng)計量:方差分析的基本思想就是通過組內(nèi)方差與組間方差的比值構(gòu)造的F統(tǒng)計量,將其與給定顯著性水平、自由度下的F值相對比,判定各組均數(shù)間的差異有無統(tǒng)計學意義。零假設(shè)否定域:例1:某公司計劃購買一臺計算機。為了選擇優(yōu)良型號的計算機以減少日后的維修問題,他們對6種型號的計算機作了初步調(diào)查,每種型號調(diào)查4臺,結(jié)果列于表1。這些結(jié)果表示每個型號的計算機上個月維修的小時數(shù)。試問由此結(jié)果能否判定由于計算機型號不同而造成它們在維修時間方面有顯著差異? 研究的指標(即觀測變量)就是維修時間,記作Y;控制因素是計算機的型號,分為6個水平即A,B,C,D,E,F,把

7、每個水平所對應(yīng)的指標看成一個總體?,F(xiàn)在的試驗就是進行調(diào)查,每種型號調(diào)查4臺,相當于每個總體中抽取一個容量為4的樣本,得到的數(shù)據(jù)記作 即為表1數(shù)據(jù)。 該例考察的問題是:不同型號的計算機的平均維修時間是相同?首先計算各樣本平均數(shù)若按兩個總體平均值比較的檢驗法,把樣本平均數(shù)兩兩組成對: 將這15對平均數(shù)一一進行比較檢驗計算工作量太大即使每對都進行了比較,并且都以0.95的置信度得出每對均值都相等的結(jié)論,但是由此要得出這6個型號的維修時間的均值都相等這一結(jié)論的置信度僅是 估計的精確性和檢驗的靈敏度降低其他方法?按照統(tǒng)計假設(shè)檢驗的原理,在本例中原假設(shè)是:不同型號的計算機的平均維修時間是相同的。如果這個原

8、假設(shè)為真,那么各型號的樣本平均數(shù)之間的變異程度就不可能太大。因此,我們考慮應(yīng)該使用方差或觀測值的偏差平方和的概念來進行檢驗。 方差分析的基本原理就是按照上述統(tǒng)計思想進行的,即:(1)將數(shù)據(jù)總的偏差平方和按照產(chǎn)生的原因分解成由因素的水平不同引起的偏差平方和以及由試驗誤差引起的偏差平方和兩部分之和: (總的偏差平方和)=(由因素水平引起的偏差平方和)+(試驗誤差平方和) (2)上式右邊兩個平方和的相對大小可以說明因素的不同水平是否使得各平均值(各型號的平均維修時間)產(chǎn)生顯著性差異,為此進行適當?shù)慕y(tǒng)計假設(shè)檢驗。 例2 SIM手機高、中、低三種收入水平被調(diào)查者的用戶滿意度是否有顯著性差異 即:研究被調(diào)

9、查者的收入水平是否會影響其對SIM手機的滿意程度。SPSS處理:Analyze Compare Mean One-Way ANOVA 結(jié)果如下:以上是一元方差分析統(tǒng)計量,多元方差分析統(tǒng)計量?書27頁多元的均值向量檢驗?例5: 調(diào)查某中學同年級22名男女生, 測量其身高(cm)、體重(kg)和胸圍(cm),數(shù)據(jù)見表。試檢驗該中學全體男女生的身體發(fā)育狀況有無差別。某中學22名男、女生身體測量資料 男 生 女 生 編號 身高 體重 胸圍 編號 身高 體重 胸圍 1 171 58.5 81.0 1 152 44.8 74 2 175 65 87 2 153 46.5 80 3 159 38 71 3

10、158 48.5 73.5 4 155.3 45 74 4 150 50.5 87 5 152 35 63 5 144 36.3 68 6 158.3 44.5 75 6 160.5 54.7 86 7 154.8 44.5 74 7 158 49 84 8 164 51 72 8 154 50.8 76 9 165.2 55 79 9 153 40 70 10 164.5 46 71 10 159.6 52 76 11 159.1 48 72.5 12 164.2 46.5 73一元方差分析的結(jié)果 身高 體重 胸圍 組別 平均值 標準差 平均值 標準差 平均值 標準差 男 161.9 6.8

11、 48.1 8.3 74.4 5.9 女 154.2 5.0 47.3 5.6 77.4 6.6 F值 8.7* 0.1 1.3 * P0.01從表可以看出,該校男、女生的身高差異有顯著性意義,而體重、胸圍差異無顯著性意義。那么, 該年級全體男女生的身體發(fā)育狀況有無差別,我們不能得到一個明確的結(jié)論。多元方差分析(操作參見書例2.1,第36頁):SPSS 選項: Analyze General Linear Model Multivariate 可用男、女生的身高、體重、胸圍組成的樣本均數(shù)向量推論該年級男、女生身體發(fā)育指標的總體均數(shù)向量1和2相等與否, 得到: F=8.8622,P=0.0008

12、。拒絕該年級男女生身體發(fā)育指標的總體均數(shù)向量相等的假設(shè),從而可認為該校男女生身體發(fā)育狀況不同。 4、方差分析的應(yīng)用條件 (1)可比性,若資料中各組均數(shù)本身不具可比性則不適用方差分析。 (2)正態(tài)性,各組的觀察數(shù)據(jù),是從服從正態(tài)分布的總體中隨機抽取的樣本。即偏態(tài)分布資料不適用方差分析。對偏態(tài)分布的資料應(yīng)考慮用對數(shù)變換、平方根變換、倒數(shù)變換、平方根反正弦變換等變量變換方法變?yōu)檎龖B(tài)或接近正態(tài)后再進行方差分析。(3)方差齊性,各組的觀察數(shù)據(jù),是從具有相同方差的相互獨立的總體中抽取得到的。即若組間方差不齊則不適用方差分析。二、方差分析的內(nèi)容1、類型: 依據(jù)涉及的分析變量多少分為:一元方差分析、多元方差分

13、析 依據(jù)對分析變量的影響因素的數(shù)量分為:單因素方差分析、多因素方差分析 2、分析步驟: (1)建立檢驗假設(shè); H0:多個樣本總體均數(shù)相等。 H1:多個樣本總體均數(shù)不相等或不全等。(2)確定檢驗統(tǒng)計量;(3)給定顯著水平;(3)計算統(tǒng)計量、確定P值并作出推斷結(jié)果。單因素方差分析一、單因素方差分析概念: 分析某一個因素A的不同水平是否對觀測變量Y產(chǎn)生了顯著影響。例:某飲料生產(chǎn)企業(yè)研制出一種新型飲料. 飲料的顏色共有四種 : 橘黃色、粉色、綠色和無色透明。這四種飲料的營養(yǎng)含量、味道、價格、包裝等可能影響銷售量的因素全部相同?,F(xiàn)從地理位置相似、經(jīng)營規(guī)模相仿的五家超市上收集了該種飲料的銷售情況。 問題:

14、飲料的顏色是否對銷售量產(chǎn)生影響? 其中:飲料的顏色即是影響因素(控制因素、變量) 銷售量是觀測變量。在其他條件相同的情況下,上述問題就歸結(jié)為一個檢驗問題,即:差異的產(chǎn)生來自兩個方面: 一方面是由不同顏色的差異造成的,既不同的飲料顏色對銷售量產(chǎn)生了影響。用組間方差表示 另一方面是由于抽選樣本的隨機性而產(chǎn)生的差異,即各顏色內(nèi)的隨機誤差,如相同顏色的飲料在不同的商場銷售量也不同。用組內(nèi)方差表示。Spss 選項: Analyze Compare Mean One-Way ANOVA (一元單因素方差分析)SPSS 輸出結(jié)果:可看出F值為10.486,P值是0.000。推斷零假設(shè)不成立。表明顏色不同飲料

15、的銷量也不同。 如何用SPSS對方差分析的方差相等要求進行判定?(因正態(tài)分布的要求不是很嚴格 ,分析忽略)Spss 選項:在 One-Way ANOVA 中選擇Option ,選定 Homogeneity-of variance進一步考察: 究竟是哪一個水平對觀察變量產(chǎn)生了顯著影響,即那種顏色的飲料對銷售量有顯著影響?運用單因素方差分析的多重比較檢驗SPSS窗口中Post Hoc選項進行選擇。 例:考察漢族、藏族、蒙古族三個民族的人均收入水平 INC、15歲及以上人口上學或畢業(yè)比例 EDU是否有差異。(多元單因素分析問題)需考察的影響因素為:民族觀測變量為:INC和EDU SPSS處理:Ana

16、lyze General Linear Model Multivariate 人均收入、教育比例Dependent Variables 民族 Fixed Factors 結(jié)果:結(jié)果分析:三個民族的人均收入、受教育比例有顯著差異。雙因素、多因素方差分析一、基本思想研究兩個或兩個以上因素(控制變量)是否對觀測變量產(chǎn)生顯著性影響。如:飲料銷售,除了關(guān)心飲料顏色之外,還想了解銷售地區(qū)、銷售策略是否影響銷售量?若把飲料的顏色看作影響銷售量的因素A,飲料的銷售地區(qū)看作影響因素B,銷售策略看作影響因素C。對因素A和因素B同時進行分析,就屬于雙因素方差分析。對因素A、B以及C (或更多因素)同時進行分析,就屬

17、多因素方差分析。 雙(多)因素方差分析是對影響因素進行檢驗,究竟是一個因素在起作用,還是兩個(多個)因素都起作用,或是兩個(多個)因素的影響都不顯著。 二、分類:雙(多)因素方差分析有兩種類型:1、無交互作用的雙(多)因素方差分析,它假定因素A和因素B的效應(yīng)是相互獨立的,不存在相互關(guān)系;2、有交互作用的雙(多)因素方差分析,它假定因素A和因素B的結(jié)合會產(chǎn)生出一種新的效應(yīng)(相互影響)。例如,若假定不同地區(qū)的消費者對某種顏色有與其他地區(qū)消費者不同的特殊偏愛,這就是兩個因素結(jié)合后產(chǎn)生的新效應(yīng),屬于有交互作用的背景;否則,就是無交互作用的背景。 三、以雙因素為例:FA=MSA/MSE FB=MSB/M

18、SE 例4 某商品有五種不同的包裝方式(因素A),在五個不同地區(qū)銷售(因素B),現(xiàn)從每個地區(qū)隨機抽取一個規(guī)模相同的超級市場,得到該商品不同包裝的銷售資料如下表。 表4 某種商品不同地區(qū)不同包裝的銷售資料 檢驗包裝方式和銷售地區(qū)對該商品銷售是否有顯著性影響?(=0.05) (1)建立假設(shè)對因素A :對因素B:(2)計算統(tǒng)計量因素A的列均值分別為:因素B的行均值分別為:總均值=15.04SST=(20-15.04)2 +(10-15.04)2=880.96 SSA=5(21.6-15.04)2 +5(11.6-15.04)2=335.36 SSB=3(15.2-15.04)2 +3(16.8-15

19、.04)2=199.36SSE=880.96-335.36-199.36=346.24 (3)統(tǒng)計決策對于因素A,因為FA=1.903F-crit;故拒絕H0,接受H1,說明不同的地區(qū)對該商品的銷售產(chǎn)生不同的影響。 SPSS處理(一元多因素方差分析): Analyze General Linear Model Univariate (1)無交互效應(yīng)(2)有交互效應(yīng)例5 職業(yè)、年齡是否是居民儲蓄(存取款額、收入水平)的影響因素SPSS處理(多元多因素方差分析): Analyze General Linear Model Multivariate (1)有交互作用(2)無交互作用2.2 協(xié)方差陣的檢驗(1)檢驗(2)檢驗SPSS處理:參見均值檢驗2.3 形象分析(Pro)一、問題提出 設(shè)從總體 ,中各自獨立地抽取樣本 和 , 。他們的均值向量差為:例 在愛情和婚姻的調(diào)查中,對一個由若干名丈夫和妻子組成的樣本進行了問卷調(diào)查,請他們回答以下幾個問題:(1)你對伴侶的愛情的“熱度”感覺如何?(2)伴侶對你的愛情的“熱度”感覺如何?(3)你對伴侶的愛情的“可結(jié)伴”水平感覺如何?(4)伴侶對你的愛情的“可結(jié)伴”水平感覺如何? 回答采用沒有、很小、有些、很大和非常大5個等級,得到結(jié)果如表。丈夫?qū)ζ拮悠拮訉φ煞?X1 X2 X3 X4 X1 X2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論