沖刺背誦方差分析_第1頁(yè)
沖刺背誦方差分析_第2頁(yè)
沖刺背誦方差分析_第3頁(yè)
沖刺背誦方差分析_第4頁(yè)
沖刺背誦方差分析_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、方差分析 (ysis of Variance)考慮以下情境:一位者感影響兒童閱讀能力的.者認(rèn)為兒童的和每次閱讀時(shí)間可能是重要的影響。者設(shè)計(jì)了以下實(shí)驗(yàn):選取三個(gè)組的兒童: 3 歲, 8 歲, 和 14 歲.將每個(gè)組的兒童隨機(jī)分配到三個(gè)閱讀條件. 組 1 閱讀時(shí)間為 5 分鐘; 組 2 為 15 分鐘; 對(duì)于組3 為 30 分鐘.兩個(gè)之后測(cè)試了這些兒童的閱讀能力。閱讀時(shí)間5 分鐘 15 分鐘 30 分鐘3 歲8 歲14 歲這個(gè)有 3 X 3 樣本 (即 9 個(gè)). 如何分析數(shù)據(jù)?t-檢驗(yàn)和 z-檢驗(yàn)不能用于多于 2 組的數(shù)據(jù). 處理這類數(shù)據(jù)需要用 一種新的推論統(tǒng)計(jì)程序:方差分析 (ANOVA).A

2、NOVA 能夠處理數(shù)據(jù)的類型: 在上例中有兩個(gè)自變量 (稱為):和閱讀時(shí)間. 兩個(gè)都是組間(獨(dú)立樣本) 變量. ANOVA 亦可用于分析包含組內(nèi) (重復(fù)測(cè)量)的設(shè)計(jì),同時(shí)包含組間和組內(nèi)的混合設(shè)計(jì)(e.g. 假設(shè)上例中用同一些兒童作縱向。是組內(nèi)變量,閱讀時(shí)間是組間變量).在方差分析中,就是自變量.包含一個(gè)自變量的稱為單設(shè)計(jì)(single-factordesign). 具有多于一個(gè)自變量稱為設(shè)計(jì)(factorialdesign).的個(gè)別處理?xiàng)l件稱為的水平.上述稱為設(shè)計(jì), 兩個(gè)組間,每一個(gè)有 3 個(gè)水平 (稱為 3 X 3 組間設(shè)計(jì)).最基本的 ANOVA.集中單, 獨(dú)立測(cè)量的設(shè)計(jì).1. ANOVA

3、 的邏輯與假設(shè)檢驗(yàn)的邏輯是同樣的, 只是具體內(nèi)容有變化ANOVA 的邏輯ANOVA 的符號(hào).ANOVA 的過程和例題事后檢驗(yàn)陳述 H0 (和 H1 ?) ,確定標(biāo)準(zhǔn): = ?ANOVA 檢驗(yàn)總是 單尾step1:step2:step3:檢驗(yàn)的df (有兩個(gè) df)step4:查表找出臨界 F 統(tǒng)計(jì)量step5:對(duì)于樣本,計(jì)算 F 統(tǒng)計(jì)量step6:比較 F 統(tǒng)計(jì)量 和臨界 F 統(tǒng)計(jì)量step7:對(duì)于 H0 作出結(jié)論單, 獨(dú)立測(cè)量設(shè)計(jì)的例子:檢驗(yàn)三個(gè)不同的學(xué)習(xí)方法的效應(yīng)。將學(xué)生隨機(jī)分配到 3 個(gè)處理組方法A:讓學(xué)生只讀, 不去上課.方法B:上課,記筆記,不讀.方法C:不讀,不去上課, 只看別人的

4、筆記陳述假設(shè)和設(shè)定標(biāo)準(zhǔn) (選擇 )Step1:H0: 1 = 2 = 3H1:其中一個(gè)組與另一個(gè)(或)的組均值不同。備擇假設(shè)可能的形式很多:1 不等于 2= 311132=不等于= 2不等于 323不等于不等于因此,只需給出虛無(wú)假設(shè)就夠了step2:ANOVA 檢驗(yàn)總是單尾. 因?yàn)椴淮嬖谪?fù)的方差. F 分布表也只有單側(cè)的 Alpha.(F 分布圖)step3:找出檢驗(yàn)的 df. 注意要考慮幾個(gè) df (step4:從表找出臨界 F 統(tǒng)計(jì)量分子的 df分母的 df12345116140522004999216540322556252305764218.5198.4919.0099.0019.16

5、99.1719.2599.2519.3099.30310.1334.129.5530.929.2829.469.1228.719.0128.24:與 t 分布表類似, F 分布表也是描述一族 F 分布.需要用到兩個(gè) df,用一個(gè)找出正確的行另一個(gè)找出正確的列.上面一行對(duì)應(yīng)于 下面一行對(duì)應(yīng)于 = 0.01.=0.05,step5: 計(jì)算樣本 的 F 統(tǒng)計(jì)量觀測(cè)值概念的水平的:ANOVA 非常類似 兩個(gè)獨(dú)立樣本的 t 檢驗(yàn)tobs= 得到的樣本均值間差異期望的機(jī)會(huì)差異對(duì)于ANOVA 檢驗(yàn)統(tǒng)計(jì)量 (稱為 F 比率)類似F =樣本均值間方差 (差異)期望的機(jī)會(huì)(誤差)方差(差異)為什么用方差?因?yàn)橛卸?/p>

6、于兩個(gè)組.如何計(jì)算一個(gè)分?jǐn)?shù)來(lái)描述差異間分布?差異不能夠分割,但是方差能夠分割。這就是ANOVA -方差分析名字的由來(lái).首先考慮方差的來(lái)源.什么造成樣本的不同(處理間變異) ?處理/組效應(yīng) - 處理造成的差異差異效應(yīng) -差異變異隨機(jī)誤差每一個(gè)樣本內(nèi)部的變異 (處理內(nèi)變異)差異效應(yīng)隨機(jī)誤差F 比率 可以表達(dá)為:F 比率=樣本均值間的方差 (差異)期望的機(jī)會(huì) (誤差)方差(差異)F 比率=處理間方差處理內(nèi)方差F 比率= 處理效應(yīng) +差異 + 隨機(jī)誤差差異 + 隨機(jī)誤差注意:有時(shí)分母叫做誤差部分,其量度了由于機(jī)會(huì)造成的方差如果 H0 為真,處理效應(yīng)的值應(yīng)該如何?H0: 123=如果沒有差異, 效應(yīng)方差

7、 = 0如果效應(yīng)方差 = 0, F 比率值?F 比率 = 0 +差異 + 隨機(jī)誤差 = 1 = 1.0差異 + 隨機(jī)誤差 1如果H0為假, F 比率應(yīng)該大于 1.step 6: 比較 F 統(tǒng)計(jì)量的觀測(cè)值與臨界 F 統(tǒng)計(jì)量如果 F 統(tǒng)計(jì)量的觀測(cè)值 (Fobs) 在統(tǒng)計(jì)上顯著地大于1.0 則H02. ANOVA 的符號(hào)K = 處理?xiàng)l件(或組)的數(shù)目n = 每一個(gè)組的數(shù)目(如果它們相等)ni = 第i 組的數(shù)目(如果 它們不等)niN = 總的樣本容量Ti = XijXijG =總的和G-bar = G / N = 總的均值(Xij2i)SSi= 每一個(gè)組的和方 =-在上例中:X2 = 106G =

8、 30 = 總的和N = 15 = 總的樣本容量G-bar = 30/15 = 2 = 總的均值K = 3 =處理?xiàng)l件 (或組) 的數(shù)目3. ANOVA 的過程和例題F 比率 = 處理間方差處理內(nèi)方差需要找出兩個(gè)方差.最基本公式 s2 = SS/df. SS 和 = X - (G /N)22= 106 - (302/15) =106 - 60 = 46SS 和需要將其分解為組間變異和組內(nèi)變異.SS 和=SS 組間+SS 組內(nèi)如何得到 SS 組內(nèi)? 將每一個(gè)組 SS 相加= SS 每一個(gè) 處理內(nèi)部 =SSiSSwithin= 6 + 6 + 4 = 16如何得到 SS 組間?方法方法 A只讀方法

9、 B只作筆記方法 C借別人筆記0410T1 = 5T2 = 20T3 = 5SS1 = 6SS2 = 6SS3 = 4n1 = 5n2 = 5n3 = 51 = 12 = 43 = 1快捷的方法是:SS 和- SS 組內(nèi)若數(shù)據(jù)足夠,不用這種方法,因?yàn)?無(wú)法檢查計(jì)算錯(cuò)誤未涉及 SS 組間 是如何組成.直接計(jì)算SS 組間的兩個(gè)公式:定義公式和計(jì)算公式SS 和 = SS 組間 + SS 組內(nèi) = 16 + 30 = 46s2= SS/df.已計(jì)算出 SS, 找出 df:共有兩個(gè) (或三個(gè))度, 一個(gè)組間方差 df,一個(gè)組內(nèi)方差 df(以及一個(gè)總的df).df 和 = N - 1df 組內(nèi) = = N

10、 - Kdf 組間=K - 1df 和 = df 組內(nèi) + df 組間在例子中:df 組內(nèi) = 15- 3= 12df 組間=3 -1 =2df 和= 15- 1= 14, = 12 + 2現(xiàn)在計(jì)算方差. 這里稱為均方.方差 = 均方 = MS = SS/dfMS 組間= SS 組間/df 組內(nèi)- 上例中 = 30/2 = 15注意: 有時(shí)MS 組間稱為誤差的均方.MS 組內(nèi) = MS 誤差 =誤差的均方 = SS 組內(nèi)/df 組內(nèi)- 上例中 = 16/12 = 1.33F 比率 = 處理間方差 = MS 組間處理內(nèi)方差MSw 組間上例中的 F 比率是: 15/1.33 = 11.28定義公式

11、計(jì)算公式SS 間 = ni(- G-bar)2SS 間 = (T2/ni) - G2/N= 5(1 - 2) 2 + 5(4 - 2) 2 + 5(1 - 2)2= 5 + 20 + 5= 30= 52/5 + 202/5 + 52/5 - 302/15= 5 + 80 + 5 - 60= 30將結(jié)果總結(jié)到方差分析表中:SSdfMS來(lái)源處理間301621215.01.33F = 11.28處理內(nèi)總的4614查F 表確定Fcrit對(duì)假設(shè)作出結(jié)論df 組間=分子的 dfdf 組內(nèi)=分母的 df (誤差)-上例中:df 組內(nèi)=12;df 組間=2如果選擇 =.05, Fcrit = 3.88如果選擇

12、 =.01, Fcrit = 6.93H0 (1 = 2 = 3).F 比率的觀測(cè)值 11.28 大于 Fcrit.,所以結(jié)果F(df 組間,df 組內(nèi))= Fobs, p ?分子的 df分母的 df12345116140522004999216540322556252305764218.5198.4919.0099.0019.1699.1719.2599.2519.3099.30310.1334.129.5530.929.2829.469.1228.719.0128.24:124.759.333.886.933.495.953.265.413.115.06134.679.073.806.70

13、3.415.743.185.203.024.86:單方差分析發(fā)現(xiàn)學(xué)習(xí)方法有顯著的效應(yīng), F(2,12) = 11.28, p 0.01.注意:電腦的結(jié)果輸出 會(huì)給出實(shí)際 p-值. 假設(shè)檢驗(yàn)的邏輯 是必須事前預(yù)設(shè) Alpha 水平. 如果選擇了 .01, 就必須 將其用于所有的檢驗(yàn).所以,如果有兩個(gè)實(shí)驗(yàn), 電腦程序得到實(shí)驗(yàn) 1 的 p值 = .001,實(shí)驗(yàn) 2 的 p -值 = .01. 它們都在統(tǒng)計(jì)上顯著. 假設(shè)檢驗(yàn)是 yes/no 決策. 上例中,結(jié)論 都是 YES.實(shí)驗(yàn) 1 的結(jié)果并不比實(shí)驗(yàn) 2更顯著.4.事后檢驗(yàn)(t hoc tests)ANOVA 的結(jié)果是檢驗(yàn)H0: 1 = 2 = 3

14、 ,這是一個(gè)兩點(diǎn) (/不) 決策. 并未提供哪個(gè)備擇假設(shè)得到支持. 也就是說(shuō), 只知道一些組與其它組不同, 但并知道差別在哪些組之間.所以從 ANOVA 得到顯著差異的結(jié)果 (H0)后,一定要做作 some 事后檢驗(yàn). 事后檢驗(yàn) 使我們能夠比較各組, 發(fā)現(xiàn)差異產(chǎn)生在什么地方.事后檢驗(yàn)就是比較每一個(gè)處理組與另一個(gè)處理組, 一次比較兩個(gè). 這稱為成對(duì)比較.12, 1 與 3,2 與 3.在上例中, 可以比較與以及這樣的做法有沒有問題?每一個(gè)比較 都是一個(gè)單獨(dú)的假設(shè)檢驗(yàn), 每一個(gè)都有犯 I 類錯(cuò)誤的風(fēng)險(xiǎn). 所以,比較對(duì)數(shù)越多,作結(jié)論的風(fēng)險(xiǎn)越大。即容易發(fā)現(xiàn)實(shí)際不存在的差異。 這稱為實(shí)驗(yàn)導(dǎo)致的(expe

15、rimentwise)alpha 水平 (或族系(familywise) 誤差)EW = 1 - (1- a)cc = 比較對(duì)數(shù)如果選擇 = 0.05 作 3 對(duì)比較- a)c = 1 - (.95)3 = 1 - .857 = .143對(duì)于上述例子,EW = 1 - (1I 類錯(cuò)誤的機(jī)會(huì)增加到 14.7%而不再是 5%,多數(shù)事后檢驗(yàn)設(shè)計(jì)中都控制了實(shí)驗(yàn)導(dǎo)致誤差.這里介紹兩個(gè)事后檢驗(yàn): Tukeys HSD 檢驗(yàn) (honestly 差異顯著性) 檢驗(yàn)和 Scheff 檢驗(yàn).a)Tukeys HSD 檢驗(yàn)可以計(jì)算出單一的值確定處理均值間的最小差異,考查此差異在統(tǒng)計(jì)上是否顯著.此檢驗(yàn)要求各組有相等

16、的樣本容量.HSD = q * sqrt(MS 組內(nèi)/n)q 值 可以從表中查出(附表 6). 需要用到 K 和df 組內(nèi),以及EW在上例中 (用EW = .05):HSD = q * sqrt(MS 組內(nèi)/n)=(3.77) sqrt(1.33/5) = (3.77)(.516) = 1.94H0: 12比較 1:=2 -1 = 4.0 - 1.0 = 3.0HSD = 1.94 0.0,不能H0H0: 23比較 3:=2 -3 = 4.0 - 1.0 = 3.0HSD = 1.94 3.88,比較 2: H0: 1H0= 3SS 組間=+- = 0MS 組間=0/2 = 0MS 組內(nèi)=16/12 = 1.33F 比率 = MS 間 =

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論