數(shù)值變量資料的統(tǒng)計推斷_第1頁
數(shù)值變量資料的統(tǒng)計推斷_第2頁
數(shù)值變量資料的統(tǒng)計推斷_第3頁
數(shù)值變量資料的統(tǒng)計推斷_第4頁
數(shù)值變量資料的統(tǒng)計推斷_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第九章第九章 數(shù)值變量資料的數(shù)值變量資料的統(tǒng)計推斷統(tǒng)計推斷第一節(jié)第一節(jié) 均數(shù)的抽樣誤差均數(shù)的抽樣誤差與總體均數(shù)的估計與總體均數(shù)的估計 用樣本信息推斷總體特征,稱用樣本信息推斷總體特征,稱統(tǒng)計統(tǒng)計推斷推斷。 統(tǒng)計推斷包括總體參數(shù)估計和假設(shè)統(tǒng)計推斷包括總體參數(shù)估計和假設(shè)檢驗。檢驗。由于抽樣造成由于抽樣造成的樣本均數(shù)與總體均數(shù)及樣本均的樣本均數(shù)與總體均數(shù)及樣本均數(shù)間的差異。數(shù)間的差異。 標(biāo)準(zhǔn)誤:標(biāo)準(zhǔn)誤:為樣本均數(shù)的標(biāo)準(zhǔn)差,是說為樣本均數(shù)的標(biāo)準(zhǔn)差,是說明樣本均數(shù)抽樣誤差的大小的指標(biāo),明樣本均數(shù)抽樣誤差的大小的指標(biāo),反映了樣本均數(shù)與總體均數(shù)的差異。反映了樣本均數(shù)與總體均數(shù)的差異。計算:計算:xn xSS

2、n (標(biāo)準(zhǔn)誤的估計值)(標(biāo)準(zhǔn)誤的估計值)注意:注意: X X 、S S X X均為樣本均數(shù)的標(biāo)準(zhǔn)誤均為樣本均數(shù)的標(biāo)準(zhǔn)誤 標(biāo)準(zhǔn)誤的用途:標(biāo)準(zhǔn)誤的用途:1.1.衡量抽樣誤差大小;衡量抽樣誤差大小;2.2.估計總體均數(shù)可信區(qū)間;估計總體均數(shù)可信區(qū)間;3.3.用于假設(shè)檢驗。用于假設(shè)檢驗。二、二、 t t 分布分布(一)概念:(一)概念:從正態(tài)總體從正態(tài)總體N(,)中進行無數(shù)次樣本含中進行無數(shù)次樣本含量為量為n的隨機抽樣,每次均可得的隨機抽樣,每次均可得 -到一個到一個和一個和一個s,通過,通過 t = 公公 s /n式轉(zhuǎn)換,可得無數(shù)個式轉(zhuǎn)換,可得無數(shù)個t值,值,t值的分布即值的分布即為含量為為含量為n

3、的的t值的總體或稱值的總體或稱t-分布。分布。XtSn(二)(二)t 分布的曲線:分布的曲線:與與 有關(guān)有關(guān) (三)特征:(三)特征:1.以以0為中心,左右對稱;為中心,左右對稱;2.t-分布曲線的形狀與自由度有關(guān);分布曲線的形狀與自由度有關(guān);3.t-分布曲線下面積為分布曲線下面積為1 。 -4 -3 -2 -1 0 +1 +2 +3 +4f(t) = (-) / = (u-d) = 5 = 1-自由度分別為自由度分別為1、5、的的t-分布分布(四)(四)t 界值表界值表(附表(附表9-1 ):):t /2, :表示自由度為:表示自由度為 ,雙側(cè)概率,雙側(cè)概率P為為 時時t的界值。的界值。(五

4、)(五)t t分布曲線下面積的規(guī)律:分布曲線下面積的規(guī)律:中間中間95%95%的的t t值:值:- t- t0.05/20.05/2, t t0.05/20.05/2, 中間中間99%99%的的t t值:值:- t- t0.01/20.01/2, t t0.01/20.01/2, 單尾概率:一側(cè)尾部面積單尾概率:一側(cè)尾部面積雙尾概率:雙側(cè)尾部面積雙尾概率:雙側(cè)尾部面積(1) (1) 自由度(自由度()一定時,)一定時,p p與與t t成反比;成反比;(2) (2) 概率(概率(p p)一定時,)一定時,與與t t成反比。成反比。三、總體均數(shù)置信區(qū)間的估計三、總體均數(shù)置信區(qū)間的估計 統(tǒng)計推斷:用

5、樣本信息推論總體特征。統(tǒng)計推斷:用樣本信息推論總體特征。 包括參數(shù)估計和假設(shè)檢驗。包括參數(shù)估計和假設(shè)檢驗。 參數(shù)估計:用樣本統(tǒng)計量估計總體參數(shù)。參數(shù)估計:用樣本統(tǒng)計量估計總體參數(shù)。 1.1.點(值)估計:點(值)估計:用樣本統(tǒng)計量用樣本統(tǒng)計量作為對總體參數(shù)的估計值。作為對總體參數(shù)的估計值。 2.2.區(qū)間估計:區(qū)間估計:根據(jù)選定的置信度根據(jù)選定的置信度(或可信度,用概率表示)估計總(或可信度,用概率表示)估計總體參數(shù)所在的范圍。體參數(shù)所在的范圍。 置信度:估計正確的概率。置信度:估計正確的概率。1- 1- ??傮w均數(shù)的可信區(qū)間:總體均數(shù)的可信區(qū)間:l按一定的可信度由樣本均數(shù)計算的總按一定的可信度

6、由樣本均數(shù)計算的總體均數(shù)可能所在的范圍,這個范圍稱為體均數(shù)可能所在的范圍,這個范圍稱為總體均數(shù)的可信區(qū)間??傮w均數(shù)的可信區(qū)間。(1 1)u u 分布法分布法(均以(均以95%CI95%CI為例)為例)Xun 已知時已知時95%CI:( )1.961.961.961.96/1.96,1.96XXuXnXX(1)u 分布分布 法法 未知但未知但n足夠大時總體均數(shù)足夠大時總體均數(shù)95%CI:( )1.96,1.96XXXSXS(2)t 分布分布 法法 未知、未知、n較小時總體均數(shù)較小時總體均數(shù)95%CI:按按t分布原理:分布原理: ( )0.05/2,0.05/2,XXXtSXtS例題:P168第二

7、節(jié)第二節(jié) 假設(shè)檢驗的假設(shè)檢驗的基本思想和基本步驟基本思想和基本步驟一、一、 假設(shè)檢驗的基本原理假設(shè)檢驗的基本原理 假設(shè)檢驗:假設(shè)檢驗:先對總體的參數(shù)或分先對總體的參數(shù)或分布作出某種假設(shè),再用適當(dāng)?shù)姆讲甲鞒瞿撤N假設(shè),再用適當(dāng)?shù)姆椒ǜ鶕?jù)樣本對總體提供的信息,法根據(jù)樣本對總體提供的信息,推斷此假設(shè)應(yīng)當(dāng)拒絕或不拒絕。推斷此假設(shè)應(yīng)當(dāng)拒絕或不拒絕。 例:例:某地抽查了某地抽查了2626名男性管理人員的空名男性管理人員的空腹血糖,均數(shù)腹血糖,均數(shù) x x為為4.84mmol/L4.84mmol/L,標(biāo)準(zhǔn),標(biāo)準(zhǔn)差差S S為為0.85mmol/L0.85mmol/L,已知大量調(diào)查的一,已知大量調(diào)查的一般健康成年

8、男性空腹靜脈血糖均數(shù)為般健康成年男性空腹靜脈血糖均數(shù)為4.70mmol/L4.70mmol/L。試問能否認為該地抽查。試問能否認為該地抽查的的2626名健康男性管理人員的空腹血糖名健康男性管理人員的空腹血糖均值與一般正常健康成年男性的空腹均值與一般正常健康成年男性的空腹血糖均值不同?血糖均值不同?差異來源的分析差異來源的分析 兩種可能性:兩種可能性: (1 1)抽樣誤差造成了二者的差別:)抽樣誤差造成了二者的差別: = = 0 0; (2 2)可能由于飲食習(xí)慣、生活條件等)可能由于飲食習(xí)慣、生活條件等的影響,樣本所代表的總體與已知總體的影響,樣本所代表的總體與已知總體確實不同:確實不同: 0

9、0。 一、假設(shè)檢驗的基本原理一、假設(shè)檢驗的基本原理 抽樣誤差所致抽樣誤差所致 P0.05 (來自同一總體)(來自同一總體) ? 假設(shè)檢驗回答假設(shè)檢驗回答 環(huán)境條件影響環(huán)境條件影響 P 0 或或 0 (單側(cè)檢驗)(單側(cè)檢驗) (檢驗水準(zhǔn)、顯著性水準(zhǔn)檢驗水準(zhǔn)、顯著性水準(zhǔn)) :通常?。和ǔH?=0.05二、假設(shè)檢驗的基本步驟二、假設(shè)檢驗的基本步驟 2. 選定檢驗方法和計算檢驗統(tǒng)計量:選定檢驗方法和計算檢驗統(tǒng)計量: 根據(jù)資料類型及統(tǒng)計推斷的目的選用根據(jù)資料類型及統(tǒng)計推斷的目的選用合適的檢驗方法計算出統(tǒng)計量合適的檢驗方法計算出統(tǒng)計量( t值、值、u值、值、 2值等值等 )。二、假設(shè)檢驗的基本步驟二、假設(shè)

10、檢驗的基本步驟 3. 確定確定P值值 ,作出推斷結(jié)論:作出推斷結(jié)論: P值:值:由由H0所規(guī)定的總體中進行隨機抽所規(guī)定的總體中進行隨機抽樣,獲得等于及大于(和樣,獲得等于及大于(和/或等于及小或等于及小于)現(xiàn)有樣本統(tǒng)計量值的概率。于)現(xiàn)有樣本統(tǒng)計量值的概率。 根據(jù)自由度,查不同統(tǒng)計量的界值表根據(jù)自由度,查不同統(tǒng)計量的界值表( t值表、值表、 2值表等值表等),確定現(xiàn)有統(tǒng)計量的,確定現(xiàn)有統(tǒng)計量的概率概率P值。值。二、假設(shè)檢驗的基本步驟二、假設(shè)檢驗的基本步驟 3. 確定確定P值值 ,作出推斷結(jié)論:作出推斷結(jié)論: 當(dāng):當(dāng): t 0.05 ( 差異無顯著性差異無顯著性 ) t 0.01() t t 0

11、.05() , 0.01 P :按所取檢驗水準(zhǔn)不拒絕按所取檢驗水準(zhǔn)不拒絕H H0 0 , ,還不能認為差異有統(tǒng)計學(xué)意義。還不能認為差異有統(tǒng)計學(xué)意義。P P :按所取檢驗水準(zhǔn)拒絕按所取檢驗水準(zhǔn)拒絕H H0 0,接受接受H H1 1 , ,差異有統(tǒng)計學(xué)意義。差異有統(tǒng)計學(xué)意義。第三節(jié)第三節(jié) t 檢驗和檢驗和 u 檢驗檢驗 t檢驗的應(yīng)用條件:檢驗的應(yīng)用條件: 樣本例數(shù)樣本例數(shù)n較小、樣本來自正態(tài)或近較小、樣本來自正態(tài)或近似正態(tài)總體,兩樣本均數(shù)比較時還要似正態(tài)總體,兩樣本均數(shù)比較時還要求相應(yīng)的兩總體方差齊同。求相應(yīng)的兩總體方差齊同。 u檢驗的應(yīng)用條件:檢驗的應(yīng)用條件: 大樣本資料,樣本例數(shù)大樣本資料,樣

12、本例數(shù)n較小但總體較小但總體標(biāo)準(zhǔn)差已知,樣本來自對稱或正態(tài)總標(biāo)準(zhǔn)差已知,樣本來自對稱或正態(tài)總體。體。一、樣本均數(shù)與總體均數(shù)比較的一、樣本均數(shù)與總體均數(shù)比較的t t檢驗檢驗 總體均數(shù):總體均數(shù):一般為理論值、標(biāo)準(zhǔn)值或經(jīng)過大一般為理論值、標(biāo)準(zhǔn)值或經(jīng)過大量觀察所得的穩(wěn)定值量觀察所得的穩(wěn)定值 0 0 比較的目的:比較的目的:樣本所代表的未知總體均數(shù)樣本所代表的未知總體均數(shù) 與已知的總體均數(shù)與已知的總體均數(shù) 0 0是否不同。是否不同。 統(tǒng)計量統(tǒng)計量t t的計算公式:的計算公式: = n - 1 = n - 10/XtSnP P170170例例9.39.3:已知一般無肝腎疾患的健康:已知一般無肝腎疾患的健

13、康人群尿素氮均值為人群尿素氮均值為4.8824.882(mmol/Lmmol/L),),1616名脂肪肝患者的尿素氮(名脂肪肝患者的尿素氮(mmol/Lmmol/L)測)測定值為定值為5.745.74,5.755.75,4.264.26,6.246.24,5.365.36,8.688.68,6.476.47,5.245.24,4.134.13,11.811.8,5.575.57,5.615.61,4.374.37,4.594.59,5.185.18,6.966.96。問脂。問脂肪肝患者尿素氮測定值的均數(shù)是否高于肪肝患者尿素氮測定值的均數(shù)是否高于健康人?健康人? 假設(shè)檢驗的步驟假設(shè)檢驗的步驟:

14、1. 建立檢驗假設(shè),確定檢驗水準(zhǔn):建立檢驗假設(shè),確定檢驗水準(zhǔn): H0 := 0 H1 : 0 (單側(cè)檢驗)(單側(cè)檢驗) =0.05 假設(shè)檢驗的步驟假設(shè)檢驗的步驟: 2. 選定檢驗方法和計算檢驗統(tǒng)計量:選定檢驗方法和計算檢驗統(tǒng)計量: x x = 5.997= 5.997,S = 1.92S = 1.92,n = 16 n = 16 t=2.32 ( t=2.32 (單側(cè)檢驗單側(cè)檢驗) )0/XtSn假設(shè)檢驗的步驟假設(shè)檢驗的步驟: 3. 確定確定P值值 ,作出推斷結(jié)論:作出推斷結(jié)論: 查查 t 值表:值表: 0.01p0.025按所取檢驗水準(zhǔn)拒絕按所取檢驗水準(zhǔn)拒絕H H0 0,接受,接受H H1

15、1 , ,差異有統(tǒng)計學(xué)意義。可以認為脂肪差異有統(tǒng)計學(xué)意義??梢哉J為脂肪肝患者尿素氮測定值的均數(shù)高于健肝患者尿素氮測定值的均數(shù)高于健康人??等?。表表2 2 克矽平治療前后血清粘蛋白含量(克矽平治療前后血清粘蛋白含量(mg/Lmg/L) 患患者者號號 治治療療前前 治治療療后后 差差值值 d d (1 1) (2 2) (3 3) (4 4)= =(2 2)- -(3 3) 1 1 6 65 5 3 34 4 3 31 1 2 2 7 73 3 3 36 6 3 37 7 3 3 7 73 3 3 37 7 3 36 6 4 4 3 30 0 2 26 6 4 4 5 5 7 73 3 4 43

16、3 3 30 0 6 6 5 56 6 3 37 7 1 19 9 7 7 7 73 3 5 50 0 2 23 3 合合計計 4 44 43 3 2 26 63 3 1 18 80 0 二、配對資料的比較二、配對資料的比較 配對資料:配對資料: 1.同一受試對象處理前后的比較或不同一受試對象處理前后的比較或不同部位測定值比較;同部位測定值比較; 2.同一樣品用兩種不同方法測試;同一樣品用兩種不同方法測試; 3.同對的兩個受試對象分別接受不同同對的兩個受試對象分別接受不同處理。處理。二、配對資料的比較二、配對資料的比較 目的:目的:推斷兩種處理的效果有無差推斷兩種處理的效果有無差別或推斷某種處

17、理有無作用。別或推斷某種處理有無作用。 條件:條件:樣本來自正態(tài)總體。樣本來自正態(tài)總體。二、配對資料的比較二、配對資料的比較 統(tǒng)計量統(tǒng)計量t的計算公式:的計算公式:0nddddtss =對子數(shù)對子數(shù) - 1 d2 (d)2 / n S d = n - 1二、配對資料的比較二、配對資料的比較 P171例例9.4:應(yīng)用某藥治療:應(yīng)用某藥治療8例高例高膽固醇血癥患者,觀察治療前后膽固醇血癥患者,觀察治療前后血漿膽固醇變化情況,見表血漿膽固醇變化情況,見表9-1,問該藥是否對患者治療前后血漿問該藥是否對患者治療前后血漿膽固醇變化有影響?膽固醇變化有影響?表表9-1 9-1 用某新藥治療前后血漿膽固醇變

18、化情況用某新藥治療前后血漿膽固醇變化情況病人編號病人編號血漿膽固醇血漿膽固醇差值差值d d治療前治療前治療后治療后(1 1)(2 2)(3 3)(4)=(2)-(3)(4)=(2)-(3)1 110.110.16.696.693.413.412 26.786.785.405.401.381.383 313.2213.2212.6712.670.550.554 47.787.786.566.561.221.225 57.477.475.655.651.821.826 66.116.115.265.260.850.857 76.026.025.435.430.590.598 88.088.086.

19、266.261.821.829 97.567.565.065.062.502.50l目的:目的:由兩個樣本均數(shù)的差別推斷兩由兩個樣本均數(shù)的差別推斷兩樣本所代表的總體均數(shù)間有無差別。樣本所代表的總體均數(shù)間有無差別。 三、成組設(shè)計的兩小樣本均數(shù)三、成組設(shè)計的兩小樣本均數(shù)比較的比較的t t檢驗檢驗 = n1+n2 - 212121221222211221211()(1)(1)2xxcxxcxxtSnnSnSnSnnss統(tǒng)計量統(tǒng)計量t t的計算公式:的計算公式:P P172172例例9.69.6:從從40-5940-59歲有無腎囊腫的女性中分別隨機抽取歲有無腎囊腫的女性中分別隨機抽取1010與與202

20、0人,測定他們的尿素氮水平(人,測定他們的尿素氮水平(mmol/Lmmol/L)如)如下,問兩組女性尿素氮水平有無不同?下,問兩組女性尿素氮水平有無不同?無腎囊腫:無腎囊腫: 4.054.05 4.184.18 5.935.93 3.143.14 4.304.30 2.412.417.607.60 6.616.61 2.982.98 5.935.93 4.184.18 4.054.05有腎囊腫:有腎囊腫: 4.544.54 4.634.63 3.643.64 7.757.75 5.075.07 6.446.445.625.62 6.146.14 4.814.81 6.426.42四、大樣本均數(shù)

21、比較的四、大樣本均數(shù)比較的 u u 檢驗檢驗 1. 1. 大樣本均數(shù)與已知總體均數(shù)比大樣本均數(shù)與已知總體均數(shù)比較的較的u u 檢驗;檢驗; 2. 2. 兩個(大)樣本均數(shù)比較的兩個(大)樣本均數(shù)比較的u u 檢驗。檢驗。(一)大樣本均數(shù)與已知總體均(一)大樣本均數(shù)與已知總體均數(shù)比較的數(shù)比較的u 檢驗;檢驗; -0 u = /n目的目的:由兩個樣本均數(shù)的差別推斷兩樣本所由兩個樣本均數(shù)的差別推斷兩樣本所代表的總體均數(shù)間有無差別。代表的總體均數(shù)間有無差別。 統(tǒng)計量統(tǒng)計量u u的計算公式的計算公式:121212121222221212xxxxxxxxxxuSSSSnns(二)兩大樣本均數(shù)比較的(二)兩

22、大樣本均數(shù)比較的u u 檢驗檢驗P P172172例例9.59.5:某地隨機抽取正常男性某地隨機抽取正常男性264264名,測得空名,測得空腹血中膽固醇的均數(shù)為腹血中膽固醇的均數(shù)為4.404mmol/L4.404mmol/L,標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)差為1.169mmol/L1.169mmol/L,隨機抽取正常,隨機抽取正常女性女性160160名,測得空腹血中膽固醇的均名,測得空腹血中膽固醇的均數(shù)為數(shù)為4.288mmol/L4.288mmol/L,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為1.106mmol/L1.106mmol/L,問男女膽固醇濃度有無,問男女膽固醇濃度有無差別?差別? 當(dāng)當(dāng) n 較大時,則較大時,則tt,可用

23、,可用=查查t值值表,表中表,表中 t 界值則為界值則為 u 界值界值常用單雙側(cè)常用單雙側(cè)u值值 單側(cè)單側(cè) 雙側(cè)雙側(cè) 0.101.2821.645 0.051.6451.960 0.022.0542.326 0.012.3262.578 P值的確定:值的確定: 雙側(cè):雙側(cè): U1.96 P0.05 差異無顯著性差異無顯著性 2.58 U1.96 0.01P0.05 差異有顯著性差異有顯著性 U2.58 P0.01 差異有高度顯著性差異有高度顯著性第四節(jié)第四節(jié) 方差分析方差分析一、單因素方差分析一、單因素方差分析表表9-3 9-3 三組三組50-5950-59歲男性的空腹血糖測定結(jié)果歲男性的空腹

24、血糖測定結(jié)果(9mmol/L9mmol/L)正常組(正常組(x x1j 1j ) 冠心病組(冠心病組(x x2j 2j ) 脂肪肝組(脂肪肝組(x x3j 3j )4.754.756.266.265.785.784.754.754.364.366.686.684.774.775.245.245.445.444.614.614.674.675.865.864.494.494.554.555.675.674.024.025.185.185.245.245.035.034.614.615.425.424.574.575.125.125.145.144.214.215.265.266.096.094.

25、884.884.834.835.745.744.624.625.595.595.725.72 x xi i4.614.615.065.065.715.71(一)方差分析的基本思(一)方差分析的基本思想想各組的樣本均數(shù)不同、各組與總的均各組的樣本均數(shù)不同、各組與總的均數(shù)不同。數(shù)不同。差異來源:差異來源:個體變異所致的抽樣誤差的影響;個體變異所致的抽樣誤差的影響;可能的可能的處理因素或影響因素的作用。處理因素或影響因素的作用。根據(jù)變異的來源,將全部觀察值根據(jù)變異的來源,將全部觀察值總總的離均差平方和的離均差平方和及及自由度自由度分解為兩分解為兩個或多個部分,除隨機誤差外,其個或多個部分,除隨機誤差

26、外,其余每個部分的變異可由某些特定因余每個部分的變異可由某些特定因素的作用加以解釋。素的作用加以解釋。通過比較不同來源變異的通過比較不同來源變異的方差方差(也(也叫叫均方均方MSMS),借助),借助F F分布做出統(tǒng)計推分布做出統(tǒng)計推斷,從而判斷某因素對觀察指標(biāo)有斷,從而判斷某因素對觀察指標(biāo)有無影響。無影響。(一)方差分析的基本思(一)方差分析的基本思想想 SS SS總總SSSS組內(nèi)組內(nèi)SSSS組間組間 總總=N-1,組間組間=k-1=k-1,組內(nèi)組內(nèi)= =總總- - 組間組間 比較:比較: SSSS組間組間/ /組間組間 與與 SSSS組內(nèi)組內(nèi)/ /組內(nèi)組內(nèi)即可知處理因素是否有作用。即可知處理

27、因素是否有作用。 SSSS總總 = = SSSS組間組間 + SS+ SS組內(nèi)組內(nèi) 總總 = = 組間組間 + + 組內(nèi)組內(nèi) 總總 = N-1 = N-1 組間組間=k-1 =k-1 組內(nèi)組內(nèi)=N - k=N - k總組內(nèi)組間2222222()SS =() =()SS=() =SS()ijijijijijijijjijiijijijiiiiixxxxNxxxxnn xxC 單因素方差分析表:單因素方差分析表:變異來源變異來源SSSS MSMSF FP P總總N-1N-1組間組間K-1K-1SSSS組間組間/ / 組間組間MSMS組間組間/ /MSMS組內(nèi)組內(nèi)組內(nèi)組內(nèi)( (誤差誤差) )SSSS

28、總總-SS-SS組間組間N-kN-kSSSS組內(nèi)組內(nèi)/ / 組內(nèi)組內(nèi)2ijijxC2()ijjiixCn列舉存在的變異及意義:列舉存在的變異及意義:1 1、全部的、全部的3333個實驗數(shù)據(jù)之間大小不個實驗數(shù)據(jù)之間大小不等,存在變異(等,存在變異(總變異總變異)。)。2 2、各個組間存在變異(、各個組間存在變異(組間變組間變):):反映處理因素之間的作用,以及隨反映處理因素之間的作用,以及隨機誤差。機誤差。3 3、各個組內(nèi)個體間數(shù)據(jù)不同:反映、各個組內(nèi)個體間數(shù)據(jù)不同:反映了觀察值的隨機誤差(了觀察值的隨機誤差(組內(nèi)變異組內(nèi)變異)。)。(二)方差分析應(yīng)用條件:(二)方差分析應(yīng)用條件: 1.各樣本來

29、自正態(tài)或接近正態(tài)的總體;各樣本來自正態(tài)或接近正態(tài)的總體; 2.各樣本為相互獨立的隨機樣本;各樣本為相互獨立的隨機樣本; 3.各樣本所來自的總體方差相等。各樣本所來自的總體方差相等。(三)假設(shè)檢驗的步驟:(三)假設(shè)檢驗的步驟: 例例9.7 隨機抽取隨機抽取50-59歲男性正歲男性正常者、冠心病人、脂肪肝患者常者、冠心病人、脂肪肝患者11人,測定空腹血糖值見表人,測定空腹血糖值見表9-3,試推斷三類人群總體均值,試推斷三類人群總體均值是否相同。是否相同。(三)假設(shè)檢驗的步驟:(三)假設(shè)檢驗的步驟: 1.1.建立假設(shè)、確定檢驗水準(zhǔn):建立假設(shè)、確定檢驗水準(zhǔn): H H0 0 : 1 1 = = 2 2

30、= = 3 3,即三類人群總體均值相同即三類人群總體均值相同 H H1 1 : 1 1、 2 2、 3 3不等或不全相等,不等或不全相等,即三類人群即三類人群總體均值不同或不全相同總體均值不同或不全相同 =0.05=0.05 2.2.選定檢驗方法和計算檢驗統(tǒng)計量:選定檢驗方法和計算檢驗統(tǒng)計量: F= F= MSMS組間組間/ /MSMS組內(nèi)組內(nèi) F=MS組間/MS組內(nèi)計算計算F F值,若值,若F F值遠大于值遠大于1 1,可認為,可認為各組均數(shù)間差別有統(tǒng)計學(xué)意義,處各組均數(shù)間差別有統(tǒng)計學(xué)意義,處理有效應(yīng);理有效應(yīng);若若F F值接近甚至小于值接近甚至小于1 1,表示差別無,表示差別無統(tǒng)計學(xué)意義,

31、處理組間效應(yīng)相同統(tǒng)計學(xué)意義,處理組間效應(yīng)相同( (差異僅僅由抽樣原因所致差異僅僅由抽樣原因所致) )。表表9-3 9-3 三組三組50-5950-59歲男性的空腹血糖測定結(jié)果(歲男性的空腹血糖測定結(jié)果(9mmol/L9mmol/L)正常組(正常組(x x1j 1j ) 冠心病組(冠心病組(x x2j 2j ) 脂肪肝組(脂肪肝組(x x3j 3j )4.754.756.266.265.785.784.754.754.364.366.686.684.774.775.245.245.445.444.614.614.674.675.865.864.494.494.554.555.675.674.02

32、4.025.185.185.245.245.035.034.614.615.425.424.574.575.125.125.145.144.214.215.265.266.096.094.884.884.834.835.745.744.624.625.595.595.725.7250.7050.7055.6755.6762.7862.78169.15169.15n ni i1111111111113333(N N) x xi ij j4.614.615.065.065.715.715.135.13( x x)234.52234.52284.71284.71360.12360.12879.358

33、79.35ijjx2ijjx2ijijxijijx2ijjxijjx表表9.5 9.5 例例9.79.7的方差分析表的方差分析表變異來變異來源源SSSSv vMSMSF FP P組間組間6.76.72 23.353.3517.6317.630.010.01組內(nèi)組內(nèi)5.635.6330300.190.19總總12.312.33 33232 3.3.確定概率確定概率P P值、做出推斷結(jié)論:值、做出推斷結(jié)論: 根據(jù)組間、組內(nèi)的自由度,查根據(jù)組間、組內(nèi)的自由度,查F F界界值表值表P P179179附表附表9-29-2,得,得P0.05P0.05,按,按 =0.05=0.05的檢驗水準(zhǔn),拒絕的檢驗水準(zhǔn)

34、,拒絕H H0 0,接受,接受H H1 1 ,差異有統(tǒng)計學(xué)意義,可認為三,差異有統(tǒng)計學(xué)意義,可認為三類人群總體均值不同或不全相同。類人群總體均值不同或不全相同。二、多個樣本均數(shù)間兩兩比二、多個樣本均數(shù)間兩兩比較的較的q q檢驗檢驗q檢驗檢驗 用于多個樣本均數(shù)間每兩個均數(shù)的比較。用于多個樣本均數(shù)間每兩個均數(shù)的比較。 排序、編秩次、計算排序、編秩次、計算q值:值:誤差誤差A(yù)B11(+)nn2ABABABxxxxxxqSMSS例例9.7 9.7 拒絕了拒絕了H H0 0 ,進一步作各均數(shù)間的兩,進一步作各均數(shù)間的兩兩比較。兩比較。1.1.建立假設(shè)、確定檢驗水準(zhǔn):建立假設(shè)、確定檢驗水準(zhǔn): H H0 0

35、 : A A = = B B H H1 1 : A A B B = 0.05 = 0.05 2.2.選定檢驗方法和計算檢驗統(tǒng)計量:選定檢驗方法和計算檢驗統(tǒng)計量: 將各組樣本均數(shù)從大到小排列將各組樣本均數(shù)從大到小排列均數(shù)5.715.064.61秩次123組別脂肪肝組冠心病組正常組因因MSMS誤差誤差=MS=MS組內(nèi)組內(nèi)=0.19=0.19,n ni i=11=11,故,故1與與3、1與與2、2與與3組比較的組比較的q值分別為值分別為0.190.132ABxxS11(+)11 111 35.71 4.618.460.13q q1-2=5.00 q2-3=3.46三個樣本均數(shù)的兩兩比較表:三個樣本均

36、數(shù)的兩兩比較表:表表9-6 9-6 三個樣本均數(shù)兩兩比較的三個樣本均數(shù)兩兩比較的q q值值對比對比組組兩均數(shù)之兩均數(shù)之差差標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤q q值值組組數(shù)數(shù)q q界值界值P PA A與與B B x xA A - - x xB BS S xA - xA - xBxB(2)/(3)(2)/(3)a a0.00.05 50.010.01(1 1)(2 2)(3 3)(4)(4)(5)(5)(6)(6)(7)(7)(8)(8)1 1與與3 31.101.100.130.138.468.463 33.43.49 94.454.450.010.011 1與與2 20.650.650.130.135.005.002 22

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論