衛(wèi)生統(tǒng)計(jì)學(xué)課件 (2)_第1頁
衛(wèi)生統(tǒng)計(jì)學(xué)課件 (2)_第2頁
衛(wèi)生統(tǒng)計(jì)學(xué)課件 (2)_第3頁
衛(wèi)生統(tǒng)計(jì)學(xué)課件 (2)_第4頁
衛(wèi)生統(tǒng)計(jì)學(xué)課件 (2)_第5頁
已閱讀5頁,還剩153頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、衛(wèi)生統(tǒng)計(jì)學(xué),第一節(jié)意義及基本概念,意義,衛(wèi)生統(tǒng)計(jì)是研究居民健康狀況以及認(rèn)識(shí)醫(yī)學(xué)現(xiàn)象數(shù)量特征的重要工具,是運(yùn)用概率論、數(shù)理統(tǒng)計(jì)的基本原理與方法,進(jìn)行醫(yī)學(xué)科研設(shè)計(jì)和資料的收集、整理、分析與推斷的過程。 包括:健康統(tǒng)計(jì)、衛(wèi)生服務(wù)統(tǒng)計(jì),總體與樣本,總體與樣本 總體:根據(jù)研究目的確定的研究對(duì)象的全體。 種類:有限總體、無限總體 樣本:從總體中隨機(jī)抽取的有代表性的一部分。 要求:有代表性。 抽樣原則:1、隨機(jī)化原則 2、樣本量適當(dāng)原則 3、同質(zhì)的原則 抽樣方法:單純隨機(jī)抽樣、機(jī)械抽樣、 分層抽樣、整群抽樣。,個(gè)體與變量,個(gè)體:個(gè)體即觀察單位 變量:個(gè)體的某項(xiàng)特征測量所得的指標(biāo)稱變量。 變異:個(gè)體間變量值的

2、差異。 參數(shù):總體的指標(biāo)。 統(tǒng)計(jì)量:樣本的指標(biāo)。,誤差,誤差測量值與真值、樣本值與總體值之間的差值。 分類:系統(tǒng)誤差:產(chǎn)生原因、特點(diǎn) 隨機(jī)誤差: 隨機(jī)測量誤差 :產(chǎn)生原因、特點(diǎn) 抽樣誤差: 概念、原因、特點(diǎn) 不可消除 ,可以測量, 可以控制,概率,概率(P) 必然事件 P0、P1; 隨機(jī)事件 0P1 小概率事件:P0.05或P0.01的事件, 小概率事件原理:現(xiàn)實(shí)中小概率事件一次不可能發(fā)生 頻率(p):樣本事件發(fā)生的可能性。,統(tǒng)計(jì)資料,統(tǒng)計(jì)資料 A 計(jì)量資料: B 計(jì)數(shù)資料:無序資料 有序資料-等級(jí)資料,醫(yī)學(xué)統(tǒng)計(jì)和衛(wèi)生統(tǒng)計(jì)中的幾種資料類型,基本步驟,確定目的 計(jì)劃和設(shè)計(jì) 收集資料 資料來源 (

3、日常資料、專題調(diào)查、實(shí)驗(yàn)研究) 收集方法 核查資料,整理資料(按量整理,按質(zhì)整理) 分析資料,統(tǒng)計(jì)分析主要內(nèi)容,一、計(jì)量資料 1、統(tǒng)計(jì)描述 集中趨勢 : 、G、M 離散趨勢: R、2、CV%、Q1/4 統(tǒng)計(jì)圖表 2、統(tǒng)計(jì)推斷 參數(shù)估計(jì): 總體均數(shù)的估計(jì)(正態(tài)法) 假設(shè)檢驗(yàn): t檢驗(yàn)、u檢驗(yàn)、方差檢驗(yàn)、秩和檢驗(yàn),統(tǒng)計(jì)分析主要內(nèi)容2,一、計(jì)數(shù)資料 1、統(tǒng)計(jì)描述 實(shí)際數(shù) 相對(duì)數(shù) 率、構(gòu)成比、相對(duì)比 統(tǒng)計(jì)圖表 2、統(tǒng)計(jì)推斷 參數(shù)估計(jì): 總體率的估計(jì)- 正態(tài)法 假設(shè)檢驗(yàn) :u檢驗(yàn)、2檢驗(yàn),練習(xí) 1 2 3 4,(一)試區(qū)分以下資料屬于哪種類型? 1.某地一批人的血紅蛋白值資料 比色法測得的具體值(如13

4、5g/L),為何類資料? 根據(jù)測得值進(jìn)行分類(如“貧血”),為何類資料? 2.數(shù)據(jù)類型的相互轉(zhuǎn)換 如年齡(歲),為何類資料? 轉(zhuǎn)換為“未成年、成人”,是何類資料? 再轉(zhuǎn)換為“嬰幼兒、青年、中年、老年”則又是何類資料? 如治療效果分類“無效、好轉(zhuǎn)、顯效、痊愈”為何類資料? (二)解釋:樣本 抽樣誤差 概率,第二節(jié),統(tǒng)計(jì)表和統(tǒng)計(jì)圖,一、統(tǒng)計(jì)表,1、表的種類:按用途分-調(diào)查表、整理表、統(tǒng)計(jì)表 按內(nèi)容分-簡單表、組合表 2、統(tǒng)計(jì)表的格式 組成:標(biāo)題、線條、標(biāo)目、數(shù)字 表序 標(biāo)題,統(tǒng)計(jì)表的繪制要求,(1)標(biāo)題:內(nèi)容、位置 (2)標(biāo)目:表明表的研究對(duì)象及指標(biāo)。 橫標(biāo)目-研究對(duì)象,位于表的左側(cè)。 縱標(biāo)目-研

5、究指標(biāo),位于表的上方。 必要時(shí)可有單位。 (3)線條:頂線、標(biāo)目線、底線。可有合計(jì)線。 注意:不得出現(xiàn)其他任何線條! (4)數(shù)字:只能填寫阿拉伯?dāng)?shù)字 不得出現(xiàn)文字及空格 缺損值、注解的表示,統(tǒng)計(jì)表例,10%明礬液治療面部深層海棉狀血管瘤療效 療效 病例數(shù) 百分比(%) 特效 66 69.7 顯效 14 14.7 有效 11 11.6 無效 4 4.2 合計(jì) 95 100.0,二、統(tǒng)計(jì)圖,統(tǒng)計(jì)圖是在統(tǒng)計(jì)表的基礎(chǔ)上繪制的。 不同的資料用不同的圖表示。常見的統(tǒng)計(jì)圖有直條圖、直方圖、構(gòu)成圖、線圖。,制圖的基本要求,統(tǒng)計(jì)圖構(gòu)成: (一)標(biāo)題 (二)圖域長寬之比一般 7:5為美觀,圓圖除外。 (三)標(biāo)目對(duì)

6、應(yīng)縱橫兩軸 ,并注明度量衡單位。 (四)尺度 (五)圖例,統(tǒng)計(jì)圖的類型,(1)條圖:又稱直條圖,表示獨(dú)立指標(biāo)在不同階段的情況。注意直條的排列(寬度、間距、順序、縱坐標(biāo)起點(diǎn))。類型:簡單、復(fù)式,百分條圖和圓圖,(2):描述百分比(構(gòu)成比)的大小, 注意:起點(diǎn)、方向、順序。,線圖,(3):用線條的升降表示事物的發(fā)展變化趨勢。 常以橫軸表示時(shí)間或變量,縱軸表示指標(biāo)。,半對(duì)數(shù)線圖,(4):縱軸用對(duì)數(shù)尺度,描述一組連續(xù)性資料的變化速度及趨勢。,直方圖,5、直方圖:用面積表示連續(xù)性變化的頻數(shù)資料。,散點(diǎn)圖,散點(diǎn)圖:用點(diǎn)的密集度和趨勢表示兩種現(xiàn)象的關(guān)系。 多用于相關(guān)分析時(shí)。,統(tǒng)計(jì)地圖,(7):描述某種現(xiàn)象的

7、地域分布,第三節(jié) 計(jì)量資料的統(tǒng)計(jì)描述,常用方法有兩種: 1、統(tǒng)計(jì)圖表 2、集中趨勢和離散趨勢指標(biāo),一、頻數(shù)分布表,1、編制 a 求極差 R=max-min b 劃組段 確定組數(shù) 、確定組距i(i=R/組數(shù))、 確定上下限 c 歸組并統(tǒng)計(jì)頻數(shù) 2、作用: a 描述資料的分布特點(diǎn)。 b 觀察集中、離散趨勢。 c 便于發(fā)現(xiàn)特大、特小的可疑值。 d 便于統(tǒng)計(jì)計(jì)算。,某市7歲男孩坐高頻數(shù)分布表,續(xù),3、分布的類型 對(duì)稱分布: 偏態(tài)分布:正偏態(tài)、負(fù)偏態(tài),二、集中趨勢,1、算術(shù)均數(shù)(簡稱均數(shù)) 描述一組數(shù)據(jù)在數(shù)量上的平均水平 。 適用于正態(tài)或近似正態(tài)分布的資料 計(jì)算方法:直接法、加權(quán)法,加權(quán)法,132名高知

8、血清總膽固醇均數(shù)、標(biāo)準(zhǔn)差計(jì)算 血清膽固醇(mmol/L) X f fx fx2 3.0 3.25 3 9.75 31.69 3.5 3.75 6 22.50 84.38 4.0 4.25 20 85.00 361.25 4.5 4.75 22 104.50 496.38 5.0 5.25 31 162.75 854.44 5.5 5.75 26 149.50 859.62 6.0 6.25 18 112.50 703.12 6.5 6.75 5 33.75 227.81 7.0 7.25 1 7.25 52.56 合計(jì) 132 687.50 3671.25 X=fx/ f=687.50/132

9、=5.21mmol/L S= ( fx2 ( fx) 2/n)/(n1)= (3671.25687.5 2 /132)/(1321) =0.83mmol/L,2、幾何均數(shù)G,描述對(duì)數(shù)正態(tài)分布或數(shù)據(jù)成倍數(shù)變化資料的平均水平。 適用于原始分布不對(duì)稱,但經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的資料,如血清抗體滴度資料。,中位數(shù),3、中位數(shù)M ,P50 (注意與百分位數(shù)的關(guān)系) 一組按大小排列的資料中處于中間位置的數(shù)值. 適用于任何分布的計(jì)量資料,但較粗糙。 方法:直接法 頻數(shù)表法,三、離散趨勢,甲 26 28 30 32 34 乙 24 27 30 33 36 丙 26 29 30 31 34 三組資料均數(shù)相同,但

10、分散度不同。 描述資料分散度的常用指標(biāo): 極差R、方差2 、標(biāo)準(zhǔn)差、 四分之一間距Q1/4及變異系數(shù)CV%。,標(biāo)準(zhǔn)差,計(jì)算 應(yīng)用: 1、描述資料的離散程度,反映均數(shù)對(duì)變量值 的代表性,標(biāo)準(zhǔn)差越大,代表性越差。 2、計(jì)算變異系數(shù)和標(biāo)準(zhǔn)誤。 3、估計(jì)頻數(shù)的分布情況及指標(biāo)的正常值范圍 NR,變異系數(shù),CV%用于兩組資料比較變異程度,但存在下列情況之一時(shí): a 資料的單位不一樣 b 資料的均數(shù)相差太大,練習(xí),某醫(yī)科大學(xué)抽查了100名健康女大學(xué)生的血清總蛋白含量(g/L),檢查結(jié)果如下: 74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 79.5 75.6 75.0 78.

11、8 72.0 72.0 72.0 74.3 75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 75.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 74.0 72.0 76.5 74.3 76.5 77.6 67.3 72.0 73.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 75.8 73.5 75.0 72.7 70.4 77.2 68.8 67.3 75.8 73.5 75.0 72.7 73.5 72.7 81.6 73.

12、5 75.0 72.7 70.4 76.5 72.7 77.2 84.3 75.0 71.2 71.2 69.7 73.5 70.4 75.0 72.7 67.3 70.3 76.5 73.5 78.0 68.0 73.5 68.0 73.5 68.0 74.3 72.7 73.7 試回答以下問題: 1.這是總體還是樣本資料? 2.上述資料的觀察單位是什么?是數(shù)值變量還是分類變量? 3.怎樣對(duì)這樣一個(gè)資料(分布規(guī)律)進(jìn)行簡單描述?,第四節(jié) 正態(tài)分布,一、正態(tài)分布的概念和特征 1、概念 是概率的連續(xù)性分布,中間高,兩邊低,左右 對(duì)稱,其曲線下的面積分布符合一定規(guī)律性。 常見的如: A 正常人的某

13、些生理、生化指標(biāo)值的頻數(shù)分布,如身 高、紅細(xì)胞數(shù)、血糖等。 B 實(shí)驗(yàn)室里對(duì)同一樣品多次重復(fù)測定結(jié)果的頻數(shù)分布。 C 從正態(tài)或近似正態(tài)分布的總體中隨機(jī)抽取的樣本均 數(shù)的頻數(shù)分布。,正態(tài)分布圖形,特征,2、特征 A 曲線形狀中間高,兩邊低,左右對(duì)稱。 B 曲線隨X絕對(duì)值的逐漸增大而逐漸接近橫軸,但不會(huì)與 橫軸相交。 C 曲線的形狀和位置分別由標(biāo)準(zhǔn)差和均數(shù)兩個(gè)參數(shù)決定。 D 曲線下與橫軸相交的面積分布有規(guī)律性: 總面積為1; 1 范圍內(nèi)的面積占68.27% 1.96 范圍內(nèi)的面積占95.00% 2.58 范圍內(nèi)的面積占99.00%,面積的計(jì)算,二、標(biāo)準(zhǔn)正態(tài)分布,每一個(gè)正態(tài)分布曲線的形狀和位置各不相同

14、,但各個(gè)系數(shù)(u值)所對(duì)應(yīng)的面積是不變的, u=1, p=68.27% u=I.96,p=95.00% u=2.58,p=99.00% u=1.5, P= u=2, P= 根據(jù)這一點(diǎn),可以制一張可供不同的、共同適應(yīng)的面積分 布表。這張表所對(duì)應(yīng)的曲線稱為標(biāo)準(zhǔn)正態(tài)分布曲線N(0、1),而 任何一條正態(tài)分布曲線都可經(jīng)過u轉(zhuǎn)換成為N(0、1)。 U轉(zhuǎn)換公式:由 u =X1,X2 u=(X),續(xù),經(jīng)變換后,對(duì)于服從N(、)的資料,均可借助標(biāo)準(zhǔn)正態(tài)曲線下面積分布表估計(jì)任意(X1,X2)范圍內(nèi)的頻率。 例:某地男孩身高x=120.0cm,S=4.7cm,現(xiàn)有一男孩身高130cm,則當(dāng)?shù)乇人叩哪泻⒂卸嗌伲?

15、U=(130-120)/4.7=2.13 查標(biāo)準(zhǔn)正態(tài)曲線下面積分布表,u2.13所對(duì)應(yīng)的面積為0.0166,即當(dāng)?shù)厣砀咴?30cm以上的男孩占1.66%。,應(yīng)用,三、正態(tài)分布的應(yīng)用 a 估計(jì)頻數(shù)分布 b 制定參考值范圍(NR) 即絕大多數(shù)正常人某指標(biāo)所在的范圍。 絕大多數(shù) 正常人 樣本量 單雙側(cè)確定 c 質(zhì)量控制 d 統(tǒng)計(jì)處理方法的基礎(chǔ)。,醫(yī)學(xué)參考值的制定,四、醫(yī)學(xué)參考值的制定 1、概念:大多數(shù)正常人的解剖、生理、生化等數(shù)據(jù)的波動(dòng)范圍。最常用的是95%參考值范圍。 2、原則及步驟 (1)確定正常人 (2)確定樣本含量 不少于100例(120) (3)選定范圍 取決于資料的性質(zhì)和研究目的 (4)

16、決定單雙側(cè) 取決于指標(biāo)的特性 (5)判斷是否按性別、年齡等因素分組 (6)根據(jù)資料特點(diǎn)選擇具體方法(正態(tài)法、百分位數(shù)法),第五節(jié) 總體均數(shù)的估計(jì)和假設(shè)檢驗(yàn),一、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤 1、標(biāo)準(zhǔn)誤的意義 已知1000名18歲女生的身高=160.00cm,=5.00cm,先從該 總體中隨機(jī)抽樣,每次抽100人,共抽K次,得K個(gè)樣本均數(shù)和標(biāo)準(zhǔn) 差如下: X1=162.30cm, S1=4.12cm X2=160.32cm,S2=4.85cm X3=159.67cm,S3=5.04cm X4=161.48cm, S4=5.21cm X5=159.30cm, S5=4.98cm XK=162.30cm,

17、 SK=4.12cm X6 X5 X3 160 X2 X4 X1,標(biāo)準(zhǔn)誤計(jì)算,標(biāo)準(zhǔn)誤反映了樣本均數(shù)與總體均數(shù)之間的差異,說明均數(shù)抽樣誤差的大小。 2、計(jì)算 X = /n ??傮w SX = S /n 。樣本 從公式中可以再次得到抽樣誤差的特點(diǎn): 可以計(jì)算,可以控制,但不能消滅。 3、標(biāo)準(zhǔn)誤的應(yīng)用: (1)、描述抽樣誤差的大小。 (2)、估計(jì)總體均數(shù)的可信區(qū)間。 (3)、作假設(shè)檢驗(yàn)。,標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的比較,標(biāo)準(zhǔn)差 標(biāo)準(zhǔn)誤 意義 表示個(gè)體觀察值間的變異, 表示樣本均數(shù)間的變異程 說明觀察值X圍繞均數(shù) 度,說明樣本均數(shù)圍繞總 分散程度的指標(biāo). 體均數(shù)的分散程度的指標(biāo) 計(jì)算公式不同 應(yīng)用1表示個(gè)體觀察值

18、間的變異 1表示樣本均數(shù)間的變異程 不同 程度. 度,描述抽樣誤差的大小. 2計(jì)算標(biāo)準(zhǔn)誤 2做假設(shè)檢驗(yàn) 3估計(jì)正常值范圍 3估計(jì)可信區(qū)間,二、t 分布,在一定條件下,樣本均數(shù)的分布也是正態(tài)分布,也可經(jīng)u轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布, u =(X-)/X , 但實(shí)際中X 并不知,多用S X代替,則 t =(X-)/SX 。 無數(shù)個(gè)t值構(gòu)成了t 分布。 t分布多用于總體均數(shù)的區(qū)間估計(jì)和t檢驗(yàn)。,T分布圖形,特點(diǎn),1、t分布的特點(diǎn) A 以0為中心,中間高,兩邊低,左右對(duì)稱。 B 形狀由自由度(v)決定,v 越大,曲線越高聳,越接近標(biāo)準(zhǔn)正態(tài)分布。但v為時(shí),t 分布便成為u分布。 2、t分布曲線下的面積分布(t

19、界值表),三、總體均數(shù)的估計(jì),即用樣本指標(biāo)值估計(jì)總體指標(biāo)值。 方法:點(diǎn)值估計(jì)、區(qū)間估計(jì)。 點(diǎn)值估計(jì) 可信區(qū)間(CI):按預(yù)先給定的概率確定的包含未知總體參數(shù)的可能范圍。 預(yù)制的概率1-稱為可信度,一般取95%。 95%CI的確切含義是:由樣本均數(shù)確定的總體均數(shù)所在范圍包含總體均數(shù)的可能性為95%。 CI的兩個(gè)要素:準(zhǔn)確度和精密度,可信區(qū)間的計(jì)算,A、 未知,按t分布估計(jì) 1、雙側(cè)CI: P(t/2, t t/2,)=1- t/2,(x)/(S/n)t/2, 即x-t/2,S/nx +t/2,S/n 2、單側(cè)CI: x +t,S/n 或x -t,S/n,續(xù),B 已知,或未知,但n足夠大(n 50

20、),按 u分布估計(jì) 1、已知: x-u/2,/nx +u/2, /n 2、未知,但n足夠大(n50): x -u/2,S/nx +u/2,S/n 注意:均數(shù)的可信區(qū)間和參考值范圍是不同的兩個(gè)概念。,四、假設(shè)檢驗(yàn),1、假設(shè)檢驗(yàn)的基本思想和作用 為研究某山區(qū)的成年男子的脈搏均數(shù)是否高于一般成年男子脈搏均數(shù),某醫(yī)生在一山區(qū)隨機(jī)抽查了25名健康成年男子,得其脈搏均數(shù)x為74.2次/分,標(biāo)準(zhǔn)差為6.0次/分。根據(jù)大量調(diào)查已知一般健康成年男子脈搏均數(shù)為72次/分,能否據(jù)此認(rèn)為該山區(qū)成年的脈搏均數(shù)高于一般成年男子的脈搏均數(shù)0? 由資料已知樣本均數(shù)與總體均數(shù)不等,原因有二: 1)是兩者非同一總體,即兩者間的差

21、異由地理氣候等因素造成; 2)是兩者為同一總體,即兩者間的差異由抽樣誤差造成。,續(xù),利用反證法思想,從 = 0出發(fā),間接判斷是否 0 。 而 = 0是否成立,看由抽樣誤差造成的可能性有多大。 如果x與0接近,其差別可用抽樣誤差解釋,可認(rèn)為x來自于總體0;如果x與0相差甚遠(yuǎn),其差別不宜用抽樣誤差解釋,則懷疑x來自于總體0 。那么x與0相差多大算是由抽樣誤差造成的呢? 可通過計(jì)算t 值判斷,t =(x )/SX。如果x與0相差甚遠(yuǎn),則t 值就大,其差別由抽樣誤差解釋的可能性P就小,當(dāng)P小于或等于預(yù)先規(guī)定的概率,則有理由 = 0認(rèn)為可能不成立,其對(duì)立面 0 成立。,2、基本步驟,1)建立檢驗(yàn)假設(shè),確

22、定檢驗(yàn)水準(zhǔn)和單雙側(cè)。 2)選定檢驗(yàn)方法,計(jì)算統(tǒng)計(jì)量。 3)確定P值,做出結(jié)論。 P:a 從H0規(guī)定的總體中隨機(jī)抽得等于及大于(或等于及小于)現(xiàn)有統(tǒng)計(jì)量(如t 值)的概率。 b 被比較事物間的差別由抽樣誤差造成的可能性。 Pa,則拒絕H0 ,接受H1,差別有統(tǒng)計(jì)學(xué)意義。 Pa,則不拒絕H0 ,差別無統(tǒng)計(jì)學(xué)意義。,3、注意事項(xiàng):,A 資料之間具有可比性。 B 根據(jù)資料特點(diǎn)選擇不同的方法。 C 在計(jì)算統(tǒng)計(jì)量之前,根據(jù)研究要求選定檢驗(yàn)水準(zhǔn),根 據(jù)專業(yè)知識(shí)選定單雙側(cè)。 D 正確理解“顯著性差異”的含義 假設(shè)檢驗(yàn)的結(jié)果只 反映性質(zhì)的差異,而不能說明數(shù)量上的大?。恢徽f明 是否有統(tǒng)計(jì)學(xué)意義,而不能說明專業(yè)上的

23、差異大小。 只有把統(tǒng)計(jì)結(jié)論和專業(yè)知識(shí)有機(jī)結(jié)合,才能得出恰當(dāng)?shù)膶I(yè)結(jié)論。 E 其結(jié)論是一種概率性的推斷,不管是拒絕0還是接受1,都有可能發(fā)生錯(cuò)誤,故不能絕對(duì)化。,續(xù),F 結(jié)論要書寫完整 統(tǒng)計(jì)量值、概率大小、檢驗(yàn)水準(zhǔn)、單雙側(cè)等 H0:“拒絕”或“不拒絕”, H1:“接受” 例:t=1.247,v = 9 ,0.2雙p0.4,按=0.05的水平,p,不拒絕H0,無統(tǒng)計(jì)學(xué)意義(統(tǒng)計(jì)結(jié)論),根據(jù)本調(diào)查還不能認(rèn)為兩種方法有差異(專業(yè)結(jié)論)。,t檢驗(yàn),4、t檢驗(yàn)和u檢驗(yàn) (1)t檢驗(yàn) a 條件: n較小時(shí),樣本取自正態(tài)總體; 兩樣本方差齊性。若不齊,用t檢驗(yàn),如Cohran法、Cox法、Satterthwa

24、ite法。 (但在實(shí)際應(yīng)用中,與條件略有偏離,只要其分布為單峰對(duì)稱分布,也無大礙) b 種類: 一個(gè)樣本和總體的比較 配對(duì)t檢驗(yàn) 兩個(gè)樣本的t檢驗(yàn)(成組t檢驗(yàn)) a 方差齊性的情況 b 方差不齊的情況,用t檢驗(yàn) c 兩樣本幾何均數(shù)比較,u檢驗(yàn),(2)u檢驗(yàn) 條件: n(n50)較大,或已知。 種類: 一個(gè)樣本和總體的比較 兩個(gè)樣本的u檢驗(yàn)(成組u檢驗(yàn)),五、型錯(cuò)誤和型錯(cuò)誤,1、型錯(cuò)誤:拒絕了實(shí)際上成立的H0而犯的錯(cuò)誤。其大小相當(dāng)于??捎袉坞p側(cè)。 =0.05,當(dāng)拒絕H0時(shí),則理論上100次檢驗(yàn)中平均有5次發(fā)生這樣的錯(cuò)誤。 2、型錯(cuò)誤:接受了實(shí)際上不成立的H0而犯的錯(cuò)誤。其大小用表示。的大小不可知

25、,一般越大,則越小,要同時(shí)減少這兩類錯(cuò)誤,只有增加樣本數(shù)量。只有單側(cè)。 1-稱為檢驗(yàn)效能,即當(dāng)兩者確有差異,按規(guī)定檢驗(yàn)水準(zhǔn)所能發(fā)現(xiàn)該差異的能力,六、可信區(qū)間與假設(shè)檢驗(yàn)的區(qū)別和聯(lián)系,1、可信區(qū)間用于說明量的大小,而假設(shè)檢驗(yàn)用于推斷質(zhì)的不同。 2、可信區(qū)間也能回答假設(shè)檢驗(yàn)的問題。 若可信區(qū)間包含了H0,則不拒絕H0;若不包含H0,則接受H1。 3、可信區(qū)間比假設(shè)檢驗(yàn)可提供更多的信息。不但回答是否有統(tǒng)計(jì)學(xué)意義,還能提示差別是否有專業(yè)意義。(詳見高等醫(yī)學(xué)院校衛(wèi)生統(tǒng)計(jì)學(xué)第四版P46)。,第六節(jié) 方差分析,一、基本思想 方差分析的基本思想是把變量值之間的差異進(jìn)行分類,即組間變異和組內(nèi)變異,通過比較兩者的關(guān)

26、系,推論組間差異是否具有統(tǒng)計(jì)學(xué)意義。,例題分析,喂養(yǎng)飼料中含鋁量不同的家兔血清含鋁量 對(duì)照組 低鋁組 高鋁組 340(ug/L) 1700 (ug/L) 5900 (ug/L) 73.7 93.4 236.8 Xij 40.6 109.8 290.1 103.8 77.4 171.5 85.2 101.6 267.1 60.7 85.2 201.7 X X 364.0 467.4 1167.2 1998.6 n 5 5 5 15 X 72.8 93.48 233.44 133.24 X2 28798.02 44351.96 281669.8 354819.78,續(xù),如本例,15個(gè)變量值之間存在

27、差異,原因有兩個(gè): 一是個(gè)體差異引起的抽樣誤差,它存在于組間,也存在于組內(nèi); 二是研究因素引起的差異,它存在于不同的組間。 如果飼料中含鋁量的多少對(duì)血清中的含鋁量沒有影響,那么,組間、組內(nèi)的差異都由抽樣誤差引起,也就是說組間變異和組內(nèi)變異相等。 如果飼料中含鋁量的多少對(duì)血清中的含鋁量有影響,那么,差異除了由抽樣誤差引起外,各個(gè)組間還存在試驗(yàn)因素引起的差異,也就是說組間變異大于組內(nèi)變異。,續(xù),方差分析中,資料之間的變異的大小用均方(均方的本質(zhì)就是方差)來表示,符號(hào)為MS,組間變異和組內(nèi)變異的大小關(guān)系用它們的比值即F來表示, F= MS組間 / MS組內(nèi) 若組間無差別,F(xiàn)值應(yīng)接近于1,反之,F(xiàn)值將

28、明顯大于1。 那么要達(dá)到多大程度才有統(tǒng)計(jì)學(xué)意義呢?通過查F界值表可以確定F值大小的統(tǒng)計(jì)學(xué)意義。,續(xù),本例方差分析的結(jié)果見下表: 方差分析結(jié)果 變異來源 SS v MS F P 總變異 88526.316 14 組間變異 76369.456 2 38184.728 37.7 0.01 組內(nèi)變異 12156.86 12 1013.072 SS: 相應(yīng)變量值的離均差平方和。 SS總= SS組間+SS組內(nèi)=X2 C C=(X)2 / N V: 自由度。 V總=N1 V組內(nèi)=Nk V組間=k1 (k處理組數(shù)),續(xù),MS:SS / v F=MS組間 / MS組內(nèi)=37.7 查F界指表,F(xiàn) 0.05(2,1

29、2)= 3.88 , F 0.01(2,12)= 6。93, FF 0.01(2,12),所以P0.01,根據(jù)=0.05,P,拒絕H0,接受H1,即根據(jù)本研究可認(rèn)為飼料中含鋁量會(huì)影響到血清的含鋁量。 注意:要說明哪些組間有差別,那些沒有差別,需進(jìn)一步作兩兩比較。,二、方差分析的條件,方差分析適用于兩組以上計(jì)量資料(k2)的比較,k=2時(shí),方差分析與t檢驗(yàn)時(shí)等價(jià)的,F(xiàn)=t2。 1、各次觀察獨(dú)立,即任何兩個(gè)觀察值之間均不相關(guān)。 2、每一水平下的觀察值分別服從相應(yīng)的正態(tài)分布。 3、各總體的方差相等,即具有方差齊性。,三、方差分析的種類,1、完全隨機(jī)設(shè)計(jì)的單因素方差分析 成組設(shè)計(jì)中只有一個(gè)研究因素,該

30、因素有k個(gè)水平,研究目的是比較不同水平的研究因素的效果是否具有統(tǒng)計(jì)學(xué)差異。如上例。,2,2、隨機(jī)區(qū)組設(shè)計(jì)的兩因素方差分析(配伍組設(shè)計(jì)) 不僅考慮研究因素的影響,還考慮到研究對(duì)象遺傳特征的差 異,因此比前者更容易檢驗(yàn)出處理組之間的差別,提高了檢驗(yàn)效率。 它把資料之間的變異分為三塊: 總變異 = 處理變異 + 隨機(jī)變異 + 區(qū)組間變異,例題,三種不同濃度的黃曲霉素給大白鼠灌腸2周後體重增長值(g) 區(qū)組 黃曲霉素的濃度(mg/kg) 合計(jì) 0 9 18 1 48 26 25 99 2 50 46 29 125 3 58 49 14 93 4 52 20 12 60 5 30 35 16 81 X

31、238 176 44 458 n 5 5 5 15 X 47.6 35.2 8.8 30.5 X2 11772 6818 2062 20652,例題分析結(jié)果,方差分析結(jié)果 變異來源 SS v MS F P 總變異 6667.733 14 處理變異 3926.933 2 1963.47 7.93 0.05 區(qū)間變異 761.066 4 190.27 0.77 0.05 隨機(jī)變異 1979.734 8 247.47 V總= N1 V區(qū)間= n1 V處理 = k1 V誤差= (k1)(n1) 查F界值表,F(xiàn) 0.05(2,8)=4.46 ,F(xiàn) 0.01(2,8)= 8.65,F(xiàn) 0.01(2,8)F

32、處理F 0.05(2,8),所以0.01P處理0.05,根據(jù)=0.05,P,拒絕H0,接受H1,即根據(jù)本研究可認(rèn)為不同濃度的黃曲霉素對(duì)體重增長有影響。,例題分析結(jié)果2,F 0.05(4,12)= 3.84 , F 0.01(4,12)= 7.01, F區(qū)組F0.05(4,12),所以P區(qū)組0.05,根據(jù) =0.05,P區(qū)組,不拒絕H0,即根據(jù)本研究可認(rèn)為5個(gè)區(qū)組的大白鼠體重增長無差別。說明區(qū)組的劃分在本研究中不需要,反而降低了檢驗(yàn)效應(yīng)。所以把區(qū)間變異和隨機(jī)變異合并成組內(nèi)變異: SS 組內(nèi)= 761.066 + 1979.734 =2740.800 V組內(nèi)= 4 + 8 =12 MS 組內(nèi)= 2

33、740.800/ 12 =228.4 F處理 =1963.47 /228.4 = 8.51,續(xù),查F界值表,F(xiàn)0.05(2,12)= 3.88 , F 0.01(2,12)= 6.93, F處理F 0.01(2,12),所以P處理0.01,根據(jù)=0.05,P,拒絕H0,接受H1,即根據(jù)本研究可認(rèn)為不同濃度的黃曲霉素對(duì)體重增長有影響。 從兩個(gè)P處理的的范圍可以發(fā)現(xiàn),當(dāng)區(qū)組之間無統(tǒng)計(jì)學(xué)差異時(shí),反而是成組設(shè)計(jì)的方差分析的檢驗(yàn)效應(yīng)更高。所以并非是任何場合都需要區(qū)組設(shè)計(jì)。,三、多個(gè)樣本均數(shù)間的兩兩比較,方差分析的結(jié)果提供了多個(gè)均數(shù)間差別的總的信息,但尚未提供各組間差別的具體信息,即尚未指出哪幾個(gè)組均數(shù)之

34、間的差別具有或不具有統(tǒng)計(jì)學(xué)意義。為得到這方面的信息,可進(jìn)行多個(gè)樣本均數(shù)間的兩兩比較。 方法有: 1、最小有意義差異t檢驗(yàn)(LSD-t檢驗(yàn)) 適用于k組中某一對(duì)或某幾對(duì)在專業(yè)上有特殊意義的均數(shù)的差值的總體水平是否為0。統(tǒng)計(jì)量為t,計(jì)算公式與q檢驗(yàn)同,自由度為誤差自由度,查t 值表。 2、Dunnett-t檢驗(yàn) 適用于k1個(gè)試驗(yàn)組和一個(gè)對(duì)照組均數(shù)差別的多重比較。 統(tǒng)計(jì)量為t,查Dunnett-t 值表。,續(xù),3、SNK-q檢驗(yàn) 適用于多個(gè)樣本均數(shù)間每兩個(gè)均數(shù)的比較。 統(tǒng)計(jì)量為q,自由度為比較組數(shù)和誤差自由度,查q值表。 以第一例為例(詳見投影膜)。 XA-XB q = - MS誤差/2(1/nA+

35、1/nB)1/2 4、新復(fù)極差法 適用于對(duì)照組與各處理組的比較。 XAX對(duì)照 q = - MS誤差/2(1/nA+1/n對(duì)照)1/2,第七節(jié) 分類資料的統(tǒng)計(jì)描述,分類資料的統(tǒng)計(jì)描述:統(tǒng)計(jì)圖表 絕對(duì)數(shù) 相對(duì)數(shù),一、常用的相對(duì)數(shù),1、率:說明某現(xiàn)象發(fā)生的頻率或強(qiáng)度。 率 = 發(fā)生某現(xiàn)象的觀察單位數(shù) / 可能發(fā)生某現(xiàn)象的觀察單位 數(shù) K K 常有百分率、千分率、萬分率、十萬分率等。 選擇原則: 習(xí)慣用法 使得到的數(shù)字一般保留12位整數(shù),以便閱讀。,2、構(gòu)成比,說明某一事物內(nèi)部各組成部分所占的比重。 構(gòu)成比 = 某一組成部分的觀察單位數(shù) / 該事物各組成 部分的觀察單位總數(shù)100%,3、相對(duì)比,說明兩

36、事物之間的對(duì)比關(guān)系。 相對(duì)比 = A事物 / B事物 A、B可以是絕對(duì)數(shù),也可是相對(duì)數(shù); 計(jì)算結(jié)果可是小數(shù),也可是倍數(shù)。 常用的有三種: (1)對(duì)比指標(biāo):同類事物指標(biāo)的比值。如性別比。 (2)關(guān)系指標(biāo):非同類事物指標(biāo)的比值。 如醫(yī)護(hù)人員與病床數(shù)之比。 (3)計(jì)劃完成指標(biāo):,二、注意事項(xiàng),1、分母不可過小。 2、不能以比代率。 某化工廠慢支患病與工齡的關(guān)系 工齡 檢查人數(shù) 患者數(shù) 百分比(%) 患病率(%) 1 340 17 11。56 5。00 5 254 30 20。41 11。81 10 432 73 49。66 16。90 15 136 27 18。37 19。85 合計(jì) 1162 14

37、7 100。00 12。65 3、如何計(jì)算合計(jì)率(總率)。 4、比較相對(duì)數(shù)時(shí),注意資料的可比性。 5、樣本率的比較要進(jìn)行假設(shè)檢驗(yàn)。,三、標(biāo)準(zhǔn)化法,甲乙兩醫(yī)院某傳染病各型治愈率比較 病型 甲院 乙院 病人數(shù) 治愈數(shù) 治愈率(%) 病人數(shù) 治愈數(shù) 治愈率(%) 普通型 300 180 60。0 100 65 65。5 重型 100 40 40。0 300 135 45。0 爆發(fā)型 100 20 20。0 100 25 25。0 合計(jì) 500 240 48。0 500 225 45。0 這種分率和總率之間的矛盾是由兩醫(yī)院內(nèi)部病人的病情構(gòu)成不同引起的,這時(shí)要用總率來比較它們的治愈率水平的高低,顯然不行

38、,因?yàn)槌藘舍t(yī)院的治療水平不同的影響外,還有病情的影響。所以要比較甲乙兩醫(yī)院某傳染病治愈率,要先消除病情構(gòu)成的影響,即選取一種共同內(nèi)部構(gòu)成作為計(jì)算總率的基礎(chǔ),這種方法稱為率的標(biāo)準(zhǔn)化法,這樣計(jì)算得到的率稱為標(biāo)準(zhǔn)化率(標(biāo)化率、調(diào)整率)。,根據(jù)資料不同,有直接法和間接法兩種。 直接法 步驟: 1、選取一個(gè)標(biāo)準(zhǔn),即一個(gè)標(biāo)準(zhǔn)的內(nèi)部構(gòu)成,可以是標(biāo)準(zhǔn)人口數(shù),也可是標(biāo)準(zhǔn)人口構(gòu)成比,還可以用標(biāo)準(zhǔn)陽性率(間接法)。 標(biāo)準(zhǔn)來源: A 具有代表性的、較穩(wěn)定的、數(shù)量較大的人群作標(biāo)準(zhǔn)。如全國的、全省的或本地區(qū)的數(shù)據(jù),時(shí)間最好與被標(biāo)化資料一致或較接近。 B 以相比資料本身數(shù)據(jù)為標(biāo)準(zhǔn),如甲院的數(shù)據(jù)、或醫(yī)院的數(shù)據(jù)、或兩院合并的

39、數(shù)據(jù)。 2、計(jì)算標(biāo)化率。,直接法,續(xù),例:以甲院數(shù)據(jù)為標(biāo)準(zhǔn)計(jì)算乙院治愈率的標(biāo)化率(直接法) 乙院某傳染病標(biāo)化治愈率計(jì)算 病型 標(biāo)準(zhǔn)病人數(shù) 原治愈率(%) 預(yù)期治愈人數(shù) 普通型 300 65。0 195 重型 100 45。0 45 爆發(fā)型 100 25。0 25 合計(jì) 500 - 265 乙院某傳染病標(biāo)化治愈率= 265 / 500 = 0。53 = 53。0% 所以在共同的構(gòu)成下,甲院治愈率為48%,乙院治愈率為53%,因此對(duì)該鐘傳染病的治療率是乙院較高.,間接法: 間接法是在不知道被比較兩者的分率,或某些組的調(diào)查人數(shù)太少,分率不可靠時(shí)采用的方法,如下例: 已知甲地死亡總數(shù)為845人,乙地為

40、679人,以及兩地各年齡組人口數(shù),比較兩地死亡水平。 甲乙兩地死亡標(biāo)化率計(jì)算 年齡組 標(biāo)準(zhǔn)死亡率 甲地 乙地 (%) 人數(shù) 預(yù)期死亡數(shù) 人數(shù) 預(yù)期死亡數(shù) 0 62。6 9300 582 4800 300 5 3。9 12200 48 6600 26 20 6。5 19000 124 35300 230 40 12。7 7600 97 2800 36 60 41。3 1900 78 500 21 合計(jì) 15。4 50000 929 50000 613,間接法,計(jì)算標(biāo)化死亡比(SMR): SMR = 實(shí)際死亡數(shù) / 預(yù)期死亡數(shù) SMR1,說明標(biāo)化率大于標(biāo)準(zhǔn)組 SMR1,說明標(biāo)化率小于標(biāo)準(zhǔn)組 甲地S

41、MR = 845 929 =0。91 甲地標(biāo)化死亡率 = 15。4%0。91 = 14。03% 乙地SMR = 679 613 =1。14 乙地標(biāo)化死亡率 = 15。4%1。14 = 17。58%,1、根據(jù)資料選用相應(yīng)的方法。 2、標(biāo)化率的大小隨選定的標(biāo)準(zhǔn)的不同而不同。 3、率的標(biāo)化的目的在于統(tǒng)一內(nèi)部構(gòu)成,是資料具有可比性,以便合理的比較。標(biāo)化率的差別,只反映資料間率的高低、大小的相對(duì)關(guān)系,并不反映資料間率的實(shí)際水平。 4、如不計(jì)算標(biāo)化率,而分別比較各組的分率,也可得到正確結(jié)論,但不能比較總率的大小。 5、被標(biāo)化的樣本率若要進(jìn)一步推斷總體結(jié)果,還需對(duì)標(biāo)化后的樣本率作假設(shè)檢驗(yàn)。,注意事項(xiàng),一、率

42、的抽樣誤差 一般地,從一個(gè)陽性率為的總體中隨機(jī)抽取含量為n的樣本,則樣本中的陽性數(shù)X服從二項(xiàng)分布B(n,),樣本陽性率p與總體率之間也存在抽樣誤差,其大小用樣本率的標(biāo)準(zhǔn)差來表示,即率的標(biāo)準(zhǔn)誤。 總體標(biāo)準(zhǔn)誤 s=(1)/ n 樣本標(biāo)準(zhǔn)誤 Sp =p(1p)/ n,第八節(jié) 總體率的估計(jì)和卡方檢驗(yàn),1、查表法 適用:n50時(shí) 2、近似正態(tài)法 適用條件:n50,p和(1p)均不太?。ú豢拷?.1和0。9)時(shí),樣本率的分布近似正態(tài)分布,可按正態(tài)分布原理估計(jì)總體率的可信區(qū)間。 95%CI:p 1。96 Sp 99%CI:p 2。58 Sp,二、總體率的估計(jì),1、直接計(jì)算概率進(jìn)行比較 2、u檢驗(yàn) 適用條件:

43、n50,p和(1p)均不太?。ú豢拷?.1和 0。9)時(shí),樣本率的分布近似正態(tài)分布。 3、2檢驗(yàn) 2檢驗(yàn)可用于 a 推斷多個(gè)樣本率或構(gòu)成比之間又無差別 b 兩種屬性或兩個(gè)變量之間有無關(guān)聯(lián)性 c 頻數(shù)分布的擬和優(yōu)度檢驗(yàn),三、率的假設(shè)檢驗(yàn),基本思想 吸煙者與不吸煙者的慢性支氣管炎患病率比較 分組 患病人數(shù) 未患病人數(shù) 合計(jì) 患病率(%) 吸煙者 43(33。86) 162(171。14) 205 (n1) 21。0 不吸煙者 13(22。14) 121(111。86) 134 (n2) 9。7 合計(jì) 56(m1) 283 (m2) 339(N) 16。5 紅色為實(shí)際數(shù)(A),藍(lán)色為理論數(shù)(T)。

44、假設(shè)吸煙與慢支之間無關(guān),則兩者總體的的患病率相同,暫時(shí)按合計(jì)率推算,即為16。5%。那么 T 11= n1m1 / N = 20556339 =33。86 T 12= n1m2/ N = 205283339= 171。14 T 21 = n2m1 / N = 13456339 = 22。14 T 22= n2m2/ N = 134283339 = 111。86,(1)四格表資料的2檢驗(yàn),續(xù),如果假設(shè)成立,那么,實(shí)際值和理論值的差值為0,否則它們相差很大。實(shí)際值和理論值之間的差距用2值表示。 2 =(AT) 2 / T 。基本公式 2 =(adbc) 2N /(a+b)(a+c)(b+c)(b+

45、d) 。四個(gè)表專用公式 由此可見,2 反映了實(shí)際數(shù)和理論數(shù)的吻合程度。若假設(shè)成立,則實(shí)際數(shù)和理論數(shù)的差別不會(huì)很大,出現(xiàn)大的2值的可能性很小。若P,就拒絕假設(shè);若P,則尚無理由拒絕它。,A 四格表資料指的是哪四個(gè)格子的數(shù)字(見有顏色 部分) B 2檢驗(yàn)的自由度V的計(jì)算 V= (R1)(C1) 四格表資料的自由度恒定為1。 C 四格表資料2 檢驗(yàn)的條件: 第一種情況:N40,且T均5,用普通2檢驗(yàn) 第二種情況:N40,但有1T5時(shí),用矯正2檢驗(yàn) 第三種情況:N40,或T1 時(shí),用確切概率法 D 當(dāng)P接近檢驗(yàn)水準(zhǔn)時(shí),不要輕易下結(jié)論。 E 在滿足各自條件的前提下, 2檢驗(yàn)與U檢驗(yàn)等價(jià), 2 值 = U

46、 2,注意:,例:有239份食品樣品,分別用熒光抗體法與常規(guī)培養(yǎng)法檢驗(yàn)沙門氏菌,結(jié)果如下: 熒光抗體法與常規(guī)培養(yǎng)法檢驗(yàn)結(jié)果 熒光抗體法 常規(guī)培養(yǎng)法 合計(jì) + - + 160 (a) 26 (b) 186 - 5 (c) 48 (d) 53 合計(jì) 165 74 239 a和d是結(jié)果相同的部分,c和b是結(jié)果不同部分,若兩種檢驗(yàn)方法效果相同,那么,理論上c = b ,但由于抽樣誤差的存在,對(duì)于樣本b不等于c的情況,需進(jìn)行假設(shè)檢驗(yàn)。 2= (bc)2/ (b+c) v = 1 。普通公式 2 = (1bc11) 2 / (b+c) v = 1 。矯正公式 b+c 40時(shí)可不矯正,b+c40時(shí)必須矯正。

47、,(2)配對(duì)四個(gè)表資料2檢驗(yàn),適用于 A 多個(gè)率的比較 B 多個(gè)構(gòu)成比的比較 C 雙向有序分類資料的關(guān)聯(lián)性檢驗(yàn),如 不同期次矽肺患者肺門密度級(jí)別分布 矽肺期次 肺門密度級(jí)別 合計(jì) + + + 43 188 14 245 1 96 72 169 6 17 55 78 合計(jì) 50 301 141 492 從資料看,肺門密度級(jí)別有隨著矽肺期次增加而增大的趨勢,即這兩個(gè)變量似乎有某種關(guān)聯(lián)。如果這些頻數(shù)在各格子里是均勻分布的,則表示兩個(gè)變量無關(guān)聯(lián)。,(3)RC表的2檢驗(yàn),續(xù),注意: A: RC表的2檢驗(yàn)適用于以下條件 T1;并且1T5的格子數(shù)不超過總格子數(shù)的1/5。 若條件不滿足,可有三種方法處理: a

48、 增加樣本數(shù) b 刪除理論數(shù)太小的行或列 c 將性質(zhì)相近的行或列合并 B: 若結(jié)論是“差異具有統(tǒng)計(jì)學(xué)意義”,僅說明其中至少有一 組與其他組存在差異,是否各組兩兩之間均存在差異,還需進(jìn)一步作2 黃金分割檢驗(yàn)。 C: 在單項(xiàng)有序行列表中,若等級(jí)數(shù)大于3,用秩和檢驗(yàn)更適合。 D: 有些RC表資料不能用RC表的2檢驗(yàn)的,這種資料的特點(diǎn)是雙向有序等級(jí)分類,且分類屬性相同。(見新世紀(jì)教材醫(yī)學(xué)統(tǒng)計(jì)學(xué)第三版主編馬斌榮p96),第九節(jié) 秩和檢驗(yàn),前面講述的統(tǒng)計(jì)推斷方法,是在已知總體分布類型的基礎(chǔ)上,對(duì)總體參數(shù)進(jìn)行估計(jì)和檢驗(yàn),稱為參數(shù)統(tǒng)計(jì)。如t-T、u-T、F-T等均屬此類。 但在許多時(shí)候,有些資料并不符合參數(shù)統(tǒng)

49、計(jì)的要求,也不能通過數(shù)據(jù)轉(zhuǎn)換使其符合參數(shù)統(tǒng)計(jì)的條件,這時(shí)就需要一種不依賴總體分布類型,也不對(duì)總體參數(shù)進(jìn)行統(tǒng)計(jì)推斷的假設(shè)檢驗(yàn)方法,稱為非參數(shù)檢驗(yàn)。 多用于: 1、偏態(tài)分布或分布形式不明的計(jì)量資料。 2、有極大值或不確切值。 3、等級(jí)資料。 4、總體方差不齊。,優(yōu)缺點(diǎn),優(yōu)點(diǎn):非參數(shù)檢驗(yàn)適用范圍廣,且收集資料、統(tǒng)計(jì)分析也較簡單。其中最常用的是2檢驗(yàn)、秩和檢驗(yàn),及等級(jí)相關(guān)分析. 但其缺點(diǎn)也是很明顯的,對(duì)于適宜作參數(shù)統(tǒng)計(jì)的資料,若用非參數(shù)統(tǒng)計(jì)方法處理,常損失部分信息,即不夠精確,犯第二類錯(cuò)誤的可能性大于參數(shù)檢驗(yàn)。 。,一、配對(duì)資料差值的符號(hào)秩和檢驗(yàn)。(Wilcoxon配對(duì)法),用于計(jì)量配對(duì)比較的資料。,

50、十名健康人用離子交換法與蒸餾法測定尿汞值,編號(hào) 離子交換法 蒸餾法 差值 秩次 1 0。5 0。0 0。5 2 T+=26。5, 2 2。2 1。1 1。1 7 T-=18。5 3 0。0 0。0 0。0 - 4 2。3 1。3 1。0 6 5 6。2 3。4 2。8 8 6 1。0 4。6 -3。6 -9 7 1。8 1。1 0。7 3。5 8 4。4 4。6 -0。2 -1 9 2。7 3。4 -0。7 -3。5 10 1。3 2。1 -0。8 -5,1、建立假設(shè)及確定檢驗(yàn)水準(zhǔn) H0:差值總體水平為0。 H1:差值總體水平不為0。 =0。05 2、計(jì)算T值 (1)求差:算出每對(duì)差值 (2)

51、編秩:按差值的絕對(duì)值大小從小到大編秩,并冠以原差值的正負(fù)號(hào)。 A 若差值為0,可刪去不計(jì),不編秩。 B 若差值的絕對(duì)值相等,符號(hào)相反,則以平均秩次作為每一個(gè)差值的秩次,保留原差值符號(hào)。 C 若差值完全相等,則按原秩號(hào),不必平均。 (3)求秩和:將正負(fù)秩次分別相加,以秩和絕對(duì)值小則為T。本例T=18。5。 3、確定P值,判斷結(jié)果。 查配對(duì)比較的T界值表,得雙側(cè)P0。10,按=0。05水平不拒絕H0,故不能認(rèn)為兩種方法有差別。,例題,注意:配對(duì)的對(duì)子數(shù)不能少于6。 本法的基本思想:若H0成立,則樣本的正負(fù)秩和應(yīng)較接近于T值的均數(shù)n(n+1)/4,T值不會(huì)很小。若正負(fù)秩和相差懸殊,則T值特別小,則在

52、H0成立的情況下,由于抽樣誤差所至的可能性很小,當(dāng)P時(shí),拒絕H0。 隨著n增大,T的分布逐漸逼近均數(shù)為n(n+1)/4,方差為n(n+1)(2n+1)/24的正態(tài)分布。N50時(shí),可用u-T代替秩和檢驗(yàn)。 1Tn(n+1)/4 10。5 U= n(n+1)(2n+1)/24,基本思想,兩組小白鼠發(fā)癌後生存日數(shù) 試驗(yàn)組 對(duì)照組 生存日數(shù) 秩次 生存日數(shù) 秩次 10 9。5 2 1 N1=10 T1=170 12 12。5 3 2 N2=12 T2=83 15 15 4 3 15 16 5 4 16 17 6 5 17 18 7 6 18 19 8 7 20 20 9 8 23 21 10 9。5 90以上 22 11 11 12 12。5 13 14,二、成組設(shè)計(jì)兩樣本比較的秩和檢驗(yàn)(Wilcoxon法),1、編秩方法 將兩組數(shù)據(jù)分別從小到大排隊(duì),再將它們從小到大編秩,凡屬不同組的相同數(shù)據(jù)一律編為平均秩次,凡屬同組的相同數(shù)據(jù)按原秩次,可不必平均。 2、秩和 n1n2 時(shí),以樣本量較少組的秩和為T n1n2 時(shí),可取任意組秩和為T。本例T=170 3、確定P值 當(dāng)n120,n2n110時(shí)(n1為樣本量少者),可查兩組比較的T值表,得雙側(cè)P0。01。 若n120,n2n110時(shí)(n1為樣本量少者),即n1、n2較大時(shí),T分布逼近= n1(n1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論