




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、醫(yī)學(xué)統(tǒng)計(jì)學(xué)溫醫(yī)大公衛(wèi)學(xué)院黃陳平醫(yī)學(xué)實(shí)踐中遇到的統(tǒng)計(jì)學(xué)問題舉例(1)某中醫(yī)師對(duì)某方劑進(jìn)行改良,改良后的方劑治療某病患者30例,有效率為80%,原方劑治療30例,有效率為60%,問兩者有效率有無差別?醫(yī)學(xué)實(shí)踐中遇到的統(tǒng)計(jì)學(xué)問題舉例(2)某醫(yī)師用、和三種方案治療嬰幼兒貧血患者,治療一個(gè)月后,血紅蛋白的增加克數(shù)如下表,問三種治療方案對(duì)嬰幼兒貧血的療效是否相同?表. 三種方案治療后血紅蛋白增加量() 24 20 20 36 18 11 25 17 6 14 10 3 26 19 0 34 24 -1 23 4 5 醫(yī)學(xué)實(shí)踐中遇到的統(tǒng)計(jì)學(xué)問題舉例(3)在小學(xué)生的課間餐面包中添加賴氨酸,以研究其對(duì)兒童體重和
2、身高增長的影響,擬分析賴氨酸添加的最佳濃度和面包烤制的最佳條件。賴氨酸的濃度有五個(gè)水平:0.0%,0.2%,0.4%,0.6%,0.8%,面包烤制條件有兩個(gè)水平:甲和乙。如何設(shè)計(jì)和分析?醫(yī)學(xué)實(shí)踐中遇到的統(tǒng)計(jì)學(xué)問題舉例(4) 22例期非小細(xì)胞肺癌患者在不同日期經(jīng)隨機(jī)化分配到放療組和放化療聯(lián)合組,從緩解出院日開始隨訪,隨訪時(shí)間(月)如下,試比較放療和放化療聯(lián)合兩種治療方案的療效有無差別?放療組 1,2,3,5,6,9+,11,13,16,26,37+放化療聯(lián)合組 10,11+,14,18,22,22,26,32,38, 40+,42+醫(yī)學(xué)實(shí)踐中遇到的統(tǒng)計(jì)學(xué)問題舉例(5) 欲研究胃癌患者術(shù)后發(fā)生院內(nèi)
3、感染的影響因素,某醫(yī)生記錄了50名胃癌患者術(shù)后院內(nèi)感染情況,并調(diào)查了下列可能的影響因素: 年齡(歲)、手術(shù)創(chuàng)傷程度(分5等級(jí))、營養(yǎng)狀態(tài)(分3等級(jí))、術(shù)前預(yù)防性抗菌(分有無)、 白細(xì)胞數(shù)(109/L)、 腫瘤病理分級(jí)(19級(jí))。 欲篩選哪些因素是影響胃癌患者術(shù)后發(fā)生院內(nèi)感染的主要因素, 應(yīng)選擇何種統(tǒng)計(jì)分析方法?學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)的要求 最低要求:知道常見的統(tǒng)計(jì)學(xué)方法,會(huì)模仿著去應(yīng)用?;疽螅毫私庥嘘P(guān)統(tǒng)計(jì)方法的原理,能較熟練地運(yùn)用統(tǒng)計(jì)軟件,解決常見的統(tǒng)計(jì)學(xué)問題。較高要求: 對(duì)較復(fù)雜的統(tǒng)計(jì)學(xué)問題,能獨(dú)立提出系統(tǒng)的解決方案。醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件下載鏈接 66/sc8/page/myspace/course/
4、item-content.do?courseId=342&itemId=4452&wrap=0第一章 緒 論 什么是統(tǒng)計(jì)學(xué)? Whats statistics?運(yùn)用概率論和數(shù)理統(tǒng)計(jì)原理,研究數(shù)據(jù)收集、整理和分析的一門學(xué)科。 (目的是找出其特征或規(guī)律) 隨機(jī)試驗(yàn)與隨機(jī)事件生物醫(yī)學(xué)研究對(duì)象多屬于隨機(jī)事物,其觀察試驗(yàn)稱隨機(jī)試驗(yàn),觀察結(jié)果為隨機(jī)事件。隨機(jī)事件: 指在一定條件下可能發(fā)生、也可能不發(fā)生的事件,但事前不能確定。問題: 大量同質(zhì)隨機(jī)事件在統(tǒng)計(jì)上有無規(guī)律性? 統(tǒng)計(jì)分析時(shí),同質(zhì)觀察對(duì)象要達(dá)到一定數(shù)量實(shí)驗(yàn)過程孟德爾的豌豆雜交實(shí)驗(yàn)P純高莖 純矮莖 F1高莖高莖 F2高莖矮莖3 : 1DD高莖dd矮莖P
5、配子dDF1Dd高莖DDDd高莖Dd高莖F1配子ddF2Dd高莖DDDddd高莖高莖矮莖1:21 【遺傳圖解如下】醫(yī)學(xué)統(tǒng)計(jì)學(xué)的應(yīng)用明確醫(yī)學(xué)現(xiàn)象的性質(zhì)比較幾種醫(yī)學(xué)現(xiàn)象的差異探討醫(yī)學(xué)現(xiàn)象之間的關(guān)系分析影響醫(yī)學(xué)現(xiàn)象變化的因素由局部的數(shù)據(jù)去推測(cè)總體的特性.第一節(jié) 統(tǒng)計(jì)學(xué)的幾個(gè)基本概念一、同質(zhì)和變異二、總體與樣本三、隨機(jī)抽樣四、誤差五、參數(shù)與統(tǒng)計(jì)量六、頻率與概率醫(yī)學(xué)統(tǒng)計(jì)學(xué)的基本概念(一)同質(zhì)與變異同質(zhì)(homogeneity) 指各觀察個(gè)體(單位)受相同因素影響的部分。變異(variation) 在同質(zhì)的基礎(chǔ)上個(gè)體間的差異。例某地某年用隨機(jī)抽樣方法檢查了140名健康成年男子的紅細(xì)胞數(shù)(1012/L),檢
6、測(cè)結(jié)果如下表:4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.93觀察指標(biāo)的
7、同質(zhì)部分:“某地某年健康成年男子”觀察指標(biāo)的變異部分:各個(gè)體間紅細(xì)胞數(shù)間的差異(二)總體與樣本(population & sample)總體:是根據(jù)研究目的所確定的同質(zhì)觀察單位(某種變量值)的全部。 1)有限總體(有時(shí)間、空間限制) 例研究2012年溫州市肝癌死亡率。 2)無限總體(沒有時(shí)間、空間限制) 例研究某藥對(duì)高血壓病的療效。樣本:從總體中隨機(jī)抽取一部分個(gè)體所組成的集合。 絕大多數(shù)研究屬抽樣研究總體樣本抽樣推斷如何能使樣本具有較好的代表性?(三)隨機(jī)抽樣 從總體中隨機(jī)遇而定抽取部分個(gè)體的過程。(總體中每一個(gè)觀察單位均有同等的機(jī)會(huì)被抽取到)總體樣本抽樣推斷隨機(jī)抽樣是樣本客觀反映總體情況的前
8、提。此外,抽取數(shù)量(樣本含量)也很重要。 隨機(jī)抽樣方法:1.單純隨機(jī)抽樣2.系統(tǒng)(機(jī)械)隨機(jī)抽樣3.整群隨機(jī)抽樣4.分層隨機(jī)抽樣總體樣本抽樣推斷上述抽樣方法得到樣本的代表性一樣嗎?(四)誤差 誤差,Error:實(shí)測(cè)值與真值之差。1. 非隨機(jī)誤差:可以而且應(yīng)該避免粗差(過失誤差)系統(tǒng)誤差(偏倚)2. 隨機(jī)誤差:不恒定、呈正態(tài)分布,不可避免隨機(jī)測(cè)量誤差抽樣誤差抽樣誤差(sampling error)抽樣引起的總體指標(biāo)與樣本指標(biāo)(之間的差別。有抽樣,抽樣誤差就不可避免。問題:某中醫(yī)師對(duì)某方劑進(jìn)行改良,改良后的方劑治療某病患者30例,有效率為80%,原方劑治療30例,有效率為60%,問兩者有效率有無差
9、別?上例從統(tǒng)計(jì)學(xué)角度,還不能認(rèn)為兩者有效率有差別。為什么?現(xiàn)從袋子中隨機(jī)抽取10個(gè)球。第1次:8紅2黑,紅球占80%; 將取出球再放回袋中。第2次:6紅4黑,紅球占60%。例:有一袋子裝有大小相同的100個(gè)球,其中紅球70個(gè),黑球30個(gè),紅球占總數(shù)70%。已知總體相同,現(xiàn)兩樣本間差別是什么原因所致?若總體未知,現(xiàn)兩樣本間有差別是否等同于總體有差別?通過統(tǒng)計(jì)推斷方法“假設(shè)檢驗(yàn)”(五)參數(shù)與統(tǒng)計(jì)量 (parameter & statistic) 參數(shù): 指總體的指標(biāo),如總體均數(shù)、總體標(biāo)準(zhǔn)差,用希臘字母表示。 統(tǒng)計(jì)量:指樣本的指標(biāo),如樣本均數(shù)、樣本標(biāo)準(zhǔn)差s,用拉丁字母表示。 檢驗(yàn)統(tǒng)計(jì)量:用于統(tǒng)計(jì)檢驗(yàn)
10、的樣本指標(biāo)。 如 t、u、x2、F 等(六)頻率與概率 (frequency & probability)頻率:在相同條件下,獨(dú)立地重復(fù)n次試驗(yàn),隨機(jī)事件A出現(xiàn)f次,則f/n為隨機(jī)事件A出現(xiàn)的頻率。概率:用P表示,0P1。當(dāng)P0時(shí),稱為不可能事件;當(dāng)P1時(shí),稱為必然事件。概率是頻率的穩(wěn)定的、極限的形式。頻率f(A)為變量,概率P(A)為常數(shù)。若n足夠大,f(A) P(A)均表示某事件發(fā)生可能性大小的量。小概率事件: P(A) 0.05 的事件小概率事件發(fā)生的可能性很小,可以認(rèn)為“在一次抽樣中幾乎不可能發(fā)生”。利用該“約定”進(jìn)行假設(shè)檢驗(yàn)。即提出一個(gè)假設(shè),并在此前提下計(jì)算有關(guān)概率P, 若P 0.0
11、5 ,則可認(rèn)為此假設(shè)不成立。觀察單位的特征變量(數(shù)值變量、分類變量)變量的測(cè)定值變量值(計(jì)量、計(jì)數(shù)、等級(jí)資料) 數(shù)值變量 計(jì)量資料 分類變量 無序分類(unordered categories) 計(jì)數(shù)資料 二項(xiàng)分類 多項(xiàng)分類 有序分類(ordered categories) 等級(jí)資料第二節(jié) 變量及統(tǒng)計(jì)資料的類型例:測(cè)得一群人Hb值(g/dL),此資料為 ; 按正常和異常分為兩組,此時(shí)資料為 ; 按量的多少分為: 16 (Hb增高)。此時(shí)資料為 。資料間的相互轉(zhuǎn)化(1)設(shè)計(jì): design(2)收集資料 collection of data (3)整理資料 sorting data (4)分析資
12、料 analysis of data第三節(jié) 醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟1)專業(yè)設(shè)計(jì)2)統(tǒng)計(jì)設(shè)計(jì)1)統(tǒng)計(jì)報(bào)表2)醫(yī)療衛(wèi)生工作記錄3)專題調(diào)查和實(shí)驗(yàn)1)對(duì)數(shù)據(jù)檢查、核對(duì)2)按分析要求分組、匯總1)統(tǒng)計(jì)描述 2)統(tǒng)計(jì)推斷 t 檢驗(yàn)、z 檢驗(yàn) 方差分析 非參數(shù)檢驗(yàn) 卡方檢驗(yàn) 集中趨勢(shì)和離散程度 相對(duì)數(shù) 多因素分析 第二章 計(jì)量資料的統(tǒng)計(jì)描述一、頻數(shù)分布二、集中趨勢(shì)的描述三、離散程度的描述1、頻數(shù)表的編制2、頻數(shù)分布的特征3、頻數(shù)分布的類型4、頻數(shù)表的用途一、計(jì)量資料的頻數(shù)分布4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.
13、704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.93例某地用隨機(jī)抽樣方法檢查了140名成年男子的紅細(xì)胞數(shù),檢測(cè)結(jié)果如下表:(1)求全距或極差(R) (2)定組段和組距(i) 1. 頻數(shù)表的編制(3)列出頻數(shù)表
14、某地140名正常男子紅細(xì)胞數(shù)的頻數(shù)表紅細(xì)胞數(shù)(1012/ L)頻數(shù)3.80 24.00 64.20114.40254.60324.80275.00175.20135.40 45.60 25.80 12. 頻數(shù)分布的特征(1)集中趨勢(shì)(2)離散趨勢(shì)(1)對(duì)稱分布 其中一種常見的類型為正態(tài)分布.(2)非對(duì)稱分布 主要為正偏態(tài)、負(fù)偏態(tài)分布.3. 頻數(shù)分布的類型4. 頻數(shù)表的用途(1)了解資料的分布類型.(2)發(fā)現(xiàn)異常值.(3)在頻數(shù)表的基礎(chǔ)上計(jì)算有關(guān)指標(biāo)。1、算術(shù)均數(shù) ,X2、幾何均數(shù) G3、中位數(shù) M二、集中趨勢(shì)的描述概念: 數(shù)值的平均.計(jì)算: 1)直接法: 例 求某地140名正常成年男子紅細(xì)胞數(shù)
15、均值為1. 均數(shù)(mean) ,X 2)加權(quán)法:RBC(1012/ L)組中值 X頻數(shù) ffX3.803.90 27.804.004.10 624.64.204.301147.34.404.5025112.54.604.7032150.44.804.9027132.35.005.101786.75.205.301368.95.405.50 422.05.605.70 211.45.805.90 15.9合計(jì)140( f)669.8 fx應(yīng)用: 對(duì) 稱分布,尤其是正態(tài)分布.概念:指一組數(shù)據(jù)的倍數(shù)平均。計(jì)算:(1)直接法: 2. 幾何均數(shù) ( geometric mean, G ) 例:5份血清的
16、抗體效價(jià)為1:10,1:100,1:1000,1:10000,1:100000,求其平均效價(jià)。 或者: 1:10,1:100,1:1000,1:10000,1:100000的指數(shù)部分為:-1,-2,-3,-4,-5,其平均值為-3,故G =10-3=1:1000 (2)加權(quán)法:何謂對(duì)數(shù)正態(tài)分布? 某資料由變量值 X1,X2, Xn組成,已知其分布呈偏態(tài)。若每個(gè)變量值取對(duì)數(shù),如Y1=lgX1,Y2=lgX2, Yn=lgXn,且Y1,Y2, Yn呈正態(tài)分布。 此時(shí),將對(duì)數(shù)值還原為原始數(shù)值,則:應(yīng)用: (1)變量值呈倍數(shù)關(guān)系 (2)對(duì)數(shù)正態(tài)分布概念:是一組由小到大按順序排列的觀察 值中位次 居中的
17、數(shù)值。計(jì)算:(1)直接法: n為奇數(shù)時(shí), n為偶數(shù)時(shí), 某病患者9人發(fā)病潛伏期為2,3,3,3,4,5,6,9,16天, 求中位數(shù)。若在第20天又發(fā)現(xiàn)1例患者,則其中位數(shù)為:3. 中位數(shù) (median M) 利用百分位數(shù)計(jì)算公式進(jìn)行計(jì)算. 百分位數(shù)(PX)是一種位置指標(biāo), 。中位數(shù)是一個(gè)特定的百分位數(shù),即M= P50 。(2)頻數(shù)表法:百分位數(shù)計(jì)算公式:百分位數(shù)計(jì)算公式:MMP25P75應(yīng)用:(1)偏態(tài)分布資料;(2)資料分布一端或兩端有未確定值。 某實(shí)驗(yàn)室觀察局部溫?zé)嶂委熜∈笠浦残阅[瘤的療效,以生存日數(shù)作觀察指標(biāo), 結(jié)果如下.問兩組生存日數(shù)有無差別? 例: 三組同性別、同年齡兒童的體重(K
18、g)如下,分析其集中趨勢(shì)與離散趨勢(shì)。 甲組:26 28 30 32 34 均數(shù):X=30 Kg 乙組:24 27 30 33 36 均數(shù):X=30 Kg 丙組:26 29 30 31 34 均數(shù):X=30 Kg三、離散趨勢(shì)的描述甲乙丙三組兒童體重的離散程度只用平均數(shù)描述資料的弊病 It has been said that a fellow with one leg frozen in ice and the other leg in boiling water is comfortable。 ON AVERAGE !描述離散程度的常用指標(biāo)1、全距(極差) (R)2、四分位數(shù)間距(QR)3、方
19、差(2 S2)和 標(biāo)準(zhǔn)差(、S)4、變異系數(shù) (CV) 反映一組同質(zhì)觀察值個(gè)體差異的范圍。 R甲=8; R乙=12; R丙=8。 缺點(diǎn)(1)不能反映組內(nèi)其它觀察值的變異度。 (2)樣本含量越大,則全距可能也越大。1. 全距(極差)即P75P25 四分位數(shù)可看作是一組同質(zhì)觀察值居中的50%變量值的變異范圍。2. 四分位數(shù)間距(quartile range, QR) 不受極值影響,較穩(wěn)定。與全距比較有何優(yōu)點(diǎn)?應(yīng)用: (1)偏態(tài)分布; (2)資料一端或兩端有未確定值。變量值的離散程度可看作是各個(gè)變量值距離中心點(diǎn)(均數(shù))的遠(yuǎn)近問題。 用算式表示: x 但: x=0 則求: x2 (離均差平方和) x2
20、 大小與變異度有關(guān)外,還與變量值個(gè)數(shù)(N)有關(guān)。 故:3. 方差(2 S2)和 標(biāo)準(zhǔn)差(、S)(variance & standard deviation) 為了用原單位表示,開方即: 標(biāo)準(zhǔn)差或方差越大,說明個(gè)體差異越大,則均數(shù)的代表性越差。 實(shí)際工作中經(jīng)常得到的是樣本資料,總體均數(shù)是不知道的,只能用樣本均數(shù)來估計(jì),這樣: 用 xx2 代替 x2 n 代替 N 但這樣算得結(jié)果常比真實(shí)低。 因此,統(tǒng)計(jì)學(xué)家提出用 n - 1 來校正。即:樣本標(biāo)準(zhǔn)差(S) S2 稱為 樣本方差 式中n-1稱為自由度,用希臘字母 (niu)表示。自由度的概念: 是指隨機(jī)變量能自由取值的個(gè)數(shù)。 例:X+Y+Z=10 =
21、 2 又例: 當(dāng)樣本均數(shù)一定時(shí),隨機(jī)變量可以自由取值的變量值個(gè)數(shù)只能是n - 1 個(gè)。計(jì)算: 1)不分組資料:例: 三組同性別、同年齡兒童的體重(Kg)如下,分析其集中趨勢(shì)與離散趨勢(shì)。 甲組:26 28 30 32 34 均數(shù):X=30 Kg 乙組:24 27 30 33 36 均數(shù):X=30 Kg 丙組:26 29 30 31 34 均數(shù):X=30 Kg計(jì)算得:S甲=3.16,S乙=4.74,S丙=2.92 2)分組資料: 計(jì)算得:S = 0.38(1012/ L)RBC(1012/ L)組中值 X頻數(shù) ffXfX23.803.90 27.8030.424.004.10 624.64.204
22、.301147.34.404.5025112.54.604.7032150.44.804.9027132.35.005.101786.75.205.301368.95.405.50 422.05.605.70 211.45.805.90 15.9合計(jì)140( f)669.8 fx3224.20應(yīng)用: 對(duì)稱分布,尤其是正態(tài)分布應(yīng)用:(1)比較單位不同的幾組資料的變異程度 (2)比較均數(shù)相差懸殊的幾組資料的變異程度4. 變異系數(shù)(CV) 例2.9 某地調(diào)查110名18歲男大學(xué)生,其身高均數(shù)為172.73cm,標(biāo)準(zhǔn)差為4.09cm;其體重均數(shù)為55.04kg,標(biāo)準(zhǔn)差為4.10kg,試比較兩者變異度。
23、 1. X S 2. M(P75 P25)綜合: 某年某地不同型流腦病死率比較 病型 病人數(shù) 死亡人數(shù) 病死率(%)菌血型 59 4 6.78 腦 型 778 48 6.17混合型 784 39 4.97 合計(jì) 1621 91 5.61計(jì)數(shù)資料下表資料的類型?等級(jí)資料下表資料的類型? 10名某病患者,用某藥治療, 測(cè)得治療前及治療后一個(gè)月的 血沉(mm/小時(shí))如下表: 病人號(hào) 1 2 3 4 5 6 7 8 9 10 治療前 10 13 6 11 10 7 8 8 5 9 治療后 6 9 3 10 10 4 2 5 3 3 問該藥是否有效? 計(jì)量資料下表資料的類型? 某衛(wèi)生防疫站對(duì)30名麻疹易
24、感兒童經(jīng)氣溶膠免疫一個(gè)月后,測(cè)得其血凝抑制抗體滴度資料如下,試計(jì)算其平均滴度 抗體滴度 1:8 1:16 1:32 1:64 1:128 1:256 1:512 例 數(shù) 2 6 5 10 4 2 1 某市1974年為了解該地居民發(fā)汞的基礎(chǔ)水平, 為汞污染的環(huán)境監(jiān)測(cè)積累資料, 調(diào)查了留住該市一年以上, 無明顯肝、腎疾病,無汞作業(yè)接觸史的居民238 人的發(fā)汞含量如下: 用何種指標(biāo)說明本資料的集中位置和變異程度較好?并計(jì)算之; 某檢驗(yàn)師測(cè)定了10名正常成年鋼鐵工人的血紅蛋白值(g/dl)和紅細(xì)胞數(shù)(萬/mm3)如下,試比較這兩個(gè)檢測(cè)項(xiàng)目的結(jié)果哪個(gè)變異性大? 血紅蛋白(g/dL) 13.0 13.6
25、14.0 14.5 14.6 14.7 15.2 15.5 15.8 16.0血細(xì)胞數(shù)(萬/mm3) 510 515 517 518 520 522 524 525 528 530常用統(tǒng)計(jì)軟件:SAS真正的巨無霸,被譽(yù)為國際上的標(biāo)準(zhǔn)統(tǒng)計(jì)軟件SPSS統(tǒng)計(jì)軟件中的貴族,操作界面極為友好Stata軟件小巧,命令行方式操作EpiData免費(fèi)的數(shù)據(jù)錄入和數(shù)據(jù)管理軟件學(xué)習(xí)統(tǒng)計(jì)學(xué)最好的方法是熟悉一種統(tǒng)計(jì)軟件的使用。EpiData EpiData SASStatistical Analysis System是當(dāng)今國際上最著名的數(shù)據(jù)分析軟件之一;由美國北卡羅萊納州立大學(xué)的兩位教授于1966年開始研制,1976年
26、正式成立SAS軟件研究所;特點(diǎn):功能強(qiáng)大、編程操作、適宜于高級(jí)用戶使用。SPSS 原名:Statistical Package for Social Science(社會(huì)科學(xué)統(tǒng)計(jì)軟件包) 2000年:Statistical Product and Service Solutions(統(tǒng)計(jì)產(chǎn)品和服務(wù)解決方案)2009年被IBM收購,改名為IBM SPSS, 現(xiàn)版本為21.0功能強(qiáng)大囊括各種統(tǒng)計(jì)方法;提供各種數(shù)據(jù)準(zhǔn)備與整理技術(shù);強(qiáng)大的統(tǒng)計(jì)圖表功能兼容性好(數(shù)據(jù)、結(jié)果)易用性強(qiáng)(菜單對(duì)話框方式)基本特點(diǎn)口號(hào):真正統(tǒng)計(jì),確實(shí)簡單。SPSS界面 SPSS數(shù)據(jù)編輯窗口(SPSS Data Editor )
27、(1)數(shù)據(jù)視圖 (Data View )SPSS界面 (2)變量視圖 (Variable View )name欄:設(shè)置變量名,在8位以內(nèi),推薦使用英文變量名。Type欄:常用變量類型為Numeric(數(shù)值型)、Data(日期型)、String(字符型)三種,一般默認(rèn)數(shù)值型即可。Width欄:設(shè)置變量運(yùn)算寬度,如數(shù)值型默認(rèn)為8位,一般不用更改Decimals欄:設(shè)置小數(shù)位,默認(rèn)為2位。Label欄:定義變量名標(biāo)簽,在結(jié)果輸出中出現(xiàn),方便閱讀。Values欄:定義變量值標(biāo)簽。用于將數(shù)據(jù)中的分類變量或非連續(xù)型變量量化。Missing欄:定義變量缺失值。SPSS中默認(rèn)缺失值用“.”表示,如所用數(shù)據(jù)集中
28、還有其它表示方法,則用該框來定義。Collumns欄:定義顯示列寬。Align欄:定義顯示對(duì)齊方式。Measure欄:定義變量的測(cè)量尺度。例2-1 某醫(yī)院用隨機(jī)抽樣方法檢查了138名成年女子的紅細(xì)胞數(shù),其測(cè)量結(jié)果如下,試編制頻數(shù)分布表。THE END單純隨機(jī)抽樣 即先將調(diào)查總體的全部觀察單位編號(hào),再隨機(jī)抽取部分觀察單位組成樣本。例:欲了解某單位職工HBsAg陽性率,該單位有職工1000人,試按單純隨機(jī)抽樣法,抽取一例數(shù)為100的樣本。系統(tǒng)隨機(jī)抽樣又稱等距抽樣或機(jī)械抽樣,即先將總體的觀察單位按某一順序號(hào)等分成n個(gè)部分,再從第一部分隨機(jī)抽第k號(hào)觀察單位,依次用相等間隔,機(jī)械地從每一部分各抽一個(gè)觀察
29、單位組成樣本。例:欲了解某單位職工HBsAg陽性率,該單位有職工1000人,試按系統(tǒng)抽樣法,抽取一例數(shù)為100的樣本。整群隨機(jī)抽樣 先將總體劃分為n個(gè)群,每個(gè)群包括若干觀察單位,再隨機(jī)抽取k個(gè)群,并將被抽取的各個(gè)群的全部觀察單位組成樣本。例:某校有80個(gè)班級(jí),各班學(xué)生50人,現(xiàn)用錫克氏試驗(yàn)調(diào)查該校學(xué)生白喉易感率,隨機(jī)抽查了8個(gè)班的全部學(xué)生。分層隨機(jī)抽樣按有關(guān)影響因素把觀察對(duì)象分成若干層次,然后將同一層次的觀察對(duì)象進(jìn)行隨機(jī)抽取。例:欲了解某地人群HBsAg陽性率情況,按年齡段、職業(yè)、性別等因素分層后進(jìn)行抽樣。病例號(hào)年齡(歲)性別身高(cm)血型心電圖尿WBC職業(yè)RBC(1012/L)135女16
30、5A正常教師4.67244男174B正常工人5.21326男180O正常職員4.10425女161AB正常農(nóng)民3.92541男171A異常+工人3.49645女158B正常+工人5.48750女160O異常+干部6.78828男176AB正常+干部7.10931女162O正常軍人5.24變量和變量值變量變量值觀察單位變量值 計(jì)量資料 用定量方法測(cè)定得到,有大小之分,有度量衡單位。例 某年某市抽樣調(diào)查的120名5歲女孩身高(cm),資料如下:105.5118.6110.5104.2110.9107.9108.1 99.1104.8116.5110.4105.7118.2117.0112.3116
31、.5113.2107.9104.8109.6109.1108.1109.4118.2103.9116.0110.1 99.6109.3107.5108.6100.6108.8103.8 95.3104.4102.7101.0112.1118.7124.0104.1109.1108.8111.0106.8120.2105.8103.1105.0115.0 計(jì)數(shù)資料按不同屬性分類后,匯總各類中的個(gè)數(shù)所得到的資料。多項(xiàng)分類資料二項(xiàng)分類資料 等級(jí)資料 將觀察單位按某屬性不同程度分組計(jì)數(shù)所得的資料。正態(tài)分布及參考值范圍的制定溫醫(yī)環(huán)境公衛(wèi)學(xué)院黃陳平一、正態(tài)分布 (normal distribution)正
32、態(tài)分布的圖形正態(tài)分布的特征標(biāo)準(zhǔn)正態(tài)分布正態(tài)分布曲線下面積分布規(guī)律4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.12
33、4.854.595.084.824.93例某地用隨機(jī)抽樣方法檢查了140名成年男子的紅細(xì)胞數(shù),檢測(cè)結(jié)果如下表:1、正態(tài)分布的圖形1)在橫軸上方,均數(shù)處最高,為單峰分布2)以均數(shù)為中心,左右對(duì)稱3)有兩個(gè)參數(shù), 和 , 即 N( , 2)4)正態(tài)曲線下面積分布有一定規(guī)律2、正態(tài)分布的特征 不同、下正態(tài)分布概率密度函數(shù)的圖形正態(tài)分布的圖形由 和 所決定,即N( , 2)對(duì)上式進(jìn)行 u 代換,即:可使一般的正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布(u 分布),此時(shí) N(0,1)。3、標(biāo)準(zhǔn)正態(tài)分布x= 0= 1問題:為什么一般的正態(tài)分布要轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布?表中曲線下面積為 - u 的面積;即 P ( u)P.69
34、5 附表1 4、正態(tài)曲線下的面積分布規(guī)律表9-6 正態(tài)分布和標(biāo)準(zhǔn)正態(tài)分布曲線下面積分布規(guī)律若為大樣本,則可用 代替,用 s 代替。圖9-6 正態(tài)分布和標(biāo)準(zhǔn)正態(tài)分布的曲線下面積分布規(guī)律 -2.58 -1.96 -1 0 +1 +1.96 +2.58 u -2.58 -1.96 -1 +1 +1.96 +2.58 x95%95%或大樣本時(shí):正態(tài)曲線下某一區(qū)間的面積占總面積的百分?jǐn)?shù)有何意義? 即該區(qū)間的例數(shù)占總例數(shù)的百分?jǐn)?shù)(頻數(shù)分布), 或觀察值落在該區(qū)間的概率, 或從此總體隨機(jī)抽得該區(qū)間觀察值的概率。正態(tài)分布的應(yīng)用估計(jì)變量值的頻數(shù)分布制定參考值范圍例 某地用隨機(jī)抽樣方法檢查了140名成年男子的紅細(xì)
35、胞數(shù)(1012/L),檢測(cè)結(jié)果如下表:4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084
36、.824.93 若上例均數(shù)為4.78 (1012/L) ,標(biāo)準(zhǔn)差為0.38 (1012/L),問低于41012/ L的人占總?cè)藬?shù)的比例有多少? 例:對(duì)使用過甘草的許多重要處方進(jìn)行分析,若已知每次的甘草用量X(單位:克)服從正態(tài)分布,=8,=2?,F(xiàn)任抽一張含甘草的處方,求甘草的用量在510克范圍內(nèi)的概率。P = P(u2)P(u1)= P(1)P(-1.5)=0.7745二、參考值范圍的估計(jì)參考值的意義制定參考值范圍的基本步驟參考值范圍的估計(jì)方法問 題 小陳參加體檢,血常規(guī)報(bào)告其白細(xì)胞計(jì)數(shù)為3.50109/L, 而健康人參考值范圍為: 4.0010.00109/L,問: (1)小陳白細(xì)胞計(jì)數(shù)值正
37、常嗎?(2)何謂參考值范圍?(一) 參考值的意義醫(yī)學(xué)參考值(medical reference value)指絕大多數(shù)正常人的生理、生化指標(biāo)常數(shù),也稱正常值。由于存在個(gè)體差異,正常人某項(xiàng)指標(biāo)測(cè)定值并非常數(shù)而是在一定范圍內(nèi)波動(dòng),故采用參考值范圍作為判斷某項(xiàng)指標(biāo)是否正常的依據(jù)。 1)隨機(jī)抽得足夠數(shù)量(n100)符合條件的觀察對(duì)象; 2)控制測(cè)量誤差; 3)合理合并或分組; 4)確定單側(cè)或雙側(cè) 白細(xì)胞計(jì)數(shù)? 肺活量? 血鉛濃度? 5)選定適當(dāng)?shù)陌俜纸缦蓿?如80%、90%、95%和99%,常用為95%。 6)選定適當(dāng)?shù)挠?jì)算方法。(二)制定參考值范圍的基本步驟(三)參考值范圍的估計(jì)方法 1、正態(tài)分布法
38、 若取95%界限, 雙側(cè): X 1.96S 單側(cè):若高不正常,則 X -1.645S 2、百分位數(shù)法 若取95%界限, 雙側(cè): P2.5 P97.5 單側(cè):若高不正常,則 P5362.6359.7285.9300.2333.6334.0288.8338.5341.9344.6337.5298.3364.2367.1338.1316.9332.7324.0282.6369.8398.7338.7308.9392.1368.7352.6378.2346.1278.6318.3323.2322.6382.1322.6309.6352.0372.5399.8335.6341.1371.0355.936
39、2.7368.1332.4405.6328.8358.8371.0387.5413.6348.7392.7401.0313.6366.8387.2319.7329.4352.0372.5399.8335.6341.1371.0355.9362.7368.1332.4405.6328.8358.8362.6359.7285.9300.2333.6334.0288.8338.5341.9344.6337.5298.3364.2367.1338.1316.9332.7324.0282.6369.8398.7338.7308.9392.1368.7352.6378.2346.1278.6318.332
40、3.2322.6382.1322.6309.6352.0376.2388.4344.6308.6347.0428.7369.1311.4376.3349.4289.2366.8371.0387.5413.6348.7392.7401.0313.6366.8387.2319.7329.4357.5372.5399.8335.6341.1371.0355.9362.7368.1332.4405.6328.8357.5387.5342.3366.7387.6332.7329.4 2002年某市150名正常成年男子的尿酸濃度( mol/L ) 上例 ,求雙側(cè)95%的參考值范圍。 參考值范圍應(yīng)用時(shí)注意:
41、人數(shù)上限值 (95%)NormalPatient假陰性假陽性 問: (1) 理論上95%男孩出生體重在什么范圍? (2) 某男孩出生體重為4.51kg,如何評(píng)價(jià)? (1) (2.43, 4.14)(2) 超重例 題 某市1974年為了解該地居民發(fā)汞的基礎(chǔ)水平, 隨機(jī)抽樣檢測(cè)該地?zé)o汞作業(yè)接觸史的健康居民238人的發(fā)汞含量如下: 如何制定該地健康居民的發(fā)汞參考值范圍?如在以后工作中測(cè)得某人發(fā)汞值為17.8mol/kg,如何判斷?100)符合條件的觀察對(duì)象; 2)控制測(cè)量誤差; 3)合理合并或分組; 4)確定單側(cè)或雙側(cè) 白細(xì)胞計(jì)數(shù)? 肺活量? 血鉛濃度? 5)選定適當(dāng)?shù)陌俜纸缦蓿?如80%、90%、
42、95%和99%,常用為95%。 6)選定適當(dāng)?shù)挠?jì)算方法。(二)制定參考值范圍的基本步驟(三)參考值范圍的估計(jì)方法 1、正態(tài)分布法 若取95%界限, 雙側(cè): X 1.96S 單側(cè):若高不正常,則 X -1.645S 2、百分位數(shù)法 若取95%界限, 雙側(cè): P2.5 P97.5 單側(cè):若高不正常,則 P5362.6359.7285.9300.2333.6334.0288.8338.5341.9344.6337.5298.3364.2367.1338.1316.9332.7324.0282.6369.8398.7338.7308.9392.1368.7352.6378.2346.1278.6318
43、.3323.2322.6382.1322.6309.6352.0372.5399.8335.6341.1371.0355.9362.7368.1332.4405.6328.8358.8371.0387.5413.6348.7392.7401.0313.6366.8387.2319.7329.4352.0372.5399.8335.6341.1371.0355.9362.7368.1332.4405.6328.8358.8362.6359.7285.9300.2333.6334.0288.8338.5341.9344.6337.5298.3364.2367.1338.1316.9332.7324
44、.0282.6369.8398.7338.7308.9392.1368.7352.6378.2346.1278.6318.3323.2322.6382.1322.6309.6352.0376.2388.4344.6308.6347.0428.7369.1311.4376.3349.4289.2366.8371.0387.5413.6348.7392.7401.0313.6366.8387.2319.7329.4357.5372.5399.8335.6341.1371.0355.9362.7368.1332.4405.6328.8357.5387.5342.3366.7387.6332.7329
45、.4 2002年某市150名正常成年男子的尿酸濃度( mol/L ) 上例 ,求雙側(cè)95%的參考值范圍。 參考值范圍應(yīng)用時(shí)注意:人數(shù)上限值 (95%)NormalPatient假陰性假陽性 問: (1) 理論上95%男孩出生體重在什么范圍? (2) 某男孩出生體重為4.51kg,如何評(píng)價(jià)? (1) (2.43, 4.14)(2) 超重例 題 某市1974年為了解該地居民發(fā)汞的基礎(chǔ)水平, 隨機(jī)抽樣檢測(cè)該地?zé)o汞作業(yè)接觸史的健康居民238人的發(fā)汞含量如下: 如何制定該地健康居民的發(fā)汞參考值范圍?如在以后工作中測(cè)得某人發(fā)汞值為17.8mol/kg,如何判斷?50),則樣本均數(shù)也逼近正態(tài)分布。(2)樣本
46、均數(shù)的總均數(shù)等于原始總體均數(shù)。某變量值總體分布樣本含量n相同的樣本均數(shù)總體分布抽樣n一、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤意義: 說明抽樣誤差的大小。抽樣誤差大,用 估計(jì)的可靠程度較小。某變量值總體分布樣本含量n相同的樣本均數(shù)總體分布抽樣n 為樣本均數(shù)的標(biāo)準(zhǔn)差,反映均數(shù)抽樣誤差大小的指標(biāo), 稱標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤的計(jì)算標(biāo)準(zhǔn)差計(jì)算式增大樣本含量可減少抽樣誤差某變量值總體分布樣本含量n相同的樣本均數(shù)總體分布抽樣n標(biāo)準(zhǔn)誤計(jì)算式 例4.1某市隨機(jī)抽查12歲男孩100人,得身高均數(shù)139.6cm,標(biāo)準(zhǔn)差6.85cm,資料,求標(biāo)準(zhǔn)誤? 若X或 X服從正態(tài)分布 N( , 2),則可作正態(tài)變量 X或 X的 u 代換。則 u 服從
47、標(biāo)準(zhǔn)正態(tài)分布 N(0,1) 二、 t 分布某變量值總體分布抽樣得到n相同的樣本均數(shù)總體分布 實(shí)際工作中, 往往未知,S 代替, 此時(shí)就不是u代換,而是 t 代換。 無數(shù)t點(diǎn)所組成的分布,稱t 分布。t 分布的特征: (1)以 0 為中心,兩側(cè)對(duì)稱的單峰分布 (2)與 u 分布比較,峰值較低,兩邊上翹 (3)有一個(gè)參數(shù) ,當(dāng) ,t分布u分布P696t 界值表的使用當(dāng)自由度v一定時(shí),t分布也確定,t界值表提供v一定時(shí)t分布曲線下某概率分布區(qū)間的t界值點(diǎn)。t界值表示: 雙側(cè) t(,v), P(t - t(,v) 且 t t(,v) )= 單側(cè)t(,v), P(t - t(,v) 或 t t(,v)
48、)= 單側(cè)t(,v)=雙側(cè) t(2,v) 如單側(cè)t(0.05,11)=雙側(cè) t(0.10,11) =1.796t 分布的用途總體均數(shù)的區(qū)間估計(jì)t 檢驗(yàn)三.總體均數(shù)的估計(jì)1. 點(diǎn)估計(jì)(point estimation): 概念: 按一定的概率(1 - )估計(jì)總體均數(shù)所在范圍(或稱置信區(qū)間, confidence interval, CI ),常用95%和99%的概率估計(jì)。2. 區(qū)間估計(jì)(interval estimation):為第一類錯(cuò)誤的概率,通常取0.05或0.01(3)未知但n較大,可按正態(tài)分布原理(2)未知時(shí),按t分布原理 (1)已知時(shí),按正態(tài)分布原理 計(jì)算: 例2.12 11名18歲
49、男大學(xué)生身高得均數(shù)172.25厘米,標(biāo)準(zhǔn)差3.31厘米,試估計(jì)該地18歲男大學(xué)生總體身高均數(shù)的95%可信區(qū)間。 本例n=11,則=10,查t界值表得:雙側(cè)t0.0510=2.228關(guān)于置信區(qū)間的準(zhǔn)確性和精密度準(zhǔn)確度反映在可信度(1 - )的大小上;精密度反映在可信區(qū)間的長度上。99%總體均數(shù)置信區(qū)間與95 %總體均數(shù)置信區(qū)間比較前者準(zhǔn)確度較高,但緊密度較低問題:均數(shù)的置信區(qū)間與參考值范圍有何區(qū)別?例: 據(jù)大量調(diào)查知,健康成年男子脈搏的均數(shù)為72次/分,某醫(yī)生在山區(qū)隨機(jī)調(diào)查了25名健康男子,其脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.0次/分,能否認(rèn)為該山區(qū)成年男子的脈搏高于一般人群?造成 與0不等
50、的原因:(1)抽樣誤差 ,即=0 (2)非同一總體,即0 已知總體 未知總體四. 假設(shè)檢驗(yàn)的基本思想和步驟 如何判斷? 統(tǒng)計(jì)上是通過假設(shè)檢驗(yàn)來回答這個(gè)問題。(1)建立假設(shè): H0: (檢驗(yàn)假設(shè)或無效假設(shè)) 如:兩總體均數(shù)相等 H1: (備擇假設(shè)) 如:兩總體參數(shù)不等 雙側(cè)檢驗(yàn) 單側(cè)檢驗(yàn)怎樣選擇雙側(cè)檢驗(yàn)或單側(cè)檢驗(yàn)? 1.根據(jù)專業(yè)知識(shí); 2.根據(jù)研究目的。H0:H1:或?yàn)槭裁捶QH0為無效假設(shè)?在建立檢驗(yàn)假設(shè)時(shí),應(yīng)當(dāng)注意: 檢驗(yàn)假設(shè)應(yīng)針對(duì)總體而言,不能針對(duì)樣本。 H0和H1缺一不可。統(tǒng)計(jì)分析是基于H0假設(shè)前提進(jìn)行的(2) 確立檢驗(yàn)水準(zhǔn) ,又稱顯著性水準(zhǔn)。 指拒絕實(shí)際上成立的檢驗(yàn)假設(shè)H0 所犯錯(cuò)誤的概
51、率(假陽性錯(cuò)誤的概率),即第一類錯(cuò)誤概率。 的大小要根據(jù)分析的要求人為確定,在實(shí)際工作中常取0.05,即小概率事件的標(biāo)準(zhǔn)。為什么強(qiáng)調(diào)對(duì)假陽性錯(cuò)誤進(jìn)行嚴(yán)格控制?(3)選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量應(yīng)根據(jù)資料的性質(zhì)和分析目的,選擇適宜的統(tǒng)計(jì)檢驗(yàn)方法,并計(jì)算檢驗(yàn)統(tǒng)計(jì)量。常用檢驗(yàn)統(tǒng)計(jì)量如: 、F、X2 等(4)確定P值,作出推斷結(jié)論 P值是指由所規(guī)定的總體中(本例 H0 : = 0)作隨機(jī)抽樣,獲得大于或等于現(xiàn)有樣本計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量值的概率。即 P( t 或 u、F、 X2 等)。P時(shí),則拒絕H0,接受H1,有統(tǒng)計(jì)學(xué)意義(統(tǒng)計(jì)結(jié)論),可認(rèn)為不同或不等(專業(yè)結(jié)論)。P時(shí),則不拒絕H0,無統(tǒng)計(jì)學(xué)意義(統(tǒng)
52、計(jì)結(jié)論),還不能認(rèn)為不同或不等(專業(yè)結(jié)論)。 假設(shè)檢驗(yàn)基本步驟小結(jié)(1)建立假設(shè) H0: (無效假設(shè)) 總體參數(shù)相等 H1: (備擇假設(shè)) 總體參數(shù)不等(2)確定檢驗(yàn)水準(zhǔn) 通常 = 0.05(3)選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量 如:、F、X2 等(4) 確定P值,作出推斷結(jié)論 P時(shí),則拒絕H0,接受H1 P時(shí), 則不拒絕H0 應(yīng)用: 用于兩均數(shù)比較的假設(shè)檢驗(yàn); 資料要求: (1)資料隨機(jī)取自正態(tài)總體; (2)兩總體方差齊性(相等)。五、 t 檢驗(yàn)1、樣本均數(shù)與總體均數(shù)比較 例4.4 據(jù)大量調(diào)查知,健康成年男子脈搏的均數(shù)為72次/分,某一身在山區(qū)隨機(jī)調(diào)查了25名健康男子,其脈搏均數(shù)為74.2次/分
53、,標(biāo)準(zhǔn)差為6.0次/分,能否認(rèn)為該山區(qū)成年男子的脈搏高于一般人群? H0: = 0 (72次/分) H1: 0 單側(cè): = 0.05此圖為從 0總體中抽樣(n=25)得到的樣本均數(shù)分布圖注意:統(tǒng)計(jì)分析是在H0前提下進(jìn)行的=74.2 125 24 查t界值表(P804),得單側(cè) t0.05,24 = 1.711 因: t =1.833 t0.05,24 所以:P 0.05 結(jié)論:按照 = 0.05水準(zhǔn),拒絕H0 ,故可認(rèn)為該山區(qū)健康成年男子脈搏高于一般人群。 上例如用雙側(cè)檢驗(yàn),查表得雙側(cè) t0.05,24 = 2.064 則: t =1.833 0.05。結(jié)論相反。 單側(cè)檢驗(yàn)效率要高于雙側(cè)檢驗(yàn)。
54、 如何選擇單側(cè)或雙側(cè)檢驗(yàn)? 主要根據(jù)專業(yè)知識(shí)而定。 如某指標(biāo)只高不低或只低不高。單樣本t檢驗(yàn)SPSS演示 例3-5 某醫(yī)生測(cè)量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L? H 0: = 0 H 1: 0 = 0.05v=n-1=35查表 t0.05/2, 35=2.030 t t0.05/2, 35, P 0.05,按= 0.05水準(zhǔn), 拒絕H0,認(rèn)為鉛作業(yè)男性工人平均血紅蛋白含量低于正常成年男性。 本例n=36, =130.83g/L,S=25.74g/L, 140g/
55、L 2、配對(duì)設(shè)計(jì)的兩均數(shù)比較 同源配對(duì) 觀察指標(biāo)測(cè)自同一受試對(duì)象或標(biāo)本。 異源配對(duì) 觀察指標(biāo)測(cè)自不同受試對(duì)象或標(biāo)本,但不同受試對(duì)象或標(biāo)本配成對(duì)子,每對(duì)除處理因素不同外,其它非處理因素一致或基本一致。 統(tǒng)計(jì)分析是比較配對(duì)差值與總體均數(shù) 0 的差別進(jìn)行的 H0: d= 0 H1: d 0 = 0.05 1=11 n為對(duì)子數(shù)或差值個(gè)數(shù)t0.10,11 = 1.796 , t0.20,11 = 1.363, 故 0.20 P 0.10。 例:某單位研究飲食中缺乏維生素E與肝中維生素A含量的關(guān)系,將同種屬的大白鼠按性別相同,年齡、體重相近者配成對(duì)子,共8對(duì),并將每對(duì)中的兩頭動(dòng)物隨機(jī)分到正常飼料組和E缺乏
56、組,過一定時(shí)期將大白鼠殺死,測(cè)得其肝中A的含量如下表,問不同飼料的大白鼠肝中維生素A含量有無差別?配對(duì)t檢驗(yàn) SPSS演示例3-6 為比較兩種方法對(duì)乳酸飲料中脂肪含量測(cè)定結(jié)果是否不同,隨機(jī)抽取了10份乳酸飲料制品,分別用脂肪酸水解法和哥特里羅紫法測(cè)定其結(jié)果如表3-5第(1)(3)欄。問兩法測(cè)定結(jié)果是否不同?(3)成組設(shè)計(jì)兩樣本均數(shù)的比較 122本例 t= 1.80.05H0: 1= 2 H1: 12 = 0.05成組設(shè)計(jì)兩樣本均數(shù)比較t檢驗(yàn)SPSS演示方差齊性檢驗(yàn)t 檢驗(yàn)結(jié)果(4)成組設(shè)計(jì)的兩樣本幾何均數(shù)的比較 一般認(rèn)為此類資料呈對(duì)數(shù)正態(tài)分布,因此,需將原始資料取對(duì)數(shù)后,再作兩組對(duì)數(shù)值均數(shù)的t
57、檢驗(yàn)。 H0: 兩株的總體幾何均數(shù)相等 H1:兩株的總體幾何均數(shù)不等 = 0.05 將兩組數(shù)據(jù)分別取對(duì)數(shù),X1=lgA,X2=lgB (A、B 分別代表兩組原始數(shù)據(jù))注意:這里直接比較的是 lgG1 與 lgG2 ,但間接說明 了 G1 與 G2 的差別。六、 正態(tài)性檢驗(yàn)1、圖示法(2)峰度系數(shù)(1)偏度系數(shù)2、偏度系數(shù)和峰度系數(shù)檢驗(yàn)(2)峰度系數(shù)= -0.165/0.457= -0.361P 0.5 H0: r 1=0; r 2= 0 H1: r1 0 ; r2 0 = 0. 10(宜稍大以減少型錯(cuò)誤)(1)偏度系數(shù)=0.156/0.230=0.678P 0.5(2)峰度系數(shù)= -0.165
58、/0.457= -0.361P 0.5 H0: r 1=0; r 2= 0 H1: r1 0 ; r2 0 = 0. 10或0.2(1)偏度系數(shù)=0.156/0.230=0.678P 0.53、柯爾莫柯羅夫-斯米爾諾夫(Kolmogorov-Smirnov)檢驗(yàn)一般適用于n大于50樣本的正態(tài)性檢驗(yàn) H0: 正態(tài)分布 H1: 非正態(tài)分布 = 0. 10(宜稍大以減少型錯(cuò)誤)4. Shapira-Wilkinson檢驗(yàn)一般適用于n小于50樣本的正態(tài)性檢驗(yàn)正態(tài)性檢驗(yàn)正態(tài)性檢驗(yàn)正態(tài)性檢驗(yàn)H0: 正態(tài)分布H1: 非正態(tài)分布 = 0.10非正態(tài)七、 兩樣本方差齊性檢驗(yàn)S21 較大, S22 較小。 例:由
59、X光片上測(cè)得兩組病人的肺門橫徑右側(cè)(cm),算得結(jié)果如下,試檢驗(yàn)兩個(gè)方差的齊性。 肺癌病人:n1=10,X1=6.21,S1=1.79cm 矽肺0期病人:n2=50,X2=4.34,S2=0.56cm 1 1= 10 1= 9, = 21= 50 1= 49查附表3,P698(齊性檢驗(yàn)用雙尾界值) 得:F0.10/2,(9,49) F0.10/2,(9,48) =2.08, 所以 P 0.10H0: 兩總體方差相等 H1:兩總體方差不等 = 0.10=1.792/0.562=10.22 一般同質(zhì)的兩組資料方差相差不大,若兩樣本方差相差一倍左右,要注意方差不齊的可能。 問題: 若方差不齊,將如何
60、處理? (1)采用適當(dāng)?shù)淖兞孔儞Q,使達(dá)到方差齊性; (2)采用秩和檢驗(yàn); (3)采用近似法 t檢驗(yàn)(1)選用的方法應(yīng)符合其應(yīng)用條件(2)正確理解差別有無顯著性的統(tǒng)計(jì)意義 結(jié)論中的“拒絕 H0 ,接受H1”,習(xí)慣上亦稱“差別顯著”,不應(yīng)誤解為相差很大。反之,“不拒絕H0”,不應(yīng)誤解為相差不大或一定相等。 例兩篇同類文章,兩樣本均數(shù)比較,甲文P0.05; 乙文 P0.01。是否可認(rèn)為乙文中兩樣本均數(shù)差值較甲文大?為什么?八、 假設(shè)檢驗(yàn)時(shí)應(yīng)注意的問題(3)結(jié)論不能絕對(duì)化 統(tǒng)計(jì)的結(jié)論是按著概率大小作出判斷,若取 = 0.05,此時(shí)拒絕H0 ,仍有0.05的概率犯錯(cuò)誤;同樣,不拒絕H0 ,也可產(chǎn)生錯(cuò)誤。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年學(xué)校消防演練方案
- 人教版五年級(jí)上冊(cè)語文反義詞多音字總結(jié)
- 2025年珍珠奶茶原材料項(xiàng)目可行性研究報(bào)告
- 2025年特種管項(xiàng)目可行性研究報(bào)告
- 重慶科創(chuàng)職業(yè)學(xué)院《蛋白質(zhì)工程》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025春新版六年級(jí)英語下冊(cè)《??季湫土?xí)題》帶答案
- 林芝市重點(diǎn)中學(xué)2025年高三二診模擬生物試題含解析
- 山東省棗莊市臺(tái)兒莊區(qū)2025屆三中初三1月考前適應(yīng)性考試生物試題含解析
- 2025春新版【三年級(jí)語文下冊(cè)】 第1-28課中心思想
- 襄陽科技職業(yè)學(xué)院《臨床醫(yī)學(xué)概論A1》2023-2024學(xué)年第二學(xué)期期末試卷
- 嬰幼兒舒適睡眠環(huán)境打造試題及答案
- 2025年育嬰師考試精神與試題及答案
- 2025年南陽科技職業(yè)學(xué)院單招綜合素質(zhì)考試題庫及答案1套
- 16J914-1 公用建筑衛(wèi)生間
- 廢氣治理設(shè)施運(yùn)行管理規(guī)程、制度
- 腌臘肉制品生產(chǎn)車間工藝布置圖
- 警棍盾牌操教案(共12頁)
- 電氣檢測(cè)報(bào)告樣本
- GB-T-13916-2013-沖壓件形狀和位置未注公差
- 永磁直線發(fā)電機(jī)建模及其性能研究畢業(yè)論文
- 防洪安全專項(xiàng)整治新建棚洞工程新建棚洞實(shí)施性施工組織設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論