版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、程琮獲得院一等獎(jiǎng)?wù)n件醫(yī)學(xué)統(tǒng)計(jì)學(xué)好用The teaching planfor medical studentsProfessor Cheng CongDept. of Preventive Medicine Taishan Medical College2 預(yù)防醫(yī)學(xué)教授,碩士生導(dǎo)師。男,1959年6月出生。漢族,無黨派。1982年12月,山東醫(yī)學(xué)院公共衛(wèi)生專業(yè)五年本科畢業(yè),獲醫(yī)學(xué)學(xué)士學(xué)位。1994年7月,上海醫(yī)科大學(xué)公共衛(wèi)生學(xué)院研究生畢業(yè),獲醫(yī)學(xué)碩士學(xué)位。2003年12月晉升教授?,F(xiàn)任預(yù)防醫(yī)學(xué)教研室副主任。主要從事醫(yī)學(xué)統(tǒng)計(jì)學(xué)、預(yù)防醫(yī)學(xué),醫(yī)學(xué)人口統(tǒng)計(jì)學(xué)等課程的教學(xué)及科研工作,每年聽課學(xué)生500-8
2、00人。自2000年起連續(xù)六年,為碩士研究生開設(shè)醫(yī)學(xué)統(tǒng)計(jì)學(xué)、SPSS統(tǒng)計(jì)分析簡明教程、衛(wèi)生經(jīng)濟(jì)學(xué)等課程,同時(shí)指導(dǎo)研究生的科研設(shè)計(jì)、開題報(bào)告及科研資料的統(tǒng)計(jì)處理與分析。發(fā)表醫(yī)學(xué)統(tǒng)計(jì)學(xué)及預(yù)防醫(yī)學(xué)的科研論文30多篇。代表作有“鋅對(duì)乳癌細(xì)胞生長、增殖與基因表達(dá)的影響”,“行列相關(guān)的測度” 等。主編、副主編各類教材及專著8部,代表作有醫(yī)學(xué)統(tǒng)計(jì)學(xué)、SPSS統(tǒng)計(jì)分析簡明教程獲得院級(jí)科研論文及科技進(jìn)步獎(jiǎng)8項(xiàng),院第四屆教學(xué)能手比賽二等獎(jiǎng)一項(xiàng),院教學(xué)評(píng)建先進(jìn)工作者一項(xiàng)。獲2004年泰山醫(yī)學(xué)院首屆十大教學(xué)名師獎(jiǎng)。 程琮教授簡介3醫(yī)學(xué)統(tǒng)計(jì)學(xué)總目錄 第1章緒論 第2章定量資料統(tǒng)計(jì)描述 第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)
3、 第4章方差分析 第5章定性資料的統(tǒng)計(jì)描述 第6章總體率的區(qū)間估計(jì)和假設(shè)檢驗(yàn) 第7章二項(xiàng)分布與泊松分布 第8章秩和檢驗(yàn) 第9章直線相關(guān)與回歸 第10章實(shí)驗(yàn)設(shè)計(jì) 第11章調(diào)查設(shè)計(jì) 第12章統(tǒng)計(jì)表與統(tǒng)計(jì)圖4第1章緒論 目錄 第五節(jié) 學(xué)習(xí)統(tǒng)計(jì)學(xué)應(yīng)注意的幾個(gè)問題 第二節(jié) 統(tǒng)計(jì)工作的基本步驟 第三節(jié) 統(tǒng)計(jì)資料的類型 第四節(jié) 統(tǒng)計(jì)學(xué)中的幾個(gè)基本概念 第一節(jié) 醫(yī)學(xué)統(tǒng)計(jì)學(xué)的定義和內(nèi)容5第一章 緒論第一節(jié) 醫(yī)學(xué)統(tǒng)計(jì)學(xué)的定義和內(nèi)容 醫(yī)學(xué)統(tǒng)計(jì)學(xué)(medical statistics) -是以醫(yī)學(xué)理論為指導(dǎo),運(yùn)用數(shù)理統(tǒng)計(jì)學(xué)的原理和方法研究醫(yī)學(xué)資料的搜集、整理與分析,從而掌握事物內(nèi)在客觀規(guī)律的一門學(xué)科。 6醫(yī)學(xué)研究的對(duì)
4、象-主要是人以及與其健康有關(guān)的各種影響因素。醫(yī)學(xué)統(tǒng)計(jì)學(xué)的主要內(nèi)容 :1.統(tǒng)計(jì)設(shè)計(jì) 包括實(shí)驗(yàn)設(shè)計(jì)和調(diào)查設(shè)計(jì),它可以合理地、科學(xué)地安排實(shí)驗(yàn)和調(diào)查工作,使之能較少地花費(fèi)人力、物力和時(shí)間,取得較滿意和可靠的結(jié)果。2.資料的統(tǒng)計(jì)描述和總體指標(biāo)的估計(jì) 通過計(jì)算各種統(tǒng)計(jì)指標(biāo)和統(tǒng)計(jì)圖表來描述資料的集中趨勢、離散趨勢和分布特征況(如正態(tài)分布或偏態(tài)分布);利用樣本指標(biāo)來估計(jì)總體指標(biāo)的大小。 73.假設(shè)檢驗(yàn) 是通過統(tǒng)計(jì)檢驗(yàn)方法(如t檢驗(yàn)、u檢驗(yàn)、F檢驗(yàn)、卡方檢驗(yàn)、秩和檢驗(yàn)等)來推斷兩組或多組統(tǒng)計(jì)指標(biāo)的差異是抽樣誤差造成的還是有本質(zhì)的差別。4.相關(guān)與回歸 醫(yī)學(xué)中存在許多相互聯(lián)系、相互制約的現(xiàn)象。如兒童的身高與體重、胸
5、圍與肺活量、血糖與尿糖等,都需要利用相關(guān)與回歸來分析。8 5.多因素分析 如多元回歸、判別分析、聚類分析、正交設(shè)計(jì)分析、主成分分析、因子分析、logistic回歸、Cox比例風(fēng)險(xiǎn)回歸等,都是分析醫(yī)學(xué)中多因素有效的方法(本書不涉及,請(qǐng)參考有關(guān)統(tǒng)計(jì)書籍)。這些方法計(jì)算復(fù)雜,大部分需借助計(jì)算機(jī)來完成。 6.健康統(tǒng)計(jì) 研究人群健康的指標(biāo)與統(tǒng)計(jì)方法,除了用上述的某些方法外,他還有其特有的方法,如壽命表、生存分析、死因分析、人口預(yù)測等方法9醫(yī)學(xué)統(tǒng)計(jì)工作可分為四個(gè)步驟:統(tǒng)計(jì)設(shè)計(jì)、搜集資料、整理資料和分析資料。這四個(gè)步驟密切聯(lián)系,缺一不可,任何一個(gè)步驟的缺陷和失誤,都會(huì)影響統(tǒng)計(jì)結(jié)果的正確性。第二節(jié) 統(tǒng)計(jì)工作的
6、基本步驟 10設(shè)計(jì)(design)是統(tǒng)計(jì)工作的第一步,也是關(guān)鍵的一步,是對(duì)統(tǒng)計(jì)工作全過程的設(shè)想和計(jì)劃安排。 統(tǒng)計(jì)設(shè)計(jì)就是根據(jù)研究目的確定試驗(yàn)因素、受試對(duì)象和觀察指標(biāo),并在現(xiàn)有的客觀條件下決定用什么方式和方法來獲取原始資料,并對(duì)原始資料如何進(jìn)行整理,以及整理后的資料應(yīng)該計(jì)算什么統(tǒng)計(jì)指標(biāo)和統(tǒng)計(jì)分析的預(yù)期結(jié)果如何等。 一、統(tǒng)計(jì)設(shè)計(jì) 11搜集資料(collection of date) 是根據(jù)設(shè)計(jì)的要求,獲取準(zhǔn)確可靠的原始資料,是統(tǒng)計(jì)分析結(jié)果可靠的重要保證。醫(yī)學(xué)統(tǒng)計(jì)資料的來源主要有以下三個(gè)方面:1.統(tǒng)計(jì)報(bào)表 統(tǒng)計(jì)報(bào)表是醫(yī)療衛(wèi)生機(jī)構(gòu)根據(jù)國家規(guī)定的報(bào)告制度,定期逐級(jí)上報(bào)的有關(guān)報(bào)表。如法定傳染病報(bào)表、出生死
7、亡報(bào)表、醫(yī)院工作報(bào)表等,報(bào)表要完整、準(zhǔn)確、及時(shí)。 二、搜集資料122.醫(yī)療衛(wèi)生工作記錄 如病歷、醫(yī)學(xué)檢查記錄、衛(wèi)生監(jiān)測記錄等。 3.專題調(diào)查或?qū)嶒?yàn)研究 它是根據(jù)研究目的選定的專題調(diào)查或?qū)嶒?yàn)研究,搜集資料有明確的目的與針對(duì)性。它是醫(yī)學(xué)科研資料的主要來源。13 整理資料(sorting data)的目的就是將搜集到的原始資料進(jìn)行反復(fù)核對(duì)和認(rèn)真檢查,糾正錯(cuò)誤,分類匯總,使其系統(tǒng)化、條理化,便于進(jìn)一步的計(jì)算和分析。整理資料的過程如下:1.審核:認(rèn)真檢查核對(duì),保證資料的準(zhǔn)確性和完整性。 2.分組:歸納分組,分組方法有兩種: 質(zhì)量分組,即將觀察單位按其類別或?qū)傩苑纸M,如按性別、職業(yè)、陽性和陰性等分組。數(shù)量
8、分組,即將觀察單位按其數(shù)值的大小分組,如按年齡的大小、藥物劑量的大小等分組。三、整理資料 143.匯總: 分組后的資料要按照設(shè)計(jì)的要求進(jìn)行匯總,整理成統(tǒng)計(jì)表。原始資料較少時(shí)用手工匯總,當(dāng)原始資料較多時(shí),可使用計(jì)算機(jī)匯總。四、分析資料 分析資料(analysis of data) 是根據(jù)設(shè)計(jì)的要求,對(duì)整理后的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)分析,結(jié)合專業(yè)知識(shí),作出科學(xué)合理的解釋。 151.統(tǒng)計(jì)描述(descriptive statistics) 將計(jì)算出的統(tǒng)計(jì)指標(biāo)與統(tǒng)計(jì)表、統(tǒng)計(jì)圖相結(jié)合,全面描述資料的數(shù)量特征及分布規(guī)律。 2.統(tǒng)計(jì)推斷(inferential statistics) 使用樣本信息推斷總體特征。通過
9、樣本統(tǒng)計(jì)量進(jìn)行總體參數(shù)的估計(jì)和假設(shè)檢驗(yàn),以達(dá)到了解總體的數(shù)量特征及其分布規(guī)律,才是最終的研究目的。 統(tǒng)計(jì)分析包括以下兩大內(nèi)容: 16醫(yī)學(xué)統(tǒng)計(jì)資料按研究指標(biāo)的性質(zhì)一般分為定量資料、定性資料和等級(jí)資料三大類。一、定量資料定量資料(quantitative data) 亦稱計(jì)量資料(measurement data),是用定量的方法測定觀察單位(個(gè)體)某項(xiàng)指標(biāo)數(shù)值的大小,所得的資料稱定量資料。如身高()、體重()、脈搏(次/分)、血壓(kPa)等為數(shù)值變量,其組成的資料為定量資料。 第三節(jié) 統(tǒng)計(jì)資料的類型 17 定性資料(qualitative data) 亦稱計(jì)數(shù)資料(enumeration da
10、ta)或分類資料(categorical data),是將觀察單位按某種屬性或類別分組,清點(diǎn)各組的觀察單位數(shù),所得的資料稱定性資料。 定性資料的觀察指標(biāo)為分類變量(categorical variable)。如人的性別按男、女分組;化驗(yàn)結(jié)果按陽性、陰性分組;動(dòng)物實(shí)驗(yàn)按生存、死亡分組;調(diào)查某人群的血型按A、B、O、AB分組等,觀察單位出現(xiàn)的結(jié)果為分類變量,分類變量沒有量的差別,只有質(zhì)的不同,其組成的資料為定性資料。二、定性資料 18三、等級(jí)資料等級(jí)資料(ranked data)亦稱有序分類資料(ordinal categorical data),是將觀察單位按屬性的等級(jí)分組,清點(diǎn)各組的觀察單位數(shù)
11、,所得的資料為等級(jí)資料。如治療結(jié)果分為治愈、顯效、好轉(zhuǎn)、無效四個(gè)等級(jí)。 19 根據(jù)需要,各類變量可以互相轉(zhuǎn)化。若按貧血的診斷標(biāo)準(zhǔn)將血紅蛋白分為四個(gè)等級(jí):重度貧血、中度貧血、輕度貧血、正常,可按等級(jí)資料處理。有時(shí)亦可將定性資料或等級(jí)資料數(shù)量化,如將等級(jí)資料的治療結(jié)果賦以分值,分別用0、1、2等表示,則可按定量資料處理。 如調(diào)查某人群的尿糖的情況,以人為觀察單位,結(jié)果可分、五個(gè)等級(jí)。 20同質(zhì)(homogeneity) 是指觀察單位或研究個(gè)體間被研究指標(biāo)的主要影響因素相同或基本相同。如研究兒童的生長發(fā)育,同性別、同年齡、同地區(qū)、同民族、健康的兒童即為同質(zhì)兒童。變異(variation) 由于生物個(gè)
12、體的各種指標(biāo)所受影響因素極為復(fù)雜,同質(zhì)的個(gè)體間各種指標(biāo)存在差異,這種差異稱為變異。如同質(zhì)的兒童身高、體重、血壓、脈搏等指標(biāo)會(huì)有一定的差別。第四節(jié) 統(tǒng)計(jì)學(xué)中的幾個(gè)基本概念一、同質(zhì)與變異21二、總體與樣本樣本(sample):是從總體中隨機(jī)抽取的部分觀察單位變量值的集合。樣本的例數(shù)稱為樣本含量(sample size)。注意:1。總體是相對(duì)的,總體的大小是根據(jù)研究目的而確定的。2。樣本應(yīng)有代表性,即應(yīng)該隨機(jī)抽樣并有足夠的樣本含量。 22圖示:總體與樣本populationsample2sample1sample3sample4 sample523三、參數(shù)與統(tǒng)計(jì)量參數(shù)(parameter):由總體計(jì)
13、算或得到的統(tǒng)計(jì)指標(biāo)稱為參數(shù)??傮w參數(shù)具有很重要的參考價(jià)值。如總體均數(shù),總體標(biāo)準(zhǔn)差等。統(tǒng)計(jì)量(statistic):由樣本計(jì)算的指標(biāo)稱為統(tǒng)計(jì)量。如樣本均數(shù),樣本標(biāo)準(zhǔn)差s等。注意:一般不容易得到參數(shù),而容易獲得樣本統(tǒng)計(jì)量。24四、抽樣誤差抽樣誤差(sample error): 由于隨機(jī)抽樣所引起的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異以及樣本統(tǒng)計(jì)量之間的差別稱為抽樣誤差。如樣本均數(shù)與總體均數(shù)之間的差別,樣本率與總體率的差別等。注意:抽樣誤差是不可避免的。無論抽樣抽得多么好,也會(huì)存在抽樣誤差。25五、概率概率(probability):是描述隨機(jī)事件發(fā)生可能性大小的量值。用英文大寫字母P來表示。概率的取值范
14、圍在01之間。當(dāng)P0時(shí),稱為不可能事件;當(dāng)P1時(shí),稱為必然事件。小概率事件:統(tǒng)計(jì)學(xué)上一般把P0.05或P0.01的事件稱為小概率事件。小概率原理:小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生。利用該原理可對(duì)科研資料進(jìn)行假設(shè)檢驗(yàn)。26第五節(jié) 學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)應(yīng)注意的問題 1.重點(diǎn)掌握醫(yī)學(xué)統(tǒng)計(jì)學(xué)的基本知識(shí)、基本技能、基本概念和基本方法,掌握使用范圍和注意事項(xiàng)。2.要培養(yǎng)科學(xué)的統(tǒng)計(jì)思維方法,提高分析問題、解決問題的能力。 3.掌握調(diào)查設(shè)計(jì)和實(shí)驗(yàn)設(shè)計(jì)的原則,培養(yǎng)搜集、整理、分析統(tǒng)計(jì)資料的系統(tǒng)工作能力。 27課后作業(yè) 列舉出計(jì)量資料、分類資料、等級(jí)資料各10個(gè)實(shí)例。 列舉出可能事件、必然事件、不可能事件及小概率事
15、件各10個(gè)。 認(rèn)真復(fù)習(xí)本章已學(xué)過的基本概念23遍。28 Best Wishes to All of You! Thank You for Listening!THE END 29醫(yī)學(xué)本科生用主講 程 琮泰山醫(yī)學(xué)院預(yù)防醫(yī)學(xué)教研室醫(yī)學(xué)統(tǒng)計(jì)學(xué)30The teaching planfor medical studentsProfessor Cheng CongDept. of Preventive Medicine Taishan Medical College31第2章定量資料的統(tǒng)計(jì)描述 目錄 第二節(jié) 集中趨勢的描述 第三節(jié) 離散趨勢的描述 第四節(jié) 正態(tài)分布 第一節(jié) 頻數(shù)分布表32統(tǒng)計(jì)描述:是用統(tǒng)計(jì)
16、圖表、統(tǒng)計(jì)指標(biāo)來描述資料的分布規(guī)律及其數(shù)量特征。頻數(shù)分布表(frequency distribution table):主要由組段和頻數(shù)兩部分組成表格。第一節(jié) 頻數(shù)分布表第二章 定量資料的統(tǒng)計(jì)描述33二、頻數(shù)分布表的編制 編制步驟 :1. 計(jì)算全距 (range): 一組變量值最大值和最小值之差稱為全距(range),亦稱極差,常用R表示。 2. 確定組距(class interval): 組距用i表示; 3. 劃分組段: 每個(gè)組段的起點(diǎn)稱組下限,終點(diǎn)稱組上限。一般分為815組。 ;4. 統(tǒng)計(jì)頻數(shù): 將所有變量值通過劃記逐個(gè)歸入相應(yīng)組段 ;5.頻率與累計(jì)頻率: 將各組的頻數(shù)除以n所得的比值被稱
17、為頻率。累計(jì)頻率等于累計(jì)頻數(shù)除以總例數(shù)。 34表2-2 某年某市120名12歲健康男孩身高(cm)的頻數(shù)分布 身高組段 (1) 頻數(shù) (2)頻率(%) (3)累計(jì)頻數(shù) (4)累計(jì)頻率 (%) (5)12510.83 10.8312943.33 54.17133108.34 1512.50合計(jì)120100.003536二、頻數(shù)分布表的用途 1.揭示資料的分布類型 2.觀察資料的集中趨勢和離散趨勢 3.便于發(fā)現(xiàn)某些特大或特小的可疑值 4.便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和作統(tǒng)計(jì)處理 3738第二節(jié) 集中趨勢的描述 集中趨勢 :代表一組同質(zhì)變量值的集中趨勢 或平均水平。 常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)和中位
18、數(shù)。另外不常用的有:眾數(shù),調(diào)和平均數(shù)和調(diào)整均數(shù)等。39一、算術(shù)均數(shù)算術(shù)均數(shù) (arithmetic mean): 簡稱均數(shù)。適用條件:對(duì)稱分布或近似對(duì)稱分布的資料。 習(xí)慣上以希臘字母表示總體均數(shù)(population mean),以英文字母表示樣本均數(shù)(sample mean)401. 直接法:用于觀察值個(gè)數(shù)不多時(shí) 計(jì)算方法41(weighting method):用于變量值個(gè)數(shù) 較多時(shí)。 注意:權(quán)數(shù)即頻數(shù)f,為權(quán)重權(quán)衡之意。42 身高 (1) 組中值X (2) 頻數(shù)f (3) fX(4)=(2)(3) fX2(5)=(2)(4) 1251271127161291291314524686441
19、33135101350182250合計(jì) 120 17168 2460040 表2-4 120名12歲健康男孩身高(cm)均數(shù)和標(biāo)準(zhǔn)差加權(quán)法計(jì)算表 4344cm。 計(jì)算結(jié)果45幾何均數(shù)(geometric mean,簡記為):表示其平均水平。 適用條件:對(duì)于變量值呈倍數(shù)關(guān)系或呈對(duì)數(shù)正態(tài)分布(正偏態(tài)分布),如抗體效價(jià)及抗體滴度,某些傳染病的潛伏期,細(xì)菌計(jì)數(shù)等。計(jì)算公式:有直接法和加權(quán)法。 二、幾何均數(shù) 461.直接法: 用于變量值的個(gè)數(shù)n較少時(shí) 47直接法計(jì)算實(shí)例482.加權(quán)法 : 用于資料中相同變量值的個(gè)數(shù)f(即頻數(shù))較多時(shí)。 49 抗體滴度 (1)頻數(shù)f (2)滴度倒數(shù)X (3) lgX (4
20、) flgX (5)=(2)(4) 1:4240.60201.20401:8680.90315.41861:167161.20418.4287合計(jì) 50 89.1045 表2-5 50名兒童麻疹疫苗接種后血凝抑制抗體滴度幾何均數(shù)計(jì)算表505150名兒童麻疹疫苗接種后平均血凝抑制抗體滴度為。 計(jì)算結(jié)果:將有關(guān)已知數(shù)據(jù)代入公式有52變量值中不能有0;不能同時(shí)有正值和負(fù)值;若全是負(fù)值,計(jì)算時(shí)可先把負(fù)號(hào)去掉,得出結(jié)果后再加上負(fù)號(hào)。計(jì)算幾何均數(shù)注意事項(xiàng):53中位數(shù) 定義:將一組變量值從小到大按順序排列,位次居中的變量值稱為中位數(shù)(median,簡記為M)。適用條件:變量值中出現(xiàn)個(gè)別特小或特大的數(shù)值;資料
21、的分布呈明顯偏態(tài),即大部分的變量值偏向一側(cè);變量值分布一端或兩端無確定數(shù)值,只有小于或大于某個(gè)數(shù)值;資料的分布不清。 三、中位數(shù)及百分位數(shù) 54定義:百分位數(shù)(percentile)是一種位置指標(biāo),以Px表示。百分位數(shù)是將頻數(shù)等分為一百的分位數(shù)。一組觀察值從小到大按順序排列,理論上有x%的變量值比Px小,有(100-x)%的變量值比Px大。故P50分位數(shù)也就是中位數(shù),即P50=M 。 百分位數(shù) 55描述一組資料在某百分位置上的水平;用于確定正常值范圍;計(jì)算四分位數(shù)間距。百分位數(shù)的應(yīng)用條件:56計(jì)算方法:有直接法和加權(quán)法1.直接法:用于例數(shù)較少時(shí) n為奇數(shù)時(shí) n為偶數(shù)時(shí) 572.頻數(shù)表法: 用于
22、例數(shù)較多時(shí) 中位數(shù)百分位數(shù)58 潛伏期(小時(shí)) (1)頻數(shù)f (2)累計(jì)頻數(shù) (3) 累計(jì)頻率() (4) 0171711.76 466343.412 3810169.9合計(jì) 145 表2-6 145例食物中毒病人潛伏期分布表 5960先找到包含Px的最小累計(jì)頻率;該累計(jì)頻率同行左邊的組段值為L;L同行右邊的頻數(shù)為fx(或fm);L前一行的累計(jì)頻數(shù)為fL;將上述已知條件代入公式計(jì)算Px或P50 。計(jì)算中位數(shù)及百分位數(shù)的步驟:61計(jì)算結(jié)果:62定義:用來說明變量值的離散程度或變異程度。注意:僅用集中趨勢尚不能完全反映一組數(shù)據(jù)的特征。故應(yīng)將集中趨勢和離散趨勢結(jié)合起來才能更好地反映一組數(shù)據(jù)的特征。常
23、用離散指標(biāo)有:極差、四分位數(shù)間距、標(biāo)準(zhǔn)差、方差、變異系數(shù)。第三節(jié) 離散趨勢的描述 63甲組: 184 186 188 190 192乙組: 180 184 188 192 196兩組球員的平均身高都是188cm,但甲組球員身高比較集中,乙組球員身高比較分散。為了說明離散趨勢,就要用離散指標(biāo)。 實(shí)例分析64極差 極差(range,簡記為R)亦稱全距,即一組變量值中最大值與最小值之差 。特點(diǎn):計(jì)算簡單,不穩(wěn)定,不全面,易變化;可用于各種分布的資料。一、極差和四分位數(shù)間距 65四分位數(shù)間距 公式: Q= P75P25 特點(diǎn):比極差穩(wěn)定,只反映中間兩端值的差異。 計(jì)算不太方便??捎糜诟鞣N分布的資料。6
24、6二、方差和標(biāo)準(zhǔn)差 方差(variance) 總體方差 樣本方差 67自由度(degree of freedom)的概念n-1是自由度,用希臘小寫字母表示,讀作nju:。定義:在N維或N度空間中能夠自由選擇的維數(shù)或度數(shù)。例:ABC,共有n=3個(gè)元素,其中只能任選2個(gè)元素的值,故自由度n-1=3-1=2。 68方差的特點(diǎn)充分反映每個(gè)數(shù)據(jù)間的離散狀況,意義深刻;指標(biāo)穩(wěn)定,應(yīng)用廣泛,但計(jì)算較為復(fù)雜,不易理解;方差的單位與原數(shù)據(jù)不同,有時(shí)使用時(shí)不太方便;在方差分析中應(yīng)用甚廣而極為重要。69(二)標(biāo)準(zhǔn)差(standard deviation) 總體標(biāo)準(zhǔn)差 樣本標(biāo)準(zhǔn)差 70牢記:離均差平方和展開式: 71
25、標(biāo)準(zhǔn)差的特點(diǎn):意義同方差,是方差的開平方;標(biāo)準(zhǔn)差的單位與原數(shù)據(jù)相同,使用方便,意義深刻,應(yīng)用廣泛;故一般已作為醫(yī)學(xué)生物學(xué)領(lǐng)域中反映變異的標(biāo)準(zhǔn),故稱標(biāo)準(zhǔn)差。72標(biāo)準(zhǔn)差的計(jì)算方法:可分為直接法和加權(quán)法。 2.加權(quán)法 73直接法:標(biāo)準(zhǔn)差計(jì)算實(shí)例:例2.12 例2.2中7名正常男子紅細(xì)胞數(shù)(1012/L)如下:4.67, 4.74, 4.77, 4.88,4.76, 4.72, 4.92,計(jì)算其標(biāo)準(zhǔn)差。 x22222222 74計(jì)算結(jié)果:75例2.13 對(duì)表2-4資料用加權(quán)法計(jì)算120名12歲健康男孩身高值的標(biāo)準(zhǔn)差。加權(quán)法:標(biāo)準(zhǔn)差計(jì)算實(shí)例:在表2-4中已算得fx=17168,fx2 =2460040,
26、 代入公式 76變異系數(shù)(coefficient of variation): 簡記為CV ;特征:變異系數(shù)為無量綱單位,可以比較不同單位指標(biāo)間的變異度;變異系數(shù)消除了均數(shù)的大小對(duì)標(biāo)準(zhǔn)差的影響,所以可以比較兩均數(shù)相差較大時(shí)指標(biāo)間的變異度。 三、變異系數(shù)77cmcmkg,kg。試比較身高與體重的變異程度。變異系數(shù) 計(jì)算實(shí)例78身高 體重變異系數(shù) 計(jì)算結(jié)果79第四節(jié) 正態(tài)分布一、正態(tài)分布的概念和特征 正態(tài)分布(normal distribution):也稱高斯分布,是醫(yī)學(xué)和生物學(xué)最常見的連續(xù)性分布。如身高、體重、紅細(xì)胞數(shù)、血紅蛋白等。 80圖2-1 120名12歲健康男孩身高的頻數(shù)分布81 正態(tài)分
27、布的函數(shù)和圖形正態(tài)分布的密度函數(shù),即正態(tài)曲線的方程為:82圖2-2 頻數(shù)分布逐漸接近正態(tài)分布示意 83為了應(yīng)用方便,常按公式(2.19)作變量變換 u值稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差,有的參考書也將u值稱為z值。 84這樣將正態(tài)分布變換為標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution) 85圖2-3 正態(tài)分布的面積與縱高 86正態(tài)分布的特征 1. 集中性 正態(tài)曲線的高峰位于正中央, 即均數(shù)所在的位置。對(duì)稱性 正態(tài)曲線以均數(shù)為中心,左右對(duì)稱, 3. 正態(tài)分布有兩個(gè)參數(shù),即均數(shù)和標(biāo)準(zhǔn)差。 4. 正態(tài)曲線下面積有一定的分布規(guī)律 87圖2-4 不同標(biāo)準(zhǔn)差的正態(tài)分布示意 88二、
28、正態(tài)曲線下面積的分布規(guī)律 89標(biāo)準(zhǔn)正態(tài)分布表(u值表) 標(biāo)準(zhǔn)正態(tài)分布曲線下的面積,由此表可查出曲線下某區(qū)間的面積。查表時(shí)應(yīng)注意:表中曲線下面積為-到u 的下側(cè)累計(jì)面積;當(dāng)已知、和X時(shí),先按公式(2.19)求得u值,再查表;當(dāng)和未知時(shí),并且樣本例數(shù)在100例以上,常用樣本均數(shù)和標(biāo)準(zhǔn)差S分別代替和 ,按公式(2.19)求得u值;曲線下橫軸上的總面積為100%或1 90 前例2.1中,某年某市120名12歲健康男孩身高,已知均數(shù)=143.07cm,標(biāo)準(zhǔn)差S=5.70cm,估計(jì)該地12歲健康男孩身高在135cm以下者占該地12歲男孩總數(shù)的百分?jǐn)?shù);估計(jì)身高界于135cm150cm范圍內(nèi)12歲男孩的比例;
29、分別求出均數(shù)1SSS范圍內(nèi)12歲男孩人數(shù)占該120名男孩總數(shù)的實(shí)際百分?jǐn)?shù),說明與理論百分?jǐn)?shù)是否接近。91根據(jù)題意,按公式(2.19)作u變換 92身高范圍所占面積 故估計(jì)該地12男孩身高在135cm以下者約占7.78; 身高界于135cm150cm范圍內(nèi)者約占81.10。 93三、正態(tài)分布的應(yīng)用 制定醫(yī)學(xué)參考值范圍 參考值范圍也稱為正常值范圍。醫(yī)學(xué)上常把絕大數(shù)正常人的某指標(biāo)范圍稱為該指標(biāo)的正常值范圍。這里的“絕大多數(shù)”可以是90、95、99,最常用的是95。質(zhì)量控制 常以均數(shù)2S作為上、下警戒值,以均數(shù)3S作為上、下控制值。 正態(tài)分布是很多統(tǒng)計(jì)方法的理論基礎(chǔ) 94THE END THANK Y
30、OU FOR LISTENING95本科生用醫(yī)學(xué)統(tǒng)計(jì)學(xué)教案主講 程 琮泰山醫(yī)學(xué)院預(yù)防醫(yī)學(xué)教研室96The teaching planfor medical studentsProfessor Cheng CongDept. of Preventive Medicine Taishan Medical College97第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn) 目錄 第五節(jié) 均數(shù)的 u 檢驗(yàn) 第二節(jié) t 分布 第三節(jié) 總體均數(shù)的區(qū)間估計(jì) 第四節(jié) 假設(shè)檢驗(yàn)的意義和基本步驟 第一節(jié) 均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤 第六節(jié) 均數(shù)的 t 檢驗(yàn) 第七節(jié)兩個(gè)方差的齊性檢驗(yàn)和t檢驗(yàn) 第八節(jié) 型錯(cuò)誤和型錯(cuò)誤 第九節(jié) 應(yīng)用假設(shè)
31、檢驗(yàn)應(yīng)注意的問題98圖示:總體與樣本Populationsample2sample1sample3sample4 sample599一、標(biāo)準(zhǔn)誤的意義及其計(jì)算統(tǒng)計(jì)推斷(statistical inference) :根據(jù)樣本信息來推論總體特征。均數(shù)的抽樣誤差 :由抽樣引起的樣本均數(shù)與總體均數(shù)的差異稱為均數(shù)的抽樣誤差。 標(biāo)準(zhǔn)誤(standard error):反映均數(shù)抽樣誤差大小的指標(biāo)。 第一節(jié) 均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤100已知:標(biāo)準(zhǔn)誤計(jì)算公式未知:101 實(shí)例:cmcm,按公式計(jì)算,則標(biāo)準(zhǔn)誤為:102 ;2.進(jìn)行總體均數(shù)的區(qū)間估計(jì); 3.進(jìn)行均數(shù)的假設(shè)檢驗(yàn)等 。二、標(biāo)準(zhǔn)誤的應(yīng)用 103正態(tài)變量X
32、采用u(X)/變換,則一般的正態(tài)分布N (,)即變換為標(biāo)準(zhǔn)正態(tài)分布N (0,1)。又因從正態(tài)總體抽取的樣本均數(shù)服從正態(tài)分布 N(, ),同樣可作正態(tài)變量的u變換,即第二節(jié) t 分布 一、t 分布的概念 104 實(shí)際工作中由于理論的標(biāo)準(zhǔn)誤往往未知,而用樣本的標(biāo)準(zhǔn)誤作為的估計(jì)值, 此時(shí)就不是u變換而是t變換了,即下式: 105t分布于1908年由英國統(tǒng)計(jì)學(xué)家以“Student”筆名發(fā)表,故又稱Student t 分布(Students t-distribution)。 106二、t分布曲線的特征 t分布曲線是單峰分布,以0為中心,左右兩側(cè)對(duì)稱,曲線的中間比標(biāo)準(zhǔn)正態(tài)曲線(u分布曲線)低,兩側(cè)翹得比標(biāo)
33、準(zhǔn)正態(tài)曲線略高。t分布曲線隨自由度而變化,當(dāng)樣本含量越?。▏?yán)格地說是自由度 =n-1越?。瑃分布與u分布差別越大;當(dāng)逐漸增大時(shí),t分布逐漸逼近于u分布,當(dāng) =時(shí),t分布就完全成正態(tài)分布 。t分布曲線是一簇曲線,而不是一條曲線。t分布下面積分布規(guī)律:查t分布表。107t 分布示意圖108t分布曲線下雙側(cè)或單側(cè)尾部合計(jì)面積我們常把自由度為的t分布曲線下雙側(cè)尾部合計(jì)面積或單側(cè)尾部面積為指定值時(shí),則橫軸上相應(yīng)的t界值記為t,。如當(dāng) =20, =0.05時(shí),記為t0.05, 20;當(dāng) =22, =0.01時(shí),記為t0.01, 22。對(duì)于t, 值,可根據(jù)和值,查附表2,t界值表。109t分布是t檢驗(yàn)的理
34、論基礎(chǔ)。由公式(3.4)可知,t值與樣本均數(shù)和總體均數(shù)之差成正比,與標(biāo)準(zhǔn)誤成反比 。在t分布中t值越大,其兩側(cè)或單側(cè)以外的面積所占曲線下總面積的比重就越小 ,說明在抽樣中獲得此t值以及更大t值的機(jī)會(huì)就越小,這種機(jī)會(huì)的大小是用概率P來表示的。t值越大,則P值越??;反之,t值越小,P值越大。根據(jù)上述的意義,在同一自由度下,t t ,則P ; 反之,tt,則P。110第三節(jié) 總體均數(shù)的區(qū)間估計(jì) 參數(shù)估計(jì):用樣本指標(biāo)(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)(參數(shù))稱為參數(shù)估計(jì)。估計(jì)總體均數(shù)的方法有兩種,即:點(diǎn)值估計(jì)(point estimation )區(qū)間估計(jì)(interval estimation)。111一、點(diǎn)值估
35、計(jì) 點(diǎn)值估計(jì):是直接用樣本均數(shù)作為總體均數(shù)的估計(jì)值。此法計(jì)算簡便,但由于存在抽樣誤差,通過樣本均數(shù)不可能準(zhǔn)確地估計(jì)出總體均數(shù)大小,也無法確知總體均數(shù)的可靠程度 。112二、區(qū)間估計(jì) 區(qū)間估計(jì)是按一定的概率(1-)估計(jì)包含總體均數(shù)可能的范圍,該范圍亦稱總體均數(shù)的可信區(qū)間(confidence interval,縮寫為CI)。1-稱為可信度,常取1-為0.95和0.99,即總體均數(shù)的95%可信區(qū)間和99%可信區(qū)間。1-(如95)可信區(qū)間的含義是:總體均數(shù)被包含在該區(qū)間內(nèi)的可能性是1-,即(95),沒有被包含的可能性為,即(5)。113總體均數(shù)的可信區(qū)間的計(jì)算 且n較小(n100),可用u檢驗(yàn)。不同
36、的統(tǒng)計(jì)檢驗(yàn)方法,可得到不同的統(tǒng)計(jì)量,如t 值和u值。1244.確定概率P值 P值是指在H0所規(guī)定的總體中作隨機(jī)抽樣,獲得等于及大于(或小于)現(xiàn)有統(tǒng)計(jì)量的概率。t t, ,則P ;t 。 1255.作出推斷結(jié)論 當(dāng)P時(shí),表示在H0成立的條件下,出現(xiàn)等于及大于現(xiàn)有統(tǒng)計(jì)量的概率是小概率,根據(jù)小概率事件原理,現(xiàn)有樣本信息不支持H0,因而拒絕H0,結(jié)論為按所取檢驗(yàn)水準(zhǔn)拒絕H0,接受H1,即差異有統(tǒng)計(jì)學(xué)意義,如例3.3 可認(rèn)為兩總體脈搏均數(shù)有差別;當(dāng)P時(shí),表示在H0成立的條件下,出現(xiàn)等于及大于現(xiàn)有統(tǒng)計(jì)量的概率不是小概率,現(xiàn)有樣本信息還不能拒絕H0,結(jié)論為按所取檢驗(yàn)水準(zhǔn)不拒絕H0,即差異無統(tǒng)計(jì)意義,如例3.
37、3 尚不能認(rèn)為兩總體脈搏均數(shù)有差別。126下結(jié)論時(shí)的注意點(diǎn):P ,拒絕H0,不能認(rèn)為H0肯定不成立,因?yàn)殡m然在H0成立的條件下出現(xiàn)等于及大于現(xiàn)有統(tǒng)計(jì)量的概率雖小,但仍有可能出現(xiàn);同理,P ,不拒絕H0,更不能認(rèn)為H0肯定成立。由此可見,假設(shè)檢驗(yàn)的結(jié)論是具有概率性的,無論拒絕H0或不拒絕H0,都有可能發(fā)生錯(cuò)誤,即第一類錯(cuò)誤或第二類錯(cuò)誤 127第五節(jié) 均數(shù)的u檢驗(yàn)國外統(tǒng)計(jì)書籍及統(tǒng)計(jì)軟件亦稱為單樣本u檢驗(yàn)(one sample u-test)。樣本均數(shù)與總體均數(shù)比較的u檢驗(yàn)適用于:總體標(biāo)準(zhǔn)差已知的情況;樣本含量較大時(shí),比如n100時(shí)。對(duì)于后者,是因?yàn)閚較大,也較大,則t分布很接近u分布的緣故。 一、
38、樣本均數(shù)與總體均數(shù)比較的u檢驗(yàn)128u 值的計(jì)算公式為:總體標(biāo)準(zhǔn)差已知時(shí),不管n的大小??傮w標(biāo)準(zhǔn)差未知時(shí),但n100時(shí)。129 某托兒所三年來測得2124月齡的47名男嬰平均體重11kg。查得近期全國九城市城區(qū)大量調(diào)查的同齡男嬰平均體重11.18kg,標(biāo)準(zhǔn)差為1.23kg。問該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平有無不同?(全國九城市的調(diào)查結(jié)果可作為總體指標(biāo)) 實(shí) 例130(1)建立檢驗(yàn)假設(shè) H0: 0 ,即該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平相同, 0.05(雙側(cè))H1: 0 ,即該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平不同。(2)計(jì)算u值 本例因總體標(biāo)準(zhǔn)差已知
39、,故可用u檢驗(yàn)。本例n=47, 樣本均數(shù)=11, 總體均數(shù)=11.18,總體標(biāo)準(zhǔn)差=1.23, 代入公式(3.7)131(3)確定P值,作出推斷結(jié)論 查u界值表(附表2,t界值表中為一行),得u=1.96,0.05。按=0.05水準(zhǔn),不拒絕H0,差異無統(tǒng)計(jì)學(xué)意義。結(jié)論:可認(rèn)為該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平相同。 132二、兩樣本均數(shù)比較的u檢驗(yàn)該檢驗(yàn)也稱為獨(dú)立樣本u檢驗(yàn)(independent sample u-test),適用于兩樣本含量較大(如n150且n250)時(shí),u值可按下式計(jì)算:133 測得某地2024歲健康女子100人收縮壓均數(shù)為15.27kPa,標(biāo)準(zhǔn)差為1.16
40、kPa;又測得該地2024歲健康男子100人收縮壓均數(shù)為16.11kPa,標(biāo)準(zhǔn)差為1.41kPa。問該地2024歲健康女子和男子之間收縮壓均數(shù)有無差別? 實(shí) 例134(1)建立檢驗(yàn)假設(shè) H0:1 2 ,即該地2024歲健康女子和男子之間收縮壓均數(shù)相同; H1: 12 ,即該地2024歲健康女子和男子之間收縮壓均數(shù)不同。 0.05(雙側(cè))(2)計(jì)算u值 本例 n1=100, 均數(shù)1=15.27, S1 n2=100, 均數(shù)2=16.11, S2135(3)確定P值,作出推斷結(jié)論 查u界值表(附表2,t界值表中為一行),得u=1.96,現(xiàn)uu=1.96,故P0.05。按水準(zhǔn) =0.05,拒絕H0,
41、接受H1,差異有統(tǒng)計(jì)學(xué)意義。結(jié)論:可認(rèn)為該地2024歲健康人的收縮壓均數(shù)男性高于女性。 136第六節(jié) 均數(shù)的 t 檢驗(yàn) 當(dāng)樣本含量較?。ㄈ鏽50)時(shí),t分布和u分布有較大的出入,所以小樣本的樣本均數(shù)與總體均數(shù)的比較以及兩個(gè)樣本均數(shù)的比較要用t檢驗(yàn)。t檢驗(yàn)的適用條件:樣本來自正態(tài)總體或近似正態(tài)總體;兩樣本總體方差相等。 137一、樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn) 亦稱為單樣本t檢驗(yàn)(one sample t-test)。即樣本均數(shù)代表的未知總體均數(shù)與已知的總體均數(shù)(一般為理論值、標(biāo)準(zhǔn)值或經(jīng)過大量觀察所得的穩(wěn)定值等)進(jìn)行比較。這時(shí)檢驗(yàn)統(tǒng)計(jì)量t值的計(jì)算在H0成立的前提條件下由公式(3.4)變?yōu)椋?13
42、8t檢驗(yàn)。 (1)建立檢驗(yàn)假設(shè) H0: 0 ,即該山區(qū)健康成年男子脈搏均數(shù)與一般健康成年男子脈搏均數(shù)相同; H1:0 ,即該山區(qū)健康成年男子脈搏均數(shù)與一般健康成年男子脈搏均數(shù)不同。 0.05(雙側(cè)) (2)計(jì)算t值 本例n = 25 , s = 6.5 , 樣本均數(shù)=74.2 ,總體均數(shù) =72 , 代入公式(3.10)139(3)確定P值, 作出推斷結(jié)論 本例 =251=24,查附表2,t界值表,得t0.05,24=2.064,現(xiàn)t=1.6920.05。按 =0.05的水準(zhǔn),不拒絕H0,差異無統(tǒng)計(jì)學(xué)意義。 結(jié)論:即根據(jù)本資料還不能認(rèn)為此山區(qū)健康成年男子脈搏數(shù)與一般健康成年男子不同。 140二
43、、配對(duì)資料的t檢驗(yàn) 醫(yī)學(xué)科研中配對(duì)資料的三種主要類型:同一批受試對(duì)象治療前后某些生理、生化指標(biāo)的比較;同一種樣品,采用兩種不同的方法進(jìn)行測定,來比較兩種方法有無不同;配對(duì)動(dòng)物試驗(yàn),各對(duì)動(dòng)物試驗(yàn)結(jié)果的比較等。配對(duì)實(shí)驗(yàn)設(shè)計(jì)得到的資料稱為配對(duì)資料。 141 先求出各對(duì)子的差值d的均值, 若兩種處理的效應(yīng)無差別,理論上差值d 的總體均數(shù)應(yīng)為0。所以這類資料的比較可看作是樣本均數(shù)與總體均數(shù)為0的比較。要求差值的總體分布為正態(tài)分布。 t檢驗(yàn)的公式為:配對(duì)資料的 t 檢驗(yàn)(paired samples t-test)142 設(shè)有12名志愿受試者服用某減肥藥,服藥前和服藥后一個(gè)療程各測量一次體重(kg),數(shù)據(jù)
44、如表3-4所示。問此減肥藥是否有效? (1)建立檢驗(yàn)假設(shè) H0:d=0, 即該減肥藥無效; H1:d0 ,即該減肥藥有效。 單側(cè)=0.05 143表3-4 某減肥藥研究的體重(kg)觀察值 144(2)計(jì)算t值本例n = 12, d = -16,d2 = 710,差值的均數(shù)=d /n = -16/12 = -1.33(kg )145(3)確定P值,作出推斷結(jié)論 自由度=n-1=12-1=11,查附表2,t界值表,得單側(cè)t0.05,11=2.201,現(xiàn)t=0.58 0.05。按=0.05水準(zhǔn),不拒絕H0, 差異無統(tǒng)計(jì)學(xué)意義。結(jié)論:故尚不能認(rèn)為該減肥藥有減肥效果。146 某單位研究飲食中缺乏維生素
45、E與肝中維生素A含量的關(guān)系,將同種屬的大白鼠按性別相同,年齡、體重相近配成8對(duì),并將每對(duì)中的兩頭動(dòng)物隨機(jī)分到正常飼料組和維生素E缺乏組,然后定期將大白鼠殺死,測得其肝中維生素A的含量如表3-5。問不同飼料組的大白鼠肝中維生素A含量有無差別? (自學(xué)內(nèi)容) 147三、兩樣本均數(shù)比較的t檢驗(yàn)兩本均數(shù)比較的t檢驗(yàn)亦稱為成組t檢驗(yàn),又稱為獨(dú)立樣本t檢驗(yàn)(independent samples t-test)。適用于比較按完全隨機(jī)設(shè)計(jì)而得到的兩組資料,比較的目的是推斷它們各自所代表的總體均數(shù)和是否相等。 148樣本估計(jì)值為 :總體方差已知:標(biāo)準(zhǔn)誤的計(jì)算公式149若n1=n2時(shí):已知S1和S2時(shí):150
46、測得14名慢性支氣管炎病人與11名健康人的尿中17酮類固醇(mol/24h)排出量如下,試比較兩組人的尿中17酮類固醇的排出量有無不同。 原始調(diào)查數(shù)據(jù)如下:病 人X1健康人X2:n=11; 17.95 30.46 10.88 22.38 12.89 23.01 13.89 19.40 15.83 26.72 17.29 151(1)建立檢驗(yàn)假設(shè) H0:1 2 ,即病人與健康人的尿中17酮類固醇的排出量相同H1: 1 2 ,即病人與健康人的尿中17酮類固醇的排出量不同 152(2)計(jì)算t值 本例n1=14, X1=212.35, X12 n2=11, X2=210.70, X22=4397.64
47、 153(3)確定P值 作出推斷結(jié)論 =14+11-2=23,查t界值表,得t0.05,23=2.069,現(xiàn)t=1.80350.05。按=0.05水準(zhǔn),不拒絕H0,差異無統(tǒng)計(jì)學(xué)意義。結(jié)論:尚不能認(rèn)為慢性支氣管炎病人與健康人的尿中17酮類固醇的排出量不同。154四、兩樣本幾何均數(shù)t檢驗(yàn)比較兩樣本幾何均數(shù)的目的是推斷它們各自代表的總體幾何均數(shù)有無差異。適用于:觀察值呈等比關(guān)系,如血清滴度;觀察值呈對(duì)數(shù)正態(tài)分布,如人體血鉛含量等。兩樣本幾何均數(shù)比較的t檢驗(yàn)公式與兩樣本均數(shù)比較的t檢驗(yàn)公式相同。只需將觀察X用lgX來代替就行了 155例3.10 將20名鉤端螺旋體病人的血清隨機(jī)分為兩組,分別用標(biāo)準(zhǔn)株和
48、水生株作凝溶試驗(yàn),抗體滴度的倒數(shù)(即稀釋度)結(jié)果如下。問兩組抗體的平均效價(jià)有無差別? 標(biāo)準(zhǔn)株(11人):100 200 400 400 400 400 800 1600 1600 1600 3200水生株(9人): 100 100 100 200 200 200 200 400 1600將兩組數(shù)據(jù)分別取對(duì)數(shù),記為x1, x2 。 x1: 2.000 2.301 2.602 2.602 2.602 2.602 2.903 3.204 3.204 x2156一、兩樣本方差的齊性檢驗(yàn) 用較大的樣本方差S2比較小的樣本方差S2 第七節(jié) 兩總體方差的齊性檢驗(yàn)和t檢驗(yàn) 1為分子自由度,2為分母自由度 15
49、7注意:方差齊性檢驗(yàn)本為雙側(cè)檢驗(yàn),但由于公式(3.18)規(guī)定以較大的方差作分子,F(xiàn)值必然大于1,故附表3單側(cè)0.025的界值,實(shí)對(duì)應(yīng)雙側(cè)檢驗(yàn)P=0.05;當(dāng)樣本含量較大時(shí)(如n1和n2均大于50),可不必作方差齊性檢驗(yàn)。 158深層水:n1=8, 樣本均數(shù)=1.781(mg/L), S1=1.899 (mg/L)表層水:n2=10,樣本均數(shù)=0.247(mg/L), S2=0.210 (mg/L) 某研究所為了了解水體中汞含量的垂直變化,對(duì)某氯堿廠附近一河流的表層水和深層水作了汞含量的測定,結(jié)果如下。試檢驗(yàn)兩個(gè)方差是否齊性。159 確定P值 作出推斷結(jié)論 本例18-1=7 , 210-1=9
50、,查附表3,F(xiàn)界值表(方差齊性檢驗(yàn)用), 得F0.05,7,9=4.20, 本例F80.97 F 0.05,7,9=4.20; 故P0.05, 按=0.05 水準(zhǔn),拒絕H0, 接受H1,結(jié)論:故可認(rèn)為兩總體方差不齊。160方差不齊時(shí),兩小樣本均數(shù)的比較,可選用以下方法:采用適當(dāng)?shù)淖兞孔儞Q,使達(dá)到方差齊的要求;采用秩和檢驗(yàn);采用近似法t 檢驗(yàn)。二、t 檢驗(yàn)161計(jì)算統(tǒng)計(jì)量t 值 162例3.12 由例3.11已知表層水和深層水含汞量方差不齊,試比較其均數(shù)有無差別?自學(xué)內(nèi)容163假設(shè)檢驗(yàn)中作出的推斷結(jié)論可能發(fā)生兩種錯(cuò)誤:拒絕了實(shí)際上是成立的H0,這叫型錯(cuò)誤(typeerror)或第一類錯(cuò)誤,也稱為
51、錯(cuò)誤。 不拒絕實(shí)際上是不成立的H0,這叫型錯(cuò)誤(typeerror)或第二類錯(cuò)誤,也稱為錯(cuò)誤。 第八節(jié) 型錯(cuò)誤和型錯(cuò)誤164表3-6 可能發(fā)生的兩類錯(cuò)誤165166聯(lián)系:一般增大,則減??; 減小,則增大;區(qū)別:(1)一般為已知,可取單側(cè)或雙側(cè),如0.05,或0.01。 (2)一般為未知,只取單側(cè),如取0.1或0.2。1 (把握度)0.75。兩類錯(cuò)誤的聯(lián)系與區(qū)別1671-稱為檢驗(yàn)效能(power of test)或把握度,其意義是兩總體確有差別,按水準(zhǔn)能發(fā)現(xiàn)它們有差別的能力。 與的大小應(yīng)根據(jù)實(shí)際情況適當(dāng)取值。 1682.選用假設(shè)檢驗(yàn)的方法應(yīng)符合其應(yīng)用條件 3.正確理解差別有無顯著性的統(tǒng)計(jì)涵義 正
52、確理解差別有統(tǒng)計(jì)學(xué)意義 及臨床上的差別的統(tǒng)計(jì)學(xué)意義。4.假設(shè)檢驗(yàn)的推斷結(jié)論不能絕對(duì)化 5.要根據(jù)資料的性質(zhì)事先確定采用雙側(cè)檢驗(yàn)或單側(cè)檢驗(yàn) 第九節(jié) 應(yīng)用假設(shè)檢驗(yàn)的注意問題169THANK YOU FOR LISTENINGTHE END 170醫(yī)學(xué)本科生用泰山醫(yī)學(xué)院 預(yù)防醫(yī)學(xué)教研室Email: 主 講 程 琮醫(yī)學(xué)統(tǒng)計(jì)學(xué)171Teaching Plan for Medical StudentsMedical StatisticsProfessor Cheng CongDept. of Preventive Medicine Taishan Medical College172第4章 方差分析 目錄
53、 第五節(jié) 多個(gè)方差的齊性檢驗(yàn) 第二節(jié) 單因素方差分析 第三節(jié) 雙因素方差分析 第四節(jié) 多個(gè)樣本均數(shù)間的兩兩比較 第一節(jié) 方差分析的基本思想 第六節(jié) 變量變換173第四章 方差分析 學(xué)習(xí)要求:1。掌握方差分析的基本思想;2。掌握單因素、雙因素方差分析的應(yīng)用條件、意義及計(jì) 算方法;3。熟悉多個(gè)均數(shù)間兩兩比較的意義及方法;4。了解方差齊性檢驗(yàn)和t檢驗(yàn)的意義及方法;5。熟悉變量變換的意義和方法。174第一節(jié) 方差分析的基本思想一、方差分析的用途及應(yīng)用條件方差分析(analysis of variance,縮寫為ANOVA)是常用的統(tǒng)計(jì)分析方法之一。其應(yīng)用廣泛,分析效率高,節(jié)省樣本含量。主要用途有:進(jìn)行
54、兩個(gè)或兩個(gè)以上樣本均數(shù)的比較;可以同時(shí)分析一個(gè)、兩個(gè)或多個(gè)因素對(duì)試驗(yàn)結(jié)果的作用和影響;分析多個(gè)因素的獨(dú)立作用及多個(gè)因素之間的交互作用;進(jìn)行兩個(gè)或多個(gè)樣本的方差齊性檢驗(yàn)等。方差分析對(duì)分析數(shù)據(jù)的要求及條件比較嚴(yán)格,即要求各樣本為隨機(jī)樣本,各樣本來自正態(tài)總體,各樣本所代表的總體方差齊性或相等。175 二、方差分析的基本思想 處理因素可分為若干個(gè)等級(jí)或不同類型,通常稱為水平。在不同的水平下進(jìn)行若干次試驗(yàn)并取得多個(gè)數(shù)據(jù),可以將在每個(gè)水平下取得的這些數(shù)據(jù)看作一個(gè)樣本。若某個(gè)因素有四個(gè)水平,每個(gè)水平的數(shù)據(jù)代表一個(gè)樣本,則獲得四個(gè)樣本的數(shù)據(jù)。 設(shè)有k個(gè)相互獨(dú)立的樣本,分別來自k個(gè)正態(tài)總體X1,X2,Xk,且方
55、差相等,即要求檢驗(yàn)假設(shè)為 此假設(shè)的意義為,在某處理因素的不同水平下,各樣本的總體均數(shù)相等。 1761。設(shè)某因素有多個(gè)水平,即試驗(yàn)數(shù)據(jù)產(chǎn)生多個(gè)樣本。由多個(gè)樣本的全部數(shù)據(jù)可以計(jì)算出總變異,稱為總的離均差平方和。即SS總。2。數(shù)理統(tǒng)計(jì)證明,SS總可以由幾個(gè)部分構(gòu)成。單因素方差分析中, SS總由組間變異和組內(nèi)變異構(gòu)成。 SS總SS組間SS組內(nèi)。3。組間變異主要受到處理因素和個(gè)體誤差兩方面影響,組內(nèi)變異主要受個(gè)體誤差的影響。當(dāng)H0 為真時(shí),由于處理因素不起作用,組間變異只受個(gè)體誤差的影響。此時(shí),組間變異與組內(nèi)變異相差不能太大。177表42 PCNA在三種不同胃組織中的表達(dá)結(jié)果標(biāo)本Xj不同胃組織XiABC
56、156302124637143392027Xj553221100874 (X)ni109827 ( N)均數(shù)55.3024.5612.532.37(總均值)Xj2312916273167239236( X2)1784。各種變異除以相應(yīng)的自由度,稱為均方,用MS表示,也就是方差。當(dāng)H0為真時(shí),組間均方與組內(nèi)均方相差不大,兩者比值F值約接近于1。 即 F組間均方組內(nèi)均方1。5。當(dāng)H0不成立時(shí),處理因素產(chǎn)生了作用,使得組間均方增大,此時(shí),F(xiàn)1,當(dāng)大于等于F臨界值時(shí),則P0.05??烧J(rèn)為H0不成立,各樣本均數(shù)不全相等。179三、方差分析的類型1。單因素方差分析(one-way ANOVA) 也稱為完全
57、隨機(jī)設(shè)計(jì)(completely random design)的方差分析。該設(shè)計(jì)只能分析一個(gè)因素下多個(gè)水平對(duì)試驗(yàn)結(jié)果的影響。2。雙因素方差分析(two-way ANOVA) 稱為隨機(jī)區(qū)組設(shè)計(jì)(randomized block design)的方差分析。該設(shè)計(jì)可以分析兩個(gè)因素。一個(gè)為處理因素,也稱為列因素;一個(gè)為區(qū)組因素,也稱為行因素。 1803。三因素方差分析 也稱為拉丁方設(shè)計(jì)(Latin square design)的方差分析。該設(shè)計(jì)特點(diǎn)是,可以同時(shí)分析三個(gè)因素對(duì)試驗(yàn)結(jié)果的作用,且三個(gè)因素之間相互獨(dú)立,不能有交互作用。4。析因設(shè)計(jì)(factorial design)的方差分析 當(dāng)兩個(gè)因素或多個(gè)
58、因素之間存在相互影響或交互作用時(shí),可用該設(shè)計(jì)來進(jìn)行分析。該設(shè)計(jì)不僅可以分析多個(gè)因素的獨(dú)立作用,也可以分析多個(gè)因素間的交互作用,是一種高效率的方差分析方法。1815。正交試驗(yàn)設(shè)計(jì)的方差分析 如果要分析的因素有三個(gè)或三個(gè)以上,可進(jìn)行正交試驗(yàn)設(shè)計(jì)(orthogonal experimental design)的方差分析。當(dāng)分析因素較多時(shí),試驗(yàn)次數(shù)會(huì)急劇增加,用此設(shè)計(jì)進(jìn)行分析則更能體現(xiàn)出其優(yōu)越性。該設(shè)計(jì)利用正交表來安排各次試驗(yàn),以最少的試驗(yàn)次數(shù),得到更多的分析結(jié)果。 182四、方差分析的基本步驟1。計(jì)算總變異:指所有試驗(yàn)數(shù)據(jù)的離均差平方和。 2。計(jì)算各部分變異 :單因素方差分析中,可以分出組間變異(S
59、S組間)和組內(nèi)變異(SS組內(nèi));雙因素方差分析中,可以分出處理組變異(SS處理),區(qū)組變異(SS區(qū)組)或稱為配伍組變異(SS配伍)及誤差變異(SS誤差)。 1833。計(jì)算各部分變異的均方 在方差分析中,方差也稱為均方,是各部分的離均差平方和除以其相應(yīng)的自由度,用MS表示。基本公式為:MSSS。 4。計(jì)算統(tǒng)計(jì)量F值 F值是指兩個(gè)均方之比。一般是用較大的均方除以較小的均方。故F值一般不會(huì)小于1。5。確定P值,推斷結(jié)論 根據(jù)分子1,分母2,查F界值表(方差分析用),得到F值的臨界值(critical value),即:如果FF界值,則PH0,接受H1??梢哉J(rèn)為各樣本所代表的總體均數(shù)不全相等。如果想要
60、了解哪兩個(gè)樣本均數(shù)之間有差異,可以繼續(xù)進(jìn)行各樣本均數(shù)的兩兩比較。 184第二節(jié) 單因素方差分析1 。特點(diǎn) 單因素方差分析是按照完全隨機(jī)設(shè)計(jì)的原則將處理因素分為若干個(gè)不同的水平,每個(gè)水平代表一個(gè)樣本,只能分析一個(gè)因素對(duì)試驗(yàn)結(jié)果的影響及作用。其設(shè)計(jì)簡單,計(jì)算方便,應(yīng)用廣泛,是一種常用的分析方法,但其效率相對(duì)較低。該設(shè)計(jì)中的總變異可以分出兩個(gè)部分, 即SS總SS組間SS組內(nèi)。2。常用符號(hào)及其意義(1)Xij 意義為第i組的第j個(gè)數(shù)據(jù)。其中下標(biāo) i 表示列,j 表示行。 (2) 意義為將第i組的全部j個(gè)數(shù)據(jù)合計(jì)。185 (3) 將第i組的j個(gè)數(shù)據(jù)合計(jì)后平方, 再將所有各i組的平方值合計(jì)。 (4)變異來
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年浙科版必修1歷史下冊(cè)階段測試試卷
- 2025年冀教版九年級(jí)歷史下冊(cè)階段測試試卷含答案
- 2025年新科版七年級(jí)物理上冊(cè)月考試卷含答案
- 2025年教科新版八年級(jí)地理上冊(cè)月考試卷
- 2025年牛津譯林版八年級(jí)地理下冊(cè)月考試卷含答案
- 2025年岳麓版九年級(jí)歷史上冊(cè)階段測試試卷含答案
- 2025年度煤炭行業(yè)安全生產(chǎn)責(zé)任保險(xiǎn)合同7篇
- 二零二五版門衛(wèi)服務(wù)與社區(qū)治安管理合同3篇
- 二零二五版門衛(wèi)值班人員安全管理聘用合同4篇
- 二零二五年度城市更新項(xiàng)目泥水工施工合同4篇
- 兩辦意見八硬措施煤礦安全生產(chǎn)條例宣貫學(xué)習(xí)課件
- 40篇短文搞定高中英語3500單詞
- 人教版高中數(shù)學(xué)必修二《第九章 統(tǒng)計(jì)》同步練習(xí)及答案解析
- 重大危險(xiǎn)源的風(fēng)險(xiǎn)評(píng)估模型
- 兒科護(hù)理安全警示教育課件
- 三年級(jí)下冊(cè)口算天天100題
- 國家中英文名稱及代碼縮寫(三位)
- 人員密集場所消防安全培訓(xùn)
- 液晶高壓芯片去保護(hù)方法
- 使用AVF血液透析患者的護(hù)理查房
- 拜太歲科儀文檔
評(píng)論
0/150
提交評(píng)論