版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、醫(yī)學(xué)本科生用醫(yī) 學(xué) 統(tǒng) 計 學(xué),主講 王守英,新鄉(xiāng)醫(yī)學(xué)院公共衛(wèi)生學(xué)系綜合實驗室 ,第1章緒論,第1頁 共654頁,醫(yī)學(xué)統(tǒng)計學(xué)總目錄,第1章緒論,第2章定量資料統(tǒng)計描述,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第4章方差分析,第5章定性資料的統(tǒng)計描述,第6章總體率的區(qū)間估計和假設(shè)檢驗,第7章二項分布與泊松分布,第8章秩和檢驗,第9章直線相關(guān)與回歸,第10章實驗設(shè)計,第11章調(diào)查設(shè)計,第12章統(tǒng)計表與統(tǒng)計圖,第1章緒論,第2頁 共654頁,第1章緒論 目錄,第五節(jié) 學(xué)習(xí)統(tǒng)計學(xué)應(yīng)注意的幾個問題,第二節(jié) 統(tǒng)計工作的基本步驟,第三節(jié) 統(tǒng)計資料的類型,第四節(jié) 統(tǒng)計學(xué)中的幾個基本概念,第一節(jié) 醫(yī)學(xué)統(tǒng)計學(xué)的定義和
2、內(nèi)容,第1章緒論,第3頁 共654頁,第一章 緒論第一節(jié) 醫(yī)學(xué)統(tǒng)計學(xué)的定義和內(nèi)容,醫(yī)學(xué)統(tǒng)計學(xué)(medical statistics) -是以醫(yī)學(xué)理論為指導(dǎo),運用數(shù)理統(tǒng)計學(xué)的原理和方法研究醫(yī)學(xué)資料的搜集、整理與分析,從而掌握事物內(nèi)在客觀規(guī)律的一門學(xué)科,第1章緒論,第4頁 共654頁,醫(yī)學(xué)研究的對象-主要是人以及與其健康有關(guān)的各種影響因素。 醫(yī)學(xué)統(tǒng)計學(xué)的主要內(nèi)容 : 1.統(tǒng)計設(shè)計 包括實驗設(shè)計和調(diào)查設(shè)計,它可以合理地、科學(xué)地安排實驗和調(diào)查工作,使之能較少地花費人力、物力和時間,取得較滿意和可靠的結(jié)果。 2.資料的統(tǒng)計描述和總體指標(biāo)的估計 通過計算各種統(tǒng)計指標(biāo)和統(tǒng)計圖表來描述資料的集中趨勢、離散趨勢
3、和分布特征況(如正態(tài)分布或偏態(tài)分布);利用樣本指標(biāo)來估計總體指標(biāo)的大小,第1章緒論,第5頁 共654頁,3.假設(shè)檢驗 是通過統(tǒng)計檢驗方法(如t檢驗、u檢驗、F檢驗、卡方檢驗、秩和檢驗等)來推斷兩組或多組統(tǒng)計指標(biāo)的差異是抽樣誤差造成的還是有本質(zhì)的差別。 4.相關(guān)與回歸 醫(yī)學(xué)中存在許多相互聯(lián)系、相互制約的現(xiàn)象。如兒童的身高與體重、胸圍與肺活量、血糖與尿糖等,都需要利用相關(guān)與回歸來分析,第1章緒論,第6頁 共654頁,5.多因素分析 如多元回歸、判別分析、聚類分析、正交設(shè)計分析、主成分分析、因子分析、logistic回歸、Cox比例風(fēng)險回歸等,都是分析醫(yī)學(xué)中多因素有效的方法(本書不涉及,請參考有關(guān)統(tǒng)
4、計書籍)。這些方法計算復(fù)雜,大部分需借助計算機來完成。 6.健康統(tǒng)計 研究人群健康的指標(biāo)與統(tǒng)計方法,除了用上述的某些方法外,他還有其特有的方法,如壽命表、生存分析、死因分析、人口預(yù)測等方法,第1章緒論,第7頁 共654頁,醫(yī)學(xué)統(tǒng)計工作可分為四個步驟: 統(tǒng)計設(shè)計、搜集資料、整理資料和分析資料。 這四個步驟密切聯(lián)系,缺一不可,任何一個步驟的缺陷和失誤,都會影響統(tǒng)計結(jié)果的正確性,第二節(jié) 統(tǒng)計工作的基本步驟,第1章緒論,第8頁 共654頁,設(shè)計(design)是統(tǒng)計工作的第一步,也是關(guān)鍵的一步,是對統(tǒng)計工作全過程的設(shè)想和計劃安排。 統(tǒng)計設(shè)計就是根據(jù)研究目的確定試驗因素、受試對象和觀察指標(biāo),并在現(xiàn)有的客
5、觀條件下決定用什么方式和方法來獲取原始資料,并對原始資料如何進行整理,以及整理后的資料應(yīng)該計算什么統(tǒng)計指標(biāo)和統(tǒng)計分析的預(yù)期結(jié)果如何等,一、統(tǒng)計設(shè)計,第1章緒論,第9頁 共654頁,搜集資料(collection of date) 是根據(jù)設(shè)計的要求,獲取準(zhǔn)確可靠的原始資料,是統(tǒng)計分析結(jié)果可靠的重要保證。 醫(yī)學(xué)統(tǒng)計資料的來源主要有以下三個方面: 1.統(tǒng)計報表 統(tǒng)計報表是醫(yī)療衛(wèi)生機構(gòu)根據(jù)國家規(guī)定的報告制度,定期逐級上報的有關(guān)報表。如法定傳染病報表、出生死亡報表、醫(yī)院工作報表等,報表要完整、準(zhǔn)確、及時,二、搜集資料,第1章緒論,第10頁 共654頁,2.醫(yī)療衛(wèi)生工作記錄 如病歷、醫(yī)學(xué)檢查記錄、衛(wèi)生監(jiān)測
6、記錄等。 3.專題調(diào)查或?qū)嶒炑芯?它是根據(jù)研究目的選定的專題調(diào)查或?qū)嶒炑芯?,搜集資料有明確的目的與針對性。它是醫(yī)學(xué)科研資料的主要來源,第1章緒論,第11頁 共654頁,整理資料(sorting data)的目的就是將搜集到的原始資料進行反復(fù)核對和認(rèn)真檢查,糾正錯誤,分類匯總,使其系統(tǒng)化、條理化,便于進一步的計算和分析。整理資料的過程如下: 1.審核:認(rèn)真檢查核對,保證資料的準(zhǔn)確性和完整性。 2.分組:歸納分組,分組方法有兩種: 質(zhì)量分組,即將觀察單位按其類別或?qū)傩苑纸M,如按性別、職業(yè)、陽性和陰性等分組。 數(shù)量分組,即將觀察單位按其數(shù)值的大小分組,如按年齡的大小、藥物劑量的大小等分組,三、整理資
7、料,第1章緒論,第12頁 共654頁,3.匯總: 分組后的資料要按照設(shè)計的要求進行 匯總,整理成統(tǒng)計表。原始資料較少時用手工匯 總,當(dāng)原始資料較多時,可使用計算機匯總。 四、分析資料 分析資料(analysis of data) 是根據(jù)設(shè)計的要求,對整理后的數(shù)據(jù)進行統(tǒng)計學(xué)分析,結(jié)合專業(yè)知識,作出科學(xué)合理的解釋,第1章緒論,第13頁 共654頁,1.統(tǒng)計描述(descriptive statistics) 將計算出的統(tǒng)計指標(biāo)與統(tǒng)計表、統(tǒng)計圖相結(jié)合,全面描述資料的數(shù)量特征及分布規(guī)律。 2.統(tǒng)計推斷(inferential statistics) 使用樣本信息推斷總體特征。通過樣本統(tǒng)計量進行總體參數(shù)
8、的估計和假設(shè)檢驗,以達到了解總體的數(shù)量特征及其分布規(guī)律,才是最終的研究目的,統(tǒng)計分析包括以下兩大內(nèi)容,第1章緒論,第14頁 共654頁,醫(yī)學(xué)統(tǒng)計資料按研究指標(biāo)的性質(zhì)一般分為定量資料、定性資料和等級資料三大類。 一、定量資料 定量資料(quantitative data) 亦稱計量資料(measurement data),是用定量的方法測定觀察單位(個體)某項指標(biāo)數(shù)值的大小,所得的資料稱定量資料。如身高()、體重()、脈搏(次/分)、血壓(kPa)等為數(shù)值變量,其組成的資料為定量資料,第三節(jié) 統(tǒng)計資料的類型,第1章緒論,第15頁 共654頁,定性資料(qualitative data) 亦稱計數(shù)
9、資料(enumeration data)或分類資料(categorical data),是將觀察單位按某種屬性或類別分組,清點各組的觀察單位數(shù),所得的資料稱定性資料。 定性資料的觀察指標(biāo)為分類變量(categorical variable)。如人的性別按男、女分組;化驗結(jié)果按陽性、陰性分組;動物實驗按生存、死亡分組;調(diào)查某人群的血型按A、B、O、AB分組等,觀察單位出現(xiàn)的結(jié)果為分類變量,分類變量沒有量的差別,只有質(zhì)的不同,其組成的資料為定性資料,二、定性資料,第1章緒論,第16頁 共654頁,三、等級資料,等級資料(ranked data)亦稱有序分類資料(ordinal categorica
10、l data),是將觀察單位按屬性的等級分組,清點各組的觀察單位數(shù),所得的資料為等級資料。 如治療結(jié)果分為治愈、顯效、好轉(zhuǎn)、無效四個等級,第1章緒論,第17頁 共654頁,根據(jù)需要,各類變量可以互相轉(zhuǎn)化。若按貧血的診斷標(biāo)準(zhǔn)將血紅蛋白分為四個等級:重度貧血、中度貧血、輕度貧血、正常,可按等級資料處理。有時亦可將定性資料或等級資料數(shù)量化,如將等級資料的治療結(jié)果賦以分值,分別用0、1、2等表示,則可按定量資料處理。 如調(diào)查某人群的尿糖的情況,以人為觀察單位,結(jié)果可分、五個等級,第1章緒論,第18頁 共654頁,同質(zhì)(homogeneity) 是指觀察單位或研究個體間被研究指標(biāo)的主要影響因素相同或基本
11、相同。如研究兒童的生長發(fā)育,同性別、同年齡、同地區(qū)、同民族、健康的兒童即為同質(zhì)兒童。 變異(variation) 由于生物個體的各種指標(biāo)所受影響因素極為復(fù)雜,同質(zhì)的個體間各種指標(biāo)存在差異,這種差異稱為變異。如同質(zhì)的兒童身高、體重、血壓、脈搏等指標(biāo)會有一定的差別,第四節(jié) 統(tǒng)計學(xué)中的幾個基本概念一、同質(zhì)與變異,第1章緒論,第19頁 共654頁,二、總體與樣本,樣本(sample):是從總體中隨機抽取的部分觀察單位變量值的集合。樣本的例數(shù)稱為樣本含量(sample size)。 注意: 1??傮w是相對的,總體的大小是根據(jù)研究目的而確定的。 2。樣本應(yīng)有代表性,即應(yīng)該隨機抽樣并有足夠的樣本含量,第1章
12、緒論,第20頁 共654頁,圖示:總體與樣本,population,sample2,sample1,sample3,sample4,sample5,第1章緒論,第21頁 共654頁,三、參數(shù)與統(tǒng)計量,參數(shù)(parameter):由總體計算或得到的統(tǒng)計指標(biāo)稱為參數(shù)??傮w參數(shù)具有很重要的參考價值。如總體均數(shù),總體標(biāo)準(zhǔn)差等。 統(tǒng)計量(statistic):由樣本計算的指標(biāo)稱為統(tǒng)計量。如樣本均數(shù),樣本標(biāo)準(zhǔn)差s等。 注意:一般不容易得到參數(shù),而容易獲得樣本統(tǒng)計量,第1章緒論,第22頁 共654頁,四、抽樣誤差,抽樣誤差(sample error): 由于隨機抽樣所引起的樣本統(tǒng)計量與總體參數(shù)之間的差異以及
13、樣本統(tǒng)計量之間的差別稱為抽樣誤差。如樣本均數(shù)與總體均數(shù)之間的差別,樣本率與總體率的差別等。 注意:抽樣誤差是不可避免的。無論抽樣抽得多么好,也會存在抽樣誤差,第1章緒論,第23頁 共654頁,五、概率,概率(probability):是描述隨機事件發(fā)生可能性大小的量值。用英文大寫字母P來表示。概率的取值范圍在01之間。當(dāng)P0時,稱為不可能事件;當(dāng)P1時,稱為必然事件。 小概率事件:統(tǒng)計學(xué)上一般把P0.05或P0.01的事件稱為小概率事件。 小概率原理:小概率事件在一次試驗中幾乎不可能發(fā)生。利用該原理可對科研資料進行假設(shè)檢驗,第1章緒論,第24頁 共654頁,第五節(jié) 學(xué)習(xí)醫(yī)學(xué)統(tǒng)計學(xué)應(yīng)注意的問題,
14、1.重點掌握醫(yī)學(xué)統(tǒng)計學(xué)的基本知識、基本技能、基本概念和基本方法,掌握使用范圍和注意事項。 2.要培養(yǎng)科學(xué)的統(tǒng)計思維方法,提高分析問題、解決問題的能力。 3.掌握調(diào)查設(shè)計和實驗設(shè)計的原則,培養(yǎng)搜集、整理、分析統(tǒng)計資料的系統(tǒng)工作能力,第1章緒論,第25頁 共654頁,課后作業(yè),列舉出計量資料、分類資料、等級資料各10個實例。 列舉出可能事件、必然事件、不可能事件及小概率事件各10個。 認(rèn)真復(fù)習(xí)本章已學(xué)過的基本概念23遍,第1章緒論,第26頁 共654頁,Best Wishes to All of You! Thank You for Listening,THE END,第1章緒論,第27頁 共65
15、4頁,醫(yī)學(xué)本科生用,主講 王守英,新鄉(xiāng)醫(yī)學(xué)院公共衛(wèi)生學(xué)系綜合實驗室 ,醫(yī)學(xué)統(tǒng)計學(xué),第2章定量資料統(tǒng)計描述,第28頁,第2章定量資料的統(tǒng)計描述 目錄,第二節(jié) 集中趨勢的描述,第三節(jié) 離散趨勢的描述,第四節(jié) 正態(tài)分布,第一節(jié) 頻數(shù)分布表,第2章定量資料統(tǒng)計描述,第29頁,統(tǒng)計描述:是用統(tǒng)計圖表、統(tǒng)計指標(biāo)來描述資料的分布規(guī)律及其數(shù)量特征。 頻數(shù)分布表(frequency distribution table):主要由組段和頻數(shù)兩部分組成表格,第一節(jié) 頻數(shù)分布表,第二章 定量資料的統(tǒng)計描述,第2章定量資料統(tǒng)計描述,第30頁,二、頻數(shù)分布表的編制,編制步驟 : 1. 計算全距 (range): 一組變量
16、值最大值和最小值之差稱為全距(range),亦稱極差,常用R表示。 2. 確定組距(class interval): 組距用i表示; 3. 劃分組段: 每個組段的起點稱組下限,終點稱組上限。一般分為815組。 ; 4. 統(tǒng)計頻數(shù): 將所有變量值通過劃記逐個歸入相應(yīng)組段 ; 5.頻率與累計頻率: 將各組的頻數(shù)除以n所得的比值被稱為頻率。累計頻率等于累計頻數(shù)除以總例數(shù),第2章定量資料統(tǒng)計描述,第31頁,表2-2 某年某市120名12歲健康男孩身高(cm)的頻數(shù)分布,第2章定量資料統(tǒng)計描述,第32頁,第2章定量資料統(tǒng)計描述,第33頁,二、頻數(shù)分布表的用途,1.揭示資料的分布類型 2.觀察資料的集中趨
17、勢和離散趨勢 3.便于發(fā)現(xiàn)某些特大或特小的可疑值 4.便于進一步計算統(tǒng)計指標(biāo)和作統(tǒng)計處理,第2章定量資料統(tǒng)計描述,第34頁,第2章定量資料統(tǒng)計描述,第35頁,第二節(jié) 集中趨勢的描述,集中趨勢 :代表一組同質(zhì)變量值的集中趨勢 或平均水平。 常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。 另外不常用的有:眾數(shù),調(diào)和平均數(shù)和調(diào)整均數(shù)等,第2章定量資料統(tǒng)計描述,第36頁,一、算術(shù)均數(shù),算術(shù)均數(shù) (arithmetic mean): 簡稱均數(shù)。 適用條件:對稱分布或近似對稱分布的資料。 習(xí)慣上以希臘字母表示總體均數(shù)(population mean),以英文字母表示樣本均數(shù)(sample mean,第2章定量
18、資料統(tǒng)計描述,第37頁,1. 直接法:用于觀察值個數(shù)不多時,計算方法,第2章定量資料統(tǒng)計描述,第38頁,2.加權(quán)法(weighting method):用于變量值個數(shù) 較多時,注意:權(quán)數(shù)即頻數(shù)f,為權(quán)重權(quán)衡之意,第2章定量資料統(tǒng)計描述,第39頁,表2-4 120名12歲健康男孩身高(cm)均數(shù)和標(biāo)準(zhǔn)差加權(quán)法計算表,第2章定量資料統(tǒng)計描述,第40頁,第2章定量資料統(tǒng)計描述,第41頁,120名12歲健康男孩身高均數(shù)為143.07cm,計算結(jié)果,第2章定量資料統(tǒng)計描述,第42頁,幾何均數(shù)(geometric mean,簡記為):表示其平均水平。 適用條件:對于變量值呈倍數(shù)關(guān)系或呈對數(shù)正態(tài)分布(正偏態(tài)
19、分布),如抗體效價及抗體滴度,某些傳染病的潛伏期,細(xì)菌計數(shù)等。 計算公式:有直接法和加權(quán)法,二、幾何均數(shù),第2章定量資料統(tǒng)計描述,第43頁,1.直接法: 用于變量值的個數(shù)n較少時,第2章定量資料統(tǒng)計描述,第44頁,直接法計算實例,第2章定量資料統(tǒng)計描述,第45頁,2.加權(quán)法 : 用于資料中相同變量值的個數(shù)f(即頻數(shù))較多時,第2章定量資料統(tǒng)計描述,第46頁,表2-5 50名兒童麻疹疫苗接種后血凝抑制抗體滴度幾何均數(shù)計算表,第2章定量資料統(tǒng)計描述,第47頁,第2章定量資料統(tǒng)計描述,第48頁,50名兒童麻疹疫苗接種后平均血凝抑制抗體滴度為1:60.55,計算結(jié)果:將有關(guān)已知數(shù)據(jù)代入公式有,第2章定
20、量資料統(tǒng)計描述,第49頁,變量值中不能有0;不能同時有正值和負(fù)值;若全是負(fù)值,計算時可先把負(fù)號去掉,得出結(jié)果后再加上負(fù)號,計算幾何均數(shù)注意事項,第2章定量資料統(tǒng)計描述,第50頁,中位數(shù) 定義:將一組變量值從小到大按順序排列,位次居中的變量值稱為中位數(shù)(median,簡記為M)。 適用條件:變量值中出現(xiàn)個別特小或特大的數(shù)值;資料的分布呈明顯偏態(tài),即大部分的變量值偏向一側(cè);變量值分布一端或兩端無確定數(shù)值,只有小于或大于某個數(shù)值;資料的分布不清,三、中位數(shù)及百分位數(shù),第2章定量資料統(tǒng)計描述,第51頁,定義:百分位數(shù)(percentile)是一種位置指標(biāo),以Px表示。百分位數(shù)是將頻數(shù)等分為一百的分位數(shù)
21、。一組觀察值從小到大按順序排列,理論上有x%的變量值比Px小,有(100-x)%的變量值比Px大。故P50分位數(shù)也就是中位數(shù),即P50=M,百分位數(shù),第2章定量資料統(tǒng)計描述,第52頁,描述一組資料在某百分位置上的水平; 用于確定正常值范圍; 計算四分位數(shù)間距,百分位數(shù)的應(yīng)用條件,第2章定量資料統(tǒng)計描述,第53頁,計算方法:有直接法和加權(quán)法,1.直接法:用于例數(shù)較少時,n為奇數(shù)時,n為偶數(shù)時,第2章定量資料統(tǒng)計描述,第54頁,2.頻數(shù)表法: 用于例數(shù)較多時,中位數(shù),百分位數(shù),第2章定量資料統(tǒng)計描述,第55頁,表2-6 145例食物中毒病人潛伏期分布表,第2章定量資料統(tǒng)計描述,第56頁,第2章定量
22、資料統(tǒng)計描述,第57頁,先找到包含Px的最小累計頻率; 該累計頻率同行左邊的組段值為L; L同行右邊的頻數(shù)為fx(或fm); L前一行的累計頻數(shù)為fL; 將上述已知條件代入公式計算Px或P50,計算中位數(shù)及百分位數(shù)的步驟,第2章定量資料統(tǒng)計描述,第58頁,計算結(jié)果,第2章定量資料統(tǒng)計描述,第59頁,定義:用來說明變量值的離散程度或變異程度。 注意:僅用集中趨勢尚不能完全反映一組數(shù)據(jù)的特征。故應(yīng)將集中趨勢和離散趨勢結(jié)合起來才能更好地反映一組數(shù)據(jù)的特征。 常用離散指標(biāo)有:極差、四分位數(shù)間距、標(biāo)準(zhǔn)差、方差、變異系數(shù),第三節(jié) 離散趨勢的描述,第2章定量資料統(tǒng)計描述,第60頁,甲組: 184 186 1
23、88 190 192 乙組: 180 184 188 192 196 兩組球員的平均身高都是188cm,但甲組球員身高比較集中,乙組球員身高比較分散。為了說明離散趨勢,就要用離散指標(biāo),實例分析,第2章定量資料統(tǒng)計描述,第61頁,極差 極差(range,簡記為R)亦稱全距,即一組變量值中最大值與最小值之差 。 特點:計算簡單,不穩(wěn)定,不全面,易變化;可用于各種分布的資料,一、極差和四分位數(shù)間距,第2章定量資料統(tǒng)計描述,第62頁,四分位數(shù)間距,公式: Q= P75P25 特點:比極差穩(wěn)定,只反映中間兩端值的差異。 計算不太方便??捎糜诟鞣N分布的資料,第2章定量資料統(tǒng)計描述,第63頁,二、方差和標(biāo)準(zhǔn)
24、差,方差(variance,總體方差,樣本方差,第2章定量資料統(tǒng)計描述,第64頁,自由度(degree of freedom)的概念,n-1是自由度,用希臘小寫字母表示,讀作nju:。 定義:在N維或N度空間中能夠自由選擇的維數(shù)或度數(shù)。 例:ABC,共有n=3個元素,其中只能任選2個元素的值,故自由度n-1=3-1=2,第2章定量資料統(tǒng)計描述,第65頁,方差的特點,充分反映每個數(shù)據(jù)間的離散狀況,意義深刻; 指標(biāo)穩(wěn)定,應(yīng)用廣泛,但計算較為復(fù)雜,不易理解; 方差的單位與原數(shù)據(jù)不同,有時使用時不太方便; 在方差分析中應(yīng)用甚廣而極為重要,第2章定量資料統(tǒng)計描述,第66頁,二)標(biāo)準(zhǔn)差(standard
25、deviation,總體標(biāo)準(zhǔn)差,樣本標(biāo)準(zhǔn)差,第2章定量資料統(tǒng)計描述,第67頁,牢記:離均差平方和展開式,第2章定量資料統(tǒng)計描述,第68頁,標(biāo)準(zhǔn)差的特點,意義同方差,是方差的開平方; 標(biāo)準(zhǔn)差的單位與原數(shù)據(jù)相同,使用方便,意義深刻,應(yīng)用廣泛;故一般已作為醫(yī)學(xué)生物學(xué)領(lǐng)域中反映變異的標(biāo)準(zhǔn),故稱標(biāo)準(zhǔn)差,第2章定量資料統(tǒng)計描述,第69頁,標(biāo)準(zhǔn)差的計算方法:可分為直接法和加權(quán)法,1.直接法,2.加權(quán)法,第2章定量資料統(tǒng)計描述,第70頁,直接法:標(biāo)準(zhǔn)差計算實例,例2.12 例2.2中7名正常男子紅細(xì)胞數(shù)(1012/L)如下:4.67, 4.74, 4.77, 4.88,4.76, 4.72, 4.92,計算其
26、標(biāo)準(zhǔn)差。 x=4.67+4.74+4.77+4.88+4.76+4.72+4.92=33.46 x2=4.672+4.742+4.772+4.882+4.762+4.722+4.922=159.99,第2章定量資料統(tǒng)計描述,第71頁,計算結(jié)果,第2章定量資料統(tǒng)計描述,第72頁,例2.13 對表2-4資料用加權(quán)法計算120名12歲健康男孩身高值的標(biāo)準(zhǔn)差,加權(quán)法:標(biāo)準(zhǔn)差計算實例,在表2-4中已算得fx=17168,fx2 =2460040, 代入公式,第2章定量資料統(tǒng)計描述,第73頁,變異系數(shù)(coefficient of variation): 簡記為CV ; 特征:變異系數(shù)為無量綱單位,可以比
27、較不同單位指標(biāo)間的變異度;變異系數(shù)消除了均數(shù)的大小對標(biāo)準(zhǔn)差的影響,所以可以比較兩均數(shù)相差較大時指標(biāo)間的變異度,三、變異系數(shù),第2章定量資料統(tǒng)計描述,第74頁,例2.14 某地20歲男子160人,身高均數(shù)為166.06cm,標(biāo)準(zhǔn)差為4.95cm; 體重均數(shù)為53.72kg, 標(biāo)準(zhǔn)差為4.96kg。試比較身高與體重的變異程度,變異系數(shù) 計算實例,第2章定量資料統(tǒng)計描述,第75頁,身高,體重,變異系數(shù) 計算結(jié)果,第2章定量資料統(tǒng)計描述,第76頁,第四節(jié) 正態(tài)分布,一、正態(tài)分布的概念和特征,正態(tài)分布(normal distribution):也稱高斯分布,是醫(yī)學(xué)和生物學(xué)最常見的連續(xù)性分布。如身高、體重
28、、紅細(xì)胞數(shù)、血紅蛋白等,第2章定量資料統(tǒng)計描述,第77頁,圖2-1 120名12歲健康男孩身高的頻數(shù)分布,第2章定量資料統(tǒng)計描述,第78頁,正態(tài)分布的函數(shù)和圖形,正態(tài)分布的密度函數(shù),即正態(tài)曲線的方程為,第2章定量資料統(tǒng)計描述,第79頁,圖2-2 頻數(shù)分布逐漸接近正態(tài)分布示意,第2章定量資料統(tǒng)計描述,第80頁,為了應(yīng)用方便,常按公式(2.19)作變量變換,u值稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差,有的參考書也將u值稱為z值,第2章定量資料統(tǒng)計描述,第81頁,這樣將正態(tài)分布變換為標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution,第2章定量資料統(tǒng)計描述,第82頁,圖2-3 正態(tài)分布的
29、面積與縱高,第2章定量資料統(tǒng)計描述,第83頁,正態(tài)分布的特征,1. 集中性 正態(tài)曲線的高峰位于正中央, 即均數(shù)所在的位置。 對稱性 正態(tài)曲線以均數(shù)為中心,左右對稱, 3. 正態(tài)分布有兩個參數(shù),即均數(shù)和標(biāo)準(zhǔn)差。 4. 正態(tài)曲線下面積有一定的分布規(guī)律,第2章定量資料統(tǒng)計描述,第84頁,圖2-4 不同標(biāo)準(zhǔn)差的正態(tài)分布示意,第2章定量資料統(tǒng)計描述,第85頁,二、正態(tài)曲線下面積的分布規(guī)律,第2章定量資料統(tǒng)計描述,第86頁,標(biāo)準(zhǔn)正態(tài)分布表(u值表,標(biāo)準(zhǔn)正態(tài)分布曲線下的面積,由此表可查出曲線下某區(qū)間的面積。查表時應(yīng)注意: 表中曲線下面積為-到u 的下側(cè)累計面積; 當(dāng)已知、和X時,先按公式(2.19)求得u值
30、,再查表;當(dāng)和未知時,并且樣本例數(shù)在100例以上,常用樣本均數(shù)和標(biāo)準(zhǔn)差S分別代替和 ,按公式(2.19)求得u值; 曲線下橫軸上的總面積為100%或1,第2章定量資料統(tǒng)計描述,第87頁,例2.16 前例2.1中,某年某市120名12歲健康男孩身高,已知均數(shù)=143.07cm,標(biāo)準(zhǔn)差S=5.70cm, 估計該地12歲健康男孩身高在135cm以下者占該地12歲男孩總數(shù)的百分?jǐn)?shù); 估計身高界于135cm150cm范圍內(nèi)12歲男孩的比例; 分別求出均數(shù)1S、均數(shù)1.96S、均數(shù)2.58S范圍內(nèi)12歲男孩人數(shù)占該120名男孩總數(shù)的實際百分?jǐn)?shù),說明與理論百分?jǐn)?shù)是否接近,第2章定量資料統(tǒng)計描述,第88頁,根
31、據(jù)題意,按公式(2.19)作u變換,第2章定量資料統(tǒng)計描述,第89頁,身高范圍所占面積,故估計該地12男孩身高在135cm以下者約占7.78; 身高界于135cm150cm范圍內(nèi)者約占81.10,第2章定量資料統(tǒng)計描述,第90頁,三、正態(tài)分布的應(yīng)用,制定醫(yī)學(xué)參考值范圍 參考值范圍也稱為正常值范圍。醫(yī)學(xué)上常把絕大數(shù)正常人的某指標(biāo)范圍稱為該指標(biāo)的正常值范圍。這里的“絕大多數(shù)”可以是90、95、99,最常用的是95。 質(zhì)量控制 常以均數(shù)2S作為上、下警戒值,以均數(shù)3S作為上、下控制值。 正態(tài)分布是很多統(tǒng)計方法的理論基礎(chǔ),第2章定量資料統(tǒng)計描述,第91頁,THE END,THANK YOU FOR L
32、ISTENING,第2章定量資料統(tǒng)計描述,第92頁,本科生用醫(yī)學(xué)統(tǒng)計學(xué)教案,主講 王守英,新鄉(xiāng)醫(yī)學(xué)院公共衛(wèi)生學(xué)系綜合實驗室 ,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第93頁,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗 目錄,第五節(jié) 均數(shù)的 u 檢驗,第二節(jié) t 分布,第三節(jié) 總體均數(shù)的區(qū)間估計,第四節(jié) 假設(shè)檢驗的意義和基本步驟,第一節(jié) 均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤,第六節(jié) 均數(shù)的 t 檢驗,第七節(jié)兩個方差的齊性檢驗和t檢驗,第八節(jié) 型錯誤和型錯誤,第九節(jié) 應(yīng)用假設(shè)檢驗應(yīng)注意的問題,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第94頁,圖示:總體與樣本,Population,sample2,sample1,sample
33、3,sample4,sample5,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第95頁,一、標(biāo)準(zhǔn)誤的意義及其計算 統(tǒng)計推斷(statistical inference) :根據(jù)樣本信息來推論總體特征。 均數(shù)的抽樣誤差 :由抽樣引起的樣本均數(shù)與總體均數(shù)的差異稱為均數(shù)的抽樣誤差。 標(biāo)準(zhǔn)誤(standard error):反映均數(shù)抽樣誤差大小的指標(biāo),第一節(jié) 均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第96頁,已知,標(biāo)準(zhǔn)誤計算公式,未知,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第97頁,實例:如某年某市120名12歲健康男孩,已求得 均數(shù)為143.07cm,標(biāo)準(zhǔn)差為5.70cm,按公式計算,則
34、標(biāo)準(zhǔn)誤為,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第98頁,1.表示抽樣誤差的大小 ; 2.進行總體均數(shù)的區(qū)間估計; 3.進行均數(shù)的假設(shè)檢驗等,二、標(biāo)準(zhǔn)誤的應(yīng)用,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第99頁,正態(tài)變量X采用u(X)/變換,則一般的正態(tài)分布N (,)即變換為標(biāo)準(zhǔn)正態(tài)分布N (0,1)。 又因從正態(tài)總體抽取的樣本均數(shù)服從正態(tài)分布 N(, ),同樣可作正態(tài)變量的u變換,即,第二節(jié) t 分布 一、t 分布的概念,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第100頁,實際工作中由于理論的標(biāo)準(zhǔn)誤往往未知,而用樣本的標(biāo)準(zhǔn)誤作為的估計值, 此時就不是u變換而是t變換了,即下式,第3章總體均數(shù)的區(qū)間估計和
35、假設(shè)檢驗,第101頁,t分布于1908年由英國統(tǒng)計學(xué)家W.S.Gosset以“Student”筆名發(fā)表,故又稱Student t 分布(Students t-distribution,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第102頁,二、t分布曲線的特征,t分布曲線是單峰分布,以0為中心,左右兩側(cè)對稱, 曲線的中間比標(biāo)準(zhǔn)正態(tài)曲線(u分布曲線)低,兩側(cè)翹得比標(biāo)準(zhǔn)正態(tài)曲線略高。 t分布曲線隨自由度而變化,當(dāng)樣本含量越?。▏?yán)格地說是自由度 =n-1越?。瑃分布與u分布差別越大;當(dāng)逐漸增大時,t分布逐漸逼近于u分布,當(dāng) =時,t分布就完全成正態(tài)分布 。 t分布曲線是一簇曲線,而不是一條曲線。 t分布下
36、面積分布規(guī)律:查t分布表,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第103頁,t 分布示意圖,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第104頁,t分布曲線下雙側(cè)或單側(cè)尾部合計面積,我們常把自由度為的t分布曲線下雙側(cè)尾部合計面積或單側(cè)尾部面積為指定值時,則橫軸上相應(yīng)的t界值記為t,。如當(dāng) =20, =0.05時,記為t0.05, 20;當(dāng) =22, =0.01時,記為t0.01, 22。對于t, 值,可根據(jù)和值,查附表2,t界值表,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第105頁,t分布是t檢驗的理論基礎(chǔ)。由公式(3.4)可知,t值與樣本均數(shù)和總體均數(shù)之差成正比,與標(biāo)準(zhǔn)誤成反比 。 在t分布中t值越大,
37、其兩側(cè)或單側(cè)以外的面積所占曲線下總面積的比重就越小 ,說明在抽樣中獲得此t值以及更大t值的機會就越小,這種機會的大小是用概率P來表示的。 t值越大,則P值越??;反之,t值越小,P值越大。根據(jù)上述的意義,在同一自由度下,t t ,則P ; 反之,tt,則P,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第106頁,第三節(jié) 總體均數(shù)的區(qū)間估計,參數(shù)估計:用樣本指標(biāo)(統(tǒng)計量)估計總體指標(biāo)(參數(shù))稱為參數(shù)估計。 估計總體均數(shù)的方法有兩種,即: 點值估計(point estimation ) 區(qū)間估計(interval estimation,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第107頁,一、點值估計,點值估計:
38、是直接用樣本均數(shù)作為總體均數(shù)的估計值。 此法計算簡便,但由于存在抽樣誤差,通過樣本均數(shù)不可能準(zhǔn)確地估計出總體均數(shù)大小,也無法確知總體均數(shù)的可靠程度,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第108頁,二、區(qū)間估計,區(qū)間估計是按一定的概率(1-)估計包含總體均數(shù)可能的范圍,該范圍亦稱總體均數(shù)的可信區(qū)間(confidence interval,縮寫為CI)。 1-稱為可信度,常取1-為0.95和0.99,即總體均數(shù)的95%可信區(qū)間和99%可信區(qū)間。 1-(如95)可信區(qū)間的含義是:總體均數(shù)被包含在該區(qū)間內(nèi)的可能性是1-,即(95),沒有被包含的可能性為,即(5,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第1
39、09頁,總體均數(shù)的可信區(qū)間的計算,1.未知且n較小(n100) 按t分布的原理,2.已知或n較大(n100) 按u分布的原理,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第110頁,95%的可信區(qū)間 為123.72.0642.38,即(118.79, 128.61)。故該地1歲嬰兒血紅蛋白平均值95的可信區(qū)間為118.7128.61(g/L,例3.1 為了了解某地1歲嬰兒的血紅蛋白濃度,從該地隨機抽取了1歲嬰兒25人,測得其血紅蛋白的平均數(shù)為123.7g/L,標(biāo)準(zhǔn)差為11.9g/L。試求該地1歲嬰兒的血紅蛋白平均值95的可信區(qū)間,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第111頁,例3.2 上述某市120
40、名12歲健康男孩身高均數(shù)為143.07cm,標(biāo)準(zhǔn)誤為0.52cm,試估計該市12歲康男孩身高均數(shù)95%和99%的可信區(qū)間,95%的可信區(qū)間為 143.071.960.52,即(142.05,144.09)。 99%的可信區(qū)間為 143.072.580.52, 即(141.73,144.41,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第112頁,注 意 點,標(biāo)準(zhǔn)誤愈小,估計總體均數(shù)可信區(qū)間的范圍也愈窄,說明樣本均數(shù)與總體均數(shù)愈接近,對總體均數(shù)的估計也愈精確; 反之,標(biāo)準(zhǔn)誤愈大,估計總體均數(shù)可信區(qū)間的范圍也愈寬,說明樣本均數(shù)距總體均數(shù)愈遠(yuǎn),對總體均數(shù)的估計也愈差,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第1
41、13頁,表3-1 標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的區(qū)別,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第114頁,第四節(jié) 假設(shè)檢驗的意義和基本步驟,假設(shè)檢驗(hypothesis test):亦稱顯著性檢驗(significance test),是統(tǒng)計推斷的重要內(nèi)容。它是指先對總體的參數(shù)或分布作出某種假設(shè),再用適當(dāng)?shù)慕y(tǒng)計方法根據(jù)樣本對總體提供的信息,推斷此假設(shè)應(yīng)當(dāng)拒絕或不拒絕,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第115頁,例3.3 根據(jù)大量調(diào)查,已知健康成年男子脈搏的均數(shù)為72次/分鐘,某醫(yī)生在一山區(qū)隨機測量了25名健康成年男子脈搏數(shù),求得其均數(shù)為74.2次/分鐘,標(biāo)準(zhǔn)差為6.5次/分鐘,能否認(rèn)為該山區(qū)成年男子的脈搏
42、數(shù)與一般健康成年男子的脈搏數(shù)不同,本例兩個均數(shù)不等有兩種可能性: 山區(qū)成年男子的脈搏總體均數(shù)與一般健康成年男子的脈搏總體均數(shù)是相同的,差別僅僅由于抽樣誤差所致; 受山區(qū)某些因素的影響,兩個總體的均數(shù)是不相同的。如何作出判斷呢?按照邏輯推理,如果第一種可能性較大時,可以接受它,統(tǒng)計上稱差異無統(tǒng)計學(xué)意義(no statistical significance); 如果第一種可能性較小時,可以拒絕它而接受后者,統(tǒng)計上稱差異有統(tǒng)計學(xué)意義(statistical significance,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第116頁,假設(shè)檢驗的一般步驟如下,1.建立檢驗假設(shè) 一種是無效假設(shè)(null
43、hypothesis),符號為H0; 一種是備擇假設(shè)(alternative hypothesis) 符號為H1,H0,H1,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第117頁,表3-2 樣本均數(shù)所代表的未知總體均數(shù)與已知總體均數(shù)的比較,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第118頁,表3-3 兩樣本均數(shù)所代表的未知總體均數(shù)的比較,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第119頁,2.確定檢驗水準(zhǔn) 檢驗水準(zhǔn)(size of a test)亦稱顯著性水準(zhǔn)(significance level),符號為 。它是判別差異有無統(tǒng)計意義的概率水準(zhǔn),其大小應(yīng)根據(jù)分析的要求確定。通常取 = 0.05。 3.選定檢
44、驗方法和計算統(tǒng)計量 根據(jù)研究設(shè)計的類型和統(tǒng)計推斷的目的要求選用不同的檢驗方法。如完全隨機設(shè)計中,兩樣本均數(shù)的比較可用t檢驗,樣本含量較大時(n100),可用u檢驗。不同的統(tǒng)計檢驗方法,可得到不同的統(tǒng)計量,如t 值和u值,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第120頁,4.確定概率P值 P值是指在H0所規(guī)定的總體中作隨機抽樣,獲得等于及大于(或小于)現(xiàn)有統(tǒng)計量的概率。 t t, ,則P ;t,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第121頁,5.作出推斷結(jié)論 當(dāng)P時,表示在H0成立的條件下,出現(xiàn)等于及大于現(xiàn)有統(tǒng)計量的概率是小概率,根據(jù)小概率事件原理,現(xiàn)有樣本信息不支持H0,因而拒絕H0,結(jié)論為按所
45、取檢驗水準(zhǔn)拒絕H0,接受H1,即差異有統(tǒng)計學(xué)意義,如例3.3 可認(rèn)為兩總體脈搏均數(shù)有差別; 當(dāng)P時,表示在H0成立的條件下,出現(xiàn)等于及大于現(xiàn)有統(tǒng)計量的概率不是小概率,現(xiàn)有樣本信息還不能拒絕H0,結(jié)論為按所取檢驗水準(zhǔn)不拒絕H0,即差異無統(tǒng)計意義,如例3.3 尚不能認(rèn)為兩總體脈搏均數(shù)有差別,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第122頁,下結(jié)論時的注意點,P ,拒絕H0,不能認(rèn)為H0肯定不成立,因為雖然在H0成立的條件下出現(xiàn)等于及大于現(xiàn)有統(tǒng)計量的概率雖小,但仍有可能出現(xiàn); 同理,P ,不拒絕H0,更不能認(rèn)為H0肯定成立。由此可見,假設(shè)檢驗的結(jié)論是具有概率性的,無論拒絕H0或不拒絕H0,都有可能發(fā)生
46、錯誤,即第一類錯誤或第二類錯誤,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第123頁,第五節(jié) 均數(shù)的u檢驗,國外統(tǒng)計書籍及統(tǒng)計軟件亦稱為單樣本u檢驗(one sample u-test)。 樣本均數(shù)與總體均數(shù)比較的u檢驗適用于: 總體標(biāo)準(zhǔn)差已知的情況; 樣本含量較大時,比如n100時。對于后者,是因為n較大,也較大,則t分布很接近u分布的緣故,一、樣本均數(shù)與總體均數(shù)比較的u檢驗,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第124頁,u 值的計算公式為,總體標(biāo)準(zhǔn)差已知 時,不管n的大小,總體標(biāo)準(zhǔn)差未知 時,但n100時,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第125頁,例3.4 某托兒所三年來測得2124月齡
47、的47名男嬰平均體重11kg。查得近期全國九城市城區(qū)大量調(diào)查的同齡男嬰平均體重11.18kg,標(biāo)準(zhǔn)差為1.23kg。問該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平有無不同?(全國九城市的調(diào)查結(jié)果可作為總體指標(biāo),實 例,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第126頁,1)建立檢驗假設(shè) H0: 0 ,即該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平相同, 0.05(雙側(cè)) H1: 0 ,即該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平不同。 (2)計算u值 本例因總體標(biāo)準(zhǔn)差已知,故可用u檢驗。 本例n=47, 樣本均數(shù)=11, 總體均數(shù)=11.18,總體標(biāo)準(zhǔn)差=1.23, 代入公式(3.7
48、,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第127頁,3)確定P值,作出推斷結(jié)論 查u界值表(附表2,t界值表中為一行),得u0.05=1.96,u=1.0030.05。按=0.05水準(zhǔn),不拒絕H0,差異無統(tǒng)計學(xué)意義。 結(jié)論:可認(rèn)為該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平相同,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第128頁,二、兩樣本均數(shù)比較的u檢驗,該檢驗也稱為獨立樣本u檢驗(independent sample u-test),適用于兩樣本含量較大(如n150且n250)時,u值可按下式計算,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第129頁,例3.5 測得某地2024歲健康女子100人收
49、縮壓均數(shù)為15.27kPa,標(biāo)準(zhǔn)差為1.16kPa;又測得該地2024歲健康男子100人收縮壓均數(shù)為16.11kPa,標(biāo)準(zhǔn)差為1.41kPa。問該地2024歲健康女子和男子之間收縮壓均數(shù)有無差別,實 例,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第130頁,1)建立檢驗假設(shè) H0:1 2 ,即該地2024歲健康女子和男子之間收縮壓均數(shù)相同; H1: 12 ,即該地2024歲健康女子和男子之間收縮壓均數(shù)不同。 0.05(雙側(cè)) (2)計算u值 本例 n1=100, 均數(shù)1=15.27, S1=1.16 n2=100, 均數(shù)2=16.11, S2=1.41,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第131頁
50、,3)確定P值,作出推斷結(jié)論 查u界值表(附表2,t界值表中為一行),得u0.05=1.96,現(xiàn)uu0.05=1.96,故P0.05。按水準(zhǔn) =0.05,拒絕H0,接受H1,差異有統(tǒng)計學(xué)意義。 結(jié)論:可認(rèn)為該地2024歲健康人的收縮壓均數(shù)男性高于女性,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第132頁,第六節(jié) 均數(shù)的 t 檢驗,當(dāng)樣本含量較?。ㄈ鏽50)時,t分布和u分布有較大的出入,所以小樣本的樣本均數(shù)與總體均數(shù)的比較以及兩個樣本均數(shù)的比較要用t檢驗。 t檢驗的適用條件:樣本來自正態(tài)總體或近似正態(tài)總體;兩樣本總體方差相等,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第133頁,一、樣本均數(shù)與總體均數(shù)比較
51、的t檢驗,亦稱為單樣本t檢驗(one sample t-test)。即樣本均數(shù)代表的未知總體均數(shù)與已知的總體均數(shù)(一般為理論值、標(biāo)準(zhǔn)值或經(jīng)過大量觀察所得的穩(wěn)定值等)進行比較。這時檢驗統(tǒng)計量t值的計算在H0成立的前提條件下由公式(3.4)變?yōu)?第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第134頁,例3.6 對例3.3資料進行t檢驗,1)建立檢驗假設(shè) H0: 0 ,即該山區(qū)健康成年男子脈搏均數(shù)與一般健康成年男子脈搏均數(shù)相同; H1:0 ,即該山區(qū)健康成年男子脈搏均數(shù)與一般健康成年男子脈搏均數(shù)不同。 0.05(雙側(cè)) (2)計算t值 本例n = 25 , s = 6.5 , 樣本均數(shù)=74.2 ,總體均數(shù)
52、 =72 , 代入公式(3.10,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第135頁,3)確定P值, 作出推斷結(jié)論 本例 =251=24,查附表2,t界值表,得t0.05,24=2.064,現(xiàn)t=1.6920.05。按 =0.05的水準(zhǔn),不拒絕H0,差異無統(tǒng)計學(xué)意義。 結(jié)論:即根據(jù)本資料還不能認(rèn)為此山區(qū)健康成年男子脈搏數(shù)與一般健康成年男子不同,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第136頁,二、配對資料的t檢驗,醫(yī)學(xué)科研中配對資料的三種主要類型: 同一批受試對象治療前后某些生理、生化指標(biāo)的比較; 同一種樣品,采用兩種不同的方法進行測定,來比較兩種方法有無不同; 配對動物試驗,各對動物試驗結(jié)果的比較
53、等。 配對實驗設(shè)計得到的資料稱為配對資料,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第137頁,先求出各對子的差值d的均值, 若兩種處理的效應(yīng)無差別,理論上差值d 的總體均數(shù)應(yīng)為0。所以這類資料的比較可看作是樣本均數(shù)與總體均數(shù)為0的比較。要求差值的總體分布為正態(tài)分布。 t檢驗的公式為,配對資料的 t 檢驗(paired samples t-test,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第138頁,例3.7 設(shè)有12名志愿受試者服用某減肥藥,服藥前和服藥后一個療程各測量一次體重(kg),數(shù)據(jù)如表3-4所示。問此減肥藥是否有效,1)建立檢驗假設(shè) H0:d=0, 即該減肥藥無效; H1:d0 ,即該減肥藥
54、有效。 單側(cè)=0.05,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第139頁,表3-4 某減肥藥研究的體重(kg)觀察值,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第140頁,2)計算t值 本例n = 12, d = -16,d2 = 710, 差值的均數(shù)=d /n = -16/12 = -1.33(kg,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第141頁,3)確定P值,作出推斷結(jié)論 自由度=n-1=12-1=11,查附表2,t界值表,得單側(cè)t0.05,11=2.201,現(xiàn)t=0.58 0.05。按=0.05水準(zhǔn),不拒絕H0, 差異無統(tǒng)計學(xué)意義。 結(jié)論:故尚不能認(rèn)為該減肥藥有減肥效果,第3章總體均數(shù)的區(qū)間估計
55、和假設(shè)檢驗,第142頁,例3.8 某單位研究飲食中缺乏維生素E與肝中維生素A含量的關(guān)系,將同種屬的大白鼠按性別相同,年齡、體重相近配成8對,并將每對中的兩頭動物隨機分到正常飼料組和維生素E缺乏組,然后定期將大白鼠殺死,測得其肝中維生素A的含量如表3-5。問不同飼料組的大白鼠肝中維生素A含量有無差別? (自學(xué)內(nèi)容,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第143頁,三、兩樣本均數(shù)比較的t檢驗,兩本均數(shù)比較的t檢驗亦稱為成組t檢驗,又稱為獨立樣本t檢驗(independent samples t-test)。 適用于比較按完全隨機設(shè)計而得到的兩組資料,比較的目的是推斷它們各自所代表的總體均數(shù)和是否相等
56、,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第144頁,樣本估計值為,總體方差已知,標(biāo)準(zhǔn)誤的計算公式,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第145頁,若n1=n2時,已知S1和S2時,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第146頁,例3.9 測得14名慢性支氣管炎病人與11名健康人的尿中17酮類固醇(mol/24h)排出量如下,試比較兩組人的尿中17酮類固醇的排出量有無不同,原始調(diào)查數(shù)據(jù)如下: 病 人X1:n=14; 10.05 18.75 18.99 15.94 13.96 17.67 20.51 17.22 14.69 15.10 9.42 8.21 7.24 24.60 健康人X2:n=11;
57、 17.95 30.46 10.88 22.38 12.89 23.01 13.89 19.40 15.83 26.72 17.29,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第147頁,1)建立檢驗假設(shè) H0:1 2 ,即病人與健康人的尿中17酮類固醇的排出量相同 H1: 1 2 ,即病人與健康人的尿中17酮類固醇的排出量不同 0.05,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第148頁,2)計算t值 本例n1=14, X1=212.35, X12=3549.0919 n2=11, X2=210.70, X22=4397.64,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第149頁,3)確定P值 作出推斷結(jié)論
58、 =14+11-2=23,查t界值表,得t0.05,23=2.069,現(xiàn)t=1.80350.05。按=0.05水準(zhǔn),不拒絕H0,差異無統(tǒng)計學(xué)意義。結(jié)論:尚不能認(rèn)為慢性支氣管炎病人與健康人的尿中17酮類固醇的排出量不同,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第150頁,四、兩樣本幾何均數(shù)t檢驗,比較兩樣本幾何均數(shù)的目的是推斷它們各自代表的總體幾何均數(shù)有無差異。 適用于: 觀察值呈等比關(guān)系,如血清滴度; 觀察值呈對數(shù)正態(tài)分布,如人體血鉛含量等。 兩樣本幾何均數(shù)比較的t檢驗公式與兩樣本均數(shù)比較的t檢驗公式相同。 只需將觀察X用lgX來代替就行了,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第151頁,例3.1
59、0 將20名鉤端螺旋體病人的血清隨機分為兩組,分別用標(biāo)準(zhǔn)株和水生株作凝溶試驗,抗體滴度的倒數(shù)(即稀釋度)結(jié)果如下。問兩組抗體的平均效價有無差別,標(biāo)準(zhǔn)株(11人):100 200 400 400 400 400 800 1600 1600 1600 3200 水生株(9人): 100 100 100 200 200 200 200 400 1600,將兩組數(shù)據(jù)分別取對數(shù),記為x1, x2 。 x1: 2.000 2.301 2.602 2.602 2.602 2.602 2.903 3.204 3.204 3.204 3.505 x2:2.000 2.000 2.000 2.301 2.301 2.301 2.301 2.602 3.204,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第152頁,一、兩樣本方差的齊性檢驗 用較大的樣本方差S2比較小的樣本方差S2,第七節(jié) 兩總體方差的齊性檢驗和t檢驗,1為分子自由度,2為分母自由度,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第153頁,注意: 方差齊性檢驗本為雙側(cè)檢驗,但由于公式(3.18)規(guī)定以較大的方差作分子,F(xiàn)值必然大于1,故附表3單側(cè)0.025的界值,實對應(yīng)雙側(cè)檢驗P=0.05; 當(dāng)樣本含量較大時(如n1和n2均大于50),可不必作方差齊性檢驗,第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗,第154頁,深層水:n1=8, 樣本均數(shù)=1.781(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度遠(yuǎn)程英語教育兼職外教合同3篇
- 二零二五年酒店員工福利待遇轉(zhuǎn)讓合同示例3篇
- 二零二五版寄賣合同范本:農(nóng)產(chǎn)品寄售協(xié)議書3篇
- 二零二五版植物營養(yǎng)肥料試驗與研究服務(wù)合同3篇
- 二零二五年度酒類批發(fā)市場租賃銷售合同2篇
- 二零二五年度耕地承包與農(nóng)村土地承包權(quán)登記發(fā)證合同2篇
- 二零二五年度紅色文化遺址保護與修復(fù)合同3篇
- 二零二五版躉購電合同:電力批發(fā)市場交易合同2篇
- 二零二五版高端社區(qū)地下車庫經(jīng)營權(quán)轉(zhuǎn)讓合同3篇
- 二零二五年度智能化辦公大樓安全防范系統(tǒng)合同2篇
- 【傳媒大學(xué)】2024年新營銷
- 乳腺癌的綜合治療及進展
- 【大學(xué)課件】基于BGP協(xié)議的IP黑名單分發(fā)系統(tǒng)
- 2025屆廣東省佛山市高三上學(xué)期普通高中教學(xué)質(zhì)量檢測(一模)英語試卷(無答案)
- 自身免疫性腦炎課件
- 人力資源管理各崗位工作職責(zé)
- 信陽農(nóng)林學(xué)院《新媒體傳播學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024建筑公司年終工作總結(jié)(32篇)
- 信息安全意識培訓(xùn)課件
- 2024年項目投資計劃書(三篇)
- 配電安規(guī)課件
評論
0/150
提交評論