緒論-醫(yī)學課件_第1頁
緒論-醫(yī)學課件_第2頁
緒論-醫(yī)學課件_第3頁
緒論-醫(yī)學課件_第4頁
緒論-醫(yī)學課件_第5頁
已閱讀5頁,還剩102頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、衛(wèi)生統(tǒng)計學 四川大學華西公共衛(wèi)生學院衛(wèi)生統(tǒng)計學教研室張強 第一章 緒論第一節(jié) 衛(wèi)生統(tǒng)計學的定義和內(nèi)容1.什么是衛(wèi)生統(tǒng)計學? Statistics is the art and science of gathering, analysis and making inferences from data. 衛(wèi)生統(tǒng)計學(health statistics)是應用概率論和數(shù)理統(tǒng)計的基本原理和方法,研究醫(yī)學領域中的數(shù)據(jù)的收集、整理和分析的一門科學。 衛(wèi)生統(tǒng)計學的研究內(nèi)容都必須建立在統(tǒng)計學的基本原理和方法的基礎上。 當今的人類社會進入了科技高速發(fā)展的時代,信息的傳播和交流日益加快,為適應時代發(fā)展的要求,必

2、須加快認識世界、改造世界的步伐。 醫(yī)學、衛(wèi)生領域的研究對象是人,故有其特殊性,具有較大的生物變異性,并受諸多社會、心理因素的影響,更需要借助統(tǒng)計分析,透過偶然現(xiàn)象認識其內(nèi)在的規(guī)律性,以推動各項醫(yī)療衛(wèi)生事業(yè)的發(fā)展。麻醉劑氟烷(halothane)的一場風波 然而不久有報告稱: 數(shù)例病人術后恢復的同時病情突然惡化、發(fā)熱、死亡,尸檢顯示肝臟大片壞死。 在有較完整病案資料的34家醫(yī)院中抽取 19601964 年間的 85 萬例手術病例。 不分死因,共有17000例死于術后6周內(nèi)。 粗死亡率為20/千。 按所用麻醉劑區(qū)分 氟烷、硫噴妥鈉(pentothal sodium)、環(huán)丙烷(cyclopropan

3、e)、乙醚(ether)和其他麻醉劑相應的粗死亡率分別為: 17/千、17/千、34/千、19/千、30/千。 死亡與術前狀況有關病情輕者死亡率僅2.5/千,重者可達300/千; 也與手術本身的危險性有關各種手術死亡率低者僅2.5/千,高者達140/千; 還與年齡、性別、醫(yī)院等有關。 校正后的死亡率分別為: 21/千、20/千、26/千、20/千、25/千。吸煙危害健康的爭論 吸煙危害健康,如今已成國際共識。 1939年Muller采用病例對照設計收集一組肺癌病人, 并配置一組其他特點與之相似的非肺癌病人作為對照組, 逐一詢問吸煙否、吸煙量和時間。 1964年Doll和Hill的一項前瞻性研究

4、:向60000名英國醫(yī)生發(fā)出關于吸煙的問卷;其中40000名應答; 據(jù)此將他們分為吸煙組和不吸煙組; 借助英國良好的死亡登記系統(tǒng)追蹤他們的結局; 發(fā)現(xiàn)吸煙組肺癌的年發(fā)病率為0.166、心臟病年發(fā)病率為0.599; 不吸煙組肺癌的年發(fā)病率為0.007、心臟病年發(fā)病率為0.422。 兩位統(tǒng)計學家的挑戰(zhàn)促進了吸煙有害健康研究的深入。 瑞典國家雙生研究即為一例: 他們調(diào)查了一方吸煙、一方不吸煙的雙生子,其中,同卵雙生男274對,女264對; 異卵雙生男733對,女653對。 發(fā)現(xiàn)慢性支氣管炎患病率 在同卵雙生的吸煙者中男、女分別為14.6和13.6, 而不吸煙者中男、女分別為7.7和7.6; 在異卵雙

5、生的吸煙者中男、女分別為12.3和14.5, 而不吸煙者中男、女分別為5.5和5.7。 吸煙與不吸煙相比,慢性支氣管炎患病的相對危險度約為1.82.5倍。 此外,還有更多的間接證據(jù) 例如動物試驗,狗的模擬吸煙導致與人類肺癌相似的結局; 吸煙有損動脈血管; 吸煙與死亡率有劑量反應關系; 戒煙時間長短對死亡率有不同影響等。3.怎樣學習衛(wèi)生統(tǒng)計學?(1)著重理解基本原理與基本概念;(2)注意培養(yǎng)科學的統(tǒng)計思維方法;(3)聯(lián)系實際、結合專業(yè);(4)對數(shù)理統(tǒng)計公式不必深究其推導;(5)教學內(nèi)容盡快消化;二.基本概念A.資料類型1.計量資料(數(shù)值變量)2.計數(shù)資料(分類變量)3.等級資料(有序分類) 在確

6、定總體之后,研究者則應對每個觀察單位的某項特征進行測量和觀察,這種特征稱為變量。 對變量的測得值稱為變量值(value of variable)或觀察值(observed value) 亦稱為資料。 定量資料(quantitative data) 亦稱數(shù)值變量(numerical variable),其變量值是定量的; 表現(xiàn)為數(shù)值大小,一般有度量衡單位。 分類資料(categorical data) 或分類變量(categorical variable) 亦稱定性資料(qualitative data); 其觀察值是定性的,表現(xiàn)為互不相容的類別或?qū)傩裕袃煞N情況:無序分類(unordered

7、categories) 包括: 二項分類。如檢查某小學學生大便中的蛔蟲卵,以每個學生為觀察單位,結果可以是蛔蟲卵陽性或陰性; 又如觀察用某藥治療某病患者的治療結果,以每個患者為觀察單位,結果分為治愈與未愈兩類。兩類間互相對立。 多項分類。 如觀察某人群的血型,以人為觀察單位,結果分為A型、B型、AB型與O型,為互不相容的多個類別。 無序分類變量的分析,應先分類匯總,計觀察單位數(shù),編制分類資料的頻數(shù)表,亦稱計數(shù)資料。 有序分類(ordinal categories)。各類之間有程度的差別,給人以“半定量”的概念,亦稱等級資料(ordinal data)。 如測定某人群血清反應,以人為觀察單位,

8、結果可分、+四級; 又如觀察用某藥治療某病患者的治療結果,以每個患者為觀察單位,結果分為治愈、顯效、好轉(zhuǎn)、無效四級。 實際上,資料類型的劃分,是根據(jù)研究目的而確定的。 根據(jù)需要,各類變量可以互相轉(zhuǎn)化。 B.同質(zhì)與變異同質(zhì)是統(tǒng)計研究的必備條件,變異是統(tǒng)計研究的核心內(nèi)容。C.概率 一般地,設某試驗的可能結局有E1,E2,等,我們分別稱E1,E2,為事件(event)。 一次試驗中出現(xiàn)某事件E的機會大小稱為事件E的概率,記為P(E)。 概率可記為 或簡記為 隨機事件概率的大小在 與 之間, 即 , 常用小數(shù)或百分數(shù)表示。 越接近 ,表示某事件發(fā)生的可能性越大, 越接近 ,表示某事件發(fā)生的可能性越小。

9、 一般所說的是以頻率為基礎的概率。主觀概率 對于任意兩個事件E1和E2,稱E1發(fā)生條件下E2發(fā)生的概率為條件概率(conditional probability)。 記為P(E2 |E1)。 例如EB病毒陽性者患鼻咽癌的概率便是一個條件概率, 記為: P (患鼻咽癌 |EB病毒陽性) 對于任意兩個事件E1和E2,若它們不可能同時發(fā)生,則稱E1和E2為互不相容事件。 如果某試驗只有兩個互不相容的可能結局 和 ,則稱它們?yōu)榛ハ鄬α⒌氖录?,顯然 某事件 發(fā)生的概率與其對立事件 發(fā)生的概率之比稱為該事件的優(yōu)勢(odds)或機會比,有的書上稱為比數(shù) 人們時常討論吸煙(A)與肺癌的關系(B),如何通過P(

10、A |B) 來求P(B |A)是我們大家所關心的問題。這就是著名的Bayes公式D總體與樣本 任何統(tǒng)計研究都必須首先確定觀察單位(observed unit),亦稱個體(individual),它是統(tǒng)計研究中最基本的單位; 它可以是一個人、一個家庭、一個地區(qū)、一個樣品、一個采樣點等,這些根據(jù)研究目的確定的同質(zhì)觀察單位的全體稱為總體。 總體是根據(jù)研究目的確定的同質(zhì)觀察單位的全體,更確切地說,是同質(zhì)的所有觀察單位某種觀察值(變量值)的集合。 樣本是總體中隨機抽取的部分觀察單位,其實測值的集合。 所謂隨機抽樣,就是按隨機化原則(即總體中每一個觀察單位都有同等的機會被選入到樣本中來)獲取樣本; 以避免

11、誤差和偏倚對研究結果有所影響。 三.統(tǒng)計工作的步驟1. 設 計2. 收 集3. 整 理4. 分 析 設計(design) 在進行統(tǒng)計工作和研究工作之前必需有一個周密的設計。設計之前,當然應先對研究的問題有較多的了解。 為此,需要廣泛查閱文獻,了解實際情況,而且,常要與有關專家共同協(xié)作。設計的內(nèi)容包括資料收集、整理和分析全過程總的設想和安排。 設計是整個研究中最關鍵的一環(huán),也是今后工作應遵循的依據(jù)。 收集資料(collection of data) 應采取措施使能取得準確可靠的原始數(shù)據(jù)。 整理資料(sorting data) 任務是凈化原始數(shù)據(jù),使其系統(tǒng)化、條理化,便于進一步計算和分析。 首先是

12、資料清理(data cleaning)。 分析資料(analysis of data) 目的是計算有關指標,反映數(shù)據(jù)的綜合特征(亦稱綜合指標),闡明事物的內(nèi)在聯(lián)系和規(guī)律。統(tǒng)計分析包括: 統(tǒng)計描述(descriptive statistics),指用統(tǒng)計指標、統(tǒng)計表、統(tǒng)計圖等方法,對資料的數(shù)量特征及其分布規(guī)律進行測定和描述。 統(tǒng)計推斷(inferential statistics),指如何抽樣,以及如何由樣本信息推斷總體特征問題。 雖然人為地將統(tǒng)計工作分為以上四個步驟,但它們是緊密聯(lián)系、不可分割的整體; 缺少任何一步,都會影響整個研究的結果。四.計量資料的描述1.集中趨勢(平均數(shù))A. 算術平均

13、數(shù)(均數(shù))B. 中位數(shù) MC. 幾何均數(shù) G 算術均數(shù)(arithmetic mean)算術均數(shù)簡稱均數(shù)(mean)。總體均數(shù)(population mean)用希臘字母 表示,樣本均數(shù)常用 表示。 均數(shù)描述一組數(shù)據(jù)在數(shù)量上的平均水平,其計算方法如下:1.直接法 將所有數(shù)據(jù) 直接相加,再除以總例數(shù)n,即 如例2.1,某市110名7歲男孩身高均數(shù)為 2. 加權法(weighting method) 當資料中出現(xiàn)相同觀察值時,可將相同觀察值的個數(shù)(即頻數(shù) f )與該觀察值 的乘積代替相同觀察值的逐個相加。加權法求均數(shù)的計算公式為: 例2.1 某市110名7歲男童的身高(cm)資料如下,請作統(tǒng)計描述

14、。114.4 119.2 124.7 125.0 115.0 112.8 120.2 110.2 120.9 120.1125.5 120.3 122.3 118.2 116.7 121.7 116.8 121.6 115.2 122.0121.7 118.8 121.8 124.5 121.7 122.7 116.3 124.0 119.0 124.5121.8 124.9 130.0 123.5 128.1 119.7 126.1 131.3 123.8 114.7122.2 122.8 128.6 122.0 132.5 122.0 123.5 116.3 126.1 119.2126.

15、4 118.4 121.0 119.1 116.9 131.1 120.4 115.2 118.0 122.4114.3 116.9 126.4 114.2 127.2 118.3 127.8 123.0 117.4 123.2119.9 122.1 120.4 124.8 122.1 114.4 120.5 115.0 122.8 116.8125.8 120.1 124.8 122.7 119.4 128.2 124.1 127.2 120.0 122.7118.3 127.1 122.5 116.3 125.1 124.4 112.3 121.3 127.0 113.5118.8 127

16、.6 125.2 121.5 122.5 129.1 122.6 134.5 118.3 132.8制作頻數(shù)分布表,步驟如下:求數(shù)據(jù)的極差(range) 極差是全部數(shù)據(jù)中的最大值與最小值之差,它描述了數(shù)據(jù)變異的幅度。 R=134.5cm-110.2cm=24.3cm2. 劃分組段 確定組數(shù): 制作頻數(shù)表是為了簡化資料,顯 示出數(shù)據(jù)的分布規(guī)律,故組數(shù)不宜過 多,但組數(shù)也不能太少,組數(shù)太少也 會掩蓋數(shù)據(jù)分布的規(guī)律。 確定組距: 組距可以相等,也可以不相等。實際應用時一般采用等距分組,其組距近似等于(極差/組數(shù))。 極差/組數(shù)=(24.3/10)2,故取組距=2確定各組段的上下限: 每個組段的起點被

17、稱為該組的下限(low limit),終點被稱為上限(upper limit)統(tǒng)計各組段內(nèi)的數(shù)據(jù)頻數(shù) 統(tǒng)計出各組段內(nèi)的數(shù)據(jù)個數(shù)(頻數(shù))即得頻數(shù)表。 表2.1 110名7歲男童身高頻數(shù)分布表2.2 2005年某市102名高中男生引體向上完成次數(shù)的頻數(shù)分布頻數(shù)分布表的用途 1. 頻數(shù)分布表可揭示資料的分布類型 2. 由頻數(shù)分布表可以看到頻數(shù)分布的兩個重要特征: 集中趨勢(central tendency) 離散趨勢 (tendency of dispersion) 3. 便于發(fā)現(xiàn)某些特大或特小的可疑值 4. 便于進一步計算統(tǒng)計指標和作統(tǒng)計處理。 圖2.1 某市110名7歲男童身高的頻數(shù)分布 圖2.

18、2 2004年我國麻疹患者的年齡分布評分頻數(shù)圖2.3 某市219名乳腺癌患者術后康復期生存質(zhì)量評分的分布 用加權法可求某市110名7歲男孩身高均數(shù)如下: 均數(shù)的特性:各觀察值與均數(shù)之差(離均差) 的總和等于零。即:2. 各觀察值的離均差平方和最小。 即: 中位數(shù)(median) 例:8名新生兒的身高(cm)為55,58,54,50,53,51,54,52,求中位數(shù)。將8個數(shù)排序得: 50, 51, 52, 53, 54, 54, 55, 58 表2.4 某市大氣中 日平均濃度(二) 中位數(shù)的應用 1. 中位數(shù)可用于各種分布的資料,在正態(tài)分布資料中,中位數(shù)等于均數(shù);在對數(shù)正態(tài)分布資料中,中位數(shù)等于幾何均數(shù)。 2. 中位數(shù)不受極端值的影響,因此,實際工作中主要用于不對稱分布類型的資料、兩端無確切值或分布不明確的資料。幾何均數(shù)(geometric mean) 5名學齡兒童的麻疹血凝抑制抗體滴度為1:25, 1:50, 1:50, 1:100, 1:400。求幾何均數(shù)。表2.5 40例麻疹易感兒童的血凝抑制抗體滴度 (二) 幾何

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論