




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
衛(wèi)生統(tǒng)計學劉金輝寶坻區(qū)疾病預防控制中心第一章
緒論統(tǒng)計學概念:統(tǒng)計學是處理數(shù)據(jù)中變異性的科學與藝術(shù),內(nèi)容包括數(shù)據(jù)的收集
、分析、解釋和表達,目的是求得可靠的結(jié)果。以往教材中概念:是研究數(shù)據(jù)的收集、整
理、分析和推斷的一門科學。第一節(jié)概述
根據(jù)研究領域和研究對象的不同,統(tǒng)計學又分為:數(shù)理統(tǒng)計、經(jīng)濟統(tǒng)計、生物統(tǒng)計、衛(wèi)生統(tǒng)計、醫(yī)學統(tǒng)計……醫(yī)學統(tǒng)計學(medicalstatistics):用統(tǒng)計學的原理和方法研究醫(yī)學中的問題。衛(wèi)生統(tǒng)計學(healthstatistics):與醫(yī)學統(tǒng)計學基本相同,但更側(cè)重于社會、人群的衛(wèi)生問題。
采用統(tǒng)計學方法,發(fā)現(xiàn)不確定現(xiàn)象背后隱藏的規(guī)律。變異是個體間存在的差異,是絕對的,是社會和生物醫(yī)學中的普遍現(xiàn)象。變異使得實驗或觀察的結(jié)果具有不確定性,如每個人的身高、體重、血壓等各有不同。為什么要學習統(tǒng)計學?
最大值=6.18,最小值=3.29,極差=2.892.
用統(tǒng)計學思維方式考慮有關(guān)醫(yī)學研究中的問題
“陽性”結(jié)果是否是虛假聯(lián)系?某感冒藥治療1周后,治愈率為90%,能否說該感冒藥十分有效?
“陰性”結(jié)果是否是樣本含量不足?
有人曾對發(fā)表在Lancet,NEnglJMed,JAMA等著名醫(yī)學雜志上的71篇陰性結(jié)果的論文作過分析,發(fā)現(xiàn)其中有62篇(93%)可能是由于樣本含量不足造成的假陰性。3.
保證你的研究論文能通過統(tǒng)計學審查據(jù)國外60~80年代對不同醫(yī)學雜志發(fā)表論文的調(diào)查,有統(tǒng)計錯誤的論文的百分比最高達72%,最低也有20%。國內(nèi)1984年對《中華醫(yī)學雜志》、《中華內(nèi)科雜志》、《中華外科雜志》、《中華婦產(chǎn)科雜志》、《中華兒科雜志》595篇論文的調(diào)查結(jié)果,相對數(shù)誤用為11.2%,抽樣方法誤用15.9%,統(tǒng)計圖表誤用11.7%。某研究者1996年對4586篇論文統(tǒng)計(中華醫(yī)學會系列雜志僅占6.9%),數(shù)據(jù)分析方法誤用達55.7%。4.
獲得循證醫(yī)學證據(jù)的主要手段“良好愿望的醫(yī)學”(well-meaningmedicine)轉(zhuǎn)入“以證據(jù)為基礎的醫(yī)學”(evidence-basedmedicine,EBM)需要有統(tǒng)計學方法的支持。
全世界的醫(yī)學期刊每年大約刊登600萬學術(shù)論文,但能作為可靠“證據(jù)”的論文并不多。
第二節(jié)醫(yī)學統(tǒng)計工作內(nèi)容及資料類型一、原始統(tǒng)計數(shù)據(jù)的來源:常規(guī)保存數(shù)據(jù)醫(yī)院信息系統(tǒng)(HIS)、統(tǒng)計報表等2.現(xiàn)場調(diào)查記錄3.實驗記錄4.其他
一、研究設計二、搜集資料三、整理資料四、分析資料五、結(jié)果表達二、統(tǒng)計工作的內(nèi)容設計的內(nèi)容包括資料的收集、整理和分析全過程的設想和安排。常有:1.調(diào)查設計(surveydesign)對研究對象不施加任何干預,通常建立隨機抽樣(randomsampling)方案。2.實驗設計(experimentdesign)對研究對象施加干預,如動物實驗研究、臨床試驗,通常建立隨機分組(randomallocation)方案。(一)、研究設計實驗設計的三個基本原則1.隨機化(randomization)2.對照(control)3.重復(replication)(二)、收集資料收集資料要遵循完整、準確、及時三個原則。衛(wèi)生工作中統(tǒng)計資料主要來源于三個方面:1.統(tǒng)計報表:由國家統(tǒng)一設計,要求醫(yī)療衛(wèi)生機構(gòu)定期逐級上報。如傳染病防治法。2.經(jīng)常性工作記錄:如經(jīng)常性衛(wèi)生監(jiān)測記錄等。3.專題調(diào)查和實驗:我們常把前兩個來源稱經(jīng)常性資料,后者稱為一時性資料。(三)、整理資料目的是將搜集到的原始資料系統(tǒng)化、條理化,便于進一步計算與分析。編碼,將數(shù)據(jù)輸入計算機糾錯改錯、補漏等(四)、分析資料(dataanalysis)
運用各種統(tǒng)計分析方法,結(jié)合專業(yè)知識,從經(jīng)過整理的資料中,計算出各種指標,進行統(tǒng)計描述和統(tǒng)計推斷,反映數(shù)據(jù)的綜合特征,闡明事物的內(nèi)在聯(lián)系與規(guī)律。1.統(tǒng)計描述(descriptivestatistics):指用統(tǒng)計指標、統(tǒng)計表、統(tǒng)計圖等方法對資料的數(shù)量特征及分布規(guī)律進行測定和描述。2.統(tǒng)計推斷(inferentialstatistics):指如何抽樣,以及如何由樣本信息推斷總體特征問題??傮w均數(shù)、總體率的可信區(qū)間及其假設檢驗兩個總體均數(shù)、總體率差值的可信區(qū)間及其假設檢驗多個總體指標之間的假設檢驗。(五)、結(jié)果表達使用的統(tǒng)計學方法使用的統(tǒng)計學軟件(SAS、SPSS)假設檢驗的統(tǒng)計量、P值等結(jié)論三、資料的類型:
只有認識了數(shù)據(jù)的特點,才能正確地選用統(tǒng)計分析方法基本概念:變量及變量值研究者對每個觀察單位的某項特征進行觀察和測量,這種特征稱為變量,變量的測得值叫變量值(也叫觀察值),全部變量值的集合也稱為資料。按變量值的性質(zhì)可將資料分為:
計量資料
計數(shù)資料等級分組資料1.計量資料(定量資料、數(shù)值變量)定義:通過度量衡的方法,測量每一個觀察單位的某項研究指標的量的大小,得到的一系列數(shù)據(jù)資料。例如:體重與身高特點:表現(xiàn)為數(shù)值大小有度量衡單位多為連續(xù)性資料
(通過測量得到)定義:將全體觀測單位按照某種性質(zhì)或特征分組,然后再分別清點各組觀察單位的個數(shù)。特點:沒有度量衡單位多為間斷性資料
(通過枚舉或記數(shù)得來)可分為二項與多項定性資料2.定性資料(分類資料、分類變量)定義:介于計量資料和計數(shù)資料之間的一種資料,通過半定量方法測量得到。特點:每一個觀察單位沒有確切值各組之間有性質(zhì)上的差別或程度上的不同。示例:檢查尿蛋白,觀察單位是每一份尿標本,按結(jié)果等級不同可分為-、+、++、+++、++++等。3.等級分組資料(有序變量)1、定性數(shù)據(jù)
(二項與多項)分類數(shù)據(jù)
計數(shù)數(shù)據(jù)2、定量數(shù)據(jù)
計量數(shù)據(jù)區(qū)間數(shù)據(jù)
數(shù)值數(shù)據(jù)3、等級資料
有序資料定性與定量數(shù)據(jù)的別名三類數(shù)據(jù)間的關(guān)系
例:一組20
40歲成年人的血壓(變量)以12kPa為界分為正常與異常兩組,統(tǒng)計每組例數(shù)
<8低血壓
8
正常血壓
12
輕度高血壓
15
中度高血壓
17
重度高血壓定量數(shù)據(jù)等級數(shù)據(jù)定性數(shù)據(jù)三類數(shù)據(jù)的編碼與計算(1)
例:一組20
40歲成年人的血壓以12kPa為界分為正常(=0)與異常(=1)兩組,統(tǒng)計每組例數(shù)
<8低血壓418
正常血壓102
12
輕度高血壓13315
中度高血壓164
17
重度高血壓185定量數(shù)據(jù)等級數(shù)據(jù)定性數(shù)據(jù)三類數(shù)據(jù)的編碼與計算(2)1.定量數(shù)據(jù):允許計算均數(shù)、標準差等(可采用t、F檢驗等,可當做有序或定性數(shù)據(jù)處理)2.定性數(shù)據(jù):編碼是任意的,不能對編碼執(zhí)行均數(shù)標準差等計算,但可計算率或比(可采用卡方檢驗等)
調(diào)查14名男子的婚姻狀況分類編碼頻數(shù)(frequency)單身13已婚25離異32分居443.有序數(shù)據(jù):允許基于順序的計算,如計算中位數(shù)、百分位數(shù)(可當做定性數(shù)據(jù)處理)第三節(jié)統(tǒng)計學中常用的幾個基本概念1、總體與樣本2、抽樣方法3、同質(zhì)與變異4、誤差5、頻率與概率
6、參數(shù)與統(tǒng)計量
※1.總體與樣本(population&sample)總體:根據(jù)研究目的確定的同質(zhì)的、所有觀察單位的某種變量值的集合。
例:2009級陜西中醫(yī)學院本科女生身高;
2007年陜西中醫(yī)學院大學生的身高;全國女大學生的身高(高血壓病人;肥胖病人)分類:
有限總體:理論上說,觀察單位的數(shù)量是可知的、有限的。
無限總體:沒有時間和地點的限制,觀察單位總數(shù)量是不可知的。
目標總體研究總體鑒于總體的巨大或不可知性
能否研究其中的一部分?不可能或沒有必要對全體中的每一個對象進行研究樣本概念:從總體中隨機抽取的、具有代表性的部分研究對象,其實測值的集合。如何從總體中得到有代表性的一部分?得到多少合適呢?2.隨機抽樣為了保證樣本的可靠性和代表性,需要采用隨機的方法抽取樣本(在總體中每個個體具有相同的機會被抽到樣本中)。Targetpopulation(目標總體)
Populationsampled(抽樣總體)
Sample(樣本)能不能成功的達到從樣本推斷總體的目的,關(guān)鍵是抽樣方法,樣本的代表性和推斷的技術(shù),這些是統(tǒng)計學的核心內(nèi)容。
概率(隨機)抽樣等概率抽樣非等概率抽樣簡單隨機抽樣機械抽樣分層抽樣整群抽樣
抽樣方法:簡單隨機抽樣:
將全部調(diào)查單位進行編號,再用隨機數(shù)字表或抽簽等方法隨機抽取部分觀察單位組成樣本。機械抽樣:
間隔抽樣,將總的觀察對象按某種順序編號,從這些編號中按照一定的間隔抽取樣本。分層抽樣:
按照某種性質(zhì)或者特征將總體分為若干組別、類別或區(qū)域(層),再從每一種層中用隨機的方法進行抽樣,獲得樣本。整群抽樣:
將總體按照某些特征分成多個組,用隨機的方法從這些組中抽取部分組作為研究對象。組中的全部觀察這組成樣本。3.同質(zhì)與變異
同質(zhì)與變異:研究對象具有的相同的狀況或?qū)傩缘裙残苑Q同質(zhì)或同質(zhì)性;對于同質(zhì)的各觀察單位,其某變量值之間的差異,稱為變異。同質(zhì)事物個體間的差異來源于一些未加控制或無法控制的甚至不明原因的因素。
例如:研究某新藥治療胃潰瘍的效果,所有研究對象都必須是確診為胃潰瘍的病人且病情相似,在這種同質(zhì)的基礎上觀察治療效果,有的人治愈,有的人未愈,這種差異就是變異。從本質(zhì)上說,統(tǒng)計學就是研究變異的科學4.誤差定義:統(tǒng)計上所說的誤差泛指測量值與真值之差,樣本指標與總體指標之差。主要有以下三種:
系統(tǒng)誤差隨機誤差
抽樣誤差
系統(tǒng)誤差:指數(shù)據(jù)搜集和測量過程中由于儀器不準確、標準不規(guī)范等原因,造成觀察結(jié)果呈傾向性的偏大或偏小,這種誤差稱為系統(tǒng)誤差。特點:具有累加性隨機誤差:由于一些非人為的偶然因素使得結(jié)果或大或小,是不確定、不可預知的。特點:隨測量次數(shù)增加而減小。(隨機測量誤差,抽樣誤差)。在消除了系統(tǒng)誤差的前提下,由于非人為的偶然因素,對于同一樣本多次測定結(jié)果不完全一樣,結(jié)果有時偏大有時偏小,沒有傾向性,這種誤差叫隨機測量誤差。特點:沒有傾向性,多次測量計算平均值可以減小甚至消除隨機測量誤差。隨機測量誤差由于抽樣原因造成的樣本指標與總體指標之間的差別。特點:有抽樣發(fā)生抽樣誤差就不可避免。統(tǒng)計上可以計算并在一定范圍內(nèi)控制抽樣誤差。抽樣誤差(1)改進抽樣方法,增加樣本的代表性;樣本量n相等的情況下:整群抽樣>單純隨機抽樣>系統(tǒng)抽樣>分層抽樣(2)增加樣本量n;(3)選擇變異程度較小的研究指標。減少抽樣誤差的方法:頻率:樣本的實際發(fā)生率稱為頻率。設在相同條件下,獨立重復進行n次試驗,事件A出現(xiàn)m次,則事件A出現(xiàn)的頻率為f=
m/n。概率:隨機事件發(fā)生的可能性大小,用大寫的P表示;取值[0,1]。5、頻率與概率
必然事件P=1隨機事件0<P<1不可能事件P=0統(tǒng)計學上把P≤0.05(5%)或P≤0.01(1%)稱為小概率事件(習慣),認為不大可能發(fā)生。CertainImpossible0.501通常我們把經(jīng)常遇到的事件分為三種類型:頻率與概率間的關(guān)系:
1.樣本頻率總是圍繞概率上下波動;
2.樣本含量n越大,波動幅度越小,頻率越接近概率。6、參數(shù)與統(tǒng)計量
(parameterandstatistic)參數(shù):總體的統(tǒng)計指標,如總體均數(shù)、總體標準差,分別用希臘字母記為μ、σ。固定的常數(shù)
總體樣本抽取部分觀察單位
統(tǒng)計量
參數(shù)
推斷inference統(tǒng)計量:樣本的統(tǒng)計指標,如樣本均數(shù)、標準差,采用拉丁字母分別記為。參數(shù)附近波動的隨機變量。第二章集中趨勢的統(tǒng)計描述主要內(nèi)容2.1頻數(shù)分布2.2平均數(shù)
第一節(jié)頻數(shù)分布
表9-12002年某市150名正常成年男子的尿酸濃度(μmol/L)
142.3148.8142.7144.4144.7145.1143.3154.2152.3142.7156.6137.9143.9141.2139.3145.8142.2137.9141.2150.6142.7151.3142.4141.5141.9147.9125.9139.9148.9154.9145.7140.8139.6148.8147.8146.7132.7149.7154.0158.2138.2149.8151.1140.1140.5143.4152.9147.5147.7162.6141.6143.6144.0150.6138.9150.8147.9136.9146.5130.6142.5149.0145.4139.5148.9144.5141.8148.1145.4134.6130.5145.2146.2146.4142.4137.1141.4144.0129.4142.8132.1141.8143.3143.8134.7147.1140.9137.4142.5146.6135.5146.8156.3150.0147.3142.9141.4134.7138.5146.6134.5135.1141.9142.1138.1134.9146.7138.5139.6139.2148.8150.3140.7143.5140.2143.6138.7138.9143.5139.9134.4133.1145.9139.2137.4142.3160.9137.7142.9126.8
頻數(shù)分布及其制作對某個隨機事件進行重復觀察,其中某變量值出現(xiàn)的次數(shù)被稱作頻數(shù)。
當匯總大量的原始數(shù)據(jù)時,把數(shù)據(jù)按類型分組,其中每個組的數(shù)據(jù)個數(shù),稱為該組的頻數(shù)。
頻數(shù)表是用于反映各組及其相對應的組頻數(shù)之間的關(guān)系。頻數(shù)表的制作步驟如下,以例2.1為例:1.計算極差R(最大值和最小值的差值)
本例中R=5.95-3.82=2.13(1012/L)2.決定組數(shù)(10-15組,最常用10-12組)3.計算組距i(等于極差與組數(shù)的比值,取整數(shù)和取偶數(shù)的原則)
本例中i=2.13/10=0.2131012/L
,取整數(shù)等于0.21012/L
寫組段(第一組段應包含最小值,最后一組段包含最大值,每個組段為前閉后開區(qū)間,最后一個組段為閉區(qū)間。也應遵循取整數(shù)和偶數(shù)的原則)
本例中第一組段應包含最小值3.82,取3.80為第一組段的下限,寫為前閉后開區(qū)間,3.80~。最后一組段應包括最大值,寫為閉區(qū)間5.80~6.00。5.列表劃記(組段和頻數(shù)是頻數(shù)表的基本要素)表2-2某地140名正常男子紅細胞數(shù)的頻數(shù)表(1012/L)圖2-1140名正常男子紅細胞數(shù)頻數(shù)分布的直方圖
對頻數(shù)表和圖的觀察,可以看出兩個重要特征:
1.集中趨勢:平均水平,向中間集中,中等數(shù)據(jù)的人數(shù)最多。
2.離散趨勢:變異水平,即隨著紅細胞數(shù)測量值逐漸變大或變小,人數(shù)越來越少,向兩端分散。頻數(shù)表的主要用途1.作為陳述資料的形式,可以替代繁雜的原始資料,便于進一步分析2.便于觀察數(shù)據(jù)的分布類型3.便于發(fā)現(xiàn)資料中某些遠離群體的特大或特小的可疑值4.當樣本含量比較大時,可用各組段的頻率作為概率的估計值5.計算集中趨勢指標與離散趨勢指標數(shù)據(jù)的分布類型對稱分布和不對稱分布正態(tài)分布:圖形中間的直條最高,高峰在中央,兩邊對稱或基本對稱地減少。偏態(tài)分布:若高峰不在中央,而位于一側(cè)。若高峰位于左側(cè),稱正偏態(tài)分布,如高峰位于右側(cè),稱負偏態(tài)分布。
對數(shù)據(jù)的描述指標也分為兩類:描述集中趨勢或平均水平的指標。2.描述離散趨勢或變異水平的指標。第二節(jié)平均數(shù)常用幾種平均值:1.算術(shù)均數(shù)2.幾何均數(shù)3.中位數(shù)集中趨勢常用平均值來描述。平均值是一組數(shù)據(jù)的典型或有代表性的值。由于這樣典型的值趨向于落在根據(jù)數(shù)據(jù)大小排列的數(shù)據(jù)的中心,因此可以用于度量集中位置(位置指標)
算術(shù)平均數(shù)(簡稱為均數(shù))一、定義:一組已知性質(zhì)相同的數(shù)值之和除以數(shù)值個數(shù)所得的商。以(總體)(樣本)表示。二、特征:∑(X-)=0估計誤差之和為0。
三、適用資料類型:
1.描述正態(tài)分布和近似正態(tài)分布資料集中趨勢的最好指標。
2.適用于大多數(shù)正常人的生理、生化指標。
四、計算方法:
1.直接法
2.加權(quán)法
直接法
適用條件:當觀察例數(shù)不多時,或觀察例數(shù)雖然很多,但有計算機及統(tǒng)計軟件,宜選擇直接法。
式(2-1)例2.1見書P10
加權(quán)法
適用條件:當無原始數(shù)據(jù)或觀察例數(shù)很多又缺乏計算機及統(tǒng)計軟件時,若用直接法很容易出錯,可以用加權(quán)法處理。
式(2-2)利用表2-2資料,用加權(quán)法計算140名正常男子紅細胞數(shù)濃度的均數(shù),計算見表1表1某地140名正常男子紅細胞數(shù)均數(shù)和標準差(1012/L
)加權(quán)法計算用表加權(quán)法計算的結(jié)果根據(jù)表1得:
=669.80/140=4.78(1012/L
)而將該資料輸入計算機用統(tǒng)計軟件和直接法計算,得
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 駱駝祥子人物性格分析教學教案:探究社會變遷與人性的掙扎
- 汽車租賃三方合同
- 農(nóng)作物種植技術(shù)手冊
- 圖表展示各類數(shù)據(jù)統(tǒng)計情況
- 小學生數(shù)學應用題的作文分析與實踐指導
- 留置擔保合同協(xié)議書
- 文學佳作圍城中的人物形象解讀
- 智能交通大數(shù)據(jù)平臺開發(fā)協(xié)議
- 企業(yè)戰(zhàn)略聯(lián)盟穩(wěn)定性評價與維護
- 產(chǎn)品推廣合作合同
- FZ/T 24011-2019羊絨機織圍巾、披肩
- 【課件】2.1.1植物細胞工程的基本技術(shù)課件-2021-2022學年高二下學期生物人教版選擇性必修3
- 35kV集電線路直埋施工組織設計方案
- 客戶來訪登記表
- 日產(chǎn)新軒逸電子手冊cvt
- 人教八年級下冊英語U5Do-you-remember-what-you-were-doing?課件
- 大連市小升初手冊
- 醫(yī)療垃圾管理及手衛(wèi)生培訓PPT課件
- 嚇數(shù)基礎知識共20
- 鋰電池安全知識培訓-課件
- 電子產(chǎn)品高可靠性裝聯(lián)工藝下
評論
0/150
提交評論