流行病學(xué)數(shù)據(jù)統(tǒng)計(jì)分析策略_第1頁
流行病學(xué)數(shù)據(jù)統(tǒng)計(jì)分析策略_第2頁
流行病學(xué)數(shù)據(jù)統(tǒng)計(jì)分析策略_第3頁
流行病學(xué)數(shù)據(jù)統(tǒng)計(jì)分析策略_第4頁
流行病學(xué)數(shù)據(jù)統(tǒng)計(jì)分析策略_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、流行病學(xué)數(shù)據(jù)統(tǒng)計(jì)分析策略流行病學(xué)數(shù)據(jù)統(tǒng)計(jì)分析策略中南大學(xué)湘雅公共衛(wèi)生學(xué)院中南大學(xué)湘雅公共衛(wèi)生學(xué)院譚紅專譚紅專 教授教授2022-4-102主要內(nèi)容主要內(nèi)容n概述概述n專題研究的數(shù)據(jù)分析專題研究的數(shù)據(jù)分析n常規(guī)收集的流行病學(xué)數(shù)據(jù)的分析常規(guī)收集的流行病學(xué)數(shù)據(jù)的分析 2022-4-103第一節(jié)第一節(jié) 概述概述n流行病學(xué)研究與流行病學(xué)數(shù)據(jù)流行病學(xué)研究與流行病學(xué)數(shù)據(jù)n流行病學(xué)數(shù)據(jù)分析的目的流行病學(xué)數(shù)據(jù)分析的目的n流行病學(xué)數(shù)據(jù)中的變量分類流行病學(xué)數(shù)據(jù)中的變量分類n流行病學(xué)數(shù)據(jù)分析的內(nèi)容流行病學(xué)數(shù)據(jù)分析的內(nèi)容2022-4-104一、流行病學(xué)研究與流行病學(xué)數(shù)據(jù)一、流行病學(xué)研究與流行病學(xué)數(shù)據(jù)n狹義的流行病學(xué)數(shù)據(jù)

2、流行病學(xué)數(shù)據(jù)(epidemiological data)指任何來自針對(duì)明確研究目的而開展特定流行病學(xué)研究所收集的資料。n廣義的流行病學(xué)數(shù)據(jù)還包括出于其他目的和用途而收集的、可以用來定量地探索疾病健康或醫(yī)療衛(wèi)生服務(wù)其他問題的資料。n即一切可為流行病學(xué)所用的數(shù)據(jù)。目前目前的臨床大數(shù)據(jù)是個(gè)寶庫。的臨床大數(shù)據(jù)是個(gè)寶庫。2022-4-105二、流行病學(xué)數(shù)據(jù)分析的目的二、流行病學(xué)數(shù)據(jù)分析的目的n流行病學(xué)數(shù)據(jù)分析是針對(duì)明確研究問題、具有針對(duì)明確研究問題、具有明確目的明確目的、采用特定方法對(duì)流行病學(xué)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)整理、統(tǒng)計(jì)描述、統(tǒng)計(jì)推斷和總結(jié)。n流行病學(xué)研究的問題涉及疾病分布、病因與危險(xiǎn)因素、診斷、預(yù)防和治療效

3、果評(píng)價(jià)等。n數(shù)據(jù)分析的根本是正確地回答有意義的問題,而不是統(tǒng)計(jì)學(xué)數(shù)字游戲。2022-4-106流行病學(xué)數(shù)據(jù)分析的目的流行病學(xué)數(shù)據(jù)分析的目的n估計(jì)有關(guān)統(tǒng)計(jì)學(xué)指標(biāo),如相對(duì)危險(xiǎn)度;n估計(jì)該統(tǒng)計(jì)學(xué)指標(biāo)的可信區(qū)間;n控制可能的混雜因素;n分析劑量反應(yīng)關(guān)系;n分析可能的效應(yīng)修飾因子;n分析可能存在的偏倚。2022-4-107三、流行病學(xué)數(shù)據(jù)中的變量分類三、流行病學(xué)數(shù)據(jù)中的變量分類 n典型的流行病學(xué)研究中變量可根據(jù)其用途分為五類:n暴露變量:因,自變量,可以有多個(gè)n結(jié)局變量:果,因變量,是數(shù)據(jù)分析的核心n混雜因素:需要控制n效應(yīng)修飾因素:需要描述n其他變量:2022-4-108按統(tǒng)計(jì)學(xué)分類按統(tǒng)計(jì)學(xué)分類n定性

4、:二分類和多分類(無序多分類)n定量:在多數(shù)流行病學(xué)研究中被轉(zhuǎn)化為分類變量n半定量(分級(jí),有序多分類)n同一個(gè)研究中,因變量和自變量的關(guān)系應(yīng)該是固定的、不能互換。但在不同的研究中,一個(gè)變量在這個(gè)研究中可能是果,在另一個(gè)研究中也可能是因。例如,高血壓可能是遺傳的結(jié)果,血壓也可能是心腦血管事件的原因。2022-4-109四、流行病學(xué)數(shù)據(jù)分析的內(nèi)容四、流行病學(xué)數(shù)據(jù)分析的內(nèi)容 n描述研究對(duì)象的數(shù)量變動(dòng);n變量分類和數(shù)據(jù)整理;n描述和比較組間基線資料;n估計(jì)結(jié)局事件發(fā)生頻率;n估計(jì)效應(yīng)大小及其可信區(qū)間;n識(shí)別和控制混雜;n識(shí)別和測量效應(yīng)修飾作用;n識(shí)別和測量劑量反應(yīng)關(guān)系;n其他分析。 2022-4-10

5、10第二節(jié)第二節(jié) 流行病學(xué)專題研究的數(shù)據(jù)分流行病學(xué)專題研究的數(shù)據(jù)分析析一、描述研究對(duì)象的數(shù)量變動(dòng)一、描述研究對(duì)象的數(shù)量變動(dòng) 數(shù)據(jù)分析的第一步須對(duì)研究對(duì)象數(shù)數(shù)據(jù)分析的第一步須對(duì)研究對(duì)象數(shù)量隨時(shí)間的變動(dòng)進(jìn)行描述,這是判斷選量隨時(shí)間的變動(dòng)進(jìn)行描述,這是判斷選擇偏倚是否存在及其大小的主要依據(jù);擇偏倚是否存在及其大小的主要依據(jù);對(duì)選樣、抽樣和篩選都應(yīng)交代原則和方對(duì)選樣、抽樣和篩選都應(yīng)交代原則和方法;對(duì)退出和失訪都應(yīng)記錄數(shù)量和原因法;對(duì)退出和失訪都應(yīng)記錄數(shù)量和原因 。2022-4-10112022-4-1012二、流行病學(xué)變量的分類與數(shù)據(jù)轉(zhuǎn)換二、流行病學(xué)變量的分類與數(shù)據(jù)轉(zhuǎn)換n轉(zhuǎn)換目的: 習(xí)慣、專業(yè)考量、模

6、型限制n轉(zhuǎn)換類型:定量轉(zhuǎn)定性或分級(jí),定性轉(zhuǎn)定量n轉(zhuǎn)換常用原則:借鑒既往同類研究的分級(jí)方法;按照通用的分級(jí)標(biāo)準(zhǔn),如年齡可按國際通用的嬰兒、幼兒、青少年、青年、中年、老年的年齡切點(diǎn)來分級(jí);把研究人群分成每組人數(shù)均等的35組等。 2022-4-1013三、描述基線資料三、描述基線資料n基線資料就是有關(guān)研究對(duì)象代表性和混雜因素的信息資料。n基線資料描述的基本目的:一是交待研究對(duì)象的特征,提供其代表人群的信息,據(jù)此判斷結(jié)果的外推人群和外推性;二是評(píng)估暴露組和非暴露組之間混雜因素的可比性,檢查存在混雜的可能性。n描述基線資料時(shí),通常在總體描述基礎(chǔ)上,對(duì)暴露組和非暴露組還要分別進(jìn)行描述。 2022-4-10

7、14四、結(jié)局事件發(fā)生的頻率四、結(jié)局事件發(fā)生的頻率n一般要求用率表示,如發(fā)病率。發(fā)病率由三個(gè)因素決定:觀察時(shí)間、可能發(fā)病的總?cè)藬?shù)和實(shí)際發(fā)病人數(shù)。n一般情況下,發(fā)病率的分子是在一定時(shí)間內(nèi)發(fā)病的總?cè)藬?shù)。n分母則因研究設(shè)計(jì)不同而異。當(dāng)發(fā)病率較低,且每個(gè)人的觀察時(shí)間長短基本一致,可用研究開始時(shí)該組人數(shù)作分母計(jì)算發(fā)病率,叫做累積發(fā)病率(cumulative incidence)。當(dāng)結(jié)局事件發(fā)生率較高(如晚期癌癥治療試驗(yàn)中的死亡)或每個(gè)人的觀察時(shí)間相差較大時(shí),這時(shí)可用人時(shí)數(shù)(如人年數(shù),person-years)做分母計(jì)算發(fā)病率,稱作人時(shí)發(fā)病率(person-time incidence rate或發(fā)病密度(

8、incidence density), 2022-4-1015五、估計(jì)效應(yīng)值五、估計(jì)效應(yīng)值n效應(yīng)就是暴露或治療對(duì)結(jié)局作用或影響的大小,多用暴露組與非暴露組或治療組與對(duì)照組間發(fā)病率的差別來表達(dá)。2022-4-10162022-4-1017六、估計(jì)效應(yīng)可信區(qū)間六、估計(jì)效應(yīng)可信區(qū)間n由于隨機(jī)誤差,各效應(yīng)指標(biāo)的點(diǎn)估計(jì)不能代表效應(yīng)的真實(shí)值,可信區(qū)間(Confidence Interval,CI)可用來表達(dá)由隨機(jī)誤差引起的效應(yīng)估計(jì)值的不確定性。實(shí)踐中一般采用95%可信區(qū)間,可以將其理解為真實(shí)效應(yīng)值有95%的可能在這個(gè)區(qū)間之內(nèi)。若效應(yīng)指標(biāo)的點(diǎn)估計(jì)值為X,標(biāo)準(zhǔn)誤為SE,該效應(yīng)指標(biāo)的95可信區(qū)間:95CI X1

9、.96SE,其中,(X1.96SE)為其下限,(X1.96SE)為其上限。 2022-4-1018七、識(shí)別和控制混雜七、識(shí)別和控制混雜n混雜是由于同一個(gè)研究里暴露對(duì)某疾病的作用與其他病因的作用交織在一起導(dǎo)致暴露效應(yīng)估計(jì)上的誤差。n混雜必須同時(shí)具備三個(gè)條件:其一,是疾病確定的病因或危險(xiǎn)因素;其二,不是暴露和疾病間的中間因素;其三,可疑的混雜因素在暴露組和非暴露組的分布不均衡。如性別可能就是吸煙與肺癌關(guān)系中的一個(gè)混雜因素。2022-4-1019n混雜的控制就是控制混雜的第三個(gè)條件,辦法有:n設(shè)計(jì)階段有三種方法:限制、匹配和隨機(jī)分組;n數(shù)據(jù)分析階段也有三種方法:直接標(biāo)化法、分層分析和多元回歸分析。

10、2022-4-1020八、交互作用八、交互作用n交互作用不同于混雜?;祀s是粗效應(yīng)值估計(jì)時(shí)的一種偏倚,需要控制和消除;交互作用是效應(yīng)大小隨第三因素暴露強(qiáng)度或劑量變化而變化的現(xiàn)象。 n區(qū)別交互作用和混雜的方法是一致性檢驗(yàn)。如果層間差異無顯著性(P0.05),說明不存在交互作用,這時(shí)可按混雜處理,可以用一個(gè)加權(quán)平均效應(yīng)值來表達(dá),如果平均效應(yīng)值與粗效應(yīng)值一致,說明無混雜。 2022-4-1021交互作用模型及其相對(duì)性交互作用模型及其相對(duì)性 決策應(yīng)基于相加模型決策應(yīng)基于相加模型2022-4-1022九、識(shí)別和測量劑量反應(yīng)關(guān)系九、識(shí)別和測量劑量反應(yīng)關(guān)系n識(shí)別和測量劑量反應(yīng)關(guān)系的分析方法主要有分層分析和回歸

11、分析。 2022-4-1023第三節(jié)第三節(jié) 常規(guī)收集的常規(guī)收集的 流行病學(xué)數(shù)據(jù)的分析流行病學(xué)數(shù)據(jù)的分析常規(guī)數(shù)據(jù)分析的特殊性有三點(diǎn):常規(guī)數(shù)據(jù)分析的特殊性有三點(diǎn):n第一,對(duì)研究問題的設(shè)定和對(duì)分析結(jié)果真實(shí)性的評(píng)估;n第二,由于沒有預(yù)先設(shè)定研究問題,可研究的問題取決于資料內(nèi)容和性質(zhì);n第三,設(shè)計(jì)框架不清楚或不完善,存在多種偏倚,結(jié)果真實(shí)性較差或不確定。n本節(jié)將以醫(yī)院的病人資料為例,說明常規(guī)數(shù)據(jù)分析的目的、方法、步驟和注意事項(xiàng)。 2022-4-1024一、常規(guī)數(shù)據(jù)的特征一、常規(guī)數(shù)據(jù)的特征(一)數(shù)據(jù)的時(shí)間框架和分類(一)數(shù)據(jù)的時(shí)間框架和分類n時(shí)間框架指數(shù)據(jù)的時(shí)間特征,主要分為隨訪數(shù)據(jù)(隊(duì)列數(shù)據(jù))和非隨訪數(shù)

12、據(jù)(現(xiàn)況數(shù)據(jù))。n現(xiàn)況數(shù)據(jù)主要探索病人現(xiàn)況、服務(wù)狀況和診斷準(zhǔn)確性,偶爾用于初步探索病因、療效和不良反應(yīng)。隊(duì)列數(shù)據(jù)可用于大多隊(duì)列數(shù)據(jù)可用于大多數(shù)臨床問題的探索數(shù)臨床問題的探索。2022-4-1025(二)變量的特征和分類(二)變量的特征和分類n按照臨床特征可將常規(guī)數(shù)據(jù)中的變量分為治療措施、診斷結(jié)果、病因/危險(xiǎn)因素、預(yù)后因素、結(jié)局、服務(wù)相關(guān)因素(如藥價(jià)、醫(yī)療保險(xiǎn)等)。n變量決定可能的研究問題變量決定可能的研究問題。例如,數(shù)據(jù)中無治療信息,則無法研究療效和副作用;無診斷結(jié)果,則無從研究診斷準(zhǔn)確性。無結(jié)局信息,則不能研究療效、預(yù)后因素、危險(xiǎn)因素。2022-4-1026二、形成研究問題二、形成研究問題n

13、根據(jù)數(shù)據(jù)的變量特征,可以初步形成可研究問題的范圍。n欲進(jìn)行診斷準(zhǔn)確性研究,數(shù)據(jù)庫里必須有檢查結(jié)果和疾病診斷信息。n研究副作用,基線資料中必須有治療信息,隨訪資料中須有副作用的信息。n評(píng)估療效,基線資料中須有治療的信息,隨訪資料中須有結(jié)局信息。n研究危險(xiǎn)因素,基線資料中須有可疑病因的信息,隨訪資料中須有有關(guān)疾病的信息。n對(duì)研究者最大的挑戰(zhàn)不是如何進(jìn)行分析,而是如何形成研究問題? 2022-4-1027三、常規(guī)數(shù)據(jù)三、常規(guī)數(shù)據(jù)“研究設(shè)計(jì)研究設(shè)計(jì)”的缺陷的缺陷2022-4-1028n研究設(shè)計(jì)最重要的三個(gè)因素是時(shí)間、人群和變研究設(shè)計(jì)最重要的三個(gè)因素是時(shí)間、人群和變量。量。時(shí)間因素包括時(shí)點(diǎn)還是時(shí)間段,如

14、何定義起始時(shí)間、時(shí)間走向、變量間的時(shí)間關(guān)系;人群因素包括人群特征,選擇過程,及比較組的形成;變量因素包括測量指標(biāo)、何時(shí)測量、測量的準(zhǔn)確性。 n通過比較常規(guī)數(shù)據(jù)收集的“設(shè)計(jì)框架”和最佳研究設(shè)計(jì),可以發(fā)現(xiàn)常規(guī)數(shù)據(jù)的設(shè)計(jì)缺陷,判斷可能引起的偏倚。在時(shí)間、人群和變量特征在時(shí)間、人群和變量特征上與最佳設(shè)計(jì)的差異,就是常規(guī)數(shù)據(jù)的缺陷所上與最佳設(shè)計(jì)的差異,就是常規(guī)數(shù)據(jù)的缺陷所在,在,也是偏倚可能出現(xiàn)的地方。n主要缺陷是非隨機(jī)主要缺陷是非隨機(jī),失訪或變量缺失。失訪或變量缺失。 2022-4-1029四、估計(jì)相應(yīng)的指標(biāo)四、估計(jì)相應(yīng)的指標(biāo)n根據(jù)研究目的以及最佳研究設(shè)計(jì),就能夠確定需要估計(jì)的指標(biāo)。n現(xiàn)況研究中,只需

15、要估計(jì)有關(guān)變量的均數(shù)和百分?jǐn)?shù);n評(píng)估治療效果時(shí),主要估計(jì)治療對(duì)結(jié)局作用的大??;n評(píng)估診斷的準(zhǔn)確性,主要估計(jì)靈敏度和特異度;n研究副作用,主要估計(jì)治療對(duì)不良結(jié)局的作用大小值。2022-4-1030常規(guī)數(shù)據(jù)分析的具體步驟常規(guī)數(shù)據(jù)分析的具體步驟n分析數(shù)據(jù)的時(shí)間框架和變量的特征;n提出可探索的問題,確定最終研究的問題;n與最佳研究設(shè)計(jì)比較,檢查數(shù)據(jù)的“研究設(shè)計(jì)”缺陷;n估計(jì)必要的指標(biāo)及其可信區(qū)間與其它必要的分析;n分析數(shù)據(jù)中可能存在的其他偏倚,例如選擇偏倚、信息偏倚和混雜偏倚;n綜合設(shè)計(jì)缺陷、偏倚和結(jié)果,對(duì)研究問題做出結(jié)論。2022-4-1031五、評(píng)估數(shù)據(jù)中的偏倚五、評(píng)估數(shù)據(jù)中的偏倚分析常規(guī)數(shù)據(jù)時(shí),

16、針對(duì)偏倚需考慮以下問題:分析常規(guī)數(shù)據(jù)時(shí),針對(duì)偏倚需考慮以下問題:n設(shè)計(jì)框架中,是否具有病因(或治療)、結(jié)局和混雜因素的信息,結(jié)局的測量是否發(fā)生在病因或治療發(fā)生后的一段時(shí)間內(nèi);n是否存在選擇偏倚:數(shù)據(jù)代表性及失訪率等;n是否存在信息偏倚;n是否存在混雜偏倚:有關(guān)混雜因素的基線信息是否完整。 2022-4-1032(一)評(píng)估數(shù)據(jù)中的選擇偏倚(一)評(píng)估數(shù)據(jù)中的選擇偏倚n很多數(shù)據(jù)的代表性很差或總體不明。 n病人還經(jīng)過了檢驗(yàn)檢查的選擇。 n最嚴(yán)重的選擇偏倚是選擇性隨訪和失訪。大多數(shù)病人缺乏結(jié)局資料可能是我國醫(yī)院常規(guī)數(shù)據(jù)中最大的問題之一。 2022-4-1033(二)評(píng)估數(shù)據(jù)中的信息偏倚(二)評(píng)估數(shù)據(jù)中的

17、信息偏倚 n數(shù)據(jù)的準(zhǔn)確性和可靠性取決于醫(yī)療機(jī)構(gòu)水平的高低 ;n另一個(gè)常見問題是數(shù)據(jù)質(zhì)量不一致,原因包括同一個(gè)醫(yī)院不同時(shí)期使用的檢查儀器、試劑、方法和標(biāo)準(zhǔn)不同,檢驗(yàn)員的水平不同; n隨訪時(shí)間不足也可能造成測量誤差。 2022-4-1034(三)評(píng)估數(shù)據(jù)中的混雜偏倚(三)評(píng)估數(shù)據(jù)中的混雜偏倚n由于利用常規(guī)資料的研究多屬于探索性研究,并不確定哪些因素是混雜因素;n即使混雜因素已知,常規(guī)數(shù)據(jù)中常缺乏混雜因素的信息,導(dǎo)致無法控制混雜因素;n即使收集了混雜因素的數(shù)據(jù),可能信息質(zhì)量不好,致使混雜的控制不徹底。2022-4-1035六、常規(guī)資料的利用六、常規(guī)資料的利用n診斷方法準(zhǔn)確性的評(píng)估n急性病住院病人的轉(zhuǎn)

18、歸和預(yù)后n圍產(chǎn)期和新生兒問題的研究n急診問題的研究n罕見疾病的病因和轉(zhuǎn)歸研究n疾病危險(xiǎn)因素初探n藥物毒副作用的研究n某類病人特征的觀察n有關(guān)服務(wù)和用藥的研究。 2022-4-1036n由于常規(guī)數(shù)據(jù)的局限性,其分析目的主目的主要是發(fā)現(xiàn)新問題,提出新假設(shè),要是發(fā)現(xiàn)新問題,提出新假設(shè),很少用來驗(yàn)證和確定研究假設(shè),不適用于已得到廣泛研究的、存在高質(zhì)量證據(jù)的、基本定論的問題。 2022-4-1037提高使用效果的措施提高使用效果的措施n利用部分常規(guī)數(shù)據(jù),再依據(jù)研究問題收集少量新數(shù)據(jù),可以擴(kuò)展常規(guī)數(shù)據(jù)的研究用途,尤其在診斷準(zhǔn)確性研究、病因和副作用的病例對(duì)照研究、罕見病的轉(zhuǎn)歸和預(yù)后研究領(lǐng)域。n擴(kuò)大數(shù)據(jù)來源。例如,一個(gè)科室或醫(yī)院的病人可能代表性差、失訪率高;如果匯總一個(gè)大城市所有醫(yī)院的數(shù)據(jù),將會(huì)大大增加代表性,降低失訪率;電子病歷使跨醫(yī)院和地區(qū)臨床數(shù)據(jù)的合并成為可能。n同時(shí)利用多個(gè)不同性質(zhì)的常規(guī)數(shù)據(jù)。例如,死亡作為觀察結(jié)局時(shí),可以同時(shí)利用一個(gè)地區(qū)或全國的死亡登記資料。2022-4-1038n針對(duì)研究的問題,盡可能對(duì)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論