版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
《流行病學》第五版筆記精華-PAGE1–第二節(jié)
現況研究的設計與實施一、明確調查目的和類型:然后根據具體的研究目的來確定采用普查還是抽樣調查。二、確定研究對象:如果是普查,在設計時可以將研究對象規(guī)定為某個區(qū)域內的全部居民,或其中的一部分,如兒童,即≤14歲者。如果是抽樣調查,則首先要明確該抽樣研究的總體是什么,其次要確定采用何種抽樣方法及其抽取多大的樣本等。抽樣調查選擇研究對象的基本原則是保證每一個研究對象是以等同的機率從其總體中選出的,即研究樣本要有代表性。三、樣本含量和抽樣方法:(一)樣本含量決定現況研究的樣本大小的因素來自多個方面,但其主要是①預期的現患率(P),如現患率越靠近50%,樣本含量就越??;反之,則要大些。②對調查結果精確性的要求,即允許誤差(d)越大,所需樣本就越小。(二)抽樣方法抽樣分為非隨機抽樣和隨機抽樣。隨機抽樣方法有單純隨機抽樣、系統抽樣、分層抽樣和整群抽樣。1、單純隨機抽樣(simplerandomsampling):也稱簡單隨機抽樣。從總體N個對象中,利用抽簽或其他隨機方法(如隨機數字)抽取n個,構成一個樣本。它的重要原則是總體中每個對象被抽到的概率相等。2、系統抽樣(systemicsampling):又稱機械抽樣,是按照一定順序,機械地每隔若干單位抽取一個單位的抽樣方法。方法:設總體單位數為N,需要調查的樣本數為n,則抽樣比為n/N,抽樣間隔為K=N/n。將每K個單位為一組,然后用隨機方法確定每一組的單位號(1,2,3,···,K),最后每隔K個單位抽取一個作為研究對象。優(yōu)點:①事先不需要知道總體內的單位數。可以根據估計而確定抽樣間隔(K);②在人群現場易進行,如可按門牌號間隔K戶調查一戶;③樣本是從分布在總體內部的各部分的單元中抽取的,分布比較均勻,代表性較好。缺點:假如總體各單位的分布有周期性趨勢,而抽取的間隔恰好是其周期,則可能產生偏性。3、分層抽樣(stratifiedsampling):先將總體的單位按某種特征分為若干次級總體(層),然后再從每一層內進行單純隨機抽樣,組成一個樣本。優(yōu)點:可以提高總體指標估計值的精確度;所得到的結果準確性更高,組織管理更方便;除了能估計總體的參數值,還可以分別估計各個層內的情況。4、整群抽樣(clustersampling):將總體分成若干群組,抽取其中部分群組作為觀察單位組成樣本的抽樣方法。若被抽到的群組中的全部個體均作為調查對象,稱為單純整群抽樣(simpleclustersampling);若調查部分個體,稱為二階段抽樣(twostagessampling)。特點:①易于組織、實施方便,可以節(jié)省人力、物力;②如群間差異越小,抽取的群越多,則精密度越好;③抽樣誤差較大,故樣本量比其他方法要增加1/2。5、多級抽樣(multistagesampling):在大型流行病學調查中,常結合使用幾種抽樣方法。先從總體中抽取范圍較大的單元,稱為一級抽樣單位(如省),再從每個抽得的一級單元中抽取范圍較小的二級單元(縣),依次類推,最后抽取其中范圍更小的單元(如村)作為調查單位。優(yōu)點:可以充分利用各種抽樣方法的優(yōu)勢,克服各自的不足,并能節(jié)省人力、物力。缺點:在抽樣之前要掌握各級調查單位的人口資料及特點。四、確定收集資料的方法:方法一經確定,就不應變更。一般有兩種方法:一是通過測定或檢查的方法,如測定血壓是否正常等。另一是通過直接用調查表詢問研究對象,讓其回答或回憶暴露或疾病的情況。五、現況研究中常見的偏倚與質量控制(一)常見偏倚:調查或研究結果與真實情況不符稱之為偏倚。原因:①主觀選擇研究對象,具有隨意性。②任意變換抽樣方法。③調查對象不合作或因種種原因不能或不愿意參加調查從而降低了應答率,此種現象稱為無應答偏倚。若應答率低于10%就較難以以調查結果來估計整個研究對象的狀況。④所調查到的對象均為幸存者,無法調查死亡的人,不能全面反映實際情況此種現象又稱之為幸存者偏倚。由以上原因導致的偏倚主要是選擇偏倚,其最終導致研究樣本缺乏代表性而使研究結果不能外推。⑤詢問調查對象有關問題時,種種原因回答不準確從而引起偏倚(報告偏倚)或調查對象對過去的暴露史或疾病史等回憶不清,特別是健康的調查對象由于沒有疾病的經歷,而容易將過去的暴露等情況遺忘,而導致回憶偏倚。⑥調查員有意識地深入調查某些人的某些特征,而不重視或馬虎對待其他一些人的這些特征而導致的偏倚,為調查偏倚。⑦資料收集、病患等情況的測量中由于測量工具、檢驗方法不正確,化驗技術操作不規(guī)范等導致的系統誤差則會介入測量偏倚。(二)質量控制:1.嚴格遵照抽樣方法的要求,確保抽樣過程的隨機化原則的完全實施;2.提高研究對象的依從性和受檢率;3.正確選擇測量工具和檢測方法;4.組織好研究工作,調查員一定要經過培訓,統一標準和認識;5.做好資料的復查、復核等工作;6..選擇正確的統計分析方法,注意辨析混雜因素及其影響。
六、調查表與調查員(一)調查表編制方法:步驟:將根據研究目的確定的調查內容歸納為幾大項,再將大項分別分為若干個小項,然后將各小項變?yōu)榫唧w的問句。注意問題:1、調查表上問題的排列:將調查者易于接受的問題安排在前面,提高被調查者對調查的依從性或應答率。2、調查表上問句的措詞:要明確,易懂,盡量避免使用專業(yè)術語,不帶有導向性,題目也應貼近盲法的原則。如將“大腸癌病例對照調查表”改為“生活與健康調查表”。3、表式:根據要求回答的形式,分為“閉關式”和“開放式”的兩種。根據是否采用計算機來作資料處理分為編碼調查表和非編碼調查表?!伴]關式”調查表要求被調查者只能選定其中的一個答案。因此答案的范圍就相當于測量的尺度,而這個尺度應包含對這個問題可能出現的所有答案,并且各個備選答案應互斥?!伴_放式”調查表則適合于那些難以限定答案尺度的問題,如年齡、出生日期等等。4、應有核實被調查者回答問題的正確性項目。如詢問年齡,可以同時設置“您今年多大?”和“您是哪年哪月出生?”5、調查表內容中應有調查開始和結束時間等項目記錄,以核查調查員在調查時的認真程度。6、預試:進行預試驗(預調查)(pilotstudy),以確定調查表的可行性。(二)調查項目(變量)的規(guī)定:1、定義研究因素:對研究的任何一個因素或變量,都應有明確的定義。2、設定即要實際可行又要能提供較豐富的信息的測量尺度。測量尺度實際上是某一測量結果的可能范圍。分為:①二值尺度(又稱0-1變量),如某人是否“有病”或“無病”;某項檢測結果的“陽性”與“陰性”等。②列名尺度:無順序,可分類,類與類之間界線明確。如,血型的分類(A、B、O、AB型)指標等。③序列尺度:有順序,可分類,但界限不很清楚;如,每日吸煙支數(0支,<5支,<10支,<15支,<20支和≥20支)等變量指標。④區(qū)間尺度:有順序且為連續(xù)性。如身高、體重、血壓等變量指標屬于該類。(三)調查員:要有實事求是的科學態(tài)度,具有責任心,嚴格按照調查表上的問題提出詢問,態(tài)度要和藹,堅守中立的態(tài)度,不可有任何形式的暗示或導向性語句或示意,熟練掌握流行病學訪問調查的技巧等。七、現況研究的資料分析
現以Ferris和Anderson(1962)所進行的一個關于慢性呼吸道疾病與吸煙、空氣污染的現況研究資料為例。其中,有關吸煙和慢性呼吸道疾病的資料經整理如表3-2所示。表3-2吸煙與慢性呼吸道疾病的現狀調查結果
吸煙不吸煙合計現患病人14238180非病人12,00013,10025,100合計12,14213,13825,280根據表3-2,即可計算出吸煙組和不吸煙組的慢性呼吸道疾病的現患率,其分別為142/12,142=11.69‰和38/13,138=2.89‰;也可按患病和非患病組計算各自的暴露率,即慢性呼吸道疾病患者中吸煙的暴露率為142/180=78.89%;而非病人中吸煙的暴露率則僅為12,000/25,100=47.81%。除此描述外,尚須進行統計學的顯著性檢驗和必要時進行吸煙與慢性呼吸道疾病之間關系的危險度估計分析。(一)顯著性檢驗以表3-2為例:可用χ2檢驗,以分別說明患病組與非患病組的吸煙暴露率,和不同暴露狀態(tài)(吸煙、不吸煙)組的現患率有無顯著性差別。兩個率的顯著性檢驗方法如u檢驗、Poisson檢驗等也可根據不同適用條件選用。第三節(jié)生態(tài)學研究生態(tài)學研究(ecologicalstudy):是描述性研究的一種類型,它是在群體的水平上研究某種因素與疾病之間的關系,以群體為觀察和分析的單位,通過描述不同人群中某因素的暴露狀況與疾病的頻率,分析該暴露因素與疾病之間的關系。該研究在收集疾病和健康狀態(tài)以及某因素的資料時,不是以個體為觀察、分析的單位而是以群體為單位的(如國家、城市、學校等),這是其最基本特征。生態(tài)學研究提供的信息是不完全的,只是一種粗線條的描述性研究。研究的目的:1、提供病因線索,產生病因假設;2、評估人群干預措施的效果。生態(tài)學研究的方法(一)生態(tài)比較研究(ecologicalcomparisonstudy):是觀察不同人群或地區(qū)某種疾病的分布,然后根據疾病分布的差異,提出病因假設。這種研究不需要暴露情況的資料,也不需要復雜的資料分析方法。如描述胃癌在全國各地區(qū)的分布,得到沿海地區(qū)的胃癌死亡率較其他地區(qū)高,從而提出沿海地區(qū)環(huán)境中如飲食結構等可能是胃癌的危險因素之一。生態(tài)比較研究也可應用于評價社會設施、人群干預以及在政策、法令的實施等方面的效果。(二)生態(tài)趨勢研究(ecologicaltrendstudy):是連續(xù)觀察不同人群中某因素平均暴露水平的改變和(或)某種疾病的發(fā)病率、死亡率變化的關系,了解其變動趨勢;通過比較暴露水平變化前后疾病頻率的變化情況,來判斷某因素與某疾病的聯系。如某地在實施了大腸癌序貫篩檢等綜合防治措施后,10余年的大腸癌死亡率曲線有一個明顯的下降趨勢,此提示了這一綜合措施在降低大腸癌死亡率方面是有效的。生態(tài)學研究的優(yōu)點和局限性(一)優(yōu)點:1、應用常規(guī)資料或現成資料(如數據庫)來研究,因而節(jié)省時間、人力和物力。2、對病因未明疾病的病醫(yī)學研究可提供病因線索供深入研究,這是最顯著的優(yōu)點。3、個體的暴露劑量無法測量的唯一可供選擇的研究方法。如空氣污染與肺癌的關系。4、對于研究因素在一個人群中暴露變異范圍小。5、適合于對人群干預措施的評價。6、在疾病監(jiān)測工作中,可估計某種疾病發(fā)展的趨勢。(二)局限性:1、生態(tài)學謬誤(ecologicalfallacy)是生態(tài)學研究最主要的缺點,其是由于生態(tài)學研究是由各個不同情況的個體“集合”而成的群體(組)為觀察和分析的單位,以及存在的混雜因素等原因而造成的研究結果與真實情況不符。正因為這樣的原因,故在一般情況下生態(tài)學研究中生態(tài)學謬誤常難以避免。2、混雜因素往往難以控制3、人群(組)中某些變量,特別是有關社會人口學及環(huán)境方面的一些變量存在多重共線性問題而影響對暴露因素與疾病之間關系的正確分析。4、生態(tài)學研究難以確定兩變量之間的因果聯系。鑒于生態(tài)學研究的特點及其局限性,應用時應注意盡可能集中研究目的,不要設置研究問題太多;選擇研究人群時,應盡可能使組間可比,觀察分析的單位盡可能地多,每單位內人數盡可能少;資料分析時盡可能用生態(tài)學回歸分析(不只用相關分析),分析模型中盡可能多納入一些變量;在對研究結果進行推測時,應盡量與其他非生態(tài)學研究結果相比較,并結合對所研究問題的專業(yè)知識等等來綜合分析和判斷。第四章隊列研究第一節(jié)概述一、概念隊列研究(cohortstudy):是將一個范圍明確的人群按是否暴露于某可疑因素及其暴露程度分為不同的亞組,追蹤其各自的結局,比較不同亞組之間結局的差異,從而判定暴露因子與結局之間有無因果關聯及關聯大小的一種觀察性研究方法。這里觀察的結局主要是與暴露因子可能有關的結局。又稱前瞻性研究(prospectivestudy)、發(fā)生率研究(incidencestudy)、隨訪研究(follow-upstudy)及縱向研究(longitudinalstudy)。暴露(exposure):是指研究對象接觸過某種待研究的物質(如重金屬)、具備某種待研究的特征(如年齡、性別及遺傳等)或行為(如吸煙)。隊列:表示一個特定的研究人群組。根據特定條件的不同,一般有兩種情況:一是指特定時期內出生的一組人群,叫出生隊列(birthcohort);另一種是泛指具有某種共同暴露或特征的一組人群,一般即稱之為隊列或暴露隊列。根據人群進出隊列的時間不同,隊列又可分為兩種:一種叫固定隊列(fixedcohort),是指人群都在某一固定時間或一個短時期之內進入隊列,之后對他們進行隨訪觀察,直至觀察期終止,成員沒有無故退出,也不再加入新的成員,即在觀察期內保持隊列的相對固定。另一種叫動態(tài)人群(dynamicpopulation),是相對固定隊列而言的,即在某隊列確定之后,原有隊列成員可以不斷退出,新的觀察對象可以隨時加入。危險因素(riskfactor),又稱為危險因子,泛指能引起某特定結局(outcome)(如疾病)發(fā)生,或使其發(fā)生的概率增加的因子,包括個人行為、生活方式、環(huán)境和遺傳等多方面的因素。二、基本原理:在一個特定人群中選擇所需的研究對象,根據目前或過去某個時期是否暴露于某個待研究的危險因素,或其不同的暴露水平而將研究對象分成不同的組,如暴露組和非暴露組,高劑量暴露組和低劑量暴露組等,隨訪觀察一段時間,檢查并登記各組人群待研究的預期結局的發(fā)生情況(如疾病、死亡、或其他健康狀況),比較各組結局的發(fā)生率,從而評價和檢驗危險因素與結局的關系。在隊列研究中,所選研究對象必須是在開始時沒有出現研究結局,但有可能出現該結局(如疾病)的人群。暴露組與非暴露組必須有可比性,非暴露組應該是除了未暴露于某因素之外,其余各方面都盡可能與暴露組相同的一組人群。根據基本原理,可以分析出一些基本特點:1)屬于觀察法2)設立對照組3)由“因”及“果”4)能確證暴露與結局的因果聯系。三、研究目的1.檢驗病因假設:一次隊列研究可以只檢驗一種暴露與一種疾病之間的因果關聯,也可同時檢驗一種暴露與多種結果之間的關聯。2.評價預防效果:有些暴露有預防某結局發(fā)生的效應,即出現預防效果。如戒煙可減少吸煙者肺癌發(fā)生的危險等,這里的預防措施不是人為給予的,而是研究對象自發(fā)行為。這種現象被稱為“人群的自然實驗”。3.
研究疾病自然史:隊列研究可以觀察人群從暴露于某因素后,疾病逐漸發(fā)生、發(fā)展,直至結局的全過程,不但可了解個體疾病的全部自然史,而且可了解全部人群疾病的發(fā)展過程。四、研究類型隊列研究依據研究對象進入隊列時間及終止觀察的時間不同,分為:(一)前瞻性(prospective)隊列研究:研究對象的分組是根據研究開始時(現時)研究對象的暴露狀況而定的。此時,研究的結局還沒有出現,還需要前瞻觀察一段時間才能得到,稱為即時性(concurrent)或前瞻性隊列研究。優(yōu)點:資料的偏倚較小,結果可信;缺點:觀察的人群樣本大,觀察時間長、花費大,影響其可行性。(二)歷史性(historical)隊列研究:研究對象的分組是根據研究開始時研究者已掌握的有關研究對象在過去某個時點的暴露狀況的歷史材料作出的;研究開始時研究的結局已經出現,其資料可從歷史資料中獲得,不需要前瞻性觀察,稱為非即時性(non-concurrent)或歷史性隊列研究。優(yōu)點:省時、省力、出結果快。缺點:歷史資料內容上未必符合要求。(三)雙向性(ambispective)隊列研究:也稱混和型隊列研究,即在歷史性隊列研究之后,繼續(xù)前瞻性觀察一段時間,它將前瞻性隊列研究與歷史性隊列研究結合起來,兼有二類的優(yōu)點,一定程度上彌補了相互的不足。不同研究類型的選用原則:前瞻性隊列研究:①應有明確的檢驗假設,檢驗的因素必須找準;②所研究疾病的發(fā)病率或死亡率應較高,如不低于5‰;③應明確規(guī)定暴露因素,并且應有把握獲得觀察人群的暴露資料;④應明確規(guī)定結局變量,如發(fā)病或死亡,并且要有確定結局的簡便而可靠的手段;⑤應有把握獲得足夠的觀察人群,并將其清楚地分成暴露組與非暴露組;⑥大部分觀察人群應能被長期隨訪下去,并取得完整可靠的資料。應有足夠的人、財、物力支持該項工作。歷史性隊列研究:除考慮前述的①至⑤點外,還應考慮是否有足夠數量的完整可靠的在過去某段時間內有關研究對象的暴露和結局的歷史記錄或檔案材料。雙向性隊列研究:當基本具備進行歷史性隊列研究的條件下,如果從暴露到現在的觀察時間還不能滿足研究的要求,還需繼續(xù)前瞻性觀察一段時間時,則選用該研究。第二節(jié)設計與實施一、確定研究因素:常稱為暴露因素或暴露變量,通常是在描述性研究和病例對照研究的基礎上確定的。在研究中要考慮如何選擇、規(guī)定和測量暴露因素。暴露的測量應采用敏感、精確、簡單和可靠的方法。二、確定研究結局:結局變量(outcomevariable)也叫結果變量,簡稱為結局,指隨訪觀察中將出現的預期結果事件,即研究者希望追蹤觀察的事件,是觀察的自然終點,不是觀察期的終止。既可是終極的結果(如發(fā)病或死亡),也可是中間結局(如分子或血清的變化)。除研究結局,可同時收集多種可能與暴露有關的結局。
三、確定研究現場:除要求有足夠數量的符合條件的研究對象,還要求當地領導重視,群眾理解和支持。四、確定研究人群:包括暴露組和對照組:1.暴露人群的選擇:暴露人群即對待研究因素有暴露的人群。有四種選擇:(1)職業(yè)人群:研究某種可疑的職業(yè)暴露因素與疾病或健康的關系的選擇;另外,由于職業(yè)人群有關暴露與疾病的歷史記錄較為全面、真實,故常做歷史性隊列研究。(2)特殊暴露人群:研究某些罕見的特殊暴露的唯一選擇,如選擇原子彈爆炸的受害者,研究射線與白血病的關系。某些職業(yè)暴露的危險一旦認識到了,大都采取防護措施以減少暴露,所以不宜前瞻性隊列研究,常用歷史性隊列研究。(3)一般人群:即某行政區(qū)域或地理區(qū)域范圍內的全體人群:①著眼于一般人群及今后在一般人群中的防治;②所研究的因素和疾病都是一般人群中常見的,特別是在研究一般人群的生活習慣或環(huán)境因素時。(4)有組織的人群團體:一般人群的特殊形式,如醫(yī)學會會員,工會會員等。目的是利用他們的組織系統,便于有效地收集隨訪資料。職業(yè)和經歷往往相同,可增加其可比性。2、對照人群的選擇:基本要求是盡可能與暴露組的可比性,即對照人群除未暴露于所研究的因素外,其它各種影響因素或人群特征(年齡、性別、民族、職業(yè)、文化程度等)都應盡可能地與暴露組相同。(1)內對照:即先選擇一組研究人群,將其中暴露于所研究因素的對象作為暴露組,其余即為非暴露組;(2)特設對照,也稱外對照,選擇職業(yè)人群或特殊暴露人群作為暴露人群時,在該人群之外去找對照組;(3)總人口對照:利用整個地區(qū)的現成的發(fā)病或死亡統計資料,對照中可能包含有暴露人群;(4)多重對照:或叫多種對照,即用上述兩種或兩種以上的形式選擇的人群同時作對照。五、確定樣本大?。河绊憳颖竞康膸讉€因素1.一般人群(對照人群)中所研究疾病的發(fā)病率p0越接近0.5,樣本量越大;2.暴露組與對照組人群發(fā)病率之差(d=p1-p0)d值越大,樣本量越??;3.要求的顯著性水平,即檢驗假設時的第Ⅰ類錯誤(假陽性錯誤)α值。α值越小,樣本量越大。4.效力:效力(power)又稱把握度(1-β),β為檢驗假設時出現第Ⅱ類錯誤的概率,而1-β為檢驗假設時能夠避免假陰性的能力。若要求效力(1-β)越大,即β值越小,則所需樣本量越大。六、基線資料的收集:收集每個研究對象在研究開始時的基本情況,包括待研究的暴露因素的暴露狀況,疾病與健康狀況,年齡、性別、職業(yè)、婚姻等個人狀況,家庭環(huán)境、個人生活習慣及家族疾病史等。獲取方式:①查閱醫(yī)院、工廠、單位及個人健康保險的記錄或檔案;②訪問研究對象或其它能夠提供信息的人;③對研究對象進行體格檢查和實驗室檢查;④環(huán)境調查與檢測。七、隨訪:1、隨訪方法包括對研究對象的直接面對面訪問、電話訪問、自填問卷、定期體檢,環(huán)境與疾病的監(jiān)測等資料的收集等,應根據隨訪內容、隨訪對象、投入研究人力、物力等條件來考慮。在整個隨訪過程中,隨訪方法應保持不變。2、觀察終點(end-point)就是指研究對象出現了預期的結果,達到了這個觀察終點,就不再對該研究對象繼續(xù)隨訪。3、觀察的終止時間是指整個研究工作截止的時間,也即預期可以得到結果的時間。4、隨訪的間隔與次數將視研究結局的變化速度、研究的人力、物力等條件而定。一般慢性病的隨訪間隔期定為1~2年。5、隨訪者:隨訪調查員必須進行培訓。研究者可參加隨訪,但最好不親自參與。八、質量控制:1、調查員的選擇:調查員應有嚴謹作風和科學態(tài)度,品質誠實可靠。另外,調查員的年齡、性別、種族、社會經濟地位等與研究對象相匹配,有調查的專業(yè)知識。2、調查員培訓:嚴格的培訓,掌握統一的方法和技巧,并要進行考核。3、制定調查員手冊:編一本調查員手冊,內列全部操作程序,注意事項等。4、監(jiān)督:①另一名調查員抽樣重復調查;②數值檢查或邏輯檢錯;③定期觀察每個調查員工作;④對不同調查員所收集的變量分布進行比較;⑤對變量的時間趨勢進行分析;⑥在訪談時使用錄音機錄音等。資料的整理與分析一、基本整理模式:根據統計分析的要求,隊列研究的資料一般整理成下表的模式。病例非病例合計發(fā)病率暴露組aba+b=n1a/n1非暴露組cdc+d=n0c/n0合計a+c=m1b+d=m0a+b+c+d=t式中a/n1和c/n0分別為暴露組的發(fā)病率和非暴露組的發(fā)病率,是統計分析的關鍵指標。二、人時的計算:常用的人時單位是人年,常用有:1、以個人為單位計算暴露人年(精確法)如樣本不太大時,可用此法計算。2、近似法計算暴露人年:不知道每個隊列成員進入與退出的具體時間或樣本太大時用該法。即平均人數乘以觀察年數得到總人年數,平均人數一般取相鄰兩年的年初人口的平均數或年中人口數。3、壽命表法:觀察對象人數較多,難以用精確法計算暴露人年,但又要求有一定的精度時用此法。
三、率的計算(一)常用指標:1、累積發(fā)病率(cumulativeincidence):用觀察開始時的人口數作分母,以整個觀察期內的發(fā)病(或死亡)人數為分子,變化范圍為0~1,其流行病學意義有賴于對累積時間長度的說明。2、發(fā)病密度(incidencedensity):有各種失訪及每個對象被觀察的時間不一樣等使資料不整齊。此時需以觀察人時為分母計算發(fā)病率,用人時為單位計算出來的率帶有瞬時頻率性質稱為發(fā)病密度。最常用的人時單位是人年,以此求出人年發(fā)病(死亡)率。發(fā)病密度的量值變化范圍是從0到無窮大。3、標化比:當研究對象數目較少,結局事件的發(fā)生率比較低時,是以全人口發(fā)病(死亡)率做為標準,算出該觀察人群的理論發(fā)病(死亡)人數,即預期發(fā)病(死亡)人數,再求觀察人群中實際發(fā)病(死亡)人數與此預期發(fā)病人數之比,即得標化發(fā)病(死亡)比。最常用的指標為標化死亡比(standardizedmortalityratio,SMR),標化比實際上不是率,而是以全人口的發(fā)病(死亡)率做為對照組而計算出來的比。例如某廠30-40歲組工人有500名,某年內有2人死于肺癌,已知該年全人口30-40歲組肺癌的死亡率2‰,求其SMR。已知O=2,E=500×2‰=1SMR=2/1=2:即某廠30-40歲年齡組工人死于肺癌的危險達到相應一般人群的2倍。如果某單位的歷年人口資料不能得到,而僅有死亡人數、原因、日期和年齡,則可改算標化比例死亡比(standardizedproportionalmortalityratio,SPMR)。是以全人口中某病因死亡占全部死亡之比例乘以某單位實際全部死亡數而得出某病因的預期死亡數,然后計算實際死亡數與預期死亡數之比。例如某廠某年30-40歲年齡組工人死亡總數為100人,其中因肺癌死亡5人,全人口中該年30-40歲組肺癌死亡占全死因死亡的比例為2.2%,則SPMR=5/(100*2.2%)=2.27。即某廠30-40歲年齡組肺癌死亡的危險為一般人群的2.27倍。(二)顯著性檢驗:隊列研究為抽樣研究,發(fā)現兩組率有差別時,要考慮抽樣誤差的可能,進行統計學顯著性檢驗。1、U檢驗:當研究樣本量較大,p和1-p都不太小,如np和n(1-p)均大于5時,樣本率的頻數分布近似正態(tài)分布,此時可應用正態(tài)分布的原理來檢驗率的差異是否有顯著性,即用U檢驗法來檢驗暴露組與對照組之間率的差異。P1為暴露組的率,P0為對照組的率,n1為暴露組觀察人數,n0為對照組的觀察人數,Pc為合并樣本率,其中X1和X0分別為暴露組和對照組結局事件的發(fā)生數。求出u值后,查u界值表得P值,按所取的檢驗水準即可作出判斷。2.其他檢驗方法:如果率比較低,樣本較小時,可改用直接概率法、二項分布檢驗或泊松(Poisson)分布檢驗;率差的顯著性檢驗可以利用的四格表資料的卡方檢驗;對SMR或SPMR的檢驗,實際是所得結果值偏離1的檢驗,其檢驗方法可用X2檢驗或計分檢驗(scoretest)。
四、效應的估計:隊列研究的最大優(yōu)點就在于它可以直接計算出研究對象的結局的發(fā)生率,能直接計算出暴露組與對照組之間的率比和率差,即相對危險度RR(relativerisk)與歸因危險度AR(attributablerisk),從而可直接準確地評價暴露的效應。1、相對危險度(RR)也叫危險比(riskratio)或率比(rateratio),是反映暴露與發(fā)病(死亡)關聯強度的最有用的指標,式中Ie和Io分別代表暴露組和非暴露組的率。RR表明暴露組發(fā)病或死亡的危險是非暴露組的多少倍。RR值越大,表明暴露的效應越大,暴露與結局關聯的強度越大。RR算出的只是一個點估計值,是一個樣本值。若要估計數值的總體范圍,應考慮到抽樣誤差的存在,需計算其可信區(qū)間,通常用95%可信區(qū)間。常用的有Woolf法和Miettinen法。如Woolf法。lnRR的95%可信區(qū)間=其反自然對數即為RR的95%可信區(qū)間。2.
歸因危險度(AR)又叫特異危險度、率差(ratedifference,RD)和超額危險度(excessrisk),是暴露組發(fā)病率與對照組發(fā)病率相差的絕對值,它表示危險特異地歸因于暴露因素的程度。RR說明暴露者與非暴露者比較增加相應疾病危險的倍數;AR則一般是對人群而言,暴露人群與非暴露人群比較,所增加的疾病發(fā)生數量,如果暴露因素消除,就可減少這個數量的疾病發(fā)生。前者具有病因學的意義,后者更具有疾病預防和公共衛(wèi)生學上的意義。以表4-9,從RR看,吸煙對肺癌的作用較大,病因聯系較強;從AR看,吸煙對心血管疾病的作用較大,預防所取得的社會效果將更大。表4-9吸煙者與非吸煙者死于不同疾病的RR與AR疾病吸煙者非吸煙者RRAR(1/10萬人年)(1/10萬人年)(1/10萬人年)肺癌50.124.6910.745.43心血管疾病296.75170.321.7126.43
3.
歸因危險度百分比(AR%):又稱為病因分值EF(etiologicfraction),是指暴露人群中的發(fā)病或死亡歸因于暴露的部分占全部發(fā)病或死亡的百分比?;蛞员?-9為例計算肺癌的。說明吸煙者中發(fā)生的肺癌有90.6%歸因于吸煙。4、人群歸因危險度(populationattributablerisk,PAR)與人群歸因危險度百分比(PAR%)人群歸因危險度百分比也叫人群病因分值(populationetiologicfraction,PEF)。PAR是指總人群發(fā)病率中歸因于暴露的部分,而PAR%是指PAR占總人群全部發(fā)病(或死亡)的百分比。RR和AR都說明暴露的生物學效應,即暴露的致病作用有多大;而PAR和PAR%則說明暴露對一個具體人群的危害程度,以及消除這個因素后可能使發(fā)病率或死亡率減少的程度,它既與RR和AR有關,又與人群中暴露者的比例有關。PAR和PAR%的計算式如下:PAR=It-I0It代表全人群的率,I0為非暴露組的率。式中Pe表示人群中有某種暴露者的比例,從該式可看出PAR%與相對危險度及人群中暴露者的比例的關系。繼續(xù)以表4-9的數據資料為例,已知非吸煙者的肺癌年死亡率為0.0469‰(I0),全人群的肺癌年死亡率為0.2836‰(It),則:①PAR=It—I0=0.2836‰—0.0469‰=0.2367‰②從計算結果可知,雖然吸煙導致肺癌的AR%達90.6%,但因人群中只有部分人吸煙,故其PAR%僅為83.5%。5.劑量反應關系的分析:如果某種暴露存在劑量效應關系,即暴露的劑量越大,其效應越大,則該種暴露作為病因的可能性就增大。其分析方法是先列出不同暴露水平下的發(fā)病率,然后以最低暴露水平組為對照,計算各暴露水平的相對危險度和率差。必要時,應對率的變化作率的趨勢性檢驗。
偏倚及其防止
一、常見偏倚的種類:1、選擇偏倚(selectionbias):發(fā)生于研究對象中有人拒絕參加;歷史性隊列研究中有些人的檔案丟失或記錄不全;研究對象由較健康志愿者組成;早期病人研究開始時未發(fā)現、抽樣方法不正確、執(zhí)行不嚴格。2、失訪偏倚(losttofollow-up)在一個較長的追蹤觀察期內,總會有對象遷移、外出、死于非終點疾病或拒絕繼續(xù)參加觀察而退出隊列。失訪率最好不超過10%。3、信息偏倚(informationbias)在獲取暴露、結局或其他信息時所出現的系統誤差或偏差,又稱為錯分偏倚(misclassificationbias),如判斷有病為無病,判斷有無暴露等。由于儀器不精確、詢問技巧不佳、檢驗技術不熟練、醫(yī)生診斷水平不高或標準不明確、記錄錯誤甚至造假等造成。若發(fā)生于一組而不發(fā)生于另一組,或兩組錯分的程度不同,則結果可能比實際的相對危險度高或低。前者稱為非特異性錯分,將后者稱為特異性錯分。4、混雜偏倚(confoundingbias)混雜是指所研究因素與結果的聯系被其它外部因素所混淆,這個外部因素就叫混雜變量.它是疾病的一個危險因子,又與所研究的因素有聯系,它在暴露組與對照組的分布是不均衡的。性別、年齡是最常見的混雜因素。二、常見偏倚的預防:1、選擇偏倚的防止:預防為主的方針。首先要有一個正確的抽樣方法,即嚴格遵守隨機化的原則;嚴格按規(guī)定的標準選擇對象;對象一旦選定,堅持隨訪到底。2、失訪偏倚的防止:提高研究對象的依從性。失訪率達到20%以上,則研究的真實性值得懷疑。3、信息偏倚的防止:選擇精確穩(wěn)定的測量方法、調準儀器、嚴格實驗操作規(guī)程、同等地對待每個研究對象、提高臨床診斷技術、明確各項標準、嚴格按規(guī)定執(zhí)行、做好調查員培訓是重要措施。4、混雜偏倚的防止:對研究對象作某種限制以獲得同質的樣本;在對照選擇中采用匹配的辦法,在研究對象抽樣嚴格遵守隨機化的原則等措施。三、常見偏倚的估計與處理:1、選擇偏倚與失訪失倚:通過審查研究對象的選擇方法、調查研究對象的依從率、比較失訪及退出研究者與繼續(xù)研究者的基本特征等,可初步估計選擇偏倚與失訪失偏產生的可能性。2.信息偏倚:通過對一個隨機樣本進行重復的調查與檢測,將兩次檢測的結果進行比較,以估計信息偏倚的可能與大小。3、混雜偏倚:首先應根據混雜的判斷標準來判斷混雜存在的可能性,比較分層調整前后的兩個效應測量值的大小以估計混雜作用的大小?;祀s偏倚的處理可采用分層分析、標準化或多因素分析的方法。第五節(jié)研究的優(yōu)缺點一、優(yōu)點:1、由于研究對象暴露資料的收集在結局發(fā)生之前,并且都是由研究者親自觀察得到的,所以資料可靠,一般不存在回憶偏倚。2、可以直接獲得暴露組和對照組人群的發(fā)病或死亡率,可直接計算出RR和AR等反映疾病危險關聯的指標,可以充分而直接地分析暴露的病因作用。3、由于病因發(fā)生在前,疾病發(fā)生在后,因果現象發(fā)生的時間順序上合理,加之偏倚較少,又可直接計算各項測量疾病危險關聯的指標,故其檢驗病因假說的能力較強,一般可證實病因聯系。4、有助于了解人群疾病的自然史。有時還可能獲得多種預期以外的疾病的結局資料,分析一因與多種疾病的關系。5、樣本量大,結果比較穩(wěn)定。二、缺點:1、不適于發(fā)病率很低的疾病的病因研究,因為在這種情況下需要的研究對象數量太大,一般難以達到。2、由于隨訪時間較長,對象不易保持依從性,容易產生各種各樣的失訪偏倚。同時由于跨時太長,研究對象也容易從半途中了解到研究目的而改變他們的態(tài)度。3、研究耗費的人力、物力、財力和時間較多,其組織與后勤工作亦相當艱巨。4、由于消耗太大,故對研究設計的要求更嚴密,資料的收集和分析也增加了一定的難度,特別是暴露人年的計算較繁重。5、在隨訪過程中,未知變量引入人群,或人群中已知變量的變化等,都可使結局受到影響,使資料的收集和分析復雜化。 病例對照研究(case-controlstudy)一、基本原理:以現在確診的患有某特定疾病的病人作為病例,以不患有該病但具有可比性的個體作為對照,通過詢問,實驗室檢查或復查病史,搜集既往各種可能的危險因素的暴露史,測量并比較病例組與對照組中各因素的暴露比例,經統計學檢驗,若兩組差別有意義,則可認為因素與疾病之間存在著統計學上的關聯。在評估了各種偏倚對研究結果的影響之后,再借助病因推斷技術,推斷出某個或某些暴露因素是疾病的危險因素,而達到探索和檢驗疾病病因假說的目的。這是一種回顧性的,由結果探索病因的研究方法,是在疾病發(fā)生之后去追溯假定的病因因素的方法。最早的病例對照研究見于1843年Guy向倫敦統計學會所做的分析職業(yè)暴露和肺結核發(fā)生關系的報告。最早的病例對照研究的概念見于Louis的著作。符合現代病例對照研究概念的研究首推LaneClaypon報告的生殖因素與乳腺癌關系的研究。暴露(exposure)是指研究對象曾經接觸過某些因素,或具備某些特征,或處于某種狀態(tài)。這些因素、特征或狀態(tài)即為暴露因素。暴露因素也叫研究變量(variable)。二、病例對照研究的類型1、病例與對照不匹配:在設計所規(guī)定的病例和對照人群中,分別抽取一定量的研究對象,一般對照數目應等于或多于病例人數。此外沒有其它任何限制與規(guī)定。2、病例與對照匹配:匹配或稱配比(matching)即要求對照在某些因素或特征上與病例保持一致。匹配分為:A:頻數匹配(frequencymatching)。匹配的因素所占的比例,在對照組與在病例組一致。如病例組中男女各半,則對照組中也如此。B:個體匹配(individualmatching):指以病例和對照的個體為單位進行匹配。1﹕1匹配又稱配對(pairmatching),1﹕2、1﹕3、……1﹕R匹配時,稱為匹配。配比的目的,首先在于提高研究效率。其次在于控制混雜因素。所以匹配的特征或變量必須是已知的混雜因子,或有充分的理由懷疑為混雜因子。把不必要的項目列入匹配,企圖使病例與對照盡量一致,就可能徒然丟失信息,增加工作難度,結果反而降低了研究效率。這種情況稱為配比過度(over-matching)。匹配的變量應當一致到什么程度,取決于變量的性質、實際可能與必要性。如果匹配的因素與暴露有聯系,則會低估暴露與疾病的聯系。匹配和匹配后按匹配因素進行分層分析,是控制匹配因素的混雜作用的必要途徑。病例對照研究的衍生類型:1、巢式病例對照研究:在對一個事先確定好的隊列進行隨訪觀察的基礎上,再應用病例對照研究(主要是匹配病例對照研究)的設計思路進行研究分析。(1)方法:①
確定某一人群作為研究隊列;②
收集隊列內每個成員的相關信息和生物標本;③
隨訪一段預定的時間;④
確定隨訪期內發(fā)生的所研究疾病的全部病例組成;⑤
用危險集抽樣為每個病例抽取一定數量的對照組成對照組;⑥
抽取已收集好的兩組成員的相關信息和生物標本做必要的化驗;⑦做統計分析計算率和OR;⑧獲得研究結果并做出結論。(2)類型:前瞻性和回顧性兩類。①前瞻性巢式病例對照研究(prospectivenestedcase-controlstudy):在研究開始時根據一定的條件選擇某一人群作為隊列,然后前瞻性地隨訪一定的時間確定病例組和對照組,在時間特點為從現在到將來。②回顧性巢式病例對照研究(retrospectivenestedcase-controlstudy):根據研究開始之前的一段特定時間的情況選擇某一人群作為研究隊列,根據現在的情況確定病例組和對照組,時間上特點為從過去到現在。2.病例-隊列研究(case-cohortstudy):又稱病例參比式研究(case-basereferencestudy),(1)基本原理:隊列研究開始時,在隊列中按一定比例隨機抽樣選出一個有代表性的樣本作為對照組,觀察結束時,隊列中出現的所研究疾病的全部病例作為病例組,與上述隨機對照組進行比較。與巢式病例對照研究的不同之處在于:①對照是隨機選取,不與病例進行配比。②隨機對照組中的成員如發(fā)生被研究的疾病,既作為對照,又同時作為病例。③可以同時研究幾種疾病,不同的疾病有不同的病例組,但對照組都是同一組隨機樣本。3、單純病例研究:(caseonlystudy)為Piegorseh于1994年首先提出,也稱病例病例研究,或病例系列研究(caseseriesstudy)。4、病例交叉研究:1991年美國Maclure提出的,基本思想就是比較相同研究對象在急性事件發(fā)生前一段時間的暴露情況與未發(fā)生事件的某段時間內的暴露情況。如果暴露與少見的事件(或疾病)有關,那么剛好在事件發(fā)生前一段時間內的暴露頻率應該高于更早時間內的暴露頻率。例如,據報道某種藥物可以引發(fā)猝死,如果該報道正確,則應該可以觀察到服用此藥物后一段時間內猝死增多,或者說在猝死前幾天或幾周內應有服藥增多的報道。5.病例-時間-對照設計:1995年Suissa提出的?;舅枷耄翰捎脗鹘y病例對照研究時,疾病嚴重程度造成的混雜往往不能完全控制。這是因為一般情況下,疾病的嚴重程度沒有精確的測量方法,無法肯定疾病嚴重程度在病例和對照兩組間分布一致。三、病例對照研究的實施:一般步驟:1.提出假設2.制定研究計劃3.收集資料4.對收集到的資料進行整理與分析;5.總結并提出研究報告。具體實施如下:(一)提出假設:根據所了解的疾病分布特點和已知的相關因素,廣泛查閱文獻基礎上,提出病因假設。(二)明確研究目的,選擇適宜的對照形式。1、如果為廣泛地探索疾病的危險因子,可以采用不匹配或頻數匹配。2、根據提供研究用的病例的數量。若研究的是罕見病,或能得到的符合規(guī)定的病例數很少時,選擇個體匹配方法。3、能否以較小的樣本獲得較高的檢驗效率。如1﹕R(或1﹕M)的匹配方法,R值不宜超過4。(三)病例與對照的基本來源。有兩個,1、醫(yī)院的現患病人、醫(yī)院、門診的病案,及出院記錄,稱為以醫(yī)院為基礎的;2、社區(qū)、社區(qū)的監(jiān)測資料或普查、抽查的人群資料,稱為以社區(qū)為基礎的。1.病例的選擇(1)疾病有明確統一、寬嚴適度的診斷標準。(2)對病例其它特征的規(guī)定:如性別、年齡、民族等??刂品茄芯恳蛩卦鰪娍杀刃?。在選擇病例時有新發(fā)病例、現患病例與死亡病例三種。(3)保證使病例達到有關規(guī)定的標準:如要求通過某一級醫(yī)院或實驗室的診斷,或病人必須經過某項檢查等。2.對照的選擇:對照來源主要有:(1)同一或多個醫(yī)療機構中診斷的其他病例;(2)病例的鄰居或所在同一居委會的健康人或非該病病人;(3)社會團體人群中的非該病病例或健康人;(4)社區(qū)人口中的非病例或健康人群;(5)病例的配偶、親戚、同事等。對照應當來自于產生病例的人群,能代表產生病例的人群。在醫(yī)院為基礎的病例對照研究中,常常不能識別源人群。此時,總人群的隨機樣本不一定與源人群的隨機樣本一致。當使用醫(yī)院病例時,改進對照系列的一個方法是將對照限制為那些與暴露沒有聯系跡象的病人。選擇對照時必須考慮對照的代表性,對照與病例的可比性,以及可能出現的選擇偏倚等。對照的選擇應遵循四個目的:①排除選擇偏倚;②縮小信息偏倚;③縮小不清楚或不能很好測量的變量引起的殘余混雜(準確測量的混雜因素在分析階段可以控制);④符合真實性要求和邏輯限制的前提下使統計學把握度達到最大。(四)樣本含量的估計:⒈影響樣本大小的因素:(1)研究因素在對照組中的暴露率P0;(2)預期的該因素引起的相對危險度RR或暴露的比值比OR;(3)希望達到的檢驗顯著性水平,即假設檢驗第I類錯誤的概率α;(4)希望達到的檢驗把握度(1-β),β為統計學假設檢驗第Ⅱ類錯誤的概率。⒉估計方法需注意:A、所估計的樣本含量并非絕對精確的數值,因為樣本含量的估計是有條件的,而這些條件并非是一成不變的。B、應當糾正樣本量越大越好的錯誤看法。樣本量過大,常會影響調查工作的質量,增加負擔、費用。C、病例組和對照組樣本含量相等時效率最高。(五)獲取研究因素的信息:1.變量的選定:取決于研究的目的或具體的目標。與目的有關的變量不但絕不可少(如吸煙與肺癌關系的研究中,有關調查對象吸煙或不吸煙的信息),而且應當盡量細致和深入(如還應調查吸煙持續(xù)的時間、每日吸煙量、煙的種類等)以獲得較多的信息。2.變量的規(guī)定:每項變量都盡可能地采取國際或國內統一的標準。3.變量的測量:定性的指標可通過詢問而獲得是與否,經常、偶爾等信息。通過詢問、儀器或實驗室檢查可獲得定量的資料。(六)資料的收集:主要靠詢問調查對象填寫問卷收集信息資料。有時需輔以查閱檔案,采樣化驗,實地查看或從有關方面咨詢獲得。無論什么方法,都應實行質量控制。五、實施病例對照研究應注意的問題:1、主要假設的說明、研究目的是否清楚、簡明而且可以檢驗?2、疾病與暴露變量的定義是否清楚明確?3、病例與對照的來源,病例的診斷方法,病例與對照的診斷程序是否一致?是新發(fā)病例還是現患病例?病例和對照的排除標準?4、抽樣的技術方法與樣本大小的估計明確否?病例與對照是否匹配及匹配變量是哪些?5、調查表是否完全?是否足夠詳盡?是否能夠收集到需要的數據?6、調查表經過試用否?其真實性與可靠性是否經過評估?7、調查員、質控員、編碼員等的工作手冊是否編好?是否需專門培訓?8、組織機構、人員、設備、經費是否已落實?方法試劑是否符合標準?結果的真實性與可靠性是否經過考核?9、資料數據的整理、統計處理方法及分析內容明確否?如何控制或調整混雜及其他偏倚?結論的真實性如何?六、數據資料的整理與分析:(一)資料的整理:1.原始資料的核查修正、驗收、歸檔2.原始資料的分組、歸納,或編碼輸入計算機。(二)數據的分析1.描述性統計(1)描述研究對象的一般特征:描述研究對象人數及各種特征的構成,例如性別、年齡、職業(yè)分布等。(2)均衡性檢驗:為檢驗病例組與對照組的可比性,比較病例組和對照組某些基本特征是否相似。2.統計性推斷病例對照研究中表示疾病與暴露之間聯系強度的指標為比值比(oddsratio,又譯比數比、優(yōu)勢比、交叉乘積比,簡寫OR)。所謂比值(odds)是指某事物發(fā)生的可能性與不發(fā)生的可能性之比。在病例對照研究中病例組的暴露比值為:對照組的暴露比值為:概率的分母中包括未發(fā)生事件數,而比值的分母中不包括未發(fā)生事件數。因此比值取值在0~∞之間,而概率取值在0~1之間。相對危險度(relativerisk)的本質為率比(rateratio)或危險比(riskratio),即暴露組與非暴露組發(fā)病率之比,或發(fā)病的概率之比。但是病例對照研究不能計算發(fā)病率,所以病例對照研究中只能計算OR。OR的含義與相對危險度相同,指暴露組的疾病危險性為非暴露組的多少倍。OR>1說明疾病的危險度因暴露而增加,暴露與疾病之間為“正”關聯;OR<1說明疾病的危險度因暴露而減少,暴露與疾病之間為“負”關聯。但是,在不同患病率和不同發(fā)病率的情況下,OR與RR是有差別的。疾病率小于5%時,OR是RR的極好近似值。無論以暴露比值和非暴露比值計算,或是以有病比值和無病比值計算,比值比的結果都是一樣的,OR恒等于ad/bc。(1)不匹配不分層的資料分析這是病例對照研究資料分析的基本形式。1)
每個暴露因素可整理成表5-5的四格表形式表5-5病例對照研究資料整理表暴露或特征疾病合計病例對照有aba+b=n1無cdc+d=n0合計a+c=m1b+d=m0a+b+c+d=t例如一項關于口服避孕藥與心肌梗塞的病例對照研究,結果如表5-6:表5-6口服避孕藥(OC)與心肌梗塞(MI)關系的病例對照研究結果
病例對照合計服OC未服OC391142415463268合計1531783312)利用χ2(卡方)檢驗,檢驗病例組與對照組兩組的暴露率有無統計學的顯著差異。χ2=(ad-bc)2n/(a+b)(c+d)(a+c)(b+d)=7.70χ20.01(1)=6.63,本例χ2=7.70>6.63,則p<0.01結論為不能拒絕無效假設,即兩組暴露率有統計學很顯著差異。3)計算暴露與疾病的聯系強度OR。OR=ad/bc=2.204)
Woolf氏logit近似法:如Z>1.96,p<0.05;Z>2.58,p<0.01;Z>3.08,p<0.001。本例,Z=0.7885/0.2874=2.74>2.58,p<0.01。理論上該檢驗應當與χ2檢驗的結論(即是否有統計學的顯著意義)一致。5)OR的可信區(qū)間(confidenceinterval,C.I.)前面計算的OR值是關聯程度的一個點估計值,即用一次研究(樣本人群)所計算出來的一次OR值??紤]到抽樣誤差,可按一定的概率(稱為可信度)來估計總體OR的范圍,即OR的可信區(qū)間,其上下限的值為可信限。Woolf自然對數轉換法是建立在OR方差的基礎上。OR自然對數的方差為:Var(lnOR)=1/a+1/b+1/c+1/d=0.0826。求上述值反自然對數exp(1.3218,0.2252)=3.75,1.25即OR95%C.I.=1.25~3.75(2)不匹配分層資料分析分層分析是把人群根據某特征分為不同層次(流行病學統計學的術語稱為“層”),如按性別可分為男女,按年齡可分為20-39歲40-59歲及60歲及以上等,然后分別分析各層中暴露與疾病的關聯。借以分層的因素是可能的混雜因素,通過分層可以調整這些因素的干擾。1)
分層資料的整理表5-7病例對照研究分層資料整理表暴露特征i層的發(fā)病情況合計病例對照有無aicibidin1in0i合計m1im0iti以表5-4的數據為例,考慮到年齡與口服避孕藥有關,也與MI有關,可能是個混雜因素。故可按年齡分層,分為<40歲和≥40歲兩層,如下表按年齡分層的結果<40歲≥40歲
服OC未服OC合計服OC未服OC合計病例對照21(a1)17(c1)26(b1)59(d1)47(m11)76(m01)18(a2)7(c2)88(b2)95(d2)106(m12)102(m02)合計38(n11)85(n01)123(n1)25(n12)183(n02)208(n2)OR1=2.80OR2=2.782)
計算各層的OROR1=(26×76)/(59×47)=2.80OR2=(18×95)/(7×88)=2.78兩層的ORi均較不分層時OR大。進一步分析在非暴露組年齡與MI的關聯,見表年齡與MI的關聯
<40歲≥40歲MI對照26598895OR=0.48,χ2=7.27,說明年齡與MI有聯系(小年齡有保護)。再分析對照組中年齡與口服避孕藥的關聯,見表年齡與OC的關聯
<40歲≥40歲OC對照1759795OR=3.91,χ2=8.89,說明年齡與口服避孕藥也有聯系。年齡也不是OC與MI聯系的中間環(huán)節(jié),故可以認為年齡是研究OC與MI關系時的混雜因素。這種情況下可以用分層分析方法控制年齡的混雜作用。3)
計算總的OR值用Mantel-Haenszel提出的公式:ORMH=∑(aidi/ti)/∑(bici/ti)4)
計算總的卡方值亦用Mantel-Haenszel提出的公式:=[∑ai-∑E(ai)]2/∑V(ai)(3)分級暴露資料的分析:如能獲得某暴露不同暴露水平的資料,可用來分析疾病和暴露的劑量反應關系,以增加因果關系推斷的依據。1)
將資料整理歸納成列聯表為整理方便,該整理表中的a0與b0分別相當于前面四格表中的c與d。表5-11病例對照研究分級資料整理表暴露分級
01234……合計病例對照a0(=c)b0(=d)a1b1a2b2a3b3a4b4…………m1m0合計n0n1n2n3n4……t2)做χ2(卡方)檢驗1956年Doll和Hill發(fā)表的男性吸煙與肺癌關系的研究數據見表5-12。表5-12男性每日吸煙的支數與肺癌的關系每日吸煙支數
01-5-15-合計病例對照合計2(c)27(d)33(a1)55(b1)250(a2)293(b2)364(a3)274(b3)649(m1)649(m0)29(n0)88(n1)543(n2)638(n3)1298(t)OR1.08.1011.5217.93χ2=43.15,自由度ν=3,p<0.0013)計算各分級的OR值通常以不暴露或最低水平的暴露為參照。本例以不吸煙為參照,其余各級OR值分別為8.10,11.52和17.93,隨著吸煙量的增加而遞增,呈現明顯的劑量反應關系(還可用Χ2趨勢檢驗來檢驗是否確實存在劑量反應關系)。(4)匹配資料的分析成組資料的分析同非匹配資料。本節(jié)主要介紹1∶1配對資料的分析。1)
將資料整理成四格表表5-131∶1配對病例對照研究資料整理表對照病例對子數有暴露史無暴露史有暴露史無暴露史對子數acbda+bc+dA+cb+dt以1976年Mack等報告的在洛杉磯所做的外源性雌激素與子宮內膜癌關系的病例對照研究為例。表5-14外源性雌激素與子宮內膜癌配比資料對照病例對子數有暴露史無暴露史有暴露史無暴露史對子數27(a)29(c)3(b)4(d)30(a+b)33(c+d)56(a+c)7(b+d)63(t)(Mack,1975)2)
Χ2(卡方)檢驗用McNemar公式計算Χ2=(b-c)2/(b+c)(5.13)此公式適用于較大樣本,對子數較少時用McNemar校正公式:Χ2=(│b-c│-1)2/(b+c)(5.14)本例Χ2=(│b-c│-1)2/(b+c)=19.53,p<0.0053)
計算OROR=c/b(t≠0)(5.15)本例OR=c/b=9.674)
計算OR的95%可信區(qū)間仍用Miettinen公式。5)
ORU,ORL==(2.31,40.41)即OR的95%可信區(qū)間的下限為2.31,上限為40.01。(5)歸因分值歸因分值(attributablefraction,AF)也叫病因分值(etiologicfraction,EF)、歸因危險百分比[attributableriskproportion(或percent),ARP]。暴露人群的歸因分值記為AFe,AFe=(Ie-Iu)/Ie=(OR-1)/OR(5.16)式中Ie為暴露組發(fā)病率,Iu為非暴露組發(fā)病率。在病例對照研究中一般不能獲得發(fā)病率,只能獲得OR。AFe指暴露人群內某種疾病的發(fā)病中,由該暴露引起的發(fā)病占全部發(fā)病的比例。也即假如消除該暴露,暴露組發(fā)病降低的比例。人群歸因分值記為AFP,AFP=(Ip-Iu)/Ip=Pe(OR-1)/1+Pe(OR-1)(5.17)式中Ip為總人群發(fā)病率,Iu非暴露組發(fā)病率Pe為人群的暴露率(或以對照組的暴露代替)。AFP反映暴露對人群發(fā)病的影響,表示該暴露引起的發(fā)病占全部發(fā)病的比例。也即假如消除該暴露后發(fā)病降低的比例。歸因分值是具有公共衛(wèi)生意義的指標,它同時還代表人群中隨機抽取一個病例可能因該暴露引起的概率。(三)病例對照研究的功效研究功效(power)也叫做把握度,可以解釋為拒絕無效假設的能力,即當無效假設不成立時,該假設被拒絕的概率。以1∶1匹配病例對照研究資料的功效估計為例。例:假定人群中暴露于所研究的危險因素的比例P0=0.30,統計學雙側檢驗的顯著性水平α=0.05,病例與對照各50例。計算該研究有多大的功效發(fā)現RR=2。首先計算Z值
(式13.19)功效=1-β=P(Z≤Zβ)(P為概率),計算出Zβ之后,根據標準正態(tài)分布查出小于Zβ時的概率,P1與計算樣本量時相同。本例:n=50,P0=0.30,α=0.05(雙側檢驗),Zα=1.96,RR=2
=(P0+P1)/2=(0.3+0.4615)/2=0.3808查正態(tài)分布表,當=-0.30時,β=0.62,功效=P=1-β=38%結論:如果該研究選用50個病例和50個對照,在給定的條件下,該研究能檢出OR顯著地不等于1的概率為38%,如果OR確實≤2,則該研究成功的希望不大。一般認為一項研究的檢驗效率應在75%以上。七、病例對照研究中的偏倚及其防止(一)選擇偏倚(selectionbias):由于選入的研究對象與未選入的研究對象在某些特征上存在差異而引起的誤差。常發(fā)生于設計階段。⒈入院率偏倚(admissionratebias)也叫Berkson偏倚。當利用醫(yī)院病人作為病例和對照時,由于對照是醫(yī)院的某一部分病人,而不是全體目標人群的一個隨機樣本,又由于病例只是該醫(yī)院或某些醫(yī)院的特定病例,因為病人對醫(yī)院及醫(yī)院對病人雙方都有選擇性,所以作為病例組的病例也不是全體病人的隨機樣本,所以難免產生偏倚,特別是因為各種疾病的入院率不同導致病例組與對照組某些特征上的系統差異。盡量采用隨機選擇研究對象,在多個醫(yī)院選擇對象等方法以減少偏倚程度。2、現患病例-新發(fā)病例偏倚(prevalence-incidencebias)又稱奈曼偏倚(Neymanbias)。調查對象選自現患病例,可能得到很多信息可能只與存活有關,而未必與該病發(fā)病有關,從而高估某些暴露因素病因作用。另一種情況,某病的幸存者改變了生活習慣,從而降低了某個危險因素的水平,明確規(guī)定納入標準為新發(fā)病例,或有可能做隊列研究,同時將暴露程度、暴露時間和暴露結局聯系起來做結論可減少偏倚程度。3、出征侯偏倚(detectionsignalbias)也稱暴露偏倚(unmaskingbias)。病人常因某些與致病無關的癥狀而就醫(yī),從而提高了早期病例的檢出率,致使過高地估計了暴露程度,而產生的系統誤差。如果延長收集病例的時間,使其超過由早期向中、晚期發(fā)生的時間,則檢出病例中暴露者的比例會趨于正常。⒋時間效應偏倚(timeeffectbias)慢性疾病,從開始暴露于危險因素到出現病變往往經歷一個較長的時間過程。那些暴露后即將發(fā)生病變的人,已發(fā)生早期病變而不能檢出的人,或在調查中已有病變但因缺乏早期檢測手段而被錯誤地認為是非病例的人,都可能被選入對照組,由此產生的誤差。在調查中盡量采用敏感的疾病早期檢查技術,開展觀察期充分長的縱向調查。(二)信息偏倚(informationbias):又稱觀察偏倚(observationbias)或測量偏倚(measurementbias),是在收集整理信息過程中由于測量暴露與結局的方法有缺陷造成的系統誤差。⒈回憶偏倚(recallbias)由于被調查者記憶失真或不完整造成結論的系統誤差。選擇不易為人們所忘記的重要指標做調查,并重視問卷的提問方式和調查技術,將有助于減少回憶偏倚。⒉調查偏倚(investigationbias):可能來自于調查對象及調查者雙方。病例與對照的調查環(huán)境與條件不同,或者調查技術、調查質量不高或差錯以及儀器設備的問題等均可產生調查偏倚。采用客觀指征、合適的人選參加調查、調查技術培訓、復查等方法做好質量控制,檢查條件盡量一致、檢查儀器應精良、嚴格掌握試劑的要求等均可望減少偏倚。(三)混雜偏倚(confoundingbias):當研究某個因素與某種疾病的關聯時,由于某個既與疾病有制約關系,又與所研究的暴露因素有聯系的外來因素的影響,掩蓋或夸大了所研究的暴露因素與疾病的聯系。這種現象或影響叫混雜(confounding)或混雜偏倚(confoundingbias),該外來因素叫混雜因素(confoundingfactor)。防止辦法:在設計時利用限制的方法,配比的方法;資料分析階段采用分層分析或多因素分析模型處理。
八、病例對照研究方法的優(yōu)點與局限性(一)優(yōu)點:⒈特別適用于罕見病的研究,有時往往是罕見病病因研究的唯一選擇,因為病例對照研究不需要太多的研究對象,此時隊列研究常常不實際。2.雖有更多的機會發(fā)生偏倚和錯誤的推論,但是相對更省力、省錢、省時間,并且較易于組織實施。3.該方法不僅應用于病因的探討,而且廣泛應用于許多方面,例如疫苗免疫學效果的考核及爆發(fā)調查等。4、可以同時研究多個因素與疾病的聯系,適宜于探索性病因研究。(二)局限性:⒈不適于研究人群中暴露比例很低的因素,因為需要很大的樣本量。⒉選擇研究對象時,難以避免選擇偏倚。⒊暴露與疾病的時間先后常難以判斷。⒋獲取既往信息時,難以避免回憶偏倚。實驗流行病學研究第一節(jié)概述1、實驗流行病學(experimentalepidemiology)又稱干預研究(interventionstudy)、流行病學實驗(epidemiologicalexperiment)研究,是指將來自同一總體的研究人群隨機分為實驗組和對照組,研究者對實驗組人群施加某種干預措施后,隨訪并比較兩組人群的發(fā)病(死亡)情況或健康狀況有無差別及差別大小,從而判斷干預措施效果的一種前瞻性、實驗性研究方法。2、實驗流行病學研究的基本原則:(一)對照的原則:要求兩組研究對象必須具有可比性,即除了是否給予不同干預措施外,其它的基本特征如性別、年齡、居住環(huán)境等應盡可能一致。(二)隨機的原則:參加實驗研究的對象必須隨機地分配到實驗組或對照組,提高兩組的可比性或均衡性。(三)盲法的原則:由于受研究對象和研究者主觀因素的影響,在設計、資料收集或分析階段容易出現信息偏倚,為避免可采用盲法3、實驗流行病學研究的分類:(一)按研究場所劃分:1.現場試驗(fieldtrial):亦稱社區(qū)隨機對照試驗是在社區(qū)(一定區(qū)域內的人群)或現場環(huán)境下進行的實驗。以尚未患所研究疾病的人群作為研究對象。根據接受干預的基本單位不同,可分為:(1)個體試驗(individualtrial)接受處理或某種預防措施的基本單位是未患所研究疾病的個人。常用于在健康人群中推行預防接種、藥物預防等措施的效果評價。(2)社區(qū)試驗(communitytrial)又稱為社區(qū)干預項目(communityinterventionprogramCIP)、生活方式干預試驗(lifestyleinterventiontrial)、以社區(qū)為基礎的公共衛(wèi)生試驗(community-basedpublichealthtrial)等,是以尚未患所研究疾病的人群作為整體進行試驗觀察,常用于對某種預防措施或方法進行考核或評價。2.臨床試驗(clinicaltrial):是在醫(yī)院或其他醫(yī)療照顧環(huán)境下進行的實驗。接受處理或某種預防措施的基本單位與個體分組試驗一樣是個人,但不同的是臨床試驗的研究對象是病人,包括住院和未住院的病人。常用于對某種藥物或治療方法的效果進行檢驗和評價。該試驗中的干預措施不是一級預防,它不能防止疾病的發(fā)生,僅能防止疾病的復發(fā)或后遺癥。(二)按所具備設計的基本特征劃分:1.真實驗(trueexperiment):具備四個基本特征的實驗稱為真實驗。(1)它是前瞻性研究;(2)必須施加一種或多種干預措施,可以是預防某種疾病的疫苗、治療某病的藥物或其他干預的方法措施等;(3)研究對象必須是來自一個總體的隨機抽樣人群,并在分組時采取嚴格的隨機分配原則;(4)必須有平行的實驗組和對照組,要求在開始實驗時,兩組在有關各方面必須相當近似或可比。2.類實驗(quasi-experiment)又稱半實驗(semi-experiment),如果一項實驗研究缺少其中一個或幾個特征,這種實驗就稱為類實驗??煞譃閮深悾?1)不設對照組:但不等于沒有對比,對比有:一、自身前后對照,即同一受試驗者在接受干預措施前后比較,二是與已知的不給該項干預措施的結果比較。(2)設對照組:雖然設立了對照組,但研究對象的分組不是隨機的。第二節(jié)現場試驗研究一、定義:現場試驗是以正常人為研究對象,以個體或群體為研究單位,將研究對象隨機分為實驗組和對照組,將所研究的干預措施給予實驗組人群后,隨訪觀察一段時間并比較兩組人群的結局,如發(fā)病率、死亡率、治愈率、健康狀況改變情況等,對比分析兩組之間效應上的差別,從而判斷干預措施的效果的一種前瞻性、實驗性研究方法。二、原理:社區(qū)隨機對照試驗是一種前瞻性的實驗流行病學的研究方法,研究對象是正常人,即未患所研究疾病的人群,選擇具有可比性的社區(qū),以社區(qū)為單位隨機分為實驗組和對照組,給實驗組施加一種或多種干預措施后,隨訪追蹤一段時間后,得到兩組人群的結局資料,比較兩組人群效應上的差異,從而判斷或評價干預措施的效果。三、研究設計基本原則與步驟:(一)明確研究目的:一般是評價藥物或疫苗的預防效果;評估健康教育和行為改變對健康或疾病的影響;;探索生物、社會環(huán)境改變對人群健康或疾病的影響。通常一次實驗只解決一個問題。(二)研究對象的選擇:研究對象是未患所研究疾病的人群。選擇研究對象時應制訂出嚴格的選入和排除的標準。選擇原則:1.對干預措施有效的人群;2.預期發(fā)病率較高的人群;3.干預對其無害的人群;4.能將實驗堅持到底的人群;5.依從性(compliance)好的人群。(三)確定實驗現場。應考慮以下幾個方面:1.實驗現場人口相對穩(wěn)定,流動性小,并要有足夠的數量。2.實驗研究的疾病在該地區(qū)有較高而穩(wěn)定的發(fā)病率。3.評價疫苗的免疫學效果時,應選擇近期內未發(fā)生該疾病流行的地區(qū)。4.實驗地區(qū)有較好的醫(yī)療衛(wèi)生條件,衛(wèi)生防疫保健機構比較健全,登記報告制度較完善,醫(yī)療機構及診斷水平較好等。5.實驗地區(qū)(單位)領導重視,群眾愿意接受,有較好的協作條件等。(四)樣本大小的確定:影響因素:⑴干預措施實施前、后研究人群中研究事件(疾病或死亡)的發(fā)生率:干預前人群發(fā)生率越高,所需樣本量越??;干預后效果越好,所需樣本量小。反之,就要大些。⑵第I型(α)錯誤出現的概率,即出現假陽性錯誤的概率:α水平由研究者自行確定,通常將α定為0.05,有時也可定為0.01。但要求的顯著性水平越高,所需樣本量就越大。⑶第II型(β)錯誤出現的概率,即出現假陰性錯誤的概率:β水平由研究者自行確定,一般常將β定為0.20、0.10或0.05。1-β稱把握度,把握度要求越高,則所需樣本量就越大。⑷單側檢驗或雙側檢驗單側檢驗比雙側檢驗所需樣本量小。如果實驗組的效果不比對照組差時,就用單側檢驗;當不能肯定是實驗組和對照組哪一組效果好,即可能實驗組優(yōu)于對照組或對照組優(yōu)于實驗組時,則用雙側檢驗。⑸研究對象分組數量:分組數量越多,則所需樣本量越大。(五)隨機化分組:方法有:1.簡單隨機分組(simplerandomization)將研究對象以個人為單位用擲硬幣(正、反兩面指定為實驗組和對照組)、抽簽、使用隨機數字表,也可采用系統隨機化法,即用現成的數據(如研究對象順序號、身份證號、病歷卡號、工號、學號等)交替隨機分配到實驗組和對照組中去。優(yōu)點:簡單易行,隨時可用,不需要專門工具。缺點:當研究對象數量大時,工作量相當大,有時甚至難以做到。2.分層隨機分組(stratifiedrandomization)按研究對象特征,即可能產生混雜作用的某些因素(如年齡、性別、種族、文化程度、居住條件等)先進行分層,然后在每層內隨機地把研究對象分配到甲(實驗組)和乙(對照
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 總價合同施工合同范例
- 電梯管理合同范例
- 鍋爐就位合同范例
- 提前解聘合同范例
- 餐飲臨時試用合同范例
- 公司管理協議合同范例
- 電子勞動合同范例
- 策劃 營銷合同范例
- 餐飲業(yè)態(tài)合同范例
- 工裝石材拆除合同范例
- 化療后胃腸道反應護理
- 山西省2024-2025學年九年級上學期11月期中考試化學試題
- 商業(yè)街招商運營年終總結
- 家庭年度盤點模板
- 河南省鄭州市2023-2024學年高二上學期期末考試 數學 含答案
- 2024年男方因賭博離婚協議書
- 2024年資格考試-WSET二級認證考試近5年真題集錦(頻考類試題)帶答案
- 部編版五年級上冊道德與法治期末測試卷含答案精練
- 統編版(2024年新版)七年級上冊歷史期末復習課件
- 零工市場(驛站)運營管理 投標方案(技術方案)
- 無線傳感器網絡技術與應用 第2版習題答案
評論
0/150
提交評論