版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
生存分析問題由來流行病學(xué)研究資料既有連續(xù)變量、又有屬性變量。某些流行病學(xué)研究的興趣在于事件發(fā)生所需的時間。最常見的一種資料,記錄從某個固定起點(如外科手術(shù))至某一事件(如死亡)終點所間隔的時間研究對象出現(xiàn)某種結(jié)局所經(jīng)歷的時間統(tǒng)稱為生存時間,含生存數(shù)據(jù)的資料稱為生存數(shù)據(jù)對生存數(shù)據(jù)進(jìn)行統(tǒng)計學(xué)處理稱為生存分析生存分析與傳統(tǒng)設(shè)計的數(shù)據(jù)分析的區(qū)別:測量的是事件發(fā)生時間一次性征集的研究對象數(shù)不夠多,無法分成兩組,研究對象只能在不同時間進(jìn)入研究常需數(shù)月才能征集到適宜的研究對象研究對象常有失訪各個研究對象隨訪時間長短不一生存時間臨床研究的生存時間常指死亡時間、發(fā)生某一癥狀時間、疾病緩解后的復(fù)發(fā)時間、吸毒者的復(fù)吸時間等事件的終點時間常有一個清楚的界定但其起點時間的界定往往不清楚例如,診斷時間不易確定,不大可能知道得病時間多長某些疾病的診斷時間與疾病起點時間可有很大差別狹義講,生存時間指某種疾病的病人從發(fā)病至死亡所經(jīng)歷的時間跨度廣義講,生存時間指某種事件從起始至到達(dá)某種終點所經(jīng)歷的時間病人癥狀緩解至復(fù)發(fā)所間隔時間病人兩次發(fā)作間隔時間健康至發(fā)病所經(jīng)歷時間如接觸危險因素至發(fā)病所經(jīng)歷時間病人發(fā)病至死亡所經(jīng)歷時間病人治療開始至痊愈所經(jīng)歷時間病人治療開始至死亡所經(jīng)歷時間輸卵管再通術(shù)后至受孕所間隔時間數(shù)據(jù)的截縮(censoring)生存(時間)數(shù)據(jù),不適用于此前講過的任何方法進(jìn)行分析欲觀察到所有研究對象結(jié)局發(fā)生,幾乎不可能例如,比較施行不同類型手術(shù)的乳癌病人的生存時間,雖可隨訪病人多年,但總有一些病人在觀察終止時仍然活著。因此,就不知道她們自手術(shù)以來的生存時間,只知道她們生存的時間比參加研究的時間要長,這稱為生存時間被截縮(censored),即在事件發(fā)生前,觀察期截斷(終止)這類研究事件往往是一些不良事件,如死亡、發(fā)病數(shù)據(jù)的截縮(續(xù))隨訪中,如能觀察到研究對象的明確結(jié)局,所提供的生存時間信息是完整的,稱為完全性數(shù)據(jù)(completedata)隨訪中,如因各種原因未能觀察到研究對象的明確結(jié)局,不知其確切的生存時間,只知該研究對象至少在其已經(jīng)歷的時間內(nèi)未發(fā)生結(jié)局(如死亡),即其生存時間只會長于觀察的時間而不會短于這個時間,這種研究對象的生存時間在未到規(guī)定的終點之前就終止(或截縮)了,這種數(shù)據(jù)稱為截縮(或終檢、或截尾)數(shù)據(jù)(censoreddata)截縮(終檢、截尾)的原因研究對象失訪拒絕繼續(xù)參加研究終止、研究對象生存期超過研究終止期研究對象死于其它競爭性死因風(fēng)險(hazard)函數(shù)風(fēng)險函數(shù)是指一個已活到時間t的觀察對象,在時間t到t+Δt非常短的時間區(qū)間內(nèi)死亡(瞬間)概率的極限(概率函數(shù)):實際工作中可估計單位長度時間內(nèi)的風(fēng)險函數(shù):某時間區(qū)間(t,t+Δt)內(nèi)死亡人數(shù)風(fēng)險函數(shù)=
與該時間區(qū)間開始時的觀察對象總數(shù)隨時間延長,風(fēng)險函數(shù)可表現(xiàn)為遞增或遞減當(dāng)風(fēng)險函數(shù)為常數(shù)時,說明其不隨時間而改變?nèi)顼L(fēng)險函數(shù)隨時間增大,表示死亡速率隨時間而加快風(fēng)險(hazard)函數(shù)(續(xù))風(fēng)險函數(shù)是指一個已活到時間t的觀察對象,在時間t到t+Δt這個非常短的時間區(qū)間內(nèi)死亡概率(瞬間概率)的極限(概率函數(shù)),即:于時間t存活的觀察對象在t至t+Δt的時間區(qū)間內(nèi)死亡的概率h(t)
=────────────────────────────
Δt風(fēng)險函數(shù)又稱時間t的瞬時死亡概率(密度)函數(shù),或條件死亡概率,或死亡力(force),或年齡死亡速率比例風(fēng)險回歸生物醫(yī)學(xué)研究目的不僅是描述病人在不同時間的生存率或風(fēng)險函數(shù)希望能建立一個模型反映生存時間與協(xié)變量(或自變量、解釋變量、預(yù)測變量、影響變量等)之間的聯(lián)系可采取兩種方法:分層分析:按自變量分成若干層次,計算各層的生存率Cox回歸分析:分析帶協(xié)變量的生存數(shù)據(jù),生存數(shù)據(jù)反映生存時間長短比例風(fēng)險回歸D.R.Cox最早提出比例風(fēng)險回歸模型又稱Cox回歸模型建立條件死亡概率和偏似然函數(shù)估計與檢驗的方法用這種模型,可對兩組風(fēng)險函數(shù)進(jìn)行多變量分析與多變量線性回歸和logistic回歸分析相似比例風(fēng)險回歸模型也可評價各個自變量在兩個風(fēng)險函數(shù)差異中的影響,并調(diào)整其它自變量的混雜作用Cox回歸模型分析可看作是帶協(xié)變量的生存分析比例風(fēng)險回歸Cox回歸模型不是直接考察生存率S(t,x)與自變量(協(xié)變量)x的關(guān)系而是假設(shè)兩個風(fēng)險率h1(t,x)與h0(t)成比例,以這個比例作因變量h1(t,x)=h0(t)exp(Σβkxk)
=h0(t)exp(β1x1+β2x2+β3x3+……βkxk)再來考察該比例與自變量(協(xié)變量)x的關(guān)系;[某個條件純在的時候生存的時間之比較]比例風(fēng)險回歸比例風(fēng)險回歸模型具有多變量回歸模型的大部分特征偏回歸系數(shù)bi表示第i個變量改變1個單位時,兩個風(fēng)險函數(shù)之比(風(fēng)險比,hazardratio,HR)的改變情況,而其它k?1個變量保持不變風(fēng)險比(hazardratio,HR)相當(dāng)于相對危險性(RR)應(yīng)用比例風(fēng)險回歸分析注意事項(1)Cox回歸模型主要用于生存資料的分析,對所分析的數(shù)據(jù)分布無特殊要求,可以進(jìn)行多因素分析Cox模型中每個觀察對象的隨訪數(shù)據(jù)必須包括兩部分信息:
①
發(fā)生或未發(fā)生“失效”,即結(jié)局事件是否發(fā)生②
結(jié)局發(fā)生或未發(fā)生的時間,即“失效”時間或截縮時間(2)Cox回歸模型用于隊列研究資料分析,毋須假設(shè)所有對象的觀察時間一致,無論隨訪遲早、隨訪時間長短、或失訪、或數(shù)據(jù)截縮,均適用應(yīng)用比例風(fēng)險回歸分析注意事項(續(xù))(3)Cox回歸模型的因變量是風(fēng)險比(hazardratio)它不是非直接用生存時間作因變量,也不是直接估計風(fēng)險率它估計的是兩個風(fēng)險(率)的比它所比較的兩個風(fēng)險(率)是以一定的生存時間來反映的:
∑bi×xih(t,x)=h0(t)e
∑bi×xih(t,x)/h0(t)=c=c1c2c3......ck=exp∑bi×xi=e上式中h(t,x)=風(fēng)險,是指在t時刻的瞬間死亡率
h0(t)=當(dāng)所有xi都為0時的風(fēng)險,又稱基準(zhǔn)風(fēng)險
bi
=偏回歸系數(shù)假設(shè)bi與h(t,x)呈指數(shù)關(guān)系Cox回歸模型可以用于分析多種因素對疾病預(yù)后或生存時間的影響具有評價和預(yù)測的功能它不必考慮生存時間數(shù)據(jù)的分布在分析對生存或死亡的影響同時,也可分析結(jié)局發(fā)生時間這個定量指標(biāo),使分析的信息增加它可以直接估計相對危險性(風(fēng)險比),不必作發(fā)病率很低的假設(shè)研究設(shè)計上比較靈活,處理失訪也很容易應(yīng)用比例風(fēng)險回歸分析注意事項(續(xù))(4)入選模型的變量不一定都與“壽命(生存時間)”有因果關(guān)系,可能是伴隨關(guān)系未入選模型的變量不一定無關(guān),應(yīng)考慮模型內(nèi)某些變量替代了它的作用,或因檢驗效率低,或?qū)δ硞€變量進(jìn)行了控制(5)Cox回歸分析的生存率一般不宜用于不同資料的比較,因基準(zhǔn)風(fēng)險只在同一數(shù)據(jù)資料內(nèi)保持相同,不同資料的基準(zhǔn)風(fēng)險各異。且不同資料的協(xié)變量組合也難一致(6)生存率估計不應(yīng)任意外推,也不宜輕易用于預(yù)測(7)注意變量之間的交互應(yīng)用比例風(fēng)險回歸分析注意事項(續(xù))(8)Cox回歸模型中的自變量及自變量的效應(yīng)(bi)均不隨時間而改變(9)Cox回歸模型的擬合與logistic回歸模型擬合相似,估計的參數(shù)已調(diào)整了其它混雜變量的影響(10)擬合Cox回歸模型的死亡數(shù)據(jù)應(yīng)無重疊(ties)[在同一個時間內(nèi),只發(fā)生一例,否則需要再次細(xì)分時間,以免重疊發(fā)生]連續(xù)變量“失效時間”也無重疊、或盡可能減少(最好是沒有)“失效時間”相同的情況,如是,可將“失效時間”劃分得更細(xì)些,或轉(zhuǎn)換成屬性變量形式應(yīng)用比例風(fēng)險回歸分析注意事項(續(xù))(11)Cox回歸模型的參數(shù)檢驗常用Waldχ2
檢驗、Scoreχ2
檢驗、或似然比檢驗可以根據(jù)Waldχ2統(tǒng)計量的大小,比較各個自變量對因變量影響的大?。?2)應(yīng)用Cox回歸模型時所需樣本含量視需分析的自變量數(shù)目多少而定,變量越多所需樣本含量也大(至少是變量數(shù)的10倍)樣本含量估計可用下式計算:
2(Z+Z
)2d=
ln上式中,d=每組發(fā)生的事件數(shù)=研究結(jié)束時兩組的預(yù)期風(fēng)險比(常難估計)
Z=水平下標(biāo)準(zhǔn)正態(tài)離差,Z=水平下標(biāo)準(zhǔn)正態(tài)離差例如,設(shè)=0.05,=0.20,Z=1.96,Z=0.84如果研究結(jié)束時試驗組的事件發(fā)生率估計為50%知道了后,即可計算d(例如,20),算得d后,乘以2(1/50%)即得到所需征集得對象數(shù)(40)生存分析生存分析:在臨床診療工作的評價中,慢性疾病的預(yù)后一般不適用于治愈率、病死率等指標(biāo)來考核,因為其無法在短時間內(nèi)明確判斷預(yù)后情況,為此,只能對患者進(jìn)行長期隨訪,統(tǒng)計一定時期后的生存或死亡情況以判斷診療效果。生存分析還適用于現(xiàn)場追蹤研究(發(fā)病為陽性)、臨床療效試驗(痊愈或顯效為陽性)、動物試驗(發(fā)病或死亡)等?;靖拍钌鏁r間(SurvivalTime):從狹義的角度來說:生存時間是患某病的病人從發(fā)病到死亡所經(jīng)歷的時間跨度。
開始發(fā)病病人死亡
從廣義的角度:從某種起始事件到達(dá)某種終點時間所經(jīng)歷的時間跨度。
起始事件終點事件生存時間生存時間生存時間的數(shù)據(jù)類型2.截尾數(shù)據(jù)(CensoredData):由于某種原因未能觀察到觀察對象的明確的結(jié)局,所以不知道該觀察對象的確切的生存時間,就象該觀察對象的生存時間在未到達(dá)規(guī)定的終點之前就被截尾了。截尾數(shù)據(jù)提供了部分關(guān)于生存時間的信息,使研究者知道該觀察對象至少在已經(jīng)經(jīng)歷的這個時間長度內(nèi)沒有發(fā)生終點事件,其真實的生存時間只能長于我們現(xiàn)在觀察到的時間而不會短于這個時間。(符號t+)1.完全數(shù)據(jù)(CompleteData)指達(dá)到了明確結(jié)局的觀察對象的生存時間數(shù)據(jù)。某個觀察對象具有明確的結(jié)局時,該觀察對象所提供的關(guān)于生存時間的信息是完整的。生存時間資料的特點有2個效應(yīng)變量:一是生存時間(天數(shù)),二是結(jié)局(死亡與否、是否陽性等)。
存在截尾數(shù)據(jù):由于某種原因未能明確觀察到隨訪對象發(fā)生事先定義的終終事件。
分布類型復(fù)雜:生存時間資料常通過隨訪獲得,因觀察時間長且難以控制混雜因素,故其分布常呈偏態(tài),影響因素較多,規(guī)律難以估測。生存分析方法Kaplan-meier過程這是一種非參數(shù)法,主要用于小樣本,適用于能夠準(zhǔn)確記錄事件和刪失發(fā)生時點的數(shù)據(jù)。LifeTables過程也叫壽命表法,適用于樣本量大,且不太可能準(zhǔn)確記載每個觀察對象的死亡或刪失發(fā)生時間的數(shù)據(jù)。Cox回歸模型分析法用于描述多個變量對生存時間的影響Kaplan-meier過程Kaplan-meier法用于:估計某因素不同水平的中位生存時間比較研究因素不同水平的生存時間有無差異控制一分層因素后對研究因素不同水平的生存時間比較例1:3種療法治療66例白血病患者緩解時間(天),數(shù)據(jù)(kaplanm.sav)如下A療法:4,5,9,10,11,12,13,28,28,28,29,31,32,37,41,41,57,62,74,100,139,20+,258+,269B療法:8,10,10,12,14,20,48,70,75,99,103,162,169,195,220,161+,199+,217+,245+C療法:8,10,11,23,25,28,28,31,31,40,48,89,124,143,12+,159+,190+,196+,197+,205+,219+Kaplan-meier過程Kaplan-meier過程Kaplan-meier過程時間變量結(jié)局變量分組變量當(dāng)變量為二分類變量時,一般以死亡、復(fù)發(fā)、惡化等為終結(jié)事件,如本例就是以惡化為終結(jié)事件,標(biāo)記值為1,所以在Singlevalue框中輸入1;如果生存狀態(tài)變量取值為連續(xù)變量時,則在Rangeofvalues框分別輸入下限值和上限值。Kaplan-meier過程LogRank法和Breslow法較為常用Kaplan-meier過程對組間生存函數(shù)的差異進(jìn)行檢驗的方法Kaplan-meier過程Survival:累積生存率估計,選中,表明要求將各觀察樣本的生存率存入原始數(shù)據(jù)庫中Standarderrorofsurvival:累積生存率估計的標(biāo)準(zhǔn)誤Hazard:累積風(fēng)險函數(shù)估計Cumulativeevents:終結(jié)事件的累積頻數(shù)生存分析表平均生存時間和中位生存時間及其標(biāo)準(zhǔn)誤和可信區(qū)間累積生存函數(shù)曲線Kaplan-meier過程Kaplan-meier過程分析結(jié)果…1.觀察時間2.生存狀態(tài)3.累積生存率4.累積生存率的標(biāo)準(zhǔn)差5.累積死亡數(shù)6.組中剩余人數(shù)123456(1)生存表分析
Mean是生存時間的算術(shù)均數(shù),Median為中位生存時間,同時表格中也給出它們的95%的可信區(qū)間。Kaplan-meier過程分析結(jié)果(2)生存時間估計
LogRank、Breslow和Tarone-Ware三種檢驗方法的檢驗統(tǒng)計量分別為3.282、2.861和3.360,它們的p值分別為0.194、0.239和0.186,說明三組療法之間生存時間的差異無顯著性Kaplan-meier過程分析結(jié)果(3)水平間的整體比較分析結(jié)果(4)生存曲線Kaplan-meier過程LifeTables過程用于:制作壽命表繪制各做曲線如生存函數(shù)、風(fēng)險函數(shù)曲線等。對某一研究因素的不同水平的生存時間分布進(jìn)行比較,控制另一個因素后對研究因素不同水平的生存時間分布進(jìn)行比較,包括從總體上比較和不同水平間進(jìn)行兩兩比較。Life-Tables過程例2:某醫(yī)院對114名男性胃癌患者接受手術(shù)后的生存情況進(jìn)行了11年的隨訪,得到數(shù)據(jù)(lifetb.sav)如下Life-Tables過程Life-Tables過程輸出生存時間范圍及組距:前一個框輸入生存時間上限,后一個框輸入生存時間的組距Life-Tables過程Life-Tables過程生存曲線風(fēng)險函數(shù)曲線壽命表Life-Tables過程分析結(jié)果(1)壽命表(分三部分講解)1.生存時間的組段下限2.進(jìn)入該組段的觀察例數(shù)3.該組段的刪失例數(shù)4.暴露于危險因素的例數(shù)5.所關(guān)心的事件的例數(shù),即死亡例數(shù)Life-Tables過程分析結(jié)果(1)壽命表Ⅰ123451.所關(guān)心事件的觀察單位數(shù)的比,即各組的死亡概率2.各組的生存概率3.至本組段上限的生存函數(shù)估計值,由各組的生存概率累積相乘所得。4.概率密度,所有個體在時點t后單位時間內(nèi)死亡概率估計值。Life-Tables過程分析結(jié)果(1)壽命表Ⅱ12341.風(fēng)險率?;钸^時點t個體在時點t后單位時間內(nèi)死亡概率的估計值2.生存函數(shù)估計的標(biāo)準(zhǔn)誤。3.概率密度的標(biāo)準(zhǔn)誤4.風(fēng)險率的標(biāo)準(zhǔn)誤。1234Life-Tables過程分析結(jié)果(1)壽命表ⅢLife-Tables過程分析結(jié)果(2)累積生存函數(shù)曲線基本思想不同:LifeTables過程是將生存時間分成許多小的時間段,計算該段內(nèi)生存率的變化情況,分析的重點是研究總體生存規(guī)律;而Kaplan-Meier過程則是計算每一“結(jié)果”事件發(fā)生時點的生存率,分析的重點除了研究總體生存規(guī)律外,還熱心于尋找相關(guān)影響因素。對于分層變量的處理不同:LifeTables過程僅按該分層變量進(jìn)行分層,沒有考慮其對生存時間的影響,即沒有提供控制該分層變量的情況下對研究因素對生存時間的影響進(jìn)行統(tǒng)計分析的能力;Kaplan-Meier過程則是在控制該分層變量的情況下對研究因素對生存時間的影響進(jìn)行統(tǒng)計分析。做出的生存曲線不同統(tǒng)計學(xué)檢驗方法不同:LifeTables過程采用Wilcoxon法,Kaplan-Meier過程用Logrank法、Breslow法、Tarone-are法Kaplan-Meler法和壽命表法的比較Cox回歸模型上面介紹的兩種生存分析方法只能研究一至兩個因素對生存時間的影響,當(dāng)生存時間的影響因素有多個時,它們就無能為力了,下面介紹CoxRegression過程,這是一種專門用于生存時間多變量分析的統(tǒng)計方法。模型結(jié)構(gòu):設(shè)有n名病人,第i名病人的生存時間為ti,同時該病人具有一組伴隨變量xi1,xi2…xip。該病人生存到時間ti的風(fēng)險函數(shù)hi(t)是其基礎(chǔ)風(fēng)險函數(shù)ho(t)與相應(yīng)伴隨變量的函數(shù)的乘積,其數(shù)學(xué)表達(dá)式為:
hi(t)=h0(t)f(β1xi1+….+βpxip)
Cox建議伴隨變量的函數(shù)為指數(shù)形式,故Cox比例風(fēng)險回歸可寫為:
hi(t)=h0(t)exp(β1xi1+….+βpxip)式中的h0(t)是當(dāng)所有伴隨變量xi1,xi2,…xip都處于0或標(biāo)準(zhǔn)狀態(tài)下的風(fēng)險函數(shù),是一個不確定的值,β1,β2…,βp為回歸系數(shù),須用實際資料來估計。Cox回歸模型將h0(t)移至等式左邊并去自然對數(shù)得:
ln[hi(t)/h0(t)]=β1xi1+….+βp
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 滾珠絲杠課程設(shè)計圖紙
- 自行車的人機(jī)課程設(shè)計
- 荒島植物辨識課程設(shè)計
- 泵房的課程設(shè)計
- 智慧物流課課程設(shè)計
- 英語思維導(dǎo)圖課程設(shè)計
- 古泉1100kV千伏GIS安裝施工方案(報公司審核)
- 植物根莖科學(xué)課程設(shè)計
- 長沙交通集團(tuán)日常維修定點項目招標(biāo)文件
- 物體打擊 課程設(shè)計
- 水利水電工程安全管理制度例文(三篇)
- 2025四川宜賓市南溪區(qū)屬國企業(yè)招聘融資人員6人管理單位筆試遴選500模擬題附帶答案詳解
- DB45T 2048-2019 微型消防站建設(shè)管理規(guī)范
- 人教版2024-2025學(xué)年第一學(xué)期八年級物理期末綜合復(fù)習(xí)練習(xí)卷(含答案)
- 《上帝擲骰子嗎:量子物理史話》導(dǎo)讀學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 病例報告表(CRF)模板
- CCC例行檢驗和確認(rèn)檢驗程序
- 初中物理競賽教程(基礎(chǔ)篇)第16講比熱容
- 親子鑒定書(共3頁)
- 容器支腿計算公式(支腿計算主要用于立式容器的支腿受力及地腳螺栓計算)
- 建設(shè)工程項目施工安全管理流程圖3頁
評論
0/150
提交評論