生存分析(第17章)_第1頁(yè)
生存分析(第17章)_第2頁(yè)
生存分析(第17章)_第3頁(yè)
生存分析(第17章)_第4頁(yè)
生存分析(第17章)_第5頁(yè)
已閱讀5頁(yè),還剩88頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1第17章生存分析SurvivalAnalysis第二軍醫(yī)大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)教研室張羅漫12講課內(nèi)容第一節(jié)生存分析中的基本概念(重點(diǎn))第二節(jié)生存率的估計(jì)與生存曲線第三節(jié)生存曲線的log-rank檢驗(yàn)第四節(jié)Cox比例風(fēng)險(xiǎn)回歸模型(重點(diǎn))23開(kāi)始觀察時(shí)間:1992.01.01終止隨訪時(shí)間:2001.12.3141.

兩種治療方法的治愈率相同,但平均治愈天數(shù)不同。甲、乙兩藥物治療某病治愈率均為90%,甲藥治療的患者平均12天出院,乙藥治療的患者平均7天出院。隨訪觀測(cè)評(píng)價(jià)臨床療效存在三個(gè)問(wèn)題52.一部分研究對(duì)象可觀測(cè)到死亡,得到準(zhǔn)確生存時(shí)間(完全數(shù)據(jù));一部分研究對(duì)象中途失訪、或死于其它疾病、或觀測(cè)結(jié)束時(shí)仍存活,得不到準(zhǔn)確生存時(shí)間(不完全數(shù)據(jù))。3.生存時(shí)間分布通常不服從正態(tài)分布。隨訪觀測(cè)評(píng)價(jià)臨床療效存在三個(gè)問(wèn)題62個(gè)效應(yīng)變量

生存時(shí)間(天數(shù))

結(jié)局(死亡或生存、陽(yáng)性或陰性等)存在不完全數(shù)據(jù)分布類型復(fù)雜生存時(shí)間分布常呈正偏態(tài)分布生存時(shí)間資料的特點(diǎn)7

2個(gè)效應(yīng)變量錯(cuò)誤1:忽略生存時(shí)間,采用logistic回歸分析死亡與否與各Xi的關(guān)系。錯(cuò)誤2:忽略結(jié)局,采用多元線性回歸分析生存時(shí)間與各Xi的關(guān)系。對(duì)生存時(shí)間資料的錯(cuò)誤處理8對(duì)生存時(shí)間資料的錯(cuò)誤處理不完全數(shù)據(jù)錯(cuò)誤1:丟棄不完全數(shù)據(jù),只考慮完全

數(shù)據(jù),損失了部分信息。錯(cuò)誤2:將不完全數(shù)據(jù)當(dāng)作完全數(shù)據(jù)處

理,低估了生存時(shí)間的平均水平。9對(duì)生存時(shí)間資料的錯(cuò)誤處理非正態(tài)分布數(shù)據(jù)錯(cuò)誤1:描述時(shí)采用平均生存時(shí)間而不是采用中位生存時(shí)間來(lái)表示生存時(shí)間的平均水平。錯(cuò)誤2:推斷時(shí)采用常規(guī)t檢驗(yàn)或方差分析進(jìn)行各組間生存時(shí)間比較。10針對(duì)以上生存時(shí)間資料的特點(diǎn),生存分析是將事件發(fā)生的結(jié)果與隨訪時(shí)間兩個(gè)因素結(jié)合起來(lái)、可以對(duì)完全或不完全數(shù)據(jù)進(jìn)行分析的方法。11第一節(jié)生存分析中的基本概念TheBasicConceptofSurvivalAnalysis1112

一、名詞解釋

1.生存時(shí)間(survivaltime,

t)

起始事件終點(diǎn)事件

發(fā)病死亡戒煙開(kāi)始重新吸煙白血病治療緩解復(fù)發(fā)冠心病前一次發(fā)作下一次發(fā)作接觸危險(xiǎn)因素發(fā)病開(kāi)始服藥治愈132.截尾值(censoredvalue,X+)隨訪中由于某種原因未能觀測(cè)到病人的明確結(jié)局,提示真實(shí)生存時(shí)間長(zhǎng)于觀測(cè)到的時(shí)間原因:失訪(一般失訪率不應(yīng)>20%);死于其他疾??;病人生存期超過(guò)研究的終止期;治療措施改變。又稱刪失值或終檢值

,本章討論右刪失情況143.死亡概率(mortalityprobability,q)

死于某時(shí)間段內(nèi)的可能性大小。有刪失值時(shí):年初校正人數(shù)=原年初人數(shù)刪失例數(shù)/2154.生存概率(survivalprobability,p)單位時(shí)段開(kāi)始時(shí)存活的個(gè)體到該時(shí)段結(jié)束時(shí)仍存活的可能性。

p=1q有刪失值時(shí):年初校正人數(shù)=原年初人數(shù)刪失例數(shù)/2165.生存率

(survivalrate,S(t,X))

又稱生存函數(shù),累積生存概率。生存概率針對(duì)單位時(shí)間;生存率針對(duì)某個(gè)較長(zhǎng)時(shí)間段,它是生存概率的累積結(jié)果。如5年生存率是每一年不同生存概率乘積。協(xié)變量17例手術(shù)治療50例肺癌病人,術(shù)后1、2、3年的死亡數(shù)分別為10、10、10例,無(wú)截尾數(shù)據(jù)。求各年的生存概率和3年生存率。各年生存概率p1=(50–10)/50=0.8000p2=(40–10)/40=0.7500p3=(30–10)/30=0.66673年生存率

S(3)=(N–d)/N

=(50–30)/50=0.4000S(3)=p1×

p2×

p3=0.8000×0.7500×0.6667=0.4000186.風(fēng)險(xiǎn)函數(shù)

(hazardfunction,h(t,X))生存時(shí)間已達(dá)到t的一群具有協(xié)變量X的觀測(cè)對(duì)象在t

時(shí)刻的瞬時(shí)死亡率。本章討論的重點(diǎn)風(fēng)險(xiǎn)函數(shù)h(t,X)是生存率S(t,X)的導(dǎo)數(shù)函數(shù),通過(guò)研究風(fēng)險(xiǎn)函數(shù)同樣達(dá)到研究生存率的目的。19

二、資料收集(一)隨訪內(nèi)容

1.明確開(kāi)始隨訪的時(shí)間如出院時(shí)間、確診時(shí)間、開(kāi)始治療時(shí)間

2.隨訪的結(jié)局終止隨訪時(shí)間死亡死亡時(shí)間生存但中途失訪最后一次訪問(wèn)時(shí)間死于其他疾病死于該病時(shí)間生存但隨訪結(jié)束研究結(jié)束時(shí)間

3.記錄影響生存時(shí)間的有關(guān)因素20(二)隨訪方式○○○○○××××?xí)r間0始點(diǎn)t終點(diǎn)×

死亡○失訪治療措施改變死于其他疾病21○○○○○××××?xí)r間0始點(diǎn)t終點(diǎn)×

死亡○失訪治療措施改變死于其他疾病22○○○○○××××?xí)r間

始點(diǎn)t終點(diǎn)×

死亡○失訪治療措施改變死于其他疾病23三、生存分析研究的主要內(nèi)容1.描述生存過(guò)程生存時(shí)間分布特點(diǎn)估計(jì)生存率及平均生存時(shí)間繪制生存曲線2.比較生存過(guò)程對(duì)各樣本生存曲線進(jìn)行比較3.影響生存時(shí)間的因素分析擬合生存分析模型24四、生存分析的基本方法25第一節(jié)生存分析中的基本概念25一、名詞解釋二、資料收集三、生存分析研究的主要內(nèi)容四、生存分析的基本方法26第二節(jié)生存率的估計(jì)與生存曲線

(生存過(guò)程的描述)26EstimateofSurvivalRate&SurvivalCurve27

一、小樣本資料

1.生存率的計(jì)算

2.生存率標(biāo)準(zhǔn)誤的計(jì)算

3.生存曲線

4.中位生存時(shí)間281.生存率的計(jì)算乘積極限法

(product-limitedmethod)由Kaplan-Meier于1958年提出,又稱為Kaplan-Meier法。利用生存概率與概率乘法原理計(jì)算生存率29例有人研究了甲種手術(shù)方法治療腎上腺腫瘤病人23例的生存情況,定義從手術(shù)后到病人死亡時(shí)間為生存時(shí)間,得到生存時(shí)間(月)如下(+為截尾數(shù)據(jù)),試計(jì)算其生存率與標(biāo)準(zhǔn)誤。

1,3,5,5,5,6,6,6,7,8,10,

10,14+,17,19+

,20+

,22+

,26+

,

31+

,34,34+

,44,59。相同數(shù)據(jù)只列一次,完全數(shù)據(jù)與截尾數(shù)據(jù)相同時(shí),截尾數(shù)據(jù)在后。300.957×0.955×0.857=0.783312.生存率標(biāo)準(zhǔn)誤的計(jì)算

由Greenwood1926年提出32總體生存率1-的可信區(qū)間

333.生存曲線例

用乙種手術(shù)方法治療與甲種手術(shù)方法病情基本相同的腎上腺腫瘤病人20例,定義從手術(shù)后到病人死亡的時(shí)間為生存時(shí)間,得到生存時(shí)間(月)如下(+為截尾數(shù)據(jù))。試計(jì)算其生存率與標(biāo)準(zhǔn)誤,并繪制甲、乙兩種手術(shù)方法的生存曲線。

1,1,2,3,3,4,4,4,6,6,8,9,

9,10,11,12,13,15,17,18。34SPSS實(shí)現(xiàn)3536死亡373839每一級(jí)階梯代表一個(gè)死亡時(shí)間點(diǎn),在截尾時(shí)間點(diǎn)無(wú)階梯。39173440例有人研究了甲種手術(shù)方法治療腎上腺腫瘤病人23例的生存情況,定義從手術(shù)后到病人死亡時(shí)間為生存時(shí)間,得到生存時(shí)間(月)如下(+為截尾數(shù)據(jù)),試計(jì)算其生存率與標(biāo)準(zhǔn)誤。

1,3,5,5,5,6,6,6,7,8,10,

10,14+,17,19+

,20+

,22+

,26+

31+

,34,34+

,44,59。414.中位生存時(shí)間生存率為50%時(shí)對(duì)應(yīng)的時(shí)間。424.中位生存時(shí)間生存率為50%時(shí)對(duì)應(yīng)的時(shí)間。434344

二、大樣本資料

1.生存率的計(jì)算

壽命表法(lifetablemethod)由E.Halley(英,1656-1742)最早提出。452418-456=19621962-19.5=1942.5462.生存率曲線4647

第二節(jié)生存率的估計(jì)與生存曲線47一、小樣本資料

乘積極限法

(Kaplan-Meier法)二、大樣本資料壽命表法4849第三節(jié)生存曲線的log-rank檢驗(yàn)

(生存過(guò)程的比較)48Log-rankTestforSurvivalCurves50log-rank檢驗(yàn)譯為時(shí)序檢驗(yàn),譯為對(duì)數(shù)秩檢驗(yàn)是錯(cuò)誤的。log-記錄。log-rank檢驗(yàn)是對(duì)各組生存曲線作整體的比較log-rank檢驗(yàn)的基本思想將各組生存時(shí)間混合統(tǒng)一排序后,對(duì)實(shí)際死亡數(shù)與期望死亡數(shù)進(jìn)行比較。log-rank檢驗(yàn)是一種非參數(shù)方法。51例用甲、乙兩種手術(shù)方法分別治療病情基本相同的腎上腺腫瘤病人23例與20例,定義從手術(shù)后到病人死亡的時(shí)間為生存時(shí)間,得到生存時(shí)間(月)如下(+為截尾數(shù)據(jù)),問(wèn)甲、乙兩種手術(shù)方式后病人生存率有無(wú)差別?甲(n=23)1,3,5,5,5,6,6,6,7,8,10,10,14+,17,19+

,20+

,22+

,26+

,31+

,34,34+

,44,59乙(n=20)1,1,2,3,3,4,4,4,6,6,8,9,9,10,11,12,13,15,17,1852H0:兩種手術(shù)方式后病人的生存曲線相同H1:兩種手術(shù)方式后病人的生存曲線不相同=0.05是兩條生存曲線的整體比較53混合統(tǒng)一排序截尾生存時(shí)間5455(1)將兩組生存時(shí)間混合后統(tǒng)一排序

c1i、c2i分別表示兩組截尾數(shù)據(jù)(2)計(jì)算各組的期望死亡數(shù):56(3)求各組的期望死亡人數(shù)之和:

(4)計(jì)算值:結(jié)論:按=0.05水準(zhǔn)拒絕H0

,接受H1

,認(rèn)為兩種手術(shù)方式后病人的生存曲線有差別。57SPSS軟件計(jì)算58死亡59差別由三種方法在各時(shí)點(diǎn)所取權(quán)重不同造成。60第三節(jié)生存曲線的log-rank檢驗(yàn)59兩樣本生存曲線比較及SPSS實(shí)現(xiàn)61第四節(jié)Cox比例風(fēng)險(xiǎn)回歸模型

(生存過(guò)程影響因素分析)60Cox’sProportionalHazardRegressionModel62

1972年由英國(guó)統(tǒng)計(jì)學(xué)家D.R.Cox

提出,解決以下問(wèn)題:在生存時(shí)間的分布種類繁多且難以確定、存在截尾數(shù)據(jù)的情況下,研究協(xié)變量X與生存函數(shù)S(t,X)之間的關(guān)系。Cox模型不直接考察生存函數(shù)S(t,X)與協(xié)變量的關(guān)系,而是用風(fēng)險(xiǎn)函數(shù)h(t,X)作為應(yīng)變量。該方法在不對(duì)生存時(shí)間的具體分布進(jìn)行假設(shè)的情況下分析協(xié)變量的影響,大大降低了生存分析的煩瑣性,被譽(yù)為生存分析研究的里程碑。63DavidRoxbeeCox(英,1924~)1972年發(fā)表了在生存分析領(lǐng)域具有開(kāi)創(chuàng)性的論文《回歸模型和壽命表》,提出了著名的Cox比例風(fēng)險(xiǎn)模型,從而極大地推動(dòng)了壽命分布模型的發(fā)展并且拓寬了模型的應(yīng)用。1990年他因此獲得了凱特靈獎(jiǎng)和金質(zhì)獎(jiǎng)?wù)隆?966年到1991年,擔(dān)任著名生物統(tǒng)計(jì)學(xué)雜志Biometrika編委,發(fā)表了300多篇論文,出版了多部著作。他被推舉擔(dān)任了英國(guó)皇家統(tǒng)計(jì)學(xué)會(huì)和國(guó)際統(tǒng)計(jì)機(jī)構(gòu)的會(huì)長(zhǎng)。64一、Cox模型的基本形式與意義h(t,X)=h0(t)exp(β1X1+β2X2+···+βmXm)h(t,X):風(fēng)險(xiǎn)函數(shù),瞬時(shí)死亡率

X=(X1,X2,···,Xm)’:影響生存時(shí)間的協(xié)變量,不隨時(shí)間而變化。

h0(t):危險(xiǎn)因素為0的基礎(chǔ)風(fēng)險(xiǎn)率,分布未知,

與h(t,X)呈比例非參數(shù)部分

β=(β1,β2,···,βm)’:偏回歸系數(shù)參數(shù)部分65對(duì)于0,1變量,假設(shè)危險(xiǎn)因素Xj在非暴露組取值為0,在暴露組取值為1:h(t,X)=h0(t)exp(β1X1+β2X2+···+βmXm

)

對(duì)于連續(xù)變量,假設(shè)危險(xiǎn)因素Xj取值為k與k+1Cox比例風(fēng)險(xiǎn)回歸模型6667例:

為探討胃癌患者的預(yù)后,對(duì)是否施行手術(shù)治療(X1,手術(shù)=1,否=0)和是否接受放射治療(X2,放射=1,否=0)的效果進(jìn)行分析,其偏回歸系數(shù)分別為-0.360與-0.333。h(t,Xi=1)=h0(t)exp(β1X1+β2X2)=h0(t)exp(0.360×1

0.333×1)=0.5h0(t)

h(t,Xi=0)=h0(t)exp(0.360×0

0.333×0)=

h0(t)RR=h(t,Xi=1)∕h(t,Xi=0)=0.5多因素相對(duì)危險(xiǎn)度

RR=h(t,Xi=1)/h(t,Xi=0)=exp[β’(Xi=1Xi=0)]68多因素相對(duì)危險(xiǎn)度

RR=h(t,Xi=1)/h(t,Xi=0)=HR風(fēng)險(xiǎn)比(hazardratio)69

二、參數(shù)估計(jì)與假設(shè)檢驗(yàn)(一)參數(shù)估計(jì)在時(shí)刻ti上病人死亡的條件概率為:S代表ti時(shí)刻以后危險(xiǎn)集R(ti)中對(duì)似然函數(shù)有貢獻(xiàn)的個(gè)體。70

n個(gè)病人死亡的條件概率相乘,并非通常意義下的似然函數(shù),但Cox證明了它是觀察數(shù)據(jù)在特定意義下的一部分,稱為偏似然函數(shù)。71

截尾資料(i=0截尾;i=1死亡)的偏似然函數(shù)

對(duì)ln()求關(guān)于j的一階偏導(dǎo)數(shù),并求其等于0

的解,可得到j(luò)的最大似然函數(shù)估計(jì)值bj。72

(二)假設(shè)檢驗(yàn)

1.最大似然比檢驗(yàn)(maximumlikelihoodratiotest)模型中原有不顯著變量剔除與新變量引進(jìn);包含不同協(xié)變量的模型間比較。733.計(jì)分檢驗(yàn)(scoretest)新變量是否能夠引進(jìn)模型。2.wald檢驗(yàn)(waldtest)模型中的協(xié)變量是否應(yīng)從模型中剔除。74

(三)生存率的估計(jì)基礎(chǔ)生存率75三、因素的初步篩選與最佳模型的建立常用多元逐步Cox模型分析,SAS程序:

procphreg;modelt*y(1)=X1~Xn/selection=stepwiseslentry=0.05slstay=0.10;

檢驗(yàn)各因素是否有統(tǒng)計(jì)學(xué)意義:

Maximunlikelihoodratiotest(選與剔)Scoretest(選)Waldtest(剔)

76

四、Cox模型的統(tǒng)計(jì)描述

1.回歸系數(shù)(bj)和標(biāo)準(zhǔn)回歸系數(shù)(bj’)反應(yīng)某因素Xj對(duì)生存時(shí)間影響的程度。

2.相對(duì)危險(xiǎn)度(某因素Xj取值為1與取值為0相比)RR的1–可信區(qū)間:773.個(gè)體預(yù)后指數(shù)(personalprognosisindex)PI>0

表示該病人對(duì)應(yīng)的危險(xiǎn)度大于平均水平PI=0表示該病人對(duì)應(yīng)的危險(xiǎn)度達(dá)到平均水平PI<0表示該病人對(duì)應(yīng)的危險(xiǎn)度小于平均水平

78

五、應(yīng)用實(shí)例7980X4治療方式(傳統(tǒng)=1,新=0)X5淋巴結(jié)是否轉(zhuǎn)移(是=1,否=0)81SPSS軟件計(jì)算82死亡83基于最大似然估計(jì)的向前逐步回歸法848586六、Cox模型的注意事項(xiàng)及應(yīng)用范圍設(shè)計(jì)階段應(yīng)注意的問(wèn)題研究樣本要有代表性;協(xié)變量在研究對(duì)象中的分布要有敏感性;盡可能全部包括影響因素;生存時(shí)間要有明確規(guī)定;過(guò)多的失訪容易造成研究結(jié)果的偏倚;協(xié)變量隨時(shí)間變化而變化時(shí)采用Cox時(shí)間依存協(xié)變量模型;樣本含量一般為自變量個(gè)數(shù)的15~20倍。87模型配合時(shí)應(yīng)注意的問(wèn)題消除多元共線的影響;選擇單因

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論