




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
生存分析
SurvivalAnalysis
第四軍醫(yī)大學(xué)西京醫(yī)院神經(jīng)內(nèi)科劉學(xué)東生存分析
SurvivalAnalysis第四軍醫(yī)大學(xué)西1第一節(jié)概述第二節(jié)生存時(shí)間資料的特點(diǎn)第三節(jié)小樣本生存率的Kaplan-Meier估計(jì)第四節(jié)大樣本生存率的壽命表法估計(jì)第五節(jié)生存曲線比較的假設(shè)檢驗(yàn)第六節(jié)Cox比例風(fēng)險(xiǎn)回歸模型第七節(jié)實(shí)例分析第一節(jié)概述2
第一節(jié)概述
3一根本概念生存分析:是將事件的結(jié)果〔終點(diǎn)事件〕和出現(xiàn)這一結(jié)果所經(jīng)歷的時(shí)間結(jié)合起來分析的一種統(tǒng)計(jì)分析方法。二特點(diǎn)含有截尾數(shù)據(jù)生存時(shí)間一般不呈正態(tài)分布一根本概念4三歷史最早可上溯至十九世紀(jì)的死亡壽命表現(xiàn)代的生存分析那么開場于二十世紀(jì)三十年代工業(yè)科學(xué)中的相關(guān)應(yīng)用二次世界大戰(zhàn):武器裝備的可靠性研究,這一研究興趣延續(xù)到戰(zhàn)后。此時(shí)生存分析都集中在參數(shù)模型。三歷史5二十世紀(jì)六七十年代:醫(yī)學(xué)研究中大量臨床試驗(yàn)的出現(xiàn),要求方法學(xué)有新的突破,生存分析研究開場轉(zhuǎn)向非參數(shù)方法。D.R.Cox在72年提出的比例風(fēng)險(xiǎn)模型為此做出了劃時(shí)代的奉獻(xiàn)?,F(xiàn)在,生存分析方法的在醫(yī)學(xué)領(lǐng)域得到了廣泛的應(yīng)用,而通過醫(yī)學(xué)研究要求的不斷提高?!渡娣治鲋v》教學(xué)課件6四主要研究內(nèi)容
描述生存過程比較生存時(shí)間分析影響生存時(shí)間的因素四主要研究內(nèi)容7五根本方法1非參數(shù)法:不考慮資料的分布形式,只根據(jù)樣本提供的順序統(tǒng)計(jì)量對(duì)生存率進(jìn)展估計(jì),常用有K-M法、Lifetable法2參數(shù)法:假定生存時(shí)間服從特定的參數(shù)分布,根據(jù)已知分布特點(diǎn)對(duì)影響生存時(shí)間的因素進(jìn)展分析,常用有:指數(shù)分布法、對(duì)數(shù)正態(tài)回歸分析法3半?yún)?shù)法:兼有參數(shù)法和非參數(shù)法的特點(diǎn),分析影響生存時(shí)間和生存率的因素,常用有Cox比例風(fēng)險(xiǎn)回歸模型五根本方法8第二節(jié)生存時(shí)間資料的特點(diǎn)及描述《生存分析講》教學(xué)課件9一、起始事件與失效事件
起始事件:研究對(duì)象生存過程的起始特征事件失效事件(終點(diǎn)事件、死亡事件):研究者關(guān)心的特定結(jié)局相對(duì)而言的,都由研究目的決定,失效事件并非一定死亡,死亡也并非一定發(fā)生了失效事件。分析的基石一、起始事件與失效事件10二、生存時(shí)間〔survivaltime〕任何兩個(gè)有聯(lián)系事件之間的時(shí)間間隔,用t表示狹義:發(fā)病至死亡的時(shí)間跨度廣義:起始事件到終點(diǎn)事件的時(shí)間間隔起始事件終點(diǎn)事件服藥痊愈手術(shù)切除死亡出院復(fù)發(fā)二、生存時(shí)間〔survivaltime〕11三、完全數(shù)據(jù)與刪失數(shù)據(jù)完全數(shù)據(jù):可獲得準(zhǔn)確的生存時(shí)間,所提供信息完全刪失數(shù)據(jù)(截尾值):隨訪中未能觀察到病人的終點(diǎn)事件,右上角加“+〞原因:失訪死于其它疾病觀察完畢時(shí)病人尚存活三、完全數(shù)據(jù)與刪失數(shù)據(jù)12《生存分析講》教學(xué)課件13四、數(shù)據(jù)構(gòu)造生存信息起始時(shí)間終點(diǎn)時(shí)間結(jié)局及原因失訪存活死亡
四、數(shù)據(jù)構(gòu)造14預(yù)后信息一般信息個(gè)人史及既往史臨床資料檢驗(yàn)結(jié)果組織病理分子生物學(xué)影像學(xué)預(yù)后信息一般信息15《生存分析講》教學(xué)課件16與亞飯店
五、資料特點(diǎn)1含截尾數(shù)據(jù)2分布類型復(fù)雜六、資料的根本要求1.終點(diǎn)事件例數(shù)不宜太少2.截尾原因無偏性3.生存時(shí)間盡可能記錄準(zhǔn)確與亞飯店五、資料特點(diǎn)17七、統(tǒng)計(jì)描述指標(biāo)1.死亡率、死亡概率、生存概率2.生存率及其標(biāo)準(zhǔn)誤3.生存曲線4.中位生存時(shí)間及四分位數(shù)間距七、統(tǒng)計(jì)描述指標(biāo)181.死亡率、死亡概率、生存概率(1)死亡率(mortalityrate,deathrate)表示某單位時(shí)間內(nèi)的死亡強(qiáng)度。
年平均人口數(shù)=(年初人口數(shù)+年末人口數(shù))/21.死亡率、死亡概率、生存概率19(2)死亡概率(mortalityprobability)指死于某時(shí)段內(nèi)的可能性大小。
=d/n0
年內(nèi)有刪失,分母用校正人口數(shù):校正人口數(shù)=年初人口數(shù)—?jiǎng)h失例數(shù)/2=n0-c/2(2)死亡概率(mortalityprobabili20(3)生存概率(survivalprobability)指某單位時(shí)段開場時(shí)存活的個(gè)體到該時(shí)段完畢時(shí)仍存活的可能性的大小。
=(n0-d)/n0分子為年末尚存人數(shù),假設(shè)年內(nèi)有刪失,分母用校正人口數(shù)。(3)生存概率(survivalprobabilit2160例肺癌病人,術(shù)后每年死亡10例,無刪失。N=60術(shù)后年內(nèi)年內(nèi)年初年死亡死亡生存(t+1)年年死亡截尾觀察平均率概率概率生存率數(shù)例數(shù)例數(shù)例數(shù)例數(shù)p=1-qtdcn0n=no-d/2m=d/nq=d/n0(n0-d)/n0(n0-d)/N(1)(2)(3)(4)(5)(6)(7)(8)(9)0~1006055.185.167.833.8331~1005045.222.200.800.6672~1004035.286.250.750.5003~1003025.400.333.667.3334~1002015.667.500.500.167注意:死亡率與死亡概率的分子一樣,但分母不同;生存概率與生存率的分子一樣,但分母不同60例肺癌病人,術(shù)后每年死亡10例,無刪失。N=60術(shù)后222.生存率生存率(survivalrate)(累積生存概率cumulativeprobabilityofsurvival)指病人經(jīng)歷t個(gè)單位時(shí)間后仍存活的概率。
生存概率指單個(gè)時(shí)段的概率,生存率指從0~t多個(gè)時(shí)段的積累概率。反映了病人的疾病嚴(yán)重程度、進(jìn)展快慢或兇險(xiǎn)程度等。2.生存率23公式1用于完全數(shù)據(jù)
公式2用于刪失數(shù)據(jù)以及完全數(shù)據(jù)
S(t)=P(T≥tk
)=p1p2…pk公式1用于完全數(shù)據(jù)24《生存分析講》教學(xué)課件253生存曲線〔survivalcurve〕以觀察〔隨訪〕時(shí)間為橫軸,以生存率為縱軸,將各個(gè)時(shí)間點(diǎn)所對(duì)應(yīng)的生存率連接在一起的曲線圖。描述生存過程比較生存過程中位生存期
3生存曲線〔survivalcurve〕26(月〕(月〕274中位生存時(shí)間〔mediansurvivaltime)即生存時(shí)間中位數(shù),表示50%的個(gè)體可存活的時(shí)間(集中趨勢)計(jì)算:圖解法線性內(nèi)插法:找出兩個(gè)生存率S(ti-1)和S(ti),使S(ti-1)>0.5,S(ti)<0.5。
4中位生存時(shí)間〔mediansurvivaltime)28例:t=8,P(X>8)=0.565,t=10,P(X>10)=0.478(8-10):(8-t)=(0.565-0.478):(0.565-0.5),t=9.494(月)
生存率的計(jì)算方法例:t=8,P(X>8)=0.565,t=10,P(29第三節(jié)小樣本生存率的Kaplan-Meier估計(jì)《生存分析講》教學(xué)課件30Kaplan-Meier法(K-M法、乘積極限法)Kaplan-Meier法由Kaplan和Meier于1958年提出,直接用概率乘法定理估計(jì)生存率,故稱乘積極限法〔product-limitmethod〕,是一種非參數(shù)法,適用于小樣本和大樣本。
Kaplan-Meier法(K-M法、乘積極限法)31根本思想:將生存時(shí)間由小到大依次排列,在每個(gè)死亡點(diǎn)上,計(jì)算其期初人數(shù)、死亡人數(shù)、死亡概率、生存概率和生存率。本法只估計(jì)死亡時(shí)點(diǎn)的生存率根本思想:將生存時(shí)間由小到大依次排列,在每個(gè)死亡點(diǎn)上,計(jì)算其32《生存分析講》教學(xué)課件33(a)研究終止在475天(b)研究終止在474天圖12-3乘積極限法生存曲線(階梯形)及其半數(shù)生存期(Md=158天)(a)研究終止在475天34第四節(jié)大樣本生存率的壽命表法估計(jì)《生存分析講》教學(xué)課件35壽命表法(LifeTables)根本原理:是先求出病人在治療后活過n年后再活過下一年的可能性,統(tǒng)計(jì)學(xué)上稱為生存概率,根據(jù)概率論的乘法定律將逐年生存概率相乘即可得出一定年限的生存率。適用于大樣本資料
壽命表法(LifeTables)36《生存分析講》教學(xué)課件37K-M法和Lifetable法比較K-M法和Lifetable法比較38第五節(jié)生存曲線比較的假設(shè)檢驗(yàn)《生存分析講》教學(xué)課件39log-rank檢驗(yàn)〔對(duì)數(shù)秩檢驗(yàn)、時(shí)序檢驗(yàn)〕根本原理:對(duì)每組生存數(shù)據(jù)根據(jù)其在各個(gè)時(shí)刻中尚存活的對(duì)象數(shù)計(jì)算期望死亡數(shù),然后將期望死亡總數(shù)與實(shí)際死亡數(shù)進(jìn)展比較將生存曲線作為整體對(duì)曲線與曲線間的差異進(jìn)展比較,偏重于遠(yuǎn)期療效評(píng)價(jià),屬非參數(shù)檢驗(yàn)log-rank檢驗(yàn)〔對(duì)數(shù)秩檢驗(yàn)、時(shí)序檢驗(yàn)〕40《生存分析講》教學(xué)課件41比較兩組或多組生存曲線,實(shí)為一單因素分析要求各組生存曲線不能穿插,如穿插提示存在混雜因素,應(yīng)采用分層分析方法或多因素方法來校正當(dāng)假設(shè)檢驗(yàn)有統(tǒng)計(jì)意義時(shí),可從以下幾方面來評(píng)價(jià)各組效應(yīng)大?。荷媲€圖目測判斷、中位生存期比較比較兩組或多組生存曲線,實(shí)為一單因素分析42第六節(jié)Cox比例風(fēng)險(xiǎn)回歸模型《生存分析講》教學(xué)課件43一概述簡稱Cox回歸模型,是一種允許資料有“刪失〔或截尾〕〞數(shù)據(jù)存在的,可以同時(shí)分析眾多因素對(duì)生存時(shí)間影響的多變量生存分析方法,是一種半?yún)?shù)方法。一概述44
該模型由英國統(tǒng)計(jì)學(xué)家D.R.Cox于1972年提出,主要用于腫瘤和其它慢性病的預(yù)后分析,也可用于隊(duì)列研究的病因探索。優(yōu)點(diǎn):多因素分析方法不考慮生存時(shí)間分布利用截尾數(shù)據(jù)該模型由英國統(tǒng)計(jì)學(xué)家D.R.Cox于1972年提出,主45二根本形式
h(t,X)—t時(shí)刻風(fēng)險(xiǎn)函數(shù)、風(fēng)險(xiǎn)率或瞬時(shí)死亡率h0(t)—基準(zhǔn)風(fēng)險(xiǎn)函數(shù),即所有協(xié)變量都取0時(shí)t時(shí)刻風(fēng)險(xiǎn)函數(shù)。X1、X2、…、Xp—協(xié)變量、影響因素、預(yù)后因素。β1、β2、…、βp—回歸系數(shù)。
二根本形式46βp:在其它協(xié)變量不變的情況下,協(xié)變量Xp每改變一個(gè)測定單位所引起相當(dāng)危險(xiǎn)度的自然對(duì)數(shù)的改變量RR:相當(dāng)危險(xiǎn)度,兩個(gè)分別具有協(xié)變量Xi與Xj的病人其風(fēng)險(xiǎn)函數(shù)〔危險(xiǎn)度〕之比RR=exp[βj(xi-xj)]βp:在其它協(xié)變量不變的情況下,協(xié)變量Xp每改變一個(gè)測47如協(xié)變量treat的β=-1.617,RRtreat=0.199,表示treat變量水平2與1比較,treat=2的危險(xiǎn)度是treat=1的0.199倍,提示治療方案2優(yōu)于治療方案1。而age的β=0.119,RRage=1.127,說明年齡每增加一歲,死亡的可能性增加1.127倍。如協(xié)變量treat的β=-1.617,RRtreat=048β>0,RR>1,說明變量X增加時(shí),危險(xiǎn)率增加,即X是危險(xiǎn)因素。β<0,RR<1,說明變量X增加時(shí),危險(xiǎn)率下降,即X是保護(hù)因素。β=0,RR=1,說明變量X增加時(shí),危險(xiǎn)率不變,即X是危險(xiǎn)無關(guān)因素。β>0,RR>1,說明變量X增加時(shí),危險(xiǎn)率增加,即X是危險(xiǎn)因49三參數(shù)估計(jì)與假設(shè)檢驗(yàn)①參數(shù)估計(jì)最大似然法②假設(shè)檢驗(yàn)(模型中變量的剔除和引入)似然比檢驗(yàn)得分檢驗(yàn)Wald檢驗(yàn)三參數(shù)估計(jì)與假設(shè)檢驗(yàn)50四因素篩選與最優(yōu)模型的建立因素初步篩選2檢驗(yàn)、log-rank檢驗(yàn)等單變量Cox模型分析〔P=0.10〕直接進(jìn)展逐步Cox模型分析四因素篩選與最優(yōu)模型的建立51最正確模型建立1、Enter 2、Forward:Conditional 3、Forward:LR 4、Forward:Wald 5、Backward:Conditional 6、Backward:LR 7、Backward:Wald最正確模型建立52五檢驗(yàn)水準(zhǔn)檢驗(yàn)水準(zhǔn)包括引入的檢驗(yàn)水準(zhǔn)和剔除的檢驗(yàn)水準(zhǔn)。一般地,剔除α≥引入α初步的、探索性的研究,或變量數(shù)較少時(shí),可取0.10或0.15。設(shè)計(jì)嚴(yán)謹(jǐn)?shù)摹⒆C實(shí)性的研究,或變量數(shù)較多時(shí),可取0.05。
五檢驗(yàn)水準(zhǔn)53六統(tǒng)計(jì)描述1回歸系數(shù)和標(biāo)準(zhǔn)回歸系數(shù)標(biāo)準(zhǔn)回歸系數(shù):觀察值經(jīng)過標(biāo)準(zhǔn)化變換后所求得。相對(duì)值,比較自變量對(duì)模型奉獻(xiàn),反映因素對(duì)生存時(shí)間影響強(qiáng)度2相對(duì)危險(xiǎn)度及可信區(qū)間無序分類變量,轉(zhuǎn)換亞變量分析
六統(tǒng)計(jì)描述543個(gè)體預(yù)后指數(shù)〔PI〕PI=預(yù)后指數(shù)越小,預(yù)后越好;預(yù)后指數(shù)越大,預(yù)后越差。據(jù)PI的大小可將病人分為不同的危險(xiǎn)組,繪制分組的生存曲線,直觀比較各危險(xiǎn)組的生存情況。3個(gè)體預(yù)后指數(shù)〔PI〕55例如:傳統(tǒng)治療方式,淋巴結(jié)轉(zhuǎn)移,PI=2.6929傳統(tǒng)治療方式,淋巴結(jié)無轉(zhuǎn)移,PI=1.7616新治療方式,淋巴結(jié)轉(zhuǎn)移,PI=0.9313新治療方式,淋巴結(jié)無轉(zhuǎn)移,PI=0例如:56七分析結(jié)果〔結(jié)果解釋〕與生存相關(guān)的因素因素作用大小及方向:保護(hù)因素還是危險(xiǎn)因素、相對(duì)危險(xiǎn)度的大小。因素作用大小排序:標(biāo)準(zhǔn)化回歸系數(shù)的絕對(duì)值。七分析結(jié)果〔結(jié)果解釋〕57八結(jié)果報(bào)告
1起始時(shí)間與終止時(shí)間2結(jié)局事件3刪失數(shù)據(jù)的種類與原因4生存率估計(jì)值、置信區(qū)間及其統(tǒng)計(jì)學(xué)方法八結(jié)果報(bào)告585生存率比較的統(tǒng)計(jì)學(xué)方法(如logrank法)及其p值6給出Cox回歸模型,呈現(xiàn)解釋變量與風(fēng)險(xiǎn)之間的聯(lián)系風(fēng)險(xiǎn)比〔hazardratio〕及其置信區(qū)間5生存率比較的統(tǒng)計(jì)學(xué)方法(如logrank法)及59九應(yīng)用范圍
因素分析
具有l(wèi)ogistic回歸模型的所有優(yōu)點(diǎn)同時(shí)考慮生存結(jié)局和生存時(shí)間,可處理截尾數(shù)據(jù)不考慮基準(zhǔn)風(fēng)險(xiǎn)的分布九應(yīng)用范圍60生存預(yù)測強(qiáng)調(diào)設(shè)計(jì)的重要性專業(yè)知識(shí)角度:選擇疾病種類、終點(diǎn)事件、影響因素及結(jié)果的專業(yè)解釋等。統(tǒng)計(jì)學(xué)角度:樣本例數(shù)、因素的賦值、生存時(shí)間準(zhǔn)確、因素篩選方法、結(jié)果的統(tǒng)計(jì)學(xué)解釋等。生存預(yù)測61十本卷須知①應(yīng)用條件除生存資料的根本要求外,還要求因素對(duì)生存時(shí)間的作用不隨時(shí)間變化〔比例風(fēng)險(xiǎn)假定〕。②設(shè)計(jì)階段資料的代表性和可靠性將盡可能的因素都包括在調(diào)查分析中十本卷須知62
篩選變量容易收集費(fèi)用明確規(guī)定生存時(shí)間樣本量為觀察協(xié)變量的5~20倍③模型擬合多元共線性:自變量間不獨(dú)立,相互間有一定線性依存關(guān)系篩選變量容易收集費(fèi)用63④選入模型的變量是統(tǒng)計(jì)學(xué)上的有關(guān)變量,不一定都與生存時(shí)間有因果關(guān)系。其中某些變量可能只是伴隨關(guān)系而已,未選入模型的變量不一定全是無關(guān)變量,要考慮是否模型內(nèi)的某些變量代替了它的作用,或因例數(shù)不夠,或試驗(yàn)中對(duì)該變量進(jìn)展了控制而引起。④選入模型的變量是統(tǒng)計(jì)學(xué)上的有關(guān)變量,不一定都與生存時(shí)64⑤模型擬合優(yōu)度考察:據(jù)預(yù)后指數(shù)PI分組,比較各組基于Cox模型的生存曲線與基于kaplan-Meier法估計(jì)的生存曲線,如兩組曲線吻合較好,說明Cox模型擬合較好。⑥生存率分析:生存曲線不能隨意延長,也不能輕易用于預(yù)測預(yù)報(bào),經(jīng)過大量研究所得的生存曲線才有可能推廣應(yīng)用?!渡娣治鲋v》教學(xué)課件65十一常見問題1生存時(shí)間的計(jì)算和選擇2生存率計(jì)算方法使用不當(dāng)3忽略結(jié)局,采用t檢驗(yàn)、線性回歸分析生存時(shí)間4忽略生存時(shí)間,采用Logistic回歸分析死亡率十一常見問題665采用平均生存時(shí)間表示生存時(shí)間的平均水平6采用常規(guī)t檢驗(yàn)或方差分析進(jìn)展組間生存時(shí)間比較7丟棄截尾數(shù)據(jù),只考慮確切數(shù)據(jù)8將截尾數(shù)據(jù)當(dāng)作確切數(shù)據(jù)處理5采用平均生存時(shí)間表示生存時(shí)間的平均水平67例某研究者追蹤100名癌癥患者,經(jīng)治療后的生存情況,隨訪第1年有30人死亡,隨訪第2年時(shí),有20人死亡,有40人無法聯(lián)系失訪。方法一:去掉截尾數(shù)據(jù)方法二:不去掉截尾數(shù)據(jù)總例數(shù)N=60N=100生存數(shù)生存率生存數(shù)生存率1年3030/60=50%7070/100=70%例某研究者追蹤100名癌癥患者,經(jīng)治療后的生存情況,68第七節(jié)實(shí)例分析《生存分析講》教學(xué)課件691研究設(shè)計(jì)
①目的專業(yè):描述缺血性腦卒中患者病后生存狀況,并分析影響死亡的危險(xiǎn)因素統(tǒng)計(jì)學(xué):
估計(jì):如根據(jù)缺血性腦卒中患者治療后的生存時(shí)間資料,估計(jì)不同時(shí)間的生存率、生存曲線以及中位生存期等。1研究設(shè)計(jì)70比較:對(duì)不同因素對(duì)生存率的影響進(jìn)展比較影響因素分析:目的是為了探索和了解影響生存時(shí)間的因素,如病人的年齡、性別、病程、嚴(yán)重程度等。預(yù)測:具有不同因素水平的個(gè)體生存預(yù)測比較:對(duì)不同因素對(duì)生存率的影響進(jìn)展比較71②方法:回憶性研究③確定起始事件、終點(diǎn)事件、生存時(shí)間起始事件:患者發(fā)病終點(diǎn)事件:因缺血性腦卒中死亡生存時(shí)間:患者發(fā)病至死亡、失訪或最后一次隨訪④確定可能的影響因素、水平以及量化方法②方法:回憶性研究72⑤設(shè)計(jì)調(diào)查表調(diào)查表中應(yīng)包括可能的影響因素觀察起點(diǎn)和終點(diǎn)〔年、月、日〕生存時(shí)間生存結(jié)局⑤設(shè)計(jì)調(diào)查表732搜集資料可能的影響因素:病歷生存時(shí)間及結(jié)局:隨訪3整理資料檢查、核對(duì)原始數(shù)據(jù),包括影響因素、生存時(shí)間和生存結(jié)局,盡量防止缺失值建立數(shù)據(jù)庫2搜集資料744資料分析估計(jì):Kaplan-Meier法比較:log-rank檢驗(yàn)影響因素分析:單因素分析采用單變量Cox回歸模型,采用P<0.1作為有統(tǒng)計(jì)學(xué)意義標(biāo)準(zhǔn)。多因素分析采用Cox回歸模型分析中Forward:LR法預(yù)測:建立預(yù)后指數(shù)4資料分析755結(jié)果5結(jié)果762=9.311,P=0.0022=9.311,P=0.00277《生存分析講》教學(xué)課件78《生存分析講》教學(xué)課件79謝謝!謝謝!80生存分析
SurvivalAnalysis
第四軍醫(yī)大學(xué)西京醫(yī)院神經(jīng)內(nèi)科劉學(xué)東生存分析
SurvivalAnalysis第四軍醫(yī)大學(xué)西81第一節(jié)概述第二節(jié)生存時(shí)間資料的特點(diǎn)第三節(jié)小樣本生存率的Kaplan-Meier估計(jì)第四節(jié)大樣本生存率的壽命表法估計(jì)第五節(jié)生存曲線比較的假設(shè)檢驗(yàn)第六節(jié)Cox比例風(fēng)險(xiǎn)回歸模型第七節(jié)實(shí)例分析第一節(jié)概述82
第一節(jié)概述
83一根本概念生存分析:是將事件的結(jié)果〔終點(diǎn)事件〕和出現(xiàn)這一結(jié)果所經(jīng)歷的時(shí)間結(jié)合起來分析的一種統(tǒng)計(jì)分析方法。二特點(diǎn)含有截尾數(shù)據(jù)生存時(shí)間一般不呈正態(tài)分布一根本概念84三歷史最早可上溯至十九世紀(jì)的死亡壽命表現(xiàn)代的生存分析那么開場于二十世紀(jì)三十年代工業(yè)科學(xué)中的相關(guān)應(yīng)用二次世界大戰(zhàn):武器裝備的可靠性研究,這一研究興趣延續(xù)到戰(zhàn)后。此時(shí)生存分析都集中在參數(shù)模型。三歷史85二十世紀(jì)六七十年代:醫(yī)學(xué)研究中大量臨床試驗(yàn)的出現(xiàn),要求方法學(xué)有新的突破,生存分析研究開場轉(zhuǎn)向非參數(shù)方法。D.R.Cox在72年提出的比例風(fēng)險(xiǎn)模型為此做出了劃時(shí)代的奉獻(xiàn)。現(xiàn)在,生存分析方法的在醫(yī)學(xué)領(lǐng)域得到了廣泛的應(yīng)用,而通過醫(yī)學(xué)研究要求的不斷提高。《生存分析講》教學(xué)課件86四主要研究內(nèi)容
描述生存過程比較生存時(shí)間分析影響生存時(shí)間的因素四主要研究內(nèi)容87五根本方法1非參數(shù)法:不考慮資料的分布形式,只根據(jù)樣本提供的順序統(tǒng)計(jì)量對(duì)生存率進(jìn)展估計(jì),常用有K-M法、Lifetable法2參數(shù)法:假定生存時(shí)間服從特定的參數(shù)分布,根據(jù)已知分布特點(diǎn)對(duì)影響生存時(shí)間的因素進(jìn)展分析,常用有:指數(shù)分布法、對(duì)數(shù)正態(tài)回歸分析法3半?yún)?shù)法:兼有參數(shù)法和非參數(shù)法的特點(diǎn),分析影響生存時(shí)間和生存率的因素,常用有Cox比例風(fēng)險(xiǎn)回歸模型五根本方法88第二節(jié)生存時(shí)間資料的特點(diǎn)及描述《生存分析講》教學(xué)課件89一、起始事件與失效事件
起始事件:研究對(duì)象生存過程的起始特征事件失效事件(終點(diǎn)事件、死亡事件):研究者關(guān)心的特定結(jié)局相對(duì)而言的,都由研究目的決定,失效事件并非一定死亡,死亡也并非一定發(fā)生了失效事件。分析的基石一、起始事件與失效事件90二、生存時(shí)間〔survivaltime〕任何兩個(gè)有聯(lián)系事件之間的時(shí)間間隔,用t表示狹義:發(fā)病至死亡的時(shí)間跨度廣義:起始事件到終點(diǎn)事件的時(shí)間間隔起始事件終點(diǎn)事件服藥痊愈手術(shù)切除死亡出院復(fù)發(fā)二、生存時(shí)間〔survivaltime〕91三、完全數(shù)據(jù)與刪失數(shù)據(jù)完全數(shù)據(jù):可獲得準(zhǔn)確的生存時(shí)間,所提供信息完全刪失數(shù)據(jù)(截尾值):隨訪中未能觀察到病人的終點(diǎn)事件,右上角加“+〞原因:失訪死于其它疾病觀察完畢時(shí)病人尚存活三、完全數(shù)據(jù)與刪失數(shù)據(jù)92《生存分析講》教學(xué)課件93四、數(shù)據(jù)構(gòu)造生存信息起始時(shí)間終點(diǎn)時(shí)間結(jié)局及原因失訪存活死亡
四、數(shù)據(jù)構(gòu)造94預(yù)后信息一般信息個(gè)人史及既往史臨床資料檢驗(yàn)結(jié)果組織病理分子生物學(xué)影像學(xué)預(yù)后信息一般信息95《生存分析講》教學(xué)課件96與亞飯店
五、資料特點(diǎn)1含截尾數(shù)據(jù)2分布類型復(fù)雜六、資料的根本要求1.終點(diǎn)事件例數(shù)不宜太少2.截尾原因無偏性3.生存時(shí)間盡可能記錄準(zhǔn)確與亞飯店五、資料特點(diǎn)97七、統(tǒng)計(jì)描述指標(biāo)1.死亡率、死亡概率、生存概率2.生存率及其標(biāo)準(zhǔn)誤3.生存曲線4.中位生存時(shí)間及四分位數(shù)間距七、統(tǒng)計(jì)描述指標(biāo)981.死亡率、死亡概率、生存概率(1)死亡率(mortalityrate,deathrate)表示某單位時(shí)間內(nèi)的死亡強(qiáng)度。
年平均人口數(shù)=(年初人口數(shù)+年末人口數(shù))/21.死亡率、死亡概率、生存概率99(2)死亡概率(mortalityprobability)指死于某時(shí)段內(nèi)的可能性大小。
=d/n0
年內(nèi)有刪失,分母用校正人口數(shù):校正人口數(shù)=年初人口數(shù)—?jiǎng)h失例數(shù)/2=n0-c/2(2)死亡概率(mortalityprobabili100(3)生存概率(survivalprobability)指某單位時(shí)段開場時(shí)存活的個(gè)體到該時(shí)段完畢時(shí)仍存活的可能性的大小。
=(n0-d)/n0分子為年末尚存人數(shù),假設(shè)年內(nèi)有刪失,分母用校正人口數(shù)。(3)生存概率(survivalprobabilit10160例肺癌病人,術(shù)后每年死亡10例,無刪失。N=60術(shù)后年內(nèi)年內(nèi)年初年死亡死亡生存(t+1)年年死亡截尾觀察平均率概率概率生存率數(shù)例數(shù)例數(shù)例數(shù)例數(shù)p=1-qtdcn0n=no-d/2m=d/nq=d/n0(n0-d)/n0(n0-d)/N(1)(2)(3)(4)(5)(6)(7)(8)(9)0~1006055.185.167.833.8331~1005045.222.200.800.6672~1004035.286.250.750.5003~1003025.400.333.667.3334~1002015.667.500.500.167注意:死亡率與死亡概率的分子一樣,但分母不同;生存概率與生存率的分子一樣,但分母不同60例肺癌病人,術(shù)后每年死亡10例,無刪失。N=60術(shù)后1022.生存率生存率(survivalrate)(累積生存概率cumulativeprobabilityofsurvival)指病人經(jīng)歷t個(gè)單位時(shí)間后仍存活的概率。
生存概率指單個(gè)時(shí)段的概率,生存率指從0~t多個(gè)時(shí)段的積累概率。反映了病人的疾病嚴(yán)重程度、進(jìn)展快慢或兇險(xiǎn)程度等。2.生存率103公式1用于完全數(shù)據(jù)
公式2用于刪失數(shù)據(jù)以及完全數(shù)據(jù)
S(t)=P(T≥tk
)=p1p2…pk公式1用于完全數(shù)據(jù)104《生存分析講》教學(xué)課件1053生存曲線〔survivalcurve〕以觀察〔隨訪〕時(shí)間為橫軸,以生存率為縱軸,將各個(gè)時(shí)間點(diǎn)所對(duì)應(yīng)的生存率連接在一起的曲線圖。描述生存過程比較生存過程中位生存期
3生存曲線〔survivalcurve〕106(月〕(月〕1074中位生存時(shí)間〔mediansurvivaltime)即生存時(shí)間中位數(shù),表示50%的個(gè)體可存活的時(shí)間(集中趨勢)計(jì)算:圖解法線性內(nèi)插法:找出兩個(gè)生存率S(ti-1)和S(ti),使S(ti-1)>0.5,S(ti)<0.5。
4中位生存時(shí)間〔mediansurvivaltime)108例:t=8,P(X>8)=0.565,t=10,P(X>10)=0.478(8-10):(8-t)=(0.565-0.478):(0.565-0.5),t=9.494(月)
生存率的計(jì)算方法例:t=8,P(X>8)=0.565,t=10,P(109第三節(jié)小樣本生存率的Kaplan-Meier估計(jì)《生存分析講》教學(xué)課件110Kaplan-Meier法(K-M法、乘積極限法)Kaplan-Meier法由Kaplan和Meier于1958年提出,直接用概率乘法定理估計(jì)生存率,故稱乘積極限法〔product-limitmethod〕,是一種非參數(shù)法,適用于小樣本和大樣本。
Kaplan-Meier法(K-M法、乘積極限法)111根本思想:將生存時(shí)間由小到大依次排列,在每個(gè)死亡點(diǎn)上,計(jì)算其期初人數(shù)、死亡人數(shù)、死亡概率、生存概率和生存率。本法只估計(jì)死亡時(shí)點(diǎn)的生存率根本思想:將生存時(shí)間由小到大依次排列,在每個(gè)死亡點(diǎn)上,計(jì)算其112《生存分析講》教學(xué)課件113(a)研究終止在475天(b)研究終止在474天圖12-3乘積極限法生存曲線(階梯形)及其半數(shù)生存期(Md=158天)(a)研究終止在475天114第四節(jié)大樣本生存率的壽命表法估計(jì)《生存分析講》教學(xué)課件115壽命表法(LifeTables)根本原理:是先求出病人在治療后活過n年后再活過下一年的可能性,統(tǒng)計(jì)學(xué)上稱為生存概率,根據(jù)概率論的乘法定律將逐年生存概率相乘即可得出一定年限的生存率。適用于大樣本資料
壽命表法(LifeTables)116《生存分析講》教學(xué)課件117K-M法和Lifetable法比較K-M法和Lifetable法比較118第五節(jié)生存曲線比較的假設(shè)檢驗(yàn)《生存分析講》教學(xué)課件119log-rank檢驗(yàn)〔對(duì)數(shù)秩檢驗(yàn)、時(shí)序檢驗(yàn)〕根本原理:對(duì)每組生存數(shù)據(jù)根據(jù)其在各個(gè)時(shí)刻中尚存活的對(duì)象數(shù)計(jì)算期望死亡數(shù),然后將期望死亡總數(shù)與實(shí)際死亡數(shù)進(jìn)展比較將生存曲線作為整體對(duì)曲線與曲線間的差異進(jìn)展比較,偏重于遠(yuǎn)期療效評(píng)價(jià),屬非參數(shù)檢驗(yàn)log-rank檢驗(yàn)〔對(duì)數(shù)秩檢驗(yàn)、時(shí)序檢驗(yàn)〕120《生存分析講》教學(xué)課件121比較兩組或多組生存曲線,實(shí)為一單因素分析要求各組生存曲線不能穿插,如穿插提示存在混雜因素,應(yīng)采用分層分析方法或多因素方法來校正當(dāng)假設(shè)檢驗(yàn)有統(tǒng)計(jì)意義時(shí),可從以下幾方面來評(píng)價(jià)各組效應(yīng)大小:生存曲線圖目測判斷、中位生存期比較比較兩組或多組生存曲線,實(shí)為一單因素分析122第六節(jié)Cox比例風(fēng)險(xiǎn)回歸模型《生存分析講》教學(xué)課件123一概述簡稱Cox回歸模型,是一種允許資料有“刪失〔或截尾〕〞數(shù)據(jù)存在的,可以同時(shí)分析眾多因素對(duì)生存時(shí)間影響的多變量生存分析方法,是一種半?yún)?shù)方法。一概述124
該模型由英國統(tǒng)計(jì)學(xué)家D.R.Cox于1972年提出,主要用于腫瘤和其它慢性病的預(yù)后分析,也可用于隊(duì)列研究的病因探索。優(yōu)點(diǎn):多因素分析方法不考慮生存時(shí)間分布利用截尾數(shù)據(jù)該模型由英國統(tǒng)計(jì)學(xué)家D.R.Cox于1972年提出,主125二根本形式
h(t,X)—t時(shí)刻風(fēng)險(xiǎn)函數(shù)、風(fēng)險(xiǎn)率或瞬時(shí)死亡率h0(t)—基準(zhǔn)風(fēng)險(xiǎn)函數(shù),即所有協(xié)變量都取0時(shí)t時(shí)刻風(fēng)險(xiǎn)函數(shù)。X1、X2、…、Xp—協(xié)變量、影響因素、預(yù)后因素。β1、β2、…、βp—回歸系數(shù)。
二根本形式126βp:在其它協(xié)變量不變的情況下,協(xié)變量Xp每改變一個(gè)測定單位所引起相當(dāng)危險(xiǎn)度的自然對(duì)數(shù)的改變量RR:相當(dāng)危險(xiǎn)度,兩個(gè)分別具有協(xié)變量Xi與Xj的病人其風(fēng)險(xiǎn)函數(shù)〔危險(xiǎn)度〕之比RR=exp[βj(xi-xj)]βp:在其它協(xié)變量不變的情況下,協(xié)變量Xp每改變一個(gè)測127如協(xié)變量treat的β=-1.617,RRtreat=0.199,表示treat變量水平2與1比較,treat=2的危險(xiǎn)度是treat=1的0.199倍,提示治療方案2優(yōu)于治療方案1。而age的β=0.119,RRage=1.127,說明年齡每增加一歲,死亡的可能性增加1.127倍。如協(xié)變量treat的β=-1.617,RRtreat=0128β>0,RR>1,說明變量X增加時(shí),危險(xiǎn)率增加,即X是危險(xiǎn)因素。β<0,RR<1,說明變量X增加時(shí),危險(xiǎn)率下降,即X是保護(hù)因素。β=0,RR=1,說明變量X增加時(shí),危險(xiǎn)率不變,即X是危險(xiǎn)無關(guān)因素。β>0,RR>1,說明變量X增加時(shí),危險(xiǎn)率增加,即X是危險(xiǎn)因129三參數(shù)估計(jì)與假設(shè)檢驗(yàn)①參數(shù)估計(jì)最大似然法②假設(shè)檢驗(yàn)(模型中變量的剔除和引入)似然比檢驗(yàn)得分檢驗(yàn)Wald檢驗(yàn)三參數(shù)估計(jì)與假設(shè)檢驗(yàn)130四因素篩選與最優(yōu)模型的建立因素初步篩選2檢驗(yàn)、log-rank檢驗(yàn)等單變量Cox模型分析〔P=0.10〕直接進(jìn)展逐步Cox模型分析四因素篩選與最優(yōu)模型的建立131最正確模型建立1、Enter 2、Forward:Conditional 3、Forward:LR 4、Forward:Wald 5、Backward:Conditional 6、Backward:LR 7、Backward:Wald最正確模型建立132五檢驗(yàn)水準(zhǔn)檢驗(yàn)水準(zhǔn)包括引入的檢驗(yàn)水準(zhǔn)和剔除的檢驗(yàn)水準(zhǔn)。一般地,剔除α≥引入α初步的、探索性的研究,或變量數(shù)較少時(shí),可取0.10或0.15。設(shè)計(jì)嚴(yán)謹(jǐn)?shù)?、證實(shí)性的研究,或變量數(shù)較多時(shí),可取0.05。
五檢驗(yàn)水準(zhǔn)133六統(tǒng)計(jì)描述1回歸系數(shù)和標(biāo)準(zhǔn)回歸系數(shù)標(biāo)準(zhǔn)回歸系數(shù):觀察值經(jīng)過標(biāo)準(zhǔn)化變換后所求得。相對(duì)值,比較自變量對(duì)模型奉獻(xiàn),反映因素對(duì)生存時(shí)間影響強(qiáng)度2相對(duì)危險(xiǎn)度及可信區(qū)間無序分類變量,轉(zhuǎn)換亞變量分析
六統(tǒng)計(jì)描述1343個(gè)體預(yù)后指數(shù)〔PI〕PI=預(yù)后指數(shù)越小,預(yù)后越好;預(yù)后指數(shù)越大,預(yù)后越差。據(jù)PI的大小可將病人分為不同的危險(xiǎn)組,繪制分組的生存曲線,直觀比較各危險(xiǎn)組的生存情況。3個(gè)體預(yù)后指數(shù)〔PI〕135例如:傳統(tǒng)治療方式,淋巴結(jié)轉(zhuǎn)移,PI=2.6929傳統(tǒng)治療方式,淋巴結(jié)無轉(zhuǎn)移,PI=1.7616新治療方式,淋巴結(jié)轉(zhuǎn)移,PI=0.9313新治療方式,淋巴結(jié)無轉(zhuǎn)移,PI=0例如:136七分析結(jié)果〔結(jié)果解釋〕與生存相關(guān)的因素因素作用大小及方向:保護(hù)因素還是危險(xiǎn)因素、相對(duì)危險(xiǎn)度的大小。因素作用大小排序:標(biāo)準(zhǔn)化回歸系數(shù)的絕對(duì)值。七分析結(jié)果〔結(jié)果解釋〕137八結(jié)果報(bào)告
1起始時(shí)間與終止時(shí)間2結(jié)局事件3刪失數(shù)據(jù)的種類與原因4生存率估計(jì)值、置信區(qū)間及其統(tǒng)計(jì)學(xué)方法八結(jié)果報(bào)告1385生存率比較的統(tǒng)計(jì)學(xué)方法(如logrank法)及其p值6給出Cox回歸模型,呈現(xiàn)解釋變量與風(fēng)險(xiǎn)之間的聯(lián)系風(fēng)險(xiǎn)比〔hazardratio〕及其置信區(qū)間5生存率比較的統(tǒng)計(jì)學(xué)方法(如logrank法)及139九應(yīng)用范圍
因素分析
具有l(wèi)ogistic回歸模型的所有優(yōu)點(diǎn)同時(shí)考慮生存結(jié)局和生存時(shí)間,可處理截尾數(shù)據(jù)不考慮基準(zhǔn)風(fēng)險(xiǎn)的分布九應(yīng)用范圍140生存預(yù)測強(qiáng)調(diào)設(shè)計(jì)的重要性專業(yè)知識(shí)角度:選擇疾病種類、終點(diǎn)事件、影響因素及結(jié)果的專業(yè)解釋等。統(tǒng)計(jì)學(xué)角度:樣本例數(shù)、因素的賦值、生存時(shí)間準(zhǔn)確、因素篩選方法、結(jié)果的統(tǒng)計(jì)學(xué)解釋等。生存預(yù)測141十本卷須知①應(yīng)用條件除生存資料的根本要求外,還要求因素對(duì)生存時(shí)間的作用不隨時(shí)間變化〔比例風(fēng)險(xiǎn)假定〕。②設(shè)計(jì)階段資料的代表性和可靠性將盡可能的因素都包括在調(diào)查分析中十本卷須知142
篩選變量容易收集費(fèi)用明確規(guī)定生存時(shí)間樣本量為觀察協(xié)變量的5~20倍③模型擬合
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 物流設(shè)備安全升級(jí)企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力項(xiàng)目商業(yè)計(jì)劃書
- 高端護(hù)膚論壇與研討會(huì)行業(yè)深度調(diào)研及發(fā)展項(xiàng)目商業(yè)計(jì)劃書
- 耐化學(xué)品腐蝕PVDF樹脂行業(yè)深度調(diào)研及發(fā)展項(xiàng)目商業(yè)計(jì)劃書
- 全麥饅頭專賣店企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力項(xiàng)目商業(yè)計(jì)劃書
- 傳統(tǒng)中醫(yī)草藥園游覽與采摘企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力項(xiàng)目商業(yè)計(jì)劃書
- 浙江省金華市卓越聯(lián)盟2024-2025學(xué)年高二下學(xué)期5月階段性聯(lián)考信息技術(shù)試卷(PDF版含答案)
- 醫(yī)療與醫(yī)藥行業(yè):醫(yī)藥企業(yè)知識(shí)產(chǎn)權(quán)戰(zhàn)略布局與風(fēng)險(xiǎn)管理
- 家具制造業(yè)個(gè)性化定制生產(chǎn)模式下的定制家具產(chǎn)品市場推廣策略研究報(bào)告
- 版語文二年級(jí)上冊(cè)6《書里的螞蟻》練習(xí)卷
- 干式變壓器項(xiàng)目可行性研究報(bào)告申請(qǐng)報(bào)告
- 關(guān)于Photoshop圖像處理的試題及答案分享
- DBJ41-T311-2025 《人民防空節(jié)鎳型不銹鋼防護(hù)設(shè)備選用與安裝技術(shù)標(biāo)準(zhǔn)》
- 2025-2030年中國軍用機(jī)器人行業(yè)市場現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025高考化學(xué)復(fù)習(xí)新題速遞之有機(jī)合成(解答大題)(2025年4月)
- 2024年佛山市三水樂投控股有限公司招聘考試真題
- 新聞閱讀-2024年中考語文記敘文閱讀專項(xiàng)復(fù)習(xí)(原卷版)
- 2025-2030年電石項(xiàng)目投資價(jià)值分析報(bào)告
- 2025江蘇中天鋼鐵集團(tuán)有限公司產(chǎn)品采購銷售合同
- 《演講與表達(dá)技巧》課件
- 2025年四川省成都市成華區(qū)中考二診英語試題(原卷版+解析版)
- 國家開放大學(xué)《Web開發(fā)基礎(chǔ)》形考任務(wù)實(shí)驗(yàn)1-5參考答案
評(píng)論
0/150
提交評(píng)論