




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第19章 生存分析衛(wèi)生統(tǒng)計學第7版衛(wèi)生統(tǒng)計教研室 1主要內容 第一節(jié) 生存資料的基本概念 第二節(jié) 生存率的估計 第三節(jié) 生存曲線的比較 第四節(jié) Cox 回歸2第一節(jié) 生存分析的概念生存分析(survival analysis):是將事件的結果和出現這一結果經歷的時間結合起來分析的一種統(tǒng)計分析方法.3藥物 A:治愈率 80%治療開始治療結束藥物B:治愈率 80%生存分析有兩個反應變量:事件發(fā)生 時間經歷長度tAtB如果 tA=tB,何者最優(yōu)?如果 tAtB,何者最優(yōu)?治療結束治療開始一、生存時間事件(失敗): 死亡, 發(fā)病, 疾病復發(fā), 康復,時間的測量單位: 年,月,周或天,等41. 生存時間
2、資料的結構(1). 記錄: 開始時間, 結束時間, 結局, 協變量表19-2 6例膀胱腫瘤患者生存資料原始記錄表序號年齡分級大小復發(fā)手術日期終止日期生存時間結局idagegradesizerelapsestartendtstatus16210002/10/199612/30/200059 0(存活)26410003/05/199608/12/200054 1(死亡)35220004/09/199612/03/1999440(失訪)46010006/06/199610/27/200053 0(死于其他)55921007/20/199606/21/199823 1(死亡)65911108/19/1
3、99609/10/1999371(死亡)協變量:性別,年齡等;時間記錄: 手術日期,截止日期,生存時間=截止日期手術日期結局: 死亡,存活,失訪(觀察截止,死于他病,遷居,)52、 生存時間(完全數據、截尾數據)生存時間(survival time):是指觀察到的存活時間。完全數據(complete data):指從起點至死亡所經歷的時間,即死者的存活時間截尾數據(censored data):由于失訪、改變防治方案、研究工作結束時事件尚未發(fā)生等情況,使部分病人不能隨訪到底,稱為截尾。從起點到截尾點所經歷的時間,稱為截尾數據。6(1)完全時間:精確知道生存時間跨度。 t=11 (月), 37
4、(月)(2)截尾時間:僅知道部分生存時間,但不知道精確的生存時間跨度,t+=10+ (月), 25+ (月), 9+(月)。開始截尾t+X事件發(fā)生t日歷時間(年、月、日)789101112130.01.02.03.04.05.06.07.0No. 1 2 3 4 5+03060901201501800.01.02.03.04.05.06.07.0No. 5 4 1 2 33396158+整理后的生存時間(天)73、生存時間資料的特點:兩個反應變量:生存時間變量t,結局變量Y.(2) 有截尾數據。(3) 分布:生存時間的分布往往為非正態(tài)分布。8二、死亡概率、生存概率死亡概率(mortality
5、probability):記為q,是指死于某時段內的可能性大小。生存概率(survival probability):記為p,表示某單位時段開始時存活的個體到該時段結束時仍存活的機會大小。9三、生存率生存率(survival rate):S(ti)是指病人經歷ti個單位時間之后仍存活的概率。10生存率估計的概率乘法原理:假定病人在各個時段生存的事件獨立,生存概率為P,則應用概率乘法得生存率估計的公式為:11第二節(jié) 生存曲線估計對于生存曲線的估計,我們介紹常用的2種方法:1壽命表法(Life-Table Method,簡稱LT法) 有時,收集到的資料是按生存時間分組的頻數分布資料,由于每一例觀察
6、對象的生存時間不是確切時間點的觀察資料,故只能通過生存時間區(qū)間ti-1,ti內的死亡和截尾的觀察例數來估計該區(qū)間上的死亡概率,然后用該區(qū)間及其之前各區(qū)間上的生存概率之積來估計S(ti)。當樣本量較大或者無法準確得知研究結果出現的時間時,可以將各研究對象的生存時間按某個時間段(年、月等)進行分組計算其生存率。122Kaplan-meier法,又稱乘積極限法(Product-Limit Method,簡稱PL法),由Kaplan-Meier在1958年提出,適用于樣本量較小,難以將生存時間按組段劃分,此時是利用tk時刻之前各時點上生存概率的乘積來估計在時刻tk的生存率,不需要對被估計的資料分布作任
7、何假設。13例19-1 374名食管癌患者隨訪資料,取時間均為期1年,整理結果見19-3表,計算生存率?14序號i確診后年數ti期內死亡數di期內刪失數ci期初病例數ni期初有效例數ni死亡概率qi生存概率pi生存率S(ti) 生存率標準誤SE(S(ti) (1)(2)(3)(4)(5)(6)(7)(8)(9)(10)109003743740.24060.75940.75940.0221217602842840.26760.73240.55620.025732 5102082080.24520.75480.41980.025543 25121571510.16560.83440.35030.0
8、24854 205120117.50.17020.82980.29370.023965 799590.50.07730.92270.26820.023576 497974.50.05370.94630.25380.023387 136664.50.01550.98450.24990.023398 356259.50.05040.94960.23730.023210910255451.50.03880.96120.22810.0232表19-3 壽命表法估計生存率計算表151、計算各組段期初觀察例數 ni公式:ni= ni- ci/22、計算各時間區(qū)間上的死亡概率qi和生存概率pi公式: qi=
9、 di/ ni3、計算生存率壽命表法步驟:16圖21-2 某惡性腫瘤生存曲線(壽命表法)172、Kaplan-meier法例19-2 14例膀胱腫瘤小于3.0cm患者和16例膀胱腫瘤大于或等于3.0cm患者的生存時間(月)如下,試估計兩組生存率。 3.0cm 14 19 26 28 29 32 36 40 42 44 45 53+ 54 59+ 3.0cm 6 7 9 10 11 12 13 20 23 25 27 30 34 37 43 50 18(1)將所有生存時間按從小到大排列(ti),刪失數據在完全數據后面。(2)將各期內死亡例數(di)和截尾例數(ci)分別寫在第(3),(4)列。(
10、3)列出各期初暴露病例數(ni),它是指在t時刻前仍存活的病例數。(4)計算各期的死亡概率qi, qi=di/ni,截尾數不計入同期的分母,結果見第(6)列。(5)計算各期的生存概率pi, pi=1-qi結果見第(7)列。(6)計算各ti時刻的生存率S(ti)。計算ti時刻生存率時可以用小于和等于ti時刻的各時點生存概率的乘積得到。 19序號i時間(月)ti死亡數di刪失數ci期初病例數ni死亡概率qi生存概率pi生存率S(ti) 生存率標準誤SE(S(ti) (1)(2)(3)(4)(5)(6)(7)(8)(9)11410140.07140.92860.92860.068821910130.
11、07690.92310.85720.093532610120.08330.91670.78580.109742810110.09090.90910.71440.120752910100.10000.90000.64290.12816321090.11110.88890.5715012500.87500.5001014290.85710.4286016670.83330.35710.12811044+0150.00001.00000.35710.128111451040.25000.75000.26780.123312
12、53+0130.00001.00000.26780.123313541020.50000.50000.13390.11301459+0110.00001.00000.13390.113020圖21-3小于3.0cm和大于或等于3.0cm患者的生存曲線( Kaplan-meier)3621中位生存時間 (t50%): t50%t(S(t)=0.5)又稱半數生存期,表示恰有50%的個體尚存活的時間。t(S(t)= 0.5001) =36(月), t(S(t)= 0.4286) =40(月),t50%用線形內插法計算。同理,用線形內插法可以計算任意生存概率下的生存時間。如t25%,t75%。22三、
13、 生存概率的區(qū)間估計(1) 生存率的標準誤: 計算結果見表19-4中最后一列。(2) 生存率 的100(1-)% CI23 的95% CI :(3)生存率經對數變換函數 的標準誤:生存率的95% CI:24第三節(jié) 生存曲線的比較 Log-rank test log-rank檢驗是比較生存曲線的非參數方法之一, 其基本思想:當H0成立時,根據ti時點的死亡率,可計算出ti時點上各組的理論死亡數;將所有時點各組的理論死亡數累加,便得到各組的理論死亡總數Tg;將Tg和各組的實際死亡總數Ag比較,就形成Log-rank檢驗的X2統(tǒng)計量。25序號時間(月)腫瘤 3.0cm 腫瘤 3.0cm 合計i(1)
14、ti(2)n1i(3)d1i(4)T1i(5)n2i(6)d2i(7)T2i(8)ni(9)di(10)161400.46671610.5333301271400.48271510.5172291391400.50001410.5000281合計_1117.5416_169.4584_27例19-3 表19-5 腫瘤 3.0cm和腫瘤 3.0cm患者 生存曲線比較的log-rank檢驗計算表26建立檢驗假設, 確定檢驗水準: H0 : S1=S2 H1: S1S2 =0.05/2, (two sided) 2. 選擇檢驗方法,計算統(tǒng)計量: 2-test, 計算2值。27組別死亡數未死亡數合計腫
15、瘤 Chi-SquareLog-Rank7.369310.0066Wilcoxon7.630510.0057-2Log(LR)3.780210.05193、結論29二、應用及其注意事項1、本法也適用于壽命表資料及多組比較2、實際死亡總數A與理論死亡總數T之比稱為相對死亡比,R=A/T,則相對危險度(RR)估計值為兩組相對死亡比之比。腫瘤1, 使風險增加。 如果j為-, RR(j)=exp(j)1, 使風險減少。3、參數解釋364、參數估計與假設檢驗RR的95%可信區(qū)間:標準化回歸系數:總體假設檢驗:似然比檢驗和Wald檢驗回歸系數的檢驗: Wald檢驗37篩選方法: (1) forward s
16、election (2) Backward elimination (3) Stepwise selection篩選標準:似然比統(tǒng)計量(Likelihood ratio) G = -2lnL (-2lnL) =2(lnL lnL)5、篩選因素的方法和標準-2lnL 及-2lnL為分別包含不同自變量個數的似然函數。模型中包含的自變量個數越多,自變量的效應越強,則lnL 值越小。差值G越大。G服從2 分布,自由度:=兩個模型中的自變量個數之差。38idagegradesizerelapsestartend tstatusPIS(ti)(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(
17、11)16210002/30/199612/30/20005901.6800.25626410003/05/199608/12/20005411.6800.25635220104/09/199612/03/19994404.3390.01846011006/06/199610/27/20005301.6800.51255921007/20/199606/21/19982314.4380.66265911108/19/199609/10/19993713.7370.24976310009/16/199610/20/20005012.758020/199609/18/19
18、993611.6800.859305431103/10/200009/20/2000617.0970.879例19-4 表19-7 30例膀胱腫瘤患者生存資料原始記錄表39Analysis of Maximum Likelihood EstimatesVariableDFbSbChi-SquarepRRRR95% CIgrade11.680270.3816419.3839.00015.3672.54011.339size11.078090.460045.49190.01912.9391.1937.241relapse10.978920.460234.52430.03342.6621.0806.560表21-8 30例膀胱腫瘤患者多變量Cox 回歸分析結果(逐步引入-剔除法)40求個體t時刻的生存率:41三、關于Cox 比例風險模型的假定HR=h(t)/h0(t):與時間無關,在任何時間上的風險比例保持恒定。h
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 零星維修服務協議
- 湖南省長沙市開福區(qū)2024-2025學年八年級上學期期末生物學試題(含答案)
- 英語學習情境創(chuàng)設與運用課程設計
- 醫(yī)療健康技術發(fā)展動態(tài)表
- 《世界著名音樂作品欣賞與解析教案》
- 教育資源投入與使用效果對比分析表
- 非謂語動詞在各類時態(tài)中的用法解析:高一英語教學教案
- 個人健康管理大數據分析與服務平臺建設方案
- 營銷總監(jiān)聘用協議
- 數字校園采購協議
- 《馬克思主義政治經濟學概論》課程教學大綱
- 倉庫管理基礎知識培訓模板課件
- 孤獨癥康復教育人員上崗培訓練習題庫及答案
- 環(huán)境心理學課件
- 《質量保證體系》情況說明
- 親人意外逝世的訃告微信群通知五篇-正式的去世訃告模板
- DB62∕T 4134-2020 高速公路服務區(qū)設計規(guī)范
- 中電朝陽250兆瓦智慧風儲一體化風電項目環(huán)評報告書
- 做一個幸福教師
- 國家自然科學基金申請標書模板
- 車間斷針記錄表
評論
0/150
提交評論