第二十章生存分析實習指導要點_第1頁
第二十章生存分析實習指導要點_第2頁
第二十章生存分析實習指導要點_第3頁
第二十章生存分析實習指導要點_第4頁
第二十章生存分析實習指導要點_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第二十章 生存分析 教學要求 了解:了解生存資料的特點和 Cox 模型的概念及應用。 熟悉: 理解中位生存期的概念、生存曲線的特點及解釋。 掌握: 單因素生存曲線的 K-M 方法和中位生存期的計算;單因素生存曲線比較 的 log-rank 檢驗及適用條件; Cox 模型回歸系數(shù)與 RR 的關系及模型適用條件。 重點難點 第一節(jié) 生存資料的特點生存時間往往不服從正態(tài)分布, 且資料收集過程中會出現(xiàn)刪失值的問題, 故 需要一些特殊的統(tǒng)計分析方法。一、起始事件與終點事件終點事件(outcome eve nt)又稱失效事件(failure eve nt),它是指研究者所關 心的特定結局, 而起始事件是反

2、映研究對象生存過程的起始特征的事件。 這兩者 是相對而言的, 它們都由研究目的決定, 必須在設計時就明確規(guī)定, 并在研究期 間嚴格遵守而不能隨意改變。二、生存時間生存時間(survival time)也稱失效時間(failure time),它定義為終點事件 與起始事件之間的時間間隔,常用符號 t 表示。三、刪失值基本概念: 在隨訪研究中, 由于某種原因未能明確地觀察到隨訪對象發(fā)生事 先定義的終點事件,無法得知隨訪對象的確切生存時間,這種現(xiàn)象稱為刪失 (cen sori ng)或終檢,包含刪失的數(shù)據(jù)稱不完全數(shù)據(jù)(in complete data)。本章著重討 論右刪失(right censor

3、ing),即從時間軸上看,終點事件發(fā)生在最后一次隨訪觀察 時刻的右方。 雖然刪失數(shù)據(jù)的信息可以利用, 但過多的刪失很可能會帶來分析結 果的偏倚。產(chǎn)生右刪失的原因: 1隨訪對象失訪或中途退出 (withdraw)。 2隨訪結束如數(shù)據(jù)中無刪失,生存率可用下式計算:t時刻仍存活的觀察例數(shù)總觀察例數(shù)時對象仍存活。3 治療措施改變等。第二節(jié)生存率的估計估計生存率有兩種非參數(shù)方法:用于大樣本分組資料的壽命表法(life table method)和本節(jié)介紹的乘積極限法(product-limit method),也稱K-M法,它既 可用于小樣本資料,也可用于大樣本資料。、生存率的點估計如數(shù)據(jù)中有刪失,則需

4、分時段計算不同單位時間的生存概率pi (i=1,2,t),然后利用概率乘法原理將p相乘得到t時刻生存率,即:。二、總體生存率的區(qū)間估計總體生存率的1-置信區(qū)間為:S(tJ _Z”SES(ti),其中生存率的標準誤為:SES(ti) =S(tJ 上一勺一gnj(nj -dj)三、生存曲線及中位生存期生存曲線:將隨訪時間作橫坐標,不同時點生存率作縱坐標繪制生存曲線(survival curve)。隨時間的增加,該曲線一般呈下降趨勢,下降速度快在圖形 上表現(xiàn)為坡度大、曲線陡峭,意味著生存率較低或生存期較短; 下降速度慢在圖 形上表現(xiàn)為坡度小、曲線平緩,意味著生存率較高或生存期較長。中位生存期:中位生

5、存期(median survival time)也稱半數(shù)生存期,表示恰 好有50%個體活過此時間。生存時間通常并不服從正態(tài)分布,故常用中位生存期 作為某個人群生存過程的概括性描述指標。中位生存期越長,表示疾病預后越好; 中位生存期越短,表示疾病預后越差。其數(shù)值可借助生存曲線進行圖表法估計或 用線性內插法求解。第三節(jié)生存曲線的比較應用條件:該法不指定生存時間服從特定的某種分布,屬于非參數(shù)方法。所比較的是單因素設計不同組間整個生存時間的分布,而不是僅僅比較某個特定時 間點的生存率。對比組的生存曲線不應有明顯的交叉。常用于隨機化分組后處理因素的比較,如果有重要的非處理因素在對比組間不均衡或屬于未實施

6、隨機化的 觀察性研究,應考慮后述的多因素分析方法。檢驗統(tǒng)計量:2二(Ak F =2_1。yTk第四節(jié) CoxCox回歸模型形式:h(t,x) nhoWexpCx! -2X2 -pXp),其中為恥,Xp表示研究者認為可能影響死亡率的危險因素,也稱協(xié)變量(covariates),這些變量在隨訪期間的取值不隨時間的變化而變化;t表示生存時間;h(t,x)稱為具有協(xié)變量Xi,x2,,xp的個體在t時刻的風險函數(shù)(hazard function),表示這些個體在t時刻 的瞬時危險率或死亡率;ho(t)稱為基線風險函數(shù)(baseline hazard function,表示 所有X1,X2,,Xp都取值為

7、0時的個體在t時刻的瞬時危險率或死亡率,h(t)不要 求特定的形式,具有非參數(shù)的特點;參數(shù)(i =1,2,川,p)為總體回歸系數(shù),其估 計值b可以根據(jù)樣本計算得出回歸系數(shù)的意義:回歸系數(shù)表示N每增加一個單位時,相對危險度或風險 比(risk ratio)的自然對數(shù)。當回歸系數(shù)大于0時,風險比大于1,相應協(xié)變量的增 加將增大所研究事件發(fā)生的可能性;當回歸系數(shù)小于 0時,風險比小于1,相應 協(xié)變量的增加將減小所研究事件發(fā)生的可能性; 當回歸系數(shù)等于0時,風險比等 于1,相應協(xié)變量與所研究事件的發(fā)生無關。自變量篩選:按照Cox模型的參數(shù)估計原則,當模型中增加自變量時,現(xiàn) 有模型的部分似然函數(shù)值L將增

8、大,而-2ln(L)將減??;在自變量個數(shù)即模型的自 由度一定時,-2ln(L)取值最小的模型較好。需要強調,逐步方法只是一個計算策 略,并不能保證總是得到最好的模型。必要時可以更換篩選變量的方法并調整檢 驗水準,多數(shù)情況下總是出現(xiàn)在方程中的變量可能是有意義的,最終備選的模型定要結合專業(yè)知識來判斷PHPH假定條件:Cox模型中假定風險比h(t,x)/h(t)的大小與時間t無關,稱為比例風險(proportional hazards假設,簡稱PH假設。如果某個協(xié)變量不同水 平的風險函數(shù)曲線有明顯交叉,或者協(xié)變量與時間的交互作用項在模型中有統(tǒng)計 學意義,則不能使用本章介紹的比例風險模型案例討論參考答

9、案案例20-120-1 首先,結果變量的選取應充分考慮專業(yè)上的要求。對于白血病等一 些難以完全治愈的較為兇險的疾患,延長患者的生存時間在臨床上是有現(xiàn)實意義 的,故而結果變量應選取結局(病情是否緩解)以及出現(xiàn)結局的時間(緩解時間)。 這樣,僅以病情是否緩解為結果變量的單因素Fisher精確概率結果以及多因素logistic模型結果就不很恰當。其次,在使用生存分析方法時,應考慮到影響緩 解時間的因素,除了研究者所關心的是否存在不良染色體以外,還有其它影響因素無法通過實施隨機化達到組間非研究因素的均衡性,那么單因素log-rank檢驗 的結果就無法控制非研究因素的影響,所以應該使用多因素Cox回歸分

10、析方法并檢查PH假設條件,得出正確研究結論。電腦實驗及結果解釋實驗20-120-1生存過程的統(tǒng)計描述01DATA surv noce;建立 SAS數(shù)據(jù)集 survnoce ;02seed=20021109;設定隨機數(shù)種子;03DO i=1 TO 100;設立循環(huán),循環(huán)變量i從1增加到100,每次加1 ;04s=UNIFORM(seed);產(chǎn)生均勻分布的隨機數(shù);05t=-LOG(s);產(chǎn)生參數(shù)為1的指數(shù)分布生存時間t ;06cen=1;用指示變量cen表示此數(shù)據(jù)中無刪失;07OUTPUT;將數(shù)據(jù)寫入數(shù)據(jù)集;08END;結束循環(huán);09PROC UNIVARIATE PLOT;調用UNIVARIAT

11、E過程對生存時間進行單變量描H述并打印出分布圖;10VAR t;指疋分析變量為t ;11PROC LIFETEST METHOD=PL;調用LIFETEST過程用乘積限法描述生存過程;12TIME t*CEN(0);指疋時間變量為t,cen=0表示刪失值;13RUN;運行上述語句;行號程序20-1 生存過程的統(tǒng)計描述實驗SAS程序及說明序說 明運行結果:Output 窗口:對生存時間t的UNIVARIATE過程分析結果:The UNIVARIATE ProcedureVariable:MomenttsN100Sum Weights100Mean1.03571168Sum Observation

12、s103.571168Deviation1.09864257Variance1.2070155Skewness1.90814932Kurtosis4.02632453Uncorrected SS226.764403Corrected SS119.494535Coeff Variation106.076101Std Error Mean0.10986426Basic Statistical MeasuresLocationVariabilityMean1.035712Std Deviation1.09864Median0.693335Variance1.20702ModeRange5.62217

13、Interquartile Range1.12603Tests for Location: Mu0=0Test-Statistic-p Value-Students t t9.427194Pr |t|= |M|= |S|80 THEN cen=0;令k80所對應觀測為刪失值,造成隨機刪失;12OUTPUT;將數(shù)據(jù)寫入數(shù)據(jù)集;13END;結束循環(huán);14PROCPROC PHREGPHREG ;調用PHREGPHREG過程進行Cox回歸分析;15MODEL t*CEN(0)=x;指疋Cox模型自變量為x,cen=0表示刪失值;16RUNRUN ;運行上述語句;運行結果:Output窗口: PHRE

14、G過程進行Cox回歸分析結果The PHREG ProcedureModel InformationData SetDependent Variable Censoring Variable Censoring Value(s) Ties HandlingSummary of the Number of Event and Censored ValuesPercentTotalEventCensoredCensored100811919.00Convergence StatusConvergence criterion (GCONV=1E-8) satisfied. Model Fit Sta

15、tisticsWithoutWithCriterionCovariatesCovariates-2 LOG L599.992578.110AIC599.992580.110SBC599.992582.504Testing Global Null Hypothesis: BETA=0TestChi-SquareDFPr ChiSqLikelihood Ratio21.88251.0001Score22.36061.0001Wald21.97261 ChiSqRatioX11.071780.2286521.9726 ChiSqLikelihood Ratio11.320510.0008Score1

16、1.594210.0007Wald11.381410.0007Analysis of Maximum Likelihood EstimatesParameterStandardHazardVariableDFEstimateErrorChi-SquarePr ChiSqRatio設定隨機數(shù)種子;設立循環(huán),循環(huán)變量i從1增加到100,每次加1;08cen=1;用指示變量cen=1表示此數(shù)據(jù)中無刪失;09k=INT(100*RANUNI(seed)+1; ”產(chǎn)生取值1到100之間隨機數(shù)k;10cm=50;設模型中刪失值數(shù)目cm;11IF kcm THEN cen=0;令kcm所對應觀測為刪失值,造

17、成隨機刪失;12OUTPUT;將數(shù)據(jù)寫入數(shù)據(jù)集;13END; |結束循環(huán);14PROCPROC PRINTPRINT ;RUN;調用PRINTPRINT過程在Output窗口輸出數(shù)據(jù)集 Coxlog ;15PROCPROC PHREGPHREG ;調用PHREGPHREG過程進行Cox回歸分析;16MODEL t*CEN(0)=x;指疋Cox模型自變量為x,cen-0表示刪失值;17RUN;beta=1;t=-LOG(s)/2.71828*(beta*x);建立SAS數(shù)據(jù)集coxlog ;LOGISTIC 過程進行 LOGISTIC 回歸分析結果: The LOGISTIC Procedure

18、Data SetResponse Variable Number of Response Levels Number of Observations ModelOptimization TechniqueModel Information WORK.COXLOG cen 2 100 binary logit Fishers scoringResponse Profile OrderedValue12cen01TotalFrequency5644Probability modeled is cen=0.Model Convergence StatusConvergence criterion (

19、GCONV=1E-8) satisfied.Model Fit StatisticsInterceptandCriterionOnlyCovariatesAIC139.186141.177SC141.791146.387-2 Log L137.186137.177InterceptTestChi-SquareDFPr ChiSqLikelihood Ratio0.009110.9241Score0.009110.9241Wald0.009110.9241Testing Global Null Hypothesis: BETA=0StandardWaldParameterDFEstimateEr

20、rorChi-SquarePr ChiSqIntercept10.17290.74370.05410.8161X10.03460.36370.00910.9241Analysis of Maximum Likelihood EstimatesPoint95% WaldEffectEstimateConfidence LimitsX1.0350.507 2.112Odds Ratio EstimatesPercent Concordant44.2Somers D-.002Percent Discordant44.4Gamma-.002Percent Tied11.4Tau-a-.001Pairs

21、2464c0.499Association of Predicted Probabilities and Observed Responsesh(t, x =k)h(t,x =0)_h(t)exp(k :) -h;(tj= exp(k )思考與練習題的參考答案1.線性回歸、logistic回歸和Cox回歸的區(qū)別(假設只有一個自變量X,以下同)線性回歸logistic 回歸Cox回歸結果變量連續(xù)型數(shù)值變量離散型分類變量分類結局變量及數(shù)值時間變量模型類型參數(shù)模型參數(shù)模型半?yún)?shù)模型刪失值處理不能利用不能利用能利用參數(shù)估計方法最小一乘估計極大似然估計極大部分似然估計回歸系數(shù)含義X每變化一個單X每變化一

22、個單位 OR的X每變化一個單位 RR的自然位Y的平均變化自然對數(shù)對數(shù)模型形式Y= -XP _ 1 exp(- -X)h(t,X)二 h(t)expCX)2.假設X取值為k與k 1時的相對危險度分別為RRk與RRk+i,則R“Z=”=exp(k于是,In(R&J -In(RR) =(k I) := 可以看出X的偏回歸系數(shù)表示X每增加一個單位時相對于未增加時的危險 度的自然對數(shù)。當回歸系數(shù)大于0時,相對危險度大于1,相應協(xié)變量的增加將 增大所研究事件發(fā)生的可能性;當回歸系數(shù)小于 0時,相對危險度小于1,相應 協(xié)變量的增加將減小所研究事件發(fā)生的可能性;當回歸系數(shù)等于0時,相對危險度等于1,相應協(xié)變量

23、與所研究事件的發(fā)生無關。3.21例服用6-疏嘌呤白血病患者的生存率計算序號時間(周)死亡數(shù)期初例數(shù)生存概率生存率idiPidj/nS(ti)(1)(2)(3)(4)(5)(6)1632118/21=0.85710.85712+601818/18=1.00000.8571 *0000=0.85713711716/17=0.94120.8571 0.9412=0.806749+01616/16=1.00000.8067 *0000=0.806751011514/15=0.93330.8067 0.9333=0.7529610+01414/14=1.00000.7529 1.0000=0.75297

24、11 +01313/13=1.00000.7529 1.0000=0.752981311211/12=0.91670.7529 0.9167=0.690291611110/11=0.90910.6902 0.9091=0.62751017+01010/10=1.00000.6275 1.0000=0.62751119+099/9=1.00000.6275 1.0000=0.62751220+088/8=1.00000.6275 1.0000=0.62751322176/7=0.85710.6275 0.8571=0.53781423165/6=0.83330.5378 0.8333=0.448

25、11525+055/5=1.00000.4481 0.0000=0.44811632+044/4=1.00000.4481 0.0000=0.44811734+022/2=1.00000.4481 0.0000=0.44811835+011/1=1.00000.4481 0.0000=0.448121例服用安慰劑白血病患者的生存率計算序號時間(周)死亡數(shù)期初例數(shù)生存概率生存率itidiPi-di)/nS(ti)(1)(2)(3)(4)(5)(6)1122119/21=0.90480.90482221917/19=0.89470.9048 0.8947=0.80953311716/17=0.94

26、120.8095 0.9412=0.76194421614/16=0.87500.7619 0.8750=0.66675521412/14=0.85710.6667 0.8571=0.5714684128/12=0.66670.5714 0.6667=0.3810711286/8=0.75000.3810 0.7500=0.2857812264/6=0.66670.2857 0.6667=0.1905915143/4=0.75000.1905 0.7500=03=0.66670.1429 0.6667=0.0952序號時間倜)6-疏嘌呤組安慰劑組合計t|山 d1ic1

27、iTii d2IC2IT2INIDI圖 兩組白血病患者的生存曲線目測其中位生存期分別為:6-疏嘌呤組23周,安慰劑組8周。42例白血病患者兩種療法生存曲線的log-rank檢驗計算表11 22 11/2=0.50000.0952 0.5000=0.0476122310/1=0.00000.0476 0.0000=0.0000 o o 8 8l.l.ol.ol.0.60.6 0.40.4 服用安慰劑組1010ISIS詰4040生存時同(周)(11) (12)1121001.000021201.0000422221001.050019200.9500403321000.552617100.4474

28、384421001.135116200.8649375521001.200014200.8000356621311.909112001.0909337717100.586212000.413829(6)(8)(9)(10)(3)(4)(5)2(9 -19.2505)2(21 -10.7495)219.250510.7495=15.2328,9916010.00008000.0000240101015110.65228000.3478231111113011.23818200.7619212121212001.33336200.6667182131312100.75004000.25001611

29、41511000.73334100.2667151151611100.78573000.2143141161710010.76923100.230813117199010.00002000.000011018208010.00002000.000010019227101.55562100.44449220236101.71431100.28577221255010.00000000.00005022324020.00000000.00004023342010.00000000.00002024351010.00000000.000010合計919.25052110.749530Ho:兩種治療方

30、式白血病患者的總體生存曲線相同Hi:兩種治療方式白血病患者的總體生存曲線不同匚-0.05從表中最后一行合計處得到Ai=9, A2=21,Ti=19.2505, T2=10.7495,將其代入公式按、=1查2界值表,得到P 0.0001。按=0.05水準拒絕H。,故可以認為兩種治療方式白血病患者的總體生存曲線不同4 表18-15所示結果較為合理,影響此惡性腫瘤患者生存時間的影響因素為病 人性別、組織學類型、治療方式。其中男性與女性風險比為0.035;組織學類型高分化與低分化風險比為0.095;傳統(tǒng)治療方式與新方法治療方式風險比為0.126,提示新方式治療效果較差(而表18-13單因素分析卻顯示新

31、方法療效好,可以看出不考慮其它因素的干擾作用而一味采用單因素分析會得到錯誤結論)。表18-1318-13 31名惡性腫瘤患者生存資料單因素Cox回歸結果RR 95%置信區(qū)間變量 自由度回歸系數(shù)bb的標準誤2P值-2ln(L)RR上限下限age1-0.002510.020740.01460.9037133.8930.9970.9581.039sex1-1.256730.463497.35190.0067125.7950.2850.1150.706type1-1.040600.433755.75570.0164128.1400.3530.1510.827treat10.563520.478301.

32、38810.2387132.4061.7570.6884.486lym1-0.372530.454500.67180.4124133.2060.6890.2831.679表 18-1418-1431名惡性腫瘤患者生存資料多因素Cox回歸結果(-2ln(L)-104.979)RR 95%置信區(qū)間變量自由度回歸系數(shù)bb的標準誤2P值RR上限下限age10.019940.023640.71090.39921.0200.9741.069sex1-3.466580.8953514.99050.00010.0310.0050.181type1-3.244660.8609614.20260.00020.03

33、90.0070.211treat1-1.935080.813305.66100.01730.1440.0290.711lym11.278900.756202.86020.09083.5930.81615.816表18-1518-15 31名惡性腫瘤患者生存資料多因素Cox逐步回歸結果(-2ln(L)-108.033)2RR 95%置信區(qū)間變量自由度回歸系數(shù)bb的標準誤扎P值RR上限下限sex1-3.350180.9293812.99420.00030.0350.0060.217type1-2.350710.6134614.68360.00010.0950.0290.317treat1-2.07

34、0640.851685.91100.01500.1260.0240.669補充練習題一、選擇題(一)A1A1型:每一道題下面有 A A、B B、C C、D D、E E五個備選答案,請從中選擇一 個最佳答案。1. _下列不屬于非參數(shù)統(tǒng)計方法的是 。A.秩和檢驗 B. F檢驗 C.log-rank檢驗D.spearman相關E. 2檢驗2 生存分析的結果變量為_。A .生存時間B.結局變量C.生存時間與結局變量D.刪失值E.正態(tài)分布變量3._ 乳腺癌化療患者預后分析中,以下 _情況不屬于刪失數(shù)據(jù)。A .死于乳腺癌B.死于心臟病C.失訪D.觀察期結束尚存活E.改用中藥治療4. _ 下列關于生存率的描述中不正確的是 _。A. 生存率指病人經(jīng)歷k個單位時段后仍存活的概率B. 生存率即累積生存概率C. 5年生存率即病人至少存活5年的可能性大小D. 生存率表示年初人口往后活滿一年的機會大小E. k年生存概率通常不小于k年生存率5. _ 對Cox回歸模型風險比的正確描述為 _。A.與回歸系數(shù)正負號相同B.與回歸系數(shù)正負號相反C.基準風險乘以回歸系數(shù)D.某個常數(shù)E.不服從正態(tài)分布(二)A2A2型:題干以一個小案例出現(xiàn),其下有 A A、B B、C C、D D、E E五個備選答案, 請從中選擇一個最佳答案。1.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論