cox比例風險回歸模型及其R程序_第1頁
cox比例風險回歸模型及其R程序_第2頁
cox比例風險回歸模型及其R程序_第3頁
cox比例風險回歸模型及其R程序_第4頁
cox比例風險回歸模型及其R程序_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

Cox回歸分析2021/5/91利用生存率函數(shù)S(t,X)與風險函數(shù)h(t,X)的關系可導出較好地解決截尾值的問題反映了協(xié)變量X與生存函數(shù)的關系Cox模型的基本形式2021/5/92所有危險因素為0時的基礎風險率,它是未知的,但假定它與h(t,X)是呈比例的。右側可分為兩部分:h0(t)沒有明確的定義,分布無明確的假定,參數(shù)無法估計,為非參數(shù)部分;另一部分是參數(shù)部分,其參數(shù)可以通過樣本的實際觀察值來估計的,正因為Cox模型有非參數(shù)和參數(shù)兩部分組成,故又稱為半?yún)?shù)模型。2021/5/93

若i>0,則RR>1,該因素為危險因素;若i<0,則RR<1,該因素為保護因素;若i=0,則RR=1,該因素為無關因素。

偏回歸系數(shù)i的意義是,當其它協(xié)變量都不變時,Xi每變化一個單位,相對危險度的自然對數(shù)(lnRR)變化i個單位。

2021/5/94相對危險度RR2021/5/95相對危險度RR

③同時考慮2個協(xié)變量,2個因素都存在的危險率與2個因素都不存在時的危險率之比(相對危險度)為

2021/5/96Cox回歸基本模型的兩個前提假設

①各危險因素的作用不隨時間變化而變化,即不隨時間變化而變化;②對數(shù)線性假定:模型中的協(xié)變量應該與對數(shù)風險比成線性關系。

2021/5/97Cox回歸模型與一般的回歸分析不同,它不是直接用生存時間作為回歸方程的因變量,協(xié)變量對生存時間的影響是通過風險函數(shù)和基礎風險函數(shù)的比值反映的,其中的風險函數(shù)和基礎風險函數(shù)是未知的。另外偏回歸系數(shù)的估計需要借助于偏似然函數(shù)的方法。在完成參數(shù)估計的情況下,可對基礎風險函數(shù)和風險函數(shù)做出估計,并可計算每一個時刻的生存率。2021/5/98二、Cox回歸分析的一般步驟1.分析前的準備----數(shù)據(jù)整理2.參數(shù)估計,建立最佳模型3.假設檢驗4.Cox模型的解釋及應用5.Cox模型擬合優(yōu)度的考察2021/5/991.分析前的準備----數(shù)據(jù)整理嚴密的研究設計收集資料:影響疾病的因素、病人的個性及行為特征等資料(如病人的年齡、性別、職業(yè)、是否飲酒、是否吸煙及病情、病理類型等資料)、研究對象的生存時間和截尾指示變量(一般用變量t表示生存時間,用變量d表示是否截尾)。資料應盡量避免偏性及主觀因素的影響。樣本含量:不宜過小。一般情況下,樣本例數(shù)應為分析因素的5-20倍。數(shù)據(jù)預處理:如數(shù)據(jù)的變換、日歷數(shù)據(jù)與生存時間的轉化等。同時要對數(shù)據(jù)進行描述性分析。2021/5/9102021/5/9112.參數(shù)估計,建立最佳模型

(1)參數(shù)估計----偏似然估計假定有n個病人,他們的生存時間由小到大排列:t1≤t2≤…≤tn

對于每個生存時間ti來說,凡生存時間大于等于ti的所有病人組成一個危險集,記為R(ti)。在危險集內(nèi)的病人,在ti以前尚生存,但處在危險之中,隨著時間的推移,危險集內(nèi)的病人陸續(xù)死亡,逐漸退出觀察,直至最后一個病人死亡時,危險集消失。2021/5/9122021/5/913代表ti時刻以后危險集R(ti)中對似然函數(shù)作貢獻的個體將n個病人死亡的條件概率相乘

2021/5/914兩邊取自然對數(shù)2021/5/915(2)建立最佳模型為建立最佳模型常需對研究的因素進行篩選,篩選方法有前進法、后退法和逐步回歸法。實際工作中要根據(jù)具體情況選擇使用,最常用的為逐步回歸法。因素篩選時需規(guī)定顯著性水平,一般情況下初步篩選因素的顯著性水平確定為0.1或0.15,設計較嚴格的研究顯著性水平可確定為0.05。另外,篩選因素時,還要考慮因素間共線性的影響。當存在共線性時,應考慮消除共線的影響,如采用主成分回歸等方法。2021/5/9163.參數(shù)的假設檢驗(1)似然比檢驗(likelihoodratiotest)

(2)得分檢驗(scoretest)(又稱為拉格朗日乘數(shù)法)(3)Wald檢驗是三種基于極大似然法大樣本檢驗方法。2021/5/917似然比檢驗:用于模型中原有不顯著變量的剔除和顯著變量的引入,以及包含不同變量數(shù)時模型間的比較。檢驗新增加的協(xié)變量是否有統(tǒng)計學意義的統(tǒng)計量為:2021/5/9182021/5/919拉格朗日乘子檢驗(LM)基本思想:拉格朗日乘子檢驗(LM),又稱為Score檢驗。該檢驗基于約束模型,無需估計無約束模型。假設約束條件為,在約束條件下最大化對數(shù)似然函數(shù),另表示拉格朗日乘子向量,此時,拉格朗日函數(shù)為約束條件下最大化問題就是求解下式根,2021/5/920拉格朗日乘子檢驗(LM)如果約束成立,對數(shù)似然函數(shù)值不會有顯著變化。這就意味著在一階條件下,第二項應該很小,特別是應該很小。因此,約束條件是否成立檢驗轉化成檢驗,這就是拉格朗日乘子檢驗的思想。

但是直接檢驗比較困難,有一個等價而簡單的方法。如果約束條件成立,在約束估計值處計算對數(shù)似然函數(shù)的導數(shù)應該近似為零,如果該值顯著異于零,則約束條件不成立,拒絕原假設。對數(shù)似然函數(shù)的導數(shù)就是得分向量,因此,LM檢驗就是檢驗約束條件下參數(shù)估計值的得分向量值是否顯著異于零,因而,LM檢驗又稱為得分檢驗。2021/5/921拉格朗日乘子檢驗(LM)在最大似然估計過程中,通過解似然方程,可以求出無約束估計量;如果計算有約束估計量在此處得分,則一般不為零,但是如果約束有效,則趨近于零。在原假設成立條件下,2021/5/922拉格朗日乘子檢驗(LM)對于線性約束將有關量代入上式得,拒絕域,2021/5/923拉格朗日乘子檢驗(LM)LM統(tǒng)計量另一種表達形式,LR、Wald、LM關系(一般情況下成立):2021/5/9244.Cox模型的解釋及應用(1)探索結局事件發(fā)生的危險因素,分析各因素的作用大小。(2)計算個體預后指數(shù)(prognosisindex,PI),對個體進行定性的預后評價。(3)通過估計生存率,對群體定量地進行預后評價。2021/5/925影響因素Xi的標準差

標準正態(tài)離差

相應偏回歸系數(shù)的標準誤

2021/5/926

(2)計算個體預后指數(shù)(prognosisindex,PI),對個體進行定性的預后評價。

定義第j個觀察單位的預后指數(shù)為:

式中為第i個協(xié)變量的標準偏回歸系數(shù)的估計值(),為第j個觀察單位(個體)第i個協(xié)變量的標準化值。若PIj=0,說明該個體死亡風險處于平均水平;若PIj>0,說明該個體死亡風險高于平均水平;若PIj<0,說明該個體死亡風險低于平均水平。2021/5/9273.通過估計生存率,對群體定量地進行預后評價。

由于生存率與基礎生存率相關,故只要估計出基礎生存率,再結合各因素的偏回歸系數(shù)就可以估計出生存率,即2021/5/9282021/5/929ti時刻的基礎生存率公式

ti時刻的基礎累計風險函數(shù)公式在tk時刻的死亡人數(shù)

ti時刻的生存率計算公式

2.Breslow法2021/5/9305.Cox模型擬合優(yōu)度的考察可將研究對象按個體預后指數(shù)恰當?shù)胤纸M,用乘積極限法估計各組的生存率曲線,并與按Cox模型預后指數(shù)分類的生存率曲線在同一坐標系內(nèi)進行比較,若兩種曲線具有一致性,說明模型擬合較理想。也可以使用卡方檢驗的方法。2021/5/931比例風險假定(PH假定):PH假定的檢驗方法大致可以分為圖法和正規(guī)的檢驗方法。圖法:即通過觀察散點圖中散點的分布或趨勢是否滿足既定模型基本假設下的形狀來判斷資料是否滿足或近似滿足模型假定,主要的方法有:比較COX-KM生存曲線、基于累計風險函數(shù)的圖示法、Schoenfeld殘差圖、Score殘差圖;正規(guī)的檢驗方法:通過構造滿足既定模型基本假定下服從某一已知分布的統(tǒng)計量,利用P值來檢驗資料是否滿足或近似滿足模型假定。主要方法有:時協(xié)變量法、線性相關檢驗、加權殘差Score檢驗、三次樣條函數(shù)法..\Cox比例風險回歸模型診斷及預測有關問題的研究_余紅梅.caj.caj2021/5/932對數(shù)線性假定主要的方法:多重β法;鞅殘差法;改進的鞅殘差法;構造變量法Cox回歸影響點的分析鞅殘差,剩余殘差,得分殘差,Schoenfeld殘差,加權Schoenfeld殘差2021/5/933R程序:在survival包中的函數(shù):coxph(formula,data,weights,subset,na.action……)formula:反應變量要有Surv()函數(shù)定義cox.zph(fit,transform=,global=T/F)檢驗比例風險假定basehaz(fit,centered=T/F)計算基礎風險率的函數(shù)2021/5/934getwd()setwd("C:/Users/Administrator/Desktop")my<-read.csv("pharynx.csv",header=T)attach(my)my<-my[COND!=9&GRADE!=9,]#去掉兩個缺失值COND[COND==3|COND==4]<-2COND[COND==0]<-1aa<-table(COND)aamydata<-my[,-c(1,11)]library(survival)fit<-coxph(Surv(TIME,as.numeric(STATUS))~.,data=mydata)#cox比例風險模型函數(shù)plot(survfit(fit))summary(fit)2021/5/935basehaz(fit)#基礎風險函數(shù)aa<-cox.zph(fit)#比例風險假定的檢驗print(aa)plot(aa[6])2021/5/936多重分數(shù)多項式模型library(mfp)f<-mfp(Surv(TIME,as.numeric(STATUS))~fp(AGE,df=4,select=0.05)+INST+SEX+TX+GRADE+COND+SITE+T_STAGE+N_STAGE,select=0.15,family=cox,data=mydata)print(f)(rsq=1-sum((f$residuals)^2/sum((mydata$TIME-mean(mydata$TIME))^2))#R^22021/5/937SAS程序:procphregdata=;model<生存時間變量*截尾指示變量(數(shù)值)>=<自變量>/選項;strata<分組變量名列>freq<變量名列>;by<變量名列>;Proportionality_test:test……;/*比例風險假定,時協(xié)變量法*/run;2021/5/938libnamell'F:\R語言學習\COX';dataa;setll.pharynx;run;dataa;seta;ifcond=9orgrade=9thendelete;ifcond=3orcond=4thencond=2;ifcond=0thencond=1;run;procphregdata=a;modeltime*status(0)=txcondsitet_stagen_stageagegradeinst/selection=stepwiserisklimitssle=0.15sls=0.15;baselineout=coxsurvival=suvstderr=stderr/method=ch;run;2021/5/939四、Cox模型的適用范圍及注意事項1.適用范圍Cox模型適用于生存資料的統(tǒng)計分析,屬半?yún)?shù)模型,對資料沒有特殊的要求,也可以估計各因素的參數(shù),并能做多因素的統(tǒng)計分析。該模型的主要優(yōu)點在于能從眾多的影響因素中排除混雜因素的影響,找出影響生存時間的因素,根據(jù)各因素的參數(shù)估計出個體的生存率。另外,Cox模型能分析具有截尾數(shù)值的生存時間。Cox模型可以分析多種因素對疾病預后的影響,使其更適合于臨床的隨訪研究。Cox模型使臨床觀察的定性指標又加上定量指標進行分析,提高了分析的效率。2021/5/9402.注意事項(1)設計階段應注意的問題①樣本的代表性要好。樣本的含量為觀察協(xié)變量的5-20倍。②所有危險因素要在設計時考慮全面,避免漏掉重要因素和加入無關因素。③生存時間的定義要明確。起始事件和終點事件要有明確規(guī)定,時間盡可能精確測量。④研究的協(xié)變量在研究對象中的分布要適中,否則會給參數(shù)的估計帶來困難。⑤在設計時要注意影響時間的效應因素。如研究吸煙對肺癌患者生存率的影響,若本來吸煙的人因患肺癌而戒煙,則一般模型不易分析吸煙的作用,需考慮吸煙量隨時間變化的趨勢。如果研究的因素隨時間而發(fā)生變化,必要時可以采用伴時協(xié)變量的Cox模型進行分析。2021/5/941

注意事項(2)模型擬合時應注意的問題①多重共線性問題:醫(yī)學研究中的許多變量間并不是獨立的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論