![生存分析知識(shí)總結(jié)_第1頁](http://file4.renrendoc.com/view/80f252c08f7d709f828e0aa5ad5a46b9/80f252c08f7d709f828e0aa5ad5a46b91.gif)
![生存分析知識(shí)總結(jié)_第2頁](http://file4.renrendoc.com/view/80f252c08f7d709f828e0aa5ad5a46b9/80f252c08f7d709f828e0aa5ad5a46b92.gif)
![生存分析知識(shí)總結(jié)_第3頁](http://file4.renrendoc.com/view/80f252c08f7d709f828e0aa5ad5a46b9/80f252c08f7d709f828e0aa5ad5a46b93.gif)
![生存分析知識(shí)總結(jié)_第4頁](http://file4.renrendoc.com/view/80f252c08f7d709f828e0aa5ad5a46b9/80f252c08f7d709f828e0aa5ad5a46b94.gif)
![生存分析知識(shí)總結(jié)_第5頁](http://file4.renrendoc.com/view/80f252c08f7d709f828e0aa5ad5a46b9/80f252c08f7d709f828e0aa5ad5a46b95.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Ainy 晴生存分析知識(shí)總結(jié)一、生存分析G基本概念生存分析是將事件G結(jié)果和出現(xiàn)此結(jié)果所經(jīng)歷G時(shí)間結(jié)合起來分析G統(tǒng)計(jì)分析方法。研究生存現(xiàn)象和響應(yīng)時(shí)間數(shù)據(jù)及其統(tǒng)計(jì)規(guī)律G一門學(xué)科。對(duì)一個(gè)或多個(gè)非負(fù)隨機(jī)變量(生存時(shí)間)進(jìn)行統(tǒng)計(jì)分析研究。對(duì)生存時(shí)間進(jìn)行分析和推斷,研究生存時(shí)間和結(jié)局與眾多影響因素間關(guān)系 及其程度G統(tǒng)計(jì)分析方法。在綜合考慮相關(guān)因素(內(nèi)因和外因)G基礎(chǔ)上,對(duì)涉及生物學(xué)、醫(yī) 學(xué)(臨床、流行病)、工程(可靠性)、保險(xiǎn)精算學(xué)、公共衛(wèi)生學(xué)、社會(huì)學(xué)和人口學(xué)(老齡問題、 犯罪、婚姻)、經(jīng)濟(jì)學(xué)(市場(chǎng)學(xué))等領(lǐng)域中,與事件(死亡,疾病發(fā)生、發(fā)展和緩解,失效,狀 態(tài)持續(xù))發(fā)生G時(shí)間(也叫壽命、存活時(shí)間或失效時(shí)間
2、,統(tǒng)稱生存時(shí)間)有關(guān)G問題提供相關(guān) G統(tǒng)計(jì)規(guī)律G分析與推斷方法G學(xué)科。生存時(shí)間也叫壽命、存活時(shí)間、失效時(shí)間等等。比如:醫(yī)學(xué)上包括疾病發(fā)生時(shí)間、治療后 疾病復(fù)發(fā)時(shí)間;可靠性工程系為元件或系統(tǒng)失效時(shí)間;犯罪學(xué)方面是重罪犯人G假釋時(shí)間;社 會(huì)學(xué)上指首次婚姻持續(xù)時(shí)間;人口學(xué)上包括母乳喂養(yǎng)新生兒斷奶時(shí)間;經(jīng)濟(jì)學(xué)包括經(jīng)濟(jì)危機(jī)爆 發(fā)時(shí)間、發(fā)行債券G違約時(shí)間;保險(xiǎn)精算學(xué)包括保險(xiǎn)人G索賠時(shí)間、保險(xiǎn)公司某一索賠中所付 保費(fèi);汽車工業(yè)包括汽車車輪轉(zhuǎn)數(shù);市場(chǎng)學(xué)中有報(bào)紙和雜志G篇幅和訂閱費(fèi)。這些也可以說明, 生存時(shí)間可以不是具體G時(shí)間。二、生存分析G歷史生存分析方法最早可上溯至十九世紀(jì)G死亡壽命表?,F(xiàn)代G生存分析則開始
3、于二十世紀(jì)三 十年代工業(yè)科學(xué)中G相關(guān)應(yīng)用。二次世界大戰(zhàn)時(shí)期,武器裝備G可靠性研究,這一研究興趣延續(xù)到戰(zhàn)后。此時(shí)生存分析都 集中在參數(shù)模型。二十世紀(jì)六七十年代,醫(yī)學(xué)研究中大量臨床試驗(yàn)G出現(xiàn),要求方法學(xué)有新G 突破,導(dǎo)致了生存分析G研究開始轉(zhuǎn)向非參數(shù)方法。D.R. Cox在72年提出G比例風(fēng)險(xiǎn)模型為此做出了劃時(shí)代G貢獻(xiàn)。現(xiàn)在,生存分析方法G在醫(yī)學(xué)領(lǐng)域得到了廣泛G應(yīng)用,而通過醫(yī)學(xué)研究要求G不斷提高, 這一方法也得到了飛速G發(fā)展。三、生存分析G研究目?jī)?nèi)容和具體方法(一)研究目G主要由以下五個(gè)方面.描述生存過程:估計(jì)不同時(shí)間G總體生存率,計(jì)算中位生存期,繪制生存函數(shù)曲線。統(tǒng)計(jì)方 法包括 Kaplan-M
4、eier ( K-M )法、壽命表法。.比較:比較不同處理組G生存率,如比較不同療法治療腦瘤G生存率,以了解哪種治療方案 較優(yōu)。統(tǒng)計(jì)方法log-rank檢驗(yàn)等。.影響因素分析:研究某個(gè)或某些因素對(duì)生存率或生存時(shí)間G影響作用。如為改善腦瘤病人G 預(yù)后,應(yīng)了解影響病人預(yù)后G主要因素,包括病人G年齡、性別、病程、腫瘤分期、治療方案Ainy 晴Ainy 晴.統(tǒng)計(jì)方法Cox比例風(fēng)險(xiǎn)回歸模型等。.預(yù)測(cè):建立 Cox回歸預(yù)測(cè)模型。 (二)主要研究?jī)?nèi)容描述生存過程研究人群生存狀態(tài)G規(guī)律研究生存率曲線G變動(dòng)趨勢(shì)是人壽保險(xiǎn)業(yè)G基礎(chǔ)生存過程影響因素分析及結(jié)局預(yù)測(cè)識(shí)別與反應(yīng)、生存及疾病等相關(guān)風(fēng)險(xiǎn)因素預(yù)測(cè)生存結(jié)局在臨床
5、中應(yīng)用G非常廣泛(三)主要分析方法.參數(shù)法方法:首先要求觀察G生存時(shí)間t服從某一特定G分布,采用估計(jì)分布中參數(shù)G方法獲得生存率G估計(jì)值。生存時(shí)間G分布可能為指數(shù)分布、Weibull分布、對(duì)數(shù)正態(tài)分布等,這些分布曲線都有相應(yīng)G生存率函數(shù)形式。只需求得相應(yīng)參數(shù)G估計(jì)值,即可獲得生存率G估計(jì)值 和生存曲線。.非參數(shù)方法:實(shí)際工作中,多數(shù)生存時(shí)間G分布不符合上述所指G分布,就不宜用參數(shù)法進(jìn) 行分析,應(yīng)當(dāng)用非參數(shù)法。這類方法G檢驗(yàn)假設(shè)與以往所學(xué)G非參數(shù)法一樣,假設(shè)兩組或多組 G總體生存率曲線分布相同,而不論總體G分布形式和參數(shù)如何。非參數(shù)法是隨訪資料G常用分析方法。.半?yún)?shù)方法:只規(guī)定了影響因素和生存狀
6、況間G關(guān)系,但是沒有對(duì)時(shí)間(和風(fēng)險(xiǎn)函數(shù))G分 布情況加以限定。這種方法主要用于分析生存率G影響因素,屬多因素分析方法,其典型方法 是Cox比例風(fēng)險(xiǎn)模型。生存分析G典型G統(tǒng)計(jì)軟件主要有SAS、SPSS Stata、Excel、R。四、生存分析數(shù)據(jù)G數(shù)據(jù)類型(一)完全數(shù)據(jù)每個(gè)個(gè)體確切G生產(chǎn)時(shí)間都是知道G。這樣G數(shù)據(jù)稱為完全數(shù)據(jù)。但在實(shí)際G生存分析中,數(shù)據(jù)在很多情況下是很難完全觀察到O。(二)刪失生存數(shù)據(jù)一個(gè)重要G特點(diǎn)是:在研究結(jié)束時(shí),無法獲得某些個(gè)體確切G生存時(shí)間。例如:失去聯(lián)系(病人搬走,電話號(hào)碼改變);無法觀察到結(jié)局(死于其他原因);研究截止,個(gè)體仍然存活;獲得G數(shù)據(jù)就是刪失數(shù)據(jù);對(duì)存在刪失G
7、個(gè)體,只知道刪失時(shí)間。刪失分為右刪失、左刪失和區(qū)間刪失.右刪失是指,在進(jìn)行觀察或調(diào)查時(shí),一個(gè)個(gè)體G確切生存時(shí)間不知道,而只知道其生存 時(shí)間大于時(shí)間L,則稱該個(gè)體G生存時(shí)間在L上是右刪失并稱 L為右刪失數(shù)據(jù)。右刪失有三種類型(按結(jié)束時(shí)間差別): I型刪失Ainy 晴Ainy 晴對(duì)所有個(gè)體G觀察停止在一個(gè)固定G時(shí)間,這種刪失即為I型刪失(或定時(shí)刪失)。例如:動(dòng)物研究通常是以有固定數(shù)目G動(dòng)物接受一種或多種處理開始,由于時(shí)間和費(fèi)用G限制,研究者常常不能等到所有動(dòng)物死亡。一種選擇就是在一個(gè)固定時(shí)間周期內(nèi)觀察,在截止時(shí)間之 后仍可能有些動(dòng)物活著,但不繼續(xù)觀察了。這些動(dòng)物G生存時(shí)間是不知道只知其不小于研 究
8、周期時(shí)間。I型刪失G刪失時(shí)間是固定內(nèi)。II型刪失同時(shí)對(duì)n個(gè)個(gè)體進(jìn)行觀察,一直到有一固定數(shù)目( r n) G個(gè)體死亡(失效)為止,這種 刪失即為II型刪失。II型刪失G刪失時(shí)間是隨機(jī)內(nèi)。III型刪失所有個(gè)體在不同時(shí)間進(jìn)入研究,某些個(gè)體在研究結(jié)束之前死亡,他們G確切生存時(shí)間是知 道其他個(gè)體在研究結(jié)束之前退出研究而不被跟蹤觀察或在研究結(jié)束時(shí)仍然活著。進(jìn)入研究 G時(shí)間可能不同,刪失時(shí)間也可能不同,這種刪失叫做III型刪失,又稱為隨機(jī)刪失。.左刪失研究對(duì)象在時(shí)刻t開始接受觀察,而在此之前我們感興趣G時(shí)間已經(jīng)發(fā)生,這就是左刪失。例如:“您初次吸食大麻是在什么時(shí)候?”有一種回答:“我吸食過,但我不記得吸食G
9、具體時(shí)間了。這些回答G吸食時(shí)間數(shù)據(jù)就是左刪失;通過測(cè)試確定兒童學(xué)會(huì)完成特定任務(wù)G年齡,有些兒童在進(jìn)入研究前就已經(jīng)可以完成某項(xiàng)特定任務(wù),這些兒童G事件發(fā)生時(shí)間也是左刪失;出現(xiàn)左刪失同時(shí),也可能出現(xiàn)右刪失,稱為雙刪失( Double censoring ) o例如:對(duì)吸食大麻G問卷 還有一種回答:“我從來沒有吸食過”,這樣G數(shù)據(jù)就是右刪失;.區(qū)間刪失若個(gè)體G確切生存時(shí)間不知道,只知道其生存時(shí)間在兩個(gè)觀察時(shí)間L和R之間(LR),則稱該個(gè)體G生存時(shí)間在 L,R上是區(qū)間刪失內(nèi)。實(shí)際工作中,凡是不能或者不愿作連續(xù)監(jiān)測(cè)時(shí) 就會(huì)遇到這樣G區(qū)間刪失。區(qū)間刪失分兩種:第一類區(qū)間刪失;第二類區(qū)間刪失。區(qū)間刪失,當(dāng)對(duì)
10、個(gè)體只進(jìn)行一次觀察,且個(gè)體G確切生存時(shí)間不知道,只知道其生存時(shí)間是否大于觀察時(shí)間(即 L=0或R=oo),這種刪失稱為第一類區(qū)間刪失,也稱為現(xiàn)實(shí)狀況數(shù)據(jù)當(dāng)對(duì)個(gè)體進(jìn)行兩次觀察,其觀察時(shí)間L和R滿足0 L R 笛時(shí),這種刪失稱為第二類區(qū)間刪失,也稱為一般區(qū)間刪失,如果初始時(shí)間(如艾滋病感染時(shí)間)和發(fā)生時(shí)間均為區(qū)間刪失, 則稱生存時(shí)間為雙重區(qū)間刪失。(三)截?cái)嘣谘芯炕蛘哂^測(cè)中,淘汰了一些對(duì)象(樣本),使得研究者“意識(shí)不到他們G存在”。對(duì)截?cái)鄶?shù)據(jù)G分析構(gòu)造似然采用條件分布。截?cái)喟▋煞N:左截?cái)嗪陀医財(cái)唷?左截?cái)嘀挥袀€(gè)體經(jīng)歷某種初始事件以后才能觀察到其生存時(shí)間,稱為左截?cái)啵藭r(shí)獲得G數(shù)據(jù)稱Ainy 晴A
11、iny 晴為左截?cái)鄶?shù)據(jù)例如:暴露于某疾病、發(fā)生死亡前G中間事件等。退休中心老年居民死亡時(shí)間(沒到年齡沒有進(jìn)入觀測(cè))左截?cái)嗯c左刪失G區(qū)別:在左截?cái)郍研究中,根本沒有考慮那些在進(jìn)入研究之前已經(jīng)經(jīng)歷 了感興趣時(shí)間G個(gè)體,而在左刪失G研究中,我們能獲得這些個(gè)體G部分信息。即有左截?cái)嘤执嬖谟覄h失G情況,稱為左截?cái)嘤覄h失.右截?cái)嘀挥薪?jīng)歷了某種終止事件才能觀察到生存時(shí)間(將要經(jīng)歷該事件G個(gè)體不包含在實(shí)驗(yàn)樣本中),稱為右截?cái)啵藭r(shí)獲得G數(shù)據(jù)稱為右截?cái)鄶?shù)據(jù)。例如:對(duì)艾滋病感染和發(fā)病時(shí)間觀測(cè)數(shù)據(jù),有些個(gè)體感染病毒但尚未發(fā)病,這樣G個(gè)體不在樣本范圍之內(nèi)截?cái)郍數(shù)學(xué)表示:設(shè) Y是一個(gè)非負(fù)G表示生存時(shí)間G隨機(jī)變量;T是另
12、外一個(gè)表示截?cái)鄷r(shí)間G隨機(jī)變量。在左截?cái)嘞?,只有?dāng) Y2T時(shí),才能觀察到T和Y;在左截?cái)嘞?,只有?dāng) 丫 T時(shí),才能觀察到T和Y;五、生存分析G基本函數(shù)和模型(一)生存函數(shù)描述生存時(shí)間統(tǒng)計(jì)特征G基本函數(shù),也叫生存率(Survival Rate)設(shè)T表示生存時(shí)間,F(xiàn)(t)為T分布函數(shù),生存函數(shù)定義為S(t)= P(T t) =1 -F(t), 0 t :二二生存函數(shù)是非增函數(shù),滿足S(0 ) =lim S(x) =1; S(+二)=lim S(x) =0 x-0 -x 舉:當(dāng)生存時(shí)間為連續(xù)型隨機(jī)變量時(shí):S(t); P(T t) =1 -F = f(u)dutf(t) =-S(t)=dS(t)dt(二
13、)危險(xiǎn)率函數(shù): 描述觀察個(gè)體在某時(shí)刻存活條件下,在以后G單位時(shí)間內(nèi)死亡G (條件)概率。P(T t h|T -t) ,(t)= lim .Lh)0h當(dāng) T連續(xù) Mt) =f (t)/S(t) =-dlnS(t)/dtAiny 晴Ainy 晴當(dāng)T離散,取值為 ai a2 III,且f (ai) = P(T =a), i =1,2川則a處的危險(xiǎn)率為i =P(T |T =f(a)S(ay)S(ay)-S(ai)S(ai)=1-坐Li =1,2,|HSQ)1 1S工“沙“骨)迅(1- i)危險(xiǎn)率函數(shù)在工程上叫做失效率函數(shù)或損壞函數(shù),在生存分析和醫(yī)學(xué)統(tǒng)計(jì)中又稱為風(fēng)險(xiǎn)率 函數(shù)或瞬時(shí)死亡率、或死亡強(qiáng)度、或條
14、件死亡率、或年齡死亡率等。(三)累計(jì)危險(xiǎn)率函數(shù)t累積危險(xiǎn)率函數(shù):上-(u)du0t當(dāng) T 連續(xù) S(t) =expA(t) =expJK(u)du0上(t) = -lnS(t)當(dāng)T離散時(shí),危險(xiǎn)率函數(shù)有兩種定義形式:A(t)= %和A(t)= ln(1-%)i|ai空舊i如果;的值很小,兩種定義形式的值接近(四)平均剩余壽命函數(shù)(s -t) f (s)dsr(t) = E(T -t|T t)=S(t)平均剩余壽命函數(shù)定義為:r(0)為平均壽命(五)常用G參數(shù)模型 生存時(shí)間G分布一般不呈正態(tài)分布。常用G分布有:指數(shù)分布威布爾(Weibull)分布伽瑪(Gamma)分布 對(duì)數(shù)羅吉斯蒂(logisti
15、c)分布對(duì)數(shù)正態(tài)分布六、風(fēng)險(xiǎn)回歸模型設(shè)(t;x) =lim P(t 0r(t,x)稱為相對(duì)風(fēng)險(xiǎn)。(t)為基準(zhǔn)風(fēng)險(xiǎn)函數(shù)。x為協(xié)變量Ainy 晴Ainy 晴取 r(t,x)=expZ(t)即得 Cox model(t;x)= o(t)expZ(t)其中:Z(t)=乙(t)|,Zp(t)為協(xié)變量x和t的函數(shù)0(t)=(t|x) =(0,|l|,0)一:=(fIM;p)為未知的回歸參數(shù)Relative risk model (Cox model)expZ(t)P為參數(shù)部分P =(Pi|,Pp)為未知參數(shù)%(t)為非參數(shù)部分,未知基準(zhǔn)函數(shù)因此,相對(duì)風(fēng)險(xiǎn)模型為半?yún)?shù)模型在Cox模型下:生存時(shí)間的分布函數(shù)為
16、S(t;x)=P(T t|x)t=exp-Y0(u)expZ(u) du0密度函數(shù)為:f (t;x) = (t;x)F(t;x)比例風(fēng)險(xiǎn)模型當(dāng)Zt)=Z時(shí),即協(xié)變量不依賴時(shí)間變化Mt;x) =%(t)expZB止匕時(shí)r(t, x) =expZ P為常數(shù)。故稱為比例風(fēng)險(xiǎn)模型。在風(fēng)險(xiǎn)比例模型下exp(Z:)S(t;x) =S0(t)tS0(t) =exp 1%(u)du為基準(zhǔn)生存函數(shù)。tt這是因?yàn)椋篈(t;x)= pu;x)du = 1% (u)exp( Z P)du=Ao exp(Z P) 00故:S(t;x); exp-(t;x): exp(- 0(t)exp(Z ) = S0(t)exp(Z)相對(duì)風(fēng)險(xiǎn)模型參數(shù)估計(jì)基本方法:偏似然(partial likelihood )偏似然G定義:Ainy
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 溝通與協(xié)調(diào)打造和諧職場(chǎng)環(huán)境
- 生態(tài)建筑引領(lǐng)未來商業(yè)趨勢(shì)
- 現(xiàn)代科技在股票市場(chǎng)分析中的應(yīng)用
- 校園餐飲消費(fèi)大數(shù)據(jù)洞察學(xué)生消費(fèi)習(xí)慣
- 2024年八年級(jí)生物下冊(cè) 6.2.1遺傳說課稿 (新版)冀教版
- 2024年八年級(jí)物理下冊(cè) 8.1認(rèn)識(shí)壓強(qiáng)說課稿 (新版)粵教滬版
- 14《普羅米修斯》(說課稿)2024-2025學(xué)年-統(tǒng)編版語文四年級(jí)上冊(cè)
- 2024年五年級(jí)數(shù)學(xué)下冊(cè) 五 分?jǐn)?shù)除法練習(xí)五說課稿 北師大版
- 2024-2025學(xué)年高中歷史 專題1 中國(guó)傳統(tǒng)文化主流思想的演變 3 宋明理學(xué)說課稿 人民版必修3
- 2024-2025學(xué)年八年級(jí)物理下冊(cè) 第十章 從粒子到宇宙 10.1 認(rèn)識(shí)分子說課稿 (新版)粵教滬版
- 圓筒混料機(jī)-設(shè)計(jì)說明書
- 蓋板涵施工工藝流程配圖豐富
- 中央導(dǎo)管相關(guān)血流感染防控
- 混合動(dòng)力汽車發(fā)動(dòng)機(jī)檢測(cè)與維修中職PPT完整全套教學(xué)課件
- 2023年副主任醫(yī)師(副高)-腫瘤內(nèi)科學(xué)(副高)考試歷年真題薈萃帶答案
- 產(chǎn)時(shí)子癇應(yīng)急演練文檔
- 小學(xué)美術(shù)-《神奇的肥皂粉》教學(xué)設(shè)計(jì)學(xué)情分析教材分析課后反思
- 測(cè)量管理體系內(nèi)審檢查表
- 信號(hào)與系統(tǒng)復(fù)習(xí)題及答案
- 班組月度考核評(píng)分表
- 部編版一年級(jí)下冊(cè)《道德與法治》教學(xué)工作計(jì)劃及全冊(cè)教案
評(píng)論
0/150
提交評(píng)論