生存分析概念_第1頁
生存分析概念_第2頁
生存分析概念_第3頁
生存分析概念_第4頁
生存分析概念_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、一、生存分析的概念: 將事件的結(jié)果和出現(xiàn)此結(jié)果所經(jīng)歷的時(shí)間結(jié)合 起來分析的統(tǒng)計(jì)分析方法。研究生存現(xiàn)象和響應(yīng)時(shí)間數(shù)據(jù)及其統(tǒng)計(jì)規(guī)律的 一門學(xué)科。對(duì)一個(gè)或多個(gè)非負(fù)隨機(jī)變量(生存時(shí)間)進(jìn)行統(tǒng) 計(jì)分析研究。對(duì)生存時(shí)間進(jìn)行分析和推斷,研究生存時(shí)間和結(jié) 局與眾多影響因素間關(guān)系及其程度的統(tǒng)計(jì)分析 方法。在綜合考慮相關(guān)因素(內(nèi)因和外因)的基礎(chǔ)上, 對(duì)涉及生物學(xué)、醫(yī)學(xué)(臨床、流行?。⒐こ蹋?靠性)、保險(xiǎn)精算學(xué)、公共衛(wèi)生學(xué)、社會(huì)學(xué)和人 口學(xué)(老齡問題、犯罪、婚姻)、經(jīng)濟(jì)學(xué)(市場 學(xué))等領(lǐng)域中,與事件(死亡,疾病發(fā)生、發(fā)展 和緩解,失效,狀態(tài)持續(xù))發(fā)生的時(shí)間(也叫壽 命、存活時(shí)間或失效時(shí)間,統(tǒng)稱生存時(shí)間)有關(guān) 的

2、問題提供相關(guān)的統(tǒng)計(jì)規(guī)律的分析與推斷方法 的學(xué)科。二、“生存時(shí)間”(Survival Time)的概念 生存時(shí)間也叫壽命、存活時(shí)間、失效時(shí)間等等。醫(yī)學(xué):疾病發(fā)生時(shí)間、治療后疾病復(fù)發(fā)時(shí)間 可靠性工程系:元件或系統(tǒng)失效時(shí)間 犯罪學(xué):重罪犯人的假釋時(shí)間 社會(huì)學(xué):首次婚姻持續(xù)時(shí)間 人口學(xué):母乳喂養(yǎng)新生兒斷奶時(shí)間 經(jīng)濟(jì)學(xué):經(jīng)濟(jì)危機(jī)爆發(fā)時(shí)間、發(fā)行債券的違約時(shí) 保險(xiǎn)精算學(xué):保險(xiǎn)人的索賠時(shí)間、保險(xiǎn)公司某一 索賠中所付保費(fèi)汽車工業(yè):汽車車輪轉(zhuǎn)數(shù)市場學(xué)中:報(bào)紙和雜志的篇幅和訂閱費(fèi)三、生存分析的應(yīng)用領(lǐng)域:社會(huì)學(xué),保險(xiǎn)學(xué),醫(yī) 學(xué),生物學(xué),人口學(xué),醫(yī)學(xué),經(jīng)濟(jì)學(xué),可靠性工 程學(xué)等 六、生存分析研究的目的1、描述生存過程:估

3、計(jì)不同時(shí)間的總體生存率,計(jì)算中位生存期,繪制生存函數(shù)曲線。統(tǒng)計(jì)方法包括Kaplan-Meier(K-M)法、壽命表法。2、比較:比較不同處理組的生存率,如比較不同療法治療腦瘤的生存率,以了解哪種治療方案 較優(yōu)。統(tǒng)計(jì)方法log-rank檢驗(yàn)等。3、影響因素分析:研究某個(gè)或某些因素對(duì)生存率或生存時(shí)間的影響作用。如為改善腦瘤病人的 預(yù)后,應(yīng)了解影響病人預(yù)后的主要因素,包括病 人的年齡、性別、病程、腫瘤分期、治療方案等。統(tǒng)計(jì)方法Cox比例風(fēng)險(xiǎn)回歸模型等。4、預(yù)測:建立Cox回歸預(yù)測模型。主要研究內(nèi)容描述生存過程:研究人群生存狀態(tài)的規(guī)律,研究 生存率曲線的變動(dòng)趨勢(shì),是人壽保險(xiǎn)業(yè)的基礎(chǔ)。 生存過程影響因素

4、分析及結(jié)局預(yù)測:識(shí)別與反 應(yīng)、生存及疾病等相關(guān)風(fēng)險(xiǎn)因素,預(yù)測生存結(jié)局, 在臨床中應(yīng)用的非常廣泛。七、主要分析方法1、參數(shù)法方法:首先要求觀察的生存時(shí)間t服 從某一特定的分布,采用估計(jì)分布中參數(shù)的方法 獲得生存率的估計(jì)值。生存時(shí)間的分布可能為指 數(shù)分布、Weibull分布、對(duì)數(shù)正態(tài)分布等,這些 分布曲線都有相應(yīng)的生存率函數(shù)形式。只需求得 相應(yīng)參數(shù)的估計(jì)值,即可獲得生存率的估計(jì)值和 生存曲線。2、非參數(shù)方法:實(shí)際工作中,多數(shù)生存時(shí)間的 分布不符合上述所指的分布,就不宜用參數(shù)法進(jìn) 行分析,應(yīng)當(dāng)用非參數(shù)法。這類方法的檢驗(yàn)假設(shè) 與以往所學(xué)的非參數(shù)法一樣,假設(shè)兩組或多組的 總體生存率曲線分布相同,而不論總

5、體的分布形 式和參數(shù)如何。非參數(shù)法是隨訪資料的常用分析 方法。3、半?yún)?shù)方法:只規(guī)定了影響因素和生存狀況 間的關(guān)系,但是沒有對(duì)時(shí)間(和風(fēng)險(xiǎn)函數(shù))的分 布情況加以限定。這種方法主要用于分析生存率 的影響因素,屬多因素分析方法,其典型方法是 Cox比例風(fēng)險(xiǎn)模型。4、幾種常用的統(tǒng)計(jì)軟件:SAS,SPSS,Stata, Excel,R第二章數(shù)據(jù)類型一、完全數(shù)據(jù)(Complete data)每個(gè)個(gè)體確切的生產(chǎn)時(shí)間都是知道的。這樣的數(shù) 據(jù)稱為完全數(shù)據(jù)(Complete data)。但在實(shí)際的生存分析中,數(shù)據(jù)在很多情況下是很難完全觀察 到的。III二、刪失(Censoring)生存數(shù)據(jù)一個(gè)重要的特點(diǎn)是:在研

6、究結(jié)束時(shí),無 法獲得某些個(gè)體確切的生存時(shí)間。例如:失去聯(lián) 系(病人搬走,電話號(hào)碼改變),無法觀察到結(jié)局(死于其他原因),研究截止,個(gè)體仍然存 活在這些情況下獲得的數(shù)據(jù)就是刪失數(shù)據(jù)III(Censored data)。對(duì)存在刪失的個(gè)體,只知道 刪失時(shí)間(Censoring time)。IIIIIIIIIIIIJJ刪失分為右刪失(Right censoring)、左刪失(Left censoring)和區(qū)間刪失(Interval censoring)1、右刪失(Right censoring)o在進(jìn)行觀察或調(diào)查時(shí),一個(gè)個(gè)體的確切生存時(shí)間 不知道,而只知道其生存時(shí)間大于時(shí)間L,則稱 該個(gè)體的生存時(shí)間

7、在L上是右刪失的,并稱L 為右刪失數(shù)據(jù)(Right-censored data)。右刪失有三種類型(按結(jié)束時(shí)間差別):I型刪失(Type I censoring )、II 型刪失(Type II censoring)和 III 型刪失(Type III censoring)o(1) I型刪失(Type I censoring):對(duì)所有個(gè)體 的觀察停止在一個(gè)固定的時(shí)間,這種刪失即為I 型刪失(或定時(shí)刪失)。例如:動(dòng)物研究通常是 以有固定數(shù)目的動(dòng)物接受一種或多種處理開始, 由于時(shí)間和費(fèi)用的限制,研究者常常不能等到所 有動(dòng)物死亡。一種選擇就是在一個(gè)固定時(shí)間周期 內(nèi)觀察,在截止時(shí)間之后仍可能有些動(dòng)物活

8、著, 但不繼續(xù)觀察了。這些動(dòng)物的生存時(shí)間是不知道的,只知其不小于研究周期時(shí)間。I型刪失的刪IIIIII失時(shí)間是固定的。固圖表1曜刪失示例(2)II 型刪失(Type II censoring):同時(shí)對(duì) n 個(gè)個(gè)體進(jìn)行觀察,一直到有一固定數(shù)目(r n) 的個(gè)體死亡(失效)為止,這種刪失即為II型 刪失。II型刪失的刪失時(shí)間是隨機(jī)的。IIIIII(3)III型刪失injj(Type III censoring):所有個(gè)體在不同時(shí)間進(jìn)入研究,某些個(gè)體在研究結(jié)束之 前死亡,他們的確切生存時(shí)間是知道的,其他個(gè) 體在研究結(jié)束之前退出研究而不被跟蹤觀察或 在研究結(jié)束時(shí)仍然活著。進(jìn)入研究的時(shí)間可能不 同,刪失

9、時(shí)間也可能不同,這種刪失叫做m型 刪失,又稱為隨機(jī)刪失(Random censoring)。IIIJJIIIJJIIIIIIin圖表3 III型刪失示例2、左刪失(Left censoring)研究對(duì)象在時(shí)刻C開始接受觀察,而在此之前我 l們感興趣的時(shí)間已經(jīng)發(fā)生,這就是左刪失。例如:“您初次吸食大麻是在什么時(shí)候? ”有一 種回答:“我吸食過,但我不記得吸食的具體時(shí) 間了?!边@些回答的吸食時(shí)間數(shù)據(jù)就是左刪失。 通過測試確定兒童學(xué)會(huì)完成特定任務(wù)的年齡,有 些兒童在進(jìn)入研究前就已經(jīng)可以完成某項(xiàng)特定IIIIIIIII任務(wù),這些兒童的事件發(fā)生時(shí)間也是左刪失。 出現(xiàn)左刪失同時(shí),也可能出現(xiàn)右刪失,稱為雙刪

10、失(Double censoring)o例如:對(duì)吸食大麻的問 卷還有一種回答:“我從來沒有吸食過”,這樣的 數(shù)據(jù)就是右刪失。3、區(qū)間刪失(Interval censoring):若個(gè)體的確 切生存時(shí)間不知道,只知道其生存時(shí)間在兩個(gè)觀 察時(shí)間L和R之間(LR),則稱該個(gè)體的生存 時(shí)間在L,R上是區(qū)間刪失的。實(shí)際工作中,凡 是不能或者不愿作連續(xù)監(jiān)測時(shí)就會(huì)遇到這樣的 區(qū)間刪失。區(qū)間刪失分兩種:第一類區(qū)間刪失( Case I Interval censoring )和第二類區(qū)間刪失(Case II Interval censoring )。當(dāng)對(duì)個(gè)體只進(jìn)行一次觀察,且個(gè)體的確切生存時(shí) 間不知道,只知道其

11、生存時(shí)間是否大于觀察時(shí)間 (即乙?;騌 8),這種刪失稱為第一類區(qū)間刪失, L U R WIIIIIIIII也稱為現(xiàn)實(shí)狀況數(shù)據(jù)(Current data)。當(dāng)對(duì)個(gè)體 進(jìn)行次觀察,其觀察時(shí)間L和R滿足0LRs 時(shí),這種刪失稱為第二類區(qū)間刪失,也稱為一般 區(qū)間刪失。如果初始時(shí)間(如艾滋病感染時(shí)間)和發(fā)生時(shí)間均為區(qū)間刪失,則稱生存時(shí)間為雙重區(qū)間刪失IIIIIIJJ(Double interval censoring )o三、截?cái)?Truncation) 在研究或者觀測中,淘汰了一些對(duì)象(樣本), 使得研究者“意識(shí)不到他們的存在”。對(duì)截?cái)鄶?shù)據(jù) 的分析構(gòu)造似然采用條件分布。截?cái)喟▋煞N:左截?cái)?Left

12、 truncation)和右截?cái)?Right truncation ) o1、左截?cái)?Left Truncation):只有個(gè)體經(jīng)歷某種初始事件以后才能觀察到其生存時(shí)間,稱為左 截?cái)?Left truncation),此時(shí)獲得的數(shù)據(jù)稱為左截?cái)鄶?shù)據(jù)(Left-truncated data)例如:暴露于某疾病、發(fā)生死亡前的中間事件等。退休中心老年居民死亡時(shí)間(沒到年齡沒有進(jìn)入 觀測) 左截?cái)嗯c左刪失的區(qū)別:在左截?cái)嗟难芯恐校?本沒有考慮那些在進(jìn)入研究之前已經(jīng)經(jīng)歷了感in興趣時(shí)間的個(gè)體,而在左刪失的研究中,我們能 獲得這些個(gè)體的部分信息。in即有左截?cái)嘤执嬖谟覄h失的情況,稱為左截?cái)嘤覄h失( Lef

13、t-truncation and right-censoring )2、右截?cái)?Right Truncation)生存分析課程總結(jié)只有經(jīng)歷了某種終止事件才能觀察到生存時(shí)間 (將要經(jīng)歷該事件的個(gè)體不包含在實(shí)驗(yàn)樣本中),稱為右截?cái)?Right truncation),此時(shí)獲得 的數(shù)據(jù)稱為右截?cái)鄶?shù)據(jù)(Right-truncated data)。例如:對(duì)艾滋病感染和發(fā)病時(shí)間觀測數(shù)據(jù),有些 個(gè)體感染病毒但尚未發(fā)病,這樣的個(gè)體不在樣本 范圍之內(nèi)。3、截?cái)嗟臄?shù)學(xué)表示l=J設(shè)Y是一個(gè)非負(fù)的表示生存時(shí)間的隨機(jī)變量;T 是另外一個(gè)表示截?cái)鄷r(shí)間的隨機(jī)變量。在左截?cái)嘞?,只有?dāng)y2T時(shí),才能觀察到T和Y; 在左截?cái)嘞拢?/p>

14、只有當(dāng)yT時(shí),才能觀察到T和Y。第三章基本函數(shù)和模型一、生存函數(shù)(Survival Function)描述生存時(shí)間統(tǒng)計(jì)特征的基本函數(shù),也叫生存率 (Survival Rate):設(shè)T表示生存時(shí)間,F(xiàn)(t)為T 分布函數(shù),生存函數(shù)定義為:附=叩“)=1_皿0 T t) = 1 -F(t) = j f (u)dutf (t) = - S (t)=-華dt生存函數(shù)S (t)的圖像叫做生存曲線(SurvivalCurve),如下圖:陡峭的生存曲線表示較低的生產(chǎn)率或較短的生 存時(shí)間;平緩的生存曲線表示較高的生存率或較 長的生存時(shí)間。離散生存時(shí)間產(chǎn)生于舍入操作將失效(或死亡) 時(shí)間分組從區(qū)間和壽命用整數(shù)計(jì)

15、量等。離散時(shí)間生存函數(shù)是非增的階梯函數(shù),當(dāng)T取值為,日回八 a a ta tii1.0 T.8.6 .40.0離散時(shí)間生存函數(shù)是非增的階梯函數(shù)二、危險(xiǎn)率函數(shù)(Hazard Function):危險(xiǎn)率函數(shù):描述觀察個(gè)體在某時(shí)刻存活條件下,在以后的單位時(shí)間內(nèi)死亡的(條件)概率:limh T0+當(dāng) T 連續(xù)=f(t) =_dlnS(t);麗dt當(dāng)T離散,取值為 A,Mm,a a a )=坎)ii i S (a )i-1S (a ) - S (a )S (a ) . 1Q .ii = 1 1 , I = 1,2, AS a 1)S a 1)s (t)=osm =n (1x)S (a )ia. ti1a

16、, t危險(xiǎn)率函數(shù)在工程上叫做失效率函數(shù)或損壞函數(shù),在生存分析和醫(yī)學(xué)統(tǒng)計(jì)中又稱為風(fēng)險(xiǎn)率函數(shù) 或瞬時(shí)死亡率(Simultaneous death rate)、或死亡 強(qiáng)度(Death intensity)、或條件死亡率生存分析課程總結(jié)(Conditional death rate)、或年齡死亡率(Age death rate)等。常見風(fēng)險(xiǎn)函數(shù)曲線謎增:自燃走化、 磨損說減;輟少見q死 亡發(fā)生輟早時(shí)浴盆:最常見:人 口死亡率駝晦:手術(shù)成攻I后 生存建模三、累積風(fēng)險(xiǎn)函數(shù)(Cumulative Hazard Function)累積危險(xiǎn)率函數(shù):a。)兒扁/ 人(u )du L 0當(dāng)T連續(xù), 私)=expL

17、 A(t)= expA( )=-InS Q當(dāng)T離散時(shí),危險(xiǎn)率函數(shù)有兩種定義形式:A()=當(dāng)氐)=& ln(1 X)ia t)= 4sO r (0)為平均壽命。五、常用的參數(shù)模型生存時(shí)間的分布一般不呈正態(tài)分布。常用的分布有:指數(shù)分布、威布爾(Weibull)分布、伽瑪(Gamma)分布、對(duì)數(shù)羅吉斯蒂(logistic)分布、對(duì)數(shù)正態(tài)分布。1、指數(shù)分布生存函數(shù)形式為:q=好場o,t0密度函數(shù)為:八)=心(頃)危險(xiǎn)率函數(shù)為:江)=入指數(shù)分布的一個(gè)重要性質(zhì):無記憶性(某事件的發(fā)生時(shí)間與歷史記錄無關(guān)),即P(T t + hT t)= P(T t)2、威布爾(Weibull)分布生存函數(shù)形式為:G= ex

18、p dtH 0心0其中、是尺度參數(shù),a是形狀參數(shù),a=1時(shí)為指數(shù)分布。危險(xiǎn)率函數(shù)為:餌玖而).適用于危險(xiǎn)率遞增(取a 1)、遞減(取a 1)和為常數(shù)(取a J等各種情形。 a = 13、伽瑪(Gamma)分布生存函數(shù):贏:j u P-i expQ uuTtpO其中g(shù)uP-iexp(-uk稱為伽瑪函數(shù)。0第四章生存數(shù)據(jù)基本特征的非參數(shù)估計(jì)一、生存函數(shù)的估計(jì)假設(shè)事件發(fā)生在D個(gè)嚴(yán)格區(qū)分的時(shí)間點(diǎn)上:t t A t tt PTt tt A p(t Tzt 勿Tt tt )ii ii-1 i-1221 1存在右刪失下:出.Y - d.*D PT t T t =i, i = 1,2, A , DiY :時(shí)刻

19、t,面臨危險(xiǎn)的個(gè)體數(shù);烏:時(shí)刻t,失效個(gè)體數(shù)三、乘積限(product-limit)估計(jì)乘積限估計(jì)又稱Kaplan-Meier估計(jì)階梯函數(shù),在觀察時(shí)間點(diǎn)上發(fā)生跳躍;跳躍的高度t與上發(fā)生的事件數(shù)和t前刪失數(shù)有ii關(guān);超出觀測上限的時(shí)間沒有給出很好的估計(jì)。四、乘積限估計(jì)尾部修正Efron(1967)建議最大觀察時(shí)間點(diǎn)以后的生存 函數(shù)等于0,即等價(jià)于假定最大時(shí)間點(diǎn)上的生存 者馬上就會(huì)死亡。(負(fù)偏估計(jì))Gill(1980)建議最大觀察時(shí)間點(diǎn)以后的生存函 數(shù)S或G),即假設(shè)最大時(shí)間點(diǎn)上的生存者永遠(yuǎn)-max不會(huì)死。(正偏估計(jì))Brown、Hollander 和 Kowar(1974)建議尾部估計(jì)為一條指數(shù)

20、曲線,即S(t )= exphnS(t 山 tmax max五、乘積限估計(jì)的方差dY(Y -d ) ti ti i iGreenwood 估計(jì)式:。2(t)“況(t)U以s六、生存函數(shù)點(diǎn)估計(jì)的置信區(qū)間 利用漸進(jìn)正態(tài)性的線性置信區(qū)間:C(t)-Z b (t)S(t)+ Z b (t)a Sa S11其他變換形式的非線性置信區(qū)間對(duì)數(shù)變換反正弦平方根IIIJJ七、累積死亡率的估計(jì) 無刪失條件下危險(xiǎn)率函數(shù)的估計(jì):)()_在時(shí)間t開始的區(qū)間中死亡的個(gè)數(shù)in-在時(shí)間t存活著的個(gè)體數(shù)x區(qū)間寬度有刪失條件下累計(jì)死亡率估計(jì):直接利用累積死亡率與生存函數(shù)的關(guān)系氐)=Ink (t)方差為:Nelson-Aalen

21、估計(jì)為()_z0,勺 t t、心Y1具有更好的小樣本性質(zhì)Nelson-Aalen估計(jì)的應(yīng)用1)用于選擇事件發(fā)生時(shí)間的參數(shù)模型2)為危險(xiǎn)率提供粗估計(jì)(對(duì)估計(jì)進(jìn)行核平滑后 計(jì)算斜率)八、累積死亡力函數(shù)的置信區(qū)間線性置信區(qū)間:(遍z b QM)+ z。)1 % Ha H1122其他變換形式的非線性置信區(qū)間對(duì)數(shù)變換區(qū)間反正弦平方根變化區(qū)間注:1、乘積限估計(jì)和Nelson-Aalen估計(jì)都是建立在非信息刪失(non-informative censoring )假設(shè)下2、乘積限估計(jì)的尾部估計(jì):a)取0; b)取最大觀測點(diǎn)的值;c)構(gòu)造指數(shù)曲線S(t )=expt lnG )/t ) max maxIII

22、JJ3、無刪失時(shí),乘積限估計(jì)即為經(jīng)驗(yàn)生存函數(shù)九、生命時(shí)間均值的估計(jì)平均生存時(shí)間:.fstk估計(jì)式為:0d =fs (t tT0方差為:vaTS(t)dt 丫土) i=1i i iIII十、左截?cái)嘤覄h失數(shù)據(jù)生存函數(shù)的估計(jì)只有生存到某時(shí)刻之后才能進(jìn)入觀察乘積限估計(jì)(獨(dú)立截?cái)嘞率亲畲笏迫还烙?jì))雙)=珂一弓(為條件估計(jì)) Yt. Vt L iY :在時(shí)刻t之前進(jìn)入?yún)^(qū)研究,且至少被研究到t的個(gè)體數(shù);iiidi:在時(shí)刻t,時(shí)死亡的個(gè)體數(shù)。Lai和Ying(1991)修正乘積限估計(jì):(當(dāng)風(fēng) 險(xiǎn)集較小時(shí)忽略此處的死亡)S()nh d,Y 待I為指數(shù)函數(shù);n為樣本大??; s 1 I / cnaY it Vt 1

23、 ic 0,0 51為常數(shù)。in十一、左刪失數(shù)據(jù)生存函數(shù)估計(jì)利用“時(shí)間倒轉(zhuǎn)法”:即不是從原點(diǎn)處測量時(shí)間,而是從很大的一個(gè)時(shí)間T倒著從相反的方向測量,用時(shí)間減去原始時(shí)間,得到右刪失數(shù)據(jù)結(jié)構(gòu),利用乘積 限估計(jì)式估計(jì)PG - X t)= P(X T -t)純粹左刪失情況很少見。十二、同時(shí)存在左、右刪失情況設(shè)0=t t At為觀察時(shí)間點(diǎn),d表示t時(shí)的死亡12mjj數(shù),,表示t時(shí)的右刪失數(shù),c表示t時(shí)的左刪失數(shù),則生存函數(shù)的迭代估計(jì)步驟為:in步驟0:忽略左刪失獲得乘積限估計(jì)作為S ()的0 j初始估計(jì);s () 5、()K 1 - S 5),盤 i)K jp = Pt x t X tijj-1j i步

24、驟(K+1)1:使用S的當(dāng)前估計(jì)值通過估計(jì) i步驟(K+1)2:使用上一步驟的結(jié)果,估計(jì)在,j時(shí)發(fā)生的事件數(shù)為d = d 4pj j i i=j步驟(K+1)3:使用上一步修正后的右刪失數(shù) 據(jù),仍然忽略左刪失計(jì)算乘積限估計(jì)。如果這一估計(jì)在所有,處都有s G)接近S Q,則停止迭代, 否則繼續(xù)步醵1。 心 K 十三、右截?cái)鄶?shù)據(jù)生成函數(shù)的估計(jì)傳染病的研究中比較常見。設(shè)廣代表第個(gè)個(gè)體被 Ti傳染的時(shí)間,X是從感染到發(fā)病的時(shí)間。研究樣X i本包含從0到,期間病人的觀測值T,X).(只有在 時(shí)間T之前發(fā)病的人才進(jìn)入研究)。1 1 V利用顛倒時(shí)間軸法:令.K,X則變?yōu)?左截?cái)嗟模?x XR便可構(gòu)造貳小.0

25、)= M 5 .)的乘積限估計(jì)式。十四、生命表中生存函數(shù)的估計(jì)生命表(也稱壽命表,life table)方法是測定死亡=j率和描述群體生存現(xiàn)象的最古老的技術(shù)之一。主要用于保險(xiǎn)精算、人口學(xué)、醫(yī)學(xué)等方面。一組(大規(guī)模)個(gè)體在整個(gè)考察時(shí)間上被連續(xù)觀S 1個(gè)相鄰但不重疊的區(qū)間內(nèi)K十1a, a )(j = 1,A , k +1)察,它們的事件發(fā)生時(shí)間或刪失時(shí)間被記入j1 j根據(jù)生命表方法應(yīng)用的范圍不同,可分為人口生 命表和臨床生命表,分析方法相似。生命表方法數(shù)據(jù)假設(shè) 失和退出)與它們?nèi)绻恢北挥^察到事件發(fā)生所 得到的死亡時(shí)間是獨(dú)立的。(1)獨(dú)立刪失:假定刪失的事件時(shí)間(包括損IIIIII(2)假定刪失時(shí)

26、間和死亡時(shí)間是均勻分布在每in個(gè)區(qū)間上的。(3)假定死亡力在區(qū)間內(nèi)是常數(shù)。生命表的構(gòu)造方法第一列給出相鄰但不重疊的固定區(qū)間/A ,a)(j =盤,k + 1),a = 0,a =8事件發(fā)生時(shí)間和刪失時(shí)i j -1 j0k +1間將落入且只落入其中的一個(gè)區(qū)間。第二列給出進(jìn)入第j個(gè)區(qū)間的對(duì)象數(shù)仃這些個(gè)體還沒有經(jīng)歷觀察事件的發(fā)生。j第三列給出在第j個(gè)區(qū)間中失去蹤跡(死亡)或活著退出觀察(遷出)的個(gè)體數(shù)w第四列給出在第j個(gè)區(qū)間中,面臨觀察事件風(fēng)險(xiǎn)的暴露數(shù)y的一個(gè)估計(jì)值,假設(shè)刪失時(shí)間在區(qū)間上是均勻分布的,則_, w/2Y Y W / 2第五列是在第j個(gè)區(qū)尚申發(fā)里觀察事件(如死亡)的個(gè)體數(shù)第六列給出在第j

27、個(gè)區(qū)間起點(diǎn)處的生存函數(shù)的估計(jì)北)對(duì)于第一個(gè)區(qū)間)= 1,且jj -1d / Y頊(-d / Yj10jjjji1生命表分析的主要任務(wù)就是估計(jì)S (),基本思想: 乘積限方法。j第七列給出估計(jì)的第.個(gè)區(qū)間中點(diǎn)處的概率 密度函數(shù)f a ),其中1 * )/2它表示在第j個(gè)區(qū) 間上單位時(shí)間內(nèi)發(fā)生觀束事件的概率,即 f a 其一 S C 此 一 a ) TOC o 1-5 h z mjj -1j jj-1第八列給出在第j個(gè)區(qū)間中點(diǎn)處估計(jì)的危險(xiǎn)率 Ja),由 *G)=f(/)/S0有4 )j( )()()() D( ) ( )1 ( )C()()3)= f (a)/S(a)=f (a)/S(a)+ S、

28、)-S(月2史 2f (a)/(a)- S(a)mjmjmjmjjj - 1jmjj - 1j也可以定義為每個(gè)個(gè)體單位時(shí)間的時(shí)間發(fā)生率J (a )= d /k - a )(-d Smj j j j -1 j j:后一個(gè)區(qū)間在理論上是無限的,所以 沒有任何危險(xiǎn)或概率密度函數(shù)的估計(jì)。第九列是第j個(gè)區(qū)間起點(diǎn)生存函數(shù)標(biāo)準(zhǔn)差的估計(jì)值,Greenwood(1976)將其定義為:S ():丈-1 d /Y Y - d)Xj j-1 i i i iL i=1祥。其中SE的估計(jì)的標(biāo)準(zhǔn)差為0 其形式與乘積限估計(jì)式的標(biāo)準(zhǔn)差估計(jì)第十列給出在第j個(gè)區(qū)間中點(diǎn)處概率密度函 數(shù)標(biāo)注差的估計(jì)值,它近似等于(j-j悻1 q/(Y

29、p)+Yp, (a - a1 i i i i i其中 q, =d /y ,p, = 1 -q,.生命表的最后一列給出了第 個(gè)區(qū)間中點(diǎn)處j仇(。)Kmqj j危險(xiǎn)率函數(shù)的標(biāo)準(zhǔn)差的估計(jì),它近似等于1 一仄(a )(a a)/22i/2 TOC o 1-5 h z mj jj1第五章 相對(duì)風(fēng)險(xiǎn)回歸模型一、Cox相對(duì)風(fēng)險(xiǎn)模型設(shè)氐;X)= lim P(t T t, x)/ h = X (t) r(t, x) hT0+0t 0 x)成為相對(duì)風(fēng)險(xiǎn)。M)為基準(zhǔn)風(fēng)險(xiǎn)函數(shù)。x為協(xié),0變量。二、相對(duì)風(fēng)險(xiǎn)回歸模型(Cox模型)取 r(t, x )= expt (t )P 唧得 C0X m0del&x)=M)expt伽

30、】其中:Z(r)=t(r)A ,t (j為協(xié)變量x和t的函級(jí)1X (t)= X(t|x)= (0,A ,0)p=U p)為未知的回歸參數(shù)Relative risk model(Cox model)e沖11),偽參數(shù)部分P=(3,A )為未知參數(shù)B )為非參數(shù)部分,未如基準(zhǔn)函數(shù),因此,相對(duì)風(fēng)險(xiǎn)模型為半?yún)?shù)模型。在Cox模型下:生存時(shí)間的分布函數(shù)為S(t; x) = P(T 11 x)=exp-/ 人(u)expZ(u) Pdu0密度函數(shù)為:f (t; x) = X(t; x) F (t; x)三、幾個(gè)簡單示例最簡單模型:X(t; x)=k (t)exp( xp), x = 0,1 o0 : control group1: treatment groupP:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論