




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第一章生存分析介紹1導(dǎo)言2簡(jiǎn)略摘要3目標(biāo)4正文5總結(jié)6練習(xí)7實(shí)驗(yàn)8練習(xí)答案第一章生存分析介紹1導(dǎo)言1導(dǎo)言
這一章給出了生存分析數(shù)據(jù)的描述性分析步驟。分析步驟包括生存分析涉及的問(wèn)題類型、結(jié)局變量的考慮、刪失數(shù)據(jù)的考慮、生存函數(shù)和風(fēng)險(xiǎn)函數(shù)的表述、生存分析數(shù)據(jù)的規(guī)劃(即數(shù)據(jù)輸入計(jì)算機(jī)時(shí)的編排方法)、生存分析的目標(biāo)、生存分析實(shí)例。因?yàn)樵撜轮饕敲枋鲂詢?nèi)容,數(shù)學(xué)、統(tǒng)計(jì)學(xué)、流行病學(xué)知識(shí)并不是絕對(duì)必要的。但是讀者對(duì)流行病學(xué)原理以及對(duì)數(shù)學(xué)符號(hào)和公式的了解將會(huì)大有利于對(duì)本書(shū)的學(xué)習(xí)。
導(dǎo)言這一章給出了生存分析數(shù)據(jù)的描述性分析步驟。2簡(jiǎn)略摘要1什么是生存分析2刪失數(shù)據(jù)3術(shù)語(yǔ)及符號(hào)4生存分析的目的5基于計(jì)算機(jī)應(yīng)用的數(shù)據(jù)格式6用于理解分析的數(shù)據(jù)格式7生存時(shí)間的描述性統(tǒng)計(jì)8例題9多變量例題10生存分析的數(shù)學(xué)模型簡(jiǎn)略摘要1什么是生存分析3學(xué)習(xí)目標(biāo)1辨認(rèn)或描述生存分析所涉及的問(wèn)題類型2刪失數(shù)據(jù)的定義3右刪失數(shù)據(jù)的定義4造成數(shù)據(jù)刪失的三個(gè)主要原因5生存函數(shù)的定義、辨認(rèn)、解釋6風(fēng)險(xiǎn)函數(shù)的定義、辨認(rèn)、解釋7生存函數(shù)與風(fēng)險(xiǎn)函數(shù)的關(guān)系8生存分析的三個(gè)主要目的9應(yīng)用于計(jì)算機(jī)的原始數(shù)據(jù)編排格式的識(shí)別或辨認(rèn),特別是能夠按照這種編排格式進(jìn)行數(shù)據(jù)設(shè)置學(xué)習(xí)目標(biāo)1辨認(rèn)或描述生存分析所涉及的問(wèn)題類型410應(yīng)用于模型理論理解的編排格式或組成部分的識(shí)別或辨認(rèn),特別是能夠按照這種編排格式進(jìn)行數(shù)據(jù)設(shè)置11實(shí)例的生存曲線或風(fēng)險(xiǎn)函數(shù)的解釋及比較12給出一個(gè)實(shí)例,根據(jù)解釋變量與生存時(shí)間之間的關(guān)系來(lái)陳述生存分析的目的13平均生存期或平均風(fēng)險(xiǎn)的計(jì)算或解釋14兩組生存數(shù)據(jù)風(fēng)險(xiǎn)比的定義或解釋10應(yīng)用于模型理論理解的編排格式或組成部分的識(shí)別或辨認(rèn),特5正文(Presentation)該章給出了生存分析的總體介紹,基于流行病學(xué)特定類型或其他數(shù)據(jù)的流行的數(shù)據(jù)分析步驟。這一章的重點(diǎn)是生存分析涉及的問(wèn)題、目的、主要的術(shù)語(yǔ)及符號(hào)、原始數(shù)據(jù)編排、實(shí)例。正文(Presentation)該章給出了生存6重點(diǎn)問(wèn)題目的術(shù)語(yǔ)及符號(hào)數(shù)據(jù)排版例題重點(diǎn)問(wèn)題目的術(shù)語(yǔ)及符號(hào)數(shù)據(jù)排版例題7一生存分析一般而言,生存分析是數(shù)據(jù)分析的統(tǒng)計(jì)學(xué)過(guò)程的集合。它所關(guān)心的結(jié)局變量為研究事件發(fā)生時(shí)的時(shí)間。一生存分析一般而言,生存分析是數(shù)據(jù)分析的統(tǒng)計(jì)8生存時(shí)間:?jiǎn)挝皇悄辍⒃?、周、日。是從?duì)研究對(duì)象開(kāi)始隨訪到研究事件發(fā)生的時(shí)間。
研究事件:可以是死亡、疾病發(fā)生、復(fù)發(fā)、痊愈或者是任何事先指定的感興趣的事件。雖然在一次研究中會(huì)有不止一個(gè)結(jié)局事件發(fā)生,但是我們假設(shè)只有一個(gè)事件是研究者感興趣的。當(dāng)考慮的結(jié)局事件不止一個(gè)時(shí),涉及到的統(tǒng)計(jì)學(xué)問(wèn)題為周期性事件或競(jìng)爭(zhēng)性危險(xiǎn)問(wèn)題,這將在第八、第九章中分別介紹。1生存分析生存時(shí)間:?jiǎn)挝皇悄?、月、周、日。是從?duì)研究對(duì)象開(kāi)始隨訪到研究9在生存分析中,通常把時(shí)間變量稱為生存時(shí)間,因?yàn)樗砹搜芯繉?duì)象在隨訪期間“生存”的時(shí)間。研究事件稱為終點(diǎn),因?yàn)檠芯渴录ǔJ撬劳?、疾病發(fā)生或其他消極事件。生存時(shí)間也可以是經(jīng)過(guò)外科手術(shù)重返工作崗位的時(shí)間按。這里的終點(diǎn)是一個(gè)積極事件。1生存分析在生存分析中,通常把時(shí)間變量稱為生存時(shí)間,因?yàn)?0結(jié)局變量:研究事件發(fā)生的
開(kāi)始隨訪研究事件時(shí)間1生存分析結(jié)局變量:研究事件發(fā)生的
開(kāi)始隨訪11研究事件:死亡、發(fā)病、復(fù)發(fā)、痊愈
假設(shè)結(jié)局為一個(gè)研究事件周期性事件>一個(gè)研究事件或競(jìng)爭(zhēng)性危險(xiǎn)時(shí)間生存時(shí)間
事件終點(diǎn)事件1生存分析研究事件:死亡、發(fā)病、復(fù)發(fā)、痊愈
假設(shè)結(jié)局為一個(gè)研究事件時(shí)間12簡(jiǎn)要介紹關(guān)于生存分析的五個(gè)例題第一個(gè)例子:,對(duì)處于緩和期的白血病患者,隨訪幾個(gè)星期后,看其能保持緩和期多長(zhǎng)時(shí)間。第二個(gè)例子:對(duì)一個(gè)身體健康無(wú)疾病的隊(duì)列,隨訪幾年后看有哪些研究對(duì)象患心臟病。第三個(gè)例子:對(duì)一個(gè)年齡大于60歲的人群,隨訪13年,觀察他們的生存期。第四個(gè)例子:對(duì)一些新近釋放的假釋犯,隨訪幾個(gè)星期,觀察他們是否又被重新拘捕。這種研究稱為累犯研究。第五個(gè)例子:追蹤隨訪經(jīng)過(guò)心臟移植手術(shù)的患者的生存期。1生存分析簡(jiǎn)要介紹關(guān)于生存分析的五個(gè)例題第一個(gè)例子:,對(duì)處于緩和期的白13以上五個(gè)例子均屬于生存分析的范疇,因?yàn)樗麄兊慕Y(jié)局變量都是某個(gè)特定事件發(fā)生時(shí)的時(shí)間。在第一個(gè)關(guān)于白血病患者的例子中,研究者感興趣的終點(diǎn)事件是患者脫離緩和期,結(jié)局變量是處于緩和期的病人從進(jìn)入研究到脫離緩和期所用的時(shí)間(周)。第二個(gè)例子的終點(diǎn)事件是“患心臟病”,結(jié)局變量是健康人群從進(jìn)入研究到患心臟病所用的時(shí)間(年)。第三個(gè)例子的終點(diǎn)事件是死亡,結(jié)局變量是年齡大于60歲的人群從進(jìn)入研究到死亡所用的時(shí)間(年)。第四個(gè)例子是一個(gè)社會(huì)學(xué)研究而不是一個(gè)醫(yī)學(xué)研究,所關(guān)心的終點(diǎn)事件是“重新被拘捕”,結(jié)局變量是假釋犯從被釋放到再一次被拘捕所經(jīng)歷的時(shí)間(周)。第五個(gè)例子的終點(diǎn)事件是死亡,結(jié)局變量是患者從接受心臟移植到死亡生存的時(shí)間。1生存分析以上五個(gè)例子均屬于生存分析的范疇,因?yàn)樗麄兊?4二刪失數(shù)據(jù)
絕大多數(shù)的生存分析必須考慮刪失問(wèn)題,當(dāng)我們獲得了研究對(duì)象生存時(shí)間的部分信息,而不知道確切的生存時(shí)間時(shí),刪失就發(fā)生了。刪失——不知道確切生存時(shí)間二刪失數(shù)據(jù)絕大多數(shù)的生存分析必須考慮刪失問(wèn)15舉一個(gè)簡(jiǎn)單的關(guān)于刪失的例子,以X表示一組處于緩和期的白血病患者,對(duì)他們進(jìn)行隨訪直到這些患者脫離緩和期。對(duì)于某個(gè)患者,當(dāng)研究結(jié)束時(shí),他仍處于緩和期,終點(diǎn)事件沒(méi)有發(fā)生,該病人的生存時(shí)間就認(rèn)為是刪失的。對(duì)于這個(gè)患者,他的生存時(shí)間至少是研究者對(duì)他進(jìn)行隨訪的時(shí)間,但是若他在研究結(jié)束以后才脫離緩和期,研究者就不知道他的確切的生存時(shí)間。2刪失數(shù)據(jù)舉一個(gè)簡(jiǎn)單的關(guān)于刪失的例子,以X表示一組處于緩和期的白血病患16一般造成刪失的原因有三個(gè)
1直到研究結(jié)束時(shí)研究對(duì)象仍未發(fā)生終點(diǎn)事件
2研究對(duì)象在研究期間發(fā)生失訪
3研究對(duì)象因死亡而退出研究(如果死亡不是研究者感興趣的事件)或其他原因(如藥物副反應(yīng)或其他風(fēng)險(xiǎn))
研究結(jié)束——終點(diǎn)事件未發(fā)生
刪失失訪
中途退出2刪失數(shù)據(jù)一般造成刪失的原因有三個(gè)
1直到研究結(jié)束時(shí)研究對(duì)象仍未發(fā)生17
2刪失數(shù)據(jù)以圖例的形式描述幾個(gè)研究對(duì)象的隨訪經(jīng)歷,以X表示發(fā)生終點(diǎn)事件的研究對(duì)象。
例
2刪失數(shù)據(jù)以圖例的形式描述幾個(gè)研究對(duì)象的隨訪經(jīng)歷,以X表18研究對(duì)象A在研究開(kāi)始時(shí)進(jìn)入研究,五周后發(fā)生終點(diǎn)事件,他的生存時(shí)間是5周,不屬于刪失
研究對(duì)象B也是在研究開(kāi)始時(shí)進(jìn)入研究,但是在12周的研究期結(jié)束以后仍未發(fā)生終點(diǎn)事件,生存時(shí)間屬于刪失,因?yàn)槲覀冎恢浪辽偕娴?2周
研究對(duì)象C在研究開(kāi)始后第2.5周進(jìn)入研究,在第六周時(shí)退出研究,他的生存時(shí)間為3.5周,屬于刪失
研究對(duì)象D在研究開(kāi)始后第4周進(jìn)入研究,直到研究結(jié)束時(shí)仍未發(fā)生終點(diǎn)事件,他的刪失時(shí)間為8周
研究對(duì)象E在研究開(kāi)始后第3周進(jìn)入研究,在隨訪到第九周時(shí)發(fā)生失訪,他的刪失時(shí)間為6周
研究對(duì)象F在研究開(kāi)始后第8周進(jìn)入研究,隨訪到第11.5周時(shí)發(fā)生終點(diǎn)事件,與研究對(duì)象A一樣,沒(méi)有發(fā)生刪失,他的生存時(shí)間為3.5周2刪失數(shù)據(jù)研究對(duì)象A在研究開(kāi)始時(shí)進(jìn)入研究,五周后發(fā)生終點(diǎn)事件,他的生存19總結(jié)
六個(gè)研究對(duì)象中,有兩個(gè)發(fā)生終點(diǎn)事件,為A與F,四個(gè)發(fā)生刪失,為B、C、D、E。2刪失數(shù)據(jù)總結(jié)
六個(gè)研究對(duì)象中,有兩個(gè)發(fā)生終點(diǎn)事件,為A與F,四個(gè)發(fā)生20六名研究對(duì)象的生存時(shí)間表2刪失數(shù)據(jù)在該表最后一列中,以1表示研究對(duì)象發(fā)生了終點(diǎn)事件,以0表示發(fā)生刪失。生存時(shí)間的單位為周六名研究對(duì)象的生存時(shí)間表2刪失數(shù)據(jù)在該表最后一列中,以1表21刪失類型2刪失數(shù)據(jù)刪失類型2刪失數(shù)據(jù)222刪失數(shù)據(jù)右刪失——當(dāng)研究結(jié)束時(shí)研究對(duì)象未發(fā)生終點(diǎn)事件、失訪、中途退出造成的刪失稱為右刪失。
雖然研究對(duì)象也可能發(fā)生左刪失,但大部分刪失都是右刪失。2刪失數(shù)據(jù)右刪失——當(dāng)研究結(jié)束時(shí)研究對(duì)象未發(fā)23左刪失——研究對(duì)象的確切生存時(shí)間小于或等于觀察的生存時(shí)間。例如,隨訪一個(gè)研究對(duì)象直到他表現(xiàn)為HIV陽(yáng)性,研究者一般將研究對(duì)象第一次HIV測(cè)試陽(yáng)性作為終點(diǎn)事件。但是研究者不知道研究對(duì)象接觸到HIV病毒的確切時(shí)間,也就不知道研究對(duì)象確切的HIV呈陽(yáng)性的時(shí)間。這樣該研究對(duì)象的生存時(shí)間屬于左刪失,因?yàn)樗嬲纳鏁r(shí)間是從隨訪開(kāi)始到感染HIV的時(shí)間,小于觀察的生存時(shí)間(從隨訪開(kāi)始到HIV測(cè)試陽(yáng)性的時(shí)間)2刪失數(shù)據(jù)左刪失——研究對(duì)象的確切生存時(shí)間小于或等于觀察24三術(shù)語(yǔ)與符號(hào)三術(shù)語(yǔ)與符號(hào)25T——隨機(jī)變量,生存時(shí)間,大于或等于0t——隨機(jī)變量T的某一個(gè)確切值,例如,觀察某個(gè)研究對(duì)象經(jīng)過(guò)癌癥治療以后生存期能否超過(guò)5年,此時(shí)t=5,T>5?3術(shù)語(yǔ)與符號(hào)T——隨機(jī)變量,生存時(shí)間,大于或等于0t——隨機(jī)變量T的某26以希臘字母作為終點(diǎn)事件是否發(fā)生的指示變量,它是一個(gè)隨機(jī)變量3術(shù)語(yǔ)與符號(hào)
研究結(jié)束時(shí)未發(fā)生終點(diǎn)事件=0失訪中途退出以希臘字母作為終點(diǎn)事件是否發(fā)生的指示變量,它是一個(gè)隨27生存函數(shù)與風(fēng)險(xiǎn)函數(shù)3術(shù)語(yǔ)與符號(hào)生存函數(shù)與風(fēng)險(xiǎn)函數(shù)3術(shù)語(yǔ)與符號(hào)28生存函數(shù)表示研究對(duì)象活過(guò)某個(gè)時(shí)間的概率,即T>t的概率3術(shù)語(yǔ)與符號(hào)生存函數(shù)表示研究對(duì)象活過(guò)某個(gè)時(shí)間的概率,即T>t的概率3術(shù)29生存函數(shù)是生存分析的基礎(chǔ),因?yàn)橹懒瞬煌瑃值的生存概率,就獲得了關(guān)于生存數(shù)據(jù)的最關(guān)鍵信息理論上,t的取值范圍為0-∞,生存函數(shù)的圖形是一條光滑的曲線3術(shù)語(yǔ)與符號(hào)生存函數(shù)是生存分析的基礎(chǔ),因?yàn)橹懒瞬煌瑃值的生存概率,就獲30以生存時(shí)間t為橫軸,生存函數(shù)s(t)為縱軸,繪制生存曲線。由圖可以觀察得到生存曲線的以下特點(diǎn)(1)生存曲線是一條非增曲線,隨著t的增加,不斷下降。(2)t=0時(shí),s(t)=s(0)=1。即研究開(kāi)始時(shí),沒(méi)有研究對(duì)象出現(xiàn)終點(diǎn)事件。在0時(shí)刻的生存概率為1(3)t→∞時(shí),s(t)=s(∞)=0。即理論上,若研究時(shí)間沒(méi)有限制,最后將沒(méi)有研究對(duì)象存活。所以生存曲線最終下降為0。這種情形是生存曲線的理論模型3術(shù)語(yǔ)與符號(hào)以生存時(shí)間t為橫軸,生存函數(shù)s(t)為縱軸,繪制生存曲線。由31對(duì)于實(shí)際數(shù)據(jù),生存函數(shù)的圖形是階梯狀的,而不是光滑曲線。由于研究期限不可能無(wú)限長(zhǎng)以及競(jìng)爭(zhēng)風(fēng)險(xiǎn)的存在,因此不是所有的研究對(duì)象都會(huì)發(fā)生終點(diǎn)事件。以表示估計(jì)的生存函數(shù),在研究結(jié)束時(shí),生存曲線不一定下降為0。3術(shù)語(yǔ)與符號(hào)對(duì)于實(shí)際數(shù)據(jù),生存函數(shù)的圖形是階梯狀的,而不32以h(t)表示風(fēng)險(xiǎn)函數(shù),風(fēng)險(xiǎn)函數(shù)公式為3術(shù)語(yǔ)與符號(hào)
表示一個(gè)小的時(shí)間區(qū)間以h(t)表示風(fēng)險(xiǎn)函數(shù),風(fēng)險(xiǎn)函數(shù)公式為3術(shù)語(yǔ)與符號(hào)33h(t)表示在時(shí)間t仍存活的研究對(duì)象,每單位時(shí)間終點(diǎn)事件發(fā)生的瞬時(shí)可能。與生存函數(shù)相反,生存函數(shù)關(guān)注的是未發(fā)生終點(diǎn)事件,風(fēng)險(xiǎn)函數(shù)關(guān)注的則是終點(diǎn)事件的發(fā)生。在某種程度上,風(fēng)險(xiǎn)函數(shù)可以認(rèn)為是給出了生存函數(shù)蘊(yùn)含的信息的相反的一面。3術(shù)語(yǔ)與符號(hào)h(t)表示在時(shí)間t仍存活的研究對(duì)象,每單位時(shí)34以速度的例子解釋瞬時(shí)可能的意義。在你開(kāi)車(chē)時(shí)看到速度儀顯示的速度為60英里每小時(shí),這意味著在未來(lái)的一小時(shí)內(nèi)你將在這條路上行駛60英里。這就是瞬時(shí)可能的意義。速度儀上的數(shù)字決定你在未來(lái)一小時(shí)內(nèi)行駛多長(zhǎng)的距離。由于你可能在未來(lái)的一小時(shí)內(nèi)減速或加速,也有可能停車(chē),所以60英里每小時(shí)的讀數(shù)并不能說(shuō)明你在未來(lái)一小時(shí)內(nèi)真正行駛的距離。速度儀僅僅說(shuō)明你在某一瞬間的行駛速度。
與速度的含義相似,風(fēng)險(xiǎn)函數(shù)表示生存到t時(shí)刻的研究對(duì)象,在t時(shí)刻失效事件(死亡或發(fā)?。┌l(fā)生的瞬時(shí)可能。這與速度的例子是類似的,假設(shè)你已經(jīng)行駛了一段時(shí)間,這時(shí)速度儀上的速度也是一個(gè)瞬時(shí)可能。3術(shù)語(yǔ)與符號(hào)以速度的例子解釋瞬時(shí)可能的意義。在你開(kāi)車(chē)時(shí)看到速度儀顯示的速35風(fēng)險(xiǎn)函數(shù)公式極限符號(hào)右側(cè)的分子部分是一個(gè)條件函數(shù),它表示在給定條件A的前提下,B的概率。即已經(jīng)生存到t時(shí)刻的研究對(duì)象在(t,t+)時(shí)間區(qū)間內(nèi)終點(diǎn)事件發(fā)生的概率。由于風(fēng)險(xiǎn)函數(shù)利用了條件概率的形式,因此風(fēng)險(xiǎn)函數(shù)有時(shí)被稱為條件風(fēng)險(xiǎn)率。3術(shù)語(yǔ)與符號(hào)風(fēng)險(xiǎn)函數(shù)公式極限符號(hào)右側(cè)的分子部分是一個(gè)36風(fēng)險(xiǎn)函數(shù)是一個(gè)比率而不是概率由風(fēng)險(xiǎn)函數(shù)的公式可知,極限符號(hào)右側(cè)是兩個(gè)數(shù)值之比,分子是條件概率,分母是一個(gè)小的時(shí)間區(qū)間,分子與分母相除以后得到的是每單位時(shí)間的概率,不再是概率而是比率,它的取值范圍與概率的取值范圍不同,概率的取值范圍為0-1,而極限符號(hào)右側(cè)的取值范圍為0-∞,其大小取決于時(shí)間的單位是天、周、月還是年。3術(shù)語(yǔ)與符號(hào)風(fēng)險(xiǎn)函數(shù)是一個(gè)比率而不是概率由風(fēng)險(xiǎn)函數(shù)的公式可知37舉例說(shuō)明風(fēng)險(xiǎn)函數(shù)的取值,以P表示條件概率,P=1/3,時(shí)間區(qū)間 為1/2天,兩數(shù)相除可得每單位時(shí)間的概率,P值保持不變,時(shí)間區(qū)間的單位由天改為周,則1/2天等于1/14周,兩數(shù)相除可得每單位時(shí)間的概率,計(jì)算結(jié)果見(jiàn)下表 3術(shù)語(yǔ)與符號(hào)舉例說(shuō)明風(fēng)險(xiǎn)函數(shù)的取值,以P表示條件概率,P=38對(duì)于相同的條件概率,時(shí)間區(qū)間的單位不同時(shí),計(jì)算得到的結(jié)果不同,其值有可能大于一。3術(shù)語(yǔ)與符號(hào)對(duì)于相同的條件概率,時(shí)間區(qū)間的單位不同時(shí),計(jì)算39趨于零,對(duì)公式右側(cè)的表達(dá)式取極限,可以得到t時(shí)刻每單位時(shí)間失效事件發(fā)生的概率。另一種說(shuō)法是風(fēng)險(xiǎn)函數(shù)或條件風(fēng)險(xiǎn)比表示已生存到t時(shí)刻的研究對(duì)象,在t時(shí)刻每單位時(shí)間失效事件發(fā)生的瞬時(shí)可能。3術(shù)語(yǔ)與符號(hào)趨于零,對(duì)公式右側(cè)的表達(dá)式取極限,可以40下圖是三個(gè)風(fēng)險(xiǎn)函數(shù)隨時(shí)間變化的圖形,不同于生存函數(shù),風(fēng)險(xiǎn)函數(shù)的取值不一定從1開(kāi)始,一直下降為0,而是可以從任意值開(kāi)始,向任意方向上升或下降,但總是大于零。3術(shù)語(yǔ)與符號(hào)下圖是三個(gè)風(fēng)險(xiǎn)函數(shù)隨時(shí)間變化的圖形,不同于生存函數(shù),風(fēng)險(xiǎn)函數(shù)41對(duì)于一個(gè)給定的t值,風(fēng)險(xiǎn)函數(shù)具有以下兩個(gè)特點(diǎn):1風(fēng)險(xiǎn)函數(shù)是非負(fù)的,h(t)≥02風(fēng)險(xiǎn)函數(shù)沒(méi)有上界,即風(fēng)險(xiǎn)函數(shù)的取值范圍為0-∞原因:由風(fēng)險(xiǎn)函數(shù)的公式可知,風(fēng)險(xiǎn)函數(shù)的分子與分母都是非負(fù)的,分母的取值范圍為0-∞3術(shù)語(yǔ)與符號(hào)對(duì)于一個(gè)給定的t值,風(fēng)險(xiǎn)函數(shù)具有以下兩個(gè)特點(diǎn):1風(fēng)險(xiǎn)函數(shù)是42風(fēng)險(xiǎn)函數(shù)的圖形類型
1常數(shù)風(fēng)險(xiǎn)函數(shù)3術(shù)語(yǔ)與符號(hào)第一個(gè)圖是健康人群的風(fēng)險(xiǎn)函數(shù)圖,由圖可知,不論t取何值,h(t)均等于一個(gè)常數(shù)——,即對(duì)于一個(gè)研究對(duì)象而言,若他/她在研究期間一直保持健康狀態(tài),那么他/她在研究期間的任何時(shí)間患病的瞬時(shí)可能性均相同。當(dāng)風(fēng)險(xiǎn)函數(shù)為一常數(shù)時(shí),這時(shí)的生存模型就是指數(shù)模型風(fēng)險(xiǎn)函數(shù)的圖形類型
1常數(shù)風(fēng)險(xiǎn)函數(shù)3術(shù)語(yǔ)與符號(hào)第一個(gè)圖是432隨時(shí)間遞增的風(fēng)險(xiǎn)函數(shù)由圖可知,風(fēng)險(xiǎn)函數(shù)隨著時(shí)間的延長(zhǎng)而增大。這種圖形稱為遞增的Weibull模型。這種圖形適用于以死亡為失效事件的白血病,而不是用于疾病治療后的反應(yīng)。對(duì)于一個(gè)白血病人,隨著生存期的延長(zhǎng),預(yù)后變差,病人的死亡風(fēng)險(xiǎn)將會(huì)增加。3術(shù)語(yǔ)與符號(hào)2隨時(shí)間遞增的風(fēng)險(xiǎn)函數(shù)由圖可知,風(fēng)險(xiǎn)函數(shù)隨著時(shí)間的延長(zhǎng)而增443隨時(shí)間遞減的風(fēng)險(xiǎn)函數(shù)風(fēng)險(xiǎn)函數(shù)隨時(shí)間不斷減小。這種類型的圖形稱為遞減的Weibull模型。這種模型適用于經(jīng)過(guò)外科手術(shù)治療處于恢復(fù)期的病人,失效事件為死亡。處于恢復(fù)期的病人,隨著生存期的延長(zhǎng),預(yù)后變好,病人的死亡風(fēng)險(xiǎn)將會(huì)減少。3術(shù)語(yǔ)與符號(hào)3隨時(shí)間遞減的風(fēng)險(xiǎn)函數(shù)風(fēng)險(xiǎn)函數(shù)隨時(shí)間不斷減小。這種類型的圖454先增后減的風(fēng)險(xiǎn)函數(shù)該圖顯示風(fēng)險(xiǎn)函數(shù)是先增加后減少。該類型的代表是對(duì)數(shù)正態(tài)生存模型。肺結(jié)核病人的風(fēng)險(xiǎn)函數(shù)屬于這種類型,病人的死亡風(fēng)險(xiǎn)在早期是遞增的,經(jīng)過(guò)一段時(shí)間以后會(huì)逐漸下降。3術(shù)語(yǔ)與符號(hào)4先增后減的風(fēng)險(xiǎn)函數(shù)該圖顯示風(fēng)險(xiǎn)函數(shù)是先增加后減少。該類型46生存函數(shù)與風(fēng)險(xiǎn)函數(shù)的關(guān)系生存函數(shù)對(duì)于生存數(shù)據(jù)的分析而言,具有更大的吸引力,因?yàn)樗苯用枋鲆粋€(gè)研究隊(duì)列的生存經(jīng)歷。3術(shù)語(yǔ)與符號(hào)生存函數(shù)與風(fēng)險(xiǎn)函數(shù)的關(guān)系生存函數(shù)對(duì)于生存數(shù)據(jù)的分析而言,具有47應(yīng)用風(fēng)險(xiǎn)函數(shù)主要基于以下幾個(gè)原因1風(fēng)險(xiǎn)函數(shù)可以計(jì)算瞬時(shí)可能性(概率),而生存函數(shù)則是條件累積概率2風(fēng)險(xiǎn)函數(shù)可以鑒別模型類型,例如對(duì)于一組數(shù)據(jù),它的模型是指數(shù)模型,Weibull模型,還是對(duì)數(shù)正態(tài)模型3風(fēng)險(xiǎn)函數(shù)是生存分析的數(shù)學(xué)模型3術(shù)語(yǔ)與符號(hào)應(yīng)用風(fēng)險(xiǎn)函數(shù)主要基于以下幾個(gè)原因1風(fēng)險(xiǎn)函數(shù)可以計(jì)算瞬時(shí)可能48生存函數(shù)與風(fēng)險(xiǎn)函數(shù)的關(guān)系:知道其中一個(gè)就可以推導(dǎo)出另一個(gè)。例如,風(fēng)險(xiǎn)函數(shù)等于一個(gè)常數(shù),即h(t)=,則相應(yīng)的生存函數(shù)s(t)=3術(shù)語(yǔ)與符號(hào)生存函數(shù)與風(fēng)險(xiǎn)函數(shù)的關(guān)系:知道其中一個(gè)就可以推導(dǎo)出另一個(gè)。例49可以用兩個(gè)微積分公式表示生存函數(shù)與風(fēng)險(xiǎn)函數(shù)的更一般的關(guān)系
在實(shí)際的數(shù)據(jù)分析中,電腦程序可以給出生存函數(shù)與風(fēng)險(xiǎn)函數(shù)的數(shù)字轉(zhuǎn)換,不需要研究者自己利用公式計(jì)算。3術(shù)語(yǔ)與符號(hào)可以用兩個(gè)微積分公式表示生存函數(shù)與風(fēng)險(xiǎn)函數(shù)的更一般的關(guān)系
在50總結(jié)對(duì)于一個(gè)已生存到t時(shí)刻的研究對(duì)象,生存函數(shù)側(cè)重于生存,而風(fēng)險(xiǎn)函數(shù)則側(cè)重于失效事件的發(fā)生3術(shù)語(yǔ)與符號(hào)總結(jié)對(duì)于一個(gè)已生存到t時(shí)刻的研究對(duì)象,生存函數(shù)側(cè)重于生存,而51四生存分析的目的生存分析的基本目標(biāo)1估計(jì)及解釋生存數(shù)據(jù)的生存函數(shù)和/或風(fēng)險(xiǎn)函數(shù)2比較生存函數(shù)和/或風(fēng)險(xiǎn)函數(shù)3評(píng)價(jià)解釋變量與生存時(shí)間的關(guān)系生存分析的目的四生存分析的目的生存分析的基本目標(biāo)生存分析的目的52以下是兩個(gè)生存函數(shù)的曲線圖(針對(duì)第一個(gè)目的)左側(cè)的生存函數(shù)顯示在隨訪早期生存率下降很快,后期下降較慢;右側(cè)的生存函數(shù)則相反,在隨訪早期生存率下降較慢,后期則下降很快。生存分析的目的以下是兩個(gè)生存函數(shù)的曲線圖(針對(duì)第一個(gè)目的)左側(cè)的生存函數(shù)顯53治療組與安慰劑組生存函數(shù)的比較(針對(duì)第二個(gè)目的)在六周以前,治療組的生存函數(shù)曲線一直在安慰劑組的上方,六周以后,兩組的生存曲線基本重疊,這說(shuō)明在六周以前,治療組的效應(yīng)大大好于安慰劑組,六周以后兩組的效應(yīng)基本相同。生存分析的目的治療組與安慰劑組生存函數(shù)的比較(針對(duì)第二個(gè)目的)在六周以前,54數(shù)學(xué)模型
(針對(duì)第三個(gè)目的)實(shí)現(xiàn)這個(gè)目的,需要應(yīng)用數(shù)學(xué)估計(jì)模型,例如Cox比利風(fēng)險(xiǎn)模型就是最常使用的。生存分析的目的數(shù)學(xué)模型
(針對(duì)第三個(gè)目的)實(shí)現(xiàn)這個(gè)目的,需要應(yīng)用數(shù)學(xué)估計(jì)模55五基于計(jì)算機(jī)的數(shù)據(jù)編排基于計(jì)算機(jī)應(yīng)用數(shù)據(jù)編排類型基于理解五基于計(jì)算機(jī)的數(shù)據(jù)編排56左表是基于計(jì)算機(jī)的原始數(shù)據(jù)的編排形式。設(shè)樣本量為n,表的第一列是研究對(duì)象的編號(hào),從一到n;第二列為生存時(shí)間,第一個(gè)研究對(duì)象的生存時(shí)間記為,第二個(gè)研究對(duì)象的生存時(shí)間記為,以此類推。第二列給出了所有研究對(duì)象的觀察的生存時(shí)間,不論研究對(duì)象是否發(fā)生失效事件。第三列是表示是否發(fā)生刪失的指示變量,若研究對(duì)象發(fā)生了失效事件,則=1,否則=0.五基于計(jì)算機(jī)的數(shù)據(jù)編排左表是基于計(jì)算機(jī)的原始數(shù)據(jù)的編排形式。設(shè)樣本量為n,表的第一57對(duì)于第五個(gè)研究對(duì)象,在研究期間發(fā)生了失效事件,則=1,第八個(gè)研究對(duì)象在研究期間發(fā)生刪失,則=0,等于失效事件發(fā)生的總和,≤n,因?yàn)椴皇撬械难芯繉?duì)象都會(huì)發(fā)生失效事件。為解釋性變量,例如年齡、暴露情況以及乘積變量(年齡×種族)等五基于計(jì)算機(jī)的數(shù)據(jù)編排對(duì)于第五個(gè)研究對(duì)象,在研究期間發(fā)生了失效事件,則=58解釋變量X1對(duì)應(yīng)的一列數(shù)據(jù)是n個(gè)研究對(duì)象該變量的觀測(cè)值,X11表示第一個(gè)研究對(duì)象的第一個(gè)解釋變量的值,X21表示第二個(gè)研究對(duì)象的第一個(gè)解釋變量的值,其他的以此類推。對(duì)于第j個(gè)研究對(duì)象,他對(duì)應(yīng)的研究信息為tj,,Xj1,Xj2,…Xjp五基于計(jì)算機(jī)的數(shù)據(jù)編排解釋變量X1對(duì)應(yīng)的一列數(shù)據(jù)是n個(gè)研究對(duì)象59例題兩組白血病患者的研究數(shù)據(jù)將42名白血病患者分為兩組,每組21人,一組接受治療,一組使用安慰劑。該數(shù)據(jù)來(lái)自Freireich于1963年發(fā)表在Blood雜志的文章。左側(cè)表的數(shù)據(jù)編不能直接錄入計(jì)算機(jī)進(jìn)行分析,需要重新進(jìn)行編排。該數(shù)據(jù)給出了每一個(gè)研究對(duì)象在研究期間處于緩和期的周數(shù),知道他發(fā)生失效事件或刪失。在該研究中,脫離緩和期為失效事件,若研究對(duì)象在研究結(jié)束仍未發(fā)生失效事件、失訪或研究結(jié)束前退出,這些都視為刪失。以生存時(shí)間后加一個(gè)加號(hào)表示刪失數(shù)據(jù)。五基于計(jì)算機(jī)的數(shù)據(jù)編排例題兩組白血病患者的研究數(shù)據(jù)將42名白血病患者分為兩組,每60五基于計(jì)算機(jī)的數(shù)據(jù)編排五基于計(jì)算機(jī)的數(shù)據(jù)編排61由下表可知,前三個(gè)研究對(duì)象都在第六周時(shí)發(fā)生失效事件,之后的六名研究對(duì)象也先后發(fā)生失效事件,他們的生存時(shí)間集中在7-23周之間。其余的研究對(duì)象都發(fā)生了刪失事件,他們的生存時(shí)間集中在6-35周之間。例如第三行的第一個(gè)數(shù)據(jù)為6,其后有加號(hào)標(biāo)識(shí),表示該研究對(duì)象在第六周時(shí)發(fā)生了刪失。
第一組的21名研究對(duì)象有九名發(fā)生了失效事件,其余12名均為刪失。第二組沒(méi)有刪失數(shù)據(jù),即第二組的21名研究對(duì)象在研究期間均脫離了緩和期。五基于計(jì)算機(jī)的數(shù)據(jù)編排由下表可知,前三個(gè)研究對(duì)象都在第六周時(shí)發(fā)生失效事件,之后的六62。五基于計(jì)算機(jī)的數(shù)據(jù)編排。五基于計(jì)算機(jī)的數(shù)據(jù)編排63上表為經(jīng)過(guò)編排的可用于計(jì)算機(jī)分析的數(shù)據(jù)五基于計(jì)算機(jī)的數(shù)據(jù)編排表的前半部分為治療組的數(shù)據(jù)(1-21),后半部分為安慰劑組的數(shù)據(jù)(22-42),表的第一列為研究者編號(hào),第二列為生存時(shí)間,第三列為指示變量(刪失還是失效),第四列為解釋變量(組別),1代表治療組,0代表安慰劑組。表中的一行數(shù)據(jù)代表了一個(gè)研究對(duì)象的信息,例如,對(duì)3號(hào)研究對(duì)象而言,他的生存時(shí)間為六周,=1,即該研究對(duì)象在研究期間脫離了緩和期,X=1表示該研究對(duì)象屬于治療組。對(duì)于14號(hào)研究對(duì)象,他的生存時(shí)間為17周,=0.即研究對(duì)象在研究期間發(fā)生了刪失,X=1表示該研究對(duì)象也屬于治療組;對(duì)于第32號(hào)研究對(duì)象,他的生存時(shí)間是8周,=1,即該研究對(duì)象在研究期間發(fā)生了失效事件,X=0表示他屬于安慰劑組。上表為經(jīng)過(guò)編排的可用于計(jì)算機(jī)分析的數(shù)據(jù)五基于計(jì)算機(jī)的數(shù)據(jù)編64六基于理解分析的數(shù)據(jù)編排該部分將有助于理解生存分析的分析過(guò)程及生存曲線的繪制。六基于理解分析的數(shù)據(jù)編排該部分將有助于理解生存分析的分析過(guò)65表中第一列為按升序排列的生存時(shí)間,其中不包括刪失的生存時(shí)間,以,,,…表示。K等于失效時(shí)間數(shù)。第二列表示在某個(gè)生存時(shí)間發(fā)生失效的人數(shù)。六基于理解分析的數(shù)據(jù)編排表中第一列為按升序排列的生存時(shí)間,其中不包括刪失的生存時(shí)間,66六基于理解分析的數(shù)據(jù)編排六基于理解分析的數(shù)據(jù)編排67上頁(yè)為經(jīng)過(guò)整理的兩組白血病人的生存數(shù)據(jù),對(duì)第一組,21個(gè)患者有九個(gè)發(fā)生了失效事件,其中在第六周有三個(gè)患者發(fā)生失效事件,在7、10、13、16、22和23周各有一名患者發(fā)生失效事件,因此k=7。將這7個(gè)生存時(shí)間按升序排列,=6,=7,=23.對(duì)于第二組,21名患者全部發(fā)生失效事件,且在同一個(gè)生存時(shí)間有相持發(fā)生,例如在第一周有兩名患者脫離緩和期,在第二周也有兩名患者脫離緩和期,這21名患者總共有12個(gè)時(shí)間點(diǎn),即k=12,這12個(gè)時(shí)間點(diǎn)列在表的第一列。表的第一行為t=0時(shí)的信息,這一行的作用將在介紹第三列時(shí)解釋。表的第三列給出了在同一個(gè)時(shí)間點(diǎn)發(fā)生失效事件的患者數(shù),以表示。在某個(gè)時(shí)間點(diǎn)沒(méi)有相持發(fā)生時(shí),=1,對(duì)于第一組數(shù)據(jù),只在第六周時(shí)有相持發(fā)生,其他時(shí)間點(diǎn)都未發(fā)生。對(duì)于第二組數(shù)據(jù),在第1、2、4、5、8、11、12周均發(fā)生了相持。相加的和為相應(yīng)組中發(fā)生失效事件的患者總和,即第一組中,第二組中。六基于理解分析的數(shù)據(jù)編排上頁(yè)為經(jīng)過(guò)整理的兩組白血病人的生存數(shù)據(jù),對(duì)第一組,21個(gè)患者68第三列為在時(shí)間區(qū)間內(nèi)刪失的患者數(shù),以表示,例如,第一組中有5個(gè)非零的的,,,,,,將其相加,和為第一組中刪失的患者數(shù),即,且六基于理解分析的數(shù)據(jù)編排第三列為在時(shí)間區(qū)間內(nèi)刪失的患者69六基于理解分析的數(shù)據(jù)編排六基于理解分析的數(shù)據(jù)編排70上頁(yè)中,左側(cè)表是第一組患者的未經(jīng)整理的原始數(shù)據(jù),右側(cè)為整理以后的數(shù)據(jù)。左表中的第十號(hào)患者在第6周發(fā)生刪失,因此右側(cè)表中的=1,即表中與=6相對(duì)應(yīng)的第二行第三列。左表中的11號(hào)患者在第9周發(fā)生刪失,由于該患者是在[7,10)的時(shí)間區(qū)間內(nèi)刪失的,故=1,第12號(hào)患者在第十周發(fā)生刪失,已不屬于這個(gè)區(qū)間,他屬于[10,13)的時(shí)間區(qū)間。左表中的12、13號(hào)患者,他們分別在第10周、第11周發(fā)生刪失,這兩個(gè)時(shí)間都屬于[10,13)的時(shí)間區(qū)間,因此=2.q的計(jì)算六基于理解分析的數(shù)據(jù)編排上頁(yè)中,左側(cè)表是第一組患者的未經(jīng)整理的原始數(shù)據(jù),右側(cè)為整理以71對(duì)于右側(cè)的表,表的第一行為=0,加入這一行是為了防止有研究對(duì)象在第一個(gè)失效時(shí)間之前就發(fā)生刪失,因此有可能是非零的。對(duì)于該例的兩組數(shù)據(jù),均沒(méi)有研究對(duì)象在第一個(gè)失效時(shí)間之前發(fā)生刪失。右側(cè)的表的最后一列為“風(fēng)險(xiǎn)趨勢(shì)”,風(fēng)險(xiǎn)趨勢(shì)既不是數(shù)值變量也不是頻數(shù)變量,它是特定研究對(duì)象的集合。風(fēng)險(xiǎn)趨勢(shì)表示至少生存到時(shí)間的研究對(duì)象的集合,即對(duì)于每個(gè)研究對(duì)象,他的生存期為或比更長(zhǎng),而不考慮該研究對(duì)象是否發(fā)生了刪失。六基于理解分析的數(shù)據(jù)編排對(duì)于右側(cè)的表,表的第一行為=0,加入72例如,對(duì)于第一組的研究對(duì)象,在研究開(kāi)始時(shí),生存期都大于0周,因此在0周時(shí)的風(fēng)險(xiǎn)趨勢(shì)就包含了第一組中的所有研究對(duì)象。第一組第六周的風(fēng)險(xiǎn)趨勢(shì)也包含了所有的研究對(duì)象,因?yàn)檫@21名研究對(duì)象至少活過(guò)了第六周。在第六周時(shí),21名研究對(duì)象中有3名發(fā)生了失效事件,因?yàn)樗麄冊(cè)谶@個(gè)時(shí)間點(diǎn)是活著的并處于失效的風(fēng)險(xiǎn)中。六基于理解分析的數(shù)據(jù)編排例如,對(duì)于第一組的研究對(duì)象,在研究開(kāi)始時(shí),生存期都大于0周,73現(xiàn)在來(lái)看第一組研究對(duì)象第七周的風(fēng)險(xiǎn)趨勢(shì),它包括17名研究對(duì)象,因?yàn)檫@17名研究對(duì)象至少活到了第七周。在這里我們排除了上一頁(yè)表中用“X”劃去的研究對(duì)象,這包括在第六周發(fā)生失效事件的3名研究對(duì)象及在第六周發(fā)生刪失的一名研究對(duì)象,這四人均未活到第七周。雖然發(fā)生刪失的研究對(duì)象的生存期可能大于7周,但是我們關(guān)于該研究對(duì)象的信息只到第六周,因此必須要將他從中排除。六基于理解分析的數(shù)據(jù)編排現(xiàn)在來(lái)看第一組研究對(duì)象第七周的風(fēng)險(xiǎn)趨勢(shì),它包括74對(duì)于某一時(shí)間的風(fēng)險(xiǎn)趨勢(shì)的計(jì)算,必須要將該時(shí)間點(diǎn)之前的研究對(duì)象全部排除,不管研究對(duì)象是刪失還是發(fā)生了失效事件。例如,對(duì)于第一組在13周的風(fēng)險(xiǎn)趨勢(shì),必須排除13周之前的發(fā)生失效事件的研究對(duì)象,也不能包括13周之前發(fā)生刪失的研究對(duì)象和13周中發(fā)生失效及刪失的研究對(duì)象。從21名研究對(duì)象中減去9,剩下的12名研究對(duì)象在第13周仍處于風(fēng)險(xiǎn)之中,即13周的風(fēng)險(xiǎn)趨勢(shì)包括了這12名研究對(duì)象。六基于理解分析的數(shù)據(jù)編排對(duì)于某一時(shí)間的風(fēng)險(xiǎn)趨勢(shì)的計(jì)算,必須要將該時(shí)間點(diǎn)75對(duì)刪失數(shù)據(jù)的處理:利用直到刪失發(fā)生的所用信息,不隨意丟失信息對(duì)于經(jīng)過(guò)整理的按生存時(shí)間排序的表,允許我們?cè)谶M(jìn)行生存分析時(shí)利用發(fā)生刪失的研究對(duì)象的信息。雖然發(fā)生刪失的研究對(duì)象的信息是不完整的,即我們不知道研究對(duì)象的確切生存時(shí)間,但是我們?nèi)匀豢梢岳醚芯繉?duì)象發(fā)生刪失之前的信息。對(duì)于發(fā)生刪失的研究對(duì)象,不能簡(jiǎn)單的將其刪除,而是要利用研究對(duì)象發(fā)生刪失之前的所有信息。六基于理解分析的數(shù)據(jù)編排對(duì)刪失數(shù)據(jù)的處理:利用直到刪失發(fā)生的所用信息,不隨意丟失信息76例如,對(duì)于第一組中在16-20周內(nèi)發(fā)生刪失的三個(gè)研究對(duì)象而言,我們獲得了他們?cè)?6周之前的所有信息,這是不能忽略的。這三個(gè)研究對(duì)象在16周之前也都處于發(fā)生終點(diǎn)事件的風(fēng)險(xiǎn)之中,即他們均有可能在16周時(shí)發(fā)生終點(diǎn)事件。六基于理解分析的數(shù)據(jù)編排例如,對(duì)于第一組中在16-20周內(nèi)發(fā)生刪失的三個(gè)研究對(duì)象而言77七生存經(jīng)歷的描述性度量左圖是非表格形式的白血病患者緩和期數(shù)據(jù)。觀察兩組患者的生存數(shù)據(jù),可以看出治療組大部分研究對(duì)象的生存期要長(zhǎng)于安慰劑組大部分研究對(duì)象的生存期。如果我們忽略以‘+’標(biāo)識(shí)的刪失數(shù)據(jù),僅僅計(jì)算每組21名研究對(duì)象生存期的均數(shù),以表示,則治療組的平均生存期為17.1周,安慰劑組的平均生存期為8.6周。由于治療組中有幾個(gè)研究對(duì)象在研究期間發(fā)生刪失,這就意味著第一組的平均生存期要長(zhǎng)于之前計(jì)算的平均生存期。按照之前計(jì)算得到的平均生存期,治療要比安慰劑有效地多。七生存經(jīng)歷的描述性度量左圖是非表格形式的白血病患者緩和期數(shù)78七生存經(jīng)歷的描述性度量相較于之前計(jì)算的簡(jiǎn)單的平均數(shù),還可以用另一種方式來(lái)度量每一組的生存經(jīng)歷,即平均風(fēng)險(xiǎn)比,以表示。這個(gè)比值是用每一組中發(fā)生終點(diǎn)事件的研究對(duì)象的總數(shù)除以所有研究對(duì)象(包括發(fā)生終點(diǎn)事件與發(fā)生刪失的研究對(duì)象)的生存期的總和得到的,對(duì)于第一組,=9/359=0.025,對(duì)于第二組,=21/182=0.115。七生存經(jīng)歷的描述性度量相較于之前計(jì)算的簡(jiǎn)單的平均數(shù),還可以79七生存經(jīng)歷的描述性度量與生存率相比,風(fēng)險(xiǎn)比表明的是終點(diǎn)事件發(fā)生的可能性,因此若某一組具有較高的風(fēng)險(xiǎn)比,相應(yīng)的生存率就較低。在白血病患者的例子中,治療組的風(fēng)險(xiǎn)比低于安慰劑組的風(fēng)險(xiǎn)比。通過(guò)風(fēng)險(xiǎn)比的比較,可以看出治療組研究對(duì)象的表現(xiàn)要好于安慰劑組,即治療組研究對(duì)象發(fā)生終點(diǎn)事件的可能性要小于安慰劑組。使用平均數(shù)和風(fēng)險(xiǎn)比對(duì)兩組研究對(duì)象的生存經(jīng)歷進(jìn)行描述性度量,可以提供治療組與安慰劑組的總體比較。但是這種描述性度量無(wú)法進(jìn)行隨時(shí)間變化的兩組的總體比較。而生存曲線可以解決這個(gè)問(wèn)題。七生存經(jīng)歷的描述性度量與生存率相比,風(fēng)險(xiǎn)比表明的是終點(diǎn)事件80七生存經(jīng)歷的描述性度量左圖是治療組與安慰劑組的估計(jì)生存曲線。這種曲線的繪制方法稱為Kaplan-Meier法。這種方法將在第二章詳細(xì)介紹。生存曲線可以使我們比較隨時(shí)間變化的兩組的差異。從圖中可以看出治療組的生存曲線一直在安慰劑組之上,這種差異提示在隨訪期間的任一時(shí)間點(diǎn)上治療都是有效地。在研究開(kāi)始的幾周中,兩組的生存曲線很接近,但是隨后兩組生存曲線間的間隔變得很大,這種變化表示治療在隨訪后期比前期更加有效。七生存經(jīng)歷的描述性度量左圖是治療組與安慰劑組的估計(jì)生存曲線81七生存經(jīng)歷的描述性度量生存曲線還可以用來(lái)估計(jì)中位生存期,即每一組中生存率為0.5時(shí)對(duì)應(yīng)的時(shí)間即是中位生存期。治療組的中位生存期為23周,安慰劑組的中位生存期為8周。七生存經(jīng)歷的描述性度量生存曲線還可以用來(lái)估計(jì)中位生存期,即82八擴(kuò)展的緩和期數(shù)據(jù)右表在之前緩和期數(shù)據(jù)的基礎(chǔ)上又給出了兩組研究對(duì)象的對(duì)數(shù)白細(xì)胞數(shù)。之所以加上這個(gè)變量是因?yàn)榘准?xì)胞數(shù)是影響白血病人預(yù)后的重要因素,白細(xì)胞數(shù)越高,預(yù)后越差。因此兩組研究對(duì)象的生存狀況的比較必須要考慮像這樣的因素(白細(xì)胞數(shù))的可能的混雜效應(yīng)。八擴(kuò)展的緩和期數(shù)據(jù)右表在之前緩和期數(shù)據(jù)的基礎(chǔ)上又給出了兩組83假設(shè)治療組研究對(duì)象具有較低的白細(xì)胞水平,安慰劑組研究對(duì)象的白細(xì)胞水平較高,在本例中,治療組的對(duì)數(shù)白細(xì)胞取均值為1.8,安慰劑組的對(duì)數(shù)白細(xì)胞取均值為4.1.由于安慰劑組的白細(xì)胞水平高于治療組的,因此有理由懷疑之前對(duì)治療組和安慰劑組進(jìn)行比較得到的結(jié)論有可能是錯(cuò)誤的。變量對(duì)數(shù)白細(xì)胞數(shù)提示治療組研究對(duì)象的生存期較長(zhǎng)可能僅僅是因?yàn)橹委熃M的白細(xì)胞水平較低造成的,而不是治療有效。在本例中,治療效果有可能受白細(xì)胞水平的影響。假設(shè)治療組研究對(duì)象具有較低的白細(xì)胞水平,安慰劑組研究對(duì)象的白84進(jìn)一步分析,治療組的對(duì)數(shù)白細(xì)胞分布有可能與安慰劑組有很大的不同。下圖繪制的是治療組與安慰劑組對(duì)數(shù)白細(xì)胞數(shù)頻數(shù)分布的極端情況,并不是根據(jù)原始數(shù)據(jù)繪制的,若治療組與安慰劑組的白細(xì)胞數(shù)分布嚴(yán)重不平衡,則需要對(duì)白細(xì)胞數(shù)進(jìn)行調(diào)整。如果白細(xì)胞水平確實(shí)對(duì)治療效果有影響,則在生存分析時(shí)不應(yīng)該對(duì)白細(xì)胞數(shù)進(jìn)行約束(即應(yīng)該考慮白細(xì)胞的對(duì)治療效果的影響)。進(jìn)一步分析,治療組的對(duì)數(shù)白細(xì)胞分布有可能與安慰劑組有很大的不85
另一個(gè)需要考慮的問(wèn)題是對(duì)數(shù)白細(xì)胞所起的作用有可能是交互作用,即治療的效果有可能隨對(duì)數(shù)白細(xì)胞水平變化而變化。例如,假設(shè)研究對(duì)象具有較高的對(duì)數(shù)白細(xì)胞水平,治療組的生存率在隨訪期間一直高于安慰劑組,如下圖第一個(gè)圖所示。相反的,對(duì)于第二個(gè)圖,假設(shè)研究對(duì)象具有較低的對(duì)數(shù)白細(xì)胞水平,治療組與安慰劑組的效應(yīng)在整個(gè)隨訪期間沒(méi)有明顯的差別。綜上所述,我們可以說(shuō)治療與白細(xì)胞之間存在交互效應(yīng),即治療的效應(yīng)大小依賴于白細(xì)胞水平。另一個(gè)需要考慮的問(wèn)題是對(duì)數(shù)白細(xì)胞所起的作用有可86之前的例子中存在交互作用,而在一些案例中交互作用是不存在的。與混雜一樣,在這一章中不對(duì)交互作用作詳細(xì)的介紹。對(duì)于擴(kuò)展的緩和期數(shù)據(jù)要考慮的基本問(wèn)題如下:對(duì)對(duì)數(shù)白細(xì)胞數(shù)可能存在的混雜或交互作用進(jìn)行校正以后再對(duì)兩組研究對(duì)象的生存經(jīng)歷進(jìn)行比較。在擴(kuò)展的緩和期數(shù)據(jù)中要考慮的解釋型變量變成了兩個(gè),而之前我們的分析一直是圍繞一個(gè)變量(分組變量)進(jìn)行。在用計(jì)算機(jī)進(jìn)行數(shù)據(jù)分析,數(shù)據(jù)錄入時(shí)需要加上對(duì)數(shù)白細(xì)胞數(shù)這個(gè)變量下頁(yè)給出了應(yīng)用于計(jì)算機(jī)的數(shù)據(jù)編排格式。之前的例子中存在交互作用,而在一些案例中交互作用是不存在的。87第一章生存分析介紹要點(diǎn)課件88上頁(yè)中的表給出的兩個(gè)自變量,,分別代表組別與對(duì)數(shù)白細(xì)胞數(shù)。組別是主要的研究?jī)?nèi)容,即研究者感興趣的暴露變量。變量對(duì)數(shù)白細(xì)胞數(shù)是一個(gè)外擾變量,利用它來(lái)控制和解釋混雜或交換效應(yīng)。上頁(yè)中的表給出的兩個(gè)自變量,,分別代表組89對(duì)于擴(kuò)展的緩和期數(shù)據(jù),由于對(duì)數(shù)白細(xì)胞數(shù)可能存在混雜或交互作用,因此需要使用一定的方法來(lái)校正或估計(jì)它對(duì)研究對(duì)象的影響,從而對(duì)治療的效果做出正確的估計(jì)。以下是兩種最常用的分析方法:1將對(duì)數(shù)白細(xì)胞數(shù)作為分層變量,對(duì)不同層中的生存曲線進(jìn)行比較2使用數(shù)學(xué)模型,例如比例風(fēng)險(xiǎn)模型或其他的生存模型對(duì)于擴(kuò)展的緩和期數(shù)據(jù),由于對(duì)數(shù)白細(xì)胞數(shù)可能存在混雜或交互作用90九多變量的例子這一部分的目的是描述更一般的多元生存分析問(wèn)題的類型。這一部分涉及的例子是對(duì)一個(gè)固定的隊(duì)列從1967年-1980年隨訪13年的研究。樣本量n=170;研究對(duì)象是年齡大于等于60歲的白人男性;結(jié)局變量為T(mén),即從進(jìn)入隨訪直到發(fā)生死亡所經(jīng)歷的年數(shù);該例中包括以下幾個(gè)解釋變量,一個(gè)是作為主要研究?jī)?nèi)容的暴露變量,其他的是可能的潛在混雜因素或交互作用變量主要的暴露變量是社會(huì)網(wǎng)絡(luò)指數(shù)(SNI)該指標(biāo)的數(shù)據(jù)來(lái)源于問(wèn)卷調(diào)查,是評(píng)價(jià)研究對(duì)象社會(huì)接觸程度的指標(biāo),SNI的取值范圍是從0(沒(méi)有任何社會(huì)網(wǎng)絡(luò))到5(豐富的社會(huì)網(wǎng)絡(luò))九多變量的例子這一部分的目的是描述更一般的多元生存分析問(wèn)91第一章生存分析介紹要點(diǎn)課件92研究的目的是為了確定社會(huì)網(wǎng)絡(luò)指數(shù)是否是死亡的保護(hù)因素(protectiveagainstdeath)。如果假設(shè)是正確的,那么社會(huì)網(wǎng)絡(luò)指數(shù)得分越高,研究對(duì)象就將具有更長(zhǎng)的生存年限。為了研究這個(gè)問(wèn)題,除了調(diào)查研究對(duì)象的SNI指數(shù),研究者還在隨訪開(kāi)始時(shí)測(cè)量了其他的幾個(gè)解釋變量,包括年齡、心臟收縮壓(SBP),慢性疾病是否存在的指示變量(CHR)、Quetelet指數(shù)、社會(huì)等級(jí)(SOCL)。
其中Quetelet指數(shù)=以上五個(gè)變量被納入研究,是因?yàn)檠芯空哒J(rèn)為它們對(duì)研究對(duì)象生存期的長(zhǎng)短具有單獨(dú)或聯(lián)合的影響。因此,在評(píng)估社會(huì)網(wǎng)絡(luò)指數(shù)對(duì)研究對(duì)象生存期的影響時(shí),將這五個(gè)變量看做是潛在的混雜因素或交互作用變量。經(jīng)過(guò)以上解釋,該例題可以簡(jiǎn)單表述為:控制SNI、SBP、CHR、Quetelet指數(shù)、SOCL這幾個(gè)變量,描述社會(huì)網(wǎng)絡(luò)指數(shù)與死亡時(shí)間之間的關(guān)系。研究的目的是為了確定社會(huì)網(wǎng)絡(luò)指數(shù)是否是死亡的保護(hù)因素(pro93這一部分的目標(biāo)是利用生存分析解決以下幾個(gè)問(wèn)題:1校正其他五個(gè)變量的作用之后,描述SNI與死亡時(shí)間的關(guān)系2繪制不同社會(huì)網(wǎng)絡(luò)類型的研究對(duì)象生存率隨時(shí)間變化的生存曲線,尤其是對(duì)具有豐富的社會(huì)網(wǎng)絡(luò)的研究對(duì)象的生存經(jīng)歷與具有貧瘠的社會(huì)網(wǎng)絡(luò)的研究對(duì)象的生存經(jīng)歷進(jìn)行比較。在繪制生存曲線時(shí),需要對(duì)其他解釋變量的效應(yīng)進(jìn)行控制(排除混雜或交互)。3為了實(shí)現(xiàn)以上兩個(gè)目標(biāo),需要進(jìn)行兩個(gè)中間步驟,即對(duì)除SNI以外的5個(gè)解釋變量進(jìn)行校正及確定一種合適的校正方法這一部分的目標(biāo)是利用生存分析解決以下幾個(gè)問(wèn)題:94下表是基于計(jì)算機(jī)的數(shù)據(jù)編排格式,第一列是170名研究對(duì)象的編號(hào),第二列是生存時(shí)間,第三列是發(fā)生刪失事件還是終點(diǎn)事件的指示變量,剩下的幾列是六個(gè)解釋變量,下表是基于計(jì)算機(jī)的數(shù)據(jù)編排格式,第一列是170名研究對(duì)象的編95十生存分析的數(shù)學(xué)模型生存分析的典型問(wèn)題是在控制混雜因素或交互作用變(,,,)以后描述暴露變量(E)與結(jié)局變量(D)之間的關(guān)系。在生存分析例題中,E是社會(huì)網(wǎng)絡(luò)指數(shù)SNI,D是生存時(shí)間變量,混雜因素或交互作用變量有5個(gè),分別是AGE、SBP、CHR、QUET、SOCL。十生存分析的數(shù)學(xué)模型生存分析的典型問(wèn)題是在控制混雜因素或交96結(jié)局變量類型不同,則使用的模型也不相同。在生存分析中,結(jié)局變量是終點(diǎn)事件發(fā)生時(shí)的時(shí)間,還可能含有刪失數(shù)據(jù)。在線性回歸模型中,結(jié)局變量通常是連續(xù)的,例如血壓變量。在Logistic模型中,結(jié)局變量是二分類的,例如CHD變量。如果用線性回歸模型或Logistic模型分析生存數(shù)據(jù),則無(wú)法利用隨訪時(shí)間的信息。結(jié)局變量類型不同,則使用的模型也不相同。在生存分析中,結(jié)局變97與線性回歸和Logistic回歸一樣,生存分析的一個(gè)統(tǒng)計(jì)學(xué)目標(biāo)是在校正了混雜或交互作用變量的影響后得到效應(yīng)的估計(jì),以此來(lái)描述暴露因素與結(jié)局之間的關(guān)系。在線性回歸模型中,通常使用回歸系數(shù)來(lái)進(jìn)行效應(yīng)大小的測(cè)量;在Logistic回歸模型中,通常用優(yōu)勢(shì)比()來(lái)測(cè)量效應(yīng)的大小。在生存分析中,一般用風(fēng)險(xiǎn)比度量效應(yīng)的大小,與Logistic回歸一樣,風(fēng)險(xiǎn)比也是對(duì)回歸系數(shù)取指數(shù)得到的,即HR=與線性回歸和Logistic回歸一樣,生存分析的一個(gè)統(tǒng)計(jì)學(xué)目98
雖然風(fēng)險(xiǎn)比與優(yōu)勢(shì)比的計(jì)算方法不同,但是它們對(duì)于效應(yīng)強(qiáng)度的解釋是相似的.例如風(fēng)險(xiǎn)比等于1的意義,與優(yōu)勢(shì)比等于1一樣,都意味著暴露與結(jié)局之間沒(méi)有關(guān)系.風(fēng)險(xiǎn)比等于10,與優(yōu)勢(shì)比等于10一樣,意味著暴露組發(fā)生終點(diǎn)事件的風(fēng)險(xiǎn)是非暴露的10倍。風(fēng)險(xiǎn)比等于1/10,與優(yōu)勢(shì)比等于1/10一樣,意味著暴露組發(fā)生終點(diǎn)事件的風(fēng)險(xiǎn)是非暴漏組的1/10.雖然風(fēng)險(xiǎn)比與優(yōu)勢(shì)比的計(jì)算方法不同,但是它們對(duì)于99第一章生存分析介紹1導(dǎo)言2簡(jiǎn)略摘要3目標(biāo)4正文5總結(jié)6練習(xí)7實(shí)驗(yàn)8練習(xí)答案第一章生存分析介紹1導(dǎo)言100導(dǎo)言
這一章給出了生存分析數(shù)據(jù)的描述性分析步驟。分析步驟包括生存分析涉及的問(wèn)題類型、結(jié)局變量的考慮、刪失數(shù)據(jù)的考慮、生存函數(shù)和風(fēng)險(xiǎn)函數(shù)的表述、生存分析數(shù)據(jù)的規(guī)劃(即數(shù)據(jù)輸入計(jì)算機(jī)時(shí)的編排方法)、生存分析的目標(biāo)、生存分析實(shí)例。因?yàn)樵撜轮饕敲枋鲂詢?nèi)容,數(shù)學(xué)、統(tǒng)計(jì)學(xué)、流行病學(xué)知識(shí)并不是絕對(duì)必要的。但是讀者對(duì)流行病學(xué)原理以及對(duì)數(shù)學(xué)符號(hào)和公式的了解將會(huì)大有利于對(duì)本書(shū)的學(xué)習(xí)。
導(dǎo)言這一章給出了生存分析數(shù)據(jù)的描述性分析步驟。101簡(jiǎn)略摘要1什么是生存分析2刪失數(shù)據(jù)3術(shù)語(yǔ)及符號(hào)4生存分析的目的5基于計(jì)算機(jī)應(yīng)用的數(shù)據(jù)格式6用于理解分析的數(shù)據(jù)格式7生存時(shí)間的描述性統(tǒng)計(jì)8例題9多變量例題10生存分析的數(shù)學(xué)模型簡(jiǎn)略摘要1什么是生存分析102學(xué)習(xí)目標(biāo)1辨認(rèn)或描述生存分析所涉及的問(wèn)題類型2刪失數(shù)據(jù)的定義3右刪失數(shù)據(jù)的定義4造成數(shù)據(jù)刪失的三個(gè)主要原因5生存函數(shù)的定義、辨認(rèn)、解釋6風(fēng)險(xiǎn)函數(shù)的定義、辨認(rèn)、解釋7生存函數(shù)與風(fēng)險(xiǎn)函數(shù)的關(guān)系8生存分析的三個(gè)主要目的9應(yīng)用于計(jì)算機(jī)的原始數(shù)據(jù)編排格式的識(shí)別或辨認(rèn),特別是能夠按照這種編排格式進(jìn)行數(shù)據(jù)設(shè)置學(xué)習(xí)目標(biāo)1辨認(rèn)或描述生存分析所涉及的問(wèn)題類型10310應(yīng)用于模型理論理解的編排格式或組成部分的識(shí)別或辨認(rèn),特別是能夠按照這種編排格式進(jìn)行數(shù)據(jù)設(shè)置11實(shí)例的生存曲線或風(fēng)險(xiǎn)函數(shù)的解釋及比較12給出一個(gè)實(shí)例,根據(jù)解釋變量與生存時(shí)間之間的關(guān)系來(lái)陳述生存分析的目的13平均生存期或平均風(fēng)險(xiǎn)的計(jì)算或解釋14兩組生存數(shù)據(jù)風(fēng)險(xiǎn)比的定義或解釋10應(yīng)用于模型理論理解的編排格式或組成部分的識(shí)別或辨認(rèn),特104正文(Presentation)該章給出了生存分析的總體介紹,基于流行病學(xué)特定類型或其他數(shù)據(jù)的流行的數(shù)據(jù)分析步驟。這一章的重點(diǎn)是生存分析涉及的問(wèn)題、目的、主要的術(shù)語(yǔ)及符號(hào)、原始數(shù)據(jù)編排、實(shí)例。正文(Presentation)該章給出了生存105重點(diǎn)問(wèn)題目的術(shù)語(yǔ)及符號(hào)數(shù)據(jù)排版例題重點(diǎn)問(wèn)題目的術(shù)語(yǔ)及符號(hào)數(shù)據(jù)排版例題106一生存分析一般而言,生存分析是數(shù)據(jù)分析的統(tǒng)計(jì)學(xué)過(guò)程的集合。它所關(guān)心的結(jié)局變量為研究事件發(fā)生時(shí)的時(shí)間。一生存分析一般而言,生存分析是數(shù)據(jù)分析的統(tǒng)計(jì)107生存時(shí)間:?jiǎn)挝皇悄?、月、周、日。是從?duì)研究對(duì)象開(kāi)始隨訪到研究事件發(fā)生的時(shí)間。
研究事件:可以是死亡、疾病發(fā)生、復(fù)發(fā)、痊愈或者是任何事先指定的感興趣的事件。雖然在一次研究中會(huì)有不止一個(gè)結(jié)局事件發(fā)生,但是我們假設(shè)只有一個(gè)事件是研究者感興趣的。當(dāng)考慮的結(jié)局事件不止一個(gè)時(shí),涉及到的統(tǒng)計(jì)學(xué)問(wèn)題為周期性事件或競(jìng)爭(zhēng)性危險(xiǎn)問(wèn)題,這將在第八、第九章中分別介紹。1生存分析生存時(shí)間:?jiǎn)挝皇悄?、月、周、日。是從?duì)研究對(duì)象開(kāi)始隨訪到研究108在生存分析中,通常把時(shí)間變量稱為生存時(shí)間,因?yàn)樗砹搜芯繉?duì)象在隨訪期間“生存”的時(shí)間。研究事件稱為終點(diǎn),因?yàn)檠芯渴录ǔJ撬劳?、疾病發(fā)生或其他消極事件。生存時(shí)間也可以是經(jīng)過(guò)外科手術(shù)重返工作崗位的時(shí)間按。這里的終點(diǎn)是一個(gè)積極事件。1生存分析在生存分析中,通常把時(shí)間變量稱為生存時(shí)間,因?yàn)?09結(jié)局變量:研究事件發(fā)生的
開(kāi)始隨訪研究事件時(shí)間1生存分析結(jié)局變量:研究事件發(fā)生的
開(kāi)始隨訪110研究事件:死亡、發(fā)病、復(fù)發(fā)、痊愈
假設(shè)結(jié)局為一個(gè)研究事件周期性事件>一個(gè)研究事件或競(jìng)爭(zhēng)性危險(xiǎn)時(shí)間生存時(shí)間
事件終點(diǎn)事件1生存分析研究事件:死亡、發(fā)病、復(fù)發(fā)、痊愈
假設(shè)結(jié)局為一個(gè)研究事件時(shí)間111簡(jiǎn)要介紹關(guān)于生存分析的五個(gè)例題第一個(gè)例子:,對(duì)處于緩和期的白血病患者,隨訪幾個(gè)星期后,看其能保持緩和期多長(zhǎng)時(shí)間。第二個(gè)例子:對(duì)一個(gè)身體健康無(wú)疾病的隊(duì)列,隨訪幾年后看有哪些研究對(duì)象患心臟病。第三個(gè)例子:對(duì)一個(gè)年齡大于60歲的人群,隨訪13年,觀察他們的生存期。第四個(gè)例子:對(duì)一些新近釋放的假釋犯,隨訪幾個(gè)星期,觀察他們是否又被重新拘捕。這種研究稱為累犯研究。第五個(gè)例子:追蹤隨訪經(jīng)過(guò)心臟移植手術(shù)的患者的生存期。1生存分析簡(jiǎn)要介紹關(guān)于生存分析的五個(gè)例題第一個(gè)例子:,對(duì)處于緩和期的白112以上五個(gè)例子均屬于生存分析的范疇,因?yàn)樗麄兊慕Y(jié)局變量都是某個(gè)特定事件發(fā)生時(shí)的時(shí)間。在第一個(gè)關(guān)于白血病患者的例子中,研究者感興趣的終點(diǎn)事件是患者脫離緩和期,結(jié)局變量是處于緩和期的病人從進(jìn)入研究到脫離緩和期所用的時(shí)間(周)。第二個(gè)例子的終點(diǎn)事件是“患心臟病”,結(jié)局變量是健康人群從進(jìn)入研究到患心臟病所用的時(shí)間(年)。第三個(gè)例子的終點(diǎn)事件是死亡,結(jié)局變量是年齡大于60歲的人群從進(jìn)入研究到死亡所用的時(shí)間(年)。第四個(gè)例子是一個(gè)社會(huì)學(xué)研究而不是一個(gè)醫(yī)學(xué)研究,所關(guān)心的終點(diǎn)事件是“重新被拘捕”,結(jié)局變量是假釋犯從被釋放到再一次被拘捕所經(jīng)歷的時(shí)間(周)。第五個(gè)例子的終點(diǎn)事件是死亡,結(jié)局變量是患者從接受心臟移植到死亡生存的時(shí)間。1生存分析以上五個(gè)例子均屬于生存分析的范疇,因?yàn)樗麄兊?13二刪失數(shù)據(jù)
絕大多數(shù)的生存分析必須考慮刪失問(wèn)題,當(dāng)我們獲得了研究對(duì)象生存時(shí)間的部分信息,而不知道確切的生存時(shí)間時(shí),刪失就發(fā)生了。刪失——不知道確切生存時(shí)間二刪失數(shù)據(jù)絕大多數(shù)的生存分析必須考慮刪失問(wèn)114舉一個(gè)簡(jiǎn)單的關(guān)于刪失的例子,以X表示一組處于緩和期的白血病患者,對(duì)他們進(jìn)行隨訪直到這些患者脫離緩和期。對(duì)于某個(gè)患者,當(dāng)研究結(jié)束時(shí),他仍處于緩和期,終點(diǎn)事件沒(méi)有發(fā)生,該病人的生存時(shí)間就認(rèn)為是刪失的。對(duì)于這個(gè)患者,他的生存時(shí)間至少是研究者對(duì)他進(jìn)行隨訪的時(shí)間,但是若他在研究結(jié)束以后才脫離緩和期,研究者就不知道他的確切的生存時(shí)間。2刪失數(shù)據(jù)舉一個(gè)簡(jiǎn)單的關(guān)于刪失的例子,以X表示一組處于緩和期的白血病患115一般造成刪失的原因有三個(gè)
1直到研究結(jié)束時(shí)研究對(duì)象仍未發(fā)生終點(diǎn)事件
2研究對(duì)象在研究期間發(fā)生失訪
3研究對(duì)象因死亡而退出研究(如果死亡不是研究者感興趣的事件)或其他原因(如藥物副反應(yīng)或其他風(fēng)險(xiǎn))
研究結(jié)束——終點(diǎn)事件未發(fā)生
刪失失訪
中途退出2刪失數(shù)據(jù)一般造成刪失的原因有三個(gè)
1直到研究結(jié)束時(shí)研究對(duì)象仍未發(fā)生116
2刪失數(shù)據(jù)以圖例的形式描述幾個(gè)研究對(duì)象的隨訪經(jīng)歷,以X表示發(fā)生終點(diǎn)事件的研究對(duì)象。
例
2刪失數(shù)據(jù)以圖例的形式描述幾個(gè)研究對(duì)象的隨訪經(jīng)歷,以X表117研究對(duì)象A在研究開(kāi)始時(shí)進(jìn)入研究,五周后發(fā)生終點(diǎn)事件,他的生存時(shí)間是5周,不屬于刪失
研究對(duì)象B也是在研究開(kāi)始時(shí)進(jìn)入研究,但是在12周的研究期結(jié)束以后仍未發(fā)生終點(diǎn)事件,生存時(shí)間屬于刪失,因?yàn)槲覀冎恢浪辽偕娴?2周
研究對(duì)象C在研究開(kāi)始后第2.5周進(jìn)入研究,在第六周時(shí)退出研究,他的生存時(shí)間為3.5周,屬于刪失
研究對(duì)象D在研究開(kāi)始后第4周進(jìn)入研究,直到研究結(jié)束時(shí)仍未發(fā)生終點(diǎn)事件,他的刪失時(shí)間為8周
研究對(duì)象E在研究開(kāi)始后第3周進(jìn)入研究,在隨訪到第九周時(shí)發(fā)生失訪,他的刪失時(shí)間為6周
研究對(duì)象F在研究開(kāi)始后第8周進(jìn)入研究,隨訪到第11.5周時(shí)發(fā)生終點(diǎn)事件,與研究對(duì)象A一樣,沒(méi)有發(fā)生刪失,他的生存時(shí)間為3.5周2刪失數(shù)據(jù)研究對(duì)象A在研究開(kāi)始時(shí)進(jìn)入研究,五周后發(fā)生終點(diǎn)事件,他的生存118總結(jié)
六個(gè)研究對(duì)象中,有兩個(gè)發(fā)生終點(diǎn)事件,為A與F,四個(gè)發(fā)生刪失,為B、C、D、E。2刪失數(shù)據(jù)總結(jié)
六個(gè)研究對(duì)象中,有兩個(gè)發(fā)生終點(diǎn)事件,為A與F,四個(gè)發(fā)生119六名研究對(duì)象的生存時(shí)間表2刪失數(shù)據(jù)在該表最后一列中,以1表示研究對(duì)象發(fā)生了終點(diǎn)事件,以0表示發(fā)生刪失。生存時(shí)間的單位為周六名研究對(duì)象的生存時(shí)間表2刪失數(shù)據(jù)在該表最后一列中,以1表120刪失類型2刪失數(shù)據(jù)刪失類型2刪失數(shù)據(jù)1212刪失數(shù)據(jù)右刪失——當(dāng)研究結(jié)束時(shí)研究對(duì)象未發(fā)生終點(diǎn)事件、失訪、中途退出造成的刪失稱為右刪失。
雖然研究對(duì)象也可能發(fā)生左刪失,但大部分刪失都是右刪失。2刪失數(shù)據(jù)右刪失——當(dāng)研究結(jié)束時(shí)研究對(duì)象未發(fā)122左刪失——研究對(duì)象的確切生存時(shí)間小于或等于觀察的生存時(shí)間。例如,隨訪一個(gè)研究對(duì)象直到他表現(xiàn)為HIV陽(yáng)性,研究者一般將研究對(duì)象第一次HIV測(cè)試陽(yáng)性作為終點(diǎn)事件。但是研究者不知道研究對(duì)象接觸到HIV病毒的確切時(shí)間,也就不知道研究對(duì)象確切的HIV呈陽(yáng)性的時(shí)間。這樣該研究對(duì)象的生存時(shí)間屬于左刪失,因?yàn)樗嬲纳鏁r(shí)間是從隨訪開(kāi)始到感染HIV的時(shí)間,小于觀察的生存時(shí)間(從隨訪開(kāi)始到HIV測(cè)試陽(yáng)性的時(shí)間)2刪失數(shù)據(jù)左刪失——研究對(duì)象的確切生存時(shí)間小于或等于觀察123三術(shù)語(yǔ)與符號(hào)三術(shù)語(yǔ)與符號(hào)124T——隨機(jī)變量,生存時(shí)間,大于或等于0t——隨機(jī)變量T的某一個(gè)確切值,例如,觀察某個(gè)研究對(duì)象經(jīng)過(guò)癌癥治療以后生存期能否超過(guò)5年,此時(shí)t=5,T>5?3術(shù)語(yǔ)與符號(hào)T——隨機(jī)變量,生存時(shí)間,大于或等于0t——隨機(jī)變量T的某125以希臘字母作為終點(diǎn)事件是否發(fā)生的指示變量,它是一個(gè)隨機(jī)變量3術(shù)語(yǔ)與符號(hào)
研究結(jié)束時(shí)未發(fā)生終點(diǎn)事件=0失訪中途退出以希臘字母作為終點(diǎn)事件是否發(fā)生的指示變量,它是一個(gè)隨126生存函數(shù)與風(fēng)險(xiǎn)函數(shù)3術(shù)語(yǔ)與符號(hào)生存函數(shù)與風(fēng)險(xiǎn)函數(shù)3術(shù)語(yǔ)與符號(hào)127生存函數(shù)表示研究對(duì)象活過(guò)某個(gè)時(shí)間的概率,即T>t的概率3術(shù)語(yǔ)與符號(hào)生存函數(shù)表示研究對(duì)象活過(guò)某個(gè)時(shí)間的概率,即T>t的概率3術(shù)128生存函數(shù)是生存分析的基礎(chǔ),因?yàn)橹懒瞬煌瑃值的生存概率,就獲得了關(guān)于生存數(shù)據(jù)的最關(guān)鍵信息理論上,t的取值范圍為0-∞,生存函數(shù)的圖形是一條光滑的曲線3術(shù)語(yǔ)與符號(hào)生存函數(shù)是生存分析的基礎(chǔ),因?yàn)橹懒瞬煌瑃值的生存概率,就獲129以生存時(shí)間t為橫軸,生存函數(shù)s(t)為縱軸,繪制生存曲線。由圖可以觀察得到生存曲線的以下特點(diǎn)(1)生存曲線是一條非增曲線,隨著t的增加,不斷下降。(2)t=0時(shí),s(t)=s(0)=1。即研究開(kāi)始時(shí),沒(méi)有研究對(duì)象出現(xiàn)終點(diǎn)事件。在0時(shí)刻的生存概率為1(3)t→∞時(shí),s(t)=s(∞)=0。即理論上,若研究時(shí)間沒(méi)有限制,最后將沒(méi)有研究對(duì)象存活。所以生存曲線最終下降為0。這種情形是生存曲線的理論模型3術(shù)語(yǔ)與符號(hào)以生存時(shí)間t為橫軸,生存函數(shù)s(t)為縱軸,繪制生存曲線。由130對(duì)于實(shí)際數(shù)據(jù),生存函數(shù)的圖形是階梯狀的,而不是光滑曲線。由于研究期限不可能無(wú)限長(zhǎng)以及競(jìng)爭(zhēng)風(fēng)險(xiǎn)的存在,因此不是所有的研究對(duì)象都會(huì)發(fā)生終點(diǎn)事件。以表示估計(jì)的生存函數(shù),在研究結(jié)束時(shí),生存曲線不一定下降為0。3術(shù)語(yǔ)與符號(hào)對(duì)于實(shí)際數(shù)據(jù),生存函數(shù)的圖形是階梯狀的,而不131以h(t)表示風(fēng)險(xiǎn)函數(shù),風(fēng)險(xiǎn)函數(shù)公式為3術(shù)語(yǔ)與符號(hào)
表示一個(gè)小的時(shí)間區(qū)間以h(t)表示風(fēng)險(xiǎn)函數(shù),風(fēng)險(xiǎn)函數(shù)公式為3術(shù)語(yǔ)與符號(hào)132h(t)表示在時(shí)間t仍存活的研究對(duì)象,每單位時(shí)間終點(diǎn)事件發(fā)生的瞬時(shí)可能。與生存函數(shù)相反,生存函數(shù)關(guān)注的是未發(fā)生終點(diǎn)事件,風(fēng)險(xiǎn)函數(shù)關(guān)注的則是終點(diǎn)事件的發(fā)生。在某種程度上,風(fēng)險(xiǎn)函數(shù)可以認(rèn)為是給出了生存函數(shù)蘊(yùn)含的信息的相反的一面。3術(shù)語(yǔ)與符號(hào)h(t)表示在時(shí)間t仍存活的研究對(duì)象,每單位時(shí)133以速度的例子解釋瞬時(shí)可能的意義。在你開(kāi)車(chē)時(shí)看到速度儀顯示的速度為60英里每小時(shí),這意味著在未來(lái)的一小時(shí)內(nèi)你將在這條路上行駛60英里。這就是瞬時(shí)可能的意義。速度儀上的數(shù)字決定你在未來(lái)一小時(shí)內(nèi)行駛多長(zhǎng)的距離。由于你可能在未來(lái)的一小時(shí)內(nèi)減速或加速,也有可能停車(chē),所以60英里每小時(shí)的讀數(shù)并不能說(shuō)明你在未來(lái)一小時(shí)內(nèi)真正行駛的距離。速度儀僅僅說(shuō)明你在某一瞬間的行駛速度。
與速度的含義相似,風(fēng)險(xiǎn)函數(shù)表示生存到t時(shí)刻的研究對(duì)象,在t時(shí)刻失效事件(死亡或發(fā)?。┌l(fā)生的瞬時(shí)可能。這與速度的例子是類似的,假設(shè)你已經(jīng)行駛了一段時(shí)間,這時(shí)速度儀上的速度也是一個(gè)瞬時(shí)可能。3術(shù)語(yǔ)與符號(hào)以速度的例子解釋瞬時(shí)可能的意義。在你開(kāi)車(chē)時(shí)看到速度儀顯示的速134風(fēng)險(xiǎn)函數(shù)公式極限符號(hào)右側(cè)的分子部分是一個(gè)條件函數(shù),它表示在給定條件A的前提下,B的概率。即已經(jīng)生存到t時(shí)刻的研究對(duì)象在(t,t+)時(shí)間區(qū)間內(nèi)終點(diǎn)事件發(fā)生的概率。由于風(fēng)險(xiǎn)函數(shù)利用了條件概率的形式,因此風(fēng)險(xiǎn)函數(shù)有時(shí)被稱為條件風(fēng)險(xiǎn)率。3術(shù)語(yǔ)與符號(hào)風(fēng)險(xiǎn)函數(shù)公式極限符號(hào)右側(cè)的分子部分是一個(gè)135風(fēng)險(xiǎn)函數(shù)是一個(gè)比率而不是概率由風(fēng)險(xiǎn)函數(shù)的公式可知,極限符號(hào)右側(cè)是兩個(gè)數(shù)值之比,分子是條件概率,分母是一個(gè)小的時(shí)間區(qū)間,分子與分母相除以后得到的是每單位時(shí)間的概率,不再是概率而是比率,它的取值范圍與概率的取值范圍不同,概率的取值范圍為0-1,而極限符號(hào)右側(cè)的取值范圍為0-∞,其大小取決于時(shí)間的單位是天、周、月還是年。3術(shù)語(yǔ)與符號(hào)風(fēng)險(xiǎn)函數(shù)是一個(gè)比率而不是概率由風(fēng)險(xiǎn)函數(shù)的公式可知136舉例說(shuō)明風(fēng)險(xiǎn)函數(shù)的取值,以P表示條件概率,P=1/3,時(shí)間區(qū)間 為1/2天,兩數(shù)相除可得每單位時(shí)間的概率,P值保持不變,時(shí)間區(qū)間的單位由天改為周,則1/2天等于1/14周,兩數(shù)相除可得每單位時(shí)間的概率,計(jì)算結(jié)果見(jiàn)下表 3術(shù)語(yǔ)與符號(hào)舉例說(shuō)明風(fēng)險(xiǎn)函數(shù)的取值,以P表示條件概率,P=137對(duì)于相同的條件概率,時(shí)間區(qū)間的單位不同時(shí),計(jì)算得到的結(jié)果不同,其值有可能大于一。3術(shù)語(yǔ)與符號(hào)對(duì)于相同的條件概率,時(shí)間區(qū)間的單位不同時(shí),計(jì)算138趨于零,對(duì)公式右側(cè)的表達(dá)式取極限,可以得到t時(shí)刻每單位時(shí)間失效事件發(fā)生的概率。另一種說(shuō)法是風(fēng)險(xiǎn)函數(shù)或條件風(fēng)險(xiǎn)比表示已生存到t時(shí)刻的研究對(duì)象,在t時(shí)刻每單位時(shí)間失效事件發(fā)生的瞬時(shí)可能。3術(shù)語(yǔ)與符號(hào)趨于零,對(duì)公式右側(cè)的表達(dá)式取極限,可以139下圖是三個(gè)風(fēng)險(xiǎn)函數(shù)隨時(shí)間變化的圖形,不同于生存函數(shù),風(fēng)險(xiǎn)函數(shù)的取值不一定從1開(kāi)始,一直下降為0,而是可以從任意值開(kāi)始,向任意方向上升或下降,但總是大于零。3術(shù)語(yǔ)與符號(hào)下圖是三個(gè)風(fēng)險(xiǎn)函數(shù)隨時(shí)間變化的圖形,不同于生存函數(shù),風(fēng)險(xiǎn)函數(shù)140對(duì)于一個(gè)給定的t值,風(fēng)險(xiǎn)函數(shù)具有以下兩個(gè)特點(diǎn):1風(fēng)險(xiǎn)函數(shù)是非負(fù)的,h(t)≥02風(fēng)險(xiǎn)函數(shù)沒(méi)有上界,即風(fēng)險(xiǎn)函數(shù)的取值范圍為0-∞原因:由風(fēng)險(xiǎn)函數(shù)的公式可知,風(fēng)險(xiǎn)函數(shù)的分子與分母都是非負(fù)的,分母的取值范圍為0-∞3術(shù)語(yǔ)與符號(hào)對(duì)于一個(gè)給定的t值,風(fēng)險(xiǎn)函數(shù)具有以下兩個(gè)特點(diǎn):1風(fēng)險(xiǎn)函數(shù)是141風(fēng)險(xiǎn)函數(shù)的圖形類型
1常數(shù)風(fēng)險(xiǎn)函數(shù)3術(shù)語(yǔ)與符號(hào)第一個(gè)圖是健康人群的風(fēng)險(xiǎn)函數(shù)圖,由圖可知,不論t取何值,h(t)均等于一個(gè)常數(shù)——,即對(duì)于一個(gè)研究對(duì)象而言,若他/她在研究期間一直保持健康狀態(tài),那么他/她在研究期間的任何時(shí)間患病的瞬時(shí)可能性均相同。當(dāng)風(fēng)險(xiǎn)函數(shù)為一常數(shù)時(shí),這時(shí)的生存模型就是指數(shù)模型風(fēng)險(xiǎn)函數(shù)的圖形類型
1常數(shù)風(fēng)險(xiǎn)函數(shù)3術(shù)語(yǔ)與符號(hào)第一個(gè)圖是1422隨時(shí)間遞增的風(fēng)險(xiǎn)函數(shù)由圖可知,風(fēng)險(xiǎn)函數(shù)隨著時(shí)間的延長(zhǎng)而增大。這種圖形稱為遞增的Weibull模型。這種圖形適用于以死亡為失效事件的白血病,而不是用于疾病治療后的反應(yīng)。對(duì)于一個(gè)白血病人,隨著生存期的延長(zhǎng),預(yù)后變差,病人的死亡風(fēng)險(xiǎn)將會(huì)增加。3術(shù)語(yǔ)與符號(hào)2隨時(shí)間遞增的風(fēng)險(xiǎn)函數(shù)由圖可知,風(fēng)險(xiǎn)函數(shù)隨著時(shí)間的延長(zhǎng)而增1433隨時(shí)間遞減的風(fēng)險(xiǎn)函數(shù)風(fēng)險(xiǎn)函數(shù)隨時(shí)間不斷減小。這種類型的圖形稱為遞減的Weibull模型。這種模型適用于經(jīng)過(guò)外科手術(shù)治療處于恢復(fù)期的病人,失效事件為死亡。處于恢復(fù)期的病人,隨著生存期的延長(zhǎng),預(yù)后變好,病人的死亡風(fēng)險(xiǎn)將會(huì)減少。3術(shù)語(yǔ)與符號(hào)3隨時(shí)間遞減的風(fēng)險(xiǎn)函數(shù)風(fēng)險(xiǎn)函數(shù)隨時(shí)間不斷減小。這種類型的圖1444先增后減的風(fēng)險(xiǎn)函數(shù)該圖顯示風(fēng)險(xiǎn)函數(shù)是先增加后減少。該類型的代表是對(duì)數(shù)正態(tài)生存模型。肺結(jié)核病人的風(fēng)險(xiǎn)函數(shù)屬于這種類型,病人的死亡風(fēng)險(xiǎn)在早期是遞增的,經(jīng)過(guò)一段時(shí)間以后會(huì)逐漸下降。3術(shù)語(yǔ)與符號(hào)4先增后減的風(fēng)險(xiǎn)函數(shù)該圖顯示風(fēng)險(xiǎn)函數(shù)是先增加后減少。該類型145生存函數(shù)與風(fēng)險(xiǎn)函數(shù)的關(guān)系生存函數(shù)對(duì)于生存數(shù)據(jù)的分析而言,具有更大的吸引力,因?yàn)樗苯用枋鲆粋€(gè)研究隊(duì)列的生存經(jīng)歷。3術(shù)語(yǔ)與符號(hào)生存函數(shù)與風(fēng)險(xiǎn)函數(shù)的關(guān)系生存函數(shù)對(duì)于生存數(shù)據(jù)的分析而言,具有146應(yīng)用風(fēng)險(xiǎn)函數(shù)主要基于以下幾個(gè)原因1風(fēng)險(xiǎn)函數(shù)可以計(jì)算瞬時(shí)可能性(概率),而生存函數(shù)則是條件累積概率2風(fēng)險(xiǎn)函數(shù)可以鑒別模型類型,例如對(duì)于一組數(shù)據(jù),它的模型是指數(shù)模型,Weibull模型,還是對(duì)數(shù)正態(tài)模型3風(fēng)險(xiǎn)函數(shù)是生存分析的數(shù)學(xué)模型3術(shù)語(yǔ)與符號(hào)應(yīng)用風(fēng)險(xiǎn)函數(shù)主要基于以下幾個(gè)原因1風(fēng)險(xiǎn)函數(shù)可以計(jì)算瞬時(shí)可能147生存函數(shù)與風(fēng)險(xiǎn)函數(shù)的關(guān)系:知道其中一個(gè)就可以推導(dǎo)出另一個(gè)。例如,風(fēng)險(xiǎn)函數(shù)等于一個(gè)常數(shù),即h(t)=,則相應(yīng)的生存函數(shù)s(t)=3術(shù)語(yǔ)與符號(hào)生存函數(shù)與風(fēng)險(xiǎn)函數(shù)的關(guān)系:知道其中一個(gè)就可以推導(dǎo)出另一個(gè)。例148可以用兩個(gè)微積分公式表示生存函數(shù)與風(fēng)險(xiǎn)函數(shù)的更一般的關(guān)系
在實(shí)際的數(shù)據(jù)分析中,電腦程序可以給出生存函數(shù)與風(fēng)險(xiǎn)函數(shù)的數(shù)字轉(zhuǎn)換,不需要研究者自己利用公式計(jì)算。3術(shù)語(yǔ)與符號(hào)可以用兩個(gè)微積分公式表示生存函數(shù)與風(fēng)險(xiǎn)函數(shù)的更一般的關(guān)系
在149總結(jié)對(duì)于一個(gè)已生存到t時(shí)刻的研究對(duì)象,生存函數(shù)側(cè)重于生存,而風(fēng)險(xiǎn)函數(shù)則側(cè)重于失效事件的發(fā)生3術(shù)語(yǔ)與符號(hào)總結(jié)對(duì)于一個(gè)已生存到t時(shí)刻的研究對(duì)象,生存函數(shù)側(cè)重于生存,而150四生存分析的目的生存分析的基本目標(biāo)1估計(jì)及解釋生存數(shù)據(jù)的生存函數(shù)和/或風(fēng)險(xiǎn)函數(shù)2比較生存函數(shù)和/或風(fēng)險(xiǎn)函數(shù)3評(píng)價(jià)解釋變量與生存時(shí)間的關(guān)系生存分析的目的四生存分析的目的生存分析的基本目標(biāo)生存分析的目的151以下是兩個(gè)生存函數(shù)的曲線圖(針對(duì)第一個(gè)目的)左側(cè)的生存函數(shù)顯示在隨訪早期生存率下降很快,后期下降較慢;右側(cè)的生存函數(shù)則相反,在隨訪早期生存率下降較慢,后期則下降很快。生存分析的目的以下是兩個(gè)生存函數(shù)的曲線圖(針對(duì)第一個(gè)目的)左側(cè)的生存函數(shù)顯152治療組與安慰劑組生存函數(shù)的比較(針對(duì)第二個(gè)目的)在六周以前,治療組的生存函數(shù)曲線一直在安慰劑組的上方,六周以后,兩組的生存曲線基本重疊,這說(shuō)明在六周以前,治療組的效應(yīng)大大好于安慰劑組,六周以后兩組的效應(yīng)基本相同。生存分析的目的治療組與安慰劑組生存函數(shù)的比較(針對(duì)第二個(gè)目的)在六周以前,153數(shù)學(xué)模型
(針對(duì)第三個(gè)目的)實(shí)現(xiàn)這個(gè)目的,需要應(yīng)用數(shù)學(xué)估計(jì)模型,例如Cox比利風(fēng)險(xiǎn)模型就是最常使用的。生存分析的目的數(shù)學(xué)模型
(針對(duì)第三個(gè)目的)實(shí)現(xiàn)這個(gè)目的,需要應(yīng)用數(shù)學(xué)估計(jì)模154五基于計(jì)算機(jī)的數(shù)據(jù)編排基于計(jì)算機(jī)應(yīng)用數(shù)據(jù)編排類型基于理解五基于計(jì)算機(jī)的數(shù)據(jù)編排155左表是基于計(jì)算機(jī)的原始數(shù)據(jù)的編排形式。設(shè)樣本量為n,表的第一列是研究對(duì)象的編號(hào),從一到n;第二列為生存時(shí)間,第一個(gè)研究對(duì)象的生存時(shí)間記為,第二個(gè)研究對(duì)象的生存時(shí)間記為,以此類推。第二列給出了所有研究對(duì)象的觀察的生存時(shí)間,不論研究對(duì)象是否發(fā)生失效事件。第三列是表示是否發(fā)生刪失的指示變量,若研究對(duì)象發(fā)生了失效事件,則=1,否則=0.五基于計(jì)算機(jī)的數(shù)據(jù)編排左表是基于計(jì)算機(jī)的原始數(shù)據(jù)的編排形式。設(shè)樣本量為n,表的第一156對(duì)于第五個(gè)研究對(duì)象,在研究期間發(fā)生了失效事件,則=1,第八個(gè)研究對(duì)象在研究期間發(fā)生刪失,則=0,等于失效事件發(fā)生的總和,≤n,因?yàn)椴皇撬械难芯繉?duì)象都會(huì)發(fā)生失效事件。為解釋性變量,例如年齡、暴露情況以及乘積變量(年齡×種族)等五基于計(jì)算機(jī)的數(shù)據(jù)編排對(duì)于第五個(gè)研究對(duì)象,在研究期間發(fā)生了失效事件,則=157解釋變量X1對(duì)應(yīng)的一列數(shù)據(jù)是n個(gè)研究對(duì)象該變量的觀測(cè)值,X11表示第一個(gè)研究對(duì)象的第一個(gè)解釋變量的值,X21表示第二個(gè)研究對(duì)象的第一個(gè)解釋變量的值,其他的以此類推。對(duì)于第j個(gè)研究對(duì)象,他對(duì)應(yīng)的研究信息為tj,,Xj1,Xj2,…Xjp五基于計(jì)算機(jī)的數(shù)據(jù)編排解釋變量X1對(duì)應(yīng)的一列數(shù)據(jù)是n個(gè)研究對(duì)象158例題兩組白血病患者的研究數(shù)據(jù)將42名白血病患者分為兩組,每組21人,一組接受治療,一組使用安慰劑。該數(shù)據(jù)來(lái)自Freireich于1963年發(fā)表在Blood雜志的文章。左側(cè)表的數(shù)據(jù)編不能直接錄入計(jì)算機(jī)進(jìn)行分析,需要重新進(jìn)行編排。該數(shù)據(jù)給出了每一個(gè)研究對(duì)象在研究期間處于緩和期的周數(shù),知道他發(fā)生失效事件或刪失。在該研究中,脫離緩和期為失效事件,若研究對(duì)象在研究結(jié)束仍未發(fā)生失效事件、失訪或研究結(jié)束前退出,這些都視為刪失。以生存時(shí)間后加一個(gè)加號(hào)表示刪失數(shù)據(jù)。五基于計(jì)算機(jī)的數(shù)據(jù)編排例題兩組白血病患者的研究數(shù)據(jù)將42名白血病患者分為兩組,每159五基于計(jì)算機(jī)的數(shù)據(jù)編排五基于計(jì)算機(jī)的數(shù)據(jù)編排160由下表可知,前三個(gè)研究對(duì)象都在第六周時(shí)發(fā)生失效事件,之后的六名研究對(duì)象也先后發(fā)生失效事件,他們的生存時(shí)間集中在7-23周之間。其余的研究對(duì)象都發(fā)生了刪失事件,他們的生存時(shí)間集中在6-35周之間。例如第三行的第一個(gè)數(shù)據(jù)為6,其后有加號(hào)標(biāo)識(shí),表示該研究對(duì)象在第六周時(shí)發(fā)生了刪失。
第一組的21名研究對(duì)象有九名發(fā)生了失效事件,其余12名均為刪失。第二組沒(méi)有刪失數(shù)據(jù),即第二組的21名研究對(duì)象在研究期間均脫離了緩和期。五基于計(jì)算機(jī)的數(shù)據(jù)編排由下表可知,前三個(gè)研究對(duì)象都在第六周時(shí)發(fā)生失效事件,之后的六161。五基于計(jì)算機(jī)的數(shù)據(jù)編排。五基于計(jì)算機(jī)的數(shù)據(jù)編排162上表為經(jīng)過(guò)編排的可用于計(jì)算機(jī)分析的數(shù)據(jù)五基于計(jì)算機(jī)的數(shù)據(jù)編排表的前半部分為治療組的數(shù)據(jù)(1-21),后半部分為安慰劑組的數(shù)據(jù)(22-42),表的第一列為研究者編號(hào),第二列為生存時(shí)間,第三列為指示變量(刪失還是失效),第四列為解釋變量(組別),1代表治療組,0代表安慰劑組。表中的一行數(shù)據(jù)代表了一個(gè)研究對(duì)象的信息,例如,對(duì)3號(hào)研究對(duì)象而言,他的生存時(shí)間為六周,=1,即該研究對(duì)象在研究期間脫離了緩和期,X=1表示該研究對(duì)象屬于治療組。對(duì)于14號(hào)研究對(duì)象,他的生存時(shí)間為17周,=0.即研究對(duì)象在研究期間發(fā)生了刪失,X=1表示該研究對(duì)象也屬于治療組;對(duì)于第32號(hào)研究對(duì)象,他的生存時(shí)間是8周,=1,即該研究對(duì)象在研究期間發(fā)生了失效事
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度精英階層相親婚姻合同
- 二零二五年度木工行業(yè)專業(yè)人才培養(yǎng)合同
- 二零二五年度車(chē)輛貸款抵押與二手車(chē)交易平臺(tái)會(huì)員服務(wù)協(xié)議
- 2025年吉林貨運(yùn)從業(yè)資格證考試模擬題庫(kù)及答案
- 抗議英雄發(fā)言稿
- 2025年邯鄲貨車(chē)資格證考試題
- 健康醫(yī)療產(chǎn)業(yè)創(chuàng)新發(fā)展數(shù)據(jù)表
- 家裝水電施工合同
- 股份制企業(yè)合同簽署與文書(shū)管理規(guī)范
- 自然辯證法概論知到課后答案智慧樹(shù)章節(jié)測(cè)試答案2025年春浙江工業(yè)大學(xué)
- 機(jī)床夾具設(shè)計(jì)實(shí)例
- 景觀照明設(shè)施運(yùn)行維護(hù)經(jīng)費(fèi)估算
- GB/T 12279.1-2024心血管植入器械人工心臟瓣膜第1部分:通用要求
- 人工智能在維修行業(yè)的應(yīng)用
- 福建省泉州市第五中學(xué)2023-2024學(xué)年八年級(jí)下學(xué)期期中語(yǔ)文試題
- 2024CSCO惡性腫瘤患者營(yíng)養(yǎng)治療指南解讀
- 自我解壓與情緒管理課件
- 2024年時(shí)政必考試題庫(kù)ab卷
- 語(yǔ)法選擇10篇(名校模擬)-2024年中考英語(yǔ)逆襲沖刺名校模擬真題速遞(廣州專用)
- 產(chǎn)后出血預(yù)防與處理
- 通達(dá)信公式函數(shù)說(shuō)明大全
評(píng)論
0/150
提交評(píng)論