版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
生存分析的SAS編程操作薛富波2006/05/21生存分析的有關(guān)概念事件時間(time-to-event,TTE):又稱為生存時間(survivaltime)或失效時間(failuretime),是指從研究開始到相應事件發(fā)生的時間。刪失值(censoredvalue):是指TTE在某些觀測上其確切的取值是未知的,所能知道的僅僅是其測量值肯定大于或小于某個特定值(即其取值的下限或上限),或者位于某個特定的取值范圍內(nèi)(取值區(qū)間)。右側(cè)刪失:反映真實值下限的數(shù)據(jù)。左側(cè)刪失:反映真實值上限的數(shù)據(jù)。區(qū)間刪失:反映真實值所在區(qū)間的數(shù)據(jù)。生存分析的方法分類非參數(shù)法:乘積極限法、壽命表法等;參數(shù)法:指數(shù)分布法、威布爾分布(WeibullDistribution)法、對數(shù)正態(tài)回歸分析法以及對數(shù)logistic回歸分析法等;半?yún)?shù)法:Cox模型分析方法。生存分析的非參數(shù)方法非參數(shù)法生存分析示例145例乳腺癌患者中,免疫過氧化物酶檢測結(jié)果顯示9例陽性、36例陰性,比較其生存時間分布的SAS程序如下。proclifetestplots=(s);timetime*censor(1);strataimmuno;run;非參數(shù)法生存分析示例2proclifetestdata=valungmethod=lt;timesurvtime*censor(1);stratacell;run;一項有關(guān)肺癌患者生存天數(shù)的臨床研究數(shù)據(jù)。應變量survtime表示患者生存天數(shù),其中的負值表示刪失值;協(xié)變量包括cell(細胞類型)、治療方法therapy(標準方法和試驗方法)、既往治療prior(0-無,10-有)、年齡age(歲)、診斷月數(shù)diagtime(確診至入組時的以月為單位的時間間隔)、KPS評分kps等。數(shù)據(jù)中產(chǎn)生一個刪失值指示變量censor(取1表示刪失,取0表示非刪失),一個治療分組變量treatment(0表示標準方法,1表示試驗方法)。lifetest過程用以對右側(cè)刪失類型的時間數(shù)據(jù)進行時間分布的描述以及多組間時間分布的比較(檢驗兩個或多個樣本是否來自具有同一個生存函數(shù)的總體);提供兩種秩檢驗方法和一種似然比檢驗方法來檢驗多組生存函數(shù)的同一性,兩種秩檢驗方法為包括廣義Savage(指數(shù)得分)檢驗(即log-rank檢驗)和Wilcoxon檢驗。proclifetest語句proclifetest語句為調(diào)用lifetest過程的開始,其主要語句選項及其可執(zhí)行的功能見下表。intervals=選項的設置方法端點值間以空格分隔,如“intervals=10305070”;端點之間以逗號分隔,如“intervals=10,30,50,70”;“atob”的形式,如“intervals=1to7”;“atobbyc”的形式,如“intervals=1to7by2”;混合方式,如“intervals=1,3to7,10”。strata語句strata語句的作用是指定用以分層的變量;lifetest過程根據(jù)strata變量的非缺失值對輸入數(shù)據(jù)進行分層;如果要將strata變量的缺失值也作為一個合法的水平用以分層,可在strata語句中設置“missing”選項;strata語句中可指定多個分層變量,分層情況將由各分層變量水平的組合來決定;對于數(shù)值型分層變量,若為其設置分層區(qū)間端點列表,該變量的水平與形成的區(qū)間一一對應,設置方式與proclifetest語句的“intervals=”選項中類似;對于數(shù)值型分層變量,若為其設置分層區(qū)間端點列表,該變量的水平與形成的區(qū)間一一對應。所劃分的區(qū)間均為半開半閉區(qū)間,第一個區(qū)間總是以-∞為下界,最后一個區(qū)間總是以∞為上界。strata語句分層區(qū)間端點列表設置方式①端點值間以空格分隔,如:
strataage(5102030);②端點之間以逗號分隔,如:strataage(5,10,20,30);③“atob”的形式,如:strataage(5to10);④“atobbyc”的形式,如:strataage(5to30by10);⑤混合方式,如:strataage(5,10to50by10);舉例:stratawt(50to80by10);此時變量wt將按照如下的5個區(qū)間劃分成5個水平:test語句test語句指定需要與生存時間進行關(guān)聯(lián)性分析的協(xié)變量;test語句中的變量必須為數(shù)值型;對于test變量,lifetest過程將通過兩類秩檢驗統(tǒng)計量來檢驗它們與生存時間的關(guān)聯(lián)性;每一個test變量的單變量檢驗的統(tǒng)計量也將被給出;一個有關(guān)協(xié)變量聯(lián)合效應的統(tǒng)計量列表也將被給出,此統(tǒng)計量列表的順序和各協(xié)變量對聯(lián)合效應貢獻的大小順序相一致。time語句time語句為調(diào)用lifetest過程所必需,用以指定代表生存時間的變量。time語句具有如下的形式:timevariable
<
*censor(list)>;其中“variable”即為生存時間變量的名稱,此變量名稱必須指定;隨后的星號“*”及“censor(list)”項可有可無,用來表示數(shù)據(jù)的刪失值情況?!癱ensor”為代表刪失值狀況的變量名稱,“(list)”為該變量的部分取值列表(須為數(shù)值型,且不是缺失值),如果此變量取該列表中的值,則該觀測上的生存時間為刪失值;此處的刪失值均表示右側(cè)刪失值。生存分析的半?yún)?shù)方法phreg過程phreg過程針對生存數(shù)據(jù)執(zhí)行基于Cox比例風險模型(Coxproportionalhazardsmodel)的回歸分析;可以檢驗有關(guān)回歸參數(shù)的線性假設;針對配對病例-對照研究執(zhí)行條件logistic回歸分析過程;創(chuàng)建包含有關(guān)統(tǒng)計量的輸出數(shù)據(jù)集等。phreg過程可包含的語句procphreg<options>;modelresponse<*censor(list)>=variables</options>;<programmingstatements>stratavariable<(list)><...variable<(list)>></option>;<label:>testequation1<,...,equationk></option>;freqvariable;weightvariable</option>;idvariables;output<out=sas-data-set><keyword=name...keyword=name></options>;baseline<out=sas-data-set>
<covariates=sas-data-set><keyword=name...keyword=name></options>;byvariables;run;procphreg語句選項選
項功能和用法covout要求將各參數(shù)估計值的協(xié)方差矩陣輸出到“outest=”選項所指定的輸出數(shù)據(jù)集中。此選項須在設置了“outest=”選項的情況下方有效。covsandwich<(aggregate)>要求給出協(xié)方差矩陣的lin-wei穩(wěn)健三明治估計值(robustsandwichestimate)。設置此選項時,上述方法還將被用于總體假設的wald檢驗,各參數(shù)的假設檢驗以及與test語句有關(guān)的假設檢驗。該選項中“(aggregate)”為可選項,如果設置此項,則在協(xié)方差矩陣的計算中要求將每一id標識(須存在id語句以指定id變量)的得分殘差進行合計。data=指定要進行分析的輸入數(shù)據(jù)集名稱。multipass對于每一步newton-raphson迭代,要求phreg過程對“(start,stop)”(區(qū)間型)型應變量的生存時間風險集(riskset)進行重新編排,并重新計算其中時間依賴型變量(由programming語句所指定)的值。此選項的作用在于以增加計算時間為代價而減少程序運行對磁盤空間的占用,這在大樣本數(shù)據(jù)處理時非常有用。此選項僅在應變量(生存時間)為區(qū)間型時有效。noprint禁止任何輸出結(jié)果的顯示。nosummary禁止結(jié)果中對刪失值和非刪失值觀測頻數(shù)的顯示。outest=指定一個輸出數(shù)據(jù)集,用以存儲回歸系數(shù)估計值等若干統(tǒng)計量。如果同時設置了“covout”選項,該輸出數(shù)據(jù)集中還將包含各參數(shù)的協(xié)方差矩陣。simple對于model語句中所指定的自變量,要求在輸出結(jié)果中僅顯示有關(guān)的簡單統(tǒng)計量,如均數(shù)、標準差、最小值以及最大值等。model語句model語句用來指定作為失效時間的變量、可選的刪失值狀態(tài)變量以及自變量等。model語句可設置為兩種不同的形式:
modelresponse<*censor(list)>=variables</options>;model(t1,t2)<*censor(list)>=variables</options>;第一種類型適用于僅有一個應變量的情況,第二種類型適用于計數(shù)過程輸入方式的兩個應變量的情況;model語句的第一種類型中,等號前的“response”項代表作為失效時間的變量,如果包含刪失值,則須指定“censor”項,以表示刪失值狀態(tài);model語句的第二種類型中,表示失效時間的變量為兩個,構(gòu)成一個半開半閉區(qū)間,表示觀察對象處于危險狀態(tài)的時間區(qū)間。phreg過程要求刪失值狀態(tài)變量和自變量必須為數(shù)值型變量,失效時間變量不能取負數(shù)值。如果失效時間的取值為負數(shù),相應的觀測將被剔除。編程語句(programmingstatements)是指可用于phreg過程的其它SAS語句(主要為data步的常用編程語句),用來創(chuàng)建新的自變量的取值,或修改自變量的已有取值;此類語句尤其在擬合包含時間依賴型自變量的模型時非常有用;它們還可被用于創(chuàng)建新的非時間依賴型自變量;data步的各種函數(shù)也可在phreg過程中使用,其用法也完全相同,執(zhí)行完全相同的功能??捎糜趐hreg過程的data步語句ABORT語句ARRAY語句賦值語句(assignmentstatements)CALL語句DO語句循環(huán)DO語句DOUNTIL語句DOWHILE語句END語句GOTO語句IF-THEN/ELSE語句LINK-RETURN語句PUT語句SELECT語句SUM語句編程語句的操作示例考察血壓對生存時間的影響,在研究期間的多個時間點上測量受試者的血壓。血壓可看作時間依賴型自變量,擬合模型時可以在每一時點上應用最近測量的血壓值,而不是全部應用最初的或最后的血壓測量值。針對每一位受試者,右側(cè)變量的取值均被測量,如果無條件或無法測出,則以缺失值取代。Time 生存時間Censor 刪失值狀態(tài)(0表示刪失值)BP0 受試者進入研究時的血壓T1 時刻1BP1 時刻1的血壓測量值T2 時刻2BP2 時刻2的血壓測量值procphreg;modelTime*Censor(0)=BP;BP=BP0;ifTime>=T1andT1^=.thenBP=BP1;ifTime>=T2andT2^=.thenBP=BP2;run;半?yún)?shù)法生存分析示例2(條件logistic回歸模型)一項有關(guān)低體重兒出生情況的調(diào)查數(shù)據(jù),共189位受訪婦女,59例分娩出低體重兒,其余130例分娩正常體重兒??赡艿奈kU因素包括:婦女末次月經(jīng)時體重-weight,高血壓情況-ht,孕期吸煙-smoke,尿激惹癥狀-ui等。婦女年齡作為配對因素進行m:n配對的logistic回歸分析。procphregdata=LBW;modelTime*Low(0)=LWTSmokeHTUI/ties=discrete;strataAge;run;proclogisticdata=lbw;classSmokeHTUI/ref=first;modellow(event="1")=LWTSmokeHTUI;strataAge;run;練習1數(shù)據(jù)集males為有關(guān)男性心絞痛患者生存率的調(diào)查數(shù)據(jù),其中包含3個變量,years為確診后的生存時間,censored為刪失值指示變量(1-刪失,0-未刪失),freq為每個時間點的頻數(shù)。請以此數(shù)據(jù)繪制壽命表(1年為單位),以壽命表法進行每個時間點的生存函數(shù)估計,計算其中位生存時間及其可信區(qū)間,并繪制生存分布函數(shù)對時間變化的生存曲線圖。練習2為探討某惡性腫瘤的預后,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 15561-2024數(shù)字指示軌道衡
- 農(nóng)業(yè)副產(chǎn)品高值化利用趨勢
- 高一化學教案:專題第二單元第一課時化學反應中的熱量變化(一)
- 2024高中化學第四章生命中的基礎有機化學物質(zhì)1油脂課時作業(yè)含解析新人教版選修5
- 2024高中地理課時作業(yè)8區(qū)域工業(yè)化與城市化-以我國珠江三角洲地區(qū)為例含解析新人教版必修3
- 2024高中語文第1單元論語蚜第1課天下有道丘不與易也練習含解析新人教版選修先秦諸子蚜
- 2024高中語文第五單元散而不亂氣脈中貫文與可筼筜谷偃竹記訓練含解析新人教版選修中國古代詩歌散文欣賞
- 2024高中語文精讀課文一第2課3魯迅:深刻與偉大的另一面是平和三課堂練習含解析新人教版選修中外傳記蚜
- 2024高考地理一輪復習第七單元自然環(huán)境對人類活動的影響練習含解析
- 2025新人教版英語七年級下不規(guī)則動詞表
- 2025新北師大版英語七年級下單詞表
- 《智慧城市概述》課件
- 2024年北京市家庭教育需求及發(fā)展趨勢白皮書
- GB/T 45089-20240~3歲嬰幼兒居家照護服務規(guī)范
- 中建道路排水工程施工方案
- 拆機移機合同范例
- 智能停車充電一體化解決方案
- 化學驗室安全培訓
- 天書奇譚美術(shù)課件
- GB/T 18916.15-2024工業(yè)用水定額第15部分:白酒
- 部編四年級道德與法治下冊全冊教案(含反思)
評論
0/150
提交評論