醫(yī)用SAS統(tǒng)計分析四課件_第1頁
醫(yī)用SAS統(tǒng)計分析四課件_第2頁
醫(yī)用SAS統(tǒng)計分析四課件_第3頁
醫(yī)用SAS統(tǒng)計分析四課件_第4頁
醫(yī)用SAS統(tǒng)計分析四課件_第5頁
已閱讀5頁,還剩70頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

醫(yī)用SAS統(tǒng)計分析第五(dìwǔ)講第一頁,共七十五頁。11/3/20221醫(yī)用SAS統(tǒng)計分析四

一、多元線性回歸

基本概念

多元線性回歸簡稱多元回歸,是研究一個應(yīng)變量與多個自變量間線性依存關(guān)系數(shù)量(shùliàng)變化規(guī)律的一種方法。

多元線性回歸方程式中:b0為回歸方程常數(shù)項,bj(j=1,2,┅,m)為偏回歸系數(shù),即在其他自變量固定的條件下,Xj改變(gǎibiàn)一個單位時應(yīng)變量的改變(gǎibiàn)量。

第二頁,共七十五頁。11/3/20222醫(yī)用SAS統(tǒng)計分析四多元線性回歸方程的應(yīng)用

預(yù)測應(yīng)變量的估計值

探索影響(yǐngxiǎng)應(yīng)變量y的主要因素當X為某一定值時,估計應(yīng)變量y的容許區(qū)間當X為某一定值時,估計其應(yīng)變量的總體均數(shù)的置信區(qū)間第三頁,共七十五頁。11/3/20223醫(yī)用SAS統(tǒng)計分析四語句格式

同單變量線性回歸基本相同。procreg[選項];model應(yīng)變量=自變量名列/[選項];必選語句,定義回歸分析模型procreg語句的[選項]data=數(shù)據(jù)集指明回歸分析(fēnxī)所用的數(shù)據(jù)集。

outset=數(shù)據(jù)集指定一個輸出數(shù)據(jù)集,用以存儲回歸分析所得的參數(shù)估計。

simple輸出每個變量的簡單統(tǒng)計結(jié)果。第四頁,共七十五頁。11/3/20224醫(yī)用SAS統(tǒng)計分析四model語句的[選項]selection=method規(guī)定變量篩選方法,method可以是以下幾種選項:

forward(或f)前進法,按照sle規(guī)定的P值從無到有依次選一個變量進入模型

backward(或b)后退法,按照sls規(guī)定的P值從含有全部變量的模型開始,以次剔除一個變量。

stepwise逐步(zhúbù)法,按照sle的標準依次選入變量,同時對模型中現(xiàn)有的變量按sls的標準剔除不顯著的變量。注:[選項]中沒有selection語句時,模型中含有全部自變量的回歸模型。

sle=概率值入選標準,規(guī)定變量入選模型的顯著性水平,前進法默認為0.5,逐步法默認為0.15。

sls=概率值剔除標準,指定變量保留在模型的顯著性水平,后退法默認為0.1,逐步法默認為0.15。第五頁,共七十五頁。11/3/20225醫(yī)用SAS統(tǒng)計分析四

stb

輸出各自變量的標準偏回歸系數(shù)。

cli輸出個體y值的95%容許區(qū)間上下限

clm

輸出預(yù)測值均值的95%可信區(qū)間上下限。

P輸出實際(shíjì)值Yi,預(yù)測值、殘差及其標準誤。

tol

輸出各自變量的容許值。0≤tol值≤1,越接近于0,共線性越嚴重。

vif輸出各自變量的方差膨脹因子。當vif≥10時,可認為多元共線性嚴重存在。

collin要求詳細分析自變量之間的共線性,給出信息矩陣的特征根、條件指數(shù)和方差比,當條件指數(shù)≥10,方差比>0.5時,可認為存在多元共線性。

collinoint

與選擇項collin作用相同,但不包括回歸常數(shù)。

R

進行預(yù)測值的殘差分析(即異常值識別與強影響分析),輸出學生化殘差值和Cook’s距離D值。當學生化殘差值>2時,所對應(yīng)的點可能是異常點,當D值>0.5時,可認為對應(yīng)的變量值對回歸函數(shù)是強影響點。第六頁,共七十五頁。11/3/20226醫(yī)用SAS統(tǒng)計分析四

完全多元線性回歸

例7-710名女中學生的體重(tǐzhòng)(X1,kg),胸圍(X2,cm),胸圍的呼吸差(X3,cm)及肺活量(Y,ml)的資料如下表所示?,F(xiàn)作應(yīng)變量Y對自變量X1,X2,X3的三元線性回歸方程。datamreg1;inputx1x2x3y@@;cards;35690.7160040742.5260040642.0210042743.0265037721.1240045681.5220043784.3275037662.0160044703.2275042653.02500;procreg;modely=x1x2x3/stb;run;第七頁,共七十五頁。11/3/20227醫(yī)用SAS統(tǒng)計分析四Model:MODEL1DependentVariable:YAnalysisofVarianceSumofMeanSourceDFSquaresSquareFValueProb>FModel31250109.0678416703.022595.6170.0355Error6445140.9322274190.15537CTotal91695250RootMSE272.37870R-square0.7374DepMean2315.00000AdjR-sq0.6061C.V.11.76582

第八頁,共七十五頁。11/3/20228醫(yī)用SAS統(tǒng)計分析四ParameterEstimatesParameterStandardTforH0:VariableDFEstimateErrorParameter=0Prob>|T|INTERCEP1-3035.5363542168.6738473-1.4000.2111X1160.93182336.297137981.6790.1442X2137.80833422.980808911.6450.1510X31101.379460121.974703100.8310.4377StandardizedVariableEstimateINTERCEP0.00000000X10.46445689X20.39174762X30.25399450第九頁,共七十五頁。11/3/20229醫(yī)用SAS統(tǒng)計分析四

逐步回歸

簡介

逐步回歸是篩選自變量的常用的方法之一。篩選自變量的方法還有前進法,后退法和最優(yōu)回歸子集法。逐步回歸法是依據(jù)事先給定的兩個顯著性水平SLE和SLS,將自變量逐個引入方程,同時每引入一個新變量后,對已選入的變量要進行逐個檢驗,將不顯著的變量剔除,這樣保證最后所得的變量都有顯著性。自變量間的多重共線性(multicollinearity)

整個回歸方程的統(tǒng)計檢驗P<α,而各偏回歸系數(shù)的檢驗均出現(xiàn)(chūxiàn)P>α的矛盾現(xiàn)象。偏回歸系數(shù)的估計值明顯與實際情況不符,或者是偏回歸系數(shù)的符號與專業(yè)知識的情況相反。第十頁,共七十五頁。11/3/202210醫(yī)用SAS統(tǒng)計分析四據(jù)專業(yè)知識,該自變量與應(yīng)變量間關(guān)系密切,而偏回歸系數(shù)檢驗結(jié)果P>α。增加(或刪除)一個變量,或者改變(或去除)一個觀察值,引起回歸系數(shù)估計值發(fā)生大的變化。多重共線性是引起上述問題的重要原因。解決(jiějué)多重共線性的辦法

用主成分估計等有偏估計替代最小二乘估計。用逐步回歸等方法篩選自變量。如上例7-7,整個回歸模型P=0.0355,而b0,b1,b2,b3P值均大于0.05。估計變量之間存在共線性問題。第十一頁,共七十五頁。11/3/202211醫(yī)用SAS統(tǒng)計分析四程序(chéngxù)7-13datastepreg1;inputx1x2x3y@@;cards;35690.7160040742.5260040642.0210042743.0265037721.1240045681.5220043784.3275037662.0160044703.2275042653.02500;procreg;modely=x1-x3/stbtolvifcollincollinointR;modely=x1-x3/selection=stepwisesle=0.25sls=0.25stb;run;第十二頁,共七十五頁。11/3/202212醫(yī)用SAS統(tǒng)計分析四

例(《醫(yī)學統(tǒng)計學》王潔貞主編,例15.1)

某科研協(xié)作組調(diào)查某煤礦Ⅱ期高血壓病患者40例,X1為工作面污染程度等級,X2為井下工齡(年),X3為體重(kg),X4為吸煙年限(niánxiàn)(年),X5為飲酒年限(niánxiàn)(年),Y為收縮壓(kPa),試作多元線性回歸分析。datastepreg2;infile'd:\sas\sas5\wang15_1.txt';inputidx1x2x3x4x5y@@;procreg;modely=x1-x5/stbtolvifcollincollinointr;modely=x1-x5/selection=stepwisesle=0.05sls=0.05stb;run;第十三頁,共七十五頁。11/3/202213醫(yī)用SAS統(tǒng)計分析四

二、多元線性相關(guān)

研究多個變量間線性關(guān)系的一種統(tǒng)計分析方法。變量間相關(guān)系數(shù)有以下三類:

簡單相關(guān)系數(shù)它是說明(shuōmíng)兩個變量相關(guān)程度和方向(不考慮其他變量的影響)的統(tǒng)計指標(ri,j)。

偏相關(guān)系數(shù)它是當其他變量固定時,說明某兩個變量間相關(guān)程度和方向的統(tǒng)計指標(如r12,3)。

復相關(guān)系數(shù)R亦稱為全相關(guān)系數(shù)。說明應(yīng)變量與各自變量的線性關(guān)系的密切程度。

決定系數(shù)R2復相關(guān)系數(shù)的平方。它說明應(yīng)變量的變異中由各自變量的改變而引起的占多少。如R2=0.8,則說明應(yīng)變量的變異中有80%由自變量的改變而引起的。第十四頁,共七十五頁。11/3/202214醫(yī)用SAS統(tǒng)計分析四

程序7-12datamcorr1;infile'd:\sas\sas5\mcorr1.txt';inputx1x2x3y@@;proccorrnosimple;/*禁止一些簡單統(tǒng)計量的輸出*/varx1x2x3y;/*包括(bāokuò)了所有變量,實際可以省略*/proccorrnosimple;varx1x2;partialx3;/*partial語句的作用是固定x3*/proccorrnosimple;varx1x2;partialx3y;/*partial語句的作用是固定x3和y*/run;第十五頁,共七十五頁。11/3/202215醫(yī)用SAS統(tǒng)計分析四

三、Logistic回歸分析

簡介

Logistic回歸模型是適用(shìyòng)于應(yīng)變量(因變量)為分類變量的回歸分析。當應(yīng)變量為分類變量時,如應(yīng)變量結(jié)果為二分類變量的發(fā)病、不發(fā)病,生存、死亡等,是不能用多元線性回歸模型(Y=β0+Σβixi)來分析各種危險因素與應(yīng)變量之間的關(guān)系的。因為應(yīng)變量Y只能取值為1和0。不符合線性回歸模型中應(yīng)變量Y應(yīng)具有正態(tài)分布和方差齊性的要求,同時線性回歸模型得到的Y值會出現(xiàn)大于1或小于0的不合理結(jié)果,顯然不能用線性回歸建立預(yù)測模型。

以發(fā)病為例,發(fā)病的概率為P,不發(fā)病的概率為1-P,0≤P≤1。公式(gōngshì)等號左邊簡稱為logit(P),即logit(P)=β0+Σβixi可證明(zhèngmíng),無論Y得何值,均0<P<1。上式可推導為:第十六頁,共七十五頁。11/3/202216醫(yī)用SAS統(tǒng)計分析四

Logistic回歸的應(yīng)用

logistic回歸在流行病學和臨床流行病學等方面應(yīng)用廣泛,既可用于前瞻性的隊列研究,又可用于回顧性的病例(bìnglì)對照研究。常用于:病因?qū)W分析(fēnxī);預(yù)后(yùhòu)分析;鑒別診斷;評價治療措施;毒物的半數(shù)效量和聯(lián)合作用第十七頁,共七十五頁。11/3/202217醫(yī)用SAS統(tǒng)計分析四Logistic回歸的分類

按應(yīng)變量的類型分類為:

兩分類的Logistic回歸

非條件logistic回歸

即研究對象未經(jīng)過配對(pèiduì)。(在SAS中調(diào)用logistic模塊進行統(tǒng)計)。

條件logistic回歸

即在配對病例對照研究中的1:1和1:M及N:M配對。(在SAS中調(diào)用Phreg模塊進行統(tǒng)計)。

多分類有序反應(yīng)變量的Logistic回歸(在SAS中調(diào)用logistic模塊進行統(tǒng)計)。多分類無序反應(yīng)變量的Logistic回歸(在SAS中調(diào)用Catmod模塊進行統(tǒng)計)。本講主要介紹兩分類Logistic回歸

第十八頁,共七十五頁。11/3/202218醫(yī)用SAS統(tǒng)計分析四

兩分類(fēnlèi)非條件Logistic回歸

語法格式

Proclogistic[data=數(shù)據(jù)集][選項];model應(yīng)變量名=自變量名列/[選項];[freq<變量名>];可選項,指明頻數(shù)變量。output<out=數(shù)據(jù)集><pred|p=變量名>;

output語句創(chuàng)建一個新的SAS數(shù)據(jù)集,其含有每個個體的原始數(shù)據(jù),pred|p=變量名為在out=數(shù)據(jù)集中含有每個個體預(yù)測概率?!綪roc語句的[選項]】

order=data規(guī)定按照數(shù)據(jù)集中反應(yīng)變量水平出現(xiàn)的先后順序進行運算。

descending(或des)規(guī)定按照反應(yīng)變量降序水平進行運算。第十九頁,共七十五頁。11/3/202219醫(yī)用SAS統(tǒng)計分析四

注意:以上兩個選項非常重要,如死亡為1,存活為0,為了得到死亡對存活的概率(或者說是死亡的危險),應(yīng)選擇(xuǎnzé)此兩個選項之一,否則得到的是存活對死亡的概率,因為logistic回歸模型是自動按反應(yīng)變量值為小的來擬合方程的。反之,如果死亡為0,存活為1,可不選此兩項之一,【model語句的[選項]】

selection=forward(或f)|backward(或b)|stepwise(或s)|score規(guī)定變量的篩選方法,分別為向前、向后、逐步和最優(yōu)子集法。缺省時為none,擬合全回歸模型。

sle=概率值指定變量進人模型的顯著水平,缺省為0.05。

sls=概率值指定變量剔除模型的顯著水平,缺省為0.05。

CL計算輸出所有回歸參數(shù)的可信區(qū)間。第二十頁,共七十五頁。11/3/202220醫(yī)用SAS統(tǒng)計分析四clodds=pl計算輸出OR的可信區(qū)間。

scale=noneaggregate要求對模型進行擬合優(yōu)度檢驗。

例9-4

40例病人的治愈情況Y(Y=0表示(biǎoshì)未愈,Y=1表示(biǎoshì)治愈,病情嚴重程度X1(X1=0表示(biǎoshì)不嚴重,X1=1表示(biǎoshì)嚴重),年齡X2為連續(xù)變量,治療方法X3(X3=0表示(biǎoshì)新方法,X3=1表示(biǎoshì)一般療法),數(shù)據(jù)如表9.6,試作logistic回歸分析。程序9-4datac;infile'd:\sas\sas5\cx9_4.txt';inputyx1-x3;proclogisticdes;/*按降序水平進行運算*/modely=x1-x3/scale=noneaggregate;/*對模型進行擬合優(yōu)度檢驗*/Outputout=bp=pr;/*在數(shù)據(jù)集b中含有每個個體的預(yù)測概率值*/

run;第二十一頁,共七十五頁。11/3/202221醫(yī)用SAS統(tǒng)計分析四

TheLOGISTICProcedureDataSet:WORK.C數(shù)據(jù)集名ResponseVariable:Y反應(yīng)變量YResponseLevels:2反應(yīng)變量水平數(shù)2NumberofObservations:40觀察值40LinkFunction:Logit聯(lián)系(liánxì)函數(shù)logit

ResponseProfile反應(yīng)變量的描述Ordered順序值ValueYCount計數(shù)值11172023

第二十二頁,共七十五頁。11/3/202222醫(yī)用SAS統(tǒng)計分析四

DevianceandPearsonGoodness-of-FitStatistics

模型(móxíng)的擬合優(yōu)度檢驗Pr>CriterionDFValueValue/DFChi-SquareDeviance3136.32311.17170.2344Pearson3129.55830.95350.5402ModelFittingInformationandTestingGlobalNullHypothesisBETA=0

模型擬合信息和整體偏回歸系數(shù)為0的假設(shè)檢驗InterceptInterceptandCriterionOnlyCovariatesChi-SquareforCovariates判斷的準則僅有截距所有變量協(xié)變量的卡方AIC56.54855.413.SC58.23762.169.-2LOGL54.54847.4137.135with3DF(p=0.0677)Score..6.630with3DF(p=0.0847)第二十三頁,共七十五頁。11/3/202223醫(yī)用SAS統(tǒng)計分析四

AnalysisofMaximumLikelihoodEstimates

最大似然法估計值分析(fēnxī)ParameterStandardWaldPr>StandardizedOddsVariableDFEstimateErrorChi-SquareChi-SquareEstimateRatioINTERCPT13.70252.14422.98170.0842..X11-0.61570.71350.74460.3882-0.1718770.540X21-0.09390.06362.18120.1397-0.3093360.910X31-1.52360.73964.24300.0394-0.4248130.218

AssociationofPredictedProbabilitiesandObservedResponses

模型回代判別分析Concordant=71.9%(一致率)Somers'D=0.448Discordant=27.1%(非一致率)Gamma=0.452Tied=1.0%(結(jié)點率)Tau-a=0.224(391pairs)c=0.724第二十四頁,共七十五頁。11/3/202224醫(yī)用SAS統(tǒng)計分析四治愈(zhìyù)的概率模型為:例2

為了探討冠心病發(fā)生的有關(guān)危險因素(yīnsù),對26例冠心病病人和28例對照者進行病例對照研究,各因素的說明見下表。試用logistic逐步回歸分析方法篩選危險因素。第二十五頁,共七十五頁。11/3/202225醫(yī)用SAS統(tǒng)計分析四表冠心病8個可能的危險因素與賦值因素變量名賦值說明年齡(niánlíng)(歲)X1<45=1,4554=2,5564=3,65=4高血壓史X2無=0,有=1高血壓家族史X3無=0,有=1吸煙X4不吸=0,吸=1高血脂史X5無=0,有=1動物脂肪攝入X6低=0,高=1體重指數(shù)(BMI)X7<24=1,24<26=2,26=3A型性格X8否=0,是=1冠心病Y對照=0,病例=1

第二十六頁,共七十五頁。11/3/202226醫(yī)用SAS統(tǒng)計分析四程序(chéngxù)dataex16_2;infile'd:\sas\sas5\log2.txt';inputx1-x8y;proclogisticdes;modely=x1-x8/selection=stepwisesle=0.1sls=0.1clodds=pl

;run;第二十七頁,共七十五頁。11/3/202227醫(yī)用SAS統(tǒng)計分析四條件Logistic回歸

條件Logistic回歸分析是用phreg(proportionalhazardregression,比例風險回歸)模塊完成的。Phreg模塊主要用于Cox回歸的計算)

語法格式

在data步先建立(jiànlì)一個時間啞變量,一般為time=1-case;(如病例case=1,對照case=0,則病例啞變量time=0,對照啞變量time=1,要求病例的time要小,對照的time要大)。如果病例case=0,對照case=1,時間啞變量為time=case。

Procphreg[選項];model<時間啞變量*對照指示變量名(數(shù)值)>=<自變量名列>/[選項];第二十八頁,共七十五頁。11/3/202228醫(yī)用SAS統(tǒng)計分析四Strata<配對組指示變量名>;Freq<頻數(shù)變量名>;【Procphreg[選項]】;nosummary不打印輸出事件和截尾數(shù)值。

simple輸出模型中變量的簡單統(tǒng)計描述【model過程[選項]】

ties=discrete

用離散的logistic模型替代比例風險模型。此句必選!selection=forward(或f)|backward(或b)|stepwise(或s)|score規(guī)定變量的篩選方法,分別為向前(xiànɡqián)、向后、逐步和最優(yōu)子集法。缺省時為none,擬合全回歸模型。第二十九頁,共七十五頁。11/3/202229醫(yī)用SAS統(tǒng)計分析四

sle=概率值指定變量進人模型的顯著水平,缺省為0.05。

sls=概率值指定變量剔除模型的顯著水平,缺省為0.05。

risklimits計算輸出(shūchū)RR的可信區(qū)間。

alpha=概率值

指定RR的(1-α)可信區(qū)間,缺省時為0.05。

1:1配對條件Logistic回歸例9-8為研究胃癌的危險因素,某醫(yī)學院用103對1:1配對資料,這里選用其中10對三個因素,即X1(蛋白質(zhì)攝入量0,1,2,3),X2(不良飲食習慣0,1,2,3)及X3(精神因素0,1,2)。數(shù)據(jù)如表9.11。試作條件Logistic回歸分析。第三十頁,共七十五頁。11/3/202230醫(yī)用SAS統(tǒng)計分析四表9.1110對胃癌的1:1配對(pèiduì)數(shù)據(jù)對號病例對照X1X2X3X1X2X312345678910100110113233121211320120121222110112002003202000201000100000第三十一頁,共七十五頁。11/3/202231醫(yī)用SAS統(tǒng)計分析四程序datalog1_2;doid=1to10;docase=0to1;inputx1-x3@@;time=case;output;end;end;cards;130101032130012020120100111121

022200111000112000332220222000;procphreg;modeltime*case(1)=x1-x3/ties=discreteselection=stepwisesle=0.25sls=0.25;strataid;run;第三十二頁,共七十五頁。11/3/202232醫(yī)用SAS統(tǒng)計分析四ThePHREGProcedureDataSet:WORK.LOG1_2DependentVariable:TIME反應(yīng)變量timeCensoringVariable:CASE截尾變量caseCensoringValue(s):1截尾值為1TiesHandling:DISCRETE結(jié)點處理(chǔlǐ)方法為discreteSummaryoftheNumberofEventandCensoredValuesPercentStratumIDTotalEventCensoredCensored1121150.002221150.00┆┆┆┆┆┆101021150.00--------------------------------------------------------------Total20101050.00第三十三頁,共七十五頁。11/3/202233醫(yī)用SAS統(tǒng)計分析四

Step1:VariableX3isentered.Themodelcontainsthefollowingexplanatoryvariables.X3TestingGlobalNullHypothesis:BETA=0WithoutWithCriterionCovariatesCovariatesModelChi-Square-2LOGL13.8637.1586.705with1DF(p=0.0096)Score..5.538with1DF(p=0.0186)Wald..3.139with1DF(p=0.0764)第三十四頁,共七十五頁。11/3/202234醫(yī)用SAS統(tǒng)計分析四Step2:VariableX2isentered.Themodelcontainsthefollowingexplanatoryvariables.X2X3TestingGlobalNullHypothesis:BETA=0WithoutWithCriterionCovariatesCovariatesModelChi-Square-2LOGL13.8633.72410.139with2DF(p=0.0063)Score..7.229with2DF(p=0.0269)Walt..2.467with2DF(p=0.2913)NOTE:No(additional)variablesmetthe0.25levelforentryintothemodel.第三十五頁,共七十五頁。11/3/202235醫(yī)用SAS統(tǒng)計分析四AnalysisofMaximumLikelihoodEstimatesParameterStandardWaldPr>RiskVariableDFEstimateErrorChi-SquareChi-SquareRatio

變量自由度參數(shù)(cānshù)估計值標準誤wald卡方值P值RR值X211.1653510.810802.065790.15063.207X312.0671571.639441.589850.20737.902SummaryofStepwiseProcedureVariableNumberScoreWaldPr>StepEnteredRemovedInChi-SquareChi-SquareChi-Square1X315.5385.0.01862X223.4594.0.0629胃癌(wèiái)患病的概率模型為:第三十六頁,共七十五頁。11/3/202236醫(yī)用SAS統(tǒng)計分析四

1:M或N:M的條件Logistic回歸

1:M配比是一個病例配M個對照,N:M配比是N個病例配M個對照。使用的SAS語句和1:1配對基本是一致的。

例題某北方(běifāng)城市研究喉癌發(fā)病的危險因素,用1:2配對的病例-對照研究方法進行了調(diào)查。先選取了6個可能的危險因素并節(jié)錄25對數(shù)據(jù),各因素的賦值說明見下表1,資料列于表2。試作條件Logistic逐步回歸。

第三十七頁,共七十五頁。11/3/202237醫(yī)用SAS統(tǒng)計分析四表1喉癌(hóuái)的危險因素與賦值說明

因素變量名賦值說明咽炎X1無=1,偶爾=2,經(jīng)常=3吸煙量(支/日)X20=1,1~4=2,5~9=3,10~20=4,>20=5聲嘶史X3無=1,偶爾=2,經(jīng)常=3攝食新鮮蔬菜X4少=1,經(jīng)常=2,每天=3攝食水果X5很少=1,少量=2,經(jīng)常=3癌癥家族史X6無=0,有=1是否患喉癌Y病例=1,對照=0第三十八頁,共七十五頁。11/3/202238醫(yī)用SAS統(tǒng)計分析四表2喉癌1:2配對病例-對照調(diào)查(diàochá)資料整理表配比組號

iYX1X2X3X4X5X6

j11351110011133001113302113113001113200121320

i

┊┊┊┊

┊┊┊

25114111101113200111330第三十九頁,共七十五頁。11/3/202239醫(yī)用SAS統(tǒng)計分析四

程序(chéngxù)datalog1_4;infile'd:\sas\sas5\log1_4.txt';doi=1to25;doj=1to3;inputyx1-x6;time=1-y;output;end;end;procphregnosummary;modeltime*y(0)=x1-x6/ties=discreteselection=stepwisesle=0.1sls=0.1risklimits;stratai;run;第四十頁,共七十五頁。11/3/202240醫(yī)用SAS統(tǒng)計分析四四、生存分析簡介

概念

生存分析是將事件的結(jié)果和出現(xiàn)此結(jié)果所經(jīng)歷的時間結(jié)合起來分析的統(tǒng)計分析方法。

生存分析的數(shù)據(jù)(shùjù)

完全數(shù)據(jù)

即掌握研究事件的起點,又掌握終點的生存時間資料為完全數(shù)據(jù),一般用t來表示。

不完全數(shù)據(jù)①因遷移原因失去聯(lián)系;②死于其他原因;③在總結(jié)分析時仍然生存。生存分析中稱這種不完全數(shù)據(jù)為截尾數(shù)據(jù)、刪失數(shù)據(jù)、終檢數(shù)據(jù)(censoreddata)。

生存率(survivalrate)又稱累積生存概率,即個體活過時點t的概率,用S(t)表示。第四十一頁,共七十五頁。11/3/202241醫(yī)用SAS統(tǒng)計分析四

生存分析的三種變量(biànliàng)1.目標變量

即生存時間,常記為t。2.協(xié)變量

可以是研究因素,也可以是排除其影響的因素,常記為x1,x2,┄,xp。3.截尾變量

常記為censor或d等。

生存分析的任務(wù)

估計生存率;比較生存率;尋找影響因素。

生存分析的方法

參數(shù)法已知生存時間T服從某特定的分布類型,對分布的參數(shù)作統(tǒng)計描述與推斷。常見的有:Weibull分布,指數(shù)分布,正態(tài)分布等。相應(yīng)的SAS過程為lifereg。非參數(shù)法不知生存時間T的分布類型或不符合特定的分布類型,對整個分布或某個特征作統(tǒng)計描述與推斷。常用乘積極限第四十二頁,共七十五頁。11/3/202242醫(yī)用SAS統(tǒng)計分析四法(productlimitmethod)和壽命表法(lifetablemethod)估計生存率和中位生存時間等;用時序檢驗(log-ranktest),Wilcoxon檢驗和似然比檢驗等作分組比較。相應(yīng)的SAS過程為:lifetest

半?yún)?shù)法

不知生存時間分布確切類型,用模型(móxíng)的方法對模型(móxíng)的部分參數(shù)作統(tǒng)計描述與推斷。常用的是Cox模型(móxíng)。相應(yīng)的SAS過程為:phreg。注:半?yún)?shù)法與參數(shù)法可用來研究多個因素對生存時間的影響,非參數(shù)法難以實施多因素生存分析。

非參數(shù)法的lifetest過程語法格式:PROCLIFETEST[選項];TIME<生存時間變量*截尾指示變量(數(shù)值)>;第四十三頁,共七十五頁。11/3/202243醫(yī)用SAS統(tǒng)計分析四STRATA<分組變量名列>;(指定比較的分組變量,按分組變量名列分別進行(jìnxíng)分析和比較。)TEST<協(xié)變量名列>;(指定協(xié)變量名列,檢驗生存時間與該變量是否有關(guān))Freq<變量名>;(指定頻數(shù)變量名)PROC過程[選項]

1.method=方法指定估計生存率所用的方法:

PL

要求用乘積極限法(即Kaplan-Meier

法)估計生存率并計算中位生存時間等,為缺省方法。

LT

要求用壽命表法估計生存率等。2.intervals=(初值to終值by步長)或width=數(shù)值只能在指定方法為壽命表法時使用。用壽命表法分析時,程序會自動第四十四頁,共七十五頁。11/3/202244醫(yī)用SAS統(tǒng)計分析四

給定生存時間的區(qū)間。如果人為規(guī)定生存時間的分組區(qū)間,則需用該選項指定。3.Plots=繪圖類型要求輸出生存分析圖??晒┹敵龅膱D形有:

S

對生存函數(shù)S(t)作圖。橫、縱坐標分別為t,S(t)。

H

對風險函數(shù)作圖。橫、縱坐標分別為t,H(t)。小樣本資料的乘積極限法(Kaplan-Meier法)例15-1

25例某種癌癥的患者在不同的日期隨機(suíjī)分配至兩治療組,分別以A、B兩種治療方法進行治療。治療后繼續(xù)對這些病人進行隨訪至到2003年5月31日結(jié)束。資料如表15.1所示,數(shù)字后又+號者為刪失值。試進行生存率分析。第四十五頁,共七十五頁。11/3/202245醫(yī)用SAS統(tǒng)計分析四datalife1;dogroup=1to2;inputn;doi=1ton;inputt@@;ift<0thencensor=1;elsecensor=0;t=abs(t);output;end;end;cards;12852586363220365452496-528-560-676131318237076180195210232300396-490-540;proclifetestplots=(s)formchar(1,2,7)='|-+';timet*censor(1);stratagroup;run;第四十六頁,共七十五頁。11/3/202246醫(yī)用SAS統(tǒng)計分析四TheLIFETESTProcedureProduct-LimitSurvivalEstimatesGROUP=1SurvivalStandardNumberNumberTSurvivalFailureErrorFailedLeft

生存時間生存率死亡概率(gàilǜ)生存率標準誤死亡例數(shù)生存例數(shù)0.0001.0000000128.0000.91670.08330.079811152.0000.83330.16670.107621058.0000.75000.25000.12503963.000...4863.0000.58330.41670.142357220.0000.50000.50000.144366365.0000.41670.58330.142375452.0000.33330.66670.136184496.0000.25000.75000.125093528.000*...92560.000*...91676.000*...90*CensoredObservation第四十七頁,共七十五頁。11/3/202247醫(yī)用SAS統(tǒng)計分析四SummaryStatisticsforTimeVariableTPoint95%ConfidenceIntervalQuantileEstimate[Lower,Upper)

四分位數(shù)點估計95%可信區(qū)間(qūjiān)75%.220.000.50%292.50063.000496.00025%60.50052.000365.000Mean272.083StandardError62.231

生存時間均數(shù)均數(shù)的標準誤NOTE:Thelastobservationwascensoredsotheestimateofthemeanisbiased.第四十八頁,共七十五頁。11/3/202248醫(yī)用SAS統(tǒng)計分析四

TheLIFETESTProcedureProduct-LimitSurvivalEstimatesGROUP=2SurvivalStandardNumberNumberTSurvivalFailureErrorFailedLeft0.0001.00000001313.0000.92310.07690.073911218.0000.84620.15380.100121123.0000.76920.23080.116931070.0000.69230.30770.12804976.0000.61540.38460.134958180.0000.53850.46150.138367195.0000.46150.53850.138376210.0000.38460.61540.134985232.0000.30770.69230.128094300.0000.23080.76920.1169103396.0000.15380.84620.1001112490.000*...111540.000*...110*CensoredObservation第四十九頁,共七十五頁。11/3/202249醫(yī)用SAS統(tǒng)計分析四SummaryStatisticsforTimeVariableTPoint95%ConfidenceIntervalQuantileEstimate[Lower,Upper)75%300.000195.000.50%195.00070.000300.00025%70.00018.000195.000Mean192.692StandardError40.963SummaryoftheNumberofCensoredandUncensoredValuesGROUPTotalFailedCensored%Censored1129325.000021311215.3846Total2520520.0000第五十頁,共七十五頁。11/3/202250醫(yī)用SAS統(tǒng)計分析四

SDF||||||1.0+*AB|||S|||u|A*---Ar|||v|BB|i||AAv0.8+||a|B---|Bl|AA||D|*Bi|||s||B------------Bt0.6+||r|A-----------------Ai|BB|b||A-----------------Au|||t|B-B|i||A---------Ao0.4+||n|B--B|||A-----AF|B-------B|u|||n||Ac|B-----------Bt0.2+|i||o|Bn||||0.0+|||||+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-050100150200250300350400450500550600650700T第五十一頁,共七十五頁。11/3/202251醫(yī)用SAS統(tǒng)計分析四

TestofEqualityoverStrata

Pr>TestChi-SquareDFChi-SquareLog-Rank時序(shíxù)檢驗0.664010.4152Wilcoxon秩和檢驗0.327210.5673-2Log(LR)似然比檢驗

1.036210.3087第五十二頁,共七十五頁。11/3/202252醫(yī)用SAS統(tǒng)計分析四例王潔貞主編《醫(yī)學統(tǒng)計學》例14.1P202手術(shù)(shǒushù)療法組:52789296105123145136*157*182*209*224*手術(shù)+化療組:7995117175203102*157*199*216*246*269第五十三頁,共七十五頁。11/3/202253醫(yī)用SAS統(tǒng)計分析四datalife2;dogroup=1to2;inputn;doi=1ton;inputt@@;ift<0thencensor=1;elsecensor=0;t=abs(t);output;end;end;cards;1252789296105123145-136-157-182-209-224117995117175203-102-157-199-216-246269;proclifetestplots=(s)formchar(1,2,7)='|-+';timet*censor(1);stratagroup;run;第五十四頁,共七十五頁。11/3/202254醫(yī)用SAS統(tǒng)計分析四

大樣本資料(zīliào)的壽命表法

例2王潔貞主編《醫(yī)學統(tǒng)計學》例14.2P206第五十五頁,共七十五頁。11/3/202255醫(yī)用SAS統(tǒng)計分析四

datalife3;inputtcensorfg@@;/*t:月數(shù)的下限;censor:1=死亡,0=失訪;f:人數(shù)(rénshù);g:分組變量*/cards;0181000171517011131411300119121190017142704213122130221912219032251322502231112310423710237012;proclifetestmethod=Ltwidth=6plots=(s)formchar(1,2,7)='|-+';timet*censor(0);stratag;freqf;run;第五十六頁,共七十五頁。11/3/202256醫(yī)用SAS統(tǒng)計分析四

TheLIFETESTProcedureLifeT

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論