醫(yī)用SAS統(tǒng)計(jì)分析四課件_第1頁
醫(yī)用SAS統(tǒng)計(jì)分析四課件_第2頁
醫(yī)用SAS統(tǒng)計(jì)分析四課件_第3頁
醫(yī)用SAS統(tǒng)計(jì)分析四課件_第4頁
醫(yī)用SAS統(tǒng)計(jì)分析四課件_第5頁
已閱讀5頁,還剩70頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

醫(yī)用SAS統(tǒng)計(jì)分析第五(dìwǔ)講第一頁,共七十五頁。11/3/20221醫(yī)用SAS統(tǒng)計(jì)分析四

一、多元線性回歸

基本概念

多元線性回歸簡稱多元回歸,是研究一個(gè)應(yīng)變量與多個(gè)自變量間線性依存關(guān)系數(shù)量(shùliàng)變化規(guī)律的一種方法。

多元線性回歸方程式中:b0為回歸方程常數(shù)項(xiàng),bj(j=1,2,┅,m)為偏回歸系數(shù),即在其他自變量固定的條件下,Xj改變(gǎibiàn)一個(gè)單位時(shí)應(yīng)變量的改變(gǎibiàn)量。

第二頁,共七十五頁。11/3/20222醫(yī)用SAS統(tǒng)計(jì)分析四多元線性回歸方程的應(yīng)用

預(yù)測應(yīng)變量的估計(jì)值

探索影響(yǐngxiǎng)應(yīng)變量y的主要因素當(dāng)X為某一定值時(shí),估計(jì)應(yīng)變量y的容許區(qū)間當(dāng)X為某一定值時(shí),估計(jì)其應(yīng)變量的總體均數(shù)的置信區(qū)間第三頁,共七十五頁。11/3/20223醫(yī)用SAS統(tǒng)計(jì)分析四語句格式

同單變量線性回歸基本相同。procreg[選項(xiàng)];model應(yīng)變量=自變量名列/[選項(xiàng)];必選語句,定義回歸分析模型procreg語句的[選項(xiàng)]data=數(shù)據(jù)集指明回歸分析(fēnxī)所用的數(shù)據(jù)集。

outset=數(shù)據(jù)集指定一個(gè)輸出數(shù)據(jù)集,用以存儲(chǔ)回歸分析所得的參數(shù)估計(jì)。

simple輸出每個(gè)變量的簡單統(tǒng)計(jì)結(jié)果。第四頁,共七十五頁。11/3/20224醫(yī)用SAS統(tǒng)計(jì)分析四model語句的[選項(xiàng)]selection=method規(guī)定變量篩選方法,method可以是以下幾種選項(xiàng):

forward(或f)前進(jìn)法,按照sle規(guī)定的P值從無到有依次選一個(gè)變量進(jìn)入模型

backward(或b)后退法,按照sls規(guī)定的P值從含有全部變量的模型開始,以次剔除一個(gè)變量。

stepwise逐步(zhúbù)法,按照sle的標(biāo)準(zhǔn)依次選入變量,同時(shí)對模型中現(xiàn)有的變量按sls的標(biāo)準(zhǔn)剔除不顯著的變量。注:[選項(xiàng)]中沒有selection語句時(shí),模型中含有全部自變量的回歸模型。

sle=概率值入選標(biāo)準(zhǔn),規(guī)定變量入選模型的顯著性水平,前進(jìn)法默認(rèn)為0.5,逐步法默認(rèn)為0.15。

sls=概率值剔除標(biāo)準(zhǔn),指定變量保留在模型的顯著性水平,后退法默認(rèn)為0.1,逐步法默認(rèn)為0.15。第五頁,共七十五頁。11/3/20225醫(yī)用SAS統(tǒng)計(jì)分析四

stb

輸出各自變量的標(biāo)準(zhǔn)偏回歸系數(shù)。

cli輸出個(gè)體y值的95%容許區(qū)間上下限

clm

輸出預(yù)測值均值的95%可信區(qū)間上下限。

P輸出實(shí)際(shíjì)值Yi,預(yù)測值、殘差及其標(biāo)準(zhǔn)誤。

tol

輸出各自變量的容許值。0≤tol值≤1,越接近于0,共線性越嚴(yán)重。

vif輸出各自變量的方差膨脹因子。當(dāng)vif≥10時(shí),可認(rèn)為多元共線性嚴(yán)重存在。

collin要求詳細(xì)分析自變量之間的共線性,給出信息矩陣的特征根、條件指數(shù)和方差比,當(dāng)條件指數(shù)≥10,方差比>0.5時(shí),可認(rèn)為存在多元共線性。

collinoint

與選擇項(xiàng)collin作用相同,但不包括回歸常數(shù)。

R

進(jìn)行預(yù)測值的殘差分析(即異常值識別與強(qiáng)影響分析),輸出學(xué)生化殘差值和Cook’s距離D值。當(dāng)學(xué)生化殘差值>2時(shí),所對應(yīng)的點(diǎn)可能是異常點(diǎn),當(dāng)D值>0.5時(shí),可認(rèn)為對應(yīng)的變量值對回歸函數(shù)是強(qiáng)影響點(diǎn)。第六頁,共七十五頁。11/3/20226醫(yī)用SAS統(tǒng)計(jì)分析四

完全多元線性回歸

例7-710名女中學(xué)生的體重(tǐzhòng)(X1,kg),胸圍(X2,cm),胸圍的呼吸差(X3,cm)及肺活量(Y,ml)的資料如下表所示?,F(xiàn)作應(yīng)變量Y對自變量X1,X2,X3的三元線性回歸方程。datamreg1;inputx1x2x3y@@;cards;35690.7160040742.5260040642.0210042743.0265037721.1240045681.5220043784.3275037662.0160044703.2275042653.02500;procreg;modely=x1x2x3/stb;run;第七頁,共七十五頁。11/3/20227醫(yī)用SAS統(tǒng)計(jì)分析四Model:MODEL1DependentVariable:YAnalysisofVarianceSumofMeanSourceDFSquaresSquareFValueProb>FModel31250109.0678416703.022595.6170.0355Error6445140.9322274190.15537CTotal91695250RootMSE272.37870R-square0.7374DepMean2315.00000AdjR-sq0.6061C.V.11.76582

第八頁,共七十五頁。11/3/20228醫(yī)用SAS統(tǒng)計(jì)分析四ParameterEstimatesParameterStandardTforH0:VariableDFEstimateErrorParameter=0Prob>|T|INTERCEP1-3035.5363542168.6738473-1.4000.2111X1160.93182336.297137981.6790.1442X2137.80833422.980808911.6450.1510X31101.379460121.974703100.8310.4377StandardizedVariableEstimateINTERCEP0.00000000X10.46445689X20.39174762X30.25399450第九頁,共七十五頁。11/3/20229醫(yī)用SAS統(tǒng)計(jì)分析四

逐步回歸

簡介

逐步回歸是篩選自變量的常用的方法之一。篩選自變量的方法還有前進(jìn)法,后退法和最優(yōu)回歸子集法。逐步回歸法是依據(jù)事先給定的兩個(gè)顯著性水平SLE和SLS,將自變量逐個(gè)引入方程,同時(shí)每引入一個(gè)新變量后,對已選入的變量要進(jìn)行逐個(gè)檢驗(yàn),將不顯著的變量剔除,這樣保證最后所得的變量都有顯著性。自變量間的多重共線性(multicollinearity)

整個(gè)回歸方程的統(tǒng)計(jì)檢驗(yàn)P<α,而各偏回歸系數(shù)的檢驗(yàn)均出現(xiàn)(chūxiàn)P>α的矛盾現(xiàn)象。偏回歸系數(shù)的估計(jì)值明顯與實(shí)際情況不符,或者是偏回歸系數(shù)的符號與專業(yè)知識的情況相反。第十頁,共七十五頁。11/3/202210醫(yī)用SAS統(tǒng)計(jì)分析四據(jù)專業(yè)知識,該自變量與應(yīng)變量間關(guān)系密切,而偏回歸系數(shù)檢驗(yàn)結(jié)果P>α。增加(或刪除)一個(gè)變量,或者改變(或去除)一個(gè)觀察值,引起回歸系數(shù)估計(jì)值發(fā)生大的變化。多重共線性是引起上述問題的重要原因。解決(jiějué)多重共線性的辦法

用主成分估計(jì)等有偏估計(jì)替代最小二乘估計(jì)。用逐步回歸等方法篩選自變量。如上例7-7,整個(gè)回歸模型P=0.0355,而b0,b1,b2,b3P值均大于0.05。估計(jì)變量之間存在共線性問題。第十一頁,共七十五頁。11/3/202211醫(yī)用SAS統(tǒng)計(jì)分析四程序(chéngxù)7-13datastepreg1;inputx1x2x3y@@;cards;35690.7160040742.5260040642.0210042743.0265037721.1240045681.5220043784.3275037662.0160044703.2275042653.02500;procreg;modely=x1-x3/stbtolvifcollincollinointR;modely=x1-x3/selection=stepwisesle=0.25sls=0.25stb;run;第十二頁,共七十五頁。11/3/202212醫(yī)用SAS統(tǒng)計(jì)分析四

例(《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》王潔貞主編,例15.1)

某科研協(xié)作組調(diào)查某煤礦Ⅱ期高血壓病患者40例,X1為工作面污染程度等級,X2為井下工齡(年),X3為體重(kg),X4為吸煙年限(niánxiàn)(年),X5為飲酒年限(niánxiàn)(年),Y為收縮壓(kPa),試作多元線性回歸分析。datastepreg2;infile'd:\sas\sas5\wang15_1.txt';inputidx1x2x3x4x5y@@;procreg;modely=x1-x5/stbtolvifcollincollinointr;modely=x1-x5/selection=stepwisesle=0.05sls=0.05stb;run;第十三頁,共七十五頁。11/3/202213醫(yī)用SAS統(tǒng)計(jì)分析四

二、多元線性相關(guān)

研究多個(gè)變量間線性關(guān)系的一種統(tǒng)計(jì)分析方法。變量間相關(guān)系數(shù)有以下三類:

簡單相關(guān)系數(shù)它是說明(shuōmíng)兩個(gè)變量相關(guān)程度和方向(不考慮其他變量的影響)的統(tǒng)計(jì)指標(biāo)(ri,j)。

偏相關(guān)系數(shù)它是當(dāng)其他變量固定時(shí),說明某兩個(gè)變量間相關(guān)程度和方向的統(tǒng)計(jì)指標(biāo)(如r12,3)。

復(fù)相關(guān)系數(shù)R亦稱為全相關(guān)系數(shù)。說明應(yīng)變量與各自變量的線性關(guān)系的密切程度。

決定系數(shù)R2復(fù)相關(guān)系數(shù)的平方。它說明應(yīng)變量的變異中由各自變量的改變而引起的占多少。如R2=0.8,則說明應(yīng)變量的變異中有80%由自變量的改變而引起的。第十四頁,共七十五頁。11/3/202214醫(yī)用SAS統(tǒng)計(jì)分析四

程序7-12datamcorr1;infile'd:\sas\sas5\mcorr1.txt';inputx1x2x3y@@;proccorrnosimple;/*禁止一些簡單統(tǒng)計(jì)量的輸出*/varx1x2x3y;/*包括(bāokuò)了所有變量,實(shí)際可以省略*/proccorrnosimple;varx1x2;partialx3;/*partial語句的作用是固定x3*/proccorrnosimple;varx1x2;partialx3y;/*partial語句的作用是固定x3和y*/run;第十五頁,共七十五頁。11/3/202215醫(yī)用SAS統(tǒng)計(jì)分析四

三、Logistic回歸分析

簡介

Logistic回歸模型是適用(shìyòng)于應(yīng)變量(因變量)為分類變量的回歸分析。當(dāng)應(yīng)變量為分類變量時(shí),如應(yīng)變量結(jié)果為二分類變量的發(fā)病、不發(fā)病,生存、死亡等,是不能用多元線性回歸模型(Y=β0+Σβixi)來分析各種危險(xiǎn)因素與應(yīng)變量之間的關(guān)系的。因?yàn)閼?yīng)變量Y只能取值為1和0。不符合線性回歸模型中應(yīng)變量Y應(yīng)具有正態(tài)分布和方差齊性的要求,同時(shí)線性回歸模型得到的Y值會(huì)出現(xiàn)大于1或小于0的不合理結(jié)果,顯然不能用線性回歸建立預(yù)測模型。

以發(fā)病為例,發(fā)病的概率為P,不發(fā)病的概率為1-P,0≤P≤1。公式(gōngshì)等號左邊簡稱為logit(P),即logit(P)=β0+Σβixi可證明(zhèngmíng),無論Y得何值,均0<P<1。上式可推導(dǎo)為:第十六頁,共七十五頁。11/3/202216醫(yī)用SAS統(tǒng)計(jì)分析四

Logistic回歸的應(yīng)用

logistic回歸在流行病學(xué)和臨床流行病學(xué)等方面應(yīng)用廣泛,既可用于前瞻性的隊(duì)列研究,又可用于回顧性的病例(bìnglì)對照研究。常用于:病因?qū)W分析(fēnxī);預(yù)后(yùhòu)分析;鑒別診斷;評價(jià)治療措施;毒物的半數(shù)效量和聯(lián)合作用第十七頁,共七十五頁。11/3/202217醫(yī)用SAS統(tǒng)計(jì)分析四Logistic回歸的分類

按應(yīng)變量的類型分類為:

兩分類的Logistic回歸

非條件logistic回歸

即研究對象未經(jīng)過配對(pèiduì)。(在SAS中調(diào)用logistic模塊進(jìn)行統(tǒng)計(jì))。

條件logistic回歸

即在配對病例對照研究中的1:1和1:M及N:M配對。(在SAS中調(diào)用Phreg模塊進(jìn)行統(tǒng)計(jì))。

多分類有序反應(yīng)變量的Logistic回歸(在SAS中調(diào)用logistic模塊進(jìn)行統(tǒng)計(jì))。多分類無序反應(yīng)變量的Logistic回歸(在SAS中調(diào)用Catmod模塊進(jìn)行統(tǒng)計(jì))。本講主要介紹兩分類Logistic回歸

第十八頁,共七十五頁。11/3/202218醫(yī)用SAS統(tǒng)計(jì)分析四

兩分類(fēnlèi)非條件Logistic回歸

語法格式

Proclogistic[data=數(shù)據(jù)集][選項(xiàng)];model應(yīng)變量名=自變量名列/[選項(xiàng)];[freq<變量名>];可選項(xiàng),指明頻數(shù)變量。output<out=數(shù)據(jù)集><pred|p=變量名>;

output語句創(chuàng)建一個(gè)新的SAS數(shù)據(jù)集,其含有每個(gè)個(gè)體的原始數(shù)據(jù),pred|p=變量名為在out=數(shù)據(jù)集中含有每個(gè)個(gè)體預(yù)測概率?!綪roc語句的[選項(xiàng)]】

order=data規(guī)定按照數(shù)據(jù)集中反應(yīng)變量水平出現(xiàn)的先后順序進(jìn)行運(yùn)算。

descending(或des)規(guī)定按照反應(yīng)變量降序水平進(jìn)行運(yùn)算。第十九頁,共七十五頁。11/3/202219醫(yī)用SAS統(tǒng)計(jì)分析四

注意:以上兩個(gè)選項(xiàng)非常重要,如死亡為1,存活為0,為了得到死亡對存活的概率(或者說是死亡的危險(xiǎn)),應(yīng)選擇(xuǎnzé)此兩個(gè)選項(xiàng)之一,否則得到的是存活對死亡的概率,因?yàn)閘ogistic回歸模型是自動(dòng)按反應(yīng)變量值為小的來擬合方程的。反之,如果死亡為0,存活為1,可不選此兩項(xiàng)之一,【model語句的[選項(xiàng)]】

selection=forward(或f)|backward(或b)|stepwise(或s)|score規(guī)定變量的篩選方法,分別為向前、向后、逐步和最優(yōu)子集法。缺省時(shí)為none,擬合全回歸模型。

sle=概率值指定變量進(jìn)人模型的顯著水平,缺省為0.05。

sls=概率值指定變量剔除模型的顯著水平,缺省為0.05。

CL計(jì)算輸出所有回歸參數(shù)的可信區(qū)間。第二十頁,共七十五頁。11/3/202220醫(yī)用SAS統(tǒng)計(jì)分析四clodds=pl計(jì)算輸出OR的可信區(qū)間。

scale=noneaggregate要求對模型進(jìn)行擬合優(yōu)度檢驗(yàn)。

例9-4

40例病人的治愈情況Y(Y=0表示(biǎoshì)未愈,Y=1表示(biǎoshì)治愈,病情嚴(yán)重程度X1(X1=0表示(biǎoshì)不嚴(yán)重,X1=1表示(biǎoshì)嚴(yán)重),年齡X2為連續(xù)變量,治療方法X3(X3=0表示(biǎoshì)新方法,X3=1表示(biǎoshì)一般療法),數(shù)據(jù)如表9.6,試作logistic回歸分析。程序9-4datac;infile'd:\sas\sas5\cx9_4.txt';inputyx1-x3;proclogisticdes;/*按降序水平進(jìn)行運(yùn)算*/modely=x1-x3/scale=noneaggregate;/*對模型進(jìn)行擬合優(yōu)度檢驗(yàn)*/Outputout=bp=pr;/*在數(shù)據(jù)集b中含有每個(gè)個(gè)體的預(yù)測概率值*/

run;第二十一頁,共七十五頁。11/3/202221醫(yī)用SAS統(tǒng)計(jì)分析四

TheLOGISTICProcedureDataSet:WORK.C數(shù)據(jù)集名ResponseVariable:Y反應(yīng)變量YResponseLevels:2反應(yīng)變量水平數(shù)2NumberofObservations:40觀察值40LinkFunction:Logit聯(lián)系(liánxì)函數(shù)logit

ResponseProfile反應(yīng)變量的描述Ordered順序值ValueYCount計(jì)數(shù)值11172023

第二十二頁,共七十五頁。11/3/202222醫(yī)用SAS統(tǒng)計(jì)分析四

DevianceandPearsonGoodness-of-FitStatistics

模型(móxíng)的擬合優(yōu)度檢驗(yàn)Pr>CriterionDFValueValue/DFChi-SquareDeviance3136.32311.17170.2344Pearson3129.55830.95350.5402ModelFittingInformationandTestingGlobalNullHypothesisBETA=0

模型擬合信息和整體偏回歸系數(shù)為0的假設(shè)檢驗(yàn)InterceptInterceptandCriterionOnlyCovariatesChi-SquareforCovariates判斷的準(zhǔn)則僅有截距所有變量協(xié)變量的卡方AIC56.54855.413.SC58.23762.169.-2LOGL54.54847.4137.135with3DF(p=0.0677)Score..6.630with3DF(p=0.0847)第二十三頁,共七十五頁。11/3/202223醫(yī)用SAS統(tǒng)計(jì)分析四

AnalysisofMaximumLikelihoodEstimates

最大似然法估計(jì)值分析(fēnxī)ParameterStandardWaldPr>StandardizedOddsVariableDFEstimateErrorChi-SquareChi-SquareEstimateRatioINTERCPT13.70252.14422.98170.0842..X11-0.61570.71350.74460.3882-0.1718770.540X21-0.09390.06362.18120.1397-0.3093360.910X31-1.52360.73964.24300.0394-0.4248130.218

AssociationofPredictedProbabilitiesandObservedResponses

模型回代判別分析Concordant=71.9%(一致率)Somers'D=0.448Discordant=27.1%(非一致率)Gamma=0.452Tied=1.0%(結(jié)點(diǎn)率)Tau-a=0.224(391pairs)c=0.724第二十四頁,共七十五頁。11/3/202224醫(yī)用SAS統(tǒng)計(jì)分析四治愈(zhìyù)的概率模型為:例2

為了探討冠心病發(fā)生的有關(guān)危險(xiǎn)因素(yīnsù),對26例冠心病病人和28例對照者進(jìn)行病例對照研究,各因素的說明見下表。試用logistic逐步回歸分析方法篩選危險(xiǎn)因素。第二十五頁,共七十五頁。11/3/202225醫(yī)用SAS統(tǒng)計(jì)分析四表冠心病8個(gè)可能的危險(xiǎn)因素與賦值因素變量名賦值說明年齡(niánlíng)(歲)X1<45=1,4554=2,5564=3,65=4高血壓史X2無=0,有=1高血壓家族史X3無=0,有=1吸煙X4不吸=0,吸=1高血脂史X5無=0,有=1動(dòng)物脂肪攝入X6低=0,高=1體重指數(shù)(BMI)X7<24=1,24<26=2,26=3A型性格X8否=0,是=1冠心病Y對照=0,病例=1

第二十六頁,共七十五頁。11/3/202226醫(yī)用SAS統(tǒng)計(jì)分析四程序(chéngxù)dataex16_2;infile'd:\sas\sas5\log2.txt';inputx1-x8y;proclogisticdes;modely=x1-x8/selection=stepwisesle=0.1sls=0.1clodds=pl

;run;第二十七頁,共七十五頁。11/3/202227醫(yī)用SAS統(tǒng)計(jì)分析四條件Logistic回歸

條件Logistic回歸分析是用phreg(proportionalhazardregression,比例風(fēng)險(xiǎn)回歸)模塊完成的。Phreg模塊主要用于Cox回歸的計(jì)算)

語法格式

在data步先建立(jiànlì)一個(gè)時(shí)間啞變量,一般為time=1-case;(如病例case=1,對照case=0,則病例啞變量time=0,對照啞變量time=1,要求病例的time要小,對照的time要大)。如果病例case=0,對照case=1,時(shí)間啞變量為time=case。

Procphreg[選項(xiàng)];model<時(shí)間啞變量*對照指示變量名(數(shù)值)>=<自變量名列>/[選項(xiàng)];第二十八頁,共七十五頁。11/3/202228醫(yī)用SAS統(tǒng)計(jì)分析四Strata<配對組指示變量名>;Freq<頻數(shù)變量名>;【Procphreg[選項(xiàng)]】;nosummary不打印輸出事件和截尾數(shù)值。

simple輸出模型中變量的簡單統(tǒng)計(jì)描述【model過程[選項(xiàng)]】

ties=discrete

用離散的logistic模型替代比例風(fēng)險(xiǎn)模型。此句必選!selection=forward(或f)|backward(或b)|stepwise(或s)|score規(guī)定變量的篩選方法,分別為向前(xiànɡqián)、向后、逐步和最優(yōu)子集法。缺省時(shí)為none,擬合全回歸模型。第二十九頁,共七十五頁。11/3/202229醫(yī)用SAS統(tǒng)計(jì)分析四

sle=概率值指定變量進(jìn)人模型的顯著水平,缺省為0.05。

sls=概率值指定變量剔除模型的顯著水平,缺省為0.05。

risklimits計(jì)算輸出(shūchū)RR的可信區(qū)間。

alpha=概率值

指定RR的(1-α)可信區(qū)間,缺省時(shí)為0.05。

1:1配對條件Logistic回歸例9-8為研究胃癌的危險(xiǎn)因素,某醫(yī)學(xué)院用103對1:1配對資料,這里選用其中10對三個(gè)因素,即X1(蛋白質(zhì)攝入量0,1,2,3),X2(不良飲食習(xí)慣0,1,2,3)及X3(精神因素0,1,2)。數(shù)據(jù)如表9.11。試作條件Logistic回歸分析。第三十頁,共七十五頁。11/3/202230醫(yī)用SAS統(tǒng)計(jì)分析四表9.1110對胃癌的1:1配對(pèiduì)數(shù)據(jù)對號病例對照X1X2X3X1X2X312345678910100110113233121211320120121222110112002003202000201000100000第三十一頁,共七十五頁。11/3/202231醫(yī)用SAS統(tǒng)計(jì)分析四程序datalog1_2;doid=1to10;docase=0to1;inputx1-x3@@;time=case;output;end;end;cards;130101032130012020120100111121

022200111000112000332220222000;procphreg;modeltime*case(1)=x1-x3/ties=discreteselection=stepwisesle=0.25sls=0.25;strataid;run;第三十二頁,共七十五頁。11/3/202232醫(yī)用SAS統(tǒng)計(jì)分析四ThePHREGProcedureDataSet:WORK.LOG1_2DependentVariable:TIME反應(yīng)變量timeCensoringVariable:CASE截尾變量caseCensoringValue(s):1截尾值為1TiesHandling:DISCRETE結(jié)點(diǎn)處理(chǔlǐ)方法為discreteSummaryoftheNumberofEventandCensoredValuesPercentStratumIDTotalEventCensoredCensored1121150.002221150.00┆┆┆┆┆┆101021150.00--------------------------------------------------------------Total20101050.00第三十三頁,共七十五頁。11/3/202233醫(yī)用SAS統(tǒng)計(jì)分析四

Step1:VariableX3isentered.Themodelcontainsthefollowingexplanatoryvariables.X3TestingGlobalNullHypothesis:BETA=0WithoutWithCriterionCovariatesCovariatesModelChi-Square-2LOGL13.8637.1586.705with1DF(p=0.0096)Score..5.538with1DF(p=0.0186)Wald..3.139with1DF(p=0.0764)第三十四頁,共七十五頁。11/3/202234醫(yī)用SAS統(tǒng)計(jì)分析四Step2:VariableX2isentered.Themodelcontainsthefollowingexplanatoryvariables.X2X3TestingGlobalNullHypothesis:BETA=0WithoutWithCriterionCovariatesCovariatesModelChi-Square-2LOGL13.8633.72410.139with2DF(p=0.0063)Score..7.229with2DF(p=0.0269)Walt..2.467with2DF(p=0.2913)NOTE:No(additional)variablesmetthe0.25levelforentryintothemodel.第三十五頁,共七十五頁。11/3/202235醫(yī)用SAS統(tǒng)計(jì)分析四AnalysisofMaximumLikelihoodEstimatesParameterStandardWaldPr>RiskVariableDFEstimateErrorChi-SquareChi-SquareRatio

變量自由度參數(shù)(cānshù)估計(jì)值標(biāo)準(zhǔn)誤wald卡方值P值RR值X211.1653510.810802.065790.15063.207X312.0671571.639441.589850.20737.902SummaryofStepwiseProcedureVariableNumberScoreWaldPr>StepEnteredRemovedInChi-SquareChi-SquareChi-Square1X315.5385.0.01862X223.4594.0.0629胃癌(wèiái)患病的概率模型為:第三十六頁,共七十五頁。11/3/202236醫(yī)用SAS統(tǒng)計(jì)分析四

1:M或N:M的條件Logistic回歸

1:M配比是一個(gè)病例配M個(gè)對照,N:M配比是N個(gè)病例配M個(gè)對照。使用的SAS語句和1:1配對基本是一致的。

例題某北方(běifāng)城市研究喉癌發(fā)病的危險(xiǎn)因素,用1:2配對的病例-對照研究方法進(jìn)行了調(diào)查。先選取了6個(gè)可能的危險(xiǎn)因素并節(jié)錄25對數(shù)據(jù),各因素的賦值說明見下表1,資料列于表2。試作條件Logistic逐步回歸。

第三十七頁,共七十五頁。11/3/202237醫(yī)用SAS統(tǒng)計(jì)分析四表1喉癌(hóuái)的危險(xiǎn)因素與賦值說明

因素變量名賦值說明咽炎X1無=1,偶爾=2,經(jīng)常=3吸煙量(支/日)X20=1,1~4=2,5~9=3,10~20=4,>20=5聲嘶史X3無=1,偶爾=2,經(jīng)常=3攝食新鮮蔬菜X4少=1,經(jīng)常=2,每天=3攝食水果X5很少=1,少量=2,經(jīng)常=3癌癥家族史X6無=0,有=1是否患喉癌Y病例=1,對照=0第三十八頁,共七十五頁。11/3/202238醫(yī)用SAS統(tǒng)計(jì)分析四表2喉癌1:2配對病例-對照調(diào)查(diàochá)資料整理表配比組號

iYX1X2X3X4X5X6

j11351110011133001113302113113001113200121320

i

┊┊┊┊

┊┊┊

25114111101113200111330第三十九頁,共七十五頁。11/3/202239醫(yī)用SAS統(tǒng)計(jì)分析四

程序(chéngxù)datalog1_4;infile'd:\sas\sas5\log1_4.txt';doi=1to25;doj=1to3;inputyx1-x6;time=1-y;output;end;end;procphregnosummary;modeltime*y(0)=x1-x6/ties=discreteselection=stepwisesle=0.1sls=0.1risklimits;stratai;run;第四十頁,共七十五頁。11/3/202240醫(yī)用SAS統(tǒng)計(jì)分析四四、生存分析簡介

概念

生存分析是將事件的結(jié)果和出現(xiàn)此結(jié)果所經(jīng)歷的時(shí)間結(jié)合起來分析的統(tǒng)計(jì)分析方法。

生存分析的數(shù)據(jù)(shùjù)

完全數(shù)據(jù)

即掌握研究事件的起點(diǎn),又掌握終點(diǎn)的生存時(shí)間資料為完全數(shù)據(jù),一般用t來表示。

不完全數(shù)據(jù)①因遷移原因失去聯(lián)系;②死于其他原因;③在總結(jié)分析時(shí)仍然生存。生存分析中稱這種不完全數(shù)據(jù)為截尾數(shù)據(jù)、刪失數(shù)據(jù)、終檢數(shù)據(jù)(censoreddata)。

生存率(survivalrate)又稱累積生存概率,即個(gè)體活過時(shí)點(diǎn)t的概率,用S(t)表示。第四十一頁,共七十五頁。11/3/202241醫(yī)用SAS統(tǒng)計(jì)分析四

生存分析的三種變量(biànliàng)1.目標(biāo)變量

即生存時(shí)間,常記為t。2.協(xié)變量

可以是研究因素,也可以是排除其影響的因素,常記為x1,x2,┄,xp。3.截尾變量

常記為censor或d等。

生存分析的任務(wù)

估計(jì)生存率;比較生存率;尋找影響因素。

生存分析的方法

參數(shù)法已知生存時(shí)間T服從某特定的分布類型,對分布的參數(shù)作統(tǒng)計(jì)描述與推斷。常見的有:Weibull分布,指數(shù)分布,正態(tài)分布等。相應(yīng)的SAS過程為lifereg。非參數(shù)法不知生存時(shí)間T的分布類型或不符合特定的分布類型,對整個(gè)分布或某個(gè)特征作統(tǒng)計(jì)描述與推斷。常用乘積極限第四十二頁,共七十五頁。11/3/202242醫(yī)用SAS統(tǒng)計(jì)分析四法(productlimitmethod)和壽命表法(lifetablemethod)估計(jì)生存率和中位生存時(shí)間等;用時(shí)序檢驗(yàn)(log-ranktest),Wilcoxon檢驗(yàn)和似然比檢驗(yàn)等作分組比較。相應(yīng)的SAS過程為:lifetest

半?yún)?shù)法

不知生存時(shí)間分布確切類型,用模型(móxíng)的方法對模型(móxíng)的部分參數(shù)作統(tǒng)計(jì)描述與推斷。常用的是Cox模型(móxíng)。相應(yīng)的SAS過程為:phreg。注:半?yún)?shù)法與參數(shù)法可用來研究多個(gè)因素對生存時(shí)間的影響,非參數(shù)法難以實(shí)施多因素生存分析。

非參數(shù)法的lifetest過程語法格式:PROCLIFETEST[選項(xiàng)];TIME<生存時(shí)間變量*截尾指示變量(數(shù)值)>;第四十三頁,共七十五頁。11/3/202243醫(yī)用SAS統(tǒng)計(jì)分析四STRATA<分組變量名列>;(指定比較的分組變量,按分組變量名列分別進(jìn)行(jìnxíng)分析和比較。)TEST<協(xié)變量名列>;(指定協(xié)變量名列,檢驗(yàn)生存時(shí)間與該變量是否有關(guān))Freq<變量名>;(指定頻數(shù)變量名)PROC過程[選項(xiàng)]

1.method=方法指定估計(jì)生存率所用的方法:

PL

要求用乘積極限法(即Kaplan-Meier

法)估計(jì)生存率并計(jì)算中位生存時(shí)間等,為缺省方法。

LT

要求用壽命表法估計(jì)生存率等。2.intervals=(初值to終值by步長)或width=數(shù)值只能在指定方法為壽命表法時(shí)使用。用壽命表法分析時(shí),程序會(huì)自動(dòng)第四十四頁,共七十五頁。11/3/202244醫(yī)用SAS統(tǒng)計(jì)分析四

給定生存時(shí)間的區(qū)間。如果人為規(guī)定生存時(shí)間的分組區(qū)間,則需用該選項(xiàng)指定。3.Plots=繪圖類型要求輸出生存分析圖。可供輸出的圖形有:

S

對生存函數(shù)S(t)作圖。橫、縱坐標(biāo)分別為t,S(t)。

H

對風(fēng)險(xiǎn)函數(shù)作圖。橫、縱坐標(biāo)分別為t,H(t)。小樣本資料的乘積極限法(Kaplan-Meier法)例15-1

25例某種癌癥的患者在不同的日期隨機(jī)(suíjī)分配至兩治療組,分別以A、B兩種治療方法進(jìn)行治療。治療后繼續(xù)對這些病人進(jìn)行隨訪至到2003年5月31日結(jié)束。資料如表15.1所示,數(shù)字后又+號者為刪失值。試進(jìn)行生存率分析。第四十五頁,共七十五頁。11/3/202245醫(yī)用SAS統(tǒng)計(jì)分析四datalife1;dogroup=1to2;inputn;doi=1ton;inputt@@;ift<0thencensor=1;elsecensor=0;t=abs(t);output;end;end;cards;12852586363220365452496-528-560-676131318237076180195210232300396-490-540;proclifetestplots=(s)formchar(1,2,7)='|-+';timet*censor(1);stratagroup;run;第四十六頁,共七十五頁。11/3/202246醫(yī)用SAS統(tǒng)計(jì)分析四TheLIFETESTProcedureProduct-LimitSurvivalEstimatesGROUP=1SurvivalStandardNumberNumberTSurvivalFailureErrorFailedLeft

生存時(shí)間生存率死亡概率(gàilǜ)生存率標(biāo)準(zhǔn)誤死亡例數(shù)生存例數(shù)0.0001.0000000128.0000.91670.08330.079811152.0000.83330.16670.107621058.0000.75000.25000.12503963.000...4863.0000.58330.41670.142357220.0000.50000.50000.144366365.0000.41670.58330.142375452.0000.33330.66670.136184496.0000.25000.75000.125093528.000*...92560.000*...91676.000*...90*CensoredObservation第四十七頁,共七十五頁。11/3/202247醫(yī)用SAS統(tǒng)計(jì)分析四SummaryStatisticsforTimeVariableTPoint95%ConfidenceIntervalQuantileEstimate[Lower,Upper)

四分位數(shù)點(diǎn)估計(jì)95%可信區(qū)間(qūjiān)75%.220.000.50%292.50063.000496.00025%60.50052.000365.000Mean272.083StandardError62.231

生存時(shí)間均數(shù)均數(shù)的標(biāo)準(zhǔn)誤NOTE:Thelastobservationwascensoredsotheestimateofthemeanisbiased.第四十八頁,共七十五頁。11/3/202248醫(yī)用SAS統(tǒng)計(jì)分析四

TheLIFETESTProcedureProduct-LimitSurvivalEstimatesGROUP=2SurvivalStandardNumberNumberTSurvivalFailureErrorFailedLeft0.0001.00000001313.0000.92310.07690.073911218.0000.84620.15380.100121123.0000.76920.23080.116931070.0000.69230.30770.12804976.0000.61540.38460.134958180.0000.53850.46150.138367195.0000.46150.53850.138376210.0000.38460.61540.134985232.0000.30770.69230.128094300.0000.23080.76920.1169103396.0000.15380.84620.1001112490.000*...111540.000*...110*CensoredObservation第四十九頁,共七十五頁。11/3/202249醫(yī)用SAS統(tǒng)計(jì)分析四SummaryStatisticsforTimeVariableTPoint95%ConfidenceIntervalQuantileEstimate[Lower,Upper)75%300.000195.000.50%195.00070.000300.00025%70.00018.000195.000Mean192.692StandardError40.963SummaryoftheNumberofCensoredandUncensoredValuesGROUPTotalFailedCensored%Censored1129325.000021311215.3846Total2520520.0000第五十頁,共七十五頁。11/3/202250醫(yī)用SAS統(tǒng)計(jì)分析四

SDF||||||1.0+*AB|||S|||u|A*---Ar|||v|BB|i||AAv0.8+||a|B---|Bl|AA||D|*Bi|||s||B------------Bt0.6+||r|A-----------------Ai|BB|b||A-----------------Au|||t|B-B|i||A---------Ao0.4+||n|B--B|||A-----AF|B-------B|u|||n||Ac|B-----------Bt0.2+|i||o|Bn||||0.0+|||||+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-050100150200250300350400450500550600650700T第五十一頁,共七十五頁。11/3/202251醫(yī)用SAS統(tǒng)計(jì)分析四

TestofEqualityoverStrata

Pr>TestChi-SquareDFChi-SquareLog-Rank時(shí)序(shíxù)檢驗(yàn)0.664010.4152Wilcoxon秩和檢驗(yàn)0.327210.5673-2Log(LR)似然比檢驗(yàn)

1.036210.3087第五十二頁,共七十五頁。11/3/202252醫(yī)用SAS統(tǒng)計(jì)分析四例王潔貞主編《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》例14.1P202手術(shù)(shǒushù)療法組:52789296105123145136*157*182*209*224*手術(shù)+化療組:7995117175203102*157*199*216*246*269第五十三頁,共七十五頁。11/3/202253醫(yī)用SAS統(tǒng)計(jì)分析四datalife2;dogroup=1to2;inputn;doi=1ton;inputt@@;ift<0thencensor=1;elsecensor=0;t=abs(t);output;end;end;cards;1252789296105123145-136-157-182-209-224117995117175203-102-157-199-216-246269;proclifetestplots=(s)formchar(1,2,7)='|-+';timet*censor(1);stratagroup;run;第五十四頁,共七十五頁。11/3/202254醫(yī)用SAS統(tǒng)計(jì)分析四

大樣本資料(zīliào)的壽命表法

例2王潔貞主編《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》例14.2P206第五十五頁,共七十五頁。11/3/202255醫(yī)用SAS統(tǒng)計(jì)分析四

datalife3;inputtcensorfg@@;/*t:月數(shù)的下限;censor:1=死亡,0=失訪;f:人數(shù)(rénshù);g:分組變量*/cards;0181000171517011131411300119121190017142704213122130221912219032251322502231112310423710237012;proclifetestmethod=Ltwidth=6plots=(s)formchar(1,2,7)='|-+';timet*censor(0);stratag;freqf;run;第五十六頁,共七十五頁。11/3/202256醫(yī)用SAS統(tǒng)計(jì)分析四

TheLIFETESTProcedureLifeT

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論