醫(yī)學(xué)統(tǒng)計學(xué)-logistic回歸_第1頁
醫(yī)學(xué)統(tǒng)計學(xué)-logistic回歸_第2頁
醫(yī)學(xué)統(tǒng)計學(xué)-logistic回歸_第3頁
醫(yī)學(xué)統(tǒng)計學(xué)-logistic回歸_第4頁
醫(yī)學(xué)統(tǒng)計學(xué)-logistic回歸_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

衛(wèi)生統(tǒng)計學(xué)PowerPoint統(tǒng)計學(xué)第十五章多因素對某定性指標(biāo)

的影響分析

第一節(jié)Logistic回歸分析一、基本概念

應(yīng)變量是分類變量

1出現(xiàn)陽性結(jié)果(發(fā)病、有效、死亡等)

Y=

0出現(xiàn)陰性結(jié)果(未發(fā)病、無效、存活等)P:Y=1的率P/(1-P)稱優(yōu)勢(比數(shù))

0

:表示暴露劑量為0時個體發(fā)病與不發(fā)病概率之比的自然對數(shù)

i

:表示在其它自變量不變的條件下,

Xi改變一個單位時logitP=

的改變量。

第一節(jié)Logistic回歸分析

Logistic回歸的特點1、Logistic回歸方程中,各自變量Xi變化范圍可以從-

到+

,Xi可以是定量指標(biāo)、等級指標(biāo)或定性指標(biāo)(需經(jīng)數(shù)量化),而應(yīng)變量P的變化范圍為0到1。Z→∞時,P值漸近于1Z→-∞時,P值漸近于02、Logistic回歸系數(shù)和流行病學(xué)中反映各危險因素對疾病作用大小的優(yōu)勢比有直接的聯(lián)系,并把單因素兩水平下的優(yōu)勢比的定義擴(kuò)展到多因素任意取值。第一節(jié)Logistic回歸分析

設(shè)在一組自變量取值X0下,某病發(fā)病的概率為P0

,而在另外一組取值X1

下,某病發(fā)病的概率為P1

變量Xi

改變?yōu)?/p>

而固定其它自變量取值時,有ORi=exp[

i(─)]ORi>1,高水平(數(shù)據(jù)大)率大

特別當(dāng)─

=1

時,

(Xi=1為暴露,Xi=0為非暴露)

ORi=exp

i

3、對于流行病學(xué)兩類調(diào)查研究方法

前瞻性的隊列研究和回顧性的病例對照研究,所建立的Logistic回歸方程,除常數(shù)項不同外,其它各回歸系數(shù)均相同。第一節(jié)Logistic回歸分析

二、Logistic回歸模型的配合1.應(yīng)變量為二分類的Logistic回歸模型參數(shù)估計采用最大似然函數(shù)估計法(maximumlikelihoodestimate),即根據(jù)n例實際觀測數(shù)據(jù)建立一個樣本的似然函數(shù):第一節(jié)Logistic回歸分析

Pi:i例暴露條件下陽性率,Yi=1陽性,Yi=0陰性。若某對象陽性,用迭代方法使以下目標(biāo)函數(shù)

達(dá)極大值,估計出bj

(1)AIC檢驗法(AkaikeInformationCriterion)

L是最大似然函數(shù),g為應(yīng)變量分類變量的分類數(shù),k為模型中包含的自變量個數(shù)。AIC值越小,模型擬合越好。用于同一組數(shù)據(jù)下的不同模型間的比較。

H0:

H1:不全為0(含全不為0)

(2)SC檢驗法(SchwarteCriterion)式中,L是最大似然函數(shù),g為應(yīng)變量分類變量的分類數(shù),k為模型中包含的自變量個數(shù),n是樣本例數(shù)。和AIC一樣,SC值越小,模型擬合越好。用于比較同一組數(shù)據(jù)下的不同模型間的比較。

(3)似然比檢驗法

服從自由度為k-p的χ2分布,p和k是兩個模型中包含的自變量個數(shù)。P<α,則有統(tǒng)計學(xué)意義。(4)計分檢驗法(Score)公式很復(fù)雜,它服從χ2分布,用于檢驗?zāi)P椭腥孔宰兞繉?yīng)變量的聯(lián)合作用。(5)Wald檢驗法H0:H1:Wald

似然比檢驗法最可靠。Somers’D、Gamma、Tau-a和C,越接近于1說明模型擬合得的越好。選項“LACKFIT”對模型進(jìn)行擬合優(yōu)度檢驗(Goodnessoffitstatistics),P越大則說明模型擬合的越好。

例15-1.為研究病情x1(0表示不嚴(yán)重,1表示嚴(yán)重)、年齡x2(歲)及不同治療方法x3(0表示傳統(tǒng)療法,1表示新療法)對某病療效的影響,某研究者隨機(jī)抽取40名某病的患者,其中有20名患者采用傳統(tǒng)療法,另20名患者采用新療法,經(jīng)過一段治療后記錄下康復(fù)的情況y(0表示未康復(fù),1表示康復(fù)),作logistic回歸分析。

dataex15_1;inputyx1-x3@@;cards;10200102301032010380112501020110241102811030110321103811126111291113411133111381114010022000260002900034000300003800037001240012500129001320013400137001400014000033100361012410134101321013610138100391;proclogisticdescendingsimple;modely=x1-x3/stbscale=noneaggregatelackfit;unitsx2=10;run;

ResponseProfileOrderedTotalValueyFrequency11172023DevianceandPearsonGoodness-of-FitStatisticsCriterionDFValueValue/DFPr>ChiSqDeviance3133.92901.09450.3281Pearson3127.27080.87970.6585

TestingGlobalNullHypothesis:BETA=0TestChi-SquareDFPr>ChiSqLikelihoodRatio9.529030.0230Score8.595830.0352Wald6.943130.0737

AnalysisofMaximumLikelihoodEstimatesStandardStandardizedParameterDFEstimateErrorChi-SquarePr>ChiSqEstimateIntercept12.37892.02791.37620.2407x11-0.77670.74971.07310.3002-0.2168x21-0.10680.06772.48640.1148-0.3517x311.95700.80365.93030.01490.5464

OddsRatioEstimatesPoint95%WaldEffectEstimateConfidenceLimitsx10.4600.1061.999x20.8990.7871.026x37.0781.46534.198AdjustedOddsRatiosEffectUnitEstimatex210.00000.344dataex15_1;inputyx1-x3@@;cards;10200102301032010380112501020110241102811030110321103811126111291113411133111381114010022000260002900034000300003800037001240012500129001320013400137001400014000033100361012410134101321013610138100391;proc

logisticdescendingsimple;modely=x1-x3/selection=stepwisesle=0.1

sls=0.1

stb

scale=noneaggregatelackfit;unitsx2=5;run;

TheLOGISTICProcedureAnalysisofMaximumLikelihoodEstimatesStandardStandardizedParameterDFEstimateErrorChi-SquarePr>ChiSqEstimateIntercept12.27181.97711.32040.2505x21-0.11350.06632.93020.0869-0.3739x311.83460.77445.61260.01780.5122

OddsRatioEstimatesPoint95%WaldEffectEstimateConfidenceLimitsx20.8930.7841.017x36.2631.37328.573AdjustedOddsRatiosEffectUnitEstimatex25.00000.567平均康復(fù)率大1歲是小1歲的0.893倍平均康復(fù)率新療法是舊療法的6.263倍平均康復(fù)率大5歲是小5歲的0.567倍2.應(yīng)變量為有序分類變量的logistic回歸模型醫(yī)學(xué)研究中經(jīng)常要用到的應(yīng)變量為有序分類變量,例如治療效果分為“無效、好轉(zhuǎn)、有效、治愈”,疾病的嚴(yán)重程度分為“無、輕、中、重”與“I期、Ⅱ期、Ⅲ期”等,分析各種因素自變量對這種有序分類變量的應(yīng)變量的影響時也可采用logistic回歸模型。SAS軟件中的logistic回歸過程是以累積概率函數(shù)的形式提供的。設(shè)應(yīng)變量y為k個等級的有序分類變量,不妨設(shè)y的k個取值按等級順序為1、2、…、k。對y取值小于等于等級j(j=1、2、…、k)的概率即取前j個值的累積概率用來表示,則有:當(dāng)j=1、2、…、k-1例如對k=3時有:因而應(yīng)變量y取等級1、2、3的概率為:例15-2.某醫(yī)院外科采用兩種不同繃帶(x1=0為第一種繃帶,x1=1為第二種繃帶)和兩種不同的包扎方式(x2=0為第一種包扎方式,x2=1為第二種包扎方式)進(jìn)行腿部潰瘍處理。治療效果分為三個等級:不愈、有效、痊愈(y=0為不愈,y=1為有效、y=2為痊愈)。治療結(jié)果如表15-3所示。試分析不同的治療方式對治療效果的影響。dataex15_2;inputyx1x2f@@;cards;0 0 0 191 0 0 42 0 0 20 1 0 91 1 0 821 0 60 0 1 211 0 1 32 0 1 20 1 1101 1 1 1021 1 5;proc

logisticdescending;modely=x1x2/stbscale=noneaggregatelackfit;freqf;run;

AnalysisofMaximumLikelihoodEstimatesStandardStandardizedParameterDFEstimateErrorChi-SquarePr>ChiSqEstimateIntercept1-2.66780.465632.8253<.0001Intercept21-1.17090.39298.87910.0029x111.64300.438014.07080.00020.4550x21-0.19030.41890.20630.6496-0.0527

OddsRatioEstimatesPoint95%WaldEffectEstimateConfidenceLimitsx15.1712.19112.201x20.8270.3641.879Y取值2、痊愈:等級1;Y取值1、有效:等級2;Y取值0、無效:等級3。三種治療效果的概率估計為:痊愈:

有效:

無效:

但是回歸系數(shù)的假設(shè)檢驗結(jié)果只有繃帶種類x1有統(tǒng)計意義,包扎方式x2無統(tǒng)計意義。x1的OR=5.171,95%的可信區(qū)間為(2.191,12.201),區(qū)間不包含1,表示使用第二種繃帶約是使用第一種繃帶效果(痊愈的比例,痊愈及有效的比例)的5.171倍。

第二節(jié)條件Logistic回歸在研究設(shè)計階段,為控制混雜干擾因素常按干擾因素的不同取值設(shè)置相匹配的配比組,病例與對照之比為1:1或n:m。

,i=1,2,…,n

例15-3

收集了63對有關(guān)子宮內(nèi)膜癌的數(shù)據(jù),Y=0為對照,Y=1為病例,自變量因素為膽囊有無病變(gall=0為無病變,gall=1為有病變)和有無高血壓Hyper(hyper=0為無,hyper=1為有).試分析在控制血壓的條件下膽囊有無病變所引起的相對風(fēng)險。

datali15_3;inputiyx1-x2@@;t=2-y;cards;1100100021002000310130014100401051105001610160007110700081118001910090001010010000………………..;proc

phreg;modelt*y(0)=x1-x2/ties=discrete;stratai;run;

ThePHREGProcedureTestingGlobalNullHypothesis:BETA=0TestChi-SquareDFPr>ChiSqLikelihoodRatio4.548720.1029Score4.362020.1129

Wald4.006020.1349AnalysisofMaximumLikelihoodEstimatesParameterStandardHazardVariableDFEstimateErrorChi-SquarePr>ChiSqRatiox110.970410.530733.34320.06752.639x210.348070.376960.85260.35581.416

datali15_3;inputiyx1-x2@@;t=2-y;cards;110010002100200031013001410040105110500161016000711070008111800191009000101001000011110110001210012001………………;proc

phreg;modelt*y(0)=x1-2/selection=stepwisesle=0.1

sls=0.1ties=discrete;stratai;run;

AnalysisofMaximumLikelihoodEstimatesParameterStandardHazardVariableDFEstimateErrorChi-SquarePr>ChiSqRatiox110.955510.526233.29700.06942.600

SummaryofStepwiseSelectionVariableNumberScoreWaldStepEnteredRemovedInChi-SquareChi-SquarePr>ChiSq1x113.5556.0.0593子宮內(nèi)膜癌發(fā)病率有膽囊病變平均是無膽囊病變的2.6倍

例15-4

為研究肥胖X1(X1=1為肥胖,X1=0為不肥胖)、口服避孕藥雌激素X2(X2=1為服用雌激素,X2=0未服用雌激素)與子宮內(nèi)膜癌的關(guān)系,隨機(jī)選取20名患者。對于每名患者,再隨機(jī)選取年齡相近的2名正常人作為對照。datali15_4;inputix1-x2y@@;t=2-y;cards;111110001000211121102010311130103110401140004010500151005010611160006100711170107110811181008110910191109110100111001010000110111101011100120111201012010131111300013110141111400014100151111500015010160111601016010170111700017100181111810018010191011901019010201

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論