logistic回歸分析課件_第1頁
logistic回歸分析課件_第2頁
logistic回歸分析課件_第3頁
logistic回歸分析課件_第4頁
logistic回歸分析課件_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

logistic回歸分析Logisticregressionanalysis1多元線性回歸模型要求:因變量為服從正態(tài)分布的連續(xù)性變量…但在病因?qū)W研究或疾病預(yù)后研究中,觀察結(jié)果常為兩分類資料:2例:為了探討冠心病發(fā)生的有關(guān)危險(xiǎn)因素,對(duì)26例冠心病病人和28例對(duì)照者進(jìn)行病例

對(duì)照研究,各因素的說明及資料見表16-2和表16-3。

3表16-2冠心病8個(gè)可能的危險(xiǎn)因素與賦值

因素變量名賦值說明年齡(歲)X1<45=1,45

54=2,55

64=3,65

=4高血壓史X2無=0,有=1高血壓家族史X3無=0,有=1吸煙X4不吸=0,吸=1高血脂史X5無=0,有=1動(dòng)物脂肪攝入X6低=0,高=1體重指數(shù)(BMI)X7<24=1,24

<26=2,26

=3A型性格X8否=0,是=1冠心病Y對(duì)照=0,病例=14表16-3冠心病危險(xiǎn)因素的病例

對(duì)照調(diào)查資料序號(hào)X1X2X3X4X5X6X7X8Y131010011022011001003210100100…………………………543110103115食管癌的發(fā)生與吸煙、飲酒、不良飲食習(xí)慣等危險(xiǎn)因素的關(guān)系搶救急性心肌梗死病人能否成功的危險(xiǎn)因素:年齡、性別、時(shí)間、休克、心衰…臨床試驗(yàn)中藥物有效性的影響因素:年齡、性別、病情輕重、合并癥、時(shí)間…6第一節(jié)logistic回歸Logistic回歸:屬于概率型非線性回歸,是研究二分類或多分類觀察結(jié)果與一些影響因素之間關(guān)系的一種多變量分析方法。7二分類變量連續(xù)變量Logit變換一、基本概念8注:91.logistic回歸模型

或P=P(Y=1|X1,X2,…,Xm)表示在m個(gè)自變量影響下陽性結(jié)果發(fā)生的概率10圖16-1logistic函數(shù)的圖形若則112.模型參數(shù)的意義

常數(shù)項(xiàng)β0表示暴露劑量為0時(shí)個(gè)體發(fā)病與不發(fā)病概率之比的自然對(duì)數(shù)。

回歸系數(shù)βj表示在其它自變量保持不變的情況下自變量Xj改變一個(gè)單位時(shí)logitP的平均改變量,它與衡量危險(xiǎn)因素作用大小的OR值有一個(gè)對(duì)應(yīng)的關(guān)系。logitP12流行病學(xué)中的幾個(gè)概念:病例對(duì)照研究(case-controlstudy):選擇患有特定疾病的人群作為病例組,以不患有該病但具有可比性的人群作為對(duì)照組,調(diào)查兩組人群過去暴露于某種可能危險(xiǎn)因素的比例,判斷暴露危險(xiǎn)因素是否與疾病有關(guān)聯(lián)及其關(guān)聯(lián)程度大小的一種觀察性研究方法。13暴露(exposure)因素:研究者所關(guān)心的任何因素E+:暴露E-:非暴露有害的-危險(xiǎn)因素有益的-保護(hù)因素比值(odds)

:又稱為優(yōu)勢,某事物發(fā)生的可能性與不發(fā)生的可能性之比暴露(E)病例對(duì)照E+(如吸煙)abE-(如不吸煙)cd食管癌病例對(duì)照研究結(jié)果14比數(shù)比(oddsratio,OR):又稱比值比、優(yōu)勢比,指病例組的暴露比值與對(duì)照組的暴露比值之比,表示疾病與暴露之間的聯(lián)系強(qiáng)度。相對(duì)危險(xiǎn)度(relativerisk,RR):暴露組與非暴露組發(fā)病率之比發(fā)病率小于5%時(shí),OR近似等于RROR、RR:>1:危險(xiǎn)因素

0~1:保護(hù)因素15假定其它自變量保持不變時(shí),把X1的某兩個(gè)不同暴露水平分別賦值為c1和c0X1=c1:X1=c0:式1式2式1式2-=?1617ORj:多變量調(diào)整后的優(yōu)勢比,表示扣除了其它自變量影響后危險(xiǎn)因素的作用。如果Xj只有兩個(gè)水平,即暴露與非暴露,并分別賦值為0和1,則

ORj=expβj所以任何一個(gè)自變量Xj的兩個(gè)不同暴露水平下的比數(shù)比為:18βj>0:exp(βj)即OR>1表示Xj是危險(xiǎn)因素βj<0:exp(βj)即OR<1表示Xj是保護(hù)因素βj=0:exp(βj)即OR=1表示Xj不起作用19logistic回歸的分析步驟:1.根據(jù)樣本資料估計(jì)參數(shù);2.對(duì)參數(shù)進(jìn)行假設(shè)檢驗(yàn);3.篩選變量、并對(duì)各自變量的作用大小作出評(píng)價(jià)。二、logistic回歸模型的參數(shù)估計(jì)20二、logistic回歸模型的參數(shù)估計(jì)數(shù)據(jù)格式:同多元線性回歸分析的數(shù)據(jù)格式參數(shù)估計(jì):

最大似然估計(jì)(maximumlikelihoodestimate,MLE)法可利用統(tǒng)計(jì)軟件實(shí)現(xiàn)。21優(yōu)勢比估計(jì):某一因素兩個(gè)不同水平優(yōu)勢比的估計(jì)值為Xj只有兩個(gè)水平時(shí)ORj的1-α可信區(qū)間為:22X1

1吸煙0不吸煙X2

1飲酒0不飲酒Y

1病例0對(duì)照23logistic回歸分析結(jié)果:2425三、logistic回歸模型的假設(shè)檢驗(yàn)1.似然比檢驗(yàn)(likelihoodratiotest):2.Wald檢驗(yàn)(Waldtest):3.記分檢驗(yàn)(scoretest):26依次為:回歸系數(shù)、回歸系數(shù)標(biāo)準(zhǔn)誤、Waldχ2、自由度、P值、OR值、OR值的可信區(qū)間27四、變量的篩選前進(jìn)法后退法逐步回歸法28例16-2:為了探討冠心病發(fā)生的有關(guān)危險(xiǎn)因素,對(duì)26例冠心病病人和28例對(duì)照者進(jìn)行病例

對(duì)照研究,各因素的說明及資料見表16-2和表16-3。試用logistic逐步回歸分析方法篩選危險(xiǎn)因素。(α入=0.10,α出=0.15)29表16-2冠心病8個(gè)可能的危險(xiǎn)因素與賦值

因素變量名賦值說明年齡(歲)X1<45=1,45

54=2,55

64=3,65

=4高血壓史X2無=0,有=1高血壓家族史X3無=0,有=1吸煙X4不吸=0,吸=1高血脂史X5無=0,有=1動(dòng)物脂肪攝入X6低=0,高=1體重指數(shù)(BMI)X7<24=1,24

<26=2,26

=3A型性格X8否=0,是=1冠心病Y對(duì)照=0,病例=130表16-3冠心病危險(xiǎn)因素的病例

對(duì)照調(diào)查資料序號(hào)X1X2X3X4X5X6X7X8Y131010011022011001003210100100…………………………5431101031131SPSS的應(yīng)用:Analyze→Regression→binarylogistic→dependent:ycovariates:x1-x8method:forward:LRoptions:enter:0.10remove:0.15→OK323334各自變量的回歸系數(shù)如何解釋?(X6:動(dòng)物脂肪攝入)35標(biāo)準(zhǔn)化回歸系數(shù):進(jìn)入變量bSbWaldχ2Pb’OROR95%CIIntercept-4.70501.54339.29500.0023x10.92390.47663.75830.05250.40094.4641.03919.181x51.49590.74394.04400.04430.405823.0001.989265.945x63.13551.24896.30310.01210.70287.0081.33336.834x81.94710.84665.28930.02150.52334.4641.03919.18136SPSS中篩選自變量的方法:1.Forward:即表示逐步回歸三種方法:選入時(shí)用記分檢驗(yàn),剔除時(shí)標(biāo)準(zhǔn)不同

conditionalLR基于最大似然估計(jì)(最可靠)Wald2.Backward:向后法也有三種(同上)37第二節(jié)條件logistic回歸針對(duì)配對(duì)資料分析的一種方法病例對(duì)照研究:成組設(shè)計(jì)病例對(duì)照研究

配對(duì)設(shè)計(jì)病例對(duì)照研究1:M例16-3:P34338第三節(jié)logistic回歸的應(yīng)用及其注意事項(xiàng)一、logistic回歸的應(yīng)用1.流行病學(xué)危險(xiǎn)因素分析

OR=expβ(c0-c1)

多個(gè)因素同時(shí)作用下的聯(lián)合OR是各單個(gè)OR的連乘積交互作用392.臨床試驗(yàn)數(shù)據(jù)分析評(píng)價(jià)某種藥物療效或治療方法的效果時(shí),logistic回歸可平衡混雜因素的影響“控制混雜因素的一個(gè)簡單辦法是將其引入方程進(jìn)行分析”

(bi的意義:在其它自變量不變時(shí)的作用大小)403.分析藥物或毒物的劑量反應(yīng)4.預(yù)測與判別:

如根據(jù)患者的檢測指標(biāo)預(yù)測其患病的概率41二、logistic回歸應(yīng)用的注意事項(xiàng)1.變量的取值形式

在做危險(xiǎn)因素分析時(shí),若自變量是一個(gè)定量指標(biāo),最好將其按變量值的大小進(jìn)行分組,并賦值為1,2…k,否則參數(shù)的實(shí)際意義不大,甚至荒謬。如:年齡、血細(xì)胞計(jì)數(shù)等有序分類變量:數(shù)量化無序分類變量:化為k-1個(gè)啞變量(同進(jìn)同出)

βi的符號(hào)與自變量的取值形式有關(guān)42二、logistic回歸應(yīng)用的注意事項(xiàng)2.樣本含量

病例對(duì)照研究:至少各有30-50例變量越多,需要的樣本量也越大3.模型評(píng)價(jià)

建立的回歸方程的檢驗(yàn)每個(gè)自變量的檢驗(yàn)4.多分類的logistic回歸43練習(xí)題:某醫(yī)院骨科在研究某種藥物治療骨折效果時(shí),收集了516例資料,對(duì)每一患者采用相同的標(biāo)準(zhǔn)按照“好、差”作療效評(píng)價(jià)。在評(píng)價(jià)時(shí)需要同時(shí)考慮骨折的類型、是否手術(shù)、是否服藥和治療時(shí)間四個(gè)因

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論