![Logistic回歸-醫(yī)學統(tǒng)計學_第1頁](http://file4.renrendoc.com/view/e842f698587adac4f1948d3756046536/e842f698587adac4f1948d37560465361.gif)
![Logistic回歸-醫(yī)學統(tǒng)計學_第2頁](http://file4.renrendoc.com/view/e842f698587adac4f1948d3756046536/e842f698587adac4f1948d37560465362.gif)
![Logistic回歸-醫(yī)學統(tǒng)計學_第3頁](http://file4.renrendoc.com/view/e842f698587adac4f1948d3756046536/e842f698587adac4f1948d37560465363.gif)
![Logistic回歸-醫(yī)學統(tǒng)計學_第4頁](http://file4.renrendoc.com/view/e842f698587adac4f1948d3756046536/e842f698587adac4f1948d37560465364.gif)
![Logistic回歸-醫(yī)學統(tǒng)計學_第5頁](http://file4.renrendoc.com/view/e842f698587adac4f1948d3756046536/e842f698587adac4f1948d37560465365.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
Logistic回歸模型
Logisticregression首都醫(yī)科大學公共衛(wèi)生與家庭醫(yī)學學院流行病與衛(wèi)生統(tǒng)計學系講授教師:楊興華xinghuay@201210/9/20231復習多重線性回歸
(multiplelinearregression)
在醫(yī)學實踐中,常會遇到一個應變量與多個自變量數(shù)量關系的問題。如醫(yī)院住院人數(shù)不僅與門診人數(shù)有關,而且可能與病床周轉次數(shù),床位數(shù)等有關;兒童的身高不僅與遺傳有關還與生活質量,性別,地區(qū),國別等有關;人的體表面積與體重、身高等有關。10/9/20232表1多重線性回歸分析的數(shù)據(jù)結構實驗對象yX1X2X3….XP
1y1a11a12a13…a1p
2y2a21a22a23…a2p
3y3a31a32a33…a3p
…
nynan1an2an3…anp
━━━━━━━━━━━━━━━━━━其中:y取值是服從正態(tài)分布10/9/20233多重線性回歸模型
通過實驗測得含有p個自變量x1,x2,x3,…,xp及一個因變量y的n個觀察對象值,利用最小二乘法原理,建立多重線性回歸模型:其中b0為截距,b1,b2…bp稱為偏回歸系數(shù).bi表示當將其它p-1個變量的作用加以固定后,Xi改變1個單位時Y將改變bi個單位.10/9/20234logisticregressionanalysisLogistic回歸分析及其應用10/9/20235(一)基本概念和原理
1、應用背景
Logistic回歸模型是一種概率模型,適合于病例-對照研究、隨訪研究和橫斷面研究,且結果發(fā)生的變量取值必須是二項或多項分類??捎糜绊懡Y果變量發(fā)生的因素為自變量,建立回歸方程。10/9/20236
設資料中有一個因變量y、p個自變量x1,x2,…,xp,對實驗對象共有n次觀測結果,可將原始資料列成表2形式。2、Logistic回歸模型的數(shù)據(jù)結構10/9/20237表2Logistic回歸模型的數(shù)據(jù)結構實驗對象yX1X2X3….XP
1y1a11a12a13…a1p
2y2a21a22a23…a2p
3y3a31a32a33…a3p
…
nynan1an2an3…anp
━━━━━━━━━━━━━━━━━━其中:y取值是二值或多項分類10/9/20238
表3肺癌與危險因素的調查分析例號是否患病性別吸煙年齡地區(qū)111030021014613000351………………30000261
注:是否患病中,‘0’代表否,‘1’代表是。性別中‘1’代表男,‘0’代表女,吸煙中‘1’代表吸煙,‘0’代表不吸煙。地區(qū)中,‘1’代表農村,‘0’代表城市。
10/9/20239
表4配對資料(1:1)對子號病例對照x1x2x3x1x2x3113010120311303012020…10222000注:X1蛋白質攝入量,取值:0,1,2,3X2不良飲食習慣,取值:0,1,2,3X3精神狀況,取值:0,1,2
10/9/202310Logistic回歸
--Logistic回歸與多重線性回歸聯(lián)系與區(qū)別聯(lián)系:
用于分析多個自變量與一個因變量的關系,目的是矯正混雜因素、篩選自變量和更精確地對因變量作預測等。區(qū)別:
線性模型中因變量為連續(xù)性隨機變量,且要求呈正態(tài)分布.Logistic回歸因變量的取值僅有兩個,不滿足正態(tài)分布。10/9/2023113、Logistic回歸模型
令:y=1發(fā)?。栃?、死亡、治愈等)
y=0未發(fā)病(陰性、生存、未治愈等)將發(fā)病的概率記為P,它與自變量x1,x2,…,xp之間的Logistic回歸模型為:可知,不發(fā)病的概率為:
10/9/202312
經數(shù)學變換得:定義:為Logistic變換,即:
10/9/202313
4、回歸系數(shù)βi的意義
流行病學的常用指標優(yōu)勢比(oddsratio,OR)或稱比值比,定義為:暴露人群發(fā)病優(yōu)勢與非暴露人群發(fā)病優(yōu)勢之比。即Xi的優(yōu)勢比為:10/9/202314故對于樣本資料OR=exp()95%置信區(qū)間為:可見是影響因素Xi增加一個單位所引起的對數(shù)優(yōu)勢的增量,反映了其對Y作用大小。如果要比較不同因素對Y作用大小,需要消除變量量綱的影響,為此計算標準化回歸系數(shù)10/9/2023155.假設檢驗(1)回歸方程的假設檢驗H0:所有H1:某個計算統(tǒng)計量為:G=-2lnL,服從自由度等于n-p的分布(2)回歸系數(shù)的假設檢驗H0:H1:計算統(tǒng)計量為:Wald,自由度等于1。10/9/202316(二)Logistic回歸類型及其實例分析
1、非條件Logistic回歸當研究設計為隊列研究、橫斷面研究或成組病例對照研究時,可以用非條件Logistic回歸。10/9/202317實例1
某研究者調查了30名成年人,記錄了同肺癌發(fā)病的有關因素情況,數(shù)據(jù)見表4。其中是否患病中,‘0’代表否,‘1’代表是;性別中‘1’代表男,‘0’代表女;吸煙中‘1’代表吸煙,‘0’代表不吸煙;地區(qū)中,‘1’代表農村,‘0’代表城市。試分析各因素與肺癌間的關系。10/9/202318
表5肺癌與危險因素的調查分析例號是否患病性別吸煙年齡地區(qū)111030021014613000351………………30000261注:是否患病中,‘0’代表否,‘1’代表是。性別中‘1’代表男,‘0’代表女,吸煙中‘1’代表吸煙,‘0’代表不吸煙。地區(qū)中,‘1’代表農村,‘0’代表城市。10/9/202319Datalog1;Infile’log1.dat’;-----------讀取數(shù)據(jù)Inputnyx1-x4@@;-----------指出變量Proclogistic;----------調logistic回歸模塊
modely=x1;run;-----------作單變量(x1)分析Proclogistic;modely=x2;run;Proclogistic;modely=x3;run;Proclogistic;modely=x4;run;Proclogistic;
modely=x1-x4;run;------------作多變量分析10/9/202320
表6
單因素Logistic回歸分析結果
模型號變量系數(shù)標準誤Wald卡方P值
1X11.70470.80064.53440.03322X22.56490.93647.50290.00623X30.14280.04679.34090.0022
4X4-0.27190.73870.13550.7128
結果表明,性別,吸煙,年齡三個因素都與肺癌有關.由于在對某一因素進行單因素分析時沒有控制其它因素的干擾,因此結果不可靠.10/9/202321表7多因素Logistic回歸分析結果變量系數(shù)標準誤Wald卡方P值INTERCPT-9.754.095.660.02X12.521.821.920.17X23.981.984.060.04X30.190.085.670.02X4-1.301.580.680.41
由上最大似然估計分析知因素X2(吸煙),X3(年齡)對肺癌的發(fā)生有顯著的影響。所得的回歸方程為:Logit(P)=-9.7544+2.5152X1+3.9849X2+0.1884X3-1.3037X4.10/9/202322SPSS操作步驟:Analyze-----Regression-----BinaryLogistic-----Dependent框(y)-----Covariates框(x1,x2,…)------ok非條件Logistic回歸
SPSS操作步驟:10/9/20232310/9/20232410/9/202325
結果表明,性別,吸煙,年齡三個因素都與肺癌有關.由于在對某一因素進行單因素分析時沒有控制其它因素的干擾,因此結果不可靠.單因素分析的結果10/9/202326多因素分析的結果10/9/20232710/9/202328
由上最大似然估計分析知因素X2(吸煙),X3(年齡)對肺癌的發(fā)生有影響。所得的回歸方程為:Logit(P)=-9.7544+2.5152X1+3.9849X2+0.1884X3-1.3037X4.10/9/2023292.條件logistic回歸分析配對設計的類型:1:1、1:m、n:m(可采用分層COX模型來擬合)。例如:某市調查三種生活因素與胃癌的關系,資料見表5。10/9/202330表5配對資料(1:1)對子號病例對照x1x2x3x1x2x3113010120311303012020…10222000注:X1蛋白質攝入量,取值:0,1,2,3X2不良飲食習慣,取值:0,1,2,3X3精神狀況,取值:0,1,210/9/202331配對Logistic回歸SPSS操作步驟:Analyze-----Survival----COXRegression-----Time框(outcome)-----Status框(Status)-----DefineEvent:Singlevalue1:continue-----Covariates框(x1、x2、x3)-----Strata框(id)---Options---atlaststep------ok10/9/20233210/9/20233310/9/20233410/9/20233510/9/20233610/9/20233710/9/20233810/9/2023393、逐步Logistic回歸分析(1)向前法(forwardselection)
開始方程中沒有變量,自變量由少到多一個一個引入回歸方程。按自變量對因變量的貢獻(P值的大?。┯尚〉酱笠来翁暨x,變量入選的條件是其P值小于規(guī)定進入方程的P界值Enter,缺省值P(0.05)。10/9/202340(2)后退法(backwardselection)
開始變量都在方程中,然后按自變量因變量的貢獻(P值的大?。┯纱蟮叫∫来翁蕹兞刻蕹臈l件是其P值大于規(guī)定的剔除標準Remove,缺省值p(0.10)。
10/9/202341(3)逐步回歸法
逐步引入-剔除法(stepwiseselection)
前進逐步引入-剔除法是在前進法的思想下,考慮剔除變量,因此有兩個p界值Enter,Remove。10/9/202342
無論是條件還是非條件Logistic回歸,在多變量分析時均可以采用逐步回歸方法,實現(xiàn)的方法是:在model后加選項:/selection=forward、backward或stepwise再給出SLE,SLS的界值。
調試法:P從大到小取值0.5,0.1,0.05…,一般實際用時,SLE,SLS應多次選取調整10/9/202343解釋
設第i個因素的回歸系數(shù)為bi,表示當有多個自變量存在時,其它自變量固定不變的情況下,自變量Xi每增加一個單位時,所得到的優(yōu)勢比的自然對數(shù)。也就是其它自變量固定不變的情況下,自變量Xi每增加一個單位時,影響因變量Y=0發(fā)生的倍數(shù)。當bi>0時,對應的優(yōu)勢比(oddsratio,記為ORi):ORi=exp(bi)>1,說明該因素是危險因素;當bi<0時,對應的優(yōu)勢比ORi=exp(bi)<1,說明該因素是保護因素。
10/9/202344
Logistic逐步回歸結果
ParameterStandardWaldPr>RiskVariableDFEstimateErrorChi-SquareChi-SquareRatio
X211.22180.84102.11070.14633.393
X312.29471.80721.61240.20429.922
采用Logistic逐步回歸:Proclogistic;modely=x1-x3/nointselection=stepwisesle=0.3sls=0.3;Run;10/9/202345
在本例中不良飲食習慣X2,取值:0、1,2、3,b=1.2218,OR=3.393,表示不良飲食習慣,每增加一個單位時,發(fā)病的可能性提高3.393倍;精神狀況X3,取值:0、1、2,b=2.2947,OR=9.922,表示精神狀況不良影響發(fā)病,精神狀況每增加一個單位時,發(fā)病的可能性提高9.922倍。10/9/202346SPSS無論是條件還是非條件Logistic回歸,在多變量分析時均可以采用逐步回歸方法,實現(xiàn)的方法是:在method后加選項:Enter:所有變量一次全部進入方程。Forward:逐步向前法Backward:后退法變量移出方程所采取的檢驗方法:Conditional;LR;Ward
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 大學生活委員申請書
- 撤銷打架申請書
- 未來網(wǎng)絡教育的政策支持與產業(yè)發(fā)展
- 椅子高度與長時間工作的舒適性
- 物聯(lián)網(wǎng)時代下個人信息保護的倫理要求及實踐措施
- 大學新生助學金申請書
- 護士不上夜班申請書
- 專利申請書范本
- 2024-2025學年高中物理專題02動量和動量定理練習含解析
- 2024年新教材高中生物課時素養(yǎng)評價十三5.2染色體變異含解析新人教版必修2
- 胸腔鏡肺癌根治術手術配合
- 初二地理會考復習教案
- 外研版七年級上冊英語課文翻譯
- 銀行營銷術語演練
- 醫(yī)院培訓課件:《成人住院患者靜脈血栓栓塞癥的預防護理》
- 學校食品安全教育學習活動食品安全講座課件
- 2024年河北省公務員考試《行測》真題及答案解析
- 綠色建筑項目造價咨詢服務方案
- 2024-2030年中國高油酸花生油市場供需趨勢與營銷推廣渠道分析研究報告
- GB/T 44717-2024民用無人機可靠性飛行試驗要求與方法
- 五年級上冊數(shù)學小數(shù)四則混合運算練習100道及答案
評論
0/150
提交評論