版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
Logistic回歸模型
Logisticregression首都醫(yī)科大學(xué)公共衛(wèi)生與家庭醫(yī)學(xué)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系講授教師:楊興華202112/31/20221復(fù)習(xí)多重線性回歸
(multiplelinearregression)在醫(yī)學(xué)實(shí)踐中,常會遇到一個(gè)應(yīng)變量與多個(gè)自變量數(shù)量關(guān)系的問題。如醫(yī)院住院人數(shù)不僅與門診人數(shù)有關(guān),而且可能與病床周轉(zhuǎn)次數(shù),床位數(shù)等有關(guān);兒童的身高不僅與遺傳有關(guān)還與生活質(zhì)量,性別,地區(qū),國別等有關(guān);人的體外表積與體重、身高等有關(guān)。12/31/20222表1多重線性回歸分析的數(shù)據(jù)結(jié)構(gòu)實(shí)驗(yàn)對象yX1X2X3….XP
1y1a11a12a13…a1p
2y2a21a22a23…a2p
3y3a31a32a33…a3p
…
nynan1an2an3…anp
━━━━━━━━━━━━━━━━━━其中:y取值是服從正態(tài)分布12/31/20223多重線性回歸模型
通過實(shí)驗(yàn)測得含有p個(gè)自變量x1,x2,x3,…,xp及一個(gè)因變量y的n個(gè)觀察對象值,利用最小二乘法原理,建立多重線性回歸模型:其中b0為截距,b1,b2…bp稱為偏回歸系數(shù).bi表示當(dāng)將其它p-1個(gè)變量的作用加以固定后,Xi改變1個(gè)單位時(shí)Y將改變bi個(gè)單位.12/31/20224logisticregressionanalysisLogistic回歸分析及其應(yīng)用12/31/20225〔一〕根本概念和原理
1、應(yīng)用背景
Logistic回歸模型是一種概率模型,適合于病例-對照研究、隨訪研究和橫斷面研究,且結(jié)果發(fā)生的變量取值必須是二項(xiàng)或多項(xiàng)分類??捎糜绊懡Y(jié)果變量發(fā)生的因素為自變量,建立回歸方程。12/31/20226
表3肺癌與危險(xiǎn)因素的調(diào)查分析例號是否患病性別吸煙年齡地區(qū)111030021014613000351………………30000261
注:是否患病中,‘0’代表否,‘1’代表是。性別中‘1’代表男,‘0’代表女,吸煙中‘1’代表吸煙,‘0’代表不吸煙。地區(qū)中,‘1’代表農(nóng)村,‘0’代表城市。
12/31/20229
表4配對資料(1:1)對子號病例對照x1x2x3x1x2x3113010120311303012020…10222000注:X1蛋白質(zhì)攝入量,取值:0,1,2,3X2不良飲食習(xí)慣,取值:0,1,2,3X3精神狀況,取值:0,1,2
12/31/202210Logistic回歸
--Logistic回歸與多重線性回歸聯(lián)系與區(qū)別聯(lián)系:
用于分析多個(gè)自變量與一個(gè)因變量的關(guān)系,目的是矯正混雜因素、篩選自變量和更精確地對因變量作預(yù)測等。區(qū)別:
線性模型中因變量為連續(xù)性隨機(jī)變量,且要求呈正態(tài)分布.Logistic回歸因變量的取值僅有兩個(gè),不滿足正態(tài)分布。12/31/2022113、Logistic回歸模型令:y=1發(fā)病〔陽性、死亡、治愈等〕y=0未發(fā)病〔陰性、生存、未治愈等〕將發(fā)病的概率記為P,它與自變量x1,x2,…,xp之間的Logistic回歸模型為:可知,不發(fā)病的概率為:
12/31/202212
經(jīng)數(shù)學(xué)變換得:定義:為Logistic變換,即:
12/31/202213
4、回歸系數(shù)βi的意義流行病學(xué)的常用指標(biāo)優(yōu)勢比〔oddsratio,OR)或稱比值比,定義為:暴露人群發(fā)病優(yōu)勢與非暴露人群發(fā)病優(yōu)勢之比。即Xi的優(yōu)勢比為:12/31/202214故對于樣本資料OR=exp()95%置信區(qū)間為:可見是影響因素Xi增加一個(gè)單位所引起的對數(shù)優(yōu)勢的增量,反映了其對Y作用大小。如果要比較不同因素對Y作用大小,需要消除變量量綱的影響,為此計(jì)算標(biāo)準(zhǔn)化回歸系數(shù)12/31/202215〔1〕回歸方程的假設(shè)檢驗(yàn)H0:所有H1:某個(gè)計(jì)算統(tǒng)計(jì)量為:G=-2lnL,服從自由度等于n-p的分布〔2〕回歸系數(shù)的假設(shè)檢驗(yàn)H0:H1:計(jì)算統(tǒng)計(jì)量為:Wald,自由度等于1。12/31/202216〔二〕Logistic回歸類型及其實(shí)例分析
1、非條件Logistic回歸當(dāng)研究設(shè)計(jì)為隊(duì)列研究、橫斷面研究或成組病例對照研究時(shí),可以用非條件Logistic回歸。12/31/202217實(shí)例1
某研究者調(diào)查了30名成年人,記錄了同肺癌發(fā)病的有關(guān)因素情況,數(shù)據(jù)見表4。其中是否患病中,‘0’代表否,‘1’代表是;性別中‘1’代表男,‘0’代表女;吸煙中‘1’代表吸煙,‘0’代表不吸煙;地區(qū)中,‘1’代表農(nóng)村,‘0’代表城市。試分析各因素與肺癌間的關(guān)系。12/31/202218
表5肺癌與危險(xiǎn)因素的調(diào)查分析例號是否患病性別吸煙年齡地區(qū)111030021014613000351………………30000261注:是否患病中,‘0’代表否,‘1’代表是。性別中‘1’代表男,‘0’代表女,吸煙中‘1’代表吸煙,‘0’代表不吸煙。地區(qū)中,‘1’代表農(nóng)村,‘0’代表城市。12/31/202219Datalog1;Infile’log1.dat’;-----------讀取數(shù)據(jù)Inputnyx1-x4@@;-----------指出變量Proclogistic;----------調(diào)logistic回歸模塊
modely=x1;run;-----------作單變量(x1)分析Proclogistic;modely=x2;run;Proclogistic;modely=x3;run;Proclogistic;modely=x4;run;Proclogistic;
modely=x1-x4;run;------------作多變量分析12/31/202220表6單因素Logistic回歸分析結(jié)果
模型號變量系數(shù)標(biāo)準(zhǔn)誤Wald卡方P值
1X11.70470.80064.53440.03322X22.56490.93647.50290.0062
結(jié)果說明,性別,吸煙,年齡三個(gè)因素都與肺癌有關(guān).由于在對某一因素進(jìn)行單因素分析時(shí)沒有控制其它因素的干擾,因此結(jié)果不可靠.12/31/202221表7多因素Logistic回歸分析結(jié)果變量系數(shù)標(biāo)準(zhǔn)誤Wald卡方P值INTERCPT-9.754.095.660.02X12.521.821.920.17X23.981.984.060.04X30.190.085.670.02X4-1.301.580.680.41
由上最大似然估計(jì)分析知因素X2(吸煙),X3(年齡)對肺癌的發(fā)生有顯著的影響。所得的回歸方程為:Logit(P)=-9.7544+2.5152X1+3.9849X2+0.1884X3-1.3037X4.12/31/202222SPSS操作步驟:Analyze-----Regression-----BinaryLogistic-----Dependent框(y)-----Covariates框〔x1,x2,…)------ok非條件Logistic回歸
SPSS操作步驟:12/31/20222312/31/20222412/31/202225結(jié)果說明,性別,吸煙,年齡三個(gè)因素都與肺癌有關(guān).由于在對某一因素進(jìn)行單因素分析時(shí)沒有控制其它因素的干擾,因此結(jié)果不可靠.單因素分析的結(jié)果12/31/202226多因素分析的結(jié)果12/31/20222712/31/202228
由上最大似然估計(jì)分析知因素X2(吸煙),X3(年齡)對肺癌的發(fā)生有影響。所得的回歸方程為:Logit(P)=-9.7544+2.5152X1+3.9849X2+0.1884X3-1.3037X4.12/31/202229配對設(shè)計(jì)的類型:1:1、1:m、n:m〔可采用分層COX模型來擬合〕。例如:某市調(diào)查三種生活因素與胃癌的關(guān)系,資料見表5。12/31/202230表5配對資料(1:1)對子號病例對照x1x2x3x1x2x3113010120311303012020…10222000注:X1蛋白質(zhì)攝入量,取值:0,1,2,3X2不良飲食習(xí)慣,取值:0,1,2,3X3精神狀況,取值:0,1,212/31/202231配對Logistic回歸SPSS操作步驟:Analyze-----Survival----COXRegression-----Time框〔outcome)-----Status框〔Status〕-----DefineEvent:Singlevalue1:continue-----Covariates框〔x1、x2、x3)-----Strata框〔id〕---Options---atlaststep------ok12/31/20223212/31/20223312/31/20223412/31/20223512/31/20223612/31/20223712/31/20223812/31/2022393、逐步Logistic回歸分析〔1〕向前法(forwardselection)開始方程中沒有變量,自變量由少到多一個(gè)一個(gè)引入回歸方程。按自變量對因變量的奉獻(xiàn)〔P值的大小〕由小到大依次挑選,變量入選的條件是其P值小于規(guī)定進(jìn)入方程的P界值Enter,缺省值P(0.05)。12/31/202240〔2〕后退法(backwardselection)開始變量都在方程中,然后按自變量因變量的奉獻(xiàn)〔P值的大小〕由大到小依次剔除,變量剔除的條件是其P值大于規(guī)定的剔除標(biāo)準(zhǔn)Remove,缺省值p(0.10)。
12/31/202241〔3〕逐步回歸法
逐步引入-剔除法〔stepwiseselection)
前進(jìn)逐步引入-剔除法是在前進(jìn)法的思想下,考慮剔除變量,因此有兩個(gè)p界值Enter,Remove。12/31/202242
無論是條件還是非條件Logistic回歸,在多變量分析時(shí)均可以采用逐步回歸方法,實(shí)現(xiàn)的方法是:在model后加選項(xiàng):/selection=forward、backward或stepwise再給出SLE,SLS的界值。調(diào)試法:P從大到小取值0.5,0.1,0.05…,一般實(shí)際用時(shí),SLE,SLS應(yīng)屢次選取調(diào)整12/31/202243解釋設(shè)第i個(gè)因素的回歸系數(shù)為bi,表示當(dāng)有多個(gè)自變量存在時(shí),其它自變量固定不變的情況下,自變量Xi每增加一個(gè)單位時(shí),所得到的優(yōu)勢比的自然對數(shù)。也就是其它自變量固定不變的情況下,自變量Xi每增加一個(gè)單位時(shí),影響因變量Y=0發(fā)生的倍數(shù)。當(dāng)bi>0時(shí),對應(yīng)的優(yōu)勢比(oddsratio,記為ORi〕:ORi=exp(bi)>1,說明該因素是危險(xiǎn)因素;當(dāng)bi<0時(shí),對應(yīng)的優(yōu)勢比ORi=exp(bi)<1,說明該因素是保護(hù)因素。
12/31/202244
Logistic逐步回歸結(jié)果
ParameterStandardWaldPr>RiskVariableDFEstimateErrorChi-SquareChi-SquareRatio
X211.22180.84102.11070.14633.393
采用Logistic逐步回歸:Proclogistic;modely=x1-x3/nointselection=stepwisesle=0.3sls=0.3;Run;12/31/202245
在本例中不良飲食習(xí)慣X2,取值:0、1,2、3,b=1.2218,OR=3.393,表示不良飲食習(xí)慣,每增加一個(gè)單位時(shí),發(fā)病的可能性提高3.393倍;精神狀況X3,取值:0、1、2,b=2.2947,OR=9.922,表示精神狀況不良影響發(fā)病,精神狀況每增加一個(gè)單位時(shí),發(fā)病的可能性提高9.922倍。12/31/202246SPSS無論是條件還是非條件Logistic回歸,在多變量分析時(shí)均可以采用逐步回歸方法,實(shí)現(xiàn)的方法是:在method后加選項(xiàng):Enter:所有變量一次全部進(jìn)入方程。Forward:逐步向前法Backward:后退法變量移出方程所采取的檢驗(yàn)方法:Conditional;LR;Ward(盡量不用)12/31/20224712/31/202248二分類Logistic回歸method中文名稱剔除依據(jù)Enter全部進(jìn)入Forward:conditional向前逐步條件參數(shù)估計(jì)似然比Forward:LR向前逐步最大偏似然估計(jì)似然比Forward:Wald向前逐步Wald統(tǒng)計(jì)量Backward:conditional向后逐步條件參數(shù)估計(jì)似然比Backward:LR向后逐步最大偏似然估計(jì)似然比Backward:Wald向后逐步Wald統(tǒng)計(jì)量12/31/202249SPSS軟件實(shí)現(xiàn)方法File→Open→相應(yīng)數(shù)據(jù)(已存在)→Analyze→Regression→BinaryLogistic→Dependent(y)→Covariates(自變量〕→Mothod〔逐步回歸方法〕→Specifymodel(單因素或多因素〕→save(欲保存的內(nèi)容〕→Options(輸出選項(xiàng)〕→OK12/31/2022504.Logistic回歸--Logistic回歸種類成組資料的非條件Logistic回歸配對資料的條件Logistic回歸兩分類反應(yīng)變量的Logistic回歸多分類有序反應(yīng)變量Logistic回歸多分類無序反應(yīng)變量Logistic回歸1:1配對資料的條件Logistic回歸1:m配對資料的條件Logistic回歸n:m配對資料的條件Logistic回歸Logistic回歸分析12/31/202251對于成組資料的非條件Logistic回歸〔1〕兩分類反響變量的Logistic回歸12/31/20225212/31/202253自變量分為以下情況:定量資料時(shí),直接計(jì)算;二值時(shí),化為0與1或1與2;有序多分類:有線性規(guī)律時(shí)連續(xù)賦值0,1,2,….無線性規(guī)律按無序多分類無序多分類:需要先轉(zhuǎn)換成n-1個(gè)啞變量,以啞變量進(jìn)行分析。
12/31/20225412/31/20225512/31/20225612/31/20225712/31/202258二分類Logistic回歸—多重比較的方法Indicator—第一類或最后一類為參照類,每一類與參照類比較Simple------除參照類外,每一類與參照類比較Difference-除第一類外,每一類與其前各類的平均效應(yīng)比較,有稱反HelmertHelmert----除最后一類外,每一類與其后各類的平均Repeated—相鄰兩類比較,除第一類外,每類與其前一比較Polynominal—正交多名義分類比較,該法假設(shè)每一分類都有相等的空間,僅適于數(shù)值變量Deviation—除參照類外,每一類與總效應(yīng)比較12/31/202259實(shí)踐案例據(jù)報(bào)道目前全世界每年的自殺率為10/10萬,我國自殺率為23/10萬,我國高校自殺率那么為2/10萬。為了了解當(dāng)代大學(xué)生綜合素質(zhì)現(xiàn)狀、為了進(jìn)行提高大學(xué)生綜合素質(zhì)的對策研究,利用中國現(xiàn)場統(tǒng)計(jì)研究會教育統(tǒng)計(jì)與管理專業(yè)學(xué)會設(shè)計(jì)的?中國大學(xué)生綜合素質(zhì)調(diào)查問卷?,采用分層整群抽樣,選擇了不同年級、不同性別、不同專業(yè)以及不同生源的醫(yī)學(xué)大學(xué)生554名的調(diào)查問卷,其中129人有過自殺的意念。應(yīng)用Logistic回歸分析,探討大學(xué)生有自殺意念的影響因素。12/31/202260部隊(duì)3所院校,1121份有效問卷、
地方3所院校1874份有效問卷。
表8各校有效問卷情況單位有效問卷份數(shù)軍隊(duì):北京軍醫(yī)學(xué)院554海軍工程大學(xué)450解放軍信息工程大學(xué)117地方:同濟(jì)醫(yī)學(xué)院778中國科技大學(xué)628廣西工學(xué)院46812/31/2022611.各工程的名稱及量化方法在?中國大學(xué)生綜合素質(zhì)調(diào)查問卷?中又增加的2個(gè)小題記為A01,A02。根本情況A共有21項(xiàng),分別記為A1,A2,…,A21。當(dāng)有的工程中又分為2項(xiàng)時(shí)再分別賦予不同的名稱,如A10父母親文化程度分為:父親文化程度A10.1、母親文化程度A10.2。其它工程的名稱以此類推。12/31/202262利用EXCEL將調(diào)查問卷各項(xiàng)進(jìn)行量化:有序的工程按照順序賦值0,1,2,……;兩分類無序工程賦值0和1;多項(xiàng)無序和多項(xiàng)選擇工程,根據(jù)例數(shù)多少進(jìn)行合并成兩項(xiàng)或引進(jìn)啞變量。去掉了幾項(xiàng)人數(shù)少或不容易量化的個(gè)別多項(xiàng)選擇題:A9.1父親職業(yè)、A9.2母親職業(yè)、B16參加WTO后大學(xué)生最應(yīng)具備的素質(zhì)、B17在當(dāng)代大學(xué)生中你認(rèn)為普遍欠缺的東西、C10.1對學(xué)習(xí)吃力的再答復(fù)、C19.1決定考研者進(jìn)一步需答復(fù)、C21.1-C21.3參與過科研或社會實(shí)踐者進(jìn)一步需答復(fù)的問題。最終確定的變量個(gè)數(shù)是:A類有22個(gè)、B類有17個(gè)、C類有38個(gè)、D類有32個(gè)、E類有20個(gè),總計(jì)129個(gè)變量。12/31/202263ModelFittingInformationandTestingGlobalNullHypothesisBETA=0InterceptInterceptandCriterionOnlyCovariatesChi-SquareforCovariatesAIC603.311624.229.SC607.6281181.144.-2LOGL601.311366.229235.082128DF(p=0.0001)Score..198.850128DF(p=0.0001)單因素Logistic回歸分析
12/31/202264AssociationofPredictedProbabilitiesandObservedResponses(54825pairs)c=0.89712/31/202265似然比2=235.082P=0.0001。一致性Concordant=89.6%,不和諧〔不一致〕=10.2%。按P<0.1,入選了24個(gè)變量。12/31/202266多因素非條件Logistic回歸分析結(jié)果
12/31/202267InterceptnterceptandCriterionOnlyCovariatesChi-SforCovariatesAIC603.311515.801.SC607.628563.290.-2LOGL601.311493.80110DF()Score..103.66910DF(p=0.0001)
12/31/202268
AnalysisofMaximumLikelihoodEstimates
ParameterStandardWaldPr>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度年福建省高校教師資格證之高等教育法規(guī)模擬預(yù)測參考題庫及答案
- 2023年工業(yè)涂料水性色漿資金申請報(bào)告
- 二年級數(shù)學(xué)計(jì)算題專項(xiàng)練習(xí)1000題匯編
- 航空航天在國防
- 單元寫作課程化實(shí)施路徑
- 貨幣信貸政策業(yè)務(wù)技能競賽活動(dòng)方案
- 領(lǐng)會落實(shí)《關(guān)于大力實(shí)施可再生能源替代行動(dòng)的指導(dǎo)意見》心得體會
- 2024年國際商品交易協(xié)議范本
- 2024金融中介協(xié)議模板指導(dǎo)手冊
- 2024指定物業(yè)企業(yè)職工用工協(xié)議
- 檢具校準(zhǔn)規(guī)程
- 供應(yīng)商審核檢查表(共6頁)
- 小學(xué) 漢語拼音字母描紅(A4打印)
- 小組合作學(xué)習(xí)方法指導(dǎo)(課堂PPT)
- 09輸煤系統(tǒng)拆除方案
- VC6.0編的“文件讀寫”的詳細(xì)操作步驟(兩種方式MFC和基于對話框)
- PHC預(yù)應(yīng)力管樁報(bào)價(jià)單(錘擊、靜壓)綜合報(bào)價(jià)表
- 沁園春·疊嶂西馳.中職課件電子教案
- [分享]疊合板支撐架專項(xiàng)施工方案
- 中級財(cái)務(wù)會計(jì)英文課程教學(xué)大綱
- 核醫(yī)學(xué)第1章核醫(yī)學(xué)物理基礎(chǔ)
評論
0/150
提交評論