十三、logistic回歸模型_第1頁(yè)
十三、logistic回歸模型_第2頁(yè)
十三、logistic回歸模型_第3頁(yè)
十三、logistic回歸模型_第4頁(yè)
十三、logistic回歸模型_第5頁(yè)
已閱讀5頁(yè),還剩51頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅v 內(nèi)容提要內(nèi)容提要非條件非條件logistic回歸回歸模型簡(jiǎn)介模型簡(jiǎn)介簡(jiǎn)單分析實(shí)例簡(jiǎn)單分析實(shí)例啞變量設(shè)置啞變量設(shè)置自變量的篩選方法與逐步回歸自變量的篩選方法與逐步回歸模型擬合效果與擬合優(yōu)度檢驗(yàn)?zāi)P蛿M合效果與擬合優(yōu)度檢驗(yàn)?zāi)P偷脑\斷與修正模型的診斷與修正條件條件logistic回歸回歸浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅對(duì)分類(lèi)變量的分析,當(dāng)考察的影響因素較少,且也為分類(lèi)對(duì)分類(lèi)變量的分析,當(dāng)考察的影響因素較少,且也為分類(lèi)變量時(shí),常用列聯(lián)表(變量時(shí),常用列聯(lián)表(Contingency Table)進(jìn)行整理

2、,)進(jìn)行整理,并用并用 2檢驗(yàn)或分層檢驗(yàn)或分層 2檢驗(yàn)進(jìn)行分析,但存在以下局限性:檢驗(yàn)進(jìn)行分析,但存在以下局限性: 無(wú)法描述其作用大小和方向,更不能考察各因素間是否無(wú)法描述其作用大小和方向,更不能考察各因素間是否有交互作用;有交互作用; 當(dāng)控制的分層因素較多時(shí),將導(dǎo)致檢驗(yàn)結(jié)果不可靠;當(dāng)控制的分層因素較多時(shí),將導(dǎo)致檢驗(yàn)結(jié)果不可靠; 2檢驗(yàn)無(wú)法對(duì)連續(xù)性自變量進(jìn)行分析檢驗(yàn)無(wú)法對(duì)連續(xù)性自變量進(jìn)行分析(致命缺陷)(致命缺陷)。模型簡(jiǎn)介模型簡(jiǎn)介浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅logistic回歸模型適合于應(yīng)變量為二項(xiàng)分類(lèi)的資料,回歸模型適合于應(yīng)變量為二項(xiàng)分類(lèi)的資料,在醫(yī)學(xué)研究領(lǐng)域中的應(yīng)用廣泛。

3、如流行病病因?qū)W研在醫(yī)學(xué)研究領(lǐng)域中的應(yīng)用廣泛。如流行病病因?qū)W研究(包括隊(duì)列研究、病例對(duì)照研究、橫斷面研究究(包括隊(duì)列研究、病例對(duì)照研究、橫斷面研究等)、臨床療效研究(如療效與治療方法、患病輕等)、臨床療效研究(如療效與治療方法、患病輕中重等因素關(guān)系)、衛(wèi)生服務(wù)研究(如是否就診與中重等因素關(guān)系)、衛(wèi)生服務(wù)研究(如是否就診與性別、年齡、文化程度的關(guān)系)等等。性別、年齡、文化程度的關(guān)系)等等。模型簡(jiǎn)介模型簡(jiǎn)介浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅011log()ppit PXX011011exp()1exp()ppppXXPXX011111exp()ppPXX模型簡(jiǎn)介模型簡(jiǎn)介v logistic

4、回歸模型:回歸模型:浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅 反應(yīng)變量為二分類(lèi)變量或某事件的發(fā)生率;反應(yīng)變量為二分類(lèi)變量或某事件的發(fā)生率; 自變量與自變量與logit(P)之間為線(xiàn)性關(guān)系;)之間為線(xiàn)性關(guān)系; 殘差合計(jì)為殘差合計(jì)為0,且服從二項(xiàng)分布;,且服從二項(xiàng)分布; 各觀測(cè)間相互獨(dú)立。各觀測(cè)間相互獨(dú)立。模型簡(jiǎn)介模型簡(jiǎn)介適用條件適用條件v logistic logistic回歸模型應(yīng)該使用最大似然法來(lái)解決方程的回歸模型應(yīng)該使用最大似然法來(lái)解決方程的估計(jì)和檢驗(yàn)問(wèn)題,不應(yīng)當(dāng)使用以前的最小二乘法進(jìn)行參數(shù)估計(jì)和檢驗(yàn)問(wèn)題,不應(yīng)當(dāng)使用以前的最小二乘法進(jìn)行參數(shù)估計(jì)。估計(jì)。浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教

5、研室 沈毅例例1 某醫(yī)師希望研究病人的年齡某醫(yī)師希望研究病人的年齡age、性別、性別sex(0為女性、為女性、1為男性)、心電圖檢驗(yàn)是否異常為男性)、心電圖檢驗(yàn)是否異常ecg(ST段壓低、段壓低、0為正常、為正常、1為輕度異常、為輕度異常、2為為重度異常)與冠心病重度異常)與冠心病ca是否有關(guān),數(shù)據(jù)見(jiàn)是否有關(guān),數(shù)據(jù)見(jiàn)logistic_binary.sav。簡(jiǎn)單分析實(shí)例簡(jiǎn)單分析實(shí)例浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅簡(jiǎn)單分析實(shí)例簡(jiǎn)單分析實(shí)例浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅選入應(yīng)變量選入應(yīng)變量選入自選入自變量變量簡(jiǎn)單分析實(shí)例簡(jiǎn)單分析實(shí)例浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈

6、毅Dependent Variable Encoding01Original Value未患病患病Internal Value簡(jiǎn)單分析實(shí)例簡(jiǎn)單分析實(shí)例結(jié)果分析結(jié)果分析v 此表為應(yīng)變量取值水平編碼,此表為應(yīng)變量取值水平編碼,SPSSSPSS默認(rèn)取值水平默認(rèn)取值水平高的為陽(yáng)性結(jié)果。高的為陽(yáng)性結(jié)果。浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅簡(jiǎn)單分析實(shí)例簡(jiǎn)單分析實(shí)例結(jié)果分析結(jié)果分析v 本表輸出當(dāng)前模型的本表輸出當(dāng)前模型的-2log-2log(似然值)和兩個(gè)偽決(似然值)和兩個(gè)偽決定系數(shù),但對(duì)于定系數(shù),但對(duì)于logisticlogistic回歸而言,通常看見(jiàn)的偽決回歸而言,通常看見(jiàn)的偽決定系數(shù)不像線(xiàn)性

7、回歸模型中的決定系數(shù)那么大。定系數(shù)不像線(xiàn)性回歸模型中的決定系數(shù)那么大。Model Summary86.811a.237.316Step1-2 Log likelihoodCox & Snell R SquareNagelkerke R SquareEstimation terminated at iteration number 5 because parameter estimateschanged by less than .001.a. 浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅Variables in the Equation1.356.5466.1621.0133.882.

8、873.3845.1621.0232.395.093.0357.0001.0081.097-5.6421.8069.7571.002.004sexecgageConstantStep1aBS.E.WalddfSig.Exp(B)Variable(s) entered on step 1: sex, ecg, age.a. 簡(jiǎn)單分析實(shí)例簡(jiǎn)單分析實(shí)例結(jié)果分析結(jié)果分析v 此表輸出模型中的各自變量的偏回歸系數(shù)及其標(biāo)準(zhǔn)此表輸出模型中的各自變量的偏回歸系數(shù)及其標(biāo)準(zhǔn)誤、誤、WaldWald 2 2、自由度、自由度、P P 值、值、OROR值(即值(即expexp(B B)。)。浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)

9、學(xué)教研室 沈毅啞變量設(shè)置啞變量設(shè)置在回歸模型中,回歸系數(shù)在回歸模型中,回歸系數(shù)b b表示其他自變量不變,表示其他自變量不變,x x每改變一個(gè)單位時(shí),所預(yù)測(cè)的每改變一個(gè)單位時(shí),所預(yù)測(cè)的y y的平均變化量,當(dāng)?shù)钠骄兓浚?dāng)x x為連續(xù)性變量時(shí),這樣解釋沒(méi)有問(wèn)題,二分類(lèi)變量為連續(xù)性變量時(shí),這樣解釋沒(méi)有問(wèn)題,二分類(lèi)變量由于只存在兩個(gè)類(lèi)別間的比較,也可以對(duì)系數(shù)得到由于只存在兩個(gè)類(lèi)別間的比較,也可以對(duì)系數(shù)得到很好的解釋。但是當(dāng)很好的解釋。但是當(dāng)x x為多分類(lèi)變量時(shí),僅擬合一為多分類(lèi)變量時(shí),僅擬合一個(gè)回歸系數(shù)就不太合適了,此時(shí)需要使用個(gè)回歸系數(shù)就不太合適了,此時(shí)需要使用啞變量啞變量(dummy varia

10、bledummy variable)方式對(duì)模型進(jìn)行定義。)方式對(duì)模型進(jìn)行定義。浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅例例2 Hosmer 和和Lemeshow于于1989年研究了低出生體年研究了低出生體重嬰兒的影響因素,結(jié)果變量為是否娩出低出生體重嬰兒的影響因素,結(jié)果變量為是否娩出低出生體重兒(變量名為重兒(變量名為L(zhǎng)OW,1表示低出生體重兒,表示低出生體重兒,0表示表示非低出生體重兒),考慮的自變量有產(chǎn)婦妊娠前體非低出生體重兒),考慮的自變量有產(chǎn)婦妊娠前體重、產(chǎn)婦年齡、種族、是否吸煙、早產(chǎn)次數(shù)、是否重、產(chǎn)婦年齡、種族、是否吸煙、早產(chǎn)次數(shù)、是否患高血壓等。(數(shù)據(jù)文件見(jiàn):患高血壓等。(數(shù)據(jù)

11、文件見(jiàn):logistic_step.sav。)。)啞變量設(shè)置啞變量設(shè)置浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅啞變量設(shè)置啞變量設(shè)置浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅啞變量設(shè)置啞變量設(shè)置浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅選入無(wú)序多選入無(wú)序多分類(lèi)變量分類(lèi)變量設(shè)置參照水設(shè)置參照水平平啞變量設(shè)置啞變量設(shè)置浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅Categorical Variables Codings961.000.00026.0001.00067.000.000白人黑人其他種族種族Frequency(1)(2)Parameter coding啞變量設(shè)置啞變量設(shè)置結(jié)果分析結(jié)

12、果分析v 啞變量(種族)的設(shè)置情況啞變量(種族)的設(shè)置情況浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅Variables in the Equation-.025.037.4831.487.975-.014.0074.0901.043.9867.1462.028-.908.4374.3261.038.403.329.534.3801.5371.390.927.3995.4141.0202.528.552.3452.5621.1091.7361.763.6896.5411.0115.831.649.4681.9251.1651.913.032.171.0351.8511.0331.1431.08

13、71.1041.2933.135agelwtracerace(1)race(2)smokeptlhtuiftvConstantStep1aBS.E.WalddfSig.Exp(B)Variable(s) entered on step 1: age, lwt, race, smoke, ptl, ht, ui, ftv.a. 啞變量設(shè)置啞變量設(shè)置v 白人低出生體重的風(fēng)險(xiǎn)較低,而黑人風(fēng)險(xiǎn)較高。白人低出生體重的風(fēng)險(xiǎn)較低,而黑人風(fēng)險(xiǎn)較高。結(jié)果分析結(jié)果分析浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅 參照水平最好要有實(shí)際意義,不推薦使用其他作為參照;參照水平最好要有實(shí)際意義,不推薦使用其他作為參照;

14、參照水平組要有一定的頻數(shù)作保證,應(yīng)不少于參照水平組要有一定的頻數(shù)作保證,應(yīng)不少于30或或50例;例; 對(duì)有序自變量的分析:對(duì)有序自變量的分析: 從專(zhuān)業(yè)出發(fā)確定;從專(zhuān)業(yè)出發(fā)確定; 分別以啞變量和連續(xù)性變量的方式引入模型進(jìn)行比較分別以啞變量和連續(xù)性變量的方式引入模型進(jìn)行比較后確定。后確定。啞變量設(shè)置啞變量設(shè)置v 啞變量設(shè)置應(yīng)該注意的問(wèn)題啞變量設(shè)置應(yīng)該注意的問(wèn)題浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅 Forward:Conditional (最可靠)(最可靠) Forward:LR Forward:Wald (應(yīng)當(dāng)慎用)(應(yīng)當(dāng)慎用) Backward: Conditional (最可靠)(最可

15、靠) Backward:LR Backward:Wald(應(yīng)當(dāng)慎用)(應(yīng)當(dāng)慎用)v 6 6 種篩選自變量的方法種篩選自變量的方法逐步回歸逐步回歸浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅例例3 仍以例仍以例2的數(shù)據(jù)的數(shù)據(jù)為例,演示如何在為例,演示如何在SPSS中實(shí)現(xiàn)逐步中實(shí)現(xiàn)逐步logistic回歸分析。回歸分析。逐步回歸逐步回歸浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅選擇其中一選擇其中一種逐步法種逐步法逐步回歸逐步回歸浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅Model Summary227.893a.035.050223.583b.057.080217.220b.088.124St

16、ep123-2 Log likelihoodCox & Snell R SquareNagelkerke R SquareEstimation terminated at iteration number 3 because parameter estimateschanged by less than .001.a. Estimation terminated at iteration number 4 because parameter estimateschanged by less than .001.b. 逐步回歸逐步回歸v 給出了模型擬合過(guò)程中每一步的給出了模型擬合過(guò)程中每

17、一步的-2log-2log(L L)及)及兩個(gè)偽決定系數(shù)。兩個(gè)偽決定系數(shù)。結(jié)果分析結(jié)果分析浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅Variables in the Equation.802.3176.3911.0112.230-.964.17530.3701.000.381.823.3186.6831.0102.2771.272.6164.2701.0393.569-1.062.18433.2241.000.346-.015.0075.5841.018.985.728.3274.9611.0262.0711.789.6946.6391.0105.986.893.8291.1581.2822

18、.441ptlConstantStep1aptlhtConstantStep2blwtptlhtConstantStep3cBS.E.WalddfSig.Exp(B)Variable(s) entered on step 1: ptl.a. Variable(s) entered on step 2: ht.b. Variable(s) entered on step 3: lwt.c. 逐步回歸逐步回歸結(jié)果分析結(jié)果分析浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅Variables not in the Equation3.1491.0763.3401.0685.3592.0695.0281.

19、0252.0561.1523.1641.0754.7221.0302.1621.141.7531.38522.8588.004agelwtracerace(1)race(2)smokehtuiftvVariablesOverall StatisticsStep1ScoredfSig.逐步回歸逐步回歸結(jié)果分析結(jié)果分析v 輸出了尚不在模型中的自變量是否能被引入的輸出了尚不在模型中的自變量是否能被引入的ScoreScore檢驗(yàn)結(jié)果,這里只給出第一步的結(jié)果。檢驗(yàn)結(jié)果,這里只給出第一步的結(jié)果。浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅對(duì)數(shù)似然值與偽決定系數(shù)對(duì)數(shù)似然值與偽決定系數(shù)模型預(yù)測(cè)正確率模型預(yù)測(cè)正

20、確率ROCROC曲線(xiàn)曲線(xiàn)模型擬合效果檢驗(yàn)?zāi)P蛿M合效果檢驗(yàn)v 擬合效果判斷指標(biāo):擬合效果判斷指標(biāo):浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅-2 倍對(duì)數(shù)似然值表示模型的擬合效果,其值越小,越接近于倍對(duì)數(shù)似然值表示模型的擬合效果,其值越小,越接近于0,說(shuō)明模型擬合效果越好。,說(shuō)明模型擬合效果越好。但是,當(dāng)自變量中存在缺失值時(shí),因?yàn)橐话憬y(tǒng)計(jì)軟件在進(jìn)行但是,當(dāng)自變量中存在缺失值時(shí),因?yàn)橐话憬y(tǒng)計(jì)軟件在進(jìn)行計(jì)算時(shí)會(huì)把含有缺失值的記錄予以剔除,不參與統(tǒng)計(jì)分析,計(jì)算時(shí)會(huì)把含有缺失值的記錄予以剔除,不參與統(tǒng)計(jì)分析,此時(shí)不能用此時(shí)不能用-2log likelihood 對(duì)不同模型的擬合效果進(jìn)行比對(duì)不同模型的擬合

21、效果進(jìn)行比較。較。模型擬合效果檢驗(yàn)?zāi)P蛿M合效果檢驗(yàn)浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅Classification Tablea123794.6471220.371.4Observed正常低出生體重低出生體重兒Overall PercentageStep 3正常低出生體重低出生體重兒PercentageCorrectPredictedThe cut value is .500a. 例例3進(jìn)行逐步回歸的第三步(進(jìn)行逐步回歸的第三步(step3)輸出以上結(jié)果,預(yù)測(cè))輸出以上結(jié)果,預(yù)測(cè)正確的記錄占正確的記錄占71.4。模型擬合效果檢驗(yàn)?zāi)P蛿M合效果檢驗(yàn)浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈

22、毅Save子對(duì)話(huà)框子對(duì)話(huà)框模型擬合效果檢驗(yàn)?zāi)P蛿M合效果檢驗(yàn)v先保存研究對(duì)先保存研究對(duì)象的預(yù)測(cè)概率。象的預(yù)測(cè)概率。浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅模型擬合效果檢驗(yàn)?zāi)P蛿M合效果檢驗(yàn)浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅模型擬合效果檢驗(yàn)?zāi)P蛿M合效果檢驗(yàn)浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅模型擬合效果檢驗(yàn)?zāi)P蛿M合效果檢驗(yàn)v 這就是這就是ROCROC曲線(xiàn),曲線(xiàn),預(yù)測(cè)效果最佳時(shí),曲預(yù)測(cè)效果最佳時(shí),曲線(xiàn)應(yīng)該從左下角垂直線(xiàn)應(yīng)該從左下角垂直上升至頂,然后水平上升至頂,然后水平向右延伸到右上角。向右延伸到右上角。結(jié)果分析結(jié)果分析浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅Area Und

23、er the CurveTest Result Variable(s): Predicted probability.708.043.000.624.792AreaStd. ErroraAsymptotic Sig.bLower BoundUpper BoundAsymptotic 95% Confidence IntervalThe test result variable(s): Predicted probability has at least one tie between the positiveactual state group and the negative actual

24、state group. Statistics may be biased.Under the nonparametric assumptiona. Null hypothesis: true area = 0.5b. 模型擬合效果檢驗(yàn)?zāi)P蛿M合效果檢驗(yàn)結(jié)果分析結(jié)果分析v 本表是對(duì)本表是對(duì)ROCROC曲線(xiàn)下面積計(jì)算的結(jié)果,可見(jiàn)曲線(xiàn)下面曲線(xiàn)下面積計(jì)算的結(jié)果,可見(jiàn)曲線(xiàn)下面積為積為0.7080.708,9595可信區(qū)間為可信區(qū)間為0.6240.624 0.7920.792。浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅模型擬合優(yōu)度檢驗(yàn)(模型擬合優(yōu)度檢驗(yàn)(Test of Goodness Fit ):):

25、考察當(dāng)前模型是否可以進(jìn)一步改善,檢驗(yàn)當(dāng)前模型與飽考察當(dāng)前模型是否可以進(jìn)一步改善,檢驗(yàn)當(dāng)前模型與飽和模型的預(yù)測(cè)效果之差是否有統(tǒng)計(jì)學(xué)意義。和模型的預(yù)測(cè)效果之差是否有統(tǒng)計(jì)學(xué)意義。擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅 Pearson 和和Deviance 擬合優(yōu)度檢驗(yàn):擬合優(yōu)度檢驗(yàn): 當(dāng)自變量很多,或包含連續(xù)性自變量時(shí),不可以用這兩種方法。當(dāng)自變量很多,或包含連續(xù)性自變量時(shí),不可以用這兩種方法。 似然比檢驗(yàn):似然比檢驗(yàn): 主要用于考察飽和模型是否可以進(jìn)一步簡(jiǎn)化。主要用于考察飽和模型是否可以進(jìn)一步簡(jiǎn)化。 HosmerLemeshow檢驗(yàn)檢驗(yàn): 通常用于自變量很多,或包含連

26、續(xù)性自變量的情況。通常用于自變量很多,或包含連續(xù)性自變量的情況。擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)v 模型擬合優(yōu)度檢驗(yàn)的常用方法:模型擬合優(yōu)度檢驗(yàn)的常用方法:浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅點(diǎn)擊主對(duì)話(huà)框中的點(diǎn)擊主對(duì)話(huà)框中的options按鈕,出現(xiàn)如下所示的對(duì)話(huà)框:按鈕,出現(xiàn)如下所示的對(duì)話(huà)框:擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅Hosmer and Lemeshow Test9.9798.266Step3Chi-squaredfSig.Contingency Table for Hosmer and Lemeshow Test1616.69732.3031915

27、15.30343.697191817.46155.539231613.21524.785181513.70845.292191512.68335.317181112.31075.690181112.27986.72119610.531138.4691975.8121011.1881712345678910Step3ObservedExpected低出生體重兒 = 正常ObservedExpected低出生體重兒 = 低出生體重Total擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)結(jié)果分析結(jié)果分析浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅用用save子對(duì)子對(duì)話(huà)框可以保存各話(huà)框可以保存各種殘差;種殘差;如果殘差的絕

28、如果殘差的絕對(duì)值大于對(duì)值大于2,提,提示該記錄可能是示該記錄可能是異常點(diǎn)。異常點(diǎn)。Save子對(duì)話(huà)框子對(duì)話(huà)框模型的診斷與修正模型的診斷與修正v 殘差分析殘差分析浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅多重共線(xiàn)性的對(duì)偏回歸系數(shù)的影響與線(xiàn)性回歸模型中的表現(xiàn)多重共線(xiàn)性的對(duì)偏回歸系數(shù)的影響與線(xiàn)性回歸模型中的表現(xiàn)一致,如增加或刪除一條記錄,模型中偏回歸系數(shù)值發(fā)生較一致,如增加或刪除一條記錄,模型中偏回歸系數(shù)值發(fā)生較大變化,專(zhuān)業(yè)上認(rèn)為有意義的因素?zé)o統(tǒng)計(jì)學(xué)意義等等。大變化,專(zhuān)業(yè)上認(rèn)為有意義的因素?zé)o統(tǒng)計(jì)學(xué)意義等等。如果在進(jìn)行如果在進(jìn)行l(wèi)ogisticlogistic模型分析中,尤其是在向模型中引入交模型分析

29、中,尤其是在向模型中引入交互作用項(xiàng)時(shí)出現(xiàn)了回歸結(jié)果反?,F(xiàn)象,則自變量之間的多重互作用項(xiàng)時(shí)出現(xiàn)了回歸結(jié)果反?,F(xiàn)象,則自變量之間的多重共線(xiàn)性是需要排除的一種可能。共線(xiàn)性是需要排除的一種可能。模型的診斷與修正模型的診斷與修正v 多重共線(xiàn)性的識(shí)別:多重共線(xiàn)性的識(shí)別:浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅目前目前SPSSSPSS的的logisticlogistic過(guò)程中尚沒(méi)有關(guān)于多重共線(xiàn)性過(guò)程中尚沒(méi)有關(guān)于多重共線(xiàn)性診斷的結(jié)果輸出,代替方法之一是運(yùn)用相同的反應(yīng)診斷的結(jié)果輸出,代替方法之一是運(yùn)用相同的反應(yīng)變量與自變量,擬合線(xiàn)性回歸模型,并進(jìn)行相應(yīng)的變量與自變量,擬合線(xiàn)性回歸模型,并進(jìn)行相應(yīng)的共線(xiàn)性診斷

30、。共線(xiàn)性診斷。模型的診斷與修正模型的診斷與修正v 多重共線(xiàn)性的識(shí)別:多重共線(xiàn)性的識(shí)別:浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅匹配設(shè)計(jì)匹配設(shè)計(jì)(matched design)是在設(shè)計(jì)階段控制混雜因素的)是在設(shè)計(jì)階段控制混雜因素的一種方法。當(dāng)?shù)玫揭幻芯坎±螅x擇一名或多名非病例一種方法。當(dāng)?shù)玫揭幻芯坎±螅x擇一名或多名非病例作為對(duì)照,選擇相應(yīng)對(duì)照的條件是:某些需要控制的混雜因作為對(duì)照,選擇相應(yīng)對(duì)照的條件是:某些需要控制的混雜因素與該病例之間相同或相似,從而形成一個(gè)匹配的對(duì)子。一素與該病例之間相同或相似,從而形成一個(gè)匹配的對(duì)子。一個(gè)匹配的對(duì)子可以只有個(gè)匹配的對(duì)子可以只有 1個(gè)病例和個(gè)病

31、例和1個(gè)對(duì)照,稱(chēng)個(gè)對(duì)照,稱(chēng)1:1匹配;匹配;當(dāng)病例很罕見(jiàn)時(shí),常采用當(dāng)病例很罕見(jiàn)時(shí),常采用 1個(gè)病例,多個(gè)對(duì)照,此時(shí)稱(chēng)為個(gè)病例,多個(gè)對(duì)照,此時(shí)稱(chēng)為1:m匹配,常用的匹配,常用的 m一般小于等于一般小于等于4,不同的對(duì)子,不同的對(duì)子,m可以不同;可以不同;還可設(shè)計(jì)還可設(shè)計(jì)m:n匹配,即不同對(duì)子的病例與對(duì)照個(gè)數(shù)均可不同,匹配,即不同對(duì)子的病例與對(duì)照個(gè)數(shù)均可不同,這樣的設(shè)計(jì)增加了收集資料的靈活性。這樣的設(shè)計(jì)增加了收集資料的靈活性。條件條件logistic回歸回歸簡(jiǎn)介簡(jiǎn)介浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅對(duì)于這類(lèi)匹配設(shè)計(jì)資料,如果采用以上介紹的非條件對(duì)于這類(lèi)匹配設(shè)計(jì)資料,如果采用以上介紹的非條

32、件 logisticlogistic回歸方法,將會(huì)降低檢驗(yàn)效能。而應(yīng)當(dāng)采用回歸方法,將會(huì)降低檢驗(yàn)效能。而應(yīng)當(dāng)采用條件條件logisticlogistic回歸模型回歸模型(conditional logistic conditional logistic regression modelregression model)又稱(chēng)配對(duì)又稱(chēng)配對(duì)logisticlogistic回歸模型進(jìn)行回歸模型進(jìn)行分析。分析。條件條件logistic回歸回歸簡(jiǎn)介簡(jiǎn)介浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅 用變量差值擬合:用變量差值擬合:只適用于只適用于1:1配對(duì)的情況,用配對(duì)的情況,用Multinomial lo

33、gistic 過(guò)程實(shí)現(xiàn);過(guò)程實(shí)現(xiàn); 用分層用分層Cox模型擬合:適用范圍非常廣。模型擬合:適用范圍非常廣。條件條件logistic回歸回歸v SPSS SPSS中的擬合方法:中的擬合方法:浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅例例4 Mack等人預(yù)考察服用雌激素與患子宮內(nèi)膜癌的關(guān)等人預(yù)考察服用雌激素與患子宮內(nèi)膜癌的關(guān)系,對(duì)退休居住在社區(qū)的婦女進(jìn)行病例對(duì)照研究。除服系,對(duì)退休居住在社區(qū)的婦女進(jìn)行病例對(duì)照研究。除服用雌激素以外,研究的自變量還包括肥胖、膽囊病史、用雌激素以外,研究的自變量還包括肥胖、膽囊病史、服用其他非雌激素藥物。數(shù)據(jù)見(jiàn)服用其他非雌激素藥物。數(shù)據(jù)見(jiàn)1_1_logistic.s

34、av。條件條件logistic回歸回歸實(shí)例分析實(shí)例分析浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅compute case = case1 - pute age = age1 - pute est = est1 - pute gall = gall1 - pute nonest = nonest1 -nonest2.execute.由于本例是由于本例是1:1配對(duì),可以使用變量差值方式加以擬合。配對(duì),可以使用變量差值方式加以擬合。首先運(yùn)用首先運(yùn)用compute過(guò)程產(chǎn)生配對(duì)過(guò)程產(chǎn)生配對(duì)logistic回歸的分析變量,回歸的分析變量,或用以下程序予以實(shí)現(xiàn):或用以下程序予以實(shí)現(xiàn):條件條件logisti

35、c回歸回歸實(shí)例分析實(shí)例分析浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅條件條件logistic回歸回歸實(shí)例分析實(shí)例分析浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅條件條件logistic回歸回歸實(shí)例分析實(shí)例分析v 把自變量全部把自變量全部選入選入CovariateCovariate框,框,不能選入不能選入factorfactor框!框!浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅默認(rèn)情況下該復(fù)默認(rèn)情況下該復(fù)選框選中,應(yīng)該選框選中,應(yīng)該去除該復(fù)選框去除該復(fù)選框條件條件logistic回歸回歸實(shí)例分析實(shí)例分析浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅WarningsThe dependent v

36、ariable has only one valid value. A conditional logistic regressionmodel will be fitted.條件條件logistic回歸回歸結(jié)果分析結(jié)果分析v 這是系統(tǒng)給出的警告,說(shuō)明由于反應(yīng)變量只有一這是系統(tǒng)給出的警告,說(shuō)明由于反應(yīng)變量只有一個(gè)水平,因此個(gè)水平,因此SPSSSPSS將擬合條件將擬合條件logisticlogistic回歸模型?;貧w模型。浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅Model Fitting Information87.33753.17834.1594.000ModelNullFinal-2 L

37、og LikelihoodModel Fitting CriteriaChi-SquaredfSig.Likelihood Ratio Tests結(jié)果分析結(jié)果分析條件條件logistic回歸回歸v 對(duì)模型中所有對(duì)模型中所有偏回歸系數(shù)是否均為偏回歸系數(shù)是否均為0進(jìn)行似然比進(jìn)行似然比檢驗(yàn),結(jié)果說(shuō)明他們不全為檢驗(yàn),結(jié)果說(shuō)明他們不全為0。浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅Pseudo R-Square.419.558.391Cox and SnellNagelkerkeMcFadden結(jié)果分析結(jié)果分析條件條件logistic回歸回歸v 輸出了輸出了三種三種偽決定系數(shù),本偽決定系數(shù),本例的偽決定系數(shù)例的偽決定系數(shù)還比較大。還比較大。浙江大學(xué)醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 沈毅Likelihood Ratio Tests53.658.4801.48872.01318.8361.00058.7705.5921.01853.279.1021.750Effectageestgallnonest-2 Log Likelihood ofReduced ModelMode

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論