應(yīng)用統(tǒng)計(jì)學(xué)回歸模型_第1頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)回歸模型_第2頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)回歸模型_第3頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)回歸模型_第4頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)回歸模型_第5頁(yè)
已閱讀5頁(yè),還剩50頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

應(yīng)用統(tǒng)計(jì)學(xué)回歸模型第1頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月

內(nèi)容提要非條件logistic回歸模型簡(jiǎn)介簡(jiǎn)單分析實(shí)例啞變量設(shè)置自變量的篩選方法與逐步回歸模型擬合效果與擬合優(yōu)度檢驗(yàn)?zāi)P偷脑\斷與修正條件logistic回歸第2頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月對(duì)分類變量的分析,當(dāng)考察的影響因素較少,且也為分類變量時(shí),常用列聯(lián)表(ContingencyTable)進(jìn)行整理,并用2檢驗(yàn)或分層2檢驗(yàn)進(jìn)行分析,但存在以下局限性:無法描述其作用大小和方向,更不能考察各因素間是否有交互作用;當(dāng)控制的分層因素較多時(shí),將導(dǎo)致檢驗(yàn)結(jié)果不可靠;2檢驗(yàn)無法對(duì)連續(xù)性自變量進(jìn)行分析(致命缺陷)。模型簡(jiǎn)介第3頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月logistic回歸模型適合于應(yīng)變量為二項(xiàng)分類的資料,在醫(yī)學(xué)研究領(lǐng)域中的應(yīng)用廣泛。如流行病病因?qū)W研究(包括隊(duì)列研究、病例對(duì)照研究、橫斷面研究等)、臨床療效研究(如療效與治療方法、患病輕中重等因素關(guān)系)、衛(wèi)生服務(wù)研究(如是否就診與性別、年齡、文化程度的關(guān)系)等等。模型簡(jiǎn)介第4頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月模型簡(jiǎn)介logistic回歸模型:第5頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月

反應(yīng)變量為二分類變量或某事件的發(fā)生率;自變量與logit(P)之間為線性關(guān)系;殘差合計(jì)為0,且服從二項(xiàng)分布;各觀測(cè)間相互獨(dú)立。模型簡(jiǎn)介-適用條件logistic回歸模型應(yīng)該使用最大似然法來解決方程的估計(jì)和檢驗(yàn)問題,不應(yīng)當(dāng)使用以前的最小二乘法進(jìn)行參數(shù)估計(jì)。第6頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月例1

某醫(yī)師希望研究病人的年齡age、性別sex(0為女性、1為男性)、心電圖檢驗(yàn)是否異常ecg(ST段壓低、0為正常、1為輕度異常、2為重度異常)與冠心病ca是否有關(guān),數(shù)據(jù)見logistic_binary.sav。簡(jiǎn)單分析實(shí)例第7頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月簡(jiǎn)單分析實(shí)例第8頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月選入應(yīng)變量選入自變量簡(jiǎn)單分析實(shí)例第9頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月簡(jiǎn)單分析實(shí)例結(jié)果分析

此表為應(yīng)變量取值水平編碼,SPSS默認(rèn)取值水平高的為陽(yáng)性結(jié)果。第10頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月簡(jiǎn)單分析實(shí)例結(jié)果分析

本表輸出當(dāng)前模型的-2log(似然值)和兩個(gè)偽決定系數(shù),但對(duì)于logistic回歸而言,通??匆姷膫螞Q定系數(shù)不像線性回歸模型中的決定系數(shù)那么大。第11頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月簡(jiǎn)單分析實(shí)例結(jié)果分析

此表輸出模型中的各自變量的偏回歸系數(shù)及其標(biāo)準(zhǔn)誤、Wald2、自由度、P值、OR值(即exp(B))。第12頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月啞變量設(shè)置在回歸模型中,回歸系數(shù)b表示其他自變量不變,x每改變一個(gè)單位時(shí),所預(yù)測(cè)的y的平均變化量,當(dāng)x為連續(xù)性變量時(shí),這樣解釋沒有問題,二分類變量由于只存在兩個(gè)類別間的比較,也可以對(duì)系數(shù)得到很好的解釋。但是當(dāng)x為多分類變量時(shí),僅擬合一個(gè)回歸系數(shù)就不太合適了,此時(shí)需要使用啞變量(dummyvariable)方式對(duì)模型進(jìn)行定義。第13頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月例2Hosmer和Lemeshow于1989年研究了低出生體重嬰兒的影響因素,結(jié)果變量為是否娩出低出生體重兒(變量名為L(zhǎng)OW,1表示低出生體重兒,0表示非低出生體重兒),考慮的自變量有產(chǎn)婦妊娠前體重、產(chǎn)婦年齡、種族、是否吸煙、早產(chǎn)次數(shù)、是否患高血壓等。(數(shù)據(jù)文件見:logistic_step.sav。)啞變量設(shè)置第14頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月啞變量設(shè)置第15頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月啞變量設(shè)置第16頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月選入無序多分類變量設(shè)置參照水平啞變量設(shè)置第17頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月啞變量設(shè)置結(jié)果分析

啞變量(種族)的設(shè)置情況第18頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月啞變量設(shè)置

白人低出生體重的風(fēng)險(xiǎn)較低,而黑人風(fēng)險(xiǎn)較高。結(jié)果分析第19頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月

參照水平最好要有實(shí)際意義,不推薦使用其他作為參照;參照水平組要有一定的頻數(shù)作保證,應(yīng)不少于30或50例;對(duì)有序自變量的分析:從專業(yè)出發(fā)確定;分別以啞變量和連續(xù)性變量的方式引入模型進(jìn)行比較后確定。啞變量設(shè)置

啞變量設(shè)置應(yīng)該注意的問題第20頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月Forward:Conditional(最可靠)

Forward:LRForward:Wald(應(yīng)當(dāng)慎用)

Backward:Conditional(最可靠)

Backward:LRBackward:Wald(應(yīng)當(dāng)慎用)6種篩選自變量的方法逐步回歸第21頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月例3

仍以例2的數(shù)據(jù)為例,演示如何在SPSS中實(shí)現(xiàn)逐步logistic回歸分析。逐步回歸第22頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月選擇其中一種逐步法逐步回歸第23頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月逐步回歸

給出了模型擬合過程中每一步的-2log(L)及兩個(gè)偽決定系數(shù)。結(jié)果分析第24頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月逐步回歸結(jié)果分析第25頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月逐步回歸結(jié)果分析

輸出了尚不在模型中的自變量是否能被引入的Score檢驗(yàn)結(jié)果,這里只給出第一步的結(jié)果。第26頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月對(duì)數(shù)似然值與偽決定系數(shù)模型預(yù)測(cè)正確率ROC曲線模型擬合效果檢驗(yàn)

擬合效果判斷指標(biāo):第27頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月對(duì)數(shù)似然值與偽決定系數(shù):-2倍對(duì)數(shù)似然值表示模型的擬合效果,其值越小,越接近于0,說明模型擬合效果越好。但是,當(dāng)自變量中存在缺失值時(shí),因?yàn)橐话憬y(tǒng)計(jì)軟件在進(jìn)行計(jì)算時(shí)會(huì)把含有缺失值的記錄予以剔除,不參與統(tǒng)計(jì)分析,此時(shí)不能用-2loglikelihood對(duì)不同模型的擬合效果進(jìn)行比較。模型擬合效果檢驗(yàn)第28頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月模型預(yù)測(cè)正確率:例3進(jìn)行逐步回歸的第三步(step3)輸出以上結(jié)果,預(yù)測(cè)正確的記錄占71.4%。模型擬合效果檢驗(yàn)第29頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月ROC曲線:Save子對(duì)話框模型擬合效果檢驗(yàn)先保存研究對(duì)象的預(yù)測(cè)概率。第30頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月模型擬合效果檢驗(yàn)第31頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月模型擬合效果檢驗(yàn)第32頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月模型擬合效果檢驗(yàn)

這就是ROC曲線,預(yù)測(cè)效果最佳時(shí),曲線應(yīng)該從左下角垂直上升至頂,然后水平向右延伸到右上角。結(jié)果分析第33頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月模型擬合效果檢驗(yàn)結(jié)果分析

本表是對(duì)ROC曲線下面積計(jì)算的結(jié)果,可見曲線下面積為0.708,95%可信區(qū)間為0.624~0.792。第34頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月模型擬合優(yōu)度檢驗(yàn)(TestofGoodnessFit):考察當(dāng)前模型是否可以進(jìn)一步改善,檢驗(yàn)當(dāng)前模型與飽和模型的預(yù)測(cè)效果之差是否有統(tǒng)計(jì)學(xué)意義。擬合優(yōu)度檢驗(yàn)第35頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月Pearson和Deviance擬合優(yōu)度檢驗(yàn):

當(dāng)自變量很多,或包含連續(xù)性自變量時(shí),不可以用這兩種方法。似然比檢驗(yàn):主要用于考察飽和模型是否可以進(jìn)一步簡(jiǎn)化。

Hosmer-Lemeshow檢驗(yàn):

通常用于自變量很多,或包含連續(xù)性自變量的情況。擬合優(yōu)度檢驗(yàn)

模型擬合優(yōu)度檢驗(yàn)的常用方法:第36頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月點(diǎn)擊主對(duì)話框中的options按鈕,出現(xiàn)如下所示的對(duì)話框:擬合優(yōu)度檢驗(yàn)第37頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月擬合優(yōu)度檢驗(yàn)結(jié)果分析第38頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月①用save子對(duì)話框可以保存各種殘差;②如果殘差的絕對(duì)值大于2,提示該記錄可能是異常點(diǎn)。Save子對(duì)話框模型的診斷與修正

殘差分析第39頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月多重共線性的對(duì)偏回歸系數(shù)的影響與線性回歸模型中的表現(xiàn)一致,如增加或刪除一條記錄,模型中偏回歸系數(shù)值發(fā)生較大變化,專業(yè)上認(rèn)為有意義的因素?zé)o統(tǒng)計(jì)學(xué)意義等等。如果在進(jìn)行l(wèi)ogistic模型分析中,尤其是在向模型中引入交互作用項(xiàng)時(shí)出現(xiàn)了回歸結(jié)果反?,F(xiàn)象,則自變量之間的多重共線性是需要排除的一種可能。模型的診斷與修正

多重共線性的識(shí)別:第40頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月目前SPSS的logistic過程中尚沒有關(guān)于多重共線性診斷的結(jié)果輸出,代替方法之一是運(yùn)用相同的反應(yīng)變量與自變量,擬合線性回歸模型,并進(jìn)行相應(yīng)的共線性診斷。模型的診斷與修正

多重共線性的識(shí)別:第41頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月匹配設(shè)計(jì)(matcheddesign)是在設(shè)計(jì)階段控制混雜因素的一種方法。當(dāng)?shù)玫揭幻芯坎±?,選擇一名或多名非病例作為對(duì)照,選擇相應(yīng)對(duì)照的條件是:某些需要控制的混雜因素與該病例之間相同或相似,從而形成一個(gè)匹配的對(duì)子。一個(gè)匹配的對(duì)子可以只有1個(gè)病例和1個(gè)對(duì)照,稱1:1匹配;當(dāng)病例很罕見時(shí),常采用1個(gè)病例,多個(gè)對(duì)照,此時(shí)稱為1:m匹配,常用的m一般小于等于4,不同的對(duì)子,m可以不同;還可設(shè)計(jì)m:n匹配,即不同對(duì)子的病例與對(duì)照個(gè)數(shù)均可不同,這樣的設(shè)計(jì)增加了收集資料的靈活性。條件logistic回歸-簡(jiǎn)介第42頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月對(duì)于這類匹配設(shè)計(jì)資料,如果采用以上介紹的非條件logistic回歸方法,將會(huì)降低檢驗(yàn)效能。而應(yīng)當(dāng)采用條件logistic回歸模型(conditionallogisticregressionmodel)又稱配對(duì)logistic回歸模型進(jìn)行分析。條件logistic回歸-簡(jiǎn)介第43頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月

用變量差值擬合:只適用于1:1配對(duì)的情況,用Multinomiallogistic

過程實(shí)現(xiàn);用分層Cox模型擬合:適用范圍非常廣。條件logistic回歸SPSS中的擬合方法:第44頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月例4Mack等人預(yù)考察服用雌激素與患子宮內(nèi)膜癌的關(guān)系,對(duì)退休居住在社區(qū)的婦女進(jìn)行病例對(duì)照研究。除服用雌激素以外,研究的自變量還包括肥胖、膽囊病史、服用其他非雌激素藥物。數(shù)據(jù)見1_1_logistic.sav。條件logistic回歸-實(shí)例分析第45頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月computecase=case1-case2.computeage=age1-age2.computeest=est1-est2.computegall=gall1-gall2.computenonest=nonest1-nonest2.execute.由于本例是1:1配對(duì),可以使用變量差值方式加以擬合。首先運(yùn)用compute過程產(chǎn)生配對(duì)logistic回歸的分析變量,或用以下程序予以實(shí)現(xiàn):條件logistic回歸-實(shí)例分析第46頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月條件logistic回歸-實(shí)例分析第47頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月條件logistic回歸-實(shí)例分析

把自變量全部選入Covariate框,不能選入factor框!第48頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月默認(rèn)情況下該復(fù)選框選中,應(yīng)該去除該復(fù)選框條件logistic回歸-實(shí)例分析第49頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月條件logistic回歸結(jié)果分析

這是系統(tǒng)給出的警告,說明由于反應(yīng)變量只有一個(gè)水平,因此SPSS將擬合條件logistic回歸模型。第50頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月結(jié)果分析條件logistic回歸

對(duì)模型中所有偏回歸系數(shù)是否均為0進(jìn)行似然比檢驗(yàn),結(jié)果說明他們不全為0。第51頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月結(jié)果分析條件logistic回歸

輸出了三種偽決定系數(shù),本例的偽決定系數(shù)還比較大。第52頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月結(jié)果分析條件logistic回歸

輸出從模型中分別剔除每一自變量后擬合新的條件logistic回歸模型的-2倍似然對(duì)數(shù)值,用于考察是否可以從當(dāng)前模型中剔除該自變量,提示可以進(jìn)一步采用逐步回歸對(duì)當(dāng)前模型中自變量進(jìn)行篩選。第53頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月結(jié)果分析條件logistic

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論