Logisti回歸方程1_第1頁
Logisti回歸方程1_第2頁
Logisti回歸方程1_第3頁
Logisti回歸方程1_第4頁
Logisti回歸方程1_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、 Logistic Regression Analysis Logistic回歸分析回歸分析 陳新 Logistic回歸分析分析 在醫(yī)學研究中, 經(jīng)常要分析某種結果的產(chǎn)生與哪些因素有關。 例如:生存與死亡, 發(fā)病與未發(fā)病, 陰性與陽性等結果的產(chǎn)生可能與病人的年齡、性別、生活習慣、體質、遺傳等許多因素有關。如何找出其中哪些因素對結果的產(chǎn)生有顯著性影響呢? Logistic回歸分析能較好地解決這類問題。 一、一、 Logistic回歸模型 1 1、 Logistic回歸模型的構造 若因變量y為連續(xù)型正態(tài)定量變量時, 可采用多元線性回歸分析y與變量 X1, X2, , Xp之間的關系: y0+1X1

2、+2X2+pXp l 現(xiàn)y為發(fā)病或未發(fā)病,生存與死亡等定性分類變量,不能直接用上模型進行分析。 l 能否用發(fā)病的概率P來直接代替 y呢?l p 0 0+1 1X X1 1+2 2X X2 2+p pX Xp p 等式左邊 變化范圍P 發(fā)病概率 0 P11P 不發(fā)病概率 0 P1 p/1-p 比數(shù) (ratio) 0 p/1-p+ ln(p/1-p) 比數(shù)的對數(shù)值 (ratio) - ln(p/1-p) +2、 Logistic 回歸模型為:llnP/(1-P)=0+1X1+pXp. 定義:logit(P)= lnP/(1-P)為 Logistic變換, Logistic 回歸模型為: logi

3、t(P)=0+1X1+pXp ;經(jīng)數(shù)學變換可得: exp(0+1X1+pXp)l P= l 1+ exp(0+1X1+pXp);l l exp表示指數(shù)函數(shù)。 Logistic回歸模型是一種概率模型, 它是以疾病,死亡等結果發(fā)生的概率為因變量, 影響疾病發(fā)生的因素為自變量建立回歸模型。 它特別適用于因變量為二項, 多項分類的資料。 在臨床醫(yī)學中多用于鑒別診斷, 評價治療措施的好壞及分析與疾病預后有關的因素等。 CHISS軟件要求,對分類變量Y數(shù)量化,而且賦值為: 1 發(fā)病 (陽性, 死亡 , 治愈等) y = 0未發(fā)病 (陰性, 生存, 未治愈等). 注意 :P=P(y=1), 即發(fā)病的概率。

4、l3、 軟件的要求軟件的要求4 、回歸系數(shù)i的意義設只有一個自變量X,Logistic方程為 ln P/(1-P)= 0+ 1x X= 0表示非暴露,1 表示暴露。 X=1時的發(fā)病概率為 P1; X=0時的發(fā)病概率為 P0。 P1/(1-P1) 則, OR= P0/(1-P0) ln(OR)=logitP(1)-logitP(0) =(0+11)-(0+10) = 1 logistic logistic 回歸系數(shù)的回歸系數(shù)的意義 表示自變量每增加一個單位,其優(yōu)勢比的對數(shù)值的改變量, OR=e lnOR= 亦即自變量每增加一個單位,其相對危險度為e 。例如,吸煙與肺癌的關系的研究 令 1 吸煙

5、1 肺癌 X = y= 0 不吸 0 非肺癌若求得: = 1, OR=e 意思是: 吸煙的人得肺癌癥的危險性是不吸煙的2.71828倍。 注意 變量X的賦值與OR的關系令 0 吸 X = 1 不吸 則求得 = ? OR=?則求得: = -1, OR=1/e 意思是: 不吸煙的人得肺癌癥的危險性是吸煙的36.79%。 實例分析實例分析5 5、參數(shù)檢驗、參數(shù)檢驗1.1.似然比檢驗(似然比檢驗(likehoodlikehood ratio test ratio test)通過比較包含與不包含某一個或幾個待通過比較包含與不包含某一個或幾個待檢驗觀察因素的兩個模型的對數(shù)似然函檢驗觀察因素的兩個模型的對數(shù)

6、似然函數(shù)變化來進行,其統(tǒng)計量為數(shù)變化來進行,其統(tǒng)計量為G G G=-2(ln LG=-2(ln Lp p-ln L-ln Lk k) ) n n較大時,較大時, G G近似服從自由度為待檢驗近似服從自由度為待檢驗因素個數(shù)的因素個數(shù)的 分布。分布。比分檢驗比分檢驗(score testscore test) 以未包含某個或幾個變量的模型以未包含某個或幾個變量的模型計算保留模型中參數(shù)的估計值,并假計算保留模型中參數(shù)的估計值,并假設新增參數(shù)為零,計算似然函數(shù)的一設新增參數(shù)為零,計算似然函數(shù)的一價偏導數(shù)及信息距陣,兩者相乘便得價偏導數(shù)及信息距陣,兩者相乘便得比分檢驗的統(tǒng)計量比分檢驗的統(tǒng)計量S S 。n

7、 n 較大時,較大時, S S近似服從自由度為待檢因素個數(shù)的近似服從自由度為待檢因素個數(shù)的 分布。分布。WaldWald檢驗(檢驗( waldwald test test)即廣義的即廣義的t t檢驗,統(tǒng)計量為檢驗,統(tǒng)計量為u u u u服從正態(tài)分布,即為標準正態(tài)離服從正態(tài)分布,即為標準正態(tài)離差。差。iibbu =s 以上三種方法中,似然比檢以上三種方法中,似然比檢驗最可靠,比分檢驗一般與它相驗最可靠,比分檢驗一般與它相一致,但兩者計算量均較大;而一致,但兩者計算量均較大;而WaldWald檢驗未考慮各因素間的綜合檢驗未考慮各因素間的綜合作用,在因素間有共線性存在時作用,在因素間有共線性存在時,

8、 ,結果不像其它兩者可靠。結果不像其它兩者可靠。分析因素分析因素xi為等級變量時,如以最小或為等級變量時,如以最小或最大等級作參考組,并按等級順序依最大等級作參考組,并按等級順序依次取為次取為0,1,2,。此時,。此時, e(bi) 表示表示xi增加一個等級時的優(yōu)勢比,增加一個等級時的優(yōu)勢比, e(k* bi)表表示示xi增加增加k個等級時的優(yōu)勢比。個等級時的優(yōu)勢比。分析因素分析因素xi為連續(xù)性變量時,為連續(xù)性變量時, e(bi)表示表示xi增加一個計量單位時的優(yōu)勢比。增加一個計量單位時的優(yōu)勢比。6 6、 LogisticLogistic回歸分析方法回歸分析方法 分析思想與多重線性回歸分析相同

9、分析思想與多重線性回歸分析相同 篩選變量的方法篩選變量的方法: : 前進法前進法 后退法后退法 逐步法逐步法 統(tǒng)計量不再是線性回歸分析中的統(tǒng)計量不再是線性回歸分析中的F F統(tǒng)計統(tǒng)計 量,量,而是上面介紹的三種統(tǒng)計量之一。而是上面介紹的三種統(tǒng)計量之一。 為計算方便,通常向前選取變量用為計算方便,通常向前選取變量用似然比或比分檢驗,而向后剔除變量似然比或比分檢驗,而向后剔除變量常用常用WaldWald檢驗。檢驗。7 7、啞變量的設置和引入、啞變量的設置和引入啞變量,又稱啞變量,又稱指示變量指示變量有利于檢驗等級變量各個等級間的變化有利于檢驗等級變量各個等級間的變化是否相同。是否相同。一個一個k k

10、分類的分類變量,進行分類的分類變量,進行LogisticLogistic回回歸分析前需將該變量轉換成歸分析前需將該變量轉換成k-1k-1個指示變個指示變量或啞變量(量或啞變量(dummy variabledummy variable)來表示。)來表示。這樣指示變量都是二分變量,每一個指這樣指示變量都是二分變量,每一個指示變量均有一個回歸系數(shù),其解釋同前。示變量均有一個回歸系數(shù),其解釋同前。啞變量的設置教育程度X1X2X3沈陽000北京100天津010上海001地區(qū)地區(qū):北京,天津北京,天津, 上海上海, 沈陽沈陽 二、條件二、條件LogisticLogistic回歸回歸對配比調(diào)查資料,多采用條

11、件對配比調(diào)查資料,多采用條件LogisticLogistic回歸分析。回歸分析。假設自變量在各配比組對結果變量的假設自變量在各配比組對結果變量的作用相同,即自變量的回歸系數(shù)與配作用相同,即自變量的回歸系數(shù)與配比組無關。比組無關。配比設計的配比設計的LogisticLogistic回歸模型回歸模型 不含常數(shù)項。不含常數(shù)項。1 12 2logit P=bk kxbxb x三、三、logisticlogistic回歸的作用回歸的作用(1)建立logistic回歸模型: logit(p)=0+1X1+2X2+pXp ;(2) 預測預報 若已知x1, x2 xm數(shù)值大小時, 通過模型可以預測發(fā)病、死亡等的概率; (3) 因素分析 尋找發(fā)病、死亡等影響有顯著性的因素。 設 研 究 問 題 中 含 有 p 個 指 標 變 量 x 1 , x2,xp及Y. n個觀察對象. 其數(shù)據(jù)結構為: 編號 X1 X2 . XP y 1 x11 x21 x1p y1 2 x2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論