Logistic回歸分析及其應用課件_第1頁
Logistic回歸分析及其應用課件_第2頁
Logistic回歸分析及其應用課件_第3頁
Logistic回歸分析及其應用課件_第4頁
Logistic回歸分析及其應用課件_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2022/11/101概述1967年TrueltJ,ConnifieldJ和KannelW在《JournalofChronicDisease》上發(fā)表了冠心病危險因素的研究,較早將Logistic回歸用于醫(yī)學研究。一般概念一元直線回歸多元直線回歸2022/11/91概述1967年TrueltJ,Conn2022/11/102一元直線回歸模型

y=a+bx+e多元直線回歸模型

y=a+b1x1+b2x2+…+bkxk+e2022/11/92一元直線回歸模型2022/11/103-4.00-2.000.002.004.00X:自變量0.000.250.500.751.00F(y):因變量的logit值如果一定要進行直線回歸也可以做出結果,但此時效果不佳。當自變量取一定值時,因變量的預測值可能為負數(shù)。2022/11/93-4.00-2.000.002.004.2022/11/104一般直線回歸難以解決的問題醫(yī)學數(shù)據(jù)的復雜、多樣連續(xù)型和離散型數(shù)據(jù)醫(yī)學研究中疾病的復雜性一種疾病可能有多種致病因素或與多種危險因素有關疾病轉歸的影響因素也可能多種多樣臨床治療結局的綜合性2022/11/94一般直線回歸難以解決的問題醫(yī)學數(shù)據(jù)的復雜2022/11/105簡單的解決方法固定其他因素,研究有影響的一兩個因素;分層分析:按1~2個因素組成的層進行層內分析和綜合。統(tǒng)計模型2022/11/95簡單的解決方法固定其他因素,研究有影響的2022/11/106尋找合適的模型進行l(wèi)ogit變換logit(p)=ln(——),p為y=1所對應的概率

logit(0.1)=ln(———)=ln(0.1/0.9)p1-p0.11-

0.12022/11/96尋找合適的模型進行l(wèi)ogit變換p1-2022/11/107logit(p)=ln(——)p=0或1時,此式失效

以p=r/n代之

logit(p)=ln[(r+0.5)/(n–r+0.5)]此稱經(jīng)驗logistic變換

以Z代上式的logit(p),Z=a+b1x1+b2x2+…+bkxk

稱此為logistic回歸模型p1-p2022/11/97logit(p)=ln(——)2022/11/108P=ez/(1+ez)ea+b1x1+b2x2+…+bkxk

1+ea+b1x1+b2x2+…+bkxk此為非條件logistic回歸模型應用于成組數(shù)據(jù)的分析P=2022/11/98P=2022/11/109自變量取定一些值時,因變量取0、1的概率就是條件概率,對條件概率進行l(wèi)ogistic回歸,稱為條件logistic回歸表達式:

eb1x1+b2x2+…+bkxk

1-eb1x1+b2x2+…+bkxk

常用于分析配比的資料P=2022/11/99自變量取定一些值時,因變量取0、1的概率2022/11/1010概述小結logistic回歸對因變量的比數(shù)的對數(shù)值(logit值)建立模型因變量的logit值的改變與多個自變量的加權和呈線性關系因變量呈二項分布2022/11/910概述小結logistic回歸對因變量的2022/11/1011分析的一般步驟變量的編碼啞變量的設置和引入各個自變量的單因素分析變量的篩選交互作用的引入建立多個模型選擇較優(yōu)的模型模型應用條件的評價輸出結果的解釋2022/11/911分析的一般步驟變量的編碼2022/11/10121.變量的編碼變量的編碼要易于識別注意編碼的等級關系改變分類變量的編碼,其分析的意義并不改變。牢記編碼使用變量數(shù)值標識(valuelabels)記錄編碼內容2022/11/9121.變量的編碼變量的編碼要易于識別2022/11/1013變量的編碼變量名變量標識變量值值標識

SEX性別1男

2女

EDU教育程度0文盲

1小學

2初中及以上2022/11/913變量的編碼變量名變量標識2022/11/1014variablelabelsqnum'問卷序號'rnum'錄入序號'pnum'病人編號'hnum'住院號/門診號'chname'患者中文姓名'drugroup'組別'name'患者姓名'sex'患者性別'age'患者年齡'valuelabelssex1'男'2'女'/hisc1'是'0'否'9'無法判斷'/nsex1'正常'0'異常'9'未檢'/demdx1'有'0'無'/addx0'無'1'危險性'2'可能'3'很可能'/edu0‘文盲’

1‘小學程度’

2‘初中及以上'2022/11/914variablelabelsvalu2022/11/10152.啞變量的設置和引入啞變量,又稱指示變量或設計矩陣。有利于檢驗等級變量各個等級間的變化是否相同。一個k分類的分類變量,可以用k-1個啞變量來表示。2022/11/9152.啞變量的設置和引入啞變量,又稱指示2022/11/1016啞變量的設置教育程度X1X2X3文盲:0000小學:1100初中:2010高中:3001教育程度:文盲,小學,初中,高中以上2022/11/916啞變量的設置教育程度X1X2X3文盲:2022/11/1017教育程度X1X2X3文盲:0100小學:1010初中:2001高中:3000以高中作為參照2022/11/917教育程度X1X2X3文盲:0100小學2022/11/1018SPSS提供的方法Indicator:

默認。以第1或最后1類作對照,其他每類與對照比較;Sample:

以第1或最后1類作對照,其他每類與對照比較,但反映平均效應。Difference:

除第1類外各分類與其前各類平均效應比較;Helmert:

除最后1類外各分類與其前各類平均效應比較;Repeated:

除第1類外各分類與其前一類比較;Polynomial:

假設類間距相等,用于數(shù)值型變量。Deviation:

以第1或最后1類作對照,其余每類與總效應比較。2022/11/918SPSS提供的方法Indicator:2022/11/10193.自變量的單因素分析了解自變量與因變量的分布檢驗是否符合建立模型的應用條件偏離應用條件時,進行數(shù)據(jù)變換各個自變量兩組間的比較計數(shù)資料計量資料雙變量分析2022/11/9193.自變量的單因素分析了解自變量與因變2022/11/10204.變量的篩選變量篩選的原則專業(yè)上考慮測量上考慮共線性問題:計算相關矩陣,相關系數(shù)0.8-0.9,則選其一。缺失數(shù)據(jù)少、測量誤差低的優(yōu)先選擇經(jīng)驗上考慮雙變量分析中有顯著性的自變量(P≤0.15)選擇那些改變主效應的自變量2022/11/9204.變量的篩選變量篩選的原則2022/11/1021變量的篩選變量篩選的可用方法逐步logistic回歸:自動選擇有顯著性的自變量,不僅用于自變量的剔選,也用于交互作用項是否顯著的判斷。前進法:逐個引入模型外的變量后退法:放入所有變量,再逐個篩選

理論上看,前進法選擇變量的經(jīng)驗公式缺乏總體概念,當用于因素分析時,建議用后退法。當變量間有完全相關性時,后退法無法使用,可用前進法。2022/11/921變量的篩選變量篩選的可用方法2022/11/10225.交互作用的引入交互作用的定義當自變量和因變量的關系隨第三個變量的變化而改變時,則存在交互作用交互作用項的引入基于臨床實際認為對結果有重要影響基于模型應用條件的分析引入兩個自變量的乘積項交互作用的檢驗交互作用的解釋2022/11/9225.交互作用的引入交互作用的定義2022/11/10236.建立多個模型飽和模型自定義的模型從飽和模型中選擇自變量再建立模型2022/11/9236.建立多個模型飽和模型2022/11/10247.選擇較優(yōu)的模型模型擬合優(yōu)度檢驗AIC(Akaikeinformationcriterion):同一資料的多個模型的比較,此值越小,模型越合適。SC(Schwartzcriterion):同上Score統(tǒng)計量:同上,但不包括截距項。-2logL(似然比檢驗,OmnibusTest):檢驗全部自變量的作用是否顯著。較為可靠。適用于含連續(xù)性變量的情況。模型擬合好,x2值大,P值小。Hosmer-Lemeshow檢驗:評價估計概率和觀察概率接近的程度。適用于含連續(xù)性變量的情況。模型好,x2值小,P值大。2022/11/9247.選擇較優(yōu)的模型模型擬合優(yōu)度檢驗2022/11/10258.模型應用條件的評價殘差分析殘差是觀察值與估計值之差合理的logistic回歸模型也可能得到不理想的殘差,這在自變量是二分類變量時更易出現(xiàn)。增加交互作用項可能增加模型的效能2022/11/9258.模型應用條件的評價殘差分析2022/11/10269.輸出結果的解釋模型中各個系數(shù)的顯著性檢驗Wald檢驗:類似于直線回歸系數(shù)的t檢驗Waldx2檢驗:同上似然比檢驗:自變量不在模型中與在模型中的似然值比較。Score檢驗2022/11/9269.輸出結果的解釋模型中各個系數(shù)的顯著2022/11/1027輸出結果的解釋回歸系數(shù)的解釋系數(shù)的正負值:正(負)系數(shù)表示隨自變量的增加因變量logit值的增加(減少)。二分類自變量系數(shù)為比數(shù)比的對數(shù)值,由此比數(shù)比=eb多分類自變量

以第i類作參照,比較相鄰或相隔的兩個類別。連續(xù)型自變量當自變量改變一個單位時,比數(shù)比為eb2022/11/927輸出結果的解釋回歸系數(shù)的解釋2022/11/1028輸出結果的解釋模型擬合的優(yōu)劣自變量與結果變量(因變量)有無關系確認因變量與自變量的編碼模型包含的各個自變量的臨床意義由模型回歸系數(shù)計算得到的各個自變量的比數(shù)比的臨床意義2022/11/928輸出結果的解釋模型擬合的優(yōu)劣2022/11/1029輸出結果的解釋模型的預測結果的評價敏感度、特異度和陽性預測值正確選擇預測概率界值,簡單地以0.5為界值,但并不是最好的。C指數(shù)預測結果與觀察結果的一致性的度量。C值越大(最大為1),模型預測結果的能力越強。2022/11/929輸出結果的解釋模型的預測結果的評價2022/11/1030非條件logistic回歸研究對象之間是否發(fā)生某事件是獨立的。適用于:成組的病例-對照研究無分層的隊列研究或橫斷面調查診斷性試驗2022/11/930非條件logistic回歸研究對象之間2022/11/1031條件logistic回歸研究中有N個配比組,每組中n個病例配m個對照者。這時,各個研究對象發(fā)生某事件的概率即為條件概率。適用于配比設計的病例-對照研究精細分層設計的隊列研究2022/11/931條件logistic回歸研究中有N個配2022/11/1032logistic回歸的應用疾病影響因素的研究校正混雜因素疾病預后的估計疾病診斷2022/11/932logistic回歸的應用疾病影響因素2022/11/1033疾病影響因素的研究病因學研究病例-對照研究隊列研究影響因素的研究橫斷面調查臨床試驗2022/11/933疾病影響因素的研究病因學研究2022/11/1034校正混雜因素一般采用Mantel-Haenszel分層分析分層較細或存在格子零頻數(shù)時,M-H法無法采用。logistic回歸分析可綜合校正多個混雜因素的影響2022/11/934校正混雜因素一般采用Mantel-Ha2022/11/1035疾病預后的估計logistic回歸模型作為一種概率模型,可用于預測某事件發(fā)生的概率。logistic回歸不要求在因變量正態(tài)假設的前提下進行預測。2022/11/935疾病預后的估計logistic回歸模型2022/11/1036疾病診斷疾病診斷的判別診斷性試驗研究中,敏感度和特異度的估計logistic回歸模型綜合校正協(xié)變量的影響充分利用數(shù)據(jù)提供的信息可進行95%可信區(qū)間的估計2022/11/936疾病診斷疾病診斷的判別2022/11/1037logistic回歸的其他問題多分類logistic回歸模型因變量為二分類變量因變量為多分類變量多分類logistic回歸2022/11/937logistic回歸的其他問題多分類l2022/11/1038其他問題研究對象例數(shù)的確定研究設計時樣本含量的估計經(jīng)驗方法:模型中的每一自變量至少需要出現(xiàn)10個結局。給定例數(shù)時自變量太多刪除變量合并變量及變量的分類2022/11/938其他問題研究對象例數(shù)的確定2022/11/1039其他問題logistic回歸的局限性理論上的不足:自變量對疾病的影響是獨立的,但實際情況及推導結果不同。模型有不合理性:“乘法模型”與一般希望的“相加模型”相矛盾。最大似然法估計參數(shù)的局限樣本含量不宜太少:例數(shù)大于200例時才可不考慮參數(shù)估計的偏性。2022/11/939其他問題logistic回歸的局限性2022/11/1040概述1967年TrueltJ,ConnifieldJ和KannelW在《JournalofChronicDisease》上發(fā)表了冠心病危險因素的研究,較早將Logistic回歸用于醫(yī)學研究。一般概念一元直線回歸多元直線回歸2022/11/91概述1967年TrueltJ,Conn2022/11/1041一元直線回歸模型

y=a+bx+e多元直線回歸模型

y=a+b1x1+b2x2+…+bkxk+e2022/11/92一元直線回歸模型2022/11/1042-4.00-2.000.002.004.00X:自變量0.000.250.500.751.00F(y):因變量的logit值如果一定要進行直線回歸也可以做出結果,但此時效果不佳。當自變量取一定值時,因變量的預測值可能為負數(shù)。2022/11/93-4.00-2.000.002.004.2022/11/1043一般直線回歸難以解決的問題醫(yī)學數(shù)據(jù)的復雜、多樣連續(xù)型和離散型數(shù)據(jù)醫(yī)學研究中疾病的復雜性一種疾病可能有多種致病因素或與多種危險因素有關疾病轉歸的影響因素也可能多種多樣臨床治療結局的綜合性2022/11/94一般直線回歸難以解決的問題醫(yī)學數(shù)據(jù)的復雜2022/11/1044簡單的解決方法固定其他因素,研究有影響的一兩個因素;分層分析:按1~2個因素組成的層進行層內分析和綜合。統(tǒng)計模型2022/11/95簡單的解決方法固定其他因素,研究有影響的2022/11/1045尋找合適的模型進行l(wèi)ogit變換logit(p)=ln(——),p為y=1所對應的概率

logit(0.1)=ln(———)=ln(0.1/0.9)p1-p0.11-

0.12022/11/96尋找合適的模型進行l(wèi)ogit變換p1-2022/11/1046logit(p)=ln(——)p=0或1時,此式失效

以p=r/n代之

logit(p)=ln[(r+0.5)/(n–r+0.5)]此稱經(jīng)驗logistic變換

以Z代上式的logit(p),Z=a+b1x1+b2x2+…+bkxk

稱此為logistic回歸模型p1-p2022/11/97logit(p)=ln(——)2022/11/1047P=ez/(1+ez)ea+b1x1+b2x2+…+bkxk

1+ea+b1x1+b2x2+…+bkxk此為非條件logistic回歸模型應用于成組數(shù)據(jù)的分析P=2022/11/98P=2022/11/1048自變量取定一些值時,因變量取0、1的概率就是條件概率,對條件概率進行l(wèi)ogistic回歸,稱為條件logistic回歸表達式:

eb1x1+b2x2+…+bkxk

1-eb1x1+b2x2+…+bkxk

常用于分析配比的資料P=2022/11/99自變量取定一些值時,因變量取0、1的概率2022/11/1049概述小結logistic回歸對因變量的比數(shù)的對數(shù)值(logit值)建立模型因變量的logit值的改變與多個自變量的加權和呈線性關系因變量呈二項分布2022/11/910概述小結logistic回歸對因變量的2022/11/1050分析的一般步驟變量的編碼啞變量的設置和引入各個自變量的單因素分析變量的篩選交互作用的引入建立多個模型選擇較優(yōu)的模型模型應用條件的評價輸出結果的解釋2022/11/911分析的一般步驟變量的編碼2022/11/10511.變量的編碼變量的編碼要易于識別注意編碼的等級關系改變分類變量的編碼,其分析的意義并不改變。牢記編碼使用變量數(shù)值標識(valuelabels)記錄編碼內容2022/11/9121.變量的編碼變量的編碼要易于識別2022/11/1052變量的編碼變量名變量標識變量值值標識

SEX性別1男

2女

EDU教育程度0文盲

1小學

2初中及以上2022/11/913變量的編碼變量名變量標識2022/11/1053variablelabelsqnum'問卷序號'rnum'錄入序號'pnum'病人編號'hnum'住院號/門診號'chname'患者中文姓名'drugroup'組別'name'患者姓名'sex'患者性別'age'患者年齡'valuelabelssex1'男'2'女'/hisc1'是'0'否'9'無法判斷'/nsex1'正常'0'異常'9'未檢'/demdx1'有'0'無'/addx0'無'1'危險性'2'可能'3'很可能'/edu0‘文盲’

1‘小學程度’

2‘初中及以上'2022/11/914variablelabelsvalu2022/11/10542.啞變量的設置和引入啞變量,又稱指示變量或設計矩陣。有利于檢驗等級變量各個等級間的變化是否相同。一個k分類的分類變量,可以用k-1個啞變量來表示。2022/11/9152.啞變量的設置和引入啞變量,又稱指示2022/11/1055啞變量的設置教育程度X1X2X3文盲:0000小學:1100初中:2010高中:3001教育程度:文盲,小學,初中,高中以上2022/11/916啞變量的設置教育程度X1X2X3文盲:2022/11/1056教育程度X1X2X3文盲:0100小學:1010初中:2001高中:3000以高中作為參照2022/11/917教育程度X1X2X3文盲:0100小學2022/11/1057SPSS提供的方法Indicator:

默認。以第1或最后1類作對照,其他每類與對照比較;Sample:

以第1或最后1類作對照,其他每類與對照比較,但反映平均效應。Difference:

除第1類外各分類與其前各類平均效應比較;Helmert:

除最后1類外各分類與其前各類平均效應比較;Repeated:

除第1類外各分類與其前一類比較;Polynomial:

假設類間距相等,用于數(shù)值型變量。Deviation:

以第1或最后1類作對照,其余每類與總效應比較。2022/11/918SPSS提供的方法Indicator:2022/11/10583.自變量的單因素分析了解自變量與因變量的分布檢驗是否符合建立模型的應用條件偏離應用條件時,進行數(shù)據(jù)變換各個自變量兩組間的比較計數(shù)資料計量資料雙變量分析2022/11/9193.自變量的單因素分析了解自變量與因變2022/11/10594.變量的篩選變量篩選的原則專業(yè)上考慮測量上考慮共線性問題:計算相關矩陣,相關系數(shù)0.8-0.9,則選其一。缺失數(shù)據(jù)少、測量誤差低的優(yōu)先選擇經(jīng)驗上考慮雙變量分析中有顯著性的自變量(P≤0.15)選擇那些改變主效應的自變量2022/11/9204.變量的篩選變量篩選的原則2022/11/1060變量的篩選變量篩選的可用方法逐步logistic回歸:自動選擇有顯著性的自變量,不僅用于自變量的剔選,也用于交互作用項是否顯著的判斷。前進法:逐個引入模型外的變量后退法:放入所有變量,再逐個篩選

理論上看,前進法選擇變量的經(jīng)驗公式缺乏總體概念,當用于因素分析時,建議用后退法。當變量間有完全相關性時,后退法無法使用,可用前進法。2022/11/921變量的篩選變量篩選的可用方法2022/11/10615.交互作用的引入交互作用的定義當自變量和因變量的關系隨第三個變量的變化而改變時,則存在交互作用交互作用項的引入基于臨床實際認為對結果有重要影響基于模型應用條件的分析引入兩個自變量的乘積項交互作用的檢驗交互作用的解釋2022/11/9225.交互作用的引入交互作用的定義2022/11/10626.建立多個模型飽和模型自定義的模型從飽和模型中選擇自變量再建立模型2022/11/9236.建立多個模型飽和模型2022/11/10637.選擇較優(yōu)的模型模型擬合優(yōu)度檢驗AIC(Akaikeinformationcriterion):同一資料的多個模型的比較,此值越小,模型越合適。SC(Schwartzcriterion):同上Score統(tǒng)計量:同上,但不包括截距項。-2logL(似然比檢驗,OmnibusTest):檢驗全部自變量的作用是否顯著。較為可靠。適用于含連續(xù)性變量的情況。模型擬合好,x2值大,P值小。Hosmer-Lemeshow檢驗:評價估計概率和觀察概率接近的程度。適用于含連續(xù)性變量的情況。模型好,x2值小,P值大。2022/11/9247.選擇較優(yōu)的模型模型擬合優(yōu)度檢驗2022/11/10648.模型應用條件的評價殘差分析殘差是觀察值與估計值之差合理的logistic回歸模型也可能得到不理想的殘差,這在自變量是二分類變量時更易出現(xiàn)。增加交互作用項可能增加模型的效能2022/11/9258.模型應用條件的評價殘差分析2022/11/10659.輸出結果的解釋模型中各個系數(shù)的顯著性檢驗Wald檢驗:類似于直線回歸系數(shù)的t檢驗Waldx2檢驗:同上似然比檢驗:自變量不在模型中與在模型中的似然值比較。Score檢驗2022/11/9269.輸出結果的解釋模型中各個系數(shù)的顯著2022/11/1066輸出結果的解釋回歸系數(shù)的解釋系數(shù)的正負值:正(負)系數(shù)表示隨自變量的增加因變量logit值的增加(減少)。二分類自變量系數(shù)為比數(shù)比的對數(shù)值,由此比數(shù)比=eb多分類自變量

以第i類作參照,比較相鄰或相隔的兩個類別。連續(xù)型自變量當自變量改變一個單位時,比數(shù)比為eb2022/11/927輸出結果的解釋回歸系數(shù)的解釋2022/11/1067輸出結果的解釋模型擬合的優(yōu)劣自變量與結果變量(因變量)有無關系確認因變量與自變量的編碼模型包含的各個自變量的臨床意義由模型回歸系數(shù)計算得到的各個自變量的比數(shù)比的臨床意義2022/11/928輸出結果的解釋模型擬合的優(yōu)劣2022/11/1068輸出結果的解釋模型的預測結果的評價敏感度、特異度和陽性預測值正確選擇預

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論