版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、LogisticLogistic 回歸篩選影響因素校正混雜效應(yīng)進行疾病預(yù)測醫(yī)學(xué)研究線性回歸因變量連續(xù)定量變量自變量與應(yīng)變量為線性關(guān)系LogisticLogistic回歸因變量為分類變量自變量與因變量為非線性關(guān)系目的:目的:作出以多個自變量(危險因素)估計應(yīng)作出以多個自變量(危險因素)估計應(yīng) 變量(結(jié)果因素)的變量(結(jié)果因素)的logisticlogistic回歸方程。屬于回歸方程。屬于概率型非線性回歸。概率型非線性回歸。LogisticLogistic回歸適用范圍資料:資料:1. 1. 應(yīng)變量為反映某現(xiàn)象發(fā)生與不發(fā)生應(yīng)變量為反映某現(xiàn)象發(fā)生與不發(fā)生的二值變量;的二值變量; 2. 2. 自變量宜全
2、部或大部分為分類變量,自變量宜全部或大部分為分類變量,可有少數(shù)數(shù)值變量。分類變量要數(shù)量化??捎猩贁?shù)數(shù)值變量。分類變量要數(shù)量化。LogisticLogistic回歸適用范圍用途:用途:研究某種疾病或現(xiàn)象發(fā)生和多個危險研究某種疾病或現(xiàn)象發(fā)生和多個危險因素(或保護因子)的數(shù)量關(guān)系。因素(或保護因子)的數(shù)量關(guān)系。 用用 檢驗(或檢驗(或u u檢驗)的檢驗)的局限性局限性: 1. 1.只能研究只能研究1 1個危險因素;個危險因素; 2. 2.只能得出定性結(jié)論。只能得出定性結(jié)論。2分類LogisticLogistic回歸多分類資料logistic回歸:因變量多分類變量二分類資料logistic回歸:因變量
3、二分類變量多項分類logistic回歸模型或有序分類logistic回歸模型非條件logistic回歸-非配比病例-對照研究或隊列研究條件logistic回歸-配對或配比資料統(tǒng)計學(xué)概念隊列研究相對危險度(RR)病例對照研究危險度比數(shù)比或優(yōu)勢比(OR)隊列研究也稱前瞻性研究、隨訪研究等。是一種由因及果的研究,在研究開始時,根據(jù)以往有無暴露經(jīng)歷,將研究人群分為暴露人群和非暴露人群,在一定時期內(nèi),隨訪觀察和比較兩組人群的發(fā)病率或死亡率。如果兩組人群發(fā)病率或死亡率差別有統(tǒng)計學(xué)意義,則認(rèn)為暴露和疾病間存在聯(lián)系。LogisticLogistic回歸研究人群研究人群+ +- -+ + +- - -比較比較疾
4、病疾病人數(shù)人數(shù)暴露暴露abcda a/( /(a+ba+b) )c c/( /(c+dc+d ) )相對危險度LogisticLogistic回歸RRRR(相對危險度(相對危險度relative riskrelative risk):):表示暴露組與非暴露組發(fā)病率(或死亡率)的比值。也稱為危險比(risk ratio)。反映了暴露與疾病發(fā)生的關(guān)聯(lián)強度。RR表明暴露組發(fā)病或死亡的危險是非暴露組的多少倍。相對危險度LogisticLogistic回歸RRRR1 1:表示該因素為危險因素,使發(fā)病危險度增大:表示該因素為危險因素,使發(fā)病危險度增大RRRR1 1:表示該因素為保護因素,使發(fā)病危險度減?。?/p>
5、表示該因素為保護因素,使發(fā)病危險度減小RR=1RR=1:表示該因素對疾病的發(fā)病無影響。:表示該因素對疾病的發(fā)病無影響。病例對照研究LogisticLogistic回歸一種一種由果及因由果及因的回顧性研究,先按的回顧性研究,先按疾病狀態(tài)疾病狀態(tài)確定調(diào)查確定調(diào)查對象,分為病例和對照兩組,然后利用已有的記錄、或采對象,分為病例和對照兩組,然后利用已有的記錄、或采用詢問、填寫調(diào)查表等方式,了解其用詢問、填寫調(diào)查表等方式,了解其發(fā)病前發(fā)病前的的暴露情況暴露情況,并進行比較,推測疾病與暴露間的關(guān)系。并進行比較,推測疾病與暴露間的關(guān)系。+-病例病例+-對照對照abcda/(a+b)c/(c+d)比較比較人數(shù)
6、人數(shù)暴露暴露疾病疾病比數(shù)比LogisticLogistic回歸比數(shù)比LogisticLogistic回歸相對危險度相對危險度RRRR的本質(zhì)是暴露組與非暴露組發(fā)病率之比或發(fā)病概率之的本質(zhì)是暴露組與非暴露組發(fā)病率之比或發(fā)病概率之比。但病例對照研究不能計算發(fā)病率,只能計算比值比比。但病例對照研究不能計算發(fā)病率,只能計算比值比OROR值。值。OROR與與RRRR的含義是相同的,也是指暴露組的疾病危險性為非暴露組的多的含義是相同的,也是指暴露組的疾病危險性為非暴露組的多少倍。當(dāng)疾病發(fā)病率小于少倍。當(dāng)疾病發(fā)病率小于5%5%時,時,OROR是是RRRR的極好近似值。的極好近似值。OROR11, ,說明說明
7、該因素是疾病的危險性增加,為危險因素;該因素是疾病的危險性增加,為危險因素;OROR1,0, 1 0, 1 jjjjjjOROROROR無作用危險因保子護因子則有101 , 1, 0 jccX暴非若暴露露10 exp()jjORcc即 模型意義LogisticLogistic回歸對于發(fā)病率很低的慢性疾病如心腦血管病、惡對于發(fā)病率很低的慢性疾病如心腦血管病、惡性腫瘤等,優(yōu)勢比可作為相對危險度(性腫瘤等,優(yōu)勢比可作為相對危險度(relative relative risk ,risk ,RRRR)的近似估計。)的近似估計。即111000(1)(1)PPPORRRPPP 假設(shè)檢驗LogisticLo
8、gistic回歸檢驗假設(shè)為:H0:所有 H1:pii, 2 , 1 , 0, 0 0i常用的檢驗方法有以下三種:似然比檢驗Wald檢驗記分檢驗似然比檢驗LogisticLogistic回歸-2ln-2lnL L近似服從近似服從 分布分布 G G = 2(ln= 2(lnL L1 1-ln-lnL L0 0)= 2ln)= 2ln(L L1 1/ /L L0 0) =p-l=p-l2自變量X引入回歸方程L0、L1若L0/L1=1,則接受H1,拒絕H0.似然比檢驗LogisticLogistic回歸具體方法是:先擬合不包含待檢驗因素的logistic模型,求對數(shù)似然函數(shù)值;再擬合包含待檢驗因素的l
9、ogistic模型,求另一個對數(shù)似然函數(shù)值;比較兩個對數(shù)似然函數(shù)值差別的大小2d2lndGDD 不包含此變量的模型 包含此變量的模型不含此變量的似然函數(shù)含此變量的似然函數(shù)Wald檢驗LogisticLogistic回歸2, 1jjjjbbbbuSS2 或 記分檢驗LogisticLogistic回歸以未包含某個或幾個變量的模型計算保留模以未包含某個或幾個變量的模型計算保留模型中參數(shù)的估計值,并假設(shè)新增參數(shù)為零,計型中參數(shù)的估計值,并假設(shè)新增參數(shù)為零,計算似然函數(shù)的一價偏導(dǎo)數(shù)及信息距陣,兩者相算似然函數(shù)的一價偏導(dǎo)數(shù)及信息距陣,兩者相乘便得比分檢驗的統(tǒng)計量乘便得比分檢驗的統(tǒng)計量S S 。n n 較
10、大時,較大時, S S近似近似服從自由度為待檢因素個數(shù)的服從自由度為待檢因素個數(shù)的 分布。分布。 比較LogisticLogistic回歸以上三種方法中,在多數(shù)情況下,以上三種方法中,在多數(shù)情況下,似然比似然比檢驗是最有效的檢驗檢驗是最有效的檢驗,記分檢驗一般與它相,記分檢驗一般與它相一致。但兩者計算量均較大;一致。但兩者計算量均較大;WaldWald檢驗檢驗主要用于對單個回歸系數(shù)的檢驗,主要用于對單個回歸系數(shù)的檢驗,但是但是WaldWald檢驗未考慮各因素間的綜合作用,檢驗未考慮各因素間的綜合作用,比較保守,在因素間有共線性存在時比較保守,在因素間有共線性存在時, ,結(jié)果不結(jié)果不像其它兩者可
11、靠像其它兩者可靠。 一般過程LogisticLogistic回歸變量的選擇變量的選擇建立建立logisticlogistic回歸模型時,要求進入模型的自變回歸模型時,要求進入模型的自變量應(yīng)對反應(yīng)變量有解釋能力。通常研究者根據(jù)量應(yīng)對反應(yīng)變量有解釋能力。通常研究者根據(jù)專業(yè)知識和研究的問題,首先確定要研究的反專業(yè)知識和研究的問題,首先確定要研究的反應(yīng)變量和自變量應(yīng)變量和自變量單因素分析單因素分析( (變量的粗略選擇變量的粗略選擇) )用單因素分析對自變量進行篩選:卡方檢驗、用單因素分析對自變量進行篩選:卡方檢驗、t t檢驗或單因素的檢驗或單因素的logisticlogistic回歸回歸 一般過程Lo
12、gisticLogistic回歸 條件logistic回歸LogisticLogistic回歸病例與對照匹配病例與對照匹配即要求對照在即要求對照在某些因素或特征某些因素或特征上與病例上與病例保保持一致持一致,目的目的是對兩組比較時是對兩組比較時排除混雜因排除混雜因素素的干擾。匹配分為成組匹配和個體匹配。的干擾。匹配分為成組匹配和個體匹配。 條件logistic回歸LogisticLogistic回歸1、成組匹配(category matching):匹配的因素所占的比例,在對照組和在病例組一致。如病例組中男女各半,65歲以上者占1/3,則對照組也是如此。2、個體匹配(individual ma
13、tching):以病例和對照的個體為單位進行匹配叫個體匹配,每一個病例與M個與它條件相一致的對照形成一個匹配組。1:1匹配又叫配對(pair matching), 1:2, ,1:m匹配時稱為匹配。 匹配的特征必須是已知的混雜因子,或者有充分的理由懷疑其為混雜因子,否則不應(yīng)匹配。 條件logistic回歸LogisticLogistic回歸 應(yīng)用LogisticLogistic回歸 矯正混雜因素矯正混雜因素 篩選影響因素篩選影響因素 疾病預(yù)測和預(yù)后疾病預(yù)測和預(yù)后ROCROC曲線曲線涵義與起源ROCROC曲線曲線ROCROC【receiverreceiver(relative) operatin
14、g characteristic(relative) operating characteristic的縮的縮寫,譯為寫,譯為“接受者工作特征接受者工作特征”】ROCROC曲線研究歷史曲線研究歷史1950s 1950s 雷達雷達信號觀測能力評價信號觀測能力評價1960s1960s中期中期 實驗心理學(xué)實驗心理學(xué)、心理物理學(xué)、心理物理學(xué)1970s1970s末與末與1980s1980s初初 診斷醫(yī)學(xué)診斷醫(yī)學(xué)診斷試驗評價四格表ROCROC曲線曲線待評價的診斷方待評價的診斷方法法標(biāo)準(zhǔn)診斷方法標(biāo)準(zhǔn)診斷方法合計合計有病(陽性)有?。栃裕o?。幮裕o?。幮裕┯胁。栃裕┯胁。栃裕゛ a(真陽性)(真陽
15、性)b b(假陽性)(假陽性)a+ba+b無病(陰性)無?。幮裕ヽ c(假陽性)(假陽性)d d(真陰性)(真陰性)c+dc+d合計合計a+ca+cb+db+dn n(= =a+b+c+da+b+c+d)靈敏度:真陽性率靈敏度:真陽性率,表示實際患病者且被待評價的診斷方法,表示實際患病者且被待評價的診斷方法診斷為患者的概率,反映了待評價的診斷方法檢出患者能力診斷為患者的概率,反映了待評價的診斷方法檢出患者能力Se=a/Se=a/( (a+ca+c) )特異特異度:真陰性率度:真陰性率,表示實際未患病患者且被待評價的診斷,表示實際未患病患者且被待評價的診斷方法診斷為非患者的概率,反映了待評價的
16、診斷方法檢出非患者方法診斷為非患者的概率,反映了待評價的診斷方法檢出非患者的能力的能力Sp=d/(Sp=d/(b+db+d) )ROC曲線ROCROC曲線曲線完美診斷試驗完美診斷試驗0.00.20.40.60.81.00.00.20.40.60.81.0FPRTPR1- 1-特異度特異度靈敏度靈敏度完美診斷試驗完美診斷試驗FPR無用診斷試驗無用診斷試驗0.00.20.40.60.81.00.00.20.40.60.81.0FPRTPRROC曲線分析中將不同診斷分界點下的靈敏度和(1-特異度)確定為曲線上的一個操作點,靈敏度為縱坐標(biāo),(1-特異度)為橫坐標(biāo)。參考線參考線曲線下面積ROCROC曲線曲線ROC曲線下面積(AUC):用于定量地反應(yīng)診斷試驗的準(zhǔn)確性大小。取值范圍0.51.ROC曲線下面積(曲線下面積(Area)與診斷準(zhǔn)確度高低)與診斷準(zhǔn)確度高低高 0.90-1.00 = excellent (A)中 0.8
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度國有企業(yè)員工持股計劃合同模板2篇
- 二零二五年度高新技術(shù)產(chǎn)業(yè)園區(qū)建設(shè)貸款擔(dān)保合同3篇
- 二零二五年度布草行業(yè)供應(yīng)鏈金融解決方案合同3篇
- 2025年度教育機構(gòu)場地租賃合同終止及教學(xué)資源共享協(xié)議4篇
- 2024版區(qū)域公司運營合作合同版B版
- 貨幣金融學(xué):第1章 貨幣與貨幣制度
- 2025年度企業(yè)年會場地借用及服務(wù)保障合同范本3篇
- 個人機械租賃協(xié)議書(2024版)
- 2024資金擔(dān)保協(xié)議范本
- 專業(yè)木工班組2024年施工分包合同
- C及C++程序設(shè)計課件
- 帶狀皰疹護理查房
- 公路路基路面現(xiàn)場測試隨機選點記錄
- 平衡計分卡-化戰(zhàn)略為行動
- 國家自然科學(xué)基金(NSFC)申請書樣本
- 幼兒教師干預(yù)幼兒同伴沖突的行為研究 論文
- 湖南省省級溫室氣體排放清單土地利用變化和林業(yè)部分
- 材料設(shè)備驗收管理流程圖
- 培訓(xùn)機構(gòu)消防安全承諾書范文(通用5篇)
- (完整版)建筑業(yè)10項新技術(shù)(2017年最新版)
- 第8期監(jiān)理月報(江蘇版)
評論
0/150
提交評論