精品課程醫(yī)學統(tǒng)計學教學-logistic回歸分析_第1頁
精品課程醫(yī)學統(tǒng)計學教學-logistic回歸分析_第2頁
精品課程醫(yī)學統(tǒng)計學教學-logistic回歸分析_第3頁
精品課程醫(yī)學統(tǒng)計學教學-logistic回歸分析_第4頁
精品課程醫(yī)學統(tǒng)計學教學-logistic回歸分析_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、.,第十五章 logistic回歸分析 Logistic Regression Analysis,山東大學公共衛(wèi)生學院,.,回歸分析的分類,多個因變量 (y1,y2,yk),一個因變量 y,.,logistic回歸(logistic regression)是研究因變量為二分類或多分類觀察結(jié)果與影響因素(自變量)之間關(guān)系的一種多變量分析方法,屬概率型非線性回歸。 在流行病學研究中,常需要分析疾病與各種危險因素間的定量關(guān)系,同時為了能真實反映暴露因素與觀察結(jié)果間的關(guān)系,需要控制混雜因素的影響。 (1)Mantel-Haenszel分層分析:適用于樣本量大、分析因素較少的情況。當分層較多時,由于要求

2、各格子中例數(shù)不能太少,所需樣本較大,往往難以做到;當混雜因素較多時,分層數(shù)也呈幾何倍數(shù)增長,這將導致部分層中某個格子的頻數(shù)為零,無法利用其信息。 (2)線性回歸分析:由于因變量是分類變量,不能滿足其正態(tài)性要求;有些自變量對因變量的影響并非線性。,.,logistic回歸:不僅適用于病因?qū)W分析,也可用于其他方面的研究,研究某個二分類(或無序及有序多分類)目標變量與有關(guān)因素的關(guān)系。 logistic回歸的分類: (1)二分類資料logistic回歸: 因變量為兩分類變量的資料,可用非條件logistic回歸和條件logistic回歸進行分析。非條件logistic回歸多用于非配比病例-對照研究或隊

3、列研究資料,條件logistic回歸多用于配對或配比資料。 (2)多分類資料logistic回歸: 因變量為多項分類的資料,可用多項分類logistic回歸模型或有序分類logistic回歸模型進行分析。,.,隊列研究(cohort study):也稱前瞻性研究、隨訪研究等。是一種由因及果的研究,在研究開始時,根據(jù)以往有無暴露經(jīng)歷,將研究人群分為暴露人群和非暴露人群,在一定時期內(nèi),隨訪觀察和比較兩組人群的發(fā)病率或死亡率。如果兩組人群發(fā)病率或死亡率差別有統(tǒng)計學意義,則認為暴露和疾病間存在聯(lián)系。隊列研究驗證的暴露因素在研究開始前已存在,研究者知道每個研究對象的暴露情況。,.,RR(相對危險度rel

4、ative risk):表示暴露組與非暴露組發(fā)病率(或死亡率)的比值。也稱為危險比(risk ratio)。反映了暴露與疾病發(fā)生的關(guān)聯(lián)強度。 RR表明暴露組發(fā)病或死亡的危險是非暴露組的多少倍。,.,病例對照研究(case-control studies):一種由果及因的回顧性研究,先按疾病狀態(tài)確定調(diào)查對象,分為病例(case)和對照(control)兩組,然后利用已有的記錄、或采用詢問、填寫調(diào)查表等方式,了解其發(fā)病前的暴露情況,并進行比較,推測疾病與暴露間的關(guān)系。,.,相對危險度RR的本質(zhì)是暴露組與非暴露組發(fā)病率之比或發(fā)病概率之比。但病例對照研究不能計算發(fā)病率,只能計算比值比OR值。OR與RR

5、的含義是相同的,也是指暴露組的疾病危險性為非暴露組的多少倍。當疾病發(fā)病率小于5%時,OR是RR的極好近似值。,OR1,說明 該因素是疾病的危險性增加,為危險因素;OR1,說明 該因素是疾病的危險性減小,為保護因素;,.,病例對照研究的類型,(一)病例與對照不匹配-非條件logistic回歸 在設(shè)計所規(guī)定的病例和對照人群中,分別抽取一定量的研究對象,一般對照應等于或多于病例數(shù),此外無其他任何限制。,(二)病例與對照匹配-條件logistic回歸 匹配或稱配比(matching),即要求對照在某些因素或特征上與病例保持一致,目的是對兩組比較時排除混雜因素的干擾。匹配分為成組匹配和個體匹配。,.,(

6、二)病例與對照匹配-條件logistic回歸 1、成組匹配(category matching):匹配的因素所占的比例,在對照組和在病例組一致。如病例組中男女各半,65歲以上者占1/3,則對照組也是如此。 2、個體匹配(individual matching):以病例和對照的個體為單位進行匹配叫個體匹配。1:1匹配又叫配對(pair matching), 1:2, ,1:m匹配時稱為匹配。 匹配的特征必須是已知的混雜因子,或者有充分的理由懷疑其為混雜因子,否則不應匹配。 (三)巢式病例對照研究 也稱為隊列內(nèi)的病例對照研究,是將隊列研究和病例對照研究相結(jié)合的方法。,.,第一節(jié) logistic回

7、歸,.,.,.,.,.,.,二、 logistic回歸模型的參數(shù)估計,.,.,.,例15-1,.,觀察例數(shù),.,.,.,三、logistic回歸模型的假設(shè)檢驗,.,.,對所擬合模型的假設(shè)檢驗:,.,四、變量篩選,.,例 某工作者在探討腎細胞癌轉(zhuǎn)移的有關(guān)臨床病理因素研究中,收集了一批行根治性腎切除術(shù)患者的腎癌標本資料,現(xiàn)從中抽取26例。試用logistic回歸分析篩選出于癌細胞轉(zhuǎn)移有關(guān)的危險因素(變量選入和剔除水平均為0.10)。,.,用逐步回歸法擬合模型,變量選入和剔除水平均為0.10,指定選項“des”是為了按照y=1(有轉(zhuǎn)移)的概率擬合模型。如果不加此選擇項,則軟件會按照y=0(無轉(zhuǎn)移)的

8、概率擬合模型,此時,應變量的排序水平發(fā)生顛倒,且所有參數(shù)估計的符號相反,OR值為原來的倒數(shù)。,.,.,logistic逐步回歸分析篩選出兩個有統(tǒng)計學意義的變量為x2和x4,回歸系數(shù)分別為2.4134和2.0963,比數(shù)比分別為11.172和8.136。結(jié)果中還給出了標準化偏回歸系數(shù),腎癌細胞核組織學分級(x4)在引起癌細胞轉(zhuǎn)移中的危險性大于腎細胞癌血管內(nèi)皮生長因子(x2)。,.,第二節(jié) 條件logistic回歸,.,.,.,.,.,.,例 研究肥胖(x1,肥胖為1,不肥胖為0)、口服避孕藥雌激素(x2,用藥為1,不用藥為0)與子宮內(nèi)膜癌(y,病例為0,對照為1)的關(guān)系,采用1:2配對做病例-對照研究,共調(diào)查20個配比組。試分析肥胖、口服避孕藥雌激素與子宮內(nèi)膜癌的關(guān)系。,.,.,.,第三節(jié) logistic回歸的應用及其注意事項,.,.,如果藥物或毒物不止一種,也可以用logistic模型分析其聯(lián)合作用。,.,4預測與判別 logistic回歸模型是一個概率型模型,對非條件Logistic回歸,在給定的條件下可通過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論