醫(yī)學(xué)研究中Logistic回歸與其他方法的結(jié)合應(yīng)用_第1頁
醫(yī)學(xué)研究中Logistic回歸與其他方法的結(jié)合應(yīng)用_第2頁
醫(yī)學(xué)研究中Logistic回歸與其他方法的結(jié)合應(yīng)用_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、醫(yī)學(xué)研究中Logistic回歸與其他方法的結(jié)合應(yīng)用 【關(guān)鍵詞】 Logistic回歸Logistic回歸(logistic regression)屬于概率型非線性回歸,是分析反應(yīng)變量為獨立分類資料的常用統(tǒng)計分析方法,由于對資料的正態(tài)性和方差齊性不做要求、對自變量類型也不做要求等,使得近年來Logistic回歸模型在醫(yī)學(xué)研究各個領(lǐng)域被廣泛用,如流行病學(xué)、病因?qū)W的隊列研究、病例對照研究,臨床診斷的判別模型,治療效果評價等。 同時與其他傳統(tǒng)的統(tǒng)計學(xué)方法一樣,Logistic回歸也有許多的應(yīng)用條件:當(dāng)自變量為連續(xù)型變量時,Logitp與自變量成線性,對多元共線性敏感,以及參數(shù)估計條件等17,使Logi

2、stic回歸在單獨面對醫(yī)學(xué)領(lǐng)域日益龐大和復(fù)雜多變的數(shù)據(jù)信息時,往往受到一定的限制,無法使數(shù)據(jù)信息得到充分利用,應(yīng)用不當(dāng)還會得出錯誤結(jié)論。因此隨著統(tǒng)計學(xué)方法的不斷發(fā)展和新的統(tǒng)計學(xué)方法的出現(xiàn),Logistic回歸在越來越多的醫(yī)學(xué)研究的文獻資料中常常不再獨自出現(xiàn),而是與其他方法相互結(jié)合取長補短,充分利用資料中的信息,從而得出相對正確的結(jié)論。本研究將對近幾年Logistic回歸在醫(yī)學(xué)研究中與其他方法相互結(jié)合及比較應(yīng)用作簡要介紹。1 主成分Logistic回歸分析 Logistic回歸模型與多元線性回歸一樣,對自變量中存在的多元共線性很敏感。自變量之間的任何相關(guān)都表示存在多元共線性。在多元共線性程度較高

3、時, 可能導(dǎo)致模型參數(shù)的不精確估計, 使變量的單獨影響不易分解出來, 從而把一些本應(yīng)對應(yīng)變量有顯著影響的變量排除在模型之外。解決共線性的方法一般有:刪除冗余的自變量,但在實際中往往會因為無法區(qū)別有意義的變量與冗余變量而誤刪,從而造成模型誤設(shè);增加樣本含量,使標準誤減少,抵消多重共線性的影響。但這種方法只有在多重共線性是由測量誤差引起或偶然存在于原始樣本而不存在于總體時才適用;用逐步Logistic回歸,尋求建立一種最佳回歸方程,這種方法容易損失一些信息;用主成分Logistic回歸,通過主成分變換,將高度相關(guān)的幾個變量的信息綜合起來參與回歸8,主成分分析能夠用少數(shù)變量對相關(guān)變量進行綜合,既能降

4、低指標的維數(shù),又能充分反映指標的信息,從而將變量間共線性問題減弱,對結(jié)果不產(chǎn)生影響,這是目前我們最常用的解決共線性的方法。但總的來說,主成分Logistic回歸也沒有從根本上克服Logistic回歸的共線性問題,仍然需要我們尋找更為有效的方法9,10。2 Logistic回歸在ROC分析中的應(yīng)用 ROC是受試者工作特征(Receiver Operating Characteristic)或相對工作特征(Relative Operating Characteristic)的縮寫, 目前已廣泛應(yīng)用于臨床診斷性能的評價, ROC曲線是以試驗結(jié)果的每一個值作為可能的診斷界值,由此計算得到相應(yīng)的靈敏度和

5、特異度,以假陽性率即特異度為橫坐標,以真陽性率即靈敏度為縱坐標繪制而成的曲線即為ROC曲線,其曲線下面積的大小可作為診斷試驗準確度的衡量指標,其取值范圍為0.51。ROC曲線下面積估計可分為參數(shù)和非參數(shù)兩種方法,在實際應(yīng)用中可根據(jù)樣本量大小來選擇使用11。ROC曲線下面積指標因其不受患病率和診斷界值的影響,以及可對兩個診斷試驗的準確度進行綜合比較,因而成為目前公認的最佳評價指標12。ROC 分析中結(jié)合Logistic回歸模型簡單有效,尤其適用于有協(xié)變量或多指標聯(lián)合診斷試驗的分析評價。在一項診斷試驗中,由于變異的存在,必然有很多混雜因素(或協(xié)變量) 對試驗的評價產(chǎn)生影響,它們可能對疾病的狀態(tài)產(chǎn)生

6、影響,也可能對測量結(jié)果產(chǎn)生影響。其中可以識別的因素,一般在試驗設(shè)計階段應(yīng)加以控制。但在實際工作中,由于病例來源問題,在設(shè)計階段進行控制非常困難,因此在統(tǒng)計分析階段,盡可能地識別、控制混雜因素(或協(xié)變量) 顯得尤為重要。Logistic回歸模型能夠納入診斷指標之外的影響因素,有效控制混雜因素,使ROC分析更接近于總體實際情況13。3 Logistic回歸與數(shù)據(jù)挖掘技術(shù)的結(jié)合應(yīng)用 數(shù)據(jù)挖掘(Data Mining)是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識的過程14。數(shù)據(jù)挖掘技術(shù)是近幾年興起來的一個新的研究領(lǐng)域,其與傳統(tǒng)數(shù)據(jù)分析

7、的本質(zhì)區(qū)別在于:數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識。目前與Logistic回歸的結(jié)合使用多見于以下形式: 分類樹模型:分類樹模型屬于決策樹(decision tree)15的一種形式。在應(yīng)用回歸模型分析因變量與自變量之間的回歸關(guān)系時,常常需要考慮各自變量之間對因變量可能存在的交互作用。當(dāng)模型中的自變量數(shù)量較多,需要考慮的交互作用就會比較復(fù)雜,操作起來有一定的困難。而分類樹模型作為一種人工智能分析方法,能夠快速尋找并發(fā)現(xiàn)對因變量的主要影響因素,并在展示自變量間交互作用上有著獨到的優(yōu)勢,但它無法分析自變量的線性疊加效應(yīng),并且往往把一些自變量之間的線性疊加效應(yīng)的關(guān)系錯誤地用分層關(guān)系

8、進行表達,而回歸模型不僅可以較方便地表達自變量之間的線性疊加效應(yīng),而且在已知樹模型結(jié)果的情況下,可以對應(yīng)構(gòu)造相應(yīng)的回歸模型表達分層的情況和實現(xiàn)分層統(tǒng)計分析。將這兩種模型的優(yōu)勢在分析層次數(shù)據(jù)時結(jié)合起來加以利用,將會大大方便研究工作16,17。 BP (Back propagation)神經(jīng)網(wǎng)絡(luò)18:BP神經(jīng)網(wǎng)絡(luò)是一種非傳統(tǒng)的多元非線性模型,自變量可以是連續(xù)的也可以是離散的,對變量不要求滿足正態(tài)性和獨立性等條件,可以識別變量間復(fù)雜的非線性關(guān)系,尤其是用現(xiàn)有統(tǒng)計方法無法達到目的或效果不好時,采用此模型往往收到很好的效果。當(dāng)然BP神經(jīng)網(wǎng)絡(luò)在使用過程中尚有些問題需要解決,如權(quán)重系數(shù)的假設(shè)檢驗,計算權(quán)重系數(shù)的可信區(qū)間,含隱含層時權(quán)重系數(shù)的醫(yī)學(xué)解釋,判斷輸入變量的判別能力,輸入變量的選擇等19,20。因此目前的很多文章中,都是將BP神經(jīng)網(wǎng)絡(luò)與Logistic回歸比較使用,來判斷其判別效果。 目前數(shù)據(jù)挖掘技術(shù)在醫(yī)學(xué)領(lǐng)域的應(yīng)用特別是與傳統(tǒng)統(tǒng)計方法的結(jié)合應(yīng)用還處于起步階段,隨著該方法的逐步普及,其與傳統(tǒng)統(tǒng)計方法優(yōu)勢互補的特點將會不斷顯現(xiàn),使用前景是十分廣闊的。 綜上幾個方面可以看出,在醫(yī)學(xué)研究中,無論是做為分析還是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論