醫(yī)學(xué)多元線性回歸和相關(guān)專題課件_第1頁
醫(yī)學(xué)多元線性回歸和相關(guān)專題課件_第2頁
醫(yī)學(xué)多元線性回歸和相關(guān)專題課件_第3頁
醫(yī)學(xué)多元線性回歸和相關(guān)專題課件_第4頁
醫(yī)學(xué)多元線性回歸和相關(guān)專題課件_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

多元線性回歸和相關(guān)第一節(jié)多重線性回歸的概念及其統(tǒng)計描述一重線性回歸是描述一個應(yīng)變量與一個自變量間線性依存的一種分析方法。但醫(yī)學(xué)研究中,一種事物現(xiàn)象的數(shù)量關(guān)系往往與多種事物現(xiàn)象的數(shù)量變化有關(guān),如肺活量與年齡、體重、胸圍等有關(guān)。這些事物現(xiàn)象間的關(guān)系在應(yīng)變量的取值上可以是確定型的與概率型的;在幾何上可以是線性的,也可以是非線性的。多重線性回歸是確定型的線性回歸,是研究一個應(yīng)變量與多個自變量間線性依存關(guān)系數(shù)量變化規(guī)律的一種方法。一、數(shù)據(jù)與模型觀察單位應(yīng)變量自變量yX1X2…Xk1y1X11X12…X1k2y2X21X22…X2k………………nynXn1Xn2…Xnk假定y與x1,x2,,…,xk間存在線性關(guān)系,則y滿足多重線性回歸模型:按最小二乘法(leastsquaresmethod)估計原理,計算式中的各項偏回歸系數(shù)的估計值bi二、回歸參數(shù)的估計2.建立正規(guī)方程組(normalequations)1.計算基本統(tǒng)計量例11.1例13-1為了研究空氣中一氧化氮(NO)的濃度與汽車流量、氣溫、空氣濕度和風(fēng)速的關(guān)系,測定數(shù)據(jù)如下:車流x1氣溫x2氣濕x3風(fēng)速x4一氧化氮y130020.0800.450.066144423.0570.500.07678626.5641.500.001165223.0840.400.170……………143628.0682.000.099空氣中NO濃度與相關(guān)因素的檢測數(shù)據(jù)例13-1的SAS程序DATAa1;/*建立SAS數(shù)據(jù)集*/INPUTx1-x4y;DATALINES;130020.0800.450.066144423.0570.500.07678626.5641.500.001165223.0840.400.170175629.5720.900.156175430.0760.800.120120022.5691.800.040150021.8770.600.120120027.0581.700.100147627.0650.650.129182022.0830.400.135143628.0682.000.09994822.5692.000.005144021.5792.400.011108428.5593.000.003184426.0731.000.140111635.0922.800.039165620.0831.450.059153623.0571.500.08796024.8671.500.039178423.3830.900.222149627.0650.650.145106026.0581.830.029143628.0682.000.099;PROCREGCORR;/*線性回歸模型*/MODELy=x1-x4/PARTIALSTB;MODELy=x1-x4/SELECTION=STEPWISE;RUN;例13-1的回歸SAS結(jié)果ParameterEstimatesParameterStandardtforH0:VariableDFEstimateErrorParameter=0Prob>|t|INTERCEP1-0.1416630.06916107-2.0480.0546X110.0001160.000027484.2270.0005X210.0044940.001901122.3640.0289X31-0.0000065520.00069083-0.0090.9925X41-0.0346850.01081187-3.2080.0046回歸方程:第二節(jié)多重線性回歸方程的假設(shè)檢驗?zāi)康模嚎疾旎貧w方程是否符合資料特點1.方差分析法H0:β1=β2=…=βk=0

統(tǒng)計量:例13-1資料的方差分析適度檢驗ANOVA分析表analysisofVariance

SourceDFSSMSFPModel40.063960.0159917.5900.0001Error190.017270.00091Total230.081232.偏回歸系數(shù)的t檢驗法在多重回歸分析中,可能有的自變量對應(yīng)變量的影響很強,而有的較弱,甚至完全沒有作用。這樣就有必要對自變量進行選擇,使回歸方程只包含對應(yīng)變量有統(tǒng)計學(xué)意義的自變量。對某一自變量xj的統(tǒng)計學(xué)檢驗等價于對其相應(yīng)的偏回歸系數(shù)βj作統(tǒng)計學(xué)假設(shè)檢驗。標(biāo)準(zhǔn)化偏回歸系數(shù)的分析結(jié)果

ParameterEstimatesParameterStandardtforH0:StandardizedVariableDFEstimateErrorParameter=0Prob>|t|EstimateINTERCEP1-0.1416630.06916107-2.0480.05460.00000000X110.0001160.000027484.2270.00050.59249273X210.0044940.001901122.3640.02890.27273677

X31-0.0000065520.00069083-0.0090.9925-0.00110011X41-0.0346850.01081187-3.2080.0046-0.44769883第三節(jié)復(fù)相關(guān)系數(shù)與偏相關(guān)系數(shù)1.確定系數(shù)R2(coefficientofdetermination)用于評價在y的總變異中,由x變量組建立的線性回歸方程所能解釋的比例。對R2的假設(shè)檢驗等價于對回歸方程的方差分析。H0:總體確定系數(shù)R2=0例13-1的確定系數(shù)2.復(fù)相關(guān)系數(shù)R

(multiplecorrelationcoefficient)

確定系數(shù)的平方根R稱為復(fù)相關(guān)系數(shù),0≤R≤1,它表示k個自變量共同對應(yīng)變量線性相關(guān)的密切程度。例13-1的復(fù)相關(guān)系數(shù):3.校正確定系數(shù)R2α(adjustedR-square)例13-1的校正確定系數(shù):4.偏相關(guān)系數(shù)(partialcorrelationcoefficient)在一共只有3個變量(不分自變量與因變量)時,偏相關(guān)系數(shù)的公式為:表13-4的相關(guān)SAS程序DATAA;INPUTx1-x3;cards;267722293978143045192431528106632618125333655136934690159335740176136780193137889223138996274939;PROC

CORR;varx1x2x3;run;proc

corr;varx1x2;partialx3;run;proc

corr;varx2x3;partialx1;run;proc

corr;varx1x3;partialx2;RUN;表13-4的SAS結(jié)果PearsonCorrelationCoefficients,N=11Prob>|r|underH0:Rho=0x1x2x3x11.000000.972390.98909<.0001<.0001x20.972391.000000.97617<.0001<.0001x30.989090.976171.00000<.0001<.0001x1x2x11.000000.21495

x20.214951.00000p=0.5509x2x3x21.000000.41860x30.418601.00000p=0.2286x1x3x11.000000.78728

x30.787281.00000

p=0.0069第四節(jié)自變量篩選(1)向后剔除法(backwardselection)先建立一個包含全部自變量的回歸方程,然后每次剔除一個偏回歸系數(shù)最小且無統(tǒng)計學(xué)意義的自變量,由多到少直至不能剔除時為止。(2)向前引入法(forwardselection)回歸方程由一個自變量開始,每次引入一個偏回歸平方和最大且具有統(tǒng)計學(xué)意義的變量,由少到多直至無顯著性變量可引入。(3)逐步篩選法(stepwiseselection)取上述兩種方法的優(yōu)點,在向前引入一個新自變量之后,都應(yīng)重新對前已選入自變量進行檢查,以評價有無保留在方程中的價值。為此,引入和剔除交替進行,直至無具有統(tǒng)計學(xué)意義的新變量可以引入,同時也無可剔除的無統(tǒng)計學(xué)意義的自變量。篩選方法:例13-1的篩選自變量的SAS結(jié)果ParameterEstimatesParameterStandardtforH0:VariableDFEstimateErrorParameter=0Prob>|t|INTERCEP1-0.1419990.05790491-2.4520.0235X110.0001160.000024704.6990.0001X210.0044950.001849422.4300.0246X41-0.0346970.01046340-3.3160.0034篩選原則1.確定系數(shù)R21篩選原則2.殘差均方MS誤差0篩選原則3.Cp選模型自變量個數(shù)+1見表13-6多元回歸應(yīng)用的注意事項(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論