多元線性回歸分析(第15章)課件_第1頁
多元線性回歸分析(第15章)課件_第2頁
多元線性回歸分析(第15章)課件_第3頁
多元線性回歸分析(第15章)課件_第4頁
多元線性回歸分析(第15章)課件_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

MultipleLinearRegressionAnalysis

多元線性回歸分析第15章第二軍醫(yī)大學(xué)衛(wèi)生統(tǒng)計學(xué)教研室張羅漫1MultipleLinearRegressionAna

講課內(nèi)容第一節(jié)多元線性回歸(重點)第二節(jié)自變量選擇方法(重點)第三節(jié)多元線性回歸的應(yīng)用及注意事項2講課內(nèi)容2第一節(jié)多元線性回歸一、多元線性回歸模型3第一節(jié)多元線性回歸一、多元線性回歸模型3

44

多元回歸:多個Y,多個X多重回歸:一個Y,多個X5多元回歸:多個Y,多個X5

β0

常數(shù)項βj

偏回歸系數(shù)(partialregressioncoefficient):

在其它自變量保持不變時,Xj增加或減少一個單位時Y的平均變化量。e去除m個自變量對Y影響后的隨機誤差。6β0常數(shù)項6

多元線性回歸模型應(yīng)用條件:1.Y與X1,X2,,Xm之間具有線性關(guān)系;2.各個Yi間相互獨立;3.e服從均數(shù)為0、方差為

2的正態(tài)分布。7多元線性回歸模型應(yīng)用條件:7

多元線性回歸分析步驟:1.根據(jù)樣本數(shù)據(jù)求得模型參數(shù)估計值:2.對回歸方程及各Xj作假設(shè)檢驗。8多元線性回歸分析步驟:8

二、多元線性回歸方程的建立9二、多元線性回歸方程的建立9YX10YX101111X1X2Y12X1X2Y12用最小二乘法解正規(guī)方程組,使殘差平方和Q最小。13用最小二乘法解正規(guī)方程組,使殘差平方和Q最小。131414用最小二乘法解正規(guī)方程組,使殘差平方和Q最小。15用最小二乘法解正規(guī)方程組,15

1616

1717

1818

三、多元線性回歸方程的假設(shè)檢驗及評價19三、多元線性回歸方程的19

(一)回歸方程的假設(shè)檢驗及評價1.方差分析法不全為0。20(一)回歸方程的假設(shè)檢驗及評價1.方差分析法不全為0

2121

2222

2.決定系數(shù)R2血糖含量變異的60%可由總膽固醇、甘油三酯、胰島素和糖化血紅蛋白的變異解釋。232.決定系數(shù)R2血糖含量變異的60%可由總膽固醇、甘3.復(fù)相關(guān)系數(shù)RY與多個自變量間的線性相關(guān)程度;Y與估計值間的Pearson相關(guān)系數(shù)r。243.復(fù)相關(guān)系數(shù)RY與多個自變量間的線性相關(guān)程度;24

(二)各自變量的假設(shè)檢驗及評價1.偏回歸平方和表示模型中含有其它m-1個自變量的條件下該自變量對Y的回歸貢獻。其值愈大說明相應(yīng)的自變量愈重要。25(二)各自變量的假設(shè)檢驗及評價1.偏回歸平方和表示模

2626

0.6129+11.9627+20.0635+27.7939≠133.7107270.6129+11.9627+20.0635+27.

胰島素(X3)與糖化血紅蛋白(X4)與血糖(Y)有線性回歸關(guān)系。28胰島素(X3)與糖化血紅蛋白(X4)與血糖(Y)有線

2.t檢驗法292.t檢驗法29

胰島素(X3)與糖化血紅蛋白(X4)與血糖(Y)有線性回歸關(guān)系。30胰島素(X3)與糖化血紅蛋白(X4)與血糖(Y)有線

標準化回歸系數(shù)bj’的絕對值用來比較各個自變量Xj對Y的影響程度大??;絕對值越大影響越大。標準化回歸方程的截距為0。3.標準化回歸系數(shù)標準化回歸系數(shù)與一般回歸方程的回歸系數(shù)的關(guān)系:標準化回歸方程

31標準化回歸系數(shù)bj’的絕對值用來比較各個自變量Xj對血糖影響大小的順序依次為糖化血紅蛋白(X4)、胰島素(X3)、甘油三酯(X2)與總膽固醇(X1)。胰島素為負向影響。32對血糖影響大小的順序依次為糖化血紅蛋白(X4)、胰島素(X3

第二節(jié)自變量選擇方法33第二節(jié)自變量選擇方法33

一、全局選擇法對自變量各種不同的組合所建立的回歸方程進行比較,從全部組合中挑出一個“最優(yōu)”的回歸方程。34一、全局選擇法34

R2可用來評價回歸方程優(yōu)劣。隨著自變量增加,R2不斷增大,對兩個不同個數(shù)自變量回歸方程比較,須考慮方程包含自變量個數(shù)影響,應(yīng)對R2進行校正。所謂“最優(yōu)”回歸方程指最大者。1.校正決定系數(shù)選擇法35R2可用來評價回歸方程優(yōu)劣。1.校正決定系數(shù)

P為方程中自變量個數(shù)。最優(yōu)方程的Cp期望值是p+1。應(yīng)選擇Cp最接近P+1的回歸方程為最優(yōu)。2.選擇法36P為方程中自變量個數(shù)。2.選擇法36

3737

二、逐步選擇法全局選擇計算量很大:6個變量,計算26-1=63個方程;10個變量,計算210-1=1023個方程。按選入變量順序不同分前進法、后退法

與逐步回歸法,共同特點是每一步只引入或剔除一個自變量Xj。38二、逐步選擇法38對Xj的取舍要進行F檢驗:計算進行到第l步時:p:方程中自變量個數(shù)SS回:Xj的偏回歸平方和SS殘:殘差平方和39對Xj的取舍要進行F檢驗:計算進行到第l步時:39

1.前進法(只選不剔)開始方程中無自變量,然后從方程外選取偏回歸平方和最大的自變量作F檢驗以決定是否選入方程,直至無自變量可以引入方程為止。缺點:后續(xù)變量的引入可能使先前引入的變量變的不重要。Xj入選401.前進法(只選不剔)缺點:后續(xù)變量的引入可能使先前

2.后退法(只剔不選)開始方程中包含全部自變量,然后從方程中選取偏回歸平方和最小的自變量作F檢驗以決定是否從方程中剔除,直至無自變量可以從方程中剔除為止。缺點:當某些自變量高度相關(guān)時,可能得不出正確結(jié)果。Xj剔除412.后退法(只剔不選)缺點:當某些自變量高度相關(guān)時,

3.逐步回歸法(先選后剔,雙向篩選)開始方程中無自變量,從方程外選取偏回歸平方和最大的自變量作F檢驗以決定是否選入方程;每引一個自變量進入方程后,從方程中選取偏回歸平方和最小的自變量作F檢驗以決定是否從方程中剔除;直至方程外無自變量可引入,方程內(nèi)無自變量可剔除為止。423.逐步回歸法(先選后剔,雙向篩選)42

Xj剔除內(nèi)剔Xj入選外引α入值定的越小選取自變量標準越嚴,被選入方程內(nèi)自變量數(shù)越少。α入值越大則反之。小樣本:α入=0.05,α出=0.10。

大樣本:α入=0.10,α出=0.15。

α入<α出,以免Xj上一步剔除后下一步又被選入43Xj剔除內(nèi)剔Xj入選外引α入值定的越小選取自變量標準

選X4前先建立4個直線回歸方程;選X1前先建立1個含3個自變量、3個含2個自變量的多元線性回歸方程。44選X4前先建立4個直線回歸方程;44

4545

4646

4747

4848

4949第三節(jié)多元線性回歸的應(yīng)用及注意事項50第三節(jié)50

一、多元線性回歸的應(yīng)用

1.影響因素分析

年齡(X1)飲食習慣(X2)吸煙狀況(X3)工作緊張度(X4)家族史(X5)

高血壓(Y)bj的意義為在其它自變量保持不變時,Xj增加或減少一個單位時Y的平均變化量。故可排除混雜因素。51一、多元線性回歸的應(yīng)用年齡(X1)高血壓(Y)bj

2.估計與預(yù)測心臟表面積(Y)=b0+b1心臟橫徑(X1)+b2心臟縱徑(X2)+b3心臟寬徑(X3)新生兒體重(Y)=b0+b1胎兒孕齡(X1)+b2胎兒頭徑(X2)+b3胎兒胸徑(X3)+b4胎兒腹徑(X4)522.估計與預(yù)測52

3.統(tǒng)計控制利用回歸方程進行逆估計,確定Y后控制X。采用射頻治療儀治療腦腫瘤:腦皮質(zhì)毀損半徑(Y)=b0+b1射頻溫度(X1)+b2照射時間(X2)533.統(tǒng)計控制53

二、多元線性回歸應(yīng)用的注意事項

1.指標的數(shù)量化

應(yīng)變量Y為連續(xù)變量自變量X可為連續(xù)、有序分類或無序分類變量(1)連續(xù)變量:X(2)有序分類變量:1輕X=2中3重54二、多元線性回歸應(yīng)用的注意事項54

(3)無序分類變量啞變量(dummyvariables)55(3)無序分類變量啞變量(dummyvariabl

2.樣本含量

n至少是X個數(shù)m的5~10倍3.多重共線性

實際應(yīng)用中非常普遍,可使最小二乘法建立的回歸方程失效;消除方法:主成分回歸;剔除某個造成共線性的自變量。562.樣本含量56

4.變量間的交互作用某一自變量對Y的作用大小與另一自變量的取值有關(guān)。血糖(Y)與總膽固醇(X1)、甘油三酯(X2)、胰島素(X3)、糖化血紅蛋白(X4)間逐步回歸方程:X3與X4間有交互作用:574.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論