第十二講多重線性回歸演示文稿_第1頁
第十二講多重線性回歸演示文稿_第2頁
第十二講多重線性回歸演示文稿_第3頁
第十二講多重線性回歸演示文稿_第4頁
第十二講多重線性回歸演示文稿_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第十二講多重線性回歸演示文稿目前一頁\總數(shù)二十七頁\編于十點(diǎn)(優(yōu)選)第十二講多重線性回歸目前二頁\總數(shù)二十七頁\編于十點(diǎn)第11講多重線性回歸—引言在醫(yī)藥研究中,應(yīng)變量的變化往往受到多個(gè)因素的影響,此時(shí)就需要用多重線性回歸(MultipleLinearRegression),多重線性回歸是直線回歸的擴(kuò)展。例如,人的體重與身高、胸圍有關(guān);人的心率與年齡、體重、肺活量有關(guān)。因此,采用兩個(gè)或多個(gè)影響因素作為自變量(Xi)來解釋應(yīng)變量(Y)的變化,建立最優(yōu)組合模型來預(yù)測或估計(jì)因變量,比只用一個(gè)自變量進(jìn)行預(yù)測或估計(jì)更有效,更符合實(shí)際。目前三頁\總數(shù)二十七頁\編于十點(diǎn)第一節(jié)多重線性回歸一、多重線性回歸模型

Y=β0+β1X1+β2X2+…+βmXm+e

二、多重線性回歸的基本條件多重線性回歸模型的應(yīng)用條件同直線回歸,即線性(linearity)、獨(dú)立性(indepen-dency)、正態(tài)性和方差齊性(normaldistributionandequalvariance)等條件,簡記LINE。還要注意個(gè)自變量間不能存在多重共線性。目前四頁\總數(shù)二十七頁\編于十點(diǎn)三、多重線性回歸分析的步驟目前五頁\總數(shù)二十七頁\編于十點(diǎn)四、多重共線性問題如果一些自變量之間存在較強(qiáng)的線性關(guān)系,稱多重共線性。判斷多重共線有相關(guān)系數(shù)、容忍度、方差膨脹因子等指標(biāo)。一般來說,相關(guān)系數(shù)r>0.8的變量可能存在共線問題,r>0.9的變量存在共線。容忍度=1-R2,愈小說明共線問題愈嚴(yán)重,如果某個(gè)自變量的容忍度<0.1,共線問題嚴(yán)重。方差膨脹因子=容忍度的倒數(shù),愈大說明共線問題愈嚴(yán)重。消除多重共線性的方法有多種,如嶺回歸、主成分回歸等。目前六頁\總數(shù)二十七頁\編于十點(diǎn)五、多重回歸的樣本含量只要例數(shù)n多于自變量個(gè)數(shù)m即可,一般要求n為m的5倍以上。六、多重回歸的檢驗(yàn)多元線性回歸方程的假設(shè)檢驗(yàn):①對整個(gè)方程的綜合檢驗(yàn),即對回歸方程的線性假設(shè)檢驗(yàn);②對每一個(gè)自變量的檢驗(yàn),即對每個(gè)偏回歸系數(shù)的假設(shè)檢驗(yàn)。目前七頁\總數(shù)二十七頁\編于十點(diǎn)⑴回歸方程的方差分析剩余標(biāo)準(zhǔn)差

剩余標(biāo)準(zhǔn)差的平方是殘差的方差,又稱均方誤差,記為MSE,其值越小越好(2)偏回歸系數(shù)的假設(shè)檢驗(yàn)分別考察每一個(gè)自變量xi與應(yīng)變量Y是否都有直線回歸關(guān)系

目前八頁\總數(shù)二十七頁\編于十點(diǎn)R2=SS回

/SS總

校正決定系數(shù)是衡量方程好壞的常用指標(biāo)之一

七、決定系數(shù)八、標(biāo)準(zhǔn)化偏回歸系數(shù)

目前九頁\總數(shù)二十七頁\編于十點(diǎn)九、殘差分析

目前十頁\總數(shù)二十七頁\編于十點(diǎn)目前十一頁\總數(shù)二十七頁\編于十點(diǎn)資料不滿足其條件時(shí),常用的處理方法有:修改模型或者采用曲線擬合;變量變換,常用的變量變換有對數(shù)變換、平方根變換、倒數(shù)變換等。變量變換對自變量或(和)應(yīng)變量均適宜;如果方差不齊,可采用加權(quán)最小二乘法估計(jì)偏回歸系數(shù)。

目前十二頁\總數(shù)二十七頁\編于十點(diǎn)(1)分析因素的相對重要性,找出對因變量最大的關(guān)鍵因素。(2)同時(shí)調(diào)整多個(gè)混雜因素的作用(類似多元協(xié)方差分析調(diào)整多個(gè)混雜因素的作用)。(3)估計(jì)與預(yù)測,用較易測量的多個(gè)自變量來估計(jì)難以測得應(yīng)變量總體均數(shù)μY或預(yù)測個(gè)體Y值。(4)多重回歸分析是進(jìn)一步學(xué)習(xí)logistic回歸、判別分析、主成分分析、因子分析等多元統(tǒng)計(jì)分析方法的基礎(chǔ)。十一、篩選自變量方法十、多元回歸分析的應(yīng)用

目前十三頁\總數(shù)二十七頁\編于十點(diǎn)(1)全局擇優(yōu)法:m個(gè)自變量的不同組合共有2m-1種,分別建立回歸方程進(jìn)行比較后擇優(yōu)。擇優(yōu)的準(zhǔn)則有多種,準(zhǔn)則不同,篩選的結(jié)果可能不同。如果用最大校正決定系數(shù)準(zhǔn)則,則挑選校正決定系數(shù)R2a最大者來獲得“最優(yōu)子集”的回歸方程。SPSS為Enter法。(2)逐步選擇法:備選自變量較多時(shí),全局擇優(yōu)的計(jì)算量非常大,用逐步回歸法選擇可減少計(jì)算量。常用逐步(Stepwise)、向前(Forward)、向后(Backward)法。向后法考慮了自變量的組合作用,但變量數(shù)不能太多。3種逐步回歸方法選中的自變量不一定相同。逐步回歸得到只是局部最優(yōu),不一定是全局最優(yōu)回歸方程。目前十四頁\總數(shù)二十七頁\編于十點(diǎn)將自變量的交互項(xiàng)引入方程進(jìn)行檢驗(yàn)分析。

十二、自變量間交互作用的分析

【例17-1】大白鼠作受試對象,分析烏頭堿不同注射速度x1、常咯啉的不同劑量x2,大鼠體重x3與應(yīng)變量延緩心律失常發(fā)生的時(shí)間Y的關(guān)系。編號123456789101112131415X14.85.67.14.92.66.65.25.54.76.85.42.94.03.13.1X20.080.070.010.070.110.110.070.110.030.010.020.210.010.110.10X3230260252229220247233222206244222226234212212Y19.115.714.919.020.917.519.221.820.514.518.623.216.822.721.9目前十五頁\總數(shù)二十七頁\編于十點(diǎn)

【SPSS操作】以X1、X2、X3、Y為變量名建立數(shù)據(jù)文件L17-1.SAV。DataViewVariableView目前十六頁\總數(shù)二十七頁\編于十點(diǎn)→Analyze→Regression→Linear…..Y選Dependent框、X1、X2、X3選Independent框。Method框選Stepwise。目前十七頁\總數(shù)二十七頁\編于十點(diǎn)校正決定系數(shù)R2a=0.968,擬合效果好。第2步回歸的F=209.539,P=0.000,故線性回歸模型有統(tǒng)計(jì)學(xué)意義。目前十八頁\總數(shù)二十七頁\編于十點(diǎn)共線性診斷大鼠體重和??┻鴦┝康娜萑潭榷紴?.940,方差膨脹因子都為1.064,可認(rèn)為不存在共線問題。建立線性回歸方程為Y=45.110+28.844×??┻鴦┝浚?.123×大鼠體重大鼠體重、常咯啉劑量的標(biāo)準(zhǔn)回歸系數(shù)分別為-0.682、0.564??梢妼ρ泳徯穆墒Сr(shí)間影響的重要性大鼠體重大于??┻鴦┝?。目前十九頁\總數(shù)二十七頁\編于十點(diǎn)因主要考察因素x1未進(jìn)入方程,分析自變量間的交互作用,→Transform→Compute,計(jì)算X12、X13、X23。將X1,*,X2送NumericExpression,X12送TargetVariable目前二十頁\總數(shù)二十七頁\編于十點(diǎn)→Transform→Compute,計(jì)算X12、X13、X23。目前二十一頁\總數(shù)二十七頁\編于十點(diǎn)用原變量連同交互作用變量建立回歸方程:X12、X13、X23送IndependentMethod選EnterOK目前二十二頁\總數(shù)二十七頁\編于十點(diǎn)3個(gè)變量+3個(gè)交互作用變量共6個(gè)自變量,不同組合有26-1=63種,Method框選Ente,建立的63個(gè)回歸方程中,R2a=0.980最大方差分析F值63.724,方程有統(tǒng)計(jì)學(xué)意義目前二十三頁\總數(shù)二十七頁\編于十點(diǎn)最優(yōu)方程:Y=28.793+1.795x1+130.891x2-0.048x3+3.188x12-0.009x13-0.502x23。x2標(biāo)化系數(shù)=2.561最大,??┻鴦┝繉ρ泳徯穆墒С0l(fā)生時(shí)間作用最大。x23標(biāo)化偏回歸系數(shù)=-2.213絕對值第二大,常咯啉劑量與大鼠體重的交互效應(yīng)對延緩心律失常發(fā)生時(shí)間產(chǎn)生負(fù)面影響不可勿視。目前二十四頁\總數(shù)二十七頁\編于十點(diǎn)(1)二分類自變量常采用0、1賦值方法。如,用X代表性別:X=0為女,X=1為男,或者用X=1為女,X=0為男。十三、分類變量賦值方法

(2)指標(biāo)為無序k類,定義k-1個(gè)二分類啞變量。例如,中醫(yī)治崩漏,分腎虛、肝虛、肝郁、血虛4型,只要用3個(gè)二分類變量X1,X2,X3就能標(biāo)記這4個(gè)類別。崩漏分型X1X2X3腎虛型100肝虛型010肝郁型001血虛型000目前二十五頁\總數(shù)二十七頁\編于十點(diǎn),,

(3)有序分類變量數(shù)量化方法:①對等級根據(jù)級別大小進(jìn)行量化后按連續(xù)變量處理。例如,用X=1,2,3分別為表示病情輕,中,重。②用無序多分類變量設(shè)置啞變量的方法。采用哪種方法更好要視具體情況而定。

第二

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論