多元線性回歸與曲線擬合_第1頁(yè)
多元線性回歸與曲線擬合_第2頁(yè)
多元線性回歸與曲線擬合_第3頁(yè)
多元線性回歸與曲線擬合_第4頁(yè)
多元線性回歸與曲線擬合_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十章:多元線性回歸與曲線擬合――

Regression菜單詳解(上)回歸分析是處理兩個(gè)及兩個(gè)以上變量間線性依存關(guān)系的統(tǒng)計(jì)方法。在醫(yī)學(xué)領(lǐng)域中,此類(lèi)問(wèn)題很普遍,如人頭發(fā)中某種金屬元素的含量與血液中該元素的含量有關(guān)系,人的體表面積與身高、體重有關(guān)系;等等?;貧w分析就是用于說(shuō)明這種依存變化的數(shù)學(xué)關(guān)系?!?0.1Linear過(guò)程10.1.1簡(jiǎn)單操作入門(mén)調(diào)用此過(guò)程可完成二元或多元的線性回歸分析。在多元線性回歸分析中,用戶(hù)還可根據(jù)需要,選用不同篩選自變量的方法(如:逐步法、向前法、向后法,等)。例10.1:請(qǐng)分析在數(shù)據(jù)集Fatsurfactant.sav中變量fat對(duì)變量spovl的大小有無(wú)影響?顯然,在這里spovl是連續(xù)性變量,而fat是分類(lèi)變量,我們可用用單因素方差分析來(lái)解決這個(gè)問(wèn)題。但此處我們要采用和方差分析等價(jià)的分析方法--回歸分析來(lái)解決它。回歸分析和方差分析都可以被歸入廣義線性模型中,因此他們?cè)谀P偷亩x、計(jì)算方法等許多方面都非常近似,下面大家很快就會(huì)看到。這里spovl是模型中的因變量,根據(jù)回歸模型的要求,它必須是正態(tài)分布的變量才可以,我們可以用直方圖來(lái)大致看一下,可以看到基本服從正態(tài),因此不再檢驗(yàn)其正態(tài)性,繼續(xù)往下做。10.1.1.1界面詳解在菜單中選擇Regression==>liner,系統(tǒng)彈出線性回歸對(duì)話框如下:除了大家熟悉的內(nèi)容以外,里面還出現(xiàn)了一些特色菜,讓我們來(lái)一一品嘗?!綝ependent框】用于選入回歸分析的應(yīng)變量?!綛lock按鈕組】由Previous和Next兩個(gè)按鈕組成,用于將下面Independent框中選入的自變量分組。由于多元回歸分析中自變量的選入方式有前進(jìn)、后退、逐步等方法,如果對(duì)不同的自變量選入的方法不同,則用該按鈕組將自變量分組選入即可。下面的例子會(huì)講解其用法?!綢ndependent框】用于選入回歸分析的自變量?!綧ethod下拉列表】用于選擇對(duì)自變量的選入方法,有Enter(強(qiáng)行進(jìn)入法)、Stepwise(逐步法)、Remove(強(qiáng)制剔除法)、Backward(向后法)、Forward(向前法)五種。該選項(xiàng)對(duì)當(dāng)前Independent框中的所有變量均有效。模型系數(shù)b系數(shù)標(biāo)準(zhǔn)誤系數(shù)βt值P值1常數(shù)5.0970.42711.9230.000fat0.7000.2020.5783.4730.00210.1.2復(fù)雜實(shí)例操作10.1.2.1分析實(shí)例例10.2:請(qǐng)分析在數(shù)據(jù)集plastic.sav中變量extrusn、additive、gloss和opacity對(duì)變量tear_res的大小有無(wú)影響?已知extrusn對(duì)tear_res的大小有影響。顯然,這里是一個(gè)多元回歸,由于除了extrusn確有影響以外,我們不知道另三個(gè)變量有無(wú)影響,因此這里我們將extrusn放在第一個(gè)block,進(jìn)入方法為enter(我們有把握extrusn一定有統(tǒng)計(jì)學(xué)意義);另三個(gè)變量放在第二個(gè)block,進(jìn)入方法為stepwise(讓軟件自動(dòng)選擇判斷),操作如下:Analyze==>Regression==>LinerDependent框:選入tear_resIndependent框:選入extrusn;單擊next鈕Independent框:選入additive、gloss和opacity;Method列表框:選擇stepwise單擊OK鈕10.1.2.2結(jié)果解釋最終的結(jié)果如下:Regression上面的表格依次列出了模型的篩選過(guò)程,模型1用進(jìn)入法引入了extrusn,然后模型2用stepwise法引入了additive,另兩個(gè)變量因沒(méi)有達(dá)到進(jìn)入標(biāo)準(zhǔn),最終沒(méi)有進(jìn)入。上面的表格翻譯出來(lái)如下:模型進(jìn)入的變量移出的變量變量篩選方法1extrusn進(jìn)入法2additivestepwise法(標(biāo)準(zhǔn):進(jìn)入概率小于0.05,移出概率大于0.1)上表是兩個(gè)模型變異系數(shù)的改變情況,從調(diào)整的R2可見(jiàn),從上到下隨著新變量的引入,模型可解釋的變異占總變異的比例越來(lái)越大。上表是所用兩個(gè)模型的檢驗(yàn)結(jié)果,用的方法是方差分析,可見(jiàn)二個(gè)模型都有統(tǒng)計(jì)學(xué)意義。上表仍然為三個(gè)模型中各個(gè)系數(shù)的檢驗(yàn)結(jié)果,用的是t檢驗(yàn),可見(jiàn)在模型2中所有的系數(shù)都有統(tǒng)計(jì)學(xué)意義,上表的內(nèi)容翻譯如下:

未標(biāo)化的系數(shù)標(biāo)化的系數(shù)

模型

B標(biāo)準(zhǔn)誤Betat值P值1(常數(shù))5.900.265

22.278.000

extrusion.590.167.6393.522.0002(常數(shù))5.315.314

16.926.000

extrusion.590.144.6394.905.000

additive.390.144.4222.707.000這是新出現(xiàn)的一個(gè)表格,反映的是沒(méi)有進(jìn)入模型的各個(gè)變量的檢驗(yàn)結(jié)果,可見(jiàn)在模型1中,未引入模型的候選變量additive還有統(tǒng)計(jì)學(xué)意義,可能需要引入,而模型2中沒(méi)有引入的兩個(gè)變量其P值均大于0.05,無(wú)需再進(jìn)行分析了。10.2CurveEstimation過(guò)程CurveEstimation過(guò)程可以用與擬合各種各樣的曲線,原則上只要兩個(gè)變量間存在某種可以被它所描述的數(shù)量關(guān)系,就可以用該過(guò)程來(lái)分析。但這里我們要指出,由于曲線擬合非常的復(fù)雜,而該模塊的功能十分有限,因此最好采用將曲線相關(guān)關(guān)系通過(guò)變量變換的方式轉(zhuǎn)化為直線回歸的形式來(lái)分析,或者采用其他專(zhuān)用的模塊分析。10.2.1界面詳解CurveEstimation過(guò)程中有特色的對(duì)話框界面內(nèi)容如下:下面我們分別解釋一下它們的具體功能。【Dependent框】用于選入曲線擬和中的應(yīng)變量,可選入多個(gè),如果這樣,則對(duì)各個(gè)應(yīng)變量分別擬合模型?!綢ndependent單選框組】用于選入曲線擬和中的自變量,有兩種選擇,可以選入普通的自變量,也可以選擇時(shí)間作為自變量,如果這樣做,則所用的數(shù)據(jù)應(yīng)為時(shí)間序列數(shù)據(jù)格式?!綧odels復(fù)選框組】是該對(duì)話框的重點(diǎn),用于選擇所用的曲線模型,可用的有:Linear:擬合直線方程,實(shí)際上與Linear過(guò)程的二元直線回歸相同;Quadratic:擬合二次方程Y=b0+b1X+b2X2;Compound:擬合復(fù)合曲線模型Y=b0×b1X;Growth:擬合等比級(jí)數(shù)曲線模型Y=e(b0+b1X);Logarithmic:擬合對(duì)數(shù)方程Y=b0+b1lnX;Cubic:擬合三次方程Y=b0+b1X+b2X2+b3X3;S:擬合S形曲線Y=e(b0+b1/X);Exponential:擬合指數(shù)方程Y=b0eb1X;Inverse:數(shù)據(jù)按Y=b0+b1/X進(jìn)行變換;Power:擬合乘冪曲線模型Y=b0Xb1;Logistic:擬合Logistic曲線模型Y=1/(1/u+b0×b1X),如選擇該線型則要求輸入上界。上面的幾種線型和其他的模塊有重復(fù),如Logistic、Liner等,由于本模塊的功能有限,在重復(fù)的情況下建議用其它專(zhuān)用模塊來(lái)分析?!綢ncludeconstantinequation復(fù)選框】確定是否在方程中包含常數(shù)項(xiàng)?!綪lotmodels復(fù)選框】要求對(duì)模型做圖,包括原始數(shù)值的連線圖和擬合模型的曲線圖?!緎ave鈕】彈出SAVE對(duì)話框,用于定義想要存儲(chǔ)的中間結(jié)果,如預(yù)測(cè)值、預(yù)測(cè)值可信區(qū)間、殘差等?!綝isplayANOVAtable復(fù)選框】要求顯示模型檢驗(yàn)的方差分析表。10.2.2實(shí)例操作例10.3:錫克試驗(yàn)陰性率(%)隨著年齡的增長(zhǎng)而增高,某地查得兒童年齡(歲)X與錫克試驗(yàn)陰性率Y的資料如下,試擬合曲線。年齡(歲)1234567錫克試驗(yàn)陰性率(%)57.176.090.993.096.795.696.2首先對(duì)年齡和陰性率作散點(diǎn)圖,發(fā)現(xiàn)兩者有斜率逐漸放緩的曲線趨勢(shì),因此選擇二次曲線模型、三次曲線模型和對(duì)數(shù)曲線模型,最終取其中結(jié)果最優(yōu)者,做法如下:Analyze==>Regression==>CurveestimationDependant框:選入陰性率Independant框:選入年齡Models復(fù)選框組:選擇Quadratic、Curbe、Logarithmatic,取消對(duì)Liner的選擇。單擊OK結(jié)果如下:CurveFitMODEL:MOD_11.Independent:年齡DependentMthRsqd.f.FSigfb0b1b2b3陰性率LOG.913552.32.00161.325920.6704陰性率QUA.970465.20.00139.271421.8250-2.0036陰性率CUB.9943165.37.00125.571437.4278-6.5702.3806上表給出了所擬合的三個(gè)模型的檢驗(yàn)報(bào)告,包括擬合優(yōu)度、模型的檢驗(yàn)結(jié)果和各個(gè)系數(shù)值,從檢驗(yàn)結(jié)果看,三個(gè)模型均有統(tǒng)計(jì)學(xué)意義,但從擬合優(yōu)度看,三次方曲線的擬合優(yōu)度最高,似乎應(yīng)選擇三次方曲線,但注意三次方曲線多一個(gè)參數(shù),要復(fù)雜一些,而它的擬合優(yōu)度和二次方曲線相差不大,因此僅從這里的結(jié)果還不好對(duì)它們兩者作出判斷,下面我們還要看看模型曲線的情況。上圖是三個(gè)模型曲線和實(shí)際值連線的情況,可見(jiàn)在4歲以前,二次方和三次方曲線對(duì)模型的擬合相差不大,4歲以后三次方曲線則要明顯優(yōu)于二次方曲線,但我們的觀察值只有

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論