淺談多因變量的多元回歸算法的研究_第1頁(yè)
淺談多因變量的多元回歸算法的研究_第2頁(yè)
淺談多因變量的多元回歸算法的研究_第3頁(yè)
淺談多因變量的多元回歸算法的研究_第4頁(yè)
淺談多因變量的多元回歸算法的研究_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、    淺談多因變量的多元回歸算法的研究    摘要:用一個(gè)因變量與多個(gè)自變量進(jìn)行回歸是多數(shù)求解問(wèn)題中采用的方法,但進(jìn)行多元線性回歸得到的回歸方程經(jīng)過(guò)檢驗(yàn)后發(fā)現(xiàn)擬合效果往往不好。因此,本文以“低保標(biāo)準(zhǔn)”這一實(shí)際問(wèn)題為例,通過(guò)多因變量的多元回歸算法分析不同地區(qū)“低保標(biāo)準(zhǔn)”之間的相關(guān)性,能夠有效地避免丟失各地區(qū)之間相互關(guān)聯(lián)的信息,說(shuō)明多因變量的多元回歸算法可以更好地解決實(shí)際問(wèn)題。關(guān)鍵詞:多因變量的多元回歸算法、嶺回歸、相關(guān)性0 引言對(duì)于多對(duì)多的回歸問(wèn)題,可以轉(zhuǎn)化為多個(gè)多元回歸問(wèn)題來(lái)解決。但對(duì)求解各地之間低保標(biāo)準(zhǔn)的相關(guān)性的問(wèn)題,每個(gè)地區(qū)的因變量之間存在著一定的

2、聯(lián)系,如果分別建立各地區(qū)的低保標(biāo)準(zhǔn)與其指標(biāo)自變量的回歸關(guān)系式,會(huì)丟失各地低保標(biāo)準(zhǔn)之間相互關(guān)聯(lián)的信息。這就需要多因變量的多元回歸算法來(lái)分析實(shí)際問(wèn)題。1 算法過(guò)程1.1 多元線性回歸及回歸診斷在這里選取了北京、上海市2010-2016年的相關(guān)數(shù)據(jù)(如表1,表2所示),在sas軟件下編程進(jìn)行了分析。對(duì)該模型進(jìn)行回歸診斷,結(jié)果如下:圖1經(jīng)驗(yàn)表明:當(dāng)vifj10時(shí),就說(shuō)明自變量xj與其余自變量之間存在嚴(yán)重的多重共線性關(guān)系,eigenvalue(特征根)有幾個(gè)接近于0,就有幾個(gè)多重共線性關(guān)系,conditon index(條件數(shù))在10100之間時(shí),變量存在著較強(qiáng)的共線性關(guān)系。根據(jù)這些統(tǒng)計(jì)量的檢驗(yàn),我們可

3、以發(fā)現(xiàn)多因變量多元線性回歸結(jié)果存在較強(qiáng)的多重共線性關(guān)系,且p值較大,不能通過(guò)檢驗(yàn),然而同類之間的因變量、指標(biāo)變量均具有較強(qiáng)的相關(guān)性,因此利用多因變量多元逐步回歸以及嶺回歸的方法對(duì)結(jié)果進(jìn)行修正。表1 北京市2010-2016年的相關(guān)數(shù)據(jù)表2 上海市2010-2016年的相關(guān)數(shù)據(jù)1.2 多因變量的多元逐步回歸多因變量的多元逐步回歸與一個(gè)因變量的逐步回歸的基本步驟基本類似,其不同之處在于,由于因變量的個(gè)數(shù)大于一,因此,在逐步回歸的過(guò)程中,引入和剔除自變量時(shí)需要計(jì)算這些變量對(duì)因變量的貢獻(xiàn)率,此時(shí),需要利用新的統(tǒng)計(jì)量(vi統(tǒng)計(jì)量)來(lái)進(jìn)行描述。回歸方程的具體表達(dá)式:其中,殘差平方和:復(fù)相關(guān)系數(shù):(復(fù)相關(guān)系

4、數(shù)是反映一個(gè)因變量與一組自變量之間相關(guān)程度的指標(biāo))這里選取了北京、上海市2010-2016年的相關(guān)數(shù)據(jù),在sas軟件下編程進(jìn)行了分析,得到的結(jié)果如下:其中,x1,x4,x5分別代表人均gdp、職工平均工資、最低工資標(biāo)準(zhǔn), 分別代表北京、上海的預(yù)測(cè)數(shù)據(jù)。兩回歸方程經(jīng)檢驗(yàn)都是高度顯著的(p<0.05),復(fù)相關(guān)系數(shù)r1=0.9973,決定系數(shù)(r21=0.9947),復(fù)相關(guān)系數(shù)r2=0.9999(r22=0.9998)。因此回歸方程通過(guò)檢驗(yàn),且擬合效果較好。1.3 嶺回歸在對(duì)方程進(jìn)行多因變量多元線性回歸時(shí),最小二乘矩陣x'x的特征根有多個(gè)接近于0,變量之間的多重線性關(guān)系較強(qiáng)。嶺回歸的基本思想是給矩陣加入一個(gè)正的常數(shù)矩陣k*i,則x'x+ki接近奇異的程度會(huì)顯著減小,從而克服變量間的共線性關(guān)系。當(dāng)k0.01時(shí),嶺跡已經(jīng)趨于平穩(wěn),從而克服了變量間的多重共線性關(guān)系,擬合效果較好。得到的回歸方程如下:2 實(shí)驗(yàn)結(jié)果及分析實(shí)驗(yàn)的預(yù)報(bào)和控制:圖2圖3由圖2與圖3可知,多因變量的多元回歸算法的預(yù)測(cè)效果較好。3 總結(jié)通過(guò)多因變量的多元回歸算法來(lái)分析因變量之間的相關(guān)性,能夠防止丟失因變量間的關(guān)聯(lián)信息,得到更符合實(shí)際情況的分析結(jié)果。本文以“低保標(biāo)準(zhǔn)”實(shí)際問(wèn)題為例,用多因變量的多元回歸算法求解了北京市與上海市之間

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論