數(shù)學(xué)建模之回歸分析法_第1頁(yè)
數(shù)學(xué)建模之回歸分析法_第2頁(yè)
數(shù)學(xué)建模之回歸分析法_第3頁(yè)
數(shù)學(xué)建模之回歸分析法_第4頁(yè)
數(shù)學(xué)建模之回歸分析法_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、什么是回歸分析回歸分析(regression analysis)是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。運(yùn)用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。如果在回歸分析中,只包括一個(gè)自變量和一個(gè)因變量,且二者的關(guān)系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個(gè)或兩個(gè)以上的自變量,且因變量和自變量之間是線性關(guān)系,則稱為多元線性回歸分析?;貧w分析之一多元線性回歸模型案例解析多元線性回歸,主要是研究一個(gè)因變量與多個(gè)自變量之間的相關(guān)關(guān)系,跟一元回歸

2、原理差不多,區(qū)別在于影響因素(自變量)更多些而已,例如:一元線性回歸方程 為: 毫無疑問,多元線性回歸方程應(yīng)該為:上圖中的 x1, x2, xp分別代表“自變量”Xp截止,代表有P個(gè)自變量,如果有“N組樣本,那么這個(gè)多元線性回歸,將會(huì)組成一個(gè)矩陣,如下圖所示:那么,多元線性回歸方程矩陣形式為: 其中: 代表隨機(jī)誤差, 其中隨機(jī)誤差分為:可解釋的誤差 和 不可解釋的誤差,隨機(jī)誤差必須滿足以下四個(gè)條件,多元線性方程才有意義(一元線性方程也一樣)1:服成正太分布,即指:隨機(jī)誤差必須是服成正太分別的隨機(jī)變量。2:無偏性假設(shè),即指:期望值為03:同共方差性假設(shè),即指,所有的 隨機(jī)誤差變量方差都相等4:獨(dú)

3、立性假設(shè),即指:所有的隨機(jī)誤差變量都相互獨(dú)立,可以用協(xié)方差解釋。 今天跟大家一起討論一下,SPSS-多元線性回歸的具體操作過程,下面以教程教程數(shù)據(jù)為例,分析汽車特征與汽車銷售量之間的關(guān)系。通過分析汽車特征跟汽車銷售量的關(guān)系,建立擬合多元線性回歸模型。數(shù)據(jù)如下圖所示:(數(shù)據(jù)可以先用excel建立再通過spss打開)點(diǎn)擊“分析”回歸線性進(jìn)入如下圖所示的界面: 將“銷售量”作為“因變量”拖入因變量框內(nèi), 將“車長(zhǎng),車寬,耗油率,車凈重等10個(gè)自變量 拖入自變量框內(nèi),如上圖所示,在“方法”旁邊,選擇“逐步”,當(dāng)然,你也可以選擇其它的方式,如果你選擇“進(jìn)入”默認(rèn)的方式,在分析結(jié)果中,將會(huì)得到如下圖所示的

4、結(jié)果:(所有的自變量,都會(huì)強(qiáng)行進(jìn)入)如果你選擇“逐步”這個(gè)方法,將會(huì)得到如下圖所示的結(jié)果:(將會(huì)根據(jù)預(yù)先設(shè)定的“F統(tǒng)計(jì)量的概率值進(jìn)行篩選,最先進(jìn)入回歸方程的“自變量”應(yīng)該是跟“因變量”關(guān)系最為密切,貢獻(xiàn)最大的,如下圖可以看出,車的價(jià)格和車軸 跟因變量關(guān)系最為密切,符合判斷條件的概率值必須小于0.05,當(dāng)概率值大于等于0.1時(shí)將會(huì)被剔除)“選擇變量(E)" 框內(nèi),我并沒有輸入數(shù)據(jù),如果你需要對(duì)某個(gè)“自變量”進(jìn)行條件篩選,可以將那個(gè)自變量,移入“選擇變量框”內(nèi),有一個(gè)前提就是:該變量從未在另一個(gè)目標(biāo)列表中出現(xiàn)!,再點(diǎn)擊“規(guī)則”設(shè)定相應(yīng)的“篩選條件”即可,如下圖所示: 點(diǎn)擊“統(tǒng)計(jì)量”彈出如

5、下所示的框,如下所示:在“回歸系數(shù)”下面勾選“估計(jì),在右側(cè)勾選”模型擬合度“ 和”共線性診斷“ 兩個(gè)選項(xiàng),再勾選“個(gè)案診斷”再點(diǎn)擊“離群值”一般默認(rèn)值為“3”,(設(shè)定異常值的依據(jù),只有當(dāng)殘差超過3倍標(biāo)準(zhǔn)差的觀測(cè)才會(huì)被當(dāng)做異常值) 點(diǎn)擊繼續(xù)。提示:共線性檢驗(yàn),如果有兩個(gè)或兩個(gè)以上的自變量之間存在線性相關(guān)關(guān)系,就會(huì)產(chǎn)生多重共線性現(xiàn)象。這時(shí)候,用最小二乘法估計(jì)的模型參數(shù)就會(huì)不穩(wěn)定,回歸系數(shù)的估計(jì)值很容易引起誤導(dǎo)或者導(dǎo)致錯(cuò)誤的結(jié)論。所以,需要勾選“共線性診斷”來做判斷 通過容許度可以計(jì)算共線性的存在與否? 容許度TOL=1-RI平方 或方差膨脹因子(VIF): VIF=1/1-RI平方,其中RI平方是

6、用其他自變量預(yù)測(cè)第I個(gè)變量的復(fù)相關(guān)系數(shù),顯然,VIF為TOL的倒數(shù),TOL的值越小,VIF的值越大,自變量XI與其他自變量之間存在共線性的可能性越大。提供三種處理方法:1:從有共線性問題的變量里刪除不重要的變量2:增加樣本量或重新抽取樣本。3:采用其他方法擬合模型,如領(lǐng)回歸法,逐步回歸法,主成分分析法。再點(diǎn)擊“繪制”選項(xiàng),如下所示: 上圖中:DEPENDENT( 因變量) ZPRED(標(biāo)準(zhǔn)化預(yù)測(cè)值) ZRESID(標(biāo)準(zhǔn)化殘差) DRESID(剔除殘差) ADJPRED(修正后預(yù)測(cè)值) SRSID(學(xué)生化殘差) SDRESID(學(xué)生化剔除殘差) 一般我們大部分以“自變量”作為 X 軸,用“殘差”作為Y軸, 但是,也不要忽略特殊情況,這里我們以“ZPRED(標(biāo)準(zhǔn)化預(yù)測(cè)值)作為"x" 軸,分別用“SDRESID(血生化剔除殘差)”和“ZRESID(標(biāo)準(zhǔn)化殘差)作為Y軸,分別作為兩組繪圖變量。再點(diǎn)擊”保存“按鈕,進(jìn)入如下界面: 如上圖所示:勾選“距離”下面的“cook距離”選項(xiàng) (cook 距離,主要是指:把一個(gè)個(gè)案從計(jì)算回歸系數(shù)的樣本中剔除時(shí)所引

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論