版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
多重線性回歸與相關(guān)content第一節(jié)
多重線性回歸的概念與統(tǒng)計(jì)推斷第二節(jié)假設(shè)檢驗(yàn)及其評(píng)價(jià)第三節(jié)復(fù)相關(guān)系數(shù)與偏相關(guān)系數(shù)第四節(jié)
自變量篩選第五節(jié)多元線性回歸的應(yīng)用與注意事項(xiàng)目的:作出以多個(gè)自變量估計(jì)應(yīng)變量的多元線性回歸方程。資料:應(yīng)變量為定量指標(biāo);自變量全部或大部分為定量指標(biāo),若有少量定性或等級(jí)指標(biāo)需作轉(zhuǎn)換。用途:解釋和預(yù)報(bào)。更精確意義:由于事物間的聯(lián)系常常是多方面的,一個(gè)應(yīng)變量的變化可能受到其它多個(gè)自變量的影響,如糖尿病人的血糖變化可能受胰島素、糖化血紅蛋白、血清總膽固醇、甘油三脂等多種生化指標(biāo)的影響。第一節(jié)
多重線性回歸的概念與統(tǒng)計(jì)推斷變量:應(yīng)變量1個(gè),自變量k個(gè),共k+1個(gè)。樣本含量:n數(shù)據(jù)格式見(jiàn)表13-1回歸模型一般形式:一、數(shù)據(jù)與多元線性回歸模型多元回歸分析數(shù)據(jù)格式
條件車(chē)流(X1)氣溫(X2)氣濕(X3)風(fēng)速(X4)一氧化氮(Y)車(chē)流(X1)氣溫(X2)氣濕(X3)風(fēng)速(X4)一氧化氮(Y)130020.0800.450.06694822.5692.000.005144423.0570.500.076144021.5792.400.01178626.5641.500.001108428.5593.000.003165223.0840.400.170184426.0731.000.140175629.5720.900.156111635.0922.800.039175430.0760.800.120165620.0831.450.059120022.5691.800.040153623.0571.500.087150021.8770.600.12096024.8671.500.039120027.0581.700.100178423.3830.900.222147627.0650.650.129149627.0650.650.145182022.0830.400.135106026.0581.830.029143628.0682.000.099143628.0682.000.099一般步驟建立回歸方程(樣本)(2)檢驗(yàn)并評(píng)價(jià)回歸方程及各自變量的作用大小二、多元線性回歸方程的建立樣本估計(jì)而得的多重線性回歸方程bj為自變量Xj
的偏回歸系數(shù)(partialregressioncoefficient),是βj的估計(jì)值,表示當(dāng)方程中其他自變量保持常量時(shí),自變量Xj變化一個(gè)計(jì)量單位,反應(yīng)變量Y的平均值變化的單位數(shù)。
求偏導(dǎo)數(shù)(一階)原理最小二乘法統(tǒng)計(jì)軟件包第二節(jié)假設(shè)檢驗(yàn)及其評(píng)價(jià)
1.方差分析法:(一)對(duì)回歸方程
多元線性回歸方差分析表變異來(lái)源自由度SSMSFP回歸模型40.063960.0159917.59<.0001殘差190.017270.00090903總變異230.08123表13-2顯示,P<0.0001,拒絕H0。說(shuō)明從整體上而言,用這四個(gè)自變量構(gòu)成的回歸方程解釋空氣中NO濃度的變化是有統(tǒng)計(jì)學(xué)意義的。偏回歸系數(shù)的t檢驗(yàn)偏回歸系數(shù)的t檢驗(yàn)是在回歸方程具有統(tǒng)計(jì)學(xué)意義的情況下,檢驗(yàn)?zāi)硞€(gè)總體偏回歸系數(shù)等于零的假設(shè),以判斷是否相應(yīng)的那個(gè)自變量對(duì)回歸確有貢獻(xiàn)
自變量篩選的標(biāo)準(zhǔn)與原則(3)t檢驗(yàn)不準(zhǔn)確,誤將應(yīng)保留在模型中的重要變量舍棄。(4)估計(jì)值的正負(fù)符號(hào)與客觀實(shí)際不一致。偏回歸系數(shù)的t檢驗(yàn)是在回歸方程具有統(tǒng)計(jì)學(xué)意義的情況下,檢驗(yàn)?zāi)硞€(gè)總體偏回歸系數(shù)等于零的假設(shè),以判斷是否相應(yīng)的那個(gè)自變量對(duì)回歸確有貢獻(xiàn)目的:作出以多個(gè)自變量估計(jì)應(yīng)變量的多元線性回歸方程。理論上最好,建議使用采用此法。第四節(jié)
自變量篩選自變量篩選的標(biāo)準(zhǔn)與原則1、非同質(zhì)資料的合并問(wèn)題(3)t檢驗(yàn)不準(zhǔn)確,誤將應(yīng)保留在模型中的重要變量舍棄。對(duì)例13-1,由方差分析表可得:SSR=0.偏回歸系數(shù)的t檢驗(yàn)是在回歸方程具有統(tǒng)計(jì)學(xué)意義的情況下,檢驗(yàn)?zāi)硞€(gè)總體偏回歸系數(shù)等于零的假設(shè),以判斷是否相應(yīng)的那個(gè)自變量對(duì)回歸確有貢獻(xiàn)復(fù)相關(guān)系數(shù):確定系數(shù)的算術(shù)平方根利用SAS對(duì)例13-1的四個(gè)偏回歸系數(shù)進(jìn)行t檢驗(yàn)與標(biāo)準(zhǔn)化偏回歸系數(shù)的結(jié)果如表13-3所示。標(biāo)準(zhǔn)化回歸系數(shù)
變量標(biāo)準(zhǔn)化是將原始數(shù)據(jù)減去相應(yīng)變量的均數(shù),然后再除以該變量的標(biāo)準(zhǔn)差。不同質(zhì):此時(shí)應(yīng)按不同性別分別擬合回歸模型。多元線性回歸應(yīng)用的注意事項(xiàng)利用SAS對(duì)例13-1的四個(gè)偏回歸系數(shù)進(jìn)行t檢驗(yàn)與標(biāo)準(zhǔn)化偏回歸系數(shù)的結(jié)果如表13-3所示。變量自由度回歸系數(shù)標(biāo)準(zhǔn)誤t值P值標(biāo)準(zhǔn)化偏回歸系數(shù)截距1-0.141660.06916-2.050.05460X110.000116190.000027484.230.00050.59249X210.004490.001902.360.02890.27274X31-0.000006550.00069083-0.010.9925-0.00110X41-0.034680.01081-3.210.0046-0.44770第三節(jié)復(fù)相關(guān)系數(shù)與偏相關(guān)系數(shù)
確定系數(shù)、復(fù)相關(guān)系數(shù)與調(diào)整確定系數(shù)復(fù)相關(guān)系數(shù)的平方稱(chēng)為確定系數(shù)(coefficientofdetermination),或決定系數(shù),記為R2,用以反映線性回歸模型能在多大程度上解釋反應(yīng)變量Y的變異性。其定義為
復(fù)相關(guān)系數(shù):確定系數(shù)的算術(shù)平方根
對(duì)例13-1,由方差分析表可得:SSR=0.06396SSE=0.01727SST=0.08123表示變量Y與k個(gè)自變量(X1,X2,…Xk)的線性相關(guān)的密切程度。說(shuō)明,用包含氣車(chē)流量、氣溫、氣濕與風(fēng)速這四個(gè)自變量的回歸方程可解釋交通點(diǎn)空氣NO濃度變異性的78.74%。表示交通點(diǎn)空氣NO濃度與氣車(chē)流量、氣溫、氣濕與風(fēng)速等四個(gè)變量的復(fù)相關(guān)系數(shù)為0.8703
調(diào)整的R2(AdjustedR-Square)當(dāng)回歸方程中包含有很多自變量,即使其中有一些自變量(如本例中的X3
)對(duì)解釋反應(yīng)變量變異的貢獻(xiàn)極小,隨著回歸方程的自變量的增加,R2
值表現(xiàn)為只增不減,這是復(fù)相關(guān)系數(shù)R2的缺點(diǎn)。調(diào)整的R2定義為偏相關(guān)系數(shù)冷飲銷(xiāo)售量(元)X1游泳人數(shù)(人)X2氣溫(oC)X3267722293978143045192431528106632618125333655136934690159335740176136780193137889223138996274939偏相關(guān)系數(shù)(partialcorrelationcoefficient):一般地,扣除其他變量的影響后,變量Y與X的相關(guān).表13-5空氣中NO濃度與各自變量的相關(guān)系數(shù)和偏相關(guān)系數(shù)自變量相關(guān)系數(shù)偏相關(guān)系數(shù)偏相關(guān)系數(shù)P值車(chē)流X10.808000.696200.0005氣溫X20.017240.476700.0289氣濕X30.27854-0.002180.9925風(fēng)速X4-0.67957-0.592750.0046(二)對(duì)各自變量
指明方程中的每一個(gè)自變量對(duì)Y的影響(即方差分析和決定系數(shù)檢驗(yàn)整體)。1.偏回歸平方和
各自變量的偏回歸平方和可以通過(guò)擬合包含不同自變量的回歸方程計(jì)算得到結(jié)果06396SSE=0.理論上最好,建議使用采用此法。表13-2顯示,P<0.目的:使得預(yù)報(bào)和(或)解釋效果好表13-2顯示,P<0.(1)參數(shù)估計(jì)值的標(biāo)準(zhǔn)誤變得很大,從而t值變得很小。利用SAS對(duì)例13-1的四個(gè)偏回歸系數(shù)進(jìn)行t檢驗(yàn)與標(biāo)準(zhǔn)化偏回歸系數(shù)的結(jié)果如表13-3所示。消除多重共線性:剔除某個(gè)造成共線性的自變量,重建回歸方程;第四節(jié)
自變量篩選第四節(jié)
自變量篩選第五節(jié)多元線性回歸的應(yīng)用與注意事項(xiàng)標(biāo)準(zhǔn)化回歸系數(shù)
變量標(biāo)準(zhǔn)化是將原始數(shù)據(jù)減去相應(yīng)變量的均數(shù),然后再除以該變量的標(biāo)準(zhǔn)差。2.t檢驗(yàn)法是一種與偏回歸平方和檢驗(yàn)完全等價(jià)的一種方法。計(jì)算公式為結(jié)論標(biāo)準(zhǔn)化回歸系數(shù)
變量標(biāo)準(zhǔn)化是將原始數(shù)據(jù)減去相應(yīng)變量的均數(shù),然后再除以該變量的標(biāo)準(zhǔn)差。計(jì)算得到的回歸方程稱(chēng)作標(biāo)準(zhǔn)化回歸方程,相應(yīng)的回歸系數(shù)即為標(biāo)準(zhǔn)化回歸系數(shù)。
注意:
一般回歸系數(shù)有單位,用來(lái)解釋各自變量對(duì)應(yīng)變量的影響,表示在其它自變量保持不變時(shí),增加或減少一個(gè)單位時(shí)Y的平均變化量。不能用各來(lái)比較各對(duì)的影響大小。
標(biāo)準(zhǔn)化回歸系數(shù)無(wú)單位,用來(lái)比較各自變量對(duì)應(yīng)變量的影響大小,越大,對(duì)的影響越大。第四節(jié)
自變量篩選
目的:使得預(yù)報(bào)和(或)解釋效果好自變量篩選的標(biāo)準(zhǔn)與原則
1.殘差平方和(SSE)縮小與確定系數(shù)(R2)增大2.殘差均方(SSE
)縮小與調(diào)整確定系數(shù)增大3.CP統(tǒng)計(jì)量選擇既具有較小CP值,在圖中又接近于CP=q直線的模型作為“最優(yōu)”的準(zhǔn)則全局擇優(yōu)法目的:預(yù)報(bào)效果好意義:對(duì)自變量各種不同的組合所建立的回歸方程進(jìn)行比較擇優(yōu)。選擇方法:逐步選擇法1.
1.前進(jìn)法,回歸方程中的自變量從無(wú)到有、從少到多逐個(gè)引入回歸方程。這種選擇自變量的方法基于殘差均方縮小的準(zhǔn)則,不一定能保證“最優(yōu)”.此法已基本淘汰。
2.
后退法,先將全部自變量選入方程,然后逐步剔除無(wú)統(tǒng)計(jì)學(xué)意義的自變量。剔除自變量的方法是在方程中選一個(gè)偏回歸平方和最小的變量,作F檢驗(yàn)決定它是否剔除,若無(wú)統(tǒng)計(jì)學(xué)意義則將其剔除,然后對(duì)剩余的自變量建立新的回歸方程。重復(fù)這一過(guò)程,直至方程中所有的自變量都不能剔除為止。理論上最好,建議使用采用此法。
3.逐步回歸法,逐步回歸法是在前述兩種方法的基礎(chǔ)上,進(jìn)行雙向篩選的一種方法。該方法本質(zhì)上是前進(jìn)法。
第五節(jié)多元線性回歸的應(yīng)用與注意事項(xiàng)多元線性回歸的應(yīng)用多元線性回歸應(yīng)用的注意事項(xiàng)1、非同質(zhì)資料的合并問(wèn)題
斜率相同(同質(zhì)):可以利用男、女合并的資料擬合共同的回歸模型;不同質(zhì):此時(shí)應(yīng)按不同性別分別擬合回歸模型。2、指標(biāo)的數(shù)量化
3、樣本含量:n=(5~10)m。
4、關(guān)于逐步回歸:對(duì)逐步回歸得到的結(jié)果不要盲目的信任,所謂的“最優(yōu)”回歸方程并不一定是最好的,沒(méi)有選入方程的變量也未必沒(méi)有統(tǒng)計(jì)學(xué)意義。例如,例15-3中若將選入標(biāo)準(zhǔn)和剔除標(biāo)準(zhǔn)定為和,選入的變量是,而不是,結(jié)果發(fā)生了改變。不同回歸方程適應(yīng)于不同用途,依專(zhuān)業(yè)知識(shí)定。5、多重共線性
即指
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版多功能會(huì)議場(chǎng)地租賃服務(wù)合同模板3篇
- 二零二五版公積金貸款個(gè)人公積金提取借款合同3篇
- 二零二五版工業(yè)自動(dòng)化生產(chǎn)線改造項(xiàng)目承包合同范本3篇
- 二零二五版房屋屋頂光伏發(fā)電系統(tǒng)檢測(cè)維修合同范本3篇
- 二零二五年度智慧能源管理系統(tǒng)集成合同2篇
- 二零二五年機(jī)床設(shè)備采購(gòu)與客戶項(xiàng)目整體解決方案合同3篇
- 二零二五年抖音廣告創(chuàng)意策劃與投放服務(wù)合同3篇
- 二零二五年新型環(huán)保建材生產(chǎn)與建筑垃圾回收處理合同3篇
- 二零二五版家庭心理健康輔導(dǎo)與治療服務(wù)合同正規(guī)范本3篇
- 二零二五年度酒水品牌跨界合作營(yíng)銷(xiāo)合同2篇
- 常用靜脈藥物溶媒的選擇
- 當(dāng)代西方文學(xué)理論知到智慧樹(shù)章節(jié)測(cè)試課后答案2024年秋武漢科技大學(xué)
- 2024年預(yù)制混凝土制品購(gòu)銷(xiāo)協(xié)議3篇
- 2024-2030年中國(guó)高端私人會(huì)所市場(chǎng)競(jìng)爭(zhēng)格局及投資經(jīng)營(yíng)管理分析報(bào)告
- GA/T 1003-2024銀行自助服務(wù)亭技術(shù)規(guī)范
- 《消防設(shè)備操作使用》培訓(xùn)
- 新交際英語(yǔ)(2024)一年級(jí)上冊(cè)Unit 1~6全冊(cè)教案
- 2024年度跨境電商平臺(tái)運(yùn)營(yíng)與孵化合同
- 2024年電動(dòng)汽車(chē)充電消費(fèi)者研究報(bào)告-2024-11-新能源
- 湖北省黃岡高級(jí)中學(xué)2025屆物理高一第一學(xué)期期末考試試題含解析
- 上海市徐匯中學(xué)2025屆物理高一第一學(xué)期期末學(xué)業(yè)水平測(cè)試試題含解析
評(píng)論
0/150
提交評(píng)論