復(fù)回歸分析估計問題

上傳人：農(nóng)*** IP屬地：廣東上傳時間：2022-09-08 格式：PPT 頁數(shù)：49 大?。?.97MB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩44頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、復(fù)回歸分析估計問題第1頁，共49頁，2022年，5月20日，13點23分，星期二復(fù)回歸分析，也就是多元線性回歸分析，討論應(yīng)變量或回歸子Y，依賴于兩個或更多個解釋變量或回歸元的模型。本章主要討論有兩個解釋變量的情形。7.1 三變量模型：符號與假定三變量的PRF為：（）其中是截距項，表示所有未包含到模型中來的變量對Y的平均影響。和被稱為偏回歸系數(shù)（partial regression coefficients）。貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第2頁，共49頁，2022年，5月20日，13點23分，星期二在經(jīng)典線性回歸模型（CLRM）的框架下，我們對（）作如下假定： ui的均

2、值為零，即：對每一個i （）無序列相關(guān)：（）同方差性：（）ui與每一個X變量之間都有零協(xié)方差：（）貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第3頁，共49頁，2022年，5月20日，13點23分，星期二其實，只要X2和X3是非隨機的，并且有（）成立，則這個假定就自動得到滿足。無設(shè)定偏誤，或：模型被正確地設(shè)定（） X諸變量間無精確的共線性，或 X2與X3之間無精確的線性關(guān)系（）（No exact linear relationship between X2 and X3）另外，還假定：多元回歸模型對參數(shù)而言是線性的；回歸元的值在重復(fù)抽樣中是被固定的，以及回歸元的取值有足夠的變異性

3、（variability）。貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第4頁，共49頁，2022年，5月20日，13點23分，星期二（）式要求X2和X3之間無精確的線性關(guān)系，用專業(yè)術(shù)語講就是無共線性（no collinearity）或無多重共線性（no multicollinearity）。簡單地說，就是沒有一個解釋變量可以寫成其余解釋變量的線性組合。從數(shù)學(xué)上看，無共線性的含義是，不存在一組不全為零的和，使得：（）如果這一關(guān)系式存在，則說明X2和X3是共線的（collinear）或線性相關(guān)的（linearly dependent）。如果（）式僅當(dāng) 時成立，則說X2和X3是線性獨立的。

4、貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第5頁，共49頁，2022年，5月20日，13點23分，星期二如果，這會不會破壞無共線性的假定呢？不會，因為這里的兩個變量的關(guān)系是非線性的，并不違背回歸元之間沒有精確線性關(guān)系的要求。在極端情形下，如果X2和X3存在精確的線性關(guān)系，比如，則獨立的解釋變量實際上只有一個，而不是兩個了：貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第6頁，共49頁，2022年，5月20日，13點23分，星期二7.2 對復(fù)回歸方程的解釋把（）的兩邊對Y求條件期望得：（）可見，復(fù)回歸分析是以多個解釋變量的固定值為條件的回歸分析。我們所獲得的，是各個自變量X值固定時，Y的平均值或Y

5、的平均響應(yīng)（mean response）。7.3 偏回歸系數(shù)的含義偏回歸系數(shù)的含義：度量著在保持X3不變的情況下，X2每變化1個單位時，Y的均值的變化。換一句話說，給出X2的單位變化對Y均值的“直接”或“凈”影響（凈在不染有X3的影響）。則給出了X3的單位變化對Y均值的“直接”或“凈”影響，凈在不沾有X2的影響。貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第7頁，共49頁，2022年，5月20日，13點23分，星期二如何分離出X2對Y的“真實”或凈影響呢？（雙殘差方法）第一步：Y僅對X3回歸：（）其中是樣本殘差項，b13的下標(biāo)1指變量Y只對X3 回歸。第二步：X2對X3回歸：（

6、）其中也是殘差項。于是：（）貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第8頁，共49頁，2022年，5月20日，13點23分，星期二（）其中和是分別從回歸（）和（）得來的估計值。殘差和的含義：表示去掉 X3 對 Y 的（線性）影響后的Yi值；表示除去 X3 對 X2 的（線性）影響后的 X2i 的值。這樣一來，和就代表是“凈化了的（purified）” Yi 和X2i 。即除去了X3 的影響（沾染）的 Yi 和 X2i 。具體例子見P194關(guān)于兒童死亡率與人均收入、婦女識字率的關(guān)系。貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第9頁，共49頁，2022年，5月20日，13點2

7、3分，星期二第三步：做對的回歸：（）其中，是樣本殘差項。那么，就是 X2 對 Y 的“真實”或凈影響的一個估計，或者說，是Y 對 X2 的真實斜率的一個估計。7.4 偏回歸系數(shù)的OLS估計一、OLS估計量（）式的PRF相對應(yīng)的樣本回歸函數(shù)（SRF）為：（）其中是殘差項，是總體隨機擾動項ui的相應(yīng)部分。貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第10頁，共49頁，2022年，5月20日，13點23分，星期二 OLS方法的實質(zhì)就是，通過殘差平方和（RSS）的一階條件求未知參數(shù)的估計值：（）貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第11頁，共49頁，2022年，5月20日，13點

8、23分，星期二于是，得正規(guī)方程：從而，的OLS估計量為：（）（）貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第12頁，共49頁，2022年，5月20日，13點23分，星期二（）如果2和3無關(guān)，會怎樣？OLS估計量的特點：可以從方程（）和（）中的一個通過x2和x3的對調(diào)而得到另一個，所以，它們本質(zhì)上是對稱的。兩個方程的分母完全相同。三變量情形是雙變量情形的自然而然的推廣。二、OLS估計量的方差和標(biāo)準(zhǔn)誤我們計算出標(biāo)準(zhǔn)誤主要有兩個作用：建立置信區(qū)間檢驗統(tǒng)計假設(shè)。公式如下，證明見第九章。貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第13頁，共49頁，2022年，5月20日，13點23分，星期

9、二（）（）（）或者：（）其中，r23是X2和X3的樣本相關(guān)系數(shù)：貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第14頁，共49頁，2022年，5月20日，13點23分，星期二（）（）或者：（）（）（）在上述公式中是總體干擾項ui的方差，的無偏估計量是：貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第15頁，共49頁，2022年，5月20日，13點23分，星期二（）注：自由度為（n-3），這是因為在估計之前，必須先估計和。從而損失了3個自由度。四變量中自由度為（n-4）等。而（）課堂作業(yè)：證明上式貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第16頁，共49頁，2022年，5月20日

10、，13點23分，星期二貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第17頁，共49頁，2022年，5月20日，13點23分，星期二三、OLS估計量的性質(zhì)1三變量回歸面通過均值，和。因為，（）告訴我們：這個性質(zhì)可以推廣到一般情形，如在K變量回歸中有：2估計的（即）的均值等于真實的均值。由和得：貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第18頁，共49頁，2022年，5月20日，13點23分，星期二（）將上式兩邊對所有樣本值求和，再除以樣本容量n得：（）從而有：（由于（）（）其中貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第19頁，共49頁，2022年，5月20日，13點23分，星期二因此，SR

11、F：的離差形式表達(dá)為：（）3 在求解OLS估計量的過程中，曾經(jīng)有：這就是4殘差與和都不相關(guān)，就是貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第20頁，共49頁，2022年，5月20日，13點23分，星期二這也是求解OLS估計量的副產(chǎn)品：即是所求。5殘差與不相關(guān)，即貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第21頁，共49頁，2022年，5月20日，13點23分，星期二（）貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第22頁，共49頁，2022年，5月20日，13點23分，星期二6由（）和（）可見，越大（越接近1），和越大。，它們將很難估計和的真值。7由（）和（），與成

12、反比，即X2的樣本值變化越大，的方差越小，對的估計的精度越高。對的方差也如此。8偏回歸系數(shù)的OLS估計量是BLUE（最佳線性無偏估計）。證明略（用矩陣證明更簡單，見第9章）。貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第23頁，共49頁，2022年，5月20日，13點23分，星期二ML估計在總體擾動項服從的假定下，ML與OLS所得的回歸系數(shù)估計相同。但是，的估計有區(qū)別，前者所得估計是無偏的，后者是漸近無偏的。ML估計的方差貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第24頁，共49頁，2022年，5月20日，13點23分，星期二7.5 復(fù)判定系數(shù) 與復(fù)相關(guān)系數(shù)R （The Multiple coef

13、ficient of Determination and the Multiple coefficient of Correlation R）復(fù)判定系數(shù)：在三變量（或者更多變量）的模型中，衡量Y的變異由變量、等聯(lián)合解釋的比重，記作。在概念上，近似于。的推導(dǎo)：（）是從所擬合的回歸線（SRF）估計的值，它是真實的一個估計量。（）可以變換為：（）貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第25頁，共49頁，2022年，5月20日，13點23分，星期二上式兩邊平方，再對i求和，得：（）（）表明：總平方和解釋平方和殘差平方和即：TSSESSRSS （）表明：貴州財經(jīng)大學(xué)經(jīng)濟(jì)

14、研究所白萬平教授第26頁，共49頁，2022年，5月20日，13點23分，星期二代入（）有：整理得：（）于是，由定義有：（），越接近于1，我們說模型“擬合”優(yōu)度越高。貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第27頁，共49頁，2022年，5月20日，13點23分，星期二復(fù)相關(guān)系數(shù)R：度量Y和所有解釋變量在一起的關(guān)聯(lián)程度。在一元回歸中，r可正可負(fù)；但是，在多元回歸中，R永遠(yuǎn)取正值。實際上，R沒有太大的意義，用途不大。7.6 例子說明標(biāo)準(zhǔn)化后的優(yōu)勢7.7 從復(fù)回歸的角度看簡單回歸：設(shè)定偏誤初探（）模型試圖用人均收入和婦女識字率去解釋兒童死亡率的變化：（）如果采用雙變量模型

15、去擬合的話，則為：（）貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第28頁，共49頁，2022年，5月20日，13點23分，星期二既然（）是“正確”的模型，那么，（）就必然是一個有偏誤的模型，其偏誤在于丟失了一個不應(yīng)該省略的變量。如果（）的是真實的一個無偏估計，即，那么，在一元回歸中的簡單回歸系數(shù) 將不會是的無偏估計量。事實上，有以下關(guān)系式：（）其中，是對回歸中的斜率系數(shù)，即或者，有：貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第29頁，共49頁，2022年，5月20日，13點23分，星期二證明：離差形式的三變量總體回歸模型可以表述為：（1）先乘以，再乘以，得到通常的正規(guī)方程：

16、（2）（3）用除（2）的兩邊得：（4）貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第30頁，共49頁，2022年，5月20日，13點23分，星期二而（是固定量）方程（4）便可以寫為：（5）（5）式兩邊取期望值，得：（6）（與，不相關(guān)，，是常數(shù)）其實，不僅有偏誤，的方差也很可能有偏誤。貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第31頁，共49頁，2022年，5月20日，13點23分，星期二這是因為：（7）把（5）式和（6）式代入（7）式并化簡得：（8）貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第32頁，共49頁，2022年，5月20日，13點23分，星期二由（）式我

17、們知道：（）可見，（8）式和（）不同，是一個有偏估計量。。結(jié)論：簡單回歸系數(shù) 不僅度量了對Y的“直接”或“凈”影響，而且也度量了通過它對所忽略變量的影響而影響Y的間接或誘發(fā)（induced）影響。簡單地說，度量著對Y的總影響（直接影響加間接影響），而僅度量了對Y的直接或凈影響。貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第33頁，共49頁，2022年，5月20日，13點23分，星期二結(jié)論：如果需要一個三變量回歸，就不要嘗試簡單或雙變量回歸?；蛘哒f得更一般，如果你認(rèn)定某個特殊的回歸模型是“正確”模型，就不要從中略去一個或多個變量，而把它加以修改。如果你忽視這條原則，你就會得到

18、有偏誤的參數(shù)估計。不僅如此，你還可能低估了真實的方差并因而低估了回歸系數(shù)的估計標(biāo)準(zhǔn)誤。貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第34頁，共49頁，2022年，5月20日，13點23分，星期二7.8 與調(diào)整（校正）（ and the Adjusted ）我們知道：其中，，與模型中X變量的個數(shù)無關(guān)。但是，則與模型中的回歸元個數(shù)相關(guān)。隨著X變量個數(shù)的增加，很可能減小，至少不會增大，從而將會增大。因此，在比較具有相同的因變量但有著不同個數(shù)的X變量的兩個回歸模型時，選擇有最高值的模型就必須小心。這時，較高的可能來自解釋變量個數(shù)的增加，并不能說明模型更好。貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平

19、教授第35頁，共49頁，2022年，5月20日，13點23分，星期二考慮有關(guān)的自由度數(shù)，采用方差而不用變異，對的表達(dá)式進(jìn)行修正，可以導(dǎo)出校正（校正判定系數(shù)，校正可決系數(shù)）：（）其中，k代表模型中包括截距項在內(nèi)的參數(shù)個數(shù)。顯然，在三變量回歸（二元回歸）中k3。為校正（adjusted ）?！靶Ｕ敝傅氖?，利用相應(yīng)的自由度對（）式中的平方和進(jìn)行校正。有個自由度，而有個自由度。貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第36頁，共49頁，2022年，5月20日，13點23分，星期二貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第37頁，共49頁，2022年，5月20日，13點23分，星期二需

20、要指出的是，回歸分析的目的并不是要追求較高的之值，而是要取得總體回歸系數(shù)的可信任的估計量，以便作出統(tǒng)計推斷。因此，研究人員應(yīng)當(dāng)更多地從理論上探討解釋變量與因變量之間的關(guān)系，而不能單憑最高的之值來選擇模型。換言之，某個解釋變量是否應(yīng)列入模型，在很大程度上取決于事前的理論分析。 PK PK此外，還有AIC ,APC等評價模型的標(biāo)準(zhǔn)貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第38頁，共49頁，2022年，5月20日，13點23分，星期二貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第39頁，共49頁，2022年，5月20日，13點23分，星期二貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第40頁，共49頁，2022年，

21、5月20日，13點23分，星期二貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第41頁，共49頁，2022年，5月20日，13點23分，星期二7.11 偏相關(guān)系數(shù)一、簡單與偏相關(guān)系數(shù)的釋義對于三變量回歸模型，有三個簡單相關(guān)系數(shù)： Y與之間的相關(guān)系數(shù)： Y與之間的相關(guān)系數(shù)：貴州財經(jīng)大學(xué)經(jīng)濟(jì)研究所白萬平教授第42頁，共49頁，2022年，5月20日，13點23分，星期二與之間的相關(guān)系數(shù)：這些相關(guān)系數(shù)可稱毛（gross）或簡單（simple）相關(guān)系數(shù)（correlation coefficients），或稱零階相關(guān)系數(shù)（correlation coefficients of zero order）。在多變量的情況下，簡單相關(guān)系數(shù)不可能表明兩個變量之間的線性關(guān)系的真實程度。例如，上述并不能反映Y和之間的真實相關(guān)程度，因為Y還受到的影響。我們還需要一個不依賴于對

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

復(fù)回歸分析估計問題

文檔簡介

溫馨提示

最新文檔

評論

復(fù)回歸分析估計問題

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔