設定誤差與測量誤差_第1頁
設定誤差與測量誤差_第2頁
設定誤差與測量誤差_第3頁
設定誤差與測量誤差_第4頁
設定誤差與測量誤差_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

設定誤差與測量誤差引子:簡單一定勝于復雜嗎?西方國家盛行“Occam'srazor”原則1,意思是“簡單優(yōu)于復雜”的節(jié)約性原則。經(jīng)濟模型永遠無法完全把握現(xiàn)實,在建立模型中一定的抽象和簡化是不可避免的。在研究進口數(shù)量時,分析進口(IM)與國內生產(chǎn)總值(GDP)、匯率(口乂)的關系,建立并估計了以下模型IMt=—1159.179+1.142897GDP-0.815842GDP1-0.022569EX2t=(-2.268276)(7.71607)(-5.66842)(-6.857844)(1)R2=0.978378R2=0.974965dW=2.047965F=286.5846如果根據(jù)“簡單優(yōu)于復雜”的原則,直接分析進口與國內生產(chǎn)總值的關系得到回歸結果IM=—1067.337+0.2307GDP+et=(-2.0288)(16.2378)(2)R2=0.9230R2=0.9195DW=0.5357F=263.6657這兩個方程的t檢驗和F檢驗結果顯示都顯著,方程(2)中GDP的t檢驗值還優(yōu)于方程(1),而且方程(2)函數(shù)形式也更為簡單。能否根據(jù)“Occam'srazor”原則,判斷簡單的方程(2)比復雜的方程(1)更好呢?對模型的設定是計量經(jīng)濟研究的重要環(huán)節(jié)。所設定的模型要求正確地描述被解釋變量與解釋變量之間的真實關系,在第二章提出線性回歸模型的基本假定時,除了對隨機擾動項u.I分布的假定以外,也強調了假定模型對變量和函數(shù)形式的設定是正確的,假定模型中的變量沒有測量誤差。但是在實際的建模實踐中,對模型的設定不一定能夠完全滿足這樣的要求,從而會使模型出現(xiàn)設定誤差。本章以OLS估計為基礎,分別討論模型設定誤差的后果以及1見古扎拉蒂《計量經(jīng)濟學》下冊第447頁,中國人民大學出版社,2000檢驗方法。第一節(jié)設定誤差一、設定誤差的類型計量經(jīng)濟模型是對變量間經(jīng)濟關系因果性的設想,若所設定的回歸模型是“正確”的,主要任務是所選模型參數(shù)的估計和假設檢驗。若檢驗統(tǒng)計量R2,t,F和DW等在統(tǒng)計意義上是顯著的,則模型的建模過程結束。反之,若這些統(tǒng)計量中的一個或多個不顯著,我們就會去尋找其他的估計方法進行參數(shù)估計和檢驗,例如,在加權和廣義差分的基礎上用最小二乘法解決異方差性或自相關性問題。但是如果對計量模型的各種診斷或檢驗仍不能令人滿意,這時就應把注意力集中到模型的設定方面,考慮所建模型是否遺漏了重要的變量?是否包含了多余的變量?所選模型的函數(shù)形式是否正確?隨機擾動項的設定是否合理?關于被解釋變量和解釋變量的數(shù)據(jù)收集是否有誤差?等等。所有這些,在計量經(jīng)濟學中被統(tǒng)稱為設定誤差。從誤差來源看,設定誤差主要包括:(1)變量的設定誤差,包括相關變量的遺漏(欠擬合)、無關變量的誤選(過擬合);(2)變量數(shù)據(jù)的測量誤差;(3)模型函數(shù)形式的設定誤差;(4)隨機擾動項設定誤差。本章主要討論前兩類設定誤差。出現(xiàn)設定誤差的原因是多方面的。首先,數(shù)據(jù)來源渠道可能不暢。在建模過程中,盡管某個變量有著重要的經(jīng)濟意義和計量經(jīng)濟學解釋作用,但這個變量的數(shù)據(jù)很難取得,而被迫將該變量排斥在模型之外,例如消費行為分析中消費者財富的變量就是例證。其次,雖然知道模型中應當包含哪些變量,但卻不知道這些變量應當以什么確切的函數(shù)形式出現(xiàn)在回歸模型中。也就是說,經(jīng)濟管理的基本理論并沒有提示模型中變量的準確函數(shù)形式。例如,經(jīng)濟學理論不會肯定消費水平與有關變量的關系是線性的還是對數(shù)線性的,或者是兩者的某種混合形式的。最后,更為重要的是,事實上我們事先并不知道所研究的實證數(shù)據(jù)中所隱含的真實模型究竟是什么。正是上述這些原因,設定誤差在建模中是較容易出現(xiàn)的。設定誤差的存在可能會對模型形成不良的后果。二、變量設定誤差的后果變量設定誤差主要有兩類:一類是相關變量的遺漏,也稱為模型“欠擬合”;另一類是無關變量的誤選,也稱為模型“過擬合”。從實質上看,變量設定誤差的主要后果,是一個或多個解釋變量與隨機擾動項之間存在著相關性,而影響參數(shù)估計的統(tǒng)計特性。

1、遺漏相關變量(欠擬合)的偏誤采用遺漏了重要解釋變量的模型進行估計而帶來的偏誤,稱為遺漏相關變量偏誤。如果正確的模型應當為:(9.1)Y=。+。X+。X+u122i33ii其離差形式為y—Px+Px+(u-u)i22i23ii(9.2)但是由于某種原因,設定模型時將變量%遺漏了,實際采用的回歸模型為:(9.3)假定其他有關線性模型的古典假設都成立,則(9.3)式中a2的OLS估計式為:(9.4)將正確模型的離差形式(9.2)式代入((9.1)其離差形式為y—Px+Px+(u-u)i22i23ii(9.2)但是由于某種原因,設定模型時將變量%遺漏了,實際采用的回歸模型為:(9.3)假定其他有關線性模型的古典假設都成立,則(9.3)式中a2的OLS估計式為:(9.4)將正確模型的離差形式(9.2)式代入(9.4)式,得:ZX[PX+PX+(u-u)]22i^^^i—i33iX22iZpX2+P乙X+乙(u-u)22i3Y7i3i2iiZX22iZXXZx(u-u)—P+PZ2i3i+Z~i(9.5)2i對(9.5)式兩邊取期望,有:E(a)—EP+P2ZL^x(u-u)S-L-X2(9.6)當樣本容量無限增大時,觀察a2的概率極限性質,對(9.5)式兩邊取概率極限:(證明見附錄9.1)aCov(X,X)Cov(X,u)plima—p+p-pi~+/2i\iVar(X)Var(X)(9.7)由此可以看出,乂3的遺漏將產(chǎn)生如下后果:(1)如果漏掉的X與X相關,則參數(shù)a和a將是有偏且不一致性的,即E(a)^P,321211TOC\o"1-5"\h\z221122nsns「這是由于(9.3)式中廣=。X+u,所以i33iiCov(v,X)=Cov(PX+u,X)=Cov(PX,X)+Cov(u,X)(9.8)i2i33ii2i33i2ii2i(9.8)式中,雖然Cov(u,X)=0,但Cov(PX,X)=PCov(X,X)=0。在小樣本下,i2i33i2i33i2i(9.6)式中的第二項求期望不會為零,表明OLS估計量在小樣本下有偏。在大樣本下,(9.7)1第二項中的^2七七也不會隨著樣本的增大而趨于零,表明OLS估計量在大樣本下非一致,即有plima2^P2。因此,如果漏掉的X3與X2相關,OLS估計量在大樣本下是也非ms一致的。若X與X不相關,即Zxx=0,a滿足無偏性和一致性,但可以證明這時截322i3i2距項的估計&1卻是有偏的(證明從略)。-a2的方差是P2方差的有偏估計:對于(9.3)式,已知Vaa)=2(見2.40)b2=&^25)2i23(9.9)b2ZTX22i而對于(9.1)式,有(見4.14)Var(P)=VTOC\o"1-5"\h\z2亍乙xxVaa)=2(見2.40)b2=&^25)2i23(9.9)如第三章所討論的,Var(P「是P2方差的無偏估計,而如果漏掉的X3與X2相關,唁。0,__,八、__,八、__,八、Var(a)豐Var(p),故Var(a)是有偏的。222(4)漏掉X的(9.3)式中的隨機擾動項v的方差估計量o2=RSS..(n-2)將是有偏3ivv的,即E(的,即E(o2)=o2;(5)與方差相關的檢驗,包括假設檢驗、區(qū)間估計等,在關于參數(shù)的統(tǒng)計顯著性方面,都容易導出錯誤的結論。對從模型中遺漏變量時參數(shù)估計性質的認識,還有兩點要特別注意:

(1)若X3與X2相關,r2主0,顯然Vor(a2)wVar(P2),由(4.14)式可看出似乎有Var(a2)<Var(P2)。但實際情形并不完全如此??梢宰⒁獾剑?.1)和(9.3)的剩余平方和RSS是不一樣的,其自由度也是不等的。在樣本容量相同的條件下(9.3)式回歸得到的由(9.6)和(4.14),似意味著盡管變量X3在理RSS「(n-2)豐RSSj(n-3),或02=o;。因此,有可能從RSS/(n一(9.3)式回歸得到的由(9.6)和(4.14),似意味著盡管變量X3在理TOC\o"1-5"\h\zvu(2)若x3與x2不相關,有r2=0和Z乎分別有E(a)=P,Var(8)=Var(a)。若這兩個等式成立,2222論上分析是有關的變量,但從所選模型中略去似乎也不會導致什么危害。這種認識實際也不b2RSSn—2b2RSSn—3、正確。因為Var(a)==,為Var(P)=^^=歹的有偏估2桓X2乙X22乙X2乙X22.2.2i2i計,即使x3與匚不相關,也有Var(叩主Var(叩】致使假設檢驗程序很有可能是可疑的。況且,在大多數(shù)的實證經(jīng)濟研究中,X3與X2通常都是相關的,更可能會產(chǎn)生上述后果。因此必須清楚,一旦根據(jù)相關理論把模型建立起來,再從中遺漏變量需要充分地謹慎。2、包含無關變量(過擬合)的偏誤模型中包括了不重要的解釋變量,即采用誤選了無關解釋變量的模型進行估計而帶來的偏誤,稱為包含無關變量偏誤。為討論方程中包含了無關變量的情形,假設正確的模型是:=P+PX+u(9.10)i122ii而回歸模型加入了無關變量X3,被設定為:=a+aX+aX+v(9.11)i122i33ii可將(9.10)式視為以a3=0為約束的(9.11)式的特殊形式。采用OLS法對式(9.11)進行參數(shù)估計,由(3.27)式有:.二、二2—ZxyZXX(9.12)a=_X^2i[?▽__3i▽3i▽2i3i2乙X2乙X2-(乙X乙X)廠2i3i2i3i將(9.10)式的離差形式七=P2X2i+(u.-u)代入(9.12(9.12)乙22*("私])22i3i2i3i(9.13)(9.14)&=p+(£弋)(£?〃二譏乙22*("私])22i3i2i3i(9.13)(9.14)其方差為b2Var(a)=——工——-22X2(1-r2)TOC\o"1-5"\h\z2i23由以上可知,無關變量的設定誤差的后果為:(1)可以證明,(9.11)式參數(shù)的OLS估計量是無偏的,且為一致性估計量。即:E(&)=°,plima=°。同理,可證明E(&)=°,E(&)=°=0;plima=°2222113311nsns和plima3=°3=0。其中,參數(shù)a2一致性的證明見本章附錄9.2。ns(2)a不是有效估計量。八2b2因為°2的方差為2―-,那么:2i(9.15)Var(&)1□—X2―Var(°J(1-r3)(9.15)雖然變量X3對被解釋變量Y是無關的,但解釋變量X3與X2之間很可能一定程度相關,即0<吃<1,則Var(氣)>Var(°2)。這表明,無關變量X3的誤選,會使得a2的方差增大導致氣的估計精度下降,且偏離程度隨著解釋變量間相關程度的增加而增大。此結論對&也成立;1(3)E(02)=02,即隨機誤差項的方差的估計仍為無偏估計;(4)通常的區(qū)間估計和假設檢驗程序依然有效,但a2的方差增大,接受錯誤假設的概率會較高。比較遺漏相關變量和誤選無關變量兩類設定誤差可以看出,如果遺漏了相關變量,將導致參數(shù)估計量和假設檢驗是有偏的,且為不一致的;如果誤選了無關變量,雖然參數(shù)估計量具有無偏性、一致性,又會損失參數(shù)估計量的有效性。由于事先并不可能清楚地知道隱含在數(shù)據(jù)中的真實數(shù)量關系,建模過程中將面臨如何選擇更為恰當變量的兩難境地。若是主要注重檢驗的無偏性、一致性,那么可能會寧愿誤選無關變量也不愿遺漏相關變量;若是主要注重估計量的有效性,一般的選擇則是寧愿刪除相關變量。通常誤選無關變量不如遺漏相關變量的后果嚴重。因此,一定程度上模型的設定實際是對偏誤與有效進行權衡,偏愛哪一方取決于模型的研究目的。若建模目的只是為了進行預測,最小均方誤差則可能是兼顧有效性和無偏性的良好準則。均方誤差(簡記作MSE)是參數(shù)估計值P*與參數(shù)真實值P離差平方的期望MSE(P*)=E(P*-P)2(9.16)容易證明,均方誤差與方差有如下關系:E(P*-P)2=E[P*-E(P*)]2+[E(P*)-P]2(9.17)均方誤差E(伊-P)2是方差E[P*-E(P*)]2與偏倚的平方[E(P*)-P]2之和,包含了兩個方面的因素。當在較小偏倚(或無偏性)和較小方差(或最小方差性)'二者不可得兼”時,需要進行“權衡與折衷”,可用均方誤差準則。第二節(jié)設定誤差的檢驗相關變量的遺漏和無關變量的誤選,在不同程度上給模型的設定形成了不良影響,有必要對變量設定誤差進行檢驗。當然,這種假設檢驗必須在經(jīng)濟理論指導下進行,不可拋棄經(jīng)濟理論而進行假設檢驗。對于是否誤選無關變量的檢驗,只要針對無關變量系數(shù)的期望值為零的假設,用t檢驗或F檢驗,對無關變量系數(shù)作顯著性檢驗即可。對于遺漏變量設定誤差的檢驗有多種方法,例如DW檢驗、拉格朗日乘數(shù)檢驗(LagrangeMultiplier,LM)、豪斯曼檢驗(Hausman-test)、RESET一般性檢驗等。這里只討論設定誤差的一些最常用的檢驗方法。_、DW檢驗用DW檢驗去檢驗是否遺漏相關變量,其基本思想是認為遺漏的相關變量應包含在隨機擾動項中,那么回歸所得的殘差序列就會呈現(xiàn)單側的正(負)相關性,因此可從自相關性的角度檢驗相關變量的遺漏。從遺漏變量的模型看,可以認為遺漏變量模型是無遺漏變量模型的一個特例:被遺漏變量的系數(shù)為0。例如,式(9.3)是式(9.1)中變量X'^的系數(shù)為0。我們稱(9.1)為無約束回歸模型,而(9.3)為受約束回歸模型。DW檢驗的具體步驟如下:對回歸模型運用ols法得殘差序列匕。設定H0:受約束回歸模型,H「無約束回歸模型。按遺漏解釋變量的遞增次序對殘差序列e進行排序,對排序后的殘差序列匕計算d統(tǒng)計量E(e-e)2d=口寸'一(9.25)Z^e2ii=1查Durbin-Watson表,若d為顯著,則拒絕原假設,受約束回歸模型不成立,存在模型設定誤差,否則接受原假設,受約束回歸模型成立,模型無設定誤差。例如,對表7.1的數(shù)據(jù)設定總生產(chǎn)成本函數(shù),準備使用如下的三個備選模型:(1)Y=P+PX+PX2+PX3+ui12i3i4iiY=。+。X+PX2i12i3iY,=P1+P2X〔其中只有(1)為真實模型,試用DW法檢驗模型設定誤差。表9.2總成本(Y)和產(chǎn)出(X)數(shù)據(jù)總成本(Y)產(chǎn)出(X)1193122262324034244452575626067274782978935091042010首先,對上述三個模型分別代入數(shù)據(jù)回歸得:Y=141.767+63.478X,—12.962X;+0.939X,(6.375)(4.778)(0.9856)(0.0592)(22.238)(13.285)(-13.151)(15.861)R2=0.9983R=0.9975DW=2.70Y=222.383—8.0250X,+2.542X2(23.488)(9.809)(0.869)(9.468)(-0.818)(2.925)R2=0.9284R2=0.9079DW=1.038Y=166.467+19.933X,(19.201)(3.066)(8.752)(6.502)R2=0.8409R2=0.8210DW=0.716由于本例中,遺漏變量已經(jīng)按遞增次序排列,此時的DW值等于d值,無需重新計算d統(tǒng)計量。對上述模型的DW統(tǒng)計量的分析及查表情況如下:對于模型(1)有DW=2.70,當n=10、k'=3、a=5%時,dL=0.525,du=2.016,不能表明存在顯著的正相關關系,接受H0,表示沒有遺漏的變量。對于模型(3)有DW=0.716,當n=10、k'=1、a=5%時,"=0.879,d^=1.320,顯然存在正的自相關,拒絕H0,表明存在遺漏變量;對于模型(2),計算結果有n=10,DW=1.038,那么,當n=10,k'=2,a=5%時,dL=0.697,du=1.641,顯然有0.697<1.038<1.641,屬于無法確定的區(qū)域。這時,可采用修正的DW檢驗法進行檢驗,即擴大拒絕區(qū)域,可依據(jù)DW=1.038<du=1.641,寧可判別殘差中存在正的自相關,認為也存在遺漏變量。二、拉格朗日乘數(shù)(LM)檢驗拉格朗日乘數(shù)檢驗的基本思想,是認為模型中遺漏的相關變量包含在隨機擾動項中,因此隨機擾動項或回歸所得的殘差序列應與遺漏的相關變量呈現(xiàn)出某種依存關系,可以進行殘差序列與相關變量的回歸,在一定顯著水平下若相關變量具有統(tǒng)計顯著性,則認為存在遺漏變量形成的設定偏誤,若相關變量不具有統(tǒng)計顯著性,則認為沒有遺漏變量形成的設定誤差。拉格朗日乘數(shù)檢驗的具體步驟如下:1、對存在遺漏變量設定偏誤的模型(受約束回歸模型)進行回歸,得殘差序列。;i2、用殘差序列匕對全部的解釋變量(包括遺漏變量)進行回歸,得可決系數(shù)R2;3、設定H0:受約束回歸模型,H「無約束回歸模型。在大樣本情況下,構造檢驗統(tǒng)計量nR2,恩格爾(Engle)曾經(jīng)證明,nR2a~x2(約束個數(shù))(9.26)其中:“asy”(asymptotically)表示“漸近地”;約束個數(shù)是H0中設定的受約束個數(shù)。4、進行顯著性檢驗的判斷:若nR2>又淑(約束個數(shù)),則拒絕H0,認為受約束模型不成立,存在遺漏變量;否則,接受H0,認為受約束模型成立,進而無遺漏變量。

*三、一般性檢驗(RESET)2RESET檢驗(regressionerrorspecificationtest)是拉姆齊(Ramsey)于1969年提出的一種檢驗方法。其檢驗的基本思想為:如果事先知道遺漏了哪個變量,只需將此變量引入模型,估計并檢驗其參數(shù)是否顯著不為零即可,可是問題是并不知道遺漏了哪個變量,這時可尋找一個替代變量Z來進行上述檢驗。RESET檢驗中,替代變量Z通常選用所設定模型被解釋變量擬合值若干次幕的線性組合。若模型估計所得的殘差包含著遺漏的相關變量,那么這個殘差可用被解釋變量擬合值的線性組合近似表示;若這個線性組合是顯著的,則認為原模型的設定有誤。由于可引入若干個替代變量去判斷是否有多個變量被遺漏,所以該方法被稱為一般性設定偏誤檢驗。RESET檢驗的基本步驟為:第1步:對模型進行回歸,用OLS法估計Y=P+PX++PX+ui122kkii分別得到Y的擬合值Y和殘差e。若殘差e與擬合值Y之間存在某種函數(shù)關系,則可用擬ii?IIi合值Y若干次幕的線性組合充當工具變量;i第2步:用被解釋變量y的擬合值y的線性組合,測度殘差中是否包含著遺漏的相關變量。具體做法為,在第1步的模型中增加一個包含擬合值y的函數(shù)。這個函數(shù)通常選擇為擬合值Y的平方、立方和四次方的線性組合。例如:iY=P+PX+i122i+Y=P+PX+i122i+pX+5Y2+5Y3+5Y4+Vkki1i2i3ii(9.36)并對上述模型進行估計;第3步:構造原假設:H0:5=0'j』1'2'3。然后用F統(tǒng)計量進行檢驗。F檢驗統(tǒng)計量為(RSS-RSS)JF~RSS「n-(k1+J)(R2-R2)J)n-(k+J-R2)3-R2U(R2(9.37)_(RSS-RSS)3_…"rss「、-(k’+3)y-Q"+3)(9.38)其中,RSSu和Rj分別為對方程(9.36)進行回歸得到的殘差平方和與擬合優(yōu)度,RSSr和2這部分內容本科教學供選擇R2分別為當原假設:H0:七=0,j=1,2,3成立時,對方程(9.36)進行回歸得到的殘差平方和與擬合優(yōu)度,J為約束條件的個數(shù)。若F統(tǒng)計值大于F臨界值,則拒絕原假設,表明存在某種形式的設定誤差問題。第三節(jié)測量誤差經(jīng)濟計量研究中需要運用大量的觀測數(shù)據(jù),在搜集相關的數(shù)據(jù)時,經(jīng)常遇到所搜集的數(shù)據(jù)不能確實地反映變量間經(jīng)濟行為的情況。在計量經(jīng)濟模型中使用了經(jīng)濟變量不準確的數(shù)據(jù)時,則稱模型中包含了測量誤差。測量誤差將會影響計量經(jīng)濟分析的結果。一、模型變量的測量誤差測量誤差指在收集數(shù)據(jù)過程中的登記誤差、在數(shù)據(jù)加工整理過程中的整理誤差以及其他統(tǒng)計誤差。計量經(jīng)濟研究中運用的觀測數(shù)據(jù)出現(xiàn)測量誤差,原因是多方面的。首先,受人為因素和技術因素的影響,對經(jīng)濟現(xiàn)象和過程的調查登記本身就可能產(chǎn)生誤差,例如虛報和誤解指標含義而產(chǎn)生的統(tǒng)計誤差;其次,數(shù)據(jù)的加工處理過程中也可能導致一定的誤差,例如錯誤的匯總或分組導致的偏差,又如經(jīng)過修勻加工的數(shù)據(jù)與實際情況的偏差;此外,數(shù)據(jù)的不當使用也會出現(xiàn)誤差,例如錯誤地理解和運用了不同內涵、不同范圍、不同計量單位的數(shù)據(jù)??梢园堰@些有關數(shù)據(jù)的誤差統(tǒng)稱為“測量誤差”。測量誤差可能是被解釋變量的測量誤差,也可能是解釋變量的測量誤差。為了說明測量誤差的后果,設正確的回歸模型為=a+"X*+七(9.39)其中:Y為被解釋變量的理論真實值;X「為解釋變量的理論真實值,且Y*和X「都是不可直接測量的,而只能通過下列測量過程得到其樣本數(shù)據(jù):=Y*+8e~N(0q2)(9.40)TOC\o"1-5"\h\z\o"CurrentDocument"iiii8Xj=X*+氣巴~N(0,Q2)(9.41)且:Cov(e.,3)=0Cov(8.,X)=0其中:Y是Y*的測量結果;8是Y*的測量誤差;X是X*的測量結果;3是X*的\o"CurrentDocument"iiiiiiii測量誤差;8與3相互無關,8與X也無關,且各誤差都沒有序列相關。iiii

用觀測到的樣本數(shù)據(jù)進行回歸時,等價于對下式回歸:Y=a+P(X—①)+u+£iiiii=a+gX,+u+=a+gX,+u+£.-。①.(9.42)將式(9.39)、(9.40)、(9.41)分別以離差形式表示:(9.43(9.43)(9.44)(9.45)X=X*+(①一切)(9.45)對(9.42)采用OLS法,有£xyp=£iiAX2i將(9.44)和(9.45)代入,并在大樣本下,取概率極限得(推導過程見附錄9.3)PlimP=陽X(9.46)VarX*+b21+a2(9.46)b2X*其中。2為(9.41)式中①的方差;。2為X*的方差。因為(9.46)式中。2.6>0,這OX*i。x*表明當測量誤差存在時,OLS法常常會低估真實的回歸參數(shù)。值得指出的是,回歸變量中的測量誤差是數(shù)據(jù)問題,目前計量經(jīng)濟學家們還提不出有效的解決方法。一般的做法往往是忽略測量誤差問題,主觀上希望測量誤差足夠小,從而不破壞計量的合理性。二、測量誤差的檢驗測量誤差的存在使得回歸系數(shù)被低估,將直接影響計量經(jīng)濟分析的結果,因此有必要對是否存在測量誤差進行檢驗。關于測量誤差存在與否的檢驗是豪斯曼(Hausman)1978年提出的檢驗方法3,豪斯曼方法的具體步驟為:(1)對所研究的回歸模型,無論是否存在測量誤差,先采用OLS法得到參數(shù)估計量;(2)對可能存在測量誤差的解釋變量,選擇與其相關的工具變量,將可能存在測量誤3J.A.Hausman:“SpecificationTestsinEconometrics”,Econometrics,vol.46,pp1251-1271,Nov.1978.差的解釋變量對選擇的工具變量進行回歸,并獲得回歸殘差⑴;將回歸殘差⑴加入第(1)步中的回歸表達式,再次進行OLS估計,得^的參數(shù)估計值P及假設檢驗結果;①…X一-一?.一?一?..若P為顯著時,則認為解釋變量的確存在觀測誤差,反之,認為解釋變量不存①在測量誤差?,F(xiàn)以一個例子說明上述檢驗步驟:例7.2利用觀測到的樣本數(shù)據(jù)作回歸,已得到以下結果:人一一一EXP=—46.81+0.00324AID+0.00019INC-0.597POP(9.47)t=(—0.56)(13.64)(8.12)(—5.17)R2=0.993F=2190其中:EXP為某貧困地區(qū)地方政府的支出;AID為中央政府的撥款量;INC為貧困地區(qū)地方政府的財政收入;POP為該地區(qū)的總人口數(shù)?,F(xiàn)懷疑中央政府的撥款量AID存在測量誤差。現(xiàn)選擇工具變量PS(PS為貧困人口數(shù)),其原因為扶貧支出是該地區(qū)地方政府支出中比重最大的支出,其經(jīng)費來源主要是依賴中央政府的撥款,因此PS與AID有較高相關性。將AID對PS進行回歸,得到如下的殘差變量河:$.=AID—(77.95+0.845PS)(9.48)t=(—1.28)(18.02)R2=0.87將金項加入(9.47),再回歸得到以下結果:.人-EXP=—138.51+0.00174AID+0.00018INC—0.275POP+1.37有.(9.49)t=(—1.41)(1.94)(7.55)(—1.29)(1.73)從(9.49)看出,因為金系數(shù)的t值是1.73(<1.96),在5%的顯著性水平下,雙側t檢.驗接受原假設(不存在測量誤差),但在10%的顯著性水平上,雙側t檢驗則拒絕原假設而接受備擇假設(存在測量誤差)。我們注意到,引進對測量誤差可能性的修正,使AID變量的系數(shù)變小,這從另一個側面說明,測量誤差夸大了AID對EXP的影響。

第四節(jié)案例分析以引子中所提出的問題為例,分析影響中國進口量的主要因素(數(shù)據(jù)如表9.3所示)。表9.3單位:人民幣億元、億美元進口總額IM進口總額匯率年份GDP(人民幣)IMdollar(美元)EXCHANGE19804517.8298.8000200.17149.840019814862.4375.3800220.15170.510019825294.7364.9900192.85189.260019835934.5422.6000213.90197.570019847171.0637.8300274.10232.700019858964.41257.800422.52293.6600198610202.201498.300429.04345.2800198711962.501614.200432.16372.2100198814928.302055.100552.75372.2100198916909.202199.900591.40376.5100199018547.902574.300533.45478.3200199121617.803398.700637.91532.3300199226638.104443.300805.85551.4600199334634.405986.2001039.59576.2000199446759.409960.1001156.14861.8700199558478.1011048.101320.84835.1000199667884.6011557.401388.33831.4200199774462.6011806.501423.70828.9800199878345.2011626.101402.37827.9100199982067.5013736.401656.99827.8300200089468.1018638.802250.94827.8400200197314.8020159.202435.53827.70002002105172.324430.302951.70827.7000

2003117251.934195.604127.602003117251.934195.604127.60827.7000數(shù)據(jù)來源:《中國統(tǒng)計年鑒2004》中國統(tǒng)計出版社設定如下的模型。(9.50)IM=a+aGDP+ut12tt(9.50)其中,IMt是進口總額,GDPt是國內生產(chǎn)總值。為了分析此模型是否有變量設定誤差,進行變量設定誤差檢驗。有人認為,貨物與服務的進口量受到一國的生產(chǎn)規(guī)模、貨物與服務的進口價格、匯率等其他影響因素,而不能只僅用GDP來解釋商品進口的變化。因此,設定的回歸模型應該為:IM=。+。f(GDP)+Pg(Exchange)+u(9.51)t12t3tt其中:GDP為國內生產(chǎn)總值,f(GDP)為GDP的線性函數(shù),Exchange為美元兌換人民幣的匯率,g(Exchange為Exchange的線性函數(shù)。如果是這樣,顯然設定的回歸模型(9.50)式中可能遺漏了變量GDP、Exchange以及兩者的線性組合。那么GDP、Exchange以及兩者的線性組合是否被遺漏的重要變量呢?依據(jù)表9.3的數(shù)據(jù),錄入到EViews響應的數(shù)據(jù)表中,考證IM=f(GDP)基本關系圖:對(9.50)進行回歸,有回歸結果im=-1067.337+0.2307GDP+ese=(792.2620)(0.0142)t=(-2.0288)(16.2378)R2=0.9230R2=0.9195DW=0.5357F=263.6657并作(9.50)回歸的殘差圖:

顯然,存在自相關現(xiàn)象,其主要原因可能是建模時遺漏了重要的相關變量造成的。1、DW檢驗模型im=-1067.337+0.2307GDP+e的DW統(tǒng)計量表明,存在正的自相關,由于遺漏變量exchange或GDP已經(jīng)按從小到大順序排列,因此,無需重新計算d統(tǒng)計量。對n=24和k'=1,5%的德賓-沃森d-統(tǒng)計量的臨界值為dL=\.273和匕=1-446,0.5357<d^=1.273,表明存在顯著的遺漏變量現(xiàn)象。為此,進行如下的校正:DependentVariable:IMMethod:LeastSquaresDate:07/08/05Time:15:40Sample(adjusted):19812003Includedobservations:23afteradjustmentsVariableCoefficientStd.Errort-StatisticProb.C-224.36321892.132-0.1185770.9069GDP1.1482590.1514337.5826060.0000GDP(-1)-0.8224440.147359-5.5812130.0000EXCHANGE-4.2907468.348744-0.5139390.6135EXCHANGED-0.0186370.008353-2.2311620.0386R-squared0.978691Meandependentvar8434.222

AdjustedR-squared0.973956S.D.dependentvar9025.326S.E.ofregression1456.525Akaikeinfocriterion17.59515Sumsquaredresid38186370Schwarzcriterion17.84200Loglikelihood-197.3443F-statistic206.6799Durbin-Watsonstat1.962659Prob(F-statistic)0.000000其中,exchange的系數(shù)在統(tǒng)計意義上不顯者,DependentVariable:IMMethod:LeastSquaresDate:07/08/05Time:15:43Sample(adjusted):19812003Includedobservations:23afteradjustments可以剔除,則有:VariableCoefficientStd.Errort-StatisticProb.C-1159.179511.0396-2.2682760.0352GDP1.1428970.1481197.7160700.0000GDP(-1)-0.8158420.143928-5.6684200.0000EXCHANGED-0.0225690.003291-6.8578440.0000R-squared0.978378Meandependentvar8434.222AdjustedR-squared0.974965S.D.dependentvar9025.326S.E.ofregression1428.041Akaikeinfocriterion17.52277Sumsquaredresid38746720Schwarzcriterion17.72024Loglikelihood-197.5118F-statistic286.5846Durbin-Watsonstat2.047965Prob(F-statistic)0.000000可以認為,這時模型設定無變量設定誤差。2、LM檢驗按照LM檢驗步驟,首先生成殘差序列%(用EE表示),用EE對全部解釋變量(包括

遺漏變量)進行回歸,有:DependentVariable:EEMethod:LeastSquaresDate:07/08/05Time:15:45Sample(adjusted):19812003Includedobservations:23afteradjustmentsVariableCoefficientStd.Errort-StatisticProb.C448.1584511.03960.8769540.3915GDP0.9122010.1481196.1585680.0000GDP(-1)-0.8158420.143928-5.6684200.0000EXCHANGED-0.0225690.003291-6.8578440.0000R-squared0.727360Meandependentvar-37.56085AdjustedR-squared0.684312S.D.dependentvar2541.624S.E.ofregression1428.041Akaikeinfocriterion17.52277Sumsquaredresid38746720Schwarzcriterion17.72024Loglikelihood-197.5118F-statistic16.89632Durbin-Watsonstat2.047965Prob(F-statistic)0.000014再計算nR2=2株0.^2736查1表6囂7(急=9572.8377顯7然,16.72928>7.37776,拒絕h0:受約束回歸模型,接受H「無約束回歸模型的假設,即確實存在遺漏變量。因此,在本章的引子中不能判斷雖然簡單但遺漏了重要變量的方程(1)比復雜的方程(2)更好。第九章小結1、計量經(jīng)濟學模型中的古典假設不是無條件的假設,而是有條件的假設。一是所設定的條件期望方程沒有方程設定誤差;二是所設定的回歸模型沒有模型設定誤差。2、方程設定誤差主要指:(1)真實變量的遺漏;(2)無關變量的引入;(3)解釋變量、被解釋變量中存在觀測誤差。此外還有錯誤函數(shù)形式的誤設和隨機擾動項的非正確設定等。3、當模型中遺漏了真實的變量時,模型的參數(shù)估計是有偏且不一致;參數(shù)估計的方差估計不正確,隨機擾動項方差的估計也是不正確的,將使得假設檢驗、區(qū)間估計失效。4、當模型包含無關變量,后果不如遺漏變量那么嚴重,模型的參數(shù)估計仍然是無偏且一致的,隨機擾動項的方差將被正確估計,但所估計的方差將趨之于過大,從而使得參數(shù)估計的有效性降低,參數(shù)估計較為不準確,區(qū)間估計的精度下降。5、檢驗方程設定誤差的常用方法有:(1)DW檢驗;(2)LM檢驗;(3)Husman檢驗;(4)RESET檢驗。6、測量誤差分為被解釋變量測量誤差和解釋變量測量誤差。測量誤差使參數(shù)的OLS估計有偏且不一致,常常低估真正的回歸參數(shù)。第九章主要公式表均方誤差(簡記作MSE)MSE(P*)=E(P*-P)2均方誤差與方差的關系MSE(P*)=E{伊-E(P*)}2+{E(P*)-P}2DW檢驗d=£(e-e)2/乙2i=2''i=1拉格朗日乘數(shù)檢驗nR2?x2(約束個數(shù))ays思考題與練習題思考題9.1什么是設定誤差?設定誤差有那些基本表現(xiàn)?9.2不同類型的設定誤差對模型參數(shù)估計的影響有哪些相同之處?又有哪些區(qū)別?9.2檢驗變量設定誤差有哪幾種方法?它們的共性和差異是什么?9.3如何進行遺漏變量設定誤差的后果分析?其檢驗有哪些方法?如何檢驗?9.4如何進行無關變量設定誤差的后果分析?其檢驗有哪些方法?如何檢驗?9.5什么是測量誤差?測量誤差與變量設定誤差有何區(qū)別?9.6如何對測量誤差和設定誤差的后果進行分析?其檢驗有哪些方法?如何檢驗?練習題9.1設真實模型為無截距模型:=a2X2+u回歸分析中卻要求截距項不能為零,于是,有人采用的實證分析回歸模型為:=p+pX+£TOC\o"1-5"\h\z122i試分析這類設定誤差的后果。9.2資本資產(chǎn)定價模型現(xiàn)代投資理論中的資本資產(chǎn)定價模型(CAPM)設定,一定時期內的證券平均收益率與證券波動性(通常由貝塔系數(shù)p度量)有以下關系\o"CurrentDocument"R=a+a(p)+u⑴其中,R=證券,的平均收益率,Pi=證券i的真正p系數(shù),七=隨機擾動項;由于證券i的真正p系數(shù)不可直接觀測,通常采用下式進行估算:r=a+p*r+e(2)其中,%=時間t證券,的收益率,%=時間t的市場收益率(通常是某個股票市場的綜合指數(shù)的收益率),e=殘差項;p*是真正p系數(shù)的一個估計值,且有p*=p+v,v是觀ti1ii測誤差。在實際的分析中,我們采用的估計式不是(1)而是:R=a+a(p*)+u(3)(1)觀測誤差V對氣的估計會有什么影響?(2)從(3)估計的a2會是真正氣的一個無偏估計嗎?若不是,會是真正氣的一致性估計嗎?9.31978年-2003年的全國居民消費水平與國民收入的數(shù)據(jù)如下。年份國民總收國內生產(chǎn)全國居民消農(nóng)村居民消城鎮(zhèn)居民消

入(GNI)總值(GDP)費水平(CT)費水平(CN)費水平(CC)19783624.13624.118413840519794038.24038.220715843419804517.84517.823617849619814860.34862.426219956219825301.85294.728422157619835957.45934.531124660319847206.77171.032728366219858989.18964.4437347802198610201.410202.2485376805198711954.511962.55504171089198814922.314928.36935081431198916917.816909.27625531568199018598.418547.98035711686199121662.521617.88966211925199226651.926638.110707182356199334560.534634.413318553027199446670.046759.4174611183891199557494.958478.1223614344874199666850.567884.6264117685430199773142.774462.6283418765796199876967.278345.2297218956217199980579.482067.5313819276796200088254.089468.1339720377402200195727.997314.83609215677612002103935.3105172.33818226980472003116603.2117251.9408923618471若依據(jù)弗里德曼的持久收入假設,消費函數(shù)的真正模型應為CC=a+pGNI+u(1)試用Eviews軟件,采用兩種以上檢驗方法對實證

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論