面板數(shù)據(jù)模型入門講解_第1頁
面板數(shù)據(jù)模型入門講解_第2頁
面板數(shù)據(jù)模型入門講解_第3頁
面板數(shù)據(jù)模型入門講解_第4頁
面板數(shù)據(jù)模型入門講解_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 /19面板數(shù)據(jù)模型入門講解第十四章面板數(shù)據(jù)模型在第五章,當我們分析城鎮(zhèn)居民的消費特征時,我們使用的是城鎮(zhèn)居民的時間序列數(shù)據(jù);而當分析農(nóng)村居民的消費特征時,我們使用農(nóng)村居民的時間序列數(shù)據(jù)。如果我們想要分析全體中國居民的消費特征呢?我們有兩種選擇:一是使用中國居民的時間序列數(shù)據(jù)進行分析,二是把城鎮(zhèn)居民和農(nóng)村居民的樣本合并,實際上就是兩個時間序列的樣本合并為一個樣本。多個觀測對象的時間序列數(shù)據(jù)所組成的樣本數(shù)據(jù),被稱為面板數(shù)據(jù)(PanelData)。通常也被稱為綜列數(shù)據(jù),意即綜合了多個時間序列的數(shù)據(jù)。當然,面板數(shù)據(jù)也可以看成多個橫截面數(shù)據(jù)的綜合。在面板數(shù)據(jù)中,每一個觀測對象,我們稱之為一個個體(In

2、dividual)。例如城鎮(zhèn)居民是一個觀測個體,農(nóng)村居民是另一個觀測個體。如果面板數(shù)據(jù)中各觀測個體的觀測區(qū)間是相同的,我們稱其為平衡的面板數(shù)據(jù),反之,則為非平衡的面板數(shù)據(jù)?;诿姘鍞?shù)據(jù)所建立的計量經(jīng)濟學模型則被稱為面板數(shù)據(jù)模型。例如,表5.3.1中城鎮(zhèn)居民和農(nóng)村居民的樣本數(shù)據(jù)具有相同的采樣區(qū)間,所以,它是一個平衡的面板數(shù)據(jù)。14.1面板數(shù)據(jù)模型一、兩個例子居民消費行為的面板數(shù)據(jù)分析讓我們重新回到居民消費的例子。在表5.1.1中,如果我們將城鎮(zhèn)居民和農(nóng)村居民的時間序列數(shù)據(jù)作為一個樣本,以分析中國居民的消費特征。那么,此時模型(5.1.1)的凱恩斯消費函數(shù)就可以表述為:C二B+BY+(14.1.1

3、)it01itit=卩+九+u(14.1.2)ititit其中:C和Y分別表示第i個觀測個體在第t期的消費和收入。i=1、2分別表示城鎮(zhèn)itit居民和農(nóng)村居民兩個觀測個體,t=1980、2008表示不同年度。u為經(jīng)典誤差項。it在(14.1.2)中,卩隨觀測個體的變化,而不隨時間變化,它反映個體之間不隨時間變i化的差異性,被稱為個體效應(yīng)。九t反映不隨個體變化的時間上的差異性,被稱為時間效應(yīng)。在本例中,城鎮(zhèn)居民和農(nóng)村居民的消費差異一部分來自收入差異和隨機擾動,還有一部分差面板數(shù)據(jù)模型入門講解異是由城鎮(zhèn)居民和農(nóng)村居民的身份或地域差異決定的,它不隨時間變化,這種差異性就由卩1和卩2來反映。同時,對同

4、一種居民,在收入不變的情況下,消費支出還可能隨時間的變化而變化,這種變化的來源在于除隨機擾動以外經(jīng)濟環(huán)境的一些系統(tǒng)性變化,如經(jīng)濟體制的變遷,這種變化是所有居民共同面對的,所導致的居民消費在時間上的差異性就由時間效應(yīng)九、九、九來反映。198019812008實際上,模型(14.1.1)還隱含了一個假定,既假定城鄉(xiāng)居民的邊際消費傾向相同并且不隨時間變化。盡管這一假定不一定成立,但作為熟悉面板數(shù)據(jù)模型基礎(chǔ)知識的例子,我們還是暫且保留這一假定。農(nóng)村居民收入分析為了考察中國農(nóng)民收入與農(nóng)村要素投入結(jié)構(gòu)之間的關(guān)系,同樣地,我們既可以采用全國的時間序列總量數(shù)據(jù)進行分析,也可以采用各省市自治區(qū)的橫截面數(shù)據(jù)進行分

5、析。但是,如果能夠綜合各省市自治區(qū)的時間序列數(shù)據(jù),從而基于面板數(shù)據(jù)進行分析,一個顯而易見的好處就是,我們將會有更多更具體的信息,估計和檢驗統(tǒng)計量都會有更大的自由度,從而獲得更可靠的分析結(jié)論。簡單而言,由于農(nóng)村剩余勞動力的存在,影響農(nóng)村居民收入的要素配置因素可以分為以下幾個方面:資本擁有量、投資主體結(jié)構(gòu)、勞動的配置狀態(tài)等。所以,基于省際面板數(shù)據(jù),有研究者建立了如下的面板數(shù)據(jù)模型:ln(PIC)=0+0ln(CSC)+0RLT+0RCI+s(14.1.3)it01it2it3itit=p+九+u。itititi=1,2,N,t=1,2,-T其中:picit為地區(qū)i在第t期的農(nóng)村人均純收入,各年份的

6、現(xiàn)值均按本地區(qū)農(nóng)村消費者價格指數(shù)折算為1995年不變價。RLTit為地區(qū)i在第t期鄉(xiāng)村勞動力中非農(nóng)產(chǎn)業(yè)從業(yè)人數(shù)與農(nóng)林牧漁等傳統(tǒng)產(chǎn)業(yè)從業(yè)人數(shù)之比。RCIit為地區(qū)i在第t期農(nóng)村集體投資與個人投資的比率。CSC為估算的地區(qū)i在第t期農(nóng)村人均資本存量。卩和九分別為個體效應(yīng)和時間效應(yīng)。卩ititi反映除勞動力分配比例、投資比例、資本存量的影響以外,各省人均純收入受本省內(nèi)在因素(如地理位置,經(jīng)濟發(fā)展基礎(chǔ)等)所導致的不隨時間變化的差異性。而時間效應(yīng)反映除解釋變量的影響以外,所有省份農(nóng)村人均純收入面對共同的經(jīng)濟環(huán)境的變化而形成的時間上的差面板數(shù)據(jù)模型入門講解異性。顯然,面板模型與我們以前所學的模型之間的區(qū)別

7、,就在于存在個體效應(yīng)和時間效應(yīng)。簡而言之,剔除了解釋變量的影響以后,由個體內(nèi)部不變的因素所導致的個體之間的差異性,就是個體效應(yīng);由所有個體所面對的共同因素所導致的時間上的變化,就是時間效應(yīng)。二、面板數(shù)據(jù)的特征及優(yōu)勢基于前面兩個例子,我們發(fā)現(xiàn),面板數(shù)據(jù)既可以看作多個個體時間序列數(shù)據(jù)的合并,也可以看作多個時點橫截面數(shù)據(jù)的合并。所以,面板數(shù)據(jù)的基本特征就是其數(shù)據(jù)結(jié)構(gòu)的二維性(圖14.1.1)?;蛘哒f,面板數(shù)據(jù)是一個數(shù)據(jù)平面,這也正是其被以“面板”命名的原因。列數(shù)ti12Nf1XXU橫11121T截2XXX21222T面數(shù)rtXXX據(jù)1TN1N2NNO時間序圖14.1.1變量X的面板數(shù)據(jù)結(jié)構(gòu)那么,有讀

8、者會說,我們可以基于全國的總量數(shù)據(jù)(城鎮(zhèn)居民和農(nóng)村居民數(shù)據(jù)加總)來分析中國居民的消費行為,為什么要使用面板數(shù)據(jù)呢?實際上,使用面板數(shù)據(jù)會為我們的計量經(jīng)濟學分析帶來很多的好處。(1)擴大信息量,增加估計和檢驗統(tǒng)計量的自由度。顯然,與時間序列數(shù)據(jù)和橫截面數(shù)據(jù)不同,面板數(shù)據(jù)是二維數(shù)據(jù)。它既包含觀測同一個體隨時間的變化,也包含同一時間不同個體之間的差異。這顯著擴大了樣本的信息量和樣本容量,有助于提高參數(shù)估計的精度和檢驗結(jié)論的可靠性。對模型(14.1.1)而言,如果我們基于居民的時間序列數(shù)據(jù)進行分析,樣本容量為29。而基于城鎮(zhèn)和農(nóng)村的面板數(shù)據(jù),樣本容量則為58,如果基于省市區(qū)的面板數(shù)據(jù),樣本容量將更大,

9、模型估計量和檢驗統(tǒng)計量的自由度顯著增加。更重要的是,基于總量數(shù)據(jù)進行分析,無法反映兩種居民之間的差異性,其數(shù)據(jù)信息對于兩種居民都有顯著的偏差。(2)有助于提供動態(tài)分析的可靠性。面板數(shù)據(jù)模型入門講解基于單個個體的時間序列數(shù)據(jù)進行動態(tài)分析,一方面會受到采樣區(qū)間的限制,另一方面其研究結(jié)論也缺乏普適性。而基于面板數(shù)據(jù),則可以在較短的采樣區(qū)間內(nèi)反映多個個體共同的動態(tài)變化特征,從而弱化樣本區(qū)間的制約得到更為可靠的分析結(jié)論。當我們在模型(14.1.1)中引入預(yù)期因素時,其回歸模型被表述為:CP+PY+PC+。(14.1.4)it01it2i,t-1it如果使用總量數(shù)據(jù),我們只能根據(jù)不同年度消費額的變化信息來

10、估計消費的動態(tài)性質(zhì),而使用面板數(shù)據(jù),我們有兩種居民消費的變化信息可供利用。(3)有助于反映經(jīng)濟結(jié)構(gòu)、經(jīng)濟制度的漸進性變化。對于所考察的經(jīng)濟體系而言,經(jīng)濟結(jié)構(gòu)和經(jīng)濟制度的變化通常是漸進性的,我們很難找到一個量化的指標來反映這種漸進性變化。幸運的是,使用面板數(shù)據(jù)時,時間效應(yīng)是被解釋變量中不隨個體變化而只隨時間變化的部分,它反映了所有個體所面對的共同因素的影響。所以,時間效應(yīng)是對經(jīng)濟結(jié)構(gòu)和經(jīng)濟制度漸變效應(yīng)的一個很好的度量指標。(4)面板數(shù)據(jù)有助于反映經(jīng)濟體的結(jié)構(gòu)性特征。與總量數(shù)據(jù)相比,面板數(shù)據(jù)提供了更具微觀層次的信息。對很多經(jīng)濟問題的分析而言,某些變量涉及不同觀測個體之間的相互關(guān)系,例如資本和勞動在

11、區(qū)域和產(chǎn)業(yè)之間的流動,技術(shù)的溢出,通脹的相互影響等。使用面板數(shù)據(jù)使得這些結(jié)構(gòu)性變化信息的分析成為可能。三、面板數(shù)據(jù)模型的混合估計既然面板數(shù)據(jù)有諸多優(yōu)勢,那么,面板數(shù)據(jù)模型的分析與時間序列或橫截面數(shù)據(jù)模型有什么不同呢?在(14.1.1)和(14.1.3)中,如果假定個體效應(yīng)和時間效應(yīng)為0,那么,這些模型與我們前面所熟悉的單方程模型沒有任何本質(zhì)上的差異。所以,我們可以直接基于OLS對其進行估計。也就是說,我們沒有考慮面板數(shù)據(jù)的結(jié)構(gòu)特殊性,而直接把各時間序列或各橫截面數(shù)據(jù)混合起來進行估計,這種估計方法我們稱之為面板混合OLS估計。對于模型(14.1.3),如果假定個體效應(yīng)和時間效應(yīng)為0,則模型可以表

12、述為:ln(PIC)P+0ln(CSC)+PRLT+PRCI+u(14.1.5)0123其中:PIC(PICPICPICPICPIC),pic為地111TitN1NTit區(qū)i在第t期的農(nóng)村人均純收入。也就是說,我們將各個地區(qū)的數(shù)據(jù)堆積起來,看成是對同面板數(shù)據(jù)模型入門講解一個對象的觀測數(shù)據(jù)。其他變量的向量表述也是類似的。如果u為經(jīng)典誤差項,這一模型與第五章所講的多元線性回歸模型沒有任何本質(zhì)區(qū)別,其OLS估計量是線性無偏最優(yōu)估計量。基于中國28個省市自治區(qū)(不包括重慶、海南、西藏)19952005年的面板數(shù)據(jù),其面板混合OLS估計的結(jié)果為:ln(PIC)=7.8158+0.35911ln(CSC)

13、+0.2523RLT-0.0104RCI14.1.6)ititititt統(tǒng)計值202.273017.2520p值0.00000.00005.7464-3.17360.00000.0017R2=0.8409R2=0.8393。但是,對面板數(shù)據(jù)而言,把個體效應(yīng)和時間效應(yīng)假定為0一般是不符合經(jīng)濟現(xiàn)實的,尤其是個體效應(yīng)。我們很難想象各地區(qū)農(nóng)村居民的消費特征不存在差異性。當我們考慮個體效應(yīng)與時間效應(yīng)時,我們會發(fā)現(xiàn),面板數(shù)據(jù)在為我們帶來更多信息和便利的同時,也帶來了一些新的問題。14.2固定效應(yīng)與隨機效應(yīng)面板數(shù)據(jù)模型的一般形式可以表述為:Y+PXHPX+&(14.2.1)it011itKKitit8=卩+

14、九+U。itititi=1,2,Nt=1,2,T。其中:u為經(jīng)典誤差項。E(卩)=0,E(九)=0,E(卩u)=0,E(九u)=0。ititiittit我們已經(jīng)知道,與時間序列數(shù)據(jù)或橫截面數(shù)據(jù)的單方程模型相比,面板數(shù)據(jù)模型唯一的不同之處就是存在個體效應(yīng)卩和時間效應(yīng)九。根據(jù)卩和九與模型解釋變量是否相關(guān),面板數(shù)itit據(jù)的個體效應(yīng)和時間效應(yīng)又分為兩種情形:固定效應(yīng)和隨機效應(yīng)。如果個體效應(yīng)卩與模型中的解釋變量是相關(guān)的,我們就稱這種個體效應(yīng)是固定效應(yīng)i(FixedEffect)。反之,如果個體效應(yīng)卩與模型中的解釋變量不相關(guān),我們稱之為隨機效應(yīng)iRandomEffect)。同樣地,如果時間效應(yīng)九與模型中

15、的解釋變量是相關(guān)的,我們就稱這種時間效應(yīng)是固t定效應(yīng)。反之,則為隨機效應(yīng)。面板數(shù)據(jù)模型入門講解例如:在模型(14.1.1)中,如果個體效應(yīng)卩與收入Y相關(guān),時間效應(yīng)九與收入Y不iittit相關(guān),那么,該模型的個體效應(yīng)是固定效應(yīng),時間效應(yīng)是隨機效應(yīng)。如何理解固定效應(yīng)和隨機效應(yīng)的含義呢?當個體效應(yīng)與解釋變量相關(guān)時,因為解釋變量反映觀測個體的個性化特征,所以,此時的個體效應(yīng)反映了觀測個體的個性化特征?;蛘哒f,此時個體效應(yīng)的差異與觀測個體的特征有內(nèi)在的聯(lián)系,所以,我們可以稱這種效應(yīng)是“固定”的。相反,如果個體效應(yīng)與解釋變量不相關(guān),則說明個體效應(yīng)的差異與觀測個體的特征沒有顯著的內(nèi)在聯(lián)系,在某種程度上,這種

16、個體差異有可能是“隨機”產(chǎn)生的。同樣,時間效應(yīng)的固定效應(yīng)是指時間效應(yīng)在時間上的差異是與特定觀測時間的經(jīng)濟背景有內(nèi)在聯(lián)系,而其隨機效應(yīng)則是指時間效應(yīng)在時間上的差異是“隨機”產(chǎn)生的。14.3靜態(tài)面板數(shù)據(jù)模型的估計對于面板數(shù)據(jù)模型(14.2.1),我們首先考慮解釋變量中不含被解釋變量滯后項的情形,這樣的模型我們稱之為靜態(tài)面板數(shù)據(jù)模型。當個體效應(yīng)卩和時間效應(yīng)九是固定效應(yīng)和隨機效應(yīng)時,模型所面對的計量經(jīng)濟學問題it是不同的,其估計方法也不同。一、靜態(tài)面板數(shù)據(jù)模型的固定效應(yīng)估計如果個體效應(yīng)卩和時間效應(yīng)九滿足固定效應(yīng)假定,顯然此時模型的隨機誤差項與解itit釋變量相關(guān),它違背了高斯馬爾可夫定理對“解釋變量與

17、誤差項不相關(guān)”的假定,根據(jù)我們在模型設(shè)定和聯(lián)立方程中所學的知識,此時模型中參數(shù)的OLS估計量是有偏的。顯然,固定效應(yīng)面板數(shù)據(jù)模型的本質(zhì)問題是解釋變量的內(nèi)生性問題,其后果是OLS估計量不再是無偏的估計量。既然OLS估計量是有偏的,我們就需要新的無偏估計量。對于固定效應(yīng)的靜態(tài)面板數(shù)據(jù)模型,其線性最優(yōu)無偏的估計方法是最小二乘虛擬變量法(LSDV方法)。1.LSDV估計方法為了表述簡便,我們以后不考慮時間效應(yīng),而只考慮個體效應(yīng)。我們基于如下的一元靜態(tài)面板數(shù)據(jù)模型來說明LSDV估計的基本思路:Y二B+BX+(14.3.1)it01itit面板數(shù)據(jù)模型入門講解8二卩+U。itiiti=1,2,Nt=1,2

18、,T。為每一個個體設(shè)定一個虛擬變量D,i=1,2,N。其中:D=1表示第i個觀ii測個體,D=0表示不是第i個觀測個體。i在模型中引入虛擬變量,通過虛擬變量使個體效應(yīng)顯性化(參數(shù)化),則模型(14.3.1)可表述為:Y=B+卩D+卩D+BX+u(14.3.2)it011NN1itit為了解決虛擬變量的完全多重多重共線性,我們可以直接估計模型:Y二p*D+卩*D+PX+u(14.3.3)it11NN1itit或Y=p+pD+卩D+pX+u(14.3.4)it022NN1itit此時,模型的誤差項是經(jīng)典誤差項u,所以,我們可以直接對(14.3.3)或(14.3.4)it進行OLS估計。讀者應(yīng)該可以

19、理解,(14.3.3)和(14.3.4)是等價的,盡管個體效應(yīng)的估計值不相等。實際上,鑒于個體效應(yīng)只是反映個體之間的差異性,其數(shù)值本身的大小是沒有經(jīng)濟意義的,我們所關(guān)心的只是數(shù)值的差異。最后,讓我們總結(jié)一下LSDV估計的基本思想:通過虛擬變量把誤差項中與解釋變量相關(guān)的個體效應(yīng)和時間效應(yīng)參數(shù)化,把個體效應(yīng)和時間效應(yīng)從誤差項中分離出來,使誤差項與解釋變量不相關(guān),以便進行OLS估計。這正是其被稱為最小二乘虛擬變量法的原因?;氐街袊r(nóng)民純收入的例子?;谥袊氖‰H面板數(shù)據(jù),對模型(14.1.3)進行LSDV估計,為簡便起見,我們在此僅考慮個體效應(yīng),其具體估計結(jié)果為:ln(PIC)=7.9488+0.4

20、1781ln(CSC)+0.0681RLT+0.0009RCI(14.3.5)ititititt統(tǒng)計值310.558235.08072.11780.6352p值0.00000.00000.03510.5258顯然。LSDV估計結(jié)果(14.3.5)不同于混合OLS估計結(jié)果(14.1.6),尤其是RCI.系it數(shù)的估計結(jié)果由顯著的負值變?yōu)椴伙@著的正值。估計結(jié)果的顯著不同本在我們的意料之中,因為混合OLS估計的實際上是受約束模型,即卩二九二0約束下模型。it面板數(shù)據(jù)模型入門講解細心的讀者可能已經(jīng)注意到,在(14.3.5)的估計結(jié)果中,我們沒有報告模型的判定系數(shù)R2。原因在于,對于考慮了個體效應(yīng)或時間

21、效應(yīng)的面板數(shù)據(jù)模型而言,R2不能反映解釋變量對被解釋變量變化的解釋能力。因為,此時的模型包含了個體效應(yīng)和時間效應(yīng)對被解釋變量變化的解釋,其判定系數(shù)也包含了個體效應(yīng)和時間效應(yīng)的貢獻,而不只是解釋變量的貢十卜獻。2.LSDV估計方法的直觀含義根據(jù)我們在第五章中對多元回歸方程估計思想的解釋,對模型(14.3.3)我們還有一種等價的估計方法。這種等價方法的步驟是:(1)分別估計方程:Y二九D+九D+(14.3.6)TOC o 1-5 h zit11NNitX=yD+yD+C(14.3.7)it11NNit得到殘差和C。itit(2)估計方程:八八E=卩匚+U(14.3.8)it1itit此時,(14.

22、3.8)對0的估計與(14.3.3)的LSDV估計是等價的。我們注意到,在步驟(1)中,對每一個個體i而言,只有D.=1,其他虛擬變量都i等于0既D=0。以i=1為例,回歸方程(14.3.6)可以寫成:s壬iY=X+g1t11t1T該方程的殘差就是被解釋變量的離差。所以,E=Y-Y,它是在第1個個體內(nèi)部1t1tT1tt=1求變量Y的離差。同樣的,C是在第1個個體內(nèi)部求變量X的離差。由此,我們發(fā)現(xiàn),(14.3.8)it實際上是變量Y的個體內(nèi)離差對變量X的個體內(nèi)離差進行回歸。所以,LSDV估計方法的直觀含義是,將被解釋變量和解釋變量在個體內(nèi)取離差,以被解釋變量的個體內(nèi)離差對解釋變量的個體內(nèi)離差進行

23、回歸,并進行OLS估計。在分析農(nóng)民純收入的例子,如果我們將所有變量ln(PIC)、ln(CSC)、RLT、RCIitititit面板數(shù)據(jù)模型入門講解的樣本數(shù)據(jù)都轉(zhuǎn)換為省內(nèi)離差的形式,那么,我們對模型直接進行OLS估計,其斜率系數(shù)的估計結(jié)果與(14.3.5)的結(jié)果是相同的。二、靜態(tài)面板數(shù)據(jù)模型的隨機效應(yīng)估計如果個體效應(yīng)卩和時間效應(yīng)九滿足隨機效應(yīng)假定,顯然此時模型的隨機誤差項與解itit釋變量不相關(guān),此時模型中參數(shù)的OLS估計量仍是無偏的。但是,由于個體效應(yīng)卩的存在,同一觀測個體的誤差項都包含不隨擠時間變化的卩,ii從而導致同一時間序列樣本數(shù)據(jù)存在自相關(guān)。同樣地,由于時間效應(yīng)九的存在,同一橫截t面

24、的誤差項都包含不隨個體變化的九,從而導致同一橫截面樣本數(shù)據(jù)存在自相關(guān)。我們知t道,此時盡管OLS估計量是無偏的,但卻不是最優(yōu)的,OLS估計量有較大的方差。顯然,隨機效應(yīng)面板數(shù)據(jù)模型的本質(zhì)問題是誤差項的自相關(guān)問題,其后果是OLS估計量有較大的方差。既然隨即效應(yīng)問題的本質(zhì)是自相關(guān),在自相關(guān)一章中,我們已經(jīng)知道,修正自相關(guān)的影響需要采用GLS估計。所以,對于隨機效應(yīng)的靜態(tài)面板數(shù)據(jù)模型,其線性無偏最優(yōu)的估計方法是廣義最小二乘估計法(GLS)。再次回到中國農(nóng)民純收入的例子?;谥袊氖‰H面板數(shù)據(jù),在僅考慮個體效應(yīng)的情況下,我們對模型(14.1.3)進行GLS估計,其具體估計結(jié)果為:ln(PIC)=7.9

25、436+0.41601ln(CSC)+0.0750RLT+0.0007RCI(14.3.9)ititititt統(tǒng)計值202.129735.31932.42890.4921p值0.00000.00000.01570.6230就本例而言,(14.3.9)和(14.3.5)的估計結(jié)果比較接近,但還是有些許差異既然固定效應(yīng)模型應(yīng)該使用LSDV估計,而隨機效應(yīng)模型應(yīng)該采取GLS估計,那么,當我們面對一個面板數(shù)據(jù)模型時,到底是用LSDV方法呢?還是選用GLS方法呢?一方面,我們可以基于固定效應(yīng)和隨機效應(yīng)的含義,結(jié)合回歸模型所要研究的經(jīng)濟問題,從問題的經(jīng)濟背景來進行判定。另一方面,我們可以根據(jù)樣本數(shù)據(jù),通過

26、具體的檢驗統(tǒng)計量來進行檢驗。三、豪斯曼檢驗要想固定效應(yīng)和隨機效應(yīng)作出判定,我們首先要明確兩種估計量在不同情形下的性質(zhì)如果模型中的個體效應(yīng)或時間效應(yīng)是固定效應(yīng),那么,LSDV估計量是無偏的估計量,面板數(shù)據(jù)模型入門講解 /19而GLS估計量則是有偏的。反之,如果模型中是隨機效應(yīng),那么,LSDV估計量和GLS估計量都是無偏的,但LSDV估計量有較大的方差。鑒于兩種估計量的上述特征,我們發(fā)現(xiàn),如果是隨機效應(yīng)模型,LSDV估計量和GLS估計量的估計結(jié)果就比較接近,反之,如果是固定效應(yīng)模型,兩種估計量的結(jié)果就有較大的差異。豪斯曼檢驗正是基于這種思想來檢驗隨機效應(yīng)和固定效應(yīng)的。豪斯曼檢驗的待檢驗假設(shè)為:原假

27、設(shè)(H0):隨機效應(yīng)備選假設(shè)(ha):固定效應(yīng)其檢驗統(tǒng)計量為:H=(PP)(一)-1(PP)(14.3.10)FRFREFR其中:0為回歸系數(shù)的LSDV估計向量,P為回歸系數(shù)GLS估計向量,弍為LSDV估FRF計系數(shù)的協(xié)方差矩陣估計量,乞為GLS估計系數(shù)的協(xié)方差矩陣估計量。R在原假設(shè)(隨機效應(yīng))為真時,豪斯曼檢驗統(tǒng)計量服從X2分布。即:HX2(K)(14.3.11)自由度K為模型中解釋變量(不包括截距項)的個數(shù)。還是回到中國農(nóng)民純收入的例子。在僅考慮個體效應(yīng)的情況下,我們對模型(14.1.3)進行豪斯曼檢驗,檢驗結(jié)果為:H=4.1777p值=0.2429。顯然,根據(jù)檢驗結(jié)果,我們無法拒絕隨機效

28、應(yīng)的原假設(shè)。所以,從豪斯曼檢驗結(jié)果來看,中國農(nóng)村居民收入模型中的個體效應(yīng)很可能是隨機效應(yīng)。14.4動態(tài)面板數(shù)據(jù)模型簡介如果面板數(shù)據(jù)模型的解釋變量中包含被解釋變量的滯后項,我們則稱其為動態(tài)面板模型。僅包含被解釋變量一階滯后時,動態(tài)面板模型的一般表述形式為:Y=0+0X+0X+pY+8。(14.4.1)it011itKKiti,t1it隨著滯后被解釋變量作為解釋變量出現(xiàn)在模型中,由于個體效應(yīng)的存在,模型解釋變量無法 /19面板數(shù)據(jù)模型入門講解滿足嚴格外生性的條件,從而導致LSDV估計和GLS估計都是有偏的。在14.1的消費函數(shù)例子中,考慮了預(yù)期因素的模型(14.1.4)就是一個典型的動態(tài)面板數(shù)據(jù)模

29、型。首先,我們暫不考慮外生的解釋變量和截距項,鑒于動態(tài)面板數(shù)據(jù)模型特有的估計問題僅與個體效應(yīng)有關(guān),為了使表述簡化清晰,在后面的分析中,我們將僅考慮個體效應(yīng),而不再考慮時間效應(yīng)。即模型(14.4.1)的誤差項被設(shè)定為:y二py+(14.4.2)TOC o 1-5 h ziti,t-1it=R+uitiit其中:u為經(jīng)典誤差項。E(r)=0,E(Ru)=0。itiiit一、動態(tài)面板數(shù)據(jù)模型的內(nèi)生性問題在動態(tài)面板數(shù)據(jù)模型中,無論個體效應(yīng)是固定效應(yīng)還是隨機效應(yīng),固定效應(yīng)的LSDV和隨機效應(yīng)的GLS估計都是有偏的并且非一致的其原因在于,動態(tài)面板數(shù)據(jù)模型存在固有的內(nèi)生性問題。GLS估計的有偏和非一致性對于

30、GLS估計,模型(1442)的內(nèi)生性問題是顯而易見的。因為解釋變量Y與誤i,t-1差項都包含個體效應(yīng)R。即使進行差分變換,AY=Y-Y與人=u-u,itii,t-1i,t-1i,t-2ititi,t-1都包含共同因素u,我們也還是無法消除解釋變量的內(nèi)生性問題。理解這一問題,需要i,t-1注意u是Y的構(gòu)成部分。i,t-1i,t-1LSDV估計的有偏和非一致性對于LSDV估計,模型(14.4.2)可以表示為:二卩DI+RDI+pY+u(14.4.3)it11NNi,t-1it它等價于模型:*二pY*+*(14.4.4)iti,t-1it其中,符號“*”表示變量的樣本數(shù)據(jù)相對于對本觀測個體時間序列均

31、值的離差。即:Y*二Y-丄為Yi,t-1i,t-1Ti,tt=1*=-丄為。ititTitt=1ChengHsiao,AnalysisofPanelData,北京大學出版社,2005,pp70-85.面板數(shù)據(jù)模型入門講解 /19顯然,Y*和*是相關(guān)的,二者都包含誤差J,在Y*中的權(quán)重是(11/T),i,t1iti,t1i,t1i,t1在J*中的權(quán)重是1/T。所以,LSDV估計方法也無法消除動態(tài)面板模型的內(nèi)生性問題。it由于動態(tài)面板模型固有的內(nèi)生性問題,一般而言,我們通常有三種方法估計動態(tài)面板數(shù)據(jù)模型:GMM方法、偏誤直接修正方法、變換的似然方法。目前應(yīng)用最多的估計方法則是GMM方法。二、動態(tài)面

32、板模型的廣義矩估計方法(GMM)對于一階自回歸的動態(tài)面板數(shù)據(jù)模型(14.4.2):y二py+(14.4.2)TOC o 1-5 h ziti,t1it=卩+uitiit其中:U為經(jīng)典誤差項。E(卩)二0,E(卩u)二0。我們已經(jīng)知道,動態(tài)面板模型的yitiiiti,t1和是相關(guān)的,而且LS估計(無論是LSDV還是GLS)都是有偏并且非一致的。如果要想得到p的一致估計量,我們需要為y尋找適當?shù)墓ぞ咦兞?。i,t1根據(jù)工具變量的選擇的兩個條件,我們要找的工具變量必須與不相關(guān),而與y相iti,t1關(guān)?;诮o定的樣本信息,我們所能夠找到的與y.高度相關(guān)的變量只有y.的滯后項。i,t1i,t1TOC o

33、1-5 h z但是,由于個體效應(yīng)的存在,y的滯后項即y、y、y也與相關(guān),它們不i,t1i1i2i,t2it能作為工具變量使用。為了能夠找到適當?shù)墓ぞ咦兞?,我們對模型?4.4.2)取一階差分:Ay二pAy+As。(14.4.5)iti,t1it顯然,y、y、y與As不相關(guān)。因為A二uu已經(jīng)剔除了個體效應(yīng)卩,i1i2i,t2itititi,t1i同時,對于u和u,一1,yi1、yi2都與佗不相關(guān),都可以作為模型、2都是前定變量。所以,yi1、yi2、yi,t214.4.5)中Ay的工具變量。i,t1如果我們只選擇y,t2作為Ay.的工具變量,由y.i,t1i,t2與Asit之間正交的約束條件14

34、.4.6)E(yAs)=0,i,t2it基于一個給定的樣本,我們通過求解丄XZyAeT=0(14.4.7)NTi,t2itit就可以得到P的估計量P。這就是我們前面所學過的工具變量估計量(IV估計量)。我們知道,工具變量不但要求與模型的誤差項不相關(guān),而且,要盡可能地反映原內(nèi)生解釋變量的信息。顯然,y很難反映Ay太多的信息,IV估計量會有較大的估計方差。i,t2i,t1所以,我們通常會選擇y、y、y作為模型(1445)中A的工具變量。i1i2i,t2i,t1我們把A的工具變量集定義為yt-2=(y,y,y),則其滿足如下的正交i,t1i1i2i,t2條件:E(yt-2Ae)=0。it(14.4.

35、8)基于上述正交條件,我們就可以建立P的廣義矩(GMM)估計量因為我們首先對模型進行了一階差分變換,所以,該估計量有時也被稱為差分GMM估計量。在此,我們簡要地介紹GMM估計的基本思想。先回頭看一下工具變量估計量,我們基于(1447)這一個約束方程估計一個參數(shù)P,所以,我們可以通過(1447)的求解計算出P。當我們?yōu)榻忉屪兞緼選取了多個工具變量時,(14.4.8)所表示的是多個約束方程,i,t1在此,我們并不具體地討論(14.4.8)的約束形式,但至少我們已經(jīng)注意到y(tǒng)t-2是一個向量。所以說,基于(1448)的估計,我們實際上就等于是基于多個方程估計一個參數(shù)P。這樣的情況被稱為過度識別。對總體

36、而言,(14.4.8)的所有約束方程都是成立的。g(P)三yt-2Ait被稱為總體矩,我們稱(14.4.8)為總體矩條件。針對一個給定的樣本,因為存在多個約束方程,我們通常不可能用一個估計值P保證所有的約束方程都成立。也就是說,E(yt-2A)所對應(yīng)的樣本矩通常不為0。我們只能選it擇一個P,使所有樣本矩盡可能地接近0。對每一個工具變量,或者說每一個總體矩條件,我們都可以計算出對應(yīng)的樣本矩的值。Arellano,M.andBond,S.R.,1991,SomeTestsofSpecificationforPanelData:MonteCarloEvidenceandanapplicationt

37、oemploymentequations,ReviewofEconomicStudies,58,277-297.所有樣本矩的值可以表示為一個向量g(p)。那么,我們的估計思想就很明確了,我們要基于一個樣本,尋找一個估計值p,使所有樣本矩盡可能接近0以滿足總體矩的約束條件。對應(yīng)于所有的矩約束條件而言,我們的目標就是:最小化所有樣本矩的平方和。即:minG=L(P)Wg(p)(14.4.9)p其中:函數(shù)G被稱為GMM目標函數(shù)。W是一個對稱、正定的加權(quán)矩陣。所以,GMM目標函數(shù)實際上是所有樣本矩的加權(quán)平方和。是否引入加權(quán)矩陣W并不影響GMM估計量的一致性。但會影響到有限樣本下的估計精度。其最優(yōu)的選擇

38、是使用總體矩協(xié)方差逆矩陣。-1=b(g(p)g(p)L的一致估計量。顯然,引入這樣的加權(quán)矩陣是為了修正樣本矩之間相關(guān)性和異方差的影響。簡而言之,GMM估計的基本思想就是:加權(quán)以后樣本矩的平方和最小化,即GMM目標函數(shù)G最小化。三、工具變量的選擇及其有效性的檢驗1.關(guān)于GMM工具變量選擇的兩點說明在為動態(tài)面板模型的GMM估計選擇工具變量時,我們需要在估計量的偏誤和方差之間進行權(quán)衡。隨著矩條件或者說工具變量個數(shù)的增多,估計量的方差減小而偏誤增大,反之,方差增大而偏誤減小,二者之間存在此消彼漲的權(quán)衡關(guān)系。所以,在GMM估計的實際應(yīng)用中,我們通常會選擇y、y作為Ay的工具變量,1st-2。也就是i,s

39、i,t-2i,t-1說,我們只選取相鄰較近的滯后變量作為工具變量,而不再用更早期的那些滯后項。(2)另一個需要說明的問題是,如果模型中包含了外生解釋變量,例如X,那么我it們所要分析的模型為:ypy+aX+8(14.4.10)其差分形式為:iti,t-1itit8卩+UitiitAyitpAy+aAX+A8i,t-1itit(14.4.11)此時,GMM工具變量如何選擇呢?Ay的工具變量選擇如前所述,外生變量AX.、Xi,t-1itit顯然都可以作為AX的工具變量。it2.工具變量有效性檢驗當我們?yōu)橐粋€解釋變量選擇了多個工具變量時,那么工具變量的個數(shù)就會超過待估參數(shù)的個數(shù),也就是說矩約束條件的

40、個數(shù)超過了待估參數(shù)的個數(shù),導致模型的過度識別。那么,過度識別的矩約束條件是否是有效的呢?也就是說,這些工具變量是否與誤差項不相關(guān),從而是否保證矩約束條件(1448)成立呢?對此,我們可以用J檢驗進行判定。實際上,J檢驗統(tǒng)計量就是根據(jù)參數(shù)估計值得到的GMM目標函數(shù)值。在原假設(shè)一一過度識別的矩條件是有效的”成立的情況下,J檢驗統(tǒng)計量的極限分布是X2分布。即:八八J=mg(卩)Wg(卩)X2(m-k),(14.4.12)a其中:m為工具變量或者矩條件個數(shù),,為待估計參數(shù)的個數(shù)。W為mxm的加權(quán)矩陣,g(0)為根據(jù)參數(shù)向量估計值Q得到的樣本矩的均值。對模型(14.4.11)而言,0=(Pa)。當J統(tǒng)計

41、值大于給定顯著性水平下的臨界值時,我們就傾向于拒絕過度識別的矩條件有效的原假設(shè)?;氐睫r(nóng)村居民收入的例子,考慮到一個地區(qū)農(nóng)村居民收入會表現(xiàn)出一定的動態(tài)慣性特征,我們有必要在模型(14.1.2)中引入被解釋變量的滯后項,即:14.4.13)log(PIC)=Ypylog(PIC)itl=1li,t-l+0log(CSC)+0RLT+0RCI+0+s1it2it3it0it其差分GMM估計的具體結(jié)果為:log(PIC)=0.4865log(PIC)+0.1472log(CSC)+0.1674RLT+0.0015RCI+0iti,t-lititit0(14.4.14)t值24.665613.90101

42、2.29352.0219p值0.00000.000000.00000.0443就這一估計結(jié)果來看,在中國農(nóng)村居民的收入分析中,動態(tài)影響是顯著的。顯然,無論在理論上還是就統(tǒng)計推斷而言,在模型(14.1.2)中引入動態(tài)效應(yīng)的分析都是恰當?shù)?。而且考慮到動態(tài)效應(yīng)的估計結(jié)果與靜態(tài)模型有顯著差異,尤其是投資主體結(jié)構(gòu)變量RCI.的系數(shù)it估計值變?yōu)榱孙@著的正值。 /19面板數(shù)據(jù)模型入門講解那么,本模型過度識別的矩約束條件是否是有效的呢?在本例中,解釋變量的工具變量集為(log(PIC)、log(PIC)、log(PIC),log(CSC),RLT,RCI),工i1i2i,t-2ititit具變量矩陣的秩(全

43、部工具變量個數(shù))為28。因為基于一階差分進行估計,沒有估計截距項和個體效應(yīng)的值,所以待估計參數(shù)個數(shù)為4。如果過度識別的矩約束條件是有效的,那么,模型的J檢驗統(tǒng)計量應(yīng)該服從自由度為28-4=24的X2分布。根據(jù)式(14.4.14)計算的J檢驗統(tǒng)計值為:J=25.2211,根據(jù)X2(24)分布計算的p值為0.3938。顯然,我們不能拒絕“過度識別的據(jù)約束條件有效”的原假設(shè)。也就是說,基于統(tǒng)計推斷,我們可以認為工具變量與誤差項不相關(guān),或者說所選擇的工具變量是有效的。四、例子:新凱恩斯混合Phillips曲線的估計讓我們重新回到第四章一開始所介紹的新凱恩斯混合Phillips曲線的例子?;诿姘鍞?shù)據(jù),

44、新凱恩斯混合Phillips曲線的回歸方程可以表述為:兀二a+丫兀+丫E兀+丫me+e(14.4.15)it0bi,t-1fti,t+1yitit其中:對第i個經(jīng)濟個體,兀表示第t期的通貨膨脹率,E兀是第t期對t+1期的通脹ittit+1率預(yù)期。me是廠商真實邊際成本相對于其最優(yōu)狀態(tài)的偏離程度,目前文獻通常選取勞動份t額指標作為真實邊際成本的替代變量。在此,我們使用19922007年中國大陸29個省市區(qū)(不包括海南、重慶)的統(tǒng)計數(shù)據(jù)對模型(14415)進行估計。其中:基于CPI計算通貨膨脹率,并使用第t+1的實際通脹率作為第t期的通脹率理性預(yù)期E兀。由于中國經(jīng)濟具有非常明顯的二元經(jīng)濟結(jié)構(gòu)特征,

45、在tt+1模型中可以同時選擇了第一產(chǎn)業(yè)和第二、三產(chǎn)業(yè)的勞動份額指標的自然對數(shù)(LLS1和LLS23)作為真實邊際成本的反映指標。基于差分GMM方法對模型(14415)進行估計,具體估計結(jié)果為:71=&+0.5562兀+0.5626E兀+2.3529LLS1+2.9418LLS2it0i,t-1ti,t+1itit14.4.16)上值=186.8387109.6812卩值=0.00000.000019.796012.82790.00000.0000面板數(shù)據(jù)模型入門講解僅就這一估計結(jié)果而言,在中國通貨膨脹的動態(tài)變化中,適應(yīng)性預(yù)期和理性預(yù)期共存二者的影響大致相當。經(jīng)濟的短期波動對通脹具有顯著影響。可

46、能有的讀者會問,為什么沒有兀的更高階滯后項出現(xiàn)在方程中呢?事實上,我們確it實可以將兀乃至更高的滯后項引入回歸方程,不過,對本樣本而言,當在模型中引入i,t-2兀.時,其系數(shù)估計值為負,所以,我們所需估計的模型應(yīng)該只包含兀.。i,t-2i,t-1根據(jù)估計結(jié)果,兀.和E兀的系數(shù)估計值分別為0.5562和0.5626,二者之和為1.1188。i,t1ti,t+1可能讀者會認為:中國的新凱恩斯混合Phillips曲線可能滿足凸組合假設(shè),即兀.和E兀i,t1ti,t+1之和為1。但是,F(xiàn)檢驗統(tǒng)計量的值為322.0894,相對于分布F(1,373),其p值為0.0000,所以,F(xiàn)檢驗的結(jié)果是:拒絕其滿足凸組合的原假設(shè)。在本例中,解釋變量的工具變量集為(兀、兀,E兀,LLS1,LLS23),i1i2i,t2tit+1itit工具變量矩陣的秩(全部工具變量個數(shù))為29。因為基于一階差分進行估計,沒有估計截距項和個體效應(yīng)的值,所以待估計參數(shù)個數(shù)為4。顯然,模型存在過多的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論