面板數(shù)據(jù)講義20091124_第1頁
面板數(shù)據(jù)講義20091124_第2頁
面板數(shù)據(jù)講義20091124_第3頁
面板數(shù)據(jù)講義20091124_第4頁
面板數(shù)據(jù)講義20091124_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、面板數(shù)據(jù)模型與應(yīng)用1面板數(shù)據(jù)定義panel data的中譯:面板數(shù)據(jù)、桌面數(shù)據(jù)、平行數(shù)據(jù)、縱列數(shù)據(jù)、時(shí)間序列截面數(shù)據(jù)、混合數(shù)據(jù)(pool data)、固定調(diào)查對象數(shù)據(jù)。面板數(shù)據(jù)定義(1)面板數(shù)據(jù)定義為相同截面上的個(gè)體在不同時(shí)點(diǎn)的重復(fù)觀測數(shù)據(jù)。(2)稱為縱向(longitudinal)變量序列(個(gè)體)的多次測量。面板數(shù)據(jù)從橫截面(cross section)看,是由若干個(gè)體(entity, unit, individual)在某一時(shí)點(diǎn)構(gòu)成的截面觀測值,從縱剖面(longitudinal section)看每個(gè)個(gè)體都是一個(gè)時(shí)間序列。圖1 N=7,T=50的面板數(shù)據(jù)示意圖面板數(shù)據(jù)用雙下標(biāo)變量表示。例

2、如yi t, i = 1, 2, , N; t = 1, 2, , Ti對應(yīng)面板數(shù)據(jù)中不同個(gè)體。N表示面板數(shù)據(jù)中含有N個(gè)個(gè)體。t對應(yīng)面板數(shù)據(jù)中不同時(shí)點(diǎn)。T表示時(shí)間序列的最大長度。若固定t不變,yi ., ( i = 1, 2, , N)是橫截面上的N個(gè)隨機(jī)變量;若固定i不變,y. t, (t = 1, 2, , T)是縱剖面上的一個(gè)時(shí)間序列(個(gè)體)。例1:1996-2002年中國東北、華北、華東15個(gè)省級地區(qū)的居民家庭固定價(jià)格的人均消費(fèi)(CP)和人均收入(IP)數(shù)據(jù)見5panel02.wf1。數(shù)據(jù)是7年的,每一年都有15個(gè)數(shù)據(jù),共105組(個(gè))觀測值。人均消費(fèi)和收入兩個(gè)面板數(shù)據(jù)都是平衡(bal

3、ance)面板數(shù)據(jù),各有15個(gè)時(shí)間序列數(shù)據(jù)。人均消費(fèi)和收入的面板數(shù)據(jù)從縱剖面觀察分別見圖2和圖3。從橫截面觀察分別見圖4和圖5。橫截面數(shù)據(jù)散點(diǎn)圖的表現(xiàn)與觀測值順序有關(guān)。圖4和圖5中人均消費(fèi)和收入觀測值順序是按地區(qū)名的漢語拼音字母順序排序的。 圖2 15個(gè)省級地區(qū)的人均消費(fèi)序列(縱剖面) 圖3 15個(gè)省級地區(qū)的人均收入序列(5panel02)圖4 7個(gè)時(shí)點(diǎn)人均消費(fèi)橫截面數(shù)據(jù)(含15個(gè)地區(qū)) 圖5 7個(gè)時(shí)點(diǎn)人均收入橫截面數(shù)據(jù)(含15個(gè)地區(qū))(每條連線數(shù)據(jù)表示同一年度15個(gè)地區(qū)的消費(fèi)值) (每條連線數(shù)據(jù)表示同一年度15個(gè)地區(qū)的收入值)用CP表示消費(fèi),IP表示收入。AH, BJ, FJ, HB, HL

4、J, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分別表示安徽省、北京市、福建省、河北省、黑龍江省、吉林省、江蘇省、江西省、遼寧省、內(nèi)蒙古自治區(qū)、山東省、上海市、山西省、天津市、浙江省。圖6 人均消費(fèi)對收入的面板數(shù)據(jù)散點(diǎn)圖(15個(gè)時(shí)間序列疊加)圖7 人均消費(fèi)對收入的面板數(shù)據(jù)散點(diǎn)圖(7個(gè)截面疊加) 圖8 北京和內(nèi)蒙古1996-2002年消費(fèi)對收入散點(diǎn)圖 圖9 1996和2002年15個(gè)地區(qū)的消費(fèi)對收入散點(diǎn)圖2面板數(shù)據(jù)模型分類用面板數(shù)據(jù)建立的模型通常有3種,即混合回歸模型、固定效應(yīng)回歸模型和隨機(jī)效應(yīng)回歸模型。2.1 混合回歸模型(Pooled model)。如果一

5、個(gè)面板數(shù)據(jù)模型定義為, yit = a + Xit 'b +eit, i = 1, 2, , N; t = 1, 2, , T (1)其中yit為被回歸變量(標(biāo)量),a表示截距項(xiàng),Xit為k ´1階回歸變量列向量(包括k個(gè)回歸量),b為k ´1階回歸系數(shù)列向量,eit為誤差項(xiàng)(標(biāo)量)。則稱此模型為混合回歸模型。混合回歸模型的特點(diǎn)是無論對任何個(gè)體和截面,回歸系數(shù)a和b都相同。如果模型是正確設(shè)定的,解釋變量與誤差項(xiàng)不相關(guān),即Cov(Xit,eit) = 0。那么無論是N®¥,還是T®¥,模型參數(shù)的混合最小二乘估計(jì)量(Pooled

6、OLS)都是一致估計(jì)量。2.2 固定效應(yīng)回歸模型(fixed effects regression model)。固定效應(yīng)模型分為3種類型,即個(gè)體固定效應(yīng)回歸模型、時(shí)點(diǎn)固定效應(yīng)回歸模型和個(gè)體時(shí)點(diǎn)雙固定效應(yīng)回歸模型。下面分別介紹。2.2.1個(gè)體固定效應(yīng)回歸模型(entity fixed effects regression model)如果一個(gè)面板數(shù)據(jù)模型定義為, yit = ai + Xit 'b +eit, i = 1, 2, , N; t = 1, 2, , T (2)其中ai是隨機(jī)變量,表示對于i個(gè)個(gè)體有i個(gè)不同的截距項(xiàng),且其變化與Xit有關(guān)系;yit為被回歸變量(標(biāo)量),eit

7、為誤差項(xiàng)(標(biāo)量),Xit為k ´1階回歸變量列向量(包括k個(gè)回歸量),b為k ´1階回歸系數(shù)列向量,對于不同個(gè)體回歸系數(shù)相同,則稱此模型為個(gè)體固定效應(yīng)回歸模型。ai作為隨機(jī)變量描述不同個(gè)體建立的模型間的差異。因?yàn)閍i是不可觀測的,且與可觀測的解釋變量Xit的變化相聯(lián)系,所以稱(2)式為個(gè)體固定效應(yīng)回歸模型。個(gè)體固定效應(yīng)回歸模型也可以表示為 yit = a1 + a2 D2 + +aN DN + Xit 'b +eit, t = 1, 2, , T (3)其中Di =設(shè)定個(gè)體固定效應(yīng)回歸模型的原因如下。假定有面板數(shù)據(jù)模型 yit = b0 + b1 xit +b2 z

8、i +eit, i = 1, 2, , N; t = 1, 2, , T (4)其中b0為常數(shù),不隨時(shí)間、截面變化;zi表示隨個(gè)體變化,但不隨時(shí)間變化的難以觀測的變量。上述模型可以被解釋為含有N個(gè)截距,即每個(gè)個(gè)體都對應(yīng)一個(gè)不同截距的模型。令ai = b0 +b2 zi,于是(4)式變?yōu)?yit = ai + b1 xit +eit, i = 1, 2, , N; t = 1, 2, , T (5)這正是個(gè)體固定效應(yīng)回歸模型形式。對于每個(gè)個(gè)體回歸函數(shù)的斜率相同(都是b1),截距ai卻因個(gè)體不同而變化??梢妭€(gè)體固定效應(yīng)回歸模型中的截距項(xiàng)ai中包括了那些隨個(gè)體變化,但不隨時(shí)間變化的難以觀測的變量的影

9、響。ai是一個(gè)隨機(jī)變量。以案例1為例,省家庭平均人口數(shù)就是這樣的一個(gè)變量。對于短期面板來說,這是一個(gè)基本不隨時(shí)間變化的量,但是對于不同的省份,這個(gè)變量的值是不同的。以案例1為例(file:panel02)得到的個(gè)體固定效應(yīng)模型估計(jì)結(jié)果如下:注意:個(gè)體固定效應(yīng)模型的EViwes輸出結(jié)果中沒有公共截距項(xiàng)。圖10 個(gè)體固定效應(yīng)回歸模型的估計(jì)結(jié)果2.2.2 時(shí)點(diǎn)固定效應(yīng)回歸模型(time fixed effects regression model)如果一個(gè)面板數(shù)據(jù)模型定義為, yit = gt + Xit 'b +eit, i = 1, 2, , N (6)其中g(shù)t是模型截距項(xiàng),隨機(jī)變量,表

10、示對于T個(gè)截面有T個(gè)不同的截距項(xiàng),且其變化與Xit有關(guān)系;yit為被回歸變量(標(biāo)量),eit為誤差項(xiàng)(標(biāo)量),滿足通常假定條件。Xit為k ´1階回歸變量列向量(包括k個(gè)回歸變量),b為k ´1階回歸系數(shù)列向量,則稱此模型為時(shí)點(diǎn)固定效應(yīng)回歸模型。時(shí)點(diǎn)固定效應(yīng)回歸模型也可以加入虛擬變量表示為 yit = g1 + g2 W2 + +g T WT + Xit 'b +eit, i = 1, 2, , N; t = 1, 2, , T (7)其中Wt =設(shè)定時(shí)點(diǎn)固定效應(yīng)回歸模型的原因。假定有面板數(shù)據(jù)模型 yit = b0 + b1 xit +b2 zt +eit, i =

11、 1, 2, , N; t = 1, 2, , T (8)其中b0為常數(shù),不隨時(shí)間、截面變化;zt表示隨不同截面(時(shí)點(diǎn))變化,但不隨個(gè)體變化的難以觀測的變量。上述模型可以被解釋為含有T個(gè)截距,即每個(gè)截面都對應(yīng)一個(gè)不同截距的模型。令gt = b0 +b2 zt,于是(8)式變?yōu)?yit = gt + b1 xit +eit, i = 1, 2, , N; t = 1, 2, , T (9)這正是時(shí)點(diǎn)固定效應(yīng)回歸模型形式。對于每個(gè)截面,回歸函數(shù)的斜率相同(都是b1),gt卻因截面(時(shí)點(diǎn))不同而異??梢姇r(shí)點(diǎn)固定效應(yīng)回歸模型中的截距項(xiàng)gt包括了那些隨不同截面(時(shí)點(diǎn))變化,但不隨個(gè)體變化的難以觀測的變量

12、的影響。gt是一個(gè)隨機(jī)變量。以案例1為例,“全國零售物價(jià)指數(shù)”就是這樣的一個(gè)變量。對于不同時(shí)點(diǎn),這是一個(gè)變化的量,但是對于不同省份(個(gè)體),這是一個(gè)不變化的量。圖112.2.3 個(gè)體時(shí)點(diǎn)雙固定效應(yīng)回歸模型(time and entity fixed effects regression model)如果一個(gè)面板數(shù)據(jù)模型定義為, yit = ai +gt + Xit 'b +eit, i = 1, 2, , N; t = 1, 2, , T (11)其中yit為被回歸變量(標(biāo)量);ai是隨機(jī)變量,表示對于N個(gè)個(gè)體有N個(gè)不同的截距項(xiàng),且其變化與Xit有關(guān)系;gt是隨機(jī)變量,表示對于T個(gè)截面

13、(時(shí)點(diǎn))有T個(gè)不同的截距項(xiàng),且其變化與Xit有關(guān)系;Xit為k ´1階回歸變量列向量(包括k個(gè)回歸量);b為k ´1階回歸系數(shù)列向量;eit為誤差項(xiàng)(標(biāo)量)滿足通常假定(eit êXit, ai, gt) = 0;則稱此模型為個(gè)體時(shí)點(diǎn)固定效應(yīng)回歸模型。個(gè)體時(shí)點(diǎn)固定效應(yīng)回歸模型還可以表示為, yit = a1+a2 D2 +aN DN +g2 W2 +g T WT + Xit 'b +eit, t = 1, 2, , (12)其中 Di = (13)Wt = (14)如果模型形式是正確設(shè)定的,并且滿足模型通常的假定條件,對模型(12)進(jìn)行混合OLS估計(jì),全部

14、參數(shù)估計(jì)量都是不一致的。正如個(gè)體固定效應(yīng)回歸模型可以得到一致的、甚至有效的估計(jì)量一樣,一些計(jì)算方法也可以使個(gè)體時(shí)點(diǎn)雙固定效應(yīng)回歸模型得到更有效的參數(shù)估計(jì)量。以例1為例得到的截面、時(shí)點(diǎn)固定效應(yīng)模型估計(jì)結(jié)果如下:圖12回歸系數(shù)為0.67,這與個(gè)體固定效應(yīng)回歸模型給出的估計(jì)結(jié)果0.70基本一致。在上述三種固定效應(yīng)回歸模型中,個(gè)體固定效應(yīng)回歸模型最為常用。2.3 隨機(jī)效應(yīng)模型對于面板數(shù)據(jù)模型 yit = ai + Xit'b +eit, i = 1, 2, , N; t = 1, 2, , T (15)如果ai為隨機(jī)變量,其分布與Xit無關(guān);yit為被回歸變量(標(biāo)量),eit為誤差項(xiàng)(標(biāo)量),

15、Xit為k ´1階回歸變量列向量(包括k個(gè)回歸量),b為k ´1階回歸系數(shù)列向量,對于不同個(gè)體回歸系數(shù)相同,這種模型稱為個(gè)體隨機(jī)效應(yīng)回歸模型(隨機(jī)截距模型、隨機(jī)分量模型)。其假定條件是ai iid(a, sa2), eit iid(0, se2)都被假定為獨(dú)立同分布,但并未限定何種分布。 同理也可定義時(shí)點(diǎn)隨機(jī)效應(yīng)回歸模型和個(gè)體時(shí)點(diǎn)隨機(jī)效應(yīng)回歸模型,但個(gè)體隨機(jī)效應(yīng)回歸模型最為常用。個(gè)體隨機(jī)效應(yīng)模型又稱為等相關(guān)模型(Equicorrelated model)。原因如下。隨機(jī)效應(yīng)模型可以看作是混合模型的特例。對于個(gè)體隨機(jī)效應(yīng)回歸模型yit = ai + Xit 'b +e

16、it,可以把a(bǔ)i并入誤差項(xiàng)eit。模型改寫為yit = Xit 'b + (ai +eit) = Xit 'b + uit (16)其中uit = (ai +eit)。如果有ai(a, sa2),eit (0, se2)成立,那么,Cov(uit,uis) = Cov(ai +eit)( ai +eis) = (17)因?yàn)閷τ趖 ¹ s,有r(uit,uis) = = (18)相關(guān)系數(shù)r(uit,uis)與 (t s) 即相隔期數(shù)長短無關(guān)。所以個(gè)體隨機(jī)效應(yīng)模型也稱作等相關(guān)模型,或者可交換誤差模型(exchangeable model)。對于個(gè)體隨機(jī)效應(yīng)模型,E(ai

17、êXit) = a,則有,E(yit êxit) = a + Xit'b,對yit可以識(shí)別。所以隨機(jī)效應(yīng)模型參數(shù)的混合OLS估計(jì)量具有一致性,但不具有有效性。注意:“固定效應(yīng)模型”這個(gè)術(shù)語用得并不十分恰當(dāng),容易產(chǎn)生誤解。其實(shí)固定效應(yīng)模型應(yīng)該稱之為“相關(guān)效應(yīng)模型”,而隨機(jī)效應(yīng)模型應(yīng)該稱之為“非相關(guān)效應(yīng)模型”。因?yàn)楣潭ㄐ?yīng)模型和隨機(jī)效應(yīng)模型中的ai都是隨機(jī)變量。3面板數(shù)據(jù)模型估計(jì)方法面板數(shù)據(jù)模型中b的估計(jì)量既不同于截面數(shù)據(jù)估計(jì)量,也不同于時(shí)間序列估計(jì)量,其性質(zhì)隨設(shè)定固定效應(yīng)模型是否正確而變化。3.1 混合最小二乘(Pooled OLS)估計(jì)混合OLS估計(jì)方法是在時(shí)間上和

18、截面上把NT個(gè)觀測值混合在一起,然后用OLS法估計(jì)模型參數(shù)。給定混合模型 yit = a + Xit 'b +eit, i = 1, 2, , N; t = 1, 2, , T (19)如果模型是正確設(shè)定的,且解釋變量與誤差項(xiàng)不相關(guān),即Cov(Xit,eit) = 0。那么無論是N®¥,還是T®¥,模型參數(shù)的混合最小二乘估計(jì)量都具有一致性。對混合模型通常采用的是混合最小二乘(Pooled OLS)估計(jì)法。然而,在誤差項(xiàng)服從獨(dú)立同分布條件下由OLS法得到的方差協(xié)方差矩陣,在這里通常不會(huì)成立。因?yàn)閷τ诿總€(gè)個(gè)體i及其誤差項(xiàng)來說通常是序列相關(guān)的。NT個(gè)相

19、關(guān)觀測值要比NT個(gè)相互獨(dú)立的觀測值包含的信息少。從而導(dǎo)致誤差項(xiàng)的標(biāo)準(zhǔn)差常常被低估,估計(jì)量的精度被虛假夸大。如果模型存在個(gè)體固定效應(yīng),即ai與Xit相關(guān),那么對模型應(yīng)用混合OLS估計(jì)方法,估計(jì)量不再具有一致性。解釋如下:假定模型實(shí)為個(gè)體固定效應(yīng)模型yit = ai + Xit 'b +eit,但卻當(dāng)作混合模型來估計(jì)參數(shù),則模型可寫為yit = a + Xit 'b + (ai -a +eit) = a + Xit 'b + uit (20)其中uit = (ai -a +eit)。因?yàn)閍i與Xit相關(guān),也即uit與Xit相關(guān),所以個(gè)體固定效應(yīng)模型的參數(shù)若采用混合OLS估計(jì)

20、,估計(jì)量不具有一致性。3.2平均(between)OLS估計(jì) 平均OLS估計(jì)法的步驟是首先對面板數(shù)據(jù)中的每個(gè)個(gè)體求平均數(shù),共得到N個(gè)平均數(shù)(估計(jì)值)。然后利用yit和Xit的N組觀測值估計(jì)參數(shù)。以個(gè)體固定效應(yīng)回歸模型yit = ai + Xit 'b +eit (21)為例,首先對面板中的每個(gè)個(gè)體求平均數(shù),從而建立模型= ai +'b +, i = 1, 2, , N (22)其中=,=,=,i = 1, 2, , N。變換上式得= a +'b +(a i - a +), i = 1, 2, , N (23)上式稱作平均模型。對上式應(yīng)用OLS估計(jì),則參數(shù)估計(jì)量稱作平均O

21、LS估計(jì)量。此條件下的樣本容量為N,(T=1)。 如果與(a i - a +)相互獨(dú)立,a和b的平均OLS估計(jì)量是一致估計(jì)量。平均OLS估計(jì)法適用于短期面板的混合模型和個(gè)體隨機(jī)效應(yīng)模型。對于個(gè)體固定效應(yīng)模型來說,由于ai和Xit相關(guān),也即ai和相關(guān),所以,回歸參數(shù)的平均OLS估計(jì)量是非一致估計(jì)量。3.3 離差(within)OLS估計(jì) 對于短期面板數(shù)據(jù),離差OLS估計(jì)法的原理是先把面板數(shù)據(jù)中每個(gè)個(gè)體的觀測值變換為對其平均數(shù)的離差觀測值,然后利用離差數(shù)據(jù)估計(jì)模型參數(shù)。具體步驟是,對于個(gè)體固定效應(yīng)回歸模型yit = ai + Xit'b +eit (24)中的每個(gè)個(gè)體計(jì)算平均數(shù),可得到如下

22、模型,= ai +'b +其中、的定義見(22)式。上兩式相減,消去了ai,得yit -= (Xit -)'b + (eit -)此模型稱作離差數(shù)據(jù)模型。對上式應(yīng)用OLS估計(jì),所得b的估計(jì)量稱作離差OLS估計(jì)量。對于個(gè)體固定效應(yīng)回歸模型,b的離差OLS估計(jì)量是一致估計(jì)量。如果eit還滿足獨(dú)立同分布條件,b的離差OLS估計(jì)量不但具有一致性而且還具有有效性。如果對固定效應(yīng)ai感興趣,也可按下式估計(jì)。=-' (27)個(gè)體固定效應(yīng)回歸模型的估計(jì)通常采用的就是離差(within)OLS估計(jì)法。在短期面板條件下,即便ai的分布、以及ai和Xit的關(guān)系都已知到,ai的估計(jì)量仍不具有一

23、致性。當(dāng)個(gè)體數(shù)N不大時(shí),可采用OLS虛擬變量估計(jì)法估計(jì)ai和b。離差OLS估計(jì)法的主要缺點(diǎn)是不能估計(jì)非時(shí)變回歸變量構(gòu)成的面板數(shù)據(jù)模型。比如Xit = Xi(非時(shí)變變量),那么有= Xi,計(jì)算離差時(shí)有Xi -= 0。3.4 一階差分(first difference)OLS估計(jì) 在短期面板條件下,一階差分OLS估計(jì)就是對個(gè)體固定效應(yīng)模型中的回歸量與被回歸量的差分變量構(gòu)成的模型的參數(shù)進(jìn)行OLS估計(jì)。具體步驟是,對個(gè)體固定效應(yīng)回歸模型yit = ai + Xit 'b +eit取其滯后一期關(guān)系式y(tǒng)it-1 = ai + Xit-1'b +eit-1上兩式相減,得一階差分模型(ai被消

24、去)yit -yit-1 = (Xit - Xit -1) 'b + (eit -eit-1) , i = 1, 2, , N; t = 1, 2, , T對上式應(yīng)用OLS估計(jì)得到的b的估計(jì)量稱作一階差分OLS估計(jì)量。盡管ai不能被估計(jì),b的估計(jì)量是一致估計(jì)量。 在T>2,eit獨(dú)立同分布條件下得到的b的一階差分OLS估計(jì)量不如離差OLS估計(jì)量有效。3.5 隨機(jī)效應(yīng)(random effects)估計(jì)法(可行GLS(feasible GLS)估計(jì)法)有個(gè)體固定效應(yīng)模型yit = ai + Xit 'b +eiai,eit服從獨(dú)立同分布。對其作如下變換yit -= (1-)

25、m + (Xit -)'b + vit (29)其中vit = (1-)ai + (eit -)漸近服從獨(dú)立同分布,l = 1-,應(yīng)用OLS估計(jì),則所得估計(jì)量稱為隨機(jī)效應(yīng)估計(jì)量或可行GLS估計(jì)量。當(dāng)= 0時(shí),(29)式等同于混合OLS估計(jì);當(dāng)=1時(shí),(29)式等同于離差OLS估計(jì)。 對于隨機(jī)效應(yīng)模型,可行GLS估計(jì)量不但是一致估計(jì)量,而且是有效估計(jì)量,但對于個(gè)體固定效應(yīng)模型,可行GLS估計(jì)量不是一致估計(jì)量。面板數(shù)據(jù)模型估計(jì)量的穩(wěn)健統(tǒng)計(jì)推斷。在實(shí)際的經(jīng)濟(jì)面板數(shù)據(jù)中,N個(gè)個(gè)體之間相互獨(dú)立的假定通常是成立的,但是每個(gè)個(gè)體本身卻常常是序列自相關(guān)的,且存在異方差。為了得到正確的統(tǒng)計(jì)推斷,需要克服

26、這兩個(gè)因素。對于第i個(gè)個(gè)體,當(dāng)N®¥,Xi×的方差協(xié)方差矩陣仍然是T´T有限階的,所以可以用以前的方法克服異方差。采用GMM方法還可以得到更有效的估計(jì)量。EViwes中對隨機(jī)效應(yīng)回歸模型的估計(jì)采用的就是可行(feasible )GLS估計(jì)法。4面板數(shù)據(jù)模型設(shè)定檢驗(yàn)方法4.1 F檢驗(yàn)先介紹原理。F統(tǒng)計(jì)量定義為 其中SSEr 表示施加約束條件后估計(jì)模型的殘差平方和,SSEu 表示未施加約束條件的估計(jì)模型的殘差平方和,m表示約束條件個(gè)數(shù),T 表示樣本容量,k表示未加約束的模型中被估參數(shù)的個(gè)數(shù)。在原假設(shè)“約束條件真實(shí)”條件下,F(xiàn)統(tǒng)計(jì)量漸近服從自由度為( m ,

27、T k )的F分布。以檢驗(yàn)個(gè)體固定效應(yīng)回歸模型為例,介紹F檢驗(yàn)的應(yīng)用。建立假設(shè)H0:ai =a。模型中不同個(gè)體的截距相同(真實(shí)模型為混合回歸模型)。H1:模型中不同個(gè)體的截距項(xiàng)ai不同(真實(shí)模型為個(gè)體固定效應(yīng)回歸模型)。F統(tǒng)計(jì)量定義為:F= (31)其中SSEr表示約束模型,即混合估計(jì)模型的殘差平方和,SSEu表示非約束模型,即個(gè)體固定效應(yīng)回歸模型的殘差平方和。非約束模型比約束模型多了N-1個(gè)被估參數(shù)。以案例1為例,已知SSEr= 4824588,SSEu= 2270386,F(xiàn)= = 8.1 (32)F0.05(6, 87) = 1.8因?yàn)镕= 8.1 > F0.05(14, 89) =

28、 1.8,推翻原假設(shè),比較上述兩種模型,建立個(gè)體固定效應(yīng)回歸模型更合理。4.2 Hausman檢驗(yàn)對同一參數(shù)的兩個(gè)估計(jì)量差異的顯著性檢驗(yàn)稱作Hausman檢驗(yàn),簡稱H檢驗(yàn)。H檢驗(yàn)由Hausman1978年提出,是在Durbin(1914)和Wu(1973)基礎(chǔ)上發(fā)展起來的。所以H檢驗(yàn)也稱作Wu-Hausman檢驗(yàn),和Durbin-Wu-Hausman檢驗(yàn)。先介紹Hausman檢驗(yàn)原理例如在檢驗(yàn)單一方程中某個(gè)回歸變量(解釋變量)的內(nèi)生性問題時(shí)得到相應(yīng)回歸參數(shù)的兩個(gè)估計(jì)量,一個(gè)是OLS估計(jì)量、一個(gè)是2SLS估計(jì)量。其中2SLS估計(jì)量用來克服回歸變量可能存在的內(nèi)生性。如果模型的解釋變量中不存在內(nèi)生性

29、變量,那么OLS估計(jì)量和2SLS估計(jì)量都具有一致性,都有相同的概率極限分布。如果模型的解釋變量中存在內(nèi)生性變量,那么回歸參數(shù)的OLS估計(jì)量是不一致的而2SLS估計(jì)量仍具有一致性,兩個(gè)估計(jì)量將有不同的概率極限分布。更一般地,假定得到q個(gè)回歸系數(shù)的兩組估計(jì)量和,則H檢驗(yàn)的零假設(shè)和被擇假設(shè)是:H0: plim(-) = 0H1: plim(-) ¹ 0假定兩個(gè)估計(jì)量的差作為統(tǒng)計(jì)量也具有一致性,在H0成立條件下, (-) N(0, VH)其中VH是(-)的極限分布方差矩陣。則H檢驗(yàn)統(tǒng)計(jì)量定義為H = (-)' (N-1)-1 (-) ® c2(q) (33)其中(N-1)是

30、(-)的估計(jì)的方差協(xié)方差矩陣。在H0成立條件下,H統(tǒng)計(jì)量漸近服從c2(q)分布。其中q表示零假設(shè)中約束條件個(gè)數(shù)。H檢驗(yàn)原理很簡單,但實(shí)際中VH的一致估計(jì)量并不容易。一般來說,N-1= Var(-) = Var()+Var()-2Cov(,) (34)Var(),Var()在一般軟件計(jì)算中都能給出。但Cov(,)不能給出。致使H統(tǒng)計(jì)量(33)在實(shí)際中無法使用。實(shí)際中也常進(jìn)行如下檢驗(yàn)。H0:模型中所有解釋變量都是外生的。H1:其中某些解釋變量都是內(nèi)生的。在原假設(shè)成立條件下, H = (-)' (-)-1 (-)c2(k) (36)其中和分別是對Var()和Var()的估計(jì)。與(34)式比較

31、,這個(gè)結(jié)果只要求計(jì)算Var()和Var(),H統(tǒng)計(jì)量(36)具有實(shí)用性。當(dāng)q表示一個(gè)標(biāo)量時(shí),H統(tǒng)計(jì)量(36)退化為, H = c2(1)其中和分別表示和的樣本方差值。H檢驗(yàn)用途很廣??捎脕碜瞿P蛠G失變量的檢驗(yàn)、變量內(nèi)生性檢驗(yàn)、模型形式設(shè)定檢驗(yàn)、模型嵌套檢驗(yàn)、建模順序檢驗(yàn)等。下面詳細(xì)介紹面板數(shù)據(jù)中利用H統(tǒng)計(jì)量進(jìn)行模型形式設(shè)定的檢驗(yàn)。假定面板模型的誤差項(xiàng)滿足通常的假定條件,如果真實(shí)的模型是隨機(jī)效應(yīng)回歸模型,那么b的離差OLS估計(jì)量和隨機(jī)GLS法估計(jì)量都具有一致性。如果真實(shí)的模型是個(gè)體固定效應(yīng)回歸模型,則參數(shù)b的離差OLS法估計(jì)量是一致估計(jì)量,但隨機(jī)GLS估計(jì)量是非一致估計(jì)量??梢酝ㄟ^H統(tǒng)計(jì)量檢驗(yàn)(

32、-)的非零顯著性,檢驗(yàn)面板數(shù)據(jù)模型中是否存在個(gè)體固定效應(yīng)。原假設(shè)與備擇假設(shè)是H0: 個(gè)體效應(yīng)與回歸變量無關(guān)(個(gè)體隨機(jī)效應(yīng)回歸模型)H1: 個(gè)體效應(yīng)與回歸變量相關(guān)(個(gè)體固定效應(yīng)回歸模型)例:=0.7747,s() = 0.00868(計(jì)算結(jié)果對應(yīng)圖15);=0.7246,s() = 0.0106(計(jì)算結(jié)果取自EViwes個(gè)體固定效應(yīng)估計(jì)結(jié)果) H = = = 68.4因?yàn)镠 =68.4 > c20.05 (1) = 3.8,所以模型存在個(gè)體固定效應(yīng)。應(yīng)該建立個(gè)體固定效應(yīng)回歸模型。5面板數(shù)據(jù)建模案例分析 圖13 混合估計(jì)散點(diǎn)圖 圖14 平均估計(jì)散點(diǎn)圖以案例1為例,圖13是混合估計(jì)對應(yīng)數(shù)據(jù)的散

33、點(diǎn)圖?;貧w結(jié)果如下CP = 129.63 + 0.76 IP(2.0) (79.7)圖14是平均值數(shù)據(jù)散點(diǎn)圖。先對數(shù)據(jù)按個(gè)體求平均數(shù)和。然后用15組平均值數(shù)據(jù)回歸,= -40.88+0.79(-0.3) (41.1) 圖15 離差估計(jì)散點(diǎn)圖 圖16 差分估計(jì)散點(diǎn)圖圖15是離差數(shù)據(jù)散點(diǎn)圖。先計(jì)算CP、IP分別對、的離差數(shù)據(jù),然后用離差數(shù)據(jù)計(jì)算OLS回歸。CPM = 0.77 IPM (90)圖16是一階差分?jǐn)?shù)據(jù)散點(diǎn)圖。先對CP、IP各個(gè)體作一階差分,然后用一階差分?jǐn)?shù)據(jù)回歸。DCP = 0.71 DIP(24)案例2(file:5panel01a)美國公路交通事故死亡人數(shù)與啤酒稅的關(guān)系研究見Sto

34、ck J H and M W Watson, Introduction to Econometrics, Addison Wesley, 2003第8章。美國每年有4萬高速公路交通事故,約1/3涉及酒后駕車。這個(gè)比率在飲酒高峰期會(huì)上升。早晨13點(diǎn)25%的司機(jī)飲酒。飲酒司機(jī)出交通事故數(shù)是不飲酒司機(jī)的13倍。現(xiàn)有19821988年48個(gè)州共336組美國公路交通事故死亡人數(shù)(number)與啤酒稅(beertax)的數(shù)據(jù)。 圖17 1982年數(shù)據(jù)散點(diǎn)圖(File: 5panel01a-graph01) 圖18 1988年數(shù)據(jù)散點(diǎn)圖(File:5panel01a- graph07)1982年數(shù)據(jù)的估計(jì)

35、結(jié)果(散點(diǎn)圖見圖17)1982 = 2.01 + 0.15 beertax1982 (0.15) (0.13)1988年數(shù)據(jù)的估計(jì)結(jié)果(散點(diǎn)圖見圖18)1988 = 1.86 + 0.44 beertax1988 (0.11) (0.13)圖19 混合估計(jì)共336個(gè)觀測值。估計(jì)結(jié)果仍不可靠。(file: 5panel01b)19821988年混合數(shù)據(jù)估計(jì)結(jié)果(散點(diǎn)圖見圖19)19821988 = 1.85 + 0.36 beertax19821988 (42.5) (5.9) SSE=98.75顯然以上三種估計(jì)結(jié)果都不可靠(回歸參數(shù)符號不對)。原因是啤酒稅之外還有許多因素影響交通事故死亡人數(shù)。

36、個(gè)體固定效應(yīng)估計(jì)結(jié)果(散點(diǎn)圖見圖1)it = 2.375 + - 0.66 beertax it (24.5) (-3.5) SSE=10.35雙固定效應(yīng)估計(jì)結(jié)果(散點(diǎn)圖見圖1)it = 2.37 + - 0.65 beertax it (23.3) (-3.25) SSE=9.92以上兩種回歸系數(shù)的估計(jì)結(jié)果非常近似。下面的F檢驗(yàn)證實(shí)參數(shù)-0.66和0.65比較合理。用F檢驗(yàn)判斷應(yīng)該建立混合模型還是個(gè)體固定效應(yīng)模型。H0:ai =a?;旌匣貧w模型(約束截距項(xiàng)為同一參數(shù))。H1:ai各不相同。個(gè)體固定效應(yīng)回歸模型(截距項(xiàng)任意取值)F= (以EViwes5.0計(jì)算自由度) = 50.8F0.05(

37、48, 286) = 1.2因?yàn)镕= 50.8 > F0.05(14, 89) = 1.2,推翻原假設(shè),比較上述兩種模型,建立個(gè)體固定效應(yīng)回歸模型更合理。下面討論面板差分?jǐn)?shù)據(jù)的估計(jì)結(jié)果。利用1988年和1982年數(shù)據(jù)的差分?jǐn)?shù)據(jù)得估計(jì)結(jié)果(散點(diǎn)圖見圖3)1988 -1982 = -0.072 - 1.04 (beertax1988 - beertax1982) (0.065) (0.36) 圖20 差分?jǐn)?shù)據(jù)散點(diǎn)圖(File:5panel01a- graph08)6面板數(shù)據(jù)的單位根檢驗(yàn)下面介紹幾種檢驗(yàn)方法。6.1 LLC(Levin-Lin-Chu,2002)檢驗(yàn)(適用于相同根(common

38、 root)情形)LLC檢驗(yàn)原理是仍采用ADF檢驗(yàn)式形式。但使用的卻是和的剔出自相關(guān)和確定項(xiàng)影響的、標(biāo)準(zhǔn)的代理變量。具體做法是(1)先從D yit和yit中剔出自相關(guān)和確定項(xiàng)的影響,并使其標(biāo)準(zhǔn)化,成為代理變量。(2)用代理變量做ADF回歸,=r + vit。LLC 修正的漸近服從N(0,1)分布。詳細(xì)步驟如下:H0: r = 0(有單位根); H1: r < 0。LLC檢驗(yàn)為左單端檢驗(yàn)。LLC檢驗(yàn)以如下ADF檢驗(yàn)式為基礎(chǔ): D yit = r yi t-1 +D yi t-j + Zit'f + eit, i = 1, 2, , N; t = 1, 2, , T (38)其中Zi

39、t表示外生變量(確定性變量)列向量,f 表示回歸系數(shù)列向量。(1)估計(jì)代理變量。首先確定附加項(xiàng)個(gè)數(shù)ki,然后作如下兩個(gè)回歸式, D yit = D yi t-j + Zit'+ yi t-1 = D yi t-j + Zit'+移項(xiàng)得 = D yit -D yi t-j - Zit' = yit -D yi t-j - Zit'把和標(biāo)準(zhǔn)化, = /si = /si其中si, i = 1, 2, , N 是用(38)式對每個(gè)個(gè)體回歸時(shí)得到的殘差的標(biāo)準(zhǔn)差,從而得到D yit和yit-1的代理變量和。(2)用代理變量和作如下回歸,=r+ vitLLC證明,上式中估計(jì)量

40、的如下修正的統(tǒng)計(jì)量漸近地服從標(biāo)準(zhǔn)正態(tài)分布。= ® N (0, 1)其中表示標(biāo)準(zhǔn)的t統(tǒng)計(jì)量;N是截面容量;=T-1,(T為個(gè)體容量);SN是每個(gè)個(gè)體長期標(biāo)準(zhǔn)差與新息標(biāo)準(zhǔn)差之比的平均數(shù);是誤差項(xiàng)vit的方差;是標(biāo)準(zhǔn)誤差;和分別是均值和標(biāo)準(zhǔn)差的調(diào)整項(xiàng)。 見圖21輸出結(jié)果,LLC = 9.7 > -1.65,所以存在單位根。圖21 LLC檢驗(yàn)的EViews 5.0輸出結(jié)果(部分)EViews 5.0操作步驟:在面板數(shù)據(jù)窗口點(diǎn)擊View選Unit Root Test功能。在Test Type中選Common root Levin, Lin, Chu。6.5 Breitung檢驗(yàn)(2002)(適用于相同根(common root)情形)Breitung檢驗(yàn)法與LLC檢驗(yàn)法類似。先從和中剔出動(dòng)態(tài)項(xiàng),然后標(biāo)準(zhǔn)化,再退勢,最后用ADF回歸*=r* + vit。檢驗(yàn)單位根。用每個(gè)個(gè)體建立的單位根檢驗(yàn)式的誤差項(xiàng)之間若存在同期相關(guān),上述面板數(shù)據(jù)的單位根檢驗(yàn)方法都不再適用。主要是統(tǒng)計(jì)量的分布發(fā)生變化,檢驗(yàn)功效降低。為此提出一些個(gè)體同期相關(guān)面板數(shù)據(jù)的單位根檢驗(yàn)方法。6.2 Hadri檢驗(yàn)(適用于相同根(common root)情形)Hadri檢驗(yàn)與KPSS檢驗(yàn)相類似。原假設(shè)是面板中的所有序列都不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論