




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、面板數(shù)據(jù)分析面板數(shù)據(jù)分析(Panel Data Analysis)20132013年商學院暑期微觀計量培訓年商學院暑期微觀計量培訓陳華帥陳華帥2013年年7月月9日下午日下午變量遺漏問題變量遺漏問題 被解釋變量:y 解釋變量:x 不可觀察的效果:c 我們感興趣的是:E(yx,c),不是E(yx) 假設:E(yx,c)=+x +c x與c無關,仍然可以得到 的無偏估計量 x與c相關,無法得到 的一致估計量解決辦法解決辦法 尋找c的代理變量p p直接影響因變量y 當給定p時,c對y沒有影響 p與隨機擾動項無關 尋找一個IV Z與c相關,但與隨機擾動項無關Panel Data的方法 當遺漏變量不隨時
2、間而變化,如國家的初始技 術效率,城市的歷史,或個人的一些特征等 問題的解決得益于對同一個個體的重復觀測一個簡單的例子一個簡單的例子 yt,xt , t=1,2 c不隨時間而改變,但是隨個體變化而改變 考慮教育回報問題:yt=0+xt+c+ut 外生性假設:E(ut| xt, c)=0 E(xtut)=0 討論:討論: 如果E(xtc)=0,則可以進行Pooled OLS估計 如果:E(xtc)0,則Pooled OLS不一致 解決辦法:一階差分(時間上相減)y=x+uc=0不見了 考察古典假設: 要求E(xu)=0,即x與u不相關E(xu)=E(x2-x1)(u2-u1)=E(x2u2)-E
3、(x1u2)-E(x2u1)+E(x1u1)=0 -E(x1u2)-E(x2u1)則E(x1u2)+E(x2u1)=0 要求xx滿列秩,則沒有一個x=0,即每 個x在t=1,2中隨時間有變化什么是什么是 Panel Data 定義 對固定單位、個人、企業(yè)、家庭或其他經(jīng)濟體 重復觀測所形成的數(shù)據(jù) 典型的Panel在時間上進行重復觀察 跟蹤同樣的個體(如個人、家庭、企業(yè)、城市、國家等)而得到的跨時間數(shù)據(jù)例 單位:i=1,2,N 觀察時點:t=1,2, Ti 一般而言,NTi 是Panel Data, Ti N是多元時間序列數(shù)據(jù) 如果Ti對于每個單位都相同,叫平衡面板(Balanced Panel)
4、 如果Ti對于每個單位不都相同,叫不平衡面 板(Unbalanced Panel) 對于非平衡面板數(shù)據(jù),我們關心非平衡是否是內(nèi)生的 比如,yit是收入,隨著時間流逝富人更容易退出樣本,因為他們的時間成本比較高,此時數(shù)據(jù)的非平衡就是內(nèi)生引起的 此時,即使最初的模型是線性模型,yit的條件期望是xit 的線性函數(shù),我們需要非線性的樣本選擇方法更多例子更多例子 雙胞胎數(shù)據(jù)yij 老大、老二: i=1,2 不同的家庭: j=1,2,J 教師的教學評估成績yijt 不同的教師:i=1,2,N 所授的課程:j=1,2,Ji 不同學年:t=1,2,Ti 都是對固定單位進行重復觀察面板數(shù)據(jù)的優(yōu)勢面板數(shù)據(jù)的優(yōu)勢
5、 面板數(shù)據(jù)模型提供了更多的數(shù)據(jù)信息,增加了自由度,并減少了解釋變量的共線性,從而得到更為有效的估計量 面板數(shù)據(jù)模型可以分析單純截面數(shù)據(jù)和時間序列數(shù)據(jù)無法分析的重要經(jīng)濟問題 當遺漏變量是不隨時間而變化的表示個體異質(zhì)性的一些變量時,面板數(shù)據(jù)可以用來處理某些遺漏變量問題面板數(shù)據(jù)模型面板數(shù)據(jù)模型 廣義的面板數(shù)據(jù)模型:隨機參數(shù)模型 參數(shù)太多,不可估計 需要對 it,t,uit 進行更多的假設限定靜態(tài)面板數(shù)據(jù)模型vs.動態(tài)面板數(shù)據(jù)模型 如果xit不包含滯后因變量,上述模型為靜態(tài)線性面板數(shù)據(jù)模型,否則就是動態(tài)線性面板數(shù)據(jù)模型= it + xit t + uit , i = 1,2,.,n, t = 1,.,
6、Tiyit 雙向效應模型:引入個人和時間dummy 個人效應模型 固定效應與隨機效應模型:ci是否和xit相關 固定效應: E(ci | xit ) 0 隨機效應: E(ci | xit ) = 0混合模型(總體均值模型)= i + t + xit + uityit= ci + xit + uityit= i + xit + uityit= + xit + uityit面板數(shù)據(jù)模型的假設面板數(shù)據(jù)模型的假設 以未觀測效應模型為例 ci+ uit稱為合成誤差 (composite error) ci稱為個體效應 (individual effect)、個體異質(zhì)性 (individual heter
7、ogeneity),或不可觀測的異質(zhì)性 uit是隨時間和個體變化的特異性誤差 (idiosyncratic error)= xit + ci + uityit 假設特異性誤差uit和解釋變量xit是不相關的 如果個體異質(zhì)性ci和解釋變量xit也不相關,則可 以用混合最小二乘(pooled OLS,POLS)來 得到一致估計 所謂的POLS方法,是指對所有跨i和t的觀測值 進行OLS回歸,對模型進行POLS回歸 但是個體異質(zhì)性往往和解釋變量相關,此時用 POLS估計得到的估計量是有偏且不一致的, 此偏差稱為異質(zhì)性偏差(heterogeneity bias),這是遺漏(不隨時間變化的)變量引起的偏
8、差嚴格外生性假設嚴格外生性假設 假設E(ux, ci)=0即E(uitxi1, xi2,xis,xiT, ci)=0等價于E(yitxi1, xi2,xis,xiT, ci)=xit+ci可以得到E(xituis)=0 解釋 當ci和xit被控制,對任意的st,xis對yit沒有偏效應(patial effect),即解釋變量給定條件ci下是 嚴格外生的 嚴格外生性假設是一個比較強烈的假設 在嚴格外生性假設下,滯后因變量不能出 現(xiàn)在解釋變量中 嚴格外生性假設也禁止了t期隨機擾動項uit 對t+1期解釋變量xit+1的影響 如果解釋變量中包含有政策變量,而政策 變量經(jīng)常會對前期的沖擊進行調(diào)整,即
9、為 沖擊的反饋效應(feedback effect),此時uit 和xit+1相關,嚴格外生性假設被違反面板數(shù)據(jù)模型的估計量面板數(shù)據(jù)模型的估計量 Pooled OLS 估計量:估計量: 前面介紹過 如果解釋變量xit與ci和uit都不相關,POLS一致 但是方差的估計結(jié)果有問題 總的隨機擾動項存在序列相關 Cov(ci+uit, ci+uit+1) 0,且很高 如果固定效應面板模型是正確的話,POLS不一致 Cov(xit, ci) 0 Cov(xit, ci+uit+1) 0 組間組間(between) 估計量:估計量: POLS運用時間和截面上的變化估計 組間估計量運用不同個人間的變化估計
10、 如果 與 、ci不相關,則對上式的POLS估計一致 不是最有效的iiiiycxuixiu 組內(nèi)組內(nèi)(within) 估計量:估計量: 也稱為固定效應(FE)估計量 POLS運用時間和截面上的變化估計 組間估計量運用不同個人間的變化估計 組內(nèi)估計量運用同一個個人的變化估計 無法識別時間固定的解釋變量的影響()()itiitiitiyyxxuu 一階差分一階差分(FD)估計量:估計量: 面板數(shù)據(jù)模型滯后一期并相減得到: yit = xit + uit 對上式進行POLS估計 滿足嚴格外生性假設時,F(xiàn)D估計量一致 E(uit | xi 2 ,xi 3 ,.,xiT ) = 0 當uit服從隨機游走
11、時(random walk),F(xiàn)D估計 量最有效 E(ui ui | xi ,i ) = u 2IT 1 在T=2而且平衡面板的條件下,F(xiàn)D估計量和FE 估計量是一樣的隨機效應面板模型隨機效應面板模型Random-Effect Panel Model 如果總體很大,抽取的樣本單位具有較大 的隨機性,那么與個體有關的效應將被視 為具有隨機分布的性質(zhì)idyearyx1x2x3x41001120002540024007.7810012240026300054008.5910013027000.0010021038000.0010022200039400060008.70100233600400360
12、08.19100317001807006.5510032100019010006.911003302030303.43基本假設 假設RE.1 (a) 嚴格外生性E(uit|xi,ci)=0, xi=xi1,xi2,xiTt=1,2,T (b) ci獨立于xit,即 Eci|xi=Eci=0itiititycxu RE.3假設 (a)同方差假設: E(u u | x ) = 2 I (b) E(c2 | x ) = 2 i i iu Ti i c 假設RE.2 具體表述: 這種結(jié)構表明誤差項是同方差且存在序列 相關的TcTuucccuccccucJI2222222222222. 在RE.1-RE
13、.3成立時,如果我們用Pooled OLS來估計模型,估計量是一致的 但是POLS估計量忽略了隨機誤差項的結(jié)構 信息,所以不是有效的 而且其方差-協(xié)方差矩陣不會等于 2 ( X X )1 因此可以考慮GLS的方法 RE.1和RE.2假設保證后面的GLS估計結(jié)果 是一致的,RE.3保證v具有同方差結(jié)構,從 而假設保證FGLS估計結(jié)果是最有效的v RE估計:GLS)()(1 -111 -1111iniiiniiREyXXXyXXX)( 在RE.1-RE.3成立時,如果我們用Pooled OLS來估計模型,估計量是一致的 但是POLS估計量忽略了隨機誤差項的結(jié)構 信息,所以不是有效的 而且其方差-協(xié)
14、方差矩陣不會等于 2 ( X X )1 因此可以考慮GLS的方法 RE.1和RE.2假設保證后面的GLS估計結(jié)果 是一致的,RE.3保證v具有同方差結(jié)構,從 而假設保證FGLS估計結(jié)果是最有效的v 隨機效應估計量實際上是通過準去除時間均值(quasi time demeaning)而得到的 隨機效應并不是在每個時間t去掉因變量和 自變量的時間均值,而是在每個時間t去掉 時間均值的一部分 對Q個多重假設 H0 : R = r 進行假設檢驗 在RE.3成立時,可用F檢驗 不論RE.3是否成立,都可以用Wald檢驗: RE.3成立與否,決定對 的估計方法隨機效應模型的參數(shù)檢驗隨機效應模型的參數(shù)檢驗對
15、對Unobserved EffectUnobserved Effect存在性的檢驗存在性的檢驗 如果不存在Unobserved Effect,直接用 Pooled OLS估計就可以了 對Unobserved Effect存在性的檢驗也可以 看成是模型設定檢驗 在Pooled Model和RE Model之間進行選擇 檢驗假設:H0: 2c = 0,即vit不存在序列相關 Breusch and Pagan (1980) 檢驗 拉格朗日乘數(shù)檢驗(LM) 依賴于對uit的正態(tài)假設 具體檢驗統(tǒng)計量為 原假設成立下,LM統(tǒng)計量卡方分布,自由 度為1221121112(1)nTitiiuuuPOLSnT
16、itiivnTLMvyxTv Wooldridge (2002)檢驗統(tǒng)計量BPW 在原假設成立下,vit序列不相關,BPW的漸進分 布是標準正態(tài)分布 該統(tǒng)計量能夠探察vit中的許多種序列相關 但是拒絕原假設并不意味著RE的誤差結(jié)構就是正 確的 如果xit中沒有包括滯后的被解釋變量,vit即使?jié)M足Random Effect的誤差結(jié)構,原假設仍然會被拒絕11111/221111 nTTitisiistnTTitisiistv vBPWv v 固定效應模型固定效應模型Fixed-Effect Panel Model固定效應模型的基本假設固定效應模型的基本假設 與RE模型最大的不同在于,FE模型假設c
17、i可以與uit相關,即對ciuit是否成立不做假定。由于少了RE中的獨立性假定,FE比RE的結(jié)果更加穩(wěn)健。 X中不能包含不隨時間改變的變量 解釋變量如果包含不隨時間變化的變量,我們無法識別這些變量對的影響 不隨時間變化的變量指的是對所有的樣本單位都不隨時間而變化。如果該變量對部分樣本單位隨時間變化,就可以包含進來。itiititycxu固定效應轉(zhuǎn)換估計固定效應轉(zhuǎn)換估計 固定效應模型的估計策略是轉(zhuǎn)換方程消去不可觀測的效應ci 我們可以采用一階差分的方法,也可以采用固定效應轉(zhuǎn)換 (fixed effects transformation) 固定效應轉(zhuǎn)換也叫做組內(nèi)轉(zhuǎn)換 (within transfo
18、rmation) 的固定效應估計量的固定效應估計量 FE是對組內(nèi)模型進行的POLS估計,所以也 稱為組內(nèi)估計量)()()()()()()()(11111111111111QyXQXXyXXXyxxxyyxxxxxxiNiiiNiiNiTtitititNiTtitiitiNiTtitiitiNiTtitFE )( 在固定效應模型假設下, 是無偏且一致的 FE.1嚴格外生性假設中中假定E(uit|xi,ci)=0 可以推出 但是如果在隨機效應模型假設下, 僅僅用 了組內(nèi)的信息,因此它不是有效估計量|(|)(|)0|()0itiitiiiitiitiE uxE uxE uxE uxE uxx()()
19、FEFE 在固定效應模型假設下, 是無偏且一致的 FE.1嚴格外生性假設中中假定E(uit|xi,ci)=0 可以推出 但是如果在隨機效應模型假設下, 僅僅用 了組內(nèi)的信息,因此它不是有效估計量|(|)(|)0|()0itiitiiiitiitiE uxE uxE uxE uxE uxx()()FEFE虛擬變量回歸虛擬變量回歸(LSDV) 虛擬變量回歸是傳統(tǒng)的固定效應估計方法 把ci看成參數(shù),和一起進行估計 對此,可以采用最小二乘虛擬變量回歸 定義1,0,ijif ijdif ij NiNiiiccccdddd.,.2121 有 yit= xit + di c + uitTTTTnnnnlll
20、ldddddddD0.00.0.1222111211估計結(jié)果估計結(jié)果 可以證明: 最小二乘虛擬變量回歸得到的的估計量和 固定效應估計量是一樣的 Wooldridge (2002)認為這里 LSDV和 FE 相等 僅僅是一種巧合 很多情況下,尤其在非線性面板數(shù)據(jù)模型 中,把c看成參數(shù)和 一起進行估計得到的 估計量是不一致的非主要參數(shù)問題非主要參數(shù)問題 當截面觀測增加時,ci的個數(shù)也增加了 當n趨于無窮大,ci并沒有截面信息的積累,而時間長度T是固定的,隨著截面長度 n趨于無窮大,非主要參數(shù)ci的個數(shù)也趨于無窮大 加上非線性模型的復雜性很難先行消去ci ,參數(shù)的估計也被污染(contaminate
21、d),從而在一般情況下也無法得到一致估計量虛擬變量回歸估計量性質(zhì)虛擬變量回歸估計量性質(zhì) FE是 的一個無偏估計量,當T固定而n趨 于無窮時, FE 是 的一個一致估計量;而 ci 僅僅是ci 的無偏估計量,在T固定時 ci 不是 一致估計量 計量軟件一般不匯報固定效應ci的估計值, 不過經(jīng)常會匯報整體截距項的值隨機效應和固定效應估計量的比較隨機效應和固定效應估計量的比較 可以證明: RE估計量是組間回歸估計量和FE估計量的加權平均 FE模型對ci與xi的關系不作假定,因此比RE更Robust,其代價是: FE中由于包含了一個均值 x ,自由度自動減少了一個,并且 的精度降低; 解釋變量過多,易
22、引起多重共線性(LSDV); FE觀察不出不隨時間改變的變量的影響FE隨機效應和固定效應估計量的比較隨機效應和固定效應估計量的比較或E(ci | Xi ) = E(ci ) = 0Cov(ci , xit ) = 0RE還是還是FE:Hausman檢驗檢驗 僅僅從估計量的性質(zhì)來說,我們可能認為,隨機效應估計量要好于固定效應 在對兩個估計量進行比較時,我們發(fā)現(xiàn)當個體效應方差非常大的情況或T非常大時,F(xiàn)E估計量是RE估計量的一個極限 但是,隨機效應模型有一個非常強的假設: FE是無論原假設成立與否都是一致的,但 在原假設下不是有效的 RE在原假設下是一致的,并且漸進有效(樣本越大越有效),但如果原
23、假設被拒 絕,則RE不是一致的 不論在原假設還是備擇假設下,我們都保 持嚴格外生假設。如果嚴格外生假設被違 反,則固定效應和隨機效應估計量都是不 一致的RE還是還是FE:應用考慮:應用考慮 數(shù)據(jù) 當數(shù)據(jù)為省份、國家、單位資料時,即為非隨 機抽取的資料時用FE較合適;為隨機抽取的資 料時,用RE較合適 研究問題:政策分析 政策變量通常會與觀察不到的個體特征ci與觀 察到的xi相關 ci與xi存在相關性 FE模型更合適StataStata程序應用實例程序應用實例假設有假設有3期的跟蹤數(shù)據(jù),變量及數(shù)據(jù)如下:期的跟蹤數(shù)據(jù),變量及數(shù)據(jù)如下:idyabcd100120002540024007.781002
24、038000.0010037001807006.55idyabcd1001240026300054008.591002200039400060008.701003100019010006.91idyabcd1001027000.001002360040036008.191003100019010006.91截面截面1:截面截面2:截面截面3:use D:cross1.dtaforeach aaa of varlist y-d ren aaa aaa1sort idsave D:ff1.dta, replace use D:cross2.dtaforeach bbb of varlist y-d
25、 ren bbb bbb2sort idsave D:ff2.dta, replace use D:cross3.dtaforeach ccc of varlist y-d ren ccc ccc3sort idsave D:ff3.dta, replace1. 創(chuàng)建創(chuàng)建panel data:調(diào)整過后,各截面的變量名修正為(數(shù)值不變):調(diào)整過后,各截面的變量名修正為(數(shù)值不變):idy1a1b1c1d1100120002540024007.781002038000.0010037001807006.55idy2a2b2c2d21001240026300054008.59100220003940
26、0060008.701003100019010006.91idy3a3b3c3d31001027000.001002360040036008.191003100019010006.91截面截面1:截面截面2:截面截面3:2. 截面合并截面合并:use D:ff1.dtamerge id using D:ff2.dtadrop _mergesort idmerge id using D:ff3.dtadrop _mergesave D:total.dta, replaceidy1a1b1c1d1y2a2b2c2d2y3a3b3c3d31001 2000254002400 7.78 2400263
27、000 5400 8.59027000.001002038000.00 2000394000 6000 8.70 36004003600 8.1910037001807006.55 10001901000 6.91 10001901000 6.91合并后的文件合并后的文件”total”中,數(shù)據(jù)格式如下:中,數(shù)據(jù)格式如下:3.轉(zhuǎn)化為面板數(shù)據(jù):轉(zhuǎn)化為面板數(shù)據(jù):use D:total.dtaxtset idreshape long y a b c d, i(id) j(year)save D:sample.dta, replaceidyearyabcd1001120002540024007.7810
28、012240026300054008.5910013027000.0010021038000.0010022200039400060008.7010023360040036008.19100317001807006.5510032100019010006.911003302030303.43轉(zhuǎn)化后的面板轉(zhuǎn)化后的面板數(shù)據(jù)格式:數(shù)據(jù)格式:如果仍將轉(zhuǎn)化回寬數(shù)據(jù)格式,命令行如下如果仍將轉(zhuǎn)化回寬數(shù)據(jù)格式,命令行如下:idy1a1b1c1d1y2a2b2c2d2y3a3b3c3d31001 2000254002400 7.78 2400263000 5400 8.59027000.001002038000.00 2000394000 6000 8.70 36004003600 8.1910037001807006.55 10001901000 6.91 10001901000 6.91use D:sample.dtareshape wide y-d, i(id) j(year)save D:sample.dta, replace面板數(shù)據(jù)回歸指令:面板
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【方正中期期貨】全球宏觀經(jīng)濟2025年二季度報告:美國經(jīng)濟出現(xiàn)滯漲風險 關稅政策令全球前景充滿變數(shù)
- 幼兒園健康教育工作計劃(活動)
- 2025至2030年中國高溫溫度記錄儀行業(yè)發(fā)展研究報告
- 2025至2030年中國香韻瓷行業(yè)發(fā)展研究報告
- 2025至2030年中國防腐木亭子行業(yè)投資前景及策略咨詢報告002
- 四年級體育上冊 第七冊 第二十課 隊列練習 50米快速跑教學設計
- 2025至2030年中國蜂窩面包板行業(yè)發(fā)展研究報告
- 2025至2030年中國破口機行業(yè)投資前景及策略咨詢報告
- 安徽省長豐縣八年級生物上冊 5.4.3 真菌教學設計 (新版)新人教版
- 四年級上冊科學教學設計-3.3《用橡皮筋驅(qū)動小車》 教科版
- 2024版國開電大??啤豆芾碛⒄Z1》在線形考(單元自測1至8)試題及答案
- 有效溝通技巧(適用于工廠)PPT幻燈片
- 教科版四年級科學下冊實驗報告
- 受賄罪-刑事-辯護詞
- 農(nóng)業(yè)行業(yè)領域重大事故隱患判定標準
- 現(xiàn)行規(guī)章制度梳理情況統(tǒng)計表
- 統(tǒng)編版語文六年級下冊單元課內(nèi)閱讀和類文閱讀理解專項檢訓練含答案
- 高標準農(nóng)田假設檢驗批表格
- HCCDP 云遷移認證理論題庫
- 嚴格執(zhí)法【知識 精講精研 】 高中政治統(tǒng)編版必修三政治與法治
- DIN - ISO - 2768-MK-E的公差標準(德國)中文翻譯
評論
0/150
提交評論