第十二講_面板數據_第1頁
第十二講_面板數據_第2頁
第十二講_面板數據_第3頁
第十二講_面板數據_第4頁
第十二講_面板數據_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、面板數據回歸面板數據回歸面板數據是同時在時間和截面上取得的面板數據是同時在時間和截面上取得的二維數據。所以,面板數據(二維數據。所以,面板數據(panel data)也稱時間序列截面數據()也稱時間序列截面數據(time series and cross section data)或混)或混合數據(合數據(pool data)。)。 面板數據用雙下標變量表示。例如面板數據用雙下標變量表示。例如 Yit, i = 1, 2, , N; t = 1, 2, , TN表示面板數據中含有表示面板數據中含有N個個體。個個體。T表示時表示時間序列的最大長度間序列的最大長度。 對于樣本點來說:對于樣本點來說

2、:Stata中面板數據的表示中面板數據的表示companycompanyyearyearinvestinvestmvaluemvalue11951755.9483311952891.24924.9119531304.46241.7119541486.75593.621951588.22289.521952645.52159.4219536412031.321954459.32115.531951135.21819.431952157.32079.731953179.52371.631954189.62759.9在在stata中,首先使用中,首先使用xtset命令指定命令指定個個體特征體特征和和

3、時間特征時間特征,然后可以用,然后可以用xtdes命命令顯示面板數據的結構。令顯示面板數據的結構。use grunfeld,clearxtset company yearxtdes 面板數據的建模方法主要有三種:面板數據的建模方法主要有三種:固定效應回歸模型固定效應回歸模型隨機效應回歸模型隨機效應回歸模型混合回歸模型混合回歸模型固定效應模型固定效應模型對于特定的個體對于特定的個體i而言,而言,ai 表示那些不隨時間表示那些不隨時間改變的影響因素,如個人的消費習慣、國家改變的影響因素,如個人的消費習慣、國家的社會制度、地區(qū)的特征、性別等,一般稱的社會制度、地區(qū)的特征、性別等,一般稱其為其為“個體

4、效應個體效應” (individual effects)。如果把如果把“個體效應個體效應”當作不隨時間改變的固當作不隨時間改變的固定性因素,定性因素, 相應的模型稱為相應的模型稱為“固定效應固定效應”模模型。型。固定效應模型固定效應模型對于固定效應模型,可采用虛擬變量法。對于固定效應模型,可采用虛擬變量法?;舅枷耄汗潭ㄐP蛯嵸|上就是在傳統(tǒng)基本思想:固定效應模型實質上就是在傳統(tǒng)的線性回歸模型中加入的線性回歸模型中加入 N-1 個虛擬變量,使個虛擬變量,使得每個截面都有自己的截距項。由于固定效得每個截面都有自己的截距項。由于固定效應模型假設存在著應模型假設存在著“個體效應個體效應”,每個個體

5、,每個個體都有其單獨的截距項。這就相當于在原方程都有其單獨的截距項。這就相當于在原方程中引入中引入n1個虛擬變量(如果省略常數項,個虛擬變量(如果省略常數項,則引入則引入n個虛擬變量)來代表不同的個體,獲個虛擬變量)來代表不同的個體,獲得每個個體的截據項。得每個個體的截據項。例如:共有例如:共有7個州,方程可以寫成:個州,方程可以寫成:01112233445566ititiYXDDDDDDu7個州的回歸線斜率相同,但截距不同。個州的回歸線斜率相同,但截距不同。第第1個州的截距是:個州的截距是:第第2個州的截距是:個州的截距是:第第3個州的截距是:個州的截距是:第第4個州的截距是:個州的截距是:

6、10201302403如何理解個體效應、個體截距項的不同以及如何理解個體效應、個體截距項的不同以及虛擬變量的引入?虛擬變量的引入?我們用一份模擬的數據來分析:我們用一份模擬的數據來分析: use example,clear xtset company year xtdes 1。 畫出散點圖和擬合線,并建立畫出散點圖和擬合線,并建立OLS回歸回歸方程。方程。2。加入虛擬變量,并重新畫出建立。加入虛擬變量,并重新畫出建立OLS回回歸方程。歸方程。010203040-2-1012xyFitted valuesreg y x010203040-2-1012xyFitted valuesFitted v

7、aluesFitted valuesFitted valuesgen d1=0gen d2=0replace d1=1 if id=2replace d2=1 if id=3reg y x d1 d2固定效應模型的估計算法固定效應模型的估計算法“個休中心化個休中心化”O(jiān)LS算法或者組內離差估計法算法或者組內離差估計法假設原方程為:假設原方程為:(式式1)給定第給定第i 個個體,將個個體,將(式式1)兩邊對時間取平均可得,兩邊對時間取平均可得,(式式2)(式式1) (式式2),得:,得:可以用可以用OLS方法一致地估計方法一致地估計 ,稱為,稱為“固定效應估計固定效應估計量量”(Fixed Ef

8、fects Estimator),記為),記為FE由于由于 主要使用了每個個體的組內離差信息,故主要使用了每個個體的組內離差信息,故也稱為也稱為“組內估計量組內估計量”(within estimator)。)。FE固定效應模型的優(yōu)勢和劣勢固定效應模型的優(yōu)勢和劣勢面板固定效應模型的面板固定效應模型的優(yōu)勢優(yōu)勢是:即使個體是:即使個體特征特征ui與解釋變量與解釋變量Xit相關,只要使用組相關,只要使用組內估計量,就可以得到一致估計,即即內估計量,就可以得到一致估計,即即使存在不隨時間改變的遺漏變量,也可使存在不隨時間改變的遺漏變量,也可得到無偏一致的估計。得到無偏一致的估計。面板固定效應模型的面板固

9、定效應模型的劣勢劣勢是:模型無法是:模型無法估計不隨時間而變的變量之影響,這需估計不隨時間而變的變量之影響,這需要用我們后面要講到的隨機效應模型。要用我們后面要講到的隨機效應模型。在交通事故死亡人數中的應用在交通事故死亡人數中的應用由于由于(10. 8)式中的式中的“差分差分”回歸只用了回歸只用了1982年和年和1988年的數據年的數據(具體講就是這兩年的差額具體講就是這兩年的差額),而,而(10. 15)式中的固定效應回歸用式中的固定效應回歸用到了所有到了所有7年的數據,因此這兩個回歸是不同的。由于利用了年的數據,因此這兩個回歸是不同的。由于利用了更多的數據,因此更多的數據,因此(10. 1

10、5)式中的標準誤差小于式中的標準誤差小于(10. 8)式中的標式中的標準誤差。準誤差。固定效應模型的固定效應模型的stata實現實現 use grunfeld,clear xtset company year xtdes xtline invest固定效應模型:固定效應模型:xtreg invest mvalue kstock ,fe回歸結果解讀回歸結果解讀1。三個。三個R2哪個重要?哪個重要? 2。固定效應為什么有兩個。固定效應為什么有兩個F檢驗?檢驗?F的的自由度如何得出?自由度如何得出?3。corr(u_i, Xb) 的含義。的含義。4。 sigma_u、sigma_e、rho的含義。的

11、含義。1。因為固定效應模型是組內估計量(離差),。因為固定效應模型是組內估計量(離差),因此,只有因此,只有within是一個真正意義上的是一個真正意義上的R2,其他兩個是組間相關系數的平方。其他兩個是組間相關系數的平方。2。右側的。右側的F統(tǒng)計量表示除常數項外其他解釋統(tǒng)計量表示除常數項外其他解釋變量的聯合顯著性。變量的聯合顯著性。最后一個最后一個F檢驗,原假設檢驗,原假設所有所有U_i=0,即不存在個體效應,此時證明,即不存在個體效應,此時證明pooled ols (混合回歸)更有效。(混合回歸)更有效。首先注意:結果中的首先注意:結果中的u_i不表示殘差,而是表示不表示殘差,而是表示個體效

12、應。個體效應。3。corr(u_i, Xb) 個體效應與解釋變量的相關系數,個體效應與解釋變量的相關系數,相關系數為相關系數為0或者接近于或者接近于0,可以使用隨機效應模型;,可以使用隨機效應模型;相關系數不為相關系數不為0,需要使用固定效應模型。,需要使用固定效應模型。4。sigma_u:表示個體效應的標準差:表示個體效應的標準差sigma_e:表示干擾項的標準差:表示干擾項的標準差rho:rho = sigma_u2 / (sigma_u2 + sigma_e2) 表示個體效應的波動占整個波動的比例。表示個體效應的波動占整個波動的比例。拿到一份面板數據,現在我們有四種方法進拿到一份面板數據

13、,現在我們有四種方法進行估計:行估計:1。當作一份截面數據直接估計,這稱為混。當作一份截面數據直接估計,這稱為混合合OLS(pooled ols )。2。利用組內離差法進行估計,這被默認為。利用組內離差法進行估計,這被默認為固定效應模型的一般估計方法。固定效應模型的一般估計方法。3。假設有。假設有i個個體,加入個個體,加入i-1個虛擬變量。個虛擬變量。4。為了得到每個個體具體的截距項,加入。為了得到每個個體具體的截距項,加入i個虛擬變量,同時省略常數項。個虛擬變量,同時省略常數項。我們用這四種方法進行估計并比較結果。我們用這四種方法進行估計并比較結果。use invest, clearxtse

14、t company year方法方法1:reg invest mvalue kstockest store ols方法方法2:xtreg invest mvalue kstock,feest store panel_1方法方法3: tab company , gen(d)reg invest mvalue kstock d2 d3 d4 d5 est store panel_2方法方法4:reg invest mvalue kstock d1 d2 d3 d4 d5, nocons est store panel_3est table *, b(%6.3f) star(0.1 0.05 0.0

15、1) 方法方法3還可以用如下簡單等價的命令實現:還可以用如下簡單等價的命令實現: xi:reg invest mvalue kstock pany 即即LSDV方法或者添加虛擬變量法。方法或者添加虛擬變量法。面板數據格式不符合要求的處理。面板數據格式不符合要求的處理。例如如下表格格式該如何處理?例如如下表格格式該如何處理?處理方法:處理方法:扁平數據變長條數據的命令:扁平數據變長條數據的命令:reshape use invest2,clear edit reshape long invest kstock, i(company) j(year)companycompanyinvest2002i

16、nvest2002invest2003invest2003invest2004invest2004kstock2002kstock2002kstock2003kstock2003kstock2004kstock20041 118.918.919.119.119.619.619.619.616.816.816.716.72 217.417.418.418.418.818.818.118.117.417.417173 3191919.619.620.120.120.220.2171717.117.14 4202020.420.420.320.320.420.417.517.517.317.35 5

17、18.118.118.318.318.418.418.518.516.416.416.116.16 619.719.7202019.919.917.217.216.316.316.316.3時間固定效應回歸時間固定效應回歸其中其中St是只隨時間改變,不隨個體改變的變量。是只隨時間改變,不隨個體改變的變量。 和個體固定效應能控制不隨時問變化但個體間不同的變量和個體固定效應能控制不隨時問變化但個體間不同的變量一樣,時間固定效應能控制個體間相同但隨時間變化的變量。一樣,時間固定效應能控制個體間相同但隨時間變化的變量。 由于新車安全性能的提高是發(fā)生在全國范圍內的。因此它由于新車安全性能的提高是發(fā)生在全

18、國范圍內的。因此它們能夠減少所有州的交通死亡事故。故把汽車安全性能視為隨們能夠減少所有州的交通死亡事故。故把汽車安全性能視為隨時間變化但對所有州都相同的遺漏變量是合理的。于是加入用時間變化但對所有州都相同的遺漏變量是合理的。于是加入用St表示的汽車安全性能的效應后,得:表示的汽車安全性能的效應后,得:只有時間效應只有時間效應我們暫時假設我們暫時假設Zi不出現,方程變?yōu)椋翰怀霈F,方程變?yōu)椋?13itittitYXSu我們的目的是在控制我們的目的是在控制St條件下估計條件下估計1在上述例子中加入時間固定效應。在上述例子中加入時間固定效應。實際上添加了實際上添加了t-1個時間虛擬變量。主要反映個時間

19、虛擬變量。主要反映隨著時間變化的一些特征。隨著時間變化的一些特征。 tab year,gen(yr) edit drop yr1 xtreg invest mvalue kstock yr*,fe大部分時間虛擬變量顯著,說明隨著時間的大部分時間虛擬變量顯著,說明隨著時間的變動,變動,invest有不斷變動的趨勢。有不斷變動的趨勢。個體和時間固定效應(雙向固定個體和時間固定效應(雙向固定效應模型)效應模型)如果某些遺漏變量不隨時間變化但隨州變如果某些遺漏變量不隨時間變化但隨州變化化(如對酒后駕車的文化接受度如對酒后駕車的文化接受度),而其他,而其他遺漏變量不隨州變化但隨時間變化遺漏變量不隨州變化

20、但隨時間變化(如如國家國家安全標準安全標準),則在模型中同時加入個體,則在模型中同時加入個體(州州)和時間效應更為恰當,我們稱為和時間效應更為恰當,我們稱為雙向固定雙向固定效應模型。效應模型。固定效應模型:固定效應模型: Yit=ai+Xit 1 1+it雙向固定效應模型:雙向固定效應模型:Yit=ai+t+Xit 1 1+it雙向固定效應模型的估計雙向固定效應模型的估計雙向固定效應模型可以通過加入雙向固定效應模型可以通過加入n-1個個體二元變量個個體二元變量和和T-1個時間二元變量進行個時間二元變量進行OLS估計,但這會使解釋估計,但這會使解釋變量的數目變得極為龐大!變量的數目變得極為龐大!

21、所以一般我們還是采用組內離差法進行估計。所以一般我們還是采用組內離差法進行估計。 方法一方法一:可以通過先從:可以通過先從Y和和X中減去個體和時間平均中減去個體和時間平均值,然后估計被減后的值,然后估計被減后的Y關于被減后的關于被減后的X的多元回歸的多元回歸方程的方法來估計方程的方法來估計X的系數。這種方法可以避免二元的系數。這種方法可以避免二元變量的出現。變量的出現。 方法二方法二:從:從Y, X和時間指示變量中減去個體和時間指示變量中減去個體(不是時不是時間間)均值然后估計,被減后的均值然后估計,被減后的Y對被減后的對被減后的X和被減后和被減后的時間指示變量的多元回歸中的的時間指示變量的多

22、元回歸中的k+T個系數。個系數。在交通死亡人數中的應用在交通死亡人數中的應用 上述形式中包含了啤灑稅,上述形式中包含了啤灑稅,47個州二元變量個州二元變量(州固州固定效應定效應),6個年二元變量個年二元變量(時間固定效應時間固定效應)和截距項,和截距項,所以這個模型的解釋變量個數多達所以這個模型的解釋變量個數多達55個,這將帶來大個,這將帶來大量的自由度的損失。因為時間和州二元變量和截距項量的自由度的損失。因為時間和州二元變量和截距項的系數不是我們主要感興趣的,所以我們在這里沒有的系數不是我們主要感興趣的,所以我們在這里沒有列出。列出。 比較參數發(fā)現加入時間效應后啤酒稅的系數由比較參數發(fā)現加入

23、時間效應后啤酒稅的系數由-0.66變?yōu)樽優(yōu)?0.64,可見加入時間效應對結果影響不大。,可見加入時間效應對結果影響不大。固定效應回歸假設和固定效應回固定效應回歸假設和固定效應回歸的標準誤差歸的標準誤差本章給出的標準誤差是利用一般異方差穩(wěn)健公本章給出的標準誤差是利用一般異方差穩(wěn)健公式計算得到的。當式計算得到的。當T中等大小或較大時,在稱中等大小或較大時,在稱為固定效應回歸假設的五個假設條件下面板數為固定效應回歸假設的五個假設條件下面板數據中的這些異方差穩(wěn)健標準誤差都是正確的。據中的這些異方差穩(wěn)健標準誤差都是正確的。固定效應回歸假設固定效應回歸假設固定效應回歸的標準誤差固定效應回歸的標準誤差 如果

24、重要概念如果重要概念10.3中的假設中的假設5成立,則給定回成立,則給定回歸變量條件下,誤差歸變量條件下,誤差u在時間上不相關,在這種情況在時間上不相關,在這種情況下如果下如果T中等大小或較大時,則常用中等大小或較大時,則常用(異方差穩(wěn)健異方差穩(wěn)健)標標準誤差是正確的。準誤差是正確的。 如果誤差自相關,則常用標準誤差公式不正確。如果誤差自相關,則常用標準誤差公式不正確。理解這一點的一種方法是同異方差做類比。在截面理解這一點的一種方法是同異方差做類比。在截面數據回歸中,如果誤差異方差,則由于同方差適用數據回歸中,如果誤差異方差,則由于同方差適用的標準誤差是在同方差的錯誤假設下導出的,因此的標準誤

25、差是在同方差的錯誤假設下導出的,因此是不正確的。類似地,如果面板數據中的誤差自相是不正確的。類似地,如果面板數據中的誤差自相關,則由于常用標準誤差是在它們沒有自相關的錯關,則由于常用標準誤差是在它們沒有自相關的錯誤假設下導出的,因此也是不正確的。誤假設下導出的,因此也是不正確的。由于面板數據具有潛在異方差且在給定個休由于面板數據具有潛在異方差且在給定個休的不同時間上潛在相關時,正確的標準誤差的不同時間上潛在相關時,正確的標準誤差稱為稱為異方差和自相關一致的標準誤差異方差和自相關一致的標準誤差(HAC)。這種標準誤差由稱為這種標準誤差由稱為群標準誤差群標準誤差。在時間序列中使用的命令是在時間序列

26、中使用的命令是newey在面板數據中使用的命令是在面板數據中使用的命令是xtgls有關酒后駕車的法律規(guī)定和交通有關酒后駕車的法律規(guī)定和交通事故死亡人數事故死亡人數酒精稅只是抑制酒后駕車的一種方法,如果某酒精稅只是抑制酒后駕車的一種方法,如果某州想要打擊酒后駕車,可以通過增加稅收和嚴州想要打擊酒后駕車,可以通過增加稅收和嚴酷的法律來做到這一點。因此,即使在包含州酷的法律來做到這一點。因此,即使在包含州和時間固定效應的模型中遺漏這些有關酒后駕和時間固定效應的模型中遺漏這些有關酒后駕車的法律也會導致啤酒稅對交通死亡事故效應車的法律也會導致啤酒稅對交通死亡事故效應的的OLS估計量中存在遺漏變量偏差。此

27、外,是估計量中存在遺漏變量偏差。此外,是否開車也部分取決于司機是否有工作,同時,否開車也部分取決于司機是否有工作,同時,稅收變化也反映了經濟狀況稅收變化也反映了經濟狀況(如州預算赤字會如州預算赤字會增加稅收增加稅收)。所以遺漏州的經濟狀況也會導致。所以遺漏州的經濟狀況也會導致遺漏變量偏差。遺漏變量偏差。本節(jié)中我們將前面的分析推廣到保持經濟狀況不變本節(jié)中我們將前面的分析推廣到保持經濟狀況不變條件下有關酒后駕車的法律規(guī)定條件下有關酒后駕車的法律規(guī)定(包括啤酒稅包括啤酒稅)對交對交通死亡事故效應的研究。為此,我們需要估計包含通死亡事故效應的研究。為此,我們需要估計包含其他酒后駕車法律和州經濟狀況的回

28、歸變量的面板其他酒后駕車法律和州經濟狀況的回歸變量的面板數據回歸。數據回歸。這些結果刻畫了一幅抑制酒后駕車和交通死亡事故這些結果刻畫了一幅抑制酒后駕車和交通死亡事故措施引發(fā)爭議的畫面。這些估計值表明嚴厲的處罰措施引發(fā)爭議的畫面。這些估計值表明嚴厲的處罰和提高最低法定喝酒年齡對死亡率都不會產生重要和提高最低法定喝酒年齡對死亡率都不會產生重要作用。相反,有證據表明提高類似啤酒稅這樣的酒作用。相反,有證據表明提高類似啤酒稅這樣的酒精稅會減少交通死亡率。但這個效應的估計仍是不精稅會減少交通死亡率。但這個效應的估計仍是不精確的。精確的。隨機效應模型隨機效應模型對于面板數據而言,除了我們前面講的混合回對于

29、面板數據而言,除了我們前面講的混合回歸和固定效應模型以外,還存在另外一種模型歸和固定效應模型以外,還存在另外一種模型形式:隨機效應模型。形式:隨機效應模型。為了區(qū)別固定效應模型和隨機效應模型,我們?yōu)榱藚^(qū)別固定效應模型和隨機效應模型,我們把兩個模型的方程分別寫成:把兩個模型的方程分別寫成:1itiititYXu固定效應模型固定效應模型1ititiitYXu隨機效應模型隨機效應模型兩個模型看似一樣,但模型形式截然不同:兩個模型看似一樣,但模型形式截然不同:在固定效應模型中:在固定效應模型中: 作為一個隨機變量(解釋變作為一個隨機變量(解釋變量),標示模型的個體效應。量),標示模型的個體效應。而在隨

30、機效應模型中:隨機誤差項分成兩部分,一而在隨機效應模型中:隨機誤差項分成兩部分,一部分是不隨時間變化的誤差項部分是不隨時間變化的誤差項 ,另一部分是隨時,另一部分是隨時間變化的誤差項間變化的誤差項 ,即,即其中其中i1itititYXiituitiitu關于隨機效應模型:關于隨機效應模型:1。隨機效應模型將固定效應模型的個體效應。隨機效應模型將固定效應模型的個體效應歸入到隨機誤差項中,因此更加靈活。歸入到隨機誤差項中,因此更加靈活。2。固定效應模型通過組內離差的方法消除掉。固定效應模型通過組內離差的方法消除掉不隨時間改變的變量,這一方面保證了模型不隨時間改變的變量,這一方面保證了模型的無偏性,

31、另一方面模型無法估計不隨時間的無偏性,另一方面模型無法估計不隨時間改變的變量之影響,這在隨機效應模型中可改變的變量之影響,這在隨機效應模型中可以實現。以實現。3?;貧w的結果是隨機效應模型的所有的個體。回歸的結果是隨機效應模型的所有的個體具有相同的截距項,個體的差異主要反應在具有相同的截距項,個體的差異主要反應在隨機干擾項的設定上。隨機干擾項的設定上。4。由于上述特性,隨機效應模型比固定。由于上述特性,隨機效應模型比固定效應模型結果更加有效,同時,條件更效應模型結果更加有效,同時,條件更加苛刻。加苛刻。隨機效應模型必須滿足下列條件:隨機效應模型必須滿足下列條件:(,)0iitCovX一般在固定效應模型中一般在固定效應模型中(,)0iitCovX隨機效應模型:隨機效應模型:xtreg invest mvalue kstock ,re

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論