面板數(shù)據(jù)模型與stata應(yīng)用課件_第1頁
面板數(shù)據(jù)模型與stata應(yīng)用課件_第2頁
面板數(shù)據(jù)模型與stata應(yīng)用課件_第3頁
面板數(shù)據(jù)模型與stata應(yīng)用課件_第4頁
面板數(shù)據(jù)模型與stata應(yīng)用課件_第5頁
已閱讀5頁,還剩78頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第二講 面板數(shù)據(jù)模型與stata軟件的應(yīng)用,主講:陳勇兵 中南財經(jīng)政法大學(xué)工商管理學(xué)院 E-mail: ,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata軟件的應(yīng)用,一、什么是面板數(shù)據(jù) 二、面板數(shù)據(jù)模型的優(yōu)勢 三、面板模型的估計方法:FE和RE 四、stata軟件簡介 五、如何用stata估計面板模型:案例分析,面板數(shù)據(jù)模型與stata應(yīng)用,第一講 短面板,時間維度+截面維度 如我們在分析中國各省份的經(jīng)濟增長時,共有31個截面,每個截面都取1979-1998共20年的數(shù)據(jù),共有620個觀察值,這是一個典型的平行面板數(shù)據(jù) 上市公司財務(wù)數(shù)據(jù),研究一段時期內(nèi)(1998-2008)上市公司股利的

2、發(fā)放數(shù)額與股票賬面價值之間的關(guān)系,共有20 11=220個觀測值 強調(diào)經(jīng)濟理論基礎(chǔ)、強調(diào)微觀行為基礎(chǔ),面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)的分類,如果面板數(shù)據(jù)T 較小,而n 較大,被稱為“短面板”(short panel)。反之,如果T 較大,而n 較小,則被稱為“長面板”(long panel) 在面板模型中,如果解釋變量包含被解釋變量的滯后值,則稱為“動態(tài)面板”(dynamic panel);反之,則稱為“靜態(tài)面板”(static panel)。 如果在面板數(shù)據(jù)中,每個時期在樣本中的個體完全一樣,則稱為“平衡面板數(shù)據(jù)”(balanced panel);反之,

3、則稱為“非平衡面板數(shù)據(jù)”(unbalanced panel,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,表1 1996-2002年中國東北、華北、華東15個省級地區(qū)的居民家庭人均消費數(shù)據(jù)(不變價格,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,表2 上市公司的投資與股票賬面價值:N=20,T=4,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型的優(yōu)點,1)可以解決遺漏變量問題:遺漏變量常常是由于不可觀測的個體差異或異質(zhì)性(heterogeneity)造成的,如果這種個體差異“不隨時間而改變”(time invariant),則面板數(shù)據(jù)提供了解決遺漏變量問題的又一利器。

4、2)提供更多個體動態(tài)行為的信息:由于面板數(shù)據(jù)同時有橫截面與時間兩個維度,有時它可以解決單獨的截面數(shù)據(jù)或時間序列數(shù)據(jù)所不能解決的問題。 3)樣本容量較大:由于同時有截面維度與時間維度,通常面板數(shù)據(jù)的樣本容量更大,從而提高估計精度。 但面板數(shù)據(jù)也會帶來一些問題。面數(shù)據(jù)通常不滿足獨立同 分布的假定,因為同一個體在不同期的擾動項一般存在自 相關(guān)。另外,面板數(shù)據(jù)的收集成本通常較高,面板數(shù)據(jù)模型與stata應(yīng)用,舉例,交通死亡率與酒后駕車人數(shù)(一段時間內(nèi)江蘇省各市) 其他的非觀測(潛在)因素:南京與蘇州 汽車本身狀況 道路質(zhì)量 當(dāng)?shù)氐娘嬀莆幕?單位道路的車輛密度 非觀測效應(yīng)導(dǎo)致估計結(jié)果不準(zhǔn)確,面板數(shù)據(jù)可以

5、控制和估計非觀測效應(yīng),面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型形式: 其中, i=1,2,3.N,截面標(biāo)示; t=1,2,. T,時間標(biāo)示 ;xit為k1解釋變量,為k1系數(shù)列向量 對于特定的個體i 而言, ai表示那些不隨時間改變的影響因素,而這些因素在多數(shù)情況下都是無法直接觀測或難以量化的,如個人的消費習(xí)慣、地區(qū)的經(jīng)濟結(jié)構(gòu),法律和產(chǎn)權(quán)制度等,一般稱其為“個體效應(yīng)” (individual effects,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型的誤差項由兩部分組成: 一部分是與個體觀察單位有關(guān)的,它概括了所有影響被解釋變量,但不隨時間變化的因素,因此,面板數(shù)據(jù)模型也常常被成為非觀測效應(yīng)

6、模型; 另外一部分概括了隨截面隨時間而變化的不可觀測因素,通常被成為特異性誤差或特異擾動項,面板數(shù)據(jù)模型與stata應(yīng)用,在實踐中常采用折衷策略,即假定個體的回歸方程擁有相同的斜率,但可以有不同的截距項,以此來捕捉異質(zhì)性,面板數(shù)據(jù)模型與stata應(yīng)用,由于面同一個體在不同時期的擾動項之間往往存在自相關(guān),故應(yīng)使用“聚類穩(wěn)健的標(biāo)準(zhǔn)差”(cluster-robust standard error),而所謂“聚類”(cluster),就是由每個個體不同時期的所有觀測值所組成。同一聚類(個體)的觀測值允許存在相關(guān)性,而不同聚類(個體)的觀測值則不相關(guān),面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stat

7、a應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,動態(tài)模型 y=.8y(-1)+v,樣本容量分別為T=20,50,100時,各模擬2萬次,面板數(shù)據(jù)模型與stata應(yīng)用,3. 面板數(shù)據(jù)模型估計方法,混合最小二乘(Pooled OLS)估計 (適用于混合模型) 平均數(shù)(between)OLS估計 (適用于混合模型和個體隨機效應(yīng)模型) 離差變換(within)OLS估計 (適用于個體固定效應(yīng)回歸模型) 一

8、階差分(first difference)OLS估計 (適用于個體固定效應(yīng)模型) 可行GLS(feasible GLS)估計 (適用于隨機效應(yīng)模型,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,如果在原方程中引入(n 1) 個虛擬變量(如果沒有截距項,則引入n 個虛擬變量)來代表不同的個體,則可以得到與上述離差模型同樣的結(jié)果。故 FE 也被稱為“最小二乘虛擬變量模型”(Least Square Dummy Variable Model ,LSDV)。 使用LSD

9、V 的好處是可以得到對個體異質(zhì)性 的估計,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,面板數(shù)據(jù)模型與stata應(yīng)用,面板模型選擇:固定效應(yīng)還是隨機效應(yīng),對“個體效應(yīng)”的處理主要有兩種方式:一種是視其為不隨時間改變的固定性因素, 相應(yīng)的模型稱為“固定效應(yīng)”模型;另一種是視其為隨機因素,相應(yīng)的模型稱為“隨機效應(yīng)”模型 固定效應(yīng)模型中的個體差異反映在每個個體都有一個特定的截距項上; 隨機效應(yīng)模型則假設(shè)所有的個體具有相同的截距項,個體的差異主要反應(yīng)在隨機干擾項的設(shè)定上,面板數(shù)據(jù)模型與stata應(yīng)用,FE(Fixed Effects) Model RE (R

10、andom Effects) Model 其中, 是截距中的隨機變量部分,代表個體的隨機影響,Replace with dummy variables,面板數(shù)據(jù)模型與stata應(yīng)用,固定效應(yīng)模型,1、例如,在研究財政支出與經(jīng)濟增長的關(guān)系,運用全國的時間序列數(shù)據(jù)來檢驗財政支出與經(jīng)濟增長的關(guān)系可能存在設(shè)定誤差并且受統(tǒng)計資料的制約,僅用時間序列資料不能夠滿足大樣本的要求 同時,由于我國不同地區(qū)的體制變革和財政政策的不斷調(diào)整,造成各個地區(qū)財政支出結(jié)構(gòu)隨時間而不斷變化 面板數(shù)據(jù)(Panel Data )從某種程度上克服了這一困難。考慮到中國各省份財政支出結(jié)構(gòu)與經(jīng)濟增長的關(guān)系存在明顯的地區(qū)差異,從時間序列

11、的角度,考慮各省差異的動態(tài)性,是面板數(shù)據(jù)模型的優(yōu)勢,面板數(shù)據(jù)模型與stata應(yīng)用,例如,在研究中國地區(qū)經(jīng)濟增長的過程中,以全國28 個省區(qū)為研究對象,可以認(rèn)為這28 個省區(qū)幾乎代表了整個總體 同時假設(shè)在樣本區(qū)間內(nèi),各省區(qū)的 經(jīng)濟結(jié)構(gòu) 人口素質(zhì) 等不可觀測的特質(zhì)性因素是固定不變的,因此采用固定效應(yīng)模型是比較合適的,面板數(shù)據(jù)模型與stata應(yīng)用,2、而當(dāng)我們研究某個縣市居民的消費行為時,由于樣本數(shù)相對于江蘇省幾千萬人口是個很小的樣本,此時,可以認(rèn)為個體居民在個人能力、消費習(xí)慣等方面的差異是隨機的,采用隨機效應(yīng)模型較為合適 隨機效應(yīng)模型: RE認(rèn)為個體的差異是隨機的,其中 非觀測的個體差異效應(yīng) 與隨

12、機擾動項一樣都是隨機變量,隨機效應(yīng)模型,面板數(shù)據(jù)模型與stata應(yīng)用,總結(jié):如果把非觀測效應(yīng)看做是各個截面或個體特有的可估計參數(shù),并且不隨時間而變化,則模型為固定效應(yīng)模型; 如果把非觀測效應(yīng)看作隨機變量,并且符合一個特定的分布,則模型為隨機效應(yīng)模型,面板數(shù)據(jù)模型與stata應(yīng)用,3、在實證分析中,一般通過hausman檢驗判斷:由于隨機效應(yīng)模型把個體效應(yīng)設(shè)定為干擾項的一部分,所以就要求解釋變量與個體效應(yīng)不相關(guān),而固定效應(yīng)模型并不需要這個假設(shè)條件 因此,我們可以通過檢驗該假設(shè)條件是否滿足,如果滿足,那么就應(yīng)該采用隨機效應(yīng)模型,反之,就需要采用固定效應(yīng)模型,面板數(shù)據(jù)模型與stata應(yīng)用,Hausm

13、an檢驗的基本思想是:在固定效應(yīng)u_i和其他解釋變數(shù)不相關(guān)的原假設(shè)下,用OLS估計的固定效應(yīng)模型和用GLS估計的隨機效應(yīng)模型的參數(shù)估計都是一致的。反之,OLS是一致的,但GLS則不是 因此,在原假設(shè)下,二者的參數(shù)估計應(yīng)該不會有系統(tǒng)的差異,我們可以基于二者參數(shù)估計的差異構(gòu)造統(tǒng)計檢驗量。如果拒絕了原假設(shè),我們就認(rèn)為選擇固定效應(yīng)模型是比較合適的,面板數(shù)據(jù)模型與stata應(yīng)用,4面板數(shù)據(jù)模型檢驗與設(shè)定方法,4.4 Hausman檢驗,原假設(shè)與備擇假設(shè)是 H0: 個體效應(yīng)與回歸變量無關(guān)(個體隨機效應(yīng)回歸模型) H1: 個體效應(yīng)與回歸變量相關(guān)(個體固定效應(yīng)回歸模型,面板數(shù)據(jù)模型與stata應(yīng)用,Hausm

14、an檢驗究竟選擇固定效應(yīng)模型還是隨機效應(yīng)模型: 第一步:估計固定效應(yīng)模型,存儲結(jié)果 quietly xtreg fatal beertax spircons unrate perincK,fe est store fix 第二步:估計隨機效應(yīng)模型,存儲結(jié)果 quietly xtreg fatal beertax spircons unrate perincK,re est store ran 第三步:進(jìn)行hausman檢驗 hausman setconsist seteff (setconsist為固定效應(yīng)模型估計名稱,seteff為隨機效應(yīng)模型估計名稱) fix ran,面板數(shù)據(jù)模型與sta

15、ta應(yīng)用,Hausman檢驗量為: H=(b-B)Var(b)-Var(B)-1(b-B)x2(k) Hausman統(tǒng)計量服從自由度為k的2分布。當(dāng)H大于一定顯著水平的臨界值時,我們就認(rèn)為模型中存在固定效應(yīng),從而選用固定效應(yīng)模型,否則選用隨機效應(yīng)模型 如果hausman檢驗值為負(fù),說明的模型設(shè)定有問題,導(dǎo)致Hausman 檢驗的基本假設(shè)得不到滿足,遺漏變量的問題,或者某些變量是非平穩(wěn)等等。 在這里,零假設(shè)是隨機效應(yīng)成立,即個體效應(yīng)和解釋變量無關(guān),面板數(shù)據(jù)模型與stata應(yīng)用,案例:美國公路交通死亡人數(shù)與啤酒稅的關(guān)系研究 以數(shù)據(jù)集traffic.dta為例,面板數(shù)據(jù)模型與stata應(yīng)用,四、st

16、ata軟件簡介,STATA軟件估計與應(yīng)用: 打開數(shù)據(jù)庫: use E:Program FilesStata10.0綠色軟件Stata10東部.dta“ 或者重新輸入數(shù)據(jù):edit 相關(guān)系數(shù):cor gdp invest edu sci health 簡單回歸:regress gdp invest culture sci 無常數(shù):regress gdp invest culture sci,noconstant,面板數(shù)據(jù)模型與stata應(yīng)用,估計結(jié)果,面板數(shù)據(jù)模型與stata應(yīng)用,回歸診斷,是否存在異方差:estat hettest 懷特檢驗: estat imtest,white 回歸信息檢驗

17、:estat imtest 是否遺漏重要解釋變量:estat ovtest 擬合圖: rvfplot 單一變量的相關(guān)圖:cprplot invest,面板數(shù)據(jù)模型與stata應(yīng)用,畫圖,菜單與命令結(jié)合 twoway (scatter gdp invest) twoway (scatter gdp invest|lfit gdp invest,面板數(shù)據(jù)模型與stata應(yīng)用,基本建設(shè)支出與GDP的相關(guān)關(guān)系圖,面板數(shù)據(jù)模型與stata應(yīng)用,各省教育支出的增長趨勢:1998-2006,面板數(shù)據(jù)模型與stata應(yīng)用,Durbin-Watson 統(tǒng)計量:estat dwatson 序列相關(guān)檢驗:estat

18、 durbinalt 滯后階數(shù)選擇:estat durbinalt,lags(2) 條件異方差檢驗:estat archlm,lags(2) 可選變量的異方差檢驗:estat szroeter gdp invest culture sci,面板數(shù)據(jù)模型與stata應(yīng)用,五、Stata對面板數(shù)據(jù)模型的估計,面板數(shù)據(jù)模型與stata應(yīng)用,隨機效應(yīng)模型,面板數(shù)據(jù)模型與stata應(yīng)用,Stata對面板數(shù)據(jù)模型的估計,首先對面板數(shù)據(jù)進(jìn)行聲明: 前面是截面單元,后面是時間標(biāo)識: tsset company year tsset industry year 產(chǎn)生新的變量:gen newvar=human*l

19、nrd 產(chǎn)生滯后變量Gen fiscal(2)=L2.fiscal 產(chǎn)生差分變量Gen fiscal(D)=D.fiscal,面板數(shù)據(jù)模型與stata應(yīng)用,描述性統(tǒng)計: xtdes :對Panel Data截面?zhèn)€數(shù)、時間跨度的整體描述 Xtsum:分組內(nèi)、組間和樣本整體計算各個變量的基本統(tǒng)計量 xttab 采用列表的方式顯示某個變量的分布 Stata中用于估計面板模型的主要命令:xtreg xtreg depvar varlist if exp , model_type level(#),面板數(shù)據(jù)模型與stata應(yīng)用,Model type 模型 be Between-effects estim

20、ator fe Fixed-effects estimator re GLS Random-effects estimator pa GEE population-averaged estimator mle Maximum-likelihood Random-effects estimator,面板數(shù)據(jù)模型與stata應(yīng)用,主要估計方法: xtreg: Fixed-, between- and random-effects, and population-averaged linear models xtregar:Fixed- and random-effects linear model

21、s with an AR(1) disturbance xtpcse :OLS or Prais-Winsten models with panel-corrected standard errors xtrchh :Hildreth-Houck random coefficients models xtivreg :Instrumental variables and two-stage least squares for panel-data models,面板數(shù)據(jù)模型與stata應(yīng)用,xtabond:Arellano-Bond linear, dynamic panel data est

22、imator xttobit :Random-effects tobit models xtlogit : Fixed-effects, random-effects, population-averaged logit models xtprobit :Random-effects and population-averaged probit models xtfrontier :Stochastic frontier models for panel-data xtrc gdp invest culture edu sci health social admin,beta,面板數(shù)據(jù)模型與s

23、tata應(yīng)用,xtreg命令的應(yīng)用: 聲明面板數(shù)據(jù)類型:tsset sheng t 描述性統(tǒng)計:xtsum gdp invest sci admin 1.固定效應(yīng)模型估計: xtreg gdp invest culture sci health admin techno,fe 固定效應(yīng)模型中個體效應(yīng)和隨機干擾項的方差估計值(分別為sigma u 和sigma e),二者之間的相關(guān)關(guān)系(rho) 最后一行給出了檢驗固定效應(yīng)是否顯著的F 統(tǒng)計量和相應(yīng)的P 值,本例中固定效應(yīng)非常顯著,面板數(shù)據(jù)模型與stata應(yīng)用,2.隨機效應(yīng)模型估計: xtreg gdp invest culture sci he

24、alth admin techno,re 檢驗隨機效應(yīng)模型是否優(yōu)于混合OLS 模型: 在進(jìn)行隨機效應(yīng)回歸之后,使用xttest0 檢驗得到的P 值為0.0000,表明隨機效應(yīng)模型優(yōu)于混合OLS 模型 3. 最大似然估計Ml: xtreg gdp invest culture sci health admin techno,mle,面板數(shù)據(jù)模型與stata應(yīng)用,Hausman檢驗,Hausman檢驗究竟選擇固定效應(yīng)模型還是隨機效應(yīng)模型: 第一步:估計固定效應(yīng)模型,存儲結(jié)果 xtreg gdp invest culture sci health admin techno,fe est store

25、fe 第二步:估計隨機效應(yīng)模型,存儲結(jié)果 xtreg gdp invest culture sci health admin techno,re est store re 第三步:進(jìn)行hausman檢驗 hausman fe,面板數(shù)據(jù)模型與stata應(yīng)用,Hausman檢驗量為: H=(b-B)Var(b)-Var(B)-1(b-B)x2(k) Hausman統(tǒng)計量服從自由度為k的2分布。當(dāng)H大于一定顯著水平的臨界值時,我們就認(rèn)為模型中存在固定效應(yīng),從而選用固定效應(yīng)模型,否則選用隨機效應(yīng)模型 如果hausman檢驗值為負(fù),說明的模型設(shè)定有問題,導(dǎo)致Hausman 檢驗的基本假設(shè)得不到滿足,遺漏

26、變量的問題,或者某些變量是非平穩(wěn)等等 可以改用hausman檢驗的其他形式: hausman fe, sigmaless,面板數(shù)據(jù)模型與stata應(yīng)用,對于固定效應(yīng)模型的異方差檢驗和序列相關(guān)檢驗: Xtserial gdp invest culture sci health admin techno 異方差檢驗: xtreg gdp invest culture sci health admin techno,fe xttest3 (Modified Wald statistic for groupwise heteroskedasticity in fixed effect model,面板

27、數(shù)據(jù)模型與stata應(yīng)用,隨機效應(yīng)模型的序列相關(guān)檢驗: xtreg gdp invest culture sci health admin techno,re Xttest1 Xttest1用于檢驗隨機效應(yīng)(單尾和雙尾) 、一階序列相關(guān)以及兩者的聯(lián)合顯著 檢驗結(jié)果表明存在隨機效應(yīng)和序列相關(guān),而且對隨機效應(yīng)和序列相關(guān)的聯(lián)合檢驗也非常顯著,面板數(shù)據(jù)模型與stata應(yīng)用,可以使用廣義線性模型xtgls對異方差和序列相關(guān)進(jìn)行修正: xtgls gdp invest culture sci health admin techno, panels(hetero),修正異方差 xtgls gdp invest culture sci h

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論