版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、面板數(shù)據(jù)計(jì)量分析白仲林第一講 面板數(shù)據(jù)因家庭得到的面板數(shù)據(jù)越來越多,面板數(shù)據(jù)的計(jì)量分析可以說是過去三十年應(yīng)用研究領(lǐng)域所取得的最重要的進(jìn)展。Fitzgerald, Gottschalk 和Moffitt(1998, P252)第一講 內(nèi)容面板數(shù)據(jù)面板數(shù)據(jù)的優(yōu)點(diǎn)與缺陷擴(kuò)展的面板數(shù)據(jù)面板數(shù)據(jù)線性回歸模型體系面板數(shù)據(jù)單因素誤差模型面板數(shù)據(jù)雙因素誤差模型第一節(jié) 面板數(shù)據(jù)1.1 面板數(shù)據(jù)“面板數(shù)據(jù)”一詞指的是一部分家庭、或企業(yè)等在一段時(shí)期內(nèi)的觀測值所的集合。這樣的數(shù)據(jù)可以通過在一段時(shí)期內(nèi)對一些家庭或進(jìn)行跟蹤來獲得。的截面觀測值,并且,從縱剖面看從橫截面看,面板數(shù)據(jù)是由若干在某一時(shí)點(diǎn)每個(gè)都是一個(gè)時(shí)間序列。1
2、978-2005 中國級地區(qū)消費(fèi)性占可支配收入比例走勢圖(張曉峒繪制)面板數(shù)據(jù)計(jì)量分析白仲林面板數(shù)據(jù)通常分為兩類:數(shù)據(jù)得到的面板數(shù)據(jù)通常被稱為微觀面板(micro panels)。由微觀面板數(shù)據(jù)的特點(diǎn)是數(shù) N 較大(通常是幾百或幾千個(gè)),而時(shí)期數(shù) T 較短(最少是 2 年,最長不超過 10 年或 20 年)。由一段時(shí)期內(nèi)不同的數(shù)據(jù)得到的面板數(shù)據(jù)通常被稱為宏觀面板(macro panels)。這類數(shù)據(jù)一般具有適度規(guī)模的N(從 7 到 100 或 200 不等,如七國,OECD,歐盟,發(fā)達(dá)或),時(shí)期數(shù) T 一般在 20 年到 60 年之間。因數(shù)據(jù)結(jié)構(gòu)上的區(qū)別,微觀面板和宏觀面板要求使用不同的計(jì)量方
3、法。 樣本容量的區(qū)別微觀面板必須研究 T 固定而 N 較大時(shí)的漸近特性,而宏觀面板的漸近特性則是指 T 和 N都較大時(shí)的情況。平穩(wěn)性對于宏觀面板,當(dāng)時(shí)間序列較長時(shí)需要考慮數(shù)據(jù)的非平穩(wěn)問題,如根、結(jié)構(gòu)突變以及協(xié)整等;而微觀面板不需要處理非平穩(wěn)問題,特別是每個(gè)家庭或相關(guān)性的時(shí)期數(shù) T 較短時(shí)。在處理宏觀面板時(shí)必須考慮之間的相關(guān)性,而在微觀面板中,如果是隨機(jī)抽樣產(chǎn)生,則之間不大可能存在相關(guān)性,因此不需要考慮此問題。1.2 為什么使用面板數(shù)據(jù)?它們的優(yōu)點(diǎn)和局限性1 面板數(shù)據(jù)的優(yōu)點(diǎn)使用面板數(shù)據(jù)具有下列一些好處:()可以面板數(shù)據(jù)能反映異質(zhì)性、企業(yè)、州或之間存在的異質(zhì)性,即時(shí)間上和空間上的異質(zhì)效這種異質(zhì)性,
4、因而其結(jié)果很可能是有偏的。應(yīng)。而時(shí)間序列數(shù)據(jù)和橫截面分析沒有例如,Baltagi 和 Levin(1992)研究 1963-88 年美國 46 個(gè)州的香煙需求問題時(shí),設(shè)定需求模型Ditf (Di,t -1advt ")=pitIitreliiedui則模型中解釋變量包括兩大類可觀測的和不可觀測的,可分為如下四種:z第一類是可觀測的時(shí)變異質(zhì)因素,即,隨(州)和時(shí)間的變化而變化的可觀測變量,如香煙消費(fèi)量的滯后項(xiàng)、價(jià)格和收入等可觀測的變量;z第二類是隨(州)變化而不隨時(shí)間變化的可觀測變量,如(religion)和教育等變量,即可觀測的非時(shí)變異質(zhì)因素;z第三類是不隨(州)變化而隨時(shí)間變化的可
5、觀測變量,如電視和廣播中的等變量,即可觀測的時(shí)變同質(zhì)因素;最后一類是一些不可觀測變量,它們包括三種zu 非時(shí)變異質(zhì)性不可觀測因素( xi )效應(yīng)u 時(shí)變同質(zhì)性不可觀測因素( lt )時(shí)間效應(yīng)面板數(shù)據(jù)計(jì)量分析白仲林u 時(shí)變異質(zhì)性不可觀測因素( uit )剩余效應(yīng)這樣,模型可設(shè)定為Ditf (Di,t-1eduiadvt ) + xi + lt + uit=pitIitrelii事實(shí)上,對于變量,人們不可能得到每年每個(gè)州某一人數(shù)占總?cè)丝诘陌俜直?,所以一般認(rèn)為不同年份的百分比也有太大變化。同樣,完成高中或大學(xué)學(xué)業(yè)的人數(shù)占總?cè)丝诘陌俜直纫彩侨绱?。電視和廣播中的同而變化。是性的,它對需求的影響隨著州的不
6、顯然,遺漏第四類中任何一種不可觀測因素就會(huì)導(dǎo)致估計(jì)結(jié)果的偏倚,面板數(shù)據(jù)模型能夠基于這四類中的所有變量建模,而純時(shí)間序列和橫截面分析就無法做到。另外,Hajivassiliou(1987)給出了一個(gè)宏觀的面板數(shù)據(jù)研究了外債償付問題。這些的例子,他使用 1970-82 年 79 個(gè)發(fā)展中和在殖民歷史、金融機(jī)構(gòu)、信仰等方面存在差異,所有這些反映特征的特定變量都會(huì)影響它們在借債或拖欠方面的態(tài)度,同時(shí)也會(huì)影響債權(quán)國對待它們的方式。如果不考慮這些出現(xiàn)嚴(yán)重的設(shè)定錯(cuò)誤。(2)面板數(shù)據(jù)模型容易避免多重共線性問題之間的異質(zhì)性就會(huì)zzzz面板數(shù)據(jù)具有的信息;面板數(shù)據(jù)具有更大的變異;面板數(shù)據(jù)的變量間更弱的共線性;面板
7、數(shù)據(jù)模型具有更大的自由度以及更高的效率。時(shí)間序列研究中令人煩惱的問題之一是多重共線性;比如在上述香煙需求的研究中,如果從總量的角度看價(jià)格和收入就具有很強(qiáng)的共線性,而使用美國各州的面板數(shù)據(jù),存在共線性的可能就很小了,因?yàn)樵黾咏孛鎯r(jià)格和收入的信息。維度的同時(shí)也增加了數(shù)據(jù)的變異,也增加了有關(guān)事實(shí)上,數(shù)據(jù)中的變異可以分為兩個(gè)部分,一是州與州之間由于規(guī)模和特征的不同所表現(xiàn)出的變異性;二是各州內(nèi)部不同時(shí)間上表現(xiàn)出的變異性,前者的變異程度往往更大。使用、更有信息的數(shù)據(jù)就可以得到更可靠的參數(shù)估計(jì)值。當(dāng)然,這要求不同州的變量間應(yīng)具有相同的關(guān)系式,換句話說,這要求數(shù)據(jù)是可混合的(poolable)。(3)面板數(shù)據(jù)
8、更適合于研究動(dòng)態(tài)調(diào)整過程面板數(shù)據(jù)適用于研究失業(yè)、貧困等狀態(tài)的持續(xù)性問題的研究。如果這些面板數(shù)據(jù)的時(shí)期數(shù)足夠長,它們就能夠清楚地反映對政策變化的調(diào)整速度。比如,在衡量失業(yè)問題時(shí),橫截面數(shù)據(jù)可以估計(jì)出人口中多大一部分比例在給定的時(shí)間處于失業(yè)狀態(tài),多個(gè)截面可以表明這一比例如何隨時(shí)間而變化。但是,只有面板數(shù)據(jù)才能估計(jì)出在某個(gè)時(shí)期失業(yè)人中有多大一部分在另一個(gè)時(shí)期仍處于失業(yè)狀態(tài)。Deaton(1995)指出,與橫截面不同,面板可以獲得家庭或變化的數(shù)據(jù)。它可以使我們觀測到生活標(biāo)準(zhǔn)在發(fā)展過程中如何變化;可以使我們確定誰從發(fā)展中受益;而且還可以使我們觀測到 “在收入動(dòng)態(tài)變化中,貧困到底是暫時(shí)性的還是長期的狀態(tài)。
9、”面板數(shù)據(jù)計(jì)量分析白仲林由于面板數(shù)據(jù)可以將在某個(gè)時(shí)點(diǎn)的經(jīng)歷和行為與另一個(gè)時(shí)點(diǎn)的其他經(jīng)歷和行為起來,因此,面板數(shù)據(jù)在估計(jì)短期關(guān)系、生命周期模型和代際模型時(shí)也是必需的。(4)面板數(shù)據(jù)還可以識(shí)別、測量單純使用橫截面或時(shí)間序列數(shù)據(jù)無法估計(jì)的影響。 對于由婦女組成的橫截面樣本,其中年平均就業(yè)率是 50%. 這可能是由于下面兩種導(dǎo)致的:(a)每個(gè)婦女在任一給定年份有 50%的概率就業(yè);(b)樣本中有 50%的人一直有工 作,50%的人根本不工作。情況(a)中的工作轉(zhuǎn)換頻率很高,而情況(b)中沒有工作轉(zhuǎn)換,只有使用面板數(shù)據(jù)才能區(qū)分這兩種情況。(5)與純橫截面數(shù)據(jù)或時(shí)間序列數(shù)據(jù)相比,面板數(shù)據(jù)模型為模型。構(gòu)建并
10、檢驗(yàn)更復(fù)雜的行比如,對技術(shù)效率問題使用面板數(shù)據(jù)建模研究效果更好(Baltagi 和 Griffin,1988;Baltagi, Griffin 和 Rich,1995;Koop 和 Steel,2001)。另外,在分布滯后模型中使用面板數(shù)據(jù)比使用純時(shí)間序列數(shù)據(jù)需要的約束條件更少(Hsiao,2003),因?yàn)橥ǔJ褂?GMM 估計(jì)。(6)基于、企業(yè)或家庭所搜集的微觀面板數(shù)據(jù)與在宏觀層次上所搜集的類似變量相比更加準(zhǔn)確,而且還可能消除企業(yè)或(7)例如,與時(shí)間序列分析中進(jìn)行根檢驗(yàn)通常具有標(biāo)準(zhǔn)的漸近分布。數(shù)據(jù)匯總所導(dǎo)致的偏倚。根檢驗(yàn)遇到的非標(biāo)準(zhǔn)分布問題不同,面板2 面板數(shù)據(jù)的局限性面板數(shù)據(jù)的局限性包括:
11、(1)微觀面板數(shù)據(jù)極少Kasprzyk 等(1989)詳細(xì)討論了有關(guān)設(shè)計(jì)面板、數(shù)據(jù)收集和數(shù)據(jù)管理的問題。這些問題包括:覆蓋面問題(樣本沒覆蓋研究總體)、不響應(yīng)問題(由于回答者不合作或提問者的)、回憶問題(回答者的記憶時(shí)間問題和樣本期內(nèi)偏倚問題。確)、采訪的頻率問題、采訪的時(shí)間間隔問題、詢問的(2)測量誤差的扭曲(distortions)嚴(yán)重在面板數(shù)據(jù)被者,錯(cuò)誤(3)面板數(shù)據(jù)中,問題不清晰,記憶錯(cuò)誤,故意歪曲回答(例如威望偏倚),不合適的回答者的應(yīng)答以及采訪者的影響等導(dǎo)致出現(xiàn)嚴(yán)重的測量誤差。的樣本選擇問題z自選擇例如,由于個(gè)人保留工資高于工作工資,人們通常選擇不去工作。在這種情況下,觀測到的只是
12、這些人的特征,而觀測不到他們的保留工資。由于他們的工資數(shù)據(jù),產(chǎn)生刪失樣本。但是,如果這些人的所有數(shù)據(jù)都不可觀測,這就成為一個(gè)截?cái)鄻颖?。因此,面板?shù)據(jù)容易產(chǎn)生樣本的選擇有偏性。z未回答面板數(shù)據(jù)容易產(chǎn)生單項(xiàng)(或部分)未回答或完全未回答。這時(shí),除了由于數(shù)據(jù)導(dǎo)致的效率損失之外,面板數(shù)據(jù)中的未回答還可以導(dǎo)致嚴(yán)重的總體參數(shù)識(shí)別問題。z非隨機(jī)樣本流失在面板數(shù)據(jù)的隨后,由于對象的非隨機(jī)(如,低收入?yún)^(qū)域向高收入?yún)^(qū)面板數(shù)據(jù)計(jì)量分析白仲林,會(huì)產(chǎn)生對象的嚴(yán)重流失。Fitzgerald 等域的)或發(fā)現(xiàn)回答的成本過高等(1998)指出,面板數(shù)據(jù)使用價(jià)值的最大潛在威脅是有偏性流失。Lillard 和 Panis(1998)
13、研究發(fā)現(xiàn),PSID 的樣本流失有很強(qiáng)的選擇性。例如,受教育程度較低的以及較大的最容易從樣本中剔除,而已婚的人繼續(xù)留在樣本內(nèi)的可能性較大。被者在樣本內(nèi)的時(shí)期越長,繼續(xù)參與的傾向就越小。在歐洲,(第一次和第二次之間的)樣本流失率從意大利的 6%到英國的 40%不等。平均的樣本流失率大約是 10%. 為了解決樣本非隨機(jī)流失的影響,人們逐漸使用輪換面板(rotating panel)和偽面板(pseudo-panel)。(4)時(shí)間維度短微觀面板通常是年度數(shù)據(jù),每個(gè)行漸近統(tǒng)計(jì)分析。(5)截面相關(guān)性的時(shí)期數(shù)較短。因此,主要依賴數(shù)趨于無窮進(jìn)或地區(qū)的宏觀面板數(shù)據(jù),如果時(shí)間序列較長而且沒有考慮到之間的相關(guān)性就會(huì)
14、導(dǎo)致錯(cuò)誤的推斷結(jié)論。事實(shí)上,考慮截面相關(guān)非常重要,而且會(huì)影響到統(tǒng)計(jì)推斷的結(jié)論。為此,人們也提出了考慮這種相關(guān)性的面板根檢驗(yàn)方法。1.3 擴(kuò)展的面板數(shù)據(jù)1 偽面板數(shù)據(jù)1985 年,Deaton(1985)指出“由于統(tǒng)計(jì)的樣本輪換和樣本非隨機(jī)流失問題,絕大多數(shù)并不存在較長時(shí)間跨度的真正面板數(shù)據(jù),或者這樣的真正面板數(shù)據(jù)是難以獲得的,對于的微觀變量尤其如此。”并且,Deaton 發(fā)現(xiàn)“雖然某變量的統(tǒng)計(jì)抽樣不能連續(xù)到各的觀測數(shù)據(jù),但是,如果按照某種屬性(例如,、職業(yè)和等)將各期對象分成不同的群(Cohort);對于各個(gè)觀測期,選擇各群內(nèi)觀測數(shù)據(jù)的均值(中位數(shù)或分位數(shù)),即可構(gòu)造以群為的面板數(shù)據(jù)”。于是,
15、對于截面時(shí)間序列的統(tǒng)計(jì)數(shù)據(jù),基于某種屬性分群,稱以群為而構(gòu)造的人工面板數(shù)據(jù)為偽面板數(shù)據(jù)(Pseudo Panel Data)。眾所周知,面板數(shù)據(jù)的本質(zhì)是在觀測期內(nèi)的每期都能觀測到相同的相關(guān)數(shù)據(jù),然而,偽面板顯然并非如此。在觀測期內(nèi),它每期觀測的不同,并且重點(diǎn)關(guān)注的是群的統(tǒng)計(jì)特征,即通過群均值和群方差的發(fā)展變化,來揭示相關(guān)變量的總體分布特征。例如,為了基于城市住戶抽樣數(shù)據(jù)研究城市居民收入的動(dòng)態(tài)行為,常見的分群標(biāo)準(zhǔn)是戶主段、戶主出生年的區(qū)間和戶主職業(yè)類別。戶主按出生年的區(qū)間分群,在各觀測期,同群中的不同家庭都是戶主在同一出生年區(qū)間的家庭,不同群的家庭是戶主在不同出生年區(qū)間的家庭。如,對于 1963
16、-1967 年出生的群,在 1988 年時(shí),該群內(nèi)的家庭是戶主為 21-25 歲的家庭;時(shí),該群內(nèi)的家庭是戶主為 22-26 歲的家庭;依此類推,2008 年時(shí),該群內(nèi)的家庭是戶主為 41-45 歲的家庭。然后,在各年,對該群群內(nèi)的家庭人均收入求均值。這樣,對于 1963-1967 年出生的群,可得到該群的人均收入時(shí)間序列。于是,對于不同的群就可構(gòu)造一個(gè)關(guān)于家庭人均收入的面板數(shù)據(jù),稱之為按出生年分群的家庭人均收入偽面板數(shù)據(jù)計(jì)量分析白仲林面板數(shù)據(jù)。類似地,也可以構(gòu)造按段分群的人均收入偽面板數(shù)據(jù)。應(yīng)用群體分析方法得到的偽面板數(shù)據(jù)還具有以下優(yōu)點(diǎn)。一是偽面板數(shù)據(jù)是由各群群內(nèi)個(gè)體屬性的總體統(tǒng)計(jì)量組成,與
17、一般面板中的數(shù)據(jù)相比,前者消除了的測量誤差,且避免了樣本流失。二是由于不需要在每期中追蹤固定的,這樣可得到更長時(shí)間跨度的數(shù)據(jù)。但是,也產(chǎn)生了新的問題,例如,無意義的效應(yīng)、滯后數(shù)據(jù)的不可觀測。2 輪換面板因?yàn)橥粋€(gè)家庭可能不愿被一次又一次的被回訪,為了保持中家庭數(shù)目相同,在第二期中的部分家庭,被相同數(shù)目的新的家庭所替代,這在獲得面板數(shù)據(jù)時(shí)是必要的。Biorn(1981)研究了這種輪換面板的情況。在 Biorn 和 Jansen(1983)的研究中,他們基于挪威家庭預(yù)算的數(shù)據(jù),其中一半的樣本在每次中被輪換掉。換句話說,就是每一期的樣本中將有一半家庭,并被新的家庭替代。假設(shè)T = 2 ,并且每期中有
18、一半的樣本被輪換,在這種情況下,不失一般性,在第 2期,家庭 1, 2,", N / 2 被家庭 N +1, N + 2,", N + N / 2 所替代,很明顯,只有家庭N /2 +1, N /2 + 2,", N 被觀測了兩期。這個(gè)例子中有3N / 2 個(gè)不同的家庭,只有 N /2 個(gè)家庭被觀測了兩期。最初和最后的 N /2 個(gè)家庭只被觀測了一期。研究者檢驗(yàn) “抽樣時(shí)間(time-in-sample)”偏倚效應(yīng)的存在性。“抽樣時(shí)間”輪換面板偏倚是指初次采訪和隨后的采訪之間的回答有顯著的改變。對于輪換面板,每批加到面板的新組提供了檢驗(yàn)抽樣時(shí)間偏倚效應(yīng)的方法。例如
19、,Solon(1986)等研究發(fā)現(xiàn)第一次輪換所報(bào)告的失業(yè)率比基于全樣本的失業(yè)率高出10 個(gè)百分點(diǎn)。這些發(fā)現(xiàn)表明在面板數(shù)據(jù)中普遍存在著輪換組偏倚效應(yīng),而實(shí)踐中條件并沒有保持不變,因而很難把抽樣時(shí)間偏倚效應(yīng)同其他效應(yīng)區(qū)。3 空間面板數(shù)據(jù)在水平的隨機(jī)抽樣樣本中,人們很少擔(dān)心截面之間的相關(guān)性。然而,當(dāng)考慮,地區(qū),州,縣等相關(guān)截面數(shù)據(jù)時(shí),這些總量可能表現(xiàn)出必須處理的截面相關(guān)性。現(xiàn)在有大量運(yùn)用空間數(shù)據(jù)的文獻(xiàn)處理這種相關(guān)性。這種空間相依模型在區(qū)域科學(xué)和城市學(xué)中比較普遍。具體來說,這些模型使用距離測度設(shè)定了面板數(shù)據(jù)的空間自相關(guān)性和空間結(jié)構(gòu)(空間異質(zhì)性),這方面文獻(xiàn)的詳盡介紹可以參見 Anselin(1988,
20、 2001)。近年來,在中,空間面板模型變得越來越有吸引力。學(xué)的在包含空間誤差自相關(guān)和空間滯后被解釋變量的情形下,Elhorst(2003)討論了固定效應(yīng)和隨機(jī)效應(yīng)面板數(shù)據(jù)模型的 ML 估計(jì)。他們也對隨機(jī)系數(shù)模型作了相應(yīng)的擴(kuò)展。在包含空間誤差自相關(guān),或者空間滯后被解釋變量的情形下,Elhorst(2005)研究了固定效應(yīng)動(dòng)態(tài)面板數(shù)據(jù)模型的估計(jì)。4 計(jì)數(shù)面板數(shù)據(jù)被解釋變量是計(jì)數(shù)面板數(shù)據(jù)的例子很多。例如,一段時(shí)間內(nèi)一家公司的竟標(biāo)次數(shù)、一個(gè)面板數(shù)據(jù)計(jì)量分析白仲林人去看醫(yī)生的次數(shù)、每天吸煙者的數(shù)量及一個(gè)研發(fā)機(jī)構(gòu)登記專利的數(shù)目。雖然可以運(yùn)用傳統(tǒng)面板回歸模型對計(jì)數(shù)面板數(shù)據(jù)建模,但鑒于被解釋變量具有 0 及
21、非負(fù)離散取值的特征,運(yùn)用泊松面板回歸模型建模更為合適。在計(jì)數(shù)面板數(shù)據(jù)的文獻(xiàn)中,盡管泊松模型設(shè)定非常流行,但由于其均值與方差相等的性質(zhì)而備受批評。在實(shí)證分析中更常見的是過度離差的情形。為了對過度離差建模,經(jīng)常設(shè)定數(shù)據(jù)服從負(fù)二項(xiàng)分布,Hausman.(1984)研究了負(fù)二項(xiàng)分布面板數(shù)據(jù)模型。而且,負(fù)二項(xiàng)分布面板數(shù)據(jù)模型也能夠在 Stata 軟件 xtpoisson,fe and re 軟件包中實(shí)現(xiàn)。然而,面板數(shù)據(jù)不是靈丹妙藥,它并不能解決時(shí)間序列或橫截面研究中解決不了的所有問題。例如,面板根檢驗(yàn)比單一時(shí)間序列的根檢驗(yàn)功效更高,這應(yīng)該能更好地推斷力平價(jià)(PPP)和增長收斂問題。事實(shí)上,在導(dǎo)致大量經(jīng)驗(yàn)
22、應(yīng)用研究的同時(shí),也引來了一些批評,Maddala(1999)和Banerjee 等(2004,2005)認(rèn)為面板數(shù)據(jù)也不能解決 PPP 以及增長收斂的問題。面板數(shù)據(jù)計(jì)量分析白仲林第二節(jié) 面板數(shù)據(jù)回歸模型2.1 面板數(shù)據(jù)回歸模型的一般形式面板數(shù)據(jù)模型的一般形式如下:Kyit = åbkit xkit + uitk =1(2.1)其中, i = 1,2,3,", N ,表示 N個(gè); t = 1,2,3,",T ,表示已知的 T 個(gè)時(shí)點(diǎn)。 yit 是被解釋變量對i 在 t 時(shí)的觀測值;xkit 是第 k 個(gè)非隨機(jī)解釋變量對于i 在 t 時(shí)的觀測值;bkit是待估計(jì)的參數(shù)
23、; uit 是隨機(jī)誤差項(xiàng)。特別,當(dāng)回歸系數(shù)只與有關(guān),不隨時(shí)間變化時(shí),即, bkit = bki 時(shí),模型(2.1)可用矩陣表示為Yi = Xi i + Ui( i = 1,2,3,", N )(2.1)é b1i ùé yi1 ùxKi1 ùéui1 ùê y úúêu úê b úx= êi 2 úKi 2 ú= ê2i ú= êi 2 ú, X =其中, Y, U,.
24、34;úêúêúiê # úi#i#"#i#ê y úúêu úêb úxëiT ûT ´1KiT ûT ´K ëKi û K ´1ëiT ûT ´12.2 面板數(shù)據(jù)回歸模型的分類通常,對模型(2.1)將做許多限制性假設(shè),使其成為不同類型的面板數(shù)據(jù)回歸模型。一般來說,常用的面板數(shù)據(jù)回歸模型有如下九種模型,下面分別介紹它們。1 混合回歸模型
25、從時(shí)間上看,不同之間不存在顯著性差異;從截面上看,不同截面之間也不存在顯著性差異,那么就可以直接把面板數(shù)據(jù)混合在一起,用普通最小二乘法(OLS)估計(jì)參數(shù)。即估計(jì)模型K i.i.d (0s 2 )y = b + å bx+ u, u(2.2)it1k kitititk =2Y = X b + U(2.2)面板數(shù)據(jù)計(jì)量分析白仲林é b1 ùé Y1 ùé X1 ùé U1 ùêY úê X úêU úê b ú= ê2
26、ú= ê2 ú, = ê2 ú, U = ê2 ú其中, Y, X.êúêúêúê # ú#êúêúêúêúbYXUëN û NT ´1ëN ûNT ´K ëK û K ´1ëN û NT ´1例如:如果勞動(dòng)力市場、市場和商品市場是有效的,那么,在和
27、各地區(qū)()技術(shù)效率相同的假設(shè)下,根據(jù)各地區(qū)的面板數(shù)據(jù)利用 Cobb-Dauglas 生產(chǎn)函數(shù)估計(jì)勞動(dòng)和對產(chǎn)出的貢獻(xiàn)時(shí),可以將模型設(shè)定為混合回歸模型。實(shí)際上,混合回歸模型(Pooled Regression Ms)假設(shè)了解釋變量對被解釋變量的影響與無關(guān)。模型中的解釋變量部分表示可觀測同質(zhì)時(shí)變效應(yīng)、而且同分布的誤差項(xiàng)(不可觀測的時(shí)變異質(zhì)性)也未包含不可觀測的非時(shí)變異質(zhì)性和同質(zhì)的時(shí)變效應(yīng)。因此,混合模型不僅不能體現(xiàn)模型數(shù)據(jù)的信息優(yōu)勢,而且對實(shí)際問題進(jìn)行了嚴(yán)格的約束(如, Cobb-Dauglas 生產(chǎn)函數(shù)中技術(shù)不變的假設(shè))。盡管混合回歸模型在早期被廣泛應(yīng)用,但是,在許多問題的研究中,混合回歸模型并不
28、適用(Mairesse & Griliches,1990)。2 單因素效應(yīng)模型所謂單因素效應(yīng)模型,就是在模型中考慮了不可觀測非時(shí)變()異質(zhì)效應(yīng),或者,考慮了不可觀測時(shí)變()同質(zhì)效應(yīng)的模型,因此,單因素效應(yīng)模型分為模型和時(shí)間單因素效應(yīng)模型兩類。單因素效應(yīng)(1)單因素效應(yīng)模型在面板數(shù)據(jù)線性回歸模型中,如果在混合模型中添加了反映不可觀測非時(shí)變的(異質(zhì)效應(yīng)項(xiàng),即稱模型)Kx+ x + u , u i.i.d (0s 2 )y = a + åb(2.3)itk kitiititk =2為單因素效應(yīng)模型,矩陣形式為) +UY = aiNI Äi(2.3)=(1,1)'
29、的克羅內(nèi)克積,其中, I Äi矩陣 I 和 T 階列向量i",是 N 階NTNTé x1 ùé b2 ùùúúúé X1 ù""""2ê x úê X úê b ú= ê2 ú, b = ê3 úx = ê2 ú, X =, X.êúêêêúê
30、50;i#úê X úêb úêx úxKiT ûT ´( K -1)ëN û NT ´( K -1)ëK û( K -1)´1 ëN ûN ´1iTiT類似地,如果勞動(dòng)力市場、市場和商品市場是有效的,那么,在假設(shè)下,根據(jù)各地區(qū)的面板數(shù)據(jù)利用 Cobb-Dauglas 生產(chǎn)函數(shù)估計(jì)勞動(dòng)和對產(chǎn)出的貢獻(xiàn)時(shí),可以將模型設(shè)定為單因素效應(yīng)模型。這時(shí)各地區(qū)()的技術(shù)效率不同。顯然,與混合回歸模型比較,異質(zhì)性對模型參數(shù)估計(jì)的影響。
31、單因素效應(yīng)模型更合意,它了不可觀測的非時(shí)變變的全球技術(shù)進(jìn)步非時(shí)非時(shí)變同質(zhì)效應(yīng)的平均水平,截距項(xiàng)反映了不可觀測的全球技術(shù)進(jìn)步非時(shí)變面板數(shù)據(jù)計(jì)量分析白仲林(2)時(shí)間單因素效應(yīng)模型類似地,在面板數(shù)據(jù)線性回歸模型中,如果在混合模型中添加了反映不可觀測的時(shí)變(個(gè)體)同質(zhì)效應(yīng)項(xiàng),即稱模型Kx+ l + u ,u i.i.d (0s 2 )y = a + åb(2.4)itk kittititk =2為時(shí)間單因素效應(yīng)模型,矩陣形式為)l +UY = aiNi Ä I(2.4)Ä IT 是 N 階列向量iN = (1,1)' 和 T 階",矩陣 IT 的克羅內(nèi)克
32、積,其中,Né l1 ùé b2 ù""""ùúúúé X1 ù2ê X úê b úêl úl = ê2 ú= ê2 ú, b = ê3 ú, X =, X.êêêúêúê # úi#úê X úêb ú
33、234;l úxëT ûT ´1KiT ûT ´( K -1)ëN û NT ´( K -1)ëK û( K -1)´1 iTiT類似地,如果勞動(dòng)力市場、市場和商品市場是有效的,那么,在各地區(qū)()技假設(shè)下,根據(jù)各地區(qū)的面板數(shù)據(jù)利用 Cobb-Dauglas 生產(chǎn)函數(shù)估計(jì)勞動(dòng)和對產(chǎn)出的貢獻(xiàn)時(shí),可以將模型設(shè)定為時(shí)間單因素效應(yīng)模型。這時(shí)全球技術(shù)進(jìn)步是時(shí)變。顯然,與混合回歸模型比較,時(shí)間單因素效應(yīng)模型更合意,它質(zhì)性對模型參數(shù)估計(jì)的影響。(3)固定效應(yīng)和隨機(jī)效應(yīng)固定效應(yīng)模型了不可觀測的
34、時(shí)變同對于單因素效應(yīng)模型,為了估計(jì)單因素效應(yīng),可以將它們設(shè)定為確定性因素,并且,對所有的 i 和 t,假定 Xit 與uit 是相互的,這時(shí),單因素效應(yīng)模型被稱為固定效應(yīng)模型。實(shí)際上,只要結(jié)論被限定是所研究行為的時(shí)候,即我們要做出的推斷是基于樣本個(gè)體,那么,固定效應(yīng)模型是一個(gè)合適的設(shè)定。顯然,對于固定效應(yīng)模型(individual fixed effects regression m),為了估計(jì)效應(yīng),估計(jì)時(shí)需要添加 N 個(gè)虛擬變量,其取值矩陣為( IT ÄiN ) ;對于時(shí)間固定效應(yīng)模型(timefixed effects regression m矩陣為(iN Ä IT )
35、 .),為了估計(jì)時(shí)間效應(yīng),估計(jì)時(shí)需要添加 T 個(gè)虛擬變量,其取值另外,Mundlak(1978)認(rèn)為單因素固定效應(yīng)模型所有的解釋變量是內(nèi)生的。Hausman和 Taylor(1981)也指出固定效應(yīng)模型一些解釋變量和單因素效應(yīng)是可以相關(guān)的。例如,在收入方程中,i 可能代表不可觀測的個(gè)人能力,它可能與方程右邊的受教育變量相關(guān)。Chamberlain(1984)表明固定效應(yīng)模型對所有被解釋變量的超前和滯后項(xiàng)關(guān)于解釋變量的超前和滯后項(xiàng)的回歸系數(shù)施加了可檢驗(yàn)的約束。因此,在采用固定效應(yīng)模型之前應(yīng)該檢驗(yàn)這些約 束條件的有效性,例如,Hausman 檢驗(yàn)和 Chamberlain 檢驗(yàn)(見 Baltagi
36、,2008,chapter 4)。事實(shí)上,固定效應(yīng)模型和隨機(jī)效應(yīng)模型的問題曾經(jīng)在生物計(jì)量學(xué)和統(tǒng)計(jì)學(xué)文獻(xiàn)中產(chǎn)生了術(shù)效率相同的面板數(shù)據(jù)計(jì)量分析白仲林熱烈的爭論,并且已經(jīng)延伸到使用面板數(shù)據(jù)的計(jì)量學(xué)文獻(xiàn)中。Mundlak(1961)和 Wallace和 Hussain(1969)是固定效應(yīng)模型的早期擁護(hù)者,而 Balestra 和 Nerlove(1966)則是隨機(jī)單因素誤差模型的支持者。因此,使用固定效應(yīng)模型存在面的缺陷: 如果不可觀測的非時(shí)變異質(zhì)性效應(yīng)(單因素效應(yīng))或者不可觀測的時(shí)變同質(zhì)性效應(yīng)(時(shí)間單因素效應(yīng))與不可觀測的時(shí)變異質(zhì)性效應(yīng)(誤差項(xiàng))相關(guān)時(shí),OLS 估計(jì)量是有偏的; 固定效應(yīng)模型的參數(shù)
37、太多,影響估計(jì)自由度; 固定效應(yīng)模型的結(jié)論僅適用于樣本內(nèi),不能對樣本外的固定效應(yīng)模型的估計(jì)行為進(jìn)行推斷。對于固定效應(yīng)模型可以采用在模型中加虛擬變量的方法估計(jì)回歸參數(shù),并稱其估計(jì)值為LSDV 估計(jì)(The Least Square Dummy Variable Estimation)。也可以基于組內(nèi)離差數(shù)據(jù)的最小二乘法估計(jì)固定效應(yīng)模型參數(shù),簡記為組內(nèi)估計(jì)。隨機(jī)效應(yīng)模型對于單因素效應(yīng)模型,如果不關(guān)注單因素效應(yīng),僅關(guān)心解釋變量的效應(yīng)時(shí),可假定單因素效應(yīng) i(或者,時(shí)間單因素效應(yīng) t)是隨機(jī)的,這樣以來,在固定效應(yīng)模型中存在的OLS 估計(jì)量有偏、自由度損失過多和結(jié)論不能對樣本外的以避免。即行為進(jìn)行推斷
38、的三個(gè)問題就可對于單因素效應(yīng)模型K= a + å bk xkit + xi + uityitk =2 i.i.d (0s)u i.i.d (0s 2 ),i 與u 相互如果x2;并且,對于所有的 i 和 t,xiititXit 與 i 和uit 也相互,則稱該模型為隨機(jī)效應(yīng)模型。顯然,當(dāng) N 個(gè)樣本定。例如,基于 OECD是隨機(jī)抽樣于一個(gè)總體時(shí),那么隨機(jī)效應(yīng)模型就是一個(gè)恰當(dāng)?shù)脑O(shè)的數(shù)據(jù),推斷普遍適用的理論時(shí),就可以設(shè)定隨機(jī)效應(yīng)模型。類似地,對于時(shí)間單因素效應(yīng)模型K= a + å bk xkit + lt + uityitk =2如果l i.i.d (0s, u i.i.d (
39、0s 2 ),t 與u)2相互;并且,對于所有的 i 和 t,ltititXit 與 t 和uit 也相互,則稱該模型為時(shí)間隨機(jī)效應(yīng)模型。對于隨機(jī)效應(yīng)模型可以采用可行的廣義最小二乘法(FGLS)估計(jì)模型參數(shù)。3 雙因素效應(yīng)模型所謂雙因素效應(yīng)模型,就是在模型中既考慮了不可觀測非時(shí)變的()異質(zhì)效應(yīng),又考慮了不可觀測時(shí)變()同質(zhì)效應(yīng)的模型。面板數(shù)據(jù)計(jì)量分析白仲林Kx+ x + l + u ,u i.i.d (0s 2 )y = a + åb(2.5)itk kititititk =2其矩陣表示為)x + (iN Ä IT ) l + UY = aiN+Äi(2.5)效應(yīng)
40、 i 和時(shí)間效類似地,雙因素效應(yīng)模型也有固定效應(yīng)和隨機(jī)效應(yīng)之分,如果設(shè)定應(yīng) t 是確定的,就是雙因素固定效應(yīng)模型;如果設(shè)定效應(yīng) i 和時(shí)間效應(yīng) t 是隨機(jī)的,就是雙因素隨機(jī)效應(yīng)模型。在實(shí)際應(yīng)用時(shí),模型的正確設(shè)定必須進(jìn)行相關(guān)的統(tǒng)計(jì)檢驗(yàn)。4 變系數(shù)模型確定系數(shù)面板數(shù)據(jù)模型在面板數(shù)據(jù)模型(2.1)中,如果解釋變量對被解釋變量的影響隨著確定性參數(shù)時(shí),稱模型(2.1)為確定系數(shù)面板數(shù)據(jù)模型。的變化是不同的確定系數(shù)面板數(shù)據(jù)模型的矩陣形式為 Zellner(1962)的似不相關(guān)回歸模型(SeeminglyUnrelated Regressions)Y = X b + U(2.10)é b1i
41、249;é b1 ùé X1ê 00""%000#ùúúúêb úê b úX#0= ê= ê2i ú, b = ê2 ú, b其中, X2êêúêú#i#ê 0úê b úêb úXëN û NT ´ NKëki ûK ´1ëN ûKN ´15 隨機(jī)系數(shù)面板數(shù)據(jù)模型面板數(shù)據(jù)模型(2.1)揭示了不同的相同現(xiàn)象,于是,如果 N 個(gè)是從某個(gè)總體隨機(jī)抽取的一個(gè)樣本時(shí),面板數(shù)據(jù)模型(2.1)的參數(shù)列向量 bi 就是隨機(jī)向量。另外,如間是空間相關(guān)時(shí),面板數(shù)據(jù)模型(2.1)的 N 個(gè)參數(shù)列向量的集合bi |i = 1,2,", N 可果以被看成是同一個(gè)總體的 N 個(gè)樣本。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《水力空化技術(shù)在處理四環(huán)素廢水中的應(yīng)用研究》
- 《湖北裕國股份全產(chǎn)業(yè)鏈發(fā)展模式的財(cái)務(wù)績效研究》
- 《機(jī)械臂混雜場景動(dòng)態(tài)路徑規(guī)劃與多目標(biāo)識(shí)別研究》
- 2025版酒店客房客房清潔設(shè)備租賃承包合同模板3篇
- 有數(shù)電模電的課程設(shè)計(jì)
- 2025版能源項(xiàng)目擔(dān)?;刭徍献鲄f(xié)議書3篇
- 二零二五年度EPS構(gòu)件裝配式建筑構(gòu)件供應(yīng)與施工合同3篇
- 種苗繁育課程設(shè)計(jì)方案
- 2025版掘進(jìn)機(jī)操作培訓(xùn)及現(xiàn)場安全監(jiān)督服務(wù)合同3篇
- 電工電子技術(shù)課程設(shè)計(jì)
- 2025屆內(nèi)蒙古赤峰市、呼和浩特市高考考前模擬物理試題含解析
- 三年級數(shù)學(xué)(上)計(jì)算題專項(xiàng)練習(xí)附答案
- 中等職業(yè)學(xué)?!稒C(jī)械制造工藝基礎(chǔ)》課程標(biāo)準(zhǔn)
- 臨床醫(yī)學(xué)內(nèi)科學(xué)消化系統(tǒng)疾病教案脂肪性肝病教案
- 2024年江蘇省南通市中考英語試卷(含答案解析)
- 期末練習(xí)(試題)-2024-2025學(xué)年譯林版(三起)(2024)英語三年級上冊
- 成人中心靜脈導(dǎo)管(CVC)堵塞風(fēng)險(xiǎn)評估及預(yù)防-2024團(tuán)體標(biāo)準(zhǔn)
- DL∕T 5342-2018 110kV~750kV架空輸電線路鐵塔組立施工工藝導(dǎo)則
- 安全治本攻堅(jiān)三年行動(dòng)方案及重大事故隱患會(huì)議紀(jì)要(完整版)
- 部編版小升初語文必考點(diǎn)集訓(xùn)-文言文專練(2)(含參考譯文及答案)
- 湖南省益陽市2023-2024學(xué)年九年級上學(xué)期期末物理試卷
評論
0/150
提交評論