版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、BaltagiBaltagi著著 白仲林主譯白仲林主譯第一節(jié)第一節(jié) 面板數(shù)據(jù)的基本問題面板數(shù)據(jù)的基本問題第二節(jié)第二節(jié) 面板數(shù)據(jù)的模型形式面板數(shù)據(jù)的模型形式第三節(jié)第三節(jié) 面板數(shù)據(jù)模型的估計方法面板數(shù)據(jù)模型的估計方法第一節(jié)第一節(jié) 面板數(shù)據(jù)的基本問題面板數(shù)據(jù)的基本問題 一、面板數(shù)據(jù)的定義一、面板數(shù)據(jù)的定義二、面板數(shù)據(jù)的分類二、面板數(shù)據(jù)的分類三、面板數(shù)據(jù)的特點三、面板數(shù)據(jù)的特點一、面板數(shù)據(jù)的定義一、面板數(shù)據(jù)的定義 面板數(shù)據(jù)面板數(shù)據(jù)(panel data)是指由變量)是指由變量y關(guān)于關(guān)于N個不個不同對象的同對象的T個觀測期所得到的二維結(jié)構(gòu)數(shù)據(jù),記為個觀測期所得到的二維結(jié)構(gòu)數(shù)據(jù),記為yit,其中,其中,i
2、表示表示N個不同對象(如國家、地區(qū)、行業(yè)、企個不同對象(如國家、地區(qū)、行業(yè)、企業(yè)或消費者等,一般稱之為第業(yè)或消費者等,一般稱之為第i個個體),個個體),t表示表示T個觀個觀測期。測期。面板數(shù)據(jù)是二維結(jié)構(gòu)數(shù)據(jù)面板數(shù)據(jù)是二維結(jié)構(gòu)數(shù)據(jù) 時間序列數(shù)據(jù)或截面數(shù)據(jù)都是一維數(shù)據(jù)。時間序列時間序列數(shù)據(jù)或截面數(shù)據(jù)都是一維數(shù)據(jù)。時間序列數(shù)據(jù)是變量按時間得到的數(shù)據(jù);截面數(shù)據(jù)是變量在固定數(shù)據(jù)是變量按時間得到的數(shù)據(jù);截面數(shù)據(jù)是變量在固定時點的一組數(shù)據(jù)。時點的一組數(shù)據(jù)。面板數(shù)據(jù)是同時在時間和截面上取得面板數(shù)據(jù)是同時在時間和截面上取得的二維數(shù)據(jù)。的二維數(shù)據(jù)。所以所以 ,面板數(shù)據(jù),面板數(shù)據(jù)(panel data)也稱作時間也
3、稱作時間序列與截面混合數(shù)據(jù)序列與截面混合數(shù)據(jù)(pooled time series and cross section data)。面板數(shù)據(jù)是截面上個體在不同時點的重。面板數(shù)據(jù)是截面上個體在不同時點的重復(fù)觀測數(shù)據(jù)。復(fù)觀測數(shù)據(jù)。面板數(shù)據(jù)是二維結(jié)構(gòu)數(shù)據(jù)面板數(shù)據(jù)是二維結(jié)構(gòu)數(shù)據(jù) Panel原指對一組固定調(diào)查對象的多次觀測,近年原指對一組固定調(diào)查對象的多次觀測,近年來來panel data已經(jīng)成為專業(yè)術(shù)語。已經(jīng)成為專業(yè)術(shù)語。 面板數(shù)據(jù)從橫截面看面板數(shù)據(jù)從橫截面看(cross section),是由若干個體,是由若干個體(entity,unit,individual)在某一時點構(gòu)成的截面觀測值,在某一時點
4、構(gòu)成的截面觀測值,從縱剖面從縱剖面(longitudinal section)看每個個體都是一個時間看每個個體都是一個時間序列。序列。數(shù)據(jù)結(jié)構(gòu)的二維性數(shù)據(jù)結(jié)構(gòu)的二維性NTTTNNXXXTXXXXXXNit2122212121112121時間序列數(shù)據(jù)橫截面數(shù)據(jù)變量變量X的面板數(shù)據(jù)結(jié)構(gòu)的面板數(shù)據(jù)結(jié)構(gòu)面板數(shù)據(jù)是二維結(jié)構(gòu)數(shù)據(jù)面板數(shù)據(jù)是二維結(jié)構(gòu)數(shù)據(jù)第一節(jié)第一節(jié) 面板數(shù)據(jù)的基本問題面板數(shù)據(jù)的基本問題 一、面板數(shù)據(jù)的定義一、面板數(shù)據(jù)的定義二、面板數(shù)據(jù)的分類二、面板數(shù)據(jù)的分類三、面板數(shù)據(jù)的特點三、面板數(shù)據(jù)的特點二、面板數(shù)據(jù)的分類二、面板數(shù)據(jù)的分類 1.1.短面板與長面板短面板與長面板 短面板短面板(short
5、 panel):時間:時間T較小,而個體數(shù)較小,而個體數(shù)N較大。較大。 長面板長面板(long panel):時間:時間T較大,而個體數(shù)較大,而個體數(shù)N較小。較小。二、面板數(shù)據(jù)的分類二、面板數(shù)據(jù)的分類 2.2.微觀面板數(shù)據(jù)與宏觀面板數(shù)據(jù)微觀面板數(shù)據(jù)與宏觀面板數(shù)據(jù) 微觀面板數(shù)據(jù)微觀面板數(shù)據(jù)一般指一段時期內(nèi)不同個體或者家庭一般指一段時期內(nèi)不同個體或者家庭的調(diào)查數(shù)據(jù),其數(shù)據(jù)中往往個體單位較多,即的調(diào)查數(shù)據(jù),其數(shù)據(jù)中往往個體單位較多,即N較大(較大(通常均為幾百或上千)而時期數(shù)通常均為幾百或上千)而時期數(shù)T較短(最短為兩個時較短(最短為兩個時期,最長一般不超過期,最長一般不超過20個時期)。個時期)。
6、二、面板數(shù)據(jù)的分類二、面板數(shù)據(jù)的分類 2.2.微觀面板數(shù)據(jù)與宏觀面板數(shù)據(jù)微觀面板數(shù)據(jù)與宏觀面板數(shù)據(jù) 宏觀面板數(shù)據(jù)宏觀面板數(shù)據(jù)通常為一段時間內(nèi)不同國家或地區(qū)的通常為一段時間內(nèi)不同國家或地區(qū)的數(shù)據(jù)集合,其個體單位數(shù)量數(shù)據(jù)集合,其個體單位數(shù)量N不大(一般為不大(一般為7-200)而時)而時期數(shù)期數(shù)T較長(一般為較長(一般為20-60年)。年)。二、面板數(shù)據(jù)的分類二、面板數(shù)據(jù)的分類 3.3.動態(tài)面板與靜態(tài)面板動態(tài)面板與靜態(tài)面板 在面板模型中,如果解釋變量包含被解釋變量的滯在面板模型中,如果解釋變量包含被解釋變量的滯后值,則稱為后值,則稱為“動態(tài)面板動態(tài)面板”(dynamic panel);反之,;反之
7、,則稱為則稱為“靜態(tài)面板靜態(tài)面板”(static panel)。二、面板數(shù)據(jù)的分類二、面板數(shù)據(jù)的分類 4.4.平衡面板數(shù)據(jù)與非平衡面板數(shù)據(jù)平衡面板數(shù)據(jù)與非平衡面板數(shù)據(jù) 如果在面板數(shù)據(jù)中,每個時期在樣本中的個體完全如果在面板數(shù)據(jù)中,每個時期在樣本中的個體完全一樣,則稱為一樣,則稱為“平衡面板數(shù)據(jù)平衡面板數(shù)據(jù)”(balanced panel);然而;然而,有時某些個體的數(shù)據(jù)可能缺失,或者新的個體后來才,有時某些個體的數(shù)據(jù)可能缺失,或者新的個體后來才加入到調(diào)查中來,在這種情況下,每個時期觀測到的個加入到調(diào)查中來,在這種情況下,每個時期觀測到的個體不完全相同,則稱為體不完全相同,則稱為“非平衡面板數(shù)據(jù)
8、非平衡面板數(shù)據(jù)”(unbalanced panel)。第一節(jié)第一節(jié) 面板數(shù)據(jù)的基本問題面板數(shù)據(jù)的基本問題 一、面板數(shù)據(jù)的定義一、面板數(shù)據(jù)的定義二、面板數(shù)據(jù)的分類二、面板數(shù)據(jù)的分類三、面板數(shù)據(jù)的特點三、面板數(shù)據(jù)的特點三、面板數(shù)據(jù)的特點三、面板數(shù)據(jù)的特點 1.由于觀測值的增多,可以增加估計量的抽樣精度。由于觀測值的增多,可以增加估計量的抽樣精度。 由于同時有截面維度與時間維度,通常面板數(shù)據(jù)的由于同時有截面維度與時間維度,通常面板數(shù)據(jù)的樣本容量更大,從而可以提高估計的精確度。樣本容量更大,從而可以提高估計的精確度。 面板數(shù)據(jù)提供面板數(shù)據(jù)提供“更加有信息價值的數(shù)據(jù),變量增加更加有信息價值的數(shù)據(jù),變量增
9、加變異性,變量之間的共線性削弱了,并且提高了自由度變異性,變量之間的共線性削弱了,并且提高了自由度和有效性。和有效性。三、面板數(shù)據(jù)的特點三、面板數(shù)據(jù)的特點 2.提供更多個體動態(tài)行為的信息。提供更多個體動態(tài)行為的信息。 由于面板數(shù)據(jù)同時有橫截面與時間兩個維度,有時由于面板數(shù)據(jù)同時有橫截面與時間兩個維度,有時可以解決單獨的截面數(shù)據(jù)或時間序列數(shù)據(jù)所不能解決的可以解決單獨的截面數(shù)據(jù)或時間序列數(shù)據(jù)所不能解決的問題,對面板數(shù)據(jù)進行回歸既可以像回歸分析截面數(shù)據(jù)問題,對面板數(shù)據(jù)進行回歸既可以像回歸分析截面數(shù)據(jù)一樣捕獲個體間的差異變化,又可以研究個體隨時間的一樣捕獲個體間的差異變化,又可以研究個體隨時間的變化情
10、況。變化情況。三、面板數(shù)據(jù)的特點三、面板數(shù)據(jù)的特點 2.提供更多個體動態(tài)行為的信息。提供更多個體動態(tài)行為的信息。 案例:考慮如何區(qū)分規(guī)模效應(yīng)與技術(shù)進步對企業(yè)生產(chǎn)效案例:考慮如何區(qū)分規(guī)模效應(yīng)與技術(shù)進步對企業(yè)生產(chǎn)效率的影響。對于截面數(shù)據(jù)來說,由于沒有時間維度,故率的影響。對于截面數(shù)據(jù)來說,由于沒有時間維度,故無法觀測到技術(shù)進步。然而,對于單個企業(yè)的時間序列無法觀測到技術(shù)進步。然而,對于單個企業(yè)的時間序列數(shù)據(jù)來說,我們無法區(qū)分其生產(chǎn)效率的提高究竟有多少數(shù)據(jù)來說,我們無法區(qū)分其生產(chǎn)效率的提高究竟有多少是由于規(guī)模擴大,有多少是由于技術(shù)進步。是由于規(guī)模擴大,有多少是由于技術(shù)進步。 三、面板數(shù)據(jù)的特點三、面
11、板數(shù)據(jù)的特點 3.可以解決遺漏變量問題??梢越鉀Q遺漏變量問題。 遺漏變量偏差是一個普遍存在的問題。雖然可以用遺漏變量偏差是一個普遍存在的問題。雖然可以用工具變量法解決,但有效的工具變量常常很難找。遺漏工具變量法解決,但有效的工具變量常常很難找。遺漏變量常常是由于不可觀測的個體差異或變量常常是由于不可觀測的個體差異或“異質(zhì)性異質(zhì)性”造成造成的,如果這種個體差異的,如果這種個體差異“不隨時間而改變不隨時間而改變”,則面板數(shù),則面板數(shù)據(jù)提供了解決遺漏變量問題的又一利器。據(jù)提供了解決遺漏變量問題的又一利器。三、面板數(shù)據(jù)的特點三、面板數(shù)據(jù)的特點 4.帶來一些問題。帶來一些問題。 (1)由于綜合了兩種數(shù)據(jù)
12、類型,面板數(shù)據(jù)分析方法相對)由于綜合了兩種數(shù)據(jù)類型,面板數(shù)據(jù)分析方法相對更加復(fù)雜。更加復(fù)雜。 (2)由于同一個體不同時期的數(shù)據(jù)一般存在自相關(guān),樣)由于同一個體不同時期的數(shù)據(jù)一般存在自相關(guān),樣本數(shù)據(jù)通常不滿足獨立同分布的假定。本數(shù)據(jù)通常不滿足獨立同分布的假定。 (3)面板數(shù)據(jù)的收集成本通常較高,不易獲得。)面板數(shù)據(jù)的收集成本通常較高,不易獲得。2,0003,0004,0005,0006,0007,0008,0009,00010,00011,0003,0005,0007,0009,00011,00013,000CP_1996CP_1997CP_1998CP_1999CP_2000CP_2001CP
13、_2002IP2,0003,0004,0005,0006,0007,0008,0009,00010,00011,0003,0005,0007,0009,00011,00013,000CP_IAHCP_IBJCP_IFJCP_IHBCP_IHLJCP_IJLCP_IJSCP_IJXCP_ILNCP_INMGCP_ISDCP_ISHCP_ISXCP_ITJCP_IZJIP2000300040005000600070008000900010000110002000400060008000100001200014000IPCROSSCP1996CP1997CP1998CP1999CP2000CP200
14、1CP2002IP用原變量建模還是用對數(shù)變量建模用原變量建模還是用對數(shù)變量建模? ?7.88.08.28.48.68.89.09.29.48.08.28.48.68.89.09.29.49.6LOG(IPCROSS)LOG(CP1996)LOG(CP1997)LOG(CP1998)LOG(CP1999)LOG(CP2000)LOG(CP2001)LOG(CP2002)2000300040005000600070008000900010000110002000400060008000100001200014000cp_bjcp_nmgIP_I200030004000500060007000800
15、0900010000110002000400060008000100001200014000CP_1996CP_2002IP_T 第一節(jié)第一節(jié) 面板數(shù)據(jù)的基本問題面板數(shù)據(jù)的基本問題第二節(jié)第二節(jié) 面板數(shù)據(jù)的模型形式面板數(shù)據(jù)的模型形式第三節(jié)第三節(jié) 面板數(shù)據(jù)模型的估計方法面板數(shù)據(jù)模型的估計方法其中:其中: 和和 分別表示居民的消費與收入。分別表示居民的消費與收入。 反映不隨時間變化的個體上的差異性反映不隨時間變化的個體上的差異性(個體效應(yīng))(個體效應(yīng)) 反映不隨個體變化的時間上的差異性反映不隨個體變化的時間上的差異性(時間效應(yīng))(時間效應(yīng))例例1:居民消費行為與收入的關(guān)系:居民消費行為與收入的關(guān)系i
16、tititYC10ittiituitCitY(1,2,;1,2,)iN tTLLit例例2. 農(nóng)村居民收入分析農(nóng)村居民收入分析itititititRCIRLTCSCPIC3210)(ln)ln(ittiituNi, 2 , 1Tt, 2 , 1it面板數(shù)據(jù):多個觀測對象的時間序列數(shù)據(jù)所組成的樣本數(shù)據(jù)。反映不隨個體變化的時間上的差異性, 被稱為時間效應(yīng)。反映不隨時間變化的個體上的差異性, 被稱為個體效應(yīng)第二節(jié)第二節(jié) 面板數(shù)據(jù)的模型形式面板數(shù)據(jù)的模型形式 一、個體效應(yīng)模型一、個體效應(yīng)模型二、固定效應(yīng)模型二、固定效應(yīng)模型三、隨機效應(yīng)模型三、隨機效應(yīng)模型四、雙向效應(yīng)模型四、雙向效應(yīng)模型其中:其中: 為
17、為 的矩陣,的矩陣, 為為k個解釋變量的第個解釋變量的第i個個體在個個體在 第第t時期的觀測值,為時期的觀測值,為 的矩陣。的矩陣。zi為不隨時間為不隨時間 而變的個體特征,即而變的個體特征,即 。擾動項由。擾動項由 兩部分構(gòu)成,被稱為兩部分構(gòu)成,被稱為“復(fù)合擾動項復(fù)合擾動項”。 個體效應(yīng)模型個體效應(yīng)模型(individual-specific effects model)假定假定樣本中每個個體的回歸方程斜率相同,但截距項不同。樣本中每個個體的回歸方程斜率相同,但截距項不同。ititiiityxzu1k 一、個體效應(yīng)模型一、個體效應(yīng)模型,itizzt()iitu(1,2,;1,2,)iN tT
18、LLitx1k復(fù)合擾動項:復(fù)合擾動項:不可觀測的隨機變量不可觀測的隨機變量 是代表個體異質(zhì)性的截距項。是代表個體異質(zhì)性的截距項。 為隨個體與時間而變的擾動項。為隨個體與時間而變的擾動項。假定假定 為獨立同分布的,且與為獨立同分布的,且與 不相關(guān)。不相關(guān)。 ititiiityxzuiu個體效應(yīng)模型個體效應(yīng)模型()iitu(1,2,;1,2,)iN tTLLititiu1.它表示不可觀測的個體特殊效應(yīng)、潛在變量、不可觀測它表示不可觀測的個體特殊效應(yīng)、潛在變量、不可觀測 的異質(zhì)性等??紤]到個人或者任一家庭、企業(yè)都具有很的異質(zhì)性等??紤]到個人或者任一家庭、企業(yè)都具有很 難被調(diào)查者觀察到的獨有的特征,這
19、種特殊效應(yīng)在整個難被調(diào)查者觀察到的獨有的特征,這種特殊效應(yīng)在整個 時間范圍內(nèi)時間范圍內(nèi) 是保持不變的。是保持不變的。2.某些場合下將其視為常數(shù),但這也是隨機變量的特例,某些場合下將其視為常數(shù),但這也是隨機變量的特例, 即退化的隨機變量。即退化的隨機變量。 ititiiityxzuiu對于個體效應(yīng)對于個體效應(yīng) :Tt, 2 , 1取對數(shù)后,模型變?yōu)椋喝?shù)后,模型變?yōu)椋涸谶@里,在這里, 代表著企業(yè)不隨時間變化并且不可觀測到的代表著企業(yè)不隨時間變化并且不可觀測到的特殊效應(yīng),它表示一個企業(yè)的管理才能、員工素質(zhì)等。特殊效應(yīng),它表示一個企業(yè)的管理才能、員工素質(zhì)等。例:一個企業(yè)的柯布例:一個企業(yè)的柯布-道
20、格拉斯生產(chǎn)函數(shù)道格拉斯生產(chǎn)函數(shù)iitititFLAKY21iitititFLKAYlnlnlnlnln21iFln1.如果如果 與所有解釋變量與所有解釋變量 均不相關(guān),則進一步稱之均不相關(guān),則進一步稱之 為為“隨機效應(yīng)模型隨機效應(yīng)模型”(Random Effects Model,RE)。2.如果如果 與某個解釋變量相關(guān),則進一步稱之為與某個解釋變量相關(guān),則進一步稱之為“固定效固定效 應(yīng)模型應(yīng)模型(Fixed Effects Model,FE)。ititiiityxzuiu個體效應(yīng)個體效應(yīng) 與解釋變量與解釋變量 的相關(guān)性:的相關(guān)性:itxiu),(iitzxiu第二節(jié)第二節(jié) 面板數(shù)據(jù)的模型形式面
21、板數(shù)據(jù)的模型形式 一、個體效應(yīng)模型一、個體效應(yīng)模型二、固定效應(yīng)模型二、固定效應(yīng)模型三、隨機效應(yīng)模型三、隨機效應(yīng)模型四、雙向效應(yīng)模型四、雙向效應(yīng)模型 固定效應(yīng)模型形式同樣與個體效應(yīng)模型相同,但是在固定效應(yīng)模型形式同樣與個體效應(yīng)模型相同,但是在固定效應(yīng)模型中假定固定效應(yīng)模型中假定 為需要估計的固定參數(shù),它可以為需要估計的固定參數(shù),它可以與解釋變量之間存在相關(guān)性。與解釋變量之間存在相關(guān)性。 固定效應(yīng)模型意味著存在內(nèi)生解釋變量。在固定效應(yīng)模型意味著存在內(nèi)生解釋變量。在 隨隨時間變化的情況下,固定效應(yīng)模型所得到的第時間變化的情況下,固定效應(yīng)模型所得到的第j個解釋個解釋變量的邊際效應(yīng)估計量同樣是一致的。然
22、而,同隨機效變量的邊際效應(yīng)估計量同樣是一致的。然而,同隨機效應(yīng)模型相比,固定效應(yīng)應(yīng)模型相比,固定效應(yīng) 模型中存在參數(shù)過多和自由度損模型中存在參數(shù)過多和自由度損失過多等問題。失過多等問題。二、固定效應(yīng)模型二、固定效應(yīng)模型iuitjx,第二節(jié)第二節(jié) 面板數(shù)據(jù)的模型形式面板數(shù)據(jù)的模型形式 一、個體效應(yīng)模型一、個體效應(yīng)模型二、固定效應(yīng)模型二、固定效應(yīng)模型三、隨機效應(yīng)模型三、隨機效應(yīng)模型四、雙向效應(yīng)模型四、雙向效應(yīng)模型 對于隨機效應(yīng)模型,一般采用可行的廣義最小二乘法對于隨機效應(yīng)模型,一般采用可行的廣義最小二乘法(FGLS)對其進行估計,由于對其進行估計,由于 被假定為隨機的,無須估被假定為隨機的,無須估
23、計,計, 因此使用隨機效應(yīng)模型可以一次得到所有系數(shù)的估因此使用隨機效應(yīng)模型可以一次得到所有系數(shù)的估計值從而進行邊際分析。但是,如果隨機效應(yīng)模型選取計值從而進行邊際分析。但是,如果隨機效應(yīng)模型選取不恰當所得到的參數(shù)估計值將是不一致的。不恰當所得到的參數(shù)估計值將是不一致的。 隨機效應(yīng)模型形式與個體效應(yīng)模型相同,在隨機效應(yīng)隨機效應(yīng)模型形式與個體效應(yīng)模型相同,在隨機效應(yīng)模型中假定模型中假定 是完全隨機的,即是完全隨機的,即 與解釋變量無關(guān)。與解釋變量無關(guān)。三、隨機效應(yīng)模型三、隨機效應(yīng)模型iuiuiu第二節(jié)第二節(jié) 面板數(shù)據(jù)的模型形式面板數(shù)據(jù)的模型形式 一、個體效應(yīng)模型一、個體效應(yīng)模型二、固定效應(yīng)模型二、
24、固定效應(yīng)模型三、隨機效應(yīng)模型三、隨機效應(yīng)模型四、雙向效應(yīng)模型四、雙向效應(yīng)模型 雙向效應(yīng)模型雙向效應(yīng)模型(two-way-effects model)也可稱為雙因也可稱為雙因素誤差模型,它將未觀測到的個體效應(yīng)和時間效應(yīng)引入素誤差模型,它將未觀測到的個體效應(yīng)和時間效應(yīng)引入模型,是個體效應(yīng)模型的標準延伸。模型,是個體效應(yīng)模型的標準延伸。這里這里t t僅隨時間變化而不隨個體變化,表示所有未包僅隨時間變化而不隨個體變化,表示所有未包含在回歸模型中的發(fā)生在特定時期的影響,如地震對某含在回歸模型中的發(fā)生在特定時期的影響,如地震對某一時期企業(yè)生產(chǎn)的影響。一時期企業(yè)生產(chǎn)的影響。四、雙向效應(yīng)模型四、雙向效應(yīng)模型i
25、titiitityxzu雙向固定效應(yīng)模型雙向固定效應(yīng)模型(Two-way FE)對于短面板數(shù)據(jù),通常將時間效應(yīng)看做固定效應(yīng),如果個對于短面板數(shù)據(jù),通常將時間效應(yīng)看做固定效應(yīng),如果個體效應(yīng)模型中含有時間趨勢項或包含時間虛擬變量,則稱體效應(yīng)模型中含有時間趨勢項或包含時間虛擬變量,則稱之為雙向固定效應(yīng)模型。之為雙向固定效應(yīng)模型。(1)在固定效應(yīng)模型中引入時間趨勢項)在固定效應(yīng)模型中引入時間趨勢項t,它僅依時間,它僅依時間而變化,而不依個體而變。而變化,而不依個體而變。(2)對每個時期定義一個虛擬變量,然后把)對每個時期定義一個虛擬變量,然后把(T-1)個時間個時間虛擬變量包括在回歸方程中(未包括的時
26、間虛擬變量虛擬變量包括在回歸方程中(未包括的時間虛擬變量即為基期)。即為基期)。第一節(jié)第一節(jié) 面板數(shù)據(jù)的基本問題面板數(shù)據(jù)的基本問題第二節(jié)第二節(jié) 面板數(shù)據(jù)的模型形式面板數(shù)據(jù)的模型形式第三節(jié)第三節(jié) 面板數(shù)據(jù)模型的估計方法面板數(shù)據(jù)模型的估計方法第三節(jié)第三節(jié) 面板數(shù)據(jù)模型的估計方法面板數(shù)據(jù)模型的估計方法 一、混合最小二乘估計一、混合最小二乘估計二、固定效應(yīng)模型的估計方法二、固定效應(yīng)模型的估計方法三、隨機效應(yīng)模型的估計方法三、隨機效應(yīng)模型的估計方法一、混合最小二乘估計一、混合最小二乘估計(Pooled OLS)假定所有個體都擁有完全一樣的回歸方程:假定所有個體都擁有完全一樣的回歸方程:其中,其中,xit
27、不包括常數(shù)項,這樣,就可以直接把所有數(shù)據(jù)不包括常數(shù)項,這樣,就可以直接把所有數(shù)據(jù)放在一起,像對待橫截面數(shù)據(jù)那樣進行放在一起,像對待橫截面數(shù)據(jù)那樣進行OLS回歸,故被回歸,故被稱為稱為“混合回歸混合回歸”(pooled OLS)。itiititzxy人均消費對人均可支人均消費對人均可支配收入的彈性系數(shù)是配收入的彈性系數(shù)是0.9694。人均消費對人均可支人均消費對人均可支配收入的邊際系數(shù)是配收入的邊際系數(shù)是0.9694 CPit /IPit對案例對案例1人均消費人均消費CP與收入與收入IP的面板數(shù)據(jù)進行混合估計:的面板數(shù)據(jù)進行混合估計:注意:注意:1.由于面板數(shù)據(jù)的特點,雖然通??梢约僭O(shè)不同個體之
28、由于面板數(shù)據(jù)的特點,雖然通常可以假設(shè)不同個體之間的擾動項相互獨立,但同一個體在不同時期的擾動項間的擾動項相互獨立,但同一個體在不同時期的擾動項之間往往存在自相關(guān)。此時,對標準差的估計應(yīng)該使用之間往往存在自相關(guān)。此時,對標準差的估計應(yīng)該使用聚類穩(wěn)健的標準差聚類穩(wěn)健的標準差(cluster-robust standard error),而所,而所謂聚類就是由每個個體不同時期的所有觀測值所組成。謂聚類就是由每個個體不同時期的所有觀測值所組成。同一聚類(個體)的觀測值允許存在相關(guān)性,而不同聚同一聚類(個體)的觀測值允許存在相關(guān)性,而不同聚類(個體)的觀測值則不相關(guān)。類(個體)的觀測值則不相關(guān)。注意:注
29、意:2.混合回歸的基本假設(shè)是不存在個體效應(yīng)。對于這個假混合回歸的基本假設(shè)是不存在個體效應(yīng)。對于這個假設(shè)必須進行統(tǒng)計檢驗。由于個體效應(yīng)以兩種不同的形態(tài)設(shè)必須進行統(tǒng)計檢驗。由于個體效應(yīng)以兩種不同的形態(tài)存在(即隨機效應(yīng)與固定效應(yīng)),因此需要分別對其進存在(即隨機效應(yīng)與固定效應(yīng)),因此需要分別對其進行檢驗。行檢驗。第三節(jié)第三節(jié) 面板數(shù)據(jù)模型的估計方法面板數(shù)據(jù)模型的估計方法 一、混合最小二乘估計一、混合最小二乘估計二、固定效應(yīng)模型的估計方法二、固定效應(yīng)模型的估計方法三、隨機效應(yīng)模型的估計方法三、隨機效應(yīng)模型的估計方法二、固定效應(yīng)模型的估計方法二、固定效應(yīng)模型的估計方法對于固定效應(yīng)模型:對于固定效應(yīng)模型:
30、由于由于 被假定為需要估計的固定參數(shù)并允許與解釋變被假定為需要估計的固定參數(shù)并允許與解釋變量相關(guān),因此,估計固定效應(yīng)模型中的系數(shù)量相關(guān),因此,估計固定效應(yīng)模型中的系數(shù) 時便可以時便可以考慮通過變換模型形式從而消除這一不可觀測到的個體考慮通過變換模型形式從而消除這一不可觀測到的個體效應(yīng)。效應(yīng)。ititiiityxzuiu二、固定效應(yīng)模型的估計方法二、固定效應(yīng)模型的估計方法(一)組內(nèi)估計(一)組內(nèi)估計 對于固定效應(yīng)模型,給定第對于固定效應(yīng)模型,給定第i個個體,將方程個個體,將方程 兩邊對時間取平均可得兩邊對時間取平均可得 用原模型減去平均后的方程,可得其離差形式:用原模型減去平均后的方程,可得其離
31、差形式:ititiiityxzuiiiiiuzxy)()(iitiitiitxxyy二、固定效應(yīng)模型的估計方法二、固定效應(yīng)模型的估計方法定義定義則則由于上式中已將由于上式中已將 消去,故只要消去,故只要 與與 不相關(guān),則可不相關(guān),則可以用以用OLS一致地估計一致地估計 ,稱為,稱為“固定效應(yīng)估計量固定效應(yīng)估計量”(Fixed Effects Estimator),記為,記為 。由于其主要使用了。由于其主要使用了每個個體的組內(nèi)離差信息,故也稱為每個個體的組內(nèi)離差信息,故也稱為“組內(nèi)估計量組內(nèi)估計量”(within estimator)。 )()(iitiitiitxxyyiitityyyiiti
32、t)(iititxxxitititxyiuitxitFE注意:注意: 即使個體特征即使個體特征 與解釋變量與解釋變量 相關(guān),只要使用組相關(guān),只要使用組內(nèi)估計量,就可以得到一致估計,但在作離差轉(zhuǎn)換的過內(nèi)估計量,就可以得到一致估計,但在作離差轉(zhuǎn)換的過程中,程中, 也被消掉了,故無法估計也被消掉了,故無法估計 。即。即 無法估計無法估計不隨時間而變的變量的影響。不隨時間而變的變量的影響。iuitxizFE注意:注意: 另外,為了保證另外,為了保證 與與 不相關(guān),則要不相關(guān),則要求第求第i個觀測值滿足嚴格外生性,即個觀測值滿足嚴格外生性,即 ,因為因為 中包含了所有中包含了所有 的信息。換言之,擾的信
33、息。換言之,擾動項必須與各期的解釋變量均不相關(guān)(而不僅僅是當期動項必須與各期的解釋變量均不相關(guān)(而不僅僅是當期的解釋變量),這是一個比較強的假定。的解釋變量),這是一個比較強的假定。)(iit)(iitxx 0),(1iTiitxxEix),(1iTixx 二、固定效應(yīng)模型的估計方法二、固定效應(yīng)模型的估計方法(二)最小二乘虛擬變量模型(二)最小二乘虛擬變量模型(LSDV) 對于固定效應(yīng)模型:對于固定效應(yīng)模型: 在方程中引入在方程中引入(n-1)個虛擬變量(如果沒有截距項,則個虛擬變量(如果沒有截距項,則引入引入n個虛擬變量)來代表不同的個體,則可以得到與個虛擬變量)來代表不同的個體,則可以得到
34、與上述離差模型同樣的結(jié)果,稱為上述離差模型同樣的結(jié)果,稱為“最小二乘虛擬變量模最小二乘虛擬變量模型型”(Least Square Dummy Variable Model)。ititiiityxzu虛擬變量回歸的特點虛擬變量回歸的特點 使用使用LSDV方法所給出的估計值,與我們用組內(nèi)方法所給出的估計值,與我們用組內(nèi)估計方法得到的估計值恰好一樣,而且標準誤和其他估計方法得到的估計值恰好一樣,而且標準誤和其他主要統(tǒng)計量也是一樣。因此,固定效應(yīng)估計量可以從主要統(tǒng)計量也是一樣。因此,固定效應(yīng)估計量可以從虛擬變量回歸得到。虛擬變量回歸得到。 從從LSDV方法算出的可決系數(shù)的值通常都比較高,方法算出的可決
35、系數(shù)的值通常都比較高,這是因為我們對每一橫截面單位都包含了一個虛擬變這是因為我們對每一橫截面單位都包含了一個虛擬變量,以致能解釋數(shù)據(jù)中的變異的大部分。量,以致能解釋數(shù)據(jù)中的變異的大部分。iu從結(jié)果看,北京、上海、浙江是自發(fā)消費(消費函數(shù)截距)最大的3個地區(qū)。注意:注意: 使用使用LSDV方法雖然可以得到對個體異質(zhì)性方法雖然可以得到對個體異質(zhì)性 的的估計,但是會損失很大的自由度,并在估計估計,但是會損失很大的自由度,并在估計(n-1)個額外個額外的參數(shù)時,大量的虛擬變量會加劇回歸方程的多重共線的參數(shù)時,大量的虛擬變量會加劇回歸方程的多重共線性問題,也不能估計非時變性問題,也不能估計非時變(tim
36、e-constant)變量效應(yīng)。變量效應(yīng)。 此外,此外,LSDV方法也不能解決內(nèi)生性問題。方法也不能解決內(nèi)生性問題。iuLSDV的估計效果的估計效果 Islam(2000)運用蒙特卡羅模擬研究了一些關(guān)于經(jīng)運用蒙特卡羅模擬研究了一些關(guān)于經(jīng)濟增長收斂方面的面板數(shù)據(jù)估計。研究發(fā)現(xiàn),如果以濟增長收斂方面的面板數(shù)據(jù)估計。研究發(fā)現(xiàn),如果以小樣本偏差和預(yù)測誤差的標準方差來判斷的話,小樣本偏差和預(yù)測誤差的標準方差來判斷的話,LSDV估計在小樣本上的估計結(jié)果最好,其估計效果估計在小樣本上的估計結(jié)果最好,其估計效果甚至比甚至比GMM估計和工具變量估計和工具變量(IV)估計都更好。估計都更好。 Islam (200
37、0)對此提供的一種理論解釋是,對此提供的一種理論解釋是,GMM和和IV估計在小樣本上估計效果不好的原因是因為,這估計在小樣本上估計效果不好的原因是因為,這兩種方法的優(yōu)點都依賴于回歸估計中所能選擇到的最兩種方法的優(yōu)點都依賴于回歸估計中所能選擇到的最優(yōu)權(quán)重矩陣,而這一權(quán)重在回歸中可能會收到數(shù)據(jù)噪優(yōu)權(quán)重矩陣,而這一權(quán)重在回歸中可能會收到數(shù)據(jù)噪聲。聲。LSDV的估計效果的估計效果二、固定效應(yīng)模型的估計方法二、固定效應(yīng)模型的估計方法(三)一階差分法(三)一階差分法 對于固定效應(yīng)模型,給定第對于固定效應(yīng)模型,給定第i個個體,將方程個個體,將方程 兩邊進行一階差分,以消去個體效應(yīng),得兩邊進行一階差分,以消去
38、個體效應(yīng),得 對上述差分形式的方程使用對上述差分形式的方程使用OLS就可以得到就可以得到“一階差一階差分分估計量估計量”,記為,記為 。ititiiityxzu,1,1,1()()iti titi titi tyyxxFD組內(nèi)估計量與一階差分估計量組內(nèi)估計量與一階差分估計量由于由于 不再出現(xiàn)在差分方程中,只要擾動項的一階差分不再出現(xiàn)在差分方程中,只要擾動項的一階差分 與解釋變量的一階差分與解釋變量的一階差分 不相關(guān),則不相關(guān),則 是一致的。此一致性條件比保證是一致的。此一致性條件比保證 一致的嚴格外生一致的嚴格外生性假定更弱,這是性假定更弱,這是 的主要優(yōu)點。的主要優(yōu)點。,1,1,1()()i
39、ti titi titi tyyxxFDiu, 1()iti t,1()iti txxFEFD組內(nèi)估計量與一階差分估計量組內(nèi)估計量與一階差分估計量 組內(nèi)估計和一階差分都假設(shè)不可觀測的個體效應(yīng)與組內(nèi)估計和一階差分都假設(shè)不可觀測的個體效應(yīng)與解釋變量相關(guān),兩種估計方法在解釋變量相關(guān),兩種估計方法在T=2時產(chǎn)生相同的估計時產(chǎn)生相同的估計量和推斷。當總體時期量和推斷。當總體時期T2時,在時,在 序列不相關(guān),獨立序列不相關(guān),獨立同分布的情況下,組內(nèi)估計量同分布的情況下,組內(nèi)估計量 比一階差分估計量比一階差分估計量 更有效率。因此,在實踐上,主要使用更有效率。因此,在實踐上,主要使用 ,而較少用,而較少用
40、itFEFDFEFD第三節(jié)第三節(jié) 面板數(shù)據(jù)模型的估計方法面板數(shù)據(jù)模型的估計方法 一、混合最小二乘估計一、混合最小二乘估計二、固定效應(yīng)模型的估計方法二、固定效應(yīng)模型的估計方法三、隨機效應(yīng)模型的估計方法三、隨機效應(yīng)模型的估計方法三、隨機效應(yīng)模型的估計方法三、隨機效應(yīng)模型的估計方法對于回歸方程:對于回歸方程:隨機效應(yīng)模型假定隨機效應(yīng)模型假定 與解釋變量與解釋變量 均不相關(guān),故均不相關(guān),故OLS是一致的。然而,由于擾動項由是一致的。然而,由于擾動項由 組成,不是組成,不是球型擾動項(同方差、無自相關(guān)),因此,球型擾動項(同方差、無自相關(guān)),因此,OLS不是最不是最有效率的。有效率的。ititiiity
41、xzuiu),(iitzx()iitu由于由于 的存在,同一個體不同時期的擾動項之間存在自的存在,同一個體不同時期的擾動項之間存在自相關(guān),相關(guān),iu具體來說,用具體來說,用OLS來估計以下來估計以下“廣義離差廣義離差” (quasi-demeaned)模型,模型,組間估計組間估計(Between Estimator)究竟該用固定效應(yīng)還是隨機效應(yīng)模型?究竟該用固定效應(yīng)還是隨機效應(yīng)模型? 當我們在日常研究中選取模型形式時,不能確定當我們在日常研究中選取模型形式時,不能確定未觀測到的個體效應(yīng)是否與解釋變量相關(guān),因而不能未觀測到的個體效應(yīng)是否與解釋變量相關(guān),因而不能恰當?shù)卦诠潭ㄐ?yīng)模型和隨機效應(yīng)模型之
42、間進行選取。恰當?shù)卦诠潭ㄐ?yīng)模型和隨機效應(yīng)模型之間進行選取。錯誤選取模型類型,將影響我們的參數(shù)估計量等從而錯誤選取模型類型,將影響我們的參數(shù)估計量等從而影響對具體問題的分析。在處理面板數(shù)據(jù)時,究竟該影響對具體問題的分析。在處理面板數(shù)據(jù)時,究竟該使用固定效應(yīng)模型還是隨機效應(yīng)模型是一個根本問題。使用固定效應(yīng)模型還是隨機效應(yīng)模型是一個根本問題。Hausman檢驗檢驗原假設(shè)原假設(shè)H0: 與與 不相關(guān)(模型應(yīng)設(shè)定為隨機效應(yīng))不相關(guān)(模型應(yīng)設(shè)定為隨機效應(yīng)) 備擇假設(shè)備擇假設(shè)H1: 與與 相關(guān)(模型設(shè)定為固定效應(yīng))相關(guān)(模型設(shè)定為固定效應(yīng)) Hausman檢驗統(tǒng)計量:檢驗統(tǒng)計量: iu),(iitzxiu)
43、,(iitzx固定效應(yīng)模型與隨機效應(yīng)模型哪個更好一些?固定效應(yīng)模型與隨機效應(yīng)模型哪個更好一些? 隨機效應(yīng)模型的好處是節(jié)省自由度。對于從時間隨機效應(yīng)模型的好處是節(jié)省自由度。對于從時間和截面兩方面看都存在較大變化的數(shù)據(jù),隨機效應(yīng)模和截面兩方面看都存在較大變化的數(shù)據(jù),隨機效應(yīng)模型能明確地描述出誤差來源的特征。型能明確地描述出誤差來源的特征。 固定效應(yīng)模型的好處是,很容易分析任意截面數(shù)固定效應(yīng)模型的好處是,很容易分析任意截面數(shù)據(jù)所對應(yīng)的應(yīng)變量與全部截面數(shù)據(jù)對應(yīng)的因變量均值據(jù)所對應(yīng)的應(yīng)變量與全部截面數(shù)據(jù)對應(yīng)的因變量均值的差異程度。的差異程度。Wooldridge(2000) 在實際應(yīng)用時,是選擇固定效應(yīng)
44、模型還是選擇隨在實際應(yīng)用時,是選擇固定效應(yīng)模型還是選擇隨機效應(yīng)模型?一般的經(jīng)驗的做法是,如果研究者預(yù)期機效應(yīng)模型?一般的經(jīng)驗的做法是,如果研究者預(yù)期建立面板數(shù)據(jù)模型推斷樣本空間的經(jīng)濟關(guān)系,則模型建立面板數(shù)據(jù)模型推斷樣本空間的經(jīng)濟關(guān)系,則模型設(shè)定為固定效應(yīng)模型會更合理一些。否則,如果研究設(shè)定為固定效應(yīng)模型會更合理一些。否則,如果研究樣本是從總體隨機抽樣得到的,并且預(yù)期利用模型解樣本是從總體隨機抽樣得到的,并且預(yù)期利用模型解釋或推斷總體的統(tǒng)計性質(zhì),則將模型設(shè)定為隨機效應(yīng)釋或推斷總體的統(tǒng)計性質(zhì),則將模型設(shè)定為隨機效應(yīng)模型比較合理。模型比較合理。古扎拉蒂(古扎拉蒂(2013)1.如果如果T(觀測的時間
45、點的數(shù)目)較大,且(觀測的時間點的數(shù)目)較大,且N(橫截面單(橫截面單元的數(shù)量)較小,則通過固定效應(yīng)模型和隨機效應(yīng)模元的數(shù)量)較小,則通過固定效應(yīng)模型和隨機效應(yīng)模型估計的參數(shù)值之間很可能沒什么差別。這時的選擇型估計的參數(shù)值之間很可能沒什么差別。這時的選擇依據(jù)就是基于計算上的便利了。在這種情況下,固定依據(jù)就是基于計算上的便利了。在這種情況下,固定效應(yīng)模型可能更加可取。效應(yīng)模型可能更加可取。古扎拉蒂(古扎拉蒂(2013)2.在短面板(在短面板(N大且大且T小)中,兩種方法的估計值可能有小)中,兩種方法的估計值可能有顯著差別。如果我們確信樣本中橫截面單元不是從一顯著差別。如果我們確信樣本中橫截面單元
46、不是從一個較大的樣本中隨機抽取的,那么固定效應(yīng)模型是可個較大的樣本中隨機抽取的,那么固定效應(yīng)模型是可取的。如果不是這種情況,統(tǒng)計推斷是無條件的,則取的。如果不是這種情況,統(tǒng)計推斷是無條件的,則隨機效應(yīng)模型是可取的。隨機效應(yīng)模型是可取的。古扎拉蒂(古扎拉蒂(2013)3.如果如果N較大而較大而T較小,并且隨機效應(yīng)模型的假設(shè)成立,較小,并且隨機效應(yīng)模型的假設(shè)成立,那么隨機效應(yīng)模型的估計量比固定效應(yīng)模型的估計量那么隨機效應(yīng)模型的估計量比固定效應(yīng)模型的估計量更加有效。更加有效。古扎拉蒂(古扎拉蒂(2013)4.與固定效應(yīng)模型不同,隨機效應(yīng)模型可以估計時間不變與固定效應(yīng)模型不同,隨機效應(yīng)模型可以估計時間
47、不變性變量的系數(shù),比如性別和種族這類變量。固定效應(yīng)性變量的系數(shù),比如性別和種族這類變量。固定效應(yīng)模型確實可以控制住這些時間不變性變量,但是它不模型確實可以控制住這些時間不變性變量,但是它不能直接估計這些變量,這一點從能直接估計這些變量,這一點從LSDV估計模型中可以估計模型中可以清楚地得出。另一方面,固定效應(yīng)模型可以控制住所清楚地得出。另一方面,固定效應(yīng)模型可以控制住所有時間不變性變量,而隨機效應(yīng)模型只能控制住那些有時間不變性變量,而隨機效應(yīng)模型只能控制住那些在模型中可以被精確表達的時間不變性變量。在模型中可以被精確表達的時間不變性變量。各種估計量的性質(zhì)各種估計量的性質(zhì) 1.混合估計:混合估計
48、: 如果斜率系數(shù)在所有主體間是不變的,而且誤差如果斜率系數(shù)在所有主體間是不變的,而且誤差項與解釋變量無關(guān),那么混合估計就是一致的。但是,項與解釋變量無關(guān),那么混合估計就是一致的。但是,對一個給定的個體而言,誤差項在時間上很可能相關(guān)。對一個給定的個體而言,誤差項在時間上很可能相關(guān)。所有,我們必須使用面板修正標準誤來進行假設(shè)檢驗。所有,我們必須使用面板修正標準誤來進行假設(shè)檢驗。否則,一般計算得出的標準誤可能會被低估。否則,一般計算得出的標準誤可能會被低估。各種估計量的性質(zhì)各種估計量的性質(zhì) 2.固定效應(yīng)估計:固定效應(yīng)估計: 即使?jié)撛诘哪P褪腔旌匣螂S機效應(yīng)模型,固定效即使?jié)撛诘哪P褪腔旌匣螂S機效應(yīng)模型,固定效應(yīng)模型也總是一致的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 浙江省兒童練字課程設(shè)計
- 網(wǎng)站建設(shè)開發(fā)合同
- 水下游泳主題課程設(shè)計
- 廣告宣傳發(fā)布合同
- 工具課程設(shè)計總結(jié)
- 小班湯圓美食課程設(shè)計
- 2024年環(huán)保工程項目承包合同
- 模電課課程設(shè)計呼吸燈
- 壁畫制作合同3篇
- 借款合同抵押范本3篇
- 人教版(2012)音樂一年級上冊國旗國旗真美麗 說課教案
- 記賬實操-協(xié)會賬務(wù)處理的分錄
- JT-T-1344-2020純電動汽車維護、檢測、診斷技術(shù)規(guī)范
- 長期護理保險考試附有答案
- 國際經(jīng)濟學(xué)智慧樹知到期末考試答案章節(jié)答案2024年河南大學(xué)
- 特殊教育概論-期末大作業(yè)-國開-參考資料
- 2022-2023學(xué)年福建省廈門某中學(xué)八年級(上)期末數(shù)學(xué)試卷(含解析)
- 2024個人隱私保密協(xié)議
- 【多元化戰(zhàn)略對企業(yè)財務(wù)風(fēng)險的影響探究-以阿里巴巴為例10000字(論文)】
- 04979-網(wǎng)絡(luò)安全技術(shù)-國開機考參考資料
- 北京市餐飲行業(yè)污染防治手冊
評論
0/150
提交評論