內(nèi)生性產(chǎn)生的原因及解決方案課件_第1頁(yè)
內(nèi)生性產(chǎn)生的原因及解決方案課件_第2頁(yè)
內(nèi)生性產(chǎn)生的原因及解決方案課件_第3頁(yè)
內(nèi)生性產(chǎn)生的原因及解決方案課件_第4頁(yè)
內(nèi)生性產(chǎn)生的原因及解決方案課件_第5頁(yè)
已閱讀5頁(yè),還剩110頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五講內(nèi)生性?xún)?nèi)生性產(chǎn)生的原因及解決方案OLS經(jīng)典假設(shè)

所有的解釋變量Xi與隨機(jī)誤差項(xiàng)彼此之間不相關(guān)。若解釋變量Xi和ui相關(guān),則OLS估計(jì)量是非一致的,也就是即使當(dāng)樣本容量很大時(shí),OLS估計(jì)量也不會(huì)接近回歸系數(shù)的真值。當(dāng)解釋變量和隨機(jī)誤差項(xiàng)相關(guān)時(shí),模型存在著內(nèi)生性問(wèn)題。內(nèi)生性產(chǎn)生的原因及解決方案在計(jì)量經(jīng)濟(jì)學(xué)中,把所有與擾動(dòng)項(xiàng)相關(guān)的解釋變量都稱(chēng)為“內(nèi)生變量”。這與一般經(jīng)濟(jì)學(xué)理論中的定義有所不同。1。與誤差項(xiàng)相關(guān)的變量稱(chēng)為內(nèi)生變量(endogenousvariable)。2。與誤差項(xiàng)不相關(guān)的變量稱(chēng)為外生變量(exogenousvariable)。內(nèi)生性產(chǎn)生的原因及解決方案造成誤差項(xiàng)與回歸變量相關(guān)(內(nèi)生性)的原因很多,但我們主要考慮如下幾個(gè)方面:遺漏變量偏差變量有測(cè)量誤差雙向因果關(guān)系。內(nèi)生性產(chǎn)生的原因及解決方案遺漏變量偏差內(nèi)生性產(chǎn)生的原因及解決方案內(nèi)生性產(chǎn)生的原因及解決方案變量有測(cè)量誤差測(cè)量數(shù)據(jù)正確時(shí):假設(shè)方程為:當(dāng)存在測(cè)量誤差時(shí):方程為:所以我們有:內(nèi)生性產(chǎn)生的原因及解決方案可知,誤差項(xiàng)中包含所以可以得到:如果則回歸結(jié)果有偏,非一致我們假設(shè)則有內(nèi)生性產(chǎn)生的原因及解決方案結(jié)論:1。由于2?;貧w的性質(zhì)決定于w的標(biāo)準(zhǔn)差內(nèi)生性產(chǎn)生的原因及解決方案雙向因果關(guān)系之前我們假定因果關(guān)系是從回歸變量到因變量的(X導(dǎo)致了Y)。但如果因果關(guān)系同時(shí)也是從因變量到一個(gè)或多個(gè)回歸變量(Y導(dǎo)致了X)的呢?如果是這樣的話(huà),因果關(guān)系是向前的也是“向后”的,即存在雙向因果關(guān)系,如果存在雙向因果關(guān)系,則OLS回歸中同時(shí)包含了這兩個(gè)效應(yīng),因此OLS估計(jì)量是有偏的、非一致的。內(nèi)生性產(chǎn)生的原因及解決方案可以推導(dǎo)出:內(nèi)生性產(chǎn)生的原因及解決方案檢驗(yàn)方法:豪斯曼檢驗(yàn)檢驗(yàn)豪斯曼檢驗(yàn)(Hausmanspecificationtest)H0:所有解釋變量均為外生變量。H1:至少有一個(gè)解釋變量為內(nèi)生變量。

quietlyreglw80s80expr80tenure80iqeststoreolsquietlyivregress2slslw80expr80tenure80(s80iq=medkwwmrtage)eststoreivhausmanivols,若Hausman檢驗(yàn)失效(檢驗(yàn)統(tǒng)計(jì)量為負(fù)值),則使用dmexogxt,否則仍Hausman檢驗(yàn)為主。內(nèi)生性產(chǎn)生的原因及解決方案使用Davidson-MacKinnon檢驗(yàn)xtivreg后使用dmexogxt*Davidson-MacKinnon(1993)檢驗(yàn)

*H0:OLS和xtivreg都是一致的,即內(nèi)生性問(wèn)題對(duì)OLS的估計(jì)結(jié)果影響不大

xtivregtlsizendtstang(npr=tobinL1.npr),fe

dmexogxt

Davidson-MacKinnon檢驗(yàn)得到F統(tǒng)計(jì)量的P值小于0.05,代表有內(nèi)生性?xún)?nèi)生性產(chǎn)生的原因及解決方案遺漏變量偏差可采用在多元回歸中加入遺漏變量的方法加以解決,但前提是只有當(dāng)你有遺漏變量數(shù)據(jù)時(shí)上述方法才可行。雙向因果關(guān)系偏差是指如果有時(shí)因果關(guān)系是從X到Y(jié)又從Y到X時(shí),此時(shí)僅用多元回歸無(wú)法消除這一偏差。同樣,變量有測(cè)量誤差也無(wú)法用我們前面學(xué)過(guò)的方法解決。因此我們就必須尋找一種新的方法。內(nèi)生性產(chǎn)生的原因及解決方案二、內(nèi)生性的解決方案

事實(shí)上,僅僅為了解決內(nèi)生性問(wèn)題,并不需要我們對(duì)內(nèi)生性問(wèn)題的緣起有很深入的理解。對(duì)于應(yīng)用型的實(shí)證研究而言,我們只需要掌握解決內(nèi)生性問(wèn)題的具體方案即可。內(nèi)生性問(wèn)題的解決方案一共四種,理論上來(lái)講,這四種方案應(yīng)對(duì)內(nèi)生性問(wèn)題都很有效。但于我個(gè)人而言,我對(duì)四種方法的評(píng)價(jià)是有高低的,由高到低分別介紹如下。

內(nèi)生性產(chǎn)生的原因及解決方案1.自然實(shí)驗(yàn)法所謂自然實(shí)驗(yàn),就是發(fā)生了某些外部突發(fā)事件,使得研究對(duì)象仿佛被隨機(jī)分成了實(shí)驗(yàn)組或控制組。這是我最喜歡的方法,只是自然實(shí)驗(yàn)需要尋找一個(gè)事件,并且這個(gè)事件只影響解釋變量而不影響被解釋變量。遇著這種事件是一種緣分,還要能識(shí)別出來(lái),這對(duì)學(xué)者的眼光也是一種挑戰(zhàn)。有很多文章聲稱(chēng)使用了自然實(shí)驗(yàn),但嚴(yán)格來(lái)講,并沒(méi)有做到對(duì)研究對(duì)象進(jìn)行了隨機(jī)分組。雖然如此,我對(duì)此類(lèi)文章仍然很是喜歡。

內(nèi)生性產(chǎn)生的原因及解決方案自然實(shí)驗(yàn)包括的要素有:一個(gè)政策措施(treatment),一個(gè)觀(guān)察到的結(jié)果(outeome),一個(gè)對(duì)照組(contorlgoruP)。在評(píng)估“政策措施”對(duì)“結(jié)果”是否發(fā)揮作用時(shí),對(duì)照組充當(dāng)一個(gè)參照系。而一個(gè)“準(zhǔn)自然實(shí)驗(yàn)”和自然實(shí)驗(yàn)的區(qū)別在于處理組和對(duì)照組的選取是否隨機(jī)。這里的“結(jié)果”是以受政策影響的縣和沒(méi)有受政策影響的縣之間在增長(zhǎng)速度上的差異來(lái)衡量。簡(jiǎn)單連接改革措施和被直管縣績(jī)效的做法并不恰當(dāng)。這樣的做法無(wú)法排除其他政策或是整體經(jīng)濟(jì)的影響,因而是無(wú)法衡量改革真實(shí)效果的。17內(nèi)生性產(chǎn)生的原因及解決方案2.雙重差分法

Difference-in-Difference

(DID)一般稱(chēng)為雙重差分法,或倍差法。倘若出現(xiàn)了一次外部沖擊,這次沖擊影響了一部分樣本,對(duì)另一部分樣本則無(wú)影響,而我們想看一下這次外部沖擊到底有何影響,雙重差分法就是用來(lái)研究這次沖擊的凈效應(yīng)的。其基本思想是,將受沖擊的樣本視作實(shí)驗(yàn)組,再按照一定標(biāo)準(zhǔn)在未受沖擊的樣本中尋求與實(shí)驗(yàn)組匹配的對(duì)照組,而后做差,做差剩下來(lái)的便是這次沖擊的凈效應(yīng)。雙重差分法實(shí)際上是固定效應(yīng)的一個(gè)變種,差分的過(guò)程實(shí)際上是排除固定效應(yīng)的過(guò)程。ZERA在《計(jì)量論文寫(xiě)作和發(fā)表的黑客教程》有一個(gè)非常簡(jiǎn)明風(fēng)趣的舉例,我轉(zhuǎn)述于此,以饗讀者。內(nèi)生性產(chǎn)生的原因及解決方案DifferenceindifferencemodelsMaybethemostpopularidentificationstrategyinappliedworktodayAttemptstomimicrandomassignmentwithtreatmentand“comparison”sampleApplicationoftwo-wayfixedeffectsmodel19內(nèi)生性產(chǎn)生的原因及解決方案ProblemsetupCross-sectionalandtimeseriesdataOnegroupis‘treated’withinterventionHavepre-postdataforgroupreceivinginterventionCanexaminetime-serieschangesbut,unsurehowmuchofthechangeisduetosecularchanges20內(nèi)生性產(chǎn)生的原因及解決方案DifferenceindifferencemodelsBasictwo-wayfixedeffectsmodelCrosssectionandtimefixedeffectsUsetimeseriesofuntreatedgrouptoestablishwhatwouldhaveoccurredintheabsenceoftheinterventionKeyconcept:cancontrolforthefactthattheinterventionismorelikelyinsometypesofstates21內(nèi)生性產(chǎn)生的原因及解決方案ThreedifferentpresentationsTabularGraphicalRegressionequation22內(nèi)生性產(chǎn)生的原因及解決方案DifferenceinDifferenceBeforeChangeAfterChangeDifferenceGroup1(Treat)Yt1Yt2ΔYt=Yt2-Yt1Group2(Control)Yc1Yc2ΔYc=Yc2-Yc1DifferenceΔΔYΔYt–ΔYc23內(nèi)生性產(chǎn)生的原因及解決方案timeYt1t2Yt1Yt2treatmentcontrolYc1Yc2Treatmenteffect=(Yt2-Yt1)–(Yc2-Yc1)24內(nèi)生性產(chǎn)生的原因及解決方案KeyAssumptionControlgroupidentifiesthetimepathofoutcomesthatwouldhavehappenedintheabsenceofthetreatmentInthisexample,YfallsbyYc2-Yc1

evenwithouttheinterventionNotethatunderlying‘levels’ofoutcomesarenotimportant(returntothisintheregressionequation)25內(nèi)生性產(chǎn)生的原因及解決方案BasicEconometricModelDatavariesbystate(i)time(t)OutcomeisYitOnlytwoperiodsInterventionwilloccurinagroupofobservations(e.g.states,firms,etc.)26內(nèi)生性產(chǎn)生的原因及解決方案ThreekeyvariablesTit=1ifobsibelongsinthestatethatwilleventuallybetreatedAit=1intheperiodswhentreatmentoccursTitAit--interactionterm,treatmentstatesaftertheinterventionYit=β0+β1Tit+β2Ait+β3TitAit+εit27內(nèi)生性產(chǎn)生的原因及解決方案Yit=β0+β1Tit+β2Ait+β3TitAit+εitBeforeChangeAfterChangeDifferenceGroup1(Treat)β0+β1β0+β1+β2+β3ΔYt

=β2+β3Group2(Control)β0β0+β2ΔYc=β2DifferenceΔΔY=β328內(nèi)生性產(chǎn)生的原因及解決方案MoregeneralmodelDatavariesbystate(i)time(t)OutcomeisYitManyperiodsInterventionwilloccurinagroupofstatesbutatavarietyoftimes29內(nèi)生性產(chǎn)生的原因及解決方案uiisastateeffectvtisacompletesetofyear(time)effectsAnalysisofcovariancemodelYit=β0+β3TitAit+ui+λt+εit30內(nèi)生性產(chǎn)生的原因及解決方案GroupeffectsCapturedifferencesacrossgroupsthatareconstantovertimeYeareffectsCapturedifferencesovertimethatarecommontoallgroups31內(nèi)生性產(chǎn)生的原因及解決方案其中,d就是雙重差分估計(jì)量,Y為研究的結(jié)局變量,右側(cè)腳標(biāo)中treatment和control分布代表干預(yù)組和對(duì)照組,t0和t1分別代表干預(yù)前和干預(yù)后。構(gòu)造了差分估計(jì)量之后,就要根據(jù)不同的數(shù)據(jù)類(lèi)型和不同的結(jié)局變量Y,分別選用相應(yīng)的參數(shù)檢驗(yàn)方法來(lái)進(jìn)行建模。32內(nèi)生性產(chǎn)生的原因及解決方案(1)適用于獨(dú)立混合橫截面數(shù)據(jù)獨(dú)立混合橫截面數(shù)據(jù)是在不同時(shí)點(diǎn)從同一個(gè)的大總體內(nèi)部分別進(jìn)行隨機(jī)抽樣,將所得的數(shù)據(jù)混合起來(lái)的一種數(shù)據(jù)集。該類(lèi)數(shù)據(jù)的特點(diǎn)為每一條數(shù)據(jù)都是獨(dú)立的觀(guān)測(cè)值。通過(guò)將不同時(shí)點(diǎn)的多個(gè)觀(guān)測(cè)值結(jié)合起來(lái),從而可以加大樣本量以獲得更精密的估計(jì)量和更具功效的檢驗(yàn)統(tǒng)計(jì)量;也可加入新的變量———時(shí)間(即干預(yù)前后),以便判斷干預(yù)前后的差別。對(duì)于總體一致、范圍較大、涉及不同時(shí)間點(diǎn)的調(diào)查研究,多收集此類(lèi)數(shù)據(jù)33內(nèi)生性產(chǎn)生的原因及解決方案34內(nèi)生性產(chǎn)生的原因及解決方案35內(nèi)生性產(chǎn)生的原因及解決方案36內(nèi)生性產(chǎn)生的原因及解決方案(2)適用于綜列數(shù)據(jù)面板數(shù)據(jù)的DID模型面板數(shù)據(jù)要求在不同時(shí)點(diǎn)調(diào)查相同的研究對(duì)象。它與獨(dú)立混合橫截面數(shù)據(jù)最大的不同在于,不同時(shí)點(diǎn)的觀(guān)測(cè)值并不是獨(dú)立分布的。這類(lèi)數(shù)據(jù)的特點(diǎn)在于:由于研究的個(gè)體相同,一些不隨時(shí)間改變的不可觀(guān)測(cè)的因素(如個(gè)人特質(zhì)等)對(duì)不同時(shí)點(diǎn)的觀(guān)測(cè)值會(huì)產(chǎn)生影響,可以通過(guò)控制這些影響從而得到較為真實(shí)的結(jié)果;37內(nèi)生性產(chǎn)生的原因及解決方案38內(nèi)生性產(chǎn)生的原因及解決方案39內(nèi)生性產(chǎn)生的原因及解決方案由于一般大規(guī)模的人群調(diào)查存在較大的變異性問(wèn)題,僅在模型中納入虛擬變量“分組(A)”、“時(shí)間(T)”是遠(yuǎn)遠(yuǎn)不夠的。為了提高解釋系數(shù)R2,需要加入其他可能影響被解釋變量的因素,即控制除分組、時(shí)間變量以外的其他變量。40內(nèi)生性產(chǎn)生的原因及解決方案sscinstalldiff

helpdiffdiffy,t(treated)p(t)robust如果有控制變量,可以利用cov()添加41內(nèi)生性產(chǎn)生的原因及解決方案工具變量(instrumentalvariable,IV)回歸是當(dāng)回歸變量X與誤差項(xiàng)u相關(guān)時(shí)獲得總體回歸方程未知系數(shù)一致估計(jì)量的一般方法。我們經(jīng)常稱(chēng)其為IV估計(jì)。其基本思想是:假設(shè)方程是:我們假設(shè)ui與Xi相關(guān),則OLS估計(jì)量一定是有偏的和非一致的。工具變量估計(jì)是利用另一個(gè)“工具”變量Z將Xi分離成與ui相關(guān)和不相關(guān)的兩部分。3.工具變量法內(nèi)生性產(chǎn)生的原因及解決方案我們的工作就是要尋找相應(yīng)的工具變量將解釋變量分解成內(nèi)生變量和外生變量,然后利用兩階段最小二乘法(TSLS)進(jìn)行估計(jì)。內(nèi)生性產(chǎn)生的原因及解決方案

工具變量的選取

一個(gè)有效的工具變量必須滿(mǎn)足稱(chēng)為工具變量相關(guān)性和工具變量外生性?xún)蓚€(gè)條件:即

(1)工具變量相關(guān)性:工具變量與所替代的隨機(jī)解釋變量高度相關(guān);

(2)工具變量外生性:工具變量與隨機(jī)誤差項(xiàng)不相關(guān);

內(nèi)生性產(chǎn)生的原因及解決方案一個(gè)合適的工具變量應(yīng)該同時(shí)滿(mǎn)足兩個(gè)條件:第一要能很好地解釋內(nèi)生變量,也就是說(shuō)工具變量和內(nèi)生變量之間要足夠相關(guān);第二,工具變量要來(lái)自系統(tǒng)之外,即工具變量具備外生性。如果內(nèi)生性表現(xiàn)為聯(lián)立性問(wèn)題,第二個(gè)標(biāo)準(zhǔn)尤其必要。雖然統(tǒng)計(jì)證據(jù)可以告訴我們工具變量和內(nèi)生變量是否相關(guān),但是其背后的因果鏈條和工具變量是否具備外生性的證明一樣,必須依賴(lài)令人置信的邏輯推導(dǎo)。工具變量的外生性在回歸中表現(xiàn)為和方程的殘差項(xiàng)正交,即工具變量不會(huì)對(duì)方程被解釋變量產(chǎn)生影響,如果產(chǎn)生影響則只能通過(guò)內(nèi)生變量起作用。內(nèi)生性產(chǎn)生的原因及解決方案兩階段最小二乘估計(jì)量若工具變量Z滿(mǎn)足工具變量相關(guān)性和外生性的條件,則可用稱(chēng)為兩階段最小二乘(TSLS)的IV估計(jì)量估計(jì)系數(shù)?1。兩階段最小二乘估計(jì)量分兩階段計(jì)算:第一階段把X分解成兩部分:即與回歸誤差項(xiàng)相關(guān)的一部分以及與誤差項(xiàng)無(wú)關(guān)的一部分。第二階段是利用與誤差項(xiàng)無(wú)關(guān)的那部分進(jìn)行估計(jì)。內(nèi)生性產(chǎn)生的原因及解決方案一般IV回歸模型因變量Yi。外生解釋變量W1i、W2i、…Wri。內(nèi)生解釋變量X1i、X2i、…Xki。我們引入工具變量Z1i、Z2i、…Zmi。內(nèi)生性產(chǎn)生的原因及解決方案第一階段回歸:利用OLS建立每個(gè)內(nèi)生變量(X1i、X2i、…Xki)關(guān)于工具變量(Z1i、Z2i、…Zmi)和外生變量(W1i、W2i、…Wri)的回歸,并得到所有回歸結(jié)果的擬合值Xi_hat。第二階段回歸:用Xi_hat取代原有的Xi,與原有的外生變量Wi一起進(jìn)行第二次回歸,得到TSLS統(tǒng)計(jì)量βTSLS。注意:工具變量出現(xiàn)在第一階段回歸,但不出現(xiàn)在第二階段回歸。內(nèi)生性產(chǎn)生的原因及解決方案引入工具變量的個(gè)數(shù)假設(shè)我們有n個(gè)內(nèi)生解釋變量,引入了m個(gè)工具變量,n和m的關(guān)系是什么?n=m恰好識(shí)別n<m過(guò)度識(shí)別n>m不可識(shí)別只有恰好識(shí)別和過(guò)度識(shí)別才能用IV方法估計(jì)。內(nèi)生性產(chǎn)生的原因及解決方案兩階段最小二乘法的stata命令:ivregress2slsdepvar[varlist1](varlist2=instlist),r,first其中,“depvar”為被解釋變量,varlist1為外生解釋變量,varlist2為所有的內(nèi)生解釋變量集合,instlist為工具變量集合。選擇項(xiàng)r表示使用異方差穩(wěn)健的標(biāo)準(zhǔn)誤,選擇項(xiàng)“first”表示顯示第一階段的回歸。內(nèi)生性產(chǎn)生的原因及解決方案工具變量有效性的檢驗(yàn)工具變量相關(guān)性工具變量相關(guān)性越強(qiáng),也就是工具變量能解釋越多的X變動(dòng),則IV回歸中能用的信息就越多,因此利用相關(guān)性更強(qiáng)的工具變量得到的估計(jì)量也更精確。弱工具變量:如果雖然

但是弱工具變量幾乎不能解釋X的變動(dòng)。內(nèi)生性產(chǎn)生的原因及解決方案弱工具變量檢驗(yàn)準(zhǔn)則1.偏R2(Shea’spartialR2)含義:在第一階段回歸中,在控制外生變量影響的前提下,看其它變量對(duì)某內(nèi)生變量的解釋力,或者說(shuō),在第一階段回歸中,剔除掉外生變量的影響。2.最小特征值統(tǒng)計(jì)量F:經(jīng)驗(yàn)上F應(yīng)該大于10。Stata命令:estatfirststage,allforcenonrobust內(nèi)生性產(chǎn)生的原因及解決方案3.Cragg-DonaldWaldF統(tǒng)計(jì)量4.Kleibergen-PaapWaldrkF統(tǒng)計(jì)量”

(當(dāng)假定殘差項(xiàng)不滿(mǎn)足獨(dú)立同分布時(shí),就看這個(gè)來(lái)判斷是否弱工具,原假設(shè)是弱工具,所以拒絕原假設(shè)就可以)F檢驗(yàn)臨界值表

CHIDISTF(12(自變量數(shù)據(jù)m),600(自由度df=n(樣本數(shù))-m-1))=87.06Stata命令:ivreg2內(nèi)生性產(chǎn)生的原因及解決方案如果存在弱工具變量該怎么辦?1.如果有很多工具變量,有部分強(qiáng)工具變量和部分弱工具變量,可以舍棄較弱的工具變量而選用相關(guān)性較強(qiáng)的工具變量子集。在stata中,可以使用ivreg2命令進(jìn)行“冗余檢驗(yàn)”,以決定選擇舍棄哪個(gè)工具變量。(直觀(guān)上,冗余工具變量是那些第一階段回歸中不顯著的變量。)2.如果系數(shù)是恰好識(shí)別的,則你不能略去弱工具變量。在這種情況下,有兩個(gè)選擇:第一個(gè)選擇是尋找其他較強(qiáng)的工具變量。(難度較大)內(nèi)生性產(chǎn)生的原因及解決方案第二個(gè)選擇是利用弱工具變量繼續(xù)進(jìn)行實(shí)證分析,但采用的方法不再是TSLS。而是對(duì)弱工具變量不太敏感的有限信息極大似然法(LIML)。在大樣本下,LIML與2SLS是漸近等價(jià)的,但在存在弱工具變量的情況下,LIML的小樣本性質(zhì)可能優(yōu)于2SLS。LIML的Stata命令為ivregresslimldepvar[varlist1](varlist2=instlist)內(nèi)生性產(chǎn)生的原因及解決方案工具變量外生性的檢驗(yàn)剛才我們提到:只有恰好識(shí)別和過(guò)度識(shí)別才能用IV方法估計(jì)。一個(gè)很重要的命題是:只有過(guò)度識(shí)別情況下才能檢驗(yàn)工具變量的外生性,而恰好識(shí)別情況下無(wú)法檢驗(yàn)。內(nèi)生性產(chǎn)生的原因及解決方案過(guò)度識(shí)別約束檢驗(yàn)基本思想:假設(shè)有一個(gè)內(nèi)生回歸變量,兩個(gè)工具變量且沒(méi)有包含的外生變量。則你可以計(jì)算兩個(gè)不同的TSLS估計(jì)量:其中一個(gè)利用第一個(gè)工具變量,而另一個(gè)利用第二個(gè)工具變量。由于抽樣變異性,這兩個(gè)估計(jì)量不會(huì)相同,但如果兩個(gè)工具變量都是外生的,則這兩個(gè)估計(jì)量往往比較接近。如果由這兩個(gè)工具變量得到估計(jì)非常不同,則你可以得出其中一個(gè)或兩個(gè)工具變量都有內(nèi)生性問(wèn)題的結(jié)論。內(nèi)生性產(chǎn)生的原因及解決方案識(shí)別標(biāo)準(zhǔn):

Sargan統(tǒng)計(jì)量:ivregress2sls過(guò)程中,實(shí)際的工具變量(組)是x*與z*。Sagan檢驗(yàn)即檢驗(yàn)這些工具變量是否外生(是否與擾動(dòng)項(xiàng)相關(guān)),原假設(shè)是這些變量都與擾動(dòng)項(xiàng)不相關(guān)。利用殘差對(duì)這些工具變量回歸。

sargen檢驗(yàn)的P值應(yīng)該越大越好,一般超過(guò)0.1既可以說(shuō)明不能拒絕工具變量有效的零假設(shè),不宜接近于1,一般大于0.4就是危險(xiǎn)信號(hào),工具變量過(guò)多,導(dǎo)致檢驗(yàn)結(jié)果不可信。

Sargan統(tǒng)計(jì)量服從自由度為L(zhǎng)-k的卡方分布,查表。在excel中輸入CHIDIST(x,iv-v),其中x是sargan統(tǒng)計(jì)量的值,iv是工具變量的秩,v是估計(jì)參數(shù)個(gè)數(shù)?;剀?chē)。

內(nèi)生性產(chǎn)生的原因及解決方案HansenJ統(tǒng)計(jì)量C統(tǒng)計(jì)量,說(shuō)明采用工具變量的合理性過(guò)度識(shí)別檢驗(yàn)的Stata命令:estatoverid內(nèi)生性產(chǎn)生的原因及解決方案xtabond2alsoreportstestsofover-identifyingrestrictions--ofwhetherthe

instruments,asagroup,appearexogenous.

Forone-step,non-robustestimation,itreportstheSarganstatistic,whichistheminimizedvalueoftheone-stepGMMcriterionfunction.

TheSarganstatisticisnotrobusttoheteroskedasticityorautocorellation.

Soforone-step,robustestimation(穩(wěn)健估計(jì)andforalltwo-stepestimation),xtabond2alsoreportstheHansenJstatistic,whichistheminimizedvalueofthetwo-stepGMMcriterionfunction,andisrobust.xtabond2stillreportstheSarganstatisticinthesecasesbecausetheJtesthasitsownproblem:itcanbegreatlyweakenedbyinstrumentproliferation.內(nèi)生性產(chǎn)生的原因及解決方案究竟該用OLS還是工具變量法豪斯曼檢驗(yàn)原假設(shè)為:H0:所有解釋變量均為外生變量regyx1x2eststoreolsivregress2slsyx1(x2=z1z2)eststoreivhausmanivols,sigmamore內(nèi)生性產(chǎn)生的原因及解決方案上述檢驗(yàn)的缺點(diǎn)是,它假設(shè)在H0成立的情況下,OLS最有效率。但如果存在異方差,OLS并不最有效率(不是BLUE)。故傳統(tǒng)的豪斯曼檢驗(yàn)不適用于異方差的情形。此時(shí)可以使用杜賓-吳-豪斯曼檢驗(yàn)(DWH),該檢驗(yàn)在異方差的情況下也適用,更為穩(wěn)健。stata命令:estatendogenous

為負(fù)值不存在內(nèi)生性?xún)?nèi)生性產(chǎn)生的原因及解決方案例一Mincer(1958)最早研究了工資與受教育年限的正相關(guān)關(guān)系,但遺漏了“能力”這個(gè)變量,導(dǎo)致遺漏變量偏差。針對(duì)美國(guó)面板調(diào)查數(shù)據(jù)中的年輕男子組群(YoungMen’sCohortoftheNationalLongitudinalSurvey,簡(jiǎn)記NLS-Y),Griliches(1976)采用工具變量法對(duì)遺漏變量問(wèn)題進(jìn)行了校正。BlackburnandNeumark(1992)更新了Griliches(1976)的數(shù)據(jù),即這個(gè)例子中將要使用的數(shù)據(jù)集grilic.dta。內(nèi)生性產(chǎn)生的原因及解決方案該數(shù)據(jù)集中包括以下變量:lw(工資對(duì)數(shù)),s(受教育年限),age(年齡),expr(工齡),tenure(在現(xiàn)單位的工作年數(shù)),iq(智商),med(母親的受教育年限),kww(在“knowledgeoftheWorldofWork”測(cè)試中的成績(jī)),mrt(婚姻虛擬變量,已婚=1),rns(美國(guó)南方虛擬變量,住在南方=1),smsa(大城市虛擬變量,住在大城市=1),year(有數(shù)據(jù)的最早年份,1966—1973年中的某一年)。內(nèi)生性產(chǎn)生的原因及解決方案這是一個(gè)兩期面板數(shù)據(jù),初始期為當(dāng)以上變量有數(shù)據(jù)的最早年份,結(jié)束期為1980年。不帶80字樣的變量名為初始期,帶80字樣的變量名為1980年數(shù)據(jù)。比如,iq指的是初始期的智商,而lw80指的是1980年的工資對(duì)數(shù)。內(nèi)生性產(chǎn)生的原因及解決方案(1)先看一下數(shù)據(jù)的統(tǒng)計(jì)特征。usegrilic.dta,clearsum(2)考察智商與受教育年限的相關(guān)關(guān)系。pwcorriqs,sig(3)建立如下方程:reglw80s80expr80tenure80內(nèi)生性產(chǎn)生的原因及解決方案

繼續(xù)對(duì)方程進(jìn)行分析:我們發(fā)現(xiàn)了如下問(wèn)題:1。遺漏變量問(wèn)題:認(rèn)為方程遺漏了“能力”這個(gè)變量,加入iq(智商)作為“能力”的代理變量。reglw80s80iqexpr80tenure80內(nèi)生性產(chǎn)生的原因及解決方案2。測(cè)量誤差問(wèn)題:iq(智商)對(duì)“能力”的測(cè)量存在誤差。3。變量?jī)?nèi)生性問(wèn)題:s80可能與擾動(dòng)項(xiàng)中除“能力”以外的其他因素相關(guān),因此是內(nèi)生變量。解決方法:引入四個(gè)變量med,kww,mrt,age,作為內(nèi)生解釋變量iq與s80的工具變量。然后使用TSLS方法進(jìn)行回歸。ivregress2slslw80expr80tenure80(s80iq=medkwwmrtage),first內(nèi)生性產(chǎn)生的原因及解決方案也可以使用GMM估計(jì)方法使用兩步GMM。

ivregressgmmlw80expr80tenure80(s80iq=medkwwmrtage)使用迭代GMM。

ivregressgmmlw80expr80tenure80(s80iq=medkwwmrtage),igmm內(nèi)生性產(chǎn)生的原因及解決方案幾點(diǎn)注意事項(xiàng):1。first選項(xiàng)的目的是顯示TSLS第一階段的結(jié)果,如果省略,則僅顯示第二階段的結(jié)果。2。命令的用法比較嚴(yán)格,將被解釋變量和所有外生解釋變量放到括號(hào)外面,內(nèi)生解釋變量放到括號(hào)里面,等號(hào)后面為所有工具變量。3。2SLS只能通過(guò)stata完成,利用定義手動(dòng)計(jì)算的結(jié)果是錯(cuò)誤的,因?yàn)闅埐钚蛄惺清e(cuò)誤的。內(nèi)生性產(chǎn)生的原因及解決方案4。不可能單獨(dú)為每個(gè)內(nèi)生變量指定一組特定的工具變量,而是給所有內(nèi)生變量指定一系列工具變量。5。所有外生變變量都作為自己的工具變量。6。為了檢驗(yàn)工具變量的外生性,本題為過(guò)度識(shí)別。7。在大樣本下,IV估計(jì)是一致的,但在小樣本下,IV估計(jì)并非無(wú)偏估計(jì)量,有些情況下偏誤可能很?chē)?yán)重。內(nèi)生性產(chǎn)生的原因及解決方案弱工具變量檢驗(yàn)檢驗(yàn)方法:1。初步判斷可以用偏R2(partialR2)(剔除掉模型中原有外生變量的影響)。

2。Minimumeigenvaluestatistic(最小特征值統(tǒng)計(jì)量),經(jīng)驗(yàn)上此數(shù)應(yīng)該大于10。這個(gè)方法類(lèi)似于與書(shū)上的“第一階段F統(tǒng)計(jì)量”。內(nèi)生性產(chǎn)生的原因及解決方案工具變量外生性檢驗(yàn)我們一般稱(chēng)為過(guò)度識(shí)別約束J檢驗(yàn)。

檢驗(yàn)工具變量是否與干擾項(xiàng)相關(guān),即工具變量是否為外生變量。TSLS根據(jù)Sargan統(tǒng)計(jì)量進(jìn)行過(guò)度識(shí)別檢驗(yàn)。命令為:estatoverid檢驗(yàn)工具變量的外生性。

H0:所有工具變量都是外生的。

H1:至少有一個(gè)工具變量不是外生的,與擾動(dòng)項(xiàng)相關(guān)。內(nèi)生性產(chǎn)生的原因及解決方案

ivregress2slslw80expr80tenure80(s80iq=medkwwmrtage),firstestatfirststage,allforcenonrobustestatfirststageestatoverid內(nèi)生性產(chǎn)生的原因及解決方案究竟該用OLS還是IV解釋變量是否真的存在內(nèi)生性?假設(shè)能夠找到方程外的工具變量。1。如果所有解釋變量都是外生變量,則OLS比IV更有效。在這種情況下使用IV,雖然估計(jì)量仍然是一致的,會(huì)增大估計(jì)量的方差。2。如果存在內(nèi)生解釋變量,則OLS是不一致的,而IV是一致的。內(nèi)生性產(chǎn)生的原因及解決方案4.

動(dòng)態(tài)面板回歸法基本思想是將解釋變量和被解釋變量的滯后項(xiàng)作為工具變量(IV)。其實(shí),我是不認(rèn)可這種處理方法,除非萬(wàn)不得已,我不推薦這種方法,我也不太相信這種方法能真正緩解內(nèi)生性問(wèn)題。內(nèi)生性產(chǎn)生的原因及解決方案廣義矩估計(jì)法:GMM基本思想:求解如下一般化目標(biāo)函數(shù),使之最小化

J(b_GMM)=n*g(b_GMM)'*W*g(b_GMM)

其中,W為權(quán)重矩陣在球型擾動(dòng)項(xiàng)的假定下,2SLS是最有效的。但如果擾動(dòng)項(xiàng)存在異方差或自相關(guān),則廣義矩估計(jì)方法效果更好。GMM方法又分為兩步GMM法和迭代GMM方法。內(nèi)生性產(chǎn)生的原因及解決方案異方差性是相對(duì)于同方差而言的。所謂同方差,是為了保證回歸參數(shù)估計(jì)量具有良好的統(tǒng)計(jì)性質(zhì),經(jīng)典線(xiàn)性回歸模型的一個(gè)重要假定:總體回歸函數(shù)中的隨機(jī)誤差項(xiàng)滿(mǎn)足同方差性,即它們都有相同的方差。如果這一假定不滿(mǎn)足,即:隨機(jī)誤差項(xiàng)具有不同的方差,則稱(chēng)線(xiàn)性回歸模型存在異方差性。對(duì)于模型

如果隨機(jī)誤差項(xiàng)的各期望值之間存在著相關(guān)關(guān)系,即

這時(shí),稱(chēng)隨機(jī)誤差項(xiàng)之間存在自相關(guān)性(autocorrelation)或序列相關(guān)內(nèi)生性產(chǎn)生的原因及解決方案有關(guān)GMM的Stata命令為ivregressgmmyx1(x2=z1z2)(兩步GMM)ivregressgmmyx1(x2=z1z2),igmm(迭代GMM)estatoverid(過(guò)度識(shí)別檢驗(yàn))內(nèi)生性產(chǎn)生的原因及解決方案例二reglwsexprtenurernssmsa,r

引入智商(iq)作為“能力”的代理變量,再進(jìn)行OLS回歸。reglwsiqexprtenurernssmsa,r內(nèi)生性產(chǎn)生的原因及解決方案(2)由于用iq來(lái)度量能力存在“測(cè)量誤差”,故iq是內(nèi)生變量,考慮使用變量(med,kww,mrt,age)作為iq的工具變量,進(jìn)行2SLS回歸,并使用穩(wěn)健標(biāo)準(zhǔn)誤。ivregress2slslwsexprtenurernssmsa(iq=medkwwmrtage),rfirst(3)進(jìn)行過(guò)度識(shí)別檢驗(yàn),考察是否所有工具變量均外生,即與擾動(dòng)項(xiàng)不相關(guān)。

estatoverid內(nèi)生性產(chǎn)生的原因及解決方案(4)我們懷疑(mrt,age)不滿(mǎn)足外生性,故使用C統(tǒng)計(jì)量檢驗(yàn)這兩個(gè)工具變量的外生性。finditivreg2ivreg2lwsexprtenurernssmsa(iq=medkwwmrtage),rorthog(mrtage)(5)考慮僅使用變量(med,kww)作為iq的工具變量,再次進(jìn)行2SLS回歸。ivregress2slslwsexprtenurernssmsa(iq=medkww),rfirst內(nèi)生性產(chǎn)生的原因及解決方案再次進(jìn)行過(guò)度識(shí)別檢驗(yàn):estatoverid(6)弱工具變量檢驗(yàn)estatfirststage,allforcenonrobust(7)為了穩(wěn)健起見(jiàn),下面使用對(duì)弱工具變量更不敏感的有限信息最大似然法(LIML):ivregresslimllwsexprtenurernssmsa(iq=medkww),r內(nèi)生性產(chǎn)生的原因及解決方案(8)進(jìn)一步考察弱工具變量問(wèn)題,對(duì)工具變量kww進(jìn)行冗余檢驗(yàn)ivreg2lwsexprtenurernssmsa(iq=medkww),rredundant(kww)(9)利用豪斯曼檢驗(yàn)判斷是否存在內(nèi)生解釋變量。quireglwiqsexprtenurernssmsaeststoreols1quiivregress2slslwsexprtenurernssmsa(iq=medkww)estimatesstoreiv1hausmaniv1ols1,sigmamore內(nèi)生性產(chǎn)生的原因及解決方案(10)由于傳統(tǒng)的豪斯曼檢驗(yàn)在異方差的情形下不成立,下面進(jìn)行異方差穩(wěn)健的DWH檢驗(yàn):estatendogenous異方差下也可以利用ivreg2命令進(jìn)行文件的內(nèi)生性檢驗(yàn):ivreg2lwsexprtenurernssmsa(iq=medkww),rendog(iq)內(nèi)生性產(chǎn)生的原因及解決方案(11)如果存在異方差,則GMM比2SLS更有效率。為此,進(jìn)行如下最優(yōu)GMM估計(jì)。ivregressgmmlwsexprtenurernssmsa(iq=medkww)進(jìn)行過(guò)度識(shí)別檢驗(yàn):estatoverid考慮迭代GMM:ivregressgmmlwsexprtenurernssmsa(iq=med

kww),igmm

內(nèi)生性產(chǎn)生的原因及解決方案(12)結(jié)果的完整展現(xiàn):

quireglwsexprtenurernssmsa,reststoreols_no_iqquireglwiqsexprtenurernssmsa,reststoreols_with_iqquiivregress2slslwsexprtenurernssmsa(iq=medkww),reststoretslsquiivregresslimllwsexprtenurernssmsa(iq=medkww),reststorelimlquiivregressgmmlwsexprtenurernssmsa(iq=medkww)eststoregmmquiivregressgmmlwsexprtenurernssmsa(iq=medkww),igmmeststoreigmmoutreg2[ols_no_iqols_with_iqtslslimlgmmigmm]usingoutput.doc,replaceseeout內(nèi)生性產(chǎn)生的原因及解決方案遇到內(nèi)生性問(wèn)題如何處理1.使用內(nèi)生解釋變量的滯后變量作為工具變量。2.尋找有創(chuàng)意的工具變量。內(nèi)生性產(chǎn)生的原因及解決方案內(nèi)生性的其它解決辦法(1)代理變量:某變量無(wú)法直接觀(guān)測(cè),而用其它變量替代。

(2)前定變量:用變量的前一期或前幾期數(shù)據(jù)。

(3)面板數(shù)據(jù)模型。

到底如何對(duì)待內(nèi)生性問(wèn)題(1)需要重點(diǎn)考慮的問(wèn)題之一;

(2)最好的收集數(shù)據(jù)之前就加以考慮,尤其是準(zhǔn)備獲取一手?jǐn)?shù)據(jù)的情況下。如果考慮?應(yīng)用經(jīng)濟(jì)理論。內(nèi)生性產(chǎn)生的原因及解決方案本實(shí)例使用數(shù)據(jù)集“grilic.dta”??疾熘巧膛c受教育年限的相關(guān)關(guān)系:上表顯示,智商(在一定程度上可以視為能力的代理變量)與受教育年限具有強(qiáng)烈的正相關(guān)關(guān)系(相關(guān)系數(shù)為0.51)。作為一個(gè)參考系,先進(jìn)行OLS回歸,并使用穩(wěn)健標(biāo)準(zhǔn)差:內(nèi)生性產(chǎn)生的原因及解決方案內(nèi)生性產(chǎn)生的原因及解決方案其中expr,tenure,rns,smsa均為控制變量,而我們主要感興趣的是變量受教育年限(s)?;貧w的結(jié)果顯示,教育投資的年回報(bào)率為10.26%,這個(gè)似乎太高了??赡艿脑蚴牵捎谶z漏變量“能力”與受教育正相關(guān),故“能力”對(duì)工資的貢獻(xiàn)也被納入教育的貢獻(xiàn),因此高估了教育的回報(bào)率。引入智商iq作為能力的代理變量,再進(jìn)行OLS回歸:內(nèi)生性產(chǎn)生的原因及解決方案內(nèi)生性產(chǎn)生的原因及解決方案雖然教育的投資回報(bào)率有所下降,但是依然很高。由于用iq作為能力的代理變量有測(cè)量誤差,故iq是內(nèi)生變量,考慮使用變量(med(母親的受教育年限)、kww(在“knowledgeoftheWorldofWork”中的成績(jī))、mrt(婚姻虛擬變量,已婚=1)age(年齡))作為iq的工具變量,進(jìn)行2SLS回歸,并使用穩(wěn)健的標(biāo)準(zhǔn)差:內(nèi)生性產(chǎn)生的原因及解決方案內(nèi)生性產(chǎn)生的原因及解決方案在此2SLS回歸中,教育回報(bào)率反而上升到13.73%,而iq對(duì)工資的貢獻(xiàn)居然為負(fù)值。使用工具變量的前提是工具變量的有效性。為此,進(jìn)行過(guò)度識(shí)別檢驗(yàn),考察是否所有的工具變量均外生,即與擾動(dòng)項(xiàng)不相關(guān):結(jié)果強(qiáng)烈拒絕所有工具變量均外生的原假設(shè)??紤]僅使用變量(med,kww)作為iq的工具變量,再次進(jìn)行2SLS回歸,同時(shí)顯示第一階段的回歸結(jié)果:內(nèi)生性產(chǎn)生的原因及解決方案內(nèi)生性產(chǎn)生的原因及解決方案上表顯示,教育的回報(bào)率為6.08%,較為合理,再次進(jìn)行過(guò)度識(shí)別檢驗(yàn):接受原假設(shè),認(rèn)為(med,kww)外生,與擾動(dòng)項(xiàng)不相關(guān)。進(jìn)一步考察有效工具變量的第二個(gè)條件,即工具變量與內(nèi)生變量的相關(guān)性。從第一階段的回歸結(jié)果可以看出,工具變量對(duì)內(nèi)生變量具有較好的解釋力。更正式的檢驗(yàn)如下內(nèi)生性產(chǎn)生的原因及解決方案內(nèi)生性產(chǎn)生的原因及解決方案從以上結(jié)果可看出,雖然Shea’spartialR^2不到0.04,但是F統(tǒng)計(jì)量為13.40>10。我們知道,雖然2SLS是一致的,但卻是有偏的,故使用2SLS會(huì)帶來(lái)“顯著性水平扭曲”(sizedistortion),而且這種扭曲隨著弱工具變量而增大。上表的最后部分顯示,如果在結(jié)構(gòu)方程中對(duì)內(nèi)生解釋變量的顯著性進(jìn)行“名義顯著性水平”(nominalsize)為5%的沃爾德檢驗(yàn),加入可以接受的“真實(shí)顯著性水平”(truesize)不超過(guò)15%,則可以拒絕“弱工具變量”的原假設(shè),因?yàn)樽钚√卣髦到y(tǒng)計(jì)量為14.91,大于臨界值11.59??傊覀冇欣碛烧J(rèn)為不存在弱工具變量。但為了穩(wěn)健起見(jiàn),下面使用對(duì)弱工具變量更不敏感的有限信息最大似然法(LIML):內(nèi)生性產(chǎn)生的原因及解決方案內(nèi)生性產(chǎn)生的原因及解決方案結(jié)果發(fā)現(xiàn),LIML的系數(shù)估計(jì)值與2SLS

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論