一文讀懂傾向匹配得分Stata及R操作應(yīng)用_第1頁(yè)
一文讀懂傾向匹配得分Stata及R操作應(yīng)用_第2頁(yè)
一文讀懂傾向匹配得分Stata及R操作應(yīng)用_第3頁(yè)
一文讀懂傾向匹配得分Stata及R操作應(yīng)用_第4頁(yè)
一文讀懂傾向匹配得分Stata及R操作應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、文讀懂傾向匹配得分Stata及R操作應(yīng)用本文將介紹Stata及R軟件進(jìn)行傾向匹配得分操作應(yīng)用,主要包括傾向匹配得分命令簡(jiǎn)介、語(yǔ)法格式、傾向匹配得分操作步驟思路,涉及傾向匹配得分應(yīng)用、平衡性檢驗(yàn)、共同取值范圍檢驗(yàn)、核密度函數(shù)圖等內(nèi)容。1命令簡(jiǎn)介Statadoesnothaveabuilt-incommandforpropensityscorematching,anon-experimentalmethodofsamplingthatproducesacontrolgroupwhosedistributionofcovariatesissimilartothatofthetreatedgroup.

2、However,thereareseveraluser-writtenmodulesforthismethod.Thefollowingmodulesareamongthemostpopular:Stata沒(méi)有一個(gè)內(nèi)置的傾向評(píng)分匹配的命令,一種非實(shí)驗(yàn)性的抽樣方法,它產(chǎn)生一個(gè)控制組,它的協(xié)變量分布與被處理組的分布相似。但是,這個(gè)方法有幾個(gè)用戶編寫(xiě)的模塊。以下是最受歡迎的模塊(主要有如下幾個(gè)外部命令)psmatch2.adopscore.adonnmatch.adopsmatch2.adowasdevelopedbyLeuvenandSianesi(2003)andpscore.adobyBeck

3、erandIchino(2002).Morerecently,Abadie,Drukker,Herr,andImbens(2004)introducednnmatch.ado.Allthreemodulessupportpair-matchingaswellassubclassification.Ycommandasfollows:netsearchpsmatch2netsearchpscorenetsearchnnmatchYcommand,forexample:sscinstallpsmatch2,replaceAfterinstallation,readthehelpfilestofin

4、dthecorrectusage,forexample:helppsmatch2上述主要介紹了如何獲得PSM相關(guān)的命令,總結(jié)一下目前市面上用的較好的命令為osmatch2.PSM相關(guān)命令helppsmatch2helpnnmatchhelppsmatchhelppscore持續(xù)獲取最新的PSM信息和程序持續(xù)獲取最新的PSM信息和程序finditpropensityscorefinditmatchingpsmatch2isbeingcontinuouslyimprovedanddeveloped.Makesuretokeepyourversionup-to-dateasfollowssscins

5、tallpsmatch2,replacewhereyoucancheckyourversionasfollows:whichpsmatch22語(yǔ)法格式語(yǔ)法格式為:helppsmatch2psmatch2depvarindepvarsifexpinrange,outcome(varlist)pscore(varname)neighbor(integer)radiuscaliper(real)mahalanobis(varlist)ai(integer)populationaltvariancekernelllrkerneltype(type)bwidth(real)splinenknots(in

6、teger)commontrim(real)noreplacementdescendingoddsindexlogittiesquietlyw(matrix)ate選項(xiàng)含義為:depvar因變量;indepvars表示協(xié)變量;outcome(varlist)表示結(jié)果變量;logit指定使用logit模型進(jìn)行擬合,默認(rèn)的是probit模型;neighbor脂定按照1:1進(jìn)行匹配,如果要按照1:3進(jìn)行匹配,則設(shè)定為neighbor);radius表示半徑匹配核匹配(Kernelmatching)其他匹配方法廣義精確匹配(CoarsenedExactMatching)|helpcem局部線性回歸匹配

7、(Locallinearregressionmatching)樣條匹配(Splinematching)樣條匹配(Splinematching)馬氏匹配(Mahalanobismatching)pstest$X,both做匹配前后的均衡性檢驗(yàn),理論上說(shuō)此處只能對(duì)連續(xù)變量做均衡性檢驗(yàn),對(duì)分類(lèi)變量的均衡性檢驗(yàn)應(yīng)該重新整理數(shù)據(jù)后運(yùn)用c2檢驗(yàn)或者秩和檢驗(yàn)。但此處對(duì)于分類(lèi)變量也有一定的參考價(jià)值。psgraph對(duì)匹配的結(jié)果進(jìn)行圖示。3Stata操作與應(yīng)用政策背景:國(guó)家支持工作示范項(xiàng)目(NationalSupportedWork,NSW)研究目的:檢驗(yàn)接受該項(xiàng)目(培訓(xùn))與不接受該項(xiàng)目(培訓(xùn))對(duì)工資的影響。基本

8、思想:分析接受培訓(xùn)組(處理組,treatmentgroup)接受培訓(xùn)行為與不接受培訓(xùn)行為在工資表現(xiàn)上的差異。但是,現(xiàn)實(shí)可以觀測(cè)到的是處理組接受培訓(xùn)的事實(shí),而處理組沒(méi)有接受培訓(xùn)會(huì)怎樣是不可能觀測(cè)到的,這種狀態(tài)也成為反事實(shí)(counterfactual)。匹配法就是為了解決這種不可觀測(cè)事實(shí)的方法。在傾向得分匹配方法(PropensityScoreMatching)中,根據(jù)處理指示變量將樣本分為兩個(gè)組,一是處理組,在本例中就是在NSW實(shí)施后接受培訓(xùn)的組;二是對(duì)照組(comparisongroup),在本例中就是在NSW實(shí)施后不接受培訓(xùn)的組。傾向得分匹配方法的基本思想是,在處理組和對(duì)照組樣本通過(guò)一定的

9、方式匹配后,在其他條件完全相同的情況下,通過(guò)接受培訓(xùn)的組(處理組)與不接受培訓(xùn)的組(對(duì)照組)在工資表現(xiàn)上的差異來(lái)判斷接受培訓(xùn)的行為與工資之間的因果關(guān)系。1、首先進(jìn)行數(shù)據(jù)結(jié)構(gòu)查看useldw_exper.dta,cleareddesc結(jié)果為:g數(shù)琳輯器屣輯-I竝邙曰文唄R編輯(E:視國(guó)懈叨工具nodegree80142123214124-10-7474514951.3414*dcContainsdatafromlchcxper.dtibs:vars;44512擁Jan201312:47storagedisplayvariableraitotypeformatlabelvariablelabelt

10、byte灌啣participatiorinjobtrainingprognn死已byt&educbytess.agyearsofeducationblackbyteindicatorforAfrican-Americanhi印byteindicatorforHispanicmarriedbyteindicatorformarried2、描述性分析嘰indicatorfornwrethangradeschoolbutlesstharhigh-schooleducationre74float3.3grealearningsIn1974(inthouundsof1371$re75floatreale

11、arningsin1975(inthousandstrf1978$)re73floatrealearningsLn19Z8(irthousandsof1978$)tabulatet,flDatzsummarizee78炸ansstandardindicatorforunemployedin19744i片川fh+at#nrlAnciFnlAl/aH107b:I.三.匸*才亠ill口#勺rri-Iflitabulatet#summarize(re78)meansstandardparttLcipationiijobtrainingprogramSunnaryofrealearningsin1976

12、(inthcusandsof1978$)MeanStd.Dev.a3、傾向匹配彳4*55480尋分6.34914545,48383667.B67W73.1首先進(jìn)沸IE序,生成隨機(jī)數(shù)種子4的4setseed20180105產(chǎn)生隨機(jī)數(shù)種子genu=runiformsortu/排序或者orderu3.2傾向匹配得分localv1tlocalv2ageedublackhispmarriedre74re75u74u75globalxv1v2psmatch2$x,out(re78)neighbor(1)atetieslogitcommon/1:1匹配$表示引用宏變量,等價(jià)于psmatch2tageedub

13、lackhispmarriedre74re75u74u75,out(re78)neighbor(1)atetieslogitcommon結(jié)果為:3.3查看匹配后數(shù)據(jù)結(jié)果為:打開(kāi)數(shù)據(jù)編輯窗口,會(huì)發(fā)現(xiàn)軟件自動(dòng)生成了幾個(gè)新變量:其中_pscore是每個(gè)觀測(cè)值對(duì)應(yīng)的傾向值;小是自動(dòng)生成的每一個(gè)觀測(cè)對(duì)象唯一的ID(事實(shí)上這列變量即是對(duì)_pscore排序);_treated表示某個(gè)對(duì)象是否試驗(yàn)組;_n1表示的是他被匹配到的對(duì)照對(duì)象的d(如果是1:3匹配,還會(huì)生成2,_n3);_pdi俵示一組匹配了的觀察對(duì)象他們概率值的差。3.4均衡性檢驗(yàn)pstest$v2,bothgraph結(jié)果為:3.5共同取值范圍ps

14、graph結(jié)果為:3.6核密度函數(shù)圖twoway(kdensity_psif_treat=1,legend(label(1Treat)(kdensity_psif_treat=0,legend(label(2Control),xtitle(Pscore)title(BeforeMatching).twoway(kdensity_psif_treat=1,legend(label(1Treat)(kdensity_psif(_weight!=1&_weight!=.),legend(label(2Control),xtitle(Pscore)title(AfterMatching)結(jié)果為:3R操

15、作與應(yīng)用描述:這是國(guó)家支持工作示范(NSW)處理組數(shù)據(jù)的子樣本和當(dāng)前人口調(diào)查(CPS)的比較樣本。Lalonde(1986)、Dehejia和Wahba(1999)對(duì)這些數(shù)據(jù)進(jìn)行了廣泛的分析。R軟件操作傾向匹配得分的函數(shù)安裝包比較多,下面介紹一種,叫做Matching,其他的還有Matchit等。使用Matching前,需要先進(jìn)行安裝:install.packages(“Matching)就可以安裝了。1、首先進(jìn)行數(shù)據(jù)查看data(lalonde)summary(lalonde)ageeducblackMin.:17.00Min.:3.0Min.:0.00001stQu.:20.001stQu

16、.:9.01stQu.:1.0000Median:24.00Median:10.0Median:1.0000Mean:25.37Mean:10.2Mean:0.83373rdQu.:28.003rdQu.:11.03rdQu.:1.0000Max.:55.00Max.:16.0Max.:1.0000hispmarriedMin.:0.00000Min.:0.00001stQu.:0.000001stQu.:0.0000Median:0.00000Median:0.0000Mean:0.08764Mean:0.16853rdQu.:0.000003rdQu.:0.0000Max.:1.00000

17、Max.:1.0000nodegrre74Min.:0.000Min.:0.01stQu.:1.0001stQu.:0.0Median:1.000Median:0.0Mean:0.782Mean:2102.33rdQu.:1.0003rdQu.:824.4Max.:1.000Max.:39570.7re75re78u74Min.:0Min.:0Min.:0.00001stQu.:01stQu.:01stQu.:0.0000Median:0Median:3702Median:1.0000Mean:1377Mean:5301Mean:0.73263rdQu.:12213rdQu.:81253rdQ

18、u.:1.0000Max.:25142Max.:60308Max.:1.0000u75treatMin.:0.0000Min.:0.00001stQu.:0.00001stQu.:0.0000Median:1.0000Median:0.0000Mean:0.6494Mean:0.41573rdQu.:1.00003rdQu.:1.0000Max.:1.0000Max.:1.0000View(lalonde)結(jié)果為:數(shù)據(jù)介紹:包含對(duì)以下12個(gè)變量的445個(gè)觀察值。age表示年齡educ:受教育年限black:是否為黑人hispan:是否為西班牙裔married:是否已婚nodegree:是否沒(méi)有畢業(yè)文憑。re74,1974年的實(shí)際收入。re75,1975年的實(shí)際收入。re78,1978年的實(shí)際收入。u74,1974年的收入指標(biāo)變量為零。u75,1975年收入的指標(biāo)變量為零。treat:是否接受職業(yè)培訓(xùn)。2、估計(jì)傾向匹配模型glm1-glm(treatage+I(ageA2)+educ+I(educA2)+black+hisp+married+nodegr+re74+I(re74A2)+re75+I(re75A2)+u74+u75,family=binomial,data=lalonde)3保存數(shù)據(jù)對(duì)象X-glm1$fittedY-lalonde$

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論