版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
因果推論新思維反事實分析架構(gòu)第1頁,共102頁,2023年,2月20日,星期五06.09.061因果推論:從古到今參考JudeaPearl(professorofComputerScienceandStatisticsanddirectoroftheCognitiveSystemsLaboratory,UCLA)/LECTURE/lecture_sec1.htm第2頁,共102頁,2023年,2月20日,星期五06.09.061因果推論:從古到今從亞當(dāng)與夏娃說起:亞當(dāng)與夏娃吃過智慧樹的果子後,他們已經(jīng)是因果解釋的專家。當(dāng)上帝問亞當(dāng)你是否吃了智慧樹的果子時(詢問事實),亞當(dāng)?shù)幕卮鹗牵骸付[給我的那個女人,從樹上拿了果子讓我吃了」(不只是說明事實,還做了解釋);上帝問夏娃,夏娃回答是:「我是吃了,可是是蛇誘惑和欺騙了我」。第3頁,共102頁,2023年,2月20日,星期五06.09.061因果推論:從古到今聖經(jīng)故事的意涵:因果解釋是一個man-madeconcept。因果解釋是拿來歸咎責(zé)任的。只有神(為了某些目的)、人與動物(有自有意志)可以讓事情發(fā)生,而不是東西(objects)或物理的過程(physicalprocesses)。第4頁,共102頁,2023年,2月20日,星期五06.09.061因果推論:從古到今但當(dāng)工程師開始建造有許多滑輪及繩纜的system來幫人做事後,physicalobjects開始有了因果的特性。當(dāng)系統(tǒng)無法運作時,歸咎於神或人並沒有用,比較有效的解釋是滑輪或繩纜壞了,只要加以替換後,系統(tǒng)就可再運作。至此,causes之概念有雙重意義:thetargetsofcreditandblamethecarriersofphysicalflowofcontrolontheother
第5頁,共102頁,2023年,2月20日,星期五06.09.061因果推論:從古到今至文藝復(fù)興時,當(dāng)上帝做為finalcause逐漸被人的科學(xué)知識所取代時,這雙重意義遇到困難與挑戰(zhàn)。Galileo在1638年出版Discorsi(兩門新科學(xué)的對話)這本書後,有了革命性的轉(zhuǎn)變。此書有兩項重要的格言(maxims):第6頁,共102頁,2023年,2月20日,星期五06.09.061因果推論:從古到今1.先描述,後解釋(Descriptionfirst,explanationsecond):Thehowprecedesthewhy.Asknot,saidGalileo,whetheranobjectfallsbecauseitispulledfrombeloworpushedfromabove.Askhowwellyoucanpredictthetimeittakesfortheobjecttotravelacertaindistance,andhowthattimewillvaryfromobjecttoobject,andastheangleofthetrackchanges.
2.以數(shù)學(xué)(方程式)來描述,而不是語言:如d=t2
。第7頁,共102頁,2023年,2月20日,星期五06.09.061因果推論:從古到今從此,物理學(xué)充滿了有用但未被解釋的經(jīng)驗法則,如Snelllaw,Hooke’slaw,Ohm’slaw,Joule’slaw。另一項比預(yù)測實驗結(jié)果更重要的是代數(shù)方程式的運用,因為工程師除了可以問“howto”外,還可以問“whatif”。第8頁,共102頁,2023年,2月20日,星期五06.09.061因果推論:從古到今至啟蒙時代,DavidHume將Galileo的第一項格言發(fā)揮至極致,他認為
theWHYisnotmerelysecondtotheHOW,butthattheWHYistotallysuperfluousasitissubsumedbytheHOW。Onpage156ofTreatiseofHumanNature:"ThusweremembertohaveseenthatspeciesofobjectwecallFLAME,andtohavefeltthatspeciesofsensationwecallHEAT.Welikewisecalltomindtheirconstantconjunctioninallpastinstances.Withoutanyfartherceremony,wecalltheoneCAUSEandtheotherEFFECT,andinfertheexistenceoftheonefromthatoftheother."第9頁,共102頁,2023年,2月20日,星期五06.09.061因果推論:從古到今從實證主義的角度來看,Hume是在說“AcausedB”與“WheneverAoccurs,thenBdoes”相同。但是我們都知道雞啼是伴隨著朝陽,但雞啼並不是讓太陽出來的原因。大難題1:如果如Hume所說,我們的知識是來自於經(jīng)驗,而經(jīng)驗是以相關(guān)的形式存於我們的心靈中,那我們?nèi)绾蔚玫揭蚬矫娴闹R?Ifregularityofsuccessionisnotsufficient;whatWOULDbesufficient?
第10頁,共102頁,2023年,2月20日,星期五06.09.061因果推論:從古到今大難題2:我們知道某些關(guān)連有或沒有因果間的關(guān)係,有何差別嗎?知道因果又有何用?當(dāng)然知道因果關(guān)係,就可以做某些事。如果雞啼是造成太陽升起的原因,那我們要縮短夜晚的話,就可以讓雞早些啼。Ifcausalinformationhasanempiricalmeaningbeyondregularityofsuccession,thenthatinformationshouldshowupinthelawsofphysics.Butitdoesnot!
第11頁,共102頁,2023年,2月20日,星期五06.09.061因果推論:從古到今Russell(1913)認為“Allphilosophersimaginethatcausationisoneofthefundamentalaxiomsofscience,yetoddlyenough,inadvancedsciences,theword'cause'neveroccurs...Thelawofcausality,Ibelieve,isarelicofbygoneage,surviving,likethemonarchy,onlybecauseitiserroneouslysupposedtodonoharm...”“Itcouldnotpossiblybeanabbreviation,becausethelawsofphysicsareallsymmetrical,goingbothways,whilecausalrelationsareuni-directional,goingfromcausetoeffect.”第12頁,共102頁,2023年,2月20日,星期五06.09.061因果推論:從古到今但另一位科學(xué)哲學(xué)家PatrickSuppes則指出“ThereisscarcelyanissueofPhysicalReviewthatdoesnotcontainatleastonearticleusingeither‘cause’or‘causality’initstitle.”物理學(xué)家一方面寫無因果意涵的方程式,但另一方面卻大談因果關(guān)係。統(tǒng)計學(xué)一百多年前發(fā)現(xiàn)相關(guān)(correlation)的概念後,卻無法忽略相關(guān)與因果間的區(qū)辨。第13頁,共102頁,2023年,2月20日,星期五06.09.061因果推論:從古到今FrancisGalton於1888年進行個人的前臂與其頭大小關(guān)係的測量,企圖瞭解一個數(shù)值預(yù)測另一個數(shù)值的程度時,發(fā)現(xiàn)到:Ifyouplotonequantityagainsttheotherandscalethetwoaxesproperly,thentheslopeofthebest-fitlinehassomenicemathematicalproperties:Theslopeis1onlywhenonequantitycanpredicttheotherprecisely;itiszerowheneverthepredictionisnobetterthanarandomguessand,mostremarkably,theslopeisthesamenomatterifyouplotXagainstYorYagainstX."我們開始可以根據(jù)資料客觀的測量兩個變項間的關(guān)係,而不是根據(jù)我們的意見或判斷。第14頁,共102頁,2023年,2月20日,星期五06.09.061因果推論:從古到今Galton的發(fā)現(xiàn)震撼了其學(xué)生KarlPearson(公認是現(xiàn)代統(tǒng)計學(xué)之父),使他終其一生認為我們只需要「相關(guān)」這個更廣泛的概念,而不需要另一個獨立的因果關(guān)係的概念。他也從不在其論文內(nèi)提到因果的概念。這一直要到SirRonaldFisher建立randomizedexperiment的研究設(shè)計後,才成為唯一被主流統(tǒng)計學(xué)所接受,並認為這是唯一可從資料驗證因果間關(guān)係的科學(xué)方法。但這種謹慎的看法使得無法做實驗,而需靠統(tǒng)計分析為引導(dǎo)的社會科學(xué)處於近乎癱瘓的狀態(tài)。第15頁,共102頁,2023年,2月20日,星期五06.09.061因果推論的新典範(fàn)Pearl認為這樣的困境是源自統(tǒng)計學(xué)的官方語言:機率的語言。因為cause並不是機率的字彙。我們無法以機率的語言表達:Muddoesnotcauserain。我們只能說兩者相關(guān)。Naturally,ifwelackalanguagetoexpressacertainconceptexplicitly,wecan'texpecttodevelopscientificactivityaroundthatconcept.Scientificdevelopmentrequiresthatknowledgebetransferredreliablyfromonestudytoanotherand,asGalileohasshown350yearsago,suchtransferencerequirestheprecisionandcomputationalbenefitsofaformallanguage.第16頁,共102頁,2023年,2月20日,星期五06.09.061因果推論的新典範(fàn)當(dāng)研究者開始企圖使用電腦來建立因果關(guān)係時,對於先前兩大難題有了新的想法。從概念層次來說,機器人所遇到的問題是與經(jīng)濟學(xué)家企圖建立稅收及預(yù)算模式,或流行病學(xué)家企圖建立流行病的模式是一樣的。不論是機器人、經(jīng)濟學(xué)家或流行病學(xué)家都需要在行動受限制的條件下,依據(jù)充滿雜音的資訊,從環(huán)境中找出因果的關(guān)係。這就是先前的第一個大難題:HOW?第17頁,共102頁,2023年,2月20日,星期五06.09.061因果推論的新典範(fàn)機器人的世界也與第二大難題有關(guān)。如果我們教導(dǎo)機器人關(guān)於因果的知識,機器人要如何組織及運用這些知識呢?對機器人而言,這兩大難題是具體而實際的問題,就是如何從與環(huán)境的互動中得到因果的知識,以及如何運用從創(chuàng)造者/程式設(shè)計師得到的因果知識?第18頁,共102頁,2023年,2月20日,星期五06.09.061新典範(fàn)與新語言J.Pearl的答案:第二個難題可以結(jié)合graphs與equations的方式解決,如此則第一個難題也比較容易解決。解題的主要關(guān)鍵概念是:(1)treatingcausationasasummaryofbehaviorunderinterventions.(2)usingequationsandgraphsasamathematicallanguagewithinwhichcausalthoughtscanberepresentedandmanipulated.(3)Treatinginterventionsasasurgeryoverequations.第19頁,共102頁,2023年,2月20日,星期五06.09.061新典範(fàn)與新語言社會科學(xué)家過去75年來不時使用graphs,如structuralequationsmodeling及pathdiagrams。但是由於代數(shù)方程式的便利性,因而壓抑了圖型的使用,也進而失去了圖型帶來的好處。這些diagrams事實上捕捉了因果的本質(zhì)─預(yù)測不正常情況或是新的操弄狀態(tài)下,會產(chǎn)生什麼結(jié)果。這種預(yù)測是代數(shù)或相關(guān)分析無法做到的。第20頁,共102頁,2023年,2月20日,星期五06.09.061新典範(fàn)與新語言第21頁,共102頁,2023年,2月20日,星期五06.09.061新典範(fàn)與新語言從這樣的角度來看因果關(guān)係,可以理解為何科學(xué)家如此熱衷於因果解釋,因為建立因果模式會得到一種“deepunderstanding”及“beingincontrol”的感覺。Deepunderstanding的意思是“knowing,notmerelyhowthingsbehavedyesterday,butalsohowthingswillbehaveundernewhypotheticalcircumstances,controlbeingonesuchcircumstance”.第22頁,共102頁,2023年,2月20日,星期五06.09.061新典範(fàn)與新語言即使我們無法實際上控制事情,我們也因理解因果關(guān)係而得到“incontrol”的感覺。例如,我們無法控制星體的運轉(zhuǎn),但萬有引力的理論,讓我們能夠理解並獲得假設(shè)性控制(hypotheticalcontrol)的感覺。我們也可以預(yù)測當(dāng)萬有引力改變時,對潮汐會產(chǎn)生什麼影響。因果模式也是做為區(qū)辨有意識的論證(deliberatereasoning)及被動或本能的反應(yīng)(reactiveorinstinctiveresponse)的試金石。前者可在即使不真正去從事新的操弄(manipulation)下,也可以預(yù)期新的操弄可以得到什麼結(jié)果。第23頁,共102頁,2023年,2月20日,星期五06.09.061新典範(fàn)與新語言Equationsvs.Diagrams(J.Pearl)第24頁,共102頁,2023年,2月20日,星期五06.09.061新典範(fàn)與新語言DefinitionofCausation:YisacauseofZifwecanchangeZbymanipulatingY,namely,ifaftersurgicallyremovingtheequationforY,thesolutionforZwilldependonthenewvaluewesubstituteforY.THEDIAGRAMTELLSUSWHICHEQUATIONISTOBEDELETEDWHENWEMANIPULATEY.INTERVENTIONAMOUNTSTOASURGERYONEQUATIONS,GUIDEDBYADIAGRAM,ANDCAUSATIONMEANSPREDICTINGTHECONSEQUENCESOFSUCHASURGERY.第25頁,共102頁,2023年,2月20日,星期五06.09.061新典範(fàn)與新語言INTERVENTIONASSURGERY-CONTROLLEDEXPERIMENTS
假定我們要研究某種藥物是否能幫助病人從某些疾病復(fù)原。但影響復(fù)原的因素不只是藥物治療,還有其他的因素,如社經(jīng)地位、年齡、生活方式等。這對我們判斷藥物的效果來說是個問題,因為我們不知道影響復(fù)原的程度是那個因素造成的。因此,我們希望能夠比較背景相同的病人,而這就是Fisher的RandomizedExperiment能夠做到的。但隨機分派的實驗設(shè)計如何做到這種比較呢?第26頁,共102頁,2023年,2月20日,星期五06.09.061新典範(fàn)與新語言這種實驗設(shè)計實際上有兩個部份:RandomizationandIntervention.Intervention就是我們將藥物給一些在正常情況下不會需要這種治療的病人,另一方面我們給一些尋求治療的病人安慰劑(placebo)。這也是先前提及的SURGERY的概念,因為我們將一個functionallink(如SES)切斷,而用另一種替代。Fisher的偉大貢獻是connectingthenewlinktoarandomcoinflip,以此保證我們想要切斷的link是確實被切斷了,因為我們可以假定這個randomcoin是不受任何我們可以測量到的因素所影響的。第27頁,共102頁,2023年,2月20日,星期五06.09.061新典範(fàn)與新語言第28頁,共102頁,2023年,2月20日,星期五06.09.061新典範(fàn)與新思維在新典範(fàn)下,我們可以如何在無法從事實驗的情況下,利用observationalstudies(如調(diào)查或病歷)的資料思考因果關(guān)係呢?第29頁,共102頁,2023年,2月20日,星期五06.09.061發(fā)問方式兩類探索因果關(guān)係的研究問題第一類研究問題:X對Y的影響為何?研究目的是要知道:X對Y有影響嗎?有的話,影響有多大?這是實驗設(shè)計所問的研究問題第二類研究問題:影響Y的因素有哪些?研究目的是要知道:所有可能解釋Y的因素有哪些。第30頁,共102頁,2023年,2月20日,星期五06.09.061如何認定因果關(guān)係?參考Morgan,StephenL.&ChristopherWinship(2007).CounterfactualsandCausalInference:MethodsandPrinciplesforSocialResearch.NewYork,NY:CambridgeUniversityPress.第31頁,共102頁,2023年,2月20日,星期五06.09.061如何認定因果關(guān)係?XY(HadXtakenadifferentvalue,thenYwouldhavetakenadifferentvalue)ThecausalrelationshipbetweenXandYisconfoundedif:Z
XY第32頁,共102頁,2023年,2月20日,星期五06.09.061如何認定因果關(guān)係?ZA
XYZA(unobserved)
XY第33頁,共102頁,2023年,2月20日,星期五06.09.061如何認定因果關(guān)係?XY
C(collider)ZA(unobserved)
XY
第34頁,共102頁,2023年,2月20日,星期五06.09.061StatisticalRelationsvs.
CausalRelationsStatisticaldependencemayreflectRandomfluctuation(c.i.&p-value)XcausedYYcausedX(temporalorder;longitudinaldata)XandYshareacommoncause(covariateadjustment)AssociationbetweenXandisinducedbyconditioningonacommoneffectofXandY(selectionbias;colliderbias)第35頁,共102頁,2023年,2月20日,星期五06.09.061如何推估theeffectofXonY?當(dāng)X與Y有commoncauses時,如能認定X與Y間的因果路徑,可以因有效的控制一組共變項Z,且Z內(nèi)沒有受X影響時,則我們可以清楚的推估theeffectofXonY。Pearl’sBack-doorCriterion第36頁,共102頁,2023年,2月20日,星期五06.09.061如何推估theeffectofD(treatment)onY?
V(unobserved)AFGU(unobserved)BD
YC第37頁,共102頁,2023年,2月20日,星期五06.09.061Pearl’sBack-doorCriterionIfoneormoreback-doorpathsconnectsthecausalvariabletotheoutcomevariable,Pearlshowsthatthecausaleffectisidentifiedby
conditioningonasetofvariablesZ
ifandonlyifallback-doorpathsbetweenthecausalvariableandtheoutcomevariableareblockedafterconditioningonZ.第38頁,共102頁,2023年,2月20日,星期五06.09.061Pearl’sBack-doorCriterionAback-doorpathofDandYisblockedbyZ
ifandonlyiftheback-doorpathsatisfiesanyoneofthefollowing:
containsachainofmediationA→Z→B,orcontainsaforkofmutualdependenceA←Z→B;containsaninvertedforkofmutualcausationA→C*←B,whereC*andallitsdescendantsarenotinZ.第39頁,共102頁,2023年,2月20日,星期五06.09.061如何推估theeffectofDonY?
(控制B&F即可,Why?)
V(unobserved)AFGU(unobserved)BD
YC第40頁,共102頁,2023年,2月20日,星期五06.09.061Pearl’sBack-doorCriterion(continued)從Pearl的Back-doorCriterion來看,並不是控制越多變項就好,因為要是控制了colliders反而會有問題,因為本來X與Y沒有相關(guān)或因果關(guān)係的,控制這類變項後,反而會產(chǎn)生相關(guān)。Example如果collider是申請入學(xué)時是否被一所菁英學(xué)校接受(adm:1-接受;0-拒絕)是否被接受是根據(jù)兩個獨立變項:SAT及面試時對動機的評估(Motivation)因此:adm是的兩個causes是SAT及Motivation,而SAT及Motivation間是獨立的。第41頁,共102頁,2023年,2月20日,星期五06.09.061Exampleofcontrollingacollider第42頁,共102頁,2023年,2月20日,星期五06.09.061Exampleofcontrollingacollider第43頁,共102頁,2023年,2月20日,星期五06.09.061Exampleofcontrollingacollider第44頁,共102頁,2023年,2月20日,星期五06.09.061如何推估theeffectofDonY?AFGBD
Y
CH第45頁,共102頁,2023年,2月20日,星期五06.09.061如何有效的控制confoundingvariables(Z)呢?如果D只有兩個值:0及1,我們可以用實驗設(shè)計的方式,將兩組相同特性的人,隨機分配到控制組(D=0)及實驗組(D=1),即可達到前述的狀態(tài)。Why?如果無法用實驗設(shè)計,而是用調(diào)查方法蒐集資料時,如何推估呢?條件性控制(conditioning)或是配對(matching):byholding<something>constantorbybalancing/homogenizingthetreatment&controlgroups.第46頁,共102頁,2023年,2月20日,星期五06.09.061TheCounterfactualFrameworkGroupPotentialOutcomesY1Y0Treatmentgroup(D=1)
ObservableCounterfactualControlgroup(D=0)CounterfactualObservable反事實因果推論的想像第47頁,共102頁,2023年,2月20日,星期五06.09.061TheCounterfactualFramework反事實分析架構(gòu)的想像可看成是一種thoughtexperiment。要想像的是同一個個體或群體在不同的狀態(tài)下,會有什麼可能的結(jié)果(potentialoutcomes)。這些可能結(jié)果間的差異,即為不同狀態(tài)(因)的效果。Counterfactualsshouldbereasonable!
第48頁,共102頁,2023年,2月20日,星期五06.09.061TheCounterfactualFrameworkQ:什麼是unreasonable的counterfactuals呢?有什麼狀態(tài)不適合看成為causes的嗎?有什麼樣的結(jié)果不適合想像counterfactual情況的嗎?第49頁,共102頁,2023年,2月20日,星期五06.09.061TheCounterfactualFramework個人層次的真正因果效應(yīng):
δi=Yi1─Yi0TheFundamentalProblemofCausalInference:無法觀察同一個人同時在實驗組及控制組。加上一些假定,如SUTVA,則可推估群層次的因果效應(yīng)。第50頁,共102頁,2023年,2月20日,星期五06.09.061TheCounterfactualFrameworkSUTVA:TheStableUnitTreatmentValueAssumption–aprioriassumptionthatthevalueofYforunituwhenexposedtotreatmenttwillbethesamenomatterwhatmechanismisusedtoassigntreatmentttounituandnomatterwhattreatmentstheotherunitsreceive.第51頁,共102頁,2023年,2月20日,星期五06.09.061TheCounterfactualFramework實驗設(shè)計是假設(shè)我們能夠?qū)⒂^察到的替代無法觀察到的。如隨機分派到實驗組與控制組的個體的特性相同,則我們可以假定:如果實驗組的個人沒有接受treatment的話,其結(jié)果與控制組觀察到的相同;如果控制組的個人接受treatment的話,其結(jié)果與實驗組觀察到的相同。第52頁,共102頁,2023年,2月20日,星期五06.09.061TheCounterfactualFramework當(dāng)使用調(diào)查方法得到資料時,即observationaldata,個人為何會接受或不接受treatment,往往不是一個隨機的現(xiàn)象。Observationaldata通常有兩個問題:接受treatment者與不接受者有baselinedifferences,以及heterogeneityoftreatmenteffect.可能有些影響接受treatment與否的變項,並未觀察到,亦即omittedvariables的問題。第53頁,共102頁,2023年,2月20日,星期五06.09.061TheCounterfactualFrameworkGroupPotentialOutcomesY1Y0Treatmentgroup(D=1)
ObservableE[Y1|D=1]CounterfactualE[Y0|D=1]
Controlgroup(D=0)CounterfactualE[Y1|D=0]
ObservableE[Y0|D=0]
第54頁,共102頁,2023年,2月20日,星期五06.09.061TheCounterfactualFramework以反事實架構(gòu)的觀點來看,母群體層次的真正因果效應(yīng)(ATE;AverageTreatmentEffect)為:E[δ]=E[Y1–Y0]=E[Y1]–E[Y0]={πE[Y1|D=1]+(1–π)
E[Y1|D=0]}– {πE[Y0
|D=1]+(1–π)E[Y0|D=0]}=π{E[Y1
|D=1]–E[Y0|D=1]
}+(1–π){E[Y1|D=0]–E[Y0|D=0]}=πE[δ|D=1]+(1–π)
E[δ|D=0]第55頁,共102頁,2023年,2月20日,星期五06.09.061TheCounterfactualFrameworkπ:母群體中接受treatment的比例不同組的因果效應(yīng):ATT(AverageTreatmentEffectontheTreated): E[Y1|D=1]–E[Y0|D=1]
,即E[δ|D=1]
ATU(AverageTreatmentEffectontheUntreated):
E[Y1|D=0]–E[Y0|D=0],即E[δ|D=0]Q:我們可以假定不同組的人有同樣的因果效應(yīng)嗎?如果我們能夠做此假定的話,則E[Y1|D=0]=E[Y1|D=1]
第56頁,共102頁,2023年,2月20日,星期五06.09.061TheCounterfactualFramework基準(zhǔn)線的差異:
E[Y0|D=1]–E[Y0|D=0]Q:我們可以假定不同組的人在未接受treatment前是一樣的嗎?
如果我們能夠做此假定的話,則E[Y0|D=1]=E[Y0|D=0]第57頁,共102頁,2023年,2月20日,星期五06.09.061TheCounterfactualFramework
如果我們只以觀察到接受treatment的組與觀察到未接受treatment的組之間的差異做為CausalEffect的估計時,此估計是一種Na?veEstimate:
Na?veEstimateE[Y1|D=1]–E[Y0|D=0]=averagecausaleffect=E(δ)+baselinebias+{E(Y0|D=1)?E(Y0|D=0)}+differentialeffectbias+{E(δ|D=1)?E(δ|D=0)}(1?π)第58頁,共102頁,2023年,2月20日,星期五06.09.061TheCounterfactualFramework:AReview反事實分析架構(gòu)的五個關(guān)鍵概念:Potential/HypotheticalStates&Outcomes:因果效應(yīng)(causaleffect)是利用“potential”或“hypothetical”的概念,而不是只用到actualobservations。.Theceterisparibuscondition其他條件相同的條件下,也就是將其他因素控制成等同(equal)、固定不變(fixed)或是constant。第59頁,共102頁,2023年,2月20日,星期五06.09.061TheCounterfactualFramework:AReviewHeterogeneity:個人對於treatment的反應(yīng)是因人而異的。亦即因果效應(yīng)在個人層次即被認定是有差異的。每個人的因果效應(yīng)是:
[potentialoutcomeunderthepotentialtreatmentstate] ─[potentialoutcomeunderthepotentialcontrolstate]FundamentalProblemofCausalInference:由於thecounterfactualdefinitionofcausaleffect意涵著評估個人層次的因果效應(yīng)會有missingdata的問題。但是如果我們願意做一些假定的話,我們可以評估幾種AverageCausalEffects。第60頁,共102頁,2023年,2月20日,星期五06.09.061TheCounterfactualFramework:AReviewBasicParametersofInterest:ATT:AverageTreatmenteffectontheTreatedATU:AverageTreatmenteffectontheUntreatedATE:AverageTreatmentEffectthemostbasiconeisATT,andthereareothermeaningfulcausalparametersofinterestthanthesethree.第61頁,共102頁,2023年,2月20日,星期五06.09.061反事實分析架構(gòu)下分析
觀察資料的方法假設(shè)控制影響treatment之共變項後,就能達成ignorability,這也稱為selectiononobservables)propensityscorematching如果此假定不成立的話:instrumentalvariableHeckmanselectionmodel利用長期追蹤資料的特性,使用如fixedeffectmodel,changescoremodel不同的分析方法,要做不同的假定第62頁,共102頁,2023年,2月20日,星期五06.09.061傾向分數(shù)配對法介紹
關(guān)秉寅政治大學(xué)社會學(xué)系2010.01.16IntroductiontoPropensityScoreMatching第63頁,共102頁,2023年,2月20日,星期五06.09.061OLS迴歸分析的問題一般多元OLS迴歸分析,是一種ATE的估計,其作法假定其控制足夠的共變項後,可以消除基準(zhǔn)線差異,並假定接受treatment者的因果效應(yīng)與未接受者相同。這些假定合理嗎?OLS迴歸分析通常無法克服自我選擇的問題。OLS迴歸分析可能將接受treatment及沒接受treatment兩組中無法比較的人納入分析。如果兩組人的特性(基準(zhǔn)線)相當(dāng)不同,則OLS的推估會有大問題,因為其無法比較的部份是以imputation的方式來推估。第64頁,共102頁,2023年,2月20日,星期五06.09.061反事實分析架構(gòu)下分析
觀察資料的方法假設(shè)只有omittedvariables,且是可以用控制觀察到之變項來控制的話(即控制影響treatment之共變項後,就能達成ignorability,這也稱為selectiononobservables)propensityscorematching(PSM)是這類假定下發(fā)展出來的分析方法。第65頁,共102頁,2023年,2月20日,星期五06.09.061反事實分析架構(gòu)下分析
觀察資料的方法selectiononobservablesZDY
U(unobservable)第66頁,共102頁,2023年,2月20日,星期五06.09.061PropensityScoreMatching(PSM)假定:如果接受及不接受treatment兩種人的差異能夠被一組共變項(Z)完美解釋,那麼我們就可以用這些共變項進行分層配對,使得每層內(nèi)有兩種人:接受者及不接受者,且這些人在各層中唯一的不同是他們是否接受treatment。然後,我們觀察這兩種人在outcome的差異為何。我們再進一步將各分層的差異,以及分層所佔的比例做適當(dāng)加權(quán),則可得到好的ATE,ATT,ATU的估計。第67頁,共102頁,2023年,2月20日,星期五06.09.061PropensityScoreMatching(PSM)(Y1,Y0)╨
D|Z實際上如果有許多共變項時,配對過程很麻煩,且在樣本有限的情況下,有些分層會沒有個案。PaulRosenbaum及DonaldRubin在一系列的論文中,證明用所謂的「傾向分數(shù)」(propensityscore)將是否會接受視為一種機率,然後以此分數(shù)來從事分層配對是可行的。第68頁,共102頁,2023年,2月20日,星期五06.09.061PropensityScoreMatching(PSM)如何得到傾向分數(shù)?找到有意義可解釋是否會接受treatment的共變項,然後做Logit或Probit迴歸,應(yīng)變項為是否接受treatment。根據(jù)傾向分數(shù)將接受者及不接受者進行配對,並找到commonsupport。在commonsupport
的樣本中,兩組人的分配是balanced(檢視matchingquality)。第69頁,共102頁,2023年,2月20日,星期五06.09.061PropensityScoreMatching(PSM)實際從事PSM的運算方法有四大類:ExactMatchingNearestNeighborMatchingIntervalMatchingKernelMatching
不同運算方法的差異:WithorwithoutreplacementHowmanyunitstomatch第70頁,共102頁,2023年,2月20日,星期五06.09.061PropensityScoreMatching(PSM)選擇不同運算法的兩難要能maximize精準(zhǔn)的配對(如用strictly“nearest”orcommon-supportregion),可能會有比較多的樣本個案會被排除於分析之外。要能包括比較多的配對樣本個案(如擴大配對的範(fàn)圍),就會有比較多不精準(zhǔn)的配對。用bootstrapping方式求得PSM估計值的standarderrors第71頁,共102頁,2023年,2月20日,星期五06.09.061PropensityScoreMatching(PSM)實際可從事PSM的程式:Stata:psmatch2等SPSS:SPSSMacroforPropensityScoreMatching(/VRC/Lectures/index.htm)SAS:“GREEDY”Macro(/proceedings/sugi26/proceed.pdf)R:“MatchIt”(/matchit/)第72頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?
研究問題:國三補習(xí)數(shù)學(xué)有用嗎?ATT:如果國三補數(shù)學(xué)的人,沒補的話,數(shù)學(xué)成就會有差異嗎?ATU:如果國三沒補數(shù)學(xué)的人,補習(xí)的話,數(shù)學(xué)成就會有差異嗎?ATE:如果所有的人國三都補數(shù)學(xué)的話,數(shù)學(xué)成就會有差異嗎?參考:關(guān)秉寅、李敦義(2008)。補習(xí)數(shù)學(xué)有用嗎?一個「反事實」的分析。臺灣社會學(xué)刊,41,97-148。
第73頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?研究使用的資料:TEPS國中樣本(公開使用版)2001(N=13,978)2003(N=13,247)分析樣本:公立國中生;withcommonsupport
(N=10,013)第74頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?應(yīng)變項:國三數(shù)學(xué)能力IRT,轉(zhuǎn)換成NCE(normalcurveequivalence)分數(shù)(Range:1–99;Mean:50;S.D.:21.06)自變項(Treatment):國三補習(xí)數(shù)學(xué)26個配對變項:個人特性及學(xué)習(xí)特質(zhì):性別、補習(xí)經(jīng)驗、W1數(shù)學(xué)IRT等(motivation,ability)家庭背景:父母教育程度、職業(yè)、教育期待等班級/學(xué)校學(xué)習(xí)氣氛及環(huán)境第75頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?分析策略:只研究國三數(shù)學(xué)補習(xí)的效果國三補習(xí)主要是為了準(zhǔn)備基測學(xué)校教育對數(shù)學(xué)能力的培養(yǎng)比較有影響力以階層性模型探討國三補習(xí)的參與及補習(xí)效果,以瞭解過往補習(xí)研究可能有的限制,以及比較OLS及PSM兩者估計ATE可能有的差異比較有及沒有W1數(shù)學(xué)IRT做為配對變項的差異第76頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?使用Stata(version9以上版本)的指令:psmatch2及bootstrapPSMATCH2:StatamoduletoperformfullMahalanobisandpropensityscorematching,commonsupportgraphing,andcovariateimbalancetesting(byEdwinLeuven&BarbaraSianesi)Bootstrap用來估計standarderroroftheestimate第77頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?useD:\w2w1all01,clearsetseed19123584psmatch2w2s1102w1s502mathtimew1s535-w1s550w1tms1w1tms3/// w1s507dw2s1121dcram1-cram3ethn2-ethn4paedu2paedu3/// paocc1-paocc2w1p5152-w1p5154nuintactsibsize/// eduexp2eduexp3groupingw1s309-w1s318w1urban32-w1urban33/// w1m3p29c,out(w2m3p28NCE)kernelcommonlogitategenps=_pscore第78頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?第79頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?
誰參加國三數(shù)學(xué)補習(xí)?個人特性及學(xué)習(xí)特質(zhì):先備能力較佳、過去沒補習(xí)經(jīng)驗者、回家會複習(xí)功課、自己沒有補習(xí)的意願家庭背景:非原住民、與雙親同住、父母不是研究所學(xué)歷、白領(lǐng)職業(yè)、高收入、高父母教育期望、手足人數(shù)少
班級/學(xué)校情況:位於在都市化程較高地區(qū)、班上讀書風(fēng)氣盛、學(xué)業(yè)競爭激烈程度高第80頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?VariableSample|TreatedControlsDifferenceS.E.T-statw2m3p28NCEUnmatched|57.149242144.428517512.7207246.4005282931.76<observed><potential><outcome>ATT|57.124278654.8661212.25815756.4797762174.71ATU|44.684442448.26441023.57996779ATE|2.95584959+Note:S.E.forATTdoesnottakeintoaccountthatthepropensityscoreisestimated.psmatch2:|psmatch2:CommonTreatment|supportassignment|OffsuppoOnsuppor|Total++Untreated|615,263|5,324Treated|74,708|4,715++Total|689,971|10,039第81頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?pstestw2s1102w1s502mathtimew1s535-w1s550w1tms1w1tms3///w1s507dw2s1121dcram1-cram3w1m3p29cethn2-ethn4///paedu3paocc1-paocc2w1p5152-w1p5154nuintactsibsize///eduexp2eduexp3groupingw1s309-w1s318///w1urban32-w1urban33,summarytreated(_treated)第82頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?第83頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?setseed19123584psmatch2w2s1102,out(w2m3p28NCE)pscore(ps)mahal(w2stwt1)///
addkernelcommonlogit
VariableSample|TreatedControlsDifferenceS.E.T-stat+w2m3p28NCEUnmatched|57.149242144.428517512.7207246.4005282931.76ATT|57.104426854.98457362.11985317.492394954.31+Note:S.E.forATTdoesnottakeintoaccountthatthepropensityscoreisestimated.psmatch2:|psmatch2:CommonTreatment|supportassignment|OffsuppoOnsuppor|Total++Untreated|05,324|5,324Treated|264,689|4,715++Total|2610,013|10,039第84頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?psgraph,bin(50)treated(_treated)support(_support)///pscore(_pscore)檢視有commonsupport的分析樣本的balance第85頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?bsr(att):psmatch2w2s1102,out(w2m3p28NCE)pscore(ps)///mahal(w2stwt1)addkernelcommonlogitBootstrapresultsNumberofobs=10039Replications=50command:psmatch2w2s1102,out(w2m3p28NCE)pscore(ps)mahal(w2stwt1)addkernelcommonlogit_bs_1:r(att)|ObservedBootstrapNormal-based|Coef.Std.Err.zP>|z|[95%Conf.Interval]+_bs_1|2.11783.46678194.540.0001.2029543.032706第86頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?
國三補習(xí)數(shù)學(xué)有用嗎?Grosseffect(OLS):12.243(分析樣本withcommonsupport)Aftercontrollingallmatchingvariables(OLS):3.017–anestimateofATEPSMresults(allmatchingvariablesincluded):Totalpopulation(ATE):2.956Treated(ATT):2.258Untreated(ATU):3.580第87頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?
階層性模型分析結(jié)果顯示PSM的ATE估計大多比OLS的估計小ATT比ATU小都會受到未納入重要自變項的影響第88頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?
PSMstratifiedbypropensityscores1ststratum(lowest) 3.5192ndstratum 4.0633rdstratum 3.3844thstratum 1.9975thstratum(highest) 2.950 1st–3rdstratum 3.292 4th–5thstratum 2.557第89頁,共102頁,2023年,2月20日,星期五06.09.061運用PSM的實例:補習(xí)數(shù)學(xué)有用嗎?
PSMstratifiedbypriormathabilityscores1ststratum(lowest) 3.6002ndstratum 4.4063rdstratum 2.1014thstratum 3.2155thstratum(highest) 2.108
1st–3rdstratum
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025貴州省安全員-C證(專職安全員)考試題庫
- 2025年甘肅建筑安全員C證考試題庫
- 珍愛生命-校園行為規(guī)范與安全教育班會課件
- 小學(xué)心理健康輔導(dǎo)家長會課件
- 《PMC作業(yè)指引》課件
- DB61T-稻麥(油)輪作主要病蟲害防控技術(shù)規(guī)范編制說明
- 培訓(xùn)課件-車輛消防安全知識培訓(xùn)
- 單位管理制度展示選集【人力資源管理】十篇
- 單位管理制度展示大全【員工管理】
- 【物理課件】速度改變快慢的描述課件
- 迪士尼樂園總體規(guī)劃
- 惠州學(xué)院《大學(xué)物理》2021-2022學(xué)年第一學(xué)期期末試卷
- 2024消防安全警示教育(含近期事故案例)
- Starter Section 1 Meeting English 說課稿 -2024-2025學(xué)年北師大版(2024)初中英語七年級上冊
- 2025年蛇年年度營銷日歷營銷建議【2025營銷日歷】
- 2024年法律職業(yè)資格考試(試卷一)客觀題試卷及解答參考
- 食堂項目經(jīng)理培訓(xùn)
- 安全經(jīng)理述職報告
- 福建省泉州市2023-2024學(xué)年高一上學(xué)期期末質(zhì)檢英語試題 附答案
- 建筑項目經(jīng)理招聘面試題與參考回答(某大型集團公司)2024年
- 安保服務(wù)評分標(biāo)準(zhǔn)
評論
0/150
提交評論