第9講二元結(jié)果模型講解_第1頁(yè)
第9講二元結(jié)果模型講解_第2頁(yè)
第9講二元結(jié)果模型講解_第3頁(yè)
第9講二元結(jié)果模型講解_第4頁(yè)
第9講二元結(jié)果模型講解_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

99第9講離散選擇模型之二元結(jié)果模型參考書(shū)目:1?Long,J.S?,andJ.Freese.2006?RegressionModelsforCategoricalDependentVariablesUsingStata.2nded.CollegeStation,TX:StataPress教學(xué)視頻:Logisticregressionpart1:BiiiaiypredictorsLogisticregression、part2:ContinuouspredictorsLogisticregression,part3:Factorvariables、離散被解釋變量的例子二元結(jié)果模型:考研或不考研;就業(yè)或待業(yè):買房或不買房;買保險(xiǎn)或不買保險(xiǎn);貸款申請(qǐng)被批準(zhǔn)或拒絕;出國(guó)或不出國(guó);回國(guó)或不回國(guó);戰(zhàn)爭(zhēng)或和平;醫(yī)藥實(shí)驗(yàn)中的生或死。多元結(jié)果模型:對(duì)不同交通方式的選擇(走路、騎車、坐車上班):對(duì)不同職業(yè)的選擇。這類模型被稱為“離散選擇模型”(discretechoicemodel)。考慮到離散被解釋變量的特點(diǎn),通常不宜用OLS進(jìn)行回歸。假設(shè)個(gè)體只有兩種選擇,比如y=l(考研)或y=0(不考研)。是否考研,取決于研究生畢業(yè)后的預(yù)期收入、個(gè)人興趣、本科畢業(yè)后直接就業(yè)的收入前景等。所有解釋變量都包括在向量x中。圖11」OLS與二值選擇模型二、二元結(jié)果模型的微觀基礎(chǔ)對(duì)于二元選擇行為,可通過(guò)“潛變量”(latentvariable)概括該行為的凈收益(收益減去成本)。如果凈收益大于0,則選擇做;否則,選擇不做。y*=xp+s其中,凈收益y*為潛變量,不可觀測(cè)。選擇規(guī)則為y=l,若y*>0y=0,若y*S0如果£為正態(tài)分布,則為Probit:如果s為邏輯分布,則為L(zhǎng)ogitologistic—Logisticregression,reportingoddsratios(Logistic回歸,報(bào)告優(yōu)勢(shì)比/比值比)對(duì)于Logit模型,記p=P(y=l|x),則1-P=P(y=0|x)op/(l-p)稱為“兒率比/優(yōu)勢(shì)比/比值比”(oddsratio)o那么什么是兒率比?舉例說(shuō)明,假設(shè)在檢驗(yàn)藥物療效的隨機(jī)實(shí)驗(yàn)中,“y二1”表示“生S“y二0”表示“死3則兒率比為2意味著存活的概率是死亡概率的兩倍。命令語(yǔ)法:logisticdepvarindepvars[if][in][weight][,options]命令logistic擬合logistic回歸模型,其中depvar是一個(gè)0/1變量(更準(zhǔn)確地說(shuō),是一個(gè)0/非0變量)<>logistic顯示的估計(jì)結(jié)果是優(yōu)勢(shì)比;要想査看系數(shù),運(yùn)行l(wèi)ogistic后,輸入logito一、概述logistic替代logit命令,通常是擬合最大似然logit模型的首選方法。Stata使用logit和logisticB味著同樣的事情:最大似然佔(zhàn)訃。并且兩種命令會(huì)得到相同的結(jié)果。logistic命令通常優(yōu)于logit命令,原因是logistic提供優(yōu)勢(shì)比而不是系數(shù)的估計(jì)結(jié)果。對(duì)于logistic回歸的介紹,請(qǐng)參閱Lemeshow&Hosmer(2005),Pagano&Gauvreau(2000,470-487),或Pampel(2000):一個(gè)完整的,非數(shù)學(xué)的討論,請(qǐng)參閱Kleiiibaum&Klein(2010):—個(gè)更深入的討論,請(qǐng)參閱Hosmer,Lemeshow,&Sturdivant(2013)。Gould(2000)討論了關(guān)于logistic回歸的解釋。Dupont(2009)和Hilbe(2009)用Stata實(shí)例討論了logistic回歸。Vittiiighoffetal.(2012)重點(diǎn)討論了模型設(shè)定問(wèn)題。Stata有一系列命令用來(lái)估訃二分類或多分類因變量模型。Long和Freese(2014)專門論述了如何使用Stata擬合此類模型。下面是一些常用估計(jì)命令的列表。helpestimationcommands提供了Stata全部佔(zhàn)訃命令的完整列表。asclogit[Rl麥克法登離散選擇模型(McFadden,schoice)asmprobit[R1多項(xiàng)式probit模型asroprobit[Rl排序probit模型binreg[R]二項(xiàng)式的廣義線性模型

biprobit[R]二元probit模型blogit[R1分組數(shù)據(jù)的logit模型bprobit[R1分組數(shù)據(jù)的probit模型clogit[R]條件(固定效應(yīng))Iogistic回歸cloglog[R1互補(bǔ)重對(duì)數(shù)模型exlogistic[R]精確logistic回歸glm【R]廣義線性模型glogit[R1分組數(shù)據(jù)的加權(quán)最小二乘logistic回歸gprobit[R1分組數(shù)據(jù)的加權(quán)最小—.乘probit回歸heckoprobit[R1有序probit的樣本選擇模型heckprobit[R]probit的樣本選擇模型hetprobit[R1異方差probit模型ivprobit【R1具有連續(xù)內(nèi)生變量的probit模型logit【R1Logistic回歸分析,報(bào)告系數(shù)mecloglog[ME]多層次混合效應(yīng)互補(bǔ)雙對(duì)數(shù)回歸meglm[ME]多層次混合效應(yīng)廣義線性模型melogit[ME]多層次混合效應(yīng)logistic回歸meprobit[ME]多層次混合效應(yīng)probit回歸nilogitIR]多分類因變量logistic回歸mprobit[R]多分類因變量probit回歸nlogit【R1嵌套logit回歸ologit[R1有序logistic回歸oprobit[Rl有序probit回歸probit[R1Probit回歸rologit[Rl有序秩logistic回歸scobit[RlSkewedlogisticregressionslogit[RlStereotypelogisticregressionsvy:cmd[SVY]svyestimation命令的svy版xtcloglog[XT]隨機(jī)效應(yīng)和總體平均cloglog模型xtgee[XT]GEE總體平均廣義線性模型xtlogit[XT]固定效應(yīng)、隨機(jī)效應(yīng)和總體平均logit模型xtologit[XT]隨機(jī)效應(yīng)有序logistic模型xtoprobit[XT]隨機(jī)效應(yīng)有序probit模型xtprobit[XT]隨機(jī)效應(yīng)和總體平均probit模型例:佔(zhàn)計(jì)決定美國(guó)婦女就業(yè)與否的二元結(jié)果模型。數(shù)據(jù)集包括以下變量:虛擬變量work(l=就業(yè)),age(年齡),虛擬變量mamed(l=已婚),childi'en(f女?dāng)?shù)),education(受教育年限)??紤]以下模型:worki=P0+p1agei+p2mamedi+p3childreni+p4educationi+si作為對(duì)照,首先使用OLS進(jìn)行線性概率模型(LPM)估訃:usewomenwkl,clear(原數(shù)據(jù)是womenwk.dta)regworkagemaniedchildreneducationprobitworkagemaniedcliildreneducation,nologmfe (計(jì)算probit模型在樣本均值處的邊際效應(yīng),與OLS估計(jì)的回歸系數(shù)進(jìn)行比較)estatclassification(計(jì)算預(yù)測(cè)準(zhǔn)確的百分比)logitworkagemaniedcliildreneducation,nologestatclassificationlietprobworkagemamedchildi'eneducationjiet(agemamiedchildreneducation)nolog(p值為0.78,所以接受“同方差”的原假設(shè)。)generateage2=age*agegenerateagemari=age*maiTiedgenerateageclii-age*childrenquietlylogitworkagemaniedchildreneducationage2agemariageclu'testage2agemanageclii'(接受零假設(shè))quietlylogitworkagemamedchildreneducationestimatesstoreblogitquietlyprobitworkagemaniedchildreneducationestimatesstorebprobitquietlyregi'essworkagemaniedchildi'eneducationestimatesstorebolsquietlylogitworkagemaniedchildreneducation,-\xe(robust)estimatesstoreblogitrquietlyprobitworkagemamedchildreneducation,vce(robust)estimatesstorebprobitrquietlyregressworkagemaniedchildreneducation,\-ce(robust)estimatesstorebolsrestimatestableblogitblogitrbprobitbprobitrbolsbolsr,tb(%7.3f)stfhit(%8.2f)例子:航夭飛機(jī)數(shù)據(jù)useshuttle,clear(美國(guó)航天飛機(jī)25次飛行數(shù)據(jù),包括1986年挑戰(zhàn)者號(hào)最后一次升空失敗的飛行)desciibe(disti-ess:助推結(jié)點(diǎn)一處或多處受損;temp:助推結(jié)點(diǎn)的溫度;date:從1960.1.1起的消逝天數(shù))generatedate=mdy(month,day,year)tabulatedistresstabulatedistress,nolabelgenerateany=distressreplaceany=lifdistress==2(建立虛擬變量any,0代表無(wú)損壞,1代表有1處或更多損壞)logisticanydate(logistic提供優(yōu)勢(shì)比,eAbo它的意義是,自變量每增加一個(gè)單位時(shí),事件(y=l)的發(fā)生比的變化倍數(shù)(如有其他自變量,則以其他自變量保持不變?yōu)闂l件))predictphat(取得預(yù)測(cè)概率)labelvariablephat"PredictedP(distress>=l)''giaphtwowayconnectedphatdateestatclassification(默認(rèn)應(yīng)用0.5的概率作為分割點(diǎn))。兒種符號(hào)的含義:D:一個(gè)觀測(cè)中所關(guān)注的事件確實(shí)發(fā)生(尸1)。在本例中,D表示結(jié)點(diǎn)損壞發(fā)生了?D:—個(gè)觀測(cè)中所關(guān)注的事件沒(méi)有發(fā)生(尸0)。在本例中,?D表示結(jié)點(diǎn)損壞沒(méi)發(fā)生+:模型預(yù)測(cè)概率值大于等于分割點(diǎn)。本例中,+表示模型預(yù)測(cè)的事故發(fā)生概率為0.5或更高-:模型預(yù)測(cè)概率值小于分割點(diǎn)。Pr(D|+)=12/16=75%(準(zhǔn)確預(yù)測(cè))Pr(-D|+)=4/16=25%Pr(?D卜)=5/7=71.43%(準(zhǔn)確預(yù)測(cè))Pr(D|-)=2/7=28.57%logisticanydatetemp(加入助推結(jié)點(diǎn)溫度temp)根據(jù)擬合模型,結(jié)點(diǎn)溫度每1度增量將使助推結(jié)點(diǎn)損壞發(fā)生比乘以0.84,也就是說(shuō)溫度每提高1度減少損壞發(fā)生比16%o卡方檢驗(yàn)更有確定性。estatclassification(分類正確率提高到78.26%)三、條件效應(yīng)標(biāo)繪圖(條件效應(yīng)標(biāo)繪圖有助于理解logistic模型在概率方面意味著什么)quietlylogitanydatetempgenerateLl=_b[_cons]+_b[date]*8569+_b[temp]*tempgeneratepliat1=1/(1+exp(-L1))(date的第25口分位數(shù)為8569:LI是預(yù)測(cè)的logit值;phatl為相應(yīng)的distress>=l的預(yù)測(cè)概率)labelvariablephatluP(distress>=l)date=8569”generateL2=_b[_cons]+_b[date]*9341+_b[temp]*tempgeneratephat2=1/(1+exp(-L2))(date的第75口分位數(shù)為9341)labelvariablephat2uP(distress>=1)date=934V'graphtwowaymsplinephatltemp,bands(50)||msplinephat2temp,baiids(50)||,ytitlef'Probabilityofthennaldistress”)legend(label(l"June1983”)label(2“July1985”))(挑戰(zhàn)者號(hào)的起飛溫度為31,這將使它位于圖的左側(cè)頂部。這個(gè)分析預(yù)測(cè)出助推結(jié)點(diǎn)兒乎是肯定要損壞的)四、診斷統(tǒng)訃與標(biāo)繪圖(不講)quietlylogisticanydatetemppredictphat3labelvariablephat3"Predictedprobability^predictdx2,dx2labelvariabledx2"ChangeinPearsonchi-squared-5predictdb^dbetalabelvariabledb"Influence、'predictdd,dd

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論