中級(jí)計(jì)量五章 離散選擇變量(20090202)1_第1頁(yè)
中級(jí)計(jì)量五章 離散選擇變量(20090202)1_第2頁(yè)
中級(jí)計(jì)量五章 離散選擇變量(20090202)1_第3頁(yè)
中級(jí)計(jì)量五章 離散選擇變量(20090202)1_第4頁(yè)
中級(jí)計(jì)量五章 離散選擇變量(20090202)1_第5頁(yè)
已閱讀5頁(yè),還剩21頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章離散選擇模型第一節(jié)模型的基礎(chǔ)與對(duì)應(yīng)的現(xiàn)象一、問(wèn)題的提出在研究社會(huì)經(jīng)濟(jì)現(xiàn)象時(shí),常常遇見一些特殊的被解釋變量,其表現(xiàn)是選擇與決策問(wèn)題,是定性的,沒有觀測(cè)數(shù)據(jù)所對(duì)應(yīng);或者其觀測(cè)到的是受某種限制的數(shù)據(jù)。1、被解釋變量是定性的選擇與決策問(wèn)題,可以用離散數(shù)據(jù)表示,即取值是不連續(xù)的。例如,某一事件發(fā)生與否,分別用1和0表示;對(duì)某一建議持反對(duì)、中立和贊成5種觀點(diǎn),分別用0、1、2表示。由離散數(shù)據(jù)建立的模型稱為離散選擇模型。2、被解釋變量取值是連續(xù)的,但取值的范圍受到限制,或者將連續(xù)數(shù)據(jù)轉(zhuǎn)化為類型數(shù)據(jù)。例如,消費(fèi)者購(gòu)買某種商品,當(dāng)消費(fèi)者愿意支付的貨幣數(shù)量超過(guò)該商品的最低價(jià)值時(shí),則表示為購(gòu)買價(jià)格;當(dāng)消費(fèi)者愿意支付的貨幣數(shù)量低于該商品的最低價(jià)值時(shí),則購(gòu)買價(jià)格為0。這種類型的數(shù)據(jù)成為審查數(shù)據(jù)。再例如,在研究居民儲(chǔ)蓄時(shí),調(diào)查數(shù)據(jù)只有存款一萬(wàn)元以上的帳戶,這時(shí)就不能以此代表所有居民儲(chǔ)蓄的情況,這種數(shù)據(jù)稱為截?cái)鄶?shù)據(jù)。這兩種數(shù)據(jù)所建立的模型稱為受限被解釋變量模型。有的時(shí)候,人們甚至更愿意將連續(xù)數(shù)據(jù)轉(zhuǎn)化為上述類型數(shù)據(jù)來(lái)度量,例如,高考分?jǐn)?shù)線的設(shè)置,就把高出分?jǐn)?shù)線和低于分?jǐn)?shù)線劃分為了兩類。下面是幾個(gè)離散數(shù)據(jù)的例子例5.1研究家庭是否購(gòu)買住房。由于,購(gòu)買住房行為要受到許多因素的影響,不僅有家庭收入、房屋價(jià)格,還有房屋的所在環(huán)境、人們的購(gòu)買心理等,所以人們購(gòu)買住房的心理價(jià)位很難觀測(cè)到,但我們可以觀察到是否購(gòu)買了住房,即“ [1,購(gòu)買Y=< t0, 不購(gòu)買我們希望研究買房的可能性,即概率P(Y=1)的大小。例5.2分析公司員工的跳槽行為。員工是否愿意跳槽到另一家公司,取決于薪資、發(fā)展?jié)摿Φ戎T多因素的權(quán)衡。員工跳槽的成本與收益是多少,我們無(wú)法知道,但我們可以觀察到員工是否跳槽,即

“[1,跳槽=<0,不跳槽例5.3對(duì)某項(xiàng)建議進(jìn)行投票。建議對(duì)投票者的利益影響是無(wú)法知道的,但可以觀察到投票者的行為只有三種,即I支持=<2,反對(duì)3棄權(quán)研究投票者投各種票的可能性,即P(Y=j),j=1,2,3。從上述被解釋變量所取的離散數(shù)據(jù)看,如果變量只有兩個(gè)選擇,則建立的模型為二元離散選擇模型,又稱二元型響應(yīng)模型;如果變量有多于二個(gè)的選擇,則為多元選擇模型。本章主要介紹二元離散選擇模型。離散選擇模型起源于Fechner于1860年進(jìn)行的動(dòng)物條件二元反射研究。1962年,Warner首次將它應(yīng)用于經(jīng)濟(jì)研究領(lǐng)域,用于研究公共交通工具和私人交通工具的選擇問(wèn)題。70-80年代,離散選擇模型被普遍應(yīng)用于經(jīng)濟(jì)布局、企業(yè)選點(diǎn)、交通問(wèn)題、就業(yè)問(wèn)題、購(gòu)買行為等經(jīng)濟(jì)決策領(lǐng)域的研究。模型的估計(jì)方法主要發(fā)展于20世紀(jì)80年代初期。(參見李子奈,高等計(jì)量經(jīng)濟(jì)學(xué),清華大學(xué)出版社,2000年,第155頁(yè)-第156頁(yè))二、線性概率模型對(duì)于二元選擇問(wèn)題,可以建立如下計(jì)量經(jīng)濟(jì)模型。1、線性概率模型的概念。設(shè)家庭購(gòu)買住房的選擇主要受到家庭的收入水平,則用如下模型表示Y=p+pX+ui12ii其中X為家庭的收入水平,Y為家庭購(gòu)買住房的選擇,即ii[1 家庭已購(gòu)買住房Y=<0 家庭無(wú)購(gòu)買住房Y01概率1-PP由于Y是取值為0和1的隨機(jī)變量,并定義取Y值為1的概率是p,則Y的分布為 則Y的數(shù)學(xué)期望為E(Y)二0x(1—p)+lxp顯然P(Y二1X)二p二E(Y)i從而E(Y/X)二B+pX二pTOC\o"1-5"\h\zI 1 2i上述數(shù)學(xué)模型的經(jīng)濟(jì)學(xué)解釋是,因?yàn)檫x擇購(gòu)買住房變量取值是1,其概率是p,并且這時(shí)對(duì)應(yīng)p的表示是一線性關(guān)系,因此,Y在給定X下的條件期望E(Y|X)I I可解釋為在給定X下,事件(家庭購(gòu)買住房)將發(fā)生的條件概率為P(Y=1|X),I I I亦即家庭選擇購(gòu)買住房的概率是家庭收入的一個(gè)線性函數(shù)。我們稱這一關(guān)系式為線性概率函數(shù)。2、線性概率函數(shù)的估計(jì)。對(duì)線性概率函數(shù)的估計(jì)存在以下困難:(1)隨機(jī)誤差項(xiàng)的非正態(tài)性表現(xiàn)。u二Y—P—PXTOC\o"1-5"\h\zii1 2i二1,u二1—P—PX\o"CurrentDocument"i i 1 2i二0,u二—P—PX\o"CurrentDocument"i i 1 2i表明u服從兩點(diǎn)分布。i(2)u的異方差性。事實(shí)上,iVar(u)=E(u一E(u))2=E(u2)i i i i=(一卩一卩X)2(1—p)+(1一卩-卩X)2p1 2i 1 2i=p2(1—p)+(1—p)2p=p(1—p)[p+1—p]=p(1—p)上式中,p隨著i的變動(dòng)是一個(gè)變動(dòng)的量,則u的方差不是一個(gè)固定常數(shù)。i(3)利用加權(quán)最小二乘法修正異方差。取權(quán)數(shù)為v'W+~p(T^~p)尋申2X)(氣書2X)可以證明具有同方差。在具體估計(jì)線性概率模型時(shí),用f作為P的估計(jì)來(lái)計(jì)可以證明i算權(quán)數(shù)w的估計(jì)W。3、可決系數(shù)R2的非真實(shí)性。由于,被解釋變量Y只取值1或0不可能有估計(jì)的線性概率模型能很好地?cái)M合這些點(diǎn),所以,這時(shí)計(jì)算的R2會(huì)比1小許多,在大多數(shù)例子中,R2介于0.2與0.6之間。4、0WE(Y\X)W1不成立??朔@一問(wèn)題可直接從對(duì)線性概率模型的估計(jì),I i求出Y,用人工的方法定義當(dāng)Y>1時(shí),取F=1;當(dāng)Y<0時(shí),取Y=0。但要比較i i i i i好地解決這類問(wèn)題,只能考慮采用新的估計(jì)方法,這就是將要介紹的Logit模型和Probit模型。

EVievs-[Equation:EQ02Torkfile:GUARATIPP549\Untit]IIIFileEditObjectViewFrocQuickOji+iunsWindowHelpViewIProcIObjectIPrintINameIFreezeIEstimateIFore匚於11StatsIResidsID即endentVariableYWMethodLeastSquaresDate:02/07/09Time:20:58Sample(adjusted)240Includedobservations:28afteradjustmentsVariableCoefficientStd.Errort-StatisticProbW1-1.2455920120566-10.3321100000XW0.119589000686217.4543800000R-squared0981050Meandependentvar2.191518AdjustedR-squared0980321SD.dependentvar3.556681SEcif「Eg「Essicm0.498942AkaikeinfocritE「ion1516095Sumsquaredresid6.472517Schwarzcriterion16112S2Loglikelihood19.22533Durbin-Watsonstat1882836第二節(jié)Logit模型一、Logit模型的產(chǎn)生1、 產(chǎn)生Logit模型的背景。由上述介紹可知,對(duì)于線性概率模型來(lái)說(shuō),存在一些問(wèn)題,有的問(wèn)題盡管可以用適當(dāng)?shù)姆椒右詮浹a(bǔ),但并不完善和理想。古典假定不再成立,如異方差性,可用加權(quán)OLS方法加以彌補(bǔ)。在線性概率模型中,對(duì)于不滿足OWE(Y|X)W1的情況,用人工的方I i法處理,即當(dāng)Y>1時(shí),取Y=1ii當(dāng)Y<0時(shí),取Y=0ii雖然能夠彌補(bǔ)不足,但仍然具有較強(qiáng)的主觀因素。(3)經(jīng)濟(jì)意義也不能很好地得到體現(xiàn)。在線性概率模型E(Y,;X)=B+pX=p中,概率P(Y=1)會(huì)隨著X的變化而線性變化,但這與實(shí)i 1 2i i際情況通常不符。例如購(gòu)買住房,通常收入很高或很低,對(duì)于購(gòu)買住房的可能性都不會(huì)有太大的影響,而當(dāng)收入增加很快時(shí),對(duì)購(gòu)買住房的影響將會(huì)很大。顯然,購(gòu)買住房的可能性與收入之間應(yīng)該是一種非線性關(guān)系。2、 Logit模型的含義。綜合上述討論,我們所需要的是具有如下二分性質(zhì)的模型:隨著X的減小,p趨近0的速度會(huì)越來(lái)越慢;反過(guò)來(lái)隨著X的增大,i i ip接近1的速度也越來(lái)越慢,而當(dāng)X增加很快時(shí),p的變化會(huì)比較快。故p與Xi i i i i之間應(yīng)呈非線性關(guān)系。p的變化始終在0和1之間。i因此,一個(gè)很自然的想法是采用隨機(jī)變量的分布函數(shù)來(lái)表示p與X的這種ii非線性關(guān)系。從幾何圖形看,所需要的模型有點(diǎn)像圖5.1那樣,概率位于0與1之間,并隨著X非線性地變化。

如圖5.1所示的S型曲線,就是隨機(jī)變量的一個(gè)累積分布函數(shù)(CDF)。因此,當(dāng)回歸中的被解釋變量是取0和1的二分變量時(shí),并且概率值的變化與解釋變量X之間有上述變化特征,則可用CDF去建立回歸模型。在二分被解釋變量i的研究中可使用多種分布函數(shù)(Cox,1970)。但最常用的是Logistic分布函數(shù)和標(biāo)準(zhǔn)正態(tài)分布函數(shù),前者導(dǎo)出Logit模型,后者導(dǎo)出Probit模型。3)設(shè)11+e一(卩]+卩2x,)式中,Z=p+PX。并且在該表達(dá)式中,有如下變動(dòng)規(guī)律,i1 2i當(dāng)ZT+8時(shí),pT1;ii當(dāng)ZT—g時(shí),pT0;ii1當(dāng)Z二0時(shí),p=oi i2(4)Logit模型。1+e1+e—Zi11+ez.p 1+eZii 1—p1+e—Z..(*)/.ln( .—)=Z=B+PX(*)1—p.12..其中一J為機(jī)會(huì)概率比(簡(jiǎn)稱機(jī)會(huì)比,下同),即事件發(fā)生與不發(fā)生所對(duì)應(yīng)的概1—p.率之比。稱(*)式為L(zhǎng)ogit模型。3、Logit模型的特點(diǎn)。隨著p從o變到i(亦即z從—g變到a),nL從—g變到a??蒚OC\o"1-5"\h\zi i—p以看出,在LPM中概率必須在0與1之間,但在Logit模型并不受此約束。ln(—L)對(duì)X為線性函數(shù)。i—p i當(dāng)ln(—L)為正的時(shí)候,意味著隨著X的增加,選擇1的可能性也增i—p i大了。當(dāng)In(丄)為負(fù)的時(shí)候,隨著X的增加,選擇1的可能性將減小。換言之,\o"CurrentDocument"1—p i當(dāng)機(jī)會(huì)比由1變到0時(shí),ln(—L)會(huì)變負(fù)并且在幅度上越來(lái)越大;當(dāng)機(jī)會(huì)比由11—p變到無(wú)窮時(shí),In(丄)為正,并且也會(huì)越來(lái)越大。1—p二、Logit模型的估計(jì)為了估計(jì)Logit模型,除了X夕卜,我們還應(yīng)有In(丄)的數(shù)值。由于p只取i 1—p i值為1和0,使得ln(—1)無(wú)意義,所以直接對(duì)Logit模型進(jìn)行估計(jì)有困難。這1—p時(shí),通常有以下估計(jì)方法。1、根據(jù)數(shù)據(jù)類型選用OLS方法。可通過(guò)市場(chǎng)調(diào)查獲得分組或重復(fù)數(shù)據(jù)資料,用相對(duì)頻數(shù)p=2作為p的估in ii計(jì)。以購(gòu)買住房為例,將購(gòu)買住房的情況分組,假設(shè)第i組共有n個(gè)家庭,收入i為X,其中有r個(gè)家庭已購(gòu)買住房,其余未購(gòu)買。則收入為X的家庭,購(gòu)買住i i i房的頻率為rp=-i-ini將其作為p的估計(jì),并代入對(duì)數(shù)機(jī)會(huì)比,有i1—p 1—pii于是,樣本回歸函數(shù)為八In(出)=P+PX1—p12ii對(duì)上式可直接運(yùn)用OLS法估計(jì)未知參數(shù)了。具體應(yīng)用可參見DamodarN.Gujarati《計(jì)量經(jīng)濟(jì)學(xué)基礎(chǔ)》(第四版)下冊(cè),中國(guó)人民大學(xué)出版社,2005年。第559頁(yè)-第560頁(yè)。2、最大似然估計(jì)方法。在線性回歸中估計(jì)總體未知參數(shù)時(shí)主要采用OLS方法,這一方法的原理是根據(jù)線性回歸模型選擇參數(shù)估計(jì),使被解釋變量的觀測(cè)值與模型估計(jì)值之間的離差平方值為最小。而最大似然估計(jì)方法則是統(tǒng)計(jì)分析中常用的經(jīng)典方法之一,在線性回歸分析中最大似然估計(jì)法可以得到與最小二乘法一致的結(jié)果。但是,與最小二乘法相比,最大似然估計(jì)法既可以用于線性模型,又可以用于非線性模型,由于Logit回歸模型是非線性模型,因此,最大似然估計(jì)法是估計(jì)Logit回歸模型最常用的方法。下面,以單變量為例,說(shuō)明具體的估計(jì)方法。假設(shè)有n個(gè)樣本觀測(cè)數(shù)據(jù)(X,Y),i=1,2,,n,由于樣本是隨機(jī)抽取,所以,ii在給定X條件下得到的Y=1和Y=0的概率分別是p和1-p。于是,一個(gè)觀測(cè)i i i i i值的概率為P(Y)=pYi(—pi-)i i i其中,Y二1或Y二0。因?yàn)椋黜?xiàng)觀察相互獨(dú)立,貝h次觀察所得的樣本數(shù)據(jù)的ii聯(lián)合分布可表示為各邊際分布的連乘積l(p,卩)=Hp(y)=npYi(1—p)(1—Yi)1 2 i i ii=1 i=1稱上式為n次觀察的似然函數(shù)。由最大似然估計(jì)法的原理知,最大似然估計(jì)就是求解出具有最大可能取所給定的樣本觀測(cè)數(shù)據(jù)的參數(shù)估計(jì)。于是,最大似然估計(jì)的關(guān)鍵是估計(jì)出p和p,使得上述表達(dá)式取得最大值。將上式兩端取對(duì)數(shù)得12

In[l(P,P)]=InH12pYi(1-pIn[l(P,P)]=InH12pYi(1-p)(1-Yi)iii=1=yn[Yinp+(1-Y)in(1-p)]i=1=yniii=1i=1Yln(—)+ln(l-p)i 1-p iiY(p+pX)+in(1—刖"疤)

i1 2i 1+ep1+p2Xi稱上式為對(duì)數(shù)似然函數(shù)。為了估計(jì)能使in[L(p,p)]有最大的總體參數(shù)估計(jì)p和112P,先分別對(duì)P,P求偏導(dǎo)數(shù),然后令其為0,得212aink(p,p)]y12 =dapaink(p,p』=yi=1ep1+p2XiY-i 1+ep1+p2Xiep1+p2Xiap2i=1Y-i 1+epi+柑Xi在線性回歸中,似然函數(shù)是通過(guò)把偏離差平方和分別對(duì)P,P求偏導(dǎo)數(shù)得到,它12對(duì)于未知參數(shù)都是線性的,因此,很容易求解。但是對(duì)于Logit回歸中的上述兩個(gè)方程是關(guān)于p,p的非線性函數(shù),求解十分困難。隨著現(xiàn)代計(jì)算機(jī)技術(shù)的發(fā)展,12許多計(jì)量經(jīng)濟(jì)學(xué)和統(tǒng)計(jì)學(xué)的軟件包均有Logit回歸的參數(shù)最大似然估計(jì)值,常用的EViews軟件就含有該估計(jì)方法。Logit回歸最大似然估計(jì)的統(tǒng)計(jì)性質(zhì)(1) 參數(shù)估計(jì)具有一致性,即當(dāng)樣本觀測(cè)增大時(shí),模型的參數(shù)估計(jì)值將比較接近參數(shù)的真值。(2) 參數(shù)估計(jì)為漸近有效,即當(dāng)樣本觀測(cè)增大時(shí),參數(shù)估計(jì)的標(biāo)準(zhǔn)誤相應(yīng)減小。(3) 參數(shù)估計(jì)滿足漸近正態(tài)性,即隨著樣本觀測(cè)的增大,估計(jì)的分布近似于正態(tài)分布。這意味著,可以利用這一性質(zhì)對(duì)未知參數(shù)進(jìn)行假設(shè)檢驗(yàn)和區(qū)間估計(jì)了。有關(guān)證明可參見Aidrich,John&ForrestD.Nelson.1984.LinearProbability,Logit,andProbitModels.NewburyPark,SagePubiications三、Logit回歸模型的評(píng)價(jià)和參數(shù)的統(tǒng)計(jì)檢驗(yàn)與一般線性回歸模型一樣,在得到Logit回歸模型的參數(shù)估計(jì)后,還應(yīng)對(duì)模型進(jìn)行評(píng)價(jià)和相應(yīng)的統(tǒng)計(jì)檢驗(yàn)。1、模型的擬合優(yōu)度檢驗(yàn)。模型估計(jì)完成以后,需要對(duì)模型是否有效地描述了模型與觀測(cè)數(shù)據(jù)的匹配程度進(jìn)行評(píng)價(jià)。如果模型的預(yù)測(cè)值能夠與對(duì)應(yīng)的觀測(cè)值有較高的一致性,就認(rèn)為該模型能擬合數(shù)據(jù),否則,將不接受這一模型。對(duì)Logit回歸模型的評(píng)價(jià)有多種方法,不同的計(jì)算軟件給出的評(píng)價(jià)結(jié)果也有差異。這里,我們將根據(jù)EViews軟件,介紹模型擬合優(yōu)度的檢驗(yàn)方法。(1)McFaddenR2在前面的介紹中,已經(jīng)提到對(duì)于離散選擇模型,通常的擬合優(yōu)度R2沒有多大意義。在EViews軟件里,有一種方法即McFaddenR2,簡(jiǎn)記為R2。其計(jì)McF算公式為R2McF1R2McF丄— ur-LIF式中,LIF為模型中包含所有解釋變量的無(wú)約束對(duì)數(shù)似然函數(shù)值,LIF為模型ur r中僅含有截距項(xiàng)的有約束的對(duì)數(shù)似然函數(shù)值。從概念上講,LIF和LIF分別等ur r價(jià)于普通線性回歸模型中的TSS和RSS。R2與R2一樣,也在0到1之間變動(dòng)。McF(2)期望-預(yù)測(cè)表檢驗(yàn)。該方法的原理是,在模型參數(shù)估計(jì)后,選取適當(dāng)?shù)慕財(cái)嘀祊(0<p<1),將觀測(cè)數(shù)據(jù)分成兩組,一組為1/(1+e-z)Wp,另一組為1/(1+e-z)>p,其中,Z=0+(3X。如果樣本中的一個(gè)觀測(cè)數(shù)據(jù)的Y數(shù)值為0,并且該樣本屬于第1i12i組,或者一個(gè)觀測(cè)數(shù)據(jù)的Y數(shù)值為1,并且屬于第2組,就稱這個(gè)觀測(cè)數(shù)據(jù)是分

組恰當(dāng)?shù)?,否則就稱這個(gè)觀測(cè)數(shù)據(jù)是分組不恰當(dāng)?shù)?。如果模型估?jì)與實(shí)際觀測(cè)數(shù)

據(jù)比較一致,則大多數(shù)的觀測(cè)數(shù)據(jù)應(yīng)該是分組恰當(dāng)?shù)?,反之,如果分組不恰當(dāng)?shù)?/p>

觀測(cè)數(shù)據(jù)所占的比重很大,說(shuō)明模型估計(jì)與實(shí)際觀測(cè)數(shù)據(jù)的擬合程度較差,模型

需要調(diào)整。因此,該方法的思想是利用分組恰當(dāng)與否,得到觀測(cè)數(shù)據(jù)占總樣本的

比重來(lái)檢驗(yàn)?zāi)P偷臄M合優(yōu)度。利用軟件EViews進(jìn)行期望-預(yù)測(cè)表檢驗(yàn)的步驟如下:第一步,在估計(jì)好模型的窗口中按此路徑選擇View/ExpectationPredictionTable。第二步,出現(xiàn)一個(gè)對(duì)話框,在對(duì)話框里輸入一個(gè)截?cái)嘀祊(0<p<1),系統(tǒng)默認(rèn)的截?cái)嘀凳?.5。第三步,點(diǎn)擊OK后可生成對(duì)應(yīng)的期望-預(yù)測(cè)表。這時(shí)便可利用該表進(jìn)行擬合優(yōu)度的判斷。有關(guān)Logit回歸模型的擬合優(yōu)度其它檢驗(yàn)方法,可參見相關(guān)文獻(xiàn),如王濟(jì)川、郭志剛,Logistic回歸模型——方法與應(yīng)用,高等教育出版社,2001年。2、參數(shù)的顯著性檢驗(yàn)。2、參數(shù)的顯著性檢驗(yàn)。對(duì)模型中參數(shù)的顯著性檢驗(yàn),就是決策判斷某個(gè)解釋變量對(duì)事件的發(fā)生(即選取Y=1)是否有顯著性影響。如果檢驗(yàn)結(jié)果表明該解釋變量對(duì)選取Y=1的發(fā)生有顯著性影響,則認(rèn)為將該解釋變量放入Logit回歸模型中是恰當(dāng)?shù)?。否則,需要對(duì)模型進(jìn)行適當(dāng)?shù)恼{(diào)整。(1)Z檢驗(yàn)。以一元Logit回歸模型為例,設(shè)模型為P(Y=P(Y=11X)=i11+e-(Pj+P2x.)1+exp(-P-PX)12.對(duì)該模型中的參數(shù)P的顯著性檢驗(yàn)的原假設(shè)為H:P二0,即解釋變量X對(duì)事件202.Y=1發(fā)生的概率沒有顯著性影響。根據(jù)參數(shù)的最大似然估計(jì)性質(zhì)可知,在大樣本條件下,P漸近服從正態(tài)分布,于是,在H:P二0成立的前提下,檢驗(yàn)統(tǒng)計(jì)202量為Z=JLse(p)2漸近服從標(biāo)準(zhǔn)正態(tài)分布。式中,se(P)為最大似然估計(jì)P的標(biāo)準(zhǔn)誤差。因此,22

可按常規(guī)查標(biāo)準(zhǔn)正態(tài)分布表,對(duì)原假設(shè)進(jìn)行判斷,從而檢驗(yàn)?zāi)P椭袇?shù)的顯著性。(2)Wald檢驗(yàn)對(duì)模型中參數(shù)顯著性檢驗(yàn)還可使用Wald檢驗(yàn),其檢驗(yàn)統(tǒng)計(jì)量為八W二(2)2se(0)2在H:0=0下,W漸近服從自由度為1的咒2分布。因此,可根據(jù)咒2分布表,02在給定的顯著性水平a下,得到相應(yīng)的臨界值,從而判斷參數(shù)的顯著性??蓞㈤咹auck,W.W.&A.Donner.1977.Wald'testsasappliedtohypothesesinlogitanalysis.JournaloftheAmericanStatisticalAssociation,Vol.72:851-853(3)似然比檢驗(yàn)。統(tǒng)計(jì)學(xué)上已經(jīng)證明,在大樣本情況下,兩個(gè)模型之間如果具有嵌套關(guān)系,則兩個(gè)模型之間的對(duì)數(shù)似然值乘以-2的結(jié)果之差近似服從X2分布。這一統(tǒng)計(jì)量就是似然比統(tǒng)計(jì)量。該檢驗(yàn)的思想是,假設(shè)一個(gè)模型記為Model、中有解釋變量X,另一個(gè)模型j記為Model2包含了Modell中所有其它解釋變量,而沒有包含X,則稱Model2嵌j套于Modell,亦即Modell中包含了Model2。通過(guò)這一模型之間嵌套關(guān)系,我們實(shí)際上需要判斷的是X出現(xiàn)在模型中是否合適。Hanushek&Jackson,1977;jAldrich&Nelso,1984;Greene,1990;Long,1997分別證實(shí)了似然比統(tǒng)計(jì)量為L(zhǎng)R=(-2liL( -))-(L2ln(moedl2 meold=-2ln^moed^2 )的最大似然函數(shù)moedl1的最大似然函數(shù)其中,ln(L )為所設(shè)定的原模型(即包含了所有解釋變量)model1的對(duì)數(shù)值,ln(的對(duì)數(shù)值,ln(L )為省略模型(即省略了解釋變量X.)的最大似然函數(shù)的model2 j對(duì)數(shù)值,兩者之間的差乘以-2近似地服從X2分布,其自由度為省略了的解釋變量的個(gè)數(shù)。接下來(lái),可根據(jù)X2分布表,在給定的顯著性水平a下,得到臨界值,從而判斷參數(shù)的顯著性。例分析某種教學(xué)方法對(duì)成績(jī)影響的有效性,被解釋變量GRADE為接受新

教學(xué)方法后成績(jī)是否改善,如果改善取1,否則取0;GPA為平均分?jǐn)?shù);TUCE為測(cè)驗(yàn)得分;PSI為是否接受新教學(xué)方法,如果接受取1,否則取0。運(yùn)用EViews軟件中Logit模型估計(jì)方法得到如下結(jié)果E¥ie<s-[Equation:EQ01Torkfile:GREEHP204\GreFileEditObjectViewFrocQuickOptionsWindowHelp

View|P「uiz|Object|P「int|Name|F「e^E^|Estimate|Fu「亡cast|Stats|Reside|DependentVariableGRADEMethodML-BinaryLogit(Quadratichillclimbing:Date:06/04/06Time:22:11Sample:132Includedobservations:32Convergenceachievedafter5iterationsCovariancematrixcomputedusingsecondderivatives由表格寫出估MeandependentvarSEofregressionresid034375003847164.144171-12.88963-2059173SDdependentvarAkaikeinfocriterionSchwarzcriterionHannan-Quinncriter-■1 由表格寫出估MeandependentvarSEofregressionresid034375003847164.144171-12.88963-2059173SDdependentvarAkaikeinfocriterionSchwarzcriterionHannan-Quinncriter-■1 ::: '4':::latestrloglikelihoodP^(Y曲1*GPA,TUCE,PSI)二McFaddenR-squared1+e-z0.482569105560212388191116333-0.4028010374038VariableCoefficientStdErrorz-StatisticProbC-13.021364.931317-2.64064100083GPA2.82611312629402.23772600252TUCE009515801415640.67223506014PSI2.37868810646632.23442600256ObswithDep=1 11四、Logit模型回歸系數(shù)的解釋由前面的推導(dǎo)可知,將事件發(fā)生的條件概率定義為P(Y=11X)二p,則我們ii可得到如下模型P(Y=11P(Y=11X)=i11+e-(Pj+P2x.)1+exp(一卩-PX)12.進(jìn)一步,在發(fā)生比的基礎(chǔ)上,我們還可得到如下模型ln(—)=P+PX1-p12..對(duì)此模型,由于等式右端為一線性表示,則可完全按照線性回歸模型系數(shù)那樣來(lái)解釋。一個(gè)解釋變量的作用如果是增加對(duì)數(shù)發(fā)生比的話,也就增加了事件發(fā)生的概率。具體來(lái)講,Logit模型的系數(shù)如果是正的并且統(tǒng)計(jì)顯著,則在控制其它變量的情況下,對(duì)數(shù)發(fā)生比隨對(duì)應(yīng)的解釋變量值增加而增加,相反,一個(gè)顯著的負(fù)

系數(shù)代表對(duì)數(shù)發(fā)生比隨對(duì)應(yīng)解釋變量的增加而減少。如果系數(shù)的統(tǒng)計(jì)性質(zhì)不顯著,說(shuō)明對(duì)應(yīng)解釋變量的作用在統(tǒng)計(jì)上與0無(wú)差異。1、按發(fā)生比率來(lái)解釋Logit模型的系數(shù)。對(duì)Logit模型的回歸系數(shù)進(jìn)行解釋時(shí),很難具體把握以對(duì)數(shù)單位測(cè)量的作用幅度,所以通常是將Logit作用轉(zhuǎn)換成對(duì)應(yīng)的發(fā)生比來(lái)解釋。設(shè)模型為ln(—=卩+卩X1—p 1 2ii轉(zhuǎn)換成發(fā)生比的形式p 1+eZi—二 -二ez.二eP,+P2x;二eP,xeP2x;i12i12i1—p1+e—Z;;式中,截距P可以作為基準(zhǔn)發(fā)生比的對(duì)數(shù)?;鶞?zhǔn)的意思是指當(dāng)Logit模型中沒有1任何解釋變量時(shí)所產(chǎn)生的發(fā)生比?;蛘撸顺A客?,所有解釋變量都取0值時(shí)所產(chǎn)生的發(fā)生比。對(duì)于解釋變量的作用的解釋,由上式看出,各項(xiàng)作用之間已經(jīng)由加法的關(guān)系轉(zhuǎn)變?yōu)槌朔P(guān)系。因此,系數(shù)P的作用可解釋為,當(dāng)P為正值時(shí),22eP2將大于1,則在其它條件不變的情況下,X每增加一個(gè)單位值時(shí)發(fā)生比會(huì)相;應(yīng)增加;當(dāng)P為負(fù)值時(shí),eP2將小于1,說(shuō)明X每增加一個(gè)單位值時(shí)發(fā)生比會(huì)相2;應(yīng)減少;而當(dāng)P為0時(shí),eP2將等于1,那么X不論怎樣變化發(fā)生比都不會(huì)變化。2;例如,在新教學(xué)方法采納的分析中,已估計(jì)的方程可按指數(shù)運(yùn)算法則轉(zhuǎn)變?yōu)镻(Y=11GPA,P(Y=11GPA,TUCE,PSI)=11+e-z1+e—(—13.0214+2.8261GPA+0.0952TUCE+2.3787PSI)=e—(—13.0214+2.8261GPA+0.0952TUCE+2.3787PSI)1—p=e13.0214xe2.8261GPAXe0.0952TUCEXe2.3787PSI由上述表達(dá)式可以看出,由于GPA>0,則e2.826卜1,因此,在其它條件不變的情況下,平均分?jǐn)?shù)每增加一個(gè)單位,將導(dǎo)致接受新教學(xué)方法后成績(jī)有所改善的發(fā)生比會(huì)相應(yīng)提高。同理,對(duì)于變量TUCE也可作類似的討論;由于PSI為虛擬解釋變量,表示是否接受新教學(xué)方法,如果接受取1,否則取0,因此,在其它條件

不變的情況下,當(dāng)PSI=1時(shí),則將會(huì)使接受新教學(xué)方法后,學(xué)習(xí)成績(jī)改善的發(fā)生比有所提高,而當(dāng)PSI=0時(shí),則將會(huì)使接受新教學(xué)方法后,學(xué)習(xí)成績(jī)改善的發(fā)生比保持不變。2、用概率來(lái)解釋Logit模型的系數(shù)。除了解釋變量對(duì)于對(duì)數(shù)發(fā)生比的偏作用外,有時(shí)也用事件發(fā)生的概率來(lái)解釋模型中系數(shù)的偏作用。對(duì)事件發(fā)生概率的偏作用可以通過(guò)對(duì)Logit模型P(P(Y=IIX)=i11+e-(Pj+P2x.)求X的偏導(dǎo)數(shù)來(lái)加以解釋。其求導(dǎo)結(jié)果如下ieP1+PeP1+P2XidpdXid(匚三一)1+eP,+P2x.- 2dX (1+eP1+P2Xi)2iPeP1+P2Xi-P2p(1-p)于是,變量X對(duì)事件發(fā)生概率的偏作用就等于該解釋變量的系數(shù)P與p(1-p)的i2乘積。偏作用的符號(hào)由P決定,因?yàn)閜(1-p)永遠(yuǎn)為正值,作用的幅度依賴于P22的幅度和對(duì)應(yīng)于X特定值的概率,而它與模型中所有其它解釋變量有關(guān)。因此i不同于對(duì)發(fā)生比作用的解釋,對(duì)事件發(fā)生概率的偏作用是隨p值的變化而變化的。這就需要在討論變量X對(duì)事件發(fā)生概率的偏作用時(shí),應(yīng)將概率p值計(jì)算出i來(lái)后,才能解釋其偏作用。3、預(yù)測(cè)概率。與一般線性回歸模型一樣,根據(jù)Logit模型也可以獲得事件發(fā)生的預(yù)測(cè)概率。以一個(gè)解釋變量的Logit模型為例,如果我們知道參數(shù)估計(jì)P和P,并確定某一12事件的X(i豐1,2, ,n),便可將其代入Logit模型,計(jì)算預(yù)測(cè)概率。計(jì)算公式為i入 1 eA+^Xp— —Y 入 入 Y 入 入1+e-(P1+P2Xi) 1+eP1+P2Xi在計(jì)算預(yù)測(cè)概率的基礎(chǔ)上,還進(jìn)一步計(jì)算在解釋變量發(fā)生離散變化時(shí)預(yù)測(cè)概率的變化,這種方法被稱為概率離散變化法。其計(jì)算公式是Ap—P[y—1IX]-P[y—1%]—P[y—AX]i+1 i

e卩i正卩jXjie卩i正卩jXjie j=1(i=1,2,…,n)一(久+^p.X..) p,+^p.X..1+e1 j=i jji1+e1j=ijji相應(yīng)的對(duì)數(shù)發(fā)生比為ln4^扌p+才pX i?毛1…2,n,)1—p 1 jjii j=1類似多元線性回歸模型,在Logit模型中,由于多個(gè)解釋變量可能會(huì)以多個(gè)不同的尺度加以測(cè)量,這個(gè)時(shí)候要直接對(duì)比不同解釋變量對(duì)發(fā)生比的影響是不行的,因此,需要對(duì)解釋變量進(jìn)行標(biāo)準(zhǔn)化變換,將解釋變量和被解釋變量由非標(biāo)準(zhǔn)化變量轉(zhuǎn)換為標(biāo)準(zhǔn)化變量,從而,才直接對(duì)比各個(gè)解釋變量對(duì)發(fā)生比的影響大小。其變換方法與多元線性回歸模型一樣??蓞⒁娡鯘?jì)川、郭志剛,Logistic回歸模型——方法與應(yīng)用,高等教育出版社,2001年。第115頁(yè)-第117頁(yè)。第三節(jié)Probit模型_、Probit模型及參數(shù)估計(jì)在前面已經(jīng)看到,由S型曲線,可分別得到累積分布函數(shù)和標(biāo)準(zhǔn)正態(tài)分布函數(shù),對(duì)于后者可建立一個(gè)二元選擇的Probit模型。單一解釋變量X的Probit模i型為p1+p2XiP(Y=11X)=?(p+pX)=112'p(z)dzi12i—g式中①(z),申(z)分別為標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)和密度函數(shù)。與Logit模型的參數(shù)估計(jì)相似,對(duì)Probit模型的參數(shù)估計(jì)也可采用最大似然估計(jì)方法。有的教科書還介紹了一種運(yùn)用效用行為選擇理論建立Probit模型,并采用群組數(shù)據(jù)對(duì)Probit模型的參數(shù)應(yīng)用OLS方法進(jìn)行估計(jì)(參見DamodarN.Gujarati《計(jì)量經(jīng)濟(jì)學(xué)基礎(chǔ)》(第四版)下冊(cè),中國(guó)人民大學(xué)出版社,2005年,

第569頁(yè)-573頁(yè))。這里我們僅根據(jù)計(jì)算軟件Eviews的功能,介紹最大似然估計(jì)對(duì)Probit模型參數(shù)的估計(jì)。在樣本分布與總體分布一致的前提下,按隨機(jī)抽樣原則抽取樣本,對(duì)n則抽取樣本,對(duì)n個(gè)樣本(X,Y)iii二1,2, ,n,建立對(duì)數(shù)似然函數(shù)ln[Lln[L0P]扌[Y1 2 ii=1)丄郵40(X]1 2i))上述模型的最大似然估計(jì)就是使該表達(dá)式有最大值時(shí)的0、0的估計(jì)0、121具體求解過(guò)程這里不再贅述。例在前述新教學(xué)方法的例子里,運(yùn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論