中級計量五章 離散選擇變量(20090202)1_第1頁
中級計量五章 離散選擇變量(20090202)1_第2頁
中級計量五章 離散選擇變量(20090202)1_第3頁
中級計量五章 離散選擇變量(20090202)1_第4頁
中級計量五章 離散選擇變量(20090202)1_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五章離散選擇模型第一節(jié)模型的基礎與對應的現象一、問題的提出在研究社會經濟現象時,常常遇見一些特殊的被解釋變量,其表現是選擇與決策問題,是定性的,沒有觀測數據所對應;或者其觀測到的是受某種限制的數據。1、被解釋變量是定性的選擇與決策問題,可以用離散數據表示,即取值是不連續(xù)的。例如,某一事件發(fā)生與否,分別用1和0表示;對某一建議持反對、中立和贊成5種觀點,分別用0、1、2表示。由離散數據建立的模型稱為離散選擇模型。2、被解釋變量取值是連續(xù)的,但取值的范圍受到限制,或者將連續(xù)數據轉化為類型數據。例如,消費者購買某種商品,當消費者愿意支付的貨幣數量超過該商品的最低價值時,則表示為購買價格;當消費者愿意支付的貨幣數量低于該商品的最低價值時,則購買價格為0。這種類型的數據成為審查數據。再例如,在研究居民儲蓄時,調查數據只有存款一萬元以上的帳戶,這時就不能以此代表所有居民儲蓄的情況,這種數據稱為截斷數據。這兩種數據所建立的模型稱為受限被解釋變量模型。有的時候,人們甚至更愿意將連續(xù)數據轉化為上述類型數據來度量,例如,高考分數線的設置,就把高出分數線和低于分數線劃分為了兩類。下面是幾個離散數據的例子例5.1研究家庭是否購買住房。由于,購買住房行為要受到許多因素的影響,不僅有家庭收入、房屋價格,還有房屋的所在環(huán)境、人們的購買心理等,所以人們購買住房的心理價位很難觀測到,但我們可以觀察到是否購買了住房,即“ [1,購買Y=< t0, 不購買我們希望研究買房的可能性,即概率P(Y=1)的大小。例5.2分析公司員工的跳槽行為。員工是否愿意跳槽到另一家公司,取決于薪資、發(fā)展?jié)摿Φ戎T多因素的權衡。員工跳槽的成本與收益是多少,我們無法知道,但我們可以觀察到員工是否跳槽,即

“[1,跳槽=<0,不跳槽例5.3對某項建議進行投票。建議對投票者的利益影響是無法知道的,但可以觀察到投票者的行為只有三種,即I支持=<2,反對3棄權研究投票者投各種票的可能性,即P(Y=j),j=1,2,3。從上述被解釋變量所取的離散數據看,如果變量只有兩個選擇,則建立的模型為二元離散選擇模型,又稱二元型響應模型;如果變量有多于二個的選擇,則為多元選擇模型。本章主要介紹二元離散選擇模型。離散選擇模型起源于Fechner于1860年進行的動物條件二元反射研究。1962年,Warner首次將它應用于經濟研究領域,用于研究公共交通工具和私人交通工具的選擇問題。70-80年代,離散選擇模型被普遍應用于經濟布局、企業(yè)選點、交通問題、就業(yè)問題、購買行為等經濟決策領域的研究。模型的估計方法主要發(fā)展于20世紀80年代初期。(參見李子奈,高等計量經濟學,清華大學出版社,2000年,第155頁-第156頁)二、線性概率模型對于二元選擇問題,可以建立如下計量經濟模型。1、線性概率模型的概念。設家庭購買住房的選擇主要受到家庭的收入水平,則用如下模型表示Y=p+pX+ui12ii其中X為家庭的收入水平,Y為家庭購買住房的選擇,即ii[1 家庭已購買住房Y=<0 家庭無購買住房Y01概率1-PP由于Y是取值為0和1的隨機變量,并定義取Y值為1的概率是p,則Y的分布為 則Y的數學期望為E(Y)二0x(1—p)+lxp顯然P(Y二1X)二p二E(Y)i從而E(Y/X)二B+pX二pTOC\o"1-5"\h\zI 1 2i上述數學模型的經濟學解釋是,因為選擇購買住房變量取值是1,其概率是p,并且這時對應p的表示是一線性關系,因此,Y在給定X下的條件期望E(Y|X)I I可解釋為在給定X下,事件(家庭購買住房)將發(fā)生的條件概率為P(Y=1|X),I I I亦即家庭選擇購買住房的概率是家庭收入的一個線性函數。我們稱這一關系式為線性概率函數。2、線性概率函數的估計。對線性概率函數的估計存在以下困難:(1)隨機誤差項的非正態(tài)性表現。u二Y—P—PXTOC\o"1-5"\h\zii1 2i二1,u二1—P—PX\o"CurrentDocument"i i 1 2i二0,u二—P—PX\o"CurrentDocument"i i 1 2i表明u服從兩點分布。i(2)u的異方差性。事實上,iVar(u)=E(u一E(u))2=E(u2)i i i i=(一卩一卩X)2(1—p)+(1一卩-卩X)2p1 2i 1 2i=p2(1—p)+(1—p)2p=p(1—p)[p+1—p]=p(1—p)上式中,p隨著i的變動是一個變動的量,則u的方差不是一個固定常數。i(3)利用加權最小二乘法修正異方差。取權數為v'W+~p(T^~p)尋申2X)(氣書2X)可以證明具有同方差。在具體估計線性概率模型時,用f作為P的估計來計可以證明i算權數w的估計W。3、可決系數R2的非真實性。由于,被解釋變量Y只取值1或0不可能有估計的線性概率模型能很好地擬合這些點,所以,這時計算的R2會比1小許多,在大多數例子中,R2介于0.2與0.6之間。4、0WE(Y\X)W1不成立??朔@一問題可直接從對線性概率模型的估計,I i求出Y,用人工的方法定義當Y>1時,取F=1;當Y<0時,取Y=0。但要比較i i i i i好地解決這類問題,只能考慮采用新的估計方法,這就是將要介紹的Logit模型和Probit模型。

EVievs-[Equation:EQ02Torkfile:GUARATIPP549\Untit]IIIFileEditObjectViewFrocQuickOji+iunsWindowHelpViewIProcIObjectIPrintINameIFreezeIEstimateIFore匚於11StatsIResidsID即endentVariableYWMethodLeastSquaresDate:02/07/09Time:20:58Sample(adjusted)240Includedobservations:28afteradjustmentsVariableCoefficientStd.Errort-StatisticProbW1-1.2455920120566-10.3321100000XW0.119589000686217.4543800000R-squared0981050Meandependentvar2.191518AdjustedR-squared0980321SD.dependentvar3.556681SEcif「Eg「Essicm0.498942AkaikeinfocritE「ion1516095Sumsquaredresid6.472517Schwarzcriterion16112S2Loglikelihood19.22533Durbin-Watsonstat1882836第二節(jié)Logit模型一、Logit模型的產生1、 產生Logit模型的背景。由上述介紹可知,對于線性概率模型來說,存在一些問題,有的問題盡管可以用適當的方法加以彌補,但并不完善和理想。古典假定不再成立,如異方差性,可用加權OLS方法加以彌補。在線性概率模型中,對于不滿足OWE(Y|X)W1的情況,用人工的方I i法處理,即當Y>1時,取Y=1ii當Y<0時,取Y=0ii雖然能夠彌補不足,但仍然具有較強的主觀因素。(3)經濟意義也不能很好地得到體現。在線性概率模型E(Y,;X)=B+pX=p中,概率P(Y=1)會隨著X的變化而線性變化,但這與實i 1 2i i際情況通常不符。例如購買住房,通常收入很高或很低,對于購買住房的可能性都不會有太大的影響,而當收入增加很快時,對購買住房的影響將會很大。顯然,購買住房的可能性與收入之間應該是一種非線性關系。2、 Logit模型的含義。綜合上述討論,我們所需要的是具有如下二分性質的模型:隨著X的減小,p趨近0的速度會越來越慢;反過來隨著X的增大,i i ip接近1的速度也越來越慢,而當X增加很快時,p的變化會比較快。故p與Xi i i i i之間應呈非線性關系。p的變化始終在0和1之間。i因此,一個很自然的想法是采用隨機變量的分布函數來表示p與X的這種ii非線性關系。從幾何圖形看,所需要的模型有點像圖5.1那樣,概率位于0與1之間,并隨著X非線性地變化。

如圖5.1所示的S型曲線,就是隨機變量的一個累積分布函數(CDF)。因此,當回歸中的被解釋變量是取0和1的二分變量時,并且概率值的變化與解釋變量X之間有上述變化特征,則可用CDF去建立回歸模型。在二分被解釋變量i的研究中可使用多種分布函數(Cox,1970)。但最常用的是Logistic分布函數和標準正態(tài)分布函數,前者導出Logit模型,后者導出Probit模型。3)設11+e一(卩]+卩2x,)式中,Z=p+PX。并且在該表達式中,有如下變動規(guī)律,i1 2i當ZT+8時,pT1;ii當ZT—g時,pT0;ii1當Z二0時,p=oi i2(4)Logit模型。1+e1+e—Zi11+ez.p 1+eZii 1—p1+e—Z..(*)/.ln( .—)=Z=B+PX(*)1—p.12..其中一J為機會概率比(簡稱機會比,下同),即事件發(fā)生與不發(fā)生所對應的概1—p.率之比。稱(*)式為Logit模型。3、Logit模型的特點。隨著p從o變到i(亦即z從—g變到a),nL從—g變到a??蒚OC\o"1-5"\h\zi i—p以看出,在LPM中概率必須在0與1之間,但在Logit模型并不受此約束。ln(—L)對X為線性函數。i—p i當ln(—L)為正的時候,意味著隨著X的增加,選擇1的可能性也增i—p i大了。當In(丄)為負的時候,隨著X的增加,選擇1的可能性將減小。換言之,\o"CurrentDocument"1—p i當機會比由1變到0時,ln(—L)會變負并且在幅度上越來越大;當機會比由11—p變到無窮時,In(丄)為正,并且也會越來越大。1—p二、Logit模型的估計為了估計Logit模型,除了X夕卜,我們還應有In(丄)的數值。由于p只取i 1—p i值為1和0,使得ln(—1)無意義,所以直接對Logit模型進行估計有困難。這1—p時,通常有以下估計方法。1、根據數據類型選用OLS方法??赏ㄟ^市場調查獲得分組或重復數據資料,用相對頻數p=2作為p的估in ii計。以購買住房為例,將購買住房的情況分組,假設第i組共有n個家庭,收入i為X,其中有r個家庭已購買住房,其余未購買。則收入為X的家庭,購買住i i i房的頻率為rp=-i-ini將其作為p的估計,并代入對數機會比,有i1—p 1—pii于是,樣本回歸函數為八In(出)=P+PX1—p12ii對上式可直接運用OLS法估計未知參數了。具體應用可參見DamodarN.Gujarati《計量經濟學基礎》(第四版)下冊,中國人民大學出版社,2005年。第559頁-第560頁。2、最大似然估計方法。在線性回歸中估計總體未知參數時主要采用OLS方法,這一方法的原理是根據線性回歸模型選擇參數估計,使被解釋變量的觀測值與模型估計值之間的離差平方值為最小。而最大似然估計方法則是統計分析中常用的經典方法之一,在線性回歸分析中最大似然估計法可以得到與最小二乘法一致的結果。但是,與最小二乘法相比,最大似然估計法既可以用于線性模型,又可以用于非線性模型,由于Logit回歸模型是非線性模型,因此,最大似然估計法是估計Logit回歸模型最常用的方法。下面,以單變量為例,說明具體的估計方法。假設有n個樣本觀測數據(X,Y),i=1,2,,n,由于樣本是隨機抽取,所以,ii在給定X條件下得到的Y=1和Y=0的概率分別是p和1-p。于是,一個觀測i i i i i值的概率為P(Y)=pYi(—pi-)i i i其中,Y二1或Y二0。因為,各項觀察相互獨立,貝h次觀察所得的樣本數據的ii聯合分布可表示為各邊際分布的連乘積l(p,卩)=Hp(y)=npYi(1—p)(1—Yi)1 2 i i ii=1 i=1稱上式為n次觀察的似然函數。由最大似然估計法的原理知,最大似然估計就是求解出具有最大可能取所給定的樣本觀測數據的參數估計。于是,最大似然估計的關鍵是估計出p和p,使得上述表達式取得最大值。將上式兩端取對數得12

In[l(P,P)]=InH12pYi(1-pIn[l(P,P)]=InH12pYi(1-p)(1-Yi)iii=1=yn[Yinp+(1-Y)in(1-p)]i=1=yniii=1i=1Yln(—)+ln(l-p)i 1-p iiY(p+pX)+in(1—刖"疤)

i1 2i 1+ep1+p2Xi稱上式為對數似然函數。為了估計能使in[L(p,p)]有最大的總體參數估計p和112P,先分別對P,P求偏導數,然后令其為0,得212aink(p,p)]y12 =dapaink(p,p』=yi=1ep1+p2XiY-i 1+ep1+p2Xiep1+p2Xiap2i=1Y-i 1+epi+柑Xi在線性回歸中,似然函數是通過把偏離差平方和分別對P,P求偏導數得到,它12對于未知參數都是線性的,因此,很容易求解。但是對于Logit回歸中的上述兩個方程是關于p,p的非線性函數,求解十分困難。隨著現代計算機技術的發(fā)展,12許多計量經濟學和統計學的軟件包均有Logit回歸的參數最大似然估計值,常用的EViews軟件就含有該估計方法。Logit回歸最大似然估計的統計性質(1) 參數估計具有一致性,即當樣本觀測增大時,模型的參數估計值將比較接近參數的真值。(2) 參數估計為漸近有效,即當樣本觀測增大時,參數估計的標準誤相應減小。(3) 參數估計滿足漸近正態(tài)性,即隨著樣本觀測的增大,估計的分布近似于正態(tài)分布。這意味著,可以利用這一性質對未知參數進行假設檢驗和區(qū)間估計了。有關證明可參見Aidrich,John&ForrestD.Nelson.1984.LinearProbability,Logit,andProbitModels.NewburyPark,SagePubiications三、Logit回歸模型的評價和參數的統計檢驗與一般線性回歸模型一樣,在得到Logit回歸模型的參數估計后,還應對模型進行評價和相應的統計檢驗。1、模型的擬合優(yōu)度檢驗。模型估計完成以后,需要對模型是否有效地描述了模型與觀測數據的匹配程度進行評價。如果模型的預測值能夠與對應的觀測值有較高的一致性,就認為該模型能擬合數據,否則,將不接受這一模型。對Logit回歸模型的評價有多種方法,不同的計算軟件給出的評價結果也有差異。這里,我們將根據EViews軟件,介紹模型擬合優(yōu)度的檢驗方法。(1)McFaddenR2在前面的介紹中,已經提到對于離散選擇模型,通常的擬合優(yōu)度R2沒有多大意義。在EViews軟件里,有一種方法即McFaddenR2,簡記為R2。其計McF算公式為R2McF1R2McF丄— ur-LIF式中,LIF為模型中包含所有解釋變量的無約束對數似然函數值,LIF為模型ur r中僅含有截距項的有約束的對數似然函數值。從概念上講,LIF和LIF分別等ur r價于普通線性回歸模型中的TSS和RSS。R2與R2一樣,也在0到1之間變動。McF(2)期望-預測表檢驗。該方法的原理是,在模型參數估計后,選取適當的截斷值p(0<p<1),將觀測數據分成兩組,一組為1/(1+e-z)Wp,另一組為1/(1+e-z)>p,其中,Z=0+(3X。如果樣本中的一個觀測數據的Y數值為0,并且該樣本屬于第1i12i組,或者一個觀測數據的Y數值為1,并且屬于第2組,就稱這個觀測數據是分

組恰當的,否則就稱這個觀測數據是分組不恰當的。如果模型估計與實際觀測數

據比較一致,則大多數的觀測數據應該是分組恰當的,反之,如果分組不恰當的

觀測數據所占的比重很大,說明模型估計與實際觀測數據的擬合程度較差,模型

需要調整。因此,該方法的思想是利用分組恰當與否,得到觀測數據占總樣本的

比重來檢驗模型的擬合優(yōu)度。利用軟件EViews進行期望-預測表檢驗的步驟如下:第一步,在估計好模型的窗口中按此路徑選擇View/ExpectationPredictionTable。第二步,出現一個對話框,在對話框里輸入一個截斷值p(0<p<1),系統默認的截斷值是0.5。第三步,點擊OK后可生成對應的期望-預測表。這時便可利用該表進行擬合優(yōu)度的判斷。有關Logit回歸模型的擬合優(yōu)度其它檢驗方法,可參見相關文獻,如王濟川、郭志剛,Logistic回歸模型——方法與應用,高等教育出版社,2001年。2、參數的顯著性檢驗。2、參數的顯著性檢驗。對模型中參數的顯著性檢驗,就是決策判斷某個解釋變量對事件的發(fā)生(即選取Y=1)是否有顯著性影響。如果檢驗結果表明該解釋變量對選取Y=1的發(fā)生有顯著性影響,則認為將該解釋變量放入Logit回歸模型中是恰當的。否則,需要對模型進行適當的調整。(1)Z檢驗。以一元Logit回歸模型為例,設模型為P(Y=P(Y=11X)=i11+e-(Pj+P2x.)1+exp(-P-PX)12.對該模型中的參數P的顯著性檢驗的原假設為H:P二0,即解釋變量X對事件202.Y=1發(fā)生的概率沒有顯著性影響。根據參數的最大似然估計性質可知,在大樣本條件下,P漸近服從正態(tài)分布,于是,在H:P二0成立的前提下,檢驗統計202量為Z=JLse(p)2漸近服從標準正態(tài)分布。式中,se(P)為最大似然估計P的標準誤差。因此,22

可按常規(guī)查標準正態(tài)分布表,對原假設進行判斷,從而檢驗模型中參數的顯著性。(2)Wald檢驗對模型中參數顯著性檢驗還可使用Wald檢驗,其檢驗統計量為八W二(2)2se(0)2在H:0=0下,W漸近服從自由度為1的咒2分布。因此,可根據咒2分布表,02在給定的顯著性水平a下,得到相應的臨界值,從而判斷參數的顯著性??蓞㈤咹auck,W.W.&A.Donner.1977.Wald'testsasappliedtohypothesesinlogitanalysis.JournaloftheAmericanStatisticalAssociation,Vol.72:851-853(3)似然比檢驗。統計學上已經證明,在大樣本情況下,兩個模型之間如果具有嵌套關系,則兩個模型之間的對數似然值乘以-2的結果之差近似服從X2分布。這一統計量就是似然比統計量。該檢驗的思想是,假設一個模型記為Model、中有解釋變量X,另一個模型j記為Model2包含了Modell中所有其它解釋變量,而沒有包含X,則稱Model2嵌j套于Modell,亦即Modell中包含了Model2。通過這一模型之間嵌套關系,我們實際上需要判斷的是X出現在模型中是否合適。Hanushek&Jackson,1977;jAldrich&Nelso,1984;Greene,1990;Long,1997分別證實了似然比統計量為LR=(-2liL( -))-(L2ln(moedl2 meold=-2ln^moed^2 )的最大似然函數moedl1的最大似然函數其中,ln(L )為所設定的原模型(即包含了所有解釋變量)model1的對數值,ln(的對數值,ln(L )為省略模型(即省略了解釋變量X.)的最大似然函數的model2 j對數值,兩者之間的差乘以-2近似地服從X2分布,其自由度為省略了的解釋變量的個數。接下來,可根據X2分布表,在給定的顯著性水平a下,得到臨界值,從而判斷參數的顯著性。例分析某種教學方法對成績影響的有效性,被解釋變量GRADE為接受新

教學方法后成績是否改善,如果改善取1,否則取0;GPA為平均分數;TUCE為測驗得分;PSI為是否接受新教學方法,如果接受取1,否則取0。運用EViews軟件中Logit模型估計方法得到如下結果E¥ie<s-[Equation:EQ01Torkfile:GREEHP204\GreFileEditObjectViewFrocQuickOptionsWindowHelp

View|P「uiz|Object|P「int|Name|F「e^E^|Estimate|Fu「亡cast|Stats|Reside|DependentVariableGRADEMethodML-BinaryLogit(Quadratichillclimbing:Date:06/04/06Time:22:11Sample:132Includedobservations:32Convergenceachievedafter5iterationsCovariancematrixcomputedusingsecondderivatives由表格寫出估MeandependentvarSEofregressionresid034375003847164.144171-12.88963-2059173SDdependentvarAkaikeinfocriterionSchwarzcriterionHannan-Quinncriter-■1 由表格寫出估MeandependentvarSEofregressionresid034375003847164.144171-12.88963-2059173SDdependentvarAkaikeinfocriterionSchwarzcriterionHannan-Quinncriter-■1 ::: '4':::latestrloglikelihoodP^(Y曲1*GPA,TUCE,PSI)二McFaddenR-squared1+e-z0.482569105560212388191116333-0.4028010374038VariableCoefficientStdErrorz-StatisticProbC-13.021364.931317-2.64064100083GPA2.82611312629402.23772600252TUCE009515801415640.67223506014PSI2.37868810646632.23442600256ObswithDep=1 11四、Logit模型回歸系數的解釋由前面的推導可知,將事件發(fā)生的條件概率定義為P(Y=11X)二p,則我們ii可得到如下模型P(Y=11P(Y=11X)=i11+e-(Pj+P2x.)1+exp(一卩-PX)12.進一步,在發(fā)生比的基礎上,我們還可得到如下模型ln(—)=P+PX1-p12..對此模型,由于等式右端為一線性表示,則可完全按照線性回歸模型系數那樣來解釋。一個解釋變量的作用如果是增加對數發(fā)生比的話,也就增加了事件發(fā)生的概率。具體來講,Logit模型的系數如果是正的并且統計顯著,則在控制其它變量的情況下,對數發(fā)生比隨對應的解釋變量值增加而增加,相反,一個顯著的負

系數代表對數發(fā)生比隨對應解釋變量的增加而減少。如果系數的統計性質不顯著,說明對應解釋變量的作用在統計上與0無差異。1、按發(fā)生比率來解釋Logit模型的系數。對Logit模型的回歸系數進行解釋時,很難具體把握以對數單位測量的作用幅度,所以通常是將Logit作用轉換成對應的發(fā)生比來解釋。設模型為ln(—=卩+卩X1—p 1 2ii轉換成發(fā)生比的形式p 1+eZi—二 -二ez.二eP,+P2x;二eP,xeP2x;i12i12i1—p1+e—Z;;式中,截距P可以作為基準發(fā)生比的對數。基準的意思是指當Logit模型中沒有1任何解釋變量時所產生的發(fā)生比?;蛘撸顺A客?,所有解釋變量都取0值時所產生的發(fā)生比。對于解釋變量的作用的解釋,由上式看出,各項作用之間已經由加法的關系轉變?yōu)槌朔P系。因此,系數P的作用可解釋為,當P為正值時,22eP2將大于1,則在其它條件不變的情況下,X每增加一個單位值時發(fā)生比會相;應增加;當P為負值時,eP2將小于1,說明X每增加一個單位值時發(fā)生比會相2;應減少;而當P為0時,eP2將等于1,那么X不論怎樣變化發(fā)生比都不會變化。2;例如,在新教學方法采納的分析中,已估計的方程可按指數運算法則轉變?yōu)镻(Y=11GPA,P(Y=11GPA,TUCE,PSI)=11+e-z1+e—(—13.0214+2.8261GPA+0.0952TUCE+2.3787PSI)=e—(—13.0214+2.8261GPA+0.0952TUCE+2.3787PSI)1—p=e13.0214xe2.8261GPAXe0.0952TUCEXe2.3787PSI由上述表達式可以看出,由于GPA>0,則e2.826卜1,因此,在其它條件不變的情況下,平均分數每增加一個單位,將導致接受新教學方法后成績有所改善的發(fā)生比會相應提高。同理,對于變量TUCE也可作類似的討論;由于PSI為虛擬解釋變量,表示是否接受新教學方法,如果接受取1,否則取0,因此,在其它條件

不變的情況下,當PSI=1時,則將會使接受新教學方法后,學習成績改善的發(fā)生比有所提高,而當PSI=0時,則將會使接受新教學方法后,學習成績改善的發(fā)生比保持不變。2、用概率來解釋Logit模型的系數。除了解釋變量對于對數發(fā)生比的偏作用外,有時也用事件發(fā)生的概率來解釋模型中系數的偏作用。對事件發(fā)生概率的偏作用可以通過對Logit模型P(P(Y=IIX)=i11+e-(Pj+P2x.)求X的偏導數來加以解釋。其求導結果如下ieP1+PeP1+P2XidpdXid(匚三一)1+eP,+P2x.- 2dX (1+eP1+P2Xi)2iPeP1+P2Xi-P2p(1-p)于是,變量X對事件發(fā)生概率的偏作用就等于該解釋變量的系數P與p(1-p)的i2乘積。偏作用的符號由P決定,因為p(1-p)永遠為正值,作用的幅度依賴于P22的幅度和對應于X特定值的概率,而它與模型中所有其它解釋變量有關。因此i不同于對發(fā)生比作用的解釋,對事件發(fā)生概率的偏作用是隨p值的變化而變化的。這就需要在討論變量X對事件發(fā)生概率的偏作用時,應將概率p值計算出i來后,才能解釋其偏作用。3、預測概率。與一般線性回歸模型一樣,根據Logit模型也可以獲得事件發(fā)生的預測概率。以一個解釋變量的Logit模型為例,如果我們知道參數估計P和P,并確定某一12事件的X(i豐1,2, ,n),便可將其代入Logit模型,計算預測概率。計算公式為i入 1 eA+^Xp— —Y 入 入 Y 入 入1+e-(P1+P2Xi) 1+eP1+P2Xi在計算預測概率的基礎上,還進一步計算在解釋變量發(fā)生離散變化時預測概率的變化,這種方法被稱為概率離散變化法。其計算公式是Ap—P[y—1IX]-P[y—1%]—P[y—AX]i+1 i

e卩i正卩jXjie卩i正卩jXjie j=1(i=1,2,…,n)一(久+^p.X..) p,+^p.X..1+e1 j=i jji1+e1j=ijji相應的對數發(fā)生比為ln4^扌p+才pX i?毛1…2,n,)1—p 1 jjii j=1類似多元線性回歸模型,在Logit模型中,由于多個解釋變量可能會以多個不同的尺度加以測量,這個時候要直接對比不同解釋變量對發(fā)生比的影響是不行的,因此,需要對解釋變量進行標準化變換,將解釋變量和被解釋變量由非標準化變量轉換為標準化變量,從而,才直接對比各個解釋變量對發(fā)生比的影響大小。其變換方法與多元線性回歸模型一樣??蓞⒁娡鯘ā⒐緞?,Logistic回歸模型——方法與應用,高等教育出版社,2001年。第115頁-第117頁。第三節(jié)Probit模型_、Probit模型及參數估計在前面已經看到,由S型曲線,可分別得到累積分布函數和標準正態(tài)分布函數,對于后者可建立一個二元選擇的Probit模型。單一解釋變量X的Probit模i型為p1+p2XiP(Y=11X)=?(p+pX)=112'p(z)dzi12i—g式中①(z),申(z)分別為標準正態(tài)分布的分布函數和密度函數。與Logit模型的參數估計相似,對Probit模型的參數估計也可采用最大似然估計方法。有的教科書還介紹了一種運用效用行為選擇理論建立Probit模型,并采用群組數據對Probit模型的參數應用OLS方法進行估計(參見DamodarN.Gujarati《計量經濟學基礎》(第四版)下冊,中國人民大學出版社,2005年,

第569頁-573頁)。這里我們僅根據計算軟件Eviews的功能,介紹最大似然估計對Probit模型參數的估計。在樣本分布與總體分布一致的前提下,按隨機抽樣原則抽取樣本,對n則抽取樣本,對n個樣本(X,Y)iii二1,2, ,n,建立對數似然函數ln[Lln[L0P]扌[Y1 2 ii=1)丄郵40(X]1 2i))上述模型的最大似然估計就是使該表達式有最大值時的0、0的估計0、121具體求解過程這里不再贅述。例在前述新教學方法的例子里,運

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論