版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第十章定性選擇模型與受限因變量模型詳解演示文稿現(xiàn)在是1頁\一共有56頁\編輯于星期五優(yōu)選第十章定性選擇模型與受限因變量模型現(xiàn)在是2頁\一共有56頁\編輯于星期五第一節(jié)線性概率模型
因變量為虛擬變量的模型被稱為定性選擇模型或定性響應(yīng)模型。如果只有兩個選擇,我們可用0和1分別表示它們,如乘公交為0,自駕車為1,這樣的模型稱為二元選擇模型(binarychoiceModels),多于兩個選擇(如上班方式加上一種騎自行車)的定性選擇模型稱為多項選擇模型(Multinomialchoicemodels)。我們先從基礎(chǔ)的二元選擇模型入手,介紹定性選擇模型的設(shè)定和估計。最簡單的二元選擇模型是線性概率模型(LinearProbabilityModels,LPM)?,F(xiàn)在是3頁\一共有56頁\編輯于星期五一、線性概率模型的概念下面用一個關(guān)于是否讀研究生的例子來說明如何解釋線性概率模型的結(jié)果。模型為:其中:現(xiàn)在是4頁\一共有56頁\編輯于星期五
設(shè)回歸結(jié)果如下(所有系數(shù)值均在10%水平統(tǒng)計上顯著):
對每個觀測值,我們可根據(jù)(10.3)式計算因變量的擬合值或預(yù)測值。在常規(guī)OLS回歸中,因變量的擬合值或預(yù)測值的含義是,平均而言,我們可以預(yù)期的因變量的值。但在本例的情況下,這種解釋就不適用了。假設(shè)學(xué)生甲的平均分為3.5,家庭年收入為5萬美元,Y的擬合值為現(xiàn)在是5頁\一共有56頁\編輯于星期五盡管因變量在這個二元選擇模型中只能取兩個值:0或1,可是該學(xué)生的的擬合值或預(yù)測值為0.8。我們將該擬合值解釋為該生決定讀研的概率的估計值。因此,該生決定讀研的可能性或概率的估計值為0.8。需要注意的是,這種概率不是我們能觀測到的數(shù)字,能觀測的是讀研還是不讀研的決定。對斜率系數(shù)的解釋也不同了。在常規(guī)回歸中,斜率系數(shù)代表的是其他解釋變量不變的情況下,該解釋變量的單位變動引起的因變量的變動。而在線性概率模型中,斜率系數(shù)表示其他解釋變量不變的情況下,該解釋變量的單位變動引起的因變量等于1的概率的變動?,F(xiàn)在是6頁\一共有56頁\編輯于星期五CPA的系數(shù)估計值0.4意味著家庭收入不變的情況下,一個學(xué)生的增加一個點(diǎn)(如從3.0到4.0),該生決定去讀研的概率的估計值增加0.4。INCOME的系數(shù)估計值0.002表明,一個學(xué)生的成績不變,而家庭收入增加1000美元(單位為千美元),該生決定去讀研的概率的估計值增加0.002。LPM模型中,解釋變量的變動與虛擬因變量值為1的概率線性相關(guān),因而稱為線性概率模型?,F(xiàn)在是7頁\一共有56頁\編輯于星期五二、線性概率模型的估計和問題第一個問題是線性概率模型存在異方差性。擾動項的方差是,這里p是因變量等于1的概率,此概率對于每個觀測值不同,因而擾動項方差將不是常數(shù),導(dǎo)致異方差性??梢允褂肳LS法,但不是很有效,并且將改變結(jié)果的含義。第二個問題是擾動項不是正態(tài)分布的。事實上,線性概率模型的擾動項服從二項分布。第三個問題,它假定自變量與Y=1的概率之間存在線性關(guān)系,而此關(guān)系往往不是線性的?,F(xiàn)在是8頁\一共有56頁\編輯于星期五
第四個問題是,擬合值可能小于0或大于1,而概率值必須位于0和1的閉區(qū)間內(nèi)?;氐接嘘P(guān)讀研的例子。假設(shè)學(xué)生乙的為4.0,家庭收入為20萬美元,則代入(10.3)式,Y的擬合值為
從而得到一個不可能的結(jié)果(概率值大于1)。假設(shè)另有一個學(xué)生丙的為1.0,家庭收入為5萬元,則其Y的擬合值為-0.2,表明讀研的概率為負(fù)數(shù),這也是一個不可能的結(jié)果?,F(xiàn)在是9頁\一共有56頁\編輯于星期五
解決此問題的一種方法是,令所有負(fù)擬合值都等于0,所有大于1的擬合值都等于1。但也無法令人十分滿意,因為在現(xiàn)實中很少會有決策前某人讀研的概率就等于1的情況,同樣,盡管某些人成績不是很好,但他去讀研的機(jī)會仍會大于0。線性概率模型傾向于給出過多的極端結(jié)果:估計的概率等于0或1。
現(xiàn)在是10頁\一共有56頁\編輯于星期五第五個問題是在線性概率模型中,以及不再是合適的擬合優(yōu)度測度。事實上,此問題不僅是線性概率模型的問題,而是所有定性選擇模型的問題。較好一點(diǎn)的測度是模型正確預(yù)測的觀測值的百分比。首先,我們將每一預(yù)測歸類為1或0。如果擬合值大于等于0.5,則認(rèn)為因變量的預(yù)測值為1。若小于0.5,則認(rèn)為因變量的預(yù)測值為0。然后,將這些預(yù)測值與實際發(fā)生的情況相比較,計算出正確預(yù)測的百分比:
現(xiàn)在是11頁\一共有56頁\編輯于星期五
需要指出的是,這個測度也不是很理想,但預(yù)測結(jié)果的好壞,并非定性選擇模型唯一關(guān)心的事,這類模型常被用于研究影響人們進(jìn)行某個決策的因素。讓我們來看一個競選的例子。假設(shè)候選人甲和乙二人競選某市市長,我們可以用一個二元選擇模型來研究影響選民決策的因素,模型為:其中:現(xiàn)在是12頁\一共有56頁\編輯于星期五VariableCoefficientStandarderrort-Statisticp-ValueConstant-0.510.19-2.650.01INCOME0.00980.0033.250.00AGE0.0160.00533.080.00MALE0.00310.130.020.98表10.2兩候選人選舉線性概率模型回歸結(jié)果Dependentvariable:CAND1Observations:30=0.58Adjusted=0.53ResidualSumofSquares=3.15F-statistic=11.87現(xiàn)在是13頁\一共有56頁\編輯于星期五如表所示,INCOME的斜率估計值為正,且在1%的水平上顯著。年齡和性別不變的情況下,收入增加1000元,選擇候選人甲的概率增加0.0098。AGE的斜率估計值也在1%的水平上顯著。在收入和性別不變的情況下,年齡增加1歲,選擇候選人甲的概率增加0.016。的斜率系數(shù)統(tǒng)計上不顯著,因而沒有證據(jù)表明樣本中男人和女人的選票不同。我們可以得出如下結(jié)論:年老一些、富裕一些的選民更喜歡投票給候選人甲。表中給出CAND1的擬合值,每個大于等于0.5的擬合值計入CAND1為1的預(yù)測,而小于0.5的擬合值則計入CAND1為0的預(yù)測。現(xiàn)在是14頁\一共有56頁\編輯于星期五
從表可看出,30個觀測值中,27個(或90%)預(yù)測正確。選甲的14人中,12人(或85.7%)預(yù)測正確。選乙的16人中,15人(或93.8%)預(yù)測正確。是0.58,表明模型解釋了因變量的58%的變動,這與90%的正確預(yù)測比例相比,低了不少。注意表10-3中有一些擬合值大于1或小于0。這是我們前面指出的這類模型的缺點(diǎn)之一,這些擬合值是概率的估計值,而概率永遠(yuǎn)不可能大于1或小于0。現(xiàn)在是15頁\一共有56頁\編輯于星期五第二節(jié)Probit模型和Logit模型
雖然估計和使用線性概率模型很簡單,但存在上面討論的幾個問題,其中最嚴(yán)重的兩個問題是擬合值小于0或大于1的問題和假定自變量和的概率之間存在線性關(guān)系的假設(shè)不現(xiàn)實的問題。使用更為復(fù)雜的二元響應(yīng)模型可以克服這些缺陷現(xiàn)在是16頁\一共有56頁\編輯于星期五一.Probit和Logit模型的設(shè)定估計二元選擇模型的另一類方法假定回歸模型為這里不可觀測,通常稱為潛變量(latentvariable)。我們能觀測到的是虛擬變量:現(xiàn)在是17頁\一共有56頁\編輯于星期五這就是Probit和Logit方法的思路。Probit模型和Logit模型的區(qū)別在于對中擾動項u的分布的設(shè)定,前者設(shè)定為正態(tài)分布,后者設(shè)定為logistic分布。與線性概率模型的區(qū)別是,這里假設(shè)潛變量的存在。例如,若被觀測的虛擬變量是某人買車還是不買車,將被定義為“買車的欲望或能力”,注意這里的提法是“欲望”和“能力”,因此解釋變量是解釋這些元素的。可以看出,乘上任何正數(shù)都不會改變,因此這里習(xí)慣上假設(shè)Var(ui)=1,從而固定的規(guī)模。我們有現(xiàn)在是18頁\一共有56頁\編輯于星期五其中F是u的累積分布函數(shù)。如果u的分布是對稱的,則,我們可以將上式寫成我們可寫出似然函數(shù):現(xiàn)在是19頁\一共有56頁\編輯于星期五
上式中F的函數(shù)形式取決于有關(guān)擾動項u的假設(shè),如果的累積分布是logistic分布,則我們得到的是logit模型。在這種情況下,累積分布函數(shù)為:因此現(xiàn)在是20頁\一共有56頁\編輯于星期五請注意,對于logit模型:上式的左端是機(jī)會(odds)的對數(shù),稱為對數(shù)機(jī)會比率(log-oddsratio),因而上式表明對數(shù)機(jī)會比率是各解釋變量的線性函數(shù),而對于線性概率模型,為各解釋變量的線性函數(shù)。如果服從正態(tài)分布,我們得到的是probit模型(或normit模型),在這種情況下,累積分布函數(shù)為:現(xiàn)在是21頁\一共有56頁\編輯于星期五
無論是probit模型還是logit模型,極大似然函數(shù)都伴隨著非線性估計方法,目前很多計量經(jīng)濟(jì)分析軟件已可用于probit和logit分析,用起來很方便。由于累積正態(tài)分布和累積logistic分布很接近,只是尾部有點(diǎn)區(qū)別,因此,我們無論logit法還是probit法,得到的結(jié)果都不會有很大不同??墒牵瑑煞N方法得到的參數(shù)估計值不是直接可比的。由于logistic分布的方差為,因此,logit模型得到的的估計值必須乘以,才能與probit模型得到的估計值相比較(正態(tài)分布標(biāo)準(zhǔn)差為1)?,F(xiàn)在是22頁\一共有56頁\編輯于星期五概率=F(Z)10ZProbit模型線性概率模型圖10-1線性概率模型和Probit模型現(xiàn)在是23頁\一共有56頁\編輯于星期五二、Probit模型和Logit模型的極大似然估計和假設(shè)檢驗估計LPM,我們可以采用OLS或WLS。在Probit模型和Logit模型中,由于的非線性性質(zhì),OLS或WLS都不再適用。估計Probit模型和Logit模型,通常采用極大似然法。現(xiàn)在是24頁\一共有56頁\編輯于星期五極大似然估計量(MLE)即由極大化此對數(shù)似然函數(shù)得到。對于logit模型,G是標(biāo)準(zhǔn)logisticcdf,是logit估計量;對于probit模型,G是標(biāo)準(zhǔn)正態(tài)cdf,是probit估計量。由于此最大化問題的非線性性質(zhì),我們很難寫出Probit模型和Logit模型的參數(shù)的極大似然估計量的具體表達(dá)式??梢宰C明,在很一般的條件下,MLE是一致的、漸近正態(tài)和漸近有效的(一般性討論參見Woodridge(2002))。現(xiàn)在是25頁\一共有56頁\編輯于星期五伴隨每一個極大似然估計值,有一個與之對應(yīng)的標(biāo)準(zhǔn)誤差。支持Probit和Logit的軟件包在給出系數(shù)估計值的同時會給出與之對應(yīng)的標(biāo)準(zhǔn)誤差。一旦我們從軟件包的報告中得到了標(biāo)準(zhǔn)誤差,就可以構(gòu)造(漸近的)t檢驗和置信區(qū)間,與應(yīng)用OLS、2SLS估計量做檢驗時一樣。例如要檢驗,我們做法是,構(gòu)造t統(tǒng)計量,然后按通常的檢驗程序進(jìn)行檢驗。我們也可以對Probit模型和Logit模型的參數(shù)的多重約束(即關(guān)于的多個線性或非線性約束)進(jìn)行檢驗,可以采用沃爾德檢驗、拉格朗日乘數(shù)檢驗和似然比檢驗,詳細(xì)討論見第4、5章有關(guān)內(nèi)容。現(xiàn)在是26頁\一共有56頁\編輯于星期五三、偏效應(yīng)在二元響應(yīng)模型的大多數(shù)應(yīng)用中,首要的目標(biāo)是解釋對響應(yīng)概率的影響。在潛變量模型中,對潛變量的偏效應(yīng)是,我們下面將看到對響應(yīng)概率的偏效應(yīng)是,對正態(tài)分布和logistic分布而言,總有,因而上述兩個效應(yīng)的符號相同,影響的方向總是一致的。潛變量極少有一個確定的度量單位,因而本身的大小,往往不是很有用的(相對于線性概率模型而言)。對于大多數(shù)應(yīng)用而言,我們要估計的是解釋變量對響應(yīng)概率的影響。由于的非線性本質(zhì),使得這個工作相當(dāng)復(fù)雜,通常需要區(qū)分為連續(xù)變量和離散變量兩種情況?,F(xiàn)在是27頁\一共有56頁\編輯于星期五(1)如果是一個大致連續(xù)的變量,則無論P(yáng)robit模型還是Logit模型,對響應(yīng)概率的偏效應(yīng)都在處取最大值:在Probit模型中,;在Logit模型中,(2)對于離散解釋變量,微分沒有實際意義。若離散解釋變量從變化到,則其對響應(yīng)概率的離散偏效應(yīng)可由下式表示現(xiàn)在是28頁\一共有56頁\編輯于星期五與LPM模型相比,偏效應(yīng)的值多出一個乘積項,稱為比例因子(scalefactor)或調(diào)整因子(adjustmentfactor),它與全部解釋變量有關(guān),因而會隨的值而變。在計算偏效應(yīng)時,為方便起見,通常希望有一個適用于模型中所有斜率的比例因子。有兩種方法解決這個問題:第一種方法是用解釋變量觀測值的均值計算偏效應(yīng)的表達(dá)式,比例因子為第二種方法是對每個觀測值計算偏效應(yīng),然后計算它們的樣本均值,這樣得到的是平均偏效應(yīng)(averagepartialeffect,APE)。現(xiàn)在是29頁\一共有56頁\編輯于星期五四、擬合優(yōu)度的測度從實際角度看,在現(xiàn)代計算機(jī)解決了復(fù)雜的計算問題之后,Probit和Logit模型最困難之處就落在模型結(jié)果的提供和解釋方面。支持Probit和Logit的軟件包都會報告系數(shù)估計值、它們的標(biāo)準(zhǔn)誤差和對數(shù)似然函數(shù)值。如同在線性概率模型中討論的一樣,Probit模型和Logit模型也可以計算正確預(yù)測的百分比這一指標(biāo)作為擬合優(yōu)度的測度。首先,我們將每一預(yù)測歸類為1或0。如果擬合值大于等于0.5,則認(rèn)為因變量的預(yù)測值為1。若小于0.5,則認(rèn)為因變量的預(yù)測值為0。然后,將這些預(yù)測值與實際發(fā)生的情況相比較,計算出正確預(yù)測的百分比。現(xiàn)在是30頁\一共有56頁\編輯于星期五盡管正確預(yù)測的百分比作為擬合優(yōu)度的測度是有用的,但它也可能造成誤導(dǎo),特別是在對小可能結(jié)果的預(yù)測非常糟糕的情況下仍能得到相當(dāng)高的正確預(yù)測的百分比。例如,假設(shè)n=200,160個觀測值為,這160個觀測值中,有140個預(yù)測值也是0,即使對于的那40個觀測值的預(yù)測都錯,正確預(yù)測全部結(jié)果的百分比仍高達(dá)70%!度量Probit和Logit模型的擬合優(yōu)度的測度還可以采用各種pseudo-R2。pseudo-原意是偽(假),這里采用它,意思是與常規(guī)R2類似但不相同,而不是說它是假的。對于Probit模型和Logit模型,已經(jīng)開發(fā)了幾種有用的pseudo-R2測度,其中最常用的是McFadden(1974)提出的pseudo-R2測度現(xiàn)在是31頁\一共有56頁\編輯于星期五表10-4兩候選人選舉模型的Probit回歸結(jié)果Dependentvariable:CAND1VariableCoefficientStandarderrort-Statisticp-ValueConstant-5.191.70-3.060.00INCOME0.0710.0342.100.04AGE0.0730.0342.180.03MALE-0.700.90-0.780.44Observations:30McFaddenpseudo-R2=0.61ResidualSumofSquares=2.62現(xiàn)在是32頁\一共有56頁\編輯于星期五采用Probit模型估計的結(jié)果與前面用線性概率模型估計的結(jié)果有所不同。采用Probit模型的情況下,INCOME和AGE的系數(shù)估計值在5%的誤差水平上顯著,而在線性概率模型的情況下,在1%的水平上顯著。由于我們知道線性概率模型存在嚴(yán)重的問題,因此Probit結(jié)果可能更準(zhǔn)確一些??墒?,如果是實際研究的話,要有一個大得多的樣本。Probit模型的系數(shù)估計值不能像線性概率模型那樣,解釋成概率的變動(有些計量經(jīng)濟(jì)分析軟件程序可以將系數(shù)估計值轉(zhuǎn)換為與線性概率模型相當(dāng)?shù)母怕首儎樱?。使用Probit模型的一種有意思的方式是求出擬合值進(jìn)行預(yù)測,如我們用線性概率模型所做的一樣?,F(xiàn)在是33頁\一共有56頁\編輯于星期五Probit模型中用McFadden的pseudo-R2作為擬合優(yōu)度的測度。pseudo-R2是用于虛擬因變量模型的擬合優(yōu)度的測度的名字。pseudo-原意是偽(假),這里采用它,意思是與常規(guī)R2類似但不相同,而不是說它是假的。對于定性選擇模型,已經(jīng)開發(fā)了幾種有用的pseudo-R2測度,這里所用的是McFadden開發(fā)的。很多估計Probit或Logit模型的計量經(jīng)濟(jì)程序計算pseudo-R2。本例中給出的0.61的含義是,Probit模型解釋了因變量61%的變動?,F(xiàn)在是34頁\一共有56頁\編輯于星期五
與probit模型一樣,logit模型也不能用OLS法估計,而要用極大似然法估計。采用表10-1中的同樣數(shù)據(jù)估計logit模型,回歸結(jié)果如表10-5所示。表10-5兩候選人選舉模型的Logit回歸結(jié)果Dependentvariable:CAND1VariableCoefficientStandarderrort-Statisticp-ValueConstant-8.963.23-2.770.01INCOME0.120.061.980.05AGE0.130.062.030.04MALE-1.031.54-0.670.51Observations:30McFaddenpseudo-R2=0.60ResidualSumofSquares=2.59現(xiàn)在是35頁\一共有56頁\編輯于星期五
McFaddenpseudo-R2和統(tǒng)計顯著性與probit模型的結(jié)果類似。INCOME和AGE的系數(shù)估計值亦在5%誤差水平上顯著。而MALE則在兩種模型回歸中均不顯著。而斜率系數(shù)估計值則不同,這是因為它們的意義不一樣。例如,AGE的系數(shù)估計值0.13意味著收入和性別不變的情況下,年齡增大一歲,選舉候選人甲的機(jī)會的對數(shù)增加0.13。實際上,除了斜率系數(shù)的解釋不同,使用probit模型和logit模型并沒有多大區(qū)別?,F(xiàn)在是36頁\一共有56頁\編輯于星期五六、多項選擇模型多項選擇模型是研究在多于兩個的選項中進(jìn)行決策的模型。一般可以依照選擇集分為有序和無序兩種寬泛的類型。比如,城市交通工具的選擇顯然是無序的,而投資者選擇公司債券(債券經(jīng)過評級)是有序的。有關(guān)二元選擇的Logit模型可以推廣到因變量有兩個以上離散取值的情況,構(gòu)成多項Logit模型(multinomiallogitmodel),此模型的主要優(yōu)點(diǎn)是容易計算,選擇給定方案的概率易于被表示,并且極大似然函數(shù)可以用簡單明了的方式產(chǎn)生和最大化?,F(xiàn)在是37頁\一共有56頁\編輯于星期五該模型的缺點(diǎn)是它以所謂的不相干選擇的獨(dú)立性(independenceofirrelevantalternatives,IIA)性質(zhì)為特征。假設(shè)一個幾乎與一個已有選項相同的新選項被加進(jìn)選擇集中,我們期望的是,從此模型得到的選擇這兩個幾乎相同的選項(如乘公共汽車時選老車型還是新車型)的概率將被分成兩半,而選擇其它選項的概率不受影響。不幸的是,情況不是這樣。因此當(dāng)兩個或多個選項是相近替代方案時,采用多項Logit模型不適合。在這種情況下,可考慮多項Probit模型(multinomialProbitmodel)。多項Probit模型允許擾動項跨選項相關(guān),從而繞過IIA困境。它的缺點(diǎn)是計算困難,計算四個以上選項的問題幾乎不可行。隨著計算機(jī)能力和計算方法的改進(jìn),多項Probit模型的應(yīng)用前景會越來越好?,F(xiàn)在是38頁\一共有56頁\編輯于星期五如果因變量本質(zhì)上是有序的,多項Logit模型和多項Probit模型均無法解釋解釋因變量的序數(shù)性質(zhì)。因為決策者選擇不同的方案所得到的效用也是排序的,一般多元離散選擇模型中的效用關(guān)系不再適用。處理有序離散因變量的常用方法是有序Probit模型與有序Logit模型?,F(xiàn)在是39頁\一共有56頁\編輯于星期五*第三節(jié)Censored模型Censored模型研究一類重要的受限因變量:在取正值時大致連續(xù),但總體中有一個不可忽略的部分取值為零??疾鞗Q定居民家庭用于耐用消費(fèi)品(如汽車等)支出的因素,或者研究居民每年用于慈善捐助支出的決定因素,或者研究居民每月用于特殊消費(fèi)品(如酒類等)支出的決定因素等等。這些研究都需要對總體進(jìn)行抽樣調(diào)查取得相關(guān)的數(shù)據(jù),而抽樣調(diào)查的結(jié)果有一個共同的特點(diǎn),那就是有相當(dāng)一部分個體用于這些方面支出的金額為零,同時不為零的支出數(shù)據(jù)會呈現(xiàn)出基本連續(xù)的形態(tài)?,F(xiàn)在是40頁\一共有56頁\編輯于星期五一、Censored模型的概念當(dāng)因變量在特定范圍內(nèi)的值都轉(zhuǎn)換成(或報告為)某個值時,稱因變量被歸并(censoring),稱此變量為歸并變量(censoredvariable)。censored回歸模型的一般形式是現(xiàn)在是41頁\一共有56頁\編輯于星期五二、Tobit模型的估計為了計估模型參數(shù),我們推導(dǎo)Y的均值設(shè),稱為逆米爾斯比率(inverseMillsratio),它是標(biāo)準(zhǔn)正態(tài)pdf與標(biāo)準(zhǔn)正態(tài)cdf在c處的比值。則現(xiàn)在是42頁\一共有56頁\編輯于星期五有了上面的結(jié)果,我們可以計算從總體中隨機(jī)抽取的觀測值的均值因此,一旦有了的估計值,我們就可以確保Y的預(yù)測值為正。當(dāng)然,保證Y的預(yù)測值為正的代價是使用了更為復(fù)雜的非線性模型?,F(xiàn)在是43頁\一共有56頁\編輯于星期五Censored模型通常采用極大似然估計。由Y的分布,可得模型的對數(shù)似然函數(shù)為該對數(shù)似然函數(shù)由兩部分組成:一部分對應(yīng)于沒有限制的觀測值,是經(jīng)典回歸部分;一部分對應(yīng)于受到限制的觀測值。因而上式是一個非標(biāo)準(zhǔn)的對數(shù)似然函數(shù),實際上是離散分布與連續(xù)分布的混合。最大化對數(shù)似然函數(shù),可得極大似然估計量。這一估計量的性質(zhì)與普通MLE的性質(zhì)相同。一般情況下,需采用數(shù)值方法來求極大似然估計值?,F(xiàn)在是44頁\一共有56頁\編輯于星期五求標(biāo)準(zhǔn)誤差的矩陣表達(dá)式很復(fù)雜,詳細(xì)的討論見Wooldridge(2002)。利用Eviews軟件,很方便得到模型的參數(shù)估計值及標(biāo)準(zhǔn)誤差,因而可以進(jìn)行參數(shù)的假設(shè)檢驗。我們還可以采用沃爾德統(tǒng)計量或似然比統(tǒng)計量同時檢驗多個約束,其方法與一般的MLE相同。Censored模型的MLE需要兩個基本假定:潛變量模型中隨機(jī)干擾項的同方差性和正態(tài)性。如果存在異方差性或非正態(tài)性,那么MLE估計量便是不一致的。現(xiàn)在是45頁\一共有56頁\編輯于星期五在實踐中,研究人員估計Censored模型時往往采用OLS法,盡管OLS估計值不一致。人們發(fā)現(xiàn)OLS估計值通常小于ML估計值,幾乎沒有例外。一個值得注意的經(jīng)驗規(guī)律是,極大似然估計值通常約等于OLS估計值除以樣本中非受限觀測值的比例。這恐怕是人們估計Censored模型時采用OLS法的原因。現(xiàn)在是46頁\一共有56頁\編輯于星期五三、Tobit模型的偏效應(yīng)在潛變量模型中,參數(shù)的含義與線性模型相同,事實上但潛變量不可觀測,因而這個結(jié)果通常沒有什么意義。我們更關(guān)心的是解釋變量如何影響可觀測變量。可以證明,在Tobit模型擾動項正態(tài)分布的假設(shè)下,對的偏效應(yīng)為
現(xiàn)在是47頁\一共有56頁\編輯于星期五四、實例Wooldridge報告了一個美國已婚婦女工作時數(shù)的例子。樣本數(shù)據(jù)包括753個已婚婦女的年工作小時數(shù),其中有428個婦女小時數(shù)大于0,另外325個婦女的工作小時數(shù)為0。對工作時間為正的婦女而言,其工作時間范圍相當(dāng)寬,從12小時到4950小時,可以看作連續(xù)變化。因此,年工作小時數(shù)很適合用Tobit模型,Wooldridge同時還用OLS估計了線性模型(使用全部753個數(shù)據(jù)),結(jié)果由下表給出?,F(xiàn)在是48頁\一共有56頁\編輯于星期五因變量:hours自變量線性模型(OLS)Tobit模型(MLE)Nwifeinc-3.45(2.54)-8.81(4.46)Educ28.76(12.95)80.65(21.58)Exper65.67(9.96)131.56(17.28)Exper2-0.70(.325)-1.86(0.54)Age-30.51(4.36)-54.41(7.42)Kidslt6-442.09(58.85)-894.02(111.88)Kidsge6-32.78(23.18)-16.22(38.64)Constant1330.48(270.78)965.31(446.44)ConstantLog-likelihoodvalue-3819.09R-squared0.2660.275750.181122.02現(xiàn)在是49頁\一共有56頁\編輯于星期五我們對比OLS估計與Tobit估計,可以看出:(1)Tobit系數(shù)估計值與OLS估計值具有相同的符號,而且統(tǒng)計顯著性也類似??赡艿睦獾氖莕wifeinc與kidsge6的系數(shù),nwifeinc在OLS估計中的t統(tǒng)計量為-1.41,在Tobit估計中的t統(tǒng)計量為-1.98。kidsge6在OLS估計中的t統(tǒng)計量為-1.41,在Tobit估計中的t統(tǒng)計量為-0.42。(2)本例的結(jié)果可以驗證我們前面介紹的經(jīng)驗法則。樣本中非受限觀測值的比例為428/753=0.568,除個別例外(kidsge6),OLS估計值除以0.568得到的值與Tobit估計值大致相當(dāng)。如將Exper的OLS系數(shù)估計值65.67除以0.568,得到115.62。除了kidsge6外,換算后的OLS估計值的絕對值都小于對應(yīng)的Tobit估計值的絕對值?,F(xiàn)在是50頁\一共
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版機(jī)電設(shè)備安裝合同范本
- 2024版學(xué)校廢物管理承包合同3篇
- 2025年度電子元器件展參展商權(quán)益保障協(xié)議模板3篇
- 2025年度城市垃圾分類處理承包合同3篇
- 2025年度房屋租賃管理及押金合同4篇
- 二零二四平安普惠企業(yè)融資借款合同3篇
- 2025版路燈設(shè)施智能監(jiān)控系統(tǒng)建設(shè)合同4篇
- 2025年度高新技術(shù)產(chǎn)業(yè)園區(qū)廠房租賃合同補(bǔ)充協(xié)議3篇
- 2024離婚訴訟費(fèi)用分擔(dān)及財產(chǎn)處理合同
- 2025年度旅游景區(qū)旅游安全風(fēng)險評估與應(yīng)急預(yù)案合同4篇
- 2025年神經(jīng)外科護(hù)理工作計劃例文(2篇)
- 2025年湖北省武漢市東湖高新區(qū)管委會招聘工作人員歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 初中英語聽力高頻詞
- 一年級期末數(shù)學(xué)家長會課件
- 2024年社區(qū)警務(wù)規(guī)范考試題庫
- 通信工程安全知識培訓(xùn)
- 2022年高考真題-政治(天津卷) 含答案
- 2024年度乙方提供物流配送服務(wù)合同標(biāo)的為800萬元人民幣
- 個體診所醫(yī)生述職報告3篇
- 2024年事業(yè)單位招聘考試公共基礎(chǔ)知識試題庫及答案(共316題)
- 杭州宋韻文化課程設(shè)計
評論
0/150
提交評論