受限因變量模型_第1頁(yè)
受限因變量模型_第2頁(yè)
受限因變量模型_第3頁(yè)
受限因變量模型_第4頁(yè)
受限因變量模型_第5頁(yè)
已閱讀5頁(yè),還剩59頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

受限因變量模型第1頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月本章內(nèi)容第一節(jié)二元選擇模型線性概率模型PROBIT模型LOGIT模型極端值模型擬合優(yōu)度測(cè)定第二節(jié)多元選擇模型無(wú)序多元選擇模型有序因變量模型(Ordereddata)計(jì)數(shù)模型(Countdata)第三節(jié)刪改與截取模型刪改數(shù)據(jù)或截取數(shù)據(jù)模型估計(jì)中的問(wèn)題受限因變量模型(TOBIT模型)模型估計(jì)方法與統(tǒng)計(jì)檢驗(yàn)第2頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月用計(jì)量經(jīng)濟(jì)模型反映選擇行為行為主體從事的每項(xiàng)活動(dòng)都可以看作是一種選擇;行為主體有其偏好;人們的行為有其規(guī)則;在經(jīng)濟(jì)分析中,通常認(rèn)為選擇基于效用最大化標(biāo)準(zhǔn)。研究中需要考慮:行為理論基礎(chǔ)計(jì)量經(jīng)濟(jì)學(xué)模型方法模型設(shè)定統(tǒng)計(jì)理論和數(shù)據(jù)估計(jì)方法應(yīng)用分析第3頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月行為假定就可以選擇的活動(dòng)而言,行為主體的偏好具有傳遞性和完備性。每項(xiàng)選擇都有其相應(yīng)的效用水平Uijt每個(gè)行為主體都試圖獲得最大效用,當(dāng)Ui1t>Ui2t

時(shí),行為主體會(huì)選擇第一項(xiàng)活動(dòng)。然而我們無(wú)法觀測(cè)效用本身,我們只有通過(guò)觀察行為主體做出的選來(lái)揭示其偏好行為主體選擇第一項(xiàng)活動(dòng)意味著Ui1t>Ui2t第4頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月隨機(jī)效用函數(shù)

(RandomUtilityFunctions)形式:Uij=j+i’xij+i’zi+eijj為與特定選擇j相聯(lián)系的常數(shù)項(xiàng)xij為選擇j所具有的特性(Attributes)i為反映行為主體偏好的權(quán)重zi

為行為主體的特征i為行為主體特征的權(quán)重eij為效用函數(shù)中不可觀察的隨機(jī)成分,假定E(eij)=0,Var(eij)=1隨機(jī)效用函數(shù)幫助建立了行為基礎(chǔ)與觀察到的數(shù)據(jù)之間的關(guān)系。第5頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月行為選擇:考慮二元選擇模型涉及“是”或“否”的決策例如是否攻讀研究生模型:讀研究生獲得的凈效用U讀研

=+1讀研費(fèi)用+2預(yù)期收益+1家庭收入+2個(gè)人能力+e如果凈效用為正,那么選擇讀研究生(簡(jiǎn)化模型,真實(shí)中還要與其他選擇進(jìn)行比較,那是多元選擇模型,此處不表)使用的數(shù)據(jù)因變量:1為讀研,0為不讀研解釋變量X1讀研收費(fèi)+間接費(fèi)用,X2研究生工資增量Z1家庭收入,Z2讀研前學(xué)習(xí)成績(jī)顯示出的偏好讀研者U讀研

>0,定義Y=1未讀研者U讀研

<0,定義Y=0第6頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月行為選擇:考慮二元選擇模型由模型分析可以獲得的信息研究生的社會(huì)經(jīng)濟(jì)特性是否具有重要意義降低成本是否有助于吸引更多學(xué)生?就業(yè)市場(chǎng)好壞是否對(duì)讀研究生有重要影響家庭或個(gè)人特征是否影響到選擇家庭收入是否對(duì)讀研究生構(gòu)成重要限制?個(gè)人的學(xué)習(xí)能力是否影響到讀研的決策?推斷不同條件下的研究生規(guī)模變化提高費(fèi)用/就業(yè)機(jī)會(huì)增加/居民收入增加推斷個(gè)人的行為哪些學(xué)生最有可能報(bào)考研究生第7頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月有限因變量模型

(Limiteddependentvariablemodels)在有些文獻(xiàn)中,有限因變量模型也被稱為離散型選擇模型(DiscreteChoiceModels)有限因變量模型的一般形式可以表達(dá)為:P(y=l|x)=G(b0+xb)y*=b0+xb+u,y=max(0,y*)式中P(.)表示事件發(fā)生的概率;y*是一個(gè)隱變量(Latentvariable),其值大小取決于影響因素x,而y*決定事件發(fā)生的概率。當(dāng)y*>0時(shí)y=1,當(dāng)y*0時(shí)y=0(可以選擇其他臨界值)。第8頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月二元因變量模型二元因變量模型是有限因變量模型的一種特殊形式。因變量取值僅為0或1的情況。我們可以將其看作是一種選擇決策模型,當(dāng)選擇時(shí)y=1,未選擇時(shí)y=0;我們可以用線性概率模型來(lái)研究這種情況,模型可以寫作P(y=1|x)=b1x1+…+KxK+ej

表示當(dāng)xj變化時(shí)概率的變化該方程推斷的y

的值表示做出該選擇的概率。一個(gè)問(wèn)題是,由線性概率方程推斷得出的概率值可能落在區(qū)間[0,1]之外,因而只有在均值附近才較為可靠。第9頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月二元因變量模型由于線性概率函數(shù)的取值僅為0或1,因而誤差項(xiàng)與模型參數(shù)β出現(xiàn)相關(guān),即e或是等于-β?X,或是等于1-β?X,因而存在異方差問(wèn)題。此時(shí)線性概率模型違反了相同方差的古典假定,這使得對(duì)模型做的統(tǒng)計(jì)檢驗(yàn)失效。隨著計(jì)量經(jīng)濟(jì)學(xué)軟件的不斷發(fā)展,現(xiàn)在已經(jīng)很少使用線性概率模型。第10頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月概率模型Z1Z*線性概率函數(shù)第11頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月概率函數(shù)模型如前面所述,利用概率模型做推斷時(shí)可能會(huì)遇到計(jì)算值超出0~1區(qū)間的情況。為了解決這一問(wèn)題,我們用概率函數(shù)G(b0+xb)來(lái)模擬事件發(fā)生的概率,該函數(shù)應(yīng)滿足0<G(z)<1。常用的分布和模型形式有:正態(tài)分布→Probit模型Logistic分布→Logit模型Gompertz分布→極端值(Extremevalue)模型第12頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月不同分布的特征第13頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月Probit模型G(z)的一種可選形式是標(biāo)準(zhǔn)正態(tài)累積分布函數(shù),此即Probit模型。式中s是誤差項(xiàng),假定服從標(biāo)準(zhǔn)正態(tài)分布;P代表事件發(fā)生的概率。估計(jì)指標(biāo)Z,需要應(yīng)用累計(jì)正態(tài)分布函數(shù)的逆函數(shù)由于Probit模型是參數(shù)非線性函數(shù),因而不能用OLS方法估計(jì),需要用最大似然法來(lái)估計(jì)。第14頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月Logit模型G(z)的另一種可選形式是邏輯曲線,它是標(biāo)準(zhǔn)邏輯隨機(jī)變量的累積分布函數(shù),即Logit模型,有時(shí)也稱為L(zhǎng)ogistic曲線回歸;Pi=G(Z)=exp(Z)/[1+exp(Z)]=1/[1+exp(-Z)]對(duì)該式做以下變換:[1+exp(-Z)]Pi=1exp(-Z)=1/Pi-1=(1-Pi)/PiZ=log[Pi/(1-Pi)]=+X上述變換使因變量成為選擇機(jī)會(huì)比的對(duì)數(shù)。Logit模型是參數(shù)非線性函數(shù),但可以線性化。第15頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月ExtremeValue模型G(z)的第三種可選形式是極端值分布;Pi=G(Z)=exp(-e-Z)ExtremeValue模型是參數(shù)非線性函數(shù)。第16頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月模型選擇由前面的圖形可以看出,三種模型基于的三種分布有類似的變化模式,接近零時(shí)密度函數(shù)最大(此時(shí)累積分布函數(shù)上升最迅速),但分散程度有一定差異。早期研究中使用Logit模型的情況較多,這是因?yàn)樵撃P洼^容易計(jì)算?,F(xiàn)有的計(jì)量經(jīng)濟(jì)學(xué)軟件提供了三種模型的計(jì)算程序,因而都很容易計(jì)算。沒(méi)有嚴(yán)格的理由表明哪一個(gè)模型更可取得到的參數(shù)不會(huì)相同但分析結(jié)論不會(huì)有大的差別因而通?;谀P偷慕y(tǒng)計(jì)表現(xiàn)和經(jīng)驗(yàn)來(lái)決定取舍第17頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月對(duì)Probit模型和Logit模型的解釋利用概率模型做分析時(shí),我們關(guān)心的通常是X的變化如何影響概率P(y=1|x),即?p/?x。對(duì)于線性概率函數(shù),X的影響可以很容易的從其回歸系數(shù)得知。對(duì)于Probit模型和Logit模型,計(jì)算這一影響的方法較為復(fù)雜:?p/?xj=g(b0+xb)bj,式中g(shù)(z)表示dG(z)/dz從公式可以看出,邊際效果隨x的變化而改變。第18頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月對(duì)Probit模型和Logit模型的解釋因而,對(duì)三種形式的函數(shù)中X的系數(shù)直接做比較是不正確的;但仍可以通過(guò)比較估計(jì)系數(shù)的符號(hào)和顯著性來(lái)確定哪些變量最可能產(chǎn)生影響及其影響方向;為了比較X變化所產(chǎn)生影響效果的大小,我們需要計(jì)算相應(yīng)的導(dǎo)數(shù)(一般取自變量的均值做計(jì)算);有些計(jì)量經(jīng)濟(jì)學(xué)軟件(如Stata)可以直接提供這些結(jié)果。第19頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月似然值比率檢驗(yàn)對(duì)于線性概率模型,我們可以利用F統(tǒng)計(jì)值或LM統(tǒng)計(jì)值檢驗(yàn)是否可以排除某些變量;對(duì)于Probit模型和Logit模型,則需要采取新的方式進(jìn)行這樣的檢驗(yàn);在利用最大似然法估計(jì)Probit模型和Logit模型時(shí),我們同時(shí)也獲得了對(duì)數(shù)似然值;我們可以估計(jì)有系數(shù)限制和沒(méi)有系數(shù)限制的模型,然后利用得到的兩個(gè)對(duì)數(shù)似然值進(jìn)行檢驗(yàn),相應(yīng)的統(tǒng)計(jì)值為:LR=-2(Lr–Lur)~c2q

如果未受約束似然值與受約束似然值相等,說(shuō)明模型效果差,未通過(guò)檢驗(yàn);相反,如果未約束似然值遠(yuǎn)大于約束似然值,說(shuō)明所設(shè)自變量通過(guò)檢驗(yàn),模型總體效果較好。它對(duì)應(yīng)于線性模型中的F值。第20頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月擬合優(yōu)度對(duì)于線性概率模型,可以直接用得到R2來(lái)判斷擬合優(yōu)度;Probit模型和Logit模型沒(méi)有R2,因而需要利用其他方法來(lái)反映擬合優(yōu)度。一種方法是利用對(duì)數(shù)似然值計(jì)算偽R2(pseudoR2)或McFaddenR2,該值也被稱作似然值比值指數(shù),定義為1–Lur/Lr式中Lur和Lr分別為包括所有解釋變量的對(duì)數(shù)似然值和只包括常數(shù)項(xiàng)的對(duì)數(shù)似然值另一種方式是根據(jù)模型做出的正確推斷當(dāng)計(jì)算出的概率大于0.5時(shí)認(rèn)為事件發(fā)生了,即有y=1,反之則認(rèn)為事件未發(fā)生。用列表的方式可以反映出正確推斷的比例,在EVIEWS下可以直接生成。第21頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月用EVIEWS估計(jì)有限因變量模型EVIEWS包括估計(jì)單方程有限因變量模型的程序;在錄入數(shù)據(jù)和給出變量表后,調(diào)用指令:Quick->Estimateequation->模型選項(xiàng)Binary–Binarychoice(Logit,Probit,Extremevalue)Ordered–OrderedchoiceCensored–Censoreddata(Tobit)必要時(shí)給出選項(xiàng)得到估計(jì)結(jié)果第22頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月用EVIEWS估計(jì)有限因變量模型得到結(jié)果后可以在VIEW子菜單下調(diào)用:Coefficienttests各種對(duì)系數(shù)的統(tǒng)計(jì)檢驗(yàn)Residualtests對(duì)殘差的統(tǒng)計(jì)檢驗(yàn)Expectation-PredictionTable可以得到正確和錯(cuò)誤推斷的比例Goodness-of-FitTests檢驗(yàn)擬合優(yōu)劣第23頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月第24頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月第二節(jié)多元選擇模型無(wú)序多元選擇模型有序因變量模型(Ordereddata)第25頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月26多元選擇模型基本概念對(duì)于多元選擇模型,可以根據(jù)因變量的性質(zhì)分為有序和無(wú)序兩種類型。無(wú)序模型:因變量Y表示觀察對(duì)象的類型歸屬,例如:例1:上班的交通工具有走路、自行車、公共汽車、出租車、自有汽車等。例2:結(jié)構(gòu)調(diào)整中農(nóng)民主產(chǎn)品的選擇,如蔬菜、果樹、動(dòng)物養(yǎng)殖、水產(chǎn)養(yǎng)殖等。第26頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月27多元選擇模型基本概念有序模型:觀察到的因變量Y表示出按數(shù)值大小(ordered)或重要性(ranked)排序的分類結(jié)果:例1:教育水平分文盲、小學(xué)、初中、高中、大學(xué)、研究生等例2:農(nóng)民就業(yè)分純農(nóng)業(yè)、兼業(yè)、非農(nóng)業(yè)等例3:收入水平分級(jí)例4:考試成績(jī)分優(yōu)秀、良好、及格和不及格等第27頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月28無(wú)序多元選擇模型對(duì)于無(wú)序的選擇模型,其行為選擇假定出于優(yōu)化一個(gè)隨機(jī)效用函數(shù)??紤]第i個(gè)消費(fèi)者面臨j種選擇,假定選擇j的效用為:如果消費(fèi)者選擇了j,那么我們假定其獲得的效用高于其他選擇??紤]效用比較的概率函數(shù)就誤差分布形式做出假定后得到可以估計(jì)的模型。第28頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月29無(wú)序多元選擇模型考慮有三種選擇的Logit模型即每個(gè)方程都假定,任兩個(gè)選擇機(jī)會(huì)比對(duì)數(shù)是特征X的線性函數(shù)。由于所有概率之和等于1,因而機(jī)會(huì)比相互依賴,上述限制使需要估計(jì)的參數(shù)由6個(gè)減少到4個(gè)。第29頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月30無(wú)序多元選擇模型產(chǎn)生系數(shù)限制的原因:這意味著以下限制條件:即只需要估計(jì)系統(tǒng)中的兩個(gè)方程便可以得到所有參數(shù)。第30頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月31無(wú)序多元選擇模型如果樣本屬于重復(fù)試驗(yàn),那么可以計(jì)算出與每個(gè)組相聯(lián)系的概率rij/ni,然后計(jì)算出機(jī)會(huì)比的對(duì)數(shù),與X做回歸。式中rij表示組i中選擇J的次數(shù)占該組觀察對(duì)象總數(shù)ni的比例如果沒(méi)有足夠多的重復(fù),則需要利用最大似然法進(jìn)行估計(jì)。第31頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月32有序因變量模型基本概念同二元選擇模型一樣,我們可以考慮隱變量y*的值取決于一組自變量X,即:觀察到的Y由Y*決定,其規(guī)則是:需要注意的是,反映類型差別的數(shù)字大小是任意的,但必須保證當(dāng)。第32頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月33有序因變量模型基本概念觀察到每個(gè)Y的概率為:式中F為誤差項(xiàng)的累積分布函數(shù)。第33頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月34有序因變量模型基本概念分類界限和參數(shù)β均通過(guò)求以下的似然函數(shù)最大值的方式估計(jì)得出:式中函數(shù)I(.)是一個(gè)指標(biāo)函數(shù),當(dāng)括號(hào)中的邏輯關(guān)系為真時(shí)等于1,反之等于0。為了保證概率為正值,所有的必須滿足

0<

1<

2<…<

M

。第34頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月35有序的Probit模型下的概率00.10.20.30.4Y=0Y=1Y=2Y=3Y=4第35頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月36有序因變量模型估計(jì)結(jié)果的解釋如同其他概率模型一樣,有序因變量模型估計(jì)系數(shù)的直接用途一般并不大,受到關(guān)注的有:自變量的邊際效果模型對(duì)行為的推斷能力模型擬合第36頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月37X變化對(duì)概率推斷的影響對(duì)于此類模型,X變化的邊際效果不同于所得到的估計(jì)系數(shù)。考慮一個(gè)只有三種選擇的簡(jiǎn)化情況,此時(shí)模型只有一個(gè)臨界參數(shù)(假定1=0)。相應(yīng)的三個(gè)概率為:第37頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月38X變化對(duì)概率推斷的影響與三個(gè)概率相對(duì)應(yīng)的自變量的邊際效果為:當(dāng)X增加而參數(shù)和保持不變時(shí),這相當(dāng)于將分布曲線向右移動(dòng)。最小和最大段的邊際影響方向可以根據(jù)估計(jì)參數(shù)的符號(hào)確定,但中間段的影響方向取決于兩項(xiàng)的綜合結(jié)果。第38頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月39X變化對(duì)概率推斷的影響00.10.20.30.4012X的邊際效果為正或負(fù)取決于參數(shù)的符號(hào)和概率分布的變化。第39頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月40用EVIEWS估計(jì)有序因變量模型在有序因變量模型中,因變量的值僅僅反映排序,因而對(duì)其數(shù)值及間隔并無(wú)特殊要求。例:序列(1,2,3,4)等同于序列(1,10,30,100)因變量必須是整數(shù),可以利用EVIEWS的函數(shù)功能做轉(zhuǎn)換(@Round,@Floor,@Ceil)估計(jì)該方程時(shí)的步驟為:選擇Quick→Estimateequation在隨后出現(xiàn)的對(duì)話窗口中,先選擇模型設(shè)定窗口,給出因變量和自變量(不需要常數(shù)項(xiàng))。第40頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月41用EVIEWS估計(jì)有序因變量模型從三種估計(jì)方法(Probit,Logit,Extremevalue)中選擇一種確定估計(jì)模型所使用的樣本區(qū)間按OK后EVIEWS利用迭代求解法得出估計(jì)結(jié)果,包括各自變量的參數(shù)及相應(yīng)的統(tǒng)計(jì)值,各臨界點(diǎn)和其統(tǒng)計(jì)值,其他統(tǒng)計(jì)檢驗(yàn)指標(biāo)等。若模型收斂,那么報(bào)告的內(nèi)容具有意義。需要注意的問(wèn)題有:由于EVIEWS有估計(jì)參數(shù)數(shù)量限制,因而因變量的取值不能太多(使用大樣本時(shí)需要特別注意)。若某一類別中的觀察值過(guò)少,此時(shí)會(huì)造成識(shí)別困難。在可能的情況下,應(yīng)考慮將其合并到其他類別。第41頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月42第三節(jié)刪改與截取模型刪改數(shù)據(jù)或截取數(shù)據(jù)模型估計(jì)中的問(wèn)題受限因變量模型(TOBIT模型)模型估計(jì)方法與統(tǒng)計(jì)檢驗(yàn)案例分析第42頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月43截取數(shù)據(jù):子樣代表總體當(dāng)樣本是總體中的某個(gè)特殊子集時(shí),我們遇到數(shù)據(jù)被截取的情況。例1:針對(duì)貧困戶的調(diào)查資料,但無(wú)非貧困戶資料

例2:對(duì)有借款行為農(nóng)戶的調(diào)查,無(wú)非貸款農(nóng)戶資料此時(shí)只觀察到該特殊子集的各項(xiàng)資料,沒(méi)有獲得有關(guān)其他對(duì)象的觀察資料。此時(shí)出現(xiàn)樣本對(duì)總體的代表性問(wèn)題。需要注意的是,總體的確定具有相對(duì)性,例如我們將貧困人口作為總體時(shí),例1的情況不再屬于截取。第43頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月44刪改數(shù)據(jù):不完整的因變量信息若樣本在總體中的分布具有代表性,但當(dāng)數(shù)據(jù)由于報(bào)告制度而使某些信息被高度簡(jiǎn)化時(shí),我們遇到“刪改數(shù)據(jù)”情況。Y=Y*如果Y*處于某個(gè)范圍,Y=某個(gè)固定值如果Y*處于其他范圍。例:農(nóng)戶收入的調(diào)查中將低于某一水平的農(nóng)戶全部報(bào)告為貧困戶而沒(méi)有報(bào)告具體的收入數(shù)據(jù)。刪改數(shù)據(jù)仍有關(guān)于總體的自變量信息,但關(guān)于因變量的信息不完整。刪改數(shù)據(jù)情況可以被看作是由于數(shù)據(jù)報(bào)告制度存在缺點(diǎn),造成信息含量的損失。第44頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月45截取數(shù)據(jù)和刪改數(shù)據(jù)的概率分布容量限制座位貧困線收入截?。核x擇的樣本是總體的一個(gè)子集。刪改:樣本來(lái)自總體,但觀察結(jié)果不完整,或報(bào)告的信息簡(jiǎn)化。例1:居民收入例2:對(duì)電影票的需求第45頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月46截取數(shù)據(jù)和刪改數(shù)據(jù)從統(tǒng)計(jì)技術(shù)角度講,由于兩種情況均導(dǎo)致隨機(jī)變量的分布形式發(fā)生變化,并引起丟失解釋變量錯(cuò)誤,因而利用OLS方法估計(jì)模型會(huì)出現(xiàn)估計(jì)系數(shù)偏差。在很多應(yīng)用工作中,人們常常利用受限因變量模型處理存在上限、下限或上下限的數(shù)據(jù),而不去認(rèn)真考慮究竟數(shù)據(jù)體現(xiàn)何種性質(zhì)。第46頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月47截取隨機(jī)變量的密度分布定理:截取隨機(jī)變量的密度分布(考慮存在下限約束的情況)如果連續(xù)隨機(jī)變量x的概率密度函數(shù)為f(x),且該變量面臨一個(gè)限制a,那么其概率密度函數(shù)為:第47頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月48隱變量

(LatentVariables)對(duì)于截取數(shù)據(jù)模型或刪改數(shù)據(jù)模型,均可以借鑒二元因變量模型引入的隱變量概念;模型中的隱變量是解釋變量的函數(shù)y*=β0+βx+e然而我們只能觀察到y(tǒng)=max(0,y*)即:當(dāng)y*>0時(shí)y=y*當(dāng)y*≤0時(shí)y=0第48頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月49截取數(shù)據(jù)模型假定回歸模型的確定性部分為:而包括正態(tài)分布隨機(jī)誤差的方程為(假定e服從標(biāo)準(zhǔn)正態(tài)分布,方差為2):因而y為服從以下分布的隨機(jī)變量:第49頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月50截取數(shù)據(jù)模型截取對(duì)隨機(jī)變量分布的影響體現(xiàn)在:當(dāng)截取發(fā)生在低端時(shí),分布的均值增大;反之,截取發(fā)生在高端時(shí),分布的均值減少。截取降低了分布的方差。第50頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月51截取正態(tài)分布變量的矩定理:如果x~N(,2),a是一個(gè)常數(shù),那么有:截取均值E[x|truncation]=+()截取方差Var[x|truncation]=2[1-()]式中:=(a-)/如果x>a,那么()=()/[1-()]如果x<a,那么()=-()/()()=()[()-],對(duì)于所有的有0<()<1函數(shù)()被稱作inverseMillsratio。第51頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月52截取數(shù)據(jù)模型當(dāng)y在點(diǎn)a處被截取時(shí),根據(jù)前述的定理,y的條件均值為:用OLS方法估計(jì)此類模型時(shí),我們不僅遇到異方差現(xiàn)象,而且出現(xiàn)丟失解釋變量,從而使估計(jì)結(jié)果出現(xiàn)偏差,統(tǒng)計(jì)檢驗(yàn)失效。在對(duì)誤差的分布形式做出假定后,該模型可以利用最大似然法估計(jì)得出。第52頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月53刪改數(shù)據(jù)模型刪改數(shù)據(jù)通常指的是當(dāng)數(shù)據(jù)落在某一范圍時(shí)所有數(shù)據(jù)均被轉(zhuǎn)變?yōu)閱我粩?shù)值或以單一數(shù)值形式報(bào)告的情況。例:對(duì)演出票的需求從總體上看,人們對(duì)票的需求受相同因素的影響;然而,由于演出場(chǎng)地有座位限制,當(dāng)所有的票都售出后,即便有人有需求,也無(wú)法得到實(shí)現(xiàn)。我們實(shí)際觀察到的出票總是少于或等于座位數(shù)。這種情況被說(shuō)成,演出票的需求數(shù)量受到刪改。第53頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月54刪改數(shù)據(jù)模型在應(yīng)用經(jīng)濟(jì)學(xué)研究中,很多情況可以被看作是刪改數(shù)據(jù):家庭耐用品購(gòu)買就業(yè)時(shí)間新技術(shù)采用率商品消費(fèi)農(nóng)民糧食出售農(nóng)民轉(zhuǎn)業(yè)(所有農(nóng)民都有轉(zhuǎn)業(yè)的意愿,但只有那些已經(jīng)實(shí)現(xiàn)轉(zhuǎn)業(yè)的人才顯示出來(lái)。)第54頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月55刪改數(shù)據(jù)模型對(duì)于刪改數(shù)據(jù),其因變量的概率分布是一個(gè)離散分布和連續(xù)分布的混合。OLS方法無(wú)法區(qū)分達(dá)到極限的觀察值和未達(dá)到極限的觀察值(連續(xù)變量),因而估計(jì)結(jié)果存在偏差。刪改數(shù)據(jù)模型也可以基于不同的誤差項(xiàng)概率分布假定。在應(yīng)用工作中,刪改點(diǎn)可以發(fā)生在任何數(shù)值上,可以是固定的,也可以由某個(gè)連續(xù)變量所確定。第55頁(yè),課件共64頁(yè),創(chuàng)作于2023年2月56刪改數(shù)據(jù)模型為了分析上述情況,定義隨機(jī)變量y為:如果y*0,那么y=0如果y*>0,那么y=y*假定y*為正態(tài)分布變量(y*~N(,2),此時(shí)有:Pr(y=0)=Pr(y*0)=(-)=1-()Pr(y>0)=P

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論