




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1第四部分離散被解釋變量和受限因變量模型
第一節(jié)離散被解釋變量一、一些離散被解釋變量的例子二元選擇模型(購(gòu)買/不購(gòu)買)多值選擇模型:對(duì)于交通方式的選擇,對(duì)汽車的選擇等無(wú)序有序2二、二元選擇模型定義:最簡(jiǎn)單的在離散選擇模型,在兩個(gè)可供選擇的方案中選擇其一,此時(shí)被解釋變量只取兩個(gè)值,稱為二元選擇模型(binarychoicemodel)。例如學(xué)生是否選擇某選修課程,選或者不選消費(fèi)者對(duì)某種商品的選擇,買或者不買農(nóng)民是否加入合作醫(yī)療保險(xiǎn),加入或者不加入3(一)線性概率模型1、線性概率模型:例如,研究居民的收入與購(gòu)買住房決策的關(guān)系
看上去和OLS回歸一樣,區(qū)別是Y只取0和1兩個(gè)值。52、線性概率模型的特點(diǎn)63、隨機(jī)擾動(dòng)項(xiàng)的分布隨機(jī)擾動(dòng)項(xiàng)不服從正態(tài)分布。對(duì)于參數(shù)估計(jì)不會(huì)產(chǎn)生影響,但會(huì)影響統(tǒng)計(jì)推斷。只有大樣本情況下,才可以利用正態(tài)分布假定進(jìn)行統(tǒng)計(jì)推斷。774、線性概率模型評(píng)價(jià)優(yōu)點(diǎn):計(jì)算簡(jiǎn)單,結(jié)果易于解釋缺點(diǎn):預(yù)測(cè)概率值可能落在[0,1]之外。(解決方法:假設(shè)負(fù)的擬合值為0,大于1的擬合值為1.)線性概率模型假定自變量與Y=1的概率之間存在線性關(guān)系,而實(shí)際往往不是線性的。隨機(jī)誤差項(xiàng)不是正態(tài)分布隨機(jī)誤差項(xiàng)具有異方差。(方差為p(1-p),而P是Y=1的概率,此概率對(duì)不同觀測(cè)值不同。)8(二)非線性概率模型實(shí)際上,p與x可能是非線性關(guān)系。隨著X的增加,P(y=1)的概率在增加,但不超過(guò)[0,1]P和x的關(guān)系是非線性的.隨著x變大,p趨向1的速度也越慢。怎樣的函數(shù)有這個(gè)特性?累積分布函數(shù)考慮y的兩點(diǎn)分布根據(jù)累積分布函數(shù)形式如果F是正態(tài)分布的累積分布函數(shù),Probit模型如果F是邏輯分布的累積分布函數(shù),logit模型9Probit曲線,Logit曲線比較示意圖10logit曲線Probit曲線111、Probit模型分布函數(shù)取標(biāo)準(zhǔn)正態(tài)分布。稱為Probit模型或者概率單位模型利用極大似然估計(jì)方法求解12Probit模型參數(shù)的含義可以證明,x對(duì)y=1的概率的邊際影響為可見,系數(shù)本身并不是邊際影響,邊際影響也不是常數(shù)。但和邊際影響的符號(hào)相同。132、Logit模型隨機(jī)擾動(dòng)項(xiàng)取Logistic分布,稱為L(zhǎng)ogit模型利用極大似然估計(jì)方法求解14Logit模型參數(shù)的含義Logit可以計(jì)算機(jī)會(huì)比,將[0,1]區(qū)間上的預(yù)測(cè)概率的問題轉(zhuǎn)化為在實(shí)數(shù)軸上預(yù)測(cè)一個(gè)事件發(fā)生的機(jī)會(huì)比的問題。153、非線性模型的擬合優(yōu)度不再使用常用三個(gè)指標(biāo)Pseudo-R2概率的正確預(yù)測(cè)率檢查Y=1或0的概率的正確性,判斷擬合的好壞預(yù)測(cè)值與真實(shí)值的相關(guān)系數(shù)相關(guān)系數(shù)高,表明擬合越好164、模型的選擇直接比較三種概率模型的系數(shù)是沒有意義的線性概率模型可用于問題的初步分析Logit模型,系數(shù)含義可以通過(guò)機(jī)會(huì)比得以jiesh解釋,可以擴(kuò)展到多元選擇模型Probit模型,可由隨機(jī)變量服從正態(tài)分布的假定得到,可以擴(kuò)展到Tobit模型1717三個(gè)模型估計(jì)系數(shù)的大概關(guān)系LPM*2.5=ProbitLPM*4=logitProbit*1.6=logit以上只是一個(gè)大概的關(guān)系.18(三)二值選擇模型的微觀基礎(chǔ)Probit模型和Logit模型的潛變量模型推導(dǎo):這里不可觀測(cè),通常稱為潛變量(latentvariable)。我們能觀測(cè)到的是虛擬變量:19如果隨機(jī)項(xiàng)服從正態(tài)分布,則為Probit如果隨機(jī)項(xiàng)服從邏輯分布,則為logit20
三、排序模型
當(dāng)因變量不止是兩種選擇時(shí),就要用到多元選擇模型(multiplechoicemodel)。多元離散選擇問題普遍存在于經(jīng)濟(jì)生活中。例如:
(1)一個(gè)人面臨多種職業(yè)選擇,將可供選擇的職業(yè)排隊(duì),用0,1,2,3表示。影響選擇的因素有不同職業(yè)的收入、發(fā)展前景和個(gè)人偏好等;
(2)同一種商品,不同的消費(fèi)者對(duì)其偏好不同。例如,十分喜歡、一般喜歡、無(wú)所謂、一般厭惡和十分厭惡,分別用0,1,2,3,4表示。而影響消費(fèi)者偏好的因素有商品的價(jià)格、性能、收入及對(duì)商品的需求程度等;
(3)一個(gè)人選擇上班時(shí)所采用的方式——自己開車,乘出租車,乘公共汽車,還是騎自行車。21所謂“排序”是指在各個(gè)選擇項(xiàng)之間有一定的順序或級(jí)別種類。如果離散數(shù)據(jù)有天然的排序,需要建立排序選擇模型(orderedchoicemodel)。如:公司的評(píng)級(jí)
受到的教育程度
22
與二元選擇模型類似,設(shè)有一個(gè)潛在變量yi*,是不可觀測(cè)的,可觀測(cè)的是yi
,設(shè)yi有0,1,2,…,M等M+1個(gè)取值。(1)其中:ui*是獨(dú)立同分布的隨機(jī)變量,yi可以通過(guò)yi*按下式得到
(2)
23
設(shè)ui*的分布函數(shù)為F(x),可以得到如下的概率
(3)根據(jù)分布函數(shù)F(x)的不同可以有有序Probit模型、有序Logit模型。采用極大似然方法估計(jì)參數(shù)需要指出的是,M個(gè)臨界值c1,c2,…,cM事先也是不確定的,所以也作為參數(shù)和回歸系數(shù)一起估計(jì)。計(jì)數(shù)模型(CountModel)被解釋變量表示次數(shù)時(shí),離散模型變?yōu)橛?jì)數(shù)模型例如:某地區(qū)發(fā)生沙塵暴的次數(shù)公司申請(qǐng)專利數(shù)量常見模型泊松分布負(fù)二項(xiàng)回歸等
24離散因變量STATA操作案例1、二元選擇模型。命令191~193數(shù)據(jù)文件:womenwk.dta主要變量:work——0,1(1=就業(yè))age——年齡Married——(1=已婚)Children——子女?dāng)?shù)目Education——受教育年限25考慮模型26線性概率回歸(LPM)usewomenwk.dta,clearregworkagemarriedchildreneducationestimatesstorelpm27Probit回歸probitworkagemarriedchildreneducationestimatesstoreprobit
計(jì)算邊際效應(yīng)mfx計(jì)算準(zhǔn)確預(yù)測(cè)的比率estatclas28Logit回歸logitworkagemarriedchildreneducation,nologestimatesstorelogit
計(jì)算邊際效應(yīng)mfx計(jì)算準(zhǔn)確預(yù)測(cè)的比率estatclas29回歸結(jié)果比較estimatestablelpmprobitlogit3031離散因變量STATA操作案例2。有序選擇模型。命令P202(helpologit)數(shù)據(jù)文件:panel184extract.dta,公司債券評(píng)級(jí)模型主要變量:rating83——83年的債券評(píng)級(jí),2-5,5為最優(yōu)ia83——83年的incometoasset比率dia——ia比率1982-1983年的變化3132Orderedlogit估計(jì)usepanel184extract.dta,clearologitrating83cia83dia,nolog預(yù)測(cè)每個(gè)公司的評(píng)級(jí)概率predictr2r3r4r5(預(yù)測(cè)評(píng)級(jí)概率,并命名)listr2r3r4r5in1/1(僅顯示第一個(gè)公司評(píng)級(jí)概率)3233Orderedprobit估計(jì)usepanel184extract.dta,clearoprobitrating83cia83dia,nolog預(yù)測(cè)每個(gè)公司的評(píng)級(jí)概率predictp2p3p4p5listp2p3p4p5in1/13334第二節(jié)受限因變量模型
在某些情況下,被解釋變量的取值范圍可能受到限制,稱為受限因變量模型(limiteddependentvariablemodels)。
本節(jié)研究?jī)深愂芟抟蜃兞磕P蛯彶榛貧w,截取回歸,歸并問題(censored)
截?cái)嗷貧w,斷尾回歸(truncated)。35“歸并”
(censoring)問題
將被解釋變量的處于某一范圍的樣本觀測(cè)值都用一個(gè)相同的值代替。例如:需求函數(shù)模型中用實(shí)際消費(fèi)量作為需求量的觀測(cè)值,如果存在供給限制,就出現(xiàn)“歸并”問題。被解釋變量觀測(cè)值存在最高和最低的限制。例如考試成績(jī),最高100,最低0,出現(xiàn)“歸并”問題。36“截?cái)唷保╰runcation)問題
由于條件限制,樣本不能隨機(jī)抽取,即不能從全部個(gè)體,而只能從一部分個(gè)體中隨機(jī)抽取被解釋變量的樣本觀測(cè)值,而這部分個(gè)體的觀測(cè)值都大于或者小于某個(gè)確定值。
“掐頭”或者“去尾”。例如:銀行貸款,我們只能觀察到獲得銀行貸款的企業(yè)的數(shù)據(jù)。(實(shí)際上是選擇性樣本)通常表現(xiàn)為“截?cái)鄻颖尽?。原因:?jiǎn)栴}的局限。37一、審查回歸模型(censoredregressionmodels)定義1:對(duì)于線性回歸模型,當(dāng)或者時(shí),所有y都被記錄為c。
即:當(dāng)被解釋變量為截取數(shù)據(jù)時(shí),我們雖然有全部觀察數(shù)值,但對(duì)于某些觀察數(shù)據(jù),被解釋變量被壓縮再一個(gè)點(diǎn)上了。
此時(shí)Y的概率分布變成由一個(gè)離散點(diǎn),與一個(gè)連續(xù)分布所組成的混合分布38一、審查回歸模型(censoredregressionmodels)例如:買車開支。如果買車,那么買車開支為正,不買車開支為0企業(yè)R&D支出。有相當(dāng)部分企業(yè)的R&D支出為0.有R&D支出的企業(yè)數(shù)據(jù)大致連續(xù)分布假設(shè)真實(shí)情況為3940Tobit模型(一類特殊,代表性的截取回歸模型)一類重要的限制因變量模型,在嚴(yán)格為正時(shí)大致連續(xù),但總體中有一個(gè)不可忽略的部分取值為零。例如,某人在一個(gè)月中酒方面的花費(fèi)就是一個(gè)例子。有相當(dāng)多的人在酒方面的花費(fèi)為零。我們不是簡(jiǎn)單的將這些觀測(cè)從樣本中去掉,而是建立Tobit模型。
41TOBIT模型的理論基礎(chǔ),考慮下面的潛在因變量回歸模型
(1)其中:
是比例系數(shù);y*是潛在變量。被觀察的數(shù)據(jù)y與潛在變量y*的關(guān)系如下:
(2)數(shù)據(jù)的現(xiàn)實(shí):?jiǎn)栴}是可以得到全部觀察值,但是信息可能不全面。對(duì)估計(jì)的影響如果用OLS,無(wú)論是用整個(gè)樣本,還是去掉離散點(diǎn)后的子樣本,都不能得到一致估計(jì)4243審查回歸模型的極大似然估計(jì)
可以采用極大似然法估計(jì)審查回歸模型的參數(shù),對(duì)數(shù)似然函數(shù)為
(4)求式(4)的最大值即可得參數(shù)
,
的估計(jì)。這里f,F分別是u的密度函數(shù)和分布函數(shù)。
44二、
截?cái)啵〝辔玻┗貧w模型(truncatedRegression)定義:對(duì)于線性模型,,假設(shè)只有的數(shù)據(jù)才能觀測(cè)到。形象地說(shuō):就是掐頭或者去尾。即在很多實(shí)際問題中,不能從全部個(gè)體中抽取因變量的樣本觀測(cè)值,而只能從大于或小于某個(gè)數(shù)的范圍內(nèi)抽取樣本的觀測(cè)值
45例如,在研究與收入有關(guān)的問題時(shí),收入作為被解釋變量。從理論上講,收入應(yīng)該是從零到正無(wú)窮,但實(shí)際中由于各種客觀條件的限制,只能獲得處在某個(gè)范圍內(nèi)的樣本觀測(cè)值。這就是一個(gè)截?cái)鄦栴}。數(shù)據(jù)存在的問題數(shù)據(jù)缺失估計(jì)方法MLE但是要利用條件密度函數(shù)46斷尾前Y的概率密度函數(shù)為:樣本被觀察到的概率斷尾后的條件密度為474849求解該1階極值條件,即可以得到模型的參數(shù)估計(jì)量。由于這是一個(gè)復(fù)雜的非線性問題,需要采用迭代方法求解,例如牛頓法。受限因變量模型的STATA操作案例3、censored回歸。命令見P215數(shù)據(jù)文件:womenwk.dta主要數(shù)據(jù)lwf——不工作0;工作:工資的對(duì)數(shù)Age——年齡Married——婚否Children——子女?dāng)?shù)目Education——教育年限50OLS估計(jì)usewomenwk.dta,clearreglwfage
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年江西省考公務(wù)員考試縣鄉(xiāng)崗和省市崗結(jié)構(gòu)化面試真題試題試卷答案解析
- 2024年農(nóng)作物種子知識(shí)試題及答案
- 智能化農(nóng)田改造工程可行性研究報(bào)告(范文參考)
- 掌握監(jiān)管要點(diǎn)2024籃球裁判員考試試題及答案
- 模具設(shè)計(jì)師資格考試階段性調(diào)整試題及答案
- 高端物流設(shè)施園區(qū)項(xiàng)目可行性研究報(bào)告
- 2024年模具設(shè)計(jì)師資格認(rèn)證熱題及答案
- 理解農(nóng)作物種子職業(yè)教育的試題及答案
- 2024年體育經(jīng)紀(jì)人考試考生必看試題及答案
- 2024年體育經(jīng)紀(jì)人考試核心考點(diǎn)試題及答案
- 國(guó)際農(nóng)業(yè)技術(shù)轉(zhuǎn)移與合作-深度研究
- 4-2-電商文案開頭、結(jié)尾、正文的寫作
- 2025年廣州水務(wù)投資集團(tuán)有限公司招聘筆試參考題庫(kù)含答案解析
- 2025年江蘇揚(yáng)州水利建筑工程公司招聘筆試參考題庫(kù)含答案解析
- 合肥濱湖濕地森林公園觀光火車項(xiàng)目設(shè)計(jì)方案
- 4-2 討論:你是否支持設(shè)計(jì)試管嬰兒 說(shuō)課稿-高二下學(xué)期生物滬科版選擇性必修3
- 高校太極拳傳承困境及對(duì)策研究
- 皮膚瘀斑的護(hù)理查房
- 《視網(wǎng)膜靜脈阻塞》課件
- 大學(xué)假期安全教育班會(huì)
- 小學(xué)生手工串珠教學(xué)課件
評(píng)論
0/150
提交評(píng)論