




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1第四部分離散被解釋變量和受限因變量模型
第一節(jié)離散被解釋變量一、一些離散被解釋變量的例子二元選擇模型(購買/不購買)多值選擇模型:對于交通方式的選擇,對汽車的選擇等無序有序2二、二元選擇模型定義:最簡單的在離散選擇模型,在兩個可供選擇的方案中選擇其一,此時被解釋變量只取兩個值,稱為二元選擇模型(binarychoicemodel)。例如學生是否選擇某選修課程,選或者不選消費者對某種商品的選擇,買或者不買農民是否加入合作醫(yī)療保險,加入或者不加入3(一)線性概率模型1、線性概率模型:例如,研究居民的收入與購買住房決策的關系
看上去和OLS回歸一樣,區(qū)別是Y只取0和1兩個值。52、線性概率模型的特點63、隨機擾動項的分布隨機擾動項不服從正態(tài)分布。對于參數(shù)估計不會產生影響,但會影響統(tǒng)計推斷。只有大樣本情況下,才可以利用正態(tài)分布假定進行統(tǒng)計推斷。774、線性概率模型評價優(yōu)點:計算簡單,結果易于解釋缺點:預測概率值可能落在[0,1]之外。(解決方法:假設負的擬合值為0,大于1的擬合值為1.)線性概率模型假定自變量與Y=1的概率之間存在線性關系,而實際往往不是線性的。隨機誤差項不是正態(tài)分布隨機誤差項具有異方差。(方差為p(1-p),而P是Y=1的概率,此概率對不同觀測值不同。)8(二)非線性概率模型實際上,p與x可能是非線性關系。隨著X的增加,P(y=1)的概率在增加,但不超過[0,1]P和x的關系是非線性的.隨著x變大,p趨向1的速度也越慢。怎樣的函數(shù)有這個特性?累積分布函數(shù)考慮y的兩點分布根據(jù)累積分布函數(shù)形式如果F是正態(tài)分布的累積分布函數(shù),Probit模型如果F是邏輯分布的累積分布函數(shù),logit模型9Probit曲線,Logit曲線比較示意圖10logit曲線Probit曲線111、Probit模型分布函數(shù)取標準正態(tài)分布。稱為Probit模型或者概率單位模型利用極大似然估計方法求解12Probit模型參數(shù)的含義可以證明,x對y=1的概率的邊際影響為可見,系數(shù)本身并不是邊際影響,邊際影響也不是常數(shù)。但和邊際影響的符號相同。132、Logit模型隨機擾動項取Logistic分布,稱為Logit模型利用極大似然估計方法求解14Logit模型參數(shù)的含義Logit可以計算機會比,將[0,1]區(qū)間上的預測概率的問題轉化為在實數(shù)軸上預測一個事件發(fā)生的機會比的問題。153、非線性模型的擬合優(yōu)度不再使用常用三個指標Pseudo-R2概率的正確預測率檢查Y=1或0的概率的正確性,判斷擬合的好壞預測值與真實值的相關系數(shù)相關系數(shù)高,表明擬合越好164、模型的選擇直接比較三種概率模型的系數(shù)是沒有意義的線性概率模型可用于問題的初步分析Logit模型,系數(shù)含義可以通過機會比得以jiesh解釋,可以擴展到多元選擇模型Probit模型,可由隨機變量服從正態(tài)分布的假定得到,可以擴展到Tobit模型1717三個模型估計系數(shù)的大概關系LPM*2.5=ProbitLPM*4=logitProbit*1.6=logit以上只是一個大概的關系.18(三)二值選擇模型的微觀基礎Probit模型和Logit模型的潛變量模型推導:這里不可觀測,通常稱為潛變量(latentvariable)。我們能觀測到的是虛擬變量:19如果隨機項服從正態(tài)分布,則為Probit如果隨機項服從邏輯分布,則為logit20
三、排序模型
當因變量不止是兩種選擇時,就要用到多元選擇模型(multiplechoicemodel)。多元離散選擇問題普遍存在于經濟生活中。例如:
(1)一個人面臨多種職業(yè)選擇,將可供選擇的職業(yè)排隊,用0,1,2,3表示。影響選擇的因素有不同職業(yè)的收入、發(fā)展前景和個人偏好等;
(2)同一種商品,不同的消費者對其偏好不同。例如,十分喜歡、一般喜歡、無所謂、一般厭惡和十分厭惡,分別用0,1,2,3,4表示。而影響消費者偏好的因素有商品的價格、性能、收入及對商品的需求程度等;
(3)一個人選擇上班時所采用的方式——自己開車,乘出租車,乘公共汽車,還是騎自行車。21所謂“排序”是指在各個選擇項之間有一定的順序或級別種類。如果離散數(shù)據(jù)有天然的排序,需要建立排序選擇模型(orderedchoicemodel)。如:公司的評級
受到的教育程度
22
與二元選擇模型類似,設有一個潛在變量yi*,是不可觀測的,可觀測的是yi
,設yi有0,1,2,…,M等M+1個取值。(1)其中:ui*是獨立同分布的隨機變量,yi可以通過yi*按下式得到
(2)
23
設ui*的分布函數(shù)為F(x),可以得到如下的概率
(3)根據(jù)分布函數(shù)F(x)的不同可以有有序Probit模型、有序Logit模型。采用極大似然方法估計參數(shù)需要指出的是,M個臨界值c1,c2,…,cM事先也是不確定的,所以也作為參數(shù)和回歸系數(shù)一起估計。計數(shù)模型(CountModel)被解釋變量表示次數(shù)時,離散模型變?yōu)橛嫈?shù)模型例如:某地區(qū)發(fā)生沙塵暴的次數(shù)公司申請專利數(shù)量常見模型泊松分布負二項回歸等
24離散因變量STATA操作案例1、二元選擇模型。命令191~193數(shù)據(jù)文件:womenwk.dta主要變量:work——0,1(1=就業(yè))age——年齡Married——(1=已婚)Children——子女數(shù)目Education——受教育年限25考慮模型26線性概率回歸(LPM)usewomenwk.dta,clearregworkagemarriedchildreneducationestimatesstorelpm27Probit回歸probitworkagemarriedchildreneducationestimatesstoreprobit
計算邊際效應mfx計算準確預測的比率estatclas28Logit回歸logitworkagemarriedchildreneducation,nologestimatesstorelogit
計算邊際效應mfx計算準確預測的比率estatclas29回歸結果比較estimatestablelpmprobitlogit3031離散因變量STATA操作案例2。有序選擇模型。命令P202(helpologit)數(shù)據(jù)文件:panel184extract.dta,公司債券評級模型主要變量:rating83——83年的債券評級,2-5,5為最優(yōu)ia83——83年的incometoasset比率dia——ia比率1982-1983年的變化3132Orderedlogit估計usepanel184extract.dta,clearologitrating83cia83dia,nolog預測每個公司的評級概率predictr2r3r4r5(預測評級概率,并命名)listr2r3r4r5in1/1(僅顯示第一個公司評級概率)3233Orderedprobit估計usepanel184extract.dta,clearoprobitrating83cia83dia,nolog預測每個公司的評級概率predictp2p3p4p5listp2p3p4p5in1/13334第二節(jié)受限因變量模型
在某些情況下,被解釋變量的取值范圍可能受到限制,稱為受限因變量模型(limiteddependentvariablemodels)。
本節(jié)研究兩類受限因變量模型審查回歸,截取回歸,歸并問題(censored)
截斷回歸,斷尾回歸(truncated)。35“歸并”
(censoring)問題
將被解釋變量的處于某一范圍的樣本觀測值都用一個相同的值代替。例如:需求函數(shù)模型中用實際消費量作為需求量的觀測值,如果存在供給限制,就出現(xiàn)“歸并”問題。被解釋變量觀測值存在最高和最低的限制。例如考試成績,最高100,最低0,出現(xiàn)“歸并”問題。36“截斷”(truncation)問題
由于條件限制,樣本不能隨機抽取,即不能從全部個體,而只能從一部分個體中隨機抽取被解釋變量的樣本觀測值,而這部分個體的觀測值都大于或者小于某個確定值。
“掐頭”或者“去尾”。例如:銀行貸款,我們只能觀察到獲得銀行貸款的企業(yè)的數(shù)據(jù)。(實際上是選擇性樣本)通常表現(xiàn)為“截斷樣本”。原因:問題的局限。37一、審查回歸模型(censoredregressionmodels)定義1:對于線性回歸模型,當或者時,所有y都被記錄為c。
即:當被解釋變量為截取數(shù)據(jù)時,我們雖然有全部觀察數(shù)值,但對于某些觀察數(shù)據(jù),被解釋變量被壓縮再一個點上了。
此時Y的概率分布變成由一個離散點,與一個連續(xù)分布所組成的混合分布38一、審查回歸模型(censoredregressionmodels)例如:買車開支。如果買車,那么買車開支為正,不買車開支為0企業(yè)R&D支出。有相當部分企業(yè)的R&D支出為0.有R&D支出的企業(yè)數(shù)據(jù)大致連續(xù)分布假設真實情況為3940Tobit模型(一類特殊,代表性的截取回歸模型)一類重要的限制因變量模型,在嚴格為正時大致連續(xù),但總體中有一個不可忽略的部分取值為零。例如,某人在一個月中酒方面的花費就是一個例子。有相當多的人在酒方面的花費為零。我們不是簡單的將這些觀測從樣本中去掉,而是建立Tobit模型。
41TOBIT模型的理論基礎,考慮下面的潛在因變量回歸模型
(1)其中:
是比例系數(shù);y*是潛在變量。被觀察的數(shù)據(jù)y與潛在變量y*的關系如下:
(2)數(shù)據(jù)的現(xiàn)實:問題是可以得到全部觀察值,但是信息可能不全面。對估計的影響如果用OLS,無論是用整個樣本,還是去掉離散點后的子樣本,都不能得到一致估計4243審查回歸模型的極大似然估計
可以采用極大似然法估計審查回歸模型的參數(shù),對數(shù)似然函數(shù)為
(4)求式(4)的最大值即可得參數(shù)
,
的估計。這里f,F分別是u的密度函數(shù)和分布函數(shù)。
44二、
截斷(斷尾)回歸模型(truncatedRegression)定義:對于線性模型,,假設只有的數(shù)據(jù)才能觀測到。形象地說:就是掐頭或者去尾。即在很多實際問題中,不能從全部個體中抽取因變量的樣本觀測值,而只能從大于或小于某個數(shù)的范圍內抽取樣本的觀測值
45例如,在研究與收入有關的問題時,收入作為被解釋變量。從理論上講,收入應該是從零到正無窮,但實際中由于各種客觀條件的限制,只能獲得處在某個范圍內的樣本觀測值。這就是一個截斷問題。數(shù)據(jù)存在的問題數(shù)據(jù)缺失估計方法MLE但是要利用條件密度函數(shù)46斷尾前Y的概率密度函數(shù)為:樣本被觀察到的概率斷尾后的條件密度為474849求解該1階極值條件,即可以得到模型的參數(shù)估計量。由于這是一個復雜的非線性問題,需要采用迭代方法求解,例如牛頓法。受限因變量模型的STATA操作案例3、censored回歸。命令見P215數(shù)據(jù)文件:womenwk.dta主要數(shù)據(jù)lwf——不工作0;工作:工資的對數(shù)Age——年齡Married——婚否Children——子女數(shù)目Education——教育年限50OLS估計usewomenwk.dta,clearreglwfage
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 購銷合同范文
- 建筑材料采購合同協(xié)議書
- 勞動合同解除談話筆錄1
- 企業(yè)云計算資源使用合作協(xié)議
- 數(shù)字化合作框架下的遠程工作協(xié)作合同
- 配電網升級改造合同
- 環(huán)保工程服務合同:全面解決方案
- 合同生命周期管理:物業(yè)財務關鍵制度
- 圖書館目視化管理
- 拆除工程中的文物保護與遷移策略考核試卷
- 2023年5月7日內蒙古事業(yè)單位聯(lián)考職業(yè)能力傾向測驗A類真題答案解析
- 管道溝槽開挖施工方案
- 《城市數(shù)字孿生標準化白皮書(2022版)》
- 《入職心得分享》課件
- 中職班級工作
- 直流輸電技術培訓課件
- 2024.8.1十七個崗位安全操作規(guī)程手冊(值得借鑒)
- 《工業(yè)園區(qū)物業(yè)服務》課件
- 危險貨物運輸企業(yè)安全風險辨識分級管控
- 【語文課件】地動儀課件
- 非營利組織中層管理人員薪酬管理政策
評論
0/150
提交評論