第2節(jié)二元離散選擇模型課件_第1頁
第2節(jié)二元離散選擇模型課件_第2頁
第2節(jié)二元離散選擇模型課件_第3頁
第2節(jié)二元離散選擇模型課件_第4頁
第2節(jié)二元離散選擇模型課件_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第5節(jié) 定性選擇模型二元選擇模型 Models with Discrete Dependent VariablesBinary Choice Model一、社會經(jīng)濟生活中的二元選擇問題 二、二元離散選擇模型 三、二元Probit離散選擇模型及其參數(shù)估計 四、二元Logit離散選擇模型及其參數(shù)估計 五、二元離散選擇模型的檢驗 說明離散被解釋變量數(shù)據(jù)計量經(jīng)濟學模型(Models with Discrete Dependent Variables)和離散選擇模型(DCM, Discrete Choice Model)的區(qū)別。二元選擇模型(Binary Choice Model)和多元選擇模型(Mul

2、tiple Choice Model)。本節(jié)只介紹二元選擇模型。離散選擇模型起源于Fechner于1860年進行的動物條件二元反射研究。1962年,Warner首次將它應用于經(jīng)濟研究領域,用以研究公共交通工具和私人交通工具的選擇問題。70、80年代,離散選擇模型被普遍應用于經(jīng)濟布局、企業(yè)定點、交通問題、就業(yè)問題、購買決策等經(jīng)濟決策領域的研究。模型的估計方法主要發(fā)展于80年代初期。一、社會經(jīng)濟生活中的二元選擇問題研究選擇結果與影響因素之間的關系。選擇結果:0、1影響選擇結果的因素包括兩部分:決策者的屬性和備選方案的屬性。兩種方案的選擇由決策者的屬性和備選方案的屬性共同決定。例如,選擇利用公共交通

3、工具還是私人交通工具,取決于兩類因素。一類是公共交通工具和私人交通工具所具有的屬性,諸如速度、耗費時間、成本等;一類是決策個體所具有的屬性,諸如職業(yè)、年齡、收入水平、健康狀況等。從大量的統(tǒng)計中,可以發(fā)現(xiàn)選擇結果與影響因素之間具有一定的因果關系。單個方案的取舍一般由決策者的屬性決定。例如,對某種商品的購買決策問題。決定購買與否,取決于兩類因素。一類是該商品本身所具有的屬性,諸如性能、價格等;一類是消費者個體所具有的屬性,諸如收入水平、對該商品的偏好程度等。對于所有的決策者,商品本身所具有的屬性是相同的,在模型中一般不予體現(xiàn)。二、二元離散選擇模型1、原始模型對于二元選擇問題,可以建立如下計量經(jīng)濟學

4、模型。其中Y為觀測值為1和0的決策被解釋變量;X為解釋變量,包括選擇對象所具有的屬性和選擇主體所具有的屬性。 左右端矛盾由于存在這兩方面的問題,主要是模型左右端矛盾問題,導致:原始模型不能作為實際研究二元選擇問題的模型。需要將原始模型變換為效用模型。一般教科書稱為潛變量模型(Latent Variable Model)。 這是離散選擇模型的關鍵。 具有異方差性 2、效用模型 作為研究對象的二元選擇模型第i個個體 選擇1的效用第i個個體 選擇0的效用注意:在效應模型中,被解釋變量是不可觀測的潛變量,人們能夠得到的觀測值仍然是選擇結果,即1和0。很顯然,如果不可觀測的U1U0,即對應于觀測值為1,

5、因為該個體選擇公共交通工具的效用大于選擇私人交通工具的效用,他當然要選擇公共交通工具;相反,如果不可觀測的U1U0,即對應于觀測值為0,因為該個體選擇公共交通工具的效用小于選擇私人交通工具的效用,他當然要選擇私人交通工具。OLS不能用于效用模型的估計。3、最大似然估計 欲使得效用模型可以采用ML估計,就必須為隨機誤差項選擇一種特定的概率分布。兩種最常用的分布是標準正態(tài)分布和邏輯(logistic)分布,于是形成了兩種最常用的二元選擇模型Probit模型和Logit模型。最大似然函數(shù)及其估計過程如下:標準正態(tài)分布或邏輯分布的對稱性似然函數(shù) 在樣本數(shù)據(jù)的支持下,如果知道概率分布函數(shù)和概率密度函數(shù),

6、求解該方程組,可以得到模型參數(shù)估計量。 1階極值條件三、二元Probit離散選擇模型及其參數(shù)估計1、標準正態(tài)分布的概率分布函數(shù) 2、重復觀測值不可以得到情況下二元Probit離散選擇模型的參數(shù)估計 關于參數(shù)的非線性函數(shù),不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。應用計量經(jīng)濟學軟件。這里所謂“重復觀測值不可以得到”,是指對每個決策者只有一個觀測值。如果有多個觀測值,也將其看成為多個不同的決策者。 3、例題:貸款決策模型分析與建模:某商業(yè)銀行從歷史貸款客戶中隨機抽取78個樣本,根據(jù)設計的指標體系分別計算它們的“商業(yè)信用支持度”(XY)和“市場競爭地位等級”(SC),對它們貸款的結果

7、(JG)采用二元離散變量,1表示貸款成功,0表示貸款失敗。目的是研究JG與XY、SC之間的關系,并為正確貸款決策提供支持。樣本觀測值選擇Probit模型估計結果輸出的估計結果該方程表示:當XY和SC已知時,代入方程,可以計算貸款成功的概率JGF。例如,將表中第19個樣本觀測值XY=15、SC=1代入方程右邊,計算括號內(nèi)的值為0.1326552;查標準正態(tài)分布表,對應于0.1326552的累積正態(tài)分布為0.5517;于是,JG的預測值JGF=10.5517=0.4483,即對應于該客戶,貸款成功的概率為0.4483。正確解讀該結果十分重要討論:能否說“當市場競爭地位等級提高1,給該企業(yè)貸款成功的

8、概率提高5.062”?不能。為什么?能否說“對于不同的企業(yè),當市場競爭地位等級都提高1,給這些企業(yè)貸款成功的概率所提高的幅度是相同的”?不能。為什么?模擬預測預測:如果有一個新客戶,根據(jù)客戶資料,計算的“商業(yè)信用支持度”(XY)和“市場競爭地位等級”(SC),代入模型,就可以得到貸款成功的概率,以此決定是否給予貸款。4、重復觀測值可以得到情況下二元Probit離散選擇模型的參數(shù)估計 思路對每個決策者有多個重復(例如10次左右)觀測值。對第i個決策者重復觀測ni次,選擇yi=1的次數(shù)比例為pi,那么可以將pi作為真實概率Pi的一個估計量。建立 “概率單位模型” ,采用廣義最小二乘法估計 。實際中

9、并不常用。對第i個決策者重復觀測n次,選擇yi=1的次數(shù)比例為pi,那么可以將pi作為真實概率Pi的一個估計量。 定義“觀測到的”概率單位 V的觀測值通過求解標準正態(tài)分布的概率分布函數(shù)的反函數(shù)得到 實際觀測得到的 四、二元Logit離散選擇模型及其參數(shù)估計1、邏輯分布的概率分布函數(shù) 2、重復觀測值不可以得到情況下二元logit離散選擇模型的參數(shù)估計 關于參數(shù)的非線性函數(shù),不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。應用計量經(jīng)濟學軟件。 3、重復觀測值可以得到情況下二元logit離散選擇模型的參數(shù)估計思路對每個決策者有多個重復(例如10次左右)觀測值。對第i個決策者重復觀測ni次,

10、選擇yi=1的次數(shù)比例為pi,那么可以將pi作為真實概率Pi的一個估計量。建立“對數(shù)成敗比例模型” ,采用廣義最小二乘法估計 。實際中并不常用。用樣本重復觀測得到的pi構成“成敗比例”,取對數(shù)并進行臺勞展開,有 邏輯分布的概率分布函數(shù) 五、二元離散選擇模型的檢驗1、擬合檢驗P:樣本觀測值中被解釋變量等于1的比例。 L0:模型中所有解釋變量的系數(shù)都為0時的似然函數(shù)值。LRI=1,即L=1,完全擬合。 LRI=0,所有解釋變量完全不顯著,完全不擬合。LnL=1.639954LnL0=52.80224LRI=0.9689422、 總體顯著性檢驗 例中,lnL=1.639954,lnL0= 52.80

11、224,LR=102.3246。20.01(2)=9.21。可見,在0.01的顯著水平上,該模型拒絕總體不顯著的0假設。 3、異方差性檢驗截面數(shù)據(jù)樣本,容易存在異方差性。假定異方差結構為: 采用LM檢驗將解釋變量分為兩類,Z為只與個體特征有關的變量。顯然異方差與這些變量相關。將異方差檢驗問題變?yōu)橐粋€約束檢驗問題由于一般都存在異方差,不檢驗,直接采用White修正進行估計4、分布檢驗檢驗關于分布的假設(probit、logit )。一般不進行該項檢驗。具體見相關教科書(Greene,P682)。:模型1的參數(shù),:模型2的參數(shù)。組合模型的似然函數(shù):構造LM統(tǒng)計量,如果不拒絕0假設,表明模型1是適當

12、的。5、回代檢驗概率閾值樸素選擇:p=0.5 (1、0的樣本相當時)先驗選擇:p=(選1的樣本數(shù)/全部樣本)(全樣本時)最優(yōu)閾值:犯第一類錯誤最小原則如果按照樸素原則,例中,除了2個樣本外,所有樣本都通過了回代檢驗。沒有通過回代檢驗的2個樣本中,第19個樣本的選擇結果為1,回代算得的選擇1的概率為0.4472;第45個樣本的選擇結果為0,回代算得的選擇1的概率0.5498。但是,該例中,選擇1和選擇0的樣本數(shù)目分別為32和46,差異較大,不適合采用該方法。 如果按照先驗方法,即以全部樣本中選擇1的樣本所占的比例為臨界值。例中,選擇1的樣本的比例為0.41。以此為臨界值,只有第45個樣本不能通過

13、檢驗。但是,該方法適合于以全部個體作為樣本的情況,而該例中的78個樣本僅是貸款客戶的極少部分,所以也不適合采用該方法。 如果按照最優(yōu)方法,即以“犯第一類錯誤最小”為原則確定臨界值的方法。在例中,如果以0.50為臨界值,則有2個樣本發(fā)生“棄真”,即犯第一類錯誤;如果以0.41為臨界值,則發(fā)生“棄真”的樣本只有1個。所以以0.41作為臨界值比較合適。 其它實例財務欺詐識別模型建立我國上市公司財務欺詐識別模型樣本:年度報告審計意見為“無法發(fā)表意見”或者“證監(jiān)會立案調(diào)查”等公司屬于財務欺詐樣本;年度報告審計意見為“標準無保留意見”和財務報表滿足“利潤現(xiàn)金流量0”的公司屬于配對樣本。解釋變量:開始選擇11個財務指標;通過T檢驗,確定6個指標:資產(chǎn)負債率、資產(chǎn)毛利率、資產(chǎn)周轉(zhuǎn)率、營運資金比率、應收賬款周轉(zhuǎn)率、經(jīng)營活動現(xiàn)金流量/資產(chǎn)額。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論