




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第9講 離散被解釋變量模型主要內(nèi)容 1-二值選擇模型 2-多值選擇模型第第1 1節(jié)節(jié) 二值選擇模型二值選擇模型 一 實驗基本原理 二 實驗內(nèi)容和數(shù)據(jù)來源 根據(jù)某統(tǒng)計資料,得到美國婦女就業(yè)的數(shù)據(jù)統(tǒng)計集,形成數(shù)據(jù)文件“womenwork.dta”,用來研究影響美國婦女就業(yè)的因素。被解釋變量是work(就業(yè)work=1,不就業(yè)work=0),解釋變量是age(年齡),married(婚否),children(子女數(shù)),education(教育年限)。完整的數(shù)據(jù)在本書附帶光盤里的data文件夾的“womenwork.dta”工作文件中。 利用以上數(shù)據(jù),建立合適模型對就業(yè)的影響因素進行計量分析,由于被解
2、釋變量取值有兩個可以建立二值選擇模型來分析問題。 三 實驗操作指導1.建立建立logit模型分析模型分析(1)使用logit模型回歸Stata中使用logit模型回歸的命令語句格式如下:logit y x1 x2 if in weight ,options該命令中l(wèi)ogit表示使用logit模型進行回歸,相應y表示模型的被解釋變量,x表示模型的解釋變量,if表示logit的回歸條件,in表示回歸的范圍,weight表示給觀測值的加入權重,options的內(nèi)容如下表所示:本實驗中,在Stata命令窗口中輸入如下命令。use womenwork, clear輸入此命令來打開需要的數(shù)據(jù)文件。logi
3、t work age education married children輸入此命令對被解釋變量為work,解釋變量為age、education、married、children的模型使用logit模型進行回歸估計。在這個回歸結果圖中l(wèi)og likelihood即對數(shù)似然值,不斷的試錯迭代是logit模型的估計方法,在逐步進行回歸時,通過比較不同模型的-2LL判斷模型的擬合優(yōu)度,選擇取值更小的模型。LR chi2(4)是卡方檢驗的統(tǒng)計量,也就是回歸模型無效假設所對應的似然比檢驗量;其中4為自由度,Probchi2 是其對應的P值,在這個估計結果顯示以p=0顯著說明模型的有效性。其實這兩個指標與
4、線性回歸結果中F統(tǒng)計量和P值的功能是大體一致的。另外結果中的Pseudo R2是準R2,雖然不等于R2,但可以用來檢驗模型對變量的解釋力,因為二值選擇模型是非線性模型,無法進行平方和分解,所以沒有,但是準衡量的是對數(shù)似然函數(shù)的實際增加值占最大可能增加值的比重,所以也可以很好的衡量模型的擬合準確度。此logit模型中擬合優(yōu)度為0.1882。coef是自變量對應的系數(shù)估計值,OLS通過t檢驗來檢驗估計量是否顯著,logit模型通過z檢驗來判斷其顯著性;通過z檢驗結果可以看到此模型中系數(shù)均以p=0顯著不為0。 (2)由于估計系數(shù)不像線性模型能夠表示解釋變量的邊際效應,所以Stata中有額外的命令語句
5、來計算解釋變量的邊際效應: mfx compute if in ,options 此命令語句中mfx表示對回歸之后的模型計算解釋變量的邊際效應,其中options內(nèi)容如下表所示: 本實驗中,在進行l(wèi)ogit模型回歸估計后,在Stata命令窗口中輸入如下命令: mfx 此命令計算模型回歸之后,解釋變量取值在樣本均值處的邊際效應。 此輸出結果顯示了每一個解釋變量的平均邊際影響,另外讀者可以自己設定計算在邊際影響的點,其原理就是命令語句options中的at(atlist)將其具體化,例如“mfx, at (x1=0)”表示計算x1取值為0,其他解釋變量取值在樣本均值處的邊際效應;而“mfx”默認是
6、在所有解釋變量在樣本平均值處的邊際效應。 (3)計算模型預測的百分比來計算模型的擬合優(yōu)度。 如果要檢驗這個分類的依據(jù)或者要獲得每個預測值,可以利用此二值模型進行預測分析,Stata中二值選擇模型的預測的命令語句如下所示: predict type newvar if in ,single_options 其中predict是表示對模型進行預測的命令;newvar表示預測新變量的名稱,type可以表明設定新變量的類型;if和in表示對此預測設定的條件和范圍;single_options的內(nèi)容以下表所示: 本實驗中,在Stata命令窗口中輸入如下預測命令,可以得到預測結果圖: predict p1
7、, pr 此命令可以獲得此模型的個體估計的值并記為新變量p1 list work p1 此命令可以將實際值與估計值對應羅列,對比看到預測值和實際值的一致程度。 (1)ROC曲線(受試者操控曲線) 此曲線是指圖9.3提到的敏感性與(1-特異性)的散點圖,即預測值等于1的準確率與錯誤率的散點圖。Stata中繪畫該ROC曲線命令語句為: lroc x if in weight ,options 其中l(wèi)roc表示繪圖ROC曲線命令,if和in表示對繪制圖時的條件和范圍的設定,weight表示對觀測值的權重設定,另外命令中的自變量x不能單獨使用,必須與options中beta(matname)同時使用,
8、而options的內(nèi)容如下表所示: 本實驗中,在以上工作后,在命令窗口中輸入如下命令繪制ROC曲線圖 lroc 因為準確率就是曲線下面的面積,讀此圖可以看到ROC曲線是完全在45度直線上面,所以準確率高于錯誤率,即準確率大于0.5。此圖曲線下方面積=0.7806,就是預測的準確率是0.7806。 (2)goodness-of-fit擬合優(yōu)度檢驗 此檢驗是考察該模型對所用數(shù)據(jù)的擬合優(yōu)度,在Stata中命令語句為: estat gof if in weight ,group(#) all outsample table 其中,if和in表示對檢測擬合優(yōu)度時的條件和范圍的設定,weight表示對觀測
9、值的權重設定,group(#)表示使用合理的#分位數(shù)進行檢驗;all表示對所有觀測值進行檢驗,若無后面可選項則默認就是all;outsample表示對估計區(qū)間外的樣本調(diào)整自由度,table表示各組列表。 本實驗中在Stata命令窗口輸入如下命令檢驗此模型的擬合優(yōu)度,然后可以得到檢驗結果: estat gof 讀此圖的方法是P值越大,說明模型的擬合優(yōu)度越好。 2.建立建立probit模型分析模型分析 前面是使用logit模型對womenwork.dta進行分析,現(xiàn)在使用probit模型對此問題進行分析。兩種方法在Stata中的操作是很一致的。 在Stata命令窗口中輸入如下命令: use wom
10、enwork, clear 使用此命令打開所需要文件。 probit work age education married children 此命令表示使用probit模型進行回歸。 此圖的解讀方法與Logit模型結果圖是完全一樣的,probit模型估計結果顯示系數(shù)估計值相比logit估計值發(fā)生了很大變化,且均顯著通過了模型系數(shù)的顯著性檢驗;另外模型的準R2是0.1889,相比logit模型稍有改進。 由于logit與probit模型得出的參數(shù)估計值不可直接比較,根據(jù)本節(jié)開始介紹的原理已了解到兩模型的邊際效應可以比較。Stata中probit模型的邊際效應得出方法與logit是相同的。 在St
11、ata命令窗口中輸入如下命令計算probit模型回歸后解釋變量在樣本均值處的邊際效應: mfx 可以看到與前面的logit模型比較,兩模型分析的邊際效應是大致相同的。然后來計算probit模型的擬合優(yōu)度,具體操作方法也與logit模型是一致的。 計算準確預測百分比,Stata命令窗口輸入如下命令: estat clas 此圖的解讀方法與上面logit模型得到的是完全一樣的,顯然可以得到:sensitivity(敏感性)=87.64% ,specificity(特異性)=45.05%,correctly classified(正確預測百分比)=73.65%。可以看到,這個結果與logit模型是完
12、全一致的。 另外為了檢驗這個結果,可以同樣輸入如下命令: predict p2, pr 此命令可以獲得此模型的個體估計的值并記為新變量p2 list work p2 其次是使用ROC曲線來檢測預測的準確度,在Stata命令窗口中輸入如下命令,可以得到ROC曲線: lroc 此圖的讀法與logit的ROC圖是一致的,由于logit模型與probit模型的sensitivity與specificity是相同的,那么ROC曲線一定是相同的,且曲線下方的面積同樣是0.7806。 最后是godness-of-fit擬合優(yōu)度檢驗,在Stata命令窗口中輸入如下命令: estat gof 3.二值選擇模型的
13、異方差問題二值選擇模型的異方差問題 Stata中對probit二值選擇模型進行異方差檢驗和回歸的命令語句如下: hetprob y x1 x2 if in weight , het(varlist offset(varname) ,options 其中hetprob表示對模型進行異方差probit模型估計和異方差檢驗,if和in表示對檢測擬合優(yōu)度時的條件和范圍的設定,weight表示對觀測值的權重設定,選擇項 het(varilist)是影響擾動項的變量清單,在該命令語句的輸出結果里,會匯報LR檢驗的結果,據(jù)此判斷是否應該使用此異方差模型,options的內(nèi)容如下表所示: 本實驗中,在Stat
14、a命令窗口中輸入如下命令進行異方差模型估計和檢驗,可以得到圖9.12的運行結果: hetprob work age education married children, het (age education married children) 結果顯示LR檢驗的結果是接受原假設,即模型不存在異方差問題。所以回歸不應使用異方差回歸模型,可以直接應用probit模型進行估計。第第2 2節(jié)節(jié) 多值選擇模型多值選擇模型 一 實驗基本原理 1.多值選擇模型 有時候人們面臨的選擇是多個的,比如交通選擇,入讀大學的選擇等等。假設個體可以選擇的y=1,2,3,J ,其中J是正整數(shù)。當研究的被解釋變量是這樣多
15、值離散的,建立的模型就是多值選擇模型,而當J=2時,就是上節(jié)所說的probit或者logit模型。 若將上面的二值logit模型推廣開來,可以得到, 二 實驗內(nèi)容和數(shù)據(jù)來源 本實驗來自某統(tǒng)計資料,統(tǒng)計在購物時所選品牌與性別、年齡的關系。變量主要有brand(品牌),female(性別),age(年齡)。完整的數(shù)據(jù)在本書附帶光盤data文件夾下“brand.dta”中。 本實驗用此數(shù)據(jù)來以female和age為解釋變量,brand為被解釋變量,brand的取值是離散的,且有三個取值,應建立多值選擇模型進行相關分析。 二實驗操作指導 1.選擇合理模型選擇合理模型 在Stata中將數(shù)據(jù)按照某個或某幾
16、個變量進行分類并按這個變量獲得其頻數(shù)分布的命令如下: tab varlist 其中varlist表示按照其分類的變量或者變量組合。 在本實驗中,打開數(shù)據(jù)文件并將數(shù)據(jù)按brand取值分類,在Stata命令窗口中輸入如下命令 use brand ,clear tab brand 讀圖可知brand取值有三個,分別是1,2,3。由于所要探究的問題female和age對brand的影響,且假定了選擇各個品牌之間是相互獨立的,那么建立多值選擇模型來分析問題是合理的。 2.模型回歸模型回歸多值選擇模型有l(wèi)ogit和probit多值選擇模型,Stata中使用多值logit和probit模型的命令語句是:ml
17、ogit y x1 x2 if in weight ,options (multinomial logit 模型)mprobit y x1 x2 if in weight ,options (multinomial probit 模型)此命令中if和in表示對檢測擬合優(yōu)度時的條件和范圍的設定,weight表示對觀測值的權重設定,options的內(nèi)容如下表所示: 經(jīng)常使用的命令語句是“mlogit y x1 x2 ,base(#)”或者“mprobit y x1 x2 ,base(#)”,其中#是指被解釋變量的某個取值,其可以根據(jù)需要變動此參照組。本實驗中,由于logit模型與probit模型操
18、作相似,以多值logit為例進行操作。 在Stata命令窗口中輸入如下命: mlogit brand age female, base(1) 此命令表示以age和female為解釋變量,brand為被解釋變量,以brand=1為參照組的多值logit模型回歸。 根據(jù)前面原理部分的介紹,該題的多值logit模型是由三個方程組成的。Stata回歸結果圖顯示出了j=2和j=3時對應的模型估計結果,自然由三種選擇概率之和為1可得到j=1時模型結果。Stata中得出多值選擇模型個體選擇被解釋變量每個取值的概率的命令語句格式(1):predict type stub*|newvars if in ,statistic outcome(#,#,) nooffset該預測命令語句中,type表示預測設定新變量的類型,stub*|newvars表示預測的新變量名稱,if
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 浙江專用2025版高考地理大三輪復習5選擇題專練五
- 四年級語文上冊第七單元26那片綠綠的爬山虎拓展閱讀母親肖復興素材魯教版
- 廣東省廉江市實驗學校高中政治2.2價格變動的影響練一練必修1
- 北京專版2024年中考生物復習主題十降地生活課時訓練28降地生活
- 江蘇專版2024中考道德與法治復習方案第一部分七上第01課時成長的節(jié)拍提分訓練
- 跨文化商務溝通與行政禮儀
- 閱讀開啟智慧之門的關鍵
- 超聲科診斷技術的教育與實踐
- 廣西2025年02月廣西崇左市左江治旱工程管理中心招考2名工作人員筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 貓寄養(yǎng)協(xié)議合同范本
- 2025采購部年度工作計劃
- 2024年度個人珠寶首飾分期購買合同范本3篇
- 食為天:2024中國食品飲料行業(yè)白皮書
- 醫(yī)學倫理與醫(yī)患溝通技巧
- 2025年牛津譯林版英語七年級下冊全冊單元重點知識點與語法匯編
- 痔瘡中醫(yī)治療課件
- 污水處理設備的故障處理指南考核試卷
- 華東師范大學《社會研究方法》2023-2024學年第一學期期末試卷
- ps 課件教學課件
- 數(shù)控車編程實訓教案
- 2024年世界職業(yè)院校技能大賽高職組“健康養(yǎng)老照護組”賽項考試題庫(含答案)
評論
0/150
提交評論