版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
關于虛擬變量的回歸1、虛擬變量的性質(zhì)2、對一個定量變量和一個兩分定性變量的回歸3、對一個定量變量和一個多分定性變量的回歸4、對一個定量變量和兩個定性變量的回歸5、一個例子:“兼職”經(jīng)濟學6、檢驗回歸模型的結(jié)構(gòu)穩(wěn)定性7、比較兩個回歸:虛擬變量法8、比較兩個回歸:進一步說明9、交互作用效應10、虛擬變量在季節(jié)分析中的應用11、分段線性回歸12、在時間序列和橫截面數(shù)據(jù)的合并中使用虛擬變量13、虛擬變量方法的一些技術問題一、虛擬變量的性質(zhì)虛擬變量,是一種離散結(jié)構(gòu)的量,用來描述所研究變量的發(fā)展或變異而建立的一類特殊變量,常用來表示職業(yè)、性別、季節(jié)、災害、經(jīng)濟結(jié)構(gòu)變化、受教育程度等的影響。此外它還有一些其他的名稱,如指標變量、二值變量、范疇變量、定性變量和二分變量。量化虛擬變量的方法通常是賦值“1”和“0”。在回歸模型中,對定量變量和虛擬變量的估計方法是一樣。如果一個模型中的自變量全都是虛擬變量,通常對這種模型的分析方法稱之為方差分析。(為什么把這種模型稱為方差分析模型?)一個教授年薪的模型:其中表示教授的年薪根據(jù)所給數(shù)據(jù)可以估計出如下結(jié)果:估計方法與前面說講的方法沒有區(qū)別。由于這個模型與單因素方差分析統(tǒng)計模型的原理及所要表達的統(tǒng)計意義一致,因此這個最簡單的虛擬變量模型也稱之為方差分析模型二、一個定量變量和一個兩分定性變量仍然用上面的例子,只是引入教齡作為解釋變量。有如下模型:
表示教齡,其他定義如前。這個模型的系數(shù)估計用ols即可完成。主要以下幾點需要注意:1、雖然有男、女兩個分類,但是只用一個虛擬變量。更通用的規(guī)則是:如果一個定性變量有m個類別,則引入m-1個虛擬變量。2、虛擬變量的取值是隨意,但是一旦取定之后要能合理地解釋其意義。3、被賦予零值的那個類別通常稱為基底。它是用以和其他類別作比較的一個基礎。4、虛擬變量的系數(shù)稱為級差截距系數(shù),它表示取值1的類別的截距值和基底類的截距值相比有多大差別。三、一個定量變量和一個多分定性變量假設在橫截面數(shù)據(jù)的基礎上,分析個人保健支出對個人收入和教育水平的回歸。教育水平是定性變量,分為三類:低于中學、中學和大學。模型中引入兩個虛擬變量。模型如下:其中=保健年度支出=年度收入
四、一個定量變量和兩個定性變量回顧前面學院教授薪金回歸模型,現(xiàn)在假定除了教齡和性別之外,膚色也是一個重要的薪金決定因素。膚色假定只有兩種情況:黑和白。于是模型改寫為:其中表示學院教授的薪金表示教齡
假定,則可以得到以下回歸:黑人女教授平均薪金:黑人男教授平均薪金:白人女教授平均薪金:白人男教授平均薪金:五、一個例子:“兼職”經(jīng)濟學在國外,把持有兩份工作的人稱為“夜襲者”。Shisko和Rostker為了發(fā)現(xiàn)是什么因素影響這些人的工薪。根據(jù)318名夜襲者的數(shù)據(jù)建立了如下回歸模型:表示夜襲工資,表示主業(yè)工資,race=0白人,race=1非白人;urban=0非城里人,urban=1城里人;reg=0非西部,reg=1西部;hisch=0非畢業(yè),hisch=1中學畢業(yè);age表示年齡。當所有虛擬變量都為0時,可以得到白人、非城鎮(zhèn)、非西部、非中學畢業(yè)夜襲者的平均小時工薪模型:當所有虛擬變量都為1時,可以得到非白人、城鎮(zhèn)、西部、中學畢業(yè)夜襲者的平均小時工薪模型:六、檢驗回歸模型的結(jié)構(gòu)穩(wěn)定前面的虛擬變量模型只考慮了影響回歸截距的情形,這一節(jié)將分析存在變斜率的虛擬變量模型。仍然用聯(lián)合王國儲蓄-收入數(shù)據(jù)。(數(shù)據(jù):略)數(shù)據(jù)分為兩期:重建時期:重建后時期:其中Y表示儲蓄,X表示收入。這兩個回歸模型可能有以下四種情形:1、和;兩個回歸相同。(重復回歸)2、但;平行回歸,截距不同。3、但;相匯回歸,截距相同,斜率不同。4、且;相異回歸,所有這些情形都說明模型發(fā)生了結(jié)構(gòu)性變化,下面將用虛擬變量模型來處理結(jié)構(gòu)性變化。七、比較兩個回歸:虛擬變量法將儲蓄-收入模型中兩期數(shù)據(jù)進行合并,重新建立以下回歸模型:和同前,觀測值屬于重建時期;觀測值屬于重建后時期。假定E(ui)=0根據(jù)表中的數(shù)據(jù)得到如下結(jié)果:各個系數(shù)在統(tǒng)計上都是顯著的??梢钥隙▋蓚€時期的回歸是相異的。重建時期重建后時期八、比較兩個回歸:進一步說明虛擬變量技術在實際中有很多的應用,下面是一個關于英國失業(yè)和空缺的例子。從1958年第4季度到1971年第2季度的失業(yè)率與職位空缺率的關系。通過散點圖可以看出在1966年4季度前后曲線發(fā)生了明顯的變動。作者認為這是因為工黨的失業(yè)補貼政策發(fā)生了重大變化,致使失業(yè)等待時間更長,給定的空缺所對應的失業(yè)人數(shù)更多。建立以下模型:UN=失業(yè)率,%V=職位空缺率。%D=1從1966年4季度開始以后的時期=0
1966年4季度以前的時期估計得到如下結(jié)果:九、交互作用效應再考慮這樣一個模型:其中表示衣著方面的年度開支表示收入該模型隱含的假定是,在兩種教育水平之間性別的級差效應保持不變,在兩種性別之間教育的級差效應保持不變。這種假定顯然是站不住腳的。顯然上過大學的男性與女性在衣著方面支出差距比沒上過大學的肯定大或者說不一樣。這就是存在所謂的交互效應。簡單一點,上過大學和性別這兩個因素對衣著支出的影響不是獨立的,他們相互影響,也即交互效應。模型修正為:=女性的級差效應=大學畢業(yè)的級差效應=女大學畢業(yè)生的級差效應交互作用虛擬變量的系數(shù)是否在統(tǒng)計上顯著,可通過平常的t檢驗加以驗證。錯誤地忽略一個顯著的交互作用項將導致模型設定上的偏誤。十、虛擬變量在季節(jié)分析中的應用經(jīng)濟數(shù)據(jù)有時會呈現(xiàn)一種季節(jié)波動。這一點在時間序列數(shù)據(jù)出現(xiàn)比較多。當然現(xiàn)在有很多方法來消除季節(jié)波動,下面主要講述用虛擬變量方法怎么解決季節(jié)波動的問題。例子:美國制造業(yè)的利潤-銷售額行為其中=利潤,=銷售額
根據(jù)所提供的數(shù)據(jù),估計結(jié)果如下:結(jié)果表明只有銷售額和第二季度的系數(shù)在統(tǒng)計上顯著。因此可以重新考慮以下模型,只引入一個虛擬變量以區(qū)別第二季度和其他季度。新的模型估計結(jié)果如下:注意:這里我們所建立的模型都沒有考慮銷售額的斜率系數(shù)是否隨著季節(jié)變化,只是考慮了截距項的變化。關于這一點可以通過乘積性虛擬變量技術加以檢驗十一、分段線性回歸虛擬變量的另一種用途。
在銷售沒有達到給定銷售水平之前以一種方式支付傭金,在銷售額達到給定銷售水平之后以另一種方式支付傭金。根據(jù)所給條件建立如下回歸:=給定銷售水平,又稱為結(jié)點。=1如果=0如果達到銷售水平以前的平均傭金達到銷售水平以后的平均傭金十二、在時間序列和橫截面數(shù)據(jù)的合并中使
用虛擬變量混合回歸Grunfeld研究總投資()與廠商的價值(
)和資本存量(
)之間的關系一個例子。研究對象分別是通用汽車、西屋電氣和通用電氣。研究、、之間的關系有如下三種方式:1、對每一個廠商進行時間序列回歸:通用汽車:西屋電氣:2、對每一年做一個橫截面回歸。但是在本例中樣本過少,只有3個廠商。如果有15~20或以上,這也是一種思路。3、把所有樣本數(shù)據(jù)聚合,做一個回歸:i=1,2t=1,2,…,20.這就是混合回歸的一個例子,這個回歸假定了回歸參數(shù)不隨時間變化,并且在各個橫截面之間沒有差異,不存在異方差。在僅考慮這樣一種情形:通用汽車和西屋電氣的投資函數(shù)有不同截距,但有相同的斜率,并且誤差項都滿足經(jīng)典假設。模型可改寫為:
其中對通用汽車的觀測值??;否則取零。如果是統(tǒng)計上的顯著的,這就意味這著通用汽車投資函數(shù)的截距不同于西屋電氣投資函數(shù)的截距。具體估計結(jié)果如下:十三、虛擬變量方法的一些技術問題1、在半對數(shù)回歸中的虛擬變量的解釋回顧前面的關于線性到對數(shù)回歸模型的討論。加入虛擬變量之后的模型變?yōu)椋浩渲校綄W院教授的起薪,=教齡,D=1男性,D=0女性。對于的解釋前面已經(jīng)介紹的很清楚了?,F(xiàn)在關鍵要考慮虛擬變量的系數(shù)的解釋。這方面的解釋可以參照霍爾沃森和帕姆奎斯特的建議:均值的相對變化取所估的虛擬喜事的反對數(shù)再從中減1。書上舉了一個學院教授薪金與教齡和性別的假想例,估計結(jié)果如下:重點是看虛擬變量的解釋:在其他情況不變的情況下,男教授的平均薪金比女教授高出=0.1435,即14.35%。2、避免虛擬變量陷阱的另一種方法再考慮前面的教授薪金模型:把模型改寫為:在去掉截距項之后,數(shù)據(jù)不再有完全共線性的問題。其實仔細看上面的模型就是一個過原點回歸模型。這個模型雖然可以避免多重共線性的問題,但是要注意他的并不總是有意義。遵循我們前面的規(guī)則:如果有m個類別,就選擇(m-1)個虛擬變量。3、虛擬變量與異方差前面所考慮的模型都沒有考慮異方差的問題,包括在分段回歸中,如果兩個時期的回歸方程都不一樣,怎么保證他們有相同的殘差方差?也許求得系數(shù)在統(tǒng)計上顯著,而實際上卻并不如此。當然,對于異方差的問題,我們已經(jīng)有很好的工具來解決這一問題非線性回歸1、多項式回歸2、對數(shù)回歸3、雙曲回歸人生就像一杯茶,也許會
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《高血壓病發(fā)機制》課件
- 2025年分期購買網(wǎng)上娛樂游戲服務協(xié)議
- 2025年內(nèi)河船舶裝載排列協(xié)議
- 2025年農(nóng)業(yè)機器人租賃協(xié)議
- 二零二五版窗簾布品牌授權(quán)及銷售合同2篇
- 2025年男方凈身出戶財產(chǎn)分割執(zhí)行協(xié)議6篇
- 二零二五年度落戶綠色通道快速辦理合同4篇
- 二零二五年度汽車配件零件買賣合同模板4篇
- 2025年度夾板生產(chǎn)線設備租賃合同示范4篇
- 2025年新型學生實習就業(yè)指導服務協(xié)議3篇
- 增強現(xiàn)實技術在藝術教育中的應用
- TD/T 1060-2021 自然資源分等定級通則(正式版)
- 《創(chuàng)傷失血性休克中國急診專家共識(2023)》解讀
- 倉庫智能化建設方案
- 海外市場開拓計劃
- 2024年度國家社會科學基金項目課題指南
- 供應鏈組織架構(gòu)與職能設置
- 幼兒數(shù)學益智圖形連線題100題(含完整答案)
- 七上-動點、動角問題12道好題-解析
- 2024年九省聯(lián)考新高考 數(shù)學試卷(含答案解析)
- 紅色歷史研學旅行課程設計
評論
0/150
提交評論