第四講 虛擬變量_第1頁
第四講 虛擬變量_第2頁
第四講 虛擬變量_第3頁
第四講 虛擬變量_第4頁
第四講 虛擬變量_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

計量經濟學第四講虛擬變量主講人:李順毅

在實際建模過程中,被解釋變量不但受定量變量影響,同時還受定性變量影響。例如需要考慮性別、民族、不同歷史時期、季節(jié)差異、企業(yè)所有制性質不同等因素的影響。由于定性變量通常表示的是某種特征的有和無,所以量化方法可采用取值為1或0。這種變量稱作虛擬變量(dummyvariable),用D表示。虛擬變量應用于模型中,對其回歸系數(shù)的估計與檢驗方法和定量變量相同。注意:(1)當定性變量含有m個類別時,模型不能引入m個虛擬變量。最多只能引入m-1個虛擬變量,否則當模型中存在截距項時就會產生完全多重共線性,無法估計回歸參數(shù)。比如,對于季節(jié)數(shù)據(jù)引入4個虛擬變量,數(shù)據(jù)如下表,則必然會有,截距項對應的單位向量等于

(D1+D2+D3+D4)。這意味著虛擬變量之間存在完全多重共線性。

(2)把虛擬變量取值為0所對應的類別稱作基礎類別。那個類別取0是任意的。(3)當定性變量含有m個類別時,不能把虛擬變量的值設成如下形式。這種賦值法在一般情形下與虛擬變量賦值是完全不同的兩回事。(4)回歸模型可以只用虛擬變量作解釋變量,也可以用定量變量和虛擬變量一起做解釋變量。虛擬變量

1.用虛擬變量測量截距變動設有模型,yt=0+1xt+2D+ut,其中yt,xt為定量變量;D為定性變量。當D=0或1時,上述模型可表達為,D=1或0表示某種特征的有無。反映在數(shù)學上是截距不同的兩個函數(shù)。若2顯著不為零,說明截距不同;若2為零,說明這種分類無顯著性差異。D=1

D=000+2例1

隨機調查美國舊金山地區(qū)20個家庭的儲蓄情況,擬建立年儲蓄額Yi(千美元)對年收入Xi(千美元)的回歸模型。通過對樣本點的分析發(fā)現(xiàn),居于上部的6個點(用小圓圈表示)都是代表自己有房子的家庭;居于下部的14個點(用小三角表示)都是租房住的家庭。而這兩類家庭所對應的觀測點各自都表現(xiàn)出明顯的線性關系。于是給模型加入一個定性變量“住房狀況”,用D表示。定義如下:建立回歸模型Yi

=0+1

Xi+2

Di

+ut

得估計結果如下,=-0.3204+0.0675Xt+0.8273Di

(-5.2)(16.9)(11.0)R2=0.99,DW=2.27由于回歸系數(shù)0.8273顯著地不為零,說明對住房狀況不同的兩類家庭來說,回歸函數(shù)截距項確實明顯不同。當模型不引入虛擬變量“住房狀況”時,得回歸方程如下,

=-0.5667+0.0963Xi

(-3.5)(11.6)R2=0.88,

DW=1.85比較回歸方程,前者的確定系數(shù)為0.99,后者的確定系數(shù)僅為0.88。說明該回歸模型中引入虛擬變量非常必要。

把“季節(jié)”因素引入模型“季節(jié)”是在研究經濟問題中常常遇到的定性因素。比如,酒,肉的銷量在冬季要超過其它季節(jié),而飲料的銷量又以夏季為最大。當建立這類問題的計量模型時,就要考慮把“季節(jié)”因素引入模型。由于一年有四個季節(jié),所以這是一個含有四個類別的定性變量。應該向模型引入三個虛擬變量。

例2

市場用煤銷售量模型。由于受取暖用煤的影響,每年第四季度的銷售量大大高于其它季度。鑒于是季節(jié)數(shù)據(jù)可設三個季節(jié)變量如下:

以時間t為解釋變量(1982年1季度取t=1)的煤銷售量(Yi)模型估計結果如下:

=2431.20+49.00t+1388.09D1+201.84D2+85.00D3

(26.04)(10.81)(13.43)(1.96)(0.83)

R2=0.95,DW=1.2,F=100.4,T=28,t0.05(28-5)

=2.07由于D2,D3的系數(shù)沒有顯著性,說明第二、三季度可以歸并入基礎類別第一季度。于是只考慮加入一個虛擬變量D1,把季節(jié)因素分為第四季度和第一、二、三季度兩類。從上式中剔除虛擬變量D2,D3,得煤銷售量(Yi)模型如下:

=2515.86+49.73t+1290.91D1

(32.03(10.63)(14.79)R2=0.94,DW=1.4,F=184.9,T=28,t0.05(25)=2.06這里第一、二、三季度為基礎類別。R2小,擬合效果不好以上介紹了用虛擬變量測量回歸函數(shù)的截距變化。實際上,也可以用虛擬變量考察回歸函數(shù)的斜率是否發(fā)生變化。方法是在模型中加入定量變量與虛擬變量的乘積項。設模型如下,Yi

=0+1Xi

+2Di

+3(XiDi)+ui

按2,3是否為零,回歸函數(shù)可有如下四種形式。

E(Yi)=0+1Xi,(當2=3=0)E(Yi)=(

0+2)+(

1+3)Xi,(當20,30)E(Yi)=0+(1+3)Xi,(當2=0,

30)E(Yi)=(0+2)+

1Xi,(當

20,

3=0)截距、斜率同時發(fā)生變化的兩種情形見圖。2.測量斜率變動

例3

中國進出口貿易總額序列(1950~1984年)如圖。試檢驗改革開放前后該時間序列的斜率是否發(fā)生變化。定義虛擬變量D如下,

以時間time為解釋變量,進出口貿易總額用trade表示,估計結果如下,

=0.2818+0.0746time-35.8809D+1.2559time*D(1.35)(6.2)(-8.4)(9.6)

上式說明,改革開放前后相比無論截距和斜率都發(fā)生了變化。進出口貿易總額的年平均增長量擴大了近17倍。例4:香港季節(jié)GDP數(shù)據(jù)(千億港元)的擬合1990~1997年香港季度GDP呈線性增長。1997年由于遭受東南亞金融危機的影響,經濟發(fā)展處于停滯狀態(tài),1998~2002年底GDP總量幾乎沒有增長(見上圖)。對這樣一種先增長后停滯,且含有季節(jié)性周期變化的過程簡單地用一條直線去擬合顯然是不恰當?shù)摹閰^(qū)別不同季節(jié),和不同時期,定義季節(jié)虛擬變量D2、D3、D4和區(qū)別不同時期的虛擬變量DT如下,例4:香港季節(jié)GDP數(shù)據(jù)(千億港元

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論