第八章單方程回歸模型的幾個專題_第1頁
第八章單方程回歸模型的幾個專題_第2頁
第八章單方程回歸模型的幾個專題_第3頁
第八章單方程回歸模型的幾個專題_第4頁
第八章單方程回歸模型的幾個專題_第5頁
已閱讀5頁,還剩10頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第八章 單方程回歸模型的幾個專題8.1虛擬變量(dummy variable)8.1.1 概念與用作在實(shí)際建模過程中,被解釋變量不但受定量變量影響,同時還受定性變量影響。例如需要考慮性別、民族、不同歷史時期、季節(jié)差異、企業(yè)所有制性質(zhì)等因素的影響。這些因素也應(yīng)該包括在模型中。為此人們采取了一種構(gòu)造人工變量的方法,將這些定性變量進(jìn)行量化,使其能與數(shù)值變量一樣在回歸模型中得以應(yīng)用。構(gòu)造的規(guī)則是當(dāng)某種屬性存在時,人工變量取值為1;當(dāng)某種屬性不存在時時,取值為0。在計量經(jīng)濟(jì)學(xué)中,我們把反映定性因素變化,取值為0或1的人工變量稱為虛擬變量。習(xí)慣上用D表示。如:D=1 城鎮(zhèn)居民0 農(nóng)村居民D=1 男性0 女

2、性D=1 就業(yè)0 失業(yè)引入虛擬變量的作用主要有三個:1)可以描述定性因素的影響;2)能夠正確反映經(jīng)濟(jì)變量的相互關(guān)系,提高模型的精度;3)便于處理異常數(shù)據(jù)。當(dāng)樣本資料中存在異常數(shù)據(jù)時,一般有三種處理方式。一是直接剔除;二是平滑掉;三是設(shè)置虛擬變量。8.1.2 虛擬變量的設(shè)置1、設(shè)置規(guī)則1)一個因素多個屬性:若定性因素有M個不同的屬性,或相互排斥的類型,在模型中則只能引入M-1個虛擬變量,否則會引起完全多重共線性。2)多個因素多個屬性:每個因素的引入方法均按上述原則。2、引入方式:1)加法方式(截距移動)設(shè)有模型,yt = b0 + b1 xt + b2D + ut ,其中yt,xt為定量變量;D

3、為定性變量。當(dāng)D = 0 或1時,上述模型可表達(dá)為,yt =D =0 D = 1 b0 b0+b2 圖8.1 測量截距不同D = 1或0表示某種特征的有無。反映在數(shù)學(xué)上是截距不同的兩個函數(shù)。若b2顯著不為零,說明截距不同;若b2為零,說明這種分類無顯著性差異。例:中國成年人體重y(kg)與身高x(cm)的回歸關(guān)系如下: 105 + x D = 1 (男) y = - 100 + x - 5D = 100 + x D = 0 (女)注意: 若定性變量含有m個類別,應(yīng)引入m-1個虛擬變量,否則會導(dǎo)致多重共線性,稱作虛擬變量陷阱(dummy variable trap)。 關(guān)于定性變量中的哪個類別取

4、0,哪個類別取1,是任意的,不影響檢驗結(jié)果。 定性變量中取值為0所對應(yīng)的類別稱作基礎(chǔ)類別(base category)。 對于多于兩個類別的定性變量可采用設(shè)一個虛擬變量而對不同類別采取賦值不同的方法處理。如: 1 (大學(xué)) D = 0 (中學(xué)) -1 (小學(xué))。例1:市場用煤銷售量模型(file: Dummy1)我國市場用煤銷量的季節(jié)性數(shù)據(jù)(1982-1988,中國統(tǒng)計年鑒1987,1989)見下圖與表。由于受取暖用煤的影響,每年第四季度的銷售量大大高于其它季度。鑒于是季節(jié)數(shù)據(jù)可設(shè)三個季節(jié)變量如下: 1 (4季度) 1 (3季度) 1 (2季度) D1 = D2 = D3 = 0 (1, 2,

5、 3季度) 0 (1, 2, 4季度) 0 (1, 3, 4季度) 全國按季節(jié)市場用煤銷售量數(shù)據(jù)(file: Dummy1)季度YttD1D2D3季度YttD1D2D31982.12599.810001985.33159.1150101982.22647.220011985.44483.2161001982.32912.730101986.12881.8170001982.44087.041001986.23308.7180011983.12806.550001986.33437.5190101983.22672.160011986.44946.8201001983.32943.6701019

6、87.13209.0210001983.44193.481001987.23608.1220011984.13001.990001987.33815.6230101984.22969.5100011987.45332.3241001984.33287.5110101988.13929.8250001984.44270.6121001988.24126.2260011985.13044.1130001988.34015.1270101985.23078.8140011988.44904.228100數(shù)據(jù)來源:中國統(tǒng)計年鑒1989。注:以季節(jié)數(shù)據(jù)D1為例,EViews命令是D1= seas(4)。

7、以時間t為解釋變量(1982年1季度取t = 1)的煤銷售量(y)模型如下:y = 2431.20 + 49.00 t + 1388.09 D1 + 201.84 D2 + 85.00 D3 (1) (26.04) (10.81) (13.43) (1.96) (0.83) R2 = 0.95, DW = 1.2, s.e. = 191.7, F=100.4, T=28, t0.05 (28-5) = 2.07由于D2,D3的系數(shù)沒有顯著性,說明第2,3季度可以歸并入基礎(chǔ)類別第1季度。于是只考慮加入一個虛擬變量D1,把季節(jié)因素分為第四季度和第一、二、三季度兩類。從上式中剔除虛擬變量D2,D3,

8、得煤銷售量(y)模型如下: y = 2515.86 + 49.73 t + 1290.91 D1 (2) (32.03 (10.63) (14.79) R2 = 0.94, DW = 1.4, s.e. = 198.7, F = 184.9, T=28, t0.05 (25) = 2.06進(jìn)一步檢驗斜率是否有變化,在上式中加入變量t D1, y = 2509.07 + 50.22 t + 1321.19 D1 - 1.95 t D1 (3) (28.24) (9.13) (6.85) (-0.17) R2 = 0.94, DW = 1.4, s.e. = 202.8, F = 118.5, T

9、=28, t0.05 (24) = 2.06由于回歸系數(shù) -1.95所對應(yīng)的t值是 -0.17,可見斜率未發(fā)生變化。因此以模型 (2) 作為最后確立的模型。若不采用虛擬變量,得回歸結(jié)果如下, y = 2731.03 + 57.15 t (4) (11.6) (4.0) R2 = 0.38, DW = 2.5, s.e. = 608.8, T = 28, t0.05 (26) = 2.06與(2)式相比,回歸式(4)顯得很差。2、 乘法方式(斜率變化) 以上只考慮定性變量影響截距,未考慮影響斜率,即回歸系數(shù)的變化。當(dāng)需要考慮時,可建立如下模型: yt = b0 + b1 xt + b2 D +

10、b3 xt D + ut ,其中xt為定量變量;D為定性變量。當(dāng)D = 0 或1時,上述模型可表達(dá)為,yt =通過檢驗 b3是否為零,可判斷模型斜率是否發(fā)生變化。圖8.5 情形1(不同類別數(shù)據(jù)的截距和斜率不同) 圖8.6 情形2(不同類別數(shù)據(jù)的截距和斜率不同) 例2:用虛擬變量區(qū)別不同歷史時期(file:dummy2)中國進(jìn)出口貿(mào)易總額數(shù)據(jù)(1950-1984)見上表。試檢驗改革前后該時間序列的斜率是否發(fā)生變化。定義虛擬變量D如下0 (1950 - 1977)D = 1 (1978 - 1984)中國進(jìn)出口貿(mào)易總額數(shù)據(jù)(1950-1984) (單位:百億元人民幣)年tradetimeDtime

11、 D年tradetimeDtime D19500.41510019681.085190019510.59520019691.069200019520.64630019701.129210019530.80940019711.209220019540.84750019721.469230019551.09860019732.205240019561.08770019742.923250019571.04580019752.904260019581.28790019762.641270019591.493100019772.725280019601.284110019783.55029129196

12、10.908120019794.5463013019620.809130019805.6383113119630.857140019817.3533213219640.975150019827.7133313319651.184160019838.6013413419661.2711700198412.0103513519671.1221800以時間time為解釋變量,進(jìn)出口貿(mào)易總額用trade表示,估計結(jié)果如下:trade = 0.37 + 0.066 time - 33.96D + 1.20 time D (1.86) (5.53) (-10.98) (12.42) 0.37 + 0.06

13、6 time (D = 0, 1950 - 1977) = - 33.59 + 1.27 time (D = 1, 1978 - 1984) 上式說明,改革前后無論截距和斜率都發(fā)生了變化。進(jìn)出口貿(mào)易總額的年平均增長量擴(kuò)大了18倍。例3:香港季節(jié)GDP數(shù)據(jù)(單位:千億港元)的擬合(虛擬變量應(yīng)用, file:dummy6)19901997年香港季度GDP呈線性增長。1997年由于遭受東南亞金融危機(jī)的影響,經(jīng)濟(jì)發(fā)展處于停滯狀態(tài),19982002年底GDP總量幾乎沒有增長(見上圖)。對這樣一種先增長后停滯,且含有季節(jié)性周期變化的過程簡單地用一條直線去擬合顯然是不恰當(dāng)?shù)?。為區(qū)別不同季節(jié),和不同時期,定義

14、季節(jié)虛擬變量D2、D3、D4和區(qū)別不同時期的虛擬變量DT如下(數(shù)據(jù)見附錄):D2=1 第2季度0 其它季度D3=1 第3季度0 其它季度D4=1 第4季度0 其它季度 1 (1998:12002:4) DT = 0 (1990:1 1997:4)得估計結(jié)果如下: GDPt = 1.1573 + 0.0668 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4+ 1.8338 DT - 0.0654 DT t (50.8) (64.6) (3.7) (9.9) (11.0) (19.9) (-28.0) R2 = 0.99, DW = 0.9, s.e. = 0.05,

15、F=1198.4, T=52, t0.05 (52-7) = 2.01對于1990:1 1997:4 GDPt = 1.1573 + 0.0668 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4對于1998:12002:4 GDPt = 2.9911 + 0.0014 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4如果不采用虛擬變量擬合效果將很差。GDPt = 1.6952 + 0.0377 t (20.6) (13.9) R2 = 0.80, DW = 0.3, T=52, t0.05 (52-2) = 2.01例:P262略8.1.3

16、 虛擬變量的特殊應(yīng)用1、檢驗?zāi)P偷姆€(wěn)定性設(shè)根據(jù)同一總體兩個樣本的估計回歸模型分別為:樣本1:樣本2:D=1 樣本20 樣本1設(shè)置虛擬變量:合并樣本,估計模型:其中:,利用t檢驗判斷兩個虛擬變量系數(shù)的顯著性,可以得到四種檢驗結(jié)果:1) 兩個系數(shù)均等于零,表明兩個回歸模型之間的沒有顯著差異。2) 第一個系數(shù)不等于零,第二個系數(shù)等于零,說明截距不同,稱之為“平行回歸”。3) 第一個系數(shù)等于零,第二個系數(shù)不等于零,說明斜率不同,稱之為“匯合回歸”。4) 兩個系數(shù)均不等于零,表明兩個模型完全不同,稱之為相異回歸。2、分段回歸如:例2。3、混合回歸(即綜合使用時序數(shù)據(jù)和截面數(shù)據(jù))首先檢驗用不同截面的數(shù)據(jù)樣

17、本建立的模型是否穩(wěn)定,如果模型穩(wěn)定,則可合并樣本,綜合使用時序數(shù)據(jù)和截面數(shù)據(jù)。8.2 模型的設(shè)定誤差8.2.1 判斷經(jīng)濟(jì)模型優(yōu)劣的標(biāo)準(zhǔn)1、建模過程:1)根據(jù)經(jīng)濟(jì)理論或?qū)嵺`經(jīng)驗,選擇變量與函數(shù)形式,構(gòu)建理論模型。2)依據(jù)研究對象的性質(zhì),對變量、參數(shù)及隨機(jī)誤差項做出相應(yīng)的先驗假定,作為模型檢驗的標(biāo)準(zhǔn)。3)收集樣本,估計參數(shù)。4)對模型進(jìn)行理論檢驗、統(tǒng)計檢驗及計量經(jīng)濟(jì)學(xué)準(zhǔn)則檢驗,如果滿足先驗假設(shè),接受模型,否則應(yīng)當(dāng)放棄。2、判斷計量經(jīng)濟(jì)模型優(yōu)劣的基本準(zhǔn)則1)模型就力求簡單2)模型可識別3)具有較高的按按擬合集成度4)與理論相一致5)具有較好的超樣本功能8.2.2 模型設(shè)定誤差的類型與后果1、模型遺漏

18、了重要解釋變量如果模型遺漏了重要解釋變量,參數(shù)的估計值將是有偏的,隨機(jī)誤差的估計值也是有偏的,應(yīng)用慣常的檢驗程序,對參數(shù)進(jìn)行顯著性檢驗,容易得出錯誤的結(jié)論,檢驗的結(jié)果不可靠??梢哉f如果遺漏的重要解釋變量的模型,將是一個不可能的模型。例如:設(shè)正確的回歸模型為: (1)我們實(shí)際采用的模型為: (2)假定模型滿足古典假定,則參數(shù)的OLS估計值為:將正確模型代入上式得: =取期望,考慮x1為非隨機(jī)變量,有說明:1)如果遺漏的變量與解釋變量相關(guān),即非零,那么是有偏的,且不一致的。2)如果遺漏的變量與解釋變量無關(guān),是無偏的,但是有偏的。3)隨機(jī)誤差項的方差估計值,也是有偏的。在同樣的樣本下,(1)、(2)

19、式給出的樣本殘差不會相同,因此,如果(1)式給出的正確的估計值,(2)式的估計值應(yīng)是有偏的。4)參數(shù)估計量的方差是方差的有偏估計:如前所述是無偏的,即使兩變量不相關(guān),由于兩式的殘差估計值不相同,。因此,慣常的t檢驗失效。2、模型包含無關(guān)解釋變量如果模型包含無關(guān)解釋變量,參數(shù)的估計值是無偏的、一致、不是有效的估計值,這個模型也可以正確估計隨機(jī)誤差項,慣常的檢驗結(jié)果也是有效的,只是參數(shù)估計量方差增大,精確度降低。例如:設(shè)正確的回歸模型為: (1)我們實(shí)際采用的模型為: (2)采用OLS法對(2)進(jìn)行參數(shù)估計,我們可以得到:由于可知:1) (2)式的參數(shù)估計量是無偏的,一致的估計量2) 同遺漏重要解

20、釋變量一樣,因為:是無效估計量。3、模型的函數(shù)形式設(shè)定錯誤的后果如果將復(fù)雜的函數(shù)形式設(shè)成簡單線性相關(guān)形式,其結(jié)果與遺漏了重要解釋變量相同。例如:將設(shè)成.我們將在x平均值處展開泰勒級數(shù),整理得:式中:其他類推。可見真實(shí)的回歸模型實(shí)質(zhì)上是一個關(guān)于X的高次方程,誤將他設(shè)成線性函數(shù),實(shí)質(zhì)上就是遺漏了方程中的二次項和其余的高次項。8.2.3 模型設(shè)定誤差的檢驗1、包含無關(guān)變量的檢驗如解釋變量與被解釋變量無關(guān),其參數(shù)應(yīng)該為零。因此,如果某解釋變量的和t統(tǒng)計值不顯著,其解釋變量則應(yīng)為無關(guān)變量,應(yīng)從模型中剔除。如果要檢驗X2、X3是否同時應(yīng)包括在模型中,只需檢驗聯(lián)合假設(shè)H0:即可,第三章已介紹了適用的F檢驗。

21、2、遺漏重要解釋變量或采取錯誤函數(shù)形式的的檢驗如果遺漏的重要解釋變量或采取錯誤形式,模型必然不能對經(jīng)濟(jì)現(xiàn)象作出很好的解釋。反映在檢驗結(jié)果上,也一定不顯著,比如較大的殘差,較小的決定系數(shù)和DW統(tǒng)計值。因此可用這些結(jié)果對其進(jìn)行判斷。1)應(yīng)用隨機(jī)誤差項的估計值進(jìn)行檢驗步驟:第一步:計算殘差。第二步:繪制殘差與時間或某解釋變量的散點(diǎn)圖。第三步:判斷。如果殘差呈現(xiàn)有規(guī)律的變動,則說明有可能遺漏了重要變量。2)應(yīng)用DW統(tǒng)計量進(jìn)行檢驗如果遺漏的重要解釋變量,則殘差中應(yīng)包括這個相關(guān)變量,殘差就應(yīng)呈現(xiàn)相關(guān)性。判斷方法為DWdu,存在正相關(guān)。遺漏重要解釋變量。DW(4-du),存在負(fù)相關(guān),遺漏重要解釋變量。duD

22、W(4-du),不存在相關(guān),沒有遺漏重要解釋變量。8.3 隨機(jī)解釋變量問題8.3.1隨想解釋變量問題的概念與來源單方程計量經(jīng)濟(jì)學(xué)模型假定解釋變量為確定性變量,并且與隨機(jī)誤差項不相關(guān),違背這一基本假定的問題被稱為隨機(jī)解釋變量問題。在實(shí)際經(jīng)濟(jì)問題中,經(jīng)濟(jì)變量往往都具有隨機(jī)性。但是在單方程計量經(jīng)濟(jì)學(xué)模型中,凡是外生變量都被認(rèn)為是確定性變量。于是隨機(jī)解釋變量問題主要表現(xiàn)于用滯后被解釋變量作為解釋變量。經(jīng)濟(jì)活動的連貫性,使得這種現(xiàn)象大量存在。例:固定資產(chǎn)投資與國民經(jīng)濟(jì)收入的模型:消費(fèi)與收入之間關(guān)系的模型為:8.3.2 隨機(jī)解釋變量問題對參數(shù)估計的影響以一元線性回歸模型為例,來說明問題。設(shè)一元線性回歸模型

23、: 8.3.1滿足除非隨機(jī)解釋變量外的所有古典假設(shè)。模型中解釋變量為隨機(jī)變量時,其與隨機(jī)誤差項之間的關(guān)系有三種:1)當(dāng)隨機(jī)解釋變量與隨機(jī)誤差項不相關(guān),即。則最小二乘估計的參數(shù)仍是無偏估計。以為例:利用=0,可得:,即:進(jìn)行離差變換:,得:取期望得:,由于 ,所以:,可得:。2)當(dāng)隨機(jī)解釋變量與隨機(jī)誤差項在小樣本下相關(guān),即,在大樣本下漸近無關(guān),即,則在小樣本下是有偏的,在大樣本是一致的。由于在小樣本下,所以,即是有偏估計量。對上式取概率極限,利用漸近無關(guān)性,可得即在大樣本下是一致的估計量。3)當(dāng)隨機(jī)解釋變量與隨機(jī)誤差項相關(guān),并且,則參數(shù)的最小二乘估計是有偏的,且是不一致的。因為:,所以有:由上面的分析可以看出,當(dāng)隨機(jī)解釋變量與隨機(jī)誤差項相關(guān)時,由于模型參數(shù)估計值產(chǎn)生偏誤,造成擬合優(yōu)度檢驗失準(zhǔn)、F檢驗失效,t統(tǒng)計失去意義。8.3.3 隨機(jī)解釋變量的修正方法:工具變量法思路是,當(dāng)隨機(jī)解釋變量與隨機(jī)誤差項相關(guān)時,則尋找另一個變量,該變量與隨機(jī)解釋變量高度相關(guān),但與隨機(jī)誤差項不相關(guān),稱為工具變量,用其替代隨機(jī)解釋變量。1、工具變量的要求作為工具變量,必須滿足以下四個條件

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論