計量經(jīng)濟(jì)學(xué)第二章 經(jīng)典線性回歸模型_第1頁
計量經(jīng)濟(jì)學(xué)第二章 經(jīng)典線性回歸模型_第2頁
計量經(jīng)濟(jì)學(xué)第二章 經(jīng)典線性回歸模型_第3頁
計量經(jīng)濟(jì)學(xué)第二章 經(jīng)典線性回歸模型_第4頁
計量經(jīng)濟(jì)學(xué)第二章 經(jīng)典線性回歸模型_第5頁
已閱讀5頁,還剩113頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第二章第二章 經(jīng)典線性回歸模型經(jīng)典線性回歸模型 (Classical Linear Regression Model)第一節(jié) 線性回歸模型的概念第二節(jié) 線性回歸模型的估計第三節(jié) 擬合優(yōu)度第四節(jié) 非線性關(guān)系的處理第五節(jié) 假設(shè)檢驗(yàn)第六節(jié) 預(yù)測第七節(jié) 虛擬變量第一節(jié) 線性回歸模型的概念 一. 雙變量線性回歸模型 我們在上一章給出的需求函數(shù)的例子 Q =+P + u (2.1)是一個雙變量線性回歸模型,模型中只有兩個變量,一個因變量,一個解釋變量,由解釋變量的變動來解釋因變量的變動,或者說用因變量對解釋變量進(jìn)行線性回歸,因而稱為雙變量線性回歸模型雙變量線性回歸模型,亦稱簡單線簡單線性回歸模型性回歸模型

2、。讓我們再看一個例子。 C =+D + u (2.2) 這是凱恩斯消費(fèi)函數(shù),其中C為消費(fèi)支出,D為個人可支配收入,u為擾動項(xiàng)(或誤差項(xiàng))。4 此模型中,方程左端的消費(fèi)支出(C)為因變量(或被解釋變量),方程右端的個人可支配收入(D)為解釋變量(或自變量)。和是未知參數(shù),由于雙變量線性回歸模型的圖形是一條直線,因而和習(xí)慣上又分別稱為截距和斜率。這里斜率的含義是解釋變量增加一個單位所引起的因變量的變動。例如在(2.2)式中,的含義是個人可支配收入增加一個單位所引起的消費(fèi)的增加量,經(jīng)濟(jì)學(xué)中稱之為邊際消費(fèi)傾向(MPC)。截距的含義是解釋變量為0時的值。截距有時有經(jīng)濟(jì)含義,但大多數(shù)情況下沒有,因此,在計

3、量經(jīng)濟(jì)分析中,通常不大關(guān)注的取值如何。5 在教學(xué)中,我們習(xí)慣上采用Y表示因變量,X表示解釋變量,雙變量線性回歸模型的一般形式為: Y =+X + u 在實(shí)踐中,此模型被應(yīng)用于因變量和解釋變量的一組具體觀測值 和 (t=1,2,n),因而模型表示為: =+ + ut t =1,2,n (2.3) 它表明,對于n個時期t =1,2,n,該模型成立。更一般的形式為: = + + ui , i = 1, 2, .,n (2.4) 即模型對X和Y的n對觀測值(i=1,2,n)成立。 (2.3)式一般用于觀測值為時間序列的情形,在橫截面數(shù)據(jù)的情形,通常采用(2.4) 式。tYtXtYtXiYiX6二、 多

4、元線性回歸模型 在許多實(shí)際問題中,我們所研究的因變量的變動可能不僅與一個解釋變量有關(guān)。因此,有必要考慮線性模型的更一般形式,即多元線性回歸模型: t=1,2,n 在這個模型中,Y由X1、X2、X3、 XK所解釋,有K+1個未知參數(shù)0、1、2、K 。 這里,“斜率”j的含義是其它變量不變的情況其它變量不變的情況下下,Xj改變一個單位對因變量所產(chǎn)生的影響。tktktttXXXYu.221107 例例2.2 2.2 食品需求方程食品需求方程 其中,Y=在食品上的總支出 X=個人可支配收入 P=食品價格指數(shù) 用美國1959-1983年的數(shù)據(jù),得到如下回歸結(jié)果(括號中數(shù)字為標(biāo)準(zhǔn)誤差):u210PXY)1

5、14. 0()003. 0()6 . 9(99. 0739. 0112. 07 .1162RPXY),(數(shù)總消費(fèi)支出價格平減指食品價格平減指數(shù)1001972100PY和X的計量單位為10億美元 (按1972不變價格計算).8多元線性回歸模型中斜率系數(shù)的含義上例中斜率系數(shù)的含義說明如下: 價格不變的情況下,個人可支配收入每上升10億美元(1個billion),食品消費(fèi)支出增加1.12億元(0.112個 billion)。 收入不變的情況下,價格指數(shù)每上升一個點(diǎn), 食品消費(fèi)支出減少7.39億元(0.739個billion)9回到一般模型 t=1,2, ,n即對于n組觀測值,有tktktttXXXY

6、u.22110nKnKnnnnKKKKuXXXXYuXXXXYuXXXXY.33221102232322212102113132121110110其矩陣形式為: 其中 nYYYY.21KnnKKXXXXXXX.1.1.11212111uXYnKuuuu.,.2121011第二節(jié) 線性回歸模型的估計 一經(jīng)典一經(jīng)典線性回歸模型的統(tǒng)計假設(shè)(1)E(ut)=0, t=1,2,n 即各期擾動項(xiàng)的均值(期望值)均為0。均值為0的假設(shè)反映了這樣一個事實(shí):擾動項(xiàng)被假定為對因變量的那些不能列為模型主要部分的微小影響。沒有理由相信這樣一些影響會以一種系統(tǒng)的方式使因變量增加或減小。因此擾動項(xiàng)均值為0的假設(shè)是合理的。

7、 12(2)E(ui uj)=0, ij 即各期擾動項(xiàng)互不相關(guān)。也就是假定它們之間無自相關(guān)或無序列相關(guān)。 實(shí)際上該假設(shè)等同于: cov( ui, uj) = 0, ij這是因?yàn)椋?cov(ui, uj) = Eui - E(ui)uj - E(uj) = E(uiuj) 根據(jù)假設(shè)(1) (3)E(ut2)=2, t=1,2,n 即各期擾動項(xiàng)的方差是一常數(shù),也就是假定各擾動項(xiàng)具有同方差性。這是因?yàn)椋?Var(ut)=Eut-E(ut)2= E(ut2) 根據(jù)假設(shè)(1)13 (4)Xjt是非隨機(jī)量, j=1,2, k t=1,2, n (5)(K+1) n; 即觀測值的數(shù)目要大于待估計的參數(shù)的個數(shù)

8、 (要有足夠數(shù)量的數(shù)據(jù)來擬合回歸線)。(6)各解釋變量之間不存在嚴(yán)格的線性關(guān)系。上述假設(shè)條件可用矩陣表示為以下四個條件:14A1. E(u)=0 A2.由于 顯然, 僅當(dāng) E(ui uj)=0 , ij E(ut2) = 2, t=1,2,n 這兩個條件成立時才成立,因此, 此條件相當(dāng)前面條件(2), (3)兩條,即各期擾動項(xiàng)互不相關(guān),并具有常數(shù)方差。22122212121212121.nnnnnnnuuuuuuuuuuuuuuuuuuuuuuunIuuE2)(nIuuE2)(15A3. X 是一個非隨機(jī)元素矩陣。 A4. Rank(X) = (K+1) n. -相當(dāng)于前面 (5) (6) 兩

9、 條 即矩陣X的秩 =(K+1)0,b0) M = a(r - 2)b這里,變量非線性和參數(shù)非線性并存。對此方程采用對數(shù)變換 logM=loga+blog(r-2) 令Y=logM, X=log(r-2), 1= loga, 2=b 則變換后的模型為: Yt=1+2Xt + ut 64 將OLS法應(yīng)用于此模型,可求得1和2的估計值 ,從而可通過下列兩式求出a和b估計值: 應(yīng)當(dāng)指出,在這種情況下,線性模型估計量的性質(zhì)(如BLUE,正態(tài)性等)只適用于變換后的參數(shù)估計量 ,而不一定適用于原模型參數(shù)的估計量 和 。21,112log( )(e )aab21和a b65 例2.8 上例在確定貨幣需求量的

10、關(guān)系式時,我們實(shí)際上給模型加進(jìn)了一個結(jié)束條件。根據(jù)理論假設(shè),在某一利率水平上,貨幣需求量在理論上是無窮大。我們假定這個利率水平為2%。假如不給這一約束條件,而是從給定的數(shù)據(jù)中估計該利率水平的值,則模型變?yōu)椋?M = a(r - c)b 式中a,b,c均為參數(shù)。仍采用對數(shù)變換,得到 log(Mt) = loga + blog(rt - c) + ut t=1,2,n 我們無法將log(rt-c)定義為一個可觀測的變量X, 因?yàn)檫@里有一個未知量c。也就是說,此模型無法線性化。在這種情況下,只能用估計非線性模型參數(shù)值的方法。66四非線性回歸 模型 Y = a(X - c)b是一個非線性模型,a、b和

11、c是要估計的參數(shù)。此模型無法用取對數(shù)的方法線性化,只能用非線性回歸技術(shù)進(jìn)行估計,如非線性最小二乘法(NLS)。該方法的原則仍然是殘差平方和最小。計量經(jīng)濟(jì)軟件包通常提供這類方法,本書第五章將對非線性回歸方法作較深入的介紹,這里僅給出有關(guān)非線性最小二乘法的大致步驟如下:67非線性回歸方法的步驟1首先給出各參數(shù)的初始估計值(合理猜測值);2用這些參數(shù)值和X觀測值數(shù)據(jù)計算Y的各期預(yù)測 值(擬合 值) ; 3計算各期殘差,然后計算殘差平方和e2; 4對一個或多個參數(shù)的估計值作微小變動; 5計算新的Y預(yù)測值 、殘差平方和e2; 6若新的e2小于老的e2,說明新參數(shù)估計值 優(yōu)于老估計值,則以它們作為新起點(diǎn);

12、 7重復(fù)步驟4,5,6,直至無法減小e2為止。 8最后的參數(shù)估計值即為最小二乘估計值。YY68第五節(jié) 假設(shè)檢驗(yàn) 本節(jié)討論經(jīng)典線性回歸模型的區(qū)間估計和假設(shè)檢驗(yàn)問題。我們的模型是: 在第二節(jié)中我們證明了在擾動項(xiàng)服從正態(tài)分布的假設(shè)(A5)下, j0,1,k 其中 cjj 為矩陣 中的(j1, j1)元素(主對角線上第j1個元素)。 這一結(jié)果為基于OLS估計量的假設(shè)檢驗(yàn)提供了堅實(shí)的基礎(chǔ)。0112233.1,2,.,ttttKKttY X X X Xutnj2(,)jjjNc 1()X X69一、的置信區(qū)間 我們可構(gòu)造一個檢驗(yàn)統(tǒng)計量 該變量服從均值為0、標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布。 與估計量相聯(lián)系的概率分

13、布的標(biāo)準(zhǔn)差,通常稱為標(biāo)標(biāo)準(zhǔn)誤差準(zhǔn)誤差(standard error),用Se表示。 的標(biāo)準(zhǔn)誤差為: ()jjjjjjjjEzccj()()jjjjSeVarc70 如果為已知,則由于檢驗(yàn)統(tǒng)計量z服從標(biāo)準(zhǔn)正態(tài)分布,因而我們可以立即給出總體參數(shù) 的95%的置信區(qū)間為:1.96jjjcj 但實(shí)際上,我們一般無法知道擾動項(xiàng)分布的方差 ,而必須根據(jù)觀測值數(shù)據(jù)估計出 ,然后再來考慮 的置信區(qū)間的計算問題。22j71 1 2 的估計的估計可以證明, 2的無偏估計量是 式中 是殘差平方和,分母是 的自由度,這是因?yàn)槲覀冊诠烙?的過程中,失去了(K+1)個自由度。2. 的置信區(qū)間的置信區(qū)間我們重新定義 的標(biāo)準(zhǔn)誤

14、差為:) 1(22Knetk,. ,102te2tej()jjjSecj72則檢驗(yàn)統(tǒng)計量 不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從自由度為(n-k-1)的t分布,即()jjjjjjjjEtcc()(1)jjjjjjjjEtt nkcc這里n和k分別為觀測值和解釋變量的數(shù)目。故 的(1)置信區(qū)間為: 其中為顯著性水平,通常取0.05。j/2(1)jtnkjjc73例2.9 回到食品需求的例子(例2.2): 其中,Y=在食品上的總支出, X=個人可支配收入 ,P=食品價格指數(shù) 用美國1959-1983年的數(shù)據(jù),得到如下回歸結(jié)果(括號中數(shù)字為標(biāo)準(zhǔn)誤差): 求 的95置信區(qū)間。012uYXP2116.70.11

15、20.7390.99(9.6) (0.003) (0.114)YXPR174由回歸結(jié)果可知, ,我們不難得到 的95置信區(qū)間為:110.112,()0.003Se11/210.025(1)()(252 1)()0.1122.074 0.0030.1120.0062jjtnkSetSe即為0.10580.1182。75二、假設(shè)檢驗(yàn)的邏輯和步驟二、假設(shè)檢驗(yàn)的邏輯和步驟 假設(shè)檢驗(yàn)始于一個給定的假設(shè),即所謂“原假設(shè)”,亦稱“零假設(shè)”,然后計算檢驗(yàn)統(tǒng)計量,這個檢驗(yàn)統(tǒng)計量在原假設(shè)成立的假定下的概率分布是已知的。下一步是判斷計算出的檢驗(yàn)統(tǒng)計量的值是否不大可能來自此分布,如果判斷是不大可能,則表明原假設(shè)不大可

16、能成立。 我們用一個例子來說明上述有關(guān)假設(shè)檢驗(yàn)的思路。設(shè)有一個原假設(shè)規(guī)定 的值為 ,這里 是研究人員選擇的一個值,如果這個原假設(shè)(H0: )成立,我們知道統(tǒng)計量 j0j0jj0j0()jjjtSe76應(yīng)服從自由度為 (n-k-1) 的t分布,即0 (1)()jjjtt nkSe如果原假設(shè)不成立,則備擇假設(shè)H1: 成立。0jj 用于計算t的所有的量都是已知的,可以用估計值 及其標(biāo)準(zhǔn)誤差Se( )算出t的值,因此t可作為檢驗(yàn)統(tǒng)計量用于假設(shè)檢驗(yàn),如果算出的t值絕對值過大,落入t分布的尾部,意味著原假設(shè)不大可能成立,因?yàn)樵谠僭O(shè)成立的情況下,得到這樣一個t值的概率很小。jj77 由上面的說明不難看出,

17、假設(shè)檢驗(yàn)可以說就是檢驗(yàn)是否出現(xiàn)了小概率事件,如果出現(xiàn)小概率事件,則拒絕原來關(guān)于總體參數(shù)的假設(shè);如果檢驗(yàn)表明得到的樣本值并不屬于小概率事件,即若我們的假設(shè)成立,得到該樣本值的概率不算小,則我們不能拒絕原來的假設(shè),或者說,我們“接受”原假設(shè)。 問題是,我們上面提到的概率究竟應(yīng)該小到什么程度才算小。一般說來,這取決于我們愿意承擔(dān)的拒絕一個正確的假設(shè)和接受一個錯誤的假設(shè)這兩方面的風(fēng)險。在實(shí)踐中,一般習(xí)慣于取5%作為拒絕假設(shè)的臨界水平,稱為5%的顯著性水平。78假設(shè)檢驗(yàn)的具體步驟是:(1)建立關(guān)于總體參數(shù)的原假設(shè)和備擇假設(shè);(2)計算檢驗(yàn)統(tǒng)計量,檢驗(yàn)原假設(shè)(是否出現(xiàn)小概率事件);(3)得出關(guān)于原假設(shè)是否

18、合理的結(jié)論。例例2.10 仍用食品需求的例子(例2.2) 2116.70.1120.7390.99(9.6) (0.003) (0.114)YXPR試檢驗(yàn)原假設(shè): 。10.1279原假設(shè): H0:1 = 0.12備擇假設(shè):H1:10.12我們有: 用= n-k-1 = 25-2-1 = 22查t表,截斷兩側(cè)5%面積的t臨界值 tc = 2.074 故拒絕原假設(shè)H0: 。111()tSe0.1120.122.670.003 2.672.074t 80三、系數(shù)的顯著性檢驗(yàn) 在假設(shè)檢驗(yàn)中,有關(guān)斜率系數(shù) 是否為0 的假設(shè)檢驗(yàn)特別重要。如果通過檢驗(yàn),接受 的原假設(shè),則表明Xj和Y沒有關(guān)系,即Xj對Y的變

19、動沒有影響。在這種情況下,可考慮從模型中剔除Xj。 這類檢驗(yàn)稱為系數(shù)的顯著性檢驗(yàn)系數(shù)的顯著性檢驗(yàn)。1單個系數(shù)顯著性檢驗(yàn) 目的是檢驗(yàn)?zāi)硞€解釋變量的系數(shù)j是否為0,即該解釋變量是否對因變量有影響。 原假設(shè) H0: j=0 備擇假設(shè) H1: j0j0j81單個系數(shù)顯著性檢驗(yàn)的檢驗(yàn)統(tǒng)計量是自由度為 n-k-1 的 t 統(tǒng)計量: t(n-k-1)其中, 為矩陣 主對角線上第 j+1個元素。而)()(jjjjVarSet)(jVar21)(XX1122knXYYYknet82 例例2.11 仍用食品需求的例子(例2.2),回歸結(jié)果如下(括號中數(shù)字為標(biāo)準(zhǔn)誤差): 試檢驗(yàn)價格的系數(shù)的顯著性。解: 原假設(shè) H0

20、: 備擇假設(shè) H1: 查t表, 故拒絕原假設(shè)H0。結(jié)論: 顯著異于0,P對Y有影響。2116.70.1120.7390.99(9.6) (0.003) (0.114)YXPR2020222222200.7396.480.114()()()tSeSeSe 0.025(22)2.074,ctt6.482.074,t 2832若干個系數(shù)的顯著性檢驗(yàn)(聯(lián)合假設(shè)檢驗(yàn)) 有時需要同時檢驗(yàn)若干個系數(shù)是否為0,這可以通過建立單一的原假設(shè)來進(jìn)行。 設(shè)要檢驗(yàn)g個系數(shù)是否為0,即與之相對應(yīng)的g個解釋變量對因變量是否有影響。不失一般性,可設(shè)原假設(shè)和備擇假設(shè)為: H0: 1 =2 = =g =0 H1: H0不成立 (

21、即X1, Xg中某些變量對Y有 影響)84分析: 這實(shí)際上相當(dāng)于檢驗(yàn)g個約束條件 1= 0,2 = 0, ,g = 0 是否同時成立。若H0為真,則正確的模型是: 據(jù)此進(jìn)行回歸(有約束回歸),得到殘差平方和 SR是H0為真時的殘差平方和。 tKtKtggtXXYu.1102110.KtRktgRgRtRXXYS85若H1為真,正確的模型即原模型:tKtKttXXYu.110據(jù)此進(jìn)行無約束回歸(全回歸),得到殘差平方和S是H1為真時的殘差平方和。2k110.KtttXXYS86 如果H0為真,則不管X1, Xg這g個變量是否包括在模型中,所得到的結(jié)果不會有顯著差別,因此應(yīng)該有: S SR如果H1

22、為真,則由上一節(jié)中所討論的殘差平方和e2的特點(diǎn),無約束回歸增加了變量的個數(shù),應(yīng)有 S SR 通過檢驗(yàn)二者差異是否顯著地大,就能檢驗(yàn)原假設(shè)是否成立。87所使用的檢驗(yàn)統(tǒng)計量是: F(g, n-k-1)其中, g為分子自由度, n-k-1為分母自由度。使用 的作用是消除具體問題中度量單位的影響, 使計算出的 F 值是一個與度量單位無關(guān)的量。)1(KnSgSSFRSSSR88例2.12 給定20組Y, X1, X2, X3的觀測值,試檢驗(yàn)?zāi)P?中X1和X3對Y是否有影響?解:(1)全回歸 估計 得到:S =e2 = 25 (2)有約束回歸 估計 得到:SR =e2 = 30tttttXXXYu3322

23、110tttXYu220tttttuXXXY332211089 原假設(shè) H0: 1 = 3 = 0 備擇假設(shè) H1: H0不成立 我們有:n=20, g=2, k=3 6.1162522530)1(KnSgSSFR用自由度(2,16)查F分布表,5%顯著性水平下, F=1.6 FC =3.63, 故接受H0。 結(jié)論:X1和X3對Y無顯著影響3.63cF 903全部斜率系數(shù)為0的檢驗(yàn) 上一段結(jié)果的一個特例是所有斜率系數(shù)均為0的檢驗(yàn),即回歸方程的顯著性檢驗(yàn): H0: 1 =2 = = K K = 0 也就是說,所有解釋變量對Y均無影響。 注意到 g=K, 則該檢驗(yàn)的檢驗(yàn)統(tǒng)計量為: 2)(YYSR)

24、1()()1()(222KneKeYYKnSKSSFR91 分子分母均除以 ,有2)(YY1)()(12222KnYYeKYYeF) 1()1 (22KnRKR 從上式不難看出,全部斜率為0的檢驗(yàn)實(shí)際是檢驗(yàn)R2的值是否顯著異于0,如果接受原假設(shè),則表明因變量的行為完全歸因于隨機(jī)變化。若拒絕原假設(shè),則表明所選擇模型對因變量的行為能夠提供某種程度的解釋。92四四檢驗(yàn)其他形式的系數(shù)約束條件 上面所介紹的檢驗(yàn)若干個系數(shù)顯著性的方法,也可以應(yīng)用于檢驗(yàn)施加于系數(shù)的其他形式的約束條件,如 檢驗(yàn)的方法仍是分別進(jìn)行有約束回歸和無約束回歸,求出各自的殘差平方和 SR 和 S,然后用 F 統(tǒng)計量進(jìn)行檢驗(yàn)。 當(dāng)然,單

25、個系數(shù)的假設(shè)檢驗(yàn),如 H0: 3=1.0,亦可用t檢驗(yàn)統(tǒng)計量進(jìn)行檢驗(yàn)。1,11,5 . 2, 0 . 132434293例2.13 Cobb-Douglas生產(chǎn)函數(shù) Y=AKL 試根據(jù)美國制造業(yè)1899-1922年數(shù)據(jù)檢驗(yàn)規(guī)模效益不變的約束:+=1解:(1)全回歸 2log0.180.23log0.81log:(0.43)(0.06)(0.15)0.962520.0710YKLSeRFRSS94(2)有約束回歸: 將約束條件代入,要回歸的模型變?yōu)椋?Y=AKL1- 為避免回歸系數(shù)的不一致問題, 兩邊除以L,模型變換為: Y/L=A(K/L) 回歸,得:2log( / )0.020.25log(

26、/ ):(0.02)(0.04)0.6338.00.0716Y LK LSeRFRSS95 由回歸結(jié)果得到的約束回歸和全回歸的殘差平方和分別為 SR=0.0716 S=0.0710 (3)檢驗(yàn) 原假設(shè) H0:+1 備擇假設(shè) H1:+1 本例中,g=1, K=2, n=24 18. 0210710. 010710. 00716. 0) 1(KnSgSSFR96 用自由度(1,21)查F表,5%顯著性水平下, Fc=4.32 F=0.18 Fc=4.32 故接受原假設(shè)H0:+1 (4)結(jié)論 我們的數(shù)據(jù)支持規(guī)模收益不變的假設(shè)。97五、回歸結(jié)果的提供和分析五、回歸結(jié)果的提供和分析1. 回歸結(jié)果提供的格

27、式回歸結(jié)果提供的格式 在論文、專著或報告中提供回歸分析結(jié)果時一般應(yīng)采用簡潔而通行的格式,以便于交流。通行的格式有以下兩種:(1) 這里116.7、0.112和0.739分別為常數(shù)項(xiàng)和兩個斜率系數(shù)的估計值, 括號中提供的是 的標(biāo)準(zhǔn)誤差。2116.70.1120.7390.99(9.6) (0.003) (0.114)YXPR012、 和982116.70.1120.7390.99(12.17) (37.33) ( 6.48)YXPR(2)括號中數(shù)字分別是原假設(shè) 、 和 成立時的t值。 由此可見,這兩種格式的唯一區(qū)別就在于括號中數(shù)字的含義不同。正因?yàn)槿绱?,人們在論文或著作中提供回歸結(jié)果時,必須在適

28、當(dāng)?shù)胤秸f明括號中數(shù)字是標(biāo)準(zhǔn)誤差還是t值。 需要說明的是,提供回歸結(jié)果的標(biāo)準(zhǔn)格式中一般還包括檢驗(yàn)一階自相關(guān)的DW檢驗(yàn)值,我們將在下一章“自相關(guān)”一節(jié)中介紹。0:00H0:10H0:20H992. 回歸結(jié)果的分析回歸結(jié)果的分析結(jié)果的分析主要包括以下內(nèi)容:(1)系數(shù)估計值。首先是分析系數(shù)的符號是否正確,系數(shù)值的大小是否恰當(dāng),是否符合理論預(yù)期和常識。上一段例中斜率系數(shù)一正一負(fù),符合經(jīng)濟(jì)理論,數(shù)值大小也大致合理。(2)擬合情況。例中 很高,擬合較理想。(3)系數(shù)的顯著性。例中斜率系數(shù)的t值分別為37.33和6.48,表明這些系數(shù)顯著異于0,X和P對Y有影響。(4)根據(jù)DW檢驗(yàn)值說明是否存在擾動項(xiàng)的自相關(guān)

29、。如何說明,將在下一章中介紹。2R100第六節(jié) 預(yù)測 我們用OLS法對多元回歸模型的參數(shù)進(jìn)行了估計之后,如果結(jié)果理想,則可用估計好的模型進(jìn)行預(yù)測。預(yù)測指的是對諸自變量的某一組具體值 來預(yù)測與之相對應(yīng)的因變量值 。當(dāng)然,要進(jìn)行預(yù)測,有一個假設(shè)前提應(yīng)當(dāng)滿足,即擬合的模型在預(yù)測期也成立。 ).1 (02010kXXXC 0Y101 點(diǎn)預(yù)測值由與給定的諸X值對應(yīng)的回歸值給出,即 而預(yù)測期的實(shí)際Y值由下式給出: 其中u0是從預(yù)測期的擾動項(xiàng)分布中所取的值。.020210100CXXXYkk00020210100.uCuXXXYkk102預(yù)測誤差可定義為:000YYe)(0Cu0)()()(00ECuEeE

30、0 CY兩邊取期望值,得因此,OLS預(yù)測量是一個無偏預(yù)測量。0()uC103 預(yù)測誤差的方差為:)(1()()()()(1221200CXXCCXXCCVarCuVareVar)()(000eSeeEe) 1 , 0()(110NCXXCe從 e0 的定義可看出, e0 為正態(tài)變量的線性函數(shù),因此,它本身也服從正態(tài)分布。故104由于 為未知,我們用其估計值代替它,有 則 的95%置信區(qū)間為:即 ) 1(2knet)1()(1100kntCXXCYY100.0251()YtCXXC0YCXXCtC1025.0)(1105例例2.14 用例2.4的數(shù)據(jù),預(yù)測X2=10,X3=10的Y值。 解: 由

31、例2.4我們已得到: 14)10(5 . 1)10(5 . 240Y7 . 6101014/102/382/3110/45810/4510/267)10101 ()(1CXXC5 .106XY108YY106因此 的95%置信區(qū)間為: 或 3.66至24.34之間.75. 01255 .1061081122knXYYYknet0Y7 .6175.0303.414107 第七節(jié) 虛擬變量(Dummy variables)一虛擬變量的概念 在回歸分析中,常常碰到這樣一種情況,即因變量的波動不僅依賴于那種能夠很容易按某種尺度定量化的變量(如收入、產(chǎn)出、價格、身高、體重等),而且依賴于某些定性的變量(

32、如性別、地區(qū)、季節(jié)等)。 在經(jīng)濟(jì)系統(tǒng)中,許多變動是不能定量的。如政府的更迭(工黨-保守黨)、經(jīng)濟(jì)體制的改革、固定匯率變?yōu)楦訁R率、從戰(zhàn)時經(jīng)濟(jì)轉(zhuǎn)為和平時期經(jīng)濟(jì)等。 108 這樣一些變動都可以用0-1變量來表示,用1表示具有某一“品質(zhì)”或?qū)傩裕?表示不具有該“品質(zhì)”或?qū)傩?。這種變量在計量經(jīng)濟(jì)學(xué)中稱為“虛擬變量虛擬變量”。虛擬變量使得我們可以將那些無法定量化的變量引入回歸模型中。 下面給出幾個可以引入虛擬變量的例子。例1:你在研究學(xué)歷和收入之間的關(guān)系,在你的樣本中,既有女性又有男性,你打算研究在此關(guān)系中,性別是否會導(dǎo)致差別。109例2:你在研究某省家庭收入和支出的關(guān)系,采集的樣本中既包括農(nóng)村家庭,

33、又包括城鎮(zhèn)家庭,你打算研究二者的差別。例3:你在研究通貨膨脹的決定因素,在你的觀測期中,有些年份政府實(shí)行了一項(xiàng)收入政策。你想檢驗(yàn)該政策是 否對通貨膨脹產(chǎn)生影響。 上述各例都可以用兩種方法來解決,一種解決方法是分別進(jìn)行兩類情況的回歸,然后檢驗(yàn)參數(shù)是否不同。另一種方法是用全部觀測值作單一回歸,將定性因素的影響用虛擬變量引入模型。 110二虛擬變量的使用方法1 截距變動 設(shè)Y表示消費(fèi),X表示收入,我們有: 假定不變。 對于5年戰(zhàn)爭和5年和平時期的數(shù)據(jù),我們可分別估計上述兩個模型,一般將給出 的不同值。 現(xiàn)引入虛擬變量D, 將兩式并為一式: 其中, XYuXY21和平時期:戰(zhàn)時:uDXY210 0 戰(zhàn)戰(zhàn) 時時D = 1 平平 時時111 此式等價于下列兩式: 截距變動,斜率不變 在包含虛擬變量的模型中,D的數(shù)據(jù)為0,0,0,0,0,1,1,1,1,1。 估計結(jié)果如下圖所示: 應(yīng)用t檢驗(yàn),2是否顯著 可以表明截距項(xiàng)在兩個時 期是否有變化。uXYuXY12010平時:戰(zhàn)時: Y 平 時 戰(zhàn) 時 2-1=2 1=0 X1122 斜率變動 如果我們認(rèn)為戰(zhàn)時和平時的消費(fèi)函數(shù)中,截距項(xiàng)不變,而斜率不同,即變動,則可用下面的模型來研究兩個時期邊際消費(fèi)傾向的差異: 其中,D= 不難看出,上式相當(dāng)于下列兩式: 同樣,包括虛擬變量的模型中,2是否顯著可以表明斜率在兩個時期是否變化。uD

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論