第三章多元線性回歸模型(研究生)_第1頁
第三章多元線性回歸模型(研究生)_第2頁
第三章多元線性回歸模型(研究生)_第3頁
第三章多元線性回歸模型(研究生)_第4頁
第三章多元線性回歸模型(研究生)_第5頁
已閱讀5頁,還剩108頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1第三章經典單方程計量經濟學模型:多元線性回歸模型§3.1多元線性回歸模型§3.2多元線性回歸模型的參數估計§3.3多元線性回歸模型的統計檢驗§3.4多元線性回歸模型的預測§3.5

可化為線性的多元非線性回歸模型

§3.6受約束回歸2§3.1多元線性回歸模型一、多元線性回歸模型

二、多元線性回歸模型的基本假定

3一、多元線性回歸模型多元線性回歸模型:表現在線性回歸模型中的解釋變量有多個。一般表現形式:其中:k為解釋變量的數目,

j稱為回歸參數。習慣上:把常數項看成為一個虛變量的參數,該虛變量的樣本觀測值始終取1。這樣:模型中解釋變量的數目為(k+1)(3.1.1)(3.1.1)也被稱為總體回歸函數的隨機表達形式非隨機表達式為:(3.1.2)4多元回歸分析是以多個解釋變量的給定值為條件的回歸分析各變量X值固定時Y的平均響應。

j也被稱為偏回歸系數,表示在其他解釋變量保持不變的情況下,Xj每變化1個單位時,Y的均值E(Y)的變化;或者說

j給出了Xj的單位變化對Y均值的“直接”或“凈”(不含其他變量)影響。5給出一組(n個)觀測值則總體多元線性回歸模型可以表示為下面的方程組:將方程組寫成矩陣的形式:(3.1.3)多元總體線性回歸模型矩陣表示設多元總體線性回歸模型矩陣表示為:(3.1.4)6樣本回歸函數形式用估計樣本回歸函數來近似代表總體回歸函數樣本回歸函數的形式其隨機表示式:e稱為殘差或剩余項,可看成是總體回歸函數中隨機擾動項

的近似替代。樣本回歸函數的矩陣表達:(3.1.5)(3.1.6)在一個容量為n樣本下,(3.1.5)和(3.1.6)可以表示如下(3.1.8)(3.1.7)7樣本線性回歸模型矩陣形式設多元樣本線性回歸模型矩陣形式為:(3.1.9)(3.1.10)89二、多元線性回歸模型的基本假定

假設1:回歸模型是正確設定的。假設2:解釋變量是非隨機的或固定的,且各X之間互不相關(無多重共線性)。假設3:樣本容量趨于無窮時,各解釋變量的方差趨于有界常數,即n+∞時,

10二、多元線性回歸模型的基本假定

假設4:隨機誤差項具有零均值、同方差及不序列相關性

假設5:解釋變量與隨機項不相關假設6:隨機項滿足正態(tài)分布1011假定的矩陣形式

上述假設的矩陣符號表示式:

假設2,n(k+1)矩陣X是非隨機的,且X的秩(X)=k+1,即X列滿秩。假設3,n+∞時,

其中:Q為一非奇異固定矩陣,矩陣x是由各解釋變量的離差為元素組成的n

k階矩陣1112假設4:13假設5:假設6,向量

有一多維正態(tài)分布,即

14類似一元回歸模型,上述條件均可寫成非條件期望與方差形式根據這些條件,可以得到或寫為當時

當時

1415§3.2多元線性回歸模型的估計估計方法:OLS、ML或者MM一、普通最小二乘估計*二、最大或然估計*三、矩估計四、參數估計量的性質五、樣本容量問題六、估計實例

16一、普通最小二乘估計對于隨機抽取的n組觀測值如果樣本函數的參數估計值已經得到,則有:i=1,2…,n樣本回歸的隨機形式(3.2.1)(3.2.3)根據最小二乘原理,參數估計值應使殘差平方和達到最小(3.2.2)17根據微積分知識,需對Q關于待估參數求偏導數,并且令其為0。則18于是得到關于待估參數估計值的正規(guī)方程組:(3.2.4)k+1元線性方程組(3.2.3)稱為正則方程組,解該線性方程組方程,可得k+1個待估參數的估計值19正規(guī)方程組轉化為:1920正規(guī)方程組即可以將正規(guī)方程組寫成矩陣形式其中(3.2.5)由于X的列滿秩性,可得為滿秩對稱矩陣,故有(3.2.6)21根據最小二乘原理,需要尋找一組參數估計,使殘差平方和將上述過程用矩陣表示如下:最小,因此應該是方程組的解注意:是一個標量,顧是對稱矩陣22例3.2.1:在例2.3.1的家庭收入-消費支出例中,

可求得于是P37離差形式的普通最小二乘估計正規(guī)方程組另一種形式對于正規(guī)方程組

將(3.1.10)代入得(3.2.7)或(3.2.8)是多元線性回歸模型正規(guī)方程組的另一種寫法由此容易得到多元回歸分析中樣本回歸模型的離差形式或(3.2.8)求均值得:(3.2.2)(3.2.7)(3.2.7)382324記:在離差形式下,參數的最小二乘估計結果為用方程(3.2.3)減(3.2.7)得:有:(3.2.8)(3.2.8)的矩陣形式:(3.2.9)其中(3.2.10)25?隨機誤差項

的方差

的無偏估計

證明,隨機誤差項

的方差的無偏估計量為

證明根據(3.1.4),(3.1.10)和(3.2.6)殘差平方和(3.2.12)其中為對稱等冪矩陣tr()表示為矩陣的跡,其定義為矩陣主對角線元素之和(3.2.11)44對于殘差e可證*二、最大或然估計對于多元線性回歸模型由于的隨機抽取的n組樣本觀測值的聯合概率為即為變量Y的或然函數

所以其中:(3.2.13)26對數或然函數為對對數或然函數求極大值,也就是對

求極小值。因此,參數的最大或然估計為結果與參數的普通最小二乘估計相同,與一元回歸相仿有多遠線性回歸下隨機干擾項方差的估計如下(3.2.14)(3.2.15)(3.2.16)27*三、矩估計(MomentMethod,MM)

OLS估計是通過得到一個關于參數估計值的正規(guī)方程組并對它進行求解而完成的。該正規(guī)方程組

可以從另外一種思路來導:

求期望

:28稱為原總體回歸方程的一組矩條件,表明了原總體回歸方程所具有的內在特征。

由此得到正規(guī)方程組

解此正規(guī)方程組即得參數的MM估計量。易知MM估計量與OLS、ML估計量等價。29矩方法是工具變量方法(InstrumentalVariables,IV)和廣義矩估計方法(GeneralizedMomentMethod,GMM)的基礎在矩方法中關鍵是利用了

E(X’)=0

如果某個解釋變量與隨機項相關,只要能找到1個工具變量,仍然可以構成一組矩條件。這就是IV。

如果存在>k+1個變量與隨機項不相關,可以構成一組包含>k+1方程的矩條件。這就是GMM。3031

四、參數估計量的性質

在滿足基本假設的情況下,其結構參數

的普通最小二乘估計、最大或然估計及矩估計仍具有:

線性性、無偏性、有效性。

同時,隨著樣本容量增加,參數估計量具有:

漸近無偏性、漸近有效性、一致性。

四、參數估計量的性質

1、線性性是的線性函數

證其中僅與固定的X有關,其實也是的線性函數。即是的線性函數,同時也是的線性函數

2、無偏性

(3.2.18)(3.2.17)32

3、有效性(最小方差性)

(3.2.19)根據無偏性和(3.2.17)設是其他方法得到的關于線性無偏估計量為固定矩陣,于是由無偏62333、有效性(最小方差性)為主對角線元素非負的對稱矩陣,由此得到;3、

根據無偏性和有效性證明可得(3.2.20)(3.2.21)3435

五、樣本容量問題

所謂“最小樣本容量”,即從最小二乘原理和最大或然原理出發(fā),欲得到參數估計量,不管其質量如何,所要求的樣本容量的下限。⒈

最小樣本容量

樣本最小容量必須不少于模型中解釋變量的數目(包括常數項),即

n

k+1因為,無多重共線性要求:秩(X)=k+1存在要求既要求為k+1滿秩,而故要求而X為n×k+1階矩陣,此時必須有n

k+1362、滿足基本要求的樣本容量

從統計檢驗的角度:

n

30時,Z檢驗才能應用;

n-k8時,t分布較為穩(wěn)定

一般經驗認為:

當n

30或者至少n3(k+1)時,才能說滿足模型估計的基本要求。

模型的良好性質只有在大樣本下才能得到理論上的證明37

六、多元線性回歸模型的參數估計實例

例2.6.1中,已建立了中國居民人均消費一元線性模型。這里我們再考慮建立多元線性模型。P7238§3.3多元線性回歸模型的統計檢驗

一、擬合優(yōu)度檢驗二、方程的顯著性檢驗(F檢驗)

三、變量的顯著性檢驗(t檢驗)四、參數的置信區(qū)間

39

一、擬合優(yōu)度檢驗1、可決系數與調整的可決系數則

總離差平方和的分解40由于

=0所以有:

注意:一個有趣的現象(3.3.1)用到正則方程(3.2.8)2141多元線性回歸總離差平方和的分解式

TSS=RSS+ESS

總離差平方和=

殘差平方和+

回歸平方和其中:TSS反映被解釋變量觀測值總離差的大小;

ESS反映被解釋變量回歸估計值說明的總離差的大小,它是TSS中由樣本回歸線可以解釋的部分;

RSS反映被解釋變量觀測值與估計值之間的總離差,它是TSS中未被解釋的那部分離差;可決系數該統計量越接近于1,模型的擬合優(yōu)度越高。(3.3.2)42

問題:在應用過程中發(fā)現,如果在模型中增加一個解釋變量,R2往往增大(Why?)

這就給人一個錯覺:要使得模型擬合得好,只要增加解釋變量即可。但是,現實情況往往是,由增加解釋變量個數引起的R2的增大與擬合好壞無關,R2需調整。

調整的可決系數(adjustedcoefficientofdetermination)

在樣本容量一定的情況下,增加解釋變量必定使得自由度減少,所以調整的思路是:

將殘差平方和與總離差平方和分別除以各自的自由度,以剔除變量個數對擬合優(yōu)度的影響:(3.3.3)43(1)用自由度調整后,可以消除擬合優(yōu)度評價中解釋變量多少對決定系數計算的影響;(2)對于包含的解釋變量個數不同的模型,可以用調整后的決定系數直接比較它們的擬合優(yōu)度的高低。模型的擬合優(yōu)度并不是判斷模型質量的唯一標準,有時甚至為追求模型的經濟意義,可以犧牲一點擬合優(yōu)度。(3.3.4)赤馳信息準則和施瓦茨準則為了比較所含解釋變量個數不同的多遠回歸模型的擬合優(yōu)度,常用的標準還有赤馳信息準則(AkaikeInformationCriterionAIC)和施瓦茨準則(SchwarzCriterionSC),其定義為(3.3.4)(3.3.5)這兩個準則均要求僅當增加的解釋變量能減少AIC和SC值EViews給出這兩個值4445模型的擬合優(yōu)度并不是判斷模型質量的唯一標準,有時甚至為追求模型的經濟意義,可以犧牲一點擬合優(yōu)度。(3.3.7)離差和的性質*總離差平方和:回歸離差平方和:表示一個元素全為1的方陣同時其中殘差平方和:因為為等冪矩陣2346總離差平方和:回歸離差平方和:殘差平方和:方差來源平方和SS自由度MSS均方回歸平方和ESSkESS/k殘差平方和RSSn-k-1RSS/n-k-1總平方和TSSn-1方差分析表494748

二、方程的顯著性檢驗(F檢驗)

方程的顯著性檢驗,旨在對模型中被解釋變量與解釋變量之間的線性關系在總體上是否顯著成立作出推斷。

1、方程顯著性的F檢驗

即檢驗模型

Yi=

0+

1Xi1+

2Xi2++

kXik+

ii=1,2,,n中的參數

j是否顯著不為0。

多個解釋變量聯合對被解釋變量是否有顯著影響可提出如下原假設與備擇假設:H0:

0=1=2==k=0H1:

j不全為0注意,不包含

049

F檢驗的思想來自于總離差平方和的分解式:

TSS=ESS+RSS=回歸平方和+殘差平方和由于回歸平方和ESS是解釋變量X的聯合體對被解釋變量Y的線性作用的結果,考慮比值

如果這個比值較大,則X的聯合體對Y的解釋程度高,可認為總體存在線性關系,反之總體上可能不存在線性關系。

因此,可通過該比值的大小對總體線性關系進行推斷。根據數理統計知識,(證明比較難)在H0成立的條件下,有(3.3.8)4750aF

(k,n-k-1)0拒絕H0不能拒絕H0F

(1)給定顯著性水平

,查得臨界值F

(k,n-k-1);

(2)由樣本求出統計量F的數值;(3)通過F值與臨界值進行比較

F

F

(k,n-k-1)或F

F

(k,n-k-1)來拒絕或接受原假設H0,以判定原方程總體上的線性關系是否顯著成立。F檢驗的具體步驟為:例3.2.2中,計算F=560.57給定顯著水平α=0.05,查F表得F0.05(2,28)=3.34,例中解釋變量2個,樣本容量31,因為

F0.05(2,28)>3.34,拒絕原假設,線性關系成立512、關于擬合優(yōu)度檢驗與方程顯著性檢驗關系的討論

擬合優(yōu)度檢驗和方程總體線性的顯著性檢驗是從不同原理出發(fā)的兩類檢驗;擬合優(yōu)度檢驗是從已經得到估計的模型出發(fā),檢驗它對樣本觀測值的擬合程度;方程的F檢驗是從樣本觀測值出發(fā)檢驗模型總體線性關系的顯著性;但是兩者又是關聯的,擬合程度高,總體線性關系的顯著性就強。52由由上式可得:(3.3.9)R2與F之間的關系53因此,F檢驗是所估計回歸的總體顯著性的一個度量,也是R2的顯著性的檢驗(即R2是否顯著不為0)也就是檢驗

H0:

0=1=2==k=0

等價于檢驗R2=0因此,這樣計算F值更簡便(3.3.10)54例如:用F檢驗通過了總體模型的線性關系在95%的置信度下是顯著成立的。然而利用計算的到的值為0.1354;如果我們先得到肯定認為模型質量不高,卻不知道實際總體線性關系的顯著性水平達到95%。因此,在應用中不必過分苛求調整的可決系數,重要的是考察模型的經濟關系是否合理。55

三、變量的顯著性檢驗(t檢驗)

對于多元線性回歸模型,方程的總體線性關系顯著

每個解釋變量對被解釋變量的影響都是顯著的

因此,必須對每個解釋變量進行顯著性檢驗,以決定是否作為解釋變量被保留在模型中。

這一檢驗是由對變量的t檢驗完成的?;貧w參數的顯著性檢驗,目的在于檢驗當其他解釋變量不變時,該回歸系數對應的解釋變量是否對因變量有顯著影響。56根據回歸系數的估計量服從如下正態(tài)分布:1、t統計量

cii表示矩陣(X’X)-1

主對角線上的第i個元素;根據(3.2.12)第二章中給出對于來自單一樣本的估計值的t統計量是σ2的無偏估計量(3.3.11)57

2、t檢驗

設計原假設與備擇假設:

給定顯著性水平

,可得到臨界值t/2(n-k-1),由樣本求出統計量t的數值,通過

|t|

t/2(n-k-1)(拒絕域)或|t|

t/2(n-k-1)(接受域)來拒絕或接受原假設H0,從而判定對應的解釋變量是否應包括在模型中。H0:

i=0

H1:

i

0

(i=1,2…k)

構造統計量(3.3.12)58注意:一元線性回歸中,t檢驗與F檢驗一致

一方面,t檢驗與F檢驗都是對相同的原假設H0:

1=0

進行檢驗;

另一方面,兩個統計量之間有如下關系:例3.2.2中,已計算出兩個變量X1和X2=的t值分別為給定顯著水平α=0.05,查t表中自由度28得由于拒絕原假設,變量顯著性通過59四、參數的置信區(qū)間

參數的置信區(qū)間用來考察:在一次抽樣中所估計的參數值離參數的真實值有多“近”。在變量的顯著性檢驗中已經知道:容易推出:在(1-)的置信水平下

I的置信區(qū)間是其中,t/2為顯著性水平為

、自由度為n-k-1的臨界值。=(3.3.13)60

在例3.2.2中,p73給定

=0.05,查表得臨界值:t0.025(28)=2.048計算得參數的置信區(qū)間:

1

:(0.4014,0.7098)

2

:(0.0174,0.4828)

從回歸計算中已得到:61如何才能縮小置信區(qū)間?

增大樣本容量n,因為在同樣的樣本容量下,n越大,t分布表中的臨界值越小,同時,增大樣本容量,還可使樣本參數估計量的標準差減小;提高模型的擬合優(yōu)度,模型優(yōu)度越高,殘差平方和應越小。如果完全擬合,置信區(qū)間長度為0提高樣本觀測值的分散度,一般情況下,樣本觀測值越分散,

越小,使減小。62§3.4多元線性回歸模型的預測一、E(Y0)的置信區(qū)間

二、Y0的置信區(qū)間對于模型給定樣本以外的解釋變量的觀測值X0=(1,X01,X02,…,X0k),可以得到被解釋變量的預測值:

它可以是總體均值E(Y0)或個值Y0的預測。但嚴格地說,這只是被解釋變量的預測值的估計值,而不是預測值。為了進行科學預測,還需求出預測值的置信區(qū)間,包括E(Y0)和Y0的置信區(qū)間。以一定的概率出現的區(qū)間63一、E(Y0)的置信區(qū)間易知

32標量,非向量64于是,得到(1-)的置信水平下E(Y0)的置信區(qū)間:

其中,t/2為(1-)的置信水平下的臨界值。65

二、Y0的置信區(qū)間

如果已經知道實際的預測值Y0,那么預測誤差為:容易證明31(3.2.17)標量,非向量66e0服從正態(tài)分布,即

構造t統計量

可得給定(1-)的置信水平下Y0的置信區(qū)間:

67P72例3.2.2,假設某城鎮(zhèn)居民家庭2006年人均可支配收入(X1)為20000元,其2005年人均消費支出(X2)為14000元,則對該家庭2006年人均居民消費支出進行預測。根據題意,則該家庭2006年人均居民消費支出預測值為:就全國平均情況來看,可求出當面平均的人均消費支出預測值的置信區(qū)間。68預測的置信區(qū)間:在95%的置信水平下E(Y0)的置信區(qū)間:于是E(?)的95%的置信區(qū)間為:69同樣,就人均可支配收入20000元,也易得2006年人均消費支出Y0的95%的置信區(qū)間為:

需要指出的是:“如果給定解釋變量的值,根據模型就可以得到被解釋變量的預測值為。。。”,這樣的說法是不科學的,也是計量經濟學模型無法達到的。如果一定要給出一個具體的預測值,那么它的置信度為0;如果一定要回答以100%的置信度處在什么區(qū)間中,那么這個區(qū)間是(-∞,+∞)70§3.5可化為線性的多元非線性回歸模型

一、模型的類型與變換二、可化為線性的非線性回歸實例71

在實際經濟活動中,經濟變量的關系是復雜的,直接表現為線性關系的情況并不多見。

如著名的恩格爾曲線(Englecurves)表現為冪函數曲線形式、宏觀經濟學中的菲利普斯曲線(Pillips

cuves)表現為雙曲線形式等。但是,大部分非線性關系又可以通過一些簡單的數學處理,使之化為數學上的線性關系,從而可以運用線性回歸的方法進行計量經濟學方面的處理。一、模型的類型與變換

1、倒數模型、多項式模型與變量的直接置換法

(1)倒數模型(雙曲線模型):這是一個變量之間是非線性的模型,因為是以倒數形式進入模型的,但這個模型卻是參數線性模型,因為模型中參數之間是線性的。令X*=1/X,得Y=a+bX*令Y*=1/Y,X*=1/X,得Y*=a+bX*有一些非線性的模型通過適當的變換就可以化為標準線性模型,這種模型稱為可線性化模型(3.5.1)(3.5.2)7273例如,商品的需求曲線是一種雙曲線形式,商品的需求量Q與商品價格P的關系變現為:令Y=1/Q,X=1/P,進行置換得:Y=a+bX+μ

(2)多項式模型

Y=a+b1X+b2X2

+b3X3

+…+bk

Xk

模型非線性的,但其參數卻是線性的,因此它是線性回歸模型令Xt

=Xt得:y=a+b1X1+b2X2+

b3X3+…+

bk

Xk

模型轉化為多元線性回歸模型例如,描述稅收s與稅率r關系的拉弗曲線:

s=a+br+cr2+μ

c<0設X1=r,X2=r2,則原方程變換為

s=a+bX1+cX2+μc<0

(3.5.3)(3.5.4)(3.5.5)(3.5.6)742、冪函數模型、指數函數模型與函數變換法

(1)冪函數曲線模型:Y=aXbb>10<b<1b=1a>00xya1a>0yx0b<0a1在這個模型中,變量X是非線性的冪函數:Y=aXb

若a>0,則ln

Y=ln

a+blnX(雙對數模型——被解釋變量和解釋變量都是對數形式)令

Y*=ln

Y,a*

=ln

a,X*=ln

X,得:Y*=a*+bX*(***)對于變形的模型(***),如果它滿足古典線性回歸模型的基本假定,則很容易用普通最小二乘法來估計它,并且得到的估計量是最優(yōu)線性無偏估計量(3.5.8)對數模型一般形式(3.5.7)(3.5.9)75在經驗工作中,雙對數模型應用的非常廣泛,其原因在于,它有一個很吸引人的特性:斜率b度量了Y對X的彈性,即給X一個(很小)的變動所引起Y變動的百分比。如果用符號△Y代表Y的一個小的變動,△X代表X的一個小的變動,定義彈性E為:公式中的分子分母可以理解Y、X變動的百分比。彈性的概念反映了Y對于X變動的敏感程度。因此,如果Y代表了商品的需求量,X代表了單位價格,則E就是需求的價格彈性。lnY=lna+blnX

Y*=a*+bX*冪函數:Y=aXb76lnY=lna+blnX

Y*=a*+bX*可見對于這個模型,斜率等于Y關于X的彈性,所以彈性為一常數—它與X的取值無關。這個特殊的性質,雙對數模型又稱為不變彈性模型。由于冪函數具有上述優(yōu)點,在生產函數和需求函數中有廣泛應用,冪函數一般形式根據彈性的對數定義注意:一般來說,斜率和彈性是兩個不同的概念。只有在雙對數模型中,彈性才等于斜率。7778

例如,Cobb-Dauglas生產函數:冪函數

Q=AK

L

eμQ:產出量,K:投入的資本;L:投入的勞動

方程兩邊取對數:

lnQ=lnA+

lnK+lnL+μ即

Q*

=A*+K*+L*

+μ模型中的

、

分別為資本和勞動的產出彈性:79(2)指數曲線型:

y=ae

bx若a>0,則ln

y=ln

a+bx(半對數模型——只有一個變量(被解釋變量)是以對數形式出現)令y*=ln

y,a*

=ln

a,得:y*=a*

+bxln

y=ln

a+bxab<0x0yb>0yx0aa>0表示x每變動1個單位時,y將變動的百分比,特別在x表示時間變量(年份)時,系數b衡量了y的年均增長速度。80例如,生產中成本C與產量Q的關系呈現指數關系:兩邊取對數在對經濟變量的變動規(guī)律研究中,測定其增長率或衰減率是一個重要方面。在回歸分析中,我們可以用半對數模型來測度這些增長率。(3)

對數曲線模型:y=a+b

ln

x令x*=ln

x,得:y=a+bx*(半對數模型—只有一個變量(解釋變量)是以對數形式出現)b>0x0y0yxb<0對數曲線模型:y=a+b

ln

x它表示x每變動1%時,y將變動的絕對量,即變動b%個單位。81823、復雜函數模型與級數展開法

方程兩邊取對數后,得到:

(

1+2=1)Q:產出量,K:資本投入,L:勞動投入:替代參數,1、

2:分配參數例如,固定替代彈性CES生產函數

將式中l(wèi)n(

1K-+2L-)在

=0處展開泰勒級數,取關于

的線性項,即得到一個線性近似式。

如取0階、1階、2階項,可得83并非所有的函數形式都可以線性化

無法線性化模型的一般形式為:其中,f(X1,X2,…,Xk)為非線性函數。如:84本節(jié)我們討論了幾種參數之間是線性的模型或是可通過適當的變形成參數線性的模型(但變量之間并不一定是線性的)。這些不同的模型都有其自己特殊的性質和特征。主要的6種模型如下:(1)倒數(雙曲函數)模型。應變量是線性形式,但解釋變量是倒數形式;(2)多項式模型。解釋變量以不同次方形式進入模型。(3)冪函數(雙對數)模型。應變量和解釋變量都是對數形式。(4)指數函數(半對數)模型。應變量是對數形式,但解釋變量是線性形式。(5)對數函數(半對數)模型。解釋變量是對數形式,但應變量是線性形式。(6)復雜函數模型?!?.6受約束回歸

在建立回歸模型時,有時根據經濟理論需對模型中變量的參數施加一定的約束條件。

如:

0階齊次性條件的消費需求函數

1階齊次性條件的C-D生產函數模型施加約束條件后進行回歸,稱為受約束回歸(restrictedregression);

不加任何約束的回歸稱為無約束回歸(unrestrictedregression)。85受約束回歸

一、模型參數的線性約束二、對回歸模型增加或減少解釋變量三、參數的穩(wěn)定性*四、非線性約束86

一、模型參數的線性約束對模型施加約束得或(3.6.1)如果對(3.6.4)式回歸得出則由約束條件可得:(3.6.2)(3.6.3)(3.6.4)87

然而,對所考查的具體問題能否施加約束?需進一步進行相應的檢驗。常用的檢驗有:

F檢驗、x2檢驗與t檢驗,

主要介紹F檢驗在同一樣本下,記無約束樣本回歸模型為受約束樣本回歸模型為于是88受約束樣本回歸模型的殘差平方和RSSR于是e’e為無約束樣本回歸模型的殘差平方和RSSU(*)受約束與無約束模型都有相同的TSS由(*)式RSSR

RSSU從而

ESSR

ESSU這意味著,通常情況下,對模型施加約束條件會降低模型的解釋能力。89

但是,如果約束條件為真,則受約束回歸模型與無約束回歸模型具有相同的解釋能力,RSSR

與RSSU的差異變小??捎肦SSR

-RSSU的大小來檢驗約束的真實性根據數理統計學的知識:于是:注意,kU

–kR=q恰為約束條件的個數。kU為無約束條件解釋變量個數

kR為

kU+約束條件個數q90

討論:

如果約束條件無效,RSSR

與RSSU的差異較大,計算的F值也較大。拒絕原假設可能性越大

于是,可用計算的F統計量的值與所給定的顯著性水平下的臨界值作比較,對約束條件的真實性進行檢驗。注意,kU

-kR恰為約束條件的個數。在顯著水平α條件下。查表得F分布臨界值Fα

將統計量F與Fα進行比較,如果F>Fα,拒絕原假設,認為參數約束不成立,否則不能拒絕原假設。91例3.6.1

中國城鎮(zhèn)居民對食品的人均消費需求實例中,對零階齊次性檢驗:

=5%,查得臨界值F0.05(1,10)=4.96

判斷:0.231<4.96不能拒絕中國城鎮(zhèn)居民對食品的人均消費需求函數具有零階齊次特性這一假設。無約束回歸:RSSU=0.00324,

kU=3

受約束回歸:RSSR=0.00332,KR=2

樣本容量n=14,約束條件個數kU

-kR=3-2=192這里的F檢驗適合所有關于參數線性約束的檢驗如:多元回歸中對方程總體線性性的F檢驗:

H0:

j=0j=1,2,…,k這里:受約束回歸模型為這里,運用了ESSR

=0。93

二、對回歸模型增加或減少解釋變量考慮如下兩個回歸模型(*)(**)(*)式可看成是(**)式的受約束回歸:H0:相應的F統計量為:94如果約束條件為真,即額外的變量Xk+1,…,Xk+q對Y沒有解釋能力,則F統計量較?。环駝t,約束條件為假,意味著額外的變量對Y有較強的解釋能力,則F統計量較大。因此,可通過F的計算值與臨界值的比較,來判斷額外變量是否應包括在模型中。討論:

F統計量的另一個等價式

P96例3.2.295

三、參數的穩(wěn)定性

1、鄒氏參數穩(wěn)定性檢驗建立模型時往往希望模型的參數是穩(wěn)定的,即所謂的結構不變,這將提高模型的預測與分析功能。如何檢驗?假設需要建立的模型為在兩個連續(xù)的時間序列(1,2,…,n1)與(n1+1,…,n1+n2)中,相應的模型分別為:96

合并兩個時間序列為(1,2,…,n1

,n1+1,…,n1+n2),則可寫出如下無約束回歸模型如果

=

,表示沒有發(fā)生結構變化,因此可針對如下假設進行檢驗:

H0:

=

(*)式施加上述約束后變換為受約束回歸模型(*)(**)97因此,檢驗的F統計量為:記RSS1與RSS2為在兩時間段上分別回歸后所得的殘差平方和,容易驗證,于是98參數穩(wěn)定性的檢驗步驟:(1)分別以兩連續(xù)時間序列作為兩個樣本進行回歸,得到相應的殘差平方:RSS1與RSS2

(2)將兩序列并為一個大樣本后進行回歸,得到大樣本下的殘差平方和RSSR

(3)計算F統計量的值,與臨界值比較:

若F值大于臨界值,則拒絕原假設,認為發(fā)生了結構變化,參數是非穩(wěn)定的。該檢驗也被稱為鄒氏參數穩(wěn)定性檢驗(Chowtestforparameterstability)。99

2、鄒氏預測檢驗

上述參數穩(wěn)定性檢驗要求n2>k。

如果出現n2<k

,則往往進行如下的鄒氏預測檢驗(Chowtestforpredictivefailure)。

鄒氏預測檢驗的基本思想:

先用前一時間段n1個樣本估計原模型,再用估計出的參數進行后一時間段n2個樣本的預測。

如果預測誤差較大,則說明參數發(fā)生了變化,否則說明參數是穩(wěn)定的。100分別以

、

表示第一與第二時間段的參數,則其中,如果

=0,則

=,表明參數在估計期與預測期相同(*)

(*)的矩陣式:可見,用前n1個樣本估計可得前k個參數

的估計,而

不外是用后n2個樣本測算的預測誤差X2(-)(**)101如果參數沒有發(fā)生變化,則

=0,矩陣式簡化為(***)(***)式與(**)式這里:KU-KR=n2RSSU=RSS1分別可看成受約束與無約束回歸模型,于是有如下F檢驗:102

第一步,在兩時間段的合成大樣本下做OLS回歸,得受約束模型的殘差平方和RSSR

;

第二步,對前一時間段的n1個子樣做OLS回歸,得殘差平方和RSS1

;

第三步,計算檢驗的F統計量,做出判斷:鄒氏預測檢驗步驟:給定顯著性水平

,查F分布表,得臨界值F

(n2,n1-k-1)

如果F>F(n2,n1-k-1)

,則拒絕原假設,認為預測期發(fā)生了結構變化。103

例3.6.2

中國城鎮(zhèn)居民食品人均消費需求的鄒氏檢驗。

1、參數穩(wěn)定性檢驗1981~1994:RSS1=0.003240

1995~2001:

(9.96)(7.14)(-5.13)(1.81)1981~2001:

(14.83)(27.26)(-3.24)(-11.17)104給定

=5%,查表得臨界值F0.05(4,13)=3.18

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論