回歸分析基本方法_第1頁(yè)
回歸分析基本方法_第2頁(yè)
回歸分析基本方法_第3頁(yè)
回歸分析基本方法_第4頁(yè)
回歸分析基本方法_第5頁(yè)
已閱讀5頁(yè),還剩44頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

關(guān)于回歸分析基本方法第一頁(yè),共四十九頁(yè),2022年,8月28日§2.1回歸分析概述一、變量間的關(guān)系及回歸分析的基本概念

二、一元總體回歸函數(shù)三、隨機(jī)擾動(dòng)項(xiàng)四、一元樣本回歸函數(shù)(SRF)第二頁(yè),共四十九頁(yè),2022年,8月28日§2.1回歸分析概述

(1)確定性關(guān)系或函數(shù)關(guān)系:研究的是確定現(xiàn)象非隨機(jī)變量間的關(guān)系。(2)統(tǒng)計(jì)依賴或相關(guān)關(guān)系:研究的是非確定現(xiàn)象隨機(jī)變量間的關(guān)系。一、變量間的關(guān)系及回歸分析的基本概念

1、變量間的關(guān)系經(jīng)濟(jì)變量之間的關(guān)系,大體可分為兩類:第三頁(yè),共四十九頁(yè),2022年,8月28日對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過(guò)相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來(lái)完成的:例如:

函數(shù)關(guān)系:統(tǒng)計(jì)依賴關(guān)系/統(tǒng)計(jì)相關(guān)關(guān)系:第四頁(yè),共四十九頁(yè),2022年,8月28日

①不線性相關(guān)并不意味著不相關(guān);

②有相關(guān)關(guān)系并不意味著一定有因果關(guān)系;③回歸分析/相關(guān)分析研究一個(gè)變量對(duì)另一個(gè)(些)變量的統(tǒng)計(jì)依賴關(guān)系,但它們并不意味著一定有因果關(guān)系。

④相關(guān)分析對(duì)稱地對(duì)待任何(兩個(gè))變量,兩個(gè)變量都被看作是隨機(jī)的?;貧w分析對(duì)變量的處理方法存在不對(duì)稱性,即區(qū)分應(yīng)變量(被解釋變量)和自變量(解釋變量):前者是隨機(jī)變量,后者不是。▲注意:第五頁(yè),共四十九頁(yè),2022年,8月28日

回歸分析(regressionanalysis)是研究一個(gè)變量關(guān)于另一個(gè)(些)變量的具體依賴關(guān)系的計(jì)算方法和理論。

其用意:在于通過(guò)后者的已知或設(shè)定值,去估計(jì)和(或)預(yù)測(cè)前者的(總體)均值。這里:前一個(gè)變量被稱為被解釋變量(ExplainedVariable)或應(yīng)變量(DependentVariable),后一個(gè)(些)變量被稱為解釋變量(ExplanatoryVariable)或自變量(IndependentVariable)。2、回歸分析的基本概念

回歸分析構(gòu)成計(jì)量經(jīng)濟(jì)學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括:

(1)根據(jù)樣本觀察值對(duì)經(jīng)濟(jì)計(jì)量模型參數(shù)進(jìn)行估計(jì),求得回歸方程;(2)對(duì)回歸方程、參數(shù)估計(jì)值進(jìn)行顯著性檢驗(yàn);(3)利用回歸方程進(jìn)行分析、評(píng)價(jià)及預(yù)測(cè)。第六頁(yè),共四十九頁(yè),2022年,8月28日

回歸分析關(guān)心的是根據(jù)解釋變量的已知或給定值,考察被解釋變量的總體均值,即當(dāng)解釋變量取某個(gè)確定值時(shí),與之統(tǒng)計(jì)相關(guān)的被解釋變量所有可能出現(xiàn)的對(duì)應(yīng)值的平均值。

二、一元總體回歸函數(shù)第七頁(yè),共四十九頁(yè),2022年,8月28日概念:

在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為一元總體回歸線(populationregressionline),或更一般地稱為一元總體回歸曲線(populationregressioncurve)。稱為(雙變量)一元總體回歸函數(shù)(populationregressionfunction,PRF)。

相應(yīng)的函數(shù):第八頁(yè),共四十九頁(yè),2022年,8月28日

回歸函數(shù)(PRF)說(shuō)明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。含義:

函數(shù)形式:可以是線性或非線性的。為一線性函數(shù)。其中,0,1是未知參數(shù),稱為回歸系數(shù)(regressioncoefficients)。

。第九頁(yè),共四十九頁(yè),2022年,8月28日

三、隨機(jī)擾動(dòng)項(xiàng)

稱i為觀察值Yi圍繞它的期望值E(Y|Xi)的離差(deviation),是一個(gè)不可觀測(cè)的隨機(jī)變量,又稱為隨機(jī)干擾項(xiàng)(stochasticdisturbance)或隨機(jī)誤差項(xiàng)(stochasticerror)。記第十頁(yè),共四十九頁(yè),2022年,8月28日

(*)式稱為一元總體回歸函數(shù)(方程)PRF的隨機(jī)設(shè)定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機(jī)性影響。(*)

由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)學(xué)模型,因此也稱為一元總體回歸模型。第十一頁(yè),共四十九頁(yè),2022年,8月28日隨機(jī)誤差項(xiàng)主要包括下列因素的影響:1)在解釋變量中被忽略的因素的影響;2)變量觀測(cè)值的觀測(cè)誤差的影響;3)模型關(guān)系的設(shè)定誤差的影響;4)其它隨機(jī)因素的影響。產(chǎn)生并設(shè)計(jì)隨機(jī)誤差項(xiàng)的主要原因:1)理論的含糊性;2)數(shù)據(jù)的欠缺;3)節(jié)省原則。第十二頁(yè),共四十九頁(yè),2022年,8月28日

四、一元樣本回歸函數(shù)(SRF)

問(wèn)題:能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息?

總體的信息往往無(wú)法掌握,現(xiàn)實(shí)的情況只能是在一次觀測(cè)中得到總體的一個(gè)樣本。第十三頁(yè),共四十九頁(yè),2022年,8月28日該樣本的散點(diǎn)圖(scatterdiagram):

樣本散點(diǎn)圖近似于一條直線,畫(huà)一條直線以盡好地?cái)M合該散點(diǎn)圖,由于樣本取自總體,可以該線近似地代表總體回歸線。該線稱為一元樣本回歸線(sampleregressionlines)。

記樣本回歸線的函數(shù)形式為:稱為一元樣本回歸函數(shù)(sampleregressionfunction,SRF)。

第十四頁(yè),共四十九頁(yè),2022年,8月28日

這里將樣本回歸線看成總體回歸線的近似替代則

注意:第十五頁(yè),共四十九頁(yè),2022年,8月28日

樣本回歸函數(shù)的隨機(jī)形式/樣本回歸模型:同樣地,樣本回歸函數(shù)也有如下的隨機(jī)形式:

由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)模型,因此也稱為一元樣本回歸模型(sampleregressionmodel)。

第十六頁(yè),共四十九頁(yè),2022年,8月28日

▼回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸函數(shù)PRF。注意:這里PRF可能永遠(yuǎn)無(wú)法知道。即,根據(jù)

估計(jì)第十七頁(yè),共四十九頁(yè),2022年,8月28日§2.2線性回歸模型

一、多元線性回歸模型二、多元線性回歸模型的基本假定

第十八頁(yè),共四十九頁(yè),2022年,8月28日

一、多元線性回歸模型

多元線性回歸模型:表現(xiàn)在線性回歸模型中的解釋變量有多個(gè)。

一般表現(xiàn)形式:i=1,2…,n其中:k為解釋變量的數(shù)目,j稱為回歸參數(shù)(regressioncoefficient)。

習(xí)慣上:把常數(shù)項(xiàng)看成為一虛變量的系數(shù),該虛變量的樣本觀測(cè)值始終取1。這樣:

模型中解釋變量的數(shù)目為(k+1)

第十九頁(yè),共四十九頁(yè),2022年,8月28日也被稱為總體回歸函數(shù)的隨機(jī)表達(dá)形式。它的非隨機(jī)表達(dá)式為:

方程表示:各變量X值固定時(shí)Y的平均響應(yīng)。

j也被稱為偏回歸系數(shù),表示在其他解釋變量保持不變的情況下,Xj每變化1個(gè)單位時(shí),Y的均值E(Y)的變化;

或者說(shuō)j給出了Xj的單位變化對(duì)Y均值的“直接”或“凈”(不含其他變量)影響。第二十頁(yè),共四十九頁(yè),2022年,8月28日總體回歸模型n個(gè)隨機(jī)方程的矩陣表達(dá)式為

其中第二十一頁(yè),共四十九頁(yè),2022年,8月28日樣本回歸函數(shù):用來(lái)估計(jì)總體回歸函數(shù)其隨機(jī)表示式:

ei稱為殘差或剩余項(xiàng)(residuals),可看成是總體回歸函數(shù)中隨機(jī)擾動(dòng)項(xiàng)i的近似替代。

樣本回歸函數(shù)的矩陣表達(dá):

或其中:第二十二頁(yè),共四十九頁(yè),2022年,8月28日二、多元線性回歸模型的基本假定

假設(shè)1,解釋變量是非隨機(jī)的或固定的,且各X之間互不相關(guān)(無(wú)多重共線性)。

假設(shè)2,隨機(jī)誤差項(xiàng)具有零均值、同方差及不序列相關(guān)性

假設(shè)3,解釋變量與隨機(jī)項(xiàng)不相關(guān)

假設(shè)4,隨機(jī)項(xiàng)滿足正態(tài)分布

第二十三頁(yè),共四十九頁(yè),2022年,8月28日上述假設(shè)的矩陣符號(hào)表示式:

假設(shè)1,n(k+1)矩陣X是非隨機(jī)的,且X的秩=k+1,即X滿秩。

假設(shè)2,

假設(shè)3,E(X’)=0,即

第二十四頁(yè),共四十九頁(yè),2022年,8月28日假設(shè)4,向量

服從多維正態(tài)分布,即

同一元回歸一樣,多元回歸還具有如下兩個(gè)重要假設(shè):假設(shè)5,樣本容量趨于無(wú)窮時(shí),各解釋變量的方差趨于有界常數(shù),即n∞時(shí),

其中:Q為一非奇異固定矩陣,矩陣x是由各解釋變量的離差為元素組成的nk階矩陣

假設(shè)6,回歸模型的設(shè)定是正確的。

第二十五頁(yè),共四十九頁(yè),2022年,8月28日§2.3

線性回歸模型的參數(shù)估計(jì)

估計(jì)方法:OLS、ML

一、普通最小二乘估計(jì)二、最大似然估計(jì)三、參數(shù)估計(jì)量的性質(zhì)四、樣本容量問(wèn)題五、估計(jì)實(shí)例

第二十六頁(yè),共四十九頁(yè),2022年,8月28日一、普通最小二乘估計(jì)對(duì)于隨機(jī)抽取的n組觀測(cè)值如果樣本函數(shù)的參數(shù)估計(jì)值已經(jīng)得到,則有:

i=1,2…n根據(jù)最小二乘原理,參數(shù)估計(jì)值應(yīng)該是下列方程組的解

其中第二十七頁(yè),共四十九頁(yè),2022年,8月28日于是得到關(guān)于待估參數(shù)估計(jì)值的正規(guī)方程組:

第二十八頁(yè),共四十九頁(yè),2022年,8月28日正規(guī)方程組的矩陣形式即由于X’X滿秩,故有

第二十九頁(yè),共四十九頁(yè),2022年,8月28日將上述過(guò)程用矩陣表示如下:

即求解方程組:得到:

于是:第三十頁(yè),共四十九頁(yè),2022年,8月28日?正規(guī)方程組的另一種寫(xiě)法對(duì)于正規(guī)方程組

于是

(*)或(**)是多元線性回歸模型正規(guī)方程組的另一種寫(xiě)法

(*)(**)第三十一頁(yè),共四十九頁(yè),2022年,8月28日?樣本回歸函數(shù)的離差形式i=1,2…n其矩陣形式為

其中:在離差形式下,參數(shù)的最小二乘估計(jì)結(jié)果為

第三十二頁(yè),共四十九頁(yè),2022年,8月28日?隨機(jī)誤差項(xiàng)的方差的無(wú)偏估計(jì)

可以證明,隨機(jī)誤差項(xiàng)的方差的無(wú)偏估計(jì)量為

第三十三頁(yè),共四十九頁(yè),2022年,8月28日二、最大似然估計(jì)

對(duì)于多元線性回歸模型易知

Y的隨機(jī)抽取的n組樣本觀測(cè)值的聯(lián)合概率即為變量Y的似然函數(shù)

第三十四頁(yè),共四十九頁(yè),2022年,8月28日對(duì)數(shù)似然函數(shù)為對(duì)對(duì)數(shù)似然函數(shù)求極大值,也就是對(duì)

求極小值。

因此,參數(shù)的最大似然估計(jì)為結(jié)果與參數(shù)的普通最小二乘估計(jì)相同第三十五頁(yè),共四十九頁(yè),2022年,8月28日

三、參數(shù)估計(jì)量的性質(zhì)

在滿足基本假設(shè)的情況下,其結(jié)構(gòu)參數(shù)的普通最小二乘估計(jì)、最大似然估計(jì)及矩估計(jì)仍具有:

線性性、無(wú)偏性、有效性。

同時(shí),隨著樣本容量增加,參數(shù)估計(jì)量具有:

漸近無(wú)偏性、漸近有效性、一致性。

1、線性性

其中,C=(X’X)-1X’為一僅與固定的X有關(guān)的行向量

第三十六頁(yè),共四十九頁(yè),2022年,8月28日

2、無(wú)偏性

這里利用了假設(shè):E(X’)=0

3、有效性(最小方差性)

第三十七頁(yè),共四十九頁(yè),2022年,8月28日其中利用了

和第三十八頁(yè),共四十九頁(yè),2022年,8月28日

四、樣本容量問(wèn)題

所謂“最小樣本容量”,即從最小二乘原理和最大或然原理出發(fā),欲得到參數(shù)估計(jì)量,不管其質(zhì)量如何,所要求的樣本容量的下限。⒈

最小樣本容量

樣本最小容量必須不少于模型中解釋變量的數(shù)目(包括常數(shù)項(xiàng)),即

n

k+1因?yàn)椋瑹o(wú)多重共線性要求:秩(X)=k+1第三十九頁(yè),共四十九頁(yè),2022年,8月28日2、滿足基本要求的樣本容量

從統(tǒng)計(jì)檢驗(yàn)的角度:

n30時(shí),Z檢驗(yàn)才能應(yīng)用;

n-k8時(shí),t分布較為穩(wěn)定

一般經(jīng)驗(yàn)認(rèn)為:

當(dāng)n30或者至少n3(k+1)時(shí),才能說(shuō)滿足模型估計(jì)的基本要求。

模型的良好性質(zhì)只有在大樣本下才能得到理論上的證明第四十頁(yè),共四十九頁(yè),2022年,8月28日五、線性回歸模型的參數(shù)估計(jì)實(shí)例第四十一頁(yè),共四十九頁(yè),2022年,8月28日1、中國(guó)居民人均消費(fèi)模型

考察中國(guó)居民收入與消費(fèi)支出的關(guān)系。GDPP:

人均國(guó)內(nèi)生產(chǎn)總值(1990年不變價(jià))CONSP:人均居民消費(fèi)(以居民消費(fèi)價(jià)格指數(shù)(1990=100)縮減)。

表2.3.1中國(guó)居民人均消費(fèi)支出與人均GDP(元/人)

年份

人均居民消費(fèi)

CONSP

人均GDP

GDPP

年份

人均居民消費(fèi)

CONSP

人均GDP

GDPP

1978

395.8

675.1

1990

797.1

1602.3

1979

437.0

716.9

1991

861.4

1727.2

1980

464.1

763.7

1992

966.6

1949.8

1981

501.9

792.4

1993

1048.6

2187.9

1982

533.5

851.1

1994

1108.7

2436.1

1983

572.8

931.4

1995

1213.1

2663.7

1984

635.6

1059.2

1996

1322.8

2889.1

1985

716.0

1185.2

1997

1380.9

3111.9

1986

746.5

1269.6

1998

1460.6

3323.1

1987

788.3

1393.6

1999

1564.4

3529.3

1988

836.4

1527.0

2000

1690.8

3789.7

1989

779.7

1565.9

第四十二頁(yè),共四十九頁(yè),2022年,8月28日

該兩組數(shù)據(jù)是1978~2000年的時(shí)間序列數(shù)據(jù)(timeseriesdata);

建立模型

擬建立如下一元回歸模型

采用Eviews軟件進(jìn)行回歸分析的結(jié)果見(jiàn)下表

第四十三頁(yè),共四十九頁(yè),2022年,8月28日一般可寫(xiě)出如下回歸分析結(jié)果:

(13.51)(53.47)R2=0.9927F=2859.23DW=0.5503

表2.3.2中國(guó)居民人均消費(fèi)支出對(duì)人均GDP的回歸(1978~2000)

LS//DependentVariableisCONSP

Sample:19782000

Includedobservations:23

Variable

Coefficient

Std.Error

t-Statistic

Prob.

C

201.1071

14.88514

13.51060

0.0000

GDPP

0.386187

0.007222

53.47182

0.0000

R-squared

0.992709

Meandependentvar

905.3331

AdjustedR-squared

0.992362

S.D.dependentvar

380.6428

S.E.ofregression

33.26711

Akaikeinfocriterion

7.092079

Sumsquaredresid

23240.71

Schwarzcriterion

7.190818

Loglikelihood

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論