第二章 簡單線性回歸模型_第1頁
第二章 簡單線性回歸模型_第2頁
第二章 簡單線性回歸模型_第3頁
第二章 簡單線性回歸模型_第4頁
第二章 簡單線性回歸模型_第5頁
已閱讀5頁,還剩100頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第二章簡單線性回歸模型第1頁,課件共105頁,創(chuàng)作于2023年2月未來我國旅游需求將快速增長,根據(jù)中國政府所制定的遠(yuǎn)景目標(biāo),到2020年,中國入境旅游人數(shù)將達(dá)到2.1億人次;國際旅游外匯收入580億美元,國內(nèi)旅游收入2500億美元。到2020年,中國旅游業(yè)總收入將超過3000億美元,相當(dāng)于國內(nèi)生產(chǎn)總值的8%至11%。(來源:《2008年中國旅行社發(fā)展研究咨詢報告》)

(參考現(xiàn)狀:第一產(chǎn)業(yè)占GDP的15%,建筑業(yè)占GDP的7%)●什么決定性因素能使中國旅游業(yè)總收入超過3000億美元?●旅游業(yè)的發(fā)展與這種決定性因素的數(shù)量關(guān)系究竟是什么?●怎樣具體測定旅游業(yè)發(fā)展與這種決定性因素的數(shù)量關(guān)系?2第2頁,課件共105頁,創(chuàng)作于2023年2月需要研究經(jīng)濟(jì)變量之間數(shù)量關(guān)系的方法為了不使問題復(fù)雜化,我們先在某些標(biāo)準(zhǔn)的(古典的)假定條件下,用最簡單的模型,對最簡單的變量間數(shù)量關(guān)系加以討論顯然,對旅游起決定性影響作用的是“中國居民的收入水平”以及“入境旅游人數(shù)”等因素。

“旅游業(yè)總收入”(Y)與“居民平均收入”(X1)或者“入境旅游人數(shù)”(X2)有怎樣的數(shù)量關(guān)系呢?

能否用某種線性或非線性關(guān)系式Y(jié)=f(X)去表現(xiàn)這

種數(shù)量關(guān)系呢?具體該怎樣去表現(xiàn)和計量呢?第3頁,課件共105頁,創(chuàng)作于2023年2月4

第一節(jié)回歸分析與回歸函數(shù)

一、相關(guān)分析與回歸分析(對統(tǒng)計學(xué)的回顧)1、經(jīng)濟(jì)變量之間的相互關(guān)系

性質(zhì)上可能有三種情況:◆確定性的函數(shù)關(guān)系

Y=f(X)可用數(shù)學(xué)方法計算◆不確定的統(tǒng)計關(guān)系—相關(guān)關(guān)系

Y=f(X)+ε(ε為隨機(jī)變量)可用統(tǒng)計方法分析

◆沒有關(guān)系不用分析

第4頁,課件共105頁,創(chuàng)作于2023年2月◆相關(guān)關(guān)系的描述

最直觀的描述方式——坐標(biāo)圖(散布圖、散點圖))

5函數(shù)關(guān)系相關(guān)關(guān)系(線性)沒有關(guān)系相關(guān)關(guān)系(非線性)2、相關(guān)關(guān)系第5頁,課件共105頁,創(chuàng)作于2023年2月66

相關(guān)關(guān)系的類型

從涉及的變量數(shù)量看

簡單相關(guān)多重相關(guān)(復(fù)相關(guān))●

從變量相關(guān)關(guān)系的表現(xiàn)形式看

線性相關(guān)——散布圖接近一條直線非線性相關(guān)——散布圖接近一條曲線●

從變量相關(guān)關(guān)系變化的方向看

正相關(guān)——變量同方向變化,同增同減負(fù)相關(guān)——變量反方向變化,一增一減不相關(guān)第6頁,課件共105頁,創(chuàng)作于2023年2月7

3、相關(guān)程度的度量—相關(guān)系數(shù)

如果和總體的全部數(shù)據(jù)都已知,和的方差和協(xié)方差也已知,則

X和Y的總體線性相關(guān)系數(shù):

其中:-----X的方差-----Y的方差-----X和Y的協(xié)方差特點:●總體相關(guān)系數(shù)只反映總體兩個變量

的線性相關(guān)程度●對于特定的總體來說,

的數(shù)值是既定的,總體相關(guān)系數(shù)

是客觀存在的特定數(shù)值?!窨傮w的兩個變量

和的全部數(shù)值通常不可能直接觀測,所以總體相關(guān)系數(shù)一般是未知的。

第7頁,課件共105頁,創(chuàng)作于2023年2月8如果只知道X和Y的樣本觀測值,則X和Y的樣本線性相關(guān)系數(shù)為:

其中:和分別是變量X和Y的樣本觀測值,和分別是變量X和Y樣本值的平均值注意:是隨抽樣而變動的隨機(jī)變量。X和Y的樣本線性相關(guān)系數(shù):相關(guān)系數(shù)較為簡單,也可以在一定程度上測定變量間的數(shù)量關(guān)系,但是對于具體研究變量間的數(shù)量規(guī)律性還有局限性。第8頁,課件共105頁,創(chuàng)作于2023年2月

X和Y都是相互對稱的隨機(jī)變量,●

線性相關(guān)系數(shù)只反映變量間的線性相關(guān)程度,不能說明非線性相關(guān)關(guān)系●

樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計值,由于抽樣波動,樣本相關(guān)系數(shù)是隨抽樣而變動的隨機(jī)變量,其統(tǒng)計顯著性還有待檢驗

9對相關(guān)系數(shù)的正確理解和使用第9頁,課件共105頁,創(chuàng)作于2023年2月104、回歸分析回歸的古典意義:

高爾頓遺傳學(xué)的回歸概念

(父母身高與子女身高的關(guān)系)子女的身高有向人的平均身高"回歸"的趨勢回歸的現(xiàn)代意義:一個被解釋變量對若干個解釋變量依存關(guān)系的研究回歸的目的(實質(zhì)):由解釋變量去估計被解釋變量的平均值第10頁,課件共105頁,創(chuàng)作于2023年2月11●被解釋變量Y的條件分布和條件概率:

當(dāng)解釋變量X取某固定值時(條件),Y的值不確定,Y的不同取值會形成一定的分布,這是Y的條件分布。

X取某固定值時,Y取不同值的概率稱為條件概率?!癖唤忉屪兞縔的條件期望:對于X

的每一個取值,對Y所形成的分布確定其期望或均值,稱為Y的條件期望或條件均值,用表示。注意:Y的條件期望是隨X的變動而變動的

YX明確幾個概念(為深刻理解“回歸”)第11頁,課件共105頁,創(chuàng)作于2023年2月12●回歸線:對于每一個X的取值,都有Y的條件期望

與之對應(yīng),代表Y的條件期望的點的軌跡形成的直線或曲線稱為回歸線?!窕貧w函數(shù):被解釋變量Y的條件期望

隨解釋變量X的變化而有規(guī)律的變化,如果把Y的條件期望表現(xiàn)為X的某種函數(shù)

,這個函數(shù)稱為回歸函數(shù)。回歸函數(shù)分為:總體回歸函數(shù)和樣本回歸函數(shù)

X

Y第12頁,課件共105頁,創(chuàng)作于2023年2月13每月家庭可支配收入X2000250030003500400045005000550060006500131215301631184320372277246929243515352113401619172619742210238828893338372139541400171317862006232525263090365038654108每1548175018352265241926813156380240264345月1688181418852367252228873300408741654812家173819851943248526653050332142984380庭180020412037251527993189365443124580消19022186207826892887335338424413費220021792713291335344074支231222982898303837104165出2316292331673834

Y238730533310249831873510268932861591191520922586275430393396385340364148舉例:假如已知由100個家庭構(gòu)成的總體的數(shù)據(jù)

(單位:元)二、總體回歸函數(shù)(PRF)第13頁,課件共105頁,創(chuàng)作于2023年2月14消費支出的條件期望與收入關(guān)系的圖形對于本例的總體,家庭消費支出的條件期望與家庭收入基本是線性關(guān)系,可以把家庭消費支出的條件均值表示為家庭收入的線性函數(shù):第14頁,課件共105頁,創(chuàng)作于2023年2月15

1.總體回歸函數(shù)的概念

前提:假如已知所研究的經(jīng)濟(jì)現(xiàn)象的總體的被解釋變量Y和解釋變量X的每個觀測值(通常這是不可能的?。?,那么,可以計算出總體被解釋變量Y的條件期望,并將其表現(xiàn)為解釋變量X的某種函數(shù)

這個函數(shù)稱為總體回歸函數(shù)(PRF)

本質(zhì):

總體回歸函數(shù)實際上表現(xiàn)的是特定總體中被解釋變量隨解釋變量的變動而變動的某種規(guī)律性。計量經(jīng)濟(jì)學(xué)的根本目的是要探尋變量間數(shù)量關(guān)系的規(guī)律,也就要努力去尋求總體回歸函數(shù)。第15頁,課件共105頁,創(chuàng)作于2023年2月16

●條件期望表現(xiàn)形式例如Y的條件期望是解釋變量X的線性函數(shù),可表示為:

●個別值表現(xiàn)形式(隨機(jī)設(shè)定形式)對于一定的,Y的各個別值并不一定等于條件期望,而是分布在的周圍,若令各個與條件期望的偏差為,顯然是個隨機(jī)變量則有

2.總體回歸函數(shù)的表現(xiàn)形式PRF第16頁,課件共105頁,創(chuàng)作于2023年2月●作為總體運行的客觀規(guī)律,總體回歸函數(shù)是客觀存在的,但在實際的經(jīng)濟(jì)研究中總體回歸函數(shù)通常是未知的,只能根據(jù)經(jīng)濟(jì)理論和實踐經(jīng)驗去設(shè)定。計量經(jīng)濟(jì)學(xué)研究中“計量”的根本目的就是要尋求總體回歸函數(shù)。●我們所設(shè)定的計量模型實際就是在設(shè)定總體回歸函數(shù)的具體形式。●總體回歸函數(shù)中Y與X的關(guān)系可以是線性的,也可以是非線性的。

173.如何理解總體回歸函數(shù)第17頁,課件共105頁,創(chuàng)作于2023年2月18計量經(jīng)濟(jì)學(xué)中,線性回歸模型的“線性”有兩種解釋:◆就變量而言是線性的——Y的條件期望(均值)是X的線性函數(shù)

◆就參數(shù)而言是線性的

——Y的條件期望(均值)是參數(shù)β的線性函數(shù)例如:

對變量、參數(shù)均為“線性”對參數(shù)“線性”,對變量”非線性”對變量“線性”,對參數(shù)”非線性”注意:在計量經(jīng)濟(jì)學(xué)中,線性回歸模型主要指就參數(shù)而言是“線性”的,因為只要對參數(shù)而言是線性的,都可以用類似的方法去估計其參數(shù),都可以歸于線性回歸。“線性”的判斷第18頁,課件共105頁,創(chuàng)作于2023年2月◆概念

在總體回歸函數(shù)中,各個的值與其條件期望的偏差有很重要的意義。若只有的影響,

不應(yīng)有偏差。若偏差存在,說明還有其他影響因素。實際代表了排除在模型以外的所有因素對Y

的影響?!粜再|(zhì)

是其期望為0有一定分布的隨機(jī)變量重要性:隨機(jī)擾動項的性質(zhì)決定著計量經(jīng)濟(jì)分析結(jié)

果的性質(zhì)和計量經(jīng)濟(jì)方法的選擇19

三、隨機(jī)擾動項第19頁,課件共105頁,創(chuàng)作于2023年2月●是未知影響因素的代表(理論的模糊性)●

是無法取得數(shù)據(jù)的已知影響因素的代表(數(shù)據(jù)欠缺)●

是眾多細(xì)小影響因素的綜合代表(非系統(tǒng)性影響)●

模型可能存在設(shè)定誤差(變量、函數(shù)形式的設(shè)定)●

模型中變量可能存在觀測誤差(變量數(shù)據(jù)不符合實際)●

變量可能有內(nèi)在隨機(jī)性(人類經(jīng)濟(jì)行為的內(nèi)在隨機(jī)性)20引入隨機(jī)擾動項的原因第20頁,課件共105頁,創(chuàng)作于2023年2月樣本回歸線:

對于X的一定值,取得Y的樣本觀測值,可計算其條件均值,樣本觀測值條件均值的軌跡,稱為樣本回歸線。樣本回歸函數(shù):如果把被解釋變量Y的樣本條件均值

表示為解釋變量X的某種函數(shù),這個函數(shù)稱為樣本回歸函數(shù)(SRF)

21XYSRF四、樣本回歸函數(shù)(SRF)第21頁,課件共105頁,創(chuàng)作于2023年2月22

樣本回歸函數(shù)如果為線性函數(shù),可表示為

其中:是與相對應(yīng)的Y的樣本條件均值和分別是樣本回歸函數(shù)的參數(shù)

個別值(實際值)形式:被解釋變量Y的實際觀測值不完全等于樣本條件均值,二者之差用表示,稱為剩余項或殘差項:則或樣本回歸函數(shù)的函數(shù)形式條件均值形式:第22頁,課件共105頁,創(chuàng)作于2023年2月●樣本回歸線隨抽樣波動而變化:每次抽樣都能獲得一個樣本,就可以擬合一條樣本回歸線,(SRF不唯一)

●樣本回歸函數(shù)的函數(shù)形式應(yīng)與設(shè)定的總體回歸函數(shù)的函數(shù)形式一致。

●樣本回歸線只是樣本條件均值的軌跡,還不是總體回歸線,它至多只是未知的總體回歸線的近似表現(xiàn)。23樣本回歸函數(shù)的特點

SRF1SRF2

YX

第23頁,課件共105頁,創(chuàng)作于2023年2月

A

X

24PRFSRF樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系第24頁,課件共105頁,創(chuàng)作于2023年2月

如果能夠通過某種方式獲得和的數(shù)值,顯然:●和是對總體回歸函數(shù)參數(shù)和的估計●是對總體條件期望的估計●

在概念上類似總體回歸函數(shù)中的,可視

為對的估計。25對比:

總體回歸函數(shù)

樣本回歸函數(shù)對樣本回歸的理解第25頁,課件共105頁,創(chuàng)作于2023年2月26

目的:

計量經(jīng)濟(jì)分析的目標(biāo)是尋求總體回歸函數(shù)。即用樣本回歸函數(shù)SRF去估計總體回歸函數(shù)PRF。由于樣本對總體總是存在代表性誤差,SRF總會過高或過低估計PRF。要解決的問題:尋求一種規(guī)則和方法,使其得到的SRF的參數(shù)和盡可能“接近”總體回歸函數(shù)中的參數(shù)和的真實值。這樣的“規(guī)則和方法”有多種,如矩估計、極大似然估計、最小二乘估計等。其中最常用的是最小二乘法。回歸分析的目的第26頁,課件共105頁,創(chuàng)作于2023年2月用樣本去估計總體回歸函數(shù),總要使用特定的方法,而任何估計參數(shù)的方法都需要有一定的前提條件——假定條件

一、簡單線性回歸的基本假定

為什么要作基本假定?●只有具備一定的假定條件,所作出的估計才具有良好的統(tǒng)計性質(zhì)?!衲P椭杏须S機(jī)擾動項,估計的參數(shù)是隨機(jī)變量,顯然參數(shù)估計值的分布與擾動項的分布有關(guān),只有對隨機(jī)擾動的分布作出假定,才能比較方便地確定所估計參數(shù)的分布性質(zhì),也才可能進(jìn)行假設(shè)檢驗和區(qū)間估計等統(tǒng)計推斷。假定分為:◆對模型和變量的假定◆對隨機(jī)擾動項的假定

27第二節(jié)簡單線性回歸模型的最小二乘估計第27頁,課件共105頁,創(chuàng)作于2023年2月例如對于

●假定模型設(shè)定是正確的(變量和模型無設(shè)定誤差)●假定解釋變量X在重復(fù)抽樣中取固定值。

●假定解釋變量X是非隨機(jī)的,或者雖然X是隨機(jī)的,但與擾動項u是不相關(guān)的。(從變量X角度看是外生的)注意:解釋變量非隨機(jī)在自然科學(xué)的實驗研究中相對容易滿足,經(jīng)濟(jì)領(lǐng)域中變量的觀測是被動不可控的,X非隨機(jī)的假定并不一定都滿足。281.對模型和變量的假定第28頁,課件共105頁,創(chuàng)作于2023年2月

假定1:零均值假定:

在給定X的條件下,的條件期望為零

假定2:同方差假定:

在給定X的條件下,的條件方差為某個常數(shù)

29X

Y2.對隨機(jī)擾動項u的假定第29頁,課件共105頁,創(chuàng)作于2023年2月30

假定3:無自相關(guān)假定:

隨機(jī)擾動項的逐次值互不相關(guān)

假定4:解釋變量是非隨機(jī)的,或者雖然是隨機(jī)的但與擾動項不相關(guān)

(從隨機(jī)擾動角度看)

第30頁,課件共105頁,創(chuàng)作于2023年2月31假定5:對隨機(jī)擾動項分布的正態(tài)性假定,即假定服從均值為零、方差為的正態(tài)分布

(說明:正態(tài)性假定并不影響對參數(shù)的點估計,所以有時不列入基本假定,但這對確定所估計參數(shù)的分布性質(zhì)是需要的。且根據(jù)中心極限定理,當(dāng)樣本容量趨于無窮大時,的分布會趨近于正態(tài)分布。所以正態(tài)性假定有合理性)第31頁,課件共105頁,創(chuàng)作于2023年2月由于其中的和是非隨機(jī)的,是隨機(jī)變量,因此Y是隨機(jī)變量,

的分布性質(zhì)決定了的分布性質(zhì)。

對的一些假定可以等價地表示為對的假定:

假定1:零均值假定

假定2:同方差假定假定3:無自相關(guān)假定

假定5:正態(tài)性假定

32在對的基本假定下Y的分布性質(zhì)第32頁,課件共105頁,創(chuàng)作于2023年2月1.OLS的基本思想

●對于,不同的估計方法可以得到不同的樣本回歸參數(shù)和,所估計的也就不同?!窭硐氲墓烙嫿Y(jié)果應(yīng)使估計的與真實的的差(即剩余)總的來說越小越好●因可正可負(fù),總有,所以可以取最小,即在觀測值Y和X確定時,的大小決定于和。要解決的問題::如何尋求能使

最小的

和。33二、普通最小二乘法(OLS)

(OrdinaryLeastSquares)第33頁,課件共105頁,創(chuàng)作于2023年2月用克萊姆法則求解得以觀測值表現(xiàn)的OLS估計量:

34取偏導(dǎo)數(shù)并令其為0,可得正規(guī)方程或整理得即2.正規(guī)方程和估計量第34頁,課件共105頁,創(chuàng)作于2023年2月35

為表達(dá)得更簡潔,或者用離差形式的OLS估計量:容易證明由正規(guī)方程:

注意:其中:

本課程中:大寫的和均表示觀測值;小寫的和均表示觀測值的離差而且由樣本回歸函數(shù)可用離差形式寫為

用離差表現(xiàn)的OLS估計量第35頁,課件共105頁,創(chuàng)作于2023年2月

●剩余項的均值為零

●OLS回歸線通過樣本均值●估計值的均值等于實際觀測

值的均值

36(由OLS第一個正規(guī)方程直接得到)(由OLS正規(guī)方程兩邊同除n得到)3.OLS回歸線的數(shù)學(xué)性質(zhì)第36頁,課件共105頁,創(chuàng)作于2023年2月

●解釋變量與剩余項不相關(guān)

由OLS正規(guī)方程有:

●被解釋變量估計值與剩余項不相關(guān)

第37頁,課件共105頁,創(chuàng)作于2023年2月38

面臨的問題:

參數(shù)估計值參數(shù)真實值對參數(shù)估計式的優(yōu)劣需要有評價的標(biāo)準(zhǔn)

為什么呢?

●參數(shù)無法直接觀測,只能通過樣本去估計。樣本的獲得存

在抽樣波動,不同樣本的估計結(jié)果不一致?!窆烙媴?shù)的方法有多種,不同方法的估計結(jié)果可能不相同,

通過樣本估計參數(shù)時,估計方法及所確定的估計量不一定

完備,不一定能得到理想的總體參數(shù)估計值。對各種估計方法優(yōu)劣的比較與選擇需要有評價標(biāo)準(zhǔn)。估計準(zhǔn)則的基本要求:參數(shù)估計值應(yīng)"盡可能地接近"總體參數(shù)真實值”。

什么是“盡可能地接近”原則呢?

用統(tǒng)計語言表述就是:無偏性、有效性、一致性等4.OLS估計量的統(tǒng)計性質(zhì)第38頁,課件共105頁,創(chuàng)作于2023年2月39

(1)無偏性

前提:重復(fù)抽樣中估計方法固定、樣本數(shù)不變、由重復(fù)抽樣得到的觀測值,可得一系列參數(shù)估計值,的分布稱為的抽樣分布,其密度函數(shù)記為概念:如果,則稱是參數(shù)

的無偏估計量,如果,則稱是有偏的估計,其偏倚為(見下頁圖)第39頁,課件共105頁,創(chuàng)作于2023年2月40

概率密度

估計值偏倚第40頁,課件共105頁,創(chuàng)作于2023年2月41(2)有效性

前提:樣本相同、用不同的方法估計參數(shù),可以找到若干個不同的無偏估計式

目標(biāo):

努力尋求其抽樣分布具有最小方差的估計量(見下頁圖)既是無偏的同時又具有最小方差特性的估計量,稱為最佳(有效)估計量。第41頁,課件共105頁,創(chuàng)作于2023年2月42

概率密度

估計值第42頁,課件共105頁,創(chuàng)作于2023年2月思想:當(dāng)樣本容量較小時,有時很難找到方差最小的無偏估計,需要考慮樣本擴(kuò)大后的性質(zhì)(估計方法不變,樣本數(shù)逐步增大)一致性:

當(dāng)樣本容量n趨于無窮大時,如果估計式依概率收斂于總體參數(shù)的真實值,就稱這個估計式是

的一致估計式。即或

(漸近無偏估計式是當(dāng)樣本容量變得足夠大時其偏倚趨于零的估計式)

(見下頁圖)漸近有效性:當(dāng)樣本容量n趨于無窮大時,在所有的一致估計式中,具有最小的漸近方差。433、漸近性質(zhì)(大樣本性質(zhì))第43頁,課件共105頁,創(chuàng)作于2023年2月44

概率密度

估計值

圖4第44頁,課件共105頁,創(chuàng)作于2023年2月先明確幾點:●

由OLS估計式可以看出

都由可觀測的樣本值和唯一表示?!?/p>

因存在抽樣波動,OLS估計是隨機(jī)變量●

OLS估計式是點估計量

45OLS估計是否符合“盡可能地接近總體參數(shù)真實值”的要求呢?4.分析OLS估計量的統(tǒng)計性質(zhì)第45頁,課件共105頁,創(chuàng)作于2023年2月

2、

無偏特性

可以證明

(證明見教材P38)

46OLS估計式的統(tǒng)計性質(zhì)——高斯定理(注意:無偏性的證明中用到了基本假定中零均值等假定)1、

線性特征

是Y的線性函數(shù)第46頁,課件共105頁,創(chuàng)作于2023年2月3、

最小方差特性

(有效性)

(證明見教材P68附錄2·1)可以證明:在所有的線性無偏估計中,OLS估計具有最小方差(注意:最小方差性的證明中用到了基本假定中的同方差、無自相關(guān)等假定)結(jié)論(高斯定理):

在古典假定條件下,OLS估計量是最佳線性無偏估計量(BLUE)47第47頁,課件共105頁,創(chuàng)作于2023年2月概念:樣本回歸線是對樣本數(shù)據(jù)的一種擬合?!癫煌哪P停ú煌瘮?shù)形式)可擬合出不同的樣本回歸線●相同的模型用不同方法去估計參數(shù),也可以擬合出不同的回歸線擬合的回歸線與樣本觀測值總是有偏離。樣本回歸線對樣本觀測數(shù)據(jù)擬合的優(yōu)劣程度,可稱為擬合優(yōu)度。如何度量擬合優(yōu)度呢?擬合優(yōu)度的度量建立在對Y的總變差分解的基礎(chǔ)上48

第三節(jié)擬合優(yōu)度的度量

第48頁,課件共105頁,創(chuàng)作于2023年2月

分析Y的觀測值、估計值與平均值有以下關(guān)系將上式兩邊平方加總,可證得(提示:交叉項)

(TSS)(ESS)(RSS)

或者表示為

總變差(TSS):被解釋變量Y的觀測值與其平均值的離差平方和(總平方和)(說明Y的總變動程度)

解釋了的變差(ESS):被解釋變量Y的估計值與其平均值的離差平方和(回歸平方和)

剩余平方和(RSS):被解釋變量觀測值與估計值之差的平方和(未解釋的平方和)49

一、總變差的分解

第49頁,課件共105頁,創(chuàng)作于2023年2月Y

X

50變差分解的圖示(以某一個觀測值為例)

第50頁,課件共105頁,創(chuàng)作于2023年2月

以TSS同除總變差等式

兩邊:

定義:回歸平方和(解釋了的變差ESS)在總變差(TSS)中所占的比重稱為可決系數(shù),用或表示:

51或

二、可決系數(shù)

第51頁,課件共105頁,創(chuàng)作于2023年2月

可決系數(shù)越大,說明在總變差中由模型作出了解釋的部分占的比重越大,模型擬合優(yōu)度越好。反之可決系數(shù)越小,說明模型對樣本觀測值的擬合程度越差。

可決系數(shù)的特點:

●可決系數(shù)取值范圍:

●隨抽樣波動,樣本可決系數(shù)是隨抽樣而變動的隨機(jī)變量

●可決系數(shù)是非負(fù)的統(tǒng)計量52可決系數(shù)的作用第52頁,課件共105頁,創(chuàng)作于2023年2月聯(lián)系:數(shù)值上可決系數(shù)是相關(guān)系數(shù)的平方53可決系數(shù)與相關(guān)系數(shù)的關(guān)系第53頁,課件共105頁,創(chuàng)作于2023年2月區(qū)別:

可決系數(shù)相關(guān)系數(shù)

是就模型而言是就兩個變量而言說明解釋變量對被解釋說明兩變量線性依存程度

變量的解釋程度

度量不對稱的因果關(guān)系度量對稱的相關(guān)關(guān)系取值0≦≦1取值-1≦r≦1

有非負(fù)性可正可負(fù)54第54頁,課件共105頁,創(chuàng)作于2023年2月55第四節(jié)

回歸系數(shù)的區(qū)間估計和假設(shè)檢驗為什么要作區(qū)間估計?

運用OLS法可以估計出參數(shù)的一個估計值,但OLS估計只是通過樣本得到的點估計,它不一定等于真實參數(shù),還需要尋求真實參數(shù)的可能范圍,并說明其可靠性。為什么要作假設(shè)檢驗?OLS估計只是用樣本估計的結(jié)果,是否可靠?是否抽樣的偶然結(jié)果呢?還有待統(tǒng)計檢驗。區(qū)間估計和假設(shè)檢驗都是建立在確定參數(shù)估計值概率分布性質(zhì)的基礎(chǔ)上。第55頁,課件共105頁,創(chuàng)作于2023年2月56

一、OLS估計的分布性質(zhì)

基本思想

是隨機(jī)變量,必須確定其分布性質(zhì)才可能進(jìn)行區(qū)間估計和假設(shè)檢驗

怎樣確定的分布性質(zhì)呢?

是服從正態(tài)分布的隨機(jī)變量,決定

也是服從正態(tài)分布的隨機(jī)變量;

是的線性函數(shù),決定了也服從正態(tài)分布

正態(tài)正態(tài)正態(tài)

只要確定的期望和方差,即可確定的分布性質(zhì)線性特征(線性估計的重要性)第56頁,課件共105頁,創(chuàng)作于2023年2月57●的期望:

(已證明是無偏估計)●的方差和標(biāo)準(zhǔn)誤差

(證明見P39、P40)

(標(biāo)準(zhǔn)誤差是方差的平方根)

注意:以上各式中均未知,但是個常數(shù),其余均是已知的樣本觀測值,這時和都不是隨機(jī)變量。

的期望和方差第57頁,課件共105頁,創(chuàng)作于2023年2月58

基本思想:

是的方差,而不能直接觀測,只能從由樣本得到的去獲得有關(guān)的某些信息,去對作出估計??梢宰C明(見附錄2.2)其無偏估計為

(這里的n-2為自由度,即可自由變化的樣本觀測值個數(shù))注意區(qū)別:是未知的確定的常數(shù);是由樣本信息估計的,是個隨機(jī)變量對隨機(jī)擾動項方差的估計第58頁,課件共105頁,創(chuàng)作于2023年2月59對作標(biāo)準(zhǔn)化變換為什么要對作標(biāo)準(zhǔn)化變換?在正態(tài)性假定下,由前面的分析已知但在對一般正態(tài)變量作實際分析時,要具體確定的取值及對應(yīng)的概率,要通過正態(tài)分布密度函數(shù)或分布函數(shù)去計算是很麻煩的,為了便于直接利用“標(biāo)準(zhǔn)化正態(tài)分布的臨界值”,需要對作標(biāo)準(zhǔn)化變換。標(biāo)準(zhǔn)化的方式:

標(biāo)準(zhǔn)正態(tài)分布函數(shù)第59頁,課件共105頁,創(chuàng)作于2023年2月60

●在已知時對

作標(biāo)準(zhǔn)化變換,所得Z統(tǒng)計量為標(biāo)準(zhǔn)正態(tài)變量。

1.已知時,對作標(biāo)準(zhǔn)化變換注意:這時和都不是隨機(jī)變量(X、、都是非隨機(jī)的)第60頁,課件共105頁,創(chuàng)作于2023年2月61

條件:

當(dāng)未知時,可用(隨機(jī)變量)代替去估計

參數(shù)的標(biāo)準(zhǔn)誤差。這時參數(shù)估計的標(biāo)準(zhǔn)誤差是個隨機(jī)變量。

●樣本為大樣本時,作標(biāo)準(zhǔn)化變換所得的統(tǒng)計量Zk,也可以

視為標(biāo)準(zhǔn)正態(tài)變量(根據(jù)中心極限定理)。

●樣本為小樣本時,

用估計的參數(shù)標(biāo)準(zhǔn)誤差對作標(biāo)準(zhǔn)化變換,所得的統(tǒng)計量用t表示,這時t將不再服從正態(tài)分布,而是服從t分布(注意這時分母是隨機(jī)變量)

2.未知時,對作標(biāo)準(zhǔn)化變換第61頁,課件共105頁,創(chuàng)作于2023年2月基本思想:

對參數(shù)作出的點估計是隨機(jī)變量,雖然是無偏估計,但還不能說明這種估計的可靠性和精確性。如果能找到包含真實參數(shù)的一個范圍,并確定這樣的范圍包含參數(shù)真實值的可靠程度,將是對真實參數(shù)更深刻的認(rèn)識。方法:如果在確定參數(shù)估計式概率分布性質(zhì)的基礎(chǔ)上,可找到兩個正數(shù)δ和,能使得這樣的區(qū)間包含真實的概率為,即這樣的區(qū)間稱為所估計參數(shù)的置信區(qū)間。

討論:“如果已經(jīng)得出了的特定估計值,并確定了某個置信區(qū)間,這說明真實參數(shù)落入這個區(qū)間的概率為1-α”。這種說法對嗎?62

二、回歸系數(shù)的區(qū)間估計

第62頁,課件共105頁,創(chuàng)作于2023年2月63樣本容量充分大樣本容量較小總體方差已知總體方差

未知Z將接近標(biāo)準(zhǔn)正態(tài)分布服從

t分布三種情況基本思想:利用標(biāo)準(zhǔn)化后統(tǒng)計量的分布性質(zhì)去尋求:置信區(qū)間:標(biāo)準(zhǔn)正態(tài)分布第63頁,課件共105頁,創(chuàng)作于2023年2月(1)

當(dāng)總體方差已知時(Z服從正態(tài)分布)

取定(例如=0.05),查標(biāo)準(zhǔn)正態(tài)分布表得與對應(yīng)的臨界值z(例如z為1.96),則標(biāo)準(zhǔn)化變量Z*(統(tǒng)計量)

因為

即64回歸系數(shù)的區(qū)間估計

(分三種情況尋找合適的)

第64頁,課件共105頁,創(chuàng)作于2023年2月方法:可用無偏估計去代替未知的,由于樣本容量充分大,標(biāo)準(zhǔn)化變量Z*(統(tǒng)計量)將接近標(biāo)準(zhǔn)正態(tài)分布注意:這里的“

^”,表示“估計的”,這時區(qū)間估計的方式也可利用標(biāo)準(zhǔn)正態(tài)分布只是這時652.當(dāng)總體方差未知,且樣本容量充分大時

第65頁,課件共105頁,創(chuàng)作于2023年2月方法:用無偏估計去代替未知的,由于樣本容量較小,“標(biāo)準(zhǔn)化變量”

t(統(tǒng)計量)不再服從正態(tài)分布,而服從t分布。這時可用t分布去建立參數(shù)估計的置信區(qū)間。選定α,查t分布表得顯著性水平為,自由度為n-2的臨界值(n-2)

,則有即

663、當(dāng)總體方差未知,且樣本容量較小時

第66頁,課件共105頁,創(chuàng)作于2023年2月例1:研究某市城鎮(zhèn)居民人均鮮蛋需求量Y(公斤)與人均可支配收入X(元,1980年不變價計)的關(guān)系設(shè)定模型:

1995-2005年樣本數(shù)據(jù):估計參數(shù):年份19951996199719981999200020012002200320042005Y14.414.414.414.717.016.318.018.518.219.317.1X847.3821.0884.2903.7984.11035.31200.91289.81432.91539.01633.6第67頁,課件共105頁,創(chuàng)作于2023年2月計算可決系數(shù)例1:由前面的估計結(jié)果可計算出由數(shù)據(jù)Y可計算出:則估計結(jié)果:第68頁,課件共105頁,創(chuàng)作于2023年2月估計:給定查df=n-2=9的t分布臨界值參數(shù)區(qū)間估計:若給定查df=9的t分布臨界值69若給定則若給定則則第69頁,課件共105頁,創(chuàng)作于2023年2月7070統(tǒng)計量t計算的統(tǒng)計量為:相對于顯著性水平的臨界值為:

(單側(cè))或

(雙側(cè))基本概念回顧:

臨界值與概率、大概率事件與小概率事件0(大概率事件)(小概率事件)目的:簡單線性回歸中,檢驗X對Y是否真有顯著影響三、回歸系數(shù)的假設(shè)檢驗

第70頁,課件共105頁,創(chuàng)作于2023年2月71

回歸系數(shù)的檢驗方法

確立假設(shè):原假設(shè)為備擇假設(shè)為

(本質(zhì):檢驗是否為0,即檢驗是否對Y有顯著影響)

(1)當(dāng)已知或樣本容量足夠大時

可利用正態(tài)分布作Z檢驗

給定,查正態(tài)分布表得臨界值Z▼

如果則不拒絕原假設(shè)▼如果

則拒絕原假設(shè)第71頁,課件共105頁,創(chuàng)作于2023年2月72(2)當(dāng)未知,且樣本容量較小時

只能用去代替,可利用t分布作t檢驗:

給定,查t分布表得▼如果或者則拒絕原假設(shè)而不拒絕備擇假設(shè)▼如果則不拒絕原假設(shè)第72頁,課件共105頁,創(chuàng)作于2023年2月用P值判斷參數(shù)的顯著性假設(shè)檢驗的p值:

p值是基于既定的樣本數(shù)據(jù)所計算的統(tǒng)計量,拒絕原假設(shè)的最低顯著性水平。統(tǒng)計分析軟件中通常都給出了檢驗的p值

P統(tǒng)計量t計算的統(tǒng)計量:相對于顯著性水平的臨界值:或注意:t檢驗是比較和P值檢驗是比較和p與相對應(yīng)與P相對應(yīng)第73頁,課件共105頁,創(chuàng)作于2023年2月74用P值判斷參數(shù)顯著性的方法方法:將給定的顯著性水平與p值比較:?若值,必有,則在顯著性水平下拒絕原假設(shè),即認(rèn)為X對Y有顯著影響?若值,必有,則在顯著性水平下不拒絕原假設(shè),即認(rèn)為X對Y沒有顯著影響規(guī)則:當(dāng)時,P值越小,越能拒絕原假設(shè)第74頁,課件共105頁,創(chuàng)作于2023年2月75舉例:對例1參數(shù)的顯著性檢驗給定查df=9的t分布臨界值計算統(tǒng)計量判斷:因拒絕說明顯著不為0,X對Y確有顯著影響用P值檢驗:

(需要確定與

對應(yīng)的P值)由,df=9,查t分布表知道P<0.0005(t=4.781時)因t=5.00時的P值<0.0005(t=4.781)

<<則在顯著性水平下更應(yīng)拒絕原假設(shè)即認(rèn)為X對Y有顯著影響第75頁,課件共105頁,創(chuàng)作于2023年2月第五節(jié)

回歸模型預(yù)測

一、回歸分析結(jié)果的報告

經(jīng)過模型的估計、檢驗,得到一系列重要的數(shù)據(jù),為了簡明、清晰、規(guī)范地表述這些數(shù)據(jù),計量經(jīng)濟(jì)學(xué)通常采用以下規(guī)范化的方式:

例如:回歸結(jié)果為

=24·4545+0·5091

(6·4138)(0·0357)標(biāo)準(zhǔn)誤差SEt=(3·8128)(14·2605)t

統(tǒng)計量

=0·9621df=8可決系數(shù)和自由度

F=202·87DW=2.3F統(tǒng)計量DW統(tǒng)計量第76頁,課件共105頁,創(chuàng)作于2023年2月1.基本思想經(jīng)估計的計量經(jīng)濟(jì)模型可用于:經(jīng)濟(jì)結(jié)構(gòu)分析經(jīng)濟(jì)預(yù)測政策評價驗證理論●運用計量經(jīng)濟(jì)模型作預(yù)測:指利用所估計的樣本回歸函數(shù)作預(yù)測工具,用解釋變量的已知值或預(yù)測值,對預(yù)測期或樣本以外的被解釋變量的數(shù)值作出定量的估計?!裼嬃拷?jīng)濟(jì)預(yù)測是一種條件預(yù)測:

條件:◆模型設(shè)定的關(guān)系式不變

◆所估計的參數(shù)不變

◆解釋變量在預(yù)測期的取值已作出預(yù)測77

二、被解釋變量平均值預(yù)測

第77頁,課件共105頁,創(chuàng)作于2023年2月預(yù)測值、平均值、個別值的相互關(guān)系

Y

是對真實平均值的點估計,也是對個別值的點估計點預(yù)測值真實平均值個別值第78頁,課件共105頁,創(chuàng)作于2023年2月2、Y平均值的點預(yù)測

點預(yù)測:

用樣本估計的總體參數(shù)值所計算的Y的估計值直接作為Y的預(yù)測值方法:

將解釋變量預(yù)測值直接代入估計的方程

這樣計算的是一個點估計值

第79頁,課件共105頁,創(chuàng)作于2023年2月

3、Y平均值的區(qū)間預(yù)測

基本思想:●預(yù)測的目標(biāo)值是真實平均值,由于存在抽樣波動,預(yù)測的平均值不一定等于真實平均值,還需要對作區(qū)間估計●為對Y作區(qū)間預(yù)測,必須確定平均值點預(yù)測值的抽樣分布●

必須找出點預(yù)測值與預(yù)測目標(biāo)值的關(guān)系,即找出與二者都有關(guān)的統(tǒng)計量第80頁,課件共105頁,創(chuàng)作于2023年2月

具體作法(從的分布分析)

已知

可以證明

服從正態(tài)分布(為什么?),將其標(biāo)準(zhǔn)化,當(dāng)未知時,只得用代替,這時有(較復(fù)雜不具體證明)第81頁,課件共105頁,創(chuàng)作于2023年2月82顯然這樣的

t統(tǒng)計量與和都有關(guān)。給定顯著性水平α,查t分布表,得自由度n-2的臨界值,則有即Y平均值的置信度為的預(yù)測區(qū)間為構(gòu)建平均值的預(yù)測區(qū)間第82頁,課件共105頁,創(chuàng)作于2023年2月三、被解釋變量個別值預(yù)測

基本思想:

●既是對Y平均值的點預(yù)測,也是對Y個別值的點預(yù)測。●由于存在隨機(jī)擾動的影響,Y的平均值并不等于Y的個別值●為了對Y的個別值作區(qū)間預(yù)測,需要尋找與點預(yù)測值和預(yù)測目標(biāo)個別值有關(guān)的統(tǒng)計量,并要明確其概率分布第83頁,課件共105頁,創(chuàng)作于2023年2月

已知剩余項是與預(yù)測值及個別值都有關(guān)的變量,并且已知服從正態(tài)分布,且可證明

當(dāng)用代替時,對標(biāo)準(zhǔn)化的變量t為

84(較復(fù)雜不具體證明)

具體作法:

第84頁,課件共105頁,創(chuàng)作于2023年2月構(gòu)建個別值的預(yù)測區(qū)間給定顯著性水平,查t分布表得自由度為N—2的臨界值,則有

因此,一元回歸時Y的個別值的置信度為的預(yù)測區(qū)間上下限為

第85頁,課件共105頁,創(chuàng)作于2023年2月86

被解釋變量Y區(qū)間預(yù)測的特點

(1)Y平均值的預(yù)測值與真實平均值有誤差,主要是受抽樣波動影響

預(yù)測區(qū)間

Y個別值的預(yù)測值與真實個別值的差異,不僅受抽樣波動影響,而且還受隨機(jī)擾動項的影響

預(yù)測區(qū)間第86頁,課件共105頁,創(chuàng)作于2023年2月87(2)平均值和個別值預(yù)測區(qū)間都不是常數(shù),是隨的變化而變化的,當(dāng)時,預(yù)測區(qū)間最小。(3)預(yù)測區(qū)間上下限與樣本容量有關(guān),當(dāng)樣本容量n→∞時,個別值的預(yù)測區(qū)間只決定于隨機(jī)擾動的方差。預(yù)測區(qū)間第87頁,課件共105頁,創(chuàng)作于2023年2月88SRF各種預(yù)測值的關(guān)系Y的個別值的預(yù)測區(qū)間Y平均值的預(yù)測區(qū)間第88頁,課件共105頁,創(chuàng)作于2023年2月89第八節(jié)案例分析案例:中國全體居民的消費水平與經(jīng)濟(jì)發(fā)展數(shù)量關(guān)系的分析

提出問題:改革開放以來,隨著中國經(jīng)濟(jì)的快速發(fā)展,人民生活水平不斷提高,居民的消費水平也在不斷增長。研究中國全體居民的消費水平與經(jīng)濟(jì)發(fā)展的數(shù)量關(guān)系,對于探尋居民消費增長的規(guī)律性,預(yù)測居民消費的發(fā)展趨勢有重要意義。

理論分析:影響居民人均消費水平的因素有多種,但從理論和經(jīng)驗分析,最主要的影響因素應(yīng)是經(jīng)濟(jì)發(fā)展水平。從理論上說經(jīng)濟(jì)發(fā)展水平越高,居民消費越多。第89頁,課件共105頁,創(chuàng)作于2023年2月90變量選擇:被解釋變量選擇能代表城鄉(xiāng)所有居民消費的“全體居民人均年消費水平”(元/人);解釋變量選擇表現(xiàn)經(jīng)濟(jì)增長水平的“人均國民生產(chǎn)總值(人均

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論