線性回歸模型_第1頁
線性回歸模型_第2頁
線性回歸模型_第3頁
線性回歸模型_第4頁
線性回歸模型_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

關(guān)于線性回歸模型2024/4/62

2.1模型的建立及其假定條件變量之間的關(guān)系回歸分析的概念一元線性回歸模型隨機誤差項的假定第2頁,共87頁,2024年2月25日,星期天2024/4/632.1模型的建立及其假定條件1變量之間的關(guān)系經(jīng)濟變量之間的關(guān)系,大體可分為兩類:確定性關(guān)系或函數(shù)關(guān)系:變量之間存在確定的函數(shù)關(guān)系例如:某企業(yè)的銷售收入Y與其產(chǎn)品價格P和銷售量X的關(guān)系為:Y=PX第3頁,共87頁,2024年2月25日,星期天2024/4/642.1模型的建立及其假定條件統(tǒng)計依賴或相關(guān)關(guān)系:變量之間存在非確定的依賴關(guān)系.研究的是非確定現(xiàn)象隨機變量間的關(guān)系。例如:某企業(yè)資金投入X與產(chǎn)出Y的關(guān)系。Y=f(X)+u

對變量間統(tǒng)計依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的第4頁,共87頁,2024年2月25日,星期天2024/4/652.1模型的建立及其假定條件2回歸分析的概念回歸分析研究一個變量關(guān)于另一個(些)變量的具體依賴關(guān)系的計算方法和理論。

其用意:在于通過后者的已知或設(shè)定值,去估計(或)預(yù)測前者的(總體)均值。第5頁,共87頁,2024年2月25日,星期天2024/4/662.1模型的建立及其假定條件

回歸分析的基本思想和方法以及“回歸”名稱的由來英國統(tǒng)計學家高爾頓(F.Galton,1822-1911)和他的學生皮爾遜(K.Pearson,1856-1936)在研究父母身高與其子女身高的遺傳問題時,觀察了1078對夫婦,以每對夫婦的平均身高作為自變量,而取他們的一個成年兒子的身高作為因變量,將結(jié)果在平面直角坐標系上繪成散點圖,發(fā)現(xiàn)趨勢近乎一條直線,計算出的回歸直線方程為:

y=33.73+0.516x這一方程表明:父母平均身高每增減一個單位時,其年子女的身高僅平增減0.516個單位第6頁,共87頁,2024年2月25日,星期天2024/4/67

這項研究結(jié)果表明,雖然高個子父輩有生高個子兒子的趨勢,矮個子的父輩有生矮個子兒子的趨勢,但父輩身高增減一個單位,兒子身高僅增減半個單位左右。通俗地說,一群特高個子父輩的兒子們在同齡人中平均僅為高個子,一群高個子父輩的兒子們在同齡人中平均僅為略高個子;一群特矮個子父輩的兒子們在同齡人中平均僅為矮個子,一群矮個子父輩的兒子們在同齡人中平均僅為略矮個子,即子代的平均身高向中間回歸了。所以高爾頓引用了“回歸”(regression)一詞來描述父輩身高與子代身高之間的關(guān)系。盡管“回歸”這個名稱的由來具有特定的含義,但是,人們在研究大量的經(jīng)濟變量間的統(tǒng)計關(guān)系時已遠遠超出了這一特定的含義了,我們現(xiàn)在使用回歸這一名稱僅僅是接受了高爾頓先生的回歸分析基本思想和方法

第7頁,共87頁,2024年2月25日,星期天2024/4/682.1模型的建立及其假定條件3一元線性回歸模型

一元線性回歸模型表示如下:

yi=β0+β1xi+ui

yi稱為

被解釋變量(因變量)

xi

稱為解釋變量(自變量)

β0、β1——回歸系數(shù)(待定系數(shù)或待定參數(shù))

0稱作常數(shù)項(截距項),

1稱作斜率系數(shù)。ui是計量經(jīng)濟模型區(qū)別于數(shù)學模型的最關(guān)鍵的標志,稱之為隨機擾動項或誤差項。正是u的隨機性使得我們可以采用統(tǒng)計推斷方法對模型的設(shè)定進行嚴格的檢驗。第8頁,共87頁,2024年2月25日,星期天2024/4/692.1模型的建立及其假定條件

線性回歸模型”中的“線性”一詞在這里的含義:是指被解釋變量y與解釋變量x之間為線性關(guān)系,即解釋變量x僅以一次方的形式出現(xiàn)在模型之中。第9頁,共87頁,2024年2月25日,星期天2024/4/6102.1模型的建立及其假定條件一般來說,回歸模型的隨機誤差項中可能包括如下幾項內(nèi)容。(1)未在模型中列出的影響y變化的非重要解釋變量。如消費模型中家庭人口數(shù)、消費習慣、物價水平差異等因素的影響都包括在隨機誤差項中。(2)人的隨機行為。經(jīng)濟活動都是人參與的。人的經(jīng)濟行為的變化也會對隨機誤差項產(chǎn)生影響。第10頁,共87頁,2024年2月25日,星期天2.1模型的建立及其假定條件(3)數(shù)學模型形式欠妥。對于同一組觀測值,若擬合的數(shù)學模型形式不同,則相應(yīng)的隨機誤差項的值也不同。當模型形式欠妥時,會直接對隨機誤差項的值帶來影響。(4)歸并誤差。模型中被解釋變量的值常常是歸并而成的。當歸并不合理時,會產(chǎn)生誤差。如由不同種類糧食合并構(gòu)成的糧食產(chǎn)量的不合理歸并會帶來歸并誤差。(5)測量誤差。當對被解釋變量的測量存在誤差時,這種誤差將包括在隨機誤差項中第11頁,共87頁,2024年2月25日,星期天2024/4/6122.1模型的建立及其假定條件4隨機誤差項的假定條件(1)零均值假定E(ui)=0i=1,2,……這表示對X的每個觀測值來說,u可以取不同的值,有些大于零,有些小于零,考慮u的所有可能取值,他們的總體平均值等于零.

第12頁,共87頁,2024年2月25日,星期天2.1模型的建立及其假定條件(2)同方差性假定

Var(ui)=

u2

i=1,2,……這表明在各次觀測中u具有相同的方差,也就是各次觀測所受的隨機影響的程度相同.第13頁,共87頁,2024年2月25日,星期天協(xié)方差的定義

E[(X-E(X))(Y-E(Y))]稱為隨機變量X和Y的協(xié)方差,記作COV(X,Y),即COV(X,Y)=E[(X-E(X))(Y-E(Y))].計算公式為:Cov(X,Y)=E(XY)-E(X)E(Y)

協(xié)方差可以度量兩個變量之間的相關(guān)關(guān)系,如果兩個變量的協(xié)方差為零,則表明這兩個變量之間不存在相關(guān)關(guān)系.第14頁,共87頁,2024年2月25日,星期天2.1模型的建立及其假定條件(3)無序列相關(guān)假定Cov(ui,uj)=0i≠ji,j=1,2,…這表明,在任意兩次觀測時,ui,uj是不相關(guān)的,即u在某次觀測中取的值與任何其它次觀測中取的值互不影響.第15頁,共87頁,2024年2月25日,星期天2.1模型的建立及其假定條件(4)解釋變量與誤差項不相關(guān)假定

Cov(Xi,ui)=0i=1,2,……這一假定表明隨機項u與自變量x不相關(guān).提出這一假定是因為在建立回歸模型時,我們用隨機項u綜合了未包含在模型中的那些自變量以及其它因素對因變量Y的影響.因此,應(yīng)該把X對Y的影響和u對Y的影響區(qū)分開來.如果兩者相關(guān),就不可能把各自對Y的影響區(qū)分開來第16頁,共87頁,2024年2月25日,星期天2024/4/6172.1模型的建立及其假定條件(5)正態(tài)分布假定ui~N(0,u2)i=1,2,…第17頁,共87頁,2024年2月25日,星期天2024/4/6182.2一元線性回歸模型的參數(shù)估計1幾個重要的概念對于一元線性回歸模型,隨機誤差項滿足古典假設(shè)條件,這個線性回歸模型稱為X,Y之間的總體回歸模型。兩邊取條件均值,得一元線性回歸方程:

簡稱總體回歸方程(總體回歸線)。其中總體回歸系數(shù)

是未知的,實際上總體回歸線是無法求得的,它只是理論上的存在,所以稱為理論回歸方程第18頁,共87頁,2024年2月25日,星期天2024/4/6192.2一元線性回歸模型的參數(shù)估計如果變量x和y之間存在線性相關(guān)關(guān)系,對于任意抽取的若干個觀測(樣本)值(xi

,yi),有(2.2.1)

我們稱(2.2.1)為樣本回歸模型,、為、的估計值或估計量。樣本回歸模型由兩部分組成:稱為系統(tǒng)分量,是可以被x解釋的部分,也稱為可解釋分量;是不能被解釋的部分,稱為殘差(Residual),它是隨機項ui的代表值,也稱為不可解釋分量。將系統(tǒng)分量表示為(2.2.2)

第19頁,共87頁,2024年2月25日,星期天2024/4/6202.2一元線性回歸模型的參數(shù)估計

式(2.2.2)稱為一元線性樣本回歸方程,簡稱樣本回歸方程。又因(2.2.2)式的建立依賴于樣本觀測值(xi,yi),所以我們又稱其為經(jīng)驗回歸方程。、為樣本回歸系數(shù)。其中是估計的回歸直線在y軸截距,是直線的斜率。。的實際意義為x每變動一個單位時,y的平均變動值,即x的變動對y變動的邊際貢獻率;是實際觀測值y的擬合值或估計值我們用一個圖來表示yi,,E(yi,)、、ui、ei第20頁,共87頁,2024年2月25日,星期天2024/4/6212.2一元線性回歸模型的參數(shù)估計

Y

iY

ie

iY?

XiX

第21頁,共87頁,2024年2月25日,星期天2024/4/6222.2一元線性回歸模型的參數(shù)估計2普通最小二乘法給定一組樣本觀測值(Xi,Yi)(i=1,2,…n)要求樣本回歸函數(shù)盡可能好地擬合這組值.普通最小二乘法(Ordinaryleastsquares,OLS)給出的判斷標準是:二者之差的平方和最小即在給定樣本觀測值之下,選擇出、能使yi,之差的平方和最小(即為使殘差平方和最?。?/p>

第22頁,共87頁,2024年2月25日,星期天2024/4/6232.2一元線性回歸模型的參數(shù)估計方程組(*)稱為正規(guī)方程組(normalequations)。

第23頁,共87頁,2024年2月25日,星期天2024/4/6242.2一元線性回歸模型的參數(shù)估計記上述參數(shù)估計量可以寫成:

上式稱為OLS估計量的離差形式。由于參數(shù)的估計結(jié)果是通過最小二乘法得到的,故稱為普通最小二乘估計量(ordinaryleastsquaresestimators)。

第24頁,共87頁,2024年2月25日,星期天2024/4/6252.2一元線性回歸模型的參數(shù)估計3最小二乘直線的性質(zhì)(1)殘差ei的均值等于0因為,所以(2)殘差ei與解釋變量xi不相關(guān)即(3)樣本回歸直線經(jīng)過點()(4)被解釋變量的樣本平均值等于其估計值的平均值第25頁,共87頁,2024年2月25日,星期天2024/4/6262.2一元線性回歸模型的參數(shù)估計4截距為零的一元線性回歸模型的參數(shù)估計截距為零的一元線性回歸模型的一般形式為:這個模型只有一個參數(shù)需要估計,其最小二乘估計量的表達式為

第26頁,共87頁,2024年2月25日,星期天2024/4/6272.2一元線性回歸模型的參數(shù)估計例2.2.1題:一個假想的生活小區(qū)有100戶家庭組成,要研究該小區(qū)每月家庭消費支出Y與每月家庭可支配收入X的關(guān)系。首先得到這100戶家庭的每月家庭消費支出和每月家庭可支配收入的數(shù)據(jù),并把100戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費支出,分組如下:第27頁,共87頁,2024年2月25日,星期天2024/4/628第28頁,共87頁,2024年2月25日,星期天2024/4/629建立變量X與Y之間的樣本回歸模型:利用分組數(shù)據(jù)估計模型參數(shù),參數(shù)估計的計算可通過下面的表進行

iX

iY

ix

iy

iiyx

2ix

2iy

2iX

2iY

1

800

594

-1350

-973

1314090

1822500

947508

640000

352836

2

1100

638

-1050

-929

975870

1102500

863784

1210000

407044

3

1400

1122

-750

-445

334050

562500

198381

1960000

1258884

4

1700

1155

-450

-412

185580

202500

170074

2890000

1334025

5

2000

1408

-150

-159

23910

22500

25408

4000000

1982464

6

2300

1595

150

28

4140

22500

762

5290000

2544025

7

2600

1969

450

402

180720

202500

161283

6760000

3876961

8

2900

2078

750

511

382950

562500

260712

8410000

4318084

9

3200

2585

1050

1018

1068480

1102500

1035510

10240000

6682225

10

3500

2530

1350

963

1299510

1822500

926599

12250000

6400900

求和

21500

15674

5769300

7425000

4590020

53650000

29157448

平均

2150

1567

第29頁,共87頁,2024年2月25日,星期天2024/4/6302.2一元線性回歸模型的參數(shù)估計因此,由該樣本估計的回歸方程為:

第30頁,共87頁,2024年2月25日,星期天2024/4/6312.3最小二乘估計量的統(tǒng)計性質(zhì)

第31頁,共87頁,2024年2月25日,星期天2024/4/6322、無偏性,即估計量0?b、1?b的均值(期望)等于總體回歸參數(shù)真值b0與b1

證明:易知故同樣地,容易得出

第32頁,共87頁,2024年2月25日,星期天2024/4/6332.3最小二乘估計量的統(tǒng)計性質(zhì)

3、有效性(最小方差性),即在所有線性無偏估計量中,最小二乘估計量0?b、1?b具有最小方差。

(1)先求0?b與1?b的方差

第33頁,共87頁,2024年2月25日,星期天2024/4/634(2)證明最小方差性其中,ci=ki+di,di為不全為零的常數(shù)則容易證明假設(shè)*1?b是其他估計方法得到的關(guān)于b1的線性無偏估計量:

普通最小二乘估計量(ordinaryleastSquaresEstimators)稱為最佳線性無偏估計量(bestlinearunbiasedestimator,BLUE)

第34頁,共87頁,2024年2月25日,星期天例:令kids表示一名婦女生育孩子的數(shù)目,educ表示該婦女接受過教育的年數(shù)。生育率對教育年數(shù)的簡單回歸模型為:(1)隨機擾動項包含什么樣的因素?它們可能與教育水平相關(guān)嗎?(2)上述簡單回歸分析能夠揭示教育對生育率在其他條件不變下的影響嗎?請解釋。第35頁,共87頁,2024年2月25日,星期天(1)收入、年齡、家庭狀況、政府的相關(guān)政策等也是影響生育率的重要的因素,在上述簡單回歸模型中,它們被包含在了隨機擾動項之中。有些因素可能與增長率水平相關(guān),如收入水平與教育水平往往呈正相關(guān)、年齡大小與教育水平呈負相關(guān)等。(2)當歸結(jié)在隨機擾動項中的重要影響因素與模型中的教育水平educ相關(guān)時,上述回歸模型不能夠揭示教育對生育率在其他條件不變下的影響,因為這時出現(xiàn)解釋變量與隨機擾動項相關(guān)的情形,基本假設(shè)4不滿足。第36頁,共87頁,2024年2月25日,星期天例.已知回歸模型,式中E為某類公司一名新員工的起始薪金(元),N為所受教育水平(年)。隨機擾動項的分布未知,其他所有假設(shè)都滿足。(1)從直觀及經(jīng)濟角度解釋和。(2)OLS估計量和滿足線性性、無偏性及有效性嗎?簡單陳述理由。第37頁,共87頁,2024年2月25日,星期天(1)為接受過N年教育的員工的總體平均起始薪金。當N為零時,平均薪金為才,因此表示沒有接受過教育員工的平均起始薪金。是每單位N變化所引起的E的變化,即表示每多接受一年學校教育所對應(yīng)的薪金增加值。(2)OLS估計量和仍滿足線性性、無偏性及有效性,因為這些性質(zhì)的的成立無需隨機擾動項的正態(tài)分布假設(shè)。第38頁,共87頁,2024年2月25日,星期天2024/4/6392.4用樣本可決系數(shù)檢驗回歸方程的擬合優(yōu)度回歸分析是要通過樣本所估計的參數(shù)來代替總體的真實參數(shù),或者說是用樣本回歸線代替總體回歸線。盡管從統(tǒng)計性質(zhì)上已知,如果有足夠多的重復(fù)抽樣,參數(shù)的估計值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計值不一定就等于該真值。那么,在一次抽樣中,參數(shù)的估計值與真值的差異有多大,是否顯著,這就需要進一步進行統(tǒng)計檢驗。

主要包括擬合優(yōu)度檢驗、變量的顯著性檢驗及參數(shù)的區(qū)間估計。第39頁,共87頁,2024年2月25日,星期天2024/4/6402.4用樣本可決系數(shù)檢驗回歸方程的擬合優(yōu)度擬合優(yōu)度檢驗:對樣本回歸直線與樣本觀測值之間擬合程度的檢驗?;舅悸罚阂蜃兞縔的變異,能夠被X的變異解釋的比例越大,則OLS回歸線對總體的解釋程度就越好。也即是樣本觀測值距回歸線越近,擬合優(yōu)度越好,X對Y的解釋程度就越強

度量擬合優(yōu)度的指標:樣本決定系數(shù)r2第40頁,共87頁,2024年2月25日,星期天2024/4/6412.4用樣本可決系數(shù)檢驗回歸方程的擬合優(yōu)度1總離差平方和的分解

已知由一組樣本觀測值(Xi,Yi),i=1,2…,n得到如下樣本回歸直線:而Y的第i個觀測值與樣本均值的離差可分解為兩部分之和:

第41頁,共87頁,2024年2月25日,星期天2024/4/642

如果Yi=?i即實際觀測值落在樣本回歸“線”上,則擬合最好??烧J為,“離差”全部來自回歸線,而與“殘差”無關(guān)。第42頁,共87頁,2024年2月25日,星期天2024/4/643對于所有樣本點,則需考慮這些點與樣本均值離差的平方和,可以證明:記:總離差平方和(TotalSumofSquares)回歸平方和(ExplainedSumofSquares)殘差平方和(ResidualSumofSquares

)第43頁,共87頁,2024年2月25日,星期天2024/4/6442.4用樣本可決系數(shù)檢驗回歸方程的擬合優(yōu)度

即:TSS=ESS+RSS

Y的觀測值圍繞其均值的總離差可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機勢力(RSS)。在給定樣本中,TSS不變,如果實際觀測點離樣本回歸線越近,則ESS在TSS中占的比重越大,因此定義擬合優(yōu)度:回歸平方和ESS/總離差TSS第44頁,共87頁,2024年2月25日,星期天2024/4/6452.4用樣本可決系數(shù)檢驗回歸方程的擬合優(yōu)度2樣本可決系數(shù)也可表示為稱r2為(樣本)決定系數(shù)/判定系數(shù),可決系數(shù)可決系數(shù)的取值范圍:[0,1]

r2越接近1,說明實際觀測點離樣本線越近,擬合優(yōu)度越高。第45頁,共87頁,2024年2月25日,星期天2024/4/6462.4用樣本可決系數(shù)檢驗回歸方程的擬合優(yōu)度在例2.1.1的收入-消費支出例中第46頁,共87頁,2024年2月25日,星期天這表示在消費支出的變異中,有97.66%的變異是由收入的變異所解釋。即家庭每月的消費支出的97.66%取決于收入。第47頁,共87頁,2024年2月25日,星期天2024/4/6482.4用樣本可決系數(shù)檢驗回歸方程的擬合優(yōu)度3樣本相關(guān)系數(shù)

樣本相關(guān)系數(shù)是變量X與Y之間線性相關(guān)程度的度量指標,其定義為:

樣本相關(guān)系數(shù)表示x和y的線性相關(guān)關(guān)系的密切程度。其取值范圍為|r|1,即-1r1。當r=-1時,表示x與y之間完全負相關(guān);當r=1時,表示x與y之間完全正相關(guān);當r=0時,表示x與y之間無線性相關(guān)關(guān)系,即說明x與y可能無相關(guān)關(guān)系或x與y之間存在非線性相關(guān)

關(guān)系第48頁,共87頁,2024年2月25日,星期天下表列出若干對自變量與因變量。對每一對變量,你認為它們之間的關(guān)系如何?是正的、負的、還是無法確定?并說明理由。

因變量自變量個人儲蓄利率小麥產(chǎn)出降雨量美國國防開支前蘇聯(lián)國防開支老師的計量經(jīng)濟學教學學生的計量經(jīng)濟學成績總統(tǒng)聲譽任職時間學生計量經(jīng)濟學成績其統(tǒng)計學成績?nèi)毡酒嚨倪M口量美國人均國民收入第49頁,共87頁,2024年2月25日,星期天2024/4/6502.4用樣本可決系數(shù)檢驗回歸方程的擬合優(yōu)度樣本相關(guān)系數(shù)的檢驗由于一元線性回歸方程研究的是變量x與變量y之間的線性相關(guān)關(guān)系,所以我們可以用反映變量x與變量y之間的相關(guān)關(guān)系密切程度的相關(guān)系數(shù)來檢驗回歸方程的顯著性。

檢驗的步驟為:

(1)提出原假設(shè)H0:=0

備擇假設(shè)H1:

(2)構(gòu)造t統(tǒng)計量~

第50頁,共87頁,2024年2月25日,星期天2024/4/6512.4用樣本可決系數(shù)檢驗回歸方程的擬合優(yōu)度(3)給出顯著性水平,查自由度v=n-2的t分布表,得臨界值

(4)當時,接受原假設(shè),認為總體相關(guān)系數(shù)等于零,X與Y之間沒有顯著的線性相關(guān)關(guān)系

當時,拒絕原假設(shè),接受備擇假設(shè),認為X與Y之間具有顯著的線性相關(guān)關(guān)系。第51頁,共87頁,2024年2月25日,星期天2024/4/6522.5回歸系數(shù)估計值的顯著性檢驗與置信區(qū)間1隨機變量u的方差

我們在證明最小二乘估計量的有效性的時候已經(jīng)得出參數(shù)和的概率分布為:

~~

在估計的參數(shù)和的方差表達式中,都還有隨機擾動項ui的方差,由于實際上是未知的,因此和

的方差實際上是無法計算的,這就需要對其進行估計。

第52頁,共87頁,2024年2月25日,星期天2024/4/6532.5回歸系數(shù)估計值的顯著性檢驗與置信區(qū)間

由于隨機項ui不可觀測,只能從ui的估計—殘差ei出發(fā),對總體方差進行估計??梢宰C明的最小二乘估計量為

它是關(guān)于的無偏估計量

第53頁,共87頁,2024年2月25日,星期天在隨機誤差項ui的方差估計出后,參數(shù)0?b和1?b的方差和標準差的估計量分別是:

1?b的樣本方差:

?=22?1ixSb

1?b的樣本標準差:

?=2?1ixSb

0?b的樣本方差:

??=222?0iixnXSb

0?b的樣本標準差:

??=22?0iixnXSb

第54頁,共87頁,2024年2月25日,星期天2024/4/6552.5回歸系數(shù)估計值的顯著性檢驗與置信區(qū)間2回歸系數(shù)估計值的顯著性檢驗——t檢驗回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個顯著性的影響因素。在一元線性模型中,就是要判斷X是否對Y具有顯著的線性性影響。這就需要進行變量的顯著性檢驗。即是檢驗系數(shù)是否顯著地不等于零,也就是檢驗樣本是否取自其真實參數(shù)為零的總體.第55頁,共87頁,2024年2月25日,星期天第56頁,共87頁,2024年2月25日,星期天

檢驗步驟:

(1)對總體參數(shù)提出假設(shè)

H0:

1=0,H1:10(2)以原假設(shè)H0構(gòu)造t統(tǒng)計量,并由樣本計算其值(3)給定顯著性水平,查t分布表,得臨界值t/2(n-2)(4)比較,判斷若|t|>t/2(n-2),則拒絕H0

,接受H1

;若|t|

t/2(n-2),則拒絕H1

,接受H0

;t=第57頁,共87頁,2024年2月25日,星期天

對于一元線性回歸方程中的

0,可構(gòu)造如下t統(tǒng)計量進行顯著性檢驗:

在上述收入-消費支出例中,首先計算的估計值

第58頁,共87頁,2024年2月25日,星期天t統(tǒng)計量的計算結(jié)果分別為:

給定顯著性水平

=0.05,查t分布表得臨界值

t0.05/2(8)=2.306|t1|>2.306,說明家庭可支配收入在95%的置信度下顯著,即是消費支出的主要解釋變量;

|t0|<2.306,表明在95%的置信度下,無法拒絕截距項為零的假設(shè)。

第59頁,共87頁,2024年2月25日,星期天3回歸系數(shù)的置信區(qū)間

為了反映回歸系數(shù)的估計精度,需給出其區(qū)間估計,即在置信水平為下的置信區(qū)間。置信區(qū)間長度越短,說明估計值和與參數(shù)和就越接近,估計值就越精確;反之,就越不精確第60頁,共87頁,2024年2月25日,星期天區(qū)間估計的步驟:1)找一個含有該參數(shù)的統(tǒng)計量;

2)構(gòu)造一個概率為的事件;

3)通過該事件解出該參數(shù)的區(qū)間估計.第61頁,共87頁,2024年2月25日,星期天

1.對于參數(shù),我們知道統(tǒng)計量中含有參數(shù)2.構(gòu)造關(guān)于統(tǒng)計量t的概率為的事件事件為:把代入上面的式子整理得到:3.得到的的置信區(qū)間

第62頁,共87頁,2024年2月25日,星期天根據(jù)同樣的方法我們可以求出的置信區(qū)間第63頁,共87頁,2024年2月25日,星期天2.6一元線性回歸方程的預(yù)測1點預(yù)測所謂點預(yù)測,是將x的一個特定值代入樣本回歸方程,計算得出的就是y0的點預(yù)測值。

對于一元線性回歸方程對于給定的樣本以外的解釋變量的觀測值x0,可以得到被解釋變量的預(yù)測值我們還是以家庭收入與消費的例子的資料為例第64頁,共87頁,2024年2月25日,星期天2.6一元線性回歸方程的預(yù)測我們已經(jīng)估計出其一元線性回歸方程:預(yù)測收入為4000元的家庭的消費支出:第65頁,共87頁,2024年2月25日,星期天2.6一元線性回歸方程的預(yù)測2區(qū)間預(yù)測(1)個值的預(yù)測區(qū)間

由Yi=

0+1Xi+u

知:定義預(yù)測誤差:

于是

第66頁,共87頁,2024年2月25日,星期天式中

:從而在1-

的置信度下,Y0的置信區(qū)間為第67頁,共87頁,2024年2月25日,星期天2.6一元線性回歸方程的預(yù)測(2)總體均值的預(yù)測區(qū)間于是第68頁,共87頁,2024年2月25日,星期天可以證明

因此故其中第69頁,共87頁,2024年2月25日,星期天于是,在1-

的置信度下,總體均值E(Y|X0)的置信區(qū)間為第70頁,共87頁,2024年2月25日,星期天在上述收入-消費支出例中,得到的樣本回歸函數(shù)為則在X0=1000處,?0=–103.172+0.777×1000=673.84

而因此,總體均值E(Y|X=1000)的95%的置信區(qū)間為:

673.84-2.306

61.05<E(Y|X=1000)<673.84+2.306

61.05或

(533.05,814.62)

第71頁,共87頁,2024年2月25日,星期天同樣地,對于Y在X=1000的個體值,其95%的置信區(qū)間為:

(372.03,975.65)總體回歸函數(shù)的置信帶(域)個體的置信帶(域)

第72頁,共87頁,2024年2月25日,星期天對于Y的總體均值E(Y|X)與個體值的預(yù)測區(qū)間(置信區(qū)間):(1)樣本容量n越大,預(yù)測精度越高,反之預(yù)測精度越低(2)樣本容量一定時,置信帶的寬度當在X均值處最小,其附近進行預(yù)測(插值預(yù)測)精度越大;X越遠離其均值,置信帶越寬,預(yù)測可信度下降。第73頁,共87頁,2024年2月25日,星期天小結(jié):簡單線性回歸分析的主要步驟1、建立回歸模型研究某一經(jīng)濟現(xiàn)象,先根據(jù)經(jīng)濟理論,選擇具有因果關(guān)系的兩個變量(X,Y),建立線性回歸模型,確定解釋變量和被解釋變量。如果不明確兩個變量是否為線性關(guān)系,也可以根據(jù)散點圖來分析。建立回歸模型可以是根據(jù)經(jīng)濟理論,也可以根據(jù)相同或相似經(jīng)濟現(xiàn)象的歷史分析經(jīng)驗來建立回歸模型。建立模型時,不僅要考慮理論或經(jīng)驗的依據(jù),同時也要考慮數(shù)據(jù)的可利用程度。2、收集數(shù)據(jù),并經(jīng)過適當?shù)募庸ふ?,得到適于回歸分析的樣本數(shù)據(jù)集。第74頁,共87頁,2024年2月25日,星期天3、估計模型參數(shù)。利用樣本數(shù)據(jù),以O(shè)LS得到模型參數(shù)的估計值。4、對回歸模型和參數(shù)估計值進行檢驗。檢驗回歸結(jié)果是否正確反映經(jīng)濟現(xiàn)象,是否與理論相符。包括理論檢驗和統(tǒng)計檢驗。經(jīng)濟理論檢驗:參數(shù)的符號,大小是否與理論和實際相符。若不符,尋找原因統(tǒng)計檢驗:擬和優(yōu)度檢驗,回歸參數(shù)的顯著性檢驗和區(qū)間估計。第75頁,共87頁,2024年2月25日,星期天5、預(yù)測對于解釋變量的特定值,代入回歸方程得到因變量的預(yù)測值;在給定的置信水平上,得到因變量預(yù)測值的置信區(qū)間。6、回歸結(jié)果的表述:

并說明參數(shù)的顯著水平()。第76頁,共87頁,2024年2月25日,星期天提供回歸分析結(jié)果一般有兩種方式:(1)=6.70+0.58XR2=0.49

(1.38)(2.76)

這里6.70和0.58分別為

和的估計值和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論