線性回歸模型

上傳人：春*** IP屬地：廣東上傳時(shí)間：2024-04-06 格式：PPT 頁數(shù)：87 大小：2.08MB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩82頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

關(guān)于線性回歸模型2024/4/62

2.1模型的建立及其假定條件變量之間的關(guān)系回歸分析的概念一元線性回歸模型隨機(jī)誤差項(xiàng)的假定第2頁,共87頁，2024年2月25日，星期天2024/4/632.1模型的建立及其假定條件1變量之間的關(guān)系經(jīng)濟(jì)變量之間的關(guān)系，大體可分為兩類：確定性關(guān)系或函數(shù)關(guān)系：變量之間存在確定的函數(shù)關(guān)系例如：某企業(yè)的銷售收入Y與其產(chǎn)品價(jià)格P和銷售量X的關(guān)系為：Y=PX第3頁,共87頁，2024年2月25日，星期天2024/4/642.1模型的建立及其假定條件統(tǒng)計(jì)依賴或相關(guān)關(guān)系：變量之間存在非確定的依賴關(guān)系.研究的是非確定現(xiàn)象隨機(jī)變量間的關(guān)系。例如：某企業(yè)資金投入X與產(chǎn)出Y的關(guān)系。Y=f(X)+u

對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的第4頁,共87頁，2024年2月25日，星期天2024/4/652.1模型的建立及其假定條件2回歸分析的概念回歸分析研究一個(gè)變量關(guān)于另一個(gè)（些）變量的具體依賴關(guān)系的計(jì)算方法和理論。

其用意：在于通過后者的已知或設(shè)定值，去估計(jì)（或）預(yù)測(cè)前者的（總體）均值。第5頁,共87頁，2024年2月25日，星期天2024/4/662.1模型的建立及其假定條件

回歸分析的基本思想和方法以及“回歸”名稱的由來英國統(tǒng)計(jì)學(xué)家高爾頓（F.Ｇalton，1822－1911）和他的學(xué)生皮爾遜（Ｋ.Pearson，1856－1936）在研究父母身高與其子女身高的遺傳問題時(shí)，觀察了1078對(duì)夫婦，以每對(duì)夫婦的平均身高作為自變量，而取他們的一個(gè)成年兒子的身高作為因變量，將結(jié)果在平面直角坐標(biāo)系上繪成散點(diǎn)圖，發(fā)現(xiàn)趨勢(shì)近乎一條直線，計(jì)算出的回歸直線方程為：

y＝33.73＋0.516x這一方程表明：父母平均身高每增減一個(gè)單位時(shí)，其年子女的身高僅平增減0.516個(gè)單位第6頁,共87頁，2024年2月25日，星期天2024/4/67

這項(xiàng)研究結(jié)果表明，雖然高個(gè)子父輩有生高個(gè)子兒子的趨勢(shì)，矮個(gè)子的父輩有生矮個(gè)子兒子的趨勢(shì)，但父輩身高增減一個(gè)單位，兒子身高僅增減半個(gè)單位左右。通俗地說，一群特高個(gè)子父輩的兒子們?cè)谕g人中平均僅為高個(gè)子，一群高個(gè)子父輩的兒子們?cè)谕g人中平均僅為略高個(gè)子；一群特矮個(gè)子父輩的兒子們?cè)谕g人中平均僅為矮個(gè)子，一群矮個(gè)子父輩的兒子們?cè)谕g人中平均僅為略矮個(gè)子，即子代的平均身高向中間回歸了。所以高爾頓引用了“回歸”（regression）一詞來描述父輩身高與子代身高之間的關(guān)系。盡管“回歸”這個(gè)名稱的由來具有特定的含義，但是，人們?cè)谘芯看罅康慕?jīng)濟(jì)變量間的統(tǒng)計(jì)關(guān)系時(shí)已遠(yuǎn)遠(yuǎn)超出了這一特定的含義了，我們現(xiàn)在使用回歸這一名稱僅僅是接受了高爾頓先生的回歸分析基本思想和方法

第7頁,共87頁，2024年2月25日，星期天2024/4/682.1模型的建立及其假定條件3一元線性回歸模型

一元線性回歸模型表示如下：

yi=β0＋β1xi+ui

yi稱為

被解釋變量（因變量）

稱為解釋變量（自變量）

β0、β1——回歸系數(shù)（待定系數(shù)或待定參數(shù)）

0稱作常數(shù)項(xiàng)（截距項(xiàng)），

1稱作斜率系數(shù)。ui是計(jì)量經(jīng)濟(jì)模型區(qū)別于數(shù)學(xué)模型的最關(guān)鍵的標(biāo)志，稱之為隨機(jī)擾動(dòng)項(xiàng)或誤差項(xiàng)。正是u的隨機(jī)性使得我們可以采用統(tǒng)計(jì)推斷方法對(duì)模型的設(shè)定進(jìn)行嚴(yán)格的檢驗(yàn)。第8頁,共87頁，2024年2月25日，星期天2024/4/692.1模型的建立及其假定條件

線性回歸模型”中的“線性”一詞在這里的含義：是指被解釋變量y與解釋變量x之間為線性關(guān)系，即解釋變量x僅以一次方的形式出現(xiàn)在模型之中。第9頁,共87頁，2024年2月25日，星期天2024/4/6102.1模型的建立及其假定條件一般來說，回歸模型的隨機(jī)誤差項(xiàng)中可能包括如下幾項(xiàng)內(nèi)容。（1）未在模型中列出的影響y變化的非重要解釋變量。如消費(fèi)模型中家庭人口數(shù)、消費(fèi)習(xí)慣、物價(jià)水平差異等因素的影響都包括在隨機(jī)誤差項(xiàng)中。（2）人的隨機(jī)行為。經(jīng)濟(jì)活動(dòng)都是人參與的。人的經(jīng)濟(jì)行為的變化也會(huì)對(duì)隨機(jī)誤差項(xiàng)產(chǎn)生影響。第10頁,共87頁，2024年2月25日，星期天2.1模型的建立及其假定條件（3）數(shù)學(xué)模型形式欠妥。對(duì)于同一組觀測(cè)值，若擬合的數(shù)學(xué)模型形式不同，則相應(yīng)的隨機(jī)誤差項(xiàng)的值也不同。當(dāng)模型形式欠妥時(shí)，會(huì)直接對(duì)隨機(jī)誤差項(xiàng)的值帶來影響。（4）歸并誤差。模型中被解釋變量的值常常是歸并而成的。當(dāng)歸并不合理時(shí)，會(huì)產(chǎn)生誤差。如由不同種類糧食合并構(gòu)成的糧食產(chǎn)量的不合理歸并會(huì)帶來歸并誤差。（5）測(cè)量誤差。當(dāng)對(duì)被解釋變量的測(cè)量存在誤差時(shí)，這種誤差將包括在隨機(jī)誤差項(xiàng)中第11頁,共87頁，2024年2月25日，星期天2024/4/6122.1模型的建立及其假定條件4隨機(jī)誤差項(xiàng)的假定條件（1）零均值假定E(ui)=0i=1，2，……這表示對(duì)X的每個(gè)觀測(cè)值來說,u可以取不同的值,有些大于零,有些小于零,考慮u的所有可能取值,他們的總體平均值等于零.

第12頁,共87頁，2024年2月25日，星期天2.1模型的建立及其假定條件（2）同方差性假定

Var(ui)=

i=1，2，……這表明在各次觀測(cè)中u具有相同的方差,也就是各次觀測(cè)所受的隨機(jī)影響的程度相同.第13頁,共87頁，2024年2月25日，星期天協(xié)方差的定義

E[(X-E(X))(Y-E(Y))]稱為隨機(jī)變量X和Y的協(xié)方差，記作COV(X，Y)，即COV(X，Y)=E[(X-E(X))(Y-E(Y))].計(jì)算公式為:Cov(X,Y)=E(XY)-E(X)E(Y)

協(xié)方差可以度量兩個(gè)變量之間的相關(guān)關(guān)系,如果兩個(gè)變量的協(xié)方差為零,則表明這兩個(gè)變量之間不存在相關(guān)關(guān)系.第14頁,共87頁，2024年2月25日，星期天2.1模型的建立及其假定條件（3）無序列相關(guān)假定Cov(ui,uj)=0i≠ji,j=1,2,…這表明,在任意兩次觀測(cè)時(shí),ui,uj是不相關(guān)的,即u在某次觀測(cè)中取的值與任何其它次觀測(cè)中取的值互不影響.第15頁,共87頁，2024年2月25日，星期天2.1模型的建立及其假定條件（4）解釋變量與誤差項(xiàng)不相關(guān)假定

Cov(Xi,ui)=0i=1,2,……這一假定表明隨機(jī)項(xiàng)u與自變量x不相關(guān).提出這一假定是因?yàn)樵诮⒒貧w模型時(shí),我們用隨機(jī)項(xiàng)u綜合了未包含在模型中的那些自變量以及其它因素對(duì)因變量Y的影響.因此,應(yīng)該把X對(duì)Y的影響和u對(duì)Y的影響區(qū)分開來.如果兩者相關(guān),就不可能把各自對(duì)Y的影響區(qū)分開來第16頁,共87頁，2024年2月25日，星期天2024/4/6172.1模型的建立及其假定條件(5)正態(tài)分布假定ui~N(0,u2)i=1,2,…第17頁,共87頁，2024年2月25日，星期天2024/4/6182.2一元線性回歸模型的參數(shù)估計(jì)1幾個(gè)重要的概念對(duì)于一元線性回歸模型，隨機(jī)誤差項(xiàng)滿足古典假設(shè)條件，這個(gè)線性回歸模型稱為X，Y之間的總體回歸模型。兩邊取條件均值，得一元線性回歸方程：

簡稱總體回歸方程（總體回歸線）。其中總體回歸系數(shù)

和

是未知的，實(shí)際上總體回歸線是無法求得的，它只是理論上的存在，所以稱為理論回歸方程第18頁,共87頁，2024年2月25日，星期天2024/4/6192.2一元線性回歸模型的參數(shù)估計(jì)如果變量x和y之間存在線性相關(guān)關(guān)系，對(duì)于任意抽取的若干個(gè)觀測(cè)（樣本）值（xi

,yi），有（2.2.1）

我們稱（2.2.1）為樣本回歸模型,、為、的估計(jì)值或估計(jì)量。樣本回歸模型由兩部分組成：稱為系統(tǒng)分量，是可以被x解釋的部分，也稱為可解釋分量；是不能被解釋的部分，稱為殘差（Residual）,它是隨機(jī)項(xiàng)ui的代表值，也稱為不可解釋分量。將系統(tǒng)分量表示為(2.2.2)

第19頁,共87頁，2024年2月25日，星期天2024/4/6202.2一元線性回歸模型的參數(shù)估計(jì)

式（2.2.2）稱為一元線性樣本回歸方程，簡稱樣本回歸方程。又因（2.2.2）式的建立依賴于樣本觀測(cè)值(xi,yi)，所以我們又稱其為經(jīng)驗(yàn)回歸方程。、為樣本回歸系數(shù)。其中是估計(jì)的回歸直線在y軸截距，是直線的斜率。。的實(shí)際意義為x每變動(dòng)一個(gè)單位時(shí)，y的平均變動(dòng)值，即x的變動(dòng)對(duì)y變動(dòng)的邊際貢獻(xiàn)率；是實(shí)際觀測(cè)值y的擬合值或估計(jì)值我們用一個(gè)圖來表示yi,,E(yi,)、、ui、ei第20頁,共87頁，2024年2月25日，星期天2024/4/6212.2一元線性回歸模型的參數(shù)估計(jì)

iY?

XiX

第21頁,共87頁，2024年2月25日，星期天2024/4/6222.2一元線性回歸模型的參數(shù)估計(jì)2普通最小二乘法給定一組樣本觀測(cè)值（Xi,Yi）（i=1,2,…n）要求樣本回歸函數(shù)盡可能好地?cái)M合這組值.普通最小二乘法（Ordinaryleastsquares,OLS）給出的判斷標(biāo)準(zhǔn)是：二者之差的平方和最小即在給定樣本觀測(cè)值之下，選擇出、能使yi，之差的平方和最?。礊槭箽埐钇椒胶妥钚。?/p>

第22頁,共87頁，2024年2月25日，星期天2024/4/6232.2一元線性回歸模型的參數(shù)估計(jì)方程組（*）稱為正規(guī)方程組（normalequations）。

第23頁,共87頁，2024年2月25日，星期天2024/4/6242.2一元線性回歸模型的參數(shù)估計(jì)記上述參數(shù)估計(jì)量可以寫成：

上式稱為OLS估計(jì)量的離差形式。由于參數(shù)的估計(jì)結(jié)果是通過最小二乘法得到的，故稱為普通最小二乘估計(jì)量（ordinaryleastsquaresestimators）。

第24頁,共87頁，2024年2月25日，星期天2024/4/6252.2一元線性回歸模型的參數(shù)估計(jì)3最小二乘直線的性質(zhì)（1）殘差ei的均值等于0因?yàn)?，所以?）殘差ei與解釋變量xi不相關(guān)即（3）樣本回歸直線經(jīng)過點(diǎn)（）（4）被解釋變量的樣本平均值等于其估計(jì)值的平均值第25頁,共87頁，2024年2月25日，星期天2024/4/6262.2一元線性回歸模型的參數(shù)估計(jì)4截距為零的一元線性回歸模型的參數(shù)估計(jì)截距為零的一元線性回歸模型的一般形式為：這個(gè)模型只有一個(gè)參數(shù)需要估計(jì)，其最小二乘估計(jì)量的表達(dá)式為

第26頁,共87頁，2024年2月25日，星期天2024/4/6272.2一元線性回歸模型的參數(shù)估計(jì)例2.2.1題：一個(gè)假想的生活小區(qū)有100戶家庭組成，要研究該小區(qū)每月家庭消費(fèi)支出Y與每月家庭可支配收入X的關(guān)系。首先得到這100戶家庭的每月家庭消費(fèi)支出和每月家庭可支配收入的數(shù)據(jù)，并把100戶家庭劃分為組內(nèi)收入差不多的10組，以分析每一收入組的家庭消費(fèi)支出，分組如下：第27頁,共87頁，2024年2月25日，星期天2024/4/628第28頁,共87頁，2024年2月25日，星期天2024/4/629建立變量X與Y之間的樣本回歸模型：利用分組數(shù)據(jù)估計(jì)模型參數(shù)，參數(shù)估計(jì)的計(jì)算可通過下面的表進(jìn)行

iiyx

2ix

2iy

2iX

2iY

800

594

-1350

-973

1314090

1822500

947508

640000

352836

1100

638

-1050

-929

975870

1102500

863784

1210000

407044

1400

1122

-750

-445

334050

562500

198381

1960000

1258884

1700

1155

-450

-412

185580

202500

170074

2890000

1334025

2000

1408

-150

-159

23910

22500

25408

4000000

1982464

2300

1595

150

4140

22500

762

5290000

2544025

2600

1969

450

402

180720

202500

161283

6760000

3876961

2900

2078

750

511

382950

562500

260712

8410000

4318084

3200

2585

1050

1018

1068480

1102500

1035510

10240000

6682225

3500

2530

1350

963

1299510

1822500

926599

12250000

6400900

求和

21500

15674

5769300

7425000

4590020

53650000

29157448

平均

2150

1567

第29頁,共87頁，2024年2月25日，星期天2024/4/6302.2一元線性回歸模型的參數(shù)估計(jì)因此，由該樣本估計(jì)的回歸方程為：

第30頁,共87頁，2024年2月25日，星期天2024/4/6312.3最小二乘估計(jì)量的統(tǒng)計(jì)性質(zhì)

第31頁,共87頁，2024年2月25日，星期天2024/4/6322、無偏性，即估計(jì)量0?b、1?b的均值（期望）等于總體回歸參數(shù)真值b0與b1

證明：易知故同樣地，容易得出

第32頁,共87頁，2024年2月25日，星期天2024/4/6332.3最小二乘估計(jì)量的統(tǒng)計(jì)性質(zhì)

3、有效性（最小方差性），即在所有線性無偏估計(jì)量中，最小二乘估計(jì)量0?b、1?b具有最小方差。

(1)先求0?b與1?b的方差

第33頁,共87頁，2024年2月25日，星期天2024/4/634（2）證明最小方差性其中，ci=ki+di，di為不全為零的常數(shù)則容易證明假設(shè)*1?b是其他估計(jì)方法得到的關(guān)于b1的線性無偏估計(jì)量：

普通最小二乘估計(jì)量（ordinaryleastSquaresEstimators）稱為最佳線性無偏估計(jì)量（bestlinearunbiasedestimator,BLUE）

第34頁,共87頁，2024年2月25日，星期天例:令kids表示一名婦女生育孩子的數(shù)目，educ表示該婦女接受過教育的年數(shù)。生育率對(duì)教育年數(shù)的簡單回歸模型為:（1）隨機(jī)擾動(dòng)項(xiàng)包含什么樣的因素？它們可能與教育水平相關(guān)嗎？（2）上述簡單回歸分析能夠揭示教育對(duì)生育率在其他條件不變下的影響嗎？請(qǐng)解釋。第35頁,共87頁，2024年2月25日，星期天（1）收入、年齡、家庭狀況、政府的相關(guān)政策等也是影響生育率的重要的因素，在上述簡單回歸模型中，它們被包含在了隨機(jī)擾動(dòng)項(xiàng)之中。有些因素可能與增長率水平相關(guān)，如收入水平與教育水平往往呈正相關(guān)、年齡大小與教育水平呈負(fù)相關(guān)等。（2）當(dāng)歸結(jié)在隨機(jī)擾動(dòng)項(xiàng)中的重要影響因素與模型中的教育水平educ相關(guān)時(shí)，上述回歸模型不能夠揭示教育對(duì)生育率在其他條件不變下的影響，因?yàn)檫@時(shí)出現(xiàn)解釋變量與隨機(jī)擾動(dòng)項(xiàng)相關(guān)的情形，基本假設(shè)4不滿足。第36頁,共87頁，2024年2月25日，星期天例．已知回歸模型，式中E為某類公司一名新員工的起始薪金（元），N為所受教育水平（年）。隨機(jī)擾動(dòng)項(xiàng)的分布未知，其他所有假設(shè)都滿足。（1）從直觀及經(jīng)濟(jì)角度解釋和。（2）OLS估計(jì)量和滿足線性性、無偏性及有效性嗎？簡單陳述理由。第37頁,共87頁，2024年2月25日，星期天（1）為接受過N年教育的員工的總體平均起始薪金。當(dāng)N為零時(shí)，平均薪金為才，因此表示沒有接受過教育員工的平均起始薪金。是每單位N變化所引起的E的變化，即表示每多接受一年學(xué)校教育所對(duì)應(yīng)的薪金增加值。（2）OLS估計(jì)量和仍滿足線性性、無偏性及有效性，因?yàn)檫@些性質(zhì)的的成立無需隨機(jī)擾動(dòng)項(xiàng)的正態(tài)分布假設(shè)。第38頁,共87頁，2024年2月25日，星期天2024/4/6392.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度回歸分析是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù)，或者說是用樣本回歸線代替總體回歸線。盡管從統(tǒng)計(jì)性質(zhì)上已知，如果有足夠多的重復(fù)抽樣，參數(shù)的估計(jì)值的期望（均值）就等于其總體的參數(shù)真值，但在一次抽樣中，估計(jì)值不一定就等于該真值。那么，在一次抽樣中，參數(shù)的估計(jì)值與真值的差異有多大，是否顯著，這就需要進(jìn)一步進(jìn)行統(tǒng)計(jì)檢驗(yàn)。

主要包括擬合優(yōu)度檢驗(yàn)、變量的顯著性檢驗(yàn)及參數(shù)的區(qū)間估計(jì)。第39頁,共87頁，2024年2月25日，星期天2024/4/6402.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度擬合優(yōu)度檢驗(yàn)：對(duì)樣本回歸直線與樣本觀測(cè)值之間擬合程度的檢驗(yàn)?；舅悸罚阂蜃兞縔的變異，能夠被X的變異解釋的比例越大，則OLS回歸線對(duì)總體的解釋程度就越好。也即是樣本觀測(cè)值距回歸線越近，擬合優(yōu)度越好，X對(duì)Y的解釋程度就越強(qiáng)

度量擬合優(yōu)度的指標(biāo)：樣本決定系數(shù)r2第40頁,共87頁，2024年2月25日，星期天2024/4/6412.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度1總離差平方和的分解

已知由一組樣本觀測(cè)值（Xi,Yi），i=1,2…,n得到如下樣本回歸直線：而Y的第i個(gè)觀測(cè)值與樣本均值的離差可分解為兩部分之和：

第41頁,共87頁，2024年2月25日，星期天2024/4/642

如果Yi=?i即實(shí)際觀測(cè)值落在樣本回歸“線”上，則擬合最好。可認(rèn)為，“離差”全部來自回歸線，而與“殘差”無關(guān)。第42頁,共87頁，2024年2月25日，星期天2024/4/643對(duì)于所有樣本點(diǎn)，則需考慮這些點(diǎn)與樣本均值離差的平方和,可以證明：記：總離差平方和（TotalSumofSquares）回歸平方和（ExplainedSumofSquares）殘差平方和（ResidualSumofSquares

）第43頁,共87頁，2024年2月25日，星期天2024/4/6442.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度

即：TSS=ESS+RSS

Y的觀測(cè)值圍繞其均值的總離差可分解為兩部分：一部分來自回歸線(ESS)，另一部分則來自隨機(jī)勢(shì)力(RSS)。在給定樣本中，TSS不變，如果實(shí)際觀測(cè)點(diǎn)離樣本回歸線越近，則ESS在TSS中占的比重越大，因此定義擬合優(yōu)度：回歸平方和ESS/總離差TSS第44頁,共87頁，2024年2月25日，星期天2024/4/6452.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度2樣本可決系數(shù)也可表示為稱r2為（樣本）決定系數(shù)/判定系數(shù)，可決系數(shù)可決系數(shù)的取值范圍：[0，1]

r2越接近1，說明實(shí)際觀測(cè)點(diǎn)離樣本線越近，擬合優(yōu)度越高。第45頁,共87頁，2024年2月25日，星期天2024/4/6462.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度在例2.1.1的收入-消費(fèi)支出例中第46頁,共87頁，2024年2月25日，星期天這表示在消費(fèi)支出的變異中，有97.66%的變異是由收入的變異所解釋。即家庭每月的消費(fèi)支出的97.66%取決于收入。第47頁,共87頁，2024年2月25日，星期天2024/4/6482.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度3樣本相關(guān)系數(shù)

樣本相關(guān)系數(shù)是變量X與Y之間線性相關(guān)程度的度量指標(biāo)，其定義為：

樣本相關(guān)系數(shù)表示x和y的線性相關(guān)關(guān)系的密切程度。其取值范圍為|r|1，即-1r1。當(dāng)r=-1時(shí)，表示x與y之間完全負(fù)相關(guān);當(dāng)r=1時(shí)，表示x與y之間完全正相關(guān)；當(dāng)r=0時(shí)，表示x與y之間無線性相關(guān)關(guān)系，即說明x與y可能無相關(guān)關(guān)系或x與y之間存在非線性相關(guān)

關(guān)系第48頁,共87頁，2024年2月25日，星期天下表列出若干對(duì)自變量與因變量。對(duì)每一對(duì)變量，你認(rèn)為它們之間的關(guān)系如何？是正的、負(fù)的、還是無法確定？并說明理由。

因變量自變量個(gè)人儲(chǔ)蓄利率小麥產(chǎn)出降雨量美國國防開支前蘇聯(lián)國防開支老師的計(jì)量經(jīng)濟(jì)學(xué)教學(xué)學(xué)生的計(jì)量經(jīng)濟(jì)學(xué)成績總統(tǒng)聲譽(yù)任職時(shí)間學(xué)生計(jì)量經(jīng)濟(jì)學(xué)成績其統(tǒng)計(jì)學(xué)成績?nèi)毡酒嚨倪M(jìn)口量美國人均國民收入第49頁,共87頁，2024年2月25日，星期天2024/4/6502.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度樣本相關(guān)系數(shù)的檢驗(yàn)由于一元線性回歸方程研究的是變量x與變量y之間的線性相關(guān)關(guān)系，所以我們可以用反映變量x與變量y之間的相關(guān)關(guān)系密切程度的相關(guān)系數(shù)來檢驗(yàn)回歸方程的顯著性。

檢驗(yàn)的步驟為：

（1）提出原假設(shè)H0：=0

備擇假設(shè)H1：

（2）構(gòu)造t統(tǒng)計(jì)量~

第50頁,共87頁，2024年2月25日，星期天2024/4/6512.4用樣本可決系數(shù)檢驗(yàn)回歸方程的擬合優(yōu)度（3）給出顯著性水平，查自由度v=n-2的t分布表，得臨界值

（4）當(dāng)時(shí)，接受原假設(shè)，認(rèn)為總體相關(guān)系數(shù)等于零，X與Y之間沒有顯著的線性相關(guān)關(guān)系

當(dāng)時(shí)，拒絕原假設(shè)，接受備擇假設(shè)，認(rèn)為X與Y之間具有顯著的線性相關(guān)關(guān)系。第51頁,共87頁，2024年2月25日，星期天2024/4/6522.5回歸系數(shù)估計(jì)值的顯著性檢驗(yàn)與置信區(qū)間1隨機(jī)變量u的方差

我們?cè)谧C明最小二乘估計(jì)量的有效性的時(shí)候已經(jīng)得出參數(shù)和的概率分布為：

在估計(jì)的參數(shù)和的方差表達(dá)式中，都還有隨機(jī)擾動(dòng)項(xiàng)ui的方差，由于實(shí)際上是未知的，因此和

的方差實(shí)際上是無法計(jì)算的，這就需要對(duì)其進(jìn)行估計(jì)。

第52頁,共87頁，2024年2月25日，星期天2024/4/6532.5回歸系數(shù)估計(jì)值的顯著性檢驗(yàn)與置信區(qū)間

由于隨機(jī)項(xiàng)ui不可觀測(cè)，只能從ui的估計(jì)—?dú)埐頴i出發(fā)，對(duì)總體方差進(jìn)行估計(jì)。可以證明的最小二乘估計(jì)量為

它是關(guān)于的無偏估計(jì)量

第53頁,共87頁，2024年2月25日，星期天在隨機(jī)誤差項(xiàng)ui的方差估計(jì)出后，參數(shù)0?b和1?b的方差和標(biāo)準(zhǔn)差的估計(jì)量分別是：

1?b的樣本方差：

?=22?1ixSb

1?b的樣本標(biāo)準(zhǔn)差：

?=2?1ixSb

0?b的樣本方差：

??=222?0iixnXSb

0?b的樣本標(biāo)準(zhǔn)差：

??=22?0iixnXSb

第54頁,共87頁，2024年2月25日，星期天2024/4/6552.5回歸系數(shù)估計(jì)值的顯著性檢驗(yàn)與置信區(qū)間2回歸系數(shù)估計(jì)值的顯著性檢驗(yàn)——t檢驗(yàn)回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個(gè)顯著性的影響因素。在一元線性模型中，就是要判斷X是否對(duì)Y具有顯著的線性性影響。這就需要進(jìn)行變量的顯著性檢驗(yàn)。即是檢驗(yàn)系數(shù)是否顯著地不等于零,也就是檢驗(yàn)樣本是否取自其真實(shí)參數(shù)為零的總體.第55頁,共87頁，2024年2月25日，星期天第56頁,共87頁，2024年2月25日，星期天

檢驗(yàn)步驟：

（1）對(duì)總體參數(shù)提出假設(shè)

H0：

1=0，H1：10（2）以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量，并由樣本計(jì)算其值（3）給定顯著性水平，查t分布表，得臨界值t/2(n-2)(4)比較，判斷若|t|>t/2(n-2)，則拒絕H0

，接受H1

；若|t|

t/2(n-2)，則拒絕H1

，接受H0

；t=第57頁,共87頁，2024年2月25日，星期天

對(duì)于一元線性回歸方程中的

0，可構(gòu)造如下t統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn)：

在上述收入-消費(fèi)支出例中，首先計(jì)算的估計(jì)值

第58頁,共87頁，2024年2月25日，星期天t統(tǒng)計(jì)量的計(jì)算結(jié)果分別為：

給定顯著性水平

=0.05，查t分布表得臨界值

t0.05/2(8)=2.306|t1|>2.306，說明家庭可支配收入在95%的置信度下顯著，即是消費(fèi)支出的主要解釋變量；

|t0|<2.306,表明在95%的置信度下，無法拒絕截距項(xiàng)為零的假設(shè)。

第59頁,共87頁，2024年2月25日，星期天3回歸系數(shù)的置信區(qū)間

為了反映回歸系數(shù)的估計(jì)精度，需給出其區(qū)間估計(jì)，即在置信水平為下的置信區(qū)間。置信區(qū)間長度越短，說明估計(jì)值和與參數(shù)和就越接近，估計(jì)值就越精確；反之，就越不精確第60頁,共87頁，2024年2月25日，星期天區(qū)間估計(jì)的步驟：1)找一個(gè)含有該參數(shù)的統(tǒng)計(jì)量;

2)構(gòu)造一個(gè)概率為的事件;

3)通過該事件解出該參數(shù)的區(qū)間估計(jì).第61頁,共87頁，2024年2月25日，星期天

1.對(duì)于參數(shù)，我們知道統(tǒng)計(jì)量中含有參數(shù)2.構(gòu)造關(guān)于統(tǒng)計(jì)量t的概率為的事件事件為：把代入上面的式子整理得到：3.得到的的置信區(qū)間

第62頁,共87頁，2024年2月25日，星期天根據(jù)同樣的方法我們可以求出的置信區(qū)間第63頁,共87頁，2024年2月25日，星期天2.6一元線性回歸方程的預(yù)測(cè)1點(diǎn)預(yù)測(cè)所謂點(diǎn)預(yù)測(cè)，是將x的一個(gè)特定值代入樣本回歸方程，計(jì)算得出的就是y0的點(diǎn)預(yù)測(cè)值。

對(duì)于一元線性回歸方程對(duì)于給定的樣本以外的解釋變量的觀測(cè)值x0，可以得到被解釋變量的預(yù)測(cè)值我們還是以家庭收入與消費(fèi)的例子的資料為例第64頁,共87頁，2024年2月25日，星期天2.6一元線性回歸方程的預(yù)測(cè)我們已經(jīng)估計(jì)出其一元線性回歸方程：預(yù)測(cè)收入為4000元的家庭的消費(fèi)支出：第65頁,共87頁，2024年2月25日，星期天2.6一元線性回歸方程的預(yù)測(cè)２區(qū)間預(yù)測(cè)(1)個(gè)值的預(yù)測(cè)區(qū)間

由Yi=

0+1Xi+u

知:定義預(yù)測(cè)誤差:

于是

第66頁,共87頁，2024年2月25日，星期天式中

:從而在1-

的置信度下，Y0的置信區(qū)間為第67頁,共87頁，2024年2月25日，星期天2.6一元線性回歸方程的預(yù)測(cè)(2)總體均值的預(yù)測(cè)區(qū)間于是第68頁,共87頁，2024年2月25日，星期天可以證明

因此故其中第69頁,共87頁，2024年2月25日，星期天于是,在1-

的置信度下，總體均值E(Y|X0)的置信區(qū)間為第70頁,共87頁，2024年2月25日，星期天在上述收入-消費(fèi)支出例中，得到的樣本回歸函數(shù)為則在X0=1000處，?0=–103.172+0.777×1000=673.84

而因此，總體均值E(Y|X=1000)的95%的置信區(qū)間為：

673.84-2.306

61.05<E(Y|X=1000)<673.84+2.306

61.05或

（533.05,814.62）

第71頁,共87頁，2024年2月25日，星期天同樣地，對(duì)于Y在X=1000的個(gè)體值，其95%的置信區(qū)間為：

(372.03,975.65)總體回歸函數(shù)的置信帶（域）個(gè)體的置信帶（域）

第72頁,共87頁，2024年2月25日，星期天對(duì)于Y的總體均值E(Y|X)與個(gè)體值的預(yù)測(cè)區(qū)間（置信區(qū)間）:（1）樣本容量n越大，預(yù)測(cè)精度越高，反之預(yù)測(cè)精度越低（2）樣本容量一定時(shí)，置信帶的寬度當(dāng)在X均值處最小，其附近進(jìn)行預(yù)測(cè)（插值預(yù)測(cè)）精度越大；X越遠(yuǎn)離其均值，置信帶越寬，預(yù)測(cè)可信度下降。第73頁,共87頁，2024年2月25日，星期天小結(jié)：簡單線性回歸分析的主要步驟1、建立回歸模型研究某一經(jīng)濟(jì)現(xiàn)象，先根據(jù)經(jīng)濟(jì)理論，選擇具有因果關(guān)系的兩個(gè)變量（X，Y)，建立線性回歸模型，確定解釋變量和被解釋變量。如果不明確兩個(gè)變量是否為線性關(guān)系，也可以根據(jù)散點(diǎn)圖來分析。建立回歸模型可以是根據(jù)經(jīng)濟(jì)理論，也可以根據(jù)相同或相似經(jīng)濟(jì)現(xiàn)象的歷史分析經(jīng)驗(yàn)來建立回歸模型。建立模型時(shí)，不僅要考慮理論或經(jīng)驗(yàn)的依據(jù)，同時(shí)也要考慮數(shù)據(jù)的可利用程度。2、收集數(shù)據(jù)，并經(jīng)過適當(dāng)?shù)募庸ふ恚玫竭m于回歸分析的樣本數(shù)據(jù)集。第74頁,共87頁，2024年2月25日，星期天3、估計(jì)模型參數(shù)。利用樣本數(shù)據(jù)，以O(shè)LS得到模型參數(shù)的估計(jì)值。4、對(duì)回歸模型和參數(shù)估計(jì)值進(jìn)行檢驗(yàn)。檢驗(yàn)回歸結(jié)果是否正確反映經(jīng)濟(jì)現(xiàn)象，是否與理論相符。包括理論檢驗(yàn)和統(tǒng)計(jì)檢驗(yàn)。經(jīng)濟(jì)理論檢驗(yàn)：參數(shù)的符號(hào)，大小是否與理論和實(shí)際相符。若不符，尋找原因統(tǒng)計(jì)檢驗(yàn)：擬和優(yōu)度檢驗(yàn)，回歸參數(shù)的顯著性檢驗(yàn)和區(qū)間估計(jì)。第75頁,共87頁，2024年2月25日，星期天5、預(yù)測(cè)對(duì)于解釋變量的特定值，代入回歸方程得到因變量的預(yù)測(cè)值；在給定的置信水平上，得到因變量預(yù)測(cè)值的置信區(qū)間。6、回歸結(jié)果的表述：

并說明參數(shù)的顯著水平（）。第76頁,共87頁，2024年2月25日，星期天提供回歸分析結(jié)果一般有兩種方式：（1）=6.70+0.58XR2=0.49

（1.38）（2.76）

這里6.70和0.58分別為

和的估計(jì)值和

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

線性回歸模型

文檔簡介

溫馨提示

最新文檔

評(píng)論

線性回歸模型

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔