版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、經(jīng)典線性回歸模型第1頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二2.1 回歸分析概述一、變量間的關(guān)系及回歸分析的基本概念二、總體回歸函數(shù)(PRF)三、隨機(jī)擾動(dòng)項(xiàng)四、樣本回歸函數(shù)(SRF)第2頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二一、變量間的關(guān)系及回歸分析的基本概念1. 變量間的關(guān)系(1)確定性關(guān)系或函數(shù)關(guān)系:研究的是確定現(xiàn)象非隨機(jī)變量間的關(guān)系。(2)統(tǒng)計(jì)依賴或相關(guān)關(guān)系:研究的是非確定現(xiàn)象隨機(jī)變量間的關(guān)系。第3頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二2. 回歸分析的基本概念回歸分析(regression analysis)是研究一個(gè)變量關(guān)于另一
2、個(gè)(些)變量的具體依賴關(guān)系的計(jì)算方法和理論。其目的在于通過后者的已知或設(shè)定值,去估計(jì)和(或)預(yù)測(cè)前者的(總體)均值。被解釋變量(Explained Variable)或應(yīng)變量(Dependent Variable)。解釋變量(Explanatory Variable)或自變量(Independent Variable)。第4頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二回歸分析構(gòu)成計(jì)量經(jīng)濟(jì)學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括:(1)根據(jù)樣本觀察值對(duì)經(jīng)濟(jì)計(jì)量模型參數(shù)進(jìn)行估計(jì),求得回歸方程;(2)對(duì)回歸方程、參數(shù)估計(jì)值進(jìn)行顯著性檢驗(yàn);(3)利用回歸方程進(jìn)行分析、評(píng)價(jià)及預(yù)測(cè)。第5頁(yè),共107頁(yè)
3、,2022年,5月20日,18點(diǎn)5分,星期二二、總體回歸函數(shù)回歸分析關(guān)心的是根據(jù)解釋變量的已知或給定值,考察被解釋變量的總體均值,即當(dāng)解釋變量取某個(gè)確定值時(shí),與之統(tǒng)計(jì)相關(guān)的被解釋變量所有可能出現(xiàn)的對(duì)應(yīng)值的平均值。第6頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二例2.1:一個(gè)假想的社區(qū)有100戶家庭組成,要研究該社區(qū)每月家庭消費(fèi)支出Y與每月家庭可支配收入X的關(guān)系。 即如果知道了家庭的月收入,能否預(yù)測(cè)該社區(qū)家庭的平均月消費(fèi)支出水平。 為達(dá)到此目的,將該100戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費(fèi)支出。第7頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期
4、二第8頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二由于不確定因素的影響,對(duì)同一收入水平X,不同家庭的消費(fèi)支出不完全相同;但由于調(diào)查的完備性,給定收入水平X的消費(fèi)支出Y的分布是確定的,即以X的給定值為條件的Y的條件分布(Conditional distribution)是已知的,例如:P(Y=561|X=800)=1/4。第9頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二因此,給定收入X的值Xi,可得消費(fèi)支出Y的條件均值(conditional mean)或條件期望(conditional expectation):E(Y|X=Xi)。該例中:E(Y | X=800)=
5、605描出散點(diǎn)圖發(fā)現(xiàn):隨著收入的增加,消費(fèi)“平均地說”也在增加,且Y的條件均值均落在一根正斜率的直線上。這條直線稱為總體回歸線。第10頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消費(fèi)支出Y(元)第11頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線(population regression line),或更一般地稱為總體回歸曲線(population regress
6、ion curve)。稱為(雙變量)總體回歸函數(shù)(population regression function, PRF)。 相應(yīng)的函數(shù):第12頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二含義:回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。 函數(shù)形式:可以是線性或非線性的。 例2.1中,將居民消費(fèi)支出看成是其可支配收入的線性函數(shù)時(shí): 為一線性函數(shù)。其中,0,1是未知參數(shù),稱為回歸系數(shù)(regression coefficients)。第13頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二三、隨機(jī)擾動(dòng)項(xiàng)總體回歸函數(shù)說明在給定的收入水平
7、Xi下,該社區(qū)家庭平均的消費(fèi)支出水平。但對(duì)某一個(gè)別的家庭,其消費(fèi)支出可能與該平均水平有偏差。稱為觀察值圍繞它的期望值的離差(deviation),是一個(gè)不可觀測(cè)的隨機(jī)變量,又稱為隨機(jī)干擾項(xiàng)(stochastic disturbance)或隨機(jī)誤差項(xiàng)(stochastic error)。第14頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二例2.1中,給定收入水平Xi ,個(gè)別家庭的支出可表示為兩部分之和:(1)該收入水平下所有家庭的平均消費(fèi)支出E(Y|Xi),稱為系統(tǒng)性(systematic)或確定性(deterministic)部分;(2)其他隨機(jī)或非確定性(nonsystemati
8、c)部分i。第15頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二稱為總體回歸函數(shù)(PRF)的隨機(jī)設(shè)定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機(jī)性影響。由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)學(xué)模型,因此也稱為總體回歸模型。第16頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二隨機(jī)誤差項(xiàng)主要包括下列因素:在解釋變量中被忽略的因素的影響;變量觀測(cè)值的觀測(cè)誤差的影響;模型關(guān)系的設(shè)定誤差的影響;其他隨機(jī)因素的影響。產(chǎn)生并設(shè)計(jì)隨機(jī)誤差項(xiàng)的主要原因:理論的含糊性;數(shù)據(jù)的欠缺;節(jié)省原則。第17頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二四、樣本回歸函
9、數(shù)(SRF)問題:能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息?例2.2:在例2.1的總體中有如下一個(gè)樣本,能否從該樣本估計(jì)總體回歸函數(shù)PRF? 回答:能第18頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 該樣本的散點(diǎn)圖(scatter diagram): 畫一條直線以盡好地?cái)M合該散點(diǎn)圖,由于樣本取自總體,可以該直線近似地代表總體回歸線。該直線稱為樣本回歸線(sample regression lines)。第19頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 記樣本回歸線的函數(shù)形式為:稱為樣本回歸函數(shù)(sample regressi
10、on function,SRF)。第20頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 注意:這里將樣本回歸線看成總體回歸線的近似替代則第21頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二樣本回歸函數(shù)的隨機(jī)形式/樣本回歸模型:同樣地,樣本回歸函數(shù)也有如下的隨機(jī)形式: 由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)模型,因此也稱為樣本回歸模型(sample regression model)。 第22頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸函數(shù)PRF。即,根據(jù) 估計(jì)第23頁(yè),共107頁(yè),2022年,5月20
11、日,18點(diǎn)5分,星期二注意:這里PRF可能永遠(yuǎn)無(wú)法知道。第24頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二2.2 雙變量線性回歸模型的參數(shù)估計(jì) 一、雙變量線性回歸模型的基本假設(shè) 二、參數(shù)的普通最小二乘估計(jì)(OLS) 三、最小二乘估計(jì)量的性質(zhì) 四、參數(shù)估計(jì)量的概率分布及隨機(jī)干 擾項(xiàng)方差的估計(jì) 第25頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二回歸分析的主要目的是要通過樣本回歸函數(shù)(模型)SRF盡可能準(zhǔn)確地估計(jì)總體回歸函數(shù)(模型)PRF。估計(jì)方法有多種,其中最廣泛使用的是普通最小二乘法(ordinary least squares, OLS)。為保證參數(shù)估計(jì)量具有良好的
12、性質(zhì),通常對(duì)模型提出若干基本假設(shè)。實(shí)際這些假設(shè)與所采用的估計(jì)方法緊密相關(guān)。第26頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 一、線性回歸模型的基本假設(shè)-P99-100-105 假設(shè)1. 解釋變量X是確定性變量,不是隨機(jī)變量; 假設(shè)2. 隨機(jī)誤差項(xiàng)具有零均值、同方差和無(wú)自相關(guān): E(i)=0 i=1,2, ,n Var (i)=2 i=1,2, ,n Cov(i, j)=0 ij i,j= 1,2, ,n 第27頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二異方差XYXY第28頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二序列自相關(guān)XXYY負(fù)相關(guān)正相關(guān)第2
13、9頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二假設(shè)3. 隨機(jī)誤差項(xiàng)與解釋變量X之間不相關(guān): Cov(Xi, i)=0 i=1,2, ,n 假設(shè)4. 服從零均值、同方差、零協(xié)方差的正態(tài)分布 iN(0, 2 ) i=1,2, ,n第30頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 如果假設(shè)1、2滿足,則假設(shè)3也滿足; 如果假設(shè)4滿足,則假設(shè)2也滿足。注意: 以上假設(shè)也稱為線性回歸模型的經(jīng)典假設(shè)或高斯(Gauss)假設(shè),滿足該假設(shè)的線性回歸模型,也稱為經(jīng)典線性回歸模型(Classical Linear Regression Model, CLRM)。 第31頁(yè),共107頁(yè)
14、,2022年,5月20日,18點(diǎn)5分,星期二二、參數(shù)的普通最小二乘估計(jì)(OLS) 給定一組樣本觀測(cè)值(Xi, Yi)(i=1,2,n)要求樣本回歸函數(shù)盡可能好地?cái)M合這組值. 普通最小二乘法(Ordinary least squares, OLS)給出的判斷標(biāo)準(zhǔn)是:二者之差的平方和最小。第32頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二最小二乘法的思路為了精確地描述Y與X之間的關(guān)系,必須使用這兩個(gè)變量的每一對(duì)觀察值(n組觀察值),才不至于以點(diǎn)概面(做到全面)。Y與X之間是否是直線關(guān)系(用協(xié)方差或相關(guān)系數(shù)判斷)?若是,可用一條直線描述它們之間的關(guān)系。在Y與X的散點(diǎn)圖上畫出直線的方法很
15、多。找出一條能夠最好地描述Y與X(代表所有點(diǎn))之間的直線。問題是:怎樣算“最好”?最好指的是找一條直線使得所有這些點(diǎn)到該直線的縱向距離的和(平方和)最小。第33頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二最小二乘法的思路yx縱向距離橫向距離距離A為實(shí)際點(diǎn),B為擬合直線上與之對(duì)應(yīng)的點(diǎn)第34頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二最小二乘法的思路縱向距離是Y的實(shí)際值與擬合值之差,差異大擬合不好,差異小擬合好,所以稱為殘差、擬合誤差或剩余。將所有縱向距離平方后相加,即得誤差平方和,“最好”直線就是使誤差平方和最小的直線。擬合直線在總體上最接近實(shí)際觀測(cè)點(diǎn)。于是可以運(yùn)用求
16、極值的原理,將求最好擬合直線問題轉(zhuǎn)換為求誤差平方和最小的問題。第35頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二YX0*Y7Y9Min數(shù)學(xué)形式第36頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二最小二乘法的數(shù)學(xué)原理縱向距離是Y的實(shí)際值與擬合值之差,差異大擬合不好,差異小擬合好,所以又稱為擬合誤差或殘差。將所有縱向距離平方后相加,即得誤差平方和,“最好”直線就是使誤差平方和最小的直線。于是可以運(yùn)用求極值的原理,將求最好擬合直線問題轉(zhuǎn)換為求誤差平方和最小。第37頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二得到的參數(shù)估計(jì)量可以寫成: 稱為OLS估計(jì)量的離差形式
17、(deviation form)。 由于參數(shù)的估計(jì)結(jié)果是通過最小二乘法得到 的,故稱為普通最小二乘估計(jì)量(ordinary least squares estimators)。 第38頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 例:在上述家庭可支配收入-消費(fèi)支出例中,對(duì)于所抽出的一組樣本數(shù),參數(shù)估計(jì)的計(jì)算可通過下面的表進(jìn)行。 第39頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二計(jì)量經(jīng)濟(jì)學(xué)與電腦必須指出,模型的建立和實(shí)際使用,離開了電腦幾乎是不可能的。目前,已有很多計(jì)量經(jīng)濟(jì)學(xué)軟件包,可以完成計(jì)量經(jīng)濟(jì)學(xué)模型的參數(shù)估計(jì)、模型檢驗(yàn)、預(yù)測(cè)等基本運(yùn)算。幾種常見計(jì)量軟件SAS,S
18、PSS,ET,ESP,GAUSS,MATLAB,MICROTSP,STATA, MINITAB,SYSTAT,SHAZAM,EViews,DATA-FIT。本課程采用國(guó)家教委推薦的EViews進(jìn)行案例教學(xué)。要求同學(xué)們掌握EViews,比較熟練地使用它,并掌握EViews與其它Windows軟件共享信息。第40頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二學(xué)習(xí)計(jì)量軟件的要求鼯鼠五能,不如烏賊一技!第41頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二第42頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二第43頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期
19、二因此,由該樣本估計(jì)的回歸方程為: 第44頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 四、最小二乘估計(jì)量的性質(zhì) 當(dāng)模型參數(shù)估計(jì)出后,需考慮參數(shù)估計(jì)值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計(jì)量的統(tǒng)計(jì)性質(zhì)。 一個(gè)用于考察總體的估計(jì)量,可從如下幾個(gè)方面考察其優(yōu)劣性: (1)線性,即它是否是另一隨機(jī)變量的線性函數(shù);第45頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二(2)無(wú)偏性,即它的均值或期望值是否等于總體的真實(shí)值;(3)有效性,即它是否在所有線性無(wú)偏估計(jì)量中具有最小方差。 這三個(gè)準(zhǔn)則也稱作估計(jì)量的小樣本性質(zhì)。 擁有這類性質(zhì)的估計(jì)量稱為最佳線性無(wú)偏估計(jì)量(
20、best liner unbiased estimator, BLUE)。 第46頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二(4)漸近無(wú)偏性,即樣本容量趨于無(wú)窮大時(shí),是否它的均值序列趨于總體真值;(5)一致性,即樣本容量趨于無(wú)窮大時(shí),它是否依概率收斂于總體的真值;(6)漸近有效性,即樣本容量趨于無(wú)窮大時(shí),是否它在所有的一致估計(jì)量中具有最小的漸近方差。 當(dāng)不滿足小樣本性質(zhì)時(shí),需進(jìn)一步考察估計(jì)量的大樣本或漸近性質(zhì):第47頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二OLS參數(shù)估計(jì)量的有效性指的是:在一切線性、無(wú)偏估計(jì)量中,OLS參數(shù)估計(jì)量的方差最小。所有參數(shù)估計(jì)量線性參
21、數(shù)估計(jì)量無(wú)偏參數(shù)估計(jì)量最小二乘參數(shù)估計(jì)量第48頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二高斯馬爾可夫定理(Gauss-Markov theorem) 在給定經(jīng)典線性回歸的假定下,最小二乘估計(jì)量是具有最小方差的線性無(wú)偏估計(jì)量。第49頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 五、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì) 第50頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二2. 隨機(jī)誤差項(xiàng)的方差2的估計(jì)2又稱為總體方差。 第51頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二由于隨機(jī)項(xiàng)i不可觀測(cè),只能從i的估計(jì)殘差ei出發(fā),對(duì)總體方差進(jìn)行估計(jì)
22、。 可以證明, 2的最小二乘估計(jì)量為它是關(guān)于2的無(wú)偏估計(jì)量。 第52頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二第53頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二2.3 雙變量線性回歸模型的統(tǒng)計(jì)檢驗(yàn) 一、擬合優(yōu)度檢驗(yàn) 二、變量的顯著性檢驗(yàn) 三、參數(shù)的置信區(qū)間 第54頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 如果Yi=i 即實(shí)際觀測(cè)值落在樣本回歸“線”上,則擬合最好。 第55頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平方和,可以證明:第56頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5
23、分,星期二TSS=ESS+RSS記總體平方和(Total Sum of Squares)回歸平方和(Explained Sum of Squares)殘差平方和(Residual Sum of Squares )第57頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 Y的觀測(cè)值圍繞其均值的總離差(total variation)可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機(jī)勢(shì)力(RSS)。在給定樣本中,TSS不變,如果實(shí)際觀測(cè)點(diǎn)離樣本回歸線越近,則ESS在TSS中占的比重越大,因此擬合優(yōu)度:回歸平方和ESS/Y的總離差TSS第58頁(yè),共107頁(yè),2022年,5月20日
24、,18點(diǎn)5分,星期二2、判定系數(shù)R2統(tǒng)計(jì)量 稱 R2 為(樣本)判定系數(shù)/可決系數(shù)(coefficient of determination)。 判定系數(shù)的取值范圍:0,1 R2越接近1,說明實(shí)際觀測(cè)點(diǎn)離樣本線越近,擬合優(yōu)度越高。第59頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 在例的收入消費(fèi)支出例中, 注:判定系數(shù)是一個(gè)非負(fù)的統(tǒng)計(jì)量。它也是隨著抽樣的不同而不同。為此,對(duì)判定系數(shù)的統(tǒng)計(jì)可靠性也應(yīng)進(jìn)行檢驗(yàn),這將在以后進(jìn)行。 第60頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二R2的其他表示方法第61頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二擬合優(yōu)度(或
25、稱判定系數(shù)、決定系數(shù))判定系數(shù)只是說明列入模型的所有解釋變量對(duì)應(yīng)變量的聯(lián)合的影響程度,不說明模型中單個(gè)解釋變量的影響程度。對(duì)時(shí)間序列數(shù)據(jù),判定系數(shù)達(dá)到0.9以上是很平常的;但是,對(duì)截面數(shù)據(jù)而言,能夠有0.5就不錯(cuò)了。第62頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二判定系數(shù)達(dá)到多少為宜?沒有一個(gè)統(tǒng)一的明確界限值;若建模的目的是預(yù)測(cè)應(yīng)變量值,一般需考慮有較高的判定系數(shù)。若建模的目的是結(jié)構(gòu)分析,就不能只追求高的判定系數(shù),而是要得到總體回歸系數(shù)的可信任的估計(jì)量。判定系數(shù)高并不一定每個(gè)回歸系數(shù)都可信任;第63頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 二、變量的顯著性檢驗(yàn)
26、 回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個(gè)顯著性的影響因素。 在雙變量線性模型中,就是要判斷X是否對(duì)Y具有顯著的線性性影響。這就需要進(jìn)行變量的顯著性檢驗(yàn)。 變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中的假設(shè)檢驗(yàn)。 計(jì)量經(jīng)濟(jì)學(xué)中,主要是針對(duì)變量的參數(shù)真值是否為零來進(jìn)行顯著性檢驗(yàn)的。 第64頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 1、假設(shè)檢驗(yàn) 所謂假設(shè)檢驗(yàn),就是事先對(duì)總體參數(shù)或總體分布形式作出一個(gè)假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè)。第65頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二
27、假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法 先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生”這一原理的第66頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 2、變量的顯著性檢驗(yàn) 第67頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 檢驗(yàn)步驟: (1)對(duì)總體參數(shù)提出假設(shè) H0: 1=0, H1:10(2)以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量,并由樣本計(jì)算其值(3)給定顯著性水平,查t分布表得臨界值t /2(n-2)第68頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 (4) 比較,判斷 若
28、 |t| t /2(n-2),則拒絕H0 ,接受H1 ; 若 |t| t /2(n-2),則拒絕H1 ,接受H0 ; 對(duì)于雙變量線性回歸方程中的0,可構(gòu)造如下t統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn): 第69頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二在上述收入消費(fèi)支出例中,首先計(jì)算2的估計(jì)值 第70頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二t統(tǒng)計(jì)量的計(jì)算結(jié)果分別為: 給定顯著性水平=0.05,查t分布表得臨界值 t 0.05/2(8)=2.306 |t1|2.306,說明家庭可支配收入在0.05的顯著性水平下顯著,即是消費(fèi)支出的主要解釋變量; |t0|2.306,表明在0.05的
29、顯著性水平下不顯著,無(wú)法拒絕截距項(xiàng)為零的假設(shè)。 第71頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 假設(shè)檢驗(yàn)可以通過一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。 三、參數(shù)的置信區(qū)間 第72頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 要判斷樣本參數(shù)的估計(jì)值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過構(gòu)造一個(gè)以樣本參數(shù)的估計(jì)值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實(shí)的參數(shù)值。這種方法就是參數(shù)的區(qū)間估計(jì)。 第73頁(yè),共107頁(yè),2022年,5月20日,18
30、點(diǎn)5分,星期二 如果存在這樣一個(gè)區(qū)間,稱之為置信區(qū)間(confidence interval); 1-稱為置信系數(shù)(置信度)(confidence coefficient), 稱為顯著性水平(level of significance);置信區(qū)間的端點(diǎn)稱為置信限(confidence limit)或臨界值(critical values)。第74頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二對(duì)區(qū)間估計(jì)的形象比喻我們經(jīng)常說某甲的成績(jī)“大概80分左右”,可以看成一個(gè)區(qū)間估計(jì)。(某甲的成績(jī)?yōu)楸还烙?jì)的參數(shù)) P(1 2 )=大概的準(zhǔn)確程度( 1-) 如:P(75 85 )=95%=1-5%
31、“大概80分左右”犯第一類錯(cuò)誤的概率(也叫顯著水平 )下限上限置信水平1 第75頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二/2/21-圖示如下第76頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二雙變量線性模型中,i (i=1,2)的置信區(qū)間:在變量的顯著性檢驗(yàn)中已經(jīng)知道: 意味著,如果給定置信度(1-),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t/2, t/2)的概率是(1- )。表示為: 即第77頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二于是得到:(1-)的置信度下, i的置信區(qū)間是 在上述收入-消費(fèi)支出例中,如果給定 =0.01
32、,查表得: 由于于是,1、0的置信區(qū)間分別為: (0.6345,0.9195) (-433.32,226.98) 第78頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。要縮小置信區(qū)間,需要(1)增大樣本容量n。因?yàn)樵谕瑯拥闹眯潘较?,n越大,t分布表中的臨界值越??;同時(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減??;第79頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 (2)提高模型的擬合優(yōu)度。因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小。
33、由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。 第80頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二2.4 雙變量線性回歸分析的應(yīng)用:預(yù)測(cè)問題 一、0是條件均值E(Y|X=X0)或個(gè)值Y0的一個(gè)無(wú)偏估計(jì)二、總體條件均值與個(gè)值預(yù)測(cè)值的置信區(qū)間-(選學(xué)內(nèi)容)第81頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 對(duì)于雙變量線性回歸模型 給定樣本以外的解釋變量的觀測(cè)值X0,可以得到被解釋變量的預(yù)測(cè)值0 ,可以此作為其條件均值E(Y|X=X0)或個(gè)別值Y0的一個(gè)近似估計(jì)。 嚴(yán)格地說,這只是被解釋變量的預(yù)測(cè)值的估計(jì)值,而不是預(yù)測(cè)值。原
34、因: (1)參數(shù)估計(jì)量不確定; (2)隨機(jī)項(xiàng)的影響說 明第82頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 二、總體條件均值與個(gè)值預(yù)測(cè)值的置信區(qū)間 1、總體均值預(yù)測(cè)值的置信區(qū)間 由于 于是可以證明 第83頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二因此 故 第84頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二于是,在1-的置信度下,總體均值E(Y|X0)的置信區(qū)間為 其中第85頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二2、總體個(gè)值預(yù)測(cè)值的預(yù)測(cè)區(qū)間 由 Y0=0+1X0+ 知: 于是 式中 :從而在1-的置信度下, Y0的置信區(qū)間為 第86
35、頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二在上述收入消費(fèi)支出例中,得到的樣本回歸函數(shù)為: 則在 X0=1000處, 0 = 103.172+0.7771000=673.84 而第87頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 因此,總體均值E(Y|X=1000)的95%的置信區(qū)間為: 61.05 E(Y|X=1000) 673.84+2.30661.05或 (533.05, 814.62) 同樣地,對(duì)于Y在X=1000的個(gè)體值,其95%的置信區(qū)間為: 673.84 - 2.30661.05Yx=1000 673.84 + 2.30661.05或 (372.03,
36、 975.65)第88頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 總體回歸函數(shù)的置信帶(域)(confidence band)-教材P120 個(gè)體的置信帶(域)第89頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 對(duì)于Y的總體均值E(Y|X)與個(gè)體值的預(yù)測(cè)區(qū)間(置信區(qū)間):(1)樣本容量n越大,預(yù)測(cè)精度越高,反之預(yù)測(cè)精度越低;(2)樣本容量一定時(shí),置信帶的寬度當(dāng)在X均值處最小,其附近進(jìn)行預(yù)測(cè)(插值預(yù)測(cè))精度越大;X越遠(yuǎn)離其均值,置信帶越寬,預(yù)測(cè)可信度下降。第90頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二2.5 實(shí)例:時(shí)間序列問題 一、中國(guó)居民人均消費(fèi)
37、模型 二、我國(guó)固定資產(chǎn)投資總額與GDP的關(guān)系第91頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 一、中國(guó)居民人均消費(fèi)模型 考察中國(guó)居民收入與消費(fèi)支出的關(guān)系。GDPP: 人均國(guó)內(nèi)生產(chǎn)總值(1990年不變價(jià))CONSP:人均居民消費(fèi)(以居民消費(fèi)價(jià)格指數(shù)(1990=100)縮減)。第92頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二第93頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二 1. 建立模型 擬建立如下雙變量回歸模型 采用Eviews軟件進(jìn)行回歸分析的結(jié)果見下表 該兩組數(shù)據(jù)是19782000年的時(shí)間序列數(shù)據(jù)(time series data); 前述收入消費(fèi)支出例中的數(shù)據(jù)是截面數(shù)據(jù)(cross-sectional data)。第94頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二第95頁(yè),共107頁(yè),2022年,5月20日,18點(diǎn)5分,星期二一般可寫出如下回歸分析結(jié)果: (13.51) (53.47) R2=0.9927 F=2859.23 DW-d=0.5503 R2=0.9927T值:C:13.51, GDPP:53.47 臨界值: t0.05/2(21)=2.08斜率項(xiàng):00.38621,符合絕對(duì)收入假說 2. 模型檢驗(yàn) 第96
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程土方施工合同范例
- 山林樹木合同范例
- 房東裝修出租合同范例
- 宣傳物料用品采購(gòu)合同范例
- 電梯設(shè)備戰(zhàn)略合作合同范例
- 種子銷售簡(jiǎn)易合同范例
- 藥材公司合同范例
- 酒店裝修顧問合同范例
- 合肥官方代理記賬合同范例
- 酒店雇人合同范例
- 9m跨度輕型屋面三角形鋼屋架設(shè)計(jì)說明書
- CA6140撥叉831002課程設(shè)計(jì)工序卡
- 全國(guó)醫(yī)療服務(wù)價(jià)格項(xiàng)目規(guī)范(2012年版)
- MATLAB論文基于MATLAB的自動(dòng)控制系統(tǒng)及案例分析
- 化學(xué)元素周期表word版(可打印)
- 車友會(huì)活動(dòng)策劃方案PPT
- 英語(yǔ)演講稿——Healthy Lifestyle
- 法院立案送達(dá)地址確認(rèn)書
- 電氣設(shè)備拆除工程施工方案
- GB_T 20981-2021 面包質(zhì)量通則(高清-現(xiàn)行)
- 企業(yè)標(biāo)準(zhǔn)化管理辦法
評(píng)論
0/150
提交評(píng)論