計量經(jīng)濟學(xué)2-2_第1頁
計量經(jīng)濟學(xué)2-2_第2頁
計量經(jīng)濟學(xué)2-2_第3頁
計量經(jīng)濟學(xué)2-2_第4頁
計量經(jīng)濟學(xué)2-2_第5頁
已閱讀5頁,還剩48頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 計量經(jīng)濟學(xué)理論和應(yīng)用張紅霞張紅霞Zhanghx_ n回歸分析回歸分析是要通過樣本所估計的參數(shù)來代替總是要通過樣本所估計的參數(shù)來代替總體的真實參數(shù),或者說是用樣本回歸線代替總體的真實參數(shù),或者說是用樣本回歸線代替總體回歸線。體回歸線。 盡管從統(tǒng)計性質(zhì)統(tǒng)計性質(zhì)上已知,如果有足夠多的重復(fù) 抽樣,參數(shù)的估計值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計值不一定就等于該真值。 那么,在一次抽樣中,參數(shù)的估計值與真值的差異有多大,是否顯著,這就需要進一步進行統(tǒng)計檢驗統(tǒng)計檢驗。 主要包括擬合優(yōu)度檢驗擬合優(yōu)度檢驗、變量的顯著性檢驗顯著性檢驗及參數(shù)的區(qū)間估計區(qū)間估計。一元線性回歸模型的統(tǒng)計檢驗一

2、元線性回歸模型的統(tǒng)計檢驗 一、擬合優(yōu)度檢驗一、擬合優(yōu)度檢驗 對樣本回歸線與樣本觀對樣本回歸線與樣本觀測值之間擬合程度的檢驗。測值之間擬合程度的檢驗。 :判定系數(shù)(可決系數(shù))R2 問題:問題:采用普通最小二乘估計方法,已經(jīng)保證了模型最好地擬合了樣本觀測值,為什么還要檢驗擬合程度? 1 1、總離差平方和的分解、總離差平方和的分解 已知由一組樣本觀測值(Xi,Yi),i=1,2,n得到如下樣本回歸直線 iiXY10iiiiiiiyeYYYYYYy)()( 如果Yi=i 即實際觀測值落在樣本回歸“線”上,則擬合最好擬合最好??烧J為,“離差離差”全部來自回歸線,而與“殘差”無關(guān)。 對于所有樣本點,則需考

3、慮這些點與樣本均值離差的平方和,可以證明: 1 1、總離差平方和的分解、總離差平方和的分解記22)(YYyTSSii總體平方和總體平方和(Total Sum of Squares)22)(YYyESSii回歸平方和回歸平方和(Explained Sum of Squares)22)(iiiYYeRSS殘差平方和殘差平方和(Residual Sum of Squares ) 1 1、總離差平方和的分解、總離差平方和的分解222:,00 0tttttttttX YYabXeX ee YYYYYYY估計回歸方程的性質(zhì) (1)一定在估計直線上 (2) (3)(4) (5) 1 1、總離差平方和的分解、

4、總離差平方和的分解TSS=ESS+RSS Y的觀測值圍繞其均值的總離差總離差(total variation)可分解為兩部分:一部分來自回歸線可分解為兩部分:一部分來自回歸線(ESS),另一部,另一部分則來自隨機勢力分則來自隨機勢力(RSS)。在給定樣本中,TSS不變, 如果實際觀測點離樣本回歸線越近,則ESS在TSS中占的比重越大,因此 擬合優(yōu)度擬合優(yōu)度:回歸平方和:回歸平方和ESS/YESS/Y的總離差的總離差TSSTSS 1 1、總離差平方和的分解、總離差平方和的分解TSSRSSTSSESSR1記22、判定系數(shù)、判定系數(shù)R2 2統(tǒng)計量統(tǒng)計量 稱稱 R2 為為(樣本)可決系數(shù)(樣本)可決系

5、數(shù)/判定系數(shù)判定系數(shù)(coefficient of determination)。 判定系數(shù)判定系數(shù)的取值范圍取值范圍:0,1 R2 2越接近越接近1 1,說明實際觀測點離樣本線越近,擬,說明實際觀測點離樣本線越近,擬合優(yōu)度越高合優(yōu)度越高。在實際計算可決系數(shù)時,在1已經(jīng)估計出后: 22212iiyxR 在例2.1.1的收入收入-消費支出消費支出例中, 9766. 045900207425000)777. 0(222212iiyxR 注:判定系數(shù)是一個非負的統(tǒng)計量。它也是注:判定系數(shù)是一個非負的統(tǒng)計量。它也是隨著抽樣的不同而不同。為此,對可決系數(shù)的統(tǒng)隨著抽樣的不同而不同。為此,對可決系數(shù)的統(tǒng)計可

6、靠性也應(yīng)進行檢驗。計可靠性也應(yīng)進行檢驗。 2、判定系數(shù)、判定系數(shù)R2 2統(tǒng)計量統(tǒng)計量 二、變量的顯著性檢驗二、變量的顯著性檢驗 回歸分析是要判斷是要判斷解釋變量X是否是是否是被解釋變量Y的一個顯著性的影響因素。的一個顯著性的影響因素。 在在一元線性模型中,就是要判斷中,就是要判斷X是否對是否對Y具有具有顯著的線性性影響。這就需要進行顯著的線性性影響。這就需要進行變量的顯著性檢驗。 變量的顯著性檢驗所應(yīng)用的方法是數(shù)理統(tǒng)計變量的顯著性檢驗所應(yīng)用的方法是數(shù)理統(tǒng)計學(xué)中的學(xué)中的假設(shè)檢驗假設(shè)檢驗。 計量經(jīng)計學(xué)中計量經(jīng)計學(xué)中,主要是針對變量的參數(shù)真值,主要是針對變量的參數(shù)真值是否為零來進行顯著性檢驗的。是否

7、為零來進行顯著性檢驗的。 1、假設(shè)檢驗、假設(shè)檢驗 n 所謂所謂假設(shè)檢驗,就是事先對總體參數(shù)或總體分布形式作出一個假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè)。n 假設(shè)檢驗采用的邏輯推理方法是反證法。 先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。接受原假設(shè)。n 判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生”這一原理的 2、變量的顯著性檢驗、變量的顯著性檢驗 ),(2211ixN)2(1112211nt

8、Sxti 檢檢驗驗步步驟:驟: (1)對總體參數(shù)提出假設(shè) H0: 1=0, H1:10(2)以原假設(shè)H0構(gòu)造t統(tǒng)計量,并由樣本計算其值11St (3)給定顯著性水平,查t分布表,得臨界值t /2(n-2)(4) 比較,判斷 若 |t| t /2(n-2),則拒絕H0 ,接受H1 ; 若 |t| t /2(n-2),則拒絕H1 ,接受H0 ; 2、變量的顯著性檢驗、變量的顯著性檢驗 對于一元線性回歸方程中的0,可構(gòu)造如下t統(tǒng)計量進行顯著性檢驗: )2(0022200ntSxnXtii 2、變量的顯著性檢驗、變量的顯著性檢驗 在上述收入-消費支出例中,首先計算2的估計值 1340221074250

9、00777. 04590020222221222nxyneiii0425. 00018. 07425000/13402221ixS41.98742500010/53650000134022220iixnXS 2、變量的顯著性檢驗、變量的顯著性檢驗 29.180425. 0777. 0111St048. 141.9817.103000St 給定顯著性水平=0.05,查t分布表得臨界值 t 0.05/2(8)=2.306 |t1|2.306,說明家庭可支配收入在家庭可支配收入在95%95%的置信的置信度下顯著,即是消費支出的主要解釋變量;度下顯著,即是消費支出的主要解釋變量; |t2|2.306,

10、表明在95%的置信度下,無法拒絕截距項為零的假設(shè)。 2、變量的顯著性檢驗、變量的顯著性檢驗 假設(shè)檢驗假設(shè)檢驗可以通過一次抽樣的結(jié)果檢驗總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。 要判斷樣本參數(shù)的估計值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過構(gòu)造一個以樣本參數(shù)的估計值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實的參數(shù)值。這種方法就是參數(shù)檢驗的置信區(qū)間估計置信區(qū)間估計。 三、參數(shù)的置信區(qū)間三、參數(shù)的置信區(qū)間 1)(P 如 果 存 在 這 樣 一 個 區(qū) 間 , 稱 之 為 置 信 區(qū) 間置 信 區(qū)

11、間(confidence interval); 1-稱為置信系數(shù)置信系數(shù)(置信度置信度)(confidence coefficient), 稱為顯著性水平顯著性水平(level of significance);置信區(qū)間的端點稱為置信限置信限(confidence limit)或臨界值臨界值(critical values)。 三、參數(shù)的置信區(qū)間三、參數(shù)的置信區(qū)間 一元線性模型中一元線性模型中, i (i=1,2)的置信區(qū)間的置信區(qū)間: :在變量的顯著性檢驗中已經(jīng)知道: )2(ntstiii 意味著,如果給定置信度(1-),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t/2, t

12、/2)的概率是(1- )。表示為: 三、參數(shù)的置信區(qū)間三、參數(shù)的置信區(qū)間 Pttt()221即Ptstiii()221Ptstsiiiii()221 三、參數(shù)的置信區(qū)間三、參數(shù)的置信區(qū)間 于是得到:(1-)的置信度下, i的置信區(qū)間是 (,)iitstsii22 在上述收入收入- -消費支出消費支出例中,如果給定 =0.01,查表得: 355. 3)8()2(005. 02tnt由于042. 01S41.980S于是,1、0的置信區(qū)間分別為: (0.6345,0.9195) (-433.32,226.98) 三、參數(shù)的置信區(qū)間三、參數(shù)的置信區(qū)間 由于置信區(qū)間一定程度地給出了樣本參數(shù)估計值與總體

13、參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。 要縮小置信區(qū)間,需 (1 1)增大樣本容量)增大樣本容量n n,因為在同樣的置信水平下,n越大,t分布表中的臨界值越??;同時,增大樣本容量,還可使樣本參數(shù)估計量的標(biāo)準(zhǔn)差減?。?(2 2)提高模型的擬合優(yōu)度)提高模型的擬合優(yōu)度,因為樣本參數(shù)估計量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小。 三、參數(shù)的置信區(qū)間三、參數(shù)的置信區(qū)間 經(jīng)濟解釋經(jīng)濟解釋n基本含義:基本含義:nX增加增加1個單位,個單位,Y將平均增加將平均增加 個單位個單位iiXY101經(jīng)濟解釋經(jīng)濟解釋n取對數(shù)以后的解釋取對數(shù)以后的解釋 XYlnln10XdXYdYXdX

14、YdY111X增加1%,Y將增加 %。n雙對數(shù)模型應(yīng)用非常廣泛,其優(yōu)點是:雙對數(shù)模型應(yīng)用非常廣泛,其優(yōu)點是:v參數(shù)具有彈性含義(可用來估計常彈性)參數(shù)具有彈性含義(可用來估計常彈性)v經(jīng)過對數(shù)變換的變量,一般更加符合假設(shè)條件經(jīng)過對數(shù)變換的變量,一般更加符合假設(shè)條件v可以縮小取值范圍,減少異常值的影響可以縮小取值范圍,減少異常值的影響經(jīng)濟解釋經(jīng)濟解釋經(jīng)濟解釋經(jīng)濟解釋nX增加增加1%,Y將增加將增加 。 XYln10XXYXdXdY11101. 0經(jīng)濟解釋經(jīng)濟解釋XY10)ln(XYYdXYdY11X增加1個單位,Y將增加%1001經(jīng)濟解釋經(jīng)濟解釋n在解釋時,要考慮計量單位在解釋時,要考慮計量單位

15、010121211XwYwXwwXYYXwwXwXXXXYYXXlliiiiiiiiXXXY 預(yù)測問題預(yù)測問題 一、0是條件均值E(Y|X=X0)或個值Y0的一個無偏估計二、總體條件均值與個值預(yù)測值的置信區(qū)間 對于一元線性回歸模型 iiXY10給定樣本以外的解釋變量的觀測值X0,可以得到被解釋變量的預(yù)測值0 0 ,可以此作為其條件均值條件均值E(Y|X=X0)或個別值個別值Y0的一個近似估計。 注意:注意: 嚴(yán)格地說,這只是被解釋變量的預(yù)測值的估計值,而不是預(yù)測值。 原因:(1)參數(shù)估計量不確定; (2)隨機項的影響 預(yù)測問題預(yù)測問題 一、一、0 0是條件均值是條件均值E(Y|X=X0)或個值

16、或個值Y0的一的一個無偏估計個無偏估計對總體回歸函數(shù)總體回歸函數(shù)E(Y|X=X0)=0+1X,X=X0時 E(Y|X=X0)=0+1X00100XY于是0101000100)()()()(XEXEXEYE可見,可見,0是條件均值是條件均值E(Y|X=X0)的無偏估計的無偏估計。 預(yù)測問題預(yù)測問題 對總體回歸模型總體回歸模型Y=0+1X+,當(dāng)X=X0時0100XY于是0100100100)()()(XEXXEYE0101000100)()()()(XEXEXEYE 預(yù)測問題預(yù)測問題 ? 二、總體條件均值與個值預(yù)測值的置信二、總體條件均值與個值預(yù)測值的置信區(qū)間區(qū)間 1、總體均值預(yù)測值的置信區(qū)間、總

17、體均值預(yù)測值的置信區(qū)間 由于 0100XY),(2211ixN),(22200iixnXN于是0101000)()()(XEXEYE)(),(2)()(12010000VarXCovXVarYVar可以證明 2210/),(ixXCov 預(yù)測問題預(yù)測問題 因此 222022022202)(iiiixXxXXxnXYVar200222222XXXXnXnXxii)(20222XXnxxii)(1(2202ixXXn故 )(1(,(22020100ixXXnXNY)2()(00100ntSXYtY)(1(22020iYxXXnS其中于是,在1-的置信度下,總體均值總體均值E(Y|X0)的置信區(qū)間為

18、的置信區(qū)間為 0202000)|(YYStYXYEStY2、總體個值預(yù)測值的預(yù)測區(qū)間、總體個值預(yù)測值的預(yù)測區(qū)間 由 Y0=0+1X0+ 知: ),(20100XNY于是 )(11 (, 0(220200ixXXnNYY)2(0000ntSYYtYY式中 :)(11 (220200iYYxXXnS從而在1-的置信度下, Y0的置信區(qū)間的置信區(qū)間為 002020000YYYYStYYStY 預(yù)測問題預(yù)測問題 在上述收入收入-消費支出消費支出例中,得到的樣本回歸函數(shù)為 iiXY777. 0172.103 則在 X0=1000處, 0 = 103.172+0.7771000=673.84 29.372

19、77425000)21501000(10113402)(20YVar而05.61)(0YS 因此,總體均值總體均值E(Y|X=1000)的95%的置信區(qū)間為: 673.84-2.30661.05 E(Y|X=1000) 673.84+2.30661.05或 (533.05, 814.62) 預(yù)測問題預(yù)測問題 同樣地,對于Y在X=1000的個體值個體值,其95%的置信區(qū)間為: 673.84 - 2.30661.05Yx=1000 673.84 + 2.30661.05或 (372.03, 975.65) 預(yù)測問題預(yù)測問題 預(yù)測問題預(yù)測問題 總體回歸函數(shù)的置信帶(域)置信帶(域)(confiden

20、ce band) 個體的置信帶(域)置信帶(域) 對于Y的總體均值E(Y|X)與個體值的預(yù)測區(qū)間(置信區(qū)間):(1)樣本容量n越大,預(yù)測精度越高,反之預(yù)測精度越低;(2)樣本容量一定時,置信帶的寬度當(dāng)在X均值處最小,其附近進行預(yù)測(插值預(yù)測)精度越大;X越遠離其均值,置信帶越寬,預(yù)測可信度下降。 預(yù)測問題預(yù)測問題 n在預(yù)測時,要注意:在預(yù)測時,要注意:v不能預(yù)測離樣本區(qū)間太遠的點不能預(yù)測離樣本區(qū)間太遠的點v要分析參數(shù)會不會發(fā)生變化要分析參數(shù)會不會發(fā)生變化v可以先按可以先按n-1個樣本建模,利用第個樣本建模,利用第n個數(shù)據(jù)進個數(shù)據(jù)進行檢驗行檢驗 預(yù)測問題預(yù)測問題 n預(yù)測精度預(yù)測精度n當(dāng)平均絕對百

21、分誤差小于當(dāng)平均絕對百分誤差小于10時,可以認時,可以認為預(yù)測精度較高為預(yù)測精度較高nYYYMAPEiii/ 預(yù)測問題預(yù)測問題 模型的改進模型的改進n遺漏重要自變量遺漏重要自變量n函數(shù)形式不合適函數(shù)形式不合適n違背回歸模型的假設(shè)違背回歸模型的假設(shè)n存在異常值存在異常值模型的改進模型的改進n分析工具分析工具 殘差(殘差( )圖)圖 22211var. 0XXXXneeEYYeiiiiiiiie模型的改進模型的改進n殘差圖因縱坐標(biāo)、橫坐標(biāo)不同而有多殘差圖因縱坐標(biāo)、橫坐標(biāo)不同而有多種形式,常用的為:種形式,常用的為:X Variable 1 Residual Plot-600-400-20002004006008000.002000.004000.006000.008000.0010000.0012000.0014000.00收入殘差模型的改進模型的改進n帽子矩陣(帽子矩陣(hat matrix)XXjiijnjjijnjjXXjinjjXXjjiiiilXXXXnhYhYlXXXXYnlYXXXXYXXYXY11111110模型的改進模型的改進n帽子矩陣對角線上的點稱為杠桿率,在帽子矩陣對角線上的點稱為杠桿率,在高杠桿率的位置如果出現(xiàn)異常的高杠桿率的位置如果出現(xiàn)異常的Y值,將值,將對擬合產(chǎn)生嚴(yán)重的影響。對擬合產(chǎn)生嚴(yán)重的影響。穩(wěn)健估計穩(wěn)健估計n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論