雙變量線性回歸課件_第1頁
雙變量線性回歸課件_第2頁
雙變量線性回歸課件_第3頁
雙變量線性回歸課件_第4頁
雙變量線性回歸課件_第5頁
已閱讀5頁,還剩135頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第二章雙變量線性回歸1XianghongShirleyWang-modifiedfromProfessorAnderson

回歸分析概述模型的基本假設(shè)模型的參數(shù)估計(jì)模型的統(tǒng)計(jì)檢驗(yàn)?zāi)P偷念A(yù)測實(shí)例主要內(nèi)容2XianghongShirleyWang2.1回歸分析概述變量間的關(guān)系及回歸分析的基本概念總體回歸函數(shù)(PRF)隨機(jī)擾動(dòng)項(xiàng)樣本回歸函數(shù)(SRF)3XianghongShirleyWang對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的。相關(guān)分析對(duì)稱地對(duì)待任何(兩個(gè))變量,兩個(gè)變量都被看作是隨機(jī)的。回歸分析對(duì)變量的處理方法存在不對(duì)稱性,即區(qū)分因變量(被解釋變量)和自變量(解釋變量):前者是隨機(jī)變量,后者不是。5XianghongShirleyWang回歸分析的基本概念回歸分析(regressionanalysis)是研究一個(gè)變量關(guān)于另一個(gè)(些)變量的具體依賴關(guān)系的計(jì)算方法和理論。其目的在于通過后者的已知或設(shè)定值,去估計(jì)和(或)預(yù)測前者的(總體)均值。被解釋變量(ExplainedVariable)或因變量(DependentVariable)。解釋變量(ExplanatoryVariable)或自變量(IndependentVariable)。6XianghongShirleyWang回歸分析構(gòu)成計(jì)量經(jīng)濟(jì)學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括:根據(jù)樣本觀察值對(duì)經(jīng)濟(jì)計(jì)量模型參數(shù)進(jìn)行估計(jì),求得回歸方程;對(duì)回歸方程、參數(shù)估計(jì)值進(jìn)行顯著性檢驗(yàn);利用回歸方程進(jìn)行分析、評(píng)價(jià)及預(yù)測。7XianghongShirleyWang例:一個(gè)假想的社區(qū)有100戶家庭組成,要研究該社區(qū)每月家庭消費(fèi)支出Y與每月家庭可支配收入X的關(guān)系。即如果知道了家庭的月收入,能否預(yù)測該社區(qū)家庭的平均月消費(fèi)支出水平。為達(dá)到此目的,將該100戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費(fèi)支出。9XianghongShirleyWang10XianghongShirleyWang由于不確定性因素的影響,對(duì)同一收入水平X,不同家庭的消費(fèi)支出并不完全相同;但由于調(diào)查的完備性,給定收入水平X的消費(fèi)支出Y的分布是確定的,即以X的給定值為條件的Y的條件分布(Conditionaldistribution)是已知的,例如:P(Y=561|X=800)=1/4。11XianghongShirleyWang05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消費(fèi)支出Y(元)13XianghongShirleyWang在給定解釋變量Xi

條件下被解釋變量Yi

的期望軌跡稱為總體回歸線(populationregressionline),或更一般地稱為總體回歸曲線(populationregressioncurve)。相應(yīng)的函數(shù):稱為(雙變量)總體回歸函數(shù)(populationregressionfunction,PRF)。14XianghongShirleyWang含義:總體回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。函數(shù)形式:可以是線性或非線性的。例子中,將居民消費(fèi)支出看成是其可支配收入的線性函數(shù)時(shí):為一線性函數(shù)。其中,0,1是未知參數(shù),稱為回歸系數(shù)(regressioncoefficients)。15XianghongShirleyWang三、隨機(jī)擾動(dòng)項(xiàng)總體回歸函數(shù)說明在給定的收入水平Xi下,該社區(qū)家庭平均的消費(fèi)支出水平。但對(duì)某一個(gè)別的家庭,其消費(fèi)支出可能與該平均水平存在偏差。稱為觀察值圍繞它的期望值的離差(deviation),它是一個(gè)不可觀測的隨機(jī)變量,又稱為隨機(jī)擾動(dòng)項(xiàng)(stochasticdisturbance)或隨機(jī)誤差項(xiàng)(stochasticerror)。17XianghongShirleyWang

上例中,給定收入水平Xi,個(gè)別家庭的支出可表示為兩部分之和:該收入水平下所有家庭的平均消費(fèi)支出E(Y|Xi),稱為系統(tǒng)性(systematic)或確定性(deterministic)部分;其他隨機(jī)或非確定性(nonsystematic)部分為

ui。稱為總體回歸函數(shù)(PRF)的隨機(jī)設(shè)定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機(jī)性影響。由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)學(xué)模型,因此也稱為總體回歸模型。18XianghongShirleyWang隨機(jī)誤差項(xiàng)的意義理論的模糊性數(shù)據(jù)的欠缺核心變量與周邊變量人類行為的內(nèi)在隨機(jī)性糟糕的替代變量節(jié)省原則(Occam’srazor)錯(cuò)誤的函數(shù)形式19XianghongShirleyWang該樣本的散點(diǎn)圖(scatterdiagram)如下:

畫一條直線以盡好地?cái)M合該散點(diǎn)圖,由于樣本取自總體,可以將該直線近似地代表總體回歸線。該直線稱為樣本回歸線(sampleregressionlines)。21XianghongShirleyWang樣本回歸線可以看成總體回歸線的近似替代。樣本回歸線的函數(shù)形式為:即為樣本回歸函數(shù)(sampleregressionfunction,SRF)。為E(Y|Xi

)的估計(jì)量;為i

的估計(jì)量,(i=0,1)。22XianghongShirleyWang樣本回歸函數(shù)的隨機(jī)形式/樣本回歸模型:同樣地,樣本回歸函數(shù)也有如下的隨機(jī)形式:

由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)模型,因此也稱為樣本回歸模型(sampleregressionmodel)。

23XianghongShirleyWang2.2模型的基本假設(shè)

仍以家庭收入X與消費(fèi)支出Y之間的關(guān)系為例,每個(gè)家庭的消費(fèi)支出Y主要取決于該家庭的收入X,但是也受其他因素的影響。高收入家庭,消費(fèi)支出的離散性比較大(方差較大)低收入家庭,消費(fèi)支出的離散性比較小(方差較小)

通常,消費(fèi)支出Y的分布函數(shù)是多種多樣的,不一定是正態(tài)分布,也不一定是相同的分布。分布函數(shù)的方差、均值都不相同,分布函數(shù)的形式也不同。25XianghongShirleyWang家庭消費(fèi)支出Y是家庭收入X的條件概率函數(shù)P(Y|Xi)。這個(gè)概率函數(shù)有三個(gè)明顯特征:對(duì)于不同的X,條件概率P(Y|Xi)的分布函數(shù)形式不同對(duì)于不同的X,條件概率P(Y|Xi)的方差不同對(duì)于不同的X,條件概率P(Y|Xi)的均值E(Y)一般不在同一條直線上26XianghongShirleyWang

1)重復(fù)抽樣中,解釋變量

是一組固定的值或雖然是隨機(jī)的,但與干擾項(xiàng)獨(dú)立;一、對(duì)變量和模型的假定2)無測量誤差;3)模型設(shè)定正確(不存在設(shè)定誤差)29XianghongShirleyWang假定1:隨機(jī)誤差項(xiàng)ui的數(shù)學(xué)期望(均值)為0,即二、對(duì)隨機(jī)擾動(dòng)項(xiàng)(或分布)的假定

30XianghongShirleyWang假定2:隨機(jī)誤差項(xiàng)ui的方差與i無關(guān),為一個(gè)常數(shù),又稱為同方差性。Var(ui)=

E(ui-E(ui))2=E(ui2)=u2,i=1,2,……,n

如果誤差項(xiàng)的方差不同,那么與其對(duì)應(yīng)的觀測值Yi的可靠程度也不相同。這會(huì)使參數(shù)的檢驗(yàn)和利用模型進(jìn)行預(yù)測復(fù)雜化。而滿足同方差假設(shè),將使檢驗(yàn)和預(yù)測簡化。31XianghongShirleyWang假定3:無自相關(guān)假定,即表示不同的誤差項(xiàng)之間互相獨(dú)立,同時(shí),不同的被解釋變量在統(tǒng)計(jì)上也是互相獨(dú)立的。Cov(ui,

uj)=E(ui-E(ui))(uj-E(uj))=E(uiuj)=0,i≠j,i,j=1,2,……,n32XianghongShirleyWang假定4:擾動(dòng)項(xiàng)與解釋變量之間不相關(guān)(相互獨(dú)立)Cov(ui,

Xi)=E(ui-E(ui))(Xi-E(Xi))=E(ui(Xi-E(Xi))=E(uiXi)-E(ui)E(Xi)=E(uiXi)=033XianghongShirleyWang假定5:隨機(jī)擾動(dòng)項(xiàng)服從正態(tài)分布如果只利用OLS進(jìn)行參數(shù)估計(jì),不需要該假設(shè)。但是若要進(jìn)行假設(shè)檢驗(yàn)和預(yù)測,就必須知道總體Yi的分布情況。如果Xi為非隨機(jī)變量,總體Yi與誤差項(xiàng)ui服從相同的分布,Yi與ui之間只有均值E(Yi)的差別。根據(jù)中心極限定理,當(dāng)樣本容量趨于無窮大時(shí),假定5對(duì)于任何實(shí)際模型都是滿足的。34XianghongShirleyWang

以上假定1-4也稱為線性回歸模型的經(jīng)典假設(shè)或高斯(Gauss)假設(shè),滿足該假設(shè)的線性回歸模型,也稱為經(jīng)典線性回歸模型(ClassicalLinearRegressionModel,CLRM)。

35XianghongShirleyWang2.3模型的參數(shù)估計(jì)參數(shù)估計(jì)——最小二乘法(OLS)最小二乘估計(jì)量的性質(zhì)36XianghongShirleyWangXY(Xn,Yn)(X1,Y1)(X2,Y2)(Xi,Yi)}一、最小二乘法(OLS)尋找實(shí)際值與擬合值的殘差平方和為最小的回歸直線。殘差平方和為:37XianghongShirleyWang根據(jù)微積分中求極值的原理

正規(guī)方程組(normalequations)38XianghongShirleyWang解方程組得截距項(xiàng):當(dāng)解釋變量為零時(shí),被解釋變量的取值;斜率項(xiàng):當(dāng)解釋變量每變動(dòng)一個(gè)單位時(shí),被解釋變量

平均變動(dòng)個(gè)單位。注:令或OLS估計(jì)量的離差形式(deviationform)39XianghongShirleyWang樣本回歸函數(shù)可以記作:定義:右式稱為樣本回歸函數(shù)的離差形式。因此40XianghongShirleyWang

例:

討論家庭收入X對(duì)家庭消費(fèi)支出Y的影響問題。如果通過調(diào)查得到一組數(shù)據(jù):(百元)

187.76461.62121114413232013400260430229006605402116008406502725001350770384900266089039810035109100551000060501012066144007920合計(jì)540299.74300822893.641XianghongShirleyWang42XianghongShirleyWang二、最小二乘估計(jì)量的性質(zhì)

當(dāng)模型參數(shù)估計(jì)出后,需考慮參數(shù)估計(jì)值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計(jì)量的統(tǒng)計(jì)性質(zhì)。

43XianghongShirleyWang

一個(gè)用于考察總體的估計(jì)量,可以從以下幾個(gè)方面考察其優(yōu)劣性:(1)線性性,即它是否是隨機(jī)變量Yi

的線性函數(shù);(2)無偏性,即它的均值或期望值是否等于總體的真實(shí)值;(3)有效性,即它是否在所有線性無偏估計(jì)量中具有最小方差。

這三個(gè)準(zhǔn)則也稱作估計(jì)量的小樣本性質(zhì)。擁有這類性質(zhì)的估計(jì)量稱為最佳線性無偏估計(jì)量(bestlinerunbiasedestimator,BLUE)。

44XianghongShirleyWang

在給定經(jīng)典線性回歸的假定下,最小二乘估計(jì)量是具有最小方差的線性無偏估計(jì)量。——高斯—馬爾可夫定理(Gauss-Markovtheorem)45XianghongShirleyWang線性特性是指參數(shù)估計(jì)量分別為觀測值Yi或擾動(dòng)項(xiàng)ui的線性組合。(一)線性性46XianghongShirleyWang47XianghongShirleyWang(二)無偏性證:證:48XianghongShirleyWang(三)有效性(最小方差性)先求和的方差證明:49XianghongShirleyWang

證明50XianghongShirleyWang再證明所求的方差為最小方差假設(shè)是總體參數(shù)的線性無偏估計(jì)量,有51XianghongShirleyWang由是的線性無偏估計(jì),所以比較等式兩邊,有

52XianghongShirleyWang其中53XianghongShirleyWang同理可證也有最小方差。為最小值,且由此證明了最小二乘估計(jì)值的方差在1的各種線性無偏估計(jì)值中為最小。最小二乘法也稱最優(yōu)線性無偏估計(jì)(BLUE:bestlinearunbiasedestimators)這種特性稱為高斯—馬爾可夫(Gauss—Markov)定理。54XianghongShirleyWang正態(tài)分布變量的線性組合,仍為正態(tài)分布變量。因此55XianghongShirleyWang2.4模型的統(tǒng)計(jì)檢驗(yàn)擬合優(yōu)度檢驗(yàn)方程顯著性檢驗(yàn)變量顯著性檢驗(yàn)56XianghongShirleyWang回歸分析是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù),或者說是用樣本回歸線代替總體回歸線。盡管從統(tǒng)計(jì)性質(zhì)上已知,如果有足夠多的重復(fù)抽樣,參數(shù)的估計(jì)值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計(jì)值不一定就等于該真值。那么,在一次抽樣中,參數(shù)的估計(jì)值與真值的差異有多大,是否顯著,這就需要進(jìn)一步進(jìn)行統(tǒng)計(jì)檢驗(yàn)。主要包括擬合優(yōu)度檢驗(yàn)、方程的顯著性檢驗(yàn)及變量的顯著性檢驗(yàn),其中還會(huì)涉及參數(shù)的區(qū)間估計(jì)問題。57XianghongShirleyWang一、擬合優(yōu)度檢驗(yàn)

擬合優(yōu)度檢驗(yàn):是檢驗(yàn)?zāi)P蛯?duì)樣本觀測值的擬合程度。檢驗(yàn)的具體方法,是構(gòu)造一個(gè)可以表征擬合程度的指標(biāo),在這里被稱為統(tǒng)計(jì)量。統(tǒng)計(jì)量是樣本的函數(shù)。從檢驗(yàn)對(duì)象中計(jì)算出該統(tǒng)計(jì)量的數(shù)值,然后與某一標(biāo)準(zhǔn)進(jìn)行比較,得出檢驗(yàn)結(jié)論。度量擬合優(yōu)度的指標(biāo):判定系數(shù)(可決系數(shù))R258XianghongShirleyWang有人也許會(huì)問,采用普通最小二乘估計(jì)方法,已經(jīng)保證了模型最好地?cái)M合樣本觀測值,為什么還要檢驗(yàn)擬合程度?問題在于,在一個(gè)特定的條件下做得最好的并不一定就是高質(zhì)量的。普通最小二乘法所保證的最好擬合,是同一個(gè)問題內(nèi)部的比較,擬合優(yōu)度檢驗(yàn)結(jié)果所表示的優(yōu)劣是不同問題之間的比較。59XianghongShirleyWangy0xy0x例如上面兩圖的直線方程都是由散點(diǎn)表示的樣本觀測值的最小二乘估計(jì)結(jié)果,對(duì)于每個(gè)問題它們都滿足殘差的平方和最小,但是二者對(duì)樣本觀測值的擬合程度顯然是不同的。60XianghongShirleyWang

1.總離差平方和的分解已知由一組樣本觀測值(Xi,Yi),i=1,2…,n,得到樣本回歸直線:

總偏差(離差)可解釋偏差(回歸偏差)殘差(隨機(jī)偏差)61XianghongShirleyWang

Y

iX來自殘差來自回歸是樣本回歸擬和值與觀測值的平均之差,可以認(rèn)為是由回歸直線解釋的部分;是實(shí)際觀測值與回歸擬和值之差,可以認(rèn)為是回歸直線不能解釋的部分。62XianghongShirleyWang

如果Yi=?i

即實(shí)際觀測值落在樣本回歸“線”上,則擬合最好??梢哉J(rèn)為,“離差”全部來自回歸線,而與“殘差”無關(guān)。

對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)(觀測點(diǎn))與樣本均值離差(總離差)的平方和,可以證明:63XianghongShirleyWang證:64XianghongShirleyWangESS(Explainedsumofsquares)為回歸平方和,反映由模型中解釋變量所解釋的那部分離差的大小TSS(Totalsumofsquares)為總體平方和,反映樣本觀測值總體離差的大小TSS=ESS+RSSRSS(Residualsumofsquares)為殘差平方和,反映樣本觀測值與估計(jì)值偏離的大小,也是模型中解釋變量未解釋的那部分離差的大小65XianghongShirleyWang

顯然,ESS在TSS中所占比例越大,RSS在TSS中所占比例越小,說明回歸參數(shù)估計(jì)值的顯著性越強(qiáng)。因此,可以選擇總體平方和與回歸平方和的接近程度作為一個(gè)評(píng)判模型擬合優(yōu)度的標(biāo)準(zhǔn)。即樣本回歸線與樣本觀測值擬合TSS=ESS+RSS得越好。66XianghongShirleyWang

既然RSS反映樣本觀測值與估計(jì)值偏離的大小,是否可以直接用它作為擬合優(yōu)度檢驗(yàn)的統(tǒng)計(jì)量?作為檢驗(yàn)統(tǒng)計(jì)量的一般是相對(duì)量,而不能用絕對(duì)量。因?yàn)橛媒^對(duì)量作為檢驗(yàn)統(tǒng)計(jì)量,無法設(shè)置標(biāo)準(zhǔn)。RSS(殘差平方和)與樣本容量關(guān)系很大,當(dāng)n比較小時(shí),它的值也較小,但不能因此而判斷模型的擬合優(yōu)度就好。67XianghongShirleyWang回歸平方和:RSS(Regressionsumofsquares)

或SSR(Sumofsquaresduetoregression)殘差平方和:ESS(errorsumofsquares)

或SSE(Sumofsquaresduetoerror)注意:在有些計(jì)量經(jīng)濟(jì)學(xué)著作中所使用的符號(hào)與我們相反:68XianghongShirleyWang定義:

R2表示模型擬合的程度,稱為擬合優(yōu)度或判定

系數(shù)(coefficientofdetermination)。2.擬合優(yōu)度的度量69XianghongShirleyWang

因?yàn)?≤ESS≤TSS,0≤RSS≤TSS

所以0≤R2≤1

R2

越接近1,說明實(shí)際觀測點(diǎn)離樣本回歸線越近,擬合優(yōu)度越高。70XianghongShirleyWang對(duì)于雙變量線性回歸模型71XianghongShirleyWang仍以上一節(jié)的例子說明

XY187.7212113201343022540216502777038890399100551012066合計(jì)540299.772XianghongShirleyWang在實(shí)際應(yīng)用中,達(dá)到多大才算通過了檢驗(yàn),沒有絕對(duì)的標(biāo)準(zhǔn),要看具體情況而定。模型的擬合優(yōu)度并不是判斷模型質(zhì)量的唯一標(biāo)準(zhǔn)。有時(shí)甚至為了追求模型的經(jīng)濟(jì)意義,可以犧牲一點(diǎn)擬合優(yōu)度。73XianghongShirleyWang對(duì)于變量之間的關(guān)系,有多種分析方法。除了回歸分析方法之外,相關(guān)分析方法也可以用于分析變量之間的關(guān)系。通常把相關(guān)分析作為回歸分析的補(bǔ)充分析方法。由擬合優(yōu)度可以引入樣本相關(guān)系數(shù)

r(samplecorrelationcoefficient)74XianghongShirleyWangr

的數(shù)值與R2有關(guān),但概念不同。75XianghongShirleyWang二、方程顯著性檢驗(yàn)

方程的顯著性檢驗(yàn),旨在對(duì)模型中被解釋變量與解釋變量之間的線性關(guān)系在總體上是否顯著成立作出推斷。

我們利用F統(tǒng)計(jì)量對(duì)方程的顯著性進(jìn)行檢驗(yàn),F(xiàn)檢驗(yàn)的思想來自于總離差平方和的分解式,使用的是方差分析的原理。76XianghongShirleyWangF檢驗(yàn)的思想TSS=ESS+RSS77XianghongShirleyWangF統(tǒng)計(jì)量根據(jù)數(shù)理統(tǒng)計(jì)的結(jié)論:因此,建立統(tǒng)計(jì)量我們可以利用F統(tǒng)計(jì)量對(duì)回歸方程進(jìn)行顯著性檢驗(yàn)。78XianghongShirleyWangF檢驗(yàn)的步驟(1)提出假設(shè):(2)利用樣本值計(jì)算統(tǒng)計(jì)量:(3)79XianghongShirleyWang仍以上個(gè)例子說明(1)提出假設(shè):(2)利用樣本值計(jì)算統(tǒng)計(jì)量:(3)80XianghongShirleyWang三、變量顯著性檢驗(yàn)

回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個(gè)顯著性的影響因素。在雙變量線性模型中,就是要判斷X是否對(duì)Y具有顯著的線性性影響。這就需要進(jìn)行變量的顯著性檢驗(yàn)。

變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中的假設(shè)檢驗(yàn)。計(jì)量經(jīng)濟(jì)學(xué)中,主要是針對(duì)變量的參數(shù)真值是否為零來進(jìn)行顯著性檢驗(yàn)的。81XianghongShirleyWang82XianghongShirleyWang83XianghongShirleyWang隨機(jī)誤差項(xiàng)方差的估計(jì)變量的顯著性檢驗(yàn)總體參數(shù)的置信區(qū)間本小節(jié)的主要內(nèi)容包括84XianghongShirleyWang殘差ei可以看作誤差項(xiàng)ui的估計(jì)值。因此,我們可以用殘差ei的方差作為

2的估計(jì)值。1.隨機(jī)誤差項(xiàng)方差的估計(jì)85XianghongShirleyWang上式中為待定的ei的自由度。由于殘差ei是由樣本得到的,樣本容量n總是有限的,并且由于殘差ei存在約束條件,因此ei的自由度<n。的數(shù)值由

2的估計(jì)值應(yīng)該具有無偏性的條件求出。86XianghongShirleyWang所以根據(jù)87XianghongShirleyWang其中88XianghongShirleyWang實(shí)際上,由于最小二乘估計(jì)要求滿足如下兩個(gè)條件:

因此,自由度必然是n-2,2代表有兩個(gè)約束條件。89XianghongShirleyWang

當(dāng)參數(shù)方差中的總體方差未知時(shí),用的無偏估計(jì)量來代替。S稱為誤差項(xiàng)的標(biāo)準(zhǔn)差。90XianghongShirleyWang

有了的方差估計(jì),就可以對(duì)最小二乘估計(jì)進(jìn)行顯著性檢驗(yàn),也可以估計(jì)總體參數(shù)的置信區(qū)間。簡稱為標(biāo)準(zhǔn)誤(standarderroroftheregression)。91XianghongShirleyWang2.變量的顯著性檢驗(yàn)

利用正態(tài)分布轉(zhuǎn)化公式,可以構(gòu)造與0和1有關(guān)的假設(shè)。92XianghongShirleyWang其中,(n-k)為自由度,k為估計(jì)參數(shù)的總數(shù)。對(duì)于雙變量線性回歸模型,有兩個(gè)參數(shù),k=2。建立t統(tǒng)計(jì)量93XianghongShirleyWangt分布是對(duì)稱分布函數(shù),所以t

落入?yún)^(qū)間()內(nèi)的概率是

t

的臨界值除了與顯著性水平有關(guān),還與自由度(n-k)有關(guān)。94XianghongShirleyWang變量顯著性檢驗(yàn)的步驟

(1)對(duì)總體參數(shù)提出假設(shè)原假設(shè)H0:1=0;備擇假設(shè)H1:10(2)以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量,并由樣本計(jì)算其值(3)給定顯著性水平,查t分布表得臨界值t

/2(n-2)95XianghongShirleyWang

(4)比較、判斷得出結(jié)論可以認(rèn)為假設(shè)H0:1=0成立的概率很大。因此接受原假設(shè)H0:1=0,拒絕對(duì)立假設(shè)H1:1≠0。可以認(rèn)為假設(shè)H0:1=0成立的概率很小。因此拒絕原假設(shè)H0:1=0,接受對(duì)立假設(shè)H1:2≠0。96XianghongShirleyWang仍以前面的例子說明(1)提出原假設(shè)和備擇假設(shè)(2)計(jì)算t統(tǒng)計(jì)量的值(3)設(shè)定=0.05,查t

分布表得所以拒絕原假設(shè)H0:1=0,接受備擇假設(shè)H1:1≠0。認(rèn)為X變量是顯著的。(4)得到結(jié)論,由于:97XianghongShirleyWang其他形式的檢驗(yàn)98XianghongShirleyWang對(duì)0的檢驗(yàn)

通常情況下,回歸模型中的截距項(xiàng)是需要保留的,盡管有的時(shí)候它并沒有什么實(shí)際的經(jīng)濟(jì)含義,但為了保證最小二乘法滿足假定條件,并使得參數(shù)估計(jì)量是無偏的,截距項(xiàng)都不會(huì)被去除。

對(duì)于特殊的情況,比如E(X)=0時(shí),有Y=0,那么,雙變量模型的形式可以設(shè)定為過原點(diǎn)的形式,此時(shí)參數(shù)估計(jì)量仍是無偏的。99XianghongShirleyWang3.總體參數(shù)的置信區(qū)間假設(shè)檢驗(yàn)可以通過一次抽樣的結(jié)果來檢驗(yàn)總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。要想判斷樣本參數(shù)的估計(jì)值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過構(gòu)造一個(gè)以樣本參數(shù)的估計(jì)值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實(shí)的參數(shù)值。這種方法就是參數(shù)檢驗(yàn)的置信區(qū)間估計(jì)。

100XianghongShirleyWang

要判斷估計(jì)的參數(shù)值離真實(shí)的參數(shù)值有多“近”,可預(yù)先選擇一個(gè)概率

a(0<a<1),并求一個(gè)正數(shù)d,使得隨機(jī)區(qū)間包含參數(shù)真值的概率為1-

a

。即置信區(qū)間可以以一定概率推斷總體參數(shù)所處的區(qū)間,從而推斷總體回歸線所在的區(qū)域。101XianghongShirleyWangi(i=0,1)的置信區(qū)間在變量的顯著性檢驗(yàn)中已經(jīng)知道:

這意味著,如果給定置信度(1-),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t/2,t/2)的概率是(1-)。102XianghongShirleyWangi(i=0,1)的置信區(qū)間可以表示為:

即i(i=0,1)的水平的置信區(qū)間就可以表示為:103XianghongShirleyWang給定置信水平=0.05,從t分布表中查得自由度為8的臨界值為t/2=2.306仍以前面的例子說明則參數(shù)在95%顯著性水平下的置信區(qū)間為:104XianghongShirleyWang

由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間是越小越好。要縮小置信區(qū)間,可以采取以下措施:

(1)增大樣本容量n,因?yàn)樵谕瑯拥闹眯潘较拢琻越大,t分布表中的臨界值越?。煌瑫r(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減小;

(2)提高模型的擬合優(yōu)度,因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小。105XianghongShirleyWang補(bǔ)充說明——精確的顯著性水平p值比如,上個(gè)例子中截距項(xiàng)估計(jì)值的p值為0.1109,這表示拒絕原假設(shè)(截距項(xiàng)為零)的概率為11%,如果顯著性水平設(shè)定為5%,那么我們就不能拒絕原假設(shè),然而可以認(rèn)為以89%的可能性接受截距項(xiàng)非零。同樣,另一個(gè)參數(shù)的p值為0.0000,顯然我們拒絕原假設(shè)有充分的理由。一般來說,當(dāng)p值低于我們?cè)O(shè)定的顯著性水平時(shí),我們會(huì)拒絕原假設(shè)。p值是一個(gè)概率值(ProbabilityValue),被稱為是精確的顯著性水平,它是原假設(shè)可被拒絕的最低顯著水平。一般計(jì)量經(jīng)濟(jì)軟件在進(jìn)行假設(shè)檢驗(yàn)得到統(tǒng)計(jì)量值的同時(shí),都會(huì)給出相應(yīng)的p值。106XianghongShirleyWang補(bǔ)充說明——?dú)埐畹恼龖B(tài)性檢驗(yàn)

殘差直方圖正態(tài)概率圖JB檢驗(yàn)107XianghongShirleyWang殘差直方圖(HistogramofResiduals)

用于了解隨機(jī)變量概率密度函數(shù)的形狀如何。橫軸將變量劃分為若干適當(dāng)?shù)膮^(qū)間,在每個(gè)區(qū)間,建立高度與觀察值個(gè)數(shù)相一致的長方形。如果呈正態(tài)分布,則長方形的排列大致會(huì)如同鐘型的走勢。108XianghongShirleyWang正態(tài)概率圖(NormalProbabilityPlot)

簡稱為NPP,常在專用的正態(tài)概率紙上作圖。橫軸標(biāo)出所關(guān)注變量的值,在縱軸標(biāo)出該變量服從正態(tài)分布所對(duì)應(yīng)的均值。如果該變量來自正態(tài)總體,則正態(tài)概率圖將近似為一條直線。109XianghongShirleyWang是一種針對(duì)大樣本變量的檢驗(yàn)方法,或稱為漸進(jìn)檢驗(yàn)。首先計(jì)算偏度系數(shù)S和峰度系數(shù)K,對(duì)于正態(tài)分布變量,S=0,K=3。如果變量服從正態(tài)分布,則JB統(tǒng)計(jì)量的值為0。可以通過JB統(tǒng)計(jì)量的p值進(jìn)行正態(tài)程度的判斷。Jarqe-Bera檢驗(yàn)建立JB統(tǒng)計(jì)量:在正態(tài)性假定下,JB統(tǒng)計(jì)量漸進(jìn)地服從自由度為2的分布,即110XianghongShirleyWang補(bǔ)充說明——回歸結(jié)果的提供和分析回歸結(jié)果提供的兩種格式

當(dāng)然,除了這些基本信息以外,一般還會(huì)列出樣本區(qū)間、DW值等重要信息。這會(huì)在后面的課程中說明。111XianghongShirleyWang補(bǔ)充說明——回歸結(jié)果的提供和分析回歸結(jié)果的分析應(yīng)包括以下內(nèi)容參數(shù)的說明擬合情況方程的顯著性系數(shù)的顯著性其他(比如DW檢驗(yàn)的情況)112XianghongShirleyWang2.5模型的預(yù)測參數(shù)估計(jì)量不確定隨機(jī)項(xiàng)的影響

對(duì)于雙變量線性回歸模型

給定樣本以外的解釋變量的觀測值X0,可以得到被解釋變量的預(yù)測值?0,可以此作為其條件均值E(Y|X=X0)或個(gè)別值Y0的一個(gè)近似估計(jì)。

嚴(yán)格地說,這只是被解釋變量的預(yù)測值的估計(jì)值,而不是預(yù)測值。原因:113XianghongShirleyWang均值預(yù)測和個(gè)值預(yù)測均值預(yù)測(meanprediction):對(duì)應(yīng)于選定的X0,預(yù)測Y的條件均值,也就是總體回歸線上的點(diǎn)個(gè)值預(yù)測(individualprediction):對(duì)應(yīng)于X0的Y的一個(gè)個(gè)別值在點(diǎn)預(yù)測的同時(shí),我們還可以找到預(yù)測值的置信區(qū)間114XianghongShirleyWang?0是條件均值E(Y|X=X0)的一個(gè)無偏估計(jì)對(duì)總體回歸函數(shù)

E(Y|X=X0)=0+1X,當(dāng)X=X0時(shí)

E(Y|X=X0)=0+1X0于是可見,?0是條件均值E(Y|X=X0)

的無偏估計(jì)。115XianghongShirleyWang?0是個(gè)值Y0的一個(gè)無偏估計(jì)對(duì)總體回歸模型Y=0+1X+u

,當(dāng)X=X0時(shí),

Y0=0+1X0+u于是可見,?0是個(gè)值的無偏估計(jì)。116XianghongShirleyWang總體均值預(yù)測值的置信區(qū)間

由于

于是可以證明

117XianghongShirleyWang因此

118XianghongShirleyWang于是,在1-的置信度下,總體均值E(Y|X0)的置信區(qū)間為

其中119XianghongShirleyWang總體個(gè)值預(yù)測值的預(yù)測區(qū)間

由Y0=0+1X0+u

知:

于是

從而在1-的置信度下,Y0的置信區(qū)間為

120XianghongShirleyWang仍以前面的例子說明

XY187.7212113201343022540216502777038890399100551012066合計(jì)540299.7121XianghongShirleyWang結(jié)果總體均值E(Y|X=80)的95%的置信區(qū)間為:同樣地,對(duì)于Y在X=80的個(gè)體值,其95%的置信區(qū)間為:即為:=(39.175,49.955)即為:=(33.155,51.975)122XianghongShirleyWang總體回歸函數(shù)的置信帶(域)(confidenceband)與個(gè)體的置信帶(域)的比較

123XianghongShirleyWang總結(jié)樣本容量n越大,預(yù)測精度越高,反之預(yù)測精度越低樣本容量一定時(shí),置信帶的寬度當(dāng)在X均值處最小,其附近進(jìn)行預(yù)測(插值預(yù)測)精度越大;X越遠(yuǎn)離其均值,置信帶越寬,預(yù)測可信度下降。124XianghongShirleyWang2.6實(shí)例凱恩斯的絕對(duì)收入假說消費(fèi)函數(shù)選舉結(jié)果和競選支出CEO的薪水和凈資產(chǎn)回報(bào)率工資和教育125XianghongShirleyWang一、凱恩斯的絕對(duì)收入假說消費(fèi)函數(shù)現(xiàn)代經(jīng)濟(jì)學(xué)家針對(duì)消費(fèi)和儲(chǔ)蓄行為提出了許多假說,包括凱恩斯的絕對(duì)收入假說、杜森貝利(J.S.Duesenberry)的相對(duì)收入假說、莫迪利安尼(F.Modiglianni)的生命周期理論、弗里德曼的永久收入假說等。我們使用中國1985-1999年的實(shí)際數(shù)據(jù)來估計(jì)凱恩斯消費(fèi)函數(shù)。模型的形式為:126XianghongShirleyWang取自統(tǒng)計(jì)年鑒的相關(guān)數(shù)據(jù)年份國內(nèi)居民人均消費(fèi)額(元)農(nóng)村居民家庭人均純收入(元)城鎮(zhèn)居民家庭人均可支配收入(元)農(nóng)村人口比重(%)居民消費(fèi)價(jià)格指數(shù)(1985=100)1985437397.6739.176.291001986485423.8899.675.48106.51987550462.61002.274.68114.31988693544.91181.474.19135.81989762601.51375.773.79160.21990803686.31510.273.59165.21991896708.61700.673.63170.8199210707842026.672.37181.719931331921.62577.471.86208.41994174612213496.271.38258.6199522361577.7428370.96302.8199626411926.14838.970.63327.9199728342090.15160.370.08337.11998297221625425.169.6334.4199931432210.3585469.11329.7127XianghongShirleyWang整理之后的可用數(shù)據(jù)年份人均消費(fèi)(元)人均可支配收入(元)1985437.0478.61986455.4507.51987481.2524.31988510.3522.21989475.7502.11990486.1547.21991524.6568.01992588.9620.41993638.7665.81994675.2724.01995738.4780.51996805.4848.31997840.7892.51998888.8943.21999953.31011.8128XianghongShirleyWangEViews得到的結(jié)果DependentVariable:CONSMethod:LeastSquaresDate:03/29/07Time:14:40Sample:19851999Includedobservations:15VariableCoefficientStd.Errort-StatisticProb.C-19.6844712.92819-1.5226010.1518Y0.9663160.01853352.141120.0000R-squared0.995241

Meandependentvar633.3133AdjustedR-squared0.994875

S.D.dependentvar173.5928S.E.ofregression12.42738

Akaikeinfocriterion8.001247Sumsquaredresid

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論