




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第七一元線性回歸模型演示文稿當前第1頁\共有109頁\編于星期三\8點(優(yōu)選)第七一元線性回歸模型當前第2頁\共有109頁\編于星期三\8點一、變量間的關系及回歸分析的基本概念1.變量間的關系(1)確定性關系或函數(shù)關系:研究的是確定現(xiàn)象非隨機變量間的關系。(2)統(tǒng)計依賴或相關關系:研究的是非確定現(xiàn)象隨機變量間的關系。注:給定一個半徑,有唯一的一個圓面積與之對應;但給定一個施肥量,與之對應的農作物產量并不能確定,即不會取唯一值。當前第3頁\共有109頁\編于星期三\8點
函數(shù)關系:變量之間依一定的函數(shù)形式形成的一一對應關系稱為函數(shù)關系。若兩個變量分別記作y和x,則當y與x之間存在函數(shù)關系時,x值一旦被指定,y值就是唯一確定的。函數(shù)關系可以用公式確切的反映出來,一般記為y=f(x)。當前第4頁\共有109頁\編于星期三\8點
例如,某種商品的銷售額y與銷售量x之間的關系,在銷售價格p一定的條件下,只要給定一個商品銷售量,就有一個唯一確定的商品銷售額與之對應,用公式表示為y=px。當前第5頁\共有109頁\編于星期三\8點
統(tǒng)計關系:兩個變量之間存在某種依存關系,但變量Y并不是由變量X唯一確定的,它們之間沒有嚴格的一一對應關系。兩個變量之間的這種關系就是統(tǒng)計關系,也稱為相關關系。當前第6頁\共有109頁\編于星期三\8點
例如:同樣收入的家庭,用于食品的消費支出往往并不相同。因為對家庭食品費用的影響,不僅有家庭收入的多少,還有家庭人口,生活習慣等因素,所以,家庭食品費用支出與家庭收入之間不是函數(shù)關系,而是相關關系。當前第7頁\共有109頁\編于星期三\8點對變量間統(tǒng)計關系的考察主要是通過相關分析(correlationanalysis)和回歸分析(regressionanalysis)來完成的。相關分析主要研究隨機變量間的相關形式及相關程度。變量間相關的形式有線性相關與非線性相關之分;變量間相關程度的大小可以通過相關系數(shù)來測量。具有相關關系的變量間有時存在著因果關系,這時可以通過回歸分析來研究它們間的具體依存關系。注:變量間有因果關系,可以用回歸分析來研究;但回歸分析研究一個變量對另一個(些)變量的具體依賴關系時,它們并不意味著一定有因果關系,有無因果關系,一定要根據(jù)具體的經(jīng)濟理論來判斷(比如凱恩斯的消費理論)。當前第8頁\共有109頁\編于星期三\8點當前第9頁\共有109頁\編于星期三\8點注意①不線性相關并不意味著不相關。②有相關關系并不意味著一定有因果關系。③回歸分析研究一個變量對另一個(些)變量的具體依賴關系,但它們并不意味著一定有因果關系。④相關分析對稱地對待任何(兩個)變量,兩個變量都被看作是隨機的。回歸分析對變量的處理方法存在不對稱性,即區(qū)分應變量(被解釋變量)和自變量(解釋變量):前者是隨機變量,后者不是。(gm01,3.11)當前第10頁\共有109頁\編于星期三\8點2.回歸分析的基本概念回歸分析(regressionanalysis)是研究一個變量關于另一個(些)變量的具體依賴關系的計算方法和理論。其目的在于通過后者的已知或設定值,去估計和(或)預測前者的(總體)均值。被解釋變量(ExplainedVariable)或應變量(DependentVariable)。解釋變量(ExplanatoryVariable)或自變量(IndependentVariable)。當前第11頁\共有109頁\編于星期三\8點回歸分析構成計量經(jīng)濟學的方法論基礎,其主要內容包括:(1)根據(jù)樣本觀察值對經(jīng)濟計量模型參數(shù)進行估計,求得回歸方程;(2)對回歸方程、參數(shù)估計值進行顯著性檢驗;(3)利用回歸方程進行分析、評價及預測。當前第12頁\共有109頁\編于星期三\8點二、總體回歸函數(shù)回歸分析關心的是根據(jù)解釋變量的已知或給定值,考察被解釋變量的總體均值,即當解釋變量取某個確定值時,與之統(tǒng)計相關的被解釋變量所有可能出現(xiàn)的對應值的平均值。當前第13頁\共有109頁\編于星期三\8點例2.1:一個假想的社區(qū)有100戶家庭組成,要研究該社區(qū)每月家庭消費支出Y與每月家庭可支配收入X的關系,即根據(jù)家庭的每月可支配收入,考察該社區(qū)家庭每月消費支出的平均水平。為達到此目的,將該100戶家庭劃分為組內收入差不多的10組,以分析每一收入組的家庭消費支出。當前第14頁\共有109頁\編于星期三\8點當前第15頁\共有109頁\編于星期三\8點由于不確定因素的影響,對同一收入水平X,不同家庭的消費支出不完全相同;但由于調查的完備性,給定收入水平X的消費支出Y的分布是確定的,即以X的給定值為條件的Y的條件分布(Conditionaldistribution)是已知的,例如:P(Y=561|X=800)=1/4。當前第16頁\共有109頁\編于星期三\8點因此,給定收入X的值Xi,可得消費支出Y的條件均值(conditionalmean)或條件期望(conditionalexpectation):E(Y|X=Xi)。該例中:E(Y|X=800)=605描出散點圖發(fā)現(xiàn):隨著收入的增加,消費“平均地說”也在增加,且Y的條件均值均落在一根正斜率的直線上。這條直線稱為總體回歸線。當前第17頁\共有109頁\編于星期三\8點05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消費支出Y(元)當前第18頁\共有109頁\編于星期三\8點********************XY雖然Y的所有條件期望都落在一條直線上,但是相同的X卻對應著不同的Y??傮w回歸函數(shù)的確定形式不能完全體現(xiàn)因變量的個別值與解釋變量的固定值之間的統(tǒng)計依賴關系。********************************************************************************當前第19頁\共有109頁\編于星期三\8點在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線(populationregressionline),或更一般地稱為總體回歸曲線(populationregressioncurve)。稱為(雙變量)總體回歸函數(shù)(populationregressionfunction,PRF)。
相應的函數(shù):當前第20頁\共有109頁\編于星期三\8點含義:回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。
函數(shù)形式:可以是線性或非線性的。例2.1中,將居民消費支出看成是其可支配收入的線性函數(shù)時:
為一線性函數(shù)。其中,0,1是未知參數(shù),稱為回歸系數(shù)(regressioncoefficients)。當前第21頁\共有109頁\編于星期三\8點三、隨機擾動項總體回歸函數(shù)說明在給定的收入水平Xi下,該社區(qū)家庭平均的消費支出水平。但對某一個別的家庭,其消費支出可能與該平均水平有偏差。稱為觀察值(每個家庭的消費支出)圍繞它的期望值的離差(deviation),是一個不可觀測的隨機變量,又稱為隨機干擾項(stochasticdisturbance)或隨機誤差項(stochasticerror)。當前第22頁\共有109頁\編于星期三\8點例2.1中,給定收入水平Xi
(如800元),個別家庭(如消費支出為638元的家庭)的支出可表示為兩部分之和:(1)該收入水平下所有家庭(此處為4個家庭)的平均消費支出E(Y|Xi)(如2420/4=605),稱為系統(tǒng)性(systematic)或確定性(deterministic)部分;(2)其他隨機或非確定性(nonsystematic)部分i。(此處為33元)。即638元(個別家庭消費支出)=605元(平均消費支出)+33元(偏離平均數(shù)的誤差值)當前第23頁\共有109頁\編于星期三\8點稱為總體回歸函數(shù)(PRF)的隨機設定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機性影響。由于方程中引入了隨機項,成為計量經(jīng)濟學模型,因此也稱為總體回歸模型。當前第24頁\共有109頁\編于星期三\8點在總體回歸函數(shù)中引入隨機干擾項,主要有以下幾個方面的原因:(1)代表未知的影響因素。(2)代表殘缺數(shù)據(jù)。即使所有的影響變量都被包含在模型中,也會有某些變量的數(shù)據(jù)無法取得。比如,經(jīng)濟理論中,居民消費支出除受可支配收入影響外,還受財富擁有量的影響,但后者在實踐中往往是無法收集到的。這時模型中不得不省略掉這一變量,而將其納入隨機干擾項中。(3)代表眾多細小影響因素。當前第25頁\共有109頁\編于星期三\8點(4)代表數(shù)據(jù)觀測誤差。由于某些主客觀的原因,在取得觀察數(shù)據(jù)時,往往存在測量誤差,這些觀測誤差也被納入隨機干擾項。(5)代表模型設定誤差。模型的真實函數(shù)形式往往是未知的。實際設定的模型可能與真實的模型有誤差。(6)變量的內在隨機性。由于某些變量所固有的內在隨機性,也會對被解釋變量產生隨機性影響。當前第26頁\共有109頁\編于星期三\8點四、樣本回歸函數(shù)(SRF)問題:能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息?例2.2:在例2.1的總體中有如下一個樣本,能否從該樣本估計總體回歸函數(shù)PRF?
回答:能表2.1.3
家庭消費支出與可支配收入的一個隨機樣本
X
800
1100
1400
1700
2000
2300
2600
2900
3200
3500
Y
594
638
1122
1155
1408
1595
1969
2078
2585
2530
當前第27頁\共有109頁\編于星期三\8點
該樣本的散點圖(scatterdiagram):
畫一條直線以盡好地擬合該散點圖,由于樣本取自總體,可以該直線近似地代表總體回歸線。該直線稱為樣本回歸線(sampleregressionlines)。當前第28頁\共有109頁\編于星期三\8點記樣本回歸線的函數(shù)形式為:稱為樣本回歸函數(shù)(sampleregressionfunction,SRF)。當前第29頁\共有109頁\編于星期三\8點注意:這里將樣本回歸線看成總體回歸線的近似替代則當前第30頁\共有109頁\編于星期三\8點樣本回歸函數(shù)的隨機形式,即樣本回歸模型:同樣地,樣本回歸函數(shù)也有如下的隨機形式:
由于方程中引入了隨機項,成為計量經(jīng)濟模型,因此也稱為樣本回歸模型(sampleregressionmodel)。
iiiiieXYY++=+=10????bbm當前第31頁\共有109頁\編于星期三\8點
▼回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計總體回歸函數(shù)PRF。即,根據(jù)
估計當前第32頁\共有109頁\編于星期三\8點當前第33頁\共有109頁\編于星期三\8點注意:這里PRF可能永遠無法知道。當前第34頁\共有109頁\編于星期三\8點小結:1.總體回歸函數(shù)2.樣本回歸函數(shù)3.總體回歸模型
4.樣本回歸模型iiieXY++=10??bb當前第35頁\共有109頁\編于星期三\8點§2.2一元線性回歸模型的參數(shù)估計
一、一元線性回歸模型的基本假設二、參數(shù)的普通最小二乘估計(OLS)三*、參數(shù)估計的最大或然法(ML)四、最小二乘估計量的性質五、參數(shù)估計量的概率分布及隨機干擾項方差的估計
當前第36頁\共有109頁\編于星期三\8點說明單方程計量經(jīng)濟學模型分為兩大類:線性模型和非線性模型線性模型中,變量之間的關系呈線性關系非線性模型中,變量之間的關系呈非線性關系一元線性回歸模型:只有一個解釋變量i=1,2,…,nY為被解釋變量,X為解釋變量,0與1為待估參數(shù),為隨機干擾項當前第37頁\共有109頁\編于星期三\8點回歸分析的主要目的是要通過樣本回歸函數(shù)(模型)SRF盡可能準確地估計總體回歸函數(shù)(模型)PRF。估計方法有多種,其中最廣泛使用的是普通最小二乘法(ordinaryleastsquares,OLS)。為保證參數(shù)估計量具有良好的性質,通常對模型提出若干基本假設。實際這些假設與所采用的估計方法緊密相關。當前第38頁\共有109頁\編于星期三\8點
一、線性回歸模型的基本假設
假設1.解釋變量X是確定性變量,不是隨機變量。如
假設2.隨機誤差項具有零均值、同方差和不序列相關性:
E(i)=0i=1,2,…,nVar(i)=2i=1,2,…,nCov(i,j)=0i≠ji,j=1,2,…,n
當前第39頁\共有109頁\編于星期三\8點
同方差:隨機干擾項的條件方差恒定X1:假設經(jīng)濟學0801全班30名同學個人可支配收入都是每月600元/人;Y:現(xiàn)實中消費支出水平有30個不同的值,并用一個方差度量這30個取值的離散程度。X2:假設全班30名同學個人可支配收入增加到每月800元/人;Y:現(xiàn)實中消費支出水平有30個不同的值,并用一個方差度量這30個取值的離散程度按照同方差假設,以上兩個方差的值是一樣的。當前第40頁\共有109頁\編于星期三\8點同方差:隨機干擾項的條件方差恒定當前第41頁\共有109頁\編于星期三\8點
異方差:隨機干擾項的條件方差不一樣X1:假設全班30名同學個人可支配收入都是每月600元/人;Y:現(xiàn)實中消費支出水平有30個不同的值,并用一個方差度量這30個取值的離散程度X2:假設全班30名同學個人可支配收入增加到每月800元/人;Y:現(xiàn)實中消費支出水平有30個不同的值,并用一個方差度量這30個取值的離散程度按照異方差假設,以上兩個方差的值是不一樣的。當前第42頁\共有109頁\編于星期三\8點當前第43頁\共有109頁\編于星期三\8點任意兩個誤差項即隨機擾動項不相關假設
(不序列相關)X1:假設全班30名同學個人可支配收入都是每月600元/人;Y:現(xiàn)實中消費支出水平有30個不同的值。
那么30個不同的消費支出數(shù)額可求出一個平均數(shù)。每一個人的實際消費支出額與這個平均數(shù)的差額就是誤差項的取值。那么每個人都有一個誤差項的取值,任意兩個誤差項的取值應當是不相關的。(預測股票的走勢就像預測一只鳥下一步要飛到哪根樹枝上一樣)當前第44頁\共有109頁\編于星期三\8點度量兩個隨機變量的線性關系表明隨機誤差項是個隨機變量。由于假定任何兩個誤差項是不相關的,所以任何兩個Y值也是不相關的。因為,假定給定β值和X值,Y隨著取值的變化而變化。附注:相關系數(shù)當前第45頁\共有109頁\編于星期三\8點假設3.隨機誤差項與解釋變量X之間不相關:
Cov(Xi,i)=0i=1,2,…,n
如果X是非隨機機的(即為固定值),則該假設自動滿足。因為一個固定值與一個隨機變量之間當然不相關。假設4.服從正態(tài)分布
i~N(0,2
)i=1,2,…,n
推導:誤差項代表了沒有納入回歸模型的其他所有影響因素。因為這些影響因素中,每種因素對Y的影響都很微弱。如果所有這些影響因素都是隨機的,并用μ代表所有這些影響因素之和,那么根據(jù)中心極限定理,可以假設誤差項服從正態(tài)分布當前第46頁\共有109頁\編于星期三\8點
以上假設也稱為線性回歸模型的經(jīng)典假設或高斯(Gauss)假設,滿足該假設的線性回歸模型,也稱為經(jīng)典線性回歸模型(ClassicalLinearRegressionModel,CLRM)。
附注:中心極限定理一般來說,如果一個隨機變量是由大量的相互獨立的隨機因素的影響所造成,而每個因素的作用又是很微小的,那么這個隨機變量趨于正態(tài)分布。當前第47頁\共有109頁\編于星期三\8點
另外,在進行模型回歸時,還有兩個暗含的假設:
假設5(暫時不學習).隨著樣本容量的無限增加,解釋變量X的樣本方差趨于一有限常數(shù)。即
假設6.回歸模型是正確設定的
當前第48頁\共有109頁\編于星期三\8點假設5旨在排除時間序列數(shù)據(jù)出現(xiàn)持續(xù)上升或下降的變量作為解釋變量,因為這類數(shù)據(jù)不僅使大樣本統(tǒng)計推斷變得無效,而且往往產生所謂的偽回歸問題(spuriousregressionproblem)。(暫時不學習)假設6也被稱為模型沒有設定偏誤(specificationerror)當前第49頁\共有109頁\編于星期三\8點二、參數(shù)的普通最小二乘估計(OLS)
給定一組樣本觀測值(Xi,Yi)(i=1,2,…n)要求樣本回歸函數(shù)盡可能好地擬合這組值.
普通最小二乘法(Ordinaryleastsquares,OLS)給出的判斷標準是:二者之差的平方和最小。表2.1.3
家庭消費支出與可支配收入的一個隨機樣本
X
800
1100
1400
1700
2000
2300
2600
2900
3200
3500
Y
594
638
1122
1155
1408
1595
1969
2078
2585
2530
當前第50頁\共有109頁\編于星期三\8點根據(jù)微積分學的運算,當Q對β的估計量的一階偏導數(shù)為0時,Q達到最小。當前第51頁\共有109頁\編于星期三\8點方程組(*)稱為正規(guī)方程組(normalequations)。
當前第52頁\共有109頁\編于星期三\8點記上述參數(shù)估計量可以寫成:
稱為OLS估計量的離差形式(deviationform)。由于參數(shù)的估計結果是通過最小二乘法得到的,故稱為普通最小二乘估計量(ordinaryleastsquaresestimators)。
當前第53頁\共有109頁\編于星期三\8點順便指出,記則有
可得
(**)式也稱為樣本回歸函數(shù)的離差形式。(**)注意:在計量經(jīng)濟學中,往往以小寫字母表示對均值的離差。
當前第54頁\共有109頁\編于星期三\8點
四、最小二乘估計量的性質當模型參數(shù)估計出后,需考慮參數(shù)估計值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計量的統(tǒng)計性質。一個用于考察總體的估計量,可從如下幾個方面考察其優(yōu)劣性:
(1)線性性,即它是否是另一隨機變量的線性函數(shù);當前第55頁\共有109頁\編于星期三\8點(2)無偏性,即它的均值或期望值是否等于總體的真實值;(3)有效性,即它是否在所有線性無偏估計量中具有最小方差。
這三個準則也稱作估計量的小樣本性質。因為一旦某估計量具有該類性質,它是不以樣本的大小而改變的。擁有這類性質的估計量稱為最佳線性無偏估計量(bestlinerunbiasedestimator,BLUE)。
當前第56頁\共有109頁\編于星期三\8點(4)漸近無偏性,即樣本容量趨于無窮大時,是否估計量的均值序列趨于總體真值;(5)一致性,即樣本容量趨于無窮大時,它是否依概率收斂于總體的真值(即隨著樣本容量的增加,估計量接近參數(shù)的真實值);(6)漸近有效性,即樣本容量趨于無窮大時,是否它在所有的一致估計量中具有最小的漸近方差。
當不滿足小樣本性質時,需進一步考察估計量的大樣本或漸近性質:當前第57頁\共有109頁\編于星期三\8點高斯—馬爾可夫定理(Gauss-Markovtheorem)
在給定經(jīng)典線性回歸的假定下,最小二乘估計量是具有最小方差的線性無偏估計量。當前第58頁\共有109頁\編于星期三\8點當前第59頁\共有109頁\編于星期三\8點理解:根據(jù)從總體中抽取的另外一個隨機樣本也可以通過普通最小二乘法計算出兩個參數(shù)估計值。進一步地,其它的樣本同樣會計算出參數(shù)估計值。表2.1.3
家庭消費支出與可支配收入的另外一個隨機樣本
X
800
1100
1400
1700
2000
2300
2600
2900
3200
3500
Y
561
748
1012
1210
1364
1672
1881
2189
2486
2629
當前第60頁\共有109頁\編于星期三\8點理解:在前面由100戶家庭組成的總體中,若抽取10個樣本出來。那么每一個樣本可以通過普通最小二乘法進行參數(shù)估計。截距項就有10個不同的估計值,同理,解釋變量前面的系數(shù)也有10個不同的估計值。如果用其它的方法(非普通最小二乘估計法)來進行參數(shù)估計,同樣也會得到截距項的10個不同的估計值,以及解釋變量前面的系數(shù)的10個不同的估計值。比較以下數(shù)據(jù)的大小:用OLS法求出的10個截距值的方差用非OLS法求出的10個截距值的方差結果:用OLS法求出的10個截距值的方差最小當前第61頁\共有109頁\編于星期三\8點普通最小二乘估計量(ordinaryleastSquaresEstimators)稱為最佳線性無偏估計量(bestlinearunbiasedestimator,BLUE)比較以下數(shù)據(jù)的大?。河肙LS法求出的解釋變量前系數(shù)的10個估計值的方差用非OLS法求出的解釋變量前系數(shù)的10個估計值的方差結果:用OLS法估計的解釋變量前系數(shù)的10個估計值的方差最小埋伏筆:參數(shù)估計量在此有10個具體的估計值,因此參數(shù)估計量本身就是一個隨機變量,進而有必要探討參數(shù)估計量的概率分布,而概率分布的數(shù)字特征主要有兩個,一個是期望,一個是方差。當前第62頁\共有109頁\編于星期三\8點
由于最小二乘估計量擁有一個“好”的估計量所應具備的小樣本特性,它自然也擁有大樣本特性。
當前第63頁\共有109頁\編于星期三\8點
五、參數(shù)估計量的概率分布及隨機干擾項方差的估計(教材P125)當前第64頁\共有109頁\編于星期三\8點附注:由于μ服從正態(tài)分布,μi~N(0
,σ2),而Y是μ的線性組合,即因此,Y也服從正態(tài)分布
Yi~N(β0+β1Xi,σ2)又因為,是Yi的線性組合,所以,也服從正態(tài)分布。當前第65頁\共有109頁\編于星期三\8點當前第66頁\共有109頁\編于星期三\8點2.隨機誤差項的方差2的估計2又稱為總體方差。
當前第67頁\共有109頁\編于星期三\8點由于隨機項i不可觀測,只能從i的估計——殘差ei出發(fā),對總體方差進行估計??梢宰C明,2的最小二乘估計量為它是關于2的無偏估計量。
當前第68頁\共有109頁\編于星期三\8點§2.3一元線性回歸模型的統(tǒng)計檢驗
一、擬合優(yōu)度檢驗二、變量的顯著性檢驗三、參數(shù)的置信區(qū)間當前第69頁\共有109頁\編于星期三\8點說明回歸分析是要通過樣本所估計的參數(shù)來代替總體的真實參數(shù),或者說是用樣本回歸線代替總體回歸線。盡管從統(tǒng)計性質上已知,如果有足夠多的重復抽樣,參數(shù)的估計值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計值不一定就等于該真值。當前第70頁\共有109頁\編于星期三\8點那么,在一次抽樣中,參數(shù)的估計值與真值的差異有多大,是否顯著,這就需要進一步進行統(tǒng)計檢驗。主要包括擬合優(yōu)度檢驗、變量的顯著性檢驗及參數(shù)的區(qū)間估計。當前第71頁\共有109頁\編于星期三\8點
一、擬合優(yōu)度檢驗
擬合優(yōu)度檢驗:對樣本回歸直線與樣本觀測值之間擬合程度的檢驗。度量擬合優(yōu)度的指標:判定系數(shù)(可決系數(shù))R2
問題:采用普通最小二乘估計方法,已經(jīng)保證了樣本回歸線最好地擬合了樣本觀測點,為什么還要檢驗擬合程度?
當前第72頁\共有109頁\編于星期三\8點回答:在一個特定的條件下做得最好的并不一定就是高質量的。比方,假如你采用最好的學習方法學習計量經(jīng)濟學(該方法冠名為“普通最小二乘學習法”,可以保證你取得最好的考試成績。但是這個最好成績也有可能通過考核發(fā)現(xiàn)只有55分(不及格),但已經(jīng)是你的最好成績了;也有可能是99分,但不管怎樣,要通過考核才知道這個對于你來說的最好成績到底是多少分??傊?,對于你來說的最好成績,不一定就是高分。當前第73頁\共有109頁\編于星期三\8點當前第74頁\共有109頁\編于星期三\8點
1、總離差平方和的分解已知由一組樣本觀測值(Xi,Yi),i=1,2…,n得到如下樣本回歸直線
表2.1.3
家庭消費支出(Y)與可支配收入(X)的一個隨機樣本
X800
1100
1400
1700
2000
2300
2600
2900
3200
3500
Y
594
638
1122
1155
1408
1595
1969
2078
2585
2530
當前第75頁\共有109頁\編于星期三\8點當前第76頁\共有109頁\編于星期三\8點注:如果Yi=?i
即實際觀測值落在樣本回歸“線”上,則Y的第i個觀察值與樣本均值的離差,全部來自樣本回歸擬合值與樣本均值的離差,即完全可由樣本回歸線解釋,表明在該點處實現(xiàn)完全擬合(擬合最好)。這時可認為,“離差”全部來自回歸線,而與“殘差”無關。
當前第77頁\共有109頁\編于星期三\8點
對于所有的樣本點(本例為10個樣本點),則需考慮這些點(家庭消費支出的10個數(shù)額)與樣本均值(即家庭消費支出10個數(shù)額的均值)離差的平方和,可以證明:當前第78頁\共有109頁\編于星期三\8點TSS=ESS+RSS記總體平方和(TotalSumofSquares)回歸平方和(ExplainedSumofSquares)殘差平方和(ResidualSumofSquares
)當前第79頁\共有109頁\編于星期三\8點
Y的觀測值圍繞其均值的總離差(totalvariation)可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機勢力(RSS)。在給定樣本中,TSS不變,如果實際觀測點離樣本回歸線越近,則ESS在TSS中占的比重越大。因此,擬合優(yōu)度:回歸平方和ESS/Y的總離差TSS當前第80頁\共有109頁\編于星期三\8點2、可決系數(shù)R2統(tǒng)計量
稱R2為(樣本)可決系數(shù)/判定系數(shù)(coefficientofdetermination)。
可決系數(shù)的取值范圍:[0,1]R2越接近1,說明實際觀測點離樣本線越近,擬合優(yōu)度越高。當前第81頁\共有109頁\編于星期三\8點在例的收入-消費支出例中,
注:可決系數(shù)是一個非負的統(tǒng)計量。它也是隨著抽樣的不同而不同。為此,對可決系數(shù)的統(tǒng)計可靠性也應進行檢驗,這將在第3章中進行。
當前第82頁\共有109頁\編于星期三\8點
二、變量的顯著性檢驗
回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個顯著性的影響因素。在一元線性模型中,就是要判斷X是否對Y具有顯著的線性性影響。這就需要進行變量的顯著性檢驗。
變量的顯著性檢驗所應用的方法是數(shù)理統(tǒng)計學中的假設檢驗。
計量經(jīng)濟學中,主要是針對變量的參數(shù)真值是否為零來進行顯著性檢驗的。
當前第83頁\共有109頁\編于星期三\8點
1、假設檢驗
所謂假設檢驗,就是事先對總體參數(shù)(或總體分布形式)作出一個假設,然后利用樣本信息來判斷原假設是否合理,即判斷樣本信息與原假設是否有顯著差異,從而決定是否接受或否定原假設。當前第84頁\共有109頁\編于星期三\8點假設檢驗采用的邏輯推理方法是反證法先假定原假設正確,然后根據(jù)樣本信息,觀察由此假設而導致的結果是否合理,從而判斷是否接受原假設。判斷結果合理與否,是基于“小概率事件不易發(fā)生”這一原理的當前第85頁\共有109頁\編于星期三\8點
2、變量的顯著性檢驗
當前第86頁\共有109頁\編于星期三\8點
檢驗步驟:
(1)對總體參數(shù)提出假設
H0:1=0,H1:10(2)以原假設H0構造t統(tǒng)計量,并由樣本計算其值(3)給定顯著性水平,查t分布表得臨界值t/2(n-2)當前第87頁\共有109頁\編于星期三\8點
(4)比較,判斷若|t|>t/2(n-2),則拒絕H0
,接受H1
;若|t|t/2(n-2),則拒絕H1
,接受H0
;對于一元線性回歸方程中的0,可構造如下t統(tǒng)計量進行顯著性檢驗:
當前第88頁\共有109頁\編于星期三\8點順便指出,記則有
可得
(**)式也稱為樣本回歸函數(shù)的離差形式。(**)注意:在計量經(jīng)濟學中,往往以小寫字母表示對均值的離差。
知識回顧:當前第89頁\共有109頁\編于星期三\8點在上述收入—消費支出例中,首先計算2的估計值當前第90頁\共有109頁\編于星期三\8點t統(tǒng)計量的計算結果分別為:
給定顯著性水平=0.05,查t分布表得臨界值
t0.05/2(8)=2.306|t1|>2.306,說明家庭可支配收入在95%的置信度下顯著,即是消費支出的主要解釋變量;
|t0|<2.306,表明在95%的置信度下,無法拒絕截距項為零的假設。
當前第91頁\共有109頁\編于星期三\8點EVIEWS演算過程:
表2.1.3
家庭消費支出(Y)與可支配收入(X)的一個隨機樣本
X800
1100
1400
1700
2000
2300
2600
2900
3200
3500
Y
594
638
1122
1155
1408
1595
1969
2078
2585
2530
當前第92頁\共有109頁\編于星期三\8點當前第93頁\共有109頁\編于星期三\8點當前第94頁\共有109頁\編于星期三\8點當前第95頁\共有109頁\編于星期三\8點
假設檢驗可以通過一次抽樣的結果檢驗總體參數(shù)可能的假設值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。
三、參數(shù)的置信區(qū)間
當前第96頁\共有109頁\編于星期三\8點要判斷樣本參數(shù)的估計值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過構造一個以樣本參數(shù)的估計值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實的參數(shù)值。這種方法就是參數(shù)檢驗的置信區(qū)間估計。當前第97頁\共有109頁\編于星期三\8點如果存在這樣一個區(qū)間,稱之為置信區(qū)間(confidenceinterval);
1-稱為置信系數(shù)(置信度)(confidencecoefficient),
稱為顯著性水平(levelofsignificance);置信區(qū)間的端點稱為置信限(confidencelimit)或臨界值(criticalvalues)。當前第98頁\共有109頁\編于星期三\8點一元線性模型中,i(i=1,2)的置信區(qū)間:在變量的顯著性檢驗中已經(jīng)知道:
意味著,如果給定置信度(1-),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t/2,t/2)的概率是(1-)。表示為:
即當前第99頁\共有109頁\編于星期三\8點于是得到:(1-)的置信度下,i的置信區(qū)間是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年馬鞍山含山銀河動力人工智能有限公司招聘120人筆試參考題庫附帶答案詳解
- 2025年陜西農業(yè)發(fā)展集團有限公司(陜西省土地工程建設集團)招聘(200人)筆試參考題庫附帶答案詳解
- 2025年國網(wǎng)陜西省電力有限公司招聘480人(第二批)筆試參考題庫附帶答案詳解
- 游戲行業(yè)游戲開發(fā)與運營的可持續(xù)增長策略
- 統(tǒng)計學多元分析方法試題及答案
- 語文基礎鞏固六年級專項題試題及答案
- 清華附中上莊學校招聘筆試真題2024
- 酒泉市金塔縣招聘社區(qū)工作者筆試真題2024
- 廣西壯族自治區(qū)煙草專賣局招聘考試真題2024
- 2025四川長九光電科技有限責任公司招聘系統(tǒng)總體工程師等崗位20人筆試參考題庫附帶答案詳解
- GB 16246-1996車間空氣中硫酸二甲酯衛(wèi)生標準
- 驅動橋畢業(yè)設計
- 2023機關公文寫作與處理PPT模板
- 基坑支護、降水及土方開挖專項施工方案
- 幼兒數(shù)字1-100字帖練習
- 細胞生物學-7細胞信號轉導課件
- 攪拌站安全培訓試卷
- 茶葉市場營銷講義
- 走進中國傳統(tǒng)節(jié)日 詳細版課件
- 乙肝兩對半ppt課件
- 鍋爐空氣預熱器拆除安裝方案
評論
0/150
提交評論