版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
計量經濟學重點知識整理
1一般性定義
計量經濟學是以經濟理論和經濟數據的事實為依據,運用數學和統計學的方法,通過建立數
學模型來研究經濟數量關系和規(guī)律的一門經濟學科。
研究的主體(出發(fā)點、歸宿、核心):
經濟現象及數量變化規(guī)律
研究的工具(手段):
模型數學和統計方法
必須明確:
方法手段要服從研究對象的本質特征(與數學不同),方法是為經濟問題服務
2注意:計量經濟研窕的三個方面
理論:即說明所研究對象經濟行為的經濟理論一一計量經濟研究的基礎
數據:對所研究對象經濟行為觀測所得到的信息一一計量經濟研究的原料或依據
方法:模型的方法與估計、檢驗、分析的方法一一計量經濟研究的工具與手段
三者缺一不可
3計量經濟學的學科類型
?理論計量經濟學
研究經濟計量的理論和方法
?應用計量經濟學:應用計量經濟方法研究某些領域的具體經濟問題
4區(qū)別:
?經濟理論重在定性分析,并不對經濟關系提供數量上的具體度量
?計量經濟學對經濟關系要作出定量的估計,對經濟理論提出經驗的內容
5計量經濟學與經濟統計學的關系
聯系:
?經濟統計側重于對社會經濟現象的描述性計量
?經濟統計提供的數據是計量經濟學據以估計參數、驗證經濟理論的基本依據
?經濟現象不能作實驗,只能被動地觀測客觀經濟現象變動的既成事實,只能依賴于經濟統
計數據
6計量經濟學與數理統計學的關系
聯系:
?數理統計學是計量經濟學的方法論基礎
區(qū)別:
?數理統計學是在標準假定條件下抽象地研究一
般的隨機變量的統計規(guī)律性;
?計量經濟學是從經濟模型出發(fā),研究模型參數
的估計和推斷,參數有特定的經濟意義,標準
假定條件經常不能滿足,需要建立一些專門的
經濟計量方法
3、計量經濟學的特點:
計量經濟學的一個重要特點是:它自身并沒有固定的經濟理論,而是根據其它經濟理論,應
用計量經濟方法將這些理論數量化。
4、計量經濟學為什么是一門單獨的學科
計量經濟學是經濟理論、數理經濟、經濟統計與數理統計的混合物。
1、經濟理論所作的陳述或假說大多數是定性性質的,計量經濟學對大多數經濟理論賦予經
驗內容。
2、經濟統計學的問題主要是收集、加工并通過圖或表的形式以展現經濟數據,他們不考慮
怎樣用所收集的數據來檢驗經濟理論。
3、雖然數理統計學提供了這一行業(yè)中使用的許多工具,但由于大多數經濟數據的獨特性,
計量經濟學家常常需要有特殊的方法。
§2、計量經濟學的方法論
1、用計量經濟學來分析問題的一般方法;
(1)理論或假說的陳述
(2)理論的數學模型的設定
(3)理論的計量模型的設定
(4)獲取數據
(5)計量經濟模型的參數估計
(6)模型檢驗(假設檢驗)
(7)模型的應用:A、預報或預測B、利用模型進行控制或制定政策
2、應用舉例(消費函數):
(1)理論或假說的陳述:
凱恩斯認為:隨著收入的增加,消費也會增加,但是消費的增加不及收入增加的多。即邊
際消費傾向遞減。
(2)理論的數學模型設定:Y=a+bX
其中y為消費支出,x為收入,ab為模型的參數,分別代表截距和斜率系數。斜率系
數b就是消費邊際傾向MPC的度量。
其中左邊的Y稱為應變量,方程右邊的X稱為自變量或解釋變量。
該方程表明消費和收入之間存在準確的一一對應關系。
(3)計量模型的設定:
考慮到經濟變量間的非準確關系,則消費函數的計量模型可以設定為:Y=a+Bx+u
其中U被稱為干擾項,或誤差項,是一個隨機變量,它有良好定義的概率性質。
u是從模型中省略下來的而又集體影響著Y的全部變量的替代物(就是除了收入外,其
它可能影響消費的所有因素)。
(4)數據的獲得
各種統計年鑒,企業(yè)報表和相關職能部門公布的統計數據。(該例中我們可以通過中
國統計年鑒獲取相關數據)
(5)參數估計(利用各種統計或計量軟件來進行如:Eviews)
以美國1980-1991年的數據,通過Eviews5.0的計算,
我們可得如下消費函數方程:y=-231.8+0.7196
其中a=-231.8b=0.7196
它表明在1980-1991年間,實際收入每增加一元,美國人的平均消費增加0.72元。
(6)模型檢驗(假設檢驗)
A、對理論或假說的檢驗
弗里德曼認為凡是不能通過經驗數據檢驗(實證檢驗)的理論或假設,都不能作為科學
探索的一部分。
0<0.7196<1
B、對模型的檢驗
統計推斷檢驗:模型的擬合優(yōu)度檢驗、變量的顯著性檢驗
計量經濟學檢驗:平穩(wěn)性、多重共線性、自相關、異方差等方面的檢驗、
(7)預報或預測
(8)利用模型進行控制或制定政策
4.計量經濟學模型的應用
一、結構分析
經濟學中的結構分析是對經濟現象中變量之間相互關系的研究。
結構分析所采用的主要方法是彈性分析、乘數分析與比較靜力分析。
計量經濟學模型的功能是揭示經濟現象中變量之間的相互關系,即通過模型得到彈性、乘數
等。
應用舉例
二、經濟預測
計量經濟學模型作為一類經濟數學模型,是從用于經濟預測,特別是短期預測而發(fā)展起來的。
計量經濟學模型是以模擬歷史、從已經發(fā)生的經濟活動中找出變化規(guī)律為主要技術手段。
對于非穩(wěn)定發(fā)展的經濟過程,對于缺乏規(guī)范行為理論的經濟活動,計量經濟學模型預測功能
失效。
模型理論方法的發(fā)展以適應預測的需要。
三、政策評價
政策評價的重要性。
經濟政策的不可試驗性。
計量經濟學模型的“經濟政策實驗室”功能。
四、理論檢驗與發(fā)展
實踐是檢驗真理的唯一標準。
任何經濟學理論,只有當它成功地解釋了過去,才能為人們所接受。
計量經濟學模型提供了一種檢驗經濟理論的好方法。
對理論假設的檢驗可以發(fā)現和發(fā)展理論。
§3變量數據參數與模型
1,計量經濟模型中的變量
(1)從變量的因果關系分:
自變量因(應)變量
解釋變量被解釋變量
(2)從變量的性質分
內生變量:模型求解的結果
外生變量:
2、計量經濟學中應用的數據
(1)時間序列數據
(2)截面數據
(3)混合數據
(4)虛擬變量數據:一些定性的事實,不能直接用一般的數據去計量。
3、參數及其估計準則
(1)無偏性
(2)最小方差性(最優(yōu)無偏估計)
(3)一致性
4、計量模型的基本函數形式
(1)線性模型
(2)非線性模型(可變?yōu)榫€性形式的非線性模型)
雙對數模型
半對數模型
倒數變換模型
第二章一元回歸模型概述
回歸分析的性質
回歸分析的一些基本概念
對線性的幾點說明
§2.1回歸分析的性質
一、變量間的關系及回歸分析的基本概念
1>變量間的關系
經濟變量之間的關系,大體可分為兩類:
(1)確定性關系或函數關系:研究的是確定現象非隨機變量間的關系。
(2)統計依賴或相關關系:研究的是非確定現象隨機變量間的關系。(以一定的統計規(guī)律呈
現出來的關系)
例如:
函數關系:圓面積=/(肛半徑)=??半徑2
統計依賴關系/統計相關關系:
農作物產量=/(氣溫,降雨量,陽光,施肥量)
摒物1關]不相關卜關系就,
黜獻系][通關,。戶1產因聯系->目的折
產相關I確聯系■?糊扮析
將性相斗稗關J
〔負相關
▲注意:
①不線性相關并不意味著不相關;
②有相關關系并不意味著一定有因果關系;
③回歸分析/相關分析研究一個變量對另一個(些)變量的統計依賴關系,但它們并不意味
著一定有因果關系。
④相關分析對稱地對待任何(兩個)變量,兩個變量都被看作是隨機的?;貧w分析對變量的
處理方法存在不對稱性,即區(qū)分應變量(被解釋變量)和自變量(解釋變量):前者是隨機
變量,后者不是。
回歸與因果關系
雖然回歸分析研究一個變量對另一(些)變量的依賴關系,但它并不意味著因果關系。Kendall
和Stuart認為一個統計關系式不管多么強,也不管多么有啟發(fā)性,卻永遠不能確立因果方面
的聯系,對因果關系方面的理念必須來自統計學之外,最終來自這種或那種理論。
從邏輯上說,統計關系式本身不可能意味著任何因果關系。要談因果關系,必須訴諸先驗
或理論上的思考。
§2.2回歸分析的基本思想:
一、利用樣本來推斷總體
1、總回歸函數(PRF)
2、樣本回歸函數(SRF)
3、樣本回歸函數對總回歸函數的進行擬合:
(1)最小二乘法(OLS)
(2)最小二乘法的基本假定
(3)最小二乘估計的精度或標準誤
(4)最小二乘估計量的性質
(5)擬合優(yōu)度的度量
(6)區(qū)間估計或假設檢驗
4、利用回歸方程進行分析、評價及預測。
二、回歸分析的基本概念
1、回歸分析(regressionanalysis)是研究一個變量關于另一個(些)變量的具體依賴關系的
計算方法和理論。
其用意:在于通過后者的已知或設定值,去估計和(或)預測前者的(總體)均值.
這里:前一個變量被稱為被解釋變量或因變量對變量測量尺度的注解:分類尺度(名
義尺度)、順序尺度(序數尺度)、間隔尺度(區(qū)間尺度)、比率尺度(比率尺度)
三、總體回歸函數
由于變量間關系的隨機性,回歸分析關心的是根據解釋變量的己知或給定值,考察被解釋變
量的總體均值,即當解釋變量取某個確定值時,與之統計相關的被解釋變量所有可能出現的
對應值的平均值。
例2.1:一個假想的社區(qū)有100戶家庭組成,要研究該社區(qū)每月家庭消費支出Y與每月家庭
可支配收入X的關系。
即如果知道了家庭的月收入,能否預測該社區(qū)家庭的平均月消費支出水平。
為達到此目的,將該100戶家庭劃分為組內收入差不多的10組,以分析每一收入組的家庭
消費支出。
分析:(1)由于不確定因素的影響,對同一收入水平X,不同家庭的消費支出不完全相同;
(2)但由于調查的完備性,給定收入水平X的消費支出Y的分布是確定的,即以X的給
定值為條件的Y的條件分布(Conditionaldistribution)是已知的,如:
P(Y=561|X=800)=1/4。
因此,給定收入X的值Xi,可得消費支出Y的條件均值(conditionalmean)或條件期望
(conditionalexpectation):E(Y|X=Xi)
該例中:E(Y|X=800)=561
描出散點圖發(fā)現:隨著收入的增加,消費“平均地說”也在增加,且Y的條件均值均落在
一根正斜率的直線上。這條直線稱為總體回歸線。
概念:
在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線,或更一般地稱為總體
回歸曲線。
相應的函數:E(Y|X,)=/(XJ稱為(雙變量)總體回歸函數。
含義:回歸函數(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變
化的規(guī)律。
函數形式:可以是線性或非線性的。
例2.1中,將居民消費支出看成是其可支配收入的線性函數時:'J=0。+^X,
為一線性函數。其中,曲夕1是未知參數,稱為回歸系數(regressioncoefficients)?。
四、隨機擾動項
總體回歸函數說明在給定的收入水平Xi下,該社區(qū)家庭平均的消費支出水平。
但對某一個別的家庭,其消費支出可能與該平均水平有偏差。
記:〃產x-E(y|xj
稱"為觀察值Yi圍繞它的期望值E(Y|Xi)的離,是一個不可觀測的隨機變量,又稱為隨機干
擾項或隨機誤差項。
例2.1中,個別家庭的消費支出為:
I=E(y1乂)+4=A+AX+四(*)
即,給定收入水平Xi,個別家庭的支出可表示為兩部分之和:
(1)該收入水平下所有家庭的平均消費支出E(Y|Xi),稱為系統性(systematic)或確定性
(deterministic)部分。
(2)其他隨機或非確定性(nonsystematic)部分i。
(*)式稱為總體回歸函數PRF的隨機設定形式。表明被解釋變量除了受解釋變量的系統性影
響外,還受其他因素的隨機性影響。
由于方程中引入了隨機項,成為計量經濟學模型,因此也稱為總體回歸模型。
隨機誤差項主要包括下列因素的影響:
隨機誤差項是指從模型中省略下來的而又集體地影響著Y的全部變量的替代物。
1)在解釋變量中被忽略的因素的影響;
2)變量觀測值的觀測誤差的影響;
3)其它隨機因素的影響。
產生并設計隨機誤差項的主要原因:
1)理論的含糊性;2)數據的欠缺(糟糕的替代變量)
3)核心變量與周邊變量:4)節(jié)省原則:
5)人類行為的內在隨機性;6)錯誤的函數形式;
35五、樣本回歸函數(SRF)
問題:能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似
信息?
例2.2:在例2.1的總體中有如下一個樣本,
總體的信息往往無法掌握,現實的情況只能是在一次觀測中得到總體的一個樣本。
問:能否從該樣本估計總體回歸函數PRF?
回答:能
表2.1.3家庭消費支出與可支配收入的一個隨機樣本
Y800110014001700200023002600290032003500
X59463811221155140815951969207825852530
核樣本的散點圖(scatterdiagram):
每
月
消
費3000
支2500
00
出20
Y1500
15000
7U)00
0
800110014001700200023002600290032003500
每月可支§蚣工:元)樣本散點圖近似于一條直線,畫一條直線以盡好
地擬合該散點圖,由于樣本取自總體,可以該線近似地代表總體回歸線。該線稱為樣本回歸
線。
記樣本回歸線的函數形式為:
g=/(X,)=A+?X,
稱為樣本回歸函數。
注意:這里將樣本回歸線看成總體回歸線的近似替代
E=A。+。國
X=E(WXJ+〃f
=A+4工+四
Y,為EQ"')的估計量;
則自為自的估計量,i=(O,l)
樣本回歸函數的隨機形式/樣本回歸模型:
A八人
同樣地,樣本回歸函數也有如下的隨機形式:匕=匕+2=A+4X,.+e,
式中,弓稱為《樣本》殘差(或剜余》項(residual),代表
了其他影響匕的隨機因素的集合,可看成是的估計埔c
由于方程中引入了隨機項,成為計量經濟模型,因此也稱為樣本回歸模型。
▼回歸分析的主要目的:根據樣本回歸函數SRF,估計總體回歸函數PRF。
即,根據匕=£+“=&)+6/+令
估計K=E(y|x,)+4=z7o+片x,+〃j
YJ
圖總體回歸線與樣本回歸線的基本關系
2.1.3注意:這里PRF可能永遠無法知道。
§2.3對線性的幾點說明
一、對變量之間關系為線性
二、對參數為線性
三、本身為非線性,但通過變形可以變?yōu)榫€性關系
經典回歸分析主要考慮對參數是線性的形式,對變量之間的關系不作線性要求。
第三章一元回歸模型的參數估計
一、參數的普通最小二乘估計(OLS)
二、最小二乘估計量的數值性質
三、一元線性回歸模型的基本假設
四、最小二乘估計量的統計性質
五、參數估計量的概率分布及隨機干
擾項方差的估計
六、最小二乘估計(OLS)的精度或標準誤
單方程計量經濟學模型分為兩大類:
線性模型和非線性模型
線性模型中,變量之間的關系呈線性關系
非線性模型中,變量之間的關系呈非線性關系
一元線性回歸模型:只有一個解釋變量匕=4>+4Xj+〃,i=],2,..,n
Y為被解釋變量,X為解釋變量,⑶與⑶為待估參數,〃為隨機干擾項
回歸分析的主要目的是要通過樣本回歸函數(模型)SRF盡可能準確地估計總體回歸函數(模
型)PRFo
估計方法有多種,其中最廣泛使用的是普通最小二乘法。因為OLS具有良好的數值性質和
統計性質。同時,在一系列假定下OLS估計量具有BLUE性質,能滿足我們用樣本推斷總
體的要求。
注:實際這些假設與所采用的估計方法緊密相關。
一、參數的普通最小二乘估計(OLS)
給定一組樣本觀測值(Xi,Yi)(i=l,2,…n)要求樣本回歸函數盡可能好地擬合這組值.
離差
要求樣本函數僅可能好的擬合這組數值,我們可以考慮
使觀測值Yi與樣本回歸值之差(殘差ei)盡可能的小,
使之盡可能的接近PRF,即:.、
注:在統計分析中,如沒有殍藻加的磁一般是指觀測值與其均值的差,即
這種方法盡管有直觀上的說服力,卻不是一個很好的準則,如果采用
miny(y;.-y)即minZei
那么卷超和(el+e2+e3+e4+...ei)中,無
論殘差離樣本回歸函數SRF遠還是近,都
得到同樣的權重。結果很可能ei離開SRF
散布得很遠,但代數和很小甚至為零。
nn
普通最小二乘法給出的判斷標準是:二者之差的平方和。"9"最小。
為什么要用兩者之差平方和最?。?/p>
1、它根據各觀測值離SRF的遠近不同分別給予不同的權重。從而ei越大,Eei2也越大。
2、Eei2=f(pO,pl),即殘差平方和是估計量能的某個函數。八八
3、用OLS原理或方法選出來的的,引,將使得對于給定的樣本或數據殘差平方和盡可能的
小。
根據微分運算,可推得用「估泡、1的下列方程組:
|£區(qū)+41:-];)工=0'
戊I線=收+5國
包工=及以+6M
方程組(*)稱為正規(guī)方程組(normalequations)o
ZxM=z(x,-T)&-F)=zx1-1Zx,Zy;
自告
上述參數估計量可以寫成:〔瓦=’-自無
稱為OLS估計量的離差形式
由于參數的估計結果是通過最小二乘法得到的,故稱為普通最小二乘估計量。
二、OLS估計量的數值性質
OLS數值性質是指運用最小二乘法而得以成立的那些性質,而不管這些數據是怎樣產生的。
1、OLS估計量純粹是用可觀測的量(即樣本)來表達的,因此這些量是容易計算的。
2、這些量是點估計量。
3、一旦從樣本數據得到OLS估計值,便容易畫出樣本回歸線,這樣得到的回歸線有如下性
質:
(1)它通過Y和X的樣本均值。即..
(2)估計的Y均值等于實測的Y均由。=隔平向林
(3)殘差ei的均值為零。即Eei=0。據此,我們可以
推出樣本回歸函數的離差形式。即打=4下
注意:在計量經濟學中,往往以小寫字母表示對均值的離差。
記y,=y,-Y
力=(瓦+自x,)-(6°+AK+a)
則有=81(x「又)一二%
可得%=夕歸(**)
(**)式為樣本回歸函數的離差形式。
(4)殘差ei和預測的Yi值不相關.即
Z(*)=0
(5)殘差ei和Xi不相關。即EeiXi=O
三、線性回歸模型的基本假設
為什么要做出假定:
AA
1,雖然通過OLS,我們可以獲得同,Pi1的估計值,但我們的目的不僅僅是為了得到它們
的值。
2、更為重要的是對叩,小與真實的。0,pi之間的替代性進行推斷。
3、對Yi與E(Y|X=Xi)之間的差距到底有多大進行推斷。
4、在模型匕=£+%=&>+禽中,山
是一隨機變量,如果我們不知道xi、ei是怎樣產生的,就無法對Yi做出任何推斷,也無法
對的,。1做出任何推斷。
5、在一系列假定下,OLS具有良好的統計性質,能夠滿足我們對pO,R作出推斷的
要求。
線性回歸模型的基本假設
假設1、線性回歸模型,回歸模型對參數而言是線性的;
假設2、解釋變量X是確定性變量,不是隨機變量;
假設3、隨機誤差項具有零均值、同方差和不序列相關性:
E(pi)=0i=l,2,...,n
Var(gi)=O]j2i=l,2,...,n
Cov(gi,pj)=Oi#jij=1,2,...,n
假設4、隨機誤差項與解釋變量X之間不相關:
Cov(Xi,pi)=0i=l,2,...,n
假設5、服從零均值、同方差、零協方差的正態(tài)分布
pi~N(0,a2)i=l,2,...,n
假設6、觀測次數n必須大于待估的參數個數;
假設7、X值要有變異性;
假設8、正確的設定了回歸模型;也被稱為模型沒有設定偏誤(specificationerror);
假設9、在多元回歸模型中沒有完全的多重共線性.
注意:
1、如果假設2、3滿足,則假設4也滿足;
2、如果假設5滿足,則假設3也滿足。
以上假設也稱為線性回歸模型的經典假設或高斯(Gauss)假設,滿足該假設的線性回歸模
型,也稱為經典線性回歸模型。
另外,在進行模型回歸時,還有一個暗含的假設:
假設10:隨著樣本容量的無限增加,解釋變量X的樣本方差趨于一有限常數。即
Z(Xj-又)2/〃f2,〃f8
假設5旨在排除時間序列數據出現持續(xù)上升或下降的變量作為解釋變量,因為這類數據不僅
使大樣本統計推斷變得無效,而且往往產生所謂的偽回歸問題。
四、假定條件下的最小二乘估計量的統計性質
當模型參數估計出后,需考慮參數估計值的精度,即是否能代表總體參數的真值,或者說需
考察參數估計量的統計性質。
一個用于考察總體的估計量,可從如下幾個方面考察其優(yōu)劣性:
(1)線性性,即它是否是另一隨機變量的線性函數;
(2)無偏性,即它的均值或期望值是否等于總體的真實值;
(3)有效性,即它是否在所有線性無偏估計量中具有最小方差。
(4)漸近無偏性,即樣本容量趨于無窮大時,是否它的均值序列趨于總體真值;
(5)一致性,即樣本容量趨于無窮大時,它是否依概率收斂于總體的真值;
(6)漸近有效性,即樣本容量趨于無窮大時,是否它在所有的一致估計量中具有最小的漸
近方差。
這三個準則也稱作估計量的小樣本性質。
擁有這類性質的估計量稱為最佳線性無偏估計量(bestlinerunbiasedestimator,BLUE)。
當不滿足小樣本性質時,需進一步考察估計量的大樣本或漸近性質:
高斯一馬爾可夫定理
在給定經典線性回歸的假定下,最小二乘估計量是具有最小方差的線性無偏估計量。
1、線性性,即估計量為、A是號的線性組合。
證譏ZxZWTZ*士
歹一~E7--夕一夕
令尢因=故仃
2-'?
=汐-=£,,?,1;
2,無偏性,即估計量瓦、總的均值(期望)等于總體回歸
參數真值島與用
=yp-=0'kX=1
易知z怎乙is-1
故+E1kM
m)=E5+2>附)=A+=A
同樣地,容易得出
3、有效性(最小方差性),即在所有線性無偏估計量
中,最小二乘估計量自、A具有最小方差。
(1)先求A與其的方差
var(4)=var(^^耳)=2葉var(4+f3xXi+//,.)=k;var(w.)
的皿(工MF-雙>
var)"w/)=£;var(^0-"J.c?
E(樂)=E(兒+Z%從)=E(夕。)+工嗎E(〃,)=Bo咕備卜崎—行(2)
證明最小方差性
假設"是其他估計方法得到的關于小的線性無偏估計量:
/;=2*
其中,ci=ki+di,di為不全為零的常數
則容易證明vW京)Nvar(后)
普通最小二乘估計量稱為最佳線性無偏估計量
由于最小二乘估計量擁有一個“好”的估計量所應具備的小樣本特性,它自然也擁有大樣本
特性。
J蛾整的二贅%+£kM)=Plim(M)+Plim(半詈)
?-link2
M(X0=+9=4
五、參數估計量的概率分布及隨機干擾項方差的估計
1、參數估計量力和a的^率分布
普通坡小二乘估計量一摳分就是1;的線性組合,
因此,A,和a的概率分俏取決JT的分命特征
在〃足正態(tài)分辦的假設卜..r是正態(tài)分布,則
也服從正態(tài)分布,閃此
A"3*京)BLN電,逛。b
瓦和A的標準差
2、隨機誤差項〃的方差。2的估計
在估計的參數&和。的方左表達式中,部含仃隨機
擾動項〃的方芥<7:。d又稱為總體方差。
由「▼:實際k是未知的,因此&和自的方力次際
I:無法計算,這就需要時其進行估計。
由于隨機項3不可觀測,只能從〃的估計——殘差ei出發(fā),對總體方差進行估計。
2又稱為總體方差。
可以證明,。2的最小二乘估計量為〃-2它是關于°2的無偏估計量。
在隨機誤差項N的方差,估計出后,參頗
和A的方差和標準差的估計量分別是:
A的樣本方差:SA=
A的樣本標準差:%=同回
A的樣本方差:s3住X;
A的樣本標準差:sa=64心;
六、最小二乘估計的精度或標準誤差
最小二乘估計是樣本數據的函數,當樣本發(fā)生變化時,估計
值也會發(fā)生變化.因此需要對估計量瓦、A的可靠性或精密
(1)尺的方差與人成正比,與成反比拯表明在給定的/
度進行某種度量。在統計學中,一個統計量的精度是由它的
條件下,X值的變化越大,區(qū)的的方差越小,A得以更大
標準誤(se)來衡量的.所謂的標準誤實質上是估計量尺、A
的精密度得以估計:解量”的增加,的精度也將增加.
的標準差。A
通過前面的計算,我們知道:(2)A的方差與合和£X:成正比與和樣本大小成反比,
7
砥瓦)=/薪se(^)=-=3)由于月、自是估計量,它們不僅從l個樣本變到另一個
Jx;樣本,而且對于給定的樣本,它們還可能是礴的。第四
章一元線性回歸模型的統計檢驗
一、擬合優(yōu)度檢驗
二、變量的顯著性檢驗
三、參數的置信區(qū)間
回歸分析是要通過樣本所估計的參數來代替總體的真實參數,或者說是用樣本回歸線代替總
體回歸線。
盡管從統計性質上已知,如果有足夠多的重復抽樣,參數的估計值的期望(均值)就等于其
總體的參數真值,但在一次抽樣中,估計值不一定就等于該真值。
那么,在一次抽樣中,參數的估計值與真值的差異有多大,是否顯著,這就需要進一步進
行統計檢驗。
主要包括擬合優(yōu)度檢驗、變量的顯著性檢驗及參數的區(qū)間估計。
一、擬合優(yōu)度檢驗
擬合優(yōu)度檢驗:對樣本回歸直線與樣本觀測值之間擬合程度的檢驗。
度量擬合優(yōu)度的指標:判定系數(可決系數)r2(二元回歸)或R2(多元回歸)
問題:采用普通最小二乘估計方法,已經保證了模型最好地擬合了樣本觀測值,為什么還要
檢驗擬合程度?
1、總離差平方和的分解
已知由一組樣本觀測值(Xi,Yi),i=l,2-,n得到如下樣本回歸直線
已知由一組樣本觀測值(葛MP,i=12…n
得到如下樣本回歸直線
工=氐+//
而Y的笫/?個觀測值與樣本均值的離差反=(£-"是樣本回歸擬合值與觀測值的平均值之差,可
可分解為兩部分之和認為是由回歸直線解釋的部分;
,,”>?一小是實際觀測值與回歸擬合值之差,是回歸克線
yt=Yl-Y=(Yl-Yt)^(yt-y)=et+yi不能解釋的部分.
如果Yi=Vi即實際觀測值落在樣本回歸“線”上,則擬合最好。
可認為,“離差”全部來自回歸線,而與“殘差”無關。
對于所有樣本點,則需考慮這些點與樣本均值離差的平方和。
記
根據樣本回歸方程和樣本回歸函數的離差形式:TSS=2>;=2(X-F)2總體平方和(I
ofSquares)
yi=^lxi+ei
貴=6%
我們可以得到:]必=2+eiESS=£/;=£(X-F)2回歸平方和(]
方程兩邊同時平方.求和得:|SumofSquarf
起S=?e;=Za-Z)2殘差平方和
我們可以得到:
方程兩邊同時平方,求和得:
TSS=ESS+RSS
Y的觀測值圍繞其均值的總離差(totalvaria可分解為兩部分:一部分來自回歸線(ESS),另一
部分則來自隨機勢力(RSS)。
在給定樣本中,TSS不變,
如果實際觀測點離樣本回歸線越近,則ESS在TSS中占的比重越大,因此,擬合優(yōu)度:
回歸平方和ESS/Y的總離差TSS
2、可決系數R2統計量
記1=黑RSS
Tss
稱R2為(樣本)可決系數/判定系數(coefficientofdetermination)o
可決系數的取值范圍:[0,1J
R2越接近1,說明實際觀測點離樣本線越近,擬合優(yōu)度越高。
在實際計算可決系數時,的:已經估計出后:
在例2.L1的收入-消費支出例中,
R:=在二=(。刀7):X7425000
0.9766
~,£>;4590020-
注:可決系數是一個善負的統計里。它也是
著抽樣的不同而不同。為此,對可決系救的統計
可靠性也應進行檢蛉,這將在下章中進行。
二、回歸系數的區(qū)間估計
用。ZS法得到的模型參數估討g,盡管在重復抽樣
中可預計它的期望會鼾參數的真值,題(給=4
但還是不能說明斫得繳點估計值的可靠性。雖然
我們在前面已確定了繳的標準品嫉)和s":),
但標準誤只能說明估灌與其均值的離散程度
還不能說明參數真實f勤可能范圍。
為此,我們要設法找到可能包含參數真實值的一個
范圍,并且確定這個范圍包含真實值的可靠程度。
這就需要對參數進行區(qū)間估計和假設檢臉。
要判斷估計的參數值P離口實的參數值夕有多“近”,
可預先選擇?個概率a?Ka<l),并求一個正數B,使得
隨機區(qū)間楨包含參數的真值的概定為1-,即:
P(jB-8<p<p+8)=l-a
如果存在這樣一個區(qū)間,稱之為置信區(qū)間;1-a稱為置信系數(置信度),a稱為顯著性水平;
置信區(qū)間的端點稱為置信限或臨界值。
從定義我們可以看出,區(qū)間估計量是一個構造出來的區(qū)間,要使得它把參數的真值包括在區(qū)
間的界限內有一個特定的概率:1—a
在給定a=0.05或5%的情況下,置信(隨機)
區(qū)間包含真實P的概率為0.95或95%o
它表示使用我們所描述的方法構造出來的
眾多區(qū)間中包含P真值的概率為0.95或95%。
我們能不能構造出這樣的區(qū)間呢??
依據什么來構造呢???
依據概率知識我們知道,如果估計量的抽樣或概率分布已知,我們就可以構造出以一定概率
包含真實B值的區(qū)間。
.古曲假定條件下,“和樣本向歸樟型的扮加M服從
正態(tài)分布,為此%也服從正態(tài)分布。由璐、自為耳的線
生函數,所以即使在小樣本情況下向、a也服從正態(tài)分
市,在大樣本條件下,即使不不服從正態(tài)分布,禽、a也
會趨于正態(tài)分布。由于河、自是萬°、丹的無偏估計,因而
急)
對回歸系數B的區(qū)間估計可歸納為三種情況
(1)在總體方差cr記知時,在4服從正態(tài)分布的假設下
已知:Z=氏-f~N(0,l)其中:
陽㈤
品(月)=之可以確定。顯著性水平通常采用三個標準
a=0.05,即1-a=0.95
a=0.01,即1-a=0.99
a=0.001,即1-a=0.999
例如:取a=0.05,即1-a=0.95,查標準正態(tài)分布表可知
Z值在(-1.96,1.96)區(qū)間的概率為0.95。即P(-1.96<Z<1.96)=0.95
(2)當總體方和未知,且樣本容量充分:時,可以用N
的無偏估i廿=Z豈來代替此時由于樣本容量箱大
M-2
仍可認為:Z=&二&?N(O,D
$明)
(3以總體方差。沫知,且樣本容量小時,若用無偏估計
:、旁來代替內此時
左蓼~?"-2汾布,此時幽置信區(qū)間不再利用標準正
se(用
態(tài)分布,而用分布。P(-%Yi%)=l-a
三、假設檢驗:
回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個顯著性的影響因素。
在一元線性模型中,就是要判斷X是否對Y具有顯著的線性性影響。這就需要進行
變量的顯著性檢驗。
變量的顯著性檢驗所應用的方法是數理統計學中的假設檢驗。
計量經計學中,主要是針對變量的參數真值是否為零來進行顯著性檢驗的。
1、假設檢驗
所謂假設檢驗,就是事先對總體參數或總體分布形式作出一個假設,然后利用樣本信息來判
斷原假設是否合理,即判斷樣本信息與原假設是否有顯著差異,從而決定是否接受或否定原
假設。
當我們拒絕原假設(虛擬假設)時,我們說發(fā)現統計上是顯著的。當我們不拒絕原假設
時,我們說發(fā)現不是統計上顯著的。
假設檢驗采用的邏輯推理方法是反證法。
先假定原假設正確,然后根據樣本信息,觀察由此假設而導致的結果是否合理,從而判
斷是否接受原假設。
判斷結果合理與否,是基于“小概率事件不易發(fā)生”這一原理的
2、變量的顯著性檢驗
對「一元線性回歸方程中的八,己經知道它服
從正惑分布
…但晝)
III「真實的£未知,在用它的無偏估計量
6=2e:/m-2)替代時,可構造如F統計量
~t(n-2)
檢驗步驟:
(1)對總體參數提出假設
HO:pl=O,Hl:pl^O
(2)以原假設HO構造t統計量,并由樣本計算其值
,A-AA
(3)給定顯著硬嫉語s。質禰t分布表,得臨界值ta/2(n-2)
(4)比較,判斷
若|t|>ta/2(n-2),則拒絕HO,接受Hl;
對于一元線性回歸方程中的自,可構造如下t
統計里進行顯著性檢驗:
r-身---且?*“_2)
FEE/吃=s*
在上述收入-消費支出例中,首先計算七的估計值
£,:4590020-0777,7425000匹5
°-E-----0-------------g--------13403
廣是&和A的標準):的估計值分別是:
:
Ss-/yx:-713402.「42580-J0.0018-0.0425
若|t區(qū)ta/2(n-2),則拒絕Hl,接受HO;s一屋無桁-病匹而兩5TE迎加1
t統計量的計算結果分別為:
t.=耶公=0.777/0.0425=18.29
r0==-103117/98.41=-1.048
給定顯著性水平a=0.05,查t分布表得臨界值10.05/2(8)=2.306
|tl|>2.306,說明家庭可支配收入在95%的置信度下顯著,即是消費支出的主要解釋變
量;
|⑵<2.306,表明在95%的置信度下,無法拒絕截距項為零的假設。
3、變量的置信區(qū)間檢驗
回!11分析希望通過樣本所估計出的參數后來
代替總體的參數加
要判斷樣本參數的估計值在多大程度上可以“近似”地替代總體參數的真值,往往需要通過
構造一個以樣本參數的估計值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著
真實的參數值。這種方法就是參數檢驗的置信區(qū)間估計。
在置信區(qū)間檢驗程序中,我們試圖建立一個以某種概率包含有真實,但未知的B的一個范圍
區(qū)間;而在顯著性檢驗步驟中,我們假設B為某值,然后看所計算的值,是否位于該假設
值周圍某個合理的范圍內。
一元線性模型中,色(41,2)的盥餐區(qū)間:
在變星的顯著性檢蛤中已經知道:
sl
意味著,如果給定置信度(1-a),從分布
表中查得自由度為8-2)的臨界值,那么t值處在
(-ta/2,的概率是(1-a)。表示為:
P(-r.<:<:.)=1-a
&-B,
即P(-r.<
Tsi-
-q*q<月(&)=i-a
于是得到:(1-a)的置信度下,內的置信區(qū)間是
(4Yxs”4+/xs-
ITA
在上述收入-消費支出例中,如果給定a
=0.01,查表得:
%("-2)=%0M(8)=3.355
由于Sit=0.042=98.41
于是,瓦、區(qū)的置信區(qū)間分別為:
(0.6345,0.9195)
(-433.32,226.98)
由于置信區(qū)間一定程度地給出了樣本參數估計值與總體參數真值的''接近”程度,因此置信
區(qū)間越小越好。
要縮小置信區(qū)間,需
(1)增大樣本容量n,因為在同樣的置信水平下,n越大,t分布表中的臨界值越?。煌?/p>
時,增大樣本容量,還可使樣本參數估計量的標準差減小;
(2)提高模型的擬合優(yōu)度,因為樣本參數估計量的標準差與殘差平方和呈正比,模型擬
合優(yōu)度越高,殘差平方和應越小。
第六章雙變量線性回歸模型的延伸
6.1過原點的回歸
過原點的回歸
截距項不存在或為0.過原點的回歸
如,工二月%+%估計的模型:
y=4乂
或Y=p,Xi+ui
運用OLS方法:a
B-X丫和的(1>會-
2yx,-2
和£2_2蘇
N-1
//過原點的回歸
無截距模型的性質
y=&+/x+〃,Y=。20u'i
LWX不必要
-T.XY
p=
2乙*再一z*
2R2A82
,人可能為負值.
Yar(P2)=q―2A
1.X-
整盤
3,df不必包括常數項,ie,(女k)成江
n-1
實際上:n-1
:2
?1.除非有非常強的先驗性或理論預期.否則回歸中應該包含_IZGC-XXY-^
d2_工(")'
截距項.Z(X一kZ(Y;骨
?2.如果回歸模型包含截距項,但結果不顯著則我們需要除主orn2-(Z孫Y
R
截距項作回歸.
例1:資本資產定價模型(CAPM)證券期望風險溢價二期望市場風險溢價
但
月
2m"r/
.
無
險
風
望
的
回
率
第I種證報
場
組
券的期市
證
券
合
望回報回
報
的證券市場線
率率
A不可分散風險的度量.
A>i=>波動性或進攻型證券.
片VI=>防御性證券.E&-f
例2:覆蓋的平價利率
國際利率差等于匯率預期升水
例2:(Cont.)
回歸:20/)=0
^)+?,
e
1
例如果利率平價,//則預期為零.
6.2尺度與測量單位
改變X和Y的測量單位
Y=Pl+p,X+u1
P,:回歸直線的斜率又二小+鳳天+4
回歸結果中
P=Y的單位變化=絲成@
;-x的單位變化-AX或怒,
P2R2,t,F/k=(Pi/k)+(P)X/k+uA
統計量不變,i2i
如果Y'=1000Y
但SEE,RSSY:=p:+02冷福
X*=1000X和其它統計
則1000Y=1000+^lOOOX+100CU,量發(fā)生變化.這里Y:=Y/ku*=UjZk
=>V=眾+^X+u'
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 地鐵泵站施工與維護方案
- 社區(qū)服務滿意度統計方案
- 鋼結構拆除后再利用方案
- 機場擴建臨時用電方案
- 醫(yī)院公共衛(wèi)生間提升方案
- 火腿出口貿易策略方案
- 臨時圍墻施工方案與管理
- 光伏發(fā)電系統經濟效益評估方案
- 科研基地實驗樓施工總平面布置方案
- 房地產項目降低開發(fā)成本方案
- 貴州省火力發(fā)電企業(yè)名錄2017年125家
- 二年級上冊科學二單元《材料》教材解讀
- 新教材湘教湘科版四年級上冊科學 1.1 各種各樣的聲音 教案(教學設計)
- 思想道德與法治課件:第四章 第一節(jié) 全體人民共同的價值追求則
- 戰(zhàn)略管理教學ppt課件(完整版)
- DB32-T 3129-2016適合機械化作業(yè)的單體鋼架塑料大棚 技術規(guī)范-(高清現行)
- 高危新生兒急診服務流程圖
- 人教版八年級上冊Unit 2 How often do you exercise聽說課的集體備課教學設計
- 五四制青島版2022-2023五年級科學上冊第八單元第26課《我們的住宅》課件(定稿)
- 健康教育學【完整版】
- 近代笛簫制作師承
評論
0/150
提交評論