第2章 簡單回歸模型(2015.3)_第1頁
第2章 簡單回歸模型(2015.3)_第2頁
第2章 簡單回歸模型(2015.3)_第3頁
第2章 簡單回歸模型(2015.3)_第4頁
第2章 簡單回歸模型(2015.3)_第5頁
已閱讀5頁,還剩168頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第2章簡單回歸模型商學(xué)院金融系方海燕簡單回歸模型可以用來研究兩個(gè)變量之間的關(guān)系。簡單回歸模型要作為經(jīng)驗(yàn)分析的一般工具還存在著局限性。但是作為一個(gè)經(jīng)驗(yàn)工具還是很合適的。學(xué)會解釋簡單回歸模型,對于多元回歸模型的學(xué)習(xí)是一個(gè)很好的練習(xí)。2.1簡單回歸模型的定義解釋y和x是兩個(gè)代表某個(gè)總體的變量“用x來解釋y”或“研究y如何隨x而變化”。比如:y是大豆的產(chǎn)出,x是施肥量;y每小時(shí)工資,x是受教育的年數(shù);y是社區(qū)的犯罪率,x是警察的數(shù)量。在寫出用x來解釋y的模型時(shí),要面臨三個(gè)問題。1、既然兩個(gè)變量之間沒有一個(gè)確切的關(guān)系,那么我們應(yīng)該如何考慮其他影響y的因素呢?2、y和x的函數(shù)關(guān)系是怎樣的呢?3、我們何以確定我們在其他條件不變的情況下刻畫了y和x之間的關(guān)系(如果這是一個(gè)目標(biāo)的話)呢?可以通過寫出y和x的一個(gè)方程來消除這些疑慮。一個(gè)簡單的方程是:

(2.1)假定方程(2.1)在我們所關(guān)心的總體中成立,它就定義了一個(gè)簡單線性回歸模型。或者叫兩變量或雙變量線性回歸模型。y被稱為因變量、被解釋變量、響應(yīng)變量、被預(yù)測變量和回歸子。x被稱為自變量、解釋變量、控制變量、預(yù)測變量和回歸元。變量u稱為誤差項(xiàng)或者干擾項(xiàng),表示除x之外其他影響y的因素。簡單回歸分析有效地把除x之外其他因素所有影響y的因素都看成無法觀測的因素。方程(2.1)還表現(xiàn)出y和x之間的函數(shù)關(guān)系。如果u中的其他因素不變,于是u的變化為0,即則x對y具有線性影響,其表述如下:(2.2)稱為斜率參數(shù),稱為截距參數(shù)。例2.1大豆收成與施肥量

(2.3)

y——收成,x——施肥量,u——土地質(zhì)量,降雨量等度量了在其他因素不變的情況下,施肥量如何影響大豆收成。例2.2一個(gè)簡單的工資方程

(2.4)y—小時(shí)工資,x—受教育年數(shù),u—勞動經(jīng)驗(yàn)、天生能力、任現(xiàn)職時(shí)間等

度量了在其他因素不變的情況下,多接受一年的教育導(dǎo)致小時(shí)工資的變化量。式(2.1)的線性形式意味著:不管x的初始值為多少,它的任何一個(gè)單位變化對y的影響都是相同的。這對許多經(jīng)濟(jì)應(yīng)用來說是不現(xiàn)實(shí)的。比如在工資——教育的例子中,可能還要考慮到遞增的回報(bào),即后一年的教育比前一年的教育對工資的影響更大。我們將在2.4節(jié)研究如何考慮這種可能性。要解決的最困難問題是,模型(2.1)是否真的能讓我們得到關(guān)于x如何在其他條件不變情況下影響y的結(jié)論。從方程(2.1)看到,保持所有其他條件不變,確實(shí)能夠度量x對y的影響。問題是我們怎樣才能在忽略所有其他因素的同時(shí),有得到其他因素不變情況下x對y的影響呢?節(jié)2.5將說明,只有在我們對無法觀測的u與解釋變量x之間的關(guān)系加以約束時(shí),才能從一個(gè)隨機(jī)數(shù)據(jù)樣本中獲得的可靠估計(jì)值。由于u和x都是隨機(jī)變量,所有會涉及到概率的概念。假設(shè)(2.5)這只是對無法觀測因素的分布給的一個(gè)命題。事實(shí)上,如果令則且證畢?,F(xiàn)在討論u和x如何相關(guān)的關(guān)鍵假定。度量兩個(gè)隨機(jī)變量關(guān)系的一個(gè)自然指數(shù)是相關(guān)系數(shù)。如果u和x不相關(guān),則作為隨機(jī)變量,它們就不存在線性相關(guān)。但是有可能非線性相關(guān),如果這樣的話,在解釋模型和推導(dǎo)統(tǒng)計(jì)性質(zhì)時(shí)產(chǎn)生問題。一種更好的方法是對給定x時(shí)u的期望值作出假定。關(guān)鍵假定是,u的平均值與x值無關(guān),即

(2.6)方程(2.6)表明,根據(jù)x值的不同把總體劃分成若干部分,每個(gè)部分中都有無法觀測的因素都具有相同的平均值,而且這個(gè)共同的平均值必然等于總體中u的平均值。當(dāng)方程(2.6)成立時(shí),稱u的均值獨(dú)立于x。于是有稱

為零條件均值假定。在工資——教育例子中式(2.6)意味著什么。為了討論方便,假定u就是天生能力。那么式(2.6)就要求無論教育程度如何,能力的平均水平都相同。如果我們認(rèn)為平均能力是隨著教育程度的增加而遞增的,那么式(2.6)就是錯(cuò)的。問題2.1假如期末考試的分?jǐn)?shù)取決于出勤率和影響考試成績的其他無法觀測因素(如學(xué)生能力等):(2.7)其中y表示考試分?jǐn)?shù),x表示出勤率。問題:這個(gè)模型在什么情況下能夠滿足方程(2.6)?答:當(dāng)u中的學(xué)生能力、學(xué)習(xí)動機(jī)、年齡及其他因素與出勤率無關(guān)時(shí),式(2.6)將成立。不過,這看起來不太可能。在施肥的例子中,如果施肥量與該地區(qū)的其他條件沒有關(guān)系,那么式(2.6)就成立。但是如果更多的肥料被施用在更高質(zhì)量的土地上,那么u的平均值就會隨著肥料的用量而改變,式(2.6)也就不成立了。零條件均值假定給出的另一種非常有用的解釋。由有

(2.8)方程(2.8)表明,總體回歸函數(shù)(populationregressionfunction,PRF)是x的一個(gè)線性函數(shù)。即x變化一個(gè)單位,將使y的期望值改變之多。給定零條件均值假定把方程(2.1)中的y看成兩個(gè)部分是比較有用的一部分是表示被稱為y的系統(tǒng)部分,即由x解釋的那一部分另一部分是被稱為非系統(tǒng)部分的u,即不能由x解釋的那一部分。在節(jié)2.2,我們將在給定一個(gè)數(shù)據(jù)的隨機(jī)樣本的情況下,利用假定式(2.5)和式(2.6)給出的估計(jì)量。零條件均值假定對節(jié)2.6的統(tǒng)計(jì)分析也起到關(guān)鍵作用。2.2普通最小二乘法的推導(dǎo)我們已經(jīng)討論了假定回歸模型的基本要素,接下來將要闡述如何估計(jì)方程(2.1)中的參數(shù)這個(gè)重要問題。為此,需要從總體中找出一個(gè)樣本。令表示從總體中抽取的一個(gè)容量為n的隨機(jī)樣本。因?yàn)檫@些數(shù)據(jù)來自方程(2.1),所以對每個(gè)i都可以寫為:

(2.9)這里,所以它是第i次觀測的誤差項(xiàng)。

舉例來說,可能是某特定年份家庭i的年收入和年儲蓄。如果我們收集了15個(gè)家庭的數(shù)據(jù),則n=15。我們必須確定如何利用這些數(shù)據(jù),得到儲蓄對收入的總體回歸中的截距和斜率估計(jì)值。有幾種方法促使我們完成如下估計(jì)程序。我們將用到假定式(2.5)和假定式(2.6)的一個(gè)重要含義:在總體中,u和x不相關(guān)。因此,我們看到,u的期望值為零時(shí),x和u的協(xié)方差也為零:

(2.10)

(2.11)事實(shí)上式(2.10)和式(2.11)可以用觀測變量x和y以及未知參數(shù)來表示,方程(2.10)和(2.11)可分別寫為(2.12)

(2.13)方程(2.12)和(2.13)意味著對總體中(x,y)的聯(lián)合概率分布的兩個(gè)限制。因?yàn)橛袃蓚€(gè)未知參數(shù)要估計(jì),所以我們寄希望于方程(2.12)和(2.13)能用于求出的較好估計(jì)量。事實(shí)上,我們確實(shí)能夠做到這一點(diǎn)。給定一個(gè)數(shù)據(jù)樣本,我們選擇估計(jì)值求解(2.12)和(2.13)的樣本對應(yīng)值:

(2.14)

(2.15)這是一個(gè)用矩法進(jìn)行估計(jì)的例子。這兩個(gè)方程可用來解出方程(2.14)改寫為

(2.16)其中的樣本均值,的樣本均值。由(2.16)得(2.17)將(2.17)代入(2.15)得整理后便得到根據(jù)求和運(yùn)算的基本性質(zhì)有因此,只要有(2.18)估計(jì)的斜率就為(2.19)方程(2.19)無非就是x和y的樣本協(xié)方差與x的樣本方差之比。這是非常有意義的,因?yàn)楫?dāng)?shù)扔诳傮w的方差與x的方差之比。一個(gè)顯然的含義是,若樣本中的x和y正相關(guān),則為正;若x和y負(fù)相關(guān),則為負(fù)。盡管假定(2.6)給出了求解式(2.17)和式(2.19)的方法,但計(jì)算一個(gè)特定的樣本估計(jì)值時(shí),唯一需要的假定卻是式(2.18)。這幾乎不能算什么假定,因?yàn)橹灰獦颖局械牟皇峭耆嗟?,?2.18)就一定成立。如果式(2.18)不成立,那么我們要么在從總體中取樣時(shí)非常不走運(yùn),要么就是設(shè)定一個(gè)值得我們關(guān)注的問題(因?yàn)閤在總體中沒有變化。)例如,若y表示工資,x表示教育,則式(2.18)只有在樣本中每一個(gè)人都具有相同的教育程度(比方說每一個(gè)人都是高中畢業(yè)時(shí))才不成立。只要有一個(gè)人的受教育程度不同,式(2.18)仍然成立,并且能夠計(jì)算出估計(jì)值。式(2.17)和式(2.19)所給出的估計(jì)值叫做的普通最小二乘法(ordinaryleastsquares,OLS)估計(jì)值。為了說明這個(gè)名稱的合理性,對任一截距和斜率,定義時(shí)的一個(gè)擬合值(fittedvalue)為(2.20)這是在給定截距和斜率下,時(shí)的預(yù)測值。樣本中的每一次給出都有一個(gè)擬合值。第i次觀測的殘差(residual)是的實(shí)際值與其擬合值之差:

(2.21)有n個(gè)這樣的殘差。[它與我們在式(2.9)中看到的誤差不同,我們將在節(jié)2.5繼續(xù)討論這個(gè)問題。]現(xiàn)在,假設(shè)我們選擇最小化殘差平方和(sumofsquaredresiduals):

(2.22)可以證明,使殘差平方和最小的必要條件是滿足:(2.14)(2.15)式(2.14)和式(2.15)通常被稱為OLS估計(jì)值一階條件。OLS的一階條件的解由式(2.17)和式(2.19)給出?!捌胀ㄗ钚《朔ā敝缘妹?,就是因?yàn)檫@些估計(jì)值最小化了殘差平方和。一旦我們確定了OLS截距和斜率估計(jì)值,就可以建立OLS回歸線:

(2.23)其中是從式(2.17)和式(2.19)中得到的。從方程(2.23)得到的預(yù)測值便是估計(jì)值。方程(2.23)又稱為樣本回歸函數(shù)(sampleregressionfunction,SRF),因?yàn)樗强傮w回歸函數(shù)的一個(gè)樣本估計(jì)。總體回歸函數(shù)是固定而又未知的,切記這一點(diǎn)非常重要。因?yàn)闃颖净貧w函數(shù)來自一組給定的數(shù)據(jù)樣本,所以一個(gè)新的樣本將使得方程(2.23)中產(chǎn)生不同的斜率和截距。在大多數(shù)情形中,斜率估計(jì)值可寫成(2.24)它告訴我們變化一個(gè)單位時(shí)的變化量。等價(jià)地,(2.25)所以,給定x的一個(gè)變化,都可以計(jì)算出y的預(yù)期變化?,F(xiàn)在給出一些通過實(shí)際數(shù)據(jù)得到簡單回歸的例子。因?yàn)檫@些例子涉及到許多觀測,所以要用計(jì)量經(jīng)濟(jì)學(xué)軟件包進(jìn)行計(jì)算。注意:不要指望能從這些回歸中得到太多東西,因?yàn)樗鼈儾灰欢芙沂径嗌僖蚬P(guān)系。到目前為止,還沒有提到OLS的統(tǒng)計(jì)性質(zhì)。在節(jié)2.5中,在我們對總體模型方程(2.1)明確施加一些假定之后,再來考慮其統(tǒng)計(jì)性質(zhì)。例2.3首席執(zhí)行官的薪水和股本回報(bào)率對于由首席執(zhí)行官(CEO)構(gòu)成的總體,令y代表年薪,以千美元為單位。即y=856.3表示年薪為856300美元。令x表示某個(gè)CEO所在公司在過去三年里的平均股本回報(bào)率(股本回報(bào)率=凈收入占普通股價(jià)值的百分比)。例如x=10,表示平均股本回報(bào)率為10%。為了研究這個(gè)公司業(yè)績指標(biāo)和CEO薪水之間的關(guān)系,可以假定一個(gè)簡單模型斜率參數(shù)衡量的是,當(dāng)股本回報(bào)率增長一個(gè)百分點(diǎn),以千美元計(jì)年薪的變化量。因?yàn)楦叩膞對公司有好處,所以我們認(rèn)為數(shù)據(jù)集1包含了1990年209位CEO的信息;這些數(shù)據(jù)是從《商業(yè)周刊》(BusinessWeek,5/6/91)中獲得的。在這個(gè)樣本中,CEO的平均年薪是1281120美元,最低值和最高值分別是223000美元和14822000美元。1988年、1989年和1990年的平均股本回報(bào)率是17.18%,最低值和最高值分別是0.5%和56.3%。利用數(shù)據(jù)集1的數(shù)據(jù),聯(lián)系y和x的OLS回歸線為(2.26)其中截距和斜率都是被四舍五入到小數(shù)后三位;用表示這是一個(gè)估計(jì)方程。我們?nèi)绾谓忉屵@個(gè)方程?首先,如果股本回報(bào)率是零,即x=0,那么年薪的預(yù)測值等于截距963.191,因?yàn)樾剿郧涝獮閱挝?,所以又等?63191美元。其次,能夠把年薪的預(yù)期變化看成x變化的函數(shù):這意味著,若股本回報(bào)率增加一個(gè)百分點(diǎn),即,則年薪的預(yù)期變化就是18.5,或18500美元。因?yàn)槭?2.26)是一個(gè)線性方程,所以所估計(jì)的變化與初始年薪無關(guān)。利用式(2.26),很容易比較x取不同值時(shí)的年薪預(yù)測值。假設(shè)(千美元),超過150萬美元。然而,這并不是說在一個(gè)x=30的公司中某個(gè)特定的CEO可以賺到1518221萬美元,因?yàn)檫€有許多其他因素會影響薪水。這只是我們從OLS回歸線(2.26)得到的預(yù)測值。我們不可能知道PRF的真正形狀,所以無法確知SRF與PRF有多接近。另外一個(gè)數(shù)據(jù)樣本便會給出一條不同的回歸線,這條回歸線有可能更接近總體回歸線,也有可能會離總體回歸線更遠(yuǎn)。例2.4工資和受教育程度以1976年的勞動力為總體,令y表示時(shí)薪。于是,對一個(gè)特定的人來說,如果y=6.75,則表示每小時(shí)工資為6.75美元。令x表示接受教育的年數(shù);例如x=12表示完成了高中教育。由于例子中的平均工資是5.90美元,消費(fèi)者價(jià)格指數(shù)表明,這一數(shù)值相當(dāng)于2003年的19.06美元。利用數(shù)據(jù)1中n=526個(gè)人的數(shù)據(jù),可以得到如下OLS回歸線(或樣本回歸函數(shù)):

(2.27)問題2.2當(dāng)x=8時(shí),從式(2.27)中得到的估計(jì)工資是用1976年的美元表示的3.42美元,如果用2003年的美元表示,這個(gè)值多少?答:約11.05美元。從以1976年和2003年的美元度量的平均工資,可以得到CPI縮減指數(shù)為那么2003年的平均工資為(美元)我們必須謹(jǐn)慎地解釋這個(gè)方程。截距-0.90字面上看意味著,一個(gè)沒有受過教育的人,其小時(shí)工資的預(yù)測值是-90美分。這無疑是非??尚Φ?。在這個(gè)526人的樣本中,只有18人接受的教育低于8年。于是,回歸線在受教育程度極低時(shí)表現(xiàn)不好也就不足為奇了。對于一個(gè)接受8年教育的人來說,預(yù)測工資為式(2.27)斜率估計(jì)值顯示,多接受一年教育,小時(shí)工資就會增加54美分。因此,增加四年教育可以使小時(shí)工資增加4×0.54=2.16(美元)這是相當(dāng)大的影響。因?yàn)槭?2.27)的線性性質(zhì),所以無論初始教育水平如何,每增加一年的教育都使工資增加相同的數(shù)量。在節(jié)2.4中,我們會討論容許解釋變量具有非恒常邊際效應(yīng)的某些方法。例2.5投票結(jié)果和競選支出數(shù)據(jù)2包含了1988年美國眾議院173次兩黨競選的選舉結(jié)果和競選支出數(shù)據(jù)。每次競選有兩名候選人,A和B。令為候選人A所得票數(shù)的百分比,為候選人A在總競選支出中所占的百分比。除了以外,還有許多因素影響著競選結(jié)果(包括候選人的素質(zhì),還可能包括A和B支出的美元數(shù)量)。然而,我們可以估計(jì)一個(gè)簡單回歸模型,與競爭對手相比,花費(fèi)更多的錢是否能夠得到更多的票數(shù)百分比。利用這173次觀測得到的估計(jì)方程為

(2.28)這意味著,如果候選人A的支出在總花費(fèi)中的比例增加一個(gè)百分點(diǎn),候選人A就能多得到幾乎半個(gè)(0.464)百分點(diǎn)的總票數(shù)。這是不是一種因果關(guān)系尚不清楚,但并非難以置信。即投票的半數(shù)。問題2.3在例2.5中,若即60%,預(yù)計(jì)候選人A能得到的票數(shù)是多少?這個(gè)結(jié)果合理嗎?答:將代入方程(2.28)就可以得到,即54.65%。就是說如果候選人A花了總競選支出的60%,那么預(yù)測候選人將得到接近55%的選票。這并非不合理。在有些情形中,回歸分析不是用來確定因果關(guān)系,而是像標(biāo)準(zhǔn)的相關(guān)分析一樣,僅用于判斷兩個(gè)變量是正相關(guān)還是負(fù)相關(guān)。關(guān)于術(shù)語的注解在多數(shù)情形中,我們總是通過寫出諸如式(2.26)、式(2.27)或式(2.28)的方程,表示我們通過OLS估計(jì)了某個(gè)關(guān)系式。有時(shí)候,為了方便,僅指出運(yùn)用OLS回歸而不寫出這些方程。我們說做了(2.29)的一個(gè)回歸,或者只說將回歸,通常指的是通過OLS得到了方程(2.23)。式(2.29)中的位置標(biāo)志著哪一個(gè)是因變量和哪一個(gè)是自變量:我們總是將因變量對自變量回歸。2.3OLS的操作技巧我們在上一節(jié)考察了OLS截距和斜率參數(shù)表達(dá)式的數(shù)學(xué)推導(dǎo)。在本節(jié)中,我們將進(jìn)一步討論擬合OLS回歸線的某些代數(shù)性質(zhì)。考慮這些性質(zhì)的最佳途徑,就是要意識到,根據(jù)構(gòu)造,它們對任何數(shù)據(jù)樣本都成立??紤]相對數(shù)據(jù)的所有可能隨機(jī)樣本的OLS性質(zhì)是一個(gè)更艱巨的任務(wù),這將留待節(jié)2.5討論。我們將要推導(dǎo)的一些代數(shù)性質(zhì)看起來非常普通。不過,掌握這些性質(zhì)有助于我們理解,在對數(shù)據(jù)進(jìn)行某種處理時(shí)(比如當(dāng)因變量和在半空的度量單位發(fā)生變化),OLS估計(jì)值及相關(guān)統(tǒng)計(jì)量會發(fā)生什么變化。擬合值和殘差我們假定從給定數(shù)據(jù)樣本中得到截距和斜率的估計(jì)值。給定,我們能夠獲得每次觀測的擬合值[由方程(2.20)給出。]根據(jù)定義,的每個(gè)擬合值都在OLS回歸線上。如方程(2.21)所指出,與第i次觀測相聯(lián)系的OLS殘差與其擬合值之差。若為正,則回歸線低估了;若為負(fù),則回歸線高估了。第i次觀測最理想的情況是,但是,大部分情形中,并非每個(gè)殘差都等于零。即實(shí)際上沒有一個(gè)數(shù)據(jù)點(diǎn)必須在OLS線上。例2.6CEO的薪水和股本回報(bào)率表2.1包含了CEO數(shù)據(jù)集中的前15次觀測列表,同時(shí)給出擬合值和殘差。(股本回報(bào)率),(工資),(擬合值)殘差表2.1前15位CEO的擬合值與殘差obsno(%)12345678910111213141514.110.923.55.913.820.016.416.310.526.325.926.814.822.356.310951001112257813681145107810941237833567933133993720111224.0581164.8541397.9691072.3481218.5081333.2151266.6111264.7611157.4541449.7731442.3721459.0231237.0091375.7682004.808-129.0581-163.8542275.9692-494.3484149.4923-188.2151-188.6108-170.760679.54626-616.7726-875.3721-526.0231101.9911-438.76786.191895前4位CEO的薪水低于我們從回歸線式(2.26)得到的預(yù)測值;第5,9、13和15位的薪水高于我們從回歸線式(2.26)得到的預(yù)測值。OLS統(tǒng)計(jì)量的代數(shù)性質(zhì)接下來介紹OLS估計(jì)值及其相關(guān)統(tǒng)計(jì)量的一些有用代數(shù)性質(zhì)。我們介紹其中最重要的三條。(1)OLS殘差和以及OLS殘差樣本均值都為零即OLS殘差和為零:殘差樣本均值為零:因?yàn)橛蒓LS的一階條件式(2.14)中直接得到。由式(2.14):

(2.30)(2)回歸元和OLS殘差的樣本協(xié)方差為零。即由式(2.15):(2.31)其中,由(1)知,所以(3)點(diǎn)總在OLS回歸線上。事實(shí)上,由式(2.23)知由式(2.17)知所以有即也就是說總在OLS回歸線上。把每個(gè)都寫成它的擬合值與它的殘差之和,便提供了解釋OLS回歸的又一方法。對于任何i值,都有(2.32)根據(jù)性質(zhì)(1),可知道殘差均值為零。即所以擬合值的樣本均值與的樣本均值相等。即其中進(jìn)一步來說,性質(zhì)(1)和性質(zhì)(2)可被用于證明之間的樣本協(xié)方差為零。那么,我們可以把OLS看作是把分成擬合值和殘差兩個(gè)部分。在樣本中,擬合值與殘差是不相關(guān)的。事實(shí)上,定義總平方和(totalsumofsquares,SST)解釋平方和(explainedsumofsquares,SSE)殘差平方和(residualsumofsquares,SSR)(也叫做剩余平方和)如下:總平方和(2.33)

解釋平方和(2.34)殘差平方和

(2.35)SST度量了中的總樣本變異;即度量了在樣本中的分散程度;SSE度量了在樣本中的分散程度(其中用到結(jié)論);SSR度量了的樣本變異。的總變異總能表示成解釋了的變異SSE和未解釋的SSR變異之和。因此,SST=SSE+SSR(2.36)證明式(2.36)并不困難。事實(shí)上,而(2.37)因?yàn)閿M合優(yōu)度迄今為止,我們還沒有辦法衡量解釋變量或自變量x究竟多好地解釋了因變量y。如果能夠計(jì)算出一個(gè)數(shù)值,用以概括OLS回歸線對數(shù)據(jù)擬合得有多好,對我們就非常有幫助。假設(shè)總平方和SST不為零(除非所有都相等這樣一個(gè)極其罕見的情況出現(xiàn),否則這個(gè)假定總成立),將方程(2.36)兩邊同除以SST得令,(2.38)稱為判定系數(shù)。是解釋變異與總變異之比,因此被解釋成y的樣本變異中被x解釋的部分。式(2.38)的第二個(gè)等式提供了計(jì)算的另一種方法。根據(jù)式(2.36),。若數(shù)據(jù)點(diǎn)都落在同一直線上,OLS就提供了數(shù)據(jù)的一個(gè)完美擬合。此時(shí),。一個(gè)接近于零的值表明OLS給出了一個(gè)糟糕的擬合??梢宰C明事實(shí)上,其中例2.8CEO的薪水和股本回報(bào)率在CEO薪水的回歸中,我們可以得到:

(2.39)在這個(gè)209位CEO的樣本中,企業(yè)的股本回報(bào)率僅解釋了薪水變異的約1.3%。這意味著這些CEO的薪水變異中還有98.7%懸而未決由于還有企業(yè)和CEO個(gè)人的諸多其他特征影響薪水,所以缺乏解釋力就不奇怪了。這些因素都被包含在簡單回歸分析的誤差中。在社會科學(xué)中,回歸方程中的過低是很正常的,對于橫截面分析來說更是如此。我們要在多元回歸分析中更一般性地討論這個(gè)問題,但在此有必要強(qiáng)調(diào),一個(gè)看似很低的值,并不意味著OLS回歸方程沒有用。式(2.39)仍然可能是y和x在其他條件不變下關(guān)系的良好估計(jì);是否正確并不直接依賴于的大小。初學(xué)計(jì)量經(jīng)濟(jì)學(xué)的學(xué)生在評價(jià)回歸方程時(shí)總是特別注意的大小?,F(xiàn)在要意識到,把作為評價(jià)計(jì)量經(jīng)濟(jì)分析成功與否的主要準(zhǔn)則可能會帶來許多麻煩。例2.9投票結(jié)果和競選支出在投票結(jié)果方程(2.28)中,。因此,競選支出比例解釋了該樣本中選舉結(jié)果變異的85%以上。這是相當(dāng)大的一個(gè)比例。2.4度量單位和函數(shù)形式在應(yīng)用經(jīng)濟(jì)學(xué)中,有兩個(gè)重要問題:(1)理解改變因變量和(或)自變量的度量單位將如何影響OLS估計(jì)值;(2)了解如何把在經(jīng)濟(jì)學(xué)中使用的總體函數(shù)形式加入到回歸分析中。改變度量單位對OLS統(tǒng)計(jì)量的影響在例2.3中,我們選擇用千美元來計(jì)算年薪,用百分?jǐn)?shù)來計(jì)算股本回報(bào)率。為了理解方程(2.39)中的估計(jì)值,明確這個(gè)例子中y和x的度量單位非常關(guān)鍵。我們還必須知道,當(dāng)因變量和自變量的度量單位變化時(shí),OLS估計(jì)值的變化完全可以預(yù)料。一般地,當(dāng)因變量的度量單位改變時(shí),我們很容易計(jì)算出截距和斜率估計(jì)值的變化。若因變量乘以一個(gè)常數(shù)c(意味著樣本中的每個(gè)數(shù)據(jù)都乘以c),則OLS截距和斜率的估計(jì)值都擴(kuò)大為原來的c倍。(這里假設(shè)自變量沒有任何變化。)問題2.4假設(shè)薪水用百美元,而不是千美元,令其為z,在z對股本回報(bào)率的回歸中截距和斜率的OLS估計(jì)值是多少?答:將方程(2.39)變?yōu)橥瑯?,可以用CEO薪水的例子來考察,當(dāng)我們改變自變量的度量單位時(shí)會發(fā)生什么情況。定義,意味著23%的股本回報(bào)率。為了集中考慮自變量度量單位的改變,保持原來因變量的度量單位(千美元)不變。當(dāng)我們將y對k回歸時(shí),便得到

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論