版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1第五章第五章 線性回歸的定式偏差線性回歸的定式偏差 2引子o 前面介紹的線性回歸分析建立在模型假設(shè)成立的基礎(chǔ)上,但這些假設(shè)并不必然成立。 o 本章討論變量關(guān)系非線性、存在異常值、規(guī)律性擾動和解釋變量缺落等,導(dǎo)致線性回歸模型前兩條假設(shè)不成立的定式偏差,包括它們對線性回歸分析的影響,判斷和處理的方法等。 3本章主要內(nèi)容o 第一節(jié) 變量關(guān)系非線性 o 第二節(jié) 異常值o 第三節(jié) 規(guī)律性擾動 o 第四節(jié) 解釋變量缺落 o 第五節(jié) 參數(shù)變化4第一節(jié)第一節(jié) 變量關(guān)系非線性變量關(guān)系非線性o 1.問題o 2.發(fā)現(xiàn)與判斷o 3.問題處理和非線性回歸 51.問題o 線性回歸模型都假設(shè)變量關(guān)系是線性隨機(jī)函數(shù)關(guān)系,或
2、者經(jīng)過特定數(shù)學(xué)變換以后是線性隨機(jī)函數(shù)關(guān)系。 o 但實(shí)際變量關(guān)系可能會存在偏差,存在用線性模型分析非線性關(guān)系的可能性。 o 把非線性變量關(guān)系當(dāng)作線性關(guān)系處理,也可以說是違反誤差項(xiàng)均值為0的假設(shè),對線性回歸分析的有效性有根本性的破壞作用。 6o 問題問題:o 原因:變量關(guān)系非線性、異常值、季節(jié)性擾原因:變量關(guān)系非線性、異常值、季節(jié)性擾動、經(jīng)濟(jì)周期、變量缺落、參數(shù)變化等。動、經(jīng)濟(jì)周期、變量缺落、參數(shù)變化等。o 后果:回歸分析、預(yù)測不再有效。無偏、有后果:回歸分析、預(yù)測不再有效。無偏、有效性都不成立,模型無價值。效性都不成立,模型無價值。 0iE7o 例如若兩個變量之間的真實(shí)關(guān)系為: o 其中 滿足
3、=0和線性回歸模型的其他假設(shè),但如果我們直接用: 進(jìn)行回歸分析,那么因?yàn)椋簅 因此: 顯然不可能始終為0。210XY)(EXY10XX12100 XXE12100)(E8o 把非線性變量關(guān)系作為線性關(guān)系進(jìn)行分析是變量關(guān)系的誤識別。o 不僅會使得回歸分析的擬合程度降低,還會對經(jīng)濟(jì)規(guī)律作出錯誤判斷,以及導(dǎo)致較大的預(yù)測偏差,屬于計(jì)量經(jīng)濟(jì)分析比較嚴(yán)重的問題。 9二、發(fā)現(xiàn)與判斷o 由于有隨機(jī)擾動因素的影響,線性回歸模型的錯誤設(shè)定并不是很容易發(fā)現(xiàn)的。 o 發(fā)現(xiàn)和判斷變量關(guān)系非線性,首先是用數(shù)理經(jīng)濟(jì)分析的方法,對模型的函數(shù)關(guān)系進(jìn)行更深入的分析。 o 其次是根據(jù)數(shù)據(jù)和及其分布圖形、散點(diǎn)圖進(jìn)行直接判斷。o 更重
4、要的方法是根據(jù)回歸殘差序列,從技術(shù)角度發(fā)現(xiàn)和判斷異常值問題。10o 回歸殘差序列根據(jù)被解釋變量的實(shí)際值和回歸理論值之差計(jì)算。 o 在EViews軟件進(jìn)行回歸分析時,可以在得到回歸結(jié)果后在回歸結(jié)果窗口點(diǎn)擊View/Actual,F(xiàn)itted,Residual/ Actual,fitted,residual table,直接得到回歸殘差序列和殘差序列圖。o 如果模型存在變量關(guān)系非線性問題,回歸殘差序列會表現(xiàn)出有規(guī)律的變化。 11o 例如當(dāng)發(fā)現(xiàn)模型的回歸殘差序列有圖5.1所示的規(guī)律性變化,就應(yīng)該考慮存在把非線性關(guān)系(二次函數(shù)等)當(dāng)作線性關(guān)系進(jìn)行回歸的問題,必須進(jìn)行處理。 圖圖5.1 非線性變量關(guān)系的
5、殘差序列非線性變量關(guān)系的殘差序列 ei12o 用回歸殘差序列判斷變量關(guān)系非線性的最大問題是,線性回歸模型的其他某些一些問題,如參數(shù)(結(jié)構(gòu))改變等,與變量關(guān)系非線性的表現(xiàn)形式常常很相似,不容易正確區(qū)分。 o 因此必須結(jié)合問題背景分析、相關(guān)理論和經(jīng)驗(yàn)進(jìn)行綜合判斷,然后再通過處理和結(jié)果的反復(fù)比較加以確定。 13三、問題處理和非線性回歸 o 解決錯誤的第一步,是恢復(fù)變量之間的真實(shí)函數(shù)關(guān)系。o 然后再設(shè)法通過冪函數(shù)、對數(shù)化等數(shù)學(xué)變換等,把非線性關(guān)系轉(zhuǎn)化為正確的線性回歸模型。 o 如果變量關(guān)系可以用初等數(shù)學(xué)變化轉(zhuǎn)化為線性模型,那么只要在轉(zhuǎn)化后再進(jìn)行線性回歸分析就可以了。 14o 但也有不少非線性變量關(guān)系無
6、法通過初等數(shù)學(xué)變換轉(zhuǎn)化為線性模型。例如Y和X之間有兩變量關(guān)系如下:o 其中 、 、 是未知參數(shù),這個函數(shù)就無法通過初等數(shù)學(xué)變換轉(zhuǎn)化為線性模型。o 這時候就需要直接處理非線性回歸模型。非線性回歸分析是線性回歸分析的自然擴(kuò)展。 XeY15o 我們假設(shè)非線性函數(shù)關(guān)系為:o 其中 是K個解釋變量, 是模型的P個參數(shù), 為多元非線性函數(shù),且對 是連續(xù)可微的。o 對于這種非線性回歸模型,解決的方法之一是利用級數(shù)展開方法作非線性函數(shù)的近似線性函數(shù),把模型強(qiáng)制性化為線性模型。 PKXXfY,;,11KXX,1P,1fP,116o 泰勒級數(shù)展開先要取一組參數(shù)的初始值:o 然后將上述非線性函數(shù)在該點(diǎn)處對 作泰勒級
7、數(shù)展開,并只取其中的線性項(xiàng)而忽略所有高次項(xiàng),得到: 010,PbbP,11001001100110,10,;PPKPbbPPbbPfYfXXbbbfb17o 其中 為原變量關(guān)系中的誤差項(xiàng) 與泰勒級數(shù)展開的高階項(xiàng)之和。 o 整理上述展開式,移項(xiàng)合并可化為:10010011000,11,;PPKPPPiibbbbiiiiYfXXbbffb18o 若令:o 我們得到:o 這是一個 對 的線性回歸模型,可以用最小二乘法估計(jì)其中參數(shù) 的估計(jì)值,我們記為 PiibbiPKbfbbXXfYMP10,0101010;,010,PbbiifZPPZZZM2211MPZZ,1P,1111,Pbb 19o 經(jīng)過泰勒
8、級數(shù)展開得到的線性模型只是原變量關(guān)系的近似,雖然可以把 作為原模型參數(shù)的估計(jì),但效果可能沒有保證。 o 由于 和參數(shù)真實(shí)值的近似程度越高,級數(shù)展開忽略的高階項(xiàng)越不重要,因此提高級數(shù)展開初始值與參數(shù)真實(shí)值的近似程度有利于提高上述間接估計(jì)的精度。o 提高近似程度的方法是,把前一次回歸得到的估計(jì)值作為新的級數(shù)展開初始值,再進(jìn)行新的級數(shù)展開。然后再作變換和線性回歸,得到另一組參數(shù)估計(jì)值。 111,Pbb 010,Pbb20o 這個程序可以反復(fù)進(jìn)行,直到參數(shù)估計(jì)值收斂或不再有大的變化。 o 最后得到的 就是非線性回歸模型的參數(shù)估計(jì)值。o 除了上述泰勒級數(shù)展開線性化近似的迭代方法以外,還可以直接進(jìn)行非線性
9、回歸分析。 o 不過由計(jì)量軟件進(jìn)行非線性回歸的迭代優(yōu)化分析就不存在這方面的困難,只要直接輸入相關(guān)命令即可。 Pjjbb,121例51某地消費(fèi)函數(shù)相關(guān)數(shù)據(jù)年度 Y C 年度 Y C 年度 Y C1950 791.8 733.2 1962 1170.2 1069.0 1974 1896.6 1674.01951 819.0 748.7 1963 1207.3 1108.4 1975 1931.7 1711.91952 844.3 771.4 1964 1291.0 1170.6 1976 2001.0 1803.91953 880.0 802.5 1965 1365.7 1236.4 1977 2
10、066.6 1883.81954 894.0 822.7 1966 1431.3 1298.9 1978 2167.4 1961.01955 944.5 873.8 1967 1493.2 1337.7 1979 2212.6 2004.41956 989.4 899.8 1968 1551.3 1405.9 1980 2214.3 2000.41957 1012.1 919.7 1969 1599.8 1456.7 1981 2248.6 2024.21958 1028.8 932.9 1970 1688.1 1492.0 1982 2261.5 2050.71959 1067.2 979.
11、4 1971 1728.4 1538.8 1983 2334.6 2145.91960 1091.1 1005.1 1972 1797.4 1621.9 1984 2468.4 2239.91961 1123.2 1025.2 1973 1916.3 1689.6 1985 2509.0 2312.622o 為了選擇進(jìn)行回歸分析的模型,可以用EViews軟件作兩個變量的散點(diǎn)圖。 o 建立工作文件和輸入收據(jù)后,用Graph命令或菜單操作可得到兩個變量的如下散點(diǎn)圖: 23圖5.2 某地收入對消費(fèi)的散點(diǎn)圖 500100015002000250030005001000150020002500CCYY
12、vs. CC24o 根據(jù)對上述散點(diǎn)圖的直觀判斷,對消費(fèi)和收入進(jìn)行線性回歸分析基本上是合理的。o 但是,如果我們進(jìn)一步通過該回歸結(jié)果窗口的菜單操作得到下列殘差序列圖,如圖5.3,可以發(fā)現(xiàn)該回歸殘差序列顯示出明顯的規(guī)律性變化,包含了明顯的趨勢性。25圖5.3 某地消費(fèi)函數(shù)回歸殘差序列圖 -60-40-2002040605055606570758085CC Residuals26操作演示操作演示27第二節(jié)第二節(jié) 異常值異常值o 1.問題o 2.異常值的發(fā)現(xiàn)判斷o 3.問題的處理281.問題o 現(xiàn)實(shí)經(jīng)濟(jì)中常常存在這樣的情況,一些突發(fā)事件或變化對經(jīng)濟(jì)活動、經(jīng)濟(jì)關(guān)系造成短暫的,但卻是很顯著的沖擊影響。o
13、這些影響既不能被看作微小的隨機(jī)擾動,但又不會決定或改變長期的經(jīng)濟(jì)關(guān)系,或者說經(jīng)濟(jì)規(guī)律。 o 這種情況在經(jīng)濟(jì)數(shù)據(jù)上反映出來,就會表現(xiàn)為一個脫離基本趨勢的異常值。 29o 如果所研究的經(jīng)濟(jì)問題或相關(guān)數(shù)據(jù)中存在這種情況,建立線性回歸模型時又沒有預(yù)先處理或剔除這種影響,就會表現(xiàn)為模型誤差項(xiàng)在相應(yīng)時點(diǎn)存在均值非0的問題。 o 例如變量Y 和X 在長期中的關(guān)系基本滿足線性回歸模型的各個假設(shè),但在時刻 有一個突發(fā)情況,使得Y 出現(xiàn)一個C 單位的暫時性波動。那么如果用線性回歸模型: 分析這兩個變量的關(guān)系,其誤差項(xiàng)的均值是: XY30o 顯然不是 對任意i 都成立,也就是模型的假設(shè)(2)是不成立的。o 這種情況
14、如果不作處理,線性回歸分析的有效性也會受到不利影響。o 異常值會使回歸分析結(jié)果出現(xiàn)較大偏差,參數(shù)估計(jì)量的性質(zhì)和相關(guān)統(tǒng)計(jì)推斷都會失效。 000)(iiCiiEi當(dāng)當(dāng)0)(iE312.異常值的發(fā)現(xiàn)判斷o 發(fā)現(xiàn)和判斷異常值的方法之一是分析經(jīng)濟(jì)問題的相關(guān)背景情況,包括對經(jīng)濟(jì)現(xiàn)象、相關(guān)社會經(jīng)濟(jì)事件以及數(shù)據(jù)序列直接分析等。o 殘差序列分析也是從技術(shù)角度發(fā)現(xiàn)和判斷異常值問題的基本方法。o 因?yàn)楫惓V抵皇莻€別情況,最小二乘估計(jì)仍然是一致估計(jì)量,回歸殘差中會包含由于異常值所導(dǎo)致模型誤差項(xiàng)均值非0的信息。 32o 在模型假設(shè)成立的前提下,回歸殘差是服從正態(tài)分布的隨機(jī)變量,其取值95%左右的概率應(yīng)分布在均值加減2倍
15、標(biāo)準(zhǔn)差的范圍內(nèi)。 o 如果發(fā)現(xiàn)某個殘差 出現(xiàn): 其中 是殘差的標(biāo)準(zhǔn)差,模型在時點(diǎn)i處就很可能存在異常值問題。 ie2Sei122KneSSii回歸殘差序列分析發(fā)現(xiàn)和判斷異常值問題的方法 33o 上述回歸殘差序列分析等價于下列殘差序列圖分析。o 把根據(jù)回歸殘差序列和殘差標(biāo)準(zhǔn)差計(jì)算出的 /S數(shù)據(jù)序列,描繪到以i為橫軸,以 /S為縱軸的坐標(biāo)平面上,再在縱軸的 處畫上兩條水平的臨界線。o 以誤差序列中是否有點(diǎn)落在兩條臨界線范圍之外作為判斷異常值的初步標(biāo)準(zhǔn)。 iee234圖5.4 異常值的殘差序列圖檢驗(yàn)i2235o 用EViews軟件進(jìn)行回歸分析可以直接輸出殘差序列圖,并且在圖形中包括有兩倍標(biāo)準(zhǔn)差的臨界
16、值,因此可以直接根據(jù)EViews輸出的殘差序列圖判斷是否有異常值的可能性。o 如果有個別 /S坐標(biāo)落在兩條臨界線的范圍以外,就意味著在i 時點(diǎn)上有異常值。 o 當(dāng)然,如果落在臨界線以外的點(diǎn)有多個,那么一方面可以考慮存在多個異常值的可能性,另外也應(yīng)該懷疑存在其他系統(tǒng)性偏差。 ie36o 存在多個較大殘差不能簡單地認(rèn)為是多個異常值,而是應(yīng)該作進(jìn)一步的深入分析,結(jié)合對其他問題的分析進(jìn)行判斷。 o 此外,上述殘差序列判斷異常值的臨界值標(biāo)準(zhǔn)是95%置信度的,當(dāng) /S的絕對值落在2到3之間時,用95%的置信度判斷有異常值,而用99%的置信度判斷則可能沒有異常值,因此仍然存在模糊的地方。o 這時候必須與問題
17、背景分析結(jié)合起來考慮,并考慮各點(diǎn)殘差相對情況等。ie373.問題的處理o 如果判斷模型存在異常值問題,必須作針對性的處理。 o 例如一個兩變量線性回歸模型 ,在 處存在異常值問題: o 解決的方法是引進(jìn)一個針對性的虛擬變量D,其定義式為: XY0ii 000)(iiCiiEi當(dāng)當(dāng)38o 把這個虛擬變量引進(jìn)原來的模型,得到一個新的回歸模型 , 因此o 在引進(jìn)虛擬變量D的新模型中,異常值就不會造成模型誤差項(xiàng)出現(xiàn)均值非0的問題了,從而可以保證回歸分析的有效性。 0010iiiiDi當(dāng)當(dāng)CDXYCD0001000)() (iiCCiiCDEEii39例例5-2 消費(fèi)函數(shù)模型的異常值問題 -600-40
18、0-20002004006008284868890929496980002Y Residuals圖圖5.5 消費(fèi)函數(shù)殘差序列圖消費(fèi)函數(shù)殘差序列圖 40o 根據(jù)圖中的殘差分布可以看出,1996、2001和2002年的回歸殘差絕對值,都大于2倍的殘差標(biāo)準(zhǔn)差,因此可能屬于異常值。o 由于相比之下1996、1999、2000和2001四年的殘差偏離更大,而在去掉這幾年趨勢以后的其余年份基本上都在長期趨勢上,因此考慮引進(jìn)四個虛擬變量。 4142圖圖5.6 引進(jìn)虛擬變量后的回歸殘差引進(jìn)虛擬變量后的回歸殘差 -150-100-500501001508284868890929496980002Y Residu
19、als43o 再看引進(jìn)虛擬變量后回歸的下列殘差序列圖,則現(xiàn)在是有多點(diǎn)而不是個別點(diǎn)在2倍標(biāo)準(zhǔn)差臨界值之外,而且都離臨界值不遠(yuǎn),并且2倍標(biāo)準(zhǔn)差的臨界值范圍也比未引進(jìn)虛擬變量時小了許多,因此可不再認(rèn)為存在異常值。?操作演示操作演示44第三節(jié)第三節(jié) 規(guī)律性擾動規(guī)律性擾動1.問題2.問題的發(fā)現(xiàn)和判斷3.問題的處理451.問題o 周期性或其他規(guī)律性擾動,也會使線性回歸模型的誤差項(xiàng)偏離零均值假設(shè)。 o 周期性擾動比較典型的例子是商業(yè)銷量指標(biāo)的季節(jié)性變化。 o 這些問題并不影響變量關(guān)系的總體趨勢,但都會對變量關(guān)系產(chǎn)生規(guī)律性的影響,如果不預(yù)先加以處理或排除掉,就會導(dǎo)致誤差項(xiàng)均值非0問題的出現(xiàn),影響回歸分析的效果
20、。 46o 例如變量Y 的季度數(shù)據(jù)中,第一季度總是受到一個季節(jié)性因素的影響。 o 如果我們忽視這種影響,用兩變量模型或多元模型研究Y 規(guī)律,就會遇到誤差項(xiàng)均值非0問題 第一季度第一季度iCiEi0)(472.問題的發(fā)現(xiàn)與判斷o 由規(guī)律性擾動導(dǎo)致的誤差項(xiàng)均值非零問題的發(fā)現(xiàn)、判斷和處理,與異常值問題基本相似。 o 在發(fā)現(xiàn)和判斷方面,經(jīng)濟(jì)問題的背景分析,以及同樣的回歸殘差序列分析,基本上都可以適用于規(guī)律性擾動問題。 o 規(guī)律性擾動在殘差序列圖上會表現(xiàn)為多個有規(guī)律的較大殘差,可以通過與問題背景的相互印證和分析,確定是否屬于規(guī)律性擾動。 483.問題的處理o 解決規(guī)律性擾動問題的方法之一是對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)
21、平滑處理,消除季節(jié)性或其他周期性擾動的影響。 o 但平滑處理存在兩個問題,一是不能區(qū)別趨勢因素和季節(jié)性擾動,不能真正確定所研究變量關(guān)系的具體變化軌跡,二是容易導(dǎo)致另一種問題,就是誤差序列自相關(guān)問題(以后會介紹)。 o 因此平滑處理并不是克服規(guī)律性擾動對線性回歸分析影響的好方法。49o 處理規(guī)律性擾動問題的較好方法也是引進(jìn)虛擬變量,但有時需要引進(jìn)多個虛擬變量。 o 以上面第一季度存在季節(jié)性因素影響的問題為例。如果在這個例子中,使用虛擬變量第一季度當(dāng)?shù)谝患径犬?dāng)iiDi1050o 把模型改為 或 Yo 那么新模型就不再存在誤差項(xiàng)均值非0的問題,回歸分析的效果就能得到保證。o 如果第一季度受到一種季節(jié)
22、性因素?cái)_動,第三季度受到另一種方向和力度不同因素的擾動。那么可以引進(jìn)兩個虛擬變量 CDXYCDXXKK110第一季度第一季度iiDi101第三季度第三季度iiDi10351o 把這兩個虛擬變量同時引入模型,模型變?yōu)?或 Yo 新模型同樣可以避免由于上述季節(jié)性擾動所導(dǎo)致的誤差項(xiàng)均值非0問題。o 在對截面數(shù)據(jù)的計(jì)量經(jīng)濟(jì)分析中,觀測對象特征差異導(dǎo)致的規(guī)律性擾動,也可以利用虛擬變量加以處理。 3311DCDCXY3311110DCDCXXKK52o 利用虛擬變量解決規(guī)律性擾動需要注意的是,引進(jìn)虛擬變量是有限度的,需要謹(jǐn)慎,不能隨意引進(jìn)。 o 因?yàn)橐M(jìn)更多虛擬變量意味著要估計(jì)更多參數(shù)和損失自由度,對回歸
23、分析的效果有不利影響。 o 此外引進(jìn)虛擬變量還可能落入“虛擬變量陷阱”。 53o 例如如果上述季節(jié)性擾動模型中同時引進(jìn)對應(yīng)全部四個季節(jié)的,按照類似規(guī)則定義的四個虛擬變量為 、 、 和 ,那么這四個虛擬變量滿足相加和為1。o 同時出現(xiàn)在一個模型中必然導(dǎo)致解釋變量嚴(yán)格線性相關(guān),導(dǎo)致模型的崩潰。o 因此在計(jì)量經(jīng)濟(jì)分析中引進(jìn)虛擬變量時需要謹(jǐn)慎,要注意避免虛擬變量陷阱。 1D2D3D4D54o 例例1 1:變量:變量Y Y的季度數(shù)據(jù)中,第一季度總的季度數(shù)據(jù)中,第一季度總會受到一個季節(jié)性因素的影響。會受到一個季節(jié)性因素的影響。 使用虛擬變量:使用虛擬變量: 第一季度第一季度iCiEi0第一季度當(dāng)?shù)谝患径犬?dāng)
24、iiDi1055o 例例2 2:一年中的第一季度會受到一種季:一年中的第一季度會受到一種季節(jié)性擾動,第三季度也會受到一種方向節(jié)性擾動,第三季度也會受到一種方向和力度與第一季度不同的擾動。和力度與第一季度不同的擾動。 引入兩個虛擬變量引入兩個虛擬變量:第一季度第一季度iiDi101第三季度第三季度iiDi10356o 例例3 3:用截面數(shù)據(jù)研究收入或消費(fèi)規(guī)律時,:用截面數(shù)據(jù)研究收入或消費(fèi)規(guī)律時,觀測對象的性別也是一個影響因素。觀測對象的性別也是一個影響因素。 引入一個虛擬變量引入一個虛擬變量:10iiDi當(dāng) 是男性時當(dāng) 是女性時57 一個因素多個類型一個因素多個類型 對于一個有對于一個有m m個
25、不同屬性的定性因素,應(yīng)該設(shè)個不同屬性的定性因素,應(yīng)該設(shè)置置m-1m-1個虛擬變量來反映該因素的影響。個虛擬變量來反映該因素的影響。 例如,設(shè)公司職員的年薪與工齡和學(xué)歷有關(guān)。例如,設(shè)公司職員的年薪與工齡和學(xué)歷有關(guān)。學(xué)歷分成三種:大專以下、本科、研究生。為反學(xué)歷分成三種:大專以下、本科、研究生。為反映映“學(xué)歷學(xué)歷” ” 的影響,應(yīng)該設(shè)置兩個虛擬變量:的影響,應(yīng)該設(shè)置兩個虛擬變量: 011D本科本科其他其他012D研究生研究生其他其他虛擬變量的設(shè)置原則 Y Yi i=a+bx=a+bxi i+i i 大專以下大專以下(D(D1 1=D=D2 2=0)=0) Y Yi i=(a+=(a+1 1)+ b
26、x)+ bxi i+i i 本科本科(D(D1 1=1=1,D D2 2=0)=0) Y Yi i=(a+=(a+2 2)+ bx)+ bxi i+i i 研究生研究生(D(D1 1=0=0,D D2 2=1)=1)而將年薪模型取成(假設(shè)以加法方式引入):而將年薪模型取成(假設(shè)以加法方式引入): Y Yi i=a+bx=a+bxi i+1 1D D1i1i+2 2D D2i 2i +i i 其等價于:其等價于:三類年薪函數(shù)的差異情況如下圖所示:三類年薪函數(shù)的差異情況如下圖所示:大專以下大專以下本科本科研究生研究生工齡工齡年薪年薪2-11611 1、定義:、定義: 反映品質(zhì)指標(biāo)變化、數(shù)值通常只取
27、反映品質(zhì)指標(biāo)變化、數(shù)值通常只取0 0和和1 1的人工變的人工變量。用符號量。用符號D D來表示。來表示。 如:01D城鎮(zhèn)居民城鎮(zhèn)居民農(nóng)村居民農(nóng)村居民01D銷售旺季銷售旺季銷售淡季銷售淡季01D政策緊縮政策緊縮政策寬松政策寬松01D本科以上學(xué)歷本科以上學(xué)歷本科以下學(xué)歷本科以下學(xué)歷變量的劃分應(yīng)遵循變量的劃分應(yīng)遵循窮舉窮舉與與互斥互斥原則。原則。一、虛擬變量及其作用622 2、作用、作用:可以描述和測量定性因素的影響??梢悦枋龊蜏y量定性因素的影響。 能夠正確反映經(jīng)濟(jì)變量之間的相互關(guān)系,提高模能夠正確反映經(jīng)濟(jì)變量之間的相互關(guān)系,提高模型的精度。型的精度。便于處理異常數(shù)據(jù)。便于處理異常數(shù)據(jù)。 即將異常數(shù)
28、據(jù)作為一個特殊的定性因素即將異常數(shù)據(jù)作為一個特殊的定性因素1 1虛擬變量的引入方式虛擬變量的引入方式 。 (1 1)加法方式)加法方式 Y Yi i=a+bx=a+bxi i+D+Di i+i i 等價為:等價為:當(dāng)當(dāng)D Di i =0 =0時:時:Y Yi i=a+bx=a+bxi i+i i 當(dāng)當(dāng)D Di i =1 =1時:時:Y Yi i=(a+)+bx=(a+)+bxi i+i iD=0D=1aa+a+以加法方式引入,反映定性因素對截距的影響以加法方式引入,反映定性因素對截距的影響 二、二、虛擬變量的設(shè)定虛擬變量的設(shè)定64(2 2)乘法方式)乘法方式 Y Yi i=a+bx=a+bxi
29、 i+XD+XDi i+i i其中:其中:XDXDi i=X=Xi i* *D Di i,上式等價于:上式等價于:當(dāng)當(dāng)D Di i =0 =0時:時:Y Yi i=a+bx=a+bxi i+i i 當(dāng)當(dāng)D Di i =1 =1時:時:Y Yi i=a+(b+)x=a+(b+)xi i+i iD=0D=1a 以乘法方式引入,可反映定性因素對斜率的影以乘法方式引入,可反映定性因素對斜率的影響,系數(shù)響,系數(shù)描述了定性因素的影響程度。描述了定性因素的影響程度。65(3 3)加法和乘法綜合的方式)加法和乘法綜合的方式 三、虛擬變量的特殊應(yīng)用 1 1、調(diào)整季節(jié)波動、調(diào)整季節(jié)波動 例如,用季度數(shù)據(jù)分析某公司
30、利潤例如,用季度數(shù)據(jù)分析某公司利潤y y與銷售與銷售收入收入x x之間的相互關(guān)系時,為研究四個季度的季之間的相互關(guān)系時,為研究四個季度的季節(jié)性影響,引入三個虛擬變量(設(shè)第節(jié)性影響,引入三個虛擬變量(設(shè)第1 1季度為基季度為基礎(chǔ)類型):礎(chǔ)類型): 利潤函數(shù)可取為利潤函數(shù)可取為 : Y Yi i=a+bx=a+bxi i+ + 1 1D D1i1i+ + 2 2D D2i 2i + + 3 3D D3i 3i + + i i01iD第第i+1i+1季度季度 i=1,2,3i=1,2,3其他季度其他季度67時間TRPFD1D2D32000,10002000,21002000,30102000,400
31、12001,10002001,21002001,30102001,400168第四節(jié)第四節(jié) 解釋變量缺落解釋變量缺落o 1.問題o 2.發(fā)現(xiàn)與判斷69遺漏變量的后果如果遺漏了一個應(yīng)該加入的變量呢?o OLS通常會是有偏的o 但是參數(shù)估計(jì)量的方差變小遺漏的一個原因:不得不遺漏wage = 0 + 1educ + 2abil + u能力不可觀測,估計(jì)模型wage = 0 + 1educ + v70更一般的情況更一般的情況ykey關(guān)鍵變量關(guān)鍵變量其它變量其它變量遺漏變量遺漏變量omit我們忽略所有其它變量推導(dǎo)關(guān)鍵變量的偏誤方向。我們忽略所有其它變量推導(dǎo)關(guān)鍵變量的偏誤方向。71 練習(xí)練習(xí)例例3.3中,
32、如省略變量中,如省略變量age,mrate系數(shù)是否有顯著系數(shù)是否有顯著變化?為什么?變化?為什么?.01180 125 520 234=?pratemrateagepratemrate72 練習(xí)練習(xí)答案:答案:變化不太大,因?yàn)殡m然遺漏的變化不太大,因?yàn)殡m然遺漏的age是個重要變量,是個重要變量,但是但是age和和mrate的樣本相關(guān)性很小的樣本相關(guān)性很小1=5.86731.問題o 除了異常值和規(guī)律性擾動以外,還有一些定式偏差,如解釋變量缺落和參數(shù)改變,也是引起誤差項(xiàng)均值非0問題的常見原因。 o 所謂解釋變量缺落就是線性回歸模型設(shè)定的變量關(guān)系中,忽略了某些具有重要的,對被解釋變量有趨勢性影響的因
33、素。o 解釋變量缺落會引起誤差項(xiàng)均值非0很容易理解,因?yàn)楸缓雎缘囊蛩貙Ρ唤忉屪兞康挠绊?,會在誤差項(xiàng)中表現(xiàn)出來,導(dǎo)致誤差項(xiàng)不再是純粹的隨機(jī)擾動。 74o 例如若真實(shí)變量關(guān)系應(yīng)該為 其中 滿足 及多元線性回歸模型的其他假設(shè)。o 如果建模時忽略了其中的變量 ,即采用變量關(guān)系 那么其中的誤差項(xiàng) 3322110XXXY0)(E3X22110XXY 3322211100XXX75o 滿足o 由于 、 和 之間不存在線性關(guān)系, 不可能始終等于0。o 因此缺落重要解釋變量的線性回歸模型,必然違反誤差項(xiàng)0均值的假設(shè)。 3322211100)(XXXE1X2X3X)(E762.發(fā)現(xiàn)與判斷o 發(fā)現(xiàn)和判斷解釋變量缺落
34、或模型參數(shù)改變的基本方法,也是經(jīng)濟(jì)問題背景分析和殘差序列分析相結(jié)合。 o 在原模型回歸分析的基礎(chǔ)上對回歸殘差序列進(jìn)行分析,如果發(fā)現(xiàn)殘差序列有某種趨勢性,那么可以根據(jù)問題背景考慮是否忽略了有重要性的因素。 77o 若以懷疑缺落的變量 為橫軸,殘差e為縱軸,作殘差序列分布圖。如發(fā)現(xiàn) 和e 確實(shí)有相關(guān)性,如圖所示,可初步認(rèn)為模型缺落了 。 0X0X0Xe0X78o 解釋變量缺落和模型參數(shù)改變問題的處理方法比較簡單,因?yàn)獒槍π缘丶尤胨甭涞淖兞?,或根?jù)參數(shù)改變的時間分不同時期段進(jìn)行分段回歸,就可以解決這些問題。 79第五節(jié)第五節(jié) 參數(shù)變化參數(shù)變化o 1. 問題o 2. 發(fā)現(xiàn)和判斷o 3.處理801.
35、問題o 參數(shù)改變指在考察期間(樣本數(shù)據(jù)觀測范圍),變量關(guān)系中的參數(shù)發(fā)生變化,就是變量關(guān)系本身發(fā)生變化。 o 這時實(shí)際上不能用同一個線性回歸模型研究變量在整個考察期間的關(guān)系。 o 如果忽略這種模型參數(shù)變化,也會導(dǎo)致誤差項(xiàng)均值非0問題。 81o 以兩變量線性關(guān)系在考察期0,T 中的t時刻參數(shù)發(fā)生變化為例。 o 真實(shí)的變量關(guān)系可以用0,t 和(t,T)兩個時期中的兩個模型分別表示o 其中 和 都滿足均值為0和線性回歸模型的其他假設(shè),且 , 。 11110XY22120XY122010211182o 如果忽略了模型參數(shù)的上述變化,簡單地用同一變量關(guān)系 ,代表Y和X在整個0,T時期的關(guān)系,那么因?yàn)樵趦蓚€時期中模型的誤差項(xiàng) 分別為:o 因此兩個時期誤差項(xiàng)的均值分別為 XY10 1111010X 2121020X XE111010)( 200211( )EX83o 很顯然,除非 和 同時成立,否則的均值不可能在兩個時期都始終為0。 o 如果兩個等式同時成立,就意味著兩個時期參數(shù)沒有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年沙地生態(tài)保護(hù)與可持續(xù)發(fā)展承包合同3篇
- 2025年度戶外廣告牌使用權(quán)及維護(hù)合同4篇
- 二零二五版杭州二手房買賣合同產(chǎn)權(quán)變更與登記服務(wù)協(xié)議3篇
- 2025年度光伏發(fā)電項(xiàng)目個人工勞務(wù)分包合同2篇
- 2025年度苗木種植保險合同匯編3篇
- 二零二五年度廚房設(shè)備安裝與智能化節(jié)能改造合同4篇
- 二零二五年度地產(chǎn)樣板間軟裝設(shè)計(jì)定制合同3篇
- 2025年拋光技術(shù)成果轉(zhuǎn)化與應(yīng)用合同4篇
- 二零二五年度包裝印刷生產(chǎn)經(jīng)理招聘合同書4篇
- 二零二五年度出租車司機(jī)合同履行監(jiān)督聘用協(xié)議3篇
- 墓地銷售計(jì)劃及方案設(shè)計(jì)書
- 從偏差行為到卓越一生3.0版
- 優(yōu)佳學(xué)案七年級上冊歷史
- 鋁箔行業(yè)海外分析
- 紀(jì)委辦案安全培訓(xùn)課件
- 超市連鎖行業(yè)招商策劃
- 醫(yī)藥高等數(shù)學(xué)智慧樹知到課后章節(jié)答案2023年下浙江中醫(yī)藥大學(xué)
- 城市道路智慧路燈項(xiàng)目 投標(biāo)方案(技術(shù)標(biāo))
- 【公司利潤質(zhì)量研究國內(nèi)外文獻(xiàn)綜述3400字】
- 工行全國地區(qū)碼
- 新疆2022年中考物理試卷及答案
評論
0/150
提交評論