多元線性回歸模型_第1頁(yè)
多元線性回歸模型_第2頁(yè)
多元線性回歸模型_第3頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章多元線性回歸模型在一元線性回歸模型中,解釋變量只有一個(gè)。但在實(shí)際問(wèn)題中,影響因變量 的變量可能不止一個(gè),比如根據(jù)經(jīng)濟(jì)學(xué)理論,人們對(duì)某種商品的需求不僅受該商 品市場(chǎng)價(jià)格的影響,而且受其它商品價(jià)格以及人們可支配收入水平的制約;影響勞動(dòng)力勞動(dòng)供給意愿(用勞動(dòng)參與率度量)的因素不僅包括經(jīng)濟(jì)形勢(shì)(用失業(yè)率 度量),而且包括勞動(dòng)實(shí)際工資;根據(jù)凱恩斯的流動(dòng)性偏好理論,影響人們貨幣 需求的因素不僅包括人們的收入水平,而且包括利率水平等。當(dāng)解釋變量的個(gè)數(shù)由一個(gè)擴(kuò)展到兩個(gè)或兩個(gè)以上時(shí),一元線性回歸模型就擴(kuò)展為多元線性回歸模 型。本章在理論分析中以二元線性回歸模型為例進(jìn)行。一、預(yù)備知識(shí)(一)相關(guān)概念對(duì)于一個(gè)三

2、變量總體,若由基礎(chǔ)理論,變量x1, x2和變量y之間存在因果關(guān)系,或xX2的變異可用來(lái)解釋y的變異。為檢驗(yàn)變量Xi,X2和變量y之間因果關(guān) 系是否存在、度量變量Xi,X2對(duì)變量y影響的強(qiáng)弱與顯著性、以及利用解釋變量 Xi,X2去預(yù)測(cè)因變量y,引入多元回歸分析這一工具。將給定Xii, X2i條件下y的均值E(yi | Xii , X2i ) = 一0 Xii -2X2i( 4.1)定義為總體回歸函數(shù)(Population Regression Function,PRF )。定義 yi -E(yi |Xii,X2i)為誤差項(xiàng)(error term ),記為,即 * = yi - E( yi | 刈

3、,x?i), 這樣yi =EW |旳卞劑,或y= <01刈 :2X2ii(4.2)(4.2)式稱為總體回歸模型或者隨機(jī)總體回歸函數(shù)。其中,X1,X2稱為解釋 變量(explanatory variable ) 或自變量(independent variable ); y 稱為被 解釋變量(explained variable )或因變量(dependent variable );誤差項(xiàng)二解 釋了因變量的變動(dòng)中不能完全被自變量所解釋的部分。在總體回歸模型(4.2 )中參數(shù)r12是未知的,叫是不可觀察的,統(tǒng)計(jì) 計(jì)量分析的目標(biāo)之一就是估計(jì)模型的未知參數(shù)。給定一組隨機(jī)樣本 (yi , X1i ,

4、 X2i ), i = 1,2, , n,對(duì)(4.1 )式進(jìn)行估計(jì),若 E( yi | x1i , x2i ), ' 0, ' 1, ' 2 的估AAAA計(jì)量分別記為yioi2,則定義(4.3 )式為樣本回歸函數(shù)AAAAyi 八01 Xii:2X2i( i = 1,2/ ,n)( 4.3 )AAA注意,樣本回歸函數(shù)隨著樣本的不同而不同,也就是說(shuō)。,匚匕是隨機(jī)變量,它們的隨機(jī)性是由于yi的隨機(jī)性(同一組(Xii,X2i)可能對(duì)應(yīng)不同的yj、Xi,X2各自的變異、以及x1, x2之間的相關(guān)性共同引起的。定義yy為殘差項(xiàng)(residualAAterm),記為 e ,即 e =

5、 yi - yi,這樣 yi = yi + e,或AAyi1 人 y( i =1,2, ,n)(4.4)(4.4)式稱為樣本回歸模型或者隨機(jī)樣本回歸函數(shù)。樣本回歸模型中殘差項(xiàng)e可 視為總體回歸模型中誤差項(xiàng) 叫的估計(jì)量。(二)多元線性回歸模型的矩陣表示多元線性回歸模型的參數(shù)估計(jì)比一元線性回歸模型要復(fù)雜得多, 為了便于計(jì) 算和分析,便于將結(jié)果由三變量總體推廣到一般的多變量總體, 引入矩陣這一工 具簡(jiǎn)化計(jì)算和分析。設(shè)(yi,Xii,X2i),i =12,n是取自總體的一組隨機(jī)樣本。在該組樣本下,總體 回歸模型(4.2 )式可以寫(xiě)成方程組的形式y(tǒng)i = - 0 - 1X11- 2X21 川-1y2 =

6、 一 0 一 1X12- 2X22 川-2yn = 必仆2X2n利用矩陣運(yùn)算,可表示為yjy21JnY11xn目2_1X12aaaAn 一JXmX11X21X2nR ,X21X22X2n(4.5)2則在該組樣本下,總體回歸模型的矩陣表示為(4.6)e/le2e =_en則樣本回歸模型的矩陣表示為(4.7)y 二 X : e(三)模型假定假定1回歸模型是參數(shù)線性的,并且是設(shè)定正確的 假定2隨機(jī)誤差項(xiàng)與解釋變量不相關(guān)。即cov(Xji,叫)=0 , j =1,2。如果解釋變量是非隨機(jī)的,則該假設(shè)自動(dòng)滿足。 假定3零均值假定。即E(叫)=0, i =1,2, n假定4同方差假定。即var(叫)2,i

7、 =1,2, ,n假定5無(wú)自相關(guān)假定。即兩個(gè)誤差項(xiàng)之間不相關(guān)cov( 曲)=0 i = j,i =1,2廠,n,j =1,2,n假定6解釋變量X1與X2之間不存在完全共線性,即兩個(gè)解釋變量之間無(wú)確切的 的線性關(guān)系。假定7正態(tài)性假定。即2叫N(0,匚),i =1,2, ,n(四) 參數(shù)估計(jì)與估計(jì)量的分布 系數(shù)向量:的OLS估計(jì)為A一 (XTX)XTy(4.8 )其中,xt為X的轉(zhuǎn)置矩陣。在隨機(jī)誤差項(xiàng)服從正態(tài)分布的假定下,系數(shù)向量的 估計(jì)量也服從正態(tài)分布,即A1 N( 1 ,;2(XTX)(4.9 )記C =(XTX)J的第j個(gè)主對(duì)角元素為Cjj,貝UAj N( j;2Cjj)(4.10 )有了系

8、數(shù)估計(jì)量的分布,就可以對(duì)總體參數(shù)做假設(shè)檢驗(yàn)。與雙變量總體相同,A總體誤差7是不可觀察的,因而其方差二2是未知的。若用二2的無(wú)偏估計(jì)量二2代 替二2,則OLS估計(jì)量服從自由度為n-3的t分布,而不是正態(tài)分布,即At(n -3)(4.11 )se( : j)2 其中,se(:j)=2 Cjj,匚2:。n-3(五) 預(yù)測(cè)原理回歸分析的目的之一是利用回歸模型預(yù)測(cè)因變量。假設(shè)三變量總體的回歸模型為(4.2 ),即月 = o' :lXi :2X2-i(4.2 )在一組隨機(jī)樣本(y,Xi,X2),i =1,2, ,n下,利用OLS求得樣本回歸函數(shù)為(4.3 )ANNAy J:oXi2 X2( i =

9、1,2,n )(4.3 )給定樣本外一點(diǎn)Xf =(1,Xif,X2f)T,貝U因變量yf的點(diǎn)預(yù)測(cè)為(4.12 )(4.13)y f = 'o' 1 X1 2 X2 fA點(diǎn)預(yù)測(cè)yf的標(biāo)準(zhǔn)誤為AA1TT1se( yf) = ;1 Xf (X X) Xf因變量yf的置信度為1 -:的區(qū)間預(yù)測(cè)為AAAAyf-tg( n-3)se(yf), y2( n-3)se(yf)(4.14 )二、案例案例1 Woody餐館的選址分析Woody餐館是一家價(jià)位適中、24小時(shí)營(yíng)業(yè)的家庭連鎖店,公司邀請(qǐng)你決策下 一家連鎖店的選址問(wèn)題。你決定建立一個(gè)回歸模型來(lái)解釋每一家連鎖餐館的毛銷(xiāo) 售額Y(the gro

10、ss sales volume ),通過(guò)文獻(xiàn)的閱讀,你認(rèn)為以下變量對(duì)毛銷(xiāo) 售額的影響較大,N =競(jìng)爭(zhēng)變量:餐館位置半徑2里以內(nèi)市場(chǎng)直接競(jìng)爭(zhēng)者的數(shù)量;P=人口:餐館位置半徑3里以內(nèi)人口的數(shù)量;匸收入:餐館位置半徑3里以內(nèi)家庭平均收入。并且通過(guò)調(diào)研,你獲得了 33家Woody餐館連鎖店的數(shù)據(jù)。 案例2經(jīng)濟(jì)形勢(shì)和實(shí)際工資對(duì)人們工作意愿的影響在第三章,我們根據(jù)勞動(dòng)經(jīng)濟(jì)學(xué)理論,分析了經(jīng)濟(jì)形勢(shì)對(duì)人們工作意愿的影 響存在兩種效應(yīng):受挫工人效應(yīng)和增加工人效應(yīng);并且利用1980-2002年的數(shù)據(jù) 實(shí)證了受挫工人效應(yīng)占主導(dǎo)地位。但根據(jù)勞動(dòng)經(jīng)濟(jì)學(xué)理論,影響人們工作意愿的因素,除了經(jīng)濟(jì)形勢(shì)以外,還 有實(shí)際的工資水平。

11、從理論上說(shuō),實(shí)際工資增加對(duì)勞動(dòng)供給具有兩種效應(yīng):替代效應(yīng)與收入效應(yīng)。替代效應(yīng)趨于使勞動(dòng)供給增加,而收入效應(yīng)則趨于使勞動(dòng)供給 降低,兩種效應(yīng)的相對(duì)影響取決于家庭的偏好(參考文獻(xiàn)4 ,p49)。本案例考察實(shí)際工資對(duì)人們工作意愿是否有影響,以及在有影響的情況下, 那種效應(yīng)占優(yōu)。數(shù)據(jù)見(jiàn)表3.1。三、實(shí)驗(yàn)?zāi)康陌咐? Woody餐館的選址分析1、繪制丫對(duì)N P、I的散點(diǎn)圖,并在散點(diǎn)圖中附加回歸線。2、 建立丫對(duì)N、P、I的線性回歸模型,并定性分析解釋變量N、P、I對(duì)丫的影 響。3、利用樣本數(shù)據(jù)及OLS法對(duì)回歸模型進(jìn)行估計(jì),并報(bào)告回歸結(jié)果。4、觀察回歸系數(shù)的顯著性和方程的顯著性,并解釋回歸系數(shù)的含義。案例2

12、經(jīng)濟(jì)形勢(shì)和實(shí)際工資對(duì)人們工作意愿的影響1、繪制clfpr對(duì)ahe82的散點(diǎn)圖,并附回歸線,觀察城市勞動(dòng)參與率與實(shí)際工 資之間的線性關(guān)系。2、 建立clfpr對(duì)ahe82的一元線性回歸模型,利用1980-2002年的數(shù)據(jù)估計(jì)模 型,并觀察回歸系數(shù)的顯著性和方程的顯著性。3、同時(shí)考慮經(jīng)濟(jì)形勢(shì)與實(shí)際工資對(duì)人們工作意愿的影響,建立二元線性回歸模 型,利用1980-2002年的數(shù)據(jù)估計(jì)模型,觀察回歸系數(shù)的顯著性和方程的顯著性, 并解釋回歸系數(shù)的經(jīng)濟(jì)含義。4、對(duì)上面(2)與(3)中估計(jì)結(jié)果的差別進(jìn)行解釋。5、模型的選擇問(wèn)題,在以下三個(gè)模型之間,哪個(gè)模型更好呢?clfprt = :0 cunrt t(I)c

13、lfprt 二:0 ahe82t t(n)clfprt = :0 ahe82t:2cu nr-t(川)四、實(shí)驗(yàn)原理五、實(shí)驗(yàn)步驟案例1 Woody餐館的選址分析180,000160,000140,000120,000100,00080,00002468 10N180,000160,000 -140,000Y120,000 -100,000 -80,0000100,000200,000300,000P180,000 1160,000 -140,000* / * * / «丫d *120,000 -*.卜100,000 £ 二80,000 -y10,00020,00030,000

14、40,000圖4-1 Y對(duì)N P、I的散點(diǎn)圖1、打開(kāi)Eviews工作文件 Woody.wfl,按住Ctrl鍵,點(diǎn)擊工作文件目錄中的序 列丫、N、P、I圖標(biāo),點(diǎn)擊鼠標(biāo)右鍵,點(diǎn)擊 Open/as Group,出現(xiàn)包含序列丫、N、 P、I的組對(duì)象窗口。點(diǎn)擊組對(duì)象窗口工具欄的 View按鈕,選擇Graph,在Specifi選項(xiàng)中選擇Scatter,在 Fit lines 中選擇 Regression Line,在 Multiple 中選擇 Multiple graphs-First vs.All,設(shè)定完畢后點(diǎn)擊 確定按鈕,則出現(xiàn)丫對(duì)N P、I的三張散 點(diǎn)圖,點(diǎn)擊鼠標(biāo)右鍵,選擇Copy,將散點(diǎn)圖復(fù)制到

15、Word文檔中,如圖4-1所示。2、Y對(duì)N P、I的線性回歸模型為Yi 。1 1 N i 一: 2 Pi 1 3 I i (4.15)一般來(lái)說(shuō),人口越多,餐館的毛銷(xiāo)售額越大;人們的收入水平越高,餐館的 毛銷(xiāo)售額越大;競(jìng)爭(zhēng)者的數(shù)量越多,餐館的毛銷(xiāo)售額越低。即P和I對(duì)丫有正的 影響,N對(duì)丫有負(fù)的影響,從而 J,的預(yù)期符號(hào)為正,、的預(yù)期符號(hào)為負(fù)。圖 4-1散點(diǎn)圖中回歸線的斜率與理論的預(yù)期是一致的。3、 在文件窗口點(diǎn)擊 object/new object,在出現(xiàn)的對(duì)象類型中選擇 equation,在 對(duì)象名中填寫(xiě)eq1,點(diǎn)擊0K出現(xiàn)對(duì)話框圖4.2Equation EstimationSpeci f i

16、cat 1 on Opt 1 OY13Eciuat ion sued fl cationDependent variable followed by List of resressoi's 丑nd FDL tejnsj OR an eKjaliclt equalico like圖4.2回歸方程的設(shè)定在估計(jì)方法中選擇最小二乘法,樣本范圍填寫(xiě) 1到30。設(shè)定完畢后點(diǎn)擊確定。出現(xiàn)圖4.3 EQuation: EQI Workfilt: WOOrtssionI n vifiw Pr cic ob jeet Pr i<nt |fJrne | IPr| For ecrtst弓上曰t:呂|氏匕

17、卻廿玄r>pF5nci!F?nt X/h廠VMethod: Least SquaresDate 1 1/1 7/1 2 Time.1 O.SOSample- 1 33Included observations-33VariableCoefficientStd Errort-StatisticProk>.C1Q2192 41837o 000011.2079230.5432942.3705040.0246N-9074 674-4O OOOIc0 35<iee8O 072814 9798100 0000R-squaredO ©181S4初 m 曰 n depenclent

18、 var1 ZS634 6Adjust&d R-squaredO 578653S O dependent var22404 09S.E. of regression14642.7SAkaike infocriterion22.12O7USum 円qu曰廠oEdO 1 3F-DS3SSuhw日廠孑 crirt=rionNN 3OS? 1 RLog likelihood-3O 9930> lannan-Ouinn criter.22.181021 &Our Liiiri-WiJtori103F*rob(F-statisticQ 000003圖4.3方程估計(jì)的輸出 根據(jù)圖4.3

19、,報(bào)告估計(jì)結(jié)果如下Y = 102192.4 - 9074.67*N + 0.35*P + 1.29*1(2052.67)(0.073)(0.54 )2t=-4.424.872.37R =0.584、從估計(jì)輸出結(jié)果可知,回歸系數(shù)的符號(hào)方向(正、負(fù))和大小均與理論分析 一致,t統(tǒng)計(jì)量的值顯示也在 0.05的顯著性水平下顯著(這一點(diǎn)也可以從邊際 概率值觀察到),F(xiàn)統(tǒng)計(jì)量的值為15.64 (相應(yīng)的概率值為0.000003),表明三個(gè) 解釋變量對(duì)被解釋變量聯(lián)合顯著。多元回歸系數(shù)的含義為,當(dāng)其他變量(控制變量)不變時(shí),該變量對(duì)因變量 的邊際影響。對(duì)于本例各系數(shù)的含義為,收入增加一個(gè)單位會(huì)使餐館的銷(xiāo)售收入

20、增加1.29個(gè)單位;人口增加一個(gè)單位會(huì)使餐館的銷(xiāo)售收入增加0.35個(gè)單位;競(jìng)爭(zhēng)者的數(shù)量增加一個(gè)單位將使餐館的銷(xiāo)售數(shù)量減少9074.67個(gè)單位。案例2經(jīng)濟(jì)形勢(shì)和實(shí)際工資對(duì)人們工作意愿的影響在以下操作中,假設(shè)包含clfpr、ahe82和cunr三個(gè)序列的Eviews工作文 件clfpr.wfl已經(jīng)存在。1、打開(kāi)Eviews工作文件clfpr.wfl ,建立包括序列ahe82和clfpr的組對(duì)象, 點(diǎn)擊組對(duì)象窗口工具欄的 View按鈕,選擇 Graph,在Specifi選項(xiàng)中選擇 Scatter,在Fit lines 中選擇 Regression Line,設(shè)定完畢后點(diǎn)擊確定按鈕, 出現(xiàn)圖4.4。

21、Group: UNTITLED Workfile: CLFPR-CUNR;Untit1ed 1 II 耳J戶rocjgtijwcfc Print宙殆 rnpl5sh輕両宙ta詞書(shū)pt寸.圖4.4 clfpr 對(duì)ahe82的散點(diǎn)圖由散點(diǎn)圖可見(jiàn),clfpr與ahe82之間存在非常弱的線性關(guān)系,回歸線斜率為 負(fù),且接近于水平線。2、建立一元線性回歸模型如下:clfprt =iahe82t 7(4.16)用1980-2002年的數(shù)據(jù)估計(jì)上述模型,估計(jì)結(jié)果如圖4.5所示Equation: UNTITLED Workfile:CLFPR-CUMR:UntitL=II 旦)saj|ViewprocObjec

22、t printName | FreezeEstliimate (Fore-caiStStats |Dependent Viariable CLFPR Method: Least Squares Date: 1 1/18/12 Time: 1 0:1 7Sample 1980 2002 Included observations 23VariableCoefficientStd. Errort-StatisticProb.AHE92 C-0 88451972.685671 227799-O 7204099.4284斗 57.709190O 47920.0000R-quar&dAdjust

23、ed R-squared S.E. of regression Sum squared resid Log likelihood F-statisticProb(F-statistic)O 024118 -0 0223531.181 70329 32484 -35 429400.5189890.479216ean dependeTit var S.D. dependent var Akaike info criterion Schwarz criterion H;annan-Quinn crrter Durbin-Watson stat65 89565 1 168713 3.254731 3.

24、3534693 2795S30.05685圖4.5 clfpr 對(duì)ahe82回歸的估計(jì)結(jié)果從圖4.5的t統(tǒng)計(jì)量和概率值均可知,實(shí)際工資對(duì)勞動(dòng)參與率沒(méi)有顯著影響, 擬合優(yōu)度(0.024118)很低,調(diào)整的擬合優(yōu)度更是為負(fù)值,F(xiàn)統(tǒng)計(jì)量和概率值也 顯示方程常數(shù)項(xiàng)和解釋變量(ahe82)對(duì)因變量(clfpr )的聯(lián)合影響不顯著。回 歸的結(jié)果與理論分析相悖。3、同時(shí)考慮經(jīng)濟(jì)形勢(shì)與實(shí)際工資對(duì)人們工作意愿的影響,建立二元線性回歸模 型如下clfprt = :0ahe82t:2cunr'-t( 4.17)利用1980-2002年的數(shù)據(jù)估計(jì)模型,估計(jì)結(jié)果如圖4.6所示11 Equation: UNTIT

25、LED Workfile:CLFPR-CUNR:Unt1tl. IS l| View | Proc | Object PrintName | FreezeEstimateFo廠e匚a stStats ResidsDependent Variable CLFPRMethod. Least SquaresDate: 1 1/10/12 Time10:19Sample 1 980 2002Included observations-23VariableCoefficientStd.匚rrort*StatisticProbAHE82-1 4104320.610348-2.310967 0316CUNR

26、-0 0716310 082705-8T208450 OOOOC80.951224.77033716 969710.0000R-squared0 772914fJesn dependent var65 89565Adjusted R-squared0 750205S O dependent var1 168713匚一 of regression0.5841 17Akaike info criterion1.883676Sum squared resid6 823S46Schwarz criterion2 031784Log likelihood-18.66227Hannan-Quinn ci

27、rter.1.920924F-statistic34 03611Durbin-Watson5tat0 7S7065Prob(F-statistic o aooooa圖4.6 clfpr 對(duì)ahe82和cunr回歸的估計(jì)結(jié)果由圖4.6中間部分的t統(tǒng)計(jì)量和概率值可知,解釋變量ahe82和cunr均在0.05的水平上對(duì)clfpr有顯著影響;調(diào)整的擬合優(yōu)度為0.750205,擬合度較高; F統(tǒng)計(jì)量的值為34.03611,相應(yīng)的概率值為0.000000,表明ahe82和cunr對(duì)clfpr 的聯(lián)合影響顯著。解釋變量ahe82和cunr的回歸系數(shù)分別為-1.41和-0.67,它們的經(jīng)濟(jì)含義 為,在cunr保持不變的條件下,實(shí)際小時(shí)工資增加1美元,勞動(dòng)參與率降低1.41 個(gè)百分點(diǎn),表明實(shí)際工資對(duì)勞動(dòng)供給影響的收入效應(yīng)占優(yōu),即收入

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論