31回歸分析概述_第1頁
31回歸分析概述_第2頁
31回歸分析概述_第3頁
31回歸分析概述_第4頁
31回歸分析概述_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第三章第三章 :線性回歸模型:線性回歸模型 回歸分析概述 線性回歸模型的參數(shù)估計 線性回歸模型的擬合優(yōu)度檢驗1 1 回歸分析概述回歸分析概述一、基本概念二、總體回歸函數(shù)(prf)三、隨機擾動項四、樣本回歸函數(shù)(srf)什么是回歸分析: 計量經(jīng)濟學是對實際的經(jīng)濟和商業(yè)現(xiàn)象進行數(shù)量化度量和分析的學科,它旨在對理論關系進行量化分析。 而回歸分析就是計量經(jīng)濟學中至今為止應用最多的一種方法。一、基本概念1. 變量間的關系(1)確定性關系或函數(shù)關系:研究的是確定現(xiàn)象非隨機變量間的關系。2,半徑半徑圓面積f(2)統(tǒng)計依賴或相關關系:研究的是非確定現(xiàn)象隨機變量間的關系。施肥量陽光降雨量氣溫農(nóng)作物產(chǎn)量,f 對變

2、量間統(tǒng)計依賴關系的考察主要是通過相關分析(correlation analysis)或回歸分析(regression analysis)來完成的 正相關 線性相關 不相關 相關系數(shù):統(tǒng)計依賴關系 負相關 11xy 有因果關系 回回歸歸分分析析 正相關 無因果關系 相相關關分分析析 非線性相關 不相關 負相關 注意注意不線性相關并不意味著不相關。有相關關系并不意味著一定有因果關系。回歸分析/相關分析研究一個變量對另一個(些)變量的統(tǒng)計依賴關系,但它們并不意味著一定有因果關系。2. 回歸分析 回歸分析(regression analysis)關心的是根據(jù)關心的是根據(jù)解釋變量的已知或給定值,考察被解

3、釋變量解釋變量的已知或給定值,考察被解釋變量的總體均值的總體均值,即當解釋變量取某個確定值時,與之統(tǒng)計相關的被解釋變量所有可能出現(xiàn)的對應值的平均值 被解釋變量(explained variable)或應變量(dependent variable)。 解釋變量(explanatory variable)或自變量(independent variable)。 回歸分析構成計量經(jīng)濟學的方法論基礎,其回歸分析構成計量經(jīng)濟學的方法論基礎,其主要內(nèi)容包括:主要內(nèi)容包括: (1)根據(jù)樣本觀察值對經(jīng)濟計量模型參數(shù)進行估計,求得回歸方程; (2)對回歸方程、參數(shù)估計值進行顯著性檢驗; (3)利用回歸方程進行分析

4、、評價及預測。 例2.1:一個假想的社區(qū)有100戶家庭組成,要研究該社區(qū)每月家庭消費支出家庭消費支出y與每月家庭可家庭可支配收入支配收入x的關系。 即如果知道了家庭的月收入,能否預測該社區(qū)家庭的平均月消費支出水平。 為達到此目的,將該100戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費支出。二、總體回歸函數(shù)表表 2.1.1 某某社社區(qū)區(qū)家家庭庭每每月月收收入入與與消消費費支支出出統(tǒng)統(tǒng)計計表表 每月家庭可支配收入x(元) 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 561 638 869 1023 1254 1408 1650

5、 1969 2090 2299 594 748 913 1100 1309 1452 1738 1991 2134 2321 627 814 924 1144 1364 1551 1749 2046 2178 2530 638 847 979 1155 1397 1595 1804 2068 2266 2629 935 1012 1210 1408 1650 1848 2101 2354 2860 968 1045 1243 1474 1672 1881 2189 2486 2871 1078 1254 1496 1683 1925 2233 2552 1122 1298 1496 1716

6、1969 2244 2585 1155 1331 1562 1749 2013 2299 2640 1188 1364 1573 1771 2035 2310 1210 1408 1606 1804 2101 1430 1650 1870 2112 1485 1716 1947 2200 每 月 家 庭 消 費 支 出 y (元) 2002 共計 2420 4950 11495 16445 19305 23870 25025 21450 21285 15510 由于不確定因素的影響,對同一收入水平x,不同家庭的消費支出不完全相同;但由于調(diào)查的完備性,給定收入水平x的消費支出y的分布是確定的,即

7、以x的給定值為條件的y的條條件分布件分布(conditional distribution)是已知的,例如: 因此,給定收入x的值xi,可得消費支出y的條件均值(conditional mean)或條件期望(conditional expectation): e(y|x=xi)。 該例中:e(y | x=800)=561 描出散點圖發(fā)現(xiàn):隨著收入的增加,消費“平均地說平均地說”也在增加,且y的條件均值均落在一根正斜率的直線上。這條直線稱為總體回歸線總體回歸線。p(y=561|x=800)=1/4。0500100015002000250030003500500100015002000250030

8、0035004000每月可支配收入x(元)每月消費支出y(元) 在給定解釋變量xi條件下被解釋變量yi的期望軌跡稱為總體回歸線(population regression line),或更一般地稱為總體回歸曲線(population regression curve)。相應的函數(shù):)()|(iixfxye稱為(雙變量)總體回歸函數(shù)(population regression function, prf)。 函數(shù)形式:可以是線性或非線性的。稱 iixxye10)|(為一線性函數(shù)。其中,0,1是總體未知參數(shù),稱為回歸系數(shù)回歸系數(shù)(regression coefficients)。 含義:總體回歸函

9、數(shù)(prf)說明被解釋變量y的平均狀態(tài)(總體條件期望)隨解釋變量x變化的規(guī)律。用例子解釋對總體回歸函數(shù)的進一步說明:;yeixx第一,我們的最終目標是 第二, 條件 的作用在于限制y的可能取值范圍,以便于提高搜索y的精確度; 第三,總體回歸函數(shù)的建立與回歸分析無關。方程中的“=”反映的不是統(tǒng)計依賴關系(即不是統(tǒng)計學上的相關關系),而是由經(jīng)濟理論分析所確定的一種因果關系。這是統(tǒng)計學與經(jīng)濟學中所使用的回歸分析之間最大的不同?。ㄇ杏洠。┤?、隨機擾動項 總體回歸函數(shù)說明在給定的收入水平xi下,該社區(qū)家庭平均的消費支出水平。但對某一個別的家庭,其消費支出可能與該平均水平有偏差。 稱為觀察值圍繞它的期望值

10、的離差(deviation),是一個不可觀測的隨機變量,又稱為隨機干擾項(stochastic disturbance)或隨機誤差項(stochastic error)。)|(iiixyey 例2.1中,給定收入水平xi ,個別家庭的支出可表示為兩部分之和:(1)該收入水平下所有家庭的平均消費支出e(y|xi),稱為系統(tǒng)性(systematic)或確定性(deterministic)部分;(2)其他隨機或非確定性(nonsystematic)部分i。 稱為總體回歸函數(shù)(prf)的隨機設定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機性影響。由于方程中引入了隨機項,成為計量

11、經(jīng)濟學模型,因此也稱為總體回歸模型。 隨機誤差項主要包括下列因素:隨機誤差項主要包括下列因素:在解釋變量中被忽略的因素的影響;被解釋變量觀測值的觀測誤差的影響;模型關系的設定誤差的影響;其他隨機因素的影響。 回歸模型的擴展:回歸模型的擴展:一元模型是一個方程組,舉例; 允許多個解釋變量的存在,系數(shù)含義。四、樣本回歸函數(shù)(四、樣本回歸函數(shù)(srf) 問題:問題:能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息? 例例2.2:在例2.1的總體中有如下一個樣本,能否從該樣本估計總體回歸函數(shù)prf?表表2.1.3 家家庭庭消消費費支支出出與與可可支支配配收收入入的的一一個

12、個隨隨機機樣樣本本 y 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 x 594 638 1122 1155 1408 1595 1969 2078 2585 2530 回答:能 該樣本的散點圖散點圖(scatter diagram): 畫一條直線以盡好地擬合該散點圖,由于樣本取自總體,可以該直線近似地代表總體回歸線。該直線稱為樣本回歸線(sample regression lines)。 記樣本回歸線的函數(shù)形式為:iiixxfy10)(稱為樣本回歸函數(shù)樣本回歸函數(shù)(sample regression function,srf)。 問題一:樣

13、本回歸函數(shù)(樣本回歸線)有幾條?總體回歸線呢?注意,“擬合”的含義: 樣本回歸曲線有無數(shù)條,這是由我們對其的定義所決定的。它就是對樣本散點的擬合曲線!在沒有給出擬合標準之前,我可以任意決定。而總體回歸曲線只有一條,就是總體 的條件期望的軌跡,即總體回歸曲線的設定標準我已經(jīng)給出了。iy 問題二,為什么不將樣本回歸函數(shù)也定義成樣本的條件期望呢?這里我們是希望利用擬合手段來求解樣本回歸函數(shù)。而將樣本回歸函數(shù)定義成樣本的條件期望,進而用其去近似替代總體回歸函數(shù),這一技術(手段)也可行,并且已經(jīng)被人們建立起來了,這就是所謂的矩估計方法。換句話說,“擬合”與“條件期望”都是構造樣本回歸函數(shù)的方法而已,這就

14、是所謂的估計。而檢驗主要是指針對樣本觀測值分析這些構造方法下得到的樣本回歸函數(shù)的好壞。而構造出來的樣本回歸函數(shù)究竟在多大程度上能去替代總體回歸函數(shù),這還涉及到對樣本的抽樣技術,要求所抽樣本能全面反映總體特征,進而用從樣本中得到的信息去近似替代總體的特征?。ǚ中危?注意:注意:這里將樣本回歸線樣本回歸線看成總體回歸線總體回歸線的近似替代則 樣本回歸函數(shù)的隨機形式樣本回歸函數(shù)的隨機形式/ /樣本回歸模型:樣本回歸模型:同樣地,樣本回歸函數(shù)也有如下的隨機形式: iiiiiexyy10式中,ie稱為(樣樣本本)殘殘差差(或剩剩余余)項項(residual) ,代表了其他影響iy的隨機因素的集合,可看成是i的估計量i。 由于方程中引入了隨機項,成為計量經(jīng)濟模型,因此也稱為樣本回歸模型樣本回歸模型(sample regression model)。 回歸分析的主要目的:估計樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論