計(jì)量經(jīng)濟(jì)學(xué)-2一元線性回歸分析_第1頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)-2一元線性回歸分析_第2頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)-2一元線性回歸分析_第3頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)-2一元線性回歸分析_第4頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)-2一元線性回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩80頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1 第二章第二章 一元線性回歸模型一元線性回歸模型2主要內(nèi)容n回歸分析概述 n雙變量線性回歸模型的參數(shù)估計(jì) n雙變量線性回歸模型的假設(shè)檢驗(yàn)n雙變量線性回歸模型的預(yù)測(cè)n案例32.12.1 回歸分析概述回歸分析概述一、變量間的關(guān)系及回歸分析的基本概念二、總體回歸函數(shù)(PRF)三、隨機(jī)擾動(dòng)項(xiàng)四、樣本回歸函數(shù)(SRF)4一、變量間的關(guān)系及回歸分析的基本概念一、變量間的關(guān)系及回歸分析的基本概念1. 1. 變量間的關(guān)系變量間的關(guān)系(1)確定性關(guān)系確定性關(guān)系或函數(shù)關(guān)系函數(shù)關(guān)系:研究的是確定現(xiàn)象非隨機(jī)變量間的關(guān)系。2,半徑半徑圓面積fn一個(gè)(或多個(gè))變量的變化能完全決定另一個(gè)變量的變化:n利息率一定,存入本金

2、與到期本息 5n存在密切聯(lián)系但并非完全決定n居民收入與消費(fèi)密切相關(guān),但不能完全決定消費(fèi)n廣告費(fèi)支出與銷售額密切相關(guān),但不能完全決定銷售額(2)統(tǒng)計(jì)依賴)統(tǒng)計(jì)依賴或相關(guān)關(guān)系(相關(guān)關(guān)系(非確定性關(guān)系):):研究的是非確定現(xiàn)象隨機(jī)變量間的關(guān)系。, 施肥量陽(yáng)光降雨量氣溫農(nóng)作物產(chǎn)量f6 回歸分析(regression analysis)是研究一個(gè)變量關(guān)于另一個(gè)(些)變量的具體依賴關(guān)系的計(jì)算方法和理論。 其用意:在于通過(guò)后者的已知或設(shè)定值,去估計(jì)和(或)預(yù)測(cè)前者的(總體)均值。 這里:前一個(gè)變量被稱為被解釋變量(Explained Variable)或因變量(Dependent Variable),后一個(gè)

3、(些)變量被稱為解釋變量(Explanatory Variable)或自變量(Independent Variable)。2 2、回歸分析的基本概念、回歸分析的基本概念7 回歸分析構(gòu)成計(jì)量經(jīng)濟(jì)學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括: n根據(jù)樣本觀察值對(duì)經(jīng)濟(jì)計(jì)量模型參數(shù)進(jìn)行估計(jì),求得回歸方程;回歸方程;n對(duì)回歸方程、參數(shù)估計(jì)值進(jìn)行檢驗(yàn);n利用回歸方程進(jìn)行分析、評(píng)價(jià)及預(yù)測(cè)。8二、總體回歸函數(shù)二、總體回歸函數(shù)n回歸分析回歸分析關(guān)心的是根據(jù)解釋變量的已知或關(guān)心的是根據(jù)解釋變量的已知或給定值,考察被解釋變量的總體均值給定值,考察被解釋變量的總體均值,即當(dāng)解釋變量取某個(gè)確定值時(shí),與之統(tǒng)計(jì)相關(guān)的被解釋變量所有可能出

4、現(xiàn)的對(duì)應(yīng)值的平均值。910n在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線總體回歸線(population regression line),或更一般地稱為總體回歸曲線總體回歸曲線(population regression curve)。)()|(iiXfXYE稱為(雙變量)總體回歸函數(shù)總體回歸函數(shù)(population regression function, PRF)。 相應(yīng)的函數(shù):11n含義:含義:回歸函數(shù)(PRF)說(shuō)明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。 函數(shù)形式:函數(shù)形式:可以是線性或非線性的。 如,將居民消費(fèi)支出看成是其可支配收入的線性函

5、數(shù)時(shí): iiXXYE10)|(為一線性函數(shù)。線性函數(shù)。其中,0,1是未知參數(shù),稱為回歸系數(shù)回歸系數(shù)(regression coefficients)。12三、隨機(jī)擾動(dòng)項(xiàng)三、隨機(jī)擾動(dòng)項(xiàng)n總體回歸函數(shù)說(shuō)明在給定的收入水平Xi下,家庭平均的消費(fèi)支出水平。n但對(duì)某一個(gè)別的家庭,其消費(fèi)支出可能與該平均水平有偏差。n稱為觀察值圍繞它的期望值的離差離差(deviation),是一個(gè)不可觀測(cè)的隨機(jī)變量,又稱為隨機(jī)干擾項(xiàng)隨機(jī)干擾項(xiàng)(stochastic disturbance)或隨機(jī)誤差項(xiàng)隨機(jī)誤差項(xiàng)(stochastic error)。)|(iiiXYEY iu13nE(Y|Xi)稱為系統(tǒng)性(系統(tǒng)性(syste

6、matic)或確定性確定性(deterministic)部分;部分;其他為隨機(jī)隨機(jī)或非確定性非確定性(nonsystematic)部分部分ui。iuiu14 稱為總體回歸函數(shù)(PRF)的隨機(jī)設(shè)定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機(jī)性影響。由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)學(xué)模型,因此也稱為總體回歸模型。iuiu15n隨機(jī)誤差項(xiàng)主要包括下列因素:隨機(jī)誤差項(xiàng)主要包括下列因素:n在解釋變量中被忽略的因素的影響;n變量觀測(cè)值的觀測(cè)誤差的影響;n模型關(guān)系的設(shè)定誤差的影響;n其他隨機(jī)因素的影響。n隨機(jī)干擾項(xiàng)的意義 n將各種次要變量作了綜合處理,保證了分析的可操作性。16四

7、、樣本回歸函數(shù)(四、樣本回歸函數(shù)(SRF)n問(wèn)題:?jiǎn)栴}:能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息?n例:例:在總體中有如下一個(gè)樣本,能否從該樣本估計(jì)總體回歸函數(shù)PRF? 家庭消費(fèi)支出與可支配收入的一個(gè)隨機(jī)樣本家庭消費(fèi)支出與可支配收入的一個(gè)隨機(jī)樣本 Y 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 X 594 638 1122 1155 1408 1595 1969 2078 2585 2530 該樣本的散點(diǎn)圖散點(diǎn)圖(scatter diagram):n 畫(huà)一條直線以盡好地?cái)M合該散點(diǎn)圖,由于樣本取自總體,可

8、以該直線近似地代表總體回歸線。該直線稱為樣本回歸線樣本回歸線(sample regression lines)。)。18n 記樣本回歸線的函數(shù)形式為:iiiXXfY10)(稱為樣本回歸函數(shù)樣本回歸函數(shù)(sample regression function,SRF)。19 樣本回歸函數(shù)的隨機(jī)形式樣本回歸函數(shù)的隨機(jī)形式/ /樣本回歸模型:樣本回歸模型:樣本回歸函數(shù)也有如下的隨機(jī)形式: 由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)模型,因此也稱為樣本回歸模型樣本回歸模型(sample regression model)。 iiiiieXYY10iu 式中,ie稱為(樣本)殘差(樣本)殘差 (或剩余剩余)項(xiàng)項(xiàng)

9、(residual),代表了其他影響iY的隨機(jī)因素的集合,可看成是 的估計(jì)量。 iu iu 回歸分析的主要目的回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸函數(shù)PRF。根據(jù) iiiiieXeYY10估計(jì)iiiiiuXuXYEY10)|(iu212.2 2.2 雙變量線性回歸模型的參數(shù)估計(jì)雙變量線性回歸模型的參數(shù)估計(jì) 一、參數(shù)的普通最小二乘估計(jì)(一、參數(shù)的普通最小二乘估計(jì)(OLSOLS) 二、雙變量線性回歸模型的基本假設(shè)二、雙變量線性回歸模型的基本假設(shè)三、最小二乘估計(jì)量的性質(zhì)三、最小二乘估計(jì)量的性質(zhì) 四、參數(shù)估計(jì)量的概率分布及隨機(jī)干四、參數(shù)估計(jì)量的概率分布及隨機(jī)干 擾項(xiàng)方差的估計(jì)擾項(xiàng)方

10、差的估計(jì) 23n回歸分析的主要目的回歸分析的主要目的是要通過(guò)樣本回歸函數(shù)(模型)SRF盡可能準(zhǔn)確地估計(jì)總體回歸函數(shù)(模型)PRF。n估計(jì)方法估計(jì)方法有多種,其中最廣泛使用的是普通最普通最小二乘法小二乘法(ordinary least squares, OLS)。n為保證參數(shù)估計(jì)量具有良好的性質(zhì),通常對(duì)模型提出若干基本假設(shè)。n實(shí)際這些假設(shè)與所采用的估計(jì)方法緊密相關(guān)。24一、參數(shù)的普通最小二乘估計(jì)(一、參數(shù)的普通最小二乘估計(jì)(OLSOLS) 給定一組樣本觀測(cè)值(Xi, Yi)(i=1,2,n)要求樣本回歸函數(shù)盡可能好地?cái)M合這組值. 普通最小二乘法普通最小二乘法(Ordinary least squ

11、ares, OLS)給出的判斷標(biāo)準(zhǔn)是:二者之差(殘差)的平方和最小。niiiniXYYYQ121021)()(25最小二乘法的思路n為了精確地描述Y與X之間的關(guān)系,必須使用這兩個(gè)變量的每一對(duì)觀察值(n組觀察值),才不至于以點(diǎn)概面(做到全面)。nY與X之間是否是直線關(guān)系(用協(xié)方差或相關(guān)系數(shù)判斷)?若是,可用一條直線描述它們之間的關(guān)系。n在Y與X的散點(diǎn)圖上畫(huà)出直線的方法很多。n找出一條能夠最好地描述Y與X(代表所有點(diǎn))之間的直線。問(wèn)題是:怎樣算“最好”?n最好指的是找一條直線使得所有這些點(diǎn)到該直線的縱向距離的和(平方和)最小。26最小二乘法的思路yx縱向距離橫向距離距離yxiiA,yxiiB,A為

12、實(shí)際點(diǎn),B為擬合直線上與之對(duì)應(yīng)的點(diǎn)xyyyuiiiii10縱向距離27最小二乘法的思路n縱向距離是Y的實(shí)際值與擬合值之差,差異大擬合不好,差異小擬合好,所以稱為殘差、擬合誤差或剩余。n將所有縱向距離平方后相加,即得誤差平方和,“最好”直線就是使誤差平方和最小的直線。擬合直線在總體上最接近實(shí)際觀測(cè)點(diǎn)。n于是可以運(yùn)用求極值的原理,將求最好擬合直線問(wèn)題轉(zhuǎn)換為求誤差平方和最小的問(wèn)題。28YX0*7Y9Y*Y7Y9Min2)(iiYY數(shù)學(xué)形式29得到的參數(shù)估計(jì)量可以寫(xiě)成: XYxyxiii1021 稱為OLS估計(jì)量的離差形式離差形式(deviation form)。)。 由于參數(shù)的估計(jì)結(jié)果是通過(guò)最小二乘

13、法得到 的,故稱為普通普通最小二乘估計(jì)量最小二乘估計(jì)量(ordinary least squares estimators)。 其中nXXXXxniiiii1nYYYYyniiiii1 例例2:在上述家庭可支配收入可支配收入- -消費(fèi)支出消費(fèi)支出例中,對(duì)于所抽出的一組樣本數(shù),參數(shù)估計(jì)的計(jì)算可通過(guò)下面的表進(jìn)行。 表表 2.2.1 參參數(shù)數(shù)估估計(jì)計(jì)的的計(jì)計(jì)算算表表 iX iY ix iy iiyx 2ix 2iy 2iX 2iY 1 800 594 -1350 -973 1314090 1822500 947508 640000 352836 2 1100 638 -1050 -929 97587

14、0 1102500 863784 1210000 407044 3 1400 1122 -750 -445 334050 562500 198381 1960000 1258884 4 1700 1155 -450 -412 185580 202500 170074 2890000 1334025 5 2000 1408 -150 -159 23910 22500 25408 4000000 1982464 6 2300 1595 150 28 4140 22500 762 5290000 2544025 7 2600 1969 450 402 180720 202500 161283 676

15、0000 3876961 8 2900 2078 750 511 382950 562500 260712 8410000 4318084 9 3200 2585 1050 1018 1068480 1102500 1035510 10240000 6682225 10 3500 2530 1350 963 1299510 1822500 926599 12250000 6400900 求和 21500 15674 5769300 7425000 4590020 53650000 29157448 平均 2150 1567 31777. 07425000576930021iiixyx172.1

16、032150777. 0156700XY因此,由該樣本估計(jì)的回歸方程為: iiXY777.0172.10332n模型解釋變量和誤差項(xiàng)模型解釋變量和誤差項(xiàng)ui的的假定條件假定條件如下如下:(1) ui 是一個(gè)隨機(jī)變量,是一個(gè)隨機(jī)變量,ui 的取值服從概率分布。的取值服從概率分布。(2) E(ui) = 0。(3) ui 具有同方差性。具有同方差性。 D(ui) = Eui - E(ui) 2 = E(ui)2 = 2。(4) ui為正態(tài)分布(根據(jù)中心極限定理)。為正態(tài)分布(根據(jù)中心極限定理)。 以上以上四個(gè)假定條件四個(gè)假定條件可作如下表達(dá)。可作如下表達(dá)。 ui N (0, ) 二、線性回歸模型的

17、基本假設(shè)二、線性回歸模型的基本假設(shè)33 (5) ui 非自相關(guān)。非自相關(guān)。 Cov(ui, uj) = E(ui - E(ui) ) ( uj - E(uj) ) = E(ui, uj) = 0,(i j )。 (6) xi是非隨機(jī)的。是非隨機(jī)的。 (7) ui 與與xi 相互獨(dú)立。相互獨(dú)立。 Cov(ui, xi) = E(ui - E(ui) ) (xi - E(xi) ) = Eui (xi - E(xi) = Eui xi - ui E(xi) = E(ui xi) = 0. (8) 對(duì)于多元線性回歸模型,解釋變量之間不能完全對(duì)于多元線性回歸模型,解釋變量之間不能完全 相關(guān)或高度相關(guān)(

18、非多重共線性)。相關(guān)或高度相關(guān)(非多重共線性)。 在假定(在假定(1),(),(2) ,(,(6)成立條件下有)成立條件下有 E(yi) = E( 0+ + 1 xi+ +ui) = 0+ + 1 xi34n同方差35n異方差36 三、最小二乘估計(jì)量的性質(zhì)三、最小二乘估計(jì)量的性質(zhì) 當(dāng)模型參數(shù)估計(jì)出后,需考慮參數(shù)估計(jì)值的精度,即是否能代表總體參數(shù)的真值,或者說(shuō)需考察參數(shù)估計(jì)量的統(tǒng)計(jì)性質(zhì)。 一個(gè)用于考察總體的估計(jì)量,可從如下幾個(gè)方面考察其優(yōu)劣性: (1)線性)線性,即它是否是另一隨機(jī)變量的線性函數(shù);37(2)無(wú)偏性)無(wú)偏性,1100EE無(wú)偏性意味著這兩個(gè)估計(jì)量沒(méi)有高估或低估的系統(tǒng)傾向。即估計(jì)量的均

19、值或期望值是否等于總體的真實(shí)值;38(3)有效性)有效性,即估計(jì)量在所有線性無(wú)偏估計(jì)量中具有最小方差。2122012211varvarniiniiXXXnXXn含義:估計(jì)量方差與隨機(jī)項(xiàng)方差、自變量取值范圍、樣本量等有關(guān)。39n這三個(gè)準(zhǔn)則也稱作估計(jì)量的小樣本性質(zhì)。小樣本性質(zhì)。 擁有這類性質(zhì)的估計(jì)量稱為最佳線性無(wú)偏估計(jì)量最佳線性無(wú)偏估計(jì)量(best liner unbiased estimator, BLUE)。高斯高斯馬爾可夫定理馬爾可夫定理(Gauss-Markov theorem) 在給定經(jīng)典線性回歸的假定下,最小二乘估計(jì)在給定經(jīng)典線性回歸的假定下,最小二乘估計(jì)量是具有最小方差的線性無(wú)偏估計(jì)

20、量。量是具有最小方差的線性無(wú)偏估計(jì)量。40 四四、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)項(xiàng)方差的估計(jì) 1、參數(shù)估計(jì)量、參數(shù)估計(jì)量0和和1的概率分布的概率分布 ),(2211ixN),(22200iixnXN412. 隨機(jī)誤差項(xiàng)隨機(jī)誤差項(xiàng)u的方差的方差 2的估計(jì)的估計(jì) 2又稱為總體方差總體方差。u 由于隨機(jī)項(xiàng)ui不可觀測(cè),只能從ui的估計(jì)殘差ei出發(fā),對(duì)總體方差進(jìn)行估計(jì)。 2的最小二乘估計(jì)量最小二乘估計(jì)量為222nei它是關(guān)于2的無(wú)偏估計(jì)量。 42在隨機(jī)誤差項(xiàng)的方差2估計(jì)出后,參數(shù)0和1的方方差差和標(biāo)標(biāo)準(zhǔn)準(zhǔn)差差的估計(jì)量分別是: 1的樣本方差: 2221ixS

21、1的樣本標(biāo)準(zhǔn)差: 21ixS 0的樣本方差: 22220iixnXS 0的樣本標(biāo)準(zhǔn)差: 220iixnXS 432.3 2.3 雙變量線性回歸模型的統(tǒng)計(jì)檢驗(yàn)雙變量線性回歸模型的統(tǒng)計(jì)檢驗(yàn) 一、擬合優(yōu)度檢驗(yàn)一、擬合優(yōu)度檢驗(yàn) 二、變量的顯著性檢驗(yàn)二、變量的顯著性檢驗(yàn) 三、參數(shù)的置信區(qū)間三、參數(shù)的置信區(qū)間 44 如果Yi=i 即實(shí)際觀測(cè)值落在樣本回歸“線”上,則擬合最好擬合最好。 45 對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平方和,可以證明:222)()()(iiiiYYYYYY即 TSS=ESS+RSS46TSS=ESS+RSS22)(YYyTSSii22)(YYyESSii22)(iiiY

22、YeRSS總體平方和總體平方和(Total Sum of Squares)回歸平方和回歸平方和(Explained Sum of Squares)殘差平方和殘差平方和(Residual Sum of Squares )47 Y的觀測(cè)值圍繞其均值的總離差的觀測(cè)值圍繞其均值的總離差(total variation)可分解為兩部分:一部可分解為兩部分:一部分來(lái)自回歸線分來(lái)自回歸線(ESS),另一部分則來(lái)自隨,另一部分則來(lái)自隨機(jī)勢(shì)力機(jī)勢(shì)力(RSS)。n在給定樣本中,TSS不變,n如果實(shí)際觀測(cè)點(diǎn)離樣本回歸線越近,則ESS在TSS中占的比重越大,因此n擬合優(yōu)度:回歸平方和擬合優(yōu)度:回歸平方和ESS/Y的總

23、離差的總離差TSS48TSSRSSTSSESSR1記22、判定系數(shù)、判定系數(shù)R2 2統(tǒng)計(jì)量統(tǒng)計(jì)量 稱 R2 為(樣本)(樣本)判定系數(shù)判定系數(shù)/可決系數(shù)可決系數(shù)(coefficient of determination)。 判定系數(shù)判定系數(shù)的取值范圍取值范圍:0,1 R2 2越接近越接近1 1,說(shuō)明實(shí)際觀測(cè)點(diǎn)離,說(shuō)明實(shí)際觀測(cè)點(diǎn)離樣本線樣本線越近,越近,擬合優(yōu)度越高擬合優(yōu)度越高。49擬合優(yōu)度(或稱判定系數(shù)、決定系數(shù))n判定系數(shù)只是說(shuō)明列入模型的所有解釋變量對(duì)應(yīng)變量的聯(lián)合的影響程度,不說(shuō)明模型中單個(gè)解釋變量的影響程度。n對(duì)時(shí)間序列數(shù)據(jù),判定系數(shù)達(dá)到0.9以上是很平常的;但是,對(duì)截面數(shù)據(jù)而言,能夠有

24、0.5就不錯(cuò)了。50判定系數(shù)達(dá)到多少為宜?n沒(méi)有一個(gè)統(tǒng)一的明確界限值;n若建模的目的是預(yù)測(cè)應(yīng)變量值,一般需考慮有較高的判定系數(shù)。n若建模的目的是結(jié)構(gòu)分析,就不能只追求高的判定系數(shù),而是要得到總體回歸系數(shù)的可信任的估計(jì)量。判定系數(shù)高并不一定每個(gè)回歸系數(shù)都可信任;51 二、變量的顯著性檢驗(yàn)二、變量的顯著性檢驗(yàn) 回歸分析回歸分析是要判斷解釋變量解釋變量X是否是被解釋被解釋變量變量Y的一個(gè)顯著性的影響因素。 在雙變量線性模型雙變量線性模型中,就是要判斷X是否對(duì)Y具有顯著的線性影響。這就需要進(jìn)行變量的顯著變量的顯著性檢驗(yàn)。性檢驗(yàn)。 變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理

25、統(tǒng)計(jì)學(xué)中的學(xué)中的假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)。 計(jì)量經(jīng)濟(jì)學(xué)中計(jì)量經(jīng)濟(jì)學(xué)中,主要是針對(duì)變量的參數(shù)真值,主要是針對(duì)變量的參數(shù)真值是否為零(?)來(lái)進(jìn)行顯著性檢驗(yàn)的。是否為零(?)來(lái)進(jìn)行顯著性檢驗(yàn)的。 52 1、假設(shè)檢驗(yàn)、假設(shè)檢驗(yàn) n 所謂假設(shè)檢驗(yàn)假設(shè)檢驗(yàn),就是事先對(duì)總體參數(shù)或總體分布形式作出一個(gè)假設(shè),然后利用樣本信息來(lái)判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否“接受”或否定原假設(shè)。53n假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法 先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。n判斷結(jié)果合理與否,是基于判斷結(jié)果合

26、理與否,是基于“小概率事件不易小概率事件不易發(fā)生發(fā)生”這一原理的這一原理的54 2、變量的顯著性檢驗(yàn)、變量的顯著性檢驗(yàn) ),(2211ixN)2(1112211ntSxti55 檢驗(yàn)步驟:檢驗(yàn)步驟: (1)對(duì)總體參數(shù)提出假設(shè) H0: 1=0, H1:10(2)以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量,并由樣本計(jì)算其值11St (3)給定顯著性水平,查t分布表得臨界值t /2(n-2)(4) 比較,判斷 若 |t| t /2(n-2),則拒絕H0 ,接受H1 ; 若 |t| t /2(n-2),則拒絕H1 ,接受H0 ; 56 假設(shè)檢驗(yàn)可以通過(guò)一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒(méi)

27、有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。 三、參數(shù)的置信區(qū)間三、參數(shù)的置信區(qū)間 要判斷樣本參數(shù)的估計(jì)值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過(guò)構(gòu)造一個(gè)以樣本參數(shù)的估計(jì)值為中心的“區(qū)間”,來(lái)考察它以多大的可能性(概率)包含著真實(shí)的參數(shù)值。這種方法就是參數(shù)的區(qū)間估計(jì)區(qū)間估計(jì)。 1)(P 如果存在這樣一個(gè)區(qū)間,稱之為置信區(qū)間置信區(qū)間(confidence interval); 1-稱為置信系數(shù)置信系數(shù)(置信度置信度)(confidence coefficient), 稱為顯著性水平顯著性水平(level of significance);置信區(qū)間的端點(diǎn)稱為置信限

28、置信限(confidence limit)或臨界值臨界值(critical values)。58tt2/2/nxn-x :,置信區(qū)間tnxtnx/2/21-x圖示如下59雙變量線性模型中雙變量線性模型中, i (i=1,2)的置信區(qū)間的置信區(qū)間: :在變量的顯著性檢驗(yàn)中已經(jīng)知道: )2(ntstiii 意味著,如果給定置信度(1-),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t/2, t/2)的概率是(1- )。表示為: P ttt() 221即P tstiii() 221Ptstsiiiii()22160于是得到:(1-)的置信度下, i的置信區(qū)間是 (,)iitstsii2

29、2在上述收入收入- -消費(fèi)支出消費(fèi)支出例中,如果給定 =0.01,查表得: 355. 3) 8 () 2(005. 02tnt由于042. 01S41.980S于是,1、0的置信區(qū)間分別為:(0.6345,0.9195) , (-433.32,226.98) 61n由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。n要縮小置信區(qū)間,需要n增大樣本容量增大樣本容量n。因?yàn)樵谕瑯拥闹眯潘较?,n越大,t分布表中的臨界值越??;同時(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減?。籲提高模型的擬合優(yōu)度。提高模型的擬合優(yōu)度。因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方

30、和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小。622.4 2.4 雙變量線性回歸分析的應(yīng)用:預(yù)測(cè)問(wèn)題雙變量線性回歸分析的應(yīng)用:預(yù)測(cè)問(wèn)題 一、一、0 0是條件均值是條件均值E(Y|X=X0)或個(gè)值或個(gè)值Y0的一個(gè)無(wú)偏估計(jì)的一個(gè)無(wú)偏估計(jì)二、總體條件均值與個(gè)值預(yù)測(cè)值的置信二、總體條件均值與個(gè)值預(yù)測(cè)值的置信區(qū)間區(qū)間63 對(duì)于雙變量線性回歸模型 iiXY10給定樣本以外的解釋變量的觀測(cè)值X0,可以得到被解釋變量的預(yù)測(cè)值0 0 ,可以此作為其條件均條件均值值E(Y|X=X0)或個(gè)別值個(gè)別值Y0的一個(gè)近似估計(jì)。 嚴(yán)格地說(shuō),這只是被解釋變量的預(yù)測(cè)值的估計(jì)值,而不是預(yù)測(cè)值。原因: (1)參數(shù)估計(jì)量不確定 (2)

31、隨機(jī)項(xiàng)的影響64 二、總體條件均值與個(gè)值預(yù)測(cè)值的置信區(qū)間二、總體條件均值與個(gè)值預(yù)測(cè)值的置信區(qū)間 1、總體均值預(yù)測(cè)值的置信區(qū)間、總體均值預(yù)測(cè)值的置信區(qū)間 由于 0100XY),(2211ixN),(22200iixnXN于是)(1(,(22020100ixXXnXNY65) 2()(00100ntSXYtY)(1(22020iYxXXnS于是,在1-的置信度下,總體均值總體均值E(Y|X0)的置的置信區(qū)間為信區(qū)間為 0202000)|(YYStYXYEStY其中662、總體個(gè)值預(yù)測(cè)值的預(yù)測(cè)區(qū)間、總體個(gè)值預(yù)測(cè)值的預(yù)測(cè)區(qū)間 由 Y0=0+1X0+u 知: ),(20100XNY于是 )(11 (,

32、0(220200ixXXnNYY) 2(0000ntSYYtYY式中 :)(11 (220200iYYxXXnS從而在1-的置信度下, Y0的置信區(qū)間的置信區(qū)間為 002020000YYYYStYYStY67 總體回歸函數(shù)的置信帶(域)置信帶(域)(confidence band) 個(gè)體的置信帶(域)置信帶(域)68 對(duì)于Y的總體均值E(Y|X)與個(gè)體值的預(yù)測(cè)區(qū)間(置信區(qū)間):(1)樣本容量n越大,預(yù)測(cè)精度越高,反之預(yù)測(cè)精度越低;(2)樣本容量一定時(shí),置信帶的寬度當(dāng)在X均值處最??;X越遠(yuǎn)離其均值,置信帶越寬,預(yù)測(cè)可信度下降。用回歸模型預(yù)測(cè)木材剩余物用回歸模型預(yù)測(cè)木材剩余物n伊春林區(qū)位于黑龍江省

33、東北部,有森林面積219萬(wàn)公頃,木材蓄積量為2.3億m3。森林覆蓋率為62.5%,是我國(guó)主要的木材工業(yè)基地之一。1999年伊春林區(qū)木材采伐量為532萬(wàn)m3。按此速度44年之后,1999年的蓄積量將被采伐一空。n為緩解森林資源危機(jī),并解決部分職工就業(yè)問(wèn)題,除了做好木材的深加工外,還要充分利用木材剩余物生產(chǎn)林業(yè)產(chǎn)品,如紙漿、紙袋、紙板等。因此預(yù)測(cè)林區(qū)的年木材剩余物是安排木材剩余物加工生產(chǎn)的一個(gè)關(guān)鍵環(huán)節(jié)。2.5 2.5 案例:案例:林業(yè)局名年木材剩余物yt(萬(wàn)m3) 年木材采伐量xt(萬(wàn)m3)烏伊嶺26.1361.4東風(fēng)23.4948.3新青21.9751.8紅星11.5335.9五營(yíng)7.1817.

34、8上甘嶺6.8017.0友好18.4355.0翠巒11.6932.7烏馬河6.8017.0美溪9.6927.3大豐7.9921.5南岔12.1535.5帶嶺6.8017.0朗鄉(xiāng)17.2050.0桃山9.5030.0雙豐5.5213.8合計(jì)202.87532.00觀測(cè)點(diǎn)近似服從線性關(guān)系。觀測(cè)點(diǎn)近似服從線性關(guān)系。建立一元線性回歸模型如下:建立一元線性回歸模型如下: yi = 0 + 1 xi + ui年剩余物年剩余物yi和年木材采伐量和年木材采伐量xi散點(diǎn)圖散點(diǎn)圖分析分析EViews輸出結(jié)果。輸出結(jié)果。 = -0.7629 + 0.4043 xi (-0.6) (12.1) R2 = 0.91, T = 16上述模型的上述模型的經(jīng)濟(jì)解釋經(jīng)濟(jì)解釋是,對(duì)于是,對(duì)于伊春林區(qū)每采伐伊春林區(qū)每采伐1 m3木材,木材,將平均產(chǎn)生將平均產(chǎn)生0.4 m3的剩余物。的剩余物。iy 74討論討論1 1:判斷下列表達(dá)式是否正確:判斷下列表達(dá)式是否正確iu75iuiuiuiu iu 76參數(shù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論