一元線性回歸模型(第四次課)_第1頁(yè)
一元線性回歸模型(第四次課)_第2頁(yè)
一元線性回歸模型(第四次課)_第3頁(yè)
一元線性回歸模型(第四次課)_第4頁(yè)
一元線性回歸模型(第四次課)_第5頁(yè)
已閱讀5頁(yè),還剩31頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

溫故知新

四、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)

五、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)

2、隨機(jī)誤差項(xiàng)的方差2的估計(jì)由于隨機(jī)項(xiàng)i不可觀測(cè),只能從i的估計(jì)——?dú)埐頴i出發(fā),對(duì)總體方差進(jìn)行估計(jì)。

可以證明,2的最小二乘估計(jì)量為(課本P36-P37,2.32-2.35)它是關(guān)于2的無(wú)偏估計(jì)量。

§2.3一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)

一、擬合優(yōu)度檢驗(yàn)

二、變量的顯著性檢驗(yàn)三、回歸方程的顯著性檢驗(yàn)

一、擬合優(yōu)度檢驗(yàn)

擬合優(yōu)度檢驗(yàn):對(duì)樣本回歸直線與樣本觀測(cè)值之間擬合程度的檢驗(yàn)。

度量擬合優(yōu)度的指標(biāo):判定系數(shù)(樣本決定系數(shù))R2作用擬合度指回歸直線與樣本數(shù)據(jù)趨勢(shì)的吻合程度。雖然OLS有好的性質(zhì),但并不保證具體模型的參數(shù)估計(jì)結(jié)果理想。因?yàn)槟P图僭O(shè)不一定真正成立,而且數(shù)據(jù)等情況也有差異。擬合度取決于(1)回歸方法;(2)變量關(guān)系;(3)擾動(dòng)因素。

1、總離差平方和的分解

對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平方和,可以證明:記總體平方和(TotalSumofSquares)回歸平方和(ExplainedSumofSquares)殘差平方和(ResidualSumofSquares

)TSS=ESS+RSS在給定樣本中,TSS不變,如果實(shí)際觀測(cè)點(diǎn)離樣本回歸線越近,則ESS在TSS中占的比重越大,因此

擬合優(yōu)度:回歸平方和ESS/Y的總離差TSS樣本決定系數(shù)的取值范圍:[0,1]R2越接近1,說(shuō)明實(shí)際觀測(cè)點(diǎn)離樣本線越近,擬合優(yōu)度越高。經(jīng)變換發(fā)現(xiàn),R與X,Y的相關(guān)系數(shù)r值相同。可通過(guò)R與r進(jìn)行X與Y的線性相關(guān)性檢驗(yàn),查書(shū)后附表1。

二、變量的顯著性檢驗(yàn)

回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個(gè)顯著性的影響因素。即判斷X是否對(duì)Y具有顯著的線性性影響。這就需要進(jìn)行變量的顯著性檢驗(yàn)。

變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中的假設(shè)檢驗(yàn)。

計(jì)量經(jīng)計(jì)學(xué)中,主要是針對(duì)變量的參數(shù)真值是否為零來(lái)進(jìn)行顯著性檢驗(yàn)的。

1、假設(shè)檢驗(yàn)

所謂假設(shè)檢驗(yàn),就是事先對(duì)總體參數(shù)或總體分布形式作出一個(gè)假設(shè),然后利用樣本信息來(lái)判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè)。假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法。先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生”這一原理的

2、變量的顯著性檢驗(yàn)

當(dāng)總體方差已知時(shí),估計(jì)量標(biāo)準(zhǔn)化后仍服從正態(tài)分布當(dāng)總體方差未知時(shí),且小樣本情況下,則用代替估計(jì)量標(biāo)準(zhǔn)化后服從自由度與Se2相同的t分布

檢驗(yàn)步驟:

(1)對(duì)總體參數(shù)提出假設(shè)

H0:1=0,H1:10(2)以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量,并由樣本計(jì)算其值(3)給定顯著性水平,查t分布表,得臨界值t/2(n-2)(4)比較,判斷若|t|>t/2(n-2),則拒絕H0

,接受H1

;

若|t|

t/2(n-2),則拒絕H1

,接受H0

;

對(duì)于一元線性回歸方程中的0,可構(gòu)造如下t統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn):

t統(tǒng)計(jì)量的計(jì)算結(jié)果分別為:

給定顯著性水平=0.05,查t分布表得臨界值

t0.05/2(8)=2.306|t1|>2.306,說(shuō)明家庭可支配收入在95%的置信度下顯著,即是消費(fèi)支出的主要解釋變量;

|t2|<2.306,表明在95%的置信度下,無(wú)法拒絕截距項(xiàng)為零的假設(shè)。

回歸方程的顯著性檢驗(yàn)總離差平方和分解式:自由度:可自由取值變量個(gè)數(shù)受約束,自由度為n-1回歸平方和的自由度取決于解釋變量的個(gè)數(shù)回歸平方和的自由度與總殘差平方和的自由度之和等于總平方和的自由度,因此,殘差平方和自由度為n-2回歸方程的顯著性檢驗(yàn)可以證明:服從各自自由度的卡方分布分布設(shè)Yi~N(μ,σ2),則,Yi=(Yi-μ)/σ~N(0,1)χ2分布:F分布:設(shè)U是服從自由度為n1的χ2分布的隨機(jī)變量,即U~χ2(n1),V是服從自由度為n2的χ2分布的隨機(jī)變量,即V~χ2(n2),且U和V相互獨(dú)立,則:

檢驗(yàn)步驟:

(1)對(duì)總體參數(shù)提出假設(shè)

H0:1=0,H1:10(2)計(jì)算統(tǒng)計(jì)量(3)給定顯著性水平,查F分布表,得臨界值F(1,n-2)(4)比較,判斷若F>F

(1,n-2),則拒絕H0

,接受H1

;

若F

F(1,n-2),則拒絕H1

,接受H0

;§2.4一元線性回歸分析的應(yīng)用:預(yù)測(cè)問(wèn)題

一、?0的點(diǎn)預(yù)測(cè)二、區(qū)間預(yù)測(cè)

對(duì)于一元線性回歸模型

給定樣本以外的解釋變量的觀測(cè)值X0,可以得到被解釋變量的預(yù)測(cè)值?0

。

注意:嚴(yán)格地說(shuō),這只是被解釋變量的預(yù)測(cè)值的估計(jì)值,而不是預(yù)測(cè)值。原因:(1)參數(shù)估計(jì)量不確定;(2)隨機(jī)項(xiàng)的影響2、單個(gè)值的區(qū)間估計(jì)

由Y0=0+1X0+

知:

于是

式中

:從而在1-的置信度下,Y0的置信區(qū)間為

其中于是,在1-的置信度下,總體均值E(Y|X0)的置信區(qū)間為

均值的區(qū)間估計(jì)

作為的預(yù)測(cè)值,由于在上述收入-消費(fèi)支出例中,得到的樣本回歸函數(shù)為

則在X0=1000處,?0=–103.172+0.777×1000=673.84

而因此,總體均值E(Y|X=1000)的95%的置信區(qū)間為:

673.84-2.30661.05<E(Y|X=1000)<673.84+2.30661.05或

(533.05,814.62)

同樣地,對(duì)于Y在X=1000的個(gè)體值,其95%的置信區(qū)間為:

673.84-2.306131.2<Yx=1000<673.84+131.2或(372.03,975.65)總體回歸函數(shù)的置信帶(域)(confidenceband)個(gè)體的置信帶(域)

對(duì)于Y的總體均值E(Y|X)與個(gè)體值的預(yù)測(cè)區(qū)間(置信區(qū)間):(1)樣本容量n越大,預(yù)測(cè)精度越高,反之預(yù)測(cè)精度越低;(2)樣本容量一定時(shí),置信帶的寬度當(dāng)在X均值處最小,其附近進(jìn)行預(yù)測(cè)(插值預(yù)測(cè))精度越大;X越遠(yuǎn)離其均值,置信帶越寬,預(yù)測(cè)可信度下降?!?.5實(shí)例:時(shí)間序列問(wèn)題

一、中國(guó)居民人均消費(fèi)模型

二、時(shí)間序列問(wèn)題

一、中國(guó)居民人均消費(fèi)模型

例2.5.1

考察中國(guó)居民收入與消費(fèi)支出的關(guān)系。GDPP:

人均國(guó)內(nèi)生產(chǎn)總值(1990年不變價(jià))CONSP:人均居民消費(fèi)(以居民消費(fèi)價(jià)格指數(shù)(1990=100)縮減)。該兩組數(shù)據(jù)是1978~2000年的時(shí)間序列數(shù)據(jù)(timeseriesdata);

1、建立模型

擬建立如下一元回歸模型

采用Eviews軟件進(jìn)行回歸分析的結(jié)果見(jiàn)下表

前述收入-消費(fèi)支出例中的數(shù)據(jù)是截面數(shù)據(jù)(cross-sectionaldata)。一般可寫(xiě)出如下回歸分析結(jié)果:

(13.51)(53.47)R2=0.9927F=2859.23DW=0.5503

2、模型檢驗(yàn)

R2=0.9927T值:C:13.51,GDPP:53.47

臨界值:t0.05/2(21)=2.08斜率項(xiàng):0<0.3862<1,符合絕對(duì)收入假說(shuō)3、預(yù)測(cè)

2001年:GDPP=4033.1(元)(90年不變價(jià))點(diǎn)估計(jì):CONSP2001=201.107+0.38624033.1=1758.7(元)

2001年實(shí)測(cè)的CONSP(1990年價(jià)):1782.2元,

相對(duì)誤差:-1.32%。

2001年人均居民消費(fèi)的預(yù)測(cè)區(qū)間

人均GDP的樣本均值與樣本方差:

E(GDPP)=1823.5Var(GDPP)=982.042=964410.4

在95%的置信度下,E(CONSP2001)的預(yù)測(cè)區(qū)間為:

=1758.740.13或:(1718.6,1798.8)

同樣地,在95%的置信度下,CONSP2001的預(yù)測(cè)區(qū)間為:

=1758.786.57或

(1672.1,18

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論