新雙變量回歸區(qū)間估計與假設(shè)檢驗_第1頁
新雙變量回歸區(qū)間估計與假設(shè)檢驗_第2頁
新雙變量回歸區(qū)間估計與假設(shè)檢驗_第3頁
新雙變量回歸區(qū)間估計與假設(shè)檢驗_第4頁
新雙變量回歸區(qū)間估計與假設(shè)檢驗_第5頁
已閱讀5頁,還剩96頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第5章雙變量回歸:區(qū)間估計與假設(shè)檢驗暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計學(xué)系靜2013/9/281暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜5.2

區(qū)間估計—一些基本概念OLS得出的參數(shù)點估計是無偏估計,但是某一次抽樣得出的點估計的值不會恰好等于參數(shù)的真實值,那么估計值到底距離真實值有多“近”?能否構(gòu)造一個包含真實值的區(qū)間?因此提出了置信區(qū)間。2013/9/282暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜5.2

區(qū)間估計—一些基本概念區(qū)間估計的思想:對于已有的點估計如?2,希望基于這一點估計構(gòu)造一個區(qū)間,使總體真值2以較高的概率被包含在這一區(qū)間內(nèi),既然是區(qū)間,所要解決的問題就是如何構(gòu)造即確定區(qū)間的左右端點(

一般考慮對稱區(qū)間),且這種區(qū)間如何與概率(顯著性水平)相聯(lián)系?2013/9/283暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜置信區(qū)間由于標(biāo)準(zhǔn)差是度量估計量的精度,所以可利用標(biāo)準(zhǔn)差來構(gòu)造置信區(qū)間,這樣,形成區(qū)間估計可以表述為:確定決定區(qū)間的數(shù)

(基于標(biāo)準(zhǔn)差)和顯著性水平,使總體參數(shù)2被包含在這一區(qū)間的概率(置信水平)為1

:Pr(?

?

)

1

2

2

22013/9/284暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜注釋22置信區(qū)間:?

2置信系數(shù):1

顯著性水平:置信下限:?

置信上限:?

2013/9/285暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜進(jìn)一步解釋置信區(qū)間是根據(jù)點估計量?

構(gòu)造出來的一個區(qū)間,2要使得它把總體參數(shù)的真值包括在區(qū)間內(nèi)的概率為1

,從而區(qū)間估計量給出了一個真實2所在

其中的數(shù)值范圍。若

5%,則置信水平為95%,那么置信區(qū)間包含真實2的概率就為95%。2013/9/286暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2

2

2Pr(?

?

)

1

的說明:正確表述:置信區(qū)間包含真實參數(shù)2的概率為1錯誤表述:2落入?yún)^(qū)間的概率為1

。置信區(qū)間是根據(jù)點估計量?

構(gòu)造的,所以是隨機(jī)區(qū)間。2因為不同的樣本估計得出的?

是不同的,?

是隨機(jī)的。2

2在重復(fù)抽樣中,平均來看,有100%(1-)次包含著總體參數(shù)的真值。只要?

不知道,則這個置信區(qū)間為隨機(jī)區(qū)間。2一旦樣本確定,估計出一個?2的值,這時就是一個固定區(qū)間了,這是真實2或在區(qū)間內(nèi),或在區(qū)間外,從而概率只能是1或0。2013/9/287暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2212i22221

122??)nxx2112

22

2

Xvar(

)?N

(

,

)?N

(

,

2i

i5.3

回歸系數(shù)1

和2

的置信區(qū)間在擾動項服從正態(tài)分布的假定下,估計的系數(shù)?

和?12都服從正態(tài)分布。均值:

E(?

)

E(?

)

1

1

2方差:var(

):

2x?se(?2

)(?

)2

2i

2 2

Z

以?

為例進(jìn)行分析,標(biāo)準(zhǔn)化變量:2若總體方差

2已知,則利用正態(tài)分布來進(jìn)行分析。2013/9/288暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2222?xse(

)?

t

(?

)t(n

2)2

2

i?若總體方差

2未知,則只能用估計的方差?2來進(jìn)行代替。這時回歸系數(shù)的分布將會發(fā)生變化,服從t分布。估計量

假設(shè)的真實參數(shù)注意理解:在對點估計量?

進(jìn)行標(biāo)準(zhǔn)化的過程估計量的標(biāo)準(zhǔn)誤的估計值2中,由于隨機(jī)干擾項的方差未知,用殘差的方差來代替,就使得標(biāo)準(zhǔn)化后的量服從t分布。2013/9/289暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜

2

2

222se(?

)2

/

2

/

2

/

2

/

22

/

2

/

2Pr(t

t

t

)

Pr

t

(?

)

t

/

2

Pr[?

t2

2

2se(?

)

?

tse(?

)]

1?

t

se(?

)用t分布來建立置信區(qū)間:Pr(t

2

t

t

2

)

1

2的置信區(qū)間為:2013/9/2810暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2013/9/2811暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜22

22

/

2

/

2

2

(n

2)

?2

2?22

21

/

2?21

/

2

2~ (n

2)Pr(

)

1

Pr[(n

2)

(n

2)]

1

5.4

2

的?

置信區(qū)間利用

2分布建立

2

的置信區(qū)間:在ui的正態(tài)性假定下,變量:2013/9/2812暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2013/9/2813暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜5.5

假設(shè)檢驗虛擬假設(shè):通常是研究者(對某一回歸參數(shù)的)非預(yù)期取值的一種表述。虛擬假設(shè)的表示是在非預(yù)期的取值范圍前加上符號“H0:”。例如,如果你預(yù)期系數(shù)是正值,那么0或負(fù)的系數(shù)就是非預(yù)期的取值范圍,于是虛擬假設(shè)為:虛擬假設(shè)H0

:

0(這是你的非預(yù)期的取值范圍)2013/9/2814暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜備選假設(shè):通常是對研究者預(yù)期取值的表述。備選假設(shè)的表示是在預(yù)期取值范圍的表述前加上符號“H

A:”。繼續(xù)的例子,如果你預(yù)期系數(shù)是正值,那么備選假設(shè)是:備選假設(shè)HA

:

0(?這是你所預(yù)期的取值范圍)注:上述假設(shè)是針對單側(cè)(或單尾)檢驗而言的,因為備選假設(shè)的取值位于虛擬假設(shè)的一側(cè)。另法是使側(cè)檢驗:H0

:

0

HA

:

02013/9/2815暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜假設(shè)檢驗:置信區(qū)間的方法2013/9/2816暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜22

/2se(?)?

t22

/2se(?

)?

t1

2

222222

/2

/2P[?

tse(?

)

?

tse(?

)]

1

在假設(shè)H0下,落入此區(qū)間的2值有100(1

)%性,因而,若2果真落入此區(qū)域,就不能H00決策規(guī)則:構(gòu)造一個2的100(1

)%置信區(qū)間。若在假設(shè)H0下的2落入此區(qū)間,就不要

H0。172013/若9/28落在此區(qū)間之外暨南,大學(xué)則經(jīng)濟(jì)要學(xué)院拒統(tǒng)計絕系靜。1.檢驗回歸系數(shù)的顯著性:t檢驗顯著性檢驗:是構(gòu)造一個合適的統(tǒng)計量(作為估計量),以及在原假設(shè)之下的抽樣分布(本課程基于經(jīng)典的統(tǒng)計量,其分布已知),通過計算這一統(tǒng)計量的樣本值,進(jìn)而與臨界值比較,如落入接受域,則不原假設(shè),而不落入接受域即落入域,則原假設(shè)。幾乎所有假設(shè)檢驗,均按這一原理而實現(xiàn)。假設(shè)檢驗:顯著性檢驗法2013/9/2818暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜檢驗是:設(shè)定原假設(shè)和備選假設(shè),構(gòu)造統(tǒng)計量以及推導(dǎo)它在原假設(shè)下的分布,利用這一分布檢驗假設(shè),所以這種思想實質(zhì)上是先行假定原假設(shè)為真,從而有統(tǒng)計量在原假設(shè)下的分布,基于此檢驗假設(shè)。假設(shè)檢驗:顯著性檢驗法2013/9/2819暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜

2

2

2

0.0357se(?

)?(

)0.5091

0.3t

5.86第一步:建立原假設(shè)和備擇假設(shè)H0:2

0.3H1:2

0.3第二步:根據(jù)回歸估計得出?

0.5091,se(?)

0.03572

2根據(jù)樣本信息和H

假設(shè)下的

0.3計算t值0

2t檢驗法:第三步:確定顯著性水平為5%,

度為n

2,則查t分布表得出臨界值t

2

2.306,t

t

2,則度為n

2,臨界值H0。2013/9/2820暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜t

Distribution()0f(t)-tc/2tc

t/2RejectregionRejectregionRegion

of

acceptancered

area

=

rejection

region

for

2-sided4.t13e

st2013/9/2821暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜4.25One-tailed

t-test

decision

ruleLeft-tail(If t

<

-

tc(If t

>

-

tc==> reject

H0

)==> not

reject H0

)Decision

RuleStep

5:

If t

>

tcIf t

<

tc==> reject

H0==> not

reject

H0Right-tail0tc

<

tRight-tail0t

<

-tcleft-tail2013/9/2822暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜

2

2

2222*se(?

)?2

/

2se(

)?(

)t

t(n

2)(?

)t

/

2

]

1

Pr[

*

t

se(?

)

?

t

/

2

se(?

)]

1

2

2

2

2t檢驗的實質(zhì)理解:置信區(qū)間:Pr[t/2

?

?2

/

2)

2

2

2*

t

se(?

)]

1

/

2

2這一式子的意義為:在假定

時,?

以概率1-落入其中的區(qū)間2

2

2[

*

tse(?

)]。若估計的?

落在這個區(qū)間外,則2

/

22

2原假設(shè)H

,若落0在區(qū)間內(nèi),則不能。例:根據(jù)Pr[

*

t

se(得出:Pr[0.2177

?

0.3823]

0.9522?

0.5091,不在這個區(qū)間內(nèi),因此

原假設(shè)H

。02013/9/2823暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜*0

2由此可以看出:置信區(qū)間檢驗方法中,是根據(jù)估計的?2構(gòu)造一個以以某種概率包含有真實但未知的或假設(shè)的2的一個范圍或區(qū)間。在顯著性檢驗中,則是根據(jù)原假設(shè)H

下的假設(shè)的

構(gòu)造區(qū)間,看估計的?

是否在這個區(qū)間范圍內(nèi),若在區(qū)間內(nèi),則不能

。2若在區(qū)間外,則

原假設(shè)。t顯著性檢驗和置信區(qū)間檢驗的區(qū)別2013/9/2824暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜置信區(qū)間和顯著性檢驗的比較采用估計的?

來構(gòu)造2區(qū)間以某概率包含真值2置信區(qū)間檢驗:。,看估計的?

是否落入置信區(qū)顯著性檢驗:用H0假設(shè)下的2構(gòu)造區(qū)間2間范圍內(nèi)。2P[?

t

se(?

)

?

t2

/2

2

2

2

/2se(?

)]

1*222

/2

/2Pr[

t

se(?

)

?

*2

2

t

se(?

)]

1

2013/9/2825暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜*222

/2

/2Pr[

t

se(?

)

?

*2

2

t

se(?

)]

1

看估計的?是否落入置信區(qū)顯著性檢驗:用H0假設(shè)下的2構(gòu)造區(qū)間,2間范圍內(nèi)。2013/9/2826暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜22

/2P[?

tse(?

)

?

t2

2

2

/2se(?

)]

12采用估計的?

來構(gòu)造置信區(qū)間檢驗:區(qū)間以某概率包含真值2。2013/9/2827暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜顯著性檢驗——說明顯著性檢驗的實質(zhì):建立真值或總體的某一特定值的原假設(shè)和備選假設(shè),在原假設(shè)下構(gòu)造統(tǒng)計量和它的分布,

并在原假設(shè)建立有關(guān)估計量的置信區(qū)間,最后

估計的值是否落入置信區(qū)間之內(nèi)還是之外,若落入之內(nèi),不能

原假設(shè),否則

原假設(shè)。這一問題可轉(zhuǎn)化為,如計算的t值較大,即可成為原假設(shè)的

。2013/9/2828暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜t檢驗——注釋如果一個統(tǒng)計量的值落在

域內(nèi),則原假設(shè),這個統(tǒng)計量是統(tǒng)計上顯著的。如果一個統(tǒng)計量的值落在接受域內(nèi),則不能

原假設(shè),這個統(tǒng)計量是統(tǒng)計上不顯著的。2013/9/2829暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜右單側(cè)檢驗:H0:2

0.5H1:2

0.52013/9/2830暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2013/9/2831暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜關(guān)于

2的顯著性檢驗:

2

(n

2)

?2

2~

2(n

2)用這一統(tǒng)計量進(jìn)行顯著性檢驗,其決策機(jī)制列入表5.2.2013/9/2832暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2013/9/2833暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2

201?2這顯然是雙尾檢驗,

2

(n

2)

~

2

(n

2),給出了檢驗這2

85?

H

例子:前述消費與收入模型,所計算的?2

42.1591,d.f

.

8如設(shè)定原和備假設(shè)為:H

2

2(10.05/

2) (0.05/

2)2

一假設(shè)的統(tǒng)計量,將?2

42.1591,d.f

.

8代入(在原假設(shè)之下),有計算的值為?2(8)*

23.97選定顯著性水平0.05,可查得

2的兩個臨界值分別為(8)

2.1797和

(8)

17.5346,

接表5.2中的第三行的雙尾決策規(guī)則,由計算的2.18<

2

3.97

17.54即落入這兩個臨界值所界定的區(qū)域之內(nèi),故不

原假設(shè)。2013/9/2834暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜接受與

的含義對于顯著性檢驗(如t檢驗),當(dāng)計算的統(tǒng)計量值落入接受域中,因此其含意為,根據(jù)樣本

,接受原假設(shè),沒有理由拒絕原假設(shè);而并非是指,原假設(shè)一定為真。為什么?對于已決定接受的原假設(shè),若與之類似的另一原假設(shè)( 只是沒有設(shè)定),通過相同的步驟,有可能結(jié)果為接受這一新的原假設(shè),若如此,哪一個原假設(shè)為真?通過假設(shè)檢驗還無法決定。2013/9/2835暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2例子:仍就前述收入與消費,設(shè)定H

01

2 0

.

5

,?而

=

0

.

5

0

9

1

標(biāo)

準(zhǔn)

se(?)

0

.

0

3

5

7

,2而計算的統(tǒng)計量為t

(

0

.

5

0

9

1

0

.

5

)

0

.

2

50

.

0

3

5

7這一數(shù)值落入接受域中(為什么?),所以接受H

0

1現(xiàn)在再設(shè)定H

02

2 0.4

8

,于是可以計算t

(

0

.

5

0

9

1

0

.

4

8

)

0

.

8

20

.

0

3

5

7顯然0.8

2

再次落入接受域內(nèi),故應(yīng)接受H

02

。對于H

0

1和

H

02

, 基

統(tǒng)

,唯一能確定的是兩個原假設(shè)能被接受,或均不能被拒絕。所以,在接受一個原假設(shè)時,有可能另一個原假設(shè)(未設(shè)定而己)也不能被。于是,只是說這一原假設(shè)不能被,而不是說確定要接受它。但為2方013/便9/28,常用接受原暨南假大學(xué)設(shè)經(jīng)濟(jì)學(xué)。院統(tǒng)計系靜

36“零”原假設(shè)與“2-t”法則在計量經(jīng)濟(jì)學(xué)中,常常要檢驗?zāi)骋粋€變量對于應(yīng)變量的解釋能力,或變量是否有顯著性影響,這一問題就表述為對應(yīng)的系數(shù)是否可約束為零,對于收入與消費模型,這個問題即為H0:2

0,即零原假設(shè)或簡稱為零假設(shè)。2013/9/2837暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2倍t法則零假設(shè)檢驗有一常用的法則:“2倍t法則”:如果

度大于或等于20,顯著性水平為0.05,則所計算的(t

t=(?

0)

/

se(?

))的絕對值超2

2過2時,就可以零假設(shè)H0:2

0。2013/9/2838暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜建立原假設(shè)與備選假設(shè)一般而言,建立原和備假設(shè)沒有一個的規(guī)則,通常是基于所研究的問題而定,或者是基于檢驗?zāi)康模缭谀P椭袘?yīng)檢驗?zāi)承┗蚰硞€變量的顯著性,則建立對應(yīng)的系數(shù)為零作為原假設(shè)。另一方面,有些假設(shè)通常是根據(jù)所研究的問題所隱含的意義而建立,這樣的假設(shè)往往具有較為豐富的經(jīng)濟(jì)學(xué)意義?;蛘呤怯山?jīng)濟(jì)學(xué)金融學(xué)理論或?qū)嶋H經(jīng)濟(jì)行為

而建立假設(shè)。通過檢驗假設(shè)來證實經(jīng)濟(jì)學(xué)理

論或?qū)嶋H行為的正確與否。2013/9/2839暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜顯著性水平通常選定的顯著性水平,其實質(zhì)含義為犯第I類錯誤的概率,所謂第I類錯誤是指,在原假設(shè)為真時,

這一正確的原假設(shè),即去真。而對應(yīng)的取偽的概率即為犯第II類錯誤的概率,即接受了錯誤的假設(shè)的概率。一般而言,計量經(jīng)濟(jì)學(xué)中的假設(shè)檢驗將犯第I類錯誤的概率定在=0.05,或0.01,或0.10。所謂檢驗勢(power

of

thetest)定義為1-Pr.(犯第II類錯誤),這是目前在仿真實驗中所使用的概念,它主要用在計量經(jīng)濟(jì)學(xué)的理論研究中,以此評價所構(gòu)造的統(tǒng)計量的檢驗?zāi)芰?。一般而言,檢驗勢高,表明這一統(tǒng)計量的檢驗?zāi)芰蛷?qiáng)。2013/9/2840暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜精確的顯著性水平—p值2013/9/2841暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜的p值表示所設(shè)定的原假設(shè)可被最低的顯著性水平,或精確的,或者是犯第I類錯誤的概率。p值與顯著性水平關(guān)系,如果要選定,那么,當(dāng)p值小于或等于,則在水平上不

原原假設(shè)。反之,

假設(shè)。上與其人為地把固定在某一水平,不如干脆選取檢驗統(tǒng)計量的P值,讓讀者去決定是否在計算的P值水平

原假設(shè)。統(tǒng)計顯著性——解釋????iiiiit?ise(?

)統(tǒng)計顯著性:用tt

臨界值

原假設(shè),統(tǒng)計上是顯著的。t

臨界值

不能

原假設(shè),統(tǒng)計上不顯著。來進(jìn)行判斷。主要是判斷利用樣本估it

大,若在5%的顯著性水平上原假設(shè)H

0,表明估計

?

(H

假設(shè)下的值)i

i

0計的?與假設(shè)總體的真值之間是否有顯著性的差異。的?在5%的水平上顯著地異于假設(shè)的

。i

i2013/9/2842暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜

?

?

22

2

2比如,原假設(shè)H0為:2

0.61,這是在假設(shè)檢驗過程中,研究者對總體參數(shù)的一個假設(shè)的真值。而利用樣本估計的?

0.5091。se(?

)

0.0357,

度為8,若選取

5%,22則t

2.306,則置信區(qū)間t

se(

)區(qū)間為:0.4268,0.5914

,2

0

2假,這個區(qū)間沒有包含有95%的把握的設(shè)的0.61

原假設(shè)。因此可以判斷:估計值0.5091是統(tǒng)計上是顯著的,也就是說,估計值顯著異于0.61。即?

=0.5091顯著地異于H

0.61,這就是統(tǒng)計上的顯著性?;蛘咧苯佑胻

2

2.306

1.96(臨界值),

原假設(shè),統(tǒng)計上顯著。2013/9/2843暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜ii

i(或符號)有關(guān)系。若估計的值?與假設(shè)值

實際的經(jīng)濟(jì)實際顯著性:實際的經(jīng)濟(jì)效應(yīng)的差異性。與?的大小??

ii

的正負(fù)號很小時的變量會有“錯誤的”符號。即效應(yīng)有顯著差異,則存在實際顯著性。一般而言,統(tǒng)計顯著性均產(chǎn)生實際顯著性。注:當(dāng)統(tǒng)計上顯著時,要估計系數(shù)的大小及其在實際經(jīng)濟(jì)中的重要性或經(jīng)濟(jì)含義。若統(tǒng)計上不顯著時,仍然要考慮該變量對被解釋變量是否具有預(yù)期的影響,這個影響在實踐中是否很大,并由實際計算的P值來探討。通常,t可能有誤,就其原因,可能是多重共線性等原因造成。2013/9/2844暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜11

MPC例如:由于2表示邊際消費傾向MPC,則收入乘數(shù):?

MPC

0.5091,則所產(chǎn)生的收入乘數(shù)為2.04;即=2增加1

的開支,將導(dǎo)致收入最終增加2.04元,而當(dāng)2=MPC=0.61時,收入乘數(shù)為2.56,顯然,不能將2.04等同于2.56,因此統(tǒng)計的顯著性,產(chǎn)生了實際結(jié)果的顯著性。2013/9/2845暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜t檢驗的局限性關(guān)于t-檢驗的一個問題是它很容易被

,由于計算機(jī)回歸 包可以直接提供t比率的計算結(jié)果,t-檢驗很容易操作,所以初學(xué)者有時就試圖運用t檢驗來“證明”一些它不可能檢驗的事情。所以,了解t檢驗的局限性就同了解其應(yīng)用方法同等的重要。t-檢驗最主要的局限性可能就在于,隨著需要估計和檢驗的設(shè)定越來越多,t-檢驗的價值迅速下降。2013/9/2846暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜回想一下,t檢驗的目的在于:幫助研究者基于總體的一個樣本所得到的估計值,對總體的某一假定系數(shù)進(jìn)行推斷。

一些初學(xué)者則認(rèn)為:所有在統(tǒng)計上顯著的結(jié)果在理論上都是正確的。這樣的結(jié)論是很的,因為它

了統(tǒng)計顯著性和理論有效性的含義。2013/9/2847暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2013/9/2848暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜本例的陷阱在于,P

是消費者價格指數(shù)而C是英國的累積降雨量!

剛剛表示了降雨對解釋消費者價格指數(shù)是統(tǒng)計顯著的,那么這一結(jié)果是否也意味著隱含的理論也是成立的呢?當(dāng)然不是。那么,為什么統(tǒng)計結(jié)果會如此顯著呢?答案是,方程兩邊湊巧具有同趨勢,且這種同趨勢本身沒有任何的含義。有一條原則必須清楚:

由t檢驗得出的統(tǒng)計顯著性等同于理論的有效性。2013/9/2849暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜估計系數(shù)湊巧在與假設(shè)相反的方向上顯著。

一些初學(xué)者就試圖改變他們的假設(shè)。例如,一個學(xué)生進(jìn)行回歸分析,其假設(shè)的符號是正的,但卻得到“統(tǒng)計上顯著”的負(fù)值,在對這一問題“重新考慮”以后,便試圖改變他們的理論預(yù)期,轉(zhuǎn)而“預(yù)期”為負(fù)號。盡管

贊同基于新的證據(jù)對不正確的理論進(jìn)行重新檢驗,但一般而言這些新的

本質(zhì)上應(yīng)具有理論上的合理性。2013/9/2850暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜在上面的例子中,應(yīng)當(dāng)關(guān)注為什么沒有支持理論,而不能因為缺乏支持就完全改變理論本身。如果使研究者重新考慮模型的理論基礎(chǔ)并且發(fā)現(xiàn)有錯誤,那么虛擬假設(shè)就需要修改,但是新的假設(shè)必須使用完全不同的數(shù)據(jù)集進(jìn)行檢驗。畢竟,已經(jīng)知道如果用原數(shù)據(jù)集進(jìn)行檢驗會得到什么樣的結(jié)果。2013/9/2851暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜t檢驗不是檢驗變量的“重要性”回歸方程的一種可能的用途是有助于判定哪個自變量對應(yīng)變量具有最大的相對效應(yīng)(重要性)。一些初學(xué)者容易得出一個不可靠的結(jié)論:回歸模型中最具統(tǒng)計顯著性的變量,因其解釋了應(yīng)變量變動的最大部分而被認(rèn)為是最重要的變量。2013/9/2852暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜統(tǒng)計顯著性所指的是偶然獲得一個特定的樣本結(jié)果的可能性,而幾乎不反映哪個變量決定了應(yīng)變量變動的最大份額。為了確定變量的重要性,以其系數(shù)乘以自變量的平均值或標(biāo)準(zhǔn)誤,其數(shù)值結(jié)果的大小更能反映自變量對應(yīng)變量變動的解釋能力。盡管目前已經(jīng)建立了一些評價

“重要性”的統(tǒng)計指標(biāo),但由于多重共線性(將在第8章 )的影響,其中沒有一個是完全令人滿意的。2013/9/2853暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2013/9/2854暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜552013/9/28暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜t檢驗不能擴(kuò)展到檢驗整個總體t檢驗從總體(從中抽取樣本的那個群體)的一個樣本所計算的估計值對總體參數(shù)的真值進(jìn)行推斷。隨著樣本容量逐漸接近總體規(guī)模,系數(shù)的無偏估計趨向于總體的真值。如果系數(shù)是由整個總體計算出來的,那么無偏估計值本身就是總體真值,t-檢驗對于檢驗總體參數(shù)就幾乎沒有任何意義。2013/9/2856暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜有些人可能忽視了這一性質(zhì),而過于強(qiáng)調(diào)由規(guī)模近似于總體的樣本中所得到的t-值的重要性。實際上,

t檢驗所能提供的所有信息,只不過是在基于一個特定的小樣本

關(guān)于總體參數(shù)真值的假設(shè)時,幫助研究者確定犯錯誤的可能性。2013/9/2857暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜要理解這一點,也許最好的辦法是牢記t比率等于系數(shù)的估計值除以它的標(biāo)準(zhǔn)誤。2013/9/2858暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜5.9

回歸分析與方差分析222

22????2i

i

i

2

i

iy

y

u

x

u

離差平方和分解:TSS

ESS

RSS得出總平方和分解為兩個構(gòu)成部分:回歸(解釋)平方和與殘差或剩余平方和。對這些構(gòu)成部分進(jìn)行研究就叫做從回歸的角度做方差分析。2013/9/2859暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2013/9/2860暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2i(x

x

)s2

i1

度:當(dāng)以樣本統(tǒng)計量來估計總體參數(shù)時。樣本中能獨立或

變化的數(shù)據(jù)的個數(shù)。例如:樣本方差nn

1n

1為

度度樣本方差中的(degree

offreedom)2013/9/2861暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜度樣本方差中的(degree

offreedom)1、度:指數(shù)據(jù)個數(shù)減去附加給獨立觀測值的約束或限制的個數(shù),即一組數(shù)據(jù)中可以取值的數(shù)據(jù)的個數(shù)2、當(dāng)樣本數(shù)據(jù)的個數(shù)為n

時,若樣本均值x確定后,只有n-1個數(shù)據(jù)可以取值,其中必有一個數(shù)據(jù)則不能取值。按著這一邏輯,如果對n個觀測值附加的約束個數(shù)為k個,度則為n-k。2013/9/2862暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜度(degree

of

freedom)1.

樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則

x=5。當(dāng)

x

=

5

確定后,x1,x

和x3有兩個數(shù)據(jù)可以取值,另一個則不能

取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值3.2.

為什么樣本方差的

度是n-1呢?因為在計算離差平方和時,必須先求出樣本均值x

,而x則是附加給離差平方和的一個約束,因此,計算離差平方和時只有n-1個獨立的觀測值,而不是n個度(n-1)保證了樣本方差是總體方差的無偏估計2013/9/2863暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜雙變量回歸模型的方差分解表2013/9/2864暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜方差分析中的

度解釋:22222?和?

就是約束條件,因此RSS

的1

2??????i

i2i

2ii

2y

X

)

12

i

(Y

Y

)

(

Y

?y

(Y

Y

)2,Y

就是一個約束條件,度為n

1.x

,當(dāng)x

給定時僅是

的函數(shù),TSS

TSS的ESS

ESS

的RSS

u

2

i

i

i

i度為1

k

1)度為n

2(即n

k

).總之,

由于回歸所產(chǎn)生的總離差平方和的

度為

n

1

,它分解為回歸平方和(

度為

1

與殘差平方和(

度n

2

)之和。2013/9/2865暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜222?

??xxESS

/1F

F

(1,

n

2)RSS

/

(n

2)u

/

(n

2)2

2i2

2i?2

i在擾動ui為正態(tài)分布且在H0

:2

=0之下,下式表示的F

統(tǒng)計量服從F(1,n

2)分布0.05ESS

/1RSS

/

(n

2)F

F

(1,n

2)F

統(tǒng)計量可以看作是來自X

的均方與來自殘差的均方之比。后者可以看作是系統(tǒng)的“噪音”,X的影響只有在其影響超過系統(tǒng)內(nèi)在的噪音水平時才會被察覺,于是X

的顯著性可以通過檢驗樣本的F

值是否超過F

分布上側(cè)的適當(dāng)臨界值加以檢驗。若:H0

:2

=0,其中F0.05表示該分布只則在5%的顯著性水平上有5%的概率落入

區(qū)域2013/9/2866暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜

22222222???iEx

)

xu

/

(n

2)

E

2

i

2

i可以證明:E((5.9.2)

(5.9.3)2若

=0,上述兩式都給出了相同的真實

的估計,這時解2釋變量X

對Y沒有任何線性影響,Y的變異全部由隨機(jī)干擾項ui來解釋。若2

0,上述兩式將會有所不同,Y的部分變異歸因于X,即解釋變量X

對Y有線性影響。因此,F(xiàn)統(tǒng)計量實際上提供了對H0:2=0的一個檢驗。在一元線性回歸中,t檢驗和F檢驗是等價的:t2

m

F(1,m)注意:在多元線性回歸中,F(xiàn)檢驗是檢驗整個模型是否顯著。2013/9/2867暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜The

F-Distribution,

F(m,n)F0

1.0Nonnegative

values

onlyNot

symmetric(skewed

to

the

right)Ea ember

of

the

family

isdetermined

by

twoparameters:the

numerator

degrees

offreedom

(m)

and

thedenominator

degrees

of

freedom(n).Chap

10-

5

68Ka2-f0u

1W3o/ng9/?228003暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜”下拉菜單第1步:進(jìn)入Excel表格界面,選擇“第2步:選擇“函數(shù)”點擊第3步:在函數(shù)分類中點擊“統(tǒng)計”,函數(shù)名的菜單下選擇字符正態(tài)分布:“NORMSINV”:已知概率水平,求x的值或z值“NORMSDIST”:已知X或Z值,求相應(yīng)的概率t分布:“TINV”:知道概率值和

度,求t臨界值“TDIST”:知道t值,

度和單側(cè)或雙側(cè)檢驗,求概率值Excel求相關(guān)值

令2013/9/2869暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜Excel求F值

令第1步:進(jìn)入Excel表格界面,選擇“

”下拉菜單第2步:選擇“函數(shù)”點擊第3步:在函數(shù)分類中點擊“統(tǒng)計”,函數(shù)名的菜單下選擇字符“FINV”就可以求出相應(yīng)的F臨界值求概率值:“FDIST”卡方分布:“CHIINV”:知道概率值和

度,求臨界值求概率值:“CHIDIST”2013/9/2870暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜F

202.87

F臨界值

5.3176,所以H0:2

=02013/9/2871暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜精確概率P值

5.75252E

07,P遠(yuǎn)遠(yuǎn)小于

0.05,所以H0:2

=02013/9/2872暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜F檢驗和t檢驗——一個注釋在一元線性回歸中,自變量x只有一個,則此時F檢驗和t檢驗是等價的,即若原假設(shè)被t檢驗,則也將被F檢驗

。在多元回歸分析中,自變量x有多個,則此時F檢驗和t檢驗的意義是不同的。F檢驗:

檢驗總體回歸關(guān)系的顯著性t檢驗:檢驗各個回歸系數(shù)的顯著性2013/9/2873暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜5.10

回歸分析的應(yīng)用:

問題iY?

24.4545

0.5091Xi使用這一模型能產(chǎn)生兩種對于一個回歸模型,如收入與消費數(shù)據(jù)所得到的回歸模型:,其一是所謂均值,其二是點。2013/9/2874暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜Y1、均值

。所謂均值 是對于給定點或給定X的值,的條件均值Y

E(Y

X

X

0

),由于E(Y X

)為總體回歸線,因此這種 即是

總體回歸線上的點,稱為均值

。由于所估計的回歸直線為總體回歸直線的估計,

所以均值 的值由估計的回歸直線給出。2013/9/2875暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜均值0

0

0?的X

X

0

=20,

的均值Y

E(Y X

X

()

記為Y

)為例子:估計的樣本回歸直線(表3-2中數(shù)據(jù)):Y?

0.0144

0.7240Xi

i它為總體回歸直線的無偏估計,故均值

即為,對于給定Y?

0.0144

0.7240X

0.0144

0.7240

20

14.465600作為Y0的估計且這一

為最優(yōu)無偏線性2013/9/2876暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜0??iivar(Yx2x22(X0

X)2

)

1n120(X

X)2Y0

N

0

1X0

,

n

?

?

命題1、在正態(tài)擾動下,均值

Y?0的分布為正態(tài)分布,其均值為0

1X0,方差為注:證明過程見附錄,2013/9/2877暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜1

0se(Y?)t

Y?

(0

0

X

)

~

t(n

2)0故可以用t分布構(gòu)造E(Y0用無偏估計量?2

來代替

2,可以得出:X

0

)

1

2

X

0的置信區(qū)間,即Pr[?

?

X

t

se(Y?

)

X

?

?

X

t

se(Y?

)]

1

1

2

0

/

20

1

2

01

2

0

/

20通過計算,

真實E(Y X

0

)的95%

的置信區(qū)間為:14.4656

2.201

0.6185

E(Y0

X

20)

14.4656

2.201

0.6185得到:13.1043

E(Y0

X

20)

15.8260即:在給定X

0

20的條件下,重復(fù)抽樣100次,形成100個置信區(qū)間,應(yīng)用95(

=0.05)個包含著真實的均值,而真實值的最優(yōu)估計為14.4656。將對每個X

值求出的置信區(qū)間的端點連接,即可產(chǎn)生置信域。2013/9/2878暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜0

00

01??inx22

2(X0

X

)2

var(Y

Y)

E(Y

Y)

1

是給定X

X0Y所對應(yīng)的單個值,2.個值

。個值稱為個值

。若

只是對X

X0時,僅

單個的Y(而不一定是總體直線上的點)值Y0

1

2

X0

u0,Y0也遵循正態(tài)分布,Y0的最優(yōu)無偏估計仍為Y?

?

?

X

,但0

1

2

0的誤(偏)差為(Y

Y?),0

0方差為2013/9/2879暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜020

01020

1

2002?

????2iXnx

22E(Y0

Y?

)

E(

?)

E(

?

)

X

E(u

)

0

0

122

0

0var(Y

Y)

var(1)

X

var()

2

X

cov(

,

)

var(u

)

i證明:對于X

X

0,對應(yīng)的Y的個值為Y0

1

2

X

0

u0

,

個值為Y?

?

?

X

,所以得出:0

1

2

0Y0

Y?

(

?

)

(

?

)

X

u

0

1

1

2

20022x2000iixx

2

X

2

2

X

(

X)

2

2

1

n1

(

X

0

X

)2

0Y

Y?t

~

t(n

2)0?se(Y

Y

)

i用無偏估計量?2

來代替

2,可以得出:80所20以13/可9/28用這一分布對真暨實南大的學(xué)經(jīng)Y濟(jì)進(jìn)學(xué)院行統(tǒng)計推系靜均值

和個值均值

的置信區(qū)間:的置信區(qū)間比較8100se(Y?

)Pr[?

?

X

t

se(Y?

)

X

?

?

X1

2

0

/20

1

2

0

1

2

0

/2

t

se(Y?

)]

1Y?

t se(Y?Y

)

Y

Y?

t0

/2

0

0

0

0

/2se(Y?Y

)0

0用t分布構(gòu)造E(Y0

X0

)

1

2

X0的置信區(qū)間,即置信區(qū)間為:Y?

t

se(Y?

)

E(Y

X

)

Y?

t0

/2

0

0

0

0

/2個值

的置信區(qū)間:2013/9/28暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜對應(yīng)X

0

100,個值值Y0的95%的置信區(qū)間是:58.6345

Y0而前面的均值X

0

100?

92

0945

(差值為33.46)的區(qū)間為:67.9010

E(Y X

100?

82)8381.(差?值為14.93)可見,個值的置信區(qū)間比均值的置信區(qū)間要寬,其原因是,個值的方差大于對應(yīng)的均值的方差,導(dǎo)致置信區(qū)間的寬度大于對應(yīng)的均值的寬度。而當(dāng)X

X

時,這些置信域的寬度最小,這是因為當(dāng)X

X

,方差和標(biāo)準(zhǔn)差為0,從而使帶寬最小。但當(dāng)X

遠(yuǎn)離X

時,

置信域的寬度會變寬,

這是因為兩種

的方差和標(biāo)準(zhǔn)差變大,

從而使置信區(qū)間變寬。因此,估計得出的樣本回歸直線的

能力隨著X

0越來越遠(yuǎn)離X

而顯著下降。要特別區(qū)分的是,均值

是對E(Y0X

0

)

1

2

X

0所作的預(yù)測,而個值

是對Y0的

,因此,由此而形成的

的方差82201和3/9統(tǒng)/28計量不同,故所得暨南到大的學(xué)經(jīng)置濟(jì)學(xué)信院統(tǒng)區(qū)計間系。Simple

inference

+slide

164.

PredictionintervalsX0=100Fig.

5.6Y=1110Y?

=75.36X

=170C.I.

forindividual

Y92836858C.I.

for

mean

YSRF:

?

=24

+

(0.51)?X2013/9/2883暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2013/9/2884暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜85報告回歸結(jié)果iiR

2F1,8

se

(

6.4138)(

0

.

0357

)t

(

3.8128)(

14

.

2432

)p

(

0

.

00257

)(

0

.

0000

)Y?

24.4545

0.5091

X

0.9621

df

8

202.8679(

p

0.00001)2013/9/28暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜回歸結(jié)果的解釋斜率?

0.5091:表示在80

到260

這個X的樣本范圍內(nèi),2X每增加1

,則平均每周消費支出估計會增加51美分。回歸系數(shù)顯著性檢驗:?

對應(yīng)的t值為14.2432,統(tǒng)計量對應(yīng)的p值為0,這表明2原假設(shè),該系數(shù)通過了顯著性檢驗。判定系數(shù)R2

0.9621:這表明約有96%的每周消費支出的差異能由收入這個變量來進(jìn)行解釋,這說明樣本回歸直線對總體數(shù)據(jù)的擬合度很高。截距項?

24.454:表示每周收入為零時的每周消費支出的平均1支出,但是這樣的解釋沒有什么現(xiàn)實意義。線性關(guān)系檢驗:F檢驗統(tǒng)計量的值為202.8679,其對應(yīng)的p值為0.00001,這表2明013收/9入/28與消費支出之間的暨線南性大學(xué)關(guān)經(jīng)濟(jì)系學(xué)顯院統(tǒng)著計。系靜Y

1112?

0.5091124.4545iiY?

24.454

0.5091

XY樣本均值點(170

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論