版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第5章雙變量回歸:區(qū)間估計與假設(shè)檢驗暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計學(xué)系靜2013/9/281暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜5.2
區(qū)間估計—一些基本概念OLS得出的參數(shù)點估計是無偏估計,但是某一次抽樣得出的點估計的值不會恰好等于參數(shù)的真實值,那么估計值到底距離真實值有多“近”?能否構(gòu)造一個包含真實值的區(qū)間?因此提出了置信區(qū)間。2013/9/282暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜5.2
區(qū)間估計—一些基本概念區(qū)間估計的思想:對于已有的點估計如?2,希望基于這一點估計構(gòu)造一個區(qū)間,使總體真值2以較高的概率被包含在這一區(qū)間內(nèi),既然是區(qū)間,所要解決的問題就是如何構(gòu)造即確定區(qū)間的左右端點(
一般考慮對稱區(qū)間),且這種區(qū)間如何與概率(顯著性水平)相聯(lián)系?2013/9/283暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜置信區(qū)間由于標(biāo)準(zhǔn)差是度量估計量的精度,所以可利用標(biāo)準(zhǔn)差來構(gòu)造置信區(qū)間,這樣,形成區(qū)間估計可以表述為:確定決定區(qū)間的數(shù)
(基于標(biāo)準(zhǔn)差)和顯著性水平,使總體參數(shù)2被包含在這一區(qū)間的概率(置信水平)為1
:Pr(?
?
)
1
2
2
22013/9/284暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜注釋22置信區(qū)間:?
2置信系數(shù):1
顯著性水平:置信下限:?
置信上限:?
2013/9/285暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜進(jìn)一步解釋置信區(qū)間是根據(jù)點估計量?
構(gòu)造出來的一個區(qū)間,2要使得它把總體參數(shù)的真值包括在區(qū)間內(nèi)的概率為1
,從而區(qū)間估計量給出了一個真實2所在
其中的數(shù)值范圍。若
5%,則置信水平為95%,那么置信區(qū)間包含真實2的概率就為95%。2013/9/286暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2
2
2Pr(?
?
)
1
的說明:正確表述:置信區(qū)間包含真實參數(shù)2的概率為1錯誤表述:2落入?yún)^(qū)間的概率為1
。置信區(qū)間是根據(jù)點估計量?
構(gòu)造的,所以是隨機(jī)區(qū)間。2因為不同的樣本估計得出的?
是不同的,?
是隨機(jī)的。2
2在重復(fù)抽樣中,平均來看,有100%(1-)次包含著總體參數(shù)的真值。只要?
不知道,則這個置信區(qū)間為隨機(jī)區(qū)間。2一旦樣本確定,估計出一個?2的值,這時就是一個固定區(qū)間了,這是真實2或在區(qū)間內(nèi),或在區(qū)間外,從而概率只能是1或0。2013/9/287暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2212i22221
122??)nxx2112
22
2
Xvar(
)?N
(
,
)?N
(
,
2i
i5.3
回歸系數(shù)1
和2
的置信區(qū)間在擾動項服從正態(tài)分布的假定下,估計的系數(shù)?
和?12都服從正態(tài)分布。均值:
E(?
)
E(?
)
1
1
2方差:var(
):
:
2x?se(?2
)(?
)2
2i
2 2
Z
以?
為例進(jìn)行分析,標(biāo)準(zhǔn)化變量:2若總體方差
2已知,則利用正態(tài)分布來進(jìn)行分析。2013/9/288暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2222?xse(
)?
t
(?
)t(n
2)2
2
i?若總體方差
2未知,則只能用估計的方差?2來進(jìn)行代替。這時回歸系數(shù)的分布將會發(fā)生變化,服從t分布。估計量
假設(shè)的真實參數(shù)注意理解:在對點估計量?
進(jìn)行標(biāo)準(zhǔn)化的過程估計量的標(biāo)準(zhǔn)誤的估計值2中,由于隨機(jī)干擾項的方差未知,用殘差的方差來代替,就使得標(biāo)準(zhǔn)化后的量服從t分布。2013/9/289暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜
2
2
222se(?
)2
/
2
/
2
/
2
/
22
/
2
/
2Pr(t
t
t
)
Pr
t
(?
)
t
/
2
Pr[?
t2
2
2se(?
)
?
tse(?
)]
1?
t
se(?
)用t分布來建立置信區(qū)間:Pr(t
2
t
t
2
)
1
2的置信區(qū)間為:2013/9/2810暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2013/9/2811暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜22
22
/
2
/
2
2
(n
2)
?2
2?22
21
/
2?21
/
2
2~ (n
2)Pr(
)
1
Pr[(n
2)
(n
2)]
1
5.4
2
的?
置信區(qū)間利用
2分布建立
2
的置信區(qū)間:在ui的正態(tài)性假定下,變量:2013/9/2812暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2013/9/2813暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜5.5
假設(shè)檢驗虛擬假設(shè):通常是研究者(對某一回歸參數(shù)的)非預(yù)期取值的一種表述。虛擬假設(shè)的表示是在非預(yù)期的取值范圍前加上符號“H0:”。例如,如果你預(yù)期系數(shù)是正值,那么0或負(fù)的系數(shù)就是非預(yù)期的取值范圍,于是虛擬假設(shè)為:虛擬假設(shè)H0
:
0(這是你的非預(yù)期的取值范圍)2013/9/2814暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜備選假設(shè):通常是對研究者預(yù)期取值的表述。備選假設(shè)的表示是在預(yù)期取值范圍的表述前加上符號“H
A:”。繼續(xù)的例子,如果你預(yù)期系數(shù)是正值,那么備選假設(shè)是:備選假設(shè)HA
:
0(?這是你所預(yù)期的取值范圍)注:上述假設(shè)是針對單側(cè)(或單尾)檢驗而言的,因為備選假設(shè)的取值位于虛擬假設(shè)的一側(cè)。另法是使側(cè)檢驗:H0
:
0
HA
:
02013/9/2815暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜假設(shè)檢驗:置信區(qū)間的方法2013/9/2816暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜22
/2se(?)?
t22
/2se(?
)?
t1
2
222222
/2
/2P[?
tse(?
)
?
tse(?
)]
1
在假設(shè)H0下,落入此區(qū)間的2值有100(1
)%性,因而,若2果真落入此區(qū)域,就不能H00決策規(guī)則:構(gòu)造一個2的100(1
)%置信區(qū)間。若在假設(shè)H0下的2落入此區(qū)間,就不要
H0。172013/若9/28落在此區(qū)間之外暨南,大學(xué)則經(jīng)濟(jì)要學(xué)院拒統(tǒng)計絕系靜。1.檢驗回歸系數(shù)的顯著性:t檢驗顯著性檢驗:是構(gòu)造一個合適的統(tǒng)計量(作為估計量),以及在原假設(shè)之下的抽樣分布(本課程基于經(jīng)典的統(tǒng)計量,其分布已知),通過計算這一統(tǒng)計量的樣本值,進(jìn)而與臨界值比較,如落入接受域,則不原假設(shè),而不落入接受域即落入域,則原假設(shè)。幾乎所有假設(shè)檢驗,均按這一原理而實現(xiàn)。假設(shè)檢驗:顯著性檢驗法2013/9/2818暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜檢驗是:設(shè)定原假設(shè)和備選假設(shè),構(gòu)造統(tǒng)計量以及推導(dǎo)它在原假設(shè)下的分布,利用這一分布檢驗假設(shè),所以這種思想實質(zhì)上是先行假定原假設(shè)為真,從而有統(tǒng)計量在原假設(shè)下的分布,基于此檢驗假設(shè)。假設(shè)檢驗:顯著性檢驗法2013/9/2819暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜
2
2
2
0.0357se(?
)?(
)0.5091
0.3t
5.86第一步:建立原假設(shè)和備擇假設(shè)H0:2
0.3H1:2
0.3第二步:根據(jù)回歸估計得出?
0.5091,se(?)
0.03572
2根據(jù)樣本信息和H
假設(shè)下的
0.3計算t值0
2t檢驗法:第三步:確定顯著性水平為5%,
度為n
2,則查t分布表得出臨界值t
2
2.306,t
t
2,則度為n
2,臨界值H0。2013/9/2820暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜t
Distribution()0f(t)-tc/2tc
t/2RejectregionRejectregionRegion
of
acceptancered
area
=
rejection
region
for
2-sided4.t13e
st2013/9/2821暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜4.25One-tailed
t-test
decision
ruleLeft-tail(If t
<
-
tc(If t
>
-
tc==> reject
H0
)==> not
reject H0
)Decision
RuleStep
5:
If t
>
tcIf t
<
tc==> reject
H0==> not
reject
H0Right-tail0tc
<
tRight-tail0t
<
-tcleft-tail2013/9/2822暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜
2
2
2222*se(?
)?2
/
2se(
)?(
)t
t(n
2)(?
)t
/
2
]
1
Pr[
*
t
se(?
)
?
t
/
2
se(?
)]
1
2
2
2
2t檢驗的實質(zhì)理解:置信區(qū)間:Pr[t/2
?
?2
/
2)
2
2
2*
t
se(?
)]
1
/
2
2這一式子的意義為:在假定
時,?
以概率1-落入其中的區(qū)間2
2
2[
*
tse(?
)]。若估計的?
落在這個區(qū)間外,則2
/
22
2原假設(shè)H
,若落0在區(qū)間內(nèi),則不能。例:根據(jù)Pr[
*
t
se(得出:Pr[0.2177
?
0.3823]
0.9522?
0.5091,不在這個區(qū)間內(nèi),因此
原假設(shè)H
。02013/9/2823暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜*0
2由此可以看出:置信區(qū)間檢驗方法中,是根據(jù)估計的?2構(gòu)造一個以以某種概率包含有真實但未知的或假設(shè)的2的一個范圍或區(qū)間。在顯著性檢驗中,則是根據(jù)原假設(shè)H
下的假設(shè)的
構(gòu)造區(qū)間,看估計的?
是否在這個區(qū)間范圍內(nèi),若在區(qū)間內(nèi),則不能
。2若在區(qū)間外,則
原假設(shè)。t顯著性檢驗和置信區(qū)間檢驗的區(qū)別2013/9/2824暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜置信區(qū)間和顯著性檢驗的比較采用估計的?
來構(gòu)造2區(qū)間以某概率包含真值2置信區(qū)間檢驗:。,看估計的?
是否落入置信區(qū)顯著性檢驗:用H0假設(shè)下的2構(gòu)造區(qū)間2間范圍內(nèi)。2P[?
t
se(?
)
?
t2
/2
2
2
2
/2se(?
)]
1*222
/2
/2Pr[
t
se(?
)
?
*2
2
t
se(?
)]
1
2013/9/2825暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜*222
/2
/2Pr[
t
se(?
)
?
*2
2
t
se(?
)]
1
看估計的?是否落入置信區(qū)顯著性檢驗:用H0假設(shè)下的2構(gòu)造區(qū)間,2間范圍內(nèi)。2013/9/2826暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜22
/2P[?
tse(?
)
?
t2
2
2
/2se(?
)]
12采用估計的?
來構(gòu)造置信區(qū)間檢驗:區(qū)間以某概率包含真值2。2013/9/2827暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜顯著性檢驗——說明顯著性檢驗的實質(zhì):建立真值或總體的某一特定值的原假設(shè)和備選假設(shè),在原假設(shè)下構(gòu)造統(tǒng)計量和它的分布,
并在原假設(shè)建立有關(guān)估計量的置信區(qū)間,最后
估計的值是否落入置信區(qū)間之內(nèi)還是之外,若落入之內(nèi),不能
原假設(shè),否則
原假設(shè)。這一問題可轉(zhuǎn)化為,如計算的t值較大,即可成為原假設(shè)的
。2013/9/2828暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜t檢驗——注釋如果一個統(tǒng)計量的值落在
域內(nèi),則原假設(shè),這個統(tǒng)計量是統(tǒng)計上顯著的。如果一個統(tǒng)計量的值落在接受域內(nèi),則不能
原假設(shè),這個統(tǒng)計量是統(tǒng)計上不顯著的。2013/9/2829暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜右單側(cè)檢驗:H0:2
0.5H1:2
0.52013/9/2830暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2013/9/2831暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜關(guān)于
2的顯著性檢驗:
2
(n
2)
?2
2~
2(n
2)用這一統(tǒng)計量進(jìn)行顯著性檢驗,其決策機(jī)制列入表5.2.2013/9/2832暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2013/9/2833暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2
201?2這顯然是雙尾檢驗,
2
(n
2)
~
2
(n
2),給出了檢驗這2
85?
H
:
例子:前述消費與收入模型,所計算的?2
42.1591,d.f
.
8如設(shè)定原和備假設(shè)為:H
:
2
2(10.05/
2) (0.05/
2)2
一假設(shè)的統(tǒng)計量,將?2
42.1591,d.f
.
8代入(在原假設(shè)之下),有計算的值為?2(8)*
23.97選定顯著性水平0.05,可查得
2的兩個臨界值分別為(8)
2.1797和
(8)
17.5346,
接表5.2中的第三行的雙尾決策規(guī)則,由計算的2.18<
2
3.97
17.54即落入這兩個臨界值所界定的區(qū)域之內(nèi),故不
原假設(shè)。2013/9/2834暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜接受與
的含義對于顯著性檢驗(如t檢驗),當(dāng)計算的統(tǒng)計量值落入接受域中,因此其含意為,根據(jù)樣本
,接受原假設(shè),沒有理由拒絕原假設(shè);而并非是指,原假設(shè)一定為真。為什么?對于已決定接受的原假設(shè),若與之類似的另一原假設(shè)( 只是沒有設(shè)定),通過相同的步驟,有可能結(jié)果為接受這一新的原假設(shè),若如此,哪一個原假設(shè)為真?通過假設(shè)檢驗還無法決定。2013/9/2835暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2例子:仍就前述收入與消費,設(shè)定H
01
:
2 0
.
5
,?而
=
0
.
5
0
9
1
,
并
且
它
的
標(biāo)
準(zhǔn)
差
估
計
為
se(?)
0
.
0
3
5
7
,2而計算的統(tǒng)計量為t
(
0
.
5
0
9
1
0
.
5
)
0
.
2
50
.
0
3
5
7這一數(shù)值落入接受域中(為什么?),所以接受H
0
1現(xiàn)在再設(shè)定H
02
:
2 0.4
8
,于是可以計算t
(
0
.
5
0
9
1
0
.
4
8
)
0
.
8
20
.
0
3
5
7顯然0.8
2
再次落入接受域內(nèi),故應(yīng)接受H
02
。對于H
0
1和
H
02
,
哪
一
個
為
真
, 基
于
統(tǒng)
計
檢
驗
無
法
確
定
,唯一能確定的是兩個原假設(shè)能被接受,或均不能被拒絕。所以,在接受一個原假設(shè)時,有可能另一個原假設(shè)(未設(shè)定而己)也不能被。于是,只是說這一原假設(shè)不能被,而不是說確定要接受它。但為2方013/便9/28,常用接受原暨南假大學(xué)設(shè)經(jīng)濟(jì)學(xué)。院統(tǒng)計系靜
36“零”原假設(shè)與“2-t”法則在計量經(jīng)濟(jì)學(xué)中,常常要檢驗?zāi)骋粋€變量對于應(yīng)變量的解釋能力,或變量是否有顯著性影響,這一問題就表述為對應(yīng)的系數(shù)是否可約束為零,對于收入與消費模型,這個問題即為H0:2
0,即零原假設(shè)或簡稱為零假設(shè)。2013/9/2837暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2倍t法則零假設(shè)檢驗有一常用的法則:“2倍t法則”:如果
度大于或等于20,顯著性水平為0.05,則所計算的(t
t=(?
0)
/
se(?
))的絕對值超2
2過2時,就可以零假設(shè)H0:2
0。2013/9/2838暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜建立原假設(shè)與備選假設(shè)一般而言,建立原和備假設(shè)沒有一個的規(guī)則,通常是基于所研究的問題而定,或者是基于檢驗?zāi)康模缭谀P椭袘?yīng)檢驗?zāi)承┗蚰硞€變量的顯著性,則建立對應(yīng)的系數(shù)為零作為原假設(shè)。另一方面,有些假設(shè)通常是根據(jù)所研究的問題所隱含的意義而建立,這樣的假設(shè)往往具有較為豐富的經(jīng)濟(jì)學(xué)意義?;蛘呤怯山?jīng)濟(jì)學(xué)金融學(xué)理論或?qū)嶋H經(jīng)濟(jì)行為
而建立假設(shè)。通過檢驗假設(shè)來證實經(jīng)濟(jì)學(xué)理
論或?qū)嶋H行為的正確與否。2013/9/2839暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜顯著性水平通常選定的顯著性水平,其實質(zhì)含義為犯第I類錯誤的概率,所謂第I類錯誤是指,在原假設(shè)為真時,
這一正確的原假設(shè),即去真。而對應(yīng)的取偽的概率即為犯第II類錯誤的概率,即接受了錯誤的假設(shè)的概率。一般而言,計量經(jīng)濟(jì)學(xué)中的假設(shè)檢驗將犯第I類錯誤的概率定在=0.05,或0.01,或0.10。所謂檢驗勢(power
of
thetest)定義為1-Pr.(犯第II類錯誤),這是目前在仿真實驗中所使用的概念,它主要用在計量經(jīng)濟(jì)學(xué)的理論研究中,以此評價所構(gòu)造的統(tǒng)計量的檢驗?zāi)芰?。一般而言,檢驗勢高,表明這一統(tǒng)計量的檢驗?zāi)芰蛷?qiáng)。2013/9/2840暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜精確的顯著性水平—p值2013/9/2841暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜的p值表示所設(shè)定的原假設(shè)可被最低的顯著性水平,或精確的,或者是犯第I類錯誤的概率。p值與顯著性水平關(guān)系,如果要選定,那么,當(dāng)p值小于或等于,則在水平上不
原原假設(shè)。反之,
假設(shè)。上與其人為地把固定在某一水平,不如干脆選取檢驗統(tǒng)計量的P值,讓讀者去決定是否在計算的P值水平
原假設(shè)。統(tǒng)計顯著性——解釋????iiiiit?ise(?
)統(tǒng)計顯著性:用tt
臨界值
原假設(shè),統(tǒng)計上是顯著的。t
臨界值
不能
原假設(shè),統(tǒng)計上不顯著。來進(jìn)行判斷。主要是判斷利用樣本估it
大,若在5%的顯著性水平上原假設(shè)H
0,表明估計
?
(H
假設(shè)下的值)i
i
0計的?與假設(shè)總體的真值之間是否有顯著性的差異。的?在5%的水平上顯著地異于假設(shè)的
。i
i2013/9/2842暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜
?
?
22
2
2比如,原假設(shè)H0為:2
0.61,這是在假設(shè)檢驗過程中,研究者對總體參數(shù)的一個假設(shè)的真值。而利用樣本估計的?
0.5091。se(?
)
0.0357,
度為8,若選取
5%,22則t
2.306,則置信區(qū)間t
se(
)區(qū)間為:0.4268,0.5914
,2
0
2假,這個區(qū)間沒有包含有95%的把握的設(shè)的0.61
原假設(shè)。因此可以判斷:估計值0.5091是統(tǒng)計上是顯著的,也就是說,估計值顯著異于0.61。即?
=0.5091顯著地異于H
:
0.61,這就是統(tǒng)計上的顯著性?;蛘咧苯佑胻
2
2.306
1.96(臨界值),
原假設(shè),統(tǒng)計上顯著。2013/9/2843暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜ii
i(或符號)有關(guān)系。若估計的值?與假設(shè)值
實際的經(jīng)濟(jì)實際顯著性:實際的經(jīng)濟(jì)效應(yīng)的差異性。與?的大小??
ii
的正負(fù)號很小時的變量會有“錯誤的”符號。即效應(yīng)有顯著差異,則存在實際顯著性。一般而言,統(tǒng)計顯著性均產(chǎn)生實際顯著性。注:當(dāng)統(tǒng)計上顯著時,要估計系數(shù)的大小及其在實際經(jīng)濟(jì)中的重要性或經(jīng)濟(jì)含義。若統(tǒng)計上不顯著時,仍然要考慮該變量對被解釋變量是否具有預(yù)期的影響,這個影響在實踐中是否很大,并由實際計算的P值來探討。通常,t可能有誤,就其原因,可能是多重共線性等原因造成。2013/9/2844暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜11
MPC例如:由于2表示邊際消費傾向MPC,則收入乘數(shù):?
MPC
0.5091,則所產(chǎn)生的收入乘數(shù)為2.04;即=2增加1
的開支,將導(dǎo)致收入最終增加2.04元,而當(dāng)2=MPC=0.61時,收入乘數(shù)為2.56,顯然,不能將2.04等同于2.56,因此統(tǒng)計的顯著性,產(chǎn)生了實際結(jié)果的顯著性。2013/9/2845暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜t檢驗的局限性關(guān)于t-檢驗的一個問題是它很容易被
,由于計算機(jī)回歸 包可以直接提供t比率的計算結(jié)果,t-檢驗很容易操作,所以初學(xué)者有時就試圖運用t檢驗來“證明”一些它不可能檢驗的事情。所以,了解t檢驗的局限性就同了解其應(yīng)用方法同等的重要。t-檢驗最主要的局限性可能就在于,隨著需要估計和檢驗的設(shè)定越來越多,t-檢驗的價值迅速下降。2013/9/2846暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜回想一下,t檢驗的目的在于:幫助研究者基于總體的一個樣本所得到的估計值,對總體的某一假定系數(shù)進(jìn)行推斷。
一些初學(xué)者則認(rèn)為:所有在統(tǒng)計上顯著的結(jié)果在理論上都是正確的。這樣的結(jié)論是很的,因為它
了統(tǒng)計顯著性和理論有效性的含義。2013/9/2847暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2013/9/2848暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜本例的陷阱在于,P
是消費者價格指數(shù)而C是英國的累積降雨量!
剛剛表示了降雨對解釋消費者價格指數(shù)是統(tǒng)計顯著的,那么這一結(jié)果是否也意味著隱含的理論也是成立的呢?當(dāng)然不是。那么,為什么統(tǒng)計結(jié)果會如此顯著呢?答案是,方程兩邊湊巧具有同趨勢,且這種同趨勢本身沒有任何的含義。有一條原則必須清楚:
由t檢驗得出的統(tǒng)計顯著性等同于理論的有效性。2013/9/2849暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜估計系數(shù)湊巧在與假設(shè)相反的方向上顯著。
一些初學(xué)者就試圖改變他們的假設(shè)。例如,一個學(xué)生進(jìn)行回歸分析,其假設(shè)的符號是正的,但卻得到“統(tǒng)計上顯著”的負(fù)值,在對這一問題“重新考慮”以后,便試圖改變他們的理論預(yù)期,轉(zhuǎn)而“預(yù)期”為負(fù)號。盡管
贊同基于新的證據(jù)對不正確的理論進(jìn)行重新檢驗,但一般而言這些新的
本質(zhì)上應(yīng)具有理論上的合理性。2013/9/2850暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜在上面的例子中,應(yīng)當(dāng)關(guān)注為什么沒有支持理論,而不能因為缺乏支持就完全改變理論本身。如果使研究者重新考慮模型的理論基礎(chǔ)并且發(fā)現(xiàn)有錯誤,那么虛擬假設(shè)就需要修改,但是新的假設(shè)必須使用完全不同的數(shù)據(jù)集進(jìn)行檢驗。畢竟,已經(jīng)知道如果用原數(shù)據(jù)集進(jìn)行檢驗會得到什么樣的結(jié)果。2013/9/2851暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜t檢驗不是檢驗變量的“重要性”回歸方程的一種可能的用途是有助于判定哪個自變量對應(yīng)變量具有最大的相對效應(yīng)(重要性)。一些初學(xué)者容易得出一個不可靠的結(jié)論:回歸模型中最具統(tǒng)計顯著性的變量,因其解釋了應(yīng)變量變動的最大部分而被認(rèn)為是最重要的變量。2013/9/2852暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜統(tǒng)計顯著性所指的是偶然獲得一個特定的樣本結(jié)果的可能性,而幾乎不反映哪個變量決定了應(yīng)變量變動的最大份額。為了確定變量的重要性,以其系數(shù)乘以自變量的平均值或標(biāo)準(zhǔn)誤,其數(shù)值結(jié)果的大小更能反映自變量對應(yīng)變量變動的解釋能力。盡管目前已經(jīng)建立了一些評價
“重要性”的統(tǒng)計指標(biāo),但由于多重共線性(將在第8章 )的影響,其中沒有一個是完全令人滿意的。2013/9/2853暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2013/9/2854暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜552013/9/28暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜t檢驗不能擴(kuò)展到檢驗整個總體t檢驗從總體(從中抽取樣本的那個群體)的一個樣本所計算的估計值對總體參數(shù)的真值進(jìn)行推斷。隨著樣本容量逐漸接近總體規(guī)模,系數(shù)的無偏估計趨向于總體的真值。如果系數(shù)是由整個總體計算出來的,那么無偏估計值本身就是總體真值,t-檢驗對于檢驗總體參數(shù)就幾乎沒有任何意義。2013/9/2856暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜有些人可能忽視了這一性質(zhì),而過于強(qiáng)調(diào)由規(guī)模近似于總體的樣本中所得到的t-值的重要性。實際上,
t檢驗所能提供的所有信息,只不過是在基于一個特定的小樣本
關(guān)于總體參數(shù)真值的假設(shè)時,幫助研究者確定犯錯誤的可能性。2013/9/2857暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜要理解這一點,也許最好的辦法是牢記t比率等于系數(shù)的估計值除以它的標(biāo)準(zhǔn)誤。2013/9/2858暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜5.9
回歸分析與方差分析222
22????2i
i
i
2
i
iy
y
u
x
u
離差平方和分解:TSS
ESS
RSS得出總平方和分解為兩個構(gòu)成部分:回歸(解釋)平方和與殘差或剩余平方和。對這些構(gòu)成部分進(jìn)行研究就叫做從回歸的角度做方差分析。2013/9/2859暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2013/9/2860暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2i(x
x
)s2
i1
度:當(dāng)以樣本統(tǒng)計量來估計總體參數(shù)時。樣本中能獨立或
變化的數(shù)據(jù)的個數(shù)。例如:樣本方差nn
1n
1為
度度樣本方差中的(degree
offreedom)2013/9/2861暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜度樣本方差中的(degree
offreedom)1、度:指數(shù)據(jù)個數(shù)減去附加給獨立觀測值的約束或限制的個數(shù),即一組數(shù)據(jù)中可以取值的數(shù)據(jù)的個數(shù)2、當(dāng)樣本數(shù)據(jù)的個數(shù)為n
時,若樣本均值x確定后,只有n-1個數(shù)據(jù)可以取值,其中必有一個數(shù)據(jù)則不能取值。按著這一邏輯,如果對n個觀測值附加的約束個數(shù)為k個,度則為n-k。2013/9/2862暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜度(degree
of
freedom)1.
樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則
x=5。當(dāng)
x
=
5
確定后,x1,x
和x3有兩個數(shù)據(jù)可以取值,另一個則不能
取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值3.2.
為什么樣本方差的
度是n-1呢?因為在計算離差平方和時,必須先求出樣本均值x
,而x則是附加給離差平方和的一個約束,因此,計算離差平方和時只有n-1個獨立的觀測值,而不是n個度(n-1)保證了樣本方差是總體方差的無偏估計2013/9/2863暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜雙變量回歸模型的方差分解表2013/9/2864暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜方差分析中的
度解釋:22222?和?
就是約束條件,因此RSS
的1
2??????i
i2i
2ii
2y
X
)
12
i
(Y
Y
)
(
Y
?y
(Y
Y
)2,Y
就是一個約束條件,度為n
1.x
,當(dāng)x
給定時僅是
的函數(shù),TSS
TSS的ESS
ESS
的RSS
u
2
i
i
i
i度為1
(
k
1)度為n
2(即n
k
).總之,
由于回歸所產(chǎn)生的總離差平方和的
度為
n
1
,它分解為回歸平方和(
度為
1
)
與殘差平方和(
度n
2
)之和。2013/9/2865暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜222?
??xxESS
/1F
F
(1,
n
2)RSS
/
(n
2)u
/
(n
2)2
2i2
2i?2
i在擾動ui為正態(tài)分布且在H0
:2
=0之下,下式表示的F
統(tǒng)計量服從F(1,n
2)分布0.05ESS
/1RSS
/
(n
2)F
F
(1,n
2)F
統(tǒng)計量可以看作是來自X
的均方與來自殘差的均方之比。后者可以看作是系統(tǒng)的“噪音”,X的影響只有在其影響超過系統(tǒng)內(nèi)在的噪音水平時才會被察覺,于是X
的顯著性可以通過檢驗樣本的F
值是否超過F
分布上側(cè)的適當(dāng)臨界值加以檢驗。若:H0
:2
=0,其中F0.05表示該分布只則在5%的顯著性水平上有5%的概率落入
區(qū)域2013/9/2866暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜
22222222???iEx
)
xu
/
(n
2)
E
2
i
2
i可以證明:E((5.9.2)
(5.9.3)2若
=0,上述兩式都給出了相同的真實
的估計,這時解2釋變量X
對Y沒有任何線性影響,Y的變異全部由隨機(jī)干擾項ui來解釋。若2
0,上述兩式將會有所不同,Y的部分變異歸因于X,即解釋變量X
對Y有線性影響。因此,F(xiàn)統(tǒng)計量實際上提供了對H0:2=0的一個檢驗。在一元線性回歸中,t檢驗和F檢驗是等價的:t2
m
F(1,m)注意:在多元線性回歸中,F(xiàn)檢驗是檢驗整個模型是否顯著。2013/9/2867暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜The
F-Distribution,
F(m,n)F0
1.0Nonnegative
values
onlyNot
symmetric(skewed
to
the
right)Ea ember
of
the
family
isdetermined
by
twoparameters:the
numerator
degrees
offreedom
(m)
and
thedenominator
degrees
of
freedom(n).Chap
10-
5
68Ka2-f0u
1W3o/ng9/?228003暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜”下拉菜單第1步:進(jìn)入Excel表格界面,選擇“第2步:選擇“函數(shù)”點擊第3步:在函數(shù)分類中點擊“統(tǒng)計”,函數(shù)名的菜單下選擇字符正態(tài)分布:“NORMSINV”:已知概率水平,求x的值或z值“NORMSDIST”:已知X或Z值,求相應(yīng)的概率t分布:“TINV”:知道概率值和
度,求t臨界值“TDIST”:知道t值,
度和單側(cè)或雙側(cè)檢驗,求概率值Excel求相關(guān)值
令2013/9/2869暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜Excel求F值
令第1步:進(jìn)入Excel表格界面,選擇“
”下拉菜單第2步:選擇“函數(shù)”點擊第3步:在函數(shù)分類中點擊“統(tǒng)計”,函數(shù)名的菜單下選擇字符“FINV”就可以求出相應(yīng)的F臨界值求概率值:“FDIST”卡方分布:“CHIINV”:知道概率值和
度,求臨界值求概率值:“CHIDIST”2013/9/2870暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜F
202.87
F臨界值
5.3176,所以H0:2
=02013/9/2871暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜精確概率P值
5.75252E
07,P遠(yuǎn)遠(yuǎn)小于
0.05,所以H0:2
=02013/9/2872暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜F檢驗和t檢驗——一個注釋在一元線性回歸中,自變量x只有一個,則此時F檢驗和t檢驗是等價的,即若原假設(shè)被t檢驗,則也將被F檢驗
。在多元回歸分析中,自變量x有多個,則此時F檢驗和t檢驗的意義是不同的。F檢驗:
檢驗總體回歸關(guān)系的顯著性t檢驗:檢驗各個回歸系數(shù)的顯著性2013/9/2873暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜5.10
回歸分析的應(yīng)用:
問題iY?
24.4545
0.5091Xi使用這一模型能產(chǎn)生兩種對于一個回歸模型,如收入與消費數(shù)據(jù)所得到的回歸模型:,其一是所謂均值,其二是點。2013/9/2874暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜Y1、均值
。所謂均值 是對于給定點或給定X的值,的條件均值Y
E(Y
X
X
0
),由于E(Y X
)為總體回歸線,因此這種 即是
總體回歸線上的點,稱為均值
。由于所估計的回歸直線為總體回歸直線的估計,
所以均值 的值由估計的回歸直線給出。2013/9/2875暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜均值0
0
0?的X
X
0
=20,
的均值Y
E(Y X
X
()
記為Y
)為例子:估計的樣本回歸直線(表3-2中數(shù)據(jù)):Y?
0.0144
0.7240Xi
i它為總體回歸直線的無偏估計,故均值
即為,對于給定Y?
0.0144
0.7240X
0.0144
0.7240
20
14.465600作為Y0的估計且這一
為最優(yōu)無偏線性2013/9/2876暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜0??iivar(Yx2x22(X0
X)2
)
1n120(X
X)2Y0
N
0
1X0
,
n
?
?
命題1、在正態(tài)擾動下,均值
Y?0的分布為正態(tài)分布,其均值為0
1X0,方差為注:證明過程見附錄,2013/9/2877暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜1
0se(Y?)t
Y?
(0
0
X
)
~
t(n
2)0故可以用t分布構(gòu)造E(Y0用無偏估計量?2
來代替
2,可以得出:X
0
)
1
2
X
0的置信區(qū)間,即Pr[?
?
X
t
se(Y?
)
X
?
?
X
t
se(Y?
)]
1
1
2
0
/
20
1
2
01
2
0
/
20通過計算,
真實E(Y X
0
)的95%
的置信區(qū)間為:14.4656
2.201
0.6185
E(Y0
X
20)
14.4656
2.201
0.6185得到:13.1043
E(Y0
X
20)
15.8260即:在給定X
0
20的條件下,重復(fù)抽樣100次,形成100個置信區(qū)間,應(yīng)用95(
=0.05)個包含著真實的均值,而真實值的最優(yōu)估計為14.4656。將對每個X
值求出的置信區(qū)間的端點連接,即可產(chǎn)生置信域。2013/9/2878暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜0
00
01??inx22
2(X0
X
)2
var(Y
Y)
E(Y
Y)
1
是給定X
X0Y所對應(yīng)的單個值,2.個值
。個值稱為個值
。若
只是對X
X0時,僅
單個的Y(而不一定是總體直線上的點)值Y0
1
2
X0
u0,Y0也遵循正態(tài)分布,Y0的最優(yōu)無偏估計仍為Y?
?
?
X
,但0
1
2
0的誤(偏)差為(Y
Y?),0
0方差為2013/9/2879暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜020
01020
1
2002?
????2iXnx
22E(Y0
Y?
)
E(
?)
E(
?
)
X
E(u
)
0
0
122
0
0var(Y
Y)
var(1)
X
var()
2
X
cov(
,
)
var(u
)
i證明:對于X
X
0,對應(yīng)的Y的個值為Y0
1
2
X
0
u0
,
個值為Y?
?
?
X
,所以得出:0
1
2
0Y0
Y?
(
?
)
(
?
)
X
u
0
1
1
2
20022x2000iixx
2
X
2
2
X
(
X)
2
2
1
n1
(
X
0
X
)2
0Y
Y?t
~
t(n
2)0?se(Y
Y
)
i用無偏估計量?2
來代替
2,可以得出:80所20以13/可9/28用這一分布對真暨實南大的學(xué)經(jīng)Y濟(jì)進(jìn)學(xué)院行統(tǒng)計推系靜均值
和個值均值
的置信區(qū)間:的置信區(qū)間比較8100se(Y?
)Pr[?
?
X
t
se(Y?
)
X
?
?
X1
2
0
/20
1
2
0
1
2
0
/2
t
se(Y?
)]
1Y?
t se(Y?Y
)
Y
Y?
t0
/2
0
0
0
0
/2se(Y?Y
)0
0用t分布構(gòu)造E(Y0
X0
)
1
2
X0的置信區(qū)間,即置信區(qū)間為:Y?
t
se(Y?
)
E(Y
X
)
Y?
t0
/2
0
0
0
0
/2個值
的置信區(qū)間:2013/9/28暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜對應(yīng)X
0
100,個值值Y0的95%的置信區(qū)間是:58.6345
Y0而前面的均值X
0
100?
92
0945
(差值為33.46)的區(qū)間為:67.9010
E(Y X
100?
82)8381.(差?值為14.93)可見,個值的置信區(qū)間比均值的置信區(qū)間要寬,其原因是,個值的方差大于對應(yīng)的均值的方差,導(dǎo)致置信區(qū)間的寬度大于對應(yīng)的均值的寬度。而當(dāng)X
X
時,這些置信域的寬度最小,這是因為當(dāng)X
X
,方差和標(biāo)準(zhǔn)差為0,從而使帶寬最小。但當(dāng)X
遠(yuǎn)離X
時,
置信域的寬度會變寬,
這是因為兩種
的方差和標(biāo)準(zhǔn)差變大,
從而使置信區(qū)間變寬。因此,估計得出的樣本回歸直線的
能力隨著X
0越來越遠(yuǎn)離X
而顯著下降。要特別區(qū)分的是,均值
是對E(Y0X
0
)
1
2
X
0所作的預(yù)測,而個值
是對Y0的
,因此,由此而形成的
的方差82201和3/9統(tǒng)/28計量不同,故所得暨南到大的學(xué)經(jīng)置濟(jì)學(xué)信院統(tǒng)區(qū)計間系。Simple
inference
+slide
164.
PredictionintervalsX0=100Fig.
5.6Y=1110Y?
=75.36X
=170C.I.
forindividual
Y92836858C.I.
for
mean
YSRF:
?
=24
+
(0.51)?X2013/9/2883暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜2013/9/2884暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜85報告回歸結(jié)果iiR
2F1,8
se
(
6.4138)(
0
.
0357
)t
(
3.8128)(
14
.
2432
)p
(
0
.
00257
)(
0
.
0000
)Y?
24.4545
0.5091
X
0.9621
df
8
202.8679(
p
0.00001)2013/9/28暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系靜回歸結(jié)果的解釋斜率?
0.5091:表示在80
到260
這個X的樣本范圍內(nèi),2X每增加1
,則平均每周消費支出估計會增加51美分。回歸系數(shù)顯著性檢驗:?
對應(yīng)的t值為14.2432,統(tǒng)計量對應(yīng)的p值為0,這表明2原假設(shè),該系數(shù)通過了顯著性檢驗。判定系數(shù)R2
0.9621:這表明約有96%的每周消費支出的差異能由收入這個變量來進(jìn)行解釋,這說明樣本回歸直線對總體數(shù)據(jù)的擬合度很高。截距項?
24.454:表示每周收入為零時的每周消費支出的平均1支出,但是這樣的解釋沒有什么現(xiàn)實意義。線性關(guān)系檢驗:F檢驗統(tǒng)計量的值為202.8679,其對應(yīng)的p值為0.00001,這表2明013收/9入/28與消費支出之間的暨線南性大學(xué)關(guān)經(jīng)濟(jì)系學(xué)顯院統(tǒng)著計。系靜Y
1112?
0.5091124.4545iiY?
24.454
0.5091
XY樣本均值點(170
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程勘察承攬合同
- 生物中圖版自主訓(xùn)練:第二單元第二章第二節(jié)自由組合規(guī)律在實踐中的應(yīng)用
- 股東借款合同范本
- 2024年二手房買賣協(xié)議書模板
- 房屋買賣合同簡單版格式
- 外高橋保稅區(qū)清關(guān)合作協(xié)議
- 攤位出租合同格式指南
- 線上支付合作協(xié)議參考
- 實習(xí)保密協(xié)議書范例
- 房屋交易資金代收代付協(xié)議-合同范本
- 工商企業(yè)管理專業(yè)案例分析報告
- 風(fēng)疹病毒實驗活動風(fēng)險評估報告
- AI人工智能(PPT頁)(共37張PPT)
- 中外美術(shù)史年表
- 裝修改造工程施工勞動力計劃及機(jī)械設(shè)備配置
- 二年級上冊道德與法治10《我們不亂扔》說課稿二篇
- 小學(xué)蘇教版六年級上冊數(shù)學(xué)《分?jǐn)?shù)四則混合運算》市級公開課課件
- 蘇州某校蘇教版六年級數(shù)學(xué)上冊第四單元《解決問題的策略》教材分析及全部教案(共含3課時)
- 國家開放大學(xué)電大本科《社會統(tǒng)計學(xué)》2023期末試題及答案(試卷代號:1318)
- 《小鯉魚跳龍門》教學(xué)設(shè)計3篇
- 新能源公司商業(yè)計劃書
評論
0/150
提交評論