ch相關(guān)與回歸分析實(shí)用_第1頁(yè)
ch相關(guān)與回歸分析實(shí)用_第2頁(yè)
ch相關(guān)與回歸分析實(shí)用_第3頁(yè)
ch相關(guān)與回歸分析實(shí)用_第4頁(yè)
ch相關(guān)與回歸分析實(shí)用_第5頁(yè)
已閱讀5頁(yè),還剩79頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

會(huì)計(jì)學(xué)1ch相關(guān)與回歸分析實(shí)用Ch7學(xué)習(xí)目的1,掌握相關(guān)與回歸的基本概念2,掌握相關(guān)分析技術(shù)3,掌握一元線(xiàn)性回歸方法4,掌握多元線(xiàn)性回歸方法5,掌握回歸診斷方法Ch7相關(guān)與回歸分析§7.1相關(guān)與回歸的基本概念§7.2相關(guān)分析§7.3一元線(xiàn)性回歸分析§7.4多元線(xiàn)性回歸分析(new)§7.5回歸診斷與殘差分析(new)第1頁(yè)/共84頁(yè)Ch7相關(guān)與回歸分析統(tǒng)計(jì)學(xué)原理§7.1相關(guān)與回歸的基本概念§7.2相關(guān)分析§7.3一元線(xiàn)性回歸分析§7.4多元線(xiàn)性回歸分析(new)§7.5回歸診斷與殘差分析(new)第2頁(yè)/共84頁(yè)§7.1相關(guān)與回歸的基本概念§7.1.1確定性關(guān)系與相關(guān)關(guān)系§7.1.2回歸函數(shù)與經(jīng)驗(yàn)方程§7.1.3相關(guān)與回歸分析§7.1.4相關(guān)表與相關(guān)圖§7.1.5相關(guān)關(guān)系的種類(lèi)Ch7相關(guān)與回歸分析§7.1相關(guān)與回歸的基本概念§7.2相關(guān)分析§7.3一元線(xiàn)性回歸分析§7.4多元線(xiàn)性回歸分析(new)§7.5回歸診斷與殘差分析(new)返回第3頁(yè)/共84頁(yè)關(guān)系給定一個(gè)X,就可以確定一個(gè)Y,Y值隨X的值變化。Y?(X=Xt)是這兩個(gè)變量之間的函數(shù)表達(dá)式。這個(gè)函數(shù)表達(dá)式,對(duì)應(yīng)著一個(gè)具體的因果數(shù)學(xué)定理。特征是,“2個(gè)以上變量的變化方向大致是規(guī)則的”,變量Y,X之間的近似規(guī)則關(guān)系,只是一個(gè)經(jīng)驗(yàn)關(guān)系u是Y與?(X=Xt)的偏差,且總假定E(u)=0關(guān)系確定性關(guān)系相關(guān)關(guān)系經(jīng)驗(yàn)關(guān)系Y

?(X=Xt)+u函數(shù)關(guān)系統(tǒng)計(jì)關(guān)系Y

?(X=Xt)§7.1.1確定性關(guān)系與相關(guān)關(guān)系Ch7相關(guān)與回歸分析§7.1相關(guān)與回歸的基本概念第4頁(yè)/共84頁(yè)§7.1.1確定性關(guān)系與相關(guān)關(guān)系確定性關(guān)系也叫函數(shù)關(guān)系。

Y?(X=Xt),(7.1.1)即只要給定一個(gè)X,就可以確定一個(gè)Y,Y值隨X的值變化,則變量Y,X之間,就是一種確定性的函數(shù)關(guān)系。Y?(X=Xt)是這兩個(gè)變量之間的函數(shù)表達(dá)式。這個(gè)函數(shù)表達(dá)式,對(duì)應(yīng)著一個(gè)具體的因果數(shù)學(xué)定理。

相關(guān)關(guān)系也叫統(tǒng)計(jì)關(guān)系或者經(jīng)驗(yàn)關(guān)系。相關(guān)關(guān)系的特征是,“2個(gè)以上變量的變化方向大致是規(guī)則的”,變量Y,X之間的某種近似規(guī)則關(guān)系,不是一種精確的確定性關(guān)系,只是一個(gè)經(jīng)驗(yàn)關(guān)系

Y

?(X=Xt)+u;(7.1.2)u是Y與?(X=Xt)的偏差,且總假定E(u)=0。這種經(jīng)驗(yàn)關(guān)系就是統(tǒng)計(jì)相關(guān)關(guān)系。統(tǒng)計(jì)相關(guān)關(guān)系,常常表現(xiàn)為一種統(tǒng)計(jì)定律。統(tǒng)計(jì)定律和相關(guān)關(guān)系,是相關(guān)回歸分析的主要研究對(duì)象。Ch7相關(guān)與回歸分析§7.1相關(guān)與回歸的基本概念返回第5頁(yè)/共84頁(yè)§7.1.2回歸函數(shù)與經(jīng)驗(yàn)方程存在統(tǒng)計(jì)相關(guān)關(guān)系的變量Y,X之間,有Y

?(X=Xt)+u;(7.1.2)因?yàn)椋珽(u)=0,所以,E(Y|X=Xt

)?(Xt)是給定X=Xt條件下Y的期望值,?(Xt)就是Y關(guān)于X的期望函數(shù)。它實(shí)際反映的是Y,X之間存在的統(tǒng)計(jì)規(guī)律。因?yàn)榻y(tǒng)計(jì)規(guī)律,總是可以在日常的實(shí)踐過(guò)程中,不斷回歸重現(xiàn)。于是,期望函數(shù),也稱(chēng)為Y關(guān)于X的回歸方程或回歸函數(shù),記為

??(X=Xt)

E(Y|X=Xt

)(7.1.3)回歸函數(shù)的具體表達(dá)式,通常也叫經(jīng)驗(yàn)函數(shù)或者經(jīng)驗(yàn)公式。Ch7相關(guān)與回歸分析§7.1相關(guān)與回歸的基本概念返回第6頁(yè)/共84頁(yè)§7.1.3相關(guān)與回歸分析相關(guān)與回歸分析:是研究相關(guān)關(guān)系的一種有力數(shù)學(xué)工具。它是建立在對(duì)客觀事物進(jìn)行大量試驗(yàn)和觀察的基礎(chǔ)上,在不確定的現(xiàn)象中,尋找隱藏的統(tǒng)計(jì)規(guī)律性的數(shù)理統(tǒng)計(jì)方法。具體步驟是:第一步,根據(jù)研究的目的,通過(guò)觀察和實(shí)驗(yàn)取得資料。第二步,整理資料。分組編制相關(guān)表,以便進(jìn)行分析。第三步,繪制相關(guān)圖。把成對(duì)的相關(guān)資料,繪成散布圖或曲線(xiàn)圖,從圖形中,初步判斷變量之間是否存在相關(guān)關(guān)系,以及相關(guān)的基本形式。第四步,相關(guān)關(guān)系的解析。建立回歸方程,計(jì)算估計(jì)標(biāo)準(zhǔn)誤差、相關(guān)系數(shù)等,以反映變量之間的關(guān)系、誤差大小及密切程度,并運(yùn)用數(shù)理統(tǒng)計(jì)方法,進(jìn)行檢驗(yàn)和評(píng)價(jià)。Ch7相關(guān)與回歸分析§7.1相關(guān)與回歸的基本概念返回第7頁(yè)/共84頁(yè)§7.1.4相關(guān)表與相關(guān)圖相關(guān)表與相關(guān)圖,是研究相關(guān)關(guān)系的直觀工具。一般在進(jìn)行詳細(xì)的定量分析之前,可以先利用它們,對(duì)現(xiàn)象之間存在的相關(guān)方向、形式和密切程度,作大致的判斷。相關(guān)表,是一種反映變量之間相關(guān)關(guān)系的統(tǒng)計(jì)表。將某一變量,按其取值的大小順序排列,然后再將與其相關(guān)的另一變量的值,對(duì)應(yīng)排列,便可得到簡(jiǎn)單的相關(guān)表。利用相關(guān)表,便可得到相關(guān)圖。相關(guān)圖又稱(chēng)散布圖。它是以直角坐標(biāo)系的橫軸代表變量X,縱軸代表變量Y

,將兩個(gè)變量的值,用坐標(biāo)點(diǎn)(Xt,Yt)的形式描繪出來(lái),用來(lái)反映兩變量之間相關(guān)關(guān)系的圖形。Ch7相關(guān)與回歸分析§7.1相關(guān)與回歸的基本概念第8頁(yè)/共84頁(yè)§7.1.4相關(guān)表與相關(guān)圖【例7-1】利用某國(guó)1951-1970年的消費(fèi)Y

和可支配收入X數(shù)據(jù),可整理得相關(guān)表與相關(guān)圖。Ch7相關(guān)與回歸分析§7.1相關(guān)與回歸的基本概念年份序號(hào)t

可支配收入Xt

消費(fèi)Yt

19511226.6206.319522238.3216.719533252.623019544257.4236.519555275.3254.419566293.2266.719577308.5281.419588318.8290.119599337.3311.2196010350325.2196111364.4335.2196212385.3355.1196313404.6375196414438.1401.2196515473.2432.8196616511.9466.3196717546.3492.1196818591.2535.8196919631.6577.5197020684.7616.8圖7-1消費(fèi)Y

和可支配收入X相關(guān)圖YX0200200600400400600返回第9頁(yè)/共84頁(yè)§7.1.5相關(guān)關(guān)系的種類(lèi)按相關(guān)的程度可分為完全相關(guān)、不完全相關(guān)、不相關(guān)按相關(guān)的方向可分為正相關(guān)、負(fù)相關(guān)按相關(guān)的形式可分為線(xiàn)性相關(guān)和非線(xiàn)性相關(guān)按所研究的變量的多少可分為單相關(guān)、復(fù)相關(guān)和偏相關(guān)Ch7相關(guān)與回歸分析§7.1相關(guān)與回歸的基本概念正線(xiàn)性相關(guān)負(fù)線(xiàn)性相關(guān)YX0YX?=1+

2X.0非線(xiàn)性相關(guān)非線(xiàn)性相關(guān)YX0YX圖7-2線(xiàn)性相關(guān)與非線(xiàn)性相關(guān)0返回第10頁(yè)/共84頁(yè)§7.2相關(guān)分析§7.2.1相關(guān)系數(shù)§7.2.2相關(guān)系數(shù)與相關(guān)程度§7.2.3相關(guān)系數(shù)的檢驗(yàn)§7.2.4等級(jí)相關(guān)系數(shù)及其檢驗(yàn)Ch7相關(guān)與回歸分析§7.1相關(guān)與回歸的基本概念§7.2相關(guān)分析§7.3一元線(xiàn)性回歸分析§7.4多元線(xiàn)性回歸分析(new)§7.5回歸診斷與殘差分析(new)返回第11頁(yè)/共84頁(yè)§7.2.1相關(guān)系數(shù)相關(guān)系數(shù)也叫單相關(guān)系數(shù)。它是在線(xiàn)性相關(guān)的條件下,用來(lái)測(cè)定變量Y,X之間相關(guān)程度的一個(gè)重要指標(biāo)。通常以ρ表示總體的相關(guān)系數(shù),以γ表示樣本的相關(guān)系數(shù)。存在線(xiàn)性相關(guān)的變量總體(Y,X),ρ定義為

(7.2.1)式中:Cov(X,Y)是變量X和Y的協(xié)方差,Var(X)和Var(Y)分別是X和Y的方差。對(duì)來(lái)自總體(Y,X)的n組樣本觀察值(Yt,Xt),t=1,2,3,…,n-1,n,記γ為

(7.2.2)其中SX,Y=Cov(Xt,Yt)是樣本(Yt,Xt)的協(xié)方差,SX和SY分別是X和Y的樣本標(biāo)準(zhǔn)差。樣本相關(guān)系數(shù)γ,是根據(jù)樣本觀察值計(jì)算的。Ch7相關(guān)與回歸分析§7.2相關(guān)分析第12頁(yè)/共84頁(yè)§7.2.1相關(guān)系數(shù)總體ρ值為常數(shù),在很多情況下,是無(wú)法直接按定義計(jì)算的,只能通過(guò)樣本相關(guān)系數(shù)γ,去估計(jì)ρ值。容易證明,樣本相關(guān)系數(shù)γ,是總體相關(guān)系數(shù)ρ的一致估計(jì)量??梢宰C明,存在線(xiàn)性相關(guān)的變量之間,不論是總體相關(guān)系數(shù),還是樣本相關(guān)系數(shù),均有0≦|ρ|≦1,0≦|γ|≦1。為便于計(jì)算,引進(jìn)如下符號(hào):

(7.2.3)Ch7相關(guān)與回歸分析§7.2相關(guān)分析第13頁(yè)/共84頁(yè)§7.2.1相關(guān)系數(shù)【例7-2】利用某國(guó)1951-1970年的消費(fèi)Y和可支配收入X數(shù)據(jù),計(jì)算它們之間的相關(guān)系數(shù)。解:根據(jù)相關(guān)系數(shù)的公式,有

于是Ch7相關(guān)與回歸分析§7.2相關(guān)分析年份序號(hào)t

可支配收入Xt

消費(fèi)Yt

19511226.6206.319522238.3216.719533252.623019544257.4236.519555275.3254.419566293.2266.719577308.5281.419588318.8290.119599337.3311.2196010350325.2196111364.4335.2196212385.3355.1196313404.6375196414438.1401.2196515473.2432.8196616511.9466.3196717546.3492.1196818591.2535.8196919631.6577.5197020684.7616.8第14頁(yè)/共84頁(yè)年份序號(hào)t

可支配收入Xt

消費(fèi)Yt

Xt·Xt

Yt·Yt

Xt·Yt

19511226.6206.351347.5642559.6946747.5819522238.3216.756786.8946958.8951639.6119533252.623063806.76529005809819544257.4236.566254.7655932.2560875.119555275.3254.475790.0964719.3670036.3219566293.2266.785966.2471128.8978196.4419577308.5281.495172.2579185.9686811.919588318.8290.1101633.484158.0192483.8819599337.3311.2113771.396845.44104967.8196010350325.2122500105755113820196111364.4335.2132787.4112359122146.9196212385.3355.1148456.1126096136820196313404.6375163701.2140625151725196414438.1401.2191931.6160961.4175765.7196515473.2432.8223918.2187315.8204801196616511.9466.3262041.6217435.7238699196717546.3492.1298443.7242162.4268834.2196818591.2535.8349517.4287081.6316765196919631.6577.5398918.6333506.3364749197020684.7616.8468814.1380442.2422323合計(jì)-7889.37206.3347155928881293166305平均-394.465360.315173578144406.5158315.3返回第15頁(yè)/共84頁(yè)§7.2.2相關(guān)系數(shù)與相關(guān)程度如果|ρ|=1,表明(Y,X

)之間是完全線(xiàn)性相關(guān),完全線(xiàn)性相關(guān),是一種精確的線(xiàn)性函數(shù)關(guān)系;如果|ρ|=0,表明(Y,X

)之間沒(méi)有關(guān)系或者線(xiàn)性無(wú)關(guān);如果0<|ρ|<1,(Y,X

)是一種線(xiàn)性統(tǒng)計(jì)關(guān)系,線(xiàn)性統(tǒng)計(jì)關(guān)系,是最常見(jiàn)的相關(guān)關(guān)系;0<ρ<1是正的線(xiàn)性相關(guān);-1<ρ<0是負(fù)的線(xiàn)性相關(guān)。|ρ|值越大,則線(xiàn)性關(guān)比較系密切,反之,則線(xiàn)性關(guān)系不密切。同理,|γ|=1,表示樣本(Yt,Xt)為完全線(xiàn)性相關(guān);γ=1,表示(Yt,Xt)為完全正線(xiàn)性相關(guān),樣本的所有點(diǎn)(Yt,Xt)都在一條直線(xiàn)上;γ=-1,表示(Yt,Xt)為完全負(fù)線(xiàn)性相關(guān),樣本的所有點(diǎn)(Yt,Xt)也都在一條直線(xiàn)上;γ=0,表示樣本點(diǎn)(Yt

,Xt)在散點(diǎn)圖上的分布是雜亂無(wú)章的,(Yt,Xt)之間無(wú)相關(guān)關(guān)系;0<|γ|<1,表示(Yt,Xt)之間存在線(xiàn)性相關(guān)關(guān)系,其樣本點(diǎn)(Yt,Xt)大致地分布在某條直線(xiàn)左右。當(dāng)|γ|比較小時(shí),樣本點(diǎn)離該直線(xiàn)比較分散,而當(dāng)|γ|比較大(接近于1)時(shí),樣本點(diǎn)就靠近該直線(xiàn)。Ch7相關(guān)與回歸分析§7.2相關(guān)分析返回第16頁(yè)/共84頁(yè)§7.2.3相關(guān)系數(shù)的檢驗(yàn)檢驗(yàn)樣本相關(guān)系數(shù)γ,實(shí)質(zhì)上是用樣本相關(guān)系數(shù)γ,檢驗(yàn)總體相關(guān)系數(shù)ρ是否為0,如果ρ=0,則兩變量Y,X

之間,線(xiàn)性關(guān)系微弱;若ρ≠0,則兩變量Y,X

之間,線(xiàn)性關(guān)系顯著。由γ的分布理論,可以證明:如果變量Y,X是正態(tài)變量,當(dāng)ρ=0,則與γ有關(guān)的統(tǒng)計(jì)量

(7.2.4)與γ有關(guān)的統(tǒng)計(jì)量

(7.2.5)根據(jù)這一定理,可以檢驗(yàn)ρ是否為0(總體兩變量之間直線(xiàn)相關(guān)關(guān)系是否為不顯著)。各種不同的統(tǒng)計(jì)量,構(gòu)成不同的檢驗(yàn)方法。因此,γ的檢驗(yàn)方法,有t統(tǒng)計(jì)量檢驗(yàn)、F統(tǒng)計(jì)量檢驗(yàn)和γ的查表檢驗(yàn)。γ的查表檢驗(yàn),是t檢驗(yàn)或者F檢驗(yàn)方法的結(jié)果。三種方法的檢驗(yàn)結(jié)論相同。Ch7相關(guān)與回歸分析§7.2相關(guān)分析第17頁(yè)/共84頁(yè)§7.2.3相關(guān)系數(shù)的檢驗(yàn)t統(tǒng)計(jì)量檢驗(yàn)⑴作統(tǒng)計(jì)假設(shè)零假設(shè)H0:ρ=0,備擇假設(shè)H1:ρ≠0。⑵計(jì)算樣本相關(guān)系數(shù)γ的t值,⑶選擇顯著性水平,取小概率=1%或者=5%。根據(jù)和自由度n-2,求t分布的臨界值t/2,若|t|≦t/2,接受H0,表示Y,X之間相關(guān)不顯著;若|t|>t/2,拒絕H0,表示Y,X之間相關(guān)顯著。Ch7相關(guān)與回歸分析§7.2相關(guān)分析第18頁(yè)/共84頁(yè)§7.2.3相關(guān)系數(shù)的檢驗(yàn)F統(tǒng)計(jì)量檢驗(yàn)⑴作統(tǒng)計(jì)假設(shè)零假設(shè)H0:ρ=0,備擇假設(shè)H1:ρ≠0。⑵計(jì)算樣本相關(guān)系數(shù)γ的F值,⑶選擇顯著性水平,取=1%或者=5%。根據(jù)和自由度1,n-2,求F分布的兩個(gè)臨界值F1-/2(1,n-2),F/2(1,n-2),且F1-/2(1,n-2)<F/2(1,n-2)。若F1-/2(1,n-2)≦F≦F/2(1,n-2),接受H0,表示Y,X之間相關(guān)不顯著;若F>F/2(1,n-2)或F<

F1-/2(1,n-2),拒絕H0,表示Y,X之間相關(guān)顯著。說(shuō)明:F檢驗(yàn)是雙側(cè)檢驗(yàn),有兩個(gè)臨界值F1-/2(1,n-2),F/2(1,n-2),且F1-/2(1,n-2)<F/2(1,n-2),即接受零假設(shè)H0的臨界區(qū)域?yàn)镕1-/2(1,n-2)≦F≦F/2(1,n-2)

F≦F/2(1,n-2)、1/F≦1/F1-/2(1,n-2);由于有F~F(1,n-2)和1/F~F(n-2,1),于是可以證明,在H0成立的條件下,F(xiàn)雙側(cè)檢驗(yàn)等價(jià)于兩個(gè)統(tǒng)計(jì)量F、1/F的單側(cè)檢驗(yàn),兩個(gè)統(tǒng)計(jì)量中只要有一個(gè)滿(mǎn)足檢驗(yàn)的要求即可,即F≦

F/2(1,n-2)或者1/F≦F1-/2(1,n-2)=1/F/2(n-2,1)就接受H0。通常的做法是檢驗(yàn)F≦F/2(1,n-2),且統(tǒng)一記F≦F/2。Ch7相關(guān)與回歸分析§7.2相關(guān)分析第19頁(yè)/共84頁(yè)§7.2.3相關(guān)系數(shù)的檢驗(yàn)γ的查表檢驗(yàn)γ的查表檢驗(yàn),是t檢驗(yàn)或者F檢驗(yàn)方法衍生的結(jié)果。不論是t檢驗(yàn)還是F檢驗(yàn),其臨界值t/2、F/2,對(duì)自由度n-2(樣本容量=n)和樣本相關(guān)系數(shù)γ,都有一個(gè)臨界要求,反算出樣本相關(guān)系數(shù)臨界值γ/2,那么由顯著性水平、自由度n-2及臨界樣本相關(guān)系數(shù)γ/2,就可以構(gòu)成一個(gè)相關(guān)系數(shù)檢驗(yàn)表。在給定條件下查驗(yàn)該表,就可以判斷變量Y,X之間是否線(xiàn)性相關(guān)。⑴作統(tǒng)計(jì)假設(shè)H0:ρ=0,H1:ρ≠0。⑵計(jì)算樣本相關(guān)系數(shù)γ。⑶選擇顯著性水平,取=1%或者=5%。根據(jù)和自由度n-2,查相關(guān)系數(shù)表求臨界值γ/2,若|γ|≦γ/2,接受H0,表示Y,X之間相關(guān)不顯著;若|γ|>γ/2,拒絕H0,表示Y,X之間相關(guān)顯著。Ch7相關(guān)與回歸分析§7.2相關(guān)分析第20頁(yè)/共84頁(yè)§7.2.3相關(guān)系數(shù)的檢驗(yàn)【例7-3】利用某國(guó)1951-1970年的消費(fèi)Y和可支配收入X的相關(guān)系數(shù)γ,在=5%時(shí),是否可以認(rèn)為Y和X之間存在顯著性的線(xiàn)性相關(guān)關(guān)系。解:⑴作統(tǒng)計(jì)假設(shè)H0:ρ=0,H1:ρ≠0。⑵計(jì)算樣本相關(guān)系數(shù)γ的t值。已知γ=0.999689,求得t=170.071。⑶選擇顯著性水平,取=5%。根據(jù)和自由度n-2,求得t分布的臨界值t/2(n-2)=t2.5%(20-2)=2.102。因?yàn)閨t|=170.071>t/2=2.102,所以拒絕H0,表示Y,X之間相關(guān)顯著。Ch7相關(guān)與回歸分析§7.2相關(guān)分析返回第21頁(yè)/共84頁(yè)§7.2.4等級(jí)相關(guān)系數(shù)及其檢驗(yàn)等級(jí)相關(guān)系數(shù)(又稱(chēng)為順序相關(guān)系數(shù))。設(shè)有Xt和Yt兩個(gè)數(shù)列,依數(shù)量的大小或者品質(zhì)的優(yōu)劣,分為1,2,3,…,n-1,n個(gè)等級(jí),以VX,t表示各個(gè)Xt的等級(jí)數(shù),以VY,t表示各個(gè)Yt的等級(jí)數(shù),則等級(jí)相關(guān)系數(shù)γs為

(7.2.6)式中,n是樣本容量。該公式可由兩個(gè)等級(jí)變量的相關(guān)系數(shù),推導(dǎo)而來(lái)。與相關(guān)系數(shù)γ類(lèi)似,γs的取值范圍為0≦|γs|≦1。γs為正值,存在正的等級(jí)相關(guān)關(guān)系,γs取負(fù)值,存在負(fù)的等級(jí)相關(guān)。γs=1,表明兩種現(xiàn)象的等級(jí)完全相同,存在完全正相關(guān);γs=-1,表明兩種現(xiàn)象的等級(jí)完全相反,存在完全負(fù)相關(guān)。Ch7相關(guān)與回歸分析§7.2相關(guān)分析非參數(shù)相關(guān)分析。多做定性研究。第22頁(yè)/共84頁(yè)§7.2.4等級(jí)相關(guān)系數(shù)及其檢驗(yàn)等級(jí)相關(guān)系數(shù)檢驗(yàn)。當(dāng)樣本容量n≧20時(shí),可利用以下的t統(tǒng)計(jì)量,進(jìn)行γs的檢驗(yàn)

(7.2.7)當(dāng)總體等級(jí)相關(guān)系數(shù)ρ

s=0時(shí),可以證明:t統(tǒng)計(jì)量服從自由度為n-2的t分布。在給定顯著性水平下,如果|t|≦t/2(n-2),接受H0,表示Y,X之間相關(guān)不顯著;若|t|>t/2(n-2),拒絕H0,表示Y,X之間相關(guān)顯著。同樣也可以參照樣本相關(guān)系數(shù)γ的檢驗(yàn)方法,構(gòu)造新的統(tǒng)計(jì)量t2去進(jìn)行F檢驗(yàn),或者直接查相關(guān)系數(shù)表檢驗(yàn)。Ch7相關(guān)與回歸分析§7.2相關(guān)分析第23頁(yè)/共84頁(yè)§7.2.4等級(jí)相關(guān)系數(shù)及其檢驗(yàn)【例7-4】某校對(duì)學(xué)生某專(zhuān)業(yè)課程的復(fù)習(xí)時(shí)間和考試成績(jī)進(jìn)行調(diào)查。抽查10同學(xué)的有關(guān)數(shù)據(jù)如下表。計(jì)算復(fù)習(xí)時(shí)間與考試成績(jī)的相關(guān)系數(shù)和等級(jí)相關(guān)系數(shù)。根據(jù)以上結(jié)果,能否得出復(fù)習(xí)時(shí)間越長(zhǎng)考試成績(jī)?cè)礁叩慕Y(jié)論。解:Ch7相關(guān)與回歸分析§7.2相關(guān)分析序號(hào)t

復(fù)習(xí)時(shí)間

考試成績(jī)

Dt2=(VX,t-VX,t)2

時(shí)間Xt

排隊(duì)等級(jí)VX,t

成績(jī)Yt

排隊(duì)等級(jí)VX,t

133863024487403114104228520555936168691517108958.50.2589794709119958.50.2510131096100合計(jì)-55-552.5第24頁(yè)/共84頁(yè)§7.2.4等級(jí)相關(guān)系數(shù)及其檢驗(yàn)解:首先對(duì)復(fù)習(xí)時(shí)間X與考試成績(jī)Y按從小到大的順序確定等級(jí)。對(duì)于Xt或者Yt相同的,取其應(yīng)得等級(jí)的平均數(shù)。其次,計(jì)算相關(guān)系數(shù)γ。根據(jù)公式,得γ=0.587,t=2.05。在=5%、自由度=n-2=8條件下,得t/2(n-2)=2.306。因?yàn)閨t|=2.05≦t/2(n-2)=2.306,表示Y,X之間相關(guān)不顯著,難以判斷復(fù)習(xí)時(shí)間X與考試成績(jī)Y之間存在顯著的線(xiàn)性關(guān)系。最后,計(jì)算等級(jí)相關(guān)系數(shù)γs。根據(jù)公式,得γs=0.9848,ts=16.04。在=5%、自由度=n-2=8條件下,得t/2(n-2)=2.306。因?yàn)閨ts|=16.04>t/2(n-2)=2.306,表示Y,X之間相關(guān)顯著,存在復(fù)習(xí)時(shí)間越長(zhǎng)考試成績(jī)?cè)礁叩默F(xiàn)象。Ch7相關(guān)與回歸分析§7.2相關(guān)分析返回第25頁(yè)/共84頁(yè)§7.3一元線(xiàn)性回歸分析§7.3.1標(biāo)準(zhǔn)的一元線(xiàn)性回歸模型§7.3.2一元線(xiàn)性回歸模型的估計(jì)§7.3.3一元線(xiàn)性回歸模型的檢驗(yàn)§7.3.4誤差項(xiàng)ut的自相關(guān)檢驗(yàn)

§7.3.5一元線(xiàn)性回歸模型的預(yù)測(cè)Ch7相關(guān)與回歸分析§7.1相關(guān)與回歸的基本概念§7.2相關(guān)分析§7.3一元線(xiàn)性回歸分析§7.4多元線(xiàn)性回歸分析(new)§7.5回歸診斷與殘差分析(new)返回第26頁(yè)/共84頁(yè)§7.3.1標(biāo)準(zhǔn)的一元線(xiàn)性回歸模型總體回歸函數(shù)設(shè)因變量為Y,自變量為X;若Y的數(shù)學(xué)期望存在,且服從如下的分布

Y~N(1+2X

,

2)(7.3.1)式中1,2和2是不依賴(lài)于X的未知參數(shù)。則方程

Y=1+2X+u

;u~N(0,2)(7.3.2)就稱(chēng)為一元線(xiàn)性回歸模型(或稱(chēng)為相關(guān)方程)。其中,u是隨機(jī)誤差項(xiàng),E(u)=0。又由于Y的數(shù)學(xué)期望是X的函數(shù),

E(Y|X

)=1+2X(7.3.3)Y的取值主要由X的取值決定,因此,E(Y|X

)是一個(gè)關(guān)于X的回歸期望,它從平均意義上表達(dá)了Y與X的統(tǒng)計(jì)規(guī)律性,于是,E(Y|X

)也可以作為Y的估計(jì),故

?X=1+2X(7.3.4)稱(chēng)為總體一元回歸估計(jì)方程或者回歸估計(jì)函數(shù),1,2是這個(gè)回歸方程中的回歸系數(shù),其圖形表現(xiàn)為一條直線(xiàn)。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第27頁(yè)/共84頁(yè)§7.3.1標(biāo)準(zhǔn)的一元線(xiàn)性回歸模型誤差項(xiàng)u的標(biāo)準(zhǔn)假定⑴誤差項(xiàng)的期望值恒為零,即E(ut|Xt)=0(7.3.5)⑵誤差項(xiàng)的方差是同觀察時(shí)點(diǎn)t無(wú)關(guān)的常數(shù),即Var(ut|Xt)=E(ut2|Xt)=2(7.3.6)⑶時(shí)點(diǎn)不同的誤差項(xiàng)之間不相關(guān),即Cov(ut,us)=E(utus

)=0;t≠s(7.3.7)⑷ut的概率分布與1,2和X無(wú)關(guān)。⑸X是給定的變量(確定變量),即X,u不是有統(tǒng)計(jì)從屬關(guān)系的隨機(jī)變量。Cov(Xt,ut)=E(Xtut

)=0(7.3.8)⑹ut服從正態(tài)分布,即ut

~N(0,2)(7.3.9)以上假定最早是由德國(guó)數(shù)學(xué)家高斯提出來(lái)的,也稱(chēng)為高斯假定或者標(biāo)準(zhǔn)假定。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析圖7-3總體回歸與隨機(jī)誤差YX?=1+2X.0Y=1+2X+uut→第28頁(yè)/共84頁(yè)§7.3.1標(biāo)準(zhǔn)的一元線(xiàn)性回歸模型滿(mǎn)足以上⑴~⑸假定的一元線(xiàn)性回歸模型,稱(chēng)為標(biāo)準(zhǔn)的一元線(xiàn)性回歸模型。滿(mǎn)足⑴~⑹假定的一元線(xiàn)性回歸模型,稱(chēng)為標(biāo)準(zhǔn)線(xiàn)性正態(tài)回歸模型。應(yīng)當(dāng)指出的是,在現(xiàn)實(shí)的情況是由于種種原因,以上假定常常不能得到滿(mǎn)足。其最一般的模型及回歸函數(shù)為Y=1+

2X

+u,?X=E(Y|X

)=1+2X(7.3.10)u為隨機(jī)誤差項(xiàng),E(u)=0,E(u2)=

2,Y與u同分布,且均為非正態(tài)分布,我們以下的討論均以(7.3.10)式為基礎(chǔ),其余變量的解釋如前。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析圖7-3總體回歸與隨機(jī)誤差YX?=1+2X.0Y=1+2X+uut→第29頁(yè)/共84頁(yè)§7.3.1標(biāo)準(zhǔn)的一元線(xiàn)性回歸模型樣本回歸函數(shù),就是根據(jù)樣本資料(Yt,Xt),對(duì)總體回歸函數(shù)進(jìn)行擬合的估計(jì)函數(shù)。由于樣本(Yt,Xt)來(lái)源于總體(Y,X

),因此,樣本回歸線(xiàn)與總體回歸線(xiàn),有相同的函數(shù)形式。由樣本關(guān)系方程

(7.3.11)有樣本回歸函數(shù)

(7.3.12)式中,Yt和Xt分別是Y和X的第t次觀察值;?t為樣本回歸線(xiàn)上與Xt相對(duì)應(yīng)的值,它是對(duì)E(Yt|Xt)的估計(jì);為樣本回歸系數(shù),是對(duì)總體回歸系數(shù)的1,2的估計(jì);et=Yt–?t是實(shí)際觀察值與樣本估計(jì)值之差,亦稱(chēng)殘差,是一個(gè)可計(jì)算的量;n為樣本容量;是對(duì)2的估計(jì)。樣本回歸函數(shù)是總體回歸函數(shù)的近似反映?;貧w分析的主要任務(wù),就是充分利用樣本的信息,采用適當(dāng)?shù)姆椒?,使得樣本回歸函數(shù),盡可能接近真實(shí)的總體回歸函數(shù)。

Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析返回第30頁(yè)/共84頁(yè)§7.3.2一元線(xiàn)性回歸模型的估計(jì)回歸系數(shù)的估計(jì)最小二乘法,簡(jiǎn)記為OLS法。它的準(zhǔn)則是使et的平方和最小,即

(7.3.15)由極值條件,有聯(lián)立方程

(7.3.16)整理得正規(guī)方程組

(7.3.17)Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第31頁(yè)/共84頁(yè)§7.3.2一元線(xiàn)性回歸模型的估計(jì)回歸系數(shù)的估計(jì)(續(xù))求解正規(guī)方程組,得

(7.3.18)利用(7.2.3)式,則最小二乘估計(jì)量,又可簡(jiǎn)寫(xiě)為

(7.3.19)Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第32頁(yè)/共84頁(yè)§7.3.2一元線(xiàn)性回歸模型的估計(jì)【例7-5】利用某國(guó)1951-1970年的消費(fèi)Y和可支配收入X數(shù)據(jù),建立消費(fèi)對(duì)可支配收入的回歸估計(jì)方程。解:因?yàn)橄M(fèi)Y和可支配收入X之間是顯著線(xiàn)性相關(guān),所以,可以建立Y,X之間的一元回歸估計(jì)模型Y=1+2X

+u,?X

=E(Y|X

)=1+2X根據(jù)最小二乘估計(jì)方法,得回歸估計(jì)方程?X=5.168775+0.900324X,S=3.174108481,γ2=0.9993781(2.205544043)(0.005293811)d=1.225513

Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第33頁(yè)/共84頁(yè)年份序號(hào)t

可支配收入Xt

消費(fèi)Yt

Xt·Xt

Yt·Yt

Xt·Yt

?X,t

et=Yt–?t

19511226.6206.351347.5642559.6946747.58209.1821-2.88214653819522238.3216.756786.8946958.8951639.61219.7159-3.01593491319533252.623063806.765290058098232.5906-2.59056514819544257.4236.566254.7655932.2560875.1236.9121-0.41211935319555275.3254.475790.0964719.3670036.32253.02791.37208475719566293.2266.785966.2471128.8978196.44269.1437-2.44371113219577308.5281.495172.2579185.9686811.9282.9187-1.5186651619588318.8290.1101633.484158.0192483.88292.192-2.09200022519599337.3311.2113771.396845.44104967.8308.8482.35200961196010350325.2122500105755113820320.28214.917897442196111364.4335.2132787.4112359122146.9333.24681.953234828196212385.3355.1148456.1126096136820352.06353.03646756196313404.6375163701.2140625151725369.43985.560218361196414438.1401.2191931.6160961.4175765.7399.60061.599371305196515473.2432.8223918.2187315.8204801431.2021.598006182196616511.9466.3262041.6217435.7238699466.04450.255475404196717546.3492.1298443.7242162.4268834.2497.0157-4.915663065196818591.2535.8349517.4287081.6316765537.4402-1.640201357196919631.6577.5398918.6333506.3364749573.81333.686717418197020684.7616.8468814.1380442.2422323621.6205-4.820475975合計(jì)2107889.37206.33471559288812931663057206.38.52651E-13平均10.5394.465360.315173578144406.5158315.3360.3154.26326E-14第34頁(yè)/共84頁(yè)§7.3.2一元線(xiàn)性回歸模型的估計(jì)最小二乘估計(jì)量的性質(zhì)可以證明,在高斯假定能夠得到滿(mǎn)足的條件下,

(7.3.20)其方差

(7.3.21)回歸系數(shù)的最小二乘估計(jì)量,是最優(yōu)的線(xiàn)性無(wú)偏估計(jì)量和一致估計(jì)量。以上性質(zhì),在文獻(xiàn)中被稱(chēng)為高斯—馬爾可夫定理。該定理表明,在高斯假定條件下,最小二乘估計(jì)量,是一種最佳的估計(jì)方式。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第35頁(yè)/共84頁(yè)§7.3.2一元線(xiàn)性回歸模型的估計(jì)隨機(jī)誤差項(xiàng)的方差估計(jì)數(shù)學(xué)上可以證明,2的無(wú)偏估計(jì)S2可由下式給出:

(7.3.23)在一元線(xiàn)性回歸模型中,殘差et必須滿(mǎn)足1,2最小二乘估計(jì)要求所導(dǎo)出的兩個(gè)約束條件:

(7.3.24)因而失去了2個(gè)自由度,所以,殘差et的自由度為n-2。S越小,表明實(shí)際觀測(cè)點(diǎn)與所擬的樣本回歸線(xiàn)的離差程度越小,即回歸線(xiàn)具有較強(qiáng)的代表性;反之,S越大,表明實(shí)際觀測(cè)點(diǎn)與所擬合的樣本回歸的離差程度越大,即回歸線(xiàn)的代表性較差。因此,S又叫做回歸估計(jì)的標(biāo)準(zhǔn)誤差。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第36頁(yè)/共84頁(yè)§7.3.2一元線(xiàn)性回歸模型的估計(jì)【例7-6】利用例7-2、例7-5的有關(guān)數(shù)據(jù),計(jì)算其消費(fèi)對(duì)可支配收入回歸估計(jì)方程的回歸估計(jì)標(biāo)準(zhǔn)誤差。解:已知n=20,(Y)=7206.3,(Y2)=2888129,(X·Y)=3166305,(e2)=(Y2)-5.168775×(Y)-0.900324×(X·Y)=2888129-5.168775×7206.3-0.900324×3166305=181.3493637S2=(e2)/(n-2)=181.3493637/18=10.07496465S=3.174108481LXX=359506.4,(X)=7889.3,(X)/n=394.465另外可計(jì)算回歸系數(shù)1,2估計(jì)值的標(biāo)準(zhǔn)差分別為(2.205544043)和(0.005293811)。上述結(jié)果如果用Excel軟件計(jì)算將更為簡(jiǎn)單。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析返回第37頁(yè)/共84頁(yè)§7.3.3一元線(xiàn)性回歸模型的檢驗(yàn)回歸模型檢驗(yàn)的種類(lèi)包括理論意義檢驗(yàn)、一級(jí)檢驗(yàn)和二級(jí)檢驗(yàn)。理論意義檢驗(yàn),主要涉及參數(shù)估計(jì)值的符號(hào)和取值區(qū)間,如果它們與實(shí)質(zhì)性科學(xué)的理論及其人們的經(jīng)驗(yàn)不相符,就說(shuō)明模型不能很好地解釋現(xiàn)實(shí)的現(xiàn)象。一級(jí)檢驗(yàn),又稱(chēng)為統(tǒng)計(jì)學(xué)檢驗(yàn),它是利用統(tǒng)計(jì)學(xué)的抽樣理論,來(lái)檢驗(yàn)回歸方程的可靠性,具體可分為擬合程度評(píng)價(jià)和顯著性檢驗(yàn)。一級(jí)檢驗(yàn),是所有回歸分析必須通過(guò)的檢驗(yàn)。二級(jí)檢驗(yàn),又稱(chēng)為經(jīng)濟(jì)計(jì)量學(xué)檢驗(yàn),它是對(duì)標(biāo)準(zhǔn)線(xiàn)性回歸模型中的高斯假定條件能否滿(mǎn)足,進(jìn)行檢驗(yàn),具體包括序列相關(guān)、異方差性檢驗(yàn)等。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第38頁(yè)/共84頁(yè)§7.3.3一元線(xiàn)性回歸模型的檢驗(yàn)由于

(7.3.30)LYY是實(shí)際觀察值與其樣本均值的總的離差平方和,SSR是由回歸直線(xiàn)解釋的那部分離差平方和,稱(chēng)為回歸平方和,SSE是殘差平方和,是用回歸直線(xiàn)無(wú)法解釋的部分離差平方和。公式兩端同除以L(fǎng)YY,則

(7.3.31)顯然,各個(gè)樣本觀察值與樣本回歸線(xiàn)靠得愈近,SSR在LYY中的比例就越大。因此,可定義這一比例為可決系數(shù)

(7.3.32)Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第39頁(yè)/共84頁(yè)§7.3.3一元線(xiàn)性回歸模型的檢驗(yàn)可決系數(shù)γ2,是對(duì)回歸模型擬合程度的綜合度量指標(biāo),γ2越大,模型擬合程度越高;γ2越小,模型擬合程度越差??蓻Q系數(shù)γ2具有如下性質(zhì):⑴0≦γ2≦1;當(dāng)樣本觀察值(Yt,Xt)都處于回歸直線(xiàn)上時(shí),SSE=0,γ2=1;當(dāng)觀察值(Yt,Xt)并不全部處于回歸直線(xiàn)上時(shí),SSE>0,0<γ2<1;當(dāng)模型中解釋變量X與因變量Y完全無(wú)關(guān)時(shí),LYY=SSE,γ2=0。⑵γ2是樣本觀察值(Yt,Xt)的函數(shù),它也是一統(tǒng)計(jì)量;⑶γ2的開(kāi)平方根為樣本相關(guān)系數(shù)γ。可決系數(shù)開(kāi)平方根后γ的符號(hào),由回歸變差LXY決定,它們兩者同號(hào)。注意:雖然γ2給出了一個(gè)回歸的好壞、適與不適的程度,但不能說(shuō)只有γ2=0時(shí)才表明X完全不能解釋Y。因?yàn)椋词箍傮w相關(guān)系數(shù)ρ=0,樣本相關(guān)系數(shù)γ也不會(huì)正好是0。所以,一個(gè)更根本的問(wèn)題是:γ≠0是否表示X和Y真正相關(guān)ρ≠0?回答這個(gè)問(wèn)題的統(tǒng)計(jì)方法是問(wèn):γ2或γ是否顯著地異于0?這就需要進(jìn)行顯著性檢驗(yàn)。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第40頁(yè)/共84頁(yè)§7.3.3一元線(xiàn)性回歸模型的檢驗(yàn)顯著性檢驗(yàn)回歸分析的顯著性檢驗(yàn),包括兩方面的內(nèi)容:一是對(duì)各回歸系數(shù)的顯著性檢驗(yàn);二是對(duì)整個(gè)回歸方程的顯著性檢驗(yàn)。通常前者采用t檢驗(yàn),后者則是在方差分析的基礎(chǔ)上,進(jìn)行F檢驗(yàn)。在一元線(xiàn)性回歸模型中,由于只有一個(gè)解釋變量X,對(duì)2=0的t檢驗(yàn),和對(duì)整個(gè)回歸方程的F檢驗(yàn),是等價(jià)的。因此,這里只介紹對(duì)回歸系數(shù)的顯著性檢驗(yàn),而對(duì)整個(gè)回歸方程的顯著性檢驗(yàn),在下一節(jié)介紹?;貧w系數(shù)的顯著性檢驗(yàn),就是根據(jù)樣本估計(jì)的結(jié)果,對(duì)總體回歸系數(shù)的有關(guān)假設(shè)進(jìn)行檢驗(yàn)。為了進(jìn)行檢驗(yàn),必須了解的概率分布。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第41頁(yè)/共84頁(yè)§7.3.3一元線(xiàn)性回歸模型的檢驗(yàn)因?yàn)榫鶠榫€(xiàn)性估計(jì)量,是因變量Yt的線(xiàn)性組合,根據(jù)高斯假定,可知Yt是服從正態(tài)分布的變量,所以也服從正態(tài)分布。有

(7.3.34)其中在總體方差2已知的情況下,可利用Z檢驗(yàn)方法,對(duì)回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn)。但一般來(lái)說(shuō),2是未知的,需要用其無(wú)偏估計(jì)量S2去代替。用代表的估計(jì)值,數(shù)學(xué)上可以證明,當(dāng)樣本為小樣本時(shí),有

(7.3.35)利用以上結(jié)論,就可以對(duì)回歸系數(shù)進(jìn)行顯著性檢驗(yàn)。1,2的檢驗(yàn)方法是相同的,但2的檢驗(yàn)更為重要,因?yàn)樗砻髯宰兞縓對(duì)因變量Y線(xiàn)性影響的程度。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第42頁(yè)/共84頁(yè)§7.3.3一元線(xiàn)性回歸模型的檢驗(yàn)以2的檢驗(yàn)為例,其回歸系數(shù)的顯著性檢驗(yàn)步驟:⑴作統(tǒng)計(jì)假設(shè)零假設(shè)H0:2=0,備擇假設(shè)H1:2≠0。⑵計(jì)算回歸系數(shù)2的t值⑶選擇顯著性水平,取小概率=1%或者=5%。根據(jù)和自由度n-2,求t分布的臨界值t/2,若|t|≦t/2,接受零假設(shè)H0,表示Y,X之間相關(guān)不顯著;若|t|>t/2,拒絕零假設(shè)H0,表示Y,X之間相關(guān)顯著。對(duì)一元線(xiàn)性回歸模型,利用(7.3.18),有

(7.3.36)可以證明:檢驗(yàn)H0:2=0等價(jià)于檢驗(yàn)H0:ρ=0,如果檢驗(yàn)認(rèn)為2≠0,就意味著ρ≠0,即認(rèn)為X對(duì)Y的解釋作用是真實(shí)的。由于t~t(n-2),可以證明,t2=F~F(1,n-2),于是在一元線(xiàn)性回歸模型中,對(duì)2的t檢驗(yàn)和對(duì)LYY的解釋平方和做F檢驗(yàn)也是完全等效的。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析返回第43頁(yè)/共84頁(yè)§7.3.4誤差項(xiàng)ut的自相關(guān)檢驗(yàn)

自相關(guān)或稱(chēng)序列相關(guān):如果誤差項(xiàng)之間存在相關(guān)關(guān)系,Cov(ut,us)=E(utus

)≠0;t≠s;t<s(7.3.37)則稱(chēng)這種現(xiàn)象為誤差項(xiàng)ut的自相關(guān)或稱(chēng)序列相關(guān)。如果進(jìn)一步有ut=ρeut-1+t;t~N(0,2);且E(t

s

)=0;t≠s;t<s。(7.3.38)其中-1<ρe<1,則具有這種自回歸關(guān)系的誤差項(xiàng)相關(guān),簡(jiǎn)稱(chēng)一階自相關(guān)。E(ut-1ut

)=E(utut+1

)=ρe(7.3.39)如果誤差項(xiàng)ut存在自相關(guān),則(7.3.12)式,便不能反映變量之間真正的依存關(guān)系,其用最小二乘法所做的回歸估計(jì),便是一個(gè)無(wú)效的估計(jì),因此必須對(duì)ut的獨(dú)立性進(jìn)行檢驗(yàn)。由于總體資料是未知的,因此,只能以樣本回歸模型中的誤差項(xiàng)et來(lái)檢驗(yàn)。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第44頁(yè)/共84頁(yè)§7.3.4誤差項(xiàng)ut的自相關(guān)檢驗(yàn)

圖解法雖然ut是總體誤差,et是樣本誤差,ut和et不是同一回事,但它們是有關(guān)的。可以證明

(7.3.40)如果ut存在自相關(guān),則借助于(7.3.40)式中et可以反映出來(lái)。因此,考察et可以揭示有關(guān)ut序列相關(guān)的線(xiàn)索。為此,可以針對(duì)式(7.3.40)編制et對(duì)時(shí)點(diǎn)t的散布圖;或者針對(duì)式(7.3.38)編制et對(duì)et-1散布圖。如果散布圖表現(xiàn)如圖7-4,就可以推測(cè)其中存在自相關(guān);如果表現(xiàn)不是這樣,也許可以認(rèn)定為不存在自相關(guān)。進(jìn)一步,如果散布圖有一種同號(hào)殘差相隨的傾向,就表明存在正相關(guān)E(utus

)>0;t<s;如果散布圖有一種異號(hào)殘差相隨的傾向,就表明存在負(fù)相關(guān)E(utus

)<0;t<s。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第45頁(yè)/共84頁(yè)§7.3.4誤差項(xiàng)ut的自相關(guān)檢驗(yàn)

圖解法Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析正序列相關(guān)負(fù)序列相關(guān)00圖7-4正序列相關(guān)與負(fù)序列相關(guān)0ut,ett0ut,etut-1,et-1ut,etut,etut-1,et-1t正序列相關(guān)負(fù)序列相關(guān)第46頁(yè)/共84頁(yè)§7.3.4誤差項(xiàng)ut的自相關(guān)檢驗(yàn)

符號(hào)分析順序記下LS回歸中殘差et=Yt–?t的符號(hào),如果殘差et>0,則記為“+”,若殘差et<0,則為“?”,如此一個(gè)殘差序列et,t=1,2,3,…,n便可獲得一個(gè)符號(hào)序列,比如“++?+????++?++??”,符號(hào)序列中,連續(xù)同號(hào)的符號(hào)串,稱(chēng)為一個(gè)游程或者一個(gè)連串,一個(gè)游程中符號(hào)的個(gè)數(shù),叫做游程的長(zhǎng)度??梢宰C明,如果誤差項(xiàng)ut不存在序列相關(guān)ρe=0,則符號(hào)序列中符號(hào)“+”或“?”的出現(xiàn),應(yīng)該是完全隨機(jī)的;連串過(guò)多或者過(guò)少,都是違反隨機(jī)原則的,應(yīng)有ρe≠0。利用符號(hào)檢驗(yàn)方法,可以判斷,如果連串過(guò)少,就表明有正的自相關(guān);如果連串過(guò)多,就表明有負(fù)的自相關(guān)。符號(hào)檢驗(yàn)的具體方法參見(jiàn)第六章。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第47頁(yè)/共84頁(yè)§7.3.4誤差項(xiàng)ut的自相關(guān)檢驗(yàn)

D-W檢驗(yàn)D-W檢驗(yàn),也叫德賓—沃森檢驗(yàn)法(Durbin-Wastontest)。該方法對(duì)檢驗(yàn)是否存在一階自相關(guān),尤其有效。D-W檢驗(yàn)法的統(tǒng)計(jì)量d定義為

(7.3.41)其中n代表樣本大小。因?yàn)?,和只相差一期觀察值,它們是近似相等的,因此令,則(7.3.41)式可寫(xiě)成

(7.3.42)Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第48頁(yè)/共84頁(yè)§7.3.4誤差項(xiàng)ut的自相關(guān)檢驗(yàn)

定義樣本的一階自相關(guān)系數(shù)γe為

(7.3.43)它是ρe的一個(gè)估計(jì)式。利用(7.3.43)式,可以把(7.3.42)式寫(xiě)成

(7.3.44)d的變化范圍為0到4。可見(jiàn),如果不存在一階自相關(guān),有γe=0,d≈2;如果存在完全的正自相關(guān)γe=+1,于是d≈0,因此,d愈接近于0,則存在正自相關(guān)的可能性比較大,在殘差圖上各個(gè)et將聚集在一起,其差分勢(shì)|et-et-1|表現(xiàn)必很??;如果γe=-1,則連續(xù)的殘差中有完全的負(fù)自相關(guān),從而d≈4,因此,d愈接近于4,則愈能證實(shí)存在負(fù)自相關(guān),其殘差表現(xiàn)是一個(gè)正的et之后往往會(huì)有一個(gè)負(fù)的et,于是|et-et-1|>|et|。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第49頁(yè)/共84頁(yè)§7.3.4誤差項(xiàng)ut的自相關(guān)檢驗(yàn)

為了進(jìn)一步判定在各種情況下,是否存在正的或負(fù)的自相關(guān)的問(wèn)題,Durbin-Waston對(duì)任意的樣本容量n和多達(dá)5個(gè)解釋變量的情形,給出了d的分布及d的兩個(gè)值dL(下界)和dU(上界)。如果d值落在[0,dL]范圍內(nèi),則認(rèn)為存在正自相關(guān);如果d值落入[dU,4-dU]范圍內(nèi),則認(rèn)為存在負(fù)自相關(guān);而當(dāng)d落入[dU,4-dU]范圍內(nèi)時(shí),則認(rèn)定不存在自相關(guān);但當(dāng)d落入[dL,dU]或者[4-dL,4-dU]范圍內(nèi)時(shí),則不能認(rèn)定是否存在自相關(guān)。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析不確定區(qū)域→不確定區(qū)域→圖7-5Durbin-Waston

統(tǒng)計(jì)f(d)d拒絕H0,存在正自相關(guān)0H0:ρe=0,H1:ρe≠0。拒絕H0,存在負(fù)自相關(guān)24不拒絕H0dL

dU4-dL4-dU第50頁(yè)/共84頁(yè)§7.3.4誤差項(xiàng)ut的自相關(guān)檢驗(yàn)

D-W雙側(cè)檢驗(yàn)的具體步驟:⑴作統(tǒng)計(jì)假設(shè)H0:ρe=0,H1:ρe≠0。⑵計(jì)算樣本殘差et,計(jì)算(7.3.41)式d統(tǒng)計(jì)量。⑶選擇顯著性水平,取=1%或者=5%。根據(jù),查d統(tǒng)計(jì)量表求臨界值dL/2,dU/2,若d<dL/2或者d>4-dU/2,拒絕H0選擇H1存在自相關(guān);若dU/2<d<4-dU/2,則接受H0,表示不存在自相關(guān);如果dL/2<d<dU/2,或者4-dL/2<d<4-dU/2,檢驗(yàn)結(jié)果不確定。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析不確定區(qū)域→不確定區(qū)域→圖7-5Durbin-Waston

統(tǒng)計(jì)f(d)d拒絕H0,存在正自相關(guān)0H0:ρe=0,H1:ρe≠0。拒絕H0,存在負(fù)自相關(guān)24不拒絕H0dL

dU4-dL4-dU第51頁(yè)/共84頁(yè)§7.3.4誤差項(xiàng)ut的自相關(guān)檢驗(yàn)

【例7-7】利用例7-2、例7-5、例7-6的有關(guān)數(shù)據(jù),試對(duì)消費(fèi)與可支配收入的回歸估計(jì)方程進(jìn)行D-W雙側(cè)檢驗(yàn)。解:利用最小二乘估計(jì)方法,得回歸估計(jì)方程的所有估計(jì)參數(shù)?X=5.168775+0.900324X,S=3.174108481,γ2=0.9993781(2.205544043)(0.005293811)d=1.225513其中(2.205544043)和(0.005293811)為回歸系數(shù)1,2估計(jì)值的標(biāo)準(zhǔn)差,而d為D-W檢驗(yàn)法的統(tǒng)計(jì)量。對(duì)于n=20,包括常數(shù)項(xiàng)在內(nèi)的自變量個(gè)數(shù)k=2,查D-W統(tǒng)計(jì)量d表,在=5%顯著水平上,得dL=1.20和dU=1.41,因?yàn)閐=1.225513在dL=1.20和dU=1.41之間,故不能做出是否存在自相關(guān)的決定。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析圖7-6消費(fèi)函數(shù)殘差序列et圖1152t10163456789et

-61211131417殘差變動(dòng)趨勢(shì)181920-4-20246返回第52頁(yè)/共84頁(yè)§7.3.5一元線(xiàn)性回歸模型的預(yù)測(cè)回歸預(yù)測(cè)的基本公式為

(7.3.45)式中,X0是給定的X具體數(shù)值;?0是X0給定時(shí)Y的預(yù)測(cè)值。回歸預(yù)測(cè)是一種有條件的預(yù)測(cè),在進(jìn)行預(yù)測(cè)時(shí),必須先給出X0的具體數(shù)值。當(dāng)給出X0屬于樣本內(nèi)的數(shù)值時(shí),利用(7.3.45)式計(jì)算?0稱(chēng)為內(nèi)插檢驗(yàn)或者事后預(yù)測(cè)。當(dāng)給出X0屬于樣本之外的數(shù)值時(shí),利用(7.3.45)式計(jì)算?0稱(chēng)為外推預(yù)測(cè)或者事前預(yù)測(cè)。通常所說(shuō)的預(yù)測(cè)就是指事前預(yù)測(cè)。預(yù)測(cè)誤差?0是根據(jù)樣本回歸方程計(jì)算的,它是樣本觀察值的函數(shù),因而也是一隨機(jī)變量。?0與所要預(yù)測(cè)的Y的真值之間,必然存在一定的誤差。這個(gè)誤差的來(lái)源,一般可以概括為以下四個(gè)方面:⑴模型結(jié)構(gòu)誤差所造成的誤差。這一誤差,可以用總體的方差2來(lái)評(píng)價(jià)。⑵回歸系數(shù)的估計(jì)值同其真值不一致所造成的誤差。這一誤差,可以用回歸系數(shù)的最小二乘估計(jì)量的方差來(lái)評(píng)價(jià)。這個(gè)方差值的大小,通常用來(lái)衡量模型的穩(wěn)定性。⑶自變量X的設(shè)定值同其實(shí)際值的偏離所造成的誤差。⑷未來(lái)時(shí)期1,

2發(fā)生變化所造成的誤差。在以上造成預(yù)測(cè)誤差的原因中,⑶、⑷、兩項(xiàng)不屬于回歸方程本身的問(wèn)題,而且也難以事先予以估計(jì)和控制。因此,在下面的討論中,假定只存在⑴、⑵、兩種誤差。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第53頁(yè)/共84頁(yè)§7.3.5一元線(xiàn)性回歸模型的預(yù)測(cè)設(shè)X0給定時(shí)Y的真值為Y0,有Y0=1+2X0

+u0,(7.3.46)則有

(7.3.47)式中,e0是預(yù)測(cè)的殘差。利用期望值與方差的運(yùn)算規(guī)則,以及前面給出的回歸系數(shù)最小二乘估計(jì)量的期望值與方差,可以證明

(7.3.48)在此基礎(chǔ)上,可以證明,?0是Y0的最優(yōu)線(xiàn)性無(wú)偏估計(jì)預(yù)測(cè),即在高斯假定得到滿(mǎn)足的條件下,(7.3.45)式就是Y0的最佳預(yù)測(cè)方式。Ch7相關(guān)與回歸分析§7.3一元線(xiàn)性回歸分析第54頁(yè)/共84頁(yè)§7.3.5一元線(xiàn)性回歸模型的預(yù)測(cè)Y0的區(qū)間估計(jì):由(7.3.47)、(7.3.48)式可知,在高斯假定條件下,e0服從于標(biāo)準(zhǔn)正態(tài)分布,即e0

~N(0,Var(e0))(7.3.49)由于Var(e0)中的2是未知的,通常用其無(wú)偏估計(jì)量S2來(lái)代替。如果用Se0來(lái)表示預(yù)測(cè)的標(biāo)準(zhǔn)誤差的估計(jì)值,

(7.3.50)數(shù)學(xué)上可以證明(Y0-?0)/Se0~t(n-2)(7.3.51)對(duì)于給定的置信度為1-,有Pro{?0-

t/2(n-2)·Se0≤Y0≤?0+t/2(n-2)·Se0}=1-,(7.3.52)于是可以得出Y0的1-的置信區(qū)間為?0-

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論