第08章 相關(guān)與回歸分析_第1頁
第08章 相關(guān)與回歸分析_第2頁
第08章 相關(guān)與回歸分析_第3頁
第08章 相關(guān)與回歸分析_第4頁
第08章 相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩97頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

應(yīng)用統(tǒng)計(jì)學(xué)第八章相關(guān)與回歸分析

CorrelationandRegressionAnalysis1本章學(xué)習(xí)目標(biāo)通過本章的學(xué)習(xí),你應(yīng)該能夠:

理解和掌握相關(guān)分析和回歸分析的原理估計(jì)一元線性回歸模型,并對(duì)模型進(jìn)行檢驗(yàn)利用計(jì)算機(jī)軟件估計(jì)多元線性回歸模型,并對(duì)模型進(jìn)行檢驗(yàn)了解幾種常見的非線性函數(shù),并對(duì)它們進(jìn)行線性化變換;計(jì)算樣本相關(guān)系數(shù),并能對(duì)相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)2第8章相關(guān)與回歸分析8.1相關(guān)與回歸的基本概念8.2簡(jiǎn)單線性相關(guān)與回歸分析8.3多元線性相關(guān)與回歸分析8.4非線性相關(guān)分析與非線性回歸分析38.1相關(guān)與回歸的基本概念8.1.1變量間的相互關(guān)系8.1.2相關(guān)關(guān)系的類型8.1.3相關(guān)分析與回歸分析4變量間的相互關(guān)系確定性的函數(shù)關(guān)系:當(dāng)一個(gè)或者幾個(gè)變量取一定的值時(shí),另一個(gè)變量有確定值與之相對(duì)應(yīng);例如銷售收入與銷售量之間的關(guān)系、路程與速度之間的關(guān)系;不確定性的相關(guān)關(guān)系:當(dāng)一個(gè)或幾個(gè)相互聯(lián)系的變量取一定數(shù)值時(shí),與之相對(duì)應(yīng)的另一個(gè)變量的值雖然不確定,但它仍按照某種規(guī)律在一定的范圍內(nèi)變化;

變量之間的函數(shù)關(guān)系和相關(guān)關(guān)系在一定條件下可以相互轉(zhuǎn)化。

客觀現(xiàn)象的函數(shù)關(guān)系可以用數(shù)學(xué)分析的方法去研究,而研究客觀現(xiàn)象的相關(guān)關(guān)系必須借助于統(tǒng)計(jì)學(xué)中的相關(guān)與回歸分析方法。

5相關(guān)關(guān)系的類型從相關(guān)關(guān)系涉及的變量數(shù)量看:?jiǎn)蜗嚓P(guān)和復(fù)相關(guān)一個(gè)變量對(duì)另一變量的相關(guān)關(guān)系,稱為單相關(guān);

一個(gè)變量對(duì)兩個(gè)以上變量的相關(guān)關(guān)系時(shí),稱為復(fù)相關(guān);

從變量相關(guān)關(guān)系的表現(xiàn)形式看:線性相關(guān)和非線性相關(guān)從變量相關(guān)關(guān)系變化的方向看:正相關(guān)和負(fù)相關(guān)從變量相關(guān)的程度看:完全相關(guān)(函數(shù)關(guān)系)、不完全相關(guān)、不相關(guān)6相關(guān)分析與回歸分析

聯(lián)系:有共同的研究對(duì)象,在具體應(yīng)用時(shí),常常必須互相補(bǔ)充;

區(qū)別:研究目的和方法上有明顯區(qū)別;局限性:定性分析與定量分析相結(jié)合;相關(guān)分析是用一個(gè)指標(biāo)(相關(guān)系數(shù)r)來表明現(xiàn)象間依存關(guān)系的密切程度。

回歸分析是用數(shù)學(xué)模型近似表達(dá)變量間的平均變化關(guān)系。7相關(guān)分析可以不必確定變量中哪個(gè)是自變量,哪個(gè)是因變量,其所涉及的變量都是隨機(jī)變量。回歸分析必須事先確定具有相關(guān)關(guān)系的變量中哪個(gè)為自變量,哪個(gè)為因變量。一般地說,回歸分析中因變量是隨機(jī)的,而把自變量作為研究時(shí)給定的非隨機(jī)變量。相關(guān)分析和回歸分析有共同的研究對(duì)象,常常必須互相補(bǔ)充。相關(guān)分析需要依靠回歸分析來表明現(xiàn)象數(shù)量相關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來表明現(xiàn)象數(shù)量變化的密切程度。只有當(dāng)變量之間存在著高度相關(guān)時(shí),進(jìn)行回歸分析才有意義。相關(guān)分析與回歸分析

88.2簡(jiǎn)單線性相關(guān)與回歸分析8.2.1簡(jiǎn)單線性相關(guān)系數(shù)及檢驗(yàn)8.2.2總體回歸函數(shù)與樣本回歸函數(shù)8.2.3回歸系數(shù)的估計(jì)8.2.4簡(jiǎn)單線性回歸模型的檢驗(yàn)8.2.4簡(jiǎn)單線性回歸模型預(yù)測(cè)9相關(guān)系數(shù)總體相關(guān)系數(shù)(

populationcorrelationcoefficient)ρ

是反映兩變量之間線性相關(guān)程度的一種特征值,表現(xiàn)為一個(gè)常數(shù)。樣本相關(guān)系數(shù)(

samplecorrelationcoefficient)r

是總體相關(guān)系數(shù)的一致估計(jì)量,是根據(jù)樣本觀測(cè)值計(jì)算的,反映樣本觀測(cè)值線性相關(guān)程度的指標(biāo)。10樣本相關(guān)系數(shù)其中: r=樣本相關(guān)系數(shù) n=樣本容量

樣本相關(guān)系數(shù):或:11樣本相關(guān)系數(shù)計(jì)算的例子樹的高度樹干的直徑y(tǒng)xxyy2x23582801225644994412401812771897294933619810893660137803600169217147441494511495202512151126122601144

y=321

x=73

xy=3142

y2=14111

x2=71312樹干的直徑,x樹的高度,y樣本相關(guān)系數(shù)計(jì)算的例子r=0.886→表明x和y具有高度線性相關(guān)關(guān)系。13Excel輸出結(jié)果Excel相關(guān)分析的輸出結(jié)果工具/數(shù)據(jù)分析/相關(guān)系數(shù)樹的高度與樹干的直徑的相關(guān)系數(shù)14相關(guān)系數(shù)的特點(diǎn)

r的取值在-1與1之間;

當(dāng)r=0時(shí),X與Y的樣本觀測(cè)值之間沒有線性關(guān)系;在大多數(shù)情況下,0<|r|<1,即X與Y的樣本觀測(cè)值之間存在著一定的線性關(guān)系,當(dāng)r>0時(shí),X與Y為正相關(guān),當(dāng)r<0時(shí),X與Y為負(fù)相關(guān)。如果|r|=1,則表明X與Y完全線性相關(guān),當(dāng)r=1時(shí),稱為完全正相關(guān),而r=-1時(shí),稱為完全負(fù)相關(guān)。

r是對(duì)變量之間線性相關(guān)關(guān)系的度量。r=0只是表明兩個(gè)變量之間不存在線性關(guān)系,但它并不意味著X與Y之間不存在其他類型的關(guān)系。

15r=+0.3r=+1相關(guān)系數(shù)的圖示yxyxyxyxyxr=-1r=-0.6r=016單相關(guān)系數(shù)的顯著性檢驗(yàn)

假設(shè)

H0:ρ=0 (無線性相關(guān)關(guān)系) H1:ρ

≠0 (確實(shí)存在線性相關(guān)關(guān)系)檢驗(yàn)統(tǒng)計(jì)量

(自由度為n–2)17單相關(guān)系數(shù)的顯著性檢驗(yàn)是否可以根據(jù)5%的顯著性水平認(rèn)為樹的高度與樹干的直徑之間存在一定程度的線性相關(guān)關(guān)系?H0:ρ

=0(無線性相關(guān)關(guān)系)H1:ρ≠0(確實(shí)存在線性相關(guān)關(guān)系)

=0.05,df

=

8-2=618單相關(guān)系數(shù)的顯著性檢驗(yàn)結(jié)論:

足以證明樹的高度與樹干的直徑之間存在一定程度的線性相關(guān)關(guān)系。決策:

拒絕H0拒絕H0拒絕H0a/2=0.025-tα/2不能拒絕H00tα/2a/2=0.025-2.44692.44694.68d.f.=8-2=619回歸分析

RegressionAnalysis回歸分析研究一個(gè)變量如何隨著其他變量的變化而變化;

用一個(gè)稱為回歸模型的數(shù)學(xué)方程來描述因變量與自變量之間的變化關(guān)系,再通過控制或給定自變量的數(shù)值來估計(jì)或預(yù)測(cè)因變量可能的數(shù)值。

被解釋變量、因變量(Dependentvariable):被視為隨著自變量而變化的變量,是我們想要加以解釋的變量。解釋變量、自變量(Independentvariable):被視為主動(dòng)變化的變量,用于解釋被解釋變量。20一元(簡(jiǎn)單)線性回歸模型只有一個(gè)自變量,XX和Y的關(guān)系用線性函數(shù)來描述Y的變化被認(rèn)為是由于X的變化引起的21線性部分總體回歸函數(shù)(模型)總體回歸函數(shù)(模型):截距項(xiàng)

斜率

隨機(jī)誤差項(xiàng)(隨機(jī)干擾項(xiàng))因變量Y的第t個(gè)觀測(cè)值自變量X的第t個(gè)觀測(cè)值隨機(jī)誤差項(xiàng)其中,ut是隨機(jī)誤差項(xiàng),又稱隨機(jī)干擾項(xiàng),它是一個(gè)特殊的隨機(jī)變量,反映未列入方程式的其他各種因素對(duì)Y的影響。

22總體回歸線與隨機(jī)誤差項(xiàng)隨機(jī)誤差項(xiàng)yxxi對(duì)應(yīng)的因變量的實(shí)際觀測(cè)值yiyi的擬合值

xi斜率=β2截距=β1

ut23樣本回歸直線是根據(jù)樣本數(shù)據(jù)擬合的,是總體回歸線的一個(gè)估計(jì)。樣本回歸線和樣本回歸模型回歸截距的估計(jì)值回歸斜率的估計(jì)值

估計(jì)的(或擬合的)y值自變量樣本回歸線(樣本回歸方程)樣本回歸函數(shù)(樣本回歸模型)殘差24總體回歸線是未知的,只有一條。樣本回歸線是根據(jù)樣本數(shù)據(jù)擬合的,每抽取一組樣本,便可以擬合一條樣本回歸線??傮w回歸模型中的β1和β2是未知的參數(shù),表現(xiàn)為常數(shù)。而樣本回歸函數(shù)中的和是隨機(jī)變量,其具體數(shù)值隨所抽取的樣本觀測(cè)值不同而變動(dòng)??傮w回歸模型中的ut是yt與未知的總體回歸線之間的縱向距離,它是不可直接觀測(cè)的。而樣本回歸函數(shù)中的et是yt與樣本回歸線之間的縱向距離,當(dāng)根據(jù)樣本觀測(cè)值擬合出樣本回歸線之后,可以計(jì)算出et的具體數(shù)值。

樣本回歸函數(shù)和總體回歸函數(shù)的區(qū)別

25誤差項(xiàng)的標(biāo)準(zhǔn)假定假定1:誤差項(xiàng)的期望值等于0,即對(duì)所有的t總有E(ut)=0假定2:誤差項(xiàng)的方差為常數(shù),即對(duì)所有的t總有Var(ut)=E(ut2)=假定3:誤差項(xiàng)之間不存在序列相關(guān)關(guān)系,其協(xié)方差為零;假定4:自變量是給定的變量,與隨機(jī)誤差項(xiàng)線性無關(guān);假定5:隨機(jī)誤差項(xiàng)服從正態(tài)分布;26最小二乘估計(jì)在根據(jù)樣本數(shù)據(jù)確定樣本回歸方程時(shí),總是希望y的估計(jì)值盡可能地接近其實(shí)際觀測(cè)值,即殘差et的總量越小越好。由于et有正有負(fù),簡(jiǎn)單的代數(shù)和會(huì)相互抵消,因此為了數(shù)學(xué)上便于處理,我們采用殘差平方和作為衡量總偏差的尺度。所謂最小二乘法,就是根據(jù)這一思路,通過使殘差平方和最小來估計(jì)回歸系數(shù)的方法。27最小二乘估計(jì)正規(guī)方程組(標(biāo)準(zhǔn)方程組)28最小二乘估計(jì)量求解正規(guī)方程組,可得:以上就是總體回歸系數(shù)的最小二乘估計(jì)量。29最小二乘估計(jì)量的性質(zhì)最小二乘估計(jì)量是隨著樣本的不同而不同的隨機(jī)變量;在滿足標(biāo)準(zhǔn)假定的情況下,回歸參數(shù)的最小二乘估計(jì)量是無偏的,即

最小二乘估計(jì)量是因變量Y的線性組合;數(shù)學(xué)上還可以證明,在所有的線性無偏估計(jì)中,回歸系數(shù)的最小二乘估計(jì)量的方差最小,同時(shí)隨著樣本容量的增大,其方差會(huì)不斷縮小;綜上所述,在標(biāo)準(zhǔn)的假定條件下,最小二乘估計(jì)量是最佳線性無偏估計(jì)量和一致估計(jì)量。

30

是當(dāng)x等于0時(shí)y的平均估計(jì)值;

是x每變化一個(gè)單位,因變量y平均變化的量。最小二乘估計(jì)量的解釋31一元線性回歸模型的例子一家房地產(chǎn)公司的經(jīng)理想知道該公司住房的售價(jià)和住房面積(單位:平方尺)

之間的關(guān)系。為此他抽取了一個(gè)包含10套住房的隨機(jī)樣本。因變量(y)=住房的售價(jià)(單位:$1000)自變量(x)=住房的面積(單位:平方尺)32住房?jī)r(jià)格例子的樣本數(shù)據(jù)住房的售價(jià)y住房的面積xxyx224514003430001960000312160049920025600002791700474300289000030818755775003515625199110021890012100002191550339450240250040523509517505522500324245079380060025003191425454575203062525517004335002890000

y=2865

x=17150

xy=5085975

x2=3098375033回歸系數(shù)的估計(jì)34用Excel進(jìn)行回歸分析工具/數(shù)據(jù)分析/回歸35Excel輸出結(jié)果回歸統(tǒng)計(jì)MultipleR0.76211RSquare0.58082AdjustedRSquare0.52842標(biāo)準(zhǔn)誤差41.33032觀測(cè)值10方差分析

dfSSMSFSignificanceF回歸分析118934.934818934.934811.08480.01039殘差813665.56521708.1957總計(jì)932600.5000

Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%Intercept98.2483358.033481.692960.12892-35.57720232.07386住房的面積0.109770.032973.329380.010390.033740.18580樣本回歸方程是:36回歸分析的圖示住房?jī)r(jià)格模型:散點(diǎn)圖和樣本回歸線斜率

=0.10977截距

=98.2483337是當(dāng)x等于0時(shí)y的平均估計(jì)值在這個(gè)例子中,沒有房子的面積會(huì)等于0,所以98.24833僅僅意味著在所觀測(cè)的樣本范圍內(nèi),住房售價(jià)中有$98,248.33不能用住房的面積來加以解釋?;貧w截距估計(jì)值的解釋38回歸斜率估計(jì)值的解釋是x每變化一個(gè)單位,因變量y平均變化的量。這里0.10977表示住房面積每增加一平方尺,住房的售價(jià)平均增加0.10977×$1000=$109.77。39總體(隨機(jī)誤差項(xiàng))方差的估計(jì)

標(biāo)準(zhǔn)的一元線性回歸模型除了β1和β2以外,還有一個(gè)未知參數(shù),就是總體隨機(jī)誤差項(xiàng)的方差

2。由于隨機(jī)誤差項(xiàng)ut不可直接觀測(cè),所以需要用最小二乘殘差et來估計(jì)

2。

數(shù)學(xué)上可以證明,S2是

2的無偏估計(jì)。40總體(隨機(jī)誤差項(xiàng))方差的估計(jì)

分母n-2是自由度,因?yàn)闅埐畋仨殱M足兩個(gè)約束條件:S2的正平方根稱為回歸估計(jì)的標(biāo)準(zhǔn)誤差。S越小表明實(shí)際觀測(cè)點(diǎn)與所擬合的樣本回歸線的離差程度越小,即樣本回歸線具有較強(qiáng)的代表性,反之,S越大表明實(shí)際觀測(cè)點(diǎn)與所擬合的樣本回歸線的離差程度越大,即回歸線的代表性越差。

41回歸模型檢驗(yàn)的種類

理論意義檢驗(yàn):主要考察參數(shù)估計(jì)值的符號(hào)和取值是否與實(shí)質(zhì)性科學(xué)的理論以及人們的實(shí)踐經(jīng)驗(yàn)相符。如果不符,原因可能是樣本容量太小,或者不滿足標(biāo)準(zhǔn)假定條件。

一級(jí)檢驗(yàn)(統(tǒng)計(jì)學(xué)檢驗(yàn)):利用統(tǒng)計(jì)學(xué)中的抽樣理論來檢驗(yàn)樣本回歸方程的可靠性,具體分為擬合程度評(píng)價(jià)和顯著性檢驗(yàn)。這是所有現(xiàn)象進(jìn)行回歸分析時(shí)都必須通過的檢驗(yàn)。

二級(jí)檢驗(yàn)(經(jīng)濟(jì)計(jì)量學(xué)檢驗(yàn)):是對(duì)標(biāo)準(zhǔn)線性回歸模型的假定條件能否得到滿足進(jìn)行檢驗(yàn),具體包括序列相關(guān)檢驗(yàn)、異方差檢驗(yàn)等等。這是經(jīng)濟(jì)計(jì)量學(xué)研究的內(nèi)容。42擬合程度的評(píng)價(jià)所謂擬合程度是指樣本觀測(cè)值聚集在樣本回歸線周圍的緊密程度。

判斷回歸模型擬合程度優(yōu)劣的指標(biāo)是可決系數(shù)(決定系數(shù)),該指標(biāo)是建立在對(duì)總離差平方和進(jìn)行分解的基礎(chǔ)之上的。

總離差(因變量的實(shí)際觀測(cè)值與樣本均值的離差)

可解釋離差(因變量的擬合值與樣本均值的離差,可以看作能夠由回歸直線解釋的部分)

殘差(因變量的實(shí)際觀測(cè)值與擬合值的離差,可以看作不能由回歸直線解釋的部分)

43總離差平方和的分解總離差平方和可以分解為兩部分:總離差平方和回歸平方和殘差平方和其中:

=因變量觀測(cè)值的平均值

y=因變量的觀測(cè)值 =因變量實(shí)際觀測(cè)值的擬合值44XiyxyiTSS

=

(yi

-

y)2RSS

=

(yi

-

yi)2

ESS=

(yi-

y)2

___總離差平方和的分解y

yy_y

45可決系數(shù)(coefficientofdetermination)是回歸平方和占總離差平方和的比例,可決系數(shù)越大,說明模型擬合程度越高。

可決系數(shù)也稱為R平方(R-squared),用R2表示。可決系數(shù),R246相關(guān)系數(shù)與可決系數(shù)

R2注意:

一元線性回歸模型的可決系數(shù)就是因變量Y和自變量X的相關(guān)系數(shù)的平方。

其中: R2=一元線性回歸模型的可決系數(shù) r=簡(jiǎn)單相關(guān)系數(shù)區(qū)別:可決系數(shù)是就回歸模型而言的,具有非負(fù)性;而相關(guān)系數(shù)是就兩個(gè)變量而言的,可正可負(fù);

47R2=1可決系數(shù),R2yxyxR2=1R2=1所有的觀測(cè)值都位于回歸直線上,RSS=0,說明總離差可以完全由所估計(jì)的樣本回歸直線來解釋。48可決系數(shù),R2yxyx0<R2<1觀測(cè)值并不是全部位于回歸直線上,RSS>0,有部分總離差不能由樣本回歸直線來解釋。49可決系數(shù),R2R2=0回歸直線沒有解釋任何離差,即模型中解釋變量X與因變量Y完全無關(guān),Y的總離差全部歸于殘差平方和,即RSS=TSS。yxR2=050Excel輸出結(jié)果回歸統(tǒng)計(jì)MultipleR0.76211RSquare0.58082AdjustedRSquare0.52842標(biāo)準(zhǔn)誤差41.33032觀測(cè)值10方差分析

dfSSMSFSignificanceF回歸分析118934.934818934.934811.08480.01039殘差813665.56521708.1957總計(jì)932600.5000

Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%Intercept98.2483358.033481.692960.12892-35.57720232.07386住房的面積0.109770.032973.329380.010390.033740.18580住房售價(jià)的58.08%離差可以用住房的面積變化來解釋。51回歸系數(shù)的顯著性檢驗(yàn)——t檢驗(yàn)

回歸斜率的顯著性檢驗(yàn)—t檢驗(yàn)X和Y是否確實(shí)存在線性關(guān)系?零假設(shè)和備擇假設(shè)H0:β2=0 (無線性相關(guān)關(guān)系)H1:β2

0 (線性相關(guān)關(guān)系確實(shí)存在)檢驗(yàn)統(tǒng)計(jì)量

其中:=回歸斜率的估計(jì)值

β2=假設(shè)的斜率=標(biāo)準(zhǔn)差的估計(jì)值52其中:

=最小二乘斜率的標(biāo)準(zhǔn)差的估計(jì)值 =回歸估計(jì)的標(biāo)準(zhǔn)誤差回歸系數(shù)的顯著性檢驗(yàn)——t檢驗(yàn)53Excel輸出結(jié)果回歸統(tǒng)計(jì)MultipleR0.76211RSquare0.58082AdjustedRSquare0.52842標(biāo)準(zhǔn)誤差41.33032觀測(cè)值10方差分析

dfSSMSFSignificanceF回歸分析118934.934818934.934811.08480.01039殘差813665.56521708.1957總計(jì)932600.5000

Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%Intercept98.2483358.033481.692960.12892-35.57720232.07386住房的面積0.109770.032973.329380.010390.033740.1858054住房的售價(jià)$1000(y)住房的面積(x)2451400312160027917003081875199110021915504052350324245031914252551700估計(jì)的樣本回歸方程為:模型中斜率等于0.10977;請(qǐng)問住房的面積對(duì)住房的售價(jià)是否具有顯著的影響?

回歸系數(shù)顯著性檢驗(yàn)的例子55回歸系數(shù)顯著性檢驗(yàn)的例子H0:β2=0H1:β2

0檢驗(yàn)統(tǒng)計(jì)量:

t=3.32938有足夠的證據(jù)表明住房的面積確實(shí)對(duì)住房的售價(jià)有顯著的影響。Excel輸出結(jié)果:拒絕H0

Coefficients標(biāo)準(zhǔn)誤差tStatP-valueIntercept98.2483358.033481.692960.12892住房的面積0.109770.032973.329380.01039t決策:結(jié)論:拒絕H0拒絕H0a/2=.025-tα/2不能拒絕H00tα/2a/2=.025-2.30602.30603.32938d.f.=10-2=856回歸系數(shù)的置信區(qū)間估計(jì)斜率的置信區(qū)間估計(jì)的公式為:Excel的輸出結(jié)果:以95%的置信水平認(rèn)為,斜率的置信區(qū)間為(0.0337,0.1858)

Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%Intercept98.2483358.033481.692960.12892-35.57720232.07386住房的面積0.109770.032973.329380.010390.033740.18580d.f.=n-257回歸系數(shù)的置信區(qū)間估計(jì)因?yàn)樽》康氖蹆r(jià)是以$1000為單位的,我們可以以95%的置信度認(rèn)為住房面積每增加一平方尺對(duì)住房售價(jià)的平均影響在$33.70到$185.80之間。

Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%Intercept98.2483358.033481.692960.12892-35.57720232.07386住房的面積0.109770.032973.329380.010390.033740.18580這個(gè)95%的置信區(qū)間

不包含0.結(jié)論:以0.05的顯著性水平認(rèn)為住房的面積對(duì)住房的售價(jià)有顯著的影響。58簡(jiǎn)單線性回歸模型預(yù)測(cè)

回歸預(yù)測(cè)的基本公式:發(fā)生預(yù)測(cè)誤差的原因有:模型本身中的誤差因素所造成的誤差(總體回歸函數(shù)未將所有影響Y的因素都納入模型,可以用隨機(jī)擾動(dòng)項(xiàng)的方差來評(píng)價(jià))

由于回歸系數(shù)的估計(jì)值同其真值不一致所造成的誤差

由于X的設(shè)定值同實(shí)際值不同引起的誤差

由于未來時(shí)期總體回歸系數(shù)發(fā)生變化造成的誤差

59一元線性回歸模型區(qū)間預(yù)測(cè)

區(qū)間預(yù)測(cè)的公式:60一元線性回歸模型預(yù)測(cè)的例子請(qǐng)預(yù)測(cè)面積為2000平方尺住房的售價(jià)?住房的售價(jià)$1000(y)住房的面積(x)2451400312160027917003081875199110021915504052350324245031914252551700估計(jì)的樣本回歸方程為:61一元線性回歸模型預(yù)測(cè)的例子預(yù)測(cè)面積為2000平方尺住房的售價(jià)為:預(yù)計(jì)面積為2000平方尺的住房的售價(jià)為317.85×$1,000=$317,85062一元線性回歸模型預(yù)測(cè)的例子計(jì)算置信度為95%的住房(面積為2000平方尺)售價(jià)的預(yù)測(cè)區(qū)間。置信度為95%的住房售價(jià)的預(yù)測(cè)區(qū)間為215.57--420.13,或者$215,570--$420,130。638.3多元線性相關(guān)與回歸分析8.3.1多元線性回歸模型及假設(shè)8.3.2多元線性回歸模型的估計(jì)8.3.3多元線性回歸模型的檢驗(yàn)64多元線性回歸模型研究在線性相關(guān)條件下,兩個(gè)和兩個(gè)以上自變量對(duì)一個(gè)因變量的數(shù)量變化關(guān)系??傮w回歸模型截距項(xiàng)總體回歸系數(shù)隨機(jī)誤差項(xiàng)估計(jì)的(或擬合的)Y值總體回歸系數(shù)的估計(jì)值估計(jì)的樣本回歸方程:65誤差項(xiàng)的標(biāo)準(zhǔn)假定假定1:零均值假定2:同方差

假定3:無自相關(guān)假定4:自變量與隨機(jī)誤差項(xiàng)線性無關(guān)假定5:正態(tài)性假定假定6:各自變量之間不存在較強(qiáng)的線性關(guān)系66回歸系數(shù)的估計(jì)為了便于表述,我們用矩陣形式來表示總體回歸模型。其中:67回歸系數(shù)的估計(jì)68回歸系數(shù)的估計(jì)在此,Y和X都是已知的矩陣或者向量,只有是未知的,所以,而根據(jù)定理,如果,則因此兩項(xiàng)均轉(zhuǎn)置,得

69最小二乘估計(jì)量整理得:(正規(guī)方程組,即標(biāo)準(zhǔn)方程組,k個(gè)方程)

根據(jù)標(biāo)準(zhǔn)假定6,k個(gè)自變量之間不存在高度的線性相關(guān)關(guān)系,因此的逆矩陣存在;此即最小二乘估計(jì)量的矩陣表示。70多元線性回歸模型的例子某個(gè)餡餅分銷商經(jīng)理想要評(píng)價(jià)影響?zhàn)W餅銷售的因素,為此他確定了因變量:餡餅銷售量(以周為單位)自變量:價(jià)格($)

廣告投入($100)他收集了過去15周的數(shù)據(jù)作為樣本。71餡餅銷售模型周餡餅銷售量?jī)r(jià)格($)廣告投入($100s)13505.503.324607.503.333508.003.044308.004.553506.803.063807.504.074304.503.084706.403.794507.003.5104905.004.0113407.203.5123007.903.2134405.904.0144505.003.5153007.002.7多元回歸模型:72估計(jì)多元線性回歸模型多元回歸分析的計(jì)算通常采用現(xiàn)成的軟件來完成,例如,Excel、SPSS等。Excel:工具/數(shù)據(jù)分析/回歸73Excel輸出結(jié)果回歸統(tǒng)計(jì)MultipleR0.72213RSquare0.52148AdjustedRSquare0.44172標(biāo)準(zhǔn)誤差47.46341觀測(cè)值15方差分析

dfSSMSFSignificanceF回歸分析229460.02714730.0136.538610.01201殘差1227033.3062252.776總計(jì)1456493.333

Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%Intercept306.52619114.253892.682850.0199357.58835555.46404價(jià)格-24.9750910.83213-2.305650.03979-48.57626-1.37392廣告投入74.1309625.967322.854780.0144917.55303130.7088874多元線性回歸方程的解釋-24.975:

扣除廣告投入對(duì)銷售量的影響,平均來講,銷售價(jià)格每增加$1將引起餡餅的周銷售量減少24.975個(gè)。74.131:

扣除銷售價(jià)格對(duì)銷售量的影響,平均來講,廣告投入每增加$100將引起餡餅的周銷售量增加74.131個(gè)75利用模型進(jìn)行預(yù)測(cè)請(qǐng)預(yù)測(cè)當(dāng)銷售價(jià)格為$5.50,廣告投入為$350時(shí)餡餅的周銷售數(shù)量:預(yù)測(cè)的銷售量為428.62個(gè)注意廣告投入是以$100為單位的,所以$350意味著x2=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論