版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
應(yīng)用統(tǒng)計(jì)學(xué)第八章相關(guān)與回歸分析
CorrelationandRegressionAnalysis1本章學(xué)習(xí)目標(biāo)通過本章的學(xué)習(xí),你應(yīng)該能夠:
理解和掌握相關(guān)分析和回歸分析的原理估計(jì)一元線性回歸模型,并對(duì)模型進(jìn)行檢驗(yàn)利用計(jì)算機(jī)軟件估計(jì)多元線性回歸模型,并對(duì)模型進(jìn)行檢驗(yàn)了解幾種常見的非線性函數(shù),并對(duì)它們進(jìn)行線性化變換;計(jì)算樣本相關(guān)系數(shù),并能對(duì)相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)2第8章相關(guān)與回歸分析8.1相關(guān)與回歸的基本概念8.2簡(jiǎn)單線性相關(guān)與回歸分析8.3多元線性相關(guān)與回歸分析8.4非線性相關(guān)分析與非線性回歸分析38.1相關(guān)與回歸的基本概念8.1.1變量間的相互關(guān)系8.1.2相關(guān)關(guān)系的類型8.1.3相關(guān)分析與回歸分析4變量間的相互關(guān)系確定性的函數(shù)關(guān)系:當(dāng)一個(gè)或者幾個(gè)變量取一定的值時(shí),另一個(gè)變量有確定值與之相對(duì)應(yīng);例如銷售收入與銷售量之間的關(guān)系、路程與速度之間的關(guān)系;不確定性的相關(guān)關(guān)系:當(dāng)一個(gè)或幾個(gè)相互聯(lián)系的變量取一定數(shù)值時(shí),與之相對(duì)應(yīng)的另一個(gè)變量的值雖然不確定,但它仍按照某種規(guī)律在一定的范圍內(nèi)變化;
變量之間的函數(shù)關(guān)系和相關(guān)關(guān)系在一定條件下可以相互轉(zhuǎn)化。
客觀現(xiàn)象的函數(shù)關(guān)系可以用數(shù)學(xué)分析的方法去研究,而研究客觀現(xiàn)象的相關(guān)關(guān)系必須借助于統(tǒng)計(jì)學(xué)中的相關(guān)與回歸分析方法。
5相關(guān)關(guān)系的類型從相關(guān)關(guān)系涉及的變量數(shù)量看:?jiǎn)蜗嚓P(guān)和復(fù)相關(guān)一個(gè)變量對(duì)另一變量的相關(guān)關(guān)系,稱為單相關(guān);
一個(gè)變量對(duì)兩個(gè)以上變量的相關(guān)關(guān)系時(shí),稱為復(fù)相關(guān);
從變量相關(guān)關(guān)系的表現(xiàn)形式看:線性相關(guān)和非線性相關(guān)從變量相關(guān)關(guān)系變化的方向看:正相關(guān)和負(fù)相關(guān)從變量相關(guān)的程度看:完全相關(guān)(函數(shù)關(guān)系)、不完全相關(guān)、不相關(guān)6相關(guān)分析與回歸分析
聯(lián)系:有共同的研究對(duì)象,在具體應(yīng)用時(shí),常常必須互相補(bǔ)充;
區(qū)別:研究目的和方法上有明顯區(qū)別;局限性:定性分析與定量分析相結(jié)合;相關(guān)分析是用一個(gè)指標(biāo)(相關(guān)系數(shù)r)來表明現(xiàn)象間依存關(guān)系的密切程度。
回歸分析是用數(shù)學(xué)模型近似表達(dá)變量間的平均變化關(guān)系。7相關(guān)分析可以不必確定變量中哪個(gè)是自變量,哪個(gè)是因變量,其所涉及的變量都是隨機(jī)變量。回歸分析必須事先確定具有相關(guān)關(guān)系的變量中哪個(gè)為自變量,哪個(gè)為因變量。一般地說,回歸分析中因變量是隨機(jī)的,而把自變量作為研究時(shí)給定的非隨機(jī)變量。相關(guān)分析和回歸分析有共同的研究對(duì)象,常常必須互相補(bǔ)充。相關(guān)分析需要依靠回歸分析來表明現(xiàn)象數(shù)量相關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來表明現(xiàn)象數(shù)量變化的密切程度。只有當(dāng)變量之間存在著高度相關(guān)時(shí),進(jìn)行回歸分析才有意義。相關(guān)分析與回歸分析
88.2簡(jiǎn)單線性相關(guān)與回歸分析8.2.1簡(jiǎn)單線性相關(guān)系數(shù)及檢驗(yàn)8.2.2總體回歸函數(shù)與樣本回歸函數(shù)8.2.3回歸系數(shù)的估計(jì)8.2.4簡(jiǎn)單線性回歸模型的檢驗(yàn)8.2.4簡(jiǎn)單線性回歸模型預(yù)測(cè)9相關(guān)系數(shù)總體相關(guān)系數(shù)(
populationcorrelationcoefficient)ρ
是反映兩變量之間線性相關(guān)程度的一種特征值,表現(xiàn)為一個(gè)常數(shù)。樣本相關(guān)系數(shù)(
samplecorrelationcoefficient)r
是總體相關(guān)系數(shù)的一致估計(jì)量,是根據(jù)樣本觀測(cè)值計(jì)算的,反映樣本觀測(cè)值線性相關(guān)程度的指標(biāo)。10樣本相關(guān)系數(shù)其中: r=樣本相關(guān)系數(shù) n=樣本容量
樣本相關(guān)系數(shù):或:11樣本相關(guān)系數(shù)計(jì)算的例子樹的高度樹干的直徑y(tǒng)xxyy2x23582801225644994412401812771897294933619810893660137803600169217147441494511495202512151126122601144
y=321
x=73
xy=3142
y2=14111
x2=71312樹干的直徑,x樹的高度,y樣本相關(guān)系數(shù)計(jì)算的例子r=0.886→表明x和y具有高度線性相關(guān)關(guān)系。13Excel輸出結(jié)果Excel相關(guān)分析的輸出結(jié)果工具/數(shù)據(jù)分析/相關(guān)系數(shù)樹的高度與樹干的直徑的相關(guān)系數(shù)14相關(guān)系數(shù)的特點(diǎn)
r的取值在-1與1之間;
當(dāng)r=0時(shí),X與Y的樣本觀測(cè)值之間沒有線性關(guān)系;在大多數(shù)情況下,0<|r|<1,即X與Y的樣本觀測(cè)值之間存在著一定的線性關(guān)系,當(dāng)r>0時(shí),X與Y為正相關(guān),當(dāng)r<0時(shí),X與Y為負(fù)相關(guān)。如果|r|=1,則表明X與Y完全線性相關(guān),當(dāng)r=1時(shí),稱為完全正相關(guān),而r=-1時(shí),稱為完全負(fù)相關(guān)。
r是對(duì)變量之間線性相關(guān)關(guān)系的度量。r=0只是表明兩個(gè)變量之間不存在線性關(guān)系,但它并不意味著X與Y之間不存在其他類型的關(guān)系。
15r=+0.3r=+1相關(guān)系數(shù)的圖示yxyxyxyxyxr=-1r=-0.6r=016單相關(guān)系數(shù)的顯著性檢驗(yàn)
假設(shè)
H0:ρ=0 (無線性相關(guān)關(guān)系) H1:ρ
≠0 (確實(shí)存在線性相關(guān)關(guān)系)檢驗(yàn)統(tǒng)計(jì)量
(自由度為n–2)17單相關(guān)系數(shù)的顯著性檢驗(yàn)是否可以根據(jù)5%的顯著性水平認(rèn)為樹的高度與樹干的直徑之間存在一定程度的線性相關(guān)關(guān)系?H0:ρ
=0(無線性相關(guān)關(guān)系)H1:ρ≠0(確實(shí)存在線性相關(guān)關(guān)系)
=0.05,df
=
8-2=618單相關(guān)系數(shù)的顯著性檢驗(yàn)結(jié)論:
足以證明樹的高度與樹干的直徑之間存在一定程度的線性相關(guān)關(guān)系。決策:
拒絕H0拒絕H0拒絕H0a/2=0.025-tα/2不能拒絕H00tα/2a/2=0.025-2.44692.44694.68d.f.=8-2=619回歸分析
RegressionAnalysis回歸分析研究一個(gè)變量如何隨著其他變量的變化而變化;
用一個(gè)稱為回歸模型的數(shù)學(xué)方程來描述因變量與自變量之間的變化關(guān)系,再通過控制或給定自變量的數(shù)值來估計(jì)或預(yù)測(cè)因變量可能的數(shù)值。
被解釋變量、因變量(Dependentvariable):被視為隨著自變量而變化的變量,是我們想要加以解釋的變量。解釋變量、自變量(Independentvariable):被視為主動(dòng)變化的變量,用于解釋被解釋變量。20一元(簡(jiǎn)單)線性回歸模型只有一個(gè)自變量,XX和Y的關(guān)系用線性函數(shù)來描述Y的變化被認(rèn)為是由于X的變化引起的21線性部分總體回歸函數(shù)(模型)總體回歸函數(shù)(模型):截距項(xiàng)
斜率
隨機(jī)誤差項(xiàng)(隨機(jī)干擾項(xiàng))因變量Y的第t個(gè)觀測(cè)值自變量X的第t個(gè)觀測(cè)值隨機(jī)誤差項(xiàng)其中,ut是隨機(jī)誤差項(xiàng),又稱隨機(jī)干擾項(xiàng),它是一個(gè)特殊的隨機(jī)變量,反映未列入方程式的其他各種因素對(duì)Y的影響。
22總體回歸線與隨機(jī)誤差項(xiàng)隨機(jī)誤差項(xiàng)yxxi對(duì)應(yīng)的因變量的實(shí)際觀測(cè)值yiyi的擬合值
xi斜率=β2截距=β1
ut23樣本回歸直線是根據(jù)樣本數(shù)據(jù)擬合的,是總體回歸線的一個(gè)估計(jì)。樣本回歸線和樣本回歸模型回歸截距的估計(jì)值回歸斜率的估計(jì)值
估計(jì)的(或擬合的)y值自變量樣本回歸線(樣本回歸方程)樣本回歸函數(shù)(樣本回歸模型)殘差24總體回歸線是未知的,只有一條。樣本回歸線是根據(jù)樣本數(shù)據(jù)擬合的,每抽取一組樣本,便可以擬合一條樣本回歸線??傮w回歸模型中的β1和β2是未知的參數(shù),表現(xiàn)為常數(shù)。而樣本回歸函數(shù)中的和是隨機(jī)變量,其具體數(shù)值隨所抽取的樣本觀測(cè)值不同而變動(dòng)??傮w回歸模型中的ut是yt與未知的總體回歸線之間的縱向距離,它是不可直接觀測(cè)的。而樣本回歸函數(shù)中的et是yt與樣本回歸線之間的縱向距離,當(dāng)根據(jù)樣本觀測(cè)值擬合出樣本回歸線之后,可以計(jì)算出et的具體數(shù)值。
樣本回歸函數(shù)和總體回歸函數(shù)的區(qū)別
25誤差項(xiàng)的標(biāo)準(zhǔn)假定假定1:誤差項(xiàng)的期望值等于0,即對(duì)所有的t總有E(ut)=0假定2:誤差項(xiàng)的方差為常數(shù),即對(duì)所有的t總有Var(ut)=E(ut2)=假定3:誤差項(xiàng)之間不存在序列相關(guān)關(guān)系,其協(xié)方差為零;假定4:自變量是給定的變量,與隨機(jī)誤差項(xiàng)線性無關(guān);假定5:隨機(jī)誤差項(xiàng)服從正態(tài)分布;26最小二乘估計(jì)在根據(jù)樣本數(shù)據(jù)確定樣本回歸方程時(shí),總是希望y的估計(jì)值盡可能地接近其實(shí)際觀測(cè)值,即殘差et的總量越小越好。由于et有正有負(fù),簡(jiǎn)單的代數(shù)和會(huì)相互抵消,因此為了數(shù)學(xué)上便于處理,我們采用殘差平方和作為衡量總偏差的尺度。所謂最小二乘法,就是根據(jù)這一思路,通過使殘差平方和最小來估計(jì)回歸系數(shù)的方法。27最小二乘估計(jì)正規(guī)方程組(標(biāo)準(zhǔn)方程組)28最小二乘估計(jì)量求解正規(guī)方程組,可得:以上就是總體回歸系數(shù)的最小二乘估計(jì)量。29最小二乘估計(jì)量的性質(zhì)最小二乘估計(jì)量是隨著樣本的不同而不同的隨機(jī)變量;在滿足標(biāo)準(zhǔn)假定的情況下,回歸參數(shù)的最小二乘估計(jì)量是無偏的,即
最小二乘估計(jì)量是因變量Y的線性組合;數(shù)學(xué)上還可以證明,在所有的線性無偏估計(jì)中,回歸系數(shù)的最小二乘估計(jì)量的方差最小,同時(shí)隨著樣本容量的增大,其方差會(huì)不斷縮小;綜上所述,在標(biāo)準(zhǔn)的假定條件下,最小二乘估計(jì)量是最佳線性無偏估計(jì)量和一致估計(jì)量。
30
是當(dāng)x等于0時(shí)y的平均估計(jì)值;
是x每變化一個(gè)單位,因變量y平均變化的量。最小二乘估計(jì)量的解釋31一元線性回歸模型的例子一家房地產(chǎn)公司的經(jīng)理想知道該公司住房的售價(jià)和住房面積(單位:平方尺)
之間的關(guān)系。為此他抽取了一個(gè)包含10套住房的隨機(jī)樣本。因變量(y)=住房的售價(jià)(單位:$1000)自變量(x)=住房的面積(單位:平方尺)32住房?jī)r(jià)格例子的樣本數(shù)據(jù)住房的售價(jià)y住房的面積xxyx224514003430001960000312160049920025600002791700474300289000030818755775003515625199110021890012100002191550339450240250040523509517505522500324245079380060025003191425454575203062525517004335002890000
y=2865
x=17150
xy=5085975
x2=3098375033回歸系數(shù)的估計(jì)34用Excel進(jìn)行回歸分析工具/數(shù)據(jù)分析/回歸35Excel輸出結(jié)果回歸統(tǒng)計(jì)MultipleR0.76211RSquare0.58082AdjustedRSquare0.52842標(biāo)準(zhǔn)誤差41.33032觀測(cè)值10方差分析
dfSSMSFSignificanceF回歸分析118934.934818934.934811.08480.01039殘差813665.56521708.1957總計(jì)932600.5000
Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%Intercept98.2483358.033481.692960.12892-35.57720232.07386住房的面積0.109770.032973.329380.010390.033740.18580樣本回歸方程是:36回歸分析的圖示住房?jī)r(jià)格模型:散點(diǎn)圖和樣本回歸線斜率
=0.10977截距
=98.2483337是當(dāng)x等于0時(shí)y的平均估計(jì)值在這個(gè)例子中,沒有房子的面積會(huì)等于0,所以98.24833僅僅意味著在所觀測(cè)的樣本范圍內(nèi),住房售價(jià)中有$98,248.33不能用住房的面積來加以解釋?;貧w截距估計(jì)值的解釋38回歸斜率估計(jì)值的解釋是x每變化一個(gè)單位,因變量y平均變化的量。這里0.10977表示住房面積每增加一平方尺,住房的售價(jià)平均增加0.10977×$1000=$109.77。39總體(隨機(jī)誤差項(xiàng))方差的估計(jì)
標(biāo)準(zhǔn)的一元線性回歸模型除了β1和β2以外,還有一個(gè)未知參數(shù),就是總體隨機(jī)誤差項(xiàng)的方差
2。由于隨機(jī)誤差項(xiàng)ut不可直接觀測(cè),所以需要用最小二乘殘差et來估計(jì)
2。
數(shù)學(xué)上可以證明,S2是
2的無偏估計(jì)。40總體(隨機(jī)誤差項(xiàng))方差的估計(jì)
分母n-2是自由度,因?yàn)闅埐畋仨殱M足兩個(gè)約束條件:S2的正平方根稱為回歸估計(jì)的標(biāo)準(zhǔn)誤差。S越小表明實(shí)際觀測(cè)點(diǎn)與所擬合的樣本回歸線的離差程度越小,即樣本回歸線具有較強(qiáng)的代表性,反之,S越大表明實(shí)際觀測(cè)點(diǎn)與所擬合的樣本回歸線的離差程度越大,即回歸線的代表性越差。
41回歸模型檢驗(yàn)的種類
理論意義檢驗(yàn):主要考察參數(shù)估計(jì)值的符號(hào)和取值是否與實(shí)質(zhì)性科學(xué)的理論以及人們的實(shí)踐經(jīng)驗(yàn)相符。如果不符,原因可能是樣本容量太小,或者不滿足標(biāo)準(zhǔn)假定條件。
一級(jí)檢驗(yàn)(統(tǒng)計(jì)學(xué)檢驗(yàn)):利用統(tǒng)計(jì)學(xué)中的抽樣理論來檢驗(yàn)樣本回歸方程的可靠性,具體分為擬合程度評(píng)價(jià)和顯著性檢驗(yàn)。這是所有現(xiàn)象進(jìn)行回歸分析時(shí)都必須通過的檢驗(yàn)。
二級(jí)檢驗(yàn)(經(jīng)濟(jì)計(jì)量學(xué)檢驗(yàn)):是對(duì)標(biāo)準(zhǔn)線性回歸模型的假定條件能否得到滿足進(jìn)行檢驗(yàn),具體包括序列相關(guān)檢驗(yàn)、異方差檢驗(yàn)等等。這是經(jīng)濟(jì)計(jì)量學(xué)研究的內(nèi)容。42擬合程度的評(píng)價(jià)所謂擬合程度是指樣本觀測(cè)值聚集在樣本回歸線周圍的緊密程度。
判斷回歸模型擬合程度優(yōu)劣的指標(biāo)是可決系數(shù)(決定系數(shù)),該指標(biāo)是建立在對(duì)總離差平方和進(jìn)行分解的基礎(chǔ)之上的。
總離差(因變量的實(shí)際觀測(cè)值與樣本均值的離差)
可解釋離差(因變量的擬合值與樣本均值的離差,可以看作能夠由回歸直線解釋的部分)
殘差(因變量的實(shí)際觀測(cè)值與擬合值的離差,可以看作不能由回歸直線解釋的部分)
43總離差平方和的分解總離差平方和可以分解為兩部分:總離差平方和回歸平方和殘差平方和其中:
=因變量觀測(cè)值的平均值
y=因變量的觀測(cè)值 =因變量實(shí)際觀測(cè)值的擬合值44XiyxyiTSS
=
(yi
-
y)2RSS
=
(yi
-
yi)2
ESS=
(yi-
y)2
___總離差平方和的分解y
yy_y
45可決系數(shù)(coefficientofdetermination)是回歸平方和占總離差平方和的比例,可決系數(shù)越大,說明模型擬合程度越高。
可決系數(shù)也稱為R平方(R-squared),用R2表示。可決系數(shù),R246相關(guān)系數(shù)與可決系數(shù)
R2注意:
一元線性回歸模型的可決系數(shù)就是因變量Y和自變量X的相關(guān)系數(shù)的平方。
其中: R2=一元線性回歸模型的可決系數(shù) r=簡(jiǎn)單相關(guān)系數(shù)區(qū)別:可決系數(shù)是就回歸模型而言的,具有非負(fù)性;而相關(guān)系數(shù)是就兩個(gè)變量而言的,可正可負(fù);
47R2=1可決系數(shù),R2yxyxR2=1R2=1所有的觀測(cè)值都位于回歸直線上,RSS=0,說明總離差可以完全由所估計(jì)的樣本回歸直線來解釋。48可決系數(shù),R2yxyx0<R2<1觀測(cè)值并不是全部位于回歸直線上,RSS>0,有部分總離差不能由樣本回歸直線來解釋。49可決系數(shù),R2R2=0回歸直線沒有解釋任何離差,即模型中解釋變量X與因變量Y完全無關(guān),Y的總離差全部歸于殘差平方和,即RSS=TSS。yxR2=050Excel輸出結(jié)果回歸統(tǒng)計(jì)MultipleR0.76211RSquare0.58082AdjustedRSquare0.52842標(biāo)準(zhǔn)誤差41.33032觀測(cè)值10方差分析
dfSSMSFSignificanceF回歸分析118934.934818934.934811.08480.01039殘差813665.56521708.1957總計(jì)932600.5000
Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%Intercept98.2483358.033481.692960.12892-35.57720232.07386住房的面積0.109770.032973.329380.010390.033740.18580住房售價(jià)的58.08%離差可以用住房的面積變化來解釋。51回歸系數(shù)的顯著性檢驗(yàn)——t檢驗(yàn)
回歸斜率的顯著性檢驗(yàn)—t檢驗(yàn)X和Y是否確實(shí)存在線性關(guān)系?零假設(shè)和備擇假設(shè)H0:β2=0 (無線性相關(guān)關(guān)系)H1:β2
0 (線性相關(guān)關(guān)系確實(shí)存在)檢驗(yàn)統(tǒng)計(jì)量
其中:=回歸斜率的估計(jì)值
β2=假設(shè)的斜率=標(biāo)準(zhǔn)差的估計(jì)值52其中:
=最小二乘斜率的標(biāo)準(zhǔn)差的估計(jì)值 =回歸估計(jì)的標(biāo)準(zhǔn)誤差回歸系數(shù)的顯著性檢驗(yàn)——t檢驗(yàn)53Excel輸出結(jié)果回歸統(tǒng)計(jì)MultipleR0.76211RSquare0.58082AdjustedRSquare0.52842標(biāo)準(zhǔn)誤差41.33032觀測(cè)值10方差分析
dfSSMSFSignificanceF回歸分析118934.934818934.934811.08480.01039殘差813665.56521708.1957總計(jì)932600.5000
Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%Intercept98.2483358.033481.692960.12892-35.57720232.07386住房的面積0.109770.032973.329380.010390.033740.1858054住房的售價(jià)$1000(y)住房的面積(x)2451400312160027917003081875199110021915504052350324245031914252551700估計(jì)的樣本回歸方程為:模型中斜率等于0.10977;請(qǐng)問住房的面積對(duì)住房的售價(jià)是否具有顯著的影響?
回歸系數(shù)顯著性檢驗(yàn)的例子55回歸系數(shù)顯著性檢驗(yàn)的例子H0:β2=0H1:β2
0檢驗(yàn)統(tǒng)計(jì)量:
t=3.32938有足夠的證據(jù)表明住房的面積確實(shí)對(duì)住房的售價(jià)有顯著的影響。Excel輸出結(jié)果:拒絕H0
Coefficients標(biāo)準(zhǔn)誤差tStatP-valueIntercept98.2483358.033481.692960.12892住房的面積0.109770.032973.329380.01039t決策:結(jié)論:拒絕H0拒絕H0a/2=.025-tα/2不能拒絕H00tα/2a/2=.025-2.30602.30603.32938d.f.=10-2=856回歸系數(shù)的置信區(qū)間估計(jì)斜率的置信區(qū)間估計(jì)的公式為:Excel的輸出結(jié)果:以95%的置信水平認(rèn)為,斜率的置信區(qū)間為(0.0337,0.1858)
Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%Intercept98.2483358.033481.692960.12892-35.57720232.07386住房的面積0.109770.032973.329380.010390.033740.18580d.f.=n-257回歸系數(shù)的置信區(qū)間估計(jì)因?yàn)樽》康氖蹆r(jià)是以$1000為單位的,我們可以以95%的置信度認(rèn)為住房面積每增加一平方尺對(duì)住房售價(jià)的平均影響在$33.70到$185.80之間。
Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%Intercept98.2483358.033481.692960.12892-35.57720232.07386住房的面積0.109770.032973.329380.010390.033740.18580這個(gè)95%的置信區(qū)間
不包含0.結(jié)論:以0.05的顯著性水平認(rèn)為住房的面積對(duì)住房的售價(jià)有顯著的影響。58簡(jiǎn)單線性回歸模型預(yù)測(cè)
回歸預(yù)測(cè)的基本公式:發(fā)生預(yù)測(cè)誤差的原因有:模型本身中的誤差因素所造成的誤差(總體回歸函數(shù)未將所有影響Y的因素都納入模型,可以用隨機(jī)擾動(dòng)項(xiàng)的方差來評(píng)價(jià))
由于回歸系數(shù)的估計(jì)值同其真值不一致所造成的誤差
由于X的設(shè)定值同實(shí)際值不同引起的誤差
由于未來時(shí)期總體回歸系數(shù)發(fā)生變化造成的誤差
59一元線性回歸模型區(qū)間預(yù)測(cè)
區(qū)間預(yù)測(cè)的公式:60一元線性回歸模型預(yù)測(cè)的例子請(qǐng)預(yù)測(cè)面積為2000平方尺住房的售價(jià)?住房的售價(jià)$1000(y)住房的面積(x)2451400312160027917003081875199110021915504052350324245031914252551700估計(jì)的樣本回歸方程為:61一元線性回歸模型預(yù)測(cè)的例子預(yù)測(cè)面積為2000平方尺住房的售價(jià)為:預(yù)計(jì)面積為2000平方尺的住房的售價(jià)為317.85×$1,000=$317,85062一元線性回歸模型預(yù)測(cè)的例子計(jì)算置信度為95%的住房(面積為2000平方尺)售價(jià)的預(yù)測(cè)區(qū)間。置信度為95%的住房售價(jià)的預(yù)測(cè)區(qū)間為215.57--420.13,或者$215,570--$420,130。638.3多元線性相關(guān)與回歸分析8.3.1多元線性回歸模型及假設(shè)8.3.2多元線性回歸模型的估計(jì)8.3.3多元線性回歸模型的檢驗(yàn)64多元線性回歸模型研究在線性相關(guān)條件下,兩個(gè)和兩個(gè)以上自變量對(duì)一個(gè)因變量的數(shù)量變化關(guān)系??傮w回歸模型截距項(xiàng)總體回歸系數(shù)隨機(jī)誤差項(xiàng)估計(jì)的(或擬合的)Y值總體回歸系數(shù)的估計(jì)值估計(jì)的樣本回歸方程:65誤差項(xiàng)的標(biāo)準(zhǔn)假定假定1:零均值假定2:同方差
假定3:無自相關(guān)假定4:自變量與隨機(jī)誤差項(xiàng)線性無關(guān)假定5:正態(tài)性假定假定6:各自變量之間不存在較強(qiáng)的線性關(guān)系66回歸系數(shù)的估計(jì)為了便于表述,我們用矩陣形式來表示總體回歸模型。其中:67回歸系數(shù)的估計(jì)68回歸系數(shù)的估計(jì)在此,Y和X都是已知的矩陣或者向量,只有是未知的,所以,而根據(jù)定理,如果,則因此兩項(xiàng)均轉(zhuǎn)置,得
69最小二乘估計(jì)量整理得:(正規(guī)方程組,即標(biāo)準(zhǔn)方程組,k個(gè)方程)
根據(jù)標(biāo)準(zhǔn)假定6,k個(gè)自變量之間不存在高度的線性相關(guān)關(guān)系,因此的逆矩陣存在;此即最小二乘估計(jì)量的矩陣表示。70多元線性回歸模型的例子某個(gè)餡餅分銷商經(jīng)理想要評(píng)價(jià)影響?zhàn)W餅銷售的因素,為此他確定了因變量:餡餅銷售量(以周為單位)自變量:價(jià)格($)
廣告投入($100)他收集了過去15周的數(shù)據(jù)作為樣本。71餡餅銷售模型周餡餅銷售量?jī)r(jià)格($)廣告投入($100s)13505.503.324607.503.333508.003.044308.004.553506.803.063807.504.074304.503.084706.403.794507.003.5104905.004.0113407.203.5123007.903.2134405.904.0144505.003.5153007.002.7多元回歸模型:72估計(jì)多元線性回歸模型多元回歸分析的計(jì)算通常采用現(xiàn)成的軟件來完成,例如,Excel、SPSS等。Excel:工具/數(shù)據(jù)分析/回歸73Excel輸出結(jié)果回歸統(tǒng)計(jì)MultipleR0.72213RSquare0.52148AdjustedRSquare0.44172標(biāo)準(zhǔn)誤差47.46341觀測(cè)值15方差分析
dfSSMSFSignificanceF回歸分析229460.02714730.0136.538610.01201殘差1227033.3062252.776總計(jì)1456493.333
Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%Intercept306.52619114.253892.682850.0199357.58835555.46404價(jià)格-24.9750910.83213-2.305650.03979-48.57626-1.37392廣告投入74.1309625.967322.854780.0144917.55303130.7088874多元線性回歸方程的解釋-24.975:
扣除廣告投入對(duì)銷售量的影響,平均來講,銷售價(jià)格每增加$1將引起餡餅的周銷售量減少24.975個(gè)。74.131:
扣除銷售價(jià)格對(duì)銷售量的影響,平均來講,廣告投入每增加$100將引起餡餅的周銷售量增加74.131個(gè)75利用模型進(jìn)行預(yù)測(cè)請(qǐng)預(yù)測(cè)當(dāng)銷售價(jià)格為$5.50,廣告投入為$350時(shí)餡餅的周銷售數(shù)量:預(yù)測(cè)的銷售量為428.62個(gè)注意廣告投入是以$100為單位的,所以$350意味著x2=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 環(huán)衛(wèi)半年工作總結(jié)范文(4篇)
- 2025年度暑假工招募及勞動(dòng)保障服務(wù)合同2篇
- 2025年度四人股份合作協(xié)議書:跨境電商平臺(tái)股權(quán)合作與品牌建設(shè)3篇
- 2025年度新能源產(chǎn)品銷售代理框架協(xié)議2篇
- 2025年度工地施工機(jī)械設(shè)備智能化升級(jí)合同2篇
- 2024煤炭銷售居間服務(wù)合同范本(含稅收政策說明)3篇
- 2025版巖土工程勘測(cè)與施工合同范本6篇
- 2025年度金融機(jī)構(gòu)與中小企業(yè)跨境融資合同3篇
- 二零二五年度二手房按揭買賣合同(含貸款期限調(diào)整)
- 二零二五年大棚設(shè)施更新改造與節(jié)能降耗合同3篇
- TSG 51-2023 起重機(jī)械安全技術(shù)規(guī)程 含2024年第1號(hào)修改單
- 《正態(tài)分布理論及其應(yīng)用研究》4200字(論文)
- GB/T 45086.1-2024車載定位系統(tǒng)技術(shù)要求及試驗(yàn)方法第1部分:衛(wèi)星定位
- 浙江省杭州市錢塘區(qū)2023-2024學(xué)年四年級(jí)上學(xué)期英語期末試卷
- 1古詩文理解性默寫(教師卷)
- 廣東省廣州市越秀區(qū)2021-2022學(xué)年九年級(jí)上學(xué)期期末道德與法治試題(含答案)
- 2024-2025學(xué)年六上科學(xué)期末綜合檢測(cè)卷(含答案)
- 在線教育平臺(tái)合作合同助力教育公平
- 工地鋼板短期出租合同模板
- 女排精神課件教學(xué)課件
- 2024年湖南省公務(wù)員考試《行測(cè)》真題及答案解析
評(píng)論
0/150
提交評(píng)論