總結(jié):線性回歸分析的基本步驟_第1頁(yè)
總結(jié):線性回歸分析的基本步驟_第2頁(yè)
總結(jié):線性回歸分析的基本步驟_第3頁(yè)
總結(jié):線性回歸分析的基本步驟_第4頁(yè)
總結(jié):線性回歸分析的基本步驟_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

線性回歸分析的基本步驟步驟一、建立模型知識(shí)點(diǎn):1、總體回歸模型、總體回歸方程、樣本回歸模型、樣本回歸方程總體回歸模型:研究總體之中自變量和因變量之間某種非確定依賴關(guān)系的計(jì)量模型。Y=Xp+U特點(diǎn):由于隨機(jī)誤差項(xiàng)U的存在,使得Y和X不在一條直線呼面上。例1:某鎮(zhèn)共有60個(gè)家庭,經(jīng)普查,60個(gè)家庭的每周收入(乂)與每周消費(fèi)(Y)數(shù)據(jù)如下:每周收入(X)每周消費(fèi)支出(Y)8055606570751006570748085881207984909498140809395103108113115160102107110116118125180110115120130135140200120136140144145220135137140152157160162240137145155165175189260150152175178180185191作出其散點(diǎn)圖如下:200-|TOC\o"1-5"\h\z180-;O-V160-艾:140-::;:Y120-一"■1*100-■"?*£80-.':,\o"CurrentDocument"?■*

■pn60-40-I,11114080120160200240280

總體回歸方程(線):由于假定EU=0,因此因變量的均值與自變量總處于一條直線上,這條直線E(YIX)=Xp就稱為總體回歸線(方程)??傮w回歸方程的求法:以例1的數(shù)據(jù)為例E(YIX)=p0+p1XE(YIX)=p0+p1X可得:'77=P+100P

01)?1<01137=p+200p0下=170P=0.61每周收入(乂)每周消費(fèi)支出(Y)E(YIX.)8055606570756510065707480858877120798490949889140809395103108113115101160102107110116118125113180110115120130135140125200120136140144145137220135137140152157160162149240137145155165175189161260150152175178180185191173由于E?IXj)=幻+捋X,因此任意帶入兩個(gè)X]和其對(duì)應(yīng)的E(YIX)值:即可求出p和R,并進(jìn)而得到總體回歸方程。''如將°X2=100,E(YIX2)=77和X7=200,E(FIX7)=137代入以上求出80和P1反映了E(叫)和X,之間的真實(shí)關(guān)系,即所求的總體回歸方程為:EX.)=17+0.6X.,其圖形為:Y

樣本回歸模型:總體通常難以得到,因此只能通過(guò)抽樣得到樣本數(shù)據(jù)。Y如在例1中,通過(guò)抽樣考察,我們得到了20個(gè)家庭的樣本數(shù)據(jù):每周收入(乂)每周消費(fèi)支出(Y)8055100657012079841408093160102107110180110200120136220135137240137145260150152175那么描述樣本數(shù)據(jù)中因變量Y和自變量X之間非確定依賴關(guān)系的模型____aY=Xp+e就稱為樣本回歸模型。樣本回歸方程(線):通過(guò)樣本數(shù)據(jù)估計(jì)出P,得到樣本觀測(cè)值的擬合值與解釋變量之間的關(guān)系方程Y=Xp稱為樣本回歸方程。如下圖所示:四者之間的關(guān)系:i:總體回歸模型建立在總體數(shù)據(jù)之上,它描述的是因變量Y和自變量X之間的真實(shí)的非確定型依賴關(guān)系;樣本回歸模型建立在抽樣數(shù)據(jù)基礎(chǔ)之上,它描述的是因變量Y和自變量X之間的近似于真實(shí)的非確定型依賴關(guān)系。這種近似表現(xiàn)在兩個(gè)方面:一是結(jié)構(gòu)參數(shù)6是其真實(shí)值P的一種e近似估計(jì);二是殘差是隨機(jī)誤差項(xiàng)U的一個(gè)近似估計(jì);ii:總體回歸方程是根據(jù)總體數(shù)據(jù)得到的,它描述的是因變量的條件均值£(YX)與自變量X之間的線性關(guān)系;樣本回歸方程是根據(jù)抽樣數(shù)據(jù)得到―一?q?的,它描述的是因變量Y樣本預(yù)測(cè)值的擬合值Y與自變量X之間的線性關(guān)系。iii:回歸分析的目的是試圖通過(guò)樣本數(shù)據(jù)得到真實(shí)結(jié)構(gòu)參數(shù)P的估計(jì)值,并要求估計(jì)結(jié)果6足夠接近真實(shí)值P。由于抽樣數(shù)據(jù)有多種可能,每一AA一一次抽樣所得到的估計(jì)值。都不會(huì)相同,即。的估計(jì)量B是一個(gè)隨機(jī)變量。因此必須選擇合適的參數(shù)估計(jì)方法,使其具有良好的統(tǒng)計(jì)性質(zhì)。2、隨機(jī)誤差項(xiàng)U存在的原因:非重要解釋變量的省略人的隨機(jī)行為數(shù)學(xué)模型形式欠妥歸并誤差(如一國(guó)GDP的計(jì)算)測(cè)量誤差等3、多元回歸模型的基本假定隨機(jī)誤差項(xiàng)的期望值為零E(U)=0i隨機(jī)誤差項(xiàng)具有同方差性Var(u)=。2i=1,2,—,ni隨機(jī)誤差項(xiàng)彼此之間不相關(guān)Cov(u,u)=0i”;i,j=1,2,…,n解釋就變量XgTk為確定型變量,與隨機(jī)誤差項(xiàng)彼此不相關(guān)。Cov(X,u)=0i=1,2,—,kj=1,2,…,njj解釋就變量x1:x2-Xk之間不存在精確的(完全的)線性關(guān)系,即解釋變量的樣本觀測(cè)值矩陣X為滿秩矩陣:rank(X)=k+1<n隨機(jī)誤差項(xiàng)服從正態(tài)分布,即:〃廠N(0,b2),1=1,2,???弗步驟二、參數(shù)估計(jì)知識(shí)點(diǎn):1、最小二乘估計(jì)的基本原理:殘差平方和最小化。2、參數(shù)估計(jì)量:①一元回歸:<$'沁

1Xjx①一元回歸:<i0=Y-fTX01②多元回歸:fT=(XX)~1XrY3、最小二乘估計(jì)量的性質(zhì)(Gauss-Markov定理):在滿足基本假設(shè)的情況下,最小二乘估計(jì)量帝是P的最優(yōu)線性無(wú)偏估計(jì)量(BLUE估計(jì)量)步驟三、模型檢驗(yàn)1、經(jīng)濟(jì)計(jì)量檢驗(yàn)(后三章內(nèi)容)2、統(tǒng)計(jì)檢驗(yàn)擬合優(yōu)度檢驗(yàn)知識(shí)點(diǎn):i:擬合優(yōu)度檢驗(yàn)的作用:檢驗(yàn)回歸方程對(duì)樣本點(diǎn)的擬合程度ii:擬合優(yōu)度的檢驗(yàn)方法:計(jì)算(調(diào)整的)樣本可決系數(shù)R2/R2RSS”ESSESS/n-k-1=1—,R2=1—TSSTSSTSS/n—1注意掌握離差平方和、回歸平方和、殘差平方和之間的關(guān)系以及它們

的自由度。計(jì)算方法:通過(guò)方差分析表計(jì)算方差來(lái)源符號(hào)計(jì)算公式自由度(#)均方值(MSS)離差平方和TSSEG—y)2iin-1EG—Y》/n-1ii回歸平方和RSS£?!猋)iikE(Y—Y)/kii殘差平方和ESS江—Y)iin-k-1E(y—Y)/n-k-1ii例2:下表列出了三變量(二元)模型的回歸結(jié)果:方差來(lái)源平方和(SS)自由度均方值離差平方和TSS6604214回歸平方和RSS65965殘差平方和ESS1)樣本容量為多少?解:由于TSS的自由度為n-1,由上表知n-1=14,因此樣本容量n=15。2)求ESS解:由于TSS=ESS+RSS,故ESS=TSS-RSS=773)ESS和RSS的自由度各為多少?解:對(duì)三變量模型而言,k=2,故ESS的自由度為n-k-1=12RSS的自由度為k=24)求R2和R2RSS65965ESS/n—k—1解:R2===0.9988,R2=1—=0.9986:TSS66042TSS/n—1回歸方程的顯著性檢驗(yàn)(F檢驗(yàn))目的:檢驗(yàn)?zāi)P椭械囊蜃兞颗c自變量之間是否存在顯著的線性關(guān)系步驟:1、2、3、4、提出假設(shè):H0:P1=P2=…=頃H:至少有一0j,0,j=1,2,...,k構(gòu)造統(tǒng)計(jì)量:F=EW/k]~F(k,n-k-1)給定顯著性水平a,確定拒絕域F>F(k,n-k-1)a計(jì)算統(tǒng)計(jì)量值,并判斷是否拒絕原假設(shè)例3:就例2中的數(shù)據(jù),給定顯著性水平a=1%,對(duì)回歸方程進(jìn)行顯著性檢驗(yàn)。步驟:1、2、3、4、解:由于統(tǒng)計(jì)量值f=RS/k=65965/2=5140.13,ESS/n-k-177/12又Foo1(2,12)=6.93,而F=5140.13>孔皿(2,12)=6.93故拒絕原假設(shè),即在1%的顯著性水平下可以認(rèn)為回歸方程存在顯著的線性關(guān)系。附:R2與F檢驗(yàn)的關(guān)系:勘RSSRSS%R2'由于2-TS~ESS+RSS=~1-r2E[/R2/k由于gRSS/kr=G-R2萬(wàn)(n-k-1)又=ESS/n-k-1J解釋變量的顯著性檢驗(yàn)(t檢驗(yàn))目的:檢驗(yàn)?zāi)P椭械淖宰兞渴欠駥?duì)因變量存在顯著影響。知識(shí)點(diǎn):多元回歸:S=(£exC,其中C為(XX力中位于第i+1行度\n—k—1i+1,i+1i+1,i+1和i+1列的元素;

1乙e21乙e2x乙X2S廣*nG)2)xZ*七1、提出假設(shè):H0:P.=0H1:P。02、構(gòu)造統(tǒng)計(jì)量:t=二-1(n-k-1)S3、給定顯著性水平a,確定拒絕域\t\>t(n一k一1)TOC\o"1-5"\h\z1a/24、計(jì)算統(tǒng)計(jì)量值,并判斷是否拒絕原假設(shè)例4:根據(jù)19個(gè)樣本數(shù)據(jù)得到某一回歸方程如下:\o"CurrentDocument"人_____.Y=-58.9+0.2X一0.1X12se(0.0092)(0.084)試在5%的顯著性水平下對(duì)變量X和X2的顯著性進(jìn)行檢驗(yàn)。解:由于ta/2(n一k-1)=10025(16)=2.12,故t檢驗(yàn)的拒絕域?yàn)閨t|>2.12。對(duì).一一△一自變量X而言,其t統(tǒng)計(jì)量值為t上一0.2一21.74>2.12,落入1S0.0092拒絕域,故拒絕p廣0的原假設(shè),即在5%的顯著性水平下,可以認(rèn)為自變量x1對(duì)因變量有顯著影響;一*—一-.對(duì)自變量X而言,其t統(tǒng)計(jì)量值為|t|一%-=0,1=1.19V2.12,未落入拒211S0.084P2絕域,故不能拒絕P2=0的原假設(shè),即在5%的顯著性水平下,可以認(rèn)為自變量x2對(duì)因變量Y的影響并不顯著?;貧w系數(shù)的置信區(qū)間目的:給定某一置信水平1-a,構(gòu)造某一回歸參數(shù)p,的一個(gè)置信區(qū)間,使p落在該區(qū)間內(nèi)的概率為1-ai基本步驟:...rCc1、構(gòu)造統(tǒng)計(jì)量t=氣冬-1(n-k-1)ft2、給定置信水平1-a,查表求出a水平的雙側(cè)分位數(shù)t(n—k—1)a/23、求出p的置信度為1—a的置信區(qū)間?—txS,$+1xS)iia/2&ia/2&門ri例5:根據(jù)例4的數(shù)據(jù),求出p的置信度為95%的置信區(qū)間。

1解:由于t00(16)=2.12,故p的置信度為95%的置信區(qū)間為:(0.2—2.12x0.0092,0.2+2.12x0.0092)=(0.18,0.22)3、經(jīng)濟(jì)意義檢驗(yàn)?zāi)康模簷z驗(yàn)回歸參數(shù)的符號(hào)及數(shù)值是否與經(jīng)濟(jì)理論的預(yù)期相符。例6:根據(jù)26個(gè)樣本數(shù)據(jù)建立了以下回歸方程用于解釋美國(guó)居民的個(gè)人消費(fèi)支出:人_______-Y=—10.96+0.93X-2.09X12t(—3.33)(249.06)(—3.09)R2=0.9996其中:Y為個(gè)人消費(fèi)支出(億元);X、為居民可支配收入(億元);X2為利率(%)先驗(yàn)估計(jì)p和B的符號(hào);12解:由于居民可支配收入越高,其個(gè)人消費(fèi)水平也會(huì)越高,因此預(yù)期自變量X1回歸系數(shù)的符號(hào)為正;而利率越高,居民儲(chǔ)蓄意愿越強(qiáng),消費(fèi)意愿相應(yīng)越低,因此個(gè)從消費(fèi)支出與利率應(yīng)該存在負(fù)相關(guān)關(guān)系,即商應(yīng)為負(fù)。2解釋兩個(gè)自變量回歸系數(shù)的經(jīng)濟(jì)含義;匹

1=1解:『=0.93表示,居民可支配收入每增加1億元,其個(gè)人消費(fèi)支出相應(yīng)1會(huì)增加0.93億元,即居民的邊際消費(fèi)傾向MPC=0.93;匹

1=1商=-2.09表示,利率提高1個(gè)百分點(diǎn),個(gè)人消費(fèi)支出將減少2.09億元。2截距項(xiàng)表示居民可支配收入和利率為零時(shí)的個(gè)人消費(fèi)支出為-10.96億元,它沒(méi)有明確的經(jīng)濟(jì)含義。3)檢驗(yàn)&是否顯著不為1;(a=5%)1解:1)提出假設(shè):H:p=1H:PTOC\o"1-5"\h\z0111A2)構(gòu)造統(tǒng)計(jì)量:ft3)給定顯著性水平a=5%,查t(ji—k-1)=t(23)=2.079絕a/20.025域?yàn)闀r(shí)>2.074)計(jì)算統(tǒng)計(jì)量值:由于耶)=_LnS=烏=冬=0.。。37341S鳥(niǎo)r(0)249.06鳥(niǎo)1A則k=lzl=_?^L=i8.75>2.07,落入拒絕域。故拒絕°=1的原假設(shè)。1S0.0037341%即在5%的顯著性水平下,可認(rèn)為邊際消費(fèi)傾向AffC顯著不為1。4)檢驗(yàn)&顯否顯著不為零;(a=5%)2解:1)提出假設(shè):H:P=0H:P邳0212人2)構(gòu)造統(tǒng)計(jì)量:t=導(dǎo)-~t(n一4一1)P23)給定顯著性水平a—5%9查表得r(n-k-l)=t(23)=2.07,故拒絕a/20.025域?yàn)榫W(wǎng)>2.074)計(jì)算統(tǒng)計(jì)量值:由于|心)=3.09>2.07,落入拒絕域,故拒絕原假I2設(shè)。即在5%的顯著性水平下,可以認(rèn)為°顯著異于零。25)計(jì)算反值;2=.ESS/n-k-11ESSn-1.匕°)n-1R2=1=1X=1-\1-If2/X解:由于TSS/n-1TSSn-k-1n-k-1=1-(1-0.9996)x26-1=0.9995726-2-1

-10.96計(jì)算每個(gè)回歸系數(shù)的標(biāo)準(zhǔn)差;=匕=—=3.29解:由于g(B)=_LnS=業(yè)->,%&耶,)Po耶)-33300.93=-^-=-^-=0.00373可如)249.061P-2.09ng=——金—==0.6764P2如)-3.0927)給出p置信水平為95%的置信區(qū)間;2解:由于|f=_2.09,S=0.6764,t(23)=2.07,故|3置信水平為95%的置信TOC\o"1-5"\h\z2伉0.0252區(qū)間為(-2.09-2.07x0.6764,-2.09+2.07x0.676功=(-3.49,4).69)8)對(duì)回歸方程進(jìn)行顯著性檢驗(yàn);解:提出假設(shè):H:p=p=0H鄧或°邳012-10.96解:由于g(B)=_LnS=業(yè)->,%&耶,)0.93構(gòu)造統(tǒng)計(jì)量歹=一RSS/kF(k9n-k-l)ESS/n-k-1確定拒絕域:F>F(kM-k-l)=F(223)=3.42a0.05計(jì)算統(tǒng)計(jì)量并進(jìn)行判斷:由于F=Z宰£、=09996/蘭=28738.5>3.42\1Zr2力偵一比一1)0.0004/23故拒絕原假設(shè),即在5%的顯著性水平下認(rèn)為回歸方程的線性關(guān)系顯著成立。步驟四:經(jīng)濟(jì)預(yù)測(cè)TOC\o"1-5"\h\z點(diǎn)預(yù)測(cè):Y=Xi可以看著是Y的條件均值£(y|X)和個(gè)別值V的預(yù)測(cè)值,

00000分別稱為均值預(yù)測(cè)和個(gè)值預(yù)測(cè);性質(zhì):y=xp是eGIX)和丫的一個(gè)無(wú)偏估計(jì)量。00000區(qū)間預(yù)測(cè):均值E(Y\X)的區(qū)間預(yù)測(cè)00預(yù)測(cè)步驟:1)確定統(tǒng)計(jì)量:t=

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論