




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第七章相關(guān)與回歸分析制作時間:2004—2005內(nèi)容提要1、相關(guān)關(guān)系的概念與種類2、相關(guān)分析3、一元線性回歸分析4、多元線性回歸分析5、曲線回歸分析學(xué)習(xí)目標(biāo)1. 理解相關(guān)關(guān)系的概念掌握線性回歸的基本原理和參數(shù)的最小二乘估計掌握回歸直線的擬合優(yōu)度掌握回歸方程的顯著性檢驗(yàn)利用回歸方程進(jìn)行估計和預(yù)測用Excel
進(jìn)行回歸分析第一節(jié)相關(guān)關(guān)系概述一、變量間的關(guān)系(一)函數(shù)關(guān)系是一一對應(yīng)的確定關(guān)系設(shè)有兩個變量x和y,變量y隨變量x一起變化,并完全依賴于x
,當(dāng)變量x取某個數(shù)值時,
y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測點(diǎn)落在一條線上
xy函數(shù)關(guān)系
(幾個例子)
函數(shù)關(guān)系的例子某種商品的銷售額y與銷售量x之間的關(guān)系可表示為y=px
(p為單價)圓的面積S與半徑之間的關(guān)系可表示為S=
R2
企業(yè)的原材料消耗額y與產(chǎn)量x1、單位產(chǎn)量消耗x2、原材料價格x3之間的關(guān)系可表示為
y=x1x2x3
(二)相關(guān)關(guān)系
(correlation)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個變量的取值不能由另一個變量唯一確定當(dāng)變量
x取某個值時,變量y的取值可能有幾個各觀測點(diǎn)分布在直線周圍
xy相關(guān)關(guān)系
(幾個例子)
相關(guān)關(guān)系的例子父親身高y與子女身高x之間的關(guān)系收入水平y(tǒng)與受教育程度x之間的關(guān)系糧食畝產(chǎn)量y與施肥量x1、降雨量x2、溫度x3之間的關(guān)系商品的消費(fèi)量y與居民收入x之間的關(guān)系商品銷售額y與廣告費(fèi)支出x之間的關(guān)系二、相關(guān)關(guān)系的種類
相關(guān)關(guān)系的種類單項(xiàng)關(guān)1、按相關(guān)的形式分為:線性相關(guān)非線性相關(guān)2、按所研究的變量多少分為:復(fù)相關(guān)3、按相關(guān)的方向分為:正相關(guān)負(fù)相關(guān)4、按相關(guān)的程度分為:完全相關(guān)不完全相關(guān)不相關(guān)偏相關(guān)散點(diǎn)圖
(scatterdiagram)
不相關(guān)
負(fù)線性相關(guān)
正線性相關(guān)
非線性相關(guān)
完全負(fù)線性相關(guān)完全正線性相關(guān)
三、相關(guān)關(guān)系分析的方法(一)相關(guān)分析1、相關(guān)分析主要用于測定具有相關(guān)關(guān)系的變量之間相互關(guān)系的密切程度。2、是回歸分析的基礎(chǔ)。3、分析方法主要有:繪制散點(diǎn)圖、編制相關(guān)表、計算項(xiàng)關(guān)系數(shù)等。(二)回歸分析
(Regression)研究具有相關(guān)關(guān)系的變量值之間一般的數(shù)量變動關(guān)系,即自變量發(fā)生變化時,因變量平均會發(fā)生多大的變化。通過建立回歸方程來完成分析。回歸方程除可用于研究相關(guān)變量之間的一般數(shù)量變動關(guān)系外,還常用于進(jìn)行預(yù)測,即根據(jù)一個或幾個變量的取值來預(yù)測或控制另一個相關(guān)變量的取值,并給出這種預(yù)測或控制的精確程度回歸模型的類型(三)回歸分析與相關(guān)分析的區(qū)別相關(guān)分析主要是描述兩個變量之間線性關(guān)系的密切程度;回歸分析不僅可以揭示變量之間的一般數(shù)量變動關(guān)系,還可以由回歸方程進(jìn)行預(yù)測和控制。相關(guān)分析中,變量x
變量y處于平等的地位;回歸分析中,變量y稱為因變量,處在被解釋的地位,x稱為自變量,用于預(yù)測因變量的變化相關(guān)分析中所涉及的變量x和y都是隨機(jī)變量;回歸分析中,因變量y是隨機(jī)變量,自變量x
可以是隨機(jī)變量,也可以是非隨機(jī)的確定變量第二節(jié)相關(guān)分析一、相關(guān)表和相關(guān)圖相關(guān)表與相關(guān)圖
(概念要點(diǎn))1、相關(guān)表和相關(guān)圖是研究相關(guān)關(guān)系的直觀工具。一般在進(jìn)行詳細(xì)的定量分析之前,可以利用它們對現(xiàn)象之間存在的相關(guān)關(guān)系的方向、形式和密切程度做大致的判斷。2、相關(guān)表是一種反映變量之間相關(guān)關(guān)系的統(tǒng)計表。它是將某一變量按其取值的大小排列,然后再將與其相關(guān)的另一變量的對應(yīng)值平行排列,便可得到簡單的相關(guān)表。3、相關(guān)圖又稱散點(diǎn)圖。它是以直角坐標(biāo)系的橫軸代表變量X,縱軸代表Y,將兩個變量間相應(yīng)的變量值用坐標(biāo)點(diǎn)的形式描繪出來,用來反應(yīng)量變量之間相關(guān)關(guān)系的圖形。相關(guān)表
(舉例分析)家庭編號12345678910可支配收入25186045628892997598可支配收入18254560627588929899
居民收入和消費(fèi)的原始資料計量單位:百元
居民消費(fèi)和收入相關(guān)表計量單位:百元消費(fèi)支出20154030426065705378消費(fèi)支出15203040425360657870散點(diǎn)圖
(例題分析)【例】一家大型商業(yè)銀行在多個地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來,該銀行的貸款額平穩(wěn)增長,但不良貸款額也有較大比例的增長,這給銀行業(yè)務(wù)的發(fā)展帶來較大壓力。為弄清楚不良貸款形成的原因,希望利用銀行業(yè)務(wù)的有關(guān)數(shù)據(jù)做些定量分析,以便找出控制不良貸款的辦法。下面是該銀行所屬的25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)散點(diǎn)圖
(例題分析)散點(diǎn)圖
(例題分析)二、相關(guān)系數(shù)及其檢驗(yàn)相關(guān)系數(shù)
(correlationcoefficient)對變量之間關(guān)系密切程度的測度值(指標(biāo))對兩個變量之間線性相關(guān)程度的度量稱為單相關(guān)系數(shù)若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,稱為總體相關(guān)系數(shù),記為
,若是根據(jù)樣本數(shù)據(jù)計算的,則稱為樣本相關(guān)系數(shù),記為r相關(guān)系數(shù)
(計算公式)
樣本相關(guān)系數(shù)的計算公式或化簡為相關(guān)系數(shù)
(取值及其意義)
r
的取值范圍是[-1,1]
|r|=1,為完全相關(guān)r=1,為完全正相關(guān)r=-1,為完全負(fù)正相關(guān)
r=0,不存在線性相關(guān)關(guān)系-1
r<0,為負(fù)相關(guān)
0<r
1,為正相關(guān)
|r|越趨于1表示關(guān)系越密切;|r|越趨于0表示關(guān)系越不密切相關(guān)系數(shù)
(取值及其意義)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加相關(guān)系數(shù)
(例題分析)
用Excel計算相關(guān)系數(shù)相關(guān)系數(shù)的顯著性檢驗(yàn)相關(guān)系數(shù)的顯著性檢驗(yàn)
(r的抽樣分布)1. r的抽樣分布隨總體相關(guān)系數(shù)和樣本容量的大小而變化當(dāng)樣本數(shù)據(jù)來自正態(tài)總體時,隨著n的增大,r的抽樣分布趨于正態(tài)分布,尤其是在總體相關(guān)系數(shù)
很小或接近0時,趨于正態(tài)分布的趨勢非常明顯。而當(dāng)
遠(yuǎn)離0時,除非n非常大,否則r的抽樣分布呈現(xiàn)一定的偏態(tài)。當(dāng)
為較大的正值時,r呈現(xiàn)左偏分布;當(dāng)
為較小的負(fù)值時,r呈現(xiàn)右偏分布。只有當(dāng)
接近于0,而樣本容量n很大時,才能認(rèn)為r是接近于正態(tài)分布的隨機(jī)變量1-10
=0.8r的抽樣分布P接近0時樣本相關(guān)系數(shù)r的分布1-10
=0.8r的抽樣分布P接近1時樣本相關(guān)系數(shù)r的分布1-10
=-0.8r的抽樣分布P接近-1時樣本相關(guān)系數(shù)r的分布相關(guān)系數(shù)的顯著性檢驗(yàn)
(檢驗(yàn)的步驟)1. 檢驗(yàn)兩個變量之間是否存在線性相關(guān)關(guān)系由于對r的正態(tài)性假設(shè)具有很大的風(fēng)險,因此通常情況下,不采用正態(tài)檢驗(yàn),而采用R.A.Fisher提出的t檢驗(yàn),該檢驗(yàn)可用于小樣本,也可用于大樣本。檢驗(yàn)的步驟為提出假設(shè):H0:
;H1:
0計算檢驗(yàn)的統(tǒng)計量:確定顯著性水平,并作出決策若t>t
,拒絕H0
若t<t
,不能拒絕H0相關(guān)系數(shù)的顯著性檢驗(yàn)
(例題分析)
對不良貸款與貸款余額之間的相關(guān)系數(shù)進(jìn)行顯著性檢(
0.05)提出假設(shè):H0:
;H1:
0計算檢驗(yàn)的統(tǒng)計量3.根據(jù)顯著性水平
=0.05,查t分布表得t
(n-2)=2.0687由于t=7.5344>t
(25-2)=2.0687,拒絕H0,不良貸款與貸款余額之間存在著顯著的正線性相關(guān)關(guān)系相關(guān)系數(shù)的顯著性檢驗(yàn)
(例題分析)各相關(guān)系數(shù)檢驗(yàn)的統(tǒng)計量第三節(jié)一元線性回歸一、一元線性回歸與函數(shù)模型一元線性回歸函數(shù)一元線性回歸模型總體樣本(一)一元線性回歸函數(shù)與模型的數(shù)學(xué)表達(dá)式
0是回歸直線在y軸上的截距,是當(dāng)x=0時y的期望值。
1是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動一個單位時,y的平均變動值。XYX1X2X3X4(二)一元線性回歸函數(shù)與模型意義的圖形解釋(三)一元線性回歸模型的基本假定1.誤差項(xiàng)u是一個期望值為0的正態(tài)分布隨機(jī)變量,即2.對于所有的x值,u的方差σ2都相同,即3.對于一個特定的x值,它所對應(yīng)的u與其他x值所對應(yīng)的u不相關(guān)。即4.對于一個特定的x值,它所對應(yīng)的y值與其他x所對應(yīng)的y值也不相關(guān)XYX1X2X3X4回歸模型基本假定的圖形解釋(四)樣本回歸方程與總體回歸方程的聯(lián)系與區(qū)別聯(lián)系:樣本回歸方程與總體回歸方程具有相同的形式,且樣本回歸模型是作為總體回歸模型的估計而存在的。區(qū)別:1、總體回歸線是未知的,并且只有一條。而樣本回歸線則是根據(jù)樣本數(shù)據(jù)擬合的,每抽取一個樣本,便可以擬合一條回歸線。2、總體回歸方程中的參數(shù)是未知的,但它是確定的。而樣本回歸方程中的參數(shù)是隨機(jī)變量,隨樣本的不同而不同。3、總體回歸模型中的ui是(因變量實(shí)際觀測值)Yi與總體回歸線之間的縱向距離,它是不可直接觀測的。而樣本回歸模型中ei是Yi與樣本回歸線之間的縱向距離,當(dāng)根據(jù)樣本數(shù)據(jù)擬合出樣本回歸線之后,可以計算出ei的具體數(shù)值。二、模型參數(shù)的估計(一)回歸系數(shù)的估計
—最小二乘估計使因變量的觀察值與估計值之間的離差平方和達(dá)到最小來求得和的方法。即用最小二乘法擬合的直線來代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小最小二乘估計
(圖示)xy(xn,yn)(x1,y1)
(x2,y2)(xi,yi)}ei=yi-yi^最小二乘法
(
和的計算公式)
根據(jù)最小二乘法的要求,可得求解和的公式如下最小二乘法
(例題分析)【例】求不良貸款對貸款余額的回歸(方程)函數(shù)回歸方程為:y=-0.8295
+0.037895
x回歸系數(shù)=0.037895表示,貸款余額每增加1億元,不良貸款平均增加0.037895億元
^最小二乘法
(例題分析)不良貸款對貸款余額回歸方程的圖示(二)總體方差的估計
此外,S2的正平方根有叫做回歸估計的標(biāo)準(zhǔn)差。S越小,回歸線的代表性越強(qiáng),否則相反。除了β1和β2,一元線性回歸模型還包括另外一個未知參數(shù),那就是總體隨機(jī)誤差項(xiàng)的方差б2。б2可以反映理論模型誤差的大小,它是檢驗(yàn)?zāi)P蜁r,必須利用的一個重要參數(shù)。由于б2本身不能直接觀測,因而需要用∑et2(最小二乘殘差)來估計б2??梢宰C明б2的無偏估計為:用Excel進(jìn)行回歸分析第1步:選擇“工具”下拉菜單第2步:選擇“數(shù)據(jù)分析”選項(xiàng)第3步:在分析工具中選擇“回歸”,然后選擇“確定”第4步:當(dāng)對話框出現(xiàn)時
在“Y值輸入?yún)^(qū)域”設(shè)置框內(nèi)鍵入Y的數(shù)據(jù)區(qū)域在“X值輸入?yún)^(qū)域”設(shè)置框內(nèi)鍵入X的數(shù)據(jù)區(qū)域在“置信度”選項(xiàng)中給出所需的數(shù)值在“輸出選項(xiàng)”中選擇輸出區(qū)域在“殘差”分析選項(xiàng)中選擇所需的選項(xiàng)
用Excel進(jìn)行回歸分析三、回歸模型的檢驗(yàn)1、經(jīng)濟(jì)理論檢驗(yàn)經(jīng)濟(jì)理論檢驗(yàn)主要涉及估計值的符號和取值區(qū)間。如果它們與實(shí)質(zhì)性科學(xué)的理論以及人們的實(shí)踐經(jīng)驗(yàn)不相符合,就說明模型不能很好的解釋現(xiàn)實(shí)現(xiàn)象。其原因可能是樣本偏小,不能代表總體或不能滿足標(biāo)準(zhǔn)回歸分析所要求的假定條件。2、統(tǒng)計檢驗(yàn)(一級檢驗(yàn))統(tǒng)計檢驗(yàn)是利用統(tǒng)計學(xué)中的抽樣理論檢驗(yàn)樣本回歸方程的可靠性,包括擬合優(yōu)度檢驗(yàn)和顯著性檢驗(yàn)。統(tǒng)計檢驗(yàn)是所有現(xiàn)象進(jìn)行回歸分析時都必須進(jìn)行的檢驗(yàn)。3、計量經(jīng)濟(jì)學(xué)檢驗(yàn)(二級檢驗(yàn))計量經(jīng)濟(jì)學(xué)檢驗(yàn)是對標(biāo)準(zhǔn)回歸方程的假定條件能否得到滿足進(jìn)行檢驗(yàn)。(一)模型檢驗(yàn)的內(nèi)容(二)模型擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)是檢驗(yàn)樣本回歸方程對樣本觀測值代表性大小。衡量這一問題的指標(biāo)稱為可決系數(shù)(決定系數(shù)),其數(shù)學(xué)表達(dá)式為:
(RegressionSumofSquare)(ResidualSumofSquare)(TotalDeviationSumofSquare)1、概念及公式離差平方和的分解
(變差)因變量
y的取值是不同的,y取值的這種波動稱為變差。變差來源于兩個方面由于自變量x的取值不同造成的除x以外的其他因素(如x對y的非線性影響、測量誤差等)的影響對一個具體的觀測值來說,變差的大小可以通過該實(shí)際觀測值與其均值之差來表示變差的分解
(圖示)xyy{}}
離差平方和的分解
(三個平方和的關(guān)系)SST=SSR+SSE總平方和(SST){回歸平方和(SSR)殘差平方和(SSE){{離差平方和的分解
(三個平方和的意義)總平方和(SST)反映因變量的n個觀察值與其均值的總離差回歸平方和(SSR)反映自變量x的變化對因變量y取值變化的影響,或者說,是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的平方和殘差平方和(SSE)反映除x以外的其他因素對y取值的影響,也稱為不可解釋的平方和或剩余平方和2、可決系數(shù)r2的特性(1)具有非負(fù)性(2)r2的值越接近1,SSR越接近SST,即說明回歸方程對實(shí)際觀測值的擬合程度愈好,否則相反。(3)可決系數(shù)是樣本觀測值的函數(shù),它也是一個隨機(jī)變量。(4)可決系數(shù)的平方根為相關(guān)系數(shù),用公式表示為:
可決系數(shù)r2
(例題分析)【例】計算不良貸款對貸款余額回歸的判定系數(shù),并解釋其意義
判定系數(shù)的實(shí)際意義是:在不良貸款取值的變差中,有71.16%可以由不良貸款與貸款余額之間的線性關(guān)系來解釋,或者說,在不良貸款取值的變動中,有71.16%是由貸款余額所決定的。也就是說,不良貸款取值的差異有2/3以上是由貸款余額決定的。可見不良貸款與貸款余額之間有較強(qiáng)的線性關(guān)系(三)顯著性檢驗(yàn)顯著性檢驗(yàn)(概念要點(diǎn))回歸分析中的顯著性檢驗(yàn)包括兩方面的內(nèi)容:一是對各回歸系數(shù)的顯著性檢驗(yàn);對于回歸系數(shù)的顯著性檢驗(yàn)通常采用t檢驗(yàn),二是對整個回歸方程的顯著性檢驗(yàn)。對回歸方程的顯著性檢驗(yàn)則是在方差分析的基礎(chǔ)上采用F檢驗(yàn)。在一元線性回歸模型中,由于只有一個自變量X,對=0的t檢驗(yàn)與整個方程的F檢驗(yàn)是等價的。所以這里只介紹回歸系數(shù)的顯著性檢驗(yàn),關(guān)于回歸方程的顯著性檢驗(yàn)將在多元統(tǒng)計分析中介紹。(三)回歸系數(shù)的檢驗(yàn)回歸系數(shù)的檢驗(yàn)
(概念要點(diǎn))2.檢驗(yàn)x與y之間是否具有線性關(guān)系,或者說,檢驗(yàn)自變量x對因變量y的影響是否顯著3.理論基礎(chǔ)是回歸系數(shù)
的抽樣分布,
1.就是根據(jù)樣本估計的結(jié)果對總體回歸系數(shù)的是否為0進(jìn)行假設(shè)檢驗(yàn)?;貧w系數(shù)的檢驗(yàn)
(樣本統(tǒng)計量的分布)
是根據(jù)最小二乘法求出的樣本統(tǒng)計量,它是一個隨機(jī)變量,有自己的分布的分布具有如下性質(zhì)分布形式:正態(tài)分布數(shù)學(xué)期望:標(biāo)準(zhǔn)差:由于
未知,需用其估計量sy來代替得到的估計的標(biāo)準(zhǔn)差回歸系數(shù)的檢驗(yàn)
(檢驗(yàn)步驟)提出假設(shè)H0:b1=0(沒有線性關(guān)系)H1:b1
0(有線性關(guān)系)計算檢驗(yàn)的統(tǒng)計量確定顯著性水平
,并進(jìn)行決策
t>t
,拒絕H0;t<t
,不能拒絕H00回歸系數(shù)的檢驗(yàn)
(例題分析)
對例題的回歸系數(shù)進(jìn)行顯著性檢驗(yàn)(
=0.05)提出假設(shè)H0:b1=0H1:b1
0計算檢驗(yàn)的統(tǒng)計量
t=7.533515>t
=2.201,拒絕H0,表明不良貸款與貸款余額之間有線性關(guān)系回歸系數(shù)的檢驗(yàn)
(例題分析)
P值的應(yīng)用P=0.000000<
=0.05,拒絕原假設(shè),不良貸款與貸款余額之間有線性關(guān)系Excel輸出的部分回歸結(jié)果R2)四、利用樣本回歸函數(shù)方程式進(jìn)行估計和預(yù)測利用回歸函數(shù)方程進(jìn)行
估計和預(yù)測根據(jù)自變量x
的取值估計或預(yù)測因變量y的取值估計或預(yù)測的類型點(diǎn)估計y的平均值的點(diǎn)估計y的個別值的點(diǎn)估計區(qū)間估計y的平均值的置信區(qū)間估計y的個別值的預(yù)測區(qū)間估計(一)點(diǎn)估計點(diǎn)估計2.點(diǎn)估計值有y的平均值的點(diǎn)估計y的個別值的點(diǎn)估計在點(diǎn)估計條件下,平均值的點(diǎn)估計和個別值的的點(diǎn)估計是一樣的,但在區(qū)間估計中則不同對于自變量x的一個給定值x0,根據(jù)回歸方程得到因變量y的一個估計值
y的平均值的點(diǎn)估計
利用估計的回歸方程,對于自變量x的一個給定值x0
,求出因變量y的平均值的一個估計值E(y0),就是平均值的點(diǎn)估計在前面的例子中,假如我們要估計貸款余額為100億元時,所有分行不良貸款的平均值,就是平均值的點(diǎn)估計。根據(jù)估計的回歸方程得y的個別值的點(diǎn)估計
利用估計的回歸方程,對于自變量x的一個給定值x0
,求出因變量y的一個個別值的估計值,就是個別值的點(diǎn)估計例如,如果我們只是想知道貸款余額為72.8億元的那個分行(這里是編號為10的那個分行)的不良貸款是多少,則屬于個別值的點(diǎn)估計。根據(jù)估計的回歸方程得(二)區(qū)間估計區(qū)間估計與預(yù)測點(diǎn)估計不能給出估計的精度,點(diǎn)估計值與實(shí)際值之間是有誤差的,因此需要進(jìn)行區(qū)間估計對于自變量
x的一個給定值x0,根據(jù)回歸方程得到因變量y的一個估計區(qū)間區(qū)間估計有兩種類型均值的預(yù)測區(qū)間(confidenceintervalestimate)個別值的預(yù)測區(qū)間(predictionintervalestimate)均值的區(qū)間估計利用樣本回歸函數(shù)方程,對于自變量
x的一個給定值x0
,求出因變量y
的平均值的估計區(qū)間
,這一估計區(qū)間稱為置信區(qū)間(confidenceinterval)
E(y0)
在1-
置信水平下的置信區(qū)間為式中:sy為估計標(biāo)準(zhǔn)誤差均值的區(qū)間估計
(例題分析)
【例】求出貸款余額為100億元時,不良貸款95%置信水平下的置信區(qū)間
解:根據(jù)前面的計算結(jié)果,已知n=25,sy=1.9799,t
(25-2)=2.0687置信區(qū)間為當(dāng)貸款余額為100億元時,不良貸款的平均值在2.1422億元到3.7778億元之間個別值的預(yù)測區(qū)間利用估計的回歸方程,對于自變量x的一個給定值x0
,求出因變量y
的一個個別值的估計區(qū)間,這一區(qū)間稱為預(yù)測區(qū)間(predictioninterval)
y0在1-
置信水平下的預(yù)測區(qū)間為注意!預(yù)測區(qū)間估計
(例題分析)【例】求出貸款余額為100億元時,不良貸款95%置信水平下的預(yù)測區(qū)間
解:根據(jù)前面的計算結(jié)果,已知n=25,sy=1.9799,t
(25-2)=2.0687置信區(qū)間為貸款余額為72.8億元的那個分行,其不良貸款的預(yù)測區(qū)間在-2.2467億元到6.1067億元之間影響區(qū)間寬度的因素置信水平(1-
)區(qū)間寬度隨置信水平的增大而增大數(shù)據(jù)的離散程度s區(qū)間寬度隨離散程度的增大而增大3. 樣本容量區(qū)間寬度隨樣本容量的增大而減小4. 用于預(yù)測的xp與
x的差異程度區(qū)間寬度隨xp與
x的差異程度的增大而增大置信區(qū)間、預(yù)測區(qū)間、回歸方程xpyx
x預(yù)測上限置信上限預(yù)測下限置信下限第四節(jié)多元線性回歸一、多元回歸模型與回歸函數(shù)總體多元回歸模型
(multipleregressionmodel)一個因變量與兩個及兩個以上自變量的回歸描述因變量y如何依賴于自變量x1,x2,…,
xp
和誤差項(xiàng)
的方程,稱為多元回歸模型涉及p個自變量的多元回歸模型可表示為
b0
,b1,b2
,,bp是參數(shù)
是被稱為誤差項(xiàng)的隨機(jī)變量
y是x1,,x2
,
,xp
的線性函數(shù)加上誤差項(xiàng)
包含在y里面但不能被p個自變量的線性關(guān)系所解釋的變異性總體多元回歸模型
(基本假定)誤差項(xiàng)ε是一個期望值為0的隨機(jī)變量,即E(
)=0對于自變量x1,x2,…,xp的所有值,
的方差
2都相同誤差項(xiàng)ε是一個服從正態(tài)分布的隨機(jī)變量,即ε~N(0,
2),且相互獨(dú)立總體多元回歸函數(shù)
(multipleregressionequation)描述因變量y的平均值或期望值如何依賴于自變量x1,x2
,…,xp的方程多元線性回歸方程的形式為
E(y)=
0+
1x1
+
2x2
+…+
p
xp
b1,b2,,bp稱為偏回歸系數(shù)
bi
表示假定其他變量不變,當(dāng)xi
每變動一個單位時,y的平均平均變動值二元回歸方程的直觀解釋二元線性回歸模型(觀察到的y)回歸面
0
ix1yx2(x1,x2)}樣本多元回歸函數(shù)
(estimatedmultipleregressionequation)是估計值是y
的估計值用樣本統(tǒng)計量估計回歸方程中的參數(shù)
時得到的方程由最小二乘法求得一般形式為樣本多元回歸函數(shù)的矩陣表達(dá)式矩陣形式二、參數(shù)的最小二乘估計參數(shù)的最小二乘法求解各回歸參數(shù)的標(biāo)準(zhǔn)方程如下使因變量的觀察值與估計值之間的離差平方和達(dá)到最小來求得
。即參數(shù)的最小二乘法
(例題分析)【例】一家大型商業(yè)銀行在多個地區(qū)設(shè)有分行,為弄清楚不良貸款形成的原因,抽取了該銀行所屬的25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)。試建立不良貸款y與貸款余額x1、累計應(yīng)收貸款x2、貸款項(xiàng)目個數(shù)x3和固定資產(chǎn)投資額x4的線性回歸方程,并解釋各回歸系數(shù)的含義
用Excel進(jìn)行回歸三、模型的檢驗(yàn)(一)擬合優(yōu)度檢驗(yàn)復(fù)可決系數(shù)
(multiplecoefficientofdetermination)
回歸平方和占總平方和的比例計算公式為因變量取值的變差中,能被估計的多元回歸方程所解釋的比例修正的可決系數(shù)
(adjustedmultiplecoefficientofdetermination)
用樣本容量n和自變量的個數(shù)p去修正R2得到計算公式為避免增加自變量而高估R2意義與R2類似數(shù)值小于R2
Excel輸出結(jié)果的分析估計標(biāo)準(zhǔn)誤差Sy對誤差項(xiàng)
的標(biāo)準(zhǔn)差
的一個估計值衡量多元回歸函數(shù)方程的擬合優(yōu)度計算公式為
Excel輸出結(jié)果的分析(二)線性關(guān)系檢驗(yàn)線性關(guān)系檢驗(yàn)檢驗(yàn)因變量與所有自變量之間的線性關(guān)系是否顯著也被稱為總體的顯著性檢驗(yàn)檢驗(yàn)方法是將回歸離差平方和(SSR)同剩余離差平方和(SSE)加以比較,應(yīng)用F檢驗(yàn)來分析二者之間的差別是否顯著如果是顯著的,因變量與自變量之間存在線性關(guān)系如果不顯著,因變量與自變量之間不存在線性關(guān)系線性關(guān)系檢驗(yàn)提出假設(shè)H0:
1
2
p=0線性關(guān)系不顯著H1:
1,
2,,
p至少有一個不等于02.計算檢驗(yàn)統(tǒng)計量F確定顯著性水平
和分子自由度p、分母自由度
n-p-1找出臨界值F
4.作出決策:若F>F
,拒絕H0
Excel輸出結(jié)果的分析(三)回歸系數(shù)檢驗(yàn)和推斷回歸系數(shù)的檢驗(yàn)線性關(guān)系檢驗(yàn)通過后,對各個回歸系數(shù)有選擇地進(jìn)行一次或多次檢驗(yàn)究竟要對哪幾個回歸系數(shù)進(jìn)行檢驗(yàn),通常需要在建立模型之前作出決定對回歸系數(shù)檢驗(yàn)的個數(shù)進(jìn)行限制,以避免犯過多的第一類錯誤(棄真錯誤)對每一個自變量都要單獨(dú)進(jìn)行檢驗(yàn)應(yīng)用t檢驗(yàn)統(tǒng)計量回歸系數(shù)的檢驗(yàn)
(步驟)提
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司包車送員工合同范例
- 醫(yī)院擔(dān)架服務(wù)合同范本
- 互聯(lián)網(wǎng)商標(biāo)設(shè)計合同范本
- 個人建房外包合同范本
- 勞動合同范本 學(xué)校
- 低租金租房合同范本
- 勞動合同范本 合肥
- 農(nóng)村建筑標(biāo)準(zhǔn)合同范例
- 供電設(shè)施租用合同范本
- 加工牛肉出售合同范本
- 征地搬遷基本要求及工作技巧課件
- 小學(xué)教學(xué)質(zhì)量分析報告教學(xué)課件
- 《煙花爆竹基礎(chǔ)知識》課件
- 井下刷漆-安全技術(shù)措施
- 連乘兩步計算的實(shí)際問題
- 部編版語文五年級下冊 課本解讀
- 中國畫的特點(diǎn)及分類課件
- 供應(yīng)商現(xiàn)場審核評估表
- 重大危險源監(jiān)理實(shí)施細(xì)則(二篇)
- 自身免疫性多內(nèi)分泌腺體綜合征
- IEC-60068-系列標(biāo)準(zhǔn)完整版
評論
0/150
提交評論