




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第八
章相關(guān)與回歸分析8.1
相關(guān)與回歸基本問(wèn)題
8.2
相關(guān)分析
8.3
一元線性回歸分析
8.4
多元線性回歸分析
學(xué)習(xí)目標(biāo)1.
相關(guān)系數(shù)的分析方法線性回歸的基本原理和參數(shù)的最小二乘估計(jì)回歸直線的擬合優(yōu)度回歸方程的顯著性檢驗(yàn)利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)8.1相關(guān)與回歸的基本問(wèn)題
經(jīng)濟(jì)變量間的統(tǒng)計(jì)關(guān)系及其分類(lèi)
相關(guān)分析的主要內(nèi)容
回歸分析的主要內(nèi)容
相關(guān)分析與回歸分析二者的聯(lián)系
變量間的關(guān)系主要有兩種:1.函數(shù)關(guān)系2.相關(guān)關(guān)系函數(shù)關(guān)系是一一對(duì)應(yīng)的確定關(guān)系設(shè)有兩個(gè)變量x
和
y,變量y
隨變量x
一起變化,并完全依賴(lài)于x
,當(dāng)變量x
取某個(gè)數(shù)值時(shí),
y
依確定的關(guān)系取相應(yīng)的值,則稱(chēng)y是x
的函數(shù),記為y=f(x),其中
x
稱(chēng)為自變量,y稱(chēng)為因變量各觀測(cè)點(diǎn)落在一條線上
xy函數(shù)關(guān)系
(幾個(gè)例子)
函數(shù)關(guān)系的例子某種商品的銷(xiāo)售額y與銷(xiāo)售量x之間的關(guān)系可表示為y=px
(p為單價(jià))圓的面積S與半徑之間的關(guān)系可表示為S=
R2
企業(yè)的原材料消耗額y與產(chǎn)量x1
、單位產(chǎn)量消耗x2
、原材料價(jià)格x3之間的關(guān)系可表示為
y=x1x2x3
相關(guān)關(guān)系
(correlation)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個(gè)變量的取值不能由另一個(gè)變量唯一確定當(dāng)變量
x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)各觀測(cè)點(diǎn)分布在直線周?chē)?/p>
xy相關(guān)關(guān)系
(幾個(gè)例子)
相關(guān)關(guān)系的例子父親身高y與子女身高x之間的關(guān)系收入水平y(tǒng)與受教育程度x之間的關(guān)系糧食畝產(chǎn)量y與施肥量x1
、降雨量x2
、溫度x3之間的關(guān)系商品的消費(fèi)量y與居民收入x之間的關(guān)系商品銷(xiāo)售額y與廣告費(fèi)支出x之間的關(guān)系相關(guān)關(guān)系
(分類(lèi))
根據(jù)影響因素多少分單相關(guān):兩個(gè)變量間相關(guān)復(fù)相關(guān)(多重相關(guān)和偏相關(guān))根據(jù)相關(guān)關(guān)系的表現(xiàn)形式分線性相關(guān)非線性相關(guān)根據(jù)相關(guān)關(guān)系的方向分正相關(guān)負(fù)相關(guān)根據(jù)相關(guān)密切程度分完全相關(guān)不完全相關(guān)不相關(guān)相關(guān)關(guān)系的主要內(nèi)容
確定現(xiàn)象之間有無(wú)關(guān)系及相關(guān)關(guān)系的表現(xiàn)形式確定相關(guān)關(guān)系的密切程度相關(guān)關(guān)系的檢驗(yàn)回歸分析的主要內(nèi)容
進(jìn)行參數(shù)估計(jì)進(jìn)行統(tǒng)計(jì)顯著性檢驗(yàn)進(jìn)行預(yù)測(cè)與控制回歸分析與相關(guān)分析的聯(lián)系相關(guān)分析與回歸分析都是研究和處理變量之間相關(guān)關(guān)系的數(shù)理統(tǒng)計(jì)方法回歸分析是建立在相關(guān)分析的基礎(chǔ)上,對(duì)于具有密切相關(guān)的兩個(gè)變量進(jìn)行深入分析,建立它們之間的數(shù)學(xué)關(guān)系式,并進(jìn)行統(tǒng)計(jì)推斷,是相關(guān)分析的拓展相關(guān)分析是回歸分析的前提,對(duì)于相關(guān)程度很低的兩個(gè)變量進(jìn)行回歸分析是沒(méi)有實(shí)際意義的
回歸分析與相關(guān)分析的區(qū)別相關(guān)分析中,變量x
變量y處于平等的地位;回歸分析中,變量y稱(chēng)為因變量,處在被解釋的地位,x稱(chēng)為自變量,用于預(yù)測(cè)因變量的變化相關(guān)分析中所涉及的變量x和y都是隨機(jī)變量;回歸分析中,因變量y是隨機(jī)變量,自變量x
可以是隨機(jī)變量,也可以是非隨機(jī)的確定變量相關(guān)分析主要是描述兩個(gè)變量之間線性關(guān)系的密切程度;回歸分析不僅可以揭示變量x對(duì)變量y的影響大小,還可以由回歸方程進(jìn)行預(yù)測(cè)和控制8.2相關(guān)分析
定性分析
相關(guān)圖表
相關(guān)系數(shù)
相關(guān)分析檢驗(yàn)相關(guān)關(guān)系的判定
定性認(rèn)識(shí)受判斷者的經(jīng)驗(yàn)、學(xué)識(shí)、能力等因素的影響
相關(guān)表和相關(guān)圖簡(jiǎn)單相關(guān)表和相關(guān)圖(資料沒(méi)有分組時(shí)用)分組相關(guān)表和相關(guān)圖(資料分組時(shí)用)單變量分組雙變量分組相關(guān)表相關(guān)表是根據(jù)現(xiàn)象變動(dòng)樣本資料編制出來(lái)的反映變量間相關(guān)關(guān)系的統(tǒng)計(jì)表,根據(jù)樣本資料是否分組,相關(guān)表分為簡(jiǎn)單相關(guān)表和分組相關(guān)表
簡(jiǎn)單相關(guān)表只將自變量的取值按照從小到大的順序并配合因變量的取值一一對(duì)應(yīng)平等排列起來(lái)的表其編制程序是:將相關(guān)資料中的兩個(gè)變量,分為自變量和因變量,其次將兩個(gè)變量值一一對(duì)應(yīng),按自變量的值從小到大順序排列即成相關(guān)表分組相關(guān)表是指將原始資料進(jìn)行分組而形成的相關(guān)表??煞譃閱巫兞糠纸M相關(guān)表和雙變量分組相關(guān)表單變量分組相關(guān)表對(duì)自變量進(jìn)行分組并計(jì)算次數(shù),而對(duì)因變量分組,只計(jì)算其平均值雙變量分組相關(guān)表是自變量和因變量都進(jìn)行分組而形成的相關(guān)表,又稱(chēng)為棋盤(pán)式相關(guān)表相關(guān)圖自變量置于橫軸上,因變量置于縱軸上,將兩變量相對(duì)應(yīng)的變量值用坐標(biāo)點(diǎn)形式描繪出來(lái),用以表明相關(guān)關(guān)系的圖形,稱(chēng)為相關(guān)圖利用相關(guān)圖可以:判斷現(xiàn)象之間有無(wú)相關(guān)關(guān)系觀察相關(guān)關(guān)系的類(lèi)型觀察相關(guān)關(guān)系的密切程度
相關(guān)圖
不相關(guān)
負(fù)線性相關(guān)
正線性相關(guān)
非線性相關(guān)
完全負(fù)線性相關(guān)完全正線性相關(guān)
相關(guān)圖
(例題分析)【例】一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國(guó)家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來(lái),該銀行的貸款額平穩(wěn)增長(zhǎng),但不良貸款額也有較大比例的增長(zhǎng),這給銀行業(yè)務(wù)的發(fā)展帶來(lái)較大壓力。為弄清楚不良貸款形成的原因,希望利用銀行業(yè)務(wù)的有關(guān)數(shù)據(jù)做些定量分析,以便找出控制不良貸款的辦法。下面是該銀行所屬的25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)相關(guān)圖
(例題分析)相關(guān)圖
(例題分析)相關(guān)系數(shù)
(correlationcoefficient)對(duì)變量之間關(guān)系密切程度的度量對(duì)兩個(gè)變量之間線性相關(guān)程度的度量稱(chēng)為簡(jiǎn)單相關(guān)系數(shù)若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱(chēng)為總體相關(guān)系數(shù),記為
若是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱(chēng)為樣本相關(guān)系數(shù),記為
r相關(guān)系數(shù)
(計(jì)算公式)
樣本相關(guān)系數(shù)的計(jì)算公式或化簡(jiǎn)為相關(guān)系數(shù)的性質(zhì)
r
的取值范圍是[-1,1]
|r|=1,為完全相關(guān)r=1,為完全正相關(guān)r=-1,為完全負(fù)正相關(guān)
r=0,不存在線性相關(guān)關(guān)系
-1
r<0,為負(fù)相關(guān)
0<r
1,為正相關(guān)
|r|越趨于1表示關(guān)系越密切;|r|越趨于0表示關(guān)系越不密切相關(guān)系數(shù)的性質(zhì)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無(wú)線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加相關(guān)系數(shù)檢驗(yàn)相關(guān)系數(shù)檢驗(yàn)相關(guān)系數(shù)是根據(jù)樣本數(shù)據(jù)計(jì)算出來(lái)的,兩個(gè)不相關(guān)的變量,其樣本相關(guān)系數(shù)也可能較高,這在統(tǒng)計(jì)上稱(chēng)為虛假相關(guān)
相關(guān)系數(shù)描述與之間的密切程度與樣本個(gè)數(shù)有關(guān),當(dāng)較小時(shí),相關(guān)系數(shù)的絕對(duì)值容易接近1,特別地當(dāng)n=2,相關(guān)系數(shù)的絕對(duì)值一定為1我們并不能根據(jù)相關(guān)系數(shù)的絕對(duì)值大小直接衡量x與y之間關(guān)系是否真正密切,還必須通過(guò)相關(guān)系數(shù)臨界值進(jìn)行比較相關(guān)系數(shù)的顯著性檢驗(yàn)
(檢驗(yàn)的步驟)提出假設(shè):H0:
;H1:
0構(gòu)造相關(guān)系數(shù)統(tǒng)計(jì)量取定顯著性水平α,查相關(guān)系數(shù)臨界表得rα(n-m),其中m=k+1(k為自變量的個(gè)數(shù))為變量的個(gè)數(shù)或估計(jì)的參數(shù)個(gè)數(shù)。(在單相關(guān)中m=2)作出統(tǒng)計(jì)決策:若|r|≥rα(n-m),則認(rèn)為x與y之間線性相關(guān)關(guān)系顯著,否則,不顯著8.3一元線性回歸分析
一元線性回歸模型
一元線性回歸模型中隨機(jī)項(xiàng)的假定
一元線性樣本回歸方程
普通最小平方法
統(tǒng)計(jì)顯著性檢驗(yàn)
預(yù)測(cè)
案例回歸分析的基本概述
“回歸”問(wèn)題最早來(lái)源于生物界,英國(guó)生物學(xué)家兼統(tǒng)計(jì)學(xué)家高爾頓(Galton,1822-1911)發(fā)現(xiàn)同一種族中兒子的平均高度介于其父親的高度與種族平均高度之間。兒子的身高有返歸于種族平均身高的趨勢(shì),即回歸于種族的平均身高。
回歸分析是指對(duì)具有相關(guān)關(guān)系的現(xiàn)象,根據(jù)其關(guān)系形態(tài),選擇一個(gè)合適的數(shù)學(xué)模型,用來(lái)近似地表示變量間的平均變化關(guān)系的一種統(tǒng)計(jì)方法?;貧w模型的類(lèi)型一元線性回歸模型一元線性回歸涉及一個(gè)自變量的回歸因變量y與自變量x之間為線性關(guān)系被預(yù)測(cè)或被解釋的變量稱(chēng)為因變量(dependentvariable),用y表示用來(lái)預(yù)測(cè)或用來(lái)解釋因變量的一個(gè)或多個(gè)變量稱(chēng)為自變量(independentvariable),用x表示因變量與自變量之間的關(guān)系用一個(gè)線性方程來(lái)表示回歸模型
(regressionmodel)回答“變量之間是什么樣的關(guān)系?”方程中運(yùn)用1個(gè)數(shù)字的因變量(響應(yīng)變量)被預(yù)測(cè)的變量1個(gè)或多個(gè)數(shù)字的或分類(lèi)的自變量(解釋變量)用于預(yù)測(cè)的變量3. 主要用于預(yù)測(cè)和估計(jì)回歸模型的一般形式總體回歸模型:y=f(x)+u,其中x為自變量,y為因變量,u為隨機(jī)項(xiàng)樣本回歸模型:yi=f(xi)+ui隨機(jī)項(xiàng)u來(lái)自以下幾個(gè)方面:自變量的省略
統(tǒng)計(jì)誤差模型的設(shè)定誤差隨機(jī)誤差
一元線性回歸模型描述因變量y如何依賴(lài)于自變量x和誤差項(xiàng)u
的方程稱(chēng)為回歸模型一元線性總體回歸模型可表示為
y=b0+b1x+uy是x的線性函數(shù)(部分)加上誤差項(xiàng)線性部分反映了由于x的變化而引起的y的變化誤差項(xiàng)u
是隨機(jī)變量反映了除x和y之間的線性關(guān)系之外的隨機(jī)因素對(duì)y的影響是不能由x和y之間的線性關(guān)系所解釋的變異性
0
和
1
稱(chēng)為模型的參數(shù)一元線性回歸模型
(基本假定)誤差項(xiàng)u是一個(gè)期望值為0的隨機(jī)變量,即E(ε)=0。對(duì)于一個(gè)給定的x值,y的期望值為E(y)=
0+
1x對(duì)于所有的x值,u的方差σ2都相同誤差項(xiàng)u是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立。即u~N(0,σ2)獨(dú)立性意味著對(duì)于一個(gè)特定的x值,它所對(duì)應(yīng)的u與其他x值所對(duì)應(yīng)的u不相關(guān)對(duì)于一個(gè)特定的x值,它所對(duì)應(yīng)的y值與其他x所對(duì)應(yīng)的y值也不相關(guān)回歸方程
(regressionequation)描述y的平均值或期望值如何依賴(lài)于x的方程稱(chēng)為回歸方程一元線性回歸方程的形式如下
E(y)=
0+
1x方程的圖示是一條直線,也稱(chēng)為直線回歸方程
0是回歸直線在y軸上的截距,是當(dāng)x=0時(shí)y的期望值
1是直線的斜率,稱(chēng)為回歸系數(shù),表示當(dāng)x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值估計(jì)的回歸方程
(estimatedregressionequation)一元線性回歸中估計(jì)的回歸方程為用樣本統(tǒng)計(jì)量和代替回歸方程中的未知參數(shù)和,就得到了估計(jì)的回歸方程總體回歸參數(shù)和
是未知的,必須利用樣本數(shù)據(jù)去估計(jì)其中:是估計(jì)的回歸直線在y
軸上的截距,是直線的斜率,它表示對(duì)于一個(gè)給定的x
的值,是y
的估計(jì)值,也表示x
每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值
參數(shù)的最小二乘估計(jì)最小二乘估計(jì)用最小二乘法擬合的直線來(lái)代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來(lái)求得和的方法。即最小二乘估計(jì)
(圖示)最小二乘法
(
和的計(jì)算公式)
根據(jù)最小二乘法的要求,可得求解和的公式如下統(tǒng)計(jì)顯著性檢驗(yàn)T
檢驗(yàn)檢驗(yàn)x與y之間是否具有線性關(guān)系,或者說(shuō),檢驗(yàn)自變量x對(duì)因變量y的影響是否顯著理論基礎(chǔ)是回歸系數(shù)
的抽樣分布屬于回歸系數(shù)的統(tǒng)計(jì)顯著性檢驗(yàn)T
檢驗(yàn)
(檢驗(yàn)步驟)提出假設(shè)H0:b1=0(沒(méi)有線性關(guān)系)H1:b1
0(有線性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量
確定顯著性水平
,并進(jìn)行決策
t>t
,拒絕H0;t<t
,不能拒絕H0T
檢驗(yàn)
(樣本統(tǒng)計(jì)量的分布)
是根據(jù)最小二乘法求出的樣本統(tǒng)計(jì)量,它有自己的分布的分布具有如下性質(zhì)分布形式:正態(tài)分布數(shù)學(xué)期望:標(biāo)準(zhǔn)差:由于
未知,需用其估計(jì)量sy來(lái)代替得到的估計(jì)的標(biāo)準(zhǔn)差回歸直線的擬合優(yōu)度變差因變量
y的取值是不同的,y取值的這種波動(dòng)稱(chēng)為變差。變差來(lái)源于兩個(gè)方面由于自變量x的取值不同造成的除x以外的其他因素(如x對(duì)y的非線性影響、測(cè)量誤差等)的影響對(duì)一個(gè)具體的觀測(cè)值來(lái)說(shuō),變差的大小可以通過(guò)該實(shí)際觀測(cè)值與其均值之差來(lái)表示變差的分解
(圖示)xyy{}}
離差平方和的分解
(三個(gè)平方和的關(guān)系)SST=SSE+SSR總平方和(SST){回歸平方和(SSE){殘差平方和(SSR){離差平方和的分解
(三個(gè)平方和的意義)總平方和(SST)反映因變量的n個(gè)觀察值與其均值的總離差回歸平方和(SSE)反映自變量x的變化對(duì)因變量y取值變化的影響,或者說(shuō),是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱(chēng)為可解釋的平方和殘差平方和(SSR)反映除x以外的其他因素對(duì)y取值的影響,也稱(chēng)為不可解釋的平方和或剩余平方和判定系數(shù)r2
(coefficientofdetermination)回歸平方和占總離差平方和的比例反映回歸直線的擬合程度取值范圍在[0,1]之間
R2
1,說(shuō)明回歸方程擬合的越好;R2
0,說(shuō)明回歸方程擬合的越差估計(jì)標(biāo)準(zhǔn)誤差
(standarderrorofestimate)實(shí)際觀察值與回歸估計(jì)值離差平方和的均方根反映實(shí)際觀察值在回歸直線周?chē)姆稚顩r對(duì)誤差項(xiàng)u的標(biāo)準(zhǔn)差
的估計(jì),是在排除了x對(duì)y的線性影響后,y隨機(jī)波動(dòng)大小的一個(gè)估計(jì)量反映用估計(jì)的回歸方程預(yù)測(cè)y時(shí)預(yù)測(cè)誤差的大小
計(jì)算公式為F檢驗(yàn)屬于回歸方程的顯著性檢驗(yàn)將回歸均方(MSR)同殘差均方(MSE)加以比較,應(yīng)用F檢驗(yàn)來(lái)分析二者之間的差別是否顯著回歸均方:回歸平方和SSR除以相應(yīng)的自由度(自變量的個(gè)數(shù)p)殘差均方:殘差平方和SSE除以相應(yīng)的自由度(n-p-1)F檢驗(yàn)
(檢驗(yàn)的步驟)提出假設(shè)H0:
0=
1=0線性關(guān)系不顯著計(jì)算檢驗(yàn)統(tǒng)計(jì)量F確定顯著性水平
,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F
作出決策:若F>F
,拒絕H0;若F<F
,不能拒絕H0R的檢驗(yàn)
(檢驗(yàn)的步驟)提出假設(shè):H0:
;H1:
0構(gòu)造相關(guān)系數(shù)統(tǒng)計(jì)量取定顯著性水平α,查相關(guān)系數(shù)臨界表得rα(n-m),其中m=k+1(k為自變量的個(gè)數(shù))為變量的個(gè)數(shù)或估計(jì)的參數(shù)個(gè)數(shù)作出統(tǒng)計(jì)決策:若|r|≥rα(n-m),則認(rèn)為x與y之間線性相關(guān)關(guān)系顯著,否則,不顯著三種檢驗(yàn)的關(guān)系對(duì)于一元線性回歸方程來(lái)說(shuō),三種檢驗(yàn)是等價(jià)的
利用回歸方程進(jìn)行預(yù)測(cè)根據(jù)自變量x
的取值預(yù)測(cè)因變量y的取值預(yù)測(cè)的類(lèi)型點(diǎn)預(yù)測(cè)y的個(gè)別值的點(diǎn)預(yù)測(cè)y的平均值的點(diǎn)預(yù)測(cè)區(qū)間估計(jì)y的個(gè)別值的預(yù)測(cè)區(qū)間預(yù)測(cè)y的平均值的置信區(qū)間預(yù)測(cè)點(diǎn)預(yù)測(cè)點(diǎn)預(yù)測(cè)2.點(diǎn)預(yù)測(cè)值有y的個(gè)別值的點(diǎn)預(yù)測(cè)y的平均值的點(diǎn)預(yù)測(cè)在點(diǎn)預(yù)測(cè)條件下,平均值的點(diǎn)預(yù)測(cè)和個(gè)別值的的點(diǎn)預(yù)測(cè)是一樣的,但在區(qū)間預(yù)測(cè)中則不同對(duì)于自變量
x
的一個(gè)給定值x0
,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)值點(diǎn)預(yù)測(cè)
利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0
,求出因變量y
的一個(gè)個(gè)別值的估計(jì)值,就是個(gè)別值的點(diǎn)預(yù)測(cè)
利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0
,求出因變量y
的平均值的一個(gè)估計(jì)值E(y0),就是平均值的點(diǎn)預(yù)測(cè)區(qū)間估計(jì)區(qū)間預(yù)測(cè)點(diǎn)預(yù)測(cè)不能給出估計(jì)的精度,點(diǎn)預(yù)測(cè)值與實(shí)際值之間是有誤差的,因此需要進(jìn)行區(qū)間估計(jì)對(duì)于自變量
x的一個(gè)給定值x0,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)區(qū)間區(qū)間預(yù)測(cè)有兩種類(lèi)型預(yù)測(cè)區(qū)間預(yù)測(cè)(predictionintervalestimate)置信區(qū)間預(yù)測(cè)(confidenceintervalestimate)個(gè)別值的區(qū)間預(yù)測(cè)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0
,求出因變量y
的一個(gè)個(gè)別值的估計(jì)區(qū)間,這一區(qū)間稱(chēng)為預(yù)測(cè)區(qū)間(predictioninterval)
y0在1-
置信水平下的預(yù)測(cè)區(qū)間為平均值的區(qū)間預(yù)測(cè)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0
,求出因變量y
的平均值的估計(jì)區(qū)間,這一估計(jì)區(qū)間稱(chēng)為置信區(qū)間(confidenceinterval)
E(y0)
在1-
置信水平下的置信區(qū)間為影響區(qū)間寬度的因素1.置信水平(1-
)區(qū)間寬度隨置信水平的增大而增大2.數(shù)據(jù)的離散程度s區(qū)間寬度隨離散程度的增大而增大3. 樣本容量區(qū)間寬度隨樣本容量的增大而減小4. 用于預(yù)測(cè)的xp與
x的差異程度區(qū)間寬度隨xp與
x的差異程度的增大而增大置信區(qū)間、預(yù)測(cè)區(qū)間、回歸方程xpyx
x預(yù)測(cè)上限置信上限預(yù)測(cè)下限置信下限案例:一元線性回歸模型的應(yīng)用表8.3.1某地1978年~2003年的國(guó)內(nèi)生產(chǎn)總值GDP與貨運(yùn)周轉(zhuǎn)量的數(shù)據(jù)
用Excel繪制散點(diǎn)圖(步驟)選擇“插入”下拉菜單選擇“圖表”選項(xiàng)選擇XY散點(diǎn)圖輸入數(shù)據(jù)區(qū)域(B2:C27)輸入圖表標(biāo)題“散點(diǎn)圖”、數(shù)值X軸“國(guó)內(nèi)生產(chǎn)總值GDP”、數(shù)值Y軸“貨運(yùn)周轉(zhuǎn)量”選擇新工作表插入還是作為其中的對(duì)象插入相關(guān)分析(案例)用Excel進(jìn)行回歸分析第1步:選擇“工具”下拉菜單第2步:選擇“數(shù)據(jù)分析”選項(xiàng)第3步:在分析工具中選擇“回歸”,然后選擇“確定”第4步:當(dāng)對(duì)話框出現(xiàn)時(shí)
在“Y值輸入?yún)^(qū)域”設(shè)置框內(nèi)鍵入Y的數(shù)據(jù)區(qū)域在“X值輸入?yún)^(qū)域”設(shè)置框內(nèi)鍵入X的數(shù)據(jù)區(qū)域在“置信度”選項(xiàng)中給出所需的數(shù)值(此例取95%)
在“輸出選項(xiàng)”中選擇輸出區(qū)域
用Excel進(jìn)行回歸分析回歸分析(案例)Excel輸出的部分回歸結(jié)果R2)結(jié)果分析于是我們認(rèn)為,國(guó)內(nèi)生產(chǎn)總值與貨運(yùn)周轉(zhuǎn)量之間的線性相關(guān)關(guān)系顯著,統(tǒng)計(jì)顯著性檢驗(yàn)通過(guò)
回歸方程:
檢驗(yàn)SignificanceF=1.395E-21;P-value=1.395E-21<5%預(yù)測(cè)
點(diǎn)預(yù)測(cè):例若2005年的GDP為80億元,則貨運(yùn)周轉(zhuǎn)量為區(qū)間預(yù)測(cè)個(gè)別值的區(qū)間預(yù)測(cè)由公式計(jì)算的GDP為80時(shí):50.177~58.569均值的區(qū)間預(yù)測(cè)由公式計(jì)算的GDP為80時(shí):52.788~55.95758.4多元線性回歸分析
多元線性回歸模型及其假設(shè)
參數(shù)估計(jì)
統(tǒng)計(jì)顯著性檢驗(yàn)
解釋變量的選擇
利用多元線性回歸方程進(jìn)行預(yù)測(cè)
案例:多元線性回歸模型的應(yīng)用舉例多元回歸模型與回歸方程多元回歸模型
(multipleregressionmodel)一個(gè)因變量與兩個(gè)及兩個(gè)以上自變量的回歸描述因變量y如何依賴(lài)于自變量x1
,x2
,…,
xk
和誤差項(xiàng)u
的方程,稱(chēng)為多元回歸模型涉及k個(gè)自變量的多元回歸模型可表示為
b0
,b1,b2
,,bk是參數(shù)
u
是被稱(chēng)為誤差項(xiàng)的隨機(jī)變量
y是x1,,x2
,
,xk
的線性函數(shù)加上誤差項(xiàng)u
u包含在y里面但不能被k個(gè)自變量的線性關(guān)系所解釋的變異性多元回歸模型
(矩陣形式)=+XB+UY=多元回歸模型
(基本假定)誤差項(xiàng)u是一個(gè)期望值為0的隨機(jī)變量,即E(u)=0對(duì)于自變量x1,x2,…,xk的所有值,u的方差
2都相同誤差項(xiàng)u是一個(gè)服從正態(tài)分布的隨機(jī)變量,即u~N(0,
2),且相互獨(dú)立多元回歸方程
(multipleregressionequation)描述因變量y的平均值或期望值如何依賴(lài)于自變量x1,x2
,…,xk的方程多元線性回歸方程的形式為
E(y)=
0+
1x1
+
2x2
+…+
k
xkb1,b2,,bk稱(chēng)為偏回歸系數(shù)
bi
表示假定其他變量不變,當(dāng)xi
每變動(dòng)一個(gè)單位時(shí),y的平均平均變動(dòng)值二元回歸方程的直觀解釋二元線性回歸模型(觀察到的y)回歸面
0uix1yx2(x1,x2)}估計(jì)的多元回歸方程估計(jì)的多元回歸的方程
(estimatedmultipleregressionequation)
是估計(jì)值是y
的估計(jì)值用樣本統(tǒng)計(jì)量估計(jì)回歸方程中的參數(shù)
時(shí)得到的方程由最小二乘法求得一般形式為參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘法求解各回歸參數(shù)的標(biāo)準(zhǔn)方程如下使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來(lái)求得
。即估計(jì)標(biāo)準(zhǔn)誤差
Sy對(duì)誤差項(xiàng)u的標(biāo)準(zhǔn)差
的一個(gè)估計(jì)值衡量多元回歸方程的擬合優(yōu)度計(jì)算公式為決定系數(shù)檢驗(yàn)決定系數(shù)
(multiplecoefficientofdetermination)
回歸平方和占總平方和的比例計(jì)算公式為因變量取值的變差中,能被估計(jì)的多元回歸方程所解釋的比例修正決定系數(shù)
(adjustedmultiplecoefficientofdetermination)
用樣本容量n和自變量的個(gè)數(shù)k去修正R2得到計(jì)算公式為避免增加自變量而高估R2意義與R2類(lèi)似數(shù)值小于R2線性關(guān)系檢驗(yàn)線性關(guān)系檢驗(yàn)檢驗(yàn)因變量與所有自變量之間的線性關(guān)系是否顯著也被稱(chēng)為總體的顯著性檢驗(yàn)檢驗(yàn)方法是將回歸離差平方和(SSR)同剩余離差平方和(SSE)加以比較,應(yīng)用F檢驗(yàn)來(lái)分析二者之間的差別是否顯著如果是顯著的,因變量與自變量之間存在線性關(guān)系如果不顯著,因變量與自變量之間不存在線性關(guān)系線性關(guān)系檢驗(yàn)提出假設(shè)H0:
1
2
k=0線性關(guān)系不顯著H1:
1,
2,,
k至少有一個(gè)不等于02.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F確定顯著性水平
和分子自由度p、分母自由度
n-k-1找出臨界值F
4.作出決策:若F>F
,拒絕H0回歸系數(shù)檢驗(yàn)和推斷回歸系數(shù)的檢驗(yàn)線性關(guān)系檢驗(yàn)通過(guò)后,對(duì)各個(gè)回歸系數(shù)有選擇地進(jìn)行一次或多次檢驗(yàn)究竟要對(duì)哪幾個(gè)回歸系數(shù)進(jìn)行檢驗(yàn),通常需要在建立模型之前作出決定對(duì)回歸系數(shù)檢驗(yàn)的個(gè)數(shù)進(jìn)行限制,以避免犯過(guò)多的第一類(lèi)錯(cuò)誤(棄真錯(cuò)誤)對(duì)每一個(gè)自變量都要單獨(dú)進(jìn)行檢驗(yàn)應(yīng)用t檢驗(yàn)統(tǒng)計(jì)量回歸系數(shù)的檢驗(yàn)
(步驟)提出假設(shè)H0:bi=0(自變量xi
與
因變量y沒(méi)有線性關(guān)系)H1:bi
0(自變量xi
與
因變量y有線性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量t
確定顯著性水平
,并進(jìn)行決策
t>t
,拒絕H0;t<t
,不能拒絕H0相關(guān)系數(shù)分析復(fù)相關(guān)系數(shù)簡(jiǎn)單相關(guān)系數(shù)R=偏相關(guān)系數(shù)解釋變量的選擇前進(jìn)法對(duì)全部個(gè)自變量,分別對(duì)因變量y建立k個(gè)一元線性回歸方程,并分別計(jì)算這個(gè)一元回歸方程的F檢驗(yàn)值,記為{F11,F(xiàn)21,F(xiàn)31,…,F(xiàn)k1};選其最大的記為:
Fj1=max{F11,F(xiàn)21,F(xiàn)31,…,F(xiàn)k1}給定顯著性水平α,若Fj1≥Fα(1,n-2),則首先引入方程,不妨設(shè)就是x1。前進(jìn)法因變量分別與(x1,x2),(x1,x3)…,(x1,xk),建立k-1個(gè)二元線
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 顯著成效的咖啡師試題及答案
- 小自考視覺(jué)傳播設(shè)計(jì)互聯(lián)網(wǎng)傳播策略試題及答案
- 提升商業(yè)分析職業(yè)形象試題及答案
- 2024年犍為縣招聘事業(yè)單位人員考試真題
- 湖南邵陽(yáng)農(nóng)商行招聘筆試真題2024
- 聚焦考點(diǎn) 2024年稅務(wù)師試題及答案
- 2024年鞍山市立山區(qū)招聘幼兒園教師考試真題
- 2025年混懸劑項(xiàng)目發(fā)展計(jì)劃
- 新人教版小學(xué)六年級(jí)上冊(cè)數(shù)學(xué)全冊(cè)教學(xué)設(shè)計(jì)
- DB5301∕T 34-2019 用水定額 機(jī)關(guān)單位
- 國(guó)開(kāi)2024年《機(jī)械設(shè)計(jì)基礎(chǔ)》形考任務(wù)1-4答案
- 某局副局長(zhǎng)日常廉政談話記錄
- 2023年福建省考評(píng)員考試題
- 《公路橋梁抗震設(shè)計(jì)細(xì)則》-鮑衛(wèi)剛
- 保潔員安全培訓(xùn)教育課件
- 量子傳感器技術(shù)與應(yīng)用
- 趙一曼英雄事跡
- 2024屆遼寧省名校聯(lián)盟高考模擬卷(調(diào)研卷)數(shù)學(xué)試題(一)
- 用戶需求調(diào)研結(jié)果分析報(bào)告
- Creo-7.0基礎(chǔ)教程-配套課件
- 方格網(wǎng)土方計(jì)算表
評(píng)論
0/150
提交評(píng)論