




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第8章相關(guān)和回歸分析學(xué)習(xí)目標(biāo)
7.1相關(guān)與回歸分析的基本概念7.2一元線性回歸分析7.3多元線性回歸分析7.4非線性回歸7.5相關(guān)分析云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院第8章相關(guān)和回歸分析學(xué)習(xí)目標(biāo)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院1學(xué)習(xí)重點(diǎn)1. 相關(guān)系數(shù)的分析方法2.一元線性回歸的基本原理和參數(shù)的最小二乘估計(jì)3.回歸直線的擬合優(yōu)度4.回歸方程的顯著性檢驗(yàn)5.利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院學(xué)習(xí)重點(diǎn)1. 相關(guān)系數(shù)的分析方法云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院27.1相關(guān)與回歸分析的基本概念函數(shù)關(guān)系是一一對(duì)應(yīng)的確定關(guān)系設(shè)有兩個(gè)變量x和y,變量y隨變量x一起變化,并完全依賴于x
,當(dāng)變量x取某個(gè)數(shù)值時(shí),
y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測(cè)點(diǎn)落在一條線上
云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.1相關(guān)與回歸分析的基本概念函數(shù)關(guān)系是一一對(duì)應(yīng)的確定關(guān)3函數(shù)關(guān)系
(幾個(gè)例子)函數(shù)關(guān)系的例子某種商品的銷售額y與銷售量x之間的關(guān)系可表示為y=px(p為單價(jià))圓的面積S與半徑之間的關(guān)系可表示為S=R2
企業(yè)的原材料消耗額y與產(chǎn)量x1、單位產(chǎn)量消耗x2、原材料價(jià)格x3之間的關(guān)系可表示為y=x1x2x3
云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院函數(shù)關(guān)系
(幾個(gè)例子)函數(shù)關(guān)系的例子云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息4相關(guān)關(guān)系
(correlation)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)2.一個(gè)變量的取值不能由另一個(gè)變量唯一確定3.當(dāng)變量
x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)4.各觀測(cè)點(diǎn)分布在直線周圍
云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院相關(guān)關(guān)系
(correlation)變量間關(guān)系不能用函數(shù)關(guān)系5相關(guān)關(guān)系
(幾個(gè)例子)相關(guān)關(guān)系的例子父親身高y與子女身高x之間的關(guān)系收入水平y(tǒng)與受教育程度x之間的關(guān)系糧食畝產(chǎn)量y與施肥量x1、降雨量x2、溫度x3之間的關(guān)系商品的消費(fèi)量y與居民收入x之間的關(guān)系商品銷售額y與廣告費(fèi)支出x之間的關(guān)系云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院相關(guān)關(guān)系
(幾個(gè)例子)相關(guān)關(guān)系的例子云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息6相關(guān)關(guān)系(類型)
按相關(guān)程度劃分:
完全相關(guān)、不完全相關(guān)和不相關(guān)按相關(guān)方向劃分:
正相關(guān)和負(fù)相關(guān)按相關(guān)形式劃分:
線性相關(guān)和非線性相關(guān)按變量多少劃分單相關(guān)、復(fù)相關(guān)和偏相關(guān)按相關(guān)性質(zhì)劃分真實(shí)相關(guān)和虛假相關(guān)
云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院相關(guān)關(guān)系(類型)
按相關(guān)程度劃分:云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院77.2一元線性回歸7.2.1標(biāo)準(zhǔn)的一元線性回歸模型7.2.2一元線性回歸模型的估計(jì)7.2.3一元線性回歸模型的檢驗(yàn)7.2.4一元線性回歸模型的預(yù)測(cè)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.2一元線性回歸7.2.1標(biāo)準(zhǔn)的一元8一元線性回歸模型描述因變量y如何依賴于自變量x和誤差項(xiàng)
的方程稱為回歸模型一元線性回歸模型可表示為y=b0+b1x+ey是x的線性函數(shù)(部分)加上誤差項(xiàng)線性部分反映了由于x的變化而引起的y的變化誤差項(xiàng)
是隨機(jī)變量反映了除x和y之間的線性關(guān)系之外的隨機(jī)因素對(duì)y的影響是不能由x和y之間的線性關(guān)系所解釋的變異性0和1稱為模型的參數(shù)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院一元線性回歸模型描述因變量y如何依賴于自變量x和誤差9一元線性回歸模型
(基本假定)誤差項(xiàng)ε的期望值為0,即E(ε)=0。對(duì)于一個(gè)給定的x值,y的期望值為E(y)=0+
1x對(duì)于所有的x值,誤差項(xiàng)之間不存在序列相關(guān)關(guān)系,即
自變量是給定的變量,與隨機(jī)誤差項(xiàng)線性無(wú)關(guān)隨機(jī)誤差項(xiàng)服從正態(tài)分布,即
ε~N(0,σ2)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院一元線性回歸模型
(基本假定)誤差項(xiàng)ε的期望值為0,即E(10總體回歸函數(shù)描述y的平均值或期望值如何依賴于x的方程稱為總體回歸函數(shù)總體回歸函數(shù)的數(shù)學(xué)形式如下E(y)=0+1x函數(shù)的圖示是一條直線,也稱為總體回歸直線0是回歸直線在y軸上的截距,是當(dāng)x=0時(shí)y的期望值1是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院總體回歸函數(shù)描述y的平均值或期望值如何依賴于x的方程11樣本回歸函數(shù)(估計(jì)方程)
總體回歸參數(shù)和
是未知的,必須利用樣本數(shù)據(jù)去估計(jì)用樣本統(tǒng)計(jì)量和代替回歸方程中的未知參數(shù)和,就得到了估計(jì)的回歸方程3.一元線性回歸中估計(jì)的回歸方程為其中:是估計(jì)的回歸直線在y軸上的截距,是直線的斜率,它表示對(duì)于一個(gè)給定的x的值,是y的估計(jì)值,也表示x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值
云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院樣本回歸函數(shù)(估計(jì)方程)
總體回歸參數(shù)和是未知的127.2.2一元線性回歸模型的估計(jì)使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來(lái)求得和的方法。即用最小二乘法擬合的直線來(lái)代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.2.2一元線性回歸模型的估計(jì)使因變量的觀察值與估計(jì)值之間13最小二乘法
(
和的計(jì)算公式)
根據(jù)最小二乘法的要求,可得求解和的公式如下云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院最小二乘法
(和的計(jì)算公式)根據(jù)最小二14估計(jì)方程的求法
(例題分析)【例7-1】估計(jì)食品支出的恩格爾函數(shù)回歸方程為:y=9.9872+0.1802
x回歸系數(shù)=0.1802表示,收入每增加1億元,食品支出平均增加0.1802億元
云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院估計(jì)方程的求法
(例題分析)【例7-1】估計(jì)食品支出的恩格爾15估計(jì)標(biāo)準(zhǔn)誤差
(standarderrorofestimate)實(shí)際觀察值與回歸估計(jì)值離差平方和的均方根反映實(shí)際觀察值在回歸直線周圍的分散狀況對(duì)誤差項(xiàng)的標(biāo)準(zhǔn)差的估計(jì),是在排除了x對(duì)y的線性影響后,y隨機(jī)波動(dòng)大小的一個(gè)估計(jì)量反映用估計(jì)的回歸方程預(yù)測(cè)y時(shí)預(yù)測(cè)誤差的大小
計(jì)算公式為注:例題的計(jì)算結(jié)果為1.8286云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院估計(jì)標(biāo)準(zhǔn)誤差
(standarderrorofesti167.2.3一元線性回歸模型的檢驗(yàn)離差因變量
y的取值是不同的,y取值的這種波動(dòng)稱為變差。變差來(lái)源于兩個(gè)方面由于自變量x的取值不同造成的除x以外的其他因素(如x對(duì)y的非線性影響、測(cè)量誤差等)的影響對(duì)一個(gè)具體的觀測(cè)值來(lái)說(shuō),變差的大小可以通過(guò)該實(shí)際觀測(cè)值與其均值之差來(lái)表示云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.2.3一元線性回歸模型的檢驗(yàn)離差因變量y的取值是不同17離差的分解
(圖示)xyy{}}云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院離差的分解
(圖示)xyy{}}云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院18離差平方和的分解
(三個(gè)平方和的關(guān)系)SST=SSR+SSE總平方和(SST){回歸平方和(SSR)殘差平方和(SSE){{云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院離差平方和的分解
(三個(gè)平方和的關(guān)系)SST=SSR19離差平方和的分解
(三個(gè)平方和的意義)總平方和(SST)反映因變量的n個(gè)觀察值與其均值的總離差回歸平方和(SSR)反映自變量x的變化對(duì)因變量y取值變化的影響,或者說(shuō),是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的平方和殘差平方和(SSE)反映除x以外的其他因素對(duì)y取值的影響,也稱為不可解釋的平方和或剩余平方和云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院離差平方和的分解
(三個(gè)平方和的意義)總平方和(SST)云20可決系數(shù)r2回歸平方和占總離差平方和的比例反映回歸直線的擬合程度取值范圍在[0,1]之間
R21,說(shuō)明回歸方程擬合的越好;R20,說(shuō)明回歸方程擬合的越差判定系數(shù)等于相關(guān)系數(shù)的平方,即R2=r2云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院可決系數(shù)r2回歸平方和占總離差平方和的比例反映回歸直線的擬合21可決系數(shù)r2
(例題分析)
【例7-2】計(jì)算估計(jì)食品支出的恩格爾函數(shù)回歸的可決系數(shù),并解釋其意義
可決系數(shù)的實(shí)際意義是:在食品支出取值的變差中,有88.63%可以由食品支出與家庭收入之間的線性關(guān)系來(lái)解釋,或者說(shuō),在食品支出取值的變動(dòng)中,有88.63%是家庭收入所決定的。可見(jiàn)食品支出與家庭收入之間有較強(qiáng)的線性關(guān)系云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院可決系數(shù)r2(例題分析)
【例7-2】計(jì)算估計(jì)食品支出的22
7.2.3一元線性回歸模型的檢驗(yàn)檢驗(yàn)x與y之間是否具有線性關(guān)系,或者說(shuō),檢驗(yàn)自變量x對(duì)因變量y的影響是否顯著理論基礎(chǔ)是回歸系數(shù)
的抽樣分布在一元線性回歸中,等價(jià)于線性關(guān)系的顯著性檢驗(yàn)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.2.3一元線性回歸模型的檢驗(yàn)檢驗(yàn)x與y之間是否23回歸系數(shù)的檢驗(yàn)
(樣本統(tǒng)計(jì)量的分布)
是根據(jù)最小二乘法求出的樣本統(tǒng)計(jì)量,它有自己的分布的分布具有如下性質(zhì)分布形式:正態(tài)分布數(shù)學(xué)期望:標(biāo)準(zhǔn)差:由于未知,需用其估計(jì)量sy來(lái)代替得到的估計(jì)的標(biāo)準(zhǔn)差云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院回歸系數(shù)的檢驗(yàn)
(樣本統(tǒng)計(jì)量的分布)是根據(jù)最小二24回歸系數(shù)的檢驗(yàn)
(檢驗(yàn)步驟)提出假設(shè)H0:b1=0(沒(méi)有線性關(guān)系)H1:b1
0(有線性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量確定顯著性水平,并進(jìn)行決策t>t,拒絕H0;t<t,不拒絕H0云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院回歸系數(shù)的檢驗(yàn)
(檢驗(yàn)步驟)提出假設(shè)確定顯著性水平,25回歸系數(shù)的檢驗(yàn)
(例題分析)對(duì)例題的回歸系數(shù)進(jìn)行顯著性檢驗(yàn)(=0.05)提出假設(shè)H0:b1=0H1:b1
0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量
t=10.07>t=2.160,拒絕H0,表明食品支出與家庭收入之間有線性關(guān)系云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院回歸系數(shù)的檢驗(yàn)
(例題分析)對(duì)例題的回歸系數(shù)進(jìn)行顯著性檢26
7.2.4一元線性回歸模型的預(yù)測(cè)根據(jù)自變量x的取值估計(jì)或預(yù)測(cè)因變量y的取值估計(jì)或預(yù)測(cè)的類型點(diǎn)估計(jì)y的個(gè)別值的點(diǎn)估計(jì)(或預(yù)測(cè))區(qū)間估計(jì)y的個(gè)別值的預(yù)測(cè)區(qū)間估計(jì)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.2.4一元線性回歸模型的預(yù)測(cè)根據(jù)自變量x的取值估計(jì)27y的個(gè)別值的點(diǎn)預(yù)測(cè)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0
,求出因變量y的一個(gè)個(gè)別值的估計(jì)值,就是個(gè)別值的點(diǎn)估計(jì)例如,如果我們只是想知道家庭收入為200元的那些家庭的食品支出是多少,則屬于個(gè)別值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院y的個(gè)別值的點(diǎn)預(yù)測(cè)利用估計(jì)的回歸方程,對(duì)于自變量x的28區(qū)間預(yù)測(cè)
點(diǎn)估計(jì)不能給出估計(jì)的精度,點(diǎn)估計(jì)值與實(shí)際值之間是有誤差的,因此需要進(jìn)行區(qū)間估計(jì)對(duì)于自變量
x的一個(gè)給定值x0,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)區(qū)間本課程討論的區(qū)間估計(jì)類型預(yù)測(cè)區(qū)間估計(jì)(predictionintervalestimate)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院區(qū)間預(yù)測(cè)點(diǎn)估計(jì)不能給出估計(jì)的精度,點(diǎn)估計(jì)值與實(shí)際值之間是有29預(yù)測(cè)區(qū)間估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0
,求出因變量y的一個(gè)個(gè)別值的估計(jì)區(qū)間,這一區(qū)間稱為預(yù)測(cè)區(qū)間(predictioninterval)
y0在1-置信水平下的預(yù)測(cè)區(qū)間為云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院預(yù)測(cè)區(qū)間估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值30影響區(qū)間寬度的因素置信水平(1-)區(qū)間寬度隨置信水平的增大而增大數(shù)據(jù)的離散程度s區(qū)間寬度隨離散程度的增大而增大3. 樣本容量區(qū)間寬度隨樣本容量的增大而減小4. 用于預(yù)測(cè)的xp與x的差異程度區(qū)間寬度隨xp與x的差異程度的增大而增大云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院影響區(qū)間寬度的因素置信水平(1-)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信31置信區(qū)間、預(yù)測(cè)區(qū)間、回歸方程xpyxx預(yù)測(cè)上限置信上限預(yù)測(cè)下限置信下限云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院置信區(qū)間、預(yù)測(cè)區(qū)間、回歸方程xpyxx預(yù)測(cè)上限置信上限預(yù)測(cè)327.3多元線性回歸分析7.3.1多元線性回歸模型7.3.2多元線性回歸模型的估計(jì)7.3.3多元線性回歸模型的檢驗(yàn)和預(yù)測(cè)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.3多元線性回歸分析7.3.1多元線性回歸模型云南337.3.1多元回歸模型
一個(gè)因變量與兩個(gè)及兩個(gè)以上自變量的回歸描述因變量y如何依賴于自變量x1,x2,…,xk
和誤差項(xiàng)
的方程,稱為多元回歸模型涉及p個(gè)自變量的多元回歸模型可表示為
b0
,b1,b2
,,bk是參數(shù)
是被稱為誤差項(xiàng)的隨機(jī)變量y是x1,,x2
,,xk
的線性函數(shù)加上誤差項(xiàng)
包含在y里面但不能被k個(gè)自變量的線性關(guān)系所解釋的變異性云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.3.1多元回歸模型
一個(gè)因變量與兩個(gè)及兩個(gè)以上自變量的34多元回歸模型
(基本假定)誤差項(xiàng)ε是一個(gè)期望值為0的隨機(jī)變量,即E()=0對(duì)于自變量x1,x2,…,xp的所有值,的方差2都相同誤差項(xiàng)ε是一個(gè)服從正態(tài)分布的隨機(jī)變量,即ε~N(0,2),且相互獨(dú)立云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院多元回歸模型
(基本假定)誤差項(xiàng)ε是一個(gè)期望值為0的隨機(jī)變35多元樣本回歸函數(shù)(方程)
用樣本統(tǒng)計(jì)量估計(jì)回歸方程中的參數(shù)
時(shí)得到的方程由最小二乘法求得一般形式為是估計(jì)值是y的估計(jì)值云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院多元樣本回歸函數(shù)(方程)
用樣本統(tǒng)計(jì)量367.3.2多元線性回歸模型的估計(jì)使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來(lái)求得
。即求解各回歸參數(shù)的標(biāo)準(zhǔn)方程如下云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.3.2多元線性回歸模型的估計(jì)使因變量的觀察值與估377.3.3多元線性回歸模型的檢驗(yàn)和預(yù)測(cè)回歸方程的擬合優(yōu)度回歸平方和占總平方和的比例計(jì)算公式為3.因變量取值的變差中,能被估計(jì)的多元回歸方程所解釋的比例云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.3.3多元線性回歸模型的檢驗(yàn)和預(yù)測(cè)回歸方程的擬合38修正多重可決系數(shù)
用樣本容量n和自變量的個(gè)數(shù)p去修正R2得到計(jì)算公式為避免增加自變量而高估R2意義與R2類似數(shù)值小于R2云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院修正多重可決系數(shù)
用樣本容量n和自變量的個(gè)數(shù)p去修正R2得到39顯著性檢驗(yàn)(回歸系數(shù)的檢驗(yàn))提出假設(shè)H0:bi=0(自變量xi
與
因變量y沒(méi)有線性關(guān)系)H1:bi
0(自變量xi
與
因變量y有線性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量t確定顯著性水平,并進(jìn)行決策t>t,拒絕H0;t<t,不拒絕H0云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院顯著性檢驗(yàn)(回歸系數(shù)的檢驗(yàn))提出假設(shè)確定顯著性水平,40顯著性檢驗(yàn)
(回歸方程的顯著性檢驗(yàn))提出假設(shè)H0:12p=0線性關(guān)系不顯著H1:1,2,p至少有一個(gè)不等于02.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F確定顯著性水平和分子自由度p、分母自由度n-p-1找出臨界值F
4.作出決策:若F>F
,拒絕H0云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院顯著性檢驗(yàn)
(回歸方程的顯著性檢驗(yàn))提出假設(shè)2.計(jì)算417.4非線性回歸1. 因變量y與x之間不是線性關(guān)系2. 可通過(guò)變量代換轉(zhuǎn)換成線性關(guān)系用最小二乘法求出參數(shù)的估計(jì)值并非所有的非線性模型都可以化為線性模型云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.4非線性回歸1. 因變量y與x之間不是線性關(guān)系42雙曲線基本形式:線性化方法令:y'=1/y,x'=1/x,則有y'
=+x'云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院雙曲線基本形式:云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院43指數(shù)曲線基本形式:線性化方法兩端取對(duì)數(shù)得:lny
=ln+x令:y'=lny,則有y'
=ln+x云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院指數(shù)曲線基本形式:云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院44S型曲線基本形式:線性化方法令:y'=1/y,x'=e-x,則有y'
=+x云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院S型曲線基本形式:云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院457.5相關(guān)分析
相關(guān)系數(shù)(correlationcoefficient)
對(duì)變量之間關(guān)系密切程度的度量對(duì)兩個(gè)變量之間線性相關(guān)程度的度量稱為簡(jiǎn)單相關(guān)系數(shù)若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為若是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為r云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.5相關(guān)分析
相關(guān)系數(shù)(correlationcoef46相關(guān)系數(shù)
(計(jì)算公式)
樣本相關(guān)系數(shù)的計(jì)算公式或化簡(jiǎn)為云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院相關(guān)系數(shù)
(計(jì)算公式)樣本相關(guān)系數(shù)的計(jì)算公式或化簡(jiǎn)為云47相關(guān)系數(shù)
(取值及其意義)
r的取值范圍是[-1,1]
|r|=1,為完全相關(guān)r=1,為完全正相關(guān)r=-1,為完全負(fù)正相關(guān)
r=0,不存在線性相關(guān)關(guān)系-1r<0,為負(fù)相關(guān)0<r1,為正相關(guān)
|r|越趨于1表示關(guān)系越密切;|r|越趨于0表示關(guān)系越不密切云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院相關(guān)系數(shù)
(取值及其意義)r的取值范圍是[-1,1]云48相關(guān)系數(shù)的顯著性檢驗(yàn)
(r的抽樣分布)1. r的抽樣分布隨總體相關(guān)系數(shù)和樣本容量的大小而變化當(dāng)樣本數(shù)據(jù)來(lái)自正態(tài)總體時(shí),隨著n的增大,r的抽樣分布趨于正態(tài)分布,尤其是在總體相關(guān)系數(shù)很小或接近0時(shí),趨于正態(tài)分布的趨勢(shì)非常明顯。而當(dāng)遠(yuǎn)離0時(shí),除非n非常大,否則r的抽樣分布呈現(xiàn)一定的偏態(tài)。當(dāng)為較大的正值時(shí),r呈現(xiàn)左偏分布;當(dāng)為較小的負(fù)值時(shí),r呈現(xiàn)右偏分布。只有當(dāng)接近于0,而樣本容量n很大時(shí),才能認(rèn)為r是接近于正態(tài)分布的隨機(jī)變量云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院相關(guān)系數(shù)的顯著性檢驗(yàn)
(r的抽樣分布)1. r的抽樣分49相關(guān)系數(shù)的顯著性檢驗(yàn)
(檢驗(yàn)的步驟)1. 檢驗(yàn)兩個(gè)變量之間是否存在線性相關(guān)關(guān)系等價(jià)于對(duì)回歸系數(shù)b1的檢驗(yàn)采用R.A.Fisher提出的t檢驗(yàn)檢驗(yàn)的步驟為提出假設(shè):H0:;H1:0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量:確定顯著性水平,并作出決策若t>t,拒絕H0若t<t,不能拒絕H0云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院相關(guān)系數(shù)的顯著性檢驗(yàn)
(檢驗(yàn)的步驟)1. 檢驗(yàn)兩個(gè)變量之間是50EndofChapter7休息片刻!云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院EndofChapter7休息片刻!云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信51第8章相關(guān)和回歸分析學(xué)習(xí)目標(biāo)
7.1相關(guān)與回歸分析的基本概念7.2一元線性回歸分析7.3多元線性回歸分析7.4非線性回歸7.5相關(guān)分析云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院第8章相關(guān)和回歸分析學(xué)習(xí)目標(biāo)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院52學(xué)習(xí)重點(diǎn)1. 相關(guān)系數(shù)的分析方法2.一元線性回歸的基本原理和參數(shù)的最小二乘估計(jì)3.回歸直線的擬合優(yōu)度4.回歸方程的顯著性檢驗(yàn)5.利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院學(xué)習(xí)重點(diǎn)1. 相關(guān)系數(shù)的分析方法云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院537.1相關(guān)與回歸分析的基本概念函數(shù)關(guān)系是一一對(duì)應(yīng)的確定關(guān)系設(shè)有兩個(gè)變量x和y,變量y隨變量x一起變化,并完全依賴于x
,當(dāng)變量x取某個(gè)數(shù)值時(shí),
y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測(cè)點(diǎn)落在一條線上
云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.1相關(guān)與回歸分析的基本概念函數(shù)關(guān)系是一一對(duì)應(yīng)的確定關(guān)54函數(shù)關(guān)系
(幾個(gè)例子)函數(shù)關(guān)系的例子某種商品的銷售額y與銷售量x之間的關(guān)系可表示為y=px(p為單價(jià))圓的面積S與半徑之間的關(guān)系可表示為S=R2
企業(yè)的原材料消耗額y與產(chǎn)量x1、單位產(chǎn)量消耗x2、原材料價(jià)格x3之間的關(guān)系可表示為y=x1x2x3
云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院函數(shù)關(guān)系
(幾個(gè)例子)函數(shù)關(guān)系的例子云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息55相關(guān)關(guān)系
(correlation)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)2.一個(gè)變量的取值不能由另一個(gè)變量唯一確定3.當(dāng)變量
x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)4.各觀測(cè)點(diǎn)分布在直線周圍
云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院相關(guān)關(guān)系
(correlation)變量間關(guān)系不能用函數(shù)關(guān)系56相關(guān)關(guān)系
(幾個(gè)例子)相關(guān)關(guān)系的例子父親身高y與子女身高x之間的關(guān)系收入水平y(tǒng)與受教育程度x之間的關(guān)系糧食畝產(chǎn)量y與施肥量x1、降雨量x2、溫度x3之間的關(guān)系商品的消費(fèi)量y與居民收入x之間的關(guān)系商品銷售額y與廣告費(fèi)支出x之間的關(guān)系云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院相關(guān)關(guān)系
(幾個(gè)例子)相關(guān)關(guān)系的例子云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息57相關(guān)關(guān)系(類型)
按相關(guān)程度劃分:
完全相關(guān)、不完全相關(guān)和不相關(guān)按相關(guān)方向劃分:
正相關(guān)和負(fù)相關(guān)按相關(guān)形式劃分:
線性相關(guān)和非線性相關(guān)按變量多少劃分單相關(guān)、復(fù)相關(guān)和偏相關(guān)按相關(guān)性質(zhì)劃分真實(shí)相關(guān)和虛假相關(guān)
云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院相關(guān)關(guān)系(類型)
按相關(guān)程度劃分:云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院587.2一元線性回歸7.2.1標(biāo)準(zhǔn)的一元線性回歸模型7.2.2一元線性回歸模型的估計(jì)7.2.3一元線性回歸模型的檢驗(yàn)7.2.4一元線性回歸模型的預(yù)測(cè)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.2一元線性回歸7.2.1標(biāo)準(zhǔn)的一元59一元線性回歸模型描述因變量y如何依賴于自變量x和誤差項(xiàng)
的方程稱為回歸模型一元線性回歸模型可表示為y=b0+b1x+ey是x的線性函數(shù)(部分)加上誤差項(xiàng)線性部分反映了由于x的變化而引起的y的變化誤差項(xiàng)
是隨機(jī)變量反映了除x和y之間的線性關(guān)系之外的隨機(jī)因素對(duì)y的影響是不能由x和y之間的線性關(guān)系所解釋的變異性0和1稱為模型的參數(shù)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院一元線性回歸模型描述因變量y如何依賴于自變量x和誤差60一元線性回歸模型
(基本假定)誤差項(xiàng)ε的期望值為0,即E(ε)=0。對(duì)于一個(gè)給定的x值,y的期望值為E(y)=0+
1x對(duì)于所有的x值,誤差項(xiàng)之間不存在序列相關(guān)關(guān)系,即
自變量是給定的變量,與隨機(jī)誤差項(xiàng)線性無(wú)關(guān)隨機(jī)誤差項(xiàng)服從正態(tài)分布,即
ε~N(0,σ2)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院一元線性回歸模型
(基本假定)誤差項(xiàng)ε的期望值為0,即E(61總體回歸函數(shù)描述y的平均值或期望值如何依賴于x的方程稱為總體回歸函數(shù)總體回歸函數(shù)的數(shù)學(xué)形式如下E(y)=0+1x函數(shù)的圖示是一條直線,也稱為總體回歸直線0是回歸直線在y軸上的截距,是當(dāng)x=0時(shí)y的期望值1是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院總體回歸函數(shù)描述y的平均值或期望值如何依賴于x的方程62樣本回歸函數(shù)(估計(jì)方程)
總體回歸參數(shù)和
是未知的,必須利用樣本數(shù)據(jù)去估計(jì)用樣本統(tǒng)計(jì)量和代替回歸方程中的未知參數(shù)和,就得到了估計(jì)的回歸方程3.一元線性回歸中估計(jì)的回歸方程為其中:是估計(jì)的回歸直線在y軸上的截距,是直線的斜率,它表示對(duì)于一個(gè)給定的x的值,是y的估計(jì)值,也表示x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值
云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院樣本回歸函數(shù)(估計(jì)方程)
總體回歸參數(shù)和是未知的637.2.2一元線性回歸模型的估計(jì)使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來(lái)求得和的方法。即用最小二乘法擬合的直線來(lái)代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.2.2一元線性回歸模型的估計(jì)使因變量的觀察值與估計(jì)值之間64最小二乘法
(
和的計(jì)算公式)
根據(jù)最小二乘法的要求,可得求解和的公式如下云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院最小二乘法
(和的計(jì)算公式)根據(jù)最小二65估計(jì)方程的求法
(例題分析)【例7-1】估計(jì)食品支出的恩格爾函數(shù)回歸方程為:y=9.9872+0.1802
x回歸系數(shù)=0.1802表示,收入每增加1億元,食品支出平均增加0.1802億元
云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院估計(jì)方程的求法
(例題分析)【例7-1】估計(jì)食品支出的恩格爾66估計(jì)標(biāo)準(zhǔn)誤差
(standarderrorofestimate)實(shí)際觀察值與回歸估計(jì)值離差平方和的均方根反映實(shí)際觀察值在回歸直線周圍的分散狀況對(duì)誤差項(xiàng)的標(biāo)準(zhǔn)差的估計(jì),是在排除了x對(duì)y的線性影響后,y隨機(jī)波動(dòng)大小的一個(gè)估計(jì)量反映用估計(jì)的回歸方程預(yù)測(cè)y時(shí)預(yù)測(cè)誤差的大小
計(jì)算公式為注:例題的計(jì)算結(jié)果為1.8286云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院估計(jì)標(biāo)準(zhǔn)誤差
(standarderrorofesti677.2.3一元線性回歸模型的檢驗(yàn)離差因變量
y的取值是不同的,y取值的這種波動(dòng)稱為變差。變差來(lái)源于兩個(gè)方面由于自變量x的取值不同造成的除x以外的其他因素(如x對(duì)y的非線性影響、測(cè)量誤差等)的影響對(duì)一個(gè)具體的觀測(cè)值來(lái)說(shuō),變差的大小可以通過(guò)該實(shí)際觀測(cè)值與其均值之差來(lái)表示云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.2.3一元線性回歸模型的檢驗(yàn)離差因變量y的取值是不同68離差的分解
(圖示)xyy{}}云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院離差的分解
(圖示)xyy{}}云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院69離差平方和的分解
(三個(gè)平方和的關(guān)系)SST=SSR+SSE總平方和(SST){回歸平方和(SSR)殘差平方和(SSE){{云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院離差平方和的分解
(三個(gè)平方和的關(guān)系)SST=SSR70離差平方和的分解
(三個(gè)平方和的意義)總平方和(SST)反映因變量的n個(gè)觀察值與其均值的總離差回歸平方和(SSR)反映自變量x的變化對(duì)因變量y取值變化的影響,或者說(shuō),是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的平方和殘差平方和(SSE)反映除x以外的其他因素對(duì)y取值的影響,也稱為不可解釋的平方和或剩余平方和云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院離差平方和的分解
(三個(gè)平方和的意義)總平方和(SST)云71可決系數(shù)r2回歸平方和占總離差平方和的比例反映回歸直線的擬合程度取值范圍在[0,1]之間
R21,說(shuō)明回歸方程擬合的越好;R20,說(shuō)明回歸方程擬合的越差判定系數(shù)等于相關(guān)系數(shù)的平方,即R2=r2云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院可決系數(shù)r2回歸平方和占總離差平方和的比例反映回歸直線的擬合72可決系數(shù)r2
(例題分析)
【例7-2】計(jì)算估計(jì)食品支出的恩格爾函數(shù)回歸的可決系數(shù),并解釋其意義
可決系數(shù)的實(shí)際意義是:在食品支出取值的變差中,有88.63%可以由食品支出與家庭收入之間的線性關(guān)系來(lái)解釋,或者說(shuō),在食品支出取值的變動(dòng)中,有88.63%是家庭收入所決定的??梢?jiàn)食品支出與家庭收入之間有較強(qiáng)的線性關(guān)系云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院可決系數(shù)r2(例題分析)
【例7-2】計(jì)算估計(jì)食品支出的73
7.2.3一元線性回歸模型的檢驗(yàn)檢驗(yàn)x與y之間是否具有線性關(guān)系,或者說(shuō),檢驗(yàn)自變量x對(duì)因變量y的影響是否顯著理論基礎(chǔ)是回歸系數(shù)
的抽樣分布在一元線性回歸中,等價(jià)于線性關(guān)系的顯著性檢驗(yàn)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.2.3一元線性回歸模型的檢驗(yàn)檢驗(yàn)x與y之間是否74回歸系數(shù)的檢驗(yàn)
(樣本統(tǒng)計(jì)量的分布)
是根據(jù)最小二乘法求出的樣本統(tǒng)計(jì)量,它有自己的分布的分布具有如下性質(zhì)分布形式:正態(tài)分布數(shù)學(xué)期望:標(biāo)準(zhǔn)差:由于未知,需用其估計(jì)量sy來(lái)代替得到的估計(jì)的標(biāo)準(zhǔn)差云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院回歸系數(shù)的檢驗(yàn)
(樣本統(tǒng)計(jì)量的分布)是根據(jù)最小二75回歸系數(shù)的檢驗(yàn)
(檢驗(yàn)步驟)提出假設(shè)H0:b1=0(沒(méi)有線性關(guān)系)H1:b1
0(有線性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量確定顯著性水平,并進(jìn)行決策t>t,拒絕H0;t<t,不拒絕H0云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院回歸系數(shù)的檢驗(yàn)
(檢驗(yàn)步驟)提出假設(shè)確定顯著性水平,76回歸系數(shù)的檢驗(yàn)
(例題分析)對(duì)例題的回歸系數(shù)進(jìn)行顯著性檢驗(yàn)(=0.05)提出假設(shè)H0:b1=0H1:b1
0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量
t=10.07>t=2.160,拒絕H0,表明食品支出與家庭收入之間有線性關(guān)系云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院回歸系數(shù)的檢驗(yàn)
(例題分析)對(duì)例題的回歸系數(shù)進(jìn)行顯著性檢77
7.2.4一元線性回歸模型的預(yù)測(cè)根據(jù)自變量x的取值估計(jì)或預(yù)測(cè)因變量y的取值估計(jì)或預(yù)測(cè)的類型點(diǎn)估計(jì)y的個(gè)別值的點(diǎn)估計(jì)(或預(yù)測(cè))區(qū)間估計(jì)y的個(gè)別值的預(yù)測(cè)區(qū)間估計(jì)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.2.4一元線性回歸模型的預(yù)測(cè)根據(jù)自變量x的取值估計(jì)78y的個(gè)別值的點(diǎn)預(yù)測(cè)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0
,求出因變量y的一個(gè)個(gè)別值的估計(jì)值,就是個(gè)別值的點(diǎn)估計(jì)例如,如果我們只是想知道家庭收入為200元的那些家庭的食品支出是多少,則屬于個(gè)別值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院y的個(gè)別值的點(diǎn)預(yù)測(cè)利用估計(jì)的回歸方程,對(duì)于自變量x的79區(qū)間預(yù)測(cè)
點(diǎn)估計(jì)不能給出估計(jì)的精度,點(diǎn)估計(jì)值與實(shí)際值之間是有誤差的,因此需要進(jìn)行區(qū)間估計(jì)對(duì)于自變量
x的一個(gè)給定值x0,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)區(qū)間本課程討論的區(qū)間估計(jì)類型預(yù)測(cè)區(qū)間估計(jì)(predictionintervalestimate)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院區(qū)間預(yù)測(cè)點(diǎn)估計(jì)不能給出估計(jì)的精度,點(diǎn)估計(jì)值與實(shí)際值之間是有80預(yù)測(cè)區(qū)間估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0
,求出因變量y的一個(gè)個(gè)別值的估計(jì)區(qū)間,這一區(qū)間稱為預(yù)測(cè)區(qū)間(predictioninterval)
y0在1-置信水平下的預(yù)測(cè)區(qū)間為云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院預(yù)測(cè)區(qū)間估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值81影響區(qū)間寬度的因素置信水平(1-)區(qū)間寬度隨置信水平的增大而增大數(shù)據(jù)的離散程度s區(qū)間寬度隨離散程度的增大而增大3. 樣本容量區(qū)間寬度隨樣本容量的增大而減小4. 用于預(yù)測(cè)的xp與x的差異程度區(qū)間寬度隨xp與x的差異程度的增大而增大云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院影響區(qū)間寬度的因素置信水平(1-)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信82置信區(qū)間、預(yù)測(cè)區(qū)間、回歸方程xpyxx預(yù)測(cè)上限置信上限預(yù)測(cè)下限置信下限云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院置信區(qū)間、預(yù)測(cè)區(qū)間、回歸方程xpyxx預(yù)測(cè)上限置信上限預(yù)測(cè)837.3多元線性回歸分析7.3.1多元線性回歸模型7.3.2多元線性回歸模型的估計(jì)7.3.3多元線性回歸模型的檢驗(yàn)和預(yù)測(cè)云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.3多元線性回歸分析7.3.1多元線性回歸模型云南847.3.1多元回歸模型
一個(gè)因變量與兩個(gè)及兩個(gè)以上自變量的回歸描述因變量y如何依賴于自變量x1,x2,…,xk
和誤差項(xiàng)
的方程,稱為多元回歸模型涉及p個(gè)自變量的多元回歸模型可表示為
b0
,b1,b2
,,bk是參數(shù)
是被稱為誤差項(xiàng)的隨機(jī)變量y是x1,,x2
,,xk
的線性函數(shù)加上誤差項(xiàng)
包含在y里面但不能被k個(gè)自變量的線性關(guān)系所解釋的變異性云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.3.1多元回歸模型
一個(gè)因變量與兩個(gè)及兩個(gè)以上自變量的85多元回歸模型
(基本假定)誤差項(xiàng)ε是一個(gè)期望值為0的隨機(jī)變量,即E()=0對(duì)于自變量x1,x2,…,xp的所有值,的方差2都相同誤差項(xiàng)ε是一個(gè)服從正態(tài)分布的隨機(jī)變量,即ε~N(0,2),且相互獨(dú)立云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院多元回歸模型
(基本假定)誤差項(xiàng)ε是一個(gè)期望值為0的隨機(jī)變86多元樣本回歸函數(shù)(方程)
用樣本統(tǒng)計(jì)量估計(jì)回歸方程中的參數(shù)
時(shí)得到的方程由最小二乘法求得一般形式為是估計(jì)值是y的估計(jì)值云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院多元樣本回歸函數(shù)(方程)
用樣本統(tǒng)計(jì)量877.3.2多元線性回歸模型的估計(jì)使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來(lái)求得
。即求解各回歸參數(shù)的標(biāo)準(zhǔn)方程如下云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.3.2多元線性回歸模型的估計(jì)使因變量的觀察值與估887.3.3多元線性回歸模型的檢驗(yàn)和預(yù)測(cè)回歸方程的擬合優(yōu)度回歸平方和占總平方和的比例計(jì)算公式為3.因變量取值的變差中,能被估計(jì)的多元回歸方程所解釋的比例云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院7.3.3多元線性回歸模型的檢驗(yàn)和預(yù)測(cè)回歸方程的擬合89修正多重可決系數(shù)
用樣本容量n和自變量的個(gè)數(shù)p去修正R2得到計(jì)算公式為避免增加自變量而高估R2意義與R2類似數(shù)值小于R2云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)信息學(xué)院修正多重可決系數(shù)
用樣本容量n和自變量的個(gè)數(shù)p去修正R2得到90顯著性檢驗(yàn)(回歸系數(shù)的檢驗(yàn))提出假設(shè)H0:bi=0(自變量xi
與
因變量y沒(méi)有線性關(guān)系)H1:bi
0(自變量xi
與
因變量y有線性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量t確定顯著性水平,并進(jìn)行決策t>t,拒絕H0;t<t,不拒絕H0
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 印刷服務(wù)合同
- 手破碎機(jī)設(shè)備買賣合同
- 聘用出納合同增加多場(chǎng)景
- 生產(chǎn)車間承包合同協(xié)議
- 機(jī)械工程勞務(wù)分包合同
- 河北化工醫(yī)藥職業(yè)技術(shù)學(xué)院《中學(xué)生物課堂教學(xué)技能訓(xùn)練》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣州華立科技職業(yè)學(xué)院《數(shù)據(jù)挖掘與決策管理》2023-2024學(xué)年第二學(xué)期期末試卷
- 寧波衛(wèi)生職業(yè)技術(shù)學(xué)院《界面化學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 宜春學(xué)院《需求工程》2023-2024學(xué)年第二學(xué)期期末試卷
- 宿州職業(yè)技術(shù)學(xué)院《水質(zhì)工程學(xué)實(shí)驗(yàn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 中國(guó)古代服飾文化135張課件
- 《道德與法治》五下第一單元《我們一家人》教案
- 拔罐技術(shù)操作流程圖
- 真空泵日常操作標(biāo)準(zhǔn)作業(yè)指導(dǎo)書(shū)
- 鋼筋保護(hù)層厚度試驗(yàn)檢測(cè)記錄表
- 南寧市海綿城市規(guī)劃設(shè)計(jì)導(dǎo)則-圖文課件
- 階段1 古代中華文明的起源與奠基-先秦 課時(shí)1 先秦時(shí)期的社會(huì)經(jīng)濟(jì) 課件-2022屆高三歷史一輪復(fù)習(xí)
- 電焊工安全教育培訓(xùn)課件
- 公共關(guān)系理論與實(shí)務(wù)ppt課件(完整版)
- 外研版五年級(jí)下冊(cè)小學(xué)英語(yǔ)全冊(cè)教學(xué)課件PPT
- 中國(guó)石油大學(xué)(華東)-朱超-答辯通用PPT模板
評(píng)論
0/150
提交評(píng)論