版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第七章相關(guān)與回歸分析第一節(jié)變量間的相關(guān)關(guān)系第二節(jié)一元線性回歸第三節(jié)多元線性回歸1第一節(jié)變量間的相關(guān)關(guān)系一.變量相關(guān)的概念二.相關(guān)系數(shù)及其計算2變量相關(guān)的概念3變量間的關(guān)系
(函數(shù)關(guān)系)是一一對應(yīng)的確定關(guān)系設(shè)有兩個變量x和y,變量y隨變量x一起變化,并完全依賴于x
,當(dāng)變量x取某個數(shù)值時,
y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測點落在一條線上
xy4變量間的關(guān)系
(函數(shù)關(guān)系)
函數(shù)關(guān)系的例子某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為y=p
x(p為單價)圓的面積(S)與半徑之間的關(guān)系可表示為S=
R2
企業(yè)的原材料消耗額(y)與產(chǎn)量(x1)
、單位產(chǎn)量消耗(x2)
、原材料價格(x3)之間的關(guān)系可表示為y=x1x2x3
5變量間的關(guān)系
(相關(guān)關(guān)系)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個變量的取值不能由另一個變量唯一確定當(dāng)變量x取某個值時,變量y的取值可能有幾個各觀測點分布在直線周圍
xy6變量間的關(guān)系
(相關(guān)關(guān)系)
相關(guān)關(guān)系的例子商品的消費量(y)與居民收入(x)之間的關(guān)系商品銷售額(y)與廣告費支出(x)之間的關(guān)系糧食畝產(chǎn)量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關(guān)系收入水平(y)與受教育程度(x)之間的關(guān)系父親身高(y)與子女身高(x)之間的關(guān)系7相關(guān)關(guān)系的圖示
不相關(guān)
負(fù)線性相關(guān)
正線性相關(guān)
非線性相關(guān)
完全負(fù)線性相關(guān)完全正線性相關(guān)
8相關(guān)系數(shù)及其計算9相關(guān)關(guān)系的測度
(相關(guān)系數(shù))對變量之間關(guān)系密切程度的度量對兩個變量之間線性相關(guān)程度的度量稱為簡單相關(guān)系數(shù)若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,稱為總體相關(guān)系數(shù),記為
若是根據(jù)樣本數(shù)據(jù)計算的,則稱為樣本相關(guān)系數(shù),記為r10相關(guān)關(guān)系的測度
(相關(guān)系數(shù))
樣本相關(guān)系數(shù)的計算公式或化簡為11相關(guān)關(guān)系的測度
(相關(guān)系數(shù)取值及其意義)
r的取值范圍是[-1,1]|r|=1,為完全相關(guān)r=1,為完全正相關(guān)r=-1,為完全負(fù)正相關(guān)
r=0,不存在線性相關(guān)關(guān)系相關(guān)-1
r<0,為負(fù)相關(guān)0<r
1,為正相關(guān)|r|越趨于1表示關(guān)系越密切;|r|越趨于0表示關(guān)系越不密切12相關(guān)關(guān)系的測度
(相關(guān)系數(shù)取值及其意義)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加13表7-1我國人均國民收入與人均消費金額數(shù)據(jù)單位:元年份人均國民收入人均消費金額年份人均國民收入人均消費金額1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148相關(guān)關(guān)系的測度
(相關(guān)系數(shù)計算例)【例7.1】在研究我國人均消費水平的問題中,把全國人均消費額記為y,把人均國民收入記為x。我們收集到1981~1993年的樣本數(shù)據(jù)(xi
,yi),i=1,2,…,13,數(shù)據(jù)見表7-1,計算相關(guān)系數(shù)。14相關(guān)關(guān)系的測度
(計算結(jié)果)解:根據(jù)樣本相關(guān)系數(shù)的計算公式有人均國民收入與人均消費金額之間的相關(guān)系數(shù)為0.998715第二節(jié)一元線性回歸一.一元線性回歸模型參數(shù)的最小二乘估計回歸方程的顯著性檢驗預(yù)測及應(yīng)用16什么是回歸分析?
從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式對這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計檢驗,并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著.利用所求的關(guān)系式,根據(jù)一個或幾個變量的取值來預(yù)測或控制另一個特定變量的取值,并給出這種預(yù)測或控制的精確程度.17回歸模型的類型一個自變量兩個及兩個以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸18回歸模型與回歸方程19回歸模型回答“變量之間是什么樣的關(guān)系?”方程中運用1個因變量(響應(yīng)變量)、被預(yù)測的變量1個或多個自變量(解釋變量)、用于預(yù)測的變量主要用于預(yù)測和估計20一元線性回歸模型
(概念要點)當(dāng)只涉及一個自變量時稱為一元回歸,若因變量y與自變量x之間為線性關(guān)系時稱為一元線性回歸對于具有線性關(guān)系的兩個變量,可以用一條線性方程來表示它們之間的關(guān)系描述因變量y如何依賴于自變量x和誤差項
的方程稱為回歸模型21一元線性回歸模型
(概念要點)
對于只涉及一個自變量的簡單線性回歸模型可表示為y=b0+b1x+e模型中,y是x的線性函數(shù)(部分)加上誤差項線性部分反映了由于x的變化而引起的y的變化誤差項
是隨機變量反映了除x和y之間的線性關(guān)系之外的隨機因素對y的影響是不能由x和y之間的線性關(guān)系所解釋的變異性
0和
1稱為模型的參數(shù)22一元線性回歸模型
(基本假定)誤差項ε是一個期望值為0的隨機變量,即E(ε)=0。對于一個給定的x值,y的期望值為E(y)=
0+
1x對于所有的x值,ε的方差σ2都相同誤差項ε是一個服從正態(tài)分布的隨機變量,且相互獨立。即ε~N(0,σ2)獨立性意味著對于一個特定的x值,它所對應(yīng)的ε與其他x值所對應(yīng)的ε不相關(guān)對于一個特定的x值,它所對應(yīng)的y值與其他x所對應(yīng)的y值也不相關(guān)23回歸方程
(概念要點)描述y的平均值或期望值如何依賴于x的方程稱為回歸方程簡單線性回歸方程的形式如下E(y)=
0+
1x方程的圖示是一條直線,因此也稱為直線回歸方程
0是回歸直線在y軸上的截距,是當(dāng)x=0時y的期望值
1是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動一個單位時,y的平均變動值24估計(樣本)的回歸方程簡單線性回歸中估計的回歸方程為其中:是估計的回歸直線在y
軸上的截距,是直線的斜率,它表示對于一個給定的x
的值,是y
的估計值,也表示x
每變動一個單位時,y的平均變動值
用樣本統(tǒng)計量和代替回歸方程中的未知參數(shù)和,就得到了估計的回歸方程總體回歸參數(shù)和
是未知的,必需利用樣本數(shù)據(jù)去估計25參數(shù)
0和
1的最小二乘估計26最小二乘法
(概念要點)使因變量的觀察值與估計值之間的離差平方和達(dá)到最小來求得和的方法。即用最小二乘法擬合的直線來代表x與y之間的關(guān)系與實際數(shù)據(jù)的誤差比其他任何直線都小27最小二乘法
(圖示)xy(xn,yn)(x1,y1)
(x2,y2)(xi,yi)}ei=yi-yi^28最小二乘法
(
和的計算公式)
根據(jù)最小二乘法的要求,可得求解和的標(biāo)準(zhǔn)方程如下29估計方程的求法
(實例)
【例】根據(jù)例7.1中的數(shù)據(jù),配合人均消費金額對人均國民收入的回歸方程
根據(jù)和的求解公式得30估計方程人均消費金額對人均國民收入的回歸方程為y=54.22286+0.52638x^31回歸方程的顯著性檢驗32離差平方和的分解因變量y的取值是不同的,y取值的這種波動稱為變差。變差來源于兩個方面由于自變量x的取值不同造成的除x以外的其他因素(如x對y的非線性影響、測量誤差等)的影響對一個具體的觀測值來說,變差的大小可以通過該實際觀測值與其均值之差來表示33離差平方和的分解
(圖示)xyy{}}
離差分解圖34離差平方和的分解
(三個平方和的關(guān)系)2.兩端平方后求和有從圖上看有TSS=RSS+ESS總變差平方和(TSS){回歸平方和(RSS){殘差平方和(ESS){35離差平方和的分解
(三個平方和的意義)總平方和(TSS)反映因變量的n個觀察值與其均值的總離差回歸平方和(RSS)反映自變量x的變化對因變量y取值變化的影響,或者說,是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的平方和殘差平方和(ESS)反映除x以外的其他因素對y取值的影響,也稱為不可解釋的平方和或剩余平方和36樣本決定系數(shù)
(判定系數(shù)r2
)1.回歸平方和占總離差平方和的比例反映回歸直線的擬合程度取值范圍在[0,1]之間
r21,說明回歸方程擬合的越好;r20,說明回歸方程擬合的越差判定系數(shù)等于相關(guān)系數(shù)的平方,即r2=(r)237回歸方程的顯著性檢驗
(線性關(guān)系的檢驗
)1.檢驗自變量和因變量之間的線性關(guān)系是否顯著2.具體方法是將回歸離差平方和(RSS)同剩余離差平方和(ESS)加以比較,應(yīng)用F檢驗來分析二者之間的差別是否顯著如果是顯著的,兩個變量之間存在線性關(guān)系如果不顯著,兩個變量之間不存在線性關(guān)系38回歸方程的顯著性檢驗
(檢驗的步驟)提出假設(shè)H0:線性關(guān)系不顯著2.計算檢驗統(tǒng)計量F確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F
作出決策:若F
F
,拒絕H0;若F<F
,接受H039估計標(biāo)準(zhǔn)誤差Sy實際觀察值與回歸估計值離差平方和的均方根反映實際觀察值在回歸直線周圍的分散狀況從另一個角度說明了回歸直線的擬合程度計算公式為注:上例的計算結(jié)果為14.94967840回歸系數(shù)的顯著性檢驗
(要點)在一元線性回歸中,等價于回歸方程的顯著性檢驗檢驗x與y之間是否具有線性關(guān)系,或者說,檢驗自變量x對因變量y的影響是否顯著理論基礎(chǔ)是回歸系數(shù)
的抽樣分布41回歸系數(shù)的顯著性檢驗
(樣本統(tǒng)計量的分布)
是根據(jù)最小二乘法求出的樣本統(tǒng)計量,它有自己的分布的分布具有如下性質(zhì)分布形式:正態(tài)分布數(shù)學(xué)期望:標(biāo)準(zhǔn)差:由于無未知,需用其估計量Sy來代替得到的估計的標(biāo)準(zhǔn)差42回歸系數(shù)的顯著性檢驗
(樣本統(tǒng)計量的分布)43回歸系數(shù)的顯著性檢驗
(步驟)提出假設(shè)H0:b1=0(沒有線性關(guān)系)H1:b1
0(有線性關(guān)系)計算檢驗的統(tǒng)計量3.確定顯著性水平,并進(jìn)行決策
t>t,拒絕H0;t<t,接受H044回歸系數(shù)的顯著性檢驗
(實例)1.提出假設(shè)H0:b1=0人均收入與人均消費之間無線性關(guān)系H1:b1
0人均收入與人均消費之間有線性關(guān)系2.計算檢驗的統(tǒng)計量
t
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)藥分公司藥品研發(fā)管理規(guī)范
- 校車的應(yīng)急預(yù)案
- 建筑工程工法管理辦法
- IT行業(yè)外包安全管理辦法
- 《Excel數(shù)據(jù)獲取與處理實戰(zhàn)》 課件 第8章 宏和VBA
- 2022年大學(xué)心理學(xué)專業(yè)大學(xué)物理二期中考試試卷-附解析
- 2022年大學(xué)法醫(yī)學(xué)專業(yè)大學(xué)物理下冊期中考試試題-含答案
- 2022年大學(xué)能源動力專業(yè)大學(xué)物理下冊開學(xué)考試試卷D卷-附解析
- 2022年大學(xué)動物醫(yī)學(xué)專業(yè)大學(xué)物理下冊期中考試試卷D卷-含答案
- 腦血管病介入診療護理
- 特大橋雙線矩形空心橋臺施工方案
- 公務(wù)員申論答題標(biāo)準(zhǔn)格子紙版A4打印版
- 骨肉瘤化療臨床路徑
- 第六章休閑體育產(chǎn)業(yè)PPT課件
- 道路水穩(wěn)層施工方案(完整版)
- 匹茲堡睡眠質(zhì)量指數(shù)(psqi)表格
- 5、火災(zāi)事故桌面演練記錄表
- 《甲基化與腫瘤》PPT課件.ppt
- 行政法對憲法實施的作用探討
- BIM等信息技術(shù)的使用
- 西方發(fā)愿文是一篇圓滿的作品它包括了初中后三階段最
評論
0/150
提交評論