相關(guān)與回歸分析方法介紹課件_第1頁
相關(guān)與回歸分析方法介紹課件_第2頁
相關(guān)與回歸分析方法介紹課件_第3頁
相關(guān)與回歸分析方法介紹課件_第4頁
相關(guān)與回歸分析方法介紹課件_第5頁
已閱讀5頁,還剩147頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第八章相關(guān)與回歸分析

CorrelationRegressionAnalysis章前導(dǎo)語:

1、有其父,必有其子。--------古人和現(xiàn)代人都這么說2、“真的,”公爵夫人說:“火烈鳥和芥末都很刺鼻。那意思是說‘物以類聚’。”“但芥末并不是鳥?!盇lice說。“是的,象往常那樣,”公爵夫人說,“你具有多么清晰的表達方式!”--------《Alice漫游奇境記》12/19/20221第八章相關(guān)與回歸分析

Correlation第八章相關(guān)與回歸分析StatisticsinPractice消費者應(yīng)該留下多少小費?在西方國家餐飲等服務(wù)行業(yè)有一條不成文的規(guī)定,即發(fā)生餐飲等服務(wù)項目消費時,必須給服務(wù)員一定數(shù)額的小費,許多人都聽說小費應(yīng)該是賬單的16%左右,是否真的如此呢?讓我們來考察表8-1,表中的數(shù)據(jù)是經(jīng)過調(diào)查所得的樣本數(shù)據(jù),通過對這幾組數(shù)據(jù)的分析與觀察,我們能發(fā)現(xiàn)兩者之間的數(shù)量關(guān)系。12/19/20222第八章相關(guān)與回歸分析StatisticsinPraStatisticsinPractice問題:1、是否有足夠的證據(jù)斷定:在賬單與小費數(shù)額之間存在某種聯(lián)系?2、如果存在某種聯(lián)系,怎樣使用這種聯(lián)系來確定應(yīng)該留下多少小費?本章的重點就是基于成對出現(xiàn)的樣本數(shù)據(jù)做出一些推論。如上例,我們想要確定賬單與小費數(shù)額之間是否存在某種聯(lián)系,如果存在,我們就想用一個公式來描述它,這樣就能找出人們留小費時遵循的規(guī)則。類似這樣的問題還有很多,如:(1)犯罪率與偷竊率;(2)香煙消費與患癌癥率;(3)個人收入水平與受教育年限;(4)血壓與年齡;(5)父母身高與子女身高;(6)薪金與酒價等等。12/19/20223StatisticsinPractice問題:12/18主要內(nèi)容8.1相關(guān)關(guān)系概述

一、變量間的相互關(guān)系二、相關(guān)關(guān)系的種類三、相關(guān)分析的內(nèi)容及其假定8.2線性相關(guān)關(guān)系的測定

一、相關(guān)圖表二、相關(guān)系數(shù)8.3回歸分析

一、回歸分析概述二、一元線性回歸方程的擬合三、回歸分析的方差分析四、一元線性回歸模型的檢驗五、對回歸分析結(jié)果的評價六、多元線性回歸分析12/19/20224主要內(nèi)容8.1相關(guān)關(guān)系概述12/18/202248.1相關(guān)關(guān)系概述一、變量間的相互關(guān)系(一)函數(shù)關(guān)系定義:完全確定的(數(shù)量)關(guān)系。(1)某一(組)變量與另一變量間存在著一一對應(yīng)的關(guān)系;[例]計件工資(y)與產(chǎn)量(x)y=f(x)=10x;

x0=1件,y0=10元;

x1=2件,y1=20元圓的面積S=ΠR2,R=10,S=100Π(2)表述:y=f(x)。(二)相關(guān)關(guān)系1、定義:不完全確定的關(guān)系。(1)某一(組)變量與另一變量間有關(guān)系,但并非一一對應(yīng);12/19/202258.1相關(guān)關(guān)系概述一、變量間的相互關(guān)系12/18/202一、變量間的相互關(guān)系[例]身高y與體重x;A:x=60kg、y=170m;B:x=60kg、y=1.72m;C:x=60kg、y=1.68m;D:x=60kg、y=1.65m。(2)表述:y=f(x)+。影響身高的因素:體重、遺傳、鍛煉、睡眠質(zhì)量……2、成因(1)某些影響因素尚未被認(rèn)識;(2)雖已認(rèn)識但無法測量;(3)測量誤差。[例]某種水果P元/斤:購買額y=Px購買量

x=2斤

y=2P+=2×1.9+0.23、數(shù)量關(guān)系的形式(1)單一因果關(guān)系;(2)互為因果關(guān)系;(3)伴隨關(guān)系。12/19/20226一、變量間的相互關(guān)系[例]身高y與體重x;12/18/202二、相關(guān)關(guān)系的種類(一)按相關(guān)的程度分1、完全相關(guān):函數(shù)關(guān)系;2、不相關(guān):沒有關(guān)系;3、不完全相關(guān)。(二)按相關(guān)的方向分1、正相關(guān):變量的變動方向一致(同增同減);2、負(fù)相關(guān):變量的變動方向相反(一增一減)。(三)按相關(guān)的形式分1、線性相關(guān);2、非線性相關(guān)。12/19/20227二、相關(guān)關(guān)系的種類(一)按相關(guān)的程度分12/18/20227二、相關(guān)關(guān)系的種類相關(guān)程度密切相關(guān)程度不密切12/19/20228二、相關(guān)關(guān)系的種類相關(guān)程度密切相關(guān)程度不密切12/18/20二、相關(guān)關(guān)系的種類(四)按影響因素的多少分1、單(簡單)相關(guān):只有一個自變量;[例]學(xué)習(xí)成績與學(xué)習(xí)時間;血壓與年齡;畝產(chǎn)量與施肥量。2、復(fù)(多元)相關(guān):兩個或兩個以上的自變量;[例]經(jīng)濟增長與人口增長、科技水平、自然資源、管理水平等之間的關(guān)系;體重與身高、食欲、睡眠時間之間的關(guān)系。3、偏相關(guān):就多個變量測定其中兩個變量的相關(guān)程度而假定其他變量不變。[例]就y=ax1+bx2+,研究y與x1之間的關(guān)系,假定x2不變。12/19/20229二、相關(guān)關(guān)系的種類(四)按影響因素的多少分12/18/202相關(guān)分析要解決的問題變量之間是否存在關(guān)系?如果存在關(guān)系,它們之間是什么樣的關(guān)系?變量之間的關(guān)系強度如何?樣本所反映的變量之間的關(guān)系能否代表總體變量之間的關(guān)系?為解決這些問題,在進行相關(guān)分析時,對總體有以下兩個主要假定兩個變量之間是線性關(guān)系兩個變量都是隨機變量三、相關(guān)分析的內(nèi)容及其假定12/19/202210相關(guān)分析要解決的問題三、相關(guān)分析的內(nèi)容及其假定12/18/28.2線性相關(guān)關(guān)系的測定[目的]測定變量間的相關(guān)方向與密切程度。一、相關(guān)圖表(一)相關(guān)表1、單變量分組相關(guān)表:自變量分組且計算次數(shù),因變量只計算平均數(shù)。12/19/2022118.2線性相關(guān)關(guān)系的測定[目的]測定變量間的相關(guān)方向與密一、相關(guān)圖表2、雙變量分組相關(guān)表:對自變量與因變量均進行分組。注:自變量X軸;因變量Y軸。12/19/202212一、相關(guān)圖表2、雙變量分組相關(guān)表:對自變量與因變量均進行分組正相關(guān)負(fù)相關(guān)曲線相關(guān)不相關(guān)xyxyxyxy又稱散點圖,用直角坐標(biāo)系的x軸代表自變量,y軸代表因變量,將兩個變量間相對應(yīng)的變量值用坐標(biāo)點的形式描繪出來,用以表明相關(guān)點分布狀況的圖形。一、相關(guān)圖表[不足]難以精確反映相關(guān)的密切程度。(二)相關(guān)圖12/19/202213正相關(guān)負(fù)相關(guān)曲線相關(guān)不相關(guān)xyxyxyxy又稱散二、相關(guān)系數(shù)二、(線性)相關(guān)系數(shù)※(一)積差法計算公式——在線性相關(guān)的條件下,用來反映變量之間相關(guān)方向及程度的統(tǒng)計指標(biāo),用r(ρ)表示。12/19/202214二、相關(guān)系數(shù)二、(線性)相關(guān)系數(shù)※——在線性相關(guān)的條件下,用二、相關(guān)系數(shù)[注解1]

協(xié)方差Cov(x,y)的作用1、顯示x與y之間的相關(guān)方向。[正相關(guān)]12/19/202215二、相關(guān)系數(shù)[注解1]協(xié)方差Cov(x,y)的作用[正相關(guān)二、相關(guān)系數(shù)[負(fù)相關(guān)]12/19/202216二、相關(guān)系數(shù)[負(fù)相關(guān)]12/18/202216二、相關(guān)系數(shù)2、顯示x與y之間的相關(guān)程度。[正相關(guān)]12/19/202217二、相關(guān)系數(shù)2、顯示x與y之間的相關(guān)程度。[正相關(guān)]12/1二、相關(guān)系數(shù)[負(fù)相關(guān)]12/19/202218二、相關(guān)系數(shù)[負(fù)相關(guān)]12/18/202218二、相關(guān)系數(shù)[無線性相關(guān)]12/19/202219二、相關(guān)系數(shù)[無線性相關(guān)]12/18/202219二、相關(guān)系數(shù)[歸納]Cov(x,y)的作用第一、顯示x與y之間的相關(guān)方向第二、顯示x與y之間的相關(guān)密切程度12/19/202220二、相關(guān)系數(shù)[歸納]Cov(x,y)的作用第二、顯示x與y二、相關(guān)系數(shù)[注解2]

sx、sy的作用1、使不同變量的協(xié)方差標(biāo)準(zhǔn)化直接對比。12/19/202221二、相關(guān)系數(shù)[注解2]sx、sy的作用12/18/2022二、相關(guān)系數(shù)2、使12/19/202222二、相關(guān)系數(shù)2、使12/18/202222二、相關(guān)系數(shù)(二)積差法相關(guān)系數(shù)的簡捷計算公式12/19/202223二、相關(guān)系數(shù)(二)積差法相關(guān)系數(shù)的簡捷計算公式12/18/2二、相關(guān)系數(shù)[r的簡捷計算公式]12/19/202224二、相關(guān)系數(shù)[r的簡捷計算公式]12/18/202224二、相關(guān)系數(shù)[r的簡捷計算公式]12/19/202225二、相關(guān)系數(shù)[r的簡捷計算公式]12/18/202225二、相關(guān)系數(shù)(三)線性相關(guān)的經(jīng)驗判斷準(zhǔn)則[例]為了解餐飲業(yè)消費數(shù)額與小費之間的數(shù)額關(guān)系,特從若干名消費者中隨機抽取10名消費者進行調(diào)查,所得數(shù)據(jù)如下:12/19/202226二、相關(guān)系數(shù)(三)線性相關(guān)的經(jīng)驗判斷準(zhǔn)則[例]為了解餐飲業(yè)消二、相關(guān)系數(shù)[例]計算過程。12/19/202227二、相關(guān)系數(shù)[例]計算過程。12/18/202227二、相關(guān)系數(shù)[解]答:賬單消費額與小費之間存在著高度的正相關(guān)關(guān)系。12/19/202228二、相關(guān)系數(shù)[解]答:賬單消費額與小費之間存在著高度的正相關(guān)二、相關(guān)系數(shù)問:若令賬單消費額為y,小費為x,則r的取值是否改變?12/19/202229二、相關(guān)系數(shù)問:若令賬單消費額為y,小費為x,則r的取二、相關(guān)系數(shù)(四)樣本相關(guān)系數(shù)的特點1、兩變量均為隨機變量;2、兩變量的地位是平等的rxy=ryx;3、取值范圍[-1,1],其接近于1的程度與樣本容量n有關(guān)。

n小,r1。特例:當(dāng)n=2時,r=1。[例]樣本(x,y)為(6,12.6),(1,3.0),n=2。12/19/202230二、相關(guān)系數(shù)(四)樣本相關(guān)系數(shù)的特點12/18/202230二、相關(guān)系數(shù)(五)關(guān)于相關(guān)的普遍錯誤在解釋關(guān)于相關(guān)的結(jié)果中會出現(xiàn)以下三種普遍的錯誤:1、相關(guān)就一定意味著因果關(guān)系。如:一項研究表明,統(tǒng)計學(xué)教授的薪金與每人的啤酒消費量之間有很強的正相關(guān)關(guān)系,但這兩個變量都受經(jīng)濟形勢(隱藏變量)的影響。2、相關(guān)系數(shù)為0,一定不相關(guān)。3、基于平均數(shù)進行相關(guān)分析與基于個體數(shù)據(jù)進行相關(guān)分析,其相關(guān)程度不一樣。如:一項研究中,關(guān)于個人收入和教育的成對數(shù)據(jù)產(chǎn)生了一個0.4的線性相關(guān)系數(shù),但當(dāng)使用區(qū)域平均時,線性相關(guān)系數(shù)變?yōu)?.7。12/19/202231二、相關(guān)系數(shù)(五)關(guān)于相關(guān)的普遍錯誤12/18/202231二、相關(guān)系數(shù)(六)線性相關(guān)的假設(shè)檢驗(兩種方法)1、提出原假設(shè)與備擇假設(shè)2、給定顯著性水平α3、選擇檢驗方法,構(gòu)建檢驗統(tǒng)計量4、將檢驗統(tǒng)計量與臨界值比較,如檢驗統(tǒng)計量的絕對值大于臨界值,則拒絕原假設(shè),否則,就不拒絕原假設(shè)。

t檢驗法

r檢驗法:用已經(jīng)算好的r作為檢驗統(tǒng)計量,其臨界值可以通過查表得到。

12/19/202232二、相關(guān)系數(shù)(六)線性相關(guān)的假設(shè)檢驗(兩種方法)12/18/二、相關(guān)系數(shù)(六)線性相關(guān)的假設(shè)檢驗(兩種方法)如襲前例:賬單與小費之間的r=0.92,若用t檢驗法:

r檢驗法:N=10,r=0.92,rα=0.632,∵r>rα∴拒絕原假設(shè),則認(rèn)為兩者存在顯著的線性相關(guān)。12/19/202233二、相關(guān)系數(shù)(六)線性相關(guān)的假設(shè)檢驗(兩種方法)12/18/二、相關(guān)系數(shù)一些人相信他們手掌生命線的長度可以用來預(yù)測他們的壽命。M.E.Wilson和L.E.Mather在《美國醫(yī)學(xué)協(xié)會學(xué)報》上發(fā)表的一封信中,通過對尸體的研究對此給予了駁斥。死亡時的年齡與手掌生命線的長度被一起記錄下來。作者得出死亡時的年齡與生命線的長度不存在顯著相關(guān)的結(jié)論。手相術(shù)失傳了,手也就放得下了??词窒啵?2/19/202234二、相關(guān)系數(shù)一些人相信他們手掌生命線的看手相:12/18/8.3

回歸分析一、回歸分析概述(一)概念1、[回顧]線性相關(guān)分析:計算線性相關(guān)系數(shù)r確定兩變量之間的相關(guān)方向與密切程度。[不足]無法表明兩變量之間的因果關(guān)系無法從一個或幾個變量(xi)的變化來推測另一個變量(y)的變化情況。10名用餐顧客消費金額與所付小費數(shù)據(jù)如下:r=0.9212/19/2022358.3回歸分析一、回歸分析概述12/18/202235一、回歸分析概述2、回歸分析:通過一個(些)變量的變化解釋另一變量的變化y=a+bx、y=a+b1x1+bx2

、y=0+1x1+2x2+…+nxn[回歸]英國生物學(xué)家F·Galton首次提出。父輩身高子輩身高

xyy=f(x)+人類的平均身高。

[目的]在于通過X的已知或設(shè)定值,去估計或預(yù)測Y的(總體)均值。變量Y是被預(yù)測或被解釋的變量,稱為因變量(DependentVariable)或被解釋變量(ExplainedVariable)變量X是用來預(yù)測或解釋因變量的變量,稱為自變量(IndependentVariable)或解釋變量(ExplanatoryVariable)12/19/202236一、回歸分析概述2、回歸分析:通過一個(些)變量的變化解釋另一、回歸分析概述(二)回歸分析的種類1、按自變量的多少分(1)簡單(一元)回歸:自變量只有一個。[例]y=a+bx一元回歸方程(2)復(fù)(多元)回歸:自變量為兩個或兩個以上。[例]y=0+1x1+2x2+…+nxn2、按回歸方程式的特征分(1)線性回歸:因變量為自變量的線性函數(shù)。[例]y=a+bx一元線性回歸方程※(2)非線性回歸:因變量為自變量的非線性函數(shù)。[例]12/19/202237一、回歸分析概述(二)回歸分析的種類12/18/2022371.定義:描述因變量y如何依賴于自變量x和誤差項

的方程稱為回歸模型。2.一元線性回歸模型可表示為

y=b0+b1x+ey是x的線性函數(shù)(b0+b1x部分)加上誤差項線性部分反映了由于x的變化而引起的y的變化誤差項

是隨機變量反映除了x和y之間的線性關(guān)系以外的隨機因素對y的影響是不能由x和y之間的線性關(guān)系所解釋的變異性0和1稱為模型的參數(shù)一、回歸分析概述(三)一元線性回歸模型

Ⅰ.回歸模型(regressionmodel)12/19/2022381.定義:描述因變量y如何依賴于自變量x和誤差項3.一元線性回歸模型的基本假定

(1)誤差項ε是一個期望值為0的隨機變量,即E(ε)=0。對于一個給定的x值,y的期望值為E(y)=0+

1x(2)對于所有的x值,ε的方差σ2都相同,即Var(εi)=E(εi2)=2(3)誤差項之間不存在自相關(guān)關(guān)系,其協(xié)方差為0,即Cov(εi,εj)=E(εiεj)=0(ij)(4)誤差項ε是一個服從正態(tài)分布的隨機變量,即ε~N(0,σ2)(5)自變量是給定的變量,與隨機誤差項線性無關(guān)。以上這些基本假設(shè)是德國數(shù)學(xué)家高斯最早提出的,故也稱為高斯假定或經(jīng)典假定。一、回歸分析概述12/19/2022393.一元線性回歸模型的基本假定(1)誤差項ε是一個期望值為Ⅱ.回歸方程(regressionequation)定義:描述因變量y的期望值如何依賴于自變量x的方程,稱為回歸方程一元線性回歸方程的形式如下

E(y)=0+1x方程的圖示是一條直線,也稱為直線回歸方程0是回歸直線在y軸上的截距,是當(dāng)x=0時,y的期望值1是直線的斜率,表示x每變動一個單位時,y的平均變動值一、回歸分析概述12/19/202240Ⅱ.回歸方程(regressionequation)定義Ⅲ.估計的回歸方程(estimatedregressionequation)一元線性回歸中估計的回歸方程為用樣本統(tǒng)計量和代替回歸方程中的未知參數(shù)和,就得到了估計的回歸方程總體回歸參數(shù)和

是未知的,必須利用樣本數(shù)據(jù)去估計其中:是估計的回歸直線在y軸上的截距;是直線的斜率,表示x每變動一個單位時,y的平均變動值

一、回歸分析概述12/19/202241Ⅲ.估計的回歸方程(estimatedregressio一、回歸分析概述(四)回歸分析的步驟1、確定自變量和因變量;[例]糧食產(chǎn)量(y)施肥量(x);消費支出(y)國民收入(x);火災(zāi)損失額(y)火災(zāi)發(fā)生地與最近一個消防站之間的距離(x)。2、確定樣本回歸方程;3、參數(shù)估計與模型檢驗;4、預(yù)測或控制。[例]消費與收入的回歸方程:y=a+bx=200+0.15x已知x,確定y:估計或預(yù)測已知y,確定x:控制12/19/202242一、回歸分析概述(四)回歸分析的步驟12/18/202242相關(guān)分析中x與y對等,回歸分析中x與y要確定自變量和因變量;相關(guān)分析中x、y均為隨機變量,回歸分析中只有y為隨機變量;相關(guān)分析測定相關(guān)程度和方向,回歸分析用回歸模型進行預(yù)測和控制。區(qū)別:一、回歸分析概述(五)回歸分析與相關(guān)分析比較12/19/202243相關(guān)分析中x與y對等,回歸分析中x與y要確定自變量和因變量;理論和方法具有一致性;相關(guān)分析是回歸分析的基礎(chǔ)和前提,無相關(guān)就無回歸,相關(guān)程度越高,回歸越好;回歸分析是相關(guān)分析的繼續(xù)和深化;相關(guān)系數(shù)和回歸系數(shù)方向一致,可以互相推算。聯(lián)系:一、回歸分析概述(五)回歸分析與相關(guān)分析比較12/19/202244理論和方法具有一致性;聯(lián)系:一、回歸分析概述(五)回歸分析與二、一元線性回歸方程的擬合(一)總體回歸方程12/19/202245二、一元線性回歸方程的擬合(一)總體回歸方程12/18/20二、一元線性回歸方程的擬合

Yi/Xi=條件均值+εi

=β0+β1Xi+εi12/19/202246二、一元線性回歸方程的擬合12二、一元線性回歸方程的擬合(二)樣本回歸方程從總體中隨機取樣,獲取一組樣本觀察值。12/19/202247二、一元線性回歸方程的擬合(二)樣本回歸方程12/18/20二、一元線性回歸方程的擬合[圖示]12/19/202248二、一元線性回歸方程的擬合[圖示]12/18/202248二、一元線性回歸方程的擬合(三)樣本回歸方程的擬合方法1、絕對值擬合法2、最小二乘法(OLS法)※基本思路:使殘差平方和最小的直線“最優(yōu)直線”。12/19/202249二、一元線性回歸方程的擬合(三)樣本回歸方程的擬合方法2、最二、一元線性回歸方程的擬合總可以設(shè)法找到一對的取值,使Q為最小值。12/19/202250二、一元線性回歸方程的擬合總可以設(shè)法找到一對二、一元線性回歸方程的擬合將上式代入(2)式,得12/19/202251二、一元線性回歸方程的擬合將上式代入(2)式,得12/18/二、一元線性回歸方程的擬合[計算公式]12/19/202252二、一元線性回歸方程的擬合[計算公式]12/18/20225二、一元線性回歸方程的擬合相關(guān)系數(shù)r與回歸系數(shù)之間的關(guān)系(1)兩者是同向的;(2)r反映變量的相關(guān)方向與密切程度;

反映自變量每變動一個單位時因變量的平均變動量。12/19/202253二、一元線性回歸方程的擬合相關(guān)系數(shù)r與回歸系數(shù)之間的關(guān)系1.線性特征

是的線性函數(shù)

2.無偏特性

3.最小方差特性

在所有的線性無偏估計中,OLS估計具有最小方差

結(jié)論:在經(jīng)典假定條件下,OLS估計量是最佳線性無偏估計量(bestlinearunbiasedestimator,BLUE)。(四)OLS估計量的性質(zhì)(高斯—馬爾柯夫定理)二、一元線性回歸方程的擬合12/19/2022541.線性特征是的線性函數(shù)(四)二、一元線性回歸方程的擬合[例]為研究用餐消費與小費支出的關(guān)系,隨機抽取了10位用餐顧客,得樣本數(shù)據(jù)如下:請擬合小費依消費的直線回歸方程樣本的相關(guān)系數(shù)r=0.9212/19/202255二、一元線性回歸方程的擬合[例]為研究用餐消費與小費支出的關(guān)二、一元線性回歸方程的擬合[例]為研究用餐消費與小費支出的關(guān)系,隨機抽取了10位用餐顧客,得樣本數(shù)據(jù)如下(用Excel軟件生成的折線圖)請擬合樣本回歸方程12/19/202256二、一元線性回歸方程的擬合[例]為研究用餐消費與小費支出的關(guān)二、一元線性回歸方程的擬合解:通過散點圖可近似看出小費與用餐消費之間呈線性關(guān)系,故設(shè)兩者之間關(guān)系為經(jīng)濟意義:餐費每增加100元,小費支出平均增加16.55元。12/19/202257二、一元線性回歸方程的擬合解:通過散點圖可近似看出小費與用餐三、回歸方程的方差分析(一)總離差平方和的分解12/19/202258三、回歸方程的方差分析(一)總離差平方和的分解12/18/2三、回歸方程的方差分析由:12/19/202259三、回歸方程的方差分析由:12/18/202259三、回歸方程的方差分析[離差分析]12/19/202260三、回歸方程的方差分析[離差分析]12/18/202260殘差平方和回歸離差平方和總離差平方和12/19/202261殘差平方和回歸離差平方和總離差平方和12/18/202261三、回歸方程的方差分析(二)判定系數(shù)SSR占SST的比例,用表示;用來衡量回歸方程對y的解釋程度。12/19/202262三、回歸方程的方差分析(二)判定系數(shù)SSR占SST的比例,用三、回歸方程的方差分析[判定系數(shù)的作用]總離差平方和SST回歸平方和SSR殘差平方和SSE來自樣本回歸線來自殘差回歸線上的點與樣本均值離差的平方和判定系數(shù)(coefficientofdetermination)的取值范圍:[0,1],越接近1,說明實際觀測點離樣本線越近,擬合優(yōu)度越高。在給定樣本中,SST不變,如果實際觀測點離樣本回歸線越近,則SSR在SST中占的比重越大,因此回歸直線的擬合優(yōu)度可用下面的判定系數(shù)(可決系數(shù))測度:實際觀測點與回歸線上的點的離差的平方和12/19/202263三、回歸方程的方差分析[判定系數(shù)的作用]總離差回歸平方和殘差三、回歸方程的方差分析(三)判定系數(shù)R2與相關(guān)系數(shù)r的關(guān)系12/19/202264三、回歸方程的方差分析(三)判定系數(shù)R2與相關(guān)系數(shù)r的關(guān)系1判定系數(shù)與相關(guān)系數(shù)的區(qū)別判定系數(shù)無方向性,相關(guān)系數(shù)則有方向,其方向與樣本回歸系數(shù)β1相同;判定系數(shù)說明變量值的總離差平方和中可以用回歸線來解釋的比例,相關(guān)系數(shù)只說明兩變量間關(guān)聯(lián)程度及方向;相關(guān)系數(shù)有夸大變量間相關(guān)程度的傾向,因而判定系數(shù)是更好的度量值。三、回歸方程的方差分析12/19/202265判定系數(shù)與相關(guān)系數(shù)的區(qū)別判定系數(shù)無方向性,相關(guān)系數(shù)則有方向,三、回歸方程的方差分析(四)估計標(biāo)準(zhǔn)誤差1、定義:觀察值與回歸值之間的平均誤差。2、公式12/19/202266三、回歸方程的方差分析(四)估計標(biāo)準(zhǔn)誤差12/18/2022三、回歸方程的方差分析[圖示]12/19/202267三、回歸方程的方差分析[圖示]12/18/202267線性回歸模型的檢驗分二大類:統(tǒng)計檢驗計量經(jīng)濟檢驗從統(tǒng)計學(xué)的角度檢驗所估計的樣本回歸函數(shù)的有效性從基本假設(shè)是否成立這一角度檢驗最小二乘估計法的適用性及其改進擬合優(yōu)度檢驗顯著性檢驗四、一元線性回歸模型的檢驗

本課程只學(xué)習(xí)統(tǒng)計檢驗:

1、擬合優(yōu)度檢驗

擬合優(yōu)度檢驗主要用來檢驗樣本回歸函數(shù)與實際觀測點的“接近”程度,可用判定系數(shù)(或相關(guān)系數(shù)、估計標(biāo)準(zhǔn)誤差)測度。12/19/202268線性回歸模型的檢驗分二大類:統(tǒng)計檢驗計量經(jīng)濟檢驗從(1)線性關(guān)系的檢驗檢驗自變量與因變量之間的線性關(guān)系是否顯著,即各解釋變量前的參數(shù)是否不全為零。如果總體上線性關(guān)系成立,則Y的總離差平方和中,可由該線性回歸函數(shù)解釋的部分(系統(tǒng)性因素)所占比重較大,殘差平方和(隨機性因素)所占比重較小,從而使得回歸平方和與殘差平方和的比值較大。將回歸均方(MSR)同殘差均方(MSE)加以比較,應(yīng)用F檢驗來分析二者之間的差別是否顯著其中,k表示模型中回歸參數(shù)的個數(shù),n為樣本容量。2、顯著性檢驗12/19/202269(1)線性關(guān)系的檢驗檢驗自變量與因變量之間的線性關(guān)系是否顯著線性關(guān)系檢驗的步驟

提出假設(shè)H0:1=0線性關(guān)系不顯著2.

計算檢驗統(tǒng)計量F確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F

作出決策:若F>F

(P<α),拒絕H0;若F<F

(P>α),不拒絕H012/19/202270線性關(guān)系檢驗的步驟提出假設(shè)2.計算檢驗統(tǒng)計量F確定顯(2)回歸系數(shù)的檢驗采用t檢驗在一元線性回歸中,等價于線性關(guān)系的顯著性檢驗理論基礎(chǔ)是回歸系數(shù)

的抽樣分布對各回歸系數(shù)的顯著性檢驗主要是通過樣本考察總體回歸系數(shù)的“可能取值”?;貧w分析中,主要是針對總體參數(shù)是否為某一值(一般設(shè)為零)來檢驗自變量x對因變量y的影響是否顯著的(為什么?)12/19/202271(2)回歸系數(shù)的檢驗采用t檢驗理論基礎(chǔ)是回歸系數(shù)的樣本統(tǒng)計量的抽樣分布

是根據(jù)最小二乘法求出的樣本統(tǒng)計量,它有自己的分布的分布具有如下性質(zhì)分布形式:正態(tài)分布數(shù)學(xué)期望:標(biāo)準(zhǔn)差:由于未知,需用其估計量se來代替,得到的估計標(biāo)準(zhǔn)差12/19/202272樣本統(tǒng)計量的抽樣分布是根據(jù)最小二乘法求出的樣回歸系數(shù)檢驗的步驟提出假設(shè)H0:b1=0(沒有線性關(guān)系)H1:b1

0(有線性關(guān)系)計算檢驗的統(tǒng)計量確定顯著性水平,并進行決策若t>t,則拒絕H0;若t<t,就不拒絕H0用Excel進行相關(guān)和回歸分析12/19/202273回歸系數(shù)檢驗的步驟提出假設(shè)確定顯著性水平,并進行決策用五、對回歸分析結(jié)果的評價建立的模型是否合適?或者說,這個擬合的模型有多“好”?要回答這些問題,可以從以下幾個方面入手:所估計的回歸系數(shù)

的符號是否與理論或事先預(yù)期相一致如果理論上認(rèn)為x與y之間的關(guān)系不僅是正的,而且是統(tǒng)計上顯著的,那么所建立的回歸方程也應(yīng)該如此回歸模型在多大程度上解釋了因變量y取值的差異?可以用判定系數(shù)R2來回答這一問題考察關(guān)于誤差項的正態(tài)性假定是否成立。因為我們在對線性關(guān)系進行F檢驗和回歸系數(shù)進行t檢驗時,都要求誤差項服從正態(tài)分布,否則,我們所用的檢驗程序?qū)⑹菬o效的。正態(tài)性的簡單方法是畫出殘差的直方圖或正態(tài)概率圖12/19/202274五、對回歸分析結(jié)果的評價建立的模型是否合適?或者說,這個擬合六、多元線性回歸分析1、多元線性回歸模型多元線性回歸模型:是指在線性相關(guān)的條件下,研究2個或2個以上自變量與因變量之間的數(shù)量關(guān)系。其模型為:

y=0+1X12X2+…+nXn+ei2、多元線性回歸模型參數(shù)的估計:最小平方法。求解回歸系數(shù)的估計值,通常用統(tǒng)計軟件。其方程用矩陣表示為:█12/19/202275六、多元線性回歸分析1、多元線性回歸模型█12/18/202本章小節(jié)一、變量間關(guān)系的種類;二、相關(guān)系數(shù)的計算、評價及檢驗三、回歸模型、回歸方程、估計回歸方程的概念,回歸方程參數(shù)的最小二乘估計;四、判定系數(shù)、估計標(biāo)準(zhǔn)誤差的計算,及線性關(guān)系檢驗及回歸系數(shù)的檢驗12/19/202276本章小節(jié)一、變量間關(guān)系的種類;12/18/202276

第八章相關(guān)與回歸分析

CorrelationRegressionAnalysis章前導(dǎo)語:

1、有其父,必有其子。--------古人和現(xiàn)代人都這么說2、“真的,”公爵夫人說:“火烈鳥和芥末都很刺鼻。那意思是說‘物以類聚’?!薄暗婺┎⒉皇区B?!盇lice說?!笆堑?,象往常那樣,”公爵夫人說,“你具有多么清晰的表達方式!”--------《Alice漫游奇境記》12/19/202277第八章相關(guān)與回歸分析

Correlation第八章相關(guān)與回歸分析StatisticsinPractice消費者應(yīng)該留下多少小費?在西方國家餐飲等服務(wù)行業(yè)有一條不成文的規(guī)定,即發(fā)生餐飲等服務(wù)項目消費時,必須給服務(wù)員一定數(shù)額的小費,許多人都聽說小費應(yīng)該是賬單的16%左右,是否真的如此呢?讓我們來考察表8-1,表中的數(shù)據(jù)是經(jīng)過調(diào)查所得的樣本數(shù)據(jù),通過對這幾組數(shù)據(jù)的分析與觀察,我們能發(fā)現(xiàn)兩者之間的數(shù)量關(guān)系。12/19/202278第八章相關(guān)與回歸分析StatisticsinPraStatisticsinPractice問題:1、是否有足夠的證據(jù)斷定:在賬單與小費數(shù)額之間存在某種聯(lián)系?2、如果存在某種聯(lián)系,怎樣使用這種聯(lián)系來確定應(yīng)該留下多少小費?本章的重點就是基于成對出現(xiàn)的樣本數(shù)據(jù)做出一些推論。如上例,我們想要確定賬單與小費數(shù)額之間是否存在某種聯(lián)系,如果存在,我們就想用一個公式來描述它,這樣就能找出人們留小費時遵循的規(guī)則。類似這樣的問題還有很多,如:(1)犯罪率與偷竊率;(2)香煙消費與患癌癥率;(3)個人收入水平與受教育年限;(4)血壓與年齡;(5)父母身高與子女身高;(6)薪金與酒價等等。12/19/202279StatisticsinPractice問題:12/18主要內(nèi)容8.1相關(guān)關(guān)系概述

一、變量間的相互關(guān)系二、相關(guān)關(guān)系的種類三、相關(guān)分析的內(nèi)容及其假定8.2線性相關(guān)關(guān)系的測定

一、相關(guān)圖表二、相關(guān)系數(shù)8.3回歸分析

一、回歸分析概述二、一元線性回歸方程的擬合三、回歸分析的方差分析四、一元線性回歸模型的檢驗五、對回歸分析結(jié)果的評價六、多元線性回歸分析12/19/202280主要內(nèi)容8.1相關(guān)關(guān)系概述12/18/202248.1相關(guān)關(guān)系概述一、變量間的相互關(guān)系(一)函數(shù)關(guān)系定義:完全確定的(數(shù)量)關(guān)系。(1)某一(組)變量與另一變量間存在著一一對應(yīng)的關(guān)系;[例]計件工資(y)與產(chǎn)量(x)y=f(x)=10x;

x0=1件,y0=10元;

x1=2件,y1=20元圓的面積S=ΠR2,R=10,S=100Π(2)表述:y=f(x)。(二)相關(guān)關(guān)系1、定義:不完全確定的關(guān)系。(1)某一(組)變量與另一變量間有關(guān)系,但并非一一對應(yīng);12/19/2022818.1相關(guān)關(guān)系概述一、變量間的相互關(guān)系12/18/202一、變量間的相互關(guān)系[例]身高y與體重x;A:x=60kg、y=170m;B:x=60kg、y=1.72m;C:x=60kg、y=1.68m;D:x=60kg、y=1.65m。(2)表述:y=f(x)+。影響身高的因素:體重、遺傳、鍛煉、睡眠質(zhì)量……2、成因(1)某些影響因素尚未被認(rèn)識;(2)雖已認(rèn)識但無法測量;(3)測量誤差。[例]某種水果P元/斤:購買額y=Px購買量

x=2斤

y=2P+=2×1.9+0.23、數(shù)量關(guān)系的形式(1)單一因果關(guān)系;(2)互為因果關(guān)系;(3)伴隨關(guān)系。12/19/202282一、變量間的相互關(guān)系[例]身高y與體重x;12/18/202二、相關(guān)關(guān)系的種類(一)按相關(guān)的程度分1、完全相關(guān):函數(shù)關(guān)系;2、不相關(guān):沒有關(guān)系;3、不完全相關(guān)。(二)按相關(guān)的方向分1、正相關(guān):變量的變動方向一致(同增同減);2、負(fù)相關(guān):變量的變動方向相反(一增一減)。(三)按相關(guān)的形式分1、線性相關(guān);2、非線性相關(guān)。12/19/202283二、相關(guān)關(guān)系的種類(一)按相關(guān)的程度分12/18/20227二、相關(guān)關(guān)系的種類相關(guān)程度密切相關(guān)程度不密切12/19/202284二、相關(guān)關(guān)系的種類相關(guān)程度密切相關(guān)程度不密切12/18/20二、相關(guān)關(guān)系的種類(四)按影響因素的多少分1、單(簡單)相關(guān):只有一個自變量;[例]學(xué)習(xí)成績與學(xué)習(xí)時間;血壓與年齡;畝產(chǎn)量與施肥量。2、復(fù)(多元)相關(guān):兩個或兩個以上的自變量;[例]經(jīng)濟增長與人口增長、科技水平、自然資源、管理水平等之間的關(guān)系;體重與身高、食欲、睡眠時間之間的關(guān)系。3、偏相關(guān):就多個變量測定其中兩個變量的相關(guān)程度而假定其他變量不變。[例]就y=ax1+bx2+,研究y與x1之間的關(guān)系,假定x2不變。12/19/202285二、相關(guān)關(guān)系的種類(四)按影響因素的多少分12/18/202相關(guān)分析要解決的問題變量之間是否存在關(guān)系?如果存在關(guān)系,它們之間是什么樣的關(guān)系?變量之間的關(guān)系強度如何?樣本所反映的變量之間的關(guān)系能否代表總體變量之間的關(guān)系?為解決這些問題,在進行相關(guān)分析時,對總體有以下兩個主要假定兩個變量之間是線性關(guān)系兩個變量都是隨機變量三、相關(guān)分析的內(nèi)容及其假定12/19/202286相關(guān)分析要解決的問題三、相關(guān)分析的內(nèi)容及其假定12/18/28.2線性相關(guān)關(guān)系的測定[目的]測定變量間的相關(guān)方向與密切程度。一、相關(guān)圖表(一)相關(guān)表1、單變量分組相關(guān)表:自變量分組且計算次數(shù),因變量只計算平均數(shù)。12/19/2022878.2線性相關(guān)關(guān)系的測定[目的]測定變量間的相關(guān)方向與密一、相關(guān)圖表2、雙變量分組相關(guān)表:對自變量與因變量均進行分組。注:自變量X軸;因變量Y軸。12/19/202288一、相關(guān)圖表2、雙變量分組相關(guān)表:對自變量與因變量均進行分組正相關(guān)負(fù)相關(guān)曲線相關(guān)不相關(guān)xyxyxyxy又稱散點圖,用直角坐標(biāo)系的x軸代表自變量,y軸代表因變量,將兩個變量間相對應(yīng)的變量值用坐標(biāo)點的形式描繪出來,用以表明相關(guān)點分布狀況的圖形。一、相關(guān)圖表[不足]難以精確反映相關(guān)的密切程度。(二)相關(guān)圖12/19/202289正相關(guān)負(fù)相關(guān)曲線相關(guān)不相關(guān)xyxyxyxy又稱散二、相關(guān)系數(shù)二、(線性)相關(guān)系數(shù)※(一)積差法計算公式——在線性相關(guān)的條件下,用來反映變量之間相關(guān)方向及程度的統(tǒng)計指標(biāo),用r(ρ)表示。12/19/202290二、相關(guān)系數(shù)二、(線性)相關(guān)系數(shù)※——在線性相關(guān)的條件下,用二、相關(guān)系數(shù)[注解1]

協(xié)方差Cov(x,y)的作用1、顯示x與y之間的相關(guān)方向。[正相關(guān)]12/19/202291二、相關(guān)系數(shù)[注解1]協(xié)方差Cov(x,y)的作用[正相關(guān)二、相關(guān)系數(shù)[負(fù)相關(guān)]12/19/202292二、相關(guān)系數(shù)[負(fù)相關(guān)]12/18/202216二、相關(guān)系數(shù)2、顯示x與y之間的相關(guān)程度。[正相關(guān)]12/19/202293二、相關(guān)系數(shù)2、顯示x與y之間的相關(guān)程度。[正相關(guān)]12/1二、相關(guān)系數(shù)[負(fù)相關(guān)]12/19/202294二、相關(guān)系數(shù)[負(fù)相關(guān)]12/18/202218二、相關(guān)系數(shù)[無線性相關(guān)]12/19/202295二、相關(guān)系數(shù)[無線性相關(guān)]12/18/202219二、相關(guān)系數(shù)[歸納]Cov(x,y)的作用第一、顯示x與y之間的相關(guān)方向第二、顯示x與y之間的相關(guān)密切程度12/19/202296二、相關(guān)系數(shù)[歸納]Cov(x,y)的作用第二、顯示x與y二、相關(guān)系數(shù)[注解2]

sx、sy的作用1、使不同變量的協(xié)方差標(biāo)準(zhǔn)化直接對比。12/19/202297二、相關(guān)系數(shù)[注解2]sx、sy的作用12/18/2022二、相關(guān)系數(shù)2、使12/19/202298二、相關(guān)系數(shù)2、使12/18/202222二、相關(guān)系數(shù)(二)積差法相關(guān)系數(shù)的簡捷計算公式12/19/202299二、相關(guān)系數(shù)(二)積差法相關(guān)系數(shù)的簡捷計算公式12/18/2二、相關(guān)系數(shù)[r的簡捷計算公式]12/19/2022100二、相關(guān)系數(shù)[r的簡捷計算公式]12/18/202224二、相關(guān)系數(shù)[r的簡捷計算公式]12/19/2022101二、相關(guān)系數(shù)[r的簡捷計算公式]12/18/202225二、相關(guān)系數(shù)(三)線性相關(guān)的經(jīng)驗判斷準(zhǔn)則[例]為了解餐飲業(yè)消費數(shù)額與小費之間的數(shù)額關(guān)系,特從若干名消費者中隨機抽取10名消費者進行調(diào)查,所得數(shù)據(jù)如下:12/19/2022102二、相關(guān)系數(shù)(三)線性相關(guān)的經(jīng)驗判斷準(zhǔn)則[例]為了解餐飲業(yè)消二、相關(guān)系數(shù)[例]計算過程。12/19/2022103二、相關(guān)系數(shù)[例]計算過程。12/18/202227二、相關(guān)系數(shù)[解]答:賬單消費額與小費之間存在著高度的正相關(guān)關(guān)系。12/19/2022104二、相關(guān)系數(shù)[解]答:賬單消費額與小費之間存在著高度的正相關(guān)二、相關(guān)系數(shù)問:若令賬單消費額為y,小費為x,則r的取值是否改變?12/19/2022105二、相關(guān)系數(shù)問:若令賬單消費額為y,小費為x,則r的取二、相關(guān)系數(shù)(四)樣本相關(guān)系數(shù)的特點1、兩變量均為隨機變量;2、兩變量的地位是平等的rxy=ryx;3、取值范圍[-1,1],其接近于1的程度與樣本容量n有關(guān)。

n小,r1。特例:當(dāng)n=2時,r=1。[例]樣本(x,y)為(6,12.6),(1,3.0),n=2。12/19/2022106二、相關(guān)系數(shù)(四)樣本相關(guān)系數(shù)的特點12/18/202230二、相關(guān)系數(shù)(五)關(guān)于相關(guān)的普遍錯誤在解釋關(guān)于相關(guān)的結(jié)果中會出現(xiàn)以下三種普遍的錯誤:1、相關(guān)就一定意味著因果關(guān)系。如:一項研究表明,統(tǒng)計學(xué)教授的薪金與每人的啤酒消費量之間有很強的正相關(guān)關(guān)系,但這兩個變量都受經(jīng)濟形勢(隱藏變量)的影響。2、相關(guān)系數(shù)為0,一定不相關(guān)。3、基于平均數(shù)進行相關(guān)分析與基于個體數(shù)據(jù)進行相關(guān)分析,其相關(guān)程度不一樣。如:一項研究中,關(guān)于個人收入和教育的成對數(shù)據(jù)產(chǎn)生了一個0.4的線性相關(guān)系數(shù),但當(dāng)使用區(qū)域平均時,線性相關(guān)系數(shù)變?yōu)?.7。12/19/2022107二、相關(guān)系數(shù)(五)關(guān)于相關(guān)的普遍錯誤12/18/202231二、相關(guān)系數(shù)(六)線性相關(guān)的假設(shè)檢驗(兩種方法)1、提出原假設(shè)與備擇假設(shè)2、給定顯著性水平α3、選擇檢驗方法,構(gòu)建檢驗統(tǒng)計量4、將檢驗統(tǒng)計量與臨界值比較,如檢驗統(tǒng)計量的絕對值大于臨界值,則拒絕原假設(shè),否則,就不拒絕原假設(shè)。

t檢驗法

r檢驗法:用已經(jīng)算好的r作為檢驗統(tǒng)計量,其臨界值可以通過查表得到。

12/19/2022108二、相關(guān)系數(shù)(六)線性相關(guān)的假設(shè)檢驗(兩種方法)12/18/二、相關(guān)系數(shù)(六)線性相關(guān)的假設(shè)檢驗(兩種方法)如襲前例:賬單與小費之間的r=0.92,若用t檢驗法:

r檢驗法:N=10,r=0.92,rα=0.632,∵r>rα∴拒絕原假設(shè),則認(rèn)為兩者存在顯著的線性相關(guān)。12/19/2022109二、相關(guān)系數(shù)(六)線性相關(guān)的假設(shè)檢驗(兩種方法)12/18/二、相關(guān)系數(shù)一些人相信他們手掌生命線的長度可以用來預(yù)測他們的壽命。M.E.Wilson和L.E.Mather在《美國醫(yī)學(xué)協(xié)會學(xué)報》上發(fā)表的一封信中,通過對尸體的研究對此給予了駁斥。死亡時的年齡與手掌生命線的長度被一起記錄下來。作者得出死亡時的年齡與生命線的長度不存在顯著相關(guān)的結(jié)論。手相術(shù)失傳了,手也就放得下了??词窒啵?2/19/2022110二、相關(guān)系數(shù)一些人相信他們手掌生命線的看手相:12/18/8.3

回歸分析一、回歸分析概述(一)概念1、[回顧]線性相關(guān)分析:計算線性相關(guān)系數(shù)r確定兩變量之間的相關(guān)方向與密切程度。[不足]無法表明兩變量之間的因果關(guān)系無法從一個或幾個變量(xi)的變化來推測另一個變量(y)的變化情況。10名用餐顧客消費金額與所付小費數(shù)據(jù)如下:r=0.9212/19/20221118.3回歸分析一、回歸分析概述12/18/202235一、回歸分析概述2、回歸分析:通過一個(些)變量的變化解釋另一變量的變化y=a+bx、y=a+b1x1+bx2

、y=0+1x1+2x2+…+nxn[回歸]英國生物學(xué)家F·Galton首次提出。父輩身高子輩身高

xyy=f(x)+人類的平均身高。

[目的]在于通過X的已知或設(shè)定值,去估計或預(yù)測Y的(總體)均值。變量Y是被預(yù)測或被解釋的變量,稱為因變量(DependentVariable)或被解釋變量(ExplainedVariable)變量X是用來預(yù)測或解釋因變量的變量,稱為自變量(IndependentVariable)或解釋變量(ExplanatoryVariable)12/19/2022112一、回歸分析概述2、回歸分析:通過一個(些)變量的變化解釋另一、回歸分析概述(二)回歸分析的種類1、按自變量的多少分(1)簡單(一元)回歸:自變量只有一個。[例]y=a+bx一元回歸方程(2)復(fù)(多元)回歸:自變量為兩個或兩個以上。[例]y=0+1x1+2x2+…+nxn2、按回歸方程式的特征分(1)線性回歸:因變量為自變量的線性函數(shù)。[例]y=a+bx一元線性回歸方程※(2)非線性回歸:因變量為自變量的非線性函數(shù)。[例]12/19/2022113一、回歸分析概述(二)回歸分析的種類12/18/2022371.定義:描述因變量y如何依賴于自變量x和誤差項

的方程稱為回歸模型。2.一元線性回歸模型可表示為

y=b0+b1x+ey是x的線性函數(shù)(b0+b1x部分)加上誤差項線性部分反映了由于x的變化而引起的y的變化誤差項

是隨機變量反映除了x和y之間的線性關(guān)系以外的隨機因素對y的影響是不能由x和y之間的線性關(guān)系所解釋的變異性0和1稱為模型的參數(shù)一、回歸分析概述(三)一元線性回歸模型

Ⅰ.回歸模型(regressionmodel)12/19/20221141.定義:描述因變量y如何依賴于自變量x和誤差項3.一元線性回歸模型的基本假定

(1)誤差項ε是一個期望值為0的隨機變量,即E(ε)=0。對于一個給定的x值,y的期望值為E(y)=0+

1x(2)對于所有的x值,ε的方差σ2都相同,即Var(εi)=E(εi2)=2(3)誤差項之間不存在自相關(guān)關(guān)系,其協(xié)方差為0,即Cov(εi,εj)=E(εiεj)=0(ij)(4)誤差項ε是一個服從正態(tài)分布的隨機變量,即ε~N(0,σ2)(5)自變量是給定的變量,與隨機誤差項線性無關(guān)。以上這些基本假設(shè)是德國數(shù)學(xué)家高斯最早提出的,故也稱為高斯假定或經(jīng)典假定。一、回歸分析概述12/19/20221153.一元線性回歸模型的基本假定(1)誤差項ε是一個期望值為Ⅱ.回歸方程(regressionequation)定義:描述因變量y的期望值如何依賴于自變量x的方程,稱為回歸方程一元線性回歸方程的形式如下

E(y)=0+1x方程的圖示是一條直線,也稱為直線回歸方程0是回歸直線在y軸上的截距,是當(dāng)x=0時,y的期望值1是直線的斜率,表示x每變動一個單位時,y的平均變動值一、回歸分析概述12/19/2022116Ⅱ.回歸方程(regressionequation)定義Ⅲ.估計的回歸方程(estimatedregressionequation)一元線性回歸中估計的回歸方程為用樣本統(tǒng)計量和代替回歸方程中的未知參數(shù)和,就得到了估計的回歸方程總體回歸參數(shù)和

是未知的,必須利用樣本數(shù)據(jù)去估計其中:是估計的回歸直線在y軸上的截距;是直線的斜率,表示x每變動一個單位時,y的平均變動值

一、回歸分析概述12/19/2022117Ⅲ.估計的回歸方程(estimatedregressio一、回歸分析概述(四)回歸分析的步驟1、確定自變量和因變量;[例]糧食產(chǎn)量(y)施肥量(x);消費支出(y)國民收入(x);火災(zāi)損失額(y)火災(zāi)發(fā)生地與最近一個消防站之間的距離(x)。2、確定樣本回歸方程;3、參數(shù)估計與模型檢驗;4、預(yù)測或控制。[例]消費與收入的回歸方程:y=a+bx=200+0.15x已知x,確定y:估計或預(yù)測已知y,確定x:控制12/19/2022118一、回歸分析概述(四)回歸分析的步驟12/18/202242相關(guān)分析中x與y對等,回歸分析中x與y要確定自變量和因變量;相關(guān)分析中x、y均為隨機變量,回歸分析中只有y為隨機變量;相關(guān)分析測定相關(guān)程度和方向,回歸分析用回歸模型進行預(yù)測和控制。區(qū)別:一、回歸分析概述(五)回歸分析與相關(guān)分析比較12/19/2022119相關(guān)分析中x與y對等,回歸分析中x與y要確定自變量和因變量;理論和方法具有一致性;相關(guān)分析是回歸分析的基礎(chǔ)和前提,無相關(guān)就無回歸,相關(guān)程度越高,回歸越好;回歸分析是相關(guān)分析的繼續(xù)和深化;相關(guān)系數(shù)和回歸系數(shù)方向一致,可以互相推算。聯(lián)系:一、回歸分析概述(五)回歸分析與相關(guān)分析比較12/19/2022120理論和方法具有一致性;聯(lián)系:一、回歸分析概述(五)回歸分析與二、一元線性回歸方程的擬合(一)總體回歸方程12/19/2022121二、一元線性回歸方程的擬合(一)總體回歸方程12/18/20二、一元線性回歸方程的擬合

Yi/Xi=條件均值+εi

=β0+β1Xi+εi12/19/2022122二、一元線性回歸方程的擬合12二、一元線性回歸方程的擬合(二)樣本回歸方程從總體中隨機取樣,獲取一組樣本觀察值。12/19/2022123二、一元線性回歸方程的擬合(二)樣本回歸方程12/18/20二、一元線性回歸方程的擬合[圖示]12/19/2022124二、一元線性回歸方程的擬合[圖示]12/18/202248二、一元線性回歸方程的擬合(三)樣本回歸方程的擬合方法1、絕對值擬合法2、最小二乘法(OLS法)※基本思路:使殘差平方和最小的直線“最優(yōu)直線”。12/19/2022125二、一元線性回歸方程的擬合(三)樣本回歸方程的擬合方法2、最二、一元線性回歸方程的擬合總可以設(shè)法找到一對的取值,使Q為最小值。12/19/2022126二、一元線性回歸方程的擬合總可以設(shè)法找到一對二、一元線性回歸方程的擬合將上式代入(2)式,得12/19/2022127二、一元線性回歸方程的擬合將上式代入(2)式,得12/18/二、一元線性回歸方程的擬合[計算公式]12/19/2022128二、一元線性回歸方程的擬合[計算公式]12/18/20225二、一元線性回歸方程的擬合相關(guān)系數(shù)r與回歸系數(shù)之間的關(guān)系(1)兩者是同向的;(2)r反映變量的相關(guān)方向與密切程度;

反映自變量每變動一個單位時因變量的平均變動量。12/19/2022129二、一元線性回歸方程的擬合相關(guān)系數(shù)r與回歸系數(shù)之間的關(guān)系1.線性特征

是的線性函數(shù)

2.無偏特性

3.最小方差特性

在所有的線性無偏估計中,OLS估計具有最小方差

結(jié)論:在經(jīng)典假定條件下,OLS估計量是最佳線性無偏估計量(bestlinearunbiasedestimator,BLUE)。(四)OLS估計量的性質(zhì)(高斯—馬爾柯夫定理)二、一元線性回歸方程的擬合12/19/20221301.線性特征是的線性函數(shù)(四)二、一元線性回歸方程的擬合[例]為研究用餐消費與小費支出的關(guān)系,隨機抽取了10位用餐顧客,得樣本數(shù)據(jù)如下:請擬合小費依消費的直線回歸方程樣本的相關(guān)系數(shù)r=0.9212/19/2022131二、一元線性回歸方程的擬合[例]為研究用餐消費與小費支出的關(guān)二、一元線性回歸方程的擬合[例]為研究用餐消費與小費支出的關(guān)系,隨機抽取了10位用餐顧客,得樣本數(shù)據(jù)如下(用Excel軟件生成的折線圖)請擬合樣本回歸方程12/19/2022132二、一元線性回歸方程的擬合[例]為研究用餐消費與小費支出的關(guān)二、一元線性回歸方程的擬合解:通過散點圖可近似看出小費與用餐消費之間呈線性關(guān)系,故設(shè)兩者之間關(guān)系為經(jīng)濟意義:餐費每增加100元,小費支出平均增加16.55元。12/19/2022133二、一元線性回歸方程的擬合解:通過散點圖可近似看出小費與用餐三、回歸方程的方差分析(一)總離差平方和的分解12/19/2022134三、回歸方程的方差分析(一)總離差平方和的分解12/18/2三、回歸方程的方差分析由:12/19/2022135三、回歸方程的方差分析由:12/18/202259三、回歸方程的方差分析[離差分析]12/19/2022136三、回歸方程的方差分析[離差分析]12/18/202260殘差平方和回歸離差平方和總離差平方和12/19/2022137殘差平方和回歸離差平方和總離差平方和12/18/202261三、回歸方程的方差分析(二)判定系數(shù)SSR占SST的比例,用表示;用來衡量回歸方程對y的解釋程度。12/19/2022138三、回歸方程的方差分析(二)判定系數(shù)SSR占SST的比例,用三、回歸方程的方差分析[判定系數(shù)的作用]總離差平方和SST回歸平方和SSR殘差平方和SSE來自樣本回歸線來自殘差回歸線上的點與樣本均值離差的平方和判定系數(shù)(coefficientofdetermination)的取值范圍:[0,1],越接近1,說明實際觀測點離樣本線越近,擬合優(yōu)度越高。在給定樣本中,SST不變,如果實際觀測點離樣本回歸線越近,則SSR在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論