版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第十章相關(guān)與回歸分析一、基本內(nèi)容第一節(jié)相關(guān)與回歸分析的基本問題
相關(guān)的概念與種類、回歸的概念與種類、相關(guān)分析與回歸分析的區(qū)別和聯(lián)系、相關(guān)分析與回歸分析的作用、相關(guān)分析與回歸分析的步驟第二節(jié)相關(guān)關(guān)系與一元線性回歸分析
相關(guān)系數(shù)測(cè)定,建立一元線性回歸方程,回歸估計(jì)標(biāo)準(zhǔn)差二、學(xué)習(xí)目的與要求通過對(duì)本章的學(xué)習(xí),使同學(xué)們明確相關(guān)與回歸的概念、種類,相關(guān)與回歸分析的作用,掌握直線相關(guān)與簡(jiǎn)單直線回歸分析的原理和計(jì)算方法。三、學(xué)習(xí)重點(diǎn)與難點(diǎn)本章學(xué)習(xí)的重點(diǎn)是直線相關(guān)與簡(jiǎn)單直線回歸分析的計(jì)算,難點(diǎn)是相關(guān)與回歸在計(jì)算上的聯(lián)系。四、授課學(xué)時(shí):4-6個(gè)學(xué)時(shí)
客觀現(xiàn)象總是普遍聯(lián)系和相互依存的??陀^現(xiàn)象之間的數(shù)量聯(lián)系存在著兩種不同的類型:函數(shù)關(guān)系;相關(guān)關(guān)系?,F(xiàn)象的函數(shù)關(guān)系可以用數(shù)學(xué)分析的方法去研究,而研究客觀現(xiàn)象的相關(guān)關(guān)系需用統(tǒng)計(jì)學(xué)中的相關(guān)與回歸分析方法。第一節(jié)相關(guān)與回歸分析
的基本問題一、相關(guān)的概念與種類二、回歸的概念與種類三、相關(guān)分析與回歸分析的區(qū)別與聯(lián)系四、相關(guān)分析與回歸分析的作用五、相關(guān)分析與回歸分析的步驟一、相關(guān)的概念與種類(一)函數(shù)關(guān)系函數(shù)關(guān)系是指現(xiàn)象之間存在嚴(yán)格的依存關(guān)系。(二)相關(guān)關(guān)系相關(guān)關(guān)系是指現(xiàn)象之間存在這非嚴(yán)格、不確定的依存關(guān)系。現(xiàn)象間關(guān)系相關(guān)關(guān)系函數(shù)關(guān)系兩現(xiàn)象間的數(shù)量按照一定規(guī)律一一對(duì)應(yīng)。例如:兩現(xiàn)象間的數(shù)量存在協(xié)變關(guān)系,但卻不是一一對(duì)應(yīng)的。例如:考慮施肥量與產(chǎn)量之間的關(guān)系。相關(guān)分析回歸分析變量間的關(guān)系
(函數(shù)關(guān)系)是一一對(duì)應(yīng)的確定關(guān)系設(shè)有兩個(gè)變量x和y,變量y隨變量x一起變化,并完全依賴于x,當(dāng)變量x取某個(gè)數(shù)值時(shí),
y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測(cè)點(diǎn)落在一條線上xy變量間的關(guān)系
(函數(shù)關(guān)系)函數(shù)關(guān)系的例子某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為y=p
x(p為單價(jià))圓的面積(S)與半徑之間的關(guān)系可表示為S=R2
企業(yè)的原材料消耗額(y)與產(chǎn)量(x1)
、單位產(chǎn)量消耗(x2)
、原材料價(jià)格(x3)之間的關(guān)系可表示為y=x1x2x3
變量間的關(guān)系
(相關(guān)關(guān)系)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個(gè)變量的取值不能由另一個(gè)變量唯一確定當(dāng)變量x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)各觀測(cè)點(diǎn)分布在直線周圍
xy變量間的關(guān)系
(相關(guān)關(guān)系)相關(guān)關(guān)系的例子商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系商品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系糧食畝產(chǎn)量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關(guān)系收入水平(y)與受教育程度(x)之間的關(guān)系父親身高(y)與子女身高(x)之間的關(guān)系(三)相關(guān)關(guān)系種類1按變量的多少,分單相關(guān)和復(fù)相關(guān)2按相關(guān)形式不同,分線性相關(guān)和非線性相關(guān)(曲線相關(guān))3按相關(guān)方向不同,分正相關(guān)和負(fù)相關(guān)4按相關(guān)程度的高低,分完全相關(guān)、不完全相關(guān)和不相關(guān)相關(guān)關(guān)系的圖示不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)在途人數(shù)航程產(chǎn)量零件報(bào)廢率資金占用量施肥量運(yùn)轉(zhuǎn)時(shí)間商品周轉(zhuǎn)速度正直線相關(guān)負(fù)直線相關(guān)指數(shù)曲線相關(guān)拋物線相關(guān)幾種不同的相關(guān)關(guān)系類型二、回歸的概念與種類(一)回歸英國(guó)生物學(xué)家兼統(tǒng)計(jì)學(xué)家高爾頓提出統(tǒng)計(jì)學(xué)上的回歸分析是指根據(jù)大量統(tǒng)計(jì)數(shù)據(jù),找出變量之間在數(shù)量變化方面的規(guī)律。(二)回歸分析的種類一元回歸(簡(jiǎn)單回歸)多元回歸(復(fù)回歸)線性回歸非線性回歸一元線性回歸按自變量的個(gè)數(shù)分⒈按回歸曲線的形態(tài)分⒉三、相關(guān)分析與回歸分析的區(qū)別與聯(lián)系1聯(lián)系:均為研究?jī)蓚€(gè)或兩個(gè)以上變量之間關(guān)系的方法。相關(guān)分析是回歸分析的前提,回歸分析是相關(guān)分析的繼續(xù)。無相關(guān)就無回歸,相關(guān)程度越高,回歸越好;相關(guān)系數(shù)和回歸系數(shù)方向一致。2區(qū)別:相關(guān)分析中x與y對(duì)等,回歸分析中x與y要確定自變量和因變量;相關(guān)分析中x、y均為隨機(jī)變量,回歸分析中只有y為隨機(jī)變量,x為一般變量;相關(guān)分析用于測(cè)定現(xiàn)象相關(guān)程度和方向,回歸分析用回歸模型進(jìn)行預(yù)測(cè)和控制。四、相關(guān)分析與回歸分析的作用
1研究經(jīng)濟(jì)現(xiàn)象之間的相關(guān)形式、相關(guān)方向和密切程度,認(rèn)識(shí)其數(shù)量變化的規(guī)律性。2對(duì)經(jīng)濟(jì)現(xiàn)象進(jìn)行推算和預(yù)測(cè),為科學(xué)地制定經(jīng)濟(jì)政策和管理決策提供科學(xué)依據(jù)。五、相關(guān)分析與回歸分析的步驟1相關(guān)關(guān)系的定性分析2確定回歸方程3計(jì)算相關(guān)系數(shù),對(duì)回歸方程變量之間的相關(guān)性進(jìn)行顯著性檢驗(yàn);4利用回歸方程進(jìn)行推算和預(yù)測(cè);5對(duì)推算和預(yù)測(cè)作出置信區(qū)間估計(jì)第二節(jié)相關(guān)關(guān)系與一元線性回歸分析
判斷現(xiàn)象之間有無相關(guān)關(guān)系時(shí),先據(jù)實(shí)際情況看是否有相關(guān)關(guān)系,若有,在定性分析的基礎(chǔ)上編制相關(guān)表,繪制相關(guān)圖,最后計(jì)算相關(guān)系數(shù)。一、相關(guān)表和相關(guān)圖
相關(guān)表是一種統(tǒng)計(jì)表,它是直接根據(jù)現(xiàn)象之間的原始資料,將一變量的變量值按從小到大(或從大到?。┑捻樞蜻M(jìn)行排列,并將另一變量的值與之對(duì)應(yīng)排列形成的表格。相關(guān)圖又稱散點(diǎn)圖,它是用直角坐標(biāo)系的x軸代表自變量,y軸代表因變量,將兩個(gè)變量間相對(duì)應(yīng)的變量值用坐標(biāo)點(diǎn)的形式描繪出來,用以表明相關(guān)點(diǎn)分布狀況的圖形。10個(gè)大型工業(yè)企業(yè)銷售額(單位:億元)序號(hào)企業(yè)銷售額X利潤(rùn)額Y12345678910華東電力大慶石油華北電力華中電力武鋼上海石化北京燕化齊魯石化寶鋼廣東電力11110290856662585148432522242125131812109合計(jì)716179408090100110506070201510525YX銷售額利潤(rùn)額10個(gè)大型工業(yè)企業(yè)銷售額與利潤(rùn)額散點(diǎn)圖(億元)二、回歸分析概述
指在相關(guān)分析的基礎(chǔ)上,根據(jù)相關(guān)關(guān)系的數(shù)量表達(dá)式(回歸方程式)與給定的自變量x,揭示因變量y在數(shù)量上的平均變化,并求得因變量的預(yù)測(cè)值的統(tǒng)計(jì)分析方法二、一元線性回歸方程的確定對(duì)于經(jīng)判斷具有線性關(guān)系的兩個(gè)變量y與x,構(gòu)造一元線性回歸模型為:E()=0,總體一元線性回歸方程:一元線性回歸方程的幾何意義截距斜率一元線性回歸方程的可能形態(tài)為正為負(fù)為0
我們用樣本觀察值計(jì)算a、b,并用其對(duì)總體線性回歸方程中的參數(shù)α、β做出估計(jì),即求樣本回歸方程,用其對(duì)總體線性回歸方程進(jìn)行估計(jì)。樣本回歸直線方程又稱一元線性回歸方程,其表達(dá)式為:?=a+bx總體一元線性回歸方程:樣本一元線性回歸方程:以樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)斜率(回歸系數(shù))截距(回歸系數(shù))截距a表示在沒有自變量x的影響時(shí),其它各種因素對(duì)因變量y的影響;回歸系數(shù)b表明自變量x每變動(dòng)一個(gè)單位,因變量y變動(dòng)b個(gè)單位。(估計(jì)的回歸方程)(一元線性回歸方程)隨機(jī)干擾:各種偶然因素、觀察誤差和其他被忽視因素的影響X對(duì)y的線性影響而形成的系統(tǒng)部分,反映兩變量的平均變動(dòng)關(guān)系,即本質(zhì)特征。一元線性回歸方程中參數(shù)a、b的確定:最小平方法基本數(shù)學(xué)要求:整理得到由兩個(gè)關(guān)于a、b的二元一次方程組成的方程組:進(jìn)一步整理,有:︽408090100110506070201510525YX銷售額利潤(rùn)額回歸直線10個(gè)大型工業(yè)企業(yè)銷售額與利潤(rùn)額散點(diǎn)圖(億元)10個(gè)大型工業(yè)企業(yè)銷售額回歸分析計(jì)算表(單位:億元)序號(hào)企業(yè)銷售額X利潤(rùn)額YX2XYY212345678910華東電力大慶石油華北電力華中電力武鋼上海石化北京燕化齊魯石化寶鋼廣東電力1111029085666258514843252224212513181210912321104048100722543563844336426012304184927752244216017851650806104461248038762548457644162516932414410081合計(jì)71617956368139433569例題見課本P194-195回歸系數(shù)b與相關(guān)系數(shù)r的關(guān)系:r>0r<0r=0b>0b<0 b=0三、相關(guān)系數(shù)
相關(guān)系數(shù)是用以反映變量之間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)指標(biāo)。將反映兩變量間線性相關(guān)關(guān)系的統(tǒng)計(jì)指標(biāo)稱為線性相關(guān)系數(shù)(簡(jiǎn)稱相關(guān)系數(shù));將反映兩變量間曲線相關(guān)關(guān)系的統(tǒng)計(jì)指標(biāo)稱為非線性相關(guān)系數(shù);將反映多元線性相關(guān)關(guān)系的統(tǒng)計(jì)指標(biāo)稱為復(fù)相關(guān)系數(shù)。我們只介紹線性相關(guān)系數(shù)。簡(jiǎn)化公式XY協(xié)方差X均方差Y均方差相關(guān)系數(shù)的計(jì)算
相關(guān)系數(shù)取值及其意義
r
的取值范圍是[-1,1]|r|=1為完全相關(guān)r=1,為完全正相關(guān)r=-1為完全負(fù)正相關(guān)
r=0不存在線性相關(guān)關(guān)系-1r<0為負(fù)相關(guān)0<r1為正相關(guān)|r|越趨于1表示關(guān)系越密切;|r|越趨于0表示關(guān)系越不密切相關(guān)關(guān)系的測(cè)度
(相關(guān)系數(shù)取值及其意義)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加低度線性相關(guān)
中度線性相關(guān)高度線性相關(guān)10個(gè)大型工業(yè)企業(yè)銷售額相關(guān)系數(shù)計(jì)算表(單位:億元)序號(hào)企業(yè)銷售額X利潤(rùn)額YX2XYY212345678910華東電力大慶石油華北電力華中電力武鋼上海石化北京燕化齊魯石化寶鋼廣東電力1111029085666258514843252224212513181210912321104048100722543563844336426012304184927752244216017851650806104461248038762548457644162516932414410081合計(jì)71617956368139433569
表8-1我國(guó)人均國(guó)民收入與人均消費(fèi)金額數(shù)據(jù)
單位:元年份人均國(guó)民收入人均消費(fèi)金額年份人均國(guó)民收入人均消費(fèi)金額1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148相關(guān)關(guān)系的測(cè)度
(相關(guān)系數(shù)計(jì)算例)【例】在研究我國(guó)人均消費(fèi)水平的問題中,把全國(guó)人均消費(fèi)額記為y,把人均國(guó)民收入記為x。我們收集到1981~1993年的樣本數(shù)據(jù)(xi
,yi),i=1,2,…,13,數(shù)據(jù)見表8-1,計(jì)算相關(guān)系數(shù)。相關(guān)關(guān)系的測(cè)度
(計(jì)算結(jié)果)解:根據(jù)樣本相關(guān)系數(shù)的計(jì)算公式有人均國(guó)民收入與人均消費(fèi)金額之間的相關(guān)系數(shù)為0.9987相關(guān)系數(shù)的顯著性檢驗(yàn)(P196)
檢驗(yàn)的步驟第一步,計(jì)算相關(guān)系數(shù)第二步,根據(jù)回歸方程的自由度(n-2)和給定的顯著性水平值,從相關(guān)系數(shù)臨界值查出臨界值tα/2(n-2)
第三步,判別。如果|t|≥
tα/2(n-2),表明兩變量之間線性相關(guān)關(guān)系顯著,檢驗(yàn)通過;如果|t|<
tα/2(n-2),表明兩變量之間線性相關(guān)關(guān)系不顯著,檢驗(yàn)不通過。
四、估計(jì)標(biāo)準(zhǔn)誤差
估計(jì)標(biāo)準(zhǔn)誤差是因變量各實(shí)際值與其估計(jì)值之間的平均差異程度,表明其估計(jì)值對(duì)各實(shí)際值代表性的強(qiáng)弱;其值越小,回歸方程的代表性越強(qiáng),用回歸方程估計(jì)或預(yù)測(cè)的結(jié)果越準(zhǔn)確??蓮囊环矫娣从郴貧w模型擬合的優(yōu)劣狀況。在大樣本條件下,可用公式計(jì)算:五、擬合程度的評(píng)價(jià)總離差平方和的分解 對(duì)任一實(shí)際觀測(cè)值Yt總有:
對(duì)上式兩邊取平方并求和,得到:
可以證明:
從而有:
即SST=SSR+SSE
上式中,SST是總離差平方和;SSR是由回歸直線可以解釋的那一部分離差平方和,稱為回歸平方和;SSE是用回歸直線無法解釋的離差平方和,稱為殘差平方和。式子兩邊同除以SST,得:顯而易見,各個(gè)樣本觀測(cè)點(diǎn)與樣本回歸直線靠得越緊,SSR在SST中所占的比例就越大。因此,可定義這一比例為決定系數(shù),即有:決定系數(shù)是對(duì)回歸模型擬合程度的綜合度量,決定系數(shù)越大,模型擬合程度越高。決定系數(shù)越小,則模型對(duì)樣本的擬合程度越差。決定系數(shù)r2具有如下特性:1.決定系數(shù)r2具有非負(fù)性。 由決定系數(shù)的定義式可知,r2的分子分母均是不可能為負(fù)值的平方和,因此其比值必大于零。(但是在回歸模型中不包括截距項(xiàng)的場(chǎng)合,由于總離差平方和的分解公式不成立,按該式計(jì)算的r2有可能小于0。)2.決定系數(shù)的取值范圍為0≤r2≤1。3.決定系數(shù)是樣本觀測(cè)值的函數(shù),它也是一個(gè)統(tǒng)計(jì)量。4.在一元線性回歸模型中,決定系數(shù)是單相關(guān)系數(shù)的平方。離差平方和的分解每個(gè)因變量y的實(shí)際值與其平均數(shù)之間存在的離差(y-)的平方和稱為總離差平方和,簡(jiǎn)稱總變差??傋儾罨貧w變差估計(jì)值與平均數(shù)離差的平方和,稱為回歸變差(可解釋變差)。剩余變差每個(gè)觀察值y與估計(jì)值的離差平方和,稱為剩余變差(未解釋變差。剩余平方和回歸平方和總離差平方和SST=SSR+SSE總離差平方和回歸平方和剩余(誤差)平方和判定系數(shù)是指因變量的總變差中可以被自變量解釋部分的比例,即可解釋因素的影響程度。用來說明因變量的變化有多少可通過自變量得到解釋。是衡量擬合模型優(yōu)劣的重要分析指標(biāo)。r2值越大,說明回歸模型擬合得愈優(yōu)。判定系數(shù)與相關(guān)系數(shù)的關(guān)系二者均可測(cè)定兩變量的線性相關(guān)密切程度判定系數(shù)與相關(guān)系數(shù)的區(qū)別:判定系數(shù)無方向性(不能反映負(fù)相關(guān)),相關(guān)系數(shù)則有方向,其方向與樣本回歸系數(shù)b相同(可反映正相關(guān),也可反映負(fù)相關(guān));判定系數(shù)說明變量值的總離差平方和中可以用回歸線來解釋的比例,相關(guān)系數(shù)只說明兩變量間關(guān)聯(lián)程度及方向。估計(jì)標(biāo)準(zhǔn)差越小,則變量間相關(guān)程度越高,回歸線對(duì)Y的解釋程度越高。判定系數(shù)與估計(jì)標(biāo)準(zhǔn)誤差的關(guān)系:五、線性回歸的顯著性檢驗(yàn)及回歸預(yù)測(cè)
在回歸分析中,要檢驗(yàn)因變量Y與自變量X間到底有無真正的線性關(guān)系,可以通過回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))或回歸方程的顯著性檢驗(yàn)(F檢驗(yàn))來判
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版辦公室租賃合同涵蓋物業(yè)能耗管理及節(jié)能減排條款3篇
- 液壓課程設(shè)計(jì)理念
- 2025版航空航天零部件供應(yīng)商協(xié)議3篇
- 二零二五年出口貨運(yùn)代理與全球物流網(wǎng)絡(luò)優(yōu)化合同3篇
- 2025版餐飲行業(yè)財(cái)務(wù)管控與賬務(wù)管理制度合同3篇
- 線上中醫(yī)培訓(xùn)課程設(shè)計(jì)
- 蘇教版四年級(jí)上冊(cè)科學(xué)期末測(cè)試卷13
- 2025年RoHS環(huán)保產(chǎn)品生命周期評(píng)估服務(wù)協(xié)議2篇
- 二零二五年度個(gè)人承包新能源發(fā)電項(xiàng)目合同示范3篇
- 液位計(jì)課程設(shè)計(jì)總結(jié)
- 2024年副班主任工作總結(jié)(3篇)
- 課題申報(bào)書:古滇青銅文化基因圖譜構(gòu)建及活態(tài)深化研究
- 統(tǒng)編版2024-2025學(xué)年第一學(xué)期四年級(jí)語文期末學(xué)業(yè)質(zhì)量監(jiān)測(cè)試卷(含答案)
- 2024年城鄉(xiāng)學(xué)校結(jié)對(duì)幫扶工作總結(jié)范例(3篇)
- 房地產(chǎn)法律風(fēng)險(xiǎn)防范手冊(cè)
- 《監(jiān)考人員培訓(xùn)》課件
- 期末綜合測(cè)試卷(試題)-2024-2025學(xué)年四年級(jí)上冊(cè)數(shù)學(xué)人教版
- 分布式光伏發(fā)電項(xiàng)目計(jì)劃書
- 2024-2025學(xué)年廣東省肇慶鼎湖中學(xué)高三上學(xué)期9月考試英語試題(含答案)
- 黑龍江省哈爾濱市2023-2024學(xué)年七年級(jí)上學(xué)期期末統(tǒng)考學(xué)業(yè)水平調(diào)研測(cè)試語文試卷(解析版)
- DB52T 1776.1-2023 耕地質(zhì)量等別評(píng)價(jià) 第1部分:評(píng)價(jià)規(guī)范
評(píng)論
0/150
提交評(píng)論