《相關(guān)與回歸》PPT課件-(2)_第1頁(yè)
《相關(guān)與回歸》PPT課件-(2)_第2頁(yè)
《相關(guān)與回歸》PPT課件-(2)_第3頁(yè)
《相關(guān)與回歸》PPT課件-(2)_第4頁(yè)
《相關(guān)與回歸》PPT課件-(2)_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第八章 相關(guān)與回歸相關(guān)分析概述相關(guān)關(guān)系的測(cè)定一元線性回歸分析1可編輯ppt第一節(jié) 相關(guān)分析概述一、函數(shù)關(guān)系與相關(guān)關(guān)系正方形面積與邊長(zhǎng);腳長(zhǎng)與智商;銷售收入和消費(fèi)情況;廣告投入與銷售收入;GDP與精神病患者;頭發(fā)長(zhǎng)與見識(shí)短1.函數(shù)關(guān)系: 變量之間存在嚴(yán)格的數(shù)量關(guān)系。2. 相關(guān)關(guān)系: 變量之間存在不確定的依存關(guān)系。2可編輯ppt二、分類1.按相關(guān)關(guān)系涉及的變量多少劃分:?jiǎn)蜗嚓P(guān)、復(fù)相關(guān)、偏相關(guān)。2.按相關(guān)形式劃分:線性相關(guān)和曲線相關(guān)。3.按相關(guān)的方向劃分:正相關(guān)和負(fù)相關(guān)。4.按相關(guān)關(guān)系的程度劃分:完全相關(guān),不完全相關(guān)和不相關(guān)。5.按相關(guān)性質(zhì)分為:真實(shí)相關(guān)和虛假相關(guān)。二、相關(guān)關(guān)系的種類3可編輯ppt相

2、關(guān)分析:研究變量之間相關(guān)方向和相關(guān)密切程度的統(tǒng)計(jì)分析方法。(1)確定現(xiàn)象之間有無相關(guān)關(guān)系,以及相關(guān)關(guān)系的表現(xiàn)形態(tài)(2)確定相關(guān)關(guān)系的密切程度(3)建立合適的數(shù)學(xué)模型(4)測(cè)定估計(jì)值的可靠程度 三、相關(guān)分析的內(nèi)容4可編輯ppt定性分析依據(jù)研究者的理論知識(shí)和實(shí)踐經(jīng)驗(yàn),對(duì)客觀現(xiàn)象之間是否存在相關(guān)關(guān)系,以及何種關(guān)系作出判斷。定量分析在定性分析的基礎(chǔ)上,通過編制相關(guān)表、繪制相關(guān)圖、計(jì)算相關(guān)系數(shù)等方法,來判斷現(xiàn)象之間相關(guān)的方向、形態(tài)及密切程度。第二節(jié) 相關(guān)關(guān)系的測(cè)定5可編輯ppt一、相關(guān)圖:又稱散點(diǎn)圖。將x置于橫軸上,y置于縱軸上,將(x,y)繪于坐標(biāo)圖上。用來反映兩變量之間相關(guān)關(guān)系的圖形。6可編輯ppt

3、二、相關(guān)系數(shù)(一)相關(guān)系數(shù)的定義1、相關(guān)系數(shù):在線性條件下說明兩個(gè)變量之間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)分析指標(biāo)。7可編輯ppt2、相關(guān)系數(shù)r的取值范圍:-1r10|r|1表示存在不同程度線性相關(guān): |r| 0 為正相關(guān),r 0 為負(fù)相關(guān);|r|=0 表示不存在線性關(guān)系;|r|1 表示完全線性相關(guān);(函數(shù)關(guān)系)8可編輯ppt 例:下表是有關(guān)15個(gè)地區(qū)某種食物需求量和地區(qū)人口增加量的資料。9可編輯ppt10可編輯ppt(1)相關(guān)關(guān)系不等于因果關(guān)系;(2)相關(guān)系數(shù)只度量變量間的線性關(guān)系,因此,弱相關(guān)不一定表明變量間沒有關(guān)系;(3)極端值可能影響相關(guān)系數(shù)。(4)警惕虛假相關(guān)3、使用相關(guān)系數(shù)時(shí)應(yīng)注意的問題11

4、可編輯ppt第三節(jié) 一元線性回歸分析回歸分析通過一個(gè)變量x或一些變量(x1,x2,x3)的變化解釋另一變量y的變化。即根據(jù)相關(guān)關(guān)系的數(shù)量表達(dá)式(回歸方程式)與給定的自變量x,揭示因變量y在數(shù)量上的平均變化和求得因變量的預(yù)測(cè)值的統(tǒng)計(jì)分析方法回歸方程回歸模型反映自變量和因變量之間數(shù)學(xué)聯(lián)系的表達(dá)式。某一類回歸方程的總稱。12可編輯ppt1、根據(jù)理論和對(duì)問題的分析判斷, 區(qū)分自變量和因變量; 2、設(shè)法找出適合的數(shù)學(xué)方程式(即 回歸模型)描述變量間的關(guān)系 3、對(duì)回歸模型進(jìn)行統(tǒng)計(jì)檢驗(yàn); 4、統(tǒng)計(jì)檢驗(yàn)通過后,利用回歸模型,根據(jù)解釋變量去估計(jì),預(yù)測(cè) 因變量。 一、回歸分析的內(nèi)容13可編輯ppt一個(gè)自變量?jī)蓚€(gè)及

5、兩個(gè)以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸14可編輯ppt二、一元線性回歸方程樣本一元線性回歸方程:斜率(回歸系數(shù))截距截距a 表示在沒有自變量x的影響時(shí),其它各種因素對(duì)因變量y的平均影響;回歸系數(shù)b 表明自變量x每變動(dòng)一個(gè)單位,因變量y平均變動(dòng)b個(gè)單位。(估計(jì)的回歸方程)15可編輯ppt三、直線回歸方程的求解原理最小二乘法使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來求得 a 和 b 的方法。用最小二乘法擬合的直線來代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小。16可編輯ppt17可編輯ppt例:配合回歸直線18可編輯ppt19可編輯ppt思考題

6、不定向選擇1、圓的面積與半徑之間存在著( )A 相關(guān)關(guān)系 B 因果關(guān)系C 函數(shù)關(guān)系 D比較關(guān)系2、下列現(xiàn)象屬于相關(guān)關(guān)系的有( )A 職工家庭收入不斷增加,消費(fèi)支出也相應(yīng)增加 B 工人文化技術(shù)水平越高,勞動(dòng)效率也越高 C 在電阻一定的電路中,電壓隨電流強(qiáng)度大小而確定 D 農(nóng)作物施肥量增加,產(chǎn)量也隨之增加。3、自變量的值按一定數(shù)量增加時(shí),應(yīng)變量相應(yīng)地按等量增加數(shù)量,反之亦然,那么自變量和應(yīng)變量之間存在著( ) A 正相關(guān)關(guān)系 B 負(fù)相關(guān)關(guān)系 C 直線相關(guān)關(guān)系 D 曲線相關(guān)關(guān)系 E零相關(guān)關(guān)系4、如果兩個(gè)變量之間相關(guān)系數(shù)是1,則兩個(gè)變量是( )A 負(fù)相關(guān)關(guān)系 B 正相關(guān)關(guān)系 C 完全相關(guān)關(guān)系 D 不完

7、全相關(guān)關(guān)系5、如果兩變量將的相關(guān)系數(shù)為-1,說明兩變量間( )A 高度相關(guān)關(guān)系 B 完全相關(guān)關(guān)系 C 低度相關(guān)關(guān)系 D 完全不相關(guān)20可編輯ppt四、一元線性回歸方程的檢驗(yàn)(一) 回歸模型檢驗(yàn)的種類 回歸模型的檢驗(yàn)包括理論意義檢驗(yàn)、回歸方程的檢驗(yàn)和回歸系數(shù)的檢驗(yàn)。21可編輯ppt(二)擬合程度的評(píng)價(jià) 1、擬合程度,是指樣本觀測(cè)值聚集在樣本回歸線周圍的緊密程度。2、判斷回歸模型擬合程度優(yōu)劣最常用的數(shù)量尺度是決定系數(shù)。它是建立在對(duì)總離差平方和進(jìn)行分解的基礎(chǔ)之上的。22可編輯ppt3、離差平方和的分解因變量 y 的取值是不同的,y 取值的這種波動(dòng)稱為變差。變差來源于兩個(gè)方面:由于自變量 x 的取值不

8、同造成的;除 x 以外的其他因素(如x對(duì)y的非線性影響、測(cè)量誤差等)的影響。xyy離差分解圖23可編輯ppt3、離差平方和的分解 (三個(gè)平方和的關(guān)系)2) 兩端平方后求和有1)從圖上看有SST = SSR + SSE總離差平方和(SST)回歸平方和(SSR)殘差平方和(SSE)24可編輯ppt4、決定系數(shù) (r2 )1)回歸平方和占總離差平方和的比例2)反映回歸直線的擬合程度3)取值范圍在 0 , 1 之間4) r2 1,說明回歸方程擬合的越好;r20,說明回歸方程擬合的越差5)判定系數(shù)等于相關(guān)系數(shù)的平方,即r2(r)225可編輯ppt(三)回歸方程的顯著性檢驗(yàn)1、檢驗(yàn)自變量和因變量之間的線性

9、關(guān)系是否顯著具體方法是將回歸離差平方和(SSR)同剩余離差平方和(SSE)加以比較,應(yīng)用F檢驗(yàn)來分析二者之間的差別是否顯著如果是顯著的,兩個(gè)變量之間存在線性關(guān)系如果不顯著,兩個(gè)變量之間不存在線性關(guān)系26可編輯ppt2、檢驗(yàn)的步驟1)提出假設(shè)H0:線性關(guān)系不顯著 2) 計(jì)算檢驗(yàn)統(tǒng)計(jì)量F3)確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F 4)作出決策:若FF ,拒絕H0;若Ft,拒絕H0; tt=2.201,拒絕H0,表明人均收入與人均消費(fèi)之間有線性關(guān)系對(duì)前例的回歸系數(shù)進(jìn)行顯著性檢驗(yàn)(0.05)32可編輯ppt7、Excel輸出的結(jié)果33可編輯ppt五、一元線性回歸方程的預(yù)測(cè)1、

10、根據(jù)自變量 x 的取值估計(jì)或預(yù)測(cè)因變量 y的取值2、估計(jì)或預(yù)測(cè)的類型點(diǎn)估計(jì)y 的平均值的點(diǎn)估計(jì)y 的個(gè)別值的點(diǎn)估計(jì)區(qū)間估計(jì)y 的平均值的置信區(qū)間估計(jì)34可編輯ppt3、置信區(qū)間估計(jì)(1) y 的平均值的置信區(qū)間估計(jì) 利用估計(jì)的回歸方程,對(duì)于自變量 x 的一個(gè)給定值 x0 ,求出因變量 y 的平均值E(y0)的估計(jì)區(qū)間 ,這一估計(jì)區(qū)間稱為置信區(qū)間 (2)E(y0) 在1-置信水平下的置信區(qū)間為式中:Sy為估計(jì)標(biāo)準(zhǔn)誤差35可編輯ppt(3)影響區(qū)間寬度的因素1)置信水平 (1 - )區(qū)間寬度隨置信水平的增大而增大2)數(shù)據(jù)的離散程度 (s)區(qū)間寬度隨離散程度的增大而增大3)樣本容量區(qū)間寬度隨樣本容量

11、的增大而減小4)用于預(yù)測(cè)的 xp與x的差異程度區(qū)間寬度隨 xp與x 的差異程度的增大而增大36可編輯ppt置信區(qū)間、回歸方程xpyxx置信上限置信下限37可編輯ppt第四節(jié) 多元線性相關(guān)與回歸分析一、多元線性回歸模型1、定義:一個(gè)因變量與兩個(gè)及兩個(gè)以上自變量之間的回歸描述因變量 y 如何依賴于自變量 x1 ,x2 , xp 和誤差項(xiàng) 的方程稱為多元線性回歸模型 b0 ,b1,b2 ,bp是參數(shù) 是被稱為誤差項(xiàng)的隨機(jī)變量 y 是x1,,x2 , ,xp 的線性函數(shù)加上誤差項(xiàng) 說明了包含在y里面但不能被p個(gè)自變量的線性關(guān)系所解釋的變異性38可編輯ppt多元線性回歸模型 對(duì)于 n 組實(shí)際觀察數(shù)據(jù)(y

12、i ; xi1,,xi2 , ,xip ),(i=1,2,n),多元線性回歸模型可表示為y1 = b0 + b1 x11+ b2 x12 + bpx1p + e1y2= b0 + b1 x21 + b2 x22 + bpx2p + e2 yn= b0 + b1 xn1 + b2 xn2 + bpxnp + en39可編輯ppt二、參數(shù)的最小二乘法根據(jù)最小二乘法的要求,可得求解各回歸參數(shù) 的標(biāo)準(zhǔn)方程如下使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來求得 。即40可編輯ppt三、顯著性檢驗(yàn) (線性關(guān)系的檢驗(yàn) )1、回歸方程的檢驗(yàn):將回歸離差平方和(SSR)同剩余離差平方和(SSE)加以比較,應(yīng)

13、用 F 檢驗(yàn)來分析二者之間的差別是否顯著如果是顯著的,因變量與自變量之間存在線性關(guān)系如果不顯著,因變量與自變量之間不存在線性關(guān)系2、回歸系數(shù)的檢驗(yàn):對(duì)每一個(gè)自變量都要單獨(dú)進(jìn)行檢驗(yàn),應(yīng)用 t 檢驗(yàn)在多元線性回歸中,回歸方程的顯著性檢驗(yàn)不再等價(jià)于回歸系數(shù)的顯著性檢驗(yàn)。41可編輯ppt第五節(jié)非線性相關(guān)與回歸分析一、非線性函數(shù)形式的確定1、選擇回歸方程的具體形式應(yīng)遵循以下原則:首先,方程形式應(yīng)與有關(guān)實(shí)質(zhì)性科學(xué)的基本理論相一致。其次,方程有較高的擬合程度。最后,方程的數(shù)學(xué)形式要盡可能簡(jiǎn)單。42可編輯ppt二、幾種常見的非線性模型 (一)指數(shù)函數(shù)線性化方法兩端取對(duì)數(shù)得:lny = ln + x令:y =

14、lny,則有y = ln + x基本形式:圖像 43可編輯ppt二、幾種常見的非線性模型 (二)冪函數(shù)線性化方法兩端取對(duì)數(shù)得:lg y = lg + lg x令:y = lgy,x= lg x,則y = lg + x基本形式:圖像0 1 1 = 1-1 0 -1 =-1 44可編輯ppt二、幾種常見的非線性模型 (三)雙曲線函數(shù)線性化方法令:y = 1/y,x= 1/x, 則有y = + x基本形式:圖像 045可編輯ppt二、幾種常見的非線性模型 (四)對(duì)數(shù)函數(shù)線性化方法x= lgx , 則有y = + x基本形式:圖像 0 0 46可編輯ppt幾種常見的非線性模型線性化方法令:y = 1/y,x= e-x, 則有y = + x基本形式:圖像(五) S 型曲線47可編輯ppt三、非線性回歸【例】為研究生產(chǎn)率與廢品率之間的關(guān)系,記錄數(shù)據(jù)如下表。試擬合適當(dāng)?shù)哪P?。廢品率與生產(chǎn)率的關(guān)系生產(chǎn)率(周/單位)x100020003000350040004500

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論