數(shù)學:1.1《回歸的基本思想及其初步應用》課件(新人教A版選修1-2)_第1頁
數(shù)學:1.1《回歸的基本思想及其初步應用》課件(新人教A版選修1-2)_第2頁
數(shù)學:1.1《回歸的基本思想及其初步應用》課件(新人教A版選修1-2)_第3頁
數(shù)學:1.1《回歸的基本思想及其初步應用》課件(新人教A版選修1-2)_第4頁
數(shù)學:1.1《回歸的基本思想及其初步應用》課件(新人教A版選修1-2)_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、一、復習回顧:一、復習回顧:1 1、求線性回歸方程、求線性回歸方程2 2、線性相關(guān)關(guān)系強弱的判斷:、線性相關(guān)關(guān)系強弱的判斷:相關(guān)系數(shù)相關(guān)系數(shù)r r例例1:1:從某大學中隨機選取從某大學中隨機選取8 8名女大學生名女大學生, ,其其身高和體重數(shù)據(jù)如下表身高和體重數(shù)據(jù)如下表, ,求根據(jù)女大學生求根據(jù)女大學生的身高預報體重的回歸方程的身高預報體重的回歸方程, ,并預報一名并預報一名身高為身高為172cm172cm的女大學生的體重的女大學生的體重. .線性回歸模型:線性回歸模型: y=0.849x-85.712+ey=0.849x-85.712+e身高、隨機誤差對體重有沒有影響?身高、隨機誤差對體重有

2、沒有影響?y = 0.8485x - 85.712010203040506070150155160165170175180身高體重二、新概念引入:二、新概念引入:n n1 1i i2 2i iT T) )y y( (y yS SS S1 1. .總總偏偏差差平平方方和和計算例計算例1 1中總偏差平方和中總偏差平方和 SSSST T=354=354思考:預報變量(體重)與實際值有偏思考:預報變量(體重)與實際值有偏差即總偏差平方和,這個偏差變化在多差即總偏差平方和,這個偏差變化在多大程度上與解釋變量(身高)有關(guān)?在大程度上與解釋變量(身高)有關(guān)?在多大程度上與隨機變量有關(guān)?多大程度上與隨機變量有

3、關(guān)?y = 0.8485x - 85.712010203040506070150155160165170175180身高體重n n1 1i i2 2i ii iE E) )y y( (y yS SS S作用作用:表示隨機誤差的效應:表示隨機誤差的效應 殘差平方和:殘差平方和:樣本值與回歸值差的平方和樣本值與回歸值差的平方和 2.2.殘差:殘差:樣本值與回歸值差即樣本值與回歸值差即i ii iy yy y例例1 SS1 SSE E=128.361=128.361y = 0.8485x - 85.712010203040506070150155160165170175180身高體重思考:若體重僅受

4、身高的影響,散點圖又如何?思考:若體重僅受身高的影響,散點圖又如何?3.3.回歸平方和回歸平方和:相應回歸值與樣本均值差的:相應回歸值與樣本均值差的平方和,即:平方和,即:n n1 1i i2 2i iR R) )y yy y( (S SS SSSSST T=SS=SSR R+SS+SSE E作用:表示解釋變量的效應作用:表示解釋變量的效應例例1 SS1 SSR R=225.639=225.639即刻畫了預報變量的變化中由解釋變量通過即刻畫了預報變量的變化中由解釋變量通過線性回歸模型所引起的那部分變化程度線性回歸模型所引起的那部分變化程度y = 0.8485x - 85.71201020304

5、0506070150155160165170175180身高體重注:當總偏差平方和相對固定時,殘差平方注:當總偏差平方和相對固定時,殘差平方和越小,則回歸平方和越大,此時模型的擬和越小,則回歸平方和越大,此時模型的擬合效果越好合效果越好 . .SSSST T=SS=SSR R+SS+SSE Ey = 0.8485x - 85.712010203040506070150155160165170175180身高體重4.4.有沒有其他方法來刻劃模型的擬合程度?有沒有其他方法來刻劃模型的擬合程度?相關(guān)指數(shù):相關(guān)指數(shù):n n1 1i i2 2i in n1 1i i2 2i ii i2 2) )y y(

6、y(y) )y y(y(y1 1R R1 1)R R2 2越大,說明殘差平方和越小,回歸平方越大,說明殘差平方和越小,回歸平方和越大,則模型擬合效果越好。和越大,則模型擬合效果越好。2 2)R R2 2表示解釋變量對預報變量變化的貢獻率表示解釋變量對預報變量變化的貢獻率3 3)R R2 211,模型擬合效果越好,表示解釋變量,模型擬合效果越好,表示解釋變量和預報變量的相關(guān)性越強。和預報變量的相關(guān)性越強。例例1 1 相關(guān)指數(shù)相關(guān)指數(shù)R R2 2=0.64,=0.64,說明了什么?說明了什么?解釋變量對總效應約貢獻了解釋變量對總效應約貢獻了64%64%,隨機誤差,隨機誤差貢獻了剩余的貢獻了剩余的3

7、6%36%。4 4)若采用了幾種不同回歸方程進行回歸分)若采用了幾種不同回歸方程進行回歸分析,通過比較析,通過比較R R2 2值作出選擇,即選擇值作出選擇,即選擇R R2 2大的大的模型作為這組數(shù)據(jù)的模型。模型作為這組數(shù)據(jù)的模型。問:有些時候,樣本數(shù)據(jù)中難免混有錯誤問:有些時候,樣本數(shù)據(jù)中難免混有錯誤數(shù)據(jù),通過何種方法把它剔除?數(shù)據(jù),通過何種方法把它剔除?5 5、殘差分析:、殘差分析: 判斷原始數(shù)據(jù)中是否存在可判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù),這方面的工作稱為疑數(shù)據(jù),這方面的工作稱為殘差分析。殘差分析。步驟:步驟:1 1)計算每組數(shù)據(jù)的殘差)計算每組數(shù)據(jù)的殘差2 2)畫殘差圖。縱坐標為殘差,橫坐

8、標為自)畫殘差圖??v坐標為殘差,橫坐標為自變量。變量。3 3)分析殘差圖)分析殘差圖4 4)找異常值)找異常值練:例練:例1 1作出殘差分析作出殘差分析即樣本值減預測值即樣本值減預測值) )y y( (y yi ii i-8-6-4-2024680123456789編號殘差殘差比較均勻地落在帶狀區(qū)域內(nèi),殘差比較均勻地落在帶狀區(qū)域內(nèi),說明選用的模型比較合適。說明選用的模型比較合適。但第但第1 1個點與第個點與第6 6個點殘差較大,需要分析。個點殘差較大,需要分析。-2-20 02 2-4-4 0 05 5-5-5 0 05 5-5-5 0 0-50-50回歸模型合理回歸模型合理回歸模型不是最好回

9、歸模型不是最好回歸模型不是最好回歸模型不是最好回歸模型不是最好回歸模型不是最好例例1 1用身高預測體重要注意的問題:用身高預測體重要注意的問題:(1 1)回歸方程所適用樣本的總體)回歸方程所適用樣本的總體(2 2)回歸方程所適用的時間性)回歸方程所適用的時間性(3 3)回歸方程所適用的范圍)回歸方程所適用的范圍(4 4)回歸方程得到的是預報變量可能?。┗貧w方程得到的是預報變量可能取值的平均值值的平均值據(jù)據(jù)R2大小大?。ㄗ鳉埐畋砘驁D作殘差表或圖)殘差分析殘差分析 據(jù)據(jù) r 的大小判定相關(guān)性的大小判定相關(guān)性應應 用用(解釋變量解釋變量)e ea ab bx xy yn n1 1i in n1 1i

10、 i2 2i i2 2i ii in n1 1i ii i) )y y( (y y) )x x( (x x) )y y( (y y) )x x( (x xr r相關(guān)性判相關(guān)性判定定 公公 式式121()()()niiiniixxyyxxb bin n2 2i i2 2i i 1 1n n2 2i ii i 1 1( ( y yy y ) )R R1 1( ( y yy y ) )殘差分析殘差分析公式公式例例1 1 小結(jié)小結(jié)建立回歸模型的步驟:建立回歸模型的步驟:(1 1)明確研究對象,設(shè)好變量)明確研究對象,設(shè)好變量(2 2)畫出散點圖)畫出散點圖(3 3)選定回歸方程類型)選定回歸方程類型(

11、4 4)求回歸方程中的參數(shù))求回歸方程中的參數(shù)(5 5)作殘差圖,進行殘差分析)作殘差圖,進行殘差分析例例2 2 關(guān)于關(guān)于x x與與y y有如下數(shù)據(jù):有如下數(shù)據(jù): 為了對為了對x x、y y兩個變量進行統(tǒng)計分析,現(xiàn)有以兩個變量進行統(tǒng)計分析,現(xiàn)有以下兩種線性模型:下兩種線性模型:y=6.5x+17.5y=6.5x+17.5,y=7x+17y=7x+17,試比較哪一個模型擬合的效果更好試比較哪一個模型擬合的效果更好. . 1 1)總偏差平方和)總偏差平方和= =回歸平方和回歸平方和+ +殘差平方和殘差平方和2 2)判斷兩個模型擬合程度:相關(guān)指數(shù))判斷兩個模型擬合程度:相關(guān)指數(shù)R R2 23 3)如

12、何進行殘差分析?)如何進行殘差分析?4 4)求回歸模型的步驟。)求回歸模型的步驟。小結(jié)小結(jié)例例1 從某大學中隨機選取從某大學中隨機選取8名女大學生,其身高和體重數(shù)據(jù)如表名女大學生,其身高和體重數(shù)據(jù)如表1-1所示。所示。求根據(jù)一名女大學生的身高預報她的體重的回歸方程,并預報一名身高為求根據(jù)一名女大學生的身高預報她的體重的回歸方程,并預報一名身高為172cm的女大學生的體重。的女大學生的體重。案例案例1:女大學生的身高與體重:女大學生的身高與體重解:解:1、選取身高為自變量、選取身高為自變量x,體重為因變量,體重為因變量y,作散點圖:,作散點圖:2、由散點圖知道身高和體重有比較好的、由散點圖知道身

13、高和體重有比較好的線性相關(guān)關(guān)系,因此可以用線性回歸方程線性相關(guān)關(guān)系,因此可以用線性回歸方程刻畫它們之間的關(guān)系??坍嬎鼈冎g的關(guān)系。3、從散點圖還看到,樣本點散布在某一條、從散點圖還看到,樣本點散布在某一條直線的附近,而不是在一條直線上,所以直線的附近,而不是在一條直線上,所以不能用一次函數(shù)不能用一次函數(shù)y=bx+a描述它們關(guān)系。描述它們關(guān)系。 我們可以用下面的我們可以用下面的線性回歸模型線性回歸模型來表示:來表示:y=bx+a+e,其中,其中a和和b為模型的未知參數(shù),為模型的未知參數(shù),e稱為隨機誤差稱為隨機誤差。思考思考P3產(chǎn)生隨機誤差項產(chǎn)生隨機誤差項e的原因是什么?的原因是什么?思考思考P3

14、產(chǎn)生隨機誤差項產(chǎn)生隨機誤差項e的原因是什么?的原因是什么?隨機誤差隨機誤差e e的來源的來源( (可以推廣到一般):可以推廣到一般):1、其它因素的影響:影響身高 y 的因素不只是體重 x,可能 還包括遺傳基因、飲食習慣、生長環(huán)境等因素;2、用線性回歸模型近似真實模型所引起的誤差;3、身高 y 的觀測誤差。函數(shù)模型與回歸模型之間的差別函數(shù)模型與回歸模型之間的差別函數(shù)模型:abxy回歸模型:eabxy可以提供選擇模型的準則函數(shù)模型與回歸模型之間的差別函數(shù)模型與回歸模型之間的差別函數(shù)模型:abxy回歸模型:eabxy 線性回歸模型線性回歸模型y=bx+a+e增加了隨機誤差項增加了隨機誤差項e,因變

15、量,因變量y的值由自變量的值由自變量x和和隨機誤差項隨機誤差項e共同確定,即共同確定,即自變量自變量x只能解析部分只能解析部分y的變化的變化。 在統(tǒng)計中,我們也把自變量在統(tǒng)計中,我們也把自變量x稱為解析變量,因變量稱為解析變量,因變量y稱為預報變量。稱為預報變量。例例1 從某大學中隨機選取從某大學中隨機選取8名女大學生,其身高和體重數(shù)據(jù)如表名女大學生,其身高和體重數(shù)據(jù)如表1-1所示。所示。求根據(jù)一名女大學生的身高預報她的體重的回歸方程,并預報一名身高為求根據(jù)一名女大學生的身高預報她的體重的回歸方程,并預報一名身高為172cm的女大學生的體重。的女大學生的體重。案例案例1:女大學生的身高與體重:

16、女大學生的身高與體重解:解:1、選取身高為自變量、選取身高為自變量x,體重為因變量,體重為因變量y,作散點圖:,作散點圖:2、由散點圖知道身高和體重有比較好的、由散點圖知道身高和體重有比較好的線性相關(guān)關(guān)系,因此可以用線性回歸方程線性相關(guān)關(guān)系,因此可以用線性回歸方程刻畫它們之間的關(guān)系??坍嬎鼈冎g的關(guān)系。3、從散點圖還看到,樣本點散布在某一條、從散點圖還看到,樣本點散布在某一條直線的附近,而不是在一條直線上,所以直線的附近,而不是在一條直線上,所以不能用一次函數(shù)不能用一次函數(shù)y=bx+a描述它們關(guān)系。描述它們關(guān)系。 我們可以用下面的我們可以用下面的線性回歸模型線性回歸模型來表示:來表示:y=bx

17、+a+e,其中,其中a和和b為模型的未知參數(shù),為模型的未知參數(shù),e稱為隨機誤差稱為隨機誤差。例例1 從某大學中隨機選取從某大學中隨機選取8名女大學生,其身高和體重數(shù)據(jù)如表名女大學生,其身高和體重數(shù)據(jù)如表1-1所示。所示。5943616454505748體重/kg170155165175170157165165身高/cm87654321編號求根據(jù)一名女大學生的身高預報她的體重的回歸方程,并預報一名身高為求根據(jù)一名女大學生的身高預報她的體重的回歸方程,并預報一名身高為172cm的女大學生的體重。的女大學生的體重。根據(jù)最小二乘法估計 和 就是未知參數(shù)a和b的最好估計,ab制表xi2xi yiyixi

18、7 8 合計654321i2iiixyxx ynni=1i=1 , , , .例例1 從某大學中隨機選取從某大學中隨機選取8名女大學生,其身高和體重數(shù)據(jù)如表名女大學生,其身高和體重數(shù)據(jù)如表1-1所示。所示。5943616454505748體重/kg170155165175170157165165身高/cm87654321編號求根據(jù)一名女大學生的身高預報她的體重的回歸方程,并預報一名身高為求根據(jù)一名女大學生的身高預報她的體重的回歸方程,并預報一名身高為172cm的女大學生的體重。的女大學生的體重。根據(jù)最小二乘法估計 和 就是未知參數(shù)a和b的最好估計,ab于是有b=12210.849niiinii

19、x ynx yxnx85.712aybx 所以回歸方程是0.84985.712yx所以,對于身高為所以,對于身高為172cm的女大學生,由回歸方程可以預報其體重為的女大學生,由回歸方程可以預報其體重為 0.849 7285.71260.316()ykg( , )x y 稱為樣本點的中心探究探究P4:身高為身高為172cm的女大學生的體重一定是的女大學生的體重一定是60.316kg嗎?嗎?如果不是,你能解析一下原因嗎?如果不是,你能解析一下原因嗎?探究探究P4:身高為身高為172cm的女大學生的體重一定是的女大學生的體重一定是60.316kg嗎?嗎?如果不是,你能解析一下原因嗎?如果不是,你能解

20、析一下原因嗎?答:身高為答:身高為172cm的女大學生的體重不一定是的女大學生的體重不一定是60.316kg, 但一般可以認為她的體重在但一般可以認為她的體重在60.316kg左右。左右。函數(shù)模型與回歸模型之間的差別函數(shù)模型與回歸模型之間的差別函數(shù)模型:abxy回歸模型:eabxy如何描述兩個變量之間線性相關(guān)關(guān)系的強弱?如何描述兩個變量之間線性相關(guān)關(guān)系的強弱? 在數(shù)學3中,我們學習了用相關(guān)系數(shù)r來衡量兩個變量之間線性相關(guān)關(guān)系的方法。相關(guān)系數(shù)相關(guān)系數(shù)r12211()().()()niiinniiiixxyyxxyy0.751, 1, 0.75, 0 25,0.25,rrr 當, 表明兩個變量正相

21、關(guān)很強;當表明兩個變量負相關(guān)很強;當.表明兩個變量相關(guān)性較弱。相關(guān)關(guān)系的測度相關(guān)關(guān)系的測度(相關(guān)系數(shù)取值及其意義)對回歸模型進行統(tǒng)計檢驗對回歸模型進行統(tǒng)計檢驗思考思考P6:如何刻畫預報變量(體重)的變化?這個變化在多大程度上如何刻畫預報變量(體重)的變化?這個變化在多大程度上與解析變量(身高)有關(guān)?在多大程度上與隨機誤差有關(guān)?與解析變量(身高)有關(guān)?在多大程度上與隨機誤差有關(guān)? 假設(shè)身高和隨機誤差的不同不會對體重產(chǎn)生任何影響,那么所有人的體重將相假設(shè)身高和隨機誤差的不同不會對體重產(chǎn)生任何影響,那么所有人的體重將相同。同。在體重不受任何變量影響的假設(shè)下,設(shè)在體重不受任何變量影響的假設(shè)下,設(shè)8名女

22、大學生的體重都是她們的平均值,名女大學生的體重都是她們的平均值,即即8個人的體重都為個人的體重都為54.5kg。54.554.554.554.554.554.554.554.5體重/kg170155165175170157165165身高/cm87654321編號54.5kg在散點圖中,所有的點應該落在同一條在散點圖中,所有的點應該落在同一條水平直線上,但是觀測到的數(shù)據(jù)并非如水平直線上,但是觀測到的數(shù)據(jù)并非如此。此。這就意味著這就意味著預報變量(體重)的值預報變量(體重)的值受解析變量(身高)或隨機誤差的影響受解析變量(身高)或隨機誤差的影響。5943616454505748體重/kg1701

23、55165175170157165165身高/cm87654321編號 例如,編號為例如,編號為6的女大學生的體重并沒有落在水平直線上,她的體重為的女大學生的體重并沒有落在水平直線上,她的體重為61kg。解析。解析變量(身高)和隨機誤差共同把這名學生的體重從變量(身高)和隨機誤差共同把這名學生的體重從54.5kg“推推”到了到了61kg,相差,相差6.5kg,所以所以6.5kg是解析變量和隨機誤差的是解析變量和隨機誤差的組合效應組合效應。 編號為編號為3的女大學生的體重并也沒有落在水平直線上,她的體重為的女大學生的體重并也沒有落在水平直線上,她的體重為50kg。解析。解析變量(身高)和隨機誤差

24、共同把這名學生的體重從變量(身高)和隨機誤差共同把這名學生的體重從50kg“推推”到了到了54.5kg,相差,相差-4.5kg,這時解析變量和隨機誤差的組合效應為這時解析變量和隨機誤差的組合效應為-4.5kg。用這種方法可以對所有預報變量計算組合效應。用這種方法可以對所有預報變量計算組合效應。數(shù)學上,把每個效應(觀測值減去總的平均值)的平方加起來,即用數(shù)學上,把每個效應(觀測值減去總的平均值)的平方加起來,即用21()niiyy表示總的效應,稱為表示總的效應,稱為總偏差平方和總偏差平方和。在例在例1中,總偏差平方和為中,總偏差平方和為354。5943616454505748體重/kg17015

25、5165175170157165165身高/cm87654321編號 那么,在這個總的效應(總偏差平方和)中,有多少來自于解析變量(身高)?那么,在這個總的效應(總偏差平方和)中,有多少來自于解析變量(身高)?有多少來自于隨機誤差?有多少來自于隨機誤差? 假設(shè)隨機誤差對體重沒有影響,也就是說,體重僅受身高的影響,那么散點圖中所有的點將完全落在回歸直線上。但是,在圖中,數(shù)據(jù)點并沒有完全落在回歸直線上。這些點散布在回歸直線附近,所以一定是隨機誤差把這些點從回歸直線上這些點散布在回歸直線附近,所以一定是隨機誤差把這些點從回歸直線上“推推”開了開了。在例在例1中,殘差平方和約為中,殘差平方和約為128

26、.361。 因此,數(shù)據(jù)點和它在回歸直線上相應位置的差異因此,數(shù)據(jù)點和它在回歸直線上相應位置的差異 是隨機誤差的效應,是隨機誤差的效應,稱稱 為為殘差殘差。)iiyy(iiieyy=例如,編號為例如,編號為6的女大學生,計算隨機誤差的效應(殘差)為:的女大學生,計算隨機誤差的效應(殘差)為:61(0.849 16585.712)6.627對每名女大學生計算這個差異,然后分別將所得的值平方后加起來,用數(shù)學符號對每名女大學生計算這個差異,然后分別將所得的值平方后加起來,用數(shù)學符號21()niiiyy稱為稱為殘差平方和殘差平方和,它代表了隨機誤差的效應。它代表了隨機誤差的效應。表示為:表示為: 由于解

27、析變量和隨機誤差的總效應(總偏差平方和)為由于解析變量和隨機誤差的總效應(總偏差平方和)為354,而隨機誤差的效應為,而隨機誤差的效應為128.361,所以解析變量的效應為,所以解析變量的效應為解析變量和隨機誤差的總效應(總偏差平方和)解析變量和隨機誤差的總效應(總偏差平方和) =解析變量的效應(回歸平方和)解析變量的效應(回歸平方和)+隨機誤差的效應(殘差平方和)隨機誤差的效應(殘差平方和)354-128.361=225.639 這個值稱為這個值稱為回歸平方和?;貧w平方和。我們可以用我們可以用相關(guān)指數(shù)相關(guān)指數(shù)R2來刻畫回歸的效果,其計算公式是來刻畫回歸的效果,其計算公式是22121()11(

28、)niiiniiyyRyy 殘差平方和。總偏差平方和2221121()()()nniiiiiniiyyyyRyy總偏差平方和殘差平方和回歸平方和總偏差平方和總偏差平方和離差平方和的分解離差平方和的分解 (三個平方和的意義)總偏差平方和總偏差平方和(SST)q反映因變量的反映因變量的 n 個觀察值與其均值的總離差個觀察值與其均值的總離差回歸平方和回歸平方和(SSR)q反映自變量反映自變量 x 的變化對因變量的變化對因變量 y 取值變化的影響,取值變化的影響,或者說,是由于或者說,是由于 x 與與 y 之間的線性關(guān)系引起的之間的線性關(guān)系引起的 y 的的取值變化,也稱為可解釋的平方和取值變化,也稱為

29、可解釋的平方和殘差平方和殘差平方和(SSE)q反映除反映除 x 以外的其他因素對以外的其他因素對 y 取值的影響,也稱為取值的影響,也稱為不可解釋的平方和或剩余平方和不可解釋的平方和或剩余平方和樣本決定系數(shù)樣本決定系數(shù) (判定系數(shù) r2 )回歸平方和占總離差平方和的比例niiniiniiniiyyyyyyyySSTSSRr1212121221我們可以用我們可以用相關(guān)指數(shù)相關(guān)指數(shù)R2來刻畫回歸的效果,其計算公式是來刻畫回歸的效果,其計算公式是22121()11()niiiniiyyRyy 殘差平方和。總偏差平方和顯然,顯然,R2的值越大,說明殘差平方和越小,也就是說模型擬合效果越好。的值越大,說

30、明殘差平方和越小,也就是說模型擬合效果越好。在線性回歸模型中,在線性回歸模型中,R2表示解析變量對預報變量變化的貢獻率表示解析變量對預報變量變化的貢獻率。 R2越接近1,表示回歸的效果越好(因為R2越接近1,表示解析變量和預報變量的線性相關(guān)性越強)。 如果某組數(shù)據(jù)可能采取幾種不同回歸方程進行回歸分析,則可以通過比較如果某組數(shù)據(jù)可能采取幾種不同回歸方程進行回歸分析,則可以通過比較R2的值的值來做出選擇,即來做出選擇,即選取選取R2較大的模型作為這組數(shù)據(jù)的模型較大的模型作為這組數(shù)據(jù)的模型??偟膩碚f:總的來說:相關(guān)指數(shù)相關(guān)指數(shù)R2是度量模型擬合效果的一種指標。是度量模型擬合效果的一種指標。在線性模型

31、中,它在線性模型中,它代表自變量刻畫預報變量的能力代表自變量刻畫預報變量的能力。我們可以用我們可以用相關(guān)指數(shù)相關(guān)指數(shù)R2來刻畫回歸的效果,其計算公式是來刻畫回歸的效果,其計算公式是22121()11()niiiniiyyRyy 殘差平方和??偲钇椒胶?354總計0.36128.361殘差變量0.64225.639隨機誤差比例平方和來源表表1-3 從表從表3-1中可以看出,解析變量對總效應約貢獻了中可以看出,解析變量對總效應約貢獻了64%,即,即R2 0.64,可以敘述為,可以敘述為“身高解析了身高解析了64%的體重變化的體重變化”,而隨機誤差貢獻了剩余的,而隨機誤差貢獻了剩余的36%。 所以

32、,身高對體重的效應比隨機誤差的效應大得多。所以,身高對體重的效應比隨機誤差的效應大得多。表表1-4列出了女大學生身高和體重的原始數(shù)據(jù)以及相應的殘差數(shù)據(jù)。列出了女大學生身高和體重的原始數(shù)據(jù)以及相應的殘差數(shù)據(jù)。 在研究兩個變量間的關(guān)系時,首先要根據(jù)散點圖來粗略判斷它們是否線性相關(guān),在研究兩個變量間的關(guān)系時,首先要根據(jù)散點圖來粗略判斷它們是否線性相關(guān),是否可以用回歸模型來擬合數(shù)據(jù)。是否可以用回歸模型來擬合數(shù)據(jù)。殘差分析與殘差圖的定義:殘差分析與殘差圖的定義: 然后,我們可以通過殘差然后,我們可以通過殘差 來判斷模型擬合的效果,判斷原始來判斷模型擬合的效果,判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù),數(shù)據(jù)中是否存

33、在可疑數(shù)據(jù),這方面的分析工作稱為殘差分析這方面的分析工作稱為殘差分析。12,ne ee 我們可以利用圖形來分析殘差特性,作圖時縱坐標為殘差,橫坐標可以選為樣本我們可以利用圖形來分析殘差特性,作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數(shù)據(jù),或體重估計值等,這樣作出的圖形稱為編號,或身高數(shù)據(jù),或體重估計值等,這樣作出的圖形稱為殘差圖殘差圖。殘差圖的制作及作用。殘差圖的制作及作用。坐標縱軸為殘差變量,橫軸可以有不同的選擇;坐標縱軸為殘差變量,橫軸可以有不同的選擇;若模型選擇的正確,殘差圖中的點應該分布在以若模型選擇的正確,殘差圖中的點應該分布在以橫軸為心的帶形區(qū)域橫軸為心的帶形區(qū)域;對于遠離橫軸的點,要特別注意對于遠離橫軸的點,要特別注意。身高與體重殘差圖異常點 錯誤數(shù)據(jù) 模型問題 幾點說明:幾點說明: 第一個樣本點和第第一個樣本點和第6個樣本點的殘差比較大,需要確認在采集過程中是否有人為個樣本點的殘差比較大,需要確認在采集過程中是否有人為的錯誤。如果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論