高二數(shù)學(xué)1[1]1《回歸分析的基本思想及其初步應(yīng)用》PPT課件_第1頁(yè)
高二數(shù)學(xué)1[1]1《回歸分析的基本思想及其初步應(yīng)用》PPT課件_第2頁(yè)
高二數(shù)學(xué)1[1]1《回歸分析的基本思想及其初步應(yīng)用》PPT課件_第3頁(yè)
高二數(shù)學(xué)1[1]1《回歸分析的基本思想及其初步應(yīng)用》PPT課件_第4頁(yè)
高二數(shù)學(xué)1[1]1《回歸分析的基本思想及其初步應(yīng)用》PPT課件_第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一章第一章 統(tǒng)計(jì)案例統(tǒng)計(jì)案例對(duì) 比數(shù)學(xué)3中“回歸”增加的內(nèi)容數(shù)學(xué)統(tǒng)計(jì)畫散點(diǎn)圖畫散點(diǎn)圖了解最小二乘法了解最小二乘法的思想的思想求回歸直線方程求回歸直線方程ybxa1. 用回歸直線方程用回歸直線方程解決應(yīng)用問(wèn)題解決應(yīng)用問(wèn)題選修-統(tǒng)計(jì)案例引入線性回歸模型引入線性回歸模型ybxae了解模型中隨機(jī)誤差項(xiàng)了解模型中隨機(jī)誤差項(xiàng)e產(chǎn)產(chǎn)生的原因生的原因了解相關(guān)指數(shù)了解相關(guān)指數(shù) R2 和模型擬和模型擬合的效果之間的關(guān)系合的效果之間的關(guān)系了解殘差圖的作用了解殘差圖的作用利用線性回歸模型解決一類利用線性回歸模型解決一類非線性回歸問(wèn)題非線性回歸問(wèn)題5. 正確理解分析方法與結(jié)果正確理解分析方法與結(jié)果問(wèn)題問(wèn)題1 1:正方

2、形的面積正方形的面積y y與正方形的邊長(zhǎng)與正方形的邊長(zhǎng)x x之間之間 的的函數(shù)關(guān)系函數(shù)關(guān)系是是y = xy = x2 2確定性關(guān)系確定性關(guān)系問(wèn)題問(wèn)題2 2:某水田水稻產(chǎn)量某水田水稻產(chǎn)量y y與施肥量與施肥量x x之間是否之間是否 -有一個(gè)確定性的關(guān)系?有一個(gè)確定性的關(guān)系?例如:例如:在在 7 7 塊并排、形狀大小相同的試驗(yàn)田塊并排、形狀大小相同的試驗(yàn)田上上 進(jìn)行施肥量對(duì)水稻產(chǎn)量影響的試驗(yàn),得到進(jìn)行施肥量對(duì)水稻產(chǎn)量影響的試驗(yàn),得到如下所示的一組數(shù)據(jù):如下所示的一組數(shù)據(jù): 施化肥量施化肥量x x 15 20 25 30 35 15 20 25 30 35 40 4540 45 水稻產(chǎn)量水稻產(chǎn)量y

3、y 330 345 365 405 445 450 455 330 345 365 405 445 450 455復(fù)習(xí)復(fù)習(xí): :變量之間的兩種關(guān)系變量之間的兩種關(guān)系自變量取值一定時(shí),因變量的取值帶有一定隨自變量取值一定時(shí),因變量的取值帶有一定隨機(jī)性的兩個(gè)變量之間的關(guān)系叫做機(jī)性的兩個(gè)變量之間的關(guān)系叫做相關(guān)關(guān)系相關(guān)關(guān)系。1 1、定義:、定義: 1 1):相關(guān)關(guān)系是一種不確定性關(guān)系;):相關(guān)關(guān)系是一種不確定性關(guān)系;注注對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法叫統(tǒng)計(jì)分析的方法叫回歸分析回歸分析。2 2):):2 2、現(xiàn)實(shí)生活中存在著大量的相關(guān)關(guān)系?,F(xiàn)實(shí)生活中存在著大量的相

4、關(guān)關(guān)系。探索探索1 1:水稻產(chǎn)量:水稻產(chǎn)量y y與施肥量與施肥量x x之間大致有何之間大致有何規(guī)律?規(guī)律?10 20 30 40 5010 20 30 40 50500500450450400400350350300300發(fā)現(xiàn):圖中各點(diǎn),大致分布在某條直線附近。發(fā)現(xiàn):圖中各點(diǎn),大致分布在某條直線附近。探索探索2 2:在這些點(diǎn)附近可畫直線不止一條,:在這些點(diǎn)附近可畫直線不止一條, 哪條直線最能代表哪條直線最能代表x x與與y y之間的關(guān)系呢?之間的關(guān)系呢?x xy y施化肥量施化肥量水稻產(chǎn)量水稻產(chǎn)量施化肥量施化肥量x x 15 20 25 30 35 40 45 15 20 25 30 35 4

5、0 45水稻產(chǎn)量水稻產(chǎn)量y y 330 345 365 405 445 450 455 330 345 365 405 445 450 455散點(diǎn)圖散點(diǎn)圖1.最小二乘法:最小二乘法: y = bx+a(x,y)(x,y)稱為樣本點(diǎn)的中心稱為樣本點(diǎn)的中心n n( (x x- - x x) )( (y y- - y y) )i ii ii i= =1 1b b = =n n2 2( (x x- - x x) )i ii i= =1 1a a = = y y - - b bx x. .n nn n1 11 1其其 中中 x x = =x x , ,y y = =y y . .i ii in nn n

6、i i= =1 1i i= =1 1n niiiii=1i=1n n2 22 2i ii=1i=1x y -nxyx y -nxy=,=,x-nxx-nx3 3、對(duì)兩個(gè)變量進(jìn)行的線性分析叫做、對(duì)兩個(gè)變量進(jìn)行的線性分析叫做線性線性回歸分析回歸分析。2 2、回歸直線方程:、回歸直線方程:n nn ni ii ii ii ii i= =1 1i i= =1 1n nn n2 22 22 2i ii ii i= =1 1i i= =1 1( (x x - -x x) )( (y y - -y y) )x x- -n nx xy yb b = = =, ,( (x x - -x x) )x x - -n

7、 nx xa a = = y y- -b bx xy y2.2.相應(yīng)的直線叫做相應(yīng)的直線叫做回歸直線回歸直線。1 1、所求直線方程、所求直線方程 叫做叫做回歸直回歸直 -線方程線方程;其中;其中 y y = = b bx x+ +a a3.求出線性相關(guān)方程后,如何描述斜率估計(jì)值求出線性相關(guān)方程后,如何描述斜率估計(jì)值與變化增量值之間相關(guān)關(guān)系的強(qiáng)弱?通過(guò)什么與變化增量值之間相關(guān)關(guān)系的強(qiáng)弱?通過(guò)什么量來(lái)說(shuō)明?量來(lái)說(shuō)明?用相關(guān)系數(shù)用相關(guān)系數(shù) r 來(lái)衡量來(lái)衡量00rxyrxy當(dāng)時(shí),表示 與 為正相關(guān);當(dāng)時(shí),表示 與 為負(fù)相關(guān)、當(dāng)、當(dāng) 時(shí),時(shí),x x與與y y為完全線性相關(guān),它們之間為完全線性相關(guān),它們之

8、間存在確定的函數(shù)關(guān)系。存在確定的函數(shù)關(guān)系。、當(dāng)、當(dāng) 時(shí),表示時(shí),表示x x與與y y存在著一定的線性相存在著一定的線性相關(guān),關(guān),r r的絕對(duì)值越大,越接近于的絕對(duì)值越大,越接近于1 1,表示,表示x x與與y y直線直線相關(guān)程度越高,反之越低。相關(guān)程度越高,反之越低。1r10 r相關(guān)關(guān)系的測(cè)度相關(guān)關(guān)系的測(cè)度(相關(guān)系數(shù)取值及其意義)練練:某種產(chǎn)品的廣告費(fèi)支出某種產(chǎn)品的廣告費(fèi)支出x與銷售額與銷售額y之間有如表之間有如表所示數(shù)據(jù)所示數(shù)據(jù):(1)0.9192r (2)6.517.5yx(1)求求x,y之間的相關(guān)系數(shù)之間的相關(guān)系數(shù);(2)求線性回歸方程求線性回歸方程;例例1 從某大學(xué)中隨機(jī)選取從某大學(xué)中

9、隨機(jī)選取8名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如表名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如表1-1所示。所示。求根據(jù)一名女大學(xué)生的身高預(yù)報(bào)她的體重的回歸方程,并預(yù)報(bào)一名身高為求根據(jù)一名女大學(xué)生的身高預(yù)報(bào)她的體重的回歸方程,并預(yù)報(bào)一名身高為172cm的女大學(xué)生的體重。的女大學(xué)生的體重。案例案例1:女大學(xué)生的身高與體重:女大學(xué)生的身高與體重解:解:1、選取身高為自變量、選取身高為自變量x,體重為因變量,體重為因變量y,作散點(diǎn)圖:,作散點(diǎn)圖:2、由散點(diǎn)圖知道身高和體重有比較好的、由散點(diǎn)圖知道身高和體重有比較好的線性相關(guān)關(guān)系,因此可以用線性回歸方程線性相關(guān)關(guān)系,因此可以用線性回歸方程刻畫它們之間的關(guān)系??坍嬎鼈冎g的關(guān)

10、系。3、從散點(diǎn)圖還看到,樣本點(diǎn)散布在某一條、從散點(diǎn)圖還看到,樣本點(diǎn)散布在某一條直線的附近,而不是在一條直線上,所以直線的附近,而不是在一條直線上,所以不能用一次函數(shù)不能用一次函數(shù)y=bx+a描述它們關(guān)系。描述它們關(guān)系。 我們可以用下面的我們可以用下面的線性回歸模型線性回歸模型來(lái)表示:來(lái)表示:y=bx+a+e,其中,其中a和和b為模型的未知參數(shù),為模型的未知參數(shù),e稱為隨機(jī)誤差稱為隨機(jī)誤差。思考思考P3產(chǎn)生隨機(jī)誤差項(xiàng)產(chǎn)生隨機(jī)誤差項(xiàng)e的原因是什么?的原因是什么?思考思考P3產(chǎn)生隨機(jī)誤差項(xiàng)產(chǎn)生隨機(jī)誤差項(xiàng)e的原因是什么?的原因是什么?隨機(jī)誤差隨機(jī)誤差e e的來(lái)源的來(lái)源( (可以推廣到一般):可以推廣到

11、一般):1、其它因素的影響:影響身高 y 的因素不只是體重 x,可能還包括遺傳基因、飲食習(xí)慣、生長(zhǎng)環(huán)境等因素;2、用線性回歸模型近似真實(shí)模型所引起的誤差;3、身高 y 的觀測(cè)誤差。例例1 從某大學(xué)中隨機(jī)選取從某大學(xué)中隨機(jī)選取8名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如表名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如表1-1所示。所示。5943616454505748體重/kg170155165175170157165165身高/cm87654321編號(hào)求根據(jù)一名女大學(xué)生的身高預(yù)報(bào)她的體重的回歸方程,并預(yù)報(bào)一名身高為求根據(jù)一名女大學(xué)生的身高預(yù)報(bào)她的體重的回歸方程,并預(yù)報(bào)一名身高為172cm的女大學(xué)生的體重。的女大學(xué)生的體重

12、。根據(jù)最小二乘法估計(jì) 和 就是未知參數(shù)a和b的最好估計(jì),ab制表7 8 合計(jì)654321ixy , ,ixxiyy()()iixxyy2()ixx例例1 從某大學(xué)中隨機(jī)選取從某大學(xué)中隨機(jī)選取8名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如表名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如表1-1所示。所示。5943616454505748體重/kg170155165175170157165165身高/cm87654321編號(hào)求根據(jù)一名女大學(xué)生的身高預(yù)報(bào)她的體重的回歸方程,并預(yù)報(bào)一名身高為求根據(jù)一名女大學(xué)生的身高預(yù)報(bào)她的體重的回歸方程,并預(yù)報(bào)一名身高為172cm的女大學(xué)生的體重。的女大學(xué)生的體重。根據(jù)最小二乘法估計(jì) 和 就是未知

13、參數(shù)a和b的最好估計(jì),ab于是有b=12210.849niiiniix ynx yxnx85.712aybx 所以回歸方程是0.84985.712yx所以,對(duì)于身高為所以,對(duì)于身高為172cm的女大學(xué)生,由回歸方程可以預(yù)報(bào)其體重為的女大學(xué)生,由回歸方程可以預(yù)報(bào)其體重為 0.849 7285.71260.316()ykg( , )x y 稱為樣本點(diǎn)的中心探究探究P4:身高為身高為172cm的女大學(xué)生的體重一定是的女大學(xué)生的體重一定是60.316kg嗎?嗎?如果不是,你能解析一下原因嗎?如果不是,你能解析一下原因嗎?問(wèn)題二:?jiǎn)栴}二:在線性回歸模型中,在線性回歸模型中,e是用是用bx+a預(yù)報(bào)真實(shí)值預(yù)

14、報(bào)真實(shí)值y的隨機(jī)誤差,的隨機(jī)誤差, 它是一個(gè)不可觀測(cè)的量,那么應(yīng)如何研究隨機(jī)誤差呢?它是一個(gè)不可觀測(cè)的量,那么應(yīng)如何研究隨機(jī)誤差呢?,1,2,. ,1,2,.iiiiiiiiybxa ineyyybxa ine1122nniii殘差:一般的對(duì)于樣本點(diǎn)(x,y),(x ,y ),.,(x ,y ),它們的隨機(jī)誤差為e其估計(jì)值為稱為相應(yīng)于點(diǎn)(x,y )的殘差。思考思考P6:如何刻畫預(yù)報(bào)變量(體重)的變化?這個(gè)變化在多大程度上如何刻畫預(yù)報(bào)變量(體重)的變化?這個(gè)變化在多大程度上與解析變量(身高)有關(guān)?在多大程度上與隨機(jī)誤差有關(guān)?與解析變量(身高)有關(guān)?在多大程度上與隨機(jī)誤差有關(guān)?問(wèn)題三:?jiǎn)栴}三:如何

15、發(fā)現(xiàn)數(shù)據(jù)中的錯(cuò)誤?如何衡量隨機(jī)模型的擬合效果?如何發(fā)現(xiàn)數(shù)據(jù)中的錯(cuò)誤?如何衡量隨機(jī)模型的擬合效果? 假設(shè)身高和隨機(jī)誤差的不同不會(huì)對(duì)體重產(chǎn)生任何影響,那么所有人的體重將相假設(shè)身高和隨機(jī)誤差的不同不會(huì)對(duì)體重產(chǎn)生任何影響,那么所有人的體重將相同。同。在體重不受任何變量影響的假設(shè)下,設(shè)在體重不受任何變量影響的假設(shè)下,設(shè)8名女大學(xué)生的體重都是她們的平均值,名女大學(xué)生的體重都是她們的平均值,即即8個(gè)人的體重都為個(gè)人的體重都為54.5kg。54.554.554.554.554.554.554.554.5體重/kg170155165175170157165165身高/cm87654321編號(hào)54.5kg在散點(diǎn)圖

16、中,所有的點(diǎn)應(yīng)該落在同一條在散點(diǎn)圖中,所有的點(diǎn)應(yīng)該落在同一條水平直線上,但是觀測(cè)到的數(shù)據(jù)并非如水平直線上,但是觀測(cè)到的數(shù)據(jù)并非如此。此。這就意味著這就意味著預(yù)報(bào)變量(體重)的值預(yù)報(bào)變量(體重)的值受解析變量(身高)或隨機(jī)誤差的影響受解析變量(身高)或隨機(jī)誤差的影響。5943616454505748體重/kg170155165175170157165165身高/cm87654321編號(hào) 例如,編號(hào)為例如,編號(hào)為6的女大學(xué)生的體重并沒(méi)有落在水平直線上,她的體重為的女大學(xué)生的體重并沒(méi)有落在水平直線上,她的體重為61kg。解析。解析變量(身高)和隨機(jī)誤差共同把這名學(xué)生的體重從變量(身高)和隨機(jī)誤差共同

17、把這名學(xué)生的體重從54.5kg“推推”到了到了61kg,相差,相差6.5kg,所以所以6.5kg是解析變量和隨機(jī)誤差的是解析變量和隨機(jī)誤差的組合效應(yīng)組合效應(yīng)。 編號(hào)為編號(hào)為3的女大學(xué)生的體重并也沒(méi)有落在水平直線上,她的體重為的女大學(xué)生的體重并也沒(méi)有落在水平直線上,她的體重為50kg。解析。解析變量(身高)和隨機(jī)誤差共同把這名學(xué)生的體重從變量(身高)和隨機(jī)誤差共同把這名學(xué)生的體重從50kg“推推”到了到了54.5kg,相差,相差-4.5kg,這時(shí)解析變量和隨機(jī)誤差的組合效應(yīng)為這時(shí)解析變量和隨機(jī)誤差的組合效應(yīng)為-4.5kg。用這種方法可以對(duì)所有預(yù)報(bào)變量計(jì)算組合效應(yīng)。用這種方法可以對(duì)所有預(yù)報(bào)變量計(jì)算

18、組合效應(yīng)。數(shù)學(xué)上,把每個(gè)效應(yīng)(觀測(cè)值減去總的平均值)的平方加起來(lái),即用數(shù)學(xué)上,把每個(gè)效應(yīng)(觀測(cè)值減去總的平均值)的平方加起來(lái),即用21()niiyy表示總的效應(yīng),稱為表示總的效應(yīng),稱為總偏差平方和總偏差平方和。在例在例1中,總偏差平方和為中,總偏差平方和為354。5943616454505748體重/kg170155165175170157165165身高/cm87654321編號(hào) 那么,在這個(gè)總的效應(yīng)(總偏差平方和)中,有多少來(lái)自于解析變量(身高)?那么,在這個(gè)總的效應(yīng)(總偏差平方和)中,有多少來(lái)自于解析變量(身高)?有多少來(lái)自于隨機(jī)誤差?有多少來(lái)自于隨機(jī)誤差? 假設(shè)隨機(jī)誤差對(duì)體重沒(méi)有影響,

19、也就是說(shuō),體重僅受身高的影響,那么散點(diǎn)圖中所有的點(diǎn)將完全落在回歸直線上。但是,在圖中,數(shù)據(jù)點(diǎn)并沒(méi)有完全落在回歸直線上。這些點(diǎn)散布在回歸直線附近,所以一定是隨機(jī)誤差把這些點(diǎn)從回歸直線上這些點(diǎn)散布在回歸直線附近,所以一定是隨機(jī)誤差把這些點(diǎn)從回歸直線上“推推”開了開了。在例在例1中,殘差平方和約為中,殘差平方和約為128.361。 因此,數(shù)據(jù)點(diǎn)和它在回歸直線上相應(yīng)位置的差異因此,數(shù)據(jù)點(diǎn)和它在回歸直線上相應(yīng)位置的差異 是隨機(jī)誤差的效應(yīng),是隨機(jī)誤差的效應(yīng),稱稱 為為殘差殘差。)iiyy(iiieyy=例如,編號(hào)為例如,編號(hào)為6的女大學(xué)生,計(jì)算隨機(jī)誤差的效應(yīng)(殘差)為:的女大學(xué)生,計(jì)算隨機(jī)誤差的效應(yīng)(殘差

20、)為:61(0.849 16585.712)6.627對(duì)每名女大學(xué)生計(jì)算這個(gè)差異,然后分別將所得的值平方后加起來(lái),用數(shù)學(xué)符號(hào)對(duì)每名女大學(xué)生計(jì)算這個(gè)差異,然后分別將所得的值平方后加起來(lái),用數(shù)學(xué)符號(hào)21()niiiyy稱為稱為殘差平方和殘差平方和,它代表了隨機(jī)誤差的效應(yīng)。它代表了隨機(jī)誤差的效應(yīng)。表示為:表示為: 由于解析變量和隨機(jī)誤差的總效應(yīng)(總偏差平方和)為由于解析變量和隨機(jī)誤差的總效應(yīng)(總偏差平方和)為354,而隨機(jī)誤差的效應(yīng)為,而隨機(jī)誤差的效應(yīng)為128.361,所以解析變量的效應(yīng)為,所以解析變量的效應(yīng)為解析變量和隨機(jī)誤差的總效應(yīng)(總偏差平方和)解析變量和隨機(jī)誤差的總效應(yīng)(總偏差平方和) =解

21、析變量的效應(yīng)(回歸平方和)解析變量的效應(yīng)(回歸平方和)+隨機(jī)誤差的效應(yīng)(殘差平方和)隨機(jī)誤差的效應(yīng)(殘差平方和)354-128.361=225.639 這個(gè)值稱為這個(gè)值稱為回歸平方和?;貧w平方和。我們可以用我們可以用相關(guān)指數(shù)相關(guān)指數(shù)R2來(lái)刻畫回歸的效果,其計(jì)算公式是來(lái)刻畫回歸的效果,其計(jì)算公式是22121()11()niiiniiyyRyy 殘差平方和??偲钇椒胶?221121()()()nniiiiiniiyyyyRyy總偏差平方和殘差平方和回歸平方和總偏差平方和總偏差平方和我們可以用我們可以用相關(guān)指數(shù)相關(guān)指數(shù)R2來(lái)刻畫回歸的效果,其計(jì)算公式是來(lái)刻畫回歸的效果,其計(jì)算公式是22121()1

22、1()niiiniiyyRyy 殘 差 平 方 和???偏 差 平 方 和總的來(lái)說(shuō):總的來(lái)說(shuō):相關(guān)指數(shù)相關(guān)指數(shù)R2是度量模型擬合效果的一種指標(biāo)。是度量模型擬合效果的一種指標(biāo)。在線性模型中,它在線性模型中,它代表自變量刻畫預(yù)報(bào)變量的能力代表自變量刻畫預(yù)報(bào)變量的能力。表表1-4列出了女大學(xué)生身高和體重的原始數(shù)據(jù)以及相應(yīng)的殘差數(shù)據(jù)。列出了女大學(xué)生身高和體重的原始數(shù)據(jù)以及相應(yīng)的殘差數(shù)據(jù)。 在研究?jī)蓚€(gè)變量間的關(guān)系時(shí),首先要根據(jù)散點(diǎn)圖來(lái)粗略判斷它們是否線性相關(guān),在研究?jī)蓚€(gè)變量間的關(guān)系時(shí),首先要根據(jù)散點(diǎn)圖來(lái)粗略判斷它們是否線性相關(guān),是否可以用回歸模型來(lái)擬合數(shù)據(jù)。是否可以用回歸模型來(lái)擬合數(shù)據(jù)。殘差分析與殘差圖

23、的定義:殘差分析與殘差圖的定義: 然后,我們可以通過(guò)殘差然后,我們可以通過(guò)殘差 來(lái)判斷模型擬合的效果,判斷原始來(lái)判斷模型擬合的效果,判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù),數(shù)據(jù)中是否存在可疑數(shù)據(jù),這方面的分析工作稱為殘差分析這方面的分析工作稱為殘差分析。12,ne ee 我們可以利用圖形來(lái)分析殘差特性,作圖時(shí)縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本我們可以利用圖形來(lái)分析殘差特性,作圖時(shí)縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號(hào),或身高數(shù)據(jù),或體重估計(jì)值等,這樣作出的圖形稱為編號(hào),或身高數(shù)據(jù),或體重估計(jì)值等,這樣作出的圖形稱為殘差圖殘差圖。殘差圖的制作及作用。殘差圖的制作及作用。坐標(biāo)縱軸為殘差變量,橫軸可以有不同的選

24、擇;坐標(biāo)縱軸為殘差變量,橫軸可以有不同的選擇;若模型選擇的正確,殘差圖中的點(diǎn)應(yīng)該分布在以若模型選擇的正確,殘差圖中的點(diǎn)應(yīng)該分布在以橫軸為心的帶形區(qū)域橫軸為心的帶形區(qū)域;對(duì)于遠(yuǎn)離橫軸的點(diǎn),要特別注意對(duì)于遠(yuǎn)離橫軸的點(diǎn),要特別注意。身高與體重殘差圖異常點(diǎn) 錯(cuò)誤數(shù)據(jù) 模型問(wèn)題 幾點(diǎn)說(shuō)明:幾點(diǎn)說(shuō)明: 第一個(gè)樣本點(diǎn)和第第一個(gè)樣本點(diǎn)和第6個(gè)樣本點(diǎn)的殘差比較大,需要確認(rèn)在采集過(guò)程中是否有人為個(gè)樣本點(diǎn)的殘差比較大,需要確認(rèn)在采集過(guò)程中是否有人為的錯(cuò)誤。如果數(shù)據(jù)采集有錯(cuò)誤,就予以糾正,然后再重新利用線性回歸模型擬合數(shù)的錯(cuò)誤。如果數(shù)據(jù)采集有錯(cuò)誤,就予以糾正,然后再重新利用線性回歸模型擬合數(shù)據(jù);如果數(shù)據(jù)采集沒(méi)有錯(cuò)誤,

25、則需要尋找其他的原因。據(jù);如果數(shù)據(jù)采集沒(méi)有錯(cuò)誤,則需要尋找其他的原因。 另外,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明選用的模型計(jì)較合適,這另外,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明選用的模型計(jì)較合適,這樣的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精度越高,回歸方程的預(yù)報(bào)精度越高。樣的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精度越高,回歸方程的預(yù)報(bào)精度越高。小結(jié)小結(jié)用身高預(yù)報(bào)體重時(shí),需要注意下列問(wèn)題:用身高預(yù)報(bào)體重時(shí),需要注意下列問(wèn)題:1、回歸方程只適用于我們所研究的樣本的總體;、回歸方程只適用于我們所研究的樣本的總體;2、我們所建立的回歸方程一般都有時(shí)間性;、我們所建立的回歸方程一般都有時(shí)間性;3、

26、樣本采集的范圍會(huì)影響回歸方程的適用范圍;、樣本采集的范圍會(huì)影響回歸方程的適用范圍;4、不能期望回歸方程得到的預(yù)報(bào)值就是預(yù)報(bào)變量的精確值。、不能期望回歸方程得到的預(yù)報(bào)值就是預(yù)報(bào)變量的精確值。 事實(shí)上,它是預(yù)報(bào)變量的可能取值的平均值。事實(shí)上,它是預(yù)報(bào)變量的可能取值的平均值。這些問(wèn)題也使用于其他問(wèn)題。這些問(wèn)題也使用于其他問(wèn)題。涉及到統(tǒng)計(jì)的一些思想:涉及到統(tǒng)計(jì)的一些思想:模型適用的總體;模型適用的總體;模型的時(shí)間性;模型的時(shí)間性;樣本的取值范圍對(duì)模型的影響;樣本的取值范圍對(duì)模型的影響;模型預(yù)報(bào)結(jié)果的正確理解。模型預(yù)報(bào)結(jié)果的正確理解。一般地,建立回歸模型的基本步驟為:一般地,建立回歸模型的基本步驟為:(

27、1)確定研究對(duì)象,明確哪個(gè)變量是解析變量,哪個(gè)變量是預(yù)報(bào)變量。)確定研究對(duì)象,明確哪個(gè)變量是解析變量,哪個(gè)變量是預(yù)報(bào)變量。(2)畫出確定好的解析變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系)畫出確定好的解析變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系 (如是否存在線性關(guān)系等)。(如是否存在線性關(guān)系等)。(3)由經(jīng)驗(yàn)確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性)由經(jīng)驗(yàn)確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性 回歸方程回歸方程y=bx+a).(4)按一定規(guī)則估計(jì)回歸方程中的參數(shù)(如最小二乘法)。)按一定規(guī)則估計(jì)回歸方程中的參數(shù)(如最小二乘法)。(5)得出結(jié)果后分析殘差圖是否有異常(個(gè)別數(shù)據(jù)對(duì)應(yīng)殘差過(guò)大,或殘差呈現(xiàn))得出結(jié)果后分析殘差圖是否有

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論