31回歸分析四_第1頁
31回歸分析四_第2頁
31回歸分析四_第3頁
31回歸分析四_第4頁
31回歸分析四_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、3.1回歸分析的基回歸分析的基本思想及其初步本思想及其初步應(yīng)用(四)應(yīng)用(四)高二數(shù)學(xué)高二數(shù)學(xué) 選修選修2-3 第三章第三章 統(tǒng)計案例統(tǒng)計案例 比數(shù)學(xué)3中“回歸”增加的內(nèi)容數(shù)學(xué)數(shù)學(xué)統(tǒng)計統(tǒng)計1. 畫散點圖畫散點圖2. 了解最小二乘法了解最小二乘法的思想的思想3. 求回歸直線方程求回歸直線方程ybxa4. 用回歸直線方程用回歸直線方程解決應(yīng)用問題解決應(yīng)用問題選修2-3統(tǒng)計案例5. 引入線性回歸模型引入線性回歸模型ybxae6. 了解模型中隨機(jī)誤差項了解模型中隨機(jī)誤差項e產(chǎn)產(chǎn)生的原因生的原因7. 了解相關(guān)指數(shù)了解相關(guān)指數(shù) r2 和模型擬和模型擬合的效果之間的關(guān)系合的效果之間的關(guān)系8. 了解殘差圖的作

2、用了解殘差圖的作用9. 利用線性回歸模型解決一類利用線性回歸模型解決一類非線性回歸問題非線性回歸問題10. 正確理解分析方法與結(jié)果正確理解分析方法與結(jié)果復(fù)習(xí)回顧復(fù)習(xí)回顧1、線性回歸模型:、線性回歸模型:y=bx+a+e, (3)其中其中a和和b為模型的未知參數(shù),為模型的未知參數(shù),e稱為隨機(jī)誤差稱為隨機(jī)誤差。y=bx+a+e,e(e)=0,d(e)= (4) 2.2、數(shù)據(jù)點和它在回歸直線上相應(yīng)位置的差異、數(shù)據(jù)點和它在回歸直線上相應(yīng)位置的差異 是隨機(jī)誤差的效應(yīng),稱是隨機(jī)誤差的效應(yīng),稱 為為殘差殘差。)iiyy(iiieyy=3、對每名女大學(xué)生計算這個差異,然后分別將所得、對每名女大學(xué)生計算這個差異

3、,然后分別將所得的值平方后加起來,用數(shù)學(xué)符號表示為:的值平方后加起來,用數(shù)學(xué)符號表示為: 稱為稱為殘差平方和殘差平方和,它代表了隨機(jī)誤差的效應(yīng)。它代表了隨機(jī)誤差的效應(yīng)。21()niiiyy4、兩個指標(biāo):兩個指標(biāo):(1)類比樣本方差估計總體方差的思想,可以用作)類比樣本方差估計總體方差的思想,可以用作 為為 的估計量,的估計量, 越小,預(yù)報精度越高。越小,預(yù)報精度越高。22111( , )(2)22nieq a b nnn22(2)我們可以用)我們可以用相關(guān)指數(shù)相關(guān)指數(shù)r2來刻畫回歸的效果,其來刻畫回歸的效果,其 計算公式是:計算公式是:222112211()()1()()nniiiiinnii

4、iiyyyyryyyy 在研究兩個變量間的關(guān)系時,首先要根據(jù)散點圖在研究兩個變量間的關(guān)系時,首先要根據(jù)散點圖來粗略判斷它們是否線性相關(guān),是否可以用回歸模來粗略判斷它們是否線性相關(guān),是否可以用回歸模型來擬合數(shù)據(jù)。型來擬合數(shù)據(jù)。5、殘差分析與殘差圖的定義:、殘差分析與殘差圖的定義: 然后,我們可以通過殘差然后,我們可以通過殘差 來判來判斷模型擬合的效果,判斷原始數(shù)據(jù)中是否存在可斷模型擬合的效果,判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù),疑數(shù)據(jù),這方面的分析工作稱為殘差分析這方面的分析工作稱為殘差分析。12,ne ee 我們可以利用圖形來分析殘差特性,作圖時縱坐標(biāo)我們可以利用圖形來分析殘差特性,作圖時縱坐標(biāo)為

5、殘差,橫坐標(biāo)可以選為樣本編號,或身高數(shù)據(jù),或為殘差,橫坐標(biāo)可以選為樣本編號,或身高數(shù)據(jù),或體重估計值等,這樣作出的圖形稱為體重估計值等,這樣作出的圖形稱為殘差圖殘差圖。案例案例2 一只紅鈴蟲的產(chǎn)卵數(shù)一只紅鈴蟲的產(chǎn)卵數(shù)y和溫度和溫度x有關(guān)?,F(xiàn)有關(guān)。現(xiàn)收集了收集了7組觀測數(shù)據(jù)列于表中:組觀測數(shù)據(jù)列于表中:(1 1)試建立產(chǎn)卵數(shù))試建立產(chǎn)卵數(shù)y y與溫度與溫度x x之間的回歸方程;并之間的回歸方程;并預(yù)測溫度為預(yù)測溫度為2828o oc c時產(chǎn)卵數(shù)目。時產(chǎn)卵數(shù)目。(2 2)你所建立的模型中溫度在多大程度上解釋了)你所建立的模型中溫度在多大程度上解釋了產(chǎn)卵數(shù)的變化?產(chǎn)卵數(shù)的變化? 溫度溫度xoc212

6、32527293235產(chǎn)卵數(shù)產(chǎn)卵數(shù)y/個個711212466115325非線性回歸問題非線性回歸問題假設(shè)線性回歸方程為假設(shè)線性回歸方程為 :=bx+a選選 模模 型型由計算器得:線性回歸方程為由計算器得:線性回歸方程為y=y=19.8719.87x x-463.73-463.73 相關(guān)指數(shù)相關(guān)指數(shù)r r2 2= =r r2 20.8640.8642 2=0.7464=0.7464估計參數(shù)估計參數(shù) 解:選取氣溫為解釋變量解:選取氣溫為解釋變量x x,產(chǎn)卵數(shù),產(chǎn)卵數(shù) 為預(yù)報變量為預(yù)報變量y y。選變量選變量所以,二次函數(shù)模型中溫度解釋了所以,二次函數(shù)模型中溫度解釋了74.64%的產(chǎn)卵數(shù)變化。的產(chǎn)卵

7、數(shù)變化。探索新知探索新知畫散點圖畫散點圖050100150200250300350036912151821242730333639方案1分析和預(yù)測分析和預(yù)測當(dāng)當(dāng)x=28時,時,y =19.8728-463.73 93一元線性模型一元線性模型奇怪?奇怪?9366 ?模型不好?模型不好? y=bx2+a 變換變換 y=bt+a非線性關(guān)系非線性關(guān)系 線性關(guān)系線性關(guān)系方案2問題問題選用選用y=bx2+a ,還是,還是y=bx2+cx+a ?問題問題3-200-1000100200300400-40-30-20-10010203040 產(chǎn)卵數(shù)產(chǎn)卵數(shù)氣溫氣溫問題問題2如何求如何求a、b ?合作探究合作探究

8、 t=x2二次函數(shù)模型二次函數(shù)模型方案2解答平方變換平方變換:令令t=xt=x2 2,產(chǎn)卵數(shù),產(chǎn)卵數(shù)y y和溫度和溫度x x之間二次函數(shù)模型之間二次函數(shù)模型y=bxy=bx2 2+a+a就轉(zhuǎn)化為產(chǎn)卵數(shù)就轉(zhuǎn)化為產(chǎn)卵數(shù)y y和溫度的平方和溫度的平方t t之間線性回歸模型之間線性回歸模型y=bty=bt+a+a溫度溫度21232527293235溫度的平方溫度的平方t44152962572984110241225產(chǎn)卵數(shù)產(chǎn)卵數(shù)y/個個711212466115325作散點圖,并由計算器得:作散點圖,并由計算器得:y y和和t t之間的線性回歸方程為之間的線性回歸方程為y=y=0.3670.367t t-

9、202.543-202.543,相關(guān)指數(shù),相關(guān)指數(shù)r r2 2=0.802=0.802將將t=xt=x2 2代入線性回歸方程得:代入線性回歸方程得: y=y=0.3670.367x x2 2 -202.543 -202.543當(dāng)當(dāng)x x=28=28時時,y y=0.367=0.36728282 2- -202.5485202.5485,且,且r r2 2=0.802=0.802,所以,二次函數(shù)模型中溫度解所以,二次函數(shù)模型中溫度解釋了釋了80.2%80.2%的產(chǎn)卵數(shù)變化。的產(chǎn)卵數(shù)變化。產(chǎn)卵數(shù)y/個0501001502002503003500150300450600750900 1050 120

10、0 1350t問題問題 變換變換 y=bx+a非線性關(guān)系非線性關(guān)系 線性關(guān)系線性關(guān)系21c xyce問題問題如何選取指數(shù)函數(shù)的底如何選取指數(shù)函數(shù)的底?-50050100150200250300350400450-10-50510152025303540產(chǎn)卵數(shù)產(chǎn)卵數(shù)氣溫氣溫指數(shù)函數(shù)模型指數(shù)函數(shù)模型方案3合作探究合作探究對數(shù)對數(shù)方案3解答溫度溫度xoc21232527293235z=lny1.9462.3983.0453.1784.1904.7455.784產(chǎn)卵數(shù)產(chǎn)卵數(shù)y/個個71121246611532500.40.81.21.622.42.8036912 15 18 21 24 27 30 3

11、3 36 39xz當(dāng)當(dāng)x=28x=28o oc c 時,時,y 44 y 44 ,指數(shù)回歸,指數(shù)回歸模型中溫度解釋了模型中溫度解釋了98.5%98.5%的產(chǎn)卵數(shù)的的產(chǎn)卵數(shù)的變化變化由計算器得:由計算器得:z z關(guān)于關(guān)于x x的線性回歸方程的線性回歸方程為為0.272x-3.849 .ye22111221lnln()lnlnlnlnlnc xc xycececc xec xc 對數(shù)變換:在對數(shù)變換:在 中兩邊取常用對數(shù)得中兩邊取常用對數(shù)得21c xyce令令 ,則,則 就轉(zhuǎn)換為就轉(zhuǎn)換為z=bxz=bx+a.+a.12ln,ln,zy ac bc21c xyce z=0.272x-3.849 ,相

12、關(guān)指數(shù)相關(guān)指數(shù)r r2 2=0.98=0.98最好的模型是哪個最好的模型是哪個?-200-1000100200300400-40-30-20-10010203040 產(chǎn)卵數(shù)產(chǎn)卵數(shù)氣溫氣溫-50050100150200250300350400450-10-50510152025303540產(chǎn)卵數(shù)產(chǎn)卵數(shù)氣溫氣溫線性模型線性模型二次函數(shù)模型二次函數(shù)模型指數(shù)函數(shù)模型指數(shù)函數(shù)模型比一比比一比函數(shù)模型函數(shù)模型相關(guān)指數(shù)相關(guān)指數(shù)r2線性回歸模型線性回歸模型0.7464二次函數(shù)模型二次函數(shù)模型0.80指數(shù)函數(shù)模型指數(shù)函數(shù)模型0.98最好的模型是哪個最好的模型是哪個?回歸分析(二)回歸分析(二)(1)0.2723

13、.849(2)2y,y0.367202.543.xex則回歸方程的殘差計算公式分別為:則回歸方程的殘差計算公式分別為:由計算可得:由計算可得:(1)(1)0.2723.849(2)(2)2,1,2,.,7;0.367202.543,1,2,.,7.xiiiiiiiieyyyeieyyyxix21232527293235y7112124661153250.557-0.1011.875-8.9509.230-13.38134.67547.69619.400-5.832-41.000-40.104-58.26577.968(1) e(2) e(1)(2)1550.538,15448.431.qq因此

14、模型(因此模型(1)的擬合效果遠(yuǎn)遠(yuǎn)優(yōu)于模型()的擬合效果遠(yuǎn)遠(yuǎn)優(yōu)于模型(2)。)。總總 結(jié)結(jié)1122( ,),(,),.,(,),nnx yxyxy 對于給定的樣本點對于給定的樣本點兩個含有未知參數(shù)的模型:兩個含有未知參數(shù)的模型:(1)(2)( , )( , ),yf x ayg x b和其中其中a和和b都是未知參數(shù)。擬合效果比較的步驟為:都是未知參數(shù)。擬合效果比較的步驟為:(1)分別建立對應(yīng)于兩個模型的回歸方程)分別建立對應(yīng)于兩個模型的回歸方程與與 其中其中 和和 分別是參數(shù)分別是參數(shù)a和和b的估計值;的估計值;(2)分別計算兩個回歸方程的殘差平方和)分別計算兩個回歸方程的殘差平方和與與(3)

15、若)若 則則 的效果比的效果比 的好;反之,的好;反之, 的效的效果不如果不如 的好。的好。(1)( , )yf x a(2)( , ),yg x b ab(1)(1)21()niiiqyy(2)(2)21() ;niiiqyy(1)(2),qq(1)( , )yf x a(2)( , )yg x b(2)( , )yg x b(1)( , )yf x a練習(xí):練習(xí):為了研究某種細(xì)菌隨時間為了研究某種細(xì)菌隨時間x x變化,繁殖的個數(shù),變化,繁殖的個數(shù),收集數(shù)據(jù)如下:收集數(shù)據(jù)如下:天 數(shù)天 數(shù) x /x /天天 1 1 2 2 3 34 4 5 56 6繁殖個數(shù)繁殖個數(shù)y/y/個個 6 6 12

16、12 2525 4949 9595190190 (1 1)用天數(shù)作解釋變量,繁殖個數(shù)作預(yù)報變量,作出這些)用天數(shù)作解釋變量,繁殖個數(shù)作預(yù)報變量,作出這些 數(shù)據(jù)的散點圖;數(shù)據(jù)的散點圖; (2) 描述解釋變量與預(yù)報變量描述解釋變量與預(yù)報變量 之間的關(guān)系;之間的關(guān)系; (3 3) 計算殘差、相關(guān)指數(shù)計算殘差、相關(guān)指數(shù)r r2 2. .天數(shù)天數(shù)繁殖個數(shù)繁殖個數(shù)解:解:(1)散點圖如右所示散點圖如右所示 (2 2)由散點圖看出樣本點分布在一條指數(shù)函數(shù))由散點圖看出樣本點分布在一條指數(shù)函數(shù)y= y= 的的周圍,于是令周圍,于是令z=lnyz=lny, ,則則2c x1ecx x1 12 23 34 45

17、56 6z z1.791.792.482.483.223.223.893.894.554.555.255.25由計數(shù)器算得由計數(shù)器算得 則有則有z=0.69x 1.1120.69x 1.112 y=e y6.066.0612.0912.0924.0924.0948.0448.0495.7795.77190.9190.9y y6 61212252549499595190190n22ii=11e()3.1643,niiiyyn222i1i=1()yny25553.3.niiyy(3)即解釋變量天數(shù)對預(yù)報變量繁殖細(xì)菌得個數(shù)解釋了即解釋變量天數(shù)對預(yù)報變量繁殖細(xì)菌得個數(shù)解釋了99.99%.99.99%.23.164310.9999.25553.3r 練習(xí)練習(xí) 假設(shè)關(guān)于某設(shè)備的使用年限假設(shè)關(guān)于某設(shè)備的使用年限x和所支出的維修費(fèi)用和所支出的維修費(fèi)用 y(萬(萬元),有如下的統(tǒng)計資料。元),有如下的統(tǒng)計資料。使用年限使用年限x 23456維修費(fèi)用維修費(fèi)用y 2.23.85.56.57.0若由資料知若由資料知,y對對x呈線性相關(guān)關(guān)系。試求:呈線性相關(guān)關(guān)系。試求:(1)線

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論