




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1.1 回歸分析的基本思想及其初步應(yīng)用學(xué)習(xí)目標(biāo):1. 了解隨機(jī)誤差、殘差、 殘差圖的概念.(重點(diǎn))2.會(huì)通過分析殘差判斷線性回歸模型的擬合效果.(重點(diǎn))3. 了解常見的非線性回歸模型轉(zhuǎn)化為線性回歸模型的方法.(難點(diǎn))自主預(yù)習(xí)探新知1 回歸分析的相關(guān)概念(1) 回歸分析回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法.(2) 回歸直線方程方程y=bx+a是兩個(gè)具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù)(X1,y, (X2,y?),(xn,yn)的回歸方程,其中a,b是待定參數(shù),其最小二乘估計(jì)分別為:n xyin X _ yi=1n- 2 2、XTn x -i=1y - y .a=ybX,(3)
2、線性回歸模型樣本點(diǎn)散布在某一條直線的附近,而不是在一條直線上,所以不能用一次函數(shù)y=bx+a來描述它們之間的關(guān)系,而是用線性回歸模型y=bx+a+e來表示,其中a和b為模型的 未知參數(shù),e稱為隨機(jī)誤差,自變量X稱為解釋變量,因變量y稱為預(yù)報(bào)變量.思考:在線性回歸模型y=bx+a+e中,e產(chǎn)生的原因主要有哪幾種?提示隨機(jī)誤差產(chǎn)生的原因主要有以下幾種:(1) 所用的確定性函數(shù)不恰當(dāng)引起的誤差;(2) 忽略了某些因素的影響;(3) 存在觀測(cè)誤差.2.殘差的概念對(duì)于樣本點(diǎn)(X1,y1),(X2,y2),(Xn,yn)而言,它們的隨機(jī)誤差XiXzyMb=nti=1XiX其中匚=忘i, 7 = JZyi,
3、i=1i=1(X,y)稱為樣本點(diǎn)的中心.為e=ybxia,i= 1,2,n,其估計(jì)值為e=yi-y、=y-bxi-a,i= 1,2,n,e稱為相應(yīng)于點(diǎn)(Xi,y)的殘差.3.刻畫回歸效果的方式殘差圖作圖時(shí)縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號(hào),或身高數(shù)據(jù),或體重估計(jì)值等,這樣作出的圖形稱為殘差圖殘差圖殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,這樣的帶法狀區(qū)域的寬度越窄,說明模型擬合精度越高,回歸方程的預(yù)報(bào)精度越高殘差平-八2殘差平方和為X(yi-yi),殘差平方和越小,模型的擬合效果越好方和i=1nWA2送yi-yi=1相關(guān)指戌=1 -,R2表示解釋變量對(duì)于預(yù)報(bào)變量變化的貢獻(xiàn)
4、率,R2越接近數(shù)R丈y-丁二i=1于 1 表示模型的擬合效果越好基礎(chǔ)自測(cè)1. 思考辨析(1) 相關(guān)指數(shù)R2越小,線性回歸方程的擬合效果越好.()(2) 在線性回歸模型中,e是bx+a預(yù)報(bào)真實(shí)值y的隨機(jī)誤差,它是一個(gè)可觀測(cè)的量.(3) 線性回歸方程y=bx+a必過樣本點(diǎn)的中心(x,y).()答案xx(3)V2.甲、乙、丙、丁四位同學(xué)在建立變量x,y的回歸模型時(shí),分別選擇了 4種不同模型, 計(jì)算可得它們的相關(guān)指數(shù)R2分別如下表:甲乙丙丁F20.980.780.500.85建立回歸模型擬合效果最好的同學(xué)是()【導(dǎo)學(xué)號(hào):48662000】A.甲B.乙C.丙D. 丁A 相關(guān)指數(shù) 氏越大,表示回歸模型的擬
5、合效果越好.3甲、乙、丙、丁 4 位同學(xué)各自對(duì)A、B兩變量做回歸分析,分別得到散點(diǎn)圖與殘差平n八2方和a ( yi-yi)如表所示:i=1甲乙丙丁散點(diǎn)圖/L4 *R LR . *oA0PAOA殘差平方和115am ”a ” ar- ”106a”.、八厶 J、rxvr A124103_(填“甲”“乙”“丙” “丁”)同學(xué)的試驗(yàn)結(jié)果體現(xiàn)擬合AB兩 變 量 關(guān) 系 的模型擬合精度高.丁 根據(jù)線性相關(guān)的知識(shí),散點(diǎn)圖中各樣本點(diǎn)條狀分布越均勻,同時(shí)保持殘差平方和n越?。▽?duì)于已經(jīng)獲取的樣本數(shù)據(jù),R2表達(dá)式中 a (y 7)2為確定的數(shù),則殘差平方和越小,i=1氏越大),由回歸分析建立的線性回歸模型的擬合效果
6、就越好,由試驗(yàn)結(jié)果知丁要好些.4 設(shè)某大學(xué)的女生體重y(單位:kg)與身高x(單位:cm)具有線性相關(guān)關(guān)系根據(jù)一組樣本數(shù)據(jù)(Xi,yi)(i= 1,2,n),用最小二乘法建立的回歸方程為y= 0.85x 85.71,則下列結(jié)論中正確的是 _ (填序號(hào)).【導(dǎo)學(xué)號(hào):48662001】(1)y與x具有正的線性相關(guān)關(guān)系;(2)回歸直線過樣本點(diǎn)的中心(x,y);(3)若該大學(xué)某女生身高增加1 cm,則其體重約增加 0.85 kg ;若該大學(xué)某女生身高為170 cm,則可斷定其體重必為58.79 kg.(1)(2)(3)回歸方程中x的系數(shù)為 0.850,因此y與x具有正的線性相關(guān)關(guān)系,(1)正確;由回歸
7、方程系數(shù)的意義可知回歸直線過樣本點(diǎn)的中心(x , 7 ) , (2)正確;依據(jù)回歸方程中b的含義可知,x每變化 1 個(gè)單位,y相應(yīng)變化約 0.85 個(gè)單位,(3)正確;用回歸方程對(duì)總體進(jìn)行估計(jì)不能得到肯定結(jié)論,故(4)不正確.合作探究攻重難.j求線性回歸方程紐 某研究機(jī)構(gòu)對(duì)高三學(xué)生的記憶力x和判斷力y進(jìn)行統(tǒng)計(jì)分析,得下表數(shù)據(jù):x681012y2356(1)請(qǐng)畫出上表數(shù)據(jù)的散點(diǎn)圖(要求:點(diǎn)要描粗);(2)請(qǐng)根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關(guān)于x的線性回歸方程y=bx+;試根據(jù)求出的線性回歸方程,預(yù)測(cè)記憶力為9 的同學(xué)的判斷力.【導(dǎo)學(xué)號(hào):48662002】解如圖:n(2) Xiyi=6X2+
8、8X3+10X5+12X6=158,i=16 + 8+ 10+ 12n2 2 2 2 2 Xi= 6 + 8 + 10 + 12 = 344,i=1y1584X9X414b= = = 0.7 ,3444X920y 一 y a=yb x=40.7X9=2.3,故線性回歸方程為y= 0.7x 2.3.(3)由中線性回歸方程當(dāng)x= 9 時(shí),y= 0.7X9 2.3 = 4,預(yù)測(cè)記憶力為 9 的同學(xué)的判 斷力約為 4.規(guī)律方法 求線性回歸方程的基本步驟:1 列出散點(diǎn)圖,從直觀上分析數(shù)據(jù)間是否存在線性相關(guān)關(guān)系2計(jì)算: ._“ - 0.82, 氏氏.(1)的擬合效果好于(2)的擬合效果.1已知x和y之間的
9、一組數(shù)據(jù),則下列四個(gè)函數(shù)中,模擬效果最好的為哪一個(gè)?x123y35.9912.01X一1;y=3X2;y=log2X;y= 4x;y=x.提示:觀察散點(diǎn)圖中樣本點(diǎn)的分布規(guī)律可判斷樣本點(diǎn)分布在曲線y= 3X2X一1附近.所以模擬效果最好的為.2 如何將上題函數(shù)變換為線性函數(shù)?提示:將y= 3X2X一1兩邊取自然對(duì)數(shù)得 Iny= In 3 + (x 1)ln 2.則原方程變?yōu)閥= ln 3+xIn 2 ln 2= ln |+xIn 2.這樣y與x成線性函數(shù)關(guān)系.斷:y=a+bx與y=aedx哪一個(gè)作為繁殖的個(gè)數(shù)y關(guān)于時(shí)間x變化的回歸方程類型為最佳?(給出判斷即可,不必說明理由)xyz6為(Xix)
10、2i=16送(Xix) i=1(yiy)6送(XiX) i=1(Ziz)天數(shù)x/天123456繁殖個(gè)數(shù)y/個(gè)612254995190 x變化,繁殖的個(gè)數(shù),收集數(shù)據(jù)如下:(1)用天數(shù)作解釋變量,繁殖個(gè)數(shù)作預(yù)報(bào)變量,作出這些數(shù)據(jù)的散點(diǎn)圖,根據(jù)散點(diǎn)圖判5Zi=1Ayiyiyiy180=11 000 =0.82,令y,x=x,探究問題為了研究某種細(xì)菌隨時(shí)間3.562.833.5317.5596.50512.0916其中Zi= Inyi;z= 6、Zi.6i=1(2)根據(jù)(1)的判斷最佳結(jié)果及表中的數(shù)據(jù),建立y關(guān)于x的回歸方程.【導(dǎo)學(xué)號(hào):48662004】n送Xi-xyiyi=1AA一A參考公式:b-,
11、a-yb x.n2Zxx思路探究: (1)根據(jù)收集數(shù)據(jù),可得數(shù)據(jù)的散點(diǎn)圖;(2)由散點(diǎn)圖看出樣本點(diǎn)分布在一條指數(shù)型曲線y=cebx(c0)的周圍,貝 U Iny=bx+ Inc.變換后的樣本點(diǎn)分布在一條直線附近,因此可以用線性回歸方程來擬合,即可求出y對(duì)x的回歸方程.解(1)作出散點(diǎn)圖,如圖 1 所示.由散點(diǎn)圖看出樣本點(diǎn)分布在一條指數(shù)函數(shù)y=C1ec2x的周圍,于是選擇y=dec2X.(2)令z= Iny,則z=bx+a.x123456z1.792.483.223.894.555.25相應(yīng)的散點(diǎn)圖如圖 2.從圖 2 可以看出,變換后的樣本點(diǎn)分布在一條直線附近,因此可以用線性回歸方程來擬 合.6
12、為XixZizi=1A由b=6 _Z Xi-x2i=1a=zb x= 1.115,得z= 0.69x+1.115 ;65斗32I0八0.69 x+1.115則有y= e.母題探究:1.(變結(jié)論)在本例條件不變的情況下,試估計(jì)第7 天細(xì)菌繁殖個(gè)數(shù).A0.69x+1.115解 y = e ,當(dāng)x= 7 時(shí),y 382(個(gè))即第 7 天細(xì)菌繁殖個(gè)數(shù)約為382 個(gè).2.(變結(jié)論)計(jì)算相關(guān)指數(shù).解殘差計(jì)算如下表:天數(shù)123456殘差0.080.120.830.821.061.52則 云.=Z (y. -y.Y =4. 8161, (v. - y) = 24642, R,i = i1i =01*a =1-
13、塩H沁即解釋變量“天數(shù)”對(duì)預(yù)報(bào)變量“繁殖細(xì)菌個(gè)數(shù)”解釋了99.98%.規(guī)律方法解決非線性回歸問題的方法及步驟1確定變量:確定解釋變量為x,預(yù)報(bào)變量為y;?畫散點(diǎn)圖:通過觀察散點(diǎn)圖并與學(xué)過的函數(shù)幕、指數(shù)、對(duì)數(shù)函數(shù)、二次函數(shù)作比較,選取擬合效果好的函數(shù)模型;變量置換:通過變量置換把非線性回歸問題轉(zhuǎn)化為線性回歸問題;-1分析擬合效果:通過計(jì)算相關(guān)指數(shù)等來判斷擬合效果;寫出非線性回歸方程.當(dāng)堂達(dá)標(biāo)固雙基1 下表是x和y之間的一組數(shù)據(jù),則y關(guān)于x的線性回歸方程必過點(diǎn)()【導(dǎo)學(xué)號(hào):48662005】x1234y1357A. (2,3)B. (1.5,4)C. (2.5,4)D. (2.5,5)C 線性回歸
14、方程必過樣本點(diǎn)的中心(x,y),即(2.5,4),故選 C.2.對(duì)變量x,y進(jìn)行回歸分析時(shí),依據(jù)得到的4 個(gè)不同的回歸模型畫出殘差圖,則下列模型擬合精度最高的是()CDA 用殘差圖判斷模型的擬合效果,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明這樣的模型比較合適帶狀區(qū)域的寬度越窄,說明模型的擬合精度越高.3. 若一組觀測(cè)值(xi,yi) , gy2),,(Xn,yn)之間滿足yi=bxi+a+ei(i= 1,2 ,n),且ei恒為 0,貝UR2為_.1 Tei恒為 0,.樣本點(diǎn)(xi,yi) , (X2,y2),,(xn,yn)均落在直線y=bx+a上,變量x,y成函數(shù)關(guān)系,即R2= 1.4. 已知回歸方程y= 2x+ 1,而試驗(yàn)得到一組數(shù)據(jù)是(2,4.9), (3,7.1), (4,9.1),則殘差平方和等于_ .2 2 20.03(4.9 - 5) + (7.1 - 7) + (9.1 - 9) = 0.03.5.已知x,y之間的一組數(shù)據(jù)如下表:X0123y13572 2 2 2(1)分另U計(jì)算:x、y、X1y1+X2y2+X3y3+X4y4、為 +x2+x3+X4;【導(dǎo)學(xué)號(hào):48662006】已知變量x與y線性相關(guān),求出回歸方程.0 + 1 + 2+ 31 + 3 + 5 + 7解(1) x=4=1.5,y=4=4
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 新能源風(fēng)力發(fā)電標(biāo)準(zhǔn)必要專利許可與風(fēng)力發(fā)電場(chǎng)運(yùn)維合作協(xié)議
- 管理部部長(zhǎng)工作概述
- 護(hù)理進(jìn)修述職
- 醫(yī)院培訓(xùn)課件:《康復(fù)醫(yī)學(xué)》
- 鋼架大棚安裝協(xié)議書
- 食堂轉(zhuǎn)讓轉(zhuǎn)租協(xié)議書
- 車商汽車合同協(xié)議書
- 餐廳股東解散協(xié)議書
- 酒后駕駛賠償協(xié)議書
- 車輛設(shè)備移交協(xié)議書
- 化學(xué)反應(yīng)工程第一章-課件
- 降低住院患者抗菌藥物使用強(qiáng)度
- 《羅密歐與朱麗葉》劇本
- 2022年下半年自貢市自流井區(qū)事業(yè)單位招聘考試《衛(wèi)生公共基礎(chǔ)》題庫(kù)含專家精析
- 2022年港澳臺(tái)聯(lián)考語(yǔ)文真題
- 市政工程投資估算編制辦法(建標(biāo)XXXX164號(hào))
- 水性漆涂裝線項(xiàng)目環(huán)境影響報(bào)告表
- 七年級(jí)(下)第一章 活動(dòng)1 網(wǎng)絡(luò)與社會(huì)生活(第一課時(shí))
- (研究生)商業(yè)倫理與會(huì)計(jì)職業(yè)道德ppt教學(xué)課件(完整版)
- 機(jī)床刀具行業(yè)報(bào)告:以山特維克為鑒
- 高速鐵路路基聲屏障樁基試樁方案
評(píng)論
0/150
提交評(píng)論