新教材同步備課2024春高中數學第8章成對數據的統(tǒng)計分析8.2一元線性回歸模型及其應用8.2.1一元線性回歸模型8.2.2第2課時回歸分析及非線性回歸模型學生用書新人教A版選擇性必修第三冊_第1頁
新教材同步備課2024春高中數學第8章成對數據的統(tǒng)計分析8.2一元線性回歸模型及其應用8.2.1一元線性回歸模型8.2.2第2課時回歸分析及非線性回歸模型學生用書新人教A版選擇性必修第三冊_第2頁
新教材同步備課2024春高中數學第8章成對數據的統(tǒng)計分析8.2一元線性回歸模型及其應用8.2.1一元線性回歸模型8.2.2第2課時回歸分析及非線性回歸模型學生用書新人教A版選擇性必修第三冊_第3頁
新教材同步備課2024春高中數學第8章成對數據的統(tǒng)計分析8.2一元線性回歸模型及其應用8.2.1一元線性回歸模型8.2.2第2課時回歸分析及非線性回歸模型學生用書新人教A版選擇性必修第三冊_第4頁
新教材同步備課2024春高中數學第8章成對數據的統(tǒng)計分析8.2一元線性回歸模型及其應用8.2.1一元線性回歸模型8.2.2第2課時回歸分析及非線性回歸模型學生用書新人教A版選擇性必修第三冊_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第2課時回歸分析及非線性回歸模型學習任務1.了解殘差、殘差圖的概念.(數學抽象)2.會通過分析殘差和利用R2判斷回歸模型的擬合效果.(數學運算、數據分析)3.了解非線性回歸模型,掌握對數函數模型、指數函數模型和冪函數模型的求解過程.(數學運算、數學建模)設某幼苗從觀察之日起,第x天的高度為ycm,測得的一些數據如表所示:第x度y/cm0479111213作出這組數的散點圖近似描述y與x的關系,很顯然,這些散點不在一條直線附近.你能求出這個函數模型嗎?知識點1殘差及殘差圖(1)對于響應變量Y,通過觀測得到的數據稱為________.通過經驗回歸方程得到的y稱為________,觀測值減去預測值稱為________.殘差是隨機誤差的估計結果.通過對殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等.(2)作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或解釋變量的觀測值等,這樣作出的圖形稱為________.在殘差圖中,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,這樣的帶狀區(qū)域的寬度________,說明模型擬合精度越高.(3)殘差分析:________是隨機誤差的估計結果,通過對殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱為________.知識點2對模型刻畫數據效果的分析(1)殘差圖法:在殘差圖中,如果殘差比較均勻地集中在以________,則說明經驗回歸方程較好地刻畫了兩個變量的關系.(2)(3)決定系數R2法:可以用R2=來比較兩個模型的擬合效果,R2越________,模型擬合效果越差,R2越________,模型擬合效果越好.決定系數R2的取值范圍是什么?知識點3非線性回歸方程(1)非線性回歸分析的思想研究兩個變量的關系時,依據樣本點畫出散點圖,從整體上看,如果樣本點沒有分布在某個帶狀區(qū)域內,就稱這兩個變量之間不具有線性相關關系,此時不能直接利用經驗回歸方程來建立兩個變量之間的關系.(2)非線性經驗回歸方程當回歸方程不是形如y=bx+a(a,b∈R)時,稱之為非線性經驗回歸方程.當兩個變量不呈線性相關關系時,依據樣本點的分布選擇合適的曲線方程來擬合數據,可通過變量代換,利用線性回歸模型建立兩個變量間的非線性經驗回歸方程.1.思考辨析(正確的畫“√”,錯誤的畫“×”)(1)殘差平方和越接近0,線性回歸模型的擬合效果越好. ()(2)在畫兩個變量的散點圖時,響應變量在x軸上,解釋變量在y軸上. ()(3)R2越小,線性回歸模型的擬合效果越好. ()(4)在殘差圖中,縱坐標為殘差,橫坐標可以選為樣本編號. ()2.在兩個變量y與x的回歸模型中,分別選擇了4個不同的模型,它們的決定系數R2如下,其中擬合效果最好的模型是()A.模型1的決定系數R2為0.98B.模型2的決定系數R2為0.80C.模型3的決定系數R2為0.50D.模型4的決定系數R2為0.253.從某省“雙一流”大學中隨機選出8名女大學生,得到其身高x(單位:cm)與體重y(單位:kg)的數據如下表:x165165157170175165155170y4857505464614359若已知y與x的經驗回歸方程為y=0.85x-85.71,則選取的女大學生身高為175cm時,相應的殘差為________kg.類型1殘差與殘差分析【例1】(1)對變量x,y進行回歸分析時,依據得到的4個不同的回歸模型畫出殘差圖,則下列模型擬合精度最高的是()ABCD(2)已知一系列樣本點(xi,yi)(i=1,2,3,…,n)的經驗回歸方程為y=2x+a,若樣本點(r,1)與(1,s)的殘差相同,則有()A.r=s B.s=2rC.s=-2r+3 D.s=2r+1[嘗試解答](1)殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適.這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高,經驗回歸方程的預報精度越高.(2)殘差是隨機誤差的估計值,ei=y(tǒng)i-yi.[跟進訓練]1.兩個線性相關變量x與y的統(tǒng)計數據如表所示:x99.51010.511y1110865其經驗回歸方程是y=bx+40,則相對應于點(11,5)的殘差為()A.0.1B.0.2C.0.3D.0.42.已知某成對樣本數據的殘差圖如圖,則樣本點數據中可能不準確的是從左到右第________個.類型2殘差平方和與決定系數R2【例2】已知某種商品的價格x(單位:元)與需求量y(單位:件)之間的關系有如下一組數據:x1416182022y1210753(1)求y關于x的經驗回歸方程;(2)借助殘差平方和與R2說明回歸模型擬合效果的好壞.[嘗試解答]刻畫回歸效果的三種方法(1)殘差圖法:殘差點比較均勻地落在水平帶狀區(qū)域內說明選用的模型比較合適.(2)(3)決定系數R2法:R2=1-越接近1,表明模型的擬合效果越好.[跟進訓練]3.為研究質量x(單位:g)對彈簧長度y(單位:cm)的影響,對不同質量的6個物體進行測量,數據如表所示:x51015202530y7.258.128.959.9010.911.8(1)作出散點圖并求經驗回歸方程;(2)求出R2并說明回歸模型擬合的程度;(3)進行殘差分析.類型3非線性回歸分析【例3】為了研究某種細菌隨時間x變化,繁殖的個數y的變化,收集數據如表所示:天數x/天123456繁殖個數y/個612254995190(1)用天數作解釋變量,繁殖個數作響應變量,作出這些數據的散點圖,根據散點圖判斷:y=a+bx與y=c1ec2x哪一個作為繁殖的個數y關于時間x變化的回歸方程類型為最佳?xyzi=1i=1i=13.562.833.5317.5596.50512.04其中(2)根據(1)的判斷最佳結果及表中的數據,建立y關于x的回歸方程.[嘗試解答][母題探究](變設問)在本例條件不變的情況下,試估計第7天細菌繁殖個數.解決非線性回歸問題的方法及步驟(1)確定變量:確定解釋變量為x,響應變量為y.(2)畫散點圖:通過觀察散點圖并與學過的函數(冪、指數、對數函數、二次函數)作比較,選取擬合效果好的函數模型.(3)變量置換:通過變量置換把非線性回歸問題轉化為線性回歸問題.(4)分析擬合效果:通過計算決定系數等來判斷擬合效果.(5)寫出非線性回歸方程.提醒:當數據量較大時,可采用計算器或者數學軟件來求回歸方程.[跟進訓練]4.(源自湘教版教材)實驗中獲得了某化學品的化學反應時間和轉化率的數據如表,試建立轉化率y關于反應時間x的回歸方程(結果保留三位小數).時間x/min6080100120140150160170轉化率y/%6.139.9915.0220.9231.1138.8547.2555.051.下面四個殘差圖中,可以滿足一元線性回歸模型中對隨機誤差的假定的是()ABCD2.下列說法錯誤的是()A.殘差點分布的帶狀區(qū)域越窄,回歸方程的擬合效果越好B.殘差平方和越小,決定系數R2越大C.決定系數R2可以大于1D.通過經驗回歸方程得到的預報值是響應變量的可能取值的平均值,不一定是響應變量的精確值3.甲、乙、丙、丁四位同學各自對A,B兩變量的線性相關性作試驗,并用回歸分析的方法分別求得相關系數r與殘差平方和m如表:甲乙丙丁r0.820.780.690.85m106115124103則________同學的試驗結果體現了A,B兩變量更強的線性相關性.4.在研究兩個變量的相關關系時,觀察散點圖發(fā)現樣本點集中于某一條曲線y=ebx+a的周圍,令z=lny,求得經驗回歸方程為z=0.25x-2.58,則該模型的經驗回歸方程為________.回顧本節(jié)知識,自主完成以下問題:1.對模型刻畫數據效果的分析有哪些常見方法?2.決定系數R2與相關系數r一樣嗎?第2課時回歸分析及非線性回歸模型[必備知識·情境導學探新知]知識點1(1)觀測值預測值殘差(2)殘差圖越窄(3)殘差殘差分析知識點2(1)橫軸為對稱軸的水平帶狀區(qū)域內(3)小大思考提示:0≤R2≤1.課前自主體驗1.(1)√(2)×(3)×(4)√2.A[R2越大擬合效果越好.]3.0.96[當x=175cm時,y=0.85×175-85.71=63.04(kg),∴相應的殘差e=64-63.04=0.96(kg).][關鍵能力·合作探究釋疑難]例1(1)A(2)C[(1)用殘差圖判斷模型的擬合效果,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明這樣的模型比較合適,帶狀區(qū)域的寬度越窄,說明模型的擬合精度越高.(2)樣本點(r,1)的殘差為1-2r-a,樣本點(1,s)的殘差為s-a-2.依題意得1-2r-a=s-a-2,故s=-2r+3.]跟進訓練1.B[由于y=bx+40過樣本中心點(10,8所以8=10b+40,則b=-3.2,因此y=-3.2x+40.當x=11時,y=-3.2×11+40=4.8,所以殘差e=5-y=5-4.8=0.2.]2.6[原始數據中的可疑數據往往是殘差絕對值過大的那個數據,即偏離平衡位置過大.]例2解:(1)x=15×(14+16+18+20+22)=18,y=15×(12+10+7+5所以b==620-5×18a=7.4+1.15×18=28.1,所以所求經驗回歸方程是y=-1.15x+28.1.(2)列出殘差表為yi-y00.3-0.4-0.10.2yi-y4.62.6-0.4-2.4-4.4所以所以回歸模型的擬合效果很好.跟進訓練3.解:(1)散點圖如圖所示.樣本點分布在一條直線附近,y與x具有線性相關關系.由表中數據,得x=16×(5+10+15+20+25+30)y=16×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487i=1計算得b≈0.183,a≈6.285.故所求經驗回歸方程為y=6.285+0.183x.(2)列表如下:yi-y0.050.005-0.08-0.0450.040.025yi-y-2.237-1.367-0.5370.4131.4132.313可得所以R2=1-0.0131814.6783≈0.9991回歸模型的擬合效果較好.(3)由殘差表中的數值可以看出第3個樣本點的殘差比較大,需要確認在采集這個數據的時候是否有人為的錯誤,如果有的話,需要糾正數據,重新建立回歸模型;由表中數據可以看出殘差點比較均勻地落在寬度不超過0.15的狹窄的水平帶狀區(qū)域中,說明選用的線性回歸模型的精度較高,由以上分析可知,彈簧長度與所掛物體的質量成線性關系.例3解:(1)作出散點圖,如圖1所示.由散點圖看出樣本點分布在一條指數函數y=c1ec2x的周圍,于是選擇y=c(2)令z=lny,則z=bx+x123456z1.792.483.223.894.555.25相應的散點圖如圖2.從圖2可以看出,變換后的樣本點分布在一條直線附近,因此可以用經驗回歸方程來擬合.a=z-bx=1.115,得z=則有y=e0.69x+1.115.母題探究解:∵y=e0.69x+1.115,∴當x=7時,y≈382(個),即第7天細菌繁殖個數約為382個.跟進訓練4.解:根據收集的數據作散點圖(圖1).觀察散點圖可知,樣本點并沒有分布在某條直線附近,因而變量y與x之間沒有明顯的線性相關關系,所以不能直接利用線性回歸模型來刻畫這兩個變量之間的關系.根據已有的數學知識,可以認為樣本點分布在指數曲線y=c1ec2x的附近,其中c1和c為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論