山東萊蕪一中新《回歸分析基本思想及其初步應用》_第1頁
山東萊蕪一中新《回歸分析基本思想及其初步應用》_第2頁
山東萊蕪一中新《回歸分析基本思想及其初步應用》_第3頁
山東萊蕪一中新《回歸分析基本思想及其初步應用》_第4頁
山東萊蕪一中新《回歸分析基本思想及其初步應用》_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、其初步應用其初步應用回歸分析的基本思想及回歸分析的基本思想及1.3統(tǒng)計案例統(tǒng)計案例第三章第三章學習目標學習目標v通過典型案例的探究,進一步了解回歸分析的基本思想、方法及初步應用.v學習重點學習重點:通過探究使學生體會有些非線性模型通過變換可以轉化為線性回歸模型,了解在解決實際問題的過程中尋找更好的模型的方法,了解可用殘差分析的方法,比較兩種模型的擬合效果.v學習難點學習難點:了解常用函數(shù)的圖象特點,選擇不同的模型建模,并通過比較相關指數(shù)對不同的模型進行比較.行預報并用回歸直線方程進,直線方程求回歸,點圖其步驟為畫散,進行了研究的方法系的變量利用回歸分析性相關關我們對兩個具有線,中3數(shù)學在.方法

2、析的一種常用分系的兩個變量進行統(tǒng)計是對具有相關關)(析回歸分.定性關系而相關關系是一種非確,性關系函數(shù)關系是一種確定,我們知道analysisregression:,y,x,y,x,y,xnn2211二乘估計公式分別為二乘估計公式分別為截距和斜率的最小截距和斜率的最小我們知道其回歸方程的我們知道其回歸方程的關系的數(shù)據(jù)關系的數(shù)據(jù)對于一組具有線性相關對于一組具有線性相關探究探究 2xbya 1,121niiniiixxyyxxb?.y, x.yy,xn1xn1iin1ii公公式式嗎嗎你你能能推推導導出出這這兩兩個個計計算算稱稱為為其其中中樣本點的樣本點的中心中心.心回歸直線過樣本點的中 yx目的:

3、使各樣本點與這條直線的距離設回歸方程為,越接近越好!(xi,yi )iiyx., xy, Qba ,n1i2ii的值取最小值時分別是使和斜率截距從已經(jīng)學過的知識知道 n1i2iixyxyxy, Q由于2n1iii2iixyxyxyxy2xyxy,xynxyxyxy2xyxy2n1iiin1i2iixyxyxyn1iii注意到n1iiixyxyxyn1in1iiixynxyxy, 0 xynxnynxy2n1i2iixynxyxy, Q所以2n1i2iin1in1ii2i2xynyyyyxx2xx2n1i2in1iiin1i2i2xxyyxxxxxyn.yyxxyyxxn1i2in1i2i2n1

4、iii即有均為當且僅當前兩項的值取最小值因此要使數(shù)而前兩項為非負無關后兩項和在上式中, 0,Q, ,.xy,xxyyxxn1i2in1iii.公式這正是我們所要推導的.,基本思想及其應用基本思想及其應用進一步學習回歸分析的進一步學習回歸分析的下面我們通過案例下面我們通過案例.13,81所示所示重數(shù)據(jù)如表重數(shù)據(jù)如表其身高和體其身高和體名女大學生名女大學生從某大學中隨機選取從某大學中隨機選取例例5943616454505748kg/170155165175170157165165cm/87654321體重體重身高身高編號編號.cm172,的女大學生的體重的女大學生的體重并預報一名身高為并預報一名身

5、高為歸方程歸方程身高預報她的體重的回身高預報她的體重的回求根據(jù)一名女大學生的求根據(jù)一名女大學生的: ) 11.3(.y,x,圖圖作散點體重為因變量真實取身高為自變量因此選據(jù)身高預報體重由于問題中要求根解11.3圖圖xy.,11.3畫它們之間的關系刻性回歸方程以用線因此可線性相關關系較好的重有比高和體身樣本點呈條狀分布中可以看出從圖 12 ,85.712,0.849.0.84985.712.abyx 根據(jù)探究中的公式和可以得到于是得到回歸方程.kg316.60712.85172849.0y,cm172,預報其體重為由回歸方程可以的女大學生對身高為所以11.3圖圖xy?嗎316.60是女大學生的體

6、重一定的172身高探究kgcm.21.3.kg316.60kg316.60cm172,位置說明了這一點本點和回歸直線的相互中的樣圖以認為她的體重接近于但一般可是大學生的體重不一定的女身高顯然21.3圖圖 3, eabxy:,回歸模型來表示可用下面的線性所以身高和體重的關系線的附近而只是散布在某一條直線由于所有的樣本點不共.y,x,yx,exy,稱為預報變量稱為預報變量把把稱為解釋變量稱為解釋變量因此我們把因此我們把的變化的變化只能解釋部分只能解釋部分即即共同確定共同確定素素和隨機因和隨機因的值由的值由在回歸模型中在回歸模型中與函數(shù)關系不同與函數(shù)關系不同 2,.,0,0.:abeybxaeE e

7、D e這里 和 為模型的未知參數(shù) 是 與y之間的誤差通常 為隨機變量 稱為 它的均值方差這樣線性回歸模型的完整表達式為隨機誤差隨機誤差 .eD, 0eE,eabxy2 4 24,.eybxay在線性回歸模型中 隨機誤差 的方差越小通過回歸直線預報真實值 的精度越高隨機誤差是引起預報.,yy 取決于隨機誤差的方差取決于隨機誤差的方差其大小其大小之間的誤差的原因之一之間的誤差的原因之一與真實值與真實值值值 .yy ,ba,ba 21,另一個原因另一個原因之間誤差的之間誤差的與真實值與真實值這種誤差是引起預報值這種誤差是引起預報值之間也存在誤差之間也存在誤差和和它們與真實值它們與真實值的估計值的估計

8、值為截距和斜率為截距和斜率和和中中和和由于公式由于公式另一方面另一方面?e的原因是什么的原因是什么產生隨機誤差項產生隨機誤差項思考思考.e.,.,的產生的產生差項差項誤誤機機隨隨所有這些因素都會導致所有這些因素都會導致是一種近似的模型是一種近似的模型型往往只型往往只我們選用的線性模我們選用的線性模另外另外動、度量誤差等動、度量誤差等食習慣、是否喜歡運食習慣、是否喜歡運例如飲例如飲許多其他因素的影響許多其他因素的影響還受還受身高的影響外身高的影響外一個人的體重值除了受一個人的體重值除了受實際上實際上,?ey探究 在線性回歸模型中 是用y預報真實值 的誤差 它是一個不可觀測的量 那么應該怎樣研究隨

9、機誤差 如何衡量預報的精度., 0,.,2隨機誤差的大小隨機誤差的大小來衡量來衡量因此可以用方差因此可以用方差而隨機誤差的均值為而隨機誤差的均值為于均值程度的數(shù)字特征于均值程度的數(shù)字特征差是反映隨機變量集中差是反映隨機變量集中方方平均水平的數(shù)字特征平均水平的數(shù)字特征值是反映隨機變量取值值是反映隨機變量取值均均畫它的一些總體特征畫它的一些總體特征機變量的數(shù)字特征來刻機變量的數(shù)字特征來刻因此可以通過這個隨因此可以通過這個隨量量因為隨機誤差是隨機變因為隨機誤差是隨機變 .e,y,ye43?e.,2的樣本的樣本變量變量因此也就無法得到隨機因此也就無法得到隨機分離出來分離出來中中我們無法精確地把它從我們

10、無法精確地把它從中中隱含在預報變量隱含在預報變量中的中的或或由于模型由于模型的樣本呢的樣本呢到隨機變量到隨機變量如何得如何得來估計總體方差來估計總體方差的想法是通過樣本方差的想法是通過樣本方差一個自然一個自然的值的值需要估計需要估計為了衡量預報的精度為了衡量預報的精度 , a xby ,21.2歸方程可以建立回和公式根據(jù)截距和斜率的估計樣本的估計值來估計解決問題的途徑是通過 .ey ye , yye.y5y 的估計量是所以由于隨機誤差的估計值中是因此. n, 2 , 1i , abxyyye,y,x,y,x,y,xiiiiinn2211 相應它們的隨機誤差為相應它們的隨機誤差為而言而言對于樣本

11、點對于樣本點, n, 2 , 1i , a xbyy ye iiiii 其估計值為其估計值為,().iiiexyr e s id u a l稱 為 相 應 于 點的殘 差.23相應的殘差數(shù)據(jù)相應的殘差數(shù)據(jù)重的原始數(shù)據(jù)以及重的原始數(shù)據(jù)以及列出女大學生身高和體列出女大學生身高和體表表 382.0883.2627.6137.1618.4419.2627.2373.6e 5943616454505748kg/170155165175170157165165cm/87654321殘差殘差體重體重身高身高編號編號編號編號殘差殘差31.3圖圖.31.3.,.殘殘差差圖圖坐坐標標的的樣樣本本編編號號為為橫橫是

12、是以以圖圖這這樣樣作作出出的的圖圖形形為為等等或或體體重重估估計計值值高高數(shù)數(shù)據(jù)據(jù)或或身身可可選選為為樣樣本本編編號號橫橫坐坐標標縱縱坐坐標標為為殘殘差差作作圖圖時時分分析析殘殘差差特特性性我我們們可可以以利利用用圖圖形形來來殘差圖殘差圖編號編號殘差殘差31.3圖圖.,.,;,.,61,31.3越高越高回歸方程的預報精確度回歸方程的預報精確度擬合精度越高擬合精度越高說明模型說明模型區(qū)域的寬度越窄區(qū)域的寬度越窄均勻地落在水平的帶狀均勻地落在水平的帶狀殘差點比較殘差點比較另外另外則需要尋找其他的原因則需要尋找其他的原因沒有錯誤沒有錯誤如果數(shù)據(jù)采集如果數(shù)據(jù)采集合數(shù)據(jù)合數(shù)據(jù)歸模型擬歸模型擬性回性回利用

13、線利用線然后再重新然后再重新予以糾正予以糾正就就果數(shù)據(jù)采集有錯誤果數(shù)據(jù)采集有錯誤如如是否有人為的錯誤是否有人為的錯誤點的過程中點的過程中兩個樣本兩個樣本需要確認在采集這需要確認在采集這大大個樣本點的殘差比較個樣本點的殘差比較個樣本點和第個樣本點和第第第出出中可以看中可以看從圖從圖.yyy y1R:,R,n1i2in1i2ii22其其計計算算公公式式是是來來刻刻畫畫回回歸歸的的效效果果我我們們還還可可以以用用相相關關指指數(shù)數(shù)另另外外.rR,2的平方的平方系數(shù)系數(shù)恰好等于相關恰好等于相關線性模型中線性模型中在含有一個解釋變量的在含有一個解釋變量的如果對某組數(shù)據(jù)如果對某組數(shù)據(jù)關性越強關性越強量和預報

14、變量的線性相量和預報變量的線性相表示解釋變表示解釋變越接近于越接近于因為因為表示回歸的效果越好表示回歸的效果越好接近于接近于越越化的貢獻率化的貢獻率釋變量對于預報變量變釋變量對于預報變量變表示解表示解在線性回歸模型中在線性回歸模型中模型的擬合效果越好模型的擬合效果越好也就是說也就是說意味著殘差平方和越小意味著殘差平方和越小取值越大取值越大顯然顯然. ), 1R(, 1R.R,.,R,2222.R,R,22據(jù)的模型據(jù)的模型大的模型作為這組數(shù)大的模型作為這組數(shù)選擇選擇可以通過比較幾個可以通過比較幾個也也回歸分析回歸分析種不同的回歸方程進行種不同的回歸方程進行取幾取幾可能性采可能性采.%64, %6

15、4,64.0R,12高引起的高引起的是由身是由身女大學生體重差異有女大學生體重差異有或者說或者說體重變化體重變化的的女大學生身高解釋了女大學生身高解釋了表明表明中中在例在例:,需要注意下列問題用身高預報體重時.,.,.1系木的高與直徑之間的關描述北方干旱地區(qū)的樹方程的高與直徑之間的回歸在南方多雨地區(qū)的樹木不能用生長同樣之間的關系女運動員的身高和體重描述和體重之間的回歸方程不能用女大學生的身高例如所研究的樣本的總體回歸方程只適用于我們.,8020,.2之間的關系描述現(xiàn)在的身高和體重方程建立的回歸年代的身高體重數(shù)據(jù)所世紀能用不例如一般都有時間性我們所建立的回歸方程.),ycm70 x,cm170,

16、cm155x,(,.3顯然不合適值時的程計算而用這個方的樣本的取值范圍為解釋變量即在回歸方程中重之間的關系就不恰當幼兒時期的身高和體那么用它來描述一個人立的建大學生身高和體重數(shù)據(jù)我們的回歸方程是由女例如歸方程的適用范圍樣本取值范圍會影響回.,.4值的平均值它是預報變量的可能取事實上精確值的的預報值就是預報變量不能期望回歸方程得到:,驟為驟為建立回歸模型的基本步建立回歸模型的基本步一般地一般地 ;,1量量是是預預報報變變量量哪哪個個變變量量明明確確哪哪個個變變量量是是解解釋釋變變確確定定研研究究對對象象 ;,2如如是是否否存存在在線線性性關關系系等等觀觀察察它它們們之之間間的的關關系系散散點點圖

17、圖釋釋主主變變量量和和預預報報變變量量的的畫畫出出確確定定好好的的解解 );abxy,(3則則選選用用線線性性回回歸歸方方程程線線性性關關系系如如我我們們觀觀察察到到數(shù)數(shù)據(jù)據(jù)呈呈型型由由經(jīng)經(jīng)驗驗確確定定回回歸歸方方程程類類 );(4乘乘法法如如最最小小二二程程中中的的參參數(shù)數(shù)按按一一定定規(guī)規(guī)則則估估計計回回歸歸方方 .,),(5或模型是否合適等或模型是否合適等則檢查數(shù)據(jù)是否有誤則檢查數(shù)據(jù)是否有誤在異常在異常若存若存律性等等律性等等或殘差呈現(xiàn)不隨機的規(guī)或殘差呈現(xiàn)不隨機的規(guī)應殘差過大應殘差過大個別數(shù)據(jù)對個別數(shù)據(jù)對是否有異常是否有異常得出結果后分析殘差圖得出結果后分析殘差圖.xy,337.xy2之間

18、的回歸方程之間的回歸方程與與試建立試建立中中觀察數(shù)據(jù)列于表觀察數(shù)據(jù)列于表組組現(xiàn)收集了現(xiàn)收集了有關有關和溫度和溫度一只紅鈴蟲的產卵數(shù)一只紅鈴蟲的產卵數(shù)例例33表表325115662421117/y35322927252321C/0個個產卵數(shù)產卵數(shù)溫度溫度41.3圖圖溫溫度度產卵數(shù)產卵數(shù).41.3據(jù)作散點圖根據(jù)收集的數(shù)解所以不能相關關系線性個變量不呈線因此兩帶狀區(qū)域內某個布在有分并沒樣本點在散點圖中,.cc,ecy,.21xc12是待定參數(shù)和其中的周圍指數(shù)函數(shù)曲線某一條可以發(fā)現(xiàn)樣本點分布在根據(jù)已有的函數(shù)知識系立兩個變量之間的關建來直接利用線性回歸方程 .xy,.)cb,clna(abxz, yln

19、z.cc,2121了間的非線性回歸方程之和型來建立就可以利用線性回歸模這樣的周圍直線換后樣本點應該分布在則變令系變?yōu)榫€性關過對數(shù)變換把指數(shù)關系我們可以通和參數(shù)問題變?yōu)槿绾喂烙嫶ìF(xiàn)在 .,abxy線性回歸方程線性回歸方程我們稱之為非我們稱之為非時時當回歸方程不是形如當回歸方程不是形如圖的樣本數(shù)據(jù)表的數(shù)據(jù)可以得到變換后由表, 4333.,51.3.4351.3用線性回歸方程來擬合因此可以一條直線的附近變換后的樣本點分布在看出中可以從圖中數(shù)據(jù)的散點圖給出了表784.5745.4190.4178.3045.3398.2946.1z35322927252321x43 表產卵數(shù)的對數(shù)溫度51.3圖圖.8

20、43.3x272.0z 43到線性回歸方程中的數(shù)據(jù)得由表回歸方程為數(shù)對溫度的非線性因此紅鈴蟲的產卵 10.2723.8435xye.xy,ty,xt,.cc,cxcy41.3,243423非線性回歸方程之間的與從而得到之間的線性回歸方程與立然后建即令變換因此可以對溫度變量做數(shù)為待定參和其中的附近次曲線中樣本點集中在某二可以認為圖另一方面.61.3,53是相應的散點圖圖應的溫度的平方是紅鈴蟲的產卵數(shù)和對表325115662421117y12251024841729625529441t53表.xycxcy,ty,61.3423下面介紹具體方法下面介紹具體方法到到還可以通過殘差分析得還可以通過殘差分

21、析得這個結論這個結論之間的關系之間的關系與與來擬合來擬合二次曲線二次曲線即不宜用即不宜用合它合它回歸方程來擬回歸方程來擬此不宜用線性此不宜用線性因因直線的周圍直線的周圍不分布在一條不分布在一條的散點圖并的散點圖并與與可以看出可以看出中中從圖從圖溫度的平方數(shù)卵產61.3圖圖中用線性回歸模型擬合表的二次回歸方程關于下面建立的指數(shù)回歸方程關于前面已經(jīng)建立了方程歸需要建立兩個相應的回殘差為比較兩個不同模型的52.xy,xy., 222,0.367202.54,0.367202.54.6ytytyxyx的數(shù)據(jù) 得到關于的線性回歸方程即關于的二次回歸方程為 的殘差計算公式分別為和則回歸方程列的數(shù)據(jù)行第第表示表用的擬合效

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論