一元線性回歸模型參數(shù)的最小二乘估計(2)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第1頁
一元線性回歸模型參數(shù)的最小二乘估計(2)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第2頁
一元線性回歸模型參數(shù)的最小二乘估計(2)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第3頁
一元線性回歸模型參數(shù)的最小二乘估計(2)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第4頁
一元線性回歸模型參數(shù)的最小二乘估計(2)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第5頁
已閱讀5頁,還剩20頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

8.2.2一元線性回歸模型參數(shù)的最小二乘估計(2)最小二乘法:我們將

稱為Y關(guān)于x的

,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗回歸直線.這種求經(jīng)驗回歸方程的方法叫做

,求得的

,叫做

b,a

,經(jīng)驗回歸方程最小二乘法最小二乘估計復(fù)習(xí)引入其中思考1:已知兒子身高關(guān)于父親身高x的經(jīng)驗回歸方程為

如果一位父親的身高為176cm,他兒子長大成人后的身高一定是177cm嗎?為什么?顯然不一定,因為還有其他影響兒子身高的因素,父親身高不能完全決定兒子身高.

不過,我們可以作出推測,當(dāng)父親身高為176cm時,兒子身高一般在177cm左右.實際上,如果把這所學(xué)校父親身高為176cm的所有兒子身高作為一個子總體,那么177cm是這個子總體的均值的估計值.追問:根據(jù)經(jīng)驗回歸方程

中斜率的具體含義,高個子的父親一定生高個子的兒子嗎?同樣,矮個子的父親一定生矮個子的兒子嗎?這里的經(jīng)驗回歸方程

,其斜率0.839可以解釋為父親身高每增加1cm,其兒子的身高平均增加0.839cm.分析模型可以發(fā)現(xiàn),高個子父親有生高個子兒子的趨勢,但一群高個子父親的兒子們的平均身高要低于父親們的平均身高,例如x=185(cm),則矮個子父親有生矮個子兒子的趨勢,但一群矮個子父親的兒子們的平均身高要高于父親們的平均身高,例如x=170(cm),則英國著名統(tǒng)計學(xué)家高爾頓把這種后代的身高向中間值靠近的趨勢稱為“回歸現(xiàn)象”.后來,人們把由一個變量的變化去推測另一個變量的變化的方法稱為回歸分析.x(s)5101520304050607090120y(μm)610101316171923252946在某種產(chǎn)品表面進行腐蝕刻線試驗,得到腐蝕深度y(μm)與腐蝕時間x(s)之間的一組觀察值如表.(1)畫出散點圖;(2)求y關(guān)于x的經(jīng)驗回歸方程;(3)利用經(jīng)驗回歸方程預(yù)測時間為100s時腐蝕深度為多少.解:(1)散點圖如圖所示,例題x(s)5101520304050607090120y(μm)610101316171923252946∴y關(guān)于x的經(jīng)驗回歸方程為解:(3)根據(jù)(2)求得的經(jīng)驗回歸方程,當(dāng)腐蝕時間為100s時,即腐蝕時間為100s時腐蝕深度為約35.76μm.課本113頁∴估計女兒的身高為168cm左右.1.假如女兒身高y(單位:cm)關(guān)于父親身高x(單位:cm)的經(jīng)驗回歸方程為

已知父親身高為175cm,請估計女兒的身高.解:練習(xí)2.某研究機構(gòu)對高三學(xué)生的記憶力x和判斷力y進行統(tǒng)計分析,得如表數(shù)據(jù):(1)請畫出上表數(shù)據(jù)的散點圖;解:散點圖如圖所示.x681012y2356x681012y2356x681012y2356故經(jīng)驗回歸方程為

=0.7x-2.3.(3)試根據(jù)求出的經(jīng)驗回歸方程,預(yù)測記憶力為9的同學(xué)的判斷力.即預(yù)測記憶力為9的同學(xué)的判斷力為4.對于響應(yīng)變量Y,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗回歸方程得到的

稱為預(yù)測值,觀測值減去預(yù)測值稱為殘差,即

例如,對于下表中的第6個觀測,父親身高為172cm,其兒子身高的觀測值為y6=176(cm),預(yù)測值為殘差為176-173.265=2.735(cm).編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182探究:殘差分析殘差是隨機誤差的估計結(jié)果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.編號父親身高/cm兒子身高觀測值/cm兒子身高預(yù)測值/cm殘差/cm1174176174.9431.0572170176171.5874.4133173170174.104-4.1044169170170.748-0.7485182185181.6553.3456172176173.2652.7357180178179.977-1.9778172174173.2650.7359168170169.9090.09110166168168.231-0.23111182178181.655-3.65512173172174.104-2.1041316416566.553-1.55314180182179.9772.023殘差表:類似地,我們還可以得到其他的殘差,如下表所示.為了使數(shù)據(jù)更加直觀,用父親身高作為橫坐標(biāo),殘差作為縱坐標(biāo),可以畫出殘差圖,如圖下所示.殘差圖:012345-1-2-3-4-5160165170175180185殘差/cm父親身高/cm??????????????觀察殘差圖可以直觀判斷模型是否滿足一元線性回歸模型的假設(shè).觀察殘差的散點圖可以發(fā)現(xiàn),殘差比較均勻地分布在橫軸的兩邊.說明殘差比較符合一元線性回歸模型的假定,是均值為0、方差為σ2的隨機變量的觀測值.可見,通過一般地,建立經(jīng)驗回歸方程后,通常需要對模型刻畫數(shù)據(jù)的效果進行分析.借助殘差分析還可以對模型進行改進,使我們能根據(jù)改進模型作出更符合實際的預(yù)測與決策.思考2:

觀察下列四幅殘差圖,你認為哪一個殘差滿足一元線性回歸模型中對隨機誤差的假定?圖(1)顯示殘差與觀測時間有線性關(guān)系,應(yīng)將時間變量納入模型;圖(2)顯示殘差與觀測時間有非線性關(guān)系,應(yīng)在模型中加入時間的非線性函數(shù)部分;圖(3)說明殘差的方差不是一個常數(shù),隨觀測時間變大而變大圖(4)的殘差比較均勻地集中在以取值為0的橫軸為對稱軸的水平帶狀區(qū)域內(nèi).所以在四幅殘差圖中,只有圖(4)滿足一元線性回歸模型對隨機誤差的假設(shè).一般地,建立經(jīng)驗回歸方程后,通常需要對模型刻畫數(shù)據(jù)的效果進行分析.借助殘差分析還可以對模型進行改進,使我們能根據(jù)改進模型作出更符合實際的預(yù)測與決策.2.原始數(shù)據(jù)中的可疑數(shù)據(jù)往往是殘差絕對值過大的數(shù)據(jù);3.對數(shù)據(jù)刻畫效果比較好的殘差圖特征:殘差點比較均勻的集中在水平帶狀區(qū)域內(nèi).1.殘差等于觀測值減預(yù)測值殘差的性質(zhì):歸納總結(jié)課本113頁

計算表8.2-2中的所有殘差之和,你能發(fā)現(xiàn)什么規(guī)律?解:經(jīng)計算可知殘差的總和為0.027.但是即理論上殘差的總和應(yīng)等于0,這個誤差是由于計算過程中四舍五入的原因?qū)е?1.工人工資y(元)與勞動生產(chǎn)率x(千元)的相關(guān)關(guān)系的經(jīng)驗回歸方程為

=50+80x,下列判斷正確的是(

)A.勞動生產(chǎn)率為1000元時,工人工資為130元B.勞動生產(chǎn)率提高1000元時,工人工資平均提高80元C.勞動生產(chǎn)率提高1000元時,工人工資平均提高130元D.當(dāng)月工資為250元時,勞動生產(chǎn)率為2000元解析:因為經(jīng)驗回歸直線的斜率為80,所以x每增加1,y平均增加80,即勞動生產(chǎn)率提高1000元時,工人工資平均提高80元.隨堂檢測2.對變量x,y進行回歸分析時,依據(jù)得到的4個不同的回歸模型畫出殘差圖,則下列模型擬合精度最高的是(

)解析:用殘差A(yù)圖判斷模型的擬合效果,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明這樣的模型比較合適.帶狀區(qū)域的寬度越窄,說明模型的擬合精度越高.3.某種產(chǎn)品的廣告支出費用x(單位:萬元)與銷售額y(單位:萬元)的數(shù)據(jù)如下表:x24568y3040605070104.某工廠對某產(chǎn)品的產(chǎn)量與成本的資料分析后有如下數(shù)據(jù):產(chǎn)量x(千件)2356成本y(萬元)7891214.5年份x20162017201820192020儲蓄存款額y/千億元5678105.某地隨著經(jīng)濟的發(fā)展,居民收入逐年增長,該地一銀行連續(xù)五年年底的儲蓄存款情況如下表所示.為了計算方便,工作人員將上表的數(shù)據(jù)進行了處理,令t=x-2015,z=y(tǒng)-5,得到下表.t12345z01235(1)求z關(guān)于t的經(jīng)驗回歸方程;(2)通過(1)中的方程,求出y關(guān)于x的經(jīng)驗回歸方程;(3)用所求經(jīng)驗回歸方程預(yù)測到2022年年底,該地此銀行儲蓄存款額可達到多少?t12345z01235解:∴z關(guān)于t的經(jīng)驗回歸方程為∴y關(guān)于x的經(jīng)驗回歸方程為∴預(yù)測到2022年年底,該地此銀行儲蓄存款額可達到12千億元.課堂小結(jié)1.殘差:對于響應(yīng)變量Y,通過觀測得到的數(shù)據(jù)稱為

值,通過經(jīng)驗回歸方程得到的

稱為

,

減去

稱為殘差.2.殘差分析:

是隨機

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論