版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
9.1.2線性回歸方程教學(xué)目標(biāo)1.結(jié)合具體實(shí)例,了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計(jì)意義,了解最小二乘原理.2.掌握一元線性回歸模型參數(shù)的最小二乘估計(jì)方法,會使用相關(guān)的統(tǒng)計(jì)軟件.3.針對實(shí)際問題,會用一元線性回歸模型進(jìn)行預(yù)測.通過前面的學(xué)習(xí)我們已經(jīng)了解到,根據(jù)成對樣本數(shù)據(jù)的散點(diǎn)圖和線性相關(guān)系數(shù),可以推斷兩個變量是否存在相關(guān)關(guān)系以及線性相關(guān)程度的強(qiáng)弱等.若兩個變量具有線性相關(guān)關(guān)系,是否可以像建立函數(shù)模型刻畫兩個變量之間的確定性關(guān)系那樣,通過建立適當(dāng)?shù)臄?shù)學(xué)模型來刻畫兩個變量之間的相關(guān)關(guān)系?并通過模型進(jìn)行預(yù)測?問題1下面我們研究當(dāng)兩個變量線性相關(guān)時,如何利用成對樣本數(shù)據(jù)建立統(tǒng)計(jì)模型,并利用模型進(jìn)行預(yù)測的問題.生活經(jīng)驗(yàn)告訴我們,兒子的身高與父親的身高不僅線性相關(guān),而且還是正相關(guān),即父親的身高較高時,兒子的身高通常也較高.由14對數(shù)據(jù)畫出來的散點(diǎn)圖點(diǎn)大致分布在一條直線附近.情景探究1編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182利用統(tǒng)計(jì)軟件,求得樣本相關(guān)系數(shù)為r≈0.886,表明兒子身高和父親身高正線性相關(guān),且相關(guān)程度較高.隨機(jī)誤差ε母親身高生活環(huán)境飲食習(xí)慣體育鍛煉
……
除父親身高外,還有哪些因素影響兒子的身高?問題2yx假設(shè)沒有隨機(jī)誤差,則兒子身高y只受父親身高x影響,則y=a+bx.雖然父子的身高有較強(qiáng)的線性相關(guān),但是我們無法用一次函數(shù)精確地反映x與y之間的關(guān)系.y的值雖然不能由變量x的值確定,但是卻能表示為a+bx與ε的和,前一部分由x所確定,后一部分是隨機(jī)的.如果ε=0,那么y與x之間的關(guān)系就可用一元線性函數(shù)模型來描述.回歸直線的定義如果散點(diǎn)圖中的樣本點(diǎn)從整體上看,大致在一條直線附近,我們就稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線。一元線性回歸模型的定義我們將y=a+bx+ε稱為線性回歸模型,其中其中a+bx是確定性函數(shù),
ε稱為隨機(jī)誤差。1.隨機(jī)誤差產(chǎn)生的主要原因有(1)所用的確定性函數(shù)不恰當(dāng)引起的誤差;(2)忽略了某些因素的影響;(3)存在觀測誤差等。2.函數(shù)模型與回歸模型之間的差別函數(shù)模型:回歸模型:
一元線性回歸模型y=bx+a+ε增加了隨機(jī)誤差項(xiàng)ε,因變量
y的值由自變量x和隨機(jī)誤差項(xiàng)ε共同確定,即自變量x只能解釋部分y的變化.路程與速度的關(guān)系、正方體體積與邊長的關(guān)系可以應(yīng)用函數(shù)模型刻畫,體重與身高的關(guān)系、冷飲銷量與氣溫的關(guān)系可以用回歸模型刻畫。情景探究2為了研究兩個變量之間的相關(guān)關(guān)系,我們建立了一元線性回歸模型表達(dá)式
刻畫的是變量y與變量x之間的線性相關(guān)關(guān)系,其中參數(shù)a和b未知,我們能否通過樣本數(shù)據(jù)估計(jì)參數(shù)a和b?與函數(shù)模型不同,回歸模型的參數(shù)一般是無法精確求出的,只能通過成對樣本數(shù)據(jù)估計(jì)這兩個參數(shù).參數(shù)a和b刻畫了變量y與變量x的線性關(guān)系,因此通過樣本數(shù)據(jù)估計(jì)這兩個參數(shù),相當(dāng)于尋找一條適當(dāng)?shù)闹本€,使表示成對樣本數(shù)據(jù)的這些散點(diǎn)在整體上與這條直線最接近.
難點(diǎn):如何用數(shù)學(xué)的方法刻畫“從整體上看,各散點(diǎn)與直線最接近”我們會想到利用點(diǎn)到直線y=bx+a的“距離”來刻畫散點(diǎn)與該直線的接近程度,然后用所有“距離”之和刻畫所有樣本觀測數(shù)據(jù)與該直線的接近程度.設(shè)有n對觀測數(shù)據(jù)(xi,yi)(i=1,2,3,···,n),根據(jù)線性回歸模型,對于每一個xi,對應(yīng)的隨機(jī)誤差項(xiàng)εi=y(tǒng)i-(a+bxi),我們希望y=a+bx+ε與y=a+bx越“接近”越好,即|ε1|+|ε2|+···+|εn|越小越好。由于|ε1|+|ε2|+···+|εn|是絕對值之和的形式,這對于進(jìn)一步的運(yùn)算與推導(dǎo)帶來很多不便,而ε1+ε2+···+εn很小并不表示|ε1|+|ε2|+···+|εn|很小,因此通常用“ε12+ε22+···+εn2越小越好”來代替“|ε1|+|ε2|+···+|εn|越小越好”。yx刻畫各樣本觀測數(shù)據(jù)與直線y=bx+a的“整體接近程度”于是,只要求出使
取最小值時的α,β的值,分別將它們作為a和b的估計(jì)值,記為(讀作a估計(jì),b估計(jì)),通過推導(dǎo)可得:其中.隨機(jī)誤差平方和(課本161-163)該公式的推導(dǎo)較復(fù)雜,故不作推導(dǎo),但它的原理較為簡單:即各點(diǎn)到該直線的距離的平方和最小.使樣本數(shù)據(jù)各點(diǎn)到回歸直線的距離的平方和最小來得到回歸直線的方法叫做最小二乘法.這里的“二乘”是平方的意思.線性回歸方程的定義設(shè)有n對觀測數(shù)據(jù)(xi,yi)(i=1,2,3,···,n),我們將由公式(其中)得到的直線稱為n對數(shù)據(jù)的回歸直線,此直線方程稱為線性回歸方程,其中稱為回歸截距,稱為回歸系數(shù),稱為回歸值。(讀作a估計(jì),b估計(jì))因?yàn)?/p>
,所以線性回歸方程經(jīng)過樣本中心點(diǎn),即線性回歸直線經(jīng)過點(diǎn)
注意:題型剖析題型一線性回歸方程的認(rèn)識與求解1、(多選)有關(guān)線性回歸的說法,正確的是(
)(A)相關(guān)關(guān)系的兩個變量不是因果關(guān)系(B)散點(diǎn)圖能直接反映數(shù)據(jù)的相關(guān)程度(C)回歸直線最能代表線性相關(guān)的兩個變量之間的關(guān)系(D)任意一組數(shù)據(jù)都有回歸方程ABC2.以下四個散點(diǎn)圖中,兩個變量的關(guān)系適合用線性回歸模
型刻畫的是(
)
(A)①② (B)①③(C)②③ (D)③④B(A)(B)(C)(D)3.三點(diǎn)(3,10),(7,20),(11,24)的線性回歸方程是()D4.已知y與x之間的線性回歸方程為,其樣本點(diǎn)的中心為(3,y),樣本數(shù)據(jù)中y的取值依次為2.5,m,3.4,4.2,5.4,則m的值為()(A)2(B)2.8(C)3(D)3.2Cx24568y20406070805.對具有線性相關(guān)關(guān)系的變量x,y,測得一組數(shù)據(jù)如下表,根據(jù)表中數(shù)據(jù),利用最小二乘法得到回歸直線方程
,據(jù)此模型預(yù)測當(dāng)x=20時,y的估計(jì)值為()(A)210(B)210.5 (C)211.5(D)212.5C
3456
2.5344.5(1)請畫出上表數(shù)據(jù)的散點(diǎn)圖;
解:(1)由題設(shè)所給數(shù)據(jù)可得散點(diǎn)圖,如圖.
例2、下表為某地近幾年機(jī)動車車輛數(shù)與交通事故數(shù)的統(tǒng)計(jì)
資料,請判斷機(jī)動車車輛數(shù)與交通事故數(shù)之間是否具
有線性相關(guān)關(guān)系,如果具有線性相關(guān)關(guān)系,求出線性
回歸方程;如果不具有線性相關(guān)關(guān)系,說明理由。機(jī)動車輛數(shù)x/103輛95110112120129135150180交通事故數(shù)y/103件6.27.57.78.58.79.810.213解:計(jì)算相應(yīng)的數(shù)據(jù)之和:代入公式可得相關(guān)系數(shù)r=0.9927,故兩個變量之間具有很強(qiáng)的線性相關(guān)關(guān)系.代入公式可得:因此,所求線性回歸方程為(1)作出散點(diǎn)圖或求出相關(guān)系數(shù),分析數(shù)據(jù)間是否存在線性相關(guān)關(guān)系;
(4)寫出回歸方程并對實(shí)際問題作出估計(jì).求經(jīng)驗(yàn)回歸方程的基本步驟解:由表中的數(shù)據(jù)可得例3、統(tǒng)計(jì)學(xué)家K.Pearson收集了大量父親和兒子的身高數(shù)
據(jù),下表是從中隨機(jī)抽取的10對父子的身高數(shù)據(jù),父親的身高x/cm152.4157.5162.6165.1167.6兒子的身高y/cm161.3165.6167.6166.4169.9父親的身高x/cm170.2172.7177.8182.9188.0兒子的身高y/cm170.4171.2173.5178.1177.8試估計(jì)父親身高為166cm時,他兒子的身高。由公式可得:因此,所求線性回歸方程為當(dāng)x=166時,,即父親的身高為166cm時,他的兒子的身高約為168cm。根據(jù)線性相關(guān)系數(shù)公式可得r=0.9801,說明父親與兒子的身高之間具有很強(qiáng)的線性相關(guān)關(guān)系,通過觀測得到的數(shù)據(jù)稱為觀測值,通過線性回歸方程得到的稱為估計(jì)值,觀測值減去對應(yīng)的估計(jì)值稱為殘差.殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.殘差殘差圖為了使數(shù)據(jù)更加直觀,用父親身高作為橫坐標(biāo),殘差作為縱坐標(biāo),可以畫出殘差圖,如圖下所示觀察殘差的散點(diǎn)圖可以發(fā)現(xiàn),殘差有正有負(fù),比較均勻地分布在橫軸的兩邊.說明殘差比較符合一元線性回歸模型的假定,好的回歸方程對應(yīng)的殘差散點(diǎn)圖應(yīng)是均勻地分布在橫軸兩側(cè)的帶狀區(qū)域內(nèi).且?guī)顓^(qū)域越窄,說明模型擬合效果越好.一般地
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 光伏組件回收產(chǎn)業(yè)鏈分析
- 二零二五版天然氣運(yùn)輸合同協(xié)議書范本模板(含運(yùn)輸保險)2篇
- 二零二五年度行政協(xié)議指導(dǎo)大全:環(huán)境保護(hù)合作協(xié)議3篇
- 婚慶行業(yè)安全生產(chǎn)工作總結(jié)
- 2025版物流企業(yè)物流外包合作協(xié)議6篇
- 二零二五年度綠色能源裝備制造個人股東股權(quán)轉(zhuǎn)讓合同2篇
- 光纖通信技術(shù)應(yīng)用知到智慧樹章節(jié)測試課后答案2024年秋四川職業(yè)技術(shù)學(xué)院
- 二零二五版實(shí)習(xí)期員工勞動合同-實(shí)習(xí)期間安全防護(hù)3篇
- 二零二五年度酒店客房裝修與設(shè)施更新合同4篇
- 二零二五版?zhèn)D(zhuǎn)股投資合作協(xié)議書(產(chǎn)業(yè)鏈整合)3篇
- 北京市北京四中2025屆高三第四次模擬考試英語試卷含解析
- 2024年快遞行業(yè)無人機(jī)物流運(yùn)輸合同范本及法規(guī)遵循3篇
- 傷殘撫恤管理辦法實(shí)施細(xì)則
- 2024-2030年中國產(chǎn)教融合行業(yè)市場運(yùn)營態(tài)勢及發(fā)展前景研判報告
- 2024年微生物檢測試劑行業(yè)商業(yè)計(jì)劃書
- 高中英語選擇性必修一單詞表
- 物業(yè)公司介紹
- (正式版)SHT 3551-2024 石油化工儀表工程施工及驗(yàn)收規(guī)范
- 【永輝超市公司員工招聘問題及優(yōu)化(12000字論文)】
- 中國直銷發(fā)展四個階段解析
- 2024屆浙江省寧波市鎮(zhèn)海區(qū)鎮(zhèn)海中學(xué)高一物理第一學(xué)期期末質(zhì)量檢測試題含解析
評論
0/150
提交評論