版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
8.2.1一元線性回歸模型通過前面的學(xué)習(xí)我們已經(jīng)了解到,根據(jù)成對樣本數(shù)據(jù)的散點(diǎn)圖和樣本相關(guān)系數(shù),可以推斷兩個(gè)變量是否存在相關(guān)關(guān)系、是正相關(guān)還是負(fù)相關(guān),以及線性相關(guān)程度的強(qiáng)弱等.進(jìn)一步地,如果能像建立函數(shù)模型刻畫兩個(gè)變量之間的確定性關(guān)系那樣,通過建立適當(dāng)?shù)慕y(tǒng)計(jì)模型刻畫兩個(gè)隨機(jī)變量的相關(guān)關(guān)系,那么我們就可以利用這個(gè)模型研究兩個(gè)變量之間的隨機(jī)關(guān)系,并通過模型進(jìn)行預(yù)測.下面我們研究當(dāng)兩個(gè)變量線性相關(guān)時(shí),如何利用成對樣本數(shù)據(jù)建立統(tǒng)計(jì)模型,并利用模型進(jìn)行預(yù)測的問題.創(chuàng)設(shè)情境問題1:生活經(jīng)驗(yàn)告訴我們,兒子的身高與父親的身高不僅線性相關(guān),而且還是正相關(guān),即父親的身高較高時(shí),兒子的身高通常也較高.為了進(jìn)一步研究兩者之間的關(guān)系,有人調(diào)查了14名男大學(xué)生的身高及其父親的身高,得到的數(shù)據(jù)如下表所示.編號(hào)1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182探究:一元線性回歸模型思考1:根據(jù)表中的數(shù)據(jù),兒子身高和父親身高這兩個(gè)變量之間的關(guān)系可以用函數(shù)模型刻畫嗎?…172…父親身高…176174…兒子身高兒子身高不是父親身高的函數(shù)61721768172174編號(hào)1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182思考1:根據(jù)表中的數(shù)據(jù),兒子身高和父親身高這兩個(gè)變量之間的關(guān)系可以用函數(shù)模型刻畫嗎?61721768172174…170…兒子身高…173169…父親身高父親身高不是兒子身高的函數(shù)31731709169170利用前面表示數(shù)據(jù)的方法,以橫軸表示父親身高、縱軸表示兒子身高建立直角坐標(biāo)系,再將表中的成對樣本數(shù)據(jù)表示為散點(diǎn)圖,如右圖所示.思考2:經(jīng)過剛才的分析,你覺得兒子身高與父親身高的關(guān)系是怎樣的?兒子身高與父親身高不是函數(shù)關(guān)系,而是相關(guān)關(guān)系.兒子身高與父親身高不是函數(shù)關(guān)系,而是相關(guān)關(guān)系.追問:兒子身高與父親身高的關(guān)系是正相關(guān)還是負(fù)相關(guān)?是線性相關(guān)還是曲線相關(guān)?隨著父親身高的增加,兒子身高呈增加的趨勢,所以是正相關(guān).兒子身高與父親身高呈正線性相關(guān)關(guān)系.思考3:你能否進(jìn)一步驗(yàn)證剛才的結(jié)論?
樣本相關(guān)系數(shù)為:表明兒子身高和父親身高正線性相關(guān),且相關(guān)程度較高.思考4:除父親身高外,還有哪些因素影響兒子的身高?隨機(jī)誤差e母親身高生活環(huán)境飲食習(xí)慣體育鍛煉
……追問:如何理解隨機(jī)誤差e對兒子身高的影響?假設(shè)沒有隨機(jī)誤差,則兒子身高Y只受父親身高x影響,則事實(shí)上,相關(guān)系數(shù),故也可以記作思考5:隨機(jī)誤差e有哪些特征?隨機(jī)誤差e是一個(gè)隨機(jī)變量①可取正或取負(fù)②有些無法測量③不可事先設(shè)定因?yàn)檎`差是隨機(jī)的,即取各種正負(fù)誤差的可能性一樣,所以它們均值的理想狀態(tài)應(yīng)該為0.追問:為什么要假設(shè)E(e)=0,而不假設(shè)其為某個(gè)不為0的常數(shù)?思考6:你能否考慮到上述隨機(jī)因素的作用,用類似于函數(shù)的表達(dá)式,表達(dá)兒子身高與父親身高的關(guān)系嗎?若用x表示父親身高,Y表示兒子身高,e表示隨機(jī)誤差.假定隨機(jī)誤差e的均值為0,方差為與父親身高無關(guān)的定值σ2,則它們之間的關(guān)系可以表示為我們稱(1)式為Y關(guān)于x的一元線性回歸模型.其中,Y稱為因變量或響應(yīng)變量,x稱為自變量或解釋變量;a和b為模型的未知參數(shù),a稱為截距參數(shù),b稱為斜率參數(shù);e是Y與bx+a之間的隨機(jī)誤差.模型中的Y也是隨機(jī)變量,其值雖不能由變量x的值確定,但卻能表示為bx+a與e的和,前一部分由x所確定,后一部分是隨機(jī)的.如果e=0,那么Y與x之間的關(guān)系就可用一元線性函數(shù)模型來描述.函數(shù)模型與回歸模型有什么區(qū)別?追問1:你能結(jié)合父親與兒子身高的實(shí)例,說明回歸模型(1)的意義?
追問2:對于父親身高為xi的某一名男大學(xué)生,他的身高yi一定是bxi+a嗎?
思考7:你能結(jié)合具體實(shí)例解釋產(chǎn)生模型(1)中隨機(jī)誤差項(xiàng)的原因嗎?在研究兒子身高與父親身高的關(guān)系時(shí),產(chǎn)生隨機(jī)誤差e的原因有:(1)除父親身高外,其他可能影響兒子身高的因素,比如母親身高、生活環(huán)境、飲食習(xí)慣和鍛煉時(shí)間等;(2)在測量兒子身高時(shí),由于測量工具、測量精度所產(chǎn)生的測量誤差;(3)實(shí)際問題中,我們不知道兒子身高和父親身高的相關(guān)關(guān)系是什么,可以利用一元線性回歸模型來近似這種關(guān)系,這種近似也是產(chǎn)生隨機(jī)誤差e的原因.在一元線性回歸模型y=bx+a+e中,隨機(jī)誤差e產(chǎn)生的原因有:(1)所用的確定性函數(shù)不恰當(dāng)引起的誤差;(2)忽略了某些因素的影響;(3)存在觀測誤差.歸納總結(jié)課本107頁說明函數(shù)模型與回歸模型的區(qū)別,并分別舉出兩個(gè)應(yīng)用函數(shù)模型和回歸模型的例子.解:函數(shù)模型刻畫的是變量之間具有的函數(shù)關(guān)系,是一種確定性的關(guān)系.回歸模型刻畫的是變量之間具有的相關(guān)關(guān)系,不是一種確定性的關(guān)系,即回歸模型刻畫的是兩個(gè)變量之間的隨機(jī)關(guān)系.例如,路程與速度的關(guān)系、正方體體積與邊長的關(guān)系可以應(yīng)用函數(shù)模型刻畫;體重與身高的關(guān)系、冷飲銷量與氣溫的關(guān)系可以應(yīng)用回歸模型刻畫.練習(xí)2.在一元線性回歸模型(1)中,參數(shù)b的含義是什么?解:參數(shù)b的含義可以解釋為解釋變量x對響應(yīng)變量Y的均值的影響,變量x每增加1個(gè)單位,響應(yīng)變量Y的均值將增加b個(gè)單位.例如,教科書中父親身高為175cm的兒子身高的均值比父親身高為174cm的兒子身高的均值高出0.839cm.注意:因?yàn)轫憫?yīng)變量Y最終取值,除了受變量x的影響,還要受隨機(jī)誤差e的影響,所以不能解釋成解釋變量x每增加一個(gè)單位,響應(yīng)變量Y增加b個(gè)單位.課本107頁例:若某地財(cái)政收入x與支出y滿足一元線性回歸模型y=bx+a+e(單元:億元),其中b=0.7,a=3,|e|≤0.5,如果今年該地區(qū)財(cái)政收入10億元,年支出預(yù)計(jì)不會(huì)超過多少?解:因?yàn)樨?cái)政收入x與支出y滿足一元線性回歸模型y=bx+a+e,其中b=0.7,a=3,所以得到
y=0.7x+3+e,當(dāng)x=10時(shí),得y=0.7×10+3+e=10+e,而|e|≤0.5,即-0.5≤e≤0.5,所以9.5≤y≤10.5,所以年支出預(yù)計(jì)不會(huì)超過10.5億元.例題隨堂檢測1.在線性回歸模型y=bx+a+e中,下列說法正確的是(
)A.y=bx+a+e是一次函數(shù)B.因變量y是由自變量x唯一確定的C.因變量y除了受自變量x的影響外,可能還受到其它因素的影響,這些因素會(huì)導(dǎo)致隨機(jī)誤差e的產(chǎn)生D.隨機(jī)誤差e是由于計(jì)算不準(zhǔn)確造成的,可通過精確計(jì)算避免隨機(jī)誤差e的產(chǎn)生解析:選項(xiàng)A,在線性回歸模型y=bx+a+e中,方程表示的不是函數(shù)關(guān)系,因此不是一次函數(shù),故A錯(cuò)誤;選項(xiàng)B,因變量y不是由自變量x唯一確定的,故B錯(cuò)誤;選項(xiàng)D,隨機(jī)誤差是不能避免的,只能將誤差縮小,但是不能沒有誤差,故D錯(cuò)誤,只有選項(xiàng)C成立.2.判斷下列變量間哪些能用函數(shù)模型刻畫,哪些能用回歸模型刻畫?(1)某公司的銷售收入和廣告支出;(2)某城市寫字樓的出租率和每平米月租金;(3)航空公司的顧客投訴次數(shù)和航班正點(diǎn)率;(4)某地區(qū)的人均消費(fèi)水平和人均國內(nèi)生產(chǎn)總值(GDP);(5)學(xué)生期末考試成績和考前用于復(fù)習(xí)的時(shí)間;(6)一輛汽車在某段路程中的行駛速度和行駛時(shí)間;(7)正方形的面積與周長.解:(1)(2)(3)(4)(5)回歸模型,(6)(7)函數(shù)模型.時(shí)間x(s)5101520304050607090120深度Y(μm)581013161719232529462.建立一元線性回歸模型的步驟1.一元線性回歸模型(1)與函數(shù)模型的區(qū)別(2)隨機(jī)誤差產(chǎn)生的原因及分布定性分析定量分析函數(shù)關(guān)系或相關(guān)關(guān)系或沒有關(guān)系課堂小結(jié)其中,Y稱為因變量或響應(yīng)變量,x稱為自變量或解釋變量;a和b為模型的未知參數(shù),
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 四年級數(shù)學(xué)(三位數(shù)乘兩位數(shù))計(jì)算題專項(xiàng)練習(xí)及答案
- 三年級數(shù)學(xué)(上)計(jì)算題專項(xiàng)練習(xí)附答案
- 生態(tài)保護(hù)工程基礎(chǔ)知識(shí)考核試卷
- 2024年度廣西壯族自治區(qū)國家保安員資格考試押題練習(xí)試卷A卷附答案
- 白酒品牌與傳統(tǒng)醫(yī)藥文化合作考核試卷
- 現(xiàn)代康復(fù)治療技術(shù)考核試卷
- 電感器在電動(dòng)汽車驅(qū)動(dòng)系統(tǒng)中的應(yīng)用考核試卷
- 煙草種植安全生產(chǎn)標(biāo)準(zhǔn)化考核試卷
- 海洋漁業(yè)資源與海洋資源科技創(chuàng)新推動(dòng)與應(yīng)用實(shí)踐探索創(chuàng)新引領(lǐng)考核試卷
- 環(huán)保項(xiàng)目環(huán)境盡職調(diào)查要點(diǎn)考核試卷
- 山東省濟(jì)南市2023-2024學(xué)年高一上學(xué)期1月期末考試 物理 含答案
- 科研設(shè)計(jì)及研究生論文撰寫智慧樹知到期末考試答案章節(jié)答案2024年浙江中醫(yī)藥大學(xué)
- 2024年江蘇省普通高中學(xué)業(yè)水平測試小高考生物、地理、歷史、政治試卷及答案(綜合版)
- 浙江省杭州市西湖區(qū)2023-2024學(xué)年六年級上學(xué)期期末語文試卷
- 8 泵站設(shè)備安裝工程單元工程質(zhì)量驗(yàn)收評定表及填表說明
- 擋風(fēng)玻璃自動(dòng)涂膠方案
- 四層電梯控制系統(tǒng)設(shè)計(jì)-(共38頁)
- 資產(chǎn)損失鑒證報(bào)告(范本)
- 配電房施工方案及技術(shù)措施
- 數(shù)值分析實(shí)驗(yàn)報(bào)告
- 血漿置換治療兒童溶血尿毒綜合征專家共識(shí)解讀(完整版)
評論
0/150
提交評論