高中數(shù)學(xué)《8.2 一元線(xiàn)性回歸模型及其應(yīng)用》課件、導(dǎo)學(xué)案與同步練習(xí)_第1頁(yè)
高中數(shù)學(xué)《8.2 一元線(xiàn)性回歸模型及其應(yīng)用》課件、導(dǎo)學(xué)案與同步練習(xí)_第2頁(yè)
高中數(shù)學(xué)《8.2 一元線(xiàn)性回歸模型及其應(yīng)用》課件、導(dǎo)學(xué)案與同步練習(xí)_第3頁(yè)
高中數(shù)學(xué)《8.2 一元線(xiàn)性回歸模型及其應(yīng)用》課件、導(dǎo)學(xué)案與同步練習(xí)_第4頁(yè)
高中數(shù)學(xué)《8.2 一元線(xiàn)性回歸模型及其應(yīng)用》課件、導(dǎo)學(xué)案與同步練習(xí)_第5頁(yè)
已閱讀5頁(yè),還剩189頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

人教2019A版選擇性必修第三冊(cè)

第八章

成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析

8.2一元線(xiàn)性回歸模型及其應(yīng)用學(xué)習(xí)目標(biāo)1.能通過(guò)具體實(shí)例說(shuō)明一元線(xiàn)性回歸模型修改的依據(jù)與方法.2.通過(guò)對(duì)具體問(wèn)題的進(jìn)一步分析,能將某些非線(xiàn)性回歸問(wèn)題轉(zhuǎn)化為線(xiàn)

性回歸問(wèn)題并加以解決,提高數(shù)學(xué)運(yùn)算能力.3.能通過(guò)實(shí)例說(shuō)明決定系數(shù)R2的意義和作用,提高數(shù)據(jù)分析能力。問(wèn)題導(dǎo)學(xué)通過(guò)前面的學(xué)習(xí)我們已經(jīng)了解到,根據(jù)成對(duì)樣本數(shù)據(jù)的散點(diǎn)圖和樣本相關(guān)系數(shù),可以推斷兩個(gè)變量是否存在相關(guān)關(guān)系、是正相關(guān)還是負(fù)相關(guān),以及線(xiàn)性相關(guān)程度的強(qiáng)弱等.如果能像建立函數(shù)模型刻畫(huà)兩個(gè)變量之間的確定性關(guān)系那樣,通過(guò)建立適當(dāng)?shù)慕y(tǒng)計(jì)模型刻畫(huà)兩個(gè)隨機(jī)變量的相關(guān)關(guān)系,那么我們就可以利用這個(gè)模型研究?jī)蓚€(gè)變量之間的隨機(jī)關(guān)系,并通過(guò)模型進(jìn)行預(yù)測(cè).探究1:生活經(jīng)驗(yàn)告訴我們,兒子的身高與父親的身高相關(guān).一般來(lái)說(shuō),父親的身高較高時(shí),兒子的身高通常也較高.為了進(jìn)一步研究?jī)烧咧g的關(guān)系,有人調(diào)查了14名男大學(xué)生的身高及其父親的身高,得到的數(shù)據(jù)如表所示.問(wèn)題探究編號(hào)1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182可以發(fā)現(xiàn),散點(diǎn)大致分布在一條從左下角到右上角的直線(xiàn)附近,表明兒子身高和父親身高線(xiàn)性相關(guān).利用統(tǒng)計(jì)軟件,求得樣本相關(guān)系數(shù)為r≈0.886,表明兒子身高和父親身高正線(xiàn)性相關(guān),且相關(guān)程度較高。父親身高/cm180175170165160160165170175180185190·······兒子身高/cm·······185探究2.根據(jù)表中的數(shù)據(jù),兒子身高和父親身高這兩個(gè)變量之間的關(guān)系可以用函數(shù)模型刻畫(huà)嗎?問(wèn)題探究編號(hào)1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182

表中的數(shù)據(jù),存在父親身高相同而兒子身高不同的情況.例如,第6個(gè)和第8個(gè)觀(guān)測(cè)父親的身高均為172cm,而對(duì)應(yīng)的兒子的身高為176cm和174cm;同樣在第3,4個(gè)觀(guān)測(cè)中,兒子的身高都是170cm,而父親的身高分別為173cm,169cm.可見(jiàn)兒子的身高不是父親身高的函數(shù)同樣父親的身高也不是兒子身高的函數(shù),所以不能用函數(shù)模型來(lái)刻畫(huà).探究3:從成對(duì)樣本數(shù)據(jù)的散點(diǎn)圖和樣本相關(guān)系數(shù)可以發(fā)現(xiàn),散點(diǎn)大致分布在一條直線(xiàn)附近表明兒子身高和父親身高有較強(qiáng)的線(xiàn)性關(guān)系.我們可以這樣理解,由于有其他因素的存在,使兒子身高和父親身高有關(guān)系但不是函數(shù)關(guān)系.那么影響兒子身高的其他因素是什么?影響兒子身高的因素除父親的身外,還有母親的身高、生活的環(huán)境、飲食習(xí)慣、營(yíng)養(yǎng)水平、體育鍛煉等隨機(jī)的因素,兒子身高是父親身高的函數(shù)的原因是存在這些隨機(jī)的因素.探究3:由探究3我們知道,正是因?yàn)榇嬖谶@些隨機(jī)的因素,使得兒子的身高呈現(xiàn)出隨機(jī)性各種隨機(jī)因素都是獨(dú)立的,有些因素又無(wú)法量化.你能否考慮到這些隨機(jī)因素的作用,用類(lèi)似于函數(shù)的表達(dá)式,表示兒子身高與父親身高的關(guān)系嗎?問(wèn)題探究如果用x表示父親身高,Y表示兒子的身高,用e表示各種其他隨機(jī)因素影響之和,稱(chēng)e為隨機(jī)誤差,由于兒子身高與父親身高線(xiàn)性相關(guān),所以Y=bx+a.

其中,Y稱(chēng)為因變量或響應(yīng)變量,x稱(chēng)為自變量或解釋變量;a和b為模型的未知參數(shù),a稱(chēng)為截距參數(shù),b稱(chēng)為斜率參數(shù);e是Y與bx+a之間的隨機(jī)誤差,模型中的Y也是隨機(jī)變量,其值雖然不能由變量x的值確定,但是卻能表示為bx+a與e的和(疊加),前一部分由x所確定,后一部分是隨機(jī)的,如果e=0,那么Y與x之間的關(guān)系就可用一元線(xiàn)性函數(shù)模型來(lái)描述.概念解析問(wèn)題1.你能結(jié)合父親與兒子身高的實(shí)例,說(shuō)明回歸模型①的意義?①

問(wèn)題探究問(wèn)題2.你能結(jié)合具體實(shí)例解釋產(chǎn)生模型①中隨機(jī)誤差項(xiàng)的原因嗎?產(chǎn)生隨機(jī)誤差e的原因有:(1)除父親身高外,其他可能影響兒子身高的因素,比如母親身高、生活環(huán)境、飲食習(xí)慣和鍛煉時(shí)間等.(2)在測(cè)量?jī)鹤由砀邥r(shí),由于測(cè)量工具、測(cè)量精度所產(chǎn)生的測(cè)量誤差.(3)實(shí)際問(wèn)題中,我們不知道兒子身高和父親身高的相關(guān)關(guān)系是什么,可以利用一元線(xiàn)性回歸模型來(lái)近似這種關(guān)系,這種近似關(guān)系也是產(chǎn)生隨機(jī)誤差e的原因.與函數(shù)模型不同,回歸模型的參數(shù)一般是無(wú)法精確求出的,只能通過(guò)成對(duì)樣本數(shù)據(jù)估計(jì)這兩個(gè)參數(shù)。參數(shù)a和b刻畫(huà)了變量Y與變量x的線(xiàn)性關(guān)系,因此通過(guò)樣本數(shù)據(jù)估計(jì)這兩個(gè)參數(shù),相當(dāng)于尋找一條適當(dāng)?shù)闹本€(xiàn),使表示成對(duì)樣本數(shù)據(jù)的這些散點(diǎn)在整體上與這條直線(xiàn)最接近.問(wèn)題3:為了研究?jī)蓚€(gè)變量之間的相關(guān)關(guān)系,我們建立了一元線(xiàn)性回歸模型達(dá)式

刻畫(huà)的是變量Y與變量x之間的線(xiàn)性相關(guān)關(guān)系,其中參數(shù)a和b未知,我們能否通過(guò)樣本數(shù)據(jù)估計(jì)參數(shù)a和b?問(wèn)題探究問(wèn)題4.我們?cè)鯓訉ふ乙粭l“最好”的直線(xiàn),使得表示成對(duì)樣本數(shù)據(jù)的這些散點(diǎn)在整體上與這條直線(xiàn)最“接近”?目標(biāo):從成對(duì)樣本數(shù)據(jù)出發(fā),用數(shù)學(xué)的方法刻畫(huà)“從整體上看,各散點(diǎn)與直線(xiàn)最接近”方法:利用點(diǎn)到直線(xiàn)y=bx+a的“距離”來(lái)刻畫(huà)散點(diǎn)與該直線(xiàn)的接近程度,然后用所有“距離”之和刻畫(huà)所有樣本觀(guān)測(cè)數(shù)據(jù)與該直線(xiàn)的接近程度.我們?cè)O(shè)滿(mǎn)足一元線(xiàn)性回歸模型的兩個(gè)變量的n對(duì)樣本數(shù)據(jù)為(x1,y1),(x2,y2),…,(xn,yn),由yi=bxi+a+ei(i=1,2,…,n),得|yi-(bxi+a)|=|ei|.顯然|ei|越小,表示點(diǎn)(xi,yi)與點(diǎn)(xi,bxi+a)的“距離”越小,即樣本數(shù)據(jù)點(diǎn)離直線(xiàn)y=bx+a的豎直距離越小。特別地,當(dāng)ei=0時(shí),表示點(diǎn)(xi,yi)在這條直線(xiàn)上.因此,可以用

來(lái)刻畫(huà)各樣本觀(guān)測(cè)數(shù)據(jù)與直線(xiàn)y=bx+a的整體接近程度。在實(shí)際應(yīng)用中,因?yàn)榻^對(duì)值使得計(jì)算不方便,所以人們通常用各散點(diǎn)到直線(xiàn)的豎直距離的平方之和來(lái)刻畫(huà)“整體接近程度”殘差平方和:求a,b的值,使Q(a,b)最小在上式中,xi,yi(i=1,2,3,…,n)是已知的成對(duì)樣本數(shù)據(jù),所以Q由a和b所決定,即它是a和b的函數(shù),因?yàn)镼還可以表示為即它是隨機(jī)誤差的平方和,這個(gè)和當(dāng)然越小越好,所以我們?nèi)∈筈達(dá)到最小的a和b的值,作為截距和斜率的估計(jì)值。下面利用成對(duì)樣本數(shù)據(jù)求使Q取最小值的a,b.

問(wèn)題探究上式是關(guān)于b的二次函數(shù),因此要使Q取得最小值,當(dāng)且僅當(dāng)b的取值為

我們將

稱(chēng)為Y關(guān)于x的經(jīng)驗(yàn)回歸方程,也稱(chēng)經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱(chēng)為經(jīng)驗(yàn)回歸直線(xiàn),這種求經(jīng)驗(yàn)回歸方程的方法叫最小二乘法.

概念解析問(wèn)題5:利用下表的數(shù)據(jù),依據(jù)用最小二乘估計(jì)一元線(xiàn)性回歸模型參數(shù)的公式,求出兒子身高Y關(guān)于父親身高x的經(jīng)驗(yàn)回歸方程。通過(guò)信息技術(shù),計(jì)算求得編號(hào)1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182問(wèn)題探究問(wèn)題6:當(dāng)x=176時(shí),,如果一位父親身高為176cm,他兒子長(zhǎng)大后身高一定能長(zhǎng)到177cm嗎?為什么?

概念解析例如,對(duì)于右表中的第6個(gè)觀(guān)測(cè),父親身高為172cm,其兒子身高的觀(guān)測(cè)值為y==176(cm),預(yù)測(cè)值為96=0.839×172+28.957=173.265(cm),殘差為176-173.265=2.735(cm).類(lèi)似地,可以得到其他的殘差,如右表所示.問(wèn)題7:兒子身高與父親身高的關(guān)系,運(yùn)用殘差分析所得的一元線(xiàn)性回歸模型的有效性嗎?殘差圖:作圖時(shí)縱坐標(biāo)

為殘差,橫坐標(biāo)可以選為樣本編號(hào),或身高數(shù)據(jù),或體重估計(jì)值等,這樣作出的圖形稱(chēng)為殘差圖.觀(guān)察表可以看到,殘差有正有負(fù),殘差的絕對(duì)值最大是4.413.觀(guān)察殘差的散點(diǎn)圖可以發(fā)現(xiàn),殘差比較均勻地分布在橫軸的兩邊,說(shuō)明殘差比較符合一元線(xiàn)性回歸模型的假定,是均值為0、方差為σ2的隨機(jī)變量的觀(guān)測(cè)值.可見(jiàn),通過(guò)觀(guān)察殘差圖可以直觀(guān)判新模型是否滿(mǎn)足一元線(xiàn)性回歸模型的假設(shè).一般地,建立經(jīng)驗(yàn)回歸方程后,通常需要對(duì)模型刻畫(huà)數(shù)據(jù)的效果進(jìn)行分析,借助殘差分析還可以對(duì)模型進(jìn)行改進(jìn),使我們能根據(jù)改進(jìn)模型作出更符合實(shí)際的預(yù)測(cè)與決策。概念解析(1)(2)(3)(4)問(wèn)題8:觀(guān)察以下四幅殘差圖,你認(rèn)為哪一個(gè)殘差滿(mǎn)足一元線(xiàn)性回歸模型中對(duì)隨機(jī)誤差的假定?問(wèn)題探究

所以,只有圖(4)滿(mǎn)足一元線(xiàn)性回歸模型對(duì)隨機(jī)誤差的假設(shè)。例1.經(jīng)驗(yàn)表明,對(duì)于同一樹(shù)種,一般樹(shù)的胸徑(樹(shù)的主干在地面以上1.3m處的直徑)越大,樹(shù)就越高.由于測(cè)量樹(shù)高比測(cè)量胸徑困難,因此研究人員希望由胸徑預(yù)測(cè)樹(shù)高.在研究樹(shù)高與胸徑之間的關(guān)系時(shí),某林場(chǎng)收集了某種樹(shù)的一些數(shù)據(jù)如下表所示,試根據(jù)這些數(shù)據(jù)建立樹(shù)高關(guān)于胸徑的經(jīng)驗(yàn)回歸方程.編號(hào)123456胸徑/cm18.120.122.224.426.028.3樹(shù)高/m18.819.221.021.022.122.1編號(hào)789101112胸徑/cm29.632.433.735.738.340.2樹(shù)高/m22.422.623.024.323.924.7典例解析解:以胸徑為橫坐標(biāo),樹(shù)高為縱坐標(biāo)作散點(diǎn)圖如下:

散點(diǎn)大致分布在一條從左下角到右上角的直線(xiàn)附近,表明兩個(gè)變量線(xiàn)性相關(guān),并且是正相關(guān),因此可以用一元線(xiàn)性回歸模型刻畫(huà)樹(shù)高與胸徑之間的關(guān)系.用d表示胸徑,h表示樹(shù)高,根據(jù)據(jù)最小二乘法,計(jì)算可得經(jīng)驗(yàn)回歸方程為編號(hào)胸徑/cm樹(shù)高觀(guān)測(cè)值/m樹(shù)高預(yù)測(cè)值/m殘差/m118.118.819.4-0.6220.119.219.9-0.7322.221.020.40.6424.421.020.90.1526.022.121.30.8628.322.121.90.2729.622.422.20.2832.422.622.9-0.3933.723.023.2-0.21035.724.323.70.61138.323.924.4-0.51240.224.724.9-0.2根據(jù)經(jīng)驗(yàn)回歸方程,由胸徑的數(shù)據(jù)可以計(jì)算出樹(shù)高的預(yù)測(cè)值(精確到0.1)以及相應(yīng)的殘差,如下表所示.以胸徑為橫坐標(biāo),殘差為縱坐標(biāo),作殘差圖,得到下圖.

觀(guān)察殘差表和殘差圖,可以看到殘差的絕對(duì)值最大是0.8,所有殘差分布在以橫軸為對(duì)稱(chēng)軸、寬度小于2的帶狀區(qū)域內(nèi).可見(jiàn)經(jīng)驗(yàn)回歸方程較好地刻畫(huà)了樹(shù)高與胸徑的關(guān)系,我們可以根據(jù)經(jīng)驗(yàn)回歸方程由胸徑預(yù)測(cè)樹(shù)高.(1)確定研究對(duì)象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是響應(yīng)變量.(2)畫(huà)出解釋變量與響應(yīng)變量的散點(diǎn)圖,觀(guān)察它們之間的關(guān)系(如是否存在線(xiàn)性關(guān)系等).(3)由經(jīng)驗(yàn)確定回歸方程的類(lèi)型.(4)按一定規(guī)則(如最小二乘法)估計(jì)經(jīng)驗(yàn)回歸方程中的參數(shù).(5)得出結(jié)果后需進(jìn)行線(xiàn)性回歸分析.①殘差平方和越小,模型的擬合效果越好.②決定系數(shù)R2取值越大,說(shuō)明模型的擬合效果越好.需要注意的是:若題中給出了檢驗(yàn)回歸方程是否理想的條件,則根據(jù)題意進(jìn)行分析檢驗(yàn)即可.建立線(xiàn)性回歸模型的基本步驟:

歸納總結(jié)編號(hào)12345678年份18961912192119301936195619601968記錄/s11.8010.6010.4010.3010.2010.1010.009.95例2.人們常將男子短跑100m的高水平運(yùn)動(dòng)員稱(chēng)為“百米飛人”.下表給出了1968年之前男子短跑100m世界紀(jì)錄產(chǎn)生的年份和世界紀(jì)錄的數(shù)據(jù).試依據(jù)這些成對(duì)數(shù)據(jù),建立男子短跑100m世界紀(jì)錄關(guān)于紀(jì)錄產(chǎn)生年份的經(jīng)驗(yàn)回歸方程。

解:以成對(duì)數(shù)據(jù)中的世界紀(jì)錄產(chǎn)生年份為橫坐標(biāo),世界紀(jì)錄為縱坐標(biāo)作散點(diǎn)圖,得到下圖,散點(diǎn)看上去大致分布在一條直線(xiàn)附近,似乎可用一元線(xiàn)性回歸模型建立經(jīng)驗(yàn)回歸方程.用Y表示男子短跑100m的世界紀(jì)錄,t表示紀(jì)錄產(chǎn)生的年份,利用一元線(xiàn)性回歸模型來(lái)刻畫(huà)世界紀(jì)錄和世界紀(jì)錄產(chǎn)生年份之間的關(guān)系.根據(jù)最小二乘法,由表中的數(shù)據(jù)得到經(jīng)驗(yàn)回歸方程為:典例解析將經(jīng)驗(yàn)回歸直線(xiàn)疊加到散點(diǎn)圖,得到下圖:仔細(xì)觀(guān)察:從圖中可以看到,經(jīng)驗(yàn)回歸方程較好地刻畫(huà)了散點(diǎn)的變化趨勢(shì),請(qǐng)?jiān)僮屑?xì)觀(guān)察圖形,你能看出其中存在的問(wèn)題嗎?

第一個(gè)世界紀(jì)錄所對(duì)應(yīng)的散點(diǎn)遠(yuǎn)離經(jīng)驗(yàn)回歸直線(xiàn),并且前后兩時(shí)間段中的散點(diǎn)都在經(jīng)驗(yàn)回歸直線(xiàn)的上方,中間時(shí)間段的散點(diǎn)都在經(jīng)驗(yàn)回歸直線(xiàn)的下方.

這說(shuō)明散點(diǎn)并不是隨機(jī)分布在經(jīng)驗(yàn)回歸直線(xiàn)的周?chē)菄@著經(jīng)驗(yàn)回歸直線(xiàn)有一定的變化規(guī)律,即成對(duì)樣本數(shù)據(jù)呈現(xiàn)出明顯的非線(xiàn)性相關(guān)的特征.思考:你能對(duì)模型進(jìn)行修改,以使其更好地反映散點(diǎn)的分布特征嗎?仔細(xì)觀(guān)察,可以發(fā)現(xiàn)散點(diǎn)更趨向于落在中間下凸且遞減的某條曲線(xiàn)附近.回顧已有的函數(shù)知識(shí),可以發(fā)現(xiàn)函數(shù)y=-lnx的圖象具有類(lèi)似的形狀特征

注意到100m短跑的第一個(gè)世界紀(jì)錄產(chǎn)生于1896年,因此可以認(rèn)為散點(diǎn)是集中在曲線(xiàn)y=f(t)=c1+c2ln(t-1895)的周?chē)?,其中c1、c2為未知參數(shù),且c2<0.用上述函數(shù)刻畫(huà)數(shù)據(jù)變化的趨勢(shì),這是一個(gè)非線(xiàn)性經(jīng)驗(yàn)回歸函數(shù),其中c1,c2是待定參數(shù),現(xiàn)在問(wèn)題轉(zhuǎn)化為如何利用成對(duì)數(shù)據(jù)估計(jì)參數(shù)c1和c2令x=ln(t-1895),則Y=c2x+c1對(duì)數(shù)據(jù)進(jìn)行變化可得下表:

編號(hào)12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29記錄Y/s11.8010.6010.4010.3010.2010.1010.009.95得到散點(diǎn)圖,由表中的數(shù)據(jù)得到經(jīng)驗(yàn)回歸方程為:上圖表明,經(jīng)驗(yàn)回歸方程對(duì)于成對(duì)數(shù)據(jù)具有非常好的擬合精度.將x=ln(t-1895)代入:將經(jīng)驗(yàn)回歸直線(xiàn)疊加到散點(diǎn)圖,得到下圖:對(duì)于通過(guò)創(chuàng)紀(jì)錄時(shí)間預(yù)報(bào)世界紀(jì)錄的問(wèn)題,我們建立了兩個(gè)回歸模型,得到了兩個(gè)回歸方程,你能判斷哪個(gè)回歸方程擬合的精度更好嗎?①②我們發(fā)現(xiàn),散點(diǎn)圖中各散點(diǎn)都非常靠近②的圖象,表明非線(xiàn)性經(jīng)驗(yàn)回歸方程②對(duì)于原始數(shù)據(jù)的擬合效果遠(yuǎn)遠(yuǎn)好于經(jīng)驗(yàn)回歸方程①.(1).直接觀(guān)察法.在同一坐標(biāo)系中畫(huà)出成對(duì)數(shù)據(jù)散點(diǎn)圖、非線(xiàn)性經(jīng)驗(yàn)回歸方程②的圖象(藍(lán)色)以及經(jīng)驗(yàn)回歸方程①的圖象(紅色).①②(2).殘差分析:殘差平方和越小,模型擬合效果越好.Q2明顯小于Q1,說(shuō)明非線(xiàn)性回歸方程的擬合效果要優(yōu)于線(xiàn)性回歸方程.(3).利用決定系數(shù)R2刻畫(huà)回歸效果.R2越大,表示殘差平方和越小,即模型的擬合效果越好R2越小,表示殘差平方和越大,即模型擬合效果越差.①和②的R2分別為0.7325和0.9983說(shuō)明非線(xiàn)性回歸方程的擬合效果要優(yōu)于線(xiàn)性回歸方程。概念解析(4)用新的觀(guān)測(cè)數(shù)據(jù)來(lái)檢驗(yàn)?zāi)P偷臄M合效果,事實(shí)上,我們還有1968年之后的男子短跑100m世界紀(jì)錄數(shù)據(jù),如表所示在散點(diǎn)圖中,繪制表中的散點(diǎn)(綠色),再添加經(jīng)驗(yàn)回歸方程①所對(duì)應(yīng)的經(jīng)驗(yàn)回歸直線(xiàn)(紅色),以及經(jīng)驗(yàn)回歸方程②所對(duì)應(yīng)的經(jīng)驗(yàn)回歸曲線(xiàn)(藍(lán)色),得到右圖.顯然綠色散點(diǎn)分布在藍(lán)色經(jīng)驗(yàn)回歸曲線(xiàn)的附近,遠(yuǎn)離紅色經(jīng)驗(yàn)回歸直線(xiàn),表明經(jīng)驗(yàn)回歸方程②對(duì)于新數(shù)據(jù)的預(yù)報(bào)效果遠(yuǎn)遠(yuǎn)好于①.思考:在上述問(wèn)題情境中,男子短跑100m世界紀(jì)錄和紀(jì)錄創(chuàng)建年份之間呈現(xiàn)出對(duì)數(shù)關(guān)系,能借助于樣本相關(guān)系數(shù)刻畫(huà)這種關(guān)系的強(qiáng)弱嗎?在使用經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測(cè)時(shí),需要注意下列問(wèn)題:(1)經(jīng)驗(yàn)回歸方程只適用于所研究的樣本的總體,例如,根據(jù)我國(guó)父親身高與兒子身高的數(shù)據(jù)建立的經(jīng)驗(yàn)回歸方程,不能用來(lái)描述美國(guó)父親身高與兒子身高之間的關(guān)系,同樣,根據(jù)生長(zhǎng)在南方多雨地區(qū)的樹(shù)高與胸徑的數(shù)據(jù)建立的經(jīng)驗(yàn)回歸方程,不能用來(lái)描述北方干早地區(qū)的樹(shù)高與胸徑之間的關(guān)系。(2)經(jīng)驗(yàn)回歸方程一般都有時(shí)效性,例如,根據(jù)20世紀(jì)80年代的父親身高與兒子身高的數(shù)據(jù)建立的經(jīng)驗(yàn)回歸方程,不能用來(lái)描述現(xiàn)在的父親身高與兒子身高之間的關(guān)系。(3)解釋變量的取值不能離樣本數(shù)據(jù)的范圍太遠(yuǎn),一般解釋變量的取值在樣本數(shù)據(jù)范圍內(nèi),經(jīng)驗(yàn)回歸方程的預(yù)報(bào)效果會(huì)比較好,超出這個(gè)范圍越遠(yuǎn),預(yù)報(bào)的效果越差,(4)不能期望經(jīng)驗(yàn)回歸方程得到的預(yù)報(bào)值就是響應(yīng)變量的精確值,事實(shí)上,它是響應(yīng)變量的可能取值的平均值。問(wèn)題探究建立非線(xiàn)性經(jīng)驗(yàn)回歸模型的基本步驟:1.確定研究對(duì)象,明確哪個(gè)是解釋變量,哪個(gè)是響應(yīng)變量;2.由經(jīng)驗(yàn)確定非線(xiàn)性經(jīng)驗(yàn)回歸方程的模型;3.通過(guò)變換,將非線(xiàn)性經(jīng)驗(yàn)回歸模型轉(zhuǎn)化為線(xiàn)性經(jīng)驗(yàn)回歸模型;4.按照公式計(jì)算經(jīng)驗(yàn)回歸方程中的參數(shù),得到經(jīng)驗(yàn)回歸方程;5.消去新元,得到非線(xiàn)性經(jīng)驗(yàn)回歸方程;6.得出結(jié)果后分析殘差圖是否有異常.歸納總結(jié)

跟蹤訓(xùn)練1.一只藥用昆蟲(chóng)的產(chǎn)卵數(shù)y與一定范圍內(nèi)的溫度x有關(guān),現(xiàn)收集了6組觀(guān)測(cè)數(shù)據(jù)列于表中:經(jīng)計(jì)算得:

線(xiàn)性回歸殘差的平方和:其中

分別為觀(guān)測(cè)數(shù)據(jù)中的溫度和產(chǎn)卵數(shù),i=1,2,3,4,5,6.(1)若用線(xiàn)性回歸模型擬合,求y關(guān)于x的回歸方程

(精確到0.1);(2)若用非線(xiàn)性回歸模型擬合,求得y關(guān)于x回歸方程為且相關(guān)指數(shù)R2=0.9522.①試與(1)中的線(xiàn)性回歸模型相比較,用R2說(shuō)明哪種模型的擬合效果更好?②用擬合效果好的模型預(yù)測(cè)溫度為35℃時(shí)該種藥用昆蟲(chóng)的產(chǎn)卵數(shù).(結(jié)果取整數(shù)).附:相關(guān)系數(shù)

跟蹤訓(xùn)練

所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為

∵0.9398<0.9522

∴非線(xiàn)性回歸模型的回歸方程比線(xiàn)性回歸方程為:y=6.6x-139.4擬合的擬合效果更好

②當(dāng)堂達(dá)標(biāo)課堂小結(jié)8.2一元線(xiàn)性回歸模型及其應(yīng)用

《第一課時(shí)一元線(xiàn)性回歸模型及其參數(shù)的最小二乘估計(jì)》導(dǎo)學(xué)案課標(biāo)要求素養(yǎng)要求1.結(jié)合具體實(shí)例,了解一元線(xiàn)性回歸模型的含義.2.了解模型參數(shù)的統(tǒng)計(jì)意義,了解最小二乘原理.通過(guò)學(xué)習(xí)一元線(xiàn)性回歸模型的含義,體會(huì)數(shù)學(xué)抽象及數(shù)據(jù)分析素養(yǎng).新知探究恩格爾系數(shù)(Engel’sCoefficient)是根據(jù)恩格爾定律得出的比例數(shù),指居民家庭中食物支出占消費(fèi)總支出的比重,是表示生活水平高低的一個(gè)指標(biāo).其計(jì)算公式:恩格爾系數(shù)=食物支出金額÷總支出金額.一個(gè)家庭收入越少,家庭收入中或者家庭總支出中用來(lái)購(gòu)買(mǎi)食物的支出所占的比例就越大,隨著家庭收入的增加,家庭收入中或者家庭支出中用來(lái)購(gòu)買(mǎi)食物的支出所占比例將會(huì)下降.問(wèn)題恩格爾系數(shù)是預(yù)測(cè)生活水平高低的一個(gè)模型,那么當(dāng)兩個(gè)變量線(xiàn)性相關(guān)時(shí),我們?nèi)绾螌?duì)成對(duì)樣本數(shù)據(jù)建立一個(gè)模型進(jìn)行預(yù)測(cè)?提示為了對(duì)兩個(gè)變量線(xiàn)性相關(guān)關(guān)系進(jìn)行預(yù)測(cè),我們通常建立一元線(xiàn)性回歸模型進(jìn)行預(yù)測(cè).1.一元線(xiàn)性回歸模型

我們稱(chēng)為Y關(guān)于x的______________模型,其中Y稱(chēng)為因變量或響應(yīng)變量,x稱(chēng)為自變量或解釋變量;a和b為模型的未知參數(shù),a稱(chēng)為_(kāi)_____參數(shù),b稱(chēng)為_(kāi)_____參數(shù);e是Y與bx+a之間的隨機(jī)______.一元線(xiàn)性回歸截距斜率誤差2.線(xiàn)性回歸方程與最小二乘法拓展深化[微判斷]1.兩個(gè)變量之間產(chǎn)生隨機(jī)誤差的原因僅僅是因?yàn)闇y(cè)量工具產(chǎn)生的誤差.(

)

提示產(chǎn)生隨機(jī)誤差的原因有多種,測(cè)量工具和測(cè)量精度僅僅是其中的一個(gè)方面.×√[微訓(xùn)練]答案AD[微思考]1.任何一組數(shù)據(jù)都可以由最小二乘法得出回歸直線(xiàn)方程嗎?

提示

用最小二乘法求回歸直線(xiàn)方程的前提是先判斷所給數(shù)據(jù)具有線(xiàn)性相關(guān)關(guān)系(可利用散點(diǎn)圖來(lái)判斷),否則求出的回歸直線(xiàn)方程無(wú)意義.題型一求回歸直線(xiàn)方程【例1】某研究機(jī)構(gòu)對(duì)高三學(xué)生的記憶力x和判斷力y進(jìn)行統(tǒng)計(jì)分析,得下表數(shù)據(jù):x681012y2356(3)試根據(jù)求出的線(xiàn)性回歸方程,預(yù)測(cè)記憶力為9的同學(xué)的判斷力.解(1)如圖:樣本點(diǎn)分布在一條直線(xiàn)附近,y與x具有線(xiàn)性相關(guān)關(guān)系.規(guī)律方法求線(xiàn)性回歸方程的一般步驟(1)收集樣本數(shù)據(jù),設(shè)為(xi,yi)(i=1,2,…,n)(數(shù)據(jù)一般由題目給出).(2)作出散點(diǎn)圖,確定x,y具有線(xiàn)性相關(guān)關(guān)系.【訓(xùn)練1】某種產(chǎn)品的廣告費(fèi)支出x(單位:百萬(wàn)元)與銷(xiāo)售額y(單位:百萬(wàn)元)之間有如下對(duì)應(yīng)數(shù)據(jù):x24568y3040605070(1)畫(huà)出散點(diǎn)圖;(2)求回歸直線(xiàn)方程.解(1)散點(diǎn)圖如圖所示.樣本點(diǎn)分布在一條直線(xiàn)附近,y與x具有線(xiàn)性相關(guān)關(guān)系.(2)列出下表,并用科學(xué)計(jì)算器進(jìn)行有關(guān)計(jì)算.i12345xi24568yi3040605070xiyi60160300300560416253664題型二利用回歸直線(xiàn)方程對(duì)總體進(jìn)行估計(jì)【例2】一臺(tái)機(jī)器按不同的轉(zhuǎn)速生產(chǎn)出來(lái)的某機(jī)械零件有一些會(huì)有缺點(diǎn),每小時(shí)生產(chǎn)有缺點(diǎn)的零件的多少隨機(jī)器運(yùn)轉(zhuǎn)速度的變化而變化,下表為抽樣試驗(yàn)的結(jié)果:轉(zhuǎn)速x(轉(zhuǎn)/秒)1614128每小時(shí)生產(chǎn)有缺點(diǎn)的零件數(shù)y(件)11985解(1)散點(diǎn)圖如圖所示:(2)近似直線(xiàn)如圖所示:【遷移1】

(變條件,變?cè)O(shè)問(wèn))本例中近似方程不變,若每增加一個(gè)單位的轉(zhuǎn)速,生產(chǎn)有缺點(diǎn)的零件數(shù)近似增加多少?【遷移2】

(變條件,變?cè)O(shè)問(wèn))本例中近似方程不變,每小時(shí)生產(chǎn)有缺點(diǎn)的零件件數(shù)是7,估計(jì)機(jī)器的轉(zhuǎn)速.規(guī)律方法本題已知y與x是線(xiàn)性相關(guān)關(guān)系,所以可求出回歸方程進(jìn)行估計(jì)和預(yù)測(cè).否則,若兩個(gè)變量不具備相關(guān)關(guān)系或它們之間的相關(guān)關(guān)系不顯著,即使求出回歸方程也毫無(wú)意義.【訓(xùn)練2】某車(chē)間為了規(guī)定工時(shí)定額,需要確定加工零件所花費(fèi)的時(shí)間,為此做了四次實(shí)驗(yàn),得到的數(shù)據(jù)如下:零件的個(gè)數(shù)x(個(gè))2345加工的時(shí)間y(h)2.5344.5(1)已知零件個(gè)數(shù)與加工時(shí)間線(xiàn)性相關(guān),求出y關(guān)于x的線(xiàn)性回歸方程;(2)試預(yù)測(cè)加工10個(gè)零件需要多少時(shí)間?(2)加工10個(gè)零件時(shí),大約需要0.7×10+1.05=8.05(小時(shí)).解析因?yàn)榛貧w直線(xiàn)的斜率為80,所以x每增加1,y平均增加80,即勞動(dòng)生產(chǎn)率提高1000元時(shí),工人工資平均提高80元.答案B答案D解析∵兩個(gè)變量線(xiàn)性負(fù)相關(guān),∴變量x增加一個(gè)單位,y平均減少1.5個(gè)單位.答案C4.已知回歸直線(xiàn)的斜率的估計(jì)值是1.23,且過(guò)定點(diǎn)(4,5),則線(xiàn)性回歸方程是__________.5.某產(chǎn)品的廣告費(fèi)用x(單位:萬(wàn)元)與銷(xiāo)售額y(單位:萬(wàn)元)的統(tǒng)計(jì)數(shù)據(jù)如下表:廣告費(fèi)用x/萬(wàn)元3456銷(xiāo)售額y/萬(wàn)元25304045答案73.58.2一元線(xiàn)性回歸模型及其應(yīng)用

《第二課時(shí)非線(xiàn)性回歸模型及其應(yīng)用》導(dǎo)學(xué)案課標(biāo)要求素養(yǎng)要求1.進(jìn)一步掌握一元線(xiàn)性回歸模型參數(shù)的統(tǒng)計(jì)意義,會(huì)用相關(guān)統(tǒng)計(jì)軟件.2.了解非線(xiàn)性回歸模型.3.會(huì)通過(guò)分析殘差和利用R2判斷回歸模型的擬合效果.通過(guò)學(xué)習(xí)回歸模型的應(yīng)用,提升數(shù)學(xué)運(yùn)算及數(shù)據(jù)分析素養(yǎng).新知探究在實(shí)際問(wèn)題中,有時(shí)兩個(gè)變量之間的關(guān)系并不是線(xiàn)性關(guān)系,這就需要運(yùn)用散點(diǎn)圖選擇適當(dāng)?shù)暮瘮?shù)模型來(lái)擬合觀(guān)測(cè)數(shù)據(jù),然后通過(guò)適當(dāng)?shù)淖兞看鷵Q,把非線(xiàn)性問(wèn)題轉(zhuǎn)化為線(xiàn)性問(wèn)題,從而確定未知參數(shù),建立相應(yīng)的線(xiàn)性回歸方程.提示不一定;越小越好.1.殘差的概念2.刻畫(huà)回歸效果的方式 (1)殘差圖法

作圖時(shí)________為殘差,________可以選為樣本編號(hào),或身高數(shù)據(jù),或體重估計(jì)值等,這樣作出的圖形稱(chēng)為殘差圖.若殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域內(nèi),帶狀區(qū)域越窄,則說(shuō)明擬合效果越好. (2)殘差平方和法縱坐標(biāo)橫坐標(biāo)(3)利用R2刻畫(huà)回歸效果決定系數(shù)R2是度量模型擬合效果的一種指標(biāo),在線(xiàn)性模型中,它代表解釋變量客戶(hù)預(yù)報(bào)變量的能力.×√拓展深化[微判斷]1.殘差平方和越接近0,線(xiàn)性回歸模型的擬合效果越好. (

)2.在畫(huà)兩個(gè)變量的散點(diǎn)圖時(shí),

響應(yīng)變量在x軸上,解釋變量在y軸上.(

)

提示在畫(huà)兩個(gè)變量的散點(diǎn)圖時(shí),

響應(yīng)變量在y軸上,解釋變量在x軸上.3.R2越小,

線(xiàn)性回歸模型的擬合效果越好. (

)

提示

R2越大,

線(xiàn)性回歸模型的擬合效果越好.×[微訓(xùn)練]1.在殘差分析中,

殘差圖的縱坐標(biāo)為_(kāi)_________.

答案殘差2.甲、乙、丙、丁四位同學(xué)在建立變量x,y的回歸模型時(shí),分別選擇了4種不同模型,計(jì)算可得它們的決定系數(shù)R2分別如下表:

甲乙丙丁R20.980.780.500.85哪位同學(xué)建立的回歸模型擬合效果最好?解R2越大,表示回歸模型的擬合效果越好,故甲同學(xué)建立的回歸模型擬合效果最好.[微思考]

在使用經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測(cè)時(shí),需要注意哪些問(wèn)題?

提示

(1)經(jīng)驗(yàn)回歸方程只適用于所研究的樣本的總體;(2)所建立的經(jīng)驗(yàn)回歸方程一般都有時(shí)效性;(3)解釋變量的取值不能離樣本數(shù)據(jù)的范圍太遠(yuǎn).一般解釋變量的取值在樣本數(shù)據(jù)范圍內(nèi),經(jīng)驗(yàn)回歸方程的預(yù)報(bào)效果好,超出這個(gè)范圍越遠(yuǎn),預(yù)報(bào)的效果越差;(4)不能期望經(jīng)驗(yàn)回歸方程得到的預(yù)報(bào)值就是響應(yīng)變量的精確值.題型一線(xiàn)性回歸分析【例1】已知某種商品的價(jià)格x(單位:元/件)與需求量y(單位:件)之間的關(guān)系有如下一組數(shù)據(jù):x1416182022y1210753列出殘差表:00.3-0.4-0.10.24.62.6-0.4-2.4-4.4規(guī)律方法

(1)解答線(xiàn)性回歸問(wèn)題,應(yīng)通過(guò)散點(diǎn)圖來(lái)分析兩變量間的關(guān)系是否線(xiàn)性相關(guān),然后再利用求回歸方程的公式求解回歸方程,并利用殘差圖或相關(guān)指數(shù)R2來(lái)分析函數(shù)模型的擬合效果,在此基礎(chǔ)上,借助回歸方程對(duì)實(shí)際問(wèn)題進(jìn)行分析.(2)刻畫(huà)回歸效果的三種方法①殘差圖法:殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域內(nèi)說(shuō)明選用的模型比較合適.【訓(xùn)練1】某地區(qū)2011年到2017年農(nóng)村居民家庭人均純收入y(單位:千元)的數(shù)據(jù)如下表:年份2011201220132014201520162017年份代號(hào)t1234567人均純收入y2.93.33.64.44.85.25.9(2)利用(1)中的回歸方程,分析2011年到2017年該地區(qū)農(nóng)村居民家庭人均純收入的變化情況,并預(yù)測(cè)該地區(qū)2020年農(nóng)村居民家庭人均純收入.附:回歸直線(xiàn)的斜率和截距的最小二乘估計(jì)公式分別為解

(1)由所給數(shù)據(jù)計(jì)算得題型二殘差分析與相關(guān)指數(shù)的應(yīng)用

【例2】假定小麥基本苗數(shù)x與成熟期有效穗y之間存在相關(guān)關(guān)系,今測(cè)得5組數(shù)據(jù)如下:x15.025.830.036.644.4y39.442.942.943.149.2(1)以x為解釋變量,y為預(yù)報(bào)變量,作出散點(diǎn)圖;(2)求y與x之間的回歸方程,對(duì)于基本苗數(shù)56.7預(yù)報(bào)有效穗;(3)計(jì)算各組殘差,并計(jì)算殘差平方和;(4)求R2,并說(shuō)明(2)中求出的回歸模型的擬合程度.解(1)散點(diǎn)圖如下.【訓(xùn)練2】為研究質(zhì)量x(單位:g)對(duì)彈簧長(zhǎng)度y(單位:cm)的影響,對(duì)不同質(zhì)量的6個(gè)物體進(jìn)行測(cè)量,數(shù)據(jù)如下表:x51015202530y7.258.128.959.9010.911.8(1)作出散點(diǎn)圖并求回歸直線(xiàn)方程;(2)求出R2并說(shuō)明回歸模型擬合的程度;(3)進(jìn)行殘差分析.解(1)散點(diǎn)圖如圖所示.樣本點(diǎn)分布在一條直線(xiàn)附近,y與x具有線(xiàn)性相關(guān)關(guān)系.0.050.005-0.08-0.0450.040.025-2.237-1.367-0.5370.4131.4132.313(3)由殘差表中的數(shù)值可以看出第3個(gè)樣本點(diǎn)的殘差比較大,需要確認(rèn)在采集這個(gè)數(shù)據(jù)的時(shí)候是否有人為的錯(cuò)誤,如果有的話(huà),需要糾正錯(cuò)誤,重新建立回歸模型;由表中數(shù)據(jù)可以看出殘差點(diǎn)比較均勻地落在寬度不超過(guò)0.15的狹窄的水平帶狀區(qū)域中,說(shuō)明選用的線(xiàn)性回歸模型的精度較高,由以上分析可知,彈簧長(zhǎng)度與所掛物體的質(zhì)量成線(xiàn)性關(guān)系.題型三非線(xiàn)性回歸分析【例3】某公司為確定下一年度投入某種產(chǎn)品的宣傳費(fèi),需了解年宣傳費(fèi)x(單位:千元)對(duì)年銷(xiāo)售量y(單位:t)和年利潤(rùn)z(單位:千元)的影響.對(duì)近8年的年宣傳費(fèi)xi和年銷(xiāo)售量yi(i=1,2,…,8)數(shù)據(jù)作了初步處理,得到下面的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程;(3)已知這種產(chǎn)品的年利潤(rùn)z與x,y的關(guān)系為z=0.2y-x.根據(jù)(2)的結(jié)果回答下列問(wèn)題:①年宣傳費(fèi)x=49時(shí),年銷(xiāo)售量及年利潤(rùn)的預(yù)報(bào)值是多少?②年宣傳費(fèi)x為何值時(shí),年利潤(rùn)的預(yù)報(bào)值最大?規(guī)律方法求非線(xiàn)性回歸方程的步驟(1)確定變量,作出散點(diǎn)圖.(2)根據(jù)散點(diǎn)圖,選擇恰當(dāng)?shù)臄M合函數(shù).(3)變量置換,通過(guò)變量置換把非線(xiàn)性回歸問(wèn)題轉(zhuǎn)化為線(xiàn)性回歸問(wèn)題,并求出線(xiàn)性回歸方程.(4)分析擬合效果:通過(guò)計(jì)算決定系數(shù)或畫(huà)殘差圖來(lái)判斷擬合效果.(5)根據(jù)相應(yīng)的變換,寫(xiě)出非線(xiàn)性回歸方程.【訓(xùn)練3】下表為收集到的一組數(shù)據(jù):x21232527293235y711212466115325解(1)作出散點(diǎn)圖如下圖,從散點(diǎn)圖可以看出x與y不具有線(xiàn)性相關(guān)關(guān)系,根據(jù)已有知識(shí)可以發(fā)現(xiàn)樣本點(diǎn)分布在某一條指數(shù)函數(shù)曲線(xiàn)y=c1ec2x的周?chē)?,其中c1,c2為待定的參數(shù).(2)對(duì)y=c1ec2x兩邊取對(duì)數(shù),得ln

y=ln

c1+c2x,令z=ln

y,則有變換后的樣本點(diǎn)應(yīng)分布在直線(xiàn)z=bx+a(a=ln

c1,b=c2)的周?chē)?,這樣就可以利用線(xiàn)性回歸模型來(lái)建立y與x之間的非線(xiàn)性回歸方程了,數(shù)據(jù)可以轉(zhuǎn)化為x21232527293235z1.9462.3983.0453.1784.1904.7455.784殘差yi7112124661153256.44311.10119.12532.95056.770128.381290.3250.557-0.1011.875-8.9509.23-13.38134.675一、素養(yǎng)落地1.通過(guò)本節(jié)課的學(xué)習(xí),進(jìn)一步提升數(shù)學(xué)運(yùn)算及數(shù)據(jù)分析素養(yǎng).2.當(dāng)根據(jù)給定的樣本數(shù)據(jù)得到的散點(diǎn)圖并不是分布在一條直線(xiàn)附近時(shí),就不能直接求其回歸直線(xiàn)方程了,這時(shí)可根據(jù)得到的散點(diǎn)圖,選擇一種擬合得最好的函數(shù),常見(jiàn)的函數(shù)有冪函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù)等,然后進(jìn)行變量置換,將問(wèn)題轉(zhuǎn)化為線(xiàn)性回歸分析問(wèn)題.二、素養(yǎng)訓(xùn)練1.下列兩個(gè)變量之間的關(guān)系不是函數(shù)關(guān)系的是(

) A.角度和它的余弦值 B.正方形的邊長(zhǎng)和面積 C.正n邊形的邊數(shù)和內(nèi)角度數(shù)和 D.人的年齡和身高

解析函數(shù)關(guān)系就是變量之間的一種確定性關(guān)系.A,B,C三項(xiàng)中的兩個(gè)變量之間都是函數(shù)關(guān)系,可以寫(xiě)出相應(yīng)的函數(shù)表達(dá)式,分別為f(θ)=cos

θ,g(a)=a2,h(n)=(n-2)π.D選項(xiàng)中的兩個(gè)變量之間不是函數(shù)關(guān)系,對(duì)于年齡確定的人群,仍可以有不同的身高,故選D.

答案D2.(多選題)關(guān)于殘差圖的描述正確的是(

) A.殘差圖的橫坐標(biāo)可以是樣本編號(hào) B.殘差圖的橫坐標(biāo)也可以是解釋變量或預(yù)報(bào)變量 C.殘差點(diǎn)分布的帶狀區(qū)域的寬度越窄相關(guān)指數(shù)越小 D.殘差點(diǎn)分布的帶狀區(qū)域的寬度越窄殘差平方和越小解析殘差點(diǎn)分布的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精度越高,則殘差平方和越小,此時(shí),R2的值越大,故描述錯(cuò)誤的是C.答案ABD3.某產(chǎn)品在某零售攤位的零售價(jià)x(單位:元)與每天的銷(xiāo)售量y(單位:個(gè))的統(tǒng)計(jì)資料如下表所示:x16171819y50344131答案C4.在研究硝酸鈉的溶解度時(shí),觀(guān)察它在不同溫度(x)的水中溶解度(y)的結(jié)果如下表:溫度x010205070溶解度y66.776.085.0112.3128.0由此得到回歸直線(xiàn)的斜率是__________.答案0.88095.在一次抽樣調(diào)查中測(cè)得樣本的5個(gè)樣本點(diǎn),數(shù)值如下表:x0.250.5124y1612521根據(jù)散點(diǎn)圖可知y與x近似地呈反比例函數(shù)關(guān)系,t4210.50.25y1612521由散點(diǎn)圖可以看出y與t呈近似的線(xiàn)性相關(guān)關(guān)系,列表如下:itiyitiyit1416641622122443155140.5210.2550.2510.250.0625∑7.753694.2521.3125

第八章

成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析

《8.2一元線(xiàn)性回歸模型及其應(yīng)用》同步練習(xí)知識(shí)點(diǎn)撥一、變量的相關(guān)關(guān)系1.相關(guān)關(guān)系:兩個(gè)變量有關(guān)系,但又沒(méi)有確切到可由其中的一個(gè)去精確地決定另一個(gè)的程度,這種關(guān)系稱(chēng)為相關(guān)關(guān)系.2.散點(diǎn)圖:將樣本中的每一個(gè)序號(hào)下的成對(duì)樣本數(shù)據(jù)都用直角坐標(biāo)系中的點(diǎn)表示出來(lái),由這些點(diǎn)組成的統(tǒng)計(jì)圖叫做散點(diǎn)圖.3.正相關(guān)與負(fù)相關(guān):如果從整體上看,當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值也呈現(xiàn)增加的趨勢(shì),我們就稱(chēng)這兩個(gè)變量正相關(guān);如果當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值呈現(xiàn)減少的趨勢(shì),則稱(chēng)這兩個(gè)變量負(fù)相關(guān).知識(shí)點(diǎn)撥4.線(xiàn)性相關(guān):一般地,如果兩個(gè)變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在一條直線(xiàn)附近,我們就稱(chēng)這兩個(gè)變量線(xiàn)性相關(guān).5.非線(xiàn)性相關(guān):一般地,如果兩個(gè)變量具有相關(guān)性,但不是線(xiàn)性相關(guān),那么我們就稱(chēng)這兩個(gè)變量非線(xiàn)性相關(guān)或曲線(xiàn)相關(guān).知識(shí)點(diǎn)撥微練習(xí)下列兩個(gè)變量具有相關(guān)關(guān)系的是(

)A.角度和它的余弦值

B.正方形的邊長(zhǎng)和面積C.人的年齡與身高 D.人的身高和體重解析:A,B具有確定性的函數(shù)關(guān)系;C無(wú)相關(guān)關(guān)系;一般地,身高越高,體重越重,是相關(guān)關(guān)系.故選D.答案:D知識(shí)點(diǎn)撥微思考相關(guān)關(guān)系與函數(shù)關(guān)系有什么異同點(diǎn)?提示:相同點(diǎn):兩者均是指兩個(gè)變量的關(guān)系.不同點(diǎn):①函數(shù)關(guān)系是一種確定的關(guān)系,如圓的面積S與半徑r的關(guān)系,它可以用函數(shù)關(guān)系式S=πr2來(lái)表示;相關(guān)關(guān)系是一種非確定的關(guān)系,如人的體重y與身高x有關(guān),一般來(lái)說(shuō),身高越高,體重越重,但不能用一個(gè)函數(shù)關(guān)系式來(lái)嚴(yán)格地表示它們之間的關(guān)系.函數(shù)關(guān)系是兩個(gè)非隨機(jī)變量的關(guān)系,而相關(guān)關(guān)系是非隨機(jī)變量與隨機(jī)變量之間的關(guān)系.②函數(shù)關(guān)系是一種因果關(guān)系,而相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.知識(shí)點(diǎn)撥二、樣本相關(guān)系數(shù)對(duì)于變量x和變量y,設(shè)經(jīng)過(guò)隨機(jī)抽樣獲得的成對(duì)樣本數(shù)據(jù)為(x1,y1),(x2,y2),…,(xn,yn),其中x1,x2,…,xn和y1,y2,…,yn的均值分別為我們稱(chēng)r為變量x和變量y的樣本相關(guān)系數(shù).知識(shí)點(diǎn)撥名師點(diǎn)析樣本相關(guān)系數(shù)r的性質(zhì)(1)當(dāng)r>0時(shí),稱(chēng)成對(duì)數(shù)據(jù)正相關(guān);當(dāng)r<0時(shí),稱(chēng)成對(duì)數(shù)據(jù)負(fù)相關(guān).(2)當(dāng)|r|越接近1時(shí),成對(duì)數(shù)據(jù)的線(xiàn)性相關(guān)程度越強(qiáng);當(dāng)|r|越接近0時(shí),成對(duì)數(shù)據(jù)的線(xiàn)性相關(guān)程度越弱.(3)樣本相關(guān)系數(shù)r的取值范圍為[-1,1].知識(shí)點(diǎn)撥微練習(xí)對(duì)于樣本相關(guān)系數(shù)r,敘述正確的是(

)A.|r|∈(0,+∞),|r|越大,相關(guān)程度越強(qiáng),反之,相關(guān)程度越弱B.r∈(-∞,+∞),r越大,相關(guān)程度越強(qiáng),反之,相關(guān)程度越弱C.|r|≤1,|r|越接近于1,相關(guān)程度越強(qiáng);|r|越接近于0,相關(guān)程度越弱D.以上說(shuō)法都不對(duì)解析:由樣本相關(guān)系數(shù)的性質(zhì)知,r∈[-1,1],排除A,B;|r|越接近于1,相關(guān)程度越強(qiáng),|r|越接近于0,相關(guān)程度越弱,故選C.答案:C知識(shí)點(diǎn)撥三、一元線(xiàn)性回歸模型

我們稱(chēng)該式為Y關(guān)于x的一元線(xiàn)性回歸模型.其中,Y稱(chēng)為因變量或響應(yīng)變量,x稱(chēng)為自變量或解釋變量;a和b為模型的未知參數(shù),a稱(chēng)為截距參數(shù),b稱(chēng)為斜率參數(shù);e是Y與bx+a之間的隨機(jī)誤差.如果e=0,那么Y與x之間的關(guān)系就可用一元線(xiàn)性函數(shù)模型來(lái)描述.知識(shí)點(diǎn)撥四、一元線(xiàn)性回歸模型參數(shù)的最小二乘估計(jì)1.經(jīng)驗(yàn)回歸方程知識(shí)點(diǎn)撥2.殘差與殘差分析對(duì)于響應(yīng)變量Y,通過(guò)觀(guān)測(cè)得到的數(shù)據(jù)稱(chēng)為觀(guān)測(cè)值,通過(guò)經(jīng)驗(yàn)回歸方程得到的

稱(chēng)為預(yù)測(cè)值,觀(guān)測(cè)值減去預(yù)測(cè)值稱(chēng)為殘差.殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過(guò)對(duì)殘差的分析可以判斷模型刻畫(huà)數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱(chēng)為殘差分差.3.在殘差圖中,當(dāng)殘差比較均勻地分布在橫軸的兩邊,說(shuō)明殘差比較符合一元線(xiàn)性回歸模型的假定,是均值為0、方差為σ2的隨機(jī)變量的觀(guān)測(cè)值.可見(jiàn),通過(guò)觀(guān)察殘差圖就可以直觀(guān)判斷模型是否滿(mǎn)足一元線(xiàn)性回歸模型的假設(shè).知識(shí)點(diǎn)撥知識(shí)點(diǎn)撥微思考在回歸分析中,利用經(jīng)驗(yàn)回歸方程求出的值一定是真實(shí)值嗎?為什么?提示:不一定是真實(shí)值.利用經(jīng)驗(yàn)回歸方程求出的值,在很多時(shí)候只是預(yù)測(cè)值,例如,人的體重與身高存在一定的線(xiàn)性相關(guān)關(guān)系,但體重除了受身高的影響外,還受其他因素的影響,如飲食、是否喜歡運(yùn)動(dòng)等.知識(shí)點(diǎn)撥微練習(xí)(1)如果記錄了x,y的幾組數(shù)據(jù)分別為(0,1),(1,3),(2,5),(3,7),那么y關(guān)于x的經(jīng)驗(yàn)回歸直線(xiàn)必過(guò)點(diǎn)(

)A.(2,2) B.(1.5,2) C.(1,2) D.(1.5,4)∴經(jīng)驗(yàn)回歸直線(xiàn)必過(guò)點(diǎn)(1.5,4).答案:D知識(shí)點(diǎn)撥(2)若一個(gè)樣本的總偏差平方和為80,殘差平方和為60,則R2為

.

答案:0.25探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)樣本相關(guān)系數(shù)的應(yīng)用例1現(xiàn)隨機(jī)抽取了某中學(xué)高一10名在校學(xué)生,他們?nèi)雽W(xué)時(shí)的數(shù)學(xué)成績(jī)x與入學(xué)后第一次考試的數(shù)學(xué)成績(jī)y如下表:學(xué)生號(hào)12345678910x12010811710410311010410599108y84648468696869465771請(qǐng)問(wèn):這10名學(xué)生的兩次數(shù)學(xué)成績(jī)是否具有線(xiàn)性相相關(guān)關(guān)系?探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)由此可看出這10名學(xué)生的兩次數(shù)學(xué)成績(jī)線(xiàn)性相關(guān).探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)反思感悟

利用樣本相關(guān)系數(shù)判斷線(xiàn)性相關(guān)的求解策略先計(jì)算樣本相關(guān)系數(shù)r的值,再用|r|與0或1比較,進(jìn)而對(duì)變量x與變量y的相關(guān)關(guān)系作出判斷.探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)變式訓(xùn)練1已知兩個(gè)變量x和y的七組數(shù)據(jù)如下表:x21232527293235y711212466115325試判斷x與y之間是否具有線(xiàn)性相關(guān)關(guān)系.探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)求經(jīng)驗(yàn)回歸方程例2某研究機(jī)構(gòu)對(duì)高三學(xué)生的記憶力x和判斷力y進(jìn)行統(tǒng)計(jì)分析,得下表數(shù)據(jù):x681012y2356(1)請(qǐng)畫(huà)出上表數(shù)據(jù)的散點(diǎn)圖;(2)請(qǐng)根據(jù)上表提供的數(shù)據(jù),建立y關(guān)于x的經(jīng)驗(yàn)回歸方程;(3)試根據(jù)求出的經(jīng)驗(yàn)回歸方程,預(yù)測(cè)記憶力為9的同學(xué)的判斷力.探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)解:(1)散點(diǎn)圖如圖:探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)反思感悟

1.求經(jīng)驗(yàn)回歸方程:2.利用經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測(cè):把經(jīng)驗(yàn)回歸方程看作一次函數(shù),求函數(shù)值.3.利用經(jīng)驗(yàn)回歸方程判斷正、負(fù)相關(guān):決定正相關(guān)還是負(fù)相關(guān)的是探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)變式訓(xùn)練2隨著我國(guó)經(jīng)濟(jì)的發(fā)展,居民儲(chǔ)蓄存款逐年增長(zhǎng).設(shè)某地區(qū)城鄉(xiāng)居民人民幣儲(chǔ)蓄存款(年底余額)如下表:年份20152016201720182019時(shí)間代號(hào)t12345儲(chǔ)蓄存款y/千億元567810(1)建立y關(guān)于t的經(jīng)驗(yàn)回歸方程;(2)用所求經(jīng)驗(yàn)回歸方程預(yù)測(cè)該地區(qū)的居民2020年(t=6)的人民幣儲(chǔ)蓄存款.探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)解:(1)根據(jù)數(shù)據(jù)畫(huà)出散點(diǎn)圖(略),由散點(diǎn)圖可知y與t線(xiàn)性相關(guān).列表計(jì)算如下:探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)回歸分析例3某運(yùn)動(dòng)員訓(xùn)練次數(shù)x與成績(jī)y的數(shù)據(jù)如下:次數(shù)x3033353739444650成績(jī)y3034373942464851(1)作出散點(diǎn)圖;(2)建立成績(jī)y關(guān)于次數(shù)x的經(jīng)驗(yàn)回歸方程;(3)作出殘差圖;(4)計(jì)算R2,并用R2說(shuō)明擬合效果的好壞.探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)解:(1)該運(yùn)動(dòng)員訓(xùn)練次數(shù)x與成績(jī)y之間的散點(diǎn)圖如圖所示,由散點(diǎn)圖可知,它們之間具有線(xiàn)性相關(guān)關(guān)系.探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)(3)某運(yùn)動(dòng)員訓(xùn)練次數(shù)與成績(jī)之間的數(shù)據(jù)及相應(yīng)的殘差數(shù)據(jù)為

殘差圖如圖所示.由圖可知,殘差比較均勻地分布在橫軸的兩邊,說(shuō)明選用的模型比較合適.探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)(4)計(jì)算得R2≈0.985

5.說(shuō)明擬合效果較好.反思感悟

1.解答本類(lèi)題目應(yīng)先通過(guò)散點(diǎn)圖來(lái)分析兩個(gè)變量是否線(xiàn)性相關(guān),再利用求經(jīng)驗(yàn)回歸方程的公式求解經(jīng)驗(yàn)回歸方程,并利用殘差圖或R2來(lái)分析模型的擬合效果.2.“R2、殘差圖”在回歸分析中的作用:(1)R2是用來(lái)刻畫(huà)回歸效果的,由R2=1-,可知R2越大,意味著殘差平方和越小,也就是說(shuō)模型的擬合效果越好.(2)殘差圖也是用來(lái)刻畫(huà)回歸效果的,判斷依據(jù)是:殘差比較均勻地分布在橫軸的兩邊,說(shuō)明殘差比較符合一元線(xiàn)性回歸模型的假定.探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)變式訓(xùn)練3在一段時(shí)間內(nèi),某種商品的價(jià)格x(單位:元)和需求量y(單位:件)之間的一組數(shù)據(jù)如下:x/元1416182022y/件1210753已知x與y線(xiàn)性相關(guān),求出y關(guān)于x的經(jīng)驗(yàn)回歸方程,并用R2說(shuō)明擬合效果的好壞.探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)求非線(xiàn)性經(jīng)驗(yàn)回歸方程例4某地區(qū)六年來(lái)輕工業(yè)產(chǎn)品利潤(rùn)總額y(單位:億元)與年次x的數(shù)據(jù)如下:年次x123456利潤(rùn)總額y/億元11.3511.8512.4413.0713.5914.41由經(jīng)驗(yàn)知,年次x與利潤(rùn)總額y(單位:億元)近似有如下關(guān)系:y=abxe0.其中a,b均為正數(shù),求y關(guān)于x的經(jīng)驗(yàn)回歸方程.探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)解:對(duì)y=abxe0兩邊取自然對(duì)數(shù),得ln

y=ln

ae0+xln

b.令z=ln

y,則z與x的數(shù)據(jù)如下表:x123456z2.432.472.522.572.612.67由z=ln

ae0+xln

b及最小二乘法,得ln

b≈0.049

1,ln

ae0≈2.371,探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)反思感悟

非線(xiàn)性經(jīng)驗(yàn)回歸方程的求法

探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)變式訓(xùn)練4某展會(huì)一天上午9點(diǎn)半到下午2點(diǎn)的即時(shí)參觀(guān)人數(shù)如下表:時(shí)間9.51010.51111.51212.51313.514人數(shù)y/萬(wàn)12.3920.0225.5730.2635.7737.5740.2340.9541.7343.71已知時(shí)間與參觀(guān)人數(shù)具有很強(qiáng)的相關(guān)關(guān)系,試求出這段時(shí)間內(nèi)即時(shí)參觀(guān)人數(shù)關(guān)于時(shí)間的經(jīng)驗(yàn)回歸方程.探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)解:根據(jù)題表中的數(shù)據(jù)畫(huà)出散點(diǎn)圖如圖所示.由圖可以看出,樣本點(diǎn)分布在某條對(duì)數(shù)型函數(shù)曲線(xiàn)y=a+bln

x的周?chē)?令z=ln

x,則y=a+bz,故y與z具有線(xiàn)性相關(guān)關(guān)系.可知y與z的數(shù)據(jù)如下表:探究一探究二探究三探究四素養(yǎng)形成當(dāng)堂檢測(cè)z2.252.302.352.402.442.482.532.562.602.64人數(shù)y/萬(wàn)12.3920.0225.5730.2635

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論