7.1一元線性回歸(課件)-高二數(shù)學(xué)(北師大版2019選擇性)_第1頁
7.1一元線性回歸(課件)-高二數(shù)學(xué)(北師大版2019選擇性)_第2頁
7.1一元線性回歸(課件)-高二數(shù)學(xué)(北師大版2019選擇性)_第3頁
7.1一元線性回歸(課件)-高二數(shù)學(xué)(北師大版2019選擇性)_第4頁
7.1一元線性回歸(課件)-高二數(shù)學(xué)(北師大版2019選擇性)_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

一元線性回歸

在現(xiàn)實生活中,反映量與量之間的函數(shù)關(guān)系非常普遍,但也存在一些量與量之間不滿足函數(shù)關(guān)系,如人的身高與體重.一般說來,人的身高越高,體重就越重,二者確實有關(guān)系.但是身高相同的人,體重卻不一定相同,也就是說,給定身高h(yuǎn)沒有唯一的體重m與之對應(yīng).在現(xiàn)實生活中,這樣的例子還有很多,如人的年齡與血壓、農(nóng)作物的施肥量與產(chǎn)量等.實例分析直線擬合為了了解人的身高與體重的關(guān)系,我們隨機抽取9名15歲的男生,測得他們的身高(單位:cm)、體重(單位:kg)如表7-1:表7-1編號123456789身高/cm165157155175168157178160163體重/kg524445555447625053

從表7-1中不難看出,同一身高157cm對應(yīng)著不同的體重44kg和47kg,即體重不是身高的函數(shù).如果把身高看作橫坐標(biāo)、體重看作縱坐標(biāo),在平面直角坐標(biāo)系中畫出對應(yīng)的點(如圖7-1),就會發(fā)現(xiàn),隨著身高的增長,體重基本上呈現(xiàn)直線增加的趨勢.1.在圖7-1中,每個點對應(yīng)的一對數(shù)據(jù)(xi,yi),稱為成對數(shù)據(jù).這些點構(gòu)成的圖稱為散點圖.2.從散點圖上可以看出,如果變量之間存在著某種關(guān)系,這些點會有一個大致趨勢,這種趨勢通??梢杂靡粭l光滑的曲線來近似地描述.這樣近似描述的過程稱為曲線擬合。3.若在兩個變量x和y的散點圖中,所有點看上去都在一條直線附近波動,此時就可以用一條直線來近似地描述這兩個量之間的關(guān)系,稱之為直線擬合.

注意點:(1)判斷兩個變量X和Y之間是否具有線性關(guān)系,常用的簡便方法就是繪制散點圖.(2)散點圖中包含的數(shù)據(jù)越多,效果就越好.那么,應(yīng)當(dāng)如何求出這條直線呢?方法1

選取散點圖中的兩個點,使得其余的點在這兩個點所連直線兩側(cè)分布得盡可能一樣多,如有人選取了(165,52)和(168,54)這兩個成對數(shù)據(jù),得到直線方程為2x-3y-174=0.因此,一個身高166cm的15歲男生,他的體重大致為52.667kg.方法2

將所有的點分成兩部分,一部分是身高在165cm以下的,一部分是身高在165cm以上(含165cm)的;然后每部分的點求一個平均點:165cm以下的身高、體重的平均數(shù)(取整近似)作為一個平均點,即(158,48),165cm以上(含165cm)的身高、體重的平均數(shù)(取整近似)作為另一個平均點,即(172,56);最后將這兩點連接成一條直線,得到直線方程為4x-7y-296=0,因此,一個身高166cm的15歲男生,他的體重大致為52.571kg.

上面兩種方法都有一定的道理.用方法1,若x=175cm,則可計算y≈58.667kg;用方法2,若x=175cm,則可計算y≈714kg.每一種方法均與實際觀測值有偏差.在實際應(yīng)用時,我們通常選擇本章第1.2節(jié)中介紹的方法進(jìn)行處理.散點圖說明1.定義:

將兩個變量所對應(yīng)的點在平面直角坐標(biāo)系中描出來,這些點就組成了變量之間的一個圖,這種圖叫散點圖.2.散點圖的畫法:

把成對的兩個變量分別作為橫坐標(biāo)和縱坐標(biāo),把每對數(shù)值對應(yīng)的點在平面直角坐標(biāo)系中畫出來.3.散點圖的作用:(1)從散點圖可以看出,如果變量之間存在某種關(guān)系,這些點會有一個集中的大致趨勢,這種趨勢通??梢杂靡粭l光滑的曲線來近似,這樣近似的過程稱為曲線擬合.

若如果變量x和y的散點圖中,所有點看上去都在一條直線附近波動,則稱變量間是線性相關(guān)的.此時,我們可用一條直線來近似.xyo(2)若所有點看上去都在某條曲線(不是一條直線)附近波動,則稱此相關(guān)為非線性相關(guān)的.此時,我們可用一條曲線來擬合.

如果所有的點在散點圖中沒有顯示任何關(guān)系,則稱變量間是不相關(guān)的.xyoxyo(1)根據(jù)表中的數(shù)據(jù),制成散點圖.你能從散點圖中發(fā)現(xiàn)身高與右手一拃長之間的近似關(guān)系嗎?o身高/cm右手一拃長/cm15015516016517017518018519019510152025女生男生4.例題與練習(xí)(2)如果近似成線性關(guān)系,請畫出一條直線來近似地表示這種線性關(guān)系.女生男生o身高/cm右手一拃長/cm15015516016517017518018519019510152025(3)如果一個學(xué)生的身高是188cm,你能估計他的右手一拃長大概有多長嗎?18821(2)如果近似成線性關(guān)系,請畫出一條直線來近似地表示這種線性關(guān)系.o身高/cm右手一拃長/cm15015516016517017518018519019510152025(3)如果一個學(xué)生的身高是188cm,你能估計他的右手一拃長大概有多長嗎?18822平均點(2)如果近似成線性關(guān)系,請畫出一條直線來近似地表示這種線性關(guān)系.o身高/cm右手一拃長/cm15015516016517017518018519019510152025(3)如果一個學(xué)生的身高是188cm,你能估計他的右手一拃長大概有多長嗎?18822.7(3)如果一個學(xué)生的身高是188cm,你能估計他的右手一拃長大概有多長嗎?o身高/cm右手一拃長/cm16018.016218016616817017217417617816418218.519.019.520.020.521.021.5(2)如果近似成線性關(guān)系,請畫出一條直線來近似地表示這種線性關(guān)系.例1

某種木材體積與樹木的樹齡之間有如下的對應(yīng)關(guān)系:(1)請作出這些數(shù)據(jù)的散點圖;樹齡2345678體積30344060556270解以x軸表示樹木的樹齡,y軸表示樹木的體積,可得相應(yīng)的散點圖如圖所示:(2)你能由散點圖發(fā)現(xiàn)木材體積與樹木的樹齡近似成什么關(guān)系嗎?解由散點圖發(fā)現(xiàn)木材體積隨著樹齡的增加而呈增加的趨勢,且散點落在一條直線附近,所以木材的體積與樹齡成線性關(guān)系.練習(xí):

以下四個散點圖中,兩個變量的關(guān)系適合用直線擬合描述的是(

)A.①② B.①③C.②③ D.③④解析

①③中的點分布在一條直線附近,適合直線擬合描述.B

例2某品牌服裝的廣告費支出x(單位:萬元)與銷售額y(單位:萬元)之間有如下的對應(yīng)數(shù)據(jù):廣告費支出x246810銷售額y64138205285360(1)試畫出散點圖,并判斷廣告費支出x與銷售額y是否具有線性相關(guān)關(guān)系;(2)若取過點(2,64)和點(8,285)的直線作為擬合直線,試預(yù)測當(dāng)x=10和15時銷售額y的值是多少?(結(jié)果保留一位小數(shù))解

(1)根據(jù)題中數(shù)據(jù)畫出散點圖如圖觀察散點圖,可以發(fā)現(xiàn)5個樣本點從整體上看大致在一條直線附近,所以變量x,y之間具有線性相關(guān)關(guān)系.(2)過點(2,64)和點(8,285)的直線方程是221x-6y-58=0.令x=10,則221×10-6y-58=0,∴y≈358.7;令x=15,則221×15-6y-58=0,∴y≈542.8,即當(dāng)x=10時,銷售額y的值大約是358.7萬元;當(dāng)x=15時,銷售額y的值大約是542.8萬元.反思利用擬合直線進(jìn)行預(yù)測時應(yīng)注意的問題(1)首先要理解線性相關(guān)和擬合直線方程的意義.(2)利用擬合直線方程求得的預(yù)測值只是實際問題的一個估計值,因此在回答結(jié)論時不能說成是準(zhǔn)確值,而只能用“大約”等詞來回答.一元線性回歸方程

對于給定的兩個變量x和y(如身高和體重),可以把其成對的觀測值(x1,y1),(x2,y2),…,(xn,yn)表示為平面直角坐標(biāo)系中的n個點.

現(xiàn)在希望找到一條直線Y=a+bX,使得對每一個xi(i=1,2,…,n),由這個直線方程計算出來的值a+bi與實際觀測值yi的差異盡可能小.為此,希望[y1-(a+b1)]2+[y2-(a+b2)]2+…+[yn-(a+bn)]2達(dá)到最小.換句話說,我們希望a,b最小二乘法.

為了直觀起見,先考慮3對數(shù)據(jù)(x1,y1),(x2,y2),(x3,y3),即:求a,b的值,使得偏差yi-(a+bi)(i=1,2,3)的平方和最小,即[y1-(a+b1)]2+[y2-(a+b2)]2+[y3-(a+b3)]2達(dá)到最小.下面我們用向量的方法解決這個問題.首先,用向量的語言描述問題.

要用向量的語言描述偏差yi-(a+bi)(i=1,2,3),容易想到將偏差作為向量的分量,即向量的坐標(biāo)(y1-(a+b1),y2-(a+b2),y3-(a+b3)).這樣,問題就等價于:求的a,b值,使得向量(y1-(a+b1),y2-(a+b2),y3-(a+b3))的長度最小.

在這里需要強調(diào)的是:身高和體重之間并沒有函數(shù)關(guān)系,我們得到的線性回歸方程只是對其變化趨勢的一種近似描述.對一個給定身高的人,人們可以用這個方程來估計這個人的體重,這是十分有意義的.…①先來討論3個樣本點的情況補充:怎樣使達(dá)到最小值?函數(shù)法求線性回歸方程:利用配方法可得同樣使用配方法可以得到,當(dāng)假設(shè)我們已經(jīng)得到兩個具有相關(guān)關(guān)系的變量的一組數(shù)據(jù)且回歸方程是:y=bx+a,^其中,a,b是待定參數(shù)。當(dāng)變量x取時它與實際收集到的之間的偏差是oxy2024/1/26易知,截距和斜率分別是使取最小值時的值。由于這正是我們所要推導(dǎo)的公式。在上式中,后兩項和無關(guān),而前兩項為非負(fù)數(shù),因此要使Q取得最小值,當(dāng)且僅當(dāng)前兩項的值均為0,即有2024/1/262024/1/26用同樣的方法我們可以推導(dǎo)出n個點的線性回歸方程的系數(shù):牢記公式1、所求直線方程叫做回歸直線方程;相應(yīng)的直線叫做回歸直線。2、對兩個變量進(jìn)行的線性分析叫做線性回歸分析?;貧w直線方程最小二乘法:稱為樣本點的中心。2、求回歸直線方程的步驟:(3)代入公式(4)寫出直線方程為y=bx+a,即為所求的回歸直線方程。^例1

在本章節(jié)的練習(xí)中,從散點圖可以看出,某小賣部6天賣出熱茶的杯數(shù)Y(單位:杯)與當(dāng)天氣溫X(單位:°C7-2.(1)試用最小二乘法求岀Y關(guān)于X的線性回歸方程;(2)如果某天的氣溫是-3℃,請預(yù)測這天可能會賣出熱茶多少杯.

1.思考辨析(正確的畫“√”,錯誤的畫“×”)(1)利用散點圖可以直觀判斷兩個變量的關(guān)系是否可以用線性表示.(

)(2)線性回歸方程適用于一切樣本和總體.(

)(3)線性回歸方程一般都有局限性.(

)(4)線性回歸方程一定過樣本中的某一點.(

)√×√×鞏固提升2.如果記錄了x,y的幾組數(shù)據(jù)分別為(0,1),(1,3),(2,5),(3,7),那么y關(guān)于x的線性回歸直線必過點(

)A.(2,2)

B.,2)C.(1,2)

D.,4)

答案:D3.隨機抽樣中測得四個樣本點為(1,2),(2,3),(3,4),(4,5),則y與x之間的線性回歸方程為(

)A.y=x+1B.y=x+2C.y=2x+1D.y=x-1

答案:A

例3在本章1.1節(jié)的練習(xí)中,從散點圖可以看出,某小賣部6天賣出熱茶的杯數(shù)Y-2.(1) 試用最小二乘法求岀Y關(guān)于X的線性回歸方程;(2) 如果某天的氣溫是-3℃,請預(yù)測這天可能會賣出熱茶多少杯.

解(1)從散點圖7-6中可以看岀,表7-2中的兩個變量有近似的線性關(guān)系.

例4

某項研究發(fā)現(xiàn)某地的PM10濃度與車流量之間有線性相關(guān)關(guān)系.現(xiàn)采集到該地一周內(nèi)車流量x與PM10濃度y的數(shù)據(jù)如下表:時間車流量x(單位:萬輛)PM10濃度y(單位:μg/m3)星期一25.435.7星期二24.634.5星期三23.535.2星期四24.433.6星期五25.836.1星期六19.730.9星期日20.329.4

解析:(1)如圖所示.

月份代碼t1234567銷售量y(萬件)y1y2y3y4y5y6y7

例5

某地區(qū)2013年至2019年農(nóng)村居民家庭人均純收入Y(單位:千元)的數(shù)據(jù)如下表:(1)求Y關(guān)于T的線性回歸方程;年份2013201420152016201720182019年份代號T1234567人均純收入Y2.93.33.64.44.85.25.9解由所給數(shù)據(jù)計算得

=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×+1×+2×+3×=14,所求線性回歸方程為Y=T+2.3.(2)利用(1)中的線性回歸方程,分析2013年至2019年該地區(qū)農(nóng)村居民家庭人均純收入的變化情況,并預(yù)測該地區(qū)2022年農(nóng)村居民家庭人均純收入.解

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論