第5章回歸分析ppt課件_第1頁
第5章回歸分析ppt課件_第2頁
第5章回歸分析ppt課件_第3頁
第5章回歸分析ppt課件_第4頁
第5章回歸分析ppt課件_第5頁
已閱讀5頁,還剩68頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第第5章章 回歸分析回歸分析5.1 概述概述 回歸分析回歸分析研討變量與變量之間關(guān)系的數(shù)學(xué)研討變量與變量之間關(guān)系的數(shù)學(xué)方法。方法。 變量之間的關(guān)系:變量之間的關(guān)系:5.1.1 確定性關(guān)系確定性關(guān)系 函數(shù)關(guān)系,經(jīng)反復(fù)的精確實驗或嚴(yán)厲的數(shù)學(xué)推函數(shù)關(guān)系,經(jīng)反復(fù)的精確實驗或嚴(yán)厲的數(shù)學(xué)推導(dǎo)得到。如導(dǎo)得到。如 S= vt 。數(shù)學(xué)分析和物理學(xué)中的大多。數(shù)學(xué)分析和物理學(xué)中的大多數(shù)公式屬于這種類型。數(shù)公式屬于這種類型。到方差分析到方差分析 實踐問題中,絕大多數(shù)情況下,變量之間的關(guān)系實踐問題中,絕大多數(shù)情況下,變量之間的關(guān)系不那么簡單。如資料的抗拉強度與其硬度之間的關(guān)系;不那么簡單。如資料的抗拉強度與其硬度之間的

2、關(guān)系;資料的性能與其化學(xué)成份之間等等。資料的性能與其化學(xué)成份之間等等。 這些變量之間既存在著親密的關(guān)系,又不能由一這些變量之間既存在著親密的關(guān)系,又不能由一個或幾個變量自變量的數(shù)值準(zhǔn)確地求出另一個或幾個變量自變量的數(shù)值準(zhǔn)確地求出另一個變量因變量的數(shù)值,而是要經(jīng)過實驗和調(diào)查研個變量因變量的數(shù)值,而是要經(jīng)過實驗和調(diào)查研討,才干確定它們之間的關(guān)系,如圖討,才干確定它們之間的關(guān)系,如圖5.1所示,雖然各所示,雖然各組數(shù)據(jù)不是準(zhǔn)確地服從組數(shù)據(jù)不是準(zhǔn)確地服從f(x)關(guān)系,但關(guān)系,但y值總還是隨值總還是隨x的添的添加而添加。我們稱這類變量之間的關(guān)系為相關(guān)關(guān)系。加而添加。我們稱這類變量之間的關(guān)系為相關(guān)關(guān)系。

3、5.1.2 相關(guān)關(guān)系相關(guān)關(guān)系 圖5.1 相關(guān)關(guān)系024681012141605101520 xy 雖然各組數(shù)據(jù)不是準(zhǔn)確地服從雖然各組數(shù)據(jù)不是準(zhǔn)確地服從f(x)關(guān)系,但關(guān)系,但y值總值總還是隨還是隨x的添加而變化。的添加而變化。5.1 概述概述回歸分析的主要內(nèi)容:回歸分析的主要內(nèi)容: 運用數(shù)學(xué)的方法,對大量的丈量數(shù)據(jù)進展處置,從運用數(shù)學(xué)的方法,對大量的丈量數(shù)據(jù)進展處置,從而得出比較符合事物內(nèi)部規(guī)律的數(shù)學(xué)表達(dá)式數(shù)學(xué)模而得出比較符合事物內(nèi)部規(guī)律的數(shù)學(xué)表達(dá)式數(shù)學(xué)模型。型。),(21Ncccxfy5-1待定常數(shù)待定常數(shù)5 .2 最小二乘法原理最小二乘法原理 假設(shè)假設(shè) x 和和 y 是具有某種相關(guān)關(guān)系的物

4、理量,它們是具有某種相關(guān)關(guān)系的物理量,它們之間的關(guān)系可用下式給出:之間的關(guān)系可用下式給出:5 .2 最小二乘法原理最小二乘法原理 同時丈量同時丈量 x ,y 的數(shù)值,設(shè)有的數(shù)值,設(shè)有 m 對觀測結(jié)果:對觀測結(jié)果:),( ,),(),(2211mmyxyxyx 利用觀測值,確定利用觀測值,確定 。設(shè)。設(shè) x,y 關(guān)系的最關(guān)系的最正確方式為:正確方式為:Nccc,21),(21Ncccxfy5-25-3最正確估計值最正確估計值如不存在丈量誤差,那么:如不存在丈量誤差,那么:micccxfyNii, 2 , 1),(215-4由于存在丈量誤差,因此式由于存在丈量誤差,因此式5-3與與5-4不相重合,

5、即有:不相重合,即有:miyyeiii, 2 , 15-5殘差殘差誤差的實測值誤差的實測值5 .2 最小二乘法原理最小二乘法原理 式式53中的中的 x 變化時,變化時,y 也隨之變化。假設(shè)也隨之變化。假設(shè) m 對觀測值對觀測值中有比較多的中有比較多的 y 值落到曲線值落到曲線51上,那么所得曲線就能較為上,那么所得曲線就能較為稱心地反映被測物理量之間的關(guān)系,稱心地反映被測物理量之間的關(guān)系,y 值同時出現(xiàn)的概率最大,值同時出現(xiàn)的概率最大,那么曲線那么曲線53就是曲線就是曲線51的最正確方式。如圖的最正確方式。如圖5.1a所所示。假設(shè)誤差服從正態(tài)分布,那么概率示。假設(shè)誤差服從正態(tài)分布,那么概率 P

6、(e1, e2, , em)為:為: miimiiieyyS1212)(57當(dāng)當(dāng)P最大時,求得的曲線就該當(dāng)是最正確方式。從圖最大時,求得的曲線就該當(dāng)是最正確方式。從圖5-1a中可以中可以看出,顯然,此時下式應(yīng)最?。嚎闯?,顯然,此時下式應(yīng)最?。簃iiimyyeeeP122212)(exp21),( 56即殘差平方和最小,這就是最小二乘法原理的由來。即殘差平方和最小,這就是最小二乘法原理的由來。圖圖5.1aiy 38141514108y = 0.0108x3 - 0.4408x2 + 4.8901x - 1.976402468101214161805101520 xyx1 13 36 68 810

7、10131316163 38 814141515141410108 8yi2.482.489.029.0213.8313.8314.4614.4613.6413.6410.8310.837.667.66ei0.520.52-1.02-1.020.170.170.540.540.360.36-0.83-0.830.340.34iy 5 .2 最小二乘法原理最小二乘法原理 這里假定這里假定 xi 無誤差。式無誤差。式57可以寫成:可以寫成:miNiicccxfyS1221),(58S最小,就應(yīng)有:最小,就應(yīng)有:0, 0, 021NcScScS59即要求求解如即要求求解如下聯(lián)立方程組:下聯(lián)立方程組:

8、0),(0),(0),(12121211121NmiNiimiNiimiNiicfcccxfycfcccxfycfcccxfy5105.3 直線的回歸直線的回歸5.3.1 一元直線回歸分析一元直線回歸分析 對一元線性回歸而言,就是配直線的問題,下面對一元線性回歸而言,就是配直線的問題,下面經(jīng)過例題加以分析闡明。經(jīng)過例題加以分析闡明。 例例5.1 研討腐蝕時間與腐蝕深度兩個變量之間的研討腐蝕時間與腐蝕深度兩個變量之間的關(guān)系,可把腐蝕時間作為自變量關(guān)系,可把腐蝕時間作為自變量 x ,把腐蝕深度作為,把腐蝕深度作為因變量因變量 y ,將實驗數(shù)據(jù)記錄在表,將實驗數(shù)據(jù)記錄在表5-1中。求出中。求出x,y

9、之之間的線性關(guān)系。間的線性關(guān)系。 解:將表解:將表5-1中的中的(x, y) 數(shù)據(jù),在直角坐標(biāo)系中對應(yīng)數(shù)據(jù),在直角坐標(biāo)系中對應(yīng)地做出一系列的點,可得圖地做出一系列的點,可得圖5.2,這種圖稱之為散,這種圖稱之為散點圖。點圖。 與與 x 的關(guān)系大致呈直線關(guān)系,但并不是確定性的的關(guān)系大致呈直線關(guān)系,但并不是確定性的關(guān)系,而是一種相關(guān)關(guān)系:關(guān)系,而是一種相關(guān)關(guān)系:y bxay 回歸系數(shù)回歸系數(shù)511 最正確估計值應(yīng)使其殘差平方和最小,殘差為:最正確估計值應(yīng)使其殘差平方和最小,殘差為:)(iiibxaye 512圖圖52、表、表51時時間間 x,min351020304050606590120腐腐蝕蝕

10、深深度度 y, u40 60 80 130 160 170 190 250 250 290 460表表5-1 實驗數(shù)據(jù)實驗數(shù)據(jù)圖52 散點圖圖52 散點圖y = 3.2149x + 45.007R2 = 0.97110100200300400500020406080100120140時間 x時間 x腐蝕深度 y腐蝕深度 ybxay.5.3.1一元直線回歸分析一元直線回歸分析其平方和為:其平方和為: 2112)( miiimiibxayeS513平方和最小,即:平方和最小,即: 0)(20)(211miiiimiiibxayxbSbxayaS514得正規(guī)方程組:得正規(guī)方程組: imiimiimi

11、imiimiiyxxbxayxbam1121115155.3.1一元直線回歸分析一元直線回歸分析令平均值為:令平均值為: miimiimyymxx11516由由511得:得: xbyayxba517518由式由式515得:得: mimiiimimiimiiiixmxyxmyxb1212111115.3.1一元直線回歸分析一元直線回歸分析 miimiiixxyyxxb121)()(519式中式中520 由式由式(5-18)和式和式(5-19)可以求得回歸直線方程式中的??梢郧蟮没貧w直線方程式中的常數(shù)數(shù)a及回歸系數(shù)及回歸系數(shù)b。令令5-21便可得到回歸系數(shù)的另一種表達(dá)式:便可得到回歸系數(shù)的另一種表

12、達(dá)式: 5-52并且,習(xí)慣上稱miix12為 x 的平方和; mxmii12)(為平方和的修正項; miiiyx1為 x 與 y 的乘積和;的乘積和;myxmiimii11)( )(為乘積和的修正項。 上述回歸直線的詳細(xì)計算,通常都是列表進展的,上述回歸直線的詳細(xì)計算,通常都是列表進展的,本節(jié)的例如,詳細(xì)計算見表本節(jié)的例如,詳細(xì)計算見表5-2。完成表完成表5-2的計算,就可得到回歸直線方程:的計算,就可得到回歸直線方程: 5-23編號 x yx2 y2xy1340916001202560253600300310801006400800420130400169002600530160900256

13、004800640170160028900680075019025003610095008602503600625001500096525042256250016250109029081008410026100111204601440021160055200參數(shù)值493208035859539800137470參數(shù)值44.81818182189.0922095.3636439330993221.818181376414649144248.181823.2145.01表5-2 回歸直線方程的計算(I)xy2x2yxyxymx2)(my2)(myx)(yylxylxxxyllbxbyaxxl1先把

14、數(shù)據(jù)在先把數(shù)據(jù)在Excel中成列輸入到電子表格中;中成列輸入到電子表格中;2全部選擇一切數(shù)據(jù);全部選擇一切數(shù)據(jù);3點擊圖表導(dǎo)游快捷按鈕,按提示一步一步建立點擊圖表導(dǎo)游快捷按鈕,按提示一步一步建立散點圖;散點圖;5.3.2 利用微軟公司的電子表格利用微軟公司的電子表格Microsoft Excel在在計算機中進展線性回歸的方法計算機中進展線性回歸的方法14建立好散點圖后,用鼠標(biāo)點到圖上散點的位置,建立好散點圖后,用鼠標(biāo)點到圖上散點的位置,單擊鼠標(biāo)左鍵選中一切的散點,然后單擊鼠標(biāo)右鍵,單擊鼠標(biāo)左鍵選中一切的散點,然后單擊鼠標(biāo)右鍵,出現(xiàn)一個對話框,點擊左鍵選擇添加趨勢線,出現(xiàn)出現(xiàn)一個對話框,點擊左鍵

15、選擇添加趨勢線,出現(xiàn)另一個對話框,在對話框中選擇某些功能,回歸直另一個對話框,在對話框中選擇某些功能,回歸直線方程就會出如今圖上的某一位置。線方程就會出如今圖上的某一位置。2.3.2 方差分析方差分析 由由 x 預(yù)告預(yù)告 ,準(zhǔn)確度如何?用方差分析,準(zhǔn)確度如何?用方差分析 處理這一問題。處理這一問題。 殘差可表示如下:殘差可表示如下:y iiiyye 實驗得到的數(shù)據(jù)實驗得到的數(shù)據(jù)回歸直線對應(yīng)的數(shù)據(jù)回歸直線對應(yīng)的數(shù)據(jù)上式可改寫成:上式可改寫成:)()(yyyyyyeiiiii 524移項得:移項得:)()(yyyyyyiiii miimiiiimiiimiiiimiiyyyyyyyyyyyyyy1

16、21122112)()(2)()()()(兩端平方求和得:兩端平方求和得:525可以證明此項可以證明此項為零,故得:為零,故得: miimiiimiiyyyyyy121212)()()( miiiyy12)( miiyy12)( 上式中三項平方和的意義如下:上式中三項平方和的意義如下:代表在實驗范圍內(nèi),觀測值代表在實驗范圍內(nèi),觀測值 yi 總總的動搖情況,稱此為總平方和。的動搖情況,稱此為總平方和。 miiyy12)(代表代表 x 變化所引起的變化所引起的 y 值變化大小的量,值變化大小的量,即即yi 動搖中,可以經(jīng)過回歸方程計算出動搖中,可以經(jīng)過回歸方程計算出來的那一部分,稱之為回歸平方和。

17、來的那一部分,稱之為回歸平方和。 上述三個平方和之間的關(guān)系,可以用圖上述三個平方和之間的關(guān)系,可以用圖5.14表示出來。總平表示出來??偲椒胶涂梢苑纸獬蓛刹糠郑貧w平方和與殘差平方和。方和可以分解成兩部分,回歸平方和與殘差平方和。是殘差平方和,表示了回歸方程的擬合是殘差平方和,表示了回歸方程的擬合誤差,即觀測值誤差,即觀測值yi 偏離回歸值偏離回歸值 的大小。的大小。這一部分不能經(jīng)過回歸方程計算出來,這一部分不能經(jīng)過回歸方程計算出來,它是它是yi 動搖中與動搖中與 x 無關(guān)的部分。無關(guān)的部分。iy 的的分分解解圖圖yyi 35 x x y y回 歸殘 差的分解圖yyi14. 5yy yyi b

18、xay iiyy yyi 由圖中可以看出,假設(shè)殘差平方和很小,那么回歸平方和總平方和將接近于由圖中可以看出,假設(shè)殘差平方和很小,那么回歸平方和總平方和將接近于1。這時,一切的觀測點都接近或落在回歸線上,這就闡明回歸直線的精度較高。這時,一切的觀測點都接近或落在回歸線上,這就闡明回歸直線的精度較高。 殘差平方和是排除了殘差平方和是排除了 x 對對 y 的線性影響后的剩余部分,的線性影響后的剩余部分,y 值值隨機動搖程度的大小,用它來估計誤差。隨機動搖程度的大小,用它來估計誤差。 產(chǎn)生緣由:包括隨機誤差、那些影響很小但尚未思索的要素。產(chǎn)生緣由:包括隨機誤差、那些影響很小但尚未思索的要素。自在度:自

19、在度: f總總= f回回 + f殘殘 f總總= m - 1 f回回 =1f殘殘= f總總 f回回 = m - 2 方差:殘差平方和除以它的自在度:方差:殘差平方和除以它的自在度:殘殘殘差平方和殘差平方和fS 2規(guī)范偏向估算值:規(guī)范偏向估算值:殘殘殘殘差差平平方方和和fS 529用用S衡量隨機要素對衡量隨機要素對 y 的影響。的影響?;貧w方程可作如下預(yù)告:回歸方程可作如下預(yù)告:)( 置信水平置信水平Sbxay 波動原因自由度方差142252471.04239.121.70146491總計表5-3 一元直線回歸方程方差分析示例平方和1回歸殘差4395023.3)(2xyiblyy6 .142029

20、146491)(2xyyyiibllyy2myyilyy2)(1m22mbllSxyyyS將例將例5.1一元直線回歸的方差分析可歸納在表一元直線回歸的方差分析可歸納在表5-3中。中。 回歸方程可改寫為:回歸方程可改寫為:)05. 0(70.21668.432316. 3置信水平xy5.3.4 相關(guān)性檢驗相關(guān)性檢驗 用一個數(shù)量性的目的,來衡量兩個變量之間線性相關(guān)關(guān)用一個數(shù)量性的目的,來衡量兩個變量之間線性相關(guān)關(guān)系的親密程度系的親密程度相關(guān)系數(shù)相關(guān)系數(shù) r 。2121)()( miimiiyyyyr回歸平方和回歸平方和總平方和總平方和5-32 r 1 時,闡明規(guī)范誤差很小實驗點與回歸點幾乎吻時,闡

21、明規(guī)范誤差很小實驗點與回歸點幾乎吻合,回歸方程才有意義。通常合,回歸方程才有意義。通常 0r1。r 取值不同時的散點分布情況示于圖取值不同時的散點分布情況示于圖5.15中,詳細(xì)分析如下:中,詳細(xì)分析如下:1 r = 0 時。此時時。此時 b = 0 ,即按最小二乘法確定的回歸直線平,即按最小二乘法確定的回歸直線平行于行于 x 軸,這闡明軸,這闡明 y 的變化與的變化與 x 無關(guān)。故無關(guān)。故 x 與與 y 之間沒有線性關(guān)之間沒有線性關(guān)系。通常,散點的分布是完全不規(guī)那么的,如圖系。通常,散點的分布是完全不規(guī)那么的,如圖5.15a所示。所示。2 0r1。這時,。這時, x 與與 y 之間存在著一定的

22、線性關(guān)系。之間存在著一定的線性關(guān)系。當(dāng)當(dāng) r 0 時時 b0 ,散點分布有隨,散點分布有隨 x 添加添加 y 添加的趨勢,此時稱添加的趨勢,此時稱 x 與與 y 是正相關(guān),如圖是正相關(guān),如圖5.15b所示。當(dāng)所示。當(dāng) r 0 時時 b0 ,散點圖,散點圖呈呈 y 隨隨 x 添加而減小的趨勢,此時稱添加而減小的趨勢,此時稱 x 與與 y 為負(fù)相關(guān),如圖為負(fù)相關(guān),如圖5.15c所示。當(dāng)所示。當(dāng) r 的絕對值比較大時,散點遠(yuǎn)離回歸直線較為分的絕對值比較大時,散點遠(yuǎn)離回歸直線較為分散;當(dāng)散;當(dāng) r 的絕對值較大時,散點分布就接近直線。的絕對值較大時,散點分布就接近直線。3 r= 1。一切的點都在一條直

23、線上,即散點都落在回歸。一切的點都在一條直線上,即散點都落在回歸直線上。此時,稱直線上。此時,稱 x 與與 y 完全性相關(guān)。實踐上,此時完全性相關(guān)。實踐上,此時 x 與與 y 之間之間有確定性的線性關(guān)系。如圖有確定性的線性關(guān)系。如圖5.15d所示。所示。圖圖(a)R2 = 0 xy 圖圖5.15(a) x圖5 4 ( b)R2 = 0.6215xy 圖圖5.15(b) x圖5 4 ( c)R = - 0.79xy 圖圖5.15(c) x圖5 4 ( d)R2 = 1xy 圖圖5.15(d) x圖5 4 ( e)R2 = 0 xy 圖圖5.15(e) x 從上述討論可以看出,相關(guān)系數(shù)從上述討論可

24、以看出,相關(guān)系數(shù) r 表示兩個隨機變量表示兩個隨機變量 x 與與 y 之間線性相關(guān)的親密程度。之間線性相關(guān)的親密程度。 r越大,愈接近于越大,愈接近于1,x 與與 y 之間之間的線性相關(guān)也就愈親密。但必需指出,相關(guān)系數(shù)的線性相關(guān)也就愈親密。但必需指出,相關(guān)系數(shù) r 只表示線性相只表示線性相關(guān)的親密程度,當(dāng)關(guān)的親密程度,當(dāng) r 很小,甚至等于零時,并不一定闡明很小,甚至等于零時,并不一定闡明 x 與與 y 之間就不存在其它關(guān)系。如圖之間就不存在其它關(guān)系。如圖515(e)所示,雖然所示,雖然 r = 0,但從散點,但從散點分布看,分布看,x 與與 y 之間存在著明顯的曲線關(guān)系,只不過這種關(guān)系不之間

25、存在著明顯的曲線關(guān)系,只不過這種關(guān)系不是線性關(guān)系罷了。是線性關(guān)系罷了。 相關(guān)系數(shù)的絕對值終究多大才干以為兩個變量是相關(guān)的呢?相關(guān)系數(shù)的絕對值終究多大才干以為兩個變量是相關(guān)的呢?或回歸方程才有意義呢?或回歸方程才有意義呢?F檢驗:檢驗:假設(shè):假設(shè):H0:b = 0,F(xiàn)為:為:殘殘回回殘殘差差平平方方和和回回歸歸平平方方和和ffF/534 可見可見 r 檢驗與檢驗與 F 檢驗的作檢驗的作用是一致的,只用一種即可。用是一致的,只用一種即可。 可查表得出可查表得出 Fa=1,m2,當(dāng):,當(dāng): F F0.01 特別顯著;特別顯著; F0.01 F F0.05 時,顯著;時,顯著; F0.05 F F0.

26、10 時,較顯著;時,較顯著; F F0.10 時,不顯著。時,不顯著。1先把數(shù)據(jù)在先把數(shù)據(jù)在Excel中成列輸入到電子表格中;中成列輸入到電子表格中;2點擊下拉菜單的點擊下拉菜單的“工具按鈕,鼠標(biāo)箭頭挪動到工具按鈕,鼠標(biāo)箭頭挪動到“數(shù)據(jù)分析項下,點擊左鍵,出現(xiàn)數(shù)據(jù)分析對話框,數(shù)據(jù)分析項下,點擊左鍵,出現(xiàn)數(shù)據(jù)分析對話框,在對話框中選擇在對話框中選擇“回歸,點擊回歸,點擊“確定按鈕,出現(xiàn)回確定按鈕,出現(xiàn)回歸對話框,按對話框中的提示,選擇對話框中的某些功歸對話框,按對話框中的提示,選擇對話框中的某些功能,即可得出與直線回歸有關(guān)的很多參數(shù)。能,即可得出與直線回歸有關(guān)的很多參數(shù)。3利用計算出的參數(shù),即

27、可寫出回歸方程。利用計算出的參數(shù),即可寫出回歸方程。5.3.5 利用利用Excel在計算機中進展線性回歸的方法在計算機中進展線性回歸的方法25.4 曲線回歸曲線回歸 在實踐問題中,變量之間經(jīng)常不是直線關(guān)系。這時,通常在實踐問題中,變量之間經(jīng)常不是直線關(guān)系。這時,通常是選配一條比較接近的曲線,經(jīng)過變量變換把非線性方程加以是選配一條比較接近的曲線,經(jīng)過變量變換把非線性方程加以線性化,然后對線性化的方程運用最小乘法求解回歸方程。線性化,然后對線性化的方程運用最小乘法求解回歸方程。 最小二乘法的一個前提條件是函數(shù)最小二乘法的一個前提條件是函數(shù) y = fx的詳細(xì)方式為的詳細(xì)方式為知,即要求首先確定知,

28、即要求首先確定 x 與與 y 之間內(nèi)在關(guān)系的函數(shù)類型。函數(shù)的之間內(nèi)在關(guān)系的函數(shù)類型。函數(shù)的方式能夠是各種各樣的,詳細(xì)方式確實定或假設(shè),普通有下述方式能夠是各種各樣的,詳細(xì)方式確實定或假設(shè),普通有下述兩個途徑:一是根據(jù)有關(guān)的物理知識,確定兩個變量之間的函兩個途徑:一是根據(jù)有關(guān)的物理知識,確定兩個變量之間的函數(shù)類型;二是把觀測數(shù)據(jù)劃在坐標(biāo)紙上,將散點圖與知函數(shù)曲數(shù)類型;二是把觀測數(shù)據(jù)劃在坐標(biāo)紙上,將散點圖與知函數(shù)曲線對比,選取最接近散點分布的曲線公式進展試算。線對比,選取最接近散點分布的曲線公式進展試算。 常見的一些非線性函數(shù)及其線性化方法如下。常見的一些非線性函數(shù)及其線性化方法如下。5.4.1

29、曲線回歸曲線回歸xbay 11雙曲線,雙曲線, 型,見圖型,見圖5.23。bvauxvyu 則則令令,1,12指數(shù)曲線,指數(shù)曲線, ,見圖,見圖5.24。型型bxaey bvcuacxvyu 則則令令,ln,ln 3指數(shù)曲線,指數(shù)曲線, ,見圖,見圖5.25。型型xbaey/bvcuacxvyu則則令令,ln,/1,ln 4冪函數(shù)曲線,冪函數(shù)曲線, ,見圖,見圖5.26。型型baxy bvcuacxvyu則則令令,lg,lg,lg圖圖5.23 (a) 雙曲線雙曲線(a ) a 0, b 0-0.10-0.050.000.050.100.15-4-202468101214xy圖圖5.23(b)

30、雙曲線雙曲線(b) a0, b00510152025-1-0.500.511.52xy圖圖5.24(b) 指數(shù)曲線指數(shù)曲線(b) b00102030405060708000.511.522.533.54xy圖圖5.25(b) 指數(shù)曲線指數(shù)曲線(b) b0 xyb10 b 1b = 1圖圖5.26(b) 冪函數(shù)曲線冪函數(shù)曲線(b) b0 xyb 1b=11 b 0-10 xy圖圖5.27(b) 對數(shù)曲線對數(shù)曲線(a) b 0, c b 0, c 0050 xy圖圖5.29 (b) 對數(shù)拋物線對數(shù)拋物線b 0, c b 0, c 0 0 如上所述,許多曲線都可以經(jīng)過變換化為直線,可以按直線如上所述

31、,許多曲線都可以經(jīng)過變換化為直線,可以按直線擬合的方法來處置。擬合的方法來處置。 必需留意!所配曲線的回歸中,必需留意!所配曲線的回歸中,r r、S S、F F 等的計算稍有不同。等的計算稍有不同。u u、v v 等僅僅是為了變量變換,使曲線方程變?yōu)橹本€方程,然而要等僅僅是為了變量變換,使曲線方程變?yōu)橹本€方程,然而要求的是所配曲線與觀測數(shù)據(jù)擬合較好,所以計算求的是所配曲線與觀測數(shù)據(jù)擬合較好,所以計算r r、S S、F F 等時,等時,應(yīng)首先根據(jù)已建立的回歸方程,用應(yīng)首先根據(jù)已建立的回歸方程,用 xi xi 依次代入,得到依次代入,得到 yi yi 后再后再計算計算殘 差 平 方 和殘 差 平

32、方 和 及 總 平 方及 總 平 方和和 ,于是:,于是: miiiyy12)( miiyy12)(21212)() (1miimiiyyyyR5362)(12 myySmiii537殘殘回回殘殘差差平平方方和和回回歸歸平平方方和和ffF/538 下面舉例闡明曲線回歸的普通計算方法。下面舉例闡明曲線回歸的普通計算方法。 例例5.2 煉鋼廠出鋼用鋼包在運用過程中,由于鋼液煉鋼廠出鋼用鋼包在運用過程中,由于鋼液及爐渣對耐火資料的浸蝕,其容積不斷增大。鋼包的及爐渣對耐火資料的浸蝕,其容積不斷增大。鋼包的容積用盛滿鋼水的分量容積用盛滿鋼水的分量 kg 表示與相應(yīng)的運用次數(shù)表示與相應(yīng)的運用次數(shù)列于表列于

33、表5-4中。求:中。求:x、y之間的關(guān)系式:之間的關(guān)系式: 表表5-4 實驗數(shù)據(jù)實驗數(shù)據(jù)使用次數(shù) x23457810容積 y106.42108.20109.58109.50110.00109.93110.49使用次數(shù) x111415161819容積 y110.59110.60110.90110.76111.00111.20 解:解: 首先按實測數(shù)據(jù)做散點圖,如圖首先按實測數(shù)據(jù)做散點圖,如圖5.30所示。所示。 由圖可見,最初容積添加很快,以后減慢并趨于由圖可見,最初容積添加很快,以后減慢并趨于穩(wěn)定。根據(jù)這個特點,選用雙曲線:穩(wěn)定。根據(jù)這個特點,選用雙曲線:xbay 1(539表示容積表示容積

34、y 與運用次數(shù)與運用次數(shù) x 的關(guān)系。的關(guān)系。圖5.30 鋼包容積與使用次數(shù)之間的關(guān)系散點圖10610710810911011111205101520使用次數(shù) x鋼包容積 y:,1,1則則上上式式可可改改寫寫成成若若令令xvyubvau5-40 對新變量對新變量 u、 v 而言,式而言,式5-40是一個直線方程,是一個直線方程,因此可用最小二乘法進展擬合計算,求出回歸系數(shù)因此可用最小二乘法進展擬合計算,求出回歸系數(shù) b 和常數(shù)項和常數(shù)項 a 。計算步驟如下:。計算步驟如下:1根據(jù)表根據(jù)表5-4中的數(shù)據(jù),計算出中的數(shù)據(jù),計算出 v 、v2、 u、 u2 、uv和回歸系數(shù)和回歸系數(shù)b及常數(shù)項及常數(shù)

35、項a列于表列于表5-5中。中。 編號 x yv2u2uv12106.420.5000000.0093970.25000008.829853E-054.698365E-0323108.200.3333330.0092420.11111118.541723E-053.080715E-0334109.580.2500000.0091260.06250008.327937E-052.281438E-0345109.500.2000000.0091320.04000008.340110E-051.826484E-0357110.000.1428570.0090910.02040828.264463E-0

36、51.298701E-0368109.930.1250000.0090970.01562508.274991E-051.137087E-03710110.490.1000000.0090510.01000008.191323E-059.050593E-04811110.590.0909090.0090420.00826458.176516E-058.220372E-04914110.600.0714290.0090420.00510208.175037E-056.458280E-041015110.900.0666670.0090170.00444448.130868E-056.011422E

37、-041116110.760.0625000.0090290.00390638.151436E-055.642831E-041218111.000.0555560.0090090.00308648.116224E-055.005005E-041319111.200.0526320.0089930.00277018.087056E-054.733056E-042.0508820.1182670.5372181.076075E-031.883495E-02xv1yu1_表5-5 回歸計算13vumv2)(mu2muv)(m編號 x yv2u2uv12106.420.5000000.0093970.

38、25000008.829853E-054.698365E-0323108.200.3333330.0092420.11111118.541723E-053.080715E-0334109.580.2500000.0091260.06250008.327937E-052.281438E-0345109.500.2000000.0091320.04000008.340110E-051.826484E-0357110.000.1428570.0090910.02040828.264463E-051.298701E-0368109.930.1250000.0090970.01562508.274991

39、E-051.137087E-03710110.490.1000000.0090510.01000008.191323E-059.050593E-04811110.590.0909090.0090420.00826458.176516E-058.220372E-04914110.600.0714290.0090420.00510208.175037E-056.458280E-041015110.900.0666670.0090170.00444448.130868E-056.011422E-041116110.760.0625000.0090290.00390638.151436E-055.64

40、2831E-041218111.000.0555560.0090090.00308648.116224E-055.005005E-041319111.200.0526320.0089930.00277018.087056E-054.733056E-042.0508820.1182670.5372181.076075E-031.883495E-02xv1yu1_表5-5 回歸計算130.15776010.01865777610.00909740.32354740.0010759245vumv2)(mu2 muv)(m由式(5-21)計算下面的參數(shù)為:8.291744E-040.008966630

41、.21367051.508906E-071.771701E-04vvluuluvl muv)(vvuvllbvbua(2) 得出變換后的回歸直線方程式為:得出變換后的回歸直線方程式為:vu4310291744. 81096663. 8變換回原始曲線方程為:變換回原始曲線方程為: 將原始數(shù)據(jù)帶入回歸方程式將原始數(shù)據(jù)帶入回歸方程式(5-42)中,計算規(guī)范偏中,計算規(guī)范偏向向S和相關(guān)系數(shù)和相關(guān)系數(shù)R,計算結(jié)果見表,計算結(jié)果見表5-6所示。所示。 由表由表5-6得出的參數(shù)可寫出最后的回歸曲線方程式為:得出的參數(shù)可寫出最后的回歸曲線方程式為:xy110291744. 81096663. 8143 0.2

42、284933 109.94f回 = 10.22849330.9864f殘 = m 2 = 11f總 = m 1 = 12式 (5-29)y殘殘 差 平 方 和fS總 平 方 和殘 差 平 方 和1R編 號 x y殘 差 平 方 和總 平 方 和12106.42106.60-0.180.0310-3.5212.363323108.20108.190.010.0001-1.743.014234109.58109.000.580.3311-0.360.126845109.50109.500.000.0000-0.440.190257110.00110.07-0.070.00500.060.00416

43、8109.93110.25-0.320.1025-0.010.0000710110.49110.50-0.010.00020.550.3067811110.59110.590.000.00000.650.4275914110.60110.79-0.190.03720.660.44071015110.90110.840.060.00340.960.92901116110.76110.88-0.120.01530.820.67871218111.00110.950.050.00211.06120110.980.220.04651.261.59731429.171429.1

44、70.00490.57430.000021.211表 5-6 回 歸 后 的 方 差 分 析y yy2)(yy yy 2)(yy _ 本例運用最小二乘法,雖然運用雙曲線擬合,在本例運用最小二乘法,雖然運用雙曲線擬合,在計算過程中使殘差平方和到達(dá)了最小,但這并缺乏以計算過程中使殘差平方和到達(dá)了最小,但這并缺乏以闡明,所配雙曲線是對表闡明,所配雙曲線是對表5-4中數(shù)據(jù)的最正確擬合曲線。中數(shù)據(jù)的最正確擬合曲線。因此在配曲線時,最好用不同的函數(shù)類型計算后再進因此在配曲線時,最好用不同的函數(shù)類型計算后再進展比較,選取其中最優(yōu)者,即選取相關(guān)系數(shù)展比較,選取其中最優(yōu)者,即選取相關(guān)系數(shù)R為最大的為最大的曲線。

45、此外,在曲線擬合時也可采用分段擬合的方法,曲線。此外,在曲線擬合時也可采用分段擬合的方法,即在不同的自變量區(qū)間內(nèi)配以不同的曲線來進展擬合。即在不同的自變量區(qū)間內(nèi)配以不同的曲線來進展擬合。下面我們采用計算機處置方法,用其它類型的函數(shù)進下面我們采用計算機處置方法,用其它類型的函數(shù)進展回歸擬合試一試,看會得出什么樣的結(jié)果?展回歸擬合試一試,看會得出什么樣的結(jié)果? 利用利用 Excel 對對 x 、y 的數(shù)據(jù)作散點圖,直接作出回歸曲的數(shù)據(jù)作散點圖,直接作出回歸曲線。線。 第一步第一步: 在在Excel電子表格中,按列行輸入電子表格中,按列行輸入 x 與與 y 的的實驗數(shù)據(jù)。實驗數(shù)據(jù)。 第二步:對第二步

46、:對 x 與與 y 的實驗數(shù)據(jù)作出散點圖。的實驗數(shù)據(jù)作出散點圖。 第三步:在圖中選定散點的數(shù)據(jù),做多項式的趨勢線,第三步:在圖中選定散點的數(shù)據(jù),做多項式的趨勢線,即得到相應(yīng)的回歸曲線。即得到相應(yīng)的回歸曲線。5.4.2 用用Excel電子表格軟件進展曲線回歸的方法電子表格軟件進展曲線回歸的方法5.4.2.1 方法方法15.4.2.2 方法方法2 利用利用 Excel 對對 x 、y 的數(shù)據(jù)求出一切的回歸系數(shù)及方差的數(shù)據(jù)求出一切的回歸系數(shù)及方差分析數(shù)據(jù)。分析數(shù)據(jù)。 第一步第一步: 在在Excel電子表格中,按列行輸入電子表格中,按列行輸入 x 與與 y 的的實驗數(shù)據(jù)。實驗數(shù)據(jù)。 第二步:對第二步:

47、對 x 數(shù)據(jù)進展格式化復(fù)制數(shù)據(jù)進展格式化復(fù)制x2x8。 第三步:在表中選定一切第三步:在表中選定一切xx8數(shù)據(jù),選擇數(shù)據(jù),選擇“工具下拉工具下拉菜單菜單“數(shù)據(jù)分析,按提示進展操作,即可得出全部數(shù)據(jù)分析,按提示進展操作,即可得出全部計算分析數(shù)據(jù)。計算分析數(shù)據(jù)。5.5 多元回歸多元回歸5.5.1根本概念根本概念 上面討論的是只需兩個變量的回歸問題,其中一個是自變量,上面討論的是只需兩個變量的回歸問題,其中一個是自變量,另一個是因變量。但在大多數(shù)情況下,自變量不是一個而是多個,另一個是因變量。但在大多數(shù)情況下,自變量不是一個而是多個,稱這類問題為多元回歸問題。稱這類問題為多元回歸問題。 多元回歸中最簡單且最根本的是多元線性回歸。如自變量多元回歸中最簡單且最根本的是多元線性回歸。如自變量 xi ( i= 1,2, ,G ),進展,進展m次實驗,所得的數(shù)據(jù)可以寫成兩個數(shù)組,次實驗,所得的數(shù)據(jù)可以寫成兩個數(shù)組,即兩個矩陣:即兩個矩陣:121212221212

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論