數(shù)據(jù)擬合方法e_第1頁(yè)
數(shù)據(jù)擬合方法e_第2頁(yè)
數(shù)據(jù)擬合方法e_第3頁(yè)
數(shù)據(jù)擬合方法e_第4頁(yè)
數(shù)據(jù)擬合方法e_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二講數(shù)據(jù)擬合方法在實(shí)驗(yàn)中,實(shí)驗(yàn)和戡測(cè)常常會(huì)產(chǎn)生大量的數(shù)據(jù)。為了解釋這些數(shù)據(jù)或者根據(jù)這些數(shù)據(jù)做出預(yù)測(cè)、判斷,給決策者提供重要的依據(jù)。需要對(duì)測(cè)量數(shù)據(jù)進(jìn)行擬合,尋找一個(gè)反映數(shù)據(jù)變化規(guī)律的函數(shù)。數(shù)據(jù)擬合方法與數(shù)據(jù)插值方法不同,它所處理的數(shù)據(jù)量大而且不能保證每一個(gè)數(shù)據(jù)沒(méi)有誤差,所以要求一個(gè)函數(shù)嚴(yán)格通過(guò)每一個(gè)數(shù)據(jù)點(diǎn)是不合理的。數(shù)據(jù)擬合方法求擬合函數(shù),插值方法求插值函數(shù)。這兩類函數(shù)最大的不同之處是,對(duì)擬合函數(shù)不要求它通過(guò)所給的數(shù)據(jù)點(diǎn),而插值函數(shù)那么必須通過(guò)每一個(gè)數(shù)據(jù)點(diǎn)。例如,在某化學(xué)反響中,測(cè)得生成物的質(zhì)量濃度y(103g/cm3)與時(shí)間t〔min〕的關(guān)系如表所示t12346810121416y顯然,連續(xù)函數(shù)關(guān)系y(t)是客觀存在的。但是通過(guò)表中的數(shù)據(jù)不可能確切地得到這種關(guān)系。何況,由于儀器和環(huán)境的影響,測(cè)量數(shù)據(jù)難免有誤差。因此只能尋求一個(gè)近擬表達(dá)式y(tǒng)=中(t)尋求合理的近擬表達(dá)式,以反映數(shù)據(jù)變化的規(guī)律,這種方法就是數(shù)據(jù)擬合方法。數(shù)據(jù)擬合需要解決兩個(gè)問(wèn)題:第一,選擇什么類型的函數(shù)中(t)作為擬合函數(shù)〔數(shù)學(xué)模型〕;第二,對(duì)于選定的擬合函數(shù),如何確定擬合函數(shù)中的參數(shù)。數(shù)學(xué)模型應(yīng)建立在合理假設(shè)的根底上,假設(shè)的合理性首先表達(dá)在選擇某種類型的擬合函數(shù)使之符合數(shù)據(jù)變化的趨勢(shì)〔總體的變化規(guī)律〕。擬合函數(shù)的選擇比擬靈活,可以選擇線性函數(shù)、多項(xiàng)式函數(shù)、指數(shù)函數(shù)、三角函數(shù)或其它函數(shù),這應(yīng)根據(jù)數(shù)據(jù)分布的趨勢(shì)作出選擇。為了問(wèn)題表達(dá)的方便,將例1的數(shù)據(jù)表寫成一般的形式tx1x2x3x4x5x6xx8x9x1oy>1y?y3y4y、〉6y。yQ>1o一.線性擬合〔線性模型〕假設(shè)擬合函數(shù)是線性函數(shù),即擬合函數(shù)的圖形是一條平面上的直線。而表中的數(shù)據(jù)點(diǎn)未能精確地落在一條直線上的原因是實(shí)驗(yàn)數(shù)據(jù)的誤差。那么下一步是確定函數(shù)y=a+bx中系數(shù)a和b各等于多少?從幾何背景來(lái)考慮,就是要以a和b作為待定系數(shù),確定一條平面直線使得表中數(shù)據(jù)所對(duì)應(yīng)的10個(gè)點(diǎn)盡可能地靠近這條直線。一般來(lái)講,數(shù)據(jù)點(diǎn)將不會(huì)全部落在這條直線上,如果第k個(gè)點(diǎn)的數(shù)據(jù)恰好落在這條直線上,那么這個(gè)點(diǎn)的坐標(biāo)滿足直線的方程,即a+bxk=yk如果這個(gè)點(diǎn)不在直線上,那么它的坐標(biāo)不滿足直線方程,有一個(gè)絕對(duì)值為|a+bxk-yk|的差異〔殘差〕。于是全部點(diǎn)處的總誤差是**

四\a+bx-y|k=1這是關(guān)于a和b的一個(gè)二元函數(shù),合理的做法是選取a和b,使得這個(gè)函數(shù)取極小值。但是在實(shí)際求解問(wèn)題時(shí)為了操作上的方便,常常是求a和b使得函數(shù)F(a,b)=Z(a+bx-y)2滸=0db,k=1到達(dá)極小。為了求該函數(shù)的極小值點(diǎn),令咀=0da四2(a+bxkk=1習(xí)2(a+bx-y)=0k=1又可以寫成這是關(guān)于未知數(shù)a和b的線性方程組。它們被稱為法方程,10a+尤xb點(diǎn)滸=0db,四2(a+bxkk=1又可以寫成k=1Yxa+Yx2b=四kkk=1求解這個(gè)二元線性方程組便得待定系數(shù)a和b,從而得線性擬合函數(shù)y=a+bx。以下圖中直線是數(shù)據(jù)的線性擬合的結(jié)果。k=1假設(shè)擬合函數(shù)不是線性函數(shù),而是一個(gè)二次多項(xiàng)式函數(shù)。即擬合函數(shù)的圖形是一條平面上的拋物線,而表中的數(shù)據(jù)點(diǎn)未能精確地落在這條拋物線上的原因是實(shí)驗(yàn)數(shù)據(jù)的誤差。那么下一步是確定函數(shù)y=a0+a1x+a2x2中系數(shù)a0、a1和a2各等于多少?從幾何背景來(lái)考慮,就是要以a0、a1和a2為待定系數(shù),確定二次曲線使得表中數(shù)據(jù)所對(duì)應(yīng)的10個(gè)點(diǎn)盡可能地靠近這條曲線。一般來(lái)講,數(shù)據(jù)點(diǎn)將不會(huì)全部落在這條曲線上,如果第k個(gè)點(diǎn)的數(shù)據(jù)恰好落在曲線上,那么這個(gè)點(diǎn)的坐標(biāo)滿足二次曲線的方程,即

%+。1Xk+a2Xk2=我如果這個(gè)點(diǎn)不在曲線上,那么它的坐標(biāo)不滿足曲線方程,有一個(gè)誤差〔殘差〕。于是全部點(diǎn)處的總誤差用殘差平方和表示TOC\o"1-5"\h\zF(a,a,a)=^[(a+ax+ax2)-y]2

01201k2kkk=1這是關(guān)于a0、a1和a2的一個(gè)三元函數(shù),合理的做法是選取a0、a1和a2,使得這個(gè)函數(shù)取極小值。為了求該函數(shù)的極小值點(diǎn),令8F淀dF=0,=0,=0

dadada012得習(xí)2[(a+ax+ax2)一y]=001k2kkk=1v習(xí)2[(a+ax+ax2)一y]x=001k2kkkk=1習(xí)2[(a+ax+ax2)一y]x2=001k2kkkJ=1這是關(guān)于待定系數(shù)a。、。]和a?的線性方程組,寫成等價(jià)的形式為TOC\o"1-5"\h\z10a+四xa+四x2a逆y0k1k2kk=1k=1k=1四xa+四x2a+四x3a=^xy

k0k1k2kkk=1k=1k=1k=1:Ex2a+/x3a+:£x4a=^x2y

k0k1k2kk、k=1k=1k=1k=1這就是法方程,求解這一方程組可得二次擬合函數(shù)中的三個(gè)待定系數(shù)。以下圖反映了例題所給數(shù)據(jù)的二次曲線擬合的結(jié)果

三.數(shù)據(jù)的n、k=1xx1x2……xmf(x)y1x2……ym函數(shù)在個(gè)離散點(diǎn)處的函數(shù)值,假設(shè)擬合函數(shù)是n次多項(xiàng)式,那么需要用所給數(shù)據(jù)來(lái)確定下面的函數(shù)y=%+%x+%尤2+……+時(shí)這里要做一個(gè)假設(shè),即多項(xiàng)式的階數(shù)n應(yīng)小于題目所給數(shù)據(jù)的數(shù)目m〔例題中m=10〕。類似前面的推導(dǎo),可得數(shù)據(jù)的n次多項(xiàng)式擬合中擬合函數(shù)的系數(shù)應(yīng)滿足的正規(guī)方程組如下mEx…Exn]a0L1kkkk=1ExEx2…E1Exn+1a1ykkk=kkk=1k=1k=1:k=1:Ak=1Exn+1k=1…A2nk=1La」n£、*Lk=1」從這一方程組可以看出,線性擬合方法和二次擬合方法是多項(xiàng)式擬合的特殊情況。從算法上看,數(shù)據(jù)最小二乘擬合的多項(xiàng)式方法是解一個(gè)超定方程組=y1=y2(m>n)a+ax+ax2++axnTOC\o"1-5"\h\z01121n1a+ax+ax2++axn01222n2a+ax+ax2HFaxn

01m2mnm考慮擬合函數(shù):中(x)=aq(x)+aq(x)+…+aq(x),將數(shù)據(jù)表的最小二乘解。而多項(xiàng)式擬合所引出的正規(guī)方程組恰好是用超定方程組的系數(shù)矩陣的轉(zhuǎn)置矩陣去左乘超定方程組左、右兩端所得。正規(guī)方程組的系數(shù)矩陣是一個(gè)病態(tài)矩陣,這類方程組被稱為病態(tài)方程組。當(dāng)系數(shù)矩陣或者是右端向量有微小的誤差時(shí),可能引起方程組準(zhǔn)確解有很大的誤差。為了防止求解這樣的線性方程組,在做多項(xiàng)式擬合時(shí)可以將多項(xiàng)式中的各次冪函數(shù)做正交化變換,使得所推出的正規(guī)方程的系數(shù)矩陣是對(duì)角矩陣。四.點(diǎn)集=y1=y2(m>n)的最小二乘解。而多項(xiàng)式擬合所引出的正規(guī)方程組恰好是用超定方程組的系數(shù)矩陣的轉(zhuǎn)置矩陣去左乘超定方程組左、右兩端所得。正規(guī)方程組的系數(shù)矩陣是一個(gè)病態(tài)矩陣,這類方程組被稱為病態(tài)方程組。當(dāng)系數(shù)矩陣或者是右端向量有微小的誤差時(shí),可能引起方程組準(zhǔn)確解有很大的誤差。為了防止求解這樣的線性方程組,在做多項(xiàng)式擬合時(shí)可以將多項(xiàng)式中的各次冪函數(shù)做正交化變換,使得所推出的正規(guī)方程的系數(shù)矩陣是對(duì)角矩陣。四.點(diǎn)集{x],x2,多項(xiàng)式q0(x),q1(x),q2(x)正交多項(xiàng)式系可以認(rèn)為是冪函數(shù)系:1正交多項(xiàng)式系構(gòu)造的方法如下:,xm}上的正交多項(xiàng)式系,qn(x)在點(diǎn)集{x『x2,(qk,q,)=£qk電)q,(x,),xn通過(guò)正交變換而得到的一組函數(shù)。,xm}上的正交q0(x)=1,q0(x)=x-a1,(a1=i=1X,X2,Ex/n),ii=1qk(x)=(x-ak)qk1(x)-bkqk2(x),(k=2,3,其中,,n)=(xq,q)/(q,q)=£xq2(x)/^Eq2(x)k-1k-1k-1k-1ik-1ik-1ii=1i=1b=(q,q)/(q,q)=Eq2(x)/Eq2(x)kk-1k-1k-2k-2k-1ik-2ii=1i=1五.用正交多項(xiàng)式系組成擬合函數(shù)的多項(xiàng)式擬合x(chóng),-Q1—1n—nxxx12mf(x)y1x2……ym中的數(shù)據(jù)代入,得超定方程aq(x)+aq(x)+aq(x)HFaq(x)=y001111221nn11aq(x)+aq(x)+aq(x)HFaq(x)=y<002112222nn22〔m>n〕aq(x)+aq(x)+aq(x)HFaq(x)=y00m11m22mnnmm其系數(shù)矩陣為q(x)q(x)q(x)…q(x)TOC\o"1-5"\h\z011121n1q(x)q(x)q(x)…q(x)q(x)nmx2,,xm}上的正交,所以\o"CurrentDocument"021222n2q(x)q(x)q(x)…由于多項(xiàng)式q0(x),0m1m2mq1(x),q2(x),,qn(x)在點(diǎn)集{x/超定方程組的系數(shù)矩陣中不同列的列向量是相互正交的向量組。于是用這一矩陣的轉(zhuǎn)置矩陣去左乘超定方程組左、右兩端得正規(guī)方程組'(q0,q0)a0=(q0,y)

(q,q)a=q(x)nmx2,,xm}上的正交,所以由于多項(xiàng)式q0(x),'(q0,q0)a0=(q0,y)

(q,q)a=(q,y)1111=>a=(q,y)/(q,q)0000a=(q,y)/(q,q)41111(q〃,qn)a&=(qn,y)a=(q,y)/(q,q)nnnn其中,(qk,qk)=工一k..q2(x),(qk'y)習(xí)k(x,)其中,(qk,qk)=工一k..元一次方程可以直接寫出原超方程組的最小二乘解,所以擬合函數(shù)為rA(q,y)(、.(q,y)<—3,y)<、中(x)=——0q(x)+—1q(x)+F——nq(x)(q,q)0(q,q)1(q,q)n0011nn這一結(jié)果與用次多項(xiàng)式擬合所得結(jié)果在理論是完全一樣的,只是形式上不同、算法實(shí)現(xiàn)上防止了解病態(tài)方程組。六.指數(shù)函數(shù)的數(shù)據(jù)擬合問(wèn)題1:世界人中預(yù)測(cè)問(wèn)題下表給出了本世紀(jì)六十年代世界人口的統(tǒng)計(jì)數(shù)據(jù)(單位:億)年196019611962196319641965196619671968人口有人根據(jù)表中數(shù)據(jù),預(yù)測(cè)公元2000年世界人口會(huì)超過(guò)60億。這一結(jié)論在六十年代末令人難以置信,但現(xiàn)在已成為事實(shí)。試建立數(shù)學(xué)模型并根據(jù)表中數(shù)據(jù)推算出2000年世界人口的數(shù)量。根據(jù)馬爾薩斯人口理論,人口數(shù)量按指數(shù)遞增的規(guī)律開(kāi)展。記人口數(shù)為N(t),那么有指數(shù)函數(shù)N=ea+bt?,F(xiàn)需要根據(jù)六十年代的人口數(shù)據(jù)確定函數(shù)表達(dá)式中兩個(gè)常數(shù)a、b。為了計(jì)算方便,對(duì)表達(dá)式兩邊取對(duì)數(shù),得lnN=a+bt,令y=lnN。于是y(t)=a+bt。(1)計(jì)算出表中人口數(shù)據(jù)的對(duì)數(shù)值yk=lnNk(k=1,2,……,9)(2)根據(jù)表中數(shù)據(jù)寫出關(guān)于兩個(gè)未知數(shù)a、b的9個(gè)方程的超定方程組〔方程數(shù)多于未知數(shù)個(gè)數(shù)的方程組〕a+btk=yk(k=1,2,,9)其中,J=1960,t2=1961,t3=1962,......,t9=1968;y1,y2,……,y9。⑶利用MATLAB解線性方程組Ax=c的命令A(yù)\c計(jì)算出a、b的值,并寫出人口增長(zhǎng)函數(shù)。利用人口增長(zhǎng)函數(shù)計(jì)算出2000年世界人口數(shù)據(jù):N(2000)七.多元線性函數(shù)的數(shù)據(jù)擬合問(wèn)題2人的耗氧能力的數(shù)據(jù)擬合。人的耗氧能力y(ml/min?kg)與以下變量有關(guān)明年齡x體重x3英里跑步所用時(shí)間x4靜止時(shí)心速x5跑步時(shí)最大心速某健身中心對(duì)31個(gè)自愿者進(jìn)行測(cè)試,得到31組數(shù)據(jù)〔每一組數(shù)據(jù)有6個(gè)數(shù)〕yx1kx2kx3kx4kx5k(k=1,.31)令耗氧能力為因變量,其它的指標(biāo)為自變量,建立線性模型y=a0+a1x1+a2x2+a3x3+a4x4+a5x5為了確定

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論