曲線擬合精選課件_第1頁(yè)
曲線擬合精選課件_第2頁(yè)
曲線擬合精選課件_第3頁(yè)
曲線擬合精選課件_第4頁(yè)
曲線擬合精選課件_第5頁(yè)
已閱讀5頁(yè),還剩48頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、曲線擬合Curve fitting 鄭大公衛(wèi)統(tǒng)計(jì)教研室平智廣 醫(yī)學(xué)研究中X和Y的數(shù)量關(guān)系常常不是線性的,如毒物劑量與動(dòng)物死亡率,人的生長(zhǎng)曲線,藥物動(dòng)力學(xué)等,都不是線性的。如果用線性描述將丟失大量信息,甚至得出錯(cuò)誤結(jié)論。一、非線性關(guān)系的類型與特點(diǎn)根據(jù)非線性關(guān)系的性質(zhì)和特點(diǎn)可大致分為6類:1. 指數(shù)形式關(guān)系2.對(duì)數(shù)形式關(guān)系3. 冪形式關(guān)系4.雙曲形式關(guān)系5. S型形式關(guān)系6.多項(xiàng)式形式關(guān)系兩種形式:a 0,b0a 0,b0,b0時(shí),Y隨x的而,曲線凹向上;當(dāng)a0,b0 b 0時(shí),Y隨x的而,曲線凸向上;當(dāng)b0,0b0,b1a 0,b0,b1時(shí),Y隨x的而,曲線凹向上;當(dāng)a0,0b0,b0,b0a0

2、,b0,b0時(shí),Y隨x的而,速率趨小,曲線凸向上,并向y=1/b漸進(jìn);當(dāng)a0,b0時(shí),Y隨x的而,速率趨大,曲線凹向上,并向y=-a/b漸近。(五) S型曲線S型曲線由于其曲線形狀與動(dòng)、植物的生長(zhǎng)過(guò)程的基本特點(diǎn)類似,故又稱生長(zhǎng)曲線,曲線一開(kāi)始時(shí)增長(zhǎng)較慢,而在以后的某一范圍內(nèi)迅速增長(zhǎng),達(dá)到一定的限度后增長(zhǎng)又緩慢下來(lái),曲線呈拉長(zhǎng)的”S”,故稱S曲線最著名的曲線是Logistic生長(zhǎng)曲線,它最早由比利時(shí)數(shù)學(xué)家P.F.Vehulst于1838年導(dǎo)出,但直至20世紀(jì)20年代才被生物學(xué)家及統(tǒng)計(jì)學(xué)家R.Pearl和L.J. Reed 重新發(fā)現(xiàn),并逐漸被人們所發(fā)現(xiàn)。目前它已廣泛應(yīng)用于多領(lǐng)域的模擬研究。(6)多

3、項(xiàng)式回歸當(dāng)兩個(gè)變數(shù)間的曲線關(guān)系很難確定時(shí),可以適應(yīng)多項(xiàng)式去逼近,稱為多項(xiàng)式回歸(polynomial regression)。最簡(jiǎn)單的是二次多項(xiàng)式,其方程為:它的圖象是拋物線。當(dāng)b20時(shí),曲線凹向上,有一個(gè)極小值; b2 0 時(shí),曲線凸向上,有一個(gè)極大值。曲線直線化估計(jì)(Curve estimation)非線性/曲線回歸(Nonlinear/curvilinear regression) 解決辦法二、曲線直線化擬合曲線回歸方程的步驟:根據(jù)變數(shù)X與Y之間的確切關(guān)系,選擇適當(dāng)?shù)那€類型。對(duì)選定的曲線類型,在線性化后按最小二乘法原理配置直線回歸方程。將直線回歸方程轉(zhuǎn)換成相應(yīng)的曲線回歸方程,并對(duì)有關(guān)統(tǒng)

4、計(jì)參數(shù)作出推斷。比較決定系數(shù)選取“最佳”曲線方程(一) 對(duì)數(shù)關(guān)系曲線的擬合例1:上海醫(yī)科大學(xué)微生物學(xué)教研室以已知濃度X的免疫球蛋白A(IgA, g/ml)作火箭電泳, 測(cè)得火箭高度Y(mm)如表1所示。試擬合Y關(guān)于X的非線性回歸方程。 XY 0.2 7.6 0.412.3 0.615.7 0.818.2 1.018.7 1.221.4 1.422.6 1.623.8合計(jì)140.3表1 免疫球蛋白與火箭高度的關(guān)系1.繪制散點(diǎn)圖,決定曲線類型2.曲線直線化變換 XYXlnX(lnX)2 Y2 (lnX)Y 殘差平方 0.27.6-1.60942.5902 57.76 -12.2314 7.23 0

5、.1380 0.412.3-0.91630.8396 151.29 -11.2705 12.62 0.1017 0.615.7-0.51080.2609 246.49 -8.0196 15.77 0.0053 0.818.2-0.22310.0498 331.24 -4.0604 18.01 0.0361 1.018.7 00.0000 349.69 0.0000 19.75 1.0921 1.221.40.18230.0332 457.96 3.9012 21.16 0.0563 1.422.60.33650.1132 510.76 7.6049 22.36 0.0566 1.623.80.

6、47000.2209 566.44 11.1860 23.40 0.1597 合計(jì)140.3-2.27084.1078 2671.63 -12.8898 1.6458表2 免疫球蛋白與火箭高度的關(guān)系3.建立線性回歸方程 回歸方程為: =19.7451+7.7771lnX方差分析有統(tǒng)計(jì)學(xué)意義,P0.0000,F(xiàn)763.50,表明回歸方程有貢獻(xiàn)。確定系數(shù)為0.992,表明回歸擬合原資料很好。(二) 指數(shù)函數(shù)擬合例2:表2為15名重傷病人的住院天數(shù)X與預(yù)后指數(shù)Y的數(shù)據(jù),根據(jù)兩者的關(guān)系擬合曲線。表2 重傷病人的住院天數(shù)X與預(yù)后指數(shù)Y編號(hào)123456789101112131415X25710141926

7、3134384552536065Y545045373525201618138118461. 繪制散點(diǎn)圖,決定曲線類型2. 曲線直線化變換3. 建立線性回歸方程 回歸方程為: 4.037-0.038X方差分析有統(tǒng)計(jì)學(xué)意義,P0.0001,F(xiàn)276.38,表明回歸方程有貢獻(xiàn)。R2為0.9551,表明回歸擬合原資料較好。轉(zhuǎn)換為原方程的另一種形式:曲線直線化AnalyzeRegressionCurve Estimation 可選Power 、Logarithmic、Exponential、Quadratic、Cubic 等 非線性回歸AnalyzeRegression Nonlinear 設(shè)置模型:

8、Model Expression 參數(shù)賦初值:Parameters 三、采用SPSS進(jìn)行曲線擬合當(dāng)僅分析兩個(gè)變量之間的數(shù)量關(guān)系時(shí),可以通過(guò)curve estimation進(jìn)行估計(jì),此過(guò)程即為進(jìn)行曲線直線化的過(guò)程。(一) Curve EstimationLinearQuadraticCompoundGrowthLogarithmicCubicSExponentialInversePowerLogistic(二)非線性回歸變量變化可以解決一部分曲線擬合的問(wèn)題,直線回歸采用的是最小二乘法,它保證的是變換后的殘差平方和最小,如果變換回原始數(shù)據(jù),不一定是最優(yōu)方程;曲線關(guān)系極為復(fù)雜時(shí),簡(jiǎn)單的變量變化往往不

9、能轉(zhuǎn)換為直線方程;Curve Estimation僅能進(jìn)行簡(jiǎn)單的曲線擬合,而且其原理也是曲線直線化。-0.03958645282527曲線直線化 非線性最小二乘法比較兩個(gè)回歸方程可見(jiàn),對(duì)同一份樣本采用不同估計(jì)方法得到的結(jié)果并不相同。主要因?yàn)榍€直線化以后的回歸只對(duì)變換后的Y*(lnY)負(fù)責(zé), 得到的線性方程可使Y*與其估計(jì)值 之間的殘差平方和最小,并不保證原變量Y與其估計(jì)值 之間的殘差平方和也是最小。對(duì)于例2,幾個(gè)常見(jiàn)曲線擬合得到的決定系數(shù)R2如下(曲線直線化):線 性R2:0.8856 (y=46.4604 -0.7525x)冪 曲 線R2:0.8293 (y=159.9297x-0.719

10、1)對(duì)數(shù)曲線R2:0.9654 (y=72.2829 -15.9662ln(x)指數(shù)曲線R2:0.9551 (y=56.6651e-0.0380 x)二 項(xiàng) 式R2:0.9812 (y=55.8221-1.7103x+0.0148x2)對(duì)于例2,幾個(gè)常見(jiàn)曲線擬合得到的決定系數(shù)R2如下(非線性回歸迭代法):線 性R2:0.8856 (y=46.4604-0.7525x)冪 曲 線R2:0.8413 (y=88.7890 x-0.4662)對(duì)數(shù)曲線R2:0.9654 (y=72.2829-15.9662ln(x) )指數(shù)曲線R2:0.9875(y = 58.6066e-0.0396x)二 項(xiàng) 式R

11、2:0.9812(y=55.8221-1.7103x+0.0148x2)原變量Y與 (直線或曲線方程得到)間相關(guān)系數(shù)的絕對(duì)值相關(guān)指數(shù)R線 性R:X與Y間相關(guān)系數(shù)絕對(duì)值冪 曲 線R:lnX與lnY間相關(guān)系數(shù)絕對(duì)值對(duì)數(shù)曲線R:lnX與Y間相關(guān)系數(shù)絕對(duì)值指數(shù)曲線R:X與lnY間相關(guān)系數(shù)絕對(duì)值二 項(xiàng) 式R:(1SS殘差/SS總)R的計(jì)算(曲線直線化)R的計(jì)算(非線性回歸)原變量Y與 (直線或曲線方程得到)間相關(guān)系數(shù)的絕對(duì)值相關(guān)指數(shù)R線 性R:X與Y間相關(guān)系數(shù)絕對(duì)值冪 曲 線R:lnX與lnY間相關(guān)系數(shù)絕對(duì)值對(duì)數(shù)曲線R:lnX與Y間相關(guān)系數(shù)絕對(duì)值指數(shù)曲線R: X與lnY間相關(guān)系數(shù)絕對(duì)值二 項(xiàng) 式R:(1

12、SS殘差/SS總)散點(diǎn)圖辨析 如果條件允許最好采用非線性回歸(Nonlinear Regression)擬合冪函數(shù)曲線與指數(shù)函數(shù)曲線注意繪制散點(diǎn)圖,并結(jié)合專業(yè)知識(shí)解釋1306.9580.108-6-1四、曲線回歸的注意事項(xiàng)(一) 初始值設(shè)定一般來(lái)說(shuō),當(dāng)擬合模型較為簡(jiǎn)單,數(shù)據(jù)也不多時(shí),無(wú)論初始值如何,通過(guò)迭代都可以最終達(dá)到正確結(jié)果。但在擬合復(fù)雜模型時(shí),如果初始值設(shè)定不合理,常常造成迭代不收斂或者得到模型的局部最優(yōu)解,而不是全局最優(yōu)解。多選幾個(gè)初始值進(jìn)行擬合,觀察最終分析結(jié)果是否相同,若不同,則篩選出最有結(jié)果;從圖形上取幾個(gè)點(diǎn),解出各參數(shù)的近似值,將其作為初始值代入;迭代時(shí)首先簡(jiǎn)化模型,擬合不太復(fù)

13、雜的雛形,然后逐漸添加內(nèi)容,最終擬合目標(biāo)函數(shù)。(二)模型的分段擬合許多情況下變量間的非線性關(guān)系不太好用一個(gè)統(tǒng)一的函數(shù)關(guān)系來(lái)定義,但如果分為幾段,則非常容易表達(dá)。五、非線性回歸軟件介紹目前世界上在該領(lǐng)域有名的軟件工具包很多,如:Origin Pro、Matlab、SAS、SPSS、DataFit、GraphPad、TableCurve2D、TableCurve3D等。進(jìn)行非線性回歸時(shí),均需用戶提供適當(dāng)?shù)膮?shù)初始值以便計(jì)算能夠收斂并找到最優(yōu)解。如果設(shè)定的參數(shù)初始值不當(dāng)則計(jì)算難以收斂,其結(jié)果是無(wú)法求得正確結(jié)果。而在實(shí)際應(yīng)用當(dāng)中,對(duì)大多數(shù)用戶來(lái)說(shuō),給出(猜出)恰當(dāng)?shù)某跏贾凳羌喈?dāng)困難的事,特別是在參數(shù)

14、量較多的情況下,更無(wú)異于是場(chǎng)噩夢(mèng)。(一) 采用SAS進(jìn)行曲線擬合(二) 利用Origin進(jìn)行曲線擬合1stOpt(First Optimization)1stOpt是世界領(lǐng)先的非線性曲線擬合,是七維高科有限公司獨(dú)立開(kāi)發(fā)的一套數(shù)學(xué)優(yōu)化分析綜合工具軟件包。在非線性回歸、曲線擬合、非線性復(fù)雜工程模型參數(shù)估算求解等領(lǐng)域,居世界領(lǐng)先地位。界面簡(jiǎn)單易用,采用通用全局優(yōu)化算法求解,該算法之最大特點(diǎn)是克服了當(dāng)今世界上在優(yōu)化計(jì)算領(lǐng)域中使用迭代法必須給出合適初始值的難題,即用戶勿需給出參數(shù)初始值,而由1stOpt隨機(jī)給出,通過(guò)其獨(dú)特的全局優(yōu)化算法,最終找出最優(yōu)解。1stOpt憑借其超強(qiáng)的尋優(yōu),容錯(cuò)能力,在大多數(shù)情況下(大于90%),從任一隨機(jī)初始值開(kāi)始,都能求得正確結(jié)果。LINGOLingo是Linear In

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論