數(shù)理統(tǒng)計-4.2誤差分析和檢驗_第1頁
數(shù)理統(tǒng)計-4.2誤差分析和檢驗_第2頁
數(shù)理統(tǒng)計-4.2誤差分析和檢驗_第3頁
數(shù)理統(tǒng)計-4.2誤差分析和檢驗_第4頁
數(shù)理統(tǒng)計-4.2誤差分析和檢驗_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

6.4模型誤差分析

一.模型誤差的客觀存在性希望建立的模型盡善盡美:

能“逼真”地模擬現(xiàn)實系統(tǒng);

能“精確”地預(yù)測系統(tǒng)的未來情況;

能“準(zhǔn)確”地控制系統(tǒng);

得到問題的“最優(yōu)”解;…逼真、精確、準(zhǔn)確、最優(yōu)、…良好愿望

數(shù)學(xué)模型是對現(xiàn)實世界的理想化,不可能是真實世界的再現(xiàn)

任何數(shù)學(xué)模型在建立和使用的過程中,不可避免的產(chǎn)生模型誤差。

如:附加進數(shù)據(jù)的測量誤差、舍入誤差和截斷誤差等。

因此,有必要對模型誤差進行分析,并給出估計。常用“絕對誤差”和“相對誤差”來衡量誤差的大小程度:

絕對誤差=測量值-近似值相對誤差=絕對誤差/測量值與數(shù)量級有關(guān)

例6.6.1用經(jīng)驗公式

x≥0

作為土豆產(chǎn)量的近似估計公式,其誤差數(shù)值列表如下(參見p157表6.8)施肥量02498196估計值31.534.538.4841.20絕對誤差1.96-2.032.560.06相對誤差0.06-0.060.0620.001問題:如何評價誤差數(shù)據(jù)?二.誤差分析各類誤差

數(shù)據(jù)測量誤差

截斷誤差

模型假設(shè)誤差

1.?dāng)?shù)據(jù)測量誤差*在建立模型之前應(yīng)該盡量控制實驗數(shù)據(jù)的質(zhì)量,使之測量準(zhǔn)確可靠。

*數(shù)據(jù)帶有無法消除的測量誤差時,應(yīng)分析它對模型造成的影響,并對模型誤差進行估計。

例6.6.2有高為100厘米的半球形容器中裝滿了水。從某一時刻開始,水從底部一個橫截面積為1平方厘米的小孔流出,可以隨時測出水面高度h。由水力學(xué)知,水從孔口流出的流量(即通過孔口橫截面的水的體積V對時間t的變化率)Q,有關(guān)系式

其中0.62為流量系數(shù),S是小孔口橫截面積,g為重力加速度。

由測出的水面高度h,可算得水流量。由于儀器所限,測出的高度值有土0.1厘米的誤差,這會引起水流量Q的多大誤差?

100h水面高度h有誤差Δh

分析水面高度誤差為Δh

,水流量誤差則為在

h=50厘米處,代入Δh=0.1厘米,可算得絕對誤差為(注意此時重力加速度的單位!)誤差大嗎?水流量Q的相對誤差為在h=50厘米處的相對誤差為約為1‰

。誤差大嗎?2.截斷誤差

截斷誤差的來源:

1.用數(shù)值方法近似求解會產(chǎn)生截斷誤差;

2.函數(shù)近似產(chǎn)生截斷誤差;3.計算機運算的精度誤差;

應(yīng)分析截斷誤差對模型的影響

例6.6.3廣義生日問題

一個班有30名學(xué)生,他們中至少有兩名同一天生日的概率p=?他們生日均不同日的概率為q則

p=1-q。一般化后,考慮下問題:求最小的整數(shù)n,使

f(n)≤q(給定)。

思考:如何求n的精確解?

對于給定的

x,f(n)是單調(diào)下降函數(shù)(序列)解:可采用求根方法—對分法

當(dāng)q=0.5時,對不同的x,可以算出n

的最小值n*,見P159表6.9的前兩列。q

用不同方法建立:滿足f(n)≤q的最小值n*和x

之間的近似關(guān)系式.

建立經(jīng)驗公式為建立泰勒近似公式為方法二泰勒近似方法一

最小二乘法泰勒近似式的誤差控制函數(shù)

練習(xí):對兩種近似求解方法,計算各個近似值的絕對誤差和相對誤差。3.模型假設(shè)誤差通過對數(shù)據(jù)進行分析可以判斷假設(shè)是否合理。

續(xù)例6.6.4施肥效果分析

有人做了如下兩條假設(shè):

*1在實驗中除施肥量,其他影響因子:如環(huán)境條件、種植密度、土壤肥力等,均處于同等水平;*2各次實驗獨立,誤差項ε均服從N(0,σ2),σ>0分析:從數(shù)據(jù)可見在實驗點(n0,p0,k0)=(259,196,372)實際重復(fù)了三次試驗。

問題:三次試驗的土豆產(chǎn)量分別為43.15,41.26,38.43(單位:t/ha)怎樣解釋這3個數(shù)據(jù)的波動?

按照假設(shè),這3次重復(fù)試驗產(chǎn)生的產(chǎn)量波動完全因隨機誤差所致。Y=μ(n,p,k)+ε~N(μ,σ2)

并且土豆產(chǎn)量滿足回歸方程合理嗎?分析:由3個數(shù)據(jù)計算得

==40.95(t/ha),=2.38(樣本標(biāo)準(zhǔn)差)

有概率式P{}≥0.9530個試驗數(shù)據(jù)有較多數(shù)落在區(qū)間(33.82,48.07)之外

由施肥水平變化所引起的土豆產(chǎn)量的變動不及隨機誤差產(chǎn)生的波動。不合理不合理的原因:實際上三次重復(fù)試驗帶有系統(tǒng)誤差

主要來源于土壤肥力,生長期的管理措施等多種試驗時的外界條件變化。

試驗設(shè)計中,把在試驗實施過程中外界環(huán)境條件的差異所造的系統(tǒng)偏差稱為區(qū)組效應(yīng)。

施肥問題中,對應(yīng)于每種營養(yǎng)素的10個施肥試驗點,應(yīng)并為一個區(qū)組??烧J(rèn)為區(qū)組內(nèi)10次試驗的試驗條件較為一致,而不同區(qū)組間的試驗條件差別較大。

根據(jù)有區(qū)組效應(yīng)的數(shù)據(jù)不可能分析出各個肥素對土豆產(chǎn)量的交互作用。

利用數(shù)據(jù)建立模型應(yīng)盡量消除區(qū)組效應(yīng)

通過試驗設(shè)計,保證數(shù)據(jù)質(zhì)量模型檢驗

基于數(shù)據(jù)用統(tǒng)計方法建立經(jīng)驗?zāi)P停隽艘韵鹿ぷ鳎阂?模型檢驗的必要性1)借助于數(shù)據(jù)散布圖的直觀形象,選擇一個函數(shù)來近似變量之間的相關(guān)關(guān)系;

2)用最小二乘法求經(jīng)驗?zāi)P椭袇?shù)的最佳估計。

問題:如何評價這個模型?

分析:若兩個變量X、Y間存在相關(guān)關(guān)系,設(shè)其回歸函數(shù)為

y=μ(x)。

選擇一個函數(shù)f(x)

作為y=μ(x)的估計函數(shù)。

客觀存在主觀設(shè)定相當(dāng)于做假設(shè):

這種假設(shè)主觀性太強,是否真實合理必須經(jīng)過檢驗。

一元線性回歸問題需做兩方面的檢驗工作:

1.評價方程對樣本數(shù)據(jù)的代表程度;

2.檢驗變量之間的線性關(guān)系是否顯著。

二.評價回歸方程的擬合優(yōu)度兩種方法:考察數(shù)據(jù)殘差圖和計算測定系數(shù)

1)考察數(shù)據(jù)殘差圖

是檢驗回歸方程擬合優(yōu)度的一個簡單有效的方法.數(shù)據(jù)殘差圖分析原理

分析數(shù)據(jù)殘差圖,若數(shù)據(jù)點(xi,e*),i=1,2,…,n在(一2,2)區(qū)間內(nèi)隨機散布,說明回歸方程的擬合是良好的。

例6.5.1生產(chǎn)費用與產(chǎn)量擬合優(yōu)度分析

例6.6.5試分析講義P162圖6.13的四副標(biāo)準(zhǔn)化殘差圖。1.圖(a)全部數(shù)據(jù)都在(一2,2)區(qū)間內(nèi),且隨機散布,說明方程對數(shù)據(jù)的擬合是良好的。2.圖(b)中有較多數(shù)據(jù)落在(-2,2)區(qū)間的外面,這說明方程對數(shù)據(jù)的擬合不充分。

可能是由于方程的形式選擇不恰當(dāng)。

通過分析標(biāo)準(zhǔn)化殘差圖可以得到更多信息,可以分析出回歸方程的回歸假定的滿足情況。

對殘差圖做進一步分析:*1圖(c)中殘差出現(xiàn)系統(tǒng)變動的趨勢;

表明關(guān)于,i=1,2,…,n的等方差假定不滿足;

*2圖(d)中殘差值e*,i=1,2,…,n有相依關(guān)系;說明關(guān)于,i=1,2,…,n的獨立性不滿足。

2)計算測定系數(shù)(確定系數(shù)、判定系數(shù))

是評價回歸方程擬合優(yōu)度的一個指標(biāo)。

可證明

0≤r2≤1且

r2的值越大說明方程對數(shù)據(jù)的擬合度越高。續(xù)例6.5.1生產(chǎn)費用與產(chǎn)量擬合優(yōu)度分析給定擬合回歸方程測定系數(shù)為=0.6524。

結(jié)果分析:好不好?

圖6.14中標(biāo)準(zhǔn)化殘差e*在橫軸上下隨機散布,且位于(一2,2)區(qū)間內(nèi),初步判斷擬合是良好的。

結(jié)論:1)方程對這批數(shù)據(jù)的擬合是良好的,說明在生產(chǎn)費用的變動中,有65.24%是由于產(chǎn)量變動引起。2)測定系數(shù)r2的值不是很高,這說明僅用“產(chǎn)量”這一種因素來解釋生產(chǎn)費用的變動并不充分,還應(yīng)考慮其他因素。三.線性關(guān)系檢驗

測定系數(shù)r2僅是反映回歸方程對樣本數(shù)據(jù)的擬合優(yōu)度的一個衡量指標(biāo)。

r2值較高方程對樣本(數(shù)據(jù))呈現(xiàn)的線性關(guān)系的代表性較好.X和Y的相關(guān)關(guān)系是線性關(guān)系。由于抽樣的隨機性使樣本的關(guān)系與變量X與Y之間的相關(guān)關(guān)系有一定差異,還不能肯定X和Y的線性關(guān)系顯著。線性關(guān)系檢驗:

檢驗變量X與Y的線性相關(guān)關(guān)系是否顯著。樣本相關(guān)系數(shù)=的大小反映了X和Y之間線性相關(guān)關(guān)系的強弱。當(dāng)r=1,說明變量之間存在完全正相關(guān)關(guān)系;

當(dāng)r=0,說明變量之間不存在線性相關(guān)關(guān)系;當(dāng)r=-1,說明變量之間存在完全負相關(guān)關(guān)系。樣本相關(guān)系數(shù)r的變動范圍是-1≤r≤1,

當(dāng)0<r<1,說明變量之間存在一定程度的正相關(guān)關(guān)系;

當(dāng)-1<r<0,說明變量之間存在一定程度的負相關(guān)關(guān)系;

︱r︱的值有多大時,才能認(rèn)為變量X與Y之間的線性相關(guān)關(guān)系顯著?

對給定顯著性水平α(0<α<1),可計算樣本相關(guān)系數(shù)臨界值rα(n-1):

判別準(zhǔn)則:

若,則在顯著性水平α下,認(rèn)為變量X與Y之間的線性關(guān)系顯著;

否則認(rèn)為它們的線性關(guān)系不顯著。

續(xù)例6.5.1生產(chǎn)費用與產(chǎn)量線性相關(guān)關(guān)系檢驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論