高級生物統(tǒng)計044課件_第1頁
高級生物統(tǒng)計044課件_第2頁
高級生物統(tǒng)計044課件_第3頁
高級生物統(tǒng)計044課件_第4頁
高級生物統(tǒng)計044課件_第5頁
已閱讀5頁,還剩62頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第四節(jié)最優(yōu)設(shè)計

對于一定的回歸模型,在給定的因子空間的某一區(qū)域上,可以設(shè)計出多種試驗方案,每個方案都存在它的最大誤差方差。在這些試驗方案中挑選出最大誤差方差最小的方案,用它的試驗結(jié)果估計的回歸方程,其回歸預(yù)測值與實際觀測值的擬合程度最高,因而這種試驗方案是最優(yōu)的。最優(yōu)設(shè)計(optimumdesign)就是從試驗誤差方差最小的基本目的出發(fā),得出的一種試驗設(shè)計方法。為了判斷一種試驗設(shè)計是不是最優(yōu)設(shè)計,已經(jīng)提出了很多優(yōu)良性準(zhǔn)則,如D—優(yōu)良性、G—優(yōu)良性、E—優(yōu)良性、U—優(yōu)良性、A—優(yōu)良性等。一、D—最優(yōu)設(shè)計原理

(一)回歸模型與試驗方案1、回歸模型對于給定的p維歐氏因子空間區(qū)域中的點

,無論變量之間的回歸關(guān)系如何,其回歸模型的一般形式可表示為:若記

回歸模型(4—45)也可表示為:若進行了t次試驗,則模型(4-46)的結(jié)構(gòu)矩陣X為:信息矩陣A為

模型(4—45)包含了最常見的各種回歸模型。例如,當(dāng)f1(x),f2(x),…,fm(x)為一組冪函數(shù)時,若取p=2,m=6,模型(4—45)就是二元二次回歸模型。

其中x1,x2,…,xt稱為方案W的譜點。離散型方案的信息矩陣A(W)為

(4-50)

如果將離散型方案中每個點的重復(fù)次數(shù)用其與總次數(shù)的比值pi=ni/N表示,且pi可以在[0,1]中任意取值,這種方案稱為連續(xù)型方案(continuousscheme),即其中,pi稱為xi點的測度,。(二)D—優(yōu)良性與G—優(yōu)良性

1、D—優(yōu)良性為了確定一個試驗方案是不是最優(yōu)方案,必須給出判斷最優(yōu)性的標(biāo)準(zhǔn)。1943年Wald提出了信息矩陣行列式最大值判別法,1959年Kiefer稱這種判別法為D—最優(yōu)性,又稱為D—優(yōu)良性。對于同一回歸模型(4—45)的兩個不同的試驗方案W1和W2,如果方案W1的信息矩陣行列式的值大于方案W1的信息矩陣行列式的值,即|A(W1)|>|A(W2)|,則認(rèn)為在D—優(yōu)良性意義上,方案W1比方案W2優(yōu)良。由于相關(guān)矩陣C(W)是信息矩陣A(W)的逆矩陣,|C(W)|·|A(W)|=1,因此|A(W1)|>|A(W2)|等價于|C(W1)|>|C(W2)|?!纠?·9】設(shè)單因素試驗的回歸模型為試比較下列兩個試驗方案的D—優(yōu)良性。其行列式為:W1的相關(guān)矩陣及其行列式分別為:對于試驗方案W2,相應(yīng)的計算結(jié)果為:由于|A(W1)|>|A(W2)|,|C(W1)|<|C(W2)|,因此在D—優(yōu)良性意義上,試驗方案W1優(yōu)于W2。在給定的因子空間的某一區(qū)域上,可以設(shè)計出多種試驗方案。所有方案中信息矩陣行列式最大的方案稱為區(qū)域上的D—最優(yōu)方案,簡稱D—最優(yōu)方案。顯然,D—最優(yōu)方案是針對因子空間的某一區(qū)域而言的,對于不同的區(qū)域可能存在不同的D—最優(yōu)方案。其中,其回歸方程為:b的方差協(xié)方差矩陣回歸預(yù)測值的方差(4-56)當(dāng)以σ2為單位時,記回歸預(yù)測值的方差為,則

對于給定的因子空間區(qū)域上的任意一個試驗方案W,回歸預(yù)測值的方差d(x,W)在區(qū)域上總存在最大值。若該區(qū)域上試驗方案W1的回歸預(yù)測值的最大方差小于試驗方案W2的回歸預(yù)測值的最大方差,即則認(rèn)為在G—優(yōu)良性意義上,方案W1優(yōu)于方案W2。對于試驗方案W1,由(4—57)式得:

3x2+2在區(qū)域-1≤x≤1上的最大值為5,因而對于試驗方案W2

3x2-2x+2在區(qū)域-1≤x≤1上的最大值為7,因而1、試驗方案W*是D—最優(yōu)方案,則有2、試驗方案W*是G—最優(yōu)方案,則有根據(jù)這一定理,可以構(gòu)造和檢驗D—最優(yōu)方案?!纠?·11】設(shè)兩因素試驗的回歸模型為:y=1+2x1+3x2+ε(-1≤xj≤1,j=1,2)判斷下列試驗方案W是不是D—最優(yōu)方案。首先,將離散型方案W表示成連續(xù)型方案。其次,計算各試驗點回歸預(yù)測值的方差。

根據(jù)模型(4—45),此例p=2,m=3,f1(x1,x2)=1,f2(x1,x2)=x1,f3(x1,x2)=x2,F(xiàn)'(x1,x2)=(1x1

x2)。根據(jù)(4—52)式,試驗方案W的信息矩陣

相關(guān)矩陣

回歸預(yù)測值的方差

于是得到試驗方案W的三個試驗點回歸預(yù)測值的方差分別為:

最后,根據(jù)等價定理來判斷。由于試驗方案W的三個試驗點回歸預(yù)測值的方差均等于待定回歸系數(shù)的個數(shù)m,因此試驗方案W在區(qū)域-1≤xj≤1(j=1,2)上是D—最優(yōu)方案。二、飽和D—最優(yōu)設(shè)計

在進行試驗設(shè)計時,為了減小試驗誤差,提高試驗的精確性,應(yīng)盡可能選擇最優(yōu)的試驗方案。另一方面,為了節(jié)省人力、物力和財力,也應(yīng)盡量縮小試驗規(guī)模,提高試驗的效率。對于回歸設(shè)計來說,效率最高的試驗就是水平組合數(shù)(即處理數(shù))等于回歸方程中需要估計的回歸系數(shù)個數(shù)的試驗。具有這種特點的試驗設(shè)計稱為飽和設(shè)計(saturateddesign)。由于飽和設(shè)計沒有剩余自由度,因而不能估計誤差。若要進行誤差估計,飽和設(shè)計試驗必須設(shè)置若干重復(fù)。(一)一次飽和D—最優(yōu)設(shè)計及其統(tǒng)計分析

1、設(shè)計方法對于一次回歸模型其回歸系數(shù)的個數(shù)m=p+1。在p維立方體-1≤xj≤1上,選取p+1個各坐標(biāo)為-1或1的頂點(apex)構(gòu)成的設(shè)計就是一次飽和D—最優(yōu)設(shè)計。

當(dāng)p=1時,(x=1)和(x=-1)構(gòu)成的設(shè)計為一次飽和D—最優(yōu)設(shè)計。當(dāng)p=2時,正方形區(qū)域的4個頂點(x1=1,x2=1),(x1=1,x2=-1),(x1=-1,x2=1)和(x1=-1,x2=-1)中的任意3個都可構(gòu)成一次飽和D—最優(yōu)設(shè)計。前面【例4·11】就是一個p=2的一次飽和D—最優(yōu)設(shè)計。當(dāng)p=3時,立方體區(qū)域上有23-1個部分頂點構(gòu)成一次飽和D—最優(yōu)設(shè)計。當(dāng)p=4,5,6時,一次飽和D—最優(yōu)設(shè)計見表4—51。當(dāng)p=7時,7維立方體區(qū)域上有27-4個部分頂點構(gòu)成一次飽和D—最優(yōu)設(shè)計。一般地,當(dāng)m=p+1=2q(q為正整數(shù))時,p個因素的一次飽和D—最優(yōu)設(shè)計可以用型2p的全因子試驗的部分實施法給出。2、統(tǒng)計分析由于飽和設(shè)計試驗結(jié)果的統(tǒng)計分析與其他回歸設(shè)計基本相同,因此下面僅結(jié)合實例進行介紹。但需注意的是,飽和設(shè)計沒有剩余自由度,對回歸方程和回歸系數(shù)的顯著性檢驗在試驗無重復(fù)和有重復(fù)時都與一般的回歸分析方法有所不同?!纠?·12】

在油菜再生研究中,應(yīng)用p=4的一次飽和D—最優(yōu)設(shè)計分析培養(yǎng)基中2,4-D(Z1)、6-BA(Z2)、GA3(Z3)和AgNO3(Z4)對再生頻率的影響。試驗方案和試驗結(jié)果如表4—52所示。進行分析。本例的回歸方程

將設(shè)計方案中的編碼值和試驗結(jié)果代入回歸方程,并用矩陣形式表示。估計回歸系數(shù)的計算過程和計算結(jié)果如下于是可得用編碼因素表示的回歸方程各處理的回歸預(yù)測值列于表4-52的最后一列。由此可見,預(yù)測值與實際測察值完全吻合,說明回歸方程的擬合效果很好。飽和設(shè)計試驗無重復(fù)時不能對回歸系數(shù)的顯著性進行檢驗,只能對回歸方程進行近似檢驗。一般可采用控制點檢驗法,詳見本章第五節(jié)。為了應(yīng)用方便,回歸方程需用實際因素表示。由實際因素與編碼因素的關(guān)系

可得

將其代入上述回歸方程即得(二)二次飽和D—最優(yōu)設(shè)計及其統(tǒng)計分析

1、設(shè)計方法對于二次回歸模型其回歸系數(shù)的個數(shù)m=1/2(p+2)(p+1)。Box于1971年和1972年給出了p=2和p=3的二次飽和D—最優(yōu)設(shè)計,列于表4—53。對于p≥4的二次飽和D—最優(yōu)設(shè)計,至今尚未解決。但p<7的近似飽和D—最優(yōu)設(shè)計已給出,稱最優(yōu)混合設(shè)計。【例4·13】

為了研究小麥氮肥和磷肥施用量對產(chǎn)量影響的數(shù)量關(guān)系,計劃每666.67m2純N施用量的下水平和上水平分別為0和12.5kg,P2O5施用量的下水平和上水平分別為0和10kg。試采用二次飽和D—最優(yōu)設(shè)計安排試驗方案。

此例p=2。根據(jù)表4—55求得各編碼因素與實際因素之間的關(guān)系:

編碼值為-1時,純N施用量Z1=0,P2O5施用量Z2=0;編碼值為1時,純N施用量Z1=12.5,P2O5施用量Z2=10;編碼值為-0.1315時,純N施用量Z1=6.25×(1-0.1315)=5.428,P2O5施用量Z2=5×(1-0.1315)=4.343;編碼值為0.3945時,純N施用量Z1=6.25×(1+0.3945)=8.176,P2O5施用量Z2=5×(1+0.3945)=6.973。由此可以獲得本試驗的試驗方案如表4—54所示。2、統(tǒng)計分析

【例4·14】按照【例4·13】安排的試驗方案進行試驗,重復(fù)2次,隨機區(qū)組設(shè)計,試驗結(jié)果(產(chǎn)量:kg/666.67m2)列入表4—54。進行分析。首先,按照單因素隨機區(qū)組試驗結(jié)果進行方差分析,檢驗處理間的差異顯著性,見表4—55,檢驗結(jié)果表明各處理間的差異顯著,而區(qū)組間差異不顯著。由于兩個區(qū)組間的差異不顯著,下面的回歸分析采用兩次重復(fù)的平均值。其次,估計各個回歸系數(shù)。

本例的回歸方程為將設(shè)計方案中的編碼值和試驗結(jié)果代入回歸方程,并用矩陣形式表示。估計回歸系數(shù)的計算過程和計算結(jié)果如下:于是可得用編碼因素表示的回歸方程再次,檢驗回歸方程的顯著性。雖然飽和設(shè)計沒有剩余自由度,但如果試驗安排一定的重復(fù)(2~3次),則可由試驗誤差來檢驗回歸方程和回歸系數(shù)的顯著性。假設(shè)試驗共有k個處理,重復(fù)n次,隨機區(qū)組設(shè)計;第j次重復(fù)中第i個處理的觀測值為yij,第i個處理的平均值為,試驗總的平均值為,由回歸方程估計的第i個處理的預(yù)測值為?;貧w平方和及其自由度為m為回歸系數(shù)的個數(shù)(在飽和設(shè)計試驗中,m=k)。誤差平方和及其自由度為

于是可用近似檢驗回歸方程的顯著性。本例中,各處理的回歸預(yù)測值列于表4-54的最后一列,回歸平方和SSR、誤差平方和SSe和F值分別為:F檢驗極顯著,說明回歸方程表示的回歸關(guān)系存在。第四,檢驗回歸系數(shù)的顯著性。

回歸系數(shù)t檢驗的計算公式為:——誤差均方bj——第j個回歸系數(shù)Cjj——相關(guān)矩陣第j行第

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論