數(shù)理統(tǒng)計2015 第13章實驗設(shè)計2016_第1頁
數(shù)理統(tǒng)計2015 第13章實驗設(shè)計2016_第2頁
數(shù)理統(tǒng)計2015 第13章實驗設(shè)計2016_第3頁
數(shù)理統(tǒng)計2015 第13章實驗設(shè)計2016_第4頁
數(shù)理統(tǒng)計2015 第13章實驗設(shè)計2016_第5頁
已閱讀5頁,還剩124頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第13章實驗設(shè)計113.1實驗設(shè)計的基本原則13.2實驗計劃書的編制(略)13.3簡單實驗設(shè)計13.4單因素實驗設(shè)計13.5兩因素實驗設(shè)計13.6正交設(shè)計23正確的實驗設(shè)計,是數(shù)理統(tǒng)計的前提。不同的實驗設(shè)計,其結(jié)果的統(tǒng)計方法可能不同。如成組數(shù)據(jù)t檢驗和配對數(shù)據(jù)t檢驗,分別適用于成組比較設(shè)計和配對比較設(shè)計;方差分析涉及的實驗設(shè)計問題就更多了,如兩因素交叉分組和嵌套分組的實驗設(shè)計均有一定的要求。實驗設(shè)計正確,統(tǒng)計結(jié)論才有效。否則,雖然花費了大量的費用,占用了寶貴的時間,得到的結(jié)果卻很難說明任何問題。因此,若學習了數(shù)理統(tǒng)計,但缺少相應(yīng)的實驗設(shè)計知識,再好的統(tǒng)計方法也是無效的。13.1實驗設(shè)計的基本原則4實驗設(shè)計的兩個基本原則是重復(replication)和隨機化(randomization)。重復是將一基本實驗重做一次或幾次,而不是指一次基本實驗的結(jié)果重復測量多次。例如,分析大豆籽粒中維生素D的含量。這一基本實驗包括以下過程:隨機選取若干大豆,磨成豆粉,取一定數(shù)量的豆粉,乙醇回流抽提脂肪,提取液皂化,萃取,層析分離,純化,在165nm下測吸光度,最后計算出維生素D的含量。重復實驗必須是上述過程的完整重復。5設(shè)置重復有兩個重要意義:①只有設(shè)置重復才能得到實驗誤差的估計。根據(jù)標準誤差的定義,標準差s是通過重復得到的,實驗不設(shè)置重復,便無法得到標準差,也就得不到標準誤差。②只有設(shè)置重復才能推斷出處理效應(yīng)。如,比較兩種藥物的療效,每種藥物由一人服用,服A藥物的人10天痊愈,服B藥物的人12天痊愈,但無法判斷兩種藥物的療效是否不同,因為該差異可能是實驗誤差造成的。必須隨機抽取若干人服A藥物,若干人服B藥物,分別算出服兩種藥物的痊愈天數(shù)的標準誤差,再用平均痊愈天數(shù)之差與標準誤差比較(成組數(shù)據(jù)t檢驗),如果兩者之間的差異不能用偶然性來解釋,才能證明藥效之間存在差異。6隨機化是指實驗材料的配置和實驗處理的順序是隨機確定的。統(tǒng)計學理論建立在獨立隨機變量的基礎(chǔ)上,要求樣本是隨機的,只有通過隨機化才能滿足這一條件。如,在前面的藥效實驗中,設(shè)藥效受年齡影響。若服A藥物的患者都較年輕,服B藥物的患者都較年長,這時藥效與年齡效混雜,即使兩種藥物療效不同,也不能判斷是藥效的差異還是年齡的效應(yīng)。經(jīng)過隨機化,每一藥物組中既有年輕的又有年長的患者,就可以平均掉年齡對藥效的干擾,得到可信的結(jié)果。掌握了重復和隨機化這兩個基本原則,實驗設(shè)計就不會出現(xiàn)原則問題。13.2實驗計劃書的編制(略)13.2.1實驗計劃書的格式13.2.2國內(nèi)外研究動態(tài)13.2.3實驗?zāi)康?3.2.4預(yù)期結(jié)果13.2.5實驗設(shè)計的選擇13.2.6實驗方法的確定13.2.7田間規(guī)劃13.2.8實驗記錄實驗計劃很重要,但因具體實驗而異,故略。7

13.2.1實驗計劃書的格式

在進行任何實驗之前,必須首先編制一套完整的實驗計劃書。實驗的過程就是實驗計劃書的實施過程。一個好的實驗計劃書應(yīng)做到,在設(shè)計者不參與的情況下,實驗執(zhí)行者可以完全實現(xiàn)設(shè)計者的全部意圖。一般來說,一個實驗計劃書應(yīng)包括以下幾部分:1.封面:寫明實驗名稱,計劃書編制者或編制小組名稱以及設(shè)計時間等;2.國內(nèi)外研究動態(tài);3.實驗?zāi)康模?.預(yù)期結(jié)果;5.實驗設(shè)計的選擇;6.實驗方法的確定;7.田間規(guī)劃;8.實驗記錄。下面我們分節(jié)對以上內(nèi)容加以解釋。813.2.2國內(nèi)外研究動態(tài)9在一個研究項目提出之前,必須對該領(lǐng)域國內(nèi)外研究的現(xiàn)狀有所了解。看一看該項目前人是否已經(jīng)做過?現(xiàn)在是否有人正在做?已經(jīng)得到哪些結(jié)論?是否有必要再重復?如果是應(yīng)用課題,應(yīng)查閱是否有人已經(jīng)申報了專利?該項研究成果是否還能獲得專利?等等。這些問題都應(yīng)在立項之前得到明確的答案,避免工作的盲目性。決不能等到工作已經(jīng)完成,為了撰寫論文或為了寫工作報告,才去查國內(nèi)外研究動態(tài)。到那時,一發(fā)現(xiàn)該項研究工作別人早已完成,甚至于做得更好或者已經(jīng)獲得專利權(quán),那么前面所投入的精力、花費的時間、消耗的費用等都付之東流,這樣慘痛的例子并不鮮見。當然,有時候并不是事先沒有查閱,只不過是查閱得不仔細,該查到的沒有查到,直到實驗完成之后才發(fā)觀由于疏忽所造成的損失。在信息時代的今天,這種情況不應(yīng)當再發(fā)生。1013.2.3實驗?zāi)康娜魏我豁椦芯慷急仨氂忻鞔_的實驗?zāi)康?。實驗?zāi)康氖窃趯嶒為_始之前提出來的,為了實現(xiàn)實驗?zāi)康亩M行一系列研究工作。打個比方,實驗?zāi)康暮帽仁前校鰧嶒灪帽仁谴虬?。一個好的射手應(yīng)當是“指到哪里,打到哪里”,而決不能作“打到哪里,指到哪里”的射手:一槍射出之后,不管打到哪里,都大言不慚地說“這正是我要打的地方!”研究工作也是一樣,事先沒有明確的目的,實驗完成之后,不管得到什么結(jié)果,都鄭重聲明:“這就是我的實驗?zāi)康模 ?,這樣的聲明有誰會相信呢?11從另一個角度講,任何研究工作在實驗過程中,都有可能出現(xiàn)一些意想不到的結(jié)果,沿著這個新的發(fā)現(xiàn)做下去,有可能取得重大突破。這種情況不同于沒有目的地做實驗,探索性的工作本身也是有明確目的的。一項研究工作如果是由一個研究小組共同完成,那么小組中的每一個成員對實驗?zāi)康亩紤?yīng)當有清楚的了解,為了一個共同的目的,團結(jié)協(xié)作、集思廣益,依靠集體的智慧和力量,不達目的決不罷休。1213.2.4預(yù)期結(jié)果預(yù)期結(jié)果也可以說是研究的意義。在做實驗計劃時給出的預(yù)期值??茖W研究都會有很大的投入,包括人力、時間和經(jīng)費,投入之后必定要求回報的。一項研究完成后,究竟會取得哪些成果,這成果在理論上和實用上有哪些價值,在做計劃時應(yīng)當給出一個預(yù)期值。譬如,在理論上可以解釋某些現(xiàn)象或可以得出某些規(guī)律等。在實用上,可取得什么樣的經(jīng)濟效益、社會效益或生態(tài)效益等。預(yù)期結(jié)果一定要有根據(jù),不能胡亂說一通,要對研究工作負責任,以科學的態(tài)度對結(jié)果做實事求是的預(yù)期。13.2.5實驗設(shè)計的選擇實驗設(shè)計的選擇是實驗計劃書的核心,包含內(nèi)容很多,下面逐一予以介紹。1.因素和水平的選擇。在安排一個實驗時,首先要考慮哪些因素會對實驗結(jié)果產(chǎn)生影響。既不能貪大求全,在一個實驗里包羅萬象,又不能丟掉主要影響因素。例如,設(shè)計一個“篩選能促進植物愈傷組織分化的培養(yǎng)基”實驗。在考慮這個實驗時,首先要知道,植物愈傷組織分化培養(yǎng)基的成分十分復雜,有大量元素、微量元素、生長素、激動素、細胞分裂素、維生素、糖等。設(shè)計實驗時應(yīng)考慮,這些成分中哪些成分對分化的影響最大。通過文獻檢索和自己的工作經(jīng)驗或?qū)I(yè)知識,確定其中的生長素、激動素和細胞分裂素可能是對細胞分化影響最大的因素。13因此,在選擇因素時,這三個應(yīng)是首選因素。確定每個因素的水平,也是一項至關(guān)重要的內(nèi)容。水平的確定是和因素的類型密切相關(guān)的。如果是固定型因素,應(yīng)考慮所選的水平有代表性;如果是隨機型因素,應(yīng)考慮如何從該因素的水平總體中隨機抽出實驗所需的水平數(shù)。2.響應(yīng)變量的選擇。響應(yīng)變量(responsevariable)

就是實驗觀測的指標。例如,研究了一種新的減肥藥,完成動物實驗后,進入了臨床實驗階段。為了全面評價該藥物,設(shè)計了一個配對比較實驗。這時我們就要考慮,為了給該藥物以公正的評價,需要記錄哪些指標。當然,首選的指標必定是服藥前后體重的改變。但是,單獨這樣一個指標并不能真實評價該藥物減肥的功效。體重的減輕是減少了體內(nèi)的水分?消耗了肌肉組織?還是去除了多余的脂肪?14因此,至少還應(yīng)當增加一項脂肪去除效果的指標。除此之外還必須考慮,服用藥物后對心臟功能有無影響?是否會對血紅蛋白合成有抑制作用?等等。選擇哪些響應(yīng)變量,在實驗開始之前就要做周密考慮,不要在實驗完成之后才發(fā)現(xiàn)缺少某些記錄,到那時已經(jīng)無法補救了。3.實驗設(shè)計的選擇。在一個實驗計劃中,采用哪一種設(shè)計方式安排實驗是很重要的。根據(jù)實驗的需要選擇實驗采用的設(shè)計方式:如果是單因素實驗,可以選擇完全隨機化設(shè)計或隨機化完全區(qū)組設(shè)計;如果是兩因素實驗,根據(jù)實驗的要求可選擇兩因素交叉分組設(shè)計,裂區(qū)設(shè)計或套設(shè)計等。15在制定實驗計劃時,實驗者首先必須確定希望在變量間發(fā)現(xiàn)多大的差異和允許冒多大的風險,以便確定樣本含量(重復數(shù))。例如,對一個成組比較實驗,首先需要確定,希望發(fā)現(xiàn)兩個總體平均數(shù)之間的多大差異,希望發(fā)現(xiàn)的差異越小,所需的樣本含量就越大。另外,容許犯兩種錯誤的概率越小,樣本含量也應(yīng)越大。實際操作時,應(yīng)根據(jù)工作的需要選擇一個適當?shù)闹?,以滿足實驗的要求為準,不要一味追求重復越多越好。在制定計劃時,還必須確定以怎樣的方式收集數(shù)據(jù)以及在各個處理之間如何進行隨機化等,以便滿足實驗設(shè)計中對隨機化的要求。16在這里還需要強調(diào)的另一個問題是,在設(shè)計實驗時必須考慮統(tǒng)計的可靠性和花費代價之間的平衡。為了提高統(tǒng)計的可靠性,一般的做法是擴大樣本含量,擴大樣本含量的直接后果是增加了實驗的費用并消耗了更多的時間和精力。一個良好的實驗設(shè)計,既要保證統(tǒng)計上的可靠性,而且在投入上也是最經(jīng)濟的。在設(shè)計實驗的同時,還應(yīng)提出適當?shù)慕y(tǒng)計模型和擬采取的統(tǒng)計分析方法,以便對數(shù)據(jù)做統(tǒng)計分析。1713.2.6實驗方法的確定在選擇了實驗設(shè)計方法之后,就要考慮使用什么方法完成實驗。是采用比色法還是HPLC法或其他什么方法。以下幾個方面在設(shè)計實驗時,是必須要考慮的。1.實驗材料的來源。列出實驗材料的用量和備用量,對實驗材料的要求等。實驗材料的供應(yīng)是否有保證,純度和同質(zhì)性是否符合要求?如果不能達到要求,事先需做哪些處理?如果是田間試驗,需要多大面積的試驗田,土壤肥力是否需要做勘測,用什么方法勘測。水源如何解決,周圍環(huán)境是否安全,種植的材料是否會受到破壞等。2.實驗儀器和設(shè)備。列出需要的儀器和設(shè)備,種類、數(shù)量、規(guī)格、型號。183.試劑。所需試劑的種類、數(shù)量、生產(chǎn)廠家、等級。根據(jù)文獻或自己的設(shè)計,列出每一實驗的試劑配制方案。4.實驗流程。參考文獻資料或本實驗室的前期工作,寫出每一實驗的流程。5.經(jīng)費核算。核算購買以上數(shù)量的實驗材料、試劑、消耗品以及技術(shù)服務(wù)的開支。已有的經(jīng)費是否可滿足要求,如果經(jīng)費不敷支出的話,可重新調(diào)整方案,以便實驗可順利完成。1913.2.7田間規(guī)劃20對于田間試驗,除前面講過的一些要點以外,還有以下一些應(yīng)注意的問題:1.試驗地的選擇。應(yīng)當選擇地力均勻、地勢平坦的地塊作為試驗地。應(yīng)有方便的排灌條件,周圍沒有大樹遮陰,遠離人口聚集區(qū),防止實驗地人為破壞。2.土壤肥力勘測。如果沒有地力情況的記錄,試驗開始前,還需對地力進行勘測。最好采用生物勘測法。方法是:把全部試驗地分成若干小區(qū),均勻地播種純度很高的某一作物,待作物長出后,按小區(qū)記錄作物生長情況,結(jié)合收獲后的考種記錄,標記上土壤肥力分布情況。3.隔離區(qū)的設(shè)置。如果在試驗地的周圍還種有和試驗材料相同的作物,特別是當研究材料為異花授粉和常異花授粉作物時,一定要設(shè)置隔離帶,以防止生物混雜。214.保護行的設(shè)置。在試驗地的周圍至少應(yīng)種植3~5行其他作物,把全部試驗地圍起來,保護試驗材料不致受到外來因素的破壞。5.水源。根據(jù)試驗的要求,可采用地表漫灌、噴灌、滴灌等灌溉方式,不論采取哪種灌溉方式,都應(yīng)配套相應(yīng)的設(shè)施。6.小區(qū)規(guī)劃。根據(jù)種植作物的不同和試驗的要求,確定小區(qū)面積并劃分小區(qū)。在適當?shù)牡胤綉?yīng)留出通道,以便于進行田間調(diào)查。小區(qū)多規(guī)劃為矩形,走向應(yīng)視試驗地的條件而定,以東西或南北走向為佳。7.小區(qū)編號。根據(jù)試驗設(shè)計的方式,是隨機區(qū)組設(shè)計還是裂區(qū)設(shè)計抑或?qū)Ρ仍O(shè)計等,來決定小區(qū)的編號。編號完成后,應(yīng)在每個小區(qū)的一端釘上有標號的木牌或塑料牌作為標記。8.田間規(guī)劃圖。在以上工作都完成后,應(yīng)繪制一份詳細的田間規(guī)劃圖,標明試驗地坐落位置,小區(qū)的劃分,小區(qū)編號,以防田間小區(qū)標記丟失后,造成試驗混亂。9.播種計劃。在試驗規(guī)模比較大,小區(qū)比較多時,播種前一定要周密計劃。按小區(qū)編號分裝種子,在種子袋上標上小區(qū)號,播種時對號入座。一旦發(fā)現(xiàn)錯誤,應(yīng)及時糾正,實在無法糾正時,一定要做詳細記錄。2213.2.8實驗記錄實驗記錄是實驗工作的重要一環(huán),它記錄了整個實驗過程和實驗結(jié)果,實驗記錄是總結(jié)研究結(jié)果和查找實驗過程中出現(xiàn)問題的依據(jù)。實驗記錄表或記錄本在做實驗計劃時就應(yīng)周密設(shè)計,以防實驗開始后措手不及而丟失珍貴數(shù)據(jù)。為了全面反映實驗的各個方面情況,至少應(yīng)有以下幾個方面的記錄。1.實驗室日志。實驗室日志實際上就是實驗室工作的一本流水賬,包括每天在實驗室所做的工作和所發(fā)生的一切情況,尤其是一些異常情況和不應(yīng)該發(fā)生的情況。例如,頭一天結(jié)束工作后,離開實驗室時沒有切斷應(yīng)切斷的電源,沒有關(guān)掉煤氣截門或者發(fā)現(xiàn)室內(nèi)有被人翻動過的現(xiàn)象等。23記錄每天自己的工作和所發(fā)生的各種情況,有利于總結(jié)工作和找出實驗成功和失敗的原因,督促自己培養(yǎng)良好的習慣,對實驗室的安全也起一定的保障作用。2.儀器使用登記表。貴重和精密儀器的使用一定要建立使用登記制度。使用者在每次使用前后都應(yīng)檢查儀器性能、工作狀況等。使用儀器進行登記,并不是限制使用,但有提醒使用者一定要按儀器操作規(guī)范使用,要對儀器的正常運轉(zhuǎn)負責。一旦發(fā)現(xiàn)損毀,便于查找責任和及時修復,以免影響使用。3.借物登記表。實驗室之間互相借用一些物品是經(jīng)常的事,但一定要認真管理,建立借物登記制度。借物登記表包括物品名稱、借用日期、歸還日期、借用人等。自己借用別人的物品一定記住及時歸還。244.實驗原始記錄。實驗的原始記錄應(yīng)盡量詳細,認為可記可不記的現(xiàn)象一定要記,不要等到實驗完成后憑記憶,那是不可靠的。原始記錄包括:試劑的配置、實驗流程、結(jié)果記錄、意外現(xiàn)象的記錄、數(shù)據(jù)記錄等?!皩嶒炗涗洝边@四個字已經(jīng)很清楚地指明是記錄下所做的實驗。我們發(fā)現(xiàn)有一些學生甚至一些研究人員,在記錄實驗的環(huán)節(jié)上存在一些錯誤。下面以配制溶液為例,說明錯誤之所在。溶液的配制是根據(jù)實驗計劃書中所設(shè)計的方案,稱取一定量的試劑然后定容到一定的體積。在實驗記錄上應(yīng)當記下實際上稱取了多少克溶質(zhì)。如果是機械天平,就應(yīng)當核實一下砝碼,記下克數(shù);如果是電子天平,就應(yīng)當記下窗口上的數(shù)字。然而,有一些人不是這樣做,他把實驗計劃書中所設(shè)計的方案直接抄到記錄本上,就變成了實驗記錄,這種做法是十分錯誤的。25應(yīng)該稱取多少和實際稱取多少,是兩個不同的概念,不能混為一談。這樣做的最大害處是:一旦因為數(shù)量稱取錯誤而造成實驗失敗,失敗的原因無從查找。在記錄實驗流程時,也有類似的情況。不是記錄實際操作的過程,而是把實驗方案中的流程抄到記錄本上,作為實驗記錄。實驗結(jié)果所記載的內(nèi)容包括描述性的結(jié)果,如PAGE結(jié)果的照片,DNA測序結(jié)果以及形態(tài)描述等;也包括一些現(xiàn)象的描述,如兩種物質(zhì)混合后變得黏稠了等。意外現(xiàn)象的記錄容易被人們忽略,認為沒有得到理想結(jié)果,不值得記載。實際上,實驗中出現(xiàn)的意外現(xiàn)象有時很有價值。如,人類染色體研究的時期,全部處理過程都是在等滲液中進行的,所制得的染色體標本團在一起很難分辨。在一次實驗中,偶然發(fā)現(xiàn)染色體分散得特別好,以前從未見過。26經(jīng)過核實記錄發(fā)現(xiàn),實驗員在配制等滲液時錯誤地配成了低滲液。經(jīng)重復,發(fā)現(xiàn)了低滲液在染色體制片中的重要作用,這一發(fā)現(xiàn)促使人類染色體研究在20世紀60年代取得一個大的飛躍。對于需要記錄數(shù)據(jù)的結(jié)果,最好事先先列出表格,只需把數(shù)字填入相應(yīng)的位置,避免錯記或漏失。5.田間記錄。對于田間試驗,還應(yīng)當有以下記錄。包括“播種記錄表”、“田間管理記錄表”、“物侯期調(diào)查表”、“病蟲害記錄表”以及“考種記錄表”等。田間記錄最好事先列成表,一方面記錄得比較清楚,另一方面也便于在田間使用。田間記錄要用鉛筆,水筆字易被雨水洇散,圓珠筆記錄不耐日光暴曬。27以上我們把編制“實驗計劃書”的方法和應(yīng)注意的事項做了一般的介紹。在實驗開始之前應(yīng)當把計劃書的各個部分編制好,包括各種記錄表,匯編成冊,其中的實驗記錄最好單獨成冊。對于一個具體的實驗,不一定包括以上所列各項,根據(jù)實驗性質(zhì)的不同而有所區(qū)別。例如,建立一個cDNA文庫并從中篩選某一特定基因。這樣的工作不涉及田間試驗,不會有大量的數(shù)據(jù)記載,也不必對因素和水平進行設(shè)計。而對于品種比較實驗,周密的田間設(shè)計和大量數(shù)據(jù)記錄是工作的核心,幾乎沒有多少實驗室內(nèi)的研究工作。這一切都要根據(jù)工作的需要由實驗計劃書的編制者適當取舍。2813.3簡單實驗設(shè)計13.3.1成組比較實驗設(shè)計13.3.2成組比較實驗設(shè)計所需的樣本含量13.3.3配對比較實驗設(shè)計13.3.4配對設(shè)計與成組設(shè)計檢驗效率的比較2913.3.1成組比較實驗設(shè)計30成組比較實驗設(shè)計的一般做法:將實驗材料隨機分成兩組,每組各接受一種處理,通過分析處理效應(yīng)之差異是否由隨機誤差造成,來判斷是不是存在處理效應(yīng)。對于不同類型的因素,在設(shè)計實驗時沒有原則上的不同。例如,為了比較兩種不同藥物的治療作用,設(shè)計一動物實驗,將實驗動物隨機分成兩組,一組服A藥物,一組服B藥物。這個實驗中,只有“藥物”一個因素,有兩個水平,A藥物和B藥物,類似這樣的因素稱為類別因素(categoricalfactor)。另一個實驗中,將動物分成兩組,一組每只每天補加10mg復合維生素,另一組每只每天補加20mg復合維生素。這個實驗中仍只有一個因素,即維生素。但它的水平是用數(shù)量表示的,這類因素稱為數(shù)量因素(numericalfactor)。設(shè)計實驗時對兩種因素的處置一樣。成組比較試驗設(shè)計應(yīng)注意的問題:1.要用隨機化方法劃分兩組實驗材料。2.對照組和實驗組樣本一般大時檢驗的效率更高。3.樣本含量合適。樣本含量越大,統(tǒng)計推斷的結(jié)果越可靠,但相應(yīng)的工作量和費用的支出越多,或者由于實驗條件的限制,不可能無限增加重復。因此,選擇合適的樣本含量,既能達到統(tǒng)計學要求,又有可實施性,是很重要的。4.對照的設(shè)置,應(yīng)根據(jù)具體實驗來確定?;驹瓌t:除去要比較的因素,其他各方面都應(yīng)與處理一致。5.實驗誤差。實驗誤差來源于觀測值之間的變差,有兩個來源:存在于實驗材料本身的內(nèi)在變差;由于實驗重復之間的環(huán)境條件及實驗操作的不均一性等原因造成的變31差。引起實驗誤差的實驗材料本身內(nèi)在變差,如,動物實驗個體間的性別、年齡、體重、出生重、發(fā)育狀況等的差異。選擇這些因素類似的個體作為實驗材料,可減少實驗誤差。一些個體間的變差很難控制,如動物個體間遺傳素質(zhì)的差異,是引起誤差的另一類重要原因。產(chǎn)生實驗誤差的第二類原因,即環(huán)境條件及實驗操作的不均一性等。為了消除產(chǎn)生這一類誤差的根源,要盡量保持環(huán)境條件和實驗操作的一致性。對于一些實驗,保持環(huán)境條件的一致性并不容易,例如:在年度間重復的田間試驗,年度間的自然條件不可能完全一致;在不同試驗地塊上重復的田間試驗,不同地塊的土壤條件也不可能完全一致,可以通過適當?shù)膶嶒炘O(shè)計,如采用隨機化區(qū)組設(shè)計來消除不一致性造成的影響。32由實驗操作產(chǎn)生的誤差,必須在實驗前認真考慮,把該誤差降到最低。例如,全部實驗最好由一人操作,在不得不由若干人分別完成時,實驗之前一定要明確規(guī)定統(tǒng)一標準,嚴格掌握,盡量消除人為原因所造成的誤差??傊?,在考慮實驗誤差時,想得越周到,實驗結(jié)果越可靠。除上面介紹的一般考慮外,結(jié)合具體實驗,還會有其他一些產(chǎn)生誤差的原因,需要具體問題具體分析。實驗誤差問題,不僅在成組比較實驗中存在,在其他實驗設(shè)計中同樣存在。產(chǎn)生誤差的原因,在這里做了比較詳細的說明,在以后各節(jié)中就不再討論了。3313.3.2成組比較實驗設(shè)計所需的樣本含量34在考慮樣本含量時,分以下幾種情況:i相等還是不相等,i已知還是未知。由于兩樣本含量相等時檢驗效率最高,只考慮n1=n2=n。(1)i已知且相等1=2=以和的風險,分辨出零假設(shè)H0:1-2=0和備擇假設(shè)HA:1-2=d,需要多大樣本?記犯兩種錯誤的概率分別為:在做單側(cè)檢驗時,若則接受H0:1-2=0。設(shè)K為臨界值,由所確定。在零假設(shè)下,變量服從正態(tài)分布。這時,用k表示臨界值為K時變量的值,則在備擇假設(shè)下,服從正態(tài)分布,這時,由(13.3)和(13.4)式得:35若做H0:1-2=0對HA:

1-2=d的雙側(cè)檢驗:雙側(cè)檢驗時:(2)i未知:用si代替,假設(shè)1=2=。單側(cè)檢驗時:查t和t時,需要自由度,在n未定下之前,需經(jīng)幾步嘗試。先令df=,第一次求出n(1),可用n(1)-1為自由度求n(2),直到求出n(i-1)=ni時為止。3613.3.3配對比較實驗設(shè)計設(shè)計配對實驗時,配對的雙方要有內(nèi)在的聯(lián)系。如,為比較兩種不同的處理效應(yīng),選出n窩動物,每窩抽出兩只條件一致的個體(如相同體重、相同性別等),分別接受不同的處理,構(gòu)成樣本含量為n的配對比較實驗。與成組比較實驗相比,用配對比較法設(shè)計實驗可減少遺傳差異引起的變差,產(chǎn)生的實驗誤差進一步減少。對于配對樣本,樣本含量的估計公式為:sd是對配對個體間差數(shù)的標準差的估計值。n是對子數(shù),t分布的自由度為n-1。同樣這兩個公式也必須迭代。37例欲比較兩種餌料對某種魚增重的影響(雙側(cè)檢驗),分別采用隨機化設(shè)計和配對設(shè)計,希望兩種餌料的平均增重差值不低于25g,檢驗功效達到0.9,檢驗的顯著性水平為0.05,根據(jù)過去的經(jīng)驗,可知s和sd都為20g,試求兩種設(shè)計中所需的最小樣本含量。解:要做的是雙側(cè)檢驗,且=0.05,=1-P=0.1。對于完全隨機化設(shè)計,df=時t0.025=1.96和t0.10=1.282再以df=2(13-1)=24時t0.025=2.064和t0.10=1.318代入:38以df=7-1=6時t0.025=2.447和t0.10=1.44代入:再以df=2(15-1)=28時t0.025=2.048和t0.10=1.313代入,仍可得n15,所以每個樣本至少要15尾魚才能滿足要求。對于配對設(shè)計,先將df=時t0.025=1.96和t0.10=1.282代入:以df=10-1=9時t0.025=2.262和t0.10=1.383代入:再以df=9-1=8時t0.025=2.306和t0.10=1.397代入,仍得n9,所以至少需要9對魚才能滿足要求。3913.3.4配對設(shè)計與成組設(shè)計檢驗效率的比較配對設(shè)計比成組設(shè)計更容易檢驗出兩組數(shù)據(jù)平均數(shù)之間的差異。t值越大,拒絕H0的可能性越大。影響t值的因素,除兩個平均數(shù)之差以外,s越小則t越大。做配對比較實驗時,如果兩組數(shù)據(jù)平均數(shù)間存在顯著差異,這兩組數(shù)據(jù)間一般存在正相關(guān),配對設(shè)計的方差要小于成組設(shè)計。配對設(shè)計的方差:S12、

s22為第一、二個樣本方差,r為相關(guān)系數(shù),sd2為差數(shù)的方差。sd2比s12+s22小

,r越高差異越大。因此,在條件許可時,盡量把設(shè)計為配對比較實驗。配對設(shè)計可排除數(shù)據(jù)之間可能存在的相關(guān),提高檢驗效率。4013.4單因素實驗設(shè)計13.4.1完全隨機化設(shè)計13.4.2隨機化完全區(qū)組設(shè)計13.4.3拉丁方設(shè)計13.4.4希臘-拉丁方設(shè)計4113.4.1完全隨機化設(shè)計成組比較實驗中,實驗因素只有兩個水平,若水平增加到三個或三個以上,則變?yōu)橥耆S機化設(shè)計(completelyrandomizeddesign),含義:作為實驗用的個體(或田間試驗用的小區(qū))被分配到處理的哪一個水平完全是用隨機化方法確定的。這就要求實驗個體(或試驗小區(qū))必須具備同質(zhì)性,或變差控制到最小。例如,研究服用四種不同化療藥物對動物白細胞含量的影響。該實驗只有“化療藥物”一個因素,四種藥物是實驗的四個水平,也稱四個處理,設(shè)計如下:從具有同質(zhì)性(如同性別、同年齡、同體重、白細胞含量相同、身體健康等)的實驗動物群體中,隨機抽取20只(或其他數(shù)量)動物,用隨機化的方法,均等地分配到四個處理中。4213.4.2隨機化完全區(qū)組設(shè)計13.4.2.1隨機化完全區(qū)組設(shè)計的原理13.4.2.2隨機化完全區(qū)組設(shè)計的方法13.4.2.3隨機化完全區(qū)組設(shè)計的數(shù)據(jù)處理13.4.2.4隨機化完全區(qū)組設(shè)計的優(yōu)缺點4313.4.2.1隨機化完全區(qū)組設(shè)計的原理為控制實驗誤差,完全隨機化設(shè)計要求實驗材料具備同質(zhì)性。但對于規(guī)模較大的實驗,需要的材料比較多,要求實驗材料具備同質(zhì)性有時比較困難。為解決這個問題,可采取類似配對比較實驗的設(shè)計方法安排實驗。在配對比較實驗的每一重復中,同質(zhì)性的實驗材料只有兩個,如果把同質(zhì)性的實驗材料擴大到三個或三個以上,每個材料各接受一個處理,這時的一對材料變成一組具有同質(zhì)性的材料,這樣的一組材料稱一個區(qū)組(block)。44還以上節(jié)的動物實驗為例:設(shè)計實驗時,如果一次不能得到20只同質(zhì)的實驗動物,可選擇前后出生的五窩動物,每窩選出四只條件相似的個體,如性別相同、出生體重相同等。這四只動物列為一個區(qū)組,分別接受四種藥物。在區(qū)組內(nèi)哪一只動物接受哪一種藥物完全是隨機的。共有五窩動物,所以區(qū)組數(shù)為5。這樣的設(shè)計方法稱為隨機化完全區(qū)組設(shè)計(randomizedcompleteblockdesign)?!巴耆钡暮x是:在每一區(qū)組內(nèi)都包含全部處理(4種藥物)。區(qū)組的含義很廣泛,將性質(zhì)相似的實驗材料或大致相同的環(huán)境條件安排在同一組群中,該組群都是區(qū)組。4546上面的例子,是由性質(zhì)近似的實驗材料構(gòu)成的區(qū)組。再舉一個由大致相同環(huán)境條件構(gòu)成的區(qū)組。田間品種比較的單因素試驗中,有r個品種,每一品種重復n次。若按完全隨機化設(shè)計,應(yīng)把全部試驗地分成nr個小區(qū),nr個小區(qū)必須具備同質(zhì)性,哪一個品種放在哪一個小區(qū)完全是隨機的。這樣需要較多的試驗地,很難保證在各個小區(qū)的土壤肥力、含水量、日照、土質(zhì)、小氣候等條件一致。這樣,由土壤差異帶來的效應(yīng)與隨機誤差混雜,加大了試驗誤差,嚴重時甚至檢驗不出品種間本來的差異。這時可采用環(huán)境條件的隨機化完全區(qū)組設(shè)計。47做法是將全部試驗地分成n個相等的部分,要求每一部分內(nèi)的條件(如土壤肥力、土質(zhì)、含水量、田間小氣候等)一致。由于每一部分的土地面積小了,條件一致性更容易滿足。將每一部分等分為r個小區(qū),每個小區(qū)種一個品種,從而構(gòu)成一個區(qū)組,全部試驗包括n個這樣的區(qū)組(即區(qū)組數(shù)為重復數(shù))。構(gòu)成區(qū)組的方式還可以是時間、人員等形成的區(qū)組。13.4.2.2隨機化完全區(qū)組設(shè)計的方法48以品種比較試驗的隨機化完全區(qū)組設(shè)計為例,說明隨機化的方法。設(shè)試驗有a,b,c,d,e五個品種。根據(jù)試驗地的條件,可安排三個區(qū)組,每一區(qū)組內(nèi)除五個品種不同外,其他條件都一致,包括自然條件(土壤肥力、含水量、土質(zhì)、日照、試驗地走向、播種行向、田間小氣候等)及田間管理條件(耕肥、灌水、施肥、除草、除蟲、中耕次數(shù)、收獲等都應(yīng)在同一時間內(nèi)完成)。決定了處理數(shù)并劃分好區(qū)組后,用隨機化的方法決定每一品種在每一區(qū)組中的位置(小區(qū))。將5個品種a,b,c,d,e做成5個鬮,根據(jù)抓到的順序決定在區(qū)組內(nèi)的位置。一種隨機化的結(jié)果:區(qū)組Ⅰ區(qū)組Ⅱ區(qū)組Ⅲbceaeddabcbaedc圖13-1隨機化完全區(qū)組設(shè)計的示意圖4913.4.2.3隨機化完全區(qū)組設(shè)計的數(shù)據(jù)處理可將隨機化完全區(qū)組設(shè)計中的處理作為一個因素A,區(qū)組作為另一個因素B,實驗結(jié)果按兩因素方差分析處理。假設(shè)實驗共有a個處理b個區(qū)組,該實驗的一般化表示方法如下:區(qū)組Ⅰ區(qū)組Ⅱ區(qū)組by11y12…y1by21y22…y2b………ya1ya2…yab圖13-2a個處理b個區(qū)組的隨機化完全區(qū)組設(shè)計模式圖50隨機化完全區(qū)組的統(tǒng)計模型為:其中,是總平均數(shù),i是第i個處理的效應(yīng),i是第j個區(qū)組的效應(yīng)。ij是相互獨立且服從正態(tài)分布N(0,2)的隨機變量。在隨機化區(qū)組實驗中,處理一般都屬固定型。而區(qū)組則有固定型與隨機型之分,當區(qū)組為固定型時,當區(qū)組為隨機型時,51隨機區(qū)組實驗的目的是檢驗處理效應(yīng),因此統(tǒng)計假設(shè)為:處理為固定型、區(qū)組為隨機型時,均方期望為:5253表中k代表區(qū)組內(nèi)的重復,k=1,2無法估計(因誤差自由度dfE=0),在假設(shè)區(qū)組與主效應(yīng)間不存在交互作用(這一條件一般是滿足的)時,可得出檢驗主效應(yīng)的統(tǒng)計量。FA=MSA/MSE隨機化完全區(qū)組實驗的方差分析方法與無重復兩因素方差分析方法一樣。由于這兩種實驗設(shè)計的不同,最終結(jié)果說明的問題也不同:兩因素交叉分組實驗的隨機化在全部ab次實驗之間進行,因此可檢驗A、B兩個因素的效應(yīng);而隨機化完全區(qū)組設(shè)計中,各處理的隨機化只能在區(qū)組內(nèi)進行,因此只能檢驗處理效應(yīng),由于不能在區(qū)組之間隨機化,區(qū)組效應(yīng)的檢驗缺乏統(tǒng)計學依據(jù)。有時對區(qū)組項也做檢驗,所得結(jié)果只作參考,不是統(tǒng)計推斷的結(jié)論。例13.1在做品種比較試驗時,經(jīng)常采用隨機化完全區(qū)組設(shè)計。表13-9列出了田間設(shè)計及小區(qū)產(chǎn)量。為了便于計算,將表13-9中的數(shù)據(jù)整理成表13-10的格式。(方法同第9章的無重復雙因素交叉分組,故計算方法略,跳至57頁)表13-9小麥品種比較試驗的田間設(shè)計及小區(qū)產(chǎn)量區(qū)組Ⅰ品種12345產(chǎn)量/kg1836312130區(qū)組Ⅱ品種43125產(chǎn)量/kg1834233030區(qū)組Ⅲ品種54213產(chǎn)量/kg421830223454表13-10表13-9中數(shù)據(jù)整理的結(jié)果品種區(qū)組平均ⅠⅡⅢ118232221236303032331343433421181819530304234解:本試驗的目的是希望從5個品種中選出產(chǎn)量最高的品種。因此,品種是固定因素,區(qū)組是隨機因素。具體的計算過程,可以按兩因素交叉分組實驗的混合模型方差分析方法計算。零假設(shè)為:H0:i=0將表13-10中的數(shù)據(jù)均減去30列成方差分析計算表(表13-11)。5556校正項將以上結(jié)果列成方差分析表,見表13-12。5758表13-12小麥品種比較試驗方差分析表變差來源平方和自由度均方F品種A620.44155.19.46**區(qū)組B14.827.4誤差131.2816.4總和766.414

注:**=0.01。隨機區(qū)組方差分析的目的是檢驗處理間的差異,由于排除了在區(qū)組間地力差異對產(chǎn)量的影響,使結(jié)果更可靠。如果對區(qū)組做檢驗,也可以得出它的F值。隨機區(qū)組設(shè)計不同于兩因素交叉分組設(shè)計,所以在對區(qū)組做檢驗和下結(jié)論要慎重。本例區(qū)組F=0.45,很小,可以看作誤差的估計值,說明不同地塊對小麥產(chǎn)量沒有顯著影響。以后在這塊試驗地上做試驗時,可以不設(shè)區(qū)組,直接用完全隨機化設(shè)計安排試驗。5913.4.2.4隨機化完全區(qū)組設(shè)計的優(yōu)缺點優(yōu)點:把實驗材料分成n個區(qū)組,從誤差平方和中分解出區(qū)組平方和,比完全隨機化設(shè)計的靈敏度要高。這種設(shè)計對處理數(shù)和區(qū)組數(shù)沒有什么限制,對結(jié)果的統(tǒng)計分析簡單易行。假若在一個完整的實驗中,需要取消某些處理時并不影響對實驗結(jié)果的分析,或者意外地丟失了一、二個數(shù)據(jù),也可以通過適當?shù)姆椒▉硌a救。缺點:必須保證區(qū)組內(nèi)條件的一致性。當區(qū)組內(nèi)存在較大變差時,實驗數(shù)據(jù)會產(chǎn)生較大誤差。特別是實驗處理數(shù)較多、區(qū)組較大時這個現(xiàn)象就更為突出。如果上述的品種比較試驗,參比的品種不是5個而是15個,這時每一區(qū)組的土地面積很大,很難保證區(qū)組內(nèi)土壤條件的一致性。13.4.3拉丁方設(shè)計60隨機化完全區(qū)組設(shè)計可以從完全隨機化設(shè)計的誤差平方和中分離出區(qū)組平方和,提高了實驗的靈敏度。但它要求區(qū)組內(nèi)的條件必須完全一致,這個要求在有些實驗中很難滿足。為解決這個問題,可采用拉丁方設(shè)計(Latinsquaredesign)。仍以設(shè)計一個品種比較試驗為例,說明拉丁方設(shè)計的基本原理。假設(shè)試驗地的東部和北部肥沃,西部和南部貧瘠。若在這塊試驗地上采用隨機化完全區(qū)組設(shè)計,那么區(qū)組的劃分不論是東西向還是南北向,都不能保證區(qū)組內(nèi)各小區(qū)的肥力一致。為了消除兩個方向上土壤差異給試驗帶來的干擾,應(yīng)當設(shè)計成兩個方向上的區(qū)組。具體做法:每一品種在每一行上出現(xiàn)一次,同時在每列上也出現(xiàn)一次,而且每行和每列只能出現(xiàn)一次。于是,每行相當于一個區(qū)組,每列也相當于一個區(qū)組。這樣安排的結(jié)果,行小區(qū)數(shù)與列小區(qū)數(shù)相等,全部實驗小區(qū)構(gòu)成一個方陣。由于構(gòu)成上述方陣的各個小區(qū),最初是用拉丁字母表示的,所以稱為拉丁方(Latinsquare)。用來排拉丁方的字母的個數(shù),稱為拉丁方的階數(shù)。以下為一個5階拉丁方:ADBECDACBECBEDABEACDECDAB61一個p階拉丁方的統(tǒng)計模型為:yijk是第i行第k列第j次處理的觀測值。是總平均數(shù),i是第i行效應(yīng),k是第k列效應(yīng),j是第j次處理效應(yīng),ijk是相互獨立,服從NID(0,2)的隨機變量。該模型的行、列和處理之間不存在交互作用。拉丁方設(shè)計仍然是只檢驗處理效應(yīng)的,實際上共引進三個因素,除“處理”因素外,行和列是從兩個方向上控制外來因素對試驗結(jié)果的影響。

拉丁方方差分析的基本做法仍然是將p2個觀測值的總平方和分解為行、列、處理和誤差平方和(計算略,跳至67頁):6263具以下自由度:拉丁方的方差分析過程如表13-13所示。除檢驗處理效應(yīng)外,也可以檢驗“行”和“列”效應(yīng)。由于行和列在隨機化時是受限制的,所以對行效應(yīng)和列效應(yīng)檢驗的依據(jù)不是很充分。從表中可以看出,拉丁方的方差分析只不過是隨機區(qū)組方差分析的簡單擴展,比隨機區(qū)組方差分析只多出一項由于行(或列)所引起的平方和。該平方和也是從誤差平方和中分離出來的,誤差平方和進一步減少,使得檢驗靈敏度進一步提高。64例13.2

用55拉丁方設(shè)計安排大豆品種比較試驗,得到表13-14中的結(jié)果。問5個大豆品種A、B、C、D、E的產(chǎn)量差異是否顯著?表13-14大豆拉丁方試驗結(jié)果列

12345和行1ABCDE53444549402312BCDEA52514442502393CDEAB50464354472404DEABC45495444402325EABCD4360454344235和

243250231232221117765解:將每個品種各小區(qū)產(chǎn)量之和列入表13-15。表13-15例13.2拉丁方試驗結(jié)果的數(shù)據(jù)整理表品種ABCDE和2712322292282176667列成方差分析表(表13-16):結(jié)論是品種之間的差異極顯著。表13-16大豆品種比較試驗方差分析表變差來源平方和自由度均方F品種342.64485.667.77**行13.0443.26列101.84425.46誤差132.321211.03總和589.8424

注:**=0.01。68若一個拉丁方的第一行和第一列是按拉丁字母順序排列的,則稱為標準拉丁方(standardLatinsquare)。到目前為止,只知道p<8的標準拉丁方的數(shù)目。一個標準拉丁方通過變換可以產(chǎn)生更多的拉丁方,包括標準拉丁方本身在內(nèi)的p階拉丁方的總數(shù)為p!×(p-1)!×(標準拉丁方數(shù))。拉丁方設(shè)計雖然比隨機化區(qū)組設(shè)計精密,但是由于行和列的小區(qū)數(shù)應(yīng)該一樣多,在田間試驗時占用土地面積較大或因?qū)嶒炋幚磔^多,負擔過重。因此,拉丁方設(shè)計不宜過大,一般以55到99拉丁方為宜。13.4.4希臘-拉丁方設(shè)計如果在一個用拉丁字母表示的pp階拉丁方上,再重上一個希臘字母表示的pp階拉丁方,相重合的兩個拉丁方中,每一個希臘字母共同出現(xiàn)一次,而且只出現(xiàn)一次,稱這兩個拉丁方是正交的(orthogonal),這樣的設(shè)計稱為希臘-拉丁方設(shè)計(Greco-Latinsquaredesign)或正交拉丁方設(shè)計。表13-17是一個44希臘-拉丁方設(shè)計的例子。表13-17希臘-拉丁方設(shè)計列

1234行1ABCD2BADC3CDAB4DCBA69希臘-拉丁方設(shè)計,可系統(tǒng)控制三方面與實驗無關(guān)的變異性,也就是存在3個方向的區(qū)組。該設(shè)計可容納四個因素(行、列、拉丁字母和希臘字母)。每一個因素都有p個水平,共做p2次實驗。除p=6以外,所有p>3的拉丁方都有正交拉丁方。附表18列出了一些正交拉丁方,可供參考。希臘-拉丁方的統(tǒng)計模型為:707172yijkl是第i行第l列第j個拉丁字母和第k個希臘字母的觀測值,i是第i行效應(yīng),j是拉丁字母第j次處理效應(yīng),k是希臘字母第k次處理效應(yīng)。l是第l列效應(yīng),ijkl是服從NID(0,2)的隨機誤差成分。正交拉丁方要求行、列、拉丁字母和希臘字母之間不存在交互作用(計算略,跳至78頁)。希臘-拉丁方的方差分析與拉丁方的方差分析很相似。由于用希臘字母所表示的拉丁方與用拉丁字母所表示的拉丁方是正交的,所以由希臘字母所產(chǎn)生的平方和可以由每一希臘字母的總和計算出。因為第四個因素的引進,實驗誤差進一步縮小。具體計算方法歸納在表13-18中。表13-13中的。希臘-拉丁方方差分析的零假設(shè)為:

。處理均方是以誤差均方做檢驗的。7374例13.3

假設(shè)例13.2的田間管理由、、、、五人完成,為了從實驗誤差中分解出不同工人管理所造成的誤差,設(shè)計了希臘-拉丁方。結(jié)果見表13-19。表13-19大豆品種比較試驗希臘-拉丁方設(shè)計列yi???

12345行1A=53B=44C=45D=49E=402312B=52C=51D=44E=42A=502393C=50D=46E=43A=54B=472404D=45E=49A=54B=44C=402325E=43A=60B=45C=43D=44235y???l243250231232221117775解:

用拉丁字母表示的產(chǎn)量之和為:用希臘字母表示的產(chǎn)量之和為:品種ABCDE和271232229228217田間管理αβγδε產(chǎn)量271232229228217由上表計算出:其他各項平方和在例13.2中已經(jīng)計算過了,這里不再重復。76列成方差分析表:表13-20大豆品種比較試驗方差分析表變差來源平方和自由度均方F品種342.64485.6611.04**管理70.24417.56行13.0443.26列101.84425.46誤差62.0887.76總和589.8424

注:**=0.01。7778比較表13-20和表13-16可以看出,扣除由于管理所引起的變異性之后,誤差平方和進一步降低,品種項的F值從7.77升到11.04。希臘-拉丁方的概念可進一步擴展,可以將三個或更多個pp正交拉丁方重疊到一起。一個pp拉丁方最多可有p-1個正交拉丁方,如果存在p-1個互為正交的pp拉丁方,叫正交拉丁方的完全系(completesetoforthogonalLatinquare),見附表18正交拉丁方表。將p-1個正交拉丁方重疊到一起,可以容納p+1個因素,這樣的設(shè)計利用了全部p2-1個自由度。當然,這時因素之間是不能存在交互作用的。13.5兩因素實驗設(shè)計13.5.1兩因素交叉分組實驗設(shè)計13.5.2兩因素隨機化區(qū)組實驗設(shè)計13.5.3裂區(qū)實驗設(shè)計13.5.4套設(shè)計7913.5.1兩因素交叉分組實驗設(shè)計80在§9.1中已經(jīng)涉及了兩因素交叉分組設(shè)計的大部分內(nèi)容,在這里只補充另外一些應(yīng)注意的問題。設(shè)有兩個因素A和B,它們是培養(yǎng)基中的兩種主要成分,為了優(yōu)化培養(yǎng)基的構(gòu)成,從成分A的a個濃度和成分B的b個濃度組合中,選出最優(yōu)水平組合。顯然,這是一個兩因素固定模型試驗。在設(shè)計和執(zhí)行方案時應(yīng)注意:1.在上述試驗中,兩個因素的水平組合共有ab種,所培養(yǎng)的純系植株共有ab株,至于哪一株用哪一種培養(yǎng)基培養(yǎng),是完全隨機的。2.由于實驗的安排完全是隨機的,所以實驗是以同樣的精度考察這兩個因素在培養(yǎng)基中的作用,沒有哪一個精度高一些,哪一個低一些之分。3.交叉分組:配制培養(yǎng)基時,成分A配a×b次,共配a種濃度,每一種濃度下共有b份;成分B配a×b次,共配b種濃度,每一種濃度下共有a份;A,B混合后,得到a×b個組合。設(shè)A因素3個水平,B因素4個水平,實驗重復3次,全部實驗共36次,哪一個實驗材料為哪一次實驗,完全是隨機的。圖13-3是一種隨機化的結(jié)果,直觀地表達了實驗安排方法。例如,材料1接受A3B4,材料2接受A1B2……材料36接受A3B1等。A3B4A1B2A2B2A1B4A3B3A2B2A3B3A2B4A3B1A2B4A2B1A3B4A1B3A3B3A1B1A3B2A1B4A1B3A2B1A1B2A3B4A2B3A2B1A2B2A1B1A2B4A3B1A1B1A3B2A3B2A1B4A2B3A1B3A2B3A1B2A3B1圖13-3兩因素交叉分組設(shè)計隨機化示例8113.5.2兩因素隨機化區(qū)組實驗設(shè)計一個兩因素交叉分組實驗,若每一處理重復n次,全部實驗共abn次,這abn次實驗的實驗條件或?qū)嶒灢牧媳仨毦咄|(zhì)性。否則,由于實驗材料或?qū)嶒灄l件的差異所引起的誤差會混雜在實驗誤差中,影響實驗結(jié)果的可靠性。為避免這種情況發(fā)生,與隨機化完全區(qū)組的做法一樣,將每一套水平組合安排在一個區(qū)組中,也就是每一個區(qū)組是一個無重復的兩因素交叉分組實驗,n次重復構(gòu)成了n個區(qū)組。由于每一個區(qū)組的規(guī)模變小了,同質(zhì)性的要求容易得到滿足。這樣的一種設(shè)計稱為兩因素隨機化區(qū)組設(shè)計。兩因素隨機化區(qū)組設(shè)計與隨機化完全區(qū)組設(shè)計一樣,隨機化是受到限制的,需分兩個階段進行,先在區(qū)組內(nèi)的處理之間隨機化,然后再在區(qū)組之間隨機化。82例如,A因素有3個水平,B因素有4個水平,共設(shè)3個區(qū)組,圖13-4舉出一種隨機化的結(jié)果。從圖中可以明顯看出與兩因素交叉分組設(shè)計的不同,在這里隨機化是分階段進行的。8384統(tǒng)計模型為:其中i,j和()ij,分別為A因素、B因素和AB交互作用效應(yīng),k是第k區(qū)組效應(yīng),()ik、()jk和()ijk分別是區(qū)組與A因素、B因素以及區(qū)組與AB間的交互作用,ijkl是服從NID(0,2)的隨機誤差成分。(計算略,跳至88頁)下面以一個混合模型(A固定,B隨機)為例,說明兩因素隨機化區(qū)組的方差分析方法。混合模型中各分量的均方期望可由表13-21推演出,對于固定模型和隨機模型,讀者可自行推導。上表中的l為區(qū)組內(nèi)的重復,因l=1,這時2無法估計(誤差自由度dfE=0)。假設(shè)區(qū)組與因素間不存在交互作用(這一條件一般是滿足的),可將上表的左半部的后四行合并,作為誤差估計,得到表的右半部。根據(jù)表的右半部,由均方期望可以得到檢驗統(tǒng)計量:85兩因素隨機區(qū)組設(shè)計的方差分析與無重復三因素交叉分組設(shè)計的方差分析類似,區(qū)組在這里作為一個因素對待。與隨機化完全區(qū)組一樣,對于區(qū)組的檢驗同樣應(yīng)特別慎重,所得到的F值僅可作為以后工作的參考。對于上面的例子,假設(shè)區(qū)組與因素間不存在交互作用,這時的線性統(tǒng)計模型變?yōu)椋悍讲罘治龅牧慵僭O(shè)為:8687根據(jù)線性統(tǒng)計模型,總平方和做如下分解:SST=SSA+SSB+SSAB+SS區(qū)組+SSE其中自由度做相應(yīng)的分解:dfA=a-1,dfB=b-1,dfAB=(a-1)(b-1),df區(qū)組=n-1,dfE=(ab-1)(n-1)例13.4

例9.5的實驗,共需32位同質(zhì)受試者才能完成,因32位同質(zhì)受試者很難找到,因此將實驗的兩次重復安排為兩個區(qū)組,在每一區(qū)組內(nèi)只要有16名同質(zhì)受試者即可,這樣設(shè)計的實驗容易完成。解:這是一個混合模型實驗,A固定、B隨機,剛好與上面講述的內(nèi)容一樣。因此,完全可以按上面所講的方法完成方差分析,具體過程不再細述,只給出方差分析表(表13-22)(e13.3兩因素隨機化區(qū)組實驗的方差分析)。表13-22例9.5隨機化區(qū)組的方差分析表變差來源平方和自由度均方F工作速度A3.994831.33161.42受試時間B0.454130.15141.50AB交互作用8.412390.93479.26**區(qū)組0.275710.27572.73誤差1.5145150.1010總和14.651431

注:**=0.01。8813.5.3裂區(qū)實驗設(shè)計裂區(qū)設(shè)計(split-plotdesign)與兩因素隨機區(qū)組設(shè)計近似。不同點是后者在每一區(qū)組內(nèi)A、B兩因素的ab次處理是完全隨機化的。而裂區(qū)設(shè)計的每一區(qū)組內(nèi)A因素先分為a個處理,在每一處理內(nèi)B因素再分為b個處理。隨機化過程只能分別在A因素的a個處理之間及B因素的b個處理之間進行。由A因素所劃分的a個部分稱為主區(qū)(mainplot),每一主區(qū)再劃分的b個部分稱為次區(qū)(sub-plot)。例如,用3種不同方法從植物中提取有效成分,按4種不同濃度添加到培養(yǎng)基中,觀察對培養(yǎng)植株生長的促進作用,記錄培養(yǎng)一個月后植株的重量。按兩因素交叉分組設(shè)計,全部實驗包括由A因素(提取方法)3個水平和B因素(質(zhì)量濃度)4個水平構(gòu)成12種處理。8990實驗重復3次,完成全部實驗共36次。由于實驗材料的限制,一次無法得到36個同質(zhì)植株,所以分3個區(qū)組。每一區(qū)組內(nèi)包括12種處理,每一區(qū)組內(nèi)的12種處理是完全隨機化的。這是一個兩因素隨機化完全區(qū)組設(shè)計,完成全部實驗共需36批材料,經(jīng)36次提取,得到36個方法濃度的組合,才能保證每一區(qū)組內(nèi)的完全隨機化。然而,根據(jù)實驗的要求,需要更精密考慮的是不同濃度之間的差異,不同提取方法之間的比較要求不是非常嚴格。為此,可把實驗設(shè)計作如下改進:在每一區(qū)組內(nèi),每一提取方法只提取一次,把每一提取液稀釋成4種濃度,從而得到12個處理。這樣的設(shè)計方式就是裂區(qū)設(shè)計。每一區(qū)組內(nèi)根據(jù)3種提取方法所劃分的3個部分稱為主區(qū),提取方法稱為主處理(maintreatment)。每一主區(qū)再劃分的4個部分(4種濃度)稱為次區(qū),質(zhì)量濃度稱為次處理(subplottreatment)。裂區(qū)設(shè)計的隨機化受到限制,不能在區(qū)組內(nèi)進行完全隨機化,只能分階段進行。先在次區(qū)的4個水平間隨機化,然后再在主區(qū)的3個水平間隨機化,下面以圖示方法說明該設(shè)計(圖13-5)。91表13-23植物培養(yǎng)實驗數(shù)據(jù)區(qū)組ⅠⅡⅢ提取方法123

123

123質(zhì)量濃度/%

1434742414444444845248543945494350534735051465355455452524495549

545353

535758在裂區(qū)設(shè)計中,每一主區(qū)下各個次區(qū)的水平都是一樣的。例如,次區(qū)的4個濃度是5%,10%,15%和20%,那么在每一主區(qū)下的4個次區(qū)的濃度都是這4個水平。這一點與我們下面將要講到的套設(shè)計是不一樣的。表13-23即上述植物培養(yǎng)實驗所得數(shù)據(jù)。92用裂區(qū)設(shè)計可以減少一些實驗工作量,但是假若在提取方法(主區(qū))間存在某些不能控制的因素,而這些因素又隨不同的提取方法而改變,這些不可控制因素的效應(yīng)與提取方法的效應(yīng)相混雜,會降低實驗的準確性,但次區(qū)是不受影響的。因此,在裂區(qū)實驗設(shè)計中,常常將要求精度低而且較次要的因素放在主區(qū),而將要求精度較高而且較重要的因素放在次區(qū)。(計算略,跳至101頁)裂區(qū)設(shè)計的統(tǒng)計模型為:其中i,j和()ij代表主區(qū),分別相應(yīng)于區(qū)組(A因素)、主處理(B因素)和主區(qū)誤差(AB交互作用),k,()ik、()jk和()ijk代表次區(qū),分別相應(yīng)于次處理(因素C),AC,BC交互作用以及次區(qū)誤差(ABC間的交互作用)。93裂區(qū)設(shè)計在多數(shù)情況下,區(qū)組為隨機因素,若B和C為固定因素,均方期望的推演見表13-24因區(qū)組內(nèi)沒有重復,2無法化估計

。主區(qū)中的主處理(B)用AB交互作用檢驗,次區(qū)中的改處理(C)用AC交互作用檢驗,BC交互作用用ABC交互作用檢驗。各因素平方和的計算類似于無重復的三因素方差分析。總平方和為:94其中。各因素平方和分別為:為了計算各因素的交互作用平方和,需將原始數(shù)據(jù)表重新列成三個兩向表,根據(jù)以下各式進行計算。自由度分解的原則與其他方差分析一樣,這里不再細述。95例13.5

根據(jù)表13-23中所給出的數(shù)據(jù)做方差分析。解:將表13-23中的數(shù)據(jù)均減去50,列成表13-25~28表13-25裂區(qū)實驗方差分析計算表區(qū)組A123方法B123

123

123濃度C1-7-3-8-9-6-6-6-2-52-24-11-5-1-703-3301-435-54224-15-1

433

378表13-26利用yij?列出A×B兩相表

Byi??

123A1-107-24-272-71-15-21311021396表13-27利用yi?k列出A×C兩相表

Ayi?k

123C

1-18-21-13-522-9-130-223-338843101831表13-28利用y?jk列出B×C兩相表

Cy?jk

1234B1-22-776-162-116815183-19-21-710-3797各主效應(yīng)平方和分別為:根據(jù)前面給出的公式和表格中的數(shù)據(jù),可以計算出各項平方和:98各交互作用平方和為:99列出方差分析表:100提取方法均方除以主區(qū)誤差均方,得F=7.08>F2,4,0.05=6.94,說明不同提取方法對植株重量有顯著影響。濃度均方除以AC交互作用均方,得F=42.06>F3,6,0.01=9.78,即不同濃度對植株重量影響極顯著。提取方法與濃度的交互作用對植株重的影響是不顯著的。從表13-21中還可以看出,次區(qū)誤差比主區(qū)誤差小,這種情況在裂區(qū)實驗中是很普遍的。因為次區(qū)有較高的精度,所以在可能的情況下,最好把主要因素放在次區(qū)(e13.4裂區(qū)實驗設(shè)計的方差分析)。如果實驗因素多于兩個,同樣可以使用裂區(qū)設(shè)計,稱為裂-裂區(qū)設(shè)計(split-splitplotdesign)。裂-裂區(qū)設(shè)計雖然比裂區(qū)設(shè)計復雜一些,但原理都是一樣的,這里不再介紹。10113.5.4套設(shè)計

(第9章有講,這里略,跳至107頁)如果在裂區(qū)設(shè)計中的實驗不是三種提取方法,而是從三種不同藥用植物中提取有效成分,然后加到培養(yǎng)基中,觀測培養(yǎng)植株的生長量。因為不同植物有效成分的結(jié)構(gòu)和含量不同,所以加到培養(yǎng)基中的濃度也不能一樣。這時不再能使用裂區(qū)設(shè)計,因為在裂區(qū)設(shè)計中每一主區(qū)的次區(qū)水平都是一樣的,在這里每一藥用植物下的濃度并不一樣。在這種情況下,就要使用套設(shè)計(nesteddesign)安排實驗。圖13-6表示套設(shè)計的實驗安排方法。102植物種類(A)1

2

3濃度(B)123456789101112重復1111111111112222222222223333

3333

3333圖13-6套設(shè)計的實驗安排示意圖從圖中可以看出,濃度1~4是嵌套在第1種植物下,濃度5~8是嵌套在第2種植物下,濃度9~12是嵌套在第3種植物下,由此得出套設(shè)計這一名稱。在每一濃度下有n次重復。這個例子是一個因素嵌套在另一因素下,稱為二級套設(shè)計。如果再嵌套一層,稱為三級套設(shè)計。二級套設(shè)計的統(tǒng)計模型如下:103其中i是A因素第i水平的效應(yīng);j(i)是在A因素第i水平內(nèi),B因素第j水平的效應(yīng);k(ij)是在A因素第i水平,B因素第j水平下第k次重復的效應(yīng)。由此可見,套設(shè)計實際上是一個因素的效應(yīng)嵌套在另一個因素的效應(yīng)之中,因素之間的交互作用無法檢出。對于因素效應(yīng)的檢驗,根據(jù)因素類型的不同而不同。若因素A和B都是固定型,則若因素A和B都是隨機型,則對于混合模型的條件,讀者可自行寫出。設(shè)A、B均為隨機因素,均方期望可由表13-30推出:104由此得出檢驗統(tǒng)計量:表13-30隨機模型套設(shè)計均方期望的推演因素RRR均方期望abnijki1bn2+n2+bn2j(i)11n2+n2k(ij)1112各平方和與自由度計算公式如下:105例13.6

隨機選取3株植物(因素A),在每一株內(nèi)隨機選取兩片葉子(嵌套在因素A下的第二個因素B),用取樣器從每一片葉子上選取同樣面積的兩個樣本(兩次重復),稱取濕重(g),分析不同植株和同一植株上的不同葉片間含水量差異是否顯著。數(shù)據(jù)見表13-31:表13-31例13.6的實驗數(shù)據(jù)植株(A)1

2

3植株(B)12

34

56重復12.112.814.414.723.128.112.112.8

14.414.5

23.428.8106表13-32例13.6的方差分析表變差來源平方和自由度均方F植株416.782208.39葉片(植株)27.5739.1922.68*誤差0.3160.051667177.87**總和444.6611

注:*=0.05。**=0.01。解:根據(jù)前面給出的公式,可以求出各項平方和,將最終結(jié)果列成表13-32的方差分析表:對于其他模型,可以自己練習寫出均方期望,并完成方差分析。三級以上套設(shè)計的分析方法與此類似,這里不再舉例(e13.5套設(shè)計的方差分析)。10713.6正交設(shè)計13.6.1正交設(shè)計方法13.6.2正交設(shè)計的方差分析正交設(shè)計是多因素分析的有力工具,特別是要從許多因素中選出主要因素及其最優(yōu)水平時,使用正交設(shè)計是很方便的,可以用較少的實驗次數(shù)得到較多的信息。10813.6.1正交設(shè)計方法用A表示希臘-拉丁方的行,用B表示列,用C表示拉丁字母,用D表示希臘字母,如一個33希臘拉丁方:如果按因素和實驗號編成表格,如表13.34所示:表13-33一個3×3希臘-拉丁方表B1B2B3A1C1D1C2D2C3D3A2C2D3C2D1C1D2A3C3D2C1D3C2D1109表13-34四因素三水平的正交表

因素

ABCD111112122231333421235223162312731328321393321

這張表有兩個特點:(1)每一列中不同數(shù)字出現(xiàn)的數(shù)目相同,各出現(xiàn)三個1,三個2和三個3;(2)任取兩列,同一行上的有序數(shù)對出現(xiàn)的次數(shù)相同。具有這種特征的表稱為正交表(orthogonalarray)。110111正交拉丁方與正交表差別:正交拉丁方的實驗次數(shù)必須是除2和6以外的自然數(shù)的平方(22和66拉丁方不存在正交拉丁方),并且正交拉丁方不能考察因素之間的交互作用,但正交表不存在這樣的問題。正交表記為LN(mk),N表示實驗次數(shù),k表示最多可容納的因素數(shù),m為因素的水平數(shù)。LN(m1k1m2k2)的含義與上述相同,表示可以安排k1個m1

水平的因素和k2個m2水平的因素,共做N次實驗。L8(27)表示最多可以安排7個因素的兩水平實驗,實驗共需做8次。表13-35是一個L8(27)表。表13-35的最上一行表示7個因素,最左邊一列表示實驗號,表體中的1和2表示各因素的水平數(shù)。如第1號實驗是由各因素的第1水平構(gòu)成。第2號實驗是由1、2、3因素的第1水平和4、5、6、7因素的第2水平構(gòu)成,依次類推。全部實驗只需8次就夠了。由此可見,用正交設(shè)計安排實驗,可以大大減少實驗次數(shù)。一個7因素兩水平實驗,若將各因素水平組合全部做一遍的話,需27=128次,而正交實驗只需8次就可以。雖然實驗次數(shù)減少了,但因為各水平搭配很均勻,8次實驗基本上代表全部實驗的情況。表13-35正交表L8(27)行號列號12345671111111121112222312211224122221152121212621221217221122182212112112用正交表設(shè)計實驗,不僅能分析出因素的作用,而且還能考慮因素之間的交互作用。L8(27)表的兩列間交互作用可由表13-36給出:表13-36L8(27)的兩列間交互作用列號1234567(1)325476(2)16745(3)7654(4)123(5)32

(6)1如要查出列1和列2的交互作用列,查表13-36的第(1)行與第2列的交點得3,即列1和列2的交

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論