試驗設(shè)計與描述性統(tǒng)計_第1頁
試驗設(shè)計與描述性統(tǒng)計_第2頁
試驗設(shè)計與描述性統(tǒng)計_第3頁
試驗設(shè)計與描述性統(tǒng)計_第4頁
試驗設(shè)計與描述性統(tǒng)計_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

試驗設(shè)計與描述性統(tǒng)計幾個基本概念:總體(population)是指在同一組條件下所有成員的某種性狀變量的集合,或者說是某一變數(shù)的全部可能值的集合。有無限總體(infinitepopulation)和有限總體(finitepopulation)之分。參數(shù)(parameter)是指描述總體的特征數(shù),如總體平均數(shù)、總體標(biāo)準(zhǔn)差、總體方差等等。樣本(sample)是指從總體中抽出的一個部分。大樣本-個體數(shù)>30,小樣本-個體數(shù)≤30。統(tǒng)計數(shù)(statistic)是指描述樣本的特征數(shù),如樣本平均數(shù)、樣本標(biāo)準(zhǔn)差、樣本方差等等。變數(shù)(variable)是指某種性狀或特性的有變化的數(shù)據(jù)。觀察值(observation)是指每一個體的某一性狀、特性的測定數(shù)值。試驗因素(experimentalfactor)水平(level)是指因素內(nèi)設(shè)置的不同處理級別。處理(treatment)是指試驗因素不同水平的組合。第2頁,共54頁,2024年2月25日,星期天隨機(jī)樣本(RandomSample):從總體中隨機(jī)抽取的樣本。試驗指標(biāo)(Experimentalindicator):衡量試驗效果的指示性狀。試驗效應(yīng)(Experimentaleffect):試驗因素對試驗指標(biāo)所起的增或減作用。準(zhǔn)確度(Accuracy):同一處理的觀察值與其真實值的接近程度。精確度(Precision):同一處理的重復(fù)觀察值間彼此接近程度。試驗單元(ExperimentalUnit):是指接受某種處理的最小的一個獨(dú)立的試驗材料單位。如一張葉片、一個果實、一個枝條、一個植株等。誤差(Error):觀察值與處理真實值間的偏離程度。系統(tǒng)誤差(SystematicError):觀察值與處理真實值間出現(xiàn)有一定方向的系統(tǒng)偏離,如供試材料的遺傳背景、儀器等方面存在的可辨識的差別所造成的誤差。隨機(jī)誤差(RandomError):觀察值與處理真實值間出現(xiàn)的大小、方向不同的微小差異。如在試驗單元、管理方法、操作方法等方面存在的不可辨識的差別所造成的誤差。樣本含量(SampleSize/Capacity):樣本中所包含的個體數(shù)目。第3頁,共54頁,2024年2月25日,星期天第一節(jié)試驗設(shè)計experimentdesign第4頁,共54頁,2024年2月25日,星期天試驗是在人為控制條件下有目的地進(jìn)行的一種實踐活動。試驗方案是根據(jù)試驗?zāi)康暮鸵笏M(jìn)行比較的一組試驗處理的總稱。在進(jìn)行科學(xué)試驗時,必須在固定大多數(shù)因素的條件下才能研究一個或者幾個因素的作用。一、試驗類型(1)按照試驗環(huán)境田間試驗、溫室試驗、實驗室試驗、皿內(nèi)試驗、人工氣候試驗、室內(nèi)試驗等等。(2)按照供試因子的多少單因素試驗、多因素試驗、綜合性試驗(各因素的各個水平不構(gòu)成平衡的處理組合,而是將若干個因素某些水平結(jié)合在一起形成少數(shù)幾個處理組合,目的在于探索綜合作用,不在于檢測因素的單獨(dú)效應(yīng)和相互作用)。第5頁,共54頁,2024年2月25日,星期天二、試驗的基本要求目的明確結(jié)果可靠試驗條件有代表性試驗結(jié)果能夠重復(fù)第6頁,共54頁,2024年2月25日,星期天●●●●●即準(zhǔn)確又精確●●●●●準(zhǔn)確而不精確●●●●●即不準(zhǔn)確又不精確●●●●●精確而不準(zhǔn)確精確度和準(zhǔn)確度的關(guān)系第7頁,共54頁,2024年2月25日,星期天試驗?zāi)P凸┰圀w輸入處理輸出試驗指標(biāo)隨機(jī)干擾Fig.1Generalmodelofexperiment試驗指標(biāo)是指用于衡量試驗效果的指示性狀。輸入(處理)供試體輸出(觀察響應(yīng))隨機(jī)干擾(也是一種輸入)第8頁,共54頁,2024年2月25日,星期天UxFig.1Mathematicalmodelofexperiment第9頁,共54頁,2024年2月25日,星期天

離散的測定幾個點,采用統(tǒng)計學(xué)的方法經(jīng)驗的估計x=f(U)(如上圖所示),顯然觀測點未必都在曲線上。如果估計出了x=f(U),我們就掌握了x隨U而變化的規(guī)律,就可以進(jìn)行預(yù)測和控制,這個曲線稱為響應(yīng)曲線(曲面)。離地面不同高度孢子捕捉器捕捉到的蘋果黑星菌子囊孢子數(shù)量第10頁,共54頁,2024年2月25日,星期天三、處理設(shè)計田間試驗按試驗小區(qū)大小、試驗?zāi)攴?、試驗地點等可分為若干類,但最基本的是根據(jù)試驗因素可將田間試驗分為:單因素試驗(Single-factorexperiment)僅研究某一個問題,如施肥對產(chǎn)量的影響,可以包含肥料的不同等級。優(yōu)點:試驗簡單,容易分析、但是不能了解各因素之間的關(guān)系。多因素試驗(Multiple-factorexperiment)中包含了不同因素及不同水平的組合。優(yōu)點:便于了解各因素之間的相互關(guān)系,試驗復(fù)雜,設(shè)計不妥時不便于分析。綜合試驗(Comprehensiveexperiment)是在進(jìn)行多因素研究之后,將重要因素重新組合,進(jìn)行試驗分析,各因素的水平不需要構(gòu)成平衡處理。第11頁,共54頁,2024年2月25日,星期天四、試驗單元的排列方式

試驗設(shè)計的目的是避免系統(tǒng)誤差,縮小隨機(jī)誤差,以保證試驗的準(zhǔn)確度和精確度。試驗設(shè)計的三個基本原理:重復(fù)(Replication):重復(fù)的作用(1)若試驗中沒有系統(tǒng)誤差存在,只有隨機(jī)誤差,則可用處理多次重復(fù)觀察值間的參差不棄程度來估計隨機(jī)誤差。只有1次重復(fù)就無法估計隨機(jī)誤差(2)同一處理多次觀察值的平均值是處理真值的最好估計。隨機(jī)化(Randomization):通過試驗單元的隨機(jī)化排列來消除試驗單元間的系統(tǒng)誤差。局部控制(Localcontrol):將整個試驗空間分成若干個各自相對均勻的局部(區(qū)組),所有的區(qū)組構(gòu)成區(qū)組因素。作用(1)可將系統(tǒng)誤差分離出來增加準(zhǔn)確度;(2)區(qū)組內(nèi)保證試驗單元的一致性,增加精確度。第12頁,共54頁,2024年2月25日,星期天隨機(jī)化排列重復(fù)

I重復(fù)

IIbcdefgck2ckckheabcfgdaabcdefghck1、田間試驗設(shè)計ckabcgedf利用查表或產(chǎn)生隨機(jī)數(shù)的方法進(jìn)行設(shè)計ck2第13頁,共54頁,2024年2月25日,星期天五、局部控制1、田間試驗設(shè)計abcdefck第14頁,共54頁,2024年2月25日,星期天設(shè)置重復(fù)隨機(jī)化排列局部控制消除系統(tǒng)誤差,無偏試驗誤差估計估計和降低隨機(jī)誤差與隨機(jī)化結(jié)合分離系統(tǒng)誤差降低隨機(jī)誤差提高準(zhǔn)確度和精確度保證統(tǒng)計推斷的可靠性第15頁,共54頁,2024年2月25日,星期天試驗類型(二)

試驗設(shè)計可以歸納為全面實施試驗和部分實施試驗兩種類型。全面實施試驗分為順序排列的試驗設(shè)計和隨機(jī)排列的試驗設(shè)計兩大類。前者常用在處理數(shù)量大、精確度要求不高、不須作統(tǒng)計推斷的預(yù)備試驗,容易發(fā)生系統(tǒng)誤差;后者強(qiáng)調(diào)有合理的試驗誤差估計,常用于對精確度要求較高的試驗。第16頁,共54頁,2024年2月25日,星期天全面實施試驗(全因子試驗)第17頁,共54頁,2024年2月25日,星期天一、順序排列的試驗設(shè)計對比法設(shè)計(contrastdesign)常用于少數(shù)處理試驗及示范性試驗,其試驗單元排列特點是處理單元直接排列在對照區(qū)旁邊,使每一小區(qū)可與其鄰旁的對照區(qū)直接比較。IIIIII1CK23CK45678CKCK7CK81CK23456CKCK5CK67CK81234CKCK常用的田間試驗設(shè)計第18頁,共54頁,2024年2月25日,星期天2.間比法設(shè)計(intervalcontrastdesign)常用處理試驗單元較多的試驗,要求不高,但用隨機(jī)區(qū)組排列有困難的試驗。其試驗單元排列特點是第一個小區(qū)和末尾小區(qū)一定是對照,每二個對照之間排列相同數(shù)目的處理小區(qū),通常是4或9個,重復(fù)2-4次。CKCKCKCK12345678910111212個小麥品種的間比法排列第19頁,共54頁,2024年2月25日,星期天二、隨機(jī)排列的試驗設(shè)計完全隨機(jī)設(shè)計(completelyrandomdesign)將各個處理隨機(jī)分配到各個試驗單元(或小區(qū))中,每一個處理的重復(fù)數(shù)可以相等或不相等。這種設(shè)計靈活機(jī)動,單因素和多因素均可使用。2.隨機(jī)區(qū)組設(shè)計(randomizedblockdesign)亦稱完全隨機(jī)區(qū)組設(shè)計(randomcompleteblockdesign)根據(jù)局部控制的原則將試驗地劃分為等于重復(fù)次數(shù)的區(qū)組,一個區(qū)組安排一個重復(fù),區(qū)組內(nèi)各處理都獨(dú)立隨機(jī)排列。主要特點(1)簡單;(2)適應(yīng)性廣;(3)能提供無偏的誤差估計,降低誤差;(4)對試驗地形要求不嚴(yán)格;(5)試驗的處理數(shù)目一般不要超過20。第20頁,共54頁,2024年2月25日,星期天74211317368548732164524887566532IIIIIIIV肥力梯度:8個品種4次重復(fù)的隨機(jī)區(qū)組排列第21頁,共54頁,2024年2月25日,星期天3.拉丁方設(shè)計(latinsquaredesign)將各個處理從縱橫兩個方向排列為區(qū)組(或重復(fù)),使每一個處理在每一列和每一行中出現(xiàn)的次數(shù)相等(通常一次)。所以它比隨機(jī)區(qū)組多一個方向進(jìn)行局部控制的隨機(jī)排列設(shè)計。拉丁方設(shè)計具有雙向控制土壤差異的作用,有較高的精確度,但缺乏伸縮性,適應(yīng)于4-8個處理的試驗設(shè)計。ABCDEBCDEACDEABDEABCEABCD第22頁,共54頁,2024年2月25日,星期天4.裂區(qū)設(shè)計(split-plotdesign)是多因素試驗的一種設(shè)計形式。先按一個因素設(shè)計主處理小區(qū)(mainplot),然后在這個主處理小區(qū)內(nèi)引進(jìn)第二個因素的各個處理的小區(qū)(副區(qū)或裂區(qū),split-plot)。152541243634362651高低中653231163142465254低中高246532142135461653高中低IIIIII6個品種、3種施肥量第23頁,共54頁,2024年2月25日,星期天再裂區(qū)設(shè)計(split-splitplotdesign)若在裂區(qū)試驗中需要引進(jìn)第三個因素時,可以進(jìn)一步裂區(qū),將第三個因素的各個處理隨機(jī)排列在裂區(qū)內(nèi)。條區(qū)設(shè)計(stripblocksdesign)條區(qū)設(shè)計是裂區(qū)設(shè)計的一種衍生設(shè)計,當(dāng)要研究的兩個因素都需要較大的小區(qū)面積,且為了便于觀察和管理,將每個區(qū)組劃分為縱向長條形小區(qū),安排第一個因素的各個處理,再將各個區(qū)組劃分為若干個橫向長條形小區(qū),安排第二個因素的各個處理。第24頁,共54頁,2024年2月25日,星期天部分實施試驗(部分因子試驗)第25頁,共54頁,2024年2月25日,星期天正交設(shè)計(orthogonaldesign):兩個重要的特點:(1)每列中因素各水平數(shù)字出現(xiàn)的次數(shù)相等,即整齊可比性;(2)任兩列放在一起,他們的行構(gòu)成一個有序數(shù)對,這樣的數(shù)對出現(xiàn)的次數(shù)也相等?;蛘哒f任兩列之間的所有可能的水平組合都出現(xiàn),且出現(xiàn)的次數(shù)均等。即均衡分散性。具有這樣特點的數(shù)表稱為正交表。正交表是正交拉丁方的推廣。一般用LN(mk)表示正交表,N為試驗次數(shù);k為所能容納的最多因素數(shù);m為每個因素的水平數(shù)。如L8(27)。第26頁,共54頁,2024年2月25日,星期天

假設(shè)我們要做一個三因素二水平的試驗,若已知不需要考慮任何交互作用,可以用L4(23)表,但在這種情況下,誤差項Sse分離不出來,無法作統(tǒng)計檢驗,只能直觀比較哪個水平好。若存在交互作用,就會迭加在其它列上,從而得到錯誤的結(jié)果。因此,若不能排除存在交互作用的可能,則應(yīng)利用L8(27)表。12345671111111121112222312211224122221152121212621221217221122182212112ColRow第27頁,共54頁,2024年2月25日,星期天表頭設(shè)計:首先將A、B放在第1,2列上,查交互作用表,他們的交互作用AB在第3列,因此,C因素不能放在第3列上,應(yīng)放在第4列上,AC放在第5列上,BC放在第6列上,ABC放在第7列上,真正安排時只用1,2,4列。若ABC不存在,則第7列可作為誤差e,這樣就得到了表頭設(shè)計如下:因素ABABCACBCe列號1234567第28頁,共54頁,2024年2月25日,星期天第二節(jié)描述性統(tǒng)計DescriptiveStatistics第29頁,共54頁,2024年2月25日,星期天一、試驗資料的性質(zhì)與分類1.數(shù)量性狀資料(quantitativetrait)采用計數(shù)和量測兩種方式所得到的數(shù)據(jù)。間斷性變數(shù)Discontinuousordiscretevariable連續(xù)性變數(shù)continuousvariable小麥基本苗數(shù)、菌落數(shù)、穗數(shù)、分孽數(shù)等等病斑長度、作物產(chǎn)量、株高、土壤水分含量等等第30頁,共54頁,2024年2月25日,星期天2.質(zhì)量性狀資料(qualitativetrait)觀察而不能量測性狀,如菌落的顏色、麥穗有無芒等等。統(tǒng)計次數(shù)法給分法統(tǒng)計具有某個性狀的個體數(shù)目及具有不同性狀的個體數(shù)目,按類別計其次數(shù)或相對次數(shù)給予每類性狀以相對數(shù)量的方法,如小麥籽粒有紅白兩種顏色,可用0表示白色,用1表示紅色第31頁,共54頁,2024年2月25日,星期天第32頁,共54頁,2024年2月25日,星期天二、次數(shù)分布表

將試驗所得到的大量未加整理的數(shù)據(jù),按觀察值大小或數(shù)據(jù)類別進(jìn)行分組,制成關(guān)于觀察值不同組別或不同分類單位的次數(shù)分布表,就可以看出資料中不同表現(xiàn)的觀察值與其頻率間的規(guī)律性,從而對資料有一個初步概念。第33頁,共54頁,2024年2月25日,星期天間斷性資料的整理參見P37表3.1。2.連續(xù)性資料的整理參加P38表3.4。3.屬性變數(shù)資料的整理在整理前,將資料按各種質(zhì)量性狀進(jìn)行分類,分類數(shù)等于組數(shù),然后根據(jù)各個體在質(zhì)量屬性上的具體表現(xiàn),分別歸入相應(yīng)的組中,即可以得到屬性分布的規(guī)律性認(rèn)識。第34頁,共54頁,2024年2月25日,星期天三、次數(shù)分圖條形圖(bardiagram)適合于間斷性變數(shù)和屬性資料陜西旬邑蘋果黑星病病葉率(以6月2日為1)第35頁,共54頁,2024年2月25日,星期天條形圖(bardiagram)適合于間斷性變數(shù)和屬性資料第36頁,共54頁,2024年2月25日,星期天多邊形圖(polygon)適合于連續(xù)性變數(shù)資料第37頁,共54頁,2024年2月25日,星期天方柱形圖(histogram)適合于連續(xù)性變數(shù)資料第38頁,共54頁,2024年2月25日,星期天餅圖(piediagram)適合于間斷性變數(shù)和屬性資料第39頁,共54頁,2024年2月25日,星期天餅圖(piediagram)適合于間斷性變數(shù)和屬性資料第40頁,共54頁,2024年2月25日,星期天106個棉花纖維長度數(shù)據(jù)分布有何特點?27.2527.6427.8227.9228.0428.2228.2228.3728.4428.4628.5528.5728.6128.6428.6828.6928.7328.7928.8228.8928.9128.9428.9629.0629.0629.1529.2129.2429.2429.2629.2929.3229.3329.3329.3829.3929.4129.4329.4529.4729.4829.5329.5829.5929.6629.6729.6729.6929.7229.7429.8629.8629.8829.8929.9129.9429.9729.9729.9929.9930.0030.0830.1230.1430.1630.1930.2230.2530.2730.2730.3330.3830.4130.4530.4730.4730.4830.5230.5230.5730.5830.6130.6230.6630.7430.7530.7530.7830.8530.8930.9230.9630.9731.0331.1531.1631.3231.3631.4431.5031.5831.6931.7131.9232.2432.3875%50%25%算數(shù)平均數(shù)觸須線Whisker第41頁,共54頁,2024年2月25日,星期天四、平均數(shù)算術(shù)平均數(shù)(arithmeticmean),Mean中數(shù)(median)Md眾數(shù)(mode),Mo幾何平均數(shù)(geometricmean),G第42頁,共54頁,2024年2月25日,星期天算術(shù)平均數(shù)的兩個重要特性:(1)離均差之和等于零。第43頁,共54頁,2024年2月25日,星期天(2)離均差平方和最小。設(shè)a為任意數(shù),但a不等于x的平均數(shù),則(為一定量,但)第44頁,共54頁,2024年2月25日,星期天樣本平均數(shù)一般用表示。n為觀察值的個數(shù)。總體平均數(shù)一般用表示。N為有限總體中觀察值的個數(shù)。第45頁,共54頁,2024年2月25日,星期天五、變異數(shù)極差(Range)R=Xmax-Xmin,當(dāng)n≤10時,常采用R來表示資料的變異度。例如兩個小麥品種的每穗小穗數(shù)見下表。品種每穗小穗數(shù)總和平均R甲131415171818192122231801810乙16161718181818192020180184

說明甲品種極差較乙品種的大,其變異范圍較大,平均數(shù)的代表較差;乙品種的極差較小,其變異幅度較小,平均數(shù)的代表性較好。極差只是兩個極端數(shù)據(jù)所決定的,沒有充分利用資料的全部信息,所以用它代表整個樣本的變異度是有缺陷的。第46頁,共54頁,2024年2月25日,星期天方差或均方(Variance)用觀察值數(shù)目除離均差平方和(簡稱平方和)。樣本均方(S2)

第47頁,共54頁,2024年2月25日,星期天總體方差(σ2)

方差是根據(jù)全部觀察值來度量資料的變異度的,是能夠正確反映資料的變異度的度量方法。第48頁,共54頁,2024年2月25日,星期天標(biāo)準(zhǔn)差(StandardDeviation)是方差的正根值,可以很好的表示資料的變異度,其單位與觀察值的度量單位相同。樣本標(biāo)準(zhǔn)差(S)總體標(biāo)準(zhǔn)差(σ)第49頁,共54頁,2024年2月25日,星期天自由度(degreeoffreedom,縮寫為DF或者df)解釋之一:對于一個具有n個觀察值的樣本,每個x與其平均數(shù)比較時,雖然具有n個離均差,但因受到離均差之和等于0的限制,所以只能有n-1個是自由的。例如:有5個觀察值,其4個的離均差為3,2,-3,6,則第5個離均差必定為-8

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論