




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第十五章抽樣調(diào)查第一節(jié)抽樣調(diào)查方案第二節(jié)常用抽樣方法的統(tǒng)計(jì)分析第三節(jié)樣本容量的估計(jì)第十五章抽樣調(diào)查第一節(jié)抽樣調(diào)查方案1第一節(jié)抽樣調(diào)查方案一、抽樣單位二、抽樣方法三、樣本容量四、確定抽樣方案的一些因素第一節(jié)抽樣調(diào)查方案一、抽樣單位2一、抽樣單位抽樣分?jǐn)?shù)(samplingfraction):指一個(gè)樣本所包含的抽樣單位數(shù)占其總體單位數(shù)的成數(shù)。田間抽樣調(diào)查的抽樣單位(sampleunit)是隨調(diào)查研究目的、作物種類(lèi)、病蟲(chóng)害種類(lèi)、生育時(shí)期、播種方法等因素而不同的,可以是一種自然的單位,也可以是若干個(gè)自然單位歸并成的單位,還可以用人為確定的大小、范圍或數(shù)量作為一個(gè)抽樣單位。
一、抽樣單位抽樣分?jǐn)?shù)(samplingfraction):3常用的抽樣單位舉例如下:
(1)面積如0.5平方米或每平方米內(nèi)的產(chǎn)量、株數(shù)、害蟲(chóng)頭數(shù)等。
(2)長(zhǎng)度如1~2行若干長(zhǎng)度內(nèi)的產(chǎn)量、株數(shù),若干長(zhǎng)度內(nèi)植株上的害蟲(chóng)頭數(shù)等。(3)株穴如棉花連續(xù)10株的結(jié)鈴數(shù),水稻連續(xù)20穴的苗數(shù)、分蘗數(shù)、結(jié)實(shí)粒數(shù)等。
常用的抽樣單位舉例如下:4(4)器官如稻、麥千粒重,大豆百粒重,每100個(gè)棉鈴中紅鈴蟲(chóng)頭數(shù),每張葉片的病斑數(shù)等。(5)時(shí)間如單位時(shí)間內(nèi)見(jiàn)到的蟲(chóng)子頭數(shù),每天開(kāi)始開(kāi)花的株數(shù)等。(6)器械如一捕蟲(chóng)網(wǎng)的蟲(chóng)數(shù),一只誘蛾燈下的蟲(chóng)數(shù),每一個(gè)顯微鏡視野內(nèi)的細(xì)菌數(shù)、孢子數(shù)、花粉發(fā)芽粒數(shù)等。(7)容量或重量如每升或每公斤種子內(nèi)的混雜種子數(shù),每升或每公斤種子內(nèi)的害蟲(chóng)頭數(shù)等。(8)其他如一個(gè)田塊、一個(gè)農(nóng)場(chǎng)等概念性的單位。(4)器官如稻、麥千粒重,大豆百粒重,每100個(gè)棉鈴中紅5二、抽樣方法基本的抽樣方法(samplingmethod)有以下三類(lèi):1.順序抽樣(systematicsampling)也稱(chēng)機(jī)械抽樣或系統(tǒng)抽樣,按照某種既定的順序抽取一定數(shù)量的抽樣單位組成樣本。
2.典型抽樣(typicalsampling)也稱(chēng)代表性抽樣,按調(diào)查研究目的從總體內(nèi)有意識(shí)地選取一定數(shù)二、抽樣方法基本的抽樣方法(samplingmethod)6量有代表性的抽樣單位,至少要求所選取的單位能代表總體的大多數(shù)。3.隨機(jī)抽樣(randomsampling)也稱(chēng)等概率抽樣,在抽取抽樣單位時(shí),總體內(nèi)各單位應(yīng)均有同等機(jī)會(huì)被抽取。
量有代表性的抽樣單位,至少要求所選取的單位能代表總體的大多數(shù)7
常用的順序抽樣方式田間試驗(yàn)15抽樣調(diào)查課件8三、樣本容量樣本容量(或樣本含量samplesize):指樣本所包括的抽樣單位數(shù)。樣本容量的大小與所獲抽樣調(diào)查結(jié)果的準(zhǔn)確度和精確度密切有關(guān)。
三、樣本容量樣本容量(或樣本含量samplesize):指9四、確定抽樣方案的一些因素設(shè)計(jì)抽樣方案時(shí)須考慮以下幾方面:(1)所要求的準(zhǔn)確度與精確度,要求高時(shí)樣本容量應(yīng)大。(2)是否需估計(jì)置信限或作統(tǒng)計(jì)推論,一般隨機(jī)抽樣有合理的試驗(yàn)誤差估計(jì),可以做統(tǒng)計(jì)推論。而其他抽樣方法往往缺乏合理的誤差估計(jì),統(tǒng)計(jì)分析有局限性。四、確定抽樣方案的一些因素設(shè)計(jì)抽樣方案時(shí)須考慮以下幾方面:10(3)與人力、物力、時(shí)間等條件相適應(yīng),抽樣單位大、樣本容量大、進(jìn)行總體編號(hào)等都是較費(fèi)事的,必須權(quán)衡需要與可能,在保證一定精確性的情況下,盡量減低消耗。(4)注意到調(diào)查研究對(duì)象的特點(diǎn)。(3)與人力、物力、時(shí)間等條件相適應(yīng),抽樣單位大、樣本容量11第二節(jié)常用抽樣方法的統(tǒng)計(jì)分析一、簡(jiǎn)單順序抽樣及簡(jiǎn)單典型抽樣法二、簡(jiǎn)單隨機(jī)抽樣法三、分層隨機(jī)抽樣法四、整群抽樣法五、分級(jí)隨機(jī)抽樣法六、雙重隨機(jī)抽樣法七、序貫抽樣法第二節(jié)常用抽樣方法的統(tǒng)計(jì)分析一、簡(jiǎn)單順序抽樣及簡(jiǎn)單典型抽12一、簡(jiǎn)單順序抽樣及簡(jiǎn)單典型抽樣法簡(jiǎn)單順序抽樣(simplesystematicsampling):通常只計(jì)算平均數(shù)作為總體的估計(jì)值。計(jì)算平均數(shù)的公式為:
一、簡(jiǎn)單順序抽樣及簡(jiǎn)單典型抽樣法簡(jiǎn)單順序抽樣(simple13[例15.1]設(shè)成熟期對(duì)水稻汕優(yōu)2號(hào)大田測(cè)產(chǎn),該田塊約5畝,生長(zhǎng)較均勻。采用棋盤(pán)式抽樣,10個(gè)點(diǎn),每點(diǎn)由12行間距計(jì)算平均行距。其中任選二行測(cè)查2m長(zhǎng)度內(nèi)的穴數(shù)及有效穗數(shù)。再在其中拔連續(xù)5穴,將稻穗分成大、中、小三級(jí),按比例選取20穗,結(jié)合考查其他性狀計(jì)數(shù)每穗總粒數(shù)及空癟粒數(shù),從而算出結(jié)實(shí)粒數(shù)。每點(diǎn)其余稻穗脫粒,稱(chēng)取千粒重。將10點(diǎn)數(shù)據(jù)匯總后求得每畝平均穴數(shù)4.2萬(wàn),每穴平均[例15.1]設(shè)成熟期對(duì)水稻汕優(yōu)2號(hào)大田測(cè)產(chǎn),該田塊約5畝,14有效穗數(shù)9.2個(gè),每穗平均結(jié)實(shí)粒數(shù)53.7粒,平均千粒重25.2克。計(jì)算平均數(shù)的公式為。本例中土地利用系數(shù)定為98%,則估計(jì)每畝產(chǎn)量為:
=513.75(kg/畝)
簡(jiǎn)單典型抽樣法的分析同樣只計(jì)算。有效穗數(shù)9.2個(gè),每穗平均結(jié)實(shí)粒數(shù)53.7粒,平均千粒重2515二、簡(jiǎn)單隨機(jī)抽樣法簡(jiǎn)單隨機(jī)抽樣(simplerandomsampling):每個(gè)抽樣單位具有相同概率被抽入樣本??傮w編號(hào)方法及隨機(jī)抽取方法依調(diào)查對(duì)象而定。[例15.2]設(shè)在一休閑地上調(diào)查小地蠶蟲(chóng)口密度每測(cè)框?yàn)?m2,隨機(jī)取30點(diǎn),調(diào)查結(jié)果列在表15.1。二、簡(jiǎn)單隨機(jī)抽樣法簡(jiǎn)單隨機(jī)抽樣(simplerandom16表15.130個(gè)單位的小地蠶幼蟲(chóng)頭數(shù)
每m2內(nèi)幼蟲(chóng)頭數(shù)(y)0123456789101112Σ單位數(shù)(個(gè))123844222100130fy02624162012141690012131fy20212726410072981288100144773(頭/㎡)(頭/㎡)(頭/㎡)表15.130個(gè)單位的小地蠶幼蟲(chóng)頭數(shù)每m2內(nèi)幼蟲(chóng)頭數(shù)(17
即該田塊小地蠶幼蟲(chóng)約為3.38~5.34(頭/㎡),折合每畝2253.4~3560.2頭,這個(gè)估計(jì)的可靠性為95%。以上將所調(diào)查研究的總體看為面積甚大的一個(gè)無(wú)限總體進(jìn)行分析,設(shè)若該30個(gè)單位從336㎡的一塊田中抽出,這時(shí)調(diào)查研究的總體實(shí)為一有限總體,有限總體的兩個(gè)參數(shù)為:平均數(shù)
(15·1)
(頭/㎡)(頭/㎡)18標(biāo)準(zhǔn)差N為總體內(nèi)單位數(shù),即總體容量。樣本估計(jì)值仍為及,但估計(jì)抽樣誤差時(shí)應(yīng)考慮到抽樣分?jǐn)?shù)的影響。
(15·3)(15·2)標(biāo)準(zhǔn)差(15·3)(15·2)19本例中(頭/㎡)該有限總體平均數(shù)的95%置信限為:(頭/㎡)即3.42~5.30(頭/㎡),折合每畝2280.0~3533.4頭。本例中20三、分層隨機(jī)抽樣法分層隨機(jī)抽樣法(stratifiedrandomsampling):從各個(gè)層次或段落分別進(jìn)行隨機(jī)抽樣或順序抽樣。三、分層隨機(jī)抽樣法分層隨機(jī)抽樣法(stratifiedra21分層隨機(jī)抽樣有三個(gè)步驟:(1)將所調(diào)查的總體按變異情況分為相對(duì)同質(zhì)的若干部分、地段等稱(chēng)為區(qū)層,各區(qū)層可以相等,也可以不等。
(2)獨(dú)立地從每一區(qū)層按所定樣本容量進(jìn)行隨機(jī)抽樣。各區(qū)層所抽單位數(shù)可以相同,也可以不同。分層隨機(jī)抽樣有三個(gè)步驟:22抽樣單位總數(shù)在各區(qū)層的分配有:①
比例配置法:指各區(qū)層大小不同時(shí)按區(qū)層在總體中的比例確定抽樣單位數(shù),若各區(qū)層大小相同,比例配置結(jié)果實(shí)際即為相等配置;②
最優(yōu)配置法:指根據(jù)各區(qū)層的大小、變異程度以及抽取一個(gè)單位的費(fèi)用綜合權(quán)衡,確定出抽樣誤差小、費(fèi)用低的配置方案。
抽樣單位總數(shù)在各區(qū)層的分配有:23(3)根據(jù)各區(qū)層的估計(jì)值,采用加權(quán)法估計(jì)總體參數(shù)。總平均數(shù):
(15·4)
總標(biāo)準(zhǔn)誤:
(3)根據(jù)各區(qū)層的估計(jì)值,采用加權(quán)法估計(jì)總體參數(shù)。24
若各區(qū)層總體方差相同,則
(15·5)(15·6)(15·5)(15·6)25若各區(qū)層抽樣單位數(shù)按區(qū)層比例配置,則
(15·7)其中
(15·8)若各區(qū)層抽樣單位數(shù)按區(qū)層比例配置,則(15·8)26四、整群抽樣法整群隨機(jī)抽樣法(randomgroupsampling):被抽取的整群中各抽樣單位都進(jìn)行調(diào)查,按群計(jì)算平均數(shù)及標(biāo)準(zhǔn)差,并估計(jì)其置信限。
四、整群抽樣法整群隨機(jī)抽樣法(randomgroups27[例15.4]設(shè)某農(nóng)場(chǎng)調(diào)查水稻螟害發(fā)生情況,在全場(chǎng)100個(gè)條田中隨機(jī)抽取9條做調(diào)查,每田塊采用平行線式取10點(diǎn),每點(diǎn)連續(xù)查20穴,經(jīng)初步整理后將結(jié)果列于15.2。某農(nóng)場(chǎng)螟害率抽樣調(diào)查結(jié)果田塊123456789調(diào)查莖稈數(shù)198020622154251223152098242118672248螟害莖稈數(shù)178211335345212238460119298螟害率%8.9910.2315.5513.749.1611.3419.006.3713.25[例15.4]設(shè)某農(nóng)場(chǎng)調(diào)查水稻螟害發(fā)生情況,在全場(chǎng)10028這資料以條田為抽樣單位進(jìn)行分析。這資料以條田為抽樣單位進(jìn)行分析。29全場(chǎng)100條田平均螟害率95%的可能在9.01~14.91%范圍內(nèi)。本例的總體實(shí)際上是一個(gè)N=100的有限總體,故更確切地應(yīng)為:即9.15~14.77(%)間。全場(chǎng)100條田平均螟害率95%的可能在9.01~14.91%30此外,本例是百分?jǐn)?shù)資料,如果田塊間的差異不大,可以采用百分?jǐn)?shù)資料的分析方法,即由總調(diào)查莖稈數(shù)和總螟害莖稈數(shù)求出總螟害率
,得
這樣,
即11.69~12.59(%)。這個(gè)區(qū)間比前面所估小得多,這是因?yàn)榍懊嬉蕴飰K為抽樣單位,而不是以此外,本例是百分?jǐn)?shù)資料,如果田塊間的差異不大,可以采用百分?jǐn)?shù)31莖稈為單位,除了有莖稈受害與否的隨機(jī)誤差外,還包含有田塊間的差異,所以此處不宜采用百分?jǐn)?shù)的誤差估計(jì)方法。莖稈為單位,除了有莖稈受害與否的隨機(jī)誤差外,還包含有田塊間的32五、分級(jí)隨機(jī)抽樣法巢式隨機(jī)抽樣法(nestedrandomsampling):最簡(jiǎn)單的是二級(jí)隨機(jī)抽樣。例如全區(qū)的棉花結(jié)鈴數(shù),可以在區(qū)內(nèi)隨機(jī)抽取幾個(gè)鄉(xiāng),鄉(xiāng)內(nèi)隨機(jī)抽取若干戶(hù)進(jìn)行調(diào)查。這時(shí),鄉(xiāng)為初級(jí)抽樣單位,戶(hù)為次級(jí)抽樣單位。又例如研究農(nóng)藥在葉面上的殘留量,第一步隨機(jī)抽取單株,第二步在單株上隨機(jī)抽取葉片,分別作為初級(jí)和次數(shù)抽樣單位。五、分級(jí)隨機(jī)抽樣法巢式隨機(jī)抽樣法(nestedrandom33表15.3某農(nóng)藥殘留量分析結(jié)果及其方差分析
植株各葉片內(nèi)的殘留量(單位數(shù))合計(jì)平均13.283.093.033.0312.433.1123.523.483.383.3813.763.4432.882.802.812.7611.252.8143.343.383.233.2613.213.30變異來(lái)源自由度均方所估計(jì)的方差分量F植株間3MSB=0.2961*44.9F0.05(3,12)=3.49株內(nèi)葉片間12MSA=0.0066表15.3某農(nóng)藥殘留量分析結(jié)果及其方差分析34巢式隨機(jī)抽樣數(shù)據(jù)可以應(yīng)用方差分析法算出各階段的抽樣誤差,從而估計(jì)平均數(shù)的標(biāo)準(zhǔn)誤。二級(jí)抽樣的公式如下:
(15·13)其中,k=初級(jí)抽樣單位數(shù),n=次級(jí)抽樣單位數(shù)。
(15·14)
、分別為次級(jí)和初級(jí)抽樣誤差的估計(jì)值。
巢式隨機(jī)抽樣數(shù)據(jù)可以應(yīng)用方差分析法算出各階段的抽樣誤差,從而35二級(jí)抽樣的數(shù)據(jù)按單向分組的組次數(shù)相等(也可能不相等)的隨機(jī)模型進(jìn)行方差分析。例題中k=4,n=4,方差分析結(jié)果F=0.2961/0.0066=44.9,說(shuō)明植株間的誤差顯著大于株內(nèi)葉片間的誤差。這二個(gè)階段的抽樣誤差是不同的,應(yīng)該分別估計(jì)。但此處若將kn=4×4=16張葉片直接計(jì)算其方差則為0.0645。比扣除株間誤差后剩余的株內(nèi)葉片間誤差0.0066大得多。二級(jí)抽樣的數(shù)據(jù)按單向分組的組次數(shù)相等(也可能不相等)的隨機(jī)模36[例15.5]表15.3數(shù)據(jù)的分析結(jié)果:(單位)
(單位)2
(單位)
(單位)
此處DF=3,因由均方MSB計(jì)算。若只從1個(gè)初級(jí)單位估計(jì)置信限,如以株為單位作估計(jì),則:[例15.5]表15.3數(shù)據(jù)的分析結(jié)果:(單位)(單位37(單位)2
(單位)
(單位)由一株四張葉片估計(jì),比四株16張葉片估計(jì),誤差要大得多。若每株只取一張葉片,四株共取4張葉片,則(單位)2(單位)(單位)由一株四張葉片估計(jì),比四38(單位)
所以,同樣測(cè)定4張葉片,從1株上取與從4株上取,抽樣誤差是不同的,今后對(duì)此材料抽樣測(cè)定時(shí),應(yīng)多取植株,每株上可以少取一些葉片。(單位)所以,同樣測(cè)定4張葉片,從1株上取與從4株上取,39三級(jí)抽樣時(shí)的情況為:、、依次為三級(jí)、二級(jí)及一級(jí)抽樣單位的抽樣誤差,分別抽取n、k、l個(gè)不同級(jí)別的抽樣單位,則所獲樣本平均數(shù)的抽樣誤差為
獲得后,其總體平均數(shù)的置信區(qū)間的計(jì)算方法與前相同。(15·15)三級(jí)抽樣時(shí)的情況為:(15·15)40六、雙重隨機(jī)抽樣法雙重抽樣法(doublesampling):亦稱(chēng)相關(guān)抽樣法。若所要調(diào)查的性狀y是不易觀察測(cè)定,甚至對(duì)觀察材料要破壞后方能測(cè)定的,而試驗(yàn)又不容許將材料破壞,這時(shí)可以利用和所要調(diào)查的性狀有密切相關(guān)關(guān)系的另一便于測(cè)定的性狀x進(jìn)行間接的抽樣調(diào)查,按確定的相關(guān)關(guān)系從x的調(diào)查結(jié)果推算y的結(jié)果。
六、雙重隨機(jī)抽樣法雙重抽樣法(doublesampling411.做一次隨機(jī)抽樣,調(diào)查y和x兩種性狀,從中求出y依x的回歸方程。這個(gè)樣本容量n不一定很大,但希望x和y有較大的幅度。
1.做一次隨機(jī)抽樣,調(diào)查y和x兩種性狀,從中求出y依x422.對(duì)總體進(jìn)行x的抽樣調(diào)查,設(shè)樣本容量為m,按以上建立的回歸關(guān)系從推算的標(biāo)準(zhǔn)誤的近似式:(15·16)
2.對(duì)總體進(jìn)行x的抽樣調(diào)查,設(shè)樣本容量為m,按以上建立的回歸43采用雙重抽樣法,必須注意y和x兩性狀間不但要有顯著相關(guān),而且須有高程度顯著相關(guān),才能獲得比較準(zhǔn)確的結(jié)果,所以在建立回歸方程時(shí)要檢驗(yàn)其相關(guān)系數(shù)的大小及顯著性。采用雙重抽樣法,必須注意y和x兩性狀間不但要有顯著相44七、序貫抽樣法序貫抽樣法(sequentialsampling):根據(jù)逐個(gè)抽樣單位調(diào)查累積的信息,在抽樣過(guò)程中當(dāng)機(jī)確定樣本容量。
七、序貫抽樣法序貫抽樣法(sequentialsampl45序貫抽樣法的基本步驟:(1)確定作為“推斷”所依據(jù)的兩個(gè)標(biāo)準(zhǔn),P0與P1,此處P0=0.50(即50%)、P1=0.75(即75%)分別代表不符控制要求(必須治蟲(chóng))及符合控制要求(不必打藥)的兩個(gè)界限。(2)確定“推斷”的可靠程度的兩個(gè)概率標(biāo)準(zhǔn)與,表示總體百分?jǐn)?shù)P<P0而誤以為P<P1的序貫抽樣法的基本步驟:46險(xiǎn),表示總體P>P1而誤以為P<P0的風(fēng)險(xiǎn)。(3)估計(jì)總體分布類(lèi)型,計(jì)算出兩條平行的控制線。當(dāng)總體為二項(xiàng)式分布時(shí)。兩條控制線為下式:(15·17)
險(xiǎn),表示總體P>P1而誤以為P<P0的風(fēng)險(xiǎn)。47(4)將(15·17)的計(jì)算結(jié)果畫(huà)成序貫抽樣控制圖。橫坐標(biāo)為m,縱坐標(biāo)為h。
(5)進(jìn)行實(shí)際抽樣調(diào)查,將逐個(gè)抽樣單位測(cè)定的累計(jì)數(shù)m及h(完好穗數(shù))在坐標(biāo)圖上標(biāo)記。
(6)有時(shí)總體P可能在P0與P1之間,需預(yù)先計(jì)算一個(gè)推斷所需最大樣本容量E(m)。
(4)將(15·17)的計(jì)算結(jié)果畫(huà)成序貫抽樣控制圖。橫坐48當(dāng)總體屬二項(xiàng)式分布時(shí):
[例15.7]設(shè)按上述方法對(duì)玉米完好穗率進(jìn)行調(diào)查,以確定是否需要繼續(xù)用藥。此時(shí)確定P0=0.50,即完好穗率低于50%一定要防治;P1=0.75,即完好穗高于75%不再防治。=0.10,即應(yīng)該防治而誤以為不需防治的風(fēng)險(xiǎn)允許為0.10;=0.10,即不需防治(15·18)當(dāng)總體屬二項(xiàng)式分布時(shí):(15·18)49而誤以為要防治的風(fēng)險(xiǎn)允許為0.10;玉米完好穗率總體分布估計(jì)為二項(xiàng)式分布。
由(15·17)計(jì)得ha和hr的截距及斜率分別為:
ha截距
而誤以為要防治的風(fēng)險(xiǎn)允許為0.10;玉米完好穗率總體分布估計(jì)50
hr截距
斜率因而兩條控制線為:
由(15·18)得:hr截距斜率因而兩條控制線為:51
說(shuō)明推斷所需最大樣本容量為測(cè)定18株。將計(jì)算結(jié)果畫(huà)成圖15.2中兩條回歸線。經(jīng)田間逐穗實(shí)際測(cè)查結(jié)果列于表15.4。
52
圖15.2玉米完好穗率序貫抽樣控制圖圖15.2玉米完好穗率序貫抽樣控制圖53測(cè)查至m=18時(shí),h=9,超出界外,抽樣停止,因h<ha(ha=-2.00+0.631×18=9.36),故推論為總體完好穗率在50%以下,所以需要防治。本例恰好抽樣至E(m)=18時(shí)才作出推斷,這是因?yàn)榭傮w完好穗率與“推斷”所依據(jù)的兩個(gè)標(biāo)準(zhǔn)P0,P1很相近,如果相差較大,則測(cè)查穗數(shù)m小于18,便能作出推斷。累計(jì)測(cè)查穗數(shù)(m)123456789101112131415161718累計(jì)完好穗數(shù)(h)012234556667778899表15.4玉米完好穗數(shù)序貫抽樣結(jié)果累計(jì)測(cè)查穗數(shù)(m)12345678910111213141554設(shè)若將及均定為0.05,P0及P1不變,則:
ha=-2.68+0.631m
hr=2.68+0.631m
E(m)=30.85兩條平行線的間距增寬了,推斷所需最大樣本容量也增加了。又設(shè)若將、均定為0.05,P0=0.50,P1=0.60,則
ha=-7.26+0.550m
設(shè)若將及均定為0.05,P0及P1不變,則:55hr=7.26+0.550m
E(m)=213.08兩條平行線的間距更寬了,推斷所需最大樣本容量也更大了。這里說(shuō)明序貫抽樣法中有效確定、、P0、P1值對(duì)提高工作效率是很重要的。這需要依據(jù)專(zhuān)業(yè)知識(shí)確定。上例因估計(jì)總體是二項(xiàng)式分布。如果總體不是二項(xiàng)式分布而屬泊松(Poisson)分布則:hr=7.26+0.550m56(15·19)
(15·19)中l(wèi)n為自然對(duì)數(shù)的符號(hào),與為“推斷”所依據(jù)的兩個(gè)標(biāo)準(zhǔn)。例如每公斤種子含某種雜草種子在一粒以下便調(diào)進(jìn),若在三粒以上便拒絕,這時(shí)因每公斤種子中含某種雜草種子數(shù)是泊松分布,=1,=3。設(shè)若=0.1,=0.1,則:田間試驗(yàn)15抽樣調(diào)查課件57
ha截距
hr截距
斜率
ha截距hr截距斜率58“推斷”所需平均樣本容量,b<b0及b>b1時(shí)不同。
(15·20)“推斷”所需平均樣本容量,b<b0及b>b1時(shí)不同。(15·59此處:說(shuō)明平均抽取2個(gè)抽樣單位即可獲得推斷。若實(shí)踐中抽樣至3×1.95=6個(gè)抽樣單位尚無(wú)結(jié)果,則可停止抽樣。計(jì)取這6個(gè)抽樣單位的平均數(shù),若偏向則推斷為可調(diào)進(jìn),若偏向b,則推斷為拒絕調(diào)進(jìn)。此處:60
圖15.3雜草種子容量序貫抽樣控制圖圖15.3雜草種子容量序貫抽樣控制圖61第三節(jié)樣本容量的估計(jì)一、簡(jiǎn)單一級(jí)抽樣樣本容量的估計(jì)二、分層抽樣樣本容量的估計(jì)三、二級(jí)或多級(jí)抽樣樣本容量的估計(jì)四、抽樣單位大小與樣本容量的相互決定第三節(jié)樣本容量的估計(jì)一、簡(jiǎn)單一級(jí)抽樣樣本容量的估計(jì)62一、簡(jiǎn)單一級(jí)抽樣樣本容量的估計(jì)簡(jiǎn)單一級(jí)抽樣主要指簡(jiǎn)單隨機(jī)抽樣。在估計(jì)其樣本容量時(shí),首先要對(duì)調(diào)查對(duì)象的標(biāo)準(zhǔn)差做出估計(jì),并提出預(yù)定準(zhǔn)確度和置信系數(shù)的要求,然后據(jù)此以確定樣本容量。
一、簡(jiǎn)單一級(jí)抽樣樣本容量的估計(jì)簡(jiǎn)單一級(jí)抽樣主要指簡(jiǎn)單隨機(jī)抽樣63因?yàn)槠渲衝'為待定的樣本容量。
經(jīng)變項(xiàng),得:
(15·21)因?yàn)?15·21)64
(15·21)中
代表預(yù)定的準(zhǔn)確度要求,即指要求所得的樣本平均數(shù)與總體平均數(shù)相差不超過(guò)給定的量。若s估計(jì)值來(lái)自大樣本,則95%置信系數(shù)下t≈2,所以,(15·22)有時(shí)沒(méi)有大樣本的s值可借用,這時(shí)可通過(guò)平均全距(或平均極差)估計(jì)s值,(15·21)中代表預(yù)定的準(zhǔn)確65
式中為k個(gè)容量為n的小樣本極差的平均值,c為折算系數(shù)(表15.6),t由(表15.6)中的自由度估計(jì)值()及置信系數(shù)決定。
(15·24)(15·23)
66若總體屬有限性時(shí),估計(jì)的抽樣誤差應(yīng)按(15·3)用抽樣分?jǐn)?shù)作矯正,因而(15·21)將變?yōu)椋鹤冺?xiàng)合并后:
(15·25)
若總體屬有限性時(shí),估計(jì)的抽樣誤差應(yīng)按(15·3)用抽樣分?jǐn)?shù)作67如果N很大時(shí),可計(jì)算其近似值,即(15·21):
如n0/N比數(shù)不大,可采用n0為近似值,否則須計(jì)算值:
抽樣單位數(shù)()是隨變異程度(s2)和置信概率()兩者的增加而增加,同時(shí)隨容許誤差(d)數(shù)值的減少(15·26)如果N很大時(shí),可計(jì)算其近似值,即(15·21):(168
而增加的。二、分層抽樣樣本容量的估計(jì)
1.比例配置法若各區(qū)層比例為,則當(dāng)總樣本容量為
時(shí),各區(qū)層樣本容量可按
進(jìn)行分配,因此只要估計(jì)出,便可確定各區(qū)層的。
而增加的。69因?yàn)?,則。
若令,則稱(chēng)V為一定置信系數(shù)下的樣本必需方差。得比例配置法的分層抽樣樣本容量的近似公式為:
(15·27)(15·28)
因?yàn)椋瑒t70若抽樣分?jǐn)?shù)極小,則≈。
2.最優(yōu)配置法其基本出發(fā)點(diǎn)是區(qū)層大、誤差大的應(yīng)安排較多抽樣單位,區(qū)層小、誤差小的可少安排抽樣單位。Neyman證實(shí)若按區(qū)層大小與區(qū)層標(biāo)準(zhǔn)差乘積分配抽樣單位可使樣本平均數(shù)具有最小方差,因而稱(chēng)之為最優(yōu)配置。
若抽樣分?jǐn)?shù)極小,則≈。71各區(qū)層抽樣單位數(shù):
(15·29)最優(yōu)配置法分層抽樣樣本容量估計(jì)的近似公式為:
(15·30)(15·31)抽樣分?jǐn)?shù)極小時(shí),≈。
各區(qū)層抽樣單位數(shù):72三、二級(jí)或多級(jí)抽樣樣本容量的估計(jì)設(shè)第二級(jí)和第一級(jí)抽樣誤差的估計(jì)值為及,待定的抽樣方案中第一級(jí)樣本容量為,第二級(jí)樣本容量為,則所待抽取的樣本平均數(shù)標(biāo)準(zhǔn)誤將為:
(15·32)
三、二級(jí)或多級(jí)抽樣樣本容量的估計(jì)設(shè)第二級(jí)和第一級(jí)抽樣誤差的估73所以,
(15·33)
(15·34)在能假定較大時(shí),可用作近似估計(jì)。否則需用假定自由度下的t值。設(shè)抽取第一級(jí)單位(植株)的費(fèi)用為CB,抽取第二級(jí)單位(葉片)的費(fèi)用為CA,則抽取單位的費(fèi)用為:
所以,74
(15·35)
若將(15·32)與(15·35)相乘,則:
(15·36)當(dāng)最小時(shí),其微分:
75得:
此時(shí)為最佳第二級(jí)抽樣單位數(shù)。3級(jí)抽樣時(shí),可根據(jù)3級(jí)抽樣試驗(yàn)進(jìn)行3級(jí)巢式數(shù)據(jù)方差分析,從而估計(jì)出一、二、三3級(jí)抽樣誤差為、、,(15·37)得:(15·37)76(15·38)通過(guò),推導(dǎo)出
、、間的關(guān)系式。若
(15·39)田間試驗(yàn)15抽樣調(diào)查課件77求為最小值時(shí)的解:
(15·40)(15·41)
求出及后,再代入中解出。求為最小值時(shí)的解:78四、抽樣單位大小與樣本容量的相互決定一些抽樣方案中抽樣單位是定性的,例如種子含油量的測(cè)定,另一些抽樣方案中,抽樣單位是定量的,例如測(cè)定田間穗數(shù)。抽樣方案中便須權(quán)衡用大抽樣單位少樣本容量合適,還是用小抽樣單位大樣本容量合適,何者精確度高、花費(fèi)少。這時(shí)便須考慮抽樣單位大小與樣本容量的相互決定問(wèn)題。四、抽樣單位大小與樣本容量的相互決定一些抽樣方案中抽樣單位79[例15.14]研究田間麥穗數(shù)抽樣調(diào)查中抽樣單位大小與樣本容量的抽樣誤差,在3塊大小相同的田內(nèi)進(jìn)行調(diào)查,每塊田分為16小塊,每小塊中隨機(jī)定1樣點(diǎn),每樣點(diǎn)調(diào)查1m行長(zhǎng),1行的穗數(shù),順序查平行6行,按次序記錄。所獲數(shù)據(jù)共有3×16=48個(gè)樣點(diǎn),48×6個(gè)每m穗數(shù)記錄。這里將3塊田看為3個(gè)相等的區(qū)層,每區(qū)層中樣點(diǎn)看作為一級(jí)抽樣單位,每樣點(diǎn)內(nèi)1行看為1個(gè)二級(jí)抽樣單位,抽樣單位大小為1行。[例15.14]研究田間麥穗數(shù)抽樣調(diào)查中抽樣單位大小與80若將相鄰2行依次合并,二級(jí)抽樣單位大小為2行。若將相鄰3行分別合并,則二級(jí)抽樣單位大小為3行。因此同一組數(shù)據(jù)可以用以估計(jì)一級(jí)單位的抽樣誤差,不同大小二級(jí)單位的抽樣誤差,以這些誤差估計(jì)值為依據(jù),可制訂今后麥田穗數(shù)調(diào)查的抽樣方案。若將相鄰2行依次合并,二級(jí)抽樣單位大小為2行。若將相鄰3行分81變異來(lái)源DFSSMSEMS方差估計(jì)值
田塊間3-1=218589.789294.89
田塊內(nèi)樣點(diǎn)間3(16-1)=45107403.442386.74*
樣點(diǎn)內(nèi)二級(jí)單位間(1行)3×16(6-1)=240211374.78880.73
3×16(3-1)=96114597.671193.73*
3×16×3(2-1)=14496777.11672.06
3×16(2-1)=4876014.041583.62*
3×16×2(3-1)=192135360.74705.00
總3×16×6-1=287337368.00表15.9麥田穗數(shù)抽樣方案研究方差分析表變異來(lái)源DFSSMSEMS方差估計(jì)值
田塊間382表15.9中,為樣點(diǎn)間抽樣誤差的估計(jì)值;、、分別為二級(jí)抽樣單位是1行、2行、3行的抽樣誤差估計(jì)值。此調(diào)查研究為二級(jí)抽樣,按(15·23)及(15·35):1行單位時(shí),,若2行單位時(shí),,若
3行單位時(shí),,若
表15.9中,為樣點(diǎn)間抽樣誤差的估計(jì)值;、、83
則由(15·37)得:1行單位時(shí),2行單位時(shí),3行單位時(shí),則由(15·37)得:2行單位時(shí),3行單位時(shí),84以上假定2行單位及3行單位的化費(fèi)或工作量分別為1行單位的2倍及3倍。由以上分析,麥田穗數(shù)抽樣中,1行單位的抽樣誤差為880.73,2行單位的為260.84,3行單位的為298.87。抽樣單位較大時(shí)抽樣誤差較小,但三者中以2行單位的抽樣誤差最小。結(jié)合抽樣單位的花費(fèi)考慮,在二級(jí)抽樣單位分別為1、2、3行大小以上假定2行單位及3行單位的化費(fèi)或工作量分別為1行單位的2倍85時(shí)其最佳二級(jí)抽樣單位數(shù)分別為、、,三者公因子為,因而可作相互比較。
相同準(zhǔn)確度和精確度要求下最佳第二級(jí)1行、2行、3行抽樣單位的實(shí)際工作量為1.873∶0.721×2∶0.624×3=1.873∶1.442∶1.8722行單位的工作量最小,因而綜合及的信息,二級(jí)抽樣單位以2行為較合適。時(shí)其最佳二級(jí)抽樣單位數(shù)分別為、86第十五章抽樣調(diào)查第一節(jié)抽樣調(diào)查方案第二節(jié)常用抽樣方法的統(tǒng)計(jì)分析第三節(jié)樣本容量的估計(jì)第十五章抽樣調(diào)查第一節(jié)抽樣調(diào)查方案87第一節(jié)抽樣調(diào)查方案一、抽樣單位二、抽樣方法三、樣本容量四、確定抽樣方案的一些因素第一節(jié)抽樣調(diào)查方案一、抽樣單位88一、抽樣單位抽樣分?jǐn)?shù)(samplingfraction):指一個(gè)樣本所包含的抽樣單位數(shù)占其總體單位數(shù)的成數(shù)。田間抽樣調(diào)查的抽樣單位(sampleunit)是隨調(diào)查研究目的、作物種類(lèi)、病蟲(chóng)害種類(lèi)、生育時(shí)期、播種方法等因素而不同的,可以是一種自然的單位,也可以是若干個(gè)自然單位歸并成的單位,還可以用人為確定的大小、范圍或數(shù)量作為一個(gè)抽樣單位。
一、抽樣單位抽樣分?jǐn)?shù)(samplingfraction):89常用的抽樣單位舉例如下:
(1)面積如0.5平方米或每平方米內(nèi)的產(chǎn)量、株數(shù)、害蟲(chóng)頭數(shù)等。
(2)長(zhǎng)度如1~2行若干長(zhǎng)度內(nèi)的產(chǎn)量、株數(shù),若干長(zhǎng)度內(nèi)植株上的害蟲(chóng)頭數(shù)等。(3)株穴如棉花連續(xù)10株的結(jié)鈴數(shù),水稻連續(xù)20穴的苗數(shù)、分蘗數(shù)、結(jié)實(shí)粒數(shù)等。
常用的抽樣單位舉例如下:90(4)器官如稻、麥千粒重,大豆百粒重,每100個(gè)棉鈴中紅鈴蟲(chóng)頭數(shù),每張葉片的病斑數(shù)等。(5)時(shí)間如單位時(shí)間內(nèi)見(jiàn)到的蟲(chóng)子頭數(shù),每天開(kāi)始開(kāi)花的株數(shù)等。(6)器械如一捕蟲(chóng)網(wǎng)的蟲(chóng)數(shù),一只誘蛾燈下的蟲(chóng)數(shù),每一個(gè)顯微鏡視野內(nèi)的細(xì)菌數(shù)、孢子數(shù)、花粉發(fā)芽粒數(shù)等。(7)容量或重量如每升或每公斤種子內(nèi)的混雜種子數(shù),每升或每公斤種子內(nèi)的害蟲(chóng)頭數(shù)等。(8)其他如一個(gè)田塊、一個(gè)農(nóng)場(chǎng)等概念性的單位。(4)器官如稻、麥千粒重,大豆百粒重,每100個(gè)棉鈴中紅91二、抽樣方法基本的抽樣方法(samplingmethod)有以下三類(lèi):1.順序抽樣(systematicsampling)也稱(chēng)機(jī)械抽樣或系統(tǒng)抽樣,按照某種既定的順序抽取一定數(shù)量的抽樣單位組成樣本。
2.典型抽樣(typicalsampling)也稱(chēng)代表性抽樣,按調(diào)查研究目的從總體內(nèi)有意識(shí)地選取一定數(shù)二、抽樣方法基本的抽樣方法(samplingmethod)92量有代表性的抽樣單位,至少要求所選取的單位能代表總體的大多數(shù)。3.隨機(jī)抽樣(randomsampling)也稱(chēng)等概率抽樣,在抽取抽樣單位時(shí),總體內(nèi)各單位應(yīng)均有同等機(jī)會(huì)被抽取。
量有代表性的抽樣單位,至少要求所選取的單位能代表總體的大多數(shù)93
常用的順序抽樣方式田間試驗(yàn)15抽樣調(diào)查課件94三、樣本容量樣本容量(或樣本含量samplesize):指樣本所包括的抽樣單位數(shù)。樣本容量的大小與所獲抽樣調(diào)查結(jié)果的準(zhǔn)確度和精確度密切有關(guān)。
三、樣本容量樣本容量(或樣本含量samplesize):指95四、確定抽樣方案的一些因素設(shè)計(jì)抽樣方案時(shí)須考慮以下幾方面:(1)所要求的準(zhǔn)確度與精確度,要求高時(shí)樣本容量應(yīng)大。(2)是否需估計(jì)置信限或作統(tǒng)計(jì)推論,一般隨機(jī)抽樣有合理的試驗(yàn)誤差估計(jì),可以做統(tǒng)計(jì)推論。而其他抽樣方法往往缺乏合理的誤差估計(jì),統(tǒng)計(jì)分析有局限性。四、確定抽樣方案的一些因素設(shè)計(jì)抽樣方案時(shí)須考慮以下幾方面:96(3)與人力、物力、時(shí)間等條件相適應(yīng),抽樣單位大、樣本容量大、進(jìn)行總體編號(hào)等都是較費(fèi)事的,必須權(quán)衡需要與可能,在保證一定精確性的情況下,盡量減低消耗。(4)注意到調(diào)查研究對(duì)象的特點(diǎn)。(3)與人力、物力、時(shí)間等條件相適應(yīng),抽樣單位大、樣本容量97第二節(jié)常用抽樣方法的統(tǒng)計(jì)分析一、簡(jiǎn)單順序抽樣及簡(jiǎn)單典型抽樣法二、簡(jiǎn)單隨機(jī)抽樣法三、分層隨機(jī)抽樣法四、整群抽樣法五、分級(jí)隨機(jī)抽樣法六、雙重隨機(jī)抽樣法七、序貫抽樣法第二節(jié)常用抽樣方法的統(tǒng)計(jì)分析一、簡(jiǎn)單順序抽樣及簡(jiǎn)單典型抽98一、簡(jiǎn)單順序抽樣及簡(jiǎn)單典型抽樣法簡(jiǎn)單順序抽樣(simplesystematicsampling):通常只計(jì)算平均數(shù)作為總體的估計(jì)值。計(jì)算平均數(shù)的公式為:
一、簡(jiǎn)單順序抽樣及簡(jiǎn)單典型抽樣法簡(jiǎn)單順序抽樣(simple99[例15.1]設(shè)成熟期對(duì)水稻汕優(yōu)2號(hào)大田測(cè)產(chǎn),該田塊約5畝,生長(zhǎng)較均勻。采用棋盤(pán)式抽樣,10個(gè)點(diǎn),每點(diǎn)由12行間距計(jì)算平均行距。其中任選二行測(cè)查2m長(zhǎng)度內(nèi)的穴數(shù)及有效穗數(shù)。再在其中拔連續(xù)5穴,將稻穗分成大、中、小三級(jí),按比例選取20穗,結(jié)合考查其他性狀計(jì)數(shù)每穗總粒數(shù)及空癟粒數(shù),從而算出結(jié)實(shí)粒數(shù)。每點(diǎn)其余稻穗脫粒,稱(chēng)取千粒重。將10點(diǎn)數(shù)據(jù)匯總后求得每畝平均穴數(shù)4.2萬(wàn),每穴平均[例15.1]設(shè)成熟期對(duì)水稻汕優(yōu)2號(hào)大田測(cè)產(chǎn),該田塊約5畝,100有效穗數(shù)9.2個(gè),每穗平均結(jié)實(shí)粒數(shù)53.7粒,平均千粒重25.2克。計(jì)算平均數(shù)的公式為。本例中土地利用系數(shù)定為98%,則估計(jì)每畝產(chǎn)量為:
=513.75(kg/畝)
簡(jiǎn)單典型抽樣法的分析同樣只計(jì)算。有效穗數(shù)9.2個(gè),每穗平均結(jié)實(shí)粒數(shù)53.7粒,平均千粒重25101二、簡(jiǎn)單隨機(jī)抽樣法簡(jiǎn)單隨機(jī)抽樣(simplerandomsampling):每個(gè)抽樣單位具有相同概率被抽入樣本??傮w編號(hào)方法及隨機(jī)抽取方法依調(diào)查對(duì)象而定。[例15.2]設(shè)在一休閑地上調(diào)查小地蠶蟲(chóng)口密度每測(cè)框?yàn)?m2,隨機(jī)取30點(diǎn),調(diào)查結(jié)果列在表15.1。二、簡(jiǎn)單隨機(jī)抽樣法簡(jiǎn)單隨機(jī)抽樣(simplerandom102表15.130個(gè)單位的小地蠶幼蟲(chóng)頭數(shù)
每m2內(nèi)幼蟲(chóng)頭數(shù)(y)0123456789101112Σ單位數(shù)(個(gè))123844222100130fy02624162012141690012131fy20212726410072981288100144773(頭/㎡)(頭/㎡)(頭/㎡)表15.130個(gè)單位的小地蠶幼蟲(chóng)頭數(shù)每m2內(nèi)幼蟲(chóng)頭數(shù)(103
即該田塊小地蠶幼蟲(chóng)約為3.38~5.34(頭/㎡),折合每畝2253.4~3560.2頭,這個(gè)估計(jì)的可靠性為95%。以上將所調(diào)查研究的總體看為面積甚大的一個(gè)無(wú)限總體進(jìn)行分析,設(shè)若該30個(gè)單位從336㎡的一塊田中抽出,這時(shí)調(diào)查研究的總體實(shí)為一有限總體,有限總體的兩個(gè)參數(shù)為:平均數(shù)
(15·1)
(頭/㎡)(頭/㎡)104標(biāo)準(zhǔn)差N為總體內(nèi)單位數(shù),即總體容量。樣本估計(jì)值仍為及,但估計(jì)抽樣誤差時(shí)應(yīng)考慮到抽樣分?jǐn)?shù)的影響。
(15·3)(15·2)標(biāo)準(zhǔn)差(15·3)(15·2)105本例中(頭/㎡)該有限總體平均數(shù)的95%置信限為:(頭/㎡)即3.42~5.30(頭/㎡),折合每畝2280.0~3533.4頭。本例中106三、分層隨機(jī)抽樣法分層隨機(jī)抽樣法(stratifiedrandomsampling):從各個(gè)層次或段落分別進(jìn)行隨機(jī)抽樣或順序抽樣。三、分層隨機(jī)抽樣法分層隨機(jī)抽樣法(stratifiedra107分層隨機(jī)抽樣有三個(gè)步驟:(1)將所調(diào)查的總體按變異情況分為相對(duì)同質(zhì)的若干部分、地段等稱(chēng)為區(qū)層,各區(qū)層可以相等,也可以不等。
(2)獨(dú)立地從每一區(qū)層按所定樣本容量進(jìn)行隨機(jī)抽樣。各區(qū)層所抽單位數(shù)可以相同,也可以不同。分層隨機(jī)抽樣有三個(gè)步驟:108抽樣單位總數(shù)在各區(qū)層的分配有:①
比例配置法:指各區(qū)層大小不同時(shí)按區(qū)層在總體中的比例確定抽樣單位數(shù),若各區(qū)層大小相同,比例配置結(jié)果實(shí)際即為相等配置;②
最優(yōu)配置法:指根據(jù)各區(qū)層的大小、變異程度以及抽取一個(gè)單位的費(fèi)用綜合權(quán)衡,確定出抽樣誤差小、費(fèi)用低的配置方案。
抽樣單位總數(shù)在各區(qū)層的分配有:109(3)根據(jù)各區(qū)層的估計(jì)值,采用加權(quán)法估計(jì)總體參數(shù)??偲骄鶖?shù):
(15·4)
總標(biāo)準(zhǔn)誤:
(3)根據(jù)各區(qū)層的估計(jì)值,采用加權(quán)法估計(jì)總體參數(shù)。110
若各區(qū)層總體方差相同,則
(15·5)(15·6)(15·5)(15·6)111若各區(qū)層抽樣單位數(shù)按區(qū)層比例配置,則
(15·7)其中
(15·8)若各區(qū)層抽樣單位數(shù)按區(qū)層比例配置,則(15·8)112四、整群抽樣法整群隨機(jī)抽樣法(randomgroupsampling):被抽取的整群中各抽樣單位都進(jìn)行調(diào)查,按群計(jì)算平均數(shù)及標(biāo)準(zhǔn)差,并估計(jì)其置信限。
四、整群抽樣法整群隨機(jī)抽樣法(randomgroups113[例15.4]設(shè)某農(nóng)場(chǎng)調(diào)查水稻螟害發(fā)生情況,在全場(chǎng)100個(gè)條田中隨機(jī)抽取9條做調(diào)查,每田塊采用平行線式取10點(diǎn),每點(diǎn)連續(xù)查20穴,經(jīng)初步整理后將結(jié)果列于15.2。某農(nóng)場(chǎng)螟害率抽樣調(diào)查結(jié)果田塊123456789調(diào)查莖稈數(shù)198020622154251223152098242118672248螟害莖稈數(shù)178211335345212238460119298螟害率%8.9910.2315.5513.749.1611.3419.006.3713.25[例15.4]設(shè)某農(nóng)場(chǎng)調(diào)查水稻螟害發(fā)生情況,在全場(chǎng)100114這資料以條田為抽樣單位進(jìn)行分析。這資料以條田為抽樣單位進(jìn)行分析。115全場(chǎng)100條田平均螟害率95%的可能在9.01~14.91%范圍內(nèi)。本例的總體實(shí)際上是一個(gè)N=100的有限總體,故更確切地應(yīng)為:即9.15~14.77(%)間。全場(chǎng)100條田平均螟害率95%的可能在9.01~14.91%116此外,本例是百分?jǐn)?shù)資料,如果田塊間的差異不大,可以采用百分?jǐn)?shù)資料的分析方法,即由總調(diào)查莖稈數(shù)和總螟害莖稈數(shù)求出總螟害率
,得
這樣,
即11.69~12.59(%)。這個(gè)區(qū)間比前面所估小得多,這是因?yàn)榍懊嬉蕴飰K為抽樣單位,而不是以此外,本例是百分?jǐn)?shù)資料,如果田塊間的差異不大,可以采用百分?jǐn)?shù)117莖稈為單位,除了有莖稈受害與否的隨機(jī)誤差外,還包含有田塊間的差異,所以此處不宜采用百分?jǐn)?shù)的誤差估計(jì)方法。莖稈為單位,除了有莖稈受害與否的隨機(jī)誤差外,還包含有田塊間的118五、分級(jí)隨機(jī)抽樣法巢式隨機(jī)抽樣法(nestedrandomsampling):最簡(jiǎn)單的是二級(jí)隨機(jī)抽樣。例如全區(qū)的棉花結(jié)鈴數(shù),可以在區(qū)內(nèi)隨機(jī)抽取幾個(gè)鄉(xiāng),鄉(xiāng)內(nèi)隨機(jī)抽取若干戶(hù)進(jìn)行調(diào)查。這時(shí),鄉(xiāng)為初級(jí)抽樣單位,戶(hù)為次級(jí)抽樣單位。又例如研究農(nóng)藥在葉面上的殘留量,第一步隨機(jī)抽取單株,第二步在單株上隨機(jī)抽取葉片,分別作為初級(jí)和次數(shù)抽樣單位。五、分級(jí)隨機(jī)抽樣法巢式隨機(jī)抽樣法(nestedrandom119表15.3某農(nóng)藥殘留量分析結(jié)果及其方差分析
植株各葉片內(nèi)的殘留量(單位數(shù))合計(jì)平均13.283.093.033.0312.433.1123.523.483.383.3813.763.4432.882.802.812.7611.252.8143.343.383.233.2613.213.30變異來(lái)源自由度均方所估計(jì)的方差分量F植株間3MSB=0.2961*44.9F0.05(3,12)=3.49株內(nèi)葉片間12MSA=0.0066表15.3某農(nóng)藥殘留量分析結(jié)果及其方差分析120巢式隨機(jī)抽樣數(shù)據(jù)可以應(yīng)用方差分析法算出各階段的抽樣誤差,從而估計(jì)平均數(shù)的標(biāo)準(zhǔn)誤。二級(jí)抽樣的公式如下:
(15·13)其中,k=初級(jí)抽樣單位數(shù),n=次級(jí)抽樣單位數(shù)。
(15·14)
、分別為次級(jí)和初級(jí)抽樣誤差的估計(jì)值。
巢式隨機(jī)抽樣數(shù)據(jù)可以應(yīng)用方差分析法算出各階段的抽樣誤差,從而121二級(jí)抽樣的數(shù)據(jù)按單向分組的組次數(shù)相等(也可能不相等)的隨機(jī)模型進(jìn)行方差分析。例題中k=4,n=4,方差分析結(jié)果F=0.2961/0.0066=44.9,說(shuō)明植株間的誤差顯著大于株內(nèi)葉片間的誤差。這二個(gè)階段的抽樣誤差是不同的,應(yīng)該分別估計(jì)。但此處若將kn=4×4=16張葉片直接計(jì)算其方差則為0.0645。比扣除株間誤差后剩余的株內(nèi)葉片間誤差0.0066大得多。二級(jí)抽樣的數(shù)據(jù)按單向分組的組次數(shù)相等(也可能不相等)的隨機(jī)模122[例15.5]表15.3數(shù)據(jù)的分析結(jié)果:(單位)
(單位)2
(單位)
(單位)
此處DF=3,因由均方MSB計(jì)算。若只從1個(gè)初級(jí)單位估計(jì)置信限,如以株為單位作估計(jì),則:[例15.5]表15.3數(shù)據(jù)的分析結(jié)果:(單位)(單位123(單位)2
(單位)
(單位)由一株四張葉片估計(jì),比四株16張葉片估計(jì),誤差要大得多。若每株只取一張葉片,四株共取4張葉片,則(單位)2(單位)(單位)由一株四張葉片估計(jì),比四124(單位)
所以,同樣測(cè)定4張葉片,從1株上取與從4株上取,抽樣誤差是不同的,今后對(duì)此材料抽樣測(cè)定時(shí),應(yīng)多取植株,每株上可以少取一些葉片。(單位)所以,同樣測(cè)定4張葉片,從1株上取與從4株上取,125三級(jí)抽樣時(shí)的情況為:、、依次為三級(jí)、二級(jí)及一級(jí)抽樣單位的抽樣誤差,分別抽取n、k、l個(gè)不同級(jí)別的抽樣單位,則所獲樣本平均數(shù)的抽樣誤差為
獲得后,其總體平均數(shù)的置信區(qū)間的計(jì)算方法與前相同。(15·15)三級(jí)抽樣時(shí)的情況為:(15·15)126六、雙重隨機(jī)抽樣法雙重抽樣法(doublesampling):亦稱(chēng)相關(guān)抽樣法。若所要調(diào)查的性狀y是不易觀察測(cè)定,甚至對(duì)觀察材料要破壞后方能測(cè)定的,而試驗(yàn)又不容許將材料破壞,這時(shí)可以利用和所要調(diào)查的性狀有密切相關(guān)關(guān)系的另一便于測(cè)定的性狀x進(jìn)行間接的抽樣調(diào)查,按確定的相關(guān)關(guān)系從x的調(diào)查結(jié)果推算y的結(jié)果。
六、雙重隨機(jī)抽樣法雙重抽樣法(doublesampling1271.做一次隨機(jī)抽樣,調(diào)查y和x兩種性狀,從中求出y依x的回歸方程。這個(gè)樣本容量n不一定很大,但希望x和y有較大的幅度。
1.做一次隨機(jī)抽樣,調(diào)查y和x兩種性狀,從中求出y依x1282.對(duì)總體進(jìn)行x的抽樣調(diào)查,設(shè)樣本容量為m,按以上建立的回歸關(guān)系從推算的標(biāo)準(zhǔn)誤的近似式:(15·16)
2.對(duì)總體進(jìn)行x的抽樣調(diào)查,設(shè)樣本容量為m,按以上建立的回歸129采用雙重抽樣法,必須注意y和x兩性狀間不但要有顯著相關(guān),而且須有高程度顯著相關(guān),才能獲得比較準(zhǔn)確的結(jié)果,所以在建立回歸方程時(shí)要檢驗(yàn)其相關(guān)系數(shù)的大小及顯著性。采用雙重抽樣法,必須注意y和x兩性狀間不但要有顯著相130七、序貫抽樣法序貫抽樣法(sequentialsampling):根據(jù)逐個(gè)抽樣單位調(diào)查累積的信息,在抽樣過(guò)程中當(dāng)機(jī)確定樣本容量。
七、序貫抽樣法序貫抽樣法(sequentialsampl131序貫抽樣法的基本步驟:(1)確定作為“推斷”所依據(jù)的兩個(gè)標(biāo)準(zhǔn),P0與P1,此處P0=0.50(即50%)、P1=0.75(即75%)分別代表不符控制要求(必須治蟲(chóng))及符合控制要求(不必打藥)的兩個(gè)界限。(2)確定“推斷”的可靠程度的兩個(gè)概率標(biāo)準(zhǔn)與,表示總體百分?jǐn)?shù)P<P0而誤以為P<P1的序貫抽樣法的基本步驟:132險(xiǎn),表示總體P>P1而誤以為P<P0的風(fēng)險(xiǎn)。(3)估計(jì)總體分布類(lèi)型,計(jì)算出兩條平行的控制線。當(dāng)總體為二項(xiàng)式分布時(shí)。兩條控制線為下式:(15·17)
險(xiǎn),表示總體P>P1而誤以為P<P0的風(fēng)險(xiǎn)。133(4)將(15·17)的計(jì)算結(jié)果畫(huà)成序貫抽樣控制圖。橫坐標(biāo)為m,縱坐標(biāo)為h。
(5)進(jìn)行實(shí)際抽樣調(diào)查,將逐個(gè)抽樣單位測(cè)定的累計(jì)數(shù)m及h(完好穗數(shù))在坐標(biāo)圖上標(biāo)記。
(6)有時(shí)總體P可能在P0與P1之間,需預(yù)先計(jì)算一個(gè)推斷所需最大樣本容量E(m)。
(4)將(15·17)的計(jì)算結(jié)果畫(huà)成序貫抽樣控制圖。橫坐134當(dāng)總體屬二項(xiàng)式分布時(shí):
[例15.7]設(shè)按上述方法對(duì)玉米完好穗率進(jìn)行調(diào)查,以確定是否需要繼續(xù)用藥。此時(shí)確定P0=0.50,即完好穗率低于50%一定要防治;P1=0.75,即完好穗高于75%不再防治。=0.10,即應(yīng)該防治而誤以為不需防治的風(fēng)險(xiǎn)允許為0.10;=0.10,即不需防治(15·18)當(dāng)總體屬二項(xiàng)式分布時(shí):(15·18)135而誤以為要防治的風(fēng)險(xiǎn)允許為0.10;玉米完好穗率總體分布估計(jì)為二項(xiàng)式分布。
由(15·17)計(jì)得ha和hr的截距及斜率分別為:
ha截距
而誤以為要防治的風(fēng)險(xiǎn)允許為0.10;玉米完好穗率總體分布估計(jì)136
hr截距
斜率因而兩條控制線為:
由(15·18)得:hr截距斜率因而兩條控制線為:137
說(shuō)明推斷所需最大樣本容量為測(cè)定18株。將計(jì)算結(jié)果畫(huà)成圖15.2中兩條回歸線。經(jīng)田間逐穗實(shí)際測(cè)查結(jié)果列于表15.4。
138
圖15.2玉米完好穗率序貫抽樣控制圖圖15.2玉米完好穗率序貫抽樣控制圖139測(cè)查至m=18時(shí),h=9,超出界外,抽樣停止,因h<ha(ha=-2.00+0.631×18=9.36),故推論為總體完好穗率在50%以下,所以需要防治。本例恰好抽樣至E(m)=18時(shí)才作出推斷,這是因?yàn)榭傮w完好穗率與“推斷”所依據(jù)的兩個(gè)標(biāo)準(zhǔn)P0,P1很相近,如果相差較大,則測(cè)查穗數(shù)m小于18,便能作出推斷。累計(jì)測(cè)查穗數(shù)(m)123456789101112131415161718累計(jì)完好穗數(shù)(h)012234556667778899表15.4玉米完好穗數(shù)序貫抽樣結(jié)果累計(jì)測(cè)查穗數(shù)(m)123456789101112131415140設(shè)若將及均定為0.05,P0及P1不變,則:
ha=-2.68+0.631m
hr=2.68+0.631m
E(m)=30.85兩條平行線的間距增寬了,推斷所需最大樣本容量也增加了。又設(shè)若將、均定為0.05,P0=0.50,P1=0.60,則
ha=-7.26+0.550m
設(shè)若將及均定為0.05,P0及P1不變,則:141hr=7.26+0.550m
E(m)=213.08兩條平行線的間距更寬了,推斷所需最大樣本容量也更大了。這里說(shuō)明序貫抽樣法中有效確定、、P0、P1值對(duì)提高工作效率是很重要的。這需要依據(jù)專(zhuān)業(yè)知識(shí)確定。上例因估計(jì)總體是二項(xiàng)式分布。如果總體不是二項(xiàng)式分布而屬泊松(Poisson)分布則:hr=7.26+0.550m142(15·19)
(15·19)中l(wèi)n為自然對(duì)數(shù)的符號(hào),與為“推斷”所依據(jù)的兩個(gè)標(biāo)準(zhǔn)。例如每公斤種子含某種雜草種子在一粒以下便調(diào)進(jìn),若在三粒以上便拒絕,這時(shí)因每公斤種子中含某種雜草種子數(shù)是泊松分布,=1,=3。設(shè)若=0.1,=0.1,則:田間試驗(yàn)15抽樣調(diào)查課件143
ha截距
hr截距
斜率
ha截距hr截距斜率144“推斷”所需平均樣本容量,b<b0及b>b1時(shí)不同。
(15·20)“推斷”所需平均樣本容量,b<b0及b>b1時(shí)不同。(15·145此處:說(shuō)明平均抽取2個(gè)抽樣單位即可獲得推斷。若實(shí)踐中抽樣至3×1.95=6個(gè)抽樣單位尚無(wú)結(jié)果,則可停止抽樣。計(jì)取這6個(gè)抽樣單位的平均數(shù),若偏向則推斷為可調(diào)進(jìn),若偏向b,則推斷為拒絕調(diào)進(jìn)。此處:146
圖15.3雜草種子容量序貫抽樣控制圖圖15.3雜草種子容量序貫抽樣控制圖147第三節(jié)樣本容量的估計(jì)一、簡(jiǎn)單一級(jí)抽樣樣本容量的估計(jì)二、分層抽樣樣本容量的估計(jì)三、二級(jí)或多級(jí)抽樣樣本容量的估計(jì)四、抽樣單位大小與樣本容量的相互決定第三節(jié)樣本容量的估計(jì)一、簡(jiǎn)單一級(jí)抽樣樣本容量的估計(jì)148一、簡(jiǎn)單一級(jí)抽樣樣本容量的估計(jì)簡(jiǎn)單一級(jí)抽樣主要指簡(jiǎn)單隨機(jī)抽樣。在估計(jì)其樣本容量時(shí),首先要對(duì)調(diào)查對(duì)象的標(biāo)準(zhǔn)差做出估計(jì),并提出預(yù)定準(zhǔn)確度和置信系數(shù)的要求,然后據(jù)此以確定樣本容量。
一、簡(jiǎn)單一級(jí)抽樣樣本容量的估計(jì)簡(jiǎn)單一級(jí)抽樣主要指簡(jiǎn)單隨機(jī)抽樣149因?yàn)槠渲衝'為待定的樣本容量。
經(jīng)變項(xiàng),得:
(15·21)因?yàn)?15·21)150
(15·21)中
代表預(yù)定的準(zhǔn)確度要求,即指要求所得的樣本平均數(shù)與總體平均數(shù)相差不超過(guò)給定的量。若s估計(jì)值來(lái)自大樣本,則95%置信系數(shù)下t≈2,所以,(15·22)有時(shí)沒(méi)有大樣本的s值可借用,這時(shí)可通過(guò)平均全距(或平均極差)估計(jì)s值,(15·21)中代表預(yù)定的準(zhǔn)確151
式中為k個(gè)容量為n的小樣本極差的平均值,c為折算系數(shù)(表15.6),t由(表15.6)中的自由度估計(jì)值()及置信系數(shù)決定。
(15·24)(15·23)
152若總體屬有限性時(shí),估計(jì)的抽樣誤差應(yīng)按(15·3)用抽樣分?jǐn)?shù)作矯正,因而(15·21)將變?yōu)椋鹤冺?xiàng)合并后:
(15·25)
若總體屬有限性時(shí),估計(jì)的抽樣誤差應(yīng)按(15·3)用抽樣分?jǐn)?shù)作153如果N很大時(shí),可計(jì)算其近似值,即(15·21):
如n0/N比數(shù)不大,可采用n0為近似值,否則須計(jì)算值:
抽樣單位數(shù)()是隨變異程度(s2)和置信概率()兩者的增加而增加,同時(shí)隨容許誤差(d)數(shù)值的減少(15·26)如果N很大時(shí),可計(jì)算其近似值,即(15·21):(1154
而增加的。二、分層抽樣樣本容量的估計(jì)
1.比例配置法若各區(qū)層比例為,則當(dāng)總樣本容量為
時(shí),各區(qū)層樣本容量可按
進(jìn)行分配,因此只要估計(jì)出,便可確定各區(qū)層的。
而增加的。155因?yàn)?,則。
若令,則稱(chēng)V為一定置信系數(shù)下的樣本必需方差。得比例配置法的分層抽樣樣本容量的近似公式為:
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 祛斑美白淡斑霜行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢(xún)報(bào)告
- 可持續(xù)商業(yè)中心行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢(xún)報(bào)告
- 高效機(jī)床刀具涂層技術(shù)企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力戰(zhàn)略研究報(bào)告
- 2025年三元催化轉(zhuǎn)換器項(xiàng)目投資風(fēng)險(xiǎn)評(píng)估報(bào)告
- 如何高效工作并減少工作失誤
- 2025-2030中國(guó)期權(quán)行業(yè)市場(chǎng)現(xiàn)狀分析及競(jìng)爭(zhēng)格局與投資發(fā)展研究報(bào)告
- 2025-2030中國(guó)服務(wù)臺(tái)解決方案行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 2025-2030中國(guó)有機(jī)三文魚(yú)市場(chǎng)消費(fèi)規(guī)模調(diào)查與前景銷(xiāo)售規(guī)模報(bào)告
- 2025-2030中國(guó)更期用藥市場(chǎng)行情走勢(shì)與競(jìng)爭(zhēng)趨勢(shì)預(yù)測(cè)研究報(bào)告
- 2025-2030中國(guó)暖器箱行業(yè)發(fā)展分析及投資風(fēng)險(xiǎn)預(yù)測(cè)研究報(bào)告
- 《GNSS原理及應(yīng)用》課件
- 六年級(jí)下冊(cè)信息技術(shù) 課件-1.2無(wú)腳走天下-“啟動(dòng)電機(jī)”模塊和“延時(shí)等待”模塊 清華版 (共15張PPT)
- 2022年中國(guó)通用技術(shù)集團(tuán)控股有限責(zé)任公司招聘筆試題庫(kù)及答案解析
- 間歇經(jīng)口管飼法 課件
- 導(dǎo)電膠rohs2.078中文深圳市華測(cè)檢測(cè)技術(shù)股份市浦東新區(qū)新金橋路1996號(hào)
- 9 短詩(shī)三首 生字筆順課件(共10張PPT)
- 無(wú)線射頻識(shí)別技術(shù)外文翻譯參考文獻(xiàn)
- 電力負(fù)荷曲線與用電負(fù)荷預(yù)測(cè)課件
- 鋼支撐、圍檁專(zhuān)項(xiàng)施工方案
- 【2021部編版語(yǔ)文】-四年級(jí)下冊(cè)第六單元教材解讀--PPT課件
- 壓力管道安裝許可證換證自評(píng)報(bào)告
評(píng)論
0/150
提交評(píng)論