1抽樣原方法和樣本量_第1頁
1抽樣原方法和樣本量_第2頁
1抽樣原方法和樣本量_第3頁
1抽樣原方法和樣本量_第4頁
1抽樣原方法和樣本量_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、抽樣方法和樣本量前面已經經介紹,總體在在很多情情況下,往往是是很大的的,有時時是無限限的,因因此,對對總體的的研究往往往是不不可行的的而生物統(tǒng)統(tǒng)計學的的特點之之一是其其概率歸歸納原理理,即通通過對某某一特定定的、具具體的樣樣本進行行分析,在一定定概率保保證下進進行總體體的推斷斷例如,對對水體污污染進行行檢查,對空氣氣質量檢檢查,不不需要也也不可能能對整個個水體、整個空空氣逐一一進行檢檢查,只只需要抽抽取一小小部分的的水、空空氣進行行分析被抽取的的這一小小部分水水、空氣氣就是樣樣本抽取水和和空氣的的這一過過程就是是抽樣的的過程如何抽樣樣?抽樣應當當遵循什什么原則則?什么樣的的樣本才才能認為為符合

2、標標準?這是本章章要討論論的問題題抽樣的總總原則是是:樣本必須須來自于于所研究究的總體體樣本必須須能代表表所研究究的總體體抽樣方法法必須與與抽樣目目的相一一致抽樣認真真、抽樣樣方法正正確、客客觀,樣樣本就具具有代表表性;反反之,抽抽樣馬虎虎、草率率、武斷斷、主觀觀、弄虛虛作假,樣本就就差,就就不具有有代表性性抽樣方法法試驗、調調查的目目的不同同,試驗驗、調查查的方法法不同、抽樣的的方法也也不同這這里僅介介紹幾個個抽樣方方法一、隨機機抽樣法法總體比較較整齊、變異程度小、群體分分布均勻,可用隨隨機抽樣樣法隨機抽樣樣法的原原則是:總體內每每一個體體(數據據)都有有同等的的機會進進入樣本本樣本中每每一

3、個體體(數據據)進入入任何一一個組的的機會也也是相等等的隨機抽樣樣法可以以完全排排除個人人的主觀觀性隨機抽樣樣法是最最簡單、最常用用的抽樣樣方法隨機抽樣樣法有以以下幾種種方法:抓鬮法隨機數字字法偽隨機數數字法通過隨機機抽樣法法得到樣樣本后,一般需需計算樣樣本的特特征值,用以估估計總體體參數幾乎所有有調查和和試驗都都可以采采用隨機機抽樣法法進行抽抽樣二、整群群抽樣和和多層次次抽樣法法從總體中中抽取數數個樣本本單位群群,對單單位群內內的全部部個體作作全面調調查,或或用整個個單位群群進行試試驗樣本單位位群的抽抽取既可可以用隨隨機抽樣樣法得到到,也可可以有選選擇地取取得在整群抽抽樣的基基礎上,對抽得得

4、的樣本本單位群群不作全全面調查查,或不不是整個個樣本單單位群進進入試驗驗,而是是在樣本本單位中中繼續(xù)抽抽取一定定量的個個體(數數據)組組成樣本本,這就就是二級級抽樣如果二級級抽樣得得到的不不是個體體(數據據),而而是更小小的單位位群,再再從中進進行抽樣樣,這就就是三級級抽樣以此類推推二級及二二級以上上的抽樣樣就稱為為多層次次抽樣多層次抽抽樣方法法適合于于資源調調查、遺遺傳學試試驗、育育種學試試驗、傳傳染?。纳x蟲?。┱{調查、流流行病學學調查、經濟學學調查,等*三、雙雙重抽樣樣法當所研究究的性狀狀比較復復雜,或或所需經經費較多多,或須須將試驗驗動物宰宰殺后才才能測定定,因而而不大可可能進行行重

5、復性性試驗,或采用用直接抽抽樣試驗驗時有較較大的難難度,可可采用雙雙重抽樣樣法采用雙重重抽樣法法,首先先將所需需要進行行研究的的性狀定定為目標標性狀(或稱為為靶性狀狀),用用y表示,然然后根據據文獻或或其他方方法確定定一個或或幾個簡簡單易測測、不具具破壞性性、與靶靶性狀相相關性比比較緊密密的性狀狀,這些些性狀稱稱為輔助助性狀,用xi表示從總體中中抽取兩兩個樣本本,一個個大樣本本,一個個小樣本本先對小樣樣本進行行調查,或先用用小樣本本進行試試驗,對對這一小小樣本既既測y性狀,同同時也測測xi性狀,獲獲得n對y和xi,并建立立xi與y的回歸方方程,最最簡單的的回歸方方程就是是只有一一個xi的簡單回

6、回歸方程程,也可可以是曲曲線回歸歸方程,也可以以建立多多元回歸歸方程建立回歸歸方程的的原則是是其r(或其絕絕對值)或R必須很大大,以表表明用x或xi估測y其效果比比較好而較大的的樣本在在調查或或試驗中中僅測xi性狀,并并將這一一樣本中中所有被被測個體體的xi代入上述述回歸方方程中以以求得相相應的y估計值這樣獲得得的大樣樣本的y估計值,能達到到一定的的精度這一抽樣樣方法即即為雙重重抽樣法法雙重抽樣樣法的優(yōu)優(yōu)點是:對于復雜雜性狀的的調查或或試驗僅僅需破壞壞較小的的樣本即即能獲得得較大樣樣本的精精確性當目標性性狀為破破壞性性性狀時,這是唯唯一行之之有效的的方法雙重抽樣樣法的適適用范圍圍:遺傳學試試驗

7、、育育種學試試驗、繁繁殖學試試驗、生生理生化化學試驗驗、疾病病防治試試驗,等等雙重抽樣樣示意圖圖:xiyxi總體y2小樣本大樣本樣本容量量樣本容量量越大,試驗結結果就越越具有代代表性,調查的的精確性性、準確確性也越越高但隨著樣樣本容量量的增大大,抽樣樣或試驗驗的成本本也越大大,當樣樣本容量量大到一一定程度度時,再再增大樣樣本容量量,試驗驗或調查查其精確確性的提提高就漸漸趨緩慢慢:當標準差差一定時時,標準準誤的大大小與樣樣本容量量的平方方根成反反比,樣樣本容量量較小時時,隨著著樣本容容量的增增大,標標準誤會會急劇減減小,但但當樣本本容量大大到一定定程度后后再增大大樣本容容量,標標準誤的的減小將將

8、會變得得越來越越慢,即即繼續(xù)增增大樣本本容量,試驗精精確性的的提高其其效能將將逐步下下降而隨著樣樣本容量量的增大大,試驗驗或調查查所需成成本、時時間、人人力、物物力等則則可能會會成倍地地增長因此確定定一個合合宜的樣樣本容量量,使得得試驗或或調查既既有一個個較好的的精確度度,又能能最大限限度地節(jié)節(jié)省人力力和時間間、財力力、物力力,是試試驗或調調查必須須要考慮慮的問題題樣本容量量的確定定原則和和確定方方法總體有限限、且很很大時,同時注注意抽樣樣的代表表性,樣樣本可占占總體的的千分之之一到百百分之一一總體不很很大時,樣本占占總體的的百分之之五率的計算算和估計計,一般般要求大大樣本在試驗中中,同一一水

9、平或或同一組組合的變變異情況況越嚴重重,所需需樣本越越大,同同一組合合的供試試動物越越整齊,可適當當減少動動物數試驗越規(guī)規(guī)范,試試驗結束束后使用用的統(tǒng)計計方法越越嚴格,所需動動物數可可適當減減少小家畜的的供試數數應多一一些(如如雞、豬豬),大大家畜的的供試數數可適當當少一些些試驗時,考慮的的因子數數越多,每一組組合內的的供試動動物數可可少一些些,單因因子試驗驗則每一一水平內內的供試試動物數數應多一一些*不同的的抽樣方方法,所所需樣本本量還應應當根據據具體的的抽樣方方法來確確定:整群抽樣樣時,既既要考慮慮群體單單位的大大小,又又要考慮慮作為樣樣本的群群體的多多少原則上,應采取取小群體體、多群群體

10、的抽抽樣方法法,因為為這樣可可以更全全面地了了解總體體的情況況多層次抽抽樣時,有一個個每個層層次樣本本量的比比例的問問題,這這里需要要考慮每每一層次次的變異異情況及及各層次次的抽樣樣成本,以便對對每一層層次內單單位數進進行合理理的分配配*在不知知道總體體的大小小和情況況時,可可以從試試驗要求求的精確確性來考考慮樣本本容量:根據參考考文獻、他人或或自己的的經驗、專業(yè)知知識等人人為地定定出一個個樣本平平均值與與總體平平均值的的離差,即允許許誤差L:而其中,一一般般初次總總取1.96(置信度度為95%)因此:顯然,人人為定出出的允許許誤差越越大,所所需樣本本量就小小反之,人人為定出出的允許許誤差越越

11、?。醇磳υ囼烌灥囊笄蟮木_確度越高高),所所需的樣樣本量就就越大一般來講講,當所所需要的的樣本量量不大時時(n30),應當當進行反反復試求求,最后后使得n穩(wěn)定在某某一個值值上例:已知知一總體體的大致致標準差差為9.7,若規(guī)定定在抽樣樣時允許許存在L= 2.5的誤差,試求抽抽樣所需需的樣本本容量即:在95% 的置置信度下下,需要要61個個體作作為一個個樣本才才能較好好地說明明問題當要求有有較高的的置信度度99% 時,其樣本本含量的的計算公公式為:運用這一一公式所所得到的的n值一般不不應小于于30,當所得得樣本量量小于30時,應作作進一步步的試運運算,直直至所得得樣本量量n穩(wěn)定時為為止又例:一

12、一總體其其標準差差為15.9,試驗允允許誤差差為L= 10,求試驗驗所需最最小樣本本量暫設則則由于n較?。?00)百分率一一類的性性狀求樣樣本容量量時,應應注意允允許誤差差的取值值應小于于百分率率,特別別是當該該百分率率趨于兩兩端(0.7)時,更更應注意意L的取值*關于允允許誤差差L的取值允許誤差差L即為置信信半徑,如何確確定允許許誤差,這關系系到樣本本容量的的大小,也決定定了試驗驗或調查查的成敗敗因此允許許誤差的的確定是是試驗或或調查前前需要慎慎重考慮慮的問題題從前面所所介紹的的公式和和例題中中我們已已經看出出,當總總體方差差(標準準差)基基本確定定后,樣樣本容量量(即試試驗規(guī)模模)與允允許

13、誤差差的大小小是有直直接的關關系的而總體方方差的大大小可以以根據前前人的結結果所得得到允許誤差差如何確確定?一是需要要查閱大大量的文文獻,從從類似的的試驗或或調查中中確定本本次試驗驗或調查查的規(guī)模模二是根據據自身試試驗或規(guī)規(guī)模的大大小來確確定,這這里需要要考慮的的一個主主要問題題是試驗驗或調查查的資金金來源和和經費的的充裕程程度三是需要要考慮試試驗或調調查的精精確程度度:允許許誤差實實際就是是樣本平平均值與與總體平平均值的的差距最最大不超超過的某某一界限限,因此此它決定定了試驗驗或調查查的精確確程度一旦確定定了允許許誤差,就可以以用試驗驗或調查查結束后后得到的的樣本平平均值來來告訴人人們總體體

14、平均值值在哪一一個可能能的范圍圍里面,這一個個結論就就有了理理論依據據,不致致被人所所詰難或或質疑因此確定定允許誤誤差得到到的樣本本容量不不宜太小?。颖颈救萘刻≡囼烌灮蛘{查查的結果果比較粗粗糙,也也易引起起別人的的質疑),但也也不需要要太大(太大需需要大量量的經費費和人力力、物力力、時間間)由于求率率、成數數等所需需要的樣樣本容量量還是盡盡可能大大一些為為好*抽樣誤差差的估計計抽樣誤差差,一般般用標準準誤來表表示,因因此,估估計抽樣樣誤差,就是求求標準誤誤的大小小標準誤既既與標準準差有關關,也與與樣本容容量有關關樣本不同同,所得得到的誤誤差不同同抽樣方法法不同,所得到到的抽樣樣誤差也也不

15、同由于抽樣樣誤差表表示的是是樣本平平均數與與總體平平均數之之間的差差異,因因此,為為了使總總體平均均數的估估計更可可靠、更更精確,應當使使用合適適的抽樣樣方法標準誤求求得以后后,應計計算總體體平均值值的置信信區(qū)間(*)試驗設計計原理研究進程程什么是科科學研究究?任何人想想要達到到自己的的愿望或或要求,在充分分尊重客客觀事實實的前提提下,所所進行的的探索性工作研究進程程分為如如下幾個個階段:科學假設設資料收集集試驗方案案的制訂訂及試驗驗設計試驗的實實施資料的分分析及統(tǒng)統(tǒng)計研究成果果的發(fā)表表誤差誤差的概概念及分分類從試驗中中獲得的的數據總總或多或或少地偏偏離真值值,這種種偏離就就稱為誤誤差誤差分為

16、為:系統(tǒng)誤差差隨機誤差差三類錯誤系統(tǒng)誤差差有有規(guī)律的的偏離影影響響準確性性可可以以消除隨機誤差差無無規(guī)律影影響精精確性可可以縮縮小有有統(tǒng)計學學意義錯誤人人為造成成應應當當消滅(隨機)誤差的的來源這里所指指誤差是是指隨機機誤差(簡稱誤誤差)生物體的的復雜性性導致了了誤差的的存在,動物體體試驗又又有更大大的誤差差了解誤差差其目的是為了縮縮小誤差差縮小誤差差有兩個個現實意義義:提高精確性有效減小小試驗規(guī)模模縮小誤差差,其實實質是有有效地保保證數據據的整齊程度度試驗所得得到的數數據越整齊,誤差就越越小,所需樣本本也就可可以越小誤差來源源于以下下三個方方面試驗材料料遺傳物物質的不不同一(或樣本本的本質質

17、不同)試驗動物物的基因因或遺傳傳物質不不可能純純合,越越是高等等的動物物其基因因越是復復雜,所所造成的的誤差也也就越大大。這是是造成誤誤差的最最根本原原因試驗過程程中操作作與管理理技術的的不一致致操作人員員的技術術、管理理水平不不可能一一致,不不同的時時間段內內操作人人員的體體力、精精神、情情緒不可可能一致致,操作作人員的的責任心心也不可可能一致致試驗外界界條件的的不統(tǒng)一一試驗動物物不可能能安排在在絕對一一致的環(huán)環(huán)境內,對同一一組內每每一個供供試動物物的試驗驗措施也也不可能能絕對一一致誤差的控控制針對造成成誤差的的三大原原因,采采取的控控制措施施:選擇基因因型較為為純合的的近交系系基因純合合的

18、程度度依次為為:同卵雙生生個體、自交系系、高度度近交的的近交系系、近交交系、全全同胞、半同胞胞、家系系、純種種其中,后后三種是是動物試試驗中可可以實際際使用的的試驗群群體兩個純種種的雜交交后代F1代在在某些情情況下可可以考慮慮使用來自同一一父親的的半同胞胞由于群群體很大大,在遺遺傳學試試驗、育育種學試試驗、營營養(yǎng)學試試驗、繁繁殖學試試驗中經經常使用用家系一般般可用來來分析許許多遺傳傳性疾病病和尋找找疾病的的遺傳學學規(guī)律,可以用用來作人人類疾病病動物模模型中國許多多動物地地方品種種由于地地處交通通閉塞的的地區(qū),因而高高度近交交,這樣樣的純種種是很好好的試驗驗材料,級進雜雜交的群群體也是是較好的的

19、試驗材材料對操作人人員進行行培訓、教育制訂標準準化的操操作規(guī)程程制訂規(guī)范范化的操操作程序序盡可能機機械化、自動化化對所用儀儀器、設設備進行行校正設立標準準器具制訂標準準曲線及及校正公公式同一批樣樣品在同同一天內內由同一一個人用用同一批批試劑完完成測試試對外部環(huán)環(huán)境進行行有效的的控制試驗動物物的取樣樣、分組組、配置置、試驗驗次序采采取隨機機化的原原則采用局部部控制的的方法設設置區(qū)組組,將試試驗動物物進行分分組統(tǒng)計分析析時將區(qū)區(qū)組(時時間、空空間)作作為一個個因子進進行處理理減少試驗驗動物的的活動范范圍、減減少疾病病對試驗驗動物的的襲擾、消毒減少環(huán)境境污染、藥物污污染、飼飼料污染染控制溫度度、濕度

20、度試驗設計計的基本本原則重復在同一處處理內設設置多個個獨立供供試單位位作用:正正確地評評價誤差差有效地降降低誤差差準確地估估計處理理效應為隨機化化、局部部控制提提供基礎礎隨機化在試驗的的整個過過程中貫貫徹隨機機的精神神而不帶帶有任任何何主觀偏偏見作用:使使誤差的的估計無無偏、準準確正確地評評價誤差差局部控制制設置區(qū)組組,每一一區(qū)組控控制在同同一環(huán)境境內作用:有有效地降降低系統(tǒng)統(tǒng)誤差試驗設計計三原則則的關系系:重復隨機化設置區(qū)組組局部控控制使誤差估估計無偏、準準確評價誤差差統(tǒng)計推斷斷降低誤差差提高精確確度三原則作用*現在我我們來看看一個隨隨機化和和局部控控制的例例子假設設計計了6種種不同的的飼料

21、,從A1至A6。每一種種飼料飼飼喂8頭頭豬,每每一頭豬豬一個圈圈舍,共共計48頭豬。48個個圈舍共共分6排排,每排排8個圈圈,8頭頭豬,喂喂一種料料。排列列如下表表。試驗驗中需空空腹稱重重,假設設從早晨晨8:00開始始稱重,每頭豬豬需時5分鐘,則共需需240分鐘,即4個個小時,需稱至至中午12:00點鐘鐘。稱重重順序為為先稱A1的8頭豬豬,然后后是A2的8頭豬豬,以后后依次為為A3、A4、A5,直至A6。那么,A1的8頭豬豬稱重時時間為8:00到8:40,受空腹腹影響不不大,A2的8頭豬豬就受到到一定的的影響了了,因為為這A2的8頭豬豬是從8:40稱至9:20的。A3受空腹的的影響就就更大,因

22、為是是從9:20稱稱至10:00點。顯顯然,A4、A5和A6的豬受空空腹的影影響一個個比一個個大,到到A6的最后8頭豬事事實上是是在11:20以后稱稱重的,這8頭頭豬整整整餓了半半天,其其體重肯肯定比A1的8頭豬豬損失了了好多下面3張張表分別別是:順順序稱重重、隨機機稱重、區(qū)組稱稱重稱重順序序A118:00A128:05A138:10A14A15A16A17A188:40A218:40A228:45A23A24A25A26A27A289:20A319:20A329:25A33A34A35A36A37A3810:00A4110:00A4210:05A43A44A45A46A47A4810:40A

23、5110:40A5210:45A53A54A55A56A57A5811:20A6111:20A6211:25A63A64A65A66A67A6812:00稱重順序序A458:00A588:05A438:10A568:15A238:20A188:25A378:30A288:35A488:40A648:45A638:50A518:55A389:00A249:05A159:10A119:15A369:20A179:25A549:30A229:35A679:40A619:45A469:50A329:55A6610:00A2110:05A4210:10A3410:15A1310:20A5310:25A2

24、510:30A6210:35A4710:40A1410:45A6810:50A2710:55A5511:00A5211:05A4111:10A3311:15A6511:20A2611:25A3511:30A1611:35A5711:40A4411:45A3111:50A1211:55一二二三三四四五五六六七七八八A618:00A328:30A439:00A449:30A2510:00A5610:30A1711:00A3811:30A318:05A228:35A639:05A149:35A3510:05A1610:35A6711:05A1811:35A418:10A528:40A339:10A5

25、49:40A4510:10A3610:40A4711:10A5811:40A218:15A628:45A239:15A349:45A1510:15A4610:45A3711:15A2811:45A518:20A128:50A539:20A249:50A6510:20A2610:50A2711:20A6811:50A118:25A428:55A139:25A649:55A5510:25A6610:55A5711:25A4811:55上述三種種稱重方方法的比比較:顯然,第第一種稱稱重方法法存在著著很大的的系統(tǒng)誤差差,每一只只豬的體體重中不不但有著著飼料的的效應,而且混雜有稱重時時間的影影響,這這一稱重重方法顯顯然不妥妥第二種稱稱重方法法雖然沒沒有了系系統(tǒng)誤差差,但隨機誤差差卻變大了,而且且大得讓讓人不能容忍忍第三種稱稱重方法法由于設設置了區(qū)組,區(qū)組內內又進行行了隨機化。按區(qū)組組進行稱稱重,稱稱重時間間引起的的差異轉轉化成了了區(qū)組因因素(B),區(qū)區(qū)組內又又進行隨隨機配置置、隨機機稱重,將每一一區(qū)組內內殘留的的一點點點系統(tǒng)誤誤差轉化成了隨機機誤差,因此這這一稱重重方法就就

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論