




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第四章統(tǒng)計假設(shè)檢驗
Testofstatisticalhypothesis本章主要內(nèi)容由樣本的結(jié)果如何來推斷總體
假設(shè)檢驗參數(shù)估計分析誤差產(chǎn)生的原因確定差異的性質(zhì)排除誤差干擾對總體特征做出正確判斷第一節(jié)假設(shè)檢驗
的原理與方法一、假設(shè)檢驗的概念假設(shè)檢驗就是根據(jù)總體的理論分布和小概率原理,對未知或不完全知道的總體提出兩種彼此對立的假設(shè),然后由樣本的實際結(jié)果,經(jīng)過一定的計算,作出在一定概率意義上應(yīng)該接受的那種假設(shè)的推斷。如果抽樣結(jié)果使小概率發(fā)生,則拒絕假設(shè),如抽樣結(jié)果沒有使小概率發(fā)生,則接受假設(shè)。
生物統(tǒng)計學(xué)中,一般認為小于0.05或0.0l的概率為小概率。通過假設(shè)檢驗,可以正確分析處理效應(yīng)和隨機誤差,作出可靠的結(jié)論。二、假設(shè)檢驗的步驟
在進行假設(shè)檢驗時,一般應(yīng)包括以下4個步驟:提出假設(shè)確定顯著水平
計算概率推斷是否接受假設(shè)(一)提出假設(shè)
假設(shè)檢驗首先要對總體提出假設(shè)(statisticalhypothesis)一般應(yīng)作兩個假設(shè):無效假設(shè),記作H0
;備擇假設(shè),記作HA
。無效假設(shè)(nullhypothesis)是直接檢驗的假設(shè),是對總體提出的一個假想目標。所謂“無效”意指處理效應(yīng)與總體參數(shù)之間沒有真實的差異,試驗結(jié)果中的差異乃誤差所致。備擇假設(shè)(alternativehypothesis)是和無效假設(shè)相反的一種假設(shè),即認為試驗結(jié)果中的差異是由于總體參數(shù)不同所引起的。因此,無效假設(shè)與備擇假設(shè)是對立事件,在檢驗中,如果接受H0就否定HA;否定H0則接受HA
。
確定無效假設(shè)必須遵循兩個原則:①無效假設(shè)是有意義的;②據(jù)此可算出因抽樣誤差而獲得樣本結(jié)果的概率。(二)確定顯著水平在進行無效假設(shè)和備擇假設(shè)后,要確定一個否定H0的概率標準,這個概率標準叫顯著水平,記作α。α是人為規(guī)定的小概率界限,生物統(tǒng)計學(xué)中常取α=0.05和α=0.0l兩個顯著水平。(三)計算概率在假設(shè)H0正確的前提下,根據(jù)樣本平均數(shù)的抽樣分布計算出由抽樣誤差造成的概率。對于上面一個樣本平均數(shù)的例子,在H0
:μ=μ0的前提下,根據(jù)式3.27可求得:查附表2,P(|u|>1.581)=2×0.057l=0.1142,即在N(126,240)的總體中,以n=6進行隨機抽樣,所得平均數(shù)
=136與126相差為10以上的概率為0.1142注意:檢驗所計算的并不是實得差異本身的概率,而是超過實得差異的概率。概率的大小,是推斷H0是否正確的依據(jù)。在H0假設(shè)下,由于有可能大于μ,也有可能小于μ,因此需要考慮差異的正和負兩個方面,所以一般計算的都是雙尾概率。(四)推斷是否接受假設(shè)根據(jù)小概率原理作出是否接受H0
:小概率原理指出:如果假設(shè)一些條件,并在假設(shè)的條件下能夠準確地算出事件A出現(xiàn)的概率α為很小,則在假設(shè)條件下的n次獨立重復(fù)試驗中,事件A將按預(yù)定的概率發(fā)生,而在一次試驗中則幾乎不可能發(fā)生(“小概率事件實際上不可能發(fā)生”)。統(tǒng)計學(xué)中,常把概率小于0.05或0.01作為小概率。如果計算的概率大于0.05或0.01,則認為不是小概率事件;H0的假設(shè)可能是正確的,應(yīng)該接受,同時否定HA
;反之,所計算的概率小于0.05或0.01,則否定H0,接受HA
。通常把概率等于或小于0.05叫做差異顯著標準,或差異顯著水平(significancelevel);等于或小于0.01叫做差異極顯著標準,或差異極顯著水平。一般差異達到顯著水平,則在資料的右上方標以“*”,差異達到極顯著水平,則在資料右上方標以“**”。
上例中,所計算的概率為0.1142,大于0.05的顯著水平,應(yīng)接受H0
,可以推斷治療前后的血紅蛋白含量未發(fā)現(xiàn)有顯著差異,其差值10(mg·L-1)應(yīng)歸于誤差所致。在實際檢驗時,可將上述計算簡化。由例3.10已知P(|u|>1.96)=0.05,P(|u|>2.58)=0.01,因此,在用u分布進行檢驗時,如果算得|u|>1.96,就是在α=0.05的水平上達到顯著,如果|u|>2.58,就是在α=0.0l的水平上達到顯著,即達到極顯著水平,勿須再計算u值的概率。樣本頻率、變異數(shù)以及多個平均數(shù)的假設(shè)檢驗,都應(yīng)根據(jù)試驗?zāi)康奶岢鰺o效假設(shè)和備擇假設(shè)。提出無效假設(shè)的目的:可從假設(shè)的總體中推論其平均數(shù)的隨機抽樣分布,從而可以算出某一樣本平均數(shù)指定值出現(xiàn)的概率,這樣就可以根據(jù)樣本與總體的關(guān)系,作為假設(shè)檢驗的理論依據(jù)。綜上所述,假設(shè)檢驗的步驟可概括為:(1)對樣本所屬總體提出無效假設(shè)H0和備擇HA
;(2)確定檢驗的顯著水平α;(3)在H0正確的前提下,根據(jù)抽樣分布的統(tǒng)計數(shù),進行假設(shè)檢驗的概率計算;(4)根據(jù)顯著水平α的u值臨界值,進行差異是否顯著的推斷。三、雙尾檢驗與單尾檢驗
Two-tailedtestandone-tailedtest
進行假設(shè)檢驗時,需要提出無效假設(shè)和備擇假設(shè)。提出的這種假設(shè),其總體平均數(shù)μ可能大于μ0,也可能小于μ0。在樣本平均數(shù)的抽樣分布中,對于α=0.05時,落在區(qū)間(μ-1.96,μ+1.96)的
有95%,落在這一區(qū)間之外(即≤μ-1.96和≥μ+1.96)的
只有5%。同理,對于α=0.01時,落在區(qū)間(μ-2.58,μ+2.58)的有99%,落在這一區(qū)間之外(即≤μ-2.58和≥μ+2.58)的只有1%。在進行假設(shè)檢驗時,前者相當于接受H0的區(qū)域,簡稱接受區(qū)(acceptanceregion);后者相當于否定H0的區(qū)域,簡稱否定區(qū)(rejectionregion
)(圖4.1)。一般將接受區(qū)和否定區(qū)的兩個臨界值寫作μ±uα
,即當
在(μ-uα
,μ+uα
)內(nèi)為H0的接受區(qū),而≤μ-
uα
和≥
μ+
uα
為H0的兩個否定區(qū);x≤μ-uα
:為左尾否定區(qū),
≥μ+
uα
為右尾否定區(qū)。上述假設(shè)檢驗的兩個否定區(qū),分別位于分布的兩尾,稱為雙尾檢驗。當假設(shè)檢驗的
時,則 ,這時備擇假設(shè)就有兩種可能,或
或
,也就是說在 的情況下,樣本平均數(shù)有可能落入左尾否定區(qū),也有可能落入右尾否定區(qū),這兩種情況都屬于 的情況。例如,檢驗?zāi)撤N新藥與舊藥的治病療效是否有差別,就是說新藥療效比舊藥好還是舊藥療效比新藥好,兩種可能性都存在,相應(yīng)的假設(shè)檢驗就應(yīng)該用雙尾檢驗。在生物學(xué)研究中,雙尾檢驗的應(yīng)用是非常廣泛的。單尾檢驗但在某些情況下,雙尾檢驗不一定符合實際。例如,我們已經(jīng)知道新藥療效不可能低于舊藥,于是其無效假設(shè)
,備擇假設(shè)
,這時僅有一種可能性,其否定區(qū)只有一個,相應(yīng)的檢驗也只能考慮一側(cè)的概率,這種具有左尾或右尾一個否定區(qū)的檢驗叫單尾檢驗。單尾檢驗的步驟與雙尾檢驗相同,查u分布表或t分布表時,需將一尾概率乘以2,再進行查表。例如,進行α=0.05的單尾檢驗時,對
,需進行左尾檢驗,其否定區(qū)為
;對
,需進行右尾檢驗,其否定區(qū)為同理,進行α=0.01的單尾檢驗時,對 ,其否定區(qū)為
,對 ,其否定
假設(shè)檢驗是根據(jù)一定概率顯著水平對總體特征進行推斷。否定了H0
,并不等于已證明H0不真實;接受了H0
,也不等于已證明H0是真實的。如果H0是真實的,假設(shè)檢驗卻否定了它,就犯了一個否定真實假設(shè)的錯誤,這類錯誤叫第一類錯誤,或稱α錯誤,亦稱棄真錯誤。四、假設(shè)檢驗中的兩類錯誤
TypeIerrorandtypeIIerror如對樣本平均數(shù)的抽樣分布,當取概率顯著水平α=0.05時,
x落在區(qū)間(μ-1.96,
μ+1.96σ
)的概率為0.95,x落在區(qū)間(μ-1.96,μ+1.96
)之外的概率為0.05,當一旦落在區(qū)間(μ-1.96,μ+1.96)之外,假設(shè)檢驗時就會否定H0,接受HA,這樣就會導(dǎo)致錯誤的結(jié)論。不過,犯這類錯誤的概率很小,只有0.05。如果取概率顯著水平為α=0.01,則x落在區(qū)間(μ-2.58,
μ+2.58
)的概率為0.99,x落在區(qū)間(μ-2.58,
μ+2.58
)之外的概率只有0.01,即犯“錯誤的可能性更小,只有0.01。如果H0不是真實的,假設(shè)檢驗時卻接受了H0
,否定了HA
,這樣就犯了接受不真實的錯誤,這類錯誤叫第二類錯誤,或稱β錯誤,亦稱納偽錯誤。第一類錯誤和第二類錯誤既有區(qū)別又有聯(lián)系。二者的區(qū)別是,第一類錯誤只有在否定H0時才會發(fā)生,而第二類錯誤只有在接受H0時才會發(fā)生。二者的聯(lián)系是,在樣本容量相同的情況下,第一類錯誤減少,第二類錯誤就會增加;反之,第二類錯誤減少,第一類錯誤就會增加。統(tǒng)計假設(shè)正確不正確接受——沒犯錯誤否定——犯了錯誤——棄真錯誤(第一類錯誤)(危險率以α表示)接受——犯了錯誤——采偽錯誤(第二類錯誤)(危險率以β表示)否定——沒犯錯誤在假設(shè)檢驗時,一個假設(shè)的接受或否定,不可能保證百分之百的正確,肯定會出現(xiàn)一些錯誤的推斷。如何減少犯這兩類錯誤的概率?
(1)概率顯著水平的確定與犯兩類錯誤有密切的關(guān)系,α取值太高或太低都會導(dǎo)致某一種錯誤的增加。一般的作法是,將概率顯著水平不要定得太高,以取α=0.05作為小概率比較合適,這樣可使犯兩類錯誤的概率都比較小。(2)在計算正態(tài)離差u時,總體平均數(shù)μ和樣本平均數(shù)之間的差值不是隨意能夠進行主觀改變的,但在試驗研究中, 卻是可以減小的。
從理論上講,
可通過精密的試驗設(shè)計和增大樣本容量而減小到接近0的程度,這樣正態(tài)分布中接受區(qū)就變得十分狹窄,μ和 之間的差別就比較容易發(fā)現(xiàn),所以減小是減少兩類錯誤的關(guān)鍵。因此,在試驗和研究中應(yīng)用假設(shè)檢驗時,要有合理的試驗設(shè)計和正確的試驗技術(shù),盡量增加樣本容量,以減小標準誤。第二節(jié)樣本平均數(shù)的假設(shè)檢驗一、大樣本平均數(shù)的假設(shè)檢驗——u檢驗(一)一個樣本平均數(shù)的u檢驗根據(jù)總體方差σ2是否已知,一個樣本平均數(shù)的u檢驗分為兩種情況。1.總體方差σ2已知時的檢驗
當總體方差σ2為已知時,檢驗一個樣本平均數(shù)的總體平均數(shù)μ是否屬于某一指定平均數(shù)為μ0的總體,不論其樣本容量是否大于30,均可采用u檢驗法。例4.1
某魚場按常規(guī)方法所育某魚苗一月齡的平均體長為7.25cm,標準差為1.58cm,為提高魚苗質(zhì)量,現(xiàn)采用一新方法進行育苗,一月齡時隨機抽取100尾進行測量,測得其平均體長為7.65cm,試問新育苗方法與常規(guī)方法有無顯著差異?
分析:
這里總體σ=1.58cm,σ2為已知,故采用u檢驗;又新育苗方法的魚苗體長可能高于常規(guī)方法,也可能低于常規(guī)方法,故進行雙尾檢驗。檢驗步驟為:(1)假設(shè)H0
:μ=μ0=7.25cm,即新育苗方法與常規(guī)方法所育魚苗一月齡體長相同。對HA
:μ≠μ0;(2)選取顯著水平α=0.05;(3)檢驗計算:(4)推斷:u分布中,當α=0.05時,u0.05=1.96
。實得|u|>1.96
,P<0.05
,故在0.05顯著水平上否定H0
,接受HA
,認為新育苗方法一月齡體長與常規(guī)方法有顯著差異。2.總體方差σ2未知時的檢驗
當總體方差σ2未知時,只要樣本容量n>30,可用樣本方差S2來代替總體方差σ2
,仍可用u檢驗法。例4.2
生產(chǎn)某種紡織品,要求棉花纖維長度平均為30mm以上,現(xiàn)有一棉花品種,以n=400進行抽查,測得其纖維平均長度為30.2mm,標準差為2.5mm,問該棉花品種的纖維長度是否符合紡織品的生產(chǎn)?分析:由題可知,μ=30.0mm,=30.2mm,s=2.5mm,而σ2未知,但由于n=400,屬于大樣本,故可用S2來代替σ2進行u檢驗;又由于棉花纖維只有大于30.0mm才符合紡織品生產(chǎn)的要求,故用單尾檢驗。(1)假設(shè)H0
:μ≤30.0mm,即該棉花品種纖維長度達不到紡織品生產(chǎn)的要求。對HA
:μ≥30.0mm;
(2)確定顯著水平
=0.05;
(3)檢驗計算:(4)推斷:當α=0.05時,單尾檢驗臨界值u0.05=1.645。實得|u|<1.645,P>0.05,故接受H0
,否定HA
,認為該棉花品種纖維長度不符合紡織品生產(chǎn)的要求。(二)兩個樣本平均數(shù)比較的u檢驗兩個樣本平均數(shù)比較的u檢驗是要檢驗兩個樣本平均數(shù)和所屬的總體平均數(shù)μ1和μ2是否來自同一個總體。在兩個樣本方差
和
已知,或
和
未知,但兩個樣本都是大樣本,即在n1>30和n2>30時,可用u檢驗法在進行兩個大樣本平均數(shù)的比較時,需要計算樣本平均數(shù)差數(shù)的標準誤
和u值。當兩樣本方差和
已知,兩個樣本平均數(shù)差數(shù)的標準誤為:(4.1,3.37)(4.2)(4.3)(4.4)(4.5)(4.6)(4.7)(4.8)例4.3
根據(jù)多年的資料,某雜交黑麥從播種到開花的天數(shù)的標準差為6.9d,現(xiàn)在相同試驗條件下采取兩種方法取樣調(diào)查,A法調(diào)查400株,得出從播種到開花的平均天數(shù)為69.5d;B法調(diào)查200株,得出從播種到開花的平均天數(shù)為70.3d,試比較兩種調(diào)查方法所得黑麥從播種到開花的天數(shù)有無顯著差別。分析:根據(jù)題意,總體方差已知,
故用u檢驗;又事先不知A、B兩法所得從播種到開花的天數(shù)是否相同,需用雙尾檢驗。(3)檢驗計算:(1)假設(shè)H0
:μ1=μ2
,即A、B兩法所得從播種到開花的天數(shù)相同。對HA
:μ1≠μ2
;(2)取顯著水平α=0.05;(4)推斷:由于實得|u|<u0.05
=1.96,P>0.05,故在0.05顯著水平上接受H0,否定HA
,即A、B兩種調(diào)查方法所得黑麥從播種到開花的天數(shù)沒有顯著差別。例4.4
為了比較“42—67×RRIM603”和“42—67×PB86”兩個橡膠品種的割膠產(chǎn)量,兩品種分別隨機抽樣55株和107株進行割膠,割膠平均產(chǎn)量分別為95.4mL.株-l和77.6mL.株-1,割膠產(chǎn)量的方差分別為936.36(mL.株-1)2和800.89(mL·株-1)2試檢驗兩個橡膠品種在割膠產(chǎn)量上是否有顯著差別。分析:(1)
假設(shè)H0
:μ1=μ2即兩品種的割膠產(chǎn)量沒有顯著差別。對HA
:μ1≠μ2;(2)
規(guī)定顯著水平α=0.01
;(3)
檢驗計算:
(4)推斷:現(xiàn)實得|u|>u0.01
=2.58,P<0.01
,故否定H0,接受HA,即兩個橡膠品種的割膠產(chǎn)量存在極顯著的差別,由于,所以可以得出“42—67×RRIM603”的割膠產(chǎn)量顯著高于“42—67×PB86”的結(jié)論。二、小樣本平均數(shù)的假設(shè)檢驗
——t檢驗
當樣本容量n<30且總體方差σ2未知時,就無法使用u檢驗法對樣本平均數(shù)進行假設(shè)檢驗,這時,要檢驗樣本平均數(shù)與指定總體平均數(shù)μ0的差異顯著性,就必須使用t檢驗法。在生物學(xué)研究中,由于試驗條件和研究對象的限制,有許多研究的樣本容量都很難達到30,因此,采用小樣本平均數(shù)的t檢驗法在生物學(xué)研究中具有重要的意義。(一)一個樣本的假設(shè)檢驗檢驗總體方差σ2未知,樣本容量n<30的平均數(shù)
是否屬于平均數(shù)為μ0的指定總體的一種t分布。因為小樣本的S2和σ2相差較大,故
遵循自由度d?
=n-1的t分布。
例4.5
某魚塘水中的含氧量,多年平均為4.5mg·L-1,現(xiàn)在該魚塘設(shè)10個點采集水樣,測定水中含氧量分別為:4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26mg·L-1,試檢驗該次抽樣測定的水中含氧量與多年平均值有無顯著差別。分析:此題σ2未知,且n=l0,為小樣本,故用t檢驗;又該次測定的水中含氧量可能高于也可能低干多年平均值,故用雙尾檢驗。(1)
假設(shè)H0
:μ=μ0=4.5mg.L-1,即該次測定的水中含氧量與多年平均值沒有顯沒有顯著差別。對HA
:μ≠μ0;(2)
選取顯著水平α=0.05
;(3)
檢驗計算:查附表4,當d?=n-1=9時,t0.05=2.262,現(xiàn)實得|t|<t0.05,故P>0.05;(4)推斷:接受H0
,認為該次抽樣測定的魚塘水中含氧量與多年平均含氧量沒有顯著差別,與μ相差0.079mg·L-1屬于隨機誤差。(二)兩個樣本平均數(shù)的假設(shè)檢驗
———成組數(shù)據(jù)的平均數(shù)比較成組數(shù)據(jù)資料的特點:是指兩個樣本的各個變量是從各自總體中抽取的,兩個樣本之間的變量沒有任何關(guān)聯(lián),即兩個抽樣樣本彼此獨立。這樣,不論兩樣本的容量是否相同,所得數(shù)據(jù)皆為成組數(shù)據(jù)。兩組數(shù)據(jù)以組平均數(shù)進行相互比較,來檢驗其差異的顯著性。當總體方差σ12和σ22已知,或總體方差σ12和σ22未知,但兩個樣本均為大樣本時,采用u檢驗法檢驗兩組平均數(shù)的差異顯著性。這里討論當總體方差σ12和σ22未知,且兩樣本為小樣本(n1<30,n2<30),進行兩組平均數(shù)差異顯著性檢驗的t檢驗法。1.兩樣本的總體方差σ12和σ22未知,但可假設(shè)σ12
=σ22
=σ2時的檢驗首先,用樣本方差σ12和σ22進行加權(quán)求出平均數(shù)差數(shù)的方差σe2
,作為對σ2的估計,計算公式為:(4.9,5.6)(4.10,5.7)(4.11,5.8)(4.12,5.9A)例4.6
用高蛋白和低蛋白兩種飼料飼養(yǎng)一月齡大白鼠,在三個月時,測定兩組大白鼠的增重量(g),兩組的數(shù)據(jù)分別為:(4.13,5.9B)
高蛋白組:134,146,106,119,124,161,l07,83,113,129,97,123; 低蛋白組:70,118,101,85,107,132,94。 試問兩種飼料飼養(yǎng)的大白鼠增重量是否有差別?分析:本題σ12和σ22未知,且為小樣本,用t檢驗;又事先不知兩種飼料飼養(yǎng)的大白鼠增重量孰高孰低,故用雙尾檢驗。(1)
假設(shè)H0
:μ1=μ2,即兩種飼料飼養(yǎng)的大白鼠體重沒有顯著差別。對HA
:μ1≠μ2
;(2)
規(guī)定顯著水平α=0.05
;(3)
檢驗計算:(4)推斷:接令H0
,認為兩種飼料飼養(yǎng)大白鼠的增重量沒有顯著差別。
2.兩樣本的總體方差σ12和σ22未知,且σ12≠σ22(可由F檢驗得知),但n1=n2時的檢驗。這種情況仍可用t檢驗法,其計算也與可假設(shè)兩總體方差σ12=σ22的情況一樣,只是在查t值表時,所用自由度d?=n-1,而不是2(n
-1)。例4.7
兩小麥品種千粒重(g)的調(diào)查結(jié)果如下:品種甲:50,47,42,43,39,5l,43,38,44,37;品種乙:36,38,37,38,36,39,37,35,33,37。試檢驗兩品種的干粒重有無顯著差異。分析:此題n1=n2=10,經(jīng)F檢驗,得知兩品種千粒重的方差有顯著的不同。(1)
假設(shè)H0
:μ1=μ2,即兩品種的千粒重沒有顯著差別。對HA
:μ1≠μ2
;(2)
取顯著水平α=0.05
;
(3)
檢驗計算:查附表4,d?=10-1=9,現(xiàn)實得|t|>t0.05,故P<0.05(4)推斷:否定H0,接受HA
,認為兩品種千粒重有顯著差異,甲品種的千粒重顯著高于乙品種。733.兩樣本的總體方差σ12和σ22未知,且σ12≠σ22
,
n1≠n2時的檢驗這種情況所構(gòu)成的統(tǒng)計數(shù)t不再服從相應(yīng)的t分布,只能進行近似的t檢驗。由于σ12≠σ22
,所以兩樣本平均數(shù)差數(shù)的標準誤不能使用加權(quán)方差,需用兩個樣本方差S12和S12分別估計總體方差σ12和σ22
,即有:(4.14,5.10)作t檢驗時,需先計算R和d?′:式4.17的td?′近似服從于t分布,其自由度為d?′,查t值表得tα
(d?′)
,臨界值。(4.15,5.11)(4.16)(4.17,5.12A)例4.8
測定冬小麥東方紅3號的蛋白質(zhì)含量(%)10次,得,S12=1.621;測定農(nóng)大193的蛋白質(zhì)含量5次,得,S22
=0.135。試檢驗兩品種蛋白質(zhì)含量是否有顯著差異。分析:經(jīng)F檢驗,得知兩品種蛋白質(zhì)含量的方差有顯著的不同,又由于n1≠n2
,故需計算td?′,作近似的t檢驗。使用雙尾檢驗。(1)
假設(shè)H0
:μ1=μ2即兩品種蛋白質(zhì)含量沒有顯著差別。對HA
:μ1≠μ2
;(2)
取顯著水平α=0.01
;(3)
檢驗計算:(4)推斷:否定H0
,接受HA
,認為兩品種蛋白質(zhì)含量有極顯著差異。(三)成對數(shù)據(jù)平均數(shù)比較的假設(shè)檢驗成對數(shù)據(jù)的比較要求兩樣本間配偶成對,每一對除隨機地給予不同處理外,其他試驗條件應(yīng)盡量一致。成對數(shù)據(jù)特點:由于同一配對內(nèi)兩個供試單位的試驗條件非常接近,而不同配對間的條件差異又可以通過各個配對差數(shù)予以消除,因而,可以控制試驗誤差,具有較高精確度。
設(shè)兩樣本的變量分別為x1和x2,共配成n對,各對的差數(shù)為d=
x1-
x2
,則樣本差數(shù)平均數(shù)為:(4.18)(4.19)(4.20,5.14)(4.21,5.15A)(4.22,5.15B)例4.9
在研究飲食中缺乏維生素E與肝中維生素A的關(guān)系時,將試驗動物按性別、體重等配成8對,并將每對中的兩頭試驗動物用隨機分配法分配在正常飼料組和維生素E缺乏組,然后將試驗動物殺死,測定其肝中的維生素A的含量,其結(jié)果如表4-1,試檢驗兩組飼料對試驗動物肝中維生素A含量的作用是否有顯著差異。分析:此題為配對數(shù)據(jù),因兩組飼料對試驗動物肝中維生索A含量的作用孰大孰小,事先并不明確,故用雙尾檢驗。(1)
假設(shè)H0
:μd=0,兩組飼料對試驗動物肝中維生索A含量的作用沒有顯著差別。對HA
:μ1≠0
;(2)確定顯著水平α=0.01
;(3)
檢驗計算:
(4)推斷:否定H0
:ud=0,接受HA
:ud
≠0,即兩組飼料對試驗動物肝中維生素A含量的作用有極顯著差異,用正常飼料飼養(yǎng)的試驗動物肝中的維生素A含量顯著高于維生素E缺乏組飼養(yǎng)的試驗動物肝中的維生素A含量。第三節(jié)樣本頻率的假設(shè)檢驗
在生物學(xué)研究中,有許多試驗或調(diào)查結(jié)果是用頻率(或百分數(shù)、成數(shù))表示的。比如總體或樣本中的個體分屬兩種屬性,象藥劑處理后害蟲的死與活、種子的發(fā)芽與不發(fā)芽、動物的雌與雄、試驗的成功與失敗等,類似這些性狀組成的總體通常服從二項分布,因此叫二項總體,即由“非此即彼”組成的總體。有些總體中的個體有多個屬性,但可根據(jù)研究目的經(jīng)適當?shù)慕y(tǒng)計處理分為“目標性狀”和“非目標性狀”兩種屬性,也可看作二項總體。在二項總體中抽樣,樣本中的“此”性狀出現(xiàn)的情況可用次數(shù)表示,也可用頻率表示,因此頻率的假設(shè)檢驗可按二項分布進行,即從二項式(p+q)n的展開式中求出“此”性狀頻率的概率,然后作出統(tǒng)計推斷。但是,如果樣本容量n較大,0.1≤p≤0.9時,np和nq又均不小于5,(p十q)n的分布就趨于正態(tài),因而可將頻率資料作正態(tài)分布處理,從而作出近似的檢驗。一、一個樣本頻率的假設(shè)檢驗檢驗一個樣本頻率與某一理論頻率p0的差異顯著性。根據(jù)n和p的大小,其檢驗方法是不一樣的。當np或nq<5,則由二項式(p+q)n展開式直接檢驗。當np或nq>5時,二項分布趨近正態(tài),可用u檢驗,但需進行連續(xù)性矯正。如np或nq均大于30時,則可不進行連續(xù)性矯正。(4.23,5.16)(4.24,5..17)(4.25,5.23)例4.10
有一批蔬菜種子的平均發(fā)芽率p0=0.85,現(xiàn)隨機抽取500粒,用種衣劑進行浸種處理,結(jié)果有445粒發(fā)芽,試檢驗種衣劑對種子發(fā)芽有無效果。分析:本題中,p0=0.85,n=500,由于np和nq都大于30,故不需進行連續(xù)性矯正。(1)
假設(shè)H0
:p=p0=0.85,即用種衣劑浸種后的發(fā)芽率仍為0.85。對HA:
p≠p0
;(2)
確定顯著水平α=0.05
;兩尾檢驗(3)
檢驗計算:(4)推斷:由于|u|>u0.05=1.96,p<0.05,故否定H0
,接受HA,認為用種衣劑浸種能夠顯著提高蔬菜種子的發(fā)芽率。例4.11
規(guī)定種蛋的孵化率p0>0.80為合格,現(xiàn)對一批種蛋隨機抽取100枚進行孵化檢驗,結(jié)果有78枚孵出,問這批種蛋是否合格?分析:本題中,np和nq都大于5,但nq<30,故需進行連續(xù)性矯正。又只有孵化率≤
0.80才認為是不合格,故采作單尾檢驗。(1)
假設(shè)H0
:p≤p0=0.80,即該批種蛋不合格。對HA:
p>
p0
;(2)
確定顯著水平α=0.05
;(3)
檢驗計算:(4)推斷:由于|u|<u0.05=1.645,
p>0.05,故接受H0,認為這批種蛋不合格。二、兩個樣本頻率的假設(shè)檢驗檢驗兩個樣本頻率和差異顯著性,一般假定兩個樣本的方差是相等的,即σp12
=σp22。這類檢驗在實際應(yīng)用中具有更重要的意義。由于在抽樣試驗中,其理論頻率p為未知數(shù),就不能對兩樣本某屬性出現(xiàn)的次數(shù)進行比較,只能進行頻率的比較。和單個樣本頻率的假設(shè)檢驗一樣,當np或nq<5,則按二項分布直接進行檢驗;當np或nq>5時,用u檢驗,并需進行連續(xù)性矯正;當np或nq均大于30時,則可不進行連續(xù)性矯正。兩個樣本頻率差數(shù)標準誤為:(4.26,5.18)(4.27,5.21)(4.28)(4.29,5.22)如果n1<30,n2<30,對式4.29,可用t代替u值;對式4.30,可用tc代替uc值,進行t檢驗。例4.12
研究地勢對小麥銹病發(fā)病的影響,調(diào)查低洼地麥田378株,其中銹病株342株,調(diào)查高坡地麥田396株,其中銹病株313株,試比較兩塊麥田銹病發(fā)病率是否有顯著性差異。(4.30)分析:本題np和nq均大于30,不需進行連續(xù)性矯正。又事先不知兩塊麥的銹病發(fā)病率孰高孰低,故進行雙尾檢驗。(1)
假設(shè)H0
:p1=p2
,即兩塊麥田銹病發(fā)病率沒有顯著差異。對HA
:
p1≠p2
;(2)
確定顯著水平α=0.01
;(3)
檢驗計算:(4)推斷:由于|u|>u0.01=2.58,p<0.01,故否定H0
,接受HA
,認為兩塊麥田銹病發(fā)病率有極顯著差異。例4.13
某養(yǎng)魚場發(fā)生了藥物中毒,抽查甲池中的29魚尾中有20尾死亡,抽查乙池中28魚尾中有21尾死亡,試檢驗甲、乙兩池發(fā)生藥物中毒后,魚的死亡是否有差異。分析:本題np和nq均小于30,需進行連續(xù)性矯正。采用雙尾檢驗。(1)
假設(shè)H0
:p1=p2
,即甲、乙兩池魚的死亡率沒有顯著差異。對HA
:
p1≠
p2
;(2)
確定顯著水平α=0.05;(3)
檢驗計算:(4)推斷:接受H0
,認為發(fā)生藥物中毒后,甲、乙兩魚池魚的死亡率沒有顯著差異。第四節(jié)參數(shù)的區(qū)間估計與點估計
參數(shù)估計是統(tǒng)計推斷的另一個方面,它是指由樣本結(jié)果對總體參數(shù)在一定概率水平下所作出的估計。參數(shù)估計包括區(qū)間估計和點估計。一、參數(shù)區(qū)間估計與點估計的原理
參數(shù)的區(qū)間估計和點估計是建立在一定理論基礎(chǔ)上的一種方法。由中心極限定理和大數(shù)定理得知,只要抽樣為大樣本,不論其總體是否為正態(tài)分布,其樣本平均數(shù)都近似服從的正態(tài)分布,因而,當概率水平α=0.05或0.01時,即置信度為P=1-α=0.95或0.99的條件下,有:(4.31)(4.32)(4.33)(4.34)(4.35)上面式子表明,盡管我們只知道
而不知道μ
,但知道區(qū)間
內(nèi)包含μ在內(nèi)的可靠程度為1-α
,其中, 叫做μ的1-α置信區(qū)間。(4.36)對于μ的1-α置信區(qū)間的下限L1和上限L2可寫作:區(qū)間(L1,
L2)便是用樣本平均數(shù)對總體平均數(shù)μ的置信度為P=1-α的區(qū)間估計。那么,可用:(4.37)表示樣本平均數(shù)對總體平均數(shù)μ的置信度為P=1-α的點估計。當α=0.05時,包含有μ的置信度為0.95的區(qū)間估計和點估計為:(4.38)實際上,參數(shù)的區(qū)間估計也可用于假設(shè)檢驗,因為置信區(qū)間是在一定置信度P=1-α下總體參數(shù)的所在范圍,故對參數(shù)所進行的假設(shè)如果落在該區(qū)間內(nèi),就說明這個假設(shè)與真實情況沒有不同,因而就可以接受H0。(4.39)當α=0.01時,包含有μ的置信度為0.99的區(qū)間估計和點估計為:(4.40)(4.41)反之,如果對參數(shù)所進行的假設(shè)落在區(qū)間之外,則說明假設(shè)與真實情況有本質(zhì)的不同,就應(yīng)否定H0
,接受HA。注意:無論區(qū)間估計還是點估計,都與概率顯著水平α的大小聯(lián)系在一起,
α越小,則相應(yīng)的置信區(qū)間就越大,也就是說用樣本平均數(shù)對總體平均數(shù)估計的可靠程度越高,但這時估計的精度就降低了。在實際應(yīng)用中,應(yīng)合理選取概率顯著水平α的大小,不能認為α取值越小越好。二、總體平均數(shù)μ的區(qū)間估計與點估計當總體方差σ2為已知或總體方差σ2未知但為大樣本時,可以利用樣本平均數(shù)和總體方差σ2作出在置信度為P=1–α下的總體平均數(shù)μ的區(qū)間估計:由式4.36,其置信區(qū)間的下限L1和上限L2為:當樣本為小樣本且總體方差σ2未知時,
σ2需由樣本方差S2來估計,于是置信度為P=l-α的總體平均數(shù)μ的置信區(qū)間可估計為:由式4.37,總體平均數(shù)μ的點估計L為:(4.42)其置信區(qū)間的下限L1和上限L2為:(4.43)例4.14
測得某批25個小麥樣本的平均蛋白質(zhì)含量
=14.5%,已知σ=2.50%,
試進行95%置信度下的蛋白質(zhì)含量的區(qū)間估計和點估計。分析:本例σ為已知,置信度P=1-σ=0.95,即α
=0.05,查附表2得u0.05=1.96。由σ可求出:(4.44)
例4.15
從某魚場收蝦的總體中,隨機取20尾對蝦,測得平均體長,標準差,試估計置信度為99%的對蝦總體平均數(shù)。分析:本例中,由于總體方差σ2未知,需用S2估計σ2
。查附表4,當d?=20–1=19時,t0.01=2.861。具體計算如下:三、兩個總體平均數(shù)差數(shù)μ1-μ2的區(qū)間估計與點估計當兩個總體方差σ12和σ22為已知,
或總體方差σ12和σ22未知但為大樣本時,在置信度為P=1–α下,兩個總體平均數(shù)差數(shù)μ1–μ2的區(qū)間估計為:(4.45,5.28A)當兩個樣本為小樣本,且兩總體方差σ12和σ22未知,但兩總體方差相等,即σ12=σ22=σ2時,可由兩樣本方差S12和S22估計總體方差σ12和σ22。(4.46,5.28B)(4.47)在置信度為P=1–α下,兩個總體平均數(shù)差數(shù)μ1–μ2的區(qū)間估計為:(4.48,5.29A)(4.49,5.29B)(4.50)這里,d?=n1+n2-2當兩個樣本為小樣本,且兩總體方差不相等,即σ12≠σ22
時,由兩樣本方差S12和S22估計總體方差σ12和σ22
而算出的t值,已不再是d?=n1+n2-2的t分布,
而是近似服從自由度為d?′的t分布,在置信度為P=1–α下,兩個總體平均數(shù)差數(shù)μ1–μ2的區(qū)間估計為:(4.51,5.32A)當兩樣本為成對資料時,在置信度為P=1–
α?xí)r,兩個總體平均數(shù)差數(shù)μ1–μ2的區(qū)間估計為:(4.53)上面三式中,tα,
d?′為置信度為置信度為P=1–α?xí)r自由度為d?′的t臨界值。例4.16
對例4.6數(shù)據(jù)進行置信度為95%時兩種蛋白飼料飼養(yǎng)的大白鼠增重的差數(shù)區(qū)間估計和點估計。(4.54,5.33A)(4.55,5.33B)(4.56)解:在例4.6中,已算得
,
,
,并查得附表4,當d?=17時,t0.05=2.110,所以置信度為95%時兩種蛋白飼料飼養(yǎng)的大白鼠增重的差數(shù)區(qū)間估計為:分析:在例4.9中,已算得
,
,從附表4中查得,當d?=7時,t0.01=3.499
。于是,兩種飼料飼養(yǎng)下動物肝中維生素A含量差數(shù)的區(qū)間估計為:例4.17
試對表4—1資料進行置信度為99%的區(qū)間估計和點估計兩種飼料飼養(yǎng)下動物肝中維生素A含量差數(shù)的點估計為四、總體頻率p、兩總體頻率差數(shù)pl-p2的區(qū)間估計與點估計(4.57,5.34B)(4.58)(4.59)當樣本容量較小或者np、nq遠小于30時,對總體頻率p進行的區(qū)間估計和點估計需要作連續(xù)性矯正,矯正公式為:(4.60)(4.61)
在進行兩個總體頻率差數(shù)pl–p2的區(qū)間估計和點估計時,一般應(yīng)明確兩個頻率有顯著差異才有意義。在置信度為P=1–α
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年呼倫貝爾職業(yè)技術(shù)學(xué)院單招職業(yè)傾向性測試題庫匯編
- 2025年度土地互換與農(nóng)村土地制度改革合同
- 2025年度客戶價格保密與農(nóng)業(yè)科技合作開發(fā)合同
- 2025年度工地食堂員工滿意度調(diào)查與提升承包合同
- 2025年度夫妻雙方子女撫養(yǎng)權(quán)及探望權(quán)離婚協(xié)議書
- 2025年度房屋贈予與遺產(chǎn)分配協(xié)議
- 2025年度大型活動臨時聘用保安人員合作協(xié)議
- 2025年度人工智能教育平臺建設(shè)合同變更協(xié)議
- 互聯(lián)網(wǎng)平臺限用農(nóng)藥違規(guī)售賣現(xiàn)狀調(diào)研報告
- 2025年度總經(jīng)理聘任與質(zhì)量管理體系合同:提升產(chǎn)品質(zhì)量合作協(xié)議
- 2024年湖北省武漢市中考英語真題(含解析)
- 燕窩采購合同模板
- 小學(xué)五年級下冊外研版英語:Module 5 模塊測試
- 諾如病毒課件教學(xué)課件
- 《城市軌道交通應(yīng)急處理》課件-《城市軌道交通應(yīng)急處理》項目四
- 臨建工程勞務(wù)承包條件
- GB/T 44561-2024石油天然氣工業(yè)常規(guī)陸上接收站液化天然氣裝卸臂的設(shè)計與測試
- 員工履歷表(標準樣本)
- 薪酬管理制度、員工薪資結(jié)構(gòu)規(guī)定、薪酬福利管理制度
- 2024-2030年中國實驗室自動行業(yè)市場發(fā)展分析及投資發(fā)展戰(zhàn)略研究報告
- 睪丸扭轉(zhuǎn)的護理課件
評論
0/150
提交評論