第四章 統(tǒng)計推斷_第1頁
第四章 統(tǒng)計推斷_第2頁
第四章 統(tǒng)計推斷_第3頁
第四章 統(tǒng)計推斷_第4頁
第四章 統(tǒng)計推斷_第5頁
已閱讀5頁,還剩120頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計推斷(statistical inference)假設(shè)檢驗假設(shè)檢驗參數(shù)估計參數(shù)估計第一節(jié)第一節(jié)第二節(jié)第二節(jié)第三節(jié)第三節(jié)第四節(jié)第四節(jié)第五節(jié)第五節(jié)假設(shè)檢驗的原理與方法假設(shè)檢驗的原理與方法樣本平均數(shù)的假設(shè)檢驗樣本平均數(shù)的假設(shè)檢驗樣本頻率的假設(shè)檢驗樣本頻率的假設(shè)檢驗參數(shù)的區(qū)間估計與點估計參數(shù)的區(qū)間估計與點估計方差的同質(zhì)性檢驗方差的同質(zhì)性檢驗一 概念 : 假設(shè)檢驗(hypothesis test)又稱顯著性檢驗(significance test),就是根據(jù)總體的理論分布和小概率原理,對未知或不完全知道的總體提出兩種彼此對立的假設(shè),然后由樣本的實際原理,經(jīng)過一定的計算,作出在一定概率意義上應(yīng)該接受的

2、那種假設(shè)的推斷。第一節(jié) 假設(shè)檢驗 概率很小的事件在一次抽樣試驗中實際是幾乎不可能發(fā)生的。 =0.05/0.01 如果假設(shè)一些條件,并在假設(shè)的條件下能夠準(zhǔn)確地算如果假設(shè)一些條件,并在假設(shè)的條件下能夠準(zhǔn)確地算出事件出現(xiàn)的概率出事件出現(xiàn)的概率 為很小,則在假設(shè)條件下的為很小,則在假設(shè)條件下的n次獨次獨立重復(fù)試驗中,事件立重復(fù)試驗中,事件A將按預(yù)定的概率發(fā)生,而在一次試將按預(yù)定的概率發(fā)生,而在一次試驗中則幾乎不可能發(fā)生。驗中則幾乎不可能發(fā)生。平均數(shù)的檢驗平均數(shù)的檢驗頻率的檢驗頻率的檢驗方差的檢驗方差的檢驗秩和檢驗秩和檢驗符號檢驗符號檢驗游程檢驗游程檢驗秩相關(guān)檢驗秩相關(guān)檢驗統(tǒng)計假設(shè)測驗的基本思想統(tǒng)計假設(shè)

3、測驗的基本思想 設(shè)某地區(qū)的當(dāng)?shù)匦←溒贩N一般667m2產(chǎn)300kg,即當(dāng)?shù)仄贩N這個總體的平均數(shù)為0=300(kg),并從多年種植結(jié)果獲得其方差2=(75)2kg。若從這一總體中隨機抽取n個個體構(gòu)成樣本,則樣本觀察值可表示為: yi= 0 +i (i=1,2,n)現(xiàn)有某新品種通過25個小區(qū)的試驗,計算其樣本平均產(chǎn)量為每667m2為330kg。新品種的樣本觀察值可表示為: xi= +i (i=1,2,n)式中為新品種的總體平均數(shù)。新品種與地方品種的差異(品種效應(yīng))用表示,則 0 代入上式得:xi= 0 + + i (i=1,2,n)對xi求平均數(shù),并將式子稍作變形得:xi 0 = +0 x為表型效應(yīng)

4、, 在本例中,303003300 xi為處理效應(yīng),為誤差效應(yīng)。由于處理效應(yīng) 0 無法計算,統(tǒng)計推斷只能從第(2)種可能性出發(fā),即假設(shè)處理效應(yīng)不存在,試驗表型效應(yīng)全為試驗誤差。(1)處理效應(yīng)與誤差效應(yīng)處理效應(yīng)與誤差效應(yīng);(2)全為試驗誤差全為試驗誤差。xi 0 = +從式可知表型效應(yīng)的構(gòu)成有二種可能性 然后再計算該假設(shè)出現(xiàn)的概率,最后依概率的大小判斷假設(shè)是否成立,從而推斷處理效應(yīng)是否存在(反證法)。這就是統(tǒng)計假設(shè)測驗的基本思想。二二 、假設(shè)檢驗的步驟、假設(shè)檢驗的步驟 治療前治療前 0 126 2 240 N ( 126,240 )治療后治療后 n 6 x 136 未知未知 那么那么 0 ? 即克

5、矽平對治療矽肺是否有效?即克矽平對治療矽肺是否有效?例例:設(shè)矽肺病患者的血紅蛋白含量具平均數(shù):設(shè)矽肺病患者的血紅蛋白含量具平均數(shù) 0 0126(mg/L)126(mg/L), 2 2 240240 (mg/L)(mg/L)2 2的正態(tài)分布?,F(xiàn)用克矽平對的正態(tài)分布?,F(xiàn)用克矽平對6 6位矽肺病患者進行位矽肺病患者進行治療,治療后化驗測得其平均血紅蛋白含量治療,治療后化驗測得其平均血紅蛋白含量x =136(mg/L)x =136(mg/L)。1 1 、提出假設(shè)、提出假設(shè)例例:克矽平治療矽肺病是否能提高血紅蛋白含量?:克矽平治療矽肺病是否能提高血紅蛋白含量?平均數(shù)的假設(shè)檢驗平均數(shù)的假設(shè)檢驗檢驗治療后的

6、總體平均數(shù)檢驗治療后的總體平均數(shù) 是否還是治療前的是否還是治療前的126(mg/L)126(mg/L)?x-x- 0 0136-126136-12610(mg/L)10(mg/L)這一差數(shù)這一差數(shù)是由于治療造成的,還是抽樣誤差所致。是由于治療造成的,還是抽樣誤差所致。本例中零假設(shè)是指治療后的血紅蛋白平均數(shù)仍和治療前一樣,本例中零假設(shè)是指治療后的血紅蛋白平均數(shù)仍和治療前一樣,二者來自同一總體,接受零假設(shè)則表示克矽平?jīng)]有療效。二者來自同一總體,接受零假設(shè)則表示克矽平?jīng)]有療效。而相對立的備擇假設(shè)表示拒絕而相對立的備擇假設(shè)表示拒絕H0,治療后的血紅蛋白平均數(shù),治療后的血紅蛋白平均數(shù)和治療前的平均數(shù)來自

7、不同總體,即克矽平有療效。和治療前的平均數(shù)來自不同總體,即克矽平有療效。H0:=0 =126(mg/L)HA:0 0 2 2 、 確定顯著水平確定顯著水平0.05顯著水平*極顯著水平*能否定能否定H0的的人為人為規(guī)定的規(guī)定的概率概率標(biāo)準(zhǔn)稱為顯著水平,記作標(biāo)準(zhǔn)稱為顯著水平,記作 。 統(tǒng)計學(xué)中,一般認(rèn)為概率小于統(tǒng)計學(xué)中,一般認(rèn)為概率小于0.05或或0.01的事件為的事件為小概率事件小概率事件,所以在小概率原理基礎(chǔ)上建立的假設(shè)檢驗所以在小概率原理基礎(chǔ)上建立的假設(shè)檢驗也常取也常取 =0.05和和 =0.01兩個顯著水平兩個顯著水平 。P1.964、作出推斷結(jié)論:是否接受假設(shè)PP0.05所以接受H0,從

8、而得出結(jié)論:使用克矽平治療前后血紅蛋白含量未發(fā)現(xiàn)有顯著差異,其差值10應(yīng)歸于誤差所致。 0.950.0250.025u 1.96u 2.58P( u ) 0.05P( u ) 0.01差異達(dá)顯著水平差異達(dá)顯著水平差異達(dá)極顯著水平差異達(dá)極顯著水平P( -1.96 x x +1.96 x) =0.950.025臨界值:臨界值: + u x0.95 0 -1.96 x +1.96 x0.025否定區(qū)否定區(qū)接受區(qū)u + 1.96 x三三 、雙尾檢驗與單尾檢驗、雙尾檢驗與單尾檢驗 0P( -2.58 x x0在已知不可能大于0時,則備擇假設(shè)為HA:00.950.950.050.051.64-1.64H0

9、 : 0 HA : 0假設(shè):否定區(qū)H0 : 0 HA : 1.96否定否定H0,接受,接受HA;認(rèn)為新育苗方法一月齡體長與常規(guī)方法有顯著差異。認(rèn)為新育苗方法一月齡體長與常規(guī)方法有顯著差異。P 30時,可用樣本方差s2來代替 總體方差2 ,仍用u檢驗法總體總體(0)樣本樣本(n30)x s22xsxu例:例:生產(chǎn)某種紡織品,要求棉花纖維長度平均為生產(chǎn)某種紡織品,要求棉花纖維長度平均為30mm以上,以上,現(xiàn)有一棉花品種,以現(xiàn)有一棉花品種,以n=400進行抽查,測得其纖維平均長度為進行抽查,測得其纖維平均長度為30.2mm,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為2.5mm,問該棉花品種的纖維長度是否符合紡織品的生產(chǎn)要求

10、?問該棉花品種的纖維長度是否符合紡織品的生產(chǎn)要求?()這是一個樣本平均數(shù)的假設(shè)檢驗,因總體()這是一個樣本平均數(shù)的假設(shè)檢驗,因總體2未知未知, n=400 30,可用,可用s2代替代替2進行進行u檢驗;檢驗;()棉花纖維只有()棉花纖維只有30mm才符合紡織品的生產(chǎn)要求,因才符合紡織品的生產(chǎn)要求,因 此進行單尾檢驗。此進行單尾檢驗。()假設(shè)()假設(shè)(2)水平)水平(3)檢驗)檢驗(4)推斷)推斷H0: 0=30(cm),即該棉花品種纖維長度達(dá)不到紡織品生產(chǎn)的要求。即該棉花品種纖維長度達(dá)不到紡織品生產(chǎn)的要求。 HA:0選取顯著水平選取顯著水平0.05 125. 04005 . 2nssx6 .1

11、125.00 .302 .30 xsxuu 0.053、總體方差2未知,且n30時,可用樣本方差s2來代替 總體方差2 ,采用df=n-1的t檢驗法總體總體(0)樣本樣本(n30)x s22tsxx例:例:某魚塘水中的含氧量,多年平均為某魚塘水中的含氧量,多年平均為4.5(mg/L),該魚塘設(shè),該魚塘設(shè)10個點采集水樣,測定含氧量為:個點采集水樣,測定含氧量為:4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26(mg/L)試檢驗該次抽樣測定的水中含氧量與多年平均值有無顯著差別。試檢驗該次抽樣測定的水中含氧量與多年平均值有無顯著差別。()這是一個樣

12、本平均數(shù)的假設(shè)檢驗,因總體()這是一個樣本平均數(shù)的假設(shè)檢驗,因總體2未知未知, n=10 或或0.05421. 4nxx二、兩個樣本平均數(shù)二、兩個樣本平均數(shù) 的假設(shè)檢驗的假設(shè)檢驗適用范圍適用范圍:檢驗兩個樣本平均數(shù)檢驗兩個樣本平均數(shù)x 和和x 所所屬的總體平均數(shù)屬的總體平均數(shù)樣本樣本1X1樣本樣本2X2總體總體11 總體總體221、提出假設(shè)、提出假設(shè)無效假設(shè)無效假設(shè)H0: 1=2 ,兩個平均數(shù)的差,兩個平均數(shù)的差值值 是隨是隨機誤差所引起的;機誤差所引起的;21xx 備擇假設(shè)備擇假設(shè)HA: 1=2 ,兩個平均數(shù)的差值,兩個平均數(shù)的差值 除隨除隨機誤差外,機誤差外, 還包含其真實的差異,即由效應(yīng)

13、差異引還包含其真實的差異,即由效應(yīng)差異引起的;起的;21xx 2、確定顯著水平:、確定顯著水平:0.05或或0.013、檢驗統(tǒng)計量、檢驗統(tǒng)計量(1)樣本平均數(shù)差數(shù)的平均數(shù)樣本平均數(shù)差數(shù)的平均數(shù) = 總體平均數(shù)的差數(shù)總體平均數(shù)的差數(shù).212121xxxx兩個樣本平均數(shù)的差數(shù)兩個樣本平均數(shù)的差數(shù)21xx (2)樣本平均數(shù)差數(shù)的方差樣本平均數(shù)差數(shù)的方差 = 兩樣本平均數(shù)方差之和兩樣本平均數(shù)方差之和.2222212122121xxxxnn22212121nnxx樣本平均數(shù)差數(shù)的標(biāo)準(zhǔn)誤樣本平均數(shù)差數(shù)的標(biāo)準(zhǔn)誤222121221nnxx)11(212221nnxxnxx2221221nxx2222112=2

14、2= n1=n2=n 12=22= n1=n2=n ) 1 , 0(N當(dāng)當(dāng)1 12 2 和和2 22 2已知已知21)()(2121xxxxu2121xxxxuH0:1=2=時時 ) 1 , 0(N當(dāng)當(dāng)1 12 2 和和2 22 2未知,兩樣本都為大樣本時未知,兩樣本都為大樣本時21)()(2121xxsxxu2121xxsxxuH0: 1=2=時時 22212121nsnssxx)2(21nnt當(dāng)當(dāng)1 12 2 和和2 22 2未知,兩樣本都為小樣本時未知,兩樣本都為小樣本時21)()(2121xxsxxt2121xxsxxtH0: 1=2=時時 22212121nsnssxx4、作出推斷,

15、并解釋之、作出推斷,并解釋之uu tt 或或uu tt 或或 如果兩個樣本的各個變量是從各自總體中隨機如果兩個樣本的各個變量是從各自總體中隨機抽取的,兩個樣本之間的變量沒有任何關(guān)聯(lián),即兩抽取的,兩個樣本之間的變量沒有任何關(guān)聯(lián),即兩個抽樣樣本彼此獨立,則不論兩樣本的容量是否相個抽樣樣本彼此獨立,則不論兩樣本的容量是否相同,所得數(shù)據(jù)皆為同,所得數(shù)據(jù)皆為成組數(shù)據(jù)成組數(shù)據(jù)。兩組數(shù)據(jù)以組平均數(shù)。兩組數(shù)據(jù)以組平均數(shù)作為相互比較的標(biāo)準(zhǔn),來檢驗其差異的顯著性。作為相互比較的標(biāo)準(zhǔn),來檢驗其差異的顯著性。 根據(jù)兩樣本所屬的總體方差是否已知和樣本大根據(jù)兩樣本所屬的總體方差是否已知和樣本大小不同而采用不同的檢驗方法。

16、小不同而采用不同的檢驗方法。1、兩個總體方差12 和22已知,或12 和22未知,但兩個樣本都是大樣本,即n130且n230時,用u檢驗法。例例:某雜交黑麥從播種到開花的天數(shù)的標(biāo)準(zhǔn)差為:某雜交黑麥從播種到開花的天數(shù)的標(biāo)準(zhǔn)差為6.9dA法:調(diào)查法:調(diào)查400株,平均天數(shù)為株,平均天數(shù)為69.5dB法:調(diào)查法:調(diào)查200株,平均天數(shù)為株,平均天數(shù)為70.3d()這是兩個樣本(成組數(shù)據(jù))平均數(shù)比較的假設(shè)檢()這是兩個樣本(成組數(shù)據(jù))平均數(shù)比較的假設(shè)檢驗,驗,1 12 2=2 22 2=(6.9d)=(6.9d)2 2, ,樣本為大樣本,用樣本為大樣本,用u u檢驗。檢驗。()因事先不知()因事先不知

17、A、B兩方法得到的天數(shù)孰高孰低,用兩方法得到的天數(shù)孰高孰低,用雙尾檢驗。雙尾檢驗。試比較兩種調(diào)查方法所得黑麥從播種到開花天數(shù)有無顯著差別。試比較兩種調(diào)查方法所得黑麥從播種到開花天數(shù)有無顯著差別。()假設(shè)()假設(shè)(2)水平)水平(3)檢驗)檢驗(4)推斷)推斷H0:1 2,即認(rèn)為兩種方法所得天數(shù)相同。,即認(rèn)為兩種方法所得天數(shù)相同。HA: 1 2選取顯著水平選取顯著水平0.05 在在0.05顯著水平上,接受顯著水平上,接受H0,否定,否定HA;認(rèn)為兩種方法所得黑麥從播種到開花天數(shù)沒有顯著認(rèn)為兩種方法所得黑麥從播種到開花天數(shù)沒有顯著差別。差別。598.0112121nnxx338.1598.03.7

18、05.692121 xxxxuu 0.05例例:為了比較:為了比較“42-67XRRIM603”和和“42-67XPB86”兩個兩個橡膠品種的割膠產(chǎn)量,兩品種分別隨機抽樣橡膠品種的割膠產(chǎn)量,兩品種分別隨機抽樣55株和株和107株進株進行割膠,平均產(chǎn)量分別為行割膠,平均產(chǎn)量分別為95.4ml/株和株和77.6ml株,割膠產(chǎn)量株,割膠產(chǎn)量的方差分別為的方差分別為936.36(ml/株)株)2和和800.89(ml/株)株) 2()這是兩個樣本(成組數(shù)據(jù))平均數(shù)比較的假設(shè)檢()這是兩個樣本(成組數(shù)據(jù))平均數(shù)比較的假設(shè)檢驗,驗,1 12 2和和2 22 2未知未知, , n130且且n230 ,用,用

19、u u檢驗。檢驗。()因事先不知兩品種產(chǎn)量孰高孰低,用雙尾檢驗。()因事先不知兩品種產(chǎn)量孰高孰低,用雙尾檢驗。試檢驗兩個橡膠品種在割膠產(chǎn)量上是否有顯著差別。試檢驗兩個橡膠品種在割膠產(chǎn)量上是否有顯著差別。()假設(shè)()假設(shè)(2)水平)水平(3)檢驗)檢驗(4)推斷)推斷H0:1 2,即認(rèn)為兩品種割膠產(chǎn)量沒有顯著差別。,即認(rèn)為兩品種割膠產(chǎn)量沒有顯著差別。HA: 1 2選取顯著水平選取顯著水平0.01 在在0.01顯著水平上,否定顯著水平上,否定H0,接受,接受HA;兩個橡膠品種的割膠產(chǎn)量存在極顯著的差別,兩個橡膠品種的割膠產(chǎn)量存在極顯著的差別,“42-67XRRIM603” 割膠產(chǎn)量極顯著高于割膠產(chǎn)

20、量極顯著高于“42-67XPB86”。951.422212121nsnssxx595.3951.46.774.95)(2121 xxsxxuu 2.58,P 0.012、兩個總體方差12 和22未知,且兩個樣本都是小樣本,即n130且n20.05916. 12121xxsxxtdf=(ndf=(n1 1-1)+(n-1)+(n2 2-1)=17-1)=172) 2) 1 12 22 22 2,n n1 1 n n2 2,采用近似地,采用近似地t t檢驗,即檢驗,即 Aspin-Welch Aspin-Welch檢驗法。檢驗法。22212121nsnssxx1)1 (112212nRnRdf22

21、2121121222211nsnsnssssRxxx2121xxdfsxxt(3 3)1 12 22 22 2,n n1 1=n=n2 2=n=n ) 1() 1() 1() 1(212221212nnnsnsseSe22 221221nsnsseexx21)()(2121xxsxxtdf=n-1df=n-1平均數(shù)差數(shù)的標(biāo)準(zhǔn)誤平均數(shù)差數(shù)的標(biāo)準(zhǔn)誤nssexx2221當(dāng)當(dāng)n1=n2=n時時22212121nsnssxx成對(配對)比較法:將獨立獲得的若干份實驗材成對(配對)比較法:將獨立獲得的若干份實驗材料各分成兩部分或獨立獲得的若干對遺傳上基本同料各分成兩部分或獨立獲得的若干對遺傳上基本同質(zhì)的個

22、體,分別接受兩種不同的處理;或者同一個質(zhì)的個體,分別接受兩種不同的處理;或者同一個實驗對象先后接受兩種不同處理,比較不同的處理實驗對象先后接受兩種不同處理,比較不同的處理效應(yīng),這種安排稱為配對實驗設(shè)計。效應(yīng),這種安排稱為配對實驗設(shè)計。 成對數(shù)據(jù),由于同一配對內(nèi)兩個供試單位的試驗成對數(shù)據(jù),由于同一配對內(nèi)兩個供試單位的試驗條件很是接近,而不同配對間的條件差異又可通過條件很是接近,而不同配對間的條件差異又可通過同一配對的差數(shù)予以消除,因而可以控制試驗誤差,同一配對的差數(shù)予以消除,因而可以控制試驗誤差,具有較高的精確度。具有較高的精確度。21xxd212121)(xxnxnxnxxdnd樣本差數(shù)的平均

23、數(shù)等于樣本平均數(shù)的差數(shù)樣本差數(shù)的平均數(shù)等于樣本平均數(shù)的差數(shù)1)(22221)(nndddndds) 1()() 1()(2222nnnddnnddnssddddsdtdsdt 樣本差數(shù)的方差樣本差數(shù)的方差樣本差數(shù)平均數(shù)樣本差數(shù)平均數(shù)的標(biāo)準(zhǔn)誤的標(biāo)準(zhǔn)誤t 值值EAEA試檢驗兩組飼料對試驗動物肝中試檢驗兩組飼料對試驗動物肝中VA含量的作用有無顯著差異。含量的作用有無顯著差異。()假設(shè)()假設(shè)(2)水平)水平(3)檢驗)檢驗H0:d0 HA: d 00.01 5 .812ndd857.2983921)(222nnddds13.1932nssdd207.4dsdt(4)推斷)推斷在在0.01顯著水平上,

24、否定顯著水平上,否定H0,接受,接受HA;兩組飼料對動物肝中兩組飼料對動物肝中VA含量作用有極顯著差異,正含量作用有極顯著差異,正常飼料組的動物肝中的常飼料組的動物肝中的VA含量極顯著高于含量極顯著高于VE缺乏組。缺乏組。t 0.01(7) = 3.499 t t 0.01(7) 7181 ndf8n 6500d 73700002d發(fā)芽發(fā)芽不發(fā)芽不發(fā)芽存活存活死亡死亡結(jié)實結(jié)實不結(jié)實不結(jié)實紅花紅花白花白花合格合格不合格不合格當(dāng)當(dāng) np 或或 nq5由二項式由二項式 (p+q)n 展開式直接檢驗展開式直接檢驗xnxxnqpCxP)(概率函數(shù)概率函數(shù) Cnxpxqn-x P(x) P(0) C50p

25、0q5 0.00001 P(1) C51p1q4 0.00045 P(2) C52p2q3 0.0081 P(3) C53p3q2 0.0729 P(4) C54p4q1 0.32805 P(5) C55p5q0 0.59049孵化小雞的概率表孵化小雞的概率表(p= 0.90 q=0.10)P(0)或P(1)或P(2) 0.05,差異不顯著。當(dāng)當(dāng) np 和和 nq 30正態(tài)分布正態(tài)分布當(dāng)當(dāng) 5np 或或 nq 30,不需連續(xù)性矯正,則,不需連續(xù)性矯正,則u值為:值為:npqnppnnpqppppup/在在二項分布二項分布中,事件中,事件A發(fā)生的頻率發(fā)生的頻率 x/n稱為二項稱為二項成數(shù),即百分

26、數(shù)或成數(shù),即百分?jǐn)?shù)或頻率頻率。則。則頻率的平均數(shù)頻率的平均數(shù)和和標(biāo)準(zhǔn)標(biāo)準(zhǔn)誤誤分別為:(見分別為:(見P33)pppcnnppnnppnppu5.05.05.0)(2、當(dāng)、當(dāng) 5np 或或 nq30時,趨近正態(tài),需要進行連續(xù)性矯時,趨近正態(tài),需要進行連續(xù)性矯正,正,n30,u檢驗,檢驗,uc值為:值為:如果如果np時取時取“”; 30 ,無需連續(xù)矯正,用,無需連續(xù)矯正,用u檢驗;檢驗;()假設(shè)()假設(shè)(2)水平)水平(3)檢驗)檢驗(4)推斷)推斷H0:p=0.85即用種衣劑浸種后的發(fā)芽率仍為即用種衣劑浸種后的發(fā)芽率仍為0.85; HA:p0.85選取顯著水平選取顯著水平0.05 89. 050

27、0445nxpu 1.96,P 30,不需連續(xù)性矯正,用,不需連續(xù)性矯正,用u檢驗:檢驗:212121)()(ppsppppu在在H0: p1 = p2下,下,2121ppsppu212121215 . 05 . 0)()(ppcsnnppppu2、當(dāng)、當(dāng) 5 np 或或 nq 30 ,用用u檢驗:檢驗:在在H0: p1 = p2下,下,2121215 . 05 . 0ppcsnnppu212121215 . 05 . 0)()(ppcsnnppppt2、當(dāng)、當(dāng) 5 np 或或 nq 30,需進行連續(xù)性矯正,需進行連續(xù)性矯正, 如果如果n 30 ,無需連續(xù)矯正,用,無需連續(xù)矯正,用u檢驗;檢驗

28、;()假設(shè)()假設(shè)(2)水平)水平(3)檢驗)檢驗H0: p1=p2即兩塊麥田銹病發(fā)病率沒有顯著差異。即兩塊麥田銹病發(fā)病率沒有顯著差異。 HA: p1 p2選取顯著水平選取顯著水平0.01 905. 0378342111nxp790. 0396313222nxp846.03963783133422121nnxxp154.01pq026. 0)11(2121nnqpspp在在0.01顯著水平上,否定顯著水平上,否定H0,接受,接受HA;認(rèn)為兩塊麥田銹病發(fā)病率有極顯著差異,即地認(rèn)為兩塊麥田銹病發(fā)病率有極顯著差異,即地勢對小麥銹病的發(fā)生有極顯著影響作用,低洼勢對小麥銹病的發(fā)生有極顯著影響作用,低洼地

29、小麥銹病的發(fā)病率極顯著高于高坡地。地小麥銹病的發(fā)病率極顯著高于高坡地。(4)推斷)推斷u2.58,P0.01423. 42121 ppsppu第四節(jié):參數(shù)的區(qū)間估計與點估計第四節(jié):參數(shù)的區(qū)間估計與點估計一、參數(shù)區(qū)間估計與點估計的原理一、參數(shù)區(qū)間估計與點估計的原理三、兩個總體平均數(shù)差數(shù)的區(qū)間估計與點估計三、兩個總體平均數(shù)差數(shù)的區(qū)間估計與點估計二、總體平均數(shù)的區(qū)間估計與點估計二、總體平均數(shù)的區(qū)間估計與點估計四、總體頻率、兩個總體頻率差數(shù)的區(qū)間估計與點估計四、總體頻率、兩個總體頻率差數(shù)的區(qū)間估計與點估計參數(shù)的區(qū)間估計與點估計是建立在一定理論基礎(chǔ)參數(shù)的區(qū)間估計與點估計是建立在一定理論基礎(chǔ)上的一種方法。

30、上的一種方法。由中心極限定理和大數(shù)定律,只要抽樣為大樣本,由中心極限定理和大數(shù)定律,只要抽樣為大樣本,不論其總體是否為正態(tài)分布,其樣本平均數(shù)都近似不論其總體是否為正態(tài)分布,其樣本平均數(shù)都近似服從正態(tài)分布服從正態(tài)分布N(N(,2 2/n)/n)。 00.950.95(接受區(qū))(接受區(qū))0.0250.025臨界值臨界值接受區(qū)接受區(qū) 0-1.96 x 0+1.96 xxu95. 0)96. 196. 1(xxxP05. 0)96. 1()96. 1(xxxPxP99. 0)58. 258. 2(xxxP01. 0)58. 2()58. 2(xxxPxP95. 0)96. 196. 1(xxxP99.

31、 0)58. 258. 2(xxxP95. 0)96. 196. 1(xxxP95. 0)96. 196. 1(xxxxP95. 0)96. 196. 1(xxxxP95. 0)96. 196. 1(xxxxP99. 0)58. 258. 2(xxxxP95. 0)96. 196. 1(xxxxP1)(xxuxuxP99. 0)58. 258. 2(xxxxPu:正態(tài)分布下置信度:正態(tài)分布下置信度P=1- 時的時的u臨界值臨界值1- :置信水平:置信水平1)(xxuxuxP知道知道 x ,但不知道,但不知道1- 置信區(qū)間、置信距置信區(qū)間、置信距),(xxuxux),(21xxuxLuxL用樣本

32、平均數(shù)用樣本平均數(shù) x 對總體平均數(shù)對總體平均數(shù)的置信度為的置信度為P=1-的區(qū)間估計。的區(qū)間估計。xuxL用樣本平均數(shù)用樣本平均數(shù) x 對總體平均數(shù)對總體平均數(shù)的置信度為的置信度為P=1-的點估計。的點估計。參數(shù)的區(qū)間估計也可用于假設(shè)檢驗。參數(shù)的區(qū)間估計也可用于假設(shè)檢驗。對參數(shù)所進行的假設(shè)如果落在該區(qū)間之外,就說明對參數(shù)所進行的假設(shè)如果落在該區(qū)間之外,就說明這個假設(shè)與真實情況有本質(zhì)的不同,因而就否定零這個假設(shè)與真實情況有本質(zhì)的不同,因而就否定零假設(shè),接受備擇假設(shè)。假設(shè),接受備擇假設(shè)。置信區(qū)間是在一定置信度置信區(qū)間是在一定置信度P=1-P=1-下總體參數(shù)的所在下總體參數(shù)的所在范圍,故對參數(shù)所進

33、行的假設(shè)如果落在該區(qū)間內(nèi),范圍,故對參數(shù)所進行的假設(shè)如果落在該區(qū)間內(nèi),就說明這個假設(shè)與真實情況沒有不同,因而就可以就說明這個假設(shè)與真實情況沒有不同,因而就可以接受零假設(shè)。接受零假設(shè)。無論區(qū)間估計還是點估計,都與概率顯著水無論區(qū)間估計還是點估計,都與概率顯著水平平的大小聯(lián)系在一起。的大小聯(lián)系在一起。越小,則相應(yīng)的置信區(qū)間就越大,也就是越小,則相應(yīng)的置信區(qū)間就越大,也就是說用樣本平均數(shù)對總體平均數(shù)估計的可靠程說用樣本平均數(shù)對總體平均數(shù)估計的可靠程度越高,但這時估計的精度就降低了。度越高,但這時估計的精度就降低了。在實際應(yīng)用中,應(yīng)合理選取概率顯著水平在實際應(yīng)用中,應(yīng)合理選取概率顯著水平的大小,不能認(rèn)

34、為的大小,不能認(rèn)為取值越小越好。取值越小越好。二、總體平均數(shù)二、總體平均數(shù)的區(qū)間估計和點的區(qū)間估計和點估計估計 當(dāng)為大樣本時,不論總體方差當(dāng)為大樣本時,不論總體方差2為已為已知或未知,可以利用樣本平均數(shù)知或未知,可以利用樣本平均數(shù) x 和總體和總體方差方差2作出置信度為作出置信度為P1-的總體平均數(shù)的總體平均數(shù)的區(qū)間估計為:的區(qū)間估計為:),(21xxuxLuxLxuxL1xuxL2其置信區(qū)間的下限其置信區(qū)間的下限L1和上限和上限L2為為總體平均數(shù)的點估計總體平均數(shù)的點估計L為為xuxL 當(dāng)樣本為小樣本且總體方差當(dāng)樣本為小樣本且總體方差2未知時,未知時, 2需由樣本方差需由樣本方差s2來估計,

35、于是置信度為來估計,于是置信度為P1-的總體平均數(shù)的總體平均數(shù)的置信區(qū)間可估計的置信區(qū)間可估計為為),(xxstxstx其置信區(qū)間的下限其置信區(qū)間的下限L1和上限和上限L2為:為:),(21xxstxLstxL總體平均數(shù)的點估計總體平均數(shù)的點估計L為:為: xstxLt為正態(tài)分布下置信度為正態(tài)分布下置信度P1 時的時的t臨界值臨界值 例例4.14測得某批測得某批25個小麥樣本的平均蛋白質(zhì)含個小麥樣本的平均蛋白質(zhì)含量量14.5,已知,已知2.50,試進行,試進行95置置信度下的蛋白質(zhì)含量的區(qū)間估計和點估計。信度下的蛋白質(zhì)含量的區(qū)間估計和點估計。 分析:本例分析:本例為已知為已知, ,置信度置信度

36、P P1- 1- =0.95=0.95,u u0.050.05=1.96=1.96。(%)52.1350. 096. 15 .141xuxL(%)48.1550. 096. 15 .142xuxL98. 05 .1450. 096. 15 .14xuxL蛋白質(zhì)含量的點估計為:蛋白質(zhì)含量的點估計為:說明小麥蛋白質(zhì)含量有說明小麥蛋白質(zhì)含量有95的把握落的把握落在在13.5215.48的區(qū)間里。的區(qū)間里。三、兩個總體平均數(shù)差數(shù)三、兩個總體平均數(shù)差數(shù) 1 1-2 2的區(qū)間估計與點估計的區(qū)間估計與點估計當(dāng)兩個總體方差當(dāng)兩個總體方差1 12 2和和2 22 2為已知,或總體方差為已知,或總體方差12和和2

37、2未知但為大樣本時,在置信度為未知但為大樣本時,在置信度為P1- 下,下,兩個總體平均數(shù)差數(shù)兩個總體平均數(shù)差數(shù)1 1- -2 2的區(qū)間估計為:的區(qū)間估計為:2121)( ,2121xxxxuxxuxx2121xxuxxL兩個總體平均數(shù)差數(shù)兩個總體平均數(shù)差數(shù) 1 1-2 2的點估計為的點估計為其置信區(qū)間的下限其置信區(qū)間的下限1和上限和上限L2為:為:2121)(,212211xxxxuxxLuxxL當(dāng)兩個樣本為小樣本,總體方差當(dāng)兩個樣本為小樣本,總體方差12和和22未知,當(dāng)兩總體方差相等,即未知,當(dāng)兩總體方差相等,即12 22 2時,可由兩樣本方差時,可由兩樣本方差s12和和s22估計總估計總體

38、方差體方差12和和22,在置信度為在置信度為P1- 下,下,兩總體平均數(shù)差數(shù)兩總體平均數(shù)差數(shù) 1 1-2 2的區(qū)間估計為:的區(qū)間估計為:2121)( ,2121xxxxstxxstxx兩個總體平均數(shù)差數(shù)兩個總體平均數(shù)差數(shù) 1 1-2 2的點估計為:的點估計為:2121xxstxxL其置信區(qū)間的下限其置信區(qū)間的下限1和上限和上限L2為:為:2121)(,212211xxxxstxxLstxxL當(dāng)兩個樣本為小樣本,總體方差當(dāng)兩個樣本為小樣本,總體方差12和和22未未知,且兩總體方差不相等,即知,且兩總體方差不相等,即12 22時,可時,可由兩樣本方差由兩樣本方差s12和和s22對總體方差對總體方差12和和22的估的估計而算出的計而算出的t值,已不是自由度值,已不是自由度dfn1+n2-2的的t分布,而是近似的服從自由度分布,而是近似的服從自由度df 的的t分布,分布,在在置信度為置信度為P1-下,兩總體平均數(shù)差數(shù)下,兩總體平均數(shù)差數(shù) 1 1-2 2的的區(qū)間估計為:區(qū)間估計為:2121)(21)(21)( ,xxdfxxdfstxxstxx其置信區(qū)間的下限其置信區(qū)間的下限1和上限和上限L2為:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論