次數(shù)資料分析之檢驗(yàn)_第1頁(yè)
次數(shù)資料分析之檢驗(yàn)_第2頁(yè)
次數(shù)資料分析之檢驗(yàn)_第3頁(yè)
次數(shù)資料分析之檢驗(yàn)_第4頁(yè)
次數(shù)資料分析之檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 第七章 次數(shù)資料分析c2檢驗(yàn)前面介紹了計(jì)量資料的統(tǒng)計(jì)分析方法¾¾t檢驗(yàn)法與方差分析法。在畜牧、水產(chǎn)等科學(xué)研究中,除了分析計(jì)量資料以外,還常常需要對(duì)次數(shù)資料、等級(jí)資料進(jìn)行分析。等級(jí)資料實(shí)際上也是一種次數(shù)資料。次數(shù)資料服從二項(xiàng)分布或多項(xiàng)分布,其統(tǒng)計(jì)分析方法不同于服從正態(tài)分布的計(jì)量資料。本章將分別介紹對(duì)次數(shù)資料、等級(jí)資料進(jìn)行統(tǒng)計(jì)分析的方法。第一節(jié) 統(tǒng)計(jì)量與分布一、統(tǒng)計(jì)量的意義為了便于理解,現(xiàn)結(jié)合一實(shí)例說(shuō)明 (讀作卡方) 統(tǒng)計(jì)量的意義。根據(jù)遺傳學(xué)理論,動(dòng)物的性別比例是1:1。統(tǒng)計(jì)某羊場(chǎng)一年所產(chǎn)的876只羔羊中,有公羔428只,母羔448只。按1:1的性別比例計(jì)算,公、母羔均應(yīng)為4

2、38只。以A表示實(shí)際觀察次數(shù),T表示理論次數(shù),可將上述情況列成表7-1。表7-1 羔羊性別實(shí)際觀察次數(shù)與理論次數(shù)性別實(shí)際觀察次數(shù)A理論次數(shù)TA-T(A-T)2/T公428()438()-100.2283母448()438()100.2283合計(jì)87687600.4566從表7-1看到,實(shí)際觀察次數(shù)與理論次數(shù)存在一定的差異,這里公、母各相差10只。這個(gè)差異是屬于抽樣誤差(把對(duì)該羊場(chǎng)一年所生羔羊的性別統(tǒng)計(jì)當(dāng)作是一次抽樣調(diào)查)、還是羔羊性別比例發(fā)生了實(shí)質(zhì)性的變化?要回答這個(gè)問(wèn)題,首先需要確定一個(gè)統(tǒng)計(jì)量用以表示實(shí)際觀察次數(shù)與理論次數(shù)偏離的程度;然后判斷這一偏離程度是否屬于抽樣誤差,即進(jìn)行顯著性檢驗(yàn)。為

3、了度量實(shí)際觀察次數(shù)與理論次數(shù)偏離的程度,最簡(jiǎn)單的辦法是求出實(shí)際觀察次數(shù)與理論次數(shù)的差數(shù)。從表7-1看出:A1-T1 =-10,A2-T2=10,由于這兩個(gè)差數(shù)之和為0,顯然不能用這兩個(gè)差數(shù)之和來(lái)表示實(shí)際觀察次數(shù)與理論次數(shù)的偏離程度。為了避免正、負(fù)抵消,可將兩個(gè)差數(shù)A1-T1、A2-T2平方后再相加,即計(jì)算(A-T)2,其值越大,實(shí)際觀察次數(shù)與理論次數(shù)相差亦越大,反之則越小。但利用(A-T)2表示實(shí)際觀察次數(shù)與理論次數(shù)的偏離程度尚有不足。例如某一組實(shí)際觀察次數(shù)為505、理論次數(shù)為500,相差5;而另一組實(shí)際觀察次數(shù)為26、理論次數(shù)為21,相差亦為5。顯然這兩組實(shí)際觀察次數(shù)與理論次數(shù)的偏離程度是不

4、同的。因?yàn)榍罢呤窍鄬?duì)于理論次數(shù)500相差5,后者是相對(duì)于理論次數(shù)21相差5。為了彌補(bǔ)這一不足,可先將各差數(shù)平方除以相應(yīng)的理論次數(shù)后再相加,并記之為,即 (7-1)也就是說(shuō)是度量實(shí)際觀察次數(shù)與理論次數(shù)偏離程度的一個(gè)統(tǒng)計(jì)量,c2越小,表明實(shí)際觀察次數(shù)與理論次數(shù)越接近;=0,表示兩者完全吻合;越大,表示兩者相差越大。對(duì)于表7-1的資料,可計(jì)算得=表明實(shí)際觀察次數(shù)與理論次數(shù)是比較接近的。二、分布上面在屬于離散型隨機(jī)變量的次數(shù)資料的基礎(chǔ)上引入了統(tǒng)計(jì)量,它近似地服從統(tǒng)計(jì)學(xué)中一種連續(xù)型隨機(jī)變量的概率分布¾¾分布。下面對(duì)統(tǒng)計(jì)學(xué)中的分布作一簡(jiǎn)略介紹。設(shè)有一平均數(shù)為、方差為的正態(tài)總體?,F(xiàn)從此總

5、體中獨(dú)立隨機(jī)抽取n個(gè)隨機(jī)變量:x1、x2、xn,并求出其標(biāo)準(zhǔn)正態(tài)離差:, ,,記這n個(gè)相互獨(dú)立的標(biāo)準(zhǔn)正態(tài)離差的平方和為:= (7-2)它服從自由度為n的分布,記為c2 (n);若用樣本平均數(shù)代替總體平均數(shù),則隨機(jī)變量c2= (7-3)服從自由度為n-1的分布,記為因此,分布是由正態(tài)總體隨機(jī)抽樣得來(lái)的一種連續(xù)型隨機(jī)變量的分布。顯然,0,即的取值圍是0,+);分布密度曲線是隨自由度不同而改變的一組曲線。隨自由度的增大,曲線由偏斜漸趨于對(duì)稱;df30時(shí),接近平均數(shù)為的正態(tài)分布。圖7-1給出了幾個(gè)不同自由度的概率分布密度曲線。 圖7-1 幾個(gè)自由度的概率分布密度曲線三、的連續(xù)性矯正由(7-1)式計(jì)算的

6、只是近似地服從連續(xù)型隨機(jī)變量分布。在對(duì)次數(shù)資料進(jìn)行檢驗(yàn)利用連續(xù)型隨機(jī)變量分布計(jì)算概率時(shí),常常偏低,特別是當(dāng)自由度為1時(shí)偏差較大。Yates(1934)提出了一個(gè)矯正公式,矯正后的值記為:= (7-4)當(dāng)自由度大于1時(shí),(7-1)式的分布與連續(xù)型隨機(jī)變量分布相近似,這時(shí),可不作連續(xù)性矯正,但要求各組的理論次數(shù)不小于5。若某組的理論次數(shù)小于5,則應(yīng)把它與其相鄰的一組或幾組合并,直到理論次數(shù)大于5為止。第二節(jié) 適合性檢驗(yàn)一、適合性檢驗(yàn)的意義判斷實(shí)際觀察的屬性類別分配是否符合已知屬性類別分配理論或?qū)W說(shuō)的假設(shè)檢驗(yàn)稱為適合性檢驗(yàn)。在適合性檢驗(yàn)中,無(wú)效假設(shè)為H0:實(shí)際觀察的屬性類別分配符合已知屬性類別分配的

7、理論或?qū)W說(shuō);備擇假設(shè)為HA:實(shí)際觀察的屬性類別分配不符合已知屬性類別分配的理論或?qū)W說(shuō)。并在無(wú)效假設(shè)成立的條件下,按已知屬性類別分配的理論或?qū)W說(shuō)計(jì)算各屬性類別的理論次數(shù)。因所計(jì)算得的各個(gè)屬性類別理論次數(shù)的總和應(yīng)等于各個(gè)屬性類別實(shí)際觀察次數(shù)的總和,即獨(dú)立的理論次數(shù)的個(gè)數(shù)等于屬性類別分類數(shù)減1。也就是說(shuō),適合性檢驗(yàn)的自由度等于屬性類別分類數(shù)減1。若屬性類別分類數(shù)為k,則適合性檢驗(yàn)的自由度為k-1 。然后根據(jù)(7-1)或(7-4)計(jì)算出c2或c2c。將所計(jì)算得的c2或c2c值與根據(jù)自由度k-1查c2值表(附表8)所得的臨界c2值:c20.05、c20.01比較:若c2 (或c2c)c20.05,P0.

8、05,表明實(shí)際觀察次數(shù)與理論次數(shù)差異不顯著,可以認(rèn)為實(shí)際觀察的屬性類別分配符合已知屬性類別分配的理論或?qū)W說(shuō);若c20.05c2 (或c2c)c20.01,0.01P0.05,表明實(shí)際觀察次數(shù)與理論次數(shù)差異顯著,實(shí)際觀察的屬性類別分配不符合已知屬性類別分配的理論或?qū)W說(shuō);若c2 ( 或c2c)c20.01,P0.01,表明實(shí)際觀察次數(shù)與理論次數(shù)差異極顯著,實(shí)際觀察的屬性類別分配極顯著不符合已知屬性類別分配的理論或?qū)W說(shuō)。二、適合性檢驗(yàn)的方法下面結(jié)合實(shí)例說(shuō)明適合性檢驗(yàn)方法。例7.1 在進(jìn)行山羊群體遺傳檢測(cè)時(shí),觀察了260只白色羊與黑色羊雜交的子二代毛色,其中181只為白色,79只為黑色,問(wèn)此毛色的比率

9、是否符合孟德?tīng)栠z傳分離定律的31比例?檢驗(yàn)步驟如下:(一)提出無(wú)效假設(shè)與備擇假設(shè)H0:子二代分離現(xiàn)象符合31的理論比例。HA:子二代分離現(xiàn)象不符合31的理論比例。(二)選擇計(jì)算公式 由于本例是涉與到兩組毛色(白色與黑色),屬性類別分類數(shù)k=2,自由度df=k-1=2-1=1,須使用公式(74)來(lái)計(jì)算。(三)計(jì)算理論次數(shù) 根據(jù)理論比率31求理論次數(shù):白色理論次數(shù):T1=260×3/4=195黑色理論次數(shù):T2=260×1/4=65或 T2=260-T1=260-195=65(四)計(jì)算表72 c2c計(jì)算表性 狀實(shí)際觀察次數(shù)(A)理論次數(shù)(T)A-T白 色181195-140.9

10、35黑 色7965+142.804總 和26026003.739(五)查臨界c2值,作出統(tǒng)計(jì)推斷 當(dāng)自由度df=1時(shí),查得c20.05(1)=3.84,計(jì)算的c2c<c20.05(1),故P>0.05,不能否定H0,表明實(shí)際觀察次數(shù)與理論次數(shù)差異不顯著,可以認(rèn)為白色羊與黑色羊的比率符合孟德?tīng)栠z傳分離定律31的理論比例。例7.2 在研究牛的毛色和角的有無(wú)兩對(duì)相對(duì)性狀分離現(xiàn)象時(shí),用黑色無(wú)角牛和紅色有角牛雜交,子二代出現(xiàn)黑色無(wú)角牛192頭,黑色有角牛78頭,紅色無(wú)角牛72頭,紅色有角牛18頭,共360頭。試問(wèn)這兩對(duì)性狀是否符合孟德?tīng)栠z傳規(guī)律中9331的遺傳比例?檢驗(yàn)步驟:(一)提出無(wú)效假

11、設(shè)與備擇假設(shè)H0:實(shí)際觀察次數(shù)之比符合9331的理論比例。HA:實(shí)際觀察次數(shù)之比不符合9331的分離理論比例。(二)選擇計(jì)算公式 由于本例的屬性類別分類數(shù)k=4:自由度df=k-1=4-1=3>1,故利用(71)式計(jì)算。(三)計(jì)算理論次數(shù) 依據(jù)各理論比率9:3:3:1計(jì)算理論次數(shù):黑色無(wú)角牛的理論次數(shù)T1:360×9/16=202.5;黑色有角牛的理論次數(shù)T2:360×3/16=67.5;紅色無(wú)角牛的理論次數(shù)T3:360×3/16=67.5;紅色有角牛的理論次數(shù)T4:360×1/16=22.5?;?T4=360-202.5-67.5-67.5=22

12、.5(四)列表計(jì)算表73 計(jì)算表類 型實(shí)際觀察次數(shù)A理論次數(shù)TA-T(A-T)2/T黑色無(wú)角牛192(A1)202.5(T1)-10.50.5444黑色有角牛78(A2)67.5(T2)+10.51.6333紅色無(wú)角牛72(A3)67.5(T3)+4.51.6333紅色有角牛18(A4)22.5(T4)-4.50.9000總 計(jì)36036004.711=0.5444+1.6333+1.6333+0.9=4.711(五)查臨界值,作出統(tǒng)計(jì)推斷 當(dāng)df=3時(shí),c20.05(3)=7.815,因<0。05(3),P>0.05,不能否定H0 ,表明實(shí)際觀察次數(shù)與理論次數(shù)差異不顯著,可以認(rèn)為

13、毛色與角的有無(wú)兩對(duì)性狀雜交二代的分離現(xiàn)象符合孟德?tīng)栠z傳規(guī)律中9331的遺傳比例。*三、顯著性檢驗(yàn)的再分割法當(dāng)實(shí)際觀察次數(shù)與理論次數(shù)經(jīng)檢驗(yàn)差異顯著或極顯著時(shí),還應(yīng)對(duì)其結(jié)果進(jìn)行再分割檢驗(yàn),下面舉例說(shuō)明。例7.3 兩對(duì)相對(duì)性狀雜交子二代4種表現(xiàn)型A-B-、A-bb、aaB-、aabb的觀察次數(shù)依次為152、39、53、6,問(wèn)這兩對(duì)相對(duì)性狀的遺傳是否符合孟德?tīng)栠z傳規(guī)律中9331的比例。檢驗(yàn)步驟同例7.2,計(jì)算結(jié)果見(jiàn)表74。表74 計(jì)算表表現(xiàn)型實(shí)際觀察次數(shù)A理論次數(shù)TA-T(A-T)2/TA-B-152140.62511.3750.920A-bb3946.875-7.8751.323aa B-5346.

14、8756.1250.800aa bb615.625-9.6255.929總 和2502500=8.972表中理論次數(shù)依9331理論比率計(jì)算:A-B-的理論次數(shù)T1:250×9/16=140.625;A-bb的理論次數(shù)T2=aaB-的理論次數(shù)T3:250×3/16=46.875;aa bb的理論次數(shù)T4:250×1/16=15.625?;?T4=250-140.625-46.875-46.875=15.625由表75可知c2=8.972,由df=3查c2值表得:c20.05(3)=7.815,c20.01(3)=11.345。因?yàn)閏20.05(3)<c2<

15、;c20.01(3), 故0.01<P<0.05,表明實(shí)際觀察次數(shù)與理論觀察次數(shù)差異顯著,即該資料不符合9331的遺傳規(guī)律,有必要進(jìn)一步檢驗(yàn),以具體確定哪樣的表現(xiàn)型的實(shí)際觀察次數(shù)不符合9331的比例。這時(shí)須采用c2檢驗(yàn)的再分割法。c2檢驗(yàn)的再分割法的具體作法是:將一列聯(lián)表的總c2統(tǒng)計(jì)量,分割為數(shù)目等于該表總自由度的多個(gè)分量。每個(gè)分量的c2值對(duì)應(yīng)于由原始數(shù)據(jù)所產(chǎn)生的一特殊列聯(lián)表,且每個(gè)分量獨(dú)立于其它分量,這樣各分量的c2值之和等于總c2值。這種可加性只有在所分割的列聯(lián)表是相互獨(dú)立、各分量的c2值不作矯正的條件下成立。下面我們利用c2檢驗(yàn)的再分割法對(duì)例7.3的資料進(jìn)行進(jìn)一步檢驗(yàn)。1.

16、檢驗(yàn)A-B-,A-bb,aaB- 3種表現(xiàn)型是否符合933的比例。分割后c2值(記為)的計(jì)算見(jiàn)表75。表75 計(jì)算表(理論比例933)表現(xiàn)型實(shí)際觀察次數(shù)A理論次數(shù)TA-T(A-T)2/TA-B-152146.4005.6000.214A-bb3948.800-9.8001.968aaB-5348.8004.2000.361總和24424402.543=0.214+1.968+0.361=2.543由df1=3-1=2,查c2值表得,c20.05(2)=5.991,<c20.05,P>0.05,表明實(shí)際觀察次數(shù)與理論觀察次數(shù)差異不顯著,可以認(rèn)為3種表現(xiàn)型符合933的理論比例。于是,我

17、們?cè)俜治霰憩F(xiàn)型aabb是否與其它三種表現(xiàn)型的合并組比例不符合1:15的理論比例。2. 檢驗(yàn)aabb表現(xiàn)型與其它三種表現(xiàn)型的合并組是否符合1:15的比例,分割后c2值(記為)的計(jì)算見(jiàn)表7-6。表76 分割表(理論比例115)表現(xiàn)型實(shí)際觀察次數(shù)A理論次數(shù)TA-T(A-T)2/Taabb615.625-9.6255.929其它三種表現(xiàn)型合并組244234.3759.6250.395總 和250250.00006.324=5.929+0.395=6.324由df2=2-1=1,查c2表得,c20.05(12)=3.841,c20.05(1)=6.635,由于c20.05(1)<c22<c2

18、0.01(1),故0.01<P<0.05,表明實(shí)際觀察次數(shù)與理論次數(shù)差異顯著,即aabb表現(xiàn)型與其它三種表現(xiàn)型組合不符合115的比例,這樣的結(jié)論可為我們進(jìn)一步研究這個(gè)問(wèn)題提供線索。c2經(jīng)分割后,=2.543,=6.324,+=8.867與總c2=8.922略有差異,這是由于計(jì)算的舍入誤差所造成;總自由度df=3,df1=2,df2=1,所以總df=df1+df2。如果分割后c2值或自由度之和不等于c2值或總自由度,說(shuō)明所分割的列聯(lián)表相互不獨(dú)立。*四、資料分布類型的適合性檢驗(yàn)實(shí)際觀測(cè)得來(lái)的資料是否服從某種理論分布,亦可應(yīng)用適合性檢驗(yàn)來(lái)判斷。在正態(tài)分布的適合性檢驗(yàn)中,由于理論次數(shù)是由樣

19、本總次數(shù)、平均數(shù)與標(biāo)準(zhǔn)差決定的,用去3個(gè)自由度,所以自由度為k-3(k為組數(shù));而在二項(xiàng)分布和波松分布的適合性檢驗(yàn)中,由于其理論次數(shù)由總次數(shù)與均數(shù)求得,喪失2個(gè)自由度,所以自由度為k-2。但應(yīng)注意,當(dāng)組段理論次數(shù)小于5時(shí),必須與相鄰組段進(jìn)行合并,直至合并的理論次數(shù)大于5時(shí)為止。下面分別舉例說(shuō)明。(一)實(shí)際觀測(cè)資料服從正態(tài)分布的適合性檢驗(yàn)例7.4 檢驗(yàn)200頭大白豬仔豬一月窩重的資料是否服從正態(tài)分布。表77 200頭大白豬仔豬一月齡窩重服從正態(tài)分布的適合性檢驗(yàn)表組限(1)組中值(x)(2)實(shí)際次數(shù)(f)(3)上限(l)(4)l-(5)u=(x-)/Sc (6)累加概率(a)(7)各組概率(8)理

20、論次數(shù)(9)c2(10)<88¾16¾122004 10681624-57.6-49.6-41.6-2.57-2.21-1.850.00510.01360.03220.00510.00850.01861.0161.704 6.443.7201.968024¾28932-33.6-1.500.06680.03466.9200.625232¾361040-25.6-1.140.12710.060312.0600.351940¾441348-17.6-0.780.21770.090618.1201.446748¾521756-9.6-

21、0.430.33360.115923.1801.647656¾602664-1.6-0.070.47210.138527.7000.104364¾6835726.40.290.61410.142028.4001.533872¾76288014.40.640.73890.124824.9600.370380¾84218822.41.000.84130.102420.4800.013288¾92169630.41.350.91150.070214.0400.273696¾100810438.41.710.95640.04498.9800.

22、1069104-112->12010811643 7011212046.454.42.072.420.98080.992240.02440.01140.00784.8802.288 8.721.5520.3393合計(jì)2001.0000200.008.73081、先將資料(原始數(shù)據(jù)略)整理成次數(shù)分布表,組限、組中值、各組的次數(shù)列于表7-7的(1)、(2)、(3)欄,再將各組上限列于第(4)欄中。2、計(jì)算各組組上限與均數(shù)(=65.6kg)之差,列于第(5)欄。3、計(jì)算校正標(biāo)準(zhǔn)差Sc。由于由分組資料求得的標(biāo)準(zhǔn)差較不分組時(shí)所得標(biāo)準(zhǔn)差為大,故需作校正。4、依公式求各組上限的正態(tài)離差,列入第6欄。如

23、第一組5、設(shè)該資料服從正態(tài)分布,依u值查正態(tài)分布表得各組段的累計(jì)概率(a),列入第(7)欄。如當(dāng)u=-2.57時(shí),a=0.0051,u=0.29時(shí),a=0.6141。6、求出每一組段的概率,列入第(8)欄。由下一組段的累加概率減去本組段的累加概率而得。如8 組段的概率為0.0136-0.0051=0.0085。7、以總數(shù)n=200頭乘以各組概率便得理論次數(shù),列入第(9)欄。凡理論值小于5者應(yīng)加以合并。本例前三組與后三組分別合并。合并后的實(shí)際次數(shù)與理論次數(shù)分別為10與6.44、7與8.72,見(jiàn)第(3)與第(9)欄。8、求各組c2值,列入第(10)欄。9、確定自由度。這里是因?yàn)榍罄碚摯螖?shù)時(shí)用去均數(shù)

24、,標(biāo)準(zhǔn)差與總次數(shù)三個(gè)統(tǒng)計(jì)量,該例經(jīng)合并共12個(gè)組,故df=12-3=9。10、結(jié)論。由df=9查c2表得:c20.05(9)=16.919,而計(jì)算所得的c2值為:c2=8.7808,因?yàn)閏2<c20.05, P>0.05,表明各組實(shí)際次數(shù)與由正態(tài)分布計(jì)算的理論次數(shù)差異不顯著,可以認(rèn)為大白豬仔豬一月窩重服從正態(tài)分布。(二)實(shí)際觀測(cè)資料服從二項(xiàng)分布的適合性檢驗(yàn)例7.5 用800粒牧草種子進(jìn)行發(fā)芽試驗(yàn),分80行,每行10粒種子,共有174粒發(fā)芽。則每粒種子發(fā)芽的概率約為174/800=0.2175,不發(fā)芽的概率約為0.7825(即1-0.2175),每行發(fā)芽種子數(shù)見(jiàn)表78,問(wèn)該資料是否服

25、從二項(xiàng)分布。表78 80行發(fā)芽試驗(yàn)資料服從二項(xiàng)分布的適合性檢驗(yàn)計(jì)算表一行種子發(fā)芽數(shù)實(shí)際行數(shù)A理論概率理論行數(shù)T0123456789106202812860 0 140000.08610.23920.29920.22180.10790.03600.00830.00130.00010.00000.00006.888019.136023.936017.74408.63202.88000.66400.1040 12.36000.08000.00000.00000.11450.03900.69001.85940.2176總 和802.9205表中理論概率由二項(xiàng)分布概率計(jì)算公式:計(jì)算,如;表中的理論行數(shù)由

26、理論概率乘以80行而得,如0.0861´80=6.8880,0.2392´80=19.1360由于表中后6組的理論次數(shù)均小于5,故將后6組與第5組合并為一組。并組以后,資料分為5組。由表78可知,c2=2.9025。由df=5-2=3,查c2值表得:c20.05(3)=7.81,因?yàn)閏2<c20.05,P>0.05,表明實(shí)際行數(shù)與由二項(xiàng)分布計(jì)算得來(lái)的理論行數(shù)差異不顯著,可以認(rèn)為種子發(fā)芽試驗(yàn)的結(jié)果服從二項(xiàng)分布。(三)實(shí)際觀測(cè)資料服從波松分布的適合性檢驗(yàn)例7.6 用顯微鏡檢查某樣品結(jié)核菌的數(shù)目,對(duì)某些視野各小方格的結(jié)核菌數(shù)計(jì)數(shù),然后按不同的結(jié)核菌數(shù)目把格子分類,記錄

27、每類的格子數(shù)。其結(jié)果見(jiàn)表79第(1)、(2)欄。試檢驗(yàn)結(jié)核菌數(shù)是否服從波松分布。1.計(jì)算理論概率 設(shè)結(jié)核菌數(shù)服從波松分布P(),其概率計(jì)算公式為:(75)其中為平均數(shù),且等于方差2。此時(shí)因未知,可利用樣本平均數(shù)來(lái)估計(jì)。利用加權(quán)法求樣本平均數(shù)為:表79 結(jié)核菌數(shù)服從波松分布適合性檢驗(yàn)計(jì)算表結(jié)核菌數(shù)x(1)實(shí)際格子數(shù)(f=A)(2)理論概率(3)理論格子數(shù)(T)(4)(A-T)2/T(5)050.05061190.15115.97080.15782260.225317.82980.17683260.224026.58540.01294210.167126.43200.00715130.099719

28、.71780.0834678951 8110.04960.02110.00790.00265.85282.4898 9.58180.93220.30680.12970.2611總計(jì)1180.9990117.88200.7288將代入(75)式,求得各項(xiàng)理論概率為計(jì)算結(jié)果列于第(3)欄。2.計(jì)算理論次數(shù) 將總次數(shù)N=118乘以各組的理論概率即得各組理論次數(shù)T。計(jì)算結(jié)果列于第(4)欄。由于表后4組的理論次數(shù)小于5,故將后4組與第7組合并為一組,合并后的實(shí)際格子數(shù)為8,理論格子數(shù)為9.5818。3. 計(jì)算c2值 根據(jù)表79第(5)欄的數(shù)據(jù)可得c2值為:因?yàn)榇死?jīng)并組后的分組數(shù)為7;計(jì)算理論次數(shù)利用了

29、樣本平均數(shù)和總次數(shù),所以自由度為7-2=5。當(dāng)df=5時(shí),查c2值表得:c20.05(5)=11.07,因?yàn)閏2<c20.05(5),P>0.05,表明結(jié)核菌的各實(shí)際格子數(shù)與根據(jù)波松分布計(jì)算出的理論格子數(shù)差異不顯著,可以認(rèn)為結(jié)核菌數(shù)服從波松分布。第三節(jié) 獨(dú)立性檢驗(yàn)一、獨(dú)立性檢驗(yàn)的意義對(duì)次數(shù)資料,除進(jìn)行適合性檢驗(yàn)外,有時(shí)需要分析兩類因子是相互獨(dú)立還是彼此相關(guān)。如研究?jī)深愃幬飳?duì)家畜某種疾病治療效果的好壞,先將病畜分為兩組,一組用第一種藥物治療,另一組用第二種藥物治療,然后統(tǒng)計(jì)每種藥物的治愈頭數(shù)和未治愈頭數(shù)。這時(shí)需要分析藥物種類與療效是否相關(guān),若兩者彼此相關(guān),表明療效因藥物不同而異,即兩

30、種藥物療效不一樣;若兩者相互獨(dú)立,表明兩種藥物療效一樣。這種根據(jù)次數(shù)資料判斷兩類因子彼此相關(guān)或相互獨(dú)立的假設(shè)檢驗(yàn)就是獨(dú)立性檢驗(yàn)。獨(dú)立性檢驗(yàn)實(shí)際上是基于次數(shù)資料對(duì)子因子間相關(guān)性的研究。獨(dú)立性檢驗(yàn)與適合性檢驗(yàn)是兩種不同的檢驗(yàn)方法,除了研究目的不同外,還有以下區(qū)別:(一)獨(dú)立性檢驗(yàn)的次數(shù)資料是按兩因子屬性類別進(jìn)行歸組。根據(jù)兩因子屬性類別數(shù)的不同而構(gòu)成2×2、2×c、r×c列聯(lián)表(r為行因子的屬性類別數(shù),c為列因子的屬性類別數(shù))。而適合性檢驗(yàn)只按某一因子的屬性類別將如性別、表現(xiàn)型等次數(shù)資料歸組。(二)適合性檢驗(yàn)按已知的屬性分類理論或?qū)W說(shuō)計(jì)算理論次數(shù)。獨(dú)立性檢驗(yàn)在計(jì)算理論次

31、數(shù)時(shí)沒(méi)有現(xiàn)成的理論或?qū)W說(shuō)可資利用,理論次數(shù)是在兩因子相互獨(dú)立的假設(shè)下進(jìn)行計(jì)算。(三)在適合性檢驗(yàn)中確定自由度時(shí),只有一個(gè)約束條件:各理論次數(shù)之和等于各實(shí)際次數(shù)之和,自由度為屬性類別數(shù)減1。而在r×c列聯(lián)表的獨(dú)立性檢驗(yàn)中,共有rc個(gè)理論次數(shù),但受到以下條件的約束:1、rc個(gè)理論次數(shù)的總和等于rc個(gè)實(shí)際次數(shù)的總和;2、r個(gè)橫行中的每一個(gè)橫行理論次數(shù)總和等于該行實(shí)際次數(shù)的總和。但由于r個(gè)橫行實(shí)際次數(shù)之和的總和應(yīng)等于rc個(gè)實(shí)際次數(shù)之和,因而獨(dú)立的行約束條件只有r-1個(gè);3、類似地,獨(dú)立的列約束條件有c-1個(gè)。因而在進(jìn)行獨(dú)立性檢驗(yàn)時(shí),自由度為rc-1-(r-1)-(c-1)=(r-1)(c-1

32、),即等于(橫行屬性類別數(shù)-1)×(直列屬性類別數(shù)-1)。二、獨(dú)立性檢驗(yàn)的方法下面結(jié)合實(shí)例分別介紹2×2、2×c、r×c列聯(lián)表獨(dú)立性檢驗(yàn)的具體過(guò)程。(一)2×2列聯(lián)表的獨(dú)立性檢驗(yàn) 2×2列聯(lián)表的一般形式如表710所示,其自由度df=(C -1)(r-1)=(2-1) (2-1)=1,在進(jìn)行c2檢驗(yàn)時(shí),需作連續(xù)性矯正,應(yīng)計(jì)算值。表710 2×2列聯(lián)表的一般形式12行總合1()()=+2()()=+列總合T.j=+=+T.=A11+A12+A21+A22其中Aij為實(shí)際觀察次數(shù),Tij為理論次數(shù)。例7.7 某豬場(chǎng)用80頭豬檢驗(yàn)?zāi)?/p>

33、種疫苗是否有預(yù)防效果。結(jié)果是注射疫苗的44頭中有12頭發(fā)病,32頭未發(fā)病;未注射的36頭中有22頭發(fā)病,14頭未發(fā)病,問(wèn)該疫苗是否有預(yù)防效果?1、先將資料整理成列聯(lián)表(見(jiàn)表711)表711 2×2列聯(lián)表發(fā)病未發(fā)病行總和Ti.發(fā)病率注射12(18.7)32(25.3)T1.:4427.3%未注射22(15.3)14(20.7)T2.:3661.1%列總和T.jT.1:34T.2:46T。:802、提出無(wú)效假設(shè)與備擇假設(shè)H0:發(fā)病與否和注射疫苗無(wú)關(guān),即二因子相互獨(dú)立。HA:發(fā)病與否和注射疫苗有關(guān),即二因子彼此相關(guān)。3、 計(jì)算理論次數(shù) 根據(jù)二因子相互獨(dú)立的假設(shè),由樣本數(shù)據(jù)計(jì)算出各個(gè)理論次數(shù)

34、。二因子相互獨(dú)立,就是說(shuō)注射疫苗與否不影響發(fā)病率。也就是說(shuō)注射組與未注射組的理論發(fā)病率應(yīng)當(dāng)一樣,均應(yīng)等于總發(fā)病率34/80=0.425。依此計(jì)算出各個(gè)理論次數(shù)如下:注射組的理論發(fā)病數(shù):T11=44×34/80=18.7注射組的理論未發(fā)病數(shù):T12=44×46/80=25.3, 或:T12=44-18.7=25.3;未注射組的理論發(fā)病數(shù):T21=36×34/80=15.3,或T21=34-18.7=15.3;未注射組的理論未發(fā)病數(shù):T22=36×46/80=20.7,或T22=36-15.3=20.7。從上述各理論次數(shù)Tij的計(jì)算可以看到,理論次數(shù)的計(jì)算利

35、用了行、列總和,總總和,4個(gè)理論次數(shù)僅有一個(gè)是獨(dú)立的。表7-11括號(hào)的數(shù)據(jù)為相應(yīng)的理論次數(shù)。4、 計(jì)算值 將表7-11中的實(shí)際次數(shù)、理論次數(shù)代入74式得:+5、 由自由度df=1查臨界c2值,作出統(tǒng)計(jì)推斷 因?yàn)閏20.01(1)=6.63,而=7.944>c20.01(1),P<0.01,否定H0,接受HA,表明發(fā)病率與是否注射疫苗極顯著相關(guān),這里表現(xiàn)為注射組發(fā)病率極顯著低于未注射組,說(shuō)明該疫苗是有預(yù)防效果的。在進(jìn)行2´2列聯(lián)表獨(dú)立性檢驗(yàn)時(shí),還可利用下述簡(jiǎn)化公式(7-6)計(jì)算: (76)在(7-6)式中,不需要先計(jì)算理論次數(shù),直接利用實(shí)際觀察次數(shù)Aij,行、列總和Ti.、

36、T.j和總總和T.進(jìn)行計(jì)算,比利用公式(7-4)計(jì)算簡(jiǎn)便,且舍入誤差小。對(duì)于例7.7,利用(7-6)式可得:所得結(jié)果與前面計(jì)算計(jì)算的一樣。(二)2×c列聯(lián)表的獨(dú)立性檢驗(yàn) 2×c列聯(lián)表是行因子的屬性類別數(shù)為2,列因子的屬性類別數(shù)為c(c³3)的列聯(lián)表。其自由度df=(2-1) (c-1),因?yàn)閏³3,所以自由度大于2,在進(jìn)行c2檢驗(yàn)時(shí),不需作連續(xù)性矯正。2×c表的一般形式見(jiàn)表712。表712 2×c聯(lián)列表一般形式12c行總和12列總和總總和其中(i=1,2;j=1,2,c)為實(shí)際觀察次數(shù)。例7.8 在甲、乙兩地進(jìn)行水牛體型調(diào)查,將體型按

37、優(yōu)、良、中、劣四個(gè)等級(jí)分類,其結(jié)果見(jiàn)表713,問(wèn)兩地水牛體型構(gòu)成比是否一樣。表713 兩地水牛體型分類統(tǒng)計(jì)優(yōu)良中劣行總和Ti.甲10(13.3)10(10.0)60(53.3)10(13.4)90乙10(6.7)5(5.0)20(26.7)10(6.6)45列總和T.j20158020135這是一個(gè)2×4列聯(lián)表獨(dú)立性檢驗(yàn)的問(wèn)題。檢驗(yàn)步驟如下:1. 提出無(wú)效假設(shè)與備擇假設(shè)H0:水牛體型構(gòu)成比與地區(qū)無(wú)關(guān),即兩地水牛體型構(gòu)成比一樣。HA:水牛體型構(gòu)成比與地區(qū)有關(guān),即兩地水牛體型構(gòu)成比不同。2. 計(jì)算各個(gè)理論次數(shù),并填在各觀察次數(shù)后的括號(hào)中 計(jì)算方法與2×2表類似,即根據(jù)兩地水牛體

38、型構(gòu)成比一樣的假設(shè)計(jì)算。如優(yōu)等組中,甲地、乙地的理論次數(shù)按理論比率20/135計(jì)算;良等組中甲地、乙地的理論次數(shù)按理論比率15/135計(jì)算;中等、劣等組中甲地、乙地的理論次數(shù)分別按理論比率80/135和20/135計(jì)算。甲地優(yōu)等組理論次數(shù):T11=90×20/135=13.3,乙地優(yōu)等組理論次數(shù):T21=45×20/135=6.7,或T21=20-13.3=6.7;其余各個(gè)理論次數(shù)的計(jì)算類似。3.計(jì)算計(jì)算c2值4. 由自由度df=3查臨界c2值,作出統(tǒng)計(jì)推斷 因?yàn)閏20.05(3)=7.815,而c2=7.582<c20.05(3),p>0.05,不能否定H0,

39、可以認(rèn)為甲、乙兩地水牛體型構(gòu)成比一樣。在進(jìn)行2×c列聯(lián)表獨(dú)立性檢驗(yàn)時(shí),還可利用下述簡(jiǎn)化公式(7-7)或(7-8)計(jì)算 c2: (77) 或 (78)(7-7)或(7-8)式的區(qū)別在于:(7-7)式利用第一行中的實(shí)際觀察次數(shù)A1j和行總和T1.;(7-8)式利用第二行中的實(shí)際觀察次數(shù)A2j和行總和T2.,計(jì)算結(jié)果一樣。對(duì)于例7-7利用(7-8)式計(jì)算c2值得:計(jì)算結(jié)果與利用(71)式計(jì)算的結(jié)果因舍入誤差略有不同。此外,在畜牧、水產(chǎn)科學(xué)研究中,有時(shí)需將數(shù)量性狀資料以等級(jí)分類,如剪毛量分為特等、一等、二等,產(chǎn)奶量分為高產(chǎn)與低產(chǎn)等,這些由數(shù)量性狀資料轉(zhuǎn)化為質(zhì)量性狀的次數(shù)資料檢驗(yàn),也可用c2檢

40、驗(yàn)。例7.9 分別統(tǒng)計(jì)了A、B兩個(gè)品種各67頭經(jīng)產(chǎn)母豬的產(chǎn)仔情況,結(jié)果見(jiàn)表714,問(wèn)A、B兩品種的產(chǎn)仔構(gòu)成比是否一樣?表714 A、B兩個(gè)品種產(chǎn)仔數(shù)的分類統(tǒng)計(jì)9頭以下10-12頭13頭以上行總和Ti.A1744667B5332967列總和T.j2277351341、提出無(wú)效假設(shè)與備擇假設(shè)H0:A、B兩個(gè)品種產(chǎn)仔數(shù)分級(jí)構(gòu)成比一樣。HA:A、B兩個(gè)品種產(chǎn)仔數(shù)分級(jí)構(gòu)成比不同。2、計(jì)算c2值 用簡(jiǎn)化公式(77)計(jì)算為:3、由自由度df=(2-1)(3-1)=2查臨界c2值,作出統(tǒng)計(jì)推斷 因?yàn)閏20.05(2)=9.21,c2>c20.01, P<0.01,所以否定H0,接受HA ,表明A、

41、B兩品種產(chǎn)仔數(shù)構(gòu)成比差異極顯著。需要應(yīng)用c2檢驗(yàn)的再分割法來(lái)具體確定分級(jí)構(gòu)成比差異在那樣的等級(jí)。4、 c2檢驗(yàn)的再分割法(1)先對(duì)兩個(gè)品種產(chǎn)仔數(shù)在9頭以下和1012頭進(jìn)行c2檢驗(yàn),分割后的情況見(jiàn)表715。表715c21計(jì)算表9頭以下10-12頭行總和Ti.A174461B53338列總和T.j227799利用簡(jiǎn)化公式(7-7)計(jì)算c21值為:由df1=2-1=1,查c2值表得:c20.05(1)=3.841,因?yàn)閏21<c20.05(1),P>0.05,表明這兩個(gè)品種的產(chǎn)仔數(shù)在9頭以下和1012頭這兩個(gè)級(jí)別的比率差異不顯著。(2)對(duì)產(chǎn)仔數(shù)在13頭以上組與其他合并組(即9頭以下和10

42、12頭兩個(gè)組的合并)進(jìn)行c2檢驗(yàn),分割后見(jiàn)表716。表716 c22計(jì)算表合并組13頭以上總 和A61667B382967總 和9935134利用簡(jiǎn)化公式(7-7)計(jì)算c22值為:由df2=2-1=1,查c2值表得:c20.05(1)=3.846,c20.01(1)=6.63,因?yàn)閏22>c20.01(1),P<0.01,表明這兩個(gè)品種的產(chǎn)仔數(shù)在合并組與13頭以上組的比率差異極顯著。其中B品種產(chǎn)仔數(shù)在13頭以上的比率為29/67=42.38%,極顯著高于A品種產(chǎn)仔數(shù)在13頭以上的比率6/67=8.96%。或者說(shuō)B品種產(chǎn)仔數(shù)在合并組(12頭以下)的比率為38/67=56.72%,極顯

43、著低于A品種產(chǎn)仔數(shù)在合并組(12頭以下)的比率61/67=91.04%。經(jīng)分割檢驗(yàn)后,df=df1+df2=2+1=3, c2=23.25=c21+c22=2.93+20.458=23.388,c2略小于c21+c22,是由于計(jì)算中的舍入誤差所致。(三)r×c列聯(lián)表的獨(dú)立性檢驗(yàn) r×c表是指行因子的屬性類別數(shù)為r(r>2),列因子的屬性類別數(shù)為c( c>2)的列聯(lián)表。其一般形式見(jiàn)表7-17。表717 r×c列聯(lián)表的一般形式12c行總和12r列總和其中Aij(i=1,2,r;j=1,2,c)為實(shí)際觀察次數(shù)。r×c列聯(lián)表各個(gè)理論次數(shù)的計(jì)算方法與上述(2×2)、(2×c)表適合性檢驗(yàn)類似。但一般用簡(jiǎn)化公式計(jì)算c2值,其公式為: (79)例7.10 對(duì)三組奶牛(每組39頭)分別喂給不同的飼料,各組發(fā)病次數(shù)統(tǒng)計(jì)如下表,問(wèn)發(fā)病次數(shù)的構(gòu)成比與所喂飼料是否有關(guān)?表718 三組牛的發(fā)病次數(shù)資料發(fā)病次數(shù)飼 料總 和12

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論