統(tǒng)計學第14章 非參數(shù)檢驗_第1頁
統(tǒng)計學第14章 非參數(shù)檢驗_第2頁
統(tǒng)計學第14章 非參數(shù)檢驗_第3頁
統(tǒng)計學第14章 非參數(shù)檢驗_第4頁
統(tǒng)計學第14章 非參數(shù)檢驗_第5頁
已閱讀5頁,還剩23頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第14章 非參數(shù)檢驗單個總體分布特征的檢驗。即通過樣本數(shù)據(jù)來檢驗其總體是否服從某種特定的分布。通過比較兩個或多個樣本的分布特征來確定兩個或多個總體的分布是否有差異的檢驗。14.1 單個總體分布特征的檢驗 單個總體分布特征的檢驗是用樣本的分布來檢驗總體是否服從某一特定的分布。14.1.1卡方檢驗下表是250個煤的樣品中的含灰量(單位:%)的分析結果。試在顯著性水平下檢驗含灰量服從正態(tài)分布含灰量9.259.7510.2510.7511.2511.7512.2512.7513.2513.75頻數(shù)1021125476含灰量14.2514.7515.2515.7516.2516.7517.2517.75

2、18.2518.75頻數(shù)13141513241519232212含灰量19.2519.7520.2520.7521.2521.7522.2522.7523.2523.75頻數(shù)12768642203含灰量24.2524.7525.25頻數(shù)001解:,不服從正態(tài)分布以為對稱點,把這250個數(shù)據(jù)分為6組,若原假設成立,即則j(aj-1,aj)nj1-,1270.0317.75-0.750.073212,14220.10025.00-30.360314,17940.36992.251.750.033417,20950.36992.252.750.082520,22240.10025.00-10.040

3、622, 80.0317.750.250.008其中:組數(shù):分布的未知參數(shù)的個數(shù)因為 0.596<7.815,所以不能拒絕原假設,即認為這一組數(shù)據(jù)服從正態(tài)分布14.1.2 Kolmogorov-Smirnov單個樣本檢驗基本思想:根據(jù)原假設利用樣本的特征值構造一個期望分布的分布函數(shù)計算樣本的累計頻率與期望分布函數(shù)差的最大的值若這個值很大就說明這個樣本不是來自期望分布的總體,則拒絕原假設。例:某校在一次考試后隨機抽取了10名學生,其考試成績如表的第二列所示。檢驗總體成績是否服從正態(tài)分布。()序號12345678910考試成績x6065666768707172808128解:總體不服從正態(tài)分

4、布序號考試成績頻率累計頻率z值期望累計頻率1600.10.1-1.540.06180.042650.10.2-0.770.2206-0.023660.10.3-0.620.26760.034670.10.4-0.460.32280.085680.10.5-0.310.37830.126700.10.60.00.50.107710.10.70.150.55960.148720.10.80.310.62170.189800.10.91.540.9382-0.0410810.111.690.95450.05將樣本的x值從小到大排列計算樣本中每個變量出現(xiàn)的頻次,計算累計頻次計算各觀察值所對應的期望分布

5、的值查標準正態(tài)分布表可得到期望分布函數(shù)的值,也就是期望累計頻率值,計算樣本累計頻率與期望累計頻率的差值計算出k個累計頻率差 () 令這個值為D, 在樣本容量的情況下查出的臨界值如果就拒絕原假設。查附表6得:當,時D的臨界值為:因為。所以,接受原假設,樣本來自正態(tài)分布的總體。時,的臨界值顯著性水平0.1 0.05 0.02 0.01的計算方法 【例14-3】某省高考結束后,隨機抽取了100名考生。數(shù)學成績分布如表14-6中“考試成績”與“頻次”兩列所示。檢驗總體中考生數(shù)學成績是否服從正態(tài)分布。表14-6 考生數(shù)學成績分布考試成績頻次累計頻次累計頻率z值期望累計頻率3437465560636873

6、7578798083848586879394969799100102104105106107108109111112114115117118120121122123124125127128129130135136138141142147150112111112111111111131121114132334312221271611334322211245678911121314151617181920212425262829303135363941444751545557596162647172787980838690939597991000.010.020.040.050.060.070.0

7、80.090.110.120.130.140.150.160.170.180.190.200.210.240.250.260.280.290.300.310.350.360.390.410.440.470.510.540.550.570.590.610.620.640.710.720.780.790.800.830.860.900.930.950.970.991-3.03-2.91-2.55-2.19-1.99-1.87-1.67-1.48-1.40-1.28-1.24-1.20-1.08-1.04-1.00-0.96-0.92-0.68-0.64-0.56-0.52-0.44-0.40-0.

8、32-0.24-0.20-0.16-0.12-0.08-0.040.040.080.160.200.280.320.400.440.480.520.560.600.680.720.760.801.001.041.121.241.281.481.600.000.000.010.010.020.030.050.070.080.100.110.120.140.150.160.170.180.250.260.290.300.330.350.380.410.420.440.450.470.480.520.530.560.580.610.630.660.670.680.700.710.730.750.76

9、0.780.790.840.850.870.890.900.930.940.010.020.030.040.040.040.030.020.030.020.020.020.010.010.010.010.01-0.05-0.05-0.05-0.05-0.07-0.07-0.09-0.11-0.11-0.09-0.09-0.08-0.07-0.08-0.06-0.05-0.04-0.06-0.06-0.07-0.06-0.06-0.060.00-0.010.030.030.020.040.020.050.060.060.070.060.06解:0:, 總體不服從正態(tài)分布。計算臨界值。當、,時D的

10、臨界值為: 因為。所以,接受原假設,樣本來自正態(tài)分布的總體。14.2 兩個總體分布一致性的檢驗兩個獨立樣本的檢驗14.2.1、秩和檢驗(Mann-Whitney U)1秩和檢驗的統(tǒng)計思想 “秩”:將n個案按照變量x取值的大小進行排序,并用標出每個個案的等級,這些等級被稱為變量x的秩。用表示每一個個案必須占有一個等級,秩的最小值為1,最大值為n。 如果有多個個案在x變量上取值相同,這些個案被稱為結,結的秩是這些取值相同的個案應該占有的所有等級的平均值。x1233345677124446789.59.5秩和檢驗的統(tǒng)計思想如果兩個總體具有相同的分布,從兩個總體中分別抽出兩個隨機樣本,兩個樣本的分布不

11、會有太大的差異。將兩個樣本的觀測值混合排秩,這些秩會在兩個樣本的個案中交替出現(xiàn)。 分別計算兩個樣本的秩和,任何一個樣本的秩和非常大或非常小的可能性都是很小的。如果來自一個樣本的秩和太?。ɑ蛱螅?,就意味著這個總體的變量值比另一個總體的值偏?。ɑ蛘咂螅?。也就說明兩個樣本的個案并不是來源于兩個分布相同的總體。2小樣本秩和檢驗的方法樣本1:,樣本:。 其中。即始終將較小的樣本視為樣本1。兩個總體具有相同的分布兩個總體具有不同的分布將兩樣本混合后按變量值的大小排秩。然后計算樣本1中所有的秩和記為T 若或就拒絕兩個總體具有相同的分布的原假設。例:從某校學生中隨機抽取了15名學生,調查他們一周內買零食的

12、花費,問男女學生買零食的花費有無差異?()表14-8 15名學生的零食消費男2159843106 女51118207169解: 男女學生買零食的花費具有相同的分布男女學生買零食的花費具有不同的分布將上述15名學生買零食花費按大小排秩,結果如表14-9所示。表14-9 15名學生的零食消費的秩男男男女男女男男女男女男女女女234567899101115161820順序12345678910111213141512345678.58.5101112131415計算女性的秩和:查附表7秩和檢驗表得:因為。所以,拒絕原假設。男女兩性學生的零食消費有顯著差異。3大樣本秩和檢驗的方法大樣本時, , 標準化

13、可得大樣本秩和檢驗的統(tǒng)計量: 檢驗的拒絕域為:。 從某校學生中隨機抽取了24名學生,考試成績如表14-10所示。問男女兩性學生的成績有無差異?(男98959087848380787773716568 女9591888584828175747161解:,男女兩性學生的成績無顯著差異男女兩性學生的成績有顯著差異將男女生的考試成績混合排秩,如表14-11所示。表中括號中的數(shù)據(jù)為秩表14-11 24名學生的考試成績的排秩女男男男女男女女男男男女成績616568717173747577788081R(x)1234.54.56789101112女男男女女男女男女男女男成績82838484858788909

14、1959598R(x)131415.5 15.5 1718192021222324計算女生考試成績的秩和:計算T的均值與方差:查表得: 所以,接受兩個總體具有相同的分布的原假設。男女兩性學生的成績沒有顯著差異。14.2.2 游程檢驗(Wald-Wolfowitz runs)1游程檢驗的基本思想將兩個獨立樣本混和后,按大小排秩。如果兩個總體有相同分布的話,就不大可能出現(xiàn)來自一個總體的個案大部分是高秩而來自另一個總體的個案大部分是低秩。兩個樣本的秩應是交錯進行的。交錯的次數(shù)越多,兩個總體的一致性越強。根據(jù)交錯的次數(shù)來判斷總體分布是否相同的方法就是游程檢驗。游程檢驗的統(tǒng)計量是游程數(shù),游程數(shù)用r表示。

15、假設抽取的兩個樣本為:樣本1:12 19 21 26 30 樣本2:13 17 23 25 29將兩個樣本混合,并從小到大排秩。如果某個案屬于樣本1,在其秩下面寫0;如果某個案屬于樣本2,則在其秩下面寫1觀察值12 13 17 19 21 23 25 26 29 30秩1 2 3 4 5 6 7 8 9 10010 1 1 0 0 1 1 0 1 0游程圖為: 游程圖在游程圖中,線段的一個持續(xù)稱為一個游程。圖14-3中有4個0游程,3個1游程。游程總數(shù)為:r=7。如果兩個總體的個案數(shù)均為N,游程數(shù)最多可達2N個2小樣本游程檢驗的方法樣本1:,樣本:。,。 其中。即始終將較大的樣本視為樣本1。兩

16、個總體具有相同的分布兩個總體具有不同的分布。在小樣本的情況下,統(tǒng)計學家根據(jù)不同的顯著性水平給出了最小游程數(shù)的下限若,則拒絕兩個總體具有相同分布的原假設。分別從兩所大學中隨機抽取了兩組學生四級外語考試的分數(shù),問這兩所大學學生的外語水平是否相同?()表14-15 兩校學生的外語水平考試成績甲校425 427 431 446 449 456 462 534 550 601乙校429 442 458 460 475 498 542 590 621 624解:兩個總體具有相同的分布兩個總體具有不同的分布將兩校學生的考試成績混合排秩觀察值425 427 429 431 442 446 449 456 45

17、8 460 462 475 498 534 542 550 590 601 621 624秩1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20010 0 1 0 1 0 0 0 1 1 0 1 1 0 1 0 1 0 1 1兩校學生的外語水平考試成績的游程圖計算得游程數(shù)為:查游程檢驗表得:因為,所以接受兩個總體具有相同分布的原假設,兩所大學學生的外語水平?jīng)]有顯著差異。3大樣本游程檢驗的方法當時,如果兩個總體具有相同的分布,樣本的游程數(shù)r近似服從正態(tài)分布 標準化可得: 拒絕域為:。從某城市的重點高中和普通高中各抽取40名學生,家庭住房面積如表14

18、-17所示。用游程檢驗的方法檢驗普同高中和重點高中學生家庭的住房面積是否有顯著差異。()住房面積所在學校住房面積所在學校住房面積所在學校住房面積所在學校1012202020212125253030303030333334343640普通高中0普通高中0普通高中0普通高中0普通高中0普通高中0普通高中0普通高中0普通高中0普通高中0普通高中0普通高中0普通高中0普通高中0重點高中1重點高中1普通高中0重點高中1普通高中0普通高中04040404145455050505050505050505050545656普通高中0重點高中1重點高中1普通高中0普通高中0普通高中0普通高中0普通高中0普通高中

19、0普通高中0普通高中0普通高中0普通高中0重點高中1重點高中1重點高中1重點高中1重點高中1重點高中1重點高中16060606060606060666970707070757580808080普通高中0普通高中0普通高中0普通高中0重點高中1重點高中1重點高中1重點高中1普通高中0重點高中1重點高中1重點高中1重點高中1重點高中1普通高中0重點高中1普通高中0普通高中0重點高中1重點高中18080808081859090909095100100100100100120130130150重點高中1重點高中1重點高中1重點高中1普通高中0普通高中0普通高中0重點高中1重點高中1重點高中1重點高中1

20、重點高中1重點高中1重點高中1重點高中1重點高中1重點高中1重點高中1重點高中1普通高中0解:兩個總體具有相同的分布兩個總體具有不同的分布數(shù)據(jù)按照住房面積大小排序。用0表示普通高中,用1表示重點高中,從表中可以看出共有19個游程。即:查表得:因為。所以,拒絕兩個總體具有相同的分布的原假設,重點中學與普通中學學生的家庭住房面積有顯著差異。從兩所學校中各隨機抽取50名學生。用外語四級考試成績進行游程檢驗,計算得游程數(shù)為r=36,問這兩所大學學生的外語水平是否相同?解: 提出原假設與備擇假設:兩個總體具有相同的分布兩個總體具有不同的分布查表得因為。所以,拒絕兩個總體具有相同分布的原假設,兩校學生的外

21、語水平差異顯著。14.3 兩個總體分布一致性的檢驗兩個相關樣本的檢驗14.3.1 符號檢驗通過檢驗相關樣本前后兩次測量結果差的符號的分布來檢驗總體中這兩次測量結果是否有顯著差異。設樣本中的個案數(shù)為n,對第i個個案進行前測的結果為,后測結果為,后測減前測的差值為: 如果總體中前后測沒有變化, 的符號為正和為負的個數(shù)應該基本相等。設符號為正和為負的頻率分別為P(+)和P(-),則有:P(+)=P(-)=0.5在上述總體中抽取一個樣本,由于隨機誤差的存在,樣本中的符號為正和為負的個數(shù)可能不會相等,但是差異太大的可能性是很小的。1 小樣本符號檢驗的方法設為“+”的數(shù)目為n+,為“-”的數(shù)目為n-。n+

22、和n-的總數(shù)則為n+n-。若則略去不計。計算累計概率值。選擇n+和n-中較小的一個,計算該符號個數(shù)從個直到0個出現(xiàn)的概率的累計值?;蜻x擇n+和n-中較大的一個,計算該符號個數(shù)從個直到n+n -個出現(xiàn)的概率的累計值。在原假設成立的條件下,這兩個累計概率值是不會太小的。如果這兩個累計概率值特別小,就拒絕兩個配對樣本具有相同分布的原假設。累計概率值與顯著性水平進行比較。若累計概率值如小于就拒絕原假設?!纠?4-11】 從某學校學生中隨機抽取12名學生,在入學時和畢業(yè)時分別進行兩次專業(yè)喜歡程度的測量,結果如表14-22的第2列和第3列所示。檢驗經(jīng)過四年大學學習,學生的專業(yè)喜歡程度是否有變化。表14-2

23、2 學生專業(yè)喜歡程度的兩次測量結果學生編號畢業(yè)時專業(yè)喜歡程度入學時專業(yè)喜歡程度的符號123456789101112867874559060976446958873726356628076796454877465141518-710-16180-8814 8+-+-+-+解: 計算累計概率值。在上述樣本中有3個負號,9個正號。如果總體中正號和負號的數(shù)目相等,即概率相等 則有:負號數(shù)等于3的樣本出現(xiàn)的概率:負號數(shù)等于2的樣本出現(xiàn)的概率:負號數(shù)等于1的樣本出現(xiàn)的概率:負號數(shù)等于0的樣本出現(xiàn)的概率:負號數(shù)小于等于3的樣本出現(xiàn)的概率為: 由于這個概率大于0.025。不能拒絕總體中正號和負號的數(shù)目相等的原

24、假設。即,前后側沒有顯著差異。從上述的檢驗看這是一個二項分布的檢驗。由于檢驗中只用到了前測和后測差值的符號,沒有很好地利用全部的數(shù)據(jù)信息,所以檢驗的效果不如參數(shù)檢驗精確。(在參數(shù)檢驗中,該題是拒絕原假設)2大樣本符號檢驗的方法當樣本容量大于10時,可以用正態(tài)分布來近似二項分布。設樣本容量為n,在原假設成立的條件下有:根據(jù)小樣本符號檢驗的步驟計算出n+和n-后,令:則有: 式中的x+0.5是為了把離散變量x變作連續(xù)變量z的修正,稱作連續(xù)性修正。式(14-17)是大樣本符號檢驗的統(tǒng)計量。檢驗的拒絕域為。抽樣結束后可利用樣本數(shù)據(jù)計算統(tǒng)計量的值。根據(jù)是否處于拒絕域內來確定是否接受原假設?!纠?4-12

25、】用大樣本符號檢驗的方法檢驗【例14-11】中學生的專業(yè)喜歡程度是否有變化。解: 查表得:因為,不能拒絕原假設,總體中前后測沒有顯著差異。14.3.2 符號秩檢驗1符號秩檢驗的統(tǒng)計思想設樣本中的個案數(shù)為n,對第i個個案進行前測的結果為,后測結果為。后測減前測的差值為: 。符號秩檢驗的基本思想是將前后測差值的絕對值排秩,再將差值的符號付給秩。如果總體中前測與后測基本相同的話,在樣本中不僅出現(xiàn)+號和-號的次數(shù)基本相等,而且+號和-號在秩上的分布也均勻,即正秩和與負秩和應該相等。由于存在隨機誤差,所以樣本中正秩和與負秩和不能完全相等,但差異很大的可能性是很小的2小樣本符號秩檢驗的步驟 對的絕對值排秩

26、,秩作為一個變量用表示。當時,為正,當時,為負。設正秩和為,負秩和為,則有: 當時 當時理論上,符號秩檢驗的原假設是總體中后測與前測相比沒有顯著差異。反映在秩和上就是正秩和與負秩和相等。因此,符號秩檢驗的原假設和備擇假設為: 比較T+和T-,取其中絕對值較小的一個為T,即T即是符號秩檢驗的統(tǒng)計量。在原假設成立的條件下,T非常小的可能性是很小的。在小樣本的情況下,如果計算的樣本統(tǒng)計量的值小于臨界值,就可以拒絕總體中的原假設。認為前后測的結果存在顯著差異?!纠?4-15】用符號秩檢驗的方法檢驗【例14-11】中學生的專業(yè)喜歡程度是否有變化。表14-23 學生專業(yè)喜歡程度的符號秩檢驗學生編號畢業(yè)時專

27、業(yè)喜歡程度入學時專業(yè)喜歡程度的符號秩123456789101112867874559060976446958873726356628076796454877465141518-710-16180-8814 8+7.5+9+11.5-2+6-10+11.5+1-4+4+7.5+4解: n=12計算,計算結果如表14-22中第四列所示。對的絕對值排秩,并把的符號賦給秩,結果如表14-23中第5列所示。計算T+和T-,確定查符號秩檢驗表得:因為,所以拒絕原假設,后測與前測相比有顯著差異。四年的學習使得學生的專業(yè)意識增強。符號秩檢驗比較充分地利用了數(shù)據(jù)的信息,它比符號檢驗更有效。3大樣本符號秩檢驗的方

28、法當時,樣本的T近似服從正態(tài)分布, 拒絕域為:。用大樣本符號秩檢驗的方法檢驗上例中學生的專業(yè)喜歡程度是否有變化。解:n=12 在【例14-15】中已經(jīng)計算出提出原假設與備擇假設: 查表得:因為,總體中前后測差異顯著,四年的學習使得學生的專業(yè)意識增強。14.4 多個總體分布一致性的檢驗多個獨立樣本的檢驗14.4.1單向方差秩分析1單向方差秩分析的統(tǒng)計思想設被分析的尺度變量為y。類別變量分為x,x共有k個取值,可據(jù)此將個案分為k類,可以將其視為k個總體。現(xiàn)從k個總體中隨機抽取k個樣本如下:總體1 樣本1:總體2 樣本2: 樣本k:總體k 每個樣本的容量均滿足:。將k個樣本觀察值混合排秩,每個個案的

29、秩記為。如果k個總體具有相同的分布,那么每個類別樣本秩和的平均值與全部樣本秩和的平均值差異很大的可能性是很小的。如果這些平均值的差異很大就能夠說明這多個獨立樣本不是來自分布相同的總體。2單向方差秩分析的步驟根據(jù)上述單向方差秩分析的基本思想,歸納得出單向方差秩分析的步驟如下:k個總體具有相同的分布k個總體具有不同的分布將k個樣本的個案混合排秩,并根據(jù)下式計算每個樣本的秩和。 ()根據(jù)上述的統(tǒng)計思想,Kruskal和Wallis提出了檢驗的統(tǒng)計量。而且服從自由度為的卡方分布。 (14-21)式中:,即是第i個樣本的秩和。就拒絕原假設,認為k個總體不具有相同的分布。用單向方差秩分析的方法分析前例中不

30、同文化程度的居民住房面積是否有相同的分布。()解:將不同文化程度居民的住房面積混合排秩結果如表14-24所示。表14-24 不同文化程度居民的住房面積的單向方差秩分析序號小學及以下初中高中中專技校大專大學本科及以上1234567891011121320.536.840.245.170.02912163320.428.230.134.737.241.045.550.654.058.669.170.780.21 4 5 7101317212327323439.528.032.542.347.652.968.775.097.498.03. 614192231364142 36.044.548.757

31、.668.676.4107.6815202630384438.747.355.568.070.880.2114.7111824293539.54556.467.275.599.1120.82528374346不同文化程度的人的住房面積具有相同的分布不同文化程度的人的住房面積具有不同的分布查表得因為。所以,拒絕原假設,不同文化程度的人的住房面積具有不同的分布。14.4.2中位數(shù)檢驗1中位數(shù)檢驗的統(tǒng)計思想設有k個獨立樣本。將k個獨立樣本的個案混合排序并找出中位數(shù)。以中位數(shù)為分界標準將每個樣本中的個案分成小于等于中位數(shù)和大于中位數(shù)兩部分。如果總體中k個類別具有相同的分布,在總體的每個類別中小于等于中

32、位數(shù)和大于中位數(shù)的個案應基本相等。如果這k個獨立樣本來自分布相同的總體,由于隨機誤差的存在,在每個樣本中這兩部分個體數(shù)不能完全相等,但相差很大的可能性是很小的。用中位數(shù)為分割點將每個獨立樣本中的個案分為兩部分,可以制作出的列聯(lián)表。并以全部樣本中被中位數(shù)分割成的兩部分的比例計算每個獨立樣本這兩部分的期望頻次分布,用卡方檢驗的方法即可檢驗多個獨立樣本是否來自分布相同的總體。2中位數(shù)檢驗的步驟k個總體具有相同的分布k個總體具有不同的分布將k個樣本的個案混合排序并找出中位數(shù)。用中位數(shù)為分割點將每個樣本中的個案分為小于等于中位數(shù)和大于中位數(shù)兩部分。將k個樣本的分割結果制作的列聯(lián)表。用上述的列聯(lián)表計算的統(tǒng)

33、計量。拒絕域是:。如果利用的樣本數(shù)據(jù)計算的,就拒絕k個總體具有相同的分布的原假設。【例14-18】用中位數(shù)檢驗的方法分析表14-25中不同文化程度的居民住房面積是否有相同的分布。()表14-25 不同文化程度居民的住房面積分布的中位數(shù)檢驗序號初中及以下高中、中專大專及以上123456789101112131415161720.426.528.230.134.736.837.240.241.045.145.550.654.028.032.536.042.344.547.648.752.938.747.355.556.467.268.070.875.580.299.1114.7120.857.66

34、8.668.775.076.487.697.4113.958.669.170.780.2解:3個總體具有相同的分布3個總體具有不同的分布將表14-24中的全部數(shù)據(jù)混合排序后找出的中位數(shù)為:小于等于54的個案數(shù)為23,頻率為0.511。大于54的個案數(shù)為22,頻率為0.489以中位數(shù)為分割點,將3個樣本進行分割,情況如表14-25中的虛線所示。用分割結果制作列聯(lián)表如表14-26所示。表中括號的部分是期望頻次分布。期望頻次分布的計算方法如下: 表14-26 文化程度與中位數(shù)分組的交叉表分組初中及以下高中、中專大專及以上總計住房面積54.75住房面積54.7513(8.7)4(8.3)8(8.2)8

35、(7.8)2(6.1)10(5.9)2322總計17161245查表得:因為,所以,拒絕原假設,不同文化程度的人的住房面積具有不同的分布。14.5 多個總體分布一致性的檢驗多個相關樣本的檢驗14.5.1雙向方差秩分析1統(tǒng)計思想先按行對每個個案在各個變量上的取值排秩然后按列計算秩和若總體 沒有顯著差異的話,這些秩和相差很大的可能性是很小的10名學生對5名教師的評價學生編號ABCDE1234567891092(2)88(1)72(3)91(1)86(2)78(2)87(2)93(2)84(2)83(2)94(1)85(2)87(1)85(2)92(1)91(1)89(1)97(1)89(1)88(

36、1)87(3)76(3)78(2)82(3)83(3)68(5)81(3)88(3)72(4)78(3)65(5)67(4)62(5)71(5)76(4)73(3.5)72(4)85(4)76(3)70(4)72(4)68(5)64(4)73(4)69(5)73(3.5)68(5)78(5)68(5)63(5)秩和R41482817.515.514.5.2 雙向方差秩分析的方法與步驟k個總體具有相同的分布k個總體具有不同的分布2、確定檢驗的統(tǒng)計量并計算樣本統(tǒng)計量的值對多個相關樣本進行雙向方差秩分析要先按行賦秩,然后按列計算秩和。其一般表達式如表14-28所示。表14-28 多個相關樣本雙向方差

37、秩分析的一般表達式個案變量A1變量A2變量Ak12n秩和其中:是按行排的秩。、是按列計算的秩和。, 在沒有相同等級或相同等級很少的情況下,F(xiàn)riedman給出的統(tǒng)計量是: (14-22)該統(tǒng)計量服從自由度為(k-1)的分布。即:式(14-23)既是雙向方差秩分析檢驗的統(tǒng)計量。抽樣結束后可根據(jù)樣本數(shù)據(jù)計算統(tǒng)計量的值。拒絕域為:。檢五名教師的教學水平是否有顯著差異?()解:,k個總體具有相同的分布k個總體具有不同的分布查表得因為,所以,拒絕原假設,五名教師的教學水平有顯著差異。二、Kendalls W檢驗Kendall's W檢驗的統(tǒng)計量: 和諧系數(shù) :的取值范圍是0,1。的值越接近1,說

38、明多個樣本的分布差異越顯著,越接近于0說明分布的一致性越強。Kendall和諧系數(shù)與Friedman統(tǒng)計量T的關系為: (14-24)可見二者的檢驗效果是等價的。但Kendall和諧系數(shù)使得多個相關樣本分布的一致性具有了定量的測量指標?!纠?4-20】計算表14-26中五名教師教學水平的Kendall和諧系數(shù)。解:因為已經(jīng)接近于1。所以,五名教師的教學水平有顯著差異。習題14-1根據(jù)以往資料,某地區(qū)60歲以上老人養(yǎng)老方式中與子女同住、同城與子女分開住和其他模式的比例為1:6:3,一個研究機構隨機調查了500位當?shù)?0歲以上的老人,發(fā)現(xiàn)這三種養(yǎng)老模式的人數(shù)分別為78、306、116人,請問這個地

39、區(qū)60歲以上老人的養(yǎng)老模式是否發(fā)生了顯著變化()?14-2 從某市隨機抽取了200個獨生子女組成的小家庭,調查他們在哪里度過春節(jié),其中,92個家庭選擇到男方父母家,80個家庭選擇去女方父母家,28個家庭選擇在自己的小家。而依據(jù)前些年的經(jīng)驗數(shù)據(jù),三類的比例分別為:,請的顯著性水平進行檢驗現(xiàn)在的情況與經(jīng)驗數(shù)據(jù)相比是否發(fā)生了顯著變化。14-3 按孟德爾的遺傳定律,放開粉紅華的豌豆隨機授粉,子代可區(qū)分為紅花、粉紅花和白花三類,其比例為1:2:1,為檢驗這一理論,特別安排了一個試驗:結果為100株開粉紅花的豌豆隨機授粉后的子代中開紅花的有30株,開粉紅花的有48株,開白花的有22株,請問:這一實驗結果是

40、否支持孟德爾的遺傳定律呢?(=0.05)14-4 根據(jù)以往統(tǒng)計資料,某市家庭人均年收入低收入組、偏低收入組、中等收入組、偏高收入組和高收入組的構成情況為1:4:2:2:1,2010年隨機抽取了400個家庭,其中,35個家庭屬于低收入組,129個家庭屬于偏低收入組,105個家庭屬于中等收入組,82個家庭屬于偏高收入組,49個家庭屬于高收入組,請問2010年該市家庭人均收入構成與往年相比是否顯著性變化()?14-5下表是某婦產(chǎn)醫(yī)院隨機抽取的25名新生嬰兒的身高數(shù)據(jù)(單位:厘米),請用累積頻率Kolmogorov-Smirnov檢驗法檢驗這個醫(yī)院出生的新生嬰兒身高是否服從正態(tài)分布。 25名新生嬰兒的

41、身高數(shù)據(jù)身高人數(shù)461481492506518524552571合計2514-6 下表是250個煤的樣品中的含灰量(單位:%)的分析結果。試在顯著性水平下檢驗含灰量服從正態(tài)分布 50個煤的樣品中的含灰量數(shù)據(jù)含灰量頻數(shù)含灰量頻數(shù)含灰量頻數(shù)含灰量頻數(shù)9.25113.8618.32222.7529.75014.31318.81223.25010.3214.81419.31223.75310.8115.31519.8724.25011.3115.81320.3624.75011.8216.32420.8825.25112.3516.81521.3612.8417.31921.8413.3717.82322.3214-7下表是隨機抽取的某校社會學專業(yè)對入學新生專業(yè)了解程度測試結果,請運用秩和檢驗法驗證這兩年社會學專業(yè)入學新生對專業(yè)的了解程度有無顯著性差異()? 某校社會學專業(yè)入學新生對專業(yè)了解程度的測試結果編號1234567892008年738779758295842009年86819184889092858314-8 為了解甲乙兩個城市社區(qū)志愿者工作情況,分別隨機選取了部分志愿者進行調查,下表是他們過去一個月里平均每周用于志愿者工作的時間(單位:小時),請問這兩個城市的志愿

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論