非參數(shù)統(tǒng)計學講義第四章多樣本模型_第1頁
非參數(shù)統(tǒng)計學講義第四章多樣本模型_第2頁
非參數(shù)統(tǒng)計學講義第四章多樣本模型_第3頁
非參數(shù)統(tǒng)計學講義第四章多樣本模型_第4頁
非參數(shù)統(tǒng)計學講義第四章多樣本模型_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

非參數(shù)統(tǒng)計學講義主講:統(tǒng)計系袁靖第四章多樣本模型§1k個相關樣本的非參數(shù)檢驗在參數(shù)統(tǒng)計中,檢驗幾個樣本是否來自完全相同的總體,采用方差分析或F檢驗。運用F檢驗的假定條件是:樣本是從正態(tài)分布的總體中獨立抽選的;總體具有相同的方差;數(shù)據(jù)的測量層次至少是定距尺度。當被用來分析的數(shù)據(jù)不符合這些假定條件,或研究者不希望作這些假設,以便增加結論的普遍性時,不宜采用參數(shù)統(tǒng)計的方法,而必須運用非參數(shù)方法。如果k(等于或大于3)個樣本是按某種或某些條件匹配的,那么k個樣本稱為相關的,否則為獨立的。k個相關和獨立樣本的差別與兩個相關和獨立樣本之間的差別類似。本節(jié)介紹k個相關樣本的非參數(shù)檢驗。CochranQ檢驗研究背景CochranQ檢驗也譯為科庫蘭檢驗。它是用以檢驗匹配的三組或三組以上的頻數(shù)或比例之間有無顯著差異的方法。這種匹配可以用不同形式獲得。例如,檢驗三種不同類型的采訪形式對被采訪者的有效回答是否有影響,可以抽選一些人,分成n組,每組有3個匹配的被采訪者,要求他們的有關情況相同。每組的3名成員被隨機地置于3種條件之下,即分別接受三種類型的采訪,于是,就獲得了3個匹配的樣本,即k=3,每個樣本有n個觀測結果。k個相關樣本也可以采用同一組人,對不同的k個條件的反應匹配成樣本,這類似于兩個相關樣本中以研究對象作為自身的對照者。例如,檢驗幾種教學手段對學生掌握知識是否有顯著不同,可以隨機抽取n個學生,讓他們先后置于k種教學手段之下,再作出評價。這樣可以獲得k個匹配的樣本,每個樣本有n個觀測結果。在現(xiàn)實生活中,很多數(shù)據(jù)是以二元數(shù)據(jù)的形式出現(xiàn)的,【例4-1】村民對四個候選人的評價得到結果:表4-1村民評價結果處理區(qū)組:20個村民對A、B、C、D四個候選人的評價A0110011111111111011116B1100011111011011000011C011110000100011010109D0000110010000101100061321232233122333212142其中:1表示同意;0表示不同意。關心的問題是候選人在村民眼中有無區(qū)別,即檢驗H0:是否成立,此時如果使用Friedman秩和檢驗將會遇到麻煩,因為有很多打結現(xiàn)象存在。基本方法若有k個相關樣本,每個樣本有n個觀測結果,檢驗k個樣本問是否有顯著差異,可以建立雙側備擇,假設組為個樣本間無顯著差異個樣本間有顯著差異由于三個及三個以上樣本間差異的方向不便于判定,因而,通常只建立雙側備擇進行檢驗。為對假設作出判定,所分析的數(shù)據(jù)測量層次為定類尺度即可。獲得的數(shù)據(jù)可排成一個n行k列的表。如果H0為真,那么將測量結果分為“成功”和“失敗”的話,“成功”與“失敗”應隨機地分布在表中的各行各列。CochranQ檢驗的統(tǒng)計量定義為式中,是第j列的總數(shù),是第i行的總數(shù)。式中,k為處理數(shù);b為區(qū)組數(shù);為行總和;為列總和;;。由于Q統(tǒng)計量的抽樣分布近似為自由度df=k一1的分布,所以根據(jù)自由度df=k一1,給定的顯著性水平,能夠在附表中查找臨界值,若則在顯著性水平下拒絕H0,表明樣本之間存在著顯著差異。相反,則不能拒絕H0。使用說明①運用CochranQ檢驗時應注意,只有當行數(shù)n不太小時,Q的抽樣分布才近似于df=k一1的分布。但是,n的最小數(shù)值日前并沒有明確的說明,使用者采用時視具體問題而定。②CochranQ檢驗適用于定類尺度測量的數(shù)據(jù),其它測量層次的數(shù)據(jù)也可以運用,但要象例4-2那樣,轉化為兩類,但這樣做可能浪費數(shù)據(jù)中包含的信息。因此,CochranQ檢驗一般只用于定類尺度的數(shù)據(jù)。應用【續(xù)例4-1】候選人的例子因而,拒絕原假設,認為這4位候選人在選民眼中不同。【例4-2】消費者對飲料的愛好是否存在差異某商店為決定經(jīng)營飲料的品種、數(shù)量,對消費者的愛好進行了一次調查。隨機抽取18個消費者,請他們對四種飲料:熱牛奶、酸奶、果汁、可口可樂的喜好作出評價,凡喜好的記作1,不喜好記作0。調查結果如表4—2。表4-2消費者對飲料喜好的調查結果消費者熱牛奶酸奶果汁可口可樂合計()100120010100112110021010201001000110100101102111030010100101100121100211002010011001200011合計()887629分析:為檢驗消費者對四種飲料的愛好是否有差異,建立雙側各擇,假設組為消費者對四種飲料愛好無顯著差異消費者對四種飲料愛好有顯著差異由于數(shù)據(jù)為定類尺度測量,只有“愛好”與“不愛好”兩種結果,且是兩個以上相關樣本,這里是四種飲料,k=4,所以選用CochranQ檢驗。根據(jù)表4—1的調查數(shù)據(jù),計算H0成立時的統(tǒng)計量Q。=8表示喜歡第一種飲料熱牛奶的總次數(shù),是喜歡酸奶的總次數(shù),其它的依此類推。是所有四種飲料中,消費者表示喜歡的總次數(shù)。是第i個消費者喜歡各種飲料的次數(shù)。,是各個消費者對四種飲料表示喜歡的總次數(shù)。表示按樣本數(shù)計算的消費者喜歡的總次數(shù),而表示按觀察對象即消費者或說按樣品數(shù)計算的對各種飲料喜歡的總次數(shù)。這兩個總和應相等,即有。統(tǒng)計量Q正是用于說明按樣本數(shù)計算的總次數(shù)與按樣品數(shù)計算的總次數(shù)的符合程度。按(4.1)式,可以計算出Q=0.5238根據(jù)給定的顯著性水平=0.05,自由度df=4-l=3,查附表,得到臨界值=7.82。顯然,Q=0.5238<=7.82。因而,調查數(shù)據(jù)在5%的顯著性水平上不能拒絕H0,即消費者對四種飲料的愛好沒有顯著差異?!纠?-3】三種不同教學方法的效果是否有顯著差異三種不同教學方法:電視教學、課堂講授、課堂討論,對學生掌—握知識的效果是否有所不同。為檢驗這一問題,抽選部分學生分為18組,每組3名匹配的學生,他們的有關情況類似。各組中3名學生被隨機地置于3種條件下,即隨機地指定接受某種教學方法。實施不同教學方法后進行測驗,成績合格為有效,記作1;成績不合格為無效,記作0。結果如表4—3。表4-3實施不同教學方法的學生成績學生組電視教學課堂講授課堂討論合計()000001120101000010120112011201011012000001120112011201120112111300110112合計()3121328分析:學生的考試成績是定距尺度測量,這里將其轉化為合格、不合格兩類,則視為定類尺度。合格即教學方法有效為1,不合格為教學方法無效,記作0。接受三種不同教學方法的學生在每一組是匹配的,即構成3個相關樣本,k=3。檢驗三種教學方法的效果是否存在差異,建立的假設組為三種教學方法的效果無顯著差異三種教學方法的效果有顯著差異由于是定類尺度測量的數(shù)據(jù),相關樣本數(shù)目大于2,因此,宜采用CochranQ檢驗。利用表4—2的數(shù)據(jù)計算檢驗統(tǒng)計量Q=13給定顯著性水平=0.05,df=3—1=2,查附表中相應臨界值=5.99。顯然,Q=13>=5.99,在5%的顯著性水平上調查數(shù)據(jù)拒絕H。,表明三種不同教學方法的效果有顯著差異。最后的判定,還可以采用這種方法,計算其尾概率。軟件處理Friedman檢驗Friedman檢驗亦稱佛利得曼的檢驗?;蚍鹄寐p向評秩方差分析,或者Friedman秩和檢驗。它是對k個樣本是否來自同一總體的檢驗。k個樣本是匹配的,實現(xiàn)匹配的方法與前面類似??梢允莐個條件下同一組受試者構成,即受試對象作為自身的對照者,也可以將受試者分為n個組,每組均有k個匹配的受試者,隨機地將k個受試者置于k個條件之下形成。在不同受試者匹配的樣本中,應盡量使不同受試者的有關因素匹配即相似。基本方法與CochranQ檢驗相似,F(xiàn)riedman檢驗也是用來檢驗各個樣本所得的結果在整體上是否存在顯著差異。因此建立的也是雙側備擇,假設組為H0:k個樣本間無顯著差異或者H0:H1:k個樣本間有顯著差異H1:不全相等為對假設作出判定,所分析的數(shù)據(jù)應是定序尺度測量。獲得的數(shù)據(jù)排成一個n行k列的表,行代表不同的受試者或匹配的受試小組,列代表各種條件。由于是定序尺度測量的數(shù)據(jù),因此,可以對每一行的觀測結果分別評秩,即評等級,等級1是最小的,依次排序,秩從1到k。如果H0為真,那么每一列中秩的分布應該是隨機的,即各個秩出現(xiàn)在所有列中的頻數(shù)應幾乎相等,也就是說各列的秩和應該大致相等。STEP1:在每一個區(qū)組中計算各個處理的秩:;STEP2:計算秩和;STEP3:定義Friedman檢驗統(tǒng)計量為。NOTE:①Q(mào)越大對H0越不利;②在小樣本時,要查臨界值表,查表時,要作變換;③在大樣本時,有Q的抽樣分布在n、k不太小時,近似于自由度df=k—l的分布,即。因此,在附表中,可以根據(jù)給定的顯著性水平,自由度df=k一1查得H0為真時,相應的臨界值。若,則在水平上拒絕H0,否則不能拒絕H0;④某區(qū)組中存在結時,Q應作適當?shù)男拚谩纠?-4】在不同的城市對不同的人群進行血液中鉛含量測試。設有A、B、C三個城市(汽車密度不同)代表三種不同的處理(k=3),對試驗者按職業(yè)分組(b=4)取血(四個區(qū)組)。他們血液中鉛含量及其評秩的結果如下:表4-4不同城市居民血液鉛含量評秩城市(處理)職業(yè)(區(qū)組)ⅠⅡⅢⅣA80(3)100(3)51(2)65(3)11B52(2)76(2)52(3)53(2)9C40(1)52(1)34(1)35(1)4由此可以計算出【例4-4】三種不同教學方法的效果是否有顯著差異三種不同教學方法同例4-2,抽選的學生也分為18組,每組3名匹配的學生,其有關情況類似。各組中3名學生被隨機地安排接受某種教學方法。實施不同教學方法后,進行測驗,按成績高低對3名匹配學生的成績排列等級即評秩,結果如表4—4。表4-4實施不同教學方法的學生成績學生組電視教學課堂講授課堂討論13212323132121313212323121321313213212313212.52.5123123123合計()2540.542.5分析:這個問題與例4-3類似,也是檢驗三種教學方法的效果,有無差異,因而應建立雙側備擇,假設組為Ho:三種學方法的效果無顯著差異H1:三種教學方法的效果有顯著差異表4-4實施不同教學方法的學生成績等級由于數(shù)據(jù)的測量已轉化為定序尺度,且是兩個以上相關樣本,故可以來用Friedman檢驗。根據(jù)表4—4的數(shù)據(jù)表4—3中,第15組接受課堂講授和課堂討論方法的學生測驗成績相同,因此排序時,取秩2和3的平均值,均記為表4—3中,第15組接受課堂講授和課堂討論方法的學生測驗成績相同,因此排序時,取秩2和3的平均值,均記為2.5。以平均秩替代同分,不影響這一檢驗的有效性。給定顯著性水平=0.05,自由度df=k—l=2,查附表中H0成立時相應的臨界值=5.99。顯然,>=5.99,因此數(shù)據(jù)在5%的顯著性水平上拒絕H0,三種教學方法的效果有顯著差異。【例4-5】四部分技術訓練的有效性有無差異某田徑隊對新入隊的學員要進行四個部分的技術訓練,以提高學員的身體素質。為檢驗這四個部分的技術訓練計劃是否確實有效,隨機抽選了14名新學員,分別接受四個部分的訓練。每一訓練結束后,均進行該部分的測驗,成績以10分為最高。檢測結果如表4-5。表4-5學員受訓后檢測的成績學員編號技術訓練Ⅰ技術訓練Ⅱ技術訓練Ⅲ技術訓練Ⅳ10368259441038631043410654677106561035105768976542635474510965810分析:學員的測驗成績是定距尺度測量的,但可以將其轉換為定序尺度。將每一學員的4個成績,按由低到高的順序排列,給出等級即評秩,得到表4一5。由于是兩個以上相關樣本,且數(shù)據(jù)為定序尺度,故可以運用Friedman檢驗。建立的假設組為Ho:四個部分技術訓練的有效性無顯著差異H1:四個部分技術訓練的有效性有顯著差異根據(jù)表4—5的數(shù)據(jù),按(4.2)計算得到在附表中,查找與顯著性水平=0.05,自由度df=k—1=3相對應的臨界值=7.82。顯然Q=0.7714<=7.82,調查結果在5%的顯著性水平上不能拒絕H0,表明四個技術訓練的有效性沒有顯著差異。軟件處理CochranQ檢驗與Friedman檢驗這兩個檢驗都用于k個相關樣本是否可能來自同一個總體的檢驗。但對數(shù)據(jù)測量層次的要求不同。CochranQ檢驗適用于定類尺度的測量數(shù)據(jù),其它測量層次的數(shù)據(jù)也可以使用,但應轉化為兩類數(shù)據(jù)。有時觀察值是以“是”或“否”,“喜歡”或“不喜歡”等二元數(shù)據(jù)的形式出現(xiàn),如果用Friedman秩和檢驗將會出現(xiàn)很多打結的現(xiàn)象,即秩相同。CochranQ檢驗就解決了打結的問題。但當數(shù)據(jù)為定類尺度測量,只能運用CochranQ檢驗。因為,這一檢驗對于定類尺度或僅分為兩類的定序尺度測量數(shù)據(jù)是極為有效的。若數(shù)據(jù)測量層次至少為定序尺度時,應優(yōu)先選用Friedman檢驗。因為若將定序尺度轉換為定類尺度,而采用CochranQ檢驗,可能會浪費數(shù)據(jù)包含的信息區(qū)組設計的另外兩種檢驗:Page檢驗和Durbin檢驗1.完全區(qū)組設計的Page檢驗對于單邊檢驗問題,,Page于1963年引入下面統(tǒng)計量:式中為秩在第j個區(qū)組中的秩和。NOTE:①L值越大對H0越不利;②在時,有正態(tài)近似,其中:;,證明過程詳見筆記;③存在打結時,需要進行修正?!纠m(xù)例4-4】血液中含鉛量的例子這里將城A和C對調,即檢驗,。,,所以,,查表P187表,。得,,拒絕原假設,認為有顯著性影響。P187表,。正態(tài)近似計算,。2.不完全區(qū)組設計的Durbin檢驗考慮平衡的不完全區(qū)組設計,檢驗,不全相等。Durbin于1951年提出檢驗統(tǒng)計量為:可以使用下面的簡化計算:在原假設成立時,D統(tǒng)計漸近服從【例4-6】比較四種材料()在四個部位()的磨損,數(shù)據(jù)可以記為下面兩種形式:表4-6a表4-6a不完全區(qū)組設計舉例材料(處理)部位(區(qū)組)ⅠⅡⅢⅣA34(1)28(1)36(1)3B36(2)30(2)45(1)5C40(3)48(2)60(3)8D44(3)54(3)59(2)8表4-6b不完全區(qū)組設計舉例部位(區(qū)組)ⅠⅡⅢⅣ34(A)30(B)48(C)59(D)36(B)28(A)54(D)60(C)40(C)44(D)36(A)45(B)解:從右邊的表容易看出BIB設計的平衡性質,這里。拒絕原假設,認為在10%的顯著性水平下,不同材料的磨損情況存在區(qū)別?!?k個獨立樣本的非參數(shù)檢驗Kruskal-Wallis檢驗Kruskal—Wallis檢驗亦有譯為克拉夏爾—瓦里斯檢驗,或簡稱為克氏檢驗。它是兩個獨立樣本Mann—Whitney—Wilcoxon檢驗的一種推廣。問題的提出【例4-7】在一項健康試驗中,有三種生活方式,減肥效果如下表,問:每種生活方式的減肥效果是否相同?表4-7減肥效果表生活方式123一個月后減少的重量(單位500g3.77.39.03.75.24.93.05.37.13.95.78.72.76.5554更為一般的數(shù)據(jù)形式為:表4-8一般的數(shù)據(jù)結構12……k…………………在數(shù)理統(tǒng)計學中,應作單因素方差分析原假設:檢驗統(tǒng)計量:但這是要求不同的樣本來自于具有相同方差的正態(tài)總體。然而,這種條件在現(xiàn)實中難以滿足。Kruskal—Wallis檢驗基本方法基本假定①假定這k個樣本具有相似的連續(xù)分布;②所有的觀察值在樣本內和樣本間是相互獨立的。提出原假設若有k個總體,各自的連續(xù)累積分布函數(shù)為,那么Kruskal—Wallis檢驗的一般零假設為對所有的x如果在研究總體是否相同時,偏重于考察位置參數(shù),并且位置參數(shù)采用各個總體的中位數(shù),即么,H0等價于k個總體的中位數(shù)相等。若仍以代表k個總體的中位數(shù),則Kruskal—Wallis檢驗建立的假設組為中至少有兩個不相等這里的備擇對于k>2時不存在單側備擇的配對,因為對于來說,有種不同的有序排列,這不便于進行檢驗?;驹斫y(tǒng)計量的構造可以仿照兩樣本的Wilcoxon秩和檢驗,先混合兩個樣本,然后找出各個觀察值在混合樣本中的秩,分別按樣本求和。為對假設作出判定,需要的數(shù)據(jù)是k個獨立的隨機樣本,其大小為樣本獨立地分別從各自總體抽取,總體分別具有連續(xù)的累積概率分布。數(shù)據(jù)的測量層次至少在定序尺度上。記觀察值在混合樣本中的秩為。則有為第i個樣本的秩和為第i個樣本的平均秩和當存在較大差別時,有理由懷疑H0是否為真。由此,仿照方差分析的做法,可以構造檢驗的統(tǒng)計量,將它定義為H(4.7)式還可以寫成下面的形式或者可以這樣來思考。將所有數(shù)據(jù)按從小到大的順序合并成一個單一的樣本,其大小。將每一個觀察值給出一個等級即評秩,秩為整數(shù),從1到N。對于N個觀察值來說,平均等級是對于含有個觀察值的第j個樣本來說,等級總和的期望值是。若以表示第j個樣本的實際等級總和,那么就表示k個樣本中第j個樣本等級總和與其均值的偏差。如果H0為真,所有樣本數(shù)據(jù)混合排列成一個單一的隨機樣本,等級即秩次應該在k個樣本之間均勻地分布,也就是說,各樣本實際的等級總和即秩次和與期望等級總和之間的偏差應很小。因此,Kruskal—wallis檢驗定義的統(tǒng)計量可以建立在實際等級總和與期望等級總和的偏差的基礎上。計算公式為(4.9)式也可以寫(4.8)式。檢驗統(tǒng)計量檢驗統(tǒng)計量為:確定P值①小樣本時,可以查附表K-W。②大樣本時,可以查分布表。當樣本數(shù)k、每個樣本包含的觀察值數(shù)目,不是很小時,檢驗統(tǒng)計量H漸近的抽樣分布是自由度df=k—1的分布。根據(jù)給定的顯著性水平,自由度df=k一1,在附表中可以查找到H0為真時的臨界值。若H<,表明H是一個較小的值,數(shù)據(jù)支持H0,k個樣本之間無顯著差異。若H>,反映實際的秩次和分布與期望的分布之間不一致,數(shù)據(jù)拒絕H0,k個樣本來自不同總體。通常情況下,當k=3和各個時,漸近的P值無法由卡方分布表得到,而只能查找附表K-W附表。這個表是Kruskal.W.H和Wallis.W.A.于1952年在其合作的著作中發(fā)表的。Note:在大樣本時,還可以構造一個F統(tǒng)計量來作多個獨立樣本的檢驗。統(tǒng)計量與H之間的關系為:應用【例4-8】續(xù)前例分析:將樣本觀察值進行混合,然后進行評秩,結果見表4—9表4-9減肥效果評秩表生活方式123一個月后減少的重量(單位500g3.7(3.5)7.3(12)9.0(14)3.7(3.5)5.2(7)4.9(6)3.0(2)5.3(8)7.1(11)3.9(5)5.7(9)8.7(13)2.7(1)6.5(10)秩和154644秩平均39.211在該題中,=5,=5,=4,N=14。依題意,可以提出如下的假設:中至少有兩個不相等依表中的數(shù)據(jù),可以計算檢驗統(tǒng)計量H的統(tǒng)計值為:H=9.4114。查K-W表,得到在1%的顯著性水平下的臨界值為7.8229,因此拒絕原假設。如果使用卡方分布作近似計算,可以查卡方分布表,得,結論同上。【例4-9】四種不同類型治療的有效性是否有顯著不同對于精神錯亂有4種不同的手段:電擊、心理療法,電擊加心理療法、無任何治療。為檢驗這幾種不同手段對精神錯亂治療的有效性是否不同,選取了40個病人。他們在智力、品德、心理等因素方面相差不多。隨機地將40人分成4個組,每組10人。4個組分別接受不同方法的治療。一個周期后,對每個病人相對改善程度進行測量,依改善高低程度給40人分等級,等級l是改善的最高水平,依次排序,直至等級40是改善最小的水平。評秩結果如表4—10。表4-1040名病人改善程度的等級電擊療法組心理療法組電擊加心理療法組無治療組22253019613229164342411836377939271815352814124025212031231013332617338秩次和()26012290348分析:對任何一種方法判定其有效的標志是病人分數(shù)的中位數(shù),若4種方法效果差異不大,則各樣本的中位數(shù)應相等。為檢驗4種方法有效性是否有差異,可以建立假設組為中至少有兩個不相等由于數(shù)據(jù)是定序尺度測量,有兩個以上獨立樣本,因此可以來用Kruskal—Wallis檢驗;根據(jù)表4—5的數(shù)據(jù),按(4—4)式計算檢驗統(tǒng)計量H。在卡方分布表中,與df=k一1=3,顯著性水平=0.05相對應的臨界值。顯然H=31.89>。數(shù)據(jù)在5%的顯著性水平上拒絕H0,表明四種不同治療方法對精神錯亂的有效性存在顯著差異。同分的處理在實際中,往往會出現(xiàn)評分相同的情況。如果在兩個或兩個以上的評分之間出現(xiàn)同分時,每一個評分的秩都記作這些同分秩的平均值。由于出現(xiàn)同分會對統(tǒng)計量H有影響,因而計算H值時,應進行校正。校正系數(shù)為式中,u是相同評分的觀察值數(shù)目,如學員考試成績有2個62分,則u=2;還有4個78分,則u=4等等。計算H值時,利用(4—7)式除以H,得到的是校正的H值。經(jīng)過校正以后H值比校正前要大。如果末校正時,計算結果就能拒絕H0,那么校正后將在更加苛刻的顯著性水平上拒絕H0,因為與較大的H值相對應的概率P值將更小。在大多數(shù)情況下,這一校正??珊雎?。根據(jù)Kruskal和Wallis在1952年的著作中證明,當同分的觀察值數(shù)目占觀察值總數(shù)目的比例不到25%時,校正后的概率僅僅改變百分之十幾。一般情況,校正因子的大小取決于u值的大小,即同分的數(shù)目和同分觀察值數(shù)目占觀察值總數(shù)的百分比。【例4-10】三種不同教學方法的有效性是否有顯著差異某大學制定三種不同的教學方法:大班講授,小組講授、小組討論。為檢驗三種方法對學生掌握知識的有效性是否相同,進行了一次試驗。選取二年級大學生50名,隨機地分為三組,分別接受三種不同方法教學。由同一教師按不同方法分別講授同一方面的知識,規(guī)定的內容講授完后,對學生進行統(tǒng)一考試,成績如表4—11所示。表4-11學生考試成績大班講授組(Ⅰ)小組講授組(Ⅱ)小組討論組(Ⅲ)6278567384567948788662896492988498728672909278846948528469794954867386648492928469829898707269628190分析:學生成績?yōu)槎ň喑叨葴y量,但為了避免作出某些假設,以使結論更具普遍性,所以不準備采用參數(shù)檢驗方法,而選用非參數(shù)檢驗。由于三種不同教學方法是獨立的,故應采用6個獨立樣本的統(tǒng)計檢驗。對于三組學生成績集中趨勢的一個很好的度量指標是中位數(shù),成績可以由小到大排序給出等級,因此能夠采用Kruskal—Wallis檢驗。建立假設組為中至少有兩個不相等若用文字描述為H0:接受不同教學方法的學生平均成績沒有顯著差異H1:接受不同教學方法的學生平均成績不完全相同為采用Kruskal—Wallis檢驗對假設作出判定,將表4—9中的所有學生成績排序,最低分秩評為1,最高分秩評為50。由于50名學生中有不少是同分,采用相應秩的簡單算術平均數(shù)作為同分的平均秩,得到表4—12。表4-12學生考試成績的等級大班講授組(Ⅰ)小組講授組(Ⅱ)小組討論組(Ⅲ)62(9)78(22)56(6.5)73(22)84(32.5)56(6.5)79(26.5)48(1.5)78(24.5)86(37.5)62(9)89(40)64(11.5)92(44.5)98(48.5)84(32.5)98(48.5)72(19)86(37.5)72(19)90(41.5)92(44.5)78(24.5)84(32.5)69(14.5)48(1.5)52(4)84(32.5)69(14.5)79(26.5)49(3)54(5)86(37.5)73(22)86(37.5)64(11.5)84(32.5)92(44.5)92(44.5)84(32.5)69(14.5)82(29)98(48.5)98(48.5)70(17)72(19)69(14.5)62(9)81(28)90(41.5)合計(Ri)649.5318.5307用表中數(shù)據(jù),按H的計算公式計算得到附表中,df=k一1=2,H=5.2626出現(xiàn)的概率P在0.05與0.10之間。若顯著性水平=0.05,則數(shù)據(jù)不能拒絕H0;而顯著性水平=0.10,則數(shù)據(jù)拒絕H0。由于學生成績中同分較多,因而應采用校正的H。計算同分的觀察值數(shù)目,即和,計算過程列于表4—11中。由于,所以校正因子為校正后的統(tǒng)計量H為這一結果與校正前的H值相差不多。對于顯著性水平=0.05,df=k一1=2,H0為真時的臨界值為=5.99。H=5.2864<=5.99,數(shù)據(jù)在5%的顯著性水平上不能拒絕H0,表明接受不同教學方法的學生平均成績沒有顯著差異。表4-13同分的觀察值數(shù)目計算同分的觀察值UU348285628623276428694647232773327782879288462168646490289246498464合計43601書上的例子,詳見筆記P25Jonkheere-Terpstra檢驗設有k個樣本,,其中為位置參數(shù)。K-S檢驗主要用于雙邊假設檢驗,但在實踐中,有可能需要我們判斷樣本的位置是否呈現(xiàn)出某種趨勢(上升或下降趨勢),則可檢驗,,我們可以使用Jonkheere-Terpstra檢驗。記,表示樣本i中觀察值小于樣本j中觀察值的對數(shù)。則Jonkheere-Terpstra檢驗的統(tǒng)計量由兩人分別于1952年和1954年提出。由兩人分別于1952年和1954年提出。() 由J的定義可知,J越大對H0越不利。因而尾概率為,查表可求出臨界值c。Note:①如果有結出現(xiàn),則應作修正,檢驗統(tǒng)計量作相應的變動;筆記P26②在大樣本時,可以使用正態(tài)近似。筆記P26【例4-11】續(xù)前例(教材P76)分析:為了適用檢驗臨界值表的需要,應該選擇=4,=5,=5提出假設,記根據(jù)數(shù)據(jù)可以得到:=14,=25,=20則查表可得P值<0.00371<0.05=拒絕H0,說明位置有下降的趨勢。§3k個樣本的卡方檢驗兩個獨立樣本的檢驗可以直接推廣到k個獨立樣本,用來檢驗k個樣本之間差異的顯著性。基本方法k個獨立樣本檢驗與兩個獨立樣本的基本方法類似。零假設是k個樣本來自同一總體,或來自一些相同的總體。樣本可以是k個頻數(shù)或k個比例。每一樣本都可以分成r組,因此數(shù)據(jù)可以排成一個k×r的表。若以表示第i行第j列的實際頻數(shù)或比例,表示與其相應的理論頻數(shù)或比例,那么,檢驗統(tǒng)計量Q為以表示第i行的頻數(shù)和或比例和,k個樣本觀察值的數(shù)目分別為,…,,總數(shù)目,任一樣本觀察值數(shù)目記作,那么,理論頻數(shù)可以由下式計算當H0為真時,Q統(tǒng)計量的抽樣分布近似于自由度df=(k—1)(r一1)的分布。根據(jù)給定的顯著性水平,查相應的卡方分布表,即可以進行相應的檢驗應用【例4-12】收聽體育廣播興趣不同的人,參加體育活動的情況是否也不相同1990年秋的《亞運會》調查,在全國范圍抽選12個省的2162人(原抽選2211人,其中49人未回答),按收聽體育廣播的興趣程度分為:很不喜歡、不喜歡、無所謂、喜歡、非常喜歡五類,各類人員參加體育活動情況如表4—14所示表4-14各類人員參加體育活動情況的人數(shù)很不喜歡不喜歡無所謂喜歡非常喜歡合計不參加1596644290571102偶爾參加31521820449489經(jīng)常參加41510511332269天天參加31411910858302合計2514010867151962162資料來源:柯惠新等:《調查研究中的統(tǒng)計分析》P262.北京廣播學院出版社,1992。分析:按收聽體育廣播興趣劃分的五種類型是相互獨立的,抽選的2162人隨機地分為這五類,因此,k=5是獨立樣本,應采用k個獨立樣本的檢驗。數(shù)據(jù)是定類尺度測量的,所以適用檢驗。建立的假設組為H0:收聽體育廣播興趣不同不影響參加體育活動的情況H1:收聽體育廣播興趣不同參加體育活動情況也不同為對假設作出判定,需要計算Q統(tǒng)計量。必要的計算過程如表4—15。表中理論頻數(shù)由(4.13)式計算得到。利用表中數(shù)據(jù),按(4.12)式可以計算得到Q統(tǒng)計量。的計算列于表4—16。表4-15Q統(tǒng)計量計算表Ⅰ分組不參加159664429057110212.7471.35553.55364.4499.90偶爾參加315218204494895.6631.67245.63161.7244.33經(jīng)常參加415105113322693.1117.42135.1288.9624.39天天參加314119108583023.4919.56151.7099.8827.38合計2514010867151962162251401086715196表4-16Q統(tǒng)計量計算表Ⅱ0.40098.516114.779515.205018.42251.25018.77453.108011.05370.49200.25470.33626.71416.49642.37440.06881.58047.04870.660134.2434合計1.974519.207231.650333.415255.5323若給定顯著性水平=0.05,由df=(k一1)(r一1)=(5—1)(4一1)=12,查附表,臨界值=21.03。因為Q=141.7795>=21.03,所以數(shù)據(jù)在5%的水平上拒絕H0,表明收聽體育廣播興趣不同的人,參加體育活動的情況也不同,即收聽體育廣播的興趣對參加體育活動有影響。k個比例相等性的檢驗若所研究的k個獨立樣本是k個比例,那么,對k個獨立樣本是否來自同一總體,或是否來自k個相同總體的檢驗,實際是對k個比例相等性的檢驗。k個比例分別記作,則建立的假設組為中至少有兩個不等為了對假設作出判定,所需要的數(shù)據(jù)是定類尺度測量的。k個樣本的數(shù)據(jù)個數(shù)分別為。k個樣本的實際頻數(shù)分別記作,則k個樣本的平均比例為由(4.14)式可以得到第j個樣本的期望頻數(shù)為。若H0為真,那么實際頻數(shù)與相應的期望頻數(shù)應該相等。所以實際頻數(shù)與期望頻數(shù)的偏差可以作為度量k個比例是否相等的一個指標。為檢驗k個比例是否相等定義的統(tǒng)計量為Q。其計算公式為(4.12)式也可以寫成MACROBUTTONMTPlaceRefSEQMTEqn\h

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論