非參數(shù)檢驗(yàn)的概念與過程_第1頁
非參數(shù)檢驗(yàn)的概念與過程_第2頁
非參數(shù)檢驗(yàn)的概念與過程_第3頁
非參數(shù)檢驗(yàn)的概念與過程_第4頁
非參數(shù)檢驗(yàn)的概念與過程_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

非參數(shù)檢驗(yàn)說明:非參數(shù)檢驗(yàn)這章,請看下面吳喜之教授的講義,更為具體的可參看《統(tǒng)計(jì)分析與SPSS的應(yīng)用》薛薇編著人大出版社,2002.7第二次印刷非參數(shù)檢驗(yàn)的概念是指在總體不服從正態(tài)分布且分布情況不明時(shí),用來檢驗(yàn)數(shù)據(jù)資料是否來自同一個(gè)總體假設(shè)的一類檢驗(yàn)方法。由于這些方法一般不涉及總體參數(shù)故得名。這類方法的假定前提比參數(shù)性假設(shè)檢驗(yàn)方法少的多,也容易滿足,適用于計(jì)量信息較弱的資料且計(jì)算方法也簡單易行,所以在實(shí)際中有廣泛的應(yīng)用。非參數(shù)檢驗(yàn)的過程1.Chi-Squaretest卡方檢驗(yàn)2.Binomialtest二項(xiàng)分布檢驗(yàn)3.Runstest游程檢驗(yàn)4.1-SampleKolmogorov-Smirnovtest一個(gè)樣本柯爾莫哥洛夫-斯米諾夫檢驗(yàn)5.2independentSamplesTest兩個(gè)獨(dú)立樣本檢驗(yàn)6.KindependentSamplesTestK個(gè)獨(dú)立樣本檢驗(yàn)7.2relatedSamplesTest兩個(gè)相關(guān)樣本檢驗(yàn)8.KrelatedSamplesTest兩個(gè)相關(guān)樣本檢驗(yàn)12.1卡方檢驗(yàn)Chi-Squaretest

這里介紹的卡方檢驗(yàn)可以檢驗(yàn)列聯(lián)表中某一個(gè)變量的各個(gè)水平是否有同樣比例或者等于你所想象的比例(如5:4:1)實(shí)例1:擲骰子300次,變量LMT,1、2、3、4、5、6分別代表六面的六個(gè)點(diǎn),試問這骰子是否均勻。數(shù)據(jù)data12-01(300個(gè)cases)。Analyze->NonparametricTests->ChiSquareTestVariable:lmt想要檢驗(yàn)的變量由于這是一個(gè)均勻分布檢測,使用默認(rèn)選擇(ExpectedValues:Allcategoriesequal作為零假設(shè));比較有用的結(jié)果:sig=.111>0.5,不能拒絕零假設(shè),認(rèn)為均勻。實(shí)例1的數(shù)據(jù)可以組織成:兩個(gè)變量(side面和number次數(shù)),6個(gè)cases。但在卡方檢驗(yàn)前要求用number加權(quán)。結(jié)果同。補(bǔ)充:卡方檢驗(yàn)實(shí)例實(shí)例:心臟病人猝死人數(shù)與日期的關(guān)系,收集168個(gè)觀測數(shù)據(jù)。其中用1、2、3、4、5、6、7表示是星期幾死的。而人數(shù)分別為55、23、18、11、26、20、15。推斷心臟病人猝死人數(shù)與日期的關(guān)系是否為2.8:1:1:1:1:1:1。(變量2個(gè):死亡日期和死亡人數(shù),Cases7個(gè))加權(quán):Data->WeightCases:死亡人數(shù)Analyze->NonparametricTests->ChiSquareTestVariable:死亡日期ExpectedValues:2.8:1:1:1:1:1:1

比較有用的結(jié)果:sig=.256>0.5,不能拒絕零假設(shè),認(rèn)為心臟病人猝死人數(shù)與日期的關(guān)系為2.8:1:1:1:1:1:1。12.2二項(xiàng)分布檢驗(yàn)Binomialtest二項(xiàng)分布:在現(xiàn)實(shí)生活中有很多的取值是兩類的,如人群的男和女、產(chǎn)品的合格和不合格、學(xué)生的三好學(xué)生和非三好學(xué)生、投擲硬幣的正面和反面。這時(shí)如果某一類出現(xiàn)的概率是P,則另一類出現(xiàn)的概率就是1-P。這種分布稱為二項(xiàng)分布。實(shí)例1:擲一枚比賽用的挑邊器31次,變量tbh,1為出現(xiàn)A面、2為出現(xiàn)A面,試問這挑邊器是否均勻。數(shù)據(jù)data12-03(31個(gè)cases)。Analyze->NonparametricTests->BinomialTestVariable:tbh由于這是一個(gè)均勻分布檢測,使用默認(rèn)選擇(TestProportion:0.5);比較有用的結(jié)果:兩組個(gè)數(shù)和sig=1.00>0.5,不能拒絕零假設(shè),認(rèn)為挑邊器是均勻。實(shí)例1的數(shù)據(jù)可以組織成:兩個(gè)變量(side面和number次數(shù)),2個(gè)cases。但在二項(xiàng)分布檢驗(yàn)前要求用number加權(quán)。結(jié)果同。補(bǔ)充:二項(xiàng)分布檢驗(yàn)實(shí)例實(shí)例:為驗(yàn)證某批產(chǎn)品的一等品率是否達(dá)到90%,現(xiàn)從該批產(chǎn)品中隨機(jī)抽取23個(gè)樣品進(jìn)行檢測,結(jié)果有19個(gè)一等品(1-一等品,0-非一等品)。(變量2個(gè):一等品和個(gè)數(shù),Cases2個(gè):119和04)加權(quán):Data->WeightCases:個(gè)數(shù)Analyze->NonparametricTests->BinomialTestVariable:一等品TestProportion:0.9比較有用的結(jié)果:兩組個(gè)數(shù)和sig=.193>0.5,不能拒絕零假設(shè),認(rèn)為該批產(chǎn)品的一等品率達(dá)到了90%。12.3游程檢驗(yàn)Runstest單樣本變量隨機(jī)性檢驗(yàn)是對某變量值出現(xiàn)是否隨機(jī)進(jìn)行檢驗(yàn)。實(shí)例1(同二項(xiàng)分布檢驗(yàn))

:擲一枚比賽用的挑邊器31次,變量tbh,1為出現(xiàn)A面、2為出現(xiàn)A面,試問這挑邊器出現(xiàn)AB面是否隨機(jī)。數(shù)據(jù)data12-03(31個(gè)cases)。Analyze->NonparametricTests->Runs

TestVariable:tbhCutPoint:Custom:2比較有用的結(jié)果:總case數(shù)(31)、游程Run數(shù)(21)、sig=.142>0.5,不能拒絕零假設(shè),認(rèn)為挑邊器出現(xiàn)AB面是隨機(jī)的。12.4一個(gè)樣本柯爾莫哥洛夫-斯米諾夫檢驗(yàn)

1-SampleKolmogorov-Smirnovtest單樣本K-S檢驗(yàn)是利用樣本數(shù)據(jù)推斷總體是否服從某一理論分布,適用于探索連續(xù)型隨機(jī)變量的分布形態(tài)(判斷定距變量的分布情況):Normal正態(tài)分布、Uniform均勻分布、Poisson泊松分布、Exponential指數(shù)分布。實(shí)例

:盧瑟福和蓋革作了一個(gè)著名的實(shí)驗(yàn),他們觀察了長為7.5秒的時(shí)間間隔里到達(dá)某個(gè)計(jì)數(shù)器的由某塊放射物資放出的alfa粒子質(zhì)點(diǎn)數(shù),共觀察了2608次。數(shù)據(jù)data12-05(1個(gè)變量zd,2608個(gè)cases,按0-10排序)。試問這種分布規(guī)律是否服從泊松分布Analyze->NonparametricTests->1-SampleK-STestVariable:zdTestDistribution:Poisson比較有用的結(jié)果:均值(3.8673)、sig=.850>0.5,不能拒絕零假設(shè),認(rèn)為服從泊松分布。12.5兩個(gè)獨(dú)立樣本檢驗(yàn)

2independentSamplesTest通過分析兩個(gè)樣本數(shù)據(jù),推斷它們的分布是否存在顯著性差異。方法有四種:Mann-WhitneyU:是通過對平均秩的研究來實(shí)現(xiàn)推斷的K-SZ:是通過對分布的研究來實(shí)現(xiàn)推斷的Mosesextremereactions:一個(gè)作為控制樣本,另一個(gè)作為實(shí)驗(yàn)樣本W(wǎng)aldWolfwitzRuns:是通過對游程的研究來實(shí)現(xiàn)推斷的實(shí)例

:甲乙兩種安眠藥服用后的效果。數(shù)據(jù)data12-06(2個(gè)變量:組別zb和延長時(shí)間ycss,20個(gè)cases)。試問這兩種藥物的療效是否有顯著性差異。Analyze->NonparametricTests->2independentSamples

TestVariable:ycssGrouping:zb(1,2)Testtype:四種均選比較有用的結(jié)果:比較四個(gè)sig值,有三個(gè)sig>.5,不能拒絕零假設(shè)認(rèn)為療效無顯著性差異。12.6多多個(gè)個(gè)獨(dú)獨(dú)立立樣樣本本檢檢驗(yàn)驗(yàn)KindependentSamplesTest通過過分分析析多多個(gè)個(gè)樣樣本本數(shù)數(shù)據(jù)據(jù),,推推斷斷它它們們的的分分布布是是否否存存在在顯顯著著性性差差異異。。方方法法有有三三種種::Median::是是通通過過對對中中位位數(shù)數(shù)的的研研究究來來實(shí)實(shí)現(xiàn)現(xiàn)推推斷斷的的K--W::是是通通過過對對推推廣廣的的平平均均秩秩的的研研究究來來實(shí)實(shí)現(xiàn)現(xiàn)推推斷斷的的J--T::與與兩兩個(gè)個(gè)獨(dú)獨(dú)立立樣樣本本檢檢驗(yàn)驗(yàn)的的Mann-WhitneyU類類似似實(shí)例例:某某車車間間用用四四種種不不同同的的操操作作方方法法檢檢測測產(chǎn)產(chǎn)品品優(yōu)優(yōu)等等品品率率的的實(shí)實(shí)驗(yàn)驗(yàn)數(shù)數(shù)據(jù)據(jù)。。數(shù)數(shù)據(jù)據(jù)data12-07((2個(gè)個(gè)變變量量::方方法法ff和和優(yōu)優(yōu)等等品品率率ydpl,,21個(gè)個(gè)cases))。。試試問問這這四四種種不不同同的的操操作作方方法法對對產(chǎn)產(chǎn)品品優(yōu)優(yōu)等等品品率率是是否否有有顯顯著著性性差差異異。。Analyze-->NonparametricTests-->KindependentSamplesTestVariable:ydplGrouping::ff((1,,4))Testtype::三三種種均均選選比較較有有用用的的結(jié)結(jié)果果::比比較較三三個(gè)個(gè)sig值值,,K-W方方法法的的sig==.009<.05,拒拒絕絕零零假假設(shè)設(shè),認(rèn)認(rèn)為為這這四四種種不不同同的的操操作作方方法法對對產(chǎn)產(chǎn)品品優(yōu)優(yōu)等等品品率率是是有有顯顯著著性性差差異異。。其他他二二個(gè)個(gè)方方法法的的sig>.5,,但但不不用用,,原原因因是是觀觀測測量量太太少少。。12.7兩兩個(gè)個(gè)相相關(guān)關(guān)樣樣本本檢檢驗(yàn)驗(yàn)2relatedSamplesTest同一一個(gè)個(gè)被被測測試試者者,,前前后后測測兩兩次次,,彼彼此此相相關(guān)關(guān)。。方方法法有有四四種種。。實(shí)例例:某某校校15名名男男生生的的長長跑跑鍛鍛煉煉后后晨晨脈脈變變化化數(shù)數(shù)據(jù)據(jù)。。數(shù)數(shù)據(jù)據(jù)data12-08((2個(gè)個(gè)變變量量::鍛鍛煉煉前前dlq和和鍛鍛煉煉后后dlh優(yōu)優(yōu),,21個(gè)個(gè)cases))。。試試問問鍛鍛煉煉前前后后的的晨晨脈脈有有無無顯顯著著性性差差異異。。Analyze-->NonparametricTests-->2relatedSamplesTestPairs:dlq-dlhTesttype:選選一種或多種種比較有用的結(jié)結(jié)果:看sig值,sig<.05,拒絕零零假設(shè),認(rèn)為為鍛煉前后的的晨脈有顯著著性的差異。。12.8多多個(gè)相關(guān)關(guān)樣本檢驗(yàn)KrelatedSamplesTest對多個(gè)被測試試者,多個(gè)打打分,看打分分是否有顯著著性差異。方方法有三種::CochranQ:要要求樣本數(shù)據(jù)據(jù)為二值的((1-滿意0-不滿滿意)Friedman:利用用秩實(shí)現(xiàn)Kendall協(xié)同系數(shù)數(shù)檢驗(yàn):H0:協(xié)同系數(shù)數(shù)為0(評分分標(biāo)準(zhǔn)不相關(guān)關(guān)的或者是隨隨機(jī)的)實(shí)例:9個(gè)顧客對對三種款式襯襯衫的喜愛程程度(1-最最喜愛2--其次3--不喜愛)。。數(shù)據(jù)data12-09(3個(gè)變變量:款式式A,款式B,款式C,,27個(gè)cases))。試問顧客客對三種款式式襯衫的喜愛愛程度是否相相同。Analyze->NonparametricTests->krelatedSamplesTestVariables:abcTesttype:選選一種或多種種比較有用的結(jié)結(jié)果:看sig值,sig<.05,拒絕零零假設(shè),認(rèn)為為顧客對三種種款式襯衫的的喜愛程度是是不相同的。。補(bǔ)充:非參數(shù)數(shù)檢驗(yàn)以下的講義是是吳喜之教授授有關(guān)非參數(shù)檢驗(yàn)的講義,我覺覺得比書上講講得清楚。非參數(shù)檢驗(yàn)為什么用非參參數(shù)方法?經(jīng)典統(tǒng)計(jì)的多多數(shù)檢驗(yàn)都假假定了總體的的背景分布。。但也有些沒有有假定總體分分布的具體形形式,僅僅依依賴于數(shù)據(jù)觀觀測值的相對對大?。ㄖ龋┗蛄慵僭O(shè)下下等可能的概概率等和數(shù)據(jù)據(jù)本身的具體體總體分布無無關(guān)的性質(zhì)進(jìn)進(jìn)行檢驗(yàn)。這都稱為非參參數(shù)檢驗(yàn)。為什么用非參參數(shù)方法?這些非參數(shù)檢檢驗(yàn)在總體分分布未知時(shí)有有很大的優(yōu)越越性。這時(shí)如如果利用傳統(tǒng)統(tǒng)的假定分布布已知的檢驗(yàn)驗(yàn),就會產(chǎn)生生錯誤甚至災(zāi)災(zāi)難。非參數(shù)檢驗(yàn)總總是比傳統(tǒng)檢檢驗(yàn)安全。但是在總體分分布形式已知知時(shí),非參數(shù)數(shù)檢驗(yàn)就不如如傳統(tǒng)方法效效率高。這是是因?yàn)榉菂?shù)數(shù)方法利用的的信息要少些些。往往在傳傳統(tǒng)方法可以以拒絕零假設(shè)設(shè)的情況,非非參數(shù)檢驗(yàn)無無法拒絕。但非參數(shù)統(tǒng)計(jì)計(jì)在總體未知知時(shí)效率要比比傳統(tǒng)方法要要高,有時(shí)要要高很多。是是否用非參數(shù)數(shù)統(tǒng)計(jì)方法,,要根據(jù)對總總體分布的了了解程度來確確定。非參數(shù)方法這里介紹一些些非參數(shù)檢驗(yàn)驗(yàn)。關(guān)于非參數(shù)方方法的確切定定義并不很明明確。我們就就其最廣泛的的意義來理解解。在計(jì)算中,諸諸如列聯(lián)表分分析中的許多多問題都有精精確方法,MonteCarlo抽樣方法和和用于大樣本本的漸近方法法等選擇。精精確方法比較較費(fèi)時(shí)間,后后兩種要粗糙糙一些,但要要快些。秩(rank)非參數(shù)檢驗(yàn)中中秩是最常使使用的概念。。什么是一個(gè)個(gè)數(shù)據(jù)的秩呢呢?一般來說說,秩就是該該數(shù)據(jù)按照升升序排列之后后,每個(gè)觀測測值的位置。。例如我們有有下面數(shù)據(jù)Xi159183178513719Ri75918426310這下面一行((記為Ri)就是上面一一行數(shù)據(jù)Xi的秩。秩(rank)利用秩的大小小進(jìn)行推斷就就避免了不知知道背景分布布的困難。這這也是大多數(shù)數(shù)非參數(shù)檢驗(yàn)驗(yàn)的優(yōu)點(diǎn)。多數(shù)非參數(shù)檢檢驗(yàn)明顯地或或隱含地利用用了秩的性質(zhì)質(zhì);但也有一一些非參數(shù)方方法沒有涉及及秩的性質(zhì)。。列聯(lián)表問題我們講過列聯(lián)聯(lián)表的c2檢驗(yàn)問題(第第七章)。這里介紹的檢檢驗(yàn)可以檢驗(yàn)驗(yàn)列聯(lián)表中某某一個(gè)變量的的各個(gè)水平是是否有同樣比比例或者等于于你所想象的的比例。每個(gè)檢驗(yàn)都可可以選擇使用用精確方法,,MonteCarlo抽樣方法法或用于大樣樣本的漸近方方法。利用數(shù)據(jù)table7.sav,假假定你想知道道收入的比例例是否是5比比4比1(零零假設(shè))。而而且選擇精確確檢驗(yàn),你可可以得到各種種檢驗(yàn)結(jié)果如如下:列聯(lián)表問題利用數(shù)據(jù)table7.sav,假假定你想知道道收入的比例例是否是5比比4比1(零零假設(shè))。而而且選擇精確確檢驗(yàn),你可可以得到各種種檢驗(yàn)結(jié)果如如下:列聯(lián)表問題該結(jié)果除了給給出了精確檢檢驗(yàn)的p值,,表明無論還還給出漸近檢檢驗(yàn)的p值;;兩個(gè)都是0.000;;這表明零假假設(shè)的比例欠欠妥。輸出還還給出了Pearson統(tǒng)計(jì)量中的的Oi和Ei(分別為下下表中的ObservedN和ExpectedN)):列聯(lián)表問題如果要檢驗(yàn)變變量的各水平平是否都相等等,從SPSS可以得到對這這三個(gè)變量的的檢驗(yàn)(對每每個(gè)變量的零零假設(shè)是各水水平影響相同同)結(jié)果:SPSS還分分別給出對每每個(gè)變量的Pearson統(tǒng)計(jì)量中的Oi和Ei。SPSS軟件件使用說明用table7.sav數(shù)據(jù)。假定定已經(jīng)加權(quán)了了(number:權(quán))Analyze-NonparametricTests-ChiSquare。然后選擇想要檢驗(yàn)的變量(如income),如要檢驗(yàn)其水水平是否相等等,則在ExpectedValues選Allcategoriesequal作為零假設(shè)((默認(rèn)選擇));如要檢驗(yàn)其水水平是否為某某比例,則在在下面Values輸入你的比例例(我們是5比4比1,,逐個(gè)輸入))作為零假設(shè)設(shè)。點(diǎn)Exact時(shí)打開的對對話框中可以以選擇精確方方法(Exact),MonteCarlo抽樣方法((MonteCarlo)或用于于大樣本的漸漸近方法(Asymptoticonly))。如果選入的變變量多于一個(gè)個(gè),則檢驗(yàn)的的都是水平相相等的零假設(shè)設(shè)。最后OK即可。單樣本Kolmogorov-Smirnov檢驗(yàn)單樣本的Kolmogorov-Smirnov檢驗(yàn)(K-S檢驗(yàn)))是用來檢驗(yàn)驗(yàn)一個(gè)數(shù)據(jù)的的觀測累積分分布是否是已已知的理論分分布。這些作為零假假設(shè)的理論分分布在SPSS的選項(xiàng)中中有正態(tài)分布布(Normal),泊泊松分布(Poisson),均均勻分布(Uniform)和指數(shù)數(shù)分布(Exponential)。在SPSS軟件中對對于是否是正正態(tài)分布或均均勻分布的檢檢驗(yàn)統(tǒng)計(jì)量為為數(shù)據(jù)ksdata.sav的K-S檢驗(yàn)我們檢檢驗(yàn)它它是否否是正正態(tài)分分布、、均勻勻分布布和指指數(shù)分分布。。輸出出結(jié)果果分別別顯示示在下下面三三個(gè)表表中::由于sig=.074>.05,,不能能拒絕絕正態(tài)態(tài)分布布(Normal)零假假設(shè)。。由于sig=.000<.05,,拒絕絕均勻勻分布布(Uniform)零零假設(shè)設(shè)由于sig=.664>.05,,不能能拒絕絕指數(shù)數(shù)分布布(Exponential)零零假設(shè)設(shè)比較三三種分分布檢檢驗(yàn),,認(rèn)為為是該該數(shù)據(jù)據(jù)服從從指數(shù)數(shù)分布布SPSS軟軟件使使用說說明使用我我們的的ksdata.sav數(shù)據(jù)。。選項(xiàng)為為Analyze-NonparametricTests-1SampleK-S。然后把把變量量(這這里是是x)選入入VariableList。再在在下面面TestDistribution選中零零假設(shè)設(shè)的分分布((Normal、Poisson、Uniform和Exponential)作為為零假假設(shè)。。在點(diǎn)Exact時(shí)打開開的對對話框框中可可以選選擇精精確方方法((Exact),MonteCarlo抽樣方方法((MonteCarlo)或用用于大大樣本本的漸漸近方方法((Asymptoticonly)。最最后OK即可。。關(guān)于隨隨機(jī)性性的游游程檢檢驗(yàn)((runtest)游程檢檢驗(yàn)方方法是是檢驗(yàn)驗(yàn)一個(gè)個(gè)取兩兩個(gè)值值的變變量的的這兩兩個(gè)值值的出出現(xiàn)是是否是是隨機(jī)機(jī)的。。假定定下面面是由由0和和1組組成的的一個(gè)個(gè)這種種變量量的樣樣本((數(shù)據(jù)據(jù)run1.sav)::0000111111001011100000000其中相相同的的0(或相相同的的1)在一一起稱稱為一一個(gè)游游程((單獨(dú)獨(dú)的0或1也算))。這個(gè)數(shù)數(shù)據(jù)中中有4個(gè)0組成的的游程程和3個(gè)1組成的的游程程。一一共是是R=7個(gè)游程程。其其中0的個(gè)數(shù)數(shù)為m=15,而1的個(gè)數(shù)數(shù)為n=10。關(guān)于隨隨機(jī)性性的游游程檢檢驗(yàn)((runtest)出現(xiàn)0和1的的的這樣樣一個(gè)個(gè)過程程可以以看成成是參參數(shù)為為某未未知p的Bernoulli試試驗(yàn)。。但在在給定定了m和n之后,,在0和1的出出現(xiàn)是是隨機(jī)機(jī)的零零假設(shè)設(shè)之下下,R的條件件分布布就和和這個(gè)個(gè)參數(shù)數(shù)無關(guān)關(guān)了。。根據(jù)據(jù)初等等概率率論,,R的分布布可以以寫成成(令令N=m+n)關(guān)于隨隨機(jī)性性的游游程檢檢驗(yàn)((runtest)于是就就可以以算出出在零零假設(shè)設(shè)下有有關(guān)R的概率率,以以及進(jìn)進(jìn)行有有關(guān)的的檢驗(yàn)驗(yàn)了。。利用用上面面公式式可進(jìn)進(jìn)行精精確檢檢驗(yàn);;也可可以利利用大大樣本本的漸漸近分分布和和利用用MonteCarlo方法進(jìn)進(jìn)行檢檢驗(yàn)。。利用用上面面數(shù)據(jù)據(jù)的結(jié)結(jié)果是是:關(guān)于隨隨機(jī)性性的游游程檢檢驗(yàn)((runtest)當(dāng)然然,,游游程程檢檢驗(yàn)驗(yàn)并并不不僅僅僅僅用用于于只只取取兩兩個(gè)個(gè)值值的的變變量量,,它它還還可可以以用用于于某某個(gè)個(gè)連連續(xù)續(xù)變變量量的的取取值值小小于于某某個(gè)個(gè)值值及及大大于于該該值值的的個(gè)個(gè)數(shù)數(shù)((類類似似于于0和1的個(gè)個(gè)數(shù)數(shù)))是是否否隨隨機(jī)機(jī)的的問問題題。??纯聪孪旅婷胬幼?。。例(run2.sav):從從某某裝裝瓶瓶機(jī)機(jī)出出來來的的30盒盒化化妝妝品品的的重重量量如如下下((單單位位克克))71.671.071.870.370.572.971.071.070.171.871.970.370.969.371.267.367.667.767.668.168.067.569.867.569.770.069.170.471.069.9為了了看看該該裝裝瓶瓶機(jī)機(jī)是是否否工工作作正正常常,,首首先先需需要要驗(yàn)驗(yàn)證證是是否否大大于于和和小小于于中中位位數(shù)數(shù)的的個(gè)個(gè)數(shù)數(shù)是是否否是是隨隨機(jī)機(jī)的的((零零假假設(shè)設(shè)為為這這種種個(gè)個(gè)數(shù)數(shù)的的出出現(xiàn)現(xiàn)是是隨隨機(jī)機(jī)的的))。。關(guān)于于隨隨機(jī)機(jī)性性的的游游程程檢檢驗(yàn)驗(yàn)((runtest)如果果把把小小于于中中位位數(shù)數(shù)的的記記為為0,否否則則記記為為1,上上面面數(shù)數(shù)據(jù)據(jù)變變成成下下面面的的0-1序列列111111110111101000000000000110這就就歸歸為為上上面面的的問問題題。。當(dāng)當(dāng)然然這這里里進(jìn)進(jìn)行行這這種種變變換換只只是是為為了了易易于于理理解解。。實(shí)實(shí)際際計(jì)計(jì)算算時(shí)時(shí),,用用不不著著這這種種變變換換,,計(jì)計(jì)算算機(jī)機(jī)會會自自動動處處理理這這個(gè)個(gè)問問題題的的。。直接利用用這個(gè)數(shù)數(shù)據(jù),通通過SPSS,,得到下下面游程程檢驗(yàn)結(jié)結(jié)果的輸輸出。SPSS軟件使使用說明明用run2.sav數(shù)數(shù)據(jù)。選項(xiàng)為Analyze-NonparametricTests--Runs。然后把變變量(這這里是length))選入VariableList。再在下下面CutPoint選中位數(shù)數(shù)(Median)。。當(dāng)然,,也可以以選其他他值,如如均值((Mean),,眾數(shù)((Mode)或或任何你你愿意的的數(shù)目((放在Custom))。注意意在對前前面的由由0和1組成的的序列((run1.sav進(jìn)進(jìn)行隨機(jī)機(jī)性檢驗(yàn)驗(yàn)時(shí),要選均值值(為什么么?)。。在點(diǎn)Exact時(shí)打開的的對話框框中可以以選擇精精確方法法(Exact),MonteCarlo抽樣樣方法((MonteCarlo))或用于于大樣本本的漸近近方法((Asymptoticonly)。最最后OK即可。。Wilcoxon(Mann-Whitney)秩和和檢驗(yàn)這里介紹紹常用的的Wilcoxon(或稱稱Mann-Whitney)秩和和檢驗(yàn)。。它的原原理很簡簡單,假定第一一個(gè)樣本本有m個(gè)觀測值值,第二二個(gè)有n個(gè)觀測值值。把兩兩個(gè)樣本本混合之之后把這這m+n個(gè)觀測值值升冪排排序,記下每個(gè)個(gè)觀測值值在混合合排序下下面的秩秩。之后后分別把把兩個(gè)樣樣本所得得到的秩秩相加。。記第一一個(gè)樣本本觀測值值的秩的的和為WX而第二個(gè)個(gè)樣本秩秩的和為為WY。這兩個(gè)個(gè)值可以以互相推推算,稱稱為Wilcoxon統(tǒng)計(jì)量量。該統(tǒng)計(jì)量量的分布布和兩個(gè)個(gè)總體分分布無關(guān)關(guān)。由此此分布可可以得到到p-值。直觀上看看,如果果WX與WY之中有一一個(gè)顯著著地大,,則可以以選擇拒拒絕零假假設(shè)。該檢驗(yàn)需需要的唯唯一假定定就是兩兩個(gè)總體體的分布布有類似似的形狀狀(不一一定對稱稱)。Wilcoxon(Mann-Whitney)秩和和檢驗(yàn)下面數(shù)據(jù)據(jù)(GDP.sav))是地區(qū)區(qū)1的十十個(gè)城市市和地區(qū)區(qū)2的15個(gè)城城市的人人均GDP(元元)?,F(xiàn)現(xiàn)在要想想以此作作為兩個(gè)個(gè)樣本來來檢驗(yàn)兩兩個(gè)地區(qū)區(qū)的人均均GDP的中位位數(shù)m1和m2是否一樣樣,即雙雙尾檢驗(yàn)驗(yàn)H0:m1=m2對Ha:m1≠m2。由于地地區(qū)2的的人均GDP的的中位數(shù)數(shù)大于地地區(qū)1的的中位數(shù)數(shù),因此此也可以以做單尾尾檢驗(yàn)H0:m1=m2對Ha:m1<m2。地區(qū)1::32234526 383627815982 321647105628 23034618地區(qū)2::53913983 407659414748 460063254534 552656997008 540366785537 5257由SPSS的輸出可可以得到到下面結(jié)結(jié)果:Wilcoxon(Mann-Whitney)秩和和檢驗(yàn)該結(jié)果頭頭兩行顯示了Mann-Whitney和和Wilcoxon統(tǒng)統(tǒng)計(jì)量的的值。另另外和我我們需要要結(jié)果的的相關(guān)部部分為::對于雙雙尾檢驗(yàn)驗(yàn)H0:m1=m2對Ha:m1≠m2,p-值為0.016(見見“ExactSig.(2-tailed)””);而對于于單尾檢檢驗(yàn)H0:m1=m2對Ha:m1<m2(見“ExactSig.(1-tailed)””),p-值為0.008。這這兩個(gè)結(jié)結(jié)果是精精確計(jì)算算的。通通常在樣樣本量大大的時(shí)候候利用近近似方法法得到漸漸近分布布的p-值(見“Asymp.Sig.(2-tailed)”),它它只給了雙尾尾檢驗(yàn)的近似似p-值0.017,和精確確值差別不大大。注意單尾尾檢驗(yàn)的p-值是雙尾尾檢驗(yàn)的p-值的一半半。這個(gè)例例子的結(jié)果果表明,可可以拒絕原原假設(shè),即即有理由認(rèn)認(rèn)為地區(qū)2的人均GDP的中中位數(shù)要高高一些。SPSS軟軟件使用說說明使用GDP.sav數(shù)據(jù)。選項(xiàng)為Analyze-NonparametricTests-2IndependentSamples。把變量(gdp)選選入TestVariableList;再把用1和2分類類的變量area輸輸入進(jìn)GroupingVariable,,在DefineGroups輸入1和2。在TestType選中Mann-Whitney。在點(diǎn)Exact時(shí)打開的對對話框中可可以選擇精精確方法((Exact),MonteCarlo抽樣樣方法(MonteCarlo)或或用于大樣樣本的漸近近方法(Asymptoticonly)。。最后OK即可兩樣本分布布的Kolmogorov-Smirnov檢驗(yàn)假定有分別別來自兩個(gè)個(gè)獨(dú)立總體體的兩個(gè)樣樣本。要想想檢驗(yàn)它們們背后的總總體分布相相同的零假假設(shè),可以以進(jìn)行兩獨(dú)獨(dú)立樣本的的Kolmogorov-Smirnov檢驗(yàn)。原理理完全和單單樣本情況況一樣。只只不過把檢檢驗(yàn)統(tǒng)計(jì)量量中零假設(shè)設(shè)的分布換換成另一個(gè)個(gè)樣本的經(jīng)經(jīng)驗(yàn)分布即即可。假定定兩個(gè)樣本本的樣本量量分別為n1和n2,用S1(X)和S2(X)分別表示兩兩個(gè)樣本的的累積經(jīng)驗(yàn)驗(yàn)分布函數(shù)數(shù)。再記Dj=S1(Xj)-S2(Xj)。近似正態(tài)態(tài)分布的檢檢驗(yàn)統(tǒng)計(jì)量量為計(jì)算結(jié)果twonp.sav:兩種破壞性性試驗(yàn)的持持續(xù)時(shí)間。。根據(jù)這個(gè)個(gè)數(shù)據(jù),n1=30,n2=25。由SPSS輸出,得到到SPSS軟軟件使用說說明使用twonp.sav數(shù)據(jù)據(jù)。選項(xiàng)為Analyze-NonparametricTests-2IndependentSamples。把變量(duration))選入TestVariableList;再把用1和2分類類的變量type輸輸入到GroupingVariable,在DefineGroups輸入入1和2。。在TestType選中Kolmogorov-SmirnovZ。在點(diǎn)Exact時(shí)打開的對對話框中可可以選擇精精確方法((Exact),MonteCarlo抽樣樣方法(MonteCarlo)或或用于大樣樣本的漸近近方法(Asymptoticonly)。。最后OK即可兩樣本W(wǎng)ald-Wolfowitz游程檢驗(yàn)Wald-Wolfowitz游程檢驗(yàn)((Wald-Wolfowitzrunstest)和Kolmogorov-Smirnov檢驗(yàn)都是看看兩個(gè)樣本本所代表的的總體是否否分布類似似。但是所所采取的方方法不一樣樣。Wald-Wolfowitz游程檢驗(yàn)把把兩個(gè)樣本本混合之后后,按照大大小次序排排列,一個(gè)個(gè)樣本的觀觀測值在一一起的為一一個(gè)游程。。和單樣本本的游程問問題類似。。可以由游游程個(gè)數(shù)R看出兩個(gè)樣樣本在排序序中是否隨隨機(jī)出現(xiàn)。。由twonp.sav數(shù)據(jù),可以以得到下面面SPSS關(guān)于Wald-Wolfowitz游程檢驗(yàn)的的輸出:軟件使用::數(shù)據(jù)和前前面一樣,,只在TestType選Wald-Wolfowitzruns。Kruskal-Wallis關(guān)于多個(gè)樣樣本的秩和和檢驗(yàn)這個(gè)檢驗(yàn)的的目的是看看多個(gè)總體體的位置參參數(shù)是否一一樣。方法和Wilcoxon-Mann-Whitney檢驗(yàn)的思想想類似。假定有k個(gè)總體。先先把從這個(gè)個(gè)k個(gè)總體來的的樣本混合合起來排序序,記各個(gè)個(gè)總體觀測測值的秩之之和為Ri,i=1,…,k。顯然如果果這些Ri很不相同,,就可以認(rèn)認(rèn)為它們位位置參數(shù)相相同的零假假設(shè)不妥((備選假設(shè)設(shè)為各個(gè)位位置參數(shù)不不全相等))。Kruskal-Wallis關(guān)于多個(gè)樣樣本的秩和和檢驗(yàn)注意這里所所說的位置置參數(shù)是在在下面意義義上的qi;由于它在在分布函數(shù)數(shù)Fi(x)中可以和變變元x相加成為F(x+qi)的樣子,所所以稱qi為位置參數(shù)數(shù)。形式上,假假定這些樣樣本有連續(xù)續(xù)分布F1,…,Fk,零假設(shè)為H0:F1=…=Fk,備選假設(shè)為為Ha:Fi(x)=F(x+qi),i=1,…,k,這里F為某連續(xù)分分布函數(shù),,而且這些些參數(shù)qi并不相等。。Kruskal-Wallis檢驗(yàn)統(tǒng)計(jì)量量為Kruskal-Wallis關(guān)于于多多個(gè)個(gè)樣樣本本的的秩秩和和檢檢驗(yàn)驗(yàn)公式式中中ni為第第i個(gè)樣樣本本量量,,而而N為各各個(gè)個(gè)樣樣本本量量之之和和((總總樣樣本本量量))。。如果果觀觀測測值值中中有有大大小小一一樣樣的的數(shù)數(shù)值值,,這這個(gè)個(gè)公公式式會會有有稍稍微微的的變變化化。。這個(gè)個(gè)統(tǒng)統(tǒng)計(jì)計(jì)量量在在位位置置參參數(shù)數(shù)相相同同的的零零假假設(shè)設(shè)下下有有漸漸近近的的自自由由度度為為k-1的c2分布布。。Kruskal-Wallis檢驗(yàn)驗(yàn)僅僅僅僅要要求求各各個(gè)個(gè)總總體體變變量量有有相相似似形形狀狀的的連連續(xù)續(xù)分分布布。。數(shù)據(jù)據(jù)house.sav:三三個(gè)個(gè)區(qū)區(qū)域域房房價(jià)價(jià)的的數(shù)數(shù)據(jù)據(jù)為了了調(diào)調(diào)查查三三個(gè)個(gè)地地區(qū)區(qū)的的房房價(jià)價(jià)是是否否類類似似,,在在每每個(gè)個(gè)地地區(qū)區(qū)抽抽樣樣,,得得到到三三個(gè)個(gè)樣樣本本量量分分別別為為20、30、25的房房價(jià)價(jià)樣樣本本。。利利用用SPSS軟件件,,很很容容易易得得到到下下面面的的檢檢驗(yàn)驗(yàn)結(jié)結(jié)果果::SPSS軟軟件件使使用用說說明明使用用house.sav數(shù)數(shù)據(jù)據(jù)。。選項(xiàng)項(xiàng)為為Analyze--NonparametricTests--KIndependentSamples。把變變量量((這這里里是是price))選選入入TestVariableList;再再把把數(shù)數(shù)據(jù)據(jù)中中用用1、、2、、3來來分分類類的的變變量量group輸輸入入GroupingVariable,,在在DefineGroups輸輸入入1、、2、、3。。在下下面面TestType選中中Kruskal-WallisH。。點(diǎn)Exact時(shí)打打開開的的對對話話框框中中可可以以選選擇擇精精確確方方法法((Exact)),,MonteCarlo抽抽樣樣方方法法((MonteCarlo))或或用用于于大大樣樣本本的的漸漸近近方方法法((Asymptoticonly))。。最最后后OK即即可可Jonckheere-Terpstra多樣樣本本的的秩秩檢檢驗(yàn)驗(yàn)這個(gè)個(gè)檢檢驗(yàn)驗(yàn)處處理理的的問問題題和和Kruskal-Wallis檢檢驗(yàn)驗(yàn)類類似似,,零零假假設(shè)設(shè)都都是是各各個(gè)個(gè)總總體體的的位位置置參參數(shù)數(shù)相相同同,,但但這這里里的的備備選選假假設(shè)設(shè)為為各各個(gè)個(gè)總總體體的的位位置置參參數(shù)數(shù)按按升升冪冪排排列列((如如為為降降冪冪排排列列,,可可把把總總體體編編號號顛顛倒倒順順序序即即為為升升冪冪排排列列))。。注意意這這里里所所說說的的位位置置參參數(shù)數(shù)和和前前面面的的Kruskal-Wallis檢檢驗(yàn)驗(yàn)中中的的位位置置參參數(shù)數(shù)意意義義一一樣樣。。Jonckheere-Terpstra檢檢驗(yàn)驗(yàn)先先在在每每兩兩個(gè)個(gè)樣樣本本所所有有觀觀測測值值對對之之間間比比較較,,計(jì)計(jì)算算第第i個(gè)樣樣本本觀觀測測值值中中小小于于第第j個(gè)樣樣本本觀觀測測值值的的對對子子數(shù)數(shù)::數(shù)據(jù)據(jù)house.sav:三三個(gè)個(gè)區(qū)區(qū)域域房房價(jià)價(jià)的的數(shù)數(shù)據(jù)據(jù)很容容易易得得到到SPSS的Jonckheere-Terpstra檢驗(yàn)驗(yàn)結(jié)結(jié)果果輸輸出出::SPSS軟軟件件使使用用說說明明使用用house.sav數(shù)據(jù)據(jù)。。選項(xiàng)項(xiàng)為為Analyze-NonparametricTests-KIndependentSamples。把變變量量((這這里里是是price)選選入入TestVariableList;再再把把數(shù)數(shù)據(jù)據(jù)中中用用1、2、3來分分類類的的變變量量group輸入入GroupingVariable,在在DefineGroups輸入入1、2、3。在下下面面TestType選中中Jonckheere-Terpstra。在點(diǎn)點(diǎn)Exact時(shí)打打開開的的對對話話框框中中可可以以選選擇擇精精確確方法法((Exact),,MonteCarlo抽樣樣方方法法((MonteCarlo)或或用用于于大大樣樣本本的的漸漸近近方方法法((Asymptoticonly)。。最最后后OK即可可Brown-Mood中位位數(shù)數(shù)檢檢驗(yàn)驗(yàn)在有有數(shù)數(shù)個(gè)個(gè)獨(dú)獨(dú)立立樣樣本本的的情情況況,,希希望望知知道道它它們們的的中中位位數(shù)數(shù)是是否否相相等等。。零假假設(shè)設(shè)是是這些些樣樣本本所所代代表表的的總總體體的的中中位位數(shù)數(shù)相相等等。。備選選假假設(shè)設(shè)是這這些些中中位位數(shù)數(shù)不不全全相相等等。。假定定有有k個(gè)總總體體,,ni為第第i個(gè)樣樣本本量量;;把把所所有有樣樣本本量量之之和和記記為為N。先先把把從從這這個(gè)個(gè)k個(gè)總總體體來來的的樣樣本本混混合合起起來來排排序序,,找找出出它它們們的的中中位位數(shù)數(shù)。。再再計(jì)計(jì)算算每每個(gè)個(gè)總總體體中中小小于于該該中中位位數(shù)數(shù)的的觀觀測測值值個(gè)個(gè)數(shù)數(shù)O1i,i=1,……,k,和和每每個(gè)個(gè)總總體體中中大大于于該該中中位位數(shù)數(shù)的的觀觀測測值值個(gè)個(gè)數(shù)數(shù)O2i,i=1,……,k。這這樣樣就就形形成成了了一一個(gè)個(gè)由由元元素素Oij組成成的的2××k表。。其其列列總總和和為為ni,i=1,……,k;而而兩兩個(gè)個(gè)行行總總和和為為各各樣樣本本小小于于總總中中位位數(shù)數(shù)的的觀觀測測值值總總和和::R1=O11+O12+……+O1k及各各樣樣本本大大于于總總中中位位數(shù)數(shù)的的觀觀測測值值總總和和R2=O21+O22+……+O2k。這這顯顯然然是是一一個(gè)個(gè)列列聯(lián)聯(lián)表表,,可可以以用用Pearsonc2統(tǒng)計(jì)計(jì)量量,,即即house.sav數(shù)據(jù)據(jù)這里里SPSS軟軟件件使使用用說說明明使用用house.sav數(shù)據(jù)據(jù)。。選項(xiàng)項(xiàng)為為Analyze-NonparametricTests-KIndependentSamples。把變變量量((這這里里是是price)選選入入TestVariableList;再再把把數(shù)數(shù)據(jù)據(jù)中中用用1、2、3來分分類類的的變變量量group輸入入GroupingVariable,在在DefineGroups輸入入1、2、3。在下下面面TestType選中中Median。在點(diǎn)點(diǎn)Exact時(shí)打打開開的的對對話話框框中中可可以以選選擇擇精精確確方法法((Exact),,MonteCarlo抽樣樣方方法法((MonteCarlo)或或用用于于大大樣樣本本的的漸漸近近方方法法((Asymptoticonly)。。最最后后OK即可可Friedman秩和和檢檢驗(yàn)驗(yàn)前面面討討論論了了兩兩因因子子試試驗(yàn)驗(yàn)設(shè)設(shè)計(jì)計(jì)數(shù)數(shù)據(jù)據(jù)的的方方差差分分析析,,那那里里所所用用的的F檢驗(yàn)驗(yàn)需需要要假假定定總總體體的的分分布布為為正正態(tài)態(tài)分分布布。。有一一種種非非參參數(shù)數(shù)方方差差分分析析方方法法,,稱稱為為Friedman(兩兩因因子子))秩秩和和檢檢驗(yàn)驗(yàn),,或或Friedman方差差分分析析。。它它適適用用于于兩兩個(gè)個(gè)因因子子的的各各種種水水平平的的組組合合都都有有一一個(gè)個(gè)觀觀測測值值的的情情況況。。Friedman秩和檢檢驗(yàn)假定第第一個(gè)個(gè)因子子有k個(gè)水平平(稱稱為處處理,,treatment),第第二個(gè)個(gè)因子子有b個(gè)水平平(稱稱為區(qū)區(qū)組));因因此一一共有有k×b=kb個(gè)觀測測值。。這里之之所以以稱一一個(gè)因因子為為處理理,是是因?yàn)闉檫@是是我們們想要要看該該因子子各水水平是是否對對試驗(yàn)驗(yàn)結(jié)果果有顯顯著的的不同同(它它的各各個(gè)水水平的的觀測測值也也就是是本小小節(jié)的的多個(gè)個(gè)相關(guān)關(guān)樣本本)。。而另另一個(gè)個(gè)因子子稱為為區(qū)組組,不不同的的區(qū)組組也可可能對對結(jié)果果有影影響。。下面面是一一個(gè)例例子。。數(shù)據(jù)fert.sav這里有有三種種肥料料作為為第一一個(gè)因因子((肥料料因子子)的的三個(gè)個(gè)水平平;而而四種種土壤壤為第第二個(gè)個(gè)因子子(土土壤因因子))的四四個(gè)水水平。。感興興趣于于是否否這三三種肥肥料對對于某某作物物的產(chǎn)產(chǎn)量有有區(qū)別別。稱稱肥料料因子子為處處理,,而土土壤因因子為為區(qū)組組。數(shù)數(shù)據(jù)在在下表表中((表中中數(shù)字字為相相應(yīng)組組合的的產(chǎn)量量,單單位公公斤))。

肥料種類肥料A肥料B肥料C土壤類型土壤1224668土壤2253648土壤3182120土壤4111319Friedman秩和檢檢驗(yàn)Friedman秩和檢檢驗(yàn)是是關(guān)于于位置置的,,和Kruskal-Wallis檢驗(yàn)類類似,,形式式上,,假定定這些些樣本本有連連續(xù)分分布F1,…,Fk,零假假設(shè)為為H0:F1=…=Fk,備選選假設(shè)設(shè)為Ha:Fi(x)=F(x+qi),i=1,…,k,這里里F為某連連續(xù)分分布函函數(shù),,而且且這些些參數(shù)數(shù)qi并不相相等。。雖然這這和以以前的的Kruskal-Wallis檢驗(yàn)一一樣,,但是是由于于區(qū)組組的影影響,要首先先在每每一個(gè)個(gè)區(qū)組組中計(jì)計(jì)算各各個(gè)處處理的的秩;;再把把每一一個(gè)處處理在在各區(qū)區(qū)組中中的秩秩相加加.如果Rij表示在在j個(gè)區(qū)組組中第第i個(gè)處理理的秩秩。則則秩按按照處處理而而求得得的和和為Friedman秩和檢檢驗(yàn)這樣做做的目目的是是在每每個(gè)區(qū)區(qū)組內(nèi)內(nèi)比較較處理理。例例如,同同個(gè)年年齡段段中比比較藥藥品的的療效效比不不分年年齡來來比較較療效效要合合理;;在同同一個(gè)個(gè)部位位比較較不同同的材材料要要比混混合起起來比比較要要合理理等等等。這這里要要引進(jìn)進(jìn)的Friedman統(tǒng)統(tǒng)計(jì)量量定義義為第一個(gè)個(gè)式子子表明明,如如果各各個(gè)處處理很很不一一樣,,和的的平方方就會會很大大,結(jié)結(jié)果就就顯著著。第第二個(gè)個(gè)公式式是為為了計(jì)計(jì)算方方便而而導(dǎo)出出的。。它有有近似似的((有k-1個(gè)自由由度的的)c2分布。。fert.sav數(shù)據(jù)SPSS軟軟件使使用說說明使用fert.sav數(shù)數(shù)據(jù)。。選項(xiàng)為為Analyze-NonparametricTests-KRelatedSamples。然后把把變量量(這這里是是a、、b、、c))選入入TestVariableList。在下面面TestType選中Friedman。在點(diǎn)Exact時(shí)打開開的對對話框框中可可以選選擇精精確方方法((Exact)),MonteCarlo抽樣樣方法法(MonteCarlo)或或用于于大樣樣本的的漸近近方法法(Asymptoticonly)。。最后后OK即可可Kendall協(xié)同系系數(shù)檢檢驗(yàn)在實(shí)踐踐中,,常需需要按按照某某些特特別的的性質(zhì)質(zhì)來多多次對對一些些個(gè)體體進(jìn)行行評估估或排排序;;比如如幾個(gè)個(gè)(m個(gè))評評估機(jī)機(jī)構(gòu)對對一些些(n個(gè))學(xué)學(xué)校進(jìn)進(jìn)行排排序。。人們們想要要知道道,這這些機(jī)機(jī)構(gòu)的的不同同結(jié)果果是否否一致致。如如果很很不一一致,,則該該評估估多少少有些些隨機(jī)機(jī),意意義不不大。。換句話說說,這里里想要檢檢驗(yàn)的零假設(shè)是:這些些對于不不同學(xué)校校的排序序是不相相關(guān)的或或者是隨隨機(jī)的;;而備選假設(shè)設(shè)為:這些些對不同同學(xué)校的的排序是是正相關(guān)關(guān)的或者者是多少少一致的的。Kendall協(xié)同系數(shù)數(shù)檢驗(yàn)一個(gè)機(jī)構(gòu)構(gòu)對諸個(gè)個(gè)體(學(xué)學(xué)校)的的秩(次次序)的的和為1+2+…+n=n(n+1)/2;所有m個(gè)機(jī)構(gòu)對對所有個(gè)個(gè)體評估估的總秩秩為mn(n+1)/2;這樣對對每個(gè)個(gè)個(gè)體的平平均秩為為m(n+1)/2。如果記記每一個(gè)個(gè)個(gè)體的的m個(gè)秩(次次序)的的和為Ri(i=1,…,n),那么么,如果果評估是是隨機(jī)的的,這些些Ri與平均秩秩的差別別不會很很大,反反之差別別會很大大,也就就是說下下面的個(gè)體的總總秩與平平均秩的的偏差的的平方和和S很大大。S定定義為Kendall協(xié)同系數(shù)數(shù)檢驗(yàn)這個(gè)和Kendall協(xié)同系數(shù)數(shù)(Kendall’sCoefficientofConcordance)是成比比例的,,Kendall協(xié)同系數(shù)數(shù)W(Kendall’sW)定義為為數(shù)據(jù)school.sav下面是4個(gè)獨(dú)立的的環(huán)境研研究單位位對15個(gè)學(xué)校排排序的結(jié)結(jié)果每一一行為一一個(gè)評估估機(jī)構(gòu)對對這些學(xué)學(xué)校的排排序??纯瓷先ゲ徊荒敲匆灰恢拢ㄒ惨灿型耆恢碌牡模簲?shù)據(jù)school.savSPSS的Kendall協(xié)協(xié)同系數(shù)數(shù)檢驗(yàn)的的輸出SPSS軟件使使用說明明使用school.sav數(shù)據(jù)。選項(xiàng)為Analyze-NonparametricTests--KRelatedSamples。。然后把變變量(這這里是s1、s2、……、s15)選入TestVariableList。在下面TestType選中Kendall’sW。在點(diǎn)Exact時(shí)打開的的對話框框中可以以選擇精精確方法法(Exact),MonteCarlo抽樣樣方法((MonteCarlo))或用于于大樣本本的漸近近方法((Asymptoticonly)。最最后OK即可關(guān)于二元元響應(yīng)的的Cochran檢驗(yàn)驗(yàn)前面討論論了兩因因子方差差分析問問題的Friedman秩和和檢驗(yàn)。。但是當(dāng)觀觀測值只只取諸如如0或1兩個(gè)可可能值時(shí)時(shí),由于于有太多多同樣的的數(shù)目((只有0和1)),排序序的意義義就很成成問題了了。這里要引引進(jìn)的Cochran檢驗(yàn)就就是用來來解決這這個(gè)問題題的一個(gè)個(gè)非參數(shù)數(shù)檢驗(yàn)。。這里的的零假設(shè)設(shè)也是各各個(gè)處理理是相同同的。先先看一個(gè)個(gè)例子關(guān)于瓶裝裝飲用水水的調(diào)查查(數(shù)據(jù)據(jù)在water.sav)。。20名名顧客對對4種瓶瓶裝飲用用水進(jìn)行行了認(rèn)可可(記為為1)和和不認(rèn)可可(記為為0)的的表態(tài)。。我們感興興趣的是是這幾種種瓶裝水水在顧客客眼中是是否有區(qū)區(qū)別。這這里的零零假設(shè)是是這些瓶瓶裝水((作為處處理)在在(作為為區(qū)組的的)顧客客眼中沒沒有區(qū)別別。數(shù)據(jù)water.sav下表是數(shù)數(shù)據(jù),每每一行為為20個(gè)個(gè)顧客對對某一飲飲料的20個(gè)觀觀點(diǎn)(0或1))。最后后一列1為認(rèn)可可總數(shù)Ni而最后一一行為每每個(gè)顧客客給出的的4個(gè)觀觀點(diǎn)中認(rèn)認(rèn)可數(shù)的的總和Li。最后一一行的最最后的元元素為總總認(rèn)可數(shù)數(shù)N。顯然,如如果Ni和這些Ni的均值的的差距很很大,那那么這些些處理就就很不一一樣了。。Cochran檢驗(yàn)驗(yàn)就是基基于這個(gè)個(gè)思想的的。用Ni表示第i個(gè)處理所所得到的的“1””的個(gè)數(shù)數(shù),而Lj為第j個(gè)區(qū)組((例子中中的顧客客)所給給的“1”的個(gè)個(gè)數(shù),““1”的的總數(shù)記記為N。關(guān)于二元元響應(yīng)的的Cochran檢驗(yàn)驗(yàn)Cochran檢驗(yàn)統(tǒng)統(tǒng)計(jì)量((Cochran’sQ))為(假假定有k個(gè)處理和和b個(gè)區(qū)組))當(dāng)k固定時(shí),,Q在b很大時(shí)有有近似的的自由度度為k-1的c2分布。數(shù)據(jù)water.savCochran檢驗(yàn)的的SPSS輸出出:SPSS軟件使使用說明明使用water.sav數(shù)據(jù)。選項(xiàng)為Analyze-NonparametricTests--KRelatedSamples。。然后把變變量(這這里是c1、s2、c3、c4)選入TestVariableList。在下面TestType選中Cochran’sQ。在點(diǎn)Exact時(shí)打開的的對話框框中可以以選擇精精確方法法(Exact),MonteCarlo抽樣樣方法((MonteCarlo))或用于于大樣本本的漸近近方法((Asymptoticonly)。最最后OK即可9、靜靜夜夜四四無

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論