MBA統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)_第1頁(yè)
MBA統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)_第2頁(yè)
MBA統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)_第3頁(yè)
MBA統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)_第4頁(yè)
MBA統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩86頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)學(xué)從數(shù)據(jù)到結(jié)論第十六章 非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn) 16.1 關(guān)于非參數(shù)的一些常識(shí)關(guān)于非參數(shù)的一些常識(shí)l經(jīng)典統(tǒng)計(jì)的多數(shù)檢驗(yàn)都假定了總經(jīng)典統(tǒng)計(jì)的多數(shù)檢驗(yàn)都假定了總體的背景分布。體的背景分布。l但在總體未知時(shí),如果假定的總但在總體未知時(shí),如果假定的總體和真實(shí)總體不符,那么就不適體和真實(shí)總體不符,那么就不適宜用通常的檢驗(yàn)宜用通常的檢驗(yàn)l這時(shí)如果利用傳統(tǒng)的假定分布已這時(shí)如果利用傳統(tǒng)的假定分布已知的檢驗(yàn),就會(huì)產(chǎn)生錯(cuò)誤甚至災(zāi)知的檢驗(yàn),就會(huì)產(chǎn)生錯(cuò)誤甚至災(zāi)難。難。l無(wú)需假定總體分布的具體形式,無(wú)需假定總體分布的具體形式,僅僅依賴于數(shù)據(jù)觀測(cè)值的相對(duì)大僅僅依賴于數(shù)據(jù)觀測(cè)值的相對(duì)大小小(秩秩)或零假設(shè)下等可能的概率或

2、零假設(shè)下等可能的概率等和數(shù)據(jù)本身的具體總體分布無(wú)等和數(shù)據(jù)本身的具體總體分布無(wú)關(guān)的性質(zhì)進(jìn)行的檢驗(yàn)都稱為關(guān)的性質(zhì)進(jìn)行的檢驗(yàn)都稱為非參非參數(shù)檢驗(yàn)數(shù)檢驗(yàn)(nonparametric testing)。16.1 關(guān)于非參數(shù)的一些常識(shí)關(guān)于非參數(shù)的一些常識(shí)l這些非參數(shù)檢驗(yàn)在總體分布未知時(shí)有很這些非參數(shù)檢驗(yàn)在總體分布未知時(shí)有很大的優(yōu)越性。它總是比傳統(tǒng)檢驗(yàn)安全。大的優(yōu)越性。它總是比傳統(tǒng)檢驗(yàn)安全。l在總體分布形式已知時(shí),非參數(shù)檢驗(yàn)不在總體分布形式已知時(shí),非參數(shù)檢驗(yàn)不如傳統(tǒng)方法效率高。這是因?yàn)榉菂?shù)方如傳統(tǒng)方法效率高。這是因?yàn)榉菂?shù)方法利用的信息要少些。往往在傳統(tǒng)方法法利用的信息要少些。往往在傳統(tǒng)方法可以拒絕零假設(shè)

3、的情況,非參數(shù)檢驗(yàn)無(wú)可以拒絕零假設(shè)的情況,非參數(shù)檢驗(yàn)無(wú)法拒絕。法拒絕。l但非參數(shù)統(tǒng)計(jì)在總體未知時(shí)效率要比傳但非參數(shù)統(tǒng)計(jì)在總體未知時(shí)效率要比傳統(tǒng)方法要高,有時(shí)要高很多。是否用非統(tǒng)方法要高,有時(shí)要高很多。是否用非參數(shù)統(tǒng)計(jì)方法,要根據(jù)對(duì)總體分布的了參數(shù)統(tǒng)計(jì)方法,要根據(jù)對(duì)總體分布的了解程度來(lái)確定。解程度來(lái)確定。 l這里介紹一些非參數(shù)檢驗(yàn)。這里介紹一些非參數(shù)檢驗(yàn)。l關(guān)于非參數(shù)方法的確切定義并不關(guān)于非參數(shù)方法的確切定義并不很明確。我們就其最廣泛的意義很明確。我們就其最廣泛的意義來(lái)理解。來(lái)理解。l在計(jì)算中,諸如列聯(lián)表分析中的在計(jì)算中,諸如列聯(lián)表分析中的許多問(wèn)題都有精確方法,許多問(wèn)題都有精確方法,monte

4、carlo抽樣方法和用于大樣本的抽樣方法和用于大樣本的漸近方法等選擇。精確方法比較漸近方法等選擇。精確方法比較費(fèi)時(shí)間,后兩種要粗糙一些,但費(fèi)時(shí)間,后兩種要粗糙一些,但要快些。要快些。 秩(秩(rank) l非參數(shù)檢驗(yàn)中秩是最常使用的概非參數(shù)檢驗(yàn)中秩是最常使用的概念。什么是一個(gè)數(shù)據(jù)的秩呢?一念。什么是一個(gè)數(shù)據(jù)的秩呢?一般來(lái)說(shuō),秩就是該數(shù)據(jù)按照升冪般來(lái)說(shuō),秩就是該數(shù)據(jù)按照升冪排列之后,每個(gè)觀測(cè)值的位置。排列之后,每個(gè)觀測(cè)值的位置。例如我們有下面數(shù)據(jù)例如我們有下面數(shù)據(jù)xi159183178513719ri75918426310這下面一行(記為這下面一行(記為ri)就是上面一)就是上面一行數(shù)據(jù)行數(shù)據(jù)x

5、i的秩。的秩。 秩(秩(rank) l利用秩的大小進(jìn)行推斷就避免利用秩的大小進(jìn)行推斷就避免了不知道背景分布的困難。這了不知道背景分布的困難。這也是非參數(shù)檢驗(yàn)的優(yōu)點(diǎn)。也是非參數(shù)檢驗(yàn)的優(yōu)點(diǎn)。l多數(shù)非參數(shù)檢驗(yàn)明顯地或隱含多數(shù)非參數(shù)檢驗(yàn)明顯地或隱含地利用了秩的性質(zhì);但也有一地利用了秩的性質(zhì);但也有一些非參數(shù)方法沒(méi)有涉及秩的性些非參數(shù)方法沒(méi)有涉及秩的性質(zhì)。質(zhì)。 16.2 單樣本檢驗(yàn)單樣本檢驗(yàn)16.2.1單樣本中位數(shù)單樣本中位數(shù)(a a-分位數(shù)分位數(shù))符號(hào)檢驗(yàn)符號(hào)檢驗(yàn)l我們知道某點(diǎn)為中位數(shù)我們知道某點(diǎn)為中位數(shù)(a a-分位數(shù)分位數(shù))意味著一個(gè)數(shù)小于該點(diǎn)的概率應(yīng)該意味著一個(gè)數(shù)小于該點(diǎn)的概率應(yīng)該為為0.5(a

6、 a).l因此,一個(gè)觀測(cè)值小于該點(diǎn)(或與因此,一個(gè)觀測(cè)值小于該點(diǎn)(或與該點(diǎn)之差的該點(diǎn)之差的符號(hào)符號(hào)為負(fù)號(hào))的概率為為負(fù)號(hào))的概率為0.5(a a)。l這就是符號(hào)檢驗(yàn)名稱的來(lái)源,并與這就是符號(hào)檢驗(yàn)名稱的來(lái)源,并與二項(xiàng)分布有關(guān)。二項(xiàng)分布有關(guān)。例:數(shù)據(jù)例:數(shù)據(jù)gs.txtl例例16.1 質(zhì)量監(jiān)督部門對(duì)商店里面出售的某廠質(zhì)量監(jiān)督部門對(duì)商店里面出售的某廠家的西洋參片進(jìn)行了抽查。對(duì)于家的西洋參片進(jìn)行了抽查。對(duì)于25包寫明為包寫明為凈重凈重100g的西洋參片的稱重結(jié)果為(單位:的西洋參片的稱重結(jié)果為(單位:克):克):99.05 100.25 102.56 99.15 104.89 101.86 96.37

7、 96.79 99.3796.90 93.94 92.97 108.28 96.86 93.94 98.27 98.36100.81 92.99 103.72 90.66 98.24 97.87 99.21 101.79數(shù)據(jù)數(shù)據(jù)gs.txtl樣本中位數(shù)為樣本中位數(shù)為m=98.36。因此,。因此,人們懷疑廠家包裝的西洋參片份人們懷疑廠家包裝的西洋參片份量不足。由于對(duì)于這些重量的總量不足。由于對(duì)于這些重量的總體分布不清楚,決定對(duì)其進(jìn)行符體分布不清楚,決定對(duì)其進(jìn)行符號(hào)檢驗(yàn)。需要檢驗(yàn)的是:號(hào)檢驗(yàn)。需要檢驗(yàn)的是:01:100:100hmhm數(shù)據(jù)數(shù)據(jù)gs.txtl按照零假設(shè),每個(gè)觀測(cè)值(每包西按照零假設(shè),

8、每個(gè)觀測(cè)值(每包西洋參的凈重)大于中位數(shù)洋參的凈重)大于中位數(shù)m0=100g的機(jī)會(huì)和小于的機(jī)會(huì)和小于100g的概率都是的概率都是0.5。這服從二項(xiàng)分布這服從二項(xiàng)分布bin(25,0.5)。l重于重于100g的只有的只有8包。這樣的二項(xiàng)分包。這樣的二項(xiàng)分布變量小于或等于布變量小于或等于8的概率為的概率為0.05388。這就是。這就是p-值。值。l因此因此, 對(duì)于水平對(duì)于水平a a=0.05, 根據(jù)這個(gè)符根據(jù)這個(gè)符號(hào)檢驗(yàn),沒(méi)有充分的證據(jù)拒絕零假號(hào)檢驗(yàn),沒(méi)有充分的證據(jù)拒絕零假設(shè)。設(shè)。數(shù)據(jù)數(shù)據(jù)gs.txtbinomial test 1008.32251.00group 1group 2totalgsw

9、eightcategorynobservedprop.test prop.exact sig.(2-tailed)pointprobabilityspss輸出的結(jié)果在下面表格中。從輸出的結(jié)果在下面表格中。從該表格可以看出精確的雙邊檢驗(yàn)的該表格可以看出精確的雙邊檢驗(yàn)的p-值值=0.108(精確地為(精確地為0.1078);也);也就是說(shuō),我們的單尾檢驗(yàn)的就是說(shuō),我們的單尾檢驗(yàn)的p-值為值為其一半。其一半。數(shù)據(jù)數(shù)據(jù)gs.txt另一種輸出來(lái)自于另一種輸出來(lái)自于spss的另一種選的另一種選項(xiàng):項(xiàng):test statisticsb.108a.054.032exact sig. (2-tailed)exa

10、ct sig. (1-tailed)point probabilitym - gsweightbinomial distribution used.a. sign testb. spss軟件使用軟件使用 l這里有兩種選項(xiàng)方式:1.以數(shù)據(jù)gs.sav為例。直接使用spss選項(xiàng)analyzenonparametric testsbinomial,再把變量gsweight選入test variable list,然后在下面define dichotomy的cut point輸入100(克),在下面test proportion輸入p0=0.50(零假設(shè)大于100小時(shí)的比例);還可以點(diǎn)擊exact來(lái)選

11、擇精確檢驗(yàn),漸近檢驗(yàn)和monte carlo方法等,然后ok即可得到前面顯示的結(jié)果。spss軟件使用軟件使用 2. 數(shù)據(jù)gs.sav有一列(變量名為m),這是重復(fù)零假設(shè)的100g使得m的長(zhǎng)度和gsweight一樣。然后利用選項(xiàng)analyzenonparametric testsrelated samples,再把變量gsweight和m同時(shí)選入test pair(s) list之中,再在下面選sign及在exact中選exact;然后回到主對(duì)話框,ok即可。得出前面的第二個(gè)輸出。16.2 單樣本檢驗(yàn)單樣本檢驗(yàn)16.2.2單樣本位置參數(shù)的單樣本位置參數(shù)的wilcoxon符號(hào)秩檢驗(yàn)符號(hào)秩檢驗(yàn) l符

12、號(hào)檢驗(yàn)只用了差的符號(hào),但沒(méi)符號(hào)檢驗(yàn)只用了差的符號(hào),但沒(méi)有利用差值的大小。有利用差值的大小。lw i l c o x o n 符 號(hào) 秩 檢 驗(yàn)符 號(hào) 秩 檢 驗(yàn)(wilcoxon signed-rank test) 把差的絕對(duì)值的秩分別按照不同把差的絕對(duì)值的秩分別按照不同的符號(hào)相加作為其檢驗(yàn)統(tǒng)計(jì)量。的符號(hào)相加作為其檢驗(yàn)統(tǒng)計(jì)量。l它利用了更多的信息。它利用了更多的信息。 16.2 單樣本檢驗(yàn)單樣本檢驗(yàn)16.2.2單樣本位置參數(shù)的單樣本位置參數(shù)的wilcoxon符號(hào)秩檢驗(yàn)符號(hào)秩檢驗(yàn) lwilcoxon符號(hào)秩檢驗(yàn)需要一點(diǎn)總體符號(hào)秩檢驗(yàn)需要一點(diǎn)總體分布的性質(zhì);它要求假定樣本點(diǎn)來(lái)分布的性質(zhì);它要求假定樣

13、本點(diǎn)來(lái)自連續(xù)對(duì)稱總體分布;而符號(hào)檢驗(yàn)自連續(xù)對(duì)稱總體分布;而符號(hào)檢驗(yàn)不需要知道任何總體分布的性質(zhì)。不需要知道任何總體分布的性質(zhì)。l在對(duì)稱分布中,總體中位數(shù)和總體在對(duì)稱分布中,總體中位數(shù)和總體均值是相等的;因此,對(duì)于總體中均值是相等的;因此,對(duì)于總體中位數(shù)的檢驗(yàn),等價(jià)于對(duì)于總體均值位數(shù)的檢驗(yàn),等價(jià)于對(duì)于總體均值的檢驗(yàn)。的檢驗(yàn)。 l假定假定x1,x2, xn為來(lái)自連續(xù)對(duì)稱總體。為來(lái)自連續(xù)對(duì)稱總體。如果零檢驗(yàn)為中位數(shù)(均值)如果零檢驗(yàn)為中位數(shù)(均值)m = m0。l把滿足把滿足xi-m00的的|xi-m0|的秩求和,并用的秩求和,并用w+表示。如果表示。如果m0的確的確是中位數(shù),那么,是中位數(shù),那么,

14、w-和和w-應(yīng)大體差不多。應(yīng)大體差不多。l如果如果w-或者或者w+過(guò)大或過(guò)小,則應(yīng)該懷過(guò)大或過(guò)小,則應(yīng)該懷疑中位數(shù)疑中位數(shù)m = m0的零假設(shè)。的零假設(shè)。l令令w=min(w-,w+),則當(dāng),則當(dāng)w太小時(shí),應(yīng)太小時(shí),應(yīng)該拒絕零假設(shè)。這個(gè)該拒絕零假設(shè)。這個(gè)w就是就是wilcoxon符符號(hào)秩檢驗(yàn)統(tǒng)計(jì)量。號(hào)秩檢驗(yàn)統(tǒng)計(jì)量。例:數(shù)據(jù)例:數(shù)據(jù)gs.txtl例例16.1 質(zhì)量監(jiān)督部門對(duì)商店里面出售的某廠質(zhì)量監(jiān)督部門對(duì)商店里面出售的某廠家的西洋參片進(jìn)行了抽查。對(duì)于家的西洋參片進(jìn)行了抽查。對(duì)于25包寫明為包寫明為凈重凈重100g的西洋參片的稱重結(jié)果為(單位:的西洋參片的稱重結(jié)果為(單位:克):克):99.05

15、100.25 102.56 99.15 104.89 101.86 96.37 96.79 99.3796.90 93.94 92.97 108.28 96.86 93.94 98.27 98.36100.81 92.99 103.72 90.66 98.24 97.87 99.21 101.7901:100:100hmhm例例16.1:數(shù)據(jù):數(shù)據(jù)gs.txt(繼續(xù))(繼續(xù))l利用利用spss,很容易得到該數(shù)據(jù)的,很容易得到該數(shù)據(jù)的wilcoxon符號(hào)秩檢驗(yàn)結(jié)果符號(hào)秩檢驗(yàn)結(jié)果 (wilcoxon符號(hào)秩檢驗(yàn)精確符號(hào)秩檢驗(yàn)精確(單尾)的(單尾)的p-值為值為0.047 ):test statist

16、icsb-1.682a.093.095.047.002zasymp. sig. (2-tailed)exact sig. (2-tailed)exact sig. (1-tailed)point probabilitym - gsweightbased on negative ranks.a. wilcoxon signed ranks testb. 軟件使用說(shuō)明軟件使用說(shuō)明 l利用例16.1數(shù)據(jù)(gs.txt或gs.sav)。該數(shù)據(jù)有一列(變量名為m),這是重復(fù)零假設(shè)的100g使得m的長(zhǎng)度和gsweight一樣。然后利用選項(xiàng)analyzenonparametric testsrelated

17、samples,再把變量gsweight和m同時(shí)選入test pair(s) list之中,再在下面選wilcoxon及在exact中選exact;再回到主對(duì)話框,ok即可。 16.2.3 16.2.3 單樣本單樣本kolmogorov-smirnov檢驗(yàn)檢驗(yàn) l單樣本的單樣本的kolmogorov-smirnov檢驗(yàn)(檢驗(yàn)(k-s檢驗(yàn))是用來(lái)檢驗(yàn)一個(gè)數(shù)據(jù)的觀測(cè)累積分布檢驗(yàn))是用來(lái)檢驗(yàn)一個(gè)數(shù)據(jù)的觀測(cè)累積分布是否是已知的理論分布。是否是已知的理論分布。l這些作為零假設(shè)的理論分布在這些作為零假設(shè)的理論分布在spss的選項(xiàng)中的選項(xiàng)中有正態(tài)分布,有正態(tài)分布,poisson分布,均勻分布和指數(shù)分布,均勻

18、分布和指數(shù)分布。在分布。在spss軟件中對(duì)于是否是正態(tài)分布或軟件中對(duì)于是否是正態(tài)分布或均勻分布的檢驗(yàn)統(tǒng)計(jì)量為均勻分布的檢驗(yàn)統(tǒng)計(jì)量為100max()() ,()()iiiiizns xf xs xf x數(shù)據(jù)數(shù)據(jù)ksdata.sav的的k-s檢驗(yàn)檢驗(yàn) l我們檢驗(yàn)它是否是我們檢驗(yàn)它是否是正態(tài)分布、均勻分布和指正態(tài)分布、均勻分布和指數(shù)分布數(shù)分布。輸出結(jié)果分別顯示在下面三個(gè)表中:。輸出結(jié)果分別顯示在下面三個(gè)表中:one-sample kolmogorov-smirnov test501.00211.07647.182.173-.1821.284.074nmeanstd. deviationnormal

19、parametersa,babsolutepositivenegativemost extremedifferenceskolmogorov-smirnov zasymp. sig. (2-tailed)xtest distribution is normal.a. calculated from data.b. 單邊檢驗(yàn)的單邊檢驗(yàn)的p-值等于值等于0.074/2=0.037(漸(漸近檢驗(yàn))和近檢驗(yàn))和0.069/2=0.0345(精確檢(精確檢驗(yàn))。如果按照顯著性水平為驗(yàn))。如果按照顯著性水平為0.05的標(biāo)的標(biāo)準(zhǔn),可以拒絕產(chǎn)生數(shù)據(jù)的總體為正態(tài)分準(zhǔn),可以拒絕產(chǎn)生數(shù)據(jù)的總體為正態(tài)分布的零假設(shè)。布

20、的零假設(shè)。 one-sample kolmogorov-smirnov test 250.024.12.450.450-.0203.182.000nminimummaximumuniform parametersa,babsolutepositivenegativemost extremedifferenceskolmogorov-smirnov zasymp. sig. (2-tailed)xtest distribution is uniform.a. calculated from data.b. p-值等于值等于0.000(漸近檢驗(yàn))和(漸近檢驗(yàn))和0.000(精確檢驗(yàn))。如果按照顯著

21、性水(精確檢驗(yàn))。如果按照顯著性水平為平為0.05的標(biāo)準(zhǔn),可以拒絕產(chǎn)生數(shù)的標(biāo)準(zhǔn),可以拒絕產(chǎn)生數(shù)據(jù)的總體為均勻分布的零假設(shè)。據(jù)的總體為均勻分布的零假設(shè)。 one-sample kolmogorov-smirnov test 3501.0021.103.103-.052.728.664nmeanexponential parameter.a,babsolutepositivenegativemost extremedifferenceskolmogorov-smirnov zasymp. sig. (2-tailed)xtest distribution is exponential.a. cal

22、culated from data.b. p-值等于值等于0.664/2=0.332(漸近檢驗(yàn))(漸近檢驗(yàn))和和0.662/2=0.331(精確檢驗(yàn))。如(精確檢驗(yàn))。如果按照顯著性水平為果按照顯著性水平為0.05的標(biāo)準(zhǔn),的標(biāo)準(zhǔn),不能拒絕產(chǎn)生數(shù)據(jù)的總體為指數(shù)分不能拒絕產(chǎn)生數(shù)據(jù)的總體為指數(shù)分布的零假設(shè)。布的零假設(shè)。 警告警告l經(jīng)常有人在經(jīng)常有人在kolmogorov-smirnov檢驗(yàn)中,當(dāng)檢驗(yàn)不能拒絕總體分布檢驗(yàn)中,當(dāng)檢驗(yàn)不能拒絕總體分布為某分布時(shí),來(lái)為某分布時(shí),來(lái)“接受接受”或或“證明證明”該樣本來(lái)自該分布。這是錯(cuò)誤的。該樣本來(lái)自該分布。這是錯(cuò)誤的。l比如我們有由比如我們有由1、2、3、4、

23、5五個(gè)五個(gè)數(shù)目組成的數(shù)據(jù),我們分別檢驗(yàn)該數(shù)目組成的數(shù)據(jù),我們分別檢驗(yàn)該數(shù)據(jù)是否是正態(tài)分布、均勻分布、數(shù)據(jù)是否是正態(tài)分布、均勻分布、poisson分布或指數(shù)分布。結(jié)果歸分布或指數(shù)分布。結(jié)果歸納為下表(讀者可以自己練習(xí)去算)納為下表(讀者可以自己練習(xí)去算)kolmogorov-smirnov單樣本分布檢驗(yàn)單樣本分布檢驗(yàn)零假設(shè)的分布零假設(shè)的分布 (漸近雙邊檢驗(yàn)的)(漸近雙邊檢驗(yàn)的)p-值值正態(tài)分布正態(tài)分布1.000均勻分布均勻分布0.988poisson分布分布1.000指數(shù)分布指數(shù)分布0.806根據(jù)此表,沒(méi)有足夠證據(jù)來(lái)拒絕任何根據(jù)此表,沒(méi)有足夠證據(jù)來(lái)拒絕任何一個(gè)零假設(shè)。難道我們可以隨意一個(gè)零假設(shè)。

24、難道我們可以隨意“接接受受”該總體為其中任一個(gè)分布嗎?該總體為其中任一個(gè)分布嗎? spssspss軟件使用說(shuō)明軟件使用說(shuō)明 l使用我們的使用我們的ksdata.sav數(shù)據(jù)。數(shù)據(jù)。l選項(xiàng)為選項(xiàng)為analyzenonparametric tests1 sample k-s。l然后把變量(這里是然后把變量(這里是x)選入)選入variable list。再在下面再在下面test distribution選中零假設(shè)的分布選中零假設(shè)的分布( n o r m a l 、 p o i s s o n 、 u n i f o r m 和和exponential)作為零假設(shè)。)作為零假設(shè)。l在點(diǎn)在點(diǎn)exact時(shí)

25、打開(kāi)的對(duì)話框中可以選擇精確方時(shí)打開(kāi)的對(duì)話框中可以選擇精確方法(法(exact),),monte carlo抽樣方法抽樣方法(monte carlo)或用于大樣本的漸近方法)或用于大樣本的漸近方法(asymptotic only)。最后)。最后ok即可。即可。 16.2.4 16.2.4 關(guān)于隨機(jī)性的游程檢驗(yàn)關(guān)于隨機(jī)性的游程檢驗(yàn)(run test)l游程檢驗(yàn)方法是檢驗(yàn)一個(gè)取兩個(gè)值的變量游程檢驗(yàn)方法是檢驗(yàn)一個(gè)取兩個(gè)值的變量的這兩個(gè)值的出現(xiàn)是否是隨機(jī)的。假定下的這兩個(gè)值的出現(xiàn)是否是隨機(jī)的。假定下面是由面是由0和和1組成的一個(gè)這種變量的樣本組成的一個(gè)這種變量的樣本(數(shù)據(jù)(數(shù)據(jù)run1.sav):):l

26、0 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0l其中相同的其中相同的0(或相同的(或相同的1)在一起稱為一)在一起稱為一個(gè)游程(單獨(dú)的個(gè)游程(單獨(dú)的0或或1也算)。也算)。l這個(gè)數(shù)據(jù)中有這個(gè)數(shù)據(jù)中有4個(gè)個(gè)0組成的游程和組成的游程和3個(gè)個(gè)1組成組成的游程。一共是的游程。一共是r=7個(gè)游程。其中個(gè)游程。其中0的個(gè)數(shù)的個(gè)數(shù)為為m=15,而,而1的個(gè)數(shù)為的個(gè)數(shù)為n=10。 關(guān)于隨機(jī)性的游程檢驗(yàn)(關(guān)于隨機(jī)性的游程檢驗(yàn)(run testrun test) l出現(xiàn)出現(xiàn)0和和1的的這樣一個(gè)過(guò)程可以看成是參的的這樣一個(gè)過(guò)程可以看成是參數(shù)為某未知數(shù)為某未知p的的

27、bernoulli試驗(yàn)。但在給定試驗(yàn)。但在給定了了m和和n之后,在之后,在0和和1的出現(xiàn)是隨機(jī)的零假的出現(xiàn)是隨機(jī)的零假設(shè)之下,設(shè)之下,r的條件分布就和這個(gè)參數(shù)無(wú)關(guān)了。的條件分布就和這個(gè)參數(shù)無(wú)關(guān)了。根據(jù)初等概率論,根據(jù)初等概率論,r的分布可以寫成(令的分布可以寫成(令n=m+n)11211(2 ),11112211(21)mnkkp rknnmnmnkkkkp rknn關(guān)于隨機(jī)性的游程檢驗(yàn)(關(guān)于隨機(jī)性的游程檢驗(yàn)(run testrun test) l于是就可以算出在零假設(shè)下有關(guān)于是就可以算出在零假設(shè)下有關(guān)r的概率,的概率,以及進(jìn)行有關(guān)的檢驗(yàn)了。利用上面公式可以及進(jìn)行有關(guān)的檢驗(yàn)了。利用上面公式可進(jìn)

28、行精確檢驗(yàn);也可以利用大樣本的漸近進(jìn)行精確檢驗(yàn);也可以利用大樣本的漸近分布和利用分布和利用monte carlo方法進(jìn)行檢驗(yàn)。利方法進(jìn)行檢驗(yàn)。利用上面數(shù)據(jù)的結(jié)果是用上面數(shù)據(jù)的結(jié)果是 runs test.5000257-2.345.019.017.006test valueatotal casesnumber of runszasymp. sig. (2-tailed)exact sig. (2-tailed)point probabilityxuser-specified.a. 關(guān)于隨機(jī)性的游程檢驗(yàn)(關(guān)于隨機(jī)性的游程檢驗(yàn)(run testrun test) l當(dāng)然,游程檢驗(yàn)并不僅僅用于只取兩個(gè)

29、值的變當(dāng)然,游程檢驗(yàn)并不僅僅用于只取兩個(gè)值的變量,它還可以用于某個(gè)連續(xù)變量的取值小于某量,它還可以用于某個(gè)連續(xù)變量的取值小于某個(gè)值及大于該值的個(gè)數(shù)(類似于個(gè)值及大于該值的個(gè)數(shù)(類似于0和和1的個(gè)數(shù))的個(gè)數(shù))是否隨機(jī)的問(wèn)題??聪旅胬?。是否隨機(jī)的問(wèn)題??聪旅胬?。l例例 (run2.sav): 從某裝瓶機(jī)出來(lái)的從某裝瓶機(jī)出來(lái)的30盒化妝品盒化妝品的重量如下(單位克)的重量如下(單位克) l71.6 71.0 71.8 70.3 70.5 72.9 71.0 71.0 70.1 71.8 71.9 70.3 70.9 69.3 71.2 67.3 67.6 67.7 67.6 68.1 68.0

30、67.5 69.8 67.5 69.7 70.0 69.1 70.4 71.0 69.9l為了看該裝瓶機(jī)是否工作正常,首先需要驗(yàn)證為了看該裝瓶機(jī)是否工作正常,首先需要驗(yàn)證是否大于和小于中位數(shù)的個(gè)數(shù)是否是隨機(jī)的是否大于和小于中位數(shù)的個(gè)數(shù)是否是隨機(jī)的(零假設(shè)為這種個(gè)數(shù)的出現(xiàn)是隨機(jī)的)。(零假設(shè)為這種個(gè)數(shù)的出現(xiàn)是隨機(jī)的)。 關(guān)于隨機(jī)性的游程檢驗(yàn)(關(guān)于隨機(jī)性的游程檢驗(yàn)(run testrun test) l如果把小于中位數(shù)的記為如果把小于中位數(shù)的記為0 0,否則記,否則記為為1 1,上面數(shù)據(jù)變成下面的,上面數(shù)據(jù)變成下面的0 01 1序列序列l(wèi)1 1 1 1 1 1 1 1 0 1 1 1 1 0 1

31、0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 l這就歸為上面的問(wèn)題。當(dāng)然這里進(jìn)行這就歸為上面的問(wèn)題。當(dāng)然這里進(jìn)行這種變換只是為了易于理解。實(shí)際計(jì)這種變換只是為了易于理解。實(shí)際計(jì)算時(shí),用不著這種變換,計(jì)算機(jī)會(huì)自算時(shí),用不著這種變換,計(jì)算機(jī)會(huì)自動(dòng)處理這個(gè)問(wèn)題的。動(dòng)處理這個(gè)問(wèn)題的。l直接利用這個(gè)數(shù)據(jù),通過(guò)直接利用這個(gè)數(shù)據(jù),通過(guò)spssspss,得到,得到下面游程檢驗(yàn)結(jié)果的輸出。下面游程檢驗(yàn)結(jié)果的輸出。 runs test70.201515308-2.787.005.005.002test valueacases = test valuetotal casesnumber of runs

32、zasymp. sig. (2-tailed)exact sig. (2-tailed)point probabilitylengthmediana. spssspss軟件使用說(shuō)明軟件使用說(shuō)明 l用用run2.sav數(shù)據(jù)。數(shù)據(jù)。l選項(xiàng)為選項(xiàng)為analyzenonparametric testsruns。l然后把變量(這里是然后把變量(這里是length)選入)選入variable list。再在下面再在下面cut point選中位數(shù)(選中位數(shù)(median)。當(dāng)然,)。當(dāng)然,也可以選其他值,如均值(也可以選其他值,如均值(mean),眾數(shù)),眾數(shù)(mode)或任何你愿意的數(shù)目(放在)或任何你愿

33、意的數(shù)目(放在custom)。)。注意在對(duì)前面的由注意在對(duì)前面的由0和和1組成的序列(組成的序列(run1.sav進(jìn)進(jìn)行隨機(jī)性檢驗(yàn)時(shí),行隨機(jī)性檢驗(yàn)時(shí),要選均值要選均值(為什么?)為什么?)。l在點(diǎn)在點(diǎn)exact時(shí)打開(kāi)的對(duì)話框中可以選擇精確方法時(shí)打開(kāi)的對(duì)話框中可以選擇精確方法(exact),),monte carlo抽樣方法(抽樣方法(monte carlo)或用于大樣本的漸近方法()或用于大樣本的漸近方法(asymptotic only)。最后)。最后ok即可。即可。16.3 兩獨(dú)立樣本檢驗(yàn)兩獨(dú)立樣本檢驗(yàn)16.3.1 比較兩總體中位數(shù)的非參數(shù)檢驗(yàn)比較兩總體中位數(shù)的非參數(shù)檢驗(yàn): wilcoxon

34、 (mann-whitney)秩和檢驗(yàn)秩和檢驗(yàn)l為檢驗(yàn)兩總體的中位數(shù)是否相等,常用為檢驗(yàn)兩總體的中位數(shù)是否相等,常用wilcoxon (或稱或稱mann-whitney)秩和檢秩和檢驗(yàn),其原理很簡(jiǎn)單驗(yàn),其原理很簡(jiǎn)單l假定兩個(gè)個(gè)樣本分別有假定兩個(gè)個(gè)樣本分別有m個(gè)和個(gè)和n個(gè)觀測(cè)值。個(gè)觀測(cè)值。把兩個(gè)樣本混合后把這把兩個(gè)樣本混合后把這m+n個(gè)觀測(cè)值升個(gè)觀測(cè)值升冪排序,冪排序,l記下每個(gè)觀測(cè)值在混合排序下面的秩。記下每個(gè)觀測(cè)值在混合排序下面的秩。之后分別把兩個(gè)樣本所得到的秩相加。之后分別把兩個(gè)樣本所得到的秩相加。記第一個(gè)樣本觀測(cè)值的秩的和為記第一個(gè)樣本觀測(cè)值的秩的和為wx而第而第二個(gè)樣本秩的和為二個(gè)樣本

35、秩的和為wy。這兩個(gè)值可以互。這兩個(gè)值可以互相推算,稱為相推算,稱為wilcoxon統(tǒng)計(jì)量。統(tǒng)計(jì)量。l該統(tǒng)計(jì)量的分布和兩個(gè)總體分布該統(tǒng)計(jì)量的分布和兩個(gè)總體分布無(wú)關(guān)。由此分布可以得到無(wú)關(guān)。由此分布可以得到p-值。值。l直觀上看,如果直觀上看,如果wx與與wy之中有之中有一個(gè)顯著地大,則可以選擇拒絕一個(gè)顯著地大,則可以選擇拒絕零假設(shè)。零假設(shè)。l該檢驗(yàn)需要的唯一假定就是兩個(gè)該檢驗(yàn)需要的唯一假定就是兩個(gè)總體的分布有類似的形狀(不一總體的分布有類似的形狀(不一定對(duì)稱)。定對(duì)稱)。例子例子l下面數(shù)據(jù)(下面數(shù)據(jù)(gdp.txt)是地區(qū))是地區(qū)1的十個(gè)城市和地的十個(gè)城市和地區(qū)區(qū)2的的15個(gè)城市的人均個(gè)城市的人

36、均gdp(元)?,F(xiàn)在要想(元)?,F(xiàn)在要想以此作為兩個(gè)樣本來(lái)檢驗(yàn)兩個(gè)地區(qū)的人均以此作為兩個(gè)樣本來(lái)檢驗(yàn)兩個(gè)地區(qū)的人均gdp的中位數(shù)的中位數(shù)m1和和m2是否一樣,即雙尾檢驗(yàn)是否一樣,即雙尾檢驗(yàn)h0: m1=m2對(duì)對(duì)ha: m1m2。由于地區(qū)。由于地區(qū)2的人均的人均gdp的中位數(shù)大于地區(qū)的中位數(shù)大于地區(qū)1的中位數(shù),因此也可以做的中位數(shù),因此也可以做單尾檢驗(yàn)單尾檢驗(yàn)h0: m1=m2對(duì)對(duì)ha: m1m2。l地區(qū)地區(qū)1:3223452638362781598232164710562823034618l地區(qū)地區(qū)2:53913983407659414748460063254534552656997008540

37、3667855375257test statisticsb32.00087.000-2.385.017.016a.016.008.001mann-whitney uwilcoxon wzasymp. sig. (2-tailed)exact sig.2*(1-tailed sig.)exact sig. (2-tailed)exact sig. (1-tailed)point probability人均gdpnot corrected for ties.a. grouping variable: 地區(qū)b. spss的輸出的輸出l該結(jié)果頭兩行該結(jié)果頭兩行顯示了顯示了mann-whitney和和w

38、ilcoxon統(tǒng)計(jì)量的值。另外和我們需要結(jié)果統(tǒng)計(jì)量的值。另外和我們需要結(jié)果的相關(guān)部分為:對(duì)于雙尾檢驗(yàn)的相關(guān)部分為:對(duì)于雙尾檢驗(yàn)h0: m1=m2對(duì)對(duì)ha: m1m2,p-值為值為0.016(見(jiàn)(見(jiàn)“exact sig. (2-tailed)”);而對(duì)于單尾檢驗(yàn);而對(duì)于單尾檢驗(yàn)h0: m1=m2對(duì)對(duì)ha: m1 median= medianprice1.002.003.00grouphouse.txt數(shù)據(jù)數(shù)據(jù)這里這里test statisticsc7522.10005.561a2.062.058b.052.064nmedianchi-squaredfasymp. sig.sig.lower bo

39、undupper bound99% confidenceintervalmonte carlosig.price0 cells (.0%) have expected frequencies less than 5.the minimum expected cell frequency is 9.9.a. based on 10000 sampled tables with starting seed299883525.b. grouping variable: groupc. spssspss軟件使用說(shuō)明軟件使用說(shuō)明 l使用使用house.sav數(shù)據(jù)。數(shù)據(jù)。l選項(xiàng)為選項(xiàng)為analyzenon

40、parametric testsk independent samples。l把變量(這里是把變量(這里是price)選入)選入test variable list;再把數(shù)據(jù)中用;再把數(shù)據(jù)中用1、2、3來(lái)分類的變量來(lái)分類的變量group輸入輸入grouping variable,在,在define groups輸入輸入1、2、3。l在下面在下面test type選中選中median。l在點(diǎn)在點(diǎn)exact時(shí)打開(kāi)的對(duì)話框中可以選擇精確時(shí)打開(kāi)的對(duì)話框中可以選擇精確方法(方法(exact),),monte carlo抽樣方法抽樣方法(monte carlo)或用于大樣本的漸近方法)或用于大樣本的漸近方

41、法(asymptotic only)。最后)。最后ok即可即可 16.5 多個(gè)相關(guān)樣本的檢驗(yàn)多個(gè)相關(guān)樣本的檢驗(yàn) 16.5.1 friedman秩和檢驗(yàn)秩和檢驗(yàn) l前面討論了兩因子試驗(yàn)設(shè)計(jì)數(shù)據(jù)前面討論了兩因子試驗(yàn)設(shè)計(jì)數(shù)據(jù)的方差分析,那里所用的的方差分析,那里所用的f f檢驗(yàn)需檢驗(yàn)需要假定總體的分布為正態(tài)分布。要假定總體的分布為正態(tài)分布。l有一種非參數(shù)方差分析方法,稱有一種非參數(shù)方差分析方法,稱為為friedman friedman (兩因子)秩和檢驗(yàn),(兩因子)秩和檢驗(yàn),或或friedmanfriedman方差分析。它適用于方差分析。它適用于兩個(gè)因子的各種水平的組合都兩個(gè)因子的各種水平的組合都僅

42、僅有一個(gè)觀測(cè)值有一個(gè)觀測(cè)值的情況。的情況。friedman秩和檢驗(yàn)秩和檢驗(yàn) l假定第一個(gè)因子有假定第一個(gè)因子有k k個(gè)水平(稱為處個(gè)水平(稱為處理,理,treatmenttreatment),第二個(gè)因子有),第二個(gè)因子有b b個(gè)個(gè)水平(稱為區(qū)組);因此一共有水平(稱為區(qū)組);因此一共有k kb bkbkb個(gè)觀測(cè)值。個(gè)觀測(cè)值。l這里之所以稱一個(gè)因子為處理,是因這里之所以稱一個(gè)因子為處理,是因?yàn)檫@是我們想要看該因子各水平是否為這是我們想要看該因子各水平是否對(duì)試驗(yàn)結(jié)果有顯著的不同(它的各個(gè)對(duì)試驗(yàn)結(jié)果有顯著的不同(它的各個(gè)水平的觀測(cè)值也就是本小節(jié)的多個(gè)相水平的觀測(cè)值也就是本小節(jié)的多個(gè)相關(guān)樣本)。而另一

43、個(gè)因子稱為區(qū)組,關(guān)樣本)。而另一個(gè)因子稱為區(qū)組,不同的區(qū)組也可能對(duì)結(jié)果有影響。下不同的區(qū)組也可能對(duì)結(jié)果有影響。下面是一個(gè)例子。面是一個(gè)例子。數(shù)據(jù)數(shù)據(jù)fert.txtl這里有三種肥料作為第一個(gè)因子(肥料因子)的這里有三種肥料作為第一個(gè)因子(肥料因子)的三個(gè)水平;而四種土壤為第二個(gè)因子(土壤因子)三個(gè)水平;而四種土壤為第二個(gè)因子(土壤因子)的四個(gè)水平。感興趣于是否這三種肥料對(duì)于某作的四個(gè)水平。感興趣于是否這三種肥料對(duì)于某作物的產(chǎn)量有區(qū)別。稱肥料因子為處理,而土壤因物的產(chǎn)量有區(qū)別。稱肥料因子為處理,而土壤因子為區(qū)組。數(shù)據(jù)在下表中(表中數(shù)字為相應(yīng)組合子為區(qū)組。數(shù)據(jù)在下表中(表中數(shù)字為相應(yīng)組合的產(chǎn)量,單

44、位公斤)。的產(chǎn)量,單位公斤)。 肥料種類肥料種類肥料肥料a肥料肥料b肥料肥料c土土壤壤類類型型土壤土壤1224668土壤土壤2253648土壤土壤3182120土壤土壤4111319friedman秩和檢驗(yàn)秩和檢驗(yàn) lfriedman秩和檢驗(yàn)是關(guān)于位置的,和秩和檢驗(yàn)是關(guān)于位置的,和kruskal-wallis檢驗(yàn)類似,形式上,假定這些樣本有連續(xù)檢驗(yàn)類似,形式上,假定這些樣本有連續(xù)分布分布f1,fk,零假設(shè)為,零假設(shè)為h0:f1=fk,備選假,備選假設(shè)為設(shè)為ha:fi(x)=f(x+q qi),i=1,k,這里,這里f為某連為某連續(xù)分布函數(shù),而且這些參數(shù)續(xù)分布函數(shù),而且這些參數(shù)q qi并不相等。

45、并不相等。l雖然這和以前的雖然這和以前的kruskal-wallis檢驗(yàn)一樣,但是檢驗(yàn)一樣,但是由于區(qū)組的影響由于區(qū)組的影響, 要首先在每一個(gè)區(qū)組中計(jì)算各要首先在每一個(gè)區(qū)組中計(jì)算各個(gè)處理的秩;再把每一個(gè)處理在各區(qū)組中的秩相個(gè)處理的秩;再把每一個(gè)處理在各區(qū)組中的秩相加加.如果如果rij表示在表示在j個(gè)區(qū)組中第個(gè)區(qū)組中第i個(gè)處理的秩。則秩個(gè)處理的秩。則秩按照處理而求得的和為按照處理而求得的和為 1,1,.,biijjrrikfriedman秩和檢驗(yàn)秩和檢驗(yàn) l這樣做的目的是在每個(gè)區(qū)組內(nèi)比較這樣做的目的是在每個(gè)區(qū)組內(nèi)比較處理。例如處理。例如, 同個(gè)年齡段中比較藥同個(gè)年齡段中比較藥品的療效比不分年齡來(lái)

46、比較療效要品的療效比不分年齡來(lái)比較療效要合理;在同一個(gè)部位比較不同的材合理;在同一個(gè)部位比較不同的材料要比混合起來(lái)比較要合理等等。料要比混合起來(lái)比較要合理等等。這里要引進(jìn)的這里要引進(jìn)的friedman統(tǒng)計(jì)量定統(tǒng)計(jì)量定義為義為221112(1)123 (1)(1)2(1)kkiiiib kqrrb kbk kbk kfriedman秩和檢驗(yàn)秩和檢驗(yàn) 221112(1)123 (1)(1)2(1)kkiiiib kqrrb kbk kbk k第一個(gè)式子表明,如果各個(gè)處理很第一個(gè)式子表明,如果各個(gè)處理很不一樣,和的平方就會(huì)很大,結(jié)果不一樣,和的平方就會(huì)很大,結(jié)果就顯著。第二個(gè)公式是為了計(jì)算方就顯著。

47、第二個(gè)公式是為了計(jì)算方便而導(dǎo)出的。它有近似的(有便而導(dǎo)出的。它有近似的(有k-1個(gè)自由度的)個(gè)自由度的)c c2分布。分布。 fert.txt數(shù)據(jù)數(shù)據(jù)test statisticsa46.5002.039.042.037nchi-squaredfasymp. sig.exact sig.point probabilityfriedman testa. ranks1.002.252.75abcmean rankspssspss軟件使用說(shuō)明軟件使用說(shuō)明 l使用使用fert.sav數(shù)據(jù)。數(shù)據(jù)。l選項(xiàng)為選項(xiàng)為analyzenonparametric testsk related samples。l然后

48、把變量(這里是然后把變量(這里是a、b、c)選入)選入test variable list。l在下面在下面test type選中選中friedman。l在點(diǎn)在點(diǎn)exact時(shí)打開(kāi)的對(duì)話框中可以選擇精確時(shí)打開(kāi)的對(duì)話框中可以選擇精確方法(方法(exact),),monte carlo抽樣方法抽樣方法(monte carlo)或用于大樣本的漸近方法)或用于大樣本的漸近方法(asymptotic only)。最后)。最后ok即可即可16.5.2 kendall協(xié)同系數(shù)檢驗(yàn)協(xié)同系數(shù)檢驗(yàn)l實(shí)踐中常需要按照某些特別的性質(zhì)來(lái)多次實(shí)踐中常需要按照某些特別的性質(zhì)來(lái)多次對(duì)一些個(gè)體進(jìn)行評(píng)估或排序;對(duì)一些個(gè)體進(jìn)行評(píng)估或排

49、序;比如幾個(gè)比如幾個(gè)(m個(gè))評(píng)估機(jī)構(gòu)對(duì)一些(個(gè))評(píng)估機(jī)構(gòu)對(duì)一些(n個(gè))學(xué)校進(jìn)行個(gè))學(xué)校進(jìn)行排序。排序。人們想要知道,這些機(jī)構(gòu)的不同結(jié)人們想要知道,這些機(jī)構(gòu)的不同結(jié)果是否一致。如果很不一致,則該評(píng)估多果是否一致。如果很不一致,則該評(píng)估多少有些隨機(jī),意義不大。少有些隨機(jī),意義不大。l換句話說(shuō),這里想要檢驗(yàn)的換句話說(shuō),這里想要檢驗(yàn)的零假設(shè)零假設(shè)是:這是:這些對(duì)于不同學(xué)校的排序是不相關(guān)的或者是些對(duì)于不同學(xué)校的排序是不相關(guān)的或者是隨機(jī)的;而隨機(jī)的;而備選假設(shè)備選假設(shè)為:這些對(duì)不同學(xué)校為:這些對(duì)不同學(xué)校的排序是正相關(guān)的或者是多少一致的。的排序是正相關(guān)的或者是多少一致的。kendall協(xié)同系數(shù)檢驗(yàn)協(xié)同系數(shù)檢

50、驗(yàn)l一個(gè)機(jī)構(gòu)對(duì)諸個(gè)體(學(xué)校)的秩(次序)的和為一個(gè)機(jī)構(gòu)對(duì)諸個(gè)體(學(xué)校)的秩(次序)的和為1+2+n=n(n+1)/2;所有;所有m個(gè)機(jī)構(gòu)對(duì)所有個(gè)體個(gè)機(jī)構(gòu)對(duì)所有個(gè)體評(píng)估的總秩為評(píng)估的總秩為mn(n+1)/2;這樣對(duì)每個(gè)個(gè)體的平;這樣對(duì)每個(gè)個(gè)體的平均秩為均秩為m(n+1)/2。如果記每一個(gè)個(gè)體的。如果記每一個(gè)個(gè)體的m個(gè)秩個(gè)秩(次序)的和為(次序)的和為ri(i=1,n),),l如果評(píng)估是隨機(jī)的,這些如果評(píng)估是隨機(jī)的,這些ri與平均秩的差別不會(huì)與平均秩的差別不會(huì)很大,反之差別會(huì)很大,也就是說(shuō)下面的很大,反之差別會(huì)很大,也就是說(shuō)下面的個(gè)體的個(gè)體的總秩與平均秩的偏差的平方和總秩與平均秩的偏差的平方和s很

51、大。很大。s定義為定義為 21(1)2niim nsrkendall協(xié)同系數(shù)檢驗(yàn)協(xié)同系數(shù)檢驗(yàn)l這個(gè)和這個(gè)和kendall協(xié)同系數(shù)(協(xié)同系數(shù)(kendalls coefficient of concordance)是成比例)是成比例的,的,kendall協(xié)同系數(shù)協(xié)同系數(shù)w(kendalls w)定義為定義為 2312()swm nn數(shù)據(jù)數(shù)據(jù)school.txt l下面是下面是4個(gè)獨(dú)立的環(huán)境研究單位對(duì)個(gè)獨(dú)立的環(huán)境研究單位對(duì)15個(gè)學(xué)校排序的結(jié)果每一行為一個(gè)個(gè)學(xué)校排序的結(jié)果每一行為一個(gè)評(píng)估機(jī)構(gòu)對(duì)這些學(xué)校的排序??瓷显u(píng)估機(jī)構(gòu)對(duì)這些學(xué)校的排序??瓷先ゲ荒敲匆恢拢ㄒ灿型耆恢碌娜ゲ荒敲匆恢拢ㄒ灿型耆恢碌模?/p>

52、:): 數(shù)據(jù)數(shù)據(jù)school.sav l spss的的kendall協(xié)同系數(shù)檢驗(yàn)的輸出協(xié)同系數(shù)檢驗(yàn)的輸出 test statisticsb4.49127.50014.017nkendalls wachi-squaredfasymp. sig.kendalls coefficient of concordancea. some or all exact significances cannot becomputed because there is insufficient memory.b. spssspss軟件使用說(shuō)明軟件使用說(shuō)明 l使用使用school.sav數(shù)據(jù)。數(shù)據(jù)。l選項(xiàng)為選項(xiàng)為an

53、alyzenonparametric testsk related samples。l然后把變量(這里是然后把變量(這里是s1、s2、s15 )選)選入入test variable list。l在下面在下面test type選中選中kendalls w 。l在點(diǎn)在點(diǎn)exact時(shí)打開(kāi)的對(duì)話框中可以選擇精確時(shí)打開(kāi)的對(duì)話框中可以選擇精確方法(方法(exact),),monte carlo抽樣方法抽樣方法(monte carlo)或用于大樣本的漸近方法)或用于大樣本的漸近方法(asymptotic only)。最后)。最后ok即可即可16.5.3 關(guān)于兩值響應(yīng)的關(guān)于兩值響應(yīng)的cochran檢驗(yàn)檢驗(yàn) l

54、前面討論了兩因子方差分析問(wèn)題的前面討論了兩因子方差分析問(wèn)題的friedman秩和檢驗(yàn)。秩和檢驗(yàn)。l但是當(dāng)觀測(cè)值只取諸如但是當(dāng)觀測(cè)值只取諸如0或或1兩個(gè)可兩個(gè)可能值時(shí),由于有太多同樣的數(shù)目(只能值時(shí),由于有太多同樣的數(shù)目(只有有0和和1),排序的意義就很成問(wèn)題),排序的意義就很成問(wèn)題了。了。l這里要引進(jìn)的這里要引進(jìn)的cochran檢驗(yàn)就是用檢驗(yàn)就是用來(lái)解決這個(gè)問(wèn)題的一個(gè)非參數(shù)檢驗(yàn)。來(lái)解決這個(gè)問(wèn)題的一個(gè)非參數(shù)檢驗(yàn)。這里的零假設(shè)也是各個(gè)處理是相同的。這里的零假設(shè)也是各個(gè)處理是相同的。先看一個(gè)例子先看一個(gè)例子 16.5.3 關(guān)于兩值響應(yīng)的關(guān)于兩值響應(yīng)的cochran檢驗(yàn)檢驗(yàn) l關(guān)于瓶裝飲用水的調(diào)查關(guān)于

55、瓶裝飲用水的調(diào)查(數(shù)據(jù)在數(shù)據(jù)在water.txt)。20名顧客對(duì)名顧客對(duì)4種瓶裝種瓶裝飲用水進(jìn)行了認(rèn)可(記為飲用水進(jìn)行了認(rèn)可(記為1)和不)和不認(rèn)可(記為認(rèn)可(記為0)的表態(tài)。)的表態(tài)。l我們感興趣的是這幾種瓶裝水在我們感興趣的是這幾種瓶裝水在顧客眼中是否有區(qū)別。這里零假顧客眼中是否有區(qū)別。這里零假設(shè)是這些瓶裝水設(shè)是這些瓶裝水(作為處理作為處理)在在(作作為區(qū)組的為區(qū)組的)顧客眼中沒(méi)有區(qū)別。顧客眼中沒(méi)有區(qū)別。 數(shù)據(jù)數(shù)據(jù)water.txt l 下表是數(shù)據(jù),每一行為下表是數(shù)據(jù),每一行為20個(gè)顧客對(duì)某一飲料的個(gè)顧客對(duì)某一飲料的20個(gè)個(gè)觀點(diǎn)(觀點(diǎn)(0或或1)。最后一列)。最后一列1為認(rèn)可總數(shù)為認(rèn)可總數(shù)

56、ni而最后一行而最后一行為每個(gè)顧客給出的為每個(gè)顧客給出的4個(gè)觀點(diǎn)中認(rèn)可數(shù)的總和個(gè)觀點(diǎn)中認(rèn)可數(shù)的總和li。最后。最后一行的最后的元素為總認(rèn)可數(shù)一行的最后的元素為總認(rèn)可數(shù)n。 顯然,如果顯然,如果ni和這些和這些ni的均值的差距很大,那么這些處理就很的均值的差距很大,那么這些處理就很不一樣了。不一樣了。cochran檢驗(yàn)就是基于這個(gè)思想的。用檢驗(yàn)就是基于這個(gè)思想的。用ni 表示第表示第i個(gè)個(gè)處理所得到的處理所得到的“1”的個(gè)數(shù),而的個(gè)數(shù),而lj為第為第j個(gè)區(qū)組(例子中的顧客)個(gè)區(qū)組(例子中的顧客)所給的所給的“1”的個(gè)數(shù),的個(gè)數(shù),“1”的總數(shù)記為的總數(shù)記為n。 關(guān)于兩值響應(yīng)的關(guān)于兩值響應(yīng)的coch

57、ran檢驗(yàn)檢驗(yàn)lcochran檢驗(yàn)統(tǒng)計(jì)量(檢驗(yàn)統(tǒng)計(jì)量(cochrans q)為)為(假定有(假定有k個(gè)處理和個(gè)處理和b個(gè)區(qū)組)個(gè)區(qū)組)2221122111(1)()(1)(1)1kkiiiibbjjjjkiik knnk knknqknlknlnnk這里當(dāng)當(dāng)k固定時(shí),固定時(shí),q在在b很大時(shí)有近似的自由度很大時(shí)有近似的自由度為為k-1的的c c2分布。分布。 數(shù)據(jù)數(shù)據(jù)water.sav l cochran檢驗(yàn)的檢驗(yàn)的spss輸出:輸出: test statistics2012.344a3.006.006.002ncochrans qdfasymp. sig.exact sig.point pro

58、bability0 is treated as a success.a. spssspss軟件使用說(shuō)明軟件使用說(shuō)明 l使用使用water.sav數(shù)據(jù)。數(shù)據(jù)。l選項(xiàng)為選項(xiàng)為analyzenonparametric testsk related samples。l然后把變量(這里是然后把變量(這里是c1、c2、c3、c4 )選)選入入test variable list。l在下面在下面test type選中選中cochrans q。 l在點(diǎn)在點(diǎn)exact時(shí)打開(kāi)的對(duì)話框中可以選擇精確時(shí)打開(kāi)的對(duì)話框中可以選擇精確方法(方法(exact),),monte carlo抽樣方法抽樣方法(monte carl

59、o)或用于大樣本的漸近方法)或用于大樣本的漸近方法(asymptotic only)。最后)。最后ok即可即可16.5.4 成對(duì)樣本的中位數(shù)檢驗(yàn)成對(duì)樣本的中位數(shù)檢驗(yàn) l我們介紹了在正態(tài)分布總體的假我們介紹了在正態(tài)分布總體的假定下,關(guān)于成對(duì)樣本均值的定下,關(guān)于成對(duì)樣本均值的t檢驗(yàn)。檢驗(yàn)。l我們還提到,當(dāng)總體參數(shù)未知時(shí),我們還提到,當(dāng)總體參數(shù)未知時(shí),應(yīng)該使用非參數(shù)方法。應(yīng)該使用非參數(shù)方法。l這里再次利用例這里再次利用例6.4數(shù)據(jù)數(shù)據(jù)(diet.txt)介 紹 成 對(duì) 數(shù) 據(jù) 的 符 號(hào) 檢 驗(yàn) 和介 紹 成 對(duì) 數(shù) 據(jù) 的 符 號(hào) 檢 驗(yàn) 和wilcoxon符號(hào)秩檢驗(yàn)符號(hào)秩檢驗(yàn) 數(shù)據(jù)數(shù)據(jù)(diet

60、.txt)l該數(shù)據(jù)為該數(shù)據(jù)為50個(gè)人減肥前后的重量。個(gè)人減肥前后的重量。l把兩個(gè)樣本中配對(duì)的觀測(cè)值逐個(gè)相把兩個(gè)樣本中配對(duì)的觀測(cè)值逐個(gè)相減,就變成單樣本的中位數(shù)檢驗(yàn)。減,就變成單樣本的中位數(shù)檢驗(yàn)。l如果不知道總體的任何信息,則可如果不知道總體的任何信息,則可利第利第16.1介紹的符號(hào)檢驗(yàn)。介紹的符號(hào)檢驗(yàn)。l如果總體分布是對(duì)稱的,則可利用如果總體分布是對(duì)稱的,則可利用16.2節(jié)的節(jié)的wilcoxon符號(hào)秩檢驗(yàn)。符號(hào)秩檢驗(yàn)。l自然,我們不必自己去進(jìn)行減法。自然,我們不必自己去進(jìn)行減法。適當(dāng)?shù)挠?jì)算機(jī)選項(xiàng)可以自動(dòng)產(chǎn)生結(jié)果。適當(dāng)?shù)挠?jì)算機(jī)選項(xiàng)可以自動(dòng)產(chǎn)生結(jié)果。數(shù)據(jù)數(shù)據(jù)(diet.txt)l形式上,令形式上,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論