非參數(shù)統(tǒng)計學(xué)講義相關(guān)與回歸_第1頁
非參數(shù)統(tǒng)計學(xué)講義相關(guān)與回歸_第2頁
非參數(shù)統(tǒng)計學(xué)講義相關(guān)與回歸_第3頁
非參數(shù)統(tǒng)計學(xué)講義相關(guān)與回歸_第4頁
非參數(shù)統(tǒng)計學(xué)講義相關(guān)與回歸_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、個人資料整理 僅限學(xué)習(xí)使用非參數(shù)統(tǒng)計學(xué)講義主講:統(tǒng)計系袁靖第五章相關(guān)和回歸 1引言所謂相關(guān),是指兩組或兩組以上觀察結(jié)果之間的連帶性或聯(lián)系。換句話說,也就是各組觀察結(jié)果所反映的特性之間有關(guān)系。如幾個親生兄弟間的智商與出生順序有關(guān)系,受教育程度與性別有關(guān)系,出生率X和文盲率 Y之間的關(guān)系等等。在實際問題的研究中,人們常常想知道兩組或兩組以上的觀察結(jié)果是否有聯(lián)系,同時也想知道聯(lián)系的程度如何。前面的統(tǒng)計檢驗?zāi)軌蛟谝欢ǖ娘@著性水平上,確定各組觀察 值的關(guān)系是否存在。相關(guān)方法被用來度量兩個或更多變量之間的線性關(guān)系的強度,是回歸分析的基礎(chǔ)。在數(shù)理統(tǒng)計學(xué)中,我們使用相關(guān)系數(shù)定義變量X和變量Y之間的相關(guān)性。:=

2、corr(X,Y)= C0V(X,Y)1(0,1.var(X) var(Y)對于龍羊本(Xi,Yi), (X2,Y2),(Xn,Yn)來說,Pearson相關(guān)系數(shù)為Z(Xi -x)(y -Y)nVZ(Xi -x)2Z(y -Y)2v (Xi -X)(y -Y)% (Xi -X)2% (Yi -Y)2(0.2如果在這個樣本中的 n個觀察值獨立,則r是P的漸近無偏估計;如果它又是二元正態(tài)分布,則 r是P的ML估計。為了檢驗H0:P=0, H: P#0 ,可以選取統(tǒng)計量t=r J 土言t(n2)1 1 -r結(jié)論:Pearson相關(guān)系數(shù)度量的是一種線性關(guān)系,而我們所要介紹的非參數(shù)的Spearman秩相

3、關(guān)系數(shù)rs和Kendall。相關(guān)系數(shù)實際上度量的是一種形式的相依聯(lián)系,或是更廣義的單調(diào)關(guān)系。因此相關(guān)的概念被推廣,不僅指線性相關(guān),而泛指相依或聯(lián)系。 2兩個樣本的相關(guān)分析等級相關(guān)等級相關(guān)(Rank Correlation也稱作級序相關(guān),用于兩個至少是定序尺度測量的樣本問相關(guān)程度的測定研究背景1 P度量了總體樣本點在標(biāo)準(zhǔn)差線周圍的聚集程度,詳見筆記 P38。個人資料整理 僅限學(xué)習(xí)使用基本方法兩個樣本X、Y,其觀察數(shù)據(jù)可以配對為(X1,Y1), (X2,丫2),(Xn,Yn)。將x1,x2,xn排序后 評秩,其秩記作 U,與Xi相對應(yīng)的秩為Ui(i =1,2,n);同樣,Yi,Y2;j-, Yn排

4、序后評秩,秩記作 V,與 yi相對應(yīng)的秩為Vi(i =1,2,n)。這樣得到的 n對秩(U1M), (U2M),,(U n ,Vn)可能每一對完全相 等,也可能不等。由于每一樣本都是n個數(shù)據(jù)評秩,因此 叫與Vj的取值都是從1到n。X、Y的秩可能完全一致,即對于所有的i來說,有Ui = M ,表51是完全一致的評秩結(jié)果。X、Y的秩可能完全相反,表52是完全相反的評秩結(jié)果。如果 X、Y完全相關(guān),應(yīng)該對于所有的i有Ui = Vi ,即Ui Vj =0。因此,Ui與Vi之差可以用來度量 X、Y的相關(guān)程度。定義Di =Ui -Vi表5-1完全一致的評秩X的秩Y的秩1122n 1n 1nn表5-2完全相反

5、的評秩X的秩Y的秩1n2n 1n 12n1則兩組秩完全相關(guān)時,Di i 1 i 15.3)式的這個秩差值平方和的大小既受到n的多少的影響,又受到兩組秩不一致程度的影響,因此,采用相對的測量指標(biāo)有利于說明X、Y的相關(guān)程度。因為 Di2的最大值反映X、丫完全不相關(guān)的情況,所以,用5,4)式的中括號內(nèi)最后一項,當(dāng)n為奇數(shù)時是22; n為偶數(shù)時是12。5.3)式除以5,4)式得到(0.5、D2_ 3, D2,2、,一 ,2、n(n -1)/3n(n -1)5,5)式的取值從0至IJ 1。根據(jù)表5-1中的數(shù)據(jù)計算5,5)式值為0,表5-2中的數(shù)據(jù)計算的5,5)式值為1,即X、Y的秩完全一致時,5,5)式

6、的值為0, X、Y的秩完全不一致時,5,5)式的值為1。測度兩個樣本等級相關(guān)程度可以象參數(shù)方法一樣,定義等級相關(guān)系數(shù)作為標(biāo)準(zhǔn)。斯皮爾曼的等級相 關(guān)系數(shù)(Spearmancoefficient of rank correlation是測定兩個樣本相關(guān)強度的重要指標(biāo)。其計算公式為6% Di2R =12 (0,6n(n -1)斯皮爾曼相關(guān)系數(shù)也寫為,在有下標(biāo)注以s是為表明這個相關(guān)系數(shù)r不是積矩相關(guān)的簡單相關(guān)系數(shù),而是等級相關(guān)的 Spearman相關(guān)系數(shù)。注:由于5,6)式與5,5)式不同,所以,R的取值從一 1到十1, R =1表明X、Y完全相關(guān),R =十l為完全正相關(guān),R=- 1為完全負(fù)相關(guān)。|R

7、越接近于I,表明相關(guān)程度越高,反之,R越接近于零,表明相關(guān)程度越低,R=0為完全不相關(guān)。R0為正相關(guān),RV0為負(fù)相關(guān)。通常認(rèn)為 R :0,8為相關(guān)程度較高。Spearman秩相關(guān)系數(shù)檢驗臨界值查表可得,P198。存在打結(jié)時,Spearman統(tǒng)計量要作相應(yīng)修正。在大樣本時,可用正態(tài)近似作檢驗。Z=rs,n1 nN(0,1)應(yīng)用【例5-1】經(jīng)濟發(fā)展水平和衛(wèi)生水平之間的相關(guān)分析對某地區(qū)12個街道進(jìn)行調(diào)查,并對經(jīng)濟發(fā)展水平和衛(wèi)生水平按規(guī)定的標(biāo)準(zhǔn)打分,評定結(jié)果如表5- 4。表5-4某地區(qū)經(jīng)濟水平與衛(wèi)生水平得分街道號經(jīng)濟水平182287360衛(wèi)生水平867865街道號 經(jīng)濟水平衛(wèi)生水平7848087877

8、98075個人資料整理 僅限學(xué)習(xí)使用498881094965756411858568990126870分析:將表5-4中定距尺度測量的分?jǐn)?shù),按從小到大的順序排等級,得到表55的結(jié)果。對兩個定序尺度測量的樣本進(jìn)行相關(guān)分析,可以采用等級相關(guān)系數(shù)測定。必要的計算過程如表5-5所列。根據(jù)0. 8,所以該地區(qū)的經(jīng)濟發(fā)展水平和衛(wèi)生水平存在著正相關(guān)關(guān)系,相關(guān)程度較高,為 88. 81%。街道號經(jīng)濟水平U)衛(wèi)生水平式中,u是X中同分的觀察值數(shù)目,v是Y中同分的觀察值數(shù)目。【例5-2】經(jīng)濟發(fā)展水平和衛(wèi)生水平之間的相關(guān)分析某地區(qū)對24個區(qū)縣進(jìn)行調(diào)查,并對經(jīng)濟發(fā)展水平和衛(wèi)生水平按規(guī)定標(biāo)準(zhǔn)評分,結(jié)果如表56。分析:將

9、表56的評分轉(zhuǎn)換為秩次,從高往低排序,同分的秩取平均值,結(jié)果見表57。根據(jù)公式個人資料整理 僅限學(xué)習(xí)使用,_ 2R =1 - 6 i=16 347 =1 -0.1509 =0.8491n(n -1)24 (24 -1)由于經(jīng)濟水平和衛(wèi)生水平的評分中均有同分,應(yīng)采用校正因子修正。利用5.7式計算修正的R為,22n(n -1)-6% Di -6(u v)24 (575)-6 (347) -1 / 2 (16 12)n(n2-1) -12u . n(n2 _1)_12v,24 (575)-16.24 (575) -12= 0.8490對比兩個 R值可知,由于同分的觀察值數(shù)目占觀察值總數(shù)目的比例不是很

10、大,因而校正后的R與校正前的R變化不大。但是,校正前的只略大于校正后的R,這說明同分對只的影響雖然很小,但同分的區(qū)縣編號經(jīng)濟水平X)衛(wèi)生水平Y(jié))區(qū)縣編號經(jīng)濟水平X)衛(wèi)生水平Y(jié))192561368552907014676639071156559487761664585816917615068068186054779621959438777020554597664214634107663224232117454233930126865243831影響是夸大R值。因此。在X、Y中至少有一個存在大量同分時,應(yīng)進(jìn)行校正。表5-6經(jīng)濟水平與衛(wèi)生水平評分區(qū)縣編號X的秩次U)Y的秩次V)D=U-VD1114-

11、1316922.53.5-1132.520.50.254413955500666007711-416883.54.520.2599.590.50.25109.510-0.50.25111116.5-5.530.251212.584.520.251312.515-2.56.25141477491515123916161339171718-11表5-7經(jīng)濟水平與衛(wèi)生水平的秩次個人資料整理 僅限學(xué)習(xí)使用181816.51.52.25191920-11202019112121210022222200232324-1124242311347.004.R的顯著性檢驗利用相關(guān)系數(shù)及其修正的公式計算的R值,是

12、抽自兩個總體的樣本數(shù)據(jù)計算的結(jié)果,從這一相關(guān)系數(shù)的大小,可猜測總體的秩相關(guān)系數(shù)是否與零有顯著差異,但是否為真,應(yīng)進(jìn)行假設(shè)檢驗。對R的顯著性檢驗正是為了回答這一問題。檢驗可以僅研究兩個總體是否存在相關(guān),也可以分別研究相關(guān)的方向,即是正相關(guān),還是負(fù)相關(guān)。針對研究問題的不同,可以建立不同的假設(shè)組。雙側(cè)檢驗H0:不相關(guān)H1:存在相關(guān)單側(cè)檢驗H0 :不相關(guān)H0 :不相關(guān)H+ :正相關(guān)H :負(fù)相關(guān)為對假設(shè)作出判定,所需數(shù)據(jù)至少是定序尺度測量的。根據(jù)前式計算出R值。當(dāng)nM30時,在附表中,依據(jù)n和R查找相應(yīng)的概率 P。表58是判定指導(dǎo)表。表5-8 R顯著性檢驗判定指導(dǎo)表設(shè)P-H+:正相關(guān)R的右尾概率H:負(fù)相

13、關(guān)R的左尾概率H1:存在相關(guān)R的較小概率的2倍若n30,則按【例5-3】對例53作顯著性檢驗分析:由于例53中未指明相關(guān)的方向,只需檢驗是否相關(guān),因而建立雙側(cè)備擇:H0:不相關(guān)Hi:存在相關(guān)個人資料整理 僅限學(xué)習(xí)使用利用提供的數(shù)據(jù)計算的R值為0. 8491 ,每個樣本數(shù)據(jù) n為24。在附表中 n= 24時;雙側(cè)檢驗R =0.608的概率為 0. 002。顯然,R = 0. 8491 R =0.608。因此,概率 PV0. 002,數(shù)據(jù)拒絕 Ho,表 明經(jīng)濟水平和衛(wèi)生水平確實存在相關(guān)關(guān)系。二、Kendall r相關(guān)檢驗Kendall秩相關(guān)即肯德爾秩相關(guān),與等級相關(guān)一樣,也是用于兩個樣本相關(guān)程度的

14、測量,要求數(shù)據(jù)至 少是定序尺度的。它也是利用兩組秩次測定兩個樣本問相關(guān)程度的一種非參數(shù)統(tǒng)計方法。. 基本概率協(xié) 同0 ,則對子(Xi,Yi)與(Xj,Yj)協(xié)同;如果 (Xj Xi)(Yj -Y)非一致對評分與最大可能總分之比為2Vn(n -1)(0.10當(dāng)Y的秩對完全按自然順序排列時,5.9)式的值為1, 5.10)式的值為0;而當(dāng)Y的秩對全部為非一致對時,5.10)式的值為1, n(n -1)T =14Vn(n -1)(0.12若記S= U V ,則Kendall秩相關(guān)系數(shù)為n(n-1)(0.13這里的Kendall秩相關(guān)系數(shù) T是Tau的縮寫,也常寫作 。T = l,表明兩組秩次完全正相

15、關(guān);T =1,表明兩組秩次間完全負(fù)相關(guān)。一般 |T 0.8,可以為相關(guān)程度較高。NOTE :該定義式實質(zhì)為概率,-1 T , Cn -u Cn -V式中,uH=ZCu , u是X中同分觀察值的數(shù)目,v=C:, u是X中同分觀察值的數(shù)目。u, v仍分別表示X、Y的每一同分組中同分觀察值的數(shù)目。表5-11兩個裁判員的秩的評分XY的數(shù)對1, 2.52, 3.515個加1, 2.52, 3.513個減1, 4.52, 1-11 , 4.52, 512.5 , 2.53.5 , 3.50個人資料整理 僅限學(xué)習(xí)使用2.5 ,4.53.5 , 1-12.5 ,4.53.5 , 512.5 ,4.53.5 ,

16、 1-12.5 ,4.53.5 , 514.5 ,4.51 , 505. T的顯著性檢驗與Spearman秩相關(guān)系數(shù) R一樣,Kendall秩相關(guān)系數(shù) T的顯著性也應(yīng)進(jìn)行檢驗。這一檢驗實際上是檢驗兩個總體的相關(guān)是否真實存在,是正相關(guān)或是負(fù)相關(guān),從而說明以T的大小反映相關(guān)程度的高低是可信。如果研究關(guān)心的是相關(guān)是否確實存在,而不考慮相關(guān)的方向,則應(yīng)建立雙側(cè)備擇,假設(shè)組為H0:不相關(guān)H1:存在相關(guān)若關(guān)心的是相關(guān)的方向,則應(yīng)建立單側(cè)備擇,假設(shè)組為H0 :不相關(guān)H0 :不相關(guān)H+:正相關(guān)H-:負(fù)相關(guān)為對假設(shè)作出判定,所需數(shù)據(jù)至少是定序尺度測量的。通過對數(shù)據(jù)求出一致對或非一致對數(shù)目,可 以按照計算公式算出

17、 Kendall秩相關(guān)系數(shù)T。1)小樣本時(n 30),可以查表給出尾概率,T的抽樣分布中附表中給出。表5-12 T顯著性檢驗判定指導(dǎo)表設(shè)P-H+:正相關(guān)T的右尾概率H:負(fù)相關(guān)T的左尾概率Hi:存在相關(guān)T的較小概率的2倍30),可作正態(tài)近似(0.153T , n(n-1)2(2n 5), n(n -1)(2n 5)/18由于Z近似正態(tài)分布,故可以查標(biāo)準(zhǔn)正態(tài)分布表找到相應(yīng)的尾概率。三、 等級相關(guān)系數(shù)R和Kendall秩相關(guān)系數(shù)T的比較.相同點兩個相關(guān)系數(shù)的檢驗都要求數(shù)據(jù)至少是在定序尺度上測量;都是計算秩相關(guān)系數(shù),用以測度兩個相關(guān)樣本之間的相關(guān)程度;它們的取值都是在一1到+1之間;.不同點R和T的

18、數(shù)值即使對于同一組數(shù)據(jù)也是不同的,多數(shù)情況下,R的絕對值大于T的絕對值;雖然R和T都使用了資料中同量的信息,但由于兩者具有不同的基礎(chǔ)尺度,R利用的是秩差,而T利用的是秩的順序,即一致對和非一致對,因此,不能將它們的數(shù)值加以比較,以說明相關(guān)程度的高個人資料整理 僅限學(xué)習(xí)使用低。T的解釋比起 R來更容易。兩個觀察的數(shù)對 (xi,yi) , (Xj,yj),當(dāng)Xi Xj時,總有yi yj ,稱為 順序一致對,若對于每個 Xi yj ,則為不一致對。T的準(zhǔn)確意義是:一致對數(shù)目與非一致 對數(shù)目之差占全部可能數(shù)對的比重。四、偏秩相關(guān)詳見易丹輝教材k個樣本的相關(guān)分析前面一章研究的是 n個對象或個體的兩組秩之

19、間相關(guān)的度量,在實際問題中,往往還涉及n個對象或個體的幾組秩評定之間的相關(guān)。對于至少是定序尺度測量的k個配對樣本的數(shù)據(jù),或 k次實驗得到的數(shù)據(jù),其秩評定間的相關(guān),可以采用 Kendall秩評定協(xié)同系數(shù)度量。本章主要介紹兩種Kendall秩評定協(xié)同系數(shù):完全秩評定協(xié)同系數(shù)和不完全秩評定協(xié)同系數(shù)。一、完全秩評定的Kendall協(xié)同系數(shù)完全秩評定的 Kendall 協(xié)同系數(shù)(KendallCoefficient of Concordancefor ComPlete Rankings用于是組秩 評定間相關(guān)程度的測定,即多組秩之間關(guān)聯(lián)程度的測定。.基本方法若被分析的數(shù)據(jù)是定序尺度測量的,那么n個數(shù)據(jù),即

20、n個對象或個體,可以分別給予某一個秩,在這一組數(shù)據(jù)內(nèi)所有的秩次和即等級和為2 HI n = n(n 1)/2如果有k組秩,那么這 k組秩的秩次總和就是 kn(n+1)/2。例如3個消費者分別給 6種牌號電冰箱的質(zhì)量評等級,結(jié)果如表514。表中最后一行 Rj是每一種6牌號電冰箱的秩和,總的秩和為kn(n+1)/2= 3(6)(6+ 1)/2 63Z R 。這也就是最大可能的秩次j 1和。這時,對于每一個觀察對象或個體來說,平均的秩次和應(yīng)為kn(n+1)/2/ n表5-14消費者給冰箱質(zhì)量評定的秩冰箱A冰箱B冰箱C冰多i D冰箱E冰多i F116325421564233632541個人資料整理 僅

21、限學(xué)習(xí)使用秩和C8141111118/2。如果Rj(j = l, 2,,n表示每一觀察對象或個體白實際秩和,那么, B與k(n 十1/2越接近,表明對第j個觀察對象或個體的秩評定越接近平均秩;二者相差越遠(yuǎn),遠(yuǎn)離平均秩。由于Rj與k(22十1/2的差值可正可負(fù),因此,在分析時應(yīng)采用差值的平方和。定義差值的平方和為S,即 nS 八(弓-k(n 1)/2)2(0.16j 1在k組秩評定完全一致時,各個觀察對象或個體的秩和與平均秩和的離差平方和,是最大可能的離差平 方和。由于k組秩評定完全一致時,各觀察對象或個體的秩和分別為k, 2k,,nk,如表514,如果3位消費者對6種牌號電冰箱的質(zhì)量看法一致,

22、那么他們會給出相同的秩。這時,被認(rèn)為質(zhì)量最好的電冰箱將得到3個秩1,它們的秩和 Rj = 1十1十1 = 3=ko被認(rèn)為質(zhì)量第二的,秩和Rj = 2十2十2= 6=2k。最差的電冰箱秩和將是Rj = 6十6十6=18=nko也就是說,當(dāng) k組秩評定之間完全一致的時候,Rj應(yīng)是k, 2k,,nko因此,最大可能的離差平方和為 nn、jk -k(n 1)/22 =k2% (j -(n 1)/2)2 =k2n(n2 -1)/12(0.17j 1j 1k組秩評定間的一致性,即協(xié)調(diào)程實際偏差平方和與最大可能偏差平方和之比,在一定程度上能反映度。5.16)式除以W的取值在0到1之間。若 W=0,表明k組秩

23、之間不相關(guān);若 W=1,表明k組秩之間完全相關(guān),即完全致。由于k2時,k組秩評定不可能完全不一致,也就是說,只有當(dāng) k=2時,秩評定一致和非一致是對稱相反的,而k2,對稱性不再存在,因此,W取值不可能為負(fù)。為方便實際計算,NOTE :在m組秩的評定完全一致時,該離差平方和是最大可能的離差平方和,實際上,個體的秩和分別為:k,2k,,nk。22最大可能的離差平萬和為:k n(n -1)/12完全評秩的協(xié)同系數(shù) W,實際表達(dá)了實際偏差平方和和最大可能偏差平方和之比,在一定程度上反映了 k組評秩之間的一致性,即協(xié)同程度。個人資料整理 僅限學(xué)習(xí)使用0 WW W1。當(dāng)W=0時,表明k組秩之間不相關(guān);若

24、W=1 ,表明k組秩之間完全相關(guān),即完全一致。在作檢驗時,W統(tǒng)計量和 S統(tǒng)計量都有表可查;當(dāng)大樣本時,有12S2Q=k(n1)W= . (n -1)kn(n 1)應(yīng)用【例5-8】裁判組整體評分效果的相關(guān)分析在某次業(yè)余歌手大賽上,6名裁判員組成的裁判組,對10名參賽歌手的評分等級如表515。表5-15裁判員對歌手評定的等級歌手編號裁判員A裁判員B裁判員C裁判員D裁判員E裁判員F11111152237583354626949754106545365866647727329102487101034191082997108988310分析:裁判組由 6名裁判組成,要評價 6名裁判整體評分效果,實際上是

25、評價裁判組整體評分的一6個樣本完全秩評致程度。由于這是 6個配對樣本,且每一個觀察對象即參賽歌手全部都有秩,所以是定協(xié)調(diào)程度的考察,應(yīng)采用完全秩評定的Kendall協(xié)同系數(shù)。表5-16裁判員對歌手評定的等級歌手編號RjRj21101002287843321024441168153196163210247309008351225945202510462116合計33011840表516是Rj計算表。由于 k=6, n=10,按5.19)式有n R2 -3k2n(n 1)2j +k2n(n2 -1)一 _2二 12(11840) - 3(36)(10 -1)(10 1)-10(36)(102 -1

26、)=0.6865般來說,W的值越接近于l,表明k組秩評定之間的一致程度越高;W值越接近于0,則k組秩評個人資料整理 僅限學(xué)習(xí)使用定之間的一致程度就越低。這里,W=0. 6865,不算很大,表明裁判組6名裁判員對10名參賽歌手水平的意見一致程度不是很高。同分的處理詳見易丹輝編非參數(shù)統(tǒng)計一方法與應(yīng)用P134。W的顯著性檢驗對W顯著性的檢驗,是為了對總體間是否存在真實的相關(guān)關(guān)系作出判定。由于是k個樣本,只能建立雙側(cè)備擇,假設(shè)組為Ho:不相關(guān)H1:存在相關(guān)為了對假設(shè)作出判定,需要容量均為n的k個樣本數(shù)據(jù)至少是在定序尺度上測量的,每一觀察值都能有相應(yīng)的秩。 TOC o 1-5 h z 檢驗統(tǒng)計量因樣本的

27、大小而有所不同。當(dāng)樣本的觀察值n較小時,采用的檢驗統(tǒng)計量為SonnS c (B-k(n 1)/2)2 C R2-3k2n(n 1)2(0.20j ij 1當(dāng)樣本觀察值數(shù)目n較大時,采用 Q統(tǒng)計量。12S2Q=k(n-1)W= - (n-1)(0.21kn(n 1)小樣本時,檢驗統(tǒng)計量 S在H0為真時的抽樣分布,可以參見附表。大樣本時,可以查卡方分布表得 到其相應(yīng)的尾概率的值?!纠?-9】對上例的W值進(jìn)行顯著性檢驗分析:因為在這個問題中,n=l0, k= 6,所以應(yīng)利用 W值計算統(tǒng)計量 Q,根據(jù)式中,入是配對樣本被比較的次數(shù)。例如,3個消費者對3種牌號的彩電質(zhì)量評等級,若3種脾號的彩電僅一次被比

28、較,則 入=1。/2,由于有k行,因此,所 有的秩和為km(m十1/2。對于n列來說,平均每列的秩和為 km(m十1/2n。若每列的實際秩和記作 Rj(j=1, 2,,n那么,實際秩和與平均秩和的差值大小也可以用作判定協(xié)調(diào)性程度。由于實際秩和與平均秩和之差可正可負(fù),因而,仍采用差值平方和。定義S為km(m 1)12S =, B (0.23jT j 2n當(dāng)k組秩的評定完全一致時,S就是2,2,、1 n(n -1) (0.2412這也就是實際秩和與平均秩和差值平方和的最大可能值。因此,將 5.23)式與 2n(n2 -1)nW =12%j i2(0.26Rj -km(m 1)/2n222 n(n

29、1)如果 m = m和入=k,那么5.25)式和5.26)式就是5.18)式。W值在0到1之間。W為0,表明k組秩評定之間不相關(guān);W為1,表明k組秩評定之間完全相關(guān),即完全一致。由于k2時,秩評定的一致和非一致不是對稱的,因而, W取值不可能負(fù)。為實際計算的方便,5.25)式和5.26)式可以寫成5.27)式的形式。12S =12% R23k2m2(m 1)2nn12% Rf -3k2m2(m 1)2/nj注,2n(n2 -1)(0.27應(yīng)用【例5-10】消費者對彩電質(zhì)量評價的一致性分析3個。因7種不同牌號的彩電質(zhì)量檢驗,不要求消費者對每一種牌號的彩電都給出秩,只要求不大于而,m=3, n=7

30、。如果每對彩電僅一次被比較,因而有 入=1。需要的消費者數(shù)目,可以從 (521式中計算得到n(n -1) 1(7)(7 -1) k = = = /m(m -1)3(3 -1)表5-18 消費者對彩電質(zhì)量可能的評秩消費者編號彩電A彩電B彩電C彩電D彩電E彩電F彩電G1*2*3*4*5*6*7*表5-19消費者對彩電的秩評定結(jié)果消費者編號彩電A彩電B彩電C彩電D彩電E彩電F彩電G112321323321個人資料整理 僅限學(xué)習(xí)使用4231513262137132合計3597846即需要有7名消費者來評定。表518是一種滿足要求的設(shè)計表格。表中的*號表示那種牌號的彩電被消費者評秩。由于 m=3, n=

31、7, k=7,所以表中每一行有 m=3個秩,表中每一列有 km/n=7(3/7=3個秩。經(jīng)過消費者評秩,結(jié)果如表519。分析:由于這是不完全的秩評定,設(shè)計要求符合(5 21式的平衡假定,可以采用不完全秩評定的Kendall協(xié)同系數(shù),分析消費者對彩電質(zhì)量評價的一致性。根據(jù)5.27)式有12S =12(32 52 92 72 82 42 62)-3(72)(32)(3 1)2 / 7 = 12(280)-30 24 = 336336W =-2=1 7(72 -1)這是W的最大值,表明7個消費者對彩電質(zhì)量的看法完全一致。在不完全的秩評定中,同分也是可能出現(xiàn)的,因為數(shù)據(jù)可以由定距尺度的評分轉(zhuǎn)換為定序尺

32、度的 秩。但是,目前沒有比較簡單的校正公式,因此,計算 Kendall協(xié)同系數(shù)時,仍舊采用 524)式,5 25)式或 5.27)式。顯著性檢驗對于不完全秩評定的 Kendall協(xié)同系數(shù),也可以進(jìn)行顯著性檢驗。建立的假設(shè)組為Ho:不相關(guān)Hi:存在相關(guān)為對假設(shè)作出判定,需要k個樣本的數(shù)據(jù)至少是定序尺度測量的,并能夠根據(jù)前面的公式分別計算出S、Wo利用S、W按照5.28)式、5.29)式計算得到檢驗統(tǒng)計量Q。統(tǒng)計量 Q近以于自由度 df = n-l的卡方分布。因此,可以根據(jù)卡方分布對原假設(shè)作出相應(yīng)的判斷。 (n2 -1)Wm 1(0.2812S1 n(m 1)(0.29【例5-11利用例5-10的

33、數(shù)據(jù)作顯著性檢驗分析:在例5-10中,入=1, m = 3, n=7, W=1,將各個數(shù)值代入 5.28)式得到個人資料整理 僅限學(xué)習(xí)使用 TOC o 1-5 h z 22(n -1)W1(7 -1)1 .Q 二二二 12m 13 1自由度df=n 1 = 6,在卡方分布表中,H0為真時,Q是12出現(xiàn)的概率P略大于0. 05,因為當(dāng)概 率為0. 05時,72=12. 59。由于這個 P是近似的值,因而,可以在顯著性水平=0.05上拒絕Ho。況且,W的值為最大可能值1,拒絕H0是合乎邏輯的。多重比較若P值很小,以至于 H0被拒絕,也就是 k組不完全的秩評定之間存在相關(guān),那么,有必要比較這k組秩之

34、間是否有重大的不同,可以運用多重比較技術(shù)來研究這一問題。第j列的秩和Rj除以該列的秩數(shù)目km/n,是第j個對象的平均秩,比較 n個對象的k個不完全組的秩之 間有無明顯不同,可以利用各個對象的平均秩比較,也可以利用各列秩和的差值比較。對于任意兩個列等級和(Ri,Rj)1i =j Wn,它們的差值在1 一口水平下,滿足5.30)式或(0.31表明n個對象間秩評定沒有重大的不同;而若大于5.30)式或5.31)式的右側(cè),表明這是有重大不同的數(shù)對。5.30)式、/2=21,查多重比較的臨界值Z表,得到2. 823,代入5 30)式,得到R - 0 K 2.82377(1)(3+ 1)/6 = 6.0984將表5-19中各列秩和兩倆比較差值,可知,最大差值為A與C歹U,即3-9=6。這一差值仍小于6. 0984。因此,可以得出結(jié)論:在 7種牌號彩毫的不完全秩評定中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論