22列聯(lián)表資料的流程相關與應用_第1頁
22列聯(lián)表資料的流程相關與應用_第2頁
22列聯(lián)表資料的流程相關與應用_第3頁
22列聯(lián)表資料的流程相關與應用_第4頁
22列聯(lián)表資料的流程相關與應用_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

22列聯(lián)表資料的流程相關與應用

列聯(lián)系數(shù)計算群體相關性,也稱為聯(lián)合表相關性,是列聯(lián)表中顯示的特殊類型的相關性。列聯(lián)表中的行和列分別代表兩個分類變量。其中列代表第一個分類變量,行代表第二個分類變量。兩個分類變量可以分別是無序分類變量如二項分類或多項分類變量,也可以是有序分類變量即等級資料。列聯(lián)表中的數(shù)據(jù)一般為頻數(shù)或例數(shù)。進行行列相關的測度有多種指標,這些指標稱為列聯(lián)系數(shù)。用英文大寫字母R表示。它們的應用條件有所不同,其基本計算步驟及方法如下。(1)首先,根據(jù)研究目的及原始資料的特點和性質列出列聯(lián)表,計算χ2值。根據(jù)χ2值大小判斷P值。如果P≤α(一般取α=0.05,或α=0.01),認為行變量與列變量存在相關關系。此時,應該進一步作行列相關的測度。如果P>α,可以認為行變量與列變量無相關關系,不必再作行列相關的測度。(2)根據(jù)資料及列聯(lián)表的特點,選擇適當?shù)男辛邢嚓P的測度指標,計算列聯(lián)系數(shù)R值。(3)根據(jù)列聯(lián)系數(shù)R值的大小,判斷其相關程度及方向。列聯(lián)系數(shù)的取值范圍一般為-1.0~+1.0,有的為0~+1.0。一般的判斷標準如下:弱相關:|R|<0.2低度相關:0.2≤|R|<0.4中度相關:0.4≤|R|<0.7高度相關:|R|≥0.7注意:R值取負值時,為負相關;R值取正值時,為正相關。當R值<0.2時為弱相關,所求指標的實際意義可能不大。應根據(jù)資料的實際情況作出判斷,下結論應較為慎重。22列1.ad、bc和b.b的相關主要用于2×2列聯(lián)表或稱四格表資料的行列相關測度(表1)。其取值范圍為:-1.0~+1.0??梢苑从承辛邢嚓P的程度和方向。公式為:R1=ad-bc√(a+b)(c+d)(a+c)(b+d)(1)R1=ad?bc(a+b)(c+d)(a+c)(b+d)√(1)2×2列聯(lián)表模式見表1。當ad>bc時為正相關,ad<bc時為負相關。當ad≈bc時為零相關,此時,作χ2檢驗,則P>α,無行列相關。[例1]研究人員調查125名白領工人受到性騷擾的情況,數(shù)據(jù)見表2。試分析不同的性別與性騷擾發(fā)生率之間有無相關關系。計算步驟如下:(1)本例:χ2=34.19,P<0.01。行列兩變量存在相關關系。(2)計算Φ系數(shù):R1=ad-bc√(a+b)(c+d)(a+c)(b+d)=10×20-40×55√50×75×65×60=-0.5230R1=ad?bc(a+b)(c+d)(a+c)(b+d)√=10×20?40×5550×75×65×60√=?0.5230(3)判斷:Φ系數(shù)即R1=-0.5230,為中度負相關??梢哉J為不同的性別與受到性騷擾的發(fā)生率之間存在相關關系。就本例的具體情況而言,男性受到的性騷擾發(fā)生率低于女性。注意:由于R1的正負值決定于ad與bc的大小,故正負相關反映的只是男性或女性受到性騷擾的比例的大小。2.ndall、r3的計算應用條件及意義與Φ系數(shù)相同。應注意:計算的R2值和R3值的絕對值與Φ系數(shù)有一定差異,其中R2值稍偏大,R3值與Φ系數(shù)較接近。這兩個指標一般應用較少,可作為參考。Yule和Kendall在1950年提出下式:R2=ad-bcad+bc(2)R2=ad?bcad+bc(2)Ives和Gibbons在1950年提出下式:R3=(a+d)-(b+c)a+b+c+d(3)R3=(a+d)?(b+c)a+b+c+d(3)應用表2數(shù)據(jù)計算,有:R2=10×20-40×5510×20+40×55=-0.8333R3=(10+20)-(40+55)10+20+40+55=-0.52R2=10×20?40×5510×20+40×55=?0.8333R3=(10+20)?(40+55)10+20+40+55=?0.52rc列1.居住地區(qū)家庭對家庭滿意程度的相關分析主要用于r×c列聯(lián)表資料。其中r或c中至少有一個變量的分類數(shù)大于或等于2,而另一個變量的分類數(shù)至少應大于或等于3。即r×c至少應為2×3或3×2。計算公式為:R4=√χ2Ν(q-1)(4)R4=χ2N(q?1)?????√(4)式中:R4為Cramer列聯(lián)系數(shù),χ2為卡方值,N為列聯(lián)表中的總例數(shù)。q為較小的行數(shù)(r)或列數(shù)(c)。如3×4列聯(lián)表,其最小行數(shù)為3,則q=3。3×2列聯(lián)表,其最小列數(shù)為2,則q=2。R4值在0~1.0范圍內,R4接近1.0表示高度行列相關,接近0表示相關很弱或無相關。[例2]研究人員調查230戶家庭對居住地區(qū)的滿意程度。資料見表3。試分析居住地區(qū)與家庭滿意程度之間有無相關關系。計算步驟及方法:(1)本例:χ2=53.178,P<0.01。行列兩變量存在相關關系。(2)計算Cramer列聯(lián)系數(shù)代入數(shù)據(jù),有:R4=√χ2Ν(q-1)=√53.178230(3-1)=0.34R4=χ2N(q?1)?????√=53.178230(3?1)??????√=0.34(3)判斷:R4=0.34,為低度相關??梢哉J為不同居住地區(qū)與家庭滿意程度之間存在相關關系。根據(jù)本資料具體情況,可以認為,居住在農村的家庭滿意程度高于城市。2.其他rc列的連接數(shù)(1)佩斯特列出的連接數(shù)由西格勒1973年和mcnemar196年提出R5=√χ2Ν+χ2(5)(2)20世紀50年代,朱勒和赫克提出了平均距離指數(shù)的連接數(shù)R6=χ2Ν(6)(3)craur列聯(lián)系數(shù)R7=√χ2Ν√(r-1)(c-1)(7)將例2的數(shù)據(jù)代入上述三個公式,有:R5=√53.178230+53.178=0.4333R6=53.178230=0.2312R7=√53.178230√(3-1)(3-1)=0.3400注意:R5,R6,R7這三個列聯(lián)系數(shù)不太常用,對于同一資料的計算結果,與Cramer列聯(lián)系數(shù)或大或小有一定差別。僅作為參考指標或方法。觀察對象的選取1.Goodman-KruskalG系數(shù)當r或c大于2,資料有順序性即等級資料時,也可用Goodman-Kruskal系數(shù)表示兩變量的相關程度,其取值范圍為-1.0~+1.0,判斷其相關程度及方向,與列聯(lián)系數(shù)R值相同。該系數(shù)的樣本指標用G表示,總體指標用γ表示。設有兩個變量X和Y,兩者均為等級資料。X取值為X1,X2,…,Xr,由小到大排序為X1<X2<…<Xr。同樣,Y取值并排序為Y1,Y2,…,Yc。X的取值排秩次為1,2,…,r,Y的取值排秩次為1,2,…,c,并以秩次r和c作為列聯(lián)表的行和列。如表4所示。如果一個觀察對象所取X值的秩次為1,而其Y值的秩次也為1,則放入列聯(lián)表的第1,1格子中,如果一個觀察對象所取X值的秩次為2,其Y值的秩次為3,則放入第2,3格子中,余類推。則N個觀察對象可放入到所有i,j個格子中去。令N對數(shù)據(jù)中,每對數(shù)據(jù)的X和Y值順序一致的個數(shù)為P,順序不一致的個數(shù)為Q,則相關的測度的總體指標為:γ=ΡΡ+Q-QΡ+Q=Ρ-QΡ+Q(8)樣本統(tǒng)計量為:G=Ρ-QΡ+Q(9)為了計算G系數(shù),首先計算出值P和Q值。計算P值的方法和步驟如下。(1)將列聯(lián)表左上角N11格子中的頻數(shù)作為乘數(shù)P1。(2)將列聯(lián)表中不與P1同行同列的右下方的格子中的剩余頻數(shù)加起來稱為合計P1。(3)計算:乘積P1=(乘數(shù)P1)×(合計P1)(4)將與P1同行的下一個格子的頻數(shù)作為乘數(shù)P2,將表中P2右下方的格子頻數(shù)加起來作為合計P2。(5)計算:乘積P2=(乘數(shù)P2)×(合計P2)(6)繼續(xù)步驟(1)到(5)直到各行和各列全部計算結束。(7)將各乘積P1,P2,…相加,即為P值。計算Q值的方法和步驟如下。(1)以列聯(lián)表右上角的第一個格子頻數(shù)作為乘數(shù)Q1。(2)將不與Q1同行同列的左下方的格子中頻數(shù)加起來作為合計Q1。(3)計算:乘積Q1=(乘數(shù)Q1)×(合計Q1)(4)重復步驟(1)到(3)計算Q2、Q3等,直到把各行各列全部計算結束。(5)將各乘積Q1,Q2,…相加則為Q值。[例3]調查某醫(yī)院180件醫(yī)用設備的價格和質量之間的關系。數(shù)據(jù)如表5所示。試用G系數(shù)表示價格和質量之間的相關強度。計算方法及步驟如下。(1)本例:χ2=25.37,P<0.01,行列兩變量之間存在相關關系。(2)計算P值:P1=20(45+19+17+29)=2200P2=13(19+29)=624P3=15(17+29)=690P4=45(29)=1305P=P1+P2+P3+P4=2200+624+690+1305=4819(3)計算Q值Q1=12(15+45+10+17)=1044Q2=13(15+10)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論