衛(wèi)生統(tǒng)計學-09-關(guān)聯(lián)性分析_第1頁
衛(wèi)生統(tǒng)計學-09-關(guān)聯(lián)性分析_第2頁
衛(wèi)生統(tǒng)計學-09-關(guān)聯(lián)性分析_第3頁
衛(wèi)生統(tǒng)計學-09-關(guān)聯(lián)性分析_第4頁
衛(wèi)生統(tǒng)計學-09-關(guān)聯(lián)性分析_第5頁
已閱讀5頁,還剩97頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

9

關(guān)聯(lián)性分析分析目的各種分布的點與區(qū)間的參數(shù)生存率、

表的分布擬合單果變量估計性分析隨機區(qū)組/析因/交叉/重復測量/正交及其它設計的協(xié)方差分析Ho ling

T2檢驗定量:t

/Z檢驗、方差分析、秩和檢驗定性:

檢驗、秩和檢驗、對比性分析多因單果單因多果單因單果簡單線性相關(guān)/回歸、秩相關(guān)、列聯(lián)相關(guān)曲線相關(guān)(曲線擬和)??歸??典型相關(guān)、因子分析、復相關(guān)、偏相關(guān)相關(guān)回歸分析趨勢性分析多因單果單因多果單因單果多果聚積性分析聚類分析、主成分分析、通徑分析多元參考值評分、指數(shù)秩和比、層次模型、Topsis法Meta分析綜合評價分析單果或多果Kappa分析、協(xié)調(diào)系數(shù)協(xié)調(diào)性分析影響因素分析有兩個獨立的隨量:例如:父子的身高(X)、兒子的身高(Y)X1

Y1

、X2

Y2

、

X3

Y3

…、

Xn

Yn特點:它們在客觀上是有一定聯(lián)系的;在觀察時是獨立地去測量的;這兩個隨

量都服從正態(tài)分布;相關(guān)分析和回歸分析是否有聯(lián)系,聯(lián)系的方向、程度如何?相關(guān)或關(guān)聯(lián)定量指示相關(guān)或關(guān)聯(lián)的指標:如相關(guān)系數(shù)定量描述其依存關(guān)系回歸分析依存性(relationship)數(shù)學模型:如Y=f

(x)抽樣研究隨機抽樣保證樣本的合格性保證樣本間相互獨立如何保證一份作關(guān)聯(lián)性研究的樣本合格?關(guān)聯(lián)性分析概述兩個連續(xù)型隨

量的相關(guān)分析兩個分類變量間的關(guān)聯(lián)分析9.1

概述例9-1:下表為一項關(guān)于兒童健康和發(fā)展的研究中10名學齡兒童的身高和體重資料,試對學齡兒童的身高(cm)和體重(kg)進行相關(guān)分析。表9-1 10名學齡兒童的身高和體重1

2

3

4

5

6

7

8

9

10身高

X

149.4 167.6

146.3

170.7

161.5

164.6

155.5 158.5

149.4

152.4體重

Y

30.8

42.6

33.1

44.0

36.3

40.8

32.7

35.4

33.1

31.8圖9-1 10名學齡兒童的身高和體重的散點圖1.散點圖Scatterplot363432303846444240145150155160身高/cm165170175體重/kg(158.5,35.4)(h)(f)(d)(b)(a)(c)(e)(g)ZeroCorrelationPositiveCorrelationNegativeCorrelationPositive

LinearNegative

LinearZeroCorrelationZeroCorrelationCurvilinearrelationship散點圖能直觀地看出兩變量是否存在相關(guān)關(guān)系,故研究兩變量關(guān)系應先繪散點圖,再量化兩者的關(guān)系。(h)(f)(d)(b)(a)

(c)(e)(g)ZeroCorrelationPositiveCorrelationNegativeCorrelationPositive

Linear Negative

LinearZeroCorrelationZeroCorrelationCurvilinearrelationship散點圖能直觀地看出兩變量是否存在相關(guān)關(guān)系。故研究兩變量關(guān)系應先繪散點圖,再量化兩者的關(guān)系。LinearRelationship線性相關(guān)(linearcorrelation):若兩個連續(xù)的隨

量間存

性聯(lián)系,則稱為~,也稱為簡單相關(guān)(simple

correlation)。關(guān)聯(lián)(association):兩個分類變量間的聯(lián)系,則稱為~。兩個基本概念:相關(guān)的種類⑴正相關(guān)(positive

correlation):在圖中若Y有隨X增大而線性上升的趨勢,則稱為正相關(guān)。⑵負相關(guān)(negative

correlation):在圖中若Y有隨X增大而線性下降的趨勢,則稱為負相關(guān)。⑶零相關(guān)(zerocorrelation):在圖中若Y或X不隨另一變量的改變而改變,則稱為零相關(guān)。⑷非線性相關(guān)(

nonlinear

correlation

):散點圖呈曲線形狀,表明變量間呈曲線相關(guān),不是呈線性相關(guān)關(guān)系,也不宜作線性相關(guān)分析。線性相關(guān)系數(shù)

(linearcorrelation

coefficient):是定量描述兩個變量間線性聯(lián)系的強度和相關(guān)方向的統(tǒng)計學指標;又稱Pearson積矩相關(guān)系數(shù)(

Pearson

productmoment

coefficient

),總體相關(guān)系數(shù)用ρ表示表示方法樣本相關(guān)系數(shù)用r

表示2.

關(guān)聯(lián)強度的指標323034424038364446175身高/cm體重/kg⑴Pearson積矩相關(guān)系數(shù)的計算lXX

lYYlXYr

(X

X

)2

(Y

Y

)2(

X

X

)(Y

Y

)即:離均差的乘積YX(

xi

x)(

yi

y)

0XY(

xi

x)(

yi

y)

0XYPearson積矩相關(guān)系數(shù)指示相關(guān)的方向:r=0:X和Y無線性相關(guān)或零相關(guān)(null

correlation)r

>0:正相關(guān)r≠0:則X和Y線性相關(guān)r<0:負相關(guān)r=1或r=-1:完全相關(guān)(罕見)Y(a)YX

X

X(b) (

c

)YPearson積矩相關(guān)系數(shù)

(Pearson

product

moment

coefficient)weak0-11STRONGNegativeSTRONGPositiveCorrelation

Coefficient總體相關(guān)系數(shù)用ρ表示;樣本相關(guān)系數(shù)用r

表示;取值-1<ρ<1;ρ>0為正相關(guān),ρ<0為負相關(guān);ρ

越接近于1,相關(guān)性越強;越接近于0,相關(guān)性越差相關(guān)系數(shù)反應線性相關(guān)性:X3.43.23.02.82.62.42.22.01.8Y7.57.06.56.05.55.04.5X3.43.23.02.82.62.42.22.01.8Y2.22.01.81.61.41.21.0.8.6X4.03.02.01.0Y6543210X5.04.52.5

3.0

3.5

4.01.0

1.5

2.0Y5.04.54.03.53.02.52.01.51.0(1)

r

1(3)r

1(5)r

0(7)r

0X3.43.23.02.82.62.42.22.01.8Y7.57.06.56.05.55.04.5X3.43.23.02.82.62.42.22.01.8Y2.62.42.22.01.81.61.41.21.0.86543210Y4.03.02.01.03.23.02.82.62.42.22.01.8Y.7.6.5.4.3(6)r

0(2)0

r

1正相關(guān)(4)1

r

0負相關(guān)X

X(8)r

0(非線性相關(guān)非線性相關(guān)例9-1:計算學齡兒童的身高和體重的樣本相關(guān)系數(shù)。

0.93(X

X

)(Y

Y

)(X

X

)2

(Y

Y

)2r

答:身高X表9-1

10名學齡兒童的身高和體重1

2

3

4

5

6

7

8

9

10149.4 167.6

146.3

170.7

161.5

164.6

155.5 158.5

149.4

152.4體重

Y

30.8

42.6

33.1

44.0

36.3

40.8

32.7

35.4

33.1

31.83.

Pearson積矩相關(guān)系數(shù)的假設檢驗—

t

檢驗法H1:ρ

0H0:ρ=0

=0.05②計算統(tǒng)計量t

值③確定P

值,作出推斷結(jié)論ν=n-2,查t界值表得t

0.05,v,確定P

值大小。若P≤α,則ρ≠0,說明X

與Y

之間有線性關(guān)系。若P

>α,則ρ=0,說明X與Y之間無線性關(guān)系,但也可能存在其它相關(guān)關(guān)系。St

r

0

r1

r

2n

2rr,

n

2步驟:①建立檢驗假設,確立檢驗水準Pearson積矩相關(guān)系數(shù)的假設檢驗—查表法(假定系獨立、隨機的雙正態(tài)樣本)直接查r

臨界值表(P581)以

度v=n-2查出r

臨界值,比較檢驗統(tǒng)計量r值與r臨界值,后確定P值,作統(tǒng)計推斷。統(tǒng)計量

r

越大,概率

P

越??;統(tǒng)計量

r

越小,概率

P

越大。4.Pearson積矩相關(guān)系數(shù)的區(qū)間估計即:以樣本相關(guān)系數(shù)r以一定的概率估計總體相關(guān)系數(shù)ρ

的置信區(qū)間。步驟:①對相關(guān)系數(shù)r進行反雙曲正切變換或?qū)?shù)變換,得相應的z

值(-∞,+∞),近似地服從正態(tài)分布;③

再將所得上、下限作反變換,即得總體相關(guān)系數(shù)ρ的置信區(qū)間。ρ

tanh

zz

tanh

1

r或:z

1

ln

1

r2

1

r②

按正態(tài)近似原理確定

z

1-

α置信區(qū)間;z

Z

/

2

/

n

3,z

Z

/

2

/

n

311或:ρ

e2

ze2

z線性相關(guān)分析的步驟:繪制散點圖:1.相關(guān)趨勢?2.線性的還是曲線的?3.異常值或強影響點?估計Pearson樣本相關(guān)系數(shù)r對相關(guān)系數(shù)的假設檢驗,即回答在總體中該相關(guān)關(guān)系是否存在的問題參數(shù)估計:以一定的概率估計總體相關(guān)系數(shù)所在的置信區(qū)間t

檢驗法lXX

lYYlXYr

(X

X

)2

(Y

Y

)2(

X

X

)(Y

Y

)9.2

兩個連續(xù)隨量的相關(guān)分析一、Pearson積矩僅適用于兩個變量都是隨 量,并呈現(xiàn)線性趨勢的情形。要求x、y服從聯(lián)合的雙變量正態(tài)分布。注意樣本中的

值,必要時可剔除或進行變量變換。適用條件簡單線性相關(guān)(simple

linar

correlation)例9-1:下表為一項關(guān)于兒童健康和發(fā)展的研究中10名學齡兒童的身高和體重資料,試對學齡兒童的身高(cm)和體重(kg)進行相關(guān)分析。解:(1)繪制散點圖(2)計算相關(guān)系數(shù)r從整體趨勢而言,隨著身高的增加,體重呈增加的趨勢,二者之間可能存性相關(guān)關(guān)系。

0.93ni1nnx

x

2

y

y2i1x

x

y

yi1xylxxlyylr

464442403836343230140150170180160身高/cm體重/kg圖9-1

10名學齡兒童的身高和體重的散點圖(3)假設檢驗:作總體相關(guān)系數(shù)ρ=0的檢驗H0

:

0;H1

:

0

0.05法一:t

檢驗法查t

分布表,t(0.05/2,8)=2.306,故P

<0.05,H1,可認為學齡兒童的身高與體重之間存H0

,接受性相關(guān)。法二:查表法由v

=10-2=8,查r界值表得r(0.05/2,8)=0.632;因統(tǒng)計量r=0.93,故P<0.05,接受H1,相關(guān)有統(tǒng)計學意義,可認為學齡兒童身高與體重之間存

性相關(guān)。=7.10,

10

8

0.913210

21

r

2n

2=

r

0

r

0.93Strr(3)區(qū)間估計:計算95%置信區(qū)間①經(jīng)反雙曲正切變換,得z的95%置信區(qū)間為:(0.91,2.39)。②反變換得相關(guān)系數(shù)ρ的95%置信區(qū)間為:(0.72,0.98)【電腦實現(xiàn)】—SPSS線性相關(guān)分析:1.

數(shù)據(jù)錄入:2.

作散點圖:3.

讀散點圖,作線性趨勢判斷:4.

作線性相關(guān)分析:De

scriptive

Statis

ticsMeanStd.

DeviationN身高157.5908.368310體重36.0604.754010Correlations身高體重身高Pearson

Correlation1.930**Sig.

(2-tailed).000N1010體重Pearson

Correlation.930**1Sig.

(2-tailed).000N1010**.

Correlation

is

signif

icant

at

the

0.01

level5.

結(jié)果及結(jié)果輸出:相關(guān)系數(shù)及假設檢驗為探討學齡兒童身高與體重的關(guān)系,搜集了10名學齡兒童的相關(guān)數(shù)據(jù),經(jīng)分析得以下結(jié)論:10名兒童身高的均值為157.6cm,標準差為8.4cm;體重的均值為36.1kg,標準差為4.8kg;從散點圖可見,其身高與體重有線性趨勢,Pearson相關(guān)系數(shù)r

=0.93(t=7.10,

P<0.001),總體相關(guān)系數(shù)的區(qū)間為(0.72,0.98),結(jié)果表明:學齡兒童的身高和體重之間呈線性正相關(guān)。⑴統(tǒng)計描述X和Y

間是否有聯(lián)系,是線性還是非線性聯(lián)系?正向的還是負向的?聯(lián)系的程度?⑵統(tǒng)計推斷X和Y間的線性聯(lián)系是否有統(tǒng)計學意義?就總體而言,聯(lián)系的程度如何?⑶統(tǒng)計應用結(jié)合專業(yè)知識,如何對X和Y間的聯(lián)系進行解釋?二、Spearman秩相關(guān)適用條件從雙變量正態(tài)分布的資料總體分布類型未知,數(shù)據(jù)本身有不確定值或等級資料秩相關(guān)(rank

correlation)例9-2:10名患者參加家庭計劃的長度(天)和每名患者每天的費用(元)見下表示,問參加的時間長度和費用是否相關(guān)。12345678910時間10651181297092費用51612282262203134表9-2

10名患者參加家庭計劃的時間/d和每名患者每天的費用/元獨立隨機的雙變量資料;目的:

兩變量時間X和費用Y的相關(guān)性

;但該資料的兩變量均

從正態(tài)分布?!景咐馕觥恐认嚓P(guān)獨立隨機的雙變量資料;目的:

兩變量時間X和費用Y的相關(guān)性

;但該資料的兩變量均

從正態(tài)分布?!景咐馕觥縎pearman

等級秩相關(guān)⑵計算秩相關(guān)系數(shù):將兩變量X

和Y

分別從小到大進行編秩:Spearman等級相關(guān)系數(shù)的計算公式:類似與pearson相關(guān)系數(shù),不過在此應用的是數(shù)據(jù)的秩次,而不是原始數(shù)據(jù)本身。sr

22(

)(

即:

0.770)2(

p

p)(

)(

p

p)2

(s上例題解:

r

(3)Spearman秩相關(guān)系數(shù)的假設檢驗:H0

:

s

0;H1

:

s

0

0.05法一:t

檢驗法t(0.05/2,8)=2.306,故P

<0.05,

H0

,接受H1。法二:查表法由v

=10-2=8,查r界值表得r(0.05/2,8)=0.632;因統(tǒng)計量r=-0.707,故P<0.05,接受H1,相關(guān)有統(tǒng)計學意義,可認為參加家庭計劃的時間長度和每天的費用之間有負相關(guān)關(guān)系。=3.410

,

10

8

0.7107210

21

r

2n

2=

r

0

r

0.707Strr【電腦實現(xiàn)】—SPSS線性相關(guān)分析:1.

數(shù)據(jù)錄入:2.

秩轉(zhuǎn)換:3.

作散點圖:4.

讀散點圖,作線性趨勢判斷:5.

作線性相關(guān)分析:Correlations時間費用Spearman's

rho時間Correlation

Coef

f

ic

ientSig.

(2-tailed)N1.000-.770**..0091010費用Correlation

Coef

f

ic

ientSig.

(2-tailed)N-.770**1.000.009.1010**.

Correlation

is

signif

icant

at

the

0.01

level

(2-tailed).3.

結(jié)果及結(jié)果輸出:Nonparametric

Correlations四、線性相關(guān)分析應用中應注意的問題首先繪制散點圖,觀察判斷兩變量間的關(guān)系。只有當兩變量有線性趨勢時,才能進行線性相關(guān)分析。即:根據(jù)變量間可能的關(guān)系,選擇不同的相關(guān)分析方法。發(fā)現(xiàn)和處理異常點2.線性相關(guān)分析要求的兩個重要條件線性相關(guān)分析僅適用于二元正態(tài)分布資料,否則需進行變量變換或采用其它計算方法,如秩相關(guān)。兩個變量都是隨

量,當一個變量的數(shù)值人為選定時不能做相關(guān)分析。例:為研究不同溫度下兔肺動脈張力,人為選定四個溫度,作相關(guān)分析。實驗溫度兔數(shù)(只)肺動脈張力(g)37℃80.501±0.00430℃80.490±0.00424℃80.437±0.02016℃80.336±0.0363.出現(xiàn)離群值(異常值)時,慎用相關(guān)。圖

剔除異常值前后的散點圖舉例:兒子身高與樹身高的故事。4.

相關(guān)關(guān)系不一定是因果關(guān)系。兒子身高樹身高時間間接聯(lián)系注意:1)不要抽任意兩個變量放在一起算相關(guān)系數(shù)——在專業(yè)上,只有兩者存在直接聯(lián)系的變量可能存在聯(lián)系。2)簡單相關(guān)=直接聯(lián)系-間接聯(lián)系。對相關(guān)的解釋一定要結(jié)合專業(yè)知識,切不可把任意兩個變量拉在一起,盲目下結(jié)論!!!(a)(b)5.分層資料盲目合并容易引起假象。6.“相關(guān)分析”的結(jié)果解釋:如果散點圖可見兩隨

量有線性相關(guān)趨勢,且得到的相關(guān)系數(shù)r

經(jīng)假設檢驗后也得出

H0,即否定總體相關(guān)系數(shù)ρ=0的假設,則:統(tǒng)計結(jié)論:可推斷兩變量呈“線性相關(guān)”的。專業(yè)結(jié)論:不能因此推斷兩變量在生物學上有任何聯(lián)系,更不能因為呈因果關(guān)系。(2)

如果兩變量經(jīng)線性相關(guān)分析,及假設檢驗得到

“不能總體相關(guān)系數(shù)ρ=0”的結(jié)論時,不要輕易下“兩變量無關(guān)”的結(jié)論。2)還要觀察散點圖,看兩變量1)應首先看樣本含量是否足夠。即:檢驗功效是否足夠大。曲線相關(guān)?如果不能進行深入分析,則應下結(jié)論:“根據(jù)目前數(shù)據(jù)尚不能認為兩變量呈線性相關(guān)”是否應進行分層分析?9.2

兩個分類變量間的關(guān)聯(lián)分析對兩個反應屬性的分類變量,若有一份隨機樣本,可作交叉分類的頻數(shù)表,利用關(guān)于獨立性的

2檢驗和列聯(lián)系數(shù)表示這兩個變量之間的關(guān)聯(lián)性(association)。一、交叉分類2×2列聯(lián)表的關(guān)聯(lián)分析例9-3為觀察行為類型與冠心病的關(guān)系,某研究組在當?shù)仉S機了3154名居民,對象按行為類型分為A型和B型。對每個分別觀察是否為冠心病患者和行為類型兩種屬性,試分析兩種屬性的關(guān)聯(lián)性。行為類型(屬性類型A(1類型B(2是關(guān)于兩個變量的一份隨機樣本?;蛘f:一份隨機樣本,同時按兩種屬性分類,形成一個2×2交叉分類表,也稱的2×2列聯(lián)表。目的:冠心病的有無和行為方式兩個變量之間的相關(guān)性,即

兩個屬性概率分布的關(guān)系。如果一種屬性的概率分布與另一種屬性的概率分布無關(guān),則稱這兩種屬性相互獨立(independence),否則稱這兩種屬性之間存在關(guān)聯(lián)性(association)。關(guān)于隨

量獨立性的定理:設X、Y為二維離散型隨

量,則X、Y相互獨立的充要條件是:對于任何i、j=1,2,…,有

X

Xi

,Y

Yj

X

Xi

Y

Yj

i

j即:ij統(tǒng)計思想:從概率角度出發(fā),獨立是指交叉分類表的每一個格子中同時具有兩種屬性的聯(lián)合概率等于相應屬性

的邊計概率的乘積。即:

ij

ri

ci故,獨立性檢驗實際上就是

ri

ci

是否成立。

ij(1)欲檢驗的假設為:H0:屬性A

和屬性B

互相獨立;H1:屬性A

和屬性B

互相關(guān)聯(lián)。

=0.05(2)計算統(tǒng)計量

2

值獨立性檢驗就是

ij

ri

ci從

2

分布,仍采用

2

檢驗成立與否,H0

成立時,統(tǒng)計量服理論公式:公式:v=k-1-s

=(行數(shù)-1)×(列數(shù)-1)

=1(3)確定P

值,作出推斷結(jié)論A

T

2

2

ij

ij

i,

jTijnn

n

n

ri

ci

n

ijijT

n

nri

nci

nri

nci(a

b)(c

d

)(a

c)(b

d

)(ad

bc)2

n

2

2.計算關(guān)聯(lián)系數(shù)(association

coefficient,

r)以表示關(guān)聯(lián)的程度:r

2

2

n對2×2交叉列聯(lián)表而言,r

介于0和

0.5

之間,其數(shù)值越大,說明兩變量的關(guān)聯(lián)程度越高。試區(qū)別:關(guān)于交叉分類資料的獨立性檢驗比較兩獨立樣本率的假設檢驗必須注意的是:這兩類問題的研究目的、設計方案、數(shù)據(jù)結(jié)構(gòu)以及最終對結(jié)果的解釋都是不同的。答:

2ν=(2-1)×準上,

H0,病 在著關(guān)(4)計算關(guān)178

1486

79

14112

3154

39.901589

1565

257

2897

239.90

n

39.90

3154

0.112

2

2r

【電腦實現(xiàn)】—SPSS關(guān)聯(lián)性分析:1.

數(shù)據(jù)錄入:2.:3.關(guān)聯(lián)性分析的步驟:Nominalby

Nominal

CN

of

Valid

CasesNot

assuming

the

nuUsing

the

asymptoticLikelihood

RatioFisher's

Exac

tTestLi r

by-LinearA

sociationN

of

Valid

CasesComputed

only

fo0

cells

(.0%)hav52.4.

結(jié)果及結(jié)果輸出:冠心病有沒有行為

A類型Total【結(jié)果報告】行為類型A

B

為探討冠心病患病與行為類型之間的關(guān)聯(lián),對3154例居民進行了分析,結(jié)果如下表示:以Pearson

2獨立性檢驗,

2=39.900,P<0.001,

r

=0.112。結(jié)果表明,冠心病患病與行為類型間存在著一定的聯(lián)系。二、

2×2配對資料的關(guān)聯(lián)分析例9-4

研究者對103例患者進行了影像學檢驗(A)和生化檢驗(B),數(shù)據(jù)如下,試分析兩種檢驗結(jié)果的關(guān)聯(lián)性。表9-5兩種檢查結(jié)果的比較B

方法A

方法B(+)B(-)合計A(+)501565A(-)83038合計5845103【資料特點】是關(guān)于一份隨機樣本,同時按兩種屬性分類是2×2配對資料。目的:了解兩種方法的結(jié)果之間是否有關(guān)聯(lián)。方法:兩種屬性的關(guān)聯(lián)性分析。2(a

b)(c

d

)(a

c)(b

d

)(ad

bc)2

n

檢驗統(tǒng)計量:H0:A、B

兩法的檢驗結(jié)果相互獨立,即沒有關(guān)聯(lián);H1:A、B

兩法的檢驗結(jié)果有關(guān)聯(lián)。

=0.05(2)計算統(tǒng)計量

2

值答:(1)建立檢驗假設,確立檢驗水準(3)確定P

值,作出推斷結(jié)論ν=

1,查

χ2

=3.84,P<0.05。在α=0.05

水準上,0.05(2)H0,接受H1,關(guān)聯(lián)有統(tǒng)計學意義,說明A、B

兩種方法的檢測結(jié)果之間存在58

45

65

3850

30

1582

103

30.43

230.43

n

30.43

103

0.477著關(guān)聯(lián)性。(4)計算關(guān)聯(lián)系數(shù)

r

值:

r

2

2三、多分類資料的關(guān)聯(lián)分析例9-5

有人在某地隨機抽取2500名居民,記錄其民族與血型,資料見下表,試問民族和血型是否有關(guān)?【資料特點】多組資料的關(guān)聯(lián)設計:一份樣本,按兩種屬叉分類,統(tǒng)計頻數(shù)。目的:了解兩種屬性間是否有關(guān)聯(lián)。方法:多組資料—兩種屬性的關(guān)聯(lián)性分析。:檢驗統(tǒng)計量R

ci j

ij

n

m

i1

j

1A221

n多分類資料的關(guān)聯(lián)系數(shù):r

2

2

n對多分類資料列聯(lián)表而言,r

介于0和之間,其數(shù)值越大,說明兩變量的關(guān)聯(lián)程度越高。1min(

R,C)1答:(1)建立檢驗假設,確立檢驗水準H0:民族和血型無關(guān)聯(lián);

H1:民族和血型有關(guān)聯(lián)。

=0.05(2)計算統(tǒng)計量

2

值(3)確定P

值,作出推斷結(jié)論ν=

(3-1)(4-1)=6,查

χ2

=15.59,P<0.05。在α=0.05

水準0.05(6)上,

H0,接受

H1,關(guān)聯(lián)有統(tǒng)計學意義,說明血型與民族間存在著關(guān)聯(lián)性。(4)計算關(guān)聯(lián)系數(shù)r

值:r

332.97

n

332.97

2500

0.343

2

22024902

44022

...

2841.82

9501100

9101100

160470

25001R

ci1

j

1

nimj

n

ij

A2【電腦實現(xiàn)】—SPSS關(guān)聯(lián)性分析:1.

數(shù)據(jù)錄入:2.:3.關(guān)聯(lián)性分析:4.

結(jié)果及結(jié)果輸出:四、偏相關(guān)在研究兩個事物或現(xiàn)象之間的關(guān)系時,要充分考慮其它事物和現(xiàn)象對兩者之間的影響;偏相關(guān)的優(yōu)勢就是在排除混雜因素的作用后,再評價兩個事物或現(xiàn)象之間的聯(lián)系。的相關(guān)性,但考慮家庭例:

消費者信心指數(shù)值和月收入對其有一定的影響。結(jié)果輸出:在控制家庭收入的作用后,消費者總信息指數(shù)和年齡之間Pearson相關(guān)系數(shù)r=-0.216,經(jīng)檢驗有統(tǒng)計學意義(P=0.009),可以認為二者之間存在負相關(guān)關(guān)系。小

結(jié)相關(guān)是測量變量間的相互聯(lián)系或關(guān)聯(lián)的指標,要求變量資料滿足獨立隨機性。性相關(guān)分析時必須先作散點圖,發(fā)現(xiàn)有線性趨勢后,再作進一步的分析。依據(jù)不同資料的特點分別采用Pearson相關(guān)分析,

Spearman秩相關(guān)分析,以及分類資料的

2檢驗的關(guān)聯(lián)分析方法。相關(guān)和關(guān)聯(lián)是兩變量之間在數(shù)量上的關(guān)聯(lián),不能據(jù)此推論兩變量有生物學的聯(lián)系,或有因果關(guān)系。相關(guān)有可能只是伴隨關(guān)系。兩樣本資料的關(guān)聯(lián)性分析數(shù)據(jù)類型定量資料定性資料雙變量正

非雙變量態(tài)分布

正態(tài)分布雙變量一定量一有序分類變量資料交叉分類2×2

R×C2×2

配對

表兩有序分類一致性檢驗Pearson積矩相關(guān)Pearson積矩相關(guān)系數(shù)rSpearman秩相關(guān)Spearman秩相關(guān)系數(shù)rsф系數(shù)CramerV系數(shù)Pearson列聯(lián)系數(shù)列聯(lián)相關(guān)Gamma系數(shù)Gamma法Kappa一致性檢驗Kappa系數(shù)12SPSS中“相關(guān)”功能:1.

Pearson積矩相關(guān)分析適用條件:兩變量呈獨立、隨機及正態(tài)分布的資料。注意事項:一定要先繪制散點圖,看出兩變量間有線性趨勢時,再計算積差相關(guān)系數(shù)。不可用相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論