第十一章相關(guān)分析課件_第1頁
第十一章相關(guān)分析課件_第2頁
第十一章相關(guān)分析課件_第3頁
第十一章相關(guān)分析課件_第4頁
第十一章相關(guān)分析課件_第5頁
已閱讀5頁,還剩119頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第十一章相關(guān)分析第十一章相關(guān)分析一、相關(guān)概述1、相關(guān)的概念

兩個(gè)變量之間不精確、不穩(wěn)定的變化關(guān)系,稱為相關(guān)關(guān)系。兩個(gè)變量之間的變化關(guān)系,既表現(xiàn)在變化方向上,又表現(xiàn)在密切程度上。一、相關(guān)概述1、相關(guān)的概念兩個(gè)變量之間的變化方向有:正相關(guān):兩個(gè)變量的變化方向相同。負(fù)相關(guān):兩個(gè)變量的變化方向相反。零相關(guān):兩個(gè)變量的變化方向無一定規(guī)律。兩個(gè)變量之間的變化方向有:正相關(guān):兩個(gè)變量的變化方向相同。從關(guān)系密切程度來看,兩個(gè)變量的變化程度可大致分為

完全相關(guān):兩個(gè)變量的變化程度完全一致。強(qiáng)相關(guān):兩個(gè)變量變化的一致性比較強(qiáng)。中等相關(guān):兩個(gè)變量變化的一致程度中等。弱相關(guān):兩個(gè)變量變化的一致性比較差。完全不相關(guān):兩個(gè)變量變化程度沒有一致性。從關(guān)系密切程度來看,兩個(gè)變量的變化程度可大致分為完全相關(guān):2.相關(guān)系數(shù)用來描述兩個(gè)變量相互之間變化方向及密切程度的統(tǒng)計(jì)指標(biāo)稱為相關(guān)系數(shù),一般樣本的相關(guān)系數(shù)用r表示,總體的相關(guān)系數(shù)用ρ表示。相關(guān)系數(shù)的取值:-1≤r≤+10≤∣r∣≤1相關(guān)系數(shù)的符號:“+”表示正相關(guān),“-”表示負(fù)相關(guān)。2.相關(guān)系數(shù)用來描述兩個(gè)變量相互之間變化方向及密切程度的統(tǒng)計(jì)3、相關(guān)系數(shù)的性質(zhì)相關(guān)系數(shù)不是由相等單位度量而來的,因此只能比較大小,不能做任何加、減、乘、除運(yùn)算。3、相關(guān)系數(shù)的性質(zhì)相關(guān)系數(shù)不是由相等單位度量而來的,因此只能二、積差相關(guān)1、積差相關(guān)及其適用條件積差相關(guān)是英國統(tǒng)計(jì)學(xué)家皮爾遜(pearson)于20世紀(jì)初提出的一種計(jì)算相關(guān)的方法,因而被稱為皮爾遜積差相關(guān),也稱為積矩相關(guān)(productmomentcorrelation)。二、積差相關(guān)1、積差相關(guān)及其適用條件積差相關(guān)適用于:兩個(gè)變量都是連續(xù)數(shù)據(jù);兩變量總體都為正態(tài)分布;兩變量之間為線性關(guān)系。成對數(shù)據(jù),樣本容量要大。積差相關(guān)適用于:兩個(gè)變量都是連續(xù)數(shù)據(jù);兩變量總體都為正態(tài)分布2、積差相關(guān)條件的判斷方法連續(xù)變量:根據(jù)得到數(shù)據(jù)的方式判斷,測量數(shù)據(jù)。正態(tài)分布一般情況下,正常人群的身高、體重、智力水平、心理與教育測驗(yàn)的結(jié)果,都可按總體正態(tài)分布對待;如果要求比較高,則需要對數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn)。線性關(guān)系根據(jù)相關(guān)散布圖可判斷兩個(gè)變量之間是否線性關(guān)系。2、積差相關(guān)條件的判斷方法連續(xù)變量:圖18-1正相關(guān)圖18-2負(fù)相關(guān)散點(diǎn)的分布形狀為橢圓形,可認(rèn)為兩變量之間具有線性關(guān)系。圖18-1正相關(guān)圖18-2負(fù)相關(guān)散點(diǎn)的分布形狀為橢圓形圖18-4完全負(fù)相關(guān)圖18-3完全正相關(guān)當(dāng)所有的點(diǎn)都分布在一條直線上時(shí),兩變量之間的關(guān)系為完全相關(guān)。圖18-4完全負(fù)相關(guān)圖18-3完全正相關(guān)當(dāng)所有的點(diǎn)都兩個(gè)變量之間是否相關(guān),要有充分的理論依據(jù),并排除共變因素的影響。圖18-5零相關(guān)散點(diǎn)的分布沒有明顯集中在某一方向的趨勢,形成圓形區(qū)域時(shí),兩變量之間的關(guān)系為零相關(guān)。兩個(gè)變量之間是否相關(guān),要有充分的理論依據(jù),并排除共變因素的影3、積差相關(guān)系數(shù)的計(jì)算公式積差相關(guān)系數(shù)的定義公式協(xié)方差3、積差相關(guān)系數(shù)的計(jì)算公式積差相關(guān)系數(shù)的定義公式積差相關(guān)系數(shù)為(18.1

)公式中:為變量X的平均數(shù),為變量Y的平均數(shù),為變量X的標(biāo)準(zhǔn)差,為變量Y的標(biāo)準(zhǔn)差,

n為數(shù)據(jù)的對數(shù)或計(jì)算得到了相關(guān)系數(shù),還不能確定這兩個(gè)變量一定具有相關(guān)關(guān)系,需要對相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)之后,才能做出判斷。積差相關(guān)系數(shù)為(18.1)公式中:為變量X的表18-110個(gè)學(xué)生初一與初二數(shù)學(xué)成績積差相關(guān)系數(shù)計(jì)算表序號XY1747633.711.1913.692717502.7007.29372711-1.3-1.311.6946870-3-2.36.995.295767653.718.52513.696737926.713.4444.8976765-4-7.329.21653.2987077-14.7-4.7122.0995462-6-10.361.836106.091074723-0.3-0.990.09合計(jì)710723134110268.10表18-110個(gè)學(xué)生初一與初二數(shù)學(xué)成績積差相關(guān)系數(shù)計(jì)算表計(jì)算先計(jì)算變量X和Y的標(biāo)準(zhǔn)差:再將數(shù)據(jù)代入公式計(jì)算積差相關(guān)系數(shù):計(jì)算先計(jì)算變量X和Y的標(biāo)準(zhǔn)差:再將數(shù)據(jù)代入公式計(jì)積差相關(guān)系數(shù)的原始數(shù)據(jù)計(jì)算公式(18.2a

)(18.2b

)積差相關(guān)系數(shù)的原始數(shù)據(jù)計(jì)算公式(18.2a)(18.2表18-210個(gè)學(xué)生初一與初二數(shù)學(xué)成績積差相關(guān)系數(shù)計(jì)算表序號XYXY174765476577656242717580415626532537271518450415112468704624490047605767657765776577667379532962415767767654489422543558707749005929539095462422538444030107472547651845328合計(jì)710723505205254151467表18-210個(gè)學(xué)生初一與初二數(shù)學(xué)成績積差相關(guān)系數(shù)計(jì)算表代入公式計(jì)算:兩種公式計(jì)算結(jié)果相同,但以原始數(shù)據(jù)的計(jì)算公式更為簡捷和準(zhǔn)確。代入公式計(jì)算:兩種公式計(jì)算結(jié)果相同,但以原始數(shù)據(jù)的計(jì)算公式更三.斯皮爾曼等級相關(guān)等級相關(guān)(rankcorrelation)是指以等級次序排列或以等級次序表示的變量之間的相關(guān)。主要包括斯皮爾曼(spearman)二列等級相關(guān)和肯德爾和諧系數(shù)(thekandallcoefficientofconcordance)多列等級相關(guān)。

三.斯皮爾曼等級相關(guān)等級相關(guān)(rankcorrelatio1、斯皮爾曼等級相關(guān)的概念及適用條件斯皮爾曼等級相關(guān)是等級相關(guān)的一種。它適用于兩個(gè)以等級次序表示的變量,并不要求兩個(gè)變量總體呈正態(tài)分布,也不要求樣本的容量必須大于30。當(dāng)連續(xù)數(shù)據(jù)不能滿足計(jì)算積差相關(guān)的條件時(shí),可以轉(zhuǎn)換成等級數(shù)據(jù)從而計(jì)算斯皮爾曼等級相關(guān)系數(shù)。1、斯皮爾曼等級相關(guān)的概念及適用條件斯皮爾曼等級相關(guān)是等級相2、斯皮爾曼等級相關(guān)系數(shù)的計(jì)算斯皮爾曼等級相關(guān)系數(shù)表示為rR,其計(jì)算公式為:(18.3

)公式中:RX為變量X的等級數(shù),

RY為變量Y的等級數(shù),

D為兩變量的等級數(shù)之差,即D=RX-RYn為樣本的容量2、斯皮爾曼等級相關(guān)系數(shù)的計(jì)算斯皮爾曼等級相關(guān)系數(shù)表示為rR表18-310個(gè)高三學(xué)生學(xué)習(xí)潛在能力測驗(yàn)(X)與自學(xué)能力測驗(yàn)(Y)成績

斯皮爾曼等級相關(guān)系數(shù)計(jì)算表序號XYRXRYD=RX-RY190212-1128412111376434-11475545-11573656-11671767-11769878-118683862496610910-111064910911合計(jì)13表18-310個(gè)高三學(xué)生學(xué)習(xí)潛在能力測驗(yàn)(X)與自學(xué)能力如果有相同等級時(shí),可用它們所占等級位置的平均數(shù)作為它們的等級。如果有相同等級時(shí),可用它們所占等級位置的平均數(shù)作為它們的等級表18-410個(gè)學(xué)生初一與初二數(shù)學(xué)成績斯皮爾曼等級相關(guān)系數(shù)計(jì)算表序號XYRXRYD=RX-RY174762.53.5-1.012717565113727157-244687088005767613.5-2.56.256737941397676599008707772525954621010001074722.56-3.512.25合計(jì)71072358.5表18-410個(gè)學(xué)生初一與初二數(shù)學(xué)成績斯皮爾曼等級相關(guān)系計(jì)算思考:同一組數(shù)據(jù)的積差相關(guān)系數(shù)和等級相關(guān)系數(shù)為什么會(huì)有差別?哪一個(gè)更準(zhǔn)確?計(jì)算思考:同一組數(shù)據(jù)的積差相關(guān)系數(shù)和等級相關(guān)系數(shù)為什么會(huì)有四.肯德爾和諧系數(shù)肯德爾等級相關(guān)方法有許多種,肯德爾和諧系數(shù)是其中一種??系聽柡椭C系數(shù)常以rW表示,適用于多列等級變量的資料??系聽柡椭C系數(shù)可以反映多個(gè)等級變量變化的一致性。四.肯德爾和諧系數(shù)肯德爾等級相關(guān)方法有許多種,肯德爾和諧系數(shù)肯德爾和諧系數(shù)的計(jì)算公式公式中:rw表示肯德爾和諧系數(shù)

K表示等級評定者的數(shù)目,即變量數(shù)

n為被等級評定的對象的數(shù)目

R為被評定對象獲得的K個(gè)等級之和SSR為R的離差平方和,即(18.4

)肯德爾和諧系數(shù)的計(jì)算公式公式中:rw表示肯德爾和諧系數(shù)(1n=7評價(jià)者K=10Ri12345678910紅3523443243331089橙6676757766633969黃5457664454502500綠111222211215225青4344335635401600藍(lán)223111132117289紫7765576577623844Σ28013516例表18-5肯德爾和諧系數(shù)計(jì)算表n=7評價(jià)者K=10Ri12345678910紅35234學(xué)生n=6評價(jià)者K=41234134212431332134465655124265656例:4位教師對6位學(xué)生作文競賽的名次排列次序如表18-6。問4位教師評定的一致性程度如何?表18-64位教師對6位學(xué)生作文競賽的名次排列學(xué)生評價(jià)者K=41234134212431332134學(xué)生n=6評價(jià)者K=4Ri12341342110100243131112132134101004656522484512429816565622484Σ841370表18-74位教師對6位學(xué)生作文競賽名次排列的肯德爾和諧系數(shù)計(jì)算表學(xué)生評價(jià)者K=4Ri1234134211010024313有相同等級時(shí),需要用肯德爾和諧系數(shù)的修正公式計(jì)算rW系數(shù)。(18.5

)公式中:m為相同等級的數(shù)目。有相同等級時(shí),需要用肯德爾和諧系數(shù)的修正公式計(jì)算rW系數(shù)。(五、質(zhì)與量的相關(guān)

一個(gè)變量為性質(zhì)變量,另一個(gè)變量為數(shù)量變量,這樣的兩個(gè)變量之間的相關(guān)稱為質(zhì)與量的相關(guān)。五、質(zhì)與量的相關(guān)一個(gè)變量為性質(zhì)變量,另一個(gè)變量為數(shù)量變量,1、點(diǎn)二列相關(guān)適用條件一個(gè)變量為正態(tài)、連續(xù)變量,另一個(gè)變量為真正的二分名義變量,這兩個(gè)變量之間的相關(guān),稱為點(diǎn)二列相關(guān)(point-biserialcorrelation)。有時(shí)一個(gè)變量并非真正的二分變量,而是雙峰分布的變量,也可以用點(diǎn)二列相關(guān)來表示。1、點(diǎn)二列相關(guān)適用條件點(diǎn)二列相關(guān)系數(shù)的計(jì)算公式為

或(19.1)(19.2)公式中:是與二分名義變量的一個(gè)值對應(yīng)的連續(xù)變量的平均數(shù)是與二分名義變量的另一個(gè)值對應(yīng)的連續(xù)變量的平均數(shù)

p和q分別是二分名義變量的兩個(gè)值各自所占的比例,p+q=1St是連續(xù)變量的標(biāo)準(zhǔn)差點(diǎn)二列相關(guān)系數(shù)的計(jì)算公式為或(19.1)(19.2表19-1五歲幼兒投擲砂袋成績例19-1:18個(gè)五歲幼兒擲砂袋(150克),成績?nèi)绫?9-1,問性別與投擲成績的相關(guān)情況如何?序號成績性別序號成績性別14.01103.4223.62114.9133.52123.7243.22133.3254.41144.7164.81154.8173.82163.1285.21172.9294.71183.42表19-1五歲幼兒投擲砂袋成績例19-1:18個(gè)五歲表19-2五歲幼兒性別與投擲砂袋點(diǎn)二列相關(guān)計(jì)算表序號成績性別序號成績性別14.01133.3223.62144.7133.52154.8143.22163.1254.41172.9264.81183.4273.82分?jǐn)?shù)總和71.437.533.985.21人數(shù)總和1881094.71人數(shù)比率0.4440.556103.42平均數(shù)3.9674.6883.390114.91標(biāo)準(zhǔn)差0.7090.3330.262123.72表19-2五歲幼兒性別與投擲砂袋點(diǎn)二列相關(guān)計(jì)算表序號成績代入公式計(jì)算或者代入公式計(jì)算或者2、二列相關(guān)兩個(gè)變量都是正態(tài)連續(xù)變量,其中一個(gè)變量被人為地劃分成二分變量,表示這兩個(gè)變量之間的相關(guān),稱為二列相關(guān)(biserailcorrelation)。將連續(xù)變量人為劃分為二分變量時(shí),應(yīng)注意盡量使分界點(diǎn)接近平均數(shù)。2、二列相關(guān)兩個(gè)變量都是正態(tài)連續(xù)變量,其中一個(gè)變量被人為地劃二列相關(guān)系數(shù)的的計(jì)算公式公式中,Y為標(biāo)準(zhǔn)正態(tài)分布曲線中與P值對應(yīng)的縱線高度其余符號與點(diǎn)二列相關(guān)計(jì)算公式中含義相同(19.3)(19.4)二列相關(guān)系數(shù)的的計(jì)算公式公式中,Y為標(biāo)準(zhǔn)正態(tài)分布曲線中與P值例19-2:表8-3是10名學(xué)生在一次測驗(yàn)中的卷面總分和一道問答題的得分。該問答題回答是否合格與卷面總分的關(guān)系如何?(該問答題滿分為10分,規(guī)定達(dá)到6分為合格)表19-310名學(xué)生某題得分與卷面總分學(xué)生ABCDEFGHIJ卷面總分75577365675663616567問答題分7674744476例19-2:表8-3是10名學(xué)生在一次測驗(yàn)中的卷面總分和一道計(jì)算:

SX=6.12,p=0.6,q=0.4,查正態(tài)分布表,當(dāng)

p=0.60時(shí),Y=0.38667計(jì)算:SX=6.12,p=0.6,q=0.4,查正3.多系列相關(guān)(選學(xué))

當(dāng)兩個(gè)變量都是正態(tài)連續(xù)變量,其中一個(gè)變量按不同質(zhì)被人為地分成多種類別(兩類以上)的正態(tài)名義變量。表示正態(tài)連續(xù)變量與多類正態(tài)名義變量之間的相關(guān),稱為多系列相關(guān)(multiserialscorrelation)。3.多系列相關(guān)(選學(xué))當(dāng)兩個(gè)變量都是正態(tài)連續(xù)變量,其中一個(gè)六、品質(zhì)相關(guān)兩個(gè)變量都是按性質(zhì)劃分成幾種類別,表示這兩個(gè)變量之間的相關(guān)稱為品質(zhì)相關(guān)。品質(zhì)相關(guān)處理的一般是計(jì)數(shù)數(shù)據(jù)而不是連續(xù)數(shù)據(jù),主要用于雙向表或稱為列聯(lián)表(R×C表)。品質(zhì)相關(guān)的方法有多種,最常用的是Φ相關(guān)和列聯(lián)相關(guān)。六、品質(zhì)相關(guān)兩個(gè)變量都是按性質(zhì)劃分成幾種類別,表示這兩個(gè)變量1、Φ相關(guān)當(dāng)兩個(gè)變量都是二分名義變量,這兩個(gè)變量之間的關(guān)系,可以用Φ相關(guān)來討論(兩個(gè)變量都是人為二分變量的情況除外)。Φ相關(guān)系數(shù)用

表示。當(dāng)兩個(gè)變量都各分為兩類時(shí),數(shù)據(jù)在統(tǒng)計(jì)表中占有四個(gè)單元格,因此這類統(tǒng)計(jì)表又稱為四格表。Φ相關(guān)就適用于四格表。1、Φ相關(guān)當(dāng)兩個(gè)變量都是二分名義變量,這兩個(gè)變量之間的關(guān)系,四格表的一般形式變量XX1X2合計(jì)變量YY1aba+bY2cdc+d合計(jì)a+cb+dn=a+b+c+d四格表的一般形式變量XX1X2合計(jì)變量Y1aba+bY2Φ相關(guān)系數(shù)計(jì)算公式(19.5)aba+bcdc+da+cb+d巧記公式:Φ相關(guān)系數(shù)計(jì)算公式(19.5)aba+bcdc+da+cP144例5-14:關(guān)于吸煙與患癌癥之間關(guān)系數(shù)據(jù)的四格表癌癥(0)其他(1)吸煙者(0)64非吸煙者(1)37P144例5-14:關(guān)于吸煙與患癌癥之間關(guān)系數(shù)據(jù)的四格表癌從高中入學(xué)考試的英語試卷中抽取100份,并將成績分為中等以上和中等以下。其中男生中等以上的有15人,中等以下的有31人;女生中等以上的有36人,中等以下的有18人。問英語測驗(yàn)成績與性別是否存在相關(guān)?從高中入學(xué)考試的英語試卷中抽取100份,并將成績分為中等以上列表:中等以上中等以下男生153146女生3618543618100怎樣解釋這一結(jié)果?怎樣理解負(fù)相關(guān)?計(jì)算:列表:中等以上中等以下男生153146女生3618543612、列聯(lián)相關(guān)當(dāng)兩個(gè)變量均被分成兩個(gè)以上類別,或其中一個(gè)變量被分成兩個(gè)以上類別,表示這兩個(gè)變量之間的相關(guān),稱為列聯(lián)相關(guān)。列聯(lián)相關(guān)系數(shù)是由R×C的列聯(lián)表求得的,因此稱為列聯(lián)相關(guān)。最常用的是皮爾遜定義的列聯(lián)相關(guān)系數(shù)C。2、列聯(lián)相關(guān)當(dāng)兩個(gè)變量均被分成兩個(gè)以上類別,或其中一個(gè)變量被列聯(lián)相關(guān)系數(shù)的計(jì)算公式中:C為列聯(lián)相關(guān)系數(shù)值是經(jīng)檢驗(yàn)計(jì)算的結(jié)果

n是樣本的容量(19.6)列聯(lián)相關(guān)系數(shù)的計(jì)算公式中:C為列聯(lián)相關(guān)系數(shù)(19.6)僅僅根據(jù)計(jì)算得到的相關(guān)系數(shù)還不足以確定變量之間是否存在相關(guān)。只有通過對相關(guān)系數(shù)顯著性的檢驗(yàn),才能確定相關(guān)關(guān)系是否存在。對相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)包括三種情況(即三種零假設(shè)):一是ρ=0;二是ρ=ρ0;三是ρ1=ρ2。本講主要介紹前兩種情況。七.相關(guān)系數(shù)的顯著性檢驗(yàn)僅僅根據(jù)計(jì)算得到的相關(guān)系數(shù)還不足以確定變量之間是否存在相關(guān)。1.積差相關(guān)系數(shù)的顯著性檢驗(yàn)相關(guān)系數(shù)的顯著性檢驗(yàn)即樣本相關(guān)系數(shù)與總體相關(guān)系數(shù)的差異檢驗(yàn)。包括兩種情況:ρ=0和ρ=ρ0對ρ=0的檢驗(yàn)是確認(rèn)相關(guān)系數(shù)是否顯著;對ρ=ρ0的檢驗(yàn)是確認(rèn)樣本所代表的總體的相關(guān)系數(shù)是否為ρ0。1.積差相關(guān)系數(shù)的顯著性檢驗(yàn)相關(guān)系數(shù)的顯著性檢驗(yàn)即樣本相關(guān)系根據(jù)樣本相關(guān)系數(shù)r

對總體相關(guān)系數(shù)ρ進(jìn)行推斷,是以r的抽樣分布正態(tài)性為前提的,只有當(dāng)總體相關(guān)系數(shù)為零,或者接近于零,樣本容量n相當(dāng)大(n>50或n>30)時(shí),r的抽樣分布才接近于正態(tài)分布。根據(jù)樣本相關(guān)系數(shù)r對總體相關(guān)系數(shù)ρ進(jìn)行推斷,是以r的⑴.H0:ρ=0條件下,

相關(guān)系數(shù)的顯著性檢驗(yàn)檢驗(yàn)形式:雙側(cè)檢驗(yàn)統(tǒng)計(jì)量為t,檢驗(yàn)計(jì)算公式為:(19.4)⑴.H0:ρ=0條件下,

相關(guān)系數(shù)的顯著性檢驗(yàn)檢驗(yàn)形式:雙側(cè)例:經(jīng)計(jì)算,10個(gè)學(xué)生初一和初二數(shù)學(xué)成績的相關(guān)系數(shù)為0.780,能否說學(xué)生初一和初二的數(shù)學(xué)成績之間存在顯著相關(guān)?解:提出假設(shè)H0:ρ=0,H1:ρ≠0選擇檢驗(yàn)統(tǒng)計(jì)量并計(jì)算對積差相關(guān)系數(shù)進(jìn)行ρ=0的顯著性檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量為t例:經(jīng)計(jì)算,10個(gè)學(xué)生初一和初二數(shù)學(xué)成績的相關(guān)系數(shù)為0.78計(jì)算統(tǒng)計(jì)決斷根據(jù)df=10-2=8,查t值表P⑵,得t(8)0.01=3.355,|t|>t(8)0.01,則P<0.01,差異極其顯著應(yīng)在0.01顯著性水平拒絕零假設(shè),接受研究假設(shè)結(jié)論:學(xué)生初一和初二的數(shù)學(xué)成績之間存在極其顯著的相關(guān)。計(jì)算統(tǒng)計(jì)決斷另一種方法:查積差相關(guān)系數(shù)臨界值表根據(jù)df=8,查附表7,從α=0.01一列中找到對應(yīng)的積差相關(guān)系數(shù)臨界值為0.765。計(jì)算得到的r=0.780,大于表中查到的臨界值。因此應(yīng)接受該相關(guān)關(guān)系極其顯著的結(jié)論,而拒絕相關(guān)關(guān)系不顯著的零假設(shè)。另一種方法:查積差相關(guān)系數(shù)臨界值表根據(jù)df=8,查附表7,從⑵.H0:ρ=ρ0條件下,

相關(guān)系數(shù)的顯著性檢驗(yàn)ρ≠0時(shí),r的抽樣分布呈偏態(tài),不能用上述公式計(jì)算。因此可先將r與ρ都轉(zhuǎn)換成Zr,因?yàn)閆r的分布無論ρ的大小都近似于正態(tài)分布,于是不受ρ=0這一條件的限制。檢驗(yàn)統(tǒng)計(jì)量的計(jì)算公式為:(19.5)⑵.H0:ρ=ρ0條件下,

相關(guān)系數(shù)的顯著性檢驗(yàn)ρ≠0時(shí),r2.其它相關(guān)系數(shù)的顯著性檢驗(yàn)斯皮爾曼等級相關(guān)系數(shù)的顯著性檢驗(yàn),可直接查相關(guān)系數(shù)臨界值做出判斷。其它相關(guān)系數(shù)的顯著性檢驗(yàn)可根據(jù)教材P254-P255頁的各種方法進(jìn)行。2.其它相關(guān)系數(shù)的顯著性檢驗(yàn)斯皮爾曼等級相關(guān)系數(shù)的顯著性檢驗(yàn)第十一章相關(guān)分析課件第十一章相關(guān)分析第十一章相關(guān)分析一、相關(guān)概述1、相關(guān)的概念

兩個(gè)變量之間不精確、不穩(wěn)定的變化關(guān)系,稱為相關(guān)關(guān)系。兩個(gè)變量之間的變化關(guān)系,既表現(xiàn)在變化方向上,又表現(xiàn)在密切程度上。一、相關(guān)概述1、相關(guān)的概念兩個(gè)變量之間的變化方向有:正相關(guān):兩個(gè)變量的變化方向相同。負(fù)相關(guān):兩個(gè)變量的變化方向相反。零相關(guān):兩個(gè)變量的變化方向無一定規(guī)律。兩個(gè)變量之間的變化方向有:正相關(guān):兩個(gè)變量的變化方向相同。從關(guān)系密切程度來看,兩個(gè)變量的變化程度可大致分為

完全相關(guān):兩個(gè)變量的變化程度完全一致。強(qiáng)相關(guān):兩個(gè)變量變化的一致性比較強(qiáng)。中等相關(guān):兩個(gè)變量變化的一致程度中等。弱相關(guān):兩個(gè)變量變化的一致性比較差。完全不相關(guān):兩個(gè)變量變化程度沒有一致性。從關(guān)系密切程度來看,兩個(gè)變量的變化程度可大致分為完全相關(guān):2.相關(guān)系數(shù)用來描述兩個(gè)變量相互之間變化方向及密切程度的統(tǒng)計(jì)指標(biāo)稱為相關(guān)系數(shù),一般樣本的相關(guān)系數(shù)用r表示,總體的相關(guān)系數(shù)用ρ表示。相關(guān)系數(shù)的取值:-1≤r≤+10≤∣r∣≤1相關(guān)系數(shù)的符號:“+”表示正相關(guān),“-”表示負(fù)相關(guān)。2.相關(guān)系數(shù)用來描述兩個(gè)變量相互之間變化方向及密切程度的統(tǒng)計(jì)3、相關(guān)系數(shù)的性質(zhì)相關(guān)系數(shù)不是由相等單位度量而來的,因此只能比較大小,不能做任何加、減、乘、除運(yùn)算。3、相關(guān)系數(shù)的性質(zhì)相關(guān)系數(shù)不是由相等單位度量而來的,因此只能二、積差相關(guān)1、積差相關(guān)及其適用條件積差相關(guān)是英國統(tǒng)計(jì)學(xué)家皮爾遜(pearson)于20世紀(jì)初提出的一種計(jì)算相關(guān)的方法,因而被稱為皮爾遜積差相關(guān),也稱為積矩相關(guān)(productmomentcorrelation)。二、積差相關(guān)1、積差相關(guān)及其適用條件積差相關(guān)適用于:兩個(gè)變量都是連續(xù)數(shù)據(jù);兩變量總體都為正態(tài)分布;兩變量之間為線性關(guān)系。成對數(shù)據(jù),樣本容量要大。積差相關(guān)適用于:兩個(gè)變量都是連續(xù)數(shù)據(jù);兩變量總體都為正態(tài)分布2、積差相關(guān)條件的判斷方法連續(xù)變量:根據(jù)得到數(shù)據(jù)的方式判斷,測量數(shù)據(jù)。正態(tài)分布一般情況下,正常人群的身高、體重、智力水平、心理與教育測驗(yàn)的結(jié)果,都可按總體正態(tài)分布對待;如果要求比較高,則需要對數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn)。線性關(guān)系根據(jù)相關(guān)散布圖可判斷兩個(gè)變量之間是否線性關(guān)系。2、積差相關(guān)條件的判斷方法連續(xù)變量:圖18-1正相關(guān)圖18-2負(fù)相關(guān)散點(diǎn)的分布形狀為橢圓形,可認(rèn)為兩變量之間具有線性關(guān)系。圖18-1正相關(guān)圖18-2負(fù)相關(guān)散點(diǎn)的分布形狀為橢圓形圖18-4完全負(fù)相關(guān)圖18-3完全正相關(guān)當(dāng)所有的點(diǎn)都分布在一條直線上時(shí),兩變量之間的關(guān)系為完全相關(guān)。圖18-4完全負(fù)相關(guān)圖18-3完全正相關(guān)當(dāng)所有的點(diǎn)都兩個(gè)變量之間是否相關(guān),要有充分的理論依據(jù),并排除共變因素的影響。圖18-5零相關(guān)散點(diǎn)的分布沒有明顯集中在某一方向的趨勢,形成圓形區(qū)域時(shí),兩變量之間的關(guān)系為零相關(guān)。兩個(gè)變量之間是否相關(guān),要有充分的理論依據(jù),并排除共變因素的影3、積差相關(guān)系數(shù)的計(jì)算公式積差相關(guān)系數(shù)的定義公式協(xié)方差3、積差相關(guān)系數(shù)的計(jì)算公式積差相關(guān)系數(shù)的定義公式積差相關(guān)系數(shù)為(18.1

)公式中:為變量X的平均數(shù),為變量Y的平均數(shù),為變量X的標(biāo)準(zhǔn)差,為變量Y的標(biāo)準(zhǔn)差,

n為數(shù)據(jù)的對數(shù)或計(jì)算得到了相關(guān)系數(shù),還不能確定這兩個(gè)變量一定具有相關(guān)關(guān)系,需要對相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)之后,才能做出判斷。積差相關(guān)系數(shù)為(18.1)公式中:為變量X的表18-110個(gè)學(xué)生初一與初二數(shù)學(xué)成績積差相關(guān)系數(shù)計(jì)算表序號XY1747633.711.1913.692717502.7007.29372711-1.3-1.311.6946870-3-2.36.995.295767653.718.52513.696737926.713.4444.8976765-4-7.329.21653.2987077-14.7-4.7122.0995462-6-10.361.836106.091074723-0.3-0.990.09合計(jì)710723134110268.10表18-110個(gè)學(xué)生初一與初二數(shù)學(xué)成績積差相關(guān)系數(shù)計(jì)算表計(jì)算先計(jì)算變量X和Y的標(biāo)準(zhǔn)差:再將數(shù)據(jù)代入公式計(jì)算積差相關(guān)系數(shù):計(jì)算先計(jì)算變量X和Y的標(biāo)準(zhǔn)差:再將數(shù)據(jù)代入公式計(jì)積差相關(guān)系數(shù)的原始數(shù)據(jù)計(jì)算公式(18.2a

)(18.2b

)積差相關(guān)系數(shù)的原始數(shù)據(jù)計(jì)算公式(18.2a)(18.2表18-210個(gè)學(xué)生初一與初二數(shù)學(xué)成績積差相關(guān)系數(shù)計(jì)算表序號XYXY174765476577656242717580415626532537271518450415112468704624490047605767657765776577667379532962415767767654489422543558707749005929539095462422538444030107472547651845328合計(jì)710723505205254151467表18-210個(gè)學(xué)生初一與初二數(shù)學(xué)成績積差相關(guān)系數(shù)計(jì)算表代入公式計(jì)算:兩種公式計(jì)算結(jié)果相同,但以原始數(shù)據(jù)的計(jì)算公式更為簡捷和準(zhǔn)確。代入公式計(jì)算:兩種公式計(jì)算結(jié)果相同,但以原始數(shù)據(jù)的計(jì)算公式更三.斯皮爾曼等級相關(guān)等級相關(guān)(rankcorrelation)是指以等級次序排列或以等級次序表示的變量之間的相關(guān)。主要包括斯皮爾曼(spearman)二列等級相關(guān)和肯德爾和諧系數(shù)(thekandallcoefficientofconcordance)多列等級相關(guān)。

三.斯皮爾曼等級相關(guān)等級相關(guān)(rankcorrelatio1、斯皮爾曼等級相關(guān)的概念及適用條件斯皮爾曼等級相關(guān)是等級相關(guān)的一種。它適用于兩個(gè)以等級次序表示的變量,并不要求兩個(gè)變量總體呈正態(tài)分布,也不要求樣本的容量必須大于30。當(dāng)連續(xù)數(shù)據(jù)不能滿足計(jì)算積差相關(guān)的條件時(shí),可以轉(zhuǎn)換成等級數(shù)據(jù)從而計(jì)算斯皮爾曼等級相關(guān)系數(shù)。1、斯皮爾曼等級相關(guān)的概念及適用條件斯皮爾曼等級相關(guān)是等級相2、斯皮爾曼等級相關(guān)系數(shù)的計(jì)算斯皮爾曼等級相關(guān)系數(shù)表示為rR,其計(jì)算公式為:(18.3

)公式中:RX為變量X的等級數(shù),

RY為變量Y的等級數(shù),

D為兩變量的等級數(shù)之差,即D=RX-RYn為樣本的容量2、斯皮爾曼等級相關(guān)系數(shù)的計(jì)算斯皮爾曼等級相關(guān)系數(shù)表示為rR表18-310個(gè)高三學(xué)生學(xué)習(xí)潛在能力測驗(yàn)(X)與自學(xué)能力測驗(yàn)(Y)成績

斯皮爾曼等級相關(guān)系數(shù)計(jì)算表序號XYRXRYD=RX-RY190212-1128412111376434-11475545-11573656-11671767-11769878-118683862496610910-111064910911合計(jì)13表18-310個(gè)高三學(xué)生學(xué)習(xí)潛在能力測驗(yàn)(X)與自學(xué)能力如果有相同等級時(shí),可用它們所占等級位置的平均數(shù)作為它們的等級。如果有相同等級時(shí),可用它們所占等級位置的平均數(shù)作為它們的等級表18-410個(gè)學(xué)生初一與初二數(shù)學(xué)成績斯皮爾曼等級相關(guān)系數(shù)計(jì)算表序號XYRXRYD=RX-RY174762.53.5-1.012717565113727157-244687088005767613.5-2.56.256737941397676599008707772525954621010001074722.56-3.512.25合計(jì)71072358.5表18-410個(gè)學(xué)生初一與初二數(shù)學(xué)成績斯皮爾曼等級相關(guān)系計(jì)算思考:同一組數(shù)據(jù)的積差相關(guān)系數(shù)和等級相關(guān)系數(shù)為什么會(huì)有差別?哪一個(gè)更準(zhǔn)確?計(jì)算思考:同一組數(shù)據(jù)的積差相關(guān)系數(shù)和等級相關(guān)系數(shù)為什么會(huì)有四.肯德爾和諧系數(shù)肯德爾等級相關(guān)方法有許多種,肯德爾和諧系數(shù)是其中一種??系聽柡椭C系數(shù)常以rW表示,適用于多列等級變量的資料??系聽柡椭C系數(shù)可以反映多個(gè)等級變量變化的一致性。四.肯德爾和諧系數(shù)肯德爾等級相關(guān)方法有許多種,肯德爾和諧系數(shù)肯德爾和諧系數(shù)的計(jì)算公式公式中:rw表示肯德爾和諧系數(shù)

K表示等級評定者的數(shù)目,即變量數(shù)

n為被等級評定的對象的數(shù)目

R為被評定對象獲得的K個(gè)等級之和SSR為R的離差平方和,即(18.4

)肯德爾和諧系數(shù)的計(jì)算公式公式中:rw表示肯德爾和諧系數(shù)(1n=7評價(jià)者K=10Ri12345678910紅3523443243331089橙6676757766633969黃5457664454502500綠111222211215225青4344335635401600藍(lán)223111132117289紫7765576577623844Σ28013516例表18-5肯德爾和諧系數(shù)計(jì)算表n=7評價(jià)者K=10Ri12345678910紅35234學(xué)生n=6評價(jià)者K=41234134212431332134465655124265656例:4位教師對6位學(xué)生作文競賽的名次排列次序如表18-6。問4位教師評定的一致性程度如何?表18-64位教師對6位學(xué)生作文競賽的名次排列學(xué)生評價(jià)者K=41234134212431332134學(xué)生n=6評價(jià)者K=4Ri12341342110100243131112132134101004656522484512429816565622484Σ841370表18-74位教師對6位學(xué)生作文競賽名次排列的肯德爾和諧系數(shù)計(jì)算表學(xué)生評價(jià)者K=4Ri1234134211010024313有相同等級時(shí),需要用肯德爾和諧系數(shù)的修正公式計(jì)算rW系數(shù)。(18.5

)公式中:m為相同等級的數(shù)目。有相同等級時(shí),需要用肯德爾和諧系數(shù)的修正公式計(jì)算rW系數(shù)。(五、質(zhì)與量的相關(guān)

一個(gè)變量為性質(zhì)變量,另一個(gè)變量為數(shù)量變量,這樣的兩個(gè)變量之間的相關(guān)稱為質(zhì)與量的相關(guān)。五、質(zhì)與量的相關(guān)一個(gè)變量為性質(zhì)變量,另一個(gè)變量為數(shù)量變量,1、點(diǎn)二列相關(guān)適用條件一個(gè)變量為正態(tài)、連續(xù)變量,另一個(gè)變量為真正的二分名義變量,這兩個(gè)變量之間的相關(guān),稱為點(diǎn)二列相關(guān)(point-biserialcorrelation)。有時(shí)一個(gè)變量并非真正的二分變量,而是雙峰分布的變量,也可以用點(diǎn)二列相關(guān)來表示。1、點(diǎn)二列相關(guān)適用條件點(diǎn)二列相關(guān)系數(shù)的計(jì)算公式為

或(19.1)(19.2)公式中:是與二分名義變量的一個(gè)值對應(yīng)的連續(xù)變量的平均數(shù)是與二分名義變量的另一個(gè)值對應(yīng)的連續(xù)變量的平均數(shù)

p和q分別是二分名義變量的兩個(gè)值各自所占的比例,p+q=1St是連續(xù)變量的標(biāo)準(zhǔn)差點(diǎn)二列相關(guān)系數(shù)的計(jì)算公式為或(19.1)(19.2表19-1五歲幼兒投擲砂袋成績例19-1:18個(gè)五歲幼兒擲砂袋(150克),成績?nèi)绫?9-1,問性別與投擲成績的相關(guān)情況如何?序號成績性別序號成績性別14.01103.4223.62114.9133.52123.7243.22133.3254.41144.7164.81154.8173.82163.1285.21172.9294.71183.42表19-1五歲幼兒投擲砂袋成績例19-1:18個(gè)五歲表19-2五歲幼兒性別與投擲砂袋點(diǎn)二列相關(guān)計(jì)算表序號成績性別序號成績性別14.01133.3223.62144.7133.52154.8143.22163.1254.41172.9264.81183.4273.82分?jǐn)?shù)總和71.437.533.985.21人數(shù)總和1881094.71人數(shù)比率0.4440.556103.42平均數(shù)3.9674.6883.390114.91標(biāo)準(zhǔn)差0.7090.3330.262123.72表19-2五歲幼兒性別與投擲砂袋點(diǎn)二列相關(guān)計(jì)算表序號成績代入公式計(jì)算或者代入公式計(jì)算或者2、二列相關(guān)兩個(gè)變量都是正態(tài)連續(xù)變量,其中一個(gè)變量被人為地劃分成二分變量,表示這兩個(gè)變量之間的相關(guān),稱為二列相關(guān)(biserailcorrelation)。將連續(xù)變量人為劃分為二分變量時(shí),應(yīng)注意盡量使分界點(diǎn)接近平均數(shù)。2、二列相關(guān)兩個(gè)變量都是正態(tài)連續(xù)變量,其中一個(gè)變量被人為地劃二列相關(guān)系數(shù)的的計(jì)算公式公式中,Y為標(biāo)準(zhǔn)正態(tài)分布曲線中與P值對應(yīng)的縱線高度其余符號與點(diǎn)二列相關(guān)計(jì)算公式中含義相同(19.3)(19.4)二列相關(guān)系數(shù)的的計(jì)算公式公式中,Y為標(biāo)準(zhǔn)正態(tài)分布曲線中與P值例19-2:表8-3是10名學(xué)生在一次測驗(yàn)中的卷面總分和一道問答題的得分。該問答題回答是否合格與卷面總分的關(guān)系如何?(該問答題滿分為10分,規(guī)定達(dá)到6分為合格)表19-310名學(xué)生某題得分與卷面總分學(xué)生ABCDEFGHIJ卷面總分75577365675663616567問答題分7674744476例19-2:表8-3是10名學(xué)生在一次測驗(yàn)中的卷面總分和一道計(jì)算:

SX=6.12,p=0.6,q=0.4,查正態(tài)分布表,當(dāng)

p=0.60時(shí),Y=0.38667計(jì)算:SX=6.12,p=0.6,q=0.4,查正3.多系列相關(guān)(選學(xué))

當(dāng)兩個(gè)變量都是正態(tài)連續(xù)變量,其中一個(gè)變量按不同質(zhì)被人為地分成多種類別(兩類以上)的正態(tài)名義變量。表示正態(tài)連續(xù)變量與多類正態(tài)名義變量之間的相關(guān),稱為多系列相關(guān)(multiserialscorrelation)。3.多系列相關(guān)(選學(xué))當(dāng)兩個(gè)變量都是正態(tài)連續(xù)變量,其中一個(gè)六、品質(zhì)相關(guān)兩個(gè)變量都是按性質(zhì)劃分成幾種類別,表示這兩個(gè)變量之間的相關(guān)稱為品質(zhì)相關(guān)。品質(zhì)相關(guān)處理的一般是計(jì)數(shù)數(shù)據(jù)而不是連續(xù)數(shù)據(jù),主要用于雙向表或稱為列聯(lián)表(R×C表)。品質(zhì)相關(guān)的方法有多種,最常用的是Φ相關(guān)和列聯(lián)相關(guān)。六、品質(zhì)相關(guān)兩個(gè)變量都是按性質(zhì)劃分成幾種類別,表示這兩個(gè)變量1、Φ相關(guān)當(dāng)兩個(gè)變量都是二分名義變量,這兩個(gè)變量之間的關(guān)系,可以用Φ相關(guān)來討論(兩個(gè)變量都是人為二分變量的情況除外)。Φ相關(guān)系數(shù)用

表示。當(dāng)兩個(gè)變量都各分為兩類時(shí),數(shù)據(jù)在統(tǒng)計(jì)表中占有四個(gè)單元格,因此這類統(tǒng)計(jì)表又稱為四格表。Φ相關(guān)就適用于四格表。1、Φ相關(guān)當(dāng)兩個(gè)變量都是二分名義變量,這兩個(gè)變量之間的關(guān)系,四格表的一般形式變量XX1X2合計(jì)變量YY1aba+bY2cdc+d合計(jì)a+cb+dn=a+b+c+d四格表的一般形式變量XX1X2合計(jì)變量Y1aba+bY2Φ相關(guān)系數(shù)計(jì)算公式(19.5)aba+bcdc+da+cb+d巧記公式:Φ相關(guān)系數(shù)計(jì)算公式(19.5)aba+bcdc+da+cP144例5-14:關(guān)于吸煙與患癌癥之間關(guān)系數(shù)據(jù)的四格表癌癥(0)其他(1)吸煙者(0)64非吸煙者(1)37P144例5-14:關(guān)于吸煙與患癌癥之間關(guān)系數(shù)據(jù)的四格表癌從高中入學(xué)考試的英語試卷中抽取1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論