第七章相關(guān)分析_第1頁(yè)
第七章相關(guān)分析_第2頁(yè)
第七章相關(guān)分析_第3頁(yè)
第七章相關(guān)分析_第4頁(yè)
第七章相關(guān)分析_第5頁(yè)
已閱讀5頁(yè),還剩44頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七章相關(guān)分析一、相關(guān)的意義二、積差相關(guān)三、等級(jí)相關(guān)四、質(zhì)與量相關(guān)五、品質(zhì)相關(guān)偏相關(guān)一、相關(guān)的意義1、相關(guān)的概念2、相關(guān)系數(shù)

相關(guān)的概念兩變量之間不精確、不穩(wěn)定的變化關(guān)系稱為相關(guān)關(guān)系。它與函數(shù)關(guān)系的區(qū)別就在于兩個(gè)變量值不是一一對(duì)應(yīng)得那樣精確、穩(wěn)定。

兩個(gè)變量之間的變化關(guān)系,既表現(xiàn)在變化方向上,又表現(xiàn)在密切程度上。從變化方向來(lái)看,兩個(gè)變量間有以下幾種關(guān)系:(1)正相關(guān):兩個(gè)變量的變化方向一致,即一個(gè)變量值變大時(shí),另一個(gè)變量也隨之變大;反之,亦然。(2)負(fù)相關(guān):兩個(gè)變量的變化方向相反,即一個(gè)變量值變大時(shí),另一個(gè)變量值隨之變??;反之,亦然。(3)零相關(guān):兩個(gè)變量值變化方向無(wú)一定規(guī)律,即一個(gè)變量值變大時(shí),另一個(gè)變量做無(wú)規(guī)律的變化。返回關(guān)于散點(diǎn)圖如果觀察所獲得的資料是兩個(gè)變量的成對(duì)數(shù)據(jù),那么每一對(duì)觀察值都可以用直角坐標(biāo)系中的一個(gè)點(diǎn)(x,y)來(lái)表示,n個(gè)對(duì)象的觀察結(jié)果就可以用n個(gè)散點(diǎn)來(lái)表示。這就是描繪雙變量分布狀況的散點(diǎn)圖。散點(diǎn)圖(一)身高(厘米)145143150156148160154141155148150158智商(分)1001109012010010511098102908998散點(diǎn)圖(二)成績(jī)(分)859075908485807580756468智商(分)1001109012010010511098102908998畫(huà)散點(diǎn)圖X45678Y14356X45678Y35421X12345Y12345X12345Y54321X1.51.82.82.83.5Y231.542.8相關(guān)系數(shù)用來(lái)描述兩個(gè)變量相互之間變化方向及密切程度的數(shù)字特征量稱為相關(guān)系數(shù)。一般,樣本相關(guān)系數(shù)用r表示。相關(guān)系數(shù)的取值范圍是在-1到+1之間,-1≤r≤1。“+”“-”號(hào)表示變化方向?!?”表示變化方向一致,即正相關(guān)?!?”表示變化方向相反,即負(fù)相關(guān)。r的絕對(duì)值表示兩個(gè)變量之間的密切程度(即強(qiáng)度)。注意:1.相關(guān)系數(shù)僅僅是一個(gè)比值。它不是由相等單位度量而來(lái)的,不等距,也不是百分比,因此,不能直接作加、減、乘、除運(yùn)算。2.相關(guān)系數(shù)只能描述兩個(gè)變量之間的變化方向及密切程度,并不能揭示兩者之間的內(nèi)在本質(zhì)聯(lián)系。3.存在相關(guān)的兩個(gè)變量,也不一定存在因果關(guān)系。二、積差相關(guān)1、積差相關(guān)的概念2、積差相關(guān)的使用條件3、積差相關(guān)系數(shù)的公式4、總體相關(guān)系數(shù)的區(qū)間估計(jì)5、相關(guān)的顯著性檢驗(yàn)6、相關(guān)系數(shù)差異的顯著性檢驗(yàn)返回積差相關(guān)的概念當(dāng)兩個(gè)變量都是正態(tài)連續(xù)變量,而且兩者之間呈線性關(guān)系時(shí),表示這兩個(gè)變量之間的相關(guān)稱為積差相關(guān)。返回積差相關(guān)系數(shù)的公式返回例計(jì)算相關(guān)系數(shù)X45678Y14356X45678Y35421X12345Y12345X12345Y54321X1.51.82.82.83.5Y231.542.80.904-0.71-10.196積差相關(guān)的使用條件1、兩個(gè)變量都是由測(cè)量獲得的連續(xù)性數(shù)據(jù)。2、兩個(gè)變量的總體都呈正態(tài)分布,或接近正態(tài)分布,至少是單峰對(duì)稱分布。3、必須是成對(duì)的數(shù)據(jù),而且每對(duì)數(shù)據(jù)之間相互獨(dú)立,即每對(duì)分?jǐn)?shù)與其他對(duì)子沒(méi)有關(guān)系,相互獨(dú)立。4、兩個(gè)變量之間呈線形關(guān)系。這可由散點(diǎn)圖來(lái)做初步分析。5、要排除共變因素的影響。6、樣本容量要≥30,計(jì)算出的積差相關(guān)系數(shù)才具有有效意義。例返回偏相關(guān)偏相關(guān)(partialcorrelation),也稱純相關(guān)或凈相關(guān),指在計(jì)算兩個(gè)連續(xù)變量X1與X2的相關(guān)時(shí),將第三個(gè)變量X3或其他多個(gè)變量的影響,即r13和r23予以排除之后,X1與X2這兩個(gè)變量之間的純凈相關(guān),用符號(hào)r12.3表示,點(diǎn)號(hào)左邊的兩個(gè)下標(biāo)代表要求計(jì)算偏相關(guān)的兩個(gè)變量,點(diǎn)號(hào)右邊的下標(biāo)表示要消除其影響的變量。偏相關(guān)的公式如下:偏相關(guān)之例一

(將學(xué)歷XL作為控制變量,對(duì)兒童智商IQ與母親年齡NL作偏相關(guān)分析)對(duì)12名兒童的智商IQ、出生時(shí)母親的年齡NL,以及母親的文化程度(接受正規(guī)教育的年限——學(xué)齡)XL這三個(gè)變量進(jìn)行調(diào)查的結(jié)果如下表:abcdefghijklIQ788294959697102105106108114122NL202122252726282730323232XL699121212151616191922r=0.934r12.3=0.0887偏相關(guān)系數(shù)的“階數(shù)”一階偏相關(guān)系數(shù)——只控制了一個(gè)“第三變量”;二階偏相關(guān)系數(shù)——控制了兩個(gè)“第三變量”;。。。。。??刂谱兞靠梢圆恢挂粋€(gè),而控制變量的數(shù)目就是偏相關(guān)系數(shù)的階數(shù)。不難理解,兩列變量之間的簡(jiǎn)單相關(guān)系數(shù)是零階的“偏相關(guān)系數(shù)”,也就是說(shuō),它是在沒(méi)有控制任何條件的情況下考察兩種現(xiàn)象之間的相互聯(lián)系。偏相關(guān)分析作為一種統(tǒng)計(jì)分析的手段,可以幫助我們“透過(guò)現(xiàn)象看本質(zhì)”,更加深入地把握事物之間相互聯(lián)系的證據(jù)。偏相關(guān)分析既可以幫助我們辨別虛假的“偽相關(guān)”,也可以幫助我們發(fā)現(xiàn)被掩蔽了的“真相關(guān)”。偏相關(guān)分析之例二

(將工齡GL作為控制變量,對(duì)工資GZ與學(xué)歷XL作偏相關(guān)分析。)abcdefghijklGZ800900100020001500220027003000280035001500950GL2141010201021202514XL161916161212191616162212r=0.038(p>0.05)r13.2=0.8177(p<0.01)練習(xí)下表是20名學(xué)生某次期末考試的語(yǔ)文、數(shù)學(xué)、外語(yǔ)三門(mén)課的成績(jī),試求剔除了語(yǔ)文成績(jī)之后,20名學(xué)生的數(shù)學(xué)成績(jī)與外語(yǔ)成績(jī)的偏相關(guān)系數(shù)。編號(hào)1234567891011121314151617181920語(yǔ)文9188837084927887827766697493868477738971數(shù)學(xué)8592866687887481917862717790948273698883外語(yǔ)9392816484917280857364676288847861748562語(yǔ)文與數(shù)學(xué):0.827語(yǔ)文與外語(yǔ):0.900數(shù)學(xué)與外語(yǔ):0.787積差相關(guān)例題成績(jī)(分)859075908485807580756468智商(分)1001109012010010511098102908998總體相關(guān)系數(shù)的區(qū)間估計(jì)1、樣本相關(guān)系數(shù)的抽樣分布只有當(dāng)總體相關(guān)系數(shù)ρ=0時(shí),樣本相關(guān)系數(shù)的抽樣分布才接近正態(tài)(嚴(yán)格來(lái)說(shuō),ρ=0時(shí)樣本相關(guān)系數(shù)r的分布為t分布)。當(dāng)總體相關(guān)系數(shù)ρ≠0時(shí),樣本相關(guān)系數(shù)的抽樣分布呈偏態(tài),概率分布函數(shù)較為復(fù)雜。將相關(guān)系數(shù)做轉(zhuǎn)換:

那么無(wú)論總體相關(guān)系數(shù)ρ是否等于零,樣本Z的抽樣分布都近似地服從于正態(tài)分布。Zr的標(biāo)準(zhǔn)誤是:

2、置信區(qū)間的確定:return相關(guān)的顯著性檢驗(yàn)之一:H0:ρ=0的檢驗(yàn)如前所述,當(dāng)總體相關(guān)系數(shù)ρ=0時(shí),樣本相關(guān)系數(shù)r的抽樣分布為t分布。此時(shí)樣本相關(guān)系數(shù)標(biāo)準(zhǔn)誤的估計(jì)值是

檢驗(yàn)統(tǒng)計(jì)量為:自由度:n-2。在實(shí)際應(yīng)用中,通常是直接查積差相關(guān)系數(shù)顯著性臨界值表來(lái)斷定r是否顯著。例:例:12名初二學(xué)生的智商與身高情況登記如下表。能否認(rèn)為學(xué)生的智商確實(shí)與身高有關(guān)(身材矮小者較聰明或者相反)?身高(厘米)145143150156148160154141155148150158智商(分)1001109012010010511098102908998相關(guān)的顯著性檢驗(yàn)之二:H0:ρ=ρ0的檢驗(yàn)虛無(wú)假設(shè)意指:在總體中兩個(gè)變量之間存在某種程度的線性相關(guān),而樣本的相關(guān)系數(shù)r≠ρ0是由于抽樣的偶然誤差。

檢驗(yàn)統(tǒng)計(jì)量為:例:例據(jù)稱EPT與TOFEL兩種測(cè)驗(yàn)的相關(guān)高達(dá)0.80。隨機(jī)抽取的40名被試,兩個(gè)測(cè)驗(yàn)成績(jī)的相關(guān)系數(shù)r=0.75,據(jù)此能不能否定總體ρ=0.80?解:查表:r=0.75時(shí),Zr=0.973

ρ=0.80時(shí),Zρ=1.099

Return相關(guān)系數(shù)差異的顯著性檢驗(yàn)(一)1、獨(dú)立樣本(r1和r2分別由彼此獨(dú)立的被試得到)之間樣本相關(guān)系數(shù)差異的顯著性檢驗(yàn)例:從某省隨機(jī)抽取的103名高考考生中,男56人,女47人。男生數(shù)、理兩科成績(jī)的相關(guān)系數(shù)r1=0.83,女生數(shù)、理兩科成績(jī)的相關(guān)系數(shù)r2=0.76。數(shù)、理兩科成績(jī)的相互關(guān)系是否存在顯著的性別差異?解:相關(guān)系數(shù)差異的顯著性檢驗(yàn)(二)2、同組被試兩個(gè)相關(guān)系數(shù)差異的顯著性檢驗(yàn)這里只介紹同組被試的三個(gè)測(cè)驗(yàn),兩兩相關(guān)系數(shù)之差的顯著性檢驗(yàn)。檢驗(yàn)的虛無(wú)假設(shè)是:H0:ρ12=ρ13,檢驗(yàn)統(tǒng)計(jì)量為:檢驗(yàn)統(tǒng)計(jì)量t的自由度df=n-3。例:以某一權(quán)威測(cè)驗(yàn)X1為效標(biāo)考查新編制的兩套外語(yǔ)測(cè)驗(yàn)X2、X3的有效性。在容量n=303的標(biāo)準(zhǔn)化樣本中,求得三個(gè)測(cè)驗(yàn)的兩兩相關(guān)系數(shù)分別是:r12=0.62;r13=0.51;r23=0.70。新編制的兩個(gè)測(cè)驗(yàn)的效度是否有顯著的差別?解:return三、等級(jí)相關(guān)1、斯皮爾曼等級(jí)相關(guān)2、肯德?tīng)柡椭C系數(shù)返回斯皮爾曼等級(jí)相關(guān)1、概念及適用范圍當(dāng)兩個(gè)變量值以等級(jí)次序排列或以等級(jí)次序表示時(shí),兩個(gè)相應(yīng)總體并不一定呈正態(tài)分布,樣本容量也不一定大于30,表示這兩個(gè)變量之間的相關(guān),稱為等級(jí)相關(guān)。2、相關(guān)系數(shù)的計(jì)算等級(jí)相關(guān)系數(shù)的顯著性檢驗(yàn)方法與積差相關(guān)的相同。例例成績(jī)(分)859075908485807580756468智商(分)1001109012010010511098102908998成績(jī)等級(jí)3.51.591.553.56.596.591211智商等級(jí)6.52.510.516.542.58.5510.5128.5D-3-1-1.50.5-1.5-0.54.00.51.5-1.502.5D2912.250.252.250.25160.252.252.2506.25return成績(jī)(分)859075908485807580756468智商(分)1001109012010010511098102908998肯德?tīng)柡椭C系數(shù)1、概念及使用范圍

當(dāng)多個(gè)(兩個(gè)以上)變量值以等級(jí)次序排列或以等級(jí)次序表示,描述這幾個(gè)變量之間一致性程度(即相關(guān))的量,稱為肯德?tīng)柡椭C系數(shù)。它常用來(lái)表示幾個(gè)評(píng)定者對(duì)同一組學(xué)生學(xué)習(xí)成績(jī)等級(jí)評(píng)定的一致性程度或同一個(gè)評(píng)定者對(duì)同一組學(xué)生的學(xué)習(xí)成績(jī)用等級(jí)先后評(píng)定多次之間的一致性程度。2、相關(guān)系數(shù)的計(jì)算例例N=7趙錢(qián)孫李周(k=5)RiRi2蕭亞軒1111111周杰倫1111111S.H.E1111111蔡依琳1111111陳奕迅1111111潘瑋柏1111111王菲1111111返四、質(zhì)與量相關(guān)1、點(diǎn)二列相關(guān)2、二列相關(guān)返回點(diǎn)二列相關(guān)1、概念及適用范圍

當(dāng)兩個(gè)變量其中一個(gè)是正態(tài)連續(xù)性變量,另一個(gè)是真正的二分名義變量時(shí),表示這兩個(gè)變量之間的相關(guān),稱為點(diǎn)二列相關(guān)。2、相關(guān)系數(shù)的計(jì)算例例14名男女學(xué)生某項(xiàng)技能測(cè)驗(yàn)的成績(jī)?nèi)缦卤?試計(jì)算該技能測(cè)驗(yàn)成績(jī)與性別的相關(guān)系數(shù).男1女011111111000000總和成績(jī)X7968354628643677接二列相關(guān)應(yīng)用點(diǎn)二列相關(guān)的應(yīng)用

——用于對(duì)測(cè)驗(yàn)項(xiàng)目的區(qū)分度進(jìn)行檢驗(yàn)。有一是非式選擇測(cè)驗(yàn),每題選對(duì)得2分,共有50題,滿分100分。下表所列為20名學(xué)生在該測(cè)驗(yàn)中的總成績(jī)及第5題的選答情況。問(wèn)這道題與測(cè)驗(yàn)總分的相關(guān)程度如何?學(xué)號(hào)總分第5題學(xué)號(hào)總分第5題184對(duì)282錯(cuò)376錯(cuò)460錯(cuò)572錯(cuò)674錯(cuò)776錯(cuò)884對(duì)988對(duì)1090對(duì)1178對(duì)1280錯(cuò)1392對(duì)1494對(duì)1596對(duì)1688對(duì)1790對(duì)1878錯(cuò)1976錯(cuò)2074錯(cuò)點(diǎn)二列相關(guān)與二列相關(guān)相同之處:都可用于計(jì)算題目的區(qū)分度。區(qū)別:適用數(shù)據(jù)不同。點(diǎn)二列相關(guān)中的二分變量是真正的二分變量,不是正態(tài)分布的;二列相關(guān)中的二分變量是由正態(tài)分布的連續(xù)性測(cè)量數(shù)據(jù)人為轉(zhuǎn)化來(lái)的。使用點(diǎn)二列相關(guān)和二列相關(guān)的總原則:如果不是十分明確觀測(cè)數(shù)據(jù)的分布形態(tài)是否為正態(tài)分布,這時(shí),不管觀測(cè)數(shù)據(jù)代表的是一個(gè)真正的二分變量,還是一個(gè)基于正態(tài)分布的人為二分變量,都應(yīng)選用點(diǎn)二列相關(guān)。只要有任何疑問(wèn),選用點(diǎn)二列相關(guān)總是較好的選擇。在實(shí)際的研究當(dāng)中,二列相關(guān)很少使用。偏相關(guān)練習(xí)練習(xí)問(wèn)下表中成績(jī)與性別是否有關(guān)?被試12345678910性別男女女男女男男男女女成績(jī)83919584898786858892二列相關(guān)1、概念及適用范圍當(dāng)兩個(gè)變量都是正態(tài)連續(xù)變量,其中一個(gè)變量被人為地劃分成二分變量,表示這兩個(gè)變量之間的相關(guān),稱為二列相關(guān)。2、

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論