第三章 相關分析_第1頁
第三章 相關分析_第2頁
第三章 相關分析_第3頁
第三章 相關分析_第4頁
第三章 相關分析_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第三章第三章 相關分析相關分析0 一些現(xiàn)象一些現(xiàn)象 數(shù)學成績與語文成績數(shù)學成績與語文成績 身高與性別身高與性別 壽命與生長環(huán)境壽命與生長環(huán)境 課程成績與教學方法課程成績與教學方法 課程成績與教師課程成績與教師 化肥使用量與產(chǎn)出化肥使用量與產(chǎn)出 孩子學習主動性與家長的學習孩子學習主動性與家長的學習 1 基本概念基本概念n事物或現(xiàn)象之間的三種關系。事物或現(xiàn)象之間的三種關系。 n第一種是因果關系,這種關系說明的是事物之間相互依存,互為因果第一種是因果關系,這種關系說明的是事物之間相互依存,互為因果的關系,是事物之間存在的一種必然關系,即一種引起與被引起的關的關系,是事物之間存在的一種必然關系,即一種

2、引起與被引起的關系,因在前果在后的順序是不能顛倒的。系,因在前果在后的順序是不能顛倒的。n第二種是共變關系,例如夏天冷飲的銷量和中暑人數(shù)的關系。當天氣第二種是共變關系,例如夏天冷飲的銷量和中暑人數(shù)的關系。當天氣炎熱時,兩者都會增加,但通常我們不認為它們之間有什么因果關系。炎熱時,兩者都會增加,但通常我們不認為它們之間有什么因果關系。但事實上兩者皆起因于天氣炎熱的因素,它們之間并沒有直接的關系。但事實上兩者皆起因于天氣炎熱的因素,它們之間并沒有直接的關系。n第三種是相關關系,即兩類現(xiàn)象在發(fā)展變化的方向與大小方面存在一第三種是相關關系,即兩類現(xiàn)象在發(fā)展變化的方向與大小方面存在一定的聯(lián)系,但不是前面

3、兩種關系。定的聯(lián)系,但不是前面兩種關系。n另一說相關關系反映現(xiàn)象的共變關系。另一說相關關系反映現(xiàn)象的共變關系。 1.1 相關相關n兩類現(xiàn)象在發(fā)展變化的方向與大小方面存在一定的聯(lián)系,但不是因果兩類現(xiàn)象在發(fā)展變化的方向與大小方面存在一定的聯(lián)系,但不是因果關系。關系。1.2 相關的類型相關的類型 -正相關正相關(Positive correlation)是指兩列變量變動方向相同,一列)是指兩列變量變動方向相同,一列變量變量由大到小或由小到大變化時,另一列變量亦由大到小或由小到大由大到小或由小到大變化時,另一列變量亦由大到小或由小到大變化。如身高與體重,身高越長,體重就越重變化。如身高與體重,身高越長

4、,體重就越重 正相關雖然意思明確,其實是個模糊的概念,不可以量化,只是正相關雖然意思明確,其實是個模糊的概念,不可以量化,只是定性說法。如果有明確的關系,例如定性說法。如果有明確的關系,例如 y2x,這叫,這叫y與與x成成正比正比,如果,如果只是大體上,只是大體上,x、y的變化方向一樣,例如的變化方向一樣,例如x上升,上升,y也上升或者也上升或者x下降,下降,y也下降,那么,這叫也下降,那么,這叫正相關正相關 。n-負相關(負相關(Nagtive correlation)是指兩列變量變動方向相反,一列是指兩列變量變動方向相反,一列變量變量由大到小或由小到大變化時,另一列變量反而由小到大或由大到

5、由大到小或由小到大變化時,另一列變量反而由小到大或由大到小變化。小變化。 負相關是事物之間相互負相關是事物之間相互“制約制約”,一種事物發(fā)展導致另一種事物,一種事物發(fā)展導致另一種事物受到限制。受到限制。 特別是特別是“替代品替代品”。比如資源政策、環(huán)保政策出臺必然導致。比如資源政策、環(huán)保政策出臺必然導致“一一次性資源次性資源”替代品的出現(xiàn),象替代品的出現(xiàn),象“代木代鋼代木代鋼”發(fā)展起來的發(fā)展起來的PVC塑鋼。再塑鋼。再如隨著計算練習次數(shù)增加或練習時間加長,計算錯誤就越少等等。如隨著計算練習次數(shù)增加或練習時間加長,計算錯誤就越少等等。n零相關是指兩列零相關是指兩列變量變量之間沒有關系,即一列變量

6、變之間沒有關系,即一列變量變動時,另一列變量作無規(guī)律的變動,又稱為無相關動時,另一列變量作無規(guī)律的變動,又稱為無相關或不相關。或不相關。 如相貌與人的行為等現(xiàn)象之間的關系,都屬于零如相貌與人的行為等現(xiàn)象之間的關系,都屬于零相關。相關。 1.3 相關的強度相關的強度n 完全相關完全相關是指兩列變量的關系是一一對應,完全確立的關系。在是指兩列變量的關系是一一對應,完全確立的關系。在坐標軸上描繪兩列變量時會形成一條直線。坐標軸上描繪兩列變量時會形成一條直線。n強相關強相關又稱高度相關,即當一列變量變化時,與之相應的另一列又稱高度相關,即當一列變量變化時,與之相應的另一列變量增大(或減少)的可能性非常

7、大。在坐標圖上則表現(xiàn)為變量增大(或減少)的可能性非常大。在坐標圖上則表現(xiàn)為散點圖散點圖較較為集中在某條直線的周圍。為集中在某條直線的周圍。n弱相關弱相關又稱低度相關,即當一列變量變化時,與之相對應的另一又稱低度相關,即當一列變量變化時,與之相對應的另一列變量增大(或減少)的可能性較小。亦即兩列變量之間雖然有一定列變量增大(或減少)的可能性較小。亦即兩列變量之間雖然有一定的聯(lián)系,但聯(lián)系的緊密程度較低。在坐標涂上表現(xiàn)出散點比較分散地的聯(lián)系,但聯(lián)系的緊密程度較低。在坐標涂上表現(xiàn)出散點比較分散地分布在某條直線的周圍。分布在某條直線的周圍。|r|0.4為低度線性相關;為低度線性相關;0.4|r|0.7為

8、顯著性相關;為顯著性相關;0.7|r|1為高度線性相關。為高度線性相關。 1.4相關的標示類型相關的標示類型 直線相關直線相關(Linear Correlation)又稱線性相關,是指兩列又稱線性相關,是指兩列變量變量中的中的一列變量在增加(或減少)時,而另一列變量隨之而增加(或減少),一列變量在增加(或減少)時,而另一列變量隨之而增加(或減少),或這一列變量在增加時,而另一列變量則相應地減少。它們之間存在或這一列變量在增加時,而另一列變量則相應地減少。它們之間存在一種一種直線關系直線關系。直線相關可用直線擬合。直線相關可用直線擬合。 曲線相關曲線相關(Curvilinear correlat

9、ion)又稱非線性相關,是指兩)又稱非線性相關,是指兩列伴隨相變化的列伴隨相變化的變量變量,未能形成,未能形成直線關系直線關系。 1.4 散點圖散點圖2 直線相關系數(shù)直線相關系數(shù)JP132圖圖3.1 語文和算術成績散點圖語文和算術成績散點圖(-2.67,-4)(0,0)IV以xy衡量相關程度衡量相關程度n正相關時正相關時xy為正,相關程度越高,值越大。為正,相關程度越高,值越大。 為什么?為什么? 負相關時負相關時xy為負,相關程度越高,絕對值越大。為負,相關程度越高,絕對值越大。 不不相關時相關時xy趨近于趨近于0。 為什么?為什么?不足:以不足:以xy衡量相關程度,但程度衡量相關程度,但程

10、度不變時,不變時, xy隨觀測次數(shù)減加而增減。隨觀測次數(shù)減加而增減。因此,以因此,以(xy)/n協(xié)方差衡量相關程度較好。協(xié)方差衡量相關程度較好。 但,測量單位改變時,協(xié)方差會隨之改變。但,測量單位改變時,協(xié)方差會隨之改變。 進一步,再用協(xié)方差除進一步,再用協(xié)方差除以變量以變量XY 的標準差之積的標準差之積x y,得到一個指標,得到一個指標,稱為直線相關系數(shù)。稱為直線相關系數(shù)。Xyx ypn(1)Xyxyrnss樣本直線相關系數(shù):樣本直線相關系數(shù):總體直線相關系數(shù):總體直線相關系數(shù):,x X X y Y Y 其中其中2.1 Pearson correlation coefficientn皮爾森相

11、關系數(shù)(皮爾森相關系數(shù)(Pearson correlation coefficient)也稱)也稱皮爾森皮爾森積矩相關系數(shù)積矩相關系數(shù)(Pearson product-moment correlation coefficient) ,是一種線性相關系數(shù)。皮爾森相關系是一種線性相關系數(shù)。皮爾森相關系數(shù)是用來反映兩個變量線性相關程度數(shù)是用來反映兩個變量線性相關程度的統(tǒng)計量。相關系數(shù)用的統(tǒng)計量。相關系數(shù)用r表示,其中表示,其中n為為樣本量樣本量,xy、 分別為兩個變量分別為兩個變量的觀測值和均值。的觀測值和均值。r描述的是兩個變量描述的是兩個變量間線性相關強弱的程度。間線性相關強弱的程度。r的絕對值

12、越的絕對值越大表明相關性越強。(大表明相關性越強。( 1890年)年)YX公式公式的其的其他表他表述述( 1890年)年)決定系數(shù)決定系數(shù)n決定系數(shù)決定系數(shù),英文(,英文(coefficient of determination),),有的教材上翻譯為,判定系數(shù),也稱為擬合優(yōu)度。在有的教材上翻譯為,判定系數(shù),也稱為擬合優(yōu)度。在Y的總平方和中,由的總平方和中,由X引起的平方和所占的比例,或依變引起的平方和所占的比例,或依變量量Y的變異中有多少的變異中有多少百分比百分比,可由控制的自變數(shù)可由控制的自變數(shù)X來解釋來解釋 ,記為記為 與相關系數(shù)的區(qū)別在于除掉與相關系數(shù)的區(qū)別在于除掉|R|=0和和1情況

13、,由于情況,由于 j(或或ij)的格中的擇優(yōu)分數(shù)的格中的擇優(yōu)分數(shù)對偶比較法(對偶比較法(Method of paired comparison) 對偶比較法是把所有要比較的刺激配成對,然后一對對偶比較法是把所有要比較的刺激配成對,然后一對一對地呈現(xiàn),讓被試者依據(jù)刺激的某一特性進行比較,并一對地呈現(xiàn),讓被試者依據(jù)刺激的某一特性進行比較,并做出判斷這種特性在兩個刺激中的哪一個上表現(xiàn)得更為突做出判斷這種特性在兩個刺激中的哪一個上表現(xiàn)得更為突出。出。 因為每一刺激都要分別和其他刺激比較,假如以因為每一刺激都要分別和其他刺激比較,假如以n代代表刺激的總數(shù),那么配成對的個數(shù)是表刺激的總數(shù),那么配成對的個數(shù)

14、是n(n1)/2。然后。然后依它們各自明顯于其他刺激的百分比的大小排列成序,即依它們各自明顯于其他刺激的百分比的大小排列成序,即可制成一個順序量表??芍瞥梢粋€順序量表。n 為了避免空間和時間誤差,則需要再次實驗,第一次為了避免空間和時間誤差,則需要再次實驗,第一次實驗中實驗中A先于先于B,第二次則第二次則B先于先于A。所以每個單元格都有兩。所以每個單元格都有兩個結果。個結果。C為兩次結果各刺激的和,為兩次結果各刺激的和,C為對為對C的調(diào)整,的調(diào)整,C指指每個刺激在兩輪實驗中,與其他刺激比較勝出的次數(shù),而每個刺激在兩輪實驗中,與其他刺激比較勝出的次數(shù),而事實上,每種刺激和它本身也應比教,只不過是

15、不分勝負,事實上,每種刺激和它本身也應比教,只不過是不分勝負,故在每個故在每個C分數(shù)上都加分數(shù)上都加0.5,因其比較兩次,所以要加兩個,因其比較兩次,所以要加兩個0.5,即,即1。n 在有些情況下,實驗者認為對偶比較空間和時間效應在有些情況下,實驗者認為對偶比較空間和時間效應的干擾并不明顯,也可以采用簡化的程序,即每對刺激之的干擾并不明顯,也可以采用簡化的程序,即每對刺激之間僅比較一次。取間僅比較一次。取P=C/(N-1),C=C+5,P=C/N。n對偶比較法對偶比較法在廣告應用的測定與評判中的應用在廣告應用的測定與評判中的應用n對偶比較法將所有參加比較的廣告逐對呈現(xiàn),評價者按照對偶比較法將所

16、有參加比較的廣告逐對呈現(xiàn),評價者按照某種標準,比較兩幅廣告的優(yōu)劣。如果參加比較的廣告總某種標準,比較兩幅廣告的優(yōu)劣。如果參加比較的廣告總數(shù)為數(shù)為n,測定總共要呈現(xiàn)以,測定總共要呈現(xiàn)以n(n-1)/2 對,為了消除前后對,為了消除前后順序的誤差,比較一般要進行兩輪,如果第一輪呈現(xiàn)的次順序的誤差,比較一般要進行兩輪,如果第一輪呈現(xiàn)的次序是先序是先A 后后B(或者位置是(或者位置是A左左B右),第兩輪呈現(xiàn)則為先右),第兩輪呈現(xiàn)則為先B后后A(或(或A右右B左)。每幅廣告都要與其他廣告比較(左)。每幅廣告都要與其他廣告比較(n-1)次,二輪共同需比較)次,二輪共同需比較2(n-1)次。)次。假定有假定

17、有10幅廣告,分別編號為幅廣告,分別編號為A、B、C、D、E、F、G、H、I、J,一名評價人的結果記入下表(何者為,一名評價人的結果記入下表(何者為優(yōu),即記何者編號);見下表:優(yōu),即記何者編號);見下表: 解:N=5,K=9 Yij2=4*4+4*4+4*4+2*2+2*2+2*2+2*2+3*3+4*4+7*7=138 Yij=4+4+4+2+2+2+2+3+4+7=3428()8*(1389*34)110.0667(1)*(1)5/ 4*9*8ijijYKYUN NK K 對偶比較法需要注意兩點:對偶比較法需要注意兩點:1、用這種方法得到的順序量表,還僅僅是針對一個被試的、用這種方法得到的

18、順序量表,還僅僅是針對一個被試的心理物理量表,尚不能直接推廣到更大的人群。心理物理量表,尚不能直接推廣到更大的人群。2、這一量表模型要求對偶比較是可傳遞的(、這一量表模型要求對偶比較是可傳遞的(transitive),),如果刺激如果刺激A優(yōu)先于刺激優(yōu)先于刺激B,而且刺激,而且刺激B優(yōu)先于刺激優(yōu)先于刺激C,那么,那么刺激刺激A優(yōu)先于刺激優(yōu)先于刺激C。然而,有些情況下這種傳遞性難以。然而,有些情況下這種傳遞性難以保證,這時就不能采用對偶比較法。保證,這時就不能采用對偶比較法。2.6 偏相關偏相關n 偏相關分析偏相關分析也稱也稱凈相關分析凈相關分析,是指當兩個變量同時與,是指當兩個變量同時與第三個

19、變量相關時,將第三個變量的影響剔除,只分析另第三個變量相關時,將第三個變量的影響剔除,只分析另外兩個變量之間線性相關程度的過程。外兩個變量之間線性相關程度的過程。n 所采用的工具是偏相關系數(shù)(凈相關系數(shù))。控制變量所采用的工具是偏相關系數(shù)(凈相關系數(shù))??刂谱兞總€數(shù)為一時,偏相關系數(shù)稱為一階偏相關系數(shù);控制變量個數(shù)為一時,偏相關系數(shù)稱為一階偏相關系數(shù);控制變量個數(shù)為二時,偏相關系數(shù)稱為二階相關系數(shù);控制變量個個數(shù)為二時,偏相關系數(shù)稱為二階相關系數(shù);控制變量個數(shù)為零時,偏相關系數(shù)稱為零階偏相關系數(shù),也就是數(shù)為零時,偏相關系數(shù)稱為零階偏相關系數(shù),也就是簡單簡單相關系數(shù)相關系數(shù) n利用樣本數(shù)據(jù)計算偏

20、相關系數(shù),反應了兩個變量間凈相關利用樣本數(shù)據(jù)計算偏相關系數(shù),反應了兩個變量間凈相關的強弱程度。在分析變量的強弱程度。在分析變量x1和和x2之間的凈相關時,當控之間的凈相關時,當控制了變量制了變量x3的線性作用后,的線性作用后,x1和和x2之間的之間的一階一階偏相關系偏相關系數(shù)數(shù)定義為:定義為: 2.7多重相關多重相關n 多重相關系數(shù)多重相關系數(shù)(multiple correlation coefficient; coefficient of total correlation) 又稱又稱復相關系數(shù)復相關系數(shù),反映,反映一個一個因變量因變量與一組自變量與一組自變量(兩個或兩個以上兩個或兩個以上)之間相關程度之間相關程度的的指標指標。n 多重相關系數(shù)是包含所有多重相關系數(shù)是包含所有變量變量在內(nèi)的在內(nèi)的相關系數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論