SPSS相關(guān)性分析_第1頁
SPSS相關(guān)性分析_第2頁
SPSS相關(guān)性分析_第3頁
SPSS相關(guān)性分析_第4頁
SPSS相關(guān)性分析_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、.1SPSS數(shù)據(jù)分析-第8章-SPSS的相關(guān)分析和線性回歸分析SPSS統(tǒng)計分析方法及應(yīng)用.2什么是相關(guān)分析n相關(guān)分析是分析客觀事物之間相關(guān)性的數(shù)量分析方法。許多事物或現(xiàn)象之間總是相互聯(lián)系的,并且可以通過一定的數(shù)量關(guān)系反映出來。n函數(shù)關(guān)系:兩事物之間一對一的關(guān)系。n統(tǒng)計關(guān)系:兩事物之間的多對一和一對多。 .3n統(tǒng)計關(guān)系還可以分為:(1)線性相關(guān):線性相關(guān):當(dāng)一個變量的值發(fā)生變化時,另外的一個變量也發(fā)生大致相同的變化。在直角坐標(biāo)系中,如現(xiàn)象觀察值的分布大致在一條直線上,則現(xiàn)象之間的相關(guān)關(guān)系為線性相關(guān)或線性相關(guān)或直線相關(guān)直線相關(guān)(Linear correlation)。(2)非線性相關(guān):非線性相關(guān):

2、如果一個變量發(fā)生變動,另外的變量也隨之變動,但是,其觀察值分布近似的在一條曲線上,則變量之間的相關(guān)關(guān)系為非線性相關(guān)或曲線相關(guān)(非線性相關(guān)或曲線相關(guān)(Curvilinear Curvilinear correlationcorrelation).4相關(guān)關(guān)系的種類n相關(guān)關(guān)系的種類:是否線性q線性相關(guān)n正相關(guān)n負(fù)相關(guān)q曲線相關(guān) n相關(guān)關(guān)系的種類:據(jù)變量的度量類型q定類變量和定類變量之間的相關(guān)q定序變量和定序變量之間的相關(guān)q定距變量和定距變量之間的相關(guān) .5相關(guān)關(guān)系的種類n相關(guān)關(guān)系的種類:是否線性q線性相關(guān)n正相關(guān)n負(fù)相關(guān)q曲線相關(guān) n相關(guān)關(guān)系的種類:據(jù)變量的度量類型q定類變量和定類變量之間的相關(guān)q定

3、序變量和定序變量之間的相關(guān)q定距變量和定距變量之間的相關(guān) .6定類變量 定序變量 定距變量n定類變量 變量的一種,根據(jù)定性的原則區(qū)分總體各個案類別的變量。定類變量的值只能把研究對象分類,也即只能決定研究對象是同類抑或不同類,具有與的數(shù)學(xué)性質(zhì)。例如性別區(qū)分為男性和女性兩類n定序變量 變量的一種,區(qū)別同一類別個案中等級次序的變量。定序變量能決定次序,也即變量的值能把研究對象排列高低或大小,具有與的數(shù)學(xué)特質(zhì)。它是比定類變量層次更高的變量,因此也具有定類變量的特質(zhì),即區(qū)分類別(,)。例如文化程度可以分為大學(xué)、高中、初中、小學(xué)、文盲。n定距變量 也是變量的一種,區(qū)別同一類別個案中等級次序及其距離的變量。

4、它除了包括定序變量的特性外,還能確切測量同一類別各個案高低、大小次序之間的距離,因而具有加與減的數(shù)學(xué)特質(zhì)。但是,定距變量沒有一個真正的零點。.7相關(guān)分析的作用n判斷變量之間有無聯(lián)系n確定相關(guān)關(guān)系的表現(xiàn)形式及相關(guān)分析方法 n把握相關(guān)關(guān)系的方向與密切程度 n為進一步采取其他統(tǒng)計方法進行分析提供依據(jù) n用來進行預(yù)測 .8相關(guān)分析和回歸分析區(qū)別n相關(guān)分析:.9散點圖 n通過觀察散點圖能夠直觀的發(fā)現(xiàn)變量之間的統(tǒng)計關(guān)系 以及它們的強弱程度和數(shù)據(jù)對的可能走向。散點圖以橫軸表示兩個變量中的一個變量,以縱軸表示另一個變量,將兩個變量之間相對應(yīng)的變量值以坐標(biāo)點的形式逐一標(biāo)在直角坐標(biāo)系中,通過點的分布形狀、分布模式

5、和疏密程度來形象描述兩個變量之間的相關(guān)關(guān)系。 .10n矩陣散點圖:以矩陣的形式在多個坐標(biāo)軸上分別顯示多對變量間的統(tǒng)計關(guān)系。變量在那一行,那一行橫坐標(biāo)就是它。.11線性相關(guān)的度量尺度數(shù)據(jù)間的相關(guān)性的度量nPearson相關(guān)系數(shù)n相關(guān)系數(shù)的數(shù)值范圍是介于1與 +1之間:q如果|r| 0,表明兩個變量沒有線性相關(guān)關(guān)系。q如果|r| 1 ,則表示兩個變量完全直線相關(guān)。線性相關(guān)的方向通過相關(guān)系數(shù)的符號來表示,“+”號表示正相關(guān),“”表示負(fù)相關(guān)。02201()()()()niiinniiiixxyyrxxyy.12n相關(guān)系數(shù)為0或接近于0不能說明兩個變量之間沒有相關(guān)性,它只說明沒有線性相關(guān)性。不能排除具有

6、其它非線性關(guān)系。nPearson 相關(guān)系數(shù)是一種線性關(guān)聯(lián)度量。如果兩個變量關(guān)系密切,但其關(guān)系不是線性的,則 Pearson 相關(guān)系數(shù)就不是適合度量其相關(guān)性的統(tǒng)計量。.13等級相關(guān)分析n等級相關(guān)分析 等級相關(guān)是指以等級次序排列或以等級次序表示的變量之間的相關(guān)。主要包括斯皮爾曼二列等級相關(guān)和肯德爾和諧系數(shù)多列等級相關(guān)。.14Spearman等級相關(guān)系數(shù)定序變量之間的相關(guān)性的度量n斯皮爾曼等級相關(guān)系數(shù):q兩個變量為定序變量。q一個變量為定序變量,另一個變量為尺度數(shù)據(jù),且兩總體不是正態(tài)分布,樣本容量n不一定大于30。q數(shù)據(jù)的秩:秩rank,是一種數(shù)據(jù)排序的方式,可以知道某變量值在該列所有值中的名次。秩

7、是對應(yīng)數(shù)值由大到小的,例如有100個數(shù)據(jù)都不一樣的話,最大的數(shù)值對應(yīng)的秩就是100,最小的就是1。有重復(fù)數(shù)據(jù)時候,會按同名稱排列。.15n設(shè)D是兩個變量每對數(shù)據(jù)的等級差,n是樣本量。 則Spearman相關(guān)系數(shù)為:21261(1)niiDrnn2210()nniiiiiDUV.16Kendall的tau-b(K) nKendall的 系數(shù)是另一種計算定序變量之間或者定序和尺度變量之間相關(guān)系數(shù)的方法。Spearman的等級相關(guān)系數(shù)可以方便檢驗兩個定序變量是否相關(guān),但是很難具體解釋兩個變量如何相關(guān)及相關(guān)程度。Kendall的等級相關(guān)系數(shù)可以同時反映兩個變量的相關(guān)程度。.17n設(shè)樣本量為n,考察兩個

8、變量X和Y之間的相關(guān)關(guān)系,X和Y的取值記為xi,yi。所有像(xi,yi)對的個數(shù)為n(n-1)/2(也就是 )。和分別表示和的秩次,如果對于任意k,有我們稱(xk,yk)為同序?qū)?;否則,稱為逆序?qū)?。n總的同序?qū)Φ膫€數(shù)記為U,逆序?qū)Φ膫€數(shù)記為V,則Kendall的Tau系數(shù)的定義為: 2()( 1 )U Vnn2nC2nC.18偏相關(guān)分析n概念:當(dāng)有多個變量存在時,為了研究任何兩個變量之間的關(guān)系,而使與這兩個變量有聯(lián)系的其它變量都保持不變。即控制了其它一個或多個變量的影響下,計算兩個變量的相關(guān)性。n偏相關(guān)系數(shù)偏相關(guān)系數(shù):偏相關(guān)系數(shù)是用來衡量任何兩個偏相關(guān)系數(shù)是用來衡量任何兩個變量之間的關(guān)系的大

9、小。變量之間的關(guān)系的大小。n自由度:自由度:在統(tǒng)計學(xué)中,自由度指的是計算某一在統(tǒng)計學(xué)中,自由度指的是計算某一統(tǒng)計量時,取值不受限制的變量個數(shù)。通常統(tǒng)計量時,取值不受限制的變量個數(shù)。通常df=n-k。其中。其中n為樣本含量,為樣本含量,k為被限制的條為被限制的條件數(shù)或變量個數(shù),或計算某一統(tǒng)計量時用到其件數(shù)或變量個數(shù),或計算某一統(tǒng)計量時用到其它獨立統(tǒng)計量的個數(shù)。它獨立統(tǒng)計量的個數(shù)。.19回歸分析n一元線性回歸模型: 其中x為自變量;y為因變量; 為截距,即常量; 為回歸系數(shù),表明自變量對因變量的影響程度。xy1001.20n用最小二乘法求解方程中的兩個參數(shù),得到21)()(xxyyxxiiixby

10、 0.21回歸方程統(tǒng)計檢驗n回歸方程的擬合優(yōu)度:回歸方程的擬合優(yōu)度:回歸直線與各觀測點的接近程度稱回歸直線與各觀測點的接近程度稱為回歸方程的擬合優(yōu)度,也就是為回歸方程的擬合優(yōu)度,也就是樣本觀測值聚集在回歸線樣本觀測值聚集在回歸線周圍的緊密程度周圍的緊密程度 。n 當(dāng)自變量是分類變量時,需要將原變量轉(zhuǎn)換成虛擬變量,當(dāng)自變量是分類變量時,需要將原變量轉(zhuǎn)換成虛擬變量,所有虛擬變量都是所有虛擬變量都是 “1” “1”和和“0”“0”取值的二分變量。(取值的二分變量。(例例如性別變量如性別變量).22回歸方程的統(tǒng)計檢驗n 即:總離差平方和(即:總離差平方和(SST)=SST)=剩余離差平方和剩余離差平方

11、和(SST) +(SST) +回歸離差回歸離差平方和(平方和(SSR)SSR)其中;其中;SSRSSR是由是由x x和和y y的直線回歸關(guān)系引起的,可的直線回歸關(guān)系引起的,可以由回歸直線做出解釋;以由回歸直線做出解釋;SSESSE是除了是除了x x對對y y的線性影響之外的隨的線性影響之外的隨機因素所引起的機因素所引起的Y Y的變動,是回歸直線所不能解釋的。的變動,是回歸直線所不能解釋的。222yyyyyy.23殘差分析n殘差是指由回歸方程計算得到的預(yù)測值與實際樣本值之間的差距,定義為: 對于線性回歸分析來講,如果方程能夠較好的反映被解釋變量的特征和規(guī)律性,那么殘差序列中應(yīng)不包含明顯的規(guī)律性。

12、殘差分析包括以下內(nèi)容:殘差服從正態(tài)分布,其平均值等于0;殘差取值與X的取值無關(guān);殘差不存在自相關(guān);殘差方差相等。 ).(22110ppiiiixxxyyye.24n對于殘差均值和方差齊性檢驗可以利用殘差圖進行分析。如果殘差均值為零對于殘差均值和方差齊性檢驗可以利用殘差圖進行分析。如果殘差均值為零,殘差圖的點應(yīng)該在縱坐標(biāo)為,殘差圖的點應(yīng)該在縱坐標(biāo)為0的中心的帶狀區(qū)域中隨機散落。如果殘差的方的中心的帶狀區(qū)域中隨機散落。如果殘差的方差隨著解釋變量值(或被解釋變量值)的增加呈有規(guī)律的變化趨勢,則出現(xiàn)差隨著解釋變量值(或被解釋變量值)的增加呈有規(guī)律的變化趨勢,則出現(xiàn)了異方差現(xiàn)象。了異方差現(xiàn)象。nDW檢驗:檢驗: DW檢驗用來檢驗殘差的自相關(guān)。檢驗統(tǒng)計量為檢驗用來檢驗殘差的自相關(guān)。檢驗統(tǒng)計量為 DW=2表示無自相關(guān),在表示無自相關(guān),在0-2之間說明存在正自相關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論