IBM-SPSS培訓:簡單線性回歸與相關_第1頁
IBM-SPSS培訓:簡單線性回歸與相關_第2頁
IBM-SPSS培訓:簡單線性回歸與相關_第3頁
IBM-SPSS培訓:簡單線性回歸與相關_第4頁
IBM-SPSS培訓:簡單線性回歸與相關_第5頁
已閱讀5頁,還剩46頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

IBM-SPSS

簡單線性回歸與相關13.1相關分析簡介13.1.1基本概念13.1.2相關系數的計算13.1.3SPSS中的相應功能13.1.1基本概念(1)線性相關:最簡單的一種關聯(lián)。(2)曲線相關:兩變量之間存在相關趨勢,但并非呈線性,而是一曲線。(3)非線性相關:X、Y之間沒有明顯的線性關系,卻存在著某種非線性關系,說明X仍是影響Y的因素。(4)秩相關:也稱等級相關,對原變量的分布不作要求,屬于非參數統(tǒng)計方法。(5)正相關與負相關:兩變量X、Y同增或同減,變化趨勢同向,稱為正相關,兩變量一增一減,變化趨勢反向,稱為負相關。(6)完全相關:相關系數的絕對值為1,分為完全正相關和完全負相關。13.1.2相關系數的計算1.相關系數基本思想相關分析往往考察的是兩個連續(xù)變量的相關關系,對任何類型的變量,都可以使用相應的指標進行相關關系的考察。統(tǒng)計學中,一般用樣本相關系數r來推斷總體相關系數ρ。對于反映有序變量或連續(xù)變量間關聯(lián)程度的參數,取值范圍r為-1~1,r>0為正相關,r<0為負相關,r=0為零相關。2.線性相關系數(Pearson積矩相關系數)線性相關,又稱簡單相關,用來定量描述兩個變量間線性關系密切程度和相關方向的統(tǒng)計指標,適用于二元正態(tài)分布資料。相關系數的計算公式為:相關系數的統(tǒng)計檢驗是計算t統(tǒng)計量,計算公式為:t統(tǒng)計量服從自由度為n-2的t分布。3.Spearman等級相關系數Spearman等級相關系數相當于Pearson相關系數的非參數形式,它是根據各數據的排序名次進行計算,取值范圍也在―1~1之間。適用于那些不滿足正態(tài)分布的資料、總體分布未知的資料和等級資料。rs的計算公式為:4.Kendall等級相關系數

Kendall等級相關系數是對兩個有序變量或兩個秩變量之間相關程度的度量統(tǒng)計量,屬于非參數統(tǒng)計范疇,它在計算時考慮了結點(秩相同的點)的影響。KendallTau-b,它利用變量值的秩數據,計算一致對數目(U)和非一致對數目(V),其計算公式為:13.1.3SPSS中的相應功能(1)“雙變量相關”過程:用于兩個或多個變量間的參數或非參數相關分析。(2)“偏相關”過程:若需要進行相關分析的兩個變量其取值均受到其他變量的影響,可以通過偏相關分析對其他變量進行控制,給出在控制其他變量影響后兩個變量的相關系數,分析思想和協(xié)方差分析類似。(3)“距離相關”過程:此過程可對同一變量內部各觀察單位間的數值或各個不同變量進行相似性或不相似性距離分析。13.2雙變量相關原理1.系數計算Pearson相關系數(積矩相關系數)就是人們定量地描述線性相關程度好壞的一個統(tǒng)計指標。樣本的相關系數用r表示,總體相關系數用ρ表示。相關系數的計算公式為:相關系數的特點:(1)相關系數r是一個無單位的量值,其取值范圍為-1≤r≤1。(2)r值為正表示正相關;r值為負表示負相關;r值等于0為零相關。(3)相關系數的絕對值越接近于1,表示兩變量間的相關關系的密切程度越高;越接近于0,則表示相關程度越不密切。(4)|r|=1,為完全相關。此種情況很少見。2.相關系數的檢驗方法常用的檢驗方法:(1)直接查相關系數臨界值表,比較︱r︱與臨界值,統(tǒng)計量絕對值越大,概率P越??;統(tǒng)計量絕對值越小,概率P越大。(2)t檢驗H0為=0,H1為≠0,統(tǒng)計量t值為:3.積矩相關系數應注意的問題(1)散點圖可以直觀地判斷兩變量間是否具有線性關系。(2)積矩相關系數要求兩變量符合雙變量正態(tài)分布。(3)作相關分析時,應該剔除離群值。(4)相關分析要有實際意義,兩變量相關并不代表兩變量間一定存在內在聯(lián)系。(5)樣本的相關系數為0時,并不意味著兩變量一定無相關性。(6)分層資料盲目合并時易出現(xiàn)假象。分析實例對某省9個地區(qū)水質的碘含量及其甲狀腺腫的患病率作調查后得到一組數據,如圖所示,試分析不同地區(qū)的甲狀腺腫的患病率高低與本地區(qū)水質的碘含量有無關聯(lián)?數據文件見例13-1.sav。利用散點圖觀察兩變量之間有無相關趨勢。1.操作步驟與界面說明

依次單擊菜單“分析”|“相關”|“雙變量…”命令。2.結果解釋(1)描述性輸出?!懊枋鲂越y(tǒng)計量”表格給出了兩個變量的基本統(tǒng)計信息,包括均值和標準差。(2)相關性輸出。“相關性”表格給出了Pearson相關系數及其檢驗結果??梢酝茢喑龅夂颗c甲狀腺腫之間存在著明顯的正相關。Spearman等級相關系數

結果顯示,Spearman相關系數為0.979,P<0.01,在α=0.05的水平上是拒絕原假設的,結論同前。

Kendall等級相關系數

此系數是用于反映分類變量相關性的指標,適用于兩個變量均為有序分類的情況。分析結果同前。13.3偏相關分析13.3.1含義在實際應用中,線性相關分析可能會受到其他變量的影響,只有在其他變量固定不變的情況下計算相關系數,才能真正反映它們之間的相關關系,這樣的相關分析稱為偏相關分析。13.3.2偏相關系數的計算偏相關系數的計算公式為:

就是在控制了第三個因素的影響下所計算的第一個、第二個因素之間的偏相關系數。分析實例

研究者測量得到20名男童身高X(cm)、體重Y(kg)、肺活量Z(L)的數據如圖所示,試對控制身高后的體重與肺活量之間的關系進行研究。數據文件見例13-2.sav。1.操作步驟與界面說明

(1)描述性輸出。“描述性統(tǒng)計量”給出關于三個變量的均值、標準差和頻數。(2)相關性輸出。“相關性”表格上部顯示三個變量之間都呈顯著的正相關。下部結果顯示在控制身高的影響后,體重與肺活量之間仍然呈正相關(r=0.461,P=0.047)。13.4距離相關在實際的相關分析中,變量可能多到無法用以上方法解決的地步,變量都攜帶了一定的信息,彼此之間又有重疊,這時往往需要先對各個指標的差異性、相似程度進行考察,根據結果再考慮如何進行進一步分析。距離分析就是簡化數據的一種預分析過程。距離分析可以計算距離測量指標或者相似性測量指標。1.距離測量指標(1)區(qū)間變量(連續(xù)變量):默認為Euclidean距離(歐氏距離);有Euclidean距離、平方Euclidean距離、塊等。(2)計數變量:默認為卡方統(tǒng)計量測量度量。(3)二分類變量:默認為Euclidean距離;有Euclidean距離、平方Euclidean距離、尺度差分、模式差別、方差等。2.相似性測量指標分為計量資料和二分類資料分析實例

有10名學生參加測試,檢測了7個指標,分別用變量X1---X7表示,對其進行距離測量,看看哪幾個距離比較接近,如圖所示。數據見“13-3.sav”。1.操作步驟與界面說明單擊度量按鈕,彈出下圖所示的對話框,單擊轉換欄的下拉列表,選則Z得分,單擊繼續(xù)后返回。2.結果解釋

(1)案例處理摘要。給出了數據使用的基本情況,主要是對于有無缺失值的統(tǒng)計信息,本例無缺失,全部用于分析。(2)近似矩陣,給出各變量之間的相似矩陣。13.5簡單回歸分析原理1.概念與要求(1)概念線性回歸(linearregression)是分析兩個定量變量間數量依存關系的統(tǒng)計分析方法。如果某一個變量隨著另一個變量的變化而變化,并且它們的變化關系呈直線趨勢,就可以用直線回歸方程來定量地描述它們之間的數量依存關系,這就是線性回歸分析。(2)要求①因變量Y與自變量X呈線性(linear)關系。②每個個體觀察值之間相互獨立(independent)。③應變量Y屬于正態(tài)隨機變量(normaldistribution)。④在一定范圍內,不同的X值所對應的隨機變量Y的方差相等(equalvariance)。2.計算和檢驗求直線回歸方程依據的是最小二乘法(leastsquaremethod)的原理,即各實測點到回歸直線的縱向距離的平方和最小,使回歸方程可以較好地反映各點的分布情況。a和b的計算式為:(1)方差分析其原理與前面的單因素方差分析相同,統(tǒng)計量F的計算公式為,(2)t檢驗檢驗統(tǒng)計量t的計算公式為,其中Sb為回歸系數的標準誤,3.回歸分析的統(tǒng)計預測所謂預測就是將預報因子(自變量)代入回歸方程對預報量進行估計。(1)總體均數的置信區(qū)間可對總體均數進行置信區(qū)間的估計,該范圍在散點圖上表現(xiàn)為一個二維空間的弧形區(qū)帶,也稱回歸直線的置信帶。相應的總體均數的()置信區(qū)間為:(2)個體Y值的預測區(qū)間個體Y值的預測區(qū)間為:。該區(qū)間是比總體回歸置信帶更遠離的兩條弧形曲線,以95%的區(qū)間為例,表示的是期望有95%的數據點所落入的范圍。分析實例1.操作步驟與界面說明2.結果解釋下圖所示是對模型中各個自變量納入模型情況進行的匯總,由表可見,只有一個自變量,變量選擇的方法為強行進入法,也就是將所有的自變量都放入模型中。如下是對回歸方程擬合情況的描述,可知相關系數的取值(R),相關系數的平方即決定系數,校正后的決定系數和回歸系數的標準誤。如下為對模型進行方差分析的結果,F(xiàn)=115.136,P=0.000,提示模型具有統(tǒng)計學意義。a=17.484,b=4.459,回歸方程為:13.5.3相關與回歸分析的區(qū)別與聯(lián)系1.區(qū)別(1)資料要求:相關分析要求兩個變量為均服從雙變量正態(tài)分布的隨機變量。回歸分析要求應變量服從正態(tài)分布,而自變量可以是正態(tài)分布的隨機變量,也可以是能精確測量和嚴格控制的變量。(2)統(tǒng)計意義:相關反映兩變量間的相互關系?;貧w則反映兩變量間的依存關系。(3)分析目的:相關分析表明兩變量間線性關系的密切程度及相關方向。回歸分析則用函數公式定量表達應變量隨自變量變化的關系。2.聯(lián)系(1)方向一致:對同一資料,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論