版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、精心整理精心整理、兩個變量的相關(guān)分析:Bivariate1.相關(guān)系數(shù)的含義相關(guān)分析是研究變量間密切程度的一種常用統(tǒng)計方法。相關(guān)系數(shù)是描述相關(guān)關(guān)系強弱程度和方 向的統(tǒng)計量,通常用r表示。1相關(guān)系數(shù)的取值范圍在-1和+1之間,即:Wr102計算結(jié)果,若r為正,則表明兩變量為正相關(guān);若r為負,則表明兩變量為負相關(guān)。3相關(guān)系數(shù)r的數(shù)值越接近于1(-1或+1),表示相關(guān)系數(shù)越強;越接近于0,表示相關(guān)系數(shù)越弱。如果r=1或-,則表示兩個現(xiàn)象完全直線性相關(guān)。如果=0,則表示兩個現(xiàn)象完全不相關(guān)(不是直線相關(guān))。說明X與丫之間沒有線性相關(guān)關(guān)系,但并不意味著X與丫之間沒有其它關(guān)系,如很強的非線性關(guān)系。直線相關(guān)系數(shù)
2、一般只適用與測定變量間的線性相關(guān)關(guān)系,若要衡量非線性相關(guān)時,一般應(yīng)采 用相關(guān)指數(shù)Ro2.常用的簡單相關(guān)系數(shù)(1)皮爾遜(Pearson)相關(guān)系數(shù)皮爾遜相關(guān)系數(shù)亦稱積矩相關(guān)系數(shù),1890年由英國統(tǒng)計學(xué)家卡爾?皮爾遜提出。定距變量之 間的相關(guān)關(guān)系測量常用Pearson系數(shù)法。計算公式如下:n(Xix)(yiy)r,(1)/ nnJ(XiX)2(yiy)2)i1i 1(1)式是樣本的相關(guān)系數(shù)。計算皮爾遜相關(guān)系數(shù)的數(shù)據(jù)要求:變量都是服從正態(tài)分布,相互獨立的連續(xù)數(shù)據(jù);兩個變量在散點圖上有線性相關(guān)趨勢;樣本容量(2)斯皮爾曼(Spearman)等級相關(guān)系數(shù)Spearman相關(guān)系數(shù)又稱秩相關(guān)系數(shù),是用來測度
3、兩個定序數(shù)據(jù)之間的線性相關(guān)程度的指標。相關(guān)分析|r0.3, 稱為微弱相關(guān)、0.3 |r0.5,稱為低度相關(guān)、0.5 r 0.8,稱為顯著(中度)相關(guān)、0.81,稱為高度相關(guān)r值很小,n 30 0精心整理精心整理當兩組變量值以等級次序表示時,可以用斯皮爾曼等級相關(guān)系數(shù)反映變量間的關(guān)系密切程度。它是根據(jù)數(shù)據(jù)的秩而不是原始數(shù)據(jù)來計算相關(guān)系數(shù)的,其計算過程包括:對連續(xù)數(shù)據(jù)的排秩、對離散數(shù)據(jù)的排序,利用每對數(shù)據(jù)等級的差額及差額平方,通過公式計算得到相關(guān)系數(shù)。其計算公式為:R6 d21E(2)(2)式中,R為等級相關(guān)系數(shù);d為每對數(shù)據(jù)等級之差;n為樣本容量。斯皮爾曼等級相關(guān)對數(shù)據(jù)條件的要求沒有積差相關(guān)系數(shù)
4、嚴格,等級評定資料,或者是由連續(xù)變量觀測資料轉(zhuǎn)化得到的等級資料,只要兩個變量的觀測值是成對的不論兩個變量的總體分布形態(tài)、樣本容量的大小如何,都可以用斯皮爾曼等級相關(guān)來進行研究。(3)肯德爾(Kendall)等級相關(guān)系數(shù)肯德爾(Kendall)等級相關(guān)系數(shù)是在考慮了結(jié)點(秩次相同)的條件下,測度兩組定序數(shù)據(jù)或等級數(shù)據(jù)線性相關(guān)程度的指標。它利用排序數(shù)據(jù)的秩,通過計算不一致數(shù)據(jù)對在總數(shù)據(jù)對中的比1I例,來反映變量間的線性關(guān)系的。其計算公式如下:/ -K(3)式中,K是肯德爾等級相關(guān)系數(shù);i是不一致數(shù)據(jù)對數(shù);n為樣本容量。計算肯德爾等級相關(guān)系數(shù)的數(shù)據(jù)要求與計算斯皮爾曼等級相關(guān)系數(shù)的數(shù)據(jù)要求相同。3.相
5、關(guān)系數(shù)的顯著性檢驗通常,我們用樣本相關(guān)系數(shù)作為總體相關(guān)系數(shù)P的估計值,而r僅說明樣本數(shù)據(jù)的X與丫的相關(guān)程度。有時候,由于樣本數(shù)據(jù)太少或其它偶然因素,使得樣本相關(guān)系數(shù)r值很大,而總體的X與丫并不存在真正的線性關(guān)系。 因而有必要通過樣本資料來對X與丫之間是否存在真正的線性相 關(guān)進行檢驗,即檢驗總體相關(guān)系數(shù)P是否為零(即原假設(shè)是:總體中兩個變量間的相關(guān)系數(shù)為0)。SPSS勺相關(guān)分析過程給出了該假設(shè)成立的概率(輸出結(jié)果中的 樣本簡單相關(guān)系數(shù)的檢驗方法為:Sig.)。當原假設(shè)H0:0,n 50時,檢驗統(tǒng)計量為:當原假設(shè)Ho:0,n 50時,檢驗統(tǒng)計量為:精心整理占f n 2(5)式中,r為簡單相關(guān)系數(shù);
6、n為觀測值個數(shù)(或樣本容量)。4.背景材料設(shè)有10個廠家,序號為1,2,10,各廠的投入成本記為X,所得產(chǎn)出記為y。各廠家的投入和產(chǎn)出如表7-18-1所示,根據(jù)這些數(shù)據(jù),可以認為投入和產(chǎn)出之間存在相關(guān)性嗎?表110個廠家的投入產(chǎn)出單位:萬元廠家12345678910投入20402030101020202030產(chǎn)出306040603040405030705.操作步驟5-1繪制散點圖的步驟(1)選擇菜單命令“Graphs”f“LegacyDialogs f“Scatter/Dot”,打開Scatter/Dot對話框,如圖1所示。圖1選擇散點圖窗口(2)選擇散點圖類型。SPS號供了五種類型的散點圖。
7、(3)根據(jù)所選擇的散點圖類型,單擊“Define”按鈕設(shè)置散點圖。不同類型的散點圖的設(shè)置略有差別。簡單散點圖(SimpleScatte)簡單散點圖的設(shè)置窗口如圖2所示。圖2簡單散點圖的設(shè)置窗口從對話框左側(cè)的變量列表中指定某個變量為散點圖的縱坐標和橫坐標,分別選入Y-Axis和X-Axis框中。這兩項是必選項??梢园炎鳛榉纸M的變量指定到SetMarkersby框中,根據(jù)該變量取值的不同對同一個散點圖中的各點標以不同的顏色(或形狀)。該項可以省略。把標記變量指定到LabelCasesby框中,表示將標記變量的各變量值標記在散點圖的旁邊。該項可以省略。從左側(cè)變量列表框中選擇變量到Panelby框中作
8、為分類變量,可以使該變量作為行(Rows)或列(Columns)將數(shù)據(jù)分成不同的組,便于比較。該項可以省略。選擇UseChartSpecificationsFrom選項,可以選擇散點圖的文件模板,單擊“File”可以選擇指定的文件。精心整理精心整理圖6單點散點圖設(shè)置窗口X-AxisVariable框中。其他設(shè)置與簡單散點圖相同。5-2計算簡單相關(guān)系數(shù)的操作步驟通過散點圖可以初步判斷變量是否具有線性趨勢。對具有線性趨勢的變量計算相應(yīng)的簡單相關(guān) 系數(shù)的步驟如下:精心整理單擊“Title”按鈕可以對散點圖的標題進行設(shè)置,單擊“Op tio ns”按鈕可以對缺失值以及是否顯示數(shù)據(jù)的標注進行設(shè)置。重疊散
9、點圖(OverlayScatter)重疊散點圖能同時生成多對相關(guān)變量間統(tǒng)計關(guān)系的散點圖,首先根據(jù)分類變量的不同取值對原始數(shù)據(jù)進行分類,然后對各分類數(shù)據(jù)做簡單散點圖。重疊散點圖的設(shè)置窗口如圖7-18-3所示。圖3重疊散點圖的設(shè)置窗口從左側(cè)框中選擇一對變量進入Pairs框中,其中前一個為圖的縱坐標變量(丫-Variabie,后一個作為圖的橫軸變量(X-Variable),可以通過點擊 Am 按鈕進行橫縱軸變量的調(diào)換。其他設(shè)置與同簡單散點圖都相同。矩陣散點圖(MatrixScatter)矩陣散點圖以方形矩陣的形式在多個坐標軸上分別顯示多對變量間的統(tǒng)計關(guān)系。矩陣散點圖的關(guān)鍵是弄清各矩陣單元中的橫縱變量
10、。矩陣散點圖的設(shè)置窗口如圖4所示。圖4矩陣散點圖的設(shè)置窗口把參與繪圖的若干變量指定到Matrixvariables框中。選擇變量的先后順序決定了矩陣對角線上變量的排列順序。其他設(shè)置也與簡單散點圖相同。三維散點圖(3-DScatter)三維散點圖生成三個相關(guān)變量的三維散點圖,由三個坐標軸對應(yīng)變量的數(shù)據(jù)決定,它以立體圖的形式展現(xiàn)三對變量間的統(tǒng)計關(guān)系。設(shè)置窗口如圖5所示。圖5三維散點圖設(shè)置窗口從左側(cè)的變量列表中指定三個變量分別選入Y-Axis X-Axis Z-Axis框中。其他設(shè)置均與簡單散點圖相同。單點散點圖(SampleDo)單點散點圖生成單個變量的散點圖,顯示數(shù)值型變量的每一個觀測值, 這些
11、值都堆積在X軸附近,由于沒有指定丫軸,所以數(shù)據(jù)點的丫坐標沒有特殊的含義。設(shè)置窗口如圖6所示。從左側(cè)變量列表中選擇一個變量選入精心整理精心整理(1)選擇菜單命令“An alyze”f“Correlate” “Bivariate”,打開兩變量相關(guān)分析的對話 框,如圖7所示。圖7兩變量相關(guān)分析窗口(2)選入需要進行相關(guān)分析的變量進入Variables框,至少需要選入兩個,如選入“投入”、“產(chǎn)出”變量。(3)在CorrelationCoefficients復(fù)選框中選擇需要計算的相關(guān)系數(shù)。主要有:Pearson復(fù)選框:選擇進行積距相關(guān)分析,即最常用的參數(shù)相關(guān)分析;Ken dallstau-b復(fù)選框:計算
12、Ken dalls等級相關(guān)系數(shù);Spearman復(fù)選框:計算Spearman相關(guān)系數(shù),即最常用的非參數(shù)相關(guān)分析(秩相關(guān))。(4)TestofSignificanee單選框用于確定是進行相關(guān)系數(shù)的單側(cè)(One-tailed)或雙側(cè)(Two-tailed)檢驗,系統(tǒng)默認雙側(cè)檢驗。(5)Flagsignificantcorrelations用于確定是否在結(jié)果中用星號標記有統(tǒng)計學(xué)意義的相關(guān)系數(shù),一般選中。此時P0.05的系數(shù)值旁會標記一個星號,P0.01的則標記兩個星號。(6)單擊Options按鈕,彈出Options對話框,選擇需要計算的描述統(tǒng)計量和統(tǒng)計分析,如圖8所示。圖8兩變量相關(guān)分析的Opti
13、ons子對話框在Statistics復(fù)選框中定義各變量輸出的描述統(tǒng)計量。Meansandstandarddeviations選項表示每個變量的樣本均值和標準差;Cross-produetdeviatio nsan dcovaria nces選項表示各對變量的離差平方和、樣本方差、兩變量的叉積離差以及協(xié)方差陣。叉積離差為Pearson相關(guān)系數(shù)公式中的分子部分;協(xié)方差為叉積離差/(n-1)。在Miss in gValues單選框中定義分析中對缺失值的處理方法,可以是具體分析用到的兩個變量有缺失值才去除該記錄(Excludecasespairwise,或只要該記錄中進行相關(guān)分析的變量有缺失值(無論具
14、體分析的兩個變量是否缺失),則在所有分析中均將該記錄去除(Excludescaseslistwise。(7)單擊“OK按鈕完成設(shè)置,提交運行。6.結(jié)果解析根據(jù)背景資料,禾用表1中的數(shù)據(jù),建立SPSS數(shù)據(jù)文件,分別將變量投入、產(chǎn)出選入Variables框中,并在Options子對話框選中Meansandstandarddeviations選項和Cross-productdeviationsandcovariances選項,其他選擇默認。結(jié)果如表2、表3所示。6-1表2為描述統(tǒng)計量,表3為相關(guān)分析結(jié)果。從表3中可以看出皮爾遜相關(guān)系數(shù)為0.759, 即投入與產(chǎn)出的相關(guān)系數(shù)為0.759,雙側(cè)檢驗的P值
15、為0.011,明顯小于0.05,拒絕二者不相關(guān)的精心整理精心整理精心整理原假設(shè)。因此,我們可以得出結(jié)論:可以認為投入與產(chǎn)出之間存在正相關(guān),當投入增加時,產(chǎn)出也 會相應(yīng)增加。表2描述統(tǒng)計量Descri ptiveStatisticsStd.DeviatMeanionN投入22.009.18910產(chǎn)出45.0014.33710表3簡單相關(guān)系數(shù)分析結(jié)果Correlations投入產(chǎn)出投入P earsonCorrelatio*1.759nSig.(2-tailed).011SumofSquaresand760.00900.00Cross-p roducts00Covariance84.444100.0
16、00N1010產(chǎn)出P earsonCorrelatio.759*1nSig.(2-tailed).011SumofSquaresand900.001850.0Cross-p roducts000Covariance100.00205.5506N1010*.Correlationissignificantatthe0.05level(2-tailed).6-2調(diào)用Bivariate過程命令時允許同時輸入兩個變量或兩個以上變量,但系統(tǒng)輸出的是變量間兩兩相關(guān)的相關(guān)系數(shù)。、偏相關(guān)分析:P artial1.偏相關(guān)分析的含義精心整理精心整理在實際問題中,兩變量的相關(guān)關(guān)系往往還要受到其他因素的影響,這些影響
17、有時候會使相關(guān)分析的結(jié)果變得不那么可靠。因此,引入了偏相關(guān)分析的方法。偏相關(guān)分析,也稱凈相關(guān)分析,是指 在研究兩個變量之間的線性相關(guān)關(guān)系時,將與這兩個變量有聯(lián)系的其他變量控制不變的統(tǒng)計方法。根據(jù)控制變量的個數(shù),偏相關(guān)分析分為零階偏相關(guān)分析、一階偏相關(guān)分析、二階偏相關(guān)分析等等。其中,零階偏相關(guān)分析是指沒有控制變量的相關(guān)分析,即一般的相關(guān)分析。一階偏相關(guān)分析是指有 一個控制變量的相關(guān)分析,二階偏相關(guān)分析是指有兩個控制變量的偏相關(guān)分析, 其他高階偏相關(guān)分 析以此類推。2.偏相關(guān)系數(shù)進行偏相關(guān)分析時要用到偏相關(guān)系數(shù)。偏相關(guān)系數(shù)是在多元相關(guān)分析中說明當某個自變量在其 他自變量固定不變時,分別同因變量線性
18、相關(guān)程度的指標。偏相關(guān)系數(shù)的取值范圍亦在-1+1之間, 其計算公式分別為:當有一個控制變量為X2時,變量X1和y之間的一階偏相關(guān)系數(shù)為:I3.對偏相關(guān)系數(shù)的檢驗方法在偏相關(guān)分析中,由于兩個變量之間的相關(guān)系數(shù)是在固定 (控制)了一個或幾個變量后進行的, 考慮到這種因素及抽樣誤差的影響,其檢驗統(tǒng)計量為:式中,r是特定的偏相關(guān)系數(shù);n為觀測值個數(shù);k為控制變量個數(shù);n k 2為自由度。4.背景材料某汽車制造商從某月中隨機抽出10天的電力消耗量、溫度、日產(chǎn)量等有關(guān)資料,數(shù)據(jù)如表4所示。結(jié)合多年管理經(jīng)驗,對電力消耗量、溫度、日產(chǎn)量的關(guān)系做出相關(guān)分析。 表4某汽車制造商的電力消耗量、溫度、日產(chǎn)量等數(shù)據(jù)表精
19、心整理12831201179110138512897510114871051081108ryxi?X2ryxiryx2rXiX22rX1X2J(1吆)(1越電力消耗(千瓦)I溫度(華氏)日產(chǎn)量精心整理12841101177107148511211841195.操作步驟5-1選擇菜單命令“Analyzef“Correlate”f“Partial”,打開偏相關(guān)分析的對話框,如圖9所示。圖9偏相關(guān)分析窗口5-2選入需要進行偏相關(guān)分析的變量進入Variables框中,至少需要選入兩個。5-3選擇需要在偏相關(guān)分析時進行控制的協(xié)變量進入Controllingfor框中,如果不選入,則進行的就是普通的相關(guān)分
20、析。5-4在TestofSignificance單選框中確定是進行相關(guān)系數(shù)的單側(cè)(One-tailed)或雙側(cè)(Two-tailed)檢驗,一般選雙側(cè)檢驗。5-5Dis playactualsig nifica ncelevel復(fù)選框用于表示在結(jié)果中給出確切的P值,一般選中。5-6單擊Options按鈕,彈出Options對話框,選擇需要計算的描述統(tǒng)計量和統(tǒng)計分析。如圖10所示。圖10偏相關(guān)分析的Options子對話框(1)Statistics復(fù)選框用于定義可選的描述統(tǒng)計量。其中,Meansandstandarddeviations表示每個變量的樣本均值和標準差;Zero-ordercorre
21、lations表示輸出包括控制變量在內(nèi)所有變量的相關(guān)矩 陣。(2)MissingValues單選框用于定義分析中對缺失值的處理方法,可以是具體分析用到的兩個 變量有缺失值才去除該記錄(Excludecasespairwise,或只要該記錄中進行相關(guān)分析的變量有缺失值(無論具體分析的兩個變量是否缺失),則在所有分析中均將該記錄去除(Excludescaseslistwise。系統(tǒng)默認為前者,以充分利用數(shù)據(jù)。6.結(jié)果解析這里我們選擇電力消耗、溫度作為待分析變量,把日產(chǎn)量作為控制變量,在Options子對話框中選中Meansandstandarddeviations選項,其他選擇系統(tǒng)默認。具體分析結(jié)果見表4、表5所示。精心整理精心整理6-1表5偏相關(guān)系數(shù)表中的結(jié)果表明,在控制了日產(chǎn)量變量后,電力消耗與溫度之間的偏相關(guān)系數(shù)為0.815,概率P值為0.007V0.05,從而表明兩者之間有高度的相關(guān)關(guān)系。表4偏相關(guān)分析描述統(tǒng)計量Descri ptiveStatisticsStd.DeviMean ation N電力10消耗11.701.636溫度82.003.88710日產(chǎn)量112.008.08310表5偏相關(guān)系數(shù)表CorrelationsControlVar
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度車展場地租賃與媒體合作合同3篇
- 2025年度農(nóng)產(chǎn)品出口質(zhì)量保障合同3篇
- 2025年度個人環(huán)保項目貸款合同(含環(huán)保指標達標)4篇
- 二零二五年度承包工地食堂員工心理健康關(guān)愛合同3篇
- 汕尾2025年廣東汕尾陸河縣第一批城鎮(zhèn)公益性崗位招聘筆試歷年參考題庫附帶答案詳解
- 數(shù)字化時代的學(xué)生管理與德育工作變革
- 二零二五年度倉儲設(shè)施租賃與運輸服務(wù)合同3篇
- 普洱2024年云南普洱市科學(xué)技術(shù)局城鎮(zhèn)公益性崗位工作人員招聘筆試歷年參考題庫附帶答案詳解
- 昭通2025年云南昭通巧家縣人力資源和社會保障局零星選調(diào)工作人員筆試歷年參考題庫附帶答案詳解
- 社交媒體時代孩子的行為模式與心理變化
- JT-T-496-2018公路地下通信管道高密度聚乙烯硅芯塑料管
- 人員密集場所消防安全管理培訓(xùn)
- 《聚焦客戶創(chuàng)造價值》課件
- PTW-UNIDOS-E-放射劑量儀中文說明書
- JCT587-2012 玻璃纖維纏繞增強熱固性樹脂耐腐蝕立式貯罐
- 保險學(xué)(第五版)課件全套 魏華林 第0-18章 緒論、風險與保險- 保險市場監(jiān)管、附章:社會保險
- 典范英語2b課文電子書
- 員工信息登記表(標準版)
- 17~18世紀意大利歌劇探析
- 春節(jié)工地停工復(fù)工計劃安排( 共10篇)
- 何以中國:公元前2000年的中原圖景
評論
0/150
提交評論