第七章SPSS的相關(guān)分析_第1頁
第七章SPSS的相關(guān)分析_第2頁
第七章SPSS的相關(guān)分析_第3頁
第七章SPSS的相關(guān)分析_第4頁
第七章SPSS的相關(guān)分析_第5頁
已閱讀5頁,還剩68頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七章

相關(guān)分析與檢驗(yàn)主要內(nèi)容方差分析回顧相關(guān)分析的概念列聯(lián)分析簡(jiǎn)單相關(guān)分析偏相關(guān)分析方差分析回顧概念:方差分析是從因變量的方差入手,研究諸多自變量中哪些變量是對(duì)因變量有顯著影響的變量,對(duì)因變量有顯著影響的各個(gè)自變量其不同水平以及各水平的交互搭配是如何影響因變量的。方差分析認(rèn)為因變量的變化受兩類因素的影響:第一,自變量不同水平所產(chǎn)生的影響;第二,隨機(jī)變量所產(chǎn)生的影響。這里的隨機(jī)變量指那些人為很難控制的因素,主要指試驗(yàn)過程中的抽樣誤差。單因素方差分析當(dāng)一個(gè)變量為定類變量,另一變量為定距變量時(shí),兩變量間是否有關(guān),通常以分組平均數(shù)比較的方法來考察。即按照定類變量的不同取值來分組,看每個(gè)分組的定距變量的平均數(shù)是否有差異。不同組間的平均數(shù)差異越小,兩個(gè)變量間的關(guān)系越弱;相反,平均數(shù)差異越大,變量間關(guān)系越強(qiáng)。單因素方差分析的基本步驟提出原假設(shè):自變量不同水平下因變量各總體的均值無顯著差異。選擇檢驗(yàn)統(tǒng)計(jì)量:F統(tǒng)計(jì)量。計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值和概率P值。給出顯著性水平,并作出決策。一、相關(guān)關(guān)系的概念(一)函數(shù)關(guān)系:指的是兩事物間的一種一一對(duì)應(yīng)的關(guān)系,即當(dāng)變量x取一定值時(shí),另一變量y可以依確定的函數(shù)取唯一確定的值。例如:商品的銷售額與銷售量之間的關(guān)系,在單價(jià)確定時(shí),給出銷售量可以唯一的確定銷售額。(二)相關(guān)關(guān)系:兩事物間非一一對(duì)應(yīng)的關(guān)系,即當(dāng)變量x取一定值時(shí),另一變量y無法依確定的函數(shù)取唯一確定的值。例如:家庭收入和支出、子女身高和父母身高之間的關(guān)系。這些事物之間存在一定的關(guān)系,但這些關(guān)系不能像函數(shù)關(guān)系那樣用一個(gè)數(shù)學(xué)函數(shù)式描述。相關(guān)分析內(nèi)容相關(guān)分析是分析客觀事物之間關(guān)系的數(shù)量分析方法,是統(tǒng)計(jì)分析方法中最重要的內(nèi)容之一。主要內(nèi)容:對(duì)變量間的相關(guān)關(guān)系進(jìn)行分析,包括簡(jiǎn)單相關(guān)分析和偏相關(guān)分析相關(guān)分析之一——有關(guān)與無關(guān)尋找變量間的關(guān)系是科學(xué)研究的首要目的。變量間的關(guān)系最簡(jiǎn)單的劃分即:有關(guān)與無關(guān)。在統(tǒng)計(jì)學(xué)上,我們通常這樣判斷變量之間是否有關(guān):如果一個(gè)變量的取值發(fā)生變化,另外一個(gè)變量的取值也相應(yīng)發(fā)生變化,則這兩個(gè)變量有關(guān)。如果一個(gè)變量的變化不引起另一個(gè)變量的變化則二者無關(guān)。性別與四級(jí)英語考試通過率的相關(guān)統(tǒng)計(jì)表述:統(tǒng)計(jì)結(jié)果顯示,當(dāng)性別取值不同時(shí),通過率變量的取值并未發(fā)生變化,因此性別與考試通過率無關(guān)。自變量的不同取值在因變量上無差異,兩變量無關(guān)。自變量的不同取值在因變量上有差異,兩變量有關(guān)。統(tǒng)計(jì)結(jié)果顯示,當(dāng)性別取值不同時(shí),收入變量的取值發(fā)生了變化,因此性別與月收入有關(guān)。自變量因變量變量關(guān)系的統(tǒng)計(jì)類型相關(guān)分析之二——關(guān)系強(qiáng)度變量關(guān)系強(qiáng)度的含義:指兩個(gè)變量相關(guān)程度的高低。統(tǒng)計(jì)學(xué)中是以準(zhǔn)實(shí)驗(yàn)的思想來分析變量相關(guān)的。通常從以下的角度分析:A)兩變量是否相互獨(dú)立。B)兩變量是否有共變趨勢(shì)。C)一變量的變化多大程度上能由另一變量的變化來解釋。變量關(guān)系強(qiáng)度測(cè)量的主要指標(biāo)相關(guān)分析之三——關(guān)系性質(zhì)直線相關(guān)與曲線相關(guān)正相關(guān)與負(fù)相關(guān)完全相關(guān)、不相關(guān)、不完全相關(guān)二、列聯(lián)相關(guān)(一)列聯(lián)分析的基本原理自變量發(fā)生變化,因變量取值是否也發(fā)生變化。比較邊緣百分比和條件百分比的差別??ǚ綔y(cè)量用來考察兩變量是否獨(dú)立(無關(guān))。其原理是根據(jù)這一概率定理:若兩變量無關(guān),則兩變量中聯(lián)合事件發(fā)生的概率應(yīng)等于各自獨(dú)立發(fā)生的概率乘積在列聯(lián)表中,這一定理就具體轉(zhuǎn)化為:若兩變量無關(guān),則兩變量中條件概率應(yīng)等于各自邊緣的概率乘積。反之,則兩變量有關(guān),或稱兩變量不獨(dú)立。由此可見,期望值(獨(dú)立模型)與觀察值的差距越大,說明兩變量越不獨(dú)立,也就越有相關(guān)。因此,卡方的表達(dá)式如下:卡方的取值在0~∞之間??ǚ街翟酱螅P(guān)聯(lián)性越強(qiáng)。在SPSS中,有PearsonX2和相似比卡方(LikelihoodRatioX2)兩種。

的改進(jìn)標(biāo)準(zhǔn)化系數(shù):為使值有一固定的區(qū)間,便于比較,采用了以下幾個(gè)修正:A、φ系數(shù)(Phi):(0~1),適用于2×2表。B、列聯(lián)系數(shù)(ContingencyCoefficient):(0~1),適用任意表。C、CramerV系數(shù):(0~1),適用任意表。D、λ系數(shù)(Lambda):(0~1),適用任意表。E、Goodman&Kruskal-tau系數(shù):(0~1),適用任意表。

(二)列聯(lián)表分析的功能根據(jù)收集到的樣本數(shù)據(jù)編制交叉列聯(lián)表;在交叉列聯(lián)表的基礎(chǔ)上,對(duì)兩兩變量間是否存在一定的相關(guān)性進(jìn)行分析。列聯(lián)表的格式(三)列聯(lián)表分析過程列聯(lián)表分析步驟:

按AnalyzeDescriptiveStatisticsCrosstabs順序打開Crosstabs主對(duì)話框。Crosstabs對(duì)話框TableFormat對(duì)話框決定各行的排列順序:升序降序(四)例1

為了探討吸煙與慢性支氣管炎有無關(guān)系,調(diào)查了339人,情況如下:吸煙和慢性支氣管炎調(diào)查表患慢性支氣管炎未患慢性支氣管炎吸煙43162不吸煙13121錄入數(shù)據(jù)“Crosstab.sav”。變量h為頻次;變量x為是否吸煙:1為吸煙,2為不吸煙;變量n為是否患?。?為患病,2為不患病。選擇變量h進(jìn)行加權(quán)。按Analyze--DescriptiveStatistics--Crootabs順序打開Crootabs主對(duì)話框。將x變量選入Row框作為行變量,將n變量選入Column框作為列變量。打開Statistics對(duì)話框,選中Chi-square\Contingencycoefficient和PhiandCramer’sV復(fù)選框,單擊Continue返回。單擊Cell按鈕,打開Celldisplay對(duì)話框,選中observed和Expected復(fù)選框,單擊Continue返回;單擊OK。1.操作步驟統(tǒng)計(jì)摘要表,列出觀測(cè)量有效值個(gè)數(shù)、缺失值個(gè)數(shù)和總的個(gè)數(shù)。

2.輸出結(jié)果及分析

吸煙與患病統(tǒng)計(jì)摘要表吸煙與患病列聯(lián)表卡方檢驗(yàn)

對(duì)稱性檢驗(yàn)表例2:利用住房狀況問卷調(diào)查數(shù)據(jù),分析本市戶口和外地戶口家庭對(duì)“未來三年是否打算買房”是否持相同態(tài)度。首先,在所調(diào)查的2880個(gè)樣本中有113個(gè)樣本因缺失值而被剔除,2712戶為本市戶口,168戶為外地戶口,分別占樣本總量的94.2%和5.8%,可見,本市戶口占多數(shù);未來三年不打算買房、打算買房的樣本量分別為2161和719,各占總樣本的75%和25%,不打算買房的占較大比例。其次,對(duì)不同戶口進(jìn)行分析。在本市戶口中未來三年不打算買房和打算買房的樣本量分別為2052和660,各占總樣本的75.7%和24.3%,不打算買房的仍占較大比例,但打算買房的低于總體比例的25%;在外地戶口中,未來三年不打算買房和打算買房的樣本量分別為109和59,各占總樣本的64.9%和35.1%,未來三年不打算買房的仍占較大比例,但打算買房的比例高于總體比例25%。最后,對(duì)不同看法進(jìn)行分析。如果顯著性水平設(shè)為0.05,則概率值小于0.05,拒絕原假設(shè),認(rèn)為本市戶口和外地戶口對(duì)未來三年是否打算買房的看法是不一致的。三、相關(guān)分析(Correlate)(一)簡(jiǎn)介相關(guān)分析用于描述兩個(gè)變量間聯(lián)系的密切程度,其特點(diǎn)是變量不分主次,被置于同等的地位。檢驗(yàn)的假設(shè)為相關(guān)系數(shù)為0??蛇x擇是單尾檢驗(yàn)還是雙尾檢驗(yàn)。在Analyze的下拉菜單Correlate命令項(xiàng)中有三個(gè)相關(guān)分析功能子命令Bivariate過程、Partial過程、Distances過程,分別對(duì)應(yīng)著相關(guān)分析、偏相關(guān)分析和相似性測(cè)度的三個(gè)spss過程。(二)相關(guān)分析類型Bivariate(雙變量)過程用于進(jìn)行兩個(gè)或多個(gè)變量間的相關(guān)分析,如為多個(gè)變量,給出兩兩相關(guān)的分析結(jié)果。Partial(偏相關(guān))過程,當(dāng)進(jìn)行相關(guān)分析的兩個(gè)變量的取值都受到其他變量的影響時(shí),就可以利用偏相關(guān)分析對(duì)其他變量進(jìn)行控制,輸出控制其他變量影響后的相關(guān)系數(shù)。Distances過程用于對(duì)同一變量各觀察單位間的數(shù)值或各個(gè)不同變量間進(jìn)行相似性或不相似性分析,一般不單獨(dú)使用,而作為因子分析等的預(yù)分析。(三)雙變量相關(guān)分析在進(jìn)行相關(guān)分析時(shí),散點(diǎn)圖是重要的工具,分析前應(yīng)先做散點(diǎn)圖,以初步確定兩個(gè)變量間是否存在相關(guān)趨勢(shì),該趨勢(shì)是否為直線趨勢(shì),以及數(shù)據(jù)中是否存在異常點(diǎn)。否則可能的出錯(cuò)誤結(jié)論。Bivariate相關(guān)分析的步驟:輸入數(shù)據(jù)后,依次單擊Analyze—Correlate—Bivariate,打開BivariateCorrelations對(duì)話框例1:利用住房狀況問卷調(diào)查數(shù)據(jù),分析家庭收入與打算購買的住房面積之間存在怎樣的統(tǒng)計(jì)關(guān)系。解題思路第一步:繪制散點(diǎn)圖第二步:計(jì)算相關(guān)系數(shù)散點(diǎn)圖類型簡(jiǎn)單散點(diǎn)圖:表示一對(duì)變量間統(tǒng)計(jì)關(guān)系的散點(diǎn)圖。重疊散點(diǎn)圖:表示多對(duì)變量間統(tǒng)計(jì)關(guān)系的散點(diǎn)圖。矩陣散點(diǎn)圖:以矩陣形式分別顯示多對(duì)變量間的統(tǒng)計(jì)關(guān)系。三維散點(diǎn)圖:以立體圖的形式展現(xiàn)三對(duì)變量間的統(tǒng)計(jì)關(guān)系。計(jì)算相關(guān)系數(shù)一、相關(guān)系數(shù)的特點(diǎn)雖然散點(diǎn)圖能夠直觀地展現(xiàn)變量之間的統(tǒng)計(jì)關(guān)系,但是并不精確。相關(guān)系數(shù)以數(shù)值的方式精確地反映了兩個(gè)變量間線性相關(guān)的強(qiáng)弱程度。線性關(guān)系的分析步驟第一,計(jì)算樣本相關(guān)系數(shù)r。相關(guān)系數(shù)r的取值在-1~+1之間,r>0表示兩變量存在正的線性相關(guān);r<0表示兩變量存在負(fù)的線性相關(guān)關(guān)系;r=0表示兩變量存在完全正線性相關(guān);r=﹣1表示兩變量存在完全負(fù)相關(guān)關(guān)系;r=0表示兩變量不存在線性相關(guān)關(guān)系;|r|>0.8表示兩變量之間有較強(qiáng)的線性相關(guān)關(guān)系;|r|<0.3表示兩變量之間的線性相關(guān)關(guān)系較弱。第二,對(duì)樣本來自的兩總體是否存在顯著的線性關(guān)系進(jìn)行推斷。具體步驟與假設(shè)檢驗(yàn)相同。對(duì)于此案例,通過繪制散點(diǎn)圖得知家庭收入與計(jì)劃購買住房面積之間存在一定的正的弱相關(guān)關(guān)系,為更準(zhǔn)確地反映兩者之間線性關(guān)系的強(qiáng)弱,采用計(jì)算相關(guān)系數(shù)的方法。由于這兩個(gè)變量均為定距變量,因此采用簡(jiǎn)單相關(guān)系數(shù)。由輸出結(jié)果可知,家庭收入與計(jì)劃購買的住房面積的簡(jiǎn)單相關(guān)系數(shù)為0.323,說明兩者之間存在正的弱相關(guān)性,其相關(guān)系數(shù)的檢驗(yàn)概率值近似為0。因此,當(dāng)顯著性水平為0.05時(shí)應(yīng)拒絕原假設(shè),認(rèn)為兩總體不是零相關(guān)。例2:定序變量的Spearman分析實(shí)例

為研究集團(tuán)迫使個(gè)人順從的效應(yīng),一些研究者用量表對(duì)12名大學(xué)生進(jìn)行了調(diào)查,數(shù)據(jù)如下。學(xué)生ABCDEFGHIJKL權(quán)威主義265110983412711地位欲342181110671259權(quán)威主義和地位欲評(píng)秩1)輸入數(shù)據(jù),依次單擊分析—相關(guān)分析—雙變量分析,打開雙變量分析對(duì)話框2)選擇power和position變量進(jìn)入Variables框中。3)在CorrelationCoefficients欄內(nèi)選擇Spearman。4)在TestofSignificance欄選擇Two-tailed。5)選擇Flagsignificantcorrelation。6)單擊Options按鈕,選擇Meanandstandarddeviations、Cross-productdeviationsandcovariances、Excludecasespairise選項(xiàng)。7)單擊OK。分析步驟:

從表中可看出,權(quán)威主義和地位欲的相關(guān)系數(shù)為0.818,這表明權(quán)威主義越高的人地位欲也越高。權(quán)威主義與地位欲不相關(guān)的假設(shè)檢驗(yàn)值為0.001,否定假設(shè),即權(quán)威主義與地位欲是相關(guān)的。結(jié)果分析:例3:定序變量的Kendall分析實(shí)例

仍用前例中的數(shù)據(jù)(數(shù)據(jù)文件:權(quán)威(Spearman相關(guān)).sav)。操作過程相同,只是在第3)步在CorrelationCoefficients欄內(nèi)選擇Kendall’s選項(xiàng)。結(jié)果如下:權(quán)威主義和地位欲的相關(guān)系數(shù)為0.667,這表明權(quán)威主義越高的人地位欲也越高。權(quán)威主義與地位欲不相關(guān)的假設(shè)檢驗(yàn)值為0.003,否定假設(shè),即權(quán)威主義與地位欲是相關(guān)的。結(jié)果類似于Spearman分析。簡(jiǎn)單相關(guān)分析計(jì)算兩個(gè)變量間的相關(guān)系數(shù),分析兩個(gè)變量間線性關(guān)系的程度,往往因?yàn)榈谌齻€(gè)變量的作用,使相關(guān)系數(shù)不能真正反映兩個(gè)變量間的線性程度。例如:在研究商品的需求量和價(jià)格、消費(fèi)者收入之間的關(guān)系時(shí)會(huì)發(fā)現(xiàn),需求量和價(jià)格之間的相關(guān)關(guān)系實(shí)際還包含了消費(fèi)者收入對(duì)商品需求量的影響,同時(shí),收入對(duì)價(jià)格也產(chǎn)生了影響,并通過價(jià)格變動(dòng)傳遞到對(duì)商品需求量的影響中。偏相關(guān)分析的任務(wù)就是在研究?jī)蓚€(gè)變量之間的線性相關(guān)關(guān)系時(shí)控制可能對(duì)其產(chǎn)生影響的變量。(四)偏相關(guān)分析Pearson偏相關(guān)系數(shù)假設(shè)檢驗(yàn)的t統(tǒng)計(jì)量:其中,r是相應(yīng)的偏相關(guān)系數(shù),n是觀測(cè)量數(shù),k是控制變量的數(shù)目,n-k-2是自由度。當(dāng)t>t0.0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論