第10講 散點(diǎn)圖、相關(guān)系數(shù)教材_第1頁
第10講 散點(diǎn)圖、相關(guān)系數(shù)教材_第2頁
第10講 散點(diǎn)圖、相關(guān)系數(shù)教材_第3頁
第10講 散點(diǎn)圖、相關(guān)系數(shù)教材_第4頁
第10講 散點(diǎn)圖、相關(guān)系數(shù)教材_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

均值比較單樣本T檢驗(yàn)Analyze→CompareMeans→OneSampleTTest獨(dú)立樣本T檢驗(yàn)Analyze→CompareMeans→Independent-SamplesTTest配對樣本T檢驗(yàn)

Analyze→CompareMeans→Paired-SampleTTest上節(jié)回顧均值比較T檢驗(yàn)原假設(shè):xxxx的均值與yyyy的均值無顯著差異方法檢驗(yàn)的目的方法的前題條件舉

例單樣本T檢驗(yàn)檢驗(yàn)樣本均值與已知總體均值之間是否存在差異樣本總體服從正態(tài)分布某地區(qū)高考數(shù)學(xué)成績與全國數(shù)學(xué)高考成績均值是否存在顯著差異獨(dú)立樣本T檢驗(yàn)總體正態(tài)分布下,兩個(gè)獨(dú)立樣本均值之間是否存在顯著差異進(jìn)行比較的兩個(gè)樣本是獨(dú)立的,并且服從正態(tài)分布1.F檢驗(yàn)方差齊性2.T檢驗(yàn)樣本順序可調(diào)換,樣本數(shù)量可不同某大學(xué)隨機(jī)抽取若干個(gè)大學(xué)一年級學(xué)生,分析他們的大學(xué)入學(xué)考試成績在性別上是否存在顯著差異。配對樣本T檢驗(yàn)兩配對樣本總體的均值之間是否存在顯著差異1.配對要求兩組同質(zhì)受試對象配成對子或同一受試對象分別接受兩種不同的處理。2.樣本來自的兩個(gè)總體必須服從正態(tài)分布樣本順序不可調(diào)換,且樣本數(shù)必須相同。1.針對實(shí)驗(yàn)前學(xué)習(xí)成績和智商相同的兩組學(xué)生,分別進(jìn)行不同教學(xué)方法的訓(xùn)練,比較參與實(shí)驗(yàn)的兩組學(xué)生的學(xué)習(xí)成績是否存在顯著差異。2.某班學(xué)生在接愛一種新的教學(xué)方法培訓(xùn)后,學(xué)習(xí)成績是否有顯著變化。上節(jié)回顧3上節(jié)回顧4第10講

散點(diǎn)圖、相關(guān)系數(shù)5

相關(guān)概念6一、相關(guān)的概念變量之間關(guān)系的概念

客觀世界中,事物之間存在相互依存、相互制約、相互影響的關(guān)系。用于描述事物數(shù)量特征的變量之間也存在一定的關(guān)系。

這些關(guān)系分為兩種:

(1)函數(shù)關(guān)系:變量之間的一一對應(yīng)的關(guān)系,當(dāng)自變量x取一定值時(shí),因變量y依據(jù)函數(shù)關(guān)系取唯一的值。如:在單價(jià)確定時(shí),銷售量與銷售額之間的關(guān)系:y=f(x)

銷售額=價(jià)格*銷售量圓的面積與圓的半徑之間的關(guān)系:

圓面積=3.14*半徑^27一、相關(guān)的概念關(guān)系的概念(2)相關(guān)關(guān)系:如果變量之間存在密切的關(guān)系,但又不能由一個(gè)或幾個(gè)變量的值確定另一個(gè)變量的值,當(dāng)自變量x取一定值時(shí),因變量y的值可能有多個(gè),這種變量之間的非一一對應(yīng)的、不確定的關(guān)系,稱之為相關(guān)關(guān)系。如:子女身高與父母身高之間的關(guān)系證券指數(shù)與利率之間的關(guān)系8一、相關(guān)的概念相關(guān)關(guān)系的分類

(1)按相關(guān)的程度分為:完全相關(guān):一個(gè)變量的取值完全取決于另一個(gè)變量,數(shù)據(jù)點(diǎn)落在一條直線(或曲線)上相關(guān):一個(gè)變量的取值部分取決于另一個(gè)變量,數(shù)據(jù)點(diǎn)圍繞分布在一條直線(或曲線)上不相關(guān):兩個(gè)變量的數(shù)據(jù)點(diǎn)分布很分散,無任何規(guī)律

就是函數(shù)關(guān)系9一、相關(guān)的概念相關(guān)關(guān)系的分類

(2)按相關(guān)的表現(xiàn)形式分為:線性相關(guān):兩個(gè)變量之間的關(guān)系近似地表現(xiàn)為一條直線非線性相關(guān):兩個(gè)變量之間的關(guān)系近似地表現(xiàn)為一條曲線10一、相關(guān)的概念相關(guān)關(guān)系的分類

(3)按相關(guān)的方向分為:

正相關(guān):一個(gè)變量增加(減少),導(dǎo)致另一個(gè)變量增加(減少)

負(fù)相關(guān):一個(gè)變量增加(減少),導(dǎo)致另一個(gè)變量減少(增加)11一、相關(guān)的概念線性相關(guān)的四種相關(guān)關(guān)系

強(qiáng)正線性相關(guān):

一個(gè)變量x增加,導(dǎo)致另一個(gè)變量y明顯增加,說明x是影響變量y的主要因素弱正線性相關(guān):一個(gè)變量x增加,導(dǎo)致另一個(gè)變量y增加,但不明顯,說明x是影響變量y的因素,但不是唯一的影響因素強(qiáng)負(fù)線性相關(guān):一個(gè)變量x增加,導(dǎo)致另一個(gè)變量y明顯減少,說明x是影響變量y的主要因素弱負(fù)線性相關(guān):一個(gè)變量x增加,導(dǎo)致另一個(gè)變量y減少,但不明顯,說明x是影響變量y的因素,但不是唯一的影響因素12一、相關(guān)的概念相關(guān)分析的概念

相關(guān)分析就是描述兩個(gè)或兩個(gè)以上變量間關(guān)系密切程度的統(tǒng)計(jì)方法,有效地揭示事物之間相關(guān)關(guān)系的強(qiáng)弱程度。相關(guān)分析的方法

圖形(散點(diǎn)圖):常用的一種直觀的分析方法,將樣本數(shù)據(jù)點(diǎn)繪制在二維平面或三維空間上,根據(jù)這些數(shù)據(jù)點(diǎn)的分布特征,能夠直觀地研究變量間的統(tǒng)計(jì)關(guān)系以及它們的強(qiáng)弱程度和數(shù)據(jù)對的可能走向。

數(shù)值(相關(guān)系數(shù)):變量間關(guān)系的密切程度常以一個(gè)數(shù)量性指標(biāo)描述,這個(gè)指標(biāo)稱相關(guān)系數(shù)r=0.813一、相關(guān)的概念SPSS提供了三種相關(guān)分析的方法二元變量分析(

Bivariate):偏相關(guān)分析(

Partial):距離相關(guān)分析(

Distances):14

相關(guān)分析的方法15二、相關(guān)分析的方法散點(diǎn)圖

散點(diǎn)圖是相關(guān)分析過程中常用的一種直觀的分析方法;將樣本數(shù)據(jù)點(diǎn)繪制在二維平面或三維空間上,根據(jù)數(shù)據(jù)點(diǎn)的分布特征,直觀的研究變量之間的統(tǒng)計(jì)關(guān)系以及強(qiáng)弱程度。就兩個(gè)變量而言,如果變量之間的關(guān)系近似地表現(xiàn)為一條直線,則稱為線性相關(guān),如圖(a)和(b);如果變量之間的關(guān)系近似地表現(xiàn)為一條曲線,則稱為非線性相關(guān)或曲線相關(guān),如圖(c);如果兩個(gè)變量的觀測點(diǎn)很分散,無任何規(guī)律,則表示變量之間沒有相關(guān)關(guān)系,如圖(d)。(a)(b)(c)(d)16二、相關(guān)分析的方法相關(guān)系數(shù)

散點(diǎn)圖能夠直觀地反映變量之間的關(guān)系,但不精確。相關(guān)系數(shù)以數(shù)值的方式精確地反映了變量之間線性關(guān)系的強(qiáng)弱程度。相關(guān)系數(shù)通過正、負(fù)表示相關(guān)的方向,相關(guān)系數(shù)r的取值在-1~+1之間:

下表中是通過相關(guān)系數(shù)來描述相關(guān)程度

不同類型的變量采用不同的相關(guān)系數(shù)指標(biāo),但取值范圍和含義都是相同的相關(guān)系數(shù)取值范圍r=0|r|<0.3|r|=0.3~0.5|r|=0.5~0.8|r|>0.8|r|=1相關(guān)程度無相關(guān)微弱相關(guān)低度相關(guān)顯著相關(guān)高度相關(guān)完全相關(guān)17二、相關(guān)分析的方法相關(guān)系數(shù)的分類

Pearson簡單相關(guān)系數(shù)(皮爾遜)用來度量正態(tài)分布的定距變量間的線性相關(guān)關(guān)系

Pearson簡單相關(guān)系數(shù)要求變量來自的總體分布正態(tài)Spearman秩相關(guān)系數(shù)(斯皮爾曼)采用非參數(shù)檢驗(yàn)方法來度量定序變量間的線性相關(guān)關(guān)系不要求總體正態(tài)分布由于數(shù)據(jù)為非定距變量,因此不能直接采用原始數(shù)據(jù),而是利用數(shù)據(jù)的秩Kendallτ秩相關(guān)系數(shù)(肯德和諧系數(shù)、一致性系數(shù))

采用非參數(shù)檢驗(yàn)方法來度量定序變量間的線性相關(guān)關(guān)系多用于計(jì)算評價(jià)者的評定一致性看備注頁變量的值之間可以比較大小,兩個(gè)值的差有實(shí)際意義,這樣的變量叫定距變量。在調(diào)查被訪者的“年齡”和“每月平均收入”,都是定距變量。定序變量區(qū)別同一類別個(gè)案中等級次序的變量。定序變量能決定次序,也即變量的值能把研究對象排列高低或大小,具有>與<的數(shù)學(xué)特質(zhì)。例如文化程度可以分為大學(xué)、高中、初中、小學(xué)、文盲18二、相關(guān)分析的方法利用相關(guān)系數(shù)進(jìn)行變量之間線性關(guān)系的分析

利用相關(guān)系數(shù)進(jìn)行變量之間線性關(guān)系的分析分兩步:

(1)利用樣本數(shù)據(jù)計(jì)算樣本相關(guān)系數(shù)r;

(2)對樣本的總體是否存在顯著的線性關(guān)系進(jìn)行推測。

注:顯著的相關(guān)性并不能導(dǎo)出任何因果結(jié)論。19二、相關(guān)分析的方法對樣本的線性關(guān)系進(jìn)行推測步驟由于存在抽樣的隨機(jī)性以及樣本數(shù)量較少等原因,通常樣本相關(guān)系數(shù)不能直接反映樣本是否存在顯著的線性相關(guān)關(guān)系,需要通過假設(shè)檢驗(yàn)的方式對樣本的總體進(jìn)行統(tǒng)計(jì)推測。推測步驟

(1)提出零假設(shè)H0:兩總體線性不相關(guān)(或相關(guān)系數(shù)與0無顯著性差異)(2)選擇檢驗(yàn)統(tǒng)計(jì)量:對不同變量采用不同的相關(guān)系數(shù),同時(shí)也采用不同的檢驗(yàn)統(tǒng)計(jì)量(3)計(jì)算統(tǒng)計(jì)量的觀測值和對應(yīng)的概率p值;

(4)對總體的相關(guān)性進(jìn)行推斷20二、相關(guān)分析的方法根據(jù)概率P進(jìn)行解釋

檢驗(yàn)統(tǒng)計(jì)量的概率p值小于等于給定的顯著性水平α值(0.05),拒絕零假設(shè),認(rèn)為總體相關(guān)。若檢驗(yàn)統(tǒng)計(jì)量的概率p值大于給定的顯著性水平α值(0.05),接受零假設(shè),認(rèn)為總體不相關(guān)。

21

二元變量分析22三、二元變量分析概念

二元變量分析(Bivariate)是研究和分析兩個(gè)變量之間相關(guān)程度的統(tǒng)計(jì)方法。應(yīng)用很多時(shí)候都是通過兩個(gè)變量進(jìn)行相關(guān)分析,所以兩個(gè)變量之間相關(guān)程度的分析應(yīng)用十分廣泛。如:家庭收入與家庭消費(fèi)支出之間關(guān)系是否相關(guān)商品銷售價(jià)格與商品銷售額之間關(guān)系是否相關(guān)客戶滿意度與商業(yè)企業(yè)綜合競爭力之間關(guān)系是否相關(guān)廣告投入和銷售額之間關(guān)系是否相關(guān)23三、二元變量分析SPSS操作及案例分析

例一:為了研究某項(xiàng)職業(yè)技能和員工年齡之間的關(guān)系,對員工進(jìn)行職業(yè)技能測試,得到有關(guān)上述兩變量的數(shù)據(jù)表?,F(xiàn)以年齡作為自變量x,職業(yè)技能測試得分為因變量y,以兩變量數(shù)據(jù)為依據(jù),繪制散點(diǎn)圖分析兩變量之間的相關(guān)關(guān)系。注意:通過散點(diǎn)圖只是初步分析兩變量之間的相關(guān)關(guān)系

通常用散點(diǎn)圖描述相關(guān)關(guān)系的表達(dá)方式:

完全相關(guān)較強(qiáng)(正/負(fù))相關(guān)較弱(正/負(fù))相關(guān)不相關(guān)

24三、二元變量分析SPSS操作及案例分析結(jié)果分析:

從散點(diǎn)圖中可以看出,點(diǎn)的分布比較分散,在擬合線上或周圍的點(diǎn)分布較少,說明兩變量之間相關(guān)程度較弱。從擬合線的趨勢來看,職業(yè)技能和員工年齡之間之間有一定的相關(guān)關(guān)系,而且是隨著年齡的增加,職業(yè)技能測試得分會隨之上升,但上升幅度較小。所以上述兩變量之間具有較弱正相關(guān)的關(guān)系。通過對散點(diǎn)圖的編輯,可以添加擬合線25三、二元變量分析SPSS操作及案例分析操作步驟

Graphs→LegacyDialogs→Scatter/Dot…數(shù)據(jù)文件:8-Bivariate_age.sav保存文件:8-Bivariate_age.spv常用的散點(diǎn)圖類型簡單散點(diǎn)圖重疊散點(diǎn)圖矩陣散點(diǎn)圖三維散點(diǎn)圖單點(diǎn)散點(diǎn)圖26三、二元變量分析SPSS操作及案例分析散點(diǎn)圖的其他應(yīng)用(1)在散點(diǎn)圖中設(shè)置散點(diǎn)標(biāo)記。27三、二元變量分析SPSS操作及案例分析散點(diǎn)圖的其他應(yīng)用(2)在散點(diǎn)圖中設(shè)置散點(diǎn)標(biāo)簽。SPSS操作及案例分析散點(diǎn)圖的其他應(yīng)用(3)在散點(diǎn)圖中添加擬合線。28三、二元變量分析1.雙擊該圖區(qū)SPSS操作及案例分析散點(diǎn)圖的其他應(yīng)用(4)計(jì)算相關(guān)系數(shù)。Analyze→Correlate→Bivariate...29三、二元變量分析解釋:1.Sig.=0.041<0.05,拒絕H0假設(shè),表明兩變量之間是相關(guān)的。2.由于r=0.229<0.3,為微弱正相關(guān)。30三、二元變量分析SPSS操作及案例分析

例二:在有氧訓(xùn)練中,人的耗氧量y(毫升/分*千克體重)是衡量人的身體狀況的重要指標(biāo),它與多項(xiàng)指標(biāo)有關(guān)。為了研究人的耗氧量與多項(xiàng)指標(biāo)之間的關(guān)系,對31名測試者進(jìn)行測試。現(xiàn)以人的耗氧量y為因變量,多項(xiàng)指標(biāo)中之一1.5英里跑所用時(shí)間x3為自變量,通過散點(diǎn)圖和相關(guān)系數(shù),分析研究耗氧量y與1.5英里跑所用時(shí)間x3之間的相關(guān)關(guān)系。

31三、二元變量分析SPSS操作及案例分析結(jié)果分析:從散點(diǎn)圖中可以看出,耗氧量y與1.5英里跑所用時(shí)間x3之間存在較強(qiáng)負(fù)相關(guān)的關(guān)系,即1.5英里跑所用時(shí)間增加,耗氧量會隨之降低。伴隨概率P=0.000<0.01,說明兩變量之間是明顯相關(guān)關(guān)系;在相關(guān)系數(shù)表中,r=-0.832,說明兩變量之間高度負(fù)相關(guān)。32三、二元變量分析SPSS操作及案例分析結(jié)果分析:擬合線。33三、二元變量分析SPSS操作及案例分析例三:利用例二的數(shù)據(jù),分析因變量y(人的耗氧量),與自變量x1、x2、x3、x4、x5、x6之間的關(guān)系。與耗氧量有關(guān)的因素年齡x1(歲)體重x2(次/分)1.5英里跑所用時(shí)間x3(分)靜止時(shí)心跳速率x4(次/分)跑步時(shí)心跳速率x5(次/分)

跑步時(shí)最大心跳速率x6(次/分)34三、二元變量分析SPSS操作及案例分析結(jié)果圖:35三、二元變量分析SPSS操作及案例分析結(jié)果分析:

從相關(guān)系數(shù)計(jì)算結(jié)果來看:

(1)耗氧量y與1.5英里跑所用時(shí)間x3、靜止時(shí)心跳速率x4、跑步時(shí)心跳速率x5相關(guān)程度較高,其中耗氧量與1.5英里跑所用時(shí)間的r=-0.832,伴隨概率P=0.000<0.01,屬于高度負(fù)相關(guān);其他兩項(xiàng)r=-0.436,r=-0.420,伴隨概率P分別等于0.014和0.019大于0.01,但小于0.05屬于低度負(fù)相關(guān);(2)上述三個(gè)變量與耗氧量之間的關(guān)系都屬于負(fù)相關(guān)。結(jié)論:跑步速度快、靜止時(shí)心跳速率慢、跑步時(shí)心跳速率慢的人,耗氧量大;反之,耗氧量小。36三、二元變量分析SPSS操作及案例分析操作步驟:

操作步驟:Analyze→Correlate→Bivariate…數(shù)據(jù)文件:8-Bivariate.sav保存文件:8-Bivariate_all.spv37

偏相關(guān)分析38四、偏相關(guān)分析概念在多元相關(guān)分析中,由于受到其他變量的影響,在計(jì)算某兩個(gè)變量之間的相關(guān)系數(shù)時(shí),得到的結(jié)果往往不能真實(shí)反映變量之間的相關(guān)關(guān)系所以在多元相關(guān)分析中,通常將其他變量固定(控制),而計(jì)算某兩個(gè)變量之間的相關(guān)系數(shù),稱為偏相關(guān)系數(shù)。偏相關(guān)分析用于計(jì)算變量之間的偏相關(guān)系數(shù),可以判斷自變量對因變量的影響程度,舍棄影響較小的自變量,保留影響較大的自變量,從而更準(zhǔn)確地判斷變量之間的相關(guān)關(guān)系和相關(guān)程度。39四、偏相關(guān)分析SPSS操作及案例分析

例四:以數(shù)據(jù)文件“Cars.sav”為例,分析在油耗不變的情況下、汽車馬力(horse)和加速度(accel)的偏相關(guān)系數(shù)。40四、偏相關(guān)分析SPSS操作及案例分析結(jié)果分析

汽車馬力和加速度的偏相關(guān)系數(shù)為-0.622,有效樣本數(shù)為389,顯著性水平為0.000,這兩個(gè)變量的伴隨概率P=0.000小于0.01,屬于顯著負(fù)相關(guān)關(guān)系。結(jié)論:在油耗量不變的情況下,汽車發(fā)動(dòng)機(jī)功率越大,汽車加速到某個(gè)速度的時(shí)間越短。41四、偏相關(guān)分析SPSS操作及案例分析同樣是上述例子,(1)不考慮油耗量汽車馬力和加速度

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論