第3章 相關(guān)分析_第1頁
第3章 相關(guān)分析_第2頁
第3章 相關(guān)分析_第3頁
第3章 相關(guān)分析_第4頁
第3章 相關(guān)分析_第5頁
已閱讀5頁,還剩89頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第3章相關(guān)分析

相關(guān)分析的任務(wù),是揭示地理要素之間相互關(guān)系的密切程度。而地理要素之間相互關(guān)系密切程度的測定,主要是通過對相關(guān)系數(shù)的計算與檢驗來完成的。本節(jié)主要內(nèi)容:兩要素之間相關(guān)程度的測定多要素間相關(guān)程度的測定簡單相關(guān)分析是對兩個變量之間的相關(guān)程度進(jìn)行分析。簡單相關(guān)分析所用的指標(biāo)稱為簡單相關(guān)系數(shù),又稱為Pearson(皮爾森)相關(guān)系數(shù)。通常以ρ表示總體的相關(guān)系數(shù),以r表示樣本的相關(guān)系數(shù)(一)相關(guān)系數(shù)的計算與檢驗總體相關(guān)系數(shù)的定義式是:

其中,Cov(X,Y)是隨機變量X和Y的協(xié)方差;Var(X)和Var(Y)分別為變量X和Y的方差??傮w相關(guān)系數(shù)是反映兩變量之間線性相關(guān)程度的一種特征值,表現(xiàn)為一個常數(shù)。

樣本相關(guān)系數(shù)的計算

(3.1.1)兩個要素標(biāo)準(zhǔn)化后的積的平均數(shù)

和為兩要素的平均值。

公式(3.1.1)可簡化為(3.1.2)(1)說明:-1<=<=1

大于0時正相關(guān),小于0時負(fù)相關(guān)。的絕對值越接近于1,兩要素的關(guān)系越密切;越接近于0,兩要素的關(guān)系越不密切。(2)x與y是對稱的,說明x與y的相關(guān)系數(shù)等同于y與x的相關(guān)系數(shù)。(3)由于相關(guān)系數(shù)是x和y標(biāo)準(zhǔn)化后的結(jié)果,因此簡單相關(guān)系數(shù)是無量綱的。(4)對x和y做線性變換后可能會改變他們之間相關(guān)系數(shù)的符號(相關(guān)的方向),但不會改變相關(guān)系數(shù)的值。(5)相關(guān)系數(shù)能夠度量兩變量之間的線性關(guān)系,但并不是度量非線性關(guān)系的有效工具。(6)樣本相關(guān)系數(shù)是根據(jù)樣本觀測值計算的,抽取的樣本不同,其具體的數(shù)值也會有所差異。樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的一致估計量。表3.1.1倫敦的月平均氣溫與降水量

資料來源:.tw/V4/climate/wta_station/wta20.htm

相關(guān)分析實例

(1)根據(jù)表3.1.1中的數(shù)據(jù),我們可以利用公式(3.1.1),計算倫敦市月平均氣溫(t)與降水量(p)之間的相關(guān)系數(shù)

(2)計算結(jié)果表明,倫敦市的月平均氣溫(t)與降水量(p)之間呈負(fù)相關(guān),即異向相關(guān)。又如:根據(jù)甘肅省53個氣象臺站的多年平均數(shù)據(jù)(見教材表3.1.2),可以利用公式(3.1.1)對降水量(p)和緯度(y)之間的相關(guān)系數(shù)以及蒸發(fā)量(v)和緯度(y)之間的相關(guān)系數(shù)進(jìn)行計算,結(jié)果如下

==計算結(jié)果表明,降水量(p)和緯度(y)之間異向相關(guān),而蒸發(fā)量(v)與緯度(y)之間同向相關(guān)。

相關(guān)系數(shù)的檢驗

相關(guān)系數(shù)是根據(jù)要素之間的樣本值計算出來,它隨著樣本數(shù)的多少或取樣方式的不同而不同,因此它只是要素之間的樣本相關(guān)系數(shù),只有通過檢驗,才能知道它的可信度。檢驗是通過在給定的置信水平下,查相關(guān)系數(shù)檢驗的臨界值表來實現(xiàn)的。在X與Y都服從于正態(tài)分布,并且又有ρ=0的條件下,可以采用t檢驗來確定r的顯著性。其步驟如下:首先,計算相關(guān)系數(shù)r的t值:其次,根據(jù)給定的顯著性水平和自由度(n-2),查找t分布表中相應(yīng)的臨界值tα/2(或p值)。若|t|>tα/2(或p<α)表明r在統(tǒng)計上是顯著的。若|t|≤tα/2(或p≥α),表明r在統(tǒng)計上是不顯著的。

SPSS將自動計算Pearson簡單相關(guān)系數(shù)、t統(tǒng)計量的觀測值和對應(yīng)的概率p值。秩相關(guān)系數(shù)又稱Spearman等級相關(guān)系數(shù),或順序相關(guān)系數(shù),是將兩要素的樣本值按數(shù)據(jù)的大小順序排列位次,以各要素樣本值的位次代替實際數(shù)據(jù)而求得的一種統(tǒng)計量。

(二)秩相關(guān)系數(shù)的計算與檢驗其中,di

=(xi?yi

),x

i和iy

分別是兩個變量按大小(或優(yōu)劣等)排位的等級(稱為秩),n是樣本的容量。(3.1.4)

與簡單相關(guān)系數(shù)類似,Spearman等級相關(guān)系數(shù)的取值區(qū)間為:?1≤r

s≤1。

r

s為正值時,存在正的等級相關(guān),r

s取負(fù)值時,存在負(fù)的等級相關(guān)。

r

s=1,表明兩個變量的等級完全相同,存在完全正相關(guān)。r

s=-1,表明兩個變量的等級完全相反,存在完全的負(fù)相關(guān)。

教材中表3.1.4給出了2003年中國大陸各?。ㄖ陛犑?、自治區(qū))的GDP(x)和總?cè)丝冢▂)數(shù)據(jù)及其位次,將數(shù)據(jù)代入公式(3.1.4),就可以計算它們之間的秩相關(guān)系數(shù)即:GDP(x)與總?cè)丝冢▂)之間的等級相關(guān)系數(shù)為0.7847。

示例:Spearman等級相關(guān)系數(shù)檢驗

Spearman等級相關(guān)系數(shù)是根據(jù)一定的樣本計算的。兩個變量的總體是否存在顯著的等級相關(guān)也需要進(jìn)行檢驗。當(dāng)樣本容量n大于20時,可利用以下t統(tǒng)計量,進(jìn)行等級相關(guān)系數(shù)的顯著性檢驗??傮w等級相關(guān)系服從自由度為(n-2)的t分布。在給定的顯著水平α下,如按上式計算的t值(或者p值)大于臨界值tα/2(n?2)(或p<α),則可以認(rèn)為ρs

與0顯著差別,即兩種現(xiàn)象(兩個變量)的總體是否存在顯著的等級相關(guān)。

SPSS將自動計算Spearman相關(guān)系數(shù)、t統(tǒng)計量的觀測值和對應(yīng)的概率p值。(三)Kendall(肯德爾)的tau(τ)相關(guān)系數(shù)及其檢驗(了解)

Kendall(肯德爾)的tau相關(guān)系數(shù)由統(tǒng)計學(xué)家Kendall提出,適用于度量兩個定序變量X與Y之間的相關(guān)。共有三種形式:tau-a、tau-b和tau-c,公式分別為:其中,Ns為X和Y的同序?qū)Φ臄?shù)目;N

d

為X和Y的異序?qū)Φ臄?shù)目;T

x

為X中同分對的數(shù)目;T

y

為Y中同分對的數(shù)目;n為樣本容量;m為X與Y等級數(shù)較小者。所謂同序?qū)κ侵缸兞看笮№樞蛳嗤膬蓚€樣本觀測值,即其X的等級高低順序與Y的等級順序相同,否則稱為異序?qū)?;所謂同分對是指等級相同的一對樣本觀測值,如果樣本容量為n,則樣本觀測值兩兩組對的話一共可以有n(n-1)/2對。一般情況下,tau-a是在沒有同分對時采用,它表示同序?qū)Φ臄?shù)目與異序?qū)Φ臄?shù)目的差在全部可能對數(shù)中所占的比例。如果有同分對時常用tau-b和tau-c;如果X和Y的等級數(shù)相同,則可用tau-b,否則用tau-c。在SPSS中采用tau-b。特別注意,對不同類型的變量應(yīng)采用不同的相關(guān)系數(shù)來度量。兩個連續(xù)變量間呈線性相關(guān)時,使用Pearson積差相關(guān)系數(shù),不滿足積差相關(guān)分析的適用條件時,使用Spearman秩相關(guān)系數(shù)來描述.

Spearman相關(guān)系數(shù)又稱秩相關(guān)系數(shù),是利用兩變量的秩次大小作線性相關(guān)分析,對原始變量的分布不作要求,屬于非參數(shù)統(tǒng)計方法,適用范圍要廣些。對于服從Pearson相關(guān)系數(shù)的數(shù)據(jù)亦可計算Spearman相關(guān)系數(shù),但統(tǒng)計效能要低一些。Spearman相關(guān)系數(shù)的計算公式可以完全套用Spearman相關(guān)系數(shù)計算公式,但公式中的x和y用相應(yīng)的秩次代替即可。

Kendall‘stau-b等級相關(guān)系數(shù):用于反映分類變量相關(guān)性的指標(biāo),適用于兩個分類變量均為有序分類的情況。對相關(guān)的有序變量進(jìn)行非參數(shù)相關(guān)檢驗;取值范圍在-1-1之間,此檢驗適合于正方形表格;二、多要素間相關(guān)程度的測定偏相關(guān)系數(shù)的計算與檢驗復(fù)相關(guān)系數(shù)的計算與檢驗(一)偏相關(guān)系數(shù)的計算與檢驗①

定義:在多要素所構(gòu)成的地理系統(tǒng)中,先不考慮其他要素的影響,而單獨研究兩個要素之間的相互關(guān)系的密切程度,這稱為偏相關(guān)。用以度量偏相關(guān)程度的統(tǒng)計量,稱為偏相關(guān)系數(shù)。偏相關(guān)系數(shù)的計算

在計算簡單相關(guān)系數(shù)時,只需要掌握兩個變量的觀測數(shù)據(jù),并不考慮其他變量對這兩個變量可能產(chǎn)生的影響。而在計算偏相關(guān)系數(shù)時,需要掌握多個變量的數(shù)據(jù),一方面考慮多個變量相互之間可能產(chǎn)生的影響,一方面又采用一定的方法控制其他變量,專門考察兩個特定變量的凈相關(guān)關(guān)系。

在多變量相關(guān)的場合,由于變量之間存在錯綜復(fù)雜的關(guān)系,因此偏相關(guān)系數(shù)與簡單相關(guān)系數(shù)在數(shù)值上可能相差很大,有時甚至符號都可能相反。簡單相關(guān)系數(shù)受其他因素的影響,反映的往往是表面的非本質(zhì)的聯(lián)系,而偏相關(guān)系數(shù)則較能說明現(xiàn)象之間真實的聯(lián)系。

例如,一種商品的需求既受收入水平的影響又受其價格的影響。按照經(jīng)濟學(xué)理論,在一定的收入水平下,該商品的價格越高,商品的需求量就越小。也就是說,需求與價格之間應(yīng)當(dāng)是負(fù)相關(guān)??墒牵诂F(xiàn)實經(jīng)濟生活中,由于收入和價格常常都有不斷提高的趨勢,如果不考慮收入對需求的影響,僅僅利用需求和價格的時間序列數(shù)據(jù)去計算簡單相關(guān)系數(shù),就有可能得出價格越高需求越大的錯誤結(jié)論。②計算:3個要素的偏相關(guān)系數(shù)(3.1.5)

(3.1.6)

(3.1.7)

4個要素的偏相關(guān)系數(shù)(3.1.8)

(3.1.9)

(3.1.10)

(3.1.11)

例如:對于某4個地理要素x1,x2,x3,x4的23個樣本數(shù)據(jù),經(jīng)過計算得到了如下的單相關(guān)系數(shù)矩陣:

利用公式計算一級偏向關(guān)系數(shù),如表3.1.6所示:r12·3r13·2r14·2r14·3r23·1r24·1r24·3r24·1r34·20.8210.8080.6470.895-0.8630.9560.945-0.8750.371表3.1.6一級偏相關(guān)系數(shù)

利用公式計算二級偏相關(guān)系數(shù),如表3.1.7所示:表3.1.7二級偏相關(guān)系數(shù)

r12·34r13·24r14·23r23·14r24·13r34·12-0.1700.8020.635-0.1870.821-0.337

4個要素的一級偏相關(guān)系數(shù)有12個,這里給出了9個;二級偏相關(guān)系數(shù)有6個,這里全部給出來了。偏相關(guān)系數(shù)的性質(zhì)

偏相關(guān)系數(shù)分布的范圍在-1到1之間;②

偏相關(guān)系數(shù)的絕對值越大,表示其偏相關(guān)程度越大;③

偏相關(guān)系數(shù)的絕對值必小于或最多等于由同一系列資料所求得的復(fù)相關(guān)系數(shù),即R1·23≥|r12·3|。偏相關(guān)系數(shù)的顯著性檢驗

偏相關(guān)系數(shù)的顯著性檢驗,一般采用t檢驗法。其統(tǒng)計量計算公式為式中:為偏相關(guān)系數(shù);n為樣本數(shù);m為自變量個數(shù)。

(3.1.14)

查t分布表,在自由度為23-3-1=19時,t0.001=3.883,顯然,這表明在置信度水平=0.001上,偏相關(guān)系數(shù)r24·13是顯著的。譬如,對于上例計算得到的偏相關(guān)系數(shù)

,由于n=23,m=3,故選擇[Analyze]=>[Correlate]=>[Partial]

(二)復(fù)相關(guān)系數(shù)的計算與檢驗復(fù)相關(guān)系數(shù):反映幾個要素與某一個要素之間的復(fù)相關(guān)程度。復(fù)相關(guān)系數(shù)的計算當(dāng)有兩個自變量時當(dāng)有三個自變量時(3.1.15)

(3.1.16)當(dāng)有k個自變量時(3.1.17)

復(fù)相關(guān)系數(shù)的性質(zhì)

①復(fù)相關(guān)系數(shù)介于0到1之間,即②

復(fù)相關(guān)系數(shù)越大,則表明要素(變量)之間的相關(guān)程度越密切。復(fù)相關(guān)系數(shù)為1,表示完全相關(guān);復(fù)相關(guān)系數(shù)為0,表示完全無關(guān)。③

復(fù)相關(guān)系數(shù)必大于或至少等于單相關(guān)系數(shù)的絕對值。復(fù)相關(guān)系數(shù)的顯著性檢驗

F檢驗法。其統(tǒng)計量計算公式為(3.1.18)例題:在上例中,若以x4為因變量,x1,x2,x3為自變量,試計算x4與x1,x2,x3之間的復(fù)相關(guān)系數(shù)。解:按照公式(3.1.16)計算檢驗:,故復(fù)相關(guān)達(dá)到了極顯著水平。相關(guān)分析中應(yīng)注意的問題相關(guān)系數(shù)不解釋兩個變量間的因果關(guān)系,它只是表明了兩個變量間互相影響的程度和方向。有時兩變量之間不存在相關(guān)關(guān)系,但卻可能出現(xiàn)較高的相關(guān)系數(shù),要警惕虛假相關(guān)導(dǎo)致的錯誤結(jié)論。如何運用SPSS進(jìn)行相關(guān)分析數(shù)據(jù)準(zhǔn)備:來自歷年河南統(tǒng)計年鑒年份化肥施用量折純量d萬噸糧食產(chǎn)量d萬噸1986148.732545.71987135.582948.41988150.5726631989184.253149.41990213.183303.71991239.73010.31992251.13109.6199328836391994292.473253.81995322.23466.51996345.33839.91997355.33894.71998382.84009.61999399.94253.32000419.54101.52001441.74119.92002468.842102003467.93569.52004493.2426020055

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論