




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第3章相關(guān)分析
相關(guān)分析的任務(wù),是揭示地理要素之間相互關(guān)系的密切程度。而地理要素之間相互關(guān)系密切程度的測定,主要是通過對相關(guān)系數(shù)的計(jì)算與檢驗(yàn)來完成的。本節(jié)主要內(nèi)容:兩要素之間相關(guān)程度的測定多要素間相關(guān)程度的測定簡單相關(guān)分析是對兩個(gè)變量之間的相關(guān)程度進(jìn)行分析。簡單相關(guān)分析所用的指標(biāo)稱為簡單相關(guān)系數(shù),又稱為Pearson(皮爾森)相關(guān)系數(shù)。通常以ρ表示總體的相關(guān)系數(shù),以r表示樣本的相關(guān)系數(shù)(一)相關(guān)系數(shù)的計(jì)算與檢驗(yàn)總體相關(guān)系數(shù)的定義式是:
其中,Cov(X,Y)是隨機(jī)變量X和Y的協(xié)方差;Var(X)和Var(Y)分別為變量X和Y的方差。總體相關(guān)系數(shù)是反映兩變量之間線性相關(guān)程度的一種特征值,表現(xiàn)為一個(gè)常數(shù)。
樣本相關(guān)系數(shù)的計(jì)算
(3.1.1)兩個(gè)要素標(biāo)準(zhǔn)化后的積的平均數(shù)
和為兩要素的平均值。
公式(3.1.1)可簡化為(3.1.2)(1)說明:-1<=<=1
大于0時(shí)正相關(guān),小于0時(shí)負(fù)相關(guān)。的絕對值越接近于1,兩要素的關(guān)系越密切;越接近于0,兩要素的關(guān)系越不密切。(2)x與y是對稱的,說明x與y的相關(guān)系數(shù)等同于y與x的相關(guān)系數(shù)。(3)由于相關(guān)系數(shù)是x和y標(biāo)準(zhǔn)化后的結(jié)果,因此簡單相關(guān)系數(shù)是無量綱的。(4)對x和y做線性變換后可能會(huì)改變他們之間相關(guān)系數(shù)的符號(hào)(相關(guān)的方向),但不會(huì)改變相關(guān)系數(shù)的值。(5)相關(guān)系數(shù)能夠度量兩變量之間的線性關(guān)系,但并不是度量非線性關(guān)系的有效工具。(6)樣本相關(guān)系數(shù)是根據(jù)樣本觀測值計(jì)算的,抽取的樣本不同,其具體的數(shù)值也會(huì)有所差異。樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的一致估計(jì)量。表3.1.1倫敦的月平均氣溫與降水量
資料來源:.tw/V4/climate/wta_station/wta20.htm
相關(guān)分析實(shí)例
(1)根據(jù)表3.1.1中的數(shù)據(jù),我們可以利用公式(3.1.1),計(jì)算倫敦市月平均氣溫(t)與降水量(p)之間的相關(guān)系數(shù)
(2)計(jì)算結(jié)果表明,倫敦市的月平均氣溫(t)與降水量(p)之間呈負(fù)相關(guān),即異向相關(guān)。又如:根據(jù)甘肅省53個(gè)氣象臺(tái)站的多年平均數(shù)據(jù)(見教材表3.1.2),可以利用公式(3.1.1)對降水量(p)和緯度(y)之間的相關(guān)系數(shù)以及蒸發(fā)量(v)和緯度(y)之間的相關(guān)系數(shù)進(jìn)行計(jì)算,結(jié)果如下
==計(jì)算結(jié)果表明,降水量(p)和緯度(y)之間異向相關(guān),而蒸發(fā)量(v)與緯度(y)之間同向相關(guān)。
相關(guān)系數(shù)的檢驗(yàn)
相關(guān)系數(shù)是根據(jù)要素之間的樣本值計(jì)算出來,它隨著樣本數(shù)的多少或取樣方式的不同而不同,因此它只是要素之間的樣本相關(guān)系數(shù),只有通過檢驗(yàn),才能知道它的可信度。檢驗(yàn)是通過在給定的置信水平下,查相關(guān)系數(shù)檢驗(yàn)的臨界值表來實(shí)現(xiàn)的。在X與Y都服從于正態(tài)分布,并且又有ρ=0的條件下,可以采用t檢驗(yàn)來確定r的顯著性。其步驟如下:首先,計(jì)算相關(guān)系數(shù)r的t值:其次,根據(jù)給定的顯著性水平和自由度(n-2),查找t分布表中相應(yīng)的臨界值tα/2(或p值)。若|t|>tα/2(或p<α)表明r在統(tǒng)計(jì)上是顯著的。若|t|≤tα/2(或p≥α),表明r在統(tǒng)計(jì)上是不顯著的。
SPSS將自動(dòng)計(jì)算Pearson簡單相關(guān)系數(shù)、t統(tǒng)計(jì)量的觀測值和對應(yīng)的概率p值。秩相關(guān)系數(shù)又稱Spearman等級(jí)相關(guān)系數(shù),或順序相關(guān)系數(shù),是將兩要素的樣本值按數(shù)據(jù)的大小順序排列位次,以各要素樣本值的位次代替實(shí)際數(shù)據(jù)而求得的一種統(tǒng)計(jì)量。
(二)秩相關(guān)系數(shù)的計(jì)算與檢驗(yàn)其中,di
=(xi?yi
),x
i和iy
分別是兩個(gè)變量按大?。ɑ騼?yōu)劣等)排位的等級(jí)(稱為秩),n是樣本的容量。(3.1.4)
與簡單相關(guān)系數(shù)類似,Spearman等級(jí)相關(guān)系數(shù)的取值區(qū)間為:?1≤r
s≤1。
r
s為正值時(shí),存在正的等級(jí)相關(guān),r
s取負(fù)值時(shí),存在負(fù)的等級(jí)相關(guān)。
r
s=1,表明兩個(gè)變量的等級(jí)完全相同,存在完全正相關(guān)。r
s=-1,表明兩個(gè)變量的等級(jí)完全相反,存在完全的負(fù)相關(guān)。
教材中表3.1.4給出了2003年中國大陸各?。ㄖ陛犑小⒆灾螀^(qū))的GDP(x)和總?cè)丝冢▂)數(shù)據(jù)及其位次,將數(shù)據(jù)代入公式(3.1.4),就可以計(jì)算它們之間的秩相關(guān)系數(shù)即:GDP(x)與總?cè)丝冢▂)之間的等級(jí)相關(guān)系數(shù)為0.7847。
示例:Spearman等級(jí)相關(guān)系數(shù)檢驗(yàn)
Spearman等級(jí)相關(guān)系數(shù)是根據(jù)一定的樣本計(jì)算的。兩個(gè)變量的總體是否存在顯著的等級(jí)相關(guān)也需要進(jìn)行檢驗(yàn)。當(dāng)樣本容量n大于20時(shí),可利用以下t統(tǒng)計(jì)量,進(jìn)行等級(jí)相關(guān)系數(shù)的顯著性檢驗(yàn)??傮w等級(jí)相關(guān)系服從自由度為(n-2)的t分布。在給定的顯著水平α下,如按上式計(jì)算的t值(或者p值)大于臨界值tα/2(n?2)(或p<α),則可以認(rèn)為ρs
與0顯著差別,即兩種現(xiàn)象(兩個(gè)變量)的總體是否存在顯著的等級(jí)相關(guān)。
SPSS將自動(dòng)計(jì)算Spearman相關(guān)系數(shù)、t統(tǒng)計(jì)量的觀測值和對應(yīng)的概率p值。(三)Kendall(肯德爾)的tau(τ)相關(guān)系數(shù)及其檢驗(yàn)(了解)
Kendall(肯德爾)的tau相關(guān)系數(shù)由統(tǒng)計(jì)學(xué)家Kendall提出,適用于度量兩個(gè)定序變量X與Y之間的相關(guān)。共有三種形式:tau-a、tau-b和tau-c,公式分別為:其中,Ns為X和Y的同序?qū)Φ臄?shù)目;N
d
為X和Y的異序?qū)Φ臄?shù)目;T
x
為X中同分對的數(shù)目;T
y
為Y中同分對的數(shù)目;n為樣本容量;m為X與Y等級(jí)數(shù)較小者。所謂同序?qū)κ侵缸兞看笮№樞蛳嗤膬蓚€(gè)樣本觀測值,即其X的等級(jí)高低順序與Y的等級(jí)順序相同,否則稱為異序?qū)?;所謂同分對是指等級(jí)相同的一對樣本觀測值,如果樣本容量為n,則樣本觀測值兩兩組對的話一共可以有n(n-1)/2對。一般情況下,tau-a是在沒有同分對時(shí)采用,它表示同序?qū)Φ臄?shù)目與異序?qū)Φ臄?shù)目的差在全部可能對數(shù)中所占的比例。如果有同分對時(shí)常用tau-b和tau-c;如果X和Y的等級(jí)數(shù)相同,則可用tau-b,否則用tau-c。在SPSS中采用tau-b。特別注意,對不同類型的變量應(yīng)采用不同的相關(guān)系數(shù)來度量。兩個(gè)連續(xù)變量間呈線性相關(guān)時(shí),使用Pearson積差相關(guān)系數(shù),不滿足積差相關(guān)分析的適用條件時(shí),使用Spearman秩相關(guān)系數(shù)來描述.
Spearman相關(guān)系數(shù)又稱秩相關(guān)系數(shù),是利用兩變量的秩次大小作線性相關(guān)分析,對原始變量的分布不作要求,屬于非參數(shù)統(tǒng)計(jì)方法,適用范圍要廣些。對于服從Pearson相關(guān)系數(shù)的數(shù)據(jù)亦可計(jì)算Spearman相關(guān)系數(shù),但統(tǒng)計(jì)效能要低一些。Spearman相關(guān)系數(shù)的計(jì)算公式可以完全套用Spearman相關(guān)系數(shù)計(jì)算公式,但公式中的x和y用相應(yīng)的秩次代替即可。
Kendall‘stau-b等級(jí)相關(guān)系數(shù):用于反映分類變量相關(guān)性的指標(biāo),適用于兩個(gè)分類變量均為有序分類的情況。對相關(guān)的有序變量進(jìn)行非參數(shù)相關(guān)檢驗(yàn);取值范圍在-1-1之間,此檢驗(yàn)適合于正方形表格;二、多要素間相關(guān)程度的測定偏相關(guān)系數(shù)的計(jì)算與檢驗(yàn)復(fù)相關(guān)系數(shù)的計(jì)算與檢驗(yàn)(一)偏相關(guān)系數(shù)的計(jì)算與檢驗(yàn)①
定義:在多要素所構(gòu)成的地理系統(tǒng)中,先不考慮其他要素的影響,而單獨(dú)研究兩個(gè)要素之間的相互關(guān)系的密切程度,這稱為偏相關(guān)。用以度量偏相關(guān)程度的統(tǒng)計(jì)量,稱為偏相關(guān)系數(shù)。偏相關(guān)系數(shù)的計(jì)算
在計(jì)算簡單相關(guān)系數(shù)時(shí),只需要掌握兩個(gè)變量的觀測數(shù)據(jù),并不考慮其他變量對這兩個(gè)變量可能產(chǎn)生的影響。而在計(jì)算偏相關(guān)系數(shù)時(shí),需要掌握多個(gè)變量的數(shù)據(jù),一方面考慮多個(gè)變量相互之間可能產(chǎn)生的影響,一方面又采用一定的方法控制其他變量,專門考察兩個(gè)特定變量的凈相關(guān)關(guān)系。
在多變量相關(guān)的場合,由于變量之間存在錯(cuò)綜復(fù)雜的關(guān)系,因此偏相關(guān)系數(shù)與簡單相關(guān)系數(shù)在數(shù)值上可能相差很大,有時(shí)甚至符號(hào)都可能相反。簡單相關(guān)系數(shù)受其他因素的影響,反映的往往是表面的非本質(zhì)的聯(lián)系,而偏相關(guān)系數(shù)則較能說明現(xiàn)象之間真實(shí)的聯(lián)系。
例如,一種商品的需求既受收入水平的影響又受其價(jià)格的影響。按照經(jīng)濟(jì)學(xué)理論,在一定的收入水平下,該商品的價(jià)格越高,商品的需求量就越小。也就是說,需求與價(jià)格之間應(yīng)當(dāng)是負(fù)相關(guān)。可是,在現(xiàn)實(shí)經(jīng)濟(jì)生活中,由于收入和價(jià)格常常都有不斷提高的趨勢,如果不考慮收入對需求的影響,僅僅利用需求和價(jià)格的時(shí)間序列數(shù)據(jù)去計(jì)算簡單相關(guān)系數(shù),就有可能得出價(jià)格越高需求越大的錯(cuò)誤結(jié)論。②計(jì)算:3個(gè)要素的偏相關(guān)系數(shù)(3.1.5)
(3.1.6)
(3.1.7)
4個(gè)要素的偏相關(guān)系數(shù)(3.1.8)
(3.1.9)
(3.1.10)
(3.1.11)
例如:對于某4個(gè)地理要素x1,x2,x3,x4的23個(gè)樣本數(shù)據(jù),經(jīng)過計(jì)算得到了如下的單相關(guān)系數(shù)矩陣:
利用公式計(jì)算一級(jí)偏向關(guān)系數(shù),如表3.1.6所示:r12·3r13·2r14·2r14·3r23·1r24·1r24·3r24·1r34·20.8210.8080.6470.895-0.8630.9560.945-0.8750.371表3.1.6一級(jí)偏相關(guān)系數(shù)
利用公式計(jì)算二級(jí)偏相關(guān)系數(shù),如表3.1.7所示:表3.1.7二級(jí)偏相關(guān)系數(shù)
r12·34r13·24r14·23r23·14r24·13r34·12-0.1700.8020.635-0.1870.821-0.337
4個(gè)要素的一級(jí)偏相關(guān)系數(shù)有12個(gè),這里給出了9個(gè);二級(jí)偏相關(guān)系數(shù)有6個(gè),這里全部給出來了。偏相關(guān)系數(shù)的性質(zhì)
①
偏相關(guān)系數(shù)分布的范圍在-1到1之間;②
偏相關(guān)系數(shù)的絕對值越大,表示其偏相關(guān)程度越大;③
偏相關(guān)系數(shù)的絕對值必小于或最多等于由同一系列資料所求得的復(fù)相關(guān)系數(shù),即R1·23≥|r12·3|。偏相關(guān)系數(shù)的顯著性檢驗(yàn)
偏相關(guān)系數(shù)的顯著性檢驗(yàn),一般采用t檢驗(yàn)法。其統(tǒng)計(jì)量計(jì)算公式為式中:為偏相關(guān)系數(shù);n為樣本數(shù);m為自變量個(gè)數(shù)。
(3.1.14)
查t分布表,在自由度為23-3-1=19時(shí),t0.001=3.883,顯然,這表明在置信度水平=0.001上,偏相關(guān)系數(shù)r24·13是顯著的。譬如,對于上例計(jì)算得到的偏相關(guān)系數(shù)
,由于n=23,m=3,故選擇[Analyze]=>[Correlate]=>[Partial]
(二)復(fù)相關(guān)系數(shù)的計(jì)算與檢驗(yàn)復(fù)相關(guān)系數(shù):反映幾個(gè)要素與某一個(gè)要素之間的復(fù)相關(guān)程度。復(fù)相關(guān)系數(shù)的計(jì)算當(dāng)有兩個(gè)自變量時(shí)當(dāng)有三個(gè)自變量時(shí)(3.1.15)
(3.1.16)當(dāng)有k個(gè)自變量時(shí)(3.1.17)
復(fù)相關(guān)系數(shù)的性質(zhì)
①復(fù)相關(guān)系數(shù)介于0到1之間,即②
復(fù)相關(guān)系數(shù)越大,則表明要素(變量)之間的相關(guān)程度越密切。復(fù)相關(guān)系數(shù)為1,表示完全相關(guān);復(fù)相關(guān)系數(shù)為0,表示完全無關(guān)。③
復(fù)相關(guān)系數(shù)必大于或至少等于單相關(guān)系數(shù)的絕對值。復(fù)相關(guān)系數(shù)的顯著性檢驗(yàn)
F檢驗(yàn)法。其統(tǒng)計(jì)量計(jì)算公式為(3.1.18)例題:在上例中,若以x4為因變量,x1,x2,x3為自變量,試計(jì)算x4與x1,x2,x3之間的復(fù)相關(guān)系數(shù)。解:按照公式(3.1.16)計(jì)算檢驗(yàn):,故復(fù)相關(guān)達(dá)到了極顯著水平。相關(guān)分析中應(yīng)注意的問題相關(guān)系數(shù)不解釋兩個(gè)變量間的因果關(guān)系,它只是表明了兩個(gè)變量間互相影響的程度和方向。有時(shí)兩變量之間不存在相關(guān)關(guān)系,但卻可能出現(xiàn)較高的相關(guān)系數(shù),要警惕虛假相關(guān)導(dǎo)致的錯(cuò)誤結(jié)論。如何運(yùn)用SPSS進(jìn)行相關(guān)分析數(shù)據(jù)準(zhǔn)備:來自歷年河南統(tǒng)計(jì)年鑒年份化肥施用量折純量d萬噸糧食產(chǎn)量d萬噸1986148.732545.71987135.582948.41988150.5726631989184.253149.41990213.183303.71991239.73010.31992251.13109.6199328836391994292.473253.81995322.23466.51996345.33839.91997355.33894.71998382.84009.61999399.94253.32000419.54101.52001441.74119.92002468.842102003467.93569.52004493.2426020055
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 植保員工作中的科技應(yīng)用探索試題及答案
- 2024年籃球裁判員考試資料整合及試題及答案
- 2023年12月17日內(nèi)蒙古事業(yè)單位統(tǒng)考D類《職業(yè)能力傾向測驗(yàn)》試題真題試卷答案解析
- 2024年足球裁判員等級(jí)考試常見問題及試題與答案
- 中心城區(qū)地下給排水管網(wǎng)建設(shè)項(xiàng)目可行性研究報(bào)告(模板)
- 新能源叉車智能制造基地項(xiàng)目可行性研究報(bào)告
- 雙氧水項(xiàng)目可行性研究報(bào)告(范文模板)
- 汽車制動(dòng)盤加工項(xiàng)目可行性研究報(bào)告(僅供參考)
- 老舊燃?xì)夤芫W(wǎng)更新改造項(xiàng)目可行性研究報(bào)告(僅供參考)
- 建筑廢棄物處理站建設(shè)項(xiàng)目可行性研究報(bào)告(參考)
- 中國成人ICU鎮(zhèn)痛和鎮(zhèn)靜治療指南解讀
- 中國地質(zhì)大學(xué)(北京)《GNSS測量原理及其應(yīng)用》2022-2023學(xué)年第一學(xué)期期末試卷
- 護(hù)理專業(yè)實(shí)踐報(bào)告5000字范文
- 2024年度昌平區(qū)養(yǎng)老院食堂餐飲服務(wù)承包合同
- 礦山生態(tài)修復(fù)施工方案及技術(shù)措施
- 化學(xué)計(jì)量學(xué)與化學(xué)分析技術(shù)考核試卷
- 2024關(guān)于深化產(chǎn)業(yè)工人隊(duì)伍建設(shè)改革的建議全文解讀課件
- 探究膜分離技術(shù)在水處理中的應(yīng)用
- 洋流課件2024-2025學(xué)年高中地理人教版(2019)選擇性必修一
- 2024-2025學(xué)年中職數(shù)學(xué)拓展模塊一 (下冊)高教版(2021·十四五)教學(xué)設(shè)計(jì)合集
- 電梯維保工程施工組織設(shè)計(jì)方案
評論
0/150
提交評論