計量地理學(xué)第三章-1-相關(guān)分析_第1頁
計量地理學(xué)第三章-1-相關(guān)分析_第2頁
計量地理學(xué)第三章-1-相關(guān)分析_第3頁
計量地理學(xué)第三章-1-相關(guān)分析_第4頁
計量地理學(xué)第三章-1-相關(guān)分析_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第三章地理學(xué)中的經(jīng)典統(tǒng)計分析方法

3.1相關(guān)分析3.2回歸分析3.3時間序列分析3.4聚類分析3.5主成分分析3.6馬爾可夫預(yù)測3.7趨勢面分析§3.1相關(guān)分析相關(guān)分析的任務(wù),是揭示地理要素之間相互關(guān)系的密切程度。而地理要素之間相互關(guān)系密切程度的測定,主要是通過對相關(guān)系數(shù)的計算與檢驗來完成的。

兩要素之間相關(guān)程度的測定多要素間相關(guān)程度的測定一切客觀事物都是相互聯(lián)系的,而且任一事物的變化都與其周圍的其他事物相互聯(lián)系和相互影響。客觀現(xiàn)象之間的相互聯(lián)系,可以通過一定的數(shù)量關(guān)系反映出來。現(xiàn)象之間的關(guān)系形態(tài)有兩種類型:函數(shù)關(guān)系和統(tǒng)計相關(guān)關(guān)系。

一、函數(shù)關(guān)系和統(tǒng)計相關(guān)關(guān)系例如,銀行的1年期存款利率為2.25%,設(shè)存入本金為x,到期的本息為y,則這里x與y表現(xiàn)為一種線性函數(shù)關(guān)系。各觀測點落在一條直線上。圖1

線性函數(shù)

的圖形

函數(shù)關(guān)系是變量之間的一種完全確定的關(guān)系,即一個變量的數(shù)值完全由另一個(或一組)變量的數(shù)值所確定。在實際問題中,許多變量之間的關(guān)系并不是完全確定性的。例:居民家庭消費與居民家庭收入這兩個變量的關(guān)系就不是完全確定的。收入水平相同的家庭,它們的消費額往往不同;消費額相同的家庭,它們的收入也可能不同。圖2

居民家庭收入與消費支出的散點圖

統(tǒng)計相關(guān)關(guān)系是變量之間存在的不完全確定性的關(guān)系。觀測點落在直線周圍對現(xiàn)象之間相關(guān)關(guān)系密切程度的研究,稱為相關(guān)分析。二、相關(guān)關(guān)系的種類根據(jù)相關(guān)所涉及變量的多少單相關(guān)復(fù)相關(guān)兩個變量之間的相關(guān)關(guān)系多個變量之間的相關(guān)關(guān)系(1)(2)根據(jù)相關(guān)的形式不同線性相關(guān)曲線相關(guān)變量之間的關(guān)系近似地表現(xiàn)為一條直線變量之間的關(guān)系近似地表現(xiàn)為一條曲線

圖3

居民家庭收入與消費支出的數(shù)據(jù)作出的散點圖圖4

非線性相關(guān)圖3中的散點大致分布在一條直線兩側(cè),表明兩個變量之間是線性相關(guān)。圖4中散點的分布大致呈拋物線形狀,表明兩個變量之間是非線性相關(guān)。(3)根據(jù)變量相關(guān)方向的不同正相關(guān)負相關(guān)兩個變量之間的變化方向一致,都是增長或下降趨勢兩個變量變化趨勢方向相反二、相關(guān)關(guān)系的種類例如,10個家庭的月收入和月消費支出的統(tǒng)計數(shù)據(jù),它們之間呈正相關(guān)趨勢;某企業(yè)上半年產(chǎn)品產(chǎn)量和單位成本的統(tǒng)計數(shù)據(jù),它們之間呈負相關(guān)趨勢。(4)根據(jù)相關(guān)程度的不同兩個變量彼此的數(shù)量變化相互獨立介于不相關(guān)與完全相關(guān)之間的關(guān)系二、相關(guān)關(guān)系的種類不相關(guān)不完全相關(guān)完全相關(guān)一個變量的數(shù)量變化完全由另一個變量的數(shù)量變化所唯一確定圖中的散點雜亂無章地分布在一個區(qū)域中,表明兩個變量之間不相關(guān)。三、兩要素之間相關(guān)程度的測定1、相關(guān)系數(shù)的計算與檢驗2、秩相關(guān)系數(shù)的計算與檢驗1、相關(guān)系數(shù)的計算與檢驗相關(guān)系數(shù)的計算①定義1、相關(guān)系數(shù)的計算與檢驗相關(guān)系數(shù)的計算①定義②說明:-1<=rxy<=1,rxy大于0時正相關(guān),小于0時負相關(guān)。rxy絕對值越接近于1,兩要素的關(guān)系越密切;越接近于0,rxy兩要素的關(guān)系越不密切。倫敦的月平均氣溫與降水量例1計算結(jié)果表明,倫敦市的月平均氣溫(t)與降水量(p)之間呈負相關(guān),即異向相關(guān)。根據(jù)表中的數(shù)據(jù),計算倫敦市月平均氣溫(T)與降水量(P)之間的相關(guān)系數(shù):例2根據(jù)53個氣象臺站的多年平均數(shù)據(jù),可以對降水量(p)和緯度(y)之間的相關(guān)系數(shù)以及蒸發(fā)量(v)和緯度(y)之間的相關(guān)系數(shù),分別代入公式計算如下:計算結(jié)果表明,降水量(p)和緯度(y)之間異向相關(guān),而蒸發(fā)量(v)與緯度(y)之間同向相關(guān)。相關(guān)系數(shù)的檢驗相關(guān)系數(shù)是根據(jù)要素之間的樣本值計算出來,它隨著樣本數(shù)的多少或取樣方式的不同而不同,因此它只是要素之間的樣本相關(guān)系數(shù),只有通過檢驗,才能知道它的可信度。檢驗是通過在給定的置信水平下,查相關(guān)系數(shù)檢驗的臨界值表來實現(xiàn)的。

在上表中,f稱為自由度,為f=n-2,n為樣本數(shù);上方的代表不同的置信水平;表內(nèi)的數(shù)值代表不同的置信水平下相關(guān)系數(shù)的臨界值;的意思是當(dāng)所計算的相關(guān)系數(shù)的絕對值大于在水平下的臨界值時,兩要素不相關(guān)(即)的可能性只有。0.100.050.020.010.0011234567891011120.98770.90000.80540.72930.66940.62150.58220.54940.52140.49730.47620.45750.99690.95000.87830.81140.75450.70670.66640.63190.60210.57600.55290.5324

0.99950.98000.93430.88220.83290.78870.74930.71550.68510.65810.63390.6120

0.99980.99000.95870.91720.87450.83430.79770.76460.73480.70790.68350.66140.99990.99900.99120.97410.95070.92490.89820.87210.84710.82330.80100.7800

相關(guān)系數(shù)真值ρ=0時樣本相關(guān)系數(shù)的部分臨界值rα(1)對倫敦市月平均氣溫T與降水量P之間的相關(guān)系數(shù),f=12-2=10,在顯著性水平上,查表得知:。因為。所以,倫敦市月平均氣溫(T)與降水量(P)之間的相關(guān)性并不顯著。0.100.050.020.010.0011234567891011120.98770.90000.80540.72930.66940.62150.58220.54940.52140.49730.47620.45750.99690.95000.87830.81140.75450.70670.66640.63190.60210.57600.55290.5324

0.99950.98000.93430.88220.83290.78870.74930.71550.68510.65810.63390.6120

0.99980.99000.95870.91720.87450.83430.79770.76460.73480.70790.68350.66140.99990.99900.99120.97410.95070.92490.89820.87210.84710.82330.80100.7800

相關(guān)系數(shù)真值ρ=0時樣本相關(guān)系數(shù)的部分臨界值rα(2)對于53個氣象臺站降水量(P)和緯度(Y)之間的相關(guān)系數(shù),以及蒸發(fā)量(V)和緯度(Y)之間的相關(guān)系數(shù),f=53-2=51,表中沒有給出相應(yīng)樣本個數(shù)下的臨界值rα,但是在同一顯著水平下,隨著樣本數(shù)的增大,臨界值rα減少。在顯著性水平α=0.001上,取f=50,查表4.1.3得知:r0.001=0.4433。顯然,rPY和rVY的絕對值都遠遠大于r0.001=0.4433,這說明甘肅省53個氣象臺站降水量(P)和緯度(Y)之間,以及蒸發(fā)量(V)和緯度(Y)之間都是高度相關(guān)的。相關(guān)矩陣的表示方式例3:根據(jù)某種護發(fā)產(chǎn)品1998年在8個地區(qū)的銷售情況,得到月平均銷售收入y(萬元)與月平均廣告支出x(萬元)的如下統(tǒng)計資料:

地區(qū)編號12345678月平均銷售收入(萬元)y3140303425203540月平均廣告支出(萬元)x

510574379表1某種護發(fā)產(chǎn)品1998年在8個地區(qū)銷售的統(tǒng)計資料解:首先做出的散點圖,(xi,yi),i=1,2,…,8。

這些點大致分別落在一條直線附近,說明月平均廣告支出x與月平均銷售收入y之間具有明顯的線性關(guān)系。解法1編號月平均銷售收入xi月平均廣告支出yi

xi-xyi-y(xi-x)2

(yi-y)2

(xi-x)(yi-y)1315-0.88-1.250.771.561.09240108.133.7566.0214.0630.473305-1.88-1.253.521.562.3443472.130.754.520.561.595254-6.88-2.2547.275.0615.476203-11.88-3.25141.0210.5638.5973573.130.759.770.562.3484098.132.7566.027.5622.34

31.886.25

338.8841.50114.25LxxLyyLxy編號月平均銷售收入xi月平均廣告支出yi

xi2yi2xi*yi1315961251552401016001004003305900251504347115649238525462516100620340096073571225492458409160081360總和2555084673541708解法2檢驗:f=8-2=6,在顯著性水平上,查表得知:。因為。所以,銷售收入和廣告支出之間呈顯著正相關(guān)關(guān)系(P<0.001)。

相關(guān)系數(shù)真值ρ=0時樣本相關(guān)系數(shù)的部分臨界值rα0.100.050.020.010.0011234567891011120.98770.90000.80540.72930.66940.62150.58220.54940.52140.49730.47620.45750.99690.95000.87830.81140.75450.70670.66640.63190.60210.57600.55290.5324

0.99950.98000.93430.88220.83290.78870.74930.71550.68510.65810.63390.6120

0.99980.99000.95870.91720.87450.83430.79770.76460.73480.70790.68350.66140.99990.99900.99120.97410.95070.92490.89820.87210.84710.82330.80100.7800秩相關(guān)系數(shù),又稱等級相關(guān)系數(shù),或順序相關(guān)系數(shù),是將兩要素的樣本值按數(shù)據(jù)的大小順序排列位次,以各要素樣本值的位次代替實際數(shù)據(jù)而求得的一種統(tǒng)計量。

2秩相關(guān)系數(shù)的計算與檢驗相關(guān)系數(shù)是測定變量之間相關(guān)程度的最常用指標(biāo),但它主要是測定數(shù)值之間的相關(guān)程度。但在實際中,有些現(xiàn)象是難以用數(shù)字確切計量的,如才智高低、藝術(shù)水平等,要測定這些變量的相關(guān)程度,就需要計算等級相關(guān)系數(shù)。常用的等級相關(guān)系數(shù)稱為斯皮爾曼等級相關(guān)系數(shù)。等級相關(guān)系數(shù)斯皮爾曼等級相關(guān)系數(shù)的計算公式為式中,分別為x和y等級的算數(shù)平均數(shù)。若沒有重復(fù)觀測值時,公式可變?yōu)槭街衐i表示兩組數(shù)據(jù)的等級之差,即,n為數(shù)據(jù)的個數(shù)。例4

在某次模特比賽中,甲乙兩名專家分別對參賽的8名模特的表演進行評定,評定等級如下:解:根據(jù)上述資料,斯皮爾曼等級相關(guān)系數(shù)為

計算結(jié)果表明甲乙兩名專家對參賽的8名模特的表演評定等級基本一致。模特編號12345678專家甲評定等級15842637專家乙評定等級24763518例5根據(jù)2001年7月1日我國31個主要城市的日最高氣溫與最低氣溫,計算日最高氣溫與最低氣溫的等級相關(guān)系數(shù)。解:我國31個主要城市的日最高氣溫與最低氣溫的排秩(即等級)如下表所示:表2001年7月1日我國31個城市最低、最高氣溫排秩表因有重復(fù)觀測值,故斯皮爾曼等級相關(guān)系數(shù)就是兩組數(shù)據(jù)等級的相關(guān)系數(shù),根據(jù)相關(guān)系數(shù)的計算公式,其等級相關(guān)系數(shù)為0.793。n

顯著水平α

n

顯著水平α

0.05

0.01

0.050.0141.000--

160.4250.60150.9001.000180.3990.56460.8290.943200.3770.53470.7140.893220.3590.50880.6430.833240.3430.48590.6000.783260.3290.465100.5640.746280.3170.448120.4560.712300.3060.432140.4560.645------n代表樣本個數(shù),α代表不同的置信水平,也稱顯著水平,表中的數(shù)值為臨界值γα。

秩相關(guān)系數(shù)的檢驗例6已知2003年中國大陸各?。ㄖ陛犑?、自治區(qū))的GDP(x)和總?cè)丝冢▂)數(shù)據(jù)及其位次,將數(shù)據(jù)代入公式,就可以計算它們之間的秩相關(guān)系數(shù):即:GDP(x)與總?cè)丝冢▁)之間的等級相關(guān)系數(shù)為0.7847。在上例中,n=31,表中沒有給出相應(yīng)的樣本個數(shù)下的臨界值γα,但是同一顯著水平下,隨著樣本數(shù)的增大,臨界值γα減少。在n=30時,查表得:γ0.01=0.432,由于γxy=0.7847>γ0.01=0.432,所以在α=0.01的置信水平上來看,中國大陸各?。ㄖ陛犑?、自治區(qū))人口規(guī)模與GDP是等級相關(guān)的。n

顯著水平α

n

顯著水平α

0.05

0.01

0.050.0141.000--

160.4250.60150.9001.000180.3990.56460.8290.943200.3770.53470.7140.893220.3590.50880.6430.833240.3430.48590.6000.783260.3290.465100.5640.746280.3170.448120.4560.712300.3060.432140.4560.645------四、多要素間相關(guān)程度的測定偏相關(guān)系數(shù)的計算與檢驗復(fù)相關(guān)系數(shù)的計算與檢驗經(jīng)過計算,得出GDP(A)和年末人口數(shù)(B)間的相關(guān)系數(shù)rAB=0.9816,經(jīng)檢驗,二者之間呈顯著正相關(guān)關(guān)系(。如果我們把這個高度正相關(guān)理解為這兩個變量內(nèi)在聯(lián)系或因果關(guān)系,就會得出這樣的結(jié)論:要想提高GDP,只需大量增加人口。這無論從經(jīng)濟理論還是從日常生活哲理來說都是荒謬的。經(jīng)計算可以看出人口與GDP都與時間T高度正相關(guān)。因此,我們可以得知兩個經(jīng)濟變量之間的高度相關(guān)關(guān)系,有時并不是這兩個經(jīng)濟變量本身的內(nèi)在聯(lián)系所決定的,它完全可能由另外一個變量的媒介作用而形成高度相關(guān)。經(jīng)進一步研究,可以發(fā)現(xiàn)人口與GDP都與另外一個變量時間T有聯(lián)系,它們都隨著時間變化。人口B與時間T的相關(guān)系數(shù)rBT=0.9865,國民生產(chǎn)總值A(chǔ)與時間T的相關(guān)系數(shù)rAT=0.988。偏相關(guān)系數(shù)的計算與檢驗①定義:在多要素所構(gòu)成的地理系統(tǒng)中,先不考慮其它要素的影響,而單獨研究兩個要素之間的相互關(guān)系的密切程度,這稱為偏相關(guān)。用以度量偏相關(guān)程度的統(tǒng)計量,稱為偏相關(guān)系數(shù)。偏相關(guān)系數(shù)的計算②計算:3個要素的偏相關(guān)系數(shù)

四個要素的偏相關(guān)系數(shù)我們以上討論的人口與GDP的關(guān)系,如果令時間T不變,計算人口與GDP的偏相關(guān)系數(shù)為rAB.T=0.2743(P=0.4431>0.05)。由此可以看出,如果去掉時間的因素,人口與GDP之間的偏相關(guān)系數(shù)很小,

即如果固定時間不變,人口與GDP之間的關(guān)系是微弱的,且經(jīng)檢驗人口與GDP

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論