空間統(tǒng)計分析方法_第1頁
空間統(tǒng)計分析方法_第2頁
空間統(tǒng)計分析方法_第3頁
空間統(tǒng)計分析方法_第4頁
空間統(tǒng)計分析方法_第5頁
已閱讀5頁,還剩88頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

空間統(tǒng)計分析方法第一頁,共九十三頁,編輯于2023年,星期一本講內(nèi)容探索性空間統(tǒng)計分析地統(tǒng)計分析方法第二頁,共九十三頁,編輯于2023年,星期一空間統(tǒng)計分析,即空間數(shù)據(jù)(spatialdata)的統(tǒng)計分析,是現(xiàn)代計量地理學(xué)中一個快速發(fā)展的方向和領(lǐng)域??臻g統(tǒng)計分析,其核心就是認(rèn)識與地理位置相關(guān)的數(shù)據(jù)間的空間依賴、空間關(guān)聯(lián)或空間自相關(guān),通過空間位置建立數(shù)據(jù)間的統(tǒng)計關(guān)系??臻g統(tǒng)計分析的任務(wù),就是運用有關(guān)統(tǒng)計方法,建立空間統(tǒng)計模型,從凌亂的數(shù)據(jù)中挖掘空間自相關(guān)與空間變異規(guī)律。

空間統(tǒng)計分析第三頁,共九十三頁,編輯于2023年,星期一空間數(shù)據(jù)分析與傳統(tǒng)統(tǒng)計分析主要有兩大差異:(1)空間數(shù)據(jù)間并非獨立,而是在維空間中具有某種空間相關(guān)性,且在不同的空間分辨率下呈現(xiàn)不同之相關(guān)程度;(2)地球只有一個,大多數(shù)空間問題僅有一組(空間分布不規(guī)則的)觀測值,而無重復(fù)觀測數(shù)據(jù)。因此,空間現(xiàn)象的了解與描述是極為復(fù)雜的,而傳統(tǒng)方法,尤其是建立在獨立樣本上的統(tǒng)計方法,不適合分析空間數(shù)據(jù)??臻g統(tǒng)計VS.經(jīng)典統(tǒng)計經(jīng)典統(tǒng)計:獨立性、隨機(jī)性假設(shè)空間統(tǒng)計:自相關(guān)、依賴性、異質(zhì)性第四頁,共九十三頁,編輯于2023年,星期一地理學(xué)第一定律(FLG):everythingisrelatedtoeverythingelse,butnearthingsaremorerelatedthandistantthings(Tobler,1970).空間統(tǒng)計的基本思想:WaldoTobler(bornin1930)receivingaplaqueforhiscontributionstogeography.OntheeventofhisNovember2000birthday./wiki/Waldo_R._Tobler

Tobler,W.R.(1970)."AcomputermoviesimulatingurbangrowthintheDetroitregion".EconomicGeography,46(2):234-240.FLG的一般性:自然地理、人文地理、社會經(jīng)濟(jì)第五頁,共九十三頁,編輯于2023年,星期一空間自相關(guān)是普遍存在的,否則地理分析便沒有多大意義。

經(jīng)典統(tǒng)計:獨立

空間自相關(guān)的存在,使得經(jīng)典統(tǒng)計學(xué)所要求的樣本獨立性假設(shè)不滿足。如果地理學(xué)從根本上值得研究,必然是因為地理現(xiàn)象在空間上的變化不是隨機(jī)的。

經(jīng)典統(tǒng)計:隨機(jī)第六頁,共九十三頁,編輯于2023年,星期一可以借助空間統(tǒng)計更好地理解地理現(xiàn)象。

或許學(xué)習(xí)空間統(tǒng)計最重要的原因是我們不僅僅想知道問題“怎么樣”,更想知道“哪里怎么樣”

空間統(tǒng)計學(xué)可以幫助我們準(zhǔn)確地判斷具體地理模式的原因。

JohnSnow的霍亂地圖

當(dāng)發(fā)現(xiàn)某種病僅僅發(fā)生在靠近河流的村莊時,河流中的寄生物可能是病源??臻g統(tǒng)計學(xué)可以幫助我們處理大的復(fù)雜數(shù)據(jù)集,這是GIS經(jīng)常面對的事情。為什么要用空間統(tǒng)計第七頁,共九十三頁,編輯于2023年,星期一霍亂病死者居住分布圖(JohnSnow,1854)1854年8月到9月英國倫敦霍亂流行時,當(dāng)局始終找不到發(fā)病的原因,后來醫(yī)生約翰·斯諾(JohnSnow)參與調(diào)查。他在繪有霍亂流行地區(qū)所有道路、房屋、飲用水機(jī)井等內(nèi)容的1:6500比例尺地圖上,標(biāo)出了每個霍亂病死者的居住位置,得到了霍亂病死者居住分布圖。第八頁,共九十三頁,編輯于2023年,星期一一.探索性空間統(tǒng)計分析

基本原理與方法

應(yīng)用實例

第九頁,共九十三頁,編輯于2023年,星期一探索性空間數(shù)據(jù)分析(ESDA)ESDA是指利用統(tǒng)計學(xué)原理和圖形圖表相結(jié)合對空間信息的性質(zhì)進(jìn)行分析、鑒別,用以引導(dǎo)確定性模型的結(jié)構(gòu)和解法。ESDA與EDA區(qū)別在于它考慮了數(shù)據(jù)的空間特性,在方法上它將數(shù)據(jù)分解為一般趨勢和疊加于其上的局部變化兩部分。然后用一定的數(shù)學(xué)函數(shù)去擬合由樣本點產(chǎn)生的經(jīng)驗變率函數(shù),進(jìn)行諸如克立格內(nèi)插等空間操作。第十頁,共九十三頁,編輯于2023年,星期一

通常定義一個二元對稱空間權(quán)重矩陣W,來表達(dá)n個位置的空間區(qū)域的鄰近關(guān)系,其形式如下式中:Wij表示區(qū)域i與j的臨近關(guān)系,它可以根據(jù)鄰接標(biāo)準(zhǔn)或距離標(biāo)準(zhǔn)來度量。

1.基本原理與方法

(一)空間權(quán)重矩陣

第十一頁,共九十三頁,編輯于2023年,星期一①簡單的二進(jìn)制鄰接矩陣②基于距離的二進(jìn)制空間權(quán)重矩陣兩種最常用的確定空間權(quán)重矩陣的規(guī)則

第十二頁,共九十三頁,編輯于2023年,星期一(二)全局空間自相關(guān)Moran指數(shù)反映的是空間鄰接或空間鄰近的區(qū)域單元屬性值的相似程度。

Geary系數(shù)與Moran指數(shù)存在負(fù)相關(guān)關(guān)系。PatrickA.P.Moran(1917-1988)

Moran指數(shù)和Geary系數(shù)是兩個用來度量空間自相關(guān)的全局指標(biāo)。全局空間自相關(guān)概括了在一個總的空間范圍內(nèi)空間依賴的程度。第十三頁,共九十三頁,編輯于2023年,星期一

如果是位置(區(qū)域)的觀測值,則該變量的全局Moran指數(shù)I,用如下公式計算式中:I為Moran指數(shù);

;。第十四頁,共九十三頁,編輯于2023年,星期一Geary系數(shù)C計算公式如下

式中:C為Geary系數(shù);其他變量同上式。如果引入記號第十五頁,共九十三頁,編輯于2023年,星期一

則全局Moran指數(shù)I的計算公式也可以進(jìn)一步寫成

Moran指數(shù)I的取值一般在[-1,1]之間,小于0表示負(fù)相關(guān),等于0表示不相關(guān),大于0表示正相關(guān);

Geary系數(shù)C的取值一般在[0,2]之間,大于1表示負(fù)相關(guān),等于1表示不相關(guān),而小于1表示正相關(guān)。

第十六頁,共九十三頁,編輯于2023年,星期一

(三)局部空間自相關(guān)描述一個空間單元與其領(lǐng)域的相似程度,能夠表示每個局部單元服從全局總趨勢的程度(包括方向和量級),反映了空間異質(zhì)性,說明空間依賴是如何隨位置變化的。局部空間自相關(guān)分析方法包括3種:

空間聯(lián)系的局部指標(biāo)(LISA);

G統(tǒng)計量;

Moran散點圖第十七頁,共九十三頁,編輯于2023年,星期一空間聯(lián)系的局部指標(biāo)(LISA)

空間聯(lián)系的局部指標(biāo)(localindicatorsofspatialassociation,縮寫為LISA)滿足下列兩個條件:(1)每個區(qū)域單元的LISA,是描述該區(qū)域單元周圍顯著的相似值區(qū)域單元之間空間集聚程度的指標(biāo);(2)所有區(qū)域單元LISA的總和與全局的空間聯(lián)系指標(biāo)成比例。第十八頁,共九十三頁,編輯于2023年,星期一LISA包括局部Moran指數(shù)(localMoranindex)和局部Geary指數(shù)(localGearyindex),下面重點介紹和討論局部Moran指數(shù)。第十九頁,共九十三頁,編輯于2023年,星期一局部Moran指數(shù)被定義為可進(jìn)一步寫成

式中:和是經(jīng)過標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化的觀測值。局部Moran指數(shù)檢驗的標(biāo)準(zhǔn)化統(tǒng)計量為

第二十頁,共九十三頁,編輯于2023年,星期一G統(tǒng)計量全局G統(tǒng)計量的計算公式為對每一個區(qū)域單元的統(tǒng)計量為

探測區(qū)域單元是屬于高值集聚還是低值集聚的空間分布模式.第二十一頁,共九十三頁,編輯于2023年,星期一

對統(tǒng)計量的檢驗與局部Moran指數(shù)相似,其檢驗值為

顯著的正值表示在該區(qū)域單元周圍,高觀測值的區(qū)域單元趨于空間集聚,而顯著的負(fù)值表示低觀測值的區(qū)域單元趨于空間集聚,與Moran指數(shù)只能發(fā)現(xiàn)相似值(正關(guān)聯(lián))或非相似性觀測值(負(fù)關(guān)聯(lián))的空間集聚模式相比,具有能夠探測出區(qū)域單元屬于高值集聚還是低值集聚的空間分布模式。第二十二頁,共九十三頁,編輯于2023年,星期一Moran散點圖

以(Wz,z)為坐標(biāo)點的Moran散點圖,常來研究局部的空間不穩(wěn)定性,它對空間滯后因子Wz和z數(shù)據(jù)對進(jìn)行了可視化的二維圖示。全局Moran指數(shù),可以看作是Wz對于z的線性回歸系數(shù),對界外值以及對Moran指數(shù)具有強(qiáng)烈影響的區(qū)域單元,可通過標(biāo)準(zhǔn)回歸來診斷出。由于數(shù)據(jù)對(Wz,z)經(jīng)過了標(biāo)準(zhǔn)化,因此界外值可易由2-sigma規(guī)則可視化地識別出來。第二十三頁,共九十三頁,編輯于2023年,星期一Moran散點圖的4個象限,分別對應(yīng)于區(qū)域單元與其鄰居之間4種類型的局部空間聯(lián)系形式:第1象限代表了高觀測值的區(qū)域單元被高值的區(qū)域所包圍的空間聯(lián)系形式;第2象限代表了低觀測值的區(qū)域單元被高值的區(qū)域所包圍的空間聯(lián)系形式;第二十四頁,共九十三頁,編輯于2023年,星期一

第3象限代表了低觀測值的區(qū)域單元被低值的區(qū)域所包圍的空間聯(lián)系形式;第4象限代表了高觀測值的區(qū)域單元被低值的區(qū)域所包圍的空間聯(lián)系形式。第二十五頁,共九十三頁,編輯于2023年,星期一2.應(yīng)用實例

中國大陸30個省級行政區(qū)人均GDP的空間關(guān)聯(lián)分析。根據(jù)各?。ㄖ陛犑?、自治區(qū))之間的鄰接關(guān)系,采用二進(jìn)制鄰接權(quán)重矩陣,選取各?。ㄖ陛犑?、自治區(qū))1998—2002年人均GDP的自然對數(shù),依照公式計算全局Moran指數(shù)I,計算其檢驗的標(biāo)準(zhǔn)化統(tǒng)計量Z(I),結(jié)果如下表所示。年份IZP19980.50014.50350.000019990.50694.55510.000020000.51124.59780.000020010.50594.55320.000020020.50134.53260.0000第二十六頁,共九十三頁,編輯于2023年,星期一

從表中可以看出,在1998—2002年期間,中國大陸30個省級行政區(qū)人均GDP的全局Moran指數(shù)均為正值;在正態(tài)分布假設(shè)之上,對Moran指數(shù)檢驗的結(jié)果也高度顯著。這就是說,在1998—2002年期間,中國大陸30個省級行政區(qū)人均GDP存在著顯著的、正的空間自相關(guān),也就是說各省級行政區(qū)人均GDP水平的空間分布表現(xiàn)出相似值之間的空間集聚,其空間聯(lián)系的特征是:較高人均GDP水平的省級行政區(qū)相對地趨于和較高人均GDP水平的省級行政區(qū)相鄰,或者較低人均GDP水平的省級行政區(qū)相對地趨于和較低人均GDP水平的省級行政區(qū)相鄰。第二十七頁,共九十三頁,編輯于2023年,星期一

選取2001年我國30個省級行政區(qū)人均GDP數(shù)據(jù),計算局部Gi統(tǒng)計量和局部Gi統(tǒng)計量的檢驗值Z(Gi),并繪制統(tǒng)計地圖如下。第二十八頁,共九十三頁,編輯于2023年,星期一

檢驗結(jié)果表明,貴州、四川、云南西部3省的Z值在0.05的顯著性水平下顯著,重慶的Z值在0.1的顯著性水平下顯著,該4省市在空間上相連成片分布,而且從統(tǒng)計學(xué)意義上來說,與該區(qū)域相鄰的省區(qū),其人均GDP趨于為同樣是人均GDP低值的省區(qū)所包圍。由此形成人均GDP低值與低值的空間集聚,據(jù)此可認(rèn)識到西部落后省區(qū)趨于空間集聚的分布特征。

第二十九頁,共九十三頁,編輯于2023年,星期一

東部的江蘇、上海、浙江三省市的Z值在0.05的顯著性水平下顯著,天津的Z值在0.1的顯著性水平下顯著。而東部上海、江浙等發(fā)達(dá)省市趨于為一些相鄰經(jīng)濟(jì)發(fā)展水平相對較高的省份所包圍,東部發(fā)達(dá)地區(qū)的空間集聚分布特征也顯現(xiàn)出來。第三十頁,共九十三頁,編輯于2023年,星期一

以(Wz,z)為坐標(biāo),進(jìn)一步繪制Moran散點圖可以發(fā)現(xiàn),多數(shù)?。ㄖ陛犑?、自治區(qū))位于第1和第3象限內(nèi),為正的空間聯(lián)系,屬于低低集聚和高高集聚類型,而且位于第3象限內(nèi)的低低集聚類型的?。ㄖ陛犑小⒆灾螀^(qū))比位于第1象限內(nèi)的高高集聚類型的?。ㄖ陛犑小⒆灾螀^(qū))更多一些。第三十一頁,共九十三頁,編輯于2023年,星期一第三十二頁,共九十三頁,編輯于2023年,星期一

上圖進(jìn)一步顯示了30個省級行政區(qū)人均GDP局部集聚的空間結(jié)構(gòu)??梢钥闯?,從人均GDP水平相對地來看:高值被高值包圍的高高集聚?。ㄖ陛犑校┯校罕本⑻旖?、河南、安徽、湖北、江西、海南、廣東、福建、浙江、山東、上海、江蘇;低值被低值包圍的低低集聚?。ㄗ灾螀^(qū))有:黑龍江、內(nèi)蒙古、新疆、吉林、甘肅、山西、陜西、青海、西藏、四川、云南、遼寧、貴州;被低值包圍的高值省(直轄市)有:重慶、廣西、河北;被高值包圍的低值省份只有湖南。第三十三頁,共九十三頁,編輯于2023年,星期一1978、1990、2001、2007年全國各省市人均GDP的LISA顯著水平圖第三十四頁,共九十三頁,編輯于2023年,星期一二、地統(tǒng)計分析方法地統(tǒng)計方法的基本原理

應(yīng)用實例

第三十五頁,共九十三頁,編輯于2023年,星期一地統(tǒng)計學(xué)(Geostatistics),又稱地質(zhì)統(tǒng)計學(xué),是法國著名統(tǒng)計學(xué)家G.Matheron在大量理論研究基礎(chǔ)上提出的。地統(tǒng)計學(xué)是以區(qū)域化變量理論為基礎(chǔ),以變異函數(shù)為主要工具,研究那些在空間分布上既有隨機(jī)性又有結(jié)構(gòu)性,或空間相關(guān)和依賴性,或空間格局與變異,并對這些數(shù)據(jù)進(jìn)行最優(yōu)無偏內(nèi)插估計,或模擬這些數(shù)據(jù)的離散性、波動性。協(xié)方差函數(shù)和變異函數(shù)是以區(qū)域化變量理論為基礎(chǔ)建立起來的地統(tǒng)計學(xué)的兩個最基本的函數(shù)。地統(tǒng)計學(xué)的主要方法之一,克立格法就是建立在變異函數(shù)理論和結(jié)構(gòu)分析基礎(chǔ)之上的。

第三十六頁,共九十三頁,編輯于2023年,星期一

當(dāng)一個變量呈現(xiàn)為空間分布時,就稱之為區(qū)域化變量。這種變量常常反映某種空間現(xiàn)象的特征,用區(qū)域化變量來描述的現(xiàn)象稱之為區(qū)域化現(xiàn)象。

區(qū)域化變量,亦稱區(qū)域化隨機(jī)變量,G.Matheron(1963)將它定義為以空間點x的三個直角坐標(biāo)為自變量的隨機(jī)場區(qū)域化變量具有兩個最顯著,而且也是最重要的特征,即隨機(jī)性和結(jié)構(gòu)性。1.地統(tǒng)計方法的基本原理(一)區(qū)域化變量

第三十七頁,共九十三頁,編輯于2023年,星期一區(qū)域化變量的功能:

由于區(qū)域化變量是一種隨機(jī)函數(shù),因而能同時反映空間變量的結(jié)構(gòu)性和隨機(jī)性。一方面,當(dāng)空間點x固定后,Z(x)就是一個隨機(jī)變量,這體現(xiàn)了其隨機(jī)性。另一方面,在空間兩個不同點x與x+h處的區(qū)域化變量值具有某種程度的相關(guān)性,這體現(xiàn)了其結(jié)構(gòu)性。第三十八頁,共九十三頁,編輯于2023年,星期一區(qū)域化變量的組成部分

數(shù)據(jù)點結(jié)構(gòu)性可以用均值和常數(shù)趨勢表示空間相關(guān)數(shù)據(jù)通常呈現(xiàn)正空間相關(guān)性

隨機(jī)性測量誤差,其他誤差

第三十九頁,共九十三頁,編輯于2023年,星期一distanceelevation結(jié)構(gòu)性隨機(jī)性實際值第四十頁,共九十三頁,編輯于2023年,星期一(二)協(xié)方差函數(shù)

協(xié)方差函數(shù)的概念

區(qū)域化隨機(jī)變量之間的差異,可以用空間協(xié)方差來表示。在概率論中,隨機(jī)向量X與Y的協(xié)方差被定義為

區(qū)域化變量在空間點x和x+h處的兩個隨機(jī)變量和的二階混合中心矩定義為Z(x)的自協(xié)方差函數(shù),即(4.2.2)(4.2.1)第四十一頁,共九十三頁,編輯于2023年,星期一協(xié)方差函數(shù)的計算公式

式中:h為兩樣本點空間分隔距離或距離滯后;為在空間位置處的實測值;是在處距離偏離h的實測值[i=1,2,…,],是分隔距離為h時的樣本點對(paris)總數(shù),和分別為和的樣本平均數(shù),即(4.2.3)(4.2.4)(4.2.5)第四十二頁,共九十三頁,編輯于2023年,星期一

若==m(常數(shù)),則上式可以改寫為

式中:m為樣本平均數(shù),可由一般算術(shù)平均數(shù)公式求得,即

(4.2.6)第四十三頁,共九十三頁,編輯于2023年,星期一(三)變異函數(shù)

變異函數(shù)的概念

變異函數(shù)(variograms),又稱變差函數(shù)、變異矩,是地統(tǒng)計分析所特有的基本工具。在一維條件下變異函數(shù)定義為,當(dāng)空間點x在一維x軸上變化時,區(qū)域化變量Z(x)在點x和x+h處的值Z(x)與Z(x+h)差的方差的一半為區(qū)域化變量Z(x)在x軸方向上的變異函數(shù),記為γ(h),即

(4.2.7)第四十四頁,共九十三頁,編輯于2023年,星期一

在二階平穩(wěn)假設(shè)條件下,對任意的h有因此,公式可以改寫為

從上式可知,變異函數(shù)依賴于兩個自變量x和h,當(dāng)變異函數(shù)僅僅依賴于距離h而與位置x無關(guān)時,可改寫成,即

(4.2.9)(4.2.8)第四十五頁,共九十三頁,編輯于2023年,星期一變異函數(shù)的性質(zhì)

設(shè)Z(x)是區(qū)域化變量,在滿足二階平穩(wěn)假設(shè)條件下,變異函數(shù)式具有如下性質(zhì):

(1)=0,即在h=0處,變異函數(shù)為0;

(2)=,即關(guān)于直線h=0是對稱的,它是一個偶函數(shù);

(3)≥0,即只能大于或等于0;第四十六頁,共九十三頁,編輯于2023年,星期一變異函數(shù)的計算公式

設(shè)是系統(tǒng)某屬性Z在空間位置x處的值,為一區(qū)域化隨機(jī)變量,并滿足二階平穩(wěn)假設(shè),h為兩樣本點空間分隔距離,和分別是區(qū)域化變量在空間位置和處的實測值[i=1,2,…,N(h)],那么,變異函數(shù)的離散計算公式為(4.2.10)第四十七頁,共九十三頁,編輯于2023年,星期一

這樣對不同的空間分隔距離h,計算出相應(yīng)的和值。如果分別以h為橫坐標(biāo),或為縱坐標(biāo),畫出協(xié)方差函數(shù)和變異函數(shù)曲線圖,就可以直接展示區(qū)域化變量Z(x)的空間變異特點??梢姡儺惡瘮?shù)能同時描述區(qū)域化變量的隨機(jī)性和結(jié)構(gòu)性,從而在數(shù)學(xué)上對區(qū)域化變量進(jìn)行嚴(yán)格分析,是空間變異規(guī)律分析和空間結(jié)構(gòu)分析的有效工具。第四十八頁,共九十三頁,編輯于2023年,星期一第四十九頁,共九十三頁,編輯于2023年,星期一例如:假設(shè)某地區(qū)降水量Z(x)(單位:mm)是二維區(qū)域化隨機(jī)變量,滿足二階平穩(wěn)假設(shè),其觀測值的空間正方形網(wǎng)格數(shù)據(jù)如圖4.2.1所示(點與點之間的距離為h=1km)。試計算其南北方向及西北和東南方向的變異函數(shù)。第五十頁,共九十三頁,編輯于2023年,星期一圖4.2.1空間正方形網(wǎng)格數(shù)據(jù)(點間距h=1km)

從圖4.2.1可以看出,空間上有些點,由于某種原因沒有采集到。如果沒有缺失值,可直接對正方形網(wǎng)格數(shù)據(jù)結(jié)構(gòu)計算變異函數(shù);在有缺失值的情況下,也可以計算變異函數(shù)。只要“跳過”缺失點位置即可(圖4.2.2)。第五十一頁,共九十三頁,編輯于2023年,星期一圖4.2.2缺失值情況下樣本數(shù)對的組成和計算過程

☉為缺失值

第五十二頁,共九十三頁,編輯于2023年,星期一圖1空間正方形網(wǎng)格數(shù)據(jù)(點間距h=1km)

第五十三頁,共九十三頁,編輯于2023年,星期一圖2空間正方形網(wǎng)格數(shù)據(jù)(點間距h=2km)

第五十四頁,共九十三頁,編輯于2023年,星期一

首先計算南北方向上的變異函數(shù)值,由變異函數(shù)的計算公式可得

=385/72=5.35圖4.2.2缺失值情況下樣本數(shù)對的組成和計算過程

☉為缺失值

第五十五頁,共九十三頁,編輯于2023年,星期一

同樣計算出最后,得到南北方向和西北—東南方向上的變異函數(shù)計算結(jié)果見下表。同樣可以計算東西方向上的變異函數(shù)。

方向

南北

方向

西北—東南

h12345h1.412.824.245.657.07N(h)

362721135N(h)

322113825.359.2617.5525.6922.907.0612.9530.8558.1350.00第五十六頁,共九十三頁,編輯于2023年,星期一變異函數(shù)的參數(shù)

變異函數(shù)有4個非常重要的參數(shù),即基臺值(sill)、變程(range)或稱空間依賴范圍(rangeofspatialdependence)、塊金值(nugget)或稱區(qū)域不連續(xù)性值(localizeddiscontinuity)和分維數(shù)(fractaldimension)。前3個參數(shù)可以直接從變異函數(shù)圖中得到。它們決定變異函數(shù)的形狀與結(jié)構(gòu)。變異函數(shù)的形狀反映自然現(xiàn)象空間分布結(jié)構(gòu)或空間相關(guān)的類型,同時還能給出這種空間相關(guān)的范圍。第五十七頁,共九十三頁,編輯于2023年,星期一

當(dāng)變異函數(shù)隨著間隔距離h的增大,從非零值達(dá)到一個相對穩(wěn)定的常數(shù)時,該常數(shù)稱為基臺值C0+C。當(dāng)間隔距離h=0時,γ(0)=C0,該值稱為塊金值或塊金方差(nuggetvariance)?;_值是系統(tǒng)或系統(tǒng)屬性中最大的變異,變異函數(shù)達(dá)到基臺值時的間隔距離a稱為變程。變程表示在h≥a以后,區(qū)域化變量Z(x)空間相關(guān)性消失。第五十八頁,共九十三頁,編輯于2023年,星期一第4個參數(shù),即分維數(shù)用于表示變異函數(shù)的特性,由變異函數(shù)和間隔距離h之間的關(guān)系確定

其中,分維數(shù)D為雙對數(shù)直線回歸方程中的斜率,它是一個無量綱數(shù)。分維數(shù)D的大小,表示變異函數(shù)曲線的曲率,可以作為隨機(jī)變異的量度。第五十九頁,共九十三頁,編輯于2023年,星期一理論變異函數(shù)模型實踐中,常用的是變異函數(shù)圖:偏基臺值:C(partialsill)塊金值:C0(nugget)變程:a(range)h基臺值(sill)notrelatedanymore變程范圍內(nèi)才有結(jié)構(gòu)性變化(有規(guī)律的變化)反映隨機(jī)性大?。褐饕獊碓从趨^(qū)域化變量Z(x)在小于抽樣尺度h時所具有的內(nèi)部變異;另外還有抽樣分析誤差。變異函數(shù)是一個單調(diào)不減函數(shù)。當(dāng)h超過某一個范圍,例如變程,變異函數(shù)不再增大,而是趨于一個極限值,即為基臺值。實際上等于區(qū)域化變量的先驗方差。即,即基臺值與塊金值之差,表示數(shù)據(jù)中存在空間相關(guān)性引起的方差變化范圍。第六十頁,共九十三頁,編輯于2023年,星期一變異函數(shù)的理論模型

地統(tǒng)計學(xué)將變異函數(shù)理論模型分為3大類:第1類是有基臺值模型,包括球狀模型、指數(shù)模型、高斯模型、線性有基臺值模型和純塊金效應(yīng)模型;第2類是無基臺值模型,包括冪函數(shù)模型、線性無基臺值模型、拋物線模型;第3類是孔穴效應(yīng)模型。下面有代表性地介紹幾種常見的變異函數(shù)理論模型。第六十一頁,共九十三頁,編輯于2023年,星期一①純塊金效應(yīng)模型:其一般公式為式中:c0>0,為先驗方差。該模型相當(dāng)于區(qū)域化變量為隨機(jī)分布,樣本點間的協(xié)方差函數(shù)對于所有距離h均等于0,變量的空間相關(guān)不存在。

(4.2.11)第六十二頁,共九十三頁,編輯于2023年,星期一②球狀模型:其一般公式為

式中:c0為塊金(效應(yīng))常數(shù);c為拱高;c0+c為基臺值;a為變程。當(dāng)c0=0,c=1時,稱為標(biāo)準(zhǔn)球狀模型。球狀模型是地統(tǒng)計分析中應(yīng)用最廣泛的理論模型,許多區(qū)域化變量的理論模型都可以用該模型去擬合。

(4.2.12)第六十三頁,共九十三頁,編輯于2023年,星期一③指數(shù)模型:其一般公式為式中:c0和c意義與前相同,但a不是變程。當(dāng)h=3α?xí)r,,即,從而指數(shù)模型的變程約為約為3a。當(dāng)c0=0,c=1時,稱為標(biāo)準(zhǔn)指數(shù)模型。(4.2.13)第六十四頁,共九十三頁,編輯于2023年,星期一④高斯模型:其一般公式為式中:c0和c意義與前相同,a也不是變程。當(dāng)時,,即,因此高斯模型的變程約為。當(dāng)時,稱為標(biāo)準(zhǔn)高斯函數(shù)模型。(4.2.14)第六十五頁,共九十三頁,編輯于2023年,星期一⑤冪函數(shù)模型:其一般公式為式中:θ為冪指數(shù)。當(dāng)θ變化時,這種模型可以反映在原點附近的各種性狀。但是θ必須小于2,若,則函數(shù)就不再是一個條件非負(fù)定函數(shù)了,也就是說它已經(jīng)不能成為變異函數(shù)了。

(4.2.15)第六十六頁,共九十三頁,編輯于2023年,星期一⑥對數(shù)模型:其一般公式為顯然,當(dāng),這與變異函數(shù)的性質(zhì)不符。因此,對數(shù)模型不能描述點支撐上的區(qū)域化變量的結(jié)構(gòu)。(4.2.16)第六十七頁,共九十三頁,編輯于2023年,星期一⑦線性有基臺值模型:其一般公式為

式中:該模型的變程為a,基臺值為。

⑧線性無基臺值模型:其一般公式為

從式中可以看出,該模型沒有基臺值,也沒有變程。

(4.2.18)(4.2.17)第六十八頁,共九十三頁,編輯于2023年,星期一第六十九頁,共九十三頁,編輯于2023年,星期一例如:某地區(qū)降水量是一個區(qū)域化變量,其變異函數(shù)的實測值及距離h的關(guān)系見下表,下面我們試用回歸分析方法建立其球狀變異函數(shù)模型。實測值γ(h)距離h實測值γ(h)距離h2.10.69.24.94.31.110.35.15.72.210.56.26.52.510.97.57.83.111.29.58.83.812.49.8第七十頁,共九十三頁,編輯于2023年,星期一

從上面的介紹和討論,我們知道,球狀變異函數(shù)的一般形式為當(dāng)時,有第七十一頁,共九十三頁,編輯于2023年,星期一

如果記,則可以得到線性模型

根據(jù)表中的數(shù)據(jù),對上式進(jìn)行最小二乘擬合,得到

(4.2.20)

計算可知,上式的顯著性檢驗參數(shù)F=114.054,R2=0.962,可見模型的擬合效果是很好的。(4.2.19)第七十二頁,共九十三頁,編輯于2023年,星期一

比較(4.2.20)式與(4.2.19)式,并做簡單計算可知:c0=2.048,c=1.154,a=8.353,所以,球狀變異函數(shù)模型為(4.2.21)第七十三頁,共九十三頁,編輯于2023年,星期一

(四)克立格插值方法

克立格(Kriging)插值法,又稱空間局部估計或空間局部插值法。它建立在變異函數(shù)理論及結(jié)構(gòu)分析基礎(chǔ)之上的,在有限區(qū)域內(nèi)對區(qū)域化變量的取值進(jìn)行無偏最優(yōu)估計的一種方法??肆⒏穹ㄟm用的條件是,如果變異函數(shù)和相關(guān)分析的結(jié)果表明區(qū)域化變量存在空間相關(guān)性。其實質(zhì)是利用區(qū)域化變量的原始數(shù)據(jù)和變異函數(shù)的結(jié)構(gòu)特點,對未采樣點的區(qū)域化變量的取值進(jìn)行線性無偏、最優(yōu)估計。具體來說,它是根據(jù)待估樣點(或待估塊段)有限鄰域內(nèi)若干已測定的樣點數(shù)據(jù),在認(rèn)真考慮樣點的形狀、大小和空間相互位置關(guān)系,它們與待估樣點相互空間位置關(guān)系,以及變異函數(shù)提供的結(jié)構(gòu)信息之后,對該待估樣點值進(jìn)行的一種線性無偏最優(yōu)估計。第七十四頁,共九十三頁,編輯于2023年,星期一

克立格插值(kriginginterpolation)是根據(jù)變異函數(shù)模型而發(fā)展起來的一系列地統(tǒng)計的空間插值方法,包括:普通克立格法(ordinarykriging);

泛克立格法(universalkriging);

指示克立格法(indicatorkriging);

析取克立格法(disjunctivekriging);

協(xié)同克立格法(cokriging)等。下面僅對普通克立格法作一些簡單介紹。第七十五頁,共九十三頁,編輯于2023年,星期一

首先假設(shè)區(qū)域化變量滿足二階平穩(wěn)假設(shè)和本征假設(shè),其數(shù)學(xué)期望為m,協(xié)方差函數(shù)及變異函數(shù)存在。即

假設(shè)在待估計點(x)的臨域內(nèi)共有n個實測點,即x1,x2,…,xn,其樣本值為。那么,普通克里格法的插值公式為

(4.2.22)第七十六頁,共九十三頁,編輯于2023年,星期一

其中為權(quán)重系數(shù),表示各空間樣本點處的觀測值對估計值的貢獻(xiàn)程度。可見,克立格插值的關(guān)鍵就是計算權(quán)重系數(shù)。顯然,權(quán)重系數(shù)的求取必須滿足兩個條件:一是使的估計是無偏的,即偏差的數(shù)學(xué)期望為零;二是最優(yōu)的,即使估計值和實際值之差的平方和最小。為此,需要滿足以下兩個條件:第七十七頁,共九十三頁,編輯于2023年,星期一

(1)無偏性。要使成為的無偏估計量,即。

當(dāng)時,也就是當(dāng)時,則有這時,為的無偏估計量。(2)最優(yōu)性。在滿足無偏性條件下,估計方差為(4.2.23)第七十八頁,共九十三頁,編輯于2023年,星期一2.應(yīng)用實例

年降水量和蒸發(fā)量,既服從地帶性規(guī)律,同時又受隨機(jī)性因素的影響,因此它們是典型的區(qū)域化變量。我們以甘肅省53個氣象臺站多年平均降水量和蒸發(fā)量數(shù)據(jù)為實測值,擬合了年降水量和蒸發(fā)量的半變異函數(shù)理論模型,并采用普通克立格法和雙變量協(xié)同克里格法,做了空間插值計算,結(jié)論如下。

第七十九頁,共九十三頁,編輯于2023年,星期一

(一)半變異函數(shù)半變異函數(shù)模型,是克立格空間插值的前提條件,同時它也決定著空間插值的精度。一般情況下,半變異函數(shù)模型是根據(jù)半變異函數(shù)云圖的分布,選擇合適的理論模型,按照

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論