




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第六章空間統(tǒng)計學分析經(jīng)典統(tǒng)計學研究純隨機變量變量可無限次重復觀測或大量重復觀測樣本相互獨立研究樣本的數(shù)字特征空間統(tǒng)計學研究區(qū)域化變量變量不能重復試驗樣本具有空間相關性研究樣本的數(shù)字特征和區(qū)域化變量的空間分布特征經(jīng)典統(tǒng)計學與空間統(tǒng)計學的區(qū)別空間統(tǒng)計分析方法由來由于空間現(xiàn)象之間存在不同方向、不同距離成分等相互作用,使得傳統(tǒng)的數(shù)理統(tǒng)計方法無法很好地解決空間樣本點的選取、空間估值和兩組以上空間數(shù)據(jù)的關系等問題,因此,空間統(tǒng)計分析方法應運而生??臻g統(tǒng)計分析方法組成空間統(tǒng)計分析方法由分析空間變異與結(jié)構(gòu)的半變異函數(shù)和用以空間局部估計的克里格插值法兩個主要部分組成,是GIS空間分析的一個重要技術手段。利用空間統(tǒng)計學進行礦產(chǎn)資源儲量計算及平均品位估計利用空間統(tǒng)計學進行礦產(chǎn)資源預測及找礦勘探利用空間統(tǒng)計學進行石油勘探開發(fā)1、在地質(zhì)學中的應用在土壤物理性質(zhì)空間變異中的應用。
集中在應用空間統(tǒng)計學方法研究土壤顏色、土粒、土壤水分、土壤水力導度、飽和水壓、孔徑等土壤物理性質(zhì)的空間變異。在土壤化學性質(zhì)空間變異中的應用。
針對氮、磷、鉀、鈣、鎂、土壤pH等土壤養(yǎng)分的空間相關性研究。對土壤化學性狀的空間屬性進行了描述和歸類,同時為土壤養(yǎng)分管理、土壤環(huán)境背景值制圖等提供了必要數(shù)據(jù)和方法。2、在土壤學中的應用2、在土壤學中的應用在土壤學試驗設計和采樣方法中的應用
分析土壤特性的空間變異規(guī)律,可有效指導土壤采樣數(shù)目、樣點分布、采樣密度及采樣方法的確定。在土壤質(zhì)量管理方面的應用
空間統(tǒng)計學提供了利用已知取樣點的數(shù)據(jù)去估測未采樣點的土壤特性指標是否超過某一閾限的方法。近年來,空間統(tǒng)計學在土壤質(zhì)量管理方面的應用主要集中在土壤養(yǎng)分管理和土壤污染研究。3、在生態(tài)學中的應用生態(tài)學變量空間變異性的定量描述和解釋。
生物特征的估計。
生態(tài)學研究對象的時空變化規(guī)律分析,及不同相關研究對象的時空動態(tài)及耦合關系分析。4、在環(huán)境學中的應用土壤環(huán)境研究
空間統(tǒng)計學中的變異函數(shù)和克立格插值技術是進行重金屬空間結(jié)構(gòu)分析、模擬和估值的主要工具,通過描述和模擬污染物的空間分布特征以及估算未采樣點的取值,揭示出污染物在空間上的分布遷移趨勢。水環(huán)境研究
用于地下水水位預測和污染物遷移擴散參數(shù)的估計、分析預測水環(huán)境污染物濃度、水質(zhì)參數(shù)研究等。5、在氣象學中的應用在數(shù)值天氣預報和日常氣象分析中,經(jīng)常需要將不規(guī)則的站點資料插值到規(guī)則的網(wǎng)格。隨著空間統(tǒng)計學方法的興起,克立格法已經(jīng)逐步應用于氣象學領域。第6章空間統(tǒng)計學分析6.3空間局部估計6.1空間統(tǒng)計分析方法的基本原理6.2空間自相關6.4確定性插值法6.5探索性空間數(shù)據(jù)分析一、空間統(tǒng)計分析的概念20世紀60年代,法國統(tǒng)計學家MatheronG通過大量理論研究,形成了一門新的統(tǒng)計學分支,即空間統(tǒng)計學??臻g統(tǒng)計學是以區(qū)域化變量理論為基礎,以變異函數(shù)為主要工具,研究具有地理空間信息特性的事物或現(xiàn)象的空間相互作用及變化規(guī)律的學科。6.1空間統(tǒng)計分析方法的基本原理自相關空間統(tǒng)計分析方法假設研究區(qū)中所有的值都是非獨立的,相互之間存在相關性。在空間或時間范疇內(nèi),這種相關性被稱為自相關??臻g統(tǒng)計分析的重要任務揭示空間數(shù)據(jù)的相關規(guī)律和利用相關規(guī)律進行未知點預測。由于空間統(tǒng)計分析包含這兩個顯著的任務,所以涉及兩次使用樣點數(shù)據(jù),第一次用作估計空間自相關,第二次用作未知點預測。6.1空間統(tǒng)計分析方法的基本原理二、空間統(tǒng)計分析中的理論假設1、區(qū)域化變量
當一個變量呈空間分布時,稱之為區(qū)域化。
區(qū)域化變量就是指以空間點x的三個直角坐標(xu,xv,xw)為自變量的隨機場Z(xu,xv,xw)=Z(x),它常常反應某種空間現(xiàn)象的特征。區(qū)域化變量的兩重性表現(xiàn)在觀測前把它看成是隨機場,依賴于坐標(Xu,Xv,Xw),觀測后是一個普通的空間三元函數(shù)值或一個空間點函數(shù)。6.1空間統(tǒng)計分析方法的基本原理區(qū)域化變量是一種在空間上具有數(shù)值的實函數(shù),它具有以下屬性:6.1空間統(tǒng)計分析方法的基本原理空間局限性連續(xù)性各向異性區(qū)域化變量被限制于一定空間范圍,這稱為幾何域。在幾何域內(nèi),區(qū)域化變量的屬性最為明顯;在幾何域外,不明顯。不同的區(qū)域化變量具有不同程度的連續(xù)性,用區(qū)域化變量的半變異函數(shù)來描述。當區(qū)域化變量在各個方向上具有相同性質(zhì)時稱各向同性,否則稱為各向異性。其它屬性:①
區(qū)域化變量在一定范圍內(nèi)呈一定程度的空間相關,當超出這一范圍之后,相關性變?nèi)跎踔料?。?/p>
對于任一區(qū)域化變量,特殊的變異性可以疊加在一般的規(guī)律之上。6.1空間統(tǒng)計分析方法的基本原理2、協(xié)方差函數(shù)在隨機函數(shù)中,當只有一個自變量x時稱為隨機過程,隨機過程Z(t)在時間t1和t2處的隨機變量Z(t1)、Z(t2)的二階混合中心矩定義為隨機過程的協(xié)方差函數(shù)記為Cov{Z(t1),Z(t2)},即Cov{Z(t1),Z(t2)}=E[Z(t1)—EZ(t1)][Z(t2)—EZ(t2)](6.1)6.1空間統(tǒng)計分析方法的基本原理當隨機函數(shù)依賴于多個自變量時,Z(x)=Z(Xu,Xv,Xw)稱為隨機場,而隨機場Z(x)在空間點x和x+h處的兩個隨機變量Z(x)和Z(x+h)的二階混合中心矩定義為隨機場Z(x)的自協(xié)方差函數(shù),即Cov{Z(x),Z(x+h)}=E[Z(x)Z(x+h)]—E[Z(x)]E[Z(x+h)](6.2)隨機場Z(x)的自協(xié)方差函數(shù)亦稱為協(xié)方差函數(shù),一般地,協(xié)方差函數(shù)依賴于空間點x和向量h。當h=0時,協(xié)方差函數(shù)變?yōu)镃ov(x,x+0)=E[Z(x)]2—{E[Z(x)]}2(6.3)6.1空間統(tǒng)計分析方法的基本原理3、變異函數(shù)變異函數(shù)在一維條件下,當空間點x在一維x軸上變化時,區(qū)域變量Z(x)在點x和x+h處的值Z(x)與Z(x+h)差的方差一半定義為區(qū)域變量Z(x)在x軸上的變異函數(shù),記為γ(x,h),即γ(x,h)=1/2*Var[Z(x)—Z(x+h)]2
=1/2*E[Z(x)—Z(x+h)]2—1/2*{E[Z(x)]—E[Z(x+h)]}2
(6.4)6.1空間統(tǒng)計分析方法的基本原理在二階平穩(wěn)假設條件下對任意h有
E[Z(x+h)]=E[Z(x)]因此,式(6.4)可改寫為
γ(x,h)=1/2*E[Z(x)—Z(x+h)]2
(6.5)從式(6.5)可知,變異函數(shù)依賴于x和h,當變異函數(shù)僅依賴于h,與x無關時,變異函數(shù)γ(x,h)可改寫成γ(h),即
γ(h)=1/2*E[Z(x)—Z(X+h)]2
(6.6)6.1空間統(tǒng)計分析方法的基本原理4、平穩(wěn)性假設及內(nèi)蘊假設(1)平穩(wěn)性假設設某一隨機函數(shù)Z(x),其空間分布律不因平移而改變,即若對任一向量h,關系式G(z1,z2,…,x1,x2,…)=G(z1,z2,…,x1+h,x2+h,…)成立時,則該隨機函數(shù)為平穩(wěn)性隨機函數(shù)。確切的說,無論位移向量h多大,兩個k維向量的隨機變量{Z(x1),Z(x2),…,Z(xk)}和{Z(x1+h),Z(x2+h),…,Z(xk+h)}有相同的分布律。6.1空間統(tǒng)計分析方法的基本原理當區(qū)域化變量滿足下列兩個條件時,稱該區(qū)域化變量滿足二階平穩(wěn):①在整個研究區(qū)內(nèi),區(qū)域化變量Z(x)的數(shù)學期望對任意x存在且等于常數(shù),即E[Z(x)]=m(常數(shù)),任意x。②在整個研究區(qū)內(nèi),區(qū)域化變量的空間協(xié)方差函數(shù)對任意x和h存在且平穩(wěn),即
Cov{Z(x),Z(x+h)}=E[Z(x)Z(x+h)]-m2=C(h),任意x,h6.1空間統(tǒng)計分析方法的基本原理(2)內(nèi)蘊假設一些自然現(xiàn)象和隨機函數(shù)具有無限離散性,這時區(qū)域化變量Z(x)的增量Z(x)-Z(x+h)滿足下列兩個條件時,就稱該區(qū)域化變量滿足內(nèi)蘊假設:①在整個研究區(qū)內(nèi)隨機函數(shù)Z(x)的增量的數(shù)學期望為0,即E[Z(x)-Z(x+h)]=0,任意x,h②對于所有矢量的增量的方差函數(shù)存在且平穩(wěn)Var[Z(x)-Z(x+h)]=E[Z(x)-Z(x+h)]2=2γ(x,h)=2γ(h),任意X,h即要求Z(x)的半變異函數(shù)存在且平穩(wěn)。6.1空間統(tǒng)計分析方法的基本原理內(nèi)蘊假設可以理解為:隨機函數(shù)Z(x)的增量Z(x)-Z(x+h)只依賴于分隔它們的向量h,而不依賴于具體位置x,這樣,被向量h分割的每一對數(shù)據(jù)[Z(x),Z(x+h)]可以看成是一對隨機變量{Z(x1),Z(x2)}的一個不同現(xiàn)實,而半變異函數(shù)γ(h)的估計量γ*(h)為
γ*(h)=1/2N(h)*∑[Z(xi)-Z(xi+h)]2式中,N(h)是被向量h相分隔的試驗數(shù)據(jù)對的數(shù)目。6.1空間統(tǒng)計分析方法的基本原理準平穩(wěn)假設如果隨機函數(shù)只在有限大小的鄰域內(nèi)是平穩(wěn)的,則稱該隨機函數(shù)服從準平穩(wěn)假設。準平穩(wěn)(或準內(nèi)蘊)假設是一種折中方案,它既考慮到某現(xiàn)象相似性的尺度,也顧及到有效數(shù)據(jù)的多少。6.1空間統(tǒng)計分析方法的基本原理一、空間自相關理論在空間統(tǒng)計分析中,相關分析可以檢測兩種現(xiàn)象的變化是否存在相關性,若所分析的統(tǒng)計量為不同觀察對象的同一屬性變量,則稱之為自相關。通過檢測一個位置上的變異是否依賴于鄰近位置的變異來判斷該變異是否存在空間自相關性。根據(jù)變異的性質(zhì)可以將變異分為三種類型:絕對型變異(花的形態(tài)、顏色),等級型變異(植被密度等級)和連續(xù)型變異(形態(tài)測量、基因頻率)。6.2空間自相關空間自相關是針對同一個屬性變量而言的,當某一測樣點屬性值高,而其相鄰點同一屬性值也高時,為空間正相關;反之,為空間負相關。當空間自相關僅與兩點間距離有關時,稱為各向同性;否則為各向異性。6.2空間自相關二、空間自相關分析方法空間自相關方法按功能大致分為兩類:全域型自相關、區(qū)域型自相關全域型自相關的功能在于描述某現(xiàn)象的整體分布情況,判斷該現(xiàn)象在空間是否有聚集特性,但并不指出聚集在哪些區(qū)域。區(qū)域型自相關能夠推算出聚集地的范圍,原因在于:1、由統(tǒng)計顯著性檢定的方法,檢定聚集空間單元相對于整體研究范圍而言,其空間自相關是否足夠顯著,若顯著性大,即是該現(xiàn)象聚集的地區(qū)。2、度量空間單元對整個研究范圍空間自相關的影響程度,影響程度大的往往是區(qū)域內(nèi)的“特例”,“特例點”往往為聚集點。最為常用的計算空間自相關方法是:Moran’sI、Geary’sC、Getis、Joincount以及空間自相關系數(shù)圖等6.2空間自相關1、Moran’sI法建立空間區(qū)位相鄰矩陣:若在區(qū)域內(nèi)有n個空間單元,每個空間單元皆有一個觀察值X,空間單元i與空間單元j的空間關系構(gòu)成Wij的空間相鄰矩陣,以1表示i和j相鄰,以0表示i和j不相鄰。其簡單定義為[Wij]n×n
其中,Wij為表示區(qū)位相鄰矩陣,Wij=1表示區(qū)位相鄰,Wij=0則表示區(qū)位不相鄰。6.2空間自相關MoranIndex值是應用較廣泛的一種空間自相關性判定指標,其計算式為式中,,
。Wij表示區(qū)位相鄰矩陣;Cij表示屬性相似矩陣;Xi和Xj分別為i和j空間單元屬性數(shù)據(jù)值,Wij=1代表空間單元相鄰,Wij=0代表不相鄰,i≠j,Wii=0。6.2空間自相關(6.16)
若母體為隨機分配,常采用統(tǒng)計驗證的方式進一步判定MoranIndex的期望值和變異數(shù)。I的期望值為其變異數(shù)為其中,;;;6.2空間自相關;W·i和Wi·為相關權重矩陣i及j行的總和。I值結(jié)果一定介于-1到1之間;I>0為正相關,數(shù)值越大表示空間分布的相關性越大,即空間上聚集分布的現(xiàn)象越明顯;I<0為負相關,數(shù)值越小代表示相關性??;I趨于0時,代表空間分布呈現(xiàn)隨機分布的情形。6.2空間自相關I>0(正相關)I<0(負相關)圖6.1空間自相關正負結(jié)果示意圖由于Moran’sI值的量測僅能表明屬性相似的單元間是否呈聚集狀態(tài),無法由簡潔的數(shù)值表達空間中的聚集分布狀態(tài),根據(jù)各空間間隔自相關值的計算,Moran’sI公式可改寫為
其中,d代表空間間隔;Wij代表區(qū)位相鄰矩陣。d=1代表空間單元是相鄰的;d=2定義為與間隔一個的空間單元相接鄰,而與原來的空間單元不相鄰。6.2空間自相關(6.19)區(qū)域空間自相關的定義為
其中,Ii為LocalMoranIndex,Wij為區(qū)位相鄰矩陣。即:n個區(qū)域空間自相關值累加和即全域空間自相關的值。6.2空間自相關(6.20)2、Geary’sContiguityRatioC法與Moran’sI類似,其表達式為
C=1,表示不相關;0<C<1,表示正相關;C>1表示負相關。6.2空間自相關(6.21)3、Getis統(tǒng)計法Anselin曾歸納各種空間聚集的研究方法,該方法經(jīng)常表達為其中,Wij代表i與j的空間關系,即類似上述空間相鄰權重矩陣Wij;而yij則是i與j的觀察式。Yij的假設與觀念不同,即為不同的空間聚集研究方法。6.2空間自相關(6.22)全域型Getis其中,wij(d)為距離d內(nèi)的空間相鄰權重矩陣。若i與j相鄰,wij(d)=1;若i與j不相鄰,wij(d)=0。區(qū)域型Getis可量測每一個i在距離d的范圍內(nèi),與每個j的相關程度。6.2空間自相關(6.23)(6.24)
4、空間自相關系數(shù)圖分析法(以某地區(qū)為例)(1)圖中有兩處隆起處,代表微視尺度及宏觀尺度上,存在顯著的聚集分布現(xiàn)象,但聚集現(xiàn)象不存在于中觀尺度上。(2)空間間隔為2時,空間自相關值有波峰,即在空間間隔為2時,其空間分布有最大的自相關性。6.2空間自相關空間自相關空間間隔135791113151719-1.00-0.501.000.500.001.50圖6.2某地區(qū)某種空間自相關系數(shù)圖
應用實例
中國大陸30個省級行政區(qū)人均GDP的空間關聯(lián)分析。根據(jù)各?。ㄖ陛犑小⒆灾螀^(qū))之間的鄰接關系,采用二進制鄰接權重矩陣,選取各?。ㄖ陛犑?、自治區(qū))1998—2002年人均GDP的自然對數(shù),依照公式計算全局Moran指數(shù)I,計算其檢驗的標準化統(tǒng)計量Z(I),結(jié)果如下表所示。年份IZP19980.50014.50350.000019990.50694.55510.000020000.51124.59780.000020010.50594.55320.000020020.50134.53260.0000
從表中可以看出,在1998—2002年期間,中國大陸30個省級行政區(qū)人均GDP的全局Moran指數(shù)均為正值;在正態(tài)分布假設之上,對Moran指數(shù)檢驗的結(jié)果也高度顯著。這就是說,在1998—2002年期間,中國大陸30個省級行政區(qū)人均GDP存在著顯著的、正的空間自相關,也就是說各省級行政區(qū)人均GDP水平的空間分布并非表現(xiàn)出完全的隨機性,而是表現(xiàn)出相似值之間的空間集聚,其空間聯(lián)系的特征是:較高人均GDP水平的省級行政區(qū)相對地趨于和較高人均GDP水平的省級行政區(qū)相鄰,或者較低人均GDP水平的省級行政區(qū)相對地趨于和較低人均GDP水平的省級行政區(qū)相鄰。選取2001年我國30個省級行政區(qū)人均GDP數(shù)據(jù),計算局部Gi統(tǒng)計量和局部Gi統(tǒng)計量的檢驗值Z(Gi),并繪制統(tǒng)計地圖如下。檢驗結(jié)果表明,貴州、四川、云南西部3省的Z值在0.05的顯著性水平下顯著,重慶的Z值在0.1的顯著性水平下顯著,該4省市在空間上相連成片分布,而且從統(tǒng)計學意義上來說,與該區(qū)域相鄰的省區(qū),其人均GDP趨于為同樣是人均GDP低值的省區(qū)所包圍。由此形成人均GDP低值與低值的空間集聚,據(jù)此可認識到西部落后省區(qū)趨于空間集聚的分布特征。
東部的江蘇、上海、浙江三省市的Z值在0.05的顯著性水平下顯著,天津的Z值在0.1的顯著性水平下顯著。而東部上海、江浙等發(fā)達省市趨于為一些相鄰經(jīng)濟發(fā)展水平相對較高的省份所包圍,東部發(fā)達地區(qū)的空間集聚分布特征也顯現(xiàn)出來。以(Wz,z)為坐標,進一步繪制Moran散點圖可以發(fā)現(xiàn),多數(shù)?。ㄖ陛犑?、自治區(qū))位于第1和第3象限內(nèi),為正的空間聯(lián)系,屬于低低集聚和高高集聚類型,而且位于第3象限內(nèi)的低低集聚類型的?。ㄖ陛犑?、自治區(qū))比位于第1象限內(nèi)的高高集聚類型的省(直轄市、自治區(qū))更多一些。
上圖進一步顯示了30個省級行政區(qū)人均GDP局部集聚的空間結(jié)構(gòu)。可以看出,從人均GDP水平相對地來看:高值被高值包圍的高高集聚?。ㄖ陛犑校┯校罕本?、天津、河南、安徽、湖北、江西、海南、廣東、福建、浙江、山東、上海、江蘇;低值被低值包圍的低低集聚?。ㄗ灾螀^(qū))有:黑龍江、內(nèi)蒙古、新疆、吉林、甘肅、山西、陜西、青海、西藏、四川、云南、遼寧、貴州;被低值包圍的高值?。ㄖ陛犑校┯校褐貞c、廣西、河北;被高值包圍的低值省份只有湖南。空間局部估計空間局部估計也稱空間局部插值,它是利用在地表不同位置采集的樣點生成一個連續(xù)表面。常見的克立格插值模型有:普通克立格、簡單克立格、泛克立格、概率克立格、指示克立格、析取克立格及協(xié)同克立格等插值一般分為兩步:(1)樣點空間結(jié)構(gòu)量化分析——半變異函數(shù)分析;(2)對未知點進行預測6.3空間局部估計20世紀50年代,南非采礦工程師DanielKrige總結(jié)多年金礦勘探經(jīng)驗,提出根據(jù)樣品點的空間位置和樣品點之間空間相關程度的不同,對每個樣品觀測值賦予一定的權重,進行移動加權平均,估計被樣品點包圍的未知點礦產(chǎn)儲量,形成了克里金估計方法(kriging)的雛形。20世紀60年代初期,法國地質(zhì)數(shù)學家GeorgesMatheron提出數(shù)學形式的區(qū)域化變量,嚴格地給出了基本變異函數(shù)(variogram)的定義和一般克里金估計方法。一、半變異函數(shù)分析1、半變異函數(shù)及其性質(zhì)半變異函數(shù)是一個關于數(shù)據(jù)點的半變異值與數(shù)據(jù)點間距離的函數(shù),設區(qū)域化變量Z(xi)和Z(xi+h)分別是Z(x)在空間位置xi和xi+h上的觀測值(i=1,2,…,N(h)),則半變異函數(shù)可由下式進行估計其中,N(h)是分隔距離為h的樣本量。前提:Z(xi)為區(qū)域化變量且滿足平穩(wěn)條件和本征假設6.3空間局部估計(6.25)
空間統(tǒng)計學將變異函數(shù)理論模型分為3大類:第1類是有基臺值模型,包括球狀模型、指數(shù)模型、高斯模型、線性有基臺值模型和純塊金效應模型;第2類是無基臺值模型,包括冪函數(shù)模型、線性無基臺值模型、拋物線模型;第3類是孔穴效應模型。下面有代表性地介紹幾種常見的變異函數(shù)理論模型。6.3空間局部估計
①純塊金效應模型:其一般公式為式中:c0>0,為先驗方差。該模型相當于區(qū)域化變量為隨機分布,樣本點間的協(xié)方差函數(shù)對于所有距離h均等于0,變量的空間相關不存在。
②球狀模型:其一般公式為
式中:c0為塊金(效應)常數(shù);c為拱高;c0+c為基臺值;a為變程。當c0=0,c=1時,稱為標準球狀模型。球狀模型是地統(tǒng)計分析中應用最廣泛的理論模型,許多區(qū)域化變量的理論模型都可以用該模型去擬合。
③指數(shù)模型:其一般公式為式中:c0和c意義與前相同,但a不是變程。當h=3α時,,即,從而指數(shù)模型的變程約為。當c0=0,c=1時,稱為標準指數(shù)模型。④高斯模型:其一般公式為式中:c0和c意義與前相同,a也不是變程。當時,,即,因此高斯模型的變程約為。當時,稱為標準高斯函數(shù)模型。⑤冪函數(shù)模型:其一般公式為式中:θ為冪指數(shù)。當θ變化時,這種模型可以反映在原點附近的各種性狀。但是θ必須小于2,若,則函數(shù)就不再是一個條件非負定函數(shù)了,也就是說它已經(jīng)不能成為變異函數(shù)了。
⑥對數(shù)模型:其一般公式為顯然,當,這與變異函數(shù)的性質(zhì)不符。因此,對數(shù)模型不能描述點支撐上的區(qū)域化變量的結(jié)構(gòu)。
⑦線性有基臺值模型:其一般公式為式中:該模型的變程為a,基臺值為。
⑧線性無基臺值模型:其一般公式為
從式中可以看出,該模型沒有基臺值,也沒有變程。
例如:某地區(qū)降水量是一個區(qū)域化變量,其變異函數(shù)的實測值及距離h的關系見下表,下面我們試用回歸分析方法建立其球狀變異函數(shù)模型。實測值γ(h)距離h實測值γ(h)距離h2.10.69.24.94.31.110.35.15.72.210.56.26.52.510.97.57.83.111.29.58.83.812.49.8從上面的介紹和討論,我們知道,球狀變異函數(shù)的一般形式為當時,有如果記,則可以得到線性模型
根據(jù)表中的數(shù)據(jù),對上式進行最小二乘擬合,得到
計算可知,上式的顯著性檢驗參數(shù)F=114.054,R2=0.962,可見模型的擬合效果是很好的。比較前兩式,并做簡單計算可知:c0=2.048,c=1.154,a=8.353,所以,球狀變異函數(shù)模型為2、影響半變異函數(shù)的主要因素(1)樣點間的距離和支撐的大小為了使建立的半變異函數(shù)模型能準確地反映各種尺度上的變化特征,要確定采樣的最小尺度。在采樣之前,首先需要在滿足精度的前提下確定最佳的采樣尺度。用塊段取樣時,要考慮支撐的大小,一般采用正則化變量消除其影響。6.3空間局部估計(2)樣本數(shù)量的大小樣本數(shù)量在對空間統(tǒng)計學中主要指計算實際半變異函數(shù)值時的點對數(shù)目。實際取樣工作中點對數(shù)目不能無限,一般要求在變程a以內(nèi)各距離上的點對數(shù)目不應小于20對。在小尺度距離上相對要多一些,大尺度距離相對少一些。(3)異常值的影響如果異常值比較多,塊金值C0要增大,隨機成分的影響加強,而空間自相關的影響消弱。對于半變異函數(shù)的模型來講,塊金效應值C0越小越好。6.3空間局部估計(4)比例效應的影響如果平均值和標準差之間存在明顯的線性關系,則比例效應存在,反之亦然。當樣品方差隨著平均值的增加而增加時,稱正比例效應,反之亦然。比例效應的存在會使實際半變異函數(shù)值產(chǎn)生畸變,消除比例效應的方法主要是通過對原始數(shù)據(jù)取對數(shù),或者通過相對半變異函數(shù)的求解。6.3空間局部估計(5)漂移的影響當漂移存在時,半變異函數(shù)值不再是半變異函數(shù)的無偏估計。要消除漂移對半變異函數(shù)的影響,主要通過建立合適的漂移形式,即E[Z(x)]=m(x)中,m(x)的函數(shù)式,它使半變異函數(shù)曲線真實地符合實際半變異函數(shù)值。6.3空間局部估計3、半變異模型的合并假設數(shù)據(jù)中有兩個獨特的結(jié)構(gòu),只用單一模型無法表達,就可以用兩個單獨的模型來模擬這個半變異圖,然后將它們合并為一個模型。6.3空間局部估計4、半變異模型的步長分組與步長大小的選擇在所有樣點中兩兩之間均能形成樣點對,如下圖。要在半變異云圖上畫出所有樣點對是無法操作的。應設法將樣點對按照它們之間的距離和方向進行分組,這個分組過程稱為步長分組。6.3空間局部估計圖6.512個樣點兩兩形成的樣點對示意圖在步長分組過程中將樣點對按相同距離和方向進行分組,這樣每一個點都具有統(tǒng)一的原點,這個特性使理論半變異圖具有對稱性。下圖中,連線1和2具有非常相似的距離和方向。6.3空間局部估計2143圖6.6樣點對的步長分組示意圖步長大小的選擇:如果步長太大,短程的自相關性將被掩蓋;如果步長太小,就會產(chǎn)生許多空的步長組,并且每個步長組中的樣點數(shù)太少不能代表步長組的“平均值”。當用規(guī)則格網(wǎng)取樣時,格網(wǎng)間距通??梢杂脕泶_定步長大??;如果數(shù)據(jù)是通過不規(guī)則取樣的,步長大小乘以步長數(shù)應等于樣點間最大距離的0.5倍。6.3空間局部估計5、空間數(shù)據(jù)變化的方向效應Z(x)能通過半變異函數(shù)反應區(qū)域化變量的隨機性和結(jié)構(gòu)性,因此其在每個方向上呈現(xiàn)相同或不同的性質(zhì)。如果在各個方向上Z(x)的變異性相同或相近,稱Z(x)為各向同性。反之,稱為各向異性。在結(jié)構(gòu)分析中,半變異函數(shù)的變程a在不同方向上的大小反映各向同性或各向異性,如下圖所示。6.3空間局部估計
0a1a2hγ1(h)γ2(h)γ(h)C1C2圖6.7半變異函數(shù)的各向異性曲線6.3.2、克立格插值法概述克立格(Kriging)插值法,又稱空間局部估計或空間局部插值法,是空間統(tǒng)計學的主要內(nèi)容之一。克立格法是建立在變異函數(shù)理論及結(jié)構(gòu)分析基礎之上的,它是在有限區(qū)域內(nèi)對區(qū)域化變量的取值進行無偏最優(yōu)估計的一種方法。
克立格法適用的條件是,如果變異函數(shù)和相關分析的結(jié)果表明區(qū)域化變量存在空間相關性。
其實質(zhì)是利用區(qū)域化變量的原始數(shù)據(jù)和變異函數(shù)的結(jié)構(gòu)特點,對未采樣點的區(qū)域化變量的取值進行線性無偏、最優(yōu)估計。
6.3空間局部估計對于任意待估計點的估計值Z’(x0)均可以通過待估測點范圍內(nèi)的n個觀測樣本值Z(xi)(=1,2,…,n)的線性組合得到,即其中,λi為權重系數(shù),其和等于1,Z(xi)為觀測樣本值,它們位于區(qū)域內(nèi)xi位置。由于克立格法是一種無偏最優(yōu)估計,λi的確定應滿足利用拉格朗日定理,由式(6.27)和式(6.28)可推導出λi與半方差之間的矩陣方程6.3空間局部估計(6.28)(6.27)(6.29)其中,由式(6.29)代入式(6.26)計算內(nèi)插估計值Z’(x0)6.3空間局部估計三、常見克立格模型1、普通克立格模型當區(qū)域化變量Z(x)的數(shù)學期望E[Z(x)]=m為未知常數(shù)時,常采用普通克立格法進行局部估計。普通克立格模型為在運用普通克立格法進行局部估計時,設待估塊段為V,中心為x,其平均值為ZV,則6.3空間局部估計(6.31)(6.32)(6.33)在待估塊段V的領域內(nèi),存在一組n個已知樣點xi(i=1,2,…,n),其觀測值為Z(xi),其數(shù)學期望也為m。令ZV#為ZV的線性估計量,由n個已知的樣點觀測值Z(xi)構(gòu)成的線性組合,即6.3空間局部估計(6.34)在滿足下面兩個條件時,ZV#為ZV的線性無偏、最優(yōu)估計量
(1)無偏性條件當時,,ZV#為ZV的無偏估計量。
(2)最優(yōu)性條件在滿足無偏性條件下,估計方差為在無偏性條件下,使估計方差最小,則ZV#為ZV的無偏、最優(yōu)估計量。
6.3空間局部估計(6.35)2、簡單克立格模型簡單克立格插值模型可以表示為簡單克立格法可以使用半變異函數(shù)或協(xié)方差函數(shù)進行分析,可進行變換和剔除趨勢,也可進行測量誤差分析。6.3空間局部估計(6.36)
3、泛克立格模型泛克立格法是在漂移的形式E[Z(x)]=m(x)和非平穩(wěn)隨機函數(shù)Z(x)的協(xié)方差已知的情況下,一種考慮到有漂移的無偏線性估計量的空間統(tǒng)計方法,其模型可以表示為6.3空間局部估計(6.37)
4、指示克立格模型指示克立格法的模型可表示為其中,I(s)是一個二進制變量。應用二進制變量后,指示克立格法的預測精度將超過普通克立格法。6.3空間局部估計(6.38)5、析取克立格模型析取克立格法的模型表達為將指示克立格法的指示函數(shù)進行一般化處理便得到析取克立格法的指示函數(shù)表達式6.3空間局部估計(6.39)(6.41)6、協(xié)同克立格模型普通協(xié)同克立格法的模型下式所示協(xié)同克立格法應用過程中引用了協(xié)同變量,以求預測的結(jié)果更好。6.3空間局部估計(6.42)四、克立格模型應用條件這是一個二階多項式趨勢面方程,由空間坐標(x,y)經(jīng)線性回歸分析獲得。如果趨勢方程中的回歸系數(shù)是未知的,便形成了泛克立格模型;如果在任何時候趨勢是已知的,會形成簡單克立格模型;基于多個變量的克立格模型便形成了協(xié)同克立格模型;如果在協(xié)同克立格模型中使用的是未經(jīng)任何變換的Z(s),便形成了概率克立格模型。6.3空間局部估計(6.44)
地理學中可能遇到的問題:了解天津市空氣質(zhì)量宏觀分布天津市空氣質(zhì)量監(jiān)測點了解我國某個地區(qū)的氣候狀況氣象站分布-溫度降水某觀測站因意外存在缺測、漏測解決問題的難點:到研究區(qū)每個點進行觀測是非常困難的——時間、人力或財力都不允許??臻g插值導言GIS不僅對實際可視的地面對象進行計算,還可以對實際上無法顯示,但是可以用數(shù)值表示并可視化,稱為統(tǒng)計面。構(gòu)建統(tǒng)計面實際上和地形分析方法類似,只是要求輸入的數(shù)據(jù)為點數(shù)據(jù)樣本。由于點數(shù)據(jù)無法形成一個面,因此需要對點與點之間的空白區(qū)域進行估計,以構(gòu)成一個完整的面,這個構(gòu)成,成為空間插值。如何生成表面?如何才能獲得盡可能精確的表面?如何評價和比較分析的結(jié)果?空間插值要解決的問題一、空間插值的概念空間插值:用已知點的數(shù)值來估算其他點的數(shù)值的過程。
內(nèi)插:在已觀測點的區(qū)域內(nèi)估算未觀測點的數(shù)據(jù)的過程;
外推:在已觀測點的區(qū)域外估算未觀測點的數(shù)據(jù)的過程。——預測通過已知的空間數(shù)據(jù),找到一個函數(shù)關系式,使關系式最好得逼近這些已知的空間數(shù)據(jù),并能夠根據(jù)該函數(shù)關系式,推求出區(qū)域范圍內(nèi)其他任意點或多邊形分區(qū)范圍的值。
空間插值的結(jié)果是形成柵格,因此空間插值也可以理解為將點狀矢量數(shù)據(jù)轉(zhuǎn)化為柵格數(shù)據(jù)的過程。也是將點數(shù)據(jù)轉(zhuǎn)換為面數(shù)據(jù)的一種方法。將空間上離散點的測量數(shù)據(jù)轉(zhuǎn)換為連續(xù)的曲面數(shù)據(jù),即填補樣本點之間的數(shù)據(jù)空白,以便與其它空間現(xiàn)象的分布進行建模研究。一、空間插值的概念已知數(shù)據(jù)函數(shù)關系式未知數(shù)據(jù)從存在的觀測數(shù)據(jù)中找到一個函數(shù)關系式,使該關系式最好的逼近這些已知的空間數(shù)據(jù),并能根據(jù)函數(shù)關系式推求出區(qū)域范圍內(nèi)其它任意點的值。距離衰減效應空間位置上越靠近的點,越可能具有相似的觀察值;而距離越遠的點,其特征值相似的可能性越小。Tobler(1970)”地理學第一定律”描述了這樣的性質(zhì):所有的事物或現(xiàn)象在空間上都是有聯(lián)系的,但相距近的事物或現(xiàn)象之間的聯(lián)系一般較相距遠的事物或現(xiàn)象間的聯(lián)系要緊密。
二、空間插值的理論假設缺值估計如何在沒有測點的地區(qū)得到我們需要的數(shù)據(jù)?測點自然或人為的原因,缺少某天或某個時間段的數(shù)據(jù)。內(nèi)插等值線形象直觀的顯示空間數(shù)據(jù)分布平面制圖數(shù)據(jù)格網(wǎng)化以不規(guī)則點圖元組織的Z變量的數(shù)據(jù),并不適合于圖形顯示,也不適于進行分析。多數(shù)空間分析要求將Z值轉(zhuǎn)換成一個規(guī)則間距空間格網(wǎng),或者轉(zhuǎn)換成不規(guī)則三角形網(wǎng)。規(guī)則格網(wǎng)數(shù)據(jù)更好的顯示空間數(shù)據(jù)連續(xù)分布三、空間插值意義二、空間插值的類型整體插值和局部插值;精確插值和近似插值。確定性插值和地統(tǒng)計插值;整體插值:用研究區(qū)所有采樣點數(shù)據(jù)進行全區(qū)特征擬合。在整個區(qū)域用一個數(shù)學函數(shù)表達地形曲面,采用全部控制點計算未知點數(shù)據(jù)。整個區(qū)域的數(shù)據(jù)都會影響單個插值點,單個數(shù)據(jù)點變量值的增加、減少或者刪除,都對整個區(qū)域有影響。典型例子是:全局趨勢面分析、回歸模型、FourierSeries(周期序列)1、整體插值和局部插值局部內(nèi)插法只使用鄰近的數(shù)據(jù)點(樣本控制點)來估計未知點的值,步驟如下:定義一個鄰域或搜索范圍;搜索落在此鄰域范圍的數(shù)據(jù)點;選擇能表達這有限個點空間變化的數(shù)學函數(shù);為未知的數(shù)據(jù)點賦值。將復雜的地形地貌分解成一系列的局部單元,在這些局部單元內(nèi)部地形曲面具有單一的結(jié)構(gòu),由于范圍的縮小和曲面形態(tài)的簡化,用簡單曲面即可描述地形曲面。局部內(nèi)插方法:泰森多邊形(Voronoi邊形、邊界內(nèi)插)樣條函數(shù)插值法反距離權重內(nèi)插Kriging插值(空間自由協(xié)方差最佳內(nèi)插)密度估算單個數(shù)據(jù)點的改變只影響其周圍有限的數(shù)據(jù)點。局部內(nèi)插法整體插值方法將小尺度的、局部的變化看作隨機和非結(jié)構(gòu)性噪聲,從而丟失了這一部分信息。局部插值方法恰好能彌補整體插值方法的缺陷。整體插值方法通常不直接用于空間插值,而是用來檢測總趨勢和不同于總趨勢的最大偏離部分,即剩余部分,在去除了宏觀趨勢后,可用剩余殘差來進行局部插值。整體插值注意的問題精確插值:產(chǎn)生通過所有觀測點的曲面。在精確插值中,插值點落在觀測點上,內(nèi)插值等于估計值。近似插值:插值產(chǎn)生的曲面不通過所有觀測點。當數(shù)據(jù)存在不確定性時,應該使用近似插值,由于估計值替代了已知變量值,近似插值可以平滑采樣誤差。2、精確插值和非精確(近似)插值確定性方法基于未知點周圍點的值和特定的數(shù)學公式,來直接產(chǎn)生平滑的曲面;3、確定性方法和地統(tǒng)計(隨機性)方法基于自相關性(測量點的統(tǒng)計關系),根據(jù)測量數(shù)據(jù)的統(tǒng)計特征產(chǎn)生曲面;由于建立在統(tǒng)計學的基礎上,因此不僅可以產(chǎn)生預測曲面,而且可以產(chǎn)生誤差和不確定性曲面,用來評估預測結(jié)果的好壞多種kriging方法地統(tǒng)計學插值基于自相關性(測量點的統(tǒng)計關系),根據(jù)測量數(shù)據(jù)的統(tǒng)計特征產(chǎn)生曲面;由于建立在統(tǒng)計學的基礎上,因此不僅可以產(chǎn)生預測曲面,而且可以產(chǎn)生誤差和不確定性曲面,用來評估預測結(jié)果的好壞多種kriging方法地統(tǒng)計學插值確定性插值法是使用數(shù)學函數(shù)進行插值,以研究區(qū)域內(nèi)部的相似性或者以平滑度為基礎,由已知樣點來創(chuàng)建預測表面的插值方法。確定性插值法分為全局性插值法和局部性插值法,又分為精確性插值方法和非精確性插值方法。6.4確定性插值法一、反距離加權插值法反距離插值方法最早由Shepard
提出(RichardFranke,1982)提出的,并逐步得到發(fā)展。是一種局部方法,假設未知值的點受較近控制點的影響比較遠控制點的影響更大。每個采樣對插值結(jié)果的影響隨距離增加而減弱,因此距目標點近的樣點賦予的權重較大。6.4確定性插值法一、反距離加權插值法反距離加權法使用區(qū)域內(nèi)已知的樣點值來預測除樣點外的任何位置的值6.4確定性插值法采樣點圖6.15用反距離加權法內(nèi)插的表面反距離加權插值法的一般公式為確定權重的計算公式為
p為參數(shù),可以通過求均方根預測誤差的最小值確定其最佳值。6.4確定性插值法(6.45)(6.46)二、全局多項式內(nèi)插法全局多項式插值就像把一張紙插入到那些取值大小不同的樣點之間(如下圖)由采樣點值擬合的全局多項式表面起伏變化平緩,它能夠捕捉到數(shù)據(jù)集中潛在的粗糙數(shù)據(jù)。6.4確定性插值法(a)(b)(c)圖6.16全局多項式插值法全局多項式插值法適用的情況有:(1)當一個研究區(qū)域的表面變化緩慢,可以采用全局多項式插值法對該研究區(qū)進行表面插值;(2)檢驗長期變化的、全局性趨勢的影響時一般采用全局多項式插值法6.4確定性插值法三、局部多項式插值法局部多項式插值法是將一個復雜的表面進行分解,并用每個小平面的中心值來預測研究區(qū)中每一點的值,從而擬合出更為準確、真實表面的一種插值方法。局部多項式插值法適于用特定的多項式方程對指定的相鄰區(qū)域內(nèi)的所有點進行插值當數(shù)據(jù)集中含有短程變異時,局部多項式插值表面則能更好地描述這些短程變異。6.4確定性插值法四、徑向基函數(shù)插值法徑向基函數(shù)法徑向基函數(shù)法是人工神經(jīng)網(wǎng)絡方法中的一種。由徑向基函數(shù)生成的表面不僅能夠反映整體變化趨勢而且可以反映局部變化。徑向基函數(shù)包括五種不同的基本函數(shù):平面樣條函數(shù)、張力樣條函數(shù)、規(guī)則樣條函數(shù)、高次曲面函數(shù)和反高次曲面樣條函數(shù)6.4確定性插值法徑向基函數(shù)法就如同將一個橡膠膜插入并經(jīng)過各個已知樣點,同時又使表面的總曲率最小,如下圖。徑向基函數(shù)適用于對大量點數(shù)據(jù)進行插值計算從而獲得平滑表面6.4確定性插值法采樣點圖6.18用徑向基函數(shù)法內(nèi)插的表面規(guī)則樣條插值擬合的曲面光滑、漸變,可能超出采樣點的范圍。權重—在曲率最小化表達式中,定義曲面的3階導權重,控制表面的平滑度。權重越大,曲面越光滑;權重必須大于或等于0,常取值為0,0.001,0.01,0.1,0.5等。張力樣條擬合的曲面不似前者那樣光滑。權重:定義張力的權重。該系數(shù)越大,擬合表面越粗糙。權重必須大于或等于0,常取值為0,1,5,10等。樣條插值類型薄板樣條函數(shù)是以最小曲率面擬合控制點,薄板樣條函數(shù)的估算由下式計算薄板樣條函數(shù)Thin-platesplines薄板樣條函數(shù)函數(shù)的一個主要問題是在數(shù)據(jù)貧乏地區(qū)的坡度較大,經(jīng)常涉及如同過伸的情況。各種用于訂正過伸的方法有:薄板張力樣條,規(guī)則樣條。薄板樣條函數(shù)Thin-platesplines不適用于在短距離內(nèi)屬性有較大變化的地區(qū),否則估計結(jié)果偏大。樣條內(nèi)插的誤差不能直接估算,同時在實踐中要解決的問題是樣條塊的定義以及如何在三維空間中將這些塊拼成復雜曲面而又不至于引入原始曲面中所沒有的異?,F(xiàn)象等問題。樣條插值插值評價探索性空間數(shù)據(jù)分析(ESDA)ESDA是指利用統(tǒng)計學原理和圖形圖表相結(jié)合對空間信息的性質(zhì)進行分析、鑒別,用以引導確定性模型的結(jié)構(gòu)和解法。ESDA與EDA區(qū)別在于它考慮了數(shù)據(jù)的空間特性,在方法上它將數(shù)據(jù)分解為一般趨勢和疊加于其上的局部變化兩部分。然后用一定的數(shù)學函數(shù)去擬合由樣本點產(chǎn)生的經(jīng)驗變率函數(shù),進行諸如克立格內(nèi)插等空間操作。6.5探索性空間數(shù)據(jù)分析一、探索性空間數(shù)據(jù)分析的基本理論1、基本思想探索性數(shù)據(jù)分析的基本思想是:①讓數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國8寸袖珍折疊自行車數(shù)據(jù)監(jiān)測研究報告
- 2019-2025年軍隊文職人員招聘之軍隊文職管理學自我檢測試卷B卷附答案
- 2019-2025年軍隊文職人員招聘之軍隊文職管理學與服務過關檢測試卷A卷附答案
- 康德三診物理試題及答案
- 保安文化測試試題及答案
- 小學生人際交往故事征文
- 企業(yè)虛擬專用網(wǎng)絡服務協(xié)議
- 《統(tǒng)計學的數(shù)據(jù)處理基礎:初三數(shù)學教案》
- 產(chǎn)品銷量排行表-電商銷售統(tǒng)計
- 遼寧省朝陽市建平縣2024-2025學年八年級上學期期末生物學試題(含答案)
- 廣東省深圳市2023-2024學年六年級下學期期末語文試題
- 旋耕機傳動系統(tǒng)設計
- YJ-T 27-2024 應急指揮通信保障能力建設規(guī)范
- 往年專業(yè)知識(水利水電)相關題目及答案
- 乳突根治護理查房
- 駱駝祥子選擇題100道及答案
- 2024年株洲師范高等專科學校高職單招(英語/數(shù)學/語文)筆試歷年參考題庫含答案解析
- 審計學知識點歸納總結(jié)
- 2024釔-90微球選擇性內(nèi)放射治療肝臟惡性腫瘤規(guī)范化操作專家共識
- 2024年中郵保險公司招聘筆試參考題庫含答案解析
- 浙江省杭州市2023年中考英語真題
評論
0/150
提交評論