地理空間數(shù)據(jù)分析和GIS_第1頁
地理空間數(shù)據(jù)分析和GIS_第2頁
地理空間數(shù)據(jù)分析和GIS_第3頁
地理空間數(shù)據(jù)分析和GIS_第4頁
地理空間數(shù)據(jù)分析和GIS_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

地理空間數(shù)據(jù)分析和GIS

各種類型的GIS中存貯了海量的地理空間數(shù)據(jù),且數(shù)據(jù)還在以指數(shù)級方式不斷增長,迫切需要高效、精確、科學(xué)地分析這些數(shù)據(jù),以找出數(shù)據(jù)所蘊(yùn)涵的意義,進(jìn)而了解事物的性質(zhì)與規(guī)律,為科學(xué)決策提供必需的信息。所以,開發(fā)一些工具來進(jìn)行一般性地理空間數(shù)據(jù)分析和復(fù)雜的地理空間對象模擬,以將數(shù)據(jù)“點(diǎn)石成金”是一項(xiàng)艱巨而又緊迫的任務(wù)。因此,GIS領(lǐng)域由原來重點(diǎn)關(guān)注數(shù)據(jù)庫創(chuàng)建和系統(tǒng)開發(fā)建設(shè),逐漸轉(zhuǎn)向重點(diǎn)關(guān)注空間分析和空間建模。GIS的奠基人之一曾指出:“地理信息系統(tǒng)真正的功能在于它利用空間分析技術(shù),對空間數(shù)據(jù)的分析”??臻g分析使GIS超越一般空間數(shù)據(jù)庫、信息系統(tǒng)和地圖制圖系統(tǒng),成為不僅能進(jìn)行海量空間數(shù)據(jù)管理、信息查詢檢索與量測,更可通過圖形操作與數(shù)學(xué)模擬運(yùn)算分析出地理空間數(shù)據(jù)中隱藏的模式、關(guān)系和趨勢,挖掘出對科學(xué)決策具有指導(dǎo)意義的信息,從而解決復(fù)雜的地學(xué)應(yīng)用問題,進(jìn)行地學(xué)綜合研究的技術(shù)系統(tǒng)。

目前多數(shù)地理信息系統(tǒng)的應(yīng)用還局限于數(shù)據(jù)庫型GIS層面上,沒有充分利用和開發(fā)GIS的空間分析功能。因此,建立完善的空間數(shù)據(jù)分析理論和方法體系,集成先進(jìn)的空間數(shù)據(jù)分析工具,增強(qiáng)GIS的空間分析能力,使數(shù)據(jù)庫型GIS上升為分析型GIS,是GIS技術(shù)與應(yīng)用的發(fā)展目標(biāo)和趨勢。1.1地理空間數(shù)據(jù)處理與建模1.2地理空間數(shù)據(jù)挖掘1.3GIS環(huán)境下的空間分析第1章地理空間數(shù)據(jù)分析與GIS1.1地理空間數(shù)據(jù)處理與建模

地理空間數(shù)據(jù)分析是地理學(xué)和地理信息科學(xué)領(lǐng)域的重要研究內(nèi)容,它通過研究地理空間數(shù)據(jù)及其相應(yīng)分析理論、方法和技術(shù),探索、證明地理要素之間的關(guān)系,揭示地理特征和過程的內(nèi)在規(guī)律和機(jī)理,實(shí)現(xiàn)對地理空間信息的認(rèn)知、解釋、預(yù)測和調(diào)控。

1.1.1數(shù)量地理學(xué)

數(shù)量地理學(xué)(QuantitativeGeography)又稱計(jì)量地理學(xué)或地理數(shù)量方法,是應(yīng)用數(shù)學(xué)思想方法和計(jì)算機(jī)技術(shù)進(jìn)行地理學(xué)研究的科學(xué)。它試圖以定量的精確判斷來彌補(bǔ)定性文字描述的不足;以抽象的、反映本質(zhì)的數(shù)學(xué)模型去刻畫具體的、龐雜的各種地理現(xiàn)象;以對過程的模擬和預(yù)測來代替對現(xiàn)狀的分析和說明;以合理的趨勢推導(dǎo)和反饋機(jī)制分析來代替簡單的因果關(guān)系分析。

數(shù)量地理學(xué)提供了理性的復(fù)雜方法以傳遞有關(guān)諸如行為、決策的確定性程度、綜合研究精度等有用的信息,與定性研究方法結(jié)合共同構(gòu)筑了地理學(xué)研究方法的科學(xué)體系。數(shù)量地理學(xué)是對地理學(xué)傳統(tǒng)研究方法的發(fā)展和變革,反映了地理學(xué)向定量化、科學(xué)化發(fā)展的趨勢,使地理學(xué)由一門對地表事物進(jìn)行解釋性描述的學(xué)科,轉(zhuǎn)變?yōu)橐婚T進(jìn)行確定性解釋的科學(xué)。數(shù)量地理學(xué)的產(chǎn)生與發(fā)展

地理學(xué)是一門研究地球表層自然要素與人文要素相互作用關(guān)系及其時(shí)空規(guī)律的科學(xué)。作為一門古老的空間科學(xué),地理學(xué)與數(shù)學(xué)有著不解之緣。在古代,地理學(xué)與數(shù)學(xué)之源泉科學(xué)——幾何學(xué),幾乎都是研究地表的科學(xué),如運(yùn)用幾何學(xué)原理和方法測算河流長度、山體高度、土地面積等。在近代地理學(xué)時(shí)期,經(jīng)濟(jì)學(xué)中的區(qū)位論被移植到地理學(xué)中,開辟了地理學(xué)運(yùn)用分析數(shù)學(xué)之先河。

20世紀(jì)20-30年代,地理學(xué)研究中統(tǒng)計(jì)方法開始萌芽,主要是一般的數(shù)理統(tǒng)計(jì),進(jìn)行地理要素的統(tǒng)計(jì)概括和相關(guān)關(guān)系探討。數(shù)量地理學(xué)的發(fā)展階段

數(shù)量地理學(xué)發(fā)展初期階段數(shù)量地理學(xué)發(fā)展中期階段數(shù)量地理學(xué)日趨成熟階段20世紀(jì)50年代末至60年代末20世紀(jì)60年代末至70年代20世紀(jì)70年代末至今把統(tǒng)計(jì)學(xué)方法引入地理學(xué)研究在地理學(xué)研究中應(yīng)用多元統(tǒng)計(jì)方法和計(jì)算機(jī)技術(shù)

地理學(xué)與運(yùn)籌學(xué)、模糊數(shù)學(xué)、系統(tǒng)科學(xué)、GIS技術(shù)等結(jié)合

現(xiàn)代地理學(xué)中的數(shù)量方法與理論模式的產(chǎn)生與形成,可以追溯到20世紀(jì)50年代末期開始的計(jì)量運(yùn)動(dòng)。計(jì)量運(yùn)動(dòng)主要由美國地理學(xué)家發(fā)起,早期集中在衣阿華、威斯康星、普林斯頓和華盛頓等幾所大學(xué)。不同學(xué)者所持觀點(diǎn)不同,研究方向各異,由此形成了所謂的經(jīng)濟(jì)、統(tǒng)計(jì)、社會等學(xué)派。傳統(tǒng)地理學(xué)與數(shù)量地理學(xué)

數(shù)學(xué)方法是人們進(jìn)行數(shù)字運(yùn)算和求解的工具,能以嚴(yán)密的邏輯和簡潔的形式描述復(fù)雜的問題,表達(dá)極為豐富的實(shí)質(zhì)性思想。對于現(xiàn)代地理學(xué)而言,數(shù)學(xué)方法不僅是應(yīng)用地理學(xué)研究中進(jìn)行預(yù)測、決策、規(guī)劃及優(yōu)化設(shè)計(jì)的工具,也是理論地理學(xué)研究中進(jìn)行邏輯推理和理論演繹的手段。世界上的任何事物都可以用數(shù)值來描述和度量,地理要素如區(qū)域范圍、城市位置、道路長短、氣溫高低、雨量多少、山高水深、人口增減、物產(chǎn)豐欠等都可用數(shù)量來表示。

傳統(tǒng)地理學(xué)分析方法所采用的推理方式以經(jīng)驗(yàn)歸納型綜合為主,以觀察材料和事實(shí)為基礎(chǔ),由直接的類推得出現(xiàn)實(shí)世界的結(jié)論,這一方法難以回避特殊情況或解釋者的主觀好惡問題。而數(shù)量地理學(xué)以理論演繹為主,整個(gè)研究過程經(jīng)歷了提出假設(shè)、建立模式、檢驗(yàn)假設(shè)和建立理論四個(gè)步驟,符合感性-理性-實(shí)踐這一認(rèn)識的過程規(guī)律。與地理學(xué)傳統(tǒng)的思維模式相比,地理數(shù)量方法有著明顯的優(yōu)勢(見下頁)。數(shù)量地理學(xué)與傳統(tǒng)地理學(xué)研究方法比較

傳統(tǒng)地理學(xué)方法數(shù)量地理學(xué)方法實(shí)地考察收集資料根據(jù)已有的概念體系條理化比較歸納、概括地理解釋建立理論與法則觀察實(shí)踐先期模式資料篩選建立理論與法則反復(fù)檢驗(yàn)成功建立模型提出假設(shè)失敗數(shù)量地理學(xué)中地理數(shù)據(jù)分析模擬方法

數(shù)量地理學(xué)本質(zhì)上是一門關(guān)于地理數(shù)據(jù)分析處理與建模的科學(xué),其主要研究內(nèi)容涉及地理要素的描述統(tǒng)計(jì)和數(shù)量分析技術(shù),地理系統(tǒng)的分析方法,數(shù)學(xué)模型的構(gòu)建和應(yīng)用,數(shù)學(xué)模擬(仿真)技術(shù),地理預(yù)測和決策的方法、程序、模型以及地理學(xué)理論表述的數(shù)學(xué)形式等。數(shù)量地理學(xué)的研究方法:地理系統(tǒng)分析123隨機(jī)數(shù)學(xué)方法地理系統(tǒng)數(shù)學(xué)模擬

地理系統(tǒng)分析是指揚(yáng)棄地理事物繁瑣的枝節(jié),抽象出地理事物在結(jié)構(gòu)與功能上的主線,揭示地理事物動(dòng)態(tài)演變的方向與強(qiáng)度,預(yù)測其狀態(tài)變化和穩(wěn)定性程度,將復(fù)雜、高級的地理系統(tǒng)簡化為次一級簡單的系統(tǒng),進(jìn)而探討地理要素之間的數(shù)量關(guān)系。一般是首先列出所研究等級系統(tǒng)的要素清單,根據(jù)地理系統(tǒng)的實(shí)際繪出各要素的聯(lián)系框圖,再以定量方法研究系統(tǒng)要素之間的關(guān)系。

地理系統(tǒng)輸入與輸出之間一般具有隨機(jī)性,數(shù)量地理學(xué)研究方法中隨機(jī)數(shù)學(xué)占很大比重。地理系統(tǒng)是多級、多元系統(tǒng),在進(jìn)行系統(tǒng)分析時(shí),分析一組或幾組地理要素之間的關(guān)系經(jīng)常應(yīng)用多元統(tǒng)計(jì)分析方法,如多元線性回歸、逐步回歸、主成分分析、因子分析等;地理系統(tǒng)是具有空間范圍和地域界線的系統(tǒng),確定界線、進(jìn)行地理區(qū)域的劃分等經(jīng)常應(yīng)用二級判別分析、多級判別、逐步判別等數(shù)學(xué)分類技術(shù);在探討地理系統(tǒng)結(jié)構(gòu)、類型組合、空間關(guān)系時(shí),常運(yùn)用系統(tǒng)聚類分析方法;分析地理系統(tǒng)的空間特性時(shí),常用趨勢面分析方法;地理系統(tǒng)研究中十分重視系統(tǒng)目標(biāo)、系統(tǒng)結(jié)構(gòu)的研究,以使地理系統(tǒng)達(dá)到符合一定目標(biāo)的最佳狀態(tài)。此外,模擬地理系統(tǒng)狀態(tài)的轉(zhuǎn)移規(guī)律時(shí)還包括馬爾柯夫鏈、多元線性方程組、微分方程的應(yīng)用等。

建立地理系統(tǒng)數(shù)學(xué)模型的過程稱為地理系統(tǒng)的數(shù)學(xué)模擬(簡稱地理模型)。地理系統(tǒng)數(shù)學(xué)模擬的一般過程是:從實(shí)際的地理系統(tǒng)或其要素出發(fā),對空間狀態(tài)、空間成分、空間相互作用進(jìn)行分析,建立地理系統(tǒng)或要素的數(shù)學(xué)模型。經(jīng)驗(yàn)檢查,若與實(shí)際情況不符,則要重新分析,修改模型;若大致相符,則選擇計(jì)算方法,進(jìn)行程序設(shè)計(jì)、程序調(diào)試和上機(jī)運(yùn)算,從而輸出模型解。分析模型解,若模型解出錯(cuò),則修改模型;若模型解正確,則對成果進(jìn)行地理解釋,提出切實(shí)可行的方案。可見,地理系統(tǒng)數(shù)學(xué)模擬過程是反復(fù)修改數(shù)學(xué)模型、調(diào)試和修改程序的過程。1.1.2地理信息系統(tǒng)

英國著名地理學(xué)家R.J.Johnston在1995年曾指出“計(jì)量革命的直接成果是導(dǎo)致了GIS革命的到來”。

GIS起源于20世紀(jì)60年代,是對地理空間數(shù)據(jù)進(jìn)行采集、存儲、表達(dá)、更新、檢索、管理、綜合分析與輸出的計(jì)算機(jī)應(yīng)用技術(shù)系統(tǒng)。

GIS是以應(yīng)用為導(dǎo)向的空間信息技術(shù),強(qiáng)調(diào)空間實(shí)體及其關(guān)系,注重空間分析與模擬,是重要的地理空間數(shù)據(jù)管理和分析工具。GIS是客觀現(xiàn)實(shí)世界抽象化的數(shù)字模型GIS是地理空間數(shù)據(jù)管理、顯示與制圖的集成工具GIS是地理空間數(shù)據(jù)分析模擬與可視化的技術(shù)平臺

客觀現(xiàn)實(shí)世界極其復(fù)雜,運(yùn)用各種數(shù)據(jù)采集手段和量測工具,如野外調(diào)查、遙感技術(shù)等,獲取有關(guān)客觀世界的數(shù)據(jù),把各種來源和類型的地理空間數(shù)據(jù)數(shù)字化,輸入計(jì)算機(jī),按一定的規(guī)則組織管理,構(gòu)建客觀現(xiàn)實(shí)世界的抽象化數(shù)字模型,即GIS。空間數(shù)據(jù)管理GIS空間數(shù)據(jù)獲取空間數(shù)據(jù)輸入基于數(shù)學(xué)法則客觀世界數(shù)據(jù)數(shù)據(jù)庫客觀世界的抽象化過程1.1.3地理計(jì)算

隨著計(jì)算機(jī)技術(shù)、數(shù)學(xué)方法的不斷進(jìn)步,空間數(shù)據(jù)分析處理方法論也隨之革新,20世紀(jì)90年代,一門融合了計(jì)算機(jī)科學(xué)、地理學(xué)、地球信息科學(xué)(Geomatics)、信息科學(xué)、數(shù)學(xué)和統(tǒng)計(jì)學(xué)理論與方法的地理計(jì)算學(xué)(GeoComputation)開始形成并逐漸發(fā)展起來,數(shù)量地理學(xué)進(jìn)入全新的計(jì)算地理學(xué)(GeocomputationalGeography)時(shí)代,地理空間數(shù)據(jù)分析與建模有了一個(gè)新的技術(shù)平臺。地理計(jì)算的概念與內(nèi)涵

20世紀(jì)90年代中期,英國著名地理學(xué)家,里茲大學(xué)計(jì)算地理研究中心(TheCenterofComputationalGeography)StanOpenshaw教授認(rèn)為空間數(shù)據(jù)挖掘已成為數(shù)量地理學(xué)中一個(gè)重要分支,并以GeoComputation命名這個(gè)新的學(xué)科,StanOpenshaw因此被稱為“地理計(jì)算之父”。此后,許多學(xué)者紛紛從不同角度對地理計(jì)算的定義與內(nèi)容框架進(jìn)行設(shè)計(jì),并論證其作為一個(gè)學(xué)科的必要性和合理性。地理計(jì)算的各種定義Openshaw在2000年進(jìn)一步深化對于地理計(jì)算的理解,認(rèn)為地理計(jì)算是一種高性能計(jì)算,用以解決目前不能解決的、甚至未知的空間問題的科學(xué)。英國里茲大學(xué)著名地理學(xué)家Rees等提議將地理計(jì)算定義為:應(yīng)用計(jì)算技術(shù)求解地理問題的理論、方法和過程。Gahegan在1999年發(fā)表的論文中細(xì)致地談到“…地理計(jì)算關(guān)注利用一系列方法的工具箱豐富地理模擬和分析大量高度復(fù)雜的、非確定性的問題…這是人類有意識的努力去探索地理學(xué)與計(jì)算機(jī)科學(xué)之間的關(guān)聯(lián)。這是一個(gè)真正的對于數(shù)量地理學(xué)家的技術(shù),也是計(jì)算機(jī)科學(xué)家進(jìn)行計(jì)算性應(yīng)用的豐富源泉?!?/p>

Conclelis(1998)采用相對簡潔的定義:地理計(jì)算是應(yīng)用數(shù)學(xué)計(jì)算方法與技術(shù)來描述空間特征、解釋地理現(xiàn)象、解決地理問題。Openshaw和Abrahart(2000)認(rèn)為:地理計(jì)算是一門新興的交叉學(xué)科,它是在科學(xué)方法的整體范圍內(nèi)利用各種不同類型的地理數(shù)據(jù)發(fā)展相關(guān)的地理工具和模型。2003年8月,我國亞運(yùn)村地理學(xué)術(shù)沙龍談到“虛擬地理實(shí)驗(yàn)室”建設(shè),認(rèn)為地理計(jì)算既不是數(shù)量地理學(xué),也不是GIS,而是智能計(jì)算在地理學(xué)中的精確應(yīng)用,是強(qiáng)大的高性能計(jì)算,其理論驅(qū)動(dòng)是科學(xué)。

地理計(jì)算試圖回歸計(jì)量革命時(shí)代的地理分析和建模,吸收了新的計(jì)算機(jī)科學(xué)成果,如高性能計(jì)算,模式識別、分類、預(yù)測與模型技術(shù),知識挖掘,可視化等一系列計(jì)算方法和工具,建立地理模型并分析復(fù)雜的、具有不確定性的地理問題,從而豐富了地理學(xué)的研究。GeoComputation不僅僅是計(jì)算機(jī)在地理信息領(lǐng)域中的應(yīng)用,關(guān)鍵是可以輔助進(jìn)行地理研究,從而獲得基于數(shù)據(jù)驅(qū)動(dòng)的地理信息管理和地理信息分析。

綜上所述,地理計(jì)算這一學(xué)科的統(tǒng)一視角就是“計(jì)算”,它被認(rèn)為是一系列有效的程序或算法(如神經(jīng)網(wǎng)絡(luò)、模糊邏輯、遺傳算法等),當(dāng)應(yīng)用到地理問題時(shí)必然產(chǎn)生結(jié)果,不同算法之間由于基本假設(shè)的不同而產(chǎn)生結(jié)果的差異。地理計(jì)算本質(zhì)上可認(rèn)為是對地理學(xué)時(shí)間與空間問題所進(jìn)行的基于計(jì)算機(jī)的定量化分析。地理計(jì)算模型與方法

地理計(jì)算的目標(biāo)是將地理學(xué)領(lǐng)域的知識引入計(jì)算機(jī)工具,設(shè)計(jì)合適的地理數(shù)據(jù)挖掘和知識發(fā)現(xiàn)操作,研發(fā)時(shí)空尺度上的集群算法,獲得超越目前軟件、硬件能力的地理數(shù)據(jù)分析方法,用可視化和虛擬現(xiàn)實(shí)的手段實(shí)現(xiàn)地理問題的理解與交流。地理計(jì)算學(xué)是數(shù)量地理學(xué)向深層次的拓展,強(qiáng)調(diào)數(shù)學(xué)模型與模擬實(shí)驗(yàn)并重的理念,憑借計(jì)算機(jī)工具對地理學(xué)問題進(jìn)行定量或非定量分析的抽象概括和綜合研究,解決海量、復(fù)雜數(shù)據(jù)集或數(shù)據(jù)庫分析的復(fù)雜空間問題。GeoComputation包含豐富的模型和方法體系,不僅采納了傳統(tǒng)的數(shù)量地理學(xué)理論與模型,還涉及一系列新的理論技術(shù)方法:GIS為之創(chuàng)建數(shù)據(jù)庫;人工智能技術(shù)(ArtificialIntelligence,AI)和智能計(jì)算技術(shù)(ComputationalIntelligence,CI)為之提供計(jì)算原理和計(jì)算工具;高性能計(jì)算服務(wù)系統(tǒng)為之提供動(dòng)力。

智能計(jì)算技術(shù)中的神經(jīng)網(wǎng)絡(luò)模型(NeuralNetwork,NN)、模糊邏輯模型(FuzzyLogic)、遺傳算法模型(GeneticAlgorithm,GA)、元胞自動(dòng)機(jī)模型(CellularAutomata,CA)以及分形分析(FractalAnalysis)等不斷被引入并成為地理計(jì)算的核心。

高性能計(jì)算(High-PerformanceComputing)是利用超級計(jì)算機(jī)對大容量資料、需要進(jìn)行實(shí)時(shí)分析與控制的系統(tǒng)以及那些復(fù)雜而又不能用其他手段來處理的現(xiàn)實(shí)世界所實(shí)施的計(jì)算。1.1地理空間數(shù)據(jù)處理與建模1.2地理空間數(shù)據(jù)挖掘1.3GIS環(huán)境下的空間分析第1章地理空間數(shù)據(jù)分析與GIS1.2地理空間數(shù)據(jù)挖掘

人類在空間科學(xué)技術(shù)、遙感、地理信息系統(tǒng)、全球定位系統(tǒng)等領(lǐng)域取得了巨大成就,對地球系統(tǒng)的不同層面、不同現(xiàn)象的綜合觀測能力達(dá)到了空前的水平,獲得了大量對地觀測數(shù)據(jù)。同時(shí),隨著數(shù)據(jù)庫技術(shù)的成熟和信息應(yīng)用的普及,人類累積的數(shù)據(jù)量正在呈指數(shù)級增長,全世界每天存入數(shù)據(jù)數(shù)量超過萬兆字符。

未來學(xué)家JohnNaisbitt驚呼:“人類正被數(shù)據(jù)淹沒,卻饑渴于信息”。面臨浩如煙海的數(shù)據(jù),人們呼喚從數(shù)據(jù)的汪洋大海中去蕪存精、去偽存真,因此,“從數(shù)據(jù)庫中發(fā)現(xiàn)知識”(KDD)及其核心技術(shù)——數(shù)據(jù)挖掘(DataMining)應(yīng)運(yùn)而生。1.2.1地理空間數(shù)據(jù)挖掘概述

數(shù)據(jù)挖掘是一個(gè)由數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計(jì)和可視化等多學(xué)科與技術(shù)交叉、滲透、融合形成的交叉學(xué)科(邸凱昌,2000)。

地理空間數(shù)據(jù)挖掘(GeospatialDataMining)是數(shù)據(jù)挖掘的一個(gè)研究分支,其實(shí)質(zhì)是從地理空間數(shù)據(jù)庫中挖掘時(shí)空系統(tǒng)中潛在的、有價(jià)值的信息、規(guī)律和知識的過程,包括空間模式與特征、空間與非空間數(shù)據(jù)之間的概要關(guān)系等。由于空間數(shù)據(jù)具有海量、多維和自相關(guān)性等特征,使得地理空間數(shù)據(jù)挖掘更為復(fù)雜。

加拿大SimonFraser大學(xué)計(jì)算機(jī)科學(xué)系HanJiawei教授領(lǐng)導(dǎo)的小組進(jìn)行了基于關(guān)系數(shù)據(jù)庫挖掘系統(tǒng)的研究,在MapInfo平臺上開發(fā)了空間數(shù)據(jù)挖掘原型系統(tǒng)GeoMiner,并設(shè)計(jì)了專門用于空間數(shù)據(jù)挖掘的語言GMQL,實(shí)現(xiàn)了空間數(shù)據(jù)特征描述、空間比較、空間關(guān)聯(lián)、空間聚類和空間分類等空間數(shù)據(jù)分析方法的集成。GeoMiner系統(tǒng)結(jié)構(gòu)圖形用戶接口各種數(shù)據(jù)挖掘模塊空間數(shù)據(jù)庫空間數(shù)據(jù)庫服務(wù)器和數(shù)據(jù)立方體空間數(shù)據(jù)庫

空間數(shù)據(jù)庫

數(shù)據(jù)挖掘與知識發(fā)現(xiàn)的進(jìn)化歷程進(jìn)化階段技術(shù)手段數(shù)據(jù)搜集(20世紀(jì)60年代)數(shù)據(jù)訪問(20世紀(jì)80年代)數(shù)據(jù)倉庫(20世紀(jì)90年代)數(shù)據(jù)挖掘(目前)

計(jì)算機(jī)、磁帶和磁盤關(guān)系數(shù)據(jù)庫、結(jié)構(gòu)化查詢語言、ODBC

聯(lián)機(jī)分析處理、多維數(shù)據(jù)庫、數(shù)據(jù)倉庫

高級算法、多處理器計(jì)算機(jī)、海量數(shù)據(jù)庫空間聚類規(guī)則發(fā)現(xiàn)空間關(guān)聯(lián)規(guī)則發(fā)現(xiàn)空間序列模式發(fā)現(xiàn)空間預(yù)測模型發(fā)現(xiàn)空間異常值發(fā)現(xiàn)空間趨勢模型發(fā)現(xiàn)空間數(shù)據(jù)立方體地理空間數(shù)據(jù)挖掘體系結(jié)構(gòu)圖形用戶界面空間依賴關(guān)系發(fā)現(xiàn)未來空間發(fā)現(xiàn)模塊挖掘模塊集合空間數(shù)據(jù)庫服務(wù)器空間數(shù)據(jù)庫非空間數(shù)據(jù)庫相關(guān)概念

按照不同的挖掘任務(wù),地理空間數(shù)據(jù)挖掘可以分為預(yù)測模型發(fā)現(xiàn)、聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、序列模式發(fā)現(xiàn)、依賴關(guān)系發(fā)現(xiàn)、異常值分析和趨勢發(fā)現(xiàn)等。

地理空間數(shù)據(jù)挖掘系統(tǒng)包括三大支柱模塊:地理空間數(shù)據(jù)立方體、聯(lián)機(jī)分析處理(OLAP)模塊和空間數(shù)據(jù)挖掘模塊。1.2.2地理空間數(shù)據(jù)立方體

地理空間數(shù)據(jù)立方體(GeospatialDataCube)是一個(gè)面向?qū)ο蟮?、集成的、以時(shí)間為變量的、持續(xù)采集空間與非空間數(shù)據(jù)的多維數(shù)據(jù)集合,組織和匯總成一個(gè)由一組維度和度量值定義的多維結(jié)構(gòu),用以支持地理空間數(shù)據(jù)挖掘技術(shù)和決策支持過程。地理空間數(shù)據(jù)立方體涉及的概念

維度是數(shù)據(jù)立方體的一種結(jié)構(gòu)特性,是描述事實(shí)數(shù)據(jù)表中數(shù)據(jù)級別的有組織的層次結(jié)構(gòu)。包括:非空間維度、空間-非空間維度、空間-空間維度。度量值是在數(shù)據(jù)立方體內(nèi)基于該數(shù)據(jù)立方體的事實(shí)數(shù)據(jù)表中某列的一組值,它們通常是數(shù)字。包括:數(shù)值度量、空間度量。成員屬性是維度表的一個(gè)可選特性,為最終用戶提供成員的其他信息,僅從屬于級別。1.2.3聯(lián)機(jī)分析處理技術(shù)OLAP是共享多維信息的、針對特定問題的聯(lián)機(jī)數(shù)據(jù)訪問和分析的軟件技術(shù),具有匯總、合并、聚集以及從不同角度觀察消息的能力。它可以跨越空間數(shù)據(jù)庫模式的多個(gè)版本,處理來自不同組織的信息和由多個(gè)數(shù)據(jù)存儲集成的信息。聯(lián)機(jī)分析處理對空間數(shù)據(jù)立方體進(jìn)行的多維數(shù)據(jù)分析主要有切塊、切片、旋轉(zhuǎn)、鉆取等分析動(dòng)作,目的是進(jìn)行跨維、跨層次的計(jì)算與建模。地理空間數(shù)據(jù)立方體與OLAP的關(guān)系

業(yè)務(wù)處理系統(tǒng)數(shù)據(jù)提取數(shù)據(jù)準(zhǔn)備區(qū)OLAP服務(wù)器多維化處理客戶端可視化處理地理空間數(shù)據(jù)立方體數(shù)據(jù)加載1.2.4地理空間數(shù)據(jù)挖掘典型方法4地理空間統(tǒng)計(jì)方法1235地理空間聚類方法地理空間關(guān)聯(lián)分析地理空間分類與預(yù)測分析異常值分析1地理空間統(tǒng)計(jì)方法

地理空間統(tǒng)計(jì)是指分析地理空間數(shù)據(jù)的統(tǒng)計(jì)方法,主要是基于空間中鄰近的要素通常比相離較遠(yuǎn)的要素具有較高的相似性這一原理。地理空間統(tǒng)計(jì)分析與傳統(tǒng)分析主要有兩大差異:(1)空間數(shù)據(jù)間并非獨(dú)立,而是在D維空間中具有某種空間相關(guān)性,且在不同的空間分辨率下呈現(xiàn)不同的相關(guān)程度;(2)大多數(shù)空間問題僅有一組(不規(guī)則分布空間中)觀測值,而無重復(fù)觀測的資料。目前地理空間統(tǒng)計(jì)模型大致可分為三類:地統(tǒng)計(jì):是以區(qū)域化變量理論為基礎(chǔ),以變差函數(shù)為主要工具,研究空間分布上既具有隨機(jī)性又具有結(jié)構(gòu)性的自然現(xiàn)象的科學(xué)。格網(wǎng)空間模型:用以描述分布于有限(或無窮離散)空間點(diǎn)(或區(qū)域)上數(shù)據(jù)的空間關(guān)系??臻g點(diǎn)分布形態(tài):在自然科學(xué)研究中,許多資料是由點(diǎn)(或小區(qū)域)所構(gòu)成的集合,比如,地震發(fā)生地點(diǎn)分布、樹木在森林中的分布、某種鳥類鳥巢的分布、生物組織中細(xì)胞核的分布,太空中星球的分布等,稱之為空間點(diǎn)分布形態(tài),其中點(diǎn)的位置為事件。

空間數(shù)據(jù)統(tǒng)計(jì)分析是分析空間數(shù)據(jù)廣泛使用的一種方法,能夠很好地處理數(shù)字?jǐn)?shù)據(jù),提出空間現(xiàn)象的現(xiàn)實(shí)模型。然而,需要指出的是統(tǒng)計(jì)分析方法往往假設(shè)在空間中分布的數(shù)據(jù)具有統(tǒng)計(jì)獨(dú)立性,而在現(xiàn)實(shí)中,空間物體相關(guān)性很大。此外,絕大多數(shù)統(tǒng)計(jì)模型需要在有豐富領(lǐng)域知識和統(tǒng)計(jì)專門技術(shù)的專家的協(xié)助下才能實(shí)現(xiàn)。而且,統(tǒng)計(jì)模型不能很好地處理字符值、不完整或非確定性數(shù)據(jù)。地理空間聚類方法

地理空間數(shù)據(jù)聚類是按照某種距離度量準(zhǔn)則,在大型、多維數(shù)據(jù)集中標(biāo)識出聚類或稠密分布的區(qū)域,從而發(fā)現(xiàn)數(shù)據(jù)集的整體空間分布模式。該方法把空間數(shù)據(jù)庫中的對象分為有意義的子類,使同一子類內(nèi)部的成員有盡可能多的相同屬性,而不同的子類之間差異較大。

目前,地理空間聚類方法主要有四類:分割法、層次法、基于密度的方法及基于網(wǎng)格的方法。而經(jīng)典聚類法包括K-mean、K-meriod、ISODATA等。近年來,圍繞DMKD領(lǐng)域發(fā)展了CLARANS(NgR.etal.,1994)、DBSCAN(EsterM.etal.,1996)、Murray(MurrayA.J.etal.,1998)等算法。Kohonen自組織特征映射網(wǎng)絡(luò)、競爭學(xué)習(xí)網(wǎng)絡(luò)等自組織神經(jīng)網(wǎng)絡(luò)方法,在空間聚類應(yīng)用中亦有較好的效果。完全的空間任意分布地理空間聚類聚集型分布分散型分布11222233333341:極密2:密3:一般密4:稀疏經(jīng)典聚類完全的空間任意分布模式空間聚類分散分布模式地理空間關(guān)聯(lián)分析

地理空間關(guān)聯(lián)分析利用空間關(guān)聯(lián)規(guī)則提取算法發(fā)現(xiàn)空間數(shù)據(jù)庫中空間目標(biāo)間的關(guān)聯(lián)程度,是空間數(shù)據(jù)庫知識發(fā)現(xiàn)研究中的一個(gè)重要研究課題。

GIS數(shù)據(jù)庫是典型的空間數(shù)據(jù)庫,從GIS數(shù)據(jù)庫中挖掘空間關(guān)聯(lián)規(guī)則是理解GIS模型和將GIS數(shù)據(jù)轉(zhuǎn)化成知識的一種有效方法。

地理空間關(guān)聯(lián)分析的核心內(nèi)容是挖掘空間關(guān)聯(lián)規(guī)則??臻g關(guān)聯(lián)規(guī)則是指空間目標(biāo)間相鄰(如村落與道路相鄰)、相連(如火車站與鐵路相連)、共生(如蒙古包與草場的關(guān)系)、包含(如區(qū)域中包含的城市)等空間相關(guān)關(guān)系。空間關(guān)聯(lián)規(guī)則指明了空間謂詞與非空間謂詞間存在的關(guān)聯(lián)性??臻g關(guān)聯(lián)規(guī)則提取算法并不唯一,較常用的是利用MBR技術(shù)、R+樹及其他快速方法進(jìn)行空間分析,并采用概念層次樹對拓?fù)潢P(guān)系進(jìn)行概化形成拓?fù)潢P(guān)系數(shù)據(jù)表,從而提取關(guān)聯(lián)規(guī)則。地理空間分類與預(yù)測分析

地理空間分類與預(yù)測是根據(jù)已知的分類模型把數(shù)據(jù)庫中的數(shù)據(jù)映射到給定類別中,進(jìn)行數(shù)據(jù)趨勢預(yù)測分析的方法。

分類是將數(shù)據(jù)庫中的對象根據(jù)一定的意義劃分為若干個(gè)子集。

預(yù)測是利用歷史數(shù)據(jù)記錄自動(dòng)推導(dǎo)出對給定數(shù)據(jù)的推廣描述,實(shí)現(xiàn)對未來數(shù)據(jù)的趨勢分析。

分類和聚類算法的差別在于:聚類算法是根據(jù)一定要求將對象聚為一個(gè)集合,最后得到的分布模式是聚類之前未確知的;分類算法則是根據(jù)已知分布模式的屬性要求,將數(shù)據(jù)庫對象歸入相應(yīng)的分類中。在機(jī)器學(xué)習(xí)中,數(shù)據(jù)分類一般稱為監(jiān)督學(xué)習(xí),而數(shù)據(jù)聚類則稱為非監(jiān)督學(xué)習(xí)。地理空間數(shù)據(jù)分類包括兩個(gè)步驟:通過分析數(shù)據(jù)庫中各數(shù)據(jù)行的內(nèi)容建立一個(gè)分類模型(分類器),描述已知數(shù)據(jù)集類別或概念。利用所獲得的分類模型(分類器)進(jìn)行分類操作。

分類和回歸都可用于預(yù)測,空間回歸規(guī)則與空間分類規(guī)則相似,也是一種分類器,其差別在于空間分類規(guī)則的預(yù)測值是離散的,空間回歸規(guī)則的預(yù)測值是連續(xù)的。二者常表現(xiàn)為一棵決策樹,根據(jù)數(shù)據(jù)值從樹根開始搜索,沿著滿足條件的分支往上走,走到樹葉就能確定類別。空間分類或回歸的規(guī)則是普及知識,實(shí)質(zhì)是對給定數(shù)據(jù)對象集的抽象和概括,可用宏元組表示。異常值分析

若一個(gè)數(shù)據(jù)庫包含的數(shù)據(jù)目標(biāo)與通常的行為或數(shù)據(jù)模型不一致,則這些數(shù)據(jù)目標(biāo)被稱為異常值。絕大多數(shù)數(shù)據(jù)挖掘方法把異常值作為噪音或例外數(shù)據(jù),然而,在很多情況下這將會導(dǎo)致重要隱含信息的丟失。

基于計(jì)算機(jī)的異常值分析方法主要有三種:基于統(tǒng)計(jì)的異常值分析;基于距離的異常值探測;基于偏差的異常值探測。1.1地理空間數(shù)據(jù)處理與建模1.2地理空間數(shù)據(jù)挖掘1.3GIS環(huán)境下的空間分析第1章地理空間數(shù)據(jù)分析與GIS1.3.1空間分析概念

空間分析(SpatialAnalysis,SA)是地理學(xué)的精髓,是為解答地理空間問題而進(jìn)行的數(shù)據(jù)分析與挖掘。比較典型的空間分析定義有如下幾種:空間分析是對數(shù)據(jù)的空間信息、屬性信息或二者共同信息的統(tǒng)計(jì)描述或說明(Goodchild,1987)。空間分析是對于地理空間現(xiàn)象的定量研究,其常規(guī)能力是操縱空間數(shù)據(jù)成為不同的形式,并且提取其潛在信息(Openshaw,1997;Bailyetal.,1995)。空間分析是基于地理對象空間布局的地理數(shù)據(jù)分析技術(shù)(RobertHaining,1990)。空間查詢和空間分析是從GIS目標(biāo)之間的空間關(guān)系中獲取派生的信息和新的知識(李德仁,1993)。空間分析是指為制定規(guī)劃和決策,應(yīng)用邏輯或數(shù)學(xué)模型分析空間數(shù)據(jù)或空間觀測值(Landis.J,1995)?!臻g分析是集空間數(shù)據(jù)分析和空間模擬于一體的技術(shù)方法,通過地理計(jì)算和空間表達(dá)挖掘潛在空間信息,以解決實(shí)際問題。

空間分析的本質(zhì)特征包括:探測空間數(shù)據(jù)中的模式;研究空間數(shù)據(jù)間的關(guān)系并建立相應(yīng)的空間數(shù)據(jù)模型;提高適合于所有觀察模式處理過程的理解;改進(jìn)發(fā)生地理空間事件的預(yù)測能力和控制能力。

空間分析的研究對象:空間分析主要通過對空間數(shù)據(jù)和空間模型的聯(lián)合分析來挖掘空間目標(biāo)的潛在信息。

空間分析研究的主要目標(biāo)有:認(rèn)知。有效獲取空間數(shù)據(jù),并對其進(jìn)行科學(xué)的組織描述,利用數(shù)據(jù)再現(xiàn)事物本身,例如繪制風(fēng)險(xiǎn)圖。解釋。理解和解釋地理空間數(shù)據(jù)的背景過程,認(rèn)識事件的本質(zhì)規(guī)律,例如住房價(jià)格中的地理鄰居效應(yīng)。預(yù)報(bào)。在了解、掌握事件發(fā)生現(xiàn)狀與規(guī)律的前提下,運(yùn)用有關(guān)預(yù)測模型對未來的狀況做出預(yù)測,例如傳染病的爆發(fā)。調(diào)控。對地理空間發(fā)生的事件進(jìn)行調(diào)控,例如合理分配資源。1.3.2空間分析的萌芽與發(fā)展

空間分析在地理學(xué)研究中有著悠久的傳統(tǒng)與歷史。從某種意義上講,空間分析孕育了地理學(xué)。在古代,人類出于生存和發(fā)展的需要,要學(xué)會分析周圍地理事物的空間關(guān)系,因而始終在進(jìn)行著各種類型的空間分析。隨著地圖理論與應(yīng)用的廣泛深入,物理、數(shù)學(xué)概念與方法的不斷引入以及地學(xué)各分支的發(fā)展,傳統(tǒng)的空間分析能力大大加強(qiáng),人們對地圖表達(dá)空間信息的理解與解譯能力顯著提高。

現(xiàn)代“空間分析”概念的提出源于20世紀(jì)60年代地理與區(qū)域科學(xué)的計(jì)量革命。初始階段主要是應(yīng)用統(tǒng)計(jì)分析方法,定量描述點(diǎn)、線、面的空間分布模式;后期逐漸強(qiáng)調(diào)地理空間本身的特征、空間決策過程和復(fù)雜空間系統(tǒng)的時(shí)空演化過程。

地理信息系統(tǒng)把人們從過去繁重的手工操作中解脫出來,集成了多學(xué)科的最新技術(shù)和所能利用的空間分析方法,包括關(guān)系數(shù)據(jù)庫管理、高效圖形算法、插值、區(qū)劃和網(wǎng)絡(luò)分析等,為解決地理空間問題提供了便捷途徑,空間分析能力發(fā)生了質(zhì)的飛躍。隨著GIS技術(shù)的不斷進(jìn)步,空間分析成為地理信息系統(tǒng)的核心,是地理信息系統(tǒng)區(qū)別于一般空間數(shù)據(jù)庫和普通制圖系統(tǒng)的標(biāo)志?!皬哪撤N意義上講,空間分析與GIS間的關(guān)系類似于統(tǒng)計(jì)學(xué)與統(tǒng)計(jì)軟件包間的關(guān)系”(Goodchild,1988)。國內(nèi)外GIS軟件空間分析比較1.3.3GIS與空間分析

空間分析一般采用專業(yè)分析模型與GIS集成方式。GIS軟件與空間分析軟件相結(jié)合的方式可分為兩種:緊耦合,即把空間分析模塊作為一個(gè)高級應(yīng)用模塊嵌入GIS軟件包中,GIS不僅可以為空間分析提供圖形顯示功能,而且GIS中的有關(guān)數(shù)據(jù)直接參與空間分析計(jì)算。這種方式可以為用戶提供方便、全面、有效的使用功能,但造價(jià)高,實(shí)現(xiàn)周期長。松耦合,即在兩個(gè)相對獨(dú)立的GIS軟件和空間分析軟件之間增加數(shù)據(jù)交換接口,使空間分析數(shù)據(jù)及相關(guān)的影響因素和空間分析結(jié)果能夠在GIS中以各種簡單的或復(fù)雜的圖形方式顯示出來,這種方式適用于短期且費(fèi)用較小的情況。GIS與空間分析的松耦合GIS與空間分析的緊耦合數(shù)據(jù)交換接口專業(yè)模型

統(tǒng)計(jì)分析

網(wǎng)絡(luò)分析

其他空間分析模塊

用戶界面GIS管理系統(tǒng)用戶GIS管理系統(tǒng)空間分析模型空間數(shù)據(jù)庫數(shù)據(jù)文件空間數(shù)據(jù)庫1.3.4GIS環(huán)境下空間分析框架

從GIS應(yīng)用角度看,空間分析大致可以歸納為如下兩大類:一類是基于點(diǎn)、線、面基本地理要素的空間分析,通過空間信息查詢與量測、緩沖區(qū)分析、疊置分析、網(wǎng)絡(luò)分析、地統(tǒng)計(jì)分析等空間分析方法挖掘出新的信息;另一類是地理問

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論