已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
GIS數(shù)據(jù)庫更新信息傳播軟件工具設(shè)計與實現(xiàn)王育紅(河南理工大學(xué)測繪與國土信息工程學(xué)院,焦作市世紀大道2001號,454003)摘 要:針對現(xiàn)有GIS軟件工具缺乏相應(yīng)的功能模塊,不支持批處理,需要大量的人機交互,不能滿足GIS數(shù)據(jù)庫更新信息自動高效傳播要求的缺陷,采用ArcEngine組件技術(shù)設(shè)計實現(xiàn)了一個專門的更新傳播工具。該工具通過自動地執(zhí)行更新傳播過程中的模式匹配、變化提取、更新集成等操作,能夠有效地提高更新傳播的效率,彌補現(xiàn)有軟件的不足。關(guān)鍵詞:更新傳播、模式匹配、變化提取、更新集成當前GIS的核心已從數(shù)據(jù)生產(chǎn)轉(zhuǎn)為數(shù)據(jù)更新,數(shù)據(jù)更新關(guān)系著GIS的可持續(xù)發(fā)展1。隨著世界各國測繪部門和相關(guān)機構(gòu)對基礎(chǔ)地理數(shù)據(jù)庫更新工作的持續(xù)開展2,更新信息傳播問題,即如何利用新版基礎(chǔ)地理數(shù)據(jù)庫中的更新數(shù)據(jù)快速高效地更新用戶數(shù)據(jù)庫的問題,已成為生產(chǎn)部門、應(yīng)用機構(gòu)以及學(xué)術(shù)界共同關(guān)注的熱點問題之一3-4。由于應(yīng)用需求、建庫目的、專業(yè)背景等方面的不同,應(yīng)用部門經(jīng)常要對首次獲得的基礎(chǔ)地理數(shù)據(jù)庫副本,進行一定的重構(gòu)、轉(zhuǎn)換、集成、擴展等處理之后方可建立用戶數(shù)據(jù)庫。這些處理使得基礎(chǔ)地理數(shù)據(jù)庫和用戶數(shù)據(jù)庫,即使是對相同的實現(xiàn)地物地形的描述和表達,也往往在數(shù)據(jù)模型、數(shù)據(jù)模式、數(shù)據(jù)實例等方面存在一系列的差異或沖突5。上述差異的存在導(dǎo)致更新傳播的具體實施變得相當復(fù)雜,不能簡單地通過“新圖層直接替換舊圖層”或“新數(shù)據(jù)直接替換舊數(shù)據(jù)”的方式加以實現(xiàn),因為,這樣將破壞用戶數(shù)據(jù)庫的自治性、完整性、正確性和一致性等特性,最終導(dǎo)致在其之上建立的應(yīng)用系統(tǒng)不能正常運行。一般來說,實現(xiàn)更新信息傳播需要模式匹配、變化提取、實體識別和更新集成等四個操作環(huán)節(jié)的支持6。然而,由于現(xiàn)有GIS軟件缺乏針對性的自動批處理模塊,更新傳播的具體實施只能靠操作員手動完成,效率低,易出錯,很難滿足GIS數(shù)據(jù)庫更新自動高效的要求。1系統(tǒng)框架和功能設(shè)計針對現(xiàn)有GIS軟件的局限性,目前主要有獨立開發(fā)、宿主型二次開發(fā)和基于GIS組件的二次開發(fā)等三種可選方式,來設(shè)計和實現(xiàn)針對更新傳播的專用軟件工具系統(tǒng)。相對來講,基于GIS組件的開發(fā)方式既可以充分利用GIS工具軟件對空間數(shù)據(jù)庫的管理、分析功能,又可以利用其它可視化開發(fā)語言具高效、方便等編程優(yōu)點,不僅能大大提高應(yīng)用系統(tǒng)的開發(fā)效率,而且開發(fā)出來的應(yīng)用程序具有更好的外觀效果,更強大的數(shù)據(jù)庫功能,而且可靠性好、易于移植、便于維護?;谶@些分析,本文以目前非常流行的ArcEgine組件為基礎(chǔ),來開發(fā)和設(shè)計更新傳播軟件工具。1.1系統(tǒng)框架如圖1所示,更新傳播軟件工具采用GIS組件ArcEngine與面向?qū)ο缶幊陶Z言Visual Basic 2005二次集成開發(fā)方式構(gòu)建而成。其中,ArcEngine組件提供諸如空間數(shù)據(jù)管理、圖形操作、數(shù)據(jù)查詢等通用的GIS基本功能;而更新更新傳播專有的功能模塊,如模式匹配、變化檢測、更新集成采用Visual Basic語言開發(fā)實現(xiàn);另外,還通過自制組件以及其他界面輔助組件開發(fā)實現(xiàn)了分析處理結(jié)果的可視化模塊,以便于對分析結(jié)果的檢查、核對和更正。1.2系統(tǒng)功能1)基本的GIS空間數(shù)據(jù)顯示、查詢、編輯等功能。系統(tǒng)不僅提供放大、縮小、全圖、漫游等基本的地圖操作顯示功能、而且利用地圖列表可控制地圖窗口的顯示內(nèi)容、狀態(tài)、順序等,并能根據(jù)用戶需要設(shè)置相應(yīng)的顯示樣式。系統(tǒng)提供了多種的查詢方式,用戶可以檢索、瀏覽空間信息和屬性字段信息。系統(tǒng)提供了常規(guī)的數(shù)據(jù)編輯工具,使用戶能夠手動方式對其數(shù)據(jù)進行更新,主要包括單個實體的添加、刪除、修改(移動對象,操作結(jié)點,改變屬性值等)、分割以及多實體的置換、合并等操作。這些功能一般在如圖2所示的子窗口中加以實現(xiàn)。 圖2 數(shù)據(jù)管理窗口 圖3 模式匹配窗口2)模式匹配功能。模式匹配,是指從兩個數(shù)據(jù)庫模式中確定語義相關(guān)的對應(yīng)模式元素(要素類和屬性等),并聲明其具體映射關(guān)系的過程。模式匹配是更新信息自動傳播的基礎(chǔ)處理環(huán)節(jié),它所取得的匹配結(jié)果可被用于指導(dǎo)和簡化其他處理操作,保證基礎(chǔ)地理數(shù)據(jù)庫中的變化信息被充分準確提取和集成。系統(tǒng)分別設(shè)計了相應(yīng)的圖形用戶界面和自動化向?qū)Чぞ邅硗瓿筛聜鞑ブ械哪J狡ヅ洳僮?。其中,模式匹配圖形界面(如圖3所示)不僅支持以拖線方式手動建立模式映射關(guān)系,而且可以顯示和查看自動向?qū)Мa(chǎn)生的匹配結(jié)果,并進行相應(yīng)的修改和調(diào)整。GIS數(shù)據(jù)庫模式間包含兩種不同層次的匹配關(guān)系:一種是要素類與要素類之間匹配(用圖3中部第一條直線表示),另一種是屬性與屬性間的匹配(用圖3中的其他條直線表示)。 圖4 變化信息窗口3)變化提取功能。通過比較新版源數(shù)據(jù)和舊版目標數(shù)據(jù)之間對應(yīng)實體的幾何圖形和屬性信息判斷其是否發(fā)生變化,并將諸如新增、消失、合并、分解、幾何變化、屬性變化等變化類型的實體及其相關(guān)信息列在如圖4所示的窗口中,以供用戶做最終的檢查、核對和篩選。4)更新集成功能。根據(jù)模式匹配映射關(guān)系以及源數(shù)據(jù)和目標數(shù)據(jù)之間的實體對應(yīng)性,可通過添加、刪除、修改等三種基本更新算子及其組合將檢核確認后的更新變化信息集成到目標數(shù)據(jù)中。整個過程以自動生成的命令腳本加以描述,能夠以批處理的方式自動運行。2軟件功能的自動化實現(xiàn)本節(jié)將進一步介紹上述主要功能的自動化實現(xiàn)算法和基本原理。2.1基于空間實例的模式匹配為實現(xiàn)GIS數(shù)據(jù)庫模式的自動匹配,我們根據(jù)GIS數(shù)據(jù)庫的特點以及模式匹配的應(yīng)用背景,提出了一種基于空間實例統(tǒng)計相似性的模式自動匹配方法。該方法的基本步驟如下7:1)在目標數(shù)據(jù)庫中一個要素類的實例集合中,隨機地抽取若干個實體樣品,并采用較小的緩沖半徑生成這些樣品的緩沖區(qū),然后依次在源數(shù)據(jù)庫的每個要素類查找落在這些緩沖區(qū)中的對應(yīng)候選實體,最后通過比較幾何類型、候選實體個數(shù)、大小、長度等信息,建立采樣實體和候選實體的對應(yīng)關(guān)系,如圖5所示。圖5. 對應(yīng)實體抽樣識別示例2)根據(jù)對應(yīng)實體抽樣識別結(jié)果,計算要素類的相似性,并匹配語義相關(guān)的要素類。假設(shè)在源要素類S中抽樣選取了s個實體,而在目標要素類T中發(fā)現(xiàn)了t個與之對應(yīng)的實體,則兩個要素的相似性CSim(S,T)為: (1)如果源數(shù)據(jù)庫和目標數(shù)據(jù)庫分別共用m和n個要素類,采用公式(1)分別兩兩計算要素類的相似性,將形成一個mn的要素類相似矩陣(i=1,,m;j=1,,n)。對于給定閾值,如果,則斷定源數(shù)據(jù)庫中第i個要素類和目標數(shù)據(jù)庫中第j個要素類匹配。3)根據(jù)對應(yīng)實體的屬性值,在已匹配的要素類之間,計算其屬性相似性,并確定相關(guān)的屬性匹配。對于分別來自源要素類和目標要素類的兩個數(shù)字型屬性A和B,其在n對對應(yīng)實體中的屬性值分別為ai和bi(i=1,n),則其相似性為: (2)式中:。對于分別來自源要素類和目標要素類的兩個字符型屬性A和B,其在n對對應(yīng)實體中的屬性值分別為ai和bi(i=1,n),則其的相似性為: (3)式中,為屬性值ai和bi之間的編輯距離,和分別為屬性值ai和bi的字符長度。對于來自源要素類的數(shù)值型(或字符型)屬性A和來自源要素類的字符型(或數(shù)值型)屬性B(例如,圖5中的T和Grade),如果其可能的取值數(shù)目相同,則采用下式計算其相似性: (4)式中,和為分別屬性值ai和bi出現(xiàn)的概率,為屬性值ai和bi同時出現(xiàn)的聯(lián)合概率。;。假設(shè)兩個匹配要素類中分別存在m和n個屬性,根據(jù)屬性的類型分別采用上述公式兩兩計算屬性之間的相似性,將形成一個mn的屬性相似矩陣(i=1,,m;j=1,,n)。對于給定的閾值,如果,并且,則第i個屬性和第j個屬性匹配。在確定模式匹配關(guān)系之后,為保證匹配的質(zhì)量以及進一步的應(yīng)用,可以采用手動方式檢核和更正模式匹配結(jié)果,并聲明匹配元素之間具體的映射關(guān)系。2.2 面向變化提取的實體識別目前主要快照差分法、時間戳法、觸發(fā)器法、日志法等四種變化信息提取方法8。其中,快照差分法因具有通用性高、不需要其他外部輔助設(shè)施的支持等特點,而被廣泛采用,它主要通過比較不同時期的數(shù)據(jù)集快照來獲取其中的更新變化信息。實現(xiàn)該方法的關(guān)鍵是如何高效地在兩個快照之間識別和發(fā)現(xiàn)代表同一現(xiàn)實事物的對應(yīng)實體,即實體識別。在更新傳播背景下,由于源要素類和目標要素類時間跨度比較大,同一空間實體的在不同要素類的描述信息(幾何圖形、屬性值、拓撲關(guān)系等)可能差別較大,因此僅通過比較某一種類型的信息來識別實體是否對應(yīng),很容易產(chǎn)生遺漏或錯配情況。為此,本文提出了一種基于多源信息的空間實體識別方法。假設(shè)S和T分別代表源數(shù)據(jù)庫和目標數(shù)據(jù)庫中相關(guān)要素類中的實體集合,和分別表示為S和T中的屬性字段,對于實體,令表示實體的在屬性上的值,表示實體的在屬性上的值,表示和為對應(yīng)實體。首先,通過比較語義相同屬性的值,來識別要素類間的一部分對應(yīng)實體。對于實體,如果屬性Am和Bn含義相同,和存在且唯一,并且,則。然后,根據(jù)實體的幾何類型,通過比較實體的幾何特征或拓撲關(guān)系,識別發(fā)現(xiàn)要素類間所遺漏的對應(yīng)實體。1)對應(yīng)兩個點狀實體,如果兩者之間的距離小于給定閾值,則認為二者對應(yīng)。2)對于兩個線狀實體,先以較小緩沖半徑生成其中一實體的緩沖區(qū),然后計算另一實體落在該緩沖區(qū)的所有子段長度之和與該實體總長度之比,如果該閾值大于給定閾值,則兩實體對應(yīng)。3)對于兩個面狀實體,如果兩者相較部分的面積大于0,則認為二者對應(yīng)。根據(jù)識別發(fā)現(xiàn)的對應(yīng)實體關(guān)系,可以進一步提取源要素類中更新變化信息,其具體規(guī)則如下:1)對于未發(fā)現(xiàn)實體與之對應(yīng)的源要素類中的實體,則認為其為新增實體。2)對于未發(fā)現(xiàn)實體與之對應(yīng)的目標要素類中的實體,則認為其為消失實體。3)對于源要素類中的一個實體,如果僅在目標要素類發(fā)現(xiàn)一個實體與之對應(yīng),則需要進一步比較兩實體的形狀、屬性、位置等特征,以確定實體是現(xiàn)狀、位置、屬性發(fā)生了變化,或是根本沒有發(fā)生變化。4)對于源要素類中的一個實體,如果在目標要素類發(fā)現(xiàn)多個實體與之對應(yīng),則源要素類中的這個實體為合并實體。5)對于源要素類中的多個實體,如果在目標要素類僅發(fā)現(xiàn)一個實體與之對應(yīng),則源要素類中這些實體為分解實體。6)對于源源要素類中的多個實體,如果在目標源要素類也發(fā)現(xiàn)多個實體與之對應(yīng),則源要素類這些實體為聚集實體。2.3 模式和實體映射引導(dǎo)下的更新集成根據(jù)模式映射和實體對應(yīng)關(guān)系,可通過添加、刪除、修改等三個基本操作算子及其組合,將提取的更新變化信息集成到相應(yīng)的目標要素類中,以使其也具有良好的現(xiàn)勢性?,F(xiàn)定義三個操作算子的基本形式如下:Intsert (FeatureClass,ID):在名稱為FeatureClass的數(shù)據(jù)集中插入一個標識符為ID的實體;Update (FeatureClass,x,F(xiàn)ieldName,F(xiàn)ieldValue):修改要素類FeatureClass中標號為x的實體的FieldName屬性值為FieldValue;Delete (FeaturClass,x):刪除數(shù)據(jù)集FeatureClass中標號為x的實體。假設(shè)源要素類S和目標要素類之間存在形如和兩個屬性映射關(guān)系,對S中不同類型的變化信息,為保證集成后數(shù)據(jù)盡可能完整正確,可采用如下形式的操作指令將其集成到T中:1)對于消失實體,可直接執(zhí)行Delete(T.name, t.id);2)對于新增實體,應(yīng)執(zhí)行一個操作序列,記作E(s) =Insert(T.name, id=y); Update(T.name, y, Shape, s.shape), Update(T.name, y, A1, f1( s.a1 ) ), Update(T.name, y, A2, f2( s.a2, s.a3 ) );3)對于在屬性A1變化的實體和與之對應(yīng)的匹配實體,可直接執(zhí)行Update(T.name, t.id, A1 , f1 (s.a1),同樣,對于幾何變化,可直接執(zhí)行Update(T.name, t.id, Shape, s.shape);4)對于分解實體和與之對應(yīng)的實體集。首先應(yīng)該從選擇一個主實體s1,然后執(zhí)行相應(yīng)的操作序列,記作E (t) =Update (T.name, t.id, Shape, s1.shape), Update (T.name, t.id, A1 , f1 (s1.a1), Update (T.name, y, A2, f2( s1.a2, s1.a3 ) ), E(s2) , E(s3) , ., E(sn) ,其中sk, k =1, 2, 3, ., |;5)對于合并實體集和與之對應(yīng)的實體匹配,應(yīng)該執(zhí)行的操作操作序列可表示為:E(s)=Delete(T.name, t1.id), Delete(T.name, t2.id), ., Delete(T.name, tm.id), E(s) ,其中tk, k =1, 2, 3, ., |。6)對于聚集實體集和與之對應(yīng)的實體集,應(yīng)該執(zhí)行的操作可表示為:E()= Delete(T.name, t1.id), Delete(T.name, t2.id), ., Delete (T.name, tm.id), E(s2) , E(s3) , ., E(sn),其中ti, i =1, 2, 3, ., |;sj, j =1, 2, 3, ., |。3 結(jié)語針對實現(xiàn)中的具體需要,本文討論了更新傳播軟件工具的開發(fā)策略和主要功能,以及更新傳播中主要操作的自動化處理實現(xiàn)方式。當然,系統(tǒng)還有一定的局限和不足,在1對多、多對多類型的屬性匹配、更新一致性檢測和維護等方面尚需做進一步的補充和完善。致謝:本文得到國家自然科學(xué)基金項目(40337055)、國家科技支撐項目(2006BAJ05A14),河南省科技計劃重點攻關(guān)項目(092102210361),河南省教育廳自然科學(xué)研究計劃項目(2009B420001),河南理工大學(xué)博士基金項目(B2008-49)的資助。參考文獻1 Fritsch D., GIS Data Revision and RealityC, Keynote Speech in Joint ISPRS Commission Workshop on Dynamic and Multi-dimensional GIS, Beijing, 1999。2 蔣捷,陳軍,基礎(chǔ)地理信息數(shù)據(jù)庫更新的若干思考J,測繪通報,2000(5):1-3。3 Spery Laurent, A Framework for Update Process in GISC, Proceedings of the 3rd International Conference on GeoComputa
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 專業(yè)版2024年:房產(chǎn)交易合同及附件
- 2024版建筑公司技術(shù)員工勞動協(xié)議版B版
- 個人股權(quán)質(zhì)押融資合同(2024版)版B版
- 二零二五年度資產(chǎn)收購協(xié)議8篇
- 2025年新能源電動車租賃及充電設(shè)施建設(shè)合作協(xié)議3篇
- 二零二五年度高端住宅鋁窗更換及安裝工程合同范本4篇
- 專利事務(wù)委托代理合作合同2024版B版
- 二零二五廠長任期責任書及薪酬福利聘用合同4篇
- 二手車交易合同協(xié)議書簡單(2024版)
- 二零二五年電子商務(wù)平臺社交電商銷售合作協(xié)議3篇
- SQL Server 2000在醫(yī)院收費審計的運用
- 《FANUC-Oi數(shù)控銑床加工中心編程技巧與實例》教學(xué)課件(全)
- 微信小程序運營方案課件
- 抖音品牌視覺識別手冊
- 陳皮水溶性總生物堿的升血壓作用量-效關(guān)系及藥動學(xué)研究
- 安全施工專項方案報審表
- 學(xué)習(xí)解讀2022年新制定的《市場主體登記管理條例實施細則》PPT匯報演示
- 好氧廢水系統(tǒng)調(diào)試、驗收、運行、維護手冊
- 中石化ERP系統(tǒng)操作手冊
- 五年級上冊口算+脫式計算+豎式計算+方程
- 氣體管道安全管理規(guī)程
評論
0/150
提交評論