利用主題圖實現(xiàn)城市圈電子政務(wù)系統(tǒng)數(shù)據(jù)整合模型的構(gòu)建_第1頁
利用主題圖實現(xiàn)城市圈電子政務(wù)系統(tǒng)數(shù)據(jù)整合模型的構(gòu)建_第2頁
利用主題圖實現(xiàn)城市圈電子政務(wù)系統(tǒng)數(shù)據(jù)整合模型的構(gòu)建_第3頁
利用主題圖實現(xiàn)城市圈電子政務(wù)系統(tǒng)數(shù)據(jù)整合模型的構(gòu)建_第4頁
利用主題圖實現(xiàn)城市圈電子政務(wù)系統(tǒng)數(shù)據(jù)整合模型的構(gòu)建_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

利用主題圖實現(xiàn)城市圈電子政務(wù)系統(tǒng)數(shù)據(jù)整合模型的構(gòu)建

[分類號]TP3931引言城市圈(CityCircle)是指在城市群中出現(xiàn)的以一個大城市為核心,周邊城市共同參與分工、合作,構(gòu)成一個人口和產(chǎn)業(yè)密集、分工明確、各具特色、優(yōu)勢互補(bǔ)的圈域經(jīng)濟(jì)一體化的區(qū)域[1-2]。區(qū)域信息一體化建設(shè)是城市圈融合和發(fā)展的重要前提,城市間電子政務(wù)系統(tǒng)數(shù)據(jù)整合是其中的重點(diǎn)、難點(diǎn)。由于城市間的差異、建設(shè)的經(jīng)濟(jì)成本,城市圈很難重新建立統(tǒng)一的電子政務(wù)系統(tǒng)。因此,如何將各城市已有的電子政務(wù)系統(tǒng)數(shù)據(jù)進(jìn)行有效整合,從而使縱向結(jié)構(gòu)的各城市電子政務(wù)系統(tǒng)實現(xiàn)橫向數(shù)據(jù)共享是一個亟待解決的課題。目前,絕大多數(shù)電子政務(wù)系統(tǒng)均采用關(guān)系型數(shù)據(jù)庫系統(tǒng)(RelationalDataBaseManagementSystem,RDBMS)進(jìn)行數(shù)據(jù)管理,城市間多電子政務(wù)系統(tǒng)間數(shù)據(jù)結(jié)構(gòu)具有如下特性。(1)數(shù)據(jù)異構(gòu)性。城市間各電子政務(wù)系統(tǒng)由于數(shù)據(jù)庫的結(jié)構(gòu)和存儲方式不盡相同,以及數(shù)據(jù)管理模式和應(yīng)用流程的差異,形成了系統(tǒng)間的數(shù)據(jù)異構(gòu)。(2)數(shù)據(jù)成分復(fù)雜性。政務(wù)系統(tǒng)的數(shù)據(jù)來自于各個行業(yè)和部門,而且不斷有新數(shù)據(jù)產(chǎn)生,因此數(shù)據(jù)成分相對復(fù)雜。(3)數(shù)據(jù)主題性。盡管政務(wù)數(shù)據(jù)的數(shù)量龐大且成分復(fù)雜,但從使用角度分析,可以針對部門間相關(guān)數(shù)據(jù)的交叉和關(guān)聯(lián),按業(yè)務(wù)流程將數(shù)據(jù)分為多個不同的主題,使數(shù)據(jù)組織清晰化。(4)數(shù)據(jù)環(huán)境不一致性。各系統(tǒng)采用不同的計算機(jī)操作系統(tǒng)和數(shù)據(jù)庫系統(tǒng)以及硬件和體系結(jié)構(gòu)的差異,形成了數(shù)據(jù)環(huán)境的不一致性。本文在深入探討主題圖在知識組織、信息資源定位等方面優(yōu)勢的基礎(chǔ)上,針對上述數(shù)據(jù)結(jié)構(gòu)特性,構(gòu)建基于主題圖的城市圈電子政務(wù)系統(tǒng)數(shù)據(jù)整合模型。該模型通過對異構(gòu)數(shù)據(jù)庫進(jìn)行逆向工程,利用ER模型及OAI技術(shù)生成相關(guān)主題圖,并利用主題圖的可融合性進(jìn)行主題圖合并,從而實現(xiàn)異地異構(gòu)電子政務(wù)系統(tǒng)問數(shù)據(jù)的整合,支持跨政府部門的業(yè)務(wù)協(xié)同,增強(qiáng)電子政務(wù)系統(tǒng)集成能力和協(xié)調(diào)能力。該方法具有計算量相對較小、經(jīng)濟(jì)成本低等優(yōu)點(diǎn),同時可保證數(shù)據(jù)整合的語義性、可擴(kuò)展性和靈活性。2主題圖應(yīng)用的可行性一個結(jié)構(gòu)完整的電子政務(wù)系統(tǒng)至少應(yīng)該包括用戶層、應(yīng)用層、數(shù)據(jù)層三個層次。用戶層對用戶身份進(jìn)行管理并提供交互界面;應(yīng)用層是相關(guān)應(yīng)用、服務(wù)程序的集合;數(shù)據(jù)層則是所有數(shù)據(jù)資源的集合,在電子政務(wù)系統(tǒng)中一般是指RDBMS。利用主題圖技術(shù)對多電子政務(wù)系統(tǒng)進(jìn)行數(shù)據(jù)整合是在各政務(wù)系統(tǒng)的數(shù)據(jù)層和應(yīng)用層之間增加了一個第三方主題圖索引層,如圖1所示。在該層中從各RDBMS提取數(shù)據(jù),利用主題圖構(gòu)成一個結(jié)構(gòu)化的語義索引。應(yīng)用層根據(jù)用戶層的操作發(fā)出對數(shù)據(jù)的檢索請求,索引層響應(yīng)并對其進(jìn)行初步的語義檢索處理,然后根據(jù)檢索結(jié)果指向?qū)嶋H數(shù)據(jù)或者為RDBMS提供經(jīng)過數(shù)據(jù)整理和語義加工后的檢索關(guān)鍵詞,將最終檢索結(jié)果返回用戶層。圖1主題圖索引層2.1關(guān)系型數(shù)據(jù)庫關(guān)系型數(shù)據(jù)庫將復(fù)雜的數(shù)據(jù)結(jié)構(gòu)歸納為一系列“二維表格”,利用這種二元關(guān)系來表達(dá)實體類型及實體間的聯(lián)系[3]。關(guān)系型數(shù)據(jù)庫的設(shè)計主要包括關(guān)系模式(RelationalSchema)設(shè)計和完整性約束(IntegrityConstraints)申明兩部分[4]。關(guān)系型數(shù)據(jù)庫的各個屬性相互關(guān)聯(lián),相互依賴,相互制約,從而構(gòu)成一個結(jié)構(gòu)嚴(yán)密的整體。為了避免出現(xiàn)數(shù)據(jù)冗余、邏輯錯誤和操作異常,提高存取效率和準(zhǔn)確率,在進(jìn)行數(shù)據(jù)庫設(shè)計時必須遵循相應(yīng)的規(guī)則(關(guān)系模式)[5]。因此為實現(xiàn)關(guān)系型數(shù)據(jù)庫向主題圖的轉(zhuǎn)換,必須依從一定的策略,從數(shù)據(jù)的語義層次提取這些模式信息。2.2可行性分析主題圖實質(zhì)上是一個獨(dú)立于具體信息資源的、動態(tài)的、結(jié)構(gòu)化的索引,通過對主題關(guān)系實例的訪問可檢索到相關(guān)的實際資源,從而指引用戶到特定的地址獲取信息[6]。因此,利用主題圖對多電子政務(wù)系統(tǒng)進(jìn)行數(shù)據(jù)整合是對數(shù)據(jù)庫進(jìn)行一個映射與導(dǎo)航,將抽象、孤立的數(shù)據(jù)組織起來,形成結(jié)構(gòu)化的語義網(wǎng)絡(luò)。利用這種方法可以有效避免異地異構(gòu)數(shù)據(jù)庫之間的數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)合并、數(shù)據(jù)關(guān)聯(lián)等大量繁瑣的計算過程。傳統(tǒng)數(shù)據(jù)庫合并方法雖然可以解決異構(gòu)數(shù)據(jù)合并問題,但是無法很好解決語義異構(gòu)問題,而主題圖的應(yīng)用可以解決這一問題。對于數(shù)據(jù)庫和主題圖之間轉(zhuǎn)換的可行性,給出一個簡單實例。假設(shè)某政務(wù)系統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù)表如表1、表2和表3所示。圖2主題圖轉(zhuǎn)換及合并如圖2所示,根據(jù)主題圖TAO(TopicsAssociationsOccurrences)三要素的原理,可以對三個表格信息進(jìn)行分析,識別出數(shù)據(jù)信息中的主題(Topic)、聯(lián)系(Association)與事件(Occurrence)。實例中主題包括:單位、員工、職務(wù)、學(xué)歷、國土局等,其中單位、員工等是主題類型;聯(lián)系類型包括:任職、領(lǐng)導(dǎo)、工作關(guān)系等;事件包括:法人、張三等。將識別出的信息分別用XTM規(guī)定的元素節(jié)點(diǎn)進(jìn)行描述,生成XTM文檔,分別形成三個子主題圖。由于主題圖具有良好的可擴(kuò)展性與可融合性,因此可以在全局模式的指導(dǎo)下對建立的三個子主題圖進(jìn)行相似度分析,對高相似度或者一致的主題按一定規(guī)則進(jìn)行合并,把子主題圖按照自底而上的模式合并,形成全局主題圖。這種方式可以方便實現(xiàn)底層數(shù)據(jù)的增加、刪除、修改甚至數(shù)據(jù)庫結(jié)構(gòu)的變化。3模型構(gòu)建多系統(tǒng)間數(shù)據(jù)整合的基礎(chǔ)在于對異構(gòu)數(shù)據(jù)庫的統(tǒng)一化,而對數(shù)據(jù)的交互操作是模型設(shè)計的關(guān)鍵。本模型利用OAI技術(shù)形成元數(shù)據(jù)集合,從而實現(xiàn)異構(gòu)數(shù)據(jù)的標(biāo)準(zhǔn)化,通過對各政務(wù)系統(tǒng)的DBMS分別進(jìn)行逆向工程,在元數(shù)據(jù)倉儲的基礎(chǔ)上按照相關(guān)規(guī)則生成局部子主題圖并遵循一定原則進(jìn)行合并,利用生成的全局主題圖實現(xiàn)數(shù)據(jù)的交互操作。3.1模型概述圖3數(shù)據(jù)整合模型結(jié)構(gòu)圖如圖3所示,將模型設(shè)計為三個模塊:數(shù)據(jù)處理模塊,主題圖生成模塊,主題圖合并模塊。(1)數(shù)據(jù)處理模塊:本模塊主要是將數(shù)據(jù)庫進(jìn)行解析,通過對異構(gòu)數(shù)據(jù)庫的數(shù)據(jù)標(biāo)準(zhǔn)化[7]、數(shù)據(jù)庫ER模式的抽取、元數(shù)據(jù)創(chuàng)建、元數(shù)據(jù)收割等手段,形成元數(shù)據(jù)倉儲,為高層應(yīng)用服務(wù)。(2)主題圖生成模塊:本模塊利用底層形成的元數(shù)據(jù)倉儲,依照主題圖模板和規(guī)則文檔生成主題圖[8]。(3)主題圖合并模塊:由于主題圖具有良好的擴(kuò)展性和可重用性,全局主題圖可以分為若干個局部主題圖分別構(gòu)建,采用自底而頂?shù)姆绞竭M(jìn)行逐級合并,最終構(gòu)成一個總的全局主題圖。3.2ER模型提取關(guān)系型數(shù)據(jù)庫的結(jié)構(gòu)和語義信息都包含在概念數(shù)據(jù)模式(ER模式)中,向主題圖轉(zhuǎn)換的一個關(guān)鍵問題是關(guān)系型數(shù)據(jù)庫ER模型的提取,利用ER模型所包含的語義信息來指導(dǎo)主題圖的構(gòu)建。ER模型的提取一般采用數(shù)據(jù)庫逆向工程(DataBaseReverseEngineering,DBRE)方法完成。數(shù)據(jù)庫逆向工程指獲取現(xiàn)有數(shù)據(jù)庫的語義信息,把關(guān)系模式轉(zhuǎn)化為概念模式,最后用易于人類理解的概念模式來表示結(jié)果。一般來說,RDBMS數(shù)據(jù)字典中保存了當(dāng)前“最終”模式狀態(tài)[9],因此本文設(shè)計了一個ERGenerator來從數(shù)據(jù)字典中提取ER模式,如圖4所示。圖4ERGeneratorERGenerator通過JDBC對RDBMS進(jìn)行連接以后,得到一個Connection對象,可以從這個對象獲得RDBMS的各種信息。獲取這些信息的方法是通過ResultSetMetaData類和DataBaseMetaData類實現(xiàn),使用ResultSetMetaData獲得數(shù)據(jù)表的信息,使用DataBaseMetaData獲得數(shù)據(jù)庫的信息,主要步驟如下:(1)建立數(shù)據(jù)庫連接使用ResultSetMetaData類和DataBaseMetaData類,需要使用JDBCAPI與數(shù)據(jù)庫連接。首先加載連接數(shù)據(jù)庫的JDBC驅(qū)動程序,然后調(diào)用java.sql包中DriverManager類的getConnection方法,獲得一個Connection對象。此Connection對象是java.sql包中接口Connection的一個實現(xiàn),表示與該數(shù)據(jù)庫的一次連接,代碼如下:(3)獲取實體關(guān)系信息ER圖中的關(guān)系通過FK來表示,根據(jù)程序?qū)K的讀取,可以獲取實體間的關(guān)系。DataBaseMetaData類提供getImportedKeys方法得到已經(jīng)References到他表的字段。通過這個接口可以很方便地得到有關(guān)FK的信息,代碼如下:在實驗室構(gòu)建ERGenerator時采用CA公司的CASE工具Erwin對其進(jìn)行輔助操作。3.3OAI元數(shù)據(jù)收割模塊由于各電子政務(wù)系統(tǒng)RDBMS中數(shù)據(jù)信息的異構(gòu)特征,該模型采用OAI元數(shù)據(jù)收割技術(shù)來進(jìn)行元數(shù)據(jù)提取。OAI(OpenArchivesInitiative)元數(shù)據(jù)收割協(xié)議(OAIProtocolforMetadataHarvesting,OAI-PMH)廣泛應(yīng)用于資源整合、跨庫檢索、學(xué)科信息門戶建立、個性化服務(wù)等領(lǐng)域。OAI協(xié)議最大的特色是通過相對簡單的、獨(dú)立于應(yīng)用程序以外的元數(shù)據(jù)收割協(xié)議,來實現(xiàn)異構(gòu)分布元數(shù)據(jù)資源之間便捷的互操作[10]。本模型利用OAI技術(shù)進(jìn)行跨庫元數(shù)據(jù)收割的結(jié)構(gòu)如圖5所示。該模塊由三個步驟組成:(1)將各系統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù)資源處理成數(shù)字對象存儲在數(shù)字倉儲中,建立元數(shù)據(jù)庫,然后對元數(shù)據(jù)進(jìn)行結(jié)構(gòu)化組織,從而形成數(shù)據(jù)提供者(DataProvider,DP),為OAI元數(shù)據(jù)收割提供元數(shù)據(jù)信息。(2)利用元數(shù)據(jù)收集器對數(shù)據(jù)提供者提供的元數(shù)據(jù)進(jìn)行收集。圖5OAI元數(shù)據(jù)收割(3)對收集的元數(shù)據(jù)進(jìn)行規(guī)范化處理:①元數(shù)據(jù)過濾,將不符合要求的元數(shù)據(jù)過濾掉;②元數(shù)據(jù)格式轉(zhuǎn)換,將過濾后的元數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式;③元數(shù)據(jù)索引,對整理好的元數(shù)據(jù)進(jìn)行索引。經(jīng)過上述規(guī)范化處理形成元數(shù)據(jù)集合[11]。OAI元數(shù)據(jù)收割模塊可以將異構(gòu)元數(shù)據(jù)轉(zhuǎn)換成符合規(guī)范的元數(shù)據(jù)格式,形成元數(shù)據(jù)集合(倉儲),為高層應(yīng)用服務(wù),以實現(xiàn)對異構(gòu)信息資源的互操作。3.4主題圖生成與合并(1)主題圖生成模塊圖6主題圖自動生成如圖6所示,主題圖生成模塊主要完成主題圖的自動生成環(huán)節(jié),其核心是在元數(shù)據(jù)倉儲基礎(chǔ)上,根據(jù)提取的ER模式信息,按照規(guī)范生成主題圖并進(jìn)行校驗與可視化。該模塊分為三個步驟:①主題圖初步生成。利用OAI元數(shù)據(jù)收割模塊進(jìn)行元數(shù)據(jù)收割,按照數(shù)據(jù)資源規(guī)范和數(shù)據(jù)集規(guī)范進(jìn)行數(shù)據(jù)抽取,形成元數(shù)據(jù)倉儲。按照一定的主題圖規(guī)范生成初步的主題圖并輸出。②語義合法性校驗。對于初步生成的主題圖參照ER模型及SCTM約束語言進(jìn)行語義合法性檢驗,并對其進(jìn)行完善[12]。③可視化及系統(tǒng)集成。主題圖生成后應(yīng)對其進(jìn)行可視化工作,提供基于主題圖的瀏覽、檢索界面及接口[13],并將主題圖以二維圖的形式表達(dá)出來。同時采用Java語言進(jìn)行開發(fā),將其與電子政務(wù)系統(tǒng)進(jìn)行系統(tǒng)集成,建構(gòu)電子政務(wù)系統(tǒng)的索引層。一般可以借助Omnigator或StarTree等工具進(jìn)行主題圖可視化。為實現(xiàn)主題圖界面的靈活化,本模型采用XML語法及XSLT配合StarTree來實現(xiàn)。(2)主題圖合并模塊由于本模型的主題圖生成采用由底而頂、逐漸擴(kuò)大的方式構(gòu)建,所以主題圖合并模塊是整個模型中的關(guān)鍵技術(shù)。主題圖遵循的合并原則有:①當(dāng)兩個主題被合并,代表同一事物的主題和聯(lián)系將被合并,并刪除重復(fù)項。②當(dāng)兩個主題被合并,結(jié)果是一個主題,其特征元素是原來兩個元素的并集[14]。兩個主題如果滿足下列條件之一則視為描述同一概念:①兩者具有一個或多個相同的主題提示符。②兩者在同一范圍定義中有相同的主題提示符。③它們是對同一個可尋址事物的具體化[15]?;谝陨显瓌t,本文采用類程序語言來描述主題圖合并采用的三種方法:①主題合并4結(jié)語本文針對城市圈建設(shè)中多電子政務(wù)系統(tǒng)數(shù)據(jù)整合課題,在深入分析主題圖技術(shù)和關(guān)系型數(shù)據(jù)庫的基礎(chǔ)上,提出在電子政務(wù)系統(tǒng)的應(yīng)用層及數(shù)據(jù)層之間建立一個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論