版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 構(gòu)建基于的信息集成研究 胡舟摘 要在當(dāng)前的網(wǎng)絡(luò)信息時(shí)代,信息量不僅龐大而且源自于不同的數(shù)據(jù)源,信息集成一直是研究的熱點(diǎn)?;诙啻?multi-agent)的信息資源集成方案有所 不足,而xml集成機(jī)制的優(yōu)點(diǎn),適于網(wǎng)絡(luò)環(huán)境下基于xml的信息集成。關(guān)鍵詞xml 資源集成 dtd xsl wrapper dom引言隨著計(jì)算機(jī)技術(shù),特別是internet的不斷發(fā)展,實(shí)現(xiàn)"信息孤島"之間的集成與交互成為亟待解決的問題。而xml技術(shù)則可以很好的解決這個(gè)問題。用xml進(jìn)行數(shù)據(jù)集成,只需對(duì)所有的異構(gòu)數(shù)據(jù)源增加一個(gè)以xml為格式的封裝體
2、,即在不改變數(shù)據(jù)源的前提下,用xml對(duì)數(shù)據(jù)源的定義描述字、數(shù)據(jù)源的創(chuàng)建等相關(guān)信息進(jìn)行封裝。供應(yīng)鏈節(jié)點(diǎn)上所有數(shù)據(jù)源的封裝體納入全局的 xml schema或dtd,并存儲(chǔ)在xml虛擬服務(wù)器,為系統(tǒng)檢索、定位提供服務(wù)。在xml的集成機(jī)制里,可以通過xml封裝體實(shí)現(xiàn)彼此之間的數(shù)據(jù)交互,所以 不需要了解數(shù)據(jù)庫的格式,從而彌補(bǔ)了基于多代理的集成方法在這方面的不足。下面首先概要介紹xml的相關(guān)技術(shù),進(jìn)而給出網(wǎng)絡(luò)環(huán)境下的、基于xml的信息集成方案一、xml技術(shù)(一)xml相關(guān)標(biāo)準(zhǔn)xml基礎(chǔ)標(biāo)準(zhǔn)是為xml的進(jìn)一步實(shí)用化制定的標(biāo)準(zhǔn),它規(guī)定了采用xml制定標(biāo)準(zhǔn)時(shí)的一些公用特征、方法或規(guī)則。xml schema描述
3、了更加嚴(yán)格定義xml文檔的方法,以便可以更自動(dòng)地處理xml文檔。xml namespace用于保證xml dtd中名字的一致性,以便不同的dtd中的名字在需要時(shí) 可以合并到一個(gè)文檔中。dom定義了一組與平臺(tái)和語言無關(guān)的接口,以便程序和腳本能夠動(dòng)態(tài)訪問和修改xml文檔內(nèi)容、結(jié)構(gòu)及樣式。(二)xml的主要技術(shù)特點(diǎn)xml是一種元標(biāo)記語言,強(qiáng)調(diào)以數(shù)據(jù)為核心,這兩大特點(diǎn)在xml的眾多技術(shù)特點(diǎn)中最為突出,同時(shí)也奠定了xml在信息管理中的優(yōu)勢(shì)。xml是一種元標(biāo)記語言與html不同,xml不是一種具體的標(biāo)記語言,它沒有固定的標(biāo)記符號(hào),是一種元標(biāo)記語言,是一種用來定義標(biāo)記的標(biāo)記語言,它允許用戶自己定義一套適于應(yīng)
4、用的dtd。(三)dtd(document type define,文檔類型定義)dtd的作用是定義允許或不允許什么在文檔中出現(xiàn)。dtd的結(jié)構(gòu):一般由元素類型聲明、屬性表聲明、實(shí)體聲明、記號(hào)聲明等構(gòu)成。一個(gè)典型的文檔類型定義文 件會(huì)把未來所要?jiǎng)?chuàng)作的xml文檔的元素結(jié)構(gòu)、屬性類型、實(shí)體引用等預(yù)先進(jìn)行規(guī)定。用戶既可以直接在xml文檔中定義dtd,也可以通過url引用外部的 dtd。dtd位xml文檔的編寫者和處理者提供了共同遵循的原則,使得與文檔相關(guān)的各種工作有了統(tǒng)一的標(biāo)準(zhǔn)。二、基于xml的信息集成方案(一)基于xml的信息集成的層次結(jié)構(gòu)整個(gè)信息集成可以分為三個(gè)層次:其中最底層為信息抽取層,中間為
5、中介層,最上層為用戶接口層。1信息抽取層信息抽取層處于系統(tǒng)的最低層,是系統(tǒng)的數(shù)據(jù)提供者,主要功能是提取和集成分布在多個(gè)異構(gòu)數(shù)據(jù)源(數(shù)據(jù)庫,知識(shí)庫及構(gòu)件庫)上的信息。這一層采用 wrapper(包裝器)技術(shù)實(shí)現(xiàn)將一個(gè)從中介層得到的查詢,翻譯成能在經(jīng)過封裝的數(shù)據(jù)源上執(zhí)行的操作,將查詢結(jié)果抽取并打包到一個(gè)xml文檔,最后將該 文檔返回給中介層。2中介層中介層(mediation layer)的主要功能有兩方面:一方面對(duì)上接受用戶通過dom客戶端api向系統(tǒng)提交的或應(yīng)用程序發(fā)出的查詢,將其轉(zhuǎn)換成對(duì)xml的查詢,并將查詢結(jié)果 返回給用戶或應(yīng)用程序;另一方面對(duì)下將xml查詢分發(fā)給各個(gè)包裝器,并將查詢結(jié)果通
6、過dtd說明再轉(zhuǎn)換成xml格式。3用戶接口層用戶接口層(user interface layer)在中介層之上,負(fù)責(zé)將用戶的查詢命令提交給中介層,獲得并解釋查詢結(jié)果樹,并將結(jié)果顯示給用戶。xml dom(document object model,文檔對(duì)象模型)是為合法的格式良好的xml文檔設(shè)計(jì)的一套api(application programming interface,應(yīng)用程序接口),它同時(shí)定義了這些文檔的邏輯結(jié)構(gòu),訪問及操作方法。由于數(shù)據(jù)顯示與內(nèi)容分開,xml定義的數(shù)據(jù)允許指定不同的顯示方 式,使數(shù)據(jù)更合理的表現(xiàn)出來。本地的數(shù)據(jù)能夠以客戶配置,使用者選擇或其他標(biāo)準(zhǔn)決定的方式動(dòng)態(tài)的表現(xiàn)出
7、來。css和xsl為數(shù)據(jù)的顯示提供了公布的機(jī)制。(二)基于xml的信息集成系統(tǒng)的設(shè)計(jì)信息抽取層的wrapper組件由兩部分組成:wrapper生成器和wrapper實(shí)例(簡稱wrapper)。如圖4所示,一個(gè)wrapper位于 中介層和一個(gè)數(shù)據(jù)源的中間,它通常為中介層查詢異構(gòu)信息源集合提供一個(gè)公共接口。每個(gè)wrapper都要為某個(gè)特定的數(shù)據(jù)源制定相應(yīng)的接口,這個(gè)功能是由 wrapper生成器完成的。wrapper生成器用于為查詢某個(gè)確定的站點(diǎn)或站點(diǎn)集合構(gòu)建wrapper。wrapper的輸入是用一種wrapper規(guī)范語言書寫的規(guī)格說明,包 括關(guān)于將要為之生成的wrapper的數(shù)據(jù)源的元信息,該
8、元信息描述了如何從一個(gè)數(shù)據(jù)源請(qǐng)求服務(wù)以及如何抽取和解釋從數(shù)據(jù)源返回的信息。規(guī)格說明還必須能 夠表達(dá)以下內(nèi)容:數(shù)據(jù)源接口、數(shù)據(jù)模型、從用戶到數(shù)據(jù)源本地操作的查詢映射、數(shù)據(jù)源的查詢能力。三、dom客戶端api的設(shè)計(jì)dom全稱是document object model,是一個(gè)文件對(duì)象所組成的模型。它不光用于xml,最早是用于html的。dom定義了一組分析元可以顯示的標(biāo)準(zhǔn)指令集,通過程序存取html或xml的內(nèi)容,然后通過程序中的對(duì)象集合將其顯示出來。我們可以通過創(chuàng)建document對(duì)象,使得應(yīng)用程序得到對(duì)xml文檔進(jìn)行操作的入口。進(jìn)一步通過直接加載xml文檔把創(chuàng)建的這個(gè)文檔對(duì)象同實(shí)際的xml文檔
9、關(guān)聯(lián)起來。從而將xml文檔轉(zhuǎn)換成一個(gè)dom對(duì)象模型,為上層提供訪問服務(wù)。下面的例子結(jié)合vbscript和xml dom對(duì)象來生成xml數(shù)據(jù):/scripthtmlheadtitle利用dom對(duì)象來生成xml數(shù)據(jù)/title/headbodyhr姓名:input id=namelbr用戶名:input id=idbr密碼input type=“passwordid”=passwordbr電子郵件input id=emailinput type=button id=domxml value=“生成xml數(shù)據(jù)”/body/html四、總結(jié)web環(huán)境下的異構(gòu)數(shù)據(jù)源的集成,特別是基于xml的數(shù)據(jù)集成問題已經(jīng)成為當(dāng)前計(jì)算機(jī)領(lǐng)域中一個(gè)重要的研究方向。xml具有簡單、開放、可擴(kuò)展性、靈 活、自描述性等特點(diǎn),給internet注入了新的活力。作為數(shù)據(jù)表示的一個(gè)開放標(biāo)準(zhǔn),xml為數(shù)據(jù)集成帶來了新的機(jī)遇。用xml作為數(shù)據(jù)交換的中介,給 系統(tǒng)的實(shí)現(xiàn)帶來了極大的靈活性。系統(tǒng)可以屏蔽掉后臺(tái)的多種數(shù)據(jù)源,用統(tǒng)一的xml格式的數(shù)據(jù)呈現(xiàn)給用戶。接收數(shù)據(jù)方根據(jù)xml數(shù)據(jù)的dtd可以對(duì)數(shù)據(jù)進(jìn)行 任意的處理,如分解出其中需要處理的數(shù)據(jù)或是以不同的樣式來顯示
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個(gè)人法律服務(wù)委托合同4篇
- 二零二五年度路佳與配偶離婚協(xié)議:財(cái)產(chǎn)分配與子女撫養(yǎng)責(zé)任書3篇
- 2025版宿舍管理員職責(zé)聘用合同6篇
- 2025版團(tuán)購民宿項(xiàng)目合同3篇
- 二零二五年度茅臺(tái)酒經(jīng)銷商年度銷售目標(biāo)責(zé)任書3篇
- 二零二五年度寵物救助與領(lǐng)養(yǎng)支持基金合同4篇
- 二零二五年度商業(yè)地產(chǎn)項(xiàng)目購置合同書3篇
- 2025年度門窗行業(yè)綠色供應(yīng)鏈管理服務(wù)合同8篇
- 2025年度彩鋼幕墻設(shè)計(jì)與施工總承包合同3篇
- 二零二五年度寵物寵物托運(yùn)服務(wù)合同規(guī)范范本4篇
- 《天潤乳業(yè)營運(yùn)能力及風(fēng)險(xiǎn)管理問題及完善對(duì)策(7900字論文)》
- xx單位政務(wù)云商用密碼應(yīng)用方案V2.0
- 農(nóng)民專業(yè)合作社財(cái)務(wù)報(bào)表(三張報(bào)表)
- 安宮牛黃丸的培訓(xùn)
- 婦科腫瘤護(hù)理新進(jìn)展Ppt
- 動(dòng)土作業(yè)專項(xiàng)安全培訓(xùn)考試試題(帶答案)
- 大學(xué)生就業(yè)指導(dǎo)(高職就業(yè)指導(dǎo)課程 )全套教學(xué)課件
- 死亡病例討論總結(jié)分析
- 第二章 會(huì)展的產(chǎn)生與發(fā)展
- 空域規(guī)劃與管理V2.0
- JGT266-2011 泡沫混凝土標(biāo)準(zhǔn)規(guī)范
評(píng)論
0/150
提交評(píng)論