異構(gòu)數(shù)據(jù)庫整合查詢系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第1頁
異構(gòu)數(shù)據(jù)庫整合查詢系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第2頁
異構(gòu)數(shù)據(jù)庫整合查詢系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第3頁
異構(gòu)數(shù)據(jù)庫整合查詢系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第4頁
異構(gòu)數(shù)據(jù)庫整合查詢系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第5頁
已閱讀5頁,還剩58頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、學(xué)號:p200602009密級:公開異構(gòu)數(shù)據(jù)庫整合查詢系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)Design and Realization of HeterogeneousDatabase Integration Query System姓名鮑仕壯學(xué)科專業(yè)研究方向指導(dǎo)教師完成時(shí)間電路與系統(tǒng)網(wǎng)絡(luò)與智能系統(tǒng)徐 超 教授譚守標(biāo) 副教授2009 年 5 月I摘要摘要隨著計(jì)算機(jī)技術(shù)的發(fā)展,許多企業(yè)、單位或機(jī)構(gòu)部門逐步實(shí)現(xiàn)了業(yè)務(wù)、數(shù)據(jù)的信息化管理,企業(yè)、單位或機(jī)構(gòu)部門的內(nèi)部因各自處理的業(yè)務(wù)不同,信息化系統(tǒng)建設(shè)時(shí)間不同,可能采用不同數(shù)據(jù)庫產(chǎn)品管理業(yè)務(wù)數(shù)據(jù),以不同數(shù)據(jù)模型描述數(shù)據(jù)。這樣客觀上造成了多種異構(gòu)數(shù)據(jù)庫并存的情況,內(nèi)部的子系

2、統(tǒng)被隔離成一個(gè)個(gè)“信息孤島”?,F(xiàn)在,人們對數(shù)據(jù)處理的要求日益提高,經(jīng)常需要查詢多個(gè)異構(gòu)數(shù)據(jù)庫的業(yè)務(wù)數(shù)據(jù),進(jìn)行大量分析后才能作出正確決策。因此,從多個(gè)分布的、異構(gòu)的數(shù)據(jù)庫中集成數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)的共享成為當(dāng)今迫切需要解決的問題。實(shí)現(xiàn)異構(gòu)數(shù)據(jù)庫的數(shù)據(jù)共享,就必須能透明地訪問各個(gè)異構(gòu)數(shù)據(jù)庫,且對來自各個(gè)異構(gòu)數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行整合。本文提出的解決方案是在保持各個(gè)子系統(tǒng)的數(shù)據(jù)完整性和一致性的前提下,提供統(tǒng)一的接口訪問各數(shù)據(jù)庫,對異構(gòu)數(shù)據(jù)庫整合查詢,實(shí)現(xiàn)對多個(gè)異構(gòu)數(shù)據(jù)庫的信息統(tǒng)一查詢和統(tǒng)計(jì)分析,開發(fā)出實(shí)用、高效的異構(gòu)數(shù)據(jù)庫整合查詢系統(tǒng)。本文設(shè)計(jì)的系統(tǒng)采用B/S架構(gòu),分為應(yīng)用層、業(yè)務(wù)邏輯層、數(shù)據(jù)訪問層和數(shù)據(jù)層四個(gè)

3、層次。通過比較分析常見的三種異構(gòu)數(shù)據(jù)庫查詢方法,系統(tǒng)采用中間數(shù)據(jù)庫方式和中介模式實(shí)現(xiàn)對多個(gè)異構(gòu)數(shù)據(jù)庫的統(tǒng)一訪問。中間數(shù)據(jù)庫選用SqlServer,鏈接服務(wù)器是該數(shù)據(jù)庫的一個(gè)組件,使用它訪問其他異構(gòu)數(shù)據(jù)庫,從而實(shí)現(xiàn)基于中間數(shù)據(jù)庫的分布式查詢;中介模式中,數(shù)據(jù)庫的連接、訪問采用ADO.NET技術(shù),查詢的數(shù)據(jù)以XML文檔返回,即以XML作為中間數(shù)據(jù)源,建立數(shù)據(jù)庫到XML的映射以及XML到數(shù)據(jù)庫的映射,XML的平臺無關(guān)性,屏蔽了各個(gè)成員系統(tǒng)間數(shù)據(jù)描述的差異。查詢結(jié)果以自定義報(bào)表形式表現(xiàn),數(shù)據(jù)輸出采用XML、CSV等文檔。當(dāng)該系統(tǒng)需要訪問新的異構(gòu)數(shù)據(jù)庫時(shí),只需向系統(tǒng)添加被訪問數(shù)據(jù)庫相關(guān)的鏈接信息即可,因

4、此,系統(tǒng)具有很好的擴(kuò)展性。本文針對數(shù)據(jù)庫的連接和訪問,以及整合查詢的具體實(shí)現(xiàn)等關(guān)鍵技術(shù)做了詳細(xì)的闡述。關(guān)鍵字:異構(gòu)數(shù)據(jù)庫;整合查詢;中介模式;中間數(shù)據(jù)庫I異構(gòu)數(shù)據(jù)庫整合查詢系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)AbstractAlong with the development of computer technology, many enterprises andinstitutions operate based on informationization, they store a lot of data in manydifferent database management systems and dif

5、ferent formats because of the data andthe time of systems building is different. So there exists many heterogenous databases,and the subsystems are separated as many “data-islands”. Nowaday requirement ofdata processing is more frequently than before, it is very normal to get data frommany heterogen

6、eous databases and make dicision after the data analysis. Sointegrating data from distributed and heterogeneous databases to realize informationsharing is an urgent problem needed be resolved.To realize the data sharing, we must access the data in heterogenous databasestransparently and integrate th

7、em then. The scheme brought forward in the paper iskeeping the data integrality and consistency, then providing a uniform interface toaccess databases, and developing a convenient and efficient system to realize the dataquery and integration.The system designed adopts B/S mode, and consists of four

8、lays: applicationlayer, business logic layer, data access layer, data layer. After comparing andanalysing the three normal methods of heterogeneous database query,the systemadopts two modesmiddle database mode and mediator schema to realize dataaccess. The middle database is Sql Server, we can acces

9、s other databases by itscomponent, linkserver to realize the first mode; in the second mode, the databasesconnection and access is reached by ADO.NET, and the data got is returned in XMLformat. XML is used as middle datasource, then build the mapping between XML anddatabases. Because of platform ind

10、ependence of XML, it can shield the difference ofdata description in subsystems. The result can be represented in user-defined reportforms, and data output in XML, CSV formats. When accessing a new database, weonly need to add new link information about the database,so the system has a goodexpansibl

11、e.The paper emphasis on key technology of database integration and query afterdatabase connection and accessing.Key words: heterogenous databases; integration query; mediator schema; middledatabaseII目錄目錄摘要.IAbstract.II目錄. III圖表目錄. V第一章 緒論. 11.1 研究背景及意義 . 11.2 異構(gòu)數(shù)據(jù)庫綜述 . 11.2.1 分布式異構(gòu)數(shù)據(jù)庫概念. 11.2.2 異構(gòu)數(shù)據(jù)

12、庫的特點(diǎn). 21.2.3 異構(gòu)數(shù)據(jù)庫集成. 21.3 國內(nèi)外發(fā)展情況 . 41.4 本文的研究內(nèi)容 . 51.5 本文的組織結(jié)構(gòu) . 61.6 本章小結(jié) . 6第二章 相關(guān)技術(shù)綜述. 72.1 Ajax 技術(shù).72.2 ASP.NET 開發(fā)環(huán)境. 92.3 OLE DB 技術(shù) . 92.4 ADO.NET 介紹 . 112.5 常見的異構(gòu)數(shù)據(jù)庫查詢方法 . 132.5.1 數(shù)據(jù)倉庫查詢. 132.5.2 聯(lián)邦數(shù)據(jù)庫模式查詢. 132.5.3 中介模式(mediated schema)查詢 . 142.6 本章小結(jié) . 15第三章 系統(tǒng)結(jié)構(gòu)設(shè)計(jì)和運(yùn)行流程. 16III異構(gòu)數(shù)據(jù)庫整合查詢系統(tǒng)的設(shè)計(jì)

13、與實(shí)現(xiàn)3.1 系統(tǒng)設(shè)計(jì)描述 . 163.1 體系結(jié)構(gòu) . 163.2 查詢方法的選擇 . 183.3 運(yùn)行流程 . 193.4 基于角色訪問的控制策略 . 193.5 本章小結(jié) . 20第四章 中間數(shù)據(jù)庫模式查詢的設(shè)計(jì)與實(shí)現(xiàn). 214.1 功能模塊和運(yùn)行流程 . 214.2 數(shù)據(jù)庫設(shè)計(jì) . 234.3 鏈接服務(wù)器的建立 . 244.4 數(shù)據(jù)表選擇 . 274.5 邏輯表的配置 . 284.5.1 邏輯表的生成. 284.5.2 邏輯表中新字段的構(gòu)建. 304.6 自定義報(bào)表打印. 354.7 Ajax 技術(shù)的應(yīng)用.364.8 本章小結(jié). 37第五章 中介模式查詢的設(shè)計(jì)與實(shí)現(xiàn). 385.1 功能

14、模塊和運(yùn)行流程 . 385.2 查詢模型設(shè)計(jì) . 405.3 數(shù)據(jù)源信息的描述 . 425.4 查詢的分解及子查詢轉(zhuǎn)換 . 435.5 查詢結(jié)果的轉(zhuǎn)換和集成 . 455.6 兩種查詢模式的比較 . 485.7 本章小結(jié) . 49第六章 結(jié)束語. 50參考文獻(xiàn). 51致謝. 54IV目錄研究生期間發(fā)表的論文. 55圖表目錄圖 2-1 Ajax應(yīng)用與傳統(tǒng)Web應(yīng)用模式比較 . 8圖 2-2 OLE DB體系結(jié)構(gòu) . 10圖 2-3 ADO.NET體系結(jié)構(gòu) . 12圖 2-4 數(shù)據(jù)倉庫的模式 . 13圖 2-5 聯(lián)邦數(shù)據(jù)庫模式 . 14圖 2-6 中介模式 . 14圖 3-1 系統(tǒng)體系結(jié)構(gòu) . 17

15、圖 3-2 基于角色訪問控制的數(shù)據(jù)庫設(shè)計(jì) . 19圖 4-1 中間數(shù)據(jù)庫查詢模塊圖 . 21圖 4-2 中間數(shù)據(jù)庫模式查詢數(shù)據(jù)流程圖 . 22圖 4-3 中間數(shù)據(jù)庫查詢模塊的數(shù)據(jù)庫設(shè)計(jì) . 23圖 4-4 邏輯表生成 . 28表 4-1 學(xué)生信息表 . 29表 4-2 某課程成績表 . 29表 4-3 學(xué)生成績表 . 29表 4-4 各個(gè)運(yùn)算符優(yōu)先級 . 32圖 4-5 中綴表達(dá)式轉(zhuǎn)換為后綴表達(dá)式的算法 . 34圖 5-1 中介系統(tǒng)模式查詢模塊圖 . 38圖 5-2 中介系統(tǒng)模式查詢數(shù)據(jù)流程圖 . 39圖 5-3 子查詢結(jié)果轉(zhuǎn)換成XML文檔流程圖 . 45圖 5-4 多表無關(guān)聯(lián)子查詢結(jié)果集成算

16、法流程圖 . 47圖 5-5 關(guān)聯(lián)子查詢結(jié)果集成流程圖 . 47V第一章 緒論第一章 緒論1.1 研究背景及意義隨著數(shù)據(jù)庫技術(shù)的發(fā)展以及數(shù)據(jù)庫應(yīng)用領(lǐng)域的不斷擴(kuò)大,傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)不能滿足現(xiàn)代數(shù)據(jù)處理的要求,但已有的數(shù)據(jù)庫系統(tǒng)也不可能全部丟棄,因此異構(gòu)數(shù)據(jù)庫成為可能。企業(yè)或單位的內(nèi)部各個(gè)部門根據(jù)自身的應(yīng)用需要,選擇合適的數(shù)據(jù)庫管理系統(tǒng)。如企業(yè)的生產(chǎn)部門可能用一個(gè)層次型數(shù)據(jù)庫;人事部門可能會用一個(gè)關(guān)系型數(shù)據(jù)庫系統(tǒng)記錄員工的資料;采購部門可能選擇網(wǎng)絡(luò)數(shù)據(jù)庫等等,這樣就會形成企業(yè)內(nèi)部存在多種數(shù)據(jù)庫管理系統(tǒng)的情況,即異構(gòu)數(shù)據(jù)庫。這些分散的不同業(yè)務(wù)的數(shù)據(jù)管理系統(tǒng),雖然能夠滿足業(yè)務(wù)數(shù)據(jù)存儲和管理需要,但在作

17、某一個(gè)決策時(shí),可能需要訪問分布在網(wǎng)絡(luò)不同位置上的多個(gè)數(shù)據(jù)管理系統(tǒng),這就提出了數(shù)據(jù)整合和數(shù)據(jù)共享訪問的要求。企業(yè)和企業(yè)之間同樣也存在異構(gòu)數(shù)據(jù)庫的問題。企業(yè)之間為了實(shí)現(xiàn)優(yōu)勢互補(bǔ),加強(qiáng)各自企業(yè)的競爭力,節(jié)省低效率投資,企業(yè)在產(chǎn)品開發(fā)過程需要通力合作。但各個(gè)企業(yè)使用的數(shù)據(jù)庫系統(tǒng)的不同,使各企業(yè)的數(shù)據(jù)庫系統(tǒng)之間難以進(jìn)行數(shù)據(jù)交換和訪問,每個(gè)系統(tǒng)形成了一個(gè)個(gè)“信息孤島”。 信息孤島將各應(yīng)用系統(tǒng)中的數(shù)據(jù)封鎖在自身的數(shù)據(jù)庫中,無法實(shí)現(xiàn)信息的共享,資源不能充分發(fā)揮應(yīng)有的作用,使用效率低下,嚴(yán)重阻礙企業(yè)信息化建設(shè)的發(fā)展。針對異構(gòu)數(shù)據(jù)庫問題,本文解決的問題辦法是:保持原有數(shù)據(jù)庫系統(tǒng)不變,構(gòu)建異構(gòu)數(shù)據(jù)庫整合查詢系統(tǒng),實(shí)

18、現(xiàn)數(shù)據(jù)的整合和透明訪問,還可以在該系統(tǒng)的基礎(chǔ)上開發(fā)新的應(yīng)用系統(tǒng)。通過這種方式,保護(hù)并充分利用了原有子系統(tǒng)中的數(shù)據(jù),還快速方便地將各數(shù)據(jù)庫系統(tǒng)和應(yīng)用系統(tǒng)連接到整合查詢系統(tǒng)。1.2 異構(gòu)數(shù)據(jù)庫綜述1.2.1 分布式異構(gòu)數(shù)據(jù)庫概念分布式異構(gòu)數(shù)據(jù)庫 1(Distributed Heterogeneous Database, DHD)是1異構(gòu)數(shù)據(jù)庫整合查詢系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)指分布在不同地理位置的異構(gòu)數(shù)據(jù)庫資源,異構(gòu)的是操作系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)或數(shù)據(jù)庫內(nèi)部表結(jié)構(gòu)等。而異構(gòu)數(shù)據(jù)庫系統(tǒng)是相關(guān)的多個(gè)數(shù)據(jù)庫系統(tǒng)的集合,可以實(shí)現(xiàn)各個(gè)數(shù)據(jù)庫數(shù)據(jù)的共享和透明訪問。每個(gè)數(shù)據(jù)庫系統(tǒng)擁有自己的DBMS,異構(gòu)數(shù)據(jù)庫系統(tǒng)的各個(gè)組成

19、部分具有自身的自治性,在實(shí)現(xiàn)數(shù)據(jù)共享的同時(shí),各個(gè)數(shù)據(jù)庫系統(tǒng)仍保留自己完整性控制和安全性控制。在異構(gòu)數(shù)據(jù)庫互連系統(tǒng)中,組成整個(gè)系統(tǒng)的各個(gè)常規(guī)數(shù)據(jù)庫稱為局部數(shù)據(jù)庫,將以這些局部數(shù)據(jù)庫為基礎(chǔ)所形成的虛擬的數(shù)據(jù)庫稱為全局?jǐn)?shù)據(jù)庫 2-4。分布式異構(gòu)數(shù)據(jù)庫系統(tǒng)中,用戶對任何數(shù)據(jù)庫的操作就如同在本地執(zhí)行,不必關(guān)心其數(shù)據(jù)模型、物理位置等細(xì)節(jié),它屏蔽了各種數(shù)據(jù)庫在物理上和邏輯上的差異,使用戶用自己所熟悉的一種數(shù)據(jù)操作語言就能夠操縱任一種數(shù)據(jù)庫 異構(gòu)數(shù)據(jù)庫的特點(diǎn)異構(gòu)數(shù)據(jù)庫的異構(gòu)特征6,主要體現(xiàn)在系統(tǒng)和語義的異構(gòu)方面7-8:1數(shù)據(jù)庫概念模式的異構(gòu):分層次、網(wǎng)狀、關(guān)系和面向?qū)ο笏姆N。2數(shù)據(jù)庫物理摸式的

20、異構(gòu):概念模式相同,但數(shù)據(jù)存儲結(jié)構(gòu)不同。如 Oracle與 Informix 都是關(guān)系型數(shù)據(jù)庫,它們的存儲結(jié)構(gòu)卻不同。3系統(tǒng)控制方式的異構(gòu):有集中式與分布式兩種。4計(jì)算機(jī)平臺的異構(gòu):宿主機(jī)硬件的區(qū)別,從巨、大、中、小型機(jī)到工作站,微機(jī)以至手持機(jī)類型繁多。5操作系統(tǒng)平臺的異構(gòu):如 Unix, Windows. Linux 等。6網(wǎng)絡(luò)連接的異構(gòu):不同種類,拓?fù)浣Y(jié)構(gòu)的網(wǎng)絡(luò)連接,如以太網(wǎng)總線結(jié)構(gòu)與令牌環(huán)結(jié)構(gòu)的不同等。1.2.3 異構(gòu)數(shù)據(jù)庫集成各種數(shù)據(jù)庫管理系統(tǒng) (DBMS)相互之間存在著很大的不同。這些DBMS采用不同的數(shù)據(jù)存儲格式存取數(shù)據(jù),采用不同的管理方法管理數(shù)據(jù)。從用戶的角度來看,希望屏蔽異構(gòu)數(shù)

21、據(jù)庫各個(gè)方面的異構(gòu)特性,可以統(tǒng)一的表示、存儲和管理各2第一章 緒論種異構(gòu)數(shù)據(jù)。實(shí)現(xiàn)異構(gòu)數(shù)據(jù)庫集成后,異構(gòu)數(shù)據(jù)庫的數(shù)據(jù)對用戶來說就是統(tǒng)一的和無差異的。傳統(tǒng)的數(shù)據(jù)庫集成技術(shù)9主要有:數(shù)據(jù)倉庫技術(shù),聯(lián)邦數(shù)據(jù)庫技術(shù)和中間件技術(shù)。數(shù)據(jù)倉庫技術(shù)的實(shí)現(xiàn),是需要建立一個(gè)存儲數(shù)據(jù)的數(shù)據(jù)倉庫,將局部數(shù)據(jù)源的數(shù)據(jù)裝載到數(shù)據(jù)倉庫,供用戶查詢;聯(lián)邦數(shù)據(jù)庫系統(tǒng)(federated databasesystem)分緊耦合FDBS和松耦合FDBS兩種:緊耦合FDBS有一個(gè)或幾個(gè)統(tǒng)一的模式,松耦合FDBS沒有統(tǒng)一的模式,但它提供了一些查詢數(shù)據(jù)庫的統(tǒng)一語言;中間件技術(shù)是在數(shù)據(jù)庫系統(tǒng)和應(yīng)用系統(tǒng)之間構(gòu)建中間層,數(shù)據(jù)庫的操作由中間層完

22、成,中間層為應(yīng)用層提供完全一致的接口,應(yīng)用系統(tǒng)訪問多數(shù)據(jù)庫如同訪問一個(gè)數(shù)據(jù)庫一樣。各種新興數(shù)據(jù)集成技術(shù)也不斷被應(yīng)用到分布式數(shù)據(jù)庫集成系統(tǒng)中來,如基于XML技術(shù)的數(shù)據(jù)庫集成10、基于CORBA的數(shù)據(jù)庫集成11-12、基于DOM的數(shù)據(jù)庫集成13、基于Web service技術(shù)的數(shù)據(jù)庫集成等14。XML具有巨大的伸縮性與靈活性,使用者可以根據(jù)需要自行定義的標(biāo)記來描述各種數(shù)據(jù),使數(shù)據(jù)表示的內(nèi)容更豐富、更復(fù)雜多樣。XML具有良好的數(shù)據(jù)存儲格式、可擴(kuò)展性、高度的結(jié)構(gòu)化、便于網(wǎng)絡(luò)傳輸?shù)葍?yōu)點(diǎn)15,用它對數(shù)據(jù)源的定義、描述字、數(shù)據(jù)源的創(chuàng)建等相關(guān)信息進(jìn)行封裝, XML作為數(shù)據(jù)交換的中介給數(shù)據(jù)庫集成帶來極大的靈活性

23、?;贑ORBA的異構(gòu)數(shù)據(jù)庫集成技術(shù),可以為最終用戶提供一個(gè)統(tǒng)一的友好的數(shù)據(jù)庫應(yīng)用接口,屏弊掉各種網(wǎng)絡(luò)中的異構(gòu)成分,CORBA分布計(jì)算技術(shù)是由絕大多數(shù)分布計(jì)算平臺廠商所支持和遵循的系統(tǒng)規(guī)范技術(shù),具有模型完整、先進(jìn)、獨(dú)立于系統(tǒng)平臺和開發(fā)語言及被廣泛支持的特點(diǎn),已逐漸成為分布計(jì)算技術(shù)的標(biāo)準(zhǔn)。DCOM(Microsoft Distributed Component Object Model)是一系列微軟的概念和程序接口,利用這個(gè)接口,客戶端程序?qū)ο竽軌蛘埱髞碜跃W(wǎng)絡(luò)中另一臺計(jì)算機(jī)上的服務(wù)器程序?qū)ο?,而且不論兩臺計(jì)算機(jī)是運(yùn)行在局域網(wǎng)、廣域網(wǎng)、還是 Internet上。它處理網(wǎng)絡(luò)協(xié)議的低層次的細(xì)節(jié)問題,但

24、它要求服務(wù)客戶端與系統(tǒng)提供的服務(wù)本身之間必須進(jìn)行緊密耦合?;赪eb service的異構(gòu)數(shù)據(jù)庫集成系統(tǒng)具有完好封裝、松散耦合、高度可集成能力等特性。Web Service方法為數(shù)據(jù)集成提供了靈活的集成方式,為快速新增和部署新數(shù)據(jù)源提供了方便。3異構(gòu)數(shù)據(jù)庫整合查詢系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)1.3 國內(nèi)外發(fā)展情況數(shù)據(jù)庫技術(shù)產(chǎn)生于 20 世紀(jì) 60 年代中期,70 年代中期就有異構(gòu)數(shù)據(jù)庫方面的研究。數(shù)據(jù)庫系統(tǒng)在 80 年代隨著關(guān)系數(shù)據(jù)庫模型的發(fā)展而得到快速發(fā)展,同時(shí),異構(gòu)數(shù)據(jù)庫系統(tǒng)的研究也成為重要研究課題。前期主要是多種數(shù)據(jù)庫系統(tǒng)的研究16-18。多庫系統(tǒng)主要分為三大類:一是全局式多庫系統(tǒng),各局部庫問耦合較

25、為緊密,采用物理上分布、邏輯上集中的系統(tǒng)結(jié)構(gòu),各局部數(shù)據(jù)庫站點(diǎn)必須密切配合,維護(hù)全局完整性,缺點(diǎn)是局部庫缺少自治性,難以管理和集成;二是聯(lián)邦Federation)數(shù)據(jù)庫系統(tǒng),概念是由Mcleod等人提出19-20,采用的是物理和邏輯上都是分布的系統(tǒng)結(jié)構(gòu),節(jié)點(diǎn)有自身的聯(lián)邦模式,不再受制于全局模式,自治性得到加強(qiáng);三是多庫語言系統(tǒng)21,其概念由Litwin等人提出,系統(tǒng)結(jié)構(gòu)沒有統(tǒng)一的全局模式,也無局部的聯(lián)邦模式,只提供多庫訪問語言供用戶使用,全局策略完全由用戶維護(hù)。目前,已經(jīng)從多庫集成轉(zhuǎn)向多數(shù)據(jù)源集成。異構(gòu)數(shù)據(jù)源集成與多庫系統(tǒng)相比,擴(kuò)大了數(shù)據(jù)集成的范圍。多庫系統(tǒng)主要集成數(shù)據(jù)庫中的數(shù)據(jù),數(shù)據(jù)一般具有

26、固定的數(shù)據(jù)模式,而異構(gòu)數(shù)據(jù)源集成系統(tǒng)除集成結(jié)構(gòu)化 (structured)的數(shù)據(jù)外,還需集成來自WWW等數(shù)據(jù)源的半結(jié)構(gòu)化(semi-structured)數(shù)據(jù)22等。有關(guān)多庫系統(tǒng)和多數(shù)據(jù)源集成,很多公司、研究機(jī)構(gòu)和大學(xué)都有研究通用的集成系統(tǒng)。代表性的有:(1) OLE DB23Microsoft 公司的 OLE DB 是為數(shù)據(jù)庫和非數(shù)據(jù)庫中的數(shù)據(jù)提供統(tǒng)一的存取界面。它將表格型數(shù)據(jù)看成“行集”對象,所以它不適合表示非表格式和自描述的數(shù)據(jù)。(2) Garlic24Garlic 是由 IBM 公司 Almaden 研究中心研制。Garlic 是一個(gè)多媒體信息系統(tǒng),采用傳統(tǒng)的面向?qū)ο髷?shù)據(jù)模型作為公共數(shù)

27、據(jù)模型,將存放于多個(gè)數(shù)據(jù)源中的傳統(tǒng)數(shù)據(jù)和多媒體數(shù)據(jù)集成為一個(gè)全局模式。系統(tǒng)處理的是多媒體數(shù)據(jù),很難用數(shù)據(jù)模式來詳細(xì)描述,所以不能作為一種通用的數(shù)據(jù)集成方法。(3) YAT25BELL 實(shí)驗(yàn)室和 INRIA 共同開發(fā)的。它是基于 wrapper/mediator 體系結(jié)構(gòu),4第一章 緒論YAT 提供了一種基于規(guī)則的表達(dá)能力很強(qiáng)的框架結(jié)構(gòu),能夠?qū)⒂成浔硎緸橐话愕臉渥儞Q。YAT 能夠集成多種異構(gòu)數(shù)據(jù)源:從傳統(tǒng)的關(guān)系數(shù)據(jù)庫系統(tǒng)到半結(jié)構(gòu)化的Web 存儲等。主要特點(diǎn)是:1) XML 代數(shù),介紹了一種可操作的代數(shù)模型,代數(shù)的表達(dá)能力足以囊括現(xiàn)有半結(jié)構(gòu)化的 XML 或結(jié)構(gòu)化語言的大部分語義;2)源描述語言,用

28、一種完全的方式來展示如何使用 XML 代數(shù)包裝全文本查詢或結(jié)構(gòu)化查詢語言 (如 OQL 或 SQL)。(4) TSIMMIS它是由斯坦福大學(xué)研制的異構(gòu)數(shù)據(jù)源集成系統(tǒng),采用自描述的數(shù)據(jù)模型OEM(Object Exchange Model)作為集成系統(tǒng)的公共數(shù)據(jù)模型,用基于邏輯的語言 MSL(Mediator Specification Language)作為集成系統(tǒng)的視圖定義語言。該系統(tǒng)將各個(gè)局部數(shù)據(jù)庫中的數(shù)據(jù)轉(zhuǎn)換成 OEM 模型,靈活地處理數(shù)據(jù)之間的異構(gòu)性。但是該系統(tǒng)的查詢語言的語法繁雜,只有非常熟悉系統(tǒng)的專業(yè)人士查詢。(5)Panorama26-27該中間件系統(tǒng)由華中科技大學(xué)設(shè)計(jì)和實(shí)現(xiàn),給

29、出了適合多種異構(gòu)數(shù)據(jù)庫數(shù)據(jù)集成的基于 CORBA 的體系結(jié)構(gòu)、模式集成方法、查詢分解算法以及查詢優(yōu)化方法。(6)LSZ南京大學(xué)研制的 LSZ 異種網(wǎng)絡(luò),異種微型機(jī)和異種操作系統(tǒng)構(gòu)成的分布式上運(yùn)行的異構(gòu)分布式數(shù)據(jù)庫,提供全局查詢語言、全局查詢優(yōu)化并由多節(jié)點(diǎn)組成的簇為出發(fā)點(diǎn),并行性能較好。1.4 本文的研究內(nèi)容數(shù)據(jù)集成主要是實(shí)現(xiàn)數(shù)據(jù)交換和數(shù)據(jù)共享,本文的研究重點(diǎn)是實(shí)現(xiàn)異構(gòu)數(shù)據(jù)庫的整合查詢,從而實(shí)現(xiàn)數(shù)據(jù)的統(tǒng)一訪問和共享。本文的研究內(nèi)容分為三大部分:(1) 異構(gòu)數(shù)據(jù)庫整合查詢系統(tǒng)體系結(jié)構(gòu)的設(shè)計(jì)和實(shí)現(xiàn);(2) 利用中間數(shù)據(jù)庫 Sql Server 訪問其他類型數(shù)據(jù)庫。在 Sql Server 分布式查詢

30、框架中,統(tǒng)一采用 OLE DB 訪問數(shù)據(jù)庫,因此每個(gè)數(shù)據(jù)庫就是 OLE DB數(shù)據(jù)源。Sql Server 的鏈接服務(wù)器組件訪問 OLE DB 數(shù)據(jù)源,數(shù)據(jù)庫關(guān)系引擎在5異構(gòu)數(shù)據(jù)庫整合查詢系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)任何 OLE DB 數(shù)據(jù)源上,打開簡單 OLE DB 行集,從而實(shí)現(xiàn)分布式查詢。(3)采用中介系統(tǒng)模式,將基于總體視圖的查詢分解成各個(gè)數(shù)據(jù)源的子查詢,通過 ADO.NET 訪問數(shù)據(jù)庫,各個(gè)子查詢結(jié)果以 XML 形式返回,最終合并子查詢結(jié)果并以 XML 文檔的方式提供給用戶。1.5 本文的組織結(jié)構(gòu)本文的章節(jié)安排如下:第一章 緒論 介紹論文的研究背景和意義,以及該研究領(lǐng)域的研究現(xiàn)狀和本文的主要研究內(nèi)

31、容。第二章 相關(guān)技術(shù)綜述 介紹研究涉及到的相關(guān)技術(shù)和開發(fā)工具,以及常見異構(gòu)數(shù)據(jù)庫查詢的方法。第三章 系統(tǒng)結(jié)構(gòu)設(shè)計(jì)和運(yùn)行流程 介紹了系統(tǒng)的總體框架的設(shè)計(jì)以及運(yùn)行流程。第四章 中間數(shù)據(jù)庫模式查詢的設(shè)計(jì)與實(shí)現(xiàn) 介紹了如何建立鏈接服務(wù)器,詳細(xì)介紹了通過鏈接服務(wù)器實(shí)現(xiàn)分布式查詢的過程。第五章 中介模式查詢的設(shè)計(jì)與實(shí)現(xiàn) 介紹了設(shè)計(jì)的查詢模型,并根據(jù)查詢模型實(shí)現(xiàn)查詢的分解和結(jié)果的集成。最后,對本課題研究的結(jié)論進(jìn)行了總結(jié),并對課題進(jìn)一步完善提出了構(gòu)想。1.6 本章小結(jié)本章介紹了研究的背景和意義,國內(nèi)外發(fā)展情況,以及異構(gòu)數(shù)據(jù)庫相關(guān)的概念,提出了本文的研究內(nèi)容,并對章節(jié)進(jìn)行了安排。6第二章 相關(guān)技術(shù)綜述第二章 相

32、關(guān)技術(shù)綜述2.1 Ajax 技術(shù)Ajax 的全稱是 asynchronous javascript and xml(異步 javascript 和 xml),它不是有一項(xiàng)新技術(shù),而是很多成熟技術(shù)的集合。Ajax 操作的基礎(chǔ)是 HTML 或者是XHTML,Ajax 的關(guān)鍵技術(shù)有:jvascript 腳本語言;XMLHttpRequest 對象;可擴(kuò)展標(biāo)記語言 XML;文檔對象模型 DOM;級聯(lián)樣式表技術(shù) CSS 等。以下簡單介紹一下相關(guān)技術(shù):(1)jvascript 腳本語言 在 Ajax 中,Javascript 已經(jīng)從后臺狀態(tài)完全轉(zhuǎn)移到了前臺,發(fā)揮著巨大的作用。它使 DOM,XHTML,XM

33、L 和 CSS 可以相互協(xié)作,并控制它們的行為。(2)XMLHttpRequest 對象 借助它在網(wǎng)頁的背后和瀏覽器進(jìn)行異步通信,而無需刷新整個(gè)頁面。該對象在 Javascript 中創(chuàng)建并使用,客戶端可以僅僅從服務(wù)器端獲取它需要的信息;通過與 DOM 和 CSS 的結(jié)合,就可以實(shí)現(xiàn)局部刷新的效果;通過該對象異步提交信息,用戶的輸入在后臺提交到服務(wù)器而無需刷新這個(gè)頁面。(3)可擴(kuò)展標(biāo)記語言(XML) XML 是一種標(biāo)記語言,它為跨平臺,跨領(lǐng)域的應(yīng)用提供了一種通信手段。在 Ajax 中,它以客戶端和服務(wù)器端通信載體的身份出現(xiàn)。(4)文檔對象模型(DOM)在 Ajax 中,使用 Javascript 可以訪問文檔中的所有結(jié)點(diǎn),即所有對象。通過改變這些對象的屬性,用戶可以控制頁面的局部行為,將動態(tài)獲取的數(shù)據(jù)插入到文檔中,實(shí)現(xiàn)局部刷新的目的。用戶還可以利用DOM 模型增加和刪除文檔結(jié)點(diǎn),實(shí)現(xiàn)界面元素的動態(tài)變化。(5)級聯(lián)樣式表技術(shù)(CSS) 在 Ajax 中,CSS 同樣擔(dān)當(dāng)著界面表現(xiàn)的重任。如果用 Javascript 操作標(biāo)記的屬性來控制其外觀,會使代碼更加復(fù)雜而且難以維護(hù),使用 CSS 能很好的解決這些

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論