分布式數(shù)據(jù)庫及其在飛機訂票系統(tǒng)的應(yīng)用_第1頁
分布式數(shù)據(jù)庫及其在飛機訂票系統(tǒng)的應(yīng)用_第2頁
分布式數(shù)據(jù)庫及其在飛機訂票系統(tǒng)的應(yīng)用_第3頁
分布式數(shù)據(jù)庫及其在飛機訂票系統(tǒng)的應(yīng)用_第4頁
分布式數(shù)據(jù)庫及其在飛機訂票系統(tǒng)的應(yīng)用_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、分布式數(shù)據(jù)庫及其在飛機訂票系統(tǒng)中的應(yīng)用 一、分布式數(shù)據(jù)庫系統(tǒng) 1、分布式數(shù)據(jù)庫概述 隨著傳統(tǒng)的數(shù)據(jù)庫技術(shù)日趨成熟、 計算機網(wǎng)絡(luò)技術(shù)的飛速發(fā)展和應(yīng)用范圍的擴大,以分布式為主要特征的數(shù)據(jù)庫系統(tǒng)的研究與開發(fā)受到人們的注意。分布式 數(shù)據(jù)庫是數(shù)據(jù)庫技術(shù)與網(wǎng)絡(luò)技術(shù)相結(jié)合的產(chǎn)物,在數(shù)據(jù)庫領(lǐng)域已形成一個分支。分布式數(shù)據(jù)庫的研究始于20世紀70年代中期。世界上第一個分布式數(shù)據(jù)庫系統(tǒng)SDD-促由美國計算機公司(CCA于1979年在DEa算機上實現(xiàn)。20世紀90年代以來,分布式數(shù)據(jù)庫系統(tǒng)進入商品化應(yīng)用階段,傳統(tǒng)的關(guān)系數(shù)據(jù)庫產(chǎn)品均發(fā)展成以計算機網(wǎng)絡(luò)及多任務(wù)操作系統(tǒng)為核心的分布式數(shù)據(jù)庫產(chǎn)品,同時分布式數(shù)據(jù)庫 逐步向客戶

2、機/服務(wù)器模式發(fā)展。 分布式數(shù)據(jù)庫的典型定義是:分布式數(shù)據(jù)庫是一個數(shù)據(jù)集合,這些數(shù)據(jù)在邏輯上屬于同一個系統(tǒng),但物理上卻分散在計算機網(wǎng)絡(luò)的若干站點上,并且要求網(wǎng) 絡(luò)的每個站點具有自治的處理能力,能執(zhí)行本地的應(yīng)用。每個站點的計算機還至少參與一個全局應(yīng)用的執(zhí)行。 2、DDB的優(yōu)缺點 1) DDB就點: (1)更適合分布式的管理與控制。分布式數(shù)據(jù)庫系統(tǒng)的結(jié)構(gòu)更適合具有地理分布特性的組織或機構(gòu)使用,允許分布在不同區(qū)域、不同級別的各個部門對其自身的數(shù)據(jù)實行局部控制。例如:實現(xiàn)全局數(shù)據(jù)在本地錄入、查詢、維護,這時由于計算機資源靠近用戶,可以降低通信代價,提高響應(yīng)速度,而涉及其他場地數(shù)據(jù)庫中的數(shù)據(jù)只是少量的,

3、從而可以大大減少網(wǎng)絡(luò)上的信息傳輸量;同時,局部數(shù)據(jù)的安全性也可以做得更好。 (2)具有靈活的體系結(jié)構(gòu)。集中式數(shù)據(jù)庫系統(tǒng)強調(diào)的是集中式控制,物理數(shù)據(jù)庫是存放在一個場地上的,由一個DBMS中管理。多個用戶只可以通過近程或遠程終端在多用戶操作系統(tǒng)支持下運行該DBMS共享集中是數(shù)據(jù)庫中的數(shù)據(jù)。而分布式數(shù)據(jù)庫系統(tǒng)的場地局部DBMS自治性,使得大部分的局部事務(wù)管理和控制都能就地解決,只有在涉及其他場地的數(shù)據(jù)時才需要通過網(wǎng)絡(luò)作為全局事務(wù)來管理。分布式DBMS以設(shè)計成具有不同程度的自治性,從具有充分的場地自治到幾乎是完全集中式的控制。 (3)系統(tǒng)經(jīng)濟,可靠性高,可用性好。與一個大型計算機支持一個大型的冀中是數(shù)

4、據(jù)庫在加一些進程和遠程終端相比,由超級微型計算機或超級小型計算機支持的分布式數(shù)據(jù)庫系統(tǒng)往往具有更高的性價比和實施靈活性。分布式系統(tǒng)比集 中式系統(tǒng)具有更高的可靠性和更好的可用性。如由于數(shù)據(jù)分布在多個場地并有許多復制數(shù)據(jù),在個別場地或個別通信鏈路發(fā)生故障時,不至于導致整個系統(tǒng)的崩潰,而且系統(tǒng)的局部故障不會引起全局失控。 (4)在一定條件下響應(yīng)速度加快。如果存取的數(shù)據(jù)在本地數(shù)據(jù)庫中,那末就可以由用戶所在的計算機來執(zhí)行,速度就快。 (5)可擴展性好,易于集成現(xiàn)有系統(tǒng),也易于擴充。 對于一個企業(yè)或組織,可以采用分布式數(shù)據(jù)庫技術(shù)在以建立的若干數(shù)據(jù)庫的基礎(chǔ)上開發(fā)全局應(yīng)用,對原有的局部數(shù)據(jù)庫系統(tǒng)作某些改動,形

5、成一個分布式系統(tǒng)。這比重建一個大型數(shù)據(jù)庫系統(tǒng)要簡單,既省時間,又省財力、物力。也可以通過增加場地數(shù)的辦法,迅速擴充已有的分布式數(shù)據(jù)庫系統(tǒng)。 2) DDB的缺點: (1)通信開銷較大,故障率高。例如,在網(wǎng)絡(luò)通信傳輸速度不高時,系統(tǒng)的響應(yīng)速度慢,與通信縣官的因素往往導致系統(tǒng)故障,同時系統(tǒng)本身的復雜性也容易導致較高的故障率。當故障發(fā)生后系統(tǒng)恢復也比較復雜,可靠性有待提高。 (2)數(shù)據(jù)的存取結(jié)構(gòu)復雜。一般來說,在分布時數(shù)據(jù)庫中存取數(shù)據(jù),比在集中時數(shù)據(jù)庫中存取數(shù)據(jù)更復雜,開銷更大。 (3)數(shù)據(jù)的安全性和保密性較難控制。在具有高度場地自治的分布時數(shù)據(jù)庫中,不同場地的局部數(shù)據(jù)庫管理員可以采用不同的安全措施,

6、但是無法保證全局 數(shù)據(jù)都是安全的。安全性問題式分布式系統(tǒng)固有的問題。因為分布式系統(tǒng)式通過通信網(wǎng)絡(luò)來實現(xiàn)分布控制的,而通信網(wǎng)絡(luò)本身卻在保護數(shù)據(jù)的安全性和保密性方面存在弱點,數(shù)據(jù)很容易被竊取。 分布式數(shù)據(jù)庫的設(shè)計、場地劃分及數(shù)據(jù)在不同場地的分配比較復雜。數(shù)據(jù)的劃分及分配對系統(tǒng)的性能、響應(yīng)速度及可用性等具有極大的影響。不同場地的通信速度與局部數(shù)據(jù)庫系統(tǒng)的存取部件的存取速度相比,是非常慢的。通信系統(tǒng)有較高的延遲,在CPlh處理通信信息的代價很高。分布式數(shù)據(jù)庫系統(tǒng)中要注意解決分布式數(shù)據(jù)庫的設(shè)計、查詢處理和優(yōu)化、事務(wù)管理及并發(fā)控制和目錄管理等問題。 3、數(shù)據(jù)分片 1)數(shù)據(jù)分片的類型: (1)水平分片:按一

7、定的條件把全局關(guān)系的所有元組劃分成若干不相交的子集,每個子集為關(guān)系的一個片段。 (2)垂直分片:把一個全局關(guān)系的屬性集分成若干子集,并在這些子集上作投影運算,每個投影稱為垂直分片。 (3)導出分片:又稱為導出水平分片,即水平分片的條件不是本關(guān)系屬性的條件,而是其他關(guān)系屬性的條件。 (4)混合分片:以上三種方法的混合??梢韵人椒制俅怪狈制蛳却怪狈制偎椒制?,或其他形式,但他們的結(jié)果是不相同的。 2)數(shù)據(jù)分片的條件: (1)完備性條件:必須把全局關(guān)系的所有數(shù)據(jù)映射到片段中,決不允許有屬于全局關(guān)系的數(shù)據(jù)卻不屬于它的任何一個片段。 (2)可重構(gòu)條件:必須保證能夠由同一個全局關(guān)系的各個片段來重

8、建該全局關(guān)系。對于水平分片可用并操作重構(gòu)全局關(guān)系;對于垂直分片可用聯(lián)接操作重構(gòu)全局關(guān)系。 (3)不相交條件:要求一個全局關(guān)系被分割后所得的各個數(shù)據(jù)片段互不重疊(對垂直分片的主鍵除外)。 物理映象 數(shù)據(jù)分片和數(shù)據(jù)分配概念的分離,形成了“數(shù)據(jù)分布獨立型”概念。 數(shù)據(jù)冗余的顯式控制。數(shù)據(jù)在各個場地的分配情況在分配模式中一目了然,便于系統(tǒng)管理。 局部DBM的獨立性。 這個特征也稱為“局部映射透明性”。 此特征允許我們在不考慮局部DBMS用數(shù)據(jù)模型的情況下,研究DDBI理的有關(guān)問題。 所謂全局應(yīng)用,要求使用通訊子系統(tǒng)在幾個站點存取數(shù)據(jù)。這個定義強調(diào)了分布式數(shù)據(jù)庫的兩個重要特點:分布性和邏輯相關(guān)性。 下圖

9、給出了典型的分布式數(shù)據(jù)庫系統(tǒng)(DDBSW物理結(jié)構(gòu)。其中在不同地域的3臺計算機分別控制本地數(shù)據(jù)庫及各終端用戶T;每臺計算機及其本地數(shù)據(jù)庫組成了此分布式數(shù)據(jù)庫的一個站點,各站點用通訊網(wǎng)絡(luò)連接起來,可以是局域網(wǎng)或廣域網(wǎng)。 DDBS勺物理結(jié)構(gòu)圖 下圖給出了分布式數(shù)據(jù)庫的邏輯結(jié)構(gòu)。其中,DDBMS分布式數(shù)據(jù)庫管理系統(tǒng),用來支持分布式數(shù)據(jù)庫的建立和維護。LDBMS局部數(shù)據(jù)庫管理系統(tǒng),也就是通常的集中4、體系結(jié)構(gòu) 31(場地1) S2(場地2) S3C場地3) R11 FN1 R1J R22 行 E田 R43 式數(shù)據(jù)庫管理系統(tǒng),用來管理本站的數(shù)據(jù)。 G0 ce II/L LMIMIJ|1s u- DDB的邏

10、輯結(jié)構(gòu) 5、DDB的安全性保證 分布式數(shù)據(jù)庫系統(tǒng)是物理上分散而邏輯上集中的數(shù)據(jù)庫系統(tǒng)。分布式數(shù)據(jù)庫 系統(tǒng)使用計算機網(wǎng)絡(luò)將地理位置分散而管理和控制需要不同程度集中的多個邏輯單位(通常是集中式數(shù)據(jù)庫)連接起來,共同組成一個統(tǒng)一的數(shù)據(jù)庫系統(tǒng)。因此,分布式數(shù)據(jù)庫系統(tǒng)可以看成是計算機網(wǎng)絡(luò)與數(shù)據(jù)庫系統(tǒng)的有機組合。 Internet的高速發(fā)展推動著分布式數(shù)據(jù)庫的發(fā)展,但同時也增加了分布式數(shù)據(jù)庫安全問題的復雜性。如何才能保證開放網(wǎng)絡(luò)環(huán)境中分布式數(shù)據(jù)庫系統(tǒng)的安 一般情況下,分布式數(shù)據(jù)庫面臨著兩大類安全問題:一類由單站點故障、網(wǎng)絡(luò)故障等自然因素引起,這類故障通??衫镁W(wǎng)絡(luò)提供的安全性來實現(xiàn)安全防護,所以說網(wǎng)絡(luò)安全

11、是分布式數(shù)據(jù)庫安全的基礎(chǔ);另一類來自本機或網(wǎng)絡(luò)上的人為攻擊,即黑客攻擊,目前黑客攻擊網(wǎng)絡(luò)的方式主要有竊聽、重發(fā)攻擊、假冒攻擊、越權(quán)攻擊、破譯密文等,針對這類安全隱患,有下列分布式數(shù)據(jù)庫安全關(guān)鍵技術(shù):身份驗證,保密通信,訪問控制,庫文加密。 6、分布式數(shù)據(jù)更新 (1)、分布式數(shù)據(jù)更新的原則和方法 在分布式數(shù)據(jù)庫系統(tǒng)中,為了獲得高查詢速度和高可靠性,以增加數(shù)據(jù)復制的代價來減少數(shù)據(jù)通信的代價,并增強系統(tǒng)的可靠性。但由于數(shù)據(jù)復制在多個站點上,一旦要對有多個副本的數(shù)據(jù)進行更新時,為保證數(shù)據(jù)庫的一致性,就必須 對這些數(shù)據(jù)的所有復制版本同時做同樣的更新。 先考慮單用戶情況。如果站點Ah有一個事務(wù)T對數(shù)據(jù)X!

12、行更新,若X在站點Bl,B2,Bn和C,C2,, On上有副本。 而現(xiàn)在站點Bl,B2,Bn與站點A連通, 但站點C,C2, ,C與站點A見在不連通,如下圖: 說明: (1)、RftB,B2,Bn和G,C2,,Cmh有副本; (2)、但只有站點B,B2,Bn與站點A1通而站點G,C2,,C與站點A暫時未連通。 此時,現(xiàn)在只能對連通站點B,B2,Bn上的X副本進行更新,而對未連通站點C,C2,,CJ:的X副本,只能當站點連通時才能進行更新。為此,要記錄對X所做的更新內(nèi)容和應(yīng)更新而未連通的站點,一旦其中的站點連通,就立刻進行相應(yīng)的更新。 (2)、分布式數(shù)據(jù)更新存在的問題 分布式數(shù)據(jù)更新,存在如下兩

13、個問題: 多站點各副本同時更新的不現(xiàn)實性:因為每一個站點某一時刻與站點A連通 的概率為P(P=1),同時更新要求每一個有X副本的站點與A連通,其概率為P*n,當n一00時,P*n一0。 當對未連通的站點上的副本要求更新的事務(wù)增多時,就不能保證在該站點A連通時,進行的更新是正確的。因為更新的順序就是站點連通的順序,但通常情況下,對數(shù)據(jù)的更新順序不會等于站點連通的順序。 7、分布式查詢 分布式數(shù)據(jù)庫系統(tǒng)中數(shù)據(jù)的分布導致查詢也具有了分布性,分布式查詢可能針對異類的OLEDB或ODBC數(shù)據(jù)源。SQLServer支持分布式查詢,即包括來自兩個或更多服務(wù)器數(shù)據(jù)的查詢,支持服務(wù)器間的檢索、更新和游標,并使用

14、MicrosoftDistributedTransactionCoordinator(MSDTC)保證節(jié)點間事務(wù) 語義,維護服務(wù)器間的安全。 分布式查詢處理負責將用戶查詢轉(zhuǎn)換為各站點上的物理查詢,并負責合并各 子查詢結(jié)果以得到最后結(jié)果。 在分布式環(huán)境下,查詢可以分為三種:局部查詢,遠程查詢和全局查詢。局部查詢是指在本站點上執(zhí)行查詢,即查詢本站點上存放的數(shù)據(jù)。遠程查詢是指在某個站點上執(zhí)行查詢,即查詢在網(wǎng)絡(luò)上的另一個戰(zhàn)點上存放的數(shù)據(jù)。 分布式查詢處理模型 二、一個具有三個站點的飛機訂票系統(tǒng) 1、飛機訂票業(yè)務(wù)概述 這個訂票系統(tǒng)維護一個分布在三個站點,即機場1,2,3上的數(shù)據(jù)庫。數(shù)據(jù)庫存儲有關(guān)機場規(guī)程

15、、班機調(diào)度、班機可用情況和旅客訂票等數(shù)據(jù)。假定各班機直接從出發(fā)機場到到達機場,中途不停站。其功能結(jié)構(gòu)圖為: 2、飛機訂票系統(tǒng)數(shù)據(jù)庫概念模式設(shè)計 機場表 編號 字段名稱 數(shù)據(jù)類型 說明 1 ID int 序號 2 name char 城巾 3 sign char 符號 4 right char 權(quán)力 5 area int 區(qū)域 6 safe char 安全規(guī)程 旅客登記 班機表 編號 字段名稱 數(shù)據(jù)類型 說明 1 ID int 號 2 number int 機號 3 date int 日期 4 seat char 可用座位 5 entry int 進入口 6 spicture char 座位圖

16、7 delay char 延期 8 gtime int 起飛時間 9 atime int 到達時間 旅客表 編號 字段名稱 數(shù)據(jù)類型 說明 1 ID int 序號 2 name char 旅客名字 3 tnumber Int 電話 4 snumber Int 座位號 5 tkind char 機票不蜂 6 pnumber Int 行李號 機場3、飛機訂票系統(tǒng)邏輯數(shù)據(jù)庫設(shè)計4、全局數(shù)據(jù)模式和全局操作模式 (1)飛機訂票數(shù)據(jù)庫的全局數(shù)據(jù)模式 (2)飛機訂票數(shù)據(jù)庫全局操作模式 訂票應(yīng)用(訂票圖),每當一新的旅客想預(yù)定一班機的機票時,就被激活。 在這種情況下,訪問數(shù)據(jù)庫中的起飛與到達的機場,起飛與到達

17、時間和班機日期。 這些屬性在圖中標以“k”,表明它們被用作訪問數(shù)據(jù)的關(guān)鍵詞。箭頭表明經(jīng)由 兩個關(guān)系“從”與“到”訪問從機場實體到班機實體的進行情況。實體左下角和右下角中的數(shù)字分別表示示例總數(shù)和由應(yīng)用選擇的平均示例數(shù)。一旦確定了班 機,就建立旅客實體的一個新的示例及聯(lián)系訂票的一個示例;關(guān)于旅客名字,電 話和種類的數(shù)據(jù)被寫入數(shù)據(jù)庫??捎米粚傩韵茸x后寫(“O,W;O表示輸出,v般示寫入)。 訂票圖 登記應(yīng)用(登記圖),凡旅客實際登機時,先執(zhí)行登記任務(wù)。根據(jù)旅客名字和班機號與日期, 查明有關(guān)旅客和班機示例 (“K”屬性) 。 然后, 顯示檢索種類信息 (O) ,并根據(jù)這一信息和班機座位圖,將一座位號

18、分配給旅客,寫入座位圖和座位號屬性,以及旅客的檢查行李號。 登記圖 種類o 日期 起飛應(yīng)用(從機場起飛圖),從機場起飛時的應(yīng)用,產(chǎn)生描述即將離開機場 的30架班機的起飛信息的報告并顯示在ne視器上。機場符號和當前日期與時間 用于標識所涉及的機場和班機實體。對各次班機,從數(shù)據(jù)庫中抽取班機號、起飛時間、出入口、延期和目的地機場符號與城市。使用“到”聯(lián)系來確定關(guān)于目的地機場的信息。 從機場起飛圖 5、分布設(shè)計 飛機訂票系統(tǒng)中的分布設(shè)計由四步組成:對每一實體選擇分片準則,確定非冗余分配,在非冗余分配上引入冗余,最后在每一站點上重新構(gòu)建局部模式。 (1)分片設(shè)計 機場實體由一個基于區(qū)域的水平分片(片段:機場1,機場2,機場3); 班機實體由一個基于起飛機場的導出水平分片(片段:班機1,班機2,班機3); 旅客實體由一個基于旅客預(yù)定的所有班機起飛的導出水平分片(片段:旅客 1,旅客2,旅客3,旅客4,旅客5,旅客6

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論