




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
分布式數(shù)據(jù)庫新第一頁,共67頁。主要(zhǔyào)內(nèi)容分布式數(shù)據(jù)庫系統(tǒng)概述(ɡàishù)分布式數(shù)據(jù)庫系統(tǒng)的體系結(jié)構分布式查詢處理客戶/服務器結(jié)構的分布式系統(tǒng)第二頁,共67頁。主要(zhǔyào)參考資料TEXTBOOK邵佩英分布式數(shù)據(jù)庫系統(tǒng)及其應用第二版科學出版社M.T.?zsuandP.Valduriez.PrinciplesofDistributedDatabaseSystems,2ndedition.PrenticeHall賈焰分布式數(shù)據(jù)庫技術.國防工業(yè)(ɡuófánɡɡōnɡyè)出版社周龍驤分布式數(shù)據(jù)庫管理系統(tǒng)實現(xiàn)技術科學出版社第三頁,共67頁。1分布式數(shù)據(jù)庫系統(tǒng)概述(ɡàishù)1.1集中式系統(tǒng)和分布式系統(tǒng)集中式數(shù)據(jù)庫管理系統(tǒng)的缺點:通信開銷大;系統(tǒng)的堅固性差;性能差;可擴充性差;設計、管理困難。分散式系統(tǒng):將數(shù)據(jù)庫分成多個,建立在多臺計算機上,數(shù)據(jù)庫的管理、應用程序的研制都是分開并相互獨立的,之間不存在數(shù)據(jù)通行聯(lián)系。分布式數(shù)據(jù)庫系統(tǒng)的特點(tèdiǎn):數(shù)據(jù)的分布性;統(tǒng)一性;透明性。統(tǒng)一性(兩個方面:數(shù)據(jù)在邏輯上的統(tǒng)一性和數(shù)據(jù)在管理上的統(tǒng)一性)分布式數(shù)據(jù)庫與集中式數(shù)據(jù)庫相比的優(yōu)點:堅固性好;可擴充性好;可改善性能;自治性好。第四頁,共67頁。與集中式數(shù)據(jù)(shùjù)庫相比,分布式DB具有:數(shù)據(jù)(shùjù)分布式的特點。與分散式數(shù)據(jù)(shùjù)庫相比,分布式DB具有:邏輯整體性的特點。第五頁,共67頁。背景(bèijǐng)數(shù)據(jù)庫系統(tǒng)+計算機網(wǎng)絡1.2分布式數(shù)據(jù)庫系統(tǒng)的定義(dìngyì)DB1DB1DB1計算機1計算機2計算機3通訊網(wǎng)絡T1T2T3T1T2T3T1T2T3第六頁,共67頁。1.2分布式數(shù)據(jù)庫系統(tǒng)的定義(dìngyì)一個分布式系統(tǒng)由通信網(wǎng)絡聯(lián)接(liánjiē)起來的結(jié)點的集合。每個結(jié)點都是擁有集中式數(shù)據(jù)庫的計算機系統(tǒng)。分布式數(shù)據(jù)庫的特點:數(shù)據(jù)庫中的數(shù)據(jù)不是存儲在同一場地,而是分布存儲在多個場地。第七頁,共67頁。1.2分布式數(shù)據(jù)庫系統(tǒng)的定義(dìngyì)分布性:數(shù)據(jù)存儲在不同場地上。與集中式數(shù)據(jù)庫不同。邏輯整體性:數(shù)據(jù)邏輯上是相互(xiānghù)聯(lián)系的一個整體。與分散在計算機網(wǎng)絡不同站點上的一組沒有相互(xiānghù)聯(lián)系的本地數(shù)據(jù)庫區(qū)別開來。第八頁,共67頁。1.2分布式數(shù)據(jù)庫系統(tǒng)的定義(dìngyì)物理上是分布(fēnbù)的,邏輯上是統(tǒng)一的一組數(shù)據(jù)庫的集合要素計算機網(wǎng)絡數(shù)據(jù)庫系統(tǒng)第九頁,共67頁。DB1DB1DB1計算機1計算機1計算機1通訊(tōngxùn)網(wǎng)絡北京(běijīnɡ)重慶(zhònɡqìnɡ)上海銀行系統(tǒng)訪問本地銀行數(shù)據(jù):局部應用通兌業(yè)務、轉(zhuǎn)賬業(yè)務:全局應用第十頁,共67頁。1.2分布式數(shù)據(jù)庫系統(tǒng)的定義(dìngyì)全局應用(yìngyòng):指涉及到兩個或兩個以上場地中數(shù)據(jù)庫的應用(yìngyòng)。網(wǎng)絡的每個站點具有獨立處理能力,可以執(zhí)行局部應用(yìngyòng),同時也能通過網(wǎng)絡執(zhí)行全局應用(yìngyòng)。分布式數(shù)據(jù)庫是由一組數(shù)據(jù)庫組成,這些數(shù)據(jù)庫分布在計算機網(wǎng)絡的不同站點上,邏輯上是屬于同一個系統(tǒng)的。第十一頁,共67頁。1.2分布式數(shù)據(jù)庫系統(tǒng)的定義(dìngyì)分布式數(shù)據(jù)庫包含兩個重要組成部分:分布式數(shù)據(jù)庫和分布式數(shù)據(jù)庫管理系統(tǒng)。分布式數(shù)據(jù)庫是計算機網(wǎng)絡環(huán)境中各場地上數(shù)據(jù)庫的邏輯集合(jíhé)。分布式數(shù)據(jù)庫管理系統(tǒng)是分布式數(shù)據(jù)庫系統(tǒng)中的一組軟件,它復雜管理分布環(huán)境下邏輯集成數(shù)據(jù)的存取、一致性、有效性和完備性。第十二頁,共67頁。1.3分布式數(shù)據(jù)庫系統(tǒng)的透明性位置透明性 用戶或應用程序不必了解它所使用的數(shù)據(jù)的存儲位置。舉例:銀行的借貸業(yè)務:要判斷的情況有5種。復制透明性 有些數(shù)據(jù)并不存在一個場地,可能重復存放在不同的場地。本地數(shù)據(jù)庫中也包含(bāohán)了外地數(shù)據(jù)庫中的數(shù)據(jù)。一個分布式系統(tǒng)有了這兩種透明性后,用戶看到的系統(tǒng)就如同一個集中式系統(tǒng)。第十三頁,共67頁。分布式數(shù)據(jù)庫系統(tǒng)具有(jùyǒu)以下特點數(shù)據(jù)的物理分布性數(shù)據(jù)的邏輯整體性數(shù)據(jù)的分布獨立性場地(chǎngdì)自治性場地(chǎngdì)之間的協(xié)調(diào)性數(shù)據(jù)冗余及冗余透明性事務管理的分布性第十四頁,共67頁。1.4分布式數(shù)據(jù)庫系統(tǒng)的優(yōu)缺點
DDBS的上述特點(tèdiǎn)決定它具有以下優(yōu)點:具有靈活的體系結(jié)構數(shù)據(jù)庫的使用單位組織上、地理上是分布的適應分布式管理和控制機構。經(jīng)濟性能優(yōu)越經(jīng)濟上和組織上的理由系統(tǒng)的可靠性高,可用性好。局部應用的響應速度快??蓴U展性好,易于集成(jíchénɡ)現(xiàn)有系統(tǒng)。既有數(shù)據(jù)庫互連,歷史繼承;數(shù)據(jù)資源共享系統(tǒng)規(guī)模逐步擴展增加結(jié)點,不影響現(xiàn)有系統(tǒng)運行第十五頁,共67頁。1.4分布式數(shù)據(jù)庫系統(tǒng)的優(yōu)缺點缺點:系統(tǒng)開銷(kāixiāo)大,主要花在通信部分。復雜的存取結(jié)構在集中式系統(tǒng)中是有效存取數(shù)據(jù)的重要基數(shù),但在分布式系統(tǒng)中不一定有效。數(shù)據(jù)的安全性和保密性較難處理。第十六頁,共67頁。1.5分布式數(shù)據(jù)庫系統(tǒng)的分類(fēnlèi)同構同質(zhì)數(shù)據(jù)庫每個場地都用同一類型的數(shù)據(jù)模型,并運行同一型號的DBMS同構異質(zhì)(yìzhì)數(shù)據(jù)庫每個場地都用同一類型的數(shù)據(jù)模型,但運行不同型號的DBMS異構數(shù)據(jù)庫場地上的數(shù)據(jù)庫系統(tǒng)不盡相同DBMS不同數(shù)據(jù)模型不同第十七頁,共67頁。練習(liànxí):1、與集中式DB相比,分布式DB具有()特點,與分散式DB相比,又具有()特點。2、區(qū)別系統(tǒng)是分散式還是分布式就是判定系統(tǒng)是否支持().3、在分布式DB中,用戶看到的系統(tǒng)如同一個集中式DBS,這是因為分布式系統(tǒng)具有()和()特點。4、如果各個場地都采用同類型(lèixíng)數(shù)據(jù)模型,但DBMS不同型號,這種系統(tǒng)屬于()型DBMS.1、數(shù)據(jù)分布性,邏輯整體性2、全局應用3、位置(wèizhi)透明性,復制透明性4、同構異質(zhì)型DDBS.第十八頁,共67頁。數(shù)據(jù)庫分布式的管理-在技術上引起(yǐnqǐ)新問題是由一個節(jié)點來統(tǒng)一管理各分數(shù)據(jù)庫呢?還是各節(jié)點在必要時,都挺身而出代行管理的職能呢?這是集中與分散的問題。每個節(jié)點的數(shù)據(jù)只在本節(jié)點保留一份呢,還是存儲備份于其他各節(jié)點以防數(shù)據(jù)的破壞丟失呢?這是可靠性與節(jié)約(jiéyuē)之間的矛盾。當數(shù)據(jù)庫操作涉及多個分數(shù)據(jù)庫上的數(shù)據(jù)時,應該把這些數(shù)據(jù)傳送到哪個節(jié)點上去進行操作最佳呢?這是運籌帷幄的優(yōu)化問題,等等。第十九頁,共67頁。關鍵問題分布式系統(tǒng)實現(xiàn)考慮的核心問題:盡量將網(wǎng)絡(wǎngluò)的使用減到最小,即盡量縮減消息的數(shù)量和大小。具體涉及到:分布數(shù)據(jù)庫設計分布查詢處理分布目錄管理分布并發(fā)控制分布死鎖管理分布DDBMS的可靠性操作系統(tǒng)的支持-如何提供一致的操作系統(tǒng)支持第二十頁,共67頁。2分布式數(shù)據(jù)庫系統(tǒng)的體系結(jié)構2.1分布式數(shù)據(jù)存儲(1)數(shù)據(jù)分配數(shù)據(jù)分配是指數(shù)據(jù)在計算機網(wǎng)絡各場地(chǎngdì)上的分配策略。集中式:所有數(shù)據(jù)均安排在同一個場地(chǎngdì)上。分割式:所有數(shù)據(jù)只有一份,分布被安置在若干個場地(chǎngdì)。全復制式:數(shù)據(jù)在每個場地(chǎngdì)重復存儲?;旌鲜剑簲?shù)據(jù)庫分成若干可相交的子集,每一子集安置在一個或多個場地(chǎngdì)上,但是每一場地(chǎngdì)未必保存全部數(shù)據(jù)。第二十一頁,共67頁。分布式數(shù)據(jù)(shùjù)存儲(2)數(shù)據(jù)分片:分布式數(shù)據(jù)庫中的數(shù)據(jù)可以被分割和復制在物理場地(chǎngdì)的各個物理數(shù)據(jù)庫中。優(yōu)點將關系分片,有利于按用戶需求組織數(shù)據(jù)的分布。如產(chǎn)品→(內(nèi)銷產(chǎn)品,出口產(chǎn)品)。分片方式水平分片垂直分片導出分片混合分片第二十二頁,共67頁。分布式數(shù)據(jù)(shùjù)存儲第二十三頁,共67頁。第四十六頁,共67頁。⒈把關系EMPLOYEE和DEPARTMENT分布從場地1和場地2傳到場地3,然后在場地3站進行(jìnxíng)查詢傳送(chuánsònɡ)時間T=(104100+400000)/104=140s復雜的存取結(jié)構在集中式系統(tǒng)中是有效存取數(shù)據(jù)的重要基數(shù),但在分布式系統(tǒng)中不一定有效。定義各種分片時必須遵守下面三個條件:fromEMPLOYEE,DEPARTMENT2分布式數(shù)據(jù)庫系統(tǒng)的體系結(jié)構是由一個節(jié)點來統(tǒng)一管理各分數(shù)據(jù)庫呢?還是各節(jié)點在必要時,都挺身而出代行管理的職能呢?這是集中與分散的問題。4分布式數(shù)據(jù)庫系統(tǒng)的優(yōu)缺點⒉把關系EMPLOYEE傳送到場地2,在場地2作聯(lián)接,再把操作結(jié)構(jiégòu)從場地2傳到場地3:第四十一頁,共67頁。第六十三頁,共67頁。RS=R'S4客戶(kèhù)/服務器結(jié)構的分布式系統(tǒng)r=r1r2…rnQ2:總的數(shù)據(jù)傳輸量是4800字節(jié),傳輸時間為0.分布式數(shù)據(jù)(shùjù)存儲1)水平分片 將關系r按行分為若干(ruògān)子集r1,r2,…,rn,每個子集ri稱為一個水平片段。 一個水平片段可以看成是關系上的一個選擇。ri=P(i)(r) 如M_S=sex=‘M’(S) 關系的重構可以通過并運算來實現(xiàn)。r=r1∪r2∪…∪rn第二十四頁,共67頁。分布式數(shù)據(jù)(shùjù)存儲(2)垂直分片 將關系r按列分為若干屬性子集r1,r2,…,rn,每個子集ri稱為一個垂直片段。 一個垂直片段可以看成是關系上的一個投影。ri=∏Ri(r) 其中Ri是r的一個屬性子集。 如P_S=∏SNO,SNAME(S) 關系的重構可以通過連接運算來實現(xiàn)(shíxiàn)。r=r1r2…rn 要求所有垂直分片的片段都包括關系的鍵。第二十五頁,共67頁。分布式數(shù)據(jù)(shùjù)存儲(3)混合分片關系(guānxì)按某種方式分片后,得到的片段再按另一種方式繼續(xù)分片。如SC(S#,C#,G,DNO)按學生系別分片,再對每個片段按成績(及格,不及格)分片。第二十六頁,共67頁。分布式數(shù)據(jù)(shùjù)存儲定義各種分片時必須遵守下面三個條件:1)完備性條件:必須把全局關系的所有數(shù)據(jù)映射到各個片段中,絕不允許發(fā)生屬于全局關系的某個數(shù)據(jù)不屬于任何一個片段。2)重構條件:劃分所采用的方法必須確保能夠(nénggòu)由各個分段重建全局關系。3)不相交條件:要求一個全局關系被劃分后得到的各個數(shù)據(jù)片段互相不重疊。目的是為了在數(shù)據(jù)分片時容易控制數(shù)據(jù)的復制。第二十七頁,共67頁。2.2分布式數(shù)據(jù)庫系統(tǒng)的體系結(jié)構全局外模式(móshì) 全局應用的用戶視圖。全局概念模式(móshì) 定義D-DBS中數(shù)據(jù)的整體邏輯結(jié)構,數(shù)據(jù)如同沒有分布一樣。分片模式(móshì) 每一個關系可以分為若干互不相交的部分,每一部分稱為一個片段。分配(分布)模式(móshì) 定義片段的存放地點。第二十八頁,共67頁。用戶(yònghù)視圖用戶(yònghù)視圖全局(quánjú)視圖分片視圖分配視圖局部概念視圖局部概念視圖局部內(nèi)視圖局部內(nèi)視圖局部DB局部DB分布式集中式分片視圖分片視圖分配視圖分配視圖局部概念視圖局部內(nèi)視圖局部DB第二十九頁,共67頁。舉例(jǔlì):RR1R2R3R4R11R21R12R22R23R33R43S1S2S3邏輯(luójí)片段物理(wùlǐ)映像一個全局關系的片段所對應的存儲片段組成兩個物理映像可以相同。第三十頁,共67頁。2.3分布(fēnbù)透明性分布(網(wǎng)絡)透明性分片透明性(全局視圖和分片視圖之間) 用戶或應用程序只對全局關系進行(jìnxíng)操作而不必考慮關系的分片。如果分片模式改變了,通過調(diào)整全局模式與分片模式之間的映象關系來保持全局模式不變。位置透明性(分片視圖和分配視圖之間) 用戶或應用程序不必了解片段的存儲位置。局部數(shù)據(jù)模型透明性(分配視圖和局部概念視圖之間) 用戶或應用程序不必了解局部場地上使用的是哪種數(shù)據(jù)模型。第三十一頁,共67頁。RR1R2R3R4R11R21R12R22R23R33R43S1S2S3第三十二頁,共67頁。2.4分布式數(shù)據(jù)庫管理系統(tǒng)的功能(gōngnéng)及組成1、DDBMS的主要功能:用戶能夠?qū)W(wǎng)絡上任意場地數(shù)據(jù)庫的數(shù)據(jù)進行遠程存取,執(zhí)行全局應用。支持透明存取,提供一定級別的分布透明性。支持對分布式數(shù)據(jù)庫的管理與控制。支持對分布式事務的并發(fā)(bìngfā)控制和恢復。第三十三頁,共67頁。為一個典型DDBMS的結(jié)構圖,包括四個部分(bùfen):全局數(shù)據(jù)庫管理系統(tǒng)GDBMS、全局數(shù)據(jù)字典GDD、局部數(shù)據(jù)庫管理系統(tǒng)LDBMS、通信管理CM。網(wǎng)絡場地3DDBMS結(jié)構圖場地1LDBLDBMSGDBMSCM用戶/DBAGDD場地2第三十四頁,共67頁。1.全局數(shù)據(jù)庫管理系統(tǒng)GDBMSGDBMS是DDBMS的核心,負責(fùzé)提供分布透明性,協(xié)調(diào)全局事務的執(zhí)行及協(xié)調(diào)各場地上的LDBMS共同完成全局應用。GDBMS通常包括:(1)用戶接口層。提供一個用于檢驗用戶身份的接口,用戶的應用程序經(jīng)用戶接口處理,作為一個全局事務由DDBMS執(zhí)行。(2)語言處理層。負責(fùzé)查詢語言的語法、詞法分析,把查詢語句轉(zhuǎn)換成某種內(nèi)部表示形式,如用語法樹表示查詢。第三十五頁,共67頁。(3)分布式數(shù)據(jù)管理層。主要完成查詢分解、優(yōu)化和確定查詢計劃。(4)分布式事務管理層。用于對分布式事務進行并發(fā)控制,并提供全局恢復(huīfù)功能。(5)全局數(shù)據(jù)與局部數(shù)據(jù)之間的轉(zhuǎn)換層。對異構系統(tǒng),需將數(shù)據(jù)轉(zhuǎn)換成系統(tǒng)可接受的形式。具體的轉(zhuǎn)換有:數(shù)據(jù)模型的轉(zhuǎn)換;數(shù)字代碼格式、字長、精度、單位等的轉(zhuǎn)換;操作命令、完整性規(guī)則、安全性規(guī)則的轉(zhuǎn)換等。第三十六頁,共67頁。2.全局數(shù)據(jù)字典GDDGDD負責提供系統(tǒng)的各種描述、管理和控制信息。如為系統(tǒng)提供各級模式描述、網(wǎng)絡描述、存取權限、事務優(yōu)先級、完整性約束與相容性約束、數(shù)據(jù)的分割及其定義、副本數(shù)據(jù)及其所在場地、存取路徑(lùjìng)、死鎖檢測、預防及故障恢復,與數(shù)據(jù)庫運行質(zhì)量有關的統(tǒng)計信息等。數(shù)據(jù)字典又稱數(shù)據(jù)目錄,是面向系統(tǒng)的。它由系統(tǒng)定義,在初始化時由系統(tǒng)自動生成并為系統(tǒng)所用。由于數(shù)據(jù)是分布的,因此數(shù)據(jù)字典也存在一個分布策略及管理問題,數(shù)據(jù)字典中的數(shù)據(jù)與冗余也需要進行優(yōu)化。第三十七頁,共67頁。3.局部(júbù)數(shù)據(jù)庫管理系統(tǒng)LDBMSLDBMS用來建立和管理各場地上的局部(júbù)數(shù)據(jù)庫LDB,提供場地的自治能力,可執(zhí)行局部(júbù)應用和全局查詢的子查詢。4.通信管理CMCM遵循網(wǎng)絡協(xié)議,實現(xiàn)各場地之間數(shù)據(jù)的可靠傳送,完成系統(tǒng)的通信功能。第三十八頁,共67頁。分布式數(shù)據(jù)庫管理系統(tǒng)的分類(fēnlèi)1.按LDBMS類型分類(1)同構型DDBMS(HomogeneousDDBMS)同構型(也稱均質(zhì)型)系統(tǒng)是指系統(tǒng)中每個場地的LDBMS類型都相同,即它們支持(zhīchí)相同的數(shù)據(jù)模型、訪問方法、優(yōu)化策略、并發(fā)控制算法,以及相同的命令語言和查詢語言等。(2)異構型DDBMS(HeterogeneousDDBMS)異構型(也稱異質(zhì)型)系統(tǒng)是指系統(tǒng)中每個場地可以有不同類型的LDBMS。它們可以是不同的數(shù)據(jù)模型,也可以是同一數(shù)據(jù)模型但由不同廠商提供的產(chǎn)品。第三十九頁,共67頁。2.按全局控制方式分類(1)全局集中控制的DDBMS這種方式的GDBMS和GDD集中在一個中心場地上,由該場地完成全局事務的協(xié)調(diào)和局部數(shù)據(jù)庫轉(zhuǎn)換等一切控制問題。(2)全局控制分散的DDBMSGDBMS和GDD分散存放在各個場地上,即每個場地都有控制信息(xìnxī)的一個副本,都能完成全局事務的協(xié)調(diào)和局部數(shù)據(jù)庫轉(zhuǎn)換的控制問題。第四十頁,共67頁。(3)全局控制部分分散的DDBMS這種方式根據(jù)應用的需要將GDBMS和GDD分散在某些場地上,即只在部分場地包含(bāohán)控制信息的副本,性能介于以上兩種類型之間。第四十一頁,共67頁。分布式數(shù)據(jù)庫管理系統(tǒng)的分類(fēnlèi)3.按數(shù)據(jù)(shùjù)在邏輯上集中/分布分類:(1)物理上分布、邏輯上集中的DDBMS這種方式數(shù)據(jù)(shùjù)庫在邏輯上是集中的,用戶感覺不到數(shù)據(jù)(shùjù)的分布,看到的似乎是一個數(shù)據(jù)(shùjù)模式為全局數(shù)據(jù)(shùjù)模式的集中式數(shù)據(jù)(shùjù)庫。(2)物理上分布、邏輯上分布的DDBMS這種分布式數(shù)據(jù)(shùjù)庫系統(tǒng)又稱聯(lián)邦分布式數(shù)據(jù)(shùjù)庫系統(tǒng)(FederatedDistributedDatabaseSystems)。系統(tǒng)中每個場地所看到的數(shù)據(jù)(shùjù)模式是不同的,好像有多個邏輯數(shù)據(jù)(shùjù)庫存在。第四十二頁,共67頁。分布式數(shù)據(jù)庫管理系統(tǒng)的分類(fēnlèi)4.按功能分類(1)綜合型體系結(jié)構設計一個全新的DDBMS時,設計人員可綜合權衡用戶需求,采用自頂向下的設計方法,設計一個完整的DDBMS,然后把系統(tǒng)的功能按一定的策略分散(fēnsàn)配置在一個分布式環(huán)境中,這種結(jié)構稱為DDBMS。(2)聯(lián)合型體系結(jié)構在原有DBMS基礎上建立分布式DBMS,按照使用LDBMS類型的不同又分為同構型和異構型DDBMS。第四十三頁,共67頁。分布式數(shù)據(jù)庫管理系統(tǒng)的分類(fēnlèi)5.按層次分類法分類(1)單層結(jié)構DDBMS指一個分布式數(shù)據(jù)庫中,在同一全局DBMS控制管理下,其數(shù)據(jù)物理分布在網(wǎng)絡的多個(duōɡè)場地上,每個場地不存在獨立的DBMS,但可以包含全局DBMS的子部件。(2)多層結(jié)構DDBMS如果一個分布式數(shù)據(jù)庫是來自一些相互連接的場地上的數(shù)據(jù)庫中數(shù)據(jù)的邏輯集合,則稱該系統(tǒng)為多層結(jié)構的DDBMS。在這種系統(tǒng)中,每個場地都有一個獨立的DBMS,而且每個場地可以是另一個單層或多層結(jié)構的DDBMS。第四十四頁,共67頁。2.5分布式數(shù)據(jù)庫系統(tǒng)中存在(cúnzài)的問題1、不同場地的通信速度(sùdù),與局部DBS的存儲部件的存取速度(sùdù)相比,是非常慢的。2、通信系統(tǒng)有較高的存取延遲時間。3、在CPU上處理通信的代價很高。4、不同通信系統(tǒng)有不同意義的字符,數(shù)據(jù)轉(zhuǎn)換速度(sùdù)也不一樣,可以相差1000倍,存取延遲時間可能相差106倍。第四十五頁,共67頁。3分布式查詢處理分布式數(shù)據(jù)庫系統(tǒng)中由于數(shù)據(jù)分布在各個場地(chǎngdì),因此,查詢的處理比集中式數(shù)據(jù)庫復雜。第四十六頁,共67頁。3.1查詢處理的傳輸(chuánshū)代價Site-1Site-2EMPLOYEE104個記錄(jìlù)每個記錄(jìlù)100字節(jié)DEPARTMENT100個記錄(jìlù)每個記錄(jìlù)100字節(jié)檢索每個職工的姓名、地址及工作部門名 selectENAME,ADDRESS,DNAME
fromEMPLOYEE,DEPARTMENT
whereDNO=DNUMBER網(wǎng)絡傳輸速度104字節(jié)/秒第四十七頁,共67頁。分布式查詢處理⒈把關系EMPLOYEE和DEPARTMENT分布從場地1和場地2傳到場地3,然后在場地3站進行(jìnxíng)查詢 傳送時間T=(104100+10035)/104=100s32 傳送時間T=總傳輸(chuánshū)延遲+總數(shù)據(jù)量/傳輸(chuánshū)速度1第四十八頁,共67頁。分布式查詢處理⒉把關系EMPLOYEE傳送(chuánsònɡ)到場地2,在場地2作聯(lián)接,再把操作結(jié)構從場地2傳到場地3: 傳送(chuánsònɡ)時間T=(104100+400000)/104=140s132第四十九頁,共67頁。分布式查詢處理3.把關系DEPARTMENT傳送到場地1,在場地1作聯(lián)接,再把操作(cāozuò)結(jié)構從場地1傳到場地3: 傳送時間T=(3500+400000)/104=40s132第五十頁,共67頁。分布式查詢處理2)在場地3有一個查詢“檢索每個部門的名字和其經(jīng)理(jīnglǐ)的姓名、地址”。selectDNAME,ENAME,ADDRESSfromEMPLOYEE,DEPARTMENT whereMGRENO=ENO第五十一頁,共67頁。分布式查詢處理⒈把關系EMPLOYEE和DEPARTMENT分布從場地1和場地2傳到場地3,然后(ránhòu)在場地3站進行查詢 傳送時間T=(104100+3500)/104=100s32 傳送(chuánsònɡ)時間T=總傳輸延遲+總數(shù)據(jù)量/傳輸速度1第五十二頁,共67頁。分布式查詢處理⒉把關系EMPLOYEE傳送到場地2,在場地2作聯(lián)接,再把操作結(jié)構(jiégòu)從場地2傳到場地3: 傳送時間T=(104100+4000)/104=100s132第五十三頁,共67頁。分布式查詢處理3.把關系DEPARTMENT傳送(chuánsònɡ)到場地1,在場地1作聯(lián)接,再把操作結(jié)構從場地1傳到場地3: 傳送(chuánsònɡ)時間T=(3500+4000)/104=0.75s132第五十四頁,共67頁。分布式查詢處理3)如果在場地(chǎngdì)2提出上述兩個查詢Q1和Q2,可以有兩種方法:4、把關系EMPLOYEE傳送到場地(chǎngdì)2,在場地(chǎngdì)2作聯(lián)接,此時Q1和Q2的傳輸量都是1000000,時間都是100秒。12Q1Q2第五十五頁,共67頁。分布式查詢處理5.把關系DEPARTMENT傳送到場地1,在場地1作聯(lián)接,再把結(jié)果從場地1傳到場地2,此時Q1的傳輸(chuánshū)量為:3500+400000=403500,時間是40秒。Q2的傳輸(chuánshū)量都是3500+4000=7500,時間是0.75秒。12第五十六頁,共67頁。3.2基于半聯(lián)接的查詢(cháxún)優(yōu)化策略數(shù)據(jù)在網(wǎng)絡中傳輸,如果都以整個關系傳輸,顯然是一種冗余。不參與聯(lián)接的值或無用的值不必在網(wǎng)絡中來回傳輸。(1)、基于半聯(lián)接的查詢實例:如果在場地2提出上述兩個查詢Q1和Q2,可以有兩種方法:把關系DEPARTMENT傳送到場地1,在場地1作聯(lián)接,再把結(jié)果從場地1傳到場地2??梢愿倪M:1)在場地2,用投影求得關系DEPARTMENT中參與聯(lián)接操作(cāozuò)的屬性值,把投影結(jié)果傳輸?shù)綀龅?。Q1:數(shù)據(jù)傳輸量是400字節(jié)(DEPARTMENT在DNUMBER上的投影)。Q2:數(shù)據(jù)傳輸量是900字節(jié)(DEPARTMENT在MGRENO上的投影)。第五十七頁,共67頁。3.2基于半聯(lián)接的查詢(cháxún)優(yōu)化策略2)在場地1,執(zhí)行聯(lián)接操作,并用投影求出所需的屬性值,把結(jié)果送到場地2。Q1:數(shù)據(jù)傳輸量是340000字節(jié)。Q2:數(shù)據(jù)傳輸量是3900字節(jié)。3)在場地2,執(zhí)行聯(lián)接操作,把結(jié)果給用戶(yònghù)。Q1:總的數(shù)據(jù)傳輸量是340400字節(jié),傳輸時間為40秒。Q2:總的數(shù)據(jù)傳輸量是4800字節(jié),傳輸時間為0.75。顯然,本方法采用的查詢處理方法是有效的。第五十八頁,共67頁。(2)半聯(lián)接(liánjiē)操作的定義半連接運算(yùnsuàn)定義 半連接RS=R(RS)
=第五十九頁,共67頁。(2)半聯(lián)接(liánjiē)操作的定義半連接作用(zuòyòng) 找出R中能夠與S中元組相連接的元組來,類似于在連接之前先做選擇和投影。RS=(RS)SRS=(SR)R半連接的非對稱性RS(SR
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 門頭牌匾施工方案
- 物業(yè)管理培訓知識
- 排水溝疏浚施工方案
- 廚師工資協(xié)議合同范例
- 同行之間拿車合同范例
- 公益提供飲品合同范例
- 班級榮譽激勵制度的設立計劃
- 促進班級凝聚力的有效措施計劃
- 職業(yè)網(wǎng)絡拓展的策略計劃
- 生產(chǎn)計劃中的時間管理策略
- 2024-2025學年山東省濟南市九年級(上)期末語文試卷(含答案)
- 鄧宗良《煤油燈》閱讀答案
- 2025年皖北衛(wèi)生職業(yè)學院單招職業(yè)技能測試題庫參考答案
- 2024年廣州市公安局招聘交通輔警考試真題
- 隨機交易策略(TB版)
- 1.1 銳角三角函數(shù)(第1課時) 課件 2024-2025學年北師大版九年級數(shù)學下冊
- 2025年全國高考體育單招政治時事填空練習50題(含答案)
- 中華人民共和國學前教育法-知識培訓
- 2024年計算機二級WPS考試題庫380題(含答案)
- 河北省工傷職工停工留薪期分類目錄 (工傷)
- 人民調(diào)解檔案規(guī)范文本.doc調(diào)解文書的格式及使用說明
評論
0/150
提交評論