分布式數(shù)據(jù)庫(kù)系統(tǒng)課件_第1頁(yè)
分布式數(shù)據(jù)庫(kù)系統(tǒng)課件_第2頁(yè)
分布式數(shù)據(jù)庫(kù)系統(tǒng)課件_第3頁(yè)
分布式數(shù)據(jù)庫(kù)系統(tǒng)課件_第4頁(yè)
分布式數(shù)據(jù)庫(kù)系統(tǒng)課件_第5頁(yè)
已閱讀5頁(yè),還剩101頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第九章分布式數(shù)據(jù)庫(kù)系統(tǒng)第九章分布式數(shù)據(jù)庫(kù)系統(tǒng)1本章內(nèi)容分布式數(shù)據(jù)庫(kù)系統(tǒng)概述分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)分布式查詢處理客戶/服務(wù)器結(jié)構(gòu)的分布式系統(tǒng)本章內(nèi)容分布式數(shù)據(jù)庫(kù)系統(tǒng)概述29.1分布式數(shù)據(jù)庫(kù)系統(tǒng)概述9.1.1集中式系統(tǒng)和分布式系統(tǒng)集中式數(shù)據(jù)庫(kù)管理系統(tǒng)的缺點(diǎn):通信開(kāi)銷大;系統(tǒng)的堅(jiān)固性差;性能差;可擴(kuò)充性差;設(shè)計(jì)、管理困難。分散式系統(tǒng):將數(shù)據(jù)庫(kù)分成多個(gè),建立在多臺(tái)計(jì)算機(jī)上,數(shù)據(jù)庫(kù)的管理、應(yīng)用程序的研制都是分開(kāi)并相互獨(dú)立的,之間不存在數(shù)據(jù)通行聯(lián)系。分布式數(shù)據(jù)庫(kù)系統(tǒng)的特點(diǎn):數(shù)據(jù)的分布性;統(tǒng)一性;透明性。統(tǒng)一性(兩個(gè)方面:數(shù)據(jù)在邏輯上的統(tǒng)一性和數(shù)據(jù)在管理上的統(tǒng)一性)分布式數(shù)據(jù)庫(kù)與集中式數(shù)據(jù)庫(kù)相比的優(yōu)點(diǎn):堅(jiān)固性好;可擴(kuò)充性好;可改善性能;自治性好。9.1分布式數(shù)據(jù)庫(kù)系統(tǒng)概述9.1.1集中式系統(tǒng)和分布式系39.1分布式數(shù)據(jù)庫(kù)系統(tǒng)概述與集中式數(shù)據(jù)庫(kù)相比,分布式DB具有:數(shù)據(jù)分布式的特點(diǎn)。與分散式數(shù)據(jù)庫(kù)相比,分布式DB具有:邏輯整體性的特點(diǎn)。9.1分布式數(shù)據(jù)庫(kù)系統(tǒng)概述與集中式數(shù)據(jù)庫(kù)相比,分布式DB具4背景數(shù)據(jù)庫(kù)系統(tǒng)+計(jì)算機(jī)網(wǎng)絡(luò)9.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義DB1DB1DB1計(jì)算機(jī)1計(jì)算機(jī)2計(jì)算機(jī)3通訊網(wǎng)絡(luò)T1T2T3T1T2T3T1T2T3背景數(shù)據(jù)庫(kù)系統(tǒng)+計(jì)算機(jī)網(wǎng)絡(luò)9.1.2分布式59.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義一個(gè)分布式系統(tǒng)由通信網(wǎng)絡(luò)聯(lián)接起來(lái)的結(jié)點(diǎn)的集合。每個(gè)結(jié)點(diǎn)都是擁有集中式數(shù)據(jù)庫(kù)的計(jì)算機(jī)系統(tǒng)。分布式數(shù)據(jù)庫(kù)的特點(diǎn):數(shù)據(jù)庫(kù)中的數(shù)據(jù)不是存儲(chǔ)在同一場(chǎng)地,而是分布存儲(chǔ)在多個(gè)場(chǎng)地。9.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義一個(gè)分布式系統(tǒng)由通信網(wǎng)絡(luò)聯(lián)69.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義分布性:數(shù)據(jù)存儲(chǔ)在不同場(chǎng)地上。與集中式數(shù)據(jù)庫(kù)不同。邏輯整體性:數(shù)據(jù)邏輯上是相互聯(lián)系的一個(gè)整體。與分散在計(jì)算機(jī)網(wǎng)絡(luò)不同站點(diǎn)上的一組沒(méi)有相互聯(lián)系的本地?cái)?shù)據(jù)庫(kù)區(qū)別開(kāi)來(lái)。9.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義分布性:數(shù)據(jù)存儲(chǔ)在不同場(chǎng)地79.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義物理上是分布的,邏輯上是統(tǒng)一的一組數(shù)據(jù)庫(kù)的集合要素計(jì)算機(jī)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)系統(tǒng)9.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義物理上是分布的,邏輯上是統(tǒng)8DB1DB1DB1計(jì)算機(jī)1計(jì)算機(jī)1計(jì)算機(jī)1通訊網(wǎng)絡(luò)北京重慶上海銀行系統(tǒng)訪問(wèn)本地銀行數(shù)據(jù):局部應(yīng)用通兌業(yè)務(wù)、轉(zhuǎn)賬業(yè)務(wù):全局應(yīng)用DB1DB1DB1計(jì)算機(jī)1計(jì)算機(jī)1計(jì)算機(jī)1通訊網(wǎng)絡(luò)北京重慶上99.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義全局應(yīng)用:指涉及到兩個(gè)或兩個(gè)以上場(chǎng)地中數(shù)據(jù)庫(kù)的應(yīng)用。網(wǎng)絡(luò)的每個(gè)站點(diǎn)具有獨(dú)立處理能力,可以執(zhí)行局部應(yīng)用,同時(shí)也能通過(guò)網(wǎng)絡(luò)執(zhí)行全局應(yīng)用。分布式數(shù)據(jù)庫(kù)是由一組數(shù)據(jù)庫(kù)組成,這些數(shù)據(jù)庫(kù)分布在計(jì)算機(jī)網(wǎng)絡(luò)的不同站點(diǎn)上,邏輯上是屬于同一個(gè)系統(tǒng)的。9.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義全局應(yīng)用:指涉及到兩個(gè)或兩109.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義分布式數(shù)據(jù)庫(kù)包含兩個(gè)重要組成部分:分布式數(shù)據(jù)庫(kù)和分布式數(shù)據(jù)庫(kù)管理系統(tǒng)。分布式數(shù)據(jù)庫(kù)是計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境中各場(chǎng)地上數(shù)據(jù)庫(kù)的邏輯集合。分布式數(shù)據(jù)庫(kù)管理系統(tǒng)是分布式數(shù)據(jù)庫(kù)系統(tǒng)中的一組軟件,它復(fù)雜管理分布環(huán)境下邏輯集成數(shù)據(jù)的存取、一致性、有效性和完備性。9.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義分布式數(shù)據(jù)庫(kù)包含兩個(gè)重要組119.1.3分布式數(shù)據(jù)庫(kù)系統(tǒng)的透明性位置透明性 用戶或應(yīng)用程序不必了解它所使用的數(shù)據(jù)的存儲(chǔ)位置。舉例:銀行的借貸業(yè)務(wù):要判斷的情況有5種。復(fù)制透明性 有些數(shù)據(jù)并不存在一個(gè)場(chǎng)地,可能重復(fù)存放在不同的場(chǎng)地。本地?cái)?shù)據(jù)庫(kù)中也包含了外地?cái)?shù)據(jù)庫(kù)中的數(shù)據(jù)。

一個(gè)分布式系統(tǒng)有了這兩種透明性后,用戶看到的系統(tǒng)就如同一個(gè)集中式系統(tǒng)。9.1.3分布式數(shù)據(jù)庫(kù)系統(tǒng)的透明性位置透明性129.1.4分布式數(shù)據(jù)庫(kù)系統(tǒng)的優(yōu)缺點(diǎn)具有靈活的體系結(jié)構(gòu)數(shù)據(jù)庫(kù)的使用單位組織上、地理上是分布的適應(yīng)分布式管理和控制機(jī)構(gòu)。經(jīng)濟(jì)性能優(yōu)越經(jīng)濟(jì)上和組織上的理由系統(tǒng)的可靠性高,可用性好。局部應(yīng)用的響應(yīng)速度快??蓴U(kuò)展性好,易于集成現(xiàn)有系統(tǒng)。既有數(shù)據(jù)庫(kù)互連,歷史繼承;數(shù)據(jù)資源共享系統(tǒng)規(guī)模逐步擴(kuò)展增加結(jié)點(diǎn),不影響現(xiàn)有系統(tǒng)運(yùn)行9.1.4分布式數(shù)據(jù)庫(kù)系統(tǒng)的優(yōu)缺點(diǎn)具有靈活的體系結(jié)構(gòu)139.1.4分布式數(shù)據(jù)庫(kù)系統(tǒng)的優(yōu)缺點(diǎn)缺點(diǎn):系統(tǒng)開(kāi)銷大,主要花在通信部分。復(fù)雜的存取結(jié)構(gòu)在集中式系統(tǒng)中是有效存取數(shù)據(jù)的重要基數(shù),但在分布式系統(tǒng)中不一定有效。數(shù)據(jù)的安全和行保密性較難處理。9.1.4分布式數(shù)據(jù)庫(kù)系統(tǒng)的優(yōu)缺點(diǎn)缺點(diǎn):149.1.5分布式數(shù)據(jù)庫(kù)系統(tǒng)的分類同構(gòu)同質(zhì)數(shù)據(jù)庫(kù)每個(gè)場(chǎng)地都用同一類型的數(shù)據(jù)模型,并運(yùn)行同一型號(hào)的DBMS同構(gòu)異質(zhì)數(shù)據(jù)庫(kù)每個(gè)場(chǎng)地都用同一類型的數(shù)據(jù)模型,但運(yùn)行不同型號(hào)的DBMS異構(gòu)數(shù)據(jù)庫(kù)場(chǎng)地上的數(shù)據(jù)庫(kù)系統(tǒng)不盡相同DBMS不同數(shù)據(jù)模型不同9.1.5分布式數(shù)據(jù)庫(kù)系統(tǒng)的分類同構(gòu)同質(zhì)數(shù)據(jù)庫(kù)15練習(xí):1、與集中式DB相比,分布式DB具有()特點(diǎn),與分散式DB相比,又具有()特點(diǎn)。2、區(qū)別系統(tǒng)是分散式還是分布式就是判定系統(tǒng)是否支持().3、在分布式DB中,用戶看到的系統(tǒng)如同一個(gè)集中式DBS,這是因?yàn)榉植际较到y(tǒng)具有()和()特點(diǎn)。4、如果各個(gè)場(chǎng)地都采用同類型數(shù)據(jù)模型,但DBMS不同型號(hào),這種系統(tǒng)屬于()型DBMS.1、數(shù)據(jù)分布性,邏輯整體性2、全局應(yīng)用3、位置透明性,復(fù)制透明性4、同構(gòu)異質(zhì)型DDBS.練習(xí):1、與集中式DB相比,分布式DB具有()特點(diǎn),與分散式169.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)9.2.1分布式數(shù)據(jù)存儲(chǔ)(1)數(shù)據(jù)分配數(shù)據(jù)分配是指數(shù)據(jù)在計(jì)算機(jī)網(wǎng)絡(luò)各場(chǎng)地上的分配策略。集中式:所有數(shù)據(jù)均安排在同一個(gè)場(chǎng)地上。分割式:所有數(shù)據(jù)只有一份,分布被安置在若干個(gè)場(chǎng)地。全復(fù)制式:數(shù)據(jù)在每個(gè)場(chǎng)地重復(fù)存儲(chǔ)?;旌鲜剑簲?shù)據(jù)庫(kù)分成若干可相交的子集,每一子集安置在一個(gè)或多個(gè)場(chǎng)地上,但是每一場(chǎng)地未必保存全部數(shù)據(jù)。9.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)9.2.1分布式數(shù)據(jù)存儲(chǔ)17分布式數(shù)據(jù)存儲(chǔ)(2)數(shù)據(jù)分片:分布式數(shù)據(jù)庫(kù)中的數(shù)據(jù)可以被分割和復(fù)制在物理場(chǎng)地的各個(gè)物理數(shù)據(jù)庫(kù)中。優(yōu)點(diǎn)將關(guān)系分片,有利于按用戶需求組織數(shù)據(jù)的分布。如產(chǎn)品→(內(nèi)銷產(chǎn)品,出口產(chǎn)品)。分片方式水平分片垂直分片導(dǎo)出分片混合分片分布式數(shù)據(jù)存儲(chǔ)(2)數(shù)據(jù)分片:分布式數(shù)據(jù)庫(kù)中的數(shù)據(jù)可以被分割18分布式數(shù)據(jù)存儲(chǔ)分布式數(shù)據(jù)存儲(chǔ)19分布式數(shù)據(jù)存儲(chǔ)1)水平分片 將關(guān)系r按行分為若干子集r1,r2,…,rn,每個(gè)子集ri稱為一個(gè)水平片段。 一個(gè)水平片段可以看成是關(guān)系上的一個(gè)選擇。ri=P(i)(r) 如M_S=sex=‘M’(S) 關(guān)系的重構(gòu)可以通過(guò)并運(yùn)算來(lái)實(shí)現(xiàn)。r=r1∪r2∪…∪rn分布式數(shù)據(jù)存儲(chǔ)1)水平分片20分布式數(shù)據(jù)存儲(chǔ)(2)垂直分片 將關(guān)系r按列分為若干屬性子集r1,r2,…,rn,每個(gè)子集ri稱為一個(gè)垂直片段。 一個(gè)垂直片段可以看成是關(guān)系上的一個(gè)投影。ri=∏Ri(r) 其中Ri是r的一個(gè)屬性子集。 如P_S=∏SNO,SNAME(S) 關(guān)系的重構(gòu)可以通過(guò)連接運(yùn)算來(lái)實(shí)現(xiàn)。r=r1r2…rn

要求所有垂直分片的片段都包括關(guān)系的鍵。分布式數(shù)據(jù)存儲(chǔ)(2)垂直分片21分布式數(shù)據(jù)存儲(chǔ)(3)混合分片關(guān)系按某種方式分片后,得到的片段再按另一種方式繼續(xù)分片。如SC(S#,C#,G,DNO)按學(xué)生系別分片,再對(duì)每個(gè)片段按成績(jī)(及格,不及格)分片。分布式數(shù)據(jù)存儲(chǔ)(3)混合分片22分布式數(shù)據(jù)存儲(chǔ)定義各種分片時(shí)必須遵守下面三個(gè)條件:1)完備性條件:必須把全局關(guān)系的所有數(shù)據(jù)映射到各個(gè)片段中,絕不允許發(fā)生屬于全局關(guān)系的某個(gè)數(shù)據(jù)不屬于任何一個(gè)片段。2)重構(gòu)條件:劃分所采用的方法必須確保能夠由各個(gè)分段重建全局關(guān)系。3)不相交條件:要求一個(gè)全局關(guān)系被劃分后得到的各個(gè)數(shù)據(jù)片段互相不重疊。目的是為了在數(shù)據(jù)分片時(shí)容易控制數(shù)據(jù)的復(fù)制。分布式數(shù)據(jù)存儲(chǔ)定義各種分片時(shí)必須遵守下面三個(gè)條件:239.2.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)全局外模式 全局應(yīng)用的用戶視圖。全局概念模式 定義D-DBS中數(shù)據(jù)的整體邏輯結(jié)構(gòu),數(shù)據(jù)如同沒(méi)有分布一樣。分片模式 每一個(gè)關(guān)系可以分為若干互不相交的部分,每一部分稱為一個(gè)片段。分配(分布)模式 定義片段的存放地點(diǎn)。9.2.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)全局外模式24用戶視圖用戶視圖全局視圖分片視圖分配視圖局部概念視圖局部概念視圖局部?jī)?nèi)視圖局部?jī)?nèi)視圖局部DB局部DB分布式集中式分片視圖分片視圖分配視圖分配視圖局部概念視圖局部?jī)?nèi)視圖局部DB用戶視圖用戶視圖全局視圖分片視圖分配視圖局部概念視圖局部概念25舉例:RR1R2R3R4R11R21R12R22R23R33R43S1S2S3邏輯片段物理映像一個(gè)全局關(guān)系的片段所對(duì)應(yīng)的存儲(chǔ)片段組成兩個(gè)物理映像可以相同。舉例:RR1R2R3R4R11R21R12R22R23R33269.2.3分布透明性分布(網(wǎng)絡(luò))透明性分片透明性(全局視圖和分片視圖之間) 用戶或應(yīng)用程序只對(duì)全局關(guān)系進(jìn)行操作而不必考慮關(guān)系的分片。如果分片模式改變了,通過(guò)調(diào)整全局模式與分片模式之間的映象關(guān)系來(lái)保持全局模式不變。位置透明性(分片視圖和分配視圖之間)

用戶或應(yīng)用程序不必了解片段的存儲(chǔ)位置。局部數(shù)據(jù)模型透明性(分配視圖和局部概念視圖之間)

用戶或應(yīng)用程序不必了解局部場(chǎng)地上使用的是哪種數(shù)據(jù)模型。9.2.3分布透明性分布(網(wǎng)絡(luò))透明性27RR1R2R3R4R11R21R12R22R23R33R43S1S2S3例子9.4RR1R2R3R4R11R21R12R22R23R33R43289.2.4分布式數(shù)據(jù)庫(kù)管理系統(tǒng)的功能及組成1、DDBMS的主要功能:接收用戶請(qǐng)求;訪問(wèn)網(wǎng)絡(luò)數(shù)據(jù)字典;如果目標(biāo)數(shù)據(jù)存儲(chǔ)于系統(tǒng)的多個(gè)計(jì)算機(jī)上,就必須進(jìn)行分布式處理;通信接口功能;在一個(gè)異構(gòu)型分布式處理環(huán)境中,還需要提供數(shù)據(jù)和進(jìn)程移植的支持。2、DDBMS的組成:查詢處理子系統(tǒng)、完整性子系統(tǒng)、調(diào)度子系統(tǒng)和可靠性子系統(tǒng)。9.2.4分布式數(shù)據(jù)庫(kù)管理系統(tǒng)的功能及組成1、DDBMS的299.2.5分布式數(shù)據(jù)庫(kù)系統(tǒng)中存在的問(wèn)題1、不同場(chǎng)地的通信速度,與局部DBS的存儲(chǔ)部件的存取速度相比,是非常慢的。2、通信系統(tǒng)有較高的存取延遲時(shí)間。3、在CPU上處理通信的代價(jià)很高。4、不同通信系統(tǒng)有不同意義的字符,數(shù)據(jù)轉(zhuǎn)換速度也不一樣,可以相差1000倍,存取延遲時(shí)間可能相差106倍。9.2.5分布式數(shù)據(jù)庫(kù)系統(tǒng)中存在的問(wèn)題1、不同場(chǎng)地的通信速309.3分布式查詢處理分布式數(shù)據(jù)庫(kù)系統(tǒng)中由于數(shù)據(jù)分布在各個(gè)場(chǎng)地,因此,查詢的處理比集中式數(shù)據(jù)庫(kù)復(fù)雜。9.3分布式查詢處理分布式數(shù)據(jù)庫(kù)系統(tǒng)中由于數(shù)據(jù)分布在各個(gè)場(chǎng)319.3.1查詢處理的傳輸代價(jià)Site-1Site-2EMPLOYEE104個(gè)記錄每個(gè)記錄100字節(jié)DEPARTMENT100個(gè)記錄每個(gè)記錄100字節(jié)檢索每個(gè)職工的姓名、地址及工作部門(mén)名 selectENAME,ADDRESS,DNAME

fromEMPLOYEE,DEPARTMENT

whereDNO=DNUMBER網(wǎng)絡(luò)傳輸速度104字節(jié)/秒9.3.1查詢處理的傳輸代價(jià)Site-1Site-2EMP32分布式查詢處理⒈把關(guān)系EMPLOYEE和DEPARTMENT分布從場(chǎng)地1和場(chǎng)地2傳到場(chǎng)地3,然后在場(chǎng)地3站進(jìn)行查詢 傳送時(shí)間T=(104100+10035

)/104=100s32 傳送時(shí)間T=總傳輸延遲+總數(shù)據(jù)量/傳輸速度1分布式查詢處理⒈把關(guān)系EMPLOYEE和DEPARTMENT33分布式查詢處理⒉把關(guān)系EMPLOYEE傳送到場(chǎng)地2,在場(chǎng)地2作聯(lián)接,再把操作結(jié)構(gòu)從場(chǎng)地2傳到場(chǎng)地3: 傳送時(shí)間T=(104100+400000

)/104=140s132分布式查詢處理⒉把關(guān)系EMPLOYEE傳送到場(chǎng)地2,在場(chǎng)地234分布式查詢處理3.把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在場(chǎng)地1作聯(lián)接,再把操作結(jié)構(gòu)從場(chǎng)地1傳到場(chǎng)地3: 傳送時(shí)間T=(3500+400000

)/104=40s132分布式查詢處理3.把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在35分布式查詢處理2)在場(chǎng)地3有一個(gè)查詢“檢索每個(gè)部門(mén)的名字和其經(jīng)理的姓名、地址”。selectDNAME,ENAME,ADDRESS

fromEMPLOYEE,DEPARTMENT

whereMGRENO=ENO分布式查詢處理2)在場(chǎng)地3有一個(gè)查詢“檢索每個(gè)部門(mén)的名字和其36分布式查詢處理⒈把關(guān)系EMPLOYEE和DEPARTMENT分布從場(chǎng)地1和場(chǎng)地2傳到場(chǎng)地3,然后在場(chǎng)地3站進(jìn)行查詢 傳送時(shí)間T=(104100+3500

)/104=100s32 傳送時(shí)間T=總傳輸延遲+總數(shù)據(jù)量/傳輸速度1分布式查詢處理⒈把關(guān)系EMPLOYEE和DEPARTMENT37分布式查詢處理⒉把關(guān)系EMPLOYEE傳送到場(chǎng)地2,在場(chǎng)地2作聯(lián)接,再把操作結(jié)構(gòu)從場(chǎng)地2傳到場(chǎng)地3: 傳送時(shí)間T=(104100+4000

)/104=100s132分布式查詢處理⒉把關(guān)系EMPLOYEE傳送到場(chǎng)地2,在場(chǎng)地238分布式查詢處理3.把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在場(chǎng)地1作聯(lián)接,再把操作結(jié)構(gòu)從場(chǎng)地1傳到場(chǎng)地3: 傳送時(shí)間T=(3500+4000

)/104=0.75s132分布式查詢處理3.把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在39分布式查詢處理3)如果在場(chǎng)地2提出上述兩個(gè)查詢Q1和Q2,可以有兩種方法:4、把關(guān)系EMPLOYEE傳送到場(chǎng)地2,在場(chǎng)地2作聯(lián)接,此時(shí)Q1和Q2的傳輸量都是1000000,時(shí)間都是100秒。12Q1Q2分布式查詢處理3)如果在場(chǎng)地2提出上述兩個(gè)查詢Q1和Q2,可40分布式查詢處理5.把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在場(chǎng)地1作聯(lián)接,再把結(jié)果從場(chǎng)地1傳到場(chǎng)地2,此時(shí)Q1的傳輸量為:3500+400000=403500,時(shí)間是40秒。Q2的傳輸量都是3500+4000=7500,時(shí)間是0.75秒。12分布式查詢處理5.把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在419.3.2基于半聯(lián)接的查詢優(yōu)化策略數(shù)據(jù)在網(wǎng)絡(luò)中傳輸,如果都以整個(gè)關(guān)系傳輸,顯然是一種冗余。不參與聯(lián)接的值或無(wú)用的值不必在網(wǎng)絡(luò)中來(lái)回傳輸。(1)、基于半聯(lián)接的查詢實(shí)例:如果在場(chǎng)地2提出上述兩個(gè)查詢Q1和Q2,可以有兩種方法:把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在場(chǎng)地1作聯(lián)接,再把結(jié)果從場(chǎng)地1傳到場(chǎng)地2。可以改進(jìn):1)在場(chǎng)地2,用投影求得關(guān)系DEPARTMENT中參與聯(lián)接操作的屬性值,把投影結(jié)果傳輸?shù)綀?chǎng)地1。Q1:數(shù)據(jù)傳輸量是400字節(jié)(DEPARTMENT在DNUMBER上的投影)。Q2:數(shù)據(jù)傳輸量是900字節(jié)(DEPARTMENT在MGRENO上的投影)。9.3.2基于半聯(lián)接的查詢優(yōu)化策略數(shù)據(jù)在網(wǎng)絡(luò)中傳輸,如果都以429.3.2基于半聯(lián)接的查詢優(yōu)化策略2)在場(chǎng)地1,執(zhí)行聯(lián)接操作,并用投影求出所需的屬性值,把結(jié)果送到場(chǎng)地2。Q1:數(shù)據(jù)傳輸量是340000字節(jié)。Q2:數(shù)據(jù)傳輸量是3900字節(jié)。3)在場(chǎng)地2,執(zhí)行聯(lián)接操作,把結(jié)果給用戶。Q1:總的數(shù)據(jù)傳輸量是340400字節(jié),傳輸時(shí)間為40秒。Q2:總的數(shù)據(jù)傳輸量是4800字節(jié),傳輸時(shí)間為0.75。顯然,本方法采用的查詢處理方法是有效的。9.3.2基于半聯(lián)接的查詢優(yōu)化策略2)在場(chǎng)地1,執(zhí)行聯(lián)接操作43(2)半聯(lián)接操作的定義半連接運(yùn)算定義 半連接RS=R(RS)

=(2)半聯(lián)接操作的定義半連接運(yùn)算=44(2)半聯(lián)接操作的定義半連接作用 找出R中能夠與S中元組相連接的元組來(lái),類似于在連接之前先做選擇和投影。RS=(RS)SRS=(SR)R半連接的非對(duì)稱性RS(SR)定義RS=R(RS)

A=B

A=B(2)半聯(lián)接操作的定義半連接作用45(2)半聯(lián)接操作的定義半連接在分布式數(shù)據(jù)庫(kù)中的應(yīng)用 R與S位于不同場(chǎng)地S1,S2上,其屬性組分別為A,B,要作聯(lián)接操作。⒈在場(chǎng)地2對(duì)S做投影,然后把B(S)傳輸?shù)綀?chǎng)地1⒉在場(chǎng)地1執(zhí)行半聯(lián)接,設(shè)結(jié)果為R‘,然后把結(jié)果送到場(chǎng)地2。R‘=RS

A=B⒊在場(chǎng)地2執(zhí)行R‘與S的聯(lián)接操作,得到最后結(jié)果。RS=R'S(2)半聯(lián)接操作的定義半連接在分布式數(shù)據(jù)庫(kù)中的應(yīng)用46ABC123456889357BCD234578864238計(jì)算RS;RS;SR

3=2

3=1RSABC123456889357BCD23457886423847ABC123357ABC123456357BCD234578864238計(jì)算RS;RS;SR

3=2

3=1ABC123357ABC123456357BCD234578489.3.3基于聯(lián)接的查詢優(yōu)化策略在分布式查詢處理時(shí),究竟用半聯(lián)接還是用聯(lián)接方案,取決于數(shù)據(jù)傳輸和局部處理的相對(duì)費(fèi)用。9.3.3基于聯(lián)接的查詢優(yōu)化策略在分布式查詢處理時(shí),究竟用499.4客戶/服務(wù)器結(jié)構(gòu)的分布式系統(tǒng)9.4.1客戶/服務(wù)器式DBS在計(jì)算機(jī)中網(wǎng)絡(luò)中,有一些計(jì)算機(jī)扮演客戶,另一些扮演服務(wù)器,客戶統(tǒng)通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)向服務(wù)器提出計(jì)算請(qǐng)求,服務(wù)器經(jīng)過(guò)計(jì)算,將結(jié)果返回客戶機(jī)。這樣的計(jì)算機(jī)網(wǎng)絡(luò)稱為客戶/服務(wù)器計(jì)算機(jī)網(wǎng)絡(luò)。9.4客戶/服務(wù)器結(jié)構(gòu)的分布式系統(tǒng)9.4.1客戶/服務(wù)器509.4.1客戶/服務(wù)器式DBSClientServer客戶發(fā)出請(qǐng)求同意連接請(qǐng)求客戶發(fā)出服務(wù)請(qǐng)求服務(wù)器給出響應(yīng)連接建立Client客戶發(fā)出請(qǐng)求同意連接請(qǐng)求客戶發(fā)出服務(wù)請(qǐng)求服務(wù)器給出響應(yīng)連接建立9.4.1客戶/服務(wù)器式DBSClientServer客戶519.4.1客戶/服務(wù)器式DBS在客戶/服務(wù)器式DBS中,數(shù)據(jù)庫(kù)應(yīng)用的功能分為兩部分:1、前端部分:由應(yīng)用程序構(gòu)成2、后端部分:包括存取結(jié)果、查詢優(yōu)化、并發(fā)控制、恢復(fù)等系統(tǒng)程序。9.4.1客戶/服務(wù)器式DBS在客戶/服務(wù)器式DBS中,數(shù)529.4.2客戶/服務(wù)器結(jié)構(gòu)的分布式DBS1、分布式DBS的物理級(jí)客戶/服務(wù)器結(jié)構(gòu)2、客戶機(jī)和服務(wù)器的功能劃分方法3、分布式DBS的邏輯級(jí)客戶/服務(wù)器體系結(jié)構(gòu)9.4.2客戶/服務(wù)器結(jié)構(gòu)的分布式DBS1、分布式DBS的物53第九章分布式數(shù)據(jù)庫(kù)系統(tǒng)第九章分布式數(shù)據(jù)庫(kù)系統(tǒng)54本章內(nèi)容分布式數(shù)據(jù)庫(kù)系統(tǒng)概述分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)分布式查詢處理客戶/服務(wù)器結(jié)構(gòu)的分布式系統(tǒng)本章內(nèi)容分布式數(shù)據(jù)庫(kù)系統(tǒng)概述559.1分布式數(shù)據(jù)庫(kù)系統(tǒng)概述9.1.1集中式系統(tǒng)和分布式系統(tǒng)集中式數(shù)據(jù)庫(kù)管理系統(tǒng)的缺點(diǎn):通信開(kāi)銷大;系統(tǒng)的堅(jiān)固性差;性能差;可擴(kuò)充性差;設(shè)計(jì)、管理困難。分散式系統(tǒng):將數(shù)據(jù)庫(kù)分成多個(gè),建立在多臺(tái)計(jì)算機(jī)上,數(shù)據(jù)庫(kù)的管理、應(yīng)用程序的研制都是分開(kāi)并相互獨(dú)立的,之間不存在數(shù)據(jù)通行聯(lián)系。分布式數(shù)據(jù)庫(kù)系統(tǒng)的特點(diǎn):數(shù)據(jù)的分布性;統(tǒng)一性;透明性。統(tǒng)一性(兩個(gè)方面:數(shù)據(jù)在邏輯上的統(tǒng)一性和數(shù)據(jù)在管理上的統(tǒng)一性)分布式數(shù)據(jù)庫(kù)與集中式數(shù)據(jù)庫(kù)相比的優(yōu)點(diǎn):堅(jiān)固性好;可擴(kuò)充性好;可改善性能;自治性好。9.1分布式數(shù)據(jù)庫(kù)系統(tǒng)概述9.1.1集中式系統(tǒng)和分布式系569.1分布式數(shù)據(jù)庫(kù)系統(tǒng)概述與集中式數(shù)據(jù)庫(kù)相比,分布式DB具有:數(shù)據(jù)分布式的特點(diǎn)。與分散式數(shù)據(jù)庫(kù)相比,分布式DB具有:邏輯整體性的特點(diǎn)。9.1分布式數(shù)據(jù)庫(kù)系統(tǒng)概述與集中式數(shù)據(jù)庫(kù)相比,分布式DB具57背景數(shù)據(jù)庫(kù)系統(tǒng)+計(jì)算機(jī)網(wǎng)絡(luò)9.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義DB1DB1DB1計(jì)算機(jī)1計(jì)算機(jī)2計(jì)算機(jī)3通訊網(wǎng)絡(luò)T1T2T3T1T2T3T1T2T3背景數(shù)據(jù)庫(kù)系統(tǒng)+計(jì)算機(jī)網(wǎng)絡(luò)9.1.2分布式589.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義一個(gè)分布式系統(tǒng)由通信網(wǎng)絡(luò)聯(lián)接起來(lái)的結(jié)點(diǎn)的集合。每個(gè)結(jié)點(diǎn)都是擁有集中式數(shù)據(jù)庫(kù)的計(jì)算機(jī)系統(tǒng)。分布式數(shù)據(jù)庫(kù)的特點(diǎn):數(shù)據(jù)庫(kù)中的數(shù)據(jù)不是存儲(chǔ)在同一場(chǎng)地,而是分布存儲(chǔ)在多個(gè)場(chǎng)地。9.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義一個(gè)分布式系統(tǒng)由通信網(wǎng)絡(luò)聯(lián)599.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義分布性:數(shù)據(jù)存儲(chǔ)在不同場(chǎng)地上。與集中式數(shù)據(jù)庫(kù)不同。邏輯整體性:數(shù)據(jù)邏輯上是相互聯(lián)系的一個(gè)整體。與分散在計(jì)算機(jī)網(wǎng)絡(luò)不同站點(diǎn)上的一組沒(méi)有相互聯(lián)系的本地?cái)?shù)據(jù)庫(kù)區(qū)別開(kāi)來(lái)。9.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義分布性:數(shù)據(jù)存儲(chǔ)在不同場(chǎng)地609.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義物理上是分布的,邏輯上是統(tǒng)一的一組數(shù)據(jù)庫(kù)的集合要素計(jì)算機(jī)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)系統(tǒng)9.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義物理上是分布的,邏輯上是統(tǒng)61DB1DB1DB1計(jì)算機(jī)1計(jì)算機(jī)1計(jì)算機(jī)1通訊網(wǎng)絡(luò)北京重慶上海銀行系統(tǒng)訪問(wèn)本地銀行數(shù)據(jù):局部應(yīng)用通兌業(yè)務(wù)、轉(zhuǎn)賬業(yè)務(wù):全局應(yīng)用DB1DB1DB1計(jì)算機(jī)1計(jì)算機(jī)1計(jì)算機(jī)1通訊網(wǎng)絡(luò)北京重慶上629.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義全局應(yīng)用:指涉及到兩個(gè)或兩個(gè)以上場(chǎng)地中數(shù)據(jù)庫(kù)的應(yīng)用。網(wǎng)絡(luò)的每個(gè)站點(diǎn)具有獨(dú)立處理能力,可以執(zhí)行局部應(yīng)用,同時(shí)也能通過(guò)網(wǎng)絡(luò)執(zhí)行全局應(yīng)用。分布式數(shù)據(jù)庫(kù)是由一組數(shù)據(jù)庫(kù)組成,這些數(shù)據(jù)庫(kù)分布在計(jì)算機(jī)網(wǎng)絡(luò)的不同站點(diǎn)上,邏輯上是屬于同一個(gè)系統(tǒng)的。9.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義全局應(yīng)用:指涉及到兩個(gè)或兩639.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義分布式數(shù)據(jù)庫(kù)包含兩個(gè)重要組成部分:分布式數(shù)據(jù)庫(kù)和分布式數(shù)據(jù)庫(kù)管理系統(tǒng)。分布式數(shù)據(jù)庫(kù)是計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境中各場(chǎng)地上數(shù)據(jù)庫(kù)的邏輯集合。分布式數(shù)據(jù)庫(kù)管理系統(tǒng)是分布式數(shù)據(jù)庫(kù)系統(tǒng)中的一組軟件,它復(fù)雜管理分布環(huán)境下邏輯集成數(shù)據(jù)的存取、一致性、有效性和完備性。9.1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義分布式數(shù)據(jù)庫(kù)包含兩個(gè)重要組649.1.3分布式數(shù)據(jù)庫(kù)系統(tǒng)的透明性位置透明性 用戶或應(yīng)用程序不必了解它所使用的數(shù)據(jù)的存儲(chǔ)位置。舉例:銀行的借貸業(yè)務(wù):要判斷的情況有5種。復(fù)制透明性 有些數(shù)據(jù)并不存在一個(gè)場(chǎng)地,可能重復(fù)存放在不同的場(chǎng)地。本地?cái)?shù)據(jù)庫(kù)中也包含了外地?cái)?shù)據(jù)庫(kù)中的數(shù)據(jù)。

一個(gè)分布式系統(tǒng)有了這兩種透明性后,用戶看到的系統(tǒng)就如同一個(gè)集中式系統(tǒng)。9.1.3分布式數(shù)據(jù)庫(kù)系統(tǒng)的透明性位置透明性659.1.4分布式數(shù)據(jù)庫(kù)系統(tǒng)的優(yōu)缺點(diǎn)具有靈活的體系結(jié)構(gòu)數(shù)據(jù)庫(kù)的使用單位組織上、地理上是分布的適應(yīng)分布式管理和控制機(jī)構(gòu)。經(jīng)濟(jì)性能優(yōu)越經(jīng)濟(jì)上和組織上的理由系統(tǒng)的可靠性高,可用性好。局部應(yīng)用的響應(yīng)速度快。可擴(kuò)展性好,易于集成現(xiàn)有系統(tǒng)。既有數(shù)據(jù)庫(kù)互連,歷史繼承;數(shù)據(jù)資源共享系統(tǒng)規(guī)模逐步擴(kuò)展增加結(jié)點(diǎn),不影響現(xiàn)有系統(tǒng)運(yùn)行9.1.4分布式數(shù)據(jù)庫(kù)系統(tǒng)的優(yōu)缺點(diǎn)具有靈活的體系結(jié)構(gòu)669.1.4分布式數(shù)據(jù)庫(kù)系統(tǒng)的優(yōu)缺點(diǎn)缺點(diǎn):系統(tǒng)開(kāi)銷大,主要花在通信部分。復(fù)雜的存取結(jié)構(gòu)在集中式系統(tǒng)中是有效存取數(shù)據(jù)的重要基數(shù),但在分布式系統(tǒng)中不一定有效。數(shù)據(jù)的安全和行保密性較難處理。9.1.4分布式數(shù)據(jù)庫(kù)系統(tǒng)的優(yōu)缺點(diǎn)缺點(diǎn):679.1.5分布式數(shù)據(jù)庫(kù)系統(tǒng)的分類同構(gòu)同質(zhì)數(shù)據(jù)庫(kù)每個(gè)場(chǎng)地都用同一類型的數(shù)據(jù)模型,并運(yùn)行同一型號(hào)的DBMS同構(gòu)異質(zhì)數(shù)據(jù)庫(kù)每個(gè)場(chǎng)地都用同一類型的數(shù)據(jù)模型,但運(yùn)行不同型號(hào)的DBMS異構(gòu)數(shù)據(jù)庫(kù)場(chǎng)地上的數(shù)據(jù)庫(kù)系統(tǒng)不盡相同DBMS不同數(shù)據(jù)模型不同9.1.5分布式數(shù)據(jù)庫(kù)系統(tǒng)的分類同構(gòu)同質(zhì)數(shù)據(jù)庫(kù)68練習(xí):1、與集中式DB相比,分布式DB具有()特點(diǎn),與分散式DB相比,又具有()特點(diǎn)。2、區(qū)別系統(tǒng)是分散式還是分布式就是判定系統(tǒng)是否支持().3、在分布式DB中,用戶看到的系統(tǒng)如同一個(gè)集中式DBS,這是因?yàn)榉植际较到y(tǒng)具有()和()特點(diǎn)。4、如果各個(gè)場(chǎng)地都采用同類型數(shù)據(jù)模型,但DBMS不同型號(hào),這種系統(tǒng)屬于()型DBMS.1、數(shù)據(jù)分布性,邏輯整體性2、全局應(yīng)用3、位置透明性,復(fù)制透明性4、同構(gòu)異質(zhì)型DDBS.練習(xí):1、與集中式DB相比,分布式DB具有()特點(diǎn),與分散式699.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)9.2.1分布式數(shù)據(jù)存儲(chǔ)(1)數(shù)據(jù)分配數(shù)據(jù)分配是指數(shù)據(jù)在計(jì)算機(jī)網(wǎng)絡(luò)各場(chǎng)地上的分配策略。集中式:所有數(shù)據(jù)均安排在同一個(gè)場(chǎng)地上。分割式:所有數(shù)據(jù)只有一份,分布被安置在若干個(gè)場(chǎng)地。全復(fù)制式:數(shù)據(jù)在每個(gè)場(chǎng)地重復(fù)存儲(chǔ)?;旌鲜剑簲?shù)據(jù)庫(kù)分成若干可相交的子集,每一子集安置在一個(gè)或多個(gè)場(chǎng)地上,但是每一場(chǎng)地未必保存全部數(shù)據(jù)。9.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)9.2.1分布式數(shù)據(jù)存儲(chǔ)70分布式數(shù)據(jù)存儲(chǔ)(2)數(shù)據(jù)分片:分布式數(shù)據(jù)庫(kù)中的數(shù)據(jù)可以被分割和復(fù)制在物理場(chǎng)地的各個(gè)物理數(shù)據(jù)庫(kù)中。優(yōu)點(diǎn)將關(guān)系分片,有利于按用戶需求組織數(shù)據(jù)的分布。如產(chǎn)品→(內(nèi)銷產(chǎn)品,出口產(chǎn)品)。分片方式水平分片垂直分片導(dǎo)出分片混合分片分布式數(shù)據(jù)存儲(chǔ)(2)數(shù)據(jù)分片:分布式數(shù)據(jù)庫(kù)中的數(shù)據(jù)可以被分割71分布式數(shù)據(jù)存儲(chǔ)分布式數(shù)據(jù)存儲(chǔ)72分布式數(shù)據(jù)存儲(chǔ)1)水平分片 將關(guān)系r按行分為若干子集r1,r2,…,rn,每個(gè)子集ri稱為一個(gè)水平片段。 一個(gè)水平片段可以看成是關(guān)系上的一個(gè)選擇。ri=P(i)(r) 如M_S=sex=‘M’(S) 關(guān)系的重構(gòu)可以通過(guò)并運(yùn)算來(lái)實(shí)現(xiàn)。r=r1∪r2∪…∪rn分布式數(shù)據(jù)存儲(chǔ)1)水平分片73分布式數(shù)據(jù)存儲(chǔ)(2)垂直分片 將關(guān)系r按列分為若干屬性子集r1,r2,…,rn,每個(gè)子集ri稱為一個(gè)垂直片段。 一個(gè)垂直片段可以看成是關(guān)系上的一個(gè)投影。ri=∏Ri(r) 其中Ri是r的一個(gè)屬性子集。 如P_S=∏SNO,SNAME(S) 關(guān)系的重構(gòu)可以通過(guò)連接運(yùn)算來(lái)實(shí)現(xiàn)。r=r1r2…rn

要求所有垂直分片的片段都包括關(guān)系的鍵。分布式數(shù)據(jù)存儲(chǔ)(2)垂直分片74分布式數(shù)據(jù)存儲(chǔ)(3)混合分片關(guān)系按某種方式分片后,得到的片段再按另一種方式繼續(xù)分片。如SC(S#,C#,G,DNO)按學(xué)生系別分片,再對(duì)每個(gè)片段按成績(jī)(及格,不及格)分片。分布式數(shù)據(jù)存儲(chǔ)(3)混合分片75分布式數(shù)據(jù)存儲(chǔ)定義各種分片時(shí)必須遵守下面三個(gè)條件:1)完備性條件:必須把全局關(guān)系的所有數(shù)據(jù)映射到各個(gè)片段中,絕不允許發(fā)生屬于全局關(guān)系的某個(gè)數(shù)據(jù)不屬于任何一個(gè)片段。2)重構(gòu)條件:劃分所采用的方法必須確保能夠由各個(gè)分段重建全局關(guān)系。3)不相交條件:要求一個(gè)全局關(guān)系被劃分后得到的各個(gè)數(shù)據(jù)片段互相不重疊。目的是為了在數(shù)據(jù)分片時(shí)容易控制數(shù)據(jù)的復(fù)制。分布式數(shù)據(jù)存儲(chǔ)定義各種分片時(shí)必須遵守下面三個(gè)條件:769.2.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)全局外模式 全局應(yīng)用的用戶視圖。全局概念模式 定義D-DBS中數(shù)據(jù)的整體邏輯結(jié)構(gòu),數(shù)據(jù)如同沒(méi)有分布一樣。分片模式 每一個(gè)關(guān)系可以分為若干互不相交的部分,每一部分稱為一個(gè)片段。分配(分布)模式 定義片段的存放地點(diǎn)。9.2.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)全局外模式77用戶視圖用戶視圖全局視圖分片視圖分配視圖局部概念視圖局部概念視圖局部?jī)?nèi)視圖局部?jī)?nèi)視圖局部DB局部DB分布式集中式分片視圖分片視圖分配視圖分配視圖局部概念視圖局部?jī)?nèi)視圖局部DB用戶視圖用戶視圖全局視圖分片視圖分配視圖局部概念視圖局部概念78舉例:RR1R2R3R4R11R21R12R22R23R33R43S1S2S3邏輯片段物理映像一個(gè)全局關(guān)系的片段所對(duì)應(yīng)的存儲(chǔ)片段組成兩個(gè)物理映像可以相同。舉例:RR1R2R3R4R11R21R12R22R23R33799.2.3分布透明性分布(網(wǎng)絡(luò))透明性分片透明性(全局視圖和分片視圖之間) 用戶或應(yīng)用程序只對(duì)全局關(guān)系進(jìn)行操作而不必考慮關(guān)系的分片。如果分片模式改變了,通過(guò)調(diào)整全局模式與分片模式之間的映象關(guān)系來(lái)保持全局模式不變。位置透明性(分片視圖和分配視圖之間)

用戶或應(yīng)用程序不必了解片段的存儲(chǔ)位置。局部數(shù)據(jù)模型透明性(分配視圖和局部概念視圖之間)

用戶或應(yīng)用程序不必了解局部場(chǎng)地上使用的是哪種數(shù)據(jù)模型。9.2.3分布透明性分布(網(wǎng)絡(luò))透明性80RR1R2R3R4R11R21R12R22R23R33R43S1S2S3例子9.4RR1R2R3R4R11R21R12R22R23R33R43819.2.4分布式數(shù)據(jù)庫(kù)管理系統(tǒng)的功能及組成1、DDBMS的主要功能:接收用戶請(qǐng)求;訪問(wèn)網(wǎng)絡(luò)數(shù)據(jù)字典;如果目標(biāo)數(shù)據(jù)存儲(chǔ)于系統(tǒng)的多個(gè)計(jì)算機(jī)上,就必須進(jìn)行分布式處理;通信接口功能;在一個(gè)異構(gòu)型分布式處理環(huán)境中,還需要提供數(shù)據(jù)和進(jìn)程移植的支持。2、DDBMS的組成:查詢處理子系統(tǒng)、完整性子系統(tǒng)、調(diào)度子系統(tǒng)和可靠性子系統(tǒng)。9.2.4分布式數(shù)據(jù)庫(kù)管理系統(tǒng)的功能及組成1、DDBMS的829.2.5分布式數(shù)據(jù)庫(kù)系統(tǒng)中存在的問(wèn)題1、不同場(chǎng)地的通信速度,與局部DBS的存儲(chǔ)部件的存取速度相比,是非常慢的。2、通信系統(tǒng)有較高的存取延遲時(shí)間。3、在CPU上處理通信的代價(jià)很高。4、不同通信系統(tǒng)有不同意義的字符,數(shù)據(jù)轉(zhuǎn)換速度也不一樣,可以相差1000倍,存取延遲時(shí)間可能相差106倍。9.2.5分布式數(shù)據(jù)庫(kù)系統(tǒng)中存在的問(wèn)題1、不同場(chǎng)地的通信速839.3分布式查詢處理分布式數(shù)據(jù)庫(kù)系統(tǒng)中由于數(shù)據(jù)分布在各個(gè)場(chǎng)地,因此,查詢的處理比集中式數(shù)據(jù)庫(kù)復(fù)雜。9.3分布式查詢處理分布式數(shù)據(jù)庫(kù)系統(tǒng)中由于數(shù)據(jù)分布在各個(gè)場(chǎng)849.3.1查詢處理的傳輸代價(jià)Site-1Site-2EMPLOYEE104個(gè)記錄每個(gè)記錄100字節(jié)DEPARTMENT100個(gè)記錄每個(gè)記錄100字節(jié)檢索每個(gè)職工的姓名、地址及工作部門(mén)名 selectENAME,ADDRESS,DNAME

fromEMPLOYEE,DEPARTMENT

whereDNO=DNUMBER網(wǎng)絡(luò)傳輸速度104字節(jié)/秒9.3.1查詢處理的傳輸代價(jià)Site-1Site-2EMP85分布式查詢處理⒈把關(guān)系EMPLOYEE和DEPARTMENT分布從場(chǎng)地1和場(chǎng)地2傳到場(chǎng)地3,然后在場(chǎng)地3站進(jìn)行查詢 傳送時(shí)間T=(104100+10035

)/104=100s32 傳送時(shí)間T=總傳輸延遲+總數(shù)據(jù)量/傳輸速度1分布式查詢處理⒈把關(guān)系EMPLOYEE和DEPARTMENT86分布式查詢處理⒉把關(guān)系EMPLOYEE傳送到場(chǎng)地2,在場(chǎng)地2作聯(lián)接,再把操作結(jié)構(gòu)從場(chǎng)地2傳到場(chǎng)地3: 傳送時(shí)間T=(104100+400000

)/104=140s132分布式查詢處理⒉把關(guān)系EMPLOYEE傳送到場(chǎng)地2,在場(chǎng)地287分布式查詢處理3.把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在場(chǎng)地1作聯(lián)接,再把操作結(jié)構(gòu)從場(chǎng)地1傳到場(chǎng)地3: 傳送時(shí)間T=(3500+400000

)/104=40s132分布式查詢處理3.把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在88分布式查詢處理2)在場(chǎng)地3有一個(gè)查詢“檢索每個(gè)部門(mén)的名字和其經(jīng)理的姓名、地址”。selectDNAME,ENAME,ADDRESS

fromEMPLOYEE,DEPARTMENT

whereMGRENO=ENO分布式查詢處理2)在場(chǎng)地3有一個(gè)查詢“檢索每個(gè)部門(mén)的名字和其89分布式查詢處理⒈把關(guān)系EMPLOYEE和DEPARTMENT分布從場(chǎng)地1和場(chǎng)地2傳到場(chǎng)地3,然后在場(chǎng)地3站進(jìn)行查詢 傳送時(shí)間T=(104100+3500

)/104=100s32 傳送時(shí)間T=總傳輸延遲+總數(shù)據(jù)量/傳輸速度1分布式查詢處理⒈把關(guān)系EMPLOYEE和DEPARTMENT90分布式查詢處理⒉把關(guān)系EMPLOYEE傳送到場(chǎng)地2,在場(chǎng)地2作聯(lián)接,再把操作結(jié)構(gòu)從場(chǎng)地2傳到場(chǎng)地3: 傳送時(shí)間T=(104100+4000

)/104=100s132分布式查詢處理⒉把關(guān)系EMPLOYEE傳送到場(chǎng)地2,在場(chǎng)地291分布式查詢處理3.把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在場(chǎng)地1作聯(lián)接,再把操作結(jié)構(gòu)從場(chǎng)地1傳到場(chǎng)地3: 傳送時(shí)間T=(3500+4000

)/104=0.75s132分布式查詢處理3.把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在92分布式查詢處理3)如果在場(chǎng)地2提出上述兩個(gè)查詢Q1和Q2,可以有兩種方法:4、把關(guān)系EMPLOYEE傳送到場(chǎng)地2,在場(chǎng)地2作聯(lián)接,此時(shí)Q1和Q2的傳輸量都是1000000,時(shí)間都是100秒。12Q1Q2分布式查詢處理3)如果在場(chǎng)地2提出上述兩個(gè)查詢Q1和Q2,可93分布式查詢處理5.把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在場(chǎng)地1作聯(lián)接,再把結(jié)果從場(chǎng)地1傳到場(chǎng)地2,此時(shí)Q1的傳輸量為:3500+400000=403500,時(shí)間是40秒。Q2的傳輸量都是3500+4000=7500,時(shí)間是0.75秒。12分布式查詢處理5.把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在949.3.2基于半聯(lián)接的查詢優(yōu)化策略數(shù)據(jù)在網(wǎng)絡(luò)中傳輸,如果都以整個(gè)關(guān)系傳輸,顯然是一種冗余。不參與聯(lián)接的值或無(wú)用的值不必在網(wǎng)絡(luò)中來(lái)回傳輸。(1)、基于半聯(lián)接的查詢實(shí)例:如果在場(chǎng)地2提出上述兩個(gè)查詢Q1和Q2,可以有兩種方法:把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在場(chǎng)地1作聯(lián)接,再把結(jié)果從場(chǎng)地1傳到場(chǎng)地2。可以改進(jìn):1)在場(chǎng)地2,用投影求得關(guān)系DEPARTMENT中參與聯(lián)接操作的屬性值,把投影結(jié)果傳輸?shù)綀?chǎng)地1。Q1:數(shù)據(jù)傳輸量是400字節(jié)(DEPARTMENT在DNUMBER上的投影)。Q2:數(shù)據(jù)傳輸量是900字節(jié)(DEPARTMENT在MGRENO上的投影)。9.3.2基于半聯(lián)接的查詢優(yōu)化策略數(shù)據(jù)在網(wǎng)絡(luò)中傳輸,如果都以959.3.2基于半聯(lián)接的查詢優(yōu)化策略2)在場(chǎng)地1,執(zhí)行聯(lián)接操作,并用投影求出所需的屬性值,把結(jié)果送到場(chǎng)地2。Q

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論