數(shù)據(jù)庫(kù)原理與應(yīng)用概論數(shù)據(jù)庫(kù)新技術(shù)_第1頁(yè)
數(shù)據(jù)庫(kù)原理與應(yīng)用概論數(shù)據(jù)庫(kù)新技術(shù)_第2頁(yè)
數(shù)據(jù)庫(kù)原理與應(yīng)用概論數(shù)據(jù)庫(kù)新技術(shù)_第3頁(yè)
數(shù)據(jù)庫(kù)原理與應(yīng)用概論數(shù)據(jù)庫(kù)新技術(shù)_第4頁(yè)
數(shù)據(jù)庫(kù)原理與應(yīng)用概論數(shù)據(jù)庫(kù)新技術(shù)_第5頁(yè)
已閱讀5頁(yè),還剩45頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)庫(kù)原理與應(yīng)用概論數(shù)據(jù)庫(kù)新技術(shù)第一頁(yè),共五十頁(yè),2022年,8月28日第七章數(shù)據(jù)庫(kù)新技術(shù)數(shù)據(jù)庫(kù)新技術(shù)概述面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng)分布式數(shù)據(jù)庫(kù)系統(tǒng)并行數(shù)據(jù)庫(kù)系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘第二頁(yè),共五十頁(yè),2022年,8月28日7.1數(shù)據(jù)庫(kù)新技術(shù)概述

1.新一代數(shù)據(jù)庫(kù)系統(tǒng)的特點(diǎn)(1)面向?qū)ο蟮姆椒ê图夹g(shù)對(duì)數(shù)據(jù)庫(kù)發(fā)展的影響最為深遠(yuǎn)(2)數(shù)據(jù)庫(kù)技術(shù)與多學(xué)科技術(shù)的有機(jī)結(jié)合(3)面向應(yīng)用領(lǐng)域的數(shù)據(jù)庫(kù)技術(shù)的研究第三頁(yè),共五十頁(yè),2022年,8月28日2.第三代數(shù)據(jù)庫(kù)系統(tǒng)的基本特征(1)第三代數(shù)據(jù)庫(kù)系統(tǒng)應(yīng)支持?jǐn)?shù)據(jù)管理、對(duì)象管理和知識(shí)管理(2)第三代數(shù)據(jù)庫(kù)系統(tǒng)必須保持或繼承第二代數(shù)據(jù)庫(kù)系統(tǒng)的技術(shù)(3)第三代數(shù)據(jù)庫(kù)系統(tǒng)必須對(duì)其它系統(tǒng)開(kāi)放第四頁(yè),共五十頁(yè),2022年,8月28日7.2面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng)

7.2.1面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng)概述面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng)(ObjectOrientedDatabaseSystem,簡(jiǎn)稱為OODBS)是數(shù)據(jù)庫(kù)技術(shù)與面向?qū)ο蟪绦蛟O(shè)計(jì)相結(jié)合的產(chǎn)物。

1.面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng)主要研究的問(wèn)題有:對(duì)象數(shù)據(jù)模型高效的查詢語(yǔ)言并發(fā)的事務(wù)處理技術(shù)對(duì)象的存儲(chǔ)管理版本管理等第五頁(yè),共五十頁(yè),2022年,8月28日2.面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng)的功能要求

(1)在數(shù)據(jù)模型方面,引入面向?qū)ο蟮母拍睿簩?duì)象、類、對(duì)象標(biāo)識(shí)、封裝、繼承、多態(tài)性、類層次結(jié)構(gòu)等。(2)在數(shù)據(jù)庫(kù)管理方面,提供對(duì)持久對(duì)象、長(zhǎng)事務(wù)的處理、并發(fā)控制、完整性約束、版本管理和模式演化等能力。(3)在數(shù)據(jù)庫(kù)界面方面,支持消息傳遞,提供計(jì)算能力完備的數(shù)據(jù)庫(kù)語(yǔ)言,解決數(shù)據(jù)庫(kù)語(yǔ)言與宿主語(yǔ)言的失配問(wèn)題,并且數(shù)據(jù)庫(kù)語(yǔ)言應(yīng)具有類似SQL的非過(guò)程化的查詢功能。除此之外,面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng)還要求兼顧對(duì)傳統(tǒng)的關(guān)系數(shù)據(jù)的管理能力第六頁(yè),共五十頁(yè),2022年,8月28日7.2.2面向?qū)ο蟮幕靖拍?/p>

1.面向?qū)ο蟮暮诵母拍?/p>

(1)對(duì)象:數(shù)據(jù)庫(kù)中的每個(gè)事物都看作是一個(gè)對(duì)象,而且每個(gè)對(duì)象是惟一可標(biāo)識(shí)的。對(duì)象可以是有形的或抽象的,簡(jiǎn)單的或復(fù)雜的。(2)對(duì)象標(biāo)識(shí):每個(gè)對(duì)象有一個(gè)唯一的標(biāo)識(shí),稱為對(duì)象標(biāo)識(shí)(OID)。OID是獨(dú)立于屬性值的、系統(tǒng)全局惟一的。OID用來(lái)標(biāo)識(shí)兩個(gè)不同的對(duì)象,常見(jiàn)的OID有以下幾種:①值標(biāo)識(shí):用值來(lái)表示標(biāo)識(shí)。這是關(guān)系數(shù)據(jù)庫(kù)中使用的標(biāo)識(shí)形式。②名標(biāo)識(shí):用戶提供一個(gè)名字來(lái)表示標(biāo)識(shí)。這是程序變量標(biāo)識(shí)的一種典型表示形式。程序中的每個(gè)變量被賦予一個(gè)名字,變量名可以唯一地標(biāo)識(shí)每個(gè)變量,不需要考慮變量的值。③內(nèi)標(biāo)識(shí):標(biāo)識(shí)的概念建立在數(shù)據(jù)模型或程序設(shè)計(jì)語(yǔ)言中,不要求用戶給出標(biāo)識(shí)。這種形式的標(biāo)識(shí)是面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng)使用的標(biāo)識(shí)形式。第七頁(yè),共五十頁(yè),2022年,8月28日(3)類:共享同樣屬性和方法的所有對(duì)象構(gòu)成了一個(gè)對(duì)象類(CLASS),一個(gè)對(duì)象是某一個(gè)類的實(shí)例。(4)封裝:每一個(gè)對(duì)象是其屬性與行為的封裝,其中屬性是該對(duì)象一系列屬性值的集合,行為是在對(duì)象屬性上操作的集合,操作也被稱為方法。(5)繼承:在OO模型中有兩種繼承:?jiǎn)卫^承與多重繼承。若一個(gè)子類只能繼承一個(gè)超類的特性,這種繼承稱為單繼承;若一個(gè)子類繼承多個(gè)超類的特性,這種繼承稱為多重繼承。(6)消息:對(duì)象是封裝的,對(duì)象與外部的通信一般通過(guò)顯式的消息傳遞,即消息從外部傳送給對(duì)象,存取和調(diào)用對(duì)象中的屬性和方法,在內(nèi)部執(zhí)行所要求的操作,而操作的結(jié)果仍以消息的形式返回。第八頁(yè),共五十頁(yè),2022年,8月28日2.對(duì)象間的聯(lián)系(1)類層次某學(xué)校數(shù)據(jù)庫(kù)的類層次結(jié)構(gòu)圖對(duì)一個(gè)類來(lái)說(shuō),它可以有多個(gè)超類,也可以繼承類層次中其直接或間接超類的屬性和方法。超類與子類結(jié)構(gòu)在語(yǔ)義上具有泛化與特化的關(guān)系,也即常說(shuō)的Is-a關(guān)系。第九頁(yè),共五十頁(yè),2022年,8月28日(2)對(duì)象包含

類之間的包含關(guān)系表現(xiàn)了事物的局部與整體關(guān)系(組合關(guān)系),即a-part-of關(guān)系。一個(gè)包含了其他對(duì)象的對(duì)象稱為復(fù)合對(duì)象。復(fù)合對(duì)象主要的三種形式。①具有共享子對(duì)象的網(wǎng)絡(luò)結(jié)構(gòu)②組合對(duì)象層次結(jié)構(gòu)③聚合屬性第十頁(yè),共五十頁(yè),2022年,8月28日7.2.3面向?qū)ο笤O(shè)計(jì)方法

面向?qū)ο笫且环N先進(jìn)的設(shè)計(jì)方法學(xué),也是一種認(rèn)知方法學(xué),相應(yīng)的程序設(shè)計(jì)語(yǔ)言主要有C++、JAVA等。面向?qū)ο笤O(shè)計(jì)就是把數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)結(jié)構(gòu)上的操作算法封裝在一個(gè)對(duì)象之中。在面向?qū)ο蟪绦蛟O(shè)計(jì)中,操作名列在封裝對(duì)象的界面上,當(dāng)其他對(duì)象要啟動(dòng)它的某個(gè)操作時(shí),以操作名發(fā)送一條消息,該對(duì)象接收消息,執(zhí)行具體的行為動(dòng)作序列,完成對(duì)成員數(shù)據(jù)的加工。當(dāng)一個(gè)面向?qū)ο蟮某绦蜻\(yùn)行完畢時(shí),各對(duì)象也就達(dá)到了各自的終態(tài)。輸入、輸出也由對(duì)象自己完成。面向?qū)ο蟪绦蛟O(shè)計(jì)方法所支持的封裝、繼承等特性提供了同時(shí)表示、同時(shí)管理程序和數(shù)據(jù)的統(tǒng)一框架。第十一頁(yè),共五十頁(yè),2022年,8月28日7.2.4面向?qū)ο髷?shù)據(jù)庫(kù)

面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng)支持面向?qū)ο髷?shù)據(jù)模型,是一個(gè)持久的、可共享的對(duì)象庫(kù)的存儲(chǔ)和管理者;而一個(gè)對(duì)象庫(kù)是由一個(gè)OO模型所定義的對(duì)象集合體。1.持久性

持久性是指一個(gè)對(duì)象在超過(guò)其生存周期后的保存,就是將臨時(shí)對(duì)象存儲(chǔ)到磁盤(pán)上,轉(zhuǎn)換為永久對(duì)象,使對(duì)象的存活期與創(chuàng)建它的進(jìn)程無(wú)關(guān),以解決對(duì)象的重用問(wèn)題。一個(gè)標(biāo)識(shí)的持久性主要有以下幾種情況:(1)過(guò)程內(nèi)持久標(biāo)識(shí)(IntraprocedureIdentity)(2)程序內(nèi)持久標(biāo)識(shí)(IntraprogramIdentity)標(biāo)識(shí)只在一個(gè)程序或查詢的執(zhí)行中持久有效。例如,對(duì)于一個(gè)程序中全局變量的標(biāo)識(shí),在該程序的運(yùn)行中有效。(3)程序間持久標(biāo)識(shí)(InterprogramIdentity)(4)持久標(biāo)識(shí)(PersistentIdentity)

面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng)要求存儲(chǔ)永久對(duì)象。

第十二頁(yè),共五十頁(yè),2022年,8月28日2.面向?qū)ο髷?shù)據(jù)庫(kù)面向?qū)ο髷?shù)據(jù)庫(kù)模式是類的集合。面向?qū)ο蟮臄?shù)據(jù)模型提供了類層次結(jié)構(gòu)。在面向?qū)ο髷?shù)據(jù)庫(kù)模式中,一組類可形成一個(gè)類層次。一個(gè)面向?qū)ο髷?shù)據(jù)庫(kù)可能有多個(gè)類層次。3.面向?qū)ο髷?shù)據(jù)庫(kù)的特性(1)滯后聯(lián)編(2)對(duì)象的嵌套第十三頁(yè),共五十頁(yè),2022年,8月28日7.2.5面向?qū)ο髷?shù)據(jù)庫(kù)語(yǔ)言

OODB語(yǔ)言用于描述面向?qū)ο髷?shù)據(jù)庫(kù)模式,說(shuō)明并操縱類定義與對(duì)象實(shí)例。OODB語(yǔ)言主要包括對(duì)象定義語(yǔ)言(ODL)和對(duì)象操縱語(yǔ)言(OML),對(duì)象操縱語(yǔ)言中一個(gè)重要子集是對(duì)象查詢語(yǔ)言。

OODB語(yǔ)言一般應(yīng)具備下列功能:

(1)類的定義與操縱(2)操作/方法的定義(3)對(duì)象的操縱第十四頁(yè),共五十頁(yè),2022年,8月28日7.2.6面向?qū)ο髷?shù)據(jù)庫(kù)的模式演進(jìn)

面向?qū)ο髷?shù)據(jù)庫(kù)的模式是類的集合。模式為適應(yīng)需求變化而隨著時(shí)間變化稱為模式演進(jìn)。模式演進(jìn)包括建立新的類、刪除舊的類、修改類的屬性和操作等。面向?qū)ο髷?shù)據(jù)庫(kù)模式的修改要比關(guān)系模式的修改復(fù)雜,其主要原因有兩點(diǎn):(1)模式改變頻繁。OODB應(yīng)用通常需要頻繁地改變OODB數(shù)據(jù)庫(kù)模式。(2)模式修改復(fù)雜。OO模型具有很強(qiáng)的建模能力和豐富的語(yǔ)義,包括類自身的語(yǔ)義、類屬性之間和類之間豐富的語(yǔ)義聯(lián)系,可能使模式修改操作復(fù)雜多樣。在OODB中,模式演進(jìn)往往是動(dòng)態(tài)的。第十五頁(yè),共五十頁(yè),2022年,8月28日1.模式一致性模式一致性是指模式自身內(nèi)部不能出現(xiàn)矛盾和錯(cuò)誤,它由模式一致性約束來(lái)刻畫(huà)。模式的演進(jìn)必須要保持模式的一致性。模式一致性約束可分為:(1)惟一性約束:這一類約束條件要求名字惟一性。例如,在同一模式中所有類的名字必須惟一;類中屬性名和方法名必須惟一,包括從超類中繼承的屬性和方法。但模式的不同種類的成分可以同名,如屬性的名字和方法可以同名。(2)存在性約束:顯式引用的某些成分必須存在。例如,不能引用一個(gè)沒(méi)有在模式中定義的類。(3)子類型約束:例如,不允許有從多繼承帶來(lái)的任何沖突等。第十六頁(yè),共五十頁(yè),2022年,8月28日2.模式演進(jìn)的操作與實(shí)現(xiàn)模式演進(jìn)操作主要有:(1)類集的改變,包括創(chuàng)建新的類,刪除已有類,改變已有類等等。(2)已有類的成分的改變,包括增加新的屬性或新的操作/方法,刪除已有的屬性或操作,改變已有屬性的名字或類型,改變一個(gè)操作的名稱或操作的實(shí)現(xiàn)。(3)子類/超類之間聯(lián)系的改變,包括增加一個(gè)新的超類、刪除一個(gè)已有超類。所謂轉(zhuǎn)換方法是指在OO數(shù)據(jù)庫(kù)中,已有的對(duì)象將要根據(jù)新的模式結(jié)構(gòu)進(jìn)行轉(zhuǎn)換,以適應(yīng)新的模式。根據(jù)轉(zhuǎn)換發(fā)生的時(shí)間有以下轉(zhuǎn)換方式:①立即轉(zhuǎn)換方式。一旦模式變化立即執(zhí)行所有變換,缺點(diǎn)是系統(tǒng)為了執(zhí)行轉(zhuǎn)換需要消耗一些時(shí)間。②延遲轉(zhuǎn)換方式。模式變化后不是立即執(zhí)行,而是延遲到低層數(shù)據(jù)庫(kù)載入時(shí),或者延遲到該對(duì)象被存取時(shí)才執(zhí)行變換。缺點(diǎn)是應(yīng)用程序存取一個(gè)對(duì)象時(shí),要把它的結(jié)構(gòu)與其所屬類的定義比較,完成必須的修改,處理效率較低。③多模式版本方式。第十七頁(yè),共五十頁(yè),2022年,8月28日7.2.7面向?qū)ο髷?shù)據(jù)庫(kù)的事務(wù)管理

1.長(zhǎng)事務(wù)2.嵌套的事務(wù)3.合作事務(wù)

第十八頁(yè),共五十頁(yè),2022年,8月28日7.3分布式數(shù)據(jù)庫(kù)系統(tǒng)

20世紀(jì)70年代,由于計(jì)算機(jī)網(wǎng)絡(luò)通信的迅速發(fā)展,以及地理上分散的公司、團(tuán)體和組織對(duì)數(shù)據(jù)庫(kù)更為廣泛應(yīng)用的需求,在集中式數(shù)據(jù)庫(kù)系統(tǒng)成熟技術(shù)的基礎(chǔ)上誕生和發(fā)展了分布式數(shù)據(jù)庫(kù)系統(tǒng)(DistributedDatabaseSystem,DDBS)。分布式數(shù)據(jù)庫(kù)系統(tǒng)是數(shù)據(jù)庫(kù)技術(shù)和網(wǎng)絡(luò)技術(shù)兩者相互滲透和有機(jī)組合的結(jié)果。經(jīng)過(guò)20多年的發(fā)展,分布式數(shù)據(jù)庫(kù)系統(tǒng)已發(fā)展得相當(dāng)成熟,并產(chǎn)生了一些產(chǎn)品,如Ingres公司的Ingres/Star,IBMSanJose實(shí)驗(yàn)室開(kāi)發(fā)的分布式數(shù)據(jù)庫(kù)系統(tǒng)SystemR*,Oracle公司的SQL*Star等。第十九頁(yè),共五十頁(yè),2022年,8月28日

7.3.1分布式數(shù)據(jù)庫(kù)概述1.分布式數(shù)據(jù)庫(kù)系統(tǒng)的概念一個(gè)分布式數(shù)據(jù)庫(kù)系統(tǒng)強(qiáng)調(diào)數(shù)據(jù)的分布性,數(shù)據(jù)分布存儲(chǔ)在網(wǎng)絡(luò)的不同計(jì)算機(jī)(又稱結(jié)點(diǎn)或場(chǎng)地)上,各個(gè)場(chǎng)地既具有高度的自治性,同時(shí)又強(qiáng)調(diào)各場(chǎng)地系統(tǒng)之間的協(xié)作性。對(duì)使用數(shù)據(jù)庫(kù)中數(shù)據(jù)的用戶來(lái)說(shuō),一個(gè)分布式數(shù)據(jù)庫(kù)系統(tǒng)在邏輯上看就如同一個(gè)集中式數(shù)據(jù)庫(kù)系統(tǒng)一樣,用戶可以在任何一個(gè)場(chǎng)地執(zhí)行全局應(yīng)用和(或)局部應(yīng)用。一個(gè)分布式數(shù)據(jù)庫(kù)系統(tǒng)的示意圖第二十頁(yè),共五十頁(yè),2022年,8月28日2.分布式數(shù)據(jù)庫(kù)系統(tǒng)的特點(diǎn)下面來(lái)概括一下分布式數(shù)據(jù)庫(kù)系統(tǒng)的三個(gè)主要特點(diǎn):(1)數(shù)據(jù)的物理分布性。。(2)數(shù)據(jù)的邏輯整體性。(3)結(jié)點(diǎn)的自主性。3.分布式數(shù)據(jù)庫(kù)系統(tǒng)的透明性(1)位置透明性(2)復(fù)制透明性4.分布式數(shù)據(jù)庫(kù)系統(tǒng)的分類(1)同構(gòu)同質(zhì)型DDBS。(2)同構(gòu)異質(zhì)型DDBS。(3)異構(gòu)型DDBS。第二十一頁(yè),共五十頁(yè),2022年,8月28日

7.3.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)1.分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)

第二十二頁(yè),共五十頁(yè),2022年,8月28日2.?dāng)?shù)據(jù)分配集中式分割式復(fù)制式混合式進(jìn)行數(shù)據(jù)分配時(shí)注意把握以下一些原則:盡量把本地需要的數(shù)據(jù)存儲(chǔ)在本地,減少遠(yuǎn)程通信操作的開(kāi)銷;保證數(shù)據(jù)的可用性和系統(tǒng)的可靠性;盡量平衡各個(gè)場(chǎng)地的負(fù)載,提高整個(gè)系統(tǒng)的并行處理能力等第二十三頁(yè),共五十頁(yè),2022年,8月28日7.3.3分布式數(shù)據(jù)庫(kù)管理系統(tǒng)

1.分布式數(shù)據(jù)庫(kù)管理系統(tǒng)的組成LDBMS(LocalDBMS):即局部場(chǎng)地上的數(shù)據(jù)庫(kù)管理系統(tǒng),其功能是建立和管理局部數(shù)據(jù)庫(kù),提供場(chǎng)地自治能力,執(zhí)行局部應(yīng)用及全局查詢的子查詢。GDBMS(GlobalDBMS):即全局?jǐn)?shù)據(jù)庫(kù)管理系統(tǒng),主要功能是提供分布透明性,協(xié)調(diào)全局事務(wù)的執(zhí)行,協(xié)調(diào)各局部DBMS以完成全局應(yīng)用,保證數(shù)據(jù)庫(kù)的全局一致性,執(zhí)行并發(fā)控制,實(shí)現(xiàn)更新同步,提供全局恢復(fù)功能等。全局?jǐn)?shù)據(jù)字典(GlobalDataDirectory,簡(jiǎn)稱GDD):用來(lái)存放全局概念模式、分片模式、分布模式的定義以及各模式之間映像的定義,存放用戶存取權(quán)限的定義,以保證全部用戶的合法權(quán)限和數(shù)據(jù)庫(kù)的安全性;另外,還存放數(shù)據(jù)完整性約束條件的定義,其功能與集中式數(shù)據(jù)庫(kù)的數(shù)據(jù)字典類似。通信管理(CommunicationManagement,簡(jiǎn)稱CM):負(fù)責(zé)在分布式數(shù)據(jù)庫(kù)的各場(chǎng)地之間傳送消息和數(shù)據(jù),完成通信功能。第二十四頁(yè),共五十頁(yè),2022年,8月28日2.分布式數(shù)據(jù)庫(kù)管理系統(tǒng)的分類其按全局控制方式可以分為以下3種:(1)全局控制集中的DDBMS(2)全局控制分散的DDBMS(3)全局控制部分分散的DDBMS按局部DBMS的類型分類它區(qū)分不同DDBMS的一個(gè)重要特性是:局部DBMS是同構(gòu)的還是異構(gòu)的。同構(gòu)和異構(gòu)的級(jí)別可以有三級(jí):硬件、操作系統(tǒng)和局部DBMS。

第二十五頁(yè),共五十頁(yè),2022年,8月28日7.3.4分布式數(shù)據(jù)庫(kù)查詢處理和優(yōu)化

1.查詢優(yōu)化的意義2.查詢優(yōu)化要做的工作(1)全局查詢分解(2)確定操作執(zhí)行的次序(3)確定執(zhí)行操作的方法

3.分布式查詢處理的層次結(jié)構(gòu)分布式查詢處理的層次模式

第二十六頁(yè),共五十頁(yè),2022年,8月28日7.3.5分布事務(wù)管理

1.分布事務(wù)的恢復(fù)為了執(zhí)行分布事務(wù),通常在每個(gè)場(chǎng)地上都設(shè)立一個(gè)局部事務(wù)管理器,用來(lái)管理局部子事務(wù)的執(zhí)行,保證子事務(wù)的完整性。同時(shí),這些局部管理器之間還必須相互協(xié)調(diào),保證所有場(chǎng)地對(duì)它們所處理的子事務(wù)采取同樣的策略:要么都提交,要么都回滾。為了保證這一策略,最常用的技術(shù)是兩段提交協(xié)議(簡(jiǎn)稱2PC)。兩段提交協(xié)議把一個(gè)分布事務(wù)的事務(wù)管理分為兩類:協(xié)調(diào)者,所有其他的是參與者。只有協(xié)調(diào)者才有掌握提交或撤消事務(wù)的決定權(quán),而所有參與者各自負(fù)責(zé)在其本地?cái)?shù)據(jù)庫(kù)中執(zhí)行寫(xiě)操作,并向協(xié)調(diào)者提出撤消或提交子事務(wù)的意向。第二十七頁(yè),共五十頁(yè),2022年,8月28日兩段提交協(xié)議的內(nèi)容如下:(1)第一階段:開(kāi)始時(shí),協(xié)調(diào)者在它的日志中寫(xiě)入一條開(kāi)始提交的記錄,再向所有參與者發(fā)出“準(zhǔn)備提交”信息,并進(jìn)入等待狀態(tài)。當(dāng)參與者收到“準(zhǔn)備”消息后,它檢查是否能夠提交本地事務(wù)。如果某個(gè)參與者準(zhǔn)備提交,就在日志中寫(xiě)入一條就緒記錄,并向協(xié)調(diào)者發(fā)送“建議提交”信息,然后進(jìn)入就緒狀態(tài);否則,參與者寫(xiě)入撤消記錄,并向協(xié)調(diào)者發(fā)送“撤銷”信息。如果在規(guī)定時(shí)間內(nèi)協(xié)調(diào)者收到了所有參與者“建議提交”的信息,則將做出提交的決定,否則將做出撤銷的決定。(2)第二階段:協(xié)調(diào)者將有關(guān)決定的信息先寫(xiě)入日志,然后把這個(gè)決定發(fā)送給所有的參與者。所有參與者收到命令之后,首先往日志中寫(xiě)入“收到提交(或撤銷)”決定的信息,并向協(xié)調(diào)者發(fā)送“應(yīng)答”消息,最后執(zhí)行有關(guān)決定。協(xié)調(diào)者收到所有參與者的應(yīng)答消息后,一個(gè)事務(wù)的執(zhí)行到此結(jié)束,有關(guān)日志信息可以脫機(jī)保存。第二十八頁(yè),共五十頁(yè),2022年,8月28日2.并發(fā)控制在分布式數(shù)據(jù)庫(kù)系統(tǒng)中,并發(fā)控制也可采用封鎖技術(shù),不過(guò)與集中式數(shù)據(jù)庫(kù)系統(tǒng)相比,分布式數(shù)據(jù)庫(kù)系統(tǒng)要支持多副本以及因事務(wù)的分布執(zhí)行其封鎖的方法可能會(huì)引起全局死鎖這兩個(gè)原因,使得并發(fā)控制更為復(fù)雜。為了解決多副本問(wèn)題,分布事務(wù)管理就要把“事務(wù)Tl對(duì)d的X封鎖”這件事讓d副本所在場(chǎng)地上的事務(wù)管理器都知道,一個(gè)簡(jiǎn)單的方法是向這些場(chǎng)地的事務(wù)管理器發(fā)出局部封鎖請(qǐng)求,這個(gè)辦法是有效的;但封鎖的冗余度很大,局部封鎖的數(shù)目和副本數(shù)相同。第二十九頁(yè),共五十頁(yè),2022年,8月28日

為了減少系統(tǒng)開(kāi)銷,處理多副本的封鎖可采取如下幾種方法:(1)對(duì)寫(xiě)操作,要申請(qǐng)對(duì)所有副本的X鎖。對(duì)于讀操作,只要申請(qǐng)對(duì)某個(gè)副本的S鎖。(2)無(wú)論是寫(xiě)操作,還是讀操作都要對(duì)多數(shù)(大于半數(shù))副本申請(qǐng)X鎖或S鎖。(3)規(guī)定某個(gè)場(chǎng)地上的副本為主副本,所有的讀寫(xiě)操作均申請(qǐng)對(duì)主副本的封鎖。第三十頁(yè),共五十頁(yè),2022年,8月28日7.4并行數(shù)據(jù)庫(kù)系統(tǒng)

并行數(shù)據(jù)庫(kù)系統(tǒng)是新一代高性能的數(shù)據(jù)庫(kù)技術(shù)和并行計(jì)算機(jī)技術(shù)相結(jié)合的數(shù)據(jù)庫(kù)系統(tǒng),主要致力于開(kāi)發(fā)數(shù)據(jù)操作的時(shí)間并行性和空間并行性,基于對(duì)象模型的并行數(shù)據(jù)庫(kù)也是一個(gè)重要的研究方向。

一個(gè)并行數(shù)據(jù)庫(kù)系統(tǒng)應(yīng)該實(shí)現(xiàn)如下目標(biāo):(1)高性能:并行數(shù)據(jù)庫(kù)系統(tǒng)通過(guò)將數(shù)據(jù)庫(kù)管理技術(shù)與并行處理技術(shù)有機(jī)結(jié)合,發(fā)揮多處理機(jī)結(jié)構(gòu)的優(yōu)勢(shì),從而提供比相應(yīng)的大型機(jī)系統(tǒng)要高得多的性能價(jià)格比和可用性。(2)高可用性:并行數(shù)據(jù)庫(kù)系統(tǒng)可通過(guò)數(shù)據(jù)復(fù)制來(lái)增強(qiáng)數(shù)據(jù)庫(kù)的可用性。(3)可擴(kuò)充性:數(shù)據(jù)庫(kù)系統(tǒng)的可擴(kuò)充性指系統(tǒng)通過(guò)增加處理和存儲(chǔ)能力而平滑地?cái)U(kuò)展性能的能力。第三十一頁(yè),共五十頁(yè),2022年,8月28日7.4.1并行數(shù)據(jù)庫(kù)系統(tǒng)體系結(jié)構(gòu)

1.共享內(nèi)存型(SM結(jié)構(gòu))2.共享磁盤(pán)型(SD結(jié)構(gòu))3.無(wú)共享型(SharedNothing)4.混合型結(jié)構(gòu)并行數(shù)據(jù)庫(kù)系統(tǒng)體系結(jié)構(gòu)

第三十二頁(yè),共五十頁(yè),2022年,8月28日7.4.2并行數(shù)據(jù)庫(kù)系統(tǒng)并行處理技術(shù)簡(jiǎn)介

1.并行處理的基本概念(1)并行執(zhí)行計(jì)劃在并行處理環(huán)境中的執(zhí)行計(jì)劃稱為并行執(zhí)行計(jì)劃(ParallelPlan,簡(jiǎn)稱PP)。它對(duì)應(yīng)于傳統(tǒng)的順序執(zhí)行計(jì)劃(SequentialPlan,簡(jiǎn)稱SP)。(2)并行化方案如果一個(gè)查詢Q的某個(gè)并行執(zhí)行計(jì)劃PP與Q的一個(gè)順序執(zhí)行計(jì)劃SP對(duì)應(yīng)于相同的操作樹(shù),則稱PP為SP的一個(gè)并行化方案。(3)并行化由順序執(zhí)行計(jì)劃SP得到某個(gè)并行執(zhí)行計(jì)劃PP的過(guò)程稱為并行化。(4)并行粒度執(zhí)行的并行程度稱為并行粒度。一般來(lái)講,并行粒度越細(xì),并行化程度就越高,實(shí)現(xiàn)起來(lái)就越復(fù)雜。并行數(shù)據(jù)庫(kù)通過(guò)開(kāi)發(fā)事務(wù)間、查詢間、操作間以及操作內(nèi)四個(gè)不同粒度的并行性來(lái)滿足數(shù)據(jù)庫(kù)應(yīng)用環(huán)境中對(duì)事務(wù)吞吐量和響應(yīng)時(shí)間的要求。第三十三頁(yè),共五十頁(yè),2022年,8月28日2.并行粒度(1)事務(wù)間并行(2)查詢內(nèi)并行(3)操作內(nèi)并行(4)操作間并行流水線并行獨(dú)立并行3.并行化形式并行化形式

第三十四頁(yè),共五十頁(yè),2022年,8月28日4.并行操作算法并行連接算法并行掃描算法并行排序算法

5.并行數(shù)據(jù)庫(kù)的物理組織并行數(shù)據(jù)庫(kù)的物理組織的核心問(wèn)題是如何在多個(gè)處理結(jié)點(diǎn)之間分布每個(gè)數(shù)據(jù)庫(kù)關(guān)系,使查詢處理時(shí)間最小化。(1)并行數(shù)據(jù)庫(kù)的數(shù)據(jù)劃分(2)并行數(shù)據(jù)庫(kù)的數(shù)據(jù)復(fù)制(3)并行數(shù)據(jù)庫(kù)的數(shù)據(jù)重組第三十五頁(yè),共五十頁(yè),2022年,8月28日7.5數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘

隨著信息技術(shù)的發(fā)展,數(shù)據(jù)和數(shù)據(jù)庫(kù)的急劇增長(zhǎng),數(shù)據(jù)庫(kù)應(yīng)用的規(guī)模、范圍和深度不斷擴(kuò)大。一般的事務(wù)處理已不能滿足應(yīng)用的需求,企業(yè)需要能充分利用已有的數(shù)據(jù)資源,獲得有價(jià)值的信息,挖掘企業(yè)的競(jìng)爭(zhēng)優(yōu)勢(shì),提高企業(yè)運(yùn)作效率和指導(dǎo)企業(yè)決策。數(shù)據(jù)倉(cāng)庫(kù)(DataWarehouse,簡(jiǎn)稱DW)技術(shù)的興起滿足了這一要求。

數(shù)據(jù)倉(cāng)庫(kù)是在數(shù)據(jù)庫(kù)基礎(chǔ)上發(fā)展而來(lái)的,它通常包括三個(gè)部分:數(shù)據(jù)庫(kù)技術(shù)、聯(lián)機(jī)分析處理技術(shù)(OnlineAnalyticalProcessing,簡(jiǎn)稱OLAP)及數(shù)據(jù)挖掘技術(shù)(DataMining,簡(jiǎn)稱DM),它們之間具有極強(qiáng)的互補(bǔ)關(guān)系。第三十六頁(yè),共五十頁(yè),2022年,8月28日7.5.1數(shù)據(jù)倉(cāng)庫(kù)概念與結(jié)構(gòu)

1.?dāng)?shù)據(jù)倉(cāng)庫(kù)概念

WilliamH.Inmonn在《建立數(shù)據(jù)倉(cāng)庫(kù)》(BuildingtheDataWarehouse)一書(shū)中對(duì)數(shù)據(jù)倉(cāng)庫(kù)作了如下定義:“數(shù)據(jù)倉(cāng)庫(kù)是面向主題的、集成的、穩(wěn)定的、隨時(shí)間變化的數(shù)據(jù)集合,用以支持經(jīng)營(yíng)管理中的決策分析過(guò)程。”他還對(duì)數(shù)據(jù)倉(cāng)庫(kù)作了進(jìn)一步的描述:數(shù)據(jù)倉(cāng)庫(kù)提供集成化的和歷史化的數(shù)據(jù);它集成種類不同的應(yīng)用系統(tǒng),并從事物發(fā)展和歷史的角度來(lái)組織和存儲(chǔ)數(shù)據(jù),以供信息化和分析處理之用。數(shù)據(jù)倉(cāng)庫(kù)有以下幾個(gè)特征:(1)數(shù)據(jù)倉(cāng)庫(kù)是面向主題的。(2)數(shù)據(jù)倉(cāng)庫(kù)是集成的。(3)數(shù)據(jù)倉(cāng)庫(kù)是穩(wěn)定的。(4)數(shù)據(jù)倉(cāng)庫(kù)是隨時(shí)間變化的。第三十七頁(yè),共五十頁(yè),2022年,8月28日2.?dāng)?shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu)(1)數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)

數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的基本體系結(jié)構(gòu)第三十八頁(yè),共五十頁(yè),2022年,8月28日(2)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)的層次結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的層次結(jié)構(gòu)

第三十九頁(yè),共五十頁(yè),2022年,8月28日3.?dāng)?shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織(1)數(shù)據(jù)倉(cāng)庫(kù)的概念模型

數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)概念模型是多維數(shù)據(jù)模型,它直接影響到前端工具、數(shù)據(jù)存儲(chǔ)的設(shè)計(jì)和OLAP的查詢引擎。在多維數(shù)據(jù)模型中,一部分?jǐn)?shù)據(jù)是數(shù)字測(cè)量值,它們是依賴于一組“維”的,這些維提供了測(cè)量值的關(guān)聯(lián)關(guān)系。多維數(shù)據(jù)模型就是把測(cè)量的值放在這樣一些有層次的維構(gòu)成的多維空間中。(2)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織虛擬存儲(chǔ)方式

基于關(guān)系表的存儲(chǔ)方式星型模型雪花模型星網(wǎng)模型

多維數(shù)據(jù)庫(kù)組織存儲(chǔ)方式第四十頁(yè),共五十頁(yè),2022年,8月28日星型模型

第四十一頁(yè),共五十頁(yè),2022年,8月28日

雪花模型第四十二頁(yè),共五十頁(yè),2022年,8月28日7.5.2數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)和實(shí)現(xiàn)

1.?dāng)?shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)自頂向下模式:對(duì)分散在企業(yè)各處的數(shù)據(jù)庫(kù)中的數(shù)據(jù)集成建立全局性的數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)集市中的數(shù)據(jù)是為某部門(mén)DSS應(yīng)用而從數(shù)據(jù)倉(cāng)庫(kù)中抽取的。數(shù)據(jù)集市中的數(shù)據(jù)是數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)的一個(gè)子集。數(shù)據(jù)從數(shù)據(jù)倉(cāng)庫(kù)流向數(shù)據(jù)集市。自底向上模式:從建立各部門(mén)或特定商業(yè)問(wèn)題的數(shù)據(jù)集市開(kāi)始,全局性數(shù)據(jù)倉(cāng)庫(kù)建立在數(shù)據(jù)集市的基礎(chǔ)上。即數(shù)據(jù)從數(shù)據(jù)集市流向數(shù)據(jù)倉(cāng)庫(kù)。特點(diǎn)是投資少、見(jiàn)效快。平行開(kāi)發(fā)模式:在一個(gè)全局性數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型的指導(dǎo)下,數(shù)據(jù)集市和全局性數(shù)據(jù)倉(cāng)庫(kù)的建立同時(shí)進(jìn)行。第四十三頁(yè),共五十頁(yè),2022年,8月28日2.?dāng)?shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)(1)數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)與建模(2)數(shù)據(jù)集成(3)數(shù)據(jù)的存儲(chǔ)與管理(4)數(shù)據(jù)分析與展現(xiàn)第四十四頁(yè),共五十頁(yè),2022年,8月28日7.5.3聯(lián)機(jī)分析處理(OLAP)

1.聯(lián)機(jī)分析處理的概念聯(lián)機(jī)分析處理是針對(duì)特定問(wèn)題的聯(lián)機(jī)數(shù)據(jù)訪問(wèn)和分析的軟件技術(shù)。它使分析人員、經(jīng)理、管理人員通過(guò)對(duì)信息(這些信息從原始數(shù)據(jù)轉(zhuǎn)換而來(lái),反映了用戶所能理解的企業(yè)的真實(shí)的“維”)的多種可能的觀察角度進(jìn)行快速、一致和交互性的存取以獲得對(duì)信息的深入理解。2.多維數(shù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論