數(shù)據(jù)庫(kù)工程師知識(shí)點(diǎn)_第1頁(yè)
數(shù)據(jù)庫(kù)工程師知識(shí)點(diǎn)_第2頁(yè)
數(shù)據(jù)庫(kù)工程師知識(shí)點(diǎn)_第3頁(yè)
數(shù)據(jù)庫(kù)工程師知識(shí)點(diǎn)_第4頁(yè)
數(shù)據(jù)庫(kù)工程師知識(shí)點(diǎn)_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

一、數(shù)據(jù)模型1.數(shù)據(jù)模型的三要素(1)數(shù)據(jù)結(jié)構(gòu)數(shù)據(jù)結(jié)構(gòu)是所研究的對(duì)象類型(ObjectType)的集合。這些對(duì)象和對(duì)象類型是數(shù)據(jù)庫(kù)的組成成分。一般可分為兩類:一類是與數(shù)據(jù)類型、內(nèi)容和其它性質(zhì)有關(guān)的對(duì)象;一類是與數(shù)據(jù)之間的聯(lián)系有關(guān)的對(duì)象。前者如網(wǎng)狀模型中的數(shù)據(jù)項(xiàng)和記錄,關(guān)系模型中的域、屬性和關(guān)系等。后者如網(wǎng)狀模型中的關(guān)系模型(settype)。在數(shù)據(jù)庫(kù)領(lǐng)域中,通常按照數(shù)據(jù)結(jié)構(gòu)的類型來(lái)命名數(shù)據(jù)模型,進(jìn)而對(duì)數(shù)據(jù)庫(kù)管理系統(tǒng)進(jìn)行分類。如層次結(jié)構(gòu)、網(wǎng)狀結(jié)構(gòu)和關(guān)系結(jié)構(gòu)的數(shù)據(jù)模型分別稱作為層次模型、網(wǎng)狀模型和關(guān)系模型。相應(yīng)地,數(shù)據(jù)庫(kù)分別稱作為層次數(shù)據(jù)庫(kù)、網(wǎng)狀數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)。(2)數(shù)據(jù)操作數(shù)據(jù)操作是指對(duì)各種對(duì)象類型的實(shí)例(或值)所允許執(zhí)行的操作的集合,包括操作及有關(guān)的操作規(guī)則。在數(shù)據(jù)庫(kù)中,主要的操作有檢索和更新(包括插入、刪除、修改)兩大類。數(shù)據(jù)模型定義了這些操作的定義、語(yǔ)法(即使用這些操作時(shí)所用的語(yǔ)言)。數(shù)據(jù)結(jié)構(gòu)是對(duì)系統(tǒng)靜態(tài)特性的描述,而數(shù)據(jù)操作是對(duì)系統(tǒng)動(dòng)態(tài)特性的描述。兩者既有聯(lián)系,又有區(qū)別。(3)數(shù)據(jù)的約束條件數(shù)據(jù)的約束條件是完整性規(guī)則的集合。完整性規(guī)則是指在給定的數(shù)據(jù)模型中,數(shù)據(jù)及其聯(lián)系所具有的制約條件和依存條件,用以限制符合數(shù)據(jù)模型的數(shù)據(jù)庫(kù)的狀態(tài)以及狀態(tài)的變化,確保數(shù)據(jù)的正確性、有效性和一致性。2.概念模型數(shù)據(jù)模型是數(shù)據(jù)庫(kù)系統(tǒng)的核心和基礎(chǔ)。每個(gè)DBMS軟件都是基于某種數(shù)據(jù)模型的。為了把現(xiàn)實(shí)世界中的具體事物或事物之間的聯(lián)系表示成DBMS所支持的數(shù)據(jù)模型,人們首先必須將現(xiàn)實(shí)世界的事物及其之間的聯(lián)系進(jìn)行抽象,轉(zhuǎn)換為信息世界的概念模型;然后將信息世界的概念模型轉(zhuǎn)換為機(jī)器世界的數(shù)據(jù)模型。也就是說(shuō),首先把現(xiàn)實(shí)世界中的客觀對(duì)象抽象成一種信息結(jié)構(gòu)。這種信息結(jié)構(gòu)并不依賴于具體的計(jì)算機(jī)系統(tǒng)和DBMS。然后,再把概念模型轉(zhuǎn)換為某一計(jì)算機(jī)系統(tǒng)上某一DBMS所支持的數(shù)據(jù)模型。因此,概念模型是從現(xiàn)實(shí)世界到機(jī)器世界的一個(gè)中間層次?,F(xiàn)實(shí)世界的事物反映到人的大腦之中,然后人們開(kāi)始認(rèn)識(shí)這些事物,經(jīng)過(guò)選擇、命名、分類和組織等抽象工作之后形成概念模型,并進(jìn)入到信息世界。用戶(user)關(guān)心的是現(xiàn)實(shí)世界中的事物、事物的屬性及其相互關(guān)系。例如,用戶可能關(guān)心他的顧客及其屬性,如顧客地址、銀行帳號(hào)等等。用戶也關(guān)心自己的定貨帳目,如誰(shuí)訂的貨、訂的什么和訂多少等等。系統(tǒng)分析員(analyst)同樣也關(guān)心現(xiàn)實(shí)世界,但是系統(tǒng)分析員需要分析用戶的信息需求。作為需求分析的結(jié)果,分析員必須以文檔的形式對(duì)需求進(jìn)行結(jié)構(gòu)化的描述;這個(gè)文檔就是信息模型。實(shí)體(Entity)實(shí)體是構(gòu)成數(shù)據(jù)庫(kù)的基本元素。實(shí)體是指一個(gè)存在的東西以區(qū)別這個(gè)東西所具有的屬性和這個(gè)東西與其它東西的聯(lián)系。實(shí)體可以是人,也可以是物;可以是實(shí)際對(duì)象,也可以是概念;可以是事物本身,也可以是指事物之間的聯(lián)系。屬性(Attribute)一個(gè)實(shí)體可以由若干個(gè)屬性來(lái)刻畫(huà)。屬性是相對(duì)實(shí)體而言的,是實(shí)體所具有的特性。關(guān)鍵字(Key)能唯一地標(biāo)識(shí)實(shí)體的屬性的集合稱為關(guān)鍵字(或碼)。域(Domain)屬性的取值范圍稱作域。實(shí)體型(EntityType)一類實(shí)體所具有的共同特征或?qū)傩缘募戏Q為實(shí)體型。一般用實(shí)體名及其屬性來(lái)抽象地刻畫(huà)一類實(shí)體的實(shí)體型。實(shí)體集(EntitySet)同型實(shí)體的集合叫實(shí)體集。例如,學(xué)生就是一個(gè)實(shí)體集。實(shí)體集的名即是實(shí)體型。對(duì)于學(xué)生和(學(xué)號(hào),姓名,年齡,系,年級(jí))均是實(shí)體型,而學(xué)生是對(duì)實(shí)體型(學(xué)號(hào),姓名,年齡,系,年級(jí))所起的名稱,兩者是指同一客觀對(duì)象。但本科生和研究生可以為相同實(shí)體型,而實(shí)體集不同。聯(lián)系(Relationship)現(xiàn)實(shí)世界的事物之間是有聯(lián)系的。一般存在兩類聯(lián)系:一是實(shí)體內(nèi)部的組成實(shí)體的屬性之間的聯(lián)系,二是實(shí)體之間的聯(lián)系。在考慮實(shí)體內(nèi)部的聯(lián)系時(shí),是把屬性看作為實(shí)體。一般來(lái)說(shuō),兩個(gè)實(shí)體之間的聯(lián)系可分為三種:(1)一對(duì)一(1∶1)聯(lián)系若對(duì)于實(shí)體集A中的每一個(gè)實(shí)體,實(shí)體集B中至多有唯一的一個(gè)實(shí)體與之聯(lián)系,反之亦然,則稱實(shí)體集A與實(shí)體集B具有一對(duì)一聯(lián)系,記作1∶1。(2)一對(duì)多(1∶n)聯(lián)系若對(duì)于實(shí)體集A中的每個(gè)實(shí)體,實(shí)體集B中有n個(gè)實(shí)體(n≥0)與之聯(lián)系;反之,對(duì)于實(shí)體集B中的每一個(gè)實(shí)體,實(shí)體集A中至多只有一個(gè)實(shí)體與之聯(lián)系,則稱實(shí)體集A與實(shí)體集B有一對(duì)多聯(lián)系,記為1∶n。相應(yīng)地有多對(duì)一(n∶1)聯(lián)系多對(duì)一聯(lián)系,從本質(zhì)上說(shuō),是一對(duì)多聯(lián)系的逆轉(zhuǎn)。其定義同一對(duì)多聯(lián)系類似,不再贅述。(3)多對(duì)多(m∶n)聯(lián)系若對(duì)于實(shí)體集A中的每一個(gè)實(shí)體,實(shí)體集B中有n個(gè)實(shí)體(n≥0)與之聯(lián)系;反之,對(duì)于實(shí)體集B中的每一個(gè)實(shí)體,實(shí)體集A中也有m個(gè)實(shí)體(m≥0)與之對(duì)應(yīng),則稱實(shí)體集A與實(shí)體集B具有多對(duì)多聯(lián)系,記作m∶n。實(shí)質(zhì)上,多對(duì)多聯(lián)系是任意一種聯(lián)系。另外,同一實(shí)體集內(nèi)的各個(gè)實(shí)體間也可以有各種聯(lián)系。概念模型的表示方法最常用的是實(shí)體一聯(lián)系方法(Entity-RelationshipApproach),簡(jiǎn)稱E-R方法。該方法是由P.P.S.Chen在1976年提出的。E-R方法用E-R圖來(lái)描述某一組織的概念模型。在這里僅介紹E-R圖的要點(diǎn)。在E-R圖中:(1)長(zhǎng)方形框表示實(shí)體集,框內(nèi)寫(xiě)上實(shí)體型的名稱。(2)用橢圓框表示實(shí)體的屬性,并用有向邊把實(shí)體框及其屬性框連接起來(lái)。(3)用菱形框表示實(shí)體間的聯(lián)系,框內(nèi)寫(xiě)上聯(lián)系名,用無(wú)向邊把菱形框及其有關(guān)的實(shí)體框連接起來(lái),在旁邊標(biāo)明聯(lián)系的種類。如果聯(lián)系也具有屬性,則把屬性框和菱形框也用無(wú)向邊連接上。3.三種主要的數(shù)據(jù)模型實(shí)際DBMS所支持的數(shù)據(jù)模型主要有三種:層次模型(HierarchicalModel)網(wǎng)狀模型(NetworkModel)關(guān)系模型(RelationalModel)其中,關(guān)系模型是當(dāng)前DBMS所支持的數(shù)據(jù)模型的主流。90年代運(yùn)行的DBMS幾乎都是基于關(guān)系模型的。層次模型和網(wǎng)狀模型統(tǒng)稱為非關(guān)系模型。非關(guān)系模型的結(jié)構(gòu)可以和圖論中的圖相對(duì)應(yīng),比較直觀,但在理論上不完備,實(shí)現(xiàn)效率較低,故此目前很少用。但是最近,層次模型在研究面向?qū)ο蟮腄BMS中已得到重視。在關(guān)系模型中,數(shù)據(jù)在用戶的觀點(diǎn)中(或在用戶視圖中)的邏輯結(jié)構(gòu)是一張二維表(Table)。關(guān)系(Relation),對(duì)應(yīng)于平常講的一張表。元組(Tuple),表中的一行。屬性(Attribute),表中的一列稱為一個(gè)屬性,給每一列起一個(gè)名,稱為屬性名。這一列或這個(gè)屬性所有可能取的值的集合稱為這個(gè)屬性的值域(Domain),值域中的一個(gè)元素叫做這個(gè)屬性的值。主關(guān)鍵字(PrimaryKeyAttribute或PrimaryKey),是指能唯一標(biāo)識(shí)一個(gè)元組的一個(gè)或一組屬性。分量(Attributevalue),是指元組中的一個(gè)屬性值。關(guān)系模式(RelationalSchema),是對(duì)關(guān)系的描述,一般用關(guān)系名(屬性名1,屬性名2,…,屬性名n)來(lái)表示。同層次模型和網(wǎng)狀模型相比較,關(guān)系模型具有下列特點(diǎn):(1)概念單一在關(guān)系模型中,無(wú)論是實(shí)體還是實(shí)體之間的聯(lián)系都用關(guān)系來(lái)表示。在關(guān)系模型中,在用戶的觀點(diǎn)中,數(shù)據(jù)的邏輯結(jié)構(gòu)就是表,也只有這唯一的概念。在非關(guān)系模型中,用戶要區(qū)分記錄型與記錄型之間的聯(lián)系兩個(gè)概念;當(dāng)環(huán)境復(fù)雜時(shí),數(shù)據(jù)結(jié)構(gòu)異常復(fù)雜,難以掌握。而關(guān)系模型,由于概念單一,可以變復(fù)雜為直觀、簡(jiǎn)單,易學(xué)易用。(2)規(guī)范化所謂關(guān)系規(guī)范化是指在關(guān)系模型中,每一個(gè)關(guān)系都要滿足一定的條件要求。這些條件被稱為規(guī)范條件。對(duì)于關(guān)系,一個(gè)最基本的規(guī)范條件是,要求關(guān)系中的每一個(gè)屬性(或分量)均是不可分的數(shù)據(jù)項(xiàng);也就是說(shuō)不允許表中有表,表是不可嵌套的。(3)在關(guān)系模型中,用戶對(duì)數(shù)據(jù)的操作的輸入和輸出都是表,也就是說(shuō),用戶通過(guò)操作舊表而得到一張新表??傊P(guān)系模型概念簡(jiǎn)單,結(jié)構(gòu)清晰,用戶易學(xué)易用,有嚴(yán)格的以數(shù)學(xué)為基礎(chǔ)的關(guān)系理論作指導(dǎo),便于DBMS的實(shí)現(xiàn)?;陉P(guān)系的DBMS簡(jiǎn)化了應(yīng)用程序員的工作,便于數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)的設(shè)計(jì)和維護(hù)。故此,關(guān)系模型自誕生以后就得到了迅速的發(fā)展,成為應(yīng)用最為廣泛的、唯一的數(shù)據(jù)模型。二、數(shù)據(jù)庫(kù)系統(tǒng)的結(jié)構(gòu)1.數(shù)據(jù)庫(kù)系統(tǒng)的三級(jí)模式結(jié)構(gòu)數(shù)據(jù)庫(kù)管理系統(tǒng)的三級(jí)模式結(jié)構(gòu)由外模式、模式和內(nèi)模式組成。外模式(externalschema),或子模式(subschema)或用戶模式(userschema),是指數(shù)據(jù)庫(kù)用戶所看到的數(shù)據(jù)結(jié)構(gòu),是用戶看到的數(shù)據(jù)視圖。模式(schema)或邏輯模式(logicschema),是數(shù)據(jù)庫(kù)中對(duì)全體數(shù)據(jù)的邏輯結(jié)構(gòu)和特性的描述,是所有用戶所見(jiàn)到的數(shù)據(jù)視圖的總和。外模式是模式的一部分。內(nèi)模式(internalschema),或存儲(chǔ)模式(storageschema),或物理模式(physicalschema),是指數(shù)據(jù)在數(shù)據(jù)庫(kù)系統(tǒng)內(nèi)的存儲(chǔ)介質(zhì)上的表示,即對(duì)數(shù)據(jù)的物理結(jié)構(gòu)和存取方式的描述。模式描述的是數(shù)據(jù)的全局的邏輯結(jié)構(gòu),決定了DBMS的功能。外模式涉及的僅是局部的邏輯結(jié)構(gòu),是模式的子集,是對(duì)模式的調(diào)用。數(shù)據(jù)庫(kù)系統(tǒng)的三級(jí)模式是對(duì)數(shù)據(jù)進(jìn)行三個(gè)層次抽象的工具。通過(guò)三級(jí)模式,把對(duì)數(shù)據(jù)的具體組織留給DBMS來(lái)完成,使得用戶能在高層次上處理數(shù)據(jù)的邏輯結(jié)構(gòu),而不必關(guān)心數(shù)據(jù)的物理結(jié)構(gòu)。為了實(shí)現(xiàn)這三個(gè)層次這間的聯(lián)系,DBMS在溝通三級(jí)模式中提供了兩個(gè)映象:外模式-模式映象模式-內(nèi)模式映象(1)模式模式規(guī)定了數(shù)據(jù)庫(kù)中全部數(shù)據(jù)的一個(gè)邏輯表示或描述形式。模式既不同于內(nèi)模式,也不同于外模式。它比內(nèi)模式抽象,不涉及數(shù)據(jù)的物理結(jié)構(gòu)和存儲(chǔ)介質(zhì)。它與具體的應(yīng)用程序或高級(jí)語(yǔ)言無(wú)關(guān)。(2)外模式外模式是個(gè)別用戶的數(shù)據(jù)視圖,即與某一應(yīng)用有關(guān)的數(shù)據(jù)的邏輯表示。(3)內(nèi)模式內(nèi)模式是全部數(shù)據(jù)庫(kù)的內(nèi)部表示或底層描述,是用來(lái)定義數(shù)據(jù)的物理結(jié)構(gòu)和存取方式的。(4)二級(jí)映象對(duì)于同一個(gè)模式,可以有任意多個(gè)外模式。外模式-模式的映象定義了某個(gè)外模式和模式之間的對(duì)應(yīng)關(guān)系。這些映象的定義通常包含在各自的外模式中。當(dāng)模式改變時(shí),外模式-模式的映象要做相應(yīng)的改變,以保證外模式的不變性。這是數(shù)據(jù)庫(kù)管理員(DBA)的責(zé)任。模式-內(nèi)模式的映象定義了數(shù)據(jù)邏輯結(jié)構(gòu)和存儲(chǔ)結(jié)構(gòu)之間的對(duì)應(yīng)關(guān)系。例如,字段的內(nèi)部表示等。當(dāng)數(shù)據(jù)庫(kù)的存儲(chǔ)結(jié)構(gòu)改變時(shí),模式-內(nèi)模式的映象也須做相應(yīng)的修改,以使得模式保持不變性。這仍是DBA的責(zé)任。正是由于上述二級(jí)映象的功能及其自動(dòng)實(shí)現(xiàn),使得數(shù)據(jù)庫(kù)系統(tǒng)中的數(shù)據(jù)具有較高的邏輯獨(dú)立性和物理獨(dú)立性,從而大大地方便了用戶的使用。(5)概念模式與模式ANSI研究組于1975年2月提出一個(gè)臨時(shí)報(bào)告。1978年提出一個(gè)最終報(bào)告,稱之為ANˉSI/SPARC報(bào)告,簡(jiǎn)稱為SPARC報(bào)告。SPARC報(bào)告中指出,數(shù)據(jù)庫(kù)管理系統(tǒng)應(yīng)具有三級(jí)模式的結(jié)構(gòu),即概念模式、外模式和內(nèi)模式。其中外模式和內(nèi)模多與上面所講的大致相當(dāng)。但SPARC報(bào)告中的概念模式是指一個(gè)組織或部門(mén)所對(duì)應(yīng)的現(xiàn)實(shí)世界的真實(shí)模型,即概念模型。概念模式僅描述實(shí)體及其屬性和聯(lián)系,不涉及機(jī)器世界的概念。概念模型是信息世界范疇內(nèi)的信息的結(jié)構(gòu),而模式是機(jī)器世界范疇內(nèi)的概念模型的邏輯表示。概念模型獨(dú)立于具體的計(jì)算機(jī)系統(tǒng),甚至是和計(jì)算機(jī)無(wú)關(guān)的,是一個(gè)組織或部門(mén)的模型。常用的描述概念模式的方法是E-R方法。模式是依賴于具體的計(jì)算機(jī)及其DBMS的。模式通過(guò)三種具體模型:層次模型、網(wǎng)狀模型和關(guān)系模型來(lái)加以實(shí)現(xiàn)。概念模式必須轉(zhuǎn)換成具體的數(shù)據(jù)模型,然后才能在相應(yīng)的DBMS上實(shí)現(xiàn)。概念模型和模式都是描述信息或數(shù)據(jù)的整體結(jié)構(gòu)的,然而它們是在不同的抽象層次上加以描述的。概念模型離機(jī)器更遠(yuǎn),形式化程度低。從遠(yuǎn)離機(jī)器的觀點(diǎn)看,概念模型更抽象些,但更接近現(xiàn)實(shí)世界。而模式描述使用的是形式化的語(yǔ)言-模式DDL,而概念模型描述使用的是E-R圖和一些自然語(yǔ)言。2.使用數(shù)據(jù)庫(kù)的計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)廣義地講,實(shí)際上使用數(shù)據(jù)庫(kù)的計(jì)算機(jī)系統(tǒng)由下列幾個(gè)部分組成的:(1)硬件部分包括主機(jī)、外部存儲(chǔ)設(shè)備、網(wǎng)絡(luò)設(shè)備和電源等。(2)軟件部分包括操作系統(tǒng)、DBMS、編譯系統(tǒng)和應(yīng)用開(kāi)發(fā)工具軟件等。(3)人員包括數(shù)據(jù)庫(kù)管理員(DataBaseAdministrator-DBA),系統(tǒng)分析員(SystemAnaˉlyst)、應(yīng)用程序員(ApplicationProgrammer)和用戶(User)。3.數(shù)據(jù)庫(kù)管理系統(tǒng)數(shù)據(jù)庫(kù)管理系統(tǒng)DBMS是數(shù)據(jù)庫(kù)系統(tǒng)的核心。DBMS是負(fù)責(zé)數(shù)據(jù)庫(kù)的建立、使用和維護(hù)的軟件。DBMS建立在操作系統(tǒng)之上,實(shí)施對(duì)數(shù)據(jù)庫(kù)的統(tǒng)一管理和控制。用戶使用的各種數(shù)據(jù)庫(kù)命令以及應(yīng)用程序的執(zhí)行,最終都必須通過(guò)DBMS。另外,DBMS還承擔(dān)著數(shù)據(jù)庫(kù)的安全保護(hù)工作,按照DBA所規(guī)定的要求,保證數(shù)據(jù)庫(kù)的完整性和安全性。DBMS的主要功能包括以下幾個(gè)主要方面:(1)數(shù)據(jù)庫(kù)的定義功能DBMS通過(guò)提供數(shù)據(jù)描述語(yǔ)言(也稱數(shù)據(jù)定義語(yǔ)言)(DataDescripˉtiveLanguage———DDL)來(lái)對(duì)外模式、模式和內(nèi)模式加以描述。然后模式翻譯程序把用DDL寫(xiě)的各種模式的定義源碼翻譯成相應(yīng)的內(nèi)部表示,形成相應(yīng)的目標(biāo)形式,分別叫目標(biāo)外模式、目標(biāo)模式、目標(biāo)內(nèi)模式,這些目標(biāo)模式是對(duì)數(shù)據(jù)庫(kù)的描述,而不是數(shù)據(jù)本身。(目標(biāo))模式只刻畫(huà)了數(shù)據(jù)庫(kù)的形式或框架,而不包括數(shù)據(jù)庫(kù)的內(nèi)容。這些目標(biāo)模式被保存在數(shù)據(jù)字典(或系統(tǒng)目標(biāo))之中,作為DBMS存取和管理數(shù)據(jù)的基本依據(jù)。例如,DBMS根據(jù)這些模式定義,進(jìn)行物理結(jié)構(gòu)和邏輯結(jié)構(gòu)的映象,進(jìn)行邏輯結(jié)構(gòu)和用戶視圖的映象,以導(dǎo)出用戶要檢索的數(shù)據(jù)的存取方式。(2)數(shù)據(jù)操縱功能DBMS提供數(shù)據(jù)操縱語(yǔ)言(DataManipulationLanguage———DML)實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)中數(shù)據(jù)的一些基本操作,如:檢索、插入、修改、刪除和排序等等。DML有兩類:一類是嵌入主語(yǔ)言的,如嵌入到C或COBOL等高級(jí)語(yǔ)言中。這類DML語(yǔ)言本身不能單獨(dú)使用,故此稱為宿主型的DML或嵌入式DML。另一類是非嵌入式語(yǔ)言(包括交互式命令語(yǔ)言和結(jié)構(gòu)化語(yǔ)言),它的語(yǔ)法簡(jiǎn)單,可以獨(dú)立使用,由單獨(dú)的解釋或編譯系統(tǒng)來(lái)執(zhí)行,所以一般稱為自主型或自含型的DML。命令語(yǔ)言是行結(jié)構(gòu)語(yǔ)言,單條執(zhí)行。結(jié)構(gòu)化語(yǔ)言是命令語(yǔ)言的擴(kuò)充或發(fā)展,增加了程序結(jié)構(gòu)描述或過(guò)程控制功能,如循環(huán)、分支等功能。命令語(yǔ)言一般逐條解釋執(zhí)行。結(jié)構(gòu)化語(yǔ)言可以解釋執(zhí)行,也可以編譯執(zhí)行?,F(xiàn)在DBMS一般均提供命令語(yǔ)言的交互式環(huán)境和結(jié)構(gòu)環(huán)境兩種運(yùn)行方式,供用戶選擇。DBMS控制和執(zhí)行DML語(yǔ)句(或DML程序),完成對(duì)數(shù)據(jù)庫(kù)的操作。對(duì)于自主型的結(jié)構(gòu)化的DML,DBMS通常采用解釋執(zhí)行的方法,但也有編譯執(zhí)行的方法,而且編譯執(zhí)行的越來(lái)越多。另外,很多系統(tǒng)同時(shí)設(shè)有解釋和編譯兩種功能,由用戶選其一。對(duì)于嵌入型或縮主型DML,DBMS一種提供兩種方法:①預(yù)編譯方法。②修改和擴(kuò)充主語(yǔ)言編譯程序(亦稱增強(qiáng)編譯方法)。預(yù)編譯方法是,由DBMS提供一個(gè)預(yù)處理程序,對(duì)源程序進(jìn)行語(yǔ)法掃描,識(shí)別出DML語(yǔ)句,并把這些語(yǔ)句轉(zhuǎn)換成主語(yǔ)言中的特殊調(diào)用語(yǔ)句。主語(yǔ)言必須和DML有調(diào)用接口。這樣在連接形成目標(biāo)時(shí)和主語(yǔ)言語(yǔ)句一起形成可執(zhí)行的目標(biāo)。(3)數(shù)據(jù)庫(kù)運(yùn)行管理數(shù)據(jù)庫(kù)運(yùn)行期間的動(dòng)態(tài)管理是DBMS的核心部分,包括并發(fā)控制、存取控制(或安全性檢查、完整性約束條件的檢查)、數(shù)據(jù)庫(kù)內(nèi)部的維護(hù)(如索引、數(shù)據(jù)字典的自動(dòng)維護(hù)等)、緩沖區(qū)大小的設(shè)置等等。所有的數(shù)據(jù)庫(kù)操作都是在這個(gè)控制部分的統(tǒng)一管理下,協(xié)同工作,以確保事務(wù)處理的正常運(yùn)行,保證數(shù)據(jù)庫(kù)的正確性、安全性和有效性。(4)數(shù)據(jù)庫(kù)的建立和維護(hù)功能數(shù)據(jù)庫(kù)的建立和維護(hù)包括初始數(shù)據(jù)的裝入、數(shù)據(jù)庫(kù)的轉(zhuǎn)儲(chǔ)或后備功能、數(shù)據(jù)庫(kù)恢復(fù)功能、數(shù)據(jù)庫(kù)的重組織功能和性能分析等功能,這些功能一般都由各自對(duì)應(yīng)的實(shí)用功能子程序來(lái)完成。DBMS隨軟件產(chǎn)品和版本不同而有所差異。通常大型機(jī)上的DBMS功能最全,小型機(jī)上的DBMS功能稍弱點(diǎn),微機(jī)上的DBMS更弱些。但是,目前,由于硬件性能和價(jià)格的改進(jìn),微機(jī)上的DBMS功能越來(lái)越全。三、關(guān)系數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)語(yǔ)言———SQL1.SQL概述SQL的英語(yǔ)名稱是結(jié)構(gòu)查詢語(yǔ)言(StructuredQueryLanguage)實(shí)際上它的功能包括查詢(Query)、操縱(Manipulation)、定義(Definition)和控制(Control)四個(gè)方面,是一個(gè)綜合的、通用的、功能極強(qiáng)的關(guān)系數(shù)據(jù)庫(kù)語(yǔ)言。SQL支持?jǐn)?shù)據(jù)庫(kù)的三級(jí)模式結(jié)構(gòu)。2.SQL的數(shù)據(jù)定義功能SQL的數(shù)據(jù)定義功能包括三部分:定義基本表,定義視圖和定義索引。它們是:CREATETABLECREATEVIEWCREATEINDEXDROPTABLEDROPVIEWDROPINDEXSQL的數(shù)據(jù)定義功能可用于定義和修改模式(如基本表),定義外模式(如視圖)和內(nèi)模式(如索引)。3.基本表的定義與刪除定義基本表的語(yǔ)句格式為:CREATETABLE表名(列名1類型[NOTNULL][,列名2類型[NOTNULL]]…)[其他參數(shù)];其中,任選項(xiàng)“其它參數(shù)”是與物理存儲(chǔ)有關(guān)的參數(shù)。根據(jù)具體系統(tǒng)的不同而不同。刪除基本表的語(yǔ)句為:DROPTABLE表名;刪除索引的語(yǔ)句為:DROPINDEX索引名;刪除索引的同時(shí)把有關(guān)索引的描述也從數(shù)據(jù)字典中刪去。但表的內(nèi)涵仍存在且其數(shù)據(jù)外延內(nèi)容不變。把一個(gè)基本表的定義連同表上所有的記錄、索引以及由此基本表導(dǎo)出的所有視圖全部都刪除,并釋放相應(yīng)的存儲(chǔ)空間。4.索引的建立與刪除對(duì)一個(gè)基本表,可以根據(jù)應(yīng)用環(huán)境的需要建立若干索引,以提供多種存取方式。通常,索引的建立和刪除由DBA或表的主人(即建立表的人)負(fù)責(zé)。用戶不必也不能在存取數(shù)據(jù)時(shí)選擇索引。存取路徑的選擇由系統(tǒng)自動(dòng)進(jìn)行。索引的描述存放在數(shù)據(jù)字典中。建立索引的語(yǔ)句格式為:CREATE[UNIQUE]INDEX索引名ON基本表名(列名[次序][,列名[次序]]…)[其他參數(shù)];這里的任選項(xiàng)———其他參數(shù)是與物理存儲(chǔ)有關(guān)的參數(shù)。索引可以建在一列或幾列上。圓括號(hào)內(nèi)是索引列的順序說(shuō)明表。其中的任選項(xiàng)———次序,指定了索引值排序的次序??扇SC(升序)或DESC(降序)。缺省值為升序。UNIQUE表示每一索引值只對(duì)應(yīng)唯一的數(shù)據(jù)記錄。5.SQL的數(shù)據(jù)操縱功能SQL的數(shù)據(jù)操縱功能包括SELECT,INSERT,DELETE和UPDATE四個(gè)語(yǔ)句,即檢索和更新(包括增、刪、改)兩部分工能。檢索就是查詢。SQL更新語(yǔ)句SQL的更新語(yǔ)句包括修改,刪除和插入三類語(yǔ)句。①修改(UPDATE)(亦稱為更新)修改語(yǔ)句的一般格式為:UPDATE表名SET字段=表達(dá)式[,字段=表達(dá)式]…[WHERE謂詞];修改指定表中滿足謂詞(或條件)的元組,把這些元組按SET子句中的表達(dá)式修改相應(yīng)屬性或字段上的值。②刪除(DELETE)刪除語(yǔ)句一般格式為:DELETEFROM表名[WHERE謂詞];從指定表中刪除滿足謂詞的那些記錄。沒(méi)有WHERE子句時(shí)表示刪去此表中的全部記錄,但此表的定義仍在數(shù)據(jù)字典中,只是一個(gè)空表。DELETE只對(duì)表外延操作,不對(duì)內(nèi)涵操作。③插入(INSERT)插入語(yǔ)句的一般格式為:INSERTINTO表名[(字段名[,字段名]…)]valueS(常量[,常量]…);或INSERTINTO表名[(字段名[,字段名]…)]子查詢;第一種格式把一個(gè)新記錄插入指定的表中。第二種格式把子查詢的結(jié)果插入表中。若表中有些字段在插入語(yǔ)句中沒(méi)有出現(xiàn),則這些字段上的值取空值NULL。當(dāng)然在表定義中說(shuō)明了NOTNULL的字段在插入時(shí)不能取NULL。若插入語(yǔ)句中沒(méi)有指出字段名,則新記錄必須在每個(gè)字段上均有值。6.視圖視圖是從一個(gè)或幾個(gè)基本表(或視圖)導(dǎo)出的表。某一用戶可以定義若干視圖。因此對(duì)某一用戶而言,按ANSI/SPARC報(bào)告的觀點(diǎn),他的外模式是由若干基本表和若干視圖組成的。視圖和基本表不同,視圖是一個(gè)虛表,即視圖所對(duì)應(yīng)的數(shù)據(jù)不實(shí)際存儲(chǔ)在數(shù)據(jù)庫(kù)中,數(shù)據(jù)庫(kù)中只存儲(chǔ)視圖的定義(存在數(shù)據(jù)字典中)。視圖一經(jīng)定義就可以和基本表一樣被查詢、被刪除(DROP),也可以用來(lái)定義新的視圖,但更新(增、刪、改)操作將有一定限制。視圖可以理解成一個(gè)數(shù)據(jù)庫(kù),只有內(nèi)涵保存在數(shù)據(jù)庫(kù)字典中,而無(wú)外延存儲(chǔ);其外延是在使用時(shí)動(dòng)態(tài)地生成的或計(jì)算出來(lái)的。(1)視圖的定義與刪除SQL建立視圖的語(yǔ)句格式為:CREATEVIEW視圖名[(字段名[,字段名]…)]AS子查詢[WITHCHECKOPTION謂詞];視圖可以刪除,語(yǔ)句格式為:DROPVIEW視圖名;視圖的定義就從數(shù)據(jù)字典中刪除。由此視圖導(dǎo)出的其它視圖也將自動(dòng)被刪除。若導(dǎo)出此視圖的基本表刪除了,則此視圖也將自動(dòng)刪除。(2)視圖的查詢語(yǔ)句視圖定義后,用戶可以如同基本表那樣對(duì)視圖查詢。(3)視圖的更新語(yǔ)句對(duì)視圖的更新最終要轉(zhuǎn)換成對(duì)基本表的更新(這里的更新,指INSERT,UPDATE和DELETE三類操作)。在關(guān)系數(shù)據(jù)庫(kù)中,并非所有的視圖都是可更新的,也就是說(shuō),有些視圖的更新不能唯一地有意義地轉(zhuǎn)換成對(duì)基本表的更新。(4)視圖的優(yōu)點(diǎn)視圖的概念具有很多優(yōu)點(diǎn),主要有:(1)視圖對(duì)于數(shù)據(jù)庫(kù)的重構(gòu)造提供了一定程度的邏輯獨(dú)立性;(2)簡(jiǎn)化了用戶觀點(diǎn);(3)視圖機(jī)制使不同的用戶能以不同的方式看待同一數(shù)據(jù);(4)視圖機(jī)制對(duì)機(jī)密數(shù)據(jù)提供了自動(dòng)的安全保護(hù)功能。7.SQL的數(shù)據(jù)控制功能SQL數(shù)據(jù)控制功能是指控制用戶對(duì)數(shù)據(jù)的存取權(quán)力。某個(gè)用戶對(duì)某類數(shù)據(jù)具有何種操作權(quán)力是由DBA決定的。這是個(gè)政策問(wèn)題而不是技術(shù)問(wèn)題。數(shù)據(jù)庫(kù)管理系統(tǒng)的功能是保證這些決定的執(zhí)行。為此它必須能:(1)把授權(quán)的決定告知系統(tǒng),這是由SQL的GRANT和REVOKE語(yǔ)句來(lái)完成的。(2)把授權(quán)的結(jié)果存入數(shù)據(jù)字典。(3)當(dāng)用戶提出操作請(qǐng)求時(shí),根據(jù)授權(quán)情況進(jìn)行檢查,以決定是執(zhí)行操作請(qǐng)求還是拒絕之。授權(quán)語(yǔ)句的一般格式為:GRANT權(quán)力[,權(quán)力]…[ON對(duì)象類型對(duì)象名]TO用戶[,用戶]…,[WITHGRANTOPTION];對(duì)不同類型的操作對(duì)象可有不同的操作權(quán)力。(1)對(duì)基本表、視圖及其字段的操作權(quán)力有查詢、插入、更新、刪除以及它們的總和ALLPRIVILEGE。(2)對(duì)基本表的操作權(quán)力還有修改(ALTER)和建立索引(INDEX)。(3)對(duì)數(shù)據(jù)庫(kù)的操作權(quán)力有建立表(CREATETAB)。某用戶有了此權(quán)力就可以使用Createtable建立基本表。稱他為表的主人,擁有對(duì)此表的一切操作權(quán)力。(4)對(duì)表空間的權(quán)力有使用(USE)數(shù)據(jù)庫(kù)空間存儲(chǔ)基本表的權(quán)力。(5)系統(tǒng)權(quán)力有建立新數(shù)據(jù)庫(kù)(CREATEDBA)的權(quán)力。GRANT語(yǔ)句中的任選項(xiàng)WITHGRANTOPTION的作用是使獲得某種權(quán)力的用戶可以把權(quán)力再授予別的用戶。8.嵌入式SQL把SQL嵌入主語(yǔ)言使用時(shí)必須解決三個(gè)問(wèn)題:(1)區(qū)分SQL語(yǔ)句與主語(yǔ)言語(yǔ)句。這是通過(guò)在所有的SQL語(yǔ)句前加前綴EXECSQL來(lái)解決的。SQL語(yǔ)句結(jié)束標(biāo)志隨主語(yǔ)言不同而不同,如PL/1用分號(hào)(;),COBOL用EMD-EXEC來(lái)表示。SQL語(yǔ)句首先由預(yù)編譯程序加以處理,轉(zhuǎn)換為主語(yǔ)言編譯程序能夠識(shí)別的形式,然后交主語(yǔ)言編譯程序進(jìn)一步處理。(2)數(shù)據(jù)庫(kù)工作單元和程序工作單元之間的通信。SQL語(yǔ)句中可以使用主語(yǔ)言的程序變量(簡(jiǎn)稱主變量),這些變量名前加冒號(hào)(:)作標(biāo)志,以區(qū)別地字段名,程序中使用的任何表(基本表或視圖)都要用EXECSQLDECLARE語(yǔ)句加以說(shuō)明。一則使程序更加清晰,二則使預(yù)編譯程序能作某些語(yǔ)法檢查。SQL語(yǔ)句執(zhí)行后,系統(tǒng)要反饋給應(yīng)用程序若干信息,這些信息送到SQL的通信區(qū)SQLCA。SQLCA用語(yǔ)句EXECSQLINCLUDE加以定義。在SQLCA中有一個(gè)狀態(tài)指示字段SQLCODE。當(dāng)SQLCODE為零時(shí),表示SQL語(yǔ)句執(zhí)行成功,否則返回一個(gè)錯(cuò)誤代碼(負(fù)值)或警告信息(正值)。程序員應(yīng)該在每個(gè)SQL語(yǔ)句之后測(cè)試SQLCODE的值,以便處理各種情況。(3)一個(gè)SQL語(yǔ)句原則上可產(chǎn)生或處理一組記錄,而主語(yǔ)言一次只能處理一個(gè)記錄,為此必須協(xié)調(diào)兩種處理方式。這是用游標(biāo)(Cursor)來(lái)解決的。下面首先討論不需要游標(biāo)的DML語(yǔ)句,然后討論使用游標(biāo)的DML語(yǔ)句。9.不用游標(biāo)的DML語(yǔ)句不需要游標(biāo)的DML語(yǔ)句有:查詢結(jié)果為單記錄的SELECT語(yǔ)句UPDATE(除了CURRENT形式的UPDATE)語(yǔ)句DELETE(除了CURRENT形式的DELETE)語(yǔ)句INSERT語(yǔ)句(1)查詢結(jié)果為單記錄的SELECT語(yǔ)句這類語(yǔ)句的一般格式是:(主語(yǔ)言為PL/1)EXECSQLSELECT目標(biāo)列INTO主變量[空值標(biāo)志]FROM基本表(或視圖)[WHERE條件表達(dá)式];SELECT語(yǔ)句從數(shù)據(jù)庫(kù)中找到符合條件的記錄,把結(jié)果放到主變量中。(2)UPDATE語(yǔ)句(3)DELETE語(yǔ)句(4)INSERT語(yǔ)句10.使用游標(biāo)的DML語(yǔ)句一般情況下SELECT語(yǔ)句的查詢結(jié)果是記錄的集合而不是單個(gè)記錄,為此需要用游標(biāo)機(jī)制作為橋梁,把集合操作轉(zhuǎn)換為單記錄處理。與游標(biāo)有關(guān)的語(yǔ)句有四個(gè):(1)定義游標(biāo)。游標(biāo)是與某一查詢結(jié)果相聯(lián)系的符號(hào)名。用DECLARE語(yǔ)句定義。這是一個(gè)說(shuō)明語(yǔ)句。與游標(biāo)相對(duì)應(yīng)的SELECT語(yǔ)句這時(shí)并不執(zhí)行。(2)打開(kāi)(OPEN)游標(biāo)。打開(kāi)游標(biāo)語(yǔ)句使游標(biāo)處于活動(dòng)狀態(tài)。與游標(biāo)相應(yīng)的查詢語(yǔ)句被執(zhí)行。游標(biāo)指向查詢結(jié)果集中的第一個(gè)記錄之前。(3)推進(jìn)(FETCH)游標(biāo)。把游標(biāo)向前推進(jìn)一個(gè)記錄,并把游標(biāo)指向的當(dāng)前記錄中的字段值取出,放到INTO子句后相應(yīng)的主變量中。FETCH語(yǔ)句常常用于循環(huán),以借助主語(yǔ)言功能逐一處理結(jié)果集中的數(shù)據(jù)。(4)關(guān)閉(CLOSE)游標(biāo)。關(guān)閉游標(biāo),使它不再和原來(lái)的查詢結(jié)果相聯(lián)系。關(guān)閉了的游標(biāo)可以再次被打開(kāi),與新的查詢結(jié)果集相聯(lián)系。使用CURRENT形式的UPDATE和刪除語(yǔ)句應(yīng)注意:(1)若游標(biāo)定義中的SELECT語(yǔ)句帶有UNION或ORDERBY子句,或者這個(gè)SELECT語(yǔ)句相當(dāng)于定義了一個(gè)不可更新的視圖,則不能用這兩個(gè)更新語(yǔ)句。(2)若使用CURRENT形式的UPDATE語(yǔ)句,則游標(biāo)定義中要包括FORUPDATE子句,指出更新的字段(SET子句中使用的字段)。因此,游標(biāo)定義語(yǔ)句的一般格式為:EXECSQLDECLARE游標(biāo)名CURSORFOR子查詢UNION子查詢…[FORUPDATEOF字段名[,字段名]…|ORDER-BY-子句];11.SQL的事務(wù)處理功能(1)事務(wù)處理的概述所謂事務(wù)(Transaction)是指一系列動(dòng)作的組合,這些動(dòng)作被當(dāng)作一個(gè)整體來(lái)處理。這些動(dòng)作或者相繼都被執(zhí)行,或者什么也不做。在數(shù)據(jù)庫(kù)中,一個(gè)動(dòng)作是指一個(gè)SQL語(yǔ)句。事務(wù)是一組SQL語(yǔ)句組成的一個(gè)邏輯單位。要么這些SQL語(yǔ)句全部被按順序正確執(zhí)行,要么在某SQL語(yǔ)句執(zhí)行失敗時(shí),按照用戶要求,取消已執(zhí)行的SQL語(yǔ)句對(duì)數(shù)據(jù)庫(kù)中數(shù)據(jù)的修改?;蛘咭词聞?wù)中SQL語(yǔ)句都被正確執(zhí)行,完成該事務(wù)對(duì)數(shù)據(jù)庫(kù)中數(shù)據(jù)的所有操作;或者要么相當(dāng)于一條SQL語(yǔ)句也未執(zhí)行,數(shù)據(jù)庫(kù)數(shù)據(jù)未做任何改動(dòng)。(2)SQL語(yǔ)言的事務(wù)處理語(yǔ)句SQL語(yǔ)言有3條語(yǔ)句用于事務(wù)處理,它們是:(1)Commit語(yǔ)句,對(duì)于正確執(zhí)行了的事務(wù)進(jìn)行提交,進(jìn)行提交即對(duì)數(shù)據(jù)庫(kù)中數(shù)據(jù)的修改永久化。同時(shí)還釋放事務(wù)和封鎖,標(biāo)志該事務(wù)結(jié)束。(2)Savepoint語(yǔ)句,定義事務(wù)中的一個(gè)回滾保留點(diǎn),它是事務(wù)恢復(fù)時(shí)的一個(gè)標(biāo)記點(diǎn)。(3)rollback語(yǔ)句,無(wú)論事務(wù)執(zhí)行的當(dāng)前位置在哪里,該語(yǔ)句的執(zhí)行要么取消事務(wù)執(zhí)行以來(lái)對(duì)數(shù)據(jù)庫(kù)的全部修改,要么取消至某個(gè)指定回滾點(diǎn)后對(duì)數(shù)據(jù)庫(kù)的全部修改。釋放自保留點(diǎn)之后的全部表或行的封鎖(沒(méi)有保留點(diǎn),相當(dāng)于回滾到事務(wù)開(kāi)始處,終止該事務(wù))。事務(wù)的恢復(fù)(回滾)是根據(jù)事務(wù)執(zhí)行前保存下的當(dāng)時(shí)數(shù)據(jù)庫(kù)狀態(tài)來(lái)實(shí)現(xiàn)的。一遇到rollback語(yǔ)句,就將數(shù)據(jù)庫(kù)中數(shù)據(jù)恢復(fù)到原來(lái)的狀態(tài),相當(dāng)于撤消事務(wù)中已執(zhí)行了的SQL語(yǔ)句。四、數(shù)據(jù)庫(kù)的存儲(chǔ)結(jié)構(gòu)數(shù)據(jù)庫(kù)的存儲(chǔ)結(jié)構(gòu)不同于一般文件系統(tǒng)的存儲(chǔ)結(jié)構(gòu)。數(shù)據(jù)庫(kù)數(shù)據(jù)的特點(diǎn)是各種記錄型之間彼此有聯(lián)系,數(shù)據(jù)是結(jié)構(gòu)化的。數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)不僅涉及每種記錄型的記錄如何存儲(chǔ),而且要使數(shù)據(jù)的存儲(chǔ)反映各種記錄型之間的聯(lián)系。在DB多級(jí)模式中引入內(nèi)模式(存儲(chǔ)模式)的主要目的是使模式的數(shù)據(jù)結(jié)構(gòu)的描述同它的存儲(chǔ)表示的描述分開(kāi),以致DBA為了協(xié)調(diào)數(shù)據(jù)庫(kù)性能而對(duì)數(shù)據(jù)庫(kù)數(shù)據(jù)的存儲(chǔ)方法進(jìn)行修改時(shí),可不必修改模式,以提高數(shù)據(jù)庫(kù)的物理獨(dú)立性。在各個(gè)數(shù)據(jù)庫(kù)管理系統(tǒng)中,對(duì)內(nèi)模式的定義功能各不相同。在關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)中有些DDL語(yǔ)句可影響數(shù)據(jù)庫(kù)的存儲(chǔ)結(jié)構(gòu)。在DBMS中各級(jí)模式的存儲(chǔ)結(jié)構(gòu)是恒定的或唯一的,而數(shù)據(jù)庫(kù)內(nèi)容(或其記錄)的存儲(chǔ)方式是不唯一的。數(shù)據(jù)庫(kù)存儲(chǔ)結(jié)構(gòu)設(shè)計(jì)的好壞直接影響系統(tǒng)的性能。在存儲(chǔ)結(jié)構(gòu)中主要是涉及存儲(chǔ)記錄的設(shè)計(jì)。存儲(chǔ)記錄與概念記錄之間具有對(duì)應(yīng)關(guān)系,如果存儲(chǔ)記錄與概念記錄之間具有一一對(duì)應(yīng)關(guān)系,在這種情況下存儲(chǔ)記錄的設(shè)計(jì)就比較簡(jiǎn)單,不需要進(jìn)一步討論。概念記錄是指在邏輯結(jié)構(gòu)中的記錄。但當(dāng)一個(gè)概念記錄對(duì)應(yīng)多個(gè)不同類型的存儲(chǔ)記錄時(shí),存在如何設(shè)計(jì)存儲(chǔ)記錄的問(wèn)題。對(duì)于這樣的概念記錄,其存儲(chǔ)記錄可以有以下幾種設(shè)計(jì):1.順序組織將存儲(chǔ)記錄設(shè)計(jì)成與概念記錄一一對(duì)應(yīng),按SNO大小(或按記錄到來(lái))的順序?qū)⒂涗浗M成一個(gè)順序組織的文件。這樣組織的優(yōu)點(diǎn)是結(jié)構(gòu)簡(jiǎn)單,缺點(diǎn)是會(huì)浪費(fèi)存儲(chǔ)空間。2.順序帶鏈的組織順序帶鏈組織允許記錄中帶有指針(Pointer),這樣可以大大節(jié)省存儲(chǔ)空間。3.帶次關(guān)鍵字索引的順序組織為了適應(yīng)對(duì)多項(xiàng)內(nèi)容的檢索,可以建立索引文件,上述組織可改為帶次關(guān)鍵字索引的順序組織。4.多表組織在次關(guān)鍵字索引中,由于一個(gè)次關(guān)鍵字值對(duì)應(yīng)于多個(gè)記錄值,它們的個(gè)數(shù)是不固定的,所以對(duì)應(yīng)的指針數(shù)目是可變的。這種可變性給管理帶來(lái)困難,為了解決這個(gè)困難,引入了多表組織。多表組織的實(shí)現(xiàn)思想比較簡(jiǎn)單,在索引中多個(gè)指針?lè)稚⒋娣旁诿總€(gè)記錄值中,索引項(xiàng)中的指針指向第一個(gè)記錄,在第一個(gè)記錄中的指針指向第二個(gè)記錄等等。5.完全倒排組織在一個(gè)記錄型中,對(duì)主關(guān)鍵字以外的數(shù)據(jù)項(xiàng)都建立索引,這樣的組織稱之為完全倒排組織。6.Hash定址組織對(duì)于每一個(gè)存儲(chǔ)記錄值存放在數(shù)據(jù)庫(kù)的什么地方,可通過(guò)對(duì)該記錄的主關(guān)鍵字值的雜湊函數(shù)計(jì)算得出。這種組織為Hash定址組織。雜湊函數(shù)種類很多,如質(zhì)數(shù)除余法、基數(shù)轉(zhuǎn)換法、平方取中法、折疊法、位移法及各位數(shù)字分析法等等。關(guān)鍵是如何選擇一個(gè)雜湊函數(shù),盡可能避免發(fā)生碰撞。對(duì)于不同的主關(guān)鍵字值通過(guò)計(jì)算而得到同一個(gè)地址的映象,稱之為碰撞。7.聯(lián)系的存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)中,通過(guò)外來(lái)關(guān)鍵字(ForeignKey)來(lái)表示概念記錄之間的聯(lián)系。例如,為了表達(dá)學(xué)生和學(xué)校的聯(lián)系,可以在學(xué)生記錄中增加外來(lái)關(guān)鍵字“學(xué)校號(hào)”來(lái)表示聯(lián)系。五、關(guān)系數(shù)據(jù)庫(kù)1.表格表格(或簡(jiǎn)稱表)表示了用戶的特定類型(Type)的一些實(shí)體。表頭由一些屬性名(AttributeName)組成,每個(gè)屬性名對(duì)應(yīng)于一列。在表上屬性名必須唯一,不允許重名。表體是由一些行或元組(tuple)、或記錄(record)組成。一個(gè)元組對(duì)應(yīng)于傳統(tǒng)的文件結(jié)構(gòu)中的一個(gè)記錄,一個(gè)記錄含有若干個(gè)域(field)用以存儲(chǔ)屬性值(Attributevalue)。一個(gè)元組對(duì)應(yīng)于一個(gè)“用戶”實(shí)體的出現(xiàn)(occurrence)。表體中每一行和某一列的交叉點(diǎn)(相當(dāng)于記錄中的域)上保存一個(gè)屬性值。這個(gè)屬性值叫做這一行(或這個(gè)實(shí)體出現(xiàn))的相應(yīng)屬性值。表體中每一列可以保存的值對(duì)應(yīng)于某種屬性類型(TypeofAttribute),也就是說(shuō),這一列的屬性值只能取這個(gè)屬性類型的值。某個(gè)屬性所能取的所有值的集合叫做這個(gè)屬性的值域(DomainofAttribute)。類型和值域的對(duì)應(yīng)關(guān)系是一對(duì)多的。一個(gè)類型有一個(gè)值域,但一個(gè)值域可以作為多個(gè)類型,基名稱不同,但實(shí)質(zhì)上值域一樣。實(shí)際上,類型是對(duì)值域的命名。能唯一標(biāo)識(shí)一個(gè)元組的屬性稱之為關(guān)鍵屬性(PrimaryKeyAttribute)或簡(jiǎn)稱為主關(guān)鍵字(PrimaryKey)。主關(guān)鍵字有時(shí)是由多個(gè)屬性組成的,此時(shí)的主關(guān)鍵字叫做組合關(guān)鍵字(ConˉcatenatedprimaryKey)。有的時(shí)候,表中必須由一些組合的主關(guān)鍵字才能唯一地標(biāo)識(shí)一個(gè)元組,也就是說(shuō),不存在能作關(guān)鍵字的一個(gè)屬性。這時(shí)為了方便,往往引入一個(gè)附加的屬性并稱之為外來(lái)關(guān)鍵字(ForeighKey)來(lái)作主關(guān)鍵字。外來(lái)關(guān)鍵字為以后檢索和查詢帶來(lái)了方便,但也增加了信息冗余。2.表名、表頭和表體表名、表頭和表體在關(guān)系模型中具有不同的作用或功能,因而也具有完全不同的性質(zhì)。表頭是一個(gè)屬性的集合,它規(guī)定了表的結(jié)構(gòu)。表體是一個(gè)特殊的集體,稱作為關(guān)系(relation)?!瓣P(guān)系模型”中的“關(guān)系”一詞就是指表體中的這個(gè)數(shù)學(xué)關(guān)系。在關(guān)系數(shù)據(jù)庫(kù)中,表名對(duì)應(yīng)于數(shù)據(jù)庫(kù)名(或關(guān)系名),表頭對(duì)應(yīng)于數(shù)據(jù)描述(或結(jié)構(gòu)描述),表體對(duì)應(yīng)于數(shù)據(jù)庫(kù)。表體是數(shù)據(jù)庫(kù)的內(nèi)容及數(shù)據(jù)庫(kù)操作的對(duì)象。另外,有兩個(gè)概念必須加以強(qiáng)調(diào):型(type)和值或出現(xiàn)(occurence)。表頭定義了實(shí)體(或元組)的型,也就是說(shuō)規(guī)定了實(shí)體(或元組)的值域。而表體則給出了實(shí)體(或元組)的出現(xiàn)。出現(xiàn)是型中的一個(gè)值。3.關(guān)系的數(shù)學(xué)定義關(guān)系模型是建立在集合論(SetTheory)的基礎(chǔ)之上的。現(xiàn)在,開(kāi)始用集合論的術(shù)語(yǔ)來(lái)嚴(yán)格地定義數(shù)學(xué)上的關(guān)系,即給出關(guān)系的數(shù)學(xué)定義。定義1域(Domain)是值(value)的集合。4.關(guān)系模型關(guān)系模型由三部分組成:數(shù)據(jù)結(jié)構(gòu)(即關(guān)系)、關(guān)系操作、關(guān)系的完整性。下面將對(duì)這三個(gè)部分進(jìn)行分別的討論。(1)單一的數(shù)據(jù)結(jié)構(gòu)———關(guān)系在關(guān)系模型中,無(wú)論是實(shí)體還是實(shí)體之間的聯(lián)系均由單一的類型結(jié)構(gòu)—關(guān)系來(lái)表示。在前面,已給出了關(guān)系和域的數(shù)學(xué)定義,介紹了n元關(guān)系、元組和屬性等概念。下面介紹關(guān)鍵字、關(guān)系模式和關(guān)系數(shù)據(jù)庫(kù)等一些基本概念。關(guān)鍵字關(guān)系中的某一組屬性,若其值可以唯一地標(biāo)識(shí)一個(gè)元組,則稱該屬性組為一個(gè)候選關(guān)鍵字(CandidateKey)。若一個(gè)關(guān)系有多個(gè)候選關(guān)鍵字,則可以任選其中一個(gè)作為主關(guān)鍵字(PrimaryKey)。主關(guān)鍵字中的諸屬性被稱為主屬性。關(guān)系模式關(guān)系的描述稱為關(guān)系模式。它包括:關(guān)系名、組成關(guān)系的諸屬性名、屬性到域的映象、屬性間的數(shù)據(jù)依賴關(guān)系等等。所以,關(guān)系模式由關(guān)系名、諸屬性名和屬性到域的映象三個(gè)部分組成,關(guān)系模式通常簡(jiǎn)記為R(A1,A2,…,An),其中R是關(guān)系名,A1,A2,…,An為諸屬性名。屬性到域的映象一般通過(guò)指定屬性的類型和長(zhǎng)度來(lái)說(shuō)明。某個(gè)關(guān)系模式在某一時(shí)刻所具有的狀態(tài)是指關(guān)系的外延,即元組的集合。關(guān)系的外延內(nèi)容有時(shí)簡(jiǎn)稱為關(guān)系。但關(guān)系模式和關(guān)系的內(nèi)容有時(shí)也統(tǒng)稱為關(guān)系。讀者可以從上下文中區(qū)別其確切的含義。形象地說(shuō),關(guān)系模式是關(guān)于表名和表頭的描述,而關(guān)系的內(nèi)容是表體。關(guān)系數(shù)據(jù)庫(kù)在關(guān)系數(shù)據(jù)庫(kù)中,要分清型和值兩個(gè)基本概念。關(guān)系數(shù)據(jù)庫(kù)的型是指數(shù)據(jù)庫(kù)的結(jié)構(gòu)描述,它包括關(guān)系數(shù)據(jù)庫(kù)名、若干屬性的定義,以及這些屬性上的若干關(guān)系關(guān)系模式。亦稱為數(shù)據(jù)庫(kù)的內(nèi)涵(Intension),數(shù)據(jù)庫(kù)的值亦稱為數(shù)據(jù)庫(kù)的外延。在關(guān)系數(shù)據(jù)庫(kù)中,內(nèi)涵是比較穩(wěn)定的,它規(guī)定了外延的取值范圍。而外延卻是隨時(shí)間變化的。這和在一般的形式邏輯中外延和內(nèi)涵一一對(duì)應(yīng)有所區(qū)別。此處外延是指任意一個(gè)滿足內(nèi)涵的集合,而不一定恒指滿足內(nèi)涵的最大的一個(gè)集合。關(guān)系模式(即內(nèi)涵)是穩(wěn)定的;而關(guān)系的內(nèi)容,即外延,卻是隨時(shí)間動(dòng)態(tài)的變化而變化的。數(shù)據(jù)庫(kù)的結(jié)構(gòu)(即模式)是穩(wěn)定的;而數(shù)據(jù)庫(kù)中的數(shù)據(jù)內(nèi)容卻在不斷地更新。(2)關(guān)系操作關(guān)系模型規(guī)定了關(guān)系操作的功能和特點(diǎn),但不對(duì)DBMS語(yǔ)言的語(yǔ)法做出具體的規(guī)定。關(guān)系數(shù)據(jù)庫(kù)語(yǔ)言的主要特點(diǎn)(或優(yōu)點(diǎn))是其高度的非過(guò)程化(Non-procedureae)或者說(shuō)明性(declarative)。關(guān)系數(shù)據(jù)庫(kù)語(yǔ)言的語(yǔ)句是透明的。用戶只須知道語(yǔ)句做什么,而不須知道怎么做的。Codd在其早期的文章中,引入了8種基本的操作:并(Union)交(Intersection)差(Difference)笛卡爾乘積(CartesianProduct)限制(Restrictions)投影(Projection)連接(Join)除(Division)這些操作都是對(duì)關(guān)系的內(nèi)容或表體實(shí)施操作的,得到的結(jié)果仍為關(guān)系。注意,這些操作只是基本的操作,而不是不再可分的原始(Primitive)操作,例如,Join,Intersection和Division可以由其它五種操作合成。但是,把它們?nèi)齻€(gè)也作為基本操作使用起來(lái)很方便。另外,Codd并沒(méi)說(shuō)上述8種操作就是關(guān)系數(shù)據(jù)庫(kù)只能有的8種操作。實(shí)際上,上述8種操作僅僅是作為最小的DML操作的基礎(chǔ)部分,并且也還未考慮到DDL的需求。SQL支持的操作多于上述8種DML操作,而且SQL還支持DDL操作。關(guān)系操作的特點(diǎn)是集合操作,即操作的對(duì)象和結(jié)果都是集合。這種操作方式也稱為一次一集合(set-at-a-time)方式。而非關(guān)系模型的數(shù)據(jù)庫(kù)的操作方式則為一次一記錄(record-at-a-time)方式。關(guān)系操作可以用兩種方式來(lái)表示:①代數(shù)方式,即關(guān)系代數(shù)②邏輯方式,即關(guān)系演算而關(guān)系演算又進(jìn)一步分為元組關(guān)系演算和域關(guān)系演算。已經(jīng)證明,這些表示方式在功能上是相互等價(jià)的。一般選其一即可。(3)關(guān)系模型的三類完整性關(guān)系模型的三類完整性是:①實(shí)體完整性(EntityIntegrity)②參照完整性(ReferentialIntegrity)③用戶定義的完整性(UserDefinedIntegrity)其中,實(shí)體完整性和參照完整性是任何關(guān)系模型都必須滿足的完整性約束條件,應(yīng)該由關(guān)系數(shù)據(jù)庫(kù)DBMS自動(dòng)支持。而用戶定義的完整性的支持是由DBMS提供完整性定義設(shè)施(或機(jī)制),可以隨DBMS商品軟件不同而有所變化。實(shí)體完整性是指:若屬性A是基本關(guān)系R的主關(guān)鍵字的屬性(即主屬性),則屬性A不能取空值(NULL)。在關(guān)系數(shù)據(jù)庫(kù)中有各種關(guān)系,如基本關(guān)系(常稱為基本表)、查詢表、視圖表等等。基本表是指實(shí)際存在的表,它是實(shí)際存儲(chǔ)數(shù)據(jù)的邏輯表示。查詢表是指和查詢結(jié)果相對(duì)應(yīng)的表。而視圖表是由基本表或視圖表導(dǎo)出的表,是虛表,不對(duì)應(yīng)實(shí)際存儲(chǔ)的數(shù)據(jù)。實(shí)體完整性是針對(duì)基本關(guān)系的??罩凳侵浮安恢馈被蛘摺盁o(wú)意義的”或“不屬于定義域”值??罩狄浴癗ULL”表示。對(duì)于實(shí)體完整性作如下說(shuō)明:(1)一個(gè)基本關(guān)系通常對(duì)應(yīng)于現(xiàn)實(shí)世界中的一個(gè)實(shí)體集。例如學(xué)生關(guān)系對(duì)應(yīng)于學(xué)生實(shí)體集?;娟P(guān)系不是由其它關(guān)系生成的關(guān)系。基本關(guān)系是本原(Primitive),是定義復(fù)雜關(guān)系的出發(fā)點(diǎn)。(2)現(xiàn)實(shí)世界中的實(shí)體是可區(qū)分的,即實(shí)體具有某種唯一性的標(biāo)識(shí)。(3)在關(guān)系模型中由主關(guān)鍵字作為滿足唯一性的標(biāo)識(shí)。(4)主關(guān)鍵字中屬性不能取空值。因?yàn)槿糁麝P(guān)鍵字中某屬性取空值,則意味著某個(gè)實(shí)體不可標(biāo)識(shí);而這和(2)相矛盾。參照完整性是指:若基本關(guān)系R中含有另一個(gè)基本關(guān)系S的主關(guān)鍵字KS所對(duì)應(yīng)的屬性組F(F稱為R的外部關(guān)鍵字(externalkeys)),則在關(guān)系R中的每個(gè)元組中的F上的值必須滿足:①或者取空值(即F中的每個(gè)屬性的值均為空值);②或等于S中某個(gè)元組的主關(guān)鍵字的值。基本關(guān)系R和S不一定是不同的關(guān)系。外部關(guān)鍵字也稱為外來(lái)關(guān)鍵字。例如,某數(shù)據(jù)庫(kù)中有職工關(guān)系EMP(職工號(hào),姓名,部門(mén)號(hào))和部門(mén)關(guān)系DEPT(部門(mén)號(hào),部門(mén)名稱)為兩個(gè)基本關(guān)系。關(guān)系EMP的主關(guān)鍵字為“職工號(hào)”,DEPT的主關(guān)鍵字為“部門(mén)號(hào)”在EMP中,“部門(mén)號(hào)”是EMP的外部關(guān)鍵字。故此,在EMP中的每個(gè)元組中“部門(mén)號(hào)”的值只有兩種可能性:①取空值。這說(shuō)明這個(gè)職工尚未分到某個(gè)部門(mén);②或取非空值。這時(shí)“部門(mén)號(hào)”的值必須是DEPT中某個(gè)元組中的“部門(mén)號(hào)”的值。這說(shuō)明一個(gè)職工不可能被分配到一個(gè)不存在的部門(mén)。也就是說(shuō),被參照的關(guān)系DEPT中一定存在一個(gè)元組,該元組的關(guān)鍵字的值等于EMP中某元組的外部關(guān)鍵字的值。實(shí)體完整性和參照完整性是針對(duì)任何關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)的所有數(shù)據(jù)庫(kù)的一般性原則。用戶定義的完整性針對(duì)某一具體的數(shù)據(jù)庫(kù)的約束條件。條件是由現(xiàn)實(shí)世界中的應(yīng)用環(huán)境決定的。它涉及到某一具體的應(yīng)用中的數(shù)據(jù)所必須滿足的語(yǔ)義要求。關(guān)型模型的DBMS應(yīng)提供定義和檢驗(yàn)這類完整性條件的機(jī)制,以使用統(tǒng)一的方法來(lái)自動(dòng)地處理它們而不要求應(yīng)用程序員來(lái)承擔(dān)這一功能。5.關(guān)系數(shù)據(jù)庫(kù)語(yǔ)言概述關(guān)系數(shù)據(jù)庫(kù)語(yǔ)言分三類:數(shù)據(jù)描述語(yǔ)言DDL,數(shù)據(jù)操縱語(yǔ)言DML和數(shù)據(jù)控制語(yǔ)言DCL。其中,DDL負(fù)責(zé)數(shù)據(jù)庫(kù)的描述,提供一種數(shù)據(jù)描述機(jī)制,用來(lái)描述數(shù)據(jù)庫(kù)的特征或數(shù)據(jù)的邏輯結(jié)構(gòu)。DML負(fù)責(zé)數(shù)據(jù)庫(kù)的操作,提供一種處理數(shù)據(jù)庫(kù)操作的機(jī)制。DCL負(fù)責(zé)控制數(shù)據(jù)庫(kù)的完整性和安全性,提供一種檢驗(yàn)完整性和保證安全的機(jī)制。DML是用戶經(jīng)常使用的語(yǔ)言,包括了DBMS的主要功能。DML包括數(shù)據(jù)查詢和數(shù)據(jù)的增、刪、改等功能。其中查詢的表達(dá)方式是DML的主要部分。關(guān)系數(shù)據(jù)庫(kù)的DML按照查詢方式可以分為兩大類:(1)用對(duì)關(guān)系的集合代數(shù)運(yùn)算來(lái)表示查詢的方式,稱為關(guān)系代數(shù)(RelationalAlgebra)。(2)用謂詞演算來(lái)表達(dá)查詢的方式,稱為關(guān)系演算(RelationalCalculus)。關(guān)系演算又可按謂詞變?cè)幕緦?duì)象是元組變量(tuplevariable)還是域變量(domainvariable)分為元組關(guān)系演算和域關(guān)系演算兩種。關(guān)系代數(shù)和兩種關(guān)系演算均是抽象的查詢語(yǔ)言,這些抽象的查詢語(yǔ)言和實(shí)際的DBMS軟件產(chǎn)品中實(shí)現(xiàn)的具體的查詢語(yǔ)言并不完全一樣。但它們是DBMS中查詢語(yǔ)言的理論基礎(chǔ)。關(guān)系代數(shù)、元組關(guān)系演算和域關(guān)系演算這三種語(yǔ)言在表達(dá)能力上是彼此相互等價(jià)的,它們均可以作為評(píng)價(jià)實(shí)際DBMS軟件產(chǎn)品中查詢語(yǔ)言能力的標(biāo)準(zhǔn)。實(shí)際DBMS軟件產(chǎn)品的查詢語(yǔ)言,除了提供關(guān)系代數(shù)(或一種關(guān)系演算)之外,還提供了許多附加的功能,如庫(kù)函數(shù)、算術(shù)運(yùn)算等功能。SQL是介于關(guān)系代數(shù),和關(guān)系演算之間的一種語(yǔ)言。SQL不僅具有豐富的查詢功能,而且還具有數(shù)據(jù)庫(kù)定義和數(shù)據(jù)庫(kù)控制功能。SQL是集DDL、DML、DCL為一體的標(biāo)準(zhǔn)的關(guān)系數(shù)據(jù)庫(kù)語(yǔ)言。SQL充分體現(xiàn)了關(guān)系數(shù)據(jù)庫(kù)語(yǔ)言的優(yōu)點(diǎn)。6.關(guān)系代數(shù)關(guān)系代數(shù)中的運(yùn)算可以分為兩類:(1)傳統(tǒng)的集合運(yùn)算,如并、交、差、笛卡爾乘積等。這類運(yùn)算是從關(guān)系的“水平方向(即按行)”來(lái)進(jìn)行的。(2)專門(mén)的關(guān)系運(yùn)算,如選擇、投影、連接、除。這類運(yùn)算不僅涉及到行而且也涉及到列。7.關(guān)系演算關(guān)系演算是以數(shù)理邏輯中的謂詞演算為基礎(chǔ)的。用謂詞演算作為關(guān)系數(shù)據(jù)庫(kù)的語(yǔ)言并提出關(guān)系演算的是E.F.Codd。Codd首先定義了關(guān)系演算語(yǔ)言ALPHA。但ALPHA并沒(méi)有在計(jì)算機(jī)上實(shí)現(xiàn)。但關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)INGRES所用的QUEL語(yǔ)言是參考ALPHA研制的,與ALPHA十分類似。六、關(guān)系數(shù)據(jù)庫(kù)的規(guī)范化理論函數(shù)依賴定義1設(shè)R(U)是屬性集U上的關(guān)系模式。X,Y是U的子集。若對(duì)于R(U)的任意一個(gè)可能的關(guān)系r,r中不可能存在兩個(gè)元組在X上的屬性值相等,而在Y上的屬性值不等,則稱‘X函數(shù)確定Y’或‘Y函數(shù)依賴于X’,記作X→Y。函數(shù)依賴和別的數(shù)據(jù)依賴一樣是語(yǔ)義范疇的概念。只能根據(jù)語(yǔ)義來(lái)確定一個(gè)函數(shù)依賴。例如姓名→年齡這個(gè)函數(shù)依賴只有在沒(méi)有同名人的條件下成立。如果允許有相同名字,則年齡就不再函數(shù)依賴于姓名了。設(shè)計(jì)者也可以對(duì)現(xiàn)實(shí)世界作強(qiáng)制的規(guī)定。例如規(guī)定不允許同名人出現(xiàn),因而使姓名→年齡函數(shù)依賴成立。這樣當(dāng)插入某個(gè)元組時(shí)這個(gè)元組上的屬性值必須滿足規(guī)定的函數(shù)依賴,若發(fā)現(xiàn)有同名人存在,則拒絕插入該元組。注意,函數(shù)依賴不是指關(guān)系模式R的某個(gè)或某些關(guān)系滿足的約束條件,而是指R的一切關(guān)系均要滿足的約束條件七、數(shù)據(jù)庫(kù)的安全與保護(hù)1.安全性數(shù)據(jù)庫(kù)的安全性是指保護(hù)數(shù)據(jù)庫(kù)以防止不合法的或非正常的使用所造成的數(shù)據(jù)泄露、更改或破壞。安全性問(wèn)題不是數(shù)據(jù)庫(kù)系統(tǒng)所獨(dú)有的,計(jì)算機(jī)系統(tǒng)都有這個(gè)問(wèn)題。只是在數(shù)據(jù)庫(kù)系統(tǒng)中大量數(shù)據(jù)集中存放,而且為許多用戶直接共享,是十分重要的信息資源。從而使安全性問(wèn)題變得更為突出。系統(tǒng)安全保護(hù)措施是否有效是數(shù)據(jù)庫(kù)系統(tǒng)的主要性能指標(biāo)之一。對(duì)于數(shù)據(jù)庫(kù)的安全保密方式可以有系統(tǒng)處理的和物理的兩個(gè)方面。所謂物理的是指,對(duì)于強(qiáng)力逼迫透露口令、在通信線路上竊聽(tīng)、以至盜竊物理存儲(chǔ)設(shè)備等行為。對(duì)此所采取的措施是將數(shù)據(jù)編為密碼,加強(qiáng)警衛(wèi)以識(shí)別用戶身份和保護(hù)存儲(chǔ)設(shè)備等措施。在一般計(jì)算機(jī)系統(tǒng)中,安全措施是一級(jí)一級(jí)層層設(shè)置的。(1)用戶標(biāo)識(shí)和鑒定首先,系統(tǒng)提供一定的方式讓用戶標(biāo)識(shí)自己的名字或身份。系統(tǒng)進(jìn)行核實(shí),通過(guò)鑒定后才提供機(jī)器使用權(quán)。常用的方法有:用一個(gè)用戶名或者用戶標(biāo)識(shí)號(hào)來(lái)標(biāo)明用戶身份。系統(tǒng)鑒別此用戶是否是合法用戶。若是,則可以進(jìn)入下一步的核實(shí);若不是,則不能使用計(jì)算機(jī)。用戶名的登錄只由系統(tǒng)管理員進(jìn)行,一般用戶不能實(shí)施用戶名登錄。口令(Password),為了進(jìn)一步核實(shí)用戶,系統(tǒng)常常要求用戶輸入口令。(2)存取控制對(duì)于獲得上機(jī)權(quán)的用戶還要根據(jù)預(yù)先定義好的用戶權(quán)限進(jìn)行存取控制,保證用戶只能存取他有權(quán)存取的數(shù)據(jù)。所謂用戶權(quán)限是指不同的用戶對(duì)于不同的數(shù)據(jù)對(duì)象允許執(zhí)行的操作權(quán)限。它由兩部分組成,一是數(shù)據(jù)對(duì)象,二是操作類型。數(shù)據(jù)對(duì)象有二類。一類是數(shù)據(jù)本身,如關(guān)系數(shù)據(jù)庫(kù)中的表、字段,非關(guān)系數(shù)據(jù)庫(kù)中的記錄、字段(亦稱為數(shù)據(jù)項(xiàng))。另一類是外模式、模式、內(nèi)模式。在關(guān)系系統(tǒng)中DBA可以把建立、修改基本表的權(quán)力授予用戶,用戶獲得此權(quán)力后可以建立基本表、索引、視圖。這說(shuō)明關(guān)系系統(tǒng)中存取控制的數(shù)據(jù)對(duì)象不僅有數(shù)據(jù)而且有模式、外模式、內(nèi)模式等數(shù)據(jù)字典中的內(nèi)容。對(duì)于存取權(quán)限的定義稱為授權(quán)(Authorization)。這些定義經(jīng)過(guò)編譯后存儲(chǔ)在數(shù)據(jù)字典中。每當(dāng)用戶發(fā)出存取數(shù)據(jù)庫(kù)的操作請(qǐng)求后,DBMS查找數(shù)據(jù)字典,根據(jù)用戶權(quán)限進(jìn)行合法權(quán)限檢查(AuthorizationCheck)。若用戶的操作請(qǐng)求超出了定義的權(quán)限,系統(tǒng)拒絕執(zhí)行此操作。授權(quán)編譯程序和合法權(quán)限檢查機(jī)制一起組成了安全性子系統(tǒng)。衡量授權(quán)子系統(tǒng)精巧程度的另一個(gè)盡度是否提供與數(shù)據(jù)值有關(guān)的授權(quán)。有的系統(tǒng)還允許存取謂詞中引用系統(tǒng)變量,如一天中的時(shí)刻,終端設(shè)備號(hào)。這樣用戶只能在某臺(tái)終端、某段時(shí)間內(nèi)存取有關(guān)數(shù)據(jù),這就是與時(shí)間和地點(diǎn)有關(guān)的存取權(quán)限。另外,在操作系統(tǒng)中對(duì)文件、目標(biāo)等的存取還有一些安全保護(hù)措施。其中加密是一種防止數(shù)據(jù)內(nèi)容被別人引用或了解的切實(shí)可行的辦法。加密有程序加密和硬件加密卡兩種形式。2.完整性數(shù)據(jù)庫(kù)的完整性是指數(shù)據(jù)的正確性和相容性。DBMS必須提供一種功能來(lái)保證數(shù)據(jù)庫(kù)中數(shù)據(jù)的完整性。這種功能亦稱為完整性檢查,即系統(tǒng)用一定的機(jī)制來(lái)檢查數(shù)據(jù)庫(kù)中的數(shù)據(jù)是否滿足規(guī)定的條件。這種條件在數(shù)據(jù)庫(kù)中稱為完整性約束條件。數(shù)據(jù)的約束條件是語(yǔ)義的體現(xiàn),這些完整性約束條件將作為模式的一部分存放數(shù)據(jù)字典中。數(shù)據(jù)的完整性和安全性是兩個(gè)不同的概念。前者是為了防止數(shù)據(jù)庫(kù)中存在不符合語(yǔ)義的數(shù)據(jù),防止錯(cuò)誤信息的輸入和輸出,即所謂垃圾進(jìn)垃圾出(GarbageInGarbageOut)所造成的無(wú)效操作和錯(cuò)誤結(jié)果。而后者是保護(hù)數(shù)據(jù)庫(kù)防止惡意的破壞和非法的存取。當(dāng)然,完整性和安全性是密切相關(guān)的。特別從系統(tǒng)實(shí)現(xiàn)的方法來(lái)看,往往是一種機(jī)制常常既可用于安全性保護(hù)亦可用于完整性保證。完整性約束條件可以分類如下:(1)值的約束和結(jié)構(gòu)的約束前者指對(duì)數(shù)據(jù)的值的限制,后者指對(duì)數(shù)據(jù)之間聯(lián)系的限制。關(guān)于對(duì)數(shù)據(jù)值的約束這類約束條件是指對(duì)數(shù)據(jù)取值類型、范圍、精度等的規(guī)定。關(guān)于數(shù)據(jù)之間聯(lián)系的約束數(shù)據(jù)庫(kù)中同一關(guān)系的不同屬性之間可以有一定的聯(lián)系,從而也應(yīng)滿足一定的約束條件。同時(shí),由于數(shù)據(jù)庫(kù)中數(shù)據(jù)是結(jié)構(gòu)化的,不同的關(guān)系之間也可以有聯(lián)系,因而不同關(guān)系的屬性之間也可滿足一定的約束條件。(2)靜態(tài)約束和動(dòng)態(tài)約束所謂靜態(tài)約束是指對(duì)數(shù)據(jù)庫(kù)每一確定狀態(tài)的數(shù)據(jù)所應(yīng)滿足的約束條件。以上所講的約束都屬靜態(tài)約束。動(dòng)態(tài)約束是指數(shù)據(jù)庫(kù)從一種狀態(tài)轉(zhuǎn)變?yōu)榱硪环N狀態(tài)時(shí)新、舊值之間所應(yīng)滿足的約束條件。(3)立即執(zhí)行約束和延遲執(zhí)行約束立即執(zhí)行約束是指在執(zhí)行用戶事務(wù)時(shí),對(duì)事務(wù)中某一更新語(yǔ)句執(zhí)行完后馬上對(duì)此數(shù)據(jù)所應(yīng)滿足的約束條件進(jìn)行完整性檢查。延遲執(zhí)行是指在整個(gè)事務(wù)執(zhí)行結(jié)束后方對(duì)此約束條件進(jìn)行完整性檢查,結(jié)果正確方能提交。完整性的實(shí)現(xiàn)應(yīng)包括兩個(gè)方面,一是系統(tǒng)要提供定義完整性約束條件的功能,二是提供檢查完整性約束條件的方法。對(duì)于數(shù)據(jù)值的那類完整性約束條件通常在模式中定義。例如在模式中定義屬性名、類型、長(zhǎng)度、碼屬性名并標(biāo)明其值是唯一的、非空的等等。另外的那些約束條件就要用專門(mén)的方式加以定義。3.并發(fā)控制數(shù)據(jù)庫(kù)是一個(gè)共享資源,可以由多個(gè)用戶使用。這些用戶程序可以一個(gè)一個(gè)地串行執(zhí)行,也可以并行執(zhí)行。在單CPU計(jì)算機(jī)上,為了充分利用數(shù)據(jù)庫(kù)資源,應(yīng)該允許多個(gè)用戶程序并行的存取數(shù)據(jù)。這樣就會(huì)產(chǎn)生多個(gè)用戶程度并發(fā)地存取同一數(shù)據(jù)的情況。若對(duì)并發(fā)操作不加控制就會(huì)存取和存儲(chǔ)不正確的數(shù)據(jù),破壞數(shù)據(jù)庫(kù)的完整性(這里也稱為一致性)。在多CPU計(jì)算機(jī)或多計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境下,并發(fā)控制尤為重要。(1)事務(wù)的概念事務(wù)(Transaction)是并發(fā)控制的基本單位。所謂事務(wù)是一個(gè)操作序列。這些操作作為一個(gè)序列形成一個(gè)整體要么都做,要么都不做,是一個(gè)不可分割的工作單位。事務(wù)通常以BEGINTRANSACTION開(kāi)始,以COMMIT或ROLLBACK操作結(jié)束。COMMIT即提交,提交事務(wù)中所有的操作,事務(wù)正常結(jié)束。ROLLBACK即撤消已作的所有操作,滾回到事務(wù)開(kāi)始時(shí)的狀態(tài)。這里的操作指對(duì)數(shù)據(jù)庫(kù)的更新操作。滾回即相當(dāng)于所有操作均未執(zhí)行。事務(wù)和程序是兩個(gè)概念。一般地講,一個(gè)程序可包括多個(gè)事務(wù),由于事務(wù)是并發(fā)控制的基本單位,所以下面的討論均以事務(wù)為對(duì)象。(2)數(shù)據(jù)一致性級(jí)別的概念。所謂并發(fā)控制就是要用正確的方式調(diào)度并發(fā)操作,避免造成數(shù)據(jù)的不一致性,使一個(gè)用戶事務(wù)的執(zhí)行不受其它事務(wù)的干擾。4.封鎖封鎖(Locking)就是事務(wù)T可以向系統(tǒng)發(fā)出請(qǐng)求,對(duì)某個(gè)數(shù)據(jù)對(duì)象(最常用的是記錄)加鎖。于是事務(wù)T對(duì)這個(gè)數(shù)據(jù)對(duì)象就有一定的控制。例如,其它事務(wù)不能更新此數(shù)據(jù)直到T釋放(unlock)它的鎖為止。確切的控制由封鎖的類型決定?;镜姆怄i類型有兩種:排它鎖(Exclusivelocks簡(jiǎn)記為X鎖)和共享鎖(Sharelocks簡(jiǎn)記為S鎖)。若事務(wù)T對(duì)數(shù)據(jù)R加上X鎖,則只允許T讀取和修改R;其它一切事務(wù)對(duì)R的任何(包括封鎖)請(qǐng)求都不成功,直至T釋放R上的X鎖為止。這就保證了其它事務(wù)不能再讀取和修改R,直到T釋放X鎖。若事務(wù)T對(duì)數(shù)據(jù)R加上S鎖,則其它事務(wù)對(duì)R的X鎖請(qǐng)求不能成功,而對(duì)R的共享請(qǐng)求可以得到。這就保證了其它事務(wù)以讀取R但不能修改R,直至T釋放S鎖為止。5.可串行性定義當(dāng)且僅當(dāng)某組事務(wù)的一定交叉調(diào)度產(chǎn)生的結(jié)果和這些事務(wù)的某一串行調(diào)度的結(jié)果相同,則這個(gè)交叉調(diào)度是可串行化的。可串行性(Serializability)是并行事務(wù)正確性的準(zhǔn)則。這個(gè)準(zhǔn)則規(guī)定,一給定的交叉調(diào)度,當(dāng)且僅當(dāng)它是可串行化的,才認(rèn)為是正確的。6.兩段鎖協(xié)議兩段鎖協(xié)議規(guī)定所有的事務(wù)應(yīng)遵守下列規(guī)則:(1)在對(duì)任何數(shù)據(jù)進(jìn)行讀、寫(xiě)操作之前,事務(wù)首先要獲得對(duì)該數(shù)據(jù)的封鎖,而且:(2)在釋放一個(gè)封鎖之后,事務(wù)不再獲得任何其它鎖。所謂“兩段”鎖的含義是:事務(wù)分為兩個(gè)階段。第一階段是獲得封鎖,也稱為擴(kuò)展階段。第二階段是釋放封鎖,也稱為收縮階段。定理若所有事務(wù)均遵守兩段鎖協(xié)議,則這些事務(wù)的所有交叉調(diào)度都是可串行化的(證明略)。為了確保事務(wù)并行執(zhí)行的正確性,許多系統(tǒng)采用兩段鎖協(xié)議。同時(shí)系統(tǒng)設(shè)有死鎖檢測(cè)機(jī)制,發(fā)現(xiàn)死鎖后按一定的算法解除死鎖。7.恢復(fù)盡管系統(tǒng)中采取了各種保護(hù)措施來(lái)保證數(shù)據(jù)庫(kù)的安全性和完整性不被破壞,保證并行事務(wù)的正確執(zhí)行,但是計(jì)算機(jī)系統(tǒng)中硬件的故障、軟件的錯(cuò)誤、操作員的失誤以及故意的破壞仍是不可避免的。這些故障輕則造成運(yùn)行事務(wù)非正常地中斷,影響數(shù)據(jù)庫(kù)中數(shù)據(jù)的正確性,重則破壞數(shù)據(jù)庫(kù),使數(shù)據(jù)庫(kù)中全部或部分?jǐn)?shù)據(jù)丟失。因此數(shù)據(jù)庫(kù)管理系統(tǒng)必須具有把數(shù)擾庫(kù)從錯(cuò)誤狀態(tài)恢復(fù)到某一已知的正確狀態(tài)(亦稱為完整狀態(tài)或一致?tīng)顟B(tài))的功能,這就是數(shù)據(jù)庫(kù)的恢復(fù)?;謴?fù)子系統(tǒng)是數(shù)據(jù)庫(kù)管理系統(tǒng)的一個(gè)重要組成部分,而且還相當(dāng)龐大,常常占整個(gè)系統(tǒng)代碼的10%以上(如IMS,DB2)。故障恢復(fù)是否考慮周到和行之有效,是數(shù)據(jù)庫(kù)系統(tǒng)性能的一個(gè)重要指標(biāo)。大型的數(shù)據(jù)庫(kù)應(yīng)用對(duì)故障恢復(fù)的要求更加強(qiáng)烈。有時(shí)甚至采用雙工制。(1)故障的種類數(shù)據(jù)庫(kù)系統(tǒng)中可能發(fā)生各種各樣的故障,大致可以分以下幾類:①事務(wù)內(nèi)部的故障;②系統(tǒng)范圍內(nèi)的故障;③介質(zhì)故障;④計(jì)算機(jī)病毒。(2)轉(zhuǎn)儲(chǔ)和恢復(fù)轉(zhuǎn)儲(chǔ)是數(shù)據(jù)庫(kù)恢復(fù)中經(jīng)常采用的基本技術(shù)。所謂轉(zhuǎn)儲(chǔ)即DBA定期地將整個(gè)數(shù)據(jù)庫(kù)復(fù)制到磁帶或另一個(gè)磁盤(pán)上保存起來(lái)的過(guò)程。這些備用的數(shù)據(jù)文本為后備副本或后援副本。當(dāng)數(shù)據(jù)庫(kù)遭到破壞后就可以利用后備副本把數(shù)據(jù)庫(kù)恢復(fù)。這時(shí),數(shù)據(jù)庫(kù)只能恢復(fù)到轉(zhuǎn)儲(chǔ)時(shí)的狀態(tài),從那以后的所有更新事務(wù)必須重新運(yùn)行才能恢復(fù)到現(xiàn)時(shí)的正常狀態(tài)。轉(zhuǎn)儲(chǔ)是十分耗費(fèi)時(shí)間和資源的,不能頻繁進(jìn)行。DBA應(yīng)該根據(jù)數(shù)據(jù)庫(kù)使用情況確定一個(gè)適當(dāng)?shù)霓D(zhuǎn)儲(chǔ)周期。轉(zhuǎn)儲(chǔ)可分為靜態(tài)轉(zhuǎn)儲(chǔ)和動(dòng)態(tài)轉(zhuǎn)儲(chǔ)。靜態(tài)轉(zhuǎn)儲(chǔ)是指轉(zhuǎn)儲(chǔ)期間不允許(或不存在)對(duì)數(shù)據(jù)庫(kù)進(jìn)行任何存取、修改活動(dòng)。動(dòng)態(tài)轉(zhuǎn)儲(chǔ)是指轉(zhuǎn)儲(chǔ)期間允許對(duì)數(shù)據(jù)庫(kù)進(jìn)行存取或修改。即轉(zhuǎn)儲(chǔ)和用戶事務(wù)可以并發(fā)執(zhí)行。靜態(tài)轉(zhuǎn)儲(chǔ)簡(jiǎn)單,但轉(zhuǎn)儲(chǔ)必須等待用戶事務(wù)結(jié)束才能進(jìn)行。同樣,新的事務(wù)必須等待轉(zhuǎn)儲(chǔ)結(jié)束才能執(zhí)行。顯然,這會(huì)降低數(shù)據(jù)庫(kù)的可用性。動(dòng)態(tài)轉(zhuǎn)儲(chǔ)可克服靜態(tài)轉(zhuǎn)儲(chǔ)的缺點(diǎn)。但是,轉(zhuǎn)儲(chǔ)結(jié)束時(shí)后援副本上的數(shù)據(jù)并不能保證正確有效。例如,在轉(zhuǎn)儲(chǔ)期間的某時(shí)刻t1系統(tǒng)把數(shù)據(jù)A=100轉(zhuǎn)儲(chǔ)到了磁帶上,而在時(shí)刻t2,某一事務(wù)對(duì)A進(jìn)行了修改使A=200轉(zhuǎn)儲(chǔ)結(jié)束,后援副本上的A已是過(guò)時(shí)的數(shù)據(jù)了。為此,必須把轉(zhuǎn)儲(chǔ)期間事務(wù)對(duì)數(shù)據(jù)庫(kù)的修改活動(dòng)登記下來(lái),建立日志文件(logfile)。這樣,后援副本加上日志文件就能把數(shù)據(jù)庫(kù)恢復(fù)到某一時(shí)刻的正確狀態(tài)。轉(zhuǎn)儲(chǔ)還可以分為海量轉(zhuǎn)儲(chǔ)和增量轉(zhuǎn)儲(chǔ)。海量轉(zhuǎn)儲(chǔ)是指每次轉(zhuǎn)儲(chǔ)全部數(shù)據(jù)庫(kù)。增量轉(zhuǎn)儲(chǔ)則指每次只轉(zhuǎn)儲(chǔ)上次轉(zhuǎn)儲(chǔ)后更新過(guò)的數(shù)據(jù)。如果數(shù)據(jù)庫(kù)很大,事務(wù)處理又十分頻繁,則增量轉(zhuǎn)儲(chǔ)方式是很有效的。(3)日志文件日志文件是用來(lái)記錄對(duì)數(shù)據(jù)庫(kù)每一次更新活動(dòng)的文件。在動(dòng)態(tài)轉(zhuǎn)儲(chǔ)方式中必須建立日志文件,后援副本和日志文件綜合起來(lái)才能有效地恢復(fù)數(shù)據(jù)庫(kù)。在靜態(tài)轉(zhuǎn)儲(chǔ)方式中,也可以建立日志文件。當(dāng)數(shù)據(jù)庫(kù)毀壞后可重新裝放后援副本把數(shù)據(jù)庫(kù)恢復(fù)到轉(zhuǎn)儲(chǔ)結(jié)束時(shí)刻的正確狀態(tài),然后利用日志文件,把已完成的事務(wù)進(jìn)行重做處理,對(duì)故障發(fā)生時(shí)尚未完成的事務(wù)進(jìn)行撤消處理。這樣不必重新運(yùn)行那些在轉(zhuǎn)儲(chǔ)前已完成的事務(wù)程序就可把數(shù)據(jù)庫(kù)恢復(fù)到故障前某一時(shí)刻的正確狀態(tài)。八、數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)的設(shè)計(jì)1.數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)的設(shè)計(jì)步驟按規(guī)范設(shè)計(jì)的方法可將數(shù)據(jù)庫(kù)設(shè)計(jì)分為以下六個(gè)階段(1)需求分析;(2)概念結(jié)構(gòu)設(shè)計(jì);(3)邏輯結(jié)構(gòu)設(shè)計(jì);(4)數(shù)據(jù)庫(kù)物理設(shè)計(jì);(5)數(shù)據(jù)庫(kù)實(shí)施;(6)數(shù)據(jù)庫(kù)運(yùn)行和維護(hù)。2.需求分析需求收集和分析是數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)設(shè)計(jì)的第一階段。明確地把它作為數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)設(shè)計(jì)的第一步是十分重要的。這一階段收集到的基礎(chǔ)數(shù)據(jù)和一組數(shù)據(jù)流圖(DataFlowDiaˉgram———DFD)是下一步設(shè)計(jì)概念結(jié)構(gòu)的基礎(chǔ)。概念結(jié)構(gòu)對(duì)整個(gè)數(shù)據(jù)庫(kù)設(shè)計(jì)具有深刻影響。而要設(shè)計(jì)好概念結(jié)構(gòu),就必須在需求分析階段用系統(tǒng)的觀點(diǎn)來(lái)考慮問(wèn)題、收集和分析數(shù)據(jù)及其處理。如何分析和表達(dá)用戶需求呢?在眾多的分析方法中,結(jié)構(gòu)化分析(StructuredAnalysis,簡(jiǎn)稱SA方法)是一個(gè)簡(jiǎn)單實(shí)用的方法。SA方法用自頂向下、逐層分解的方式分析系統(tǒng)。用數(shù)據(jù)流圖,數(shù)據(jù)字典描述系統(tǒng)。然后把一個(gè)處理功能的具體內(nèi)容分解為若干子功能,每個(gè)子功能繼續(xù)分解,直到把系統(tǒng)的工作過(guò)程表達(dá)清楚為止。在處理功能逐步分解的同時(shí),它們所用的數(shù)據(jù)也逐級(jí)分解。形成若干層次的數(shù)據(jù)流圖。數(shù)據(jù)流圖表達(dá)了數(shù)據(jù)和處理過(guò)程的關(guān)系。處理過(guò)程的處理邏輯常常用判定表或判定樹(shù)來(lái)描述。數(shù)據(jù)字典(DataDictionary,簡(jiǎn)稱DD)則是對(duì)系統(tǒng)中數(shù)據(jù)的詳盡描述,是各類數(shù)據(jù)屬性的清單。對(duì)數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)設(shè)計(jì)來(lái)講,數(shù)據(jù)字典是進(jìn)行詳細(xì)的數(shù)據(jù)收集和數(shù)據(jù)分析所獲得的主要結(jié)果。數(shù)據(jù)字典是各類數(shù)據(jù)描述的集合,它通常包括以下5個(gè)部分:(1)數(shù)據(jù)項(xiàng),是數(shù)據(jù)最小單位。(2)數(shù)據(jù)結(jié)構(gòu),是若干數(shù)據(jù)項(xiàng)有意義的集合。(3)數(shù)據(jù)流,可以是數(shù)據(jù)項(xiàng),也可以是數(shù)據(jù)結(jié)構(gòu)。表示某一處理過(guò)程的輸入輸出。(4)數(shù)據(jù)存儲(chǔ),處理過(guò)程中存取的數(shù)據(jù)。常常是手工憑證、手工文檔或計(jì)算機(jī)文件。(5)處理過(guò)程。3.概念結(jié)構(gòu)設(shè)計(jì)如同軟件工程中重視需求分析與規(guī)范說(shuō)明的思想一樣,數(shù)據(jù)庫(kù)設(shè)計(jì)中同樣十分重視數(shù)據(jù)分析、抽象與概念結(jié)構(gòu)的設(shè)計(jì)。概念結(jié)構(gòu)的設(shè)計(jì),是整個(gè)數(shù)據(jù)庫(kù)設(shè)計(jì)的關(guān)鍵之一。概念結(jié)構(gòu)獨(dú)立于數(shù)據(jù)庫(kù)邏輯結(jié)構(gòu),獨(dú)立于支持?jǐn)?shù)據(jù)庫(kù)的DBMS,也獨(dú)立于具體計(jì)算機(jī)軟件和硬件系統(tǒng)。歸納總結(jié),其主要特點(diǎn)是:(1)能充分地反映現(xiàn)實(shí)世界,包括實(shí)體和實(shí)體之間的聯(lián)系,能滿足用戶對(duì)數(shù)據(jù)處理的要求,是現(xiàn)實(shí)世界的一個(gè)真實(shí)的模型,或接近真實(shí)的模型。(2)易于理解,從而可以和不熟悉計(jì)算機(jī)的用戶交換意見(jiàn)。用戶的積極參與是數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)設(shè)計(jì)成功與否的關(guān)鍵。(3)易于更動(dòng)。當(dāng)現(xiàn)實(shí)世界改變時(shí)容易修改和擴(kuò)充,特別是軟件、硬件環(huán)境變化時(shí)更應(yīng)如此。(4)易于向關(guān)系、網(wǎng)狀或?qū)哟蔚雀鞣N數(shù)據(jù)模型轉(zhuǎn)換。概念結(jié)構(gòu)是各種數(shù)據(jù)模型的共同基礎(chǔ),它比任意一種數(shù)據(jù)模型更獨(dú)立于機(jī)器,更抽象,從而更加穩(wěn)定。描述概念結(jié)構(gòu)的有力工具是E-R模型。P.P.S.Chen把用E-R模型定義的概念結(jié)構(gòu)稱為組織模式。設(shè)計(jì)概念結(jié)構(gòu)的策略有3種:(1)自頂向下首先定義全局概念結(jié)構(gòu)的框架,然后逐步細(xì)化。(2)自底向上首先定義各局部應(yīng)用的概念結(jié)構(gòu),然后將它們集成,得到全局概念結(jié)構(gòu)。(3)混合策略自頂向下和自底向上相結(jié)合的方法。用自頂向下策略設(shè)計(jì)一個(gè)全局概念結(jié)構(gòu)的框架,以它為骨架集成由自底向上策略中設(shè)計(jì)的各局部概念結(jié)構(gòu)?,F(xiàn)介紹自底向上設(shè)計(jì)概念結(jié)構(gòu)的策略。按照這種策略,概念結(jié)構(gòu)的設(shè)計(jì)可按下面步驟進(jìn)行。(1)數(shù)據(jù)抽象與局部視圖設(shè)計(jì)E-R模型是對(duì)現(xiàn)實(shí)世界的一種抽象。一般地講,所謂抽象是對(duì)實(shí)際的人、物、事和概念的人為處理。它抽取人們關(guān)心的共同特性,忽略非本質(zhì)的細(xì)節(jié),并把這些特性用各種抽象的概念精確地加以描述。這些概念組成了現(xiàn)實(shí)世界的一種模型表示。有3種抽象方法形成了抽象機(jī)制,來(lái)對(duì)數(shù)據(jù)進(jìn)行組織:①分類(Classification)定義某一概念作為現(xiàn)實(shí)世界中一組對(duì)象的類型。這些對(duì)象具有某些共同的特性和行為。它抽象了對(duì)象值和型之間的“isamemberof”的語(yǔ)義。在E-R模型中,實(shí)體型就是這種抽象。②聚集(Aggregation)定義某一類型的組成成分。它抽象了對(duì)象內(nèi)部屬性類型和整體與部分之間“isapartof”的語(yǔ)義。在E-R模型中若干屬性的聚集組成了實(shí)體型,就是這種抽象。③概括(Generalization)定義類型之間的一種子集聯(lián)系。它抽象了類型之間的“isasubsetof”的語(yǔ)義。概括具有一個(gè)很重要的性質(zhì):繼承性。子類繼承超類上定義的所有抽象性質(zhì)。當(dāng)然,子類可以增加自己的某些特殊屬性。概念結(jié)構(gòu)設(shè)計(jì)的第一步就是利用上面介紹的抽象機(jī)制對(duì)需求分析階段收集到的數(shù)據(jù)進(jìn)行組織,形成實(shí)體、實(shí)體的屬性,標(biāo)識(shí)實(shí)體的碼,確定實(shí)體之間的聯(lián)系類型(1∶1,1∶n,n∶m),設(shè)計(jì)成部分E-R圖。(2)視圖的集成視圖集成就是把上一步得到的各個(gè)部分E-R圖綜合成一個(gè)總體的E-R圖。視圖集成可以有兩種方式:①多個(gè)部分E-R圖一次集成。②逐步集成。用累加的方式一次集成兩個(gè)部分E-R圖。無(wú)論哪種方式,每次集成可分兩步走。第一步是合并,解決各部分E-R圖之間的沖突問(wèn)題,生成初步E-R圖。第二步是修改和重構(gòu),消除不必要的冗余,生成基本E-R圖。4.邏輯結(jié)構(gòu)設(shè)計(jì)邏輯結(jié)構(gòu)設(shè)計(jì)的任務(wù)就是把概念結(jié)構(gòu)轉(zhuǎn)換為選用的DBMS所支持的數(shù)據(jù)模型的過(guò)程。設(shè)計(jì)邏輯結(jié)構(gòu)按理應(yīng)選擇對(duì)某個(gè)概念結(jié)構(gòu)最好的數(shù)據(jù)模型,然后對(duì)支持這種數(shù)據(jù)模型的各種DBMS進(jìn)行比較,選出最合適的DBMS。但實(shí)際情況常常是已給定了某臺(tái)機(jī)器,設(shè)計(jì)人員沒(méi)有選擇DBMS的余地?,F(xiàn)行的DBMS一般只支持關(guān)系、網(wǎng)狀或?qū)哟稳N模型中的某一種,對(duì)某一種數(shù)據(jù)模型,各個(gè)機(jī)器系統(tǒng)又有許多不同的限制,提供不同的環(huán)境與工具。因而我們把設(shè)計(jì)過(guò)程分三步進(jìn)行。首先把概念結(jié)構(gòu)向一般的關(guān)系模型轉(zhuǎn)換,然后向特定的DBMS支持下的數(shù)據(jù)模型轉(zhuǎn)換,最后進(jìn)行模型的優(yōu)化。(1)E-R圖向關(guān)系數(shù)據(jù)模型的轉(zhuǎn)換下面給出把E-R圖轉(zhuǎn)換為關(guān)系模型的轉(zhuǎn)換規(guī)則。①一個(gè)實(shí)體轉(zhuǎn)換為一個(gè)關(guān)系模式。實(shí)體的屬性就是關(guān)系的屬性,實(shí)體的碼就是關(guān)系的碼。②一個(gè)聯(lián)系轉(zhuǎn)換為一個(gè)關(guān)系模式,與該聯(lián)系相連的各實(shí)體的碼以及聯(lián)系的屬性轉(zhuǎn)換為關(guān)系的屬性。該關(guān)系的碼則有三種情況:若聯(lián)系為1∶1,則每個(gè)實(shí)體的碼均是該關(guān)系的候選碼。若聯(lián)系為1∶n,關(guān)系的碼為n端實(shí)體的碼。若聯(lián)系為n∶m,則關(guān)系的碼為諸實(shí)體碼的組合。具有相同碼的關(guān)系模式可合并。形成了一般的數(shù)據(jù)模型后,下一步就向特定的DBMS規(guī)定的模型轉(zhuǎn)換。設(shè)計(jì)人員必須熟知所用DBMS的功能及限制。這一步轉(zhuǎn)換是依賴于機(jī)器的,不能給出一個(gè)普遍的規(guī)則。轉(zhuǎn)化后的模型必須進(jìn)行優(yōu)化。對(duì)數(shù)據(jù)模型進(jìn)行優(yōu)化是指調(diào)整數(shù)據(jù)模型的結(jié)構(gòu),以提高數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)的性能。性能有動(dòng)態(tài)性能和靜態(tài)性能兩種。靜態(tài)性能分析容易實(shí)現(xiàn)。根據(jù)應(yīng)用要求,選出合適的模型是一項(xiàng)復(fù)雜的工作。(2)規(guī)范化理論的應(yīng)用規(guī)范化理論是數(shù)據(jù)庫(kù)邏輯設(shè)計(jì)的指南和工具,具體地講可應(yīng)用在下面幾個(gè)具體的方面:第一,在數(shù)據(jù)分析階段用數(shù)據(jù)依賴的概念分析和表示各數(shù)據(jù)項(xiàng)之間的關(guān)系。第二,在設(shè)計(jì)概念結(jié)構(gòu)階段,用規(guī)范化理論為工具消除初步E-R圖中冗余的聯(lián)系。第三,由E-R圖向數(shù)據(jù)模型轉(zhuǎn)換過(guò)程中用模式分解的概念和算法指導(dǎo)設(shè)計(jì)?,F(xiàn)在,不管選用的DBMS是支持哪種數(shù)據(jù)模型的,均先把概念結(jié)構(gòu)向關(guān)系模型轉(zhuǎn)換。然后,充分運(yùn)用規(guī)范化理論的成果優(yōu)化關(guān)系數(shù)據(jù)庫(kù)模式的設(shè)計(jì)。5.數(shù)據(jù)庫(kù)的物理設(shè)計(jì)物理設(shè)計(jì)的內(nèi)容主要包括:(1)確定數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)從DBMS所提供的存儲(chǔ)結(jié)構(gòu)中選取一種合適的加以實(shí)現(xiàn)。確定存儲(chǔ)結(jié)構(gòu)的主要因素是存取時(shí)間、存儲(chǔ)空間利用率和維護(hù)代價(jià)三個(gè)方面。設(shè)計(jì)者常常要對(duì)這些因素進(jìn)行權(quán)衡。一般的DBMS也總是具有一定靈活性供你選擇。例如,若引入某些冗余數(shù)據(jù),則可能減少物理I/O次數(shù)提高檢索效率。相反節(jié)約存儲(chǔ)空間檢索代價(jià)就會(huì)增加。當(dāng)然應(yīng)該盡量尋找優(yōu)化方法,使這三方面的性能都較好。折衷有時(shí)是必須的。(2)存取路徑的選擇和調(diào)整數(shù)據(jù)庫(kù)必須支持多個(gè)用戶的多種應(yīng)用,因而必須提供對(duì)數(shù)據(jù)庫(kù)的多個(gè)存取入口,也就是對(duì)同一數(shù)據(jù)存儲(chǔ)要提供多條存取路徑。物理設(shè)計(jì)的任務(wù)應(yīng)確定建立哪些存取路徑。設(shè)計(jì)者應(yīng)該進(jìn)行定量的分析,根據(jù)計(jì)算結(jié)果確定存取路徑。(3)確定數(shù)據(jù)存放位置首先按數(shù)據(jù)的應(yīng)用情況劃分為不同的組,然后確定存放位置。一般的應(yīng)把數(shù)據(jù)的易變部分和穩(wěn)定部分分開(kāi),把經(jīng)常存取和不常存取的數(shù)據(jù)分開(kāi)。經(jīng)常存取或存取時(shí)間要求高的記錄應(yīng)存放在高速存儲(chǔ)器上,如硬盤(pán)。存取頻率小或存取時(shí)間要求低的放在低速存儲(chǔ)器上,如軟盤(pán)磁帶。對(duì)于同一數(shù)據(jù)文件也可根據(jù)情況進(jìn)行水平劃分或垂直劃分。(4)確定存儲(chǔ)分配許多DBMS提供了存儲(chǔ)分配的參數(shù)供設(shè)計(jì)者物理優(yōu)化處理用。例如溢出空間的大小和分布參數(shù),塊的長(zhǎng)度,塊因子的大小,裝填因子,緩沖區(qū)的大小和個(gè)數(shù)等等,它們都要在物理設(shè)計(jì)中確定。這些參數(shù)的大小影響存取時(shí)間和存儲(chǔ)空間的分配。物理設(shè)計(jì)過(guò)程需要對(duì)時(shí)間、空間效率、維護(hù)代價(jià)和各種用戶要求進(jìn)行權(quán)衡,其結(jié)果可以產(chǎn)生多種方案。在實(shí)施數(shù)據(jù)庫(kù)前對(duì)這些方案進(jìn)行方案進(jìn)行細(xì)致的評(píng)價(jià),以選擇一個(gè)較優(yōu)的方案是十分必要的。6.數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)的實(shí)施和維護(hù)對(duì)數(shù)據(jù)庫(kù)的物理設(shè)計(jì)初步評(píng)價(jià)完成后就可建立數(shù)據(jù)庫(kù)了。數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)實(shí)施對(duì)應(yīng)于軟件工程的編碼、調(diào)試階段。設(shè)計(jì)人員運(yùn)用DBMS提供的數(shù)據(jù)定義語(yǔ)言將邏輯設(shè)計(jì)和物理設(shè)計(jì)的結(jié)果嚴(yán)格地描述出來(lái),成為DBMS可接受的源代碼。經(jīng)過(guò)調(diào)試產(chǎn)生目標(biāo)模式。然后組織數(shù)據(jù)入庫(kù)。組織數(shù)據(jù)入庫(kù)是數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)實(shí)施階段最主要的工作。(1)數(shù)據(jù)庫(kù)數(shù)據(jù)的載入和應(yīng)用程序的開(kāi)發(fā)由于數(shù)據(jù)庫(kù)數(shù)據(jù)量一般都非常大,并且這些數(shù)據(jù)來(lái)源于一個(gè)組織的各個(gè)部門(mén),分散在各種數(shù)據(jù)文件或原始憑證中。這些數(shù)據(jù)的結(jié)構(gòu)和格式一般也不符合數(shù)據(jù)庫(kù)的要求,還要進(jìn)行轉(zhuǎn)換。因此組織數(shù)據(jù)入庫(kù)是一件耗費(fèi)大量人力物力的工作。數(shù)據(jù)的轉(zhuǎn)換和組織對(duì)于小系統(tǒng)可以用人工方法完成。但是,人工轉(zhuǎn)換效率低、質(zhì)量差。一般來(lái)說(shuō),應(yīng)設(shè)計(jì)一個(gè)數(shù)據(jù)輸入子系統(tǒng)讓計(jì)算機(jī)完成這個(gè)工作。輸入子系統(tǒng)的主要功能是:原始數(shù)據(jù)的輸入、抽取、校驗(yàn)、分類、轉(zhuǎn)換和綜合,最終把數(shù)據(jù)組織成符合數(shù)據(jù)庫(kù)結(jié)構(gòu)的形式。然后把數(shù)據(jù)存入數(shù)據(jù)庫(kù)中。數(shù)據(jù)的轉(zhuǎn)換、分類和綜合常常要經(jīng)過(guò)多次才能完成,因而輸入子系統(tǒng)的設(shè)計(jì)和實(shí)施亦是比較復(fù)雜的,要編寫(xiě)許多應(yīng)用程序。輸入子系統(tǒng)的設(shè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論