自考《數(shù)據(jù)庫系統(tǒng)原理》串講筆記_第1頁
自考《數(shù)據(jù)庫系統(tǒng)原理》串講筆記_第2頁
自考《數(shù)據(jù)庫系統(tǒng)原理》串講筆記_第3頁
自考《數(shù)據(jù)庫系統(tǒng)原理》串講筆記_第4頁
自考《數(shù)據(jù)庫系統(tǒng)原理》串講筆記_第5頁
已閱讀5頁,還剩41頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、自考數(shù)據(jù)庫系統(tǒng)原理串講筆記第一章數(shù)據(jù)庫基礎知識學習目的與要求:本章屬于基礎知識,主要是對一些概念的理解和記憶。沒有難點,相對的重點是數(shù)據(jù)模型的四個層次,數(shù)據(jù)庫管理系統(tǒng)的功能,數(shù)據(jù)庫系統(tǒng)的全局結構。考核知識點與考核要求1.1數(shù)據(jù)管理技術的發(fā)展階段(識記)1.2數(shù)據(jù)描述的術語(領會)1.3數(shù)據(jù)抽象的級別(領會)1.4數(shù)據(jù)庫管理系統(tǒng)(DBMS) (領會)1.5數(shù)據(jù)庫系統(tǒng)(DBS)(領會)1.1數(shù)據(jù)管理技術的發(fā)展幾個數(shù)據(jù)庫的基本術語:數(shù)據(jù): 描述事物的符號記錄數(shù)據(jù)處理:是指從某些已知的數(shù)據(jù)出發(fā),推導加工出一些新的數(shù)據(jù),這些新的數(shù)據(jù)又表示了新的信息。 數(shù)據(jù)管理:是指數(shù)據(jù)的收集、整理、組織、存儲、維護、檢

2、索、傳送等操作,這部分操作是數(shù)據(jù)處理業(yè)務的基本環(huán)節(jié),而且是任何數(shù)據(jù)處理業(yè)務中必不可少的共有部分。 數(shù)據(jù)管理技術:對數(shù)據(jù)的收集、整理、組織、存儲、維護、檢索、傳送等操作,基本目的就是從大量的,雜亂無章的,難以理解的數(shù)據(jù)中篩選出有意義的數(shù)據(jù)。數(shù)據(jù)處理是與數(shù)據(jù)管理相聯(lián)系的,數(shù)據(jù)管理技術的優(yōu)劣,將直接影響數(shù)據(jù)處理的效率。1.人工管理階段(20世紀50年代中期以前)數(shù)據(jù)不保存在機器中;)沒有專用軟件對數(shù)據(jù)進行管理;)只有程序的概念,沒有文件的概念;)數(shù)據(jù)面向程序。2. 文件系統(tǒng)階段特點與缺陷(20世紀50年代后期至60年代中期)數(shù)據(jù)可長期保存在磁盤上; )數(shù)據(jù)的邏輯結構與物理結構有了區(qū)別;)文件組織呈現(xiàn)

3、多樣化;)數(shù)據(jù)不再屬于某個特定程序,可以重復使用;)對數(shù)據(jù)的操作以記錄為單位。文件系統(tǒng)三個缺陷:)數(shù)據(jù)冗余性)數(shù)據(jù)不一致性)數(shù)據(jù)聯(lián)系弱3.數(shù)據(jù)庫階段(20世紀60年代后至今)數(shù)據(jù)管理技術進入數(shù)據(jù)庫階段的標志是20世紀60年代末三件大事:)1968年美國IBM公司推出層次模型的IMS系統(tǒng);)1969年美國CODASYL組織發(fā)布了DBTG報告??偨Y了當時各式各樣的數(shù)據(jù)庫,提出網(wǎng)狀模型,爾后于1971年4月正式通過。)1970年美國IBM公司的E.F.Codd連續(xù)發(fā)表論文,提出關系模型,奠定了關系數(shù)據(jù)庫的理論基礎。數(shù)據(jù)庫管理階段特點:1)采用數(shù)據(jù)模型表示復雜的數(shù)據(jù)結構;2)有較高的數(shù)據(jù)獨立性;3)數(shù)

4、據(jù)庫系統(tǒng)為用戶提供了方便的用戶接口。4)數(shù)據(jù)庫系統(tǒng)提供以下四個方面的數(shù)據(jù)控制功能: 數(shù)據(jù)庫的恢復; 數(shù)據(jù)庫的并發(fā)控制; 數(shù)據(jù)庫的完整性; 數(shù)據(jù)庫的安全性;5)增加了系統(tǒng)的靈活性。增加了系統(tǒng)的靈活性對數(shù)據(jù)的操作不一定以記錄為單位,可以以數(shù)據(jù)項為單位。數(shù)據(jù)庫技術中的四個名詞:DB、DBMS、DBS、數(shù)據(jù)庫技術。其概念是不同的,要分清。DB:數(shù)據(jù)庫(Database)長期存儲在計算機內、有組織的、統(tǒng)一管理的相關數(shù)據(jù)的集合。DBMS:數(shù)據(jù)庫管理系統(tǒng)(Database Management System),DBMS是位于用戶與操作系統(tǒng)之間的一層數(shù)據(jù)管理軟件,為用戶或應用程序提供訪問DB的方法,包括DB的

5、建立、查詢、更新及各種數(shù)據(jù)控制。DBMS總是基于某種數(shù)據(jù)模型,可以分為層次型、網(wǎng)狀型、關系型、面向對象型DBMS。DBS:數(shù)據(jù)庫系統(tǒng)(Database System),DBS是實現(xiàn)有組織地、動態(tài)地存儲大量關聯(lián)數(shù)據(jù),方便多用戶訪問的計算機軟件、硬件和數(shù)據(jù)資源組成的系統(tǒng),即采用了數(shù)據(jù)庫技術的計算機系統(tǒng)。數(shù)據(jù)庫技術:是一門研究數(shù)據(jù)庫結構、存儲、管理和使用的一門軟件學科。4.高級數(shù)據(jù)庫階段:)面向對象的概念建模)開放數(shù)據(jù)庫互連技術1.2數(shù)據(jù)描述在數(shù)據(jù)處理中,數(shù)據(jù)描述將涉及不同的范疇。從事物的特性到計算機中的具體表示,數(shù)據(jù)描述經(jīng)歷了三個階段概念設計、邏輯設計和物理設計。1.概念設計中的的數(shù)據(jù)描述)實體)

6、實體集)屬性)實體標識符2.邏輯設計中的數(shù)據(jù)描述)字段)記錄)文件)關鍵碼3.物理設計中的數(shù)據(jù)描述物理存儲介質層次)高速緩沖存儲器)主存儲器)快擦寫存儲器)磁盤存儲器)光盤存儲器)磁帶物理存儲中的數(shù)據(jù)描述位、字節(jié)、字、塊、桶和卷4.數(shù)據(jù)聯(lián)系的描述聯(lián)系及元數(shù)定義:二元聯(lián)系有以下三種類型:1:1聯(lián)系 :如果實體集E1中的每個實體最多只能和實體集E2中的一個實體有聯(lián)系,反之亦然,好么實體集E1對E2的聯(lián)系稱為“一對一聯(lián)系”,記為“1:1”。1:N聯(lián)系 :如果實體集E1中每個實體與實體集E2中任意個(零個或多個)實體有聯(lián)系,而E2中每個實體至多和E1中的一個實體有聯(lián)系,那么E1對E2的聯(lián)系是“一對多聯(lián)

7、系”,記為“1:N”。M:N聯(lián)系 :如果實體集E1中每個實體與實體集E2中任意個(零個或多個)實體有聯(lián)系,反之亦然,那么E1對E2的聯(lián)系是“多對多聯(lián)系”,記為“M:N”。1.3數(shù)據(jù)抽象的級別1.數(shù)據(jù)抽象的過程根據(jù)抽象的級別定義了四種模型:)概念數(shù)據(jù)模型)邏輯數(shù)據(jù)模型)外部數(shù)據(jù)模型)內部數(shù)據(jù)模型2.概念模型)四種模型中,概念模型的抽象級別最高。)概念模型的特點:(p12)3.邏輯模型邏輯模型的特點:(p13)(1)(4)邏輯模型的分類:)層次模型)網(wǎng)狀模型)關系模型三種邏輯數(shù)據(jù)模型的比較?如P17圖4.外部模型外部模型的特點:(p17)從整個系統(tǒng)考察,外部模型的優(yōu)點。5.內部模型是數(shù)據(jù)庫最底的抽

8、象,它描述數(shù)據(jù)在磁盤或磁帶上的存儲方式、存取設備和存取方法。6.三層模式和兩級映象三層模式體系結構)外模式:是用戶與數(shù)據(jù)庫系統(tǒng)的接口,是用戶用到的那部分數(shù)據(jù)的描述。)邏輯模式:是數(shù)據(jù)庫中全部數(shù)據(jù)的整體邏輯結構的描述。)內模式:是數(shù)據(jù)庫在物理存儲方面的描述,定義所有內部記錄類型、索引和文件的組織方式,以及數(shù)據(jù)控制方面的細節(jié)。兩級映象外模式/邏輯模式映象:用于定義概念模式和內模式之間的對應性。一般在內模式中描述。 邏輯模式/內模式映象:用于定義外模式和概念模式間的對應性。一般在外模式中描述。 7.高度的數(shù)據(jù)獨立性什么叫數(shù)據(jù)獨立性? 是指應用程序和數(shù)據(jù)庫的數(shù)據(jù)結構之間相互獨立,不受影響。在修改數(shù)據(jù)結

9、構時,盡可能不修改應用程序,則稱系統(tǒng)達到了數(shù)據(jù)獨立性目標。數(shù)據(jù)獨立性分為物理數(shù)據(jù)獨立性和邏輯數(shù)據(jù)獨立性:物理數(shù)據(jù)獨立性:修改內模式時盡量不影響概念模式及外模式,則達到物理數(shù)據(jù)獨立性。邏輯數(shù)據(jù)獨立性:修改概念模式時盡量不影響外模式和應用程序。1.4數(shù)據(jù)庫管理系統(tǒng)(DBMS)1.DBMS的目標與任務:數(shù)據(jù)庫管理系統(tǒng)的主要任務是完成用戶對數(shù)據(jù)庫的存取請求,即檢索、插入、更新或刪除等操作。DBMS的目標:用戶界面友好、功能完善、結構清晰、高效率、開放性 2.DBMS的工作模式(p20圖)3.DBMS的主要功能:)數(shù)據(jù)庫的定義功能)數(shù)據(jù)庫的操縱功能)數(shù)據(jù)庫的保護功能(數(shù)據(jù)庫恢復、數(shù)據(jù)庫并發(fā)控制、數(shù)據(jù)庫完

10、整性和數(shù)據(jù)庫安全性)數(shù)據(jù)庫的維護功能)數(shù)據(jù)字典1.5數(shù)據(jù)庫系統(tǒng)(DBS)1.DBS由四部分組成:數(shù)據(jù)庫、硬件、軟件、數(shù)據(jù)庫管理員。2.數(shù)據(jù)庫管理員定義及職責。(素質+職責)3.DBS的全局結構及DBS的效益。(數(shù)據(jù)庫用戶+界面+DBMS+磁盤+DBS的效益)第二章數(shù)據(jù)庫設計和ER模型學習目的與要求:本章總的目的要求是了解和掌握數(shù)據(jù)庫應用系統(tǒng)設計的全過程。首先掌握ER模型和關系模型的基本概念,然后掌握概念設計中ER模型的設計方法,邏輯設計中ER模型向關系模型轉換方法??己酥R點與考核要求2.1數(shù)據(jù)庫系統(tǒng)生存期(領會)2.2ER模型的基本概念(綜合應用)2.3關系模型的基本概念(綜合應用)2.4E

11、R模型到關系模型的轉換規(guī)則(綜合應用)2.5ER模型實例分析(簡單應用)2.6增強ER模型(簡單應用)從軟件生存期談起軟件生存期:是指從軟件的規(guī)劃、研制、實現(xiàn)、投入運行后的維護、直到它被新的軟件所取代而停止使用的整個期間。它包括六個階段:( 規(guī)需設編試運維 ) (1)規(guī)劃階段 (2)需求分析階段 (3)設計階段 (4)程序編制階段 (5)調試階段 (6)運行維護階段 2.1數(shù)據(jù)系統(tǒng)生存期1.什么叫數(shù)據(jù)庫系統(tǒng)生存期?我們把數(shù)據(jù)庫應用系統(tǒng)從開始規(guī)劃、設計、實現(xiàn)、維護到最后被新的系統(tǒng)取代而停止使用的整個期間,稱為數(shù)據(jù)庫系統(tǒng)生存期。2.這個生存期一般可劃分成以下七個階段:規(guī)劃、需求分析、概念設計、邏輯

12、設計、物理設計、實現(xiàn)、運行維護。.2ER模型的基本概念1.ER模型的基本元素實體、聯(lián)系和屬性2.屬性的分類(簡單屬性和復合屬性、單值屬性和多值屬性、存儲屬性和派生屬性)3.聯(lián)系的設計4.ER模型的操作(分裂、合并和增刪)5.采用ER模型的數(shù)據(jù)庫概念設計步驟采用ER方法進行數(shù)據(jù)庫概念設計分成三步進行: 首先設計局部ER模式 然后把各局部ER模式綜合成全局ER模式 最后對全局ER模式進行優(yōu)化 2.3關系模型的基本概念.關系模型定義:用二維表格結構表示實體集、外鍵表示實體間聯(lián)系的數(shù)據(jù)模型稱為關系模型。2.基本術語有:字段(屬性)、字段值(屬性值)、記錄(元組)、二維表格(元組集合、關系或實例)。在這

13、里,括號中的表述為關系模型中的術語。它與表格中術語可以一一對應。還有,關系中屬性個數(shù)稱為元數(shù),元組個數(shù)為基數(shù)。3.鍵:由一個或幾個屬性組成。(注意鍵不一定是唯一的一個屬性)。1)超鍵:在關系中能唯一標識元組的屬性集稱為關系模式的超鍵。(注意,超鍵也是一個屬性集,不一定只是一個屬性)2)候選鍵:不含有多余屬性的超鍵稱為候選鍵。3)主鍵:用戶選作元組標識的一個候選鍵為主鍵。4)外鍵:某個關系的主鍵相應的屬性在另一關系中出現(xiàn),此時該主鍵在就是另一關系的外鍵,如有兩個關系S和SC,其中S#是關系S的主鍵,相應的屬性S#在關系SC中也出現(xiàn),此時S#就是關系SC的外鍵。.關系的定義和性質)關系定義:關系是

14、一個屬性數(shù)目相同的元組的集合。)關系性質(p53)5.三類完整性規(guī)則)實體完整性規(guī)則:要求關系中組成主鍵的屬性上不能有空值。 )參照完整性規(guī)則:要求不引用不存在的實體。 )用戶定義完整性規(guī)則:由具體應用環(huán)境決定,系統(tǒng)提供定義和檢驗這類完整性的機制。 2.4E-R模型向關系模型的轉換E-R模型可以向現(xiàn)有的各種數(shù)據(jù)庫模型轉換,對不同的數(shù)據(jù)庫模型有不同的轉換規(guī)則。這里只討論E-R模型向關系模型的轉換方法。1.E-R模型向關系模型的轉換規(guī)則:(1)實體類型的轉換將每個實體類型轉換成一個關系模式,實體的屬性即為關系的屬性,實體標識符即為關系的鍵。(2)聯(lián)系類型的轉換1)實體間的聯(lián)系是1:1可以在兩個實體

15、類型轉換成兩個關系模式中的任意一個關系模式的屬性中加入另一個關系模式的鍵和聯(lián)系類型的屬性。2)如實體間的聯(lián)系是1:N則在N端實體類型轉換成的關系模式中加入1端實體類型轉換成的關系模式的鍵和聯(lián)系類型的屬性。3)如實體間的聯(lián)系是M:N則將聯(lián)系類型也轉換成關系模式,其屬性為兩端實體類型的鍵加上聯(lián)系類型的屬性,而鍵為兩端實體鍵的組合。以上各轉換規(guī)則,給出了一般情況下E-R模型向關系模型的轉換方法。但在實際應用中往往還需要根具實際情況進行具體處理。下面以圖書借閱系統(tǒng)的E-R模型轉換為關系模型為例。該例中,由于允許同一本書在不同的時間借給多個讀者,特別是一個讀者在不同的時間可以借同一本書。因而,在多對多聯(lián)

16、系“借閱”轉換為關系模式時,僅有讀者的編號和圖書的編號是不能構成碼的。例如:(0406010,F(xiàn)33.33,2006-10-10:10:10,2007-02-20:3:00)(0406010,F33.33,2007-5-26:4:00,NULL)說明,按照上述介紹的轉換方法得到的關系模型不一定是最好的。實際應用中,往往還要對得到的關系模型進行規(guī)范化。2.5和2.6實例分析,同學們多看書!1.庫存管理系統(tǒng)的ER模型及轉換2.人事管理信息系統(tǒng)的ER模型3.住院管理信息系統(tǒng)的ER模型4.公司車隊信息系統(tǒng)的ER模型更多優(yōu)質自考資料盡在百度貼吧自考樂園俱樂部(第三章關系模式設計理論學習目的與要求:本章特

17、點是理論性較強,學習者應從概念著手,搞清概念間的聯(lián)系和作用。本章總的要求是:了解關系數(shù)據(jù)庫規(guī)范化理論及其在數(shù)據(jù)庫設計中的作用。本章的重點是函數(shù)依賴、無損分解、保持依賴和范式。掌握這些概念并能運用它們分析模式分解的特點??己酥R點與考核要求3.1關系模式的設計準則(簡單應用)3.2函數(shù)依賴(FD)(簡單應用)3.3關系模式的分解特性(簡單應用)3.4范式1NF、2NF、3NF(簡單應用)BCNF(領會) 分解成BCNF模式集的“分解算法”(識記)分解成3NF模式集的“合成算法”(綜合應用)模式設計方法小結(領會)3.5多值依賴和第四范式(識記)3.1關系模式的設計準則1.關系模式的冗余和異常問題

18、)數(shù)據(jù)冗余)操作異常(修改異常、插入異常和刪除異常) 2.關系模式的非形式化設計準則)關系模式的設計應盡可能只包含有直接聯(lián)系的屬性,不包括有間接聯(lián)系的屬性)關系模式的設計應盡可能使得相應關系中不出現(xiàn)插入、刪除和修改異常。)關系模式的設計應盡可能使得相應關系中避免放置經(jīng)常為空值的屬性。)關系模式的設計應盡可能使得關系的等值連接在主鍵和外鍵的屬性上進行,并且保證連接以后不會生成額外的元組。3.2函數(shù)依賴1.函數(shù)依賴的定義設有關系模式R(A1,A2,.An)或簡記為R(U),X,Y是U的子集,r是R的任一具體關系,如果對r的任意兩個元組t1,t2,由t1X=t2X導致t1Y=t2Y,則稱X函數(shù)決定Y

19、,或Y函數(shù)依賴于X,記為XY。XY為模式R的一個函數(shù)依賴。這個定義可以這樣理解:有一張設計好的二維表,X,Y是表的某些列(可以是一列,也可以是多列),若在表中的第t1行,和第t2行上的X值相等,那么必有t1行和t2行上的Y值也相等,這就是說Y函數(shù)依賴于X。2.函數(shù)依賴的邏輯蘊涵設F是關系模式R的一個函數(shù)依賴集,X,Y是R的屬性子集,如果從F中的函數(shù)依賴能夠推出XY,則稱F邏輯蘊涵XY,記為F|=XY。而函數(shù)依賴的閉包F + 是指被F邏輯蘊涵的函數(shù)依賴的全體構成的集合。3.鍵和FD的關系鍵是唯一標識實體的屬性集。對于鍵和函數(shù)依賴的關系:有兩個條件:設關系模式R(A1,A2.An),F(xiàn)是R上的函數(shù)

20、依賴集,X是R的一個子集:1aXA1A2.AnF +(它的意思是X能夠決定唯一的一個元組)2a不存在X的真子集Y,使得Y也能決定唯一的一個元組,則X就是R的一個候選鍵。(它的意思是X能決定唯一的一個元組但又沒有多余的屬性集)包含在任何一個候選鍵中的屬性稱為主屬性,不包含在任何鍵中的屬性為非主屬性(非鍵屬性),(注意) 主屬性應當包含在候選鍵中。4.函數(shù)依賴(FD)的推理規(guī)則前面我們舉的例子中是以實際經(jīng)驗來確定一個函數(shù)依賴的邏輯蘊涵,但是我們需要一個推理規(guī)則才能完全確定F或F+的所有函數(shù)依賴。設有關系模式R(U),X,Y,Z,W均是U的子集,F(xiàn)是R上只涉及到U中屬性的函數(shù)依賴集,推理規(guī)則如下:A

21、1a自反性:如果Y X U,則XY在R上成立。A2a增廣性:如果XY為F所蘊涵,Z U,則XZYZ在R上成立。(XZ表示XZ,下同)A3a傳遞性:如果XY和YZ在R上成立,則XZ在R上成立。A4a合并性:如果XY和XZ成立,那么XYZ成立。A6a分解性:如果XY和Z Y成立,那么XZ成立。A5a偽傳性:如果XY和WYZ成立,那么WXZ成立。A7a復合性:XY, WZ |=XW YZ。A8a通用一致性定理:XY, WZ |=x (X-Y) YZ。5.函數(shù)依賴推理規(guī)則的完備性函數(shù)依賴推理規(guī)則系統(tǒng)(自反性、增廣性和傳遞性)是完備的。由推理規(guī)則的完備性可得到兩個重要結論:1a屬性集X + 中的每個屬性

22、A,都有XA被F邏輯蘊涵,即X + 是所有由F邏輯蘊含XA的屬性A的集合。 2aF+ 是所有利用Amstrong推理規(guī)則從F導出的函數(shù)依賴的集合。6.函數(shù)依賴集的等價和覆蓋在關系模式R(U)上的兩個函數(shù)依賴集F和G,如果 滿足F + =G + ,則稱F和G是 等價 的,稱F和G等價也稱F 覆蓋 G或G覆蓋F。每個函數(shù)依賴集F都可以被一個 右部只有單屬性的函數(shù)依賴集 G所覆蓋。如果函數(shù)依賴集合F滿足:(1)F中每一個函數(shù)依賴的右部都是單屬性;(2)F中的任一函數(shù)依賴XA,其F-XA是不等價的;(3)F中的任一函數(shù)依賴XA,Z為X的子集。(F-XA)ZA與F不等價。則稱F為最小函數(shù)依賴集合。如果函

23、數(shù)依賴集F和G等價,并且G是最小集,那么稱G是F的一個 最小覆蓋 。這一段并不要求掌握最小集的求法,但是應當通過其求法理解最小集的概念。3.3關系模式分解特性1.模式分解中存在的問題模式分解就是將一個泛關系模式 R分解成 數(shù)據(jù)庫模式 ,以代替R的過程。它不僅僅是屬性集合的分解,它是對關系模式上的函數(shù)依賴集、以及關系模式的當前值分解的具體表現(xiàn)。分解一個模式有很多方法,但是有的分解會出現(xiàn)失去函數(shù)依賴、或出現(xiàn)插入、刪除異常等情況,而有的分解則不出現(xiàn)相關問題。衡量一個分解的標準有三種:分解具有無損聯(lián)接 ;分解要保持函數(shù)依賴;分解既要保持依賴,又要具有無損聯(lián)接。那么什么是無損聯(lián)接呢?什么又是保持依賴?

24、2.無損聯(lián)接的定義和性質設R是一關系模式,分解成=R1,R2,.,Rk,F(xiàn)是R上的一個函數(shù)依賴集。無損聯(lián)接就是指R中每一個滿足F的關系r(也就是一個關系實例)都有r= R1 (r)|X| R2 (r).|X| R3 (r),即r為它在Ri上的投影的自然聯(lián)接。最簡單的理解,也就是說,分解后的關系 自然連接后完全等于 分解前的關系,則這個分解相對于F是無損聯(lián)接分解。 設R的分解為=R1,R2,F為R所滿足的函數(shù)依賴集,則分解具有無損聯(lián)接性的充分必要條件是:R1R2(R1-R2) R1R2(R2-R1) 也就是說,分解后的兩個模式的交能決定這兩個模式的差集,即R1、R2的公共屬性能夠函數(shù)決定R1或R

25、2中的其他屬性,這樣的分解就必定是無損聯(lián)接分解。3.保持函數(shù)依賴的分解在分解過程中,要求模式分解的無損聯(lián)接是必要的,只有無損聯(lián)接分解才能保證任何一個關系能由它的那些投影進行自然聯(lián)接得到恢復。 同時,分解關系模式時還應保證關系模式的函數(shù)依賴集在分解后仍在數(shù)據(jù)庫模式中保持不變,這就是保持函數(shù)依賴的問題。也就是所有分解出的模式所滿足的函數(shù)依賴的全體應當?shù)葍r于原模式的函數(shù)依賴集。只有這樣才能確保整個數(shù)據(jù)庫中數(shù)據(jù)的語義完整性不受破壞。 3.4范式1.1NF、2NF、3NF、BCNF的定義: 1NF:第一范式即關系模式中的屬性的值域中每一個值都是不可再分解的值。如果某個數(shù)據(jù)庫模式都是第一范式的,則稱該數(shù)據(jù)

26、庫模式是屬于第一范式的數(shù)據(jù)庫模式。 2NF:第二范式如果關系模式R為第一范式,并且R中每一個非主屬性完全函數(shù)依賴于R的某個候選鍵,則稱為第二范式模式。非主屬性、完全函數(shù)依賴、候選鍵三個名詞的含義。候選鍵就是指可以唯一決定關系模式R中某元組值且不含有多余屬性的屬性集。非主屬性也就是非鍵屬性,指關系模式R中不包含在任何建中的屬性。設有函數(shù)依賴WA,若存在XW,有XA成立,那么稱WA是局部依賴,否則就稱WA是 完全函數(shù)依賴 。 在分析是否為第2范式時,應首先確定候選鍵,然后把關系模式中的非主屬性與鍵的依賴關系進行考察,是否都為完全函數(shù)依賴,如是,則此關系模式為2NF。如果數(shù)據(jù)庫模式中每個關系模式都是

27、2NF的,則此數(shù)據(jù)庫模式屬于2NF的數(shù)據(jù)庫模式。 3NF:第三范式如果關系模式R是第二范式,且每個非主屬性都不傳遞依賴于R的候選鍵,則稱R為第三范式的模式。這里首先要了解傳遞依賴的含義:在關系模式中,如果YX,XA,且X不決定Y和A不屬于X,那么YA是傳遞依賴。注意的是,這里要求非主屬性都不傳遞依賴于候選鍵。BCNF:這個范式和第三范式有聯(lián)系,它是3NF的改進形式。若關系模式R是第一范式,且每個屬性都不傳遞依賴于R的候選鍵。這種關系模式就是BCNF模式。 縱觀四種范式,可以發(fā)現(xiàn)它們之間存在如下關系: 5.分解成BCNF模式集的算法對于任一關系模式,可找到一個分解達到3NF,且具有無損聯(lián)接和保持

28、函數(shù)依賴性。而對于BCNF分解,則可以保證無損聯(lián)接但不一定能保證保持函數(shù)依賴集。 無損聯(lián)接分解成BCNF模式集的算法: (1)置初值=R; (2)如果中所有關系模式都是BCNF,則轉(4); (3)如果中有一個關系模式S不是BCNF,則S中必能找到一個函數(shù)依賴集XA有X不是S的鍵,且A不屬于X,設S1 =XA,S2 =S-A,用分解S1 ,S2 代替S,轉(2); (4)分解結束。輸出。 在這個過程中,重點在于(3)步,判斷哪個關系不是BCNF,并找到X和A。這里,S的判斷用BCNF的定義,而X不是S的鍵則依靠分析。 6.分解成3NF模式集算法: (1)如果R中的某些屬性在F的所有依賴的左邊和

29、右邊都不出現(xiàn),那么這些屬性可以從R中分出去,單獨構成一個關系模式。 (2)如果F中有一個依賴XA有XAR,則=R,轉(4) (3)對于F中每一個XA,構成一個關系模式XA,如果F有有XA 1 ,XA 2 .XA n ,則可以用模式XA 1 A 2 .A n 代替n個模式XA 1 ,XA 2 .XA n ; (4)w分解結束,輸入。 這個過程的重點是這一句 “對于F中每一個XA,構成一個關系模式XA”,這使我們的分解十分容易,然后依據(jù)合并律(合并律:如果XY和XZ成立,那么XYZ成立)將有關模式合并即得到所需3NF模式。 7.模式設計方法的原則關系模式R相對于函數(shù)依賴集F分解成數(shù)據(jù)庫模式=R 1

30、 ,R 2 .R k ,一般具有下面四項特性 : 中每個關系模式R i上應具有某種范式性質(3NF或BCNF) 無損聯(lián)接性。 保持函數(shù)依賴集。 最小性,即中模式個數(shù)應最少且模式中屬性總數(shù)應最少。 一個好的模式設計方法應符合下列三條原則: 表達性 分離性 最小冗余性 8.多值依賴與第四范式(4NF)例: 學校中某一門課程由多個教師講授,他們使用相同的一套參考書。關系模式Teaching(C, T, B)課程C、教師T 和 參考書B多值依賴與第四范式TeachingBCNF:Teach具有唯一候選碼(C,T,B), 即全碼Teaching模式中存在的問題(1)數(shù)據(jù)冗余度大:有多少名任課教師,參考書

31、就要存儲多少次。(2)插入操作復雜:當某一課程增加一名任課教師時,該課程有多少本參照書,就必須插入多少個元組。例如物理課增加一名教師劉關,需要插入兩個元組: (物理,劉關,普通物理學) (物理,劉關,光學原理)(3) 刪除操作復雜:某一門課要去掉一本參考書,該課程有多少名教師,就必須刪除多少個元組。(4) 修改操作復雜:某一門課要修改一本參考書,該課程有多少名教師,就必須修改多少個元組。 產(chǎn)生原因存在多值依賴。1)多值依賴設R(U)是一個屬性集U上的一個關系模式, X、 Y和Z是U的子集,并且ZUXY,多值依賴 XY成立當且僅當對R的任一關系r,r在(X,Z)上的每個值對應一組Y的值,這組值僅

32、僅決定于X值而與Z值無關。例 Teaching(C, T, B)對于C的每一個值,T有一組值與之對應,而不論B取何值。2)第四范式(4NF)關系模式R<U,F(xiàn)>1NF,如果對于R的每個非平凡多值依賴XY(Y Í X),X都含有候選碼,則R4NF。如果R 4NF, 則R BCNF不允許有非平凡且非函數(shù)依賴的多值依賴允許的是函數(shù)依賴(是非平凡多值依賴)第四章關系運算學習目的與要求:本章總的要求是:深刻理解關系模型的運算理論,了解查詢優(yōu)化的意義和啟發(fā)式優(yōu)化算法。本章的重點是關系代數(shù)運算,應熟練掌握。關系演算是本章的難點??己酥R點和考核要求4.1關系代數(shù)4.1.1關系代數(shù)的五個

33、基本操作(并、差、笛卡兒積、投影、選 擇)(綜合運用)4.1.2關系代數(shù)的四個組合操作(交、連接、自然連接、除法) (綜合運用)4.1.3關系代數(shù)表達式的應用(綜合運用)4.1.4關系代數(shù)的兩個擴充操作(外連接、外部并)(領會)4.2關系演算4.2.1元組關系演算的定義及表達式的含義(簡單應用)4.2.2域關系演算的定義及表達式的含義(領會)4.2.3關系運算的安全約束和等價性(領會)4.3關系代數(shù)表達式的優(yōu)化(領會) 關系模型有三個重要組成部分:)數(shù)據(jù)結構)數(shù)據(jù)操縱)數(shù)據(jù)完整性規(guī)則關系查詢語言根據(jù)其理論基礎的不同分成兩類:)關系代數(shù)語言)關系演算語言4.1關系代數(shù)1.關系代數(shù)的五個基本操作:

34、并、差、笛卡爾積、投影和選擇。并 ():兩個關系需有相同的關系模式,并的對象是元組,由兩個關系所有元組構成。差 (-):同樣,兩個關系有相同的模式,R和S的差是由屬于R但不屬于S的元組構成的集合。 笛卡兒積(×): 對于兩個關系作運算,列:(n+m)列的元組的集合 ,元組的前n列是關系R的一個元組后m列是關系S的一個元組,行:k1×k2個元組。投影( ):對關系進行垂直分割,消去某些列,并重新安排列的順序。選擇 ():根據(jù)某些條件關系作水平分割,即選擇符合條件的元組。2.關系代數(shù)的四個組合操作:交、聯(lián)接、自然聯(lián)接和除法交():R和S的交是由既屬于R又屬于S的元組構成的集合。

35、 聯(lián)接包括聯(lián)接和F聯(lián)接,是選擇R×S中滿足i(r+j)或F條件的元組構成的集合,特別注意等值聯(lián)接 (為等號“=”)。自然聯(lián)接(R|X|S):在R×S中,選擇R和S公共屬性值均相等的元組,并去掉R×S中重復的公共屬性列。如果兩個關系沒有公共屬性,則自然聯(lián)接就轉化為笛卡爾積。除法(÷):首先除法的結果中元數(shù)為兩個元數(shù)的差,可以直接用觀察法來得到結果,把S看作一個塊,拿到R中去和相同屬性集中的元組作比較,如果有相同的塊,且除去此塊后留下的相應元組均相同,那么可以得到一條元組,所有這些元組的集合就是除法的結果。對于上述的五個基本操作和組合操作,應當從實際運算方面

36、進行理解和運用,對其形式定義可不必深究。注意課本上的例子。關系代數(shù)運算的三個要素:運算對象:關系運算結果:關系運算符:四類集合運算符將關系看成元組的集合運算是從關系的“水平”方向即行的角度來進行專門的關系運算符不僅涉及行而且涉及列算術比較符輔助專門的關系運算符進行操作邏輯運算符輔助專門的關系運算符進行操作廣義笛卡爾積(Extended Cartesian Product)Rn目關系,k1個元組Sm目關系,k2個元組R×S 列:(n+m)列的元組的集合元組的前n列是關系R的一個元組后m列是關系S的一個元組行:k1×k2個元組R×S = tr ts |tr Î

37、;R tsÎS 選擇(Selection) 1)選擇又稱為限制(Restriction)2)選擇運算符的含義在關系R中選擇滿足給定條件的諸元組 F(R) = t|tÎRF(t)= '真'F:選擇條件,是一個邏輯表達式,基本形式為:Ø( X1Y1 ) Ø( X2Y2 ):比較運算符(,或<>)X1,Y1等:屬性名、常量、簡單函數(shù);屬性名也可以用它的序號來代替;:邏輯運算符(或) :表示任選項:表示上述格式可以重復下去3)選擇運算是從行的角度進行的運算 4)舉例設有一個學生-課程數(shù)據(jù)庫,包括學生關系Student、課程關系Cour

38、se和選修關系SC。例1 查詢信息系(IS系)全體學生Sdept = 'IS' (Student)或5 ='IS' (Student)結果:例2 查詢年齡小于20歲的學生Sage < 20(Student) 或4 < 20(Student)結果: 投影(Projection)1)投影運算符的含義從R中選擇出若干屬性列組成新的關系A(R) = tA | t ÎR A:R中的屬性列2)投影操作主要是從列的角度進行運算但投影之后不僅取消了原關系中的某些列,而且還可能取消某些元組(避免重復行)3)舉例例3 查詢學生的姓名和所在系即求Student關

39、系上學生姓名和所在系兩個屬性上的投影Sname,Sdept(Student)或 2,5(Student)結果:例4 查詢學生關系Student中都有哪些系 Sdept(Student)結果:連接(Join) 1)連接也稱為連接2)連接運算的含義從兩個關系的笛卡爾積中選取屬性間滿足一定條件的元組 R S = | tr Î Rts ÎStrAtsB A和B:分別為R和S上度數(shù)相等且可比的屬性組:比較運算符 連接運算從R和S的廣義笛卡爾積R×S中選?。≧關系)在A屬性組上的值與(S關系)在B屬性組上值滿足比較關系的元組。 3)兩類常用連接運算等值連接(equi

40、join) 什么是等值連接為“”的連接運算稱為等值連接 等值連接的含義從關系R與S的廣義笛卡爾積中選取A、B屬性值相等的那些元組,即等值連接為: R S = | tr ÎRts ÎStrA = tsB 自然連接(Natural join) 什么是自然連接自然連接是一種特殊的等值連接兩個關系中進行比較的分量必須是相同的屬性組在結果中把重復的屬性列去掉自然連接的含義更多優(yōu)質自考資料盡在百度貼吧自考樂園俱樂部(R和S具有相同的屬性組BR S = | tr ÎRts ÎStrB = tsB 4)一般的連接操作是從行的角度進行運算。自然連接還需要取消重復列,所以是

41、同時從行和列的角度進行運算。 5)舉例例5 外連接例:列出老師的有關信息,包括姓名、工資、所教授的課程P# ,PN , SAL , C# , CN(PROF) PC C)外連接為避免自然連接時因失配而發(fā)生的信息丟失,可以假定往參與連接的一方表中附加一個取值全為空值的行,它和參與連接的另一方表中的任何一個未匹配上的元組都能匹配,稱之為外連接外連接 = 自然連接 + 失配的元組外連接的形式:左外連接、右外連接、全外連接重要內容分析1.(1)一般規(guī)則對于只涉及到選擇、投影、聯(lián)接的查詢可用下列表達式表示:(R×S) 或者(RS)對于否定的操作,一般要用差操作表示,例如“檢索不學C2課的學生姓

42、名”。對于檢索具有“全部”特征的操作,一般要用除法操作表示,例如“檢索學習全部課程的學生姓名”。 (2)“檢索不學C2課的學生姓名”,決不能用下式表示: SNAME,AGE(C#'C2'(SSC)一定要用“差”的形式: SNAME,AGE(S)SNAME,AGE(C#='C2'(SSC)(3)“檢索學習全部課程的學生學號”,要用S#,C#(SC)÷C#(C)表示,而不能寫成S# (SC÷C#(C)形式。這是因為一個學生學的課程的成績可能是不一樣的。 2.非過程性語言與過程性語言的區(qū)別編程時必須指出“干什么”及“怎么干”的語言,稱為過程性語言;

43、編程時只須指出“干什么”,不必指出“怎么干”的語言,稱為非過程性語言。4.2關系演算把數(shù)理邏輯的謂詞演算引入關系運算中,就可得到以關系演算為基礎的運算。關系演算分為元組關系演算或域關系演算,前者以元組為變量,后者以域為變量。元組關系演算形式化定義 t | P(t)表示所有使謂詞P為真的元組集合t為元組變量如果元組變量前有“全稱”(")或“存在”($)量詞,則稱其為約束變量,否則稱為自由變量。P是公式由原子公式和運算符組成原子公式sRs是關系R中的一個元組sx q uysx與uy為元組分量,他們之間滿足比較關系q sx q c分量sx與常量c之間滿足比較關系q 公式的遞歸定義原子公式是

44、公式如果P是公式,那么P也是公式如果P1 , P2是公式,則P1 Ù P2 , P1 Ú P2 , P1 Þ P2也是公式如果P(t)是公式,R是關系,則$tÎR (P(t)和"tÎR (P(t) 也是公式。公式的等價性P1 ÙP2 Û (P1 Ú P2)" tÎR (P(t) Û $t ÎR (P(t)P1 Þ P2 Û P1 ÚP2表達式的安全性元組關系演算有可能會產(chǎn)生無限關系,這樣的表達式是不安全的。如t | (t Î

45、R),求所有不在R中的元組引入公式P的域概念,用dom(P)表示dom(P) = 顯式出現(xiàn)在P中的值 + 在P中出現(xiàn)的關系的元組中出現(xiàn)的值(不必是最小集)如dom ( t | (t Î R) )是R中出現(xiàn)的所有值的集合如果出現(xiàn)在表達式t | P(t)結果中的所有值均來自dom(P),則稱t | P(t)是安全的。示例:找出工資在800元以上的老師t | tÎPROF Ù tSAL > 800找出工資在800元以上的老師的姓名 t | $sÎPROF ( tPNAME = sPNAME Ù sSAL > 800 )給出計算機系老師的姓

46、名t | $uÎDEPT ( uDNAME = “計算機系” Ù $sÎPROF ( sDNO = uDNO Ù tPNAME = sPNAME )求選修了全部課程的學生號t | "uÎC ( $sÎSC ( sCNO = uCNO Ù tSNO = sSNO )求選修了張軍同學所選修的全部課程的學生姓名"課程,張軍選之 Þ 所求同學選之t | "uÎC ( $sÎSC Ù $wÎS ( sCNO = uCNO Ù wSNO = sSN

47、O Ù wSNAME = “張軍” )元組關系演算與關系代數(shù)的等價性投影A( R ) = t | $sÎR ( sA = tA ) 選擇 sF(A)(R) = t | tÎR Ù F(tA) 廣義笛卡兒積R(A) ´ S(B) = t | $uÎR$sÎS( tA = uA Ù tB = sB)并 RÈS= t | tÎR Ú tÎS交 R-S= t | tÎR Ù tÎS域關系演算形式化定義 < x1 , x2 , , xn > |

48、 P( x1 , x2 , , xn )xi代表域變量,P為由原子構成的公式原子公式< x1 , x2 , , xn > Î Rxi是域變量或域常量x q y域變量x與y之間滿足比較關系q x q c域變量x與常量c之間滿足比較關系q 示例:找出工資在800元以上的老師< a , b , c , d , e > | < a , b , c , d , e > ÎPROF Ù e > 800找出工資在800元以上的老師的姓名< b > | $ a , c , d , e ( < a , b , c , d

49、, e > ÎPROF Ùe > 800 )4.3關系代數(shù)表達式的優(yōu)化問題目的在關系代數(shù)中找一種好的操作步驟,既省空間,查詢效率又比較高。在關系代數(shù)中,笛卡兒積和聯(lián)結運算是最費時間和空間的,在關系很大的時候,必須要考慮怎樣做才能合理的安排,做到省時省力。一個例子設關系R和S都是二元關系,屬性名分別是A、B和C、D。那么如下查詢:E1=A(B=C Ù D=99(R× S)也可以是 E2=A(B=C( R× D=99( S)或E3=A(R D=99( S)這三個代數(shù)表達式的等價的,但是執(zhí)行的效率不一樣。第一種:先做笛卡兒積。假設每個物理

50、塊可以存儲R的B1個元組,或者S的B2個元組,R關系中有n1個元組,S關系中有n2個元組,內存每次只能裝載m塊數(shù)據(jù)。在做聯(lián)接的時候先把R的第一個m-1塊數(shù)據(jù)裝入內存,然后逐個調入S中的數(shù)據(jù)塊;R中的每個數(shù)據(jù)塊只要進入內存一次,總共需要裝入的塊數(shù)示n1/B1;S中的每個數(shù)據(jù)塊需要進入內存(n1/B1)/(m-1)次,總共需要裝入的塊數(shù)是:(n1/B1)(1/(m-1)(n2/B2)這三個代數(shù)表達式的等價的,但是執(zhí)行的效率不一樣。執(zhí)行R X S的總裝入塊數(shù)是(n1/B1)(1+n2/(m-1)/B2)若n1=n2=10000,B1=B2=5,m=100,那么總的裝入塊數(shù)是42400,若每秒裝入20

51、塊,需要35分鐘。耗費時間長,在實際使用中不采用。這三個代數(shù)表達式的等價的,但是執(zhí)行的效率不一樣。第二種和第三種:先做了選擇,裝入的塊數(shù)為n1/B1+n2/B2,大約需要裝入4000塊,耗費時間3分多鐘。對于S來說,元組并不是全部進入內存,而且只是進入一次,所以速度快。1.優(yōu)化的一般策略我們所說的優(yōu)化和存儲沒有關系,主要是如何來安排操作的順序,節(jié)省時間和空間的消費優(yōu)化的一般技術:在關系代數(shù)表達式中盡可能早地執(zhí)行選擇操作。把笛卡兒積和其后的選擇操作合并成F聯(lián)接運算。同時計算一連串的選擇和投影操作,避免分開運算造成多次掃描文件。2.關系代數(shù)表達式的優(yōu)化算法對一個關系代數(shù)表達式進行語法分析可以得到一

52、棵語法樹,葉子式關系,非葉子結點式關系代數(shù)操作。算法2.1 關系代數(shù)表達式的優(yōu)化。輸入:一個關系代數(shù)表達式的語法樹。輸出:計算表達式的一個優(yōu)化程序。方法:依次執(zhí)行下面的每一步。(1)使用等價變換規(guī)則4將每個形為F1ÙÙFn(E)的子表達式轉換成串接形式:F1(Fn(E)(2)對每個選擇操作,盡可能把選擇操作移近樹的葉端(盡可能早的實行選擇操作)。(3)對每個投影操作,盡可能把投影操作移近樹的葉端。 (4)把選擇和投影合并成單個選擇、單個投影或一個選擇后跟一個投影。(5)將上述步驟得到的語法樹的內結點分組。 (6)生成一個序列,每一組結點的計算是序列中的一步。見課本例子。第五章 SQL語言學習目的與要求:SQL語言是關系數(shù)據(jù)庫的標準語言,是本課程的一個重點。本章總的要求是:全面

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論