關系數據理論課件_第1頁
關系數據理論課件_第2頁
關系數據理論課件_第3頁
關系數據理論課件_第4頁
關系數據理論課件_第5頁
已閱讀5頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第6章 關系數據理論6.1 問題的提出6.2 規(guī)范化6.3 數據依賴的公理系統(tǒng)*6.4 模式的分解6.5 小結8/9/202216.1 問題的提出關系數據庫邏輯設計針對具體問題,如何構造一個適合于它的數據模式數據庫邏輯設計的工具關系數據庫的規(guī)范化理論8/9/20222問題的提出一、概念回顧二、關系模式的形式化定義三、什么是數據依賴四、關系模式的簡化定義五、數據依賴對關系模式影響8/9/20223一、概念回顧關系:描述實體、屬性、實體間的聯(lián)系。從形式上看,它是一張二維表,是所涉及屬性的笛卡爾積的一個子集。關系模式:用來定義關系。關系數據庫:基于關系模型的數據庫,利用關系來描述現實世界。從形式上看

2、,它由一組關系組成。關系數據庫的模式:定義這組關系的關系模式的全體。8/9/20224二、關系模式的形式化定義關系模式由五部分組成,即它是一個五元組: R(U, D, DOM, F)R: 關系名U: 組成該關系的屬性名集合D: 屬性組U中屬性所來自的域DOM:屬性向域的映象集合F: 屬性間數據的依賴關系集合8/9/20225三、什么是數據依賴1. 完整性約束的表現形式限定屬性取值范圍:例如學生成績必須在0-100之間定義屬性值間的相互關連(主要體現于值的相等與否),這就是數據依賴,它是數據庫模式設計的關鍵8/9/20226什么是數據依賴(續(xù))2. 數據依賴是通過一個關系中屬性間值的相等與否體現

3、出來的數據間的相互關系是現實世界屬性間相互聯(lián)系的抽象是數據內在的性質是語義的體現8/9/20227什么是數據依賴(續(xù))3. 數據依賴的類型函數依賴(Functional Dependency,簡記為FD)多值依賴(Multivalued Dependency,簡記為MVD)其他8/9/20228四、關系模式的簡化表示關系模式R(U, D, DOM, F) 簡化為一個三元組: R(U, F)當且僅當U上的一個關系r 滿足F時,r稱為關系模式 R(U, F)的一個關系8/9/20229五、數據依賴對關系模式的影響例:描述學校的數據庫:學生的學號(Sno)、所在系(Sdept)系主任姓名(Mname

4、)、課程名(Cname)成績(Grade)單一的關系模式 : Student U Sno, Sdept, Mname, Cname, Grade 8/9/202210數據依賴對關系模式的影響(續(xù))學校數據庫的語義: 一個系有若干學生, 一個學生只屬于一個系; 一個系只有一名主任; 一個學生可以選修多門課程, 每門課程有若干學生選修; 每個學生所學的每門課程都有一個成績。 8/9/202211數據依賴對關系模式的影響(續(xù))屬性組U上的一組函數依賴F: F Sno Sdept, Sdept Mname, ( Sno, Cname ) Grade SnoCnameSdeptMnameGrade8/9

5、/202212關系模式Student中存在的問題 數據冗余太大浪費大量的存儲空間 例:每一個系主任的姓名重復出現 更新異常(Update Anomalies)數據冗余 ,更新數據時,維護數據完整性代價大。例:某系更換系主任后,系統(tǒng)必須修改與該系學生有關的每一個元組8/9/202213關系模式Student中存在的問題 插入異常(Insertion Anomalies)該插的數據插不進去 例,如果一個系剛成立,尚無學生,我們就無法把這個系及其系主任的信息存入數據庫。 刪除異常(Deletion Anomalies)不該刪除的數據不得不刪例,如果某個系的學生全部畢業(yè)了, 我們在刪除該系學生信息的同

6、時,把這個系及其系主任的信息也丟掉了。8/9/202214數據依賴對關系模式的影響(續(xù))結論:Student關系模式不是一個好的模式?!昂谩钡哪J剑翰粫l(fā)生插入異常、刪除異常、更新異常,數據冗余應盡可能少。原因:由存在于模式中的某些數據依賴引起的解決方法:通過分解關系模式來消除其中不合適 的數據依賴。8/9/2022156.2 規(guī)范化 規(guī)范化理論正是用來改造關系模式,通過分解關系模式來消除其中不合適的數據依賴,以解決插入異常、刪除異常、更新異常和數據冗余問題。8/9/2022166.2.1 函數依賴一、函數依賴二、平凡函數依賴與非平凡函數依賴三、完全函數依賴與部分函數依賴四、傳遞函數依賴8/9

7、/202217一、函數依賴定義6.1 設R(U)是一個屬性集U上的關系模式,X和Y是U的子集。 若對于R(U)的任意一個可能的關系r,r中不可能存在兩個元組在X上的屬性值相等, 而在Y上的屬性值不等, 則稱 “X函數確定Y” 或 “Y函數依賴于X”,記作XY。 X稱為這個函數依賴的決定屬性集(Determinant)。 Y=f(x)8/9/202218說明: 1. 函數依賴不是指關系模式R的某個或某些關系實例滿足的約束條件,而是指R的所有關系實例均要滿足的約束條件。2. 函數依賴是語義范疇的概念。只能根據數據的語義來確定函數依賴。 例如“姓名年齡”這個函數依賴只有在不允許有同名人的條件下成立3

8、. 數據庫設計者可以對現實世界作強制的規(guī)定。例如規(guī)定不允許同名人出現,函數依賴“姓名年齡”成立。所插入的元組必須滿足規(guī)定的函數依賴,若發(fā)現有同名人存在, 則拒絕裝入該元組。8/9/202219函數依賴(續(xù))例: Student(Sno, Sname, Ssex, Sage, Sdept) 假設不允許重名,則有:Sno Ssex, Sno Sage , Sno Sdept, Sno Sname, Sname Ssex, Sname SageSname Sdept但Ssex Sage若XY,并且YX, 則記為XY。 若Y不函數依賴于X, 則記為XY。8/9/202220二、平凡函數依賴與非平凡函數

9、依賴在關系模式R(U)中,對于U的子集X和Y,如果XY,但Y X,則稱XY是非平凡的函數依賴若XY,但Y X, 則稱XY是平凡的函數依賴例:在關系SC(Sno, Cno, Grade)中, 非平凡函數依賴: (Sno, Cno) Grade 平凡函數依賴: (Sno, Cno) Sno (Sno, Cno) Cno8/9/202221平凡函數依賴與非平凡函數依賴(續(xù))于任一關系模式,平凡函數依賴都是必然成立的,它不反映新的語義,因此若不特別聲明, 我們總是討論非平凡函數依賴。8/9/202222三、完全函數依賴與部分函數依賴定義6.2 在關系模式R(U)中,如果XY,并且對于X的任何一個真子集

10、X,都有 X Y, 則稱Y完全函數依賴于X,記作X Y。 若XY,但Y不完全函數依賴于X,則稱Y部分函數依賴于X,記作X P Y。 8/9/202223完全函數依賴與部分函數依賴(續(xù))例: 在關系SC(Sno, Cno, Grade)中, 由于:Sno Grade,Cno Grade, 因此:(Sno, Cno) Grade 8/9/202224四、傳遞函數依賴定義6.3 在關系模式R(U)中,如果XY,YZ,且Y X,YX,則稱Z傳遞函數依賴于X。注: 如果YX, 即XY,則Z直接依賴于X。例: 在關系Std(Sno, Sdept, Mname)中,有:Sno Sdept,Sdept Mna

11、me Mname傳遞函數依賴于Sno8/9/2022256.2.2 碼定義6.4 設K為關系模式R中的屬性或屬性組合。若K U,則K稱為R的一個侯選碼(Candidate Key)。若關系模式R有多個候選碼,則選定其中的一個做為主碼(Primary key)。主屬性與非主屬性ALL KEY8/9/202226外部碼定義6.5 關系模式 R 中屬性或屬性組X 并非 R的碼,但 X 是另一個關系模式的碼,則稱 X 是R 的外部碼(Foreign key)也稱外碼主碼又和外部碼一起提供了表示關系間聯(lián)系的手段。8/9/2022276.2.3 范式范式是符合某一種級別的關系模式的集合。關系數據庫中的關系

12、必須滿足一定的要求。滿足不同程度要求的為不同范式。范式的種類:第一范式(1NF)第二范式(2NF)第三范式(3NF)BC范式(BCNF)第四范式(4NF)第五范式(5NF)8/9/2022286.2.3 范式各種范式之間存在聯(lián)系:某一關系模式R為第n范式,可簡記為RnNF。8/9/2022296.2.4 2NF1NF的定義如果一個關系模式R的所有屬性都是不可分的基本數據項,則R1NF。第一范式是對關系模式的最起碼的要求。不滿足第一范式的數據庫模式不能稱為關系數據庫。但是滿足第一范式的關系模式并不一定是一個好的關系模式。8/9/2022302NF例: 關系模式 SLC(Sno, Sdept, S

13、loc, Cno, Grade) Sloc為學生住處,假設每個系的學生住在同一個地方。函數依賴包括: (Sno, Cno) f Grade Sno Sdept (Sno, Cno) P Sdept Sno Sloc (Sno, Cno) P Sloc Sdept Sloc8/9/202231 2NFSLC的碼為(Sno, Cno)SLC滿足第一范式。 非主屬性Sdept和Sloc部分函數依賴于碼(Sno, Cno)SnoCnoGradeSdeptSlocSLC8/9/202232SLC不是一個好的關系模式(1) 插入異常假設Sno95102,SdeptIS,SlocN的學生還未選課,因課程號是

14、主屬性,因此該學生的信息無法插入SLC。(2) 刪除異常 假定某個學生本來只選修了3號課程這一門課?,F在因身體不適,他連3號課程也不選修了。因課程號是主屬性,此操作將導致該學生信息的整個元組都要刪除。 8/9/202233SLC不是一個好的關系模式(3) 數據冗余度大 如果一個學生選修了10門課程,那么他的Sdept和Sloc值就要重復存儲了10次。(4) 修改復雜 例如學生轉系,在修改此學生元組的Sdept值的同時,還可能需要修改住處(Sloc)。如果這個學生選修了K門課,則必須無遺漏地修改K個元組中全部Sdept、Sloc信息。 8/9/202234 2NF原因 Sdept、 Sloc部分

15、函數依賴于碼。解決方法 SLC分解為兩個關系模式,以消除這些部分函數依賴 SC(Sno, Cno, Grade) SL(Sno, Sdept, Sloc)8/9/202235 2NFSLC的碼為(Sno, Cno)SLC滿足第一范式。 非主屬性Sdept和Sloc部分函數依賴于碼(Sno, Cno)SnoCnoGradeSdeptSlocSLC8/9/2022362NF函數依賴圖:SnoCnoGradeSCSLSnoSdeptSloc8/9/202237 2NF2NF的定義定義6.6 若關系模式R1NF,并且每一個非主屬性都完全函數依賴于R的碼,則R2NF。例:SLC(Sno, Sdept,

16、Sloc, Cno, Grade) 1NF SLC(Sno, Sdept, Sloc, Cno, Grade) 2NF SC(Sno, Cno, Grade) 2NF SL(Sno, Sdept, Sloc) 2NF8/9/202238 第二范式(續(xù))采用投影分解法將一個1NF的關系分解為多個2NF的關系,可以在一定程度上減輕原1NF關系中存在的插入異常、刪除異常、數據冗余度大、修改復雜等問題。將一個1NF關系分解為多個2NF的關系,并不能完全消除關系模式中的各種異常情況和數據冗余。8/9/202239 6.2.5 3NF例:2NF關系模式SL(Sno, Sdept, Sloc)中函數依賴:

17、SnoSdept SdeptSloc SnoSlocSloc傳遞函數依賴于Sno,即SL中存在非主屬性對碼的傳遞函數依賴。8/9/202240 3NF函數依賴圖:SLSnoSdeptSloc8/9/202241 3NF解決方法 采用投影分解法,把SL分解為兩個關系模式,以消除傳遞函數依賴: SD(Sno, Sdept) DL(Sdept, Sloc)SD的碼為Sno, DL的碼為Sdept。8/9/202242 3NFSD的碼為Sno, DL的碼為Sdept。SnoSdeptSDSdeptSlocDL8/9/202243 3NF3NF的定義定義6.8 關系模式R 中若不存在這樣的碼X、屬性組Y

18、及非主屬性Z(Z Y), 使得XY,Y X,YZ,成立,則稱R 3NF。例, SL(Sno, Sdept, Sloc) 2NF SL(Sno, Sdept, Sloc) 3NF SD(Sno, Sdept) 3NF DL(Sdept, Sloc) 3NF8/9/202244 3NF若R3NF,則R的每一個非主屬性既不部分函數依賴于候選碼也不傳遞函數依賴于候選碼。如果R3NF,則R也是2NF。采用投影分解法將一個2NF的關系分解為多個3NF的關系,可以在一定程度上解決原2NF關系中存在的插入異常、刪除異常、數據冗余度大、修改復雜等問題。 將一個2NF關系分解為多個3NF的關系后,并不能完全消除關

19、系模式中的各種異常情況和數據冗余。8/9/202245 6.2.6 BC范式(BCNF)定義6.9 設關系模式R1NF,如果對于R的每個函數依賴XY,若Y不屬于X,則X必含有候選碼,那么RBCNF。若RBCNF 每一個決定屬性集(因素)都包含(候選)碼R中的所有屬性(主,非主屬性)都完全函數依賴于碼R3NF(證明)若R3NF 則 R不一定BCNF8/9/202246 BCNF例:在關系模式STJ(S,T,J)中,S表示學生,T表示教師,J表示課程。每一教師只教一門課。每門課由若干教師教,某一學生選定某門課,就確定了一個固定的教師。某個學生選修某個教師的課就確定了所選課的名稱 : (S,J)T,

20、(S,T)J,TJ8/9/202247 6.2.6 BCNF SJTSTJSTJ8/9/202248BCNFSTJ3NF(S,J)和(S,T)都可以作為候選碼S、T、J都是主屬性STJBCNFTJ,T是決定屬性集,T不是候選碼8/9/202249BCNF解決方法:將STJ分解為二個關系模式: SJ(S,J) BCNF, TJ(T,J) BCNF 沒有任何屬性對碼的部分函數依賴和傳遞函數依賴SJSTTJTJ8/9/2022503NF與BCNF的關系如果關系模式RBCNF, 必定有R3NF如果R3NF,且R只有一個候選碼, 則R必屬于BCNF。8/9/202251BCNF的關系模式所具有的性質 所

21、有非主屬性都完全函數依賴于每個候選碼 所有主屬性都完全函數依賴于每個不包含它的候選碼 沒有任何屬性完全函數依賴于非碼的任何一組屬性8/9/202252函數依賴有效地表達了屬性值之間的多對一聯(lián)系但不能表達屬性值之間一對多的聯(lián)系下面介紹的多值依賴可以刻劃一部分一對多聯(lián)系8/9/2022536.2.5 多值依賴與第四范式(4NF)例: 學校中某一門課程由多個教師講授,他們使用相同的一套參考書。關系模式Teaching(C, T, B) 課程C、教師T 和 參考書B8/9/202254課 程 C教 員 T參 考 書 B物理數學計算數學李 勇王 軍李 勇張 平張 平周 峰 普通物理學光學原理 物理習題集

22、數學分析微分方程高等代數數學分析表6.18/9/202255普通物理學光學原理物理習題集普通物理學光學原理物理習題集數學分析微分方程高等代數數學分析微分方程高等代數李 勇李 勇李 勇王 軍王 軍王 軍李 勇李 勇李 勇張 平張 平張 平 物 理物 理物 理物 理物 理物 理數 學數 學數 學數 學數 學數 學 參考書B教員T課程C用二維表表示Teaching 8/9/202256多值依賴與第四范式(續(xù))TeachingBCNF:Teach具有唯一候選碼(C,T,B), 即全碼Teaching模式中存在的問題 (1)數據冗余度大:有多少名任課教師,參考書就要存儲多少次 8/9/202257多值依

23、賴與第四范式(續(xù)) (2)插入操作復雜:當某一課程增加一名任課教師時,該課程有多少本參照書,就必須插入多少個元組例如物理課增加一名教師劉關,需要插入兩個元組: (物理,劉關,普通物理學) (物理,劉關,光學原理)8/9/202258多值依賴與第四范式(續(xù))(3) 刪除操作復雜:某一門課要去掉一本參考書,該課程有多少名教師,就必須刪除多少個元組(4) 修改操作復雜:某一門課要修改一本參考書,該課程有多少名教師,就必須修改多少個元組 8/9/202259多值依賴與第四范式(續(xù))產生原因:課程與教師有直接聯(lián)系,課程與參考書有直接聯(lián)系,而教師與參考書無直接聯(lián)系。把無直接聯(lián)系的屬性放到一個關系模式里,就

24、會產生冗余和異常,即存在多值依賴。8/9/202260一、多值依賴定義6.10 設R(U)是一個屬性集U上的一個關系模式, X、 Y和Z是U的子集,并且ZUXY,多值依賴 XY成立當且僅當對R的任一關系r,r在(X,Z)上的每個值對應一組Y的值,這組值僅僅決定于X值而與Z值無關 例 Teaching(C, T, B) 對于C的每一個值,T有一組值與之對應,而不論B取何值,即C T8/9/202261一、多值依賴在R(U)的任一關系r中,如果存在元組t,s 使得tX=sX,那么就必然存在元組 w,v r,(w,v可以與s,t相同),使得wX=vX=tX,而wY=tY,wZ=sZ,vY=sY,vZ

25、=tZ(即交換s,t元組的Y值所得的兩個新元組必在r中),則Y多值依賴于X,記為XY。 這里,X,Y是U的子集,Z=U-X-Y。 t x y1 z2 s x y2 z1 w x y1 z1 v x y2 z28/9/202262多值依賴(續(xù))平凡多值依賴和非平凡的多值依賴若XY,而Z,則稱 XY為平凡的多值依賴否則稱XY為非平凡的多值依賴8/9/202263多值依賴的性質(1)多值依賴具有對稱性 若XY,則XZ,其中ZUXY 多值依賴的對稱性可以用完全二分圖直觀地表示出來。(2)多值依賴具有傳遞性 若XY,YZ, 則XZ -Y8/9/202264多值依賴的對稱性 XiZi1 Zi2 ZimYi

26、1 Yi2 Yin8/9/202265多值依賴的對稱性 物 理普通物理學 光學原理 物理習題集李勇 王軍8/9/202266多值依賴(續(xù))(3)函數依賴是多值依賴的特殊情況。 若XY,則XY。(4)若XY,XZ,則XY Z。(5)若XY,XZ,則XYZ。(6)若XY,XZ,則XY-Z,XZ -Y。8/9/202267多值依賴與函數依賴的區(qū)別(1) 有效性多值依賴的有效性與屬性集的范圍有關若XY在U上成立,則在W(X Y W U)上一定成立;反之則不然,即XY在W(W U)上成立,在U上并不一定成立多值依賴的定義中不僅涉及屬性組 X和 Y,而且涉及U中其余屬性Z。一般地,在R(U)上若有XY在W

27、(W U)上成立,則稱XY為R(U)的嵌入型多值依賴8/9/202268多值依賴與函數依賴的區(qū)別只要在R(U)的任何一個關系r中,元組在X和Y上的值滿足定義6.l(函數依賴), 則函數依賴XY在任何屬性集W(X Y W U)上成立。8/9/202269多值依賴(續(xù))(2) 若函數依賴XY在R(U)上成立,則對于任何Y Y均有XY 成立多值依賴XY若在R(U)上成立,不能斷言對于任何Y Y有XY 成立8/9/202270二、第四范式(4NF)定義6.10 關系模式R1NF,如果對于R的每個非平凡多值依賴XY(Y X),X都含有候選碼,則R4NF。 (XY)如果R 4NF, 則R BCNF 不允許

28、有非平凡且非函數依賴的多值依賴 允許的是函數依賴(是非平凡多值依賴)8/9/202271第四范式(續(xù))例: Teach(C,T,B) 4NF 存在非平凡的多值依賴CT,且C不是候選碼用投影分解法把Teach分解為如下兩個關系模式: CT(C, T) 4NF CB(C, B) 4NF CT, CB是平凡多值依賴 8/9/2022726.2 規(guī)范化6.2.1 第一范式(1NF)6.2.2 第二范式(2NF)6.2.3 第三范式(3NF)6.2.4 BC范式(BCNF)6.2.5 多值依賴與第四范式(4NF)6.2.6 規(guī)范化8/9/2022736.2.6 規(guī)范化關系數據庫的規(guī)范化理論是數據庫邏輯設

29、計的工具。一個關系只要其分量都是不可分的數據項,它就是規(guī)范化的關系,但這只是最基本的規(guī)范化。規(guī)范化程度可以有多個不同的級別8/9/202274規(guī)范化(續(xù))規(guī)范化程度過低的關系不一定能夠很好地描述現實世界,可能會存在插入異常、刪除異常、修改復雜、數據冗余等問題一個低一級范式的關系模式,通過模式分解可以轉換為若干個高一級范式的關系模式集合,這種過程就叫關系模式的規(guī)范化8/9/202275規(guī)范化(續(xù))關系模式規(guī)范化的基本步驟 1NF 消除非主屬性對碼的部分函數依賴消除決定屬性 2NF集非碼的非平 消除非主屬性對碼的傳遞函數依賴凡函數依賴 3NF 消除主屬性對碼的部分和傳遞函數依賴 BCNF 消除非平

30、凡且非函數依賴的多值依賴 4NF8/9/202276規(guī)范化的基本思想消除不合適的數據依賴的各關系模式達到某種程度的“分離”采用“一事一地”的模式設計原則 讓一個關系描述一個概念、一個實體或者實體間的一種聯(lián)系。若多于一個概念就把它“分離”出去所謂規(guī)范化實質上是概念的單一化8/9/202277規(guī)范化(續(xù))不能說規(guī)范化程度越高的關系模式就越好在設計數據庫模式結構時,必須對現實世界的實際情況和用戶應用需求作進一步分析,確定一個合適的、能夠反映現實世界的模式上面的規(guī)范化步驟可以在其中任何一步終止8/9/202278練習一設計關于供應商供應零件的數據庫,要求達到3NF最初的設計:R(S#, Sname, City, Status, P#, Pname, Color, Weight, QTY)主碼:(S#, P#)函數依賴:S#Sname, S# Status, S# City, City Status, P# Pname, P# Color, P# Weight 可見,其中有部分依賴,還有傳遞依賴。該模式僅為1NF8/9/202279分解第一步分解,消除部分依賴,得到:R1(S#, P#, QTY),(S#, P#)為碼R2(S#,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論