第5章數(shù)據(jù)庫規(guī)范化理論_第1頁
第5章數(shù)據(jù)庫規(guī)范化理論_第2頁
第5章數(shù)據(jù)庫規(guī)范化理論_第3頁
第5章數(shù)據(jù)庫規(guī)范化理論_第4頁
第5章數(shù)據(jù)庫規(guī)范化理論_第5頁
已閱讀5頁,還剩48頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

數(shù)據(jù)庫系統(tǒng)原理

與應(yīng)用技術(shù)

主講:陳漫紅chmh1@263.net北京聯(lián)合大學(xué)師范學(xué)院電氣信息系第5章數(shù)據(jù)庫規(guī)范化理論

5.1數(shù)據(jù)依賴5.2函數(shù)依賴5.3關(guān)系規(guī)范化5.4關(guān)系模式的分解原則5.5本章小結(jié)5.1數(shù)據(jù)依賴

5.1.1數(shù)據(jù)依賴

5.1.2數(shù)據(jù)依賴對關(guān)系模式的影響

5.1.1數(shù)據(jù)依賴數(shù)據(jù)庫設(shè)計的一個最基本的問題是怎樣建立一個好的數(shù)據(jù)庫模式,也就是給出一組數(shù)據(jù),如何構(gòu)造一個合理的數(shù)據(jù)模式,使數(shù)據(jù)庫系統(tǒng)無論是在數(shù)據(jù)存儲方面,還是在數(shù)據(jù)操縱方面都具有較好的性能。

F.E.

Codd提出并發(fā)展了一套關(guān)系數(shù)據(jù)庫設(shè)計理論--關(guān)系的規(guī)范化理論,根據(jù)現(xiàn)實世界存在的數(shù)據(jù)依賴進行關(guān)系模式的規(guī)范化處理,從而得到一個好的數(shù)據(jù)庫設(shè)計。5.1.2數(shù)據(jù)依賴對關(guān)系模式的影響比如,描述一個學(xué)生的關(guān)系,可以有學(xué)號(Sno)、姓名(Sname)、所在系(Sdept)等幾個屬性。由于一個學(xué)號只對應(yīng)一個學(xué)生,一個學(xué)生只在一個系。因而當“學(xué)號”值確定之后,姓名及其所在系的值也就被唯一地確定了。屬性間的這種依賴關(guān)系類似于數(shù)學(xué)中的函數(shù)。因此說Sno函數(shù)決定Sname和Sdept,或者說Sname和sdept函數(shù)依賴于Sno,記做Sno→Sname,Sno→Sdept。

5.1.2數(shù)據(jù)依賴對關(guān)系模式的影響假設(shè)有描述學(xué)生選課和住宿情況的關(guān)系模式:S_L_C(Sno,Sdept,Sloc,Cno,Grade)

此關(guān)系模式存在什么問題?S_L_C模式的數(shù)據(jù)示例如下表所示:SnoSdeptSLOCCnoGrade0912101計算機2公寓DB800912101計算機2公寓OS850921101信息1公寓C900921101信息1公寓DS

840921102信息1公寓OS

785.1.2數(shù)據(jù)依賴對關(guān)系模式的影響數(shù)據(jù)冗余問題:學(xué)生往往要選多門課,則Sno,Sdept,SLOC會重復(fù)出現(xiàn)很多次。數(shù)據(jù)更新問題:如果某學(xué)生從計算機系轉(zhuǎn)到信息系,那么不但要修改此學(xué)生的SDEPT列的值,而且還要修改Sloc列的值,從而使修改復(fù)雜化。

數(shù)據(jù)插入問題:例如當某學(xué)生尚未選課前,雖然已知他的學(xué)號、姓名,仍無法將他的信息插入關(guān)系S_L_C中,這是因為S的主碼是(SNO,CNO),CNO為“空”值時,插入是禁止的。數(shù)據(jù)刪除問題:假定學(xué)生周明不再選修C1課程了,本應(yīng)刪去C,但C是主碼的一部分,要刪,必須將整個元組一起刪去,這樣,有關(guān)周明的其它信息就丟失了。若想保留周明的其它信息,就只好不刪。5.2函數(shù)依賴5.2.1函數(shù)依賴的概念5.2.2碼

5.2.1函數(shù)依賴的概念定義:如果有一個關(guān)系模式R(A1,A2,…,An),X和Y為{A1,A2,…,An}的子集,那么對于關(guān)系R中的任意一個X值,都只有一個Y值與之對應(yīng),則稱X函數(shù)決定Y,或Y函數(shù)依賴于X。 例:Student(Sno,SName,Sdept,Sage)Sno→SName,Sno→Sdept,Sno→Sage例:

SC(Sno,Cno,Grade)(Sno,Cno)→Grade5.2.1函數(shù)依賴的概念一些術(shù)語和符號1.如果X→Y,但Y不包含于X,則稱X→Y是非平凡的函數(shù)依賴。如不作特別說明,我們總是討論非平凡函數(shù)依賴。2.如果Y不函數(shù)依賴于X,則記作X—/→Y。3.如果X→Y,則稱X為決定因子。4.如果X→Y,并且Y→X,則記作X←→Y。5.2.1函數(shù)依賴的概念5.如果X→Y,并且對于X的一個任意真子集X’都有X’—/→Y,則稱Y完全函數(shù)依賴于X,記作:如果X’→Y成立,則稱Y部分函數(shù)依賴于X,記作:6.如果X→Y(非平凡函數(shù)依賴,并且Y—/→X)、Y→Z,則稱Z傳遞函數(shù)依賴于X。記作:ZX5.2.2碼1候選碼

設(shè)K為關(guān)系模式R<U,F(xiàn)>中的屬性或?qū)傩越M合。若KU,則K稱為R的一個候選碼(candidatekey)。2主碼若關(guān)系模式R有多個候選碼,則選定其中的一個做為主碼(primarykey)。每個關(guān)系必定有且僅有一個主碼。3全碼候選碼為整個屬性組,稱為全碼(all-key)。4主屬性與非主屬性在關(guān)系模式R<U,F(xiàn)>中,包含在任一候選碼中的屬性稱為主屬性,不包含在任一候選碼中的屬性稱為非主屬性。5外碼

用于在關(guān)系表之間建立關(guān)聯(lián)的屬性(屬性組)稱為外碼。示例例如:關(guān)系SC(SNO,CNO,Grade)中,SNO——學(xué)號,CNO——課程號,Grade——成績 候選碼:(SNO,CNO),也為主碼主屬性:SNO,CNO,非主屬性:Grade例如:R(P,W,A),P――演奏者,W――作品,A――聽眾 語義:一個演奏者可演奏多個作品,某一作品可被多個演奏者演奏;聽眾也可欣賞不同演奏者個不同作品。 候選碼:(P,W,A)――全碼(演奏者、作品、聽眾一場音樂會)例如:關(guān)系student(Sno,Sname,Ssex,Sage,Sdept)中,有Sno→Ssex,Sno→Sage,Sno→Sdept,Sno←→Sname,(若無人重名),所以候選碼為:sno和sname,主碼為sno;關(guān)系SC(Sno,Cno,Grade)中的Sno為student的外碼。5.3關(guān)系規(guī)范化5.3.1第一范式(1NF)5.3.2第二范式(2NF)5.3.3第三范式(3NF)5.3.3BCNF范式5.3.4多值依賴與第四范式5.3.5規(guī)范化

5.3關(guān)系規(guī)范化關(guān)系數(shù)據(jù)庫中的關(guān)系要滿足一定的要求,滿足不同程度要求的為不同的范式。規(guī)范化的理論是E.F.Codd首先提出的。他認為,一個關(guān)系數(shù)據(jù)庫中的關(guān)系,都應(yīng)滿足一定的規(guī)范,才能構(gòu)造出好的數(shù)據(jù)模式,Codd把應(yīng)滿足的規(guī)范分成幾級,每一級稱為一個范式(NormalForm)。例如滿足最低要求,叫第一范式(1NF);在1NF基礎(chǔ)上又滿足一些要求的叫第二范式(2NF);第二范式中,有些關(guān)系能滿足更多的要求,就屬于第三范式(3NF)。后來Codd和Boyce又共同提出了一個新范式:BC范式(BCNF)。以后又有人提出第四范式(4NF)和第五范式(5NF)。范式的等級越高,應(yīng)滿足的條件也越嚴。5.3.1第一范式(1NF)關(guān)系,作為一張二維表,對它有一個最起碼的要求:每一個分量必須是不可分的數(shù)據(jù)項。滿足了這個條件的關(guān)系模式就屬于第一范式(1NF)。這一限制是在關(guān)系的基本性質(zhì)中提出的,任何關(guān)系都必須遵守。5.3.1第一范式(1NF)例如關(guān)系模式:SLC(Sno,Sdept,Sloc,Cno,Grade)其中Sloc為學(xué)生住處,假設(shè)每個系的學(xué)生住在同一地方。SLC的碼為(Sno,Cno)。函數(shù)依賴包括:

(Sno,Cno)完全→Grade

Sno→Sdept

(Sno,Cno)部分→Sdept

Sno→Sloc

(Sno,Cno)部分→Sloc

Sdept→Sloc(因為每個系只住一個地方)顯然SLC滿足第一范式。5.3.1第一范式(1NF)

SLC關(guān)系存在以下4個問題:①插入異常。②刪除異常。③數(shù)據(jù)冗余度大。④修改復(fù)雜:。

因此,SLC不是一個好的關(guān)系模式。5.3.2第二范式(2NF)第二范式:如果R(U,F)∈1NF,并且R中的每個非主屬性都完全函數(shù)依賴于主碼,則R(U,F)∈2NF把SLC分解為兩個關(guān)系模式:

SC(Sno,Cno,Grade)

SL(Sno,Sdept,Sloc)其中SC的碼為(Sno,Cno),SL的碼為Sno。

顯然,在分解后的關(guān)系模式中,非主屬性都完全函數(shù)依賴于碼了。從而使上述4個問題在一定程度上得到了解決。存在的問題但是將一個1NF關(guān)系分解為多個2NF的關(guān)系,并不能完全消除關(guān)系模式中的各種異常情況和數(shù)據(jù)冗余。也就是說,屬于2NF的關(guān)系模式并不一定是一個好的關(guān)系模式。

例如,2NF關(guān)系模式SL(Sno,Sdept,Sloc)中有下列函數(shù)依賴:

Sno→Sdept

Sdept→Sloc

Sno→Sloc

我們看到,Sloc傳遞函數(shù)依賴于Sno,即SL中存在非主屬性對碼的傳遞函數(shù)依賴。SL關(guān)系中仍然存在插入異常、刪除異常、數(shù)據(jù)冗余度大和修改復(fù)雜的問題。分解辦法首先,對于組成主碼的屬性集合的每一個子集,用它作為主碼構(gòu)成一個表。然后,將依賴于這些主碼的屬性放置到相應(yīng)的表中。最后,去掉只由主碼的子集構(gòu)成的表。分解示例對于S-L-C表,首先分解為如下形式的三張表:

S-L(Sno,…)

C(Cno,…)

S-C(Sno,Cno,…)然后,將依賴于這些主碼的屬性放置到相應(yīng)的表中

S-L(Sno,Sdept,Sloc)

C(Cno)

S-C(Sno,Cno,Grade)最后,去掉只由主碼的子集構(gòu)成的表,最終分解為:S-L(Sno,Sdept,Sloc)S-C(Sno,Cno,Grade)

S-L(Sno,Sdept,Sloc)存在問題數(shù)據(jù)冗余:一個系有多少個學(xué)生就有多少個重復(fù)的Sdept和SLOC;插入異常:當新建一個系時,若還沒有招收學(xué)生,則無法插入;5.3.3第三范式(3NF)定義:如果R(U,F)∈2NF,并且所有非主屬性都不傳遞依賴于主碼,則R(U,F)∈3NF。關(guān)系模式SL出現(xiàn)上述問題的原因是Sloc傳遞函數(shù)依賴于Sno。為了消除該傳遞函數(shù)依賴,可以采用投影分解法,把SL分解為兩個關(guān)系模式:SD(Sno,Sdept)SnoSdeptSD∈3NFDL(Sdept,Sloc)SdeptSloc

DL∈3NF其中SD的碼為Sno,DL的碼為Sdept。

顯然,在分解后的關(guān)系模式中既沒有非主屬性對碼的部分函數(shù)依賴也沒有非主屬性對碼的傳遞函數(shù)依賴,在一定程度上解決了上述4個問題。由于3NF關(guān)系模式中不存在非主碼屬性對主碼的部分依賴和傳遞依賴關(guān)系,因而在數(shù)據(jù)庫設(shè)計中,一般要求達到3NF.5.3.4BCNF范式BCNF也稱Boyce-Codd范式,它是3NF的進一步規(guī)范化,其限制條件更嚴格。例:關(guān)系模式:CSZ(City,Street,Zip)語義:城市和街道可以決定郵政編碼,郵政編碼可以決定城市。候選碼:(City,Street),(Street,Zip)F:{(City,Street)→Zip,Zip→City}即城市、街道決定郵政編碼,郵政編碼決定城市,可用圖表示如下:5.3.4BCNF范式容易看出,(CITY,STREET)和(STREET,ZIP)是兩個候選碼,CITY,STREET,ZIP都是主屬性,沒有非主屬性,CSZ是3NF.但函數(shù)依賴ZIP→CITY的決定因素ZIP不包含碼,所以CSZ不是BCNF存在的問題:插入異常,刪除異常。若無街道信息,則一個郵政編碼是哪個城市中的郵政編碼的信息無法存在數(shù)據(jù)庫中。若將CSZ分解為兩個關(guān)系模式:

ZC(ZIP,CITY) SZ(STREET,ZIP)主要是存在主屬性對非碼的函數(shù)依賴,產(chǎn)生BCNF。5.3.4BCNF范式R∈1NF,且能決定其它屬性取值的屬性(組)必定包含碼,則其是BCNF如果一個關(guān)系的每個決定因素都是候選碼,則其是BCNF如果一個關(guān)系的每個函數(shù)依賴的左部都是候選碼,則其是BCNF如果R∈3NF,并且不存在主屬性對非主屬性的函數(shù)依賴,則其是BCNF5.3.4BCNF范式由BCNF的定義可以得到結(jié)論,一個滿足BCNF的關(guān)系模式有:(1)所有非主屬性對每一個碼都是完全函數(shù)依賴。(2)所有的主屬性對每一個不包含它的碼,也是完全函數(shù)依賴。(3)沒有任何屬性完全函數(shù)依賴于非碼的任何一組屬性。[例如]關(guān)系模式C(CNO,CNAME,PCNO),它只有一個碼CNO,這里沒有任何屬性對CNO部分依賴或傳遞依賴,所以C是3NF。同時C中CNO是唯一的決定因素,所以C是BCNF。又例如關(guān)系模式S(Sno,SName,SDept,SAGE)假定SName也具有唯一性,則S就有兩個碼,這兩個碼都由單個屬性組成,彼此不相交。其他屬性不存在對碼的傳遞依賴與部分依賴,所以S是3NF,同時S中除Sno,SName外沒有其他決定因素,所以S也屬于BCNF。BCNF和3NF的關(guān)系若R∈BCNF,則R∈3NF若R∈3NF,則R不一定屬于BCNF[例如]關(guān)系模式SJP(S,J,P)中,S是學(xué)生,J表示課程,P表示名次。每一個學(xué)生選修每門課程的成績有一定的名次,每門課程中每一名次只有一個學(xué)生(即沒有并列名次)則(S,J)P;(J,P)S所以(S,J)與(J,P)都可作為候選碼.這個關(guān)系模式中顯然沒有屬性對碼傳遞依賴或部分依賴,所以SJP是3NF,而且除了(S,J)與(J,P)以外沒有其他決定因素,所以SJP是BCNF.5.3.5多值依賴與第四范式例:學(xué)校中某一門課程由多個教員講授,他們使用相同的一套參考書。每個教員可以講授多門課程,每種參考書可以供多門課程使用。我們可以用一個非規(guī)范化的關(guān)系來表示教員T,課程C和參考書B之間的關(guān)系假設(shè)該關(guān)系如圖所示:該關(guān)系可用二維表如表所示:課程C教師T參考書B數(shù)學(xué)張軍數(shù)學(xué)分析數(shù)學(xué)張軍高等代數(shù)數(shù)學(xué)張軍微分方程數(shù)學(xué)李斯數(shù)學(xué)分析數(shù)學(xué)李斯高等代數(shù)數(shù)學(xué)李斯微分方程物理王平普通物理學(xué)物理王平光學(xué)原理物理王平普通物理學(xué)物理何強光學(xué)原理物理陳明普通物理學(xué)物理陳明光學(xué)原理………多值依賴Teach具有唯一侯選碼(C,T,B),即全碼,因而Teach∈BCNF。但Teach模式中存在一些問題。①數(shù)據(jù)冗余度大:②增加操作復(fù)雜:③刪除操作復(fù)雜:④修改操作復(fù)雜:

BCNF的關(guān)系模式Teach之所以會產(chǎn)生上述問題,是因為參考書的取值和教師的取值是彼此獨立毫無關(guān)系的,它們都只取決于課程名。也就是說,關(guān)系模式Teach中存在一種稱之為多值依賴的數(shù)據(jù)依賴。多值依賴1、多值依賴設(shè)R(U)是一個屬性一個關(guān)系模式,X,Y和Z是U的子集,并且Z=U-X-Y,多值依賴X→→Y成立當且僅當對R的任一關(guān)系r,r在(X,Z)上的每個值對應(yīng)一組Y的值,這組值僅僅決定于X值而與Z值無關(guān)。若X→→Y,而Z=φ,則稱X→→Y為平凡的多值依賴。否則稱X→→Y為非平凡的多值依賴。多值依賴在Teach關(guān)系中,每個(C,B)上的值對應(yīng)一組T值,而且這種對應(yīng)與B無關(guān)。例如,(C,B)上的一個值(物理,光學(xué)原理)對應(yīng)一組T值{李勇,王軍},這組值僅僅決定于課程C上的值,也就是說對于(C,B)上的另一個值(物理,普通物理學(xué)),它對應(yīng)的一組T值仍是{李勇,王軍},盡管這時參考書B的值已經(jīng)改變了。因此T多值依賴于C,即C→→T。多值依賴也可以形式化地定義如下:在關(guān)系模式R(U)的任一關(guān)系r中,如果對于任意兩個元組t,s有t[X]=s[X],就必存在元組w,v∈r(w和v可以與s和t相同),使得w[X]=v[X]=t[X],而w[Y]=t[Y],w[Z]=s[Z],v[Y]=s[Y],v[Z]=t[Z],即交換s,t元組的Y值所得的兩個新元組必在r中,則稱Y多值依賴于X,記為X→→Y。其中X和Y是U的子集,Z=U-X-Y。多值依賴多值依賴具有下列性質(zhì):①多值依賴具有對稱性。即若X→→Y,則X→→Z,其中Z=U-X-Y。例如,在關(guān)系模式Teach(C,T,B)中,已經(jīng)知道C→→T。根據(jù)多值依賴的對稱性,必然有C→→B。②多值依賴具有傳遞性。即若X→→Y,Y→→Z,則X→→Z→→Y。③函數(shù)依賴可以看作是多值依賴的特殊情況。即若X→Y,則X→→Y。這是因為當X→Y時,對X的每一個值x,Y有一個確定的值y與之對應(yīng),所以X→→Y。④若X→→Y,X→→Z,則X→→YZ。⑤若X→→Y,X→→Z,則X→→Y∩Z。⑥若X→→Y,X→→Z,則X→→Y-Z,X→→Z-Y。⑦多值依賴的有效性與屬性集的范圍有關(guān)。如果X→→Y在U上成立,則在W(XYWU)上一定成立;但X→→Y在W(WU上)成立,在U上并不一定成立。這是因為多值依賴的定義中不僅涉及屬性組X和Y,而且涉及U中其余屬性Z。一般地,如果R的多值依賴X→→Y在W(WU)上成立,則稱X→→Y為R的嵌入型多值依賴。但是函數(shù)依賴X→Y的有效性僅決定于X和Y這兩個屬性集的值,與其他屬性無關(guān)。只要X→Y在屬性集W上成立,則X→Y在屬性集U(WU)上必定成立。⑧若多值依賴X→→Y在R(U)上成立,對于Y′Y,并不一定有X→→Y′成立。但是如果函數(shù)依賴X→→Y在R上成立,則對于任何Y′Y均有X→Y′成立。第四范式(4NF)

關(guān)系模式R<U,F(xiàn)>∈1NF,如果對于R的每個非平凡多值依賴X→→Y(YX),X都含有候選碼,則R∈4NF。

4NF就是限制關(guān)系模式的屬性之間不允許有非平凡且非函數(shù)依賴的多值依賴。因為根據(jù)定義,對于每一個非平凡的多值依賴X→→Y(YX),X都含有候選碼,于是當然X→Y,所以4NF所允許的非平凡多值依賴實際上是函數(shù)依賴。

顯然,如果一個關(guān)系是4NF,則必為BCNF。5.3.5規(guī)范化

從以上討論和引例可以看出,關(guān)系模式的規(guī)范化過程,就是通過關(guān)系的投影分解逐步提高關(guān)系范式等級的過程。從1NF到BCNF,其過程如下圖所示:3NF和BCNF是在函數(shù)依賴的條件下對模式分解所能達到的分離程度的測度。一個模式中的關(guān)系模式如果都屬于BCNF,那么在函數(shù)依賴范疇內(nèi),它已實現(xiàn)了徹底的分離,已消除了插入和刪除的異常。3NF的“不徹底”性表現(xiàn)在可能存在主屬性對碼的部分依賴和傳遞依賴。規(guī)范化舉例設(shè)有關(guān)系模式:Student(學(xué)號,姓名,導(dǎo)師號,導(dǎo)師名,課程號,課程說明,成績)語義:一名學(xué)生只有一個導(dǎo)師,學(xué)生可選多門課。將其規(guī)范化成3NF規(guī)范化舉例1.此表是1NF,其函數(shù)依賴為: 學(xué)號p→姓名,學(xué)號p→導(dǎo)師號,學(xué)號p→導(dǎo)師名,課程號p→課程說明,(學(xué)號,課程號)→成績主碼為(學(xué)號,課程號)存在部分函數(shù)依賴關(guān)系,不是2NF,首先將其分解為2NF。學(xué)生(學(xué)號,姓名,導(dǎo)師號,導(dǎo)師名),課程(課程號,課程說明),成績(學(xué)號,課程號,成績)均為2NF規(guī)范化舉例2.判是否為3NF“學(xué)生”表不是3NF,其函數(shù)依賴為:學(xué)號→姓名,學(xué)號→導(dǎo)師號,導(dǎo)師號p→導(dǎo)師名,∴學(xué)號傳遞→導(dǎo)師名消除依賴于決定者的屬性,把它們放在一個單獨的表中,得到:學(xué)生(學(xué)號,姓名,導(dǎo)師號),導(dǎo)師(導(dǎo)師號,導(dǎo)師名)關(guān)系模式規(guī)范化應(yīng)遵循以下原則:(1)關(guān)系模式進行無損連接分解。關(guān)系模式分解過程中數(shù)據(jù)不能丟失或增加,必須把全局關(guān)系模式中的所有數(shù)據(jù)無損地分解到各個子關(guān)系模式中,以保證數(shù)據(jù)的完整性。(2)合理選擇規(guī)范化程度??紤]到存取效率,低級模式造成的冗余度很大,既浪費了存儲空間,又影響了數(shù)據(jù)的一致性,因此希望一個子模式的屬性越少越好,即取高級范式;若考慮到查詢效率,低級范式又比高級范式好,此時連接運算的代價較小,這是一對矛盾,所以應(yīng)根據(jù)情況,合理選擇規(guī)范化程度。(3)正確性與可實現(xiàn)性原則。關(guān)系模式規(guī)范化的步驟規(guī)范化程度過低的關(guān)系可能會存在插入異常、刪除異常、修改復(fù)雜、數(shù)據(jù)冗余等問題,需要對其進行規(guī)范化,轉(zhuǎn)換成高級范式。但這并不意味著規(guī)范化程度越高的關(guān)系模式就越好。在設(shè)計數(shù)據(jù)庫模式結(jié)構(gòu)時,必須以現(xiàn)實世界的實際情況和用戶應(yīng)用需求作進一步分析,確定一個合適的、能夠反映現(xiàn)實世界的模式。即上面的規(guī)范化步驟可以在其中任何一步終止。5.4關(guān)系模式的分解原則

模式分解要滿足:模式分解具有無損連接性;模式分解能夠保持函數(shù)依賴。

無損連接是指分解后的關(guān)系通過自然連接可以恢復(fù)成原來的關(guān)系,即通過自然連接得到的關(guān)系與原來的關(guān)系相比,既不多出信息、又不丟失信息。

保持函數(shù)依賴分解是指在模式的分解過程中,函數(shù)依賴不能丟失的特性,即模式分解不能破壞原來的語義。5.4關(guān)系模式的分解原則例:S-D-L(Sno,Dept,Loc)有函數(shù)依賴:Sno→Dept,Dept→Loc顯然不是第三范式的。至少可以有三種分解方案,分別為:方案1:S-L(Sno,Loc),D-L(Dept,Loc)方案2:S-D(Sno,Dept),S-L(Sno,Loc)方案3:S-D(Sno,Dept),D-L(Dept,Loc)這三種分解方案得到的關(guān)系模式都是第三范式的,那么如何比較這三種方案的好壞呢?由此在將一個關(guān)系模式分解為多個關(guān)系模式時除了提高規(guī)范化程度之外,還需要考慮其他的一些因素。5.4關(guān)系模式的分解原則將一個關(guān)系模式R<U,F(xiàn)>分解為若干個關(guān)系模式R1<U1,F(xiàn)1>,R2<U2,F(xiàn)2>,…,Rn<Un,F(xiàn)n>,意味著將存儲在一張二維表r中的數(shù)據(jù)分散到了若干個二維表r1,r2,…,rn中。這樣的分解應(yīng)該不丟失信息,即能通過對關(guān)系r1,r2,…,rn的自然連接運算重新得到關(guān)系r中的所有信息。事實上,將關(guān)系r投影為r1,r2,…,rn時不會丟失信息,關(guān)鍵是對r1,r2,…,rn做自然連接時可能產(chǎn)生一些r中原來沒有的元組,從而無法區(qū)別哪些元組是r中原來有的,即數(shù)據(jù)庫中應(yīng)該存在的數(shù)據(jù),哪些是不應(yīng)該有的。在這個意義上就丟失了信息。5.4關(guān)系模式的分解原則這三種分解方案是否都滿足分解要求呢?假設(shè)此關(guān)系模式的數(shù)據(jù)如表所示,此關(guān)系用r表示。Sno

Dept

Loc

S01D1L1S02D2L2S03D2L2S04D3L15.4關(guān)系模式的分解原則若按方案1將S-D-L投影到S-L和D-L的屬性上,得到如左邊兩個表所示的關(guān)系。做自然連接得到結(jié)果如右表所示。Sno

Loc

S01L1S02L2S03L2S04L1Dept

Loc

D1L1D2L2D3L1Sno

Dept

Loc

S01D1L1S01D3L1S02D2L2S03D2L2S04D1L1S04D3L1元組增加了,信息丟失了5.4關(guān)系模式的分解原則無損連接性將關(guān)系模式R<U

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論