




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
數(shù)據(jù)庫范式——通俗易懂【轉(zhuǎn)】
(2012-04-0221:15:43)
數(shù)據(jù)庫范式是數(shù)據(jù)庫設(shè)計中必不可少的知識,沒有對范式的理解,就無法設(shè)計出高效率、優(yōu)雅的數(shù)據(jù)庫。甚至設(shè)
計出錯誤的數(shù)據(jù)庫。而想要理解并掌握范式卻并不是那么容易。教科書中一般以關(guān)系代數(shù)的方法來解釋數(shù)據(jù)庫范
式。這樣做雖然能夠十分準確的表達數(shù)據(jù)庫范式,但比較抽象,不太直觀,不便于理解,更難以記憶。
一、基礎(chǔ)概念
實體:現(xiàn)實世界中客觀存在并可以被區(qū)別的事物。比如“一個學生”、“一木書”、“一門課”等等。值得強調(diào)的
是這里所說的“事物”不僅僅是看得見摸得著的“東西”,它也可以是虛擬的,不如說“老師與學校的關(guān)系
?屬性:教科書上解釋為:”實體所具有的某一特性“,由此可見,屬性一開始是個邏輯概念,比如說,“性
別”是“人”的一個屬性。在關(guān)系數(shù)據(jù)庫中,屬性又是個物理概念,屬性可以看作是“表的一列”。
?元組:表中的一行就是一個元組。
?分量:元組的某個屬性值。在一個關(guān)系數(shù)據(jù)庫中,它是一個操作原子,即關(guān)系數(shù)據(jù)庫在做任何操作的時
候,屬性是“不可分的”。否則就不是關(guān)系數(shù)據(jù)庫了。
?碼:表中可以唯一確定一個元組的某個屬性(或者屬性組),如果這樣的碼有不止一個,那么大家都叫
候選碼,我們從候選碼中挑一個出來做老大,它就叫主碼。
?全碼:如果一個碼包含了所有的屬性,這個碼就是全碼。
?主屬性:一個屬性只要在任何一個候選碼中出現(xiàn)過,這個屬性就是主屬性。
?非主屬性:與上面相反,沒有在任何候選碼中出現(xiàn)過,這個屬性就是非主屬性。
?外碼:一個屬性(或?qū)傩越M),它不是碼,但是它別的表的碼,它就是外碼。
二、6個范式
好了,上面已經(jīng)介紹了我們掌握范式所需要的全部基礎(chǔ)概念,下面我們就來講范式。首先要明白,范式的包含關(guān)
系。一個數(shù)據(jù)庫設(shè)計如果符合第二范式,?定也符合第一范式。如果符合第三范式,一定也符合第二范式…
第一范式(1NF):屬性不可分。
在前面我們已經(jīng)介紹了屬性值的概念,我們說,它是“不可分的而第一范式要求屬性也不可分。那么它和屬性
值不可分有什么區(qū)別呢?給一個例子:
nametelage
大寶22
小明
21
Ps:這個表中,屬性值“分''了。
tel
nameage
手機座機
021—
大寶987654322
010—
小明]23456721
Ps:這個表中,屬性“分”了。
這兩種情況都不滿足第一范式。不滿足第一范式的數(shù)據(jù)庫,不是關(guān)系數(shù)據(jù)庫!所以,我們在任何關(guān)系數(shù)據(jù)庫管理
系統(tǒng)中,做不出這樣的“表'’來。
第二范式(2NF):符合1NF,并且,非主屬性完全依賴丁碼。
聽起來好像很神秘,其實真的沒什么。
一個候選碼中的主屬性也可能是好幾個。如果一個主屬性,它不能單獨做為一個候選碼,那么它也不能確定任何
一個非主屬性。給一個反例:我們考慮一個小學的教務管理系統(tǒng),學生上課指定一個老師,一本教材,一個教室,
一個時間,大家都上課去吧,沒有問題。那么數(shù)據(jù)庫怎么設(shè)計?(學生上課表)
學生課程老師老師職稱教材教室上課時間
小明;譽語文大寶副教授小學語文10114:30
一個學生上一門課,一定在特定某個教室。所以有(學生,課程)一>教室
一個學生上一門課,一定是特定某個老師教。所以有(學生,課程)一>老師
一個學生上一門課,他老師的職稱可以確定。所以有(學生,課程)一>老師職稱
一個學生上一門課,一定是特定某個教材。所以有(學生,課程)一》教材
一個學生上一門課,一定在特定時間。所以有(學生,課程)一〉上課時間
因此(學生,課程)是一個碼。
然而,一個課程,一定指定了某個教材,一年級語文肯定用的是《小學語文1)),那么就有課程一〉教材。(學生,
課程)是個碼,課程卻決定了教材,這就叫做不完全依賴,或者說部分依賴。出現(xiàn)這樣的情況,就不滿足第二范
式!
有什么不好嗎?你可以想想:
1、校長要新增加一門課程叫“微積分”,教材是《大學數(shù)學》,怎么辦?學生還沒選課,而學生又是主屬性,主
屬性不能空,課程怎么記錄呢,教材記到哪呢?……郁悶了吧?(插入異常)
2、下學期沒學生學一年級語文(上)了,學一年級語文(下)去了,那么表中將不存在一年級語文(上),也
就沒了《小學語文1》。這時候,校長問:一年級語文(上)用的什么教材?。俊魫灹税?(刪除異常)
3、校長說:一年級語文(上)換教材,換成《大學語文》。有10000個學生選了這么課,改動好大??!改累死
了……郁悶了吧?(修改異常)
那應該怎么解決呢?投影分解,將一個表分解成兩個或若干個表
學生課程老師(師職教室上課時間
稱
小明語又大寶副教授10114:30
學生上課表新
課程教材
一年級語文(上)《小學語文1》
課程的表第三范式(3NF):符合2NF,并且,消除傳遞依賴
上面的“學生上課表新''符合2NF,可以這樣驗證:兩個主屬性單獨使用,不用確定其它四個非主屬性的任何一個。
但是它有傳遞依賴!
在哪呢?問題就出在“老師”和“老師職稱”這里。一個老師一定能確定一個老師職稱。
有什么問題嗎?想想:
1、老師升級了,變教授了,要改數(shù)據(jù)庫,表中有N條,改了N次……(修改異常)
2、沒人選這個老師的課了,老師的職稱也沒了記錄……(刪除異常)
3、新來一個老師,還沒分配教什么課,他的職稱記到哪?……(插入異常)
那應該怎么解決呢?和上面一樣,投影分解:
學生課程老師教室上課時間
小明一年級語文大寶10114:30
(上)
老師老師職稱
大寶副教授
BC范式(BCNF):符合3NF,并且,主屬性不依賴于主屬性
若關(guān)系模式屬于第一范式,且每個屬性都不傳遞依賴于鍵碼,則R屬于BC范式。
通常
BC范式的條件有多種等價的表述:每個非平凡依賴的左邊必須包含鍵碼;每個決定因素必須包含鍵碼。
BC范式既檢查非主屬性,又檢查生屬性。當只檢查非主屬性時,就成了第三范式。滿足BC范式的關(guān)系都必然
滿足第三范式。
還可以這么說:若一個關(guān)系達到了第三范式,并且它只有一個候選碼,或者它的每個候選碼都是單屬性,則該關(guān)
系自然達到BC范式。
一般,一個數(shù)據(jù)庫設(shè)計符合3NF或BCNF就可以了。在BC范式以上還有第四范式、第五范式。
第四范式:要求把同一表內(nèi)的多對多關(guān)系刪除。
第五范式:從最終結(jié)構(gòu)重新建立原始結(jié)構(gòu)。
但在絕大多數(shù)應用中不需要設(shè)計到這種程度。并且,某些情況下,過于范式化甚至會對數(shù)據(jù)庫的邏輯可讀性和使
用效率起到阻礙。數(shù)據(jù)庫中一定程度的冗余并不一定是壞事情。如果你對第四范式、第五范式感興趣可以看一看
專業(yè)教材,從頭學起,并且忘記我說的一切,以免對你產(chǎn)生誤導
數(shù)據(jù)庫設(shè)計中的一些技巧
1.原始單據(jù)與實體之間的關(guān)系
可以是一對一、一對多、多對多的關(guān)系。在一般情況下,它們是一對一的關(guān)系:
即一張原始單據(jù)對應且只對應一個實體。在特殊情況下,它們可能是一對多或多
對一的關(guān)系,即一張原始單證對應多個實體,或多張原始單證對應一個實體。這
里的實體可以理解為基本表。明確這種對應關(guān)系后,對我們設(shè)計錄入界面大有好
處。
K例口:一份員工履歷資料,在人力資源信息系統(tǒng)中,就對應三個基本表:
員工基本情況表、社會關(guān)系表、工作簡歷表。這就是“一張原始單證對應多個實
體”的典型例子。
2.主鍵與外鍵
一般而言,一個實體不能既無主鍵又無外鍵。在E—R圖中,處于葉子部位的
實體,可以定義主鍵,也可以不定義主鍵(因為它無子孫),但必須要有外鍵(因
為它有父親)。
主鍵與外鍵的設(shè)計,在全局數(shù)據(jù)庫的設(shè)計中,占有重要地位。當全局數(shù)據(jù)庫
的設(shè)計完成以后,有個美國數(shù)據(jù)庫設(shè)計專家說:“鍵,到處都是鍵,除了鍵之外,
什么也沒有",這就是他的數(shù)據(jù)庫設(shè)計經(jīng)驗之談,也反映了他對信息系統(tǒng)核心(數(shù)
據(jù)模型)的高度抽象思想。因為:主鍵是實體的高度抽象,主鍵與外鍵的配對,
表示實體之間的連接。
3.基本表的性質(zhì)
基本表與中間表、臨時表不同,因為它具有如下四個特性:
(1)原子性。基本表中的字段是不可再分解的。
(2)原始性?;颈碇械挠涗浭窃紨?shù)據(jù)(基礎(chǔ)數(shù)據(jù))的記錄。
(3)演繹性。由基本表與代碼表中的數(shù)據(jù),可以派生出所有的輸出數(shù)據(jù)。
(4)穩(wěn)定性。基本表的結(jié)構(gòu)是相對穩(wěn)定的,表中的記錄是要長期保存的。
理解基本表的性質(zhì)后,在設(shè)計數(shù)據(jù)庫時,就能將基本表與中間表、臨時表區(qū)
分開來。
4.范式標準
基本表及其字段之間的關(guān)系,應盡量滿足第三范式。但是,滿足第三范式的
數(shù)據(jù)庫設(shè)計,往往不是最好的設(shè)計。為了提高數(shù)據(jù)庫的運行效率,常常需要降低
范式標準:適當增加冗余,達到以空間換時間的目的。
k例2』:有一張存放商品的基本表,如表1所示。“金額”這個字段的存
在,表明該表的設(shè)計不滿足第三范式,因為“金額”可以由“單價”乘以“數(shù)
量”得到,說明“金額”是冗余字段。但是,增加“金額”這個冗余字段,可以
提高查詢統(tǒng)計的速度,這就是以空間換時間的作法。
在Rose2002中,規(guī)定列有兩種類型:數(shù)據(jù)列和計算列?!敖痤~”這樣的列
被稱為“計算列”,而“單價”和“數(shù)量”這樣的列被稱為“數(shù)據(jù)列”。
表1商品表的表結(jié)構(gòu)
商品名稱商品型號單價數(shù)量金額
電視機29口寸2,50040100,000
1.通俗地理解三個范式
通俗地理解三個范式,對于數(shù)據(jù)庫設(shè)計大有好處。在數(shù)據(jù)庫設(shè)計中,為了更
好地應用三個范式,就必須通俗地理解三個范式(通俗地理解是夠用的理解,并
不是最科學最準確的理解):
第一范式:1NF是對屬性的原子性約束,要求屬性具有原子性,不可再分解;
第二范式:2NF是對記錄的惟一性約束,要求記錄有惟一標識,即實體的惟
一性;
第三范式:3NF是對字段冗余性的約束,即任何字段不能由其他字段派生出
來,它要求字段沒有冗余。
沒有冗余的數(shù)據(jù)庫設(shè)計可以做到。但是,沒有冗余的數(shù)據(jù)庫未必是最好的數(shù)
據(jù)庫,有時為了提高運行效率,就必須降低范式標準,適當保留冗余數(shù)據(jù)。具體
做法是:在概念數(shù)據(jù)模型設(shè)計時遵守第三范式,降低范式標準的工作放到物理數(shù)
據(jù)模型設(shè)計時考慮。降低范式就是增加字段,允許冗余。
6.要善于識別與正確處理多對多的關(guān)系
若兩個實體之間存在多對多的關(guān)系,則應消除這種關(guān)系。消除的辦法是,在
兩者之間增加第三個實體。這樣,原來一個多對多的關(guān)系,現(xiàn)在變?yōu)閮蓚€一對多
的關(guān)系。要將原來兩個實體的屬性合理地分配到三個實體中去。這里的第三個實
體,實質(zhì)上是一個較復雜的關(guān)系,它對應一張基本表。一般來講,數(shù)據(jù)庫設(shè)計工
具不能識別多對多的關(guān)系,但能處理多對多的關(guān)系。
K例3H:在“圖書館信息系統(tǒng)”中,“圖書”是一個實體,“讀者”也是
一個實體。這兩個實體之間的關(guān)系,是一個典型的多對多關(guān)系:一本圖書在不同
時間可以被多個讀者借閱,一個讀者又可以借多本圖書。為此,要在二者之間增
加第三個實體,該實體取名為“借還書”,它的屬性為:借還時間、借還標志(0
表示借書,1表示還書),另外,它還應該有兩個外鍵(“圖書”的主鍵,“讀者”
的主鍵),使它能與“圖書”和“讀者”連接。
7.主鍵PK的取值方法
PK是供程序員使用的表間連接工具,可以是一無物理意義的數(shù)字串,由程
序自動加1來實現(xiàn)。也可以是有物理意義的字段名或字段名的組合。不過前者比
后者好。當PK是字段名的組合時,建議字段的個數(shù)不要太多,多了不但索引占
用空間大,而且速度也慢。
8.正確認識數(shù)據(jù)冗余
主鍵與外鍵在多表中的重復出現(xiàn),不屬于數(shù)據(jù)冗余,這個概念必須清楚,事
實上有許多人還不清楚。非鍵字段的重復出現(xiàn),才是數(shù)據(jù)冗余!而且是一種低級
冗余,即重復性的冗余。高級冗余不是字段的重復出現(xiàn),而是字段的派生出現(xiàn)。
k例4』:商品中的“單價、數(shù)量、金額”三個字段,“金額”就是由“單
價”乘以“數(shù)量”派生出來的,它就是冗余,而且是一種高級冗余。冗余的目的
是為了提高處理速度。只有低級冗余才會增加數(shù)據(jù)的不一致性,因為同一數(shù)據(jù),
可能從不同時間、地點、角色上多次錄入。因此,我們提倡高級冗余(派生性冗
余),反對低級冗余(重復性冗余)。
9.E—R圖沒有標準答案
信息系統(tǒng)的E—R圖沒有標準答案,因為它的設(shè)計與畫法不是惟一的,只要
它覆蓋了系統(tǒng)需求的業(yè)務范圍和功能內(nèi)容,就是可行的。反之要修改E—R圖。
盡管它沒有惟一的標準答案,并不意味著可以隨意設(shè)計。好的E—R圖的標準是:
結(jié)構(gòu)清晰、關(guān)聯(lián)簡潔、實體個數(shù)適中、屬性分配合理、沒有低級冗余。
10.視圖技術(shù)在數(shù)據(jù)庫設(shè)計中很有用
與基本表、代碼表、中間表不同,視圖是一種虛表,它依賴數(shù)據(jù)源的實表而
存在。視圖是供程序員使用數(shù)據(jù)庫的一個窗口,是基表數(shù)據(jù)綜合的一種形式,是
數(shù)據(jù)處理的一種方法,是用戶數(shù)據(jù)保密的一種手段。為了進行復雜處理、提高運
算速度和節(jié)省存儲空間,視圖的定義深度一般不得超過三層。若三層視圖仍不夠
用,則應在視圖上定義臨時表,在臨時表上再定義視圖。這樣反復交迭定義,視
圖的深度就不受限制了。
對于某些與國家政治、經(jīng)濟、技術(shù)、軍事和安全利益有關(guān)的信息系統(tǒng),視圖
的作用更加重要。這些系統(tǒng)的基本表完成物理設(shè)計之后,立即在基本表上建立第
一層視圖,這層視圖的個數(shù)和結(jié)構(gòu),與基本表的個數(shù)和結(jié)構(gòu)是完全相同。并且規(guī)
定,所有的程序員,一律只準在視圖上操作。只有數(shù)據(jù)庫管理員,帶著多個人員
共同掌握的“安全鑰匙”,才能直接在基本表上操作。請讀者想想:這是為什么?
11.中間表、報表和臨時表
中間表是存放統(tǒng)計數(shù)據(jù)的表,它是為數(shù)據(jù)倉庫、輸出報表或查詢結(jié)果而設(shè)計
的,有時它沒有主鍵與外鍵(數(shù)據(jù)倉庫除外)。臨時表是程序員個人設(shè)計的,存放
臨時記錄,為個人所用?;砗椭虚g表由DBA維護,臨時表由程序員自己用程序
自動維護。
12.完整性約束表現(xiàn)在三個方面
域的完整性:用Check來實現(xiàn)約束,在數(shù)據(jù)庫設(shè)計工具中,對字段的取值范
圍進行定義時,有一個Check按鈕,通過它定義字段的值城。
參照完整性:用PK、FK、表級觸發(fā)器來實現(xiàn)。
用戶定義完整性:它是一些業(yè)務規(guī)則,用存儲過程和觸發(fā)器來實現(xiàn)。
13.防止數(shù)據(jù)庫設(shè)計打補丁的方法是“三少原則”
(1)一個數(shù)據(jù)庫中表的個數(shù)越少越好。只有表的個數(shù)少了,才能說明系統(tǒng)
的E-R圖少而精,去掉了重復的多余的實體,形成了對客觀世界的高度抽象,
進行了系統(tǒng)的數(shù)據(jù)集成,防止了打補丁式的設(shè)計;
(2)一個表中組合主鍵的字段個數(shù)越少越好。因為主鍵的作用,一是建主
鍵索引,二是做為子表的外鍵,所以組合主鍵的字段個數(shù)少了,不僅節(jié)省了運行
時間,而且節(jié)省了索引存儲空間;
(3)一個表中的字段個數(shù)越少越好。只有字段的個數(shù)少了,才能說明在系
統(tǒng)中不存在數(shù)據(jù)重復,且很少有數(shù)據(jù)冗余,更重要的是督促讀者學會“列變行”,
這樣就防止了將子表中的字段拉入到主表中去,在主表中留下許多空余的字段。
所謂‘'列變行",就是將主表中的一部分內(nèi)容拉出去,另外單獨建一個子表。這
個方法很簡單,有的人就是不習慣、不采納、不執(zhí)行。
數(shù)據(jù)庫設(shè)計的實用原則是:在數(shù)據(jù)冗余和處理速度之間找到合適的平衡點。
“三少”是一個整體概念,綜合觀點,不能孤立某一個原則。該原則是相對的,
不是絕對的?!叭唷痹瓌t肯定是錯誤的。試想:若覆蓋系統(tǒng)同樣的功能,一百
個實體(共一千個屬性)的E—R圖,肯定比二百個實體(共二千個屬性)的E—R
圖,要好得多。
提倡“三少”原則,是叫讀者學會利用數(shù)據(jù)庫設(shè)計技術(shù)進行系統(tǒng)的數(shù)據(jù)集
成。數(shù)據(jù)集成的步驟是將文件系統(tǒng)集成為應用數(shù)據(jù)庫,將應用數(shù)據(jù)庫集成為主題
數(shù)據(jù)庫,將主題數(shù)據(jù)庫集成為全局綜合數(shù)據(jù)庫。集成的程度越高,數(shù)據(jù)共享性就
越強,信息孤島現(xiàn)象就越少,整個企業(yè)信息系統(tǒng)的全局E—R圖中實體的個數(shù)、
主鍵的個數(shù)、屬性的個數(shù)就會越少。
提倡“三少”原則的目的,是防止讀者利用打補丁技術(shù),不斷地對數(shù)據(jù)庫進
行增刪改,使企業(yè)數(shù)據(jù)庫變成了隨意設(shè)計數(shù)據(jù)庫表的“垃圾堆”,或數(shù)據(jù)庫表的
“大雜院”,最后造成數(shù)據(jù)庫中的基本表、代碼表、中間表、臨時表雜亂無章,
不計其數(shù),導致企事業(yè)單位的信息系統(tǒng)無法維護而癱瘓。
“三多”原則任何人都可以做到,該原則是“打補丁方法”設(shè)計數(shù)據(jù)庫的
歪理學說?!叭佟痹瓌t是少而精的原則,它要求有較高的數(shù)據(jù)庫設(shè)計技巧與藝
術(shù),不是任何人都能做到的,因為該原則是杜絕用“打補丁方法”設(shè)計數(shù)據(jù)庫的
理論依據(jù)。
14.提高數(shù)據(jù)庫運行效率的辦法
在給定的系統(tǒng)硬件和系統(tǒng)軟件條件下,提高數(shù)據(jù)庫系統(tǒng)的運行效率的辦法
是:
(1)在數(shù)據(jù)庫物理設(shè)計時,降低范式,增加冗余,少用觸發(fā)器,多用存儲
過程。
(2)當計算非常復雜、而且記錄條數(shù)非常巨大時(例如一千萬條),復雜計
算要先在數(shù)據(jù)庫外面,以文件系統(tǒng)方式用C++語言計算處理完成之后,最后才入
庫追加到表中去。這是電信計費系統(tǒng)設(shè)計的經(jīng)驗。
(3)發(fā)現(xiàn)某個表的記錄太多,例如超過一千萬條,則要對該表進行水平分
割。水平分割的做法是,以該表主鍵PK的某個值為界線,將該表的記錄水平分
割為兩個表。若發(fā)現(xiàn)某個表的字段太多,例如超過八十個,則垂直分割該表,將
原來的一個表分解為兩個表。
(4)對數(shù)據(jù)庫管理系統(tǒng)DBMS進行系統(tǒng)優(yōu)化,即優(yōu)化各種系統(tǒng)參數(shù),如緩沖
區(qū)個數(shù)。
(5)在使用面向數(shù)據(jù)的SQL語言進行程序設(shè)計時,盡量采取優(yōu)化算法。
總之,要提高數(shù)據(jù)庫的運行效率,必須從數(shù)據(jù)庫系統(tǒng)級優(yōu)化、數(shù)據(jù)庫設(shè)計級
優(yōu)化、程序?qū)崿F(xiàn)級優(yōu)化,這三個層次上同時下功夫。
上述十四個技巧,是許多人在大量的數(shù)據(jù)庫分析與設(shè)計實踐中,逐步總結(jié)出
來的。對于這些經(jīng)驗的運用,讀者不能生幫硬套,死記硬背,而要消化理解,實
事求是,靈活掌握
關(guān)系數(shù)據(jù)庫規(guī)范化理論
1.1函數(shù)依賴
1.1.1函數(shù)依賴的基本概念
定義1.1:設(shè)R(U)是屬性集U上的關(guān)系模式。X,丫是U的子集。若對于R(U)的任意一個可能的關(guān)系r,tl,t2
是r中的任意兩個元組,如果由tl[X]=t2[X]Ttl[Y]=t2[Y],(即不可能存在兩個元組在X上的屬性值相等,而在Y
上的屬性值不等)則稱X函數(shù)確定Y或Y函數(shù)依賴于X,記作X-Y。
1.1.2一些術(shù)語和記號
設(shè)R(U)是屬性集U上的關(guān)系模式。X,Y是U的子集。
X-Y,但Y不包含于X則稱X-Y是非平凡的函數(shù)依賴。
若不特別聲明,我們總是討論非平凡的函數(shù)依賴。
X但YGX則稱X?Y是平凡的函數(shù)依*
若X-Y,則X叫做決定因子。
若X-Y,Y-X,則記作X--X
若Y刁
例:判斷以下函數(shù)依賴的對錯
?sno-sname,eno—cname,(sno,eno)-grade
?sname-*sno,Sno-*cno,sno-*Cname
補充:屬性間的聯(lián)系決定函數(shù)依賴關(guān)系
設(shè)X、Y均是U的f集
?X和Y間聯(lián)系是1:1,則XfY,Y—X。
?X和Y間聯(lián)系是M:l,則X-Y。
?X和Y間聯(lián)系是M:N,則X、Y間不存在函數(shù)依賴。
例:STUDENTS(SNO,SNAMEZSSEXZSAGEZSDEPT,SPLACE)
XY
SNO-(SNAME,SSEXZSAGE)
SNO-SPLACE
SPLACE-SDEPT
SSEX-SDEPT
例:設(shè)關(guān)系X,Y,W為關(guān)系R中的三個屬性組,屬性關(guān)系如下圖所示,問X-Y,X-W,WfY
w
X
各屬上述何種函數(shù)依賴:
X-Y為平凡函數(shù)依賴
X-W,WfY為非平凡函數(shù)依賴
補充:
定義1.2:在R(U)中,如果X-Y,并且對于X的任何一個真子集X',都有X'“Y,則稱Y對X完全函數(shù)依賴,
記作:X-Yo
若X-Y,但Y不完全函數(shù)依賴于X,則稱Y對X部分函數(shù)依賴,記作X上二Yo
(一般,1:1為完全函數(shù)依賴,m:l為部分函數(shù)依賴)
定義13在R(U)中,如果X-Y,(Y?X),Y?X,YfZ,則稱Z對X傳遞函數(shù)依賴。
1.2關(guān)系規(guī)范化
定義1.4設(shè)K為R(U,F)中的屬性或?qū)傩越M合,若K-U則K為R的候選碼。
主碼:若候選碼多于一個,則選定其中的一個為主碼(Primarykey)
主屬性:包含在任何一個候選碼中的屬性,叫做主屬性(Primeattribute)
非主屬性:不包含在任何碼中的屬性稱為非主屬性(Nonprimeattribute)
最簡單的情況:單個屬性是碼。
最極端的情況:整個屬性組是碼崩;為全碼(All-key)
例:關(guān)系模式R(P,W,A),屬性P表示演奏者,W表示作品,A表示聽眾。假設(shè)一個演奏者可以演奏多個作品,某
一作品可被多個演奏者演奏。聽眾也可以欣賞不同演奏者的不同作品,這個關(guān)系模式的碼為(P,W,A),即All-key.
定義L5關(guān)系模式R中屬性或?qū)傩越MX并非R的碼,但X是另一個關(guān)系模式的碼,則稱X是R的外部碼
(Foreignkey)也稱外碼。
主碼與外部碼提供了一個表示關(guān)系間聯(lián)系的手段。
范式
關(guān)系模式滿足的確定約束條件稱為范式,根據(jù)滿足約束條件的級別不同,范式由低到高分為
1NF,2NF,3NF,BCNF,4NF,5NF等。不同的級別范式性質(zhì)不同。滿足最低要求的叫第一范式,簡稱INF。在第一范式
中滿足進一步要求的為第二范式,其余以此類推。
R為第幾范式就可以寫成RexNF,
對于各種范式之間的聯(lián)系有5NFU4NFUBCNFU3NFU2NFUINF成立。
一個低一級范式的關(guān)系模式,通過模式分解可以轉(zhuǎn)換為若干個高一級范式的關(guān)系模式的集合,這種過程就叫
規(guī)范化。
一、第一范式(1NF)
關(guān)系模式的的每一個屬性都是不可再分的,則該關(guān)系模式稱為第一范式。
例1:
A1,A2,A&…人如…,An
/\
A
Akik2
例2:工資(工號,姓名,工資(基本工資,年績津貼,煤電補貼))
△不滿足1NF的關(guān)系稱為非規(guī)范化關(guān)系。
△關(guān)系數(shù)據(jù)模型不能存儲上兩個例子(非規(guī)范化關(guān)系)
在關(guān)系數(shù)據(jù)庫中不允許非規(guī)范化關(guān)系的存在。
二、第二范式
若RWINF,且每一個非主屬性完全函數(shù)依賴于碼,則RE2NF,
例:關(guān)系模式S-L-C(SNO,SDEPT,SLOC,CNO,G)中SLOC為學生的住處,并且每個系的學生住在同一
個地方。
這里主碼為(SNO,CNO),函數(shù)依賴有:
(SNO,CNO)-G)
P
SNO-*SDEPT(SNOZCNO)—?SDEPT
SNO-SLOC(SNO,CNO)旦^SLOC,
一個關(guān)系模式R不屬于2NF,就會產(chǎn)生插入異常(如沒有選課的學生記錄插不進去)、刪除異常(刪除選課記
錄會將學生信息刪除)、冗余度大(如系、地址都重復存放)。
分析上面的例子,可以發(fā)現(xiàn)問題在于有兩種非主屬性。一種如G,它對碼是完全函數(shù)依賴。另一種如SDEPT、
SLOC對碼不是完全函數(shù)依賴。解決的辦法是用投影分解把關(guān)系模式S-L-C分解為兩個關(guān)系模式。
SC(SNO,CNO,G)
S-L(SNO,SDEPT,SLOC)
關(guān)系模式SC的碼為(SNO,CNO),關(guān)系模式S-L的碼為SNO,這樣就使得非主屬性對碼都是完全函數(shù)依賴
二、第二氾式
關(guān)系模式R〈U,F〉中若不存在這樣的碼X,屬性組Y及非主屬性Z(ZY)使得X~Y,(YX)Y-Z,成立,即如果
R的任何一個非主屬性都不傳遞依賴于它的任何一個侯選關(guān)鍵字,則稱R〈U,F>£3NFo
可以證明,若R£3NF,則每一個非主屬性既不部分依賴于碼也不傳遞依賴于碼。
在關(guān)系模式SC沒有傳遞依賴,關(guān)系模式S-L存在非主屬性對碼傳遞依賴。在S-L中,由SNO-SDEPT,(SDEPT
SNO),SDEPT~SLOC,可得SNOSLOC。因此SCW3NF,而S-L3NF。
一個關(guān)系模式R若不是3NF,就會產(chǎn)生插入異常、刪除異常、冗余度大等問題。
解決的辦法同樣是將S-L分解為:
S-D(SNOZSDEPT)
D-L(SDEPTZSLOC)
分解后的關(guān)系模式S-D與D?L中不再存在傳遞依賴。
四、BC范式
關(guān)系模式R〈U,F〉W1NF。若X-Y且Y?X時X必含有碼,則R〈U,F>《BCNF。也就是詡關(guān)系模式R〈U,F〉
中,若每一個決定因素都包含碼,則R<UZF>eBCNFo
由BCNF的定義可以得到以下結(jié)論:
下面用幾個例子說明屬于3NF的關(guān)系模式有的屬于BCNF,但有的不屬于BCNFo
例1:關(guān)系模式SJP(S,J,P)中,S是學生,J表示課程,P表示名次。每一個學生選修每門課程的成績有一定的
名次,每門課程中每一名次只有一個學生(即沒有并列名次)。由語義可得到下面的函數(shù)依賴:
(SJ)-P,o,p)fs
所以(S,J)與(J,P)都可以作為候選碼。這兩個碼各由兩個屬性組成,而且它們是相交的。這個關(guān)系模式中顯然
沒有屬性對碼傳遞依賴或部分依賴。所以SJP£3NF,而且除(S,J)與。P)以外沒有其它決定因素,所以SJPGBCNFo
例2:關(guān)系模式STJ(S,T,J)中,S表示學生,T表示教師,J表示課程。每一教師只教一門課。每門課有若干教
師,某一學生選定某門課,就對應一個固定的教師。由語義可得到如下的函數(shù)依賴。
(S,J)-T,(S,T)-J
是第三范式,但是存在T-J,而T不是碼,所以不是了BC范式。
第三節(jié)關(guān)系模式的分解準則
1.3關(guān)系模式的分解準則
關(guān)系模式的規(guī)范化過程是通過對關(guān)系模式的分解來實現(xiàn)的。把低一級的關(guān)系模式分解
為若干個高一級的關(guān)系模式。這種分解不是唯一的。
1NF
|消除非主屬,性對碼的部分函數(shù)依賴
2NF
消除決定^<
|消除非主屬,性7寸碼的傳遞函數(shù)依賴
非碣相評凡3NF
|消除主屬,性對碼的部分和傳遞函數(shù)依賴
函數(shù)依賴
BCNF
I消除非平凡且非函數(shù)依賴的多值依賴
4NF
一個低級范式的關(guān)系模式,通過分解(投影)方法可轉(zhuǎn)換成多個高一級范式的關(guān)系模
式的集合,這種過程稱為規(guī)范化。
規(guī)范化的方式是進行模式分解,模式分解的原則是與原模式等價,模式分解的標準是:
?模式分解具有無損連接性
?模式分解能夠保持函數(shù)依賴
見P70頁表格
舉例:關(guān)系規(guī)范化過程
第一范式(1NF):如果一關(guān)系模式,它的每一個分量是不可分的數(shù)據(jù)項,即其域為簡
單域,則此關(guān)系模式為第一范式。
例:將學生簡歷及選課等數(shù)據(jù)設(shè)計成一個關(guān)系模式STUDENT,其表示為:
STUDENT(SNO,SNAME,AGE,SEX,CLASS,DEPTNO,DEPTNAME,CNO,
CNAMEZSCORE,CREDIT)
設(shè)該關(guān)系模式滿足下列函數(shù)依賴:
F={SNO->SNAMEZSNO->AGEZSNO->SEXZ
SN。一>CLASS,CLASS--〉DEPTNO,DEPTNO->DEPTNAME,
CNO->CNAMEZSNO.CNO->SCOREZCNO->CREDIT}
由于該關(guān)系模式的每一屬性對應的域為簡單域,即其域值不可再分,符合第一范式定
義,所以STUDENT關(guān)系模式為第一范式。
第二范式(2NF):若關(guān)系模式R?1NF,且每個非主屬性完全函數(shù)依賴丁碼,則稱R?2NF。
分析一下關(guān)系模式STUDENT,它是不是2NF?
屬性組(SNO,CNO)為關(guān)系STUDENT的碼。
例如:SNAME非主屬性,根據(jù)碼的特性具有:SNO.CNO77SNAME
根據(jù)STUDENT關(guān)系模式已知函數(shù)依賴集,下列函數(shù)依賴成立:SNO??SNAME
所以對碼是部分函數(shù)依賴。同樣方法可得到除屬
SNO.CNO??SNAMEZSNAMESCORE
性外,其它非主屬性對碼也都是部分函數(shù)依賴。所以STUDENT關(guān)系模式不是2NF。
當關(guān)系模式R是1NF而不是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電池在移動醫(yī)療領(lǐng)域的應用考核試卷
- 醫(yī)療機構(gòu)使用藥品質(zhì)量安全監(jiān)督檢查標準表
- 2025年ACCA國際注冊會計師考試真題卷二十一
- 2025年美發(fā)師中級實操考核試卷實操技能實操訓練與改進
- 2025年中學教師資格證考試心理輔導案例題解析及答案集錦
- 2025年中學教師資格《綜合素質(zhì)》教育教學反思與總結(jié)模擬試題解析與答案
- 吉林航空職業(yè)技術(shù)學院《建筑設(shè)計6》2023-2024學年第二學期期末試卷
- 貴州職業(yè)技術(shù)學院《智慧水利》2023-2024學年第二學期期末試卷
- 四川電子機械職業(yè)技術(shù)學院《深度學習前沿》2023-2024學年第二學期期末試卷
- 天津濱海職業(yè)學院《園藝病蟲害》2023-2024學年第一學期期末試卷
- 2024年農(nóng)藝師考試實務考核試題及答案
- 縱隔惡性腫瘤護理查房
- 山東省煙臺市芝罘區(qū)(五四制)2022-2023學年七年級下學期期中考試英語試題及答案
- 2024年貴州省交通運輸廳所屬事業(yè)單位招聘考試真題
- 深度學習入門試題及答案概述
- 固定資產(chǎn)管理制度實施細則
- 統(tǒng)編版語文五年級下冊習作《形形色色的人》精美課件
- 急診科與住院部臨床科室的患者交接制度與流程
- 2024-2025學年人教版數(shù)學八年級下冊期中檢測卷(含答案)
- (正式版)JBT 14449-2024 起重機械焊接工藝評定
- 突發(fā)性聾診療指南
評論
0/150
提交評論