數(shù)據(jù)庫(kù)系統(tǒng)(雙語(yǔ))復(fù)習(xí)專講-數(shù)據(jù)庫(kù)范式_第1頁(yè)
數(shù)據(jù)庫(kù)系統(tǒng)(雙語(yǔ))復(fù)習(xí)專講-數(shù)據(jù)庫(kù)范式_第2頁(yè)
數(shù)據(jù)庫(kù)系統(tǒng)(雙語(yǔ))復(fù)習(xí)專講-數(shù)據(jù)庫(kù)范式_第3頁(yè)
數(shù)據(jù)庫(kù)系統(tǒng)(雙語(yǔ))復(fù)習(xí)專講-數(shù)據(jù)庫(kù)范式_第4頁(yè)
數(shù)據(jù)庫(kù)系統(tǒng)(雙語(yǔ))復(fù)習(xí)專講-數(shù)據(jù)庫(kù)范式_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)庫(kù)范式——通俗易懂【轉(zhuǎn)】

(2012-04-0221:15:43)

數(shù)據(jù)庫(kù)范式是數(shù)據(jù)庫(kù)設(shè)計(jì)中必不可少的知識(shí),沒(méi)有對(duì)范式的理解,就無(wú)法設(shè)計(jì)出高效率、優(yōu)雅的數(shù)據(jù)庫(kù)。甚至設(shè)

計(jì)出錯(cuò)誤的數(shù)據(jù)庫(kù)。而想要理解并掌握范式卻并不是那么容易。教科書中一般以關(guān)系代數(shù)的方法來(lái)解釋數(shù)據(jù)庫(kù)范

式。這樣做雖然能夠十分準(zhǔn)確的表達(dá)數(shù)據(jù)庫(kù)范式,但比較抽象,不太直觀,不便于理解,更難以記憶。

一、基礎(chǔ)概念

實(shí)體:現(xiàn)實(shí)世界中客觀存在并可以被區(qū)別的事物。比如“一個(gè)學(xué)生”、“一木書”、“一門課”等等。值得強(qiáng)調(diào)的

是這里所說(shuō)的“事物”不僅僅是看得見(jiàn)摸得著的“東西”,它也可以是虛擬的,不如說(shuō)“老師與學(xué)校的關(guān)系

?屬性:教科書上解釋為:”實(shí)體所具有的某一特性“,由此可見(jiàn),屬性一開始是個(gè)邏輯概念,比如說(shuō),“性

別”是“人”的一個(gè)屬性。在關(guān)系數(shù)據(jù)庫(kù)中,屬性又是個(gè)物理概念,屬性可以看作是“表的一列”。

?元組:表中的一行就是一個(gè)元組。

?分量:元組的某個(gè)屬性值。在一個(gè)關(guān)系數(shù)據(jù)庫(kù)中,它是一個(gè)操作原子,即關(guān)系數(shù)據(jù)庫(kù)在做任何操作的時(shí)

候,屬性是“不可分的”。否則就不是關(guān)系數(shù)據(jù)庫(kù)了。

?碼:表中可以唯一確定一個(gè)元組的某個(gè)屬性(或者屬性組),如果這樣的碼有不止一個(gè),那么大家都叫

候選碼,我們從候選碼中挑一個(gè)出來(lái)做老大,它就叫主碼。

?全碼:如果一個(gè)碼包含了所有的屬性,這個(gè)碼就是全碼。

?主屬性:一個(gè)屬性只要在任何一個(gè)候選碼中出現(xiàn)過(guò),這個(gè)屬性就是主屬性。

?非主屬性:與上面相反,沒(méi)有在任何候選碼中出現(xiàn)過(guò),這個(gè)屬性就是非主屬性。

?外碼:一個(gè)屬性(或?qū)傩越M),它不是碼,但是它別的表的碼,它就是外碼。

二、6個(gè)范式

好了,上面已經(jīng)介紹了我們掌握范式所需要的全部基礎(chǔ)概念,下面我們就來(lái)講范式。首先要明白,范式的包含關(guān)

系。一個(gè)數(shù)據(jù)庫(kù)設(shè)計(jì)如果符合第二范式,?定也符合第一范式。如果符合第三范式,一定也符合第二范式…

第一范式(1NF):屬性不可分。

在前面我們已經(jīng)介紹了屬性值的概念,我們說(shuō),它是“不可分的而第一范式要求屬性也不可分。那么它和屬性

值不可分有什么區(qū)別呢?給一個(gè)例子:

nametelage

大寶22

小明

21

Ps:這個(gè)表中,屬性值“分''了。

tel

nameage

手機(jī)座機(jī)

021—

大寶987654322

010—

小明]23456721

Ps:這個(gè)表中,屬性“分”了。

這兩種情況都不滿足第一范式。不滿足第一范式的數(shù)據(jù)庫(kù),不是關(guān)系數(shù)據(jù)庫(kù)!所以,我們?cè)谌魏侮P(guān)系數(shù)據(jù)庫(kù)管理

系統(tǒng)中,做不出這樣的“表'’來(lái)。

第二范式(2NF):符合1NF,并且,非主屬性完全依賴丁碼。

聽(tīng)起來(lái)好像很神秘,其實(shí)真的沒(méi)什么。

一個(gè)候選碼中的主屬性也可能是好幾個(gè)。如果一個(gè)主屬性,它不能單獨(dú)做為一個(gè)候選碼,那么它也不能確定任何

一個(gè)非主屬性。給一個(gè)反例:我們考慮一個(gè)小學(xué)的教務(wù)管理系統(tǒng),學(xué)生上課指定一個(gè)老師,一本教材,一個(gè)教室,

一個(gè)時(shí)間,大家都上課去吧,沒(méi)有問(wèn)題。那么數(shù)據(jù)庫(kù)怎么設(shè)計(jì)?(學(xué)生上課表)

學(xué)生課程老師老師職稱教材教室上課時(shí)間

小明;譽(yù)語(yǔ)文大寶副教授小學(xué)語(yǔ)文10114:30

一個(gè)學(xué)生上一門課,一定在特定某個(gè)教室。所以有(學(xué)生,課程)一>教室

一個(gè)學(xué)生上一門課,一定是特定某個(gè)老師教。所以有(學(xué)生,課程)一>老師

一個(gè)學(xué)生上一門課,他老師的職稱可以確定。所以有(學(xué)生,課程)一>老師職稱

一個(gè)學(xué)生上一門課,一定是特定某個(gè)教材。所以有(學(xué)生,課程)一》教材

一個(gè)學(xué)生上一門課,一定在特定時(shí)間。所以有(學(xué)生,課程)一〉上課時(shí)間

因此(學(xué)生,課程)是一個(gè)碼。

然而,一個(gè)課程,一定指定了某個(gè)教材,一年級(jí)語(yǔ)文肯定用的是《小學(xué)語(yǔ)文1)),那么就有課程一〉教材。(學(xué)生,

課程)是個(gè)碼,課程卻決定了教材,這就叫做不完全依賴,或者說(shuō)部分依賴。出現(xiàn)這樣的情況,就不滿足第二范

式!

有什么不好嗎?你可以想想:

1、校長(zhǎng)要新增加一門課程叫“微積分”,教材是《大學(xué)數(shù)學(xué)》,怎么辦?學(xué)生還沒(méi)選課,而學(xué)生又是主屬性,主

屬性不能空,課程怎么記錄呢,教材記到哪呢?……郁悶了吧?(插入異常)

2、下學(xué)期沒(méi)學(xué)生學(xué)一年級(jí)語(yǔ)文(上)了,學(xué)一年級(jí)語(yǔ)文(下)去了,那么表中將不存在一年級(jí)語(yǔ)文(上),也

就沒(méi)了《小學(xué)語(yǔ)文1》。這時(shí)候,校長(zhǎng)問(wèn):一年級(jí)語(yǔ)文(上)用的什么教材???……郁悶了吧?(刪除異常)

3、校長(zhǎng)說(shuō):一年級(jí)語(yǔ)文(上)換教材,換成《大學(xué)語(yǔ)文》。有10000個(gè)學(xué)生選了這么課,改動(dòng)好大??!改累死

了……郁悶了吧?(修改異常)

那應(yīng)該怎么解決呢?投影分解,將一個(gè)表分解成兩個(gè)或若干個(gè)表

學(xué)生課程老師(師職教室上課時(shí)間

小明語(yǔ)又大寶副教授10114:30

學(xué)生上課表新

課程教材

一年級(jí)語(yǔ)文(上)《小學(xué)語(yǔ)文1》

課程的表第三范式(3NF):符合2NF,并且,消除傳遞依賴

上面的“學(xué)生上課表新''符合2NF,可以這樣驗(yàn)證:兩個(gè)主屬性單獨(dú)使用,不用確定其它四個(gè)非主屬性的任何一個(gè)。

但是它有傳遞依賴!

在哪呢?問(wèn)題就出在“老師”和“老師職稱”這里。一個(gè)老師一定能確定一個(gè)老師職稱。

有什么問(wèn)題嗎?想想:

1、老師升級(jí)了,變教授了,要改數(shù)據(jù)庫(kù),表中有N條,改了N次……(修改異常)

2、沒(méi)人選這個(gè)老師的課了,老師的職稱也沒(méi)了記錄……(刪除異常)

3、新來(lái)一個(gè)老師,還沒(méi)分配教什么課,他的職稱記到哪?……(插入異常)

那應(yīng)該怎么解決呢?和上面一樣,投影分解:

學(xué)生課程老師教室上課時(shí)間

小明一年級(jí)語(yǔ)文大寶10114:30

(上)

老師老師職稱

大寶副教授

BC范式(BCNF):符合3NF,并且,主屬性不依賴于主屬性

若關(guān)系模式屬于第一范式,且每個(gè)屬性都不傳遞依賴于鍵碼,則R屬于BC范式。

通常

BC范式的條件有多種等價(jià)的表述:每個(gè)非平凡依賴的左邊必須包含鍵碼;每個(gè)決定因素必須包含鍵碼。

BC范式既檢查非主屬性,又檢查生屬性。當(dāng)只檢查非主屬性時(shí),就成了第三范式。滿足BC范式的關(guān)系都必然

滿足第三范式。

還可以這么說(shuō):若一個(gè)關(guān)系達(dá)到了第三范式,并且它只有一個(gè)候選碼,或者它的每個(gè)候選碼都是單屬性,則該關(guān)

系自然達(dá)到BC范式。

一般,一個(gè)數(shù)據(jù)庫(kù)設(shè)計(jì)符合3NF或BCNF就可以了。在BC范式以上還有第四范式、第五范式。

第四范式:要求把同一表內(nèi)的多對(duì)多關(guān)系刪除。

第五范式:從最終結(jié)構(gòu)重新建立原始結(jié)構(gòu)。

但在絕大多數(shù)應(yīng)用中不需要設(shè)計(jì)到這種程度。并且,某些情況下,過(guò)于范式化甚至?xí)?duì)數(shù)據(jù)庫(kù)的邏輯可讀性和使

用效率起到阻礙。數(shù)據(jù)庫(kù)中一定程度的冗余并不一定是壞事情。如果你對(duì)第四范式、第五范式感興趣可以看一看

專業(yè)教材,從頭學(xué)起,并且忘記我說(shuō)的一切,以免對(duì)你產(chǎn)生誤導(dǎo)

數(shù)據(jù)庫(kù)設(shè)計(jì)中的一些技巧

1.原始單據(jù)與實(shí)體之間的關(guān)系

可以是一對(duì)一、一對(duì)多、多對(duì)多的關(guān)系。在一般情況下,它們是一對(duì)一的關(guān)系:

即一張?jiān)紗螕?jù)對(duì)應(yīng)且只對(duì)應(yīng)一個(gè)實(shí)體。在特殊情況下,它們可能是一對(duì)多或多

對(duì)一的關(guān)系,即一張?jiān)紗巫C對(duì)應(yīng)多個(gè)實(shí)體,或多張?jiān)紗巫C對(duì)應(yīng)一個(gè)實(shí)體。這

里的實(shí)體可以理解為基本表。明確這種對(duì)應(yīng)關(guān)系后,對(duì)我們?cè)O(shè)計(jì)錄入界面大有好

處。

K例口:一份員工履歷資料,在人力資源信息系統(tǒng)中,就對(duì)應(yīng)三個(gè)基本表:

員工基本情況表、社會(huì)關(guān)系表、工作簡(jiǎn)歷表。這就是“一張?jiān)紗巫C對(duì)應(yīng)多個(gè)實(shí)

體”的典型例子。

2.主鍵與外鍵

一般而言,一個(gè)實(shí)體不能既無(wú)主鍵又無(wú)外鍵。在E—R圖中,處于葉子部位的

實(shí)體,可以定義主鍵,也可以不定義主鍵(因?yàn)樗鼰o(wú)子孫),但必須要有外鍵(因

為它有父親)。

主鍵與外鍵的設(shè)計(jì),在全局?jǐn)?shù)據(jù)庫(kù)的設(shè)計(jì)中,占有重要地位。當(dāng)全局?jǐn)?shù)據(jù)庫(kù)

的設(shè)計(jì)完成以后,有個(gè)美國(guó)數(shù)據(jù)庫(kù)設(shè)計(jì)專家說(shuō):“鍵,到處都是鍵,除了鍵之外,

什么也沒(méi)有",這就是他的數(shù)據(jù)庫(kù)設(shè)計(jì)經(jīng)驗(yàn)之談,也反映了他對(duì)信息系統(tǒng)核心(數(shù)

據(jù)模型)的高度抽象思想。因?yàn)椋褐麈I是實(shí)體的高度抽象,主鍵與外鍵的配對(duì),

表示實(shí)體之間的連接。

3.基本表的性質(zhì)

基本表與中間表、臨時(shí)表不同,因?yàn)樗哂腥缦滤膫€(gè)特性:

(1)原子性。基本表中的字段是不可再分解的。

(2)原始性?;颈碇械挠涗浭窃紨?shù)據(jù)(基礎(chǔ)數(shù)據(jù))的記錄。

(3)演繹性。由基本表與代碼表中的數(shù)據(jù),可以派生出所有的輸出數(shù)據(jù)。

(4)穩(wěn)定性?;颈淼慕Y(jié)構(gòu)是相對(duì)穩(wěn)定的,表中的記錄是要長(zhǎng)期保存的。

理解基本表的性質(zhì)后,在設(shè)計(jì)數(shù)據(jù)庫(kù)時(shí),就能將基本表與中間表、臨時(shí)表區(qū)

分開來(lái)。

4.范式標(biāo)準(zhǔn)

基本表及其字段之間的關(guān)系,應(yīng)盡量滿足第三范式。但是,滿足第三范式的

數(shù)據(jù)庫(kù)設(shè)計(jì),往往不是最好的設(shè)計(jì)。為了提高數(shù)據(jù)庫(kù)的運(yùn)行效率,常常需要降低

范式標(biāo)準(zhǔn):適當(dāng)增加冗余,達(dá)到以空間換時(shí)間的目的。

k例2』:有一張存放商品的基本表,如表1所示?!敖痤~”這個(gè)字段的存

在,表明該表的設(shè)計(jì)不滿足第三范式,因?yàn)椤敖痤~”可以由“單價(jià)”乘以“數(shù)

量”得到,說(shuō)明“金額”是冗余字段。但是,增加“金額”這個(gè)冗余字段,可以

提高查詢統(tǒng)計(jì)的速度,這就是以空間換時(shí)間的作法。

在Rose2002中,規(guī)定列有兩種類型:數(shù)據(jù)列和計(jì)算列?!敖痤~”這樣的列

被稱為“計(jì)算列”,而“單價(jià)”和“數(shù)量”這樣的列被稱為“數(shù)據(jù)列”。

表1商品表的表結(jié)構(gòu)

商品名稱商品型號(hào)單價(jià)數(shù)量金額

電視機(jī)29口寸2,50040100,000

1.通俗地理解三個(gè)范式

通俗地理解三個(gè)范式,對(duì)于數(shù)據(jù)庫(kù)設(shè)計(jì)大有好處。在數(shù)據(jù)庫(kù)設(shè)計(jì)中,為了更

好地應(yīng)用三個(gè)范式,就必須通俗地理解三個(gè)范式(通俗地理解是夠用的理解,并

不是最科學(xué)最準(zhǔn)確的理解):

第一范式:1NF是對(duì)屬性的原子性約束,要求屬性具有原子性,不可再分解;

第二范式:2NF是對(duì)記錄的惟一性約束,要求記錄有惟一標(biāo)識(shí),即實(shí)體的惟

一性;

第三范式:3NF是對(duì)字段冗余性的約束,即任何字段不能由其他字段派生出

來(lái),它要求字段沒(méi)有冗余。

沒(méi)有冗余的數(shù)據(jù)庫(kù)設(shè)計(jì)可以做到。但是,沒(méi)有冗余的數(shù)據(jù)庫(kù)未必是最好的數(shù)

據(jù)庫(kù),有時(shí)為了提高運(yùn)行效率,就必須降低范式標(biāo)準(zhǔn),適當(dāng)保留冗余數(shù)據(jù)。具體

做法是:在概念數(shù)據(jù)模型設(shè)計(jì)時(shí)遵守第三范式,降低范式標(biāo)準(zhǔn)的工作放到物理數(shù)

據(jù)模型設(shè)計(jì)時(shí)考慮。降低范式就是增加字段,允許冗余。

6.要善于識(shí)別與正確處理多對(duì)多的關(guān)系

若兩個(gè)實(shí)體之間存在多對(duì)多的關(guān)系,則應(yīng)消除這種關(guān)系。消除的辦法是,在

兩者之間增加第三個(gè)實(shí)體。這樣,原來(lái)一個(gè)多對(duì)多的關(guān)系,現(xiàn)在變?yōu)閮蓚€(gè)一對(duì)多

的關(guān)系。要將原來(lái)兩個(gè)實(shí)體的屬性合理地分配到三個(gè)實(shí)體中去。這里的第三個(gè)實(shí)

體,實(shí)質(zhì)上是一個(gè)較復(fù)雜的關(guān)系,它對(duì)應(yīng)一張基本表。一般來(lái)講,數(shù)據(jù)庫(kù)設(shè)計(jì)工

具不能識(shí)別多對(duì)多的關(guān)系,但能處理多對(duì)多的關(guān)系。

K例3H:在“圖書館信息系統(tǒng)”中,“圖書”是一個(gè)實(shí)體,“讀者”也是

一個(gè)實(shí)體。這兩個(gè)實(shí)體之間的關(guān)系,是一個(gè)典型的多對(duì)多關(guān)系:一本圖書在不同

時(shí)間可以被多個(gè)讀者借閱,一個(gè)讀者又可以借多本圖書。為此,要在二者之間增

加第三個(gè)實(shí)體,該實(shí)體取名為“借還書”,它的屬性為:借還時(shí)間、借還標(biāo)志(0

表示借書,1表示還書),另外,它還應(yīng)該有兩個(gè)外鍵(“圖書”的主鍵,“讀者”

的主鍵),使它能與“圖書”和“讀者”連接。

7.主鍵PK的取值方法

PK是供程序員使用的表間連接工具,可以是一無(wú)物理意義的數(shù)字串,由程

序自動(dòng)加1來(lái)實(shí)現(xiàn)。也可以是有物理意義的字段名或字段名的組合。不過(guò)前者比

后者好。當(dāng)PK是字段名的組合時(shí),建議字段的個(gè)數(shù)不要太多,多了不但索引占

用空間大,而且速度也慢。

8.正確認(rèn)識(shí)數(shù)據(jù)冗余

主鍵與外鍵在多表中的重復(fù)出現(xiàn),不屬于數(shù)據(jù)冗余,這個(gè)概念必須清楚,事

實(shí)上有許多人還不清楚。非鍵字段的重復(fù)出現(xiàn),才是數(shù)據(jù)冗余!而且是一種低級(jí)

冗余,即重復(fù)性的冗余。高級(jí)冗余不是字段的重復(fù)出現(xiàn),而是字段的派生出現(xiàn)。

k例4』:商品中的“單價(jià)、數(shù)量、金額”三個(gè)字段,“金額”就是由“單

價(jià)”乘以“數(shù)量”派生出來(lái)的,它就是冗余,而且是一種高級(jí)冗余。冗余的目的

是為了提高處理速度。只有低級(jí)冗余才會(huì)增加數(shù)據(jù)的不一致性,因?yàn)橥粩?shù)據(jù),

可能從不同時(shí)間、地點(diǎn)、角色上多次錄入。因此,我們提倡高級(jí)冗余(派生性冗

余),反對(duì)低級(jí)冗余(重復(fù)性冗余)。

9.E—R圖沒(méi)有標(biāo)準(zhǔn)答案

信息系統(tǒng)的E—R圖沒(méi)有標(biāo)準(zhǔn)答案,因?yàn)樗脑O(shè)計(jì)與畫法不是惟一的,只要

它覆蓋了系統(tǒng)需求的業(yè)務(wù)范圍和功能內(nèi)容,就是可行的。反之要修改E—R圖。

盡管它沒(méi)有惟一的標(biāo)準(zhǔn)答案,并不意味著可以隨意設(shè)計(jì)。好的E—R圖的標(biāo)準(zhǔn)是:

結(jié)構(gòu)清晰、關(guān)聯(lián)簡(jiǎn)潔、實(shí)體個(gè)數(shù)適中、屬性分配合理、沒(méi)有低級(jí)冗余。

10.視圖技術(shù)在數(shù)據(jù)庫(kù)設(shè)計(jì)中很有用

與基本表、代碼表、中間表不同,視圖是一種虛表,它依賴數(shù)據(jù)源的實(shí)表而

存在。視圖是供程序員使用數(shù)據(jù)庫(kù)的一個(gè)窗口,是基表數(shù)據(jù)綜合的一種形式,是

數(shù)據(jù)處理的一種方法,是用戶數(shù)據(jù)保密的一種手段。為了進(jìn)行復(fù)雜處理、提高運(yùn)

算速度和節(jié)省存儲(chǔ)空間,視圖的定義深度一般不得超過(guò)三層。若三層視圖仍不夠

用,則應(yīng)在視圖上定義臨時(shí)表,在臨時(shí)表上再定義視圖。這樣反復(fù)交迭定義,視

圖的深度就不受限制了。

對(duì)于某些與國(guó)家政治、經(jīng)濟(jì)、技術(shù)、軍事和安全利益有關(guān)的信息系統(tǒng),視圖

的作用更加重要。這些系統(tǒng)的基本表完成物理設(shè)計(jì)之后,立即在基本表上建立第

一層視圖,這層視圖的個(gè)數(shù)和結(jié)構(gòu),與基本表的個(gè)數(shù)和結(jié)構(gòu)是完全相同。并且規(guī)

定,所有的程序員,一律只準(zhǔn)在視圖上操作。只有數(shù)據(jù)庫(kù)管理員,帶著多個(gè)人員

共同掌握的“安全鑰匙”,才能直接在基本表上操作。請(qǐng)讀者想想:這是為什么?

11.中間表、報(bào)表和臨時(shí)表

中間表是存放統(tǒng)計(jì)數(shù)據(jù)的表,它是為數(shù)據(jù)倉(cāng)庫(kù)、輸出報(bào)表或查詢結(jié)果而設(shè)計(jì)

的,有時(shí)它沒(méi)有主鍵與外鍵(數(shù)據(jù)倉(cāng)庫(kù)除外)。臨時(shí)表是程序員個(gè)人設(shè)計(jì)的,存放

臨時(shí)記錄,為個(gè)人所用。基表和中間表由DBA維護(hù),臨時(shí)表由程序員自己用程序

自動(dòng)維護(hù)。

12.完整性約束表現(xiàn)在三個(gè)方面

域的完整性:用Check來(lái)實(shí)現(xiàn)約束,在數(shù)據(jù)庫(kù)設(shè)計(jì)工具中,對(duì)字段的取值范

圍進(jìn)行定義時(shí),有一個(gè)Check按鈕,通過(guò)它定義字段的值城。

參照完整性:用PK、FK、表級(jí)觸發(fā)器來(lái)實(shí)現(xiàn)。

用戶定義完整性:它是一些業(yè)務(wù)規(guī)則,用存儲(chǔ)過(guò)程和觸發(fā)器來(lái)實(shí)現(xiàn)。

13.防止數(shù)據(jù)庫(kù)設(shè)計(jì)打補(bǔ)丁的方法是“三少原則”

(1)一個(gè)數(shù)據(jù)庫(kù)中表的個(gè)數(shù)越少越好。只有表的個(gè)數(shù)少了,才能說(shuō)明系統(tǒng)

的E-R圖少而精,去掉了重復(fù)的多余的實(shí)體,形成了對(duì)客觀世界的高度抽象,

進(jìn)行了系統(tǒng)的數(shù)據(jù)集成,防止了打補(bǔ)丁式的設(shè)計(jì);

(2)一個(gè)表中組合主鍵的字段個(gè)數(shù)越少越好。因?yàn)橹麈I的作用,一是建主

鍵索引,二是做為子表的外鍵,所以組合主鍵的字段個(gè)數(shù)少了,不僅節(jié)省了運(yùn)行

時(shí)間,而且節(jié)省了索引存儲(chǔ)空間;

(3)一個(gè)表中的字段個(gè)數(shù)越少越好。只有字段的個(gè)數(shù)少了,才能說(shuō)明在系

統(tǒng)中不存在數(shù)據(jù)重復(fù),且很少有數(shù)據(jù)冗余,更重要的是督促讀者學(xué)會(huì)“列變行”,

這樣就防止了將子表中的字段拉入到主表中去,在主表中留下許多空余的字段。

所謂‘'列變行",就是將主表中的一部分內(nèi)容拉出去,另外單獨(dú)建一個(gè)子表。這

個(gè)方法很簡(jiǎn)單,有的人就是不習(xí)慣、不采納、不執(zhí)行。

數(shù)據(jù)庫(kù)設(shè)計(jì)的實(shí)用原則是:在數(shù)據(jù)冗余和處理速度之間找到合適的平衡點(diǎn)。

“三少”是一個(gè)整體概念,綜合觀點(diǎn),不能孤立某一個(gè)原則。該原則是相對(duì)的,

不是絕對(duì)的?!叭唷痹瓌t肯定是錯(cuò)誤的。試想:若覆蓋系統(tǒng)同樣的功能,一百

個(gè)實(shí)體(共一千個(gè)屬性)的E—R圖,肯定比二百個(gè)實(shí)體(共二千個(gè)屬性)的E—R

圖,要好得多。

提倡“三少”原則,是叫讀者學(xué)會(huì)利用數(shù)據(jù)庫(kù)設(shè)計(jì)技術(shù)進(jìn)行系統(tǒng)的數(shù)據(jù)集

成。數(shù)據(jù)集成的步驟是將文件系統(tǒng)集成為應(yīng)用數(shù)據(jù)庫(kù),將應(yīng)用數(shù)據(jù)庫(kù)集成為主題

數(shù)據(jù)庫(kù),將主題數(shù)據(jù)庫(kù)集成為全局綜合數(shù)據(jù)庫(kù)。集成的程度越高,數(shù)據(jù)共享性就

越強(qiáng),信息孤島現(xiàn)象就越少,整個(gè)企業(yè)信息系統(tǒng)的全局E—R圖中實(shí)體的個(gè)數(shù)、

主鍵的個(gè)數(shù)、屬性的個(gè)數(shù)就會(huì)越少。

提倡“三少”原則的目的,是防止讀者利用打補(bǔ)丁技術(shù),不斷地對(duì)數(shù)據(jù)庫(kù)進(jìn)

行增刪改,使企業(yè)數(shù)據(jù)庫(kù)變成了隨意設(shè)計(jì)數(shù)據(jù)庫(kù)表的“垃圾堆”,或數(shù)據(jù)庫(kù)表的

“大雜院”,最后造成數(shù)據(jù)庫(kù)中的基本表、代碼表、中間表、臨時(shí)表雜亂無(wú)章,

不計(jì)其數(shù),導(dǎo)致企事業(yè)單位的信息系統(tǒng)無(wú)法維護(hù)而癱瘓。

“三多”原則任何人都可以做到,該原則是“打補(bǔ)丁方法”設(shè)計(jì)數(shù)據(jù)庫(kù)的

歪理學(xué)說(shuō)?!叭佟痹瓌t是少而精的原則,它要求有較高的數(shù)據(jù)庫(kù)設(shè)計(jì)技巧與藝

術(shù),不是任何人都能做到的,因?yàn)樵撛瓌t是杜絕用“打補(bǔ)丁方法”設(shè)計(jì)數(shù)據(jù)庫(kù)的

理論依據(jù)。

14.提高數(shù)據(jù)庫(kù)運(yùn)行效率的辦法

在給定的系統(tǒng)硬件和系統(tǒng)軟件條件下,提高數(shù)據(jù)庫(kù)系統(tǒng)的運(yùn)行效率的辦法

是:

(1)在數(shù)據(jù)庫(kù)物理設(shè)計(jì)時(shí),降低范式,增加冗余,少用觸發(fā)器,多用存儲(chǔ)

過(guò)程。

(2)當(dāng)計(jì)算非常復(fù)雜、而且記錄條數(shù)非常巨大時(shí)(例如一千萬(wàn)條),復(fù)雜計(jì)

算要先在數(shù)據(jù)庫(kù)外面,以文件系統(tǒng)方式用C++語(yǔ)言計(jì)算處理完成之后,最后才入

庫(kù)追加到表中去。這是電信計(jì)費(fèi)系統(tǒng)設(shè)計(jì)的經(jīng)驗(yàn)。

(3)發(fā)現(xiàn)某個(gè)表的記錄太多,例如超過(guò)一千萬(wàn)條,則要對(duì)該表進(jìn)行水平分

割。水平分割的做法是,以該表主鍵PK的某個(gè)值為界線,將該表的記錄水平分

割為兩個(gè)表。若發(fā)現(xiàn)某個(gè)表的字段太多,例如超過(guò)八十個(gè),則垂直分割該表,將

原來(lái)的一個(gè)表分解為兩個(gè)表。

(4)對(duì)數(shù)據(jù)庫(kù)管理系統(tǒng)DBMS進(jìn)行系統(tǒng)優(yōu)化,即優(yōu)化各種系統(tǒng)參數(shù),如緩沖

區(qū)個(gè)數(shù)。

(5)在使用面向數(shù)據(jù)的SQL語(yǔ)言進(jìn)行程序設(shè)計(jì)時(shí),盡量采取優(yōu)化算法。

總之,要提高數(shù)據(jù)庫(kù)的運(yùn)行效率,必須從數(shù)據(jù)庫(kù)系統(tǒng)級(jí)優(yōu)化、數(shù)據(jù)庫(kù)設(shè)計(jì)級(jí)

優(yōu)化、程序?qū)崿F(xiàn)級(jí)優(yōu)化,這三個(gè)層次上同時(shí)下功夫。

上述十四個(gè)技巧,是許多人在大量的數(shù)據(jù)庫(kù)分析與設(shè)計(jì)實(shí)踐中,逐步總結(jié)出

來(lái)的。對(duì)于這些經(jīng)驗(yàn)的運(yùn)用,讀者不能生幫硬套,死記硬背,而要消化理解,實(shí)

事求是,靈活掌握

關(guān)系數(shù)據(jù)庫(kù)規(guī)范化理論

1.1函數(shù)依賴

1.1.1函數(shù)依賴的基本概念

定義1.1:設(shè)R(U)是屬性集U上的關(guān)系模式。X,丫是U的子集。若對(duì)于R(U)的任意一個(gè)可能的關(guān)系r,tl,t2

是r中的任意兩個(gè)元組,如果由tl[X]=t2[X]Ttl[Y]=t2[Y],(即不可能存在兩個(gè)元組在X上的屬性值相等,而在Y

上的屬性值不等)則稱X函數(shù)確定Y或Y函數(shù)依賴于X,記作X-Y。

1.1.2一些術(shù)語(yǔ)和記號(hào)

設(shè)R(U)是屬性集U上的關(guān)系模式。X,Y是U的子集。

X-Y,但Y不包含于X則稱X-Y是非平凡的函數(shù)依賴。

若不特別聲明,我們總是討論非平凡的函數(shù)依賴。

X但YGX則稱X?Y是平凡的函數(shù)依*

若X-Y,則X叫做決定因子。

若X-Y,Y-X,則記作X--X

若Y刁

例:判斷以下函數(shù)依賴的對(duì)錯(cuò)

?sno-sname,eno—cname,(sno,eno)-grade

?sname-*sno,Sno-*cno,sno-*Cname

補(bǔ)充:屬性間的聯(lián)系決定函數(shù)依賴關(guān)系

設(shè)X、Y均是U的f集

?X和Y間聯(lián)系是1:1,則XfY,Y—X。

?X和Y間聯(lián)系是M:l,則X-Y。

?X和Y間聯(lián)系是M:N,則X、Y間不存在函數(shù)依賴。

例:STUDENTS(SNO,SNAMEZSSEXZSAGEZSDEPT,SPLACE)

XY

SNO-(SNAME,SSEXZSAGE)

SNO-SPLACE

SPLACE-SDEPT

SSEX-SDEPT

例:設(shè)關(guān)系X,Y,W為關(guān)系R中的三個(gè)屬性組,屬性關(guān)系如下圖所示,問(wèn)X-Y,X-W,WfY

w

X

各屬上述何種函數(shù)依賴:

X-Y為平凡函數(shù)依賴

X-W,WfY為非平凡函數(shù)依賴

補(bǔ)充:

定義1.2:在R(U)中,如果X-Y,并且對(duì)于X的任何一個(gè)真子集X',都有X'“Y,則稱Y對(duì)X完全函數(shù)依賴,

記作:X-Yo

若X-Y,但Y不完全函數(shù)依賴于X,則稱Y對(duì)X部分函數(shù)依賴,記作X上二Yo

(一般,1:1為完全函數(shù)依賴,m:l為部分函數(shù)依賴)

定義13在R(U)中,如果X-Y,(Y?X),Y?X,YfZ,則稱Z對(duì)X傳遞函數(shù)依賴。

1.2關(guān)系規(guī)范化

定義1.4設(shè)K為R(U,F)中的屬性或?qū)傩越M合,若K-U則K為R的候選碼。

主碼:若候選碼多于一個(gè),則選定其中的一個(gè)為主碼(Primarykey)

主屬性:包含在任何一個(gè)候選碼中的屬性,叫做主屬性(Primeattribute)

非主屬性:不包含在任何碼中的屬性稱為非主屬性(Nonprimeattribute)

最簡(jiǎn)單的情況:?jiǎn)蝹€(gè)屬性是碼。

最極端的情況:整個(gè)屬性組是碼崩;為全碼(All-key)

例:關(guān)系模式R(P,W,A),屬性P表示演奏者,W表示作品,A表示聽(tīng)眾。假設(shè)一個(gè)演奏者可以演奏多個(gè)作品,某

一作品可被多個(gè)演奏者演奏。聽(tīng)眾也可以欣賞不同演奏者的不同作品,這個(gè)關(guān)系模式的碼為(P,W,A),即All-key.

定義L5關(guān)系模式R中屬性或?qū)傩越MX并非R的碼,但X是另一個(gè)關(guān)系模式的碼,則稱X是R的外部碼

(Foreignkey)也稱外碼。

主碼與外部碼提供了一個(gè)表示關(guān)系間聯(lián)系的手段。

范式

關(guān)系模式滿足的確定約束條件稱為范式,根據(jù)滿足約束條件的級(jí)別不同,范式由低到高分為

1NF,2NF,3NF,BCNF,4NF,5NF等。不同的級(jí)別范式性質(zhì)不同。滿足最低要求的叫第一范式,簡(jiǎn)稱INF。在第一范式

中滿足進(jìn)一步要求的為第二范式,其余以此類推。

R為第幾范式就可以寫成RexNF,

對(duì)于各種范式之間的聯(lián)系有5NFU4NFUBCNFU3NFU2NFUINF成立。

一個(gè)低一級(jí)范式的關(guān)系模式,通過(guò)模式分解可以轉(zhuǎn)換為若干個(gè)高一級(jí)范式的關(guān)系模式的集合,這種過(guò)程就叫

規(guī)范化。

一、第一范式(1NF)

關(guān)系模式的的每一個(gè)屬性都是不可再分的,則該關(guān)系模式稱為第一范式。

例1:

A1,A2,A&…人如…,An

/\

A

Akik2

例2:工資(工號(hào),姓名,工資(基本工資,年績(jī)津貼,煤電補(bǔ)貼))

△不滿足1NF的關(guān)系稱為非規(guī)范化關(guān)系。

△關(guān)系數(shù)據(jù)模型不能存儲(chǔ)上兩個(gè)例子(非規(guī)范化關(guān)系)

在關(guān)系數(shù)據(jù)庫(kù)中不允許非規(guī)范化關(guān)系的存在。

二、第二范式

若RWINF,且每一個(gè)非主屬性完全函數(shù)依賴于碼,則RE2NF,

例:關(guān)系模式S-L-C(SNO,SDEPT,SLOC,CNO,G)中SLOC為學(xué)生的住處,并且每個(gè)系的學(xué)生住在同一

個(gè)地方。

這里主碼為(SNO,CNO),函數(shù)依賴有:

(SNO,CNO)-G)

P

SNO-*SDEPT(SNOZCNO)—?SDEPT

SNO-SLOC(SNO,CNO)旦^SLOC,

一個(gè)關(guān)系模式R不屬于2NF,就會(huì)產(chǎn)生插入異常(如沒(méi)有選課的學(xué)生記錄插不進(jìn)去)、刪除異常(刪除選課記

錄會(huì)將學(xué)生信息刪除)、冗余度大(如系、地址都重復(fù)存放)。

分析上面的例子,可以發(fā)現(xiàn)問(wèn)題在于有兩種非主屬性。一種如G,它對(duì)碼是完全函數(shù)依賴。另一種如SDEPT、

SLOC對(duì)碼不是完全函數(shù)依賴。解決的辦法是用投影分解把關(guān)系模式S-L-C分解為兩個(gè)關(guān)系模式。

SC(SNO,CNO,G)

S-L(SNO,SDEPT,SLOC)

關(guān)系模式SC的碼為(SNO,CNO),關(guān)系模式S-L的碼為SNO,這樣就使得非主屬性對(duì)碼都是完全函數(shù)依賴

二、第二氾式

關(guān)系模式R〈U,F〉中若不存在這樣的碼X,屬性組Y及非主屬性Z(ZY)使得X~Y,(YX)Y-Z,成立,即如果

R的任何一個(gè)非主屬性都不傳遞依賴于它的任何一個(gè)侯選關(guān)鍵字,則稱R〈U,F>£3NFo

可以證明,若R£3NF,則每一個(gè)非主屬性既不部分依賴于碼也不傳遞依賴于碼。

在關(guān)系模式SC沒(méi)有傳遞依賴,關(guān)系模式S-L存在非主屬性對(duì)碼傳遞依賴。在S-L中,由SNO-SDEPT,(SDEPT

SNO),SDEPT~SLOC,可得SNOSLOC。因此SCW3NF,而S-L3NF。

一個(gè)關(guān)系模式R若不是3NF,就會(huì)產(chǎn)生插入異常、刪除異常、冗余度大等問(wèn)題。

解決的辦法同樣是將S-L分解為:

S-D(SNOZSDEPT)

D-L(SDEPTZSLOC)

分解后的關(guān)系模式S-D與D?L中不再存在傳遞依賴。

四、BC范式

關(guān)系模式R〈U,F〉W1NF。若X-Y且Y?X時(shí)X必含有碼,則R〈U,F>《BCNF。也就是詡關(guān)系模式R〈U,F〉

中,若每一個(gè)決定因素都包含碼,則R<UZF>eBCNFo

由BCNF的定義可以得到以下結(jié)論:

下面用幾個(gè)例子說(shuō)明屬于3NF的關(guān)系模式有的屬于BCNF,但有的不屬于BCNFo

例1:關(guān)系模式SJP(S,J,P)中,S是學(xué)生,J表示課程,P表示名次。每一個(gè)學(xué)生選修每門課程的成績(jī)有一定的

名次,每門課程中每一名次只有一個(gè)學(xué)生(即沒(méi)有并列名次)。由語(yǔ)義可得到下面的函數(shù)依賴:

(SJ)-P,o,p)fs

所以(S,J)與(J,P)都可以作為候選碼。這兩個(gè)碼各由兩個(gè)屬性組成,而且它們是相交的。這個(gè)關(guān)系模式中顯然

沒(méi)有屬性對(duì)碼傳遞依賴或部分依賴。所以SJP£3NF,而且除(S,J)與。P)以外沒(méi)有其它決定因素,所以SJPGBCNFo

例2:關(guān)系模式STJ(S,T,J)中,S表示學(xué)生,T表示教師,J表示課程。每一教師只教一門課。每門課有若干教

師,某一學(xué)生選定某門課,就對(duì)應(yīng)一個(gè)固定的教師。由語(yǔ)義可得到如下的函數(shù)依賴。

(S,J)-T,(S,T)-J

是第三范式,但是存在T-J,而T不是碼,所以不是了BC范式。

第三節(jié)關(guān)系模式的分解準(zhǔn)則

1.3關(guān)系模式的分解準(zhǔn)則

關(guān)系模式的規(guī)范化過(guò)程是通過(guò)對(duì)關(guān)系模式的分解來(lái)實(shí)現(xiàn)的。把低一級(jí)的關(guān)系模式分解

為若干個(gè)高一級(jí)的關(guān)系模式。這種分解不是唯一的。

1NF

|消除非主屬,性對(duì)碼的部分函數(shù)依賴

2NF

消除決定^<

|消除非主屬,性7寸碼的傳遞函數(shù)依賴

非碣相評(píng)凡3NF

|消除主屬,性對(duì)碼的部分和傳遞函數(shù)依賴

函數(shù)依賴

BCNF

I消除非平凡且非函數(shù)依賴的多值依賴

4NF

一個(gè)低級(jí)范式的關(guān)系模式,通過(guò)分解(投影)方法可轉(zhuǎn)換成多個(gè)高一級(jí)范式的關(guān)系模

式的集合,這種過(guò)程稱為規(guī)范化。

規(guī)范化的方式是進(jìn)行模式分解,模式分解的原則是與原模式等價(jià),模式分解的標(biāo)準(zhǔn)是:

?模式分解具有無(wú)損連接性

?模式分解能夠保持函數(shù)依賴

見(jiàn)P70頁(yè)表格

舉例:關(guān)系規(guī)范化過(guò)程

第一范式(1NF):如果一關(guān)系模式,它的每一個(gè)分量是不可分的數(shù)據(jù)項(xiàng),即其域?yàn)楹?jiǎn)

單域,則此關(guān)系模式為第一范式。

例:將學(xué)生簡(jiǎn)歷及選課等數(shù)據(jù)設(shè)計(jì)成一個(gè)關(guān)系模式STUDENT,其表示為:

STUDENT(SNO,SNAME,AGE,SEX,CLASS,DEPTNO,DEPTNAME,CNO,

CNAMEZSCORE,CREDIT)

設(shè)該關(guān)系模式滿足下列函數(shù)依賴:

F={SNO->SNAMEZSNO->AGEZSNO->SEXZ

SN。一>CLASS,CLASS--〉DEPTNO,DEPTNO->DEPTNAME,

CNO->CNAMEZSNO.CNO->SCOREZCNO->CREDIT}

由于該關(guān)系模式的每一屬性對(duì)應(yīng)的域?yàn)楹?jiǎn)單域,即其域值不可再分,符合第一范式定

義,所以STUDENT關(guān)系模式為第一范式。

第二范式(2NF):若關(guān)系模式R?1NF,且每個(gè)非主屬性完全函數(shù)依賴丁碼,則稱R?2NF。

分析一下關(guān)系模式STUDENT,它是不是2NF?

屬性組(SNO,CNO)為關(guān)系STUDENT的碼。

例如:SNAME非主屬性,根據(jù)碼的特性具有:SNO.CNO77SNAME

根據(jù)STUDENT關(guān)系模式已知函數(shù)依賴集,下列函數(shù)依賴成立:SNO??SNAME

所以對(duì)碼是部分函數(shù)依賴。同樣方法可得到除屬

SNO.CNO??SNAMEZSNAMESCORE

性外,其它非主屬性對(duì)碼也都是部分函數(shù)依賴。所以STUDENT關(guān)系模式不是2NF。

當(dāng)關(guān)系模式R是1NF而不是

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論