版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)庫(kù)范式——通俗易懂【轉(zhuǎn)】
(2012-04-0221:15:43)
數(shù)據(jù)庫(kù)范式是數(shù)據(jù)庫(kù)設(shè)計(jì)中必不可少的知識(shí),沒(méi)有對(duì)范式的理解,就無(wú)法設(shè)計(jì)出高效率、優(yōu)雅的數(shù)據(jù)庫(kù)。甚至設(shè)
計(jì)出錯(cuò)誤的數(shù)據(jù)庫(kù)。而想要理解并掌握范式卻并不是那么容易。教科書中一般以關(guān)系代數(shù)的方法來(lái)解釋數(shù)據(jù)庫(kù)范
式。這樣做雖然能夠十分準(zhǔn)確的表達(dá)數(shù)據(jù)庫(kù)范式,但比較抽象,不太直觀,不便于理解,更難以記憶。
一、基礎(chǔ)概念
實(shí)體:現(xiàn)實(shí)世界中客觀存在并可以被區(qū)別的事物。比如“一個(gè)學(xué)生”、“一木書”、“一門課”等等。值得強(qiáng)調(diào)的
是這里所說(shuō)的“事物”不僅僅是看得見(jiàn)摸得著的“東西”,它也可以是虛擬的,不如說(shuō)“老師與學(xué)校的關(guān)系
?屬性:教科書上解釋為:”實(shí)體所具有的某一特性“,由此可見(jiàn),屬性一開始是個(gè)邏輯概念,比如說(shuō),“性
別”是“人”的一個(gè)屬性。在關(guān)系數(shù)據(jù)庫(kù)中,屬性又是個(gè)物理概念,屬性可以看作是“表的一列”。
?元組:表中的一行就是一個(gè)元組。
?分量:元組的某個(gè)屬性值。在一個(gè)關(guān)系數(shù)據(jù)庫(kù)中,它是一個(gè)操作原子,即關(guān)系數(shù)據(jù)庫(kù)在做任何操作的時(shí)
候,屬性是“不可分的”。否則就不是關(guān)系數(shù)據(jù)庫(kù)了。
?碼:表中可以唯一確定一個(gè)元組的某個(gè)屬性(或者屬性組),如果這樣的碼有不止一個(gè),那么大家都叫
候選碼,我們從候選碼中挑一個(gè)出來(lái)做老大,它就叫主碼。
?全碼:如果一個(gè)碼包含了所有的屬性,這個(gè)碼就是全碼。
?主屬性:一個(gè)屬性只要在任何一個(gè)候選碼中出現(xiàn)過(guò),這個(gè)屬性就是主屬性。
?非主屬性:與上面相反,沒(méi)有在任何候選碼中出現(xiàn)過(guò),這個(gè)屬性就是非主屬性。
?外碼:一個(gè)屬性(或?qū)傩越M),它不是碼,但是它別的表的碼,它就是外碼。
二、6個(gè)范式
好了,上面已經(jīng)介紹了我們掌握范式所需要的全部基礎(chǔ)概念,下面我們就來(lái)講范式。首先要明白,范式的包含關(guān)
系。一個(gè)數(shù)據(jù)庫(kù)設(shè)計(jì)如果符合第二范式,?定也符合第一范式。如果符合第三范式,一定也符合第二范式…
第一范式(1NF):屬性不可分。
在前面我們已經(jīng)介紹了屬性值的概念,我們說(shuō),它是“不可分的而第一范式要求屬性也不可分。那么它和屬性
值不可分有什么區(qū)別呢?給一個(gè)例子:
nametelage
大寶22
小明
21
Ps:這個(gè)表中,屬性值“分''了。
tel
nameage
手機(jī)座機(jī)
021—
大寶987654322
010—
小明]23456721
Ps:這個(gè)表中,屬性“分”了。
這兩種情況都不滿足第一范式。不滿足第一范式的數(shù)據(jù)庫(kù),不是關(guān)系數(shù)據(jù)庫(kù)!所以,我們?cè)谌魏侮P(guān)系數(shù)據(jù)庫(kù)管理
系統(tǒng)中,做不出這樣的“表'’來(lái)。
第二范式(2NF):符合1NF,并且,非主屬性完全依賴丁碼。
聽(tīng)起來(lái)好像很神秘,其實(shí)真的沒(méi)什么。
一個(gè)候選碼中的主屬性也可能是好幾個(gè)。如果一個(gè)主屬性,它不能單獨(dú)做為一個(gè)候選碼,那么它也不能確定任何
一個(gè)非主屬性。給一個(gè)反例:我們考慮一個(gè)小學(xué)的教務(wù)管理系統(tǒng),學(xué)生上課指定一個(gè)老師,一本教材,一個(gè)教室,
一個(gè)時(shí)間,大家都上課去吧,沒(méi)有問(wèn)題。那么數(shù)據(jù)庫(kù)怎么設(shè)計(jì)?(學(xué)生上課表)
學(xué)生課程老師老師職稱教材教室上課時(shí)間
小明;譽(yù)語(yǔ)文大寶副教授小學(xué)語(yǔ)文10114:30
一個(gè)學(xué)生上一門課,一定在特定某個(gè)教室。所以有(學(xué)生,課程)一>教室
一個(gè)學(xué)生上一門課,一定是特定某個(gè)老師教。所以有(學(xué)生,課程)一>老師
一個(gè)學(xué)生上一門課,他老師的職稱可以確定。所以有(學(xué)生,課程)一>老師職稱
一個(gè)學(xué)生上一門課,一定是特定某個(gè)教材。所以有(學(xué)生,課程)一》教材
一個(gè)學(xué)生上一門課,一定在特定時(shí)間。所以有(學(xué)生,課程)一〉上課時(shí)間
因此(學(xué)生,課程)是一個(gè)碼。
然而,一個(gè)課程,一定指定了某個(gè)教材,一年級(jí)語(yǔ)文肯定用的是《小學(xué)語(yǔ)文1)),那么就有課程一〉教材。(學(xué)生,
課程)是個(gè)碼,課程卻決定了教材,這就叫做不完全依賴,或者說(shuō)部分依賴。出現(xiàn)這樣的情況,就不滿足第二范
式!
有什么不好嗎?你可以想想:
1、校長(zhǎng)要新增加一門課程叫“微積分”,教材是《大學(xué)數(shù)學(xué)》,怎么辦?學(xué)生還沒(méi)選課,而學(xué)生又是主屬性,主
屬性不能空,課程怎么記錄呢,教材記到哪呢?……郁悶了吧?(插入異常)
2、下學(xué)期沒(méi)學(xué)生學(xué)一年級(jí)語(yǔ)文(上)了,學(xué)一年級(jí)語(yǔ)文(下)去了,那么表中將不存在一年級(jí)語(yǔ)文(上),也
就沒(méi)了《小學(xué)語(yǔ)文1》。這時(shí)候,校長(zhǎng)問(wèn):一年級(jí)語(yǔ)文(上)用的什么教材???……郁悶了吧?(刪除異常)
3、校長(zhǎng)說(shuō):一年級(jí)語(yǔ)文(上)換教材,換成《大學(xué)語(yǔ)文》。有10000個(gè)學(xué)生選了這么課,改動(dòng)好大??!改累死
了……郁悶了吧?(修改異常)
那應(yīng)該怎么解決呢?投影分解,將一個(gè)表分解成兩個(gè)或若干個(gè)表
學(xué)生課程老師(師職教室上課時(shí)間
稱
小明語(yǔ)又大寶副教授10114:30
學(xué)生上課表新
課程教材
一年級(jí)語(yǔ)文(上)《小學(xué)語(yǔ)文1》
課程的表第三范式(3NF):符合2NF,并且,消除傳遞依賴
上面的“學(xué)生上課表新''符合2NF,可以這樣驗(yàn)證:兩個(gè)主屬性單獨(dú)使用,不用確定其它四個(gè)非主屬性的任何一個(gè)。
但是它有傳遞依賴!
在哪呢?問(wèn)題就出在“老師”和“老師職稱”這里。一個(gè)老師一定能確定一個(gè)老師職稱。
有什么問(wèn)題嗎?想想:
1、老師升級(jí)了,變教授了,要改數(shù)據(jù)庫(kù),表中有N條,改了N次……(修改異常)
2、沒(méi)人選這個(gè)老師的課了,老師的職稱也沒(méi)了記錄……(刪除異常)
3、新來(lái)一個(gè)老師,還沒(méi)分配教什么課,他的職稱記到哪?……(插入異常)
那應(yīng)該怎么解決呢?和上面一樣,投影分解:
學(xué)生課程老師教室上課時(shí)間
小明一年級(jí)語(yǔ)文大寶10114:30
(上)
老師老師職稱
大寶副教授
BC范式(BCNF):符合3NF,并且,主屬性不依賴于主屬性
若關(guān)系模式屬于第一范式,且每個(gè)屬性都不傳遞依賴于鍵碼,則R屬于BC范式。
通常
BC范式的條件有多種等價(jià)的表述:每個(gè)非平凡依賴的左邊必須包含鍵碼;每個(gè)決定因素必須包含鍵碼。
BC范式既檢查非主屬性,又檢查生屬性。當(dāng)只檢查非主屬性時(shí),就成了第三范式。滿足BC范式的關(guān)系都必然
滿足第三范式。
還可以這么說(shuō):若一個(gè)關(guān)系達(dá)到了第三范式,并且它只有一個(gè)候選碼,或者它的每個(gè)候選碼都是單屬性,則該關(guān)
系自然達(dá)到BC范式。
一般,一個(gè)數(shù)據(jù)庫(kù)設(shè)計(jì)符合3NF或BCNF就可以了。在BC范式以上還有第四范式、第五范式。
第四范式:要求把同一表內(nèi)的多對(duì)多關(guān)系刪除。
第五范式:從最終結(jié)構(gòu)重新建立原始結(jié)構(gòu)。
但在絕大多數(shù)應(yīng)用中不需要設(shè)計(jì)到這種程度。并且,某些情況下,過(guò)于范式化甚至?xí)?duì)數(shù)據(jù)庫(kù)的邏輯可讀性和使
用效率起到阻礙。數(shù)據(jù)庫(kù)中一定程度的冗余并不一定是壞事情。如果你對(duì)第四范式、第五范式感興趣可以看一看
專業(yè)教材,從頭學(xué)起,并且忘記我說(shuō)的一切,以免對(duì)你產(chǎn)生誤導(dǎo)
數(shù)據(jù)庫(kù)設(shè)計(jì)中的一些技巧
1.原始單據(jù)與實(shí)體之間的關(guān)系
可以是一對(duì)一、一對(duì)多、多對(duì)多的關(guān)系。在一般情況下,它們是一對(duì)一的關(guān)系:
即一張?jiān)紗螕?jù)對(duì)應(yīng)且只對(duì)應(yīng)一個(gè)實(shí)體。在特殊情況下,它們可能是一對(duì)多或多
對(duì)一的關(guān)系,即一張?jiān)紗巫C對(duì)應(yīng)多個(gè)實(shí)體,或多張?jiān)紗巫C對(duì)應(yīng)一個(gè)實(shí)體。這
里的實(shí)體可以理解為基本表。明確這種對(duì)應(yīng)關(guān)系后,對(duì)我們?cè)O(shè)計(jì)錄入界面大有好
處。
K例口:一份員工履歷資料,在人力資源信息系統(tǒng)中,就對(duì)應(yīng)三個(gè)基本表:
員工基本情況表、社會(huì)關(guān)系表、工作簡(jiǎn)歷表。這就是“一張?jiān)紗巫C對(duì)應(yīng)多個(gè)實(shí)
體”的典型例子。
2.主鍵與外鍵
一般而言,一個(gè)實(shí)體不能既無(wú)主鍵又無(wú)外鍵。在E—R圖中,處于葉子部位的
實(shí)體,可以定義主鍵,也可以不定義主鍵(因?yàn)樗鼰o(wú)子孫),但必須要有外鍵(因
為它有父親)。
主鍵與外鍵的設(shè)計(jì),在全局?jǐn)?shù)據(jù)庫(kù)的設(shè)計(jì)中,占有重要地位。當(dāng)全局?jǐn)?shù)據(jù)庫(kù)
的設(shè)計(jì)完成以后,有個(gè)美國(guó)數(shù)據(jù)庫(kù)設(shè)計(jì)專家說(shuō):“鍵,到處都是鍵,除了鍵之外,
什么也沒(méi)有",這就是他的數(shù)據(jù)庫(kù)設(shè)計(jì)經(jīng)驗(yàn)之談,也反映了他對(duì)信息系統(tǒng)核心(數(shù)
據(jù)模型)的高度抽象思想。因?yàn)椋褐麈I是實(shí)體的高度抽象,主鍵與外鍵的配對(duì),
表示實(shí)體之間的連接。
3.基本表的性質(zhì)
基本表與中間表、臨時(shí)表不同,因?yàn)樗哂腥缦滤膫€(gè)特性:
(1)原子性。基本表中的字段是不可再分解的。
(2)原始性?;颈碇械挠涗浭窃紨?shù)據(jù)(基礎(chǔ)數(shù)據(jù))的記錄。
(3)演繹性。由基本表與代碼表中的數(shù)據(jù),可以派生出所有的輸出數(shù)據(jù)。
(4)穩(wěn)定性?;颈淼慕Y(jié)構(gòu)是相對(duì)穩(wěn)定的,表中的記錄是要長(zhǎng)期保存的。
理解基本表的性質(zhì)后,在設(shè)計(jì)數(shù)據(jù)庫(kù)時(shí),就能將基本表與中間表、臨時(shí)表區(qū)
分開來(lái)。
4.范式標(biāo)準(zhǔn)
基本表及其字段之間的關(guān)系,應(yīng)盡量滿足第三范式。但是,滿足第三范式的
數(shù)據(jù)庫(kù)設(shè)計(jì),往往不是最好的設(shè)計(jì)。為了提高數(shù)據(jù)庫(kù)的運(yùn)行效率,常常需要降低
范式標(biāo)準(zhǔn):適當(dāng)增加冗余,達(dá)到以空間換時(shí)間的目的。
k例2』:有一張存放商品的基本表,如表1所示?!敖痤~”這個(gè)字段的存
在,表明該表的設(shè)計(jì)不滿足第三范式,因?yàn)椤敖痤~”可以由“單價(jià)”乘以“數(shù)
量”得到,說(shuō)明“金額”是冗余字段。但是,增加“金額”這個(gè)冗余字段,可以
提高查詢統(tǒng)計(jì)的速度,這就是以空間換時(shí)間的作法。
在Rose2002中,規(guī)定列有兩種類型:數(shù)據(jù)列和計(jì)算列?!敖痤~”這樣的列
被稱為“計(jì)算列”,而“單價(jià)”和“數(shù)量”這樣的列被稱為“數(shù)據(jù)列”。
表1商品表的表結(jié)構(gòu)
商品名稱商品型號(hào)單價(jià)數(shù)量金額
電視機(jī)29口寸2,50040100,000
1.通俗地理解三個(gè)范式
通俗地理解三個(gè)范式,對(duì)于數(shù)據(jù)庫(kù)設(shè)計(jì)大有好處。在數(shù)據(jù)庫(kù)設(shè)計(jì)中,為了更
好地應(yīng)用三個(gè)范式,就必須通俗地理解三個(gè)范式(通俗地理解是夠用的理解,并
不是最科學(xué)最準(zhǔn)確的理解):
第一范式:1NF是對(duì)屬性的原子性約束,要求屬性具有原子性,不可再分解;
第二范式:2NF是對(duì)記錄的惟一性約束,要求記錄有惟一標(biāo)識(shí),即實(shí)體的惟
一性;
第三范式:3NF是對(duì)字段冗余性的約束,即任何字段不能由其他字段派生出
來(lái),它要求字段沒(méi)有冗余。
沒(méi)有冗余的數(shù)據(jù)庫(kù)設(shè)計(jì)可以做到。但是,沒(méi)有冗余的數(shù)據(jù)庫(kù)未必是最好的數(shù)
據(jù)庫(kù),有時(shí)為了提高運(yùn)行效率,就必須降低范式標(biāo)準(zhǔn),適當(dāng)保留冗余數(shù)據(jù)。具體
做法是:在概念數(shù)據(jù)模型設(shè)計(jì)時(shí)遵守第三范式,降低范式標(biāo)準(zhǔn)的工作放到物理數(shù)
據(jù)模型設(shè)計(jì)時(shí)考慮。降低范式就是增加字段,允許冗余。
6.要善于識(shí)別與正確處理多對(duì)多的關(guān)系
若兩個(gè)實(shí)體之間存在多對(duì)多的關(guān)系,則應(yīng)消除這種關(guān)系。消除的辦法是,在
兩者之間增加第三個(gè)實(shí)體。這樣,原來(lái)一個(gè)多對(duì)多的關(guān)系,現(xiàn)在變?yōu)閮蓚€(gè)一對(duì)多
的關(guān)系。要將原來(lái)兩個(gè)實(shí)體的屬性合理地分配到三個(gè)實(shí)體中去。這里的第三個(gè)實(shí)
體,實(shí)質(zhì)上是一個(gè)較復(fù)雜的關(guān)系,它對(duì)應(yīng)一張基本表。一般來(lái)講,數(shù)據(jù)庫(kù)設(shè)計(jì)工
具不能識(shí)別多對(duì)多的關(guān)系,但能處理多對(duì)多的關(guān)系。
K例3H:在“圖書館信息系統(tǒng)”中,“圖書”是一個(gè)實(shí)體,“讀者”也是
一個(gè)實(shí)體。這兩個(gè)實(shí)體之間的關(guān)系,是一個(gè)典型的多對(duì)多關(guān)系:一本圖書在不同
時(shí)間可以被多個(gè)讀者借閱,一個(gè)讀者又可以借多本圖書。為此,要在二者之間增
加第三個(gè)實(shí)體,該實(shí)體取名為“借還書”,它的屬性為:借還時(shí)間、借還標(biāo)志(0
表示借書,1表示還書),另外,它還應(yīng)該有兩個(gè)外鍵(“圖書”的主鍵,“讀者”
的主鍵),使它能與“圖書”和“讀者”連接。
7.主鍵PK的取值方法
PK是供程序員使用的表間連接工具,可以是一無(wú)物理意義的數(shù)字串,由程
序自動(dòng)加1來(lái)實(shí)現(xiàn)。也可以是有物理意義的字段名或字段名的組合。不過(guò)前者比
后者好。當(dāng)PK是字段名的組合時(shí),建議字段的個(gè)數(shù)不要太多,多了不但索引占
用空間大,而且速度也慢。
8.正確認(rèn)識(shí)數(shù)據(jù)冗余
主鍵與外鍵在多表中的重復(fù)出現(xiàn),不屬于數(shù)據(jù)冗余,這個(gè)概念必須清楚,事
實(shí)上有許多人還不清楚。非鍵字段的重復(fù)出現(xiàn),才是數(shù)據(jù)冗余!而且是一種低級(jí)
冗余,即重復(fù)性的冗余。高級(jí)冗余不是字段的重復(fù)出現(xiàn),而是字段的派生出現(xiàn)。
k例4』:商品中的“單價(jià)、數(shù)量、金額”三個(gè)字段,“金額”就是由“單
價(jià)”乘以“數(shù)量”派生出來(lái)的,它就是冗余,而且是一種高級(jí)冗余。冗余的目的
是為了提高處理速度。只有低級(jí)冗余才會(huì)增加數(shù)據(jù)的不一致性,因?yàn)橥粩?shù)據(jù),
可能從不同時(shí)間、地點(diǎn)、角色上多次錄入。因此,我們提倡高級(jí)冗余(派生性冗
余),反對(duì)低級(jí)冗余(重復(fù)性冗余)。
9.E—R圖沒(méi)有標(biāo)準(zhǔn)答案
信息系統(tǒng)的E—R圖沒(méi)有標(biāo)準(zhǔn)答案,因?yàn)樗脑O(shè)計(jì)與畫法不是惟一的,只要
它覆蓋了系統(tǒng)需求的業(yè)務(wù)范圍和功能內(nèi)容,就是可行的。反之要修改E—R圖。
盡管它沒(méi)有惟一的標(biāo)準(zhǔn)答案,并不意味著可以隨意設(shè)計(jì)。好的E—R圖的標(biāo)準(zhǔn)是:
結(jié)構(gòu)清晰、關(guān)聯(lián)簡(jiǎn)潔、實(shí)體個(gè)數(shù)適中、屬性分配合理、沒(méi)有低級(jí)冗余。
10.視圖技術(shù)在數(shù)據(jù)庫(kù)設(shè)計(jì)中很有用
與基本表、代碼表、中間表不同,視圖是一種虛表,它依賴數(shù)據(jù)源的實(shí)表而
存在。視圖是供程序員使用數(shù)據(jù)庫(kù)的一個(gè)窗口,是基表數(shù)據(jù)綜合的一種形式,是
數(shù)據(jù)處理的一種方法,是用戶數(shù)據(jù)保密的一種手段。為了進(jìn)行復(fù)雜處理、提高運(yùn)
算速度和節(jié)省存儲(chǔ)空間,視圖的定義深度一般不得超過(guò)三層。若三層視圖仍不夠
用,則應(yīng)在視圖上定義臨時(shí)表,在臨時(shí)表上再定義視圖。這樣反復(fù)交迭定義,視
圖的深度就不受限制了。
對(duì)于某些與國(guó)家政治、經(jīng)濟(jì)、技術(shù)、軍事和安全利益有關(guān)的信息系統(tǒng),視圖
的作用更加重要。這些系統(tǒng)的基本表完成物理設(shè)計(jì)之后,立即在基本表上建立第
一層視圖,這層視圖的個(gè)數(shù)和結(jié)構(gòu),與基本表的個(gè)數(shù)和結(jié)構(gòu)是完全相同。并且規(guī)
定,所有的程序員,一律只準(zhǔn)在視圖上操作。只有數(shù)據(jù)庫(kù)管理員,帶著多個(gè)人員
共同掌握的“安全鑰匙”,才能直接在基本表上操作。請(qǐng)讀者想想:這是為什么?
11.中間表、報(bào)表和臨時(shí)表
中間表是存放統(tǒng)計(jì)數(shù)據(jù)的表,它是為數(shù)據(jù)倉(cāng)庫(kù)、輸出報(bào)表或查詢結(jié)果而設(shè)計(jì)
的,有時(shí)它沒(méi)有主鍵與外鍵(數(shù)據(jù)倉(cāng)庫(kù)除外)。臨時(shí)表是程序員個(gè)人設(shè)計(jì)的,存放
臨時(shí)記錄,為個(gè)人所用。基表和中間表由DBA維護(hù),臨時(shí)表由程序員自己用程序
自動(dòng)維護(hù)。
12.完整性約束表現(xiàn)在三個(gè)方面
域的完整性:用Check來(lái)實(shí)現(xiàn)約束,在數(shù)據(jù)庫(kù)設(shè)計(jì)工具中,對(duì)字段的取值范
圍進(jìn)行定義時(shí),有一個(gè)Check按鈕,通過(guò)它定義字段的值城。
參照完整性:用PK、FK、表級(jí)觸發(fā)器來(lái)實(shí)現(xiàn)。
用戶定義完整性:它是一些業(yè)務(wù)規(guī)則,用存儲(chǔ)過(guò)程和觸發(fā)器來(lái)實(shí)現(xiàn)。
13.防止數(shù)據(jù)庫(kù)設(shè)計(jì)打補(bǔ)丁的方法是“三少原則”
(1)一個(gè)數(shù)據(jù)庫(kù)中表的個(gè)數(shù)越少越好。只有表的個(gè)數(shù)少了,才能說(shuō)明系統(tǒng)
的E-R圖少而精,去掉了重復(fù)的多余的實(shí)體,形成了對(duì)客觀世界的高度抽象,
進(jìn)行了系統(tǒng)的數(shù)據(jù)集成,防止了打補(bǔ)丁式的設(shè)計(jì);
(2)一個(gè)表中組合主鍵的字段個(gè)數(shù)越少越好。因?yàn)橹麈I的作用,一是建主
鍵索引,二是做為子表的外鍵,所以組合主鍵的字段個(gè)數(shù)少了,不僅節(jié)省了運(yùn)行
時(shí)間,而且節(jié)省了索引存儲(chǔ)空間;
(3)一個(gè)表中的字段個(gè)數(shù)越少越好。只有字段的個(gè)數(shù)少了,才能說(shuō)明在系
統(tǒng)中不存在數(shù)據(jù)重復(fù),且很少有數(shù)據(jù)冗余,更重要的是督促讀者學(xué)會(huì)“列變行”,
這樣就防止了將子表中的字段拉入到主表中去,在主表中留下許多空余的字段。
所謂‘'列變行",就是將主表中的一部分內(nèi)容拉出去,另外單獨(dú)建一個(gè)子表。這
個(gè)方法很簡(jiǎn)單,有的人就是不習(xí)慣、不采納、不執(zhí)行。
數(shù)據(jù)庫(kù)設(shè)計(jì)的實(shí)用原則是:在數(shù)據(jù)冗余和處理速度之間找到合適的平衡點(diǎn)。
“三少”是一個(gè)整體概念,綜合觀點(diǎn),不能孤立某一個(gè)原則。該原則是相對(duì)的,
不是絕對(duì)的?!叭唷痹瓌t肯定是錯(cuò)誤的。試想:若覆蓋系統(tǒng)同樣的功能,一百
個(gè)實(shí)體(共一千個(gè)屬性)的E—R圖,肯定比二百個(gè)實(shí)體(共二千個(gè)屬性)的E—R
圖,要好得多。
提倡“三少”原則,是叫讀者學(xué)會(huì)利用數(shù)據(jù)庫(kù)設(shè)計(jì)技術(shù)進(jìn)行系統(tǒng)的數(shù)據(jù)集
成。數(shù)據(jù)集成的步驟是將文件系統(tǒng)集成為應(yīng)用數(shù)據(jù)庫(kù),將應(yīng)用數(shù)據(jù)庫(kù)集成為主題
數(shù)據(jù)庫(kù),將主題數(shù)據(jù)庫(kù)集成為全局綜合數(shù)據(jù)庫(kù)。集成的程度越高,數(shù)據(jù)共享性就
越強(qiáng),信息孤島現(xiàn)象就越少,整個(gè)企業(yè)信息系統(tǒng)的全局E—R圖中實(shí)體的個(gè)數(shù)、
主鍵的個(gè)數(shù)、屬性的個(gè)數(shù)就會(huì)越少。
提倡“三少”原則的目的,是防止讀者利用打補(bǔ)丁技術(shù),不斷地對(duì)數(shù)據(jù)庫(kù)進(jìn)
行增刪改,使企業(yè)數(shù)據(jù)庫(kù)變成了隨意設(shè)計(jì)數(shù)據(jù)庫(kù)表的“垃圾堆”,或數(shù)據(jù)庫(kù)表的
“大雜院”,最后造成數(shù)據(jù)庫(kù)中的基本表、代碼表、中間表、臨時(shí)表雜亂無(wú)章,
不計(jì)其數(shù),導(dǎo)致企事業(yè)單位的信息系統(tǒng)無(wú)法維護(hù)而癱瘓。
“三多”原則任何人都可以做到,該原則是“打補(bǔ)丁方法”設(shè)計(jì)數(shù)據(jù)庫(kù)的
歪理學(xué)說(shuō)?!叭佟痹瓌t是少而精的原則,它要求有較高的數(shù)據(jù)庫(kù)設(shè)計(jì)技巧與藝
術(shù),不是任何人都能做到的,因?yàn)樵撛瓌t是杜絕用“打補(bǔ)丁方法”設(shè)計(jì)數(shù)據(jù)庫(kù)的
理論依據(jù)。
14.提高數(shù)據(jù)庫(kù)運(yùn)行效率的辦法
在給定的系統(tǒng)硬件和系統(tǒng)軟件條件下,提高數(shù)據(jù)庫(kù)系統(tǒng)的運(yùn)行效率的辦法
是:
(1)在數(shù)據(jù)庫(kù)物理設(shè)計(jì)時(shí),降低范式,增加冗余,少用觸發(fā)器,多用存儲(chǔ)
過(guò)程。
(2)當(dāng)計(jì)算非常復(fù)雜、而且記錄條數(shù)非常巨大時(shí)(例如一千萬(wàn)條),復(fù)雜計(jì)
算要先在數(shù)據(jù)庫(kù)外面,以文件系統(tǒng)方式用C++語(yǔ)言計(jì)算處理完成之后,最后才入
庫(kù)追加到表中去。這是電信計(jì)費(fèi)系統(tǒng)設(shè)計(jì)的經(jīng)驗(yàn)。
(3)發(fā)現(xiàn)某個(gè)表的記錄太多,例如超過(guò)一千萬(wàn)條,則要對(duì)該表進(jìn)行水平分
割。水平分割的做法是,以該表主鍵PK的某個(gè)值為界線,將該表的記錄水平分
割為兩個(gè)表。若發(fā)現(xiàn)某個(gè)表的字段太多,例如超過(guò)八十個(gè),則垂直分割該表,將
原來(lái)的一個(gè)表分解為兩個(gè)表。
(4)對(duì)數(shù)據(jù)庫(kù)管理系統(tǒng)DBMS進(jìn)行系統(tǒng)優(yōu)化,即優(yōu)化各種系統(tǒng)參數(shù),如緩沖
區(qū)個(gè)數(shù)。
(5)在使用面向數(shù)據(jù)的SQL語(yǔ)言進(jìn)行程序設(shè)計(jì)時(shí),盡量采取優(yōu)化算法。
總之,要提高數(shù)據(jù)庫(kù)的運(yùn)行效率,必須從數(shù)據(jù)庫(kù)系統(tǒng)級(jí)優(yōu)化、數(shù)據(jù)庫(kù)設(shè)計(jì)級(jí)
優(yōu)化、程序?qū)崿F(xiàn)級(jí)優(yōu)化,這三個(gè)層次上同時(shí)下功夫。
上述十四個(gè)技巧,是許多人在大量的數(shù)據(jù)庫(kù)分析與設(shè)計(jì)實(shí)踐中,逐步總結(jié)出
來(lái)的。對(duì)于這些經(jīng)驗(yàn)的運(yùn)用,讀者不能生幫硬套,死記硬背,而要消化理解,實(shí)
事求是,靈活掌握
關(guān)系數(shù)據(jù)庫(kù)規(guī)范化理論
1.1函數(shù)依賴
1.1.1函數(shù)依賴的基本概念
定義1.1:設(shè)R(U)是屬性集U上的關(guān)系模式。X,丫是U的子集。若對(duì)于R(U)的任意一個(gè)可能的關(guān)系r,tl,t2
是r中的任意兩個(gè)元組,如果由tl[X]=t2[X]Ttl[Y]=t2[Y],(即不可能存在兩個(gè)元組在X上的屬性值相等,而在Y
上的屬性值不等)則稱X函數(shù)確定Y或Y函數(shù)依賴于X,記作X-Y。
1.1.2一些術(shù)語(yǔ)和記號(hào)
設(shè)R(U)是屬性集U上的關(guān)系模式。X,Y是U的子集。
X-Y,但Y不包含于X則稱X-Y是非平凡的函數(shù)依賴。
若不特別聲明,我們總是討論非平凡的函數(shù)依賴。
X但YGX則稱X?Y是平凡的函數(shù)依*
若X-Y,則X叫做決定因子。
若X-Y,Y-X,則記作X--X
若Y刁
例:判斷以下函數(shù)依賴的對(duì)錯(cuò)
?sno-sname,eno—cname,(sno,eno)-grade
?sname-*sno,Sno-*cno,sno-*Cname
補(bǔ)充:屬性間的聯(lián)系決定函數(shù)依賴關(guān)系
設(shè)X、Y均是U的f集
?X和Y間聯(lián)系是1:1,則XfY,Y—X。
?X和Y間聯(lián)系是M:l,則X-Y。
?X和Y間聯(lián)系是M:N,則X、Y間不存在函數(shù)依賴。
例:STUDENTS(SNO,SNAMEZSSEXZSAGEZSDEPT,SPLACE)
XY
SNO-(SNAME,SSEXZSAGE)
SNO-SPLACE
SPLACE-SDEPT
SSEX-SDEPT
例:設(shè)關(guān)系X,Y,W為關(guān)系R中的三個(gè)屬性組,屬性關(guān)系如下圖所示,問(wèn)X-Y,X-W,WfY
w
X
各屬上述何種函數(shù)依賴:
X-Y為平凡函數(shù)依賴
X-W,WfY為非平凡函數(shù)依賴
補(bǔ)充:
定義1.2:在R(U)中,如果X-Y,并且對(duì)于X的任何一個(gè)真子集X',都有X'“Y,則稱Y對(duì)X完全函數(shù)依賴,
記作:X-Yo
若X-Y,但Y不完全函數(shù)依賴于X,則稱Y對(duì)X部分函數(shù)依賴,記作X上二Yo
(一般,1:1為完全函數(shù)依賴,m:l為部分函數(shù)依賴)
定義13在R(U)中,如果X-Y,(Y?X),Y?X,YfZ,則稱Z對(duì)X傳遞函數(shù)依賴。
1.2關(guān)系規(guī)范化
定義1.4設(shè)K為R(U,F)中的屬性或?qū)傩越M合,若K-U則K為R的候選碼。
主碼:若候選碼多于一個(gè),則選定其中的一個(gè)為主碼(Primarykey)
主屬性:包含在任何一個(gè)候選碼中的屬性,叫做主屬性(Primeattribute)
非主屬性:不包含在任何碼中的屬性稱為非主屬性(Nonprimeattribute)
最簡(jiǎn)單的情況:?jiǎn)蝹€(gè)屬性是碼。
最極端的情況:整個(gè)屬性組是碼崩;為全碼(All-key)
例:關(guān)系模式R(P,W,A),屬性P表示演奏者,W表示作品,A表示聽(tīng)眾。假設(shè)一個(gè)演奏者可以演奏多個(gè)作品,某
一作品可被多個(gè)演奏者演奏。聽(tīng)眾也可以欣賞不同演奏者的不同作品,這個(gè)關(guān)系模式的碼為(P,W,A),即All-key.
定義L5關(guān)系模式R中屬性或?qū)傩越MX并非R的碼,但X是另一個(gè)關(guān)系模式的碼,則稱X是R的外部碼
(Foreignkey)也稱外碼。
主碼與外部碼提供了一個(gè)表示關(guān)系間聯(lián)系的手段。
范式
關(guān)系模式滿足的確定約束條件稱為范式,根據(jù)滿足約束條件的級(jí)別不同,范式由低到高分為
1NF,2NF,3NF,BCNF,4NF,5NF等。不同的級(jí)別范式性質(zhì)不同。滿足最低要求的叫第一范式,簡(jiǎn)稱INF。在第一范式
中滿足進(jìn)一步要求的為第二范式,其余以此類推。
R為第幾范式就可以寫成RexNF,
對(duì)于各種范式之間的聯(lián)系有5NFU4NFUBCNFU3NFU2NFUINF成立。
一個(gè)低一級(jí)范式的關(guān)系模式,通過(guò)模式分解可以轉(zhuǎn)換為若干個(gè)高一級(jí)范式的關(guān)系模式的集合,這種過(guò)程就叫
規(guī)范化。
一、第一范式(1NF)
關(guān)系模式的的每一個(gè)屬性都是不可再分的,則該關(guān)系模式稱為第一范式。
例1:
A1,A2,A&…人如…,An
/\
A
Akik2
例2:工資(工號(hào),姓名,工資(基本工資,年績(jī)津貼,煤電補(bǔ)貼))
△不滿足1NF的關(guān)系稱為非規(guī)范化關(guān)系。
△關(guān)系數(shù)據(jù)模型不能存儲(chǔ)上兩個(gè)例子(非規(guī)范化關(guān)系)
在關(guān)系數(shù)據(jù)庫(kù)中不允許非規(guī)范化關(guān)系的存在。
二、第二范式
若RWINF,且每一個(gè)非主屬性完全函數(shù)依賴于碼,則RE2NF,
例:關(guān)系模式S-L-C(SNO,SDEPT,SLOC,CNO,G)中SLOC為學(xué)生的住處,并且每個(gè)系的學(xué)生住在同一
個(gè)地方。
這里主碼為(SNO,CNO),函數(shù)依賴有:
(SNO,CNO)-G)
P
SNO-*SDEPT(SNOZCNO)—?SDEPT
SNO-SLOC(SNO,CNO)旦^SLOC,
一個(gè)關(guān)系模式R不屬于2NF,就會(huì)產(chǎn)生插入異常(如沒(méi)有選課的學(xué)生記錄插不進(jìn)去)、刪除異常(刪除選課記
錄會(huì)將學(xué)生信息刪除)、冗余度大(如系、地址都重復(fù)存放)。
分析上面的例子,可以發(fā)現(xiàn)問(wèn)題在于有兩種非主屬性。一種如G,它對(duì)碼是完全函數(shù)依賴。另一種如SDEPT、
SLOC對(duì)碼不是完全函數(shù)依賴。解決的辦法是用投影分解把關(guān)系模式S-L-C分解為兩個(gè)關(guān)系模式。
SC(SNO,CNO,G)
S-L(SNO,SDEPT,SLOC)
關(guān)系模式SC的碼為(SNO,CNO),關(guān)系模式S-L的碼為SNO,這樣就使得非主屬性對(duì)碼都是完全函數(shù)依賴
二、第二氾式
關(guān)系模式R〈U,F〉中若不存在這樣的碼X,屬性組Y及非主屬性Z(ZY)使得X~Y,(YX)Y-Z,成立,即如果
R的任何一個(gè)非主屬性都不傳遞依賴于它的任何一個(gè)侯選關(guān)鍵字,則稱R〈U,F>£3NFo
可以證明,若R£3NF,則每一個(gè)非主屬性既不部分依賴于碼也不傳遞依賴于碼。
在關(guān)系模式SC沒(méi)有傳遞依賴,關(guān)系模式S-L存在非主屬性對(duì)碼傳遞依賴。在S-L中,由SNO-SDEPT,(SDEPT
SNO),SDEPT~SLOC,可得SNOSLOC。因此SCW3NF,而S-L3NF。
一個(gè)關(guān)系模式R若不是3NF,就會(huì)產(chǎn)生插入異常、刪除異常、冗余度大等問(wèn)題。
解決的辦法同樣是將S-L分解為:
S-D(SNOZSDEPT)
D-L(SDEPTZSLOC)
分解后的關(guān)系模式S-D與D?L中不再存在傳遞依賴。
四、BC范式
關(guān)系模式R〈U,F〉W1NF。若X-Y且Y?X時(shí)X必含有碼,則R〈U,F>《BCNF。也就是詡關(guān)系模式R〈U,F〉
中,若每一個(gè)決定因素都包含碼,則R<UZF>eBCNFo
由BCNF的定義可以得到以下結(jié)論:
下面用幾個(gè)例子說(shuō)明屬于3NF的關(guān)系模式有的屬于BCNF,但有的不屬于BCNFo
例1:關(guān)系模式SJP(S,J,P)中,S是學(xué)生,J表示課程,P表示名次。每一個(gè)學(xué)生選修每門課程的成績(jī)有一定的
名次,每門課程中每一名次只有一個(gè)學(xué)生(即沒(méi)有并列名次)。由語(yǔ)義可得到下面的函數(shù)依賴:
(SJ)-P,o,p)fs
所以(S,J)與(J,P)都可以作為候選碼。這兩個(gè)碼各由兩個(gè)屬性組成,而且它們是相交的。這個(gè)關(guān)系模式中顯然
沒(méi)有屬性對(duì)碼傳遞依賴或部分依賴。所以SJP£3NF,而且除(S,J)與。P)以外沒(méi)有其它決定因素,所以SJPGBCNFo
例2:關(guān)系模式STJ(S,T,J)中,S表示學(xué)生,T表示教師,J表示課程。每一教師只教一門課。每門課有若干教
師,某一學(xué)生選定某門課,就對(duì)應(yīng)一個(gè)固定的教師。由語(yǔ)義可得到如下的函數(shù)依賴。
(S,J)-T,(S,T)-J
是第三范式,但是存在T-J,而T不是碼,所以不是了BC范式。
第三節(jié)關(guān)系模式的分解準(zhǔn)則
1.3關(guān)系模式的分解準(zhǔn)則
關(guān)系模式的規(guī)范化過(guò)程是通過(guò)對(duì)關(guān)系模式的分解來(lái)實(shí)現(xiàn)的。把低一級(jí)的關(guān)系模式分解
為若干個(gè)高一級(jí)的關(guān)系模式。這種分解不是唯一的。
1NF
|消除非主屬,性對(duì)碼的部分函數(shù)依賴
2NF
消除決定^<
|消除非主屬,性7寸碼的傳遞函數(shù)依賴
非碣相評(píng)凡3NF
|消除主屬,性對(duì)碼的部分和傳遞函數(shù)依賴
函數(shù)依賴
BCNF
I消除非平凡且非函數(shù)依賴的多值依賴
4NF
一個(gè)低級(jí)范式的關(guān)系模式,通過(guò)分解(投影)方法可轉(zhuǎn)換成多個(gè)高一級(jí)范式的關(guān)系模
式的集合,這種過(guò)程稱為規(guī)范化。
規(guī)范化的方式是進(jìn)行模式分解,模式分解的原則是與原模式等價(jià),模式分解的標(biāo)準(zhǔn)是:
?模式分解具有無(wú)損連接性
?模式分解能夠保持函數(shù)依賴
見(jiàn)P70頁(yè)表格
舉例:關(guān)系規(guī)范化過(guò)程
第一范式(1NF):如果一關(guān)系模式,它的每一個(gè)分量是不可分的數(shù)據(jù)項(xiàng),即其域?yàn)楹?jiǎn)
單域,則此關(guān)系模式為第一范式。
例:將學(xué)生簡(jiǎn)歷及選課等數(shù)據(jù)設(shè)計(jì)成一個(gè)關(guān)系模式STUDENT,其表示為:
STUDENT(SNO,SNAME,AGE,SEX,CLASS,DEPTNO,DEPTNAME,CNO,
CNAMEZSCORE,CREDIT)
設(shè)該關(guān)系模式滿足下列函數(shù)依賴:
F={SNO->SNAMEZSNO->AGEZSNO->SEXZ
SN。一>CLASS,CLASS--〉DEPTNO,DEPTNO->DEPTNAME,
CNO->CNAMEZSNO.CNO->SCOREZCNO->CREDIT}
由于該關(guān)系模式的每一屬性對(duì)應(yīng)的域?yàn)楹?jiǎn)單域,即其域值不可再分,符合第一范式定
義,所以STUDENT關(guān)系模式為第一范式。
第二范式(2NF):若關(guān)系模式R?1NF,且每個(gè)非主屬性完全函數(shù)依賴丁碼,則稱R?2NF。
分析一下關(guān)系模式STUDENT,它是不是2NF?
屬性組(SNO,CNO)為關(guān)系STUDENT的碼。
例如:SNAME非主屬性,根據(jù)碼的特性具有:SNO.CNO77SNAME
根據(jù)STUDENT關(guān)系模式已知函數(shù)依賴集,下列函數(shù)依賴成立:SNO??SNAME
所以對(duì)碼是部分函數(shù)依賴。同樣方法可得到除屬
SNO.CNO??SNAMEZSNAMESCORE
性外,其它非主屬性對(duì)碼也都是部分函數(shù)依賴。所以STUDENT關(guān)系模式不是2NF。
當(dāng)關(guān)系模式R是1NF而不是
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 普通述職報(bào)告
- 新應(yīng)急預(yù)案編制
- 保護(hù)家庭網(wǎng)絡(luò)安全的方法
- 股票實(shí)戰(zhàn)課件教學(xué)課件
- 交通安全人人有責(zé)
- DB1304T 492-2024農(nóng)村消防設(shè)施管理指南
- 傳媒經(jīng)營(yíng)管理
- 校園艾滋病健康
- 初中引體向上教案
- 菱形的性質(zhì)說(shuō)課稿
- 2024年中國(guó)遙控風(fēng)扇控制器市場(chǎng)調(diào)查研究報(bào)告
- 2024年江蘇省鹽城射陽(yáng)縣部分村(居)宣傳文化管理員招聘57人歷年高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 2024智慧園區(qū)系統(tǒng)建設(shè)規(guī)范
- 2024-2030年中國(guó)紡織服裝行業(yè)市場(chǎng)發(fā)展分析及發(fā)展趨勢(shì)與投資研究報(bào)告
- 肌肉筋膜疼痛綜合征
- 我與班集體共成長(zhǎng)主題班會(huì)
- 注冊(cè)資本金代繳協(xié)議書范本
- 機(jī)加車間工作思路
- 2024年大學(xué)英語(yǔ)四六級(jí)考試大綱詞匯
- 國(guó)家自然科學(xué)基金項(xiàng)目申報(bào)建議
- 人教版八年級(jí)數(shù)學(xué)上冊(cè)第15章《分式》全部教案(共12課時(shí))
評(píng)論
0/150
提交評(píng)論