商務(wù)智能理論與應(yīng)用3-數(shù)據(jù)庫_第1頁
商務(wù)智能理論與應(yīng)用3-數(shù)據(jù)庫_第2頁
商務(wù)智能理論與應(yīng)用3-數(shù)據(jù)庫_第3頁
商務(wù)智能理論與應(yīng)用3-數(shù)據(jù)庫_第4頁
商務(wù)智能理論與應(yīng)用3-數(shù)據(jù)庫_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 第一章第一章 緒緒 論論 1 2 數(shù)據(jù)管理技術(shù)的發(fā)展 數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu) 3 4 DB、DBMS和DBS 數(shù)據(jù)庫技術(shù)的發(fā)展 數(shù)據(jù)數(shù)據(jù):描述客觀事物的一組文字、數(shù)字描述客觀事物的一組文字、數(shù)字 和符號,它是和符號,它是客觀事物的反映和記錄??陀^事物的反映和記錄。 如:如:(李明,男,(李明,男,20,1992,江蘇,數(shù)理學(xué)院,信息,江蘇,數(shù)理學(xué)院,信息 與計算科學(xué)專業(yè),與計算科學(xué)專業(yè),2008) 信息信息:潛在于數(shù)據(jù)中的意義,它反映了潛在于數(shù)據(jù)中的意義,它反映了 客觀世界中各種事物的狀態(tài)與特征,它能客觀世界中各種事物的狀態(tài)與特征,它能 增長人的知識,影響接受者的行為。增長人的知識,影響接受者的行為

2、。 基本概念基本概念 1.1 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)管理技術(shù)的發(fā)展 數(shù)據(jù)處理:數(shù)據(jù)處理:對各種形式的數(shù)據(jù)進(jìn)行收集、存對各種形式的數(shù)據(jù)進(jìn)行收集、存 儲、加工和傳播的一系列活動的總和。其目儲、加工和傳播的一系列活動的總和。其目 的是從大量原始數(shù)據(jù)中抽取出對用戶有價值的是從大量原始數(shù)據(jù)中抽取出對用戶有價值 的信息,以作為行動和決策的依據(jù)。的信息,以作為行動和決策的依據(jù)。 信息信息=數(shù)據(jù)數(shù)據(jù)+數(shù)據(jù)處理數(shù)據(jù)處理 數(shù)據(jù)管理:數(shù)據(jù)管理:指對數(shù)據(jù)進(jìn)行分類、組織、編碼、指對數(shù)據(jù)進(jìn)行分類、組織、編碼、 存儲、檢索和維護(hù),是數(shù)據(jù)處理的中心問題。存儲、檢索和維護(hù),是數(shù)據(jù)處理的中心問題。 數(shù)據(jù)庫技術(shù)是應(yīng)數(shù)據(jù)管理任務(wù)的需

3、要而產(chǎn)生的數(shù)據(jù)庫技術(shù)是應(yīng)數(shù)據(jù)管理任務(wù)的需要而產(chǎn)生的 1.1 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)管理技術(shù)的發(fā)展 l人工管理階段(人工管理階段(2020世紀(jì)世紀(jì)5050年代中期以前)年代中期以前) l文件系統(tǒng)階段(文件系統(tǒng)階段(2020世紀(jì)世紀(jì)5050年代后期年代后期-60-60年代中期)年代中期) l數(shù)據(jù)庫系統(tǒng)階段(數(shù)據(jù)庫系統(tǒng)階段(2020世紀(jì)世紀(jì)6060年代后期年代后期今)今) 硬件硬件(外存貯器外存貯器) 和軟件的發(fā)展和軟件的發(fā)展 應(yīng)用需求擴大應(yīng)用需求擴大 數(shù)據(jù)管理技術(shù)經(jīng)歷了三個發(fā)展階段:數(shù)據(jù)管理技術(shù)經(jīng)歷了三個發(fā)展階段: 人工管理階段(人工管理階段(-50年代中期)年代中期) 應(yīng)用程序1應(yīng)用程序2應(yīng)用程

4、序n 數(shù)據(jù)集 1數(shù)據(jù)集 2數(shù)據(jù)集 n 計算機主要用于科學(xué)計算計算機主要用于科學(xué)計算 數(shù)據(jù)量小、結(jié)構(gòu)簡單。數(shù)據(jù)量小、結(jié)構(gòu)簡單。 外存為順序存取設(shè)備外存為順序存取設(shè)備 磁帶、卡片、紙帶,沒有磁磁帶、卡片、紙帶,沒有磁 盤等直接存取設(shè)備。盤等直接存取設(shè)備。 沒有操作系統(tǒng)及數(shù)據(jù)管理軟件沒有操作系統(tǒng)及數(shù)據(jù)管理軟件 用戶用機器指令編碼,通過紙用戶用機器指令編碼,通過紙 帶機輸入程序和數(shù)據(jù),程序運行完帶機輸入程序和數(shù)據(jù),程序運行完 畢后,由用戶取走紙帶和運算結(jié)果,畢后,由用戶取走紙帶和運算結(jié)果, 再讓下一用戶操作。再讓下一用戶操作。 用戶完全負(fù)責(zé)數(shù)據(jù)管理工作用戶完全負(fù)責(zé)數(shù)據(jù)管理工作 數(shù)據(jù)完全面向特定的應(yīng)用程

5、序數(shù)據(jù)完全面向特定的應(yīng)用程序 每個用戶使用自己的數(shù)據(jù),用每個用戶使用自己的數(shù)據(jù),用 完撤走不保存,無共享。完撤走不保存,無共享。 數(shù)據(jù)與程序沒有獨立性數(shù)據(jù)與程序沒有獨立性 程序中存取數(shù)據(jù)的子程序隨著程序中存取數(shù)據(jù)的子程序隨著 存儲結(jié)構(gòu)的改變而改變。存儲結(jié)構(gòu)的改變而改變。 背背 景景 特特 點點 文件系統(tǒng)階段(文件系統(tǒng)階段( 50年代后期年代后期-60年代中期)年代中期) 文件文件 系統(tǒng)系統(tǒng) 文件組1 文件組2 文件組 3 應(yīng)用程序1 應(yīng)用程序2 應(yīng)用程序n 計算機不但用于科學(xué)計算,計算機不但用于科學(xué)計算, 還用于管理。還用于管理。 外存有了磁盤、磁鼓等直接外存有了磁盤、磁鼓等直接 存取設(shè)備。存

6、取設(shè)備。 有了專門管理數(shù)據(jù)的軟件,有了專門管理數(shù)據(jù)的軟件, 一般稱為文件系統(tǒng)。一般稱為文件系統(tǒng)。 數(shù)據(jù)可以長期保存數(shù)據(jù)可以長期保存 數(shù)據(jù)與程序有一定的獨立性數(shù)據(jù)與程序有一定的獨立性 文件的邏輯結(jié)構(gòu)與存儲文件的邏輯結(jié)構(gòu)與存儲 結(jié)構(gòu)由系統(tǒng)進(jìn)行轉(zhuǎn)換結(jié)構(gòu)由系統(tǒng)進(jìn)行轉(zhuǎn)換 ,數(shù)據(jù)在存儲上的,數(shù)據(jù)在存儲上的 改變不一定反映在程序上。改變不一定反映在程序上。 共享性差、冗余度大共享性差、冗余度大 (一個文件對應(yīng)一個程序)(一個文件對應(yīng)一個程序) 背背 景景 特特 點點 數(shù)據(jù)庫系統(tǒng)階段(數(shù)據(jù)庫系統(tǒng)階段(60年代后期年代后期-) 應(yīng)用程序1 應(yīng)用程序2 應(yīng)用程序n 數(shù) 據(jù) 庫 數(shù)據(jù)庫 管理系統(tǒng) DBMS 計算機管

7、理的數(shù)據(jù)量大,關(guān)系復(fù)雜,計算機管理的數(shù)據(jù)量大,關(guān)系復(fù)雜, 共享性要求強(多種應(yīng)用、不同語言共享性要求強(多種應(yīng)用、不同語言 共享數(shù)據(jù))共享數(shù)據(jù)) 外存有了大容量磁盤,光盤外存有了大容量磁盤,光盤 軟件價格上升,硬件價格下降。軟件價格上升,硬件價格下降。 數(shù)據(jù)有整體的結(jié)構(gòu)性,數(shù)據(jù)有整體的結(jié)構(gòu)性,面向全組織,面向現(xiàn)實世界面向全組織,面向現(xiàn)實世界 由由DBMSDBMS統(tǒng)一存取,維護(hù)數(shù)據(jù)語義及結(jié)構(gòu)統(tǒng)一存取,維護(hù)數(shù)據(jù)語義及結(jié)構(gòu) 數(shù)據(jù)共享性好數(shù)據(jù)共享性好 數(shù)據(jù)與程序完全相互獨立數(shù)據(jù)與程序完全相互獨立 背背 景景 特特 點點 常見常見DBMS:Oracle, IBM DB2, Informix, Sybas

8、e, SQL Server, FoxPro, Access等等 例:學(xué)生基本信息記錄表例:學(xué)生基本信息記錄表: 學(xué)號姓名性別出生年月學(xué)院籍貫獎懲情況 200505101張三男1987/10/10數(shù)理學(xué)院廣東2005-06學(xué)年一 等獎學(xué)金 2005-06學(xué)年校 三好學(xué)生 200505102李四男1988/01/10數(shù)理學(xué)院河南 200505103錢紅女1987/05/21數(shù)理學(xué)院上海 200505106趙曉林女1989/02/10數(shù)理學(xué)院上海2005-06學(xué)年一 等獎學(xué)金 這個表格的缺點:有些同學(xué)的獎懲記錄很多,但大部分沒有,因此這個表格的缺點:有些同學(xué)的獎懲記錄很多,但大部分沒有,因此“獎懲情

9、況獎懲情況” 這一欄該留多大的位置很難確定,而且很難統(tǒng)計獎勵的次數(shù)這一欄該留多大的位置很難確定,而且很難統(tǒng)計獎勵的次數(shù) 修改后的記錄表:將學(xué)生基本信息和獎懲情況分開來修改后的記錄表:將學(xué)生基本信息和獎懲情況分開來 學(xué)號獎懲情況 2005051012005-06學(xué)年一等獎學(xué)金 2005051012005-06學(xué)年校三好學(xué)生 2005051062005-06學(xué)年一等獎學(xué)金 學(xué)號姓名性別出生年月學(xué)院籍貫 200505101張三男1987/10/10數(shù)理學(xué)院廣東 200505102李四男1988/01/10數(shù)理學(xué)院河南 200505103錢紅女1987/05/21數(shù)理學(xué)院上海 200505106趙曉林

10、女1989/02/10數(shù)理學(xué)院上海 . 獎懲情況表獎懲情況表 修改后的學(xué)生基本信息記錄表修改后的學(xué)生基本信息記錄表 特點:描述數(shù)據(jù)時不僅描述數(shù)據(jù)特點:描述數(shù)據(jù)時不僅描述數(shù)據(jù) 本身,還描述了數(shù)據(jù)間的聯(lián)系。本身,還描述了數(shù)據(jù)間的聯(lián)系。 數(shù)據(jù)庫系統(tǒng)的特點數(shù)據(jù)庫系統(tǒng)的特點 1. 1. 數(shù)據(jù)結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化-數(shù)據(jù)庫系統(tǒng)與文件系統(tǒng)數(shù)據(jù)庫系統(tǒng)與文件系統(tǒng)根本區(qū)別根本區(qū)別 即采用復(fù)雜的數(shù)據(jù)模型表示數(shù)據(jù)結(jié)構(gòu)即采用復(fù)雜的數(shù)據(jù)模型表示數(shù)據(jù)結(jié)構(gòu) 按照某種數(shù)據(jù)模型按照某種數(shù)據(jù)模型, ,將整個組織的全部數(shù)據(jù)組織成將整個組織的全部數(shù)據(jù)組織成 一個結(jié)構(gòu)化的數(shù)據(jù)整體,即實現(xiàn)了整體數(shù)據(jù)的結(jié)一個結(jié)構(gòu)化的數(shù)據(jù)整體,即實現(xiàn)了整體數(shù)據(jù)的結(jié)

11、 構(gòu)化。構(gòu)化。 數(shù)據(jù)模型不僅描述數(shù)據(jù)本身數(shù)據(jù)模型不僅描述數(shù)據(jù)本身, ,還描述了數(shù)據(jù)之間的還描述了數(shù)據(jù)之間的 聯(lián)系。聯(lián)系。 數(shù)據(jù)不再面向應(yīng)用,而是面向系統(tǒng),彈性更大。數(shù)據(jù)不再面向應(yīng)用,而是面向系統(tǒng),彈性更大。 存取方式更靈活,存取粒度可為數(shù)據(jù)項。存取方式更靈活,存取粒度可為數(shù)據(jù)項。 數(shù)據(jù)庫系統(tǒng)的特點數(shù)據(jù)庫系統(tǒng)的特點 2. 2. 數(shù)據(jù)的共享性高、冗余度低,易擴充數(shù)據(jù)的共享性高、冗余度低,易擴充 共享是指多用戶、多種應(yīng)用、多種語言互相覆共享是指多用戶、多種應(yīng)用、多種語言互相覆 蓋地共享數(shù)據(jù)集合。數(shù)據(jù)共享可減少數(shù)據(jù)冗余,蓋地共享數(shù)據(jù)集合。數(shù)據(jù)共享可減少數(shù)據(jù)冗余, 節(jié)約存儲空間,避免數(shù)據(jù)之間的不相容性與

12、不節(jié)約存儲空間,避免數(shù)據(jù)之間的不相容性與不 一致性。一致性。 數(shù)據(jù)不一致指同一數(shù)據(jù)不同拷貝的值不同。數(shù)據(jù)不一致指同一數(shù)據(jù)不同拷貝的值不同。 數(shù)據(jù)面向系統(tǒng)結(jié)構(gòu)化數(shù)據(jù)共享數(shù)據(jù)面向系統(tǒng)結(jié)構(gòu)化數(shù)據(jù)共享 系統(tǒng)易系統(tǒng)易 擴充。擴充。 數(shù)據(jù)庫系統(tǒng)的特點數(shù)據(jù)庫系統(tǒng)的特點 3. 數(shù)據(jù)獨立性高數(shù)據(jù)獨立性高 包括數(shù)據(jù)的包括數(shù)據(jù)的物理獨立性物理獨立性和和邏輯獨立性邏輯獨立性 物理獨立性:物理獨立性:指用戶的應(yīng)用程序與存儲在磁盤指用戶的應(yīng)用程序與存儲在磁盤 上的數(shù)據(jù)庫中的數(shù)據(jù)相互獨立。上的數(shù)據(jù)庫中的數(shù)據(jù)相互獨立。 邏輯獨立性:邏輯獨立性:指用戶的應(yīng)用程序與數(shù)據(jù)庫的邏指用戶的應(yīng)用程序與數(shù)據(jù)庫的邏 輯結(jié)構(gòu)相互獨立。輯結(jié)構(gòu)相

13、互獨立。 數(shù)據(jù)描述、定義從應(yīng)用程序中分離出來,獨立數(shù)據(jù)描述、定義從應(yīng)用程序中分離出來,獨立 于應(yīng)用程序而存在,相互獨立,互不依賴,大于應(yīng)用程序而存在,相互獨立,互不依賴,大 大簡化了應(yīng)用程序的設(shè)計維護(hù)的工作量。大簡化了應(yīng)用程序的設(shè)計維護(hù)的工作量。 數(shù)據(jù)庫系統(tǒng)的特點數(shù)據(jù)庫系統(tǒng)的特點 4. 4. 數(shù)據(jù)由數(shù)據(jù)由DBMSDBMS統(tǒng)一管理和控制統(tǒng)一管理和控制 共享一般是共享一般是并發(fā)并發(fā)的,即多個用戶可同時使用數(shù)據(jù)的,即多個用戶可同時使用數(shù)據(jù) 庫中的數(shù)據(jù)。庫中的數(shù)據(jù)。 DBMSDBMS應(yīng)提供如下功能:應(yīng)提供如下功能: 數(shù)據(jù)安全性保護(hù)數(shù)據(jù)安全性保護(hù) 數(shù)據(jù)完整性檢查(正確性、有效性、相容性)數(shù)據(jù)完整性檢查(

14、正確性、有效性、相容性) 并發(fā)控制并發(fā)控制 數(shù)據(jù)庫恢復(fù)數(shù)據(jù)庫恢復(fù) 人工管理階段人工管理階段文件系統(tǒng)階段文件系統(tǒng)階段數(shù)據(jù)庫系統(tǒng)階段數(shù)據(jù)庫系統(tǒng)階段 背背 景景 特特 點點 數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)化無結(jié)構(gòu)無結(jié)構(gòu) 數(shù)據(jù)管理技術(shù)數(shù)據(jù)管理技術(shù)三個發(fā)展階段的詳細(xì)比較三個發(fā)展階段的詳細(xì)比較 應(yīng)用背景應(yīng)用背景 科學(xué)計算科學(xué)計算 科學(xué)計算、管理科學(xué)計算、管理 大規(guī)模管理大規(guī)模管理 硬件背景硬件背景無直接存取存儲設(shè)備無直接存取存儲設(shè)備磁盤、磁鼓磁盤、磁鼓大容量磁盤大容量磁盤 軟件背景軟件背景沒有操作系統(tǒng)沒有操作系統(tǒng) 有文件系統(tǒng)有文件系統(tǒng)有有DBMS 處理方式處理方式批處理批處理 實時處理、批處理實時處理、批處理 數(shù)

15、據(jù)的管理者數(shù)據(jù)的管理者 用戶(程序員)用戶(程序員) 文件系統(tǒng)文件系統(tǒng) 數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng) 數(shù)據(jù)面向的對象數(shù)據(jù)面向的對象 某一應(yīng)用程序某一應(yīng)用程序 某一應(yīng)用某一應(yīng)用 現(xiàn)實世界現(xiàn)實世界 數(shù)據(jù)的共享程度數(shù)據(jù)的共享程度無共享,冗余度很大無共享,冗余度很大 共享性差,冗余度大共享性差,冗余度大共享性高,冗余度小共享性高,冗余度小 獨立性差獨立性差 實時處理、分布處實時處理、分布處 理、批處理理、批處理 具有高度的物理獨具有高度的物理獨 立性和一定的邏輯立性和一定的邏輯 獨立性獨立性 數(shù)據(jù)的獨立性數(shù)據(jù)的獨立性 不獨立,完全依靠不獨立,完全依靠 于程序于程序 記錄內(nèi)有結(jié)構(gòu)、記錄內(nèi)有結(jié)構(gòu)、 整體無

16、結(jié)構(gòu)整體無結(jié)構(gòu) 整體結(jié)構(gòu)化,用整體結(jié)構(gòu)化,用 數(shù)據(jù)模型描述數(shù)據(jù)模型描述 數(shù)據(jù)控制能力數(shù)據(jù)控制能力應(yīng)用程序自己控制應(yīng)用程序自己控制文件系統(tǒng)文件系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng) 1.2 1.2 數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu)數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu) 數(shù)據(jù)庫管理系統(tǒng)角度:數(shù)據(jù)庫管理系統(tǒng)角度:三級模式結(jié)構(gòu)三級模式結(jié)構(gòu) 最終用戶角度:最終用戶角度: 單用戶結(jié)構(gòu)單用戶結(jié)構(gòu) 主從式結(jié)構(gòu)主從式結(jié)構(gòu) 分布式結(jié)構(gòu)分布式結(jié)構(gòu) 內(nèi)部內(nèi)部 外部外部 1.2 1.2 數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu)數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu) 單用戶單用戶 主從式結(jié)構(gòu)主從式結(jié)構(gòu)分布式結(jié)構(gòu)分布式結(jié)構(gòu) 結(jié)結(jié) 構(gòu)構(gòu) 特特 點點 整個數(shù)據(jù)庫系統(tǒng)在整個數(shù)據(jù)庫系統(tǒng)在 一臺機器上,由一一臺機器上,由一 個用

17、戶獨占,不同個用戶獨占,不同 機器間不能共享數(shù)機器間不能共享數(shù) 據(jù)。據(jù)。 一個主機帶多個終端一個主機帶多個終端 的多用戶系統(tǒng)。數(shù)據(jù)的多用戶系統(tǒng)。數(shù)據(jù) 庫系統(tǒng)在主機上,所庫系統(tǒng)在主機上,所 有處理由主機完成,有處理由主機完成, 各用戶通過終端并發(fā)各用戶通過終端并發(fā) 地存取數(shù)據(jù)庫共享資地存取數(shù)據(jù)庫共享資 源。源。 數(shù)據(jù)庫中的數(shù)據(jù)在邏數(shù)據(jù)庫中的數(shù)據(jù)在邏 輯上是一個整體,但輯上是一個整體,但 物理上分布在計算機物理上分布在計算機 網(wǎng)絡(luò)的不同結(jié)點上。網(wǎng)絡(luò)的不同結(jié)點上。 網(wǎng)絡(luò)中的每個結(jié)點可網(wǎng)絡(luò)中的每個結(jié)點可 以執(zhí)行局部應(yīng)用和全以執(zhí)行局部應(yīng)用和全 局應(yīng)用。局應(yīng)用。 優(yōu)優(yōu) 點點 簡單易實現(xiàn)。簡單易實現(xiàn)。簡單,

18、數(shù)據(jù)易維護(hù)管簡單,數(shù)據(jù)易維護(hù)管 理。理。 難滿足大公司對數(shù)據(jù)難滿足大公司對數(shù)據(jù) 應(yīng)用的需求。應(yīng)用的需求。 缺缺 點點 不同部門數(shù)據(jù)不不同部門數(shù)據(jù)不 共享,冗余。共享,冗余。 用戶數(shù)增多時主機負(fù)用戶數(shù)增多時主機負(fù) 擔(dān)重性能下降,系統(tǒng)擔(dān)重性能下降,系統(tǒng) 可靠性不高??煽啃圆桓?。 數(shù)據(jù)管理維護(hù)難,系數(shù)據(jù)管理維護(hù)難,系 統(tǒng)效率受網(wǎng)絡(luò)制約。統(tǒng)效率受網(wǎng)絡(luò)制約。 1.2 1.2 數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu)數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu) 1.2 1.2 數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu)數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu) 模式:模式:是數(shù)據(jù)庫中全體數(shù)據(jù)的邏輯結(jié)構(gòu)和特征的是數(shù)據(jù)庫中全體數(shù)據(jù)的邏輯結(jié)構(gòu)和特征的 描述。描述。 實例:實例:模式的一個具體值。模式的一個具體值。 模式反

19、映的是數(shù)據(jù)的結(jié)構(gòu)及其聯(lián)系模式反映的是數(shù)據(jù)的結(jié)構(gòu)及其聯(lián)系相對穩(wěn)定相對穩(wěn)定 實例反映的是數(shù)據(jù)庫某一時刻的狀態(tài)實例反映的是數(shù)據(jù)庫某一時刻的狀態(tài)相對變動相對變動 第二章第二章 數(shù)據(jù)模型數(shù)據(jù)模型 1 2 數(shù)據(jù)模型的概念 E-R模型 3 面向?qū)ο竽P?2.1 數(shù)據(jù)模型的概念數(shù)據(jù)模型的概念 在數(shù)據(jù)庫中用數(shù)據(jù)模型這個工具來在數(shù)據(jù)庫中用數(shù)據(jù)模型這個工具來抽象、表示抽象、表示 和處理和處理現(xiàn)實世界中的數(shù)據(jù)和信息。通俗地講數(shù)現(xiàn)實世界中的數(shù)據(jù)和信息。通俗地講數(shù) 據(jù)模型就是現(xiàn)實世界的模擬據(jù)模型就是現(xiàn)實世界的模擬 數(shù)據(jù)模型應(yīng)滿足三方面要求數(shù)據(jù)模型應(yīng)滿足三方面要求: 能比較能比較真實地模擬真實地模擬現(xiàn)實世界現(xiàn)實世界 容易為

20、人所容易為人所理解理解 便于在計算機上便于在計算機上實現(xiàn)實現(xiàn) 2.1.1 數(shù)據(jù)的三個范疇數(shù)據(jù)的三個范疇 從事物的客觀從事物的客觀 特性到計算機中特性到計算機中 的數(shù)據(jù)表示,經(jīng)的數(shù)據(jù)表示,經(jīng) 歷了三個階段:歷了三個階段: 存在于人們頭腦之外存在于人們頭腦之外 的客觀世界的客觀世界. . 現(xiàn)實世界在人們頭腦現(xiàn)實世界在人們頭腦 中的反映,人們把它用中的反映,人們把它用 文字和符號記載下來。文字和符號記載下來。 信息世界的信息在信息世界的信息在 機器世界以數(shù)據(jù)形式機器世界以數(shù)據(jù)形式 存儲。存儲。 現(xiàn)實世界現(xiàn)實世界 信息世界信息世界 概念模型概念模型 機器世界機器世界 DBMS支持的數(shù)據(jù)模型支持的數(shù)據(jù)模

21、型 轉(zhuǎn)換轉(zhuǎn)換 認(rèn)識抽象認(rèn)識抽象 2.1.1 數(shù)據(jù)的三個范疇數(shù)據(jù)的三個范疇 1. 信息世界信息世界 相關(guān)術(shù)語相關(guān)術(shù)語 (1)(1)實體實體:客觀存在并可相互區(qū)別的事物。:客觀存在并可相互區(qū)別的事物。 實體可以是具體的對象(一個學(xué)生、一輛汽車),實體可以是具體的對象(一個學(xué)生、一輛汽車), 也可以是抽象的事件(一次借書,一次比賽)。也可以是抽象的事件(一次借書,一次比賽)。 (2)(2)實體集實體集:性質(zhì)相同的同類實體的集合。:性質(zhì)相同的同類實體的集合。 如:全體學(xué)生,全國足球聯(lián)賽的所有比賽。如:全體學(xué)生,全國足球聯(lián)賽的所有比賽。 (3)(3)屬性屬性:實體所具有的某一特性。:實體所具有的某一特性

22、。 一個實體可以由若干個屬性來刻畫,每個屬性有一個實體可以由若干個屬性來刻畫,每個屬性有 一個值域和類型。如:學(xué)生實體由學(xué)號、姓名等構(gòu)成。一個值域和類型。如:學(xué)生實體由學(xué)號、姓名等構(gòu)成。 (4)(4)碼碼:唯一標(biāo)識實體的屬性或?qū)傩约#何ㄒ粯?biāo)識實體的屬性或?qū)傩约?如:學(xué)號是學(xué)生實體的碼。如:學(xué)號是學(xué)生實體的碼。 2.1.1 數(shù)據(jù)的三個范疇數(shù)據(jù)的三個范疇 2.2.機器世界相關(guān)術(shù)語:機器世界相關(guān)術(shù)語: (1)(1)字段(數(shù)據(jù)項):字段(數(shù)據(jù)項):標(biāo)記實體屬性的命名單位,是標(biāo)記實體屬性的命名單位,是 可以命名的最小信息單位,往往和屬性名相同??梢悦淖钚⌒畔挝唬蛯傩悦嗤?。 例如:學(xué)生有

23、學(xué)號、姓名、年齡、性別等字段。例如:學(xué)生有學(xué)號、姓名、年齡、性別等字段。 (2)(2)記錄:記錄:字段的有序集合稱為記錄。一般用一個記字段的有序集合稱為記錄。一般用一個記 錄描述一個實體。錄描述一個實體。 例如:學(xué)生記錄:(學(xué)號,姓名,年齡,性別)。例如:學(xué)生記錄:(學(xué)號,姓名,年齡,性別)。 (3)(3)文件:文件:同一類記錄的匯集稱為文件。文件是描述同一類記錄的匯集稱為文件。文件是描述 實體集的。實體集的。 例如:所有學(xué)生記錄組成了一個學(xué)生文件。例如:所有學(xué)生記錄組成了一個學(xué)生文件。 (4)(4)碼:碼:能惟一標(biāo)識文件中每個記錄的字段或字段集,能惟一標(biāo)識文件中每個記錄的字段或字段集, 與實

24、體的碼相對應(yīng)。與實體的碼相對應(yīng)。 例如:學(xué)生的學(xué)號可以作為學(xué)生記錄的碼。例如:學(xué)生的學(xué)號可以作為學(xué)生記錄的碼。 機器世界和信息世界術(shù)語的對應(yīng)關(guān)系機器世界和信息世界術(shù)語的對應(yīng)關(guān)系 : : 信息世界信息世界 機器世界機器世界 實體實體記錄記錄 屬性屬性字段(數(shù)據(jù)項)字段(數(shù)據(jù)項) 實體集實體集文件文件 碼碼. .碼碼 2.1.1 數(shù)據(jù)的三個范疇數(shù)據(jù)的三個范疇 以學(xué)生數(shù)據(jù)為例表示信息在三個世界中的有關(guān)術(shù)以學(xué)生數(shù)據(jù)為例表示信息在三個世界中的有關(guān)術(shù) 語及其聯(lián)系語及其聯(lián)系 : : 2.2 E-R模型模型 2.2.1 2.2.1 基本概念基本概念 (1)(1)實體:實體:現(xiàn)實世界中客觀存在并可相互區(qū)別的事物

25、?,F(xiàn)實世界中客觀存在并可相互區(qū)別的事物。 (2)(2)屬性:屬性:實體所具有的某一特性稱為屬性。實體所具有的某一特性稱為屬性。 (3)(3)碼(碼(keykey):):唯一表示實體的屬性集稱為碼。唯一表示實體的屬性集稱為碼。 (4)(4)域(域(DomainDomain):):屬性的取值范圍。屬性的取值范圍。 (5 5)實體集:)實體集:具有相同特征或能用同樣特征描述的實體集合。具有相同特征或能用同樣特征描述的實體集合。 組成實體集的各實體稱為實體集的外延。組成實體集的各實體稱為實體集的外延。 例如:某單位所有員工稱為實體集例如:某單位所有員工稱為實體集EmployeeEmployee的外延。

26、的外延。 (6 6)實體型:)實體型:具有相同屬性的實體必然具有共同的特征和性質(zhì)。具有相同屬性的實體必然具有共同的特征和性質(zhì)。 用實體名及其屬性名集合來抽象和刻畫同類實體,稱為實體用實體名及其屬性名集合來抽象和刻畫同類實體,稱為實體 型。型。 例如:員工(員工編號、姓名、部門、性別、年齡、職稱)就例如:員工(員工編號、姓名、部門、性別、年齡、職稱)就 是一個實體型。是一個實體型。 2.2.1 基本概念基本概念 (7 7)聯(lián)系)聯(lián)系: 實體內(nèi)部的聯(lián)系:實體內(nèi)部的聯(lián)系:組成實體的各屬性之間的組成實體的各屬性之間的 聯(lián)系聯(lián)系(如:學(xué)號姓名)(如:學(xué)號姓名)。 實體之間的聯(lián)系實體之間的聯(lián)系:不同實體集

27、之間的聯(lián)系。不同實體集之間的聯(lián)系。 兩個實體型之間的聯(lián)系可分為三類:兩個實體型之間的聯(lián)系可分為三類: 1對對1聯(lián)系聯(lián)系(1:1) 1對多聯(lián)系對多聯(lián)系(1:n) 多對多聯(lián)系多對多聯(lián)系(m:n) 2.2.1 基本概念基本概念 1對對1聯(lián)系:聯(lián)系: 定義:若對于實體集定義:若對于實體集A A 中的每一個實體,實中的每一個實體,實 體集體集B B中中至多至多有一個實有一個實 體與之聯(lián)系,反之亦體與之聯(lián)系,反之亦 然,則稱實體集然,則稱實體集A A與實與實 體集體集B B具有一對一聯(lián)系,具有一對一聯(lián)系, 記為記為1:11:1。 例:部門例:部門-負(fù)責(zé)人負(fù)責(zé)人 實體型實體型A 聯(lián)系名聯(lián)系名 實體型實體型B

28、 1 1 位于位于 部門部門 負(fù)責(zé)人負(fù)責(zé)人 1 1 2.2.1 基本概念基本概念 1 1對多聯(lián)系對多聯(lián)系: : 定義:若對于實體集定義:若對于實體集A A中中 的每一個實體,實體集的每一個實體,實體集B B 中有中有n n個個實體實體(n0)(n0)與之與之 聯(lián)系,反之,對于實體集聯(lián)系,反之,對于實體集 B B中中的每一個實體,實體的每一個實體,實體 集集A A中中至多至多只有一個實體只有一個實體 與之聯(lián)系,則稱實體集與之聯(lián)系,則稱實體集A A 與實體集與實體集B B具有一對多聯(lián)具有一對多聯(lián) 系,記為系,記為1:n1:n。 例:部門例:部門-員工員工 實體型實體型A 聯(lián)系名聯(lián)系名 實體型實體型

29、B 1 n 屬于屬于 部門部門 員工員工 1 N 2.2.1 基本概念基本概念 多對多聯(lián)系多對多聯(lián)系: 定義:若對于實體集定義:若對于實體集A A 中的每一個實體,實體中的每一個實體,實體 集集B B中有中有n n個個實體實體(n0)(n0) 與之聯(lián)系,反之,對于與之聯(lián)系,反之,對于 對于實體集對于實體集B B中中的每一的每一 個實體,實體集個實體,實體集A A中也中也 有有m m個個實體實體(m0)(m0)與之與之 聯(lián)系,則稱實體集聯(lián)系,則稱實體集A A與與 實體集實體集B B具有多對多聯(lián)具有多對多聯(lián) 系,記為系,記為m:nm:n。 例:學(xué)生例:學(xué)生-課程課程 實體型實體型B 實體型實體型A

30、 聯(lián)系名聯(lián)系名 m n 選課選課 學(xué)生學(xué)生 課程課程 M N 2.2.1 基本概念基本概念 同一實體集內(nèi)的各實體之間也存在著一對一、同一實體集內(nèi)的各實體之間也存在著一對一、 一對多和多對多的聯(lián)系一對多和多對多的聯(lián)系. 員工員工 領(lǐng)導(dǎo)領(lǐng)導(dǎo) 1 n 同一實體集內(nèi)一對多聯(lián)系同一實體集內(nèi)一對多聯(lián)系 員工員工 配偶配偶 1 1 同一實體集內(nèi)一對一聯(lián)系同一實體集內(nèi)一對一聯(lián)系 2.2.1 基本概念基本概念 一般地,兩個以上實體型之間也存在著一對一、一般地,兩個以上實體型之間也存在著一對一、 一對多和多對多的聯(lián)系一對多和多對多的聯(lián)系. 學(xué)生學(xué)生 教師教師課程課程 選課選課 m nn 三個實體型之間的多對多關(guān)系

31、三個實體型之間的多對多關(guān)系 (8 8)弱實體集:)弱實體集: 在描述實體的過程中,有些實體集的屬性可能在描述實體的過程中,有些實體集的屬性可能 不足以形成主碼,需要依賴其他實體集中的部分不足以形成主碼,需要依賴其他實體集中的部分 屬性。這樣的實體集叫做弱實體集,不需要依賴屬性。這樣的實體集叫做弱實體集,不需要依賴 其他的實體的實體集稱為強實體集。其他的實體的實體集稱為強實體集。 例如一個單位的員工實體集例如一個單位的員工實體集EmployeeEmployee與工作履與工作履 歷實體集歷實體集CareerCareer,則工作履歷實體集,則工作履歷實體集CareerCareer是以是以 職工存在為

32、前提的,即工作履歷實體集職工存在為前提的,即工作履歷實體集CareerCareer是是 弱實體集。弱實體集。 2.2.1 基本概念基本概念 2.2.2 E-R圖設(shè)計圖設(shè)計 用用E-R圖來描述現(xiàn)實世界的概念模型。圖來描述現(xiàn)實世界的概念模型。 E-R圖提供了表示實體集、屬性和聯(lián)系的方法。圖提供了表示實體集、屬性和聯(lián)系的方法。 矩形框表示實體矩形框表示實體 橢圓形表示屬性橢圓形表示屬性 菱形表示聯(lián)系菱形表示聯(lián)系 連接實體型與聯(lián)系類型,也可用于表示實體與屬性的聯(lián)系連接實體型與聯(lián)系類型,也可用于表示實體與屬性的聯(lián)系 并注明種類;對構(gòu)成碼的屬性,在屬性名下畫一橫線表示并注明種類;對構(gòu)成碼的屬性,在屬性名下

33、畫一橫線表示。 注:用虛邊矩形和虛邊菱形分別表示弱實體和弱實體之間的聯(lián)系。注:用虛邊矩形和虛邊菱形分別表示弱實體和弱實體之間的聯(lián)系。 2.2.2 E-R圖設(shè)計圖設(shè)計 確定實體類型確定實體類型:幾個實體類型及相應(yīng)的實體名:幾個實體類型及相應(yīng)的實體名 確定聯(lián)系類型確定聯(lián)系類型:各實體類型之間是否有聯(lián)系,是:各實體類型之間是否有聯(lián)系,是 何種聯(lián)系類型及相應(yīng)的聯(lián)系名何種聯(lián)系類型及相應(yīng)的聯(lián)系名. . 連接實體類型和聯(lián)系類型,組合成連接實體類型和聯(lián)系類型,組合成E-RE-R圖圖 確定實體類型和聯(lián)系類型的屬性確定實體類型和聯(lián)系類型的屬性 確定實體類型的碼確定實體類型的碼 例:學(xué)生選修課程例:學(xué)生選修課程 學(xué)

34、生學(xué)生課程課程選修選修 姓名姓名學(xué)號學(xué)號系別系別 成績成績 用矩形表用矩形表 示實體示實體 用橢圓表示實體用橢圓表示實體 的屬性的屬性 用無向邊把用無向邊把 實體與其屬實體與其屬 性連接起來性連接起來 用菱形表示實體用菱形表示實體 間的聯(lián)系間的聯(lián)系 實體與聯(lián)系用線段實體與聯(lián)系用線段 連接并注明類型連接并注明類型 mn 課程號課程號課程名課程名學(xué)分學(xué)分 2.2.2 E-R圖設(shè)計圖設(shè)計-ER圖實例圖實例 舉例:為倉庫管理設(shè)計一個舉例:為倉庫管理設(shè)計一個E-R模型,該倉庫主要管理零模型,該倉庫主要管理零 件的入庫、出庫和采購等事項;倉庫根據(jù)需要向外面廠件的入庫、出庫和采購等事項;倉庫根據(jù)需要向外面廠

35、 家(供應(yīng)商)訂購零件,而許多工程項目需要倉庫供應(yīng)家(供應(yīng)商)訂購零件,而許多工程項目需要倉庫供應(yīng) 零件;一個倉庫有多個保管員。零件;一個倉庫有多個保管員。 實體有:實體有: 倉庫:倉庫:屬性有倉庫號、倉庫面積、電話號碼。屬性有倉庫號、倉庫面積、電話號碼。 零件:零件:屬性有零件號、名稱、規(guī)格、單價、描述。屬性有零件號、名稱、規(guī)格、單價、描述。 供應(yīng)商:供應(yīng)商:屬性有供應(yīng)商號、姓名、地址、電話號碼、帳屬性有供應(yīng)商號、姓名、地址、電話號碼、帳 號。號。 項目:項目:屬性有項目號、預(yù)算、開工日期。屬性有項目號、預(yù)算、開工日期。 職工:職工:屬性有職工號、姓名、年齡、職稱。屬性有職工號、姓名、年齡、

36、職稱。 2.2.2 E-R圖設(shè)計圖設(shè)計-ER圖實例圖實例 實體之間的聯(lián)系如下:實體之間的聯(lián)系如下: 一個倉庫可以存放多種零件,一種零件可以存一個倉庫可以存放多種零件,一種零件可以存 放在多個倉庫中,某種零件在某個倉庫中的數(shù)放在多個倉庫中,某種零件在某個倉庫中的數(shù) 量用庫存量描述。量用庫存量描述。 倉庫倉庫:零件零件 m : n 倉庫倉庫:職工職工1:n 職工實體集之間職工實體集之間1:n 供應(yīng)商供應(yīng)商:項目項目:零件零件 m : n :p 一個倉庫有多個職工當(dāng)倉庫保管員,一個職工一個倉庫有多個職工當(dāng)倉庫保管員,一個職工 只能在一個倉庫工作。只能在一個倉庫工作。 職工之間具有領(lǐng)導(dǎo)被領(lǐng)導(dǎo)的關(guān)系,即

37、倉庫主任職工之間具有領(lǐng)導(dǎo)被領(lǐng)導(dǎo)的關(guān)系,即倉庫主任 領(lǐng)導(dǎo)若干保管員。領(lǐng)導(dǎo)若干保管員。 一個供應(yīng)商可以供給若干項目多種零件,每個一個供應(yīng)商可以供給若干項目多種零件,每個 項目可以使用不同供應(yīng)商供應(yīng)的零件,每種零項目可以使用不同供應(yīng)商供應(yīng)的零件,每種零 件可由不同供應(yīng)商供給。件可由不同供應(yīng)商供給。 2.2.2 E-R圖設(shè)計圖設(shè)計-ER圖實例圖實例 如果某個部門的概念模型中涉及的實體和實體屬如果某個部門的概念模型中涉及的實體和實體屬 性較多,可以把實體及其屬性在另一個圖上畫出。性較多,可以把實體及其屬性在另一個圖上畫出。 實體及其屬性圖實體及其屬性圖 倉庫倉庫 倉庫號倉庫號面積面積電話號電話號 2.2

38、.2 E-R圖設(shè)計圖設(shè)計-ER圖實例圖實例 供應(yīng)商供應(yīng)商 項目項目零件零件 供應(yīng)供應(yīng) 供應(yīng)量供應(yīng)量 庫存庫存 倉庫倉庫 庫存量庫存量 職工職工 領(lǐng)導(dǎo)領(lǐng)導(dǎo) 工作工作 n m p m n 1n 1n 實體及其聯(lián)系圖實體及其聯(lián)系圖 2.2.2 E-R圖設(shè)計圖設(shè)計-ER圖實例圖實例 【例例2.12.1】某電力公司的配電物資存放在倉庫中,假某電力公司的配電物資存放在倉庫中,假 設(shè)一個倉庫可以存放多種物資,一種配電物資只設(shè)一個倉庫可以存放多種物資,一種配電物資只 能存放在一個倉庫中;一個配電搶修工程可能需能存放在一個倉庫中;一個配電搶修工程可能需 要多種配電物資,一種配電物資可以應(yīng)用到多個要多種配電物資,一種配電物資可以應(yīng)用到多個 搶修工程中。倉庫包含倉庫編號、倉庫名稱倉庫搶修工程中。倉庫包含倉庫編號、倉庫名稱倉庫 面積等屬性,配電物資包含物資編號、物資名稱、面積等屬性,配電物資包含物資編號、物資名稱、 單價、規(guī)格、數(shù)量等屬性,搶修工程包含工程編單價、規(guī)格、數(shù)量等屬性,搶修工程包含工程編 號、工程名稱、工程開始日期、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論