第二章 信息系統(tǒng)的技術(shù)基礎(chǔ)_第1頁
第二章 信息系統(tǒng)的技術(shù)基礎(chǔ)_第2頁
第二章 信息系統(tǒng)的技術(shù)基礎(chǔ)_第3頁
第二章 信息系統(tǒng)的技術(shù)基礎(chǔ)_第4頁
第二章 信息系統(tǒng)的技術(shù)基礎(chǔ)_第5頁
已閱讀5頁,還剩104頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第二章:數(shù)據(jù)存儲與分析技術(shù)本章主要內(nèi)容引言數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)庫環(huán)境下的數(shù)據(jù)管理數(shù)據(jù)庫設(shè)計數(shù)據(jù)庫設(shè)計的步驟實體聯(lián)系模型(E-R模型)數(shù)據(jù)模型關(guān)系數(shù)據(jù)庫的規(guī)范化數(shù)據(jù)庫操作常見關(guān)系型數(shù)據(jù)庫系統(tǒng)介紹數(shù)據(jù)庫技術(shù)的發(fā)展數(shù)據(jù)倉庫數(shù)據(jù)集市數(shù)據(jù)挖掘了解傳統(tǒng)的文件組織和管理技術(shù)了解傳統(tǒng)文件管理環(huán)境下存在的問題了解數(shù)據(jù)庫管理系統(tǒng)中數(shù)據(jù)的組織方法理解三種不同的數(shù)據(jù)庫組織模型掌握E-R模型和E-R圖的畫法掌握三范式理論掌握基本的數(shù)據(jù)庫操作方法了解數(shù)據(jù)庫技術(shù)的發(fā)展

本章學(xué)習(xí)目的國際著名調(diào)查機構(gòu)GartnerGroup在高級技術(shù)調(diào)查報告中,將數(shù)據(jù)分析和人工智能列為“未來三到五年內(nèi)將對工業(yè)產(chǎn)生深遠影響的五大關(guān)鍵技術(shù)”之首,還將并行處理體系和數(shù)據(jù)分析列為未來五年內(nèi)投資焦點的十大新興技術(shù)前兩位。Gartner的調(diào)查報告預(yù)計:到2010年,數(shù)據(jù)分析在相關(guān)市場的應(yīng)用將從目前少于5%增加到超過80%。在國外,數(shù)據(jù)分析已在金融、證券、電信、制造、統(tǒng)計、零售業(yè)等數(shù)據(jù)密集型行業(yè)實施,并取得巨大的效益。引言數(shù)據(jù)管理技術(shù)數(shù)據(jù)分析技術(shù)數(shù)據(jù)加密技術(shù)數(shù)據(jù)壓縮技術(shù)數(shù)據(jù)恢復(fù)技術(shù)一、數(shù)據(jù)處理技術(shù)引言數(shù)據(jù)存儲技術(shù)數(shù)據(jù)檢索技術(shù)數(shù)據(jù)挖掘技術(shù)二、數(shù)據(jù)管理技術(shù)數(shù)據(jù)倉庫技術(shù)引言內(nèi)容管理產(chǎn)生于20世紀80年代中后期,其需求主要來自于非結(jié)構(gòu)化數(shù)據(jù)管理的需要。目前,在大多數(shù)情況下,內(nèi)容管理特指用于非結(jié)構(gòu)化數(shù)據(jù)管理的技術(shù)。內(nèi)容管理是借助信息技術(shù),通過收集、創(chuàng)建、管理和發(fā)布內(nèi)容,實現(xiàn)內(nèi)容在企業(yè)內(nèi)部以及企業(yè)之間的傳播和共享的過程。數(shù)據(jù)管理技術(shù)的重要方向-內(nèi)容管理引言數(shù)據(jù)組織層次描述字段:屬性的特定值。記錄:記錄由字段組成,其中字段代表了實體對象的各種屬性。一條記錄由一個或者多個字段組成。文件:多個相關(guān)記錄的集合形成數(shù)據(jù)庫:由多個在系統(tǒng)執(zhí)行過程中相互關(guān)聯(lián)的文件組成。位字符數(shù)據(jù)元(字段)記錄文件數(shù)據(jù)庫引言三、數(shù)據(jù)的組織層次數(shù)據(jù)庫文件記錄文件1文件2文件3文件3文件n記錄n記錄1記錄n記錄1記錄n記錄1字段n字段1字段n字段1字段n字段1字段字符n字符1字符n字符1字符引言計算機系統(tǒng)是按層次組織數(shù)據(jù)的,首先由位組成字節(jié),字節(jié)組成字段(數(shù)據(jù)元),向上依次組成記錄、文件和數(shù)據(jù)庫。位(Bit)是計算機中最小的數(shù)據(jù)單位,其值為0或1。計算機只能檢測到電脈沖信號的有無。電脈沖信號出現(xiàn)高電平表示‘1’,電脈沖信號為低電平表示‘0’。一個位表示二進制數(shù)據(jù)‘0’或‘1’,多個位組成字節(jié)(Byte),一個字節(jié)代表一個字符,字符可以是字母、數(shù)字或其他符號;多個字符組成一個詞或一個完整的數(shù)字,稱為字段、數(shù)據(jù)項或域(Field);若干個相關(guān)的字段組成一個記錄(Record);若干同類型的記錄組成一個文件(File);若干相關(guān)文件的集合組成一個數(shù)據(jù)庫(Database)。如下圖所示,比特、字符、字段、記錄、文件和數(shù)據(jù)庫構(gòu)成了數(shù)據(jù)層次,數(shù)據(jù)庫中不僅包括了所有這些數(shù)據(jù)層次,還包括了它們之間的關(guān)系。引言數(shù)據(jù)實體、屬性和鍵實體:指必須保存信息的人、地點、事物或事件,如員工、客戶、訂單等。實體是個體的集合,實體中的個體稱為實例。屬性:指對特定實體特征或性質(zhì)的描述,如訂單的訂單號、日期、數(shù)量,員工的姓名、年齡、性別等。鍵(Key):記錄中用于標識該記錄的一個或多個字段。主鍵是唯一標識該記錄的一個或多個字段。不能唯一標識記錄的字段叫次鍵。

數(shù)據(jù)管理技術(shù)的發(fā)展經(jīng)過了三個階段:人工管理:50年代中期以前文件管理:50年代后期到60年代中期數(shù)據(jù)庫管理:60年代后期開始、DBMS廣泛應(yīng)用數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)訪問應(yīng)用模型數(shù)據(jù)訪問的發(fā)展史一層(單機)客戶端邏輯業(yè)務(wù)邏輯數(shù)據(jù)存儲三層“瘦客戶端”n層兩層“胖客戶端”InternetXMLWebService發(fā)展階段描述人工管理數(shù)據(jù)和程序相互依賴:數(shù)據(jù)保存在處理程序中或隨程序進行人機交互地輸入,數(shù)據(jù)處理后將結(jié)果輸出。文件管理數(shù)據(jù)存放在永久性的系統(tǒng)文件中,供與之相對應(yīng)的應(yīng)用程序調(diào)用,應(yīng)用程序和數(shù)據(jù)文件相互獨立,數(shù)據(jù)文件可以長期保存。數(shù)據(jù)管理技術(shù)的發(fā)展...

獎金文件

工資文件

...

產(chǎn)品文件

銷售文件

...

物料文件

計劃文件

數(shù)據(jù)文件工資程序銷售程序計劃程序應(yīng)用程序財務(wù)部門銷售部門計劃部門用戶數(shù)據(jù)報表發(fā)展階段缺點人工管理程序不具有獨立性,靈活性差。應(yīng)用程序之間無法共享數(shù)據(jù)。數(shù)據(jù)不能永久保存文件管理數(shù)據(jù)冗余和不一致并發(fā)訪問異常缺乏靈活性安全性差數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)庫

數(shù)據(jù)庫(DB--Database)是以一定的組織方式存儲在一起的互相關(guān)聯(lián)的數(shù)據(jù)的集合(邏輯相關(guān)的記錄和文件的集合)。數(shù)據(jù)庫管理系統(tǒng)

數(shù)據(jù)庫管理系統(tǒng)(DBMS--DatabaseManagementSystem)是對數(shù)據(jù)庫進行管理的特定軟件。通常所說的數(shù)據(jù)庫管理系統(tǒng)是指DBMS,而不是指具體的數(shù)據(jù)庫Database。一、數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)和數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)庫環(huán)境下的數(shù)據(jù)管理數(shù)據(jù)庫系統(tǒng)

口語中常說的“數(shù)據(jù)庫系統(tǒng)”在大多數(shù)時候都是指DBMS。但是嚴格來說,數(shù)據(jù)庫系統(tǒng)(DBS--DatabaseSystem是指在計算機系統(tǒng)中引入數(shù)據(jù)庫之后的系統(tǒng),一般由數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)(及其開發(fā)工具)、應(yīng)用系統(tǒng)、數(shù)據(jù)庫管理員(DBA--DatabaseAdministrator)和用戶構(gòu)成。即:DBS=DB+DBMS+APPLICATION+DBA+USER數(shù)據(jù)庫環(huán)境下的數(shù)據(jù)管理數(shù)據(jù)庫管理系統(tǒng)的目的:就是為了解決前面提到的在文件處理系統(tǒng)中存在的一些問題:數(shù)據(jù)冗余和不一致數(shù)據(jù)訪問困難數(shù)據(jù)孤立靈活性差并發(fā)訪問異常安全性問題由于這些問題,數(shù)據(jù)庫管理系統(tǒng)提出了很多新的概念和算法,加速了DBMS的發(fā)展。二、數(shù)據(jù)庫管理系統(tǒng)(DBMS)數(shù)據(jù)庫環(huán)境下的數(shù)據(jù)管理數(shù)據(jù)庫管理系統(tǒng)的功能就是:數(shù)據(jù)庫環(huán)境下的數(shù)據(jù)管理創(chuàng)建和修改數(shù)據(jù)庫。存儲和檢索數(shù)據(jù)。操縱數(shù)據(jù)和生成報表。保證所存儲數(shù)據(jù)的安全性。數(shù)據(jù)被多用戶共享時,要避免可能產(chǎn)生的異常結(jié)果(并發(fā)控制)。Windows2000/UnixDBMS(Oraccle/DB2/SQLServer/Sybase)財務(wù)管理程序Windows2000/Unix銷售部財務(wù)部計劃部計劃數(shù)據(jù)工資數(shù)據(jù)銷售數(shù)據(jù)銷售管理程序計劃管理程序數(shù)據(jù)的數(shù)據(jù)庫管理環(huán)境數(shù)據(jù)共享減少數(shù)據(jù)冗余提高了數(shù)據(jù)的一致性數(shù)據(jù)與應(yīng)用程序之間的獨立性提高了數(shù)據(jù)的安全性三、數(shù)據(jù)庫管理的優(yōu)點數(shù)據(jù)庫環(huán)境下的數(shù)據(jù)管理

數(shù)據(jù)庫設(shè)計是建立數(shù)據(jù)庫及其應(yīng)用系統(tǒng)的技術(shù),是信息系統(tǒng)開發(fā)和建設(shè)中的核心技術(shù)。具體說,數(shù)據(jù)庫設(shè)計是指對于一個給定的應(yīng)用環(huán)境,構(gòu)造最優(yōu)的數(shù)據(jù)庫模式,建立數(shù)據(jù)庫及其應(yīng)用系統(tǒng),使之能夠有效地存儲數(shù)據(jù),滿足各種用戶的應(yīng)用需求(信息要求和處理要求)。數(shù)據(jù)庫合理的結(jié)構(gòu)和組織是信息系統(tǒng)分析、設(shè)計時需要考慮的一個重要方面。數(shù)據(jù)庫設(shè)計一、什么是數(shù)據(jù)庫設(shè)計數(shù)據(jù)庫設(shè)計轉(zhuǎn)換12信息世界(觀念世界)概念模型3數(shù)據(jù)世界(機器世界)數(shù)據(jù)模型字段記錄文件實體集實體屬性現(xiàn)實世界事物類事物性質(zhì)認識抽象二、人們對客觀事物的認識和描述過程現(xiàn)實世界的自行車數(shù)據(jù)庫設(shè)計觀念世界的自行車信息模型(概念模型)數(shù)據(jù)庫設(shè)計數(shù)據(jù)世界的自行車中國鐵路網(wǎng)絡(luò)圖信息模型(概念模型)數(shù)據(jù)庫設(shè)計階段描述需求分析分析用戶的需求:數(shù)據(jù)、功能和性能概念結(jié)構(gòu)設(shè)計根據(jù)用戶需求設(shè)計概念數(shù)據(jù)模型,主要使用E-R模型,畫E-R圖邏輯結(jié)構(gòu)設(shè)計將概念模型轉(zhuǎn)換成DBMS支持的數(shù)據(jù)模型,主要是將E-R模型轉(zhuǎn)換成關(guān)系模型數(shù)據(jù)庫物理結(jié)構(gòu)設(shè)計選擇合適的存儲結(jié)構(gòu)和存取路徑數(shù)據(jù)庫的實施包括編程、測試和試運行數(shù)據(jù)庫運行與維護系統(tǒng)運行與數(shù)據(jù)庫的日常維護按規(guī)范的設(shè)計方法,一個完整的數(shù)據(jù)庫設(shè)計一般分為以下六個階段:數(shù)據(jù)庫設(shè)計三、數(shù)據(jù)庫設(shè)計的步驟需求收集和分析設(shè)計概念結(jié)構(gòu)設(shè)計邏輯結(jié)構(gòu)數(shù)據(jù)模型優(yōu)化設(shè)計物理結(jié)構(gòu)評價設(shè)計,性能預(yù)測物理實現(xiàn)試驗性運行使用、維護數(shù)據(jù)庫四、數(shù)據(jù)庫設(shè)計的流程數(shù)據(jù)庫設(shè)計需求信息收集初步調(diào)查詳細調(diào)查(目的、內(nèi)容、方法)需求信息的分析整理業(yè)務(wù)流程數(shù)據(jù)流程、數(shù)據(jù)字典

1.需求分析數(shù)據(jù)庫設(shè)計五、數(shù)據(jù)庫設(shè)計各階段的任務(wù):需求分析目標

是把現(xiàn)實世界中的客觀對象抽象為某種信息結(jié)構(gòu),設(shè)計出反映某個組織部門信息需求的數(shù)據(jù)庫系統(tǒng)概念模式,它獨立于數(shù)據(jù)庫系統(tǒng)的邏輯結(jié)構(gòu)、獨立于數(shù)據(jù)庫管理系統(tǒng)(DBMS)、獨立于計算機系統(tǒng)。設(shè)計方法

是在需求分析的基礎(chǔ)上,用概念數(shù)據(jù)模型(例如E-R模型)表示數(shù)據(jù)及數(shù)據(jù)之間的相互聯(lián)系,設(shè)計出反映用戶信息需求和處理需求的數(shù)據(jù)庫系統(tǒng)概念模式。

2.概念結(jié)構(gòu)設(shè)計數(shù)據(jù)庫設(shè)計五、數(shù)據(jù)庫設(shè)計各階段的任務(wù):概念結(jié)構(gòu)設(shè)計(1)實體聯(lián)系模型(E-R模型:Entity-Relationship)E-R模型是這樣認識現(xiàn)實世界的:現(xiàn)實世界是由一組稱作實體的基本對象以及這些對象間的聯(lián)系構(gòu)成的。實體(Entity):“實體”是觀念世界中描述客觀事物的概念。實體可以是人,也可以是物或事件;可以指事物本身,也可指事物之間的聯(lián)系,例如一個人、一件物品、一個部門、一個銀行帳戶等都是一個實體。實體可以通過屬性集合來描述。屬性:“屬性”是指實體具有的某種特性。如人有身高、體重、年齡、性別等屬性。聯(lián)系:“聯(lián)系”是事物間的相互關(guān)聯(lián)。在信息世界中,事物之間的聯(lián)系可分為兩類:一是實體內(nèi)部的聯(lián)系,一是實體之間的聯(lián)系.數(shù)據(jù)庫設(shè)計(2)實體之間的聯(lián)系一對一聯(lián)系(1:1)對于實體集A中的每一實體,實體集B中至多有一個實體與之聯(lián)系。反之亦然。一對多聯(lián)系(1:N)對于實體集A中的每一實體,實體集B中有N個實體與之聯(lián)系。反之,對于實體集B中每一實體,實體集A中至多只有一個實體與之聯(lián)系。

多對多聯(lián)系(M:N)對于實體集A中的每一實體,實體集B中有N個實體與之聯(lián)系,對于實體集B中每一個實體,實體集A中有M個實體與之聯(lián)系。數(shù)據(jù)庫設(shè)計(3)實體-聯(lián)系方法(Entity-RelationApproach)概念模型最常用的表示方法是實體-聯(lián)系方法(Entity-RelationApproach,簡稱E-R方法)。E-R方法通過E-R圖來描述某一組織的信息模型。E-R圖由以下元素構(gòu)成:矩形:代表實體集(具有相同屬性或特征的實體集合);

橢圓:代表實體屬性;菱形:代表實體間的聯(lián)系集(同一類型的所有聯(lián)系的集合);線段:將屬性與實體集相連或?qū)嶓w集與聯(lián)系集相連。數(shù)據(jù)庫設(shè)計E-R圖示例客戶帳戶存款/取款身份證號客戶名客戶街道客戶城市帳戶號余額電話數(shù)據(jù)庫設(shè)計聯(lián)系名聯(lián)系名聯(lián)系名實體A實體B實體A實體B實體A實體B11m1nn(4)實體之間聯(lián)系類型的E-R表示數(shù)據(jù)庫設(shè)計管理廠長工廠11數(shù)據(jù)庫設(shè)計存放倉庫商品1n數(shù)據(jù)庫設(shè)計

如對于學(xué)生、課程和教師這三個實體,若規(guī)定每個學(xué)生可以選擇多門課程,每門課程可以被多個學(xué)生選修,每門課程惟一對應(yīng)一個任課教師,一個教師可以講授多門課程。則學(xué)生、課程和教師這三個實體之間的E-R圖可表示為:學(xué)生教師課程學(xué)習(xí)講授學(xué)號成績課程號教材教師號mnp1(5)三個或更多實體相互聯(lián)系的情況數(shù)據(jù)庫設(shè)計(6)設(shè)計E-R圖的過程E-R圖設(shè)計過程實際是對數(shù)據(jù)進行歸納、分析、抽象的過程,首先把企業(yè)的有關(guān)數(shù)據(jù)綜合組織,然后根據(jù)不同用戶對數(shù)據(jù)的使用需求進行分組,再從局部入手,建立局部E-R模型,再綜合成總體E-R模型。確定實體集確定聯(lián)系和聯(lián)系類型(1:1或1:n)設(shè)計局部及整體的E-R圖確定屬性將E-R圖優(yōu)化數(shù)據(jù)庫設(shè)計數(shù)據(jù)庫設(shè)計在數(shù)據(jù)分析的基礎(chǔ)上,就可以著手設(shè)計概念結(jié)構(gòu)。設(shè)計初步E-R圖的步驟①先設(shè)計局部E-R圖,也稱用戶視圖②綜合各局部E-R圖,形成總的E-R圖,即用戶視圖的集成。也稱基本E-R圖(全局E-R圖)

在設(shè)計初步E-R圖時,要盡量能充分地把組織中各部門對信息的要求集中起來,而不需要考慮數(shù)據(jù)的冗余問題。局部概念模型設(shè)計是從用戶的觀點出發(fā),設(shè)計符合用戶需求的概念結(jié)構(gòu)。局部概念模型設(shè)計的就是組織、分類收集到的數(shù)據(jù)項,確定哪些數(shù)據(jù)項作為實體,哪些數(shù)據(jù)項作為屬性,哪些數(shù)據(jù)項是同一實體的屬性等。確定實體與屬性的原則:

能作為屬性的盡量作為屬性而不要劃為實體;作為屬性的數(shù)據(jù)項不能再用其他屬性加以描述,也不能與其他實體或?qū)傩园l(fā)生聯(lián)系。①設(shè)計局部E-R圖數(shù)據(jù)庫設(shè)計倉庫存放物資1n物資a.倉庫作為屬性b.倉庫作為實體數(shù)據(jù)庫設(shè)計學(xué)生選課課程學(xué)生選課課程出生日期學(xué)號姓名性別系別出生日期何時入學(xué)獎學(xué)金成績課程號選/必教師課程名學(xué)分學(xué)號姓名性別系別入學(xué)時間碩/博成績課程號學(xué)分教師課程名學(xué)位課教務(wù)處學(xué)生管理的E-R模型圖研究生院學(xué)生管理的局部E-R模型圖數(shù)據(jù)庫設(shè)計②設(shè)計全局E-R圖

局部E-R圖的設(shè)計從局部的需求出發(fā),比一開始就設(shè)計全局E-R圖要簡單得多、單純得多。有了各個局部E-R圖,就可通過局部E-R圖的集成設(shè)計全局E-R圖。在進行局部E-R圖集成時,需按照下面三個步驟來進行:

確認局部E-R模型圖中的對應(yīng)關(guān)系和沖突

對應(yīng)關(guān)系是指局部E-R圖中語義都相同的概念,也就是它們的共同部分;沖突指相互之間有矛盾的概念。常見的沖突有下列4種:數(shù)據(jù)庫設(shè)計

命名沖突

命名沖突有同名異義和同義異名兩種。例如,在例1給出的圖中,“學(xué)生”和“課程”這兩個實體集在教務(wù)處的局部E-R圖和研究生院的局部E-R圖中含義是不同的:在教務(wù)處的局部E-R圖中學(xué)生是指大學(xué)生、大學(xué)生的課程,在研究生院的局部E-R圖中是指研究生和研究生課程,這屬于同名異義;在教務(wù)處的局部E-R圖中學(xué)生實體集有“何時入學(xué)”這一個屬性,在研究生院的局部E-R圖中有“入學(xué)日期”這一屬性,兩者是同義異名。

數(shù)據(jù)庫設(shè)計概念沖突

同一個概念在一個局部E-R圖中可能作為實體集,在另一局部E-R圖中可能作為屬性或聯(lián)系。例如,在上面給出的圖中,如果用戶要求,選課也可以作為實體集,而不作為聯(lián)系。域沖突

相同的屬性在不同的局部E-R圖中有不同的域,例如,學(xué)號在一個局部E-R圖中可能當作字符串,在另一個局部E-R圖中可能當作整數(shù)。相同的屬性采用不同的度量單位,稱為域沖突。數(shù)據(jù)庫設(shè)計約束沖突

不同局部E-R圖可能有不同的約束;例如,對于“選課”這個聯(lián)系,大學(xué)生和研究生對選課的最少門數(shù)和最多門數(shù)的限定可能不一樣。

數(shù)據(jù)庫設(shè)計對局部E-R圖進行某些修改,解決部門沖突

解決部門的沖突是對各個部門中存在的命名沖突、概念沖突、域沖突、約束沖突按照統(tǒng)一的規(guī)范定義。如在例1的圖中,“入學(xué)日期”和“何時人學(xué)”兩個屬性名可以統(tǒng)一成“入學(xué)日期”,學(xué)號統(tǒng)一用字符串表示,學(xué)生分為大學(xué)生和研究生兩類,課程也分為本科生課程和研究生課程兩類等。合并局部E-R圖,形成全局模式

數(shù)據(jù)庫設(shè)計學(xué)生選課課程學(xué)號姓名性別系別出生日期入學(xué)時間學(xué)生類別成績課程號學(xué)分教師課程名課程類別數(shù)據(jù)庫設(shè)計產(chǎn)品零件組成產(chǎn)品號產(chǎn)品名性能參數(shù)零件數(shù)零件號材料名耗用量產(chǎn)品使用材料存放倉庫產(chǎn)品號產(chǎn)品名價格用量材料號材料名價格存放量倉庫名倉庫號地點技術(shù)部門E-R圖供應(yīng)部門E-R圖數(shù)據(jù)庫設(shè)計消耗產(chǎn)品零件材料倉庫消耗產(chǎn)品號產(chǎn)品名性能參數(shù)零件號材料名價格耗用量2存放量材料號材料名價格倉庫號倉庫名地點耗用量1數(shù)量合并后的E-R模型圖存放組成數(shù)據(jù)庫設(shè)計綜合后的E-R模型圖組成消耗產(chǎn)品零件材料倉庫產(chǎn)品號產(chǎn)品名性能參數(shù)零件數(shù)零件號材料名價格耗用量2存放量材料號材料名價格倉庫號倉庫名地點存量數(shù)據(jù)庫設(shè)計1n1n1nn11n1n1n1nn1n1物料需求計劃報價采購訂單供應(yīng)商請購單采購訂單明細物料代碼檢驗單入庫單供應(yīng)商評估表收貨單生成送貨合并參照2入庫參照1收貨檢驗評估組成采購系統(tǒng)E-R圖數(shù)據(jù)庫設(shè)計設(shè)計某工廠物資管理的概念模型(畫出E-R圖)。

物資管理涉及的實體有:倉庫(倉庫號,倉庫面積,倉庫地點)

材料(材料編號,名稱,規(guī)格,單價)

供應(yīng)商(供應(yīng)商編號,聯(lián)系人,地址,電話,帳號)

采購員(編號,姓名,電話,郵箱)

實體間的聯(lián)系:

·一個倉庫可以存放多種材料,一種材料可以存放在多個倉庫中。

·一種材料只能一個采購員采購,一個采購員可以采購多種材料。

·一個供應(yīng)商只能供應(yīng)一種材料,一種材料可由多個供應(yīng)商供應(yīng)。作業(yè)題

實體及其屬性圖倉庫面積地點倉庫號采購員電話姓名郵箱編號供應(yīng)商地址聯(lián)系人電話號供應(yīng)商號帳號材料規(guī)格名稱單價材料編號供應(yīng)商材料采購員供應(yīng)供應(yīng)量采購量采購11nm存放倉庫pm實體聯(lián)系圖(1)數(shù)據(jù)模型

數(shù)據(jù)模型是描述計算機世界中數(shù)據(jù)及數(shù)據(jù)之間的關(guān)系及存儲、處理特征的模型,它依賴于具體的計算機。在數(shù)據(jù)庫系統(tǒng),對現(xiàn)實世界中數(shù)據(jù)的抽象、描述以及處理等都是通過數(shù)據(jù)模型來實現(xiàn)的,數(shù)據(jù)模型是數(shù)據(jù)庫系統(tǒng)實現(xiàn)的基礎(chǔ)。目前,在實際數(shù)據(jù)庫系統(tǒng)中支持的數(shù)據(jù)模型主要有三種:關(guān)系模型、網(wǎng)狀模型和層次模型。數(shù)據(jù)庫設(shè)計五、數(shù)據(jù)庫設(shè)計各階段的任務(wù):邏輯結(jié)構(gòu)設(shè)計4.邏輯結(jié)構(gòu)設(shè)計關(guān)系模型:關(guān)系模型是用表的集合來表示數(shù)據(jù)和數(shù)據(jù)間的聯(lián)系。每個表有多個列,每列有唯一的列名。在關(guān)系模型下,數(shù)據(jù)的邏輯結(jié)構(gòu)是一張二維表。關(guān)系模型中的有關(guān)術(shù)語:關(guān)系:一個關(guān)系對應(yīng)一張二維表元組:表中一行稱為一個元組;屬性:表中一列稱為一個屬性,列名即為屬性名;主碼:表中的某個屬性組,它的值惟一地標識一個元組。域:屬性的取值范圍;分量:元組中的一個屬性值。關(guān)系模式:對關(guān)系的描述,用關(guān)系名(屬性1,屬性2,…屬性n)來表示。數(shù)據(jù)庫設(shè)計PrimaryKeyEmployeeIDNameagesex…1001張興22男…1002李靜26女…1003王進28男…1004黃三28男…EmployeeID學(xué)號姓名課程代碼課程名稱成績1001張三005電子商務(wù)901001張三006企業(yè)管理951002李四005電子商務(wù)951002李四006企業(yè)管理90學(xué)號課程代碼PrimaryKeyProduct_quantity元組productidorderidtotal_quantityB0001D000195B0002D000215B0003D00035B0004D000410B0005D000535B0006D000610B0007D000725B0008D000845B0009D000915B00010D0001030Product_quantity(productid,orderid,total_quantity)PrimaryKey數(shù)據(jù)庫設(shè)計層次模型用樹型結(jié)構(gòu)表示實體集之間的聯(lián)系(描述數(shù)據(jù))。IBM的IMS(InformationManagementSystem)就是采用層次數(shù)據(jù)模型的數(shù)據(jù)庫管理系統(tǒng)。層次數(shù)據(jù)模型的主要特征是一棵有向樹,樹的節(jié)點是記錄類型,最上層的節(jié)點叫根節(jié)點,根節(jié)點只有一個,上下層的節(jié)點之間的關(guān)系為父--子關(guān)系,一個父節(jié)點可以有多個子節(jié)點,而一個子節(jié)點有且只有一個父結(jié)點。數(shù)據(jù)庫設(shè)計樹是應(yīng)用最廣泛,也是最重要的一類數(shù)據(jù)結(jié)構(gòu)層次模型描述的是一種一對多的邏輯關(guān)系企業(yè)的組織結(jié)構(gòu)產(chǎn)品結(jié)構(gòu)商品的分類圖書的分類文件管理擋案管理父節(jié)點一級子節(jié)點二級子節(jié)點二級子節(jié)點二級子節(jié)點二級子節(jié)點一級子節(jié)點一級子節(jié)點一級子節(jié)點一級子節(jié)點數(shù)據(jù)庫設(shè)計處室1處室2處室1處室2分公司1處室1處室2分公司3分公司2處室1處室2分公司4處室1處室2分公司5集團公司數(shù)據(jù)庫設(shè)計網(wǎng)狀模型網(wǎng)狀模型是層次數(shù)據(jù)模型的變形。事實上,為了使處理速度更快、處理更方便,可根據(jù)需要將層次數(shù)據(jù)庫轉(zhuǎn)換成網(wǎng)狀數(shù)據(jù)庫,或?qū)⒕W(wǎng)狀數(shù)據(jù)庫轉(zhuǎn)換成層次數(shù)據(jù)庫。層次數(shù)據(jù)模型主要用來描述一對多的數(shù)據(jù)邏輯關(guān)系,而網(wǎng)狀模型能夠更好地描述多對多的數(shù)據(jù)邏輯關(guān)系,也就是說父節(jié)點可以有多個子節(jié)點,子節(jié)點也可以有多個父節(jié)點。數(shù)據(jù)庫設(shè)計學(xué)生1學(xué)生2學(xué)生3學(xué)生4學(xué)生5學(xué)生6課程1課程2課程3數(shù)據(jù)庫設(shè)計(2)三類數(shù)據(jù)模型的優(yōu)缺點

三類數(shù)據(jù)模型在企業(yè)中都有應(yīng)用,它們各有自己的優(yōu)缺點。層次模型的主要優(yōu)點在于其處理效率。因為層次模型中的數(shù)據(jù)關(guān)系比較簡單,因此層次數(shù)據(jù)庫系統(tǒng)較其他數(shù)據(jù)模型花費更少的處理時間。當數(shù)據(jù)自然形成層次時,就很適合采用層次模型。但層次模型在數(shù)據(jù)組織上缺乏靈活性,修改困難,且不易安裝。一些組織中由于已采用的層次數(shù)據(jù)庫系統(tǒng)的高效率或巨額投資而在繼續(xù)使用層次模型。數(shù)據(jù)庫設(shè)計

網(wǎng)狀模型在數(shù)據(jù)組織上較層次模型有更大的靈活性,但由于數(shù)據(jù)關(guān)系的復(fù)雜性,網(wǎng)狀模型更難開發(fā)和使用。這種模型的數(shù)據(jù)庫管理系統(tǒng)在企業(yè)中應(yīng)用已不多。

關(guān)系數(shù)據(jù)模型是應(yīng)用最廣泛的數(shù)據(jù)模型。數(shù)據(jù)組織直觀,查詢方便,能夠在數(shù)據(jù)之間建立各種關(guān)系滿足一些特殊的查詢,并且設(shè)計、維護簡單。數(shù)據(jù)庫設(shè)計(3)E-R圖轉(zhuǎn)換成關(guān)系模式學(xué)生(學(xué)號,姓名,性別,班級)課程(課號,課名,學(xué)分)選課(學(xué)號,課號,成績)選課學(xué)生課程MN成績學(xué)號姓名性別班級課程編號名稱學(xué)分學(xué)號課程編號成績數(shù)據(jù)庫設(shè)計一個實體型轉(zhuǎn)換為一個關(guān)系模型,實體的屬性就是關(guān)系的屬性,實體的鍵就是關(guān)系的鍵;一個聯(lián)系轉(zhuǎn)換為一個關(guān)系模式,與該聯(lián)系相連的每個實體型的鍵以及聯(lián)系的屬性都轉(zhuǎn)換為關(guān)系的屬性。這個關(guān)系的鍵分為以下三種不同的情況:轉(zhuǎn)換原則數(shù)據(jù)庫設(shè)計若聯(lián)系為1:1,則相連的每個實體型的鍵均是該關(guān)系模式的侯選鍵。若聯(lián)系為1:n,則聯(lián)系對應(yīng)的關(guān)系模式的鍵取n端實體型的鍵。若聯(lián)系為m:n,則聯(lián)系對應(yīng)的關(guān)系模式的鍵為參加聯(lián)系的諸實體型的鍵的組合。

數(shù)據(jù)庫設(shè)計零件消耗材料11零件編號名稱規(guī)格名稱規(guī)格材料編號單價重量零件(零件編號,名稱,規(guī)格)消耗(零件編號,材料編號,重量)材料(材料編號,名稱,規(guī)格,單價)概念模型關(guān)系模型轉(zhuǎn)換1:1數(shù)據(jù)庫設(shè)計產(chǎn)品(產(chǎn)品編號,名稱,型號)零件(零件編號,名稱,規(guī)格)組成(零件編號,產(chǎn)品編號,數(shù)量)零件組成產(chǎn)品n1零件編號名稱規(guī)格名稱型號產(chǎn)品編號數(shù)量概念模型關(guān)系模型轉(zhuǎn)換1:n數(shù)據(jù)庫設(shè)計學(xué)習(xí)(學(xué)號,課程編號,成績,時間)學(xué)生(學(xué)號,姓名,班級)課程(課程編號,名稱,學(xué)分)學(xué)生學(xué)習(xí)課程nm學(xué)號姓名班級名稱學(xué)分課程編號成績時間概念模型關(guān)系模型轉(zhuǎn)換n:m數(shù)據(jù)庫設(shè)計數(shù)據(jù)庫物理設(shè)計的內(nèi)容主要包括:確定數(shù)據(jù)的存儲結(jié)構(gòu),選擇DBMS……為數(shù)據(jù)選擇和調(diào)整存取路徑,即索引的設(shè)計調(diào)整和優(yōu)化數(shù)據(jù)庫的性能,如調(diào)整DBMS的某些系統(tǒng)參數(shù)。4.數(shù)據(jù)庫的物理設(shè)計五、數(shù)據(jù)庫設(shè)計各階段的任務(wù):物理設(shè)計數(shù)據(jù)庫設(shè)計商業(yè)數(shù)據(jù)庫管理系統(tǒng)我們常用的大型商業(yè)數(shù)據(jù)庫管理系統(tǒng)有:Oracle:目前的版本是Oracle10i;在全球和中國的銷量都是第一;我國的主要用戶是公安系統(tǒng)、金融系統(tǒng)和大的企業(yè);系統(tǒng)非常復(fù)雜,可以按照用戶的要求進行組裝。支持Web功能,支持在數(shù)據(jù)庫中存儲大對象的數(shù)據(jù),如圖象和圖形、視頻和音頻數(shù)據(jù)等等。數(shù)據(jù)庫設(shè)計我們常用的大型商業(yè)數(shù)據(jù)庫管理系統(tǒng)有:Sybase:主打產(chǎn)品有兩種:SybaseAdaptiveServerEnterpriseSybaseAdaptiveServerAnywhere在中國的銷量是第二,其主要用戶有鐵道部、金融系統(tǒng)和大型企業(yè);成功的案例有“98世界杯網(wǎng)站系統(tǒng)”,“全國鐵路售票系統(tǒng)”(與民航售票系統(tǒng)完全不同)。這些系統(tǒng)主要采用Sybase公司的數(shù)據(jù)復(fù)制技術(shù)和主鍵沖突解決方案。數(shù)據(jù)庫設(shè)計我們常用的大型商業(yè)數(shù)據(jù)庫管理系統(tǒng)有:MicrosofSQLServer:它最早是從Sybase公司買的核心技術(shù),目前的版本是2005;在全球的銷量處于第三位,處于第四位的是IBM的DB2,它主要用于IBM大型機,用于并行存儲與計算;Microsoft公司的SQLServer在我國的主要用戶是中小型企業(yè)和教育機構(gòu)。數(shù)據(jù)庫設(shè)計

在關(guān)系數(shù)據(jù)庫中,所有的數(shù)據(jù)文件都以二維表的形式存在,這些二維表之間通常會產(chǎn)生數(shù)據(jù)冗余,這樣容易造成數(shù)據(jù)的不一致或不完整,從而使數(shù)據(jù)的檢索、插入、刪除和更新和等操作可能會出現(xiàn)錯誤。解決這種問題的一個辦法就是將這些關(guān)系進一步的分解。這種分解的過程就叫做規(guī)范化。

5.關(guān)系的規(guī)范化數(shù)據(jù)庫設(shè)計五、數(shù)據(jù)庫設(shè)計各階段的任務(wù):關(guān)系的規(guī)范化

規(guī)范化是可逆的轉(zhuǎn)換處理過程。在此過程中,數(shù)據(jù)之間非規(guī)范化的關(guān)系逐步轉(zhuǎn)換成規(guī)范化的關(guān)系。由于這樣一個過程是可逆的,因此轉(zhuǎn)換的過程中并沒有丟失信息。規(guī)范化可以使任何一個關(guān)系數(shù)據(jù)庫的操作都變得十分簡單方便。規(guī)范化的主要目標就是能夠讓用戶使用簡單的操作檢索出有用的信息,并且使數(shù)據(jù)的不規(guī)則、不連貫的程度達到最小。規(guī)范化的程度可用范式來表示,如滿足最低要求,則稱為第一范式,依次還有第二、三、四、五范式,在五種范式中,通常只使用前三種。屬于第一范式的關(guān)系應(yīng)滿足的基本條件是元組中的每一個分量都必須是不可分割的數(shù)據(jù)項。(一)第一范式員工編號姓名工資基本工資附加工資10000001100000021000000310000004張興李明王進趙強30003000300030002500100020001500如下面的職工工資關(guān)系就不符合第一范式員工編號姓名電話家庭電話辦公電話10000001100000021000000310000004張興李明王進趙強6024780760247808602578076025780860227806602278076022780860227809下面的職工電話關(guān)系不符合第一范式員工編號姓名基本工資附加工資10000001100000021000000310000004張興李明王進趙強30003000300030002500100020001500員工編號姓名家庭電話辦公電話10000001100000021000000310000004張興李明王進趙強6024780760247808602578076025780860227806602278076022780860227809下面的職工工資和電話關(guān)系符合第一范式學(xué)號100001100001100001100002100002100002100003100003100003張三張三張三李四李四李四王五王五王五181818181818171717男男男男男男男男男課程編號XG0001XG0002XG0003XG0001XG0002XG0003XG0001XG0002XG0003課程名稱高等數(shù)學(xué)電子商務(wù)企業(yè)管理高等數(shù)學(xué)電子商務(wù)企業(yè)管理高等數(shù)學(xué)電子商務(wù)企業(yè)管理學(xué)分322322322成績989092929692939590主屬性學(xué)號性別姓名年齡性別姓名年齡課程編號課程名稱學(xué)分成績不滿足第二范式(二)第二范式

這種關(guān)系不僅滿足第一范式,而且所有非主屬性完全依賴于其主鍵。學(xué)號100001100001100001100002100002100002100003100003100003王五17男性別張三張三張三李四李四李四王五王五1818181818181717男男男男男男男男姓名年齡李四李四1818男男張三張三1818男男王五王五1717男男課程編號XG0001XG0002XG0003XG0001XG0002XG0003XG0001XG0002XG0003課程名稱高等數(shù)學(xué)電子商務(wù)企業(yè)管理高等數(shù)學(xué)電子商務(wù)企業(yè)管理高等數(shù)學(xué)電子商務(wù)企業(yè)管理學(xué)分322322322成績989092929692939590高等數(shù)學(xué)電子商務(wù)企業(yè)管理高等數(shù)學(xué)電子商務(wù)企業(yè)管理322322數(shù)據(jù)冗余啦!第二范式——數(shù)據(jù)冗余數(shù)據(jù)冗余啦!學(xué)生資格審查單學(xué)生成績單學(xué)號100001100002100003張三李四王五181817男男男課程編號XG0001XG0002XG0003課程名稱高等數(shù)學(xué)電子商務(wù)企業(yè)管理學(xué)分322成績989690學(xué)號性別姓名年齡課程編號學(xué)號100001100002100003張三李四王五181817男男男應(yīng)修學(xué)分實修學(xué)分四級畢設(shè)學(xué)號性別姓名年齡張三李四王五181817男男男230230230235245230707682989690第二范式——數(shù)據(jù)冗余第二范式——插入異常學(xué)號100001100001100001100002100002100002100003100003100003張三張三張三李四李四李四王五王五王五181818181818171717男男男男男男男男男課程編號XG0001XG0002XG0003XG0001XG0002XG0003XG0001XG0002XG0003課程名稱高等數(shù)學(xué)電子商務(wù)企業(yè)管理高等數(shù)學(xué)電子商務(wù)企業(yè)管理高等數(shù)學(xué)電子商務(wù)企業(yè)管理學(xué)分322322322成績989092929692939590PrimaryKey學(xué)號性別姓名年齡課程編號新來了一位叫趙玲的女同學(xué),今年18歲了。100004趙玲18女??????她的課程編號是多少?插入異常啦!第二范式——插入異常學(xué)號100001100001100001100002100002100002100003100003100003張三張三張三李四李四李四王五王五王五181818181818171717男男男男男男男男男課程編號XG0001XG0002XG0003XG0001XG0002XG0003XG0001XG0002XG0003課程名稱高等數(shù)學(xué)電子商務(wù)企業(yè)管理高等數(shù)學(xué)電子商務(wù)企業(yè)管理高等數(shù)學(xué)電子商務(wù)企業(yè)管理學(xué)分322322322成績989092929692939590PrimaryKey學(xué)號性別姓名年齡課程編號有一門新課《管理信息系統(tǒng)》,3學(xué)分。??????它的學(xué)號是多少?XG0004管理信息系統(tǒng)3插入異常啦!第二范式——刪除異常學(xué)號100001100001100001100002100002100002100003100003張三張三張三李四李四李四王五王五1818181818181717男男男男男男男男課程編號XG0001XG0002XG0003XG0001XG0002XG0003XG0001XG0002課程名稱高等數(shù)學(xué)電子商務(wù)企業(yè)管理高等數(shù)學(xué)電子商務(wù)企業(yè)管理高等數(shù)學(xué)電子商務(wù)學(xué)分32232232成績9890929296929395100004趙六17男XG0004管理信息系統(tǒng)390PrimaryKey學(xué)號性別姓名年齡課程編號趙六出國了,請把他的信息刪除????????????????????刪除異常啦!《管理信息系統(tǒng)》課程的信息哪去啦?學(xué)生信息表學(xué)號~~~~~~性別~~姓名年齡課程信息表課程編號名稱學(xué)分~~~~~~成績表11223344~~~~~~~~

學(xué)號課程編號10003100100023801000107010002000~~~~~~~~成績~~~~~~~~~~~~~~~~PrimaryKeyPrimaryKeyPrimaryKey學(xué)號課程編號學(xué)號課程編號第二范式——關(guān)系分解學(xué)號100001100001100001100002100002100002100003100003100003張三張三張三李四李四李四王五王五王五181818181818171717男男男男男男男男男課程編號XG0001XG0002XG0003XG0001XG0002XG0003XG0001XG0002XG0003課程名稱高等數(shù)學(xué)電子商務(wù)企業(yè)管理高等數(shù)學(xué)電子商務(wù)企業(yè)管理高等數(shù)學(xué)電子商務(wù)企業(yè)管理學(xué)分322322322成績989092929692939590學(xué)號性別姓名年齡性別姓名年齡課程編號課程名稱學(xué)分成績課程編號XG0001XG0002XG0003課程名稱高等數(shù)學(xué)電子商務(wù)企業(yè)管理學(xué)分322課程編號學(xué)號100001100002100003張三李四王五181817學(xué)號姓名年齡性別男男男學(xué)號100001100001100001100002100002100002100003100003100003課程編號XG0001XG0002XG0003XG0001XG0002XG0003XG0001XG0002XG0003成績989092929692939590學(xué)號課程編號(三)第三范式這種關(guān)系不僅滿足第二范式,而且它的任何一個非主屬性都不傳遞依賴于任何主關(guān)鍵字。學(xué)號100001100002100003張三李四王五181817男男女學(xué)校名稱印刷學(xué)院印刷學(xué)院印刷學(xué)院學(xué)校地址大興黃村大興黃村大興黃村郵政編碼102600102600102600學(xué)號性別姓名年齡學(xué)校名稱準考證號100001100002100003張三李四王五181817男男女工作單位IBMIBMIBM地址工體北路二號工體北路二號工體北路二號聯(lián)系電話653911886539118865391188性別姓名年齡工作單位準考證號數(shù)據(jù)冗余啦!大興黃村大興黃村102600102600工體北路二號工體北路二號6539118865391188(三)第三范式這種關(guān)系不僅滿足第二范式,而且它的任何一個非主屬性都不傳遞依賴于任何主關(guān)鍵字。學(xué)號100001100002100003張三李四王五181817男男女學(xué)校名稱印刷學(xué)院印刷學(xué)院印刷學(xué)院學(xué)校地址大興黃村大興黃村大興黃村郵政編碼102600102600102600學(xué)號性別姓名年齡學(xué)校名稱準考證號100001100002100003張三李四王五181817男男女工作單位IBMIBMIBM地址工體北路二號工體北路二號工體北路二號聯(lián)系電話653911886539118865391188性別姓名年齡工作單位準考證號數(shù)據(jù)冗余啦!大興黃村大興黃村102600102600工體北路二號工體北路二號6539118865391188學(xué)號100001100002100003學(xué)號張三李四王五姓名181817男男女學(xué)校名稱印刷學(xué)院印刷學(xué)院印刷學(xué)院學(xué)校地址大興黃村大興黃村大興黃村郵政編碼102600102600102600性別年齡學(xué)校名稱印刷學(xué)院學(xué)校地址大興黃村郵政編碼102600準考證號100001100002100003準考證號張三李四王五姓名181817年齡男男女性別工作單位IBMIBMIBM地址工體北路二號工體北路二號工體北路二號聯(lián)系電話653911886539118865391188準考證號100001100002100003準考證號張三李四王五姓名181817年齡男男女性別工作單位

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論