4-數(shù)據(jù)庫和數(shù)據(jù)庫管理系統(tǒng)_第1頁
4-數(shù)據(jù)庫和數(shù)據(jù)庫管理系統(tǒng)_第2頁
4-數(shù)據(jù)庫和數(shù)據(jù)庫管理系統(tǒng)_第3頁
4-數(shù)據(jù)庫和數(shù)據(jù)庫管理系統(tǒng)_第4頁
4-數(shù)據(jù)庫和數(shù)據(jù)庫管理系統(tǒng)_第5頁
已閱讀5頁,還剩55頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第四章數(shù)據(jù)庫和數(shù)據(jù)庫管理系統(tǒng)本章內(nèi)容4.1傳統(tǒng)的數(shù)據(jù)組織方式4.2數(shù)據(jù)庫系統(tǒng)4.3數(shù)據(jù)庫管理系統(tǒng)4.4專用和通用數(shù)據(jù)庫系統(tǒng)4.5數(shù)據(jù)倉庫數(shù)據(jù)管理技術(shù)的發(fā)展人工管理階段數(shù)據(jù)不在計算機中長期保存沒有軟件系統(tǒng)對數(shù)據(jù)進行管理一組數(shù)據(jù)對應于一個應用程序文件系統(tǒng)數(shù)據(jù)按一定的規(guī)則組成文件,能在計算機中長期保存、反復處理有軟件系統(tǒng)對數(shù)據(jù)進行管理,程序與數(shù)據(jù)之間有了一定的獨立性數(shù)據(jù)庫系統(tǒng)傳統(tǒng)的數(shù)據(jù)組織方式傳統(tǒng)上,業(yè)務數(shù)據(jù)按照域、記錄和文件的層次組織起來。數(shù)據(jù)域是數(shù)據(jù)的最小單位,例如職工編號。記錄是相關(guān)的數(shù)據(jù)域的集合,如職工記錄。文件是相關(guān)的記錄的集合,如職工文件。文件和文件夾文件是電子表格、文檔、數(shù)據(jù)集合,或事實的集合。文件夾是相關(guān)文件的集合。文件的結(jié)構(gòu)文件結(jié)構(gòu)指在磁介質(zhì)上存儲記錄的方式在順序文件結(jié)構(gòu)中,存儲記錄的方式是按主鍵順序存儲。直接文件存儲是將記錄隨機存儲,即存放時不按主鍵順序。索引順序文件結(jié)構(gòu)是在直接存取介質(zhì)上進行連續(xù)存儲根據(jù)索引跟蹤記錄的物理地址和訪問記錄。索引文件索引區(qū)前部分:數(shù)據(jù)項,通常是關(guān)鍵字后部分;記錄的存儲地址,指針數(shù)據(jù)區(qū)邏輯順序與記錄的物理順序無關(guān)目的:提高查詢的效率傳統(tǒng)文件系統(tǒng)的局限性整體無結(jié)構(gòu)數(shù)據(jù)的冗余度大浪費存儲空間數(shù)據(jù)的不一致性應用程序?qū)槠鋵iT設(shè)計的文件存在依賴本章內(nèi)容4.1傳統(tǒng)的數(shù)據(jù)組織方式4.2數(shù)據(jù)庫系統(tǒng)

4.3數(shù)據(jù)庫管理系統(tǒng)4.4專用和通用數(shù)據(jù)庫系統(tǒng)4.5數(shù)據(jù)倉庫數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)庫是組織中基于計算機制數(shù)據(jù)資源的集合數(shù)據(jù)庫的兩個主要目標減少數(shù)據(jù)冗余數(shù)據(jù)冗余指的是數(shù)據(jù)的重復數(shù)據(jù)冗余的代價:數(shù)據(jù)的不一致性獲得數(shù)據(jù)獨立性數(shù)據(jù)獨立性指對數(shù)據(jù)結(jié)構(gòu)進行修改時,不必修改處理該數(shù)據(jù)的應用程序通過數(shù)據(jù)字典實現(xiàn)應用數(shù)據(jù)庫的數(shù)據(jù)層次為:數(shù)據(jù)庫文件記錄域現(xiàn)實世界轉(zhuǎn)換數(shù)據(jù)世界數(shù)據(jù)模型認識抽象信息世界概念模型現(xiàn)實世界中客觀對象的抽象過程客觀事物的關(guān)系與性質(zhì)實體聯(lián)系屬性數(shù)據(jù)庫文件記錄數(shù)據(jù)項三個世界術(shù)語對應表現(xiàn)實世界信息世界數(shù)據(jù)世界例子全體實體集文件某校全體學生的數(shù)據(jù)個體實體記錄學生張三的數(shù)據(jù)特征屬性數(shù)據(jù)項(字段)(張三,男,23)信息模型要素:實體(entity):客觀世界的萬事萬物屬性(attribute):實體的特征(外在表現(xiàn))實體集(entityset):同類個體的集合。聯(lián)系(relationship)相互聯(lián)系的方式一對一聯(lián)系(1:1)一對多聯(lián)系(1:n)多對多聯(lián)系(m:n)E-R模型實體-聯(lián)系(Entity-Relationship)實體集屬性聯(lián)系數(shù)據(jù)庫結(jié)構(gòu)的發(fā)展數(shù)據(jù)庫結(jié)構(gòu)(數(shù)據(jù)庫模型)數(shù)據(jù)庫用于組織記錄及確定記錄間關(guān)系的方法商業(yè)數(shù)據(jù)庫產(chǎn)品中,已經(jīng)提供了四種數(shù)據(jù)庫結(jié)構(gòu)層次數(shù)據(jù)庫結(jié)構(gòu)第一個數(shù)據(jù)庫管理系統(tǒng)是IDS2(IntegratedDataStore)開始采用層次數(shù)據(jù)庫結(jié)構(gòu)數(shù)據(jù)分成組,每組分成更小的組,更小的組再進一步分組。數(shù)據(jù)庫的層次結(jié)構(gòu)適合于處理定單錄入、應收事務處理系統(tǒng)(1)有且僅有一個節(jié)點無雙親(這個節(jié)點稱為根節(jié)點);

(2)其他節(jié)點有且僅有一個雙親節(jié)點。

注:樹的節(jié)點代表實體集圖某大學行政機構(gòu)層次模型網(wǎng)狀數(shù)據(jù)庫結(jié)構(gòu)CODASYL1997發(fā)布了網(wǎng)狀數(shù)據(jù)庫結(jié)構(gòu)說明網(wǎng)狀數(shù)據(jù)庫模型特點所有記錄用系表示每一系都包含一個主記錄和若干屬記錄允許一個記錄同時屬于幾個系層次模型和網(wǎng)狀模型如今很少使用缺乏靈活性圖網(wǎng)狀模型的例子

學生

班級

社團

(1)一個節(jié)點可以有多個雙親節(jié)點;(2)多個節(jié)點無雙親節(jié)點。關(guān)系數(shù)據(jù)庫結(jié)構(gòu)E.F.Codd;C.J.Date描述了基于關(guān)系代數(shù)的數(shù)據(jù)庫結(jié)構(gòu)數(shù)據(jù)庫結(jié)構(gòu)可以看成表的集合,表之間的關(guān)系不是通過顯式的索引或地址存儲,表之間的關(guān)系是隱含的表中的公共列是建立隱含關(guān)系的工具更為靈活關(guān)系模型理論表:具有結(jié)構(gòu)的某個相同主題的數(shù)據(jù)集合。表由行(記錄)、列(字段)組成每列有一個字段名,每個字段只有一個值行的上下順序、列的左右順序任意任意兩行記錄的內(nèi)容不應相同字段的取值范圍稱為域。同一字段的域相同,不同字段的域也有可能相同。關(guān)系數(shù)據(jù)庫中的維修商表冗余的弊端冗余:

數(shù)據(jù)在同一表或不同表中重復出現(xiàn)弊端:浪費空間刪除異常修改復雜數(shù)據(jù)異常數(shù)據(jù)不一致插入異常

導師編號姓名性別職稱系名電話101陳平林男教授社科系34358750102李向明男副教授計算機系76853212103馬大可女研究院生物系86238931104李小嚴女副教授社科系34358750模式的規(guī)范化1第一范式2第二范式3第三范式1第一范式表中任意字段的值必須是不可分的,即每個記錄的每個字段只能包含一個數(shù)據(jù)。2第二范式表中所有非主鍵字段完全依賴于主鍵字段表中的“名稱”字段不依賴于主鍵“職工號+工地編號”

2第二范式解決方法:非主鍵字段依賴主鍵“職工號+工地編號”非主鍵字段依賴主鍵“工地編號”3第三范式第三范式:滿足第二范式的前提下,一個表的所有非主鍵字段均不傳遞依賴于主鍵傳遞依賴:設(shè)表中有A(主鍵)、B、C三個字段,若B依賴于A,而C依賴于B,稱字段C傳遞依賴于主鍵字段A

3第三范式解決方法規(guī)范化過程先對二維表消去組合項與重復組化為第一范式再消去非主屬性對主關(guān)鍵字的不完全依賴性而變?yōu)榈诙妒皆傧シ侵鲗傩詫χ麝P(guān)鍵字的傳遞依賴性就化為第三范式。規(guī)范化職工號姓名級別工資學歷畢業(yè)時間001張三技1083中專1957001張三技1083大學1968001張三技1083研究生1981002李四技1262大學1970003王五技1083大學1970004趙二技1262中專1968E-R圖轉(zhuǎn)換為關(guān)系模型一個實體型轉(zhuǎn)換為一個關(guān)系模式。實體名作為關(guān)系名實體的屬性就是關(guān)系的屬性。一個聯(lián)系轉(zhuǎn)化為一個關(guān)系模式。聯(lián)系名作為關(guān)系名與該聯(lián)系相連的各實體的關(guān)鍵字以及聯(lián)系的屬性轉(zhuǎn)化為關(guān)系的屬性(m:n)一的主鍵放在多表中(1:n)面向?qū)ο髷?shù)據(jù)庫結(jié)構(gòu)面向?qū)ο髷?shù)據(jù)庫技術(shù)看起來最適于管理在類型、長度、內(nèi)容和形式上有實質(zhì)差異的復雜數(shù)據(jù)類型。每個對象的數(shù)據(jù)、描述對象的行為、屬性的說明三者是封裝在一起的。對象之間通過消息互相作用,且每個對象都由一組屬性來描述。具備相同屬性及方法的對象被成為一個類,某對象的行為及屬性可以由同一個類中的其他對象所繼承與其他數(shù)據(jù)庫技術(shù)有本質(zhì)的區(qū)別,開發(fā)人員在學習使用時有一定的難度數(shù)據(jù)庫軟件的發(fā)展GE的IDS是第一個數(shù)據(jù)庫管理系統(tǒng),其貢獻在于將把數(shù)據(jù)結(jié)構(gòu)的描述與程序分開。數(shù)據(jù)庫管理系統(tǒng)(DatabaseManagementSystem,DBMS)易于使用、易于訪問結(jié)構(gòu)查詢語言(StructuredQueryLanguage,SQL語言)本章內(nèi)容4.1傳統(tǒng)的數(shù)據(jù)組織方式4.2數(shù)據(jù)庫系統(tǒng)4.3數(shù)據(jù)庫管理系統(tǒng)

4.4專用和通用數(shù)據(jù)庫系統(tǒng)4.5數(shù)據(jù)倉庫數(shù)據(jù)庫管理系統(tǒng)(DBMS)DBMS的功能以規(guī)范、一致的方式存儲數(shù)據(jù);以規(guī)范、一致的方式將數(shù)據(jù)組織成記錄;允許用規(guī)范、一致的方式存取記錄應用程序、數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)三者之間的關(guān)系數(shù)據(jù)庫管理系統(tǒng)的組成遠程監(jiān)督程序應用開發(fā)程序開發(fā)工具安全軟件包歸檔程序報表生成器數(shù)據(jù)字典/目錄數(shù)據(jù)字典指的是在數(shù)據(jù)庫中存儲數(shù)據(jù)的定義數(shù)據(jù)字典/目錄應包含數(shù)據(jù)庫中每一數(shù)據(jù)項的名稱及對各數(shù)據(jù)項的描述、對各個數(shù)據(jù)項之間關(guān)系的描述。數(shù)據(jù)字典可以是紙面上的,也可以是計算機文件。通過使用數(shù)據(jù)字典,DBMS可以將數(shù)據(jù)以規(guī)范、一致的方式進行存儲,從而減少了數(shù)據(jù)冗余。數(shù)據(jù)語言數(shù)據(jù)描述語言(DDL)用來描述數(shù)據(jù)項的定義數(shù)據(jù)操縱語言(DML)用來檢索和存儲數(shù)據(jù)庫中的數(shù)據(jù),以確保數(shù)據(jù)庫中存取數(shù)據(jù)的規(guī)范性。元數(shù)據(jù)和數(shù)據(jù)視圖元數(shù)據(jù):關(guān)于數(shù)據(jù)的數(shù)據(jù)每一數(shù)據(jù)項的定義信息數(shù)據(jù)項與其他數(shù)據(jù)項的關(guān)系數(shù)據(jù)庫中的兩種視圖邏輯視圖是用戶觀察數(shù)據(jù)庫中記錄結(jié)構(gòu)和記錄之間關(guān)系的一種形式物理視圖是記錄在存儲介質(zhì)上的實際組織與存儲的方式模式模式是對數(shù)據(jù)的描述,是數(shù)據(jù)庫邏輯視圖的描述。模式通常需要說明數(shù)據(jù)的特征,包括:數(shù)據(jù)域名別名(相同數(shù)據(jù)域采用的另一個名字)數(shù)據(jù)類型(字符、字母等)位數(shù)小數(shù)的位數(shù)不同的完整性規(guī)則子模式

子模式用來表示所有數(shù)據(jù)描述的一個子集,一個數(shù)據(jù)庫邏輯視圖的一部分就是子模式。一個子模式只包含一個完整數(shù)據(jù)庫中的數(shù)據(jù)項子集。這些數(shù)據(jù)項反映某個用戶特定數(shù)據(jù)需要。子模式提供了一種保證數(shù)據(jù)庫安全的手段。將模式、子模式和數(shù)據(jù)字典結(jié)合起來,對所有數(shù)據(jù)庫用戶呈現(xiàn)一個中心數(shù)據(jù)庫的視圖,這就保證了數(shù)據(jù)獨立性,減少了冗余。數(shù)據(jù)庫系統(tǒng)的三級模式圖

三種查詢語言結(jié)構(gòu)化查詢語言(SQL)包含大約30個已成為行業(yè)標準的類英語命令

示例:SELECTNAME,ADDRESSFROMCUSTOMERWHERESTATE=‘MI’自然語言查詢

LISTTHENAMEANDADDRESSESOFALLCUSTOMERWHOLIVEINMICHIGANQBE查詢不必直接書寫查詢語言的優(yōu)缺點優(yōu)點:用戶不必深入了解記錄結(jié)構(gòu)信息和DBMS檢索數(shù)據(jù)的處理過程管理者不必學習COBOL或C語言等標準編程語言就可以訪問數(shù)據(jù)庫缺點:用戶需要經(jīng)過培訓才能高效使用查詢語言多平臺數(shù)據(jù)和Web服務軟件多平臺數(shù)據(jù)庫在不同的硬件及操作系統(tǒng)平臺上都可以使用的DBMS軟件Web服務軟件Web服務軟件集成到DBMS存放數(shù)據(jù)庫的計算機系統(tǒng)轉(zhuǎn)換到Web服務器上網(wǎng)的用戶無論處于何地都可以對數(shù)據(jù)進行操作用戶不但可查看本地數(shù)據(jù)庫數(shù)據(jù),而且對于萬維網(wǎng)本身數(shù)據(jù)也可進行查詢數(shù)據(jù)庫管理員數(shù)據(jù)庫管理員(DBA):負責數(shù)據(jù)庫的信息系統(tǒng)專家。DBA的職責數(shù)據(jù)庫規(guī)劃數(shù)據(jù)庫實施數(shù)據(jù)庫運行數(shù)據(jù)庫安全維護數(shù)據(jù)庫管理系統(tǒng)的優(yōu)點減少數(shù)據(jù)冗余提高了數(shù)據(jù)的一致性保證數(shù)據(jù)獨立性從多個文件中集成數(shù)據(jù)快速檢索數(shù)據(jù)和信息改進安全控制本章內(nèi)容4.1傳統(tǒng)的數(shù)據(jù)組織方式4.2數(shù)據(jù)庫系統(tǒng)4.3數(shù)據(jù)庫管理系統(tǒng)4.4專用和通用數(shù)據(jù)庫系統(tǒng)

4.5數(shù)據(jù)倉庫專用數(shù)據(jù)庫系統(tǒng)-超媒體數(shù)據(jù)庫超媒體數(shù)據(jù)庫超媒體數(shù)據(jù)庫是以超文本作為記錄的系統(tǒng)超媒體系統(tǒng)可由一個組織的內(nèi)、外部文件構(gòu)成超媒體文件包括文本、圖片、聲音、視頻等多種數(shù)據(jù)類型讀取超媒體文件需一種軟件——瀏覽器以超媒體文件存儲的信息可以用非連續(xù)方式存取其它專用數(shù)據(jù)庫系統(tǒng)在線數(shù)據(jù)庫圖像數(shù)據(jù)庫文檔數(shù)據(jù)庫通用數(shù)據(jù)庫系統(tǒng)通用數(shù)據(jù)管理系統(tǒng)能處理各種類型的數(shù)據(jù)——傳統(tǒng)文本數(shù)據(jù)以及圖像聲音、超媒體文件、標準文本。通用數(shù)據(jù)庫系統(tǒng)可滿足各種平臺的要求。例房地產(chǎn)銀行本章內(nèi)容4.1傳統(tǒng)的數(shù)據(jù)組織方式4.2數(shù)據(jù)庫系統(tǒng)4.3數(shù)據(jù)庫管理系統(tǒng)4.4專用和通用數(shù)據(jù)庫系統(tǒng)4.5數(shù)據(jù)倉庫數(shù)據(jù)倉庫的概念數(shù)據(jù)倉庫是指能存儲、檢索、管理或操縱大量數(shù)據(jù)的系統(tǒng)。數(shù)據(jù)倉庫包括組織中數(shù)據(jù)庫的數(shù)據(jù)和外部的數(shù)據(jù)。特點:非常大質(zhì)量非常高而且可檢索面向某一主體而不是面向事務處理在整個組織應用的范圍內(nèi)進行設(shè)計數(shù)據(jù)倉庫的主要組成部件數(shù)據(jù)本身;可供數(shù)據(jù)存儲、訪問的硬件及網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu);可從原始數(shù)據(jù)源析取數(shù)據(jù),將這些數(shù)據(jù)轉(zhuǎn)化成規(guī)范格式,并存入數(shù)據(jù)倉庫中的軟件;圖表查詢工具;在數(shù)據(jù)倉庫中進行數(shù)據(jù)挖掘的用戶使用的圖形查詢工具;使信息系統(tǒng)人員維護、升級數(shù)據(jù)倉庫的管理軟件。數(shù)據(jù)倉庫的作用將組織中隨時間推移而出現(xiàn)的數(shù)據(jù)孤島集中起來市場分析數(shù)據(jù)庫中知識發(fā)現(xiàn)(KDD)數(shù)據(jù)集市建立數(shù)據(jù)倉庫看起來是一項大的挑戰(zhàn)折衷的策略-實施數(shù)據(jù)集市(DataMarket)數(shù)據(jù)集市是一個數(shù)據(jù)庫,由組織中某一個部門所需要的數(shù)據(jù)組成,它所包含的數(shù)據(jù)僅描述一部分公司運營情況內(nèi)容總結(jié)第四章。直接文件存儲是將記錄隨機存儲,即存放時不按主鍵順序。索引順序文件結(jié)構(gòu)是在直接存取介質(zhì)上進行連續(xù)存儲根據(jù)索引跟蹤記錄的物理地址和訪問記錄。邏輯順序與記錄的物理順序無關(guān)。屬性(attribute):實體的特征(外在表現(xiàn))。一對一聯(lián)系(1:1)。多對多聯(lián)系(m:n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論