交通運輸信息管理課件_第1頁
交通運輸信息管理課件_第2頁
交通運輸信息管理課件_第3頁
交通運輸信息管理課件_第4頁
交通運輸信息管理課件_第5頁
已閱讀5頁,還剩83頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、教學(xué)輔助課件交通工程學(xué)院崔書堂主講第二章信息系統(tǒng)數(shù)據(jù)庫 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 2.2 信息系統(tǒng)中的關(guān)系數(shù)據(jù)庫2.3 運輸信息系統(tǒng)中的數(shù)據(jù)倉庫 2.4 數(shù)據(jù)庫設(shè)計交通運輸信息管理 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 數(shù)據(jù)庫是關(guān)于數(shù)據(jù)管理的技術(shù),是計算機科學(xué)的重要分文。隨著數(shù)據(jù)庫技術(shù)的成熟相信息應(yīng)用的普及,人類積累的信息量正在迅速增長,數(shù)據(jù)庫已經(jīng)成為企業(yè)存儲信息、管理信息的重要技術(shù)手段,成為企業(yè)管理的基本組成部分。 1什么是數(shù)據(jù)庫 數(shù)據(jù)庫就是利用計算機存儲和管理數(shù)據(jù)所建立的數(shù)據(jù)集合,是由一個互相關(guān)聯(lián)的數(shù)據(jù)集合和一組用以訪問這些數(shù)據(jù)的程序組成。它是數(shù)據(jù)庫系統(tǒng)的重要組成部分。 數(shù)據(jù)庫管理的基本目標(biāo)是提供

2、一個方便地、有效地存取和管理大量數(shù)據(jù)信息的環(huán)境。 一、 數(shù)據(jù)庫的基本概念數(shù)據(jù)庫的核心是數(shù)據(jù)管理,數(shù)據(jù)管理是指對各種形式的數(shù)據(jù)進(jìn)行收集、分類、組織、編碼、存儲、檢索和維護(hù)等一系列活動的總和。其目的: 1)從大量的、原始的數(shù)據(jù)中抽取、推導(dǎo)出對人們有價值的信息作為決策依據(jù); 2)借助計算機科學(xué)地保存和管理復(fù)雜的大量的數(shù)據(jù),以便人們能方便而充分地利用這些寶貴的信息資源。 數(shù)據(jù)庫是反映數(shù)據(jù)本身的內(nèi)容而且反映數(shù)據(jù)之間的聯(lián)系。為什么要設(shè)計數(shù)據(jù)庫? 保存數(shù)據(jù) 擴展人們的記憶,共享信息; 幫助人們控制與之相關(guān)的事物 因此,數(shù)據(jù)庫往往不是孤立的,通常是一個更大的信息控制系統(tǒng)的部分。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 2

3、、數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)庫系統(tǒng)是由計算機系統(tǒng)、數(shù)據(jù)、數(shù)據(jù)庫管理系統(tǒng)和有關(guān)人員組成的具有高度組織的總體。主要組成部分:計算機系統(tǒng)數(shù)據(jù)庫數(shù)據(jù)庫管理系統(tǒng)(DNMS)人員 (1)數(shù)據(jù)庫管理員。 (2)系統(tǒng)程序員。 (3)用戶。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 把數(shù)據(jù)庫比做圖書館一個圖書館要想很好地為讀者服務(wù),必須完成以下工作: (1)建立完善的書卡 (2)圖書應(yīng)有組織地存放在書庫中 (3)規(guī)定借閱權(quán)限 (4)建立周密的借閱管理制度 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 對數(shù)據(jù)庫來說,也要完成類似于圖書館的上述工作(1)建立數(shù)據(jù)模型 數(shù)據(jù)模型是對客觀事物及其聯(lián)系的數(shù)據(jù)描述反映各種數(shù)據(jù)之間的內(nèi)在聯(lián)系。數(shù)據(jù)庫不僅要存儲這些數(shù)據(jù),

4、更重要的是根據(jù)需求建立數(shù)據(jù)之間的聯(lián)系模型,其目的就是方便用戶利用數(shù)據(jù),使用戶可以根據(jù)數(shù)據(jù)模型快速訪問數(shù)據(jù)庫中的數(shù)據(jù)(如查詢檢索、增加、修改和刪除)。(2)有組織地存儲數(shù)據(jù) 數(shù)據(jù)庫中的數(shù)據(jù)是有組織地存放在存儲設(shè)備上的,并建立數(shù)據(jù)模型到物理存儲位置的對應(yīng)表(這種對應(yīng)稱為映射),這樣數(shù)據(jù)庫管理系統(tǒng)就能夠按照用戶的訪問請求,快速找到被訪問的數(shù)據(jù),而不必關(guān)心數(shù)據(jù)在數(shù)據(jù)庫中的物理存儲位置,就像讀者可以按書卡填寫借書單,而不用顧及書籍存放在書庫的具體位置一樣。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 (3)設(shè)定訪問權(quán)限 用戶對數(shù)據(jù)庫的訪問是受訪問權(quán)限控制的。數(shù)據(jù)庫設(shè)計者首先根據(jù)使用用戶設(shè)定合法用戶標(biāo)識(用戶名和口令),

5、然后依據(jù)席同用戶身份規(guī)定用戶不同的訪問權(quán)限和級別并授權(quán)。當(dāng)一個用戶訪問數(shù)據(jù)庫時,數(shù)據(jù)庫管理系統(tǒng)首先要檢查用戶身份,合法用戶才能進(jìn)入數(shù)據(jù)庫系統(tǒng),當(dāng)用戶對數(shù)據(jù)庫執(zhí)行操作時,系統(tǒng)檢查用戶權(quán)限,檢變通過后才執(zhí)行允許的操作。 (4)建立完善的數(shù)據(jù)管理體系 設(shè)立“數(shù)據(jù)庫系統(tǒng)“的目的是為了管理大量信息。對數(shù)據(jù)的管理既涉及數(shù)據(jù)存儲結(jié)構(gòu)的定義,又涉及信息操作機削的提供。此外,數(shù)據(jù)庫系統(tǒng)還必須提供信息的安全性、完整性保證,數(shù)據(jù)庫系統(tǒng)的并發(fā)控制、災(zāi)難恢復(fù)等管理機制。完善的數(shù)據(jù)管理體系是數(shù)據(jù)庫最重要的特征之一,也是衡量數(shù)據(jù)庫性能的一個重要指標(biāo)。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 2數(shù)據(jù)庫的發(fā)展 20世紀(jì)60年代早期,文件系

6、統(tǒng)是數(shù)據(jù)管理的主要技術(shù),用戶的數(shù)據(jù)文件主要存儲在磁帶上,它的組織方式是順序的,數(shù)據(jù)的訪問是通過Io設(shè)備的輸入輸出完成的,一組數(shù)據(jù)對應(yīng)一個程序,如圖61所示。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 0世紀(jì)60年代中后期,直接存儲設(shè)備磁鼓、磁盤,特別是硬盤的廣泛應(yīng)用極大地改變了數(shù)據(jù)處理的情況。文件的邏輯結(jié)構(gòu)與物理存儲結(jié)構(gòu)由系統(tǒng)進(jìn)行轉(zhuǎn)換,程序與數(shù)據(jù)有了一定的獨立性。數(shù)據(jù)管理軟件中還增加了一些安全、保密檢查機構(gòu),部分系統(tǒng)允許用戶之間以文件為單位共享數(shù)據(jù),如圖所示。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 突出的問題是: (1)數(shù)據(jù)和程序缺乏獨立性 (2)數(shù)據(jù)冗余度大 由于相同數(shù)據(jù)的重復(fù)存儲,各自管理,給數(shù)據(jù)的修改和維護(hù)帶來

7、了困難、容易造成數(shù)據(jù)的不一致件。(3)數(shù)據(jù)訪問困難 文件系統(tǒng)中數(shù)據(jù)訪問是以特定的程序而向特定的作用的,沒有通用的能對變化的需求做出快速反應(yīng)的數(shù)據(jù)檢索系統(tǒng),因此,不同的數(shù)據(jù)訪問需要編寫不問的應(yīng)用程序。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 20世紀(jì)60年代末期數(shù)據(jù)庫管理技術(shù)應(yīng)運而生。最初的數(shù)據(jù)庫主要是網(wǎng)狀數(shù)據(jù)庫和層次數(shù)據(jù)庫。它們可以創(chuàng)建和操作表或樹這樣的數(shù)據(jù)結(jié)構(gòu)。 20世紀(jì)助年代,關(guān)系數(shù)據(jù)庫占據(jù)了數(shù)據(jù)庫系統(tǒng)的主導(dǎo)地位。在關(guān)系數(shù)據(jù)庫中,幾乎所有處理數(shù)據(jù)底層的細(xì)節(jié)工作都由數(shù)據(jù)庫自動完成,關(guān)系模型的簡單性和能夠?qū)Τ绦騿T隱藏所有實現(xiàn)細(xì)節(jié)的能力使關(guān)系數(shù)據(jù)庫迅速發(fā)展起來。 在20世紀(jì)80年代人們還對并行和分布式數(shù)據(jù)庫

8、進(jìn)行了許多研究,面向?qū)ο蟮臄?shù)據(jù)庫也開始出現(xiàn)。 20世紀(jì)90年代末,隨著互聯(lián)網(wǎng)爆炸式的發(fā)展,使數(shù)據(jù)庫比以前有了更廣泛的應(yīng)用。現(xiàn)在的數(shù)據(jù)庫必須支持很高的事物處理速度,而且還要有很高的可靠性和24x 7的可用性(一天24小時,一周7天都可用,也就是沒有進(jìn)行維護(hù)的停機時間)。數(shù)掘庫系統(tǒng)還必須支持網(wǎng)絡(luò)接口。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 3數(shù)據(jù)庫的特征 ()數(shù)據(jù)和程序的獨立性較高 (2)數(shù)據(jù)冗余度小,共享度高,易擴充可以大大減小數(shù)據(jù)的冗余度,既節(jié)約存儲空間,減少存取時間又可避免數(shù)據(jù)之間的不相容性和不一致性。 (3)數(shù)據(jù)結(jié)構(gòu)化數(shù)據(jù)庫在描述數(shù)據(jù)時不僅要求描述數(shù)據(jù)本身,還要求描述數(shù)據(jù)之間的聯(lián)系,即建立數(shù)據(jù)模型。

9、這樣,數(shù)據(jù)庫中的數(shù)據(jù)便結(jié)構(gòu)化廠,數(shù)據(jù)的結(jié)構(gòu)化是數(shù)據(jù)庫的重要特征之一。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 (4)統(tǒng)一的數(shù)據(jù)控制功能 數(shù)據(jù)庫是系統(tǒng)中各用戶的共享資源。計算機的共享一般是并發(fā)的,許多用戶同時使用數(shù)據(jù)庫,因此系統(tǒng)必須提供以下三方而的控制功能。A 數(shù)據(jù)的安全性控制 數(shù)據(jù)的安全性是指保護(hù)數(shù)據(jù)以防止不合法的使用所造成數(shù)據(jù)的泄密和破壞。B 數(shù)據(jù)的完整性 數(shù)據(jù)的完整性指數(shù)據(jù)的正確性、有效性與相容性。系統(tǒng)提供必要的功能,保證數(shù)據(jù)庫中的數(shù)據(jù)在輸入、修改過程中始終符合原來的定義和規(guī)定。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 C 并發(fā)控制 當(dāng)多個用戶的并發(fā)進(jìn)程同時存取、修改數(shù)據(jù)庫時,可能會發(fā)生互相干擾而得到錯誤的結(jié)果并

10、使數(shù)據(jù)庫完整性遭到破壞,因此必須對多用戶的并發(fā)操作加以控制、協(xié)調(diào)。數(shù)據(jù)庫系統(tǒng)的程序和數(shù)據(jù)的關(guān)系如圖所示。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 數(shù)據(jù)庫是通用的綜合的數(shù)據(jù)集合。它可以供各種用戶共享且具有最小冗余度和較高的數(shù)據(jù)與程序的獨立性。由于多種程序并發(fā)地位用數(shù)據(jù)庫,數(shù)據(jù)庫提供安全性、完整性等控制。 數(shù)據(jù)庫管理系統(tǒng)(DBMS)在建立、使用和維護(hù)數(shù)據(jù)時對數(shù)據(jù)庫進(jìn)行統(tǒng)一控制。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 二、 數(shù)據(jù)模型 數(shù)據(jù)庫是企業(yè)或部門所涉及的數(shù)據(jù)的綜合,不僅反映數(shù)據(jù)本身的內(nèi)容,而且反映數(shù)據(jù)之間的聯(lián)系,數(shù)據(jù)庫結(jié)構(gòu)的基礎(chǔ)是數(shù)據(jù)模型。數(shù)據(jù)模型是對客觀事物及其聯(lián)系的數(shù)據(jù)描述,是描述數(shù)據(jù)、數(shù)據(jù)聯(lián)系、數(shù)據(jù)語義以及一

11、致性約束的概念工具的集合。數(shù)據(jù)模型給出了一種邏輯層的數(shù)據(jù)庫設(shè)計方法,在這部分我們概述目前常用的兩種數(shù)據(jù)模型: 實體一聯(lián)系模型 關(guān)系模型。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 1實體一聯(lián)系模型 為了用數(shù)據(jù)庫來模擬現(xiàn)實世界中的客觀對象,人們需要將現(xiàn)實世界的這些對象經(jīng)過選擇、命名、分類、整理等活動抽象為一種信息結(jié)構(gòu)。這個過程常用的方法是建立客觀對象的實體一聯(lián)系(ER)數(shù)據(jù)模型。 現(xiàn)實世界是由一組稱為實體的基本對象及這些對象間的聯(lián)系組成。ER模型力圖表達(dá)數(shù)據(jù)的意義,可以將現(xiàn)實世界事實的含義和相互關(guān)系映射成概念模式,此模型的提出是為了有助于數(shù)據(jù)庫的設(shè)計,通過定義數(shù)據(jù)模式來實現(xiàn)數(shù)據(jù)庫的全局邏輯結(jié)構(gòu)的設(shè)計。 2.1

12、 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 E-R模型所采用的三個主要概念是:實體集、聯(lián)系集和屬性。 (1)實體集實體(entity):是指明客觀存在并相互區(qū)別的事物。 實體可以是具體對象。 例。一本書、一個工廠、一種材料等。 實體也可以是抽象的概念和聯(lián)系。 例。學(xué)生的一次選課、一次借書等。 實體集(entity set):具有相同性質(zhì)的同類實體的集合。 例。所有教師、所有選課等。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 (2)屬性屬性(attribute):實體具有許多特性,每一個特性稱為屬性。實體是通過屬性來表示。屬性是實體集中每個成員具有的描述性性質(zhì)。例。學(xué)生的實體可由學(xué)號、姓名、性別、年齡、系別等屬性組成。 每個屬性有

13、一個取值范圍,即值域。 例。性別的取值范圍是“男”或“女”。對某個客戶實體,它的客戶號的編碼是001,客戶名稱的值是東方電機,地址是上海徐匯區(qū)。一般來說、每個實體集中要創(chuàng)建或分配包含一個或幾個屬性的屬性子集惟一標(biāo)識實體,這個屬性子集被稱為該實體集的主關(guān)鍵字。又叫主鍵(key):惟一標(biāo)識實體的屬性集。 舉例。學(xué)生實體的學(xué)號可作為學(xué)生實體的主鍵。下表所示為運輸管理信息系統(tǒng)中運輸管理數(shù)據(jù)庫的一部分,其中有兩個實體集:客戶實體集(表62)和訂單實體集(表63),主關(guān)鍵字以下劃線表示。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 客戶實體集 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 訂單實體集 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 (3)聯(lián)系

14、集 聯(lián)系是指多個實體間的相互關(guān)聯(lián)。 兩個實體集A和B之間的聯(lián)系可分為四類:一對一。A中的一個實體至多同B中的一個實體相聯(lián)系,如圖(a)所示。一對多。A中的一個實體可以同B中的任意數(shù)目的實體相聯(lián)系,而B中的一個實體至多同A中的一個實體相聯(lián)系如圖(b所示。多對一。A中的一個實體至多同B中的一個實體相聯(lián)系,而B中的一個實體可以同A中的任意數(shù)目的實體相聯(lián)系,如圖(c)所示。多對多。A中的一個實體可以同B中的任意數(shù)目的實體相聯(lián)系B中的一個實體也可以同A中的任意數(shù)目的實體相聯(lián)系,如圖(d)所示。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 一對一聯(lián)系,記為1:1。

15、例。工廠與廠長之間,科研任務(wù)與課題組長之間都是1:1聯(lián)系。 一對多聯(lián)系,記為1:N。 例。一個學(xué)校有若干學(xué)生,而每個學(xué)生都在一個學(xué)校學(xué)習(xí),學(xué)校與學(xué)生之間是一對多的聯(lián)系。 多對多聯(lián)系,記為M:N。 例。課程與學(xué)生之間,一個學(xué)生可選多門課程,而每一門課程可有多個學(xué)生選修,課程與學(xué)生之間是多對多的聯(lián)系。 (4)實體一聯(lián)系圖 數(shù)據(jù)庫的實體一聯(lián)系模型可以用E一R圖做圖形化表示。這種圖形化表示技術(shù)的簡單性及其圖示的清晰性是E一R模型被廣泛使用的重要原因。ER圖中包括如下幾個主要組件:矩形,表示實體集。橢圓,表示屬性。菱形,表示聯(lián)系。線段,將屬性連接到實體集或?qū)嶓w集連接到聯(lián)系集中,并在直線上標(biāo)注聯(lián)系的種類

16、,如: 1:1表示1對l的聯(lián)系。1:n表示1對多的聯(lián)系。M:1表示多對1的聯(lián)系。n:m表示多對多的聯(lián)系。 一個表示倉儲管理中供貨聯(lián)系的ER圖如圖所示。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 ER模型是一個很好的方法,但現(xiàn)有數(shù)據(jù)庫中沒有一個能直接接受ER模型。主要因為ER只能說明實體以及實體間語義的聯(lián)系,還不能進(jìn)一步說明詳細(xì)的數(shù)據(jù)結(jié)構(gòu)。一般在解決實際問題中,總是先設(shè)計一個ER模型轉(zhuǎn)換成計算機能實現(xiàn)的數(shù)據(jù)模型。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 2關(guān)系模型 關(guān)系模型是建立在數(shù)學(xué)概念基礎(chǔ)上的,用表的集合來表示數(shù)據(jù)和數(shù)據(jù)間的聯(lián)系。所以,關(guān)系模型是通過表格數(shù)據(jù)來表示實現(xiàn)和實體間聯(lián)系。 關(guān)系模型的幾個術(shù)語:關(guān)系:一張表對

17、應(yīng)于一個關(guān)系,表名即關(guān)系名。元組:表中的一行稱為一個元組或記錄。屬性:表中的一列稱為屬性,列名即屬性名。主碼(主關(guān)鍵字):表中的某個屬性組,它們的值惟域:屬性的取值范圍。分量:元組中的一個屬性值。 一個運輸管理系統(tǒng)的貨品關(guān)系表如表所示。 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 2.1 數(shù)據(jù)庫系統(tǒng)基礎(chǔ)知識 關(guān)系數(shù)據(jù)庫是一種共享的數(shù)據(jù)知識庫,是目前信息系統(tǒng)產(chǎn)最常用的一種數(shù)據(jù)庫,運輸信息系統(tǒng)的數(shù)據(jù)庫基本上都是關(guān)系數(shù)據(jù)庫。 關(guān)系數(shù)據(jù)庫其核心部分是關(guān)系模型。2.2 信息系統(tǒng)中的關(guān)系數(shù)據(jù)庫 2.2 信息系統(tǒng)中的關(guān)系數(shù)據(jù)庫 一、 關(guān)系數(shù)據(jù)庫的基本攝念1數(shù)據(jù)結(jié)構(gòu)關(guān)系數(shù)據(jù)庫的數(shù)據(jù)結(jié)構(gòu)單一,是二維表的結(jié)構(gòu),如表65、66所示

18、2.2 信息系統(tǒng)中的關(guān)系數(shù)據(jù)庫2基本術(shù)語(1)關(guān)鍵字或碼。在關(guān)系的諸屬性中,惟一能夠用來標(biāo)識元組的屬性(或?qū)傩缘慕M合)稱為關(guān)鍵字或碼。 在一個關(guān)系中,關(guān)鍵字的值不能為空,也不能重復(fù)。(2)候選關(guān)鍵字或候選碼。如果在一個關(guān)系中存在多個屬性(或組合)能用來惟一標(biāo)識該關(guān)系的元織,則這些屬性或(組合)就稱為該關(guān)系的候選關(guān)鍵字或候選碼。(3)主關(guān)鍵字或主碼。在一個關(guān)系的若干個候選關(guān)鍵字中指定作為關(guān)鍵字的屬性。(4)非主屬性。其他的屬性。 2.2 信息系統(tǒng)中的關(guān)系數(shù)據(jù)庫 (5)外部關(guān)鍵字或外鍵。當(dāng)關(guān)系中的某個屬性(或組合)雖個是該關(guān)系的關(guān)鍵宇或只是非關(guān)鍵字的一部分,卻是另一個關(guān)系的關(guān)鍵字時,稱該屬性為這個

19、關(guān)系的外鍵。 如學(xué)生關(guān)系中的學(xué)部號雖不是關(guān)鍵字,卻是教學(xué)部關(guān)系的關(guān)鍵字,所以,學(xué)部號為學(xué)生關(guān)系的外鍵。(6)主表與從表。主表與從表是與外鍵相關(guān)聯(lián)的兩個表,以外鍵為主鍵的表為主表,外鍵所在的表為從表。 如上面的學(xué)生關(guān)系是從表,教學(xué)部關(guān)系是主表。 需要注意的是,關(guān)系模式是穩(wěn)定的但隨著數(shù)據(jù)庫中數(shù)據(jù)的不斷更新,是隨時間不斷變化的。 2.2 信息系統(tǒng)中的關(guān)系數(shù)據(jù)庫 二、關(guān)系數(shù)據(jù)庫的數(shù)據(jù)完整性和安全性1完整性 數(shù)據(jù)庫的數(shù)據(jù)完整性是指數(shù)據(jù)庫中數(shù)據(jù)的正確性、相一致性。在數(shù)據(jù)庫中定義數(shù)據(jù)的完整性約束是為了保證授權(quán)用戶對數(shù)據(jù)庫進(jìn)行修改時不會破壞數(shù)據(jù)的一致性。防止對數(shù)據(jù)庫的意外破壞。 為了維護(hù)數(shù)據(jù)中數(shù)據(jù)的正確性和一

20、致性,在對關(guān)系數(shù)據(jù)庫進(jìn)行插入、刪除和修改時,必須遵循下述三類完整性原則。 (1)實體完整性規(guī)則。這條規(guī)則要求關(guān)系中元組的主控屬性不能有空值。如果出現(xiàn)空值,主鍵就起不了惟一標(biāo)識的作用。(2)引用完整性規(guī)則。這條規(guī)則要求不允許引用不存在的元組。(3)用自定義的完整性規(guī)則。這是針對某一具體數(shù)據(jù)的約束條件,由應(yīng)用環(huán)境決定。 2.2 信息系統(tǒng)中的關(guān)系數(shù)據(jù)庫 2安全性 除了完整性約束保護(hù)意外引入的不一致性之外,數(shù)據(jù)庫個存儲的數(shù)據(jù)還要防止未經(jīng)授權(quán)的訪問和蓄意的破壞或修改。 數(shù)據(jù)庫安全性指保護(hù)數(shù)據(jù)庫不受惡意訪問。絕對杜絕對數(shù)據(jù)庫的惡意濫用是不可能的,但可以使那些企圖在沒有適當(dāng)授權(quán)情況下訪問數(shù)據(jù)庫的代價足夠高,

21、以阻止絕大多數(shù)這樣的訪問企圖。 2.2 信息系統(tǒng)中的關(guān)系數(shù)據(jù)庫 為了保護(hù)數(shù)據(jù)庫,我們必須在幾個層次上采取安全性措施:(1)數(shù)據(jù)庫系統(tǒng)層次。數(shù)據(jù)庫系統(tǒng)的某些用戶獲得的授權(quán)可能只允許他訪問數(shù)據(jù)庫中的有限部分,而另外一些用戶獲得的授權(quán)可能允許他提出杏詢,但不允許他修改數(shù)據(jù)。保證這樣的授權(quán)限制不被違反是數(shù)據(jù)庫系統(tǒng)的責(zé)任。(2)操作系統(tǒng)層次。不管數(shù)據(jù)庫多安全、搽作系統(tǒng)安全性方面的弱點總是可能成為對數(shù)據(jù)庫進(jìn)行未經(jīng)授權(quán)訪問的一種手段。 (3)網(wǎng)絡(luò)層次。由于幾乎所有的數(shù)據(jù)庫系統(tǒng)都允許通過終端或網(wǎng)絡(luò)進(jìn)行遠(yuǎn)程訪問,網(wǎng)絡(luò)軟件的軟件層安全性和物理安全性一樣重要,不管在互聯(lián)網(wǎng)上還是在私有的網(wǎng)絡(luò)內(nèi)。(4)物理層次。計算機

22、系統(tǒng)所位于的結(jié)點(一個或多個)必須在物理層受到保護(hù),以防止入侵者強行進(jìn)入或暗中潛入。(5)人員層次。對用戶的授權(quán)必須格外小心以減少授權(quán)用戶接受賄賠或其他好處而給入侵者提供訪問機會的可能性。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫(自學(xué)) 數(shù)據(jù)倉庫作為近些年來發(fā)展迅速的一種新興技術(shù),將記錄業(yè)務(wù)活動的數(shù)據(jù)庫數(shù)據(jù)經(jīng)過再加工,形成一個綜合并面向分析的環(huán)境,實現(xiàn)業(yè)務(wù)信息的增值服務(wù),運輸數(shù)據(jù)倉庫已經(jīng)成為運輸管理中數(shù)據(jù)分析和聯(lián)機分析處理日趨重要的平臺。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) 一、數(shù)據(jù)倉庫的基本概念1數(shù)據(jù)倉庫定義 數(shù)據(jù)倉庫是計算機和運輸?shù)葦?shù)據(jù)應(yīng)用發(fā)展到一定階段的必然產(chǎn)物。數(shù)據(jù)倉庫的目的是為了建立一種體

23、系化的數(shù)據(jù)存儲環(huán)境,將分析決策所需的大量數(shù)據(jù)從傳統(tǒng)的操作環(huán)境中分離出來,使分散、不一致的操作數(shù)據(jù)轉(zhuǎn)換成集成、統(tǒng)一的信息。企業(yè)內(nèi)不同單位、不同角色的成員都可以在此單一環(huán)境之下,通過運用其中的數(shù)據(jù)與信息,發(fā)現(xiàn)全新的視野和新的問題、新的分析與思維進(jìn)而發(fā)展出制度化的決策支持系統(tǒng),并獲取更多的經(jīng)營效益。要實現(xiàn)這個目的必須獲取大量的歷史數(shù)據(jù)和匯總數(shù)據(jù)。 完整的數(shù)據(jù)倉庫應(yīng)包括3個方面的技術(shù)內(nèi)容:數(shù)據(jù)倉庫技術(shù)、聯(lián)機分析處理(OLAP)技術(shù)和數(shù)據(jù)挖掘(DM)技術(shù),它是一個十分龐大的系統(tǒng)。目前已有許多商品化的數(shù)據(jù)倉庫軟件,如:IBM等有實力的公司相繼推出了自三的數(shù)據(jù)倉庫解決方案。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (

24、自學(xué)) 數(shù)據(jù)倉庫的定義:“數(shù)據(jù)倉庫是一個面向主題的、集成的、穩(wěn)定的、不同時間的數(shù)據(jù)集合,支持管理中的決策制定過程?!睌?shù)據(jù)倉庫具有如下特征, (1)面向主題 主題是一個面向抽象的慨念,是在較高層次上將企業(yè)信息系統(tǒng)中的數(shù)據(jù)綜合、歸類后進(jìn)行分析利用的抽象。數(shù)據(jù)倉庫是為決策支持提供服務(wù)的,因此數(shù)據(jù)的組織應(yīng)是圍繞著主題的,如:顧客、供應(yīng)商、產(chǎn)品和銷售組織。數(shù)據(jù)倉庫關(guān)注決策者的數(shù)據(jù)建模與分析,而不是集中于組織機構(gòu)的日常操作相事務(wù)處理。因此,數(shù)據(jù)倉庫具有排除對決策無用的數(shù)據(jù)、提供特定主題的簡明特征。(2)數(shù)據(jù)是集成的 數(shù)據(jù)倉庫的數(shù)據(jù)并不是原有數(shù)據(jù)的簡單拷貝,必須經(jīng)過綜合、計算,拋棄分析處理不需要的數(shù)據(jù)項增加

25、一些可能涉及的外部數(shù)據(jù)。使用數(shù)據(jù)清理和數(shù)據(jù)集成技術(shù),確保命名約定、編碼結(jié)構(gòu)等的一致性,以保證數(shù)據(jù)的質(zhì)量。 對源數(shù)據(jù)的集成是數(shù)據(jù)倉庫建設(shè)中最關(guān)鍵也是最復(fù)雜的一步。(3)穩(wěn)定性 從數(shù)據(jù)的使用上看,數(shù)據(jù)倉庫的數(shù)據(jù)是穩(wěn)定的,不可更改的。即最終用戶只能通過分析進(jìn)行查詢和分析而不能修改。 從數(shù)據(jù)的內(nèi)容上看,數(shù)據(jù)倉庫存儲的是企業(yè)當(dāng)前和歷史的數(shù)據(jù),因此,也可以說數(shù)據(jù)倉庫在一定時間間隔內(nèi)是穩(wěn)定的。(4)數(shù)據(jù)的時變性 數(shù)據(jù)倉庫的數(shù)據(jù)穩(wěn)定、不可更改是針對應(yīng)用而言的,但并不是說,數(shù)據(jù)從進(jìn)入數(shù)據(jù)倉庫中就永遠(yuǎn)不變,這些數(shù)據(jù)是隨時間變化而定期更新的。每隔一段時間,數(shù)據(jù)倉庫就將運行數(shù)據(jù)庫系統(tǒng)中產(chǎn)生的數(shù)據(jù)進(jìn)行轉(zhuǎn)換,集成到數(shù)據(jù)倉

26、庫中。(5)支持決策分析 建立數(shù)據(jù)倉庫并不是取代原有的運行數(shù)據(jù)庫系統(tǒng),其目的是為了將企業(yè)多年來已經(jīng)收集到的信息按一個統(tǒng)一且一致的企業(yè)級視圖組織并存儲。然后對這些數(shù)據(jù)進(jìn)行分析,從中得出有關(guān)企業(yè)經(jīng)營狀況、客戶需求、對手情況以及以后發(fā)展趨勢等有用信息。幫助企業(yè)及時、正確把握機會、以求公激烈的競爭中獲得更大的利益。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) 2數(shù)據(jù)倉庫與傳統(tǒng)數(shù)據(jù)庫的區(qū)別 傳統(tǒng)的關(guān)系型數(shù)據(jù)庫遵循一致的關(guān)系模型,其中的數(shù)據(jù)以表格的方式存儲,并且能用統(tǒng)一的結(jié)構(gòu)化查詢語言sQL進(jìn)行數(shù)據(jù)查詢,數(shù)據(jù)庫系統(tǒng)的主要任務(wù)是執(zhí)行聯(lián)機事務(wù)和查詢處理,通常,這類系統(tǒng)被稱為聯(lián)機事務(wù)處理(OLTP),其重點在于完成

27、業(yè)務(wù)處理,及時給予用戶響應(yīng),它涵蓋了企業(yè)的大部分日常操作,如購買、庫存、制造h銀行、工資、注冊、記賬等這類系統(tǒng)用于創(chuàng)建操作數(shù)據(jù)。 當(dāng)數(shù)據(jù)庫系統(tǒng)應(yīng)用到一定階段時,企業(yè)家們便發(fā)現(xiàn)僅依賴擁有數(shù)據(jù)庫系統(tǒng)已經(jīng)不足以獲得市場競爭的優(yōu)勢。他們需要對自身業(yè)務(wù)的運行以及整個市場相關(guān)行業(yè)的態(tài)勢進(jìn)行分析,需要根據(jù)客戶、賣主和產(chǎn)品等主題進(jìn)行組合,回答決策者的問題,如“在過去的季度里,咨詢哪三樣產(chǎn)品的熱線電話最多?”,根據(jù)分析結(jié)果,做出有利的決策。這些決策需要對大量的業(yè)務(wù)數(shù)據(jù),包括歷史業(yè)務(wù)數(shù)據(jù),進(jìn)行分析,數(shù)據(jù)倉庫就是基于對業(yè)務(wù)數(shù)據(jù)進(jìn)行決策分析而創(chuàng)建的數(shù)據(jù)管理系統(tǒng)。因此,這類系統(tǒng)一般地是用于聯(lián)機分析處理系統(tǒng)(OLAP)。

28、 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) OLTP數(shù)據(jù)庫與數(shù)據(jù)倉庫的主要區(qū)別概述如下: (1)用戶和系統(tǒng)的面向性:OLTP數(shù)據(jù)庫是面向顧客的,用于記錄相處理業(yè)務(wù)員、客戶的業(yè)務(wù)過程和查詢處理,數(shù)據(jù)倉庫是面向市場的,用于知識工人(包括經(jīng)理、主管和分忻人員)的數(shù)據(jù)分析。 (2)數(shù)據(jù)內(nèi)容:OLTP數(shù)據(jù)庫主要用于管理當(dāng)前發(fā)生的數(shù)據(jù),通常,這種數(shù)據(jù)太瑣碎,難以用于決策;數(shù)據(jù)倉庫主要用于管理大量歷史數(shù)據(jù),提供匯總和聚集機制,并在不同的綜合級別上存儲和管理信息。 (3)數(shù)據(jù)庫設(shè)計:通常,OLTP數(shù)據(jù)庫系統(tǒng)采用實體一聯(lián)系(ER)模型和面向應(yīng)用的數(shù)據(jù)庫設(shè)計;而數(shù)據(jù)倉庫系統(tǒng)通常采用星型或葵花模型和面向主題的數(shù)據(jù)庫設(shè)

29、計。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) (4)視圖:OLTP數(shù)據(jù)庫系統(tǒng)主要關(guān)注一個企業(yè)或部門內(nèi)部的當(dāng)前數(shù)據(jù),面不涉及歷史數(shù)據(jù)或不同組織的數(shù)據(jù);相比之下,由于組織的變化,數(shù)據(jù)倉庫系統(tǒng)常常跨越數(shù)據(jù)庫模式的多個版本,并處理來自不同組織的信息,是由多個數(shù)據(jù)存儲集成的信息。由于數(shù)據(jù)量巨大,數(shù)據(jù)倉庫的數(shù)據(jù)也常存放在多個存儲介質(zhì)上。 (5)訪問模式:OLTP數(shù)據(jù)系統(tǒng)訪問主要是由各種可變的操作組成,這種系統(tǒng)需要并行控制和恢復(fù)機制;然而,對數(shù)據(jù)倉庫系統(tǒng)的訪問大部分是用于查詢分析對話操作。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) 總之,數(shù)據(jù)倉庫并非是一個僅僅存儲數(shù)據(jù)的簡單信息庫,它實際上是一個“以大型數(shù)據(jù)管

30、理信息系統(tǒng)為基礎(chǔ),附加在這個數(shù)據(jù)庫系統(tǒng)之上并存儲了企業(yè)所有業(yè)務(wù)數(shù)據(jù)庫中獲取的綜合數(shù)據(jù)并能利用這些綜合數(shù)據(jù)為用戶提供經(jīng)過處理后的有用信息的應(yīng)用系統(tǒng)”。數(shù)據(jù)倉庫更多的是一種管理技術(shù),它將企業(yè)網(wǎng)絡(luò)中分布的商業(yè)數(shù)據(jù)集成到起、為決策者提供各種類型的數(shù)據(jù)分析,對企業(yè)領(lǐng)導(dǎo)者起到?jīng)Q策支持智囊團的作用為決策支持系統(tǒng)提供個新的途徑。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) 二、數(shù)據(jù)倉庫的數(shù)據(jù)模型 實體一聯(lián)系數(shù)據(jù)模型廣泛用少關(guān)系數(shù)據(jù)庫設(shè)汁。在那里,數(shù)據(jù)庫模式由實體的集合和它們之間的聯(lián)系組成。這種數(shù)據(jù)模型適用于聯(lián)機事務(wù)處理(oLTP)。然而數(shù)據(jù)倉庫需要簡明的、面向主題的模式便于聯(lián)機數(shù)據(jù)分析。 最流行的數(shù)據(jù)倉庫數(shù)據(jù)模型

31、是多維數(shù)據(jù)模型。此外,還有星型數(shù)據(jù)模型和雪花型數(shù)據(jù)模型。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) 1多維數(shù)據(jù)模型 數(shù)據(jù)模型是數(shù)據(jù)倉庫研究的重點問題。在多維數(shù)據(jù)模型中,把數(shù)據(jù)集合的屬性分為度和維兩類,度類數(shù)據(jù)反映的是數(shù)據(jù)的數(shù)字測量值(如:銷售量、投資額及收入等),它們是依賴于一組“維”的、這些維類數(shù)據(jù)提供了測量值的關(guān)聯(lián)關(guān)系。例如銷售量與城市、產(chǎn)品名稱和銷售的時間有關(guān),這組相關(guān)的維惟一地決定了銷售量這個測量值。因此,多維數(shù)據(jù)模型就是把測量的值放在這樣一些有層次的維構(gòu)成的多維空間中。下圖中的小格內(nèi)存儲的數(shù)據(jù)可以假設(shè)為商品的銷售量。該模型包括商品、城市、日期等多維。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自

32、學(xué)) 圖 多維數(shù)據(jù)模型 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) 多維數(shù)據(jù)模型的另一個特點是對一維或多維所做的結(jié)合運算,例如對總銷售量按城市進(jìn)行汁算和排序,這些運算包括對同樣維所限定的測量值比較(如銷售量與預(yù)算)。一般來說時間維是一個有特殊意義的維,它對決策中的趨勢分析很重要。 針對多維模型產(chǎn)生的0W分析方法,一般有以下幾種。 (1)旋轉(zhuǎn)。即將表格的橫、縱坐標(biāo)交換(X,Y)(Y,x)。 (2)上鉆和下鉆。即根據(jù)維的層次提升所關(guān)心的數(shù)據(jù)或降低觀察層次。 (3)切片。主要根據(jù)維的限定做投影、選擇等數(shù)據(jù)庫操作而獲取數(shù)據(jù)。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) 2星型模型 大多數(shù)的數(shù)據(jù)倉庫部采用如圖6

33、10所示的“星型”模型來表示多維數(shù)據(jù)模型。數(shù)據(jù)庫中包括一個“事實表”,對于每一維部有一個“維表”。事實表中的每條元組都包含有指向各個表的外鍵和一些相應(yīng)的測量數(shù)據(jù),維表中記錄的是有關(guān)這一繼的屬性。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) 圖 星型模型 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) 從圖中可以看出事實表中的每一元組只是包含了一些指針(即外鍵),而對應(yīng)的主鍵分別放在不同的表中。如“訂單號”放在“訂貨表”中,每個指針指向個維表,這就構(gòu)成了數(shù)據(jù)庫的多維聯(lián)系。相應(yīng)每條元組中多維外鍵限定數(shù)字測量值。在每個維表中除包含每一維的主鍵外,還要說明該維的一些其他屬性字段。維表記錄廠維的層次關(guān)系。在數(shù)據(jù)倉庫

34、模型中執(zhí)行杏詢的分析過程,需要花大量時間在相關(guān)表中尋找數(shù)據(jù)。而星型模型使數(shù)據(jù)倉庫的復(fù)雜杏詢可以百接通過各維的層次比較、上鉆及下鉆等操作完成。在數(shù)據(jù)倉庫中除了維表和事實表的數(shù)據(jù)外,還應(yīng)當(dāng)包含一些已領(lǐng)處理的綜合數(shù)據(jù),這些綜合數(shù)據(jù)可以通過創(chuàng)建“概括表”(例如視圖)進(jìn)行存儲。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫(自學(xué)) 3雪花模型 “雪花模型”是對星型模型的擴展。如果某個頂點有多個歸類層次,就形成雪花型模型。它對星型模型的維表進(jìn)一步層次化,所有的各維表可能鉑擴展為小的畢實表,形成一些局部的“層次”區(qū)域。它的優(yōu)點是:通過最大限度地減少數(shù)據(jù)存儲量以及聯(lián)合較小的維表來改善查詢性能。下圖所示的“產(chǎn)品”與“產(chǎn)品目錄”

35、維表與事實表的關(guān)系區(qū)域,是在數(shù)據(jù)倉庫的數(shù)據(jù)組織上對用戶查詢需求的擴展。使用數(shù)據(jù)倉庫和查詢工具完成一些簡單的二維或三絕查詢,既滿足了用戶對復(fù)雜數(shù)據(jù)倉庫查詢的需求,又能在無須訪問過多數(shù)據(jù)的情況下,完成一些簡單查詢功能。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫(自學(xué)) 圖 雪花模型 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) 雪花模型由于擴展了維表的層次,可以減少數(shù)據(jù)冗余。這鐘表易于維護(hù)、并節(jié)省存儲空間因為當(dāng)維結(jié)構(gòu)作為列包含在較高層次的維表中時,隨著維表內(nèi)元組數(shù)據(jù)量的增加,大維表可能非常大。然而與巨大的事實表相比,這種空間的節(jié)省可以忽略;此外,由于執(zhí)行查詢需要更多的連接操作,雪花結(jié)構(gòu)可能降低瀏覽的性能。這樣系統(tǒng)的

36、性能可能相對受到影響。因此,數(shù)據(jù)倉庫設(shè)計時,雪花模型不如星型模型流行。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫(自學(xué)) 三、數(shù)據(jù)倉庫的開發(fā)模式 隨著數(shù)據(jù)倉庫技術(shù)的發(fā)展,數(shù)據(jù)倉庫的開發(fā)模式已從最初的“由上而下”模式發(fā)展到下列6種模式。1由上而下模式 由上而下的開發(fā)模式是指將原來分散存儲在企業(yè)各處的聯(lián)抓交易數(shù)據(jù)庫中的有用數(shù)據(jù),通過篩選、過濾、轉(zhuǎn)換、聚集等處理步驟建立一個 這個整體性數(shù)據(jù)倉庫將提供客戶一個一致性的數(shù)據(jù)格式和一致性的軟件環(huán)境。理論上來說,決策支持所需的數(shù)據(jù)都應(yīng)該涵蓋在這個整體性數(shù)據(jù)庫中。數(shù)據(jù)集市中存儲的數(shù)據(jù),是為了某個部門的決策支持應(yīng)用而專門從整體性數(shù)據(jù)倉庫中篩選的,它是整體性數(shù)據(jù)倉庫中的個子集

37、。在由上而下模式中、數(shù)據(jù)集市和數(shù)據(jù)倉庫的關(guān)系是單方面的,即數(shù)據(jù)從數(shù)據(jù)倉庫流向數(shù)據(jù)集市。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫(自學(xué)) 圖 由上而下模式 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) 2由下而上模式 由下而上模式(如圖 所示)是從構(gòu)造各個部門或特定的企業(yè)問題的數(shù)據(jù)集市開始,而整體性數(shù)據(jù)倉庫是建立在這些數(shù)據(jù)集市的基礎(chǔ)上。圖 由下而上開發(fā)模式 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) 由下而上開發(fā)模式的特點是:初期投資少,見效快。因為它在構(gòu)造部門數(shù)據(jù)集市時,只需要較少的人做出決策,而所解決的問題是較小的商業(yè)問題。由下而上的開發(fā)模式可以使一個部門在數(shù)據(jù)倉庫發(fā)展初期盡可能少花費資金,在做出有效的投入之前

38、評估技術(shù)的成本收益狀況。3平行開發(fā)模式 平行開發(fā)模式(如圖所示)是指在個整體性數(shù)據(jù)倉庫的數(shù)據(jù)模型的指導(dǎo)下,數(shù)據(jù)集市的建立和整體性數(shù)據(jù)倉庫的建立同步進(jìn)行。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫(自學(xué)) 圖 平行開發(fā)模式 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) 在平行開發(fā)模式中,由于數(shù)據(jù)集市的建立是在一個統(tǒng)一的整體性數(shù)據(jù)模型的指導(dǎo)下進(jìn)行的,可避免各部門在開發(fā)各自的數(shù)據(jù)集市時的盲目性,減少各個數(shù)據(jù)集市之間的數(shù)據(jù)冗余和不一致性。事實上,一些部門在建立數(shù)據(jù)集市的過程中所遇到的問題及其解決方案、所獲得的經(jīng)驗,將決定整體性數(shù)據(jù)倉庫的數(shù)據(jù)模型做出相應(yīng)的改變,這些變化將使其他部門在建立數(shù)據(jù)集市時受益,也有助于整體性數(shù)據(jù)

39、倉庫的構(gòu)造。在乎行開發(fā)模式中,數(shù)據(jù)集市的這種相對獨立性有利于整體性數(shù)據(jù)倉庫的構(gòu)造。一旦整體性數(shù)據(jù)倉庫建立好之后,各個部門的數(shù)據(jù)集市將成為整體性數(shù)據(jù)倉庫的一個子集,整體性數(shù)據(jù)倉庫將負(fù)責(zé)為各個部門已建好的和即將要建立的數(shù)據(jù)集市提供依據(jù)。 平行開發(fā)與自上而下模式的區(qū)別在于,它滿足了企業(yè)中各個部門希望在較短的時間內(nèi)建立本部門的決策支持系統(tǒng)的需求,使他們不用等待整體性數(shù)據(jù)倉庫建立好了之后才建立屬于自己的數(shù)據(jù)集市。同時它改變了在由上而下模式中部門數(shù)據(jù)集市在與整體性數(shù)據(jù)倉庫關(guān)系中的附屬地位,在建立數(shù)據(jù)集市過程中所獲得的經(jīng)鷗將有助于整體性數(shù)據(jù)倉庫的數(shù)據(jù)模型的最優(yōu)化和整體性數(shù)據(jù)倉庫的構(gòu)造。 2.3 信息系統(tǒng)中的

40、數(shù)據(jù)倉庫(自學(xué)) 平行開發(fā)模式用一個統(tǒng)一的整體性數(shù)據(jù)倉庫的數(shù)據(jù)模型來指導(dǎo)各個部門數(shù)據(jù)集市的構(gòu)造,可以解決數(shù)據(jù)集市之間數(shù)據(jù)的不一致性,也可以減少數(shù)據(jù)集市之間的數(shù)據(jù)冗余問題。但由上而下與由下而上、平行開發(fā)這三種模式都沒有考慮到如何將客戶的反饋信息不斷地反映到數(shù)據(jù)集市和數(shù)據(jù)倉庫的構(gòu)造中。這三種模式都只在建立數(shù)據(jù)集市或數(shù)據(jù)倉庫的過程中考慮到用戶的需求。但是用戶的需求并不是一成不變的,而是隨著新技術(shù)與新應(yīng)用的出現(xiàn)而不斷變化的。用戶的需求變化不僅要求更快速的硬件、更好的數(shù)據(jù)分析技術(shù)、性能更好的數(shù)據(jù)庫軟件,更加友好的圖形用戶接口,還包括所需信息內(nèi)容的變化,這將導(dǎo)致在數(shù)據(jù)倉庫或數(shù)據(jù)集市產(chǎn),必須加入某些新的屬性

41、、新的表格或重組已經(jīng)存在的表格和屬性。新的需求將對數(shù)據(jù)倉庫和數(shù)據(jù)集市的數(shù)據(jù)模型產(chǎn)生影響。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫(自學(xué)) 4有反饋的由上而下模式 有反饋的由上而下模式如圖所示、在這個模式產(chǎn),用戶的新需求的反饋分為兩個階段。第l階段,用戶的新需求不斷地被反饋給部門的數(shù)據(jù)集市,部門數(shù)據(jù)集市根據(jù)用戶的新需求*產(chǎn)生自身的需求變化;第2階段,部門數(shù)據(jù)集市把自身的需求變化反饋給整體性數(shù)據(jù)倉庫,整體性數(shù)據(jù)倉庫再做出相應(yīng)的變化。 圖 有反饋的由上而下模式 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫(自學(xué)) 5有反饋的由下而上模式 在有反饋的由下而上模式【如圖所示】,由于采取的是先構(gòu)造部門數(shù)據(jù)集市,再以各部門的數(shù)據(jù)集市

42、為基礎(chǔ),構(gòu)造整體性數(shù)據(jù)倉庫的方式。因此,數(shù)據(jù)集市能較好地滿足用戶的需求,在整體性數(shù)據(jù)庫建立好之后,需求的變化將主要體現(xiàn)在數(shù)據(jù)集市與數(shù)據(jù)倉庫之間。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫(自學(xué)) 圖 有反饋的由下而上模式 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) 如果各個部門數(shù)據(jù)集市在發(fā)展時注意保持相正之間的數(shù)據(jù)一致性,并能根據(jù)用戶的反饋信息不斷池調(diào)整自己,那么以這種模式建立曲數(shù)據(jù)倉庫在投入使用以后,能減少因用戶助需求變化所帶來的不便。6.有反饋的平行開發(fā)模式 有反饋的平行開發(fā)模式【如圖所示】,在這個模式開發(fā)的起始階段,開發(fā)人員主要是在整體性數(shù)據(jù)倉庫數(shù)據(jù)模型的指導(dǎo)下建立部門數(shù)據(jù)集市,并把在建立過程中所遇到的

43、問題及其解決方案以及客戶的意見等信息反饋給整體性數(shù)據(jù)倉庫數(shù)據(jù)模型。整體性數(shù)據(jù)模型在指導(dǎo)部門數(shù)據(jù)集市構(gòu)造的同時,也收集開發(fā)人員和部門客戶反饋的信息并根據(jù)這些信息調(diào)整自己。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫(自學(xué)) 圖 有反饋的平行開發(fā)模式 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學(xué)) 經(jīng)過調(diào)整,可以使下一階段整體性數(shù)據(jù)倉庫的構(gòu)造相對順利地進(jìn)行。通常,人們會認(rèn)為在這種平行開發(fā)模式中,整體性數(shù)據(jù)倉庫的數(shù)據(jù)模型應(yīng)在開始建立部門數(shù)據(jù)集市之前完成,因此開發(fā)人員需要在項目的起始階段,就迅速地開發(fā)建立整體性數(shù)據(jù)倉庫的數(shù)據(jù)模型,而數(shù)據(jù)集市的開發(fā)工作也不得不等待整體性數(shù)據(jù)倉庫的數(shù)據(jù)模型完成之后才開始。事實上,在平行模式的開

44、發(fā)過程中,并不一定要求在開發(fā)部門數(shù)據(jù)集市之前完成整個數(shù)據(jù)倉庫的數(shù)據(jù)模型開發(fā)。對平行開發(fā)模式而言,整體性數(shù)據(jù)倉庫的數(shù)據(jù)模型開發(fā),可以在建立第1個部門數(shù)據(jù)集市的同時進(jìn)行。這是兇為一方面,對減少數(shù)據(jù)集市之間的數(shù)據(jù)冗余度和數(shù)據(jù)的不一致件而言,并不需要一個完全建立好的整體性數(shù)據(jù)模型,整體性數(shù)據(jù)模型在指導(dǎo)數(shù)據(jù)集市構(gòu)造的同時,還要不斷聽取研發(fā)人員和用戶的反饋信息來調(diào)整自己;另一方面,部門數(shù)據(jù)集市在研發(fā)祁使用過程中所得到的經(jīng)驗,有助于研發(fā)人員在設(shè)計整體性數(shù)據(jù)模型時能更好地廠解客戶的需求。總之,數(shù)據(jù)倉庫技術(shù)是近年來出現(xiàn)并迅速發(fā)展的一種技術(shù),它可以充分利用數(shù)據(jù)倉庫中已存儲的信息幫助決策者進(jìn)行決策。數(shù)據(jù)倉庫是一種特

45、殊組織的數(shù)據(jù)庫,建立數(shù)據(jù)倉庫必須進(jìn)行系統(tǒng)的計劃和實施,是一個復(fù)雜的過程。數(shù)據(jù)倉庫以一些長期的、大量具體的數(shù)據(jù)為基礎(chǔ),需要在成功運行的數(shù)據(jù)應(yīng)用的基礎(chǔ)上,積累大量的數(shù)據(jù)才能建立。有了數(shù)據(jù)倉庫,企業(yè)即可利用其中的數(shù)據(jù)進(jìn)行分橋,做出相應(yīng)的輔助決策系統(tǒng),幫助企業(yè)獲得較強的競爭優(yōu)勢。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫(自學(xué)) 返 回 數(shù)據(jù)處理是指把來自科學(xué)研究、生產(chǎn)實踐和社會經(jīng)濟活動等領(lǐng)域中的原始數(shù)據(jù),用一定的設(shè)備和手段,按一定的使用要求,加工成為另一種形式的數(shù)據(jù),這是未來的系統(tǒng)設(shè)計能否滿足用戶要求的關(guān)鍵所在,用戶明確的要求和未來潛在的需求數(shù)據(jù)均應(yīng)該包含在內(nèi)。 2.4 數(shù)據(jù)庫設(shè)計 一、數(shù)據(jù)處理的主要目的.把數(shù)

46、據(jù)轉(zhuǎn)換成為便于觀察分析、傳送或進(jìn)一步處理的形式;.從大量的原始數(shù)據(jù)中抽取、推導(dǎo)出對人們有價值的信息以作為行動和決策的依據(jù);.科學(xué)地保存和管理已經(jīng)處理(如校驗、整理等)的大量數(shù)據(jù),以便人們能方便而充分地利用這些寶貴的信息資源。 2.4 數(shù)據(jù)庫設(shè)計 二、數(shù)據(jù)處理的基本內(nèi)容 數(shù)據(jù)收集;(企業(yè)內(nèi)部和外部) 數(shù)據(jù)轉(zhuǎn)換;(為了不同的使用和數(shù)據(jù)交換需要) 數(shù)據(jù)篩選、分組與排序; 數(shù)據(jù)的組織;(按一定的邏輯關(guān)系,便于存儲。) 數(shù)據(jù)的運算;(計算的方法和模型) 數(shù)據(jù)存儲;(根據(jù)需要確定儲存期限) 數(shù)據(jù)檢索;(為預(yù)測、決策及決策者控制服務(wù)) 數(shù)據(jù)輸出。(以不同的方式滿足各個層次用戶和系統(tǒng)要求)應(yīng)當(dāng)考慮的問題是:

47、數(shù)據(jù)以何種方式存儲在計算機中; 采用何種數(shù)據(jù)結(jié)構(gòu)能有利于數(shù)據(jù)的存儲與取用;采用何種方法從已經(jīng)組織好的數(shù)據(jù)中檢索數(shù)據(jù)。 2.4 數(shù)據(jù)庫設(shè)計 三、數(shù)據(jù)文件的操作(以VB為例) 數(shù)據(jù)文件的建立; 數(shù)據(jù)文件的修改; 數(shù)據(jù)文件中記錄的刪除; 數(shù)據(jù)文件的排序; 數(shù)據(jù)文件的更新。四、數(shù)據(jù)庫數(shù)據(jù)庫是比文件系統(tǒng)更高級的一種組織方式,是以一定組織方式存儲在一起的相關(guān)數(shù)據(jù)的集合。它能以最佳的方式、最少的數(shù)據(jù)冗余位多種應(yīng)用服務(wù),程序與數(shù)據(jù)具有較高的獨立性。如圖是某企業(yè)關(guān)于職工管理的全局?jǐn)?shù)據(jù)結(jié)構(gòu)示例。 2.4 數(shù)據(jù)庫設(shè)計 2.4 數(shù)據(jù)庫設(shè)計 五、數(shù)據(jù)庫所具有的特點.數(shù)據(jù)是結(jié)構(gòu)化的;.數(shù)據(jù)的組織面向系統(tǒng);針對系統(tǒng)的全局應(yīng)

48、用。.數(shù)據(jù)的獨立性高;應(yīng)用程序不依賴于數(shù)據(jù)的組織與物理存儲方式。.數(shù)據(jù)的共享性高;數(shù)據(jù)面向全部用戶和全部應(yīng)用(當(dāng)然要受到必要的權(quán)限的制約)。.具有對數(shù)據(jù)的安全性、完整性和并發(fā)性操作的控制功能;.對數(shù)據(jù)進(jìn)行管理、操作的功能強。數(shù)據(jù)庫中具有專門的軟件負(fù)責(zé)對數(shù)據(jù)庫進(jìn)行管理和操作(,Data Base Management System) 2.4 數(shù)據(jù)庫設(shè)計 六、數(shù)據(jù)庫設(shè)計的主要內(nèi)容 2.4 數(shù)據(jù)庫設(shè)計 從現(xiàn)實世界到觀念世界再到數(shù)據(jù)世界是一個認(rèn)識的過程,也是抽象和映射的過程,與此相對應(yīng),設(shè)計數(shù)據(jù)庫也要經(jīng)歷類似的過程:用戶要求分析;對用戶提出的系統(tǒng)要求,需要進(jìn)行詳細(xì)的調(diào)查與分析。概念結(jié)構(gòu)設(shè)計;以實體聯(lián)系

49、(ER)模型表示。邏輯結(jié)構(gòu)設(shè)計;將概念結(jié)構(gòu)模型轉(zhuǎn)換為某種數(shù)據(jù)庫管理系統(tǒng)。物理結(jié)構(gòu)設(shè)計。為數(shù)據(jù)模型在設(shè)備上選定合適的存儲結(jié)構(gòu)和存儲方法。 2.4 數(shù)據(jù)庫設(shè)計 2.4 數(shù)據(jù)庫設(shè)計 七、關(guān)系的規(guī)范化 規(guī)范化理論研究關(guān)系模式中各屬性之間的依賴關(guān)系及其對關(guān)系模式性能的影響,探討關(guān)系模式應(yīng)該具備的性質(zhì)和設(shè)計方法。是判別關(guān)系模式優(yōu)劣的標(biāo)準(zhǔn),為數(shù)據(jù)庫設(shè)計提供了嚴(yán)格的理論依據(jù)。 2.4 數(shù)據(jù)庫設(shè)計 對上表進(jìn)行分析時,可以發(fā)現(xiàn): 1. 數(shù)據(jù)冗余大用戶與產(chǎn)品欄中將存在著大量的數(shù)據(jù)重復(fù)。 2.數(shù)據(jù)維護(hù)與更新困難。當(dāng)某一個用戶的有關(guān)信息需要變更的話,則每一條同一用戶的記錄都需要修改,必然造成混亂,危害極大。 3 關(guān)系模式變動時對其他關(guān)系模式和應(yīng)用程序的影響大。如用戶信息、產(chǎn)品信息變化時,必然影響到運輸計劃、銷售分析等。 4 存在插入異常和刪除異常。如新產(chǎn)品尚未進(jìn)入市場便無法插入;而當(dāng)一個客戶完成交易后刪除時,有關(guān)信息將隨之刪除。 規(guī)范化的目的就在于消除上述四點問題。 2.4 數(shù)據(jù)庫設(shè)計 第一范式(NF,Normal Form): 關(guān)系模式需要滿足一定的約束條件,最低要求的條件是關(guān)系的每一個屬性(分量)必須是不可分的數(shù)據(jù)項。 不符合第一范式的關(guān)系表 2.4 數(shù)據(jù)庫設(shè)計 屬于第一范式的關(guān)系應(yīng)滿足的基本條件是元組中的每一個分量都必須是不可分割的數(shù)據(jù)項,上表關(guān)系不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論