數(shù)據(jù)的操縱和檢索——綜合數(shù)據(jù)庫管理系統(tǒng)_第1頁
數(shù)據(jù)的操縱和檢索——綜合數(shù)據(jù)庫管理系統(tǒng)_第2頁
數(shù)據(jù)的操縱和檢索——綜合數(shù)據(jù)庫管理系統(tǒng)_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)的操縱和檢索綜合數(shù)據(jù)庫管理系統(tǒng) 到目前為止,我們集中討論了傳統(tǒng)的文件處理。此處,文件是作為一個(gè)獨(dú)立的邏輯實(shí)體來處理的,而且通常與某個(gè)特定的業(yè)務(wù)領(lǐng)域相聯(lián)系。為了把業(yè)務(wù)上相近的那些部門的文件綜合在一起,必須預(yù)先排序記錄和合并文件。這樣做可能耗費(fèi)大量的時(shí)間,有時(shí)甚至是不可能實(shí)現(xiàn)的。 通常,文件是為了滿足特定業(yè)務(wù)領(lǐng)域某部門的專門需要而設(shè)計(jì)的,如果某部門想使用保存在一個(gè)文件上的部分?jǐn)?shù)據(jù),而該文件是另一部門為自己使用而設(shè)計(jì)的,那么他們必須抽取這些數(shù)據(jù)并重新整理后才能使用。大多數(shù)部門總是寧愿建立和保持和一個(gè)類似(而不同)的文件以更好地滿足自己的使用要求,而不愿兼顧其他部門的業(yè)務(wù)需要。這樣做的結(jié)果形成了大

2、量的帶有重復(fù)數(shù)據(jù)的文件。前面的例子中已經(jīng)提到,某所大學(xué)就保存了75個(gè)獨(dú)立的計(jì)算機(jī)文件,而每個(gè)文件中都包含有學(xué)生記錄。每當(dāng)一個(gè)學(xué)生結(jié)婚了或者改換了住處時(shí),則必須修改75個(gè)文件。 數(shù)據(jù)的冗余會使成本提高,而設(shè)計(jì)一個(gè)綜合的資源共享數(shù)據(jù)庫則可以把數(shù)據(jù)冗余度降低到最小程度。綜合的資源共享數(shù)據(jù)庫把公司看作一個(gè)整體來提供服務(wù),而不只是為公司某特殊部門服務(wù)。利用數(shù)據(jù)庫管理系統(tǒng)(DBMS)軟件就可能實(shí)現(xiàn)一個(gè)綜合的數(shù)據(jù)庫。早在70年代初期就出現(xiàn)了DBMS技術(shù),但是直到70年代末期仍未得到普遍的接受。早期的DBMS“軟件包”效率不高,實(shí)際上比傳統(tǒng)的文件處理的要求更高的硬件能力。目前DBMS對硬件的要求已經(jīng)降低了,甚

3、至在小型計(jì)算機(jī)系統(tǒng)上也能運(yùn)行DBMS軟件,造成推遲接受和實(shí)現(xiàn)DBMS技術(shù)的主要原因可能是信息服務(wù)人員缺乏專門的知識,而且用戶管理人員又不愿合作和支持建立一個(gè)共享的數(shù)據(jù)庫。目前對于設(shè)計(jì)和運(yùn)行DBMS軟件已經(jīng)有了廣泛的了解,而且部分用戶管理人員已經(jīng)認(rèn)識到應(yīng)該把信息作為一個(gè)公司的資源來看待。 數(shù)據(jù)庫環(huán)境的好處 1.經(jīng)濟(jì)上的好處。通過先進(jìn)的數(shù)據(jù)結(jié)構(gòu)技術(shù),DBMS提供了最小化數(shù)據(jù)冗余度的可能性。當(dāng)然,為了提高處理效率,即使有了DBMS幫助,有時(shí)還需要在共享的數(shù)據(jù)庫中保留一定的重復(fù)數(shù)據(jù)。由于減少了數(shù)據(jù)的冗余度,從而也簡化了收集和更新數(shù)據(jù)的過程。就前面的例子而言,只需要在一處(數(shù)據(jù)庫中)更新學(xué)生地址就可以了

4、。 2.數(shù)據(jù)庫技術(shù)也給信息服務(wù)專業(yè)人員帶來的好處。綜合資源共享數(shù)據(jù)庫為系統(tǒng)分析員打開了嶄新的大門。數(shù)據(jù)庫能向系統(tǒng)分析員提供傳統(tǒng)文件所不能提供的信息。由于有了DBMS,就更容易得到數(shù)據(jù),因此使程序設(shè)計(jì)任務(wù)要比原先更為簡單。此外,數(shù)據(jù)是獨(dú)立于程序的。這意味著用戶管理人員可以增加數(shù)據(jù)庫中的數(shù)據(jù)、修改庫中的現(xiàn)有數(shù)據(jù)或者從庫中刪除數(shù)據(jù),這些并不影響現(xiàn)有的程序,而在過去則需要測試和修改幾十個(gè)(有時(shí)幾百個(gè))程序。當(dāng)然,數(shù)據(jù)庫管理系統(tǒng)還有其它重要的優(yōu)點(diǎn),但是這些已超出本書的范圍。 3.信息方面的好處。一個(gè)綜合資源共享數(shù)據(jù)庫能以有序的方式提供一種滿足信息要求的結(jié)構(gòu)。實(shí)際上,數(shù)據(jù)庫是能夠充分利用公司信息資源的唯一

5、工具。由于數(shù)據(jù)庫和DBMS在產(chǎn)生報(bào)表方面提供了極大的靈活性,因此,也給決策過程帶來了同樣的靈活性。4.DBMS軟件在支持聯(lián)機(jī)系統(tǒng)方面是特別有價(jià)值的。共享數(shù)據(jù)庫不僅可供多個(gè)用戶存取而且還特別能反映出數(shù)據(jù)的當(dāng)前狀態(tài)。對于許多查詢來說,及時(shí)性是很關(guān)鍵的。例如,某個(gè)經(jīng)理由于設(shè)備故障不得不關(guān)閉某個(gè)工作站,此時(shí)他有可能要查詢其它工作站的狀態(tài),并且利用得到的信息來改變進(jìn)行中的工作路線。 方法 DBMS克服了傳統(tǒng)文件處理的局限性。它依靠靈活多變的數(shù)據(jù)結(jié)構(gòu)(將數(shù)據(jù)元及記錄彼此聯(lián)系的方法)來做到這一點(diǎn)?;诓煌瑪?shù)據(jù)結(jié)構(gòu)的DBMS之間差別很大。有三種設(shè)計(jì)DBMS軟件的方法 1.數(shù)據(jù)系統(tǒng)語言會議(CODASYL)設(shè)計(jì)

6、并發(fā)布的基于網(wǎng)絡(luò)或叢形數(shù)據(jù)結(jié)構(gòu)的DBMS指南。 2.IBM的信息管理系統(tǒng)(IBS)使用的一種層次結(jié)構(gòu)。 3.某些最近設(shè)計(jì)的基于關(guān)系數(shù)據(jù)結(jié)構(gòu)的DBMS。上述的每一種方法是基本概念和術(shù)語的差別都很大。因此,為了減少混淆和便于理解,以下的闡述和討論只使用網(wǎng)絡(luò)方法。 庫設(shè)計(jì) 1.數(shù)據(jù)庫設(shè)計(jì)方法 我們通過下面的例子來說明數(shù)據(jù)庫管理系統(tǒng)和一種數(shù)據(jù)庫設(shè)計(jì)方法的原理??疾煜率銮闆r。 某圖書館保存了一個(gè)文件,該文件每一個(gè)記錄都包含了下述數(shù)據(jù)元: (1)書名 (2)作者 (3)出版社 (4)出版社地址 (5)類別 (6)出版年份圖書館館長希望在獲得決策信息方面有更多的靈活性。而現(xiàn)在文件不可能滿足其要求。經(jīng)過與信息

7、處理人員交換意見之后,他們決定實(shí)現(xiàn)一個(gè)基于CODASYL的數(shù)據(jù)庫管理系統(tǒng)。檢查現(xiàn)有文件發(fā)現(xiàn)某些數(shù)據(jù)重復(fù)出現(xiàn)。每本書(每一書名)都分別有一個(gè)記錄。于是,寫過幾本書的作者的名字在他寫的每本書的記錄中重復(fù)出現(xiàn)。在一個(gè)圖書館里可能有某出版社出版的數(shù)百本,甚至數(shù)千本書,但是在該文件的每本書的記錄中都重復(fù)地出現(xiàn)出版社名和出版社地址。 2.設(shè)立數(shù)據(jù)庫的步驟 設(shè)計(jì)數(shù)據(jù)庫的方法之一是使用主題詞一屬性矩陣作為識別記錄和這些記錄之間關(guān)系的一個(gè)輔助工具。以下各步驟描述了這種設(shè)計(jì)數(shù)據(jù)庫的方法。第一步,在的主題詞一屬性矩陣的左邊列出了邏輯主題詞。在本例中,這些主題詞是:書名、作者和出版社。在矩陣的頂端列出了所有可能的屬性

8、。屬性是提供與主題詞有關(guān)的信息的任一數(shù)據(jù)元。 第二步:在屬性與主題詞之間的關(guān)系有一對一的,一對多的或者不存在關(guān)系。例如,一特定書名只有一個(gè)出版社。所以在書名與出版社之間存在一對一的關(guān)系。然而,一個(gè)書名可以有幾個(gè)作者。因而,在書名與作者之間存在一對多的關(guān)系。用“”表示一對一關(guān)系,用“M”表示一對多關(guān)系,而且空白表示無關(guān)系存在。第三步:數(shù)據(jù)庫記錄類似于傳統(tǒng)文件的記錄,它是相關(guān)數(shù)據(jù)元的集合??梢詫⒂涗洀臄?shù)據(jù)庫中讀出來,也可以將記錄寫到數(shù)據(jù)庫中去。數(shù)據(jù)庫記錄也稱為節(jié)段。在這一步,用主題詞屬性矩陣來標(biāo)識記錄。這是通過列出與每個(gè)主題詞一對一關(guān)系的屬性來實(shí)現(xiàn)的。通常,對應(yīng)每個(gè)主題都有一個(gè)記錄,“書名”記錄包

9、含出版社、出版年份和類別,如下所示: 第四步:數(shù)據(jù)庫設(shè)計(jì)過程的下一步是建立記錄之間的關(guān)系。圖20.6.11給出主題屬性矩陣中指出的一對多的關(guān)系。出版社與書名之間的一對多的關(guān)系是用兩個(gè)記錄之間的一條連線來指出的,該連線有一箭頭指向出版社記錄。指向書名記錄的兩個(gè)箭頭表示每個(gè)出版社可以有一個(gè)以上的書名。這種出版社書名的組合稱之為一個(gè)系。其它的系是:書名作者、作者出版社、作者書名和出版社作者。多對多的關(guān)系(每一端都有兩個(gè)箭頭)在處理時(shí)可能會引起混淆,因而是不允許的。圖20.6.12 一個(gè)完整的網(wǎng)絡(luò)模型 第五步:下一步消去冗余的屬性和系。記住,我們的目的是將作者、書名和出版社記錄輸入到數(shù)據(jù)庫,然后經(jīng)由系

10、建立的聯(lián)系從不同的記錄中檢索數(shù)據(jù)。因此,必須消去對此目的是冗余的那些系。在本例中,顯而易見作者出版社系或作者書名系是冗余(重復(fù))的,由于作者與書名相匹配的機(jī)會比它與出版社匹配的機(jī)會多,因此應(yīng)該消去作者出版社系。圖20.6.12給出了結(jié)果模式。該模式是數(shù)據(jù)庫邏輯結(jié)構(gòu)的一種圖式表示。 現(xiàn)在圖書館館長可以進(jìn)行如下的查詢: 列出某作者寫的所有書的書名; 按字母順序列出由Pientice-Hall在1981年出版的那些書的書名; 列出1987年以來至少在三個(gè)出版社出版書的那些作者。 該數(shù)據(jù)庫(正如所設(shè)計(jì)的那樣)很容易實(shí)現(xiàn)上述查詢及其它類似的查詢。對圖書館原有文件來說,類似的查詢不僅要求處理整個(gè)文件,而且可能還要處理好幾遍。有時(shí),還要求對文

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論