技術(shù)基礎(chǔ)篇數(shù)據(jù)處理課件_第1頁
技術(shù)基礎(chǔ)篇數(shù)據(jù)處理課件_第2頁
技術(shù)基礎(chǔ)篇數(shù)據(jù)處理課件_第3頁
技術(shù)基礎(chǔ)篇數(shù)據(jù)處理課件_第4頁
技術(shù)基礎(chǔ)篇數(shù)據(jù)處理課件_第5頁
已閱讀5頁,還剩70頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第六章數(shù)據(jù)處理教學(xué)目的及要求:⑴識記數(shù)據(jù)處理的概念、數(shù)據(jù)文件、數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)字典等概念;⑵熟悉數(shù)據(jù)處理的根本內(nèi)容、數(shù)據(jù)文件的組織方式、數(shù)據(jù)庫系統(tǒng)的結(jié)構(gòu),實(shí)體、屬性和聯(lián)系,數(shù)據(jù)庫設(shè)計(jì)的四個(gè)階段;⑶了解數(shù)據(jù)處理的開展階段,數(shù)據(jù)庫系統(tǒng)的產(chǎn)生。第六章數(shù)據(jù)處理一、數(shù)據(jù)處理的概念所謂數(shù)據(jù)處理,就是把來自科學(xué)研究、生產(chǎn)實(shí)踐和社會經(jīng)濟(jì)活動等領(lǐng)域中的原始數(shù)據(jù)用一定的設(shè)備和一定的手段按一定的使用要求加工成另一種形式的數(shù)據(jù),以便獲得對人們決策有價(jià)值的信息的過程。數(shù)據(jù)處理二、數(shù)據(jù)處理的開展階段

1.手工處理

2.機(jī)械設(shè)備處理

3.計(jì)算機(jī)系統(tǒng)處理由算盤、計(jì)算尺、手搖計(jì)算機(jī)等進(jìn)行處理由卡片、制表設(shè)備等進(jìn)行處理完全由計(jì)算機(jī)系統(tǒng)進(jìn)行處理三、數(shù)據(jù)處理的根本內(nèi)容1.數(shù)據(jù)收集〔數(shù)據(jù)采集〕〔1〕定義:數(shù)據(jù)收集就是按照用戶的需要和系統(tǒng)的要求收集必要的原始數(shù)據(jù)〔2〕收集方式人工收集聯(lián)機(jī)方式收集比較:人工方式及時(shí)性差,出錯(cuò)率高;聯(lián)機(jī)方式快速、準(zhǔn)確,但投資較大。聯(lián)機(jī)方式是數(shù)據(jù)采集的開展方向由人通過一定的中間環(huán)節(jié)獲得數(shù)據(jù)〔如檔案文件、帳冊、票據(jù)憑證等〕。要對數(shù)據(jù)的來源和數(shù)據(jù)本身的準(zhǔn)確性充分了解,以保證引用資料的準(zhǔn)確性。將某種計(jì)算機(jī)裝置、測試裝置等直接與電子數(shù)據(jù)處理系統(tǒng)相聯(lián)接,將所需數(shù)據(jù)直接送入計(jì)算機(jī)處理系統(tǒng),由計(jì)算機(jī)直接處理。2.數(shù)據(jù)加工處理〔1〕數(shù)據(jù)的轉(zhuǎn)換和錄入數(shù)據(jù)轉(zhuǎn)換:也叫數(shù)據(jù)的預(yù)處理,是將采集到的原始數(shù)據(jù)通過一定手段轉(zhuǎn)換成適合于計(jì)算機(jī)處理的形式,使數(shù)據(jù)代碼化。原始數(shù)據(jù)的分類:數(shù)值型數(shù)據(jù):由數(shù)字字符組成,可直接進(jìn)行數(shù)據(jù)錄入文字信息或特定符號:必須預(yù)先經(jīng)過“編碼〞處理才能錄入數(shù)據(jù)錄入方法:①傳統(tǒng)手工方法;②源數(shù)據(jù)自動化方法?!?〕數(shù)據(jù)分類和合并分類:根據(jù)一定順序?qū)o序的數(shù)據(jù)元素序列調(diào)整成為一個(gè)有序序列,也就是將數(shù)據(jù)元素按某一關(guān)鍵字進(jìn)行排序,形成一個(gè)有序文件。合并:將兩個(gè)或多個(gè)簡單有序集合中的數(shù)據(jù)工程按同樣的順序連接成一個(gè)有序集合。3.數(shù)據(jù)傳輸數(shù)據(jù)傳輸有兩層含義實(shí)現(xiàn)數(shù)據(jù)資源的共享與交換數(shù)據(jù)處理結(jié)果的輸出如:利用計(jì)算機(jī)通信網(wǎng)絡(luò)共享各網(wǎng)點(diǎn)的數(shù)據(jù)資源。常以報(bào)告、文件圖表等形式輸出給各用戶,并傳送到各部門。4.數(shù)據(jù)存儲數(shù)據(jù)存儲:是對原始待加工的數(shù)據(jù)及已加工的各種信息的儲存

涉及的兩個(gè)問題物理存儲:將數(shù)據(jù)存儲在適當(dāng)?shù)慕橘|(zhì)上邏輯組織:按數(shù)據(jù)邏輯內(nèi)在聯(lián)系和使用方式,把數(shù)據(jù)組成合理的結(jié)構(gòu)5.數(shù)據(jù)管理數(shù)據(jù)管理就是對數(shù)據(jù)的更新和維護(hù),也就是指對原文件中的記錄或數(shù)據(jù)項(xiàng)進(jìn)行修改、插入〔增加〕、刪除及數(shù)據(jù)存儲的調(diào)整,數(shù)據(jù)正確性的檢查和平安性的保證等。更新過程錄入更新更新新文件更新文件舊文件6.數(shù)據(jù)檢索數(shù)據(jù)檢索即從計(jì)算機(jī)存儲數(shù)據(jù)中查找和選取所需要的數(shù)據(jù)采用何種方式檢索,取決于數(shù)據(jù)存儲的形式數(shù)據(jù)處理的核心是數(shù)據(jù)收集和數(shù)據(jù)管理三、文件組織

只有將數(shù)據(jù)有序地組織起來,才能對數(shù)據(jù)進(jìn)行有效地處理。1.數(shù)據(jù)組織的層次數(shù)據(jù)按照層次方式進(jìn)行組織由(位、字節(jié)、)字段、記錄、文件、數(shù)據(jù)庫(、數(shù)據(jù)倉庫)組成位〔Bit〕:是計(jì)算機(jī)中最小的數(shù)據(jù)單位,其值為0或1,是一個(gè)二進(jìn)位,表示一個(gè)導(dǎo)通或未通的電〔光〕路。字節(jié)〔Byte〕:是由假設(shè)干位組成的,代表一個(gè)字符。字符是信息的最根本構(gòu)架。字段〔Field,也稱數(shù)據(jù)項(xiàng)〕。★多個(gè)字符組成一個(gè)詞或者一個(gè)完整的數(shù)字〔如人名或年齡〕★字段是數(shù)據(jù)的最小單位,它不能再分成有意義的單位記錄〔Record〕:由與某個(gè)特殊對象或活動有關(guān)的所有字段組成。文件〔File〕★同一類型的所有記錄組成一個(gè)文件★文件就是與某個(gè)特定主題相關(guān)的數(shù)據(jù)記錄的集合。數(shù)據(jù)庫〔Database〕:邏輯相關(guān)文件的集合。數(shù)據(jù)倉庫(Datawarehouse):由多個(gè)數(shù)據(jù)庫中的信息抽取組合構(gòu)成。(字母J的ASCII碼)數(shù)據(jù)的層次舉例文件字節(jié)字段記錄01001010900811劉漢云2000-9-4位0,1數(shù)據(jù)庫劉漢云項(xiàng)目數(shù)據(jù)庫包含:職員編號、姓名、聘用日期職員文件(名字字段)職員文件部門文件財(cái)務(wù)文件900811劉漢云2000-9-4900206李卓宇2002-7-2910810張昕陽2001-8-22.文件的組織方式文件是數(shù)據(jù)庫組織的根底,任何對數(shù)據(jù)庫的操作最終均轉(zhuǎn)化為對數(shù)據(jù)文件的操作。文件的組織方式直接影響整個(gè)信息系統(tǒng)的效率。〔1〕概念文件的組織方式是指文件中的記錄或數(shù)據(jù)在存儲介質(zhì)上的排列方式。一般按其內(nèi)部結(jié)構(gòu)大致分為串行組織、順序組織、隨機(jī)組織、索引組織、倒排組織和鏈表組織等方式?!?〕分類串行組織是最簡單的一種文件組織形式,它將記錄按出現(xiàn)的順序一個(gè)接一個(gè)地存放在存儲器的某個(gè)區(qū)中,取用某個(gè)記錄時(shí)只能順序掃描整個(gè)文件。較多用于計(jì)算機(jī)運(yùn)行過程中產(chǎn)生的暫時(shí)文件以及存檔文件。適用于磁帶存儲器。串行組織文件簡稱為串行文件。順序組織指文件中各記錄根據(jù)關(guān)鍵字〔值〕以升序或降序的形式存放在存儲介質(zhì)上的組織形式。是經(jīng)過整理的串行文件。數(shù)據(jù)記錄的邏輯順序和物理順序是一致的。其存取只能以順序方式進(jìn)行,不能任意對某個(gè)記錄進(jìn)行直接存取。適用于擁有大量記錄,且變化不頻繁的文件;也適用于成批數(shù)據(jù)順序存取的場合??纱鎯υ陧樞蚪橘|(zhì)和隨機(jī)存取介質(zhì)上。順序組織文件簡稱順序文件。隨機(jī)組織指文件中各個(gè)記錄與其在存儲介質(zhì)上的存放位置之間毫無關(guān)系的組織方式。用一種算法將記錄的鍵值轉(zhuǎn)換為一個(gè)近乎隨機(jī)的數(shù),根據(jù)這個(gè)確定記錄在存儲器上的位置。只要確定了某個(gè)記錄的存儲地址〔記錄鍵〕,就可以直接對其進(jìn)行存取,不必考慮與其他記錄之間的順序關(guān)系。只能存儲在磁盤等隨機(jī)存儲設(shè)備上,不能存儲在磁帶等順序存儲設(shè)備上。可用于聯(lián)機(jī)處理的場合,實(shí)現(xiàn)快速地對數(shù)據(jù)進(jìn)行隨機(jī)存取及查詢;不適用于文件中大局部記錄都需要處理的情況。隨機(jī)組織文件簡稱為隨機(jī)文件。索引組織是把文件中識別各個(gè)記錄的關(guān)鍵字集中在一起組成一個(gè)目錄文件〔即索引表〕的組織方式。由索引表〔簡稱索引〕與主文件兩個(gè)局部組成。適用于批處理及聯(lián)機(jī)處理。優(yōu)點(diǎn)是既可用于順序操作,也可用于隨機(jī)操作缺點(diǎn)是當(dāng)文件量較大時(shí),目錄文件增多,所占存儲空間增大。索引組織文件簡稱索引文件倒排文件是對每個(gè)輔關(guān)鍵字都設(shè)立一個(gè)索引,每種關(guān)鍵字值對應(yīng)一個(gè)索引項(xiàng),將具有相同關(guān)鍵字值記錄地址都保存在相應(yīng)的索引項(xiàng)中的組織方式。倒排組織中,記錄有多個(gè)鍵值,根據(jù)這些鍵值來確定一個(gè)記錄??梢园训古沤M織文件視為“多鍵值索引文件〞。倒排組織文件簡稱倒排文件鏈表組織是記錄之間互相用指針連接的組織方式。指針是特殊的數(shù)據(jù)項(xiàng),指出另一記錄在存儲器上的位置,同時(shí)也反映了數(shù)據(jù)記錄之間的聯(lián)系,它不代表任何屬性。一組記錄可提供幾組指針,形成不同的邏輯文件,存取記錄十分方便。鏈表組織文件簡稱鏈表文件。第七章數(shù)據(jù)庫技術(shù)教學(xué)目的及要求熟悉數(shù)據(jù)庫系統(tǒng)的結(jié)構(gòu),實(shí)體、屬性和聯(lián)系,數(shù)據(jù)庫設(shè)計(jì)的四個(gè)階段;了解一定的數(shù)據(jù)庫開發(fā)技術(shù)第七章數(shù)據(jù)庫技術(shù)一、數(shù)據(jù)庫系統(tǒng)的產(chǎn)生1.人工處理階段(50S中期以前〕沒有軟件支持,程序員直接管理數(shù)據(jù)。數(shù)據(jù)保存在處理程序中或隨程序執(zhí)行人機(jī)交互地輸入,數(shù)據(jù)處理后將結(jié)果輸出,最后數(shù)據(jù)和程序占據(jù)的內(nèi)存空間被一起釋放。只有程序文件的概念,數(shù)據(jù)的組織方式由程序自行設(shè)計(jì)和安排。問題:編程效率低,程序依賴數(shù)據(jù),不靈活,容易出錯(cuò)。人工管理方式應(yīng)用程序A文件A應(yīng)用程序B文件B應(yīng)用程序C文件C2.文件管理階段(50S后期〕程序與數(shù)據(jù)具有設(shè)備獨(dú)立性,可長期保存在外存儲器上,構(gòu)成程序文件和數(shù)據(jù)文件。數(shù)據(jù)不屬于某個(gè)特定的程序,允許重復(fù)使用。數(shù)據(jù)文件的結(jié)構(gòu)仍取決于特定的應(yīng)用,程序與數(shù)據(jù)間的依賴關(guān)系并未根本改變。缺點(diǎn):數(shù)據(jù)冗余,數(shù)據(jù)文件間缺乏聯(lián)系,修改時(shí)容易導(dǎo)致數(shù)據(jù)的不一致性;數(shù)據(jù)文件面向應(yīng)用,當(dāng)數(shù)據(jù)結(jié)構(gòu)改變時(shí),程序維護(hù)便成為系統(tǒng)的主要矛盾。文件管理方式程序A程序C程序B文件管理系統(tǒng)文件B文件C文件A1文件A23.數(shù)據(jù)庫階段(60S后期〕數(shù)據(jù)庫技術(shù)的出現(xiàn)標(biāo)志著數(shù)據(jù)資源管理進(jìn)入數(shù)據(jù)庫階段。數(shù)據(jù)庫系統(tǒng)的出現(xiàn),使數(shù)據(jù)管理進(jìn)入了一個(gè)新階段。由于使用數(shù)據(jù)庫管理系統(tǒng)來專門管理數(shù)據(jù),實(shí)現(xiàn)了數(shù)據(jù)與程序的真正獨(dú)立性,并且最大限度地降低了數(shù)據(jù)的冗余度。充分實(shí)現(xiàn)數(shù)據(jù)在不同應(yīng)用中的共享,且能并發(fā)地使用數(shù)據(jù),對數(shù)據(jù)的平安保密和完整性也有了保證措施。數(shù)據(jù)庫管理方式程序A程序C程序B數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫人工管理文件系統(tǒng)數(shù)據(jù)庫系統(tǒng)

背景應(yīng)用背景科學(xué)計(jì)算科學(xué)計(jì)算、管理大規(guī)模管理硬件背景無直接存取存儲設(shè)備磁盤、磁鼓大容量磁盤軟件背景沒有操作系統(tǒng)有文件系統(tǒng)有數(shù)據(jù)庫管理系統(tǒng)處理方式批處理聯(lián)機(jī)實(shí)時(shí)處理

批處理聯(lián)機(jī)實(shí)時(shí)處理,

分布處理批處理

特點(diǎn)數(shù)據(jù)的管理者人文件系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)面向的對象某一應(yīng)用程序某一應(yīng)用程序整個(gè)應(yīng)用系統(tǒng)數(shù)據(jù)的共享程度無共享,冗余度極大共享性差,冗余度大共享性高,冗余度小數(shù)據(jù)的獨(dú)立性不獨(dú)立,完全依賴于程序獨(dú)立性差具有高度的物理獨(dú)立性和邏輯獨(dú)立性數(shù)據(jù)的結(jié)構(gòu)化無結(jié)構(gòu)記錄內(nèi)有結(jié)構(gòu),整體無結(jié)構(gòu)整體結(jié)構(gòu)化,用數(shù)據(jù)模型描述數(shù)據(jù)控制能力應(yīng)用程序自己控制應(yīng)用程序自己控制由數(shù)據(jù)庫管理系統(tǒng)提供數(shù)據(jù)安全性、完整性、并發(fā)控制和恢復(fù)能力數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)庫系統(tǒng):數(shù)據(jù)庫與數(shù)據(jù)庫管理系統(tǒng)的有機(jī)結(jié)合;

1.數(shù)據(jù)庫:邏輯上相關(guān)的記錄和文件的集合。

2.數(shù)據(jù)庫管理系統(tǒng):是一組計(jì)算機(jī)程序,控制并組織用戶的數(shù)據(jù)庫的生成、維護(hù)和使用。數(shù)據(jù)庫系統(tǒng)由數(shù)據(jù)、硬件、軟件和用戶四局部組成;用戶可通過數(shù)據(jù)庫管理系統(tǒng)對數(shù)據(jù)進(jìn)行添加、修改、刪除、檢索、存儲、統(tǒng)計(jì)等多種操作。二、數(shù)據(jù)庫系統(tǒng)的結(jié)構(gòu)美國國家標(biāo)準(zhǔn)學(xué)會〔ANSI〕于1975年規(guī)定了數(shù)據(jù)庫按三級體系結(jié)構(gòu)組織的標(biāo)準(zhǔn),也就是有名的SPARC分級結(jié)構(gòu)〔standardplanningandrequirementcommittee)。三級結(jié)構(gòu)以內(nèi)層〔內(nèi)模式〕、中間層〔模式〕和外層〔外模式〕三個(gè)層次描述數(shù)據(jù)庫。數(shù)據(jù)庫的三級結(jié)構(gòu)數(shù)據(jù)庫管理系統(tǒng)中的模式物理模式:也稱內(nèi)模式,描述數(shù)據(jù)的物理存儲形式,直接與操作系統(tǒng)或硬件相聯(lián)系。邏輯模式:也稱模式,數(shù)據(jù)庫數(shù)據(jù)的完整表示,是所有用戶的公共數(shù)據(jù)視圖。模式僅僅涉及數(shù)據(jù)類型的描述,不涉及具體的數(shù)據(jù)值。用戶模式:也稱子模式或叫外模式,針對每一個(gè)用戶或應(yīng)用,又由模式導(dǎo)出假設(shè)干個(gè)子模式。子模式是直接面向用戶的,用戶能夠看見并使用的是邏輯結(jié)構(gòu)的局部數(shù)據(jù)描述。每一個(gè)子模式都是模式的一個(gè)子集;也可以看作是模式的一個(gè)窗口。一個(gè)數(shù)據(jù)庫系統(tǒng)可以有多個(gè)子模式。兩級映射可保證三種模式之間的相互獨(dú)立性模式與子模式之間的映射把概念數(shù)據(jù)庫與用戶級數(shù)據(jù)庫聯(lián)系起來模式與內(nèi)模式之間的映射把概念數(shù)據(jù)庫與物理數(shù)據(jù)庫聯(lián)系起來三、數(shù)據(jù)模型模型:對現(xiàn)實(shí)世界事物特征的模擬和抽象就是這個(gè)事物的模型。

計(jì)算機(jī)不能直接處理現(xiàn)實(shí)世界中的具體事物,所以必須先把具體事物轉(zhuǎn)換為抽象的模型,然后再將其轉(zhuǎn)換為計(jì)算機(jī)可以處理的數(shù)據(jù),從而以模擬的方式實(shí)現(xiàn)對現(xiàn)實(shí)世界事物的處理。數(shù)據(jù)模型

模型應(yīng)滿足以下要求:

真實(shí)地反映現(xiàn)實(shí)世界;易被人理解;便于在計(jì)算機(jī)上實(shí)現(xiàn);數(shù)據(jù)模型:是用來描述數(shù)據(jù)及數(shù)據(jù)間關(guān)系的一組概念,數(shù)據(jù)描述包括兩個(gè)方面:⑴數(shù)據(jù)的根本結(jié)構(gòu)、數(shù)據(jù)間的聯(lián)系和數(shù)據(jù)的約束等靜態(tài)屬性;⑵數(shù)據(jù)上的操作之類的動態(tài)屬性。數(shù)據(jù)模型分為三級:⑴概念數(shù)據(jù)模型:是面向用戶、面向現(xiàn)實(shí)世界的數(shù)據(jù)模型,與DBMS無關(guān),它描述一個(gè)組織的概念化結(jié)構(gòu),如實(shí)體關(guān)系模型。⑵邏輯數(shù)據(jù)模型:是用戶從數(shù)據(jù)庫中看到的數(shù)據(jù)模型,與所選用的DBMS相關(guān),也稱數(shù)據(jù)庫模型。常見的有:層次模型、網(wǎng)狀模型、關(guān)系模型。⑶物理數(shù)據(jù)模型:反映數(shù)據(jù)存儲結(jié)構(gòu)的模型,不僅與DBMS有關(guān),而且還與操作系統(tǒng)有關(guān)。具體描述數(shù)據(jù)如何組織、如何存儲在物理介質(zhì)上。數(shù)據(jù)庫模型分為三級:(即邏輯數(shù)據(jù)模型)

⑴層次模型:以樹狀結(jié)構(gòu)描述數(shù)據(jù),數(shù)據(jù)元素組成的記錄稱為節(jié)點(diǎn),最上層的節(jié)點(diǎn)稱為根,上下層節(jié)點(diǎn)之間的關(guān)系為父-子關(guān)系,一個(gè)父節(jié)點(diǎn)可有多個(gè)子節(jié)點(diǎn),而一個(gè)子節(jié)點(diǎn)只能有一個(gè)父節(jié)點(diǎn)。

⑵網(wǎng)狀模型:描述多對多的數(shù)據(jù)邏輯關(guān)系,即父節(jié)點(diǎn)可以有多個(gè)子節(jié)點(diǎn),節(jié)點(diǎn)也可以有多個(gè)父節(jié)點(diǎn)。

⑶關(guān)系模型:用二維表格(關(guān)系)來表示數(shù)據(jù)庫中的所有數(shù)據(jù)。三類數(shù)據(jù)庫模型的優(yōu)缺點(diǎn):

⑴層次模型的主要優(yōu)點(diǎn)在于其處理效率,但在數(shù)據(jù)組織上缺乏靈活性,修改困難,且不易安裝。⑵網(wǎng)狀模型靈活性很大,但數(shù)據(jù)關(guān)系復(fù)雜,很難開發(fā)和使用。⑶關(guān)系模型是應(yīng)用最廣泛的數(shù)據(jù)模型,數(shù)據(jù)組織直觀,查詢方便,主要缺點(diǎn)是處理效率低。四、實(shí)體、屬性和聯(lián)系實(shí)體(entity):客觀存在、并且可以互相區(qū)別的事物稱為實(shí)體。實(shí)體是相關(guān)的一類事物,可以是物、人、實(shí)際的東西、或者具體的東西。例:員工、庫存、客戶、訂單實(shí)體集:某個(gè)實(shí)體型下的全部實(shí)體,稱為實(shí)體集。屬性(Property):實(shí)體所具有的每一個(gè)特性都稱為一個(gè)屬性。屬性有“型〞和“值〞的概念,屬性的名稱就是屬性的“型〞;對型的具體賦值就是屬性的“值〞。學(xué)生的姓名、學(xué)號、年齡、性別、成績是學(xué)生的屬性庫存號、說明、現(xiàn)有數(shù)量、在倉庫中的位置等是庫存的屬性主關(guān)鍵字:在眾多屬性中能夠唯一標(biāo)識實(shí)體的屬性或?qū)傩越M。例:學(xué)生實(shí)體中的學(xué)號,產(chǎn)品實(shí)體中的產(chǎn)品號,訂單實(shí)體中的訂單號輔助關(guān)鍵字:不能唯一表示一個(gè)記錄的字段。聯(lián)系:一個(gè)實(shí)體集內(nèi)部各實(shí)體之間的相互聯(lián)系,叫做實(shí)體內(nèi)部聯(lián)系。在實(shí)體集之間的聯(lián)系,稱為實(shí)體的外部聯(lián)系。關(guān)系表聯(lián)系的種類和方式一對一〔1:1〕聯(lián)系在兩個(gè)實(shí)體集中,一方的一個(gè)實(shí)體最多與另一方對應(yīng)的一個(gè)實(shí)體相聯(lián)系。如:已婚男性集合和已婚女性集合一對多〔1:m〕聯(lián)系在兩個(gè)實(shí)體集中,一方的一個(gè)實(shí)體與另一方對應(yīng)的假設(shè)干個(gè)實(shí)體相聯(lián)系;反之,另一方的一個(gè)實(shí)體最多對應(yīng)一方的一個(gè)實(shí)體。如:組織中的部門和職工,一個(gè)職工只屬于一個(gè)部門,一個(gè)部門有多個(gè)職工多對多〔m:n〕聯(lián)系兩個(gè)實(shí)體集中,任何一方的一個(gè)實(shí)體都對應(yīng)另一方的假設(shè)干個(gè)實(shí)體。如:教學(xué)管理中的課程和學(xué)生,一個(gè)學(xué)生可選多門課,一門課也可被多個(gè)學(xué)生選(a)1:1聯(lián)系(b)1:n聯(lián)系(c)m:n聯(lián)系五、關(guān)系模型

由于系統(tǒng)中實(shí)體包括許多屬性,而這些屬性又會被不同的用戶使用,所以將這些屬性一起放在一個(gè)數(shù)據(jù)表中顯然是不合理的,需要進(jìn)行分類與匯總,以編制不同的、且相關(guān)聯(lián)的表,這就是所謂的關(guān)系。1、表具有以下四個(gè)性質(zhì):在表中的任意一列上,數(shù)據(jù)項(xiàng)應(yīng)屬于同一個(gè)屬性;表中所有行都是不相同的,不允許有重復(fù)行出現(xiàn);行的順序無關(guān)列的順序無關(guān),但不能重復(fù);2、表具有以下四個(gè)特點(diǎn):利用一系列的二維表存儲信息。在關(guān)系模型中,每個(gè)二維表都描述一種關(guān)系。關(guān)系是表的數(shù)學(xué)術(shù)語二維表也稱作“關(guān)系表〞每一個(gè)表〔關(guān)系〕所保存的信息都與一個(gè)特定的實(shí)體有關(guān)。二維表使描述信息間的關(guān)系十分便利,處理二維表所包含的信息也容易。3、表的主要術(shù)語:二維表中,一個(gè)豎列反映實(shí)體的某一屬性,稱之為字段。表中的一行形成一個(gè)實(shí)體,稱之為記錄〔元組〕,由各個(gè)數(shù)據(jù)項(xiàng)〔字段值〕所組成,反映某一實(shí)體的所有有關(guān)特性。關(guān)系模式:對關(guān)系的描述,用關(guān)系名〔屬性1,屬性2,…,屬性n〕來表示。對于關(guān)系模型來說,其數(shù)據(jù)模型就是一系列用二維表表示的關(guān)系。4、關(guān)系模型的根本操作關(guān)系模型有三種根本操作:投影、篩選和連接投影:從關(guān)系表格中選取指定的某些屬性,以形成新的關(guān)系;篩選:從關(guān)系表格中選取滿足某種條件的記錄,以建立新的關(guān)系;連接:把兩個(gè)關(guān)系中屬性滿足一定條件的記錄接合在一起形成新的關(guān)系。

1.數(shù)據(jù)需求分析:信息的轉(zhuǎn)換現(xiàn)實(shí)世界信息世界〔概念世界〕計(jì)算機(jī)世界〔數(shù)據(jù)世界〕客觀事物類:事物相關(guān)性質(zhì)集合現(xiàn)實(shí)世界人認(rèn)識選擇描述實(shí)體實(shí)體集合及實(shí)體聯(lián)系相關(guān)屬性集合E-R模型信息世界加工、轉(zhuǎn)換存儲二進(jìn)制數(shù)據(jù)集合結(jié)構(gòu)數(shù)文件據(jù)記錄庫相關(guān)數(shù)據(jù)項(xiàng)集合加工、轉(zhuǎn)換DBMS的數(shù)據(jù)模型

DBMS計(jì)算機(jī)世界(數(shù)據(jù)世界)六、數(shù)據(jù)庫的分析與設(shè)計(jì)三個(gè)不同世界術(shù)語對照表客觀世界信息世界數(shù)據(jù)世界組織(事物及其聯(lián)系)事物類(總體)事物(對象、個(gè)體)特征(性質(zhì))實(shí)體聯(lián)系(概念模型)實(shí)體集實(shí)體屬性數(shù)據(jù)庫(數(shù)據(jù)模型)文件記錄數(shù)據(jù)項(xiàng)對現(xiàn)實(shí)世界進(jìn)行需求分析具體做法:①了解組織機(jī)構(gòu)情況,為分析信息流做準(zhǔn)備;②了解各部門業(yè)務(wù)情況,調(diào)查各部門輸入和使用的數(shù)據(jù)及處理數(shù)據(jù)的方式與算法;③確定數(shù)據(jù)庫的信息組成及計(jì)算機(jī)系統(tǒng)應(yīng)實(shí)現(xiàn)的功能

⒉概念結(jié)構(gòu)設(shè)計(jì):在需求分析的根底上,從各個(gè)用戶出發(fā),進(jìn)行實(shí)體、實(shí)體的屬性和實(shí)體之間聯(lián)系的分析,建立概念數(shù)據(jù)模型。工具:實(shí)體聯(lián)系圖(E-R圖)

有實(shí)體、關(guān)系、屬性三種圖素,關(guān)系有一對一、一對多、多對多。E―R圖有三個(gè)要素:實(shí)體:用矩形表示實(shí)體,矩形內(nèi)標(biāo)注實(shí)體名稱。屬性:用橢圓表示屬性,橢圓內(nèi)標(biāo)注屬性名稱。并用連線與實(shí)體連接起來。實(shí)體之間的聯(lián)系:用菱形表示,菱形內(nèi)注明聯(lián)系名稱,并用連線將菱形框分別與相關(guān)實(shí)體相連,并在連線上注明聯(lián)系類型。

實(shí)體聯(lián)系圖〔E-R圖〕的設(shè)計(jì)方法學(xué)生選修樣本報(bào)表①確定實(shí)體和關(guān)鍵字:三個(gè)實(shí)體學(xué)生專業(yè)課程關(guān)鍵字學(xué)號專業(yè)號課程號②確定實(shí)體之間的聯(lián)系--畫實(shí)體聯(lián)系圖:Ⅰ.先畫上矩形,填上實(shí)體名;Ⅱ.畫上橢圓形,填上屬性名;Ⅲ.判斷實(shí)體間是否有聯(lián)系;Ⅳ.有聯(lián)系畫上菱形,再判斷聯(lián)系是1還是M。矩形表示實(shí)體橢圓形表示屬性菱形表示實(shí)體之間的聯(lián)系直線表示連接1代表出現(xiàn)一次,M代表屢次學(xué)號姓名專業(yè)名專業(yè)號課程名課程號學(xué)分成績廠長廠長號地點(diǎn)廠名廠號姓名年齡管理工廠11廠長與工廠一對一聯(lián)系數(shù)量倉庫倉庫號價(jià)格品名貨號地點(diǎn)面積存放產(chǎn)品1n倉庫與產(chǎn)品一對多聯(lián)系成績學(xué)生學(xué)號學(xué)時(shí)數(shù)課程名課程號姓名性別學(xué)習(xí)課程mn學(xué)生與課程多對多聯(lián)系助學(xué)金實(shí)際案例①建立局部E-R圖;②綜合局部E-R圖,產(chǎn)生總E-R圖。例:假定某企業(yè)的信息系統(tǒng),要求適應(yīng)以下不同用戶的應(yīng)用要求:人事科處理職工檔案,供給科處理采購業(yè)務(wù),生產(chǎn)科處理產(chǎn)品組裝業(yè)務(wù),總務(wù)科處理倉儲業(yè)務(wù)。企業(yè)各部門局部E-R圖:部門從屬職工1n人事科職工領(lǐng)導(dǎo)1n職工承包產(chǎn)品1n供應(yīng)商供應(yīng)產(chǎn)品mn供應(yīng)科產(chǎn)品使用材料mn零部件k

企業(yè)各部門局部E-R圖:生產(chǎn)科零部件裝配mn產(chǎn)品倉庫mn總務(wù)科材料產(chǎn)品mn零部件組裝產(chǎn)品mn存放生產(chǎn)

企業(yè)綜合E-R圖:裝配mn組裝倉庫mn存放mn保管mn部門從屬職工1n領(lǐng)導(dǎo)1n承包產(chǎn)品1n供應(yīng)商供應(yīng)mn消耗材料nn零部件k參加mn合同n注:①在綜合中,同一實(shí)體只出現(xiàn)一次。②總體E-R圖中未反映“產(chǎn)品〞與“材料〞之間的聯(lián)系,即供給科視圖中出現(xiàn)的“產(chǎn)品〞與“材料〞之間的聯(lián)系,在總體E-R圖中被除去了。因?yàn)檫@種聯(lián)系是多余的,它可從“零件〞所“消耗〞的“材料〞一種更為根本的聯(lián)系中推導(dǎo)出來。③總體E-R圖中“供給商〞與“材料〞之間被增加了新的聯(lián)系“合同〞,該聯(lián)系并未出現(xiàn)于任何局部E-R圖中,增加它是允許的,表示該信息系統(tǒng)能支持“材料〞合同處理。⒊邏輯結(jié)構(gòu)設(shè)計(jì):將概念數(shù)據(jù)模型轉(zhuǎn)換為所選用的DBMS所支持的邏輯數(shù)據(jù)模型,然后進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化處理。例:從E-R圖導(dǎo)出關(guān)系數(shù)據(jù)模型①E-R圖中每個(gè)實(shí)體,都相應(yīng)轉(zhuǎn)換為一個(gè)關(guān)系,并確定主關(guān)鍵字;②對于E-R圖中聯(lián)系,聯(lián)系方式不同,處理方法不同:●1:N聯(lián)系:將“1〞方的主鍵納入“n〞方實(shí)體對應(yīng)的關(guān)系中,同時(shí)將聯(lián)系的屬性也一并納入“n〞方關(guān)系中。M〔D〕:倉庫〔倉庫號,地點(diǎn),面積〕產(chǎn)品〔貨號,品名,價(jià)格,倉庫號,數(shù)量〕

●M:N聯(lián)系:對聯(lián)系單獨(dú)建立關(guān)系,用來聯(lián)系雙方。M〔D〕:學(xué)生〔學(xué)號,姓名,性別,助學(xué)金〕課程〔課程號,課程名,學(xué)時(shí)數(shù)〕學(xué)習(xí)〔學(xué)號,課程號,成績〕●1:1聯(lián)系:聯(lián)系本身無屬性,在任意方關(guān)系中參加對方主鍵均可。M〔D〕:廠長〔廠長號,廠號,姓名,年齡〕工廠〔廠號,廠名,地點(diǎn)〕或:廠長〔廠長號,姓名,年齡〕工廠〔廠號,廠長號,廠名,地點(diǎn)〕⑷物理設(shè)計(jì):是數(shù)據(jù)庫在物理設(shè)備上的存儲結(jié)構(gòu)和存取方法的設(shè)計(jì)。主要由數(shù)據(jù)庫專業(yè)人員或DBA根據(jù)DBMS所提供的技術(shù)支持進(jìn)行設(shè)計(jì)。⒋數(shù)據(jù)字典:是描述數(shù)據(jù)、處理、實(shí)體、存儲等定義、格式、內(nèi)容、聯(lián)系的一個(gè)文件。是關(guān)于數(shù)據(jù)的數(shù)據(jù)庫,它對系統(tǒng)內(nèi)的各元素作出詳細(xì)的定義和說明。在IS建設(shè)過程中數(shù)據(jù)字典是必不可少的工具,它是工作的依據(jù)、統(tǒng)一的標(biāo)準(zhǔn),它可確保數(shù)據(jù)的完整性和一致性。數(shù)據(jù)字典的作用:①按各種要求提供列表據(jù)數(shù)據(jù)字典可把所有數(shù)據(jù)元素、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)流、數(shù)據(jù)存儲、外部實(shí)體、處理邏輯按一定的順序全部列出以保證系統(tǒng)設(shè)計(jì)時(shí)不會遺漏。②相互參照,便于系統(tǒng)修改數(shù)據(jù)流圖與數(shù)據(jù)字典可以相互參照、驗(yàn)證,以防止系統(tǒng)修改時(shí)的遺漏和不一致。③由描述內(nèi)容檢索名稱

便于系統(tǒng)分析員的工作。④一致性檢驗(yàn)和完整性檢驗(yàn)

可檢驗(yàn)如下問題:⑴是否存在沒有指明來源或去向的數(shù)據(jù)流;⑵是否存在沒有指明數(shù)據(jù)存儲或所屬數(shù)據(jù)流的數(shù)據(jù)元素;⑶處理邏輯與輸入的數(shù)據(jù)元素是否匹配;⑷是否存在沒有輸入或輸出的數(shù)據(jù)存儲。

人工方式數(shù)據(jù)字典的使用方式

計(jì)算機(jī)方式把各類條目按一定的格式寫在卡片上或紙上,并分類建立一覽表。在人工方式的根底上,將內(nèi)容整理存入計(jì)算機(jī)。附:數(shù)據(jù)字典的條目數(shù)據(jù)元素條目總編號:1-101編號:101名稱:學(xué)號有關(guān)編碼說明:別名:S-NO*******說明:本校學(xué)生編碼編號數(shù)據(jù)值類型:連續(xù)班號類型:字符專

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論