




已閱讀5頁,還剩78頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
遲嘉昱,管理信息系統(tǒng),第五章 數(shù)據(jù)資源管理,1. 數(shù)據(jù)資源管理 基本概念 信息世界和機器世界 數(shù)據(jù)庫的類型 傳統(tǒng)的文件處理 數(shù)據(jù)庫管理方法 2.數(shù)據(jù)庫管理技術基礎 數(shù)據(jù)庫結構 數(shù)據(jù)庫開發(fā),第一節(jié) 數(shù)據(jù)資源管理,大量的數(shù)據(jù),基本概念,數(shù)據(jù)資源管理 應用數(shù)據(jù)庫管理、數(shù)據(jù)倉庫等信息系統(tǒng)技術和其他數(shù)據(jù)管理工具,完成組織數(shù)據(jù)資源管理任務,滿足企業(yè)股東信息需求的管理活動。,基本概念,數(shù)據(jù)(Data) 未經加工的事實或觀察資料; 描述事物的符號記錄; 例: 數(shù)據(jù)的語法即數(shù)據(jù)的格式規(guī)定 數(shù)據(jù)的語義即數(shù)據(jù)的含義 人們通過解釋、推論、歸納、分析、綜合等方法從數(shù)據(jù)中獲得的有意義的內容即為信息,基本概念,數(shù)據(jù)庫(DataBase) 是長期儲存在計算機內的、有組織的、可共享的數(shù)據(jù)的集合。 例子:,基本概念,數(shù)據(jù)庫管理系統(tǒng) DBMS - DataBase Management System 處理數(shù)據(jù)庫訪問的軟件。 提供數(shù)據(jù)庫的用戶接口。 DBMS的目的: 提供一個可以方便地、有效地存取數(shù)據(jù)庫信息的環(huán)境。 例子:Oracle, DB2, SQL Server, Sybase Access, Interbase, MySQL,基本概念,數(shù)據(jù)庫系統(tǒng) 是指在計算機系統(tǒng)中引入數(shù)據(jù)庫后的系統(tǒng),數(shù)據(jù)庫系統(tǒng)構成,信息世界和機器世界,現(xiàn)實世界 存在于人們頭腦之外的客觀世界。 信息世界 信息世界是現(xiàn)實世界在人們頭腦中的反映,人們把它用文字和符號記載下來。,信息世界中的術語 1)實體:客觀存在的可以相互區(qū)別的東西。 注:可以是具體的對象,也可以是抽象的事件; 2)實體集:性質相同的同類實體的集合; 3)屬性:實體的每一個特性; 4)實體的鍵/碼(Key):能唯一標識每個實體的屬性或屬性集。,信息世界和機器世界,信息世界中的術語(續(xù)) 5)聯(lián)系(Relation) (1)一對一聯(lián)系; (2)一對多聯(lián)系; (3)多對多聯(lián)系。,信息世界和機器世界,實體和其相互關系,機器世界 信息經過加工編碼進入機器世界,信息世界的信息在機器世界中是以數(shù)據(jù)的形式存儲的。,信息世界和機器世界,機器世界中的術語: 1)字段:標記實體屬性的命名單位稱為字段,或數(shù)據(jù)項;它是可以命名的最小信息單位。字段的名稱往往和屬性名相同。 2)記錄:字段的有序集合稱為記錄。一般用一個記錄描述實體,所以記錄又可以定義為能完整地描述一個實體的字段集。 例如: 學生(990001,王軍,20,男,電子商務),信息世界和機器世界,機器世界中的術語(續(xù)) 3)文件:同一類記錄的集合稱為文件;文件是描述實體集的,所以它又可以定義為描述一個實體集的所有記錄集。 4)記錄的鍵:能唯一標識文件中每個記錄的字段或字段集。,信息世界和機器世界,術語的對應關系:,信息世界和機器世界,三個世界的關系:,信息世界和機器世界,現(xiàn)實世界,信息世界(概念模型,如ER圖),機器世界(DBMS支持的數(shù)據(jù)模型),收集、分類和抽象,加工轉化,邏輯數(shù)據(jù)元素,字符:一個簡單的字母,或是一個數(shù)字,或是一個其他符號。 字段(數(shù)據(jù)項):標記實體屬性的命名單位,由一組相關字符構成。 記錄:描述一個實體的屬性集,是字段的有序集合。 文件:一組相關(同一類)記錄的集合,用于描述實體集。 數(shù)據(jù)庫:存儲在組織計算機中的邏輯相關的所有數(shù)據(jù)元素的集合。,邏輯數(shù)據(jù)元素,邏輯數(shù)據(jù)元素,數(shù)據(jù)庫類型,數(shù)據(jù)庫類型,運營數(shù)據(jù)庫存儲支持業(yè)務流程和企業(yè)運營的詳細數(shù)據(jù)。如:客戶數(shù)據(jù)庫、人力資源數(shù)據(jù)庫、庫存數(shù)據(jù)庫以及存儲企業(yè)運營數(shù)據(jù)的其他數(shù)據(jù)庫。 分布式數(shù)據(jù)庫在各種網(wǎng)絡上將數(shù)據(jù)庫的全部或部分復制、分發(fā)到不同的網(wǎng)絡服務器上。對終端用戶來說,復制、分享數(shù)據(jù)庫可以提高數(shù)據(jù)庫的性能。但如何確保組織內分布式數(shù)據(jù)庫中所有數(shù)據(jù)的一致性和并發(fā)性是分布式數(shù)據(jù)庫管理面臨的挑戰(zhàn)。,數(shù)據(jù)庫類型,外部數(shù)據(jù)庫由在線商業(yè)服務公司提供的收費數(shù)據(jù)庫。WWW資源也屬于外部數(shù)據(jù)庫。 超媒體數(shù)據(jù)庫Web站點上存儲的超鏈接多媒體頁面(包括文本、圖形、圖片、視頻素材和音頻片段等)。,超媒體數(shù)據(jù)庫,數(shù)據(jù)倉庫,存儲著從各種運營數(shù)據(jù)庫、外部數(shù)據(jù)庫及其他組織數(shù)據(jù)庫中提取的數(shù)據(jù)。 是企業(yè)核心的數(shù)據(jù)資源。 其中的數(shù)據(jù)已經過清洗、轉換和分類,便于管理者及其他專業(yè)人士進行數(shù)據(jù)挖掘、聯(lián)機分析處理,便于進行各類業(yè)務分析、市場研究和決策支持,但不能被變更。,數(shù)據(jù)倉庫系統(tǒng),數(shù)據(jù)集市,定義: 是數(shù)據(jù)倉庫中關于企業(yè)某一方面的數(shù)據(jù)子集,如針對某一部門或針對某一業(yè)務流程。,數(shù)據(jù)倉庫與數(shù)據(jù)集市,數(shù)據(jù)挖掘,定義: 利用各種先進的模式識別算法和數(shù)學、統(tǒng)計技術分析數(shù)據(jù)倉庫中的數(shù)據(jù),揭示已經發(fā)生的業(yè)務活動中隱含的關系、模式和趨勢,并從中推出規(guī)則,幫助管理者預測未來的行為和制定決策。,數(shù)據(jù)挖掘,進行購物籃分析,識別新產品的捆綁銷售機會(啤酒+尿布)。 防止客戶流失并爭取新客戶。 發(fā)現(xiàn)質量和生產問題的根本原因。 對現(xiàn)有客戶進行交叉銷售。 建立更準確的客戶特征及偏好信息。,傳統(tǒng)的文件處理,定義: 用彼此獨立的數(shù)據(jù)文件來組織、存儲和處理數(shù)據(jù)。,銀行文件處理系統(tǒng),傳統(tǒng)的文件處理的問題,數(shù)據(jù)冗余:數(shù)據(jù)的重復,即同一數(shù)據(jù)(如客戶姓名和地址)存儲在很多個不同的文件中。 數(shù)據(jù)的不一致性:相同的項目,比如客戶的電話和地址,更新時需要多處進行修改。如果發(fā)現(xiàn)錯誤,兩個值不相同,則很難確定哪個值是正確的。 缺少數(shù)據(jù)集成:為從每個獨立的文件中提取數(shù)據(jù),我們必須編寫特定的計算機程序。 程序和數(shù)據(jù)的依賴:在文件處理系統(tǒng)中,系統(tǒng)的主要構成部分物理存儲設備上的組織文件和訪問這些文件的應用軟件彼此高度依賴。 數(shù)據(jù)的安全性和完備性差,數(shù)據(jù)庫管理方法,定義: 將原先存儲在各個獨立文件中的數(shù)據(jù)記錄合并到一個數(shù)據(jù)庫中,供很多不同的應用程序訪問。,銀行信息系統(tǒng)中的數(shù)據(jù)庫管理方法,數(shù)據(jù)庫管理軟件(DBMS),定義: 數(shù)據(jù)庫管理系統(tǒng)是數(shù)據(jù)庫管理方法的主要軟件工具。它是存儲數(shù)據(jù)庫結構、數(shù)據(jù)、數(shù)據(jù)庫中數(shù)據(jù)之間關系和與數(shù)據(jù)庫相關的報表和報告的軟件。 DBMS是用戶和數(shù)據(jù)庫之間的軟件界面,可以幫助用戶輕松訪問數(shù)據(jù)庫中的數(shù)據(jù),是控制著組織及其終端用戶對數(shù)據(jù)庫的創(chuàng)建、維護和使用。,DBMS的主要功能,數(shù)據(jù)庫的定義; 數(shù)據(jù)庫的維護; 數(shù)據(jù)庫的查詢; 數(shù)據(jù)庫的過程性/非過程性訪問; 應用程序開發(fā); 事務處理。,DBMS的主要功能,數(shù)據(jù)庫管理系統(tǒng)的優(yōu)點,減少數(shù)據(jù)冗余。 保證數(shù)據(jù)獨立性 從多個文件中集成數(shù)據(jù) 快速檢索數(shù)據(jù)和信息 改進安全控制。,數(shù)據(jù)庫管理系統(tǒng)的缺點,需要昂貴的軟件 需要較高的硬件配置 雇用和留住DBA人員。,數(shù)據(jù)庫查詢,定義: 終端用戶可以使用DBMS的查詢特性或報告生成器在數(shù)據(jù)庫中查找信息。 查詢語言只需輸入一個簡短的查詢語句,你的特殊數(shù)據(jù)需求就會立刻得到響應。 報告生成器你可以快速指定報告的格式,以報告的形式提供信息。,自然語言和SQL查詢,數(shù)據(jù)庫維護,組織數(shù)據(jù)庫需要不斷更新,以反映最新的企業(yè)事務和其他事件。 進行數(shù)據(jù)的更新或改正,以保證數(shù)據(jù)庫中數(shù)據(jù)的準確性。,應用開發(fā),很多DBMS軟件包都提供內嵌的第四代編程語言和軟件開發(fā)工具,終端用戶、系統(tǒng)分析員及其他應用開發(fā)人員可以使用它們來開發(fā)客戶化的應用程序。,第二節(jié) 數(shù)據(jù)庫管理技術,數(shù)據(jù)庫結構,層次結構記錄間的關系呈現(xiàn)為層次或樹狀結構。,數(shù)據(jù)庫結構,網(wǎng)狀結構可以沿多條路徑訪問同一數(shù)據(jù)元素,因為任何一個數(shù)據(jù)元素或記錄可以同多個其他數(shù)據(jù)元素發(fā)生關系。,數(shù)據(jù)庫結構,關系結構數(shù)據(jù)庫中所有數(shù)據(jù)元素都以簡單的表的形式存在。,數(shù)據(jù)庫結構,多維數(shù)據(jù)庫結構 使用多維結構來組織和表示數(shù)據(jù)間的關系。,多維數(shù)據(jù)庫,面向對象的數(shù)據(jù)庫結構,面向對象的數(shù)據(jù)模型比其他數(shù)據(jù)庫結構更易處理復雜的數(shù)據(jù)類型(如圖形、圖片、聲音和文本)。 封裝將描述實體屬性的數(shù)據(jù)值與數(shù)據(jù)上可以執(zhí)行的操作作為一個對象。 繼承通過復制一個或多個父對象的一些或全部特性,自動生成新對象。,繼承,數(shù)據(jù)庫結構評價,對企業(yè)運營存在的很多結構化、常規(guī)事務處理來說,層次模型是一種自然的數(shù)據(jù)庫模型。 網(wǎng)狀數(shù)據(jù)結構可以輕松地處理多對多關系。 關系型數(shù)據(jù)庫允許終端用戶根據(jù)特定的需求輕松地從數(shù)據(jù)庫中檢索信息。,數(shù)據(jù)庫結構評價,數(shù)據(jù)庫開發(fā),大型組織通常將企業(yè)級數(shù)據(jù)庫開發(fā)的控制權交給數(shù)據(jù)庫管理員(DBA) 數(shù)據(jù)字典:一個包含元數(shù)據(jù)的數(shù)據(jù)庫管理目錄。 元數(shù)據(jù):關于數(shù)據(jù)的數(shù)據(jù)。,數(shù)據(jù)庫開發(fā)流程,數(shù)據(jù)規(guī)劃,數(shù)據(jù)庫管理員、數(shù)據(jù)庫設計人員要與企業(yè)、終端用戶一起建立企業(yè)模型,定義企業(yè)基本的業(yè)務流程。,數(shù)據(jù)建模,定義: 識別數(shù)據(jù)元素間關系。 定義支持某項基本業(yè)務流程所需要的數(shù)據(jù)元素間的關系。,實體關系圖(E-R圖),最常用的概念模型表示方法,實體關系圖(E-R圖),E-R信息模型的設計與應用,E-R圖設計原則: 真實性原則 避免冗余原則 簡單性原則 合適性原則(用實體或屬性或聯(lián)系集) 注意對客觀對象的約束 映射約束、鍵碼約束、參照完整性約束,E-R信息模型的設計與應用,實體(Entity): 是一個有著一系列顯著的、易辨認的屬性的對象。 實體可以是具體的(物體、人物等。) 實體也可以抽象的(事、概念、事物之間的聯(lián)系) 確定實體的指導 找出問題中的大模塊 問題陳述中的名詞,E-R信息模型的設計與應用,屬性(Attribute) 實體的特性,它描述了實體的一個部分。 一個實體可由若干個屬性來刻畫。 如學生(學號,姓名,性別,) 碼(Key): 唯一標識實體的屬性集。 如:學號為學生的碼。 確定屬性的指導 可能將名詞當作屬性,但不應將其和實體混淆。,E-R信息模型的設計與應用,E-R圖繪制,E-R圖繪制,E-R信息模型的設計與應用,E-R信息模型的設計與應用,E-R圖向關系數(shù)據(jù)模型的轉換 E-R圖中每個實體,相應轉換為一個關系,該關系包括對應實體的全部屬性,并確定出該關系的關鍵字。 對于“聯(lián)系集”,根據(jù)聯(lián)系方式不同,采取不同手段以使被它聯(lián)系的實體所對應的關系彼此實現(xiàn)某種聯(lián)系。,ER圖向關系數(shù)據(jù)模型的轉換,E-R信息模型的設計與應用,將E-R圖轉換成相應的表 表是行和列的集合,實體被表示成表的形式。 用列標題表示實體的屬性。 用行表示關于實體的實際數(shù)據(jù)。,E-R信息模型的設計與應用,關于表和屬性的命名規(guī)則 屬性名和表名中不能包含空格 表名對實體的描述應該是有意義的。 如:student 表名只能描述一個主題,E-R信息模型的設計與應用,轉換舉例一,E-R信息模型的設計與應用,轉換舉例二,E-R信息模型的設計與應用,轉換舉例三,邏輯和物理視圖,邏輯視圖數(shù)據(jù)庫中數(shù)據(jù)及數(shù)據(jù)間關系; 物理視圖描述了計算機系統(tǒng)的物理存儲設備上如何存儲和存取數(shù)據(jù)。,邏輯和物理視圖,ANSI/SPARC三級模式結構,美國國家標準學會/標準計劃和要求委員會,模式(concept schema) 模式是對全體邏輯數(shù)據(jù)結構的描述,是所有用戶的公共數(shù)據(jù)視圖,模式又稱邏輯模式或概念模式; 外模式(external schema) 外模式是對局部邏輯數(shù)據(jù)結構的描述,是數(shù)據(jù)庫用戶的數(shù)據(jù)視圖,外模式又稱子模式(subschema)或用戶模式;,ANSI/SPARC三級模式結構,內模式(internal schema) 內模式是對數(shù)據(jù)物理存儲結構的描述,內模式又稱物理模式或存儲模式 2級映射與數(shù)據(jù)獨立性 外模式模式:保證邏輯數(shù)據(jù)獨立性 模式內模式:保證物理數(shù)據(jù)獨立性,ANSI/SPARC三級模式結構,ANSI/SPARC三級模式結構,數(shù)據(jù)結構 邏輯結構 數(shù)據(jù)之間存在的邏輯關系 表、樹、圖、數(shù)組 物理結構 數(shù)據(jù)在計算機內的存儲方式 順序方式、鏈接方式,ANSI/SPARC三級模式結構,數(shù)據(jù)獨立性 當數(shù)據(jù)的結構發(fā)生變化時,通過系統(tǒng)提供的映象(轉換)功能,使應用程序不必
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司每月娛樂活動方案
- 公司組織義工活動方案
- 公司組建舞蹈隊活動方案
- 公司研學策劃方案
- 公司組織燒烤策劃方案
- 公司派對活動方案
- 公司節(jié)后收心會活動方案
- 2025年心理健康教育輔導考試試題及答案
- 濱海生態(tài)補償機制-洞察及研究
- 2025年食品科學與工程專業(yè)考試試卷及答案
- 第四版(2025)國際壓力性損傷潰瘍預防和治療臨床指南解讀
- 山東省2024年藝術類專科批美術與設計類第1次志愿投檔情況表(公布)
- 《道德經》的智慧啟示智慧樹知到期末考試答案2024年
- 工作作風方面和問題和不足(宗旨意識和群眾感情淡漠脫離群眾、脫離實際調查研究不經常、不深入)15篇
- 藝術欣賞完整版課件全套ppt教程(最新)
- GB∕T 2518-2019 連續(xù)熱鍍鋅和鋅合金鍍層鋼板及鋼帶
- 土地項目測算表_模板
- 教育培訓機構輔導老師月度績效考核表(KPI)
- 立式水輪機組軸線調整及導軸承的間隙分配ppt課件
- 華星全站儀使用說明書-
- 專項審計報告模板(青島市高新技術企業(yè)認定專用)
評論
0/150
提交評論