旅游數據資源管理技術.ppt_第1頁
旅游數據資源管理技術.ppt_第2頁
旅游數據資源管理技術.ppt_第3頁
旅游數據資源管理技術.ppt_第4頁
旅游數據資源管理技術.ppt_第5頁
已閱讀5頁,還剩93頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、,第四章 旅游數據資源管理技術,第四章 旅游數據資源管理技術,【學習目標】 掌握數據庫和數據倉庫概念 了解常用的數據庫管理系統 使用常用的數據挖掘工具進行統計決策 【知識要點】 數據庫和數據倉庫 數據庫管理系統 數據挖掘工具,第一節(jié) 數據管理技術的發(fā)展,一、人工管理階段 人工管理階段數據管理的特點 人工管理階段數據與程序的關系,第一節(jié) 數據管理技術的發(fā)展,二、文件系統階段 文件系統階段數據管理的特點 文件系統階段數據與程序的關系,第一節(jié) 數據管理技術的發(fā)展,三、數據庫系統階段 數據庫系統相關概念 數據庫系統 (DBS,Data Base System) 數據庫 (DB,Data Base) 數

2、據庫管理系統 (Data Base Management System),第一節(jié) 數據管理技術的發(fā)展,三、數據庫系統階段 數據庫管理階段數據與程序的關系 數據庫管理階段的特點,第二節(jié) 文件管理,一、文件概念 文件系統在操作系統中的作用 相關概念 文件系統 文件 文件名稱、文件命名、文件類型 文件屬性、文件長度、文件時間 文件權限,第二節(jié) 文件管理,二、文件分類 按文件的用途進行分類 系統文件、庫文件、用戶文件 按文件的性質分類 普通文件目錄文件特殊文件 按文件的保護級別進行分類 源文件、目標文件、可執(zhí)行文件,第二節(jié) 文件管理,三、文件存取和操作 文件的存取 順序訪問、隨機訪問、索引訪問 文件的

3、操作 對文件自身的操作 建立、刪除、打開、關閉、讀寫 對記錄的操作 插入、刪除、修改、查找,第二節(jié) 文件管理,四、文件的結構與處理方法 文件結構 物理結構、邏輯結構 文件系統的安全性和可恢復性 常見的文件系統及特點 Sysv、Minix、Ext、Ext2、NFS、Hpfs FAT(FAT12、FAT16、FAT32) 、exFAT NTFS,第三節(jié) 數據庫模型,一、數據庫概念 數據庫系統 數據管理是數據處理的中心問題。數據處理是指對各種形式的數據進行收集、儲存、加工和傳播的一系列活動的總和。 數據管理指的是對數據的分類、組織、編碼、儲存、檢索和維護。 數據庫技術所研究的問題是如何科學地組織和儲

4、存數據,如何高效地處理數據以獲取其內在信息。,第三節(jié) 數據庫模型,一、數據庫概念 數據庫管理系統 是數據庫系統的關鍵內容。它在操作系統的支持下對數據庫進行統一管理和控制。數據庫的維護工作、安全性和完整性都由DBMS負貴,應用程序只有通過DBMS才能執(zhí)行。 數據庫管理系統的主要功能 數據庫的定義、建立和維護功能 為數據存取功能 數據庫運行管理功能,第三節(jié) 數據庫模型,一、數據庫概念 數據庫系統的主要特征 數據的結構化 數據冗余度小 數據共享 具有較高的數據和程序獨立性 提供各種安全性功能,第三節(jié) 數據庫模型,二、關系數據庫模型 現實世界的數據化過程 現實世界、信息世界和數據世界之間的關系,第三節(jié)

5、 數據庫模型,二、關系數據庫模型 概念模型與數據模型 概念模型 實體(Entity) 實體的屬性(Attribute) 反映實體特性只涉及有限個屬性 屬性名、屬性值 屬性的域屬性的取值范圍,第三節(jié) 數據庫模型,二、關系數據庫模型 概念模型與數據模型 概念模型 實體集(Entity Unit) 所有屬性名完全相同實體的集合 實體名實體集的名稱 實體型(Entity Type) 實體名及其所有屬性名的集合 碼或關鍵字(Key) 確定實體集中唯一實體的屬性(集),第三節(jié) 數據庫模型,二、關系數據庫模型 概念模型與數據模型 概念模型 實體集之間的聯系 一對一聯系(1:1) 一對多聯系(1:n) 多對多

6、聯系(m:n),第三節(jié) 數據庫模型,實體集之間的聯系,第三節(jié) 數據庫模型,二、關系數據庫模型 概念模型的表示方法E-R圖 概念模型常用實體聯系法表示,即E-R圖 在E-R圖中,長方形表示實體,橢圓表示屬性,用無向邊把實體與其屬性連接起來。 菱形表示實體間的聯系,用無向邊把菱形與有關實體連接起來并在無向邊旁標上聯系的類型。若聯系具有屬性,則也把屬性與菱形用無向邊相連。,第三節(jié) 數據庫模型,教師與課程關系的E-R圖,第三節(jié) 數據庫模型,教務管理系統E-R圖,第三節(jié) 數據庫模型,二、關系數據庫模型 數據模型 非關系模型 前兩種模型統稱為非關系模型,它們的數據結構和圖是相互對應的。 在非關系模型中,概

7、念模型中的實體、實體型分別反映為記錄和記錄型,因此圖的結點表示記錄型,結點之間的連接弧表示記錄型之間的聯系。,第三節(jié) 數據庫模型,二、關系數據庫模型 數據模型 非關系模型 基本層次聯系 數據結構可以分解為基本層次聯系。 兩個記錄型及它們之間的 一對多(一對一)的聯系 稱為基本層次聯系。 父記錄和子記錄,第三節(jié) 數據庫模型,二、關系數據庫模型 數據模型 非關系模型 層次模型 若一個基本層次聯系的集合滿足下列兩個條件,則它是層次模型 有且僅有一個無父結點,這樣的結點稱為根結點。 非根結點都有且僅有一個父結點。,第三節(jié) 數據庫模型,多層層次模型,第三節(jié) 數據庫模型,二、關系數據庫模型 數據模型 非關

8、系模型 網狀模型 若一個基本層次聯系集合中,至少有一個結點有一個以上的父結點,則這種數據模型是網狀模型。 可能有一個以上的結點無父結點 結點與其父結點間聯系可能不止一個,第三節(jié) 數據庫模型,網狀模型,第三節(jié) 數據庫模型,二、關系數據庫模型 數據模型 關系模型 當前廣泛應用的數據庫管理系統幾乎都支持關系模型,稱為關系型數據庫管理系統(Relational Data Base Management System,即RDBMS) 關系模型用二維表表示實體及其相互聯系 對表的構成形式有一定限制,第三節(jié) 數據庫模型,二、關系數據庫模型 數據模型 關系模型 關系模型的主要術語 元組:行,對應實體,相當于記

9、錄 屬性和屬性名:列,列的名稱 分量:一個元組在一個屬性上的值 關系與關系名:整表是一個關系 關系模式:關系名及其所有屬性名集合,第三節(jié) 數據庫模型,二、關系數據庫模型 數據模型 關系模型 關系模型對二維表的限制 表中每一列都必須是不可分的基本項。 表中沒有完全相同的兩個元組。 在一個關系模式中: 不能有兩個屬性具有相同的屬性名。 屬性間順序和元組間順序都是無關緊要的。,第四節(jié) 旅游企業(yè)中常用的數據庫管理系統,一、Oracle數據庫管理系統 完整的數據管理功能 分布式數據庫系統,支持Internet應用 提供界面友好、功能齊全的數據庫開發(fā)工具 使用PL/SQL語言執(zhí)行各種操作 可開放性、可移植

10、性、可伸縮性 支持面向對象的功能,如類、方法、屬性等 對象/關系型數據庫管理系統 目前最新版本是Oracle 11g,第四節(jié) 旅游企業(yè)中常用的數據庫管理系統,二、DB2數據庫管理系統 具有較好的可伸縮性、高層次的數據利用性、完整性、安全性、可恢復性 與平臺無關的基本功能和SQL命令 數據分級技術 查詢優(yōu)化器,支持多任務并行查詢 網絡支持能力,適用于大型分布式應用系統 可通過開放數據庫連接(ODBC)接口、Java數據庫連接(JDBC)接口,或者CORBA接口代理被任何應用程序訪問,第四節(jié) 旅游企業(yè)中常用的數據庫管理系統,三、MS Access數據庫管理系統 Microsoft Office組件

11、之一 桌面型數據庫管理系統 無需編寫任何代碼,可視化操作 包括表、窗體、查詢、報表、宏、模塊等要素 支持ODBC與其他數據庫相連,實現數據交換和共享 與Office辦公軟件進行數據交換和共享 支持嵌入和鏈接多媒體數據,四大主流數據庫比較,一、開放性 1. SQL Server 只能在windows上運行,沒有絲毫的開放性,操作系統的系統的穩(wěn)定對數據庫是十 分重要的。Windows9X系列產品是偏重于桌面應用,NT server只適合中小型企業(yè)。而且windows平臺的可靠性,安全性和伸縮性是非常有限的。它不象unix那樣久經考驗,尤其是在處理大數據庫。 2. Oracle 能在所有主流平臺上運

12、行(包括 windows)。完全支持所有的工業(yè)標準。采用完全開放策略。可以使客戶選擇最適合的解決方案。對開發(fā)商全力支持。,四大主流數據庫比較,一、開放性 3. Sybase ASE 能在所有主流平臺上運行(包括 windows)。 但由于早期Sybase與OS集成度不高,因此VERSION11.9.2以下版本需要較多OS和DB級補丁。在多平臺的混合環(huán)境中,會有一定問題。 4. DB2 能在所有主流平臺上運行(包括windows)。最適于海量數據。DB2在企業(yè)級的應用最為廣泛,在全球的500家最大的企業(yè)中,幾乎85%以上用DB2數據庫服務器,而國內到97年約占5%。,四大主流數據庫比較,二、可伸

13、縮性,并行性 1. SQL Server 并行實施和共存模型并不成熟,很難處理日益增多的用戶數和數據卷,伸縮性有限。 2. Oracle 并行服務器通過使一組結點共享同一簇中的工作來擴展windownt的能力,提供高可用性和高伸縮性的簇的解決方案。如果windowsNT不能滿足需要,用戶可以把數據庫移到UNIX中。Oracle的并行服務器對各種UNIX平臺的集群機制都有著相當高的集成度。,四大主流數據庫比較,二、可伸縮性,并行性 3. Sybase ASE 雖然有DB SWITCH來支持其并行服務器,但DB SWITCH在技術層面還未成熟,且只支持版本12.5以上的ASE SERVER。DB

14、SWITCH技術需要一臺服務器充當SWITCH,從而在硬件上帶來一些麻煩。 4. DB2 具有很好的并行性。DB2把數據庫管理擴充到了并行的、多節(jié)點的環(huán)境。數據庫分區(qū)是數據庫的一部分,包含自己的數據、索引、配置文件、和事務日志。數據庫分區(qū)有時被稱為節(jié)點安全性。,四大主流數據庫比較,三、安全認證 1. SQL Server 沒有獲得任何安全證書。 2. Oracle Server 獲得最高認證級別的ISO標準認證。 3. Sybase ASE 獲得最高認證級別的ISO標準認證。 4. DB2 獲得最高認證級別的ISO標準認證。,四大主流數據庫比較,四、性能 1. SQL Server 多用戶時性

15、能不佳 2. Oracle 性能最高, 保持開放平臺下的TPC-D和TPC-C的世界記錄。 3. Sybase ASE 性能接近于SQL Server,但在UNIX平臺下的并發(fā)性要優(yōu)與 SQL Server。 4. DB2 性能較高適用于數據倉庫和在線事物處理。,四大主流數據庫比較,五、客戶端支持及應用模式 1. SQL Server C/S結構,只支持windows客戶,可以用ADO、DAO、OLEDB、ODBC連接。 2. Oracle 多層次網絡計算,支持多種工業(yè)標準,可以用ODBC、JDBC、OCI等網絡客戶連接。 3. Sybase ASE C/S結構,可以用ODBC、Jconnec

16、t、Ct-library等網絡客戶連接。 4. DB2 跨平臺,多層結構,支持ODBC、JDBC等客戶。,四大主流數據庫比較,六、操作簡便 1. SQL Server 操作簡單,但只有圖形界面。 2. Oracle 較復雜,同時提供GUI和命令行,在windowsNT和unix下操作相同。 3. Sybase ASE 較復雜,同時提供GUI和命令行。但GUI較差,常常無法及時狀態(tài),建議使用命令行。 4. DB2 操作簡單,同時提供GUI和命令行,在windowsNT和unix下操作相同。,四大主流數據庫比較,七、使用風險 1. SQL server 完全重寫的代碼,經歷了長期的測試,不斷延遲,

17、許多功能需要時間來證明。并不十分兼容。 2. Oracle 長時間的開發(fā)經驗,完全向下兼容。得到廣泛的應用。完全沒有風險。 3. Sybase ASE 向下兼容, 但是ct-library 程序不益移植。 4. DB2 在巨型企業(yè)得到廣泛的應用,向下兼容性好。風險小。,第五節(jié) 旅游企業(yè)中的數據倉庫,一、數據倉庫(Data Warehouse) 數據倉庫定義 數據倉庫定義為面向主題的、集成的、穩(wěn)定的、不同時間的、反映歷史變化數據集合,用于支持經營管理中決策制定過程。,第五節(jié) 旅游企業(yè)中的數據倉庫,一、數據倉庫(Data Warehouse) 數據倉庫的特點 面向主題 集成性 穩(wěn)定性 反映歷史變化

18、的,特點1:數據倉庫是面向主題的,基于傳統關系數據庫建立的各個應用系統,是面向應用進行數據組織的;而數據倉庫中的數據是面向主題進行組織的。主題是指一個分析領域,是在較高層次上企業(yè)信息系統中的數據綜合、歸類并進行利用的抽象。所謂較高層次是相對面向應用而言的,其含義是指按照主題進行數據組織的方式具有更高的數據抽象級別。 例如保險公司建立數據倉庫,所選主題可能是顧客、保險金和索賠等,而按照應用組織的數據庫則可能是汽車保險、生命保險和財產保險等。對于一個網上商城的數據倉庫來說,那么銷售分析就是一個主題,客戶屬性分析也是一個主題。,特點2:數據倉庫是集成的,面向事務處理的操作型數據庫通常與某些特定的應用

19、相關,數據庫之間相互獨立,并且往往是異構的。而數據倉庫中的數據是在對原有分散的數據庫數據抽取、清理的基礎上經過系統加工、匯總和整理得到的,必須消除源數據中的不一致性,以保證數據倉庫內的信息是關于整個企業(yè)的一致的全局信息。在創(chuàng)建數據倉庫時,信息集成的工作包括格式轉換、根據選擇邏輯消除沖突、運算、總結、綜合、統計、加時間屬性和設置缺省值等工作。還要將原始數據結構作一個從面向應用到面向主題的轉變。,特點2:數據倉庫是集成的,數據倉庫環(huán)境下數據的集成,特點3:數據倉庫是穩(wěn)定的,操作型數據庫中的數據通常實時更新,數據根據需要及時發(fā)生變化。數據倉庫的數據主要供企業(yè)決策分析之用,所涉及的數據操作主要是數據查

20、詢,數據一旦裝入其中,基本不會發(fā)生變化。數據倉庫中的每個數據項對應于一個特定時間。當對象某些屬性發(fā)生變化就會生成新的數據項。一旦某個數據進入數據倉庫以后,一般情況下將被長期保留,也就是數據倉庫中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。因此,數據倉庫的信息具有穩(wěn)定性。,特點4:數據倉庫是反映歷史變化的,操作型數據庫主要關心當前某一個時間段內的數據,而數據倉庫中的數據通常包含歷史信息,系統記錄了企業(yè)從過去某一時點(如開始應用數據倉庫的時點)到目前的各個階段的信息,通過這些信息,可以對企業(yè)的發(fā)展歷程和未來趨勢做出定量分析和預測。,數據隨時間變化,數據的不可更新是指數據

21、倉庫用戶進行分析處理時不進行數據更新工作,不是說數據倉庫從開始到刪除的整個生命周期都是永遠不變的。 數據倉庫的數據隨著時間變化而定期被更新,每隔一段固定的時間間隔后,運作數據庫系統中產生的數據被抽取、轉換以后集成到數據倉庫中,而數據的過去版本仍保留在數據倉庫中。 數據倉庫的數據也有存儲期限,一旦超過了這個期限,過期數據就要被刪除,只是數據倉庫內的數據實現要遠遠長于操作型環(huán)境中的數據時限。,第五節(jié) 旅游企業(yè)中的數據倉庫,一、數據倉庫(Data Warehouse) 數據倉庫是一個數據庫,其中的數據來自于許多系統,旨在支持管理報表生成和決策制定。 廣義上,數據倉庫實際上指的是數據存儲和工具。 數據

22、倉庫使用用戶在業(yè)務活動中收集的信息來幫助用戶決策,使用戶更好、更巧妙、更快、更有效地操作業(yè)務。 數據倉庫是合理的業(yè)務智能架構的關鍵部分。,一、數據倉庫(Data Warehouse) 企業(yè)數據倉庫的建設,是以現有企業(yè)業(yè)務系統和大量業(yè)務數據的積累為基礎。數據倉庫不是靜態(tài)的概念,只有把信息及時交給需要這些信息的使用者,供他們做出改善其業(yè)務經營的決策,信息才能發(fā)揮作用,信息才有意義。而把信息加以整理歸納和重組,并及時提供給相應的管理決策人員,是數據倉庫的根本任務。因此,從產業(yè)界的角度看,數據倉庫建設是一個工程,是一個過程。,第五節(jié) 旅游企業(yè)中的數據倉庫,數據倉庫進化過程,最初的數據倉庫主要用于企業(yè)內

23、部某一部門的報表。,決策者關心的重點發(fā)生了轉移從發(fā)生了什么轉向為什么會發(fā)生。分析活動的目的就是了解報表數據的涵義,需要對更詳細的數據進行各種角度的分析。,當一個公司決策過程得到量化以后,對經營動態(tài)的情況以及這種情況為什么發(fā)生都會有所體驗,下一步就是要將信息用于預測。,重在戰(zhàn)術性決策支持。重點在企業(yè)外部,為執(zhí)行公司戰(zhàn)略的員工提供支持。,動態(tài)數據倉庫在決策支持領域中的角色越重要,企業(yè)實現決策自動化的積極性就越高。在CRM環(huán)境中,利用動態(tài)數據倉庫,根據每一位客戶的情況做出決策都是可能的。,數據倉庫與數據庫的區(qū)別,數據倉庫的體系結構,第五節(jié) 旅游企業(yè)中的數據倉庫,一、數據倉庫(Data Warehou

24、se) 當前報表架構存在的問題 可訪問性 及時性 格式 完整性 目標、業(yè)務、智能,第五節(jié) 旅游企業(yè)中的數據倉庫,一、數據倉庫(Data Warehouse) 數據倉庫在DSS(決策支持系統)中的地位 傳統輔助決策的軟件結構是“三部件”型:總控部件、數據庫部件和模型部件。,第五節(jié) 旅游企業(yè)中的數據倉庫,一、數據倉庫(Data Warehouse) 數據倉庫在DSS(決策支持系統)中的地位 現代決策支持系統架構基于數據倉庫、聯機處理分析和數據挖掘。,第五節(jié) 旅游企業(yè)中的數據倉庫,一、數據倉庫(Data Warehouse) 數據倉庫在DSS(決策支持系統)中的地位 數據倉庫已經成為現代DSS的主要

25、數據源 傳統DSS架構的不足 現代DSS架構的突破 實際應用案例 基于數據倉庫的高速公路營運管理輔助決策系統的概念模型,第五節(jié) 旅游企業(yè)中的數據倉庫,二、數據挖掘(Data Mining) 數據挖掘的產生 起因:豐富的數據,貧乏的知識 發(fā)展:20世紀80年代開始,數據挖掘技術逐步發(fā)展起來 快速發(fā)展原因: 擁有巨大的數據資源,以及將這些數據資源轉換為信息和知識資源的巨大需求 數據挖掘可被看作是數據管理與分析技術的自然進化產物,什么是數據挖掘 ?,數據挖掘是一個利用各種分析方法和分析工具在大規(guī)模海量數據中建立模型和發(fā)現數據間關系的過程,這些模型和關系可以用來做出決策和預測。,第五節(jié) 旅游企業(yè)中的數

26、據倉庫,二、數據挖掘(Data Mining) 數據挖掘基本知識 數據挖掘: 從大量數據中挖掘或抽取出知識。 數據庫中知識發(fā)現 KDD,Knowledge Discovery from Database 從大量數據中抽取挖掘出未知的、有價值的模式或規(guī)律等知識的復雜過程。 整個知識挖掘過程由若干挖掘步驟組成,數據挖掘僅是其中一個主要步驟。,數據挖掘能做些什么?,數據特征化和數據區(qū)分 關聯分析 分類和預測 聚類分析 孤立點分析 演變分析,數據挖掘的常用方法,決策樹 相關規(guī)則 神經元網絡 遺傳算法 可視化 OLAP聯機分析處理 統計方法,數據挖掘的常用方法,決策樹 決策樹(Decision Tree

27、)。決策樹方法被成功地應用于信用卡損失和不同的國際流通貨幣的時序預測等各種問題中。一般可用于探索問題、數據預處理和預測中。目前常用的有ID3、CHAID和CART等幾種典型的算法。 決策樹算法的主要優(yōu)點是直觀,其缺點在于隨著數據復雜性的增加,分支數會增加,對數據倉庫的搜索次數會增加,管理難度會加大。,數據挖掘的常用方法,神經元網絡 神經元網絡(Neural Network)。神經元網絡雖然在易用性和易理解性方面受到了限制,但其正確率很高。它通過學習發(fā)現規(guī)律,然后進行預測。神經元網絡可用于聚類、異常發(fā)現、特征制取和預測。,數據挖掘的常用方法,遺傳算法 遺傳算法(Genetic Algorithm

28、s)。遺傳算法是霍蘭等人于20世紀40年代提出的。以生物進化的過程為基礎,加以交叉、變異和選擇運算,逐步得到問題的最優(yōu)解。,第五節(jié) 旅游企業(yè)中的數據倉庫,二、數據挖掘(Data Mining) 數據倉庫與數據挖掘 數據倉庫是創(chuàng)建商務智能過程中,繼數據庫技術后進一步的發(fā)展(超過數據庫)。 數據挖掘工具是人們用于數據倉庫和商務智能推理過程中,支持決策、解決問題或創(chuàng)造競爭優(yōu)勢而挖掘有價值信息時所必需的工具。,ORACLE 數據倉庫和數據挖掘解決方案,Oracle數據庫 SQL *Loader工具 Oracle Warehouse Builder (OWB),Oracle 提供的數據倉庫工具及其功能介

29、紹,1. Oracle9i 數據庫,一個對象關系型數據倉庫,用于存儲大量的數據。,2. SQL *Loader工具,用于將數據裝載到數據倉庫中。這些數據包括Oracle數據庫中的數據,其他數據管理系統中的數據和外部數據。開發(fā)人員可以利用這兩種工具將多種數據源融合在一個單一的存儲系統中,并加以管理,從而為最終用戶提供對這多種數據源的無縫訪問。,3. Oracle Warehouse Builder,OWB是Oracle Developer Suits 中的一個組件,是用于設計、實現、和管理企業(yè)數據倉庫和數據集市的集成系統。 通過向導驅動的用戶界面來進行數據映射、元數據導入,利用預定義的轉換庫,能

30、夠減少設計和實施時間。 自動生成代碼,并且通過校驗程序保證編碼的正確性和唯一性,按照部署的要求生成不同的編碼類型。,3. Oracle Warehouse Builder,提供可視化的直觀映射和轉換工具、對多維數據的拖放功能,以及一個用于管理倉庫的系統外門戶解決方案,降低設計和開發(fā)數據倉庫和數據中心的復雜度。 OWB為事實表和維度表提供向導和圖形編輯器。 OWB全面應用Oracle 9i 的分區(qū)、索引和總結管理等特性,與數據庫的緊密集成允許Oracle 9i 作為一種轉換引擎使用,排除了增加轉換服務器的需求。,3. Oracle Warehouse Builder,利用OWB組件文件集成器,實

31、現從文本文件中提取數據。 OWB包括一個全局共享庫(Global Shared Library),用于存儲可重復使用的轉換。 OWB軟件還包括Oracle Pure Integrate 和OWB Integrator for SAP R/3, 前者是將數據客戶集成以形成戰(zhàn)略性電子商務項目基礎的軟件,后者是對SAP特有的ERP數據進行強有力報表制作和分析的集成橋梁。,Oracle提供的數據挖掘工具及其功能介紹,Oracle 9i Data Mining Oracle 9i OLAP 工具集 (1)Oracle Discoverer (2)Oracle Express系列 Oracle Expre

32、ss Analyzer Oracle Express Objects Oracle Express Server,1. Oracle 9i Data Mining,提高應用軟件的預測力和洞察力 將數據挖掘功能嵌入 Oracle 9i 數據庫中 基于 Java 的 API,提高應用軟件的預測力和洞察力,利用DM,公司能夠構建高級商務智能應用程序、對公司的數據庫進行挖掘、發(fā)現新的有用信息并將其集成到商務應用程序中。 利用DM,公司能夠提高在客戶關系管理(CRM)、企業(yè)資源計劃(ERP)、網頁入口和無線應用等商務智能方面的能力。 鑒別最有利可圖的消費者,避免客戶流失 獲得新客戶,對已有客戶進行交叉銷

33、售 檢測欺詐行為 預測零件質量 尋找病人、藥品和療效之間的關系,數據挖掘功能的內嵌,Oracle 9i Data Mining 將數據挖掘功能嵌入 Oracle 9i 數據庫中,用于分類、預報和關聯。所有的模型構建、評分、以及元數據管理操作經由基于 Java 的 API 來啟動并完全在該關系數據庫中發(fā)生。 采用貝葉斯法則進行預測和分類 運用關聯規(guī)則檢測隱藏于數據庫中“相關”或并發(fā)事件 自動提取商務信息并將其整合在其他應用軟件之中,基于 Java 的 API,商務智能(BI)開發(fā)人員可以使用基于Java的應用程序接口(API)來開發(fā)基于預測的應用軟件。 自動執(zhí)行數據挖掘進程,為消費者打分以及產生

34、需求預測。 通過查詢、分析和報表生成器產生新的數據挖掘信息。 支持應用程序的集成。,2. Oracle 9i OLAP工具,企業(yè)級OLAP可將跨部門的數據緊密地聯系在一起,從而使所有用戶在一個共同的信息基礎上。它幫助用戶使用數據倉庫中的所有數據。 企業(yè)級OLAP還能夠超越數據倉庫的范圍,集成來自其它獨立系統的數據,這些系統可能是關系型數據庫或者外部的文件系統。這種集成使得新型應用,如:基于事實的促銷、基于行為的定價以及產品利潤分析等能夠跨越單一部門的界限。,(1)Oracle Discoverer,是Oracle公司面向決策支持系統OLAP工具集的組成部分。它是一個直觀的隨意查詢、報告、搜索和

35、Web公布的工具。 它能夠幫助公司內部各個層次的商業(yè)用戶,獲得迅速訪問關系型數據庫、數據中心或者聯機事務處理系統中數據的能力。,(1)Oracle Discoverer,User Edition提供了超乎尋常的易用性,通過任意深入能力、旋轉和圖表,給予用戶強大的數據探索能力。 Administration Edition提供了一個易于使用的基于服務器的強大的最終用戶層(End User Layer) 。 對于那些需要集中精力處理商業(yè)問題而不是數據問題的最終用戶而言,End User Layer為他們隱藏了數據結構和相互關系的復雜性。,(2) Oracle Express系列,通過使用Oracl

36、e Express : 分析咨詢人員能夠很輕松地從各自的視角觀察數據 產品經理能夠跨越許多時間段和市場區(qū)域研究她負責的某個產品 財務經理可以集中在當前或者以前的時間段,研究所有的市場和產品 地區(qū)經理可在某些地區(qū)的所有時間段上考察所有產品 策略規(guī)劃人員可以集中在公司數據的某個集上,如在當前和下個季度,僅在西部地區(qū)銷售的某個新產品,Oracle Express Analyzer,通用的、面向最終用戶的報告和分析工具,它采用面向對象技術,在Oracle Express Analyzer中能運行任何Oracle Express Objects應用。 在Oracle Express Analyzer的一

37、個基石性對象是簡報(briefing)。一個簡報由若干頁組成,每一頁上包含由可重用的對象建立的面向主題的分析。這些對象是交互的、用戶能夠旋轉、深入和查詢任何一張簡報頁中的表格或者圖形,以運行他們自己的即席分析。,Oracle Express Objects,是最早出現的用于建立C/S上OLAP應用的面向對象的可視化開發(fā)環(huán)境。 提供圖形化建模和假設分析功能 。 通過使用標準的Microsoft對象連接嵌入技術(OLE),實現對第三方軟件開放。例如能夠使用一個OLE控件顯示銷售某公司產品的商店。 通過使用代理程序、預警程序和OLE控件,可以監(jiān)控存貨水平,當存貨水平下降時向管理人員報警,自動提高主要產品的存貨水平。,Oracle Express Server,是一個先進的計算機引擎和數據高速緩存。 支持最能反應用戶對其業(yè)務思考方法的多維模型,而且具有分析、預測、建模,以及對數據進行假設分析(what-if)的能力。 具有用于數學、財務、統計和時間序列管理等方面的內置功能 。,第五節(jié) 旅游企業(yè)中的數據倉庫,三、常用的數據挖掘工具 數據挖掘工具 查詢與報表工具 智能代理 多維分析工具 統計工具 數據集市 小型的數據倉庫,數據庫設計主鍵的故事,什么是主鍵? 關系數據庫為了唯一區(qū)分表的每一行記錄,必須為表確定一個主鍵。主鍵可以是一個或多個列組成,這些主鍵列的值不能重復

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論