![《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》(演示稿)第5章_第1頁](http://file4.renrendoc.com/view/77206421d2ccd759c26263fe4ab20be9/77206421d2ccd759c26263fe4ab20be91.gif)
![《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》(演示稿)第5章_第2頁](http://file4.renrendoc.com/view/77206421d2ccd759c26263fe4ab20be9/77206421d2ccd759c26263fe4ab20be92.gif)
![《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》(演示稿)第5章_第3頁](http://file4.renrendoc.com/view/77206421d2ccd759c26263fe4ab20be9/77206421d2ccd759c26263fe4ab20be93.gif)
![《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》(演示稿)第5章_第4頁](http://file4.renrendoc.com/view/77206421d2ccd759c26263fe4ab20be9/77206421d2ccd759c26263fe4ab20be94.gif)
![《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》(演示稿)第5章_第5頁](http://file4.renrendoc.com/view/77206421d2ccd759c26263fe4ab20be9/77206421d2ccd759c26263fe4ab20be95.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第5章數(shù)據(jù)倉庫系統(tǒng)的實施SQL Server 2000數(shù)據(jù)倉庫設(shè)計與使用其他一些公司的數(shù)據(jù)倉庫實施戰(zhàn)略數(shù)據(jù)倉庫的投資回報分析1SQLServer 2000的基本服服務SQLServer 2000關(guān)系數(shù)據(jù)據(jù)庫引擎擎:是一一個流行行的、具具有高度度可伸縮縮性和高高度可靠靠性的數(shù)數(shù)據(jù)存儲儲引擎。該數(shù)據(jù)據(jù)庫引擎擎將數(shù)據(jù)據(jù)存儲在在表中。每個表表上都列列出感興興趣的一一些對象象,每個個表上的的列表示示由表建建模的對對象的屬屬性,而而表上的的行則代代表由表表建模的的這種對對象的事事例。應應用程序序可以將將結(jié)構(gòu)化化查詢語語言(SQL)的語句提提交給數(shù)數(shù)據(jù)庫引引擎,后后者將表表格格式式的結(jié)果果集返回回給應用用程
2、序。SQLServer支持的特特定SQL語言稱為為Transact-SQL。應用程序序還可以以提交SQL語句或XPath查詢,并并請求數(shù)數(shù)據(jù)庫引引擎以XML文檔形式式返回結(jié)結(jié)果。關(guān)系數(shù)據(jù)據(jù)庫引擎擎具有高高度的可可伸縮性性。SQLServer 2000企業(yè)版可可以支持持多組數(shù)數(shù)據(jù)庫服服務器相相互協(xié)作作,構(gòu)成成可供上上千用戶戶同時訪訪問的TB大小的數(shù)數(shù)據(jù)庫。該引擎擎能夠處處理世界界上任何何Web站點的流流量。該該數(shù)據(jù)庫庫引擎還還能自我我調(diào)節(jié),自動在在連接到到數(shù)據(jù)庫庫的用戶戶增多時時獲取資資源,并并在用戶戶注銷后后釋放資資源。2SQLServer 2000的基本服服務關(guān)系數(shù)據(jù)據(jù)庫引擎擎具有高高可靠性
3、性。在數(shù)數(shù)據(jù)庫引引擎的早早期版本本中要求求停止和和啟動的的管理操操作現(xiàn)在在可以在在引擎運運行當中中執(zhí)行,從而增增加了可可用性。數(shù)據(jù)庫庫引擎與與Windows 2000和Windows NT故障轉(zhuǎn)移移群集的的集成可可定義虛虛擬服務務器,即即使節(jié)點點中的一一臺物理理服務器器出現(xiàn)故故障,這這些虛擬擬服務器器仍然保保持運行行。在適適當?shù)牡氐胤?,日日志傳送送可以用用于維護護熱備用用服務器器。在故故障發(fā)生生的數(shù)分分鐘內(nèi),熱備用用服務器器可以代代替生產(chǎn)產(chǎn)服務器器運行。關(guān)系數(shù)據(jù)據(jù)庫引擎擎具有高高度的安安全性。登錄身身份驗證證可以與與Windows身份驗證證集成在在一起,這樣,密碼將將不會存存儲在SQLServ
4、er中,也不不會通過過網(wǎng)絡發(fā)發(fā)送而被被網(wǎng)絡嗅嗅探器讀讀取。網(wǎng)網(wǎng)站可以以設(shè)置C2級審核,對所有有訪問數(shù)數(shù)據(jù)庫的的用戶進進行審核核,還可可以使用用安全套套接字層層(SSL)加密的辦辦法,對對所有在在應用程程序和數(shù)數(shù)據(jù)庫間間傳送的的數(shù)據(jù)進進行加密密。3SQLServer 2000的基本服服務數(shù)據(jù)庫引引擎的分分布式查查詢功能能。可以以訪問所所有可通通過OLEDB訪問的數(shù)數(shù)據(jù)源中中的數(shù)據(jù)據(jù)。在Transact-SQL語句中,可以像像引用實實際駐留留在SQLServer數(shù)據(jù)庫中中的表一一樣引用用遠程OLEDB數(shù)據(jù)源表表。此外外,全文文檢索功功能可以以對SQLServer數(shù)據(jù)庫或或Windows文件中存存儲
5、的文文本數(shù)據(jù)據(jù)進行復復雜的模模式匹配配。關(guān)系數(shù)據(jù)據(jù)庫引擎擎能夠存存儲由頂頂層聯(lián)機機事務處處理(OLTP)系統(tǒng)生成成的所有有事務的的詳細記記錄。該該數(shù)據(jù)庫庫引擎還還可以支支持最大大的聯(lián)機機分析(OLAP)數(shù)據(jù)倉庫庫中的事事實數(shù)據(jù)據(jù)表和維維度表的的嚴格處處理要求求。MicrosoftSQL Server2000 Analysis Services提供分析析數(shù)據(jù)倉倉庫和數(shù)數(shù)據(jù)集市市中存儲儲的數(shù)據(jù)據(jù)的工具具。AnalysisServices以多維數(shù)數(shù)據(jù)集的的形式顯顯示事實實數(shù)據(jù)表表和維度度表中的的數(shù)據(jù),從多維維數(shù)據(jù)集集中可以以分析趨趨勢和其其它對于于規(guī)劃今今后工作作非常重重要的信信息。在在Analys
6、isServices多維數(shù)據(jù)據(jù)集上處處理OLAP查詢比試試圖在OLTP數(shù)據(jù)庫中中記錄的的詳細數(shù)數(shù)據(jù)上進進行同樣樣的查詢詢要快得得多。4SQLServer 2000的特性Internet集成:SQLServer 2000數(shù)據(jù)庫引引擎提供供完整的的XML支持。它它還具有有構(gòu)成最最大的Web站點的數(shù)數(shù)據(jù)存儲儲組件所所需的可可伸縮性性、可用用性和安安全功能能。其程程序設(shè)計計模型與與Windows DNA構(gòu)架集成成,用以以開發(fā)Web應用程序序,并且且還支持持English Query和Microsoft搜索服務務等功能能,在Web應用程序序中包含含了用戶戶友好的的查詢和和強大的的搜索功功能??缮炜s性性和
7、可用用性:同同一個數(shù)數(shù)據(jù)庫引引擎可以以在不同同的平臺臺上使用用。SQLServer 2000企業(yè)版支支持聯(lián)合合服務器器、索引引視圖和和大型內(nèi)內(nèi)存支持持等功能能,使其其得以升升級到最最大Web站點所需需的性能能級別。企業(yè)級數(shù)數(shù)據(jù)庫功功能:SQLServer 2000關(guān)系數(shù)據(jù)據(jù)庫引擎擎能充分分保護數(shù)數(shù)據(jù)完整整性,同同時將管管理上千千個并發(fā)發(fā)修改數(shù)數(shù)據(jù)庫的的用戶的的開銷減減到最小小。其分分布式查查詢得以以引用來來自不同同數(shù)據(jù)源源的數(shù)據(jù)據(jù),就好好象這些些數(shù)據(jù)是是SQLServer 2000數(shù)據(jù)庫的的一部分分,同時時分布式式事務支支持充分分保護任任何分布布式數(shù)據(jù)據(jù)更新的的完整性性。復制制功能可可維護多多
8、個數(shù)據(jù)據(jù)復本,同時確確保單獨獨的數(shù)據(jù)據(jù)復本保保持同步步。5SQLServer 2000的特性易于安裝裝、部署署和使用用:SQLServer 2000中包括一一系列管管理和開開發(fā)工具具,這些些工具可可改進在在多個站站點上安安裝、部部署、管管理和使使用SQLServer的過程。SQLServer 2000還支持基基于標準準的、與與Windows DNA集成的程程序設(shè)計計模型,使SQLServer數(shù)據(jù)庫和和數(shù)據(jù)倉倉庫的使使用成為為生成強強大的可可伸縮系系統(tǒng)的無無縫部分分。這些些功能可可以快速速交付SQLServer應用程序序,使客客戶只需需最少的的安裝和和管理開開銷即可可實現(xiàn)這這些應用用程序。數(shù)據(jù)倉
9、庫庫:SQLServer 2000中包括析析取和分分析匯總總數(shù)據(jù)以以進行聯(lián)聯(lián)機分析析處理(OLAP)的工具。SQLServer中還包括括一些工工具,可可用來直直觀地設(shè)設(shè)計數(shù)據(jù)據(jù)庫并通通過English Query來分析數(shù)數(shù)據(jù)。6SQLServer 2000組件關(guān)系系圖 7SQLServer 2000數(shù)據(jù)倉庫庫工具 工具描述關(guān)系數(shù)據(jù)庫數(shù)據(jù)倉庫設(shè)計、構(gòu)造、維護的基礎(chǔ)數(shù)據(jù)轉(zhuǎn)換服務(DTS)用于向數(shù)據(jù)倉庫加載數(shù)據(jù)數(shù)據(jù)復制用于分布式數(shù)據(jù)倉庫數(shù)據(jù)分布和加載數(shù)據(jù)OLE DB提供應用程序與數(shù)據(jù)源的接口APIAnalysis Services用于采集和分析數(shù)據(jù)倉庫中的數(shù)據(jù)English Query提供使用英語查
10、詢數(shù)據(jù)倉庫Meta Data Services瀏覽數(shù)據(jù)倉庫中的元數(shù)據(jù)PivotTable服務用于制定操作多維數(shù)據(jù)的客戶端接口8關(guān)系型數(shù)數(shù)據(jù)庫關(guān)系型數(shù)數(shù)據(jù)庫是是設(shè)計、構(gòu)造、維護數(shù)數(shù)據(jù)倉庫庫的基礎(chǔ)礎(chǔ)技術(shù)。MicrosoftSQL Server2000是一個關(guān)關(guān)系型數(shù)數(shù)據(jù)庫管管理系統(tǒng)統(tǒng),它提提供了強強大的數(shù)數(shù)據(jù)庫引引擎和許許多工具具,這些些工具不不僅可以以用于數(shù)數(shù)據(jù)庫的的管理,而且可可以用于于數(shù)據(jù)倉倉庫的管管理,是是數(shù)據(jù)倉倉庫的技技術(shù)基礎(chǔ)礎(chǔ)。9數(shù)據(jù)轉(zhuǎn)換換服務(DTS)提供數(shù)據(jù)據(jù)轉(zhuǎn)換功功能,例例如數(shù)據(jù)據(jù)引入、引出以以及在SQLServer和任何OLEDB、ODBC或者文本本文件之之間轉(zhuǎn)換換數(shù)據(jù)。利用D
11、TS,通過交互互式地或或按照規(guī)規(guī)劃自動動地從多多處異構(gòu)構(gòu)數(shù)據(jù)源源輸入數(shù)數(shù)據(jù),這這樣便有有可能在在SQLServer上建立數(shù)數(shù)據(jù)倉庫庫和數(shù)據(jù)據(jù)市場。數(shù)據(jù)的來來源特性性允許用用戶輸入入查詢數(shù)數(shù)據(jù)的輸輸入時間間、地點點及其計計算方法法。數(shù)據(jù)據(jù)的引入入引出是是通過以以相同的的格式讀讀寫數(shù)據(jù)據(jù),在應應用程序序之間交交換數(shù)據(jù)據(jù)的過程程。一次次轉(zhuǎn)換是是指在源源數(shù)據(jù)被被存儲到到目的地地之前,對其進進行的一一系列操操作。轉(zhuǎn)換特性性使得載載引入引引出中完完成復雜雜數(shù)據(jù)的的驗證、清除等等功能變變得非常常簡單。定制轉(zhuǎn)轉(zhuǎn)換對象象可以被被創(chuàng)建并并集成進進第三方方產(chǎn)品中中。DTS支持多步步封裝,其中大大量文件件能被單單獨處
12、理理,最終終被集成成為一個個單一的的文件。在目的的地,該該文件的的記錄能能被系統(tǒng)統(tǒng)分為多多個記錄錄,或相相反,多多個記錄錄被集成成為一個個單一的的記錄。DTS也與微軟軟的中心心庫集成成在一起起,微軟軟數(shù)據(jù)中中心庫存存儲元數(shù)數(shù)據(jù)、數(shù)數(shù)據(jù)傳送送包和數(shù)數(shù)據(jù)源特特性,許許多獨立立的軟件件經(jīng)銷商商支持和和共享這這個元數(shù)數(shù)據(jù)模型型。數(shù)據(jù)據(jù)轉(zhuǎn)換服服務可以以在SQLServer間移動數(shù)數(shù)據(jù)結(jié)構(gòu)構(gòu)、數(shù)據(jù)據(jù)、觸發(fā)發(fā)器、規(guī)規(guī)則、默默認、約約束和用用戶定義義的數(shù)據(jù)據(jù)類型,只有數(shù)數(shù)據(jù)結(jié)構(gòu)構(gòu)和數(shù)據(jù)據(jù)可以在在不同的的異構(gòu)數(shù)數(shù)據(jù)源中中間傳遞遞。10數(shù)據(jù)復制制數(shù)據(jù)復制制:是一一種實現(xiàn)現(xiàn)數(shù)據(jù)分分布的方方法,就就是指把把一個系系統(tǒng)
13、中的的數(shù)據(jù)通通過網(wǎng)絡絡分布到到另外一一個或者者多個地地理位置置不同的的系統(tǒng)中中,以適適應可伸伸縮組織織的需要要,減輕輕主服務務器的工工作負荷荷和提高高數(shù)據(jù)的的使用效效率。數(shù)據(jù)復制制的過程程類似于于報紙雜雜志的出出版過程程,即把把信息從從信息源源迅速傳傳送到信信息接受受處。出出版服務務器包含含了將要要復制的的數(shù)據(jù)所所在的數(shù)數(shù)據(jù)庫,該服務務器負責責制作將將要出版版的數(shù)據(jù)據(jù),然后后將這些些出版的的數(shù)據(jù)的的所有變變化發(fā)送送到分布布服務器器中。訂訂閱服務務器是數(shù)數(shù)據(jù)復制制的目標標地,負負責接收收復制過過來的數(shù)數(shù)據(jù),并并且負責責接收從從出版服服務器上上傳送過過來的全全部變化化。分布布服務器器在出版版服務器
14、器和訂閱閱服務器器之間起起中介作作用。分分布服務務器負責責從出版版服務器器中接受受復制過過來的數(shù)數(shù)據(jù),然然后在該該服務器器上的分分布數(shù)據(jù)據(jù)庫中存存儲這些些變化,最后按按照指定定的時間間間隔推推向響應應的訂閱閱服務器器。在復制過過程中,把將要要復制的的數(shù)據(jù)稱稱為出版版物和文文章。文文章是復復制的基基本單元元,是組組成出版版物的最最小單位位。文章章與數(shù)據(jù)據(jù)庫中的的表對應應。文章章既可以以對應一一個表中中的全部部數(shù)據(jù),也可以以指包括括表中的的一部分分數(shù)據(jù)。出版物物是一個個完整的的將要復復制的內(nèi)內(nèi)容,它它包括一一篇或多多篇文章章,是訂訂閱服務務器訂閱閱的對象象。11OLEDBOLEDB式微軟開開發(fā)的數(shù)
15、數(shù)據(jù)訪問問編程界界面。微微軟已經(jīng)經(jīng)定位OLEDB是ODBC繼承者,ODBC主要用于于處理關(guān)關(guān)系型數(shù)數(shù)據(jù)。ODBC是基于SQL的,它可可以很好好的用于于關(guān)系型型數(shù)據(jù)庫庫訪問,但是它它不能用用于非關(guān)關(guān)系型數(shù)數(shù)據(jù)源。象ODBC一樣,OLEDB也提供對對關(guān)系型型數(shù)據(jù)的的訪問,但是OLEDB擴展了由由ODBC提供的功功能。OLEDB的設(shè)計目目的是用用于所有有數(shù)據(jù)類類型的標標準界面面。除了了關(guān)系型型數(shù)據(jù)庫庫的訪問問,OLEDB提供對各各種各樣樣數(shù)據(jù)源源的訪問問,包括括Excel電子表格格的數(shù)據(jù)據(jù),dBase的ISAM文件、電電子郵件件、新的的NT的ActiveDirectory和IBM的DB2數(shù)據(jù)。使使用
16、OLEDB,用一個界界面就可可以訪問問許多不不同的數(shù)數(shù)據(jù)源。OLEDB是微軟的的數(shù)據(jù)訪訪問策略略,稱為為萬能數(shù)數(shù)據(jù)訪問問的基礎(chǔ)礎(chǔ)。萬能能數(shù)據(jù)訪訪問指的的是一組組通用界界面,它它用來表表示來自自任何數(shù)數(shù)據(jù)源的的數(shù)據(jù)。OLEDB是使萬能能訪問成成為現(xiàn)實實的技術(shù)術(shù)。萬能能數(shù)據(jù)訪訪問和OLEDB的另一方方面是所所有的對對象都應應該在數(shù)數(shù)據(jù)庫中中維護,不是企企圖把商商業(yè)要求求的不同同的數(shù)據(jù)據(jù)移動到到一個面面向?qū)ο笙蟮臄?shù)據(jù)據(jù)庫中。OLEDB創(chuàng)建和理理解企業(yè)業(yè)數(shù)據(jù)并并且在各各種數(shù)據(jù)據(jù)源中維維護。12AnalysisServices在數(shù)據(jù)倉倉庫或者者數(shù)據(jù)市市場中的的信息可可OLAP處理,OLAP可以有效效的以
17、維維度和度度量組成成的立方方體方式式察看數(shù)數(shù)據(jù)。維維度是一一種描述述性分類類,例如如,維度度可能是是地理位位置,也也可能是是產(chǎn)品類類型。度度量是一一種定量量數(shù)值,例如銷銷售額、庫存量量或者總總費用。來自于于原始數(shù)數(shù)據(jù)源的的合計存存儲在每每一個立立方體單單元中,這種組組織數(shù)據(jù)據(jù)的方法法可以輕輕易得過過濾數(shù)據(jù)據(jù)、有效效的加快快數(shù)據(jù)的的查詢。然而,存在著著這種問問題:雖雖然OLAP合計是在在數(shù)據(jù)倉倉庫中可可以達到到的查詢詢性能的的關(guān)鍵因因素,但但是存儲儲這些合合計數(shù)據(jù)據(jù)的成本本是磁盤盤存儲量量。事實實上,合合計數(shù)據(jù)據(jù)量可以以輕易的的超過原原有的數(shù)數(shù)據(jù)量。另外,當維度度和合計計量提高高時,所所要求的的
18、OLAP數(shù)據(jù)存儲儲量也大大大的提提高。這這種對存存儲量的的極大要要求一般般稱為數(shù)數(shù)據(jù)爆炸炸。OLAP描述的是是一種多多維數(shù)據(jù)據(jù)服務,這種服服務的設(shè)設(shè)計目的的是保證證分析員員、經(jīng)理理和決策策者針對對特定的的問題,通過快快速、一一致、交交互式的的實時數(shù)數(shù)據(jù)訪問問和分析析。13AnalysisServicesMOLAP:多維型OLAP在一個用用于壓縮縮索引的的永久數(shù)數(shù)據(jù)存儲儲中存儲儲維度數(shù)數(shù)據(jù)和實實時數(shù)據(jù)據(jù)。合計計存儲用用來加快快數(shù)據(jù)訪訪問。MOLAP查詢引擎擎是專有有的,而而且優(yōu)化化成由MOLAP數(shù)據(jù)存儲儲使用的的存儲格格式。MOLAP提供了比比ROLAP更快的查查詢處理理速度,并且要要求更少少的
19、存儲儲空間。然而,它不能能較好的的伸縮,并且要要求使用用單獨的的數(shù)據(jù)庫庫來存儲儲。ROLAP:關(guān)系型OLAP在關(guān)系型型數(shù)據(jù)表表中存儲儲合計。ROLAP針對關(guān)系系型數(shù)據(jù)據(jù)庫的應應用允許許其利用用已有的的數(shù)據(jù)庫庫資源,并且允允許ROLAP應用程序序很好的的伸縮。然而,ROLAP使用表存存儲合計計則要求求比MOLAP更多的磁磁盤空間間,速度度相對比比較慢。HOLAP:正如其名名稱所示示,混合合型OLAP介于MOLAP和ROLAP之間。象象ROLAP一樣,HOLAP將主數(shù)據(jù)據(jù)存儲在在源數(shù)據(jù)據(jù)庫中。象MOLAP一樣,HOLAP把合計存存儲在一一個永久久性數(shù)據(jù)據(jù)存儲的的地方,它與主主關(guān)系數(shù)數(shù)據(jù)庫分分開。這
20、這種混合合形式使使HOLAP可以具備備MOLAP和ROLAP兩者的優(yōu)優(yōu)點。14English Query微軟的英英語查詢詢環(huán)境允允許設(shè)計計者將他他們的關(guān)關(guān)系數(shù)據(jù)據(jù)庫轉(zhuǎn)移移到英語語查詢上上來,這這給最終終用戶提提供了使使用英語語提出問問題而不不是用SQL語言進行行查詢的的能力。English Query服務是利利用英語語查詢域域編輯器器創(chuàng)建的的,提供供了數(shù)據(jù)據(jù)庫的有有關(guān)信息息,從而而使English Query可用于處處理關(guān)于于特殊表表、域和和數(shù)據(jù)的的英語問問題。15Meta DataServices在MicrosoftSQL Server2000中,許多多工具把把元數(shù)據(jù)據(jù)存儲在在位于msdb系
21、統(tǒng)數(shù)據(jù)據(jù)庫中的的集中式式中心倉倉庫中。這里提提到的元元數(shù)據(jù)是是指數(shù)據(jù)據(jù)的數(shù)據(jù)據(jù),Meta DataServices提供瀏覽覽這些元元數(shù)據(jù)的的功能。數(shù)據(jù)中中心庫提提供了一一個通用用的位置置:可以以用來存存放對象象和對象象之間的的關(guān)系。通過使使用一些些軟件工工具,可可以描述述面向?qū)ο蟮男判畔ⅲ很涇浖ぞ呔呤褂酶鞲黝悓ο笙蠼M成的的信息。對象接接口界面面,界面面由屬性性、方法法和集合合組成,集合包包含了對對其他界界面的關(guān)關(guān)系,以以及關(guān)聯(lián)聯(lián)對象。16PivotTable服務PivotTable服務和AnalysisServices一起為用用戶提供供客戶端端對OLAP數(shù)據(jù)的存存取。PivotTable服
22、務運行行于客戶戶端工作作站上,它使得得可以利利用VisualBasic或其他語語言來開開發(fā)用戶戶程序,這些程程序可以以利用OLEDB技術(shù),并并使用AnalysisServices中的OLAP數(shù)據(jù)或直直接取自自關(guān)系數(shù)數(shù)據(jù)庫的的數(shù)據(jù)。當它和和OLAP服務一起起使用時時,PivotTable服務可以以自動將將進程或或緩沖內(nèi)內(nèi)存分配配到最合合適的位位置,并并且允許許多個客客戶動態(tài)態(tài)存取同同一個立立方體。PivotTable服務業(yè)能能在本地地客戶機機上存儲儲數(shù)據(jù),從而使使用戶可可以在不不連接AnalysisServices的情況下下對數(shù)據(jù)據(jù)進行分分析。這這種移動動式的解解決方案案允許分分析者將將數(shù)據(jù)帶帶
23、回家或或在途中中進行分分析。為為最終用用戶提供供的OLAP數(shù)據(jù)分析析和描述述工具可可以利用用PivotTable服務進行行開發(fā)。PivotTable服務也提提供了開開放的界界面,獨獨立的軟軟件銷售售商可以以利用它它來開發(fā)發(fā)第三方方應用的的產(chǎn)品。17數(shù)據(jù)倉庫庫的實現(xiàn)現(xiàn)步驟明確用戶戶需求設(shè)計和建建立數(shù)據(jù)據(jù)倉庫使用數(shù)據(jù)據(jù)倉庫維護和優(yōu)優(yōu)化數(shù)據(jù)據(jù)倉庫18數(shù)據(jù)倉庫庫生命周周期管理理數(shù)據(jù)倉庫庫系統(tǒng)框框架影響數(shù)據(jù)據(jù)倉庫項項目成功功的因素素數(shù)據(jù)倉庫庫的技術(shù)術(shù)數(shù)據(jù)倉庫庫項目所所需的角角色19數(shù)據(jù)倉庫庫系統(tǒng)框框架基本特點點擁有為項項目作出出技術(shù)決決策的觀觀察點擁有確定定項目是是否能夠夠完成的的計量參參照點擁有以靈靈
24、活方式式運用現(xiàn)現(xiàn)有知識識的能力力分部分、分階段段依靠多多個工作作小組協(xié)協(xié)調(diào)完成成四個階段段設(shè)想階段段規(guī)劃階段段開發(fā)階段段穩(wěn)定階段段20影響數(shù)據(jù)據(jù)倉庫項項目成功功的因素素數(shù)據(jù)倉庫庫創(chuàng)建前前的影響響因素管理層的的信任從管理項項目開始始:面向向主題交流實現(xiàn)現(xiàn)目標任命一個個面向用用戶的項項目經(jīng)理理數(shù)據(jù)倉庫庫創(chuàng)建時時的影響響因素采用成熟熟的技術(shù)術(shù)注重查詢詢而不是是注重事事務只加載所所需數(shù)據(jù)據(jù)定義合適適的數(shù)據(jù)據(jù)源:元元數(shù)據(jù)映映射明確定義義主題數(shù)據(jù)倉庫庫創(chuàng)建后后的影響響因素面向決策策的使用用者的信信任21數(shù)據(jù)倉庫庫的技術(shù)術(shù)管理大量量的數(shù)據(jù)據(jù)管理多介介質(zhì)索引和監(jiān)監(jiān)視數(shù)據(jù)據(jù)多種技術(shù)術(shù)的接口口對數(shù)據(jù)存存放位置置的
25、控制制數(shù)據(jù)的并并行存儲儲和管理理元數(shù)據(jù)管管理技術(shù)術(shù)語言接口口數(shù)據(jù)的高高效裝入入高效索引引的利用用技術(shù)數(shù)據(jù)壓縮縮技術(shù)復合鍵碼碼技術(shù)變長數(shù)據(jù)據(jù)鎖管理切切換技術(shù)術(shù)快速恢復復技術(shù)其他技術(shù)術(shù):事務務集成性性、高速速緩存、行/頁級鎖定定、引用用完整性性、數(shù)數(shù)據(jù)視視圖等22數(shù)據(jù)倉庫庫項目所所需的角角色管理角色色項目主管管項目經(jīng)理理技術(shù)角色色數(shù)據(jù)提供供專家體系結(jié)構(gòu)構(gòu)設(shè)計者者數(shù)據(jù)庫管管理員數(shù)據(jù)遷移移專家數(shù)據(jù)轉(zhuǎn)換換專家數(shù)據(jù)集市市開發(fā)的的領(lǐng)導人人質(zhì)量保證證/測試專家家維護角色色內(nèi)行的用用戶培訓教師師技術(shù)文檔檔編寫人人員工具專家家銷售商聯(lián)聯(lián)系人23創(chuàng)建數(shù)據(jù)據(jù)倉庫向向?qū)?4創(chuàng)建數(shù)據(jù)據(jù)倉庫向向?qū)?5創(chuàng)建數(shù)據(jù)據(jù)倉庫向向?qū)?
26、6創(chuàng)建數(shù)據(jù)據(jù)倉庫向向?qū)?7完成創(chuàng)建建數(shù)據(jù)倉倉庫28創(chuàng)建事實實維度表表29創(chuàng)建事實實維度表表30屬性選項項卡31屬性選項項卡32創(chuàng)建數(shù)據(jù)據(jù)庫關(guān)系系圖向?qū)?3關(guān)系圖34多維數(shù)據(jù)據(jù)集向?qū)?5多維數(shù)據(jù)據(jù)集36多維數(shù)據(jù)據(jù)集37數(shù)據(jù)倉庫庫軟件市市場19931998平均年增增23.9%,達達22億美元。數(shù)據(jù)值入入工具:從數(shù)據(jù)據(jù)庫中提提取數(shù)據(jù)據(jù),轉(zhuǎn)換換為數(shù)據(jù)據(jù)倉庫格格式并送送入數(shù)據(jù)據(jù)倉庫中中。數(shù)據(jù)過濾濾工具:對數(shù)據(jù)據(jù)倉庫中中的數(shù)據(jù)據(jù)進行存存放和管管理。數(shù)據(jù)存取取工具:讓用戶戶存取數(shù)數(shù)據(jù)倉庫庫中的數(shù)數(shù)據(jù)。數(shù)據(jù)倉庫庫市場劃劃分軟件總市市場6949312416612。3%數(shù)據(jù)存取取663-125813.7%第三
27、代語語言/公公用程序序3061-601914.5%CASE1751-308512.5%DBMS5801-11680%15.0%其它市場場58163-10212411.9%數(shù)據(jù)存取取663-125813.7%數(shù)據(jù)提取取/轉(zhuǎn)換換31-23249.3%數(shù)據(jù)管理理59-70864.3%數(shù)據(jù)倉庫庫753-219823.9%數(shù)據(jù)復制制14-31987.1%注:*-*%指1993年-1998年銷售額(M$) 年遞增率率38(1)動態(tài)可伸伸縮的數(shù)數(shù)據(jù)庫系系統(tǒng)(DSA)存放大量量數(shù)據(jù):幾個GB到幾個TBPDQ(并行數(shù)據(jù)據(jù)查詢)技術(shù):實現(xiàn)數(shù)據(jù)據(jù)查詢、索引掃掃描。索引建立立、數(shù)據(jù)據(jù)修改、備份恢復等數(shù)數(shù)據(jù)庫操操作的并
28、并發(fā)處理理支持所有有開放系系統(tǒng)硬件件環(huán)境:單CPUSMP(對稱多處處理器)Cluster(松耦合群群體系統(tǒng)統(tǒng))MPP(大規(guī)模并并行系統(tǒng)統(tǒng))批處理操作數(shù)據(jù)據(jù)事務處理理操作數(shù)據(jù)據(jù)外部數(shù)據(jù)據(jù)數(shù)據(jù)倉庫庫管理軟件件開放系統(tǒng)統(tǒng)平臺元數(shù)據(jù)目標數(shù)據(jù)據(jù)庫數(shù)據(jù)存取取工具INFORMIX-ONLINE動態(tài)服務務器INFORMIX的數(shù)據(jù)倉庫庫戰(zhàn)略39SybaseWarehouse Works 體系系結(jié)構(gòu)(1)C/S 環(huán)境境下的數(shù)數(shù)據(jù)倉庫庫框架聯(lián)機事務務處理子系統(tǒng)部門數(shù)據(jù)據(jù)部門數(shù)據(jù)據(jù)局部倉庫庫局部倉庫庫中央倉庫庫個人使用用個人使用用決策支持持數(shù)據(jù)分布布的靈活活性要求求(2)Sybase支持數(shù)數(shù)據(jù)分布布的方法法Enter
29、prise CONNECT互互操作作體系結(jié)結(jié)構(gòu):并并發(fā)方方法、異異構(gòu)數(shù)據(jù)據(jù)分布、信息打打包ReplicationServer的的基于于事件的的事件捕捕捉功能能基于時間間調(diào)度方方式的批批時間拷拷貝方案案(3)高高速的的時間訪訪問Navigation Server(導航服服務器)SQLServer中增加加interactionQuery(IQ) Accelerator 進行行隨機高高速查詢詢SybaseOmniSQLServer 提供供時間訪訪問透明明性推薦125種無無縫存取取數(shù)據(jù)的的工具40ORACLE的數(shù)據(jù)倉倉庫實施施戰(zhàn)略決策支持持應用系系統(tǒng)OracleApplications DataWarehouse外部數(shù)據(jù)據(jù)源析取取、轉(zhuǎn)換換、裝載載工具數(shù)據(jù)倉庫庫管理工工具數(shù)據(jù)分析析工具數(shù)據(jù)集成成工具數(shù)據(jù)挖掘掘并將
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司轉(zhuǎn)讓股權(quán)合同范本
- 供水搶修承包合同范本
- 業(yè)務外包服務合同范例
- 債務收購合同范例
- 農(nóng)村房父子贈與合同范例
- 農(nóng)機具供貨合同范本
- 中國國家合同范本
- 2025年度婚禮現(xiàn)場舞臺搭建與燈光音響租賃服務合同
- 個人租賃車庫合同范本
- 信息托管合同范本
- 一氧化碳中毒培訓
- 初二上冊好的數(shù)學試卷
- 廣東省潮州市2024-2025學年九年級上學期期末道德與法治試卷(含答案)
- 突發(fā)公共衛(wèi)生事件衛(wèi)生應急
- 部編版2024-2025學年三年級上冊語文期末測試卷(含答案)
- 門窗安裝施工安全管理方案
- 2024年安徽省高校分類對口招生考試數(shù)學試卷真題
- ISO45001管理體系培訓課件
- 動畫課件教學教學課件
- 小學生心理健康講座5
- 綿陽市高中2022級(2025屆)高三第一次診斷性考試(一診)數(shù)學試卷(含答案逐題解析)
評論
0/150
提交評論