版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第四章 數(shù)據(jù)倉庫設計與開發(fā)本章目標了解數(shù)據(jù)倉庫開發(fā)應用過程熟悉數(shù)據(jù)倉庫的規(guī)劃內容、目標等掌握數(shù)據(jù)倉庫的分析與設計過程、內容了解數(shù)據(jù)倉庫的實施過程第四章 數(shù)據(jù)倉庫設計與開發(fā)本章內容4.1 數(shù)據(jù)倉庫開發(fā)應用過程4.2 數(shù)據(jù)倉庫的規(guī)劃4.3 數(shù)據(jù)倉庫的分析與設計4.4 數(shù)據(jù)倉庫的實施4.5 數(shù)據(jù)倉庫技術與開發(fā)的困難4.1 數(shù)據(jù)倉庫開發(fā)應用過程數(shù)據(jù)倉庫的開發(fā)應用像生物一樣具有其特有的、完整的生命周期,數(shù)據(jù)倉庫的開發(fā)應用周期可以分成三個階段:數(shù)據(jù)倉庫規(guī)劃分析數(shù)據(jù)倉庫設計實施數(shù)據(jù)倉庫使用維護這三個階段是一個不斷循環(huán)、完善、提高的過程(螺旋式)。螺旋式開發(fā)應用過程設計體系結構開發(fā)概念模型開發(fā)邏輯模型數(shù)據(jù)庫與
2、元數(shù)據(jù)設計數(shù)據(jù)抽取轉換與加載開發(fā)中間件填充與測試數(shù)據(jù)倉庫數(shù)據(jù)倉庫應用數(shù)據(jù)倉庫維護數(shù)據(jù)倉庫評價規(guī)劃與確定需求規(guī)劃分析階段設計實施階段使用維護階段4.2 數(shù)據(jù)倉庫的規(guī)劃選擇數(shù)據(jù)倉庫實現(xiàn)策略自頂向下:實際應用比較困難 。自底向上:用于一個數(shù)據(jù)集市或一個部門的數(shù)據(jù)倉庫開發(fā) ,容易獲得成功 。兩種策略的聯(lián)合使用 :能夠快速地完成數(shù)據(jù)倉庫的開發(fā)與應用,而且還可以建立具有長遠價值的數(shù)據(jù)倉庫方案。在實際使用中難以操作 。用自頂向下方法建造企業(yè)數(shù)據(jù)倉庫建設中心數(shù)據(jù)模型一次性的完成數(shù)據(jù)的重構工作最小化數(shù)據(jù)冗余度和不一致性存儲詳細的歷史數(shù)據(jù)從企業(yè)數(shù)據(jù)倉庫中建造數(shù)據(jù)集市得到大部分的集成數(shù)據(jù)直接依賴于數(shù)據(jù)倉庫的可用性問
3、題投資效益的時間?建設中心數(shù)據(jù)模型的必要性和可能性?初始費用 ?數(shù)據(jù)集市外部數(shù)據(jù)數(shù)據(jù)集市操作數(shù)據(jù)企業(yè)數(shù)據(jù)倉庫用自底向上方法建立部門數(shù)據(jù)集市限制在一個主題區(qū)域快速投資收益 區(qū)域自治 設計的可伸縮性強對相關部門的應用容易復制 對每個數(shù)據(jù)集市需要數(shù)據(jù)重構存在一定的冗余及不一致性逐步擴展到企業(yè)數(shù)據(jù)倉庫 (EDW)把建造EDW作為一個長期的目標存在的問題:數(shù)據(jù)集市的數(shù)據(jù)都是可用的嗎?能生成數(shù)據(jù)模型嗎?如何解決不一致性?操作數(shù)據(jù) (全局)/外部數(shù)據(jù)企業(yè)數(shù)據(jù)倉庫數(shù)據(jù)集市操作數(shù)據(jù) (局部)操作數(shù)據(jù) (局部)數(shù)據(jù)集市采用從頂向下 VS 從底向下企業(yè)內部、各個業(yè)務部門和各個工作崗位對數(shù)據(jù)倉庫的理解和期望不同。作為
4、具體的部門,有特定的信息需求,都希望能在盡可能短的時間內需求獲得滿足。建立局部的系統(tǒng),所需信息能夠立即為其使用。因此對部門而言,他們追求的是一種短期的局部目標,關心的是基于所在位置的局部解決方案。整個企業(yè)看,建立數(shù)據(jù)倉庫的目的之一是獲得對整個企業(yè)業(yè)務信息的視圖。以便能把握和管理企業(yè)的經營運行,并對企業(yè)進行業(yè)務重組。企業(yè)現(xiàn)有系統(tǒng)往往不同程度上存在各自為政,缺乏統(tǒng)一的規(guī)劃和設計。數(shù)據(jù)出自各部門,提供的信息不一致,使得高層無法獲得可靠、統(tǒng)一和協(xié)調的信息。企業(yè)追求的是長期的集成目標,關心的是基于整個企業(yè)的全面解決方案。兩者的目標是有矛盾的!確定數(shù)據(jù)倉庫的開發(fā)目標和實現(xiàn)范圍首要目標是確定所需要信息的范圍
5、,確定數(shù)據(jù)倉庫在為用戶提供決策幫助時,在主題和指標領域需要哪些數(shù)據(jù)源。 另一個重要目標是確定利用哪些方法和工具訪問和導航數(shù)據(jù)? 其它目標是確定數(shù)據(jù)倉庫內部數(shù)據(jù)的規(guī)模 從用戶的角度分析 從技術的角度分析數(shù)據(jù)倉庫的結構數(shù)據(jù)倉庫的應用結構 基于業(yè)務處理系統(tǒng)的數(shù)據(jù)倉庫 單純數(shù)據(jù)倉庫 單純數(shù)據(jù)集市 數(shù)據(jù)倉庫和數(shù)據(jù)集市 數(shù)據(jù)倉庫的技術平臺結構單層結構 客戶/服務器兩層結構 三層客戶/服務器 多層式結構數(shù)據(jù)倉庫使用方案和項目規(guī)劃預算實際使用方案還可以將最終用戶的決策支持要求與數(shù)據(jù)倉庫的技術要求聯(lián)系起來 開發(fā)方案的預算進行估計 編制數(shù)據(jù)倉庫開發(fā)說明書 :說明系統(tǒng)與企業(yè)戰(zhàn)略目標的關系,系統(tǒng)與企業(yè)急需處理的、范圍
6、相對有限的開發(fā)機會。業(yè)務機會的說明以及任務概況說明、重點支持的職能部門和今后工作的建議。計劃中需要闡明期望取得的有形和無形利益業(yè)務價值計劃最好由目標業(yè)務主管來完成規(guī)劃書中要確定數(shù)據(jù)倉庫的開發(fā)目標實現(xiàn)范圍、體系結構和使用方案及開發(fā)預算。4.3 數(shù)據(jù)倉庫的分析與設計4.3.1 需求分析4.3.2 概念模型設計4.3.3 邏輯模型設計4.3.4 物理模型設計4.3.5 數(shù)據(jù)倉庫的索引技術4.3.1 需求分析確定主題域支持決策的數(shù)據(jù)來源數(shù)據(jù)倉庫的成功標準和關鍵性能指標數(shù)據(jù)量與更新頻率確定主題域(1)明確對于決策分析最有價值的主題領域有哪些?(2)每個主題域的商業(yè)維度是哪些?每個維度的粒度層次有哪些?(
7、3)制定決策的商業(yè)分區(qū)是什么?(4)不同地區(qū)需要哪些信息來制定決策?(5)對哪個區(qū)域提供特定的商品和服務?支持決策的數(shù)據(jù)來源(1)哪些源數(shù)據(jù)(操作型)與商品主題有關?(2)在已有報表和在線查詢中得到什么樣的信息?(3)提供決策支持的細節(jié)程度是怎樣的?數(shù)據(jù)倉庫的成功標準和關鍵性能指標(1)衡量數(shù)據(jù)倉庫成功的標準是什么?(2)哪些關鍵的性能指標?如何監(jiān)控?(3)對數(shù)據(jù)倉庫的期望是什么?(4)對數(shù)據(jù)倉庫的預期用途有哪些?(5)對計劃中的數(shù)據(jù)倉庫的考慮要點是什么?數(shù)據(jù)量與更新頻率(1)數(shù)據(jù)倉庫的總數(shù)據(jù)量有多少?(2)決策支持所需的數(shù)據(jù)更新頻率是多少?時間間隔是多長?(3)每種決策分析與不同時間的標準對
8、比如何?(4)數(shù)據(jù)倉庫中的信息需求的時間界限是什么?開發(fā)模型模型是對現(xiàn)實世界進行抽象的工具。在信息管理中需要將現(xiàn)實世界的事物及其有關特征轉換為信息世界的數(shù)據(jù)才能對信息進行處理與管理,這就需要依靠數(shù)據(jù)模型作為這種轉換的橋梁。這種轉換一般需要經歷從現(xiàn)實到概念模型,從概念模型到邏輯模型,從邏輯模型到物理模型的轉換過程?,F(xiàn)實世界概念世界邏輯世界計算機世界信用特性屬性列(字段、數(shù)據(jù)項)張三個體實體記錄客戶整體同質總體表文件客戶與產品整體間聯(lián)系異質總體數(shù)據(jù)庫4.3.2 概念模型設計概念模型的特點是:能真實反映現(xiàn)實世界,能滿足用戶對數(shù)據(jù)的分析,達到決策支持的要求,它是現(xiàn)實世界的一個真實模型。易于理解,便利和
9、用戶交換意見,在用戶的參與下,能有效地完成對數(shù)據(jù)倉庫的成功設計。易于更改,當用戶需求發(fā)生變化時,容易對概念模型修改和擴充。易于向數(shù)據(jù)倉庫的數(shù)據(jù)模型(星型模型)轉換。概念模型表示概念模型最常用的表示方法是實體關系法(E-R法)。E-R圖將現(xiàn)實世界表示成信息世界,便利向計算機的表示形式進行轉化。建立概念模型:對每個決策主題與屬性以及主題之間的關系用E-R圖模型表示。例子有兩個主題:商品和客戶,主題也是實體。商品有如下屬性組:商品的固有信息(商品號、商品名、類別、價格等);商品庫存信息(商品號、庫房號、庫存量、日期等);商品銷售信息(商品號、客戶號、銷售量等);客戶有如下屬性組:客戶固有信息(客戶號
10、、客戶名、住址、電話等);客戶購物信息(客戶號、商品號、售價、購買量等)。商品的銷售信息與用戶的購物信息是一致的,它們是兩個主題之間的聯(lián)系。商品商品固有信息商品號商品庫存信息銷售信息購物信息 客戶客戶固有信息客戶號=4.3.3邏輯模型設計主要工作:分析主題域進行概念模型(ER圖)到邏輯模型(星型模型)的轉換確定粒度層次劃分確定數(shù)據(jù)分割策略關系模式定義定義記錄系統(tǒng)分析主題域主題名公共碼鍵屬性組商品商品號商品固有信息:商品號,商品名,類型,顏色等商品采購信息:商品號,供應商號,供應價,供應日期,供應量等商品庫存信息:商品號,庫房號,庫存量,日期等銷售銷售單號銷售單固有信息:銷售單號,銷售地址等銷售
11、信息:客戶號,商品號,銷售價,銷售量、銷售時間等客戶客戶號客戶固有信息:客戶號,客戶名,性別,年齡,文化程度,住址,電話等客戶經濟息:客戶號,年收入,家庭總收入等概念模型到邏輯模型的轉換星型模型的設計步驟如下:(1)確定決策分析需求。決策需求是建立多維數(shù)據(jù)模型的依據(jù)。(2)從需求中識別出事實。選擇或設計反映決策主題業(yè)務的表,如在“商品”主題中,以“銷售業(yè)務”作為事實表。(3)確定維。確定影響事實的各種因素,對銷售業(yè)務的維包括商店,地區(qū),部門,城市,時間,商品等。銷售數(shù)據(jù)和維銷售數(shù)據(jù)商品促銷時間部門城市地區(qū)商店概念模型到邏輯模型的轉換星型模型的設計步驟如下:(4)確定數(shù)據(jù)匯總水平。數(shù)據(jù)倉庫中對數(shù)
12、據(jù)不同粒度的集成和綜合,形成了多層次、多種知識的數(shù)據(jù)結構。例如,對于時間維,可以以“年”、“月”或者“日”等不同水平進行匯總。(5)設計事實表和維表 。設計事實表和維表的具體屬性。在事實表中應該記錄哪些屬性是由維表的數(shù)量決定的。一般來說,與事實表相關的維表的數(shù)量應該適中,太少的維表會影響查詢的質量,用戶得不到需要的數(shù)據(jù),太多的維表又會影響查詢的速度。概念模型到邏輯模型的轉換星型模型的設計步驟如下:(6)按使用的DBMS和分析用戶工具,證實設計方案的有效性 。根據(jù)系統(tǒng)使用的DBMS,確定事實表和維表的具體實現(xiàn)。由于不同的DBMS對數(shù)據(jù)存儲有不同的要求,因此設計方案是否有效還要放在DBMS中進行檢
13、驗 (7)隨著需求變化修改設計方案。 隨著應用需求的變化,整個數(shù)據(jù)倉庫的數(shù)據(jù)模式也可能會發(fā)生變化。因此在設計之初,充分考慮數(shù)據(jù)模型的可修改性可以節(jié)省系統(tǒng)維護的代價。轉換示例(1)業(yè)務數(shù)據(jù)的E-R圖銷售銷售日期商店號商品號銷售數(shù)量銷售單位商品商品號商品名商品類號存貨星期商店號商品號數(shù)量1m1m商店商店號商店名地址城市省郵編地區(qū)號1mm11商品類商品類號商品類名部門號m1m地區(qū)地區(qū)號地區(qū)名轉換示例(2)E-R圖向多維表的轉換商品維地區(qū)維時間維部門地區(qū)年商品大類商店月商品周日銷售事實轉換示例(3)利用維關鍵字制定的星型模型轉換示例(4)修改后的星型模型確定粒度層次粒度是指數(shù)據(jù)倉庫中數(shù)據(jù)單元的詳細程度
14、和級別。數(shù)據(jù)越詳細,粒度越小,層次級別就越低;數(shù)據(jù)綜合度越高,粒度越大,層次級別就越高。決定數(shù)據(jù)倉庫采取的是單一粒度還是多重粒度,以及粒度劃分的層次。通過聚集的設計為數(shù)據(jù)倉庫的使用提供各種可能的聚集查詢便利進行粒度劃分,首先要確定所有在數(shù)據(jù)倉庫中建立的表,然后估計每個表的大約行數(shù)。確定數(shù)據(jù)分割策略把邏輯上整體的數(shù)據(jù)分割成較小的、可以獨立管理的物理單元進行存儲 。便于數(shù)據(jù)的重構、重組和恢復,以提高創(chuàng)建索引和順序掃描的效率 數(shù)據(jù)分割標準:1.數(shù)據(jù)量2.數(shù)據(jù)分析處理的對象3.粒度分割的策略定義關系模式在概念模型設計時,我們就確定了數(shù)據(jù)倉庫的基本主題,并對每個主題的公共碼鍵、基本內容等做了描述。在這一
15、步里,我們將要對選定的當前實施的主題進行模式劃分,形成多個表,并確定各個表的關系模式。 “商品”主題公共碼鍵:商品號。商品固有信息:商品表(商品號、商品名、類型、顏色)細節(jié)級商品銷售信息:銷售表1(商品號、客戶號、銷售量、)細節(jié)級銷售表2(商品號、時間段1、銷售量、)綜合級 銷售表n(商品號、時間段n、銷售量、)綜合級定義記錄系統(tǒng)定義記錄系統(tǒng)是建立數(shù)據(jù)倉庫中的數(shù)據(jù)以源系統(tǒng)中的數(shù)據(jù)的對照記錄。記錄系統(tǒng)的定義要記入數(shù)據(jù)倉庫的元數(shù)據(jù)。商品主題的記錄系統(tǒng)在元數(shù)據(jù)中可描述如表主題名屬性名數(shù)據(jù)源系統(tǒng)源表名源屬性名商品商品商品商品商品商品商品商品商品商品號商品名類別客戶號銷售日期售價銷售量庫存量庫存號庫存子
16、系統(tǒng)庫存子系統(tǒng)庫存子系統(tǒng)銷售子系統(tǒng)銷售子系統(tǒng)銷售子系統(tǒng)銷售子系統(tǒng)庫存子系統(tǒng)庫存子系統(tǒng)商品商品商品客戶銷售銷售銷售庫存?zhèn)}庫商品號商品名類別客戶號日期單價數(shù)量庫存量倉庫號4.3.4 物理模型設計物理模型設計因素:I/O存取時間空間利用率維護的代價主要工作:全面了解所選用的數(shù)據(jù)庫管理系統(tǒng),確定一個最適合應用要求的物理結構,特別是存儲結構和存取方法。了解數(shù)據(jù)環(huán)境、數(shù)據(jù)的使用頻率、使用方式、數(shù)據(jù)規(guī)模以及響應時間要求等。了解外部存儲設備的特征。確定一個最適合應用要求的物理結構(1)估計存儲容量(2)確定數(shù)據(jù)的存儲計劃(3)確定索引策略(4)確定數(shù)據(jù)存放位置(5)確定存儲分配(1) 估計存儲容量對每一個數(shù)據(jù)
17、庫表確定數(shù)據(jù)量對所有的表確定索引估計臨時存儲(2) 確定數(shù)據(jù)的存儲計劃建立聚集(匯總)計劃確定數(shù)據(jù)分區(qū)方案建立聚類選項(3) 確定索引策略在數(shù)據(jù)倉庫中由于數(shù)據(jù)量很大,需要對數(shù)據(jù)的存取路徑進行仔細設計和選擇,建立專用的復雜的索引,以獲得最高的存取效率。采用BTree索引,它是一個高效的索引,見圖4.7所示。B樹是一個平衡(balance)樹,即每個葉結點到根節(jié)點的路徑長度相同。B樹索引是一個多級索引。(4)確定數(shù)據(jù)存放位置在物理設計時,我們常常要按數(shù)據(jù)的重要程度、使用頻率以及對響應時間的要求進行分類,并將不同類的數(shù)據(jù)分別存儲在不同的存儲設備中。重要程度高、經常存取并對響應時間要求高的數(shù)據(jù)就存放在
18、高速存儲設備上,如硬盤;存取頻率低或對存取響應時間要求低的數(shù)據(jù)則可以放在低速存儲設備上,如磁盤或磁帶。 (5) 確定存儲分配物理存儲中以文件、塊和記錄來實現(xiàn)。一個文件包括很多塊,每個塊包括若干條記錄。文件中的塊是數(shù)據(jù)庫的數(shù)據(jù)和內存之間I/O傳輸?shù)幕締挝?,在那里對?shù)據(jù)進行操作。用一個簡例來說明邏輯模型和物理模型的內容,見下圖所示。 名稱類型長度注釋產品維表包括公司所有產品的信息Product-Keyinteger10主鍵Product-Namechar25產品名稱Product-SKuchar20庫存單位銷售員維表包括不同地區(qū)的所有銷售員信息Salpers-Keyinteger15主鍵Salp
19、ers-Namechar30銷售員姓名Territorychar20銷售員所在區(qū)域Regionchar20所在地區(qū)訂單事實表包括公司收到的所有訂單Order-Keyinteger10訂單鍵Order-Namechar20訂單名稱Product-refinteger10參考產品主鍵Salpers-refinteger15參考銷售員主鍵Order-AmountNum8,2銷售額Order-CostNum8,2訂單成本邏輯模型產品維表產品鍵產品名庫存單位品牌訂單事實表訂單鍵訂單名產品鍵銷售員鍵銷售額訂單成本銷售員維表銷售員鍵姓名地域地區(qū)4.3.5 數(shù)據(jù)倉庫的索引技術位索引技術Bit-Wise索引技術
20、B-Tree技術與Bit-Wise索引技術對比標識技術廣義索引Bit-Wise索引技術對于每一個記錄的字段滿足查詢條件的真假值用“1”或“0”的方式表示,或者用該字段中不同取值(即多位二進制)來表示。 例如,檢索“美國加州有多少男性未申請保險?”利用BitWise技術得到有兩個記錄 滿足條件。 性別保險州1MYMA2MNCA3FYIL4MNCA男未保險加州100111000111B-Tree技術與Bit-Wise索引技術對比Bit-Wise索引技術比B-Tree技術能提高相應速度10100倍。對于檢索“美國加州有多少男性未申請保險?”為例,假設數(shù)據(jù)庫有10M記錄,每個記錄長800個字節(jié),每一頁
21、16K字節(jié)。按傳統(tǒng)的關系數(shù)據(jù)庫的檢索:需要經過50萬次I/O操作。按BitWise檢索:對于10M個記錄建立三列的BitWise索引。存取這些索引只要進行235次I/O操作。標識技術樣本記錄數(shù)據(jù)庫中的每個實體創(chuàng)建一個標識?!敖鳌痹诩炛惺?1標識?!?8”在年齡中是02標識?!爸v師”在職稱名中有一個03標識。 姓名 籍貫 職稱 年齡陳文東 江西 教授 56何玉輝 河北 講師 32李寶 湖南 副教授 37施東 江蘇 講師 28曹文 湖南 副教授 36趙玉 吉林 講師 32黃小斌 江蘇 講師 28賽英花 山東 副教授 32彭宏 江西 講師 25廖宇宙 湖南 教授 42標識技術姓名 籍貫 職稱 年
22、齡陳文東 01 江西 01 教授 01 25 01何玉輝 02 河北 02 副教授 02 28 02李寶 03 湖南 03 講師 03 32 03施東 04 江蘇 04 36 04曹文 05 吉林 05 37 05趙玉 06 山東 06 42 06黃小斌 07 56 07賽英花 08 彭宏 09 廖宇宙 10 記錄1 01,01,01,07記錄2 02,02,03,03記錄3 03,03,02,05記錄4 04,04,03,02記錄5 05,03,02,05記錄6 06,05,03,03記錄7 07,04,03,02記錄8 08,06,02,03記錄9 09,01,03,01廣義索引對數(shù)據(jù)倉庫
23、的一個很廣泛的應用問題是“這個月銷售最好和最差的10種商品是哪些?”,我們可以設計這么一塊“黑板”,在上面標明了當月銷售最好和最差的10種商品的名稱或者它們相關記錄的存放地址。這塊“黑板”就是我們所說的“廣義索引”。4.4 數(shù)據(jù)倉庫的實施實施過程中需要完成的工作:建立數(shù)據(jù)倉庫與業(yè)務處理系統(tǒng)的接口數(shù)據(jù)倉庫的體系結構建立實現(xiàn)數(shù)據(jù)倉庫物理倉庫與元數(shù)據(jù)庫進行數(shù)據(jù)倉庫的數(shù)據(jù)初次加載完成數(shù)據(jù)倉庫的中間件設計進行數(shù)據(jù)倉庫的測試。數(shù)據(jù)倉庫與業(yè)務處理系統(tǒng)的接口接口應該具有這樣一些功能:從面向應用和操作環(huán)境生成完整的數(shù)據(jù);數(shù)據(jù)基于時間的轉換;數(shù)據(jù)的聚集;對現(xiàn)有數(shù)據(jù)系統(tǒng)的有效掃描,以便今后數(shù)據(jù)倉庫的數(shù)據(jù)追加。數(shù)據(jù)倉
24、庫的建立關系型數(shù)據(jù)庫、多維數(shù)據(jù)庫和對象數(shù)據(jù)庫 創(chuàng)建數(shù)據(jù)倉庫的工具:MS SQL Server2000,2005,2008Oracle 9i, 10iSybaseInformix Red Brick Decision Server數(shù)據(jù)倉庫的加載、復制和發(fā)行數(shù)據(jù)加載之前,首先需要對準備加載的數(shù)據(jù)進行清理 復制技術,復制結構應完成以下的復雜任務:不會受到系統(tǒng)失敗等問題的影響,保證提供可靠的數(shù)據(jù)復制。只傳送符合數(shù)據(jù)完整性規(guī)則的一致數(shù)據(jù)??梢詢?yōu)化傳送過程,減少在捕獲或修改數(shù)據(jù)和復制品作為結果傳送之間的等待時間。技術和數(shù)據(jù)結構應保證數(shù)據(jù)發(fā)行系統(tǒng)完成以下的功能:保證數(shù)據(jù)以適時和有效的方式發(fā)行。保證只發(fā)送被排
25、序的數(shù)據(jù)。建立正確的和所需要的服務水平標準。數(shù)據(jù)倉庫的測試單元測試單元測試的目的是尋找出存在于單個程序、存儲過程和其它位于一些獨立環(huán)境中模塊的錯誤。 系統(tǒng)集成測試測試目的是驗證每個單元與數(shù)據(jù)倉庫系統(tǒng)和子系統(tǒng)之間的接口是否完好,是否能夠正常傳遞數(shù)據(jù)與執(zhí)行系統(tǒng)的整體功能。4.5 數(shù)據(jù)倉庫技術與開發(fā)的困難4.5.1數(shù)據(jù)倉庫技術4.5.2數(shù)據(jù)倉庫開發(fā)的困難4.5.1數(shù)據(jù)倉庫技術(1)管理大量數(shù)據(jù)數(shù)據(jù)倉庫要管理大量的數(shù)據(jù),是因為它們:包括粒狀的、原子的細節(jié)包括歷史數(shù)據(jù)包括細節(jié)和匯總數(shù)據(jù)包括元數(shù)據(jù)有好多種管理大量數(shù)據(jù)的方法通過尋址,通過索引,通過數(shù)據(jù)的外延,通過有效的溢出管理等(2)數(shù)據(jù)的高效裝入和數(shù)據(jù)壓
26、縮數(shù)據(jù)倉庫的一個重要的技術就是能夠高效地裝入數(shù)據(jù)。有好多種裝入數(shù)據(jù)的方法:通過一個語言接口一次一條記錄。當數(shù)據(jù)能夠被壓縮時,它便能存儲在很小的空間中。 (3)存儲介質的管理 存儲介質 訪問速度 存儲費用主存 非???非常貴擴展內存 非常快 貴高速緩存 非???貴磁盤 快 適中光盤 不慢 不貴微縮膠片 慢 便宜考慮到訪問速度和存儲費用,對數(shù)據(jù)的存儲要分層次,層次的區(qū)分如下: (4)多維DBMS和數(shù)據(jù)倉庫多維數(shù)據(jù)庫管理系統(tǒng)(多維DBMS)使得對數(shù)據(jù)的訪問非常靈活,可以用多種方法對數(shù)據(jù)進行切片、分割,動態(tài)地考察匯總數(shù)據(jù)和細節(jié)數(shù)據(jù)的關系。數(shù)據(jù)倉庫和多維DBMS的區(qū)別:數(shù)據(jù)倉庫有大量的數(shù)據(jù);多維DBMS
27、中的數(shù)據(jù)至少要少一個數(shù)量級。數(shù)據(jù)倉庫只適合于少量的靈活訪問;而多維DBMS適合大量的非預知的數(shù)據(jù)的訪問和分析。數(shù)據(jù)倉庫內存儲了很長時間范圍內的數(shù)據(jù)從5年到10年;多維DBMS中存儲著比較短時間范圍內的數(shù)據(jù)。數(shù)據(jù)倉庫允許分析人員以受限的形式訪問數(shù)據(jù),而多維DBMS允許自由的訪問。多維DBMS和數(shù)據(jù)倉庫決策支持系統(tǒng)(DSS)分析者大部分時間里可以在多維DBMS中享受其操作高效的優(yōu)點,同時如果需要的話,還可以向下鉆取最低層次的細節(jié)數(shù)據(jù)。一些多維DBMS建立在關系模型上,而一些多維DBMS建立在多維立方體內.4.5.2數(shù)據(jù)倉庫開發(fā)的困難沒有理解數(shù)據(jù)的價值未能理解數(shù)據(jù)倉庫概念尚未清楚了解用戶將如何使用數(shù)
28、據(jù)倉庫之前,便貿然開發(fā)數(shù)據(jù)倉庫對數(shù)據(jù)倉庫規(guī)模的估計模糊忽視了數(shù)據(jù)倉庫體系結構和數(shù)據(jù)倉庫開發(fā)方法(第14講)考場作文開拓文路能力分解層次(網(wǎng)友來稿)江蘇省鎮(zhèn)江中學 陳乃香說明:本系列稿共24講,20XX年1月6日開始在資源上連載【要義解說】文章主旨確立以后,就應該恰當?shù)胤纸鈱哟?,使幾個層次構成一個有機的整體,形成一篇完整的文章。如何分解層次主要取決于表現(xiàn)主旨的需要?!静呗越庾x】一般說來,記人敘事的文章常按時間順序分解層次,寫景狀物的文章常按時間順序、空間順序分解層次;說明文根據(jù)說明對象的特點,可按時間順序、空間順序或邏輯順序分解層次;議論文主要根據(jù)“提出問題分析問題解決問題”順序來分解層次。當然
29、,分解層次不是一層不變的固定模式,而應該富于變化。文章的層次,也常常有些外在的形式:1小標題式。即圍繞話題把一篇文章劃分為幾個相對獨立的部分,再給它們加上一個簡潔、恰當?shù)男祟}。如世界改變了模樣四個小標題:壽命變“長”了、世界變“小”了、勞動變“輕”了、文明變“綠”了。 2序號式。序號式作文與小標題作文有相同的特點。序號可以是“一、二、三”,可以是“A、B、C”,也可以是“甲、乙、丙”從全文看,序號式干凈、明快;但從題目上看,卻看不出文章內容,只是標明了層次與部分。有時序號式作文,也適用于敘述性文章,為故事情節(jié)的展開,提供了明晰的層次。 3總分式。如高考佳作人生也是一張答卷。開頭:“人生就是一
30、張答卷。它上面有選擇題、填空題、判斷題和問答題,但它又不同于一般的答卷。一般的答卷用手來書寫,人生的答卷卻要用行動來書寫?!敝黧w部分每段首句分別為:選擇題是對人生進行正確的取舍,填空題是充實自己的人生,判斷題是表明自己的人生態(tài)度,問答題是考驗自己解決問題的能力。這份“試卷”設計得合理而且實在,每個人的人生都是不同的,這就意味著這份人生試卷的“答案是豐富多彩的”。分解層次,應追求作文美學的三個價值取向:一要勻稱美。什么材料在前,什么材料在后,要合理安排;什么材料詳寫,什么材料略寫,要通盤考慮。自然段是構成文章的基本單位,恰當劃分自然段,自然就成為分解層次的基本要求。該分段處就分段,不要老是開頭、
31、正文、結尾“三段式”,這種老套的層次顯得呆板。二要波瀾美。文章內容應該有張有弛,有起有伏,如波如瀾。只有這樣才能使文章起伏錯落,一波三折,吸引讀者。三要圓合美。文章的開頭與結尾要遙相照應,把開頭描寫的事物或提出的問題,在結尾處用各種方式加以深化或回答,給人首尾圓合的感覺?!纠慕馄省?話題:忙忙,不亦樂乎 忙,是人生中一個個步驟,每個人所忙的事務不同,但是不能是碌碌無為地白忙,要忙就忙得精彩,忙得不亦樂乎。 忙是問號。忙看似簡單,但其中卻大有學問。忙是人生中不可缺少的一部分,但是怎么才能忙出精彩,忙得不亦樂乎,卻并不簡單。人生如同一張地圖,我們一直在自己的地圖上行走,時不時我們眼前就出現(xiàn)一個十
32、字路口,我們該向哪兒,面對那縱軸橫軸相交的十字路口,我們該怎樣選擇?不急,靜下心來分析一下,選擇適合自己的坐標軸才是最重要的。忙就是如此,選擇自己該忙的才能忙得有意義。忙是問號,這個問號一直提醒我們要忙得有意義,忙得不亦樂乎。 忙是省略號。四季在有規(guī)律地進行著冷暖交替,大自然就一直按照這樣的規(guī)律不停地忙,人們亦如此。為自己找一個目標,為目標而不停地忙,讓這種忙一直忙下去。當目標已達成,那么再找一個目標,繼續(xù)這樣忙,就像省略號一樣,毫無休止地忙下去,翻開歷史的長卷,我們看到牛頓在忙著他的實驗;愛迪生在忙著思考;徐霞客在忙著記載游玩;李時珍在忙著編寫本草綱目。再看那位以筆為刀槍的充滿著朝氣與力量的文學泰斗魯迅,他正忙著用他獨有的刀和槍在不停地奮斗。忙是省略號,確定了一個目標那么就一直忙下去吧!這樣的忙一定會忙出生命靈動的色彩。 忙是驚嘆號。世界上的人都在忙著自己的事,大自然亦如此,小蜜蜂在忙,以蜂蜜為回報。那么人呢?居里夫
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度鋼材水泥市場調研與風險評估合同2篇
- 二零二五年度變壓器節(jié)能補貼申請與使用合同范本3篇
- 二零二五版加工承攬合同全文詳盡規(guī)定承攬物、報酬及質量標準3篇
- 二零二五版合伙人業(yè)務拓展合同范本3篇
- 二零二五年度貨物包裝合同范本3篇
- 2025年度森林防火物資儲備與供應標準植樹承包合同示范文本3篇
- 2024版權轉讓合同轉讓價格及支付方式
- 2024版環(huán)保設備生產與安裝合同
- 二零二五年房產分割公證合同書3篇
- 2024版環(huán)保型彩鋼板房安裝協(xié)議版B版
- 河南省鄭州外國語高中-【高二】【上期中】【把握現(xiàn)在 蓄力高三】家長會【課件】
- 2025年中煤電力有限公司招聘筆試參考題庫含答案解析
- 企業(yè)內部控制與財務風險防范
- 建設項目施工現(xiàn)場春節(jié)放假期間的安全管理方案
- 30第七章-農村社會治理課件
- 考研考博-英語-東北石油大學考試押題三合一+答案詳解1
- 出國學生英文成績單模板
- 植物細胞中氨基酸轉運蛋白的一些已知或未知的功能
- 山東省高等學校精品課程
- 三菱張力控制器LE-40MTA-E說明書
- 生活垃圾填埋場污染控制標準
評論
0/150
提交評論