版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘1.以下不屬于數(shù)據(jù)倉庫基本操作的是(B)。A.基本聚集函數(shù)B.查詢操作C.立方體操作D.上卷和下探操作3.以下屬于數(shù)據(jù)倉庫基本數(shù)據(jù)模式的是(C)。A.集中模式B.分散模式C.星型模式D.分層模式5.以下屬于OLAP實(shí)現(xiàn)的關(guān)鍵技術(shù)的有(ABCD)。A.實(shí)視圖及其維護(hù)B.立方體計(jì)算C.查詢優(yōu)化與并行處理D.?dāng)?shù)據(jù)集成7.傳統(tǒng)數(shù)據(jù)庫的主要任務(wù)是進(jìn)行事務(wù)處理,而在數(shù)據(jù)的分析處理方面,則存在著諸的不足,下面哪些是傳統(tǒng)數(shù)據(jù)庫的不足(ABC)。A.集成性的缺乏B.主題不明確C.分析處理效率低D.?dāng)?shù)據(jù)處理復(fù)雜9.?dāng)?shù)據(jù)倉庫在邏輯上可以分為三個(gè)層次,以下屬于這三個(gè)層次的是(ABC)。A.?dāng)?shù)據(jù)獲取/管理層B.?dāng)?shù)據(jù)存儲(chǔ)層C.?dāng)?shù)據(jù)分析/應(yīng)用層D.?dāng)?shù)據(jù)抽取層11.?dāng)?shù)倉庫系統(tǒng)的數(shù)據(jù)分析/應(yīng)用層,面向系統(tǒng)的一般用戶,滿足用戶的查詢需要,并以適當(dāng)方式向用戶展示查詢、分析的結(jié)果。數(shù)據(jù)分析/應(yīng)用層的主要包括以下功能(ACD)。A.查詢/統(tǒng)計(jì)服務(wù)B.?dāng)?shù)據(jù)分析服務(wù)C.OLAP服務(wù)D.?dāng)?shù)據(jù)挖掘服務(wù)13.?dāng)?shù)據(jù)倉庫是面向主題的、集成的、隨時(shí)間變化的、非易失的數(shù)據(jù)集合,用于支持管理層的決策過程,那么數(shù)據(jù)倉庫的重要特點(diǎn)是(ABCD)。A.面向主題B.?dāng)?shù)據(jù)的集成性C.?dāng)?shù)據(jù)的非易失性D.?dāng)?shù)據(jù)的時(shí)變性15.?dāng)?shù)據(jù)倉庫中的數(shù)據(jù)組織形式包括(BCD)A.順序文件B.簡單直接文件C.連續(xù)文件D.定期綜合文件17.為了將用E-R圖描述的企業(yè)模型方便地映射為數(shù)據(jù)倉庫的數(shù)據(jù)模型,可以采取措施對(duì)傳統(tǒng)的E-R圖方法進(jìn)行改進(jìn),即引入以下概念(ACD)。A.事實(shí)實(shí)體(FactEntity)B.?dāng)?shù)據(jù)實(shí)體(DataEntity)C.維度實(shí)體(DimensionEntity)D.引用實(shí)體(QuotationEntity)19.?dāng)?shù)據(jù)倉庫的物理模型設(shè)計(jì),必須依據(jù)以下要點(diǎn)進(jìn)行。物理模型設(shè)計(jì)的主要內(nèi)容,包括以下哪幾個(gè)方面(ABCD)A.?dāng)?shù)據(jù)存儲(chǔ)結(jié)構(gòu)的確定。B.索引策略的確定。C.?dāng)?shù)據(jù)存放位置的確定。D.存儲(chǔ)分配參數(shù)的確定。21.表的存儲(chǔ)空間,除了數(shù)據(jù)存儲(chǔ)空間外,還包含(A)。A.索引存儲(chǔ)空間B.鍵存儲(chǔ)空間C.?dāng)?shù)據(jù)存儲(chǔ)空間D.維度空間23.元數(shù)據(jù)按其所描述的內(nèi)容,可以分為(ABC)A.關(guān)于基本數(shù)據(jù)的元數(shù)據(jù)B.關(guān)于數(shù)據(jù)處理的元數(shù)據(jù)C.關(guān)于企業(yè)組織的元數(shù)據(jù)D.關(guān)于業(yè)務(wù)功能的元數(shù)據(jù)25.元數(shù)據(jù)定義了數(shù)據(jù)從被抽取,到清洗、轉(zhuǎn)換,再到導(dǎo)入數(shù)據(jù)倉庫的全部過程。元數(shù)據(jù)在數(shù)據(jù)抽?。D(zhuǎn)換中的作用如下(ACD)A.確定數(shù)據(jù)的來源B.?dāng)?shù)據(jù)的清洗C.保證數(shù)據(jù)倉庫內(nèi)容的質(zhì)量D.實(shí)現(xiàn)屬性間的映射與轉(zhuǎn)換27.按使用目的的不同,數(shù)據(jù)倉庫的使用者可分為(ABC)A.開發(fā)人員B.維護(hù)人員C.最終用戶D.系統(tǒng)設(shè)計(jì)人員29.?dāng)?shù)據(jù)挖掘項(xiàng)目是一項(xiàng)系統(tǒng)工程,它作為從數(shù)據(jù)庫中自動(dòng)發(fā)現(xiàn)知識(shí)的過程,仍然需要來自不同領(lǐng)域?qū)<夜餐瑓⑴c知識(shí)發(fā)現(xiàn)的全部過程。其中,發(fā)揮著主要作用的專家包括(ABCD)A.主題領(lǐng)域?qū)<褺.?dāng)?shù)據(jù)專家C.?dāng)?shù)據(jù)分析專家D.?dāng)?shù)據(jù)挖掘?qū)<?1.?dāng)?shù)據(jù)泛化的方法很多,較為常用和有效的方法有(AD)A.?dāng)?shù)據(jù)立方體B.?dāng)?shù)據(jù)分解C.聚類分析D.面向?qū)傩缘臍w納33.多層、多維的數(shù)量型關(guān)聯(lián)規(guī)則是前三種規(guī)則的復(fù)合體,挖掘的難度比較大。最簡單的關(guān)聯(lián)規(guī)則是(A)A.單維、單層的布爾關(guān)聯(lián)規(guī)則B.多維、單層的布爾關(guān)聯(lián)規(guī)則C.單維、多層的布爾關(guān)聯(lián)規(guī)則D.多維、多層的布爾關(guān)聯(lián)規(guī)則35.規(guī)則約束可以分為(ABC)類型A.反單調(diào)的和單調(diào)的B.簡潔的C.可轉(zhuǎn)變的和不可轉(zhuǎn)變的D.邏輯的通常,人們所說的分類專指有監(jiān)督學(xué)習(xí)的分類,而無監(jiān)督學(xué)習(xí)的分類被稱為聚類。37.聚類分析的數(shù)據(jù)源可以分為(AB)類型A.結(jié)構(gòu)化的數(shù)據(jù)B.非結(jié)構(gòu)化的數(shù)據(jù)C.形式化的數(shù)據(jù)D.非形式化的數(shù)據(jù)39.?dāng)?shù)據(jù)預(yù)處理就是將來自不同數(shù)據(jù)源的各類數(shù)據(jù),組織成為模式挖掘所必需的數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)預(yù)處理的過程有哪些(ABCD)A.?dāng)?shù)據(jù)清洗B.?dāng)?shù)據(jù)集成C.?dāng)?shù)據(jù)轉(zhuǎn)換D.?dāng)?shù)據(jù)約簡維成員“維成員”是指某個(gè)維的某個(gè)具體取值。如果該維具有多個(gè)層次,則維成員也是由在該維各層次上的取值組合而成的。粒度所謂粒度,是指數(shù)據(jù)倉庫中記錄數(shù)據(jù)或?qū)?shù)據(jù)進(jìn)行綜合時(shí)所使用的時(shí)間段參數(shù),它決定了數(shù)據(jù)倉庫中所存儲(chǔ)的數(shù)據(jù)單元在時(shí)間上的詳細(xì)程度和級(jí)別。時(shí)間段參數(shù)越小,粒度級(jí)別越低,數(shù)據(jù)就越詳細(xì)、越具體;反之,時(shí)間段參數(shù)越大,粒度級(jí)別越高,就意味著數(shù)據(jù)綜合度越高,同時(shí)細(xì)節(jié)的損失也就越多。維表維表是用于記錄維度的關(guān)系表。多維數(shù)據(jù)立方體中每個(gè)坐標(biāo)軸上的值,各記錄在一個(gè)維表中,這樣,一個(gè)n維的數(shù)據(jù)立方體,就有n張維表。分類分類(Classification)在數(shù)據(jù)挖掘中是一項(xiàng)非常重要的任務(wù),目前在商業(yè)上應(yīng)用最多。分類的目的是找出一組能夠描述數(shù)據(jù)集合典型特征的模型或函數(shù),以便能夠識(shí)別未知數(shù)據(jù)的歸屬或類別。分類模型能夠通過數(shù)據(jù)挖掘分類算法從一組訓(xùn)練樣本數(shù)據(jù)(其類別歸屬已知)中學(xué)習(xí)獲得。時(shí)序數(shù)據(jù)庫。主要用于存放與時(shí)間相關(guān)的數(shù)據(jù),它可用來反映隨時(shí)間變化的即時(shí)數(shù)據(jù)或不同時(shí)間發(fā)生的不同事件。例如,連續(xù)的存放即時(shí)的股票交易信息、衛(wèi)星軌道信息等。對(duì)時(shí)序數(shù)據(jù)的挖掘可以發(fā)現(xiàn)事件的發(fā)展趨勢、事物的演變過程和隱藏特征,這些信息將對(duì)事件的計(jì)劃、決策和預(yù)警是非常有用的。說明數(shù)據(jù)抽取在構(gòu)建數(shù)據(jù)倉庫的過程中,外部數(shù)據(jù)源所提供的數(shù)據(jù)并不都是有用的,有些數(shù)據(jù)對(duì)決策并能提供支持,同時(shí),外部數(shù)據(jù)源中數(shù)據(jù)冗余的現(xiàn)象也很普遍。數(shù)據(jù)倉庫既然是面向主題,么在外部數(shù)據(jù)源中,只有那些與主題相關(guān)的內(nèi)容才是必需的、有使用價(jià)值的。因此,必以主題的需求為依據(jù),對(duì)數(shù)據(jù)源的內(nèi)容進(jìn)行有目的地選擇,這一過程被稱為“數(shù)據(jù)抽取”(DataExtraction)。事實(shí)表是星形模型的核心,其內(nèi)容可以分為那些部分?作用是什么?事實(shí)表是星形模型的核心,其內(nèi)容可以分為鍵和詳細(xì)指標(biāo)兩部分。事實(shí)表通過鍵將各維表組織起來,共同滿足用戶的查詢需求;詳細(xì)指標(biāo)則是指記錄在事實(shí)表中的具體數(shù)據(jù),因其構(gòu)成與內(nèi)容較為簡單,因此在事實(shí)表中直接記錄,供查詢使用。元數(shù)據(jù)的收集的作用與業(yè)務(wù)數(shù)據(jù)相比,元數(shù)據(jù)的量是很小的,并且其變化的頻率與幅度也遠(yuǎn)不如業(yè)務(wù)數(shù)據(jù),因此,對(duì)元數(shù)據(jù)采取自動(dòng)收集的機(jī)制,不會(huì)對(duì)數(shù)據(jù)倉庫的運(yùn)行效率產(chǎn)生大的影響,也不會(huì)給開發(fā)人員帶來大量的額外工作。另一方面,有效的元數(shù)據(jù)收集機(jī)制,卻可以大大提高數(shù)據(jù)倉庫的開發(fā)、維護(hù)與工作的效率。數(shù)據(jù)挖掘中聚類與分類分析方法的不同聚類與分類分析方法不同,聚類分析是在沒有給定劃分類的情況下(如沒有預(yù)定的分類表、沒有預(yù)定的類目),根據(jù)信息相似度進(jìn)行信息聚集的一種方法。所以,聚類分析的輸入數(shù)據(jù)集是一組未標(biāo)記的對(duì)象。聚類的目的是根據(jù)一定的規(guī)則,合理地進(jìn)行分組或聚類,并用顯式或隱式的方法描述不同的類別。由于分析可以采用不同的算法,所以對(duì)于相同的數(shù)據(jù)集合可能有不同的劃分。在機(jī)器學(xué)習(xí)中,聚類是無指導(dǎo)學(xué)習(xí)的一個(gè)例子,分類是有指導(dǎo)學(xué)習(xí)的一個(gè)例子,兩者所采用的方法相差甚遠(yuǎn),并且聚類的時(shí)間復(fù)雜度要比分類大得多。對(duì)于建立企業(yè)模型而言,E-R圖法具有簡便直觀的優(yōu)點(diǎn),而且在建立傳統(tǒng)數(shù)據(jù)庫時(shí),也往往采用這一方法構(gòu)造數(shù)據(jù)庫。但E-R圖法很難直接用于開發(fā)數(shù)據(jù)倉庫,這是因?yàn)樵摲椒ù嬖谥蛔?。目前采用的解決方法是什么?答:為了將用E-R圖描述的企業(yè)模型方便地映射為數(shù)據(jù)倉庫的數(shù)據(jù)模型,可以采取措施對(duì)傳統(tǒng)的E-R圖方法進(jìn)行改進(jìn),即引入以下概念。(1)事實(shí)實(shí)體(FactEntity)用于表示現(xiàn)實(shí)世界中一系列相互關(guān)聯(lián)的事實(shí),一般是查詢分析的焦點(diǎn),在E-R圖中用矩形表示;(2)維度實(shí)體(DimensionEntity)用于對(duì)事實(shí)實(shí)體的各種屬性作細(xì)化的描述,是開展查詢分析的重要依據(jù),在E-R圖中用菱形表示;(3)引用實(shí)體(QuotationEntity)對(duì)應(yīng)于現(xiàn)實(shí)世界中的某個(gè)具體實(shí)體或?qū)ο?,在事?wù)數(shù)據(jù)查詢時(shí)能提供詳細(xì)的數(shù)據(jù),在E-R圖中用六角形表示。事實(shí)實(shí)體是數(shù)據(jù)倉庫的中心,對(duì)應(yīng)著數(shù)據(jù)倉庫中的事實(shí)表。在數(shù)據(jù)倉庫的高層模型中,它具有以下的作用:為用戶提供定量的數(shù)據(jù)基本分析點(diǎn),提供多種訪問事實(shí)數(shù)據(jù)的路徑、維度或指標(biāo),提供相關(guān)的標(biāo)準(zhǔn)數(shù)據(jù),構(gòu)成每個(gè)維度中最低一級(jí)的類別和一個(gè)信息組中的指標(biāo),作為存儲(chǔ)大量數(shù)據(jù)的基礎(chǔ)表格。在數(shù)據(jù)倉庫中,維度實(shí)體可以作為對(duì)用戶查詢結(jié)果進(jìn)行篩選的工具。維度實(shí)體的另一個(gè)重要作用,是支持?jǐn)?shù)據(jù)倉庫的整體構(gòu)建,為不同的事實(shí)實(shí)體之間建立聯(lián)系,從而將維度實(shí)體和引用實(shí)體結(jié)合成一個(gè)完整的整體,以滿足用戶對(duì)數(shù)據(jù)倉庫的訪問需求。引用實(shí)體的內(nèi)容是從業(yè)務(wù)數(shù)據(jù)庫中轉(zhuǎn)換而來的。在數(shù)據(jù)倉庫中,它往往體現(xiàn)為物理數(shù)據(jù)庫,向用戶提供詳細(xì)的數(shù)據(jù),以實(shí)現(xiàn)對(duì)決策的支持。 結(jié)合所學(xué)知識(shí)說明在企業(yè)競爭情報(bào)系統(tǒng)中數(shù)據(jù)挖掘應(yīng)用在企業(yè)競爭情報(bào)系統(tǒng)中,數(shù)據(jù)挖掘可以解決文本自動(dòng)分類、自動(dòng)聚類、信息抽取、自動(dòng)摘要、關(guān)聯(lián)規(guī)則分析等問題。1.文本自動(dòng)分類和聚類利用自動(dòng)分類和自動(dòng)聚類技術(shù),既可過濾掉不相關(guān)的文檔,又可將相關(guān)文檔按照相關(guān)程度從高到低排序,方便用戶查詢,還可以將收集到的電子文檔按類別建立相應(yīng)的數(shù)據(jù)庫,提高查全率和查準(zhǔn)率。2.信息抽取利用信息抽取工具,競爭情報(bào)人員根據(jù)情報(bào)要求可以從不同信息源中抽取多種情報(bào),如競爭對(duì)手情報(bào)收集指標(biāo)。競爭情報(bào)收集指標(biāo)的值只是文本中的信息片段,在文本中只占很小的比例,這不是文本所談?wù)摰闹黝}之一。因此,從文本資料中自動(dòng)采集競爭對(duì)手情報(bào)收集指標(biāo)的值難度很大,完全由計(jì)算機(jī)自動(dòng)處理不大可能實(shí)現(xiàn)。但是,如果這項(xiàng)工作由手工完成,效率又會(huì)很低。利用信息抽取技術(shù)既可以將分布在各種信息源中的戰(zhàn)略和戰(zhàn)術(shù)信息的片段找出來,并將它們以結(jié)構(gòu)化的方式組織和存儲(chǔ)起來;也可以從新聞等類型的非結(jié)構(gòu)化文本中動(dòng)態(tài)地抽取日期、地點(diǎn)和人物等各種元數(shù)據(jù),并借助于關(guān)聯(lián)分析方法進(jìn)一步識(shí)別出產(chǎn)品、企業(yè)、人、事件和地點(diǎn)等各種信息之間的關(guān)系。3.自動(dòng)摘要利用自動(dòng)摘要功能可以大大節(jié)省情報(bào)人員每天花費(fèi)在收集和閱讀大量書面文檔上的時(shí)間,也可以在情報(bào)循環(huán)的報(bào)告階段幫助情報(bào)人員生成報(bào)告的摘要,使主管能夠選擇是否閱讀分析報(bào)告的全文。4.關(guān)聯(lián)規(guī)則分析利用關(guān)聯(lián)規(guī)則分析方法可以實(shí)現(xiàn)競爭對(duì)手分析、客戶分析,將關(guān)聯(lián)分析與Web挖掘相結(jié)合可以分析網(wǎng)絡(luò)欺騙、訪問者的個(gè)人愛好,發(fā)現(xiàn)網(wǎng)站訪問者到購買者的轉(zhuǎn)化率、客戶的購買模式和訪問者的瀏覽模式、不同客戶群的基本特征。利用關(guān)聯(lián)規(guī)則分析方法還可以挖掘例外規(guī)則與意外規(guī)則。企業(yè)的管理者有自己的領(lǐng)域知識(shí)和職業(yè)直覺,在很多時(shí)候,他們都是憑借這些知識(shí)和直覺來指導(dǎo)企業(yè)的活動(dòng)或進(jìn)行決策。但是,如果單純依靠管理者的領(lǐng)域知識(shí)和知覺進(jìn)行決策,往往會(huì)帶有片面性,有時(shí)甚至?xí)o企業(yè)帶來巨大損失。盡可能快速地、全面地獲得與管理者的固有信念相矛盾的例外規(guī)則與意外規(guī)則,可以提高決策的科學(xué)性,降低企業(yè)在經(jīng)營活動(dòng)中的風(fēng)險(xiǎn)。2.以下對(duì)OLAP體系結(jié)構(gòu)描述正確的是(B)。A.二層C/S結(jié)構(gòu)B.三層C/S結(jié)構(gòu)C.四層C/S結(jié)構(gòu)D.不屬于C/S結(jié)構(gòu)4.OLAP的數(shù)據(jù)組織模式包括(AB)。A.MD-OLAP的綜合數(shù)據(jù)組織模式B.ROLAP的綜合數(shù)據(jù)組織模式C.DOLAP的綜合數(shù)據(jù)組織模式D.SM-OLAP的綜合數(shù)據(jù)組織模式6.以下屬于數(shù)據(jù)倉庫基本操作的是(ABCD)。A.基本聚集函數(shù)B.查詢操作C.立方體操作D.上卷和下探操作8.下面那些是數(shù)據(jù)集市的類型(AB)。A.獨(dú)立型數(shù)據(jù)集市B.從屬型數(shù)據(jù)集市(DependentDataMart)C.功能型數(shù)據(jù)集市D.分析型數(shù)據(jù)集市10.?dāng)?shù)據(jù)倉庫中保存的業(yè)務(wù)數(shù)據(jù)內(nèi)容來自多個(gè)數(shù)據(jù)源,,以保證系統(tǒng)的正常運(yùn)行,這些都是數(shù)據(jù)獲?。芾韺铀鶓?yīng)完成的任務(wù)。歸納起來,該層主要負(fù)責(zé).以下工作(ACD)。A.?dāng)?shù)據(jù)倉庫的定義與修改B.?dāng)?shù)據(jù)整理C.?dāng)?shù)據(jù)倉庫系統(tǒng)的管理D.?dāng)?shù)據(jù)的獲取12.構(gòu)造一個(gè)完善的數(shù)據(jù)倉庫,是一個(gè)十分復(fù)雜的過程。一般而言,數(shù)據(jù)倉庫的構(gòu)造模式包括(ABCD)。A.自頂向下模式B.自底向上模式C.平行開發(fā)模式D.改進(jìn)的開發(fā)模式14.?dāng)?shù)據(jù)分割的依據(jù)和粒度,應(yīng)隨數(shù)據(jù)倉庫所在行的特點(diǎn)而變。常用的分割依據(jù)包括(ABCD)A.發(fā)生時(shí)間B.地理位置C.量單位D.?dāng)?shù)據(jù)額度16.在數(shù)據(jù)倉庫開發(fā)過程中需要使用的模型包括(ABC)A.概念模型(ConceptModel)B.邏輯模型(LogicalModel)C.物理模型(PhysicalModel)D.機(jī)器模型(ComputerModel)18.建立起企業(yè)模型之后,必須實(shí)現(xiàn)從企業(yè)模型到概念數(shù)據(jù)模型的映射,從而為構(gòu)建數(shù)據(jù)倉庫的邏輯模型做好準(zhǔn)備。目前,常用的概念數(shù)據(jù)模型有以下(ACD)。A.星形模型B.樹狀模型C.雪花模型D.事實(shí)星座模型20.事實(shí)表是星形模型的核心,其內(nèi)容可以分為(AC)A.鍵B.關(guān)系C.詳細(xì)指標(biāo)D.維度22.?dāng)?shù)據(jù)挖掘可以針對(duì)任何類型的數(shù)據(jù)庫進(jìn)行,既包括(ABCD)A.關(guān)系數(shù)據(jù)庫B.?dāng)?shù)據(jù)倉庫C.文本數(shù)據(jù)庫D.復(fù)雜類型數(shù)據(jù)庫24.根據(jù)用戶對(duì)數(shù)據(jù)倉庫的認(rèn)識(shí)和使用目的,從用戶的角度分類可將數(shù)據(jù)倉庫劃分為兩大類()。A.?dāng)?shù)據(jù)元數(shù)據(jù)B.基本數(shù)據(jù)C.技術(shù)元數(shù)據(jù)D.業(yè)務(wù)元數(shù)據(jù)26.元數(shù)據(jù)的收集的方法有哪些(ABCD)。A.?dāng)?shù)據(jù)源中元數(shù)據(jù)的收集B.?dāng)?shù)據(jù)模型中元數(shù)據(jù)的收集C.映射關(guān)系元數(shù)據(jù)的收集D.?dāng)?shù)據(jù)倉庫應(yīng)用元數(shù)據(jù)的收集28.時(shí)間維在幾乎所有的MDDB或數(shù)據(jù)倉庫中,都是最要的一個(gè)維,使用最為普遍。時(shí)間維有以下特點(diǎn)(AC)A.周期特征B.區(qū)域特征C.行業(yè)特征D.空間特征30.?dāng)?shù)值型數(shù)據(jù)概念分層的方法主要有(ACD)A.分箱B.?dāng)?shù)據(jù)分解C.聚類分析D.基于熵的離散化。32.從不同的角度考察,關(guān)聯(lián)規(guī)則有多種分類。下面正確的是(ABCD)A.根據(jù)項(xiàng)對(duì)應(yīng)屬性的數(shù)據(jù)類型,關(guān)聯(lián)規(guī)則可以分為布爾型和數(shù)值型。B.根據(jù)規(guī)則中數(shù)據(jù)的抽象層次,可以分為單層關(guān)聯(lián)規(guī)則和多層關(guān)聯(lián)規(guī)則。C.根據(jù)規(guī)則中涉及到的數(shù)據(jù)的維數(shù),關(guān)聯(lián)規(guī)則可以分為單維的和多維的。D.關(guān)聯(lián)并不一定意味著相關(guān)或因果,有時(shí)需要識(shí)別不同的項(xiàng)是否相關(guān),是否存在因果關(guān)系。根據(jù)關(guān)聯(lián)規(guī)則的各種擴(kuò)展,可分為相關(guān)分析、最大模式和頻繁閉項(xiàng)集、添加約束等類型。34.對(duì)于給定的任務(wù)相關(guān)的數(shù)據(jù)集,使用數(shù)據(jù)庫挖掘可以從中挖掘出大量的規(guī)則。在數(shù)據(jù)庫挖掘中經(jīng)常使用下列(ABCD)A.知識(shí)類型約束。B.維或?qū)哟渭s束。C.?dāng)?shù)據(jù)約束。D.興趣度約束和規(guī)則約束。36.分類是數(shù)據(jù)挖掘的基本功能之一,它的目標(biāo)是從數(shù)據(jù)集中提取出能夠描述數(shù)據(jù)類基本特征的模型,并利用這些模型把數(shù)據(jù)集中的每個(gè)對(duì)象都?xì)w入到其中某個(gè)已知的數(shù)據(jù)類中。分類方法可分為(ABC)A.有監(jiān)督學(xué)習(xí)B.無監(jiān)督學(xué)習(xí)C.指導(dǎo)學(xué)習(xí)D.無指導(dǎo)學(xué)習(xí)38.Web挖掘過程的主要步驟與數(shù)據(jù)挖掘相同,不同之處在于處理對(duì)象和采用的技術(shù)方法等。數(shù)據(jù)取樣的過程有哪些(ACD)A.Web數(shù)據(jù)采樣B.Web數(shù)據(jù)轉(zhuǎn)換C.Web數(shù)據(jù)分析D.Web數(shù)據(jù)調(diào)整40.自動(dòng)摘錄方法的突出優(yōu)點(diǎn)是不受領(lǐng)域的限制。自動(dòng)摘錄方法的不足之處在于(ABCD)A.文章的書寫是否規(guī)范對(duì)摘錄效果的影響很大B.主題析出難以全面C.易產(chǎn)生冗余句D.缺乏連貫事實(shí)表事實(shí)表是用于記錄度量信息的關(guān)系表。多維數(shù)據(jù)立方體中所有的度量信息,均可記錄在同一個(gè)事實(shí)表中。因此,事實(shí)表的提交要比維表大得多。元數(shù)據(jù)所謂元數(shù)據(jù),就是有關(guān)數(shù)據(jù)的數(shù)據(jù),它是關(guān)于數(shù)據(jù)倉庫中數(shù)據(jù),操作數(shù)據(jù)的進(jìn)程以及應(yīng)用程序的結(jié)構(gòu)和意義的描述信息,元數(shù)據(jù)在數(shù)據(jù)倉庫的建立過程中,有著十分重要的作用它所描述的對(duì)象,涉及數(shù)據(jù)倉庫的各個(gè)方面??傊?,數(shù)據(jù)是整個(gè)數(shù)據(jù)倉庫中的核心部件。粒度模型粒度模型,是指數(shù)據(jù)倉庫在構(gòu)造過程中各種粒度參數(shù)的總和。在從概念模型構(gòu)造邏輯模型,由邏輯模型轉(zhuǎn)換成計(jì)算機(jī)模型,最終構(gòu)建數(shù)據(jù)倉庫的過程中,它也起著至關(guān)重要的作用。聚類聚類(Clustering)是將物理或抽象對(duì)象的集合分組成為由類似的對(duì)象組成的多個(gè)類的過程。聚類就是將數(shù)據(jù)對(duì)象組成不同的類(或簇),使得不同類對(duì)象之間的相似性盡量小,而同類對(duì)象之間的相似性盡量大。數(shù)據(jù)單元“數(shù)據(jù)單元”又稱“數(shù)據(jù)單元格”,是指多維數(shù)組的取值,即維數(shù)組的每個(gè)維都選中一個(gè)維成員后所構(gòu)成的數(shù)據(jù)組合。數(shù)據(jù)單元的表示方法為(維度1維成員,維度2維成員,…,維度n維成員,變量值)。說明數(shù)據(jù)清洗數(shù)據(jù)倉庫的外部數(shù)據(jù)源所提供的數(shù)據(jù)內(nèi)容并不完美,存在著“臟數(shù)據(jù)”—即數(shù)據(jù)有空缺、噪聲等缺陷,而且在數(shù)據(jù)倉庫的各據(jù)源之間,其內(nèi)容也存在著不一致的現(xiàn)象。為了控制這些對(duì)其進(jìn)行處理,這一處理過程稱為“數(shù)據(jù)清洗”(DataCleaning)。對(duì)于任何數(shù)據(jù)倉庫而言,數(shù)據(jù)清洗過程都是必不可少的。數(shù)據(jù)挖掘中分類和回歸的不同分類和回歸都可用于預(yù)測。預(yù)測的目的是從利用歷史數(shù)據(jù)記錄中自動(dòng)推導(dǎo)出對(duì)給定數(shù)據(jù)的推廣描述,從而能對(duì)未來數(shù)據(jù)進(jìn)行預(yù)測。和回歸方法不同的是,分類的輸出是離散的類別值,而回歸的輸出則是連續(xù)數(shù)值。數(shù)據(jù)倉庫和數(shù)據(jù)庫有何不同?它們有那些相似之處?數(shù)據(jù)倉庫與傳統(tǒng)數(shù)據(jù)庫的關(guān)系數(shù)據(jù)倉庫在傳統(tǒng)數(shù)據(jù)庫的基礎(chǔ)之上發(fā)展起來的,但它并不是對(duì)傳統(tǒng)數(shù)庫的徹底拋棄,而是旨在彌補(bǔ)統(tǒng)數(shù)據(jù)庫在數(shù)據(jù)分析能力方面的不足,以提供良好的大規(guī)模數(shù)據(jù)分析能力為己任,圖為決策提供有效的技術(shù)支持。和傳統(tǒng)數(shù)據(jù)庫相比,數(shù)據(jù)倉庫在體特征、存儲(chǔ)內(nèi)容、向用戶等方面,都有著重大的差異。正是由于這些差的存在,實(shí)現(xiàn)了數(shù)倉庫技術(shù)在分析能力上的突破。數(shù)據(jù)倉庫中數(shù)據(jù)的非易失性數(shù)據(jù)倉庫中數(shù)據(jù)的非易失性,又稱數(shù)據(jù)的穩(wěn)定性,它包括兩方面的含義:其一是指數(shù)據(jù)倉庫內(nèi)容的更新、追加等操作是不頻繁的,一般依據(jù)既定的周期或條件閾值進(jìn)行;其二是指,數(shù)據(jù)在導(dǎo)入數(shù)據(jù)倉庫后,雖然也有刪除、更新等操作,但決定這種操作的閾值條件是較難滿足的,這種情況的發(fā)生是非常罕見的,可以近似地認(rèn)為,數(shù)據(jù)一旦導(dǎo)入數(shù)據(jù)倉庫后,就不再發(fā)生變化OLAP聯(lián)機(jī)分析處理(OnlineAnalyticalProcess,OLAP)就是這樣一門分析技術(shù),它以數(shù)據(jù)倉庫為應(yīng)用平臺(tái),根據(jù)決策者的需求,迅速而靈活地對(duì)數(shù)據(jù)倉庫中的大量數(shù)據(jù)進(jìn)行復(fù)雜、有效的分析處理,并將結(jié)果以直觀的形式提供給決策分析人員,從而實(shí)現(xiàn)對(duì)決策的支持。多維數(shù)組如果一個(gè)數(shù)據(jù)集合可以從多個(gè)角度進(jìn)行觀察,即具有多個(gè)維度,則根據(jù)這些維度將數(shù)據(jù)組織所構(gòu)成的數(shù)組,就是多維數(shù)組。多維數(shù)組是OLAP的核心,按其維度的數(shù)量,也可稱為“數(shù)據(jù)立方體”或“數(shù)據(jù)超立方”。多維數(shù)組可以用(維1,維2,維3,…,維n,變量)來表示。維“維”是指人們觀察某個(gè)數(shù)據(jù)集合的特定角度,它是以對(duì)數(shù)據(jù)的某個(gè)共性的提取為前提的。維的層次在同一個(gè)維度上,可以存在多個(gè)程度不同的細(xì)節(jié),這些細(xì)節(jié)就是“維的層次”,它是對(duì)“維”的進(jìn)一步細(xì)化。當(dāng)人們從某個(gè)特定角度觀察問題時(shí),按所依據(jù)的細(xì)節(jié)程度(即維層次)的不同,可以得到多種描述方法??臻g數(shù)據(jù)庫主要指存儲(chǔ)空間信息的數(shù)據(jù)庫,其中數(shù)據(jù)可能以光柵格式提供,也可能用矢量圖形數(shù)據(jù)表示。例如,地理信息數(shù)據(jù)庫、衛(wèi)星圖像數(shù)據(jù)庫、城市地下管道、下水道及各類地下建筑分布數(shù)據(jù)庫等。對(duì)空間數(shù)據(jù)庫的挖掘可以為城市規(guī)劃、生態(tài)規(guī)劃、道路修建提供決策支持。關(guān)聯(lián)分析關(guān)聯(lián)分析(AssociationAnalysis)就是從大量的數(shù)據(jù)中發(fā)現(xiàn)項(xiàng)集之間有趣的聯(lián)系、相關(guān)關(guān)系或因果結(jié)構(gòu),以及項(xiàng)集的頻繁模式。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的知識(shí)。若兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性,則稱之為關(guān)聯(lián)。關(guān)聯(lián)可分為簡單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)規(guī)則。信息摘要信息摘要(InformationSummarization)是一種自動(dòng)編制文摘的技術(shù),即利用計(jì)算機(jī)將一篇文章濃縮成一篇短文的過程。文摘是以簡潔的篇幅,忠實(shí)地反映原文內(nèi)容的一段簡短文字。通過閱讀文摘,人們可以快速地掌握大量文獻(xiàn)的基本內(nèi)容,提高獲取信息的效率。信息抽取信息抽取(InformationExtraction)就是根據(jù)一個(gè)事先定義好的、描述所需信息規(guī)格的模板,從非結(jié)構(gòu)化的文本中抽取相關(guān)信息的過程。這個(gè)模板通常說明了某些事件、實(shí)體或關(guān)系的類型。元數(shù)據(jù)挖掘元數(shù)據(jù)挖掘(MetadataMining)是指對(duì)元數(shù)據(jù)進(jìn)行的挖掘。例如,對(duì)文本元數(shù)據(jù)的挖掘。文本元數(shù)據(jù)可以分為兩類:一類是描述性元數(shù)據(jù),包括文本的名稱、日期、大小、類型等信息;一類是語義性元數(shù)據(jù),包括文本的作者、標(biāo)題、機(jī)構(gòu)、內(nèi)容等信息。本的元數(shù)據(jù)挖掘?qū)τ诟顚哟蔚奈谋就诰騺碚f,是一個(gè)重要的基礎(chǔ)性的工作,它可以為進(jìn)一步的文本挖掘提供有價(jià)值的參考信息。數(shù)據(jù)立方體數(shù)據(jù)立方體是數(shù)據(jù)倉庫和聯(lián)機(jī)分析處理的核心概念之一。數(shù)據(jù)立方體中存放著預(yù)先對(duì)部分或所有維(屬性)的匯總結(jié)果。利用數(shù)據(jù)立方體對(duì)數(shù)據(jù)泛化的目的是把那些經(jīng)常被查詢到的、運(yùn)算開銷較高的計(jì)算預(yù)先執(zhí)行,并將執(zhí)行結(jié)果存儲(chǔ)到數(shù)據(jù)立方體中,以便于知識(shí)發(fā)現(xiàn)、決策支持以及其他應(yīng)用。數(shù)據(jù)立方體的維數(shù)不限定為3,它可以為n(n>1)。項(xiàng)對(duì)一個(gè)數(shù)據(jù)表而言,表的每個(gè)字段都具有一個(gè)或多個(gè)不同的值。字段的每種取值都是一個(gè)項(xiàng)(Item)。在進(jìn)行挖掘關(guān)聯(lián)規(guī)則時(shí),項(xiàng)一般表示成謂詞的形式,如商品類型(計(jì)算機(jī)),其中“商品類型”是字段名,“計(jì)算機(jī)”是字段的值。有時(shí)也直接用字段的值來表示。項(xiàng)集項(xiàng)的集合稱為項(xiàng)集(Itemset)。包含K個(gè)項(xiàng)的項(xiàng)集被稱為K-項(xiàng)集,K表示項(xiàng)集中項(xiàng)的數(shù)目。由所有的項(xiàng)所構(gòu)成的集合是最大的項(xiàng)集,一般用符號(hào)I表示。事務(wù)事務(wù)是項(xiàng)的集合。本質(zhì)上,一個(gè)事務(wù)就是事實(shí)表中的一條記錄。事務(wù)是項(xiàng)集I的子集。事務(wù)的集合稱為事務(wù)集,通常就是事務(wù)數(shù)據(jù)庫。一般用符號(hào)D表示事務(wù)集。對(duì)銷售數(shù)據(jù)而言,事務(wù)數(shù)據(jù)庫的記錄一般由事務(wù)處理時(shí)間、一組顧客購買的物品、顧客標(biāo)識(shí)號(hào)等幾部分組放。每一個(gè)事務(wù)都有唯一的標(biāo)識(shí),如事務(wù)號(hào),記作TID,設(shè)X是一個(gè)項(xiàng)集,T是一個(gè)事務(wù),如果XT,那么稱事務(wù)T包含,那么稱事務(wù)T包含X,記作}在數(shù)據(jù)倉庫的構(gòu)建過程中,將客觀事物從現(xiàn)實(shí)世界的存在到計(jì)算機(jī)內(nèi)物理實(shí)現(xiàn)的抽象過程劃分為四個(gè)階段,即現(xiàn)實(shí)世界(RealWorld)、概念世界(ConceptWorld)、邏輯世界(LogicalWorld)和計(jì)算機(jī)世界(ComputerWorld)。所謂現(xiàn)實(shí)世界,即客觀存在的世界,它是存在于現(xiàn)實(shí)中的各種客觀事物及其相互關(guān)系的總和。對(duì)于數(shù)據(jù)倉庫而言,它的內(nèi)容只是完整的客觀世界的一個(gè)真子集,包含了對(duì)特定決策進(jìn)行支持所必需的所有客觀對(duì)象。所謂概念世界,是人們對(duì)現(xiàn)實(shí)世界中對(duì)象的屬性進(jìn)行條析、逐步概括和歸納之后,將其以抽象的形式反映出來的結(jié)果。它包括概念和關(guān)系兩大部分內(nèi)容。所謂邏輯世界,是指人們依據(jù)計(jì)算機(jī)物理存儲(chǔ)的要求,將頭腦中的概念世界進(jìn)行轉(zhuǎn)化,從而形成的邏輯表達(dá)結(jié)果。這一結(jié)果的形成,可以幫助人們將需描述的對(duì)象從概念世界轉(zhuǎn)入計(jì)算機(jī)世界。計(jì)算機(jī)世界,是指現(xiàn)實(shí)世界中的客觀對(duì)象在計(jì)算機(jī)中的最終表達(dá)形式,即計(jì)算機(jī)系統(tǒng)中的實(shí)際存儲(chǔ)模型??陀^對(duì)象的內(nèi)容只有在計(jì)算機(jī)中實(shí)現(xiàn)了物理存儲(chǔ),才能供人們有效地進(jìn)行分析和處理。數(shù)據(jù)倉庫的反規(guī)范化處理的意義?規(guī)范化處理的結(jié)果,表現(xiàn)為將一個(gè)復(fù)雜的、依賴關(guān)系眾多的大表分解成為若干個(gè)內(nèi)容簡潔、關(guān)系清楚的小表。應(yīng)該指出,即使分解過程能滿足連接無損性和依賴保持性的要求,這種分解結(jié)果也不是最佳的。因?yàn)閿?shù)據(jù)倉庫要實(shí)現(xiàn)對(duì)決策的支持,常常需要進(jìn)行大規(guī)模的查詢操作,這種操作必然涉及對(duì)眾多的小表進(jìn)行動(dòng)態(tài)的關(guān)聯(lián)。這不僅給CPU帶來了巨大的運(yùn)算壓力,而且還要求數(shù)據(jù)庫系統(tǒng)必須有足夠的存儲(chǔ)容量,以作為關(guān)聯(lián)操作的緩沖區(qū),同時(shí),對(duì)多個(gè)小表的同步訪問,也給系統(tǒng)的I/O帶來了考驗(yàn)。為了避免這種現(xiàn)象的出現(xiàn),提高數(shù)據(jù)倉庫的運(yùn)行效率,必須結(jié)合實(shí)際情況,對(duì)源自關(guān)系型數(shù)據(jù)庫的數(shù)據(jù)模型,以屬性間的依賴關(guān)系為基礎(chǔ),進(jìn)行小表的合并,這是反規(guī)范化的第一種情況。反規(guī)范化的另一種情況,是保持?jǐn)?shù)據(jù)倉庫中數(shù)據(jù)的適度冗余。在數(shù)據(jù)倉庫中,有些數(shù)據(jù)是基本的,涉及到大多數(shù),甚至是全部的業(yè)務(wù)。依據(jù)規(guī)范化理論的要求,這類數(shù)據(jù)應(yīng)當(dāng)存放在一個(gè)基本的表中,與記錄其他具體業(yè)務(wù)數(shù)據(jù)的表相互獨(dú)立,以供查詢使用。這樣的結(jié)果是:每次進(jìn)行查詢操作時(shí),都必須同時(shí)訪問業(yè)務(wù)數(shù)據(jù)表和上述基本表,再對(duì)其進(jìn)行關(guān)聯(lián)操作,這就增加了CPU和系統(tǒng)I/O的負(fù)擔(dān)。因此,有必要將基本表中的內(nèi)容作為冗余數(shù)據(jù),重復(fù)地插入到各個(gè)業(yè)務(wù)數(shù)據(jù)表中,從而以適當(dāng)犧牲存儲(chǔ)空間為代價(jià),求得系統(tǒng)整體效率的提升。邏輯模型中,包括4種基本的結(jié)構(gòu)元素。(1)初始數(shù)據(jù)組。每個(gè)主要實(shí)體均擁有且只擁有一個(gè)初始數(shù)據(jù)組,它體現(xiàn)實(shí)體的本質(zhì)特征。初始數(shù)據(jù)組的內(nèi)容和屬性需要借助邏輯模型中的其他部件(如二次數(shù)據(jù)組等)來詳細(xì)說明。(2)二次數(shù)據(jù)組。每個(gè)主要實(shí)體均可擁有多個(gè)二次數(shù)據(jù)組,它們通過鏈接部件與初始數(shù)據(jù)組相連,對(duì)初始數(shù)據(jù)組的內(nèi)容和屬性加以詳細(xì)說明。(3)連接數(shù)據(jù)組。它是在數(shù)據(jù)組之間建立聯(lián)系的部件。借助于連接數(shù)據(jù)組,初始數(shù)據(jù)組與二次數(shù)據(jù)組之間的聯(lián)系得到了體現(xiàn),二次數(shù)據(jù)組因而可以對(duì)初始數(shù)據(jù)組的內(nèi)容作出詳細(xì)說明。(4)類型數(shù)據(jù)組。它可以理解為在初始數(shù)據(jù)組主題下,逐級(jí)細(xì)化的分類數(shù)據(jù),在圖示中通過初始數(shù)據(jù)組指向右側(cè)的線段來表示。相對(duì)靠左側(cè)的是超類型數(shù)據(jù)組,相對(duì)靠右側(cè)的稱為子類型數(shù)據(jù)組。說明邏輯模型4種基本結(jié)構(gòu)間的關(guān)系?邏輯模型的上述4種基本結(jié)構(gòu)如圖所示。邏輯模型中的4種基本結(jié)構(gòu)從數(shù)據(jù)穩(wěn)定性的角度來觀察,除連接數(shù)據(jù)組之外,從初始數(shù)據(jù)組,到二次數(shù)據(jù)組,再到類型數(shù)據(jù)組,其穩(wěn)定性是逐步降低的。通過邏輯模型,設(shè)計(jì)者可向數(shù)據(jù)倉庫的用戶提供出與概念模型相比更為詳細(xì)的“系統(tǒng)功能結(jié)構(gòu)圖”。用戶可以從中了解到系統(tǒng)所能提供的功能,以及他們所能夠獲得的信息。在邏輯模型中,數(shù)據(jù)的屬性已經(jīng)初步體現(xiàn)出來,具備了向物理模型過渡的條件。數(shù)據(jù)倉庫的物理模型設(shè)計(jì),必須依據(jù)以下要點(diǎn)進(jìn)行。物理模型設(shè)計(jì)的主要內(nèi)容,包括以下哪幾個(gè)方面。(1)數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)的確定。作為數(shù)據(jù)倉庫的基礎(chǔ),DBMS往往可以向用戶提供多種存儲(chǔ)結(jié)構(gòu),每種存儲(chǔ)結(jié)構(gòu)各有其獨(dú)特的實(shí)現(xiàn)方式。在利用DBMS數(shù)據(jù)構(gòu)建數(shù)據(jù)倉庫時(shí),應(yīng)當(dāng)統(tǒng)一考慮數(shù)據(jù)的存儲(chǔ)時(shí)間、存儲(chǔ)空間效率、數(shù)據(jù)維護(hù)成本等各方面因素,選用合適的存儲(chǔ)結(jié)構(gòu)。(2)索引策略的確定。數(shù)據(jù)倉庫中的數(shù)據(jù)存儲(chǔ)量十分龐大,遠(yuǎn)遠(yuǎn)超過一般的業(yè)務(wù)數(shù)據(jù)庫系統(tǒng)。但數(shù)據(jù)倉庫內(nèi)容的更新頻率卻不高,往往采用定期導(dǎo)入新數(shù)據(jù)的方法。因此為有效提高數(shù)據(jù)倉庫的運(yùn)行效率,可在對(duì)常見查詢請(qǐng)求所訪問的數(shù)據(jù)進(jìn)行分析的基礎(chǔ)上,設(shè)計(jì)建立較為復(fù)雜的索引策略。由于數(shù)據(jù)倉庫的內(nèi)容具有非易失性,因此盡管索引的設(shè)計(jì)與建立工作量較大,維護(hù)卻較為簡單。(3)數(shù)據(jù)存放位置的確定。不同的數(shù)據(jù)存儲(chǔ)介質(zhì)各具特點(diǎn),硬盤的存儲(chǔ)量大,數(shù)據(jù)傳輸迅速,檢索方便,但價(jià)格相對(duì)較高;光盤價(jià)格便宜,但單張容量有限,容易損壞;磁帶的存儲(chǔ)容量大,成本較低,但只適合于順序訪問。數(shù)據(jù)倉庫的內(nèi)容是按主題組織存放的,可以根據(jù)各主題的重要程度、數(shù)據(jù)訪問頻度、數(shù)據(jù)體積等方面的特點(diǎn),確定數(shù)據(jù)的存放策略。(4)存儲(chǔ)分配參數(shù)的確定。在創(chuàng)建傳統(tǒng)數(shù)據(jù)庫的工作中,包括一項(xiàng)重要的內(nèi)容,就是確定一些具體的、與數(shù)據(jù)存儲(chǔ)分配相關(guān)的參數(shù),如數(shù)據(jù)塊尺寸的大小、緩沖區(qū)體積的大小,以及緩沖區(qū)的數(shù)量等。數(shù)據(jù)倉庫是依托DBMS而建立的,因此在創(chuàng)建數(shù)據(jù)倉庫時(shí),也必須進(jìn)行這一步工作。MOLAP與ROLAP的比較MOLAP與ROLAP是OLAP實(shí)現(xiàn)的兩種主要方式,本節(jié)將從體系結(jié)構(gòu)、數(shù)據(jù)存取等幾方面,對(duì)這兩種實(shí)現(xiàn)方式進(jìn)行比較①。1.體系結(jié)構(gòu)在ROLAP處理過程中,ROLAP服務(wù)器通過用戶界面接受多維查詢,將其轉(zhuǎn)化為標(biāo)準(zhǔn)的SQL查詢,在RDBMS中執(zhí)行,然后再將查詢的結(jié)果,以適當(dāng)?shù)男问酵ㄟ^用戶端界面顯示出來。多維數(shù)據(jù)立方體是借助RDBMS平臺(tái)實(shí)現(xiàn)的,因此系統(tǒng)的工作過程稍顯復(fù)雜,如圖4-11所示。圖4-11ROLAP服務(wù)器的體系結(jié)構(gòu)在MOLAP中,MOLAP服務(wù)器的主要功能是:通過MDDB引擎訪問數(shù)據(jù)倉庫或數(shù)據(jù)庫,將抽取到的數(shù)據(jù)存儲(chǔ)到MDDB中去;通過用戶邏輯層接受用戶的請(qǐng)求,對(duì)MDDB進(jìn)行多維訪問。數(shù)據(jù)進(jìn)入MDDB后,MDDB將自動(dòng)為其建立索引,并進(jìn)行必要的綜合(“預(yù)綜合”)運(yùn)算,以提高系統(tǒng)的性能。MLOAP的體系結(jié)構(gòu)如圖4-12所示。圖4-12MOLAP服務(wù)器的體系結(jié)構(gòu)2.?dāng)?shù)據(jù)的存取MOLAP基本上是專為OLAP處理而設(shè)計(jì)的,具備良好的預(yù)綜合能力,可自建索引,可以多維查詢語言直接對(duì)數(shù)據(jù)立方體進(jìn)行存取操作,具有較快的數(shù)據(jù)存取速度。但在MOLAP中,數(shù)據(jù)的細(xì)節(jié)并不是物理地存儲(chǔ)在MDDB中,不可直接訪問。在ROLAP中,多維數(shù)據(jù)立方體是借助RDBMS中的關(guān)系表構(gòu)成的,數(shù)據(jù)存取的實(shí)現(xiàn)最終必須通過SQL語句實(shí)現(xiàn)。同時(shí),ROLAP的處理包含了大量的關(guān)系表連接運(yùn)算操作,因而不可避免地具有較低的數(shù)據(jù)存取效率。但RDBMS可針對(duì)OLAP應(yīng)用進(jìn)行全面優(yōu)化,如并行存儲(chǔ)、并行查詢、位圖索引、SQL基于OLAP的擴(kuò)展等,這些都可以在一定程度上提高ROLAP處理的效率。3.數(shù)據(jù)的存儲(chǔ)管理在存儲(chǔ)實(shí)現(xiàn)上,為了保證訪問速度,M
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度建筑幕墻工程金屬幕墻清洗勞務(wù)分包合同樣本4篇
- 2025版智慧城市建設(shè)履約擔(dān)保合同模板4篇
- 2025年度二零二五年度木質(zhì)包裝材料銷售合同范本4篇
- 2025年度個(gè)人意外傷害保險(xiǎn)借款合同范本3篇
- 2025版小程序功能開發(fā)授權(quán)合同模板3篇
- 2025年分期付款數(shù)碼產(chǎn)品購買合同
- 2025年機(jī)械設(shè)備加工合同
- 2025版外貿(mào)出口農(nóng)產(chǎn)品質(zhì)量安全合同3篇
- 2025年度環(huán)保認(rèn)證木制品采購合同范本4篇
- 二零二五年度知識(shí)產(chǎn)權(quán)留置擔(dān)保協(xié)議書4篇
- 中國末端執(zhí)行器(靈巧手)行業(yè)市場發(fā)展態(tài)勢及前景戰(zhàn)略研判報(bào)告
- 北京離婚協(xié)議書(2篇)(2篇)
- 2025中國聯(lián)通北京市分公司春季校園招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- Samsung三星SMARTCAMERANX2000(20-50mm)中文說明書200
- 2024年藥品質(zhì)量信息管理制度(2篇)
- 2024年安徽省高考地理試卷真題(含答案逐題解析)
- 廣東省廣州市2024年中考數(shù)學(xué)真題試卷(含答案)
- 內(nèi)審檢查表完整版本
- 2024屆浙江寧波鎮(zhèn)海區(qū)中考生物全真模擬試題含解析
- 人教版八年級(jí)物理下冊(cè) (功)教育教學(xué)課件
- 中藥的性能四氣五味課件
評(píng)論
0/150
提交評(píng)論