數(shù)據(jù)庫(kù)系統(tǒng)原理及應(yīng)用(何玉潔)-第16章_第1頁(yè)
數(shù)據(jù)庫(kù)系統(tǒng)原理及應(yīng)用(何玉潔)-第16章_第2頁(yè)
數(shù)據(jù)庫(kù)系統(tǒng)原理及應(yīng)用(何玉潔)-第16章_第3頁(yè)
數(shù)據(jù)庫(kù)系統(tǒng)原理及應(yīng)用(何玉潔)-第16章_第4頁(yè)
數(shù)據(jù)庫(kù)系統(tǒng)原理及應(yīng)用(何玉潔)-第16章_第5頁(yè)
已閱讀5頁(yè),還剩52頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)庫(kù)原理與應(yīng)用教程(第3版)國(guó)家“十一五”規(guī)劃教材第16章數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘

16.1數(shù)據(jù)倉(cāng)庫(kù)技術(shù)16.2聯(lián)機(jī)分析處理

16.3數(shù)據(jù)挖掘16.1數(shù)據(jù)倉(cāng)庫(kù)技術(shù)16.1.1數(shù)據(jù)倉(cāng)庫(kù)的概念及特點(diǎn)

16.1.2數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)

16.1.3數(shù)據(jù)倉(cāng)庫(kù)的分類

16.1.4數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)

數(shù)據(jù)倉(cāng)庫(kù)技術(shù)數(shù)據(jù)倉(cāng)庫(kù)是進(jìn)行聯(lián)機(jī)分析處理和數(shù)據(jù)挖掘的基礎(chǔ),它從數(shù)據(jù)分析的角度將聯(lián)機(jī)事務(wù)中的數(shù)據(jù)經(jīng)過(guò)清理、轉(zhuǎn)換并加載到數(shù)據(jù)倉(cāng)庫(kù)中,這些數(shù)據(jù)在數(shù)據(jù)倉(cāng)庫(kù)中被合理的組織和維護(hù),以滿足聯(lián)機(jī)分析處理和數(shù)據(jù)挖掘的要求。

16.1.1數(shù)據(jù)倉(cāng)庫(kù)的概念及特點(diǎn)面向主題

集成的數(shù)據(jù)

數(shù)據(jù)不可更新

數(shù)據(jù)隨時(shí)間不斷變化

使用數(shù)據(jù)倉(cāng)庫(kù)是為了更好的支持制定決策

面向主題主題是一種抽象,它是在較高層次上將企業(yè)信息系統(tǒng)中的數(shù)據(jù)綜合、歸類并進(jìn)行分析利用,是對(duì)企業(yè)中某一宏觀分析領(lǐng)域所涉及的分析對(duì)象,是針對(duì)某一決策問(wèn)題而設(shè)置的。面向主題的數(shù)據(jù)組織方式就是完整、統(tǒng)一地刻畫(huà)各個(gè)分析對(duì)象所涉及的企業(yè)的各項(xiàng)數(shù)據(jù)以及數(shù)據(jù)之間的聯(lián)系。在關(guān)系數(shù)據(jù)庫(kù)中,每個(gè)主題由一組相關(guān)的關(guān)系表或邏輯視圖來(lái)具體實(shí)現(xiàn)。主題中的所有表都通過(guò)一個(gè)公共鍵聯(lián)系起來(lái),數(shù)據(jù)可以存儲(chǔ)在不同的介質(zhì)上,而且相同的數(shù)據(jù)可以既有綜合級(jí)又有細(xì)節(jié)級(jí)。

集成的數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)的數(shù)據(jù)是從原來(lái)分散的各個(gè)子系統(tǒng)中提取出來(lái)的,但并不是原有數(shù)據(jù)的簡(jiǎn)單拷貝,而是經(jīng)過(guò)統(tǒng)一、綜合這樣的過(guò)程。原因:源數(shù)據(jù)不適合分析處理,在進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)之前必須經(jīng)過(guò)綜合、清理等過(guò)程,拋棄分析處理不需要的數(shù)據(jù)項(xiàng),增加一些可能涉及的外部數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)每個(gè)主題所對(duì)應(yīng)的源數(shù)據(jù)在原分散數(shù)據(jù)庫(kù)中有許多重復(fù)或不一致的地方,因而必須對(duì)數(shù)據(jù)進(jìn)行統(tǒng)一,消除不一致和錯(cuò)誤的地方,以保證數(shù)據(jù)的質(zhì)量。數(shù)據(jù)不可更新從數(shù)據(jù)的使用方式上看,數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)不可更新是指當(dāng)數(shù)據(jù)被存放到數(shù)據(jù)倉(cāng)庫(kù)之后,最終用戶只能進(jìn)行查詢、分析操作,而不能修改其中存儲(chǔ)的數(shù)據(jù)。

數(shù)據(jù)隨時(shí)間不斷變化數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)不可更新,但并不是說(shuō),數(shù)據(jù)從進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)以后就永遠(yuǎn)不變。從數(shù)據(jù)的內(nèi)容上看,數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)的是企業(yè)當(dāng)前的和歷史的數(shù)據(jù)。因而每隔一段固定的時(shí)間間隔后,操作型數(shù)據(jù)庫(kù)系統(tǒng)產(chǎn)生的數(shù)據(jù)需要經(jīng)過(guò)抽取、轉(zhuǎn)換過(guò)程以后集成到數(shù)據(jù)倉(cāng)庫(kù)中。數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)隨時(shí)間變化而定期地更新。數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)

操作型數(shù)據(jù)與分析型數(shù)據(jù)的區(qū)別

原始數(shù)據(jù)/操作型數(shù)據(jù)導(dǎo)出數(shù)據(jù)/DSS數(shù)據(jù)面向應(yīng)用,支持日常操作面向主題,支持管理需求數(shù)據(jù)詳細(xì),處理細(xì)節(jié)問(wèn)題綜合性強(qiáng),或經(jīng)過(guò)提煉存取的瞬間是準(zhǔn)確值代表過(guò)去的數(shù)據(jù)可更新不可更新重復(fù)運(yùn)行啟發(fā)式運(yùn)行事務(wù)處理驅(qū)動(dòng)分析處理驅(qū)動(dòng)非冗余性時(shí)常有冗余處理需求事先可知,系統(tǒng)可按預(yù)計(jì)的工作量進(jìn)行優(yōu)化處理需求事先不知道對(duì)性能要求高對(duì)性能要求寬松用戶不必理解數(shù)據(jù)庫(kù),只是輸入數(shù)據(jù)即可用戶需要理解數(shù)據(jù)庫(kù),以從數(shù)據(jù)中得出有意義的結(jié)論數(shù)據(jù)倉(cāng)庫(kù)的分類按照數(shù)據(jù)倉(cāng)庫(kù)的規(guī)模與應(yīng)用層面來(lái)區(qū)分,數(shù)據(jù)倉(cāng)庫(kù)大致可分為下列幾種:標(biāo)準(zhǔn)數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)集市。多層數(shù)據(jù)倉(cāng)庫(kù)。聯(lián)合式數(shù)據(jù)倉(cāng)庫(kù)。

標(biāo)準(zhǔn)數(shù)據(jù)倉(cāng)庫(kù)是企業(yè)最常使用的數(shù)據(jù)倉(cāng)庫(kù),它依據(jù)管理決策的需求而將數(shù)據(jù)加以整理分析,再將其轉(zhuǎn)換到數(shù)據(jù)倉(cāng)庫(kù)之中。這類數(shù)據(jù)倉(cāng)庫(kù)是以整個(gè)企業(yè)為著眼點(diǎn)而建構(gòu)出來(lái)的,其數(shù)據(jù)都與整個(gè)企業(yè)的數(shù)據(jù)有關(guān),用戶可以從中得到整個(gè)組織運(yùn)作的統(tǒng)計(jì)分析信息。數(shù)據(jù)集市針對(duì)某一主題或是某個(gè)部門而構(gòu)建的數(shù)據(jù)倉(cāng)庫(kù),規(guī)模會(huì)比標(biāo)準(zhǔn)數(shù)據(jù)倉(cāng)庫(kù)小,且只存儲(chǔ)與部門或主題相關(guān)的數(shù)據(jù),是數(shù)據(jù)體系結(jié)構(gòu)中的部門級(jí)數(shù)據(jù)倉(cāng)庫(kù)。通常用于為單位的職能部門提供信息。例如,為是銷售部門、庫(kù)存和發(fā)貨部門、財(cái)務(wù)部門、高級(jí)管理部門等提供有用信息。還可用于將數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)分段以反映按地理劃分的業(yè)務(wù),其中每個(gè)地區(qū)都是相對(duì)自治的。

多層數(shù)據(jù)倉(cāng)庫(kù)是標(biāo)準(zhǔn)數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)集市的組合應(yīng)用方式在整個(gè)架構(gòu)之中,有一個(gè)最上層的數(shù)據(jù)倉(cāng)庫(kù)提供者,它將數(shù)據(jù)提供給下層的數(shù)據(jù)集市。

數(shù)據(jù)倉(cāng)庫(kù)銷售數(shù)據(jù)集市市場(chǎng)數(shù)據(jù)集市商店數(shù)據(jù)集市用戶用戶用戶數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)

自頂向下,即從全面設(shè)計(jì)整個(gè)企業(yè)的數(shù)據(jù)倉(cāng)庫(kù)模型開(kāi)始。這是一種系統(tǒng)的解決方法,并能最大限度的減少集成問(wèn)題,但費(fèi)用高,開(kāi)發(fā)時(shí)間長(zhǎng),且缺乏靈活性,因?yàn)槭拐麄€(gè)企業(yè)的數(shù)據(jù)倉(cāng)庫(kù)模型要達(dá)到一致是很困難的。自底向上,從設(shè)計(jì)和實(shí)現(xiàn)各個(gè)獨(dú)立的數(shù)據(jù)集市開(kāi)始。這種方法費(fèi)用低,靈活性高,并能快速的回報(bào)投資。

推薦的數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)方法數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模式

典型的數(shù)據(jù)倉(cāng)庫(kù)具有為數(shù)據(jù)分析而設(shè)計(jì)的模式,供OLAP工具進(jìn)行聯(lián)機(jī)分析處理。數(shù)據(jù)通常是多維的,包括維屬性和度量屬性,維屬性是分析數(shù)據(jù)的角度,度量屬性是要分析的數(shù)據(jù),一般是數(shù)值型的。包含統(tǒng)計(jì)分析數(shù)據(jù)的表稱為事實(shí)數(shù)據(jù)表,通常比較大。

數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)星型架構(gòu)雪花型架構(gòu)星型架構(gòu)

維度表只與事實(shí)表關(guān)聯(lián),維度表彼此之間沒(méi)有任何聯(lián)系。每個(gè)維度表都有一個(gè)且只有一個(gè)列作為主碼,該主碼連接到事實(shí)數(shù)據(jù)表中的一個(gè)列上。雪花型架構(gòu)將一個(gè)維度表分解為多個(gè)表,每個(gè)表都連接到主維度表。16.2聯(lián)機(jī)分析處理聯(lián)機(jī)分析處理(OLAP)是專門為支持復(fù)雜的分析操作而設(shè)計(jì)的,側(cè)重于決策人員和高層管理人員的決策支持可以快速、靈活地進(jìn)行大數(shù)據(jù)量的復(fù)雜查詢以一種直觀易懂的形式將查詢結(jié)果提供給決策人員。以數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)為基礎(chǔ),其最終的數(shù)據(jù)來(lái)源來(lái)自底層的數(shù)據(jù)庫(kù)系統(tǒng)。OLAP與OLTP的區(qū)別OLTP面向的是操作人員和底層管理人員,OLAP面向的是決策人員和高層管理人員;OLTP是對(duì)基本數(shù)據(jù)的查詢和增、刪、改操作處理,它以數(shù)據(jù)庫(kù)為基礎(chǔ),OLAP更適合以數(shù)據(jù)倉(cāng)庫(kù)為基礎(chǔ)的數(shù)據(jù)分析處理。OLAP所依賴的歷史的、導(dǎo)出的及經(jīng)綜合提煉的數(shù)據(jù)均來(lái)自O(shè)LTP所依賴的底層數(shù)據(jù)庫(kù)。OLAP數(shù)據(jù)較之OLTP數(shù)據(jù)要多一步數(shù)據(jù)多維化或綜合處理的操作。OLAP的基本概念度量屬性:是決策者所關(guān)心的具有實(shí)際意義的數(shù)量。例如,銷售量、庫(kù)存量等。維度(或簡(jiǎn)稱為維):是人們觀察數(shù)據(jù)的角度。

維的層次:人們觀察數(shù)據(jù)的角度(即某個(gè)維)還可以存在細(xì)節(jié)程度不同的多個(gè)描述方面,稱這多個(gè)描述方面為維的層次。維度成員:維度的一個(gè)取值稱為該維的一個(gè)維度成員

多維數(shù)組:一個(gè)多維數(shù)組可以表示為:(維1,維2,…,維n,變量)。

數(shù)據(jù)單元(單元格):多維數(shù)組的取值稱為數(shù)據(jù)單元

多維度數(shù)據(jù)分析示例聯(lián)機(jī)分析處理的基本分析功能

上卷:在數(shù)據(jù)立方體中執(zhí)行聚集操作,通過(guò)在維層次中上升或消除某個(gè)或某些維來(lái)觀察更概況的數(shù)據(jù)

下鉆:通過(guò)在維層次中下降或引入某個(gè)或某些維來(lái)更細(xì)致的觀察數(shù)據(jù)。

切片:在給定的數(shù)據(jù)立方體的一個(gè)維上進(jìn)行的選擇操作,結(jié)果是得到了一個(gè)二維的平面數(shù)據(jù)。

切塊:在給定的數(shù)據(jù)立方體的兩個(gè)或多個(gè)維上進(jìn)行的選擇操作,結(jié)果得到了一個(gè)子立方體。轉(zhuǎn)軸:改變維的方向,將一個(gè)三維立方體轉(zhuǎn)變?yōu)橐幌盗卸S平面。

上卷操作示意圖城市上升到地區(qū)

下鉆操作示意圖季度下降到月

切片操作示意圖時(shí)間=1季度切塊操作示意圖(地區(qū)=“江蘇”

or“浙江”)And(時(shí)間=“第一季度”

or“第二季度”)And(商品類型=“家電”

or“食品”)

轉(zhuǎn)軸操作示意圖轉(zhuǎn)軸16.3數(shù)據(jù)挖掘如何從大量的數(shù)據(jù)中及時(shí)有效地提取有用的信息,是所有經(jīng)營(yíng)管理者所面臨的一個(gè)共同的難題。為了解決這一難題,有關(guān)人員逐步研究開(kāi)發(fā)了一系列的技術(shù)和方法,即數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)和數(shù)據(jù)庫(kù)挖掘技術(shù),其目標(biāo)就是要智能化和自動(dòng)化地把數(shù)據(jù)轉(zhuǎn)換為有用的信息和知識(shí)。數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)是識(shí)別數(shù)據(jù)庫(kù)中以前未知的、新穎的、潛在有用的和最終可被理解的模式的非平凡過(guò)程,而數(shù)據(jù)挖掘是數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)過(guò)程的一個(gè)步驟。

數(shù)據(jù)挖掘過(guò)程1.?dāng)?shù)據(jù)準(zhǔn)備數(shù)據(jù)選擇:搜索所有與業(yè)務(wù)對(duì)象有關(guān)的內(nèi)部和外部數(shù)據(jù)信息,并從中選擇出適用于數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù)。

數(shù)據(jù)預(yù)處理:研究數(shù)據(jù)的質(zhì)量,為進(jìn)一步的數(shù)據(jù)分析作準(zhǔn)備,并確定將要進(jìn)行的挖掘操作的類型。

數(shù)據(jù)轉(zhuǎn)換:將數(shù)據(jù)轉(zhuǎn)換成一個(gè)分析模型,這個(gè)分析模型是針對(duì)數(shù)據(jù)挖掘算法建立的。其他過(guò)程2.數(shù)據(jù)挖掘

對(duì)所得到的經(jīng)過(guò)轉(zhuǎn)換的數(shù)據(jù)進(jìn)行挖掘,除了選擇合適的挖掘算法外,其余一切工作都能自動(dòng)地完成。3.結(jié)果分析

解釋并評(píng)估結(jié)果。其使用的分析方法一般應(yīng)視數(shù)據(jù)挖掘操作而定,通常會(huì)用到可視化技術(shù)。4.知識(shí)的同化

將分析所得到的知識(shí)集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去。16.3.2數(shù)據(jù)挖掘知識(shí)發(fā)現(xiàn)數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的研究的三根技術(shù)支柱:數(shù)據(jù)庫(kù)人工智能數(shù)理統(tǒng)計(jì)目前DMKD(數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn))的主要研究?jī)?nèi)容包括基礎(chǔ)理論、發(fā)現(xiàn)算法、數(shù)據(jù)倉(cāng)庫(kù)、可視化技術(shù)、定性定量互換模型、知識(shí)表示方法、發(fā)現(xiàn)知識(shí)的維護(hù)和再利用、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中的知識(shí)發(fā)現(xiàn)以及網(wǎng)上數(shù)據(jù)挖掘等。數(shù)據(jù)挖掘知識(shí)的分類廣義知識(shí)關(guān)聯(lián)知識(shí)分類知識(shí)預(yù)測(cè)型知識(shí)偏差型知識(shí)廣義知識(shí)廣義知識(shí)(Generalization)是指類別特征的概括性描述知識(shí)。根據(jù)數(shù)據(jù)的微觀特性發(fā)現(xiàn)其表征的、帶有普遍性的、較高層次概念的、中觀和宏觀的知識(shí),反映同類事物共同性質(zhì),是對(duì)數(shù)據(jù)的概括、精煉和抽象。關(guān)聯(lián)知識(shí)關(guān)聯(lián)知識(shí)(Association)是反映一個(gè)事件和其他事件之間依賴或關(guān)聯(lián)的知識(shí)。如果兩項(xiàng)或多項(xiàng)屬性之間存在關(guān)聯(lián),那么其中一項(xiàng)的屬性值就可以依據(jù)其他屬性值進(jìn)行預(yù)測(cè)。關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)可分為兩步。第一步是迭代識(shí)別所有的頻繁項(xiàng)目集,要求頻繁項(xiàng)目集的支持率不低于用戶設(shè)定的最低值;第二步是從頻繁項(xiàng)目集中構(gòu)造可信度不低于用戶設(shè)定的最低值的規(guī)則。識(shí)別或發(fā)現(xiàn)所有頻繁項(xiàng)目集是關(guān)聯(lián)規(guī)則發(fā)現(xiàn)算法的核心,也是計(jì)算量最大的部分。分類知識(shí)分類知識(shí)(Classification&Clustering)是反映同類事物共同性質(zhì)的特征型知識(shí)和不同事物之間的差異型特征知識(shí)。最為典型的分類方法是基于決策樹(shù)的分類方法。它是從實(shí)例集中構(gòu)造決策樹(shù),是一種有指導(dǎo)的學(xué)習(xí)方法。預(yù)測(cè)型知識(shí)預(yù)測(cè)型知識(shí)(Prediction)是根據(jù)時(shí)間序列型數(shù)據(jù),由歷史的和當(dāng)前的數(shù)據(jù)去推測(cè)未來(lái)的數(shù)據(jù),也可以認(rèn)為是以時(shí)間為關(guān)鍵屬性的關(guān)聯(lián)知識(shí)。

目前,時(shí)間序列預(yù)測(cè)方法有經(jīng)典的統(tǒng)計(jì)方法、神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)等。偏差型知識(shí)偏差型知識(shí)(Deviation)是對(duì)差異和極端特例的描述,揭示事物偏離常規(guī)的異常現(xiàn)象,如標(biāo)準(zhǔn)類外的特例,數(shù)據(jù)聚類外的離群值等。所有這些知識(shí)都可以在不同的概念層次上被發(fā)現(xiàn),并隨著概念層次的提升,從微觀到中觀、到宏觀,以滿足不同用戶不同層次決策的需要。16.3.3數(shù)據(jù)挖掘的常用技術(shù)和目標(biāo)1.常用技術(shù)

人工神經(jīng)網(wǎng)絡(luò):仿照生理神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的非線形預(yù)測(cè)模型,通過(guò)學(xué)習(xí)進(jìn)行模式識(shí)別。

決策樹(shù):代表決策集的樹(shù)形結(jié)構(gòu)。

遺傳算法:基于進(jìn)化理論,并采用遺傳結(jié)合、遺傳變異以及自然選擇等設(shè)計(jì)方法的優(yōu)化技術(shù)。

近鄰算法:將數(shù)據(jù)集合中每一個(gè)記錄進(jìn)行分類的方法。

規(guī)則推導(dǎo):從統(tǒng)計(jì)意義上對(duì)數(shù)據(jù)中的“IF-Then”規(guī)則進(jìn)行尋找和推導(dǎo)。目標(biāo)數(shù)據(jù)挖掘用于實(shí)現(xiàn)特定的目標(biāo),這些目標(biāo)可以分為以下幾個(gè)主要類別:預(yù)測(cè):數(shù)據(jù)挖掘預(yù)測(cè)數(shù)據(jù)特定屬性的未來(lái)行為。如基于對(duì)顧客購(gòu)買行為的分析,什么市場(chǎng)和銷售策略能產(chǎn)生更多利潤(rùn)等。識(shí)別:數(shù)據(jù)挖掘可以基于數(shù)據(jù)模型識(shí)別一個(gè)事件、項(xiàng)目或活動(dòng)的存在。如識(shí)別一個(gè)人或一組人訪問(wèn)數(shù)據(jù)庫(kù)某一部分的權(quán)限,基于DNA序列中的某個(gè)特征序列識(shí)別基因的存在,等等。目標(biāo)(續(xù))分類:數(shù)據(jù)挖掘可以劃分?jǐn)?shù)據(jù),從而根據(jù)參數(shù)組合識(shí)別不同的分類和類別。如超級(jí)市場(chǎng)的顧客可以被分類為:尋找折扣的顧客,忠誠(chéng)并且常來(lái)的顧客,只買特定品牌商品的顧客,不經(jīng)常來(lái)的顧客,等等。優(yōu)化:數(shù)據(jù)挖掘可以優(yōu)化對(duì)有限資源的使用,如時(shí)間、空間、資金或材料,在給定的約束條件內(nèi)最大化產(chǎn)出值,如銷售量或利潤(rùn)。16.3.4數(shù)據(jù)挖掘工具有各種不同類型的數(shù)據(jù)挖掘工具和方法來(lái)實(shí)現(xiàn)知識(shí)提取。多數(shù)數(shù)據(jù)挖掘工具使用ODBC。多數(shù)工具可在Microsoft的Windows環(huán)境中運(yùn)行,一些工具還可在UNIX操作系統(tǒng)下運(yùn)行。工具(續(xù))挖掘工具可以基于一些標(biāo)準(zhǔn)劃分為不同類型,下列是其中的一些標(biāo)準(zhǔn):產(chǎn)品類型。產(chǎn)品特征。目的或目標(biāo)?;诋a(chǎn)品類型的挖掘的工具查詢管理者和報(bào)表作者。電子表格。多維數(shù)據(jù)庫(kù)。統(tǒng)計(jì)分析工具。人工智能工具。高級(jí)分析工具。圖像顯示工具。基于產(chǎn)品特征的挖掘工具數(shù)據(jù)識(shí)別能力。多種形式的輸出,如打印輸出、屏幕輸出、標(biāo)準(zhǔn)圖形輸出、增強(qiáng)的圖形輸出等等。格式化能力,如行數(shù)據(jù)格式、列表、電子表格形式、多維數(shù)據(jù)庫(kù)、可視化等等。計(jì)算工具,如柱狀操作、交叉表能力、電子表格、多維電子表格等等。規(guī)范管理,允許最終用戶編寫(xiě)并管理他們自己的規(guī)范。施行管理。基于目標(biāo)的挖掘工具所有應(yīng)用開(kāi)發(fā)程序和數(shù)據(jù)挖掘工具都可以歸入以下三個(gè)操作類別:數(shù)據(jù)收集和檢索。操作監(jiān)測(cè)。探測(cè)和發(fā)現(xiàn)。16.3.5數(shù)據(jù)挖掘應(yīng)用數(shù)據(jù)挖掘技術(shù)可以應(yīng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論