版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)挖掘在決策支持系統(tǒng)的應(yīng)用計(jì)算機(jī)智能與科學(xué)秦勤20112115570451101【摘 要】:本文介紹了數(shù)據(jù)挖掘和決策支持系統(tǒng)的概念以及分析方法,討論了基于數(shù)據(jù)挖掘的決策支持系統(tǒng),構(gòu)建了一個(gè)應(yīng)用于實(shí)際的基于數(shù)據(jù)挖掘的企業(yè)管理決策支持系統(tǒng)構(gòu)架?!娟P(guān)鍵詞】:數(shù)據(jù)挖掘;數(shù)據(jù)倉庫;決策支持系統(tǒng)前言在市場(chǎng)經(jīng)濟(jì)環(huán)境下,企業(yè)競(jìng)爭(zhēng)越來越激烈,如何有效地提高企業(yè)管理水平和經(jīng)濟(jì)效益,挖掘市場(chǎng)潛力,是現(xiàn)代企業(yè)面對(duì)的一個(gè)重要課題。對(duì)此,企業(yè)信息化建設(shè)是提高企業(yè)管理水平的有效方法,而且企業(yè)信息化已經(jīng)從最初的簡(jiǎn)單整合企業(yè)信息資源,發(fā)展到現(xiàn)在建立大型的企業(yè)信息數(shù)據(jù)庫,并從數(shù)據(jù)庫中發(fā)現(xiàn)知識(shí),以提供給決策層應(yīng)用,從而達(dá)到輔助企
2、業(yè)管理及決策的目的。 1.基于數(shù)據(jù)挖掘的決策支持系統(tǒng)構(gòu)建 決策支持系統(tǒng)(DSS)是利用大量信息數(shù)據(jù)結(jié)合眾多模型,通過人機(jī)交互,輔助各級(jí)決策者實(shí)現(xiàn)科學(xué)決策的系統(tǒng)。該系統(tǒng)是一個(gè)融計(jì)算機(jī)技術(shù)、信息技術(shù)、人工智能、管理科學(xué)、決策科學(xué)等學(xué)科和技術(shù)于一體的技術(shù)繼承系統(tǒng)。 在企業(yè)沒有建立起決策支持系統(tǒng)前,各個(gè)部門基本上具備各自的數(shù)據(jù)信息和獨(dú)立的信息處理系統(tǒng),但是各個(gè)部門間信息不兼容,即使部門之間有交叉業(yè)務(wù),但是由于信息不統(tǒng)一,也無法做到信息的一致性,不能有效地達(dá)到共享,造成所謂的信息孤島。即使建立了大
3、型的、集成的、信息統(tǒng)一的數(shù)據(jù)倉庫,但怎樣才能在大量的數(shù)據(jù)中發(fā)現(xiàn)有用知識(shí)呢?這就需要一個(gè)全面的解決方案,解決數(shù)據(jù)的一致性和集成性,并在這些經(jīng)過處理的數(shù)據(jù)中發(fā)現(xiàn)知識(shí),以協(xié)助企業(yè)進(jìn)行有效的決策和管理?;跀?shù)據(jù)挖掘的決策支持系統(tǒng)就是把傳統(tǒng)的決策支持系統(tǒng)和數(shù)據(jù)挖掘有機(jī)地結(jié)合在一起,通過數(shù)據(jù)挖掘技術(shù)來提高系統(tǒng)的智能性,在海量的數(shù)據(jù)中有效地提取有用數(shù)據(jù),發(fā)現(xiàn)有用知識(shí)。 決策支持系統(tǒng)由兩部分組成(見圖1.1):數(shù)據(jù)倉庫、分析系統(tǒng)(即數(shù)據(jù)挖掘方法)。 1.1 數(shù)據(jù)倉庫 數(shù)據(jù)倉庫的設(shè)計(jì)首先要滿足決策支持系統(tǒng)
4、的要求,決策支持系統(tǒng)數(shù)據(jù)庫所要求的數(shù)據(jù)要具備三方面特點(diǎn):概括性、抽象性、統(tǒng)一性。所以在圖2.1中數(shù)據(jù)倉庫和部門數(shù)據(jù)庫之間還應(yīng)有一個(gè)虛擬層,用來為數(shù)據(jù)倉庫提取有用數(shù)據(jù),這個(gè)層的功能實(shí)現(xiàn)由數(shù)據(jù)挖掘的數(shù)據(jù)清洗過程完成。 數(shù)據(jù)倉庫設(shè)計(jì)的關(guān)鍵是數(shù)據(jù)庫的結(jié)構(gòu)設(shè)計(jì),包括邏輯設(shè)計(jì)和物理設(shè)計(jì)。 (1) 數(shù)據(jù)庫邏輯設(shè)計(jì) 邏輯設(shè)計(jì)前需要首先建立一個(gè)涉及企業(yè)各個(gè)方面的詳細(xì)商業(yè)模型,即概念模型。概念模型是獨(dú)立于任何一種數(shù)據(jù)模型的信息結(jié)構(gòu),邏輯設(shè)計(jì)的任務(wù)就是把商業(yè)模型轉(zhuǎn)換為數(shù)據(jù)庫系統(tǒng)所支持的數(shù)據(jù)模型相符合的邏輯結(jié)構(gòu)
5、。由于大多數(shù)的商用數(shù)據(jù)庫系統(tǒng)是關(guān)系型數(shù)據(jù)庫,所以邏輯設(shè)計(jì)的主要問題就是把概念模型中各個(gè)實(shí)體與實(shí)體屬性的聯(lián)系轉(zhuǎn)換為關(guān)系模式。在企業(yè)中涉及很多實(shí)體,如部門實(shí)體:人力資源部、生產(chǎn)部、財(cái)務(wù)部、市場(chǎng)部等等。而各個(gè)部門中還涉及部門內(nèi)部的多個(gè)實(shí)體,如市場(chǎng)部門中涉及的實(shí)體有:客戶、客戶經(jīng)理、產(chǎn)品、訂單、銷售業(yè)績(jī),以及城市信息等等,這些實(shí)體都有自己的屬性。 (2)數(shù)據(jù)庫物理設(shè)計(jì) 數(shù)據(jù)庫在物理設(shè)備上的存儲(chǔ)結(jié)構(gòu)與存取方法稱為數(shù)據(jù)庫的物理結(jié)構(gòu),優(yōu)秀的物理結(jié)構(gòu)設(shè)計(jì)能使數(shù)據(jù)庫上運(yùn)行的各種事務(wù)響應(yīng)時(shí)間小、存儲(chǔ)空間利用率高、事務(wù)吞吐率大。優(yōu)秀的物理設(shè)計(jì)最
6、重要的是有一個(gè)高效率的存取方法,常見的存取方法有索引存取方法、HASH存取方法等,存取方法本文不再詳細(xì)敘述。 1.2 數(shù)據(jù)挖掘方法 數(shù)據(jù)挖掘從本質(zhì)上說是一種新的商業(yè)信息處理技術(shù)。數(shù)據(jù)挖掘技術(shù)把人們對(duì)數(shù)據(jù)的應(yīng)用,從低層次的聯(lián)機(jī)查詢操作,提高到?jīng)Q策支持、分析預(yù)測(cè)等更高級(jí)應(yīng)用上。它通過對(duì)這些數(shù)據(jù)進(jìn)行微觀、中觀乃至宏觀的統(tǒng)計(jì)分析、綜合和推理,發(fā)現(xiàn)數(shù)據(jù)的關(guān)聯(lián)性、未來趨勢(shì)以及一般性的概括知識(shí)等。數(shù)據(jù)挖掘作為一門數(shù)據(jù)處理的新興技術(shù),它具有的特征是處理海量數(shù)據(jù),并且即使這些數(shù)據(jù)是不完全的、冗余的、隨機(jī)的、復(fù)雜數(shù)據(jù)結(jié)構(gòu)的、維數(shù)大的,都可以通
7、過數(shù)據(jù)清洗來選擇有用數(shù)據(jù),建立知識(shí)模型。數(shù)據(jù)挖掘是多學(xué)科交叉,涉及計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、數(shù)學(xué)等學(xué)科的技術(shù)。 (1) 聯(lián)機(jī)分析挖掘OLAM OLAM(OnLine Analytical Mining)聯(lián)機(jī)分析挖掘的概念是OLAP(Online Analytical Processing,聯(lián)機(jī)分析處理)的發(fā)展。用戶的決策分析需要對(duì)數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行大量的分析計(jì)算才能得到結(jié)果,而普通的數(shù)據(jù)處理系統(tǒng)對(duì)數(shù)據(jù)庫的簡(jiǎn)單查詢,已經(jīng)不能滿足決策者提出的需求,因此就出現(xiàn)了多維數(shù)據(jù)庫和多維分析的概念,即OLAP。OLAP是聯(lián)機(jī)交互式數(shù)據(jù)分析一個(gè)良
8、好的框架,但是它只能處理數(shù)值型數(shù)據(jù),對(duì)決策支持系統(tǒng)來說是一個(gè)較大的局限性。 OLAM是在數(shù)據(jù)立方體上進(jìn)行多層次的數(shù)據(jù)挖掘,OLAM分成若干個(gè)抽象層,每個(gè)抽象層都有各自的抽象任務(wù)。主要包括數(shù)據(jù)集層:它包括相關(guān)的數(shù)據(jù)庫和數(shù)據(jù)倉庫等,同時(shí)也是OLAM的數(shù)據(jù)源,通過數(shù)據(jù)清洗和集成,生成結(jié)構(gòu)化的便于分析的數(shù)據(jù)環(huán)境。 數(shù)據(jù)立方層:形成支持OLAP和OLDM的多維數(shù)據(jù)集,它是相關(guān)數(shù)據(jù)的綜合和多維化處理,主要由數(shù)據(jù)立方和元數(shù)據(jù)集組成。 OLAP和OLDM應(yīng)用層:這一層接受數(shù)據(jù)請(qǐng)求,通過訪問多維數(shù)據(jù)集和元
9、數(shù)據(jù),完成數(shù)據(jù)挖掘和分析。用戶接口層:承擔(dān)用戶請(qǐng)求的理解以及挖掘結(jié)果的解釋和表達(dá)等。 (2) 數(shù)據(jù)挖掘過程 數(shù)據(jù)庫中發(fā)現(xiàn)知識(shí)是一個(gè)有明確學(xué)習(xí)目標(biāo)的需要多次反復(fù)的過程,因此數(shù)據(jù)挖掘是一個(gè)目標(biāo)和數(shù)據(jù)不斷優(yōu)化的過程。 a.問題定義和數(shù)據(jù)抽取 對(duì)于多異構(gòu)的數(shù)據(jù)源,需要根據(jù)源數(shù)據(jù)的結(jié)構(gòu)特點(diǎn)進(jìn)行相應(yīng)的數(shù)據(jù)抽取工作。不同類型的源數(shù)據(jù),在結(jié)構(gòu)上差異很大。這就需要以問題定義為基礎(chǔ)來界定數(shù)據(jù)抽取的原則和規(guī)則。 b.數(shù)據(jù)預(yù)處理
10、 數(shù)據(jù)預(yù)處理是對(duì)數(shù)據(jù)再加工的過程。經(jīng)過處理后,數(shù)據(jù)具有某種標(biāo)準(zhǔn)格式,可以提供給后續(xù)的數(shù)據(jù)挖掘。數(shù)據(jù)預(yù)處理的任務(wù)主要有數(shù)據(jù)清洗和數(shù)據(jù)選擇等。對(duì)于備選數(shù)據(jù)先噪聲清洗,然后根據(jù)模式要求確定數(shù)據(jù)選擇的原則和策略。選擇出滿足模式要求的數(shù)據(jù),必要時(shí)進(jìn)行數(shù)據(jù)格式的轉(zhuǎn)換。 c.數(shù)據(jù)挖掘和知識(shí)庫 數(shù)據(jù)挖掘是在規(guī)格化的目標(biāo)數(shù)據(jù)集中根據(jù)特定的模型和算法進(jìn)行數(shù)據(jù)抽象,生成知識(shí)。它應(yīng)該能反復(fù)利用獲得的知識(shí)和用戶互動(dòng),這就需要知識(shí)庫的支持,達(dá)到滿足用戶要求的知識(shí)模式。決策支持系統(tǒng)是一個(gè)多策略的挖掘系統(tǒng),所以數(shù)據(jù)挖掘包含諸如描述
11、、關(guān)聯(lián)、分類、聚類、時(shí)間序列分析以及進(jìn)化和偏差分析等功能在內(nèi)的數(shù)據(jù)挖掘工具。挖掘出來的中間或者最終知識(shí)存儲(chǔ)在知識(shí)庫中。這些知識(shí)具有不同的抽象層次、適合不同的決策層次的數(shù)據(jù)分析和決策。 2.數(shù)據(jù)挖掘決策支持系統(tǒng)在企業(yè)中的構(gòu)建 數(shù)據(jù)挖掘就是從海量的數(shù)據(jù)中挖掘出可能有潛在價(jià)值的信息的技術(shù)。用于決策支持,則是提高企業(yè)在面對(duì)不斷變換的市場(chǎng)條件下的應(yīng)變能力,以及挖掘自身潛力,增強(qiáng)自身競(jìng)爭(zhēng)力的有效手段。 2.1 數(shù)據(jù)準(zhǔn)備 完備的信息來源是決策支持系統(tǒng)的基礎(chǔ),在企業(yè)中
12、商業(yè)決策需要多樣化的信息,如實(shí)時(shí)信息、歷史信息、社會(huì)信息、企業(yè)內(nèi)部信息、行業(yè)信息等等。因此在整理信息的時(shí)候,需要做到全面、準(zhǔn)確、及時(shí)。按企業(yè)信息的業(yè)務(wù)屬性,信息可以分為以下幾類: a.財(cái)務(wù)信息:主要包括效益分析所需的銷售收入與銷售支出,運(yùn)營(yíng)決策所需的成本、管理支出等信息,根據(jù)不同的決策對(duì)數(shù)據(jù)的需求,從企業(yè)財(cái)務(wù)信息數(shù)據(jù)庫提取。 b.銷售信息:主要包括產(chǎn)品類別、價(jià)格、業(yè)務(wù)信息、客戶、交通信息、運(yùn)輸費(fèi)用、銷售人員個(gè)人信息、銷售業(yè)績(jī)、貨款回收等。 c.倉儲(chǔ)信息:主要包括庫存量,倉庫信息、產(chǎn)品類別
13、、產(chǎn)品分類儲(chǔ)量、出庫信息,入庫信息、存儲(chǔ)時(shí)間、安全存儲(chǔ)量、預(yù)警存儲(chǔ)量、盤盈盤虧額等。 d.生產(chǎn)信息:主要包括產(chǎn)品類別、生產(chǎn)成本、原材料供應(yīng)、生產(chǎn)時(shí)間、產(chǎn)品生產(chǎn)效率、歷史生產(chǎn)信息、車間信息等。 e.采購信息:主要包括合同信息、供應(yīng)商、采購價(jià)格、運(yùn)輸信息、歷史采購信息、應(yīng)付貨款等。 f.人事信息:包括人員信息,工資信息、部門、學(xué)歷等。這些來自企業(yè)和相關(guān)行業(yè)的各個(gè)方面的大量信息,通過收集、整理、存儲(chǔ)在數(shù)據(jù)庫中作為原始數(shù)據(jù),這些數(shù)據(jù)是離散的、模糊的。 2.2
14、系統(tǒng)功能模塊 根據(jù)企業(yè)的關(guān)鍵部門,如財(cái)務(wù)、生產(chǎn)、銷售、倉儲(chǔ)、采購、人事,分析各個(gè)部門的業(yè)務(wù)決策需求,在部門信息數(shù)據(jù)的基礎(chǔ)上結(jié)合企業(yè)外部數(shù)據(jù),建立各部門相關(guān)的決策分析子系統(tǒng)。除了各個(gè)部門的決策分析子系統(tǒng)外,還需要建立宏觀的戰(zhàn)略分析子系統(tǒng)。 財(cái)務(wù)部門:財(cái)務(wù)分析、集團(tuán)財(cái)務(wù)分析、經(jīng)營(yíng)財(cái)務(wù)分析等。 生產(chǎn)部門:生產(chǎn)計(jì)劃分析、物料需求分析、成本分析、生產(chǎn)調(diào)度分析等。 銷售部門:合同分析、銷售分析、競(jìng)爭(zhēng)對(duì)手分析、產(chǎn)品市場(chǎng)分析、客戶群體劃分、客戶背景分析、客戶流失分析、
15、欺詐發(fā)現(xiàn)等。 倉儲(chǔ)部門:庫存結(jié)構(gòu)分析、庫存預(yù)警分析、庫存盤點(diǎn)分析、產(chǎn)品流量分析等。 采購部門:采購合同分析、供應(yīng)商分析、應(yīng)付款分析、采購價(jià)格變動(dòng)分析、原材料市場(chǎng)分析等。 人事部門:人員結(jié)構(gòu)分析、工資結(jié)構(gòu)分析、員工負(fù)荷分析、企業(yè)人員培訓(xùn)分析等。 這里的戰(zhàn)略分析子系統(tǒng)主要可以實(shí)現(xiàn)以下功能:行業(yè)吸引力分析、行業(yè)機(jī)會(huì)威脅分析、行業(yè)結(jié)構(gòu)分析、客戶戰(zhàn)略分析、供應(yīng)商戰(zhàn)略分析、企業(yè)競(jìng)爭(zhēng)力分析、產(chǎn)品市場(chǎng)強(qiáng)度分析、企業(yè)經(jīng)濟(jì)效益分析、財(cái)務(wù)危機(jī)分析、人力資源戰(zhàn)略分析等。
16、60; 2.3 系統(tǒng)總架構(gòu) 為了滿足企業(yè)內(nèi)部不同部門的決策需求,以及企業(yè)戰(zhàn)略決策需求,決策系統(tǒng)可以根據(jù)企業(yè)的具體情況分為兩個(gè)層次,第一層為部門決策層,第二層為戰(zhàn)略決策層,整體架構(gòu)如圖2.1所示。 3.結(jié)束語 基于數(shù)據(jù)挖掘的決策支持系統(tǒng)在技術(shù)上有效地解決了企業(yè)決策難以進(jìn)行預(yù)測(cè)和分析的問題,從已經(jīng)投入使用的數(shù)據(jù)挖掘工具表明,數(shù)據(jù)挖掘方法給企業(yè)帶來了巨大的社會(huì)效益和經(jīng)濟(jì)效益?;跀?shù)據(jù)挖掘的決策支持系統(tǒng)是在更高層次上的系統(tǒng)整合,數(shù)據(jù)來源更廣泛,集成度更高,挖掘目標(biāo)更細(xì)化和
17、抽象化,這些對(duì)用戶來說具有很大的應(yīng)用價(jià)值,能給企業(yè)的管理與決策提供可靠的數(shù)據(jù)支撐,從而利于企業(yè)對(duì)市場(chǎng)的準(zhǔn)備判斷,提高經(jīng)濟(jì)效益。參考文獻(xiàn)1. 湯九斌,基于數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng)及其關(guān)鍵技術(shù)研究 (博士學(xué)位論文,南京理工大學(xué))2. 孫永劍,李仁旺,基于數(shù)據(jù)挖掘的服裝決策支持系統(tǒng) (計(jì)算機(jī)工程,第31卷第16期,P194-196)3. Roiger R J, Geatzer M W. 翁敬農(nóng)譯. 數(shù)據(jù)挖掘教程. 北京: 清華大學(xué)出版社, 2003 4. Berry M J A, Linoff G S. 袁衛(wèi)譯. 數(shù)據(jù)挖掘客戶關(guān)系管理的科學(xué)與藝術(shù). 北京:中國財(cái)政經(jīng)濟(jì)出版社, 2004 5. Fa
18、yyad U M, Piatetsky-Shapiro G. Knowledge Discovery and Data Mining :Towards a Unifying Framwork C. In: Proc. of KDD96, Menlo Park, CA:AAAI Press, 1996 6. 陳文偉.決策支持系統(tǒng)教程M.北京:清華大學(xué)出版社,2004.7. 楊善林.智能決策方法與智能決策支持系M.北京:科學(xué)出版社,2005.8. CalvaneseD,DragoneL, NardiD, etal. Enterprise modeling and Data Warehousing in
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 操場(chǎng)改造技術(shù)方案
- 攝影專業(yè)學(xué)生寫真課程設(shè)計(jì)
- 搭建個(gè)人博客的課程設(shè)計(jì)
- 搬家服務(wù)技術(shù)方案
- 搜救機(jī)器人課程設(shè)計(jì)
- 搏擊90分鐘課程設(shè)計(jì)
- 道路施工應(yīng)急方案
- 揭開粗心真面目課程設(shè)計(jì)
- 插秧捉魚課程設(shè)計(jì)
- 插畫瓶子手工課程設(shè)計(jì)
- 第4課《公民的基本權(quán)利和義務(wù)》(課件)-部編版道德與法治六年級(jí)上冊(cè)
- 20世紀(jì)時(shí)尚流行文化智慧樹知到期末考試答案章節(jié)答案2024年浙江理工大學(xué)
- 國開(甘肅)2024年春《地域文化(專)》形考任務(wù)1-4終考答案
- (高清版)JTGT 3331-04-2023 多年凍土地區(qū)公路設(shè)計(jì)與施工技術(shù)規(guī)范
- 4D廚房區(qū)域區(qū)間管理責(zé)任卡
- 增值服務(wù)具體方案怎么寫范文
- 《路由與交換技術(shù)》課程教學(xué)大綱
- 中國醫(yī)院質(zhì)量安全管理 第4-6部分:醫(yī)療管理 醫(yī)療安全(不良)事件管理 T∕CHAS 10-4-6-2018
- 執(zhí)法辦案區(qū)域工作臺(tái)賬[表格借鑒]
- 商務(wù)禮儀作業(yè)
- 蘇州大學(xué)附屬第一醫(yī)院電子病歷應(yīng)用管理制度
評(píng)論
0/150
提交評(píng)論