




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、數(shù)據(jù)挖掘在決策支持系統(tǒng)的應用計算機智能與科學秦勤20112115570451101【摘 要】:本文介紹了數(shù)據(jù)挖掘和決策支持系統(tǒng)的概念以及分析方法,討論了基于數(shù)據(jù)挖掘的決策支持系統(tǒng),構建了一個應用于實際的基于數(shù)據(jù)挖掘的企業(yè)管理決策支持系統(tǒng)構架。【關鍵詞】:數(shù)據(jù)挖掘;數(shù)據(jù)倉庫;決策支持系統(tǒng)前言在市場經(jīng)濟環(huán)境下,企業(yè)競爭越來越激烈,如何有效地提高企業(yè)管理水平和經(jīng)濟效益,挖掘市場潛力,是現(xiàn)代企業(yè)面對的一個重要課題。對此,企業(yè)信息化建設是提高企業(yè)管理水平的有效方法,而且企業(yè)信息化已經(jīng)從最初的簡單整合企業(yè)信息資源,發(fā)展到現(xiàn)在建立大型的企業(yè)信息數(shù)據(jù)庫,并從數(shù)據(jù)庫中發(fā)現(xiàn)知識,以提供給決策層應用,從而達到輔助企
2、業(yè)管理及決策的目的。 1.基于數(shù)據(jù)挖掘的決策支持系統(tǒng)構建 決策支持系統(tǒng)(DSS)是利用大量信息數(shù)據(jù)結合眾多模型,通過人機交互,輔助各級決策者實現(xiàn)科學決策的系統(tǒng)。該系統(tǒng)是一個融計算機技術、信息技術、人工智能、管理科學、決策科學等學科和技術于一體的技術繼承系統(tǒng)。 在企業(yè)沒有建立起決策支持系統(tǒng)前,各個部門基本上具備各自的數(shù)據(jù)信息和獨立的信息處理系統(tǒng),但是各個部門間信息不兼容,即使部門之間有交叉業(yè)務,但是由于信息不統(tǒng)一,也無法做到信息的一致性,不能有效地達到共享,造成所謂的信息孤島。即使建立了大
3、型的、集成的、信息統(tǒng)一的數(shù)據(jù)倉庫,但怎樣才能在大量的數(shù)據(jù)中發(fā)現(xiàn)有用知識呢?這就需要一個全面的解決方案,解決數(shù)據(jù)的一致性和集成性,并在這些經(jīng)過處理的數(shù)據(jù)中發(fā)現(xiàn)知識,以協(xié)助企業(yè)進行有效的決策和管理?;跀?shù)據(jù)挖掘的決策支持系統(tǒng)就是把傳統(tǒng)的決策支持系統(tǒng)和數(shù)據(jù)挖掘有機地結合在一起,通過數(shù)據(jù)挖掘技術來提高系統(tǒng)的智能性,在海量的數(shù)據(jù)中有效地提取有用數(shù)據(jù),發(fā)現(xiàn)有用知識。 決策支持系統(tǒng)由兩部分組成(見圖1.1):數(shù)據(jù)倉庫、分析系統(tǒng)(即數(shù)據(jù)挖掘方法)。 1.1 數(shù)據(jù)倉庫 數(shù)據(jù)倉庫的設計首先要滿足決策支持系統(tǒng)
4、的要求,決策支持系統(tǒng)數(shù)據(jù)庫所要求的數(shù)據(jù)要具備三方面特點:概括性、抽象性、統(tǒng)一性。所以在圖2.1中數(shù)據(jù)倉庫和部門數(shù)據(jù)庫之間還應有一個虛擬層,用來為數(shù)據(jù)倉庫提取有用數(shù)據(jù),這個層的功能實現(xiàn)由數(shù)據(jù)挖掘的數(shù)據(jù)清洗過程完成。 數(shù)據(jù)倉庫設計的關鍵是數(shù)據(jù)庫的結構設計,包括邏輯設計和物理設計。 (1) 數(shù)據(jù)庫邏輯設計 邏輯設計前需要首先建立一個涉及企業(yè)各個方面的詳細商業(yè)模型,即概念模型。概念模型是獨立于任何一種數(shù)據(jù)模型的信息結構,邏輯設計的任務就是把商業(yè)模型轉換為數(shù)據(jù)庫系統(tǒng)所支持的數(shù)據(jù)模型相符合的邏輯結構
5、。由于大多數(shù)的商用數(shù)據(jù)庫系統(tǒng)是關系型數(shù)據(jù)庫,所以邏輯設計的主要問題就是把概念模型中各個實體與實體屬性的聯(lián)系轉換為關系模式。在企業(yè)中涉及很多實體,如部門實體:人力資源部、生產(chǎn)部、財務部、市場部等等。而各個部門中還涉及部門內部的多個實體,如市場部門中涉及的實體有:客戶、客戶經(jīng)理、產(chǎn)品、訂單、銷售業(yè)績,以及城市信息等等,這些實體都有自己的屬性。 (2)數(shù)據(jù)庫物理設計 數(shù)據(jù)庫在物理設備上的存儲結構與存取方法稱為數(shù)據(jù)庫的物理結構,優(yōu)秀的物理結構設計能使數(shù)據(jù)庫上運行的各種事務響應時間小、存儲空間利用率高、事務吞吐率大。優(yōu)秀的物理設計最
6、重要的是有一個高效率的存取方法,常見的存取方法有索引存取方法、HASH存取方法等,存取方法本文不再詳細敘述。 1.2 數(shù)據(jù)挖掘方法 數(shù)據(jù)挖掘從本質上說是一種新的商業(yè)信息處理技術。數(shù)據(jù)挖掘技術把人們對數(shù)據(jù)的應用,從低層次的聯(lián)機查詢操作,提高到?jīng)Q策支持、分析預測等更高級應用上。它通過對這些數(shù)據(jù)進行微觀、中觀乃至宏觀的統(tǒng)計分析、綜合和推理,發(fā)現(xiàn)數(shù)據(jù)的關聯(lián)性、未來趨勢以及一般性的概括知識等。數(shù)據(jù)挖掘作為一門數(shù)據(jù)處理的新興技術,它具有的特征是處理海量數(shù)據(jù),并且即使這些數(shù)據(jù)是不完全的、冗余的、隨機的、復雜數(shù)據(jù)結構的、維數(shù)大的,都可以通
7、過數(shù)據(jù)清洗來選擇有用數(shù)據(jù),建立知識模型。數(shù)據(jù)挖掘是多學科交叉,涉及計算機科學、統(tǒng)計學、數(shù)學等學科的技術。 (1) 聯(lián)機分析挖掘OLAM OLAM(OnLine Analytical Mining)聯(lián)機分析挖掘的概念是OLAP(Online Analytical Processing,聯(lián)機分析處理)的發(fā)展。用戶的決策分析需要對數(shù)據(jù)庫中的數(shù)據(jù)進行大量的分析計算才能得到結果,而普通的數(shù)據(jù)處理系統(tǒng)對數(shù)據(jù)庫的簡單查詢,已經(jīng)不能滿足決策者提出的需求,因此就出現(xiàn)了多維數(shù)據(jù)庫和多維分析的概念,即OLAP。OLAP是聯(lián)機交互式數(shù)據(jù)分析一個良
8、好的框架,但是它只能處理數(shù)值型數(shù)據(jù),對決策支持系統(tǒng)來說是一個較大的局限性。 OLAM是在數(shù)據(jù)立方體上進行多層次的數(shù)據(jù)挖掘,OLAM分成若干個抽象層,每個抽象層都有各自的抽象任務。主要包括數(shù)據(jù)集層:它包括相關的數(shù)據(jù)庫和數(shù)據(jù)倉庫等,同時也是OLAM的數(shù)據(jù)源,通過數(shù)據(jù)清洗和集成,生成結構化的便于分析的數(shù)據(jù)環(huán)境。 數(shù)據(jù)立方層:形成支持OLAP和OLDM的多維數(shù)據(jù)集,它是相關數(shù)據(jù)的綜合和多維化處理,主要由數(shù)據(jù)立方和元數(shù)據(jù)集組成。 OLAP和OLDM應用層:這一層接受數(shù)據(jù)請求,通過訪問多維數(shù)據(jù)集和元
9、數(shù)據(jù),完成數(shù)據(jù)挖掘和分析。用戶接口層:承擔用戶請求的理解以及挖掘結果的解釋和表達等。 (2) 數(shù)據(jù)挖掘過程 數(shù)據(jù)庫中發(fā)現(xiàn)知識是一個有明確學習目標的需要多次反復的過程,因此數(shù)據(jù)挖掘是一個目標和數(shù)據(jù)不斷優(yōu)化的過程。 a.問題定義和數(shù)據(jù)抽取 對于多異構的數(shù)據(jù)源,需要根據(jù)源數(shù)據(jù)的結構特點進行相應的數(shù)據(jù)抽取工作。不同類型的源數(shù)據(jù),在結構上差異很大。這就需要以問題定義為基礎來界定數(shù)據(jù)抽取的原則和規(guī)則。 b.數(shù)據(jù)預處理
10、 數(shù)據(jù)預處理是對數(shù)據(jù)再加工的過程。經(jīng)過處理后,數(shù)據(jù)具有某種標準格式,可以提供給后續(xù)的數(shù)據(jù)挖掘。數(shù)據(jù)預處理的任務主要有數(shù)據(jù)清洗和數(shù)據(jù)選擇等。對于備選數(shù)據(jù)先噪聲清洗,然后根據(jù)模式要求確定數(shù)據(jù)選擇的原則和策略。選擇出滿足模式要求的數(shù)據(jù),必要時進行數(shù)據(jù)格式的轉換。 c.數(shù)據(jù)挖掘和知識庫 數(shù)據(jù)挖掘是在規(guī)格化的目標數(shù)據(jù)集中根據(jù)特定的模型和算法進行數(shù)據(jù)抽象,生成知識。它應該能反復利用獲得的知識和用戶互動,這就需要知識庫的支持,達到滿足用戶要求的知識模式。決策支持系統(tǒng)是一個多策略的挖掘系統(tǒng),所以數(shù)據(jù)挖掘包含諸如描述
11、、關聯(lián)、分類、聚類、時間序列分析以及進化和偏差分析等功能在內的數(shù)據(jù)挖掘工具。挖掘出來的中間或者最終知識存儲在知識庫中。這些知識具有不同的抽象層次、適合不同的決策層次的數(shù)據(jù)分析和決策。 2.數(shù)據(jù)挖掘決策支持系統(tǒng)在企業(yè)中的構建 數(shù)據(jù)挖掘就是從海量的數(shù)據(jù)中挖掘出可能有潛在價值的信息的技術。用于決策支持,則是提高企業(yè)在面對不斷變換的市場條件下的應變能力,以及挖掘自身潛力,增強自身競爭力的有效手段。 2.1 數(shù)據(jù)準備 完備的信息來源是決策支持系統(tǒng)的基礎,在企業(yè)中
12、商業(yè)決策需要多樣化的信息,如實時信息、歷史信息、社會信息、企業(yè)內部信息、行業(yè)信息等等。因此在整理信息的時候,需要做到全面、準確、及時。按企業(yè)信息的業(yè)務屬性,信息可以分為以下幾類: a.財務信息:主要包括效益分析所需的銷售收入與銷售支出,運營決策所需的成本、管理支出等信息,根據(jù)不同的決策對數(shù)據(jù)的需求,從企業(yè)財務信息數(shù)據(jù)庫提取。 b.銷售信息:主要包括產(chǎn)品類別、價格、業(yè)務信息、客戶、交通信息、運輸費用、銷售人員個人信息、銷售業(yè)績、貨款回收等。 c.倉儲信息:主要包括庫存量,倉庫信息、產(chǎn)品類別
13、、產(chǎn)品分類儲量、出庫信息,入庫信息、存儲時間、安全存儲量、預警存儲量、盤盈盤虧額等。 d.生產(chǎn)信息:主要包括產(chǎn)品類別、生產(chǎn)成本、原材料供應、生產(chǎn)時間、產(chǎn)品生產(chǎn)效率、歷史生產(chǎn)信息、車間信息等。 e.采購信息:主要包括合同信息、供應商、采購價格、運輸信息、歷史采購信息、應付貨款等。 f.人事信息:包括人員信息,工資信息、部門、學歷等。這些來自企業(yè)和相關行業(yè)的各個方面的大量信息,通過收集、整理、存儲在數(shù)據(jù)庫中作為原始數(shù)據(jù),這些數(shù)據(jù)是離散的、模糊的。 2.2
14、系統(tǒng)功能模塊 根據(jù)企業(yè)的關鍵部門,如財務、生產(chǎn)、銷售、倉儲、采購、人事,分析各個部門的業(yè)務決策需求,在部門信息數(shù)據(jù)的基礎上結合企業(yè)外部數(shù)據(jù),建立各部門相關的決策分析子系統(tǒng)。除了各個部門的決策分析子系統(tǒng)外,還需要建立宏觀的戰(zhàn)略分析子系統(tǒng)。 財務部門:財務分析、集團財務分析、經(jīng)營財務分析等。 生產(chǎn)部門:生產(chǎn)計劃分析、物料需求分析、成本分析、生產(chǎn)調度分析等。 銷售部門:合同分析、銷售分析、競爭對手分析、產(chǎn)品市場分析、客戶群體劃分、客戶背景分析、客戶流失分析、
15、欺詐發(fā)現(xiàn)等。 倉儲部門:庫存結構分析、庫存預警分析、庫存盤點分析、產(chǎn)品流量分析等。 采購部門:采購合同分析、供應商分析、應付款分析、采購價格變動分析、原材料市場分析等。 人事部門:人員結構分析、工資結構分析、員工負荷分析、企業(yè)人員培訓分析等。 這里的戰(zhàn)略分析子系統(tǒng)主要可以實現(xiàn)以下功能:行業(yè)吸引力分析、行業(yè)機會威脅分析、行業(yè)結構分析、客戶戰(zhàn)略分析、供應商戰(zhàn)略分析、企業(yè)競爭力分析、產(chǎn)品市場強度分析、企業(yè)經(jīng)濟效益分析、財務危機分析、人力資源戰(zhàn)略分析等。
16、60; 2.3 系統(tǒng)總架構 為了滿足企業(yè)內部不同部門的決策需求,以及企業(yè)戰(zhàn)略決策需求,決策系統(tǒng)可以根據(jù)企業(yè)的具體情況分為兩個層次,第一層為部門決策層,第二層為戰(zhàn)略決策層,整體架構如圖2.1所示。 3.結束語 基于數(shù)據(jù)挖掘的決策支持系統(tǒng)在技術上有效地解決了企業(yè)決策難以進行預測和分析的問題,從已經(jīng)投入使用的數(shù)據(jù)挖掘工具表明,數(shù)據(jù)挖掘方法給企業(yè)帶來了巨大的社會效益和經(jīng)濟效益。基于數(shù)據(jù)挖掘的決策支持系統(tǒng)是在更高層次上的系統(tǒng)整合,數(shù)據(jù)來源更廣泛,集成度更高,挖掘目標更細化和
17、抽象化,這些對用戶來說具有很大的應用價值,能給企業(yè)的管理與決策提供可靠的數(shù)據(jù)支撐,從而利于企業(yè)對市場的準備判斷,提高經(jīng)濟效益。參考文獻1. 湯九斌,基于數(shù)據(jù)挖掘技術的決策支持系統(tǒng)及其關鍵技術研究 (博士學位論文,南京理工大學)2. 孫永劍,李仁旺,基于數(shù)據(jù)挖掘的服裝決策支持系統(tǒng) (計算機工程,第31卷第16期,P194-196)3. Roiger R J, Geatzer M W. 翁敬農(nóng)譯. 數(shù)據(jù)挖掘教程. 北京: 清華大學出版社, 2003 4. Berry M J A, Linoff G S. 袁衛(wèi)譯. 數(shù)據(jù)挖掘客戶關系管理的科學與藝術. 北京:中國財政經(jīng)濟出版社, 2004 5. Fa
18、yyad U M, Piatetsky-Shapiro G. Knowledge Discovery and Data Mining :Towards a Unifying Framwork C. In: Proc. of KDD96, Menlo Park, CA:AAAI Press, 1996 6. 陳文偉.決策支持系統(tǒng)教程M.北京:清華大學出版社,2004.7. 楊善林.智能決策方法與智能決策支持系M.北京:科學出版社,2005.8. CalvaneseD,DragoneL, NardiD, etal. Enterprise modeling and Data Warehousing in
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)財務報表分析與投資價值評估咨詢合同
- 2025年大數(shù)據(jù)技術工程師考試試題及答案
- 2025年的基層治理理論與實踐考核試卷及答案
- 2025年心理健康與疾病管理職業(yè)資格考試試題及答案
- 果樹病蟲害綜合防治與綠色防控
- 【課件】命題、定理、證明 課件 2024-2025學年人教版數(shù)學七年級下冊
- 2型呼衰患者的護理查房
- 旅游車隊租賃運營管理擔保協(xié)議
- 新材料研發(fā)基地廠房轉租及科研成果轉化合同范本
- 工傷死亡賠償協(xié)議書
- 炎黃職業(yè)技術學院輔導員考試試題2024
- 馬工程《藝術學概論》
- 蘇教版小學語文第一冊電子課本
- (2024年)保安員培訓(44張)課件
- 責任成本管理(案例)
- 中醫(yī)養(yǎng)生與植物療法
- 手術機器人原理講解
- 新一代5G網(wǎng)絡-全網(wǎng)部署與優(yōu)化
- 故障測距-牽引網(wǎng)故障測距(鐵路牽引供電系統(tǒng)繼電保護)
- 前列腺癌診治新進展課件
- 廣州市輕工技師學院招聘真題
評論
0/150
提交評論