決策支持系統(tǒng)與數(shù)據(jù)挖掘課件_第1頁
決策支持系統(tǒng)與數(shù)據(jù)挖掘課件_第2頁
決策支持系統(tǒng)與數(shù)據(jù)挖掘課件_第3頁
決策支持系統(tǒng)與數(shù)據(jù)挖掘課件_第4頁
決策支持系統(tǒng)與數(shù)據(jù)挖掘課件_第5頁
已閱讀5頁,還剩129頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

決策支持系統(tǒng)與數(shù)據(jù)挖掘?yàn)闈M足設(shè)計(jì)要求,參照《室外排水設(shè)計(jì)規(guī)范》,結(jié)合表5-2,假定污水管道設(shè)計(jì)充滿度為0.5,水力坡度取最小坡度3‰,代入公式(5-5)得:決策支持系統(tǒng)與數(shù)據(jù)挖掘決策支持系統(tǒng)與數(shù)據(jù)挖掘?yàn)闈M足設(shè)計(jì)要求,參照《室外排水設(shè)計(jì)規(guī)范》,結(jié)合表5-2,假定污水管道設(shè)計(jì)充滿度為0.5,水力坡度取最小坡度3‰,代入公式(5-5)得:第3次上機(jī):設(shè)計(jì)表單(FORM)1第3次上機(jī)內(nèi)容和要求:內(nèi)容:表單設(shè)計(jì)要求:1、預(yù)習(xí)VF教材(綠皮書)的第7章表單設(shè)計(jì)2、用表單向?qū)槿龔垟?shù)據(jù)表設(shè)計(jì)表單,如P157頁圖7-153、用表單向?qū)гO(shè)計(jì)多表表單,并存放在表單設(shè)計(jì)器上修改(利用屬性表、控件等工具),要求做兩個(gè)多表表單4、做一個(gè)“歡迎使用教學(xué)管理信息系統(tǒng)”的表單。如P170頁圖7-27。決策支持系統(tǒng)與數(shù)據(jù)挖掘?yàn)闈M足設(shè)計(jì)要求,參照《室外排水設(shè)計(jì)規(guī)范決策支持系統(tǒng)與數(shù)據(jù)挖掘課件第8章決策支持系統(tǒng)與商務(wù)智能(1)

決策支持系統(tǒng)與數(shù)據(jù)挖掘第8章決策支持系統(tǒng)與商務(wù)智能(1)決策支持系統(tǒng)與數(shù)據(jù)挖掘第8章(1)決策支持和數(shù)據(jù)倉庫◆內(nèi)容提要:

▼決策支持系統(tǒng)(DSS)

▼聯(lián)機(jī)分析處理(OLAP)

▼數(shù)據(jù)倉庫和數(shù)據(jù)挖掘⊙數(shù)據(jù)倉庫在商業(yè)中的應(yīng)用★主要術(shù)語和概念★主要參考資料第8章(1)決策支持和數(shù)據(jù)倉庫◆內(nèi)容提要:數(shù)據(jù)倉庫Datawarehouse已講內(nèi)容與新內(nèi)容的關(guān)系營(yíng)銷系統(tǒng)生產(chǎn)系統(tǒng)財(cái)務(wù)系統(tǒng)人力管理決策支持系統(tǒng)DSS數(shù)據(jù)倉庫Datawarehouse人工智能AI商務(wù)智能BI計(jì)算機(jī)數(shù)據(jù)庫網(wǎng)絡(luò)7種策略TCSOAKWSMISDSSESS4種戰(zhàn)略MRPMRPIIERPSCMCRMEC數(shù)據(jù)挖掘Datamining數(shù)據(jù)倉庫已講內(nèi)容與新內(nèi)容的關(guān)系營(yíng)銷系統(tǒng)生產(chǎn)系統(tǒng)財(cái)務(wù)系統(tǒng)人力管本章內(nèi)容提要:相互關(guān)系數(shù)據(jù)倉庫OLAP決策支持系統(tǒng)數(shù)據(jù)挖掘技術(shù)人工智能商務(wù)智能本章內(nèi)容提要:相互關(guān)系數(shù)據(jù)倉庫OLAP決策支持系統(tǒng)數(shù)據(jù)挖掘技決策支持系統(tǒng)、商務(wù)智能與數(shù)據(jù)倉庫◆定義:決策支持系統(tǒng)(decisionsupportsystemDSS)為交互式計(jì)算機(jī)系統(tǒng),運(yùn)用數(shù)據(jù)、模型分析、專家知識(shí)及其他資源通過友善的人機(jī)接口互動(dòng),協(xié)助個(gè)人或團(tuán)體決策者提升半結(jié)構(gòu)化決策的績(jī)效和滿足。在IBM中,又稱為商務(wù)智能(businessintelligenceBI)?!舳x:數(shù)據(jù)倉庫(datawarehouseDW)是一種數(shù)據(jù)庫概念的延伸與推廣,以適應(yīng)決策支持需要的一種數(shù)據(jù)的集合。決策支持系統(tǒng)、商務(wù)智能與數(shù)據(jù)倉庫◆定義:決策支持系統(tǒng)(dec數(shù)據(jù)挖掘與聯(lián)機(jī)分析處理◆定義:數(shù)據(jù)挖掘(dataminingDM)是一種探索性的分析方法。(根據(jù)已經(jīng)有的數(shù)據(jù),挖掘其中的規(guī)律)◆定義:聯(lián)機(jī)分析處理(on-lineanalyticalprocessesOLAP):是一種驗(yàn)證性分析方法。(先定方法,后由數(shù)據(jù)驗(yàn)證)數(shù)據(jù)挖掘與聯(lián)機(jī)分析處理◆定義:數(shù)據(jù)挖掘(dataminin決策支持系統(tǒng)DSS決策支持系統(tǒng)(deciseionsupport決策支持系統(tǒng)DSS決策支持系統(tǒng)DSS和MIS的不同1、MIS主要為中層管理提供信息服務(wù)2、主要是通過查詢或報(bào)表進(jìn)行聯(lián)機(jī)事務(wù)處理(OLTP)3、問題:結(jié)構(gòu)化問題4、使用:5、主要技術(shù):關(guān)系數(shù)據(jù)庫的關(guān)系運(yùn)算1、DSS支持高層的決策2、主要是通過對(duì)話系統(tǒng)進(jìn)行聯(lián)機(jī)分析處理(OLAP)3、問題:半結(jié)構(gòu)化問題4、使用

歷史性數(shù)據(jù)庫5、主要技術(shù):數(shù)據(jù)挖掘:依賴性分析、聚類分析、神經(jīng)網(wǎng)絡(luò)、遺傳算法、粗糙集理論

數(shù)據(jù)庫數(shù)據(jù)倉庫DSS和MIS的不同1、MIS主要為中層管理提供1、決策支持系統(tǒng)(DSS)的半結(jié)構(gòu)化問題●決策支持系統(tǒng)(DSS)定義:為交互式計(jì)算機(jī)系統(tǒng),運(yùn)用數(shù)據(jù)、模型分析、專家知識(shí)及其他資源通過友善的人機(jī)接口互動(dòng),協(xié)助個(gè)人或團(tuán)體決策者提升半結(jié)構(gòu)化決策的績(jī)效和滿意決策。

◆給我銷售量最好的產(chǎn)品名單◆告訴我出現(xiàn)問題的地區(qū)◆告訴我為什么(向下鉆取)◆讓我看看其它數(shù)據(jù)(橫向鉆取)◆顯示最大的利潤(rùn)◆當(dāng)一個(gè)地區(qū)的銷售低于目標(biāo)時(shí),提醒我半結(jié)構(gòu)化問題:股票管理、貿(mào)易市場(chǎng)開發(fā)經(jīng)費(fèi)預(yù)算資本獲利分析等

問題決策支持系統(tǒng)(DSS)的半結(jié)構(gòu)化問題●決策支持系統(tǒng)(DSS)決策支持系統(tǒng)(DSS)的基本模式●DSS的基本模式:真實(shí)系統(tǒng)決策環(huán)境操作響應(yīng)管理者協(xié)作人員與人的行為有關(guān)的信息處理數(shù)據(jù)MIS信息外部數(shù)據(jù)問題對(duì)話系統(tǒng)數(shù)據(jù)庫系統(tǒng)模型庫方法庫知識(shí)庫DSS決策支持系統(tǒng)(DSS)的基本模式●DSS的基本模式:真決策環(huán)決策支持系統(tǒng)(DSS)的基本構(gòu)件

基本構(gòu)件人—機(jī)對(duì)話系統(tǒng):核心是人—機(jī)界面提問方式:“如果….則…..”能夠給用戶必要的提示和幫助數(shù)據(jù)庫:MIS的DB支持日常事務(wù)處理DSS的數(shù)據(jù)倉庫可以用聯(lián)機(jī)分析處理(OLAP)支持決策。方法庫:包括通用算法和標(biāo)準(zhǔn)函數(shù):排序算法、分類算法、最小生成樹算法最短路徑算法、線形規(guī)劃、整數(shù)規(guī)劃、動(dòng)態(tài)規(guī)劃、各種統(tǒng)計(jì)算法、各種組合算法等知識(shí)庫:包括知識(shí)的獲取,知識(shí)的解釋、知識(shí)的表示、知識(shí)推理、知識(shí)庫的管理和維護(hù)。DSS的知識(shí)庫使用的技術(shù)和專家系統(tǒng)與人工智能技術(shù)一致。模型庫:可以提供推理比較選擇、分析整個(gè)問題的模型,DSS是以模型驅(qū)動(dòng)的,可根據(jù)具體問題生成決策模型,輸出用于制定或估計(jì)決策.決策支持系統(tǒng)(DSS)的基本構(gòu)件基本構(gòu)件人—機(jī)對(duì)話系數(shù)據(jù)庫、數(shù)據(jù)倉庫、知識(shí)庫、方法庫數(shù)據(jù)庫:指長(zhǎng)期儲(chǔ)存在計(jì)算機(jī)內(nèi)的、有組織的、可共享的數(shù)據(jù)集合

數(shù)據(jù)倉庫:不同于數(shù)據(jù)庫。數(shù)據(jù)庫系統(tǒng)是一種通用的平臺(tái),用來管理企業(yè)的數(shù)據(jù);而數(shù)據(jù)倉庫是一種概念,在此概念下進(jìn)行的構(gòu)造過程,我們叫它數(shù)據(jù)倉庫處理。所以,數(shù)據(jù)倉庫不是花錢可以購(gòu)買的現(xiàn)成產(chǎn)品,它是一個(gè)建立的過程。知識(shí)庫(KnowledgeBase)是知識(shí)工程中結(jié)構(gòu)化,易操作,易利用,全面有組織的知識(shí)集群,是針對(duì)某一(或某些)領(lǐng)域問題求解的需要,采用某種知識(shí)表示方式在計(jì)算機(jī)存儲(chǔ)器中、組織、管理和使用的互相聯(lián)系的知識(shí)片存儲(chǔ)集合。方法庫基本數(shù)學(xué)方法統(tǒng)計(jì)方法優(yōu)化方法預(yù)測(cè)方法計(jì)劃方法金融方法計(jì)劃評(píng)審時(shí)間序列矩陣運(yùn)算線性規(guī)劃判別分析因子分析關(guān)聯(lián)分析初等函數(shù)算法插值算法擬合算法平滑算法外推算法回歸分析數(shù)據(jù)庫、數(shù)據(jù)倉庫、知識(shí)庫、方法庫數(shù)據(jù)庫:數(shù)據(jù)倉庫:不同于數(shù)據(jù)數(shù)據(jù)庫與數(shù)據(jù)倉庫數(shù)據(jù)庫與數(shù)據(jù)倉庫數(shù)據(jù)倉庫建立過程ETL

(ExtractTransformationLoad)數(shù)據(jù)加載:包括數(shù)據(jù)的抽取、清洗(DataCleaning)、轉(zhuǎn)換和加載數(shù)據(jù)倉庫建立過程ETL(ExtractTransform方法庫方法庫方法庫方法庫中的方法模塊方法庫基本數(shù)學(xué)方法統(tǒng)計(jì)方法優(yōu)化方法預(yù)測(cè)方法計(jì)劃方法金融方法計(jì)劃評(píng)審矩陣計(jì)算時(shí)間序列線性規(guī)劃判別分析因子分析二元相關(guān)分析方差分析回歸分析外推法平滑法擬合法插值法初等函數(shù)法方法庫方法庫中的方法模塊方法庫基統(tǒng)優(yōu)預(yù)計(jì)金計(jì)矩時(shí)線判因二方回方法庫的輸出報(bào)表圖形方法庫的輸出報(bào)表圖形知識(shí)庫知識(shí)庫決策支持系統(tǒng)與數(shù)據(jù)挖掘課件工程造價(jià)與管理知識(shí)庫工程造價(jià)與管理知識(shí)庫項(xiàng)目管理知識(shí)庫

項(xiàng)目管理知識(shí)庫DSSImageLibraryBrowserDSSImageLibraryBrowser影響DSS的因素(四個(gè))&影響DSS的因素(四個(gè))DSS的主要關(guān)鍵要素和決策流程DSS的主要關(guān)鍵要素(4個(gè))即影響DSS結(jié)果的因素:1、環(huán)境(如環(huán)境的壓力、主管的支持、權(quán)力和政治結(jié)構(gòu)等)2、任務(wù):決策的工作項(xiàng)目3、使用者:使用者的認(rèn)知方式、動(dòng)機(jī)、期望、使用方式4、DSS系統(tǒng):系統(tǒng)設(shè)計(jì)的質(zhì)量、推動(dòng)和導(dǎo)人策略等問題認(rèn)知情報(bào)搜集方案設(shè)計(jì)選擇方案推動(dòng)結(jié)果決策的流程:西蒙的決策過程DSS的主要關(guān)鍵要素和決策流程DSS的主要關(guān)鍵要素(4個(gè))問DSSLiftoffInFlightDSSLiftoffInFlightCLIME-DSS-2.CLIME-DSS-2.Leicester(英國(guó)累斯特),DSS(STScI/AURUA)

Leicester(英國(guó)累斯特),DSS(STScI/A

商務(wù)DSS系統(tǒng)

商務(wù)DSS系統(tǒng)

決策支持系統(tǒng)(DSS)的發(fā)展趨勢(shì)決策支持系統(tǒng)發(fā)展趨勢(shì)決策支持系統(tǒng)(DSS)的發(fā)展趨勢(shì)決策支持系統(tǒng)發(fā)展趨勢(shì)決策支持系統(tǒng)(DSS)的發(fā)展趨勢(shì)1、智能決策支持系統(tǒng)(IDSS):人—機(jī)接口(對(duì)話機(jī))自然語言處理系統(tǒng)問題處理系統(tǒng)模型庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)方法庫管理系統(tǒng)知識(shí)庫管理系統(tǒng)推理機(jī)模型庫數(shù)據(jù)庫方法庫知識(shí)庫用戶決策支持系統(tǒng)(DSS)的發(fā)展趨勢(shì)1、智能決策支持系統(tǒng)(IDS企業(yè)智能決策支持系統(tǒng)架構(gòu)圖企業(yè)智能決策支持系統(tǒng)架構(gòu)圖IDSS智能決策支持系統(tǒng)IDSS智能決策支持系統(tǒng)決策支持系統(tǒng)(DSS)的發(fā)展趨勢(shì)2、群體決策支持系統(tǒng)(GDSS)決策室大屏幕大屏幕大屏幕遠(yuǎn)程電信會(huì)議遠(yuǎn)程決策決策局網(wǎng)決策支持系統(tǒng)(DSS)的發(fā)展趨勢(shì)2、群體決策支持系統(tǒng)(GDS群體決策支持GDSS的類型及相互關(guān)系群組決策支持系統(tǒng)(GDSS)就是由DSS演化來的。包括:計(jì)算機(jī)輔助協(xié)同工作(CSCW)群組決策支持系統(tǒng)(GDSS)電子會(huì)議系統(tǒng)(EMS)它們之間的關(guān)系如圖:

GDSS專家Delphi法線上投票多目標(biāo)決策

EMS電子會(huì)議線上討論

CSCW共同編輯協(xié)同設(shè)計(jì)群體決策支持GDSS的類型及相互關(guān)系群組決策支持系統(tǒng)(GDSGDSS群體決策支持系統(tǒng)GDSS群體決策支持系統(tǒng)theGDSStools,wordprocessingtheGDSStools,wordprocessin聯(lián)機(jī)分析處理OLAP聯(lián)機(jī)分析處理(on-lineanalytical聯(lián)機(jī)分析處理OLAP聯(lián)機(jī)分析處理●OLAP技術(shù)是與數(shù)據(jù)倉庫技術(shù)相伴發(fā)展起來的,1993年,“關(guān)系數(shù)據(jù)庫”之父E。F。Codd首次提出了OLAP的概念,專門支持復(fù)雜的分析操作?!馩LAP的主要特征是能夠提供數(shù)據(jù)的多維概念視圖。多維信息被抽象為立方體,它包括維和度量值,維是我們說的觀察角度,度量值是我們關(guān)心的指標(biāo)值。可以使用戶從多角度、多側(cè)面、多層次直觀地考察數(shù)據(jù)倉庫中數(shù)據(jù),深入理解數(shù)據(jù)中的信息和內(nèi)含。●OLAP技術(shù)是與數(shù)據(jù)倉庫技術(shù)相伴發(fā)展起來的,1993年,“基本概念聯(lián)鎖商店的銷售金額(主題)的維1、按時(shí)間角度分析、統(tǒng)計(jì)其銷售金額(季度)2、按不同商品角度分析統(tǒng)計(jì)的銷售金額。(產(chǎn)品)3、按聯(lián)鎖商店不同地域分析統(tǒng)計(jì)的銷售金額(地域)觀察角度稱為“維”,觀察深度稱為“層”。一個(gè)維中可以允許有若干層。NO1NO2NO3ALL一二三四all(季)

TVPCVCDALL產(chǎn)品商店基本概念聯(lián)鎖商店的銷售金額(主題)的維NO1一二三四什么是聯(lián)機(jī)分析處理(OLAP)●什么是聯(lián)機(jī)分析處理(OLAP)

OLAP是一種驗(yàn)證性分析軟件,它具有歸納的作用。它將數(shù)據(jù)倉庫中的數(shù)據(jù)作為分析對(duì)象,通過多種復(fù)雜操作,可以對(duì)高層管理人員提供有力的決策支持。它可以滿足分析人員的要求,進(jìn)行快速靈活地大數(shù)據(jù)量復(fù)雜的操作處理。并且以一種直觀、易懂的形式將結(jié)果展示給決策人員。什么是聯(lián)機(jī)分析處理(OLAP)●什么是聯(lián)機(jī)分析處理(OLAPOLAP與OLTP的比較比較項(xiàng)目OLAP(聯(lián)機(jī)分析處理)OLTP(聯(lián)機(jī)事務(wù)處理)應(yīng)用基礎(chǔ)數(shù)據(jù)倉庫DBMS用戶決策者(高層管理)一般操作者(低、中)目的為決策提供支持為日常工作服務(wù)數(shù)據(jù)特征導(dǎo)出數(shù)據(jù)原始數(shù)據(jù)數(shù)據(jù)細(xì)節(jié)綜合數(shù)據(jù)細(xì)節(jié)程度低細(xì)節(jié)程度高時(shí)間特征歷史數(shù)據(jù),一個(gè)時(shí)段當(dāng)前數(shù)據(jù)數(shù)據(jù)量需求一次處理需大量數(shù)據(jù)一次處理需少量數(shù)據(jù)OLAP與OLTP的比較比較項(xiàng)目OLAP(聯(lián)機(jī)分析處理)OLCreateOLAP

CreateOLAPNETOLAPcontrol界面NETOLAPcontrol界面簡(jiǎn)單聯(lián)機(jī)分析軸側(cè)圖結(jié)果簡(jiǎn)單聯(lián)機(jī)分析軸側(cè)圖結(jié)果OLAP的分析結(jié)果OLAP的分析結(jié)果AnalyzerOLAP

AnalyzerOLAPOLAPExample1OLAPExample1OLAPMarket分析OLAPMarket分析什么是聯(lián)機(jī)分析處理(OLAP)2、OLAP試測(cè)環(huán)境構(gòu)建的4個(gè)過程:OLAP主題OLAP概念模型----星形、雪花、星座模型OLAP邏輯模型-----多維數(shù)據(jù)模型OLAP物理模型------ROLAP/MOLAP什么是聯(lián)機(jī)分析處理(OLAP)2、OLAP試測(cè)環(huán)境構(gòu)建的4個(gè)OLAP聯(lián)機(jī)分析概念模型OLAP概念模型:星型、雪花型、OLAP聯(lián)機(jī)分析概念模型OLAP概念模型:基本概念聯(lián)鎖商店的銷售金額(主題)的維度1、按時(shí)間角度分析、統(tǒng)計(jì)其銷售金額(季度)2、按不同商品角度分析統(tǒng)計(jì)的銷售金額。(產(chǎn)品)3、按聯(lián)鎖商店不同地域分析統(tǒng)計(jì)的銷售金額(地域)觀察深度稱為“層”。一個(gè)維中可以允許有若干層。NO1NO2NO3ALL一二三四all(季)

TVPCVCDALL產(chǎn)品商店基本概念聯(lián)鎖商店的銷售金額(主題)的維度NO1一二三四OLAPvsOLAPvs聯(lián)機(jī)分析處理的基本數(shù)據(jù)模型●OLAP的基本概念模型:1、星型模型(starschema)星型模型的主體是事實(shí)表(如:銷售表)其主要事實(shí)稱為量或度量(如:銷售金額),另一種表稱為維表,用以建立多維結(jié)構(gòu)中的維值,一般有一個(gè)事實(shí)表和n個(gè)維表。在維表中給出取值條件,在事實(shí)表中獲得值的結(jié)果。商店標(biāo)識(shí)符產(chǎn)品標(biāo)識(shí)符日期標(biāo)識(shí)符單價(jià)金額日期標(biāo)識(shí)符日月季年產(chǎn)品標(biāo)識(shí)符產(chǎn)品名類名大類名現(xiàn)存貨物日期表(維表)銷售表(事實(shí)表)商店表(維表)商店標(biāo)識(shí)符商店名市名省名國(guó)名洲名產(chǎn)品表(維表)實(shí)例聯(lián)機(jī)分析處理的基本數(shù)據(jù)模型●OLAP的基本概念模型:商店標(biāo)識(shí)聯(lián)機(jī)分析處理的基本數(shù)據(jù)模型2、雪花模式很多情況維呈現(xiàn)層次狀,即具有一定深度。就成為雪花模式。商店標(biāo)識(shí)符商店名市標(biāo)識(shí)符產(chǎn)品標(biāo)識(shí)符類標(biāo)識(shí)符產(chǎn)品名現(xiàn)存貨物商店標(biāo)識(shí)符產(chǎn)品標(biāo)識(shí)符日期標(biāo)識(shí)符單價(jià)犧牲金額日期標(biāo)識(shí)符月標(biāo)識(shí)符月年標(biāo)識(shí)符季標(biāo)識(shí)符年標(biāo)識(shí)符季月標(biāo)識(shí)符季標(biāo)識(shí)符月類標(biāo)識(shí)符大類標(biāo)識(shí)符類名國(guó)標(biāo)識(shí)符國(guó)名洲標(biāo)識(shí)符省標(biāo)識(shí)符省名國(guó)標(biāo)識(shí)符市標(biāo)識(shí)符市名省標(biāo)識(shí)符大類標(biāo)識(shí)符大類名洲標(biāo)識(shí)符洲名銷售表(事實(shí)表)產(chǎn)品表類表洲表大類表商店表市表省表國(guó)表年表日期表月表季表聯(lián)機(jī)分析處理的基本數(shù)據(jù)模型2、雪花模式商店標(biāo)識(shí)符商店聯(lián)機(jī)分析處理的基本數(shù)據(jù)模型3、星座模式通過共享維,將多個(gè)星型模式連接在一起,構(gòu)成星座模式。產(chǎn)品標(biāo)識(shí)符產(chǎn)品名類名大類名現(xiàn)存貨物日期標(biāo)識(shí)符日月季年商店標(biāo)識(shí)符產(chǎn)品標(biāo)識(shí)符日期標(biāo)識(shí)符單價(jià)犧牲金額商店標(biāo)識(shí)符商店名市名省名國(guó)名洲名產(chǎn)品標(biāo)識(shí)符日期標(biāo)識(shí)符供應(yīng)商標(biāo)識(shí)單價(jià)數(shù)量金額供應(yīng)商標(biāo)識(shí)符供應(yīng)商名市名省名國(guó)名洲名事實(shí)表聯(lián)機(jī)分析處理的基本數(shù)據(jù)模型3、星座模式產(chǎn)品標(biāo)識(shí)符產(chǎn)案例銀行交易分析案例銀行交易分析機(jī)構(gòu)表聯(lián)機(jī)分析處理的實(shí)例:銀行交易分析●OLAP的操作實(shí)例(如:銀行交易分析)1、雪花模型:帳號(hào)ID統(tǒng)計(jì)日期機(jī)構(gòu)代號(hào)發(fā)生金額發(fā)生筆數(shù)帳號(hào)ID帳戶類名稱科目名稱帳戶名稱日期ID月ID日月ID年ID月年ID年省行代號(hào)ID省行名時(shí)間表帳戶表帳戶交易事實(shí)表交易分析雪花模型OLAP的邏輯模型是四維數(shù)據(jù)模型,它的多維數(shù)組形式為(時(shí)間,帳號(hào),機(jī)構(gòu),發(fā)生金額與筆數(shù))如(2019年1月15日,4321567,工行漢口分理處,360萬元,567筆)聯(lián)機(jī)分析處理的實(shí)例:銀行交易分析●OLAP的操作實(shí)例(如聯(lián)機(jī)分析處理的實(shí)例:銀行交易分析2、銀行交易量分析:年季月發(fā)生額2019q1119779862903。302019q1210791201958。282019q1318749783281。052019q2419138629532。602019q2517192112346。632019q2620601215354。17年季月發(fā)生筆數(shù)2019q1181,7622019q1253,9652019q1385,3682019q2479,3962019q2568,3342019q26124,123發(fā)生金額發(fā)生筆數(shù)聯(lián)機(jī)分析處理的實(shí)例:銀行交易分析2、銀行交易量分析:年季月發(fā)案例分析結(jié)果●發(fā)現(xiàn)2月份交易額萎縮,1月和4月進(jìn)出資金量較大,但交易筆數(shù)相對(duì)比較小。這表明客戶進(jìn)行大筆資金調(diào)度,進(jìn)一步對(duì)帳戶做切片操作,最終可以將進(jìn)行大筆資金調(diào)度的客戶鎖定。案例分析結(jié)果●發(fā)現(xiàn)2月份交易額萎縮,1月和4月進(jìn)出資金量較大邏輯模型邏輯模型聯(lián)機(jī)分析處理的基本概念●基本概念:1、對(duì)象(Object)

關(guān)注和聚焦的分析客體稱為對(duì)象。如:聯(lián)鎖商店的銷售金額。2、維(dimension)對(duì)對(duì)象的觀察角度稱為“維”。如在聯(lián)鎖商店的銷售金額可以有三維:時(shí)間維:按時(shí)間角度分析、統(tǒng)計(jì)其銷售金額。商品維:按不同商品角度分析統(tǒng)計(jì)的銷售金額。地域維:按聯(lián)鎖商店不同地域分析統(tǒng)計(jì)的銷售金額。3、層(layer)

觀察深度稱為“層”。一個(gè)維中可以允許有若干層。如:在聯(lián)鎖商店的

時(shí)間維可以有日、旬、月、季、年等層

商品維可以有商品類(如家電類)商品大類(如電氣產(chǎn)品大類)等

地域維可以有市、省、國(guó)、洲等聯(lián)機(jī)分析處理的基本概念●基本概念:聯(lián)機(jī)分析處理的多維數(shù)據(jù)模型(邏輯模型)OLAP的多維結(jié)構(gòu)多維結(jié)構(gòu)由多個(gè)維組成,當(dāng)每個(gè)維確定一個(gè)取值時(shí),即可獲得一個(gè)多維結(jié)構(gòu)中的變量。這個(gè)變量稱為數(shù)據(jù)單元,或單元。(cell)這種表示方式稱為多維數(shù)組。也稱為數(shù)據(jù)立方體。(如:產(chǎn)品維成員:vcd;日期維成員:2019年3月19日;商店維成員:NO。1)

商店NO1NO2NO3ALL一二三四all(季)

TVPCVCDALL產(chǎn)品多維結(jié)構(gòu)的操作:1、切片2、切塊3、旋轉(zhuǎn)4、鉆探(下鉆如地域時(shí)間和上探(反方向))聯(lián)機(jī)分析處理的多維數(shù)據(jù)模型(邏輯模型)OLAP的多維結(jié)構(gòu)數(shù)據(jù)倉庫的操作(下鉆、上卷)數(shù)據(jù)倉庫的操作(下鉆、上卷)WiththeOracleOLAPdatamodelWiththeOracleOLAPdatamodeRelationshipsbetweencommonOLAP

RelationshipsbetweencommonOOracleOLAP

OracleOLAPSAPOLAP

SAPOLAPMSSQLServer2019的功能:分析服務(wù)MSSQLServer2019的功能:分析服務(wù)數(shù)據(jù)倉庫DW與數(shù)據(jù)挖掘DM數(shù)據(jù)倉庫與數(shù)據(jù)挖掘(datawarehouse數(shù)據(jù)倉庫DW與數(shù)據(jù)挖掘DM數(shù)據(jù)倉庫與數(shù)據(jù)挖掘數(shù)據(jù)倉庫數(shù)據(jù)倉庫數(shù)據(jù)倉庫數(shù)據(jù)倉庫引論◆數(shù)據(jù)倉庫(datawarehouse)在1988年Devlin和Murphy發(fā)表了首篇數(shù)據(jù)倉庫的論文,在1993年,由WilliamH.Inmon所寫的《BuildingtheDataWarehouse》首次系統(tǒng)地闡述了數(shù)據(jù)倉庫的思想和理論。◆知識(shí)發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase

KDD)在1989年8月第11屆國(guó)際人工智能聯(lián)合會(huì)議的專題研討會(huì)上,首次提出基于數(shù)據(jù)庫的知識(shí)發(fā)現(xiàn)技術(shù)?!魯?shù)據(jù)挖掘(DataMiningDM)在2019年,在美國(guó)計(jì)算機(jī)年會(huì)(ACM)上,首次提出數(shù)據(jù)挖掘的概念。數(shù)據(jù)挖掘是KDD過程中最為關(guān)鍵的步驟,在實(shí)際使用中兩個(gè)術(shù)語的應(yīng)用往往不加區(qū)別。引論◆數(shù)據(jù)倉庫(datawarehouse)在1988年D數(shù)據(jù)倉庫●定義:數(shù)據(jù)倉庫是一個(gè)面向主題的,集成的,隨時(shí)間變化的非易失性數(shù)據(jù)的集合,用于支持管理層的決策過程?!駭?shù)據(jù)倉庫的特性:1、面向主題性(創(chuàng)建和使用都圍繞主題:產(chǎn)品、客戶等)2、數(shù)據(jù)集成性(從業(yè)務(wù)處理系統(tǒng)獲取,如:OLTP、EC等,要經(jīng)過數(shù)據(jù)預(yù)處理:挑選、清理、綜合)3、數(shù)據(jù)的時(shí)變性(數(shù)據(jù)不能長(zhǎng)期不變)4、數(shù)據(jù)的非易失性(數(shù)據(jù)不能更改)5、數(shù)據(jù)的集合性(多維數(shù)據(jù)庫方式進(jìn)行存儲(chǔ)的多維模式)6、支持決策作用(根本的目的是對(duì)決策的支持,以便提高管理決策的質(zhì)量和效果)數(shù)據(jù)倉庫●定義:數(shù)據(jù)倉庫是一個(gè)面向主題的,集成的,隨時(shí)間變化清洗操作,最后加載到數(shù)據(jù)倉庫中數(shù)據(jù)準(zhǔn)備清洗操作,最后加載到數(shù)據(jù)倉庫中數(shù)據(jù)數(shù)據(jù)倉庫與數(shù)據(jù)集市數(shù)據(jù)倉庫與數(shù)據(jù)集市決策分析與多維分析、數(shù)據(jù)挖掘等的關(guān)系數(shù)據(jù)庫數(shù)據(jù)倉庫決策分析數(shù)據(jù)挖掘關(guān)系數(shù)據(jù)模型多維數(shù)據(jù)模型關(guān)系型分析多維分析決策分析與多維分析、數(shù)據(jù)挖掘等的關(guān)系數(shù)據(jù)庫數(shù)據(jù)倉庫決策分析數(shù)以數(shù)據(jù)倉庫為基礎(chǔ)的電子商務(wù)架構(gòu)以數(shù)據(jù)倉庫為基礎(chǔ)的電子商務(wù)架構(gòu)數(shù)據(jù)倉庫典型產(chǎn)品簡(jiǎn)介公司產(chǎn)品管理數(shù)據(jù)抽取建模OLAP數(shù)據(jù)挖掘數(shù)據(jù)展示接口OracleOraclev9。i√√強(qiáng)√良好√強(qiáng)MSSQLServer√√√強(qiáng)√強(qiáng)√SASSAS√√√強(qiáng)特色√√BusinessObjectBusinessObject√√√√√√√BrioBrio√√√√√√√CrystalDecisionsCrystal√√青大海威HIGHWAY√√√強(qiáng)√強(qiáng)√參考:徐潔磐《數(shù)據(jù)倉庫與決策支持系統(tǒng)》科學(xué)出版社P—192~224數(shù)據(jù)倉庫典型產(chǎn)品簡(jiǎn)介公司產(chǎn)品管理數(shù)據(jù)抽取建模OLAP數(shù)據(jù)挖數(shù)據(jù)倉庫市場(chǎng)保持了良好的增長(zhǎng)數(shù)據(jù)倉庫市場(chǎng)保持了良好的增長(zhǎng)數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)什么是數(shù)據(jù)挖掘(DM)●什么是數(shù)據(jù)挖掘(datamining)從數(shù)據(jù)倉庫中利用知識(shí)發(fā)現(xiàn)技術(shù)(如:依賴性分析、聚類分析、基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘技術(shù)、基于遺傳算法的數(shù)據(jù)挖掘技術(shù)、基于粗糙集的數(shù)據(jù)挖掘技術(shù)等)尋求商業(yè)模式?!駭?shù)據(jù)挖掘的目標(biāo):1、找到更好的顧客2、增加市場(chǎng)分額和獲取更高利潤(rùn)3、了解顧客的全面關(guān)系,制定定價(jià)策略和產(chǎn)品包裝方式。4、分辨顧客的生命期信息5、分析購(gòu)賣行為和促銷反映,增加促銷效益。

什么是數(shù)據(jù)挖掘(DM)●什么是數(shù)據(jù)挖掘(dataminin什么是數(shù)據(jù)知識(shí)發(fā)現(xiàn)(KDD)●數(shù)據(jù)知識(shí)發(fā)現(xiàn)(knowledgediscoverydatabaseKDD)

2019年fayyad的定義:知識(shí)發(fā)現(xiàn)是從數(shù)據(jù)集中識(shí)別有效模式的非平凡過程,該模式是新穎的,有潛在應(yīng)用價(jià)值的和最終可以理解的。

數(shù)據(jù)挖掘是知識(shí)發(fā)現(xiàn)的關(guān)鍵過程。商務(wù)智能中的KDD過程:數(shù)據(jù)目標(biāo)數(shù)據(jù)預(yù)處理后數(shù)據(jù)轉(zhuǎn)化后數(shù)據(jù)商務(wù)智能模式數(shù)據(jù)選擇預(yù)處理數(shù)據(jù)轉(zhuǎn)化數(shù)據(jù)挖掘解釋/評(píng)價(jià)什么是數(shù)據(jù)知識(shí)發(fā)現(xiàn)(KDD)●數(shù)據(jù)知識(shí)發(fā)現(xiàn)(knowledg數(shù)據(jù)挖掘的14種算法關(guān)聯(lián)規(guī)則分類分析聚類分析APRIoRI算法回歸分析差異分析劃分法層次法基于密度方法基于網(wǎng)格方法決策樹算法粗集算法人工神經(jīng)網(wǎng)絡(luò)貝葉斯方法遺傳算法數(shù)據(jù)挖掘的14種算法關(guān)聯(lián)規(guī)則分類分析聚類分析A回差劃層基基決數(shù)據(jù)挖掘的主要技術(shù)(算法)內(nèi)容數(shù)據(jù)挖掘主要技術(shù)1、描述(歸納)2、分類預(yù)測(cè)3、聚類分析4、關(guān)聯(lián)分析5、依賴性分析6、粗糙集7、模糊技術(shù)MSSQLServer2019的數(shù)據(jù)挖掘算法:1、貝葉斯算法2、決策樹算法3、時(shí)序算法4、聚類算法5、序列聚類算法6、關(guān)聯(lián)規(guī)則算法7、神經(jīng)網(wǎng)絡(luò)算法8、文本挖掘技術(shù)數(shù)據(jù)挖掘的主要技術(shù)(算法)內(nèi)容數(shù)據(jù)挖掘主要技術(shù)MSSQL數(shù)據(jù)挖掘數(shù)據(jù)挖掘數(shù)據(jù)挖掘的方法數(shù)據(jù)挖掘的方法數(shù)據(jù)挖掘的方法數(shù)據(jù)挖掘的方法四類重要的數(shù)據(jù)挖掘方法聚類分析關(guān)聯(lián)分析異常檢測(cè)預(yù)測(cè)建模四類重要的數(shù)據(jù)挖掘方法聚類分析關(guān)聯(lián)分析異常檢測(cè)預(yù)測(cè)建模數(shù)據(jù)挖掘技術(shù)(DM)1、分類和預(yù)測(cè):

分類在機(jī)器學(xué)習(xí)中稱為模式識(shí)別,分類技術(shù)包括統(tǒng)計(jì)方法(logistic回歸、線形判別、二次判別、費(fèi)歇爾判別)k—近鄰分類、決策樹分類、基于關(guān)聯(lián)規(guī)則的分類、貝葉斯分類、神經(jīng)元網(wǎng)絡(luò)分類、支持向量機(jī)分類

預(yù)測(cè)是對(duì)業(yè)務(wù)信息所代表的對(duì)象的顯著性區(qū)別,對(duì)對(duì)象的區(qū)別對(duì)待,進(jìn)而達(dá)到控制成本或者提高效率。數(shù)據(jù)挖掘技術(shù)(DM)1、分類和預(yù)測(cè):數(shù)據(jù)挖掘技術(shù):預(yù)測(cè)方法1、預(yù)測(cè)方法數(shù)據(jù)挖掘技術(shù):預(yù)測(cè)方法1、預(yù)測(cè)方法聚類分析2、聚類分析是多元分析的一種,也是非監(jiān)督模式的一個(gè)重要分支。它把一個(gè)沒有類別標(biāo)記的樣本集,按某種準(zhǔn)則劃分成若干個(gè)子集(類),使相似的樣本盡可能歸為一類,而不相似的樣本盡量劃分到不同的類中。傳統(tǒng)的聚類分析是一種硬劃分,它把每個(gè)待劃分的對(duì)象嚴(yán)格地劃分到某類中,具有非此即彼的性質(zhì)。而實(shí)際上大多數(shù)對(duì)象并沒有嚴(yán)格的屬性,它們?cè)谛詰B(tài)和類屬方面存在著中介性。具有亦此亦彼的性質(zhì),因此適合進(jìn)行軟劃分。分類算法將數(shù)據(jù)按含義劃分成組,用戶可以用此算法生成側(cè)面,例如:感興趣的顧客側(cè)面。一些常見的聚類算法包括:模式識(shí)別、側(cè)面生成、線形聚族和概念聚族。

聚類分析2、聚類分析數(shù)據(jù)挖掘技術(shù)(DM)聚類分析:是將一個(gè)數(shù)據(jù)集合按照某個(gè)標(biāo)準(zhǔn)分成幾個(gè)簇。分類聚類收入債務(wù)貸款不貸款收入債務(wù)123分類數(shù)據(jù)挖掘技術(shù)(DM)聚類分析:是將一個(gè)數(shù)據(jù)集合按照某個(gè)標(biāo)準(zhǔn)分蛋白質(zhì)的聚類分析蛋白質(zhì)的聚類分析SPSS數(shù)據(jù)挖掘方法-聚類分析

SPSS數(shù)據(jù)挖掘方法-聚類分析關(guān)聯(lián)規(guī)則4、關(guān)聯(lián)規(guī)則挖掘:

對(duì)不同類型之間的相互關(guān)系分析其潛在的邏輯規(guī)律,為業(yè)務(wù)運(yùn)作提供決策支持。是在給定的事務(wù)數(shù)據(jù)庫中找出最小支持度和最小置信度的規(guī)則如:x→y關(guān)聯(lián)規(guī)則4、關(guān)聯(lián)規(guī)則挖掘:數(shù)據(jù)挖掘軟件SPSS(貝葉斯網(wǎng)絡(luò))數(shù)據(jù)挖掘軟件SPSS(貝葉斯網(wǎng)絡(luò))數(shù)據(jù)挖掘技術(shù):邏輯斯蒂回歸數(shù)據(jù)挖掘技術(shù):邏輯斯蒂回歸數(shù)據(jù)挖掘技術(shù)(DM)3、依賴性分析:1、基本概念:

◆規(guī)則:一般形式為“IF條件成立,THEN結(jié)論”。通過關(guān)聯(lián)規(guī)則,可以發(fā)現(xiàn)這三種規(guī)則:有用的、價(jià)值不高的、費(fèi)解的。

價(jià)值不高的規(guī)則往往是對(duì)一些商業(yè)領(lǐng)域內(nèi)眾所周知的規(guī)則的重現(xiàn)。如:今天是情人節(jié),那么鮮花的價(jià)格肯定會(huì)暴漲。

費(fèi)解的規(guī)則往往是數(shù)據(jù)中一些偶然的東西。如:有一天某個(gè)超市發(fā)現(xiàn)購(gòu)買消暑商品的顧客增加,但是只有這一天特別突出,前后消量趨于平常。

有用的規(guī)則多是那些“潛在的,別人沒有發(fā)現(xiàn)的也沒有廣泛運(yùn)用在商業(yè)中的規(guī)則”如:尿布與啤酒之間的依賴性數(shù)據(jù)挖掘技術(shù)(DM)3、依賴性分析:依賴性分析原理依賴性分析原理:

依賴性分析算法在數(shù)據(jù)倉庫的條目或?qū)ο笾g抽取依賴性.利用依賴性分析算法可以從某一對(duì)象的信息來推斷另一數(shù)據(jù)對(duì)象的信息.一組依賴性可以表示為依賴圖.人們利用依賴性分析是為了解變動(dòng),并了解變動(dòng)發(fā)生的可能原因.如:

銷后服務(wù)對(duì)產(chǎn)品銷售的影響.依賴性分析原理依賴性分析原理:依賴性分析◆支持度:如果88%的顧客購(gòu)買了商品A,就說商品A的支持度為0。88即suport=0。88◆最小支持度:

如果某種規(guī)則發(fā)生的概率低于指定的最小支持度(minsupport),則我們可以不考慮這種規(guī)則。P(A→B)>minsupport最小支持度用來去除可能性很小的規(guī)則,也就是費(fèi)解的規(guī)則依賴性分析◆支持度:如果88%的顧客購(gòu)買了商品A,就說商品A數(shù)據(jù)挖掘技術(shù)(DM)◆最小置信度:

P(AB)

>minconfidence

P(A)

如果某個(gè)規(guī)則成立的概率很小,則這個(gè)規(guī)則沒有什么用途。因?yàn)檫@兩件事物的聯(lián)系很小。事實(shí)上只有高于最小支持度并且高于最小可信度的規(guī)則才被保留。

收入成本其他服務(wù)存貨服務(wù)產(chǎn)品顧客依賴性分析圖數(shù)據(jù)挖掘技術(shù)(DM)◆最小置信度:收入成本其他服務(wù)存貨服務(wù)產(chǎn)依賴性分析案例“尿布與啤酒的依賴”

◆可信度:

confidence=P(條件和結(jié)論)P(條件)例如在超市中,A,B,C商品的購(gòu)買率如右表所示,我們定義如下規(guī)則:

IFBTHENA,則它的可信度是:P(AandBandC)P(BandC)=5%/15%=0。33

元組(商品)購(gòu)買概率A45%B42.5%C40%A和B25%A和C20%B和C15%A和B和C5%依賴性分析案例“尿布與啤酒的依賴”◆可信度:依賴性分析案例“尿布與啤酒的依賴”序號(hào)顧客商品名稱時(shí)間1tom啤酒尿布香煙2000/1/12john啤酒可樂尿布2000/1/23kate啤酒罐頭衛(wèi)生巾2000/1/34benny啤酒尿布衛(wèi)生巾2000/1/4產(chǎn)品1產(chǎn)品2置信度啤酒尿布0.75啤酒衛(wèi)生巾0.5尿布啤酒0.75衛(wèi)生巾啤酒0.5支持度=同時(shí)購(gòu)買啤酒和尿布的銷售次數(shù)總銷售次數(shù)置信度:大于40%置信度的情況大于60%支持度的情況產(chǎn)品1產(chǎn)品2置信度支持度啤酒尿布0.750.75尿布啤酒0.751衛(wèi)生巾啤酒0.51依賴性分析案例“尿布與啤酒的依賴”序號(hào)顧客商品名稱香港大型商業(yè)中心對(duì)交通的依賴性分析

香港大型商業(yè)中心對(duì)交通的依賴性分析城市對(duì)房地產(chǎn)業(yè)的依賴性比較城市對(duì)房地產(chǎn)業(yè)的依賴性比較依賴性分析軟件依賴性分析軟件粗糙集(roughset)技術(shù)4、粗糙集(roughset)理論是一種研究不精確、不確定性的數(shù)學(xué)工具,由波蘭數(shù)學(xué)家Z。Pawlak在1982年首先提出,1991年他的《粗糙集合》專著出版。在粗糙集理論中,知識(shí)這個(gè)概念被視為一種分類能力,通過分類將差異不大的個(gè)體劃分為一類,它們之間構(gòu)成一種不可分辨關(guān)系,又被稱為不可分辨劃分。它正是將這種劃分后的每一類作為研究對(duì)象,研究其某一概念的肯定支持,或肯定不支持,或可能支持(也可能不支持)的程度,并用粗糙隸屬函數(shù)加以定量描述。

粗糙集(roughset)技術(shù)4、粗糙集(roughse粗糙集(roughset)技術(shù)●應(yīng)用粗糙集合進(jìn)行數(shù)據(jù)挖掘:數(shù)據(jù)挖掘研究的實(shí)施對(duì)象多為關(guān)系數(shù)據(jù)庫,關(guān)系表可被看作是粗糙集理論中的決策表(也稱為信息表)這給粗糙集方法的應(yīng)用帶來極大的方便?,F(xiàn)實(shí)世界中的規(guī)則有確定性的,也有不確定性的,從數(shù)據(jù)庫中發(fā)現(xiàn)不確定的知識(shí),為粗糙集方法的用武之地。運(yùn)用粗糙集方法得到的知識(shí)發(fā)現(xiàn)算法可以極大地提高效率。所以在知識(shí)獲取、機(jī)器學(xué)習(xí)、規(guī)則生成、決策分析、智能控制等領(lǐng)域獲得了廣泛應(yīng)用。在科研、金融、天文、醫(yī)療等領(lǐng)域龐大數(shù)據(jù)的發(fā)掘中,可以發(fā)現(xiàn)隱含在數(shù)據(jù)中的許多有價(jià)值的知識(shí)。粗糙集(roughset)技術(shù)●應(yīng)用粗糙集合進(jìn)行數(shù)據(jù)挖掘:基于粗糙集理論的知識(shí)獲取系統(tǒng)基于粗糙集理論的知識(shí)獲取系統(tǒng)模糊技術(shù)5、模糊技術(shù):

扎德提出的模糊集合論為模糊信息的描述和處理提供了數(shù)學(xué)基礎(chǔ)。模糊集合是傳統(tǒng)集合的擴(kuò)展。模糊集合的隸屬函數(shù)的值域?yàn)閇0,1],當(dāng)模糊集合的隸屬函數(shù)的值域?yàn)閇1,1]時(shí),該模糊集合就退化為傳統(tǒng)的集合。

在對(duì)數(shù)據(jù)源進(jìn)行挖掘分析時(shí),可為指定的屬性引人模糊概念,使用模糊集的方法用隸屬度對(duì)屬性值進(jìn)行轉(zhuǎn)換,使數(shù)據(jù)源中的屬性值便于人們的理解和計(jì)算機(jī)分析處理。為每個(gè)屬性引人一個(gè)模糊概念

模糊技術(shù)5、模糊技術(shù):模糊技術(shù)6、模糊技術(shù):如:收視率為“高”或“低”等,并確定相應(yīng)的隸屬函數(shù),然后進(jìn)一步掃描數(shù)據(jù)源,對(duì)每個(gè)事件的各屬性的取值用相應(yīng)的隸屬度代替。原來屬性之間的關(guān)聯(lián)就變成模糊意義上的關(guān)聯(lián)。所形成的關(guān)聯(lián)規(guī)則,即為模糊關(guān)聯(lián)規(guī)則。

模糊關(guān)聯(lián)規(guī)則的模糊性不僅體現(xiàn)在模糊概念的模糊性,而且體現(xiàn)在隸屬函數(shù)確定的模糊性,因?yàn)殡`屬函數(shù)的確定也有一定的模糊性,而不同的隸屬函數(shù)所得到的屬性值也會(huì)不同,從而可能導(dǎo)致挖掘結(jié)論不同。模糊集還用于分類,對(duì)于數(shù)據(jù)挖掘系統(tǒng)進(jìn)行分類,模糊邏輯是有用的。它提供了在高度抽象層處理的便利。模糊技術(shù)6、模糊技術(shù):模糊查詢技術(shù)在公交管理中的應(yīng)用模糊查詢技術(shù)在公交管理中的應(yīng)用數(shù)據(jù)挖掘在解決方法上的分類

分析問題

示例

SQLServer2019算法分類:為案例分布預(yù)定義的級(jí)別(如:好與差)●信用風(fēng)險(xiǎn)分析●客戶流失分析●客戶挽留●決策樹●貝葉斯算法●神經(jīng)網(wǎng)絡(luò)分割:開發(fā)一種按相似案例分組的分類方法●客戶資料分析●郵件推銷活動(dòng)●聚類分析●順序聚類關(guān)聯(lián):相關(guān)性高級(jí)計(jì)算●購(gòu)物籃分析●高級(jí)資料研究●決策樹●相關(guān)規(guī)則時(shí)間序列預(yù)測(cè):預(yù)測(cè)未來●預(yù)測(cè)銷售●預(yù)測(cè)股票價(jià)格●時(shí)間序列預(yù)測(cè):根據(jù)相似案例(如:現(xiàn)有客戶)的值預(yù)測(cè)新方案的值●提供保險(xiǎn)率●預(yù)測(cè)客戶收入●預(yù)測(cè)溫度●全部偏差分析:發(fā)現(xiàn)案例或群體與其他案例和群體的差別●信用卡欺騙檢測(cè)●網(wǎng)絡(luò)入侵分析●全部數(shù)據(jù)挖掘在解決方法上的分類數(shù)據(jù)挖掘功能和應(yīng)用領(lǐng)域應(yīng)用領(lǐng)域挖掘功能的例子挖掘過程挖掘技術(shù)欺詐檢測(cè)信用卡欺詐內(nèi)部查帳商店失竊確定標(biāo)準(zhǔn)狀況變化數(shù)據(jù)可視化基于記憶的推理風(fēng)險(xiǎn)評(píng)估信用卡升級(jí)抵押貸款客戶保持客戶信貸分類鏈接的檢測(cè)和分析決策樹基于記憶的推理市場(chǎng)分析市場(chǎng)籃子分析目標(biāo)銷售客戶個(gè)性行銷預(yù)測(cè)性的建模數(shù)據(jù)庫分割類檢測(cè)決策樹鏈接分析遺傳算法數(shù)據(jù)挖掘功能和應(yīng)用領(lǐng)域應(yīng)用領(lǐng)域挖掘功能的例子挖掘過程挖掘技術(shù)數(shù)據(jù)挖掘的實(shí)例數(shù)據(jù)挖掘的實(shí)例數(shù)據(jù)挖掘:SQLServer2019數(shù)據(jù)挖掘:SQLServer2019SQLserver2019數(shù)據(jù)挖掘研究SQLserver2019數(shù)據(jù)挖掘研究使用Access2019開始數(shù)據(jù)挖掘

使用Access2019開始數(shù)據(jù)挖掘數(shù)據(jù)挖掘在人力資源方面的應(yīng)用數(shù)據(jù)挖掘在人力資源方面的應(yīng)用DM(數(shù)據(jù)挖掘)上海數(shù)據(jù)庫開發(fā)DM(數(shù)據(jù)挖掘)上海數(shù)據(jù)庫開發(fā)生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)挖掘軟件生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)挖掘軟件SQLServer分析服務(wù)中的數(shù)據(jù)挖掘

SQLServer分析服務(wù)中的數(shù)據(jù)挖掘數(shù)據(jù)挖掘工具的比較工具名稱IBMDB2DBMinner2.0SASDarwinMineSetMasa3.0產(chǎn)品提供IBM公司DBMinerTechnologySASInstituteThinkingMachineSGI公司和美國(guó)Standford創(chuàng)我科技可提供的競(jìng)爭(zhēng)能力強(qiáng)大并行計(jì)算能力多任務(wù)挖掘工具,通過DMQL進(jìn)行數(shù)理統(tǒng)計(jì)分析軟件數(shù)據(jù)挖掘核心競(jìng)爭(zhēng)力數(shù)據(jù)庫和技術(shù)領(lǐng)先多種關(guān)系數(shù)據(jù)庫多種數(shù)據(jù)獲取、篩選、轉(zhuǎn)換價(jià)格咨詢和購(gòu)賣硬件費(fèi)用昂貴比較便宜昂貴,多采用租賃軟件免費(fèi),數(shù)據(jù)展示和準(zhǔn)備費(fèi)用高比較便宜比較便宜運(yùn)行平臺(tái)多平臺(tái)多平臺(tái)多平臺(tái)多平臺(tái)Oracle數(shù)據(jù)庫多平臺(tái)Windows平臺(tái)數(shù)據(jù)挖掘工具的比較工具名稱IBMDB2DBMinner2數(shù)據(jù)挖掘工具的比較工具名稱IBMDB2DBMinner2.0SASDarwinMineSetMasa3.0用戶界面使用復(fù)雜的數(shù)據(jù)可視化技術(shù)可視化界面可視化界面,操作復(fù)雜可視化界面,比強(qiáng)的用戶界面可視化顯示,操作簡(jiǎn)單有經(jīng)驗(yàn)用戶可自由優(yōu)化參數(shù)建模技術(shù)與算法有廣泛的數(shù)據(jù)挖掘技術(shù)和算法集,統(tǒng)計(jì)功能差算法簡(jiǎn)單,主要與SQLServer的OLAP集成提供所以的數(shù)據(jù)挖掘方法,包括統(tǒng)計(jì)分析、時(shí)序分析僅有聚類,沒有關(guān)聯(lián)和序列規(guī)則算法構(gòu)造表達(dá)式由已有的數(shù)據(jù)項(xiàng)生成新的數(shù)據(jù)項(xiàng)多種可行的數(shù)據(jù)挖掘算法,可以嵌人其它軟件代碼模型發(fā)布具有大量數(shù)據(jù)挖掘和程序接口開放式體系結(jié)構(gòu)用特有的SQL語言后臺(tái)用特別程序發(fā)布包采用C、C++、Java手工編碼輸出程序支持國(guó)際字符,可以直接發(fā)表到Web發(fā)布簡(jiǎn)單,有模板數(shù)據(jù)挖掘工具的比較工具名稱IBMDB2DBMinner2小結(jié)決策支持系統(tǒng)與數(shù)據(jù)挖掘小結(jié)小結(jié)決策支持系統(tǒng)與數(shù)據(jù)挖掘小結(jié)本章小結(jié)數(shù)據(jù)倉庫OLAP決策支持系統(tǒng)數(shù)據(jù)挖掘技術(shù)人工智能商務(wù)智能本章小結(jié)數(shù)據(jù)倉庫OLAP決策支持系統(tǒng)數(shù)據(jù)挖掘技術(shù)人工智能商務(wù)本章小結(jié)數(shù)據(jù)挖掘技術(shù)1、描述(歸納)2、分類預(yù)測(cè)3、聚類分析4、關(guān)聯(lián)分析5、依賴性分析6、粗糙集7、模糊技術(shù)MSSQLServer2019的數(shù)據(jù)挖掘算法:1、貝葉斯算法2、決策樹算法3、時(shí)序算法4、聚類算法5、序列聚類算法6、關(guān)聯(lián)規(guī)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論