數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課件_第1頁
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課件_第2頁
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課件_第3頁
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課件_第4頁
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課件_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第7章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘本章學習目標了解數(shù)據(jù)倉庫的概念及特點了解數(shù)據(jù)挖掘的應用和功能熟悉數(shù)據(jù)挖掘的幾種主要技術第7章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘本章學習目標1第7章

數(shù)據(jù)倉庫和數(shù)據(jù)挖掘7.1數(shù)據(jù)倉庫概述7.2數(shù)據(jù)挖掘概述7.3數(shù)據(jù)挖掘的主要技術7.4數(shù)據(jù)倉庫和挖掘?qū)RM的影響第7章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘7.1數(shù)據(jù)倉庫概述7.21第7章

數(shù)據(jù)倉庫和數(shù)據(jù)挖掘7.1數(shù)據(jù)倉庫概述7.2數(shù)據(jù)挖掘概述7.3數(shù)據(jù)挖掘的主要技術7.4數(shù)據(jù)倉庫和挖掘?qū)RM的影響第7章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘7.1數(shù)據(jù)倉庫概述7.21什么是數(shù)據(jù)倉庫?7.1.1數(shù)據(jù)倉庫概念與特點始于20世紀80年代初,“數(shù)據(jù)倉庫之父”WilliamH.Inmon?!皵?shù)據(jù)倉庫是在企業(yè)管理和決策中面向主題的、集成的、相對穩(wěn)定的、與時間相關的數(shù)據(jù)集合,以支持經(jīng)營管理中的決策。數(shù)據(jù)倉庫用于支持決策,面向分析型數(shù)據(jù)處理,不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫;數(shù)據(jù)倉庫是對多個異構(gòu)的數(shù)據(jù)源有效集成,集成后按照主題進行了重組,并包含歷史數(shù)據(jù)。什么是數(shù)據(jù)倉庫?7.1.1數(shù)據(jù)倉庫概念與特點始17.1.1數(shù)據(jù)倉庫概念與特點1、面向主題2、集成的數(shù)據(jù)3、數(shù)據(jù)相對穩(wěn)定4、數(shù)據(jù)倉庫的時間相關性特點7.1.1數(shù)據(jù)倉庫概念與特點1、面向主題2、集成的數(shù)據(jù)3、17.1.1數(shù)據(jù)倉庫概念與特點(1)面向主題數(shù)據(jù)庫:面向事務處理任務,各系統(tǒng)分離數(shù)據(jù)倉庫:按照一定的主題域組織在一起主題:用戶使用數(shù)據(jù)倉庫進行決策時所關心的重點方面。針對決策者的數(shù)據(jù)分析,而不是日常事務的處理,因而排除了對決策無用的數(shù)據(jù),提供了特定主題的簡明視圖。是對應企業(yè)中某一宏觀分析領域所涉及的分析對象,是針對某一決策問題而設置的。7.1.1數(shù)據(jù)倉庫概念與特點(1)面向主題1數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課件1財務子系統(tǒng)銷售商分析產(chǎn)品分析銷售子系統(tǒng)供應子系統(tǒng)人力資源子系統(tǒng)消費者分析數(shù)據(jù)倉庫生產(chǎn)調(diào)度子系統(tǒng)數(shù)據(jù)庫面向主題面向事務財務子系統(tǒng)銷售商分析產(chǎn)品分析銷售子系統(tǒng)供應子系統(tǒng)人力資源子系1例如:一個保險公司的數(shù)據(jù)倉庫所組織的主題可能是:客戶、政策、保險金、索賠等,而按應用來組織則可能是:汽車保險、生命保險、傷亡保險等。例如:一個保險公司的數(shù)據(jù)倉庫所組織的主題可能是:客戶、政策、17.1.1數(shù)據(jù)倉庫概念與特點(2)集成的數(shù)據(jù)

從原來分散的多個異種數(shù)據(jù)源(關系數(shù)據(jù)庫、文本數(shù)據(jù)庫、Web數(shù)據(jù)庫、一般文件等)構(gòu)成的子系統(tǒng)中提取數(shù)據(jù)。①原有數(shù)據(jù)庫系統(tǒng)記錄的是每一項業(yè)務處理的流水賬,不適合分析處理,在進入數(shù)據(jù)倉庫之前必須進行綜合、計算,拋棄分析處理不需要的數(shù)據(jù)項,必要時增加一定的外部數(shù)據(jù)。②原分散數(shù)據(jù)庫中有很多重復或不一致的地方,必須消除不一致和錯誤,全局統(tǒng)一。為何進行數(shù)據(jù)集成?7.1.1數(shù)據(jù)倉庫概念與特點(2)集成的數(shù)據(jù)為何進行數(shù)據(jù)集17.1.1數(shù)據(jù)倉庫概念與特點(3)數(shù)據(jù)相對穩(wěn)定數(shù)據(jù)庫:通常定時更新,根據(jù)需要變化數(shù)據(jù)倉庫:主要供查詢,只讀。從內(nèi)容上看,存儲當前和歷史的數(shù)據(jù),不是日常事務產(chǎn)生的數(shù)據(jù),并且當前數(shù)據(jù)在一定時間間隔后要轉(zhuǎn)換成歷史數(shù)據(jù)轉(zhuǎn)存慢速設備,不需要的則刪除,因此極少修改?;疖嚻变N售7.1.1數(shù)據(jù)倉庫概念與特點(3)數(shù)據(jù)相對穩(wěn)定火車票銷售17.1.1數(shù)據(jù)倉庫概念與特點(4)數(shù)據(jù)倉庫的時間相關性

數(shù)據(jù)倉庫中的數(shù)據(jù)都要表明時間屬性。通常包含歷史信息,記錄了企業(yè)從過去某一時點(如開始應用數(shù)據(jù)倉庫的時點)到目前的各個階段的信息,通過這些信息,可以對企業(yè)的發(fā)展歷程和未來趨勢做出定量分析和預測。為了滿足決策分析的需要,數(shù)據(jù)倉庫的數(shù)據(jù)存儲期限一般為5~10年,當超過數(shù)據(jù)倉庫的存儲期限,或?qū)Ψ治霾辉儆杏脮r,這些數(shù)據(jù)將從數(shù)據(jù)倉庫中刪去。7.1.1數(shù)據(jù)倉庫概念與特點(4)數(shù)據(jù)倉庫的時間相關性1學籍管理系統(tǒng)&

成績管理系統(tǒng)財務系統(tǒng)學籍管理系統(tǒng)&成績管理系統(tǒng)財務系統(tǒng)17.1.2

傳統(tǒng)數(shù)據(jù)庫與數(shù)據(jù)倉庫傳統(tǒng)數(shù)據(jù)庫數(shù)據(jù)倉庫迥異日常業(yè)務的自動化處理屬于聯(lián)機事務處理只涉及當前數(shù)據(jù),系統(tǒng)積累下的歷史業(yè)務數(shù)據(jù)往往被轉(zhuǎn)存到脫機的環(huán)境中用于支持高層決策分析屬于聯(lián)機分析處理對自身業(yè)務的運作及整個市場相關行業(yè)的態(tài)勢進行分析,做出有利的決策通存通兌增設自助網(wǎng)點7.1.2傳統(tǒng)數(shù)據(jù)庫與數(shù)據(jù)倉庫傳統(tǒng)數(shù)據(jù)庫數(shù)據(jù)倉庫迥異日常業(yè)17.1.2傳統(tǒng)數(shù)據(jù)庫與數(shù)據(jù)倉庫聯(lián)機的事務處理系統(tǒng)異構(gòu)的外部數(shù)據(jù)源脫機的歷史業(yè)務數(shù)據(jù)數(shù)據(jù)中心(倉庫)datadatadata為分析統(tǒng)計和決策支持應用服務7.1.2傳統(tǒng)數(shù)據(jù)庫與數(shù)據(jù)倉庫聯(lián)機的異構(gòu)的脫機的數(shù)據(jù)中心(1聯(lián)機事務處理和聯(lián)機分析處理聯(lián)機事務處理(OLTP)——傳統(tǒng)的關系型數(shù)據(jù)庫的核心應用。OLTP:執(zhí)行基本的增加、刪除等聯(lián)機事務和查詢處理,及時、安全地將當前事務所產(chǎn)生的記錄保存下來。幾乎涵蓋了組織的大部分日常操作。SQL語言例如:銀行交易管理系統(tǒng)中,每天的大量操作都限于增加新賬號、刪除舊賬號、更改賬號中的金額數(shù)據(jù)、查詢客戶賬號余額等。聯(lián)機事務處理和聯(lián)機分析處理聯(lián)機事務處理(OLTP)—1聯(lián)機分析處理(OLAP)——數(shù)據(jù)倉庫的核心應用。OLAP:針對同一個主題對數(shù)據(jù)進行分析、查詢和生成報表,從而快速、交互地得出決策支持的分析結(jié)論?;竟δ苁菍τ脩舢斍凹皻v史數(shù)據(jù)進行分析以輔導領導決策,側(cè)重決策支持,并提供直觀易懂的查詢結(jié)果。聯(lián)機分析處理(OLAP)——數(shù)據(jù)倉庫的核心應用。1OLTPOLAP特征操作處理信息處理面向事務分析用戶操作人員、低層管理人員決策人員、高級管理人員功能日常操作處理長期信息需求、分析決策DB設計面向應用面向主題OLTP&OLAPOLTPOLAP特征操作處理信息處理面向事務分析用戶操作人員17.1.3CRM中數(shù)據(jù)倉庫的結(jié)構(gòu)體系結(jié)構(gòu)——斯坦福大學的數(shù)據(jù)倉庫體系結(jié)構(gòu)客戶應用數(shù)據(jù)倉庫集成器監(jiān)視器/包裝器監(jiān)視器/包裝器監(jiān)視器/包裝信息信息信息7.1.3CRM中數(shù)據(jù)倉庫的結(jié)構(gòu)體系結(jié)構(gòu)——斯坦福大學的數(shù)17.1.3CRM中數(shù)據(jù)倉庫的結(jié)構(gòu)體系結(jié)構(gòu)——綜合的數(shù)據(jù)倉庫的體系結(jié)構(gòu)數(shù)據(jù)源抽取清理裝載刷新數(shù)據(jù)倉庫服務前端工具查詢工具報表工具分析工具數(shù)據(jù)挖掘工具數(shù)據(jù)集市OLAPOLAP主題主題主題7.1.3CRM中數(shù)據(jù)倉庫的結(jié)構(gòu)體系結(jié)構(gòu)——綜合的數(shù)據(jù)倉庫17.1.3CRM中數(shù)據(jù)倉庫的結(jié)構(gòu)組織結(jié)構(gòu)——四個級別當前細節(jié)級集成輕度綜合級提取綜合高度綜合級精煉綜合早期細節(jié)級老化的數(shù)據(jù)最近時期的業(yè)務數(shù)據(jù)被轉(zhuǎn)儲于磁帶等轉(zhuǎn)換介質(zhì)四個級別7.1.3CRM中數(shù)據(jù)倉庫的結(jié)構(gòu)組織結(jié)構(gòu)——四個級別當前細17.1.3CRM中數(shù)據(jù)倉庫的結(jié)構(gòu)關于數(shù)據(jù)的數(shù)據(jù)組織倉庫內(nèi)的數(shù)據(jù)存儲,描述何種信息存于何處,怎樣編碼,怎樣與其他信息相關,來自哪里,怎樣與業(yè)務相關。元數(shù)據(jù)對于管理、組織、探索數(shù)據(jù)非常重要,它能夠讓用戶知道數(shù)據(jù)倉庫有什么,以及如何使用。例如:數(shù)據(jù)倉庫表的結(jié)構(gòu)、數(shù)據(jù)倉庫表的屬性、數(shù)據(jù)倉庫的元數(shù)據(jù)、抽取日志。組織結(jié)構(gòu)——元數(shù)據(jù)7.1.3CRM中數(shù)據(jù)倉庫的結(jié)構(gòu)關于數(shù)據(jù)的數(shù)據(jù)組織結(jié)構(gòu)——17.1.3CRM中數(shù)據(jù)倉庫的結(jié)構(gòu)組織結(jié)構(gòu)圖高度綜合級面向決策人員生產(chǎn)線每月銷售輕度綜合級面向管理人員中心數(shù)據(jù)庫當前細節(jié)級銷售細節(jié)級操作型轉(zhuǎn)換早期細節(jié)級銷售細節(jié)級子生產(chǎn)線每周銷售元數(shù)據(jù)7.1.3CRM中數(shù)據(jù)倉庫的結(jié)構(gòu)組織結(jié)構(gòu)圖高度綜合級面向決17.1.4數(shù)據(jù)倉庫幾個重要概念對數(shù)據(jù)倉庫中數(shù)據(jù)綜合程度的一個度量粒度越高,綜合程度越高,細節(jié)程度越低粒度越低,綜合程度越低,細節(jié)程度越高將近期的、綜合的、查詢頻率高的高粒度數(shù)據(jù)存放于磁盤、光盤等快速設備將久遠的、細節(jié)的、查詢頻率低的低粒度數(shù)據(jù)存放于磁帶等低速設備(1)粒度7.1.4數(shù)據(jù)倉庫幾個重要概念對數(shù)據(jù)倉庫中數(shù)據(jù)綜合程度的一17.1.4數(shù)據(jù)倉庫幾個重要概念將數(shù)據(jù)分散到各自的物理單元中,以便能分別地、獨立地處理,提高效率。數(shù)據(jù)分割時可以依據(jù)不同的標準,如日期、地域或業(yè)務領域等,也可以是它們的組合,一般按日期分割不可或缺。數(shù)據(jù)分割后的數(shù)據(jù)單元稱為分片,各個分片內(nèi)的數(shù)據(jù)獨立,處理和重構(gòu)、監(jiān)控等操作更容易。(2)分割7.1.4數(shù)據(jù)倉庫幾個重要概念將數(shù)據(jù)分散到各自的物理單元中17.1.4數(shù)據(jù)倉庫幾個重要概念是數(shù)據(jù)倉庫的一個子集,只包含公司業(yè)務某一方面的數(shù)據(jù)子集。數(shù)據(jù)集市的目標是把不同的數(shù)據(jù)提供給不同的用戶。數(shù)據(jù)集市在物理上獨立,被布局在局域網(wǎng)的一個單獨的數(shù)據(jù)服務器上,專門為某一類特定用戶服務,以滿足只對數(shù)據(jù)倉庫中一部分數(shù)據(jù)感興趣的用戶的分析需求。(3)數(shù)據(jù)集市DM(DataMarts)7.1.4數(shù)據(jù)倉庫幾個重要概念是數(shù)據(jù)倉庫的一個子集,只包含17.1.5數(shù)據(jù)倉庫的主要技術1.聯(lián)機分析處理(OLAP)(1)MOLAP多維聯(lián)機分析處理。以多維數(shù)據(jù)倉庫為核心,以多維方式存儲和顯示數(shù)據(jù)。在多維數(shù)據(jù)存儲“超立方塊”的結(jié)構(gòu)技術上使用各種報表技術。當用戶發(fā)出請求時,從多維立方體中而不是數(shù)據(jù)倉庫中取得數(shù)據(jù),多維數(shù)據(jù)的處理速度快。綜合數(shù)據(jù)多,不能存儲大量細節(jié)數(shù)據(jù),粒度不會太細。技術較新,處理大規(guī)模數(shù)據(jù)能力較弱等,接口不統(tǒng)一。7.1.5數(shù)據(jù)倉庫的主要技術1.聯(lián)機分析處理(OLAP)1(2)ROLAP:

關系型聯(lián)機分析處理,以數(shù)據(jù)倉庫為核心,不生成多維立方體,知識存儲數(shù)據(jù)模型與數(shù)據(jù)倉庫之間的映射關系,真正存儲在數(shù)據(jù)倉庫。當用戶發(fā)出請求時,從數(shù)據(jù)倉庫中取得數(shù)據(jù),實時分析,增加相應時間,但是節(jié)省空間,且可以具體到細節(jié),另外可直接應用到數(shù)據(jù)倉庫系統(tǒng)上。主打產(chǎn)品。(2)ROLAP:1(3)DOLAP:桌面聯(lián)機分析處理。講聯(lián)機分析要用的數(shù)據(jù),傳輸并存儲到用戶的客戶端,用戶訪問不受網(wǎng)絡顯示。但操作安全性和數(shù)據(jù)安全性不受保障,也不易維護,一般應用于小型項目。(4)HOLAP:混合聯(lián)機分析。折中方案,根據(jù)用戶常用到的維度和測量值的分析,將它們生成多維數(shù)據(jù)庫,存儲于多維數(shù)據(jù)庫中;與這些維度和測量值相關的詳細數(shù)據(jù),仍然以關系數(shù)據(jù)的形式保存在倉庫中,既解決速度問題、存儲問題,也解決了對詳細數(shù)據(jù)的分析問題。(3)DOLAP:桌面聯(lián)機分析處理。講聯(lián)機分析要用的數(shù)據(jù),傳12.數(shù)據(jù)挖掘數(shù)據(jù)挖掘時高級應用,當前發(fā)展最快最活躍的技術,為決策過程提供強有力的支持。2.數(shù)據(jù)挖掘1

思考:1.數(shù)據(jù)倉庫的定義及特點2.什么是元數(shù)據(jù)?有何地位?3.什么是數(shù)據(jù)集市?與數(shù)據(jù)倉庫的關系?4.什么是粒度?思考:1.數(shù)據(jù)倉庫的定義及特點1第7章

數(shù)據(jù)倉庫和數(shù)據(jù)挖掘7.1數(shù)據(jù)倉庫概述7.2數(shù)據(jù)挖掘概述7.3數(shù)據(jù)挖掘的主要技術7.4數(shù)據(jù)倉庫和挖掘?qū)RM的影響第7章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘7.1數(shù)據(jù)倉庫概述7.21數(shù)據(jù)爆炸但知識貧乏數(shù)據(jù)爆炸但知識貧乏1(1)什么是數(shù)據(jù)挖掘?7.2.1數(shù)據(jù)挖掘的定義數(shù)據(jù)挖掘(DataMining)是從大型數(shù)據(jù)庫的數(shù)據(jù)中提取人們感興趣的知識,這些知識是隱含的、事先未知、潛在有用的信息,提取的知識表示為概念、規(guī)則、規(guī)律和模式等形式。挖掘?qū)ο蟛粌H是數(shù)據(jù)庫,還可能是文件系統(tǒng)或其他任何組織在一起的數(shù)據(jù)集合。

從大量的數(shù)據(jù)中,抽取出潛在的、有價值的知識、模型或規(guī)則的過程。(1)什么是數(shù)據(jù)挖掘?7.2.1數(shù)據(jù)挖掘的定義數(shù)據(jù)挖掘(D1(2)數(shù)據(jù)與知識數(shù)據(jù)——原始事實組成,有數(shù)值數(shù)據(jù)、圖形數(shù)據(jù)、聲音數(shù)據(jù)和視覺數(shù)據(jù)等。知識——概念、規(guī)則、模式、規(guī)律和約束等源泉源泉1廣義知識——數(shù)據(jù)的概括性描述,反映事物共同性質(zhì)關聯(lián)知識——一個事件與其他時間之間依賴或關聯(lián)的知識分類知識——同類事物具有共同的特征和不同事物之間存在差異性特征的知識預測知識——根據(jù)時間序列性數(shù)據(jù),用歷史的和當前的數(shù)據(jù)區(qū)推測未來的數(shù)據(jù),以時間為關鍵屬性的關聯(lián)知識偏差性知識——對差異和極端特例的描述,揭示事物偏離常規(guī)的異常現(xiàn)象廣義知識——數(shù)據(jù)的概括性描述,反映事物共同性質(zhì)17.2.2在數(shù)據(jù)倉庫進行的數(shù)據(jù)挖掘數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的關系數(shù)據(jù)倉庫是基礎,數(shù)據(jù)挖掘是高級應用兩者需整體規(guī)劃、分步實施優(yōu)勢

已經(jīng)完成對數(shù)據(jù)抽取、清洗、轉(zhuǎn)換和裝載,節(jié)省時間。數(shù)據(jù)集成度和綜合性高歷史數(shù)據(jù)豐富7.2.2在數(shù)據(jù)倉庫進行的數(shù)據(jù)挖掘數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的關系1基于數(shù)據(jù)倉庫中的數(shù)據(jù)挖掘數(shù)據(jù)倉庫各分公司數(shù)據(jù)集市分析數(shù)據(jù)集市數(shù)據(jù)挖掘數(shù)據(jù)集市數(shù)據(jù)基于數(shù)據(jù)倉庫中的數(shù)據(jù)挖掘數(shù)據(jù)倉庫各分公司分析數(shù)據(jù)挖掘數(shù)據(jù)17.2.3數(shù)據(jù)挖掘的功能功能一:自動預測趨勢和行為——ATM設置地點為了從數(shù)據(jù)倉庫中發(fā)現(xiàn)隱含的、有意義的知識7.2.3數(shù)據(jù)挖掘的功能功能一:自動預測趨勢和行為——AT1功能二:關聯(lián)分析——沃爾瑪?shù)馁徫锘@分析功能二:關聯(lián)分析——沃爾瑪?shù)馁徫锘@分析1功能三:聚類——亞馬遜網(wǎng)站Amazon功能三:聚類——亞馬遜網(wǎng)站Amazon1功能四:概念描述銷售經(jīng)理按照客戶居住區(qū)域進行分組匯總,觀察每組客戶的購買頻率和客戶的收入。功能五:偏差檢測

飯卡某天異常刷了200元功能四:概念描述17.2.4CRM中的數(shù)據(jù)挖掘流程確定問題和明確目標建立營銷數(shù)據(jù)庫為建模準備數(shù)據(jù)數(shù)據(jù)挖掘模型的建立評價模型將數(shù)據(jù)挖掘運用到CRM方案中探索數(shù)據(jù)為建立模型選擇變量;從數(shù)據(jù)中選取一個樣本來建立模型;轉(zhuǎn)換變量,與算法一致。投資回收率、收益等7.2.4CRM中的數(shù)據(jù)挖掘流程確定問題和建立營銷評價模型1第7章

數(shù)據(jù)倉庫和數(shù)據(jù)挖掘7.1數(shù)據(jù)倉庫概述7.2數(shù)據(jù)挖掘概述7.3數(shù)據(jù)挖掘的主要技術7.4數(shù)據(jù)倉庫和挖掘?qū)RM的影響第7章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘7.1數(shù)據(jù)倉庫概述7.217.3數(shù)據(jù)挖掘的主要技術決策樹ID3算法神經(jīng)網(wǎng)絡遺傳算法7.3數(shù)據(jù)挖掘的主要技術決策樹1

決策樹:對貸款申請的風險大小做出判斷低風險工作時間>10年是否高負債收入>20萬高風險高風險低風險YNNNYY決策樹的規(guī)模大小決定了數(shù)據(jù)挖掘的效率。根節(jié)點葉子7.3.1決策樹決策樹:對貸款申請的風險大小做出判斷低風險工作時間>101執(zhí)行語句If(income〉20){if(workinglife〉10)

{};};

else{};執(zhí)行語句17.3.2ID3算法ID3算法:解決兩類人群的問題頭發(fā)顏色紅色金色黑色第一類人眼睛顏色第二類人黑色灰色藍色第一類人第三類人第二類人(X.Q)(X.Q)7.3.2ID3算法ID3算法:解決兩類人群的問題頭發(fā)顏色17.3.3神經(jīng)網(wǎng)絡312456輸入層隱含層輸出層預測變量目標變量連接節(jié)點W56W36W25W24W23W13W15W14W467.3.3神經(jīng)網(wǎng)絡312456輸入層隱含層輸出層預測變量目1節(jié)點:對應于人腦的神經(jīng)細胞連接:對應于人腦神經(jīng)細胞的連接隱含層的層數(shù)和每層節(jié)點的個數(shù)決定了神經(jīng)網(wǎng)絡的復雜度。每個連接對應一個權(quán)重,此節(jié)點的值=它所有的輸入節(jié)點的值與對應連接權(quán)重乘積的和。神經(jīng)網(wǎng)絡相互之間的差別也是通過連接權(quán)值及組成結(jié)構(gòu)上的差別來體現(xiàn)的,每次出現(xiàn)錯誤時,修改的就是連接權(quán)值。神經(jīng)網(wǎng)絡節(jié)點:對應于人腦的神經(jīng)細胞神經(jīng)網(wǎng)絡1帶權(quán)重的神經(jīng)網(wǎng)絡節(jié)點3到節(jié)點6的值??忠誠區(qū)域年齡呼叫率WXYWXYWXY業(yè)務流失帶權(quán)重的神經(jīng)網(wǎng)絡節(jié)點3到節(jié)點6的值??忠誠區(qū)域年齡呼叫率W1神經(jīng)網(wǎng)絡的優(yōu)點:對于復雜問題也有好效果處理種類和連續(xù)變量缺點:輸入值需要再0~1之間不能解釋結(jié)果可能會產(chǎn)生一個不好的結(jié)果耗時,前期數(shù)據(jù)處理工作量大

神經(jīng)網(wǎng)絡神經(jīng)網(wǎng)絡的優(yōu)點:神經(jīng)網(wǎng)絡17.3.4遺傳算法遺傳算法關鍵算子:繁殖算子、交叉算子、變異算子執(zhí)行過程:P158圖7-9應用:數(shù)據(jù)聚類7.3.4遺傳算法遺傳算法1第7章

數(shù)據(jù)倉庫和數(shù)據(jù)挖掘7.1數(shù)據(jù)倉庫概述7.2數(shù)據(jù)挖掘概述7.3數(shù)據(jù)挖掘的主要技術7.4數(shù)據(jù)倉庫和挖掘?qū)RM的影響第7章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘7.1數(shù)據(jù)倉庫概述7.217.4數(shù)據(jù)倉庫和挖掘在CRM中的應用CRM的核心是數(shù)據(jù)倉庫在正確的時間使用正確的途徑為正確的客戶提供正確的服務7.4數(shù)據(jù)倉庫和挖掘在CRM中的應用CRM的核心是數(shù)據(jù)倉庫1提供個性化服務:移動電話信號中斷事件營銷:65歲老太太的大舉動(自動發(fā)現(xiàn)和匯報)數(shù)據(jù)倉庫重要性提供個性化服務:移動電話信號中斷數(shù)據(jù)倉庫重要性1數(shù)據(jù)挖掘

新客戶獲取交叉銷售客戶保持客戶個性化服務重點客戶發(fā)現(xiàn)數(shù)據(jù)挖掘重要性數(shù)據(jù)挖掘數(shù)據(jù)挖掘重要性1新客戶獲取

新客戶:以前沒聽說過本企業(yè)產(chǎn)品的人以前不需要該類產(chǎn)品的人競

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論