《數(shù)據(jù)挖掘與數(shù)據(jù)分析(財(cái)會)》數(shù)據(jù)挖掘與數(shù)據(jù)分析概述_第1頁
《數(shù)據(jù)挖掘與數(shù)據(jù)分析(財(cái)會)》數(shù)據(jù)挖掘與數(shù)據(jù)分析概述_第2頁
《數(shù)據(jù)挖掘與數(shù)據(jù)分析(財(cái)會)》數(shù)據(jù)挖掘與數(shù)據(jù)分析概述_第3頁
《數(shù)據(jù)挖掘與數(shù)據(jù)分析(財(cái)會)》數(shù)據(jù)挖掘與數(shù)據(jù)分析概述_第4頁
《數(shù)據(jù)挖掘與數(shù)據(jù)分析(財(cái)會)》數(shù)據(jù)挖掘與數(shù)據(jù)分析概述_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)挖掘與數(shù)據(jù)分析

概述CONTENTS目錄1.1數(shù)據(jù)分析和挖掘概念1.2數(shù)據(jù)挖掘的進(jìn)化歷程1.3數(shù)據(jù)分析與挖掘的應(yīng)用領(lǐng)域1.4數(shù)據(jù)分析與挖掘1.5

數(shù)據(jù)挖掘的流程1.6

數(shù)據(jù)分析與挖掘經(jīng)典算法1.7SmartbiMining企業(yè)數(shù)據(jù)挖掘平臺1.8.常用的數(shù)據(jù)分析與挖掘工具1.9.數(shù)據(jù)挖掘與分析對財(cái)會工作的影響01數(shù)據(jù)分析和挖掘概念數(shù)據(jù)分析(DataAnalysis)有廣義的數(shù)據(jù)分析和狹義的數(shù)據(jù)分析之分。其中廣義的數(shù)據(jù)分析就是包括狹義的數(shù)據(jù)分析和數(shù)據(jù)挖掘。而我們常說的數(shù)據(jù)分析指的是狹義的數(shù)據(jù)分析。它指根據(jù)分析目的,用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法與工具,對收集來的數(shù)據(jù)進(jìn)行處理與分析,提取有價(jià)值的信息,發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)挖掘(DataMining)是指從大量的數(shù)據(jù)中,通過統(tǒng)計(jì)學(xué)、人工智能、機(jī)器學(xué)習(xí)等方法,挖掘出未知的、且有價(jià)值的信息和知識的過程。數(shù)據(jù)分析與挖掘(DataAnalysisandMining)都是基于搜集來的數(shù)據(jù),應(yīng)用數(shù)學(xué)、統(tǒng)計(jì)、計(jì)算機(jī)等技術(shù)抽取出數(shù)據(jù)中的有用信息,進(jìn)而為決策提供依據(jù)和指導(dǎo)方向。1.1.數(shù)據(jù)分析和挖掘概念02數(shù)據(jù)挖掘的進(jìn)化歷程1.2.數(shù)據(jù)挖掘的進(jìn)化歷程20世紀(jì)60年代數(shù)據(jù)收集階段20世紀(jì)90年代數(shù)據(jù)倉庫決策與支持階段20世紀(jì)80年代數(shù)據(jù)倉庫決策與支持階段21世紀(jì)的現(xiàn)在數(shù)據(jù)分析與挖掘階段03數(shù)據(jù)分析與挖掘的應(yīng)用領(lǐng)域1.3.數(shù)據(jù)分析與挖掘的應(yīng)用領(lǐng)域應(yīng)用領(lǐng)域01電商領(lǐng)域:發(fā)現(xiàn)破壞規(guī)則的“害群之馬”02交通出行領(lǐng)域:為打車平臺進(jìn)行私人訂制03醫(yī)療健康領(lǐng)域:找到最佳醫(yī)療方案04銀行風(fēng)險(xiǎn)和客戶管理領(lǐng)域:預(yù)防和控制資金非法流失,優(yōu)化客戶服務(wù)05企業(yè)危機(jī)管理領(lǐng)域:挖掘?qū)ζ髽I(yè)經(jīng)營決策有用的知識06市場營銷領(lǐng)域:降低了營銷成本,提高了營銷效率04數(shù)據(jù)分析與挖掘的區(qū)別1.4數(shù)據(jù)分析與挖掘的區(qū)別定義說明二者區(qū)別側(cè)重點(diǎn)數(shù)據(jù)分析更側(cè)重于實(shí)際的業(yè)務(wù)知識數(shù)據(jù)挖掘更側(cè)重于技術(shù)的實(shí)現(xiàn)技能要求最終的輸出形式數(shù)據(jù)分析更多的是統(tǒng)計(jì)描述結(jié)果的呈現(xiàn)數(shù)據(jù)挖掘更多的是模型或規(guī)則的輸出05數(shù)據(jù)挖掘的流程1.5數(shù)據(jù)挖掘的流程01020304LOREMLOREMLOREMLOREM構(gòu)建模型數(shù)據(jù)搜集數(shù)據(jù)清洗明確目標(biāo)應(yīng)用部署模型評估LOREMLOREM060506數(shù)據(jù)分析與挖掘經(jīng)典算法1.6數(shù)據(jù)分析與挖掘經(jīng)典算法0607經(jīng)典算法08AdaBoost算法09020304K最近鄰分類算法樸素貝葉斯模型聚類算法支持向量機(jī)(SV)關(guān)聯(lián)規(guī)則算法PageRank算法01C4.510分類與回歸樹05最大期望(EM)算法07SmartbiMining企業(yè)數(shù)據(jù)挖掘平臺1.7SmartbiMining企業(yè)數(shù)據(jù)挖掘平臺思邁特企業(yè)數(shù)據(jù)挖掘平臺(SmartbiMining)是用于預(yù)測性分析的獨(dú)立產(chǎn)品,旨在為企業(yè)所做的決策提供預(yù)測性智能。該平臺不僅可為用戶提供直觀的流式建模、拖拽式操作和流程化、可視化的建模界面,還提供了大量的數(shù)據(jù)預(yù)處理操作。此外,它內(nèi)置了多種實(shí)用的、經(jīng)典的機(jī)器學(xué)習(xí)算法,這些算法配置簡單降低了機(jī)器學(xué)習(xí)的使用門檻,大大節(jié)省了企業(yè)成本,并支持標(biāo)準(zhǔn)的PMML模型輸出,可以將模型發(fā)送到Smartbi統(tǒng)一平臺,與商業(yè)智能平臺實(shí)現(xiàn)了完美整合。08常用的數(shù)據(jù)分析與挖掘工具1.8常用的數(shù)據(jù)分析與挖掘工具R語言Python語言Weka平臺SPSS軟件系統(tǒng)SAS軟件系統(tǒng)常用的數(shù)據(jù)分析與挖掘工具09數(shù)據(jù)挖掘與分析對財(cái)會工作的影響1.9數(shù)據(jù)挖掘與分析對財(cái)會工作的影響首先,使會計(jì)人員和會計(jì)部門的角色定位發(fā)生根本變化。其次,確認(rèn)要素范圍將擴(kuò)展到數(shù)據(jù)資產(chǎn)和數(shù)據(jù)資本,也將更多地采用多維數(shù)據(jù)。挑戰(zhàn)數(shù)據(jù)挖掘主要應(yīng)用在戰(zhàn)略管理會計(jì)領(lǐng)域,實(shí)現(xiàn)經(jīng)營環(huán)境分析、競爭能力分析、價(jià)值鏈分析、成本動因分析等,構(gòu)建智能財(cái)務(wù)預(yù)警系統(tǒng)應(yīng)用現(xiàn)狀會計(jì)人員和會計(jì)部門的角色定位發(fā)生根本改變,將分別轉(zhuǎn)變?yōu)閿?shù)據(jù)分析師、算法工程師和數(shù)據(jù)分析部門;會計(jì)確認(rèn)的要素范圍將擴(kuò)展到數(shù)據(jù)資產(chǎn)和數(shù)據(jù)資本,會計(jì)人員

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論