《數(shù)據(jù)分析行業(yè)服務(wù)參考文件》_第1頁(yè)
《數(shù)據(jù)分析行業(yè)服務(wù)參考文件》_第2頁(yè)
《數(shù)據(jù)分析行業(yè)服務(wù)參考文件》_第3頁(yè)
《數(shù)據(jù)分析行業(yè)服務(wù)參考文件》_第4頁(yè)
《數(shù)據(jù)分析行業(yè)服務(wù)參考文件》_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)分析行業(yè)服務(wù)參考文件

(征求意見(jiàn)稿)

編寫單位:中國(guó)商業(yè)聯(lián)合會(huì)

中國(guó)商業(yè)聯(lián)合會(huì)數(shù)據(jù)分析專業(yè)委員會(huì)

二零二一年九月

一、序言

隨著數(shù)據(jù)要素市場(chǎng)在逆勢(shì)中釋放出經(jīng)濟(jì)增長(zhǎng)新動(dòng)能,大數(shù)據(jù)也迎來(lái)了重大發(fā)

展契機(jī),當(dāng)前數(shù)據(jù)作為新型生產(chǎn)要素,已成為信息時(shí)代國(guó)家重要戰(zhàn)略資源。近年

來(lái),我國(guó)大數(shù)據(jù)從無(wú)到有、從有到優(yōu),大數(shù)據(jù)應(yīng)用加速向各行各業(yè)滲透,市場(chǎng)主

體愈發(fā)重視數(shù)據(jù)這一重要企業(yè)資產(chǎn)和資源所蘊(yùn)含的巨大商業(yè)價(jià)值。同時(shí)大數(shù)據(jù)與

各行業(yè)融合發(fā)展,助推數(shù)字化經(jīng)濟(jì)轉(zhuǎn)型,實(shí)現(xiàn)企業(yè)級(jí)數(shù)據(jù)智能驅(qū)動(dòng)業(yè)務(wù),成為驅(qū)

動(dòng)發(fā)展的強(qiáng)大引擎。

在大數(shù)據(jù)應(yīng)用價(jià)值不斷凸顯的今天,數(shù)據(jù)分析師事務(wù)所作為一個(gè)全新的第三

方服務(wù)行業(yè),已經(jīng)遍布在全國(guó)各省市,正在踐行以“大數(shù)據(jù)思維”助力政務(wù)數(shù)字

化發(fā)展、企業(yè)數(shù)字化轉(zhuǎn)型,圍繞數(shù)據(jù)的深度分析、業(yè)務(wù)場(chǎng)景構(gòu)建、深層次的咨詢

等,以大數(shù)據(jù)思維幫助企、事業(yè)單位實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型并提供行之有效的戰(zhàn)略決策。

為了倡導(dǎo)數(shù)據(jù)分析師事務(wù)所及大數(shù)據(jù)領(lǐng)域數(shù)據(jù)分析行業(yè)相關(guān)企業(yè)單位的合

規(guī)經(jīng)營(yíng)管理,提升其競(jìng)爭(zhēng)力和可持續(xù)發(fā)展能力,監(jiān)督行業(yè)自律,維護(hù)行業(yè)正當(dāng)競(jìng)

爭(zhēng),加強(qiáng)對(duì)數(shù)據(jù)分析從業(yè)行為的監(jiān)督和指導(dǎo),促進(jìn)中國(guó)數(shù)據(jù)分析行業(yè)健康發(fā)展,

中國(guó)商業(yè)聯(lián)合會(huì)數(shù)據(jù)分析專業(yè)委員會(huì)組織大數(shù)據(jù)領(lǐng)域的專家及業(yè)務(wù)突出的企業(yè)

單位,通過(guò)對(duì)數(shù)據(jù)分析服務(wù)內(nèi)容的研究與探討,歷經(jīng)數(shù)月,制定完成本《數(shù)據(jù)分

析行業(yè)服務(wù)參考文件》。

4

二、服務(wù)參考文件概述

1.編制背景

自2015年,黨的十八屆五中全會(huì)公報(bào)提出要實(shí)施“國(guó)家大數(shù)據(jù)戰(zhàn)略”,這

是大數(shù)據(jù)第一次寫入黨的全會(huì)決議,標(biāo)志著大數(shù)據(jù)戰(zhàn)略正式上升為國(guó)家戰(zhàn)略。五

中全會(huì),開(kāi)啟了大數(shù)據(jù)建設(shè)的新篇章。2015年至2021年,我國(guó)陸續(xù)發(fā)布大數(shù)據(jù)

相關(guān)政策文件,持續(xù)加強(qiáng)大數(shù)據(jù)、數(shù)字經(jīng)濟(jì)國(guó)家戰(zhàn)略部署。2021年,在建黨百年

之際,隨著《中華人民共和國(guó)國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035年

遠(yuǎn)景目標(biāo)綱要》全文正式發(fā)布,數(shù)字化轉(zhuǎn)型也再次迎來(lái)熱議。其實(shí)在信息技術(shù)和

數(shù)字經(jīng)濟(jì)的發(fā)展下,數(shù)字化轉(zhuǎn)型一直是企業(yè)的關(guān)鍵命題,熱度不減。

中國(guó)商業(yè)聯(lián)合會(huì)數(shù)據(jù)分析專業(yè)委員會(huì)成立于2008年4月,是經(jīng)國(guó)務(wù)院國(guó)有

資產(chǎn)監(jiān)督管理委員會(huì)審核同意、中華人民共和國(guó)民政部正式批準(zhǔn)和登記的中國(guó)數(shù)

據(jù)分析行業(yè)協(xié)會(huì),是以數(shù)據(jù)分析師及數(shù)據(jù)分析師事務(wù)所等從事與數(shù)據(jù)分析業(yè)務(wù)相

關(guān)的團(tuán)體與個(gè)人自愿組成的全國(guó)性數(shù)據(jù)分析行業(yè)組織,是中國(guó)較早堅(jiān)持發(fā)展專業(yè)

型協(xié)會(huì)、靠專業(yè)引領(lǐng)市場(chǎng)的行業(yè)組織。本次《數(shù)據(jù)分析行業(yè)服務(wù)參考文件》由中

國(guó)商業(yè)聯(lián)合會(huì)數(shù)據(jù)分析專業(yè)委員會(huì)組織編寫。

目前我國(guó)擁有海量的數(shù)據(jù)資源,需要有相應(yīng)豐富的落地應(yīng)用場(chǎng)景,隨著國(guó)家

政策的日漸完善以及扶持力度的不斷增強(qiáng),我國(guó)大數(shù)據(jù)產(chǎn)業(yè)不斷發(fā)展和進(jìn)步。同

時(shí)企業(yè)面臨的數(shù)字化轉(zhuǎn)型是一個(gè)循序漸進(jìn)的過(guò)程,是企業(yè)發(fā)展的必經(jīng)之路。然而,

隨著我國(guó)大數(shù)據(jù)應(yīng)用的進(jìn)一步深入,企業(yè)數(shù)字化發(fā)展的痛點(diǎn)問(wèn)題相繼暴露:認(rèn)知

偏差,缺乏大數(shù)據(jù)思維;數(shù)據(jù)孤島嚴(yán)重,缺乏數(shù)據(jù)管理機(jī)制和保障;在提供企業(yè)

數(shù)字化轉(zhuǎn)型服務(wù)時(shí),體系和框架流程不夠明確、業(yè)務(wù)范圍和服務(wù)模式模糊、服務(wù)

收費(fèi)差異大……面對(duì)當(dāng)前發(fā)展的瓶頸問(wèn)題,不僅需要從行業(yè)機(jī)制的角度尋求突破,

也亟需從市場(chǎng)化維度持續(xù)加強(qiáng)支撐。本參考文件梳理了數(shù)據(jù)分析行業(yè)業(yè)務(wù)相關(guān)定

義規(guī)范、數(shù)據(jù)分析體系和標(biāo)準(zhǔn)化分析流程,對(duì)數(shù)據(jù)分析業(yè)務(wù)范圍的研究及通過(guò)市

場(chǎng)調(diào)研相關(guān)收費(fèi)參考、服務(wù)模式、項(xiàng)目運(yùn)營(yíng)管理和項(xiàng)目交付標(biāo)準(zhǔn),以及售后服務(wù)

等內(nèi)容均做出了說(shuō)明。并對(duì)數(shù)據(jù)分析行業(yè)相關(guān)企業(yè)和個(gè)人從業(yè)規(guī)范提出了意見(jiàn)。

5

呼吁社會(huì)各界共同關(guān)注數(shù)據(jù)分析行業(yè)發(fā)展,加強(qiáng)對(duì)數(shù)據(jù)分析業(yè)務(wù)的重視,共同助

力企業(yè)數(shù)字化轉(zhuǎn)型。

2.服務(wù)參考文件實(shí)行期

本服務(wù)參考文件自2021年12月1日正式實(shí)行,根據(jù)實(shí)施情況,不定期進(jìn)行

修訂。

3.制定總體依據(jù)

本服務(wù)參考文件總體依據(jù)有:《中國(guó)數(shù)據(jù)分析行業(yè)自律公約》、《中國(guó)大數(shù)

據(jù)人才培養(yǎng)體系標(biāo)準(zhǔn)》、《企業(yè)經(jīng)營(yíng)決策數(shù)據(jù)分析服務(wù)內(nèi)容及費(fèi)用組成指導(dǎo)性文

件》、《數(shù)據(jù)分析師事務(wù)所從業(yè)規(guī)范》、《數(shù)據(jù)分析師執(zhí)業(yè)規(guī)范》等相關(guān)文件,

以及對(duì)眾多家優(yōu)質(zhì)大數(shù)據(jù)公司、數(shù)據(jù)分析師事務(wù)所進(jìn)行調(diào)研,最終擬定本服務(wù)參

考文件。

4.適用范圍

本服務(wù)參考文件主要適用范圍:數(shù)據(jù)分析行業(yè)從事專業(yè)數(shù)據(jù)分析的機(jī)構(gòu)——

數(shù)據(jù)分析師事務(wù)所,以及大數(shù)據(jù)領(lǐng)域相關(guān)企業(yè)單位。

5.編制總原則

本服務(wù)參考文件編制總原則為滿足數(shù)據(jù)分析師事務(wù)所及大數(shù)據(jù)領(lǐng)域相關(guān)企

業(yè)單位的業(yè)務(wù)需求,促進(jìn)數(shù)據(jù)分析行業(yè)公平、有序、健康發(fā)展。本次服務(wù)參考文

件統(tǒng)一了數(shù)據(jù)分析體系與分析方法、流程;規(guī)范了數(shù)據(jù)分析專業(yè)術(shù)語(yǔ)和定義;規(guī)

范了數(shù)據(jù)分析行業(yè)業(yè)務(wù)范圍;通過(guò)市場(chǎng)調(diào)研相關(guān)收費(fèi)方式提供參考;對(duì)服務(wù)模式、

項(xiàng)目運(yùn)營(yíng)管理、項(xiàng)目交付標(biāo)準(zhǔn)及售后服務(wù)規(guī)范進(jìn)行了統(tǒng)一說(shuō)明;同時(shí)對(duì)數(shù)據(jù)分析

行業(yè)相關(guān)企業(yè)單位從業(yè)及數(shù)據(jù)分析師執(zhí)業(yè)進(jìn)行規(guī)范,并且對(duì)違規(guī)事項(xiàng)及反饋機(jī)制

進(jìn)行說(shuō)明。

6

三、數(shù)據(jù)分析與數(shù)據(jù)分析標(biāo)準(zhǔn)化流程

為了進(jìn)一步規(guī)范數(shù)據(jù)分析流程,該部分首先對(duì)數(shù)據(jù)分析和數(shù)據(jù)分析師兩個(gè)概

念進(jìn)行闡述,然后引出行業(yè)數(shù)據(jù)分析標(biāo)準(zhǔn)化流程。

1.數(shù)據(jù)分析

1.1數(shù)據(jù)分析

數(shù)據(jù)分析是指基于業(yè)務(wù)目標(biāo),采用適當(dāng)?shù)姆治龇椒ê凸ぞ邔?duì)收集到的數(shù)據(jù)進(jìn)

行處理和分析,并從中提取有價(jià)值的信息的過(guò)程。在大數(shù)據(jù)時(shí)代,很多企業(yè)收集

到實(shí)時(shí)的、大量的、種類豐富的數(shù)據(jù),而這些數(shù)據(jù)通過(guò)匯總、預(yù)處理、構(gòu)建模型

等過(guò)程幫助企業(yè)發(fā)現(xiàn)并解決問(wèn)題,并提供高效的決策依據(jù),這些也屬于數(shù)據(jù)分析

的范疇。

1.2數(shù)據(jù)分析師

隨著移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)和云計(jì)算等高新技術(shù)的迅速發(fā)展,企業(yè)獲取數(shù)據(jù)的

邊界在不斷擴(kuò)大,質(zhì)量也取得大幅度提高。如何管理和應(yīng)用這些數(shù)據(jù)幫助企業(yè)提

高效率,降低運(yùn)營(yíng)成本成為企業(yè)的熱門需求,所以,數(shù)據(jù)分析師崗位的需求逐年

遞增。

數(shù)據(jù)分析師是指在不同行業(yè)中,專門從事定義和發(fā)現(xiàn)問(wèn)題,收集、整理和分

析數(shù)據(jù),并根據(jù)數(shù)據(jù)結(jié)果提出有價(jià)值的決策信息的專業(yè)人員?!白寯?shù)據(jù)創(chuàng)造價(jià)值”

是對(duì)數(shù)據(jù)分析師崗位最好的闡述。

企業(yè)對(duì)數(shù)據(jù)分析師的角色定位至關(guān)重要。優(yōu)秀的數(shù)據(jù)分析師不僅是業(yè)務(wù)專家,

同時(shí)也是技術(shù)專家,在企業(yè)充當(dāng)業(yè)務(wù)和技術(shù)之間的橋梁,為企業(yè)的決策方案提供

支持,一方面是對(duì)分析層面的支持,另一方面,還能夠?yàn)榉桨傅木唧w實(shí)施提供保

障措施。所以,對(duì)任何企業(yè)來(lái)說(shuō),數(shù)據(jù)分析師崗位的重要性異常突出。

7

數(shù)據(jù)分析師無(wú)論解決何種問(wèn)題,數(shù)據(jù)分析思維和流程都是基礎(chǔ),只有打好基

礎(chǔ),后續(xù)工作才能順利開(kāi)展。

2.?dāng)?shù)據(jù)分析標(biāo)準(zhǔn)化流程

為了保證數(shù)據(jù)分析流程在整個(gè)行業(yè)的標(biāo)準(zhǔn)化,該體系的撰寫專家廣泛查閱了

各類相關(guān)材料,并綜合了目前數(shù)據(jù)分析相關(guān)的通用步驟,將數(shù)據(jù)分析流程劃分為

業(yè)務(wù)理解、數(shù)據(jù)收集、數(shù)據(jù)探索和預(yù)處理、數(shù)據(jù)分析、結(jié)果評(píng)估和展示、決策落

地六個(gè)階段作為數(shù)據(jù)分析行業(yè)的標(biāo)準(zhǔn)化流程。

該流程提供了一種開(kāi)放的、使用便捷的、閉環(huán)的數(shù)據(jù)分析流程。該流程系統(tǒng)

科學(xué),不只包括數(shù)據(jù)的收集,數(shù)據(jù)的分析等單一環(huán)節(jié),而且是一個(gè)數(shù)據(jù)分析的全

流程解決方案。該流程具有通用性,不僅適合企業(yè)的數(shù)據(jù)科學(xué)家、算法工程師等,

也適合不同行業(yè)、不同業(yè)務(wù)部門的數(shù)據(jù)運(yùn)營(yíng)和分析人員,適合數(shù)據(jù)分析全行業(yè)應(yīng)

用。

下圖1展示了數(shù)據(jù)分析流程的6個(gè)階段。

3.數(shù)據(jù)探索

1.業(yè)務(wù)理解2.數(shù)據(jù)收集

和預(yù)處理

5.結(jié)果評(píng)估和

6.決策落地4.數(shù)據(jù)分析

展示

圖1:數(shù)據(jù)分析標(biāo)準(zhǔn)化流程圖

2.1業(yè)務(wù)理解階段

數(shù)據(jù)分析的第一個(gè)流程是業(yè)務(wù)理解,這也是全流程最關(guān)鍵的一個(gè)環(huán)節(jié)。由于

很多數(shù)據(jù)分析參考流程常常將數(shù)據(jù)獲取作為數(shù)據(jù)分析的第一步,所以實(shí)踐中仍存

8

在一些誤區(qū),認(rèn)為先有數(shù)據(jù)才開(kāi)始分析,導(dǎo)致有些項(xiàng)目在沒(méi)有明確業(yè)務(wù)問(wèn)題和需

求的情況下盲目開(kāi)展,從而效率低下,甚至達(dá)不到預(yù)期的目標(biāo)。

運(yùn)用規(guī)范的數(shù)據(jù)分析方法思考并解決業(yè)務(wù)問(wèn)題對(duì)數(shù)據(jù)分析師來(lái)說(shuō)至關(guān)重要,

數(shù)據(jù)分析工具的使用大同小異,然而分析思維的不同決定了數(shù)據(jù)分析師的差異。

初級(jí)數(shù)據(jù)分析師如何進(jìn)階成為高級(jí)、資深的數(shù)據(jù)分析師,主要體現(xiàn)在思維模式上

的轉(zhuǎn)變。

作為一名合格的數(shù)據(jù)分析師,最基本的要求是站在業(yè)務(wù)需求方的角度思考問(wèn)

題,從實(shí)際問(wèn)題出發(fā),深刻理解項(xiàng)目的需求和分析目標(biāo),并將商業(yè)需求轉(zhuǎn)化為能

用數(shù)據(jù)分析解決的問(wèn)題。要保證項(xiàng)目的目標(biāo)是可量化、可衡量的。例如,如果想

預(yù)測(cè)機(jī)器的狀態(tài)是否正常,需要明確目標(biāo)是想預(yù)測(cè)機(jī)器的壽命,還是要實(shí)時(shí)監(jiān)控

異常狀況,亦或是提前一段時(shí)間對(duì)機(jī)器故障進(jìn)行預(yù)警,如果對(duì)商業(yè)問(wèn)題的定義和

理解不同,所建立的模型和應(yīng)用的方法都可能是不同的,同時(shí),技術(shù)難度也并非

是完全一樣的。

本流程的要點(diǎn)主要包括以下幾個(gè)方面:

業(yè)務(wù)需求分析:實(shí)踐中,數(shù)據(jù)分析師可以借鑒管理中的“5W2H”原則進(jìn)行數(shù)

據(jù)分析項(xiàng)目的業(yè)務(wù)需求理解,明確分析問(wèn)題和目的。

(1)WHAT——項(xiàng)目的目標(biāo)是什么?需要做什么工作?

(2)WHY——為什么要做該項(xiàng)目?是否有其他替代方案?

(3)WHO——項(xiàng)目為誰(shuí)服務(wù)?項(xiàng)目由誰(shuí)來(lái)做?項(xiàng)目相關(guān)的利益相關(guān)者有

誰(shuí)?

(4)WHEN——項(xiàng)目什么時(shí)間做?什么時(shí)候截止?

(5)WHERE——項(xiàng)目在何處做?數(shù)據(jù)等資源在何處獲???

(6)HOW——項(xiàng)目如何做?項(xiàng)目過(guò)程如何實(shí)施?項(xiàng)目如何選擇方法和工

具?結(jié)果如何落地?

9

(7)HOWMUCH——項(xiàng)目需要做到什么程度?項(xiàng)目質(zhì)量水平如何衡量?

費(fèi)用如何?

業(yè)務(wù)需求分解:有些情況下,項(xiàng)目的問(wèn)題和目標(biāo)是較復(fù)雜和隱晦的,這時(shí)需

要把需求和目標(biāo)進(jìn)一步拆分成幾個(gè)子目標(biāo),同時(shí),對(duì)子目標(biāo)提出前提假設(shè),假設(shè)

子目標(biāo)的實(shí)現(xiàn)能夠推動(dòng)總目標(biāo)的實(shí)現(xiàn)。例如,目標(biāo)為提高某產(chǎn)品的銷售額,通過(guò)

4P理論對(duì)該問(wèn)題進(jìn)行拆分,則可以假設(shè)通過(guò)產(chǎn)品改進(jìn)、價(jià)格優(yōu)化、分銷和促銷四

個(gè)子問(wèn)題提高銷售額,因此,復(fù)雜問(wèn)題的商業(yè)理解需要對(duì)商業(yè)需求進(jìn)行分解,同

時(shí),受到各種條件的限制,分解成多個(gè)子問(wèn)題的項(xiàng)目要對(duì)問(wèn)題的重要程度進(jìn)行優(yōu)

先級(jí)排序。

現(xiàn)狀評(píng)估:充分理解項(xiàng)目需求的前提下,還需要對(duì)項(xiàng)目的現(xiàn)狀進(jìn)行評(píng)估。其

中包括:與數(shù)據(jù)分析問(wèn)題相關(guān)的商業(yè)背景是什么?項(xiàng)目可用的資源有哪些?部門

間溝通方式如何?資源的約束有哪些?項(xiàng)目風(fēng)險(xiǎn)如何?項(xiàng)目成本和收益如何?

項(xiàng)目涉及的術(shù)語(yǔ)有哪些?等等。

項(xiàng)目計(jì)劃制定:制定數(shù)據(jù)分析計(jì)劃,包括:確定項(xiàng)目目標(biāo)、制定整個(gè)項(xiàng)目

的實(shí)施方案、編制預(yù)算、組織人員、確立項(xiàng)目政策、確定項(xiàng)目執(zhí)行標(biāo)準(zhǔn)等。

2.2數(shù)據(jù)收集階段

該階段從數(shù)據(jù)收集開(kāi)始,數(shù)據(jù)分析師應(yīng)掌握對(duì)數(shù)據(jù)的洞察能力,識(shí)別數(shù)據(jù)的

質(zhì)量問(wèn)題,數(shù)據(jù)的偏差問(wèn)題,數(shù)據(jù)的內(nèi)部結(jié)構(gòu)等問(wèn)題,數(shù)據(jù)分析師應(yīng)該能夠獲取

相關(guān)數(shù)據(jù),同時(shí)對(duì)獲取的數(shù)據(jù)有一個(gè)基本的認(rèn)識(shí),識(shí)別數(shù)據(jù)是否能夠解決當(dāng)前的

商業(yè)問(wèn)題?是否還需要外部其他數(shù)據(jù)的支持?如果需要,成本和可行性如何?該

階段可能需要跨部門、甚至跨企業(yè)溝通,對(duì)商業(yè)問(wèn)題的理解有變動(dòng)時(shí),該過(guò)程也

會(huì)發(fā)生變化,所以,數(shù)據(jù)收集階段可能是反復(fù)進(jìn)行的。

本流程的要點(diǎn)主要包括以下幾個(gè)方面:

數(shù)據(jù)收集:明確與項(xiàng)目問(wèn)題相關(guān)的數(shù)據(jù)大致有哪些?明確數(shù)據(jù)來(lái)源,數(shù)據(jù)的

體現(xiàn)形式、數(shù)據(jù)的存儲(chǔ)位置、數(shù)據(jù)的獲取渠道等,并進(jìn)行數(shù)據(jù)獲取。巧婦難為無(wú)

米之炊,數(shù)據(jù)是項(xiàng)目成果的關(guān)鍵資源,但是,獲取數(shù)據(jù)的成本收益也必須明確。

10

根據(jù)商業(yè)問(wèn)題的不同,采用不同的收集數(shù)據(jù)的方式是比較合理的,不要為了獲取

數(shù)據(jù)(尤其是大數(shù)據(jù))而獲取數(shù)據(jù),如果單純地追求高質(zhì)量和大量的數(shù)據(jù),項(xiàng)目

就進(jìn)入了另一個(gè)極端,給項(xiàng)目的實(shí)施者造成極大負(fù)擔(dān)。數(shù)據(jù)獲取的方式多種多樣,

包括:企業(yè)內(nèi)部數(shù)據(jù)庫(kù)、外部公開(kāi)數(shù)據(jù)庫(kù)、互聯(lián)網(wǎng)大數(shù)據(jù)、問(wèn)卷調(diào)查、實(shí)驗(yàn)法等。

數(shù)據(jù)質(zhì)量檢驗(yàn):數(shù)據(jù)的質(zhì)量直接影響項(xiàng)目的成功與否,如果最初始階段不充

分檢驗(yàn)數(shù)據(jù)的質(zhì)量問(wèn)題,在后續(xù)階段發(fā)現(xiàn)問(wèn)題時(shí),則還需要返回修正,將極大地

浪費(fèi)時(shí)間,導(dǎo)致項(xiàng)目效率低下。數(shù)據(jù)質(zhì)量的檢驗(yàn)包括:數(shù)據(jù)的準(zhǔn)確性、數(shù)據(jù)的時(shí)

效性、數(shù)據(jù)的無(wú)偏性、數(shù)據(jù)的全面性、數(shù)據(jù)的隱私保護(hù)等問(wèn)題。

2.3數(shù)據(jù)探索和預(yù)處理階段

數(shù)據(jù)探索和預(yù)處理階段的主要任務(wù)是在第二步基礎(chǔ)上探索數(shù)據(jù)結(jié)構(gòu),并提取

建立模型或解決問(wèn)題所需的數(shù)據(jù),進(jìn)行數(shù)據(jù)建模前的準(zhǔn)備工作,如數(shù)據(jù)的清洗、

集成、轉(zhuǎn)換或規(guī)約等,數(shù)據(jù)的各項(xiàng)準(zhǔn)備工作并無(wú)先后順序,而且該階段也很可能

會(huì)被反復(fù)執(zhí)行。

本流程的要點(diǎn)主要包括以下幾個(gè)方面:

數(shù)據(jù)的描述和探索:對(duì)數(shù)據(jù)的質(zhì)量有基本的把握后,對(duì)收集來(lái)的數(shù)據(jù)進(jìn)行

數(shù)據(jù)的描述和探索,目的是從現(xiàn)有數(shù)據(jù)中提取潛在信息,驗(yàn)證項(xiàng)目中提到的前

提假設(shè),并尋找那些與后續(xù)數(shù)據(jù)分析項(xiàng)目目標(biāo)高度相關(guān)的數(shù)據(jù)等。數(shù)據(jù)的描述

和探索包括:數(shù)據(jù)的缺失和異常、數(shù)據(jù)的集中趨勢(shì)和離散程度、數(shù)據(jù)的對(duì)比分

析、趨勢(shì)分析、相關(guān)性診斷等。

數(shù)據(jù)選擇:數(shù)據(jù)獲取階段的數(shù)據(jù)范圍較廣泛,數(shù)據(jù)選擇是在獲取到的數(shù)據(jù)基

礎(chǔ)上,充分利用現(xiàn)有的業(yè)務(wù)知識(shí)對(duì)項(xiàng)目所需的數(shù)據(jù)進(jìn)行選擇和排除,為下一步分

析做準(zhǔn)備。數(shù)據(jù)的選擇并不是盲目的,有些成熟的問(wèn)題和領(lǐng)域已經(jīng)有相關(guān)的項(xiàng)目

或研究結(jié)論,數(shù)據(jù)分析師在選擇數(shù)據(jù)時(shí)可以借鑒。

數(shù)據(jù)清洗:結(jié)合業(yè)務(wù)問(wèn)題,根據(jù)清洗數(shù)據(jù)的具體方法,采取合適的工具對(duì)數(shù)

據(jù)中存在的缺失值、異常值和數(shù)據(jù)不一致等現(xiàn)象進(jìn)行處理。

11

數(shù)據(jù)集成:將不同位置的數(shù)據(jù)進(jìn)行匹配和合并,以形成面向問(wèn)題的數(shù)據(jù)倉(cāng)庫(kù)。

數(shù)據(jù)轉(zhuǎn)換:根據(jù)后續(xù)分析的要求選擇合適的數(shù)據(jù)轉(zhuǎn)換方式,包括離散化、標(biāo)

準(zhǔn)化、數(shù)據(jù)形態(tài)轉(zhuǎn)化、獨(dú)熱編碼處理等。

數(shù)據(jù)規(guī)約:規(guī)約后的數(shù)據(jù)體量會(huì)小很多,但是仍比較接近原始數(shù)據(jù),目的是

為了后續(xù)的分析更有效,效率更高。數(shù)據(jù)規(guī)約包括:維歸約、數(shù)量歸約和數(shù)據(jù)壓

縮等。

數(shù)據(jù)探索和預(yù)處理階段比較耗時(shí),有統(tǒng)計(jì)表明50%以上的數(shù)據(jù)分析時(shí)間都消

耗在數(shù)據(jù)準(zhǔn)備階段。

2.4數(shù)據(jù)分析階段

該流程是指應(yīng)用合適的數(shù)據(jù)分析軟件,選擇合適的分析方法,對(duì)之前處理好

的數(shù)據(jù)進(jìn)行分析,并識(shí)別出數(shù)據(jù)中潛在知識(shí)和規(guī)律的過(guò)程。分析過(guò)程并非越復(fù)雜

越好,要求數(shù)據(jù)分析師對(duì)分析工具和方法有深刻的認(rèn)識(shí),能在所掌握的眾多方法

中選擇恰當(dāng)?shù)姆椒?,能夠?qū)Ψ治瞿P偷膮?shù)進(jìn)行設(shè)置、調(diào)整和優(yōu)化,能夠基于業(yè)

務(wù)知識(shí)建立簡(jiǎn)潔、易懂、可靠、可解釋性高、準(zhǔn)確率高的分析模型等。

本流程的要點(diǎn)主要包括以下幾個(gè)方面:

分析工具選擇:選擇合適的分析工具,業(yè)務(wù)類的數(shù)據(jù)問(wèn)題可能需要用Excel、

BI等工具等進(jìn)行數(shù)據(jù)分析;開(kāi)發(fā)類的數(shù)據(jù)問(wèn)題可能需要用Python、R等編程語(yǔ)

言搭建算法模型。

分析方法選擇:選擇合適的分析方法,業(yè)務(wù)類的數(shù)據(jù)分析問(wèn)題可能需要用數(shù)

據(jù)透視表、相關(guān)分析、回歸分析等方法進(jìn)行分析,開(kāi)發(fā)類的數(shù)據(jù)問(wèn)題可能需要用

聚類、分類、關(guān)聯(lián)規(guī)則等機(jī)器學(xué)習(xí)算法進(jìn)行分析。

數(shù)據(jù)分析過(guò)程實(shí)施:運(yùn)用合適的方法在特定的工具上展開(kāi)分析,并輸出分析

結(jié)果,給出合理的決策建議。

12

2.5結(jié)果評(píng)估和展示階段

分析完成以后,需要評(píng)估分析結(jié)果的質(zhì)量,評(píng)估過(guò)程要全面,以確保結(jié)果更

符合業(yè)務(wù)要求。如果在評(píng)估過(guò)程中發(fā)現(xiàn)結(jié)果與業(yè)務(wù)目標(biāo)相比仍存在差距,則需要

對(duì)分析過(guò)程進(jìn)行修正,對(duì)分析過(guò)程的修正可能需要重新從第一階段開(kāi)始,通過(guò)反

復(fù)多次的迭代,使結(jié)果更優(yōu)。

本流程的要點(diǎn)主要包括以下幾個(gè)方面:

結(jié)果評(píng)價(jià):依據(jù)技術(shù)手段和實(shí)際商業(yè)范例雙重評(píng)價(jià)標(biāo)準(zhǔn)對(duì)分析結(jié)果和決策建

議進(jìn)行評(píng)估。

分析過(guò)程再檢驗(yàn):從數(shù)據(jù)分析標(biāo)準(zhǔn)流程的第一個(gè)環(huán)節(jié)開(kāi)始檢驗(yàn)分析過(guò)程是否

存在紕漏,若發(fā)現(xiàn)問(wèn)題及時(shí)指出,同時(shí)對(duì)分析過(guò)程重新予以修正,以更加符合實(shí)

踐要求。

數(shù)據(jù)結(jié)果展示:采用簡(jiǎn)單明了的數(shù)據(jù)可視化圖表和文字解釋或形成數(shù)據(jù)分析

報(bào)告來(lái)展示數(shù)據(jù)結(jié)果。

2.6決策落地階段

決策落地階段是對(duì)分析結(jié)果給出的決策建議和知識(shí)進(jìn)行落地,并實(shí)時(shí)檢驗(yàn)過(guò)

程中的效果,與初始目標(biāo)進(jìn)行對(duì)比。實(shí)踐案例中,決策落地一般由企業(yè)用戶來(lái)執(zhí)

行,這也是用戶最關(guān)心的一個(gè)環(huán)節(jié)。所以數(shù)據(jù)分析并不是項(xiàng)目的本質(zhì)目的,目的

是挖掘有用的信息和知識(shí),并將其落地實(shí)現(xiàn),否則則不符合數(shù)據(jù)分析閉環(huán)的要求。

本流程的要點(diǎn)主要包括以下幾個(gè)方面:

決策計(jì)劃制定:制定項(xiàng)目成果如何落地的方案和計(jì)劃。

計(jì)劃執(zhí)行:在執(zhí)行過(guò)程中與項(xiàng)目目標(biāo)進(jìn)行比較,評(píng)估目標(biāo)實(shí)現(xiàn)情況。

項(xiàng)目再檢驗(yàn):如果落地效果一般,則需要層層向上再檢驗(yàn)每個(gè)流程的可能失

誤環(huán)節(jié)。

13

項(xiàng)目成果交付:依照合同要求將項(xiàng)目相關(guān)的資料全部予以交付,同時(shí)按要求

準(zhǔn)備相關(guān)培訓(xùn)和售后服務(wù)等。

14

四、數(shù)據(jù)分析專業(yè)術(shù)語(yǔ)及定義規(guī)范

本章節(jié)基于上一階段的六步流程,給出每個(gè)流程可能涉及的專業(yè)術(shù)語(yǔ)及定義

規(guī)范。

1.業(yè)務(wù)理解階段定義

數(shù)據(jù)分析問(wèn)題:商業(yè)中現(xiàn)實(shí)和理想中的差距。

數(shù)據(jù)分析類型:根據(jù)需要解決的問(wèn)題的不同,數(shù)據(jù)分析的類型可以分為現(xiàn)狀

分析,原因分析和預(yù)測(cè)分析三類,有些綜合的數(shù)據(jù)分析項(xiàng)目可能同時(shí)包含兩類或

三類分析。

現(xiàn)狀分析:是數(shù)據(jù)分析最常見(jiàn)的目標(biāo)之一,包括企業(yè)現(xiàn)狀和競(jìng)爭(zhēng)對(duì)手的現(xiàn)狀

分析等,例如,商家將企業(yè)現(xiàn)有客戶細(xì)分成幾類,總結(jié)每一類的特點(diǎn),并對(duì)每類

客戶展開(kāi)精準(zhǔn)營(yíng)銷,以提高銷售額?,F(xiàn)狀分析要避免落入只描述現(xiàn)狀,沒(méi)有得出

有用結(jié)論的境地,現(xiàn)狀分析要保證結(jié)論的客觀性、準(zhǔn)確性和嚴(yán)謹(jǐn)性等。

原因分析:是對(duì)當(dāng)前存在的問(wèn)題尋找原因,并找出解決問(wèn)題的辦法的分析,

例如,找出機(jī)器發(fā)生故障的可能原因,并加以改進(jìn),從而避免故障再次發(fā)生。原

因分析常常采用多維度分解、對(duì)比分析、提出假設(shè)、驗(yàn)證假設(shè)、相關(guān)性分析、回

歸分析等方法來(lái)實(shí)現(xiàn)。原因分析要避免落入只能發(fā)現(xiàn)原因,不能提出解決問(wèn)題的

辦法的境地,原因分析要保證原因的客觀性和嚴(yán)謹(jǐn)性,解決問(wèn)題的可操作性等。

預(yù)測(cè)分析:是對(duì)企業(yè)未來(lái)的業(yè)務(wù)發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè)。如預(yù)測(cè)企業(yè)下一年度的

銷量,預(yù)測(cè)客戶在未來(lái)一段時(shí)間的流失情況等。

結(jié)構(gòu)化思維:是指面對(duì)分析問(wèn)題時(shí)能夠從多個(gè)角度進(jìn)行思考,全面深刻地剖

析問(wèn)題可能出現(xiàn)的原因,并采用系統(tǒng)的行動(dòng)方案和恰當(dāng)手段解決問(wèn)題的思維。

2.?dāng)?shù)據(jù)收集階段定義

數(shù)據(jù):現(xiàn)實(shí)世界的記錄。

15

信息:獲取并經(jīng)過(guò)處理后的數(shù)據(jù)。

知識(shí):通過(guò)對(duì)信息的分析和匯總而建立起來(lái)的關(guān)于世界的規(guī)律和模型。

數(shù)據(jù)收集:根據(jù)業(yè)務(wù)要求收集相關(guān)數(shù)據(jù)的過(guò)程,收集到的數(shù)據(jù)通常要與業(yè)務(wù)

問(wèn)題高度相,并且需要滿足時(shí)效性、準(zhǔn)確性、無(wú)偏性、可靠性等要求。

總體:所研究的全部個(gè)體的集合。

樣本:在總體中選取的一個(gè)子集。

抽樣:從總體中抽取一部分樣本的過(guò)程,目的是用樣本結(jié)果來(lái)推斷總體。

大數(shù)據(jù):無(wú)法用常規(guī)軟件和工具進(jìn)行收集、存儲(chǔ)和分析等的數(shù)據(jù)集合,具有

大量的(Volume)、高速的(Velocity)、多樣的(Variety)、價(jià)值密度低(Value)

和真實(shí)(Veracity)等特征。

數(shù)據(jù)庫(kù):存儲(chǔ)在計(jì)算機(jī)中的有組織的、可共享的數(shù)據(jù)集合。具有低冗余度、

數(shù)據(jù)獨(dú)立性強(qiáng)、擴(kuò)展性強(qiáng)、可共享等特點(diǎn)。

數(shù)據(jù)倉(cāng)庫(kù):用于支持企業(yè)管理決策的數(shù)據(jù)集合,存儲(chǔ)的一般是歷史數(shù)據(jù)。具

有面向主題、集成的、穩(wěn)定性強(qiáng)、反映歷史變化等特點(diǎn)。

數(shù)據(jù)中臺(tái):數(shù)據(jù)的公共服務(wù)平臺(tái),基于業(yè)務(wù)需求,把企業(yè)各項(xiàng)數(shù)據(jù)收集、加

工整理、封裝以后形成的一個(gè)公共數(shù)據(jù)產(chǎn)品和服務(wù)平臺(tái)。數(shù)據(jù)中臺(tái)的應(yīng)用包括BI

報(bào)表、營(yíng)銷推薦、用戶畫像、風(fēng)險(xiǎn)評(píng)估等。

結(jié)構(gòu)化數(shù)據(jù):也稱為行數(shù)據(jù),由行和列二維表的邏輯結(jié)構(gòu)存儲(chǔ)和表達(dá)的數(shù)據(jù),

通過(guò)關(guān)系型數(shù)據(jù)庫(kù)進(jìn)行存儲(chǔ)和管理。

非結(jié)構(gòu)化數(shù)據(jù):數(shù)據(jù)結(jié)構(gòu)不規(guī)則,不能用結(jié)構(gòu)化數(shù)據(jù)庫(kù)來(lái)存儲(chǔ)的數(shù)據(jù)類型,

包括文檔、圖片、視頻、音頻、XML、HTML等數(shù)據(jù)。

SQL語(yǔ)言:結(jié)構(gòu)化查詢語(yǔ)言,用來(lái)存取、查詢、更新和管理關(guān)系型數(shù)據(jù)庫(kù)的

程序設(shè)計(jì)語(yǔ)言。

16

數(shù)據(jù)集:數(shù)據(jù)的集合,通常每一列代表一個(gè)特定變量,每一行代表某一個(gè)體

的所有變量的數(shù)據(jù),數(shù)據(jù)集通常以二維表的形式出現(xiàn)。

數(shù)據(jù)準(zhǔn)確性:數(shù)據(jù)值代表真實(shí)值的程度,如未經(jīng)校準(zhǔn)的儀器測(cè)量的結(jié)果、錯(cuò)

誤的客戶電話號(hào)碼等,都屬于不準(zhǔn)確的數(shù)據(jù)。

數(shù)據(jù)連貫性:多張表里的數(shù)據(jù)是否能夠以特定的方式組合在一起,如客戶信

息表、訂單信息表和商品信息表能否通過(guò)特定的字段聯(lián)系在一起。

數(shù)據(jù)完整性:數(shù)據(jù)是否有缺失信息,如姓名、聯(lián)系方式等。

數(shù)據(jù)一致性:不同表中的信息是否保持一致,如兩張表中同一客戶的郵件地

址是否一致,如果不一致則要及時(shí)解決。

數(shù)據(jù)明確性:數(shù)據(jù)表中每一個(gè)字段的定義和描述是否明確,只有字段信息明

確才能保證數(shù)據(jù)的質(zhì)量。

數(shù)據(jù)相關(guān)性:數(shù)據(jù)表中,不同字段的信息是否有關(guān)聯(lián),如果數(shù)據(jù)間相關(guān)性很

強(qiáng),則可能存在數(shù)據(jù)信息的冗余。

數(shù)據(jù)時(shí)效性:發(fā)布數(shù)據(jù)和收集數(shù)據(jù)間的時(shí)間間隔,間隔越短代表數(shù)據(jù)的時(shí)效

性越強(qiáng)。

3.?dāng)?shù)據(jù)探索和預(yù)處理階段定義

數(shù)據(jù)探索:即探索性數(shù)據(jù)分析,是一種思維方式,目的為了獲取對(duì)數(shù)據(jù)的初

步理解,如變量的分布、缺失值和異常值、對(duì)數(shù)據(jù)進(jìn)行總結(jié)等,強(qiáng)烈建議將探索

性分析納入到數(shù)據(jù)分析中。

臟數(shù)據(jù):數(shù)據(jù)不在給定的邏輯范圍內(nèi),格式錯(cuò)誤,不規(guī)范編碼或?qū)I(yè)務(wù)毫無(wú)

意義的數(shù)據(jù)。

數(shù)據(jù)缺失:數(shù)據(jù)不完整或有缺失,實(shí)際中的數(shù)據(jù)往往缺失值較多,但很多模

型不能處理含有缺失的數(shù)據(jù)。

17

數(shù)據(jù)重復(fù):相同的記錄在表中多次重復(fù)出現(xiàn)。

集中趨勢(shì):描述一組觀測(cè)值的代表值,指一組數(shù)據(jù)的一般水平,包括均值、

中位數(shù)和眾數(shù)等。

離散趨勢(shì):描述一組觀測(cè)值偏離中心位置的趨勢(shì),包括全距、四分位差、方

差和標(biāo)準(zhǔn)差等。

離散系數(shù):也稱變異系數(shù),是標(biāo)準(zhǔn)差與均值的比值,值越大,說(shuō)明數(shù)據(jù)的離

散程度越大;值越小,說(shuō)明數(shù)據(jù)的離散程度越小。

正態(tài)分布:也稱高斯分布,一組呈正態(tài)分布的數(shù)據(jù)分布曲線呈鐘形,兩頭低、

中間高,左右對(duì)稱。

異常值:樣本中的某些個(gè)別值,其觀測(cè)值明顯偏離其他觀測(cè)值。

皮爾遜相關(guān)系數(shù):衡量數(shù)值型指標(biāo)之間相關(guān)程度的統(tǒng)計(jì)量,一般用字母r

表示。

特征:數(shù)據(jù)和模型間的紐帶。

特征工程:在給定的數(shù)據(jù)、模型和問(wèn)題下篩選出關(guān)鍵特征的過(guò)程。恰當(dāng)?shù)奶?/p>

征選擇是機(jī)器學(xué)習(xí)模型高效輸出的關(guān)鍵。

數(shù)據(jù)清洗:發(fā)現(xiàn)并處理數(shù)據(jù)中的缺失值、異常值和數(shù)據(jù)不一致等情況的過(guò)程。

數(shù)據(jù)集成:將數(shù)據(jù)進(jìn)行合并的過(guò)程,如將各分公司的數(shù)據(jù)合并在一起。

數(shù)據(jù)轉(zhuǎn)換:將數(shù)據(jù)從一種表現(xiàn)形式轉(zhuǎn)換成另一種表現(xiàn)形式的過(guò)程。

數(shù)據(jù)標(biāo)準(zhǔn)化:將原數(shù)據(jù)按照某些計(jì)算方式等比例縮放,使之取值范圍落入一

個(gè)較小的特定區(qū)間內(nèi)。

數(shù)據(jù)歸約:在盡可能保持?jǐn)?shù)據(jù)原狀的情況下,對(duì)數(shù)據(jù)進(jìn)行精簡(jiǎn)。

數(shù)據(jù)降維:將原來(lái)較多的特征重新計(jì)算組合從而形成少量新的特征的過(guò)程。

18

數(shù)據(jù)壓縮:在不丟失有用信息的前提下對(duì)數(shù)據(jù)重新組織來(lái)降低數(shù)據(jù)的冗余

和存儲(chǔ)空間,從而提高數(shù)據(jù)的存儲(chǔ)、處理和運(yùn)算效率。

4.?dāng)?shù)據(jù)分析階段定義

數(shù)據(jù)透視表:通過(guò)字段間的排列組合和相關(guān)聚合運(yùn)算幫助數(shù)據(jù)分析人員發(fā)現(xiàn)

規(guī)律和知識(shí)的一種交互式的表格。

描述性分析:將原始數(shù)據(jù)抽象濃縮成幾個(gè)統(tǒng)計(jì)指標(biāo)的過(guò)程,包括均值、標(biāo)準(zhǔn)

差、中位數(shù)、眾數(shù)等。

推斷分析:用較小的樣本去推斷總體的信息(如參數(shù)、分布或關(guān)系等)的過(guò)

程。

假設(shè)檢驗(yàn):檢驗(yàn)和判斷樣本與樣本間、樣本與總體間的差異是本質(zhì)存在的還

是由抽樣誤差引起的統(tǒng)計(jì)推斷方法。常用的方法是顯著性檢驗(yàn),提前做出某些假

設(shè),然后根據(jù)統(tǒng)計(jì)計(jì)算結(jié)果推斷是接受還是拒絕原假設(shè),常用方法包括:F檢驗(yàn)、

t檢驗(yàn)、Z檢驗(yàn)、卡方檢驗(yàn)等。

算法:解決問(wèn)題的一系列的清晰的策略指令,由規(guī)范的輸入、計(jì)算規(guī)則和輸

出等要素構(gòu)成。

算法模型化:用同一套算法解決不同的問(wèn)題。算法模型化過(guò)程賦予了算法

超強(qiáng)的問(wèn)題遷移能力,比如根據(jù)回歸算法可以開(kāi)發(fā)一套銷量預(yù)測(cè)模型,也可以開(kāi)

發(fā)出一套壽命預(yù)測(cè)模型等。

數(shù)據(jù)建模:將現(xiàn)實(shí)世界的各種數(shù)據(jù)通過(guò)某種抽象的模型組織在一起,目的

在于發(fā)現(xiàn)現(xiàn)實(shí)世界的規(guī)律,提出解決問(wèn)題的辦法。

監(jiān)督學(xué)習(xí):有一組已知類別的樣本,通過(guò)建立一個(gè)學(xué)習(xí)模型,使模型能夠在

給定的輸入狀態(tài)下,通過(guò)調(diào)整參數(shù)的設(shè)置,對(duì)已知的類別做出較精確的預(yù)測(cè)的過(guò)

程。監(jiān)督學(xué)習(xí)將數(shù)據(jù)集分為兩部分,訓(xùn)練集和測(cè)試集,訓(xùn)練集用于訓(xùn)練預(yù)測(cè)模型,

測(cè)試集用于對(duì)模型的結(jié)果進(jìn)行檢驗(yàn)。

19

非監(jiān)督學(xué)習(xí):不事先對(duì)數(shù)據(jù)進(jìn)行標(biāo)記,直接對(duì)數(shù)據(jù)進(jìn)行建模的學(xué)習(xí)過(guò)程,因

此,針對(duì)輸入數(shù)據(jù)事先并不知道輸出結(jié)果是什么。

5.結(jié)果評(píng)估和展示階段定義

數(shù)據(jù)可視化:借助圖表等可視化工具,準(zhǔn)確傳遞數(shù)據(jù)分析結(jié)論的手段,目的

在于獲取復(fù)雜數(shù)據(jù)的直觀、深刻洞察。

A/Btest:根據(jù)分析結(jié)果,為同一個(gè)業(yè)務(wù)目標(biāo)制定兩個(gè)或多個(gè)不同的方案,

以此來(lái)比較和評(píng)價(jià)最優(yōu)方案的實(shí)驗(yàn)方法。比如針對(duì)流失用戶采取召回策略,比較

免費(fèi)贈(zèng)送一個(gè)月的VIP和發(fā)放20元優(yōu)惠券兩個(gè)激勵(lì)措施哪個(gè)效果更優(yōu)。

誤差:模型結(jié)果與真實(shí)結(jié)果之間的差距,反映了模型的有效性。

時(shí)間復(fù)雜度:描述算法運(yùn)行時(shí)間的函數(shù)。

魯棒性:模型在受到外力干擾的情況下,仍可維持某些性能的特性。也就是

模型有較高的精度,若出現(xiàn)較小的偏差,對(duì)模型只能產(chǎn)生較小影響,若出現(xiàn)較大

偏差,也不會(huì)對(duì)模型產(chǎn)生致命影響。

可擴(kuò)展性:模型處理大數(shù)據(jù)集的能力。

可解釋性:模型的可理解性,如決策樹(shù)的分類規(guī)則很容易被使用者理解,但

是神經(jīng)網(wǎng)絡(luò)分類模型則把過(guò)程設(shè)計(jì)成一個(gè)黑箱,不容易解釋。

6.決策落地階段定義

決策落地:將數(shù)據(jù)分析理論建議轉(zhuǎn)化為實(shí)踐的過(guò)程。

20

五、基礎(chǔ)共性參考

1.業(yè)務(wù)范圍

服務(wù)范圍包括大數(shù)據(jù)咨詢服務(wù)、大數(shù)據(jù)分析服務(wù)、大數(shù)據(jù)產(chǎn)品服務(wù)。

大數(shù)據(jù)咨詢服務(wù)是幫助企業(yè)梳理數(shù)據(jù)化資產(chǎn),提高數(shù)據(jù)質(zhì)量,做好數(shù)據(jù)規(guī)劃,

使得數(shù)據(jù)處于有序管理的狀態(tài),管理數(shù)據(jù)的目標(biāo)使其數(shù)據(jù)以合理的方式組合在一

起,以便為后期的數(shù)據(jù)分析和數(shù)據(jù)服務(wù)打好基礎(chǔ)。大數(shù)據(jù)咨詢服務(wù)包括:數(shù)據(jù)治

理服務(wù)、企業(yè)大數(shù)據(jù)轉(zhuǎn)型規(guī)劃等。

大數(shù)據(jù)分析服務(wù)是幫助企業(yè)進(jìn)行數(shù)據(jù)整理、處理、計(jì)算、分析、計(jì)量、研究

等,分析企業(yè)現(xiàn)有的狀況,建立一個(gè)強(qiáng)大的數(shù)據(jù)基礎(chǔ),然后將現(xiàn)有數(shù)據(jù)價(jià)值挖掘

出來(lái),不僅可以幫助企業(yè)優(yōu)化內(nèi)部的管理,還可以幫助企業(yè)制定正確的市場(chǎng)營(yíng)銷

方案,借助信息的力量幫助優(yōu)化經(jīng)營(yíng)業(yè)績(jī),轉(zhuǎn)化為商業(yè)價(jià)值,助力企業(yè)騰飛。

大數(shù)據(jù)產(chǎn)品服務(wù)指大數(shù)據(jù)咨詢服務(wù)和大數(shù)據(jù)分析服務(wù)形成的成果進(jìn)行商業(yè)

化、落地執(zhí)行的產(chǎn)物,固化成大數(shù)據(jù)產(chǎn)品,更好的服務(wù)企業(yè)本身發(fā)展,同時(shí)也可

以更好的進(jìn)行技術(shù)推廣,幫助更多企業(yè)的發(fā)展,帶動(dòng)整個(gè)行業(yè)的進(jìn)步。

1.1大數(shù)據(jù)咨詢服務(wù)

當(dāng)今的業(yè)務(wù)發(fā)展速度意味著變革不再是可選項(xiàng),數(shù)字化轉(zhuǎn)型已經(jīng)達(dá)成共識(shí)。

大數(shù)據(jù)咨詢服務(wù)指依托大數(shù)據(jù)專業(yè)知識(shí)優(yōu)勢(shì),幫助企業(yè)進(jìn)行數(shù)據(jù)管理咨詢服務(wù),

幫助企業(yè)將數(shù)據(jù)向信息、知識(shí)、智慧邁進(jìn),提高數(shù)據(jù)質(zhì)量,在數(shù)據(jù)安全的前提下

更好的進(jìn)行數(shù)據(jù)服務(wù),釋放數(shù)據(jù)價(jià)值,助力數(shù)字化轉(zhuǎn)型。

1.1.1數(shù)字化轉(zhuǎn)型方案咨詢服務(wù)

數(shù)字化轉(zhuǎn)型方案(企業(yè)數(shù)字化轉(zhuǎn)型解決方案、信息系統(tǒng)生態(tài)建設(shè)方案、數(shù)據(jù)

綜合平臺(tái)解決方案),通過(guò)分析公司目前大數(shù)據(jù)信息化現(xiàn)狀、同業(yè)的大數(shù)據(jù)發(fā)展

情況、以及行業(yè)趨勢(shì)、監(jiān)管要求,結(jié)合公自身發(fā)展規(guī)劃,設(shè)計(jì)數(shù)字化轉(zhuǎn)型方案,

21

包括組織架構(gòu)、制度保障、團(tuán)隊(duì)建設(shè)等方面,同時(shí)制定未來(lái)藍(lán)圖規(guī)劃,實(shí)施路徑,

實(shí)施方案等,幫助企業(yè)快速進(jìn)行數(shù)字化變革。

1.1.2企業(yè)大數(shù)據(jù)治理咨詢

大數(shù)據(jù)管理咨詢(數(shù)據(jù)治理咨詢服務(wù)),通過(guò)分析公司現(xiàn)有的數(shù)據(jù)情況,結(jié)

合政策監(jiān)管要求和公司業(yè)務(wù)發(fā)展需要、以及大數(shù)據(jù)技術(shù)的不斷更新,制定數(shù)據(jù)治

理體系藍(lán)圖規(guī)劃,幫助企業(yè)進(jìn)行數(shù)據(jù)架構(gòu)設(shè)計(jì)、數(shù)據(jù)模型設(shè)計(jì)、數(shù)據(jù)生命周期管

理、標(biāo)準(zhǔn)化管理、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)安全管理、數(shù)據(jù)資產(chǎn)管理、元數(shù)據(jù)管理、

主數(shù)據(jù)管理、數(shù)據(jù)集成與共享服務(wù)等一系列的數(shù)據(jù)管理服務(wù),使得企業(yè)夯實(shí)數(shù)據(jù)

基礎(chǔ),建立合理、科學(xué)的數(shù)據(jù)治理體系,提升數(shù)據(jù)質(zhì)量和數(shù)據(jù)應(yīng)用水平,從而提

高公司的價(jià)值創(chuàng)造能力和風(fēng)險(xiǎn)管理水平。

1.2大數(shù)據(jù)分析服務(wù)

1.2.1企業(yè)經(jīng)營(yíng)數(shù)據(jù)分析服務(wù)

企業(yè)經(jīng)營(yíng)數(shù)據(jù)分析服務(wù)一般包括采購(gòu)和供應(yīng)鏈管理分析、生產(chǎn)管理數(shù)據(jù)分析、

質(zhì)量管理數(shù)據(jù)分析、銷售數(shù)據(jù)分析、營(yíng)銷數(shù)據(jù)分析、市場(chǎng)數(shù)據(jù)分析、財(cái)務(wù)分析、

客戶分析、產(chǎn)品分析、人力資源分析、經(jīng)營(yíng)分析等通過(guò)數(shù)據(jù)的科學(xué)分析可以助力

企業(yè)高速發(fā)展,幫助領(lǐng)導(dǎo)層量化決策。

采購(gòu)和供應(yīng)鏈管理分析:采購(gòu)優(yōu)化數(shù)據(jù)分析(最優(yōu)采購(gòu)量、最佳庫(kù)存量、庫(kù)

存優(yōu)化等);運(yùn)輸問(wèn)題(最優(yōu)運(yùn)輸路徑、最優(yōu)供貨順序、最優(yōu)路徑問(wèn)題等);供

應(yīng)商遴選和評(píng)估分析;供應(yīng)商風(fēng)險(xiǎn)分析(商業(yè)風(fēng)險(xiǎn)、信用風(fēng)險(xiǎn)、生產(chǎn)風(fēng)險(xiǎn)、安

全風(fēng)險(xiǎn)等);產(chǎn)業(yè)集群分析;供應(yīng)鏈優(yōu)化分析;招投標(biāo)數(shù)據(jù)分析;采購(gòu)品質(zhì)檢驗(yàn)

數(shù)據(jù)分析;價(jià)格預(yù)測(cè)分析(大宗商品價(jià)格、物料價(jià)格、部件價(jià)格估算、價(jià)格波動(dòng)

趨勢(shì)預(yù)測(cè)等)等。

生產(chǎn)管理數(shù)據(jù)分析:包括生產(chǎn)效率數(shù)據(jù)分析;產(chǎn)能優(yōu)化數(shù)據(jù)分析;生產(chǎn)流程

優(yōu)化數(shù)據(jù)分析;生產(chǎn)監(jiān)控?cái)?shù)據(jù)分析;產(chǎn)品回溯管理數(shù)據(jù)分析;生產(chǎn)浪費(fèi)數(shù)據(jù)分

析(物料浪費(fèi)、生產(chǎn)時(shí)間閑置、工人閑置、資金占用、能源浪費(fèi)等);生產(chǎn)成本

22

核算數(shù)據(jù)分析;生產(chǎn)成本控制數(shù)據(jù)分析;庫(kù)存優(yōu)化數(shù)據(jù)分析;生產(chǎn)管理系統(tǒng)構(gòu)建

和數(shù)據(jù)分析系統(tǒng)服務(wù)等。

質(zhì)量管理數(shù)據(jù)分析:品質(zhì)優(yōu)化數(shù)據(jù)分析;品質(zhì)監(jiān)控?cái)?shù)據(jù)分析;品質(zhì)事故預(yù)警

數(shù)據(jù)分析;品質(zhì)管理流程優(yōu)化數(shù)據(jù)分析等。

銷售管理數(shù)據(jù)分析:銷售人員有效性數(shù)據(jù)分析;銷售費(fèi)用有效性數(shù)據(jù)分析;

銷售活動(dòng)有效性數(shù)據(jù)分析;銷售人員管理數(shù)據(jù)分析;大客戶銷售流程分析(如漏

斗模型);銷售策略有效性評(píng)估分析;樣品使用有效性數(shù)據(jù)分析;門店管理數(shù)據(jù)

分析;相似業(yè)務(wù)單元相對(duì)有效性評(píng)價(jià)等。

營(yíng)銷數(shù)據(jù)分析:價(jià)格、銷量預(yù)測(cè)數(shù)據(jù)分析;廣告測(cè)試數(shù)據(jù)分析;概念測(cè)試數(shù)

據(jù)分析;品牌測(cè)試、品牌健康度監(jiān)測(cè)等數(shù)據(jù)分析;口碑監(jiān)測(cè)、輿情監(jiān)測(cè)等數(shù)據(jù)分

析;營(yíng)銷費(fèi)用控制數(shù)據(jù)分析;媒體監(jiān)測(cè)數(shù)據(jù)分析;媒體費(fèi)用優(yōu)化(最優(yōu)決策問(wèn)題、

費(fèi)用配比問(wèn)題);媒體投入產(chǎn)出效率分析;營(yíng)銷活動(dòng)損益數(shù)據(jù)分析;社交媒體數(shù)

據(jù)分析;廣告效果評(píng)價(jià)數(shù)據(jù)分析;渠道數(shù)據(jù)分析等。

市場(chǎng)數(shù)據(jù)分析:宏觀經(jīng)濟(jì)研究數(shù)據(jù)分析服務(wù);行業(yè)研究數(shù)據(jù)分析;長(zhǎng)期行業(yè)

數(shù)據(jù)監(jiān)測(cè)和數(shù)據(jù)分析服務(wù);市場(chǎng)專項(xiàng)研究數(shù)據(jù)分析服務(wù);產(chǎn)品測(cè)試數(shù)據(jù)分析服務(wù);

競(jìng)爭(zhēng)情報(bào)、市場(chǎng)監(jiān)測(cè)等數(shù)據(jù)分析;市場(chǎng)預(yù)測(cè)數(shù)據(jù)分析服務(wù);專利或者技術(shù)跟蹤數(shù)

據(jù)分析服務(wù)等。

財(cái)務(wù)分析:財(cái)務(wù)分析包括企業(yè)的償債能力、營(yíng)運(yùn)能力、盈利能力、資金實(shí)力

等方面,財(cái)務(wù)分析包括財(cái)務(wù)報(bào)表數(shù)據(jù)分析、稅務(wù)優(yōu)化數(shù)據(jù)分析、財(cái)務(wù)規(guī)劃、現(xiàn)金

流規(guī)劃數(shù)據(jù)分析;現(xiàn)金流預(yù)算、預(yù)測(cè)、預(yù)警系統(tǒng);企業(yè)信用管理系統(tǒng);全面預(yù)算

數(shù)據(jù)分析;成本優(yōu)化數(shù)據(jù)分析;ABC成本核算系統(tǒng)構(gòu)建及數(shù)據(jù)分析;財(cái)務(wù)指標(biāo)管

理和控制方案;全面財(cái)務(wù)管理分析,幫助企業(yè)做好資產(chǎn)負(fù)債平衡管理,找到適合

的籌資策略,更好的做好預(yù)算規(guī)劃。

客戶分析:指通過(guò)客戶的基礎(chǔ)屬性、行為習(xí)慣以及對(duì)客戶社交等情況的分析,

進(jìn)行客戶分群管理、完善客戶360度畫像,幫助企業(yè)深入了解客戶行為偏好和需

求特征;同時(shí)通過(guò)客戶社交行為分析,可以利用社交圈子提高營(yíng)銷效率、改進(jìn)服

23

務(wù),低成本擴(kuò)大產(chǎn)品影響力。完善的客戶分析體系幫助企業(yè)進(jìn)行精準(zhǔn)營(yíng)銷、實(shí)時(shí)

營(yíng)銷以及個(gè)性化推薦。客戶分析包括客戶數(shù)據(jù)分析、客戶需求量化分析;客戶滿

意度量化分析;客戶言論(評(píng)價(jià)、反饋、投訴等)分析;客戶細(xì)分;客戶定位數(shù)

據(jù)分析服務(wù);客戶價(jià)值(包括生命周期價(jià)值)數(shù)據(jù)分析;客戶風(fēng)險(xiǎn)分析(流失

風(fēng)險(xiǎn)、商業(yè)風(fēng)險(xiǎn)、信用風(fēng)險(xiǎn)等);營(yíng)銷活動(dòng)客戶響應(yīng)度分析;潛在客戶行為分析;

新產(chǎn)品設(shè)計(jì)數(shù)據(jù)分析等。

產(chǎn)品分析:指從產(chǎn)品定位、產(chǎn)品設(shè)計(jì)、產(chǎn)品價(jià)格測(cè)試、產(chǎn)品市場(chǎng)預(yù)測(cè)、產(chǎn)品

運(yùn)營(yíng)等多方面進(jìn)行產(chǎn)品分析服務(wù),幫助企業(yè)打造產(chǎn)品,滿足消費(fèi)者需求,提升產(chǎn)

品市場(chǎng)競(jìng)爭(zhēng)力。

人力資源分析:人才是企業(yè)發(fā)展的核心競(jìng)爭(zhēng)力,優(yōu)秀的團(tuán)隊(duì),效率與創(chuàng)意并

存時(shí),才能在新的市場(chǎng)上一舉成功。人力資源分析通過(guò)分析人力資源結(jié)構(gòu)分析,

包括人力資源數(shù)量分析、人員類別分析、工作人員素質(zhì)分析、人員年齡結(jié)構(gòu)分析、

職位結(jié)構(gòu)分析人力資源管理數(shù)據(jù)分析:人力成本核算數(shù)據(jù)分析;培訓(xùn)調(diào)研數(shù)據(jù)分

析(培訓(xùn)需求調(diào)研、培訓(xùn)效果調(diào)研等);企業(yè)文化調(diào)研數(shù)據(jù)分析;員工滿意度、

薪酬滿意度調(diào)研數(shù)據(jù)分析;組織績(jī)效評(píng)價(jià)數(shù)據(jù)分析;稀缺人才產(chǎn)出分析模型和高

級(jí)人才能力評(píng)估模型;招聘效果評(píng)價(jià);人力資源規(guī)劃數(shù)據(jù)分析;人員績(jī)效關(guān)聯(lián)分

析;人員產(chǎn)出評(píng)價(jià)模型(人當(dāng)產(chǎn)出率、元當(dāng)產(chǎn)出率等);激勵(lì)效果評(píng)價(jià)模型分

析;人事制度系統(tǒng)優(yōu)化分析;職業(yè)生涯價(jià)值分析等方面,通過(guò)人力資源規(guī)劃,幫

助企業(yè)更好的進(jìn)行人才培養(yǎng),團(tuán)隊(duì)建設(shè),形成真正的核心競(jìng)爭(zhēng)力。

經(jīng)營(yíng)管理數(shù)據(jù)分析:企業(yè)運(yùn)營(yíng)管理流程數(shù)據(jù)分析;任務(wù)管理和計(jì)劃管理數(shù)據(jù)

分析;工程管理數(shù)據(jù)分析;項(xiàng)目管理數(shù)據(jù)分析;流程優(yōu)化及流程價(jià)值創(chuàng)出數(shù)據(jù)分

析;組織效率數(shù)據(jù)分析;組織績(jī)效評(píng)價(jià)系統(tǒng)建設(shè);組織運(yùn)營(yíng)指標(biāo)系統(tǒng)構(gòu)建等。通

過(guò)分析企業(yè)的預(yù)算達(dá)成情況、業(yè)績(jī)歸因分析、成本分?jǐn)偡治觥⑹杖肜麧?rùn)分析、競(jìng)

對(duì)分析、預(yù)警分析、預(yù)測(cè)分析等方面,更好的幫助企業(yè)做到知己知彼,量化經(jīng)營(yíng)

決策。

24

1.2.2大數(shù)據(jù)行業(yè)分析報(bào)告

大數(shù)據(jù)行業(yè)分析報(bào)告包含行業(yè)研究報(bào)告、大數(shù)據(jù)商業(yè)洞察報(bào)告、市場(chǎng)趨勢(shì)預(yù)

判等,屬于偏綜合性的年度、半年度報(bào)告,針對(duì)不同的專題有相應(yīng)更為專業(yè)的方

法和分析模塊,整體分析內(nèi)容有經(jīng)典理論和客觀的數(shù)據(jù)支撐。從宏觀、行業(yè)、企

業(yè)進(jìn)行自上而下的行業(yè)大數(shù)據(jù)分析服務(wù),包括借用外部信息進(jìn)行宏觀經(jīng)濟(jì)政策分

析、行業(yè)發(fā)展環(huán)境分析、同業(yè)領(lǐng)先頭部分析、競(jìng)爭(zhēng)對(duì)手分析,同時(shí)依據(jù)自身大數(shù)

據(jù)的發(fā)展,分析企業(yè)自身經(jīng)營(yíng)情況、客戶畫像、產(chǎn)品特色、營(yíng)銷策略分析,預(yù)測(cè)

行業(yè)發(fā)展趨勢(shì),指導(dǎo)企業(yè)量化決策,順勢(shì)而為,抓住機(jī)遇。

1.2.3投資決策數(shù)據(jù)分析服務(wù)

投資決策數(shù)據(jù)分析服務(wù)包括實(shí)業(yè)投資和金融投資,提供量化投資、項(xiàng)目可行

性分析報(bào)告、項(xiàng)目投資風(fēng)險(xiǎn)報(bào)告等,數(shù)據(jù)分析師可以通過(guò)現(xiàn)金流估值模型、以及

依托大數(shù)據(jù),進(jìn)行技術(shù)分析和基本面分析、金融風(fēng)控模型,全面進(jìn)行金融產(chǎn)品估

值和風(fēng)險(xiǎn)測(cè)量,對(duì)于預(yù)測(cè)類金融投資進(jìn)行歷史推演、蒙特卡洛模擬等測(cè)算投資收

益,幫助企業(yè)在一定的約束條件下,通過(guò)規(guī)劃求解,給出最合理的投資組合和可

行性的方案,幫助企業(yè)實(shí)現(xiàn)效益最大化。

實(shí)業(yè)投資分析,針對(duì)項(xiàng)目類的實(shí)體經(jīng)濟(jì)投資,進(jìn)行費(fèi)用效果法分析(費(fèi)用現(xiàn)

值法、費(fèi)用年值法);邊際分析法(動(dòng)態(tài)路徑?jīng)Q策法);成本法(技術(shù)資產(chǎn)價(jià)值

估值、重置全價(jià)、成新率);收益法(超額收益分析、收益分成分析);期權(quán)法

(Black-Scholes模型);實(shí)業(yè)投資數(shù)據(jù)編制與估算表(資金的時(shí)間價(jià)值分析、

年金的系列計(jì)算);實(shí)業(yè)投資運(yùn)營(yíng)后的資產(chǎn)負(fù)債表預(yù)估(科目預(yù)估)、現(xiàn)金流量

表(科目預(yù)估)、收入利潤(rùn)表預(yù)估(科目預(yù)估);指標(biāo)類分析(投資收益率分析、

投資回收期、凈現(xiàn)值、內(nèi)部收益率、獲利能力指數(shù));不確定性分析(盈虧平衡

分析、敏感性分析、蒙特卡洛分析),定性風(fēng)險(xiǎn)分析(概率分析),其他風(fēng)險(xiǎn)分

析(宏觀層面:政策風(fēng)險(xiǎn)分析、經(jīng)濟(jì)風(fēng)險(xiǎn)分析、文化風(fēng)險(xiǎn)、市場(chǎng)風(fēng)險(xiǎn)分析、技術(shù)

風(fēng)險(xiǎn)分析;微觀層面:企業(yè)自身的指標(biāo)分析;個(gè)人層面:心態(tài)和心理素質(zhì)分析)。

金融投資分析:固收類金融分析(債券類);權(quán)益類分析(股票類)、衍生

品投資(期貨、遠(yuǎn)期、互換、期權(quán)等)、另類投資(大宗商品交易、房地產(chǎn)交易、

25

PE、VC等),以及金融組合投資分析(私人財(cái)富規(guī)劃、理財(cái)規(guī)劃、基金組合類),

基礎(chǔ)面分析采用的分析方法為估值分析(現(xiàn)金流折現(xiàn)類模型、公司經(jīng)營(yíng)分析、宏

觀經(jīng)濟(jì)分析等),技術(shù)類分析采用現(xiàn)代化的人工智能、數(shù)據(jù)挖掘、小波分析、支

持向量機(jī)、分形理論、隨機(jī)過(guò)程等方法去進(jìn)行量化選股、量化擇時(shí)、股指套利、

商品套利、統(tǒng)計(jì)套利、算法交易、另類套利等一系列投資決策過(guò)程。

1.2.4企業(yè)風(fēng)險(xiǎn)數(shù)據(jù)分析服務(wù)

風(fēng)險(xiǎn)數(shù)據(jù)分析針對(duì)金融類行業(yè)更為關(guān)鍵,企業(yè)風(fēng)險(xiǎn)控制是對(duì)貸款用戶的信用

風(fēng)險(xiǎn)進(jìn)行合理度量,是信貸業(yè)務(wù)關(guān)注的首要問(wèn)題。風(fēng)險(xiǎn)數(shù)據(jù)分析指通過(guò)用戶信息

對(duì)用戶的信用度進(jìn)行評(píng)估,并根據(jù)信用情況定制風(fēng)險(xiǎn)規(guī)避策略,也就是對(duì)用戶風(fēng)

險(xiǎn)進(jìn)行管理和規(guī)避的過(guò)程。通過(guò)風(fēng)險(xiǎn)數(shù)據(jù)分析,幫助企業(yè)識(shí)別風(fēng)險(xiǎn)用戶,對(duì)用戶

信用風(fēng)險(xiǎn)進(jìn)行合理度量,提升企業(yè)量化風(fēng)險(xiǎn)管理能力。

1.3大數(shù)據(jù)產(chǎn)品研發(fā)服務(wù)

數(shù)字化轉(zhuǎn)型,企業(yè)業(yè)務(wù)升級(jí)離不開(kāi)技術(shù)工具的支持,數(shù)據(jù)分析師在日常的研

究工作當(dāng)中,沉淀相應(yīng)的知識(shí)體系和業(yè)務(wù)經(jīng)驗(yàn),固化分析流程,轉(zhuǎn)換成技術(shù)類產(chǎn)

品,降低技術(shù)門檻,普及企業(yè)應(yīng)用。

數(shù)據(jù)管控工具包括元數(shù)據(jù)管理工具、數(shù)據(jù)質(zhì)量管理工具、數(shù)據(jù)標(biāo)準(zhǔn)管理工具、

數(shù)據(jù)安全管理工具(安全標(biāo)準(zhǔn)、安全監(jiān)控、權(quán)限管控)、數(shù)據(jù)模型管理、數(shù)據(jù)生

命周期管理工具、數(shù)據(jù)資產(chǎn)管理等。

元數(shù)據(jù)管理工具:管理EDW建設(shè)過(guò)程中涉及的業(yè)務(wù)、技術(shù)元數(shù)據(jù),元數(shù)據(jù)范

圍包括系統(tǒng)信息、數(shù)據(jù)庫(kù)信息、表視圖信息、數(shù)據(jù)文件信息、數(shù)據(jù)映射信息。提

供圖形化展現(xiàn)邏輯模型的功能;管理EDW對(duì)外供數(shù)的數(shù)據(jù)文件信息,為業(yè)務(wù)人員

提供分析數(shù)據(jù)需求的查詢平臺(tái)。

數(shù)據(jù)質(zhì)量管理工具:數(shù)據(jù)質(zhì)量是指數(shù)據(jù)對(duì)其期望目的的切合度,即從使用者

的角度出發(fā),數(shù)據(jù)滿足用戶使用要求的程度。幫助數(shù)據(jù)分析師及時(shí)發(fā)現(xiàn)數(shù)據(jù)中的

26

錯(cuò)誤、挖掘數(shù)據(jù)價(jià)值,保證數(shù)據(jù)的有效性、一致性、準(zhǔn)確性,為客戶數(shù)據(jù)管理

服務(wù)。

數(shù)據(jù)標(biāo)準(zhǔn)管理工具:數(shù)據(jù)標(biāo)準(zhǔn)是對(duì)數(shù)據(jù)的規(guī)范化,包括業(yè)務(wù)屬性的規(guī)范化和

技術(shù)屬性的規(guī)范化,以及數(shù)據(jù)的歸屬管理。保證數(shù)據(jù)的規(guī)范化、標(biāo)準(zhǔn)化。

數(shù)據(jù)安全管理工具:數(shù)據(jù)安全管理主要涵蓋數(shù)據(jù)的安全加密管理和數(shù)據(jù)的權(quán)

限管理,通過(guò)對(duì)企業(yè)數(shù)據(jù)的分類分級(jí),按照不通的安全級(jí)別,幫助企業(yè)在數(shù)據(jù)采

集、接入、加工、傳輸過(guò)程進(jìn)行不同級(jí)別的安全管控,防止信息泄露。

數(shù)據(jù)模型管理工具:數(shù)據(jù)模型管理工具方便企業(yè)對(duì)數(shù)據(jù)架構(gòu)直觀理解,同時(shí)

可以進(jìn)行數(shù)據(jù)模型Mapping的腳本一鍵生成,加快數(shù)倉(cāng)建設(shè),同時(shí)可以對(duì)模型進(jìn)

行事前、事中、事后的模型管理。

數(shù)據(jù)生命周期周期管理工具:數(shù)據(jù)生命周期,通常是指某個(gè)集合的數(shù)據(jù)從產(chǎn)

生或獲取到銷毀的過(guò)程。數(shù)據(jù)全生命周期分為:采集、存儲(chǔ)、整合、分析與應(yīng)用、

歸檔和銷毀幾個(gè)階段。在數(shù)據(jù)的生命周期中,數(shù)據(jù)價(jià)值決定著數(shù)據(jù)全生命周期的

長(zhǎng)度,并且數(shù)據(jù)價(jià)值會(huì)隨著時(shí)間的變化而遞減。同時(shí),數(shù)據(jù)的采集粒度與時(shí)效性、

存儲(chǔ)方式、整合狀況、可視化程度、分析的深度和應(yīng)用銜接的程度,都會(huì)影響數(shù)

據(jù)價(jià)值。所以需針對(duì)數(shù)據(jù)生命周期各個(gè)階段的特點(diǎn)采取不同的管理方法和控制手

段,這樣才能從數(shù)據(jù)中挖掘出更多有效的數(shù)據(jù)價(jià)值。數(shù)據(jù)生命周期管理工具幫助

企業(yè)優(yōu)化大數(shù)據(jù)的生命周期管理,使企業(yè)數(shù)據(jù)運(yùn)行效率更高。

數(shù)據(jù)資產(chǎn)管理工具:數(shù)據(jù)地圖,幫忙企業(yè)梳理數(shù)據(jù)資產(chǎn),盤點(diǎn)數(shù)據(jù)資產(chǎn),釋

放數(shù)據(jù)價(jià)值。

上層應(yīng)用數(shù)據(jù)產(chǎn)品包括指標(biāo)管理、BI可視化、標(biāo)簽管理、客戶畫像、關(guān)系圖

譜、數(shù)據(jù)服務(wù)(IDmapping、API標(biāo)準(zhǔn)化接口服務(wù))、聯(lián)邦學(xué)習(xí)(聯(lián)合建模)、AI

實(shí)驗(yàn)室,幫助企業(yè)釋放數(shù)據(jù)價(jià)值。

指標(biāo)管理:指標(biāo)管理是BI可視化的基礎(chǔ),支持BI可視化靈活應(yīng)用;幫助企

業(yè)靈活高效的報(bào)表分析。

27

BI可視化:支持報(bào)表展示、圖表展示、PC端、手機(jī)端、大屏端三端統(tǒng)一,

幫,幫助企業(yè)進(jìn)行經(jīng)營(yíng)分析、管理駕駛艙靈活使用。

標(biāo)簽管理:客戶標(biāo)簽是客戶畫像的基礎(chǔ),進(jìn)行標(biāo)簽體系管理;

客戶畫像:客戶畫像是客戶分析的主要商業(yè)應(yīng)用,進(jìn)行客戶分群管理和精準(zhǔn)

營(yíng)銷推薦。

關(guān)系圖譜:對(duì)于社交關(guān)系或者關(guān)系類數(shù)據(jù),進(jìn)行關(guān)系圖譜展示和圖計(jì)算,更

加直觀,運(yùn)行效率更快。

數(shù)據(jù)服務(wù):數(shù)據(jù)資產(chǎn)的商業(yè)化價(jià)值實(shí)現(xiàn),統(tǒng)一視圖管理,對(duì)外服務(wù)標(biāo)準(zhǔn)化接

口管理。

聯(lián)邦學(xué)習(xí):聯(lián)合建模平臺(tái),幫助企業(yè)進(jìn)行數(shù)據(jù)模型共建,共享大數(shù)據(jù)建模成

功。

AI實(shí)驗(yàn)室:數(shù)據(jù)挖掘和人工智能實(shí)驗(yàn)工廠,是自動(dòng)算法工程和自定義算法

雙驅(qū)動(dòng),幫助數(shù)據(jù)分析師和業(yè)務(wù)人員均可使用的算法畫布,支持算法測(cè)試成功后

一鍵生產(chǎn)部署。

智能營(yíng)銷(營(yíng)銷中心、策略中心、觸達(dá)中心、推薦中心、運(yùn)營(yíng)中心):提供

營(yíng)銷策略開(kāi)發(fā)、推送策略規(guī)則配置、推薦算法策略。

智能風(fēng)控(智能反欺詐、智能預(yù)警、智能決策、智能催收、風(fēng)險(xiǎn)運(yùn)營(yíng)):提

供相應(yīng)模塊的計(jì)算規(guī)則、模型算法等服務(wù),與開(kāi)發(fā)融合,形成智能化、標(biāo)準(zhǔn)化產(chǎn)

品。

28

2.市場(chǎng)調(diào)研參考收費(fèi)方式

2.1按人天服務(wù)收費(fèi)

2.1.1使用場(chǎng)景

該收費(fèi)模式適用于大數(shù)據(jù)咨詢服務(wù)類項(xiàng)目,計(jì)費(fèi)按照相應(yīng)人員實(shí)際參與的工

作日計(jì)費(fèi),以下收費(fèi)方式為市場(chǎng)調(diào)研價(jià)格,僅供參考。

2.1.2調(diào)研收費(fèi)參考

大數(shù)據(jù)咨詢類人天服務(wù)調(diào)研參考

表2-1大數(shù)據(jù)咨詢專家服務(wù)調(diào)研參考收費(fèi)表(單位:元)

地域維度一線城市新一線城市二線城市三線城市四五線城市

人員等級(jí)(系數(shù):1.00)(系數(shù):0.85)(系數(shù):0.6)(系數(shù):0.5)(系數(shù):0.4)

特聘專家6,0005,1003,6003,0002,400

資深專家5,0004,2503,0002,5002,000

優(yōu)秀專家4,0003,5002,4002,0001,600

高級(jí)大數(shù)據(jù)

3,5002,9752,1001,7501,400

咨詢顧問(wèn)

中級(jí)大數(shù)據(jù)

2,5002,1251,5001,2501,000

咨詢顧問(wèn)

初級(jí)大數(shù)據(jù)

1,5001,275900750600

咨詢顧問(wèn)

29

數(shù)據(jù)分析服務(wù)類人天服務(wù)調(diào)研參考

表2-2數(shù)據(jù)分析專家人才服務(wù)調(diào)研參考收費(fèi)表(單位:元)

地域維度一線城市新一線城市二線城市三線城市四五線城市

人員等級(jí)(系數(shù):1.00)(系數(shù):0.85)(系數(shù):0.6)(系數(shù):0.5)(系數(shù):0.4)

特聘數(shù)據(jù)分

6,0005,1003,6003,0002,400

析師專家

資深數(shù)據(jù)分

5,0004,2503,0002,5002,000

析師學(xué)家

優(yōu)秀數(shù)據(jù)分

4,0003,5002,4002,0001,600

析師專家

高級(jí)數(shù)據(jù)分

3,0002,5501,8001,5001,200

析師

中級(jí)數(shù)據(jù)分

2,0001,7001,2001,000800

析師

初級(jí)數(shù)據(jù)分

1000850600500400

析師

模型開(kāi)發(fā)服務(wù)類人天調(diào)研參考

表2-3算法工程師人才服務(wù)調(diào)研參考收費(fèi)表(單位:元)

地域維度一線城市新一線城市二線城市三線城市四五線城市

人員等級(jí)(系數(shù):1.00)(系數(shù):0.85)(系數(shù):0.6)(系數(shù):0.5)(系數(shù):0.4)

數(shù)據(jù)科學(xué)家6,0005,1003,6003,0002,400

資深算法工

5,0004,2503,0002,5002,000

程師學(xué)家

優(yōu)秀算法工

4,0003,5002,4002,0001,600

程師專家

高級(jí)算法工

3,0002,5501,8001,5001,200

程師

中級(jí)算法工

2,0001,7001,2001,000800

程師

初級(jí)算法工

1000850600500400

程師

差旅費(fèi)調(diào)研參考

整體差旅費(fèi)采用實(shí)報(bào)實(shí)銷制度,但不同的地域和級(jí)別均有不同的上限要求,以下內(nèi)容

僅做參考

30

表2-4技術(shù)專業(yè)人才服務(wù)調(diào)研參考收費(fèi)表(單位:元)

地域維度一線城市新一線城市二線城市三線城市四五線城市

人員等級(jí)/類

(系數(shù):1.00)(系數(shù):0.85)(系數(shù):0.6)(系數(shù):0.5)(系數(shù):0.4)

交通費(fèi)專家飛機(jī)商務(wù)艙/高飛機(jī)商務(wù)艙/飛機(jī)商務(wù)艙/飛機(jī)商務(wù)艙/高飛機(jī)商務(wù)艙/高

次(上限)鐵一等座高鐵一等座高鐵一等座鐵一等座鐵一等座

交通費(fèi)非專

飛機(jī)普通艙/高飛機(jī)普通艙/飛機(jī)普通艙/飛機(jī)普通艙/高飛機(jī)普通艙/高

家次(上

鐵二等座高鐵二等座高鐵二等座鐵二等座鐵二等座

限)

按照出租車

按照出租車(類按照出租車按照出租車按照出租車(類

(類出租車

室內(nèi)交通出租車業(yè)務(wù))實(shí)(類出租車業(yè)(類出租車業(yè)出租車業(yè)務(wù))實(shí)

業(yè)務(wù))實(shí)報(bào)

報(bào)實(shí)銷務(wù))實(shí)報(bào)實(shí)銷務(wù))實(shí)報(bào)實(shí)銷報(bào)實(shí)銷

實(shí)銷

住宿費(fèi)專家

800680480400320

天(上限)

住宿費(fèi)非專

家天(上500425300250200

限)

專家餐飲費(fèi)

20017012010080

天(上限)

非專家餐飲

費(fèi)天(上150128907560

限)

2.2按大數(shù)據(jù)產(chǎn)品收費(fèi)

2.2.1使用場(chǎng)景

該收費(fèi)模式適用于出售大數(shù)據(jù)產(chǎn)品服務(wù)等項(xiàng)目和內(nèi)部開(kāi)發(fā)大數(shù)據(jù)產(chǎn)品項(xiàng)目,

定價(jià)策略基本以成本加成的模式,同時(shí)參考市場(chǎng)同類產(chǎn)品的定價(jià),具體按照產(chǎn)品

維度進(jìn)行定價(jià),以下收費(fèi)方式為市場(chǎng)調(diào)研價(jià)格,最終以雙方合同約定計(jì)費(fèi)。

2.2.2調(diào)研收費(fèi)參考

技術(shù)產(chǎn)品作為特殊商品,其價(jià)格的構(gòu)成主要由以下三部分組成:

31

1.在技術(shù)產(chǎn)品轉(zhuǎn)讓過(guò)程中所發(fā)生的直接費(fèi)用。比如,派人洽談所需的旅差

費(fèi)、資料費(fèi)以及簽約后復(fù)制的大量技術(shù)文件資料的費(fèi)用等。但這種直接費(fèi)用在整

個(gè)技術(shù)產(chǎn)品價(jià)格中所占比例很小。如果是自研自用產(chǎn)品不涉及。

2.技術(shù)產(chǎn)品研究開(kāi)發(fā)費(fèi)用的分?jǐn)?。它取決于該項(xiàng)技術(shù)產(chǎn)品所處的生命周期,

一般為主要的費(fèi)用,包括大數(shù)據(jù)分析師的算法模型費(fèi)用、智能營(yíng)銷和風(fēng)控策略模

型、分析報(bào)告的框架、分析方法的部署等費(fèi)用。

3.技術(shù)產(chǎn)品創(chuàng)造利潤(rùn)的能力,即供方依利潤(rùn)分享原則所應(yīng)分得的份額,產(chǎn)

品為按年付費(fèi)或者按照運(yùn)營(yíng)效果進(jìn)行分?jǐn)偫麧?rùn)形式,根據(jù)接收方每年的營(yíng)收效果,

費(fèi)用每年計(jì)提。

成本加成定價(jià)=(產(chǎn)品轉(zhuǎn)讓過(guò)程費(fèi)用+產(chǎn)品研發(fā)投入成本+產(chǎn)品創(chuàng)造利潤(rùn)能力

費(fèi)用)*(1+產(chǎn)品收益率)/(1-所得稅),通常,產(chǎn)品收益率按照行業(yè)內(nèi)上市公

司的年化利潤(rùn)率。適用于新研發(fā)產(chǎn)品,市面上產(chǎn)品較少,產(chǎn)品處于初期階段。

市場(chǎng)跟隨定價(jià)=市場(chǎng)同類產(chǎn)品的參考定價(jià),適用于標(biāo)準(zhǔn)化成熟的產(chǎn)品,市面

上產(chǎn)品較多,產(chǎn)品處于成熟穩(wěn)定期。

2.3按成果應(yīng)用轉(zhuǎn)化收費(fèi)

2.3.1使用場(chǎng)景

該收費(fèi)模式適用于效果可衡量的項(xiàng)目,通常適用于聯(lián)合運(yùn)營(yíng)類項(xiàng)目,后期雙

方均參與,以雙方對(duì)收入利潤(rùn)貢獻(xiàn)的程度進(jìn)行利潤(rùn)分成或者以雙方約定的效果計(jì)

費(fèi)。以下收費(fèi)方式為市場(chǎng)調(diào)研價(jià)格,僅供參考。

2.3.2調(diào)研收費(fèi)參考

數(shù)據(jù)服務(wù)的調(diào)用量、查得量等支付收費(fèi),具體的收費(fèi)參考同類行業(yè)市場(chǎng)情況,

通常首次采用雙方協(xié)商后確定,收費(fèi)參考=查得次數(shù)*協(xié)商定價(jià),后期按照框架類

合同續(xù)約即可。

32

營(yíng)銷效果收費(fèi),按照效果轉(zhuǎn)化過(guò)程中各個(gè)重要指標(biāo)進(jìn)行收費(fèi),例如:瀏覽量、

點(diǎn)擊量、下單量等,通??梢圆捎脤?duì)賭協(xié)議形式或者基金激勵(lì)形式進(jìn)行效果收費(fèi)。

預(yù)測(cè)提升類,例如違約率降低百分點(diǎn),可以按照違約損失模型進(jìn)行收費(fèi)預(yù)估:

(原違約率*損失率*風(fēng)險(xiǎn)敞口-新違約率*損失率*風(fēng)險(xiǎn)敞口)*風(fēng)險(xiǎn)準(zhǔn)備金收益分

成。

2.4按項(xiàng)目收費(fèi)

2.4.1使用場(chǎng)景

適用于項(xiàng)目公開(kāi)招投標(biāo)方式。

2.4.2調(diào)研收費(fèi)參考

依據(jù)項(xiàng)目預(yù)算,結(jié)合本公司經(jīng)驗(yàn)給出合理報(bào)價(jià)。同時(shí)要根據(jù)項(xiàng)目是否有后續(xù)

項(xiàng)目或很有希望進(jìn)入新市場(chǎng)而進(jìn)行報(bào)價(jià)策略的選擇。

成熟項(xiàng)目類(公司主要業(yè)務(wù)范圍):

項(xiàng)目參考報(bào)價(jià)=同類項(xiàng)目市場(chǎng)歷史平均報(bào)價(jià)-預(yù)期二期的概率*二期的預(yù)期收

益率*二期規(guī)模*30%(優(yōu)惠折讓)+公司品牌溢價(jià)

新拓展的項(xiàng)目類(為拓展新業(yè)務(wù)范圍,進(jìn)行實(shí)踐案例的沉淀):

若此類項(xiàng)目無(wú)歷史參考價(jià)格,則項(xiàng)目參考報(bào)價(jià)=公司內(nèi)部人力資本評(píng)估預(yù)算

若此類項(xiàng)目有市場(chǎng)報(bào)價(jià)參考,則項(xiàng)目類參考報(bào)價(jià)>=同類項(xiàng)目市場(chǎng)歷史平均報(bào)

價(jià)*80%

2.5售后服務(wù)調(diào)研收費(fèi)參考

整體上分為免費(fèi)和收費(fèi)兩種模式,其中收費(fèi)模式下,

按產(chǎn)品提供服務(wù):可按照產(chǎn)品簽單價(jià)格的5%~10%/年提供服務(wù);

33

按項(xiàng)目提供服務(wù):可按照項(xiàng)目合同金額的5%~10%/年提供服務(wù);

按人天提供服務(wù):需要按照服務(wù)等級(jí)或問(wèn)題處理難度收費(fèi),低難度-初級(jí)職

稱人員;中等難度-中級(jí)職稱人員;高難度-高級(jí)職稱人員。詳情同上。

3.服務(wù)模式:

3.1駐場(chǎng)

駐場(chǎng)指數(shù)據(jù)分析服務(wù)人員進(jìn)入項(xiàng)目需求方現(xiàn)場(chǎng),與項(xiàng)目需求公司一起辦公。

3.1.1使用場(chǎng)景

1.對(duì)于數(shù)據(jù)、文件安全級(jí)別較高的客戶場(chǎng)景,即需要大量使用客戶內(nèi)部敏感

信息的情況;

2.需要大量溝通協(xié)調(diào)、需求實(shí)時(shí)變化的客戶場(chǎng)景;

3.對(duì)服務(wù)時(shí)間有及時(shí)性要求,一旦出問(wèn)題可以即時(shí)跟進(jìn)解決、快速響應(yīng)的場(chǎng)

景。

3.1.2工作模式

需要相關(guān)人員到客戶現(xiàn)場(chǎng)進(jìn)行項(xiàng)目實(shí)施、交付。一般情況下與需求公司的工

作模式一致,服從需求公司的管理制度,同時(shí)遵循本公司的管理制度,保持分析

師職業(yè)操守。

3.2線上

線上服務(wù)模式指采用一系列的信息技術(shù)進(jìn)行遠(yuǎn)程協(xié)助,非面對(duì)面形式。

34

3.2.1使用場(chǎng)景

1.適用于前期需求溝通完畢,范圍確定后可進(jìn)行遠(yuǎn)程服務(wù)模式;

2.為了節(jié)約辦公成本,采用居家辦公的線上模型;

3.無(wú)需用到客戶安全級(jí)別較高的內(nèi)部材料的項(xiàng)目;

4.存在高危、遠(yuǎn)距離等不利因素的客戶場(chǎng)景。

3.2.2工作模式

工作人員可以采用線上工作模式,工作要求:支持實(shí)時(shí)語(yǔ)音通話、工作會(huì)議

開(kāi)展、正常上下班打卡,可供客戶全稱監(jiān)控的線上環(huán)境。

3.3云地協(xié)同

按照官方的定義,云地協(xié)同是指:云端和地端一起協(xié)作完成一系列的模型訓(xùn)

練,提高了管理效率,加速AI更新,是網(wǎng)絡(luò)AI化的理念,而此處的云地協(xié)同模

式指駐場(chǎng)辦公人員與遠(yuǎn)程的線上人員,以及本公司場(chǎng)地人員進(jìn)行三維立體化共享

知識(shí)成果,共同完成項(xiàng)目的交付。

3.3.1使用場(chǎng)景

1.對(duì)于需求相對(duì)固定,可以遠(yuǎn)程研發(fā),同時(shí)支持線下驗(yàn)證或溝通的客戶場(chǎng)景。

2.一般性項(xiàng)目均可采用此模式,適用范圍較廣。

3.3.2工作模式

1.不定期根據(jù)需求和客戶情況,進(jìn)行遠(yuǎn)程或現(xiàn)場(chǎng)的支持,工作模式較為自由,

定期按照項(xiàng)目進(jìn)度交付產(chǎn)出物。

2.為了控制項(xiàng)目成本進(jìn)行本地化多項(xiàng)目支持,部分駐場(chǎng),線上會(huì)議,知識(shí)進(jìn)

行云端編輯共享。

35

六、項(xiàng)目運(yùn)營(yíng)管理標(biāo)準(zhǔn)

1.運(yùn)營(yíng)管理

1.1前期規(guī)劃

針對(duì)已經(jīng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論