




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
----宋停云與您分享--------宋停云與您分享----itpubinnovate51BI建模:BI開個好頭--數(shù)據(jù)模型構(gòu)建概要BI的數(shù)據(jù)模型抽象過程,是對業(yè)務(wù)過程的再梳理,將線性的數(shù)據(jù)流,改造成BIBI應(yīng)BIDW的原始數(shù)據(jù)抽取出來(經(jīng)過清洗整合的數(shù)據(jù)還是比業(yè)務(wù)源數(shù)據(jù)好得多),然后自己再加工處理。這樣既增加了數(shù)據(jù)分析的難度,也增加了成本和風險。BIBIXXBI5大數(shù)據(jù)源來構(gòu)建數(shù)據(jù)模型,而是依據(jù)電子商務(wù)業(yè)務(wù)本身來劃分專題、專題之間的相互關(guān)系等,構(gòu)思出了客戶訪問生命周期模型、客戶訂單生命周期模型、客戶生命周期模型、商品生命周期模型四大類,而且四大模型之間的影響關(guān)系也非常清晰,從這四大模型之中,完全看不到任何業(yè)務(wù)數(shù)據(jù)源的影子。而在實體商企業(yè)中,商品生命周期模型,可以作為企業(yè)級生命周期的一部分,----宋停云與您分享--------宋停云與您分享----對比模型,而品牌商有自主定價權(quán),這類分析重要性沒那么大,主要在渠道特點的分析上。如果我們的數(shù)據(jù)模型是根據(jù)業(yè)務(wù)系統(tǒng)的表結(jié)構(gòu)來構(gòu)建,那就只相當于有個物理模型,因為業(yè)務(wù)系統(tǒng)的業(yè)務(wù)數(shù)據(jù)都是線性的,無法直接拿來有效地分析,完全沒理清楚,從分析角度,需要哪些數(shù)據(jù)信息。例如電商業(yè)務(wù)系統(tǒng)會至少有訂單信息、付款、物流數(shù)據(jù),也有點擊流日志數(shù)據(jù)、外部網(wǎng)站爬取數(shù)據(jù)、客服數(shù)據(jù),然后還有企BI數(shù)據(jù)模型中,演變成可以多層次、多視角動態(tài)分析的立體模型。的導(dǎo)入也非???,數(shù)據(jù)模型實現(xiàn)建好,拿到數(shù)據(jù)就可以順利導(dǎo)入,數(shù)據(jù)分析也隨即展開,BI應(yīng)用也逐步和用戶討論。什么是BI建模,建模的本質(zhì)是什么?前幾天和大項目團隊一起和廠商聚餐,后來發(fā)了個廠商的小禮品,是一個便簽本,本子面上是塑料的殼,上面是一個活動日歷,中間如下面的數(shù)據(jù),由一個框架在數(shù)字上面,可以活動左右移動,框架上面有周日到周六的英文簡稱,最左邊是指21211116月,10611712 3 4 5 6 72 3 4 5 6 7 891011121314910111213141516171819202116171819202122232425262728----宋停云與您分享--------宋停云與您分享----2324252627282930313031話說這么多了,上面的例子是非計算機領(lǐng)域的日常用到的模型,來處理本來需2431日,這個模型無法處理掉,但是不影響我們的使用。24月日歷的變化能在一個圖表里完成,這也是這個1號開始的星期不一樣,從周日到周六,都有可能,于是我們的能左右滑動的框(框里有周日到周六的對應(yīng)指針),7+6=13列數(shù)字。那么下一個模型問題,第一排數(shù)據(jù),如何與第二排銜接。這個問題就是由日歷的規(guī)律所決12號開始,于是第二排第一217.7天累加。那3130、2931、30日,這個在模具上是無法完成的,除非有更精巧的控制性設(shè)計,但要復(fù)雜很多。BI模型當中,如何才能建好一個能反映業(yè)務(wù)本質(zhì)的模BI建模的本質(zhì),BI建模與業(yè)務(wù)系統(tǒng)建模出發(fā)點是不同的,業(yè)務(wù)BI的模型則描述業(yè)務(wù)因果關(guān)系、因果過程原因等深層次信息的模型,它既可以描述事務(wù)的流程,也可以直接跳躍流程,直接奔流程頭、尾的結(jié)果而去。----宋停云與您分享--------宋停云與您分享----BIERPBI的模型,就得以事務(wù)的生命周期為ERPBIBI的價值。很多朋友還是以為數(shù)據(jù)模型中的概念模型就等同于業(yè)務(wù)模型,其實真正的業(yè)務(wù)模型的最大價值是指導(dǎo)數(shù)據(jù)分析及應(yīng)用,而引導(dǎo)數(shù)據(jù)建模,特別是維度建模,僅僅是因為它需要起到橋梁作用,是輔助作用。業(yè)務(wù)模型描述的應(yīng)該是業(yè)務(wù)之間的因果、前后、層次等關(guān)系的架構(gòu)體系,并對每個ER技術(shù)沒有直接關(guān)系。BIBI我們業(yè)界常見的數(shù)據(jù)分析、挖掘,其實對于業(yè)務(wù)來說,只是一個因子,并不能直接----宋停云與您分享--------宋停云與您分享----而如果基于業(yè)務(wù)架構(gòu)的BI分析應(yīng)用,則可以繼承業(yè)務(wù)分析架構(gòu)師的業(yè)務(wù)廣視角理解,對不同分析需求的因子、以及他們的重要性有足夠了解,這樣的分析,就可以擴展到大型甚至企業(yè)級決策事務(wù)中去了。之所以我稱之為模型,是因為如果業(yè)務(wù)之間關(guān)系描述清楚了,層次、因果關(guān)系清晰BIBI產(chǎn)生價值。大家可以觀察下,現(xiàn)BI關(guān)于客戶的分析,已經(jīng)不是新鮮東西,從沃爾瑪?shù)目蛻粜袨榉治觯絿鴥?nèi)幾年前就有的電信、銀行客戶行為分析,這些方法都用爛了。我個人以為,任何分析都要站在更高的高度,而非僅僅盯著一個角度,否則這樣的分析價值很有限,甚至會誤導(dǎo)決策和運營行動。比如,客戶本來就分為很多種類型,例如到處閑逛型,品牌忠實型,促銷活動狂,任何分析,要產(chǎn)生價值,都需要相對于的行動支撐,就是說分析出來子丑寅卯,你總得說我下一步怎么做才有利吧?這個時候業(yè)務(wù)模型的作用就顯現(xiàn)出來了,客戶生命周期模塊下屬客戶行為-----宋停云與您分享--------宋停云與您分享----CRM策略等相關(guān),于是在業(yè)務(wù)模型中,將各種業(yè)務(wù)點和面,組成美妙的模型關(guān)系,客戶行為分析的結(jié)果,與其他業(yè)務(wù)分析,一起支撐我們的運營行動。這樣我們所有的數(shù)據(jù)分析,BI應(yīng)用效果。這樣的BI之路才是當前較為理想的應(yīng)用方法。詳解BI/數(shù)據(jù)分析/數(shù)據(jù)挖掘/業(yè)務(wù)分析概念:數(shù)據(jù)挖掘是數(shù)據(jù)分析的重要手段,而數(shù)據(jù)分析本身除了數(shù)據(jù)挖掘以外,也有普通計算加減乘除,在多維多視角基礎(chǔ)上來統(tǒng)計,看看指標結(jié)果、指標趨勢、占比、同比環(huán)比等等,這也是一種數(shù)據(jù)分析。但是談到業(yè)務(wù)分析的時候,情況就比上述又要復(fù)雜很多。首先業(yè)務(wù)分析是BI的最直接手段,BI通過業(yè)務(wù)分析來實現(xiàn)商業(yè)智能,那么業(yè)務(wù)分析和數(shù)據(jù)分析有啥區(qū)別和關(guān)系呢?舉個例子,某企業(yè)銷售強弱不均,客戶需要知道原因。通常會直接多維統(tǒng)計各KPI,占比、同比、環(huán)比等,來定位哪些屬于好,哪些屬于不好,這就是A區(qū)銷售不好,那有什么區(qū)別,共性是什么?于是數(shù)據(jù)分析人員通過數(shù)據(jù)挖掘,找出銷售得好的共性主要是商品周轉(zhuǎn)明顯快很多、回頭客貢獻高、平均毛利也較高。3大特征,我們怎么樣才能將做的差的,也符合上述主要特征呢?于是業(yè)務(wù)分析派上用場,商品周轉(zhuǎn)明顯快,那是因為貨品配置合理、AKPI指標明顯高,活動針對性強,后續(xù)跟蹤服務(wù)及時。毛利高是因為,A區(qū)選擇總部的----宋停云與您分享--------宋停云與您分享----BI業(yè)務(wù)分析完畢,高層馬上令B做調(diào)整,期待上述業(yè)務(wù)KPI都要改善,提高整個BIBI等多種概念的關(guān)系。純屬虛構(gòu),如有雷同,敬請見諒。數(shù)據(jù)分析與BI事務(wù)分析BIBI(個人覺得“事務(wù)”這個詞匯恰當一點)分析,有較大的差別,目的和范圍首先就不同。所謂數(shù)據(jù)分析,就是對數(shù)據(jù)進行一些技術(shù)手段處理,得出一些結(jié)果(注意是結(jié)果,而非結(jié)論),BI分析,除了上述手段外,需要更加精通業(yè)務(wù)、以及運營狀況、客戶真實需求。舉例說明,剛才看電視說韓國企業(yè)的惡性競爭,互相拿數(shù)據(jù)揭示對手的短處,夸大BIBI分析,公眾的公信力將失去。----宋停云與您分享--------宋停云與您分享----BI分析應(yīng)該是更為高級的應(yīng)用,必須對數(shù)據(jù)分析過程、結(jié)果進行進一步細分,事務(wù)分析更加需要高度的業(yè)務(wù)抽象、對當前業(yè)務(wù)狀況的理解,以便給出較為客觀的建議,給予符合客戶利益的引導(dǎo)。BIBI分析的子集,因為數(shù)據(jù)分析可以進行再抽象,脫離實際的個體業(yè)務(wù)狀況,進行通用的分析結(jié)果和應(yīng)用A,B,C,Da,b,c,d四種企業(yè)狀況,類似的抽2次分析,以滿足客戶具體需求。2種應(yīng)用表達清楚。我BI事務(wù)分BI有著更加合理的發(fā)展,且客戶將得到更加優(yōu)質(zhì)的服務(wù)。BIBIer各司其職,知道自己要朝哪個方向去做。例如我設(shè)想的,實施商應(yīng)多在數(shù)據(jù)分析上下功夫,因為你服務(wù)的是無數(shù)不同情況的企業(yè)。而在實施過程,或者甲方內(nèi)部做BIBI分析這個層面,因為你要的是分析效果,以及用戶要如何使用你的分析成果,而不是數(shù)據(jù)本身。遙想未來海量數(shù)據(jù)之下的BI應(yīng)用發(fā)展[復(fù)制鏈接]首先什么是海量數(shù)據(jù)?其實沒有絕對的,只有相對的。以前看過一個科學節(jié)目,說科學家已經(jīng)理論證明了可以遠程原子級別的物體傳輸,將任何物體包括人在遠端重新組合起來,唯一沒有解決的理論問題,就是如何解決被傳輸還在,而另外一端產(chǎn)----宋停云與您分享--------宋停云與您分享----3ZB,PB在未MB的基本存儲單位,只是相對現(xiàn)在,需要新的技術(shù)才行??梢灶A(yù)言,未來海量數(shù)據(jù)的產(chǎn)生,并非互聯(lián)網(wǎng)本身(訪問點擊),而是物聯(lián)網(wǎng)高級技術(shù)產(chǎn)生,如對物體的掃描信息。而數(shù)據(jù)相關(guān)的技術(shù),未來還是會繼續(xù)圍繞數(shù)據(jù)計算、數(shù)據(jù)存儲、數(shù)據(jù)傳輸、數(shù)據(jù)安全四大類方向。BIBIBIZB級數(shù)據(jù)的時候,從一個ZB的數(shù)據(jù)主要是快速計算ZB級的數(shù)據(jù)計算和傳OK了。但如果要充分利用這個數(shù)據(jù),那么還可以把這個人上次掃描和本次做一個對比,快速發(fā)現(xiàn)這個人的健康問題、健康變化和趨勢、人物判斷、情緒變化等醫(yī)學和法律問題。而作為傳輸?shù)墓?,他們利用這次掃描為客戶提供額外的服務(wù),與其他各行業(yè)合作,為客戶提出科學建議,以及新環(huán)境的特點和導(dǎo)游指引等。但針對某一個應(yīng)用,例如情緒變化,需要對掃描的原子級別的數(shù)據(jù)進行復(fù)雜----宋停云與您分享--------宋停云與您分享----上述是很遙遠的想象應(yīng)用,其實也就想說明一個問題,應(yīng)用于技術(shù)可以同步發(fā)展,互相促進而不會矛盾。但不能有了相應(yīng)的技術(shù),應(yīng)用產(chǎn)生之后,數(shù)據(jù)的價值就大打折扣。當應(yīng)用一旦產(chǎn)生,就會推動相應(yīng)的技術(shù)發(fā)展,反之,相應(yīng)的技術(shù)發(fā)展了,應(yīng)用未必會被推動,因為這涉及到很多商業(yè)行為和管理規(guī)則,并非單純的技術(shù)問題。BI60ZB,但未必能輕ZB級數(shù)ZB級是完全不同的概念。所以那個時候數(shù)據(jù)量再大,也要先對業(yè)務(wù)進行剖析,以商業(yè)為目標,再對數(shù)據(jù)進行針對性分析、挖掘,才能產(chǎn)生對應(yīng)的價值,這個道理很難改變。業(yè)務(wù)模型分析框架--為云計算鋪路[復(fù)制鏈接]MSN13BIBI沙龍演講的內(nèi)容,他說,這可以說為云計算鋪路。云計算目前只是在技術(shù)上存儲和處理海量數(shù)據(jù),但數(shù)據(jù)是否有足夠應(yīng)用,特別是分析應(yīng)用,目前幾乎沒人關(guān)注,頂多有人在做一些數(shù)據(jù)挖掘,做一些好多年前就開始挖掘的東西,有的廠商乘機搞出很多概念,但都是紙上談兵。首先申明幾點:BIBI要以客戶的角度思考問題,提供足夠的信息,和信息解讀(以后講詳細說明解讀)。能做這個分析框架的,比如是精通相關(guān)業(yè)務(wù)、了解數(shù)據(jù)如何支持業(yè)務(wù)運營,也了解業(yè)務(wù)運營要看什么樣的數(shù)據(jù)。BIBI1BI才能游刃有余。----宋停云與您分享--------宋停云與您分享----KPIKPI可能BIBI團隊通過解讀需求,通過各種渠BI期望的效果。6.BI隨著海量數(shù)據(jù)“侵襲”越來越多的企業(yè),很多企業(yè)業(yè)務(wù)開始快速變化的同時,數(shù)據(jù)量ITIT界討論話其實問題的核心還是在云計算,在上面是否有足夠的應(yīng)用,海量數(shù)據(jù)是大多數(shù)都埋海底了,還是被足夠應(yīng)用,讓企業(yè)快速發(fā)展的同時,能隨時發(fā)現(xiàn)現(xiàn)在哪些地方有問題,之前做的事情哪些需要改進,哪些需要發(fā)揚的?應(yīng)用中,本來就有從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,然后去找影響哪些業(yè)務(wù),以便為這些業(yè)務(wù)提供監(jiān)控提醒、改善支持等動作。還有就是用戶需要分析業(yè)務(wù)運營現(xiàn)狀,有哪些問題,怎么解決,然后是預(yù)測未來當計劃有變,會有什么業(yè)務(wù)變化。所以這個業(yè)務(wù)分析框架應(yīng)該是支持從數(shù)據(jù)到業(yè)務(wù)運營,也可以支持業(yè)務(wù)運營到數(shù)據(jù)的探索,并且是多對多的復(fù)雜關(guān)系。----宋停云與您分享--------宋停云與您分享----BI行業(yè)或項目有如下地方需要革新首先就是普遍的認識,不管諸位如何認識的,但至少業(yè)界不少人有如下不太合適的認識:OLTP分析系統(tǒng)相反,是少數(shù)用戶使用OLAP是少數(shù)用戶使用?BI認為需求和具體分析都是用戶的事,自己只管開發(fā)和實施,以技術(shù)實現(xiàn)為目標。BIBI實施方。比如我們用戶給我提需求,一般就是說我們上次促銷活動,幫我分析下,?他說是的,然后我就根據(jù)他說的方向進行分析,后來就作為分析包括,對活動總結(jié),以及后期業(yè)務(wù)工作改進有著重要的依據(jù)。如果你非要用戶列出,你要從哪些角度,看哪些具體指標,沒有具體需求BI何時才能發(fā)揮作用。技術(shù)人員,包括數(shù)據(jù)建模師,設(shè)計都有業(yè)務(wù)系統(tǒng)的影子,不能對業(yè)務(wù)流程梳理后BA,往往認為我只需要整理用戶需求即可,數(shù)據(jù)模型不管我的事。用戶則認為,我只管能否達成分析效果,分析BI應(yīng)用發(fā)展停滯不前的重要因素這樣的結(jié)果,就是大量建模師,都還停留在基本的維、事實的框架下建模,而且必須有業(yè)務(wù)系統(tǒng)的影子,不然就不知道怎么建模了,難怪有的朋友說,分析系統(tǒng)就是----宋停云與您分享--------宋停云與您分享----業(yè)務(wù)系統(tǒng)的衍生功能嘛。我有非常多的例子,可以反駁分析系統(tǒng)必須要跟著業(yè)務(wù)系POSEERP還是根據(jù)財務(wù)系統(tǒng)呢?BIBA只知道用戶的表面需求,不能翻譯成模型的需求,例如剛才我提到的促銷活動,BA是要挖掘出用戶的真實目的呢,然后再逐步深入,還是去收集用戶要哪些維度看哪些指標?如果了解了真實目的,那如何解釋給實施團隊,使他們能更好設(shè)計,使得開發(fā)出來的分析能適應(yīng)不同部門的需求。再比如當下最流行的電商,如果用戶說,我要看看主要頁面和商品的點擊率、轉(zhuǎn)換率、退出率等指標,然后你就把數(shù)據(jù)集成一塊,按照基本維度統(tǒng)計他們需要的指標即可?這顯然太膚淺了,電商的動態(tài)點擊分析,不同訪問路徑導(dǎo)致的不同點擊、轉(zhuǎn)換率、退出率的綜合分析,才能分別從客戶體驗到商品供應(yīng)鏈等不同角度,分析出為啥轉(zhuǎn)換率低,為啥退出率高等原因,甚至可以提供改善的行動數(shù)據(jù)支持。否則等你統(tǒng)計完基本的需求后,用戶說你去幫我查查為啥這樣,你不是傻眼了?而要分析這些東西,必須于任何業(yè)務(wù)系統(tǒng)之外,對于業(yè)務(wù)數(shù)據(jù)從分析角度重新劃分,然后在模型中體現(xiàn)出來。綜上所述,以前傳承下來的實施團隊構(gòu)成、實施努力方向、用戶的引導(dǎo),都是有明顯弊端的,這樣才導(dǎo)致了BI只發(fā)揮了N分之一的力量----宋停云與您分享--------宋停云與您分享----說到需求,確實有一些有咨詢能力的實施方,會主動提出需求方案,然后由客戶方評審。不過這樣的實施方還是比較少。即使有這樣的實施方,數(shù)據(jù)平臺是否能轉(zhuǎn)換為BI分析應(yīng)用。BI分析應(yīng)用中,最重要的一步,也是直接產(chǎn)生價值的一步,就是分析出原因或因素,然后產(chǎn)生業(yè)務(wù)行動支撐。而要實現(xiàn)這一點,客戶方很清楚自己的目標,而且要讓實施方很清楚具體的業(yè)務(wù)流程,而且要站在客戶的角度思考數(shù)據(jù)的意義,才能進行相關(guān)支撐。例如以前業(yè)務(wù)用戶告訴我?guī)兔o急分析一下上次活動的成果,這個范圍太大,我就2個方向分別分析和評估,并為一下次活SKU減少50%,或者要庫存消除90%這類的指標值,然后我們哪些商品是本次主推的,銷售目標是什么,這樣才能分析出符合業(yè)務(wù)目標的結(jié)果,而下次支撐的時候,你也得告訴我你的銷售計劃和具體商品的計劃。于是我分析出了哪些商品達到了清庫存的效果,以及銷售機會抓住了多少,哪些不足,以便下次針對性實時監(jiān)控,進行即使處理抓住銷售機會,并將更多庫存清除掉。面對客戶的大方向需求,多數(shù)實施團隊,能這樣一步一步引導(dǎo)BI的應(yīng)用么?什么是真正的BI架構(gòu)?最近和一個朋友聊到BI,BI架構(gòu),以及相關(guān)的困惑,還有他們上層領(lǐng)導(dǎo)對于BI與DATAMINING的困惑,因為不少非業(yè)內(nèi)人士,包括部分業(yè)務(wù)人士,普遍認為BI是否用得好,用得深,要看是否用了,而且用深了DATAMINING。----宋停云與您分享--------宋停云與您分享----BI是一個大型工程,它由很多概念和技術(shù)組成,而不同公司、BIBI架構(gòu)圖,可以幫我們解答吧,雖然我心里有個譜,但不足以說明問題,而且我還不是權(quán)威的代名詞。googleBIBIBIBIBI架構(gòu),我覺得這個靠譜點。----宋停云與您分享--------宋停云與您分享----BI架構(gòu),它是由數(shù)據(jù)架構(gòu)、分析模型、統(tǒng)計分BIBI總架構(gòu)師,必須具備上述四層架構(gòu)的能力,你才能將任務(wù)分給分支架構(gòu)師來構(gòu)建各自的架構(gòu),否則如果BIBI,各自只能修修補補完成各自的任務(wù)。dataminingdatamining的作用,我相信作為統(tǒng)計分析架構(gòu)的重要手段,它的作用是無可厚非的,但是其他的呢?場景、決策----宋停云與您分享--------宋停云與您分享----分析都沒有,做datamining有何用?當然這個圖里統(tǒng)計分析、文本分析,其實可以工程”里,數(shù)據(jù)挖掘更顯得渺小,它需要太多東西為它鋪墊和服務(wù),它也需要為其他組成部分服務(wù)。BTW7點起來發(fā)現(xiàn)有事情還未做,各位莫以4點還未睡覺,所以請莫模仿,哈哈。微博上有個哥們說,沒有業(yè)務(wù)架構(gòu)的BI架構(gòu),就像人妖,看上去很美。。。。。。。。我覺得這個框架最大的特點,就是把業(yè)務(wù)架構(gòu)融入了技術(shù)架構(gòu)中,形成相對完整的BI架構(gòu)。BI觀點之紫人派VS專業(yè)派“紫人派BI人士)提倡中,已有很多大BICTO所有技術(shù)環(huán)節(jié)、業(yè)務(wù)環(huán)節(jié)都要有所了解和熟悉,但不等于全部稀松,至少精通1-2門技術(shù),精通12個行業(yè)業(yè)務(wù)的流程,了解形成過程和戰(zhàn)術(shù)實施過陳。所以紫人并非樣樣知、樣樣松,而是廣而精的一種形態(tài)。----宋停云與您分享--------宋停云與您分享----專業(yè)派,則是以某種技術(shù)、某種分析業(yè)務(wù)為核心,做精做深,相關(guān)其他環(huán)節(jié)了解即可,做好自己的專業(yè)的事,剩下的通過接口把工作交接,接收上一環(huán)節(jié)任務(wù),下傳到下一環(huán)節(jié)。專業(yè)派的描述如果有誤,請補充!BI1BIBI效果。無論哪個觀點都有自己的道理,那么我們拿5年時間,看看業(yè)界的BI實施效果吧。用數(shù)據(jù)說話不等于數(shù)據(jù)驅(qū)動以前一直有兩個爭論,一個是數(shù)據(jù)分析驅(qū)動,一個是業(yè)務(wù)分析驅(qū)動。我想用數(shù)據(jù)說話,不代表數(shù)據(jù)驅(qū)動,數(shù)據(jù)沒法驅(qū)動BI!TBBI,BI的應(yīng)用,也沒法驅(qū)動發(fā)展,數(shù)據(jù)唯一能帶動的是數(shù)據(jù)分析的技術(shù)。BIB大區(qū)銷售不佳列出B大區(qū),拖累了正題銷售。從數(shù)據(jù)挖掘結(jié)果看,原來有供應(yīng)鏈、客服、商品定價管理等多種原因造成。這些都是用數(shù)據(jù)來證明上述觀點,所以叫用數(shù)據(jù)說話。那為什么不能叫數(shù)據(jù)驅(qū)動呢?所謂驅(qū)動,就是根據(jù)數(shù)據(jù)的變化、異常等來做BI其他工作,來解決問題,是工作的火車頭,這才叫什么什么驅(qū)動。但BI中無法用數(shù)據(jù)驅(qū)動,因為數(shù)據(jù)中的信息太豐富,你很難判斷出哪些真的是反應(yīng)業(yè)務(wù)問題主因,哪些是花頭。所以你想用成百上千個數(shù)據(jù)分析專題來推動整個BI,那是大大地----宋停云與您分享--------宋停云與您分享----浪費資源,還可能分析出業(yè)務(wù)部門不需要數(shù)據(jù),從工作常識就能知道的結(jié)論,而業(yè)務(wù)某三五個專題分析,就能解決運營的根本問題,以最小的代價換去最大的利益。詳解業(yè)務(wù)分析的本質(zhì)就拿數(shù)據(jù)分析和業(yè)務(wù)分析來說,為啥很多技術(shù)出身的高層,會拿是否數(shù)據(jù)挖掘BIBI現(xiàn)狀和認知,將整個認知水平拉到合理的程度來。BI的都知道,數(shù)據(jù)挖掘?qū)儆跀?shù)據(jù)分析的一部分,但在外接很多人看來,數(shù)據(jù)挖掘等同于數(shù)據(jù)分析。最高境界是做有數(shù)據(jù)依據(jù)的謀士。三國的謀士可沒處處數(shù)據(jù)分析然后出結(jié)論,很多時候是推理,然后出結(jié)論。但推理并不完全可靠,于是古人就有紙上談兵之說,所以現(xiàn)在信息化社會的數(shù)據(jù)分析,能幫助業(yè)務(wù)分析更理性地做業(yè)務(wù)推論反之,沒有業(yè)務(wù)分析作為目標的數(shù)據(jù)分析,也屬于紙上談兵。業(yè)務(wù)分析的推理是基于業(yè)務(wù)主線,因果主次而生。為什么三國中,諸葛亮的計謀大多可行,而馬謖屬于紙上談兵,劉備最后自己打一仗,自己號稱熟讀兵法,結(jié)果大???因為馬謖和劉備在戰(zhàn)術(shù)上雖然都用了兵法推理,但忽略兵法主線,也就是諸葛亮說的兵家大忌,所以諸葛亮一看到馬謖和劉備駐扎的位置,就大呼不妙。馬謖駐扎半坡,只考慮容易下ft沖鋒這一優(yōu)勢,但忽略了別人圍而不攻,你又當如何?劉備駐扎ft林,只考慮到酷熱好乘涼,卻忽略了如果別人火攻,你又該如何?----宋停云與您分享--------宋停云與您分享----所以業(yè)務(wù)分析的作用,就是在于把握“分析”的主線,無論你挖掘多深,數(shù)據(jù)多廣,需要有業(yè)務(wù)流程關(guān)系、因素主次關(guān)系,分析方能為業(yè)務(wù)所用,否則業(yè)務(wù)就會說這幫BI人員只會紙上談兵。而數(shù)據(jù)分析則是支撐業(yè)務(wù)分析推論的技術(shù)手段。三國演義中,孔明先生說一句經(jīng)典的話,大意是,將者,需通天文地理,五行八卦,利用好這些因素,同業(yè)務(wù)多版本統(tǒng)一表結(jié)構(gòu)討論piliskys目前整一數(shù)據(jù)倉庫項目,先建立基礎(chǔ)數(shù)據(jù)平臺,這個基礎(chǔ)數(shù)據(jù)要統(tǒng)一多個業(yè)務(wù)系統(tǒng)業(yè)務(wù)數(shù)據(jù),俺覺得難度大,但還是要做在此列出些問題問題:1,原系統(tǒng)各個字段應(yīng)該都有意義,不可能整合所有源系統(tǒng)所有字段,如何取舍2,原系統(tǒng)表主外鍵各不相同,如何統(tǒng)一3,原系統(tǒng)各屬性字段內(nèi)容定義不同,如何統(tǒng)一4,原系統(tǒng)各業(yè)務(wù)定義方式不同,如何統(tǒng)一5,還有未上線原系統(tǒng)呢innovate511BI,和樓主很相似,我們的電子商務(wù)業(yè)務(wù)系統(tǒng)分為3個階段,第一個階段是手工數(shù)據(jù),第二個階段是試用階段,第三個階段才是近期上ERP試在這種背景下,我目前是一個人搞定設(shè)計、開發(fā)、測試和需求、實施推動,而且我BIBI本人一個人)發(fā)起和規(guī)劃的,而且我還應(yīng)付傳統(tǒng)零售的供應(yīng)鏈方面的需求,所以我一個人可以搞定這么多事情,這個應(yīng)----宋停云與您分享--------宋停云與您分享----該不難的啦。DWH一般要建主鍵,外鍵不是必須的通過業(yè)務(wù)來統(tǒng)一,如果字段類型都不一樣的屬性,可以用對應(yīng)表進行管理,也可以對業(yè)務(wù)字段進行合并取舍wangfans先明確前期需求,然后設(shè)計DW模型,然后才是對源系統(tǒng)分析。表中何為關(guān)鍵字段都很難判斷的話,這個項目非常艱難了,外加你說的關(guān)聯(lián)字段,沒任何系統(tǒng)設(shè)計文檔嗎?如果這些都沒有的話,項目風險與難度確實夠大的。建議你跟你領(lǐng)導(dǎo)先說明情況,別到時候弄得自己很狼狽。關(guān)于字段內(nèi)容屬性不統(tǒng)一的話,可以采用DB->datafile->ODS的方式 這個不是困難,大多的的DW項目都有這個問題----------------------------結(jié)構(gòu)再進行統(tǒng)一,但這樣的確也有問題,查詢基礎(chǔ)的東西就難統(tǒng)一了業(yè)務(wù)模型指導(dǎo)數(shù)據(jù)建模概要[復(fù)制鏈接]目前很少同行提到構(gòu)建業(yè)務(wù)模型,而且不少同仁認為構(gòu)建好了數(shù)據(jù)模型,業(yè)務(wù)模型就出來了。而離業(yè)務(wù)最近的數(shù)據(jù)分析人員,只是看具體的業(yè)務(wù)需求、業(yè)務(wù)流程點和----宋停云與您分享--------宋停云與您分享----BIBI人認為數(shù)據(jù)模型把已知數(shù)據(jù)的數(shù)據(jù)信息充分體現(xiàn)就行了,其實這是數(shù)據(jù)驅(qū)動的方向,如果按照業(yè)務(wù)驅(qū)動方向,數(shù)據(jù)模型預(yù)留一些未知數(shù)據(jù)也常見的,因為數(shù)據(jù)還沒有,但是需要的數(shù)據(jù),未來可能有。那么這些都是從業(yè)務(wù)角度出發(fā),來看數(shù)據(jù)問題。例如如果業(yè)務(wù)模型中,劃分的幾個業(yè)務(wù)主題,可能會形成不同的事實群,那么我要描述一個完整的業(yè)務(wù)生命周期,在數(shù)據(jù)集市中是否需要集成在一個事實表中去呢?顯然沒有必要。如果是一個業(yè)務(wù)流程線內(nèi),我們可以用指標來勾畫出一個業(yè)務(wù)線內(nèi)發(fā)生的事件,如果跨越了業(yè)務(wù)流程線,你也沒法集成在一個事實表,所以這就靠統(tǒng)一的維度模型把事務(wù)前因后果描述清楚。例如商品生命周期,你可以商品訪問(跟網(wǎng)站訪問線)、商品下單與快遞(跟訂單線)、商品倉儲(跟ERP線)、商品采購(跟ERP線)、商品供需(BI抽象線),構(gòu)成完整的周期事實表群。落實到表之后,接下來就是維度和事實,我想在前面勾畫好的幾個業(yè)務(wù)線之后,維度和事實在建模師手里,已經(jīng)不是難事了,因為具體的事實表和業(yè)務(wù)、業(yè)務(wù)系統(tǒng),2BI抽象這個事實,就需要你勾畫出業(yè)務(wù)對商品的營銷思路,例如上下架、活動、要留多少進入往季銷售,這些都是和企業(yè)營銷思路有關(guān)系的,結(jié)合我們商品營銷的抽象性事實。BI抽像事實表說的比較含蓄,但確實不能說深了,呵呵。----宋停云與您分享--------宋停云與您分享----業(yè)務(wù)模型指導(dǎo)數(shù)據(jù)模型,只是在業(yè)務(wù)部分,要知道數(shù)據(jù)倉庫本身就是數(shù)據(jù)與業(yè)務(wù)雙驅(qū)動,只是人為的將數(shù)據(jù)倉庫搞成數(shù)據(jù)驅(qū)動,或者業(yè)務(wù)驅(qū)動。InmonKimball的特長是另外業(yè)務(wù)模型并非只針對數(shù)據(jù)模型,更大的作用是引導(dǎo)數(shù)據(jù)分析方向,我正醞釀下一個題目就是業(yè)務(wù)模型引導(dǎo)數(shù)據(jù)分析,剖析為什么多數(shù)BI只是對用戶的需求撓撓癢,關(guān)鍵是沒有搞清楚業(yè)務(wù)之間的關(guān)系,落實到實際業(yè)務(wù)就成了紙上談兵。這個我在微博上試過一點水,說得搞過幾年網(wǎng)站分析,自以為很網(wǎng)站分析很成熟的人跑回去反思去了。ORACLE個人感覺各位說的業(yè)務(wù)模型/KPI方面的DimensionFACTDIMENSIONKPI。恩,這個有點概念模型的味道,數(shù)據(jù)模型的概念模型,就是業(yè)務(wù)模型承繼業(yè)務(wù)架構(gòu)到數(shù)據(jù)模型的落腳地,是數(shù)據(jù)模型的邏輯部分初始架構(gòu)。不過這還不是真正的業(yè)務(wù)模型,真正的業(yè)務(wù)模型的最大價值是指導(dǎo)數(shù)據(jù)分析及應(yīng)用,引導(dǎo)數(shù)據(jù)建模,特別是維度建模,僅僅是因為它需要起到橋梁作用。----宋停云與您分享--------宋停云與您分享----業(yè)務(wù)模型描述的應(yīng)該是業(yè)務(wù)之間的因果、前后、層次等關(guān)系的架構(gòu)體系,并對每個ER技術(shù)沒有直接關(guān)系。BIBI我們業(yè)界常見的數(shù)據(jù)分析、挖掘,其實對于業(yè)務(wù)來說,只是一個因子,并不能直接不知道這樣解釋,大家明白了沒有?BI成功標準和應(yīng)用分工面對越來越火的分析系統(tǒng)建設(shè),企業(yè)往往找不到明確方向,如果以所謂需求來BI再現(xiàn)業(yè)務(wù)系統(tǒng)上的報表和簡單數(shù)據(jù)查詢,重則提出需求的人變化了,新的用戶可能棄之不用。BI沒有正確的認識,要么就認為是快速查詢數(shù)據(jù)BI,認為數(shù)據(jù)挖掘好神----宋停云與您分享--------宋停云與您分享----秘,你們幫我們做做數(shù)據(jù)挖掘吧?問之挖掘什么,答到,我知道挖掘什么,還找你們做什么呢?二是實施團隊常未有合理的設(shè)計和引導(dǎo),咨詢和設(shè)計能力嚴重不足。由經(jīng)驗不足的人來設(shè)計,設(shè)計出來的只可能客戶要什么報表,就做什么報表,數(shù)據(jù)倉庫能滿足使用效率,以及一定的數(shù)據(jù)質(zhì)量即可。BI價值實現(xiàn)的過程中,一般有如下過程和分工,首先就需要數(shù)據(jù)模型的支撐,然后是數(shù)據(jù)分析和基礎(chǔ)信息展現(xiàn),最后是決策與業(yè)務(wù)操作輔助應(yīng)用,產(chǎn)生直接的BI價值。這期間有2種極端情況常發(fā)生,一是完全跟著用戶的具體需求來開發(fā);二是不去接洽用戶需求,自己弄一套,然后再找用戶推進。BI界成功標準的缺失,如果以滿足客戶需求為標準,那么當客戶需求僅BIBIDWETLDW團隊里,團里的力量就會要么技術(shù)能力偏弱,要么業(yè)務(wù)能力偏弱BI應(yīng)用歸納的需求應(yīng)該有層次之分,以產(chǎn)生不同的應(yīng)用效果,達到BI預(yù)期,BI----宋停云與您分享--------宋停云與您分享----這樣BI分析既有架構(gòu)支持,也有應(yīng)用支持,也就是說,如果我們業(yè)務(wù)用戶的決策太大,無法達到?jīng)Q策支持時,我們可以從下一個層次業(yè)務(wù)流程著手,順之,若業(yè)務(wù)流程還是太大,不敢言流程是否有大的問題,哪里需要優(yōu)化調(diào)整,那么就可以從最基本的業(yè)務(wù)操作這種最細小的應(yīng)用著手。在底層應(yīng)用順手后,再往上推。這樣BI不可能成為失敗的作品,只是因為企業(yè)不同情況,而導(dǎo)致的不同階段而已。而用戶最初最為惱火的數(shù)據(jù)質(zhì)量問題,往往有2個原因,一是業(yè)務(wù)系統(tǒng)本身存在數(shù)據(jù)質(zhì)量問題,但之前沒專業(yè)核對機制導(dǎo)致無法發(fā)現(xiàn),二是DW的業(yè)務(wù)主題劃分時的條件失誤,與用戶的定義有差異,使用戶認為BI不可用,所以這些基礎(chǔ)問題,當然是必須解決的,但不是BI的核心價值,不多討論了。----宋停云與您分享--------宋停云與您分享----運作質(zhì)量流程運作質(zhì)量流程優(yōu)化方案業(yè)務(wù)擴展決策節(jié)點監(jiān)控BI應(yīng)用KPI監(jiān)控業(yè)務(wù)操作輔助業(yè)務(wù)流程管理輔助業(yè)務(wù)流程執(zhí)行銷售調(diào)整決策決策支持業(yè)務(wù)流程問題監(jiān)控產(chǎn)品調(diào)整決策操作效率BI應(yīng)用要成功,和其他系統(tǒng)一樣,必須受用戶普遍歡迎,同時對業(yè)務(wù)產(chǎn)生價值業(yè)務(wù)操作輔助是最基本的BI應(yīng)用,BI必須全力推廣的,并為更高級的應(yīng)用服務(wù)業(yè)務(wù)流程,是對某一個業(yè)務(wù)的整體描述,企業(yè)的執(zhí)行是否成功,是否需要調(diào)整,都需要通過本階段實現(xiàn),承上啟下。能幫助決策者提供盡量多的高價值信息,使決策者盡量減少BI應(yīng)用才能有真正有價值的決策支持。----宋停云與您分享--------宋停云與您分享----維度建模與關(guān)系建模的比較徐輝強 北京大學智能科學系 1001213776數(shù)據(jù)倉庫、實體關(guān)系建模、維度建模1、 引言。這種分離劃清了數(shù)據(jù)處理的分析型環(huán)境與----宋停云與您分享--------宋停云與您分享----數(shù)據(jù)倉庫是決策支持系統(tǒng)( 數(shù)據(jù)倉庫是決策支持系統(tǒng)( dss)和聯(lián)機分析應(yīng)用數(shù)據(jù)源的結(jié)構(gòu)化數(shù)據(jù)環(huán)境。數(shù)據(jù)倉庫研究和解決從數(shù)據(jù)庫中獲取信息的問結(jié)構(gòu)化數(shù)據(jù)環(huán)境。數(shù)據(jù)倉庫研究和解決從數(shù)據(jù)庫中獲取信息的問題。數(shù)據(jù)倉庫的特征在于面向主題、集成性、穩(wěn)定性和時變性。題。數(shù)據(jù)倉庫的特征在于面向主題、集成性、穩(wěn)定性和時變性。數(shù)據(jù)倉庫之父 William H. Inmon 在 1991 年出版的“BuildingtheDataWarehouse”一書中所提出的定義被廣泛接受——數(shù)據(jù)倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的( Integrated)、相對穩(wěn)定的(Non-Volatile反映歷史變化(TimeVariant的數(shù)據(jù)集合,用于支持管理決策(DecisionMakingSupport) 。數(shù)據(jù)倉庫,是在數(shù)據(jù)庫已經(jīng)大量存在的情況下,為了進一步挖掘數(shù)據(jù)資源、為了決策需要而產(chǎn)生的,它并不是所謂的“大型數(shù)據(jù)庫”。數(shù)據(jù)倉庫的方案建設(shè)的目的,是為前端查詢和分析作為基礎(chǔ),由于有較大的冗余,所以需要的存儲也較大。設(shè)計好一個數(shù)據(jù)倉庫是一個相對比較復(fù)雜的過程,需要抽象數(shù)據(jù)進行具體化,并且建立好模型,因此在這個過程中,模型設(shè)計是一個比較重要的一環(huán)。2、 關(guān)系建模實體關(guān)系模型是通過兩個概念“實體”和“關(guān)系)構(gòu)造特定的集合論中的關(guān)系概念為基礎(chǔ)發(fā)展起來的。關(guān)系模型中無論是實體----宋停云與您分享--------宋停云與您分享----還是實體間的聯(lián)系均由單一的結(jié)構(gòu)類型——關(guān)系來表示。在實際的關(guān)系數(shù)據(jù)庫中的關(guān)系也稱表。一個關(guān)系數(shù)據(jù)庫就是由若干個表組成。關(guān)系模型主要的組成部分有:1)關(guān)系數(shù)據(jù)結(jié)構(gòu)單一的數(shù)據(jù)結(jié)構(gòu)——關(guān)系現(xiàn)實世界的實體以及實體間的各種聯(lián)系均用關(guān)系來表示,從用戶角度看,關(guān)系模型中數(shù)據(jù)的邏輯結(jié)構(gòu)是一張二維表。2)關(guān)系操作集合常用的關(guān)系操作包括查詢操作和插入、刪除、修改操作兩大部分。其中查詢操作的表達能力最重要,包括:選擇、投影、連接、除、并、交、差等。關(guān)系模型中的關(guān)系操作能力早期通常是用代數(shù)方法或邏輯方法來表示,分別稱為關(guān)系代數(shù)和關(guān)系演算。關(guān)系代數(shù)是用對關(guān)系的代數(shù)運算來表達查詢要求的方式;關(guān)系演算是用謂詞來表達查詢要求的方式。另外還有一種介于關(guān)系代數(shù)和關(guān)系演算的語言稱位結(jié)構(gòu)化查詢語言,簡稱SQL。3)關(guān)系的數(shù)據(jù)完整性包括:域完整性、實體完整性、參照完整性和用戶自定義的完整性。----宋停云與您分享--------宋停云與您分享----域完整性:指屬性的取值范圍,如性別取值應(yīng)為男或女。實體完整性(EntityIntegrity) 規(guī)則:若屬性 A是基本關(guān)系 R的主屬性,則屬性 A不能取空值。例如:在課程表(課程號,課程名,教師,周課時數(shù),備注)中,“課程號”屬性為主鍵,則“課程號”不能取相同的值,也不能取空值。參照完整性規(guī)則:若屬性(或?qū)傩越M)F是基本關(guān)系R的外鍵,它與基本關(guān)系S的主鍵Ks相對應(yīng)(關(guān)系R和S不一定是不同的關(guān)系),則對于關(guān)系R中每個元組在屬性F上的值必須為:1)或者取空值(F中的每個屬性值均為空);2)或者等于 S中某個元組的主鍵值。域完整性、實體完整性和參照完整性是關(guān)系模型中必須滿足的完整性約束條件,只要是關(guān)系數(shù)據(jù)庫系統(tǒng)就應(yīng)該支持域完整性、實體完整性和參照完整性。除此之外,不同的關(guān)系數(shù)據(jù)庫系統(tǒng)根據(jù)其應(yīng)用環(huán)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司商務(wù)用車維修合同范本
- 2025年制動分泵項目合作計劃書
- 2025年麻將涼席合作協(xié)議書
- 個體建材購銷合同范本
- 單位食堂供應(yīng)合同范例
- 2025年加氣加注設(shè)備項目建議書
- 家政公司家政公司加盟合同范本
- 2025年霍爾汽車點火系統(tǒng)合作協(xié)議書
- 農(nóng)村承包荒地合同范例
- 合同范本面布局
- 2025年湖南鐵道職業(yè)技術(shù)學院單招職業(yè)技能測試題庫附答案
- 個人車輛租賃給公司合同5篇
- 2025年上半年中國海油秋季校園招聘易考易錯模擬試題(共500題)試卷后附參考答案
- 云南省勞動合同范本
- 北京市石景山區(qū)2024-2025學年高三上學期期末英語試題【含答案解析】
- 2024-2025年中國鋰電池隔膜行業(yè)未來發(fā)展趨勢分析及投資規(guī)劃建議研究報告
- 2024年南昌健康職業(yè)技術(shù)學院高職單招職業(yè)技能測驗歷年參考題庫(頻考版)含答案解析
- 2025浙江中煙招聘高頻重點提升(共500題)附帶答案詳解
- 月子會所護理人員禮儀
- 校園安全隱患排查培訓
- 《化妝品包裝材料相容性試驗評估指南》
評論
0/150
提交評論