


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
數(shù)倉避坑-整明白懂粒度編輯導(dǎo)語:在數(shù)倉中,你理解什么是粒度嗎?這是一個(gè)很抽象的名詞,但同時(shí)它又是數(shù)倉中重要的一個(gè)概念。作者通過五個(gè)方面總結(jié)如何把粒度整明白的方法,我們一起來看下吧。上篇文章數(shù)倉避坑-搞懂維度模型介紹了維度建模經(jīng)典的四部曲:選定業(yè)務(wù)過程、聲明粒度、確定維度、確定事實(shí)。第二步中,粒度的概念著實(shí)有點(diǎn)抽象,很難理解。但是,如果粒度整不明白,近乎等于數(shù)倉沒入門,你將會面臨一系列問題~今天就給大家分享一下,我踩坑粒度的過程。一、先說說粒度的概念選定了分析的過程,緊接著就要聲明粒度??吹綍镞@么說,我當(dāng)時(shí)的反應(yīng)是:為什么?粒度是什么?普通場景里,粒度可以理解為一個(gè)東西的大小。比如,鉆石要區(qū)分顆粒度,大小不同的鉆石,價(jià)格不一。而在數(shù)據(jù)分析的語境里,粒度則意味著分析的范圍,分析的細(xì)致程度。舉兩個(gè)例子。系統(tǒng)的注冊總?cè)藬?shù),可以按照國家、省份來統(tǒng)計(jì),這是地域?qū)用嫔系牟煌y(tǒng)計(jì)粒度。系統(tǒng)的活躍用戶數(shù),可以按天、按周統(tǒng)計(jì)登錄人數(shù),這是時(shí)間層面上不同的統(tǒng)計(jì)粒度。從數(shù)據(jù)表的角度來看,粒度則解釋著什么情況下增加一條記錄。按國家統(tǒng)計(jì)用戶數(shù),中國只會有一條記錄,按省統(tǒng)計(jì),中國則會有34條記錄。按周統(tǒng)計(jì)活躍用戶,一年只會有52行記錄,按天統(tǒng)計(jì),一年則有365或366條記錄。二、通過實(shí)戰(zhàn)理解粒度好,看書搞懂了概念,實(shí)戰(zhàn)就來了。公司出了新APP,老板很關(guān)心新APP的用戶活躍程度,于是,用戶端產(chǎn)品經(jīng)理希望做個(gè)面板,看每天有多少人登錄。同時(shí),他提了另一個(gè)需求,他希望能支持統(tǒng)計(jì)兩個(gè)日期區(qū)間內(nèi)的登錄人數(shù)(兩個(gè)日期是變化的)。通過例子理解:某個(gè)活動發(fā)布后,要查看不同時(shí)間區(qū)間內(nèi)的累積活躍用戶數(shù),比如1-2號,3-5號,以便及時(shí)調(diào)整促活的策略。初生牛犢不怕虎,說搞咱就搞,就按照維度建模經(jīng)典套路搞。首先,選定業(yè)務(wù)過程。這個(gè)一目了然,自然就是用戶登錄過程。其次,聲明粒度。這里用戶方希望按照不同的日期統(tǒng)計(jì)累積人數(shù),那粒度是天。然后,是確定維度。這個(gè)例子里,因?yàn)橐凑杖掌诜治?,最主要的維度是日期(為了簡單,例子里就就先不考慮其他維度了),日期維度表設(shè)計(jì)如下:三下五除二,維度模型搞定!就等寫好ETL腳本,按周期調(diào)度啦。三、維度模型搞不定,是粒度理解不到位構(gòu)建模型,最終都是為了查出對應(yīng)的指標(biāo)和結(jié)果,所以維度模型通常都會跟標(biāo)準(zhǔn)的指標(biāo)系統(tǒng)配套來使用。對指標(biāo)體系不太了解的朋友可以看這篇:一文幫你更好地理解指標(biāo),或者看華為阿里的產(chǎn)品。當(dāng)我們按照標(biāo)準(zhǔn)套路,進(jìn)入指標(biāo)設(shè)計(jì)階段,問題就會慢慢浮出水
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《初中數(shù)學(xué)競賽題庫:提高解題能力的訓(xùn)練教案》
- 個(gè)人技術(shù)咨詢服務(wù)協(xié)議
- 地面伽瑪射線全譜儀相關(guān)項(xiàng)目投資計(jì)劃書
- 網(wǎng)絡(luò)安全防護(hù)技術(shù)研究成果轉(zhuǎn)化協(xié)議
- 商業(yè)建筑防水工程合同書
- 教育科技研發(fā)與教育平臺開發(fā)合作書
- PCM脈碼調(diào)制終端設(shè)備相關(guān)行業(yè)投資方案范本
- 臨時(shí)工聘用勞務(wù)協(xié)議書
- 清潔能源應(yīng)用開發(fā)合作協(xié)議
- 體育場館運(yùn)營及管理手冊
- 2024脈沖式布袋除塵器設(shè)備運(yùn)行情況記錄表(模板)
- 管理批次管理辦法
- 機(jī)器人維護(hù)協(xié)議范文
- 助理值班員(中級)技能鑒定理論題庫(濃縮400題)
- 診所負(fù)責(zé)人變更申請書
- DL-T5334-2016電力工程勘測安全規(guī)程
- (高清版)JTG D50-2017 公路瀝青路面設(shè)計(jì)規(guī)范
- 《鐵路職業(yè)道德》課件-1.1 職業(yè)與職業(yè)化
- 頭療加盟方案
- 2024年內(nèi)蒙古交通職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫含答案
- 《幼兒安全》安安全全坐火車
評論
0/150
提交評論