版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第9章數(shù)據(jù)倉庫開發(fā)實例
9.1基于商務(wù)智能的超市營銷系統(tǒng)規(guī)劃與分析9.2商務(wù)智能開發(fā)工具簡介
9.3SQLServer的數(shù)據(jù)倉庫創(chuàng)建9.4SQLServer數(shù)據(jù)倉庫事實表與多維數(shù)據(jù)集的建立第9章數(shù)據(jù)倉庫開發(fā)實例9.1基于商務(wù)智能的超市營銷系統(tǒng)規(guī)1第9章數(shù)據(jù)倉庫開發(fā)實例
通過本章學(xué)習(xí),可以了解:超市銷售商務(wù)智能規(guī)劃與需求分析;超市銷售數(shù)據(jù)倉庫的邏輯模型設(shè)計;SQLServer的商務(wù)智能開發(fā)工具;SQLServer事實表的建立;SQLServer的多維數(shù)據(jù)集的建立;第9章數(shù)據(jù)倉庫開發(fā)實例通過本章學(xué)習(xí),可以了解:29.1基于商務(wù)智能的超市營銷系統(tǒng)規(guī)劃與分析
某大型連鎖超市的業(yè)務(wù)涵蓋于3個省范圍內(nèi)的1000多家門市。每個門市都有較完整的日用品和食品銷售部門,包括百貨、雜貨、冷凍食品、奶制品、肉制品和面包食品等,大約5萬多種,其中大約45000種商品來自外部生產(chǎn)廠家,并在包裝上印有條形碼。每個條形碼代表了唯一的商品。為該超市建立一個能夠提高市場競爭能力的數(shù)據(jù)倉庫,首先需要進(jìn)行數(shù)據(jù)倉庫的規(guī)劃分析。這就涉及到對數(shù)據(jù)倉庫的需求分析、模型構(gòu)建兩個過程。9.1基于商務(wù)智能的超市營銷系統(tǒng)規(guī)劃與分析某大型連鎖超市的39.1.1超市銷售商務(wù)智能的需求分析
1超市營銷售策略分析超市最高層管理所關(guān)注的是如何通過商品的采購、儲存與銷售,最大限度地獲取利潤。需要通過加強(qiáng)對每種商品的管理,減低商品的采購成本和管理費(fèi)用,吸引盡可能多的客戶。其中最重要的是關(guān)于商品促銷的管理決策。需要依靠合適的促銷活動,應(yīng)用適當(dāng)?shù)拇黉N策略針對合適的客戶,以增加超市的銷售利潤,是超市數(shù)據(jù)倉庫建設(shè)的基本需求。超市不同商品的銷售利潤是有差別的。希望在數(shù)據(jù)倉庫中通過對商品的贏利分析,了解不同商品的銷售贏利狀態(tài),以確定企業(yè)的銷售重點(diǎn),對那些可以為企業(yè)帶來較大贏利的商品加大促銷力度。9.1.1超市銷售商務(wù)智能的需求分析1超市營銷售策略分析42超市商品庫存分析超市商品的庫存狀況對超市的利潤具有巨大的影響。超市如果能夠在合適的時候銷售合適的商品,在不出現(xiàn)脫銷的情況下盡可能減少商品庫存的庫存成本,是超市商品庫存分析的主要目的。在商品庫存分析中,管理人員還經(jīng)常要根據(jù)商品的庫存量和商品庫存成本確定商品的銷售價格。從超市的商品庫存情況來看,庫存分析實質(zhì)上是對超市的價值鏈進(jìn)行分析,分析商品庫存在超市的整個價值鏈上所發(fā)揮的作用。9.1.1超市銷售商務(wù)智能的需求分析
2超市商品庫存分析9.1.1超市銷售商務(wù)智能的需求分析53超市商品采購分析超市在商品采購工作中需要分析哪些商品是熱銷的商品,盡可能采購銷售熱銷商品。熱銷商品往往是加快企業(yè)資金流動的動力,快速流動的資金可以使企業(yè)在一定的時間內(nèi)取得比其他企業(yè)更多的利潤。而且超市營銷管理人員在了解熱銷商品后,可以大量采購熱銷商品,重新安排熱銷商品的貨架,向更多的客戶推銷熱銷商品,便于更多客戶的購買,以進(jìn)一步加快企業(yè)資金的流動。9.1.1超市銷售商務(wù)智能的需求分析
3超市商品采購分析9.1.1超市銷售商務(wù)智能的需求分析64超市客戶關(guān)系分析用90:20理論分析,占企業(yè)客戶群20%左右的客戶購買金額往往占據(jù)了企業(yè)銷售金額的90%。對客戶群體的劃分有利于企業(yè)了解企業(yè)的主要客戶群體狀況、主要客戶群對企業(yè)銷售服務(wù)的需求狀況、不同客戶群為企業(yè)所帶來的利潤狀況。在對客戶進(jìn)行類型劃分的基礎(chǔ)上,可以針對不同客戶群體的特點(diǎn)采用不同的營銷策略,對客戶群體的消費(fèi)進(jìn)行合理的引導(dǎo)。超市客戶的流失,意味著企業(yè)贏利的降低。企業(yè)管理者希望了解哪些客戶可能會流失,使企業(yè)能夠提前設(shè)法加以挽留。9.1.1超市銷售商務(wù)智能的需求分析
4超市客戶關(guān)系分析9.1.1超市銷售商務(wù)智能的需求分析79.1.2超市營銷數(shù)據(jù)倉庫E-R模型構(gòu)造數(shù)據(jù)倉庫設(shè)計中就首先考慮營銷主題的設(shè)計,確定超市營銷主題模型
采用了星型模型,沒有采用雪花模型。因為雪花模型通過對維表的分類細(xì)化描述,對于主題的分類詳細(xì)查詢具有良好的響應(yīng)能力。但是雪花模型的構(gòu)造在本質(zhì)上是一種數(shù)據(jù)模型的規(guī)范化處理,會給數(shù)據(jù)倉庫操作帶來不同表的連接困難。但是在對維度表進(jìn)行維護(hù)時,可能需要對大量重復(fù)值進(jìn)行修改。星型模型通過對維表的冗余應(yīng)用,以犧牲維表空間來換取數(shù)據(jù)倉庫的高性能與易使用的優(yōu)勢。
9.1.2超市營銷數(shù)據(jù)倉庫E-R模型構(gòu)造數(shù)據(jù)倉庫設(shè)計中就8日期商品促銷客戶門市商品營銷9.1.2超市營銷數(shù)據(jù)倉庫E-R模型構(gòu)造日期商品促銷客戶門市商品營銷9.1.2超市營銷數(shù)據(jù)倉庫E99.1.3超市數(shù)據(jù)倉庫事實表模型確定在數(shù)據(jù)倉庫中,怎樣的粒度數(shù)據(jù)才能滿足管理人員對數(shù)據(jù)倉庫營銷策劃分析的需要。超市商品銷售主題中,最理想的原子數(shù)據(jù)是來自POS機(jī)上的每個銷售事務(wù)數(shù)據(jù)分析超市高層管理人員通過那些角度,即需要通過那些維度來考察、選擇營銷方案。一般情況下,在確定超市營銷策劃時,超市管理人員需要通過日期、商品、門市、促銷和客戶五個維度對促銷方案進(jìn)行分析,了解促銷方案的可用性和效果9.1.3超市數(shù)據(jù)倉庫事實表模型確定在數(shù)據(jù)倉庫中,怎樣的10超市營銷數(shù)據(jù)倉庫事實表模型
超市營銷主題日期關(guān)鍵字門市關(guān)鍵字商品關(guān)鍵字促銷關(guān)鍵字商品銷售編號商品銷售量商品銷售額商品成本商品銷售利潤日期維日期關(guān)鍵字商品維商品關(guān)鍵字門市維門市關(guān)鍵字促銷維促銷關(guān)鍵字客戶維客戶關(guān)鍵字超市營銷數(shù)據(jù)倉庫事實表模型超市營銷主題日期維商品維門市維促11超市營銷數(shù)據(jù)倉庫事實表模型
從銷售系統(tǒng)中可直接獲取商品銷售量、銷售單價、商品成本。但管理人員考察超市的營銷策略時,需要考慮營銷策略和相應(yīng)的商品銷售利潤。商品銷售利潤可以直接通過商品銷售量、銷售單價和商品成本計算獲得,但商品銷售利潤具有良好的可加性,管理人員又經(jīng)常需要查看。將利潤數(shù)據(jù)存放在事實表中可大大減少數(shù)據(jù)倉庫工作時的工作量,還可以保證所有用戶在使用商品銷售利潤這一重要數(shù)據(jù)時的一致性。商品銷售單價對于計算商品利潤十分重要,但將某個商品一段時間內(nèi)的所有銷售單價相加是毫無意義的。管理人員可能只對某一時間段內(nèi)某個商品的平均銷售價感興趣。平均銷售價格可以用該時間段內(nèi)的商品銷售額除以商品銷售量獲取。在事實表中可以不用商品銷售單價,代之以商品銷售額,銷售額也常常是管理人員衡量營銷策略好壞的重要指標(biāo)。超市營銷數(shù)據(jù)倉庫事實表模型從銷售系統(tǒng)中可直接獲取商品銷售量12超市營銷數(shù)據(jù)倉庫事實表模型
超市管理者還可能對商品銷售的利潤率感興趣,該數(shù)據(jù)可以用商品銷售利潤除以銷售額獲得,該數(shù)據(jù)不是一個可加數(shù)據(jù)。將比率或百分?jǐn)?shù)的數(shù)據(jù)進(jìn)行相加,所獲得的數(shù)據(jù)是沒有什么意義的。管理人員在了解某一時期某些商品的利潤率時,完全可以利用該時期該商品利潤和銷售額獲得。因此,事實表中確定度量數(shù)據(jù)為商品銷售量、商品銷售額、商品成本和商品銷售利潤。超市營銷數(shù)據(jù)倉庫事實表模型超市管理者還可能對商品銷售的利潤139.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計1.日期維日期維模型是許多數(shù)據(jù)倉庫應(yīng)用中的常用維度,其設(shè)計方式與其他多數(shù)維模型有差別。具體設(shè)計時,日期維可以存放以日期表示的5到10年的數(shù)據(jù)行,也可以將3至4年的數(shù)據(jù)行作為日期維內(nèi)容。如果對10年的每一天都進(jìn)行存儲,也只需要3650行
日期維的每列由行所代表的特定日期進(jìn)行定義?!靶瞧凇绷泻邢瘛靶瞧谝弧边@樣的名稱內(nèi)容,該列可用于創(chuàng)建比較“星期一”與“星期日”銷售情況對比的查詢。日歷日期編號從1開始取值,然后根據(jù)月份的情況取到29、29、30或者31,這一列主要用于對每個月的同一天進(jìn)行比較。同樣,可以給出日歷周編號、和日歷月編號(1,…,12)。9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計1.日期維14紀(jì)元表示法采用從某紀(jì)元開始連續(xù)對日期進(jìn)行計數(shù)的方法來給出日編號,在表中還可以給出“星期”與“月份”的絕對編號列。這些數(shù)據(jù)支持跨年度跨月份的簡單數(shù)據(jù)運(yùn)算。在生成報表時,經(jīng)常要給出像“一月”這樣的月份名稱。因此,為報表確定一個“年月”(YYYY-MM)列標(biāo)題也有必要。報表中很可能需要季度編號(Q1,…,Q4)或年季度編號列。如果企業(yè)的財政年度與日歷表在周期上不一致,還需要為財政年度給出類似列。在“節(jié)假日”列中給出“節(jié)假日”或者“非節(jié)假日”的內(nèi)容,維表屬性作為數(shù)據(jù)分析的導(dǎo)航,簡單地在“節(jié)假日”列中給出“Y”或者“N”對數(shù)據(jù)分析沒有多大用處。例如,在生成某種商品的節(jié)假日與非節(jié)假日銷售情況比較查詢時,列中給出“節(jié)假日”或者“非節(jié)假日”這樣有意義的值要比一個簡單的“Y”或者“N”之類的值有用得多。9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計紀(jì)元表示法采用從某紀(jì)元開始連續(xù)對日期進(jìn)行計數(shù)的方法來給出日編15“星期六”與“星期日”要?dú)w入“周末”之列。當(dāng)然,可以對多個日期表屬性進(jìn)行共同約束,從而能夠?qū)崿F(xiàn)一些像平日假期銷售與周末假期銷售進(jìn)行比較的數(shù)據(jù)倉庫應(yīng)用?!颁N售時節(jié)”列應(yīng)設(shè)置為銷售時節(jié)的名稱,例如,春節(jié)、情人節(jié)、端午節(jié)、五一節(jié)、國慶節(jié)、中秋節(jié)、重陽節(jié)、圣誕節(jié)、或者標(biāo)為“不是”?!爸卮笫录绷信c“銷售時節(jié)”列情形類似,可以標(biāo)記為“周日大采購”或者“中秋合家歡”這樣與日期有特殊聯(lián)系的促銷事件。而一般性的促銷活動通常不放在日期表中處理,以促銷維表的形式進(jìn)行更加完整的描述。因為促銷事件并不是僅僅由日期來定義,通常還需要由日期、商品與商店的組合來定義。9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計“星期六”與“星期日”要?dú)w入“周末”之列。當(dāng)然,可以對多個日16日期維度銷售事實日期關(guān)鍵字日期關(guān)鍵字星期商品關(guān)鍵字日歷日期編號門市關(guān)鍵字日歷周編號促銷關(guān)鍵字日歷月編號客戶關(guān)鍵字紀(jì)元日編號POS事務(wù)編號紀(jì)元周編號銷售量紀(jì)元月編號銷售額財政月日編號成本額年度日歷周數(shù)利潤金額年度日歷月數(shù)日歷年月(YYYY-MM)日歷季度日歷年季度日歷半年度日期維度銷售事實日期關(guān)鍵字日期關(guān)鍵字星期商品關(guān)鍵字日歷日期編17日歷年財政周年度財政周數(shù)財政月年度財政月數(shù)財政年月財政季度財政年季度財政半年度財政年節(jié)假日指示符星期指示符銷售時節(jié)重大事件……日歷年財政周年度財政周數(shù)財政月年度財政月數(shù)財政年月財政季度財182.商品維一般超市門市可能存儲60000個商品編號,但大型連鎖超市保留不再銷售的歷史商品營銷方案情況,商品維度可能至少需要150000行乃至多達(dá)百萬行。
商品維度數(shù)據(jù)主要來源于業(yè)務(wù)系統(tǒng)的商品主文件。超市總部對所銷售商品的主文件進(jìn)行統(tǒng)一管理。商品主文件的一個重要作用,就是維護(hù)每個商品存儲標(biāo)志的許多描述屬性。商品維是一組重要的屬性。某個商品種類包含多個商品子類,商品子類包含多個商標(biāo),商標(biāo)包含多個商品存儲標(biāo)志。還應(yīng)包含描述商品形狀或存儲位置的層次屬性,例如商品的包裝類型、包裝尺寸、包裝數(shù)量、托盤中的包裝數(shù),以及與商品存儲的層次:存儲類型、貨架結(jié)構(gòu)等維度。9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計2.商品維9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計193.門市維門市維表用于描述超市的各個鏈鎖店。門市維表是基本的地理維度,每個門市可被看成一個位置。這樣,可以由門市形成諸如街道、郵政編碼、縣、市、省這樣的任意地理屬性。地理體系與門市地區(qū)體系對每個門市來說,都有良好的定義。在連鎖超市所使用的門市維表中有建筑面積、金融服務(wù)、最早開業(yè)時間等描述特定門市的文字描述。描述銷售面積的列應(yīng)該是數(shù)字型的,并且在理論上是跨門市可相加的,以表示某一地區(qū)的銷售面積。它是門市的一個不變屬性,通常作為報表約束或者行標(biāo)題使用。而且為了能夠分析不同種類商品對超市銷售利潤的貢獻(xiàn)情況,還需要設(shè)立不同商品的銷售面積。9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計3.門市維9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計204.促銷維超市的促銷方案可能包含:臨時降價、柜臺展銷、報紙廣告與優(yōu)惠券發(fā)放等。促銷維應(yīng)該可以反映商品促銷方案的成效。促銷的成效評估因素:促銷商品的銷售是否在促銷區(qū)間出現(xiàn)增長、是否在促銷進(jìn)行之前或者隨后出現(xiàn)減少狀況;是否發(fā)生促銷商品的銷售出現(xiàn)增長,而臨近貨架上的其他商品銷售卻呈現(xiàn)出相應(yīng)的降低情況(同類相食);促銷類別中所有商品的銷售是否都經(jīng)歷了一個實際的總體增長;促銷是否贏利。促銷利潤的計算要考慮促銷類別的利潤增量與時間過渡、同類調(diào)劑以及銷售底線等各種情況。9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計4.促銷維9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計214.促銷維在促銷維度中為促銷出現(xiàn)的每種組合都建立一行記錄是很有意義的。在一年的銷售活動中,可能出現(xiàn)1000個廣告,5000次臨時降價和1000次柜臺展銷,但可能只有10000個組合促銷能影響任何特定的商品。例如,在某給定維度中,大多數(shù)門市都會同時運(yùn)作所有促銷售手段,而只有少數(shù)幾個門市不進(jìn)行柜臺展銷。在這種情況下,就需要兩個單獨(dú)的促銷記錄行,一個用于通常的降價并外加廣告與柜臺展銷,而另一個用于降價并外加單純的廣告。超市的促銷維度可以包含促銷名稱、減價類型、促銷媒體類型、廣告類型和優(yōu)惠券類型等。超市的主要促銷方式是降價、廣告、柜臺展銷與優(yōu)惠券。如果將這些因素分別建立促銷維度,就可以記錄分析這些促銷方法非常相似的信息,使用戶更加容易理解促銷方案的作用。但是將所有的促銷因素合并在一個維表中,則能夠方便用戶的瀏覽,能夠弄清各種不同的價格降低、廣告、展銷與優(yōu)惠券是如何在一起共同發(fā)揮促銷作用的。9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計4.促銷維9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計225.客戶維超市的客戶維度可以包含客戶賬號、姓名、地址、所在地區(qū)、郵政編碼、電子信箱、電話、日常活動范圍、出生日期、收入、孩子數(shù)量、住房和汽車等內(nèi)容。在客戶維中的地址由于客戶可能會給出其家庭地址、工作地址或其它一些常用地址,因此在維表中可以設(shè)置4個地址,對于電話的設(shè)置也是出于相同因素的考慮。在數(shù)據(jù)倉庫的應(yīng)用中有時需要對客戶按照不同的地區(qū)進(jìn)行分析,為此,在維表中就按照省、市、縣(區(qū))郵政編碼進(jìn)行地區(qū)的設(shè)置。性別、婚姻狀況、家庭人口、住房條件和自有汽車情況均是超市銷售管理人員對超市營銷策略進(jìn)行分析的主要依據(jù)。出于超市營銷策略制定的考慮,還需要了解客戶的日?;顒臃秶员阌嗅槍π缘剡M(jìn)行促銷廣告的發(fā)送。9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計5.客戶維9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計239.1.5超市數(shù)據(jù)倉庫模型的關(guān)鍵字設(shè)計采用代理關(guān)鍵字技術(shù),而不是依賴業(yè)務(wù)系統(tǒng)中的各種關(guān)鍵字(許多業(yè)務(wù)系統(tǒng)中的各種編碼往往具有某種特定的含義)代理關(guān)鍵字一般采用在填充維度時按需要而順序分配的整數(shù)值。例如,為第一條商品記錄分配一個值為1的商品代理關(guān)鍵字,第二條分配2,第n條分配n等。代理關(guān)鍵字僅僅用于維度表到事實表的連接。
代理關(guān)鍵字的好處還能夠?qū)?shù)據(jù)倉庫環(huán)境的操作型變化進(jìn)行緩沖,不會受到商品編碼生成、更新、刪除、再生與重用等操作型規(guī)則的妨礙。代理關(guān)鍵字允許數(shù)據(jù)倉庫對來自多個業(yè)務(wù)型系統(tǒng)的數(shù)據(jù)進(jìn)行合并,即使它們之間缺乏一致的源關(guān)鍵字也無所謂。9.1.5超市數(shù)據(jù)倉庫模型的關(guān)鍵字設(shè)計采用代理關(guān)鍵字技術(shù)249.1.5超市數(shù)據(jù)倉庫模型的關(guān)鍵字設(shè)計使用代理關(guān)鍵字還可以獲得性能上的優(yōu)勢。代理關(guān)鍵字可能只有一個整數(shù)所占據(jù)的空間大小,卻能確保充裕地容納維度行以后可能需要的序號或者最大編號。而業(yè)務(wù)型編碼常常是一個混合了字母與數(shù)字的區(qū)間編碼體系。代理關(guān)鍵字還能夠用于記錄那些諸如“不在促銷之列”這樣的可能沒有業(yè)務(wù)系統(tǒng)中編碼的維度情形。通過對數(shù)據(jù)倉庫的關(guān)鍵字施加控制,就能夠做到不管是否缺少業(yè)務(wù)型編碼,總可以分配一個代理關(guān)鍵字將這類情況標(biāo)識出來。將代理日期關(guān)鍵字處理成日期序號,可以允許事實表在日期關(guān)鍵字基礎(chǔ)上進(jìn)行物理分區(qū)。9.1.5超市數(shù)據(jù)倉庫模型的關(guān)鍵字設(shè)計使用代理關(guān)鍵字還可259.1.5超市數(shù)據(jù)倉庫模型的關(guān)鍵字設(shè)計目前在超市數(shù)據(jù)倉庫中已經(jīng)包含了6個實際的表:營銷事實表與日期、商品、門市、促銷和客戶維表。每個維表有一個主關(guān)鍵字,而事實表除了有一個退化的銷售事務(wù)編號之外,還有由五個外關(guān)鍵字組成的一個復(fù)合關(guān)鍵字。如果五個關(guān)鍵字都是進(jìn)行了緊湊處理的連續(xù)整數(shù),那么僅僅需要為所有五個關(guān)鍵字保留19個字節(jié)的小存儲空間(日期、商品、促銷和客戶維各用4個字節(jié),而門市用2個字節(jié))。同時,銷售事務(wù)編號可能另外需要9個字節(jié)。如果事實表4類事實(銷售量、銷售額、成本和利潤)中的任何一個都是4字節(jié)的整數(shù),則僅僅需要再保留另外的16個字節(jié),這樣事實表只有42個字節(jié)寬。對一個10億行的事實表也只占用大約42GB的存儲空間就可以存儲所有事實數(shù)據(jù)。9.1.5超市數(shù)據(jù)倉庫模型的關(guān)鍵字設(shè)計目前在超市數(shù)據(jù)倉庫269.1.6超市數(shù)據(jù)倉庫元數(shù)據(jù)設(shè)計銷售主題元數(shù)據(jù)名稱Sales描述整個超市中每個門市中每個POS機(jī)所記載的商品銷售狀況目的用于進(jìn)行超市銷售狀況和促銷情況的分析聯(lián)系人各個門市銷售經(jīng)理維時間、商品、客戶、商店、促銷事實銷售事實表度量值銷售成本、銷售額、銷售利潤、銷售量9.1.6超市數(shù)據(jù)倉庫元數(shù)據(jù)設(shè)計銷售主題元數(shù)據(jù)名稱Sa27銷售事實元數(shù)據(jù)名稱Sales_Fact_年份描述記錄每個門市每個POS機(jī)所發(fā)生的銷售數(shù)據(jù)目的作為銷售主題的分析事實使用狀況每天平均查詢次數(shù)每天平均查詢返回行數(shù)每天查詢平均執(zhí)行時間(分鐘)每天最大查詢次數(shù)每天查詢返回最大行數(shù)每天查詢最大執(zhí)行時間(分鐘)存檔規(guī)則每個月將前36個月的數(shù)據(jù)存檔存檔狀況最近存檔處理日期已經(jīng)存檔數(shù)據(jù)日期更新規(guī)則每個月將前60個月的數(shù)據(jù)從數(shù)據(jù)倉庫中刪除更新狀況最近更新處理日期已更新數(shù)據(jù)日期銷售事實元數(shù)據(jù)名稱Sales_Fact_年份描述記錄每個門市28銷售事實元數(shù)據(jù)數(shù)據(jù)質(zhì)量要求及確認(rèn)由于從各個門市POS機(jī)上所產(chǎn)生的數(shù)據(jù)可能會由于極少的人工輸入,而使數(shù)據(jù)質(zhì)量不能得到保證,但也真實地反映了銷售現(xiàn)狀,不能隨意修改,應(yīng)被認(rèn)可。數(shù)據(jù)準(zhǔn)確性要求必須百分百地反映各個門市銷售狀況數(shù)據(jù)粒度要求能夠反映每一項商品的銷售狀況,不對數(shù)據(jù)進(jìn)行匯總表鍵事實表的鍵是時間、商品、客戶、商店和促銷維中鍵的組合數(shù)據(jù)來源超市銷售業(yè)務(wù)系統(tǒng)中的銷售表(sales_fact_年份)加載周期每天一次加載狀況最后加載日期加載的行數(shù)加載規(guī)則每天清晨3:00將各個超市門市中前一天的銷售事實數(shù)據(jù)拷貝到本表,拷貝過程中要根據(jù)各個數(shù)據(jù)成員所定義的加載規(guī)則進(jìn)行篩選和清理銷售事實元數(shù)據(jù)數(shù)據(jù)質(zhì)量要求及確認(rèn)由于從各個門市POS機(jī)上所產(chǎn)29維元數(shù)據(jù)名稱客戶(Customer)定義從超市任何一個門市購買貨物的任何個人或組織都稱為客戶,一個客戶可以與多個銷售地區(qū)發(fā)生聯(lián)系(即出現(xiàn)在地理維的不同層次體系中)層次結(jié)構(gòu)一個客戶的數(shù)據(jù)可以在3個級別上進(jìn)行統(tǒng)計:最低級別是出現(xiàn)在客戶所在的縣/區(qū),其上為市、省更改規(guī)則新的客戶位置作為新的一行插入維中。對已有位置的修改,則在原處更新加載頻率每天一次加載統(tǒng)計數(shù)據(jù)最后加載日期加載的行數(shù)使用的統(tǒng)計數(shù)據(jù)每天平均查詢個數(shù)每天查詢返回的平均行數(shù)每天查詢平均執(zhí)行時間(分鐘)每天最大的查詢個數(shù)每天查詢返回的最大行數(shù)每天查詢執(zhí)行的最長時間(分鐘)維元數(shù)據(jù)名稱客戶(Customer)定義從超市任何一個門市30維元數(shù)據(jù)存檔規(guī)則每個月將前36個月的數(shù)據(jù)存檔已經(jīng)存檔數(shù)據(jù)日期更新規(guī)則每個月將前60個月的數(shù)據(jù)從數(shù)據(jù)倉庫中刪除更新狀況最近更新處理日期已經(jīng)更新數(shù)據(jù)日期數(shù)據(jù)質(zhì)量增加一個新客戶時,先檢查是否已在其他地方和該客戶做過交易。少數(shù)情況下,由于檢查失敗,會將一個客戶的不同部門作為不同客戶保存。直到客戶注意到在不同的地方與公司交易時,以前的記錄仍保持不變。地區(qū)屬性并不是銷售業(yè)務(wù)系統(tǒng)原有的,而是根據(jù)送貨地址屬性中的郵政編碼進(jìn)行區(qū)分?jǐn)?shù)據(jù)的準(zhǔn)確程度一個客戶與其地理位置的關(guān)聯(lián)出錯的可能性在某一百分比以下,該百分比大小要根據(jù)對業(yè)務(wù)數(shù)據(jù)的研究情況確定關(guān)鍵字客戶維的關(guān)鍵字是系統(tǒng)產(chǎn)生的數(shù)字維元數(shù)據(jù)存檔規(guī)則每個月將前36個月的數(shù)據(jù)存檔已經(jīng)存檔數(shù)據(jù)日31維元數(shù)據(jù)產(chǎn)生關(guān)鍵字的方法從銷售業(yè)務(wù)系統(tǒng)中拷貝一個客戶時,將檢查轉(zhuǎn)換表,檢查該客戶是否已經(jīng)存在于數(shù)據(jù)倉庫中。如果否,就產(chǎn)生一個新的關(guān)鍵字。然后將這個關(guān)鍵字和銷售業(yè)務(wù)系統(tǒng)中的Custom~ID和地區(qū)ID插入轉(zhuǎn)換表中。如果該客戶和位置已經(jīng)存在于轉(zhuǎn)換表,就根據(jù)表中的關(guān)鍵字決定數(shù)據(jù)倉庫中要更新的記錄源表名稱超市銷售業(yè)務(wù)系統(tǒng)中的Customer表加載規(guī)則每天拷貝每個Customer表中的行。對于已存在的客戶,進(jìn)行更新。對于新客戶,確定其所在地理位置之后,產(chǎn)生一個關(guān)鍵字,然后插入一行新記錄。在更新/插入操作之前,需要檢查是否有重復(fù)的客戶名。如果有,則在客戶名后增加一個順序號,直到名字以及名字和順序號的組合都沒有重復(fù)為止。加載規(guī)則只選擇新的和發(fā)生變化的行源表名稱Customer_Location表轉(zhuǎn)換規(guī)則每天拷貝一次Customer_Location表。對于已存在的客戶,更新其送貨地址;對于新的客戶,則產(chǎn)生一個鍵,并插入一行。維元數(shù)據(jù)產(chǎn)生關(guān)鍵字的方法從銷售業(yè)務(wù)系統(tǒng)中拷貝一個客戶時,將32數(shù)據(jù)成員元數(shù)據(jù)名稱客戶關(guān)鍵字(Customer_ID)定義用以唯一標(biāo)識客戶和位置的值更新規(guī)則一旦分配,就不改變數(shù)據(jù)類型數(shù)值型值域1—999,999,999產(chǎn)生規(guī)則由系統(tǒng)自動產(chǎn)生,將當(dāng)前最大值增l來源系統(tǒng)自動生成數(shù)據(jù)成員元數(shù)據(jù)名稱客戶關(guān)鍵字(Customer_ID)定義33數(shù)據(jù)成員元數(shù)據(jù)名稱客戶名稱(Customer_Name)定義客戶的名稱更新規(guī)則客戶名稱發(fā)生改變時,就在原來的記錄上更新數(shù)據(jù)類型Char(30)值域保證能區(qū)分不同客戶的名稱。對不同而具有相同名稱的客戶,可在名稱后依次加1來區(qū)分相同名稱來源超市銷售業(yè)務(wù)系統(tǒng)中Customer表中的Name產(chǎn)生規(guī)則對于零售客戶,其名稱由姓和名組成。對于公司,則將公司名作為客戶名稱數(shù)據(jù)成員元數(shù)據(jù)名稱客戶名稱(Customer_Name)定349.2商務(wù)智能開發(fā)工具簡介9.2.1數(shù)據(jù)倉庫開發(fā)工具目前已有許多數(shù)據(jù)倉庫開發(fā)工具供應(yīng)商,可以提供各種構(gòu)建數(shù)據(jù)倉庫的工具。但有些數(shù)據(jù)倉庫開發(fā)工具還要結(jié)合第三方供應(yīng)商工具才能完成整個數(shù)據(jù)倉庫的構(gòu)建。1.Oracle商務(wù)智能開發(fā)工具Oracle數(shù)據(jù)庫10g是一個基于標(biāo)準(zhǔn)的獨(dú)立平臺,可滿足服務(wù)器一側(cè)商務(wù)智能和數(shù)據(jù)倉庫的各種要求,包括提取、轉(zhuǎn)換和裝載(ETL),在線分析處理(OLAP)和數(shù)據(jù)挖掘。Oracle還推出了針對中小型企業(yè)的需求打包和配置的、完全集成的BI系統(tǒng)——OracleBusinessIntelligenceStandardEditionOne。9.2商務(wù)智能開發(fā)工具簡介9.2.1數(shù)據(jù)倉庫開發(fā)工具352.IBM商務(wù)智能開發(fā)工具一整套面向商業(yè)智能應(yīng)用的軟件產(chǎn)品包——IBMDB2DWE(DataWarehouseEdition),包含十多個工具,給商業(yè)智能提供了全面、堅實的支持,DB2Alphablox是新版的DWE,是一套基于Java開發(fā)的分析組件DB2CubeViews是DB2通用數(shù)據(jù)庫的附加功能部件DB2UDBDataWarehouseEdition(WDE)是一個用于靈活、可伸縮和集成的數(shù)據(jù)倉庫和分析應(yīng)用程序的業(yè)務(wù)智能平臺。2.IBM商務(wù)智能開發(fā)工具一整套面向商業(yè)智能應(yīng)用的軟件產(chǎn)品包363.Sybase數(shù)據(jù)倉庫開發(fā)工具數(shù)據(jù)倉庫解決方案為WarehouseStudio,包括數(shù)據(jù)倉庫的建模、數(shù)據(jù)抽取與轉(zhuǎn)換、數(shù)據(jù)存儲與管理、元數(shù)據(jù)管理以及可視化數(shù)據(jù)分析等工具。其中,WarehouseArchitect是PowerDesigner中的一個設(shè)計模塊,它支持星形模型、雪花模型和ER模型;數(shù)據(jù)抽取與轉(zhuǎn)換工具包括PowerStage、ReplicationServer、CarletonPASSPORT
AdaptiveServerEnterprise是Sybase企業(yè)級關(guān)系數(shù)據(jù)庫,AdaptiveServerIQ是Sybase公司專為數(shù)據(jù)倉庫設(shè)計的關(guān)系數(shù)據(jù)庫SybaseIQ支持各種流行的前端展現(xiàn)工具,如CognosImpromptu、BusinessObjects、BrioQuery等。數(shù)據(jù)分析與展現(xiàn)工具包括PowerDimensions、EnglishWizard、InfoMaker、PowerDynamo等,PowerDimensions是圖形化的OLAP分析工具,支持SMP和多維緩存技術(shù),能夠集成異構(gòu)的關(guān)系型數(shù)據(jù)倉庫和分布式數(shù)據(jù)集市。數(shù)據(jù)倉庫的維護(hù)與管理工具包括WarehouseControlCenter、SybaseCentral、DistributionDirector,其中WarehouseControlCenter是為數(shù)據(jù)倉庫開發(fā)人員提供的元數(shù)據(jù)管理工具。
3.Sybase數(shù)據(jù)倉庫開發(fā)工具數(shù)據(jù)倉庫解決方案為Wareh374.NCR商務(wù)智能開發(fā)工具2006年9月宣布推出全新TeradataWarehouse8.2版,這是一套包括硬件、軟件以及專業(yè)咨詢服務(wù)的全面套件,為前端操作、客戶服務(wù)和策略計劃提供實時商業(yè)智能,以支持策略決策和數(shù)以萬計的日常運(yùn)營事務(wù)。Teradata數(shù)據(jù)挖掘器(TeradataWarehouseMiner)專為分析大規(guī)模數(shù)據(jù)而設(shè)計,工作在Teradata數(shù)據(jù)庫中Teradata數(shù)據(jù)加載工具允許從任何平臺的任何數(shù)據(jù)源中導(dǎo)入或?qū)С鰯?shù)據(jù)TeradataParallelTransporter允許并行多功能裝載環(huán)境TeradataFastLoad用來將從通道或聯(lián)網(wǎng)客戶機(jī)的數(shù)據(jù)源上收集到的大量數(shù)據(jù)裝入到Teradata數(shù)據(jù)庫中的空表中TeradataFastExport可以快速地將數(shù)據(jù)從Teradata數(shù)據(jù)庫中的表或視圖導(dǎo)出到客戶機(jī)系統(tǒng)TeradataTpump用來連續(xù)地將數(shù)據(jù)從數(shù)據(jù)源導(dǎo)入Teradata表中,4.NCR商務(wù)智能開發(fā)工具2006年9月宣布推出全新Tera385.SAS商務(wù)智能開發(fā)工具SAS提供的工具包括30多個專用模塊。其中:SAS/WA(WarehouseAdministrator)是建立數(shù)據(jù)倉庫的集成管理工具;SAS/MDDB是SAS用于在線分析的多維數(shù)據(jù)庫服務(wù)器;SAS/AF提供了屏幕設(shè)計功能和用于開發(fā)的SCL(屏幕控制語言)。SAS公司的增強(qiáng)數(shù)據(jù)挖掘軟件EnterpriseMiner集成了一套豐富的數(shù)據(jù)挖掘工具SASTextMiner擴(kuò)展了數(shù)據(jù)挖掘功能,包括文本數(shù)據(jù)的大規(guī)模存儲。SAS借助于100多個native訪問引擎,涵蓋所有數(shù)據(jù)庫、操作系統(tǒng)、外部數(shù)據(jù)源、電子數(shù)據(jù)源等,。SAS是唯一在數(shù)據(jù)質(zhì)量和ETL方面提供全面集成的供應(yīng)商,稱之為ETLtothePowerofQ(ETLQ)。倉庫數(shù)據(jù)還可以存儲到第三方層次和關(guān)系數(shù)據(jù)庫中。SAS/ACCESS接口提供了工具,可以快速、有效地進(jìn)行數(shù)據(jù)加載。5.SAS商務(wù)智能開發(fā)工具SAS提供的工具包括30多個專用模396.BusinessObjects商務(wù)智能開發(fā)工具BusinessObjects的商務(wù)智能平臺提供了一組公共服務(wù)包含有合作伙伴集成工具包,使用戶能夠直接從企業(yè)應(yīng)用程序中訪問BI信息。BusinessObjectsEnterprise還提供了一種能夠深入了解最終用戶的創(chuàng)新環(huán)境,并能夠進(jìn)行靈活的系統(tǒng)管理,快速部署標(biāo)準(zhǔn)化BI產(chǎn)品。BusinessObjectsEnterprise為所有主要數(shù)據(jù)庫平臺、應(yīng)用程序和格式提供了端到端的元數(shù)據(jù)和廣泛的數(shù)據(jù)訪問功能。對開發(fā)人員來講,BusinessObjectsEnterprise具備功能強(qiáng)大的一套BI服務(wù),并通過Java、.NET和Web服務(wù)軟件開發(fā)工具(SDK)來為開發(fā)人員提供幫助。這些工具可以將BI緊密地集成到應(yīng)用程序和門戶中。BusinessObjects還提供了一系列分析引擎——SetAnalysis、PredicableAnalysis和StatisticsProcessControl,可以強(qiáng)化管理儀表盤和平衡記分卡。6.BusinessObjects商務(wù)智能開發(fā)工具Busi409.2.2SQLServer數(shù)據(jù)倉庫開發(fā)應(yīng)用工具M(jìn)icrosoft公司的SQLServer2005是一套完全的數(shù)據(jù)倉庫和數(shù)據(jù)分析解決方案,使用戶可以快速地由數(shù)據(jù)庫向可擴(kuò)展電子商務(wù)和數(shù)據(jù)倉庫解決方案擴(kuò)充。數(shù)據(jù)倉庫工具名稱在數(shù)據(jù)倉庫中的作用關(guān)系型數(shù)據(jù)庫數(shù)據(jù)轉(zhuǎn)換工具數(shù)據(jù)復(fù)制工具OLEDBAnalysisServicesEnglishQueryMetaDataServicesPivotTable數(shù)據(jù)倉庫的創(chuàng)建和維護(hù)數(shù)據(jù)倉庫的數(shù)據(jù)加載分布式數(shù)據(jù)倉庫的數(shù)據(jù)發(fā)布、加載應(yīng)用系統(tǒng)與數(shù)據(jù)源的接口數(shù)據(jù)挖掘與分析數(shù)據(jù)倉庫的語言查詢數(shù)據(jù)倉庫的元數(shù)據(jù)瀏覽客戶端多維數(shù)據(jù)的定制與操作9.2.2SQLServer數(shù)據(jù)倉庫開發(fā)應(yīng)用工具M(jìn)ic411.創(chuàng)建數(shù)據(jù)準(zhǔn)備區(qū)數(shù)據(jù)準(zhǔn)備區(qū)的創(chuàng)建可以利用SQLServer中的數(shù)據(jù)庫創(chuàng)建與表創(chuàng)建工具實現(xiàn)。2.創(chuàng)建數(shù)據(jù)倉庫數(shù)據(jù)倉庫的框架通常由事實表和一些維表組成,可以用SQLServer中的數(shù)據(jù)庫創(chuàng)建工具和表創(chuàng)建工具完成。3.從業(yè)務(wù)系統(tǒng)提取數(shù)據(jù)SQLServer中的數(shù)據(jù)抽取工具主要有Transact-SQL、分布式查詢、DTS、命令行應(yīng)用程序、bcp實用工具、從文本文件加載的BULKInsert語句和ActiveX腳本。4.清理和轉(zhuǎn)換數(shù)據(jù)SQLServer提供了Transact-SQL查詢、DTS包、命令行應(yīng)用程序、ActiveX腳本等工具完成清理工作,并對數(shù)據(jù)進(jìn)行必要的轉(zhuǎn)換。5.將數(shù)據(jù)加載進(jìn)數(shù)據(jù)倉庫SQLServer提供的Transact-SQL、DTS和bcp工具實現(xiàn)數(shù)據(jù)加載。6.將數(shù)據(jù)發(fā)布到數(shù)據(jù)集市SQLServer提供了數(shù)據(jù)復(fù)制技術(shù)來完成數(shù)據(jù)集市的初始裝載,并提供了各種數(shù)據(jù)加載工具對數(shù)據(jù)集市進(jìn)行數(shù)據(jù)加載。1.創(chuàng)建數(shù)據(jù)準(zhǔn)備區(qū)429.2.2SQLServer數(shù)據(jù)倉庫開發(fā)應(yīng)用工具7.SQL查詢SQLServer提供了Transact-SQL來實現(xiàn)SQL查詢。9.OLAP應(yīng)用SQLServer中的AnalysisServices可以實現(xiàn)OLAP應(yīng)用的創(chuàng)建和管理。9.數(shù)據(jù)挖掘SQLServer在AnalysisServices中還提供了數(shù)據(jù)挖掘技術(shù)的創(chuàng)建和管理功能,可以實現(xiàn)決策樹和聚集兩種數(shù)據(jù)挖掘功能。10.Web訪問SQLServer所提供的AnalysisServices、EnglishQuery可以與Internet信息服務(wù)(IIS)一起,用多種方法在Web上對數(shù)據(jù)倉庫進(jìn)行查詢和更新。11.更新數(shù)據(jù)倉庫數(shù)據(jù)數(shù)據(jù)倉庫在實際應(yīng)用中還需要定期地進(jìn)行數(shù)據(jù)更新維護(hù),這些工作可以用SQLServer的Transact-SQL、DTS和bcp實用工具完成。9.2.2SQLServer數(shù)據(jù)倉庫開發(fā)應(yīng)用工具7.S439.3SQLServer的數(shù)據(jù)倉庫創(chuàng)建9.3.1創(chuàng)建數(shù)據(jù)庫9.3SQLServer的數(shù)據(jù)倉庫創(chuàng)建9.3.1創(chuàng)44數(shù)據(jù)庫屬性設(shè)置窗口
數(shù)據(jù)庫屬性設(shè)置窗口459.2.2創(chuàng)建表9.2.2創(chuàng)建表46表結(jié)構(gòu)輸入窗口
表結(jié)構(gòu)輸入窗口479.4SQLServer數(shù)據(jù)倉庫事實表與多維數(shù)據(jù)集的建立9.4.1AnalysisManager數(shù)據(jù)庫的創(chuàng)建與數(shù)據(jù)源確定AnalysisServer系統(tǒng)是一個管理多維數(shù)據(jù)集的有力工具,可以用來創(chuàng)建對數(shù)據(jù)倉庫訪問、分析多維數(shù)據(jù)集和知識發(fā)現(xiàn)的數(shù)據(jù)挖掘模型。在使用AnalysisServer以前,必須要從SQLServer的安裝光盤上將其安裝到機(jī)器上。1.AnalysisManager數(shù)據(jù)庫的創(chuàng)建用戶可以利用AnalysisManager在數(shù)據(jù)倉庫中建立起多維數(shù)據(jù)集合,以有效地訪問數(shù)據(jù)倉庫中數(shù)據(jù)。9.4SQLServer數(shù)據(jù)倉庫事實表與多維數(shù)據(jù)集的建481.創(chuàng)建AnalysisServices項目1.創(chuàng)建AnalysisServices項目492.定義新的數(shù)據(jù)源2.定義新的數(shù)據(jù)源502.定義新的數(shù)據(jù)源2.定義新的數(shù)據(jù)源512.定義新的數(shù)據(jù)源2.定義新的數(shù)據(jù)源522.定義新的數(shù)據(jù)源2.定義新的數(shù)據(jù)源533.定義一個新的數(shù)據(jù)源視圖3.定義一個新的數(shù)據(jù)源視圖549.4.2SQLServer數(shù)據(jù)倉庫的維創(chuàng)建1.調(diào)出維度向?qū)g迎對話框9.4.2SQLServer數(shù)據(jù)倉庫的維創(chuàng)建1.調(diào)出維552.“選擇生成方法”對話框2.“選擇生成方法”對話框563.“選擇數(shù)據(jù)源視圖”對話框3.“選擇數(shù)據(jù)源視圖”對話框574.“選擇維度類型”對話框4.“選擇維度類型”對話框585.定義時間段(基于表的時間維度)5.定義時間段(基于表的時間維度)596.查看新建層次結(jié)構(gòu)6.查看新建層次結(jié)構(gòu)607.完成維度向?qū)?.完成維度向?qū)?19.4.3SQLServer的多維數(shù)據(jù)集創(chuàng)建1.進(jìn)入多維數(shù)據(jù)集創(chuàng)建9.4.3SQLServer的多維數(shù)據(jù)集創(chuàng)建1.進(jìn)入多622.“選擇生成方法”對話框2.“選擇生成方法”對話框633.“選擇數(shù)據(jù)源視圖”對話框3.“選擇數(shù)據(jù)源視圖”對話框644.“標(biāo)識事實數(shù)據(jù)表和維度表”對話框4.“標(biāo)識事實數(shù)據(jù)表和維度表”對話框655.“選擇度量值”對話框5.“選擇度量值”對話框665.“選擇度量值”對話框5.“選擇度量值”對話框676.“多維數(shù)據(jù)集向?qū)瓿伞睔g迎對話框6.“多維數(shù)據(jù)集向?qū)瓿伞睔g迎對話框687.“部署進(jìn)度”對話框7.“部署進(jìn)度”對話框698.“處理多維數(shù)據(jù)集”對話框8.“處理多維數(shù)據(jù)集”對話框708.“處理多維數(shù)據(jù)集”對話框8.“處理多維數(shù)據(jù)集”對話框718.“處理多維數(shù)據(jù)集”對話框8.“處理多維數(shù)據(jù)集”對話框72第9章數(shù)據(jù)倉庫開發(fā)實例
9.1基于商務(wù)智能的超市營銷系統(tǒng)規(guī)劃與分析9.2商務(wù)智能開發(fā)工具簡介
9.3SQLServer的數(shù)據(jù)倉庫創(chuàng)建9.4SQLServer數(shù)據(jù)倉庫事實表與多維數(shù)據(jù)集的建立第9章數(shù)據(jù)倉庫開發(fā)實例9.1基于商務(wù)智能的超市營銷系統(tǒng)規(guī)73第9章數(shù)據(jù)倉庫開發(fā)實例
通過本章學(xué)習(xí),可以了解:超市銷售商務(wù)智能規(guī)劃與需求分析;超市銷售數(shù)據(jù)倉庫的邏輯模型設(shè)計;SQLServer的商務(wù)智能開發(fā)工具;SQLServer事實表的建立;SQLServer的多維數(shù)據(jù)集的建立;第9章數(shù)據(jù)倉庫開發(fā)實例通過本章學(xué)習(xí),可以了解:749.1基于商務(wù)智能的超市營銷系統(tǒng)規(guī)劃與分析
某大型連鎖超市的業(yè)務(wù)涵蓋于3個省范圍內(nèi)的1000多家門市。每個門市都有較完整的日用品和食品銷售部門,包括百貨、雜貨、冷凍食品、奶制品、肉制品和面包食品等,大約5萬多種,其中大約45000種商品來自外部生產(chǎn)廠家,并在包裝上印有條形碼。每個條形碼代表了唯一的商品。為該超市建立一個能夠提高市場競爭能力的數(shù)據(jù)倉庫,首先需要進(jìn)行數(shù)據(jù)倉庫的規(guī)劃分析。這就涉及到對數(shù)據(jù)倉庫的需求分析、模型構(gòu)建兩個過程。9.1基于商務(wù)智能的超市營銷系統(tǒng)規(guī)劃與分析某大型連鎖超市的759.1.1超市銷售商務(wù)智能的需求分析
1超市營銷售策略分析超市最高層管理所關(guān)注的是如何通過商品的采購、儲存與銷售,最大限度地獲取利潤。需要通過加強(qiáng)對每種商品的管理,減低商品的采購成本和管理費(fèi)用,吸引盡可能多的客戶。其中最重要的是關(guān)于商品促銷的管理決策。需要依靠合適的促銷活動,應(yīng)用適當(dāng)?shù)拇黉N策略針對合適的客戶,以增加超市的銷售利潤,是超市數(shù)據(jù)倉庫建設(shè)的基本需求。超市不同商品的銷售利潤是有差別的。希望在數(shù)據(jù)倉庫中通過對商品的贏利分析,了解不同商品的銷售贏利狀態(tài),以確定企業(yè)的銷售重點(diǎn),對那些可以為企業(yè)帶來較大贏利的商品加大促銷力度。9.1.1超市銷售商務(wù)智能的需求分析1超市營銷售策略分析762超市商品庫存分析超市商品的庫存狀況對超市的利潤具有巨大的影響。超市如果能夠在合適的時候銷售合適的商品,在不出現(xiàn)脫銷的情況下盡可能減少商品庫存的庫存成本,是超市商品庫存分析的主要目的。在商品庫存分析中,管理人員還經(jīng)常要根據(jù)商品的庫存量和商品庫存成本確定商品的銷售價格。從超市的商品庫存情況來看,庫存分析實質(zhì)上是對超市的價值鏈進(jìn)行分析,分析商品庫存在超市的整個價值鏈上所發(fā)揮的作用。9.1.1超市銷售商務(wù)智能的需求分析
2超市商品庫存分析9.1.1超市銷售商務(wù)智能的需求分析773超市商品采購分析超市在商品采購工作中需要分析哪些商品是熱銷的商品,盡可能采購銷售熱銷商品。熱銷商品往往是加快企業(yè)資金流動的動力,快速流動的資金可以使企業(yè)在一定的時間內(nèi)取得比其他企業(yè)更多的利潤。而且超市營銷管理人員在了解熱銷商品后,可以大量采購熱銷商品,重新安排熱銷商品的貨架,向更多的客戶推銷熱銷商品,便于更多客戶的購買,以進(jìn)一步加快企業(yè)資金的流動。9.1.1超市銷售商務(wù)智能的需求分析
3超市商品采購分析9.1.1超市銷售商務(wù)智能的需求分析784超市客戶關(guān)系分析用90:20理論分析,占企業(yè)客戶群20%左右的客戶購買金額往往占據(jù)了企業(yè)銷售金額的90%。對客戶群體的劃分有利于企業(yè)了解企業(yè)的主要客戶群體狀況、主要客戶群對企業(yè)銷售服務(wù)的需求狀況、不同客戶群為企業(yè)所帶來的利潤狀況。在對客戶進(jìn)行類型劃分的基礎(chǔ)上,可以針對不同客戶群體的特點(diǎn)采用不同的營銷策略,對客戶群體的消費(fèi)進(jìn)行合理的引導(dǎo)。超市客戶的流失,意味著企業(yè)贏利的降低。企業(yè)管理者希望了解哪些客戶可能會流失,使企業(yè)能夠提前設(shè)法加以挽留。9.1.1超市銷售商務(wù)智能的需求分析
4超市客戶關(guān)系分析9.1.1超市銷售商務(wù)智能的需求分析799.1.2超市營銷數(shù)據(jù)倉庫E-R模型構(gòu)造數(shù)據(jù)倉庫設(shè)計中就首先考慮營銷主題的設(shè)計,確定超市營銷主題模型
采用了星型模型,沒有采用雪花模型。因為雪花模型通過對維表的分類細(xì)化描述,對于主題的分類詳細(xì)查詢具有良好的響應(yīng)能力。但是雪花模型的構(gòu)造在本質(zhì)上是一種數(shù)據(jù)模型的規(guī)范化處理,會給數(shù)據(jù)倉庫操作帶來不同表的連接困難。但是在對維度表進(jìn)行維護(hù)時,可能需要對大量重復(fù)值進(jìn)行修改。星型模型通過對維表的冗余應(yīng)用,以犧牲維表空間來換取數(shù)據(jù)倉庫的高性能與易使用的優(yōu)勢。
9.1.2超市營銷數(shù)據(jù)倉庫E-R模型構(gòu)造數(shù)據(jù)倉庫設(shè)計中就80日期商品促銷客戶門市商品營銷9.1.2超市營銷數(shù)據(jù)倉庫E-R模型構(gòu)造日期商品促銷客戶門市商品營銷9.1.2超市營銷數(shù)據(jù)倉庫E819.1.3超市數(shù)據(jù)倉庫事實表模型確定在數(shù)據(jù)倉庫中,怎樣的粒度數(shù)據(jù)才能滿足管理人員對數(shù)據(jù)倉庫營銷策劃分析的需要。超市商品銷售主題中,最理想的原子數(shù)據(jù)是來自POS機(jī)上的每個銷售事務(wù)數(shù)據(jù)分析超市高層管理人員通過那些角度,即需要通過那些維度來考察、選擇營銷方案。一般情況下,在確定超市營銷策劃時,超市管理人員需要通過日期、商品、門市、促銷和客戶五個維度對促銷方案進(jìn)行分析,了解促銷方案的可用性和效果9.1.3超市數(shù)據(jù)倉庫事實表模型確定在數(shù)據(jù)倉庫中,怎樣的82超市營銷數(shù)據(jù)倉庫事實表模型
超市營銷主題日期關(guān)鍵字門市關(guān)鍵字商品關(guān)鍵字促銷關(guān)鍵字商品銷售編號商品銷售量商品銷售額商品成本商品銷售利潤日期維日期關(guān)鍵字商品維商品關(guān)鍵字門市維門市關(guān)鍵字促銷維促銷關(guān)鍵字客戶維客戶關(guān)鍵字超市營銷數(shù)據(jù)倉庫事實表模型超市營銷主題日期維商品維門市維促83超市營銷數(shù)據(jù)倉庫事實表模型
從銷售系統(tǒng)中可直接獲取商品銷售量、銷售單價、商品成本。但管理人員考察超市的營銷策略時,需要考慮營銷策略和相應(yīng)的商品銷售利潤。商品銷售利潤可以直接通過商品銷售量、銷售單價和商品成本計算獲得,但商品銷售利潤具有良好的可加性,管理人員又經(jīng)常需要查看。將利潤數(shù)據(jù)存放在事實表中可大大減少數(shù)據(jù)倉庫工作時的工作量,還可以保證所有用戶在使用商品銷售利潤這一重要數(shù)據(jù)時的一致性。商品銷售單價對于計算商品利潤十分重要,但將某個商品一段時間內(nèi)的所有銷售單價相加是毫無意義的。管理人員可能只對某一時間段內(nèi)某個商品的平均銷售價感興趣。平均銷售價格可以用該時間段內(nèi)的商品銷售額除以商品銷售量獲取。在事實表中可以不用商品銷售單價,代之以商品銷售額,銷售額也常常是管理人員衡量營銷策略好壞的重要指標(biāo)。超市營銷數(shù)據(jù)倉庫事實表模型從銷售系統(tǒng)中可直接獲取商品銷售量84超市營銷數(shù)據(jù)倉庫事實表模型
超市管理者還可能對商品銷售的利潤率感興趣,該數(shù)據(jù)可以用商品銷售利潤除以銷售額獲得,該數(shù)據(jù)不是一個可加數(shù)據(jù)。將比率或百分?jǐn)?shù)的數(shù)據(jù)進(jìn)行相加,所獲得的數(shù)據(jù)是沒有什么意義的。管理人員在了解某一時期某些商品的利潤率時,完全可以利用該時期該商品利潤和銷售額獲得。因此,事實表中確定度量數(shù)據(jù)為商品銷售量、商品銷售額、商品成本和商品銷售利潤。超市營銷數(shù)據(jù)倉庫事實表模型超市管理者還可能對商品銷售的利潤859.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計1.日期維日期維模型是許多數(shù)據(jù)倉庫應(yīng)用中的常用維度,其設(shè)計方式與其他多數(shù)維模型有差別。具體設(shè)計時,日期維可以存放以日期表示的5到10年的數(shù)據(jù)行,也可以將3至4年的數(shù)據(jù)行作為日期維內(nèi)容。如果對10年的每一天都進(jìn)行存儲,也只需要3650行
日期維的每列由行所代表的特定日期進(jìn)行定義?!靶瞧凇绷泻邢瘛靶瞧谝弧边@樣的名稱內(nèi)容,該列可用于創(chuàng)建比較“星期一”與“星期日”銷售情況對比的查詢。日歷日期編號從1開始取值,然后根據(jù)月份的情況取到29、29、30或者31,這一列主要用于對每個月的同一天進(jìn)行比較。同樣,可以給出日歷周編號、和日歷月編號(1,…,12)。9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計1.日期維86紀(jì)元表示法采用從某紀(jì)元開始連續(xù)對日期進(jìn)行計數(shù)的方法來給出日編號,在表中還可以給出“星期”與“月份”的絕對編號列。這些數(shù)據(jù)支持跨年度跨月份的簡單數(shù)據(jù)運(yùn)算。在生成報表時,經(jīng)常要給出像“一月”這樣的月份名稱。因此,為報表確定一個“年月”(YYYY-MM)列標(biāo)題也有必要。報表中很可能需要季度編號(Q1,…,Q4)或年季度編號列。如果企業(yè)的財政年度與日歷表在周期上不一致,還需要為財政年度給出類似列。在“節(jié)假日”列中給出“節(jié)假日”或者“非節(jié)假日”的內(nèi)容,維表屬性作為數(shù)據(jù)分析的導(dǎo)航,簡單地在“節(jié)假日”列中給出“Y”或者“N”對數(shù)據(jù)分析沒有多大用處。例如,在生成某種商品的節(jié)假日與非節(jié)假日銷售情況比較查詢時,列中給出“節(jié)假日”或者“非節(jié)假日”這樣有意義的值要比一個簡單的“Y”或者“N”之類的值有用得多。9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計紀(jì)元表示法采用從某紀(jì)元開始連續(xù)對日期進(jìn)行計數(shù)的方法來給出日編87“星期六”與“星期日”要?dú)w入“周末”之列。當(dāng)然,可以對多個日期表屬性進(jìn)行共同約束,從而能夠?qū)崿F(xiàn)一些像平日假期銷售與周末假期銷售進(jìn)行比較的數(shù)據(jù)倉庫應(yīng)用?!颁N售時節(jié)”列應(yīng)設(shè)置為銷售時節(jié)的名稱,例如,春節(jié)、情人節(jié)、端午節(jié)、五一節(jié)、國慶節(jié)、中秋節(jié)、重陽節(jié)、圣誕節(jié)、或者標(biāo)為“不是”?!爸卮笫录绷信c“銷售時節(jié)”列情形類似,可以標(biāo)記為“周日大采購”或者“中秋合家歡”這樣與日期有特殊聯(lián)系的促銷事件。而一般性的促銷活動通常不放在日期表中處理,以促銷維表的形式進(jìn)行更加完整的描述。因為促銷事件并不是僅僅由日期來定義,通常還需要由日期、商品與商店的組合來定義。9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計“星期六”與“星期日”要?dú)w入“周末”之列。當(dāng)然,可以對多個日88日期維度銷售事實日期關(guān)鍵字日期關(guān)鍵字星期商品關(guān)鍵字日歷日期編號門市關(guān)鍵字日歷周編號促銷關(guān)鍵字日歷月編號客戶關(guān)鍵字紀(jì)元日編號POS事務(wù)編號紀(jì)元周編號銷售量紀(jì)元月編號銷售額財政月日編號成本額年度日歷周數(shù)利潤金額年度日歷月數(shù)日歷年月(YYYY-MM)日歷季度日歷年季度日歷半年度日期維度銷售事實日期關(guān)鍵字日期關(guān)鍵字星期商品關(guān)鍵字日歷日期編89日歷年財政周年度財政周數(shù)財政月年度財政月數(shù)財政年月財政季度財政年季度財政半年度財政年節(jié)假日指示符星期指示符銷售時節(jié)重大事件……日歷年財政周年度財政周數(shù)財政月年度財政月數(shù)財政年月財政季度財902.商品維一般超市門市可能存儲60000個商品編號,但大型連鎖超市保留不再銷售的歷史商品營銷方案情況,商品維度可能至少需要150000行乃至多達(dá)百萬行。
商品維度數(shù)據(jù)主要來源于業(yè)務(wù)系統(tǒng)的商品主文件。超市總部對所銷售商品的主文件進(jìn)行統(tǒng)一管理。商品主文件的一個重要作用,就是維護(hù)每個商品存儲標(biāo)志的許多描述屬性。商品維是一組重要的屬性。某個商品種類包含多個商品子類,商品子類包含多個商標(biāo),商標(biāo)包含多個商品存儲標(biāo)志。還應(yīng)包含描述商品形狀或存儲位置的層次屬性,例如商品的包裝類型、包裝尺寸、包裝數(shù)量、托盤中的包裝數(shù),以及與商品存儲的層次:存儲類型、貨架結(jié)構(gòu)等維度。9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計2.商品維9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計913.門市維門市維表用于描述超市的各個鏈鎖店。門市維表是基本的地理維度,每個門市可被看成一個位置。這樣,可以由門市形成諸如街道、郵政編碼、縣、市、省這樣的任意地理屬性。地理體系與門市地區(qū)體系對每個門市來說,都有良好的定義。在連鎖超市所使用的門市維表中有建筑面積、金融服務(wù)、最早開業(yè)時間等描述特定門市的文字描述。描述銷售面積的列應(yīng)該是數(shù)字型的,并且在理論上是跨門市可相加的,以表示某一地區(qū)的銷售面積。它是門市的一個不變屬性,通常作為報表約束或者行標(biāo)題使用。而且為了能夠分析不同種類商品對超市銷售利潤的貢獻(xiàn)情況,還需要設(shè)立不同商品的銷售面積。9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計3.門市維9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計924.促銷維超市的促銷方案可能包含:臨時降價、柜臺展銷、報紙廣告與優(yōu)惠券發(fā)放等。促銷維應(yīng)該可以反映商品促銷方案的成效。促銷的成效評估因素:促銷商品的銷售是否在促銷區(qū)間出現(xiàn)增長、是否在促銷進(jìn)行之前或者隨后出現(xiàn)減少狀況;是否發(fā)生促銷商品的銷售出現(xiàn)增長,而臨近貨架上的其他商品銷售卻呈現(xiàn)出相應(yīng)的降低情況(同類相食);促銷類別中所有商品的銷售是否都經(jīng)歷了一個實際的總體增長;促銷是否贏利。促銷利潤的計算要考慮促銷類別的利潤增量與時間過渡、同類調(diào)劑以及銷售底線等各種情況。9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計4.促銷維9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計934.促銷維在促銷維度中為促銷出現(xiàn)的每種組合都建立一行記錄是很有意義的。在一年的銷售活動中,可能出現(xiàn)1000個廣告,5000次臨時降價和1000次柜臺展銷,但可能只有10000個組合促銷能影響任何特定的商品。例如,在某給定維度中,大多數(shù)門市都會同時運(yùn)作所有促銷售手段,而只有少數(shù)幾個門市不進(jìn)行柜臺展銷。在這種情況下,就需要兩個單獨(dú)的促銷記錄行,一個用于通常的降價并外加廣告與柜臺展銷,而另一個用于降價并外加單純的廣告。超市的促銷維度可以包含促銷名稱、減價類型、促銷媒體類型、廣告類型和優(yōu)惠券類型等。超市的主要促銷方式是降價、廣告、柜臺展銷與優(yōu)惠券。如果將這些因素分別建立促銷維度,就可以記錄分析這些促銷方法非常相似的信息,使用戶更加容易理解促銷方案的作用。但是將所有的促銷因素合并在一個維表中,則能夠方便用戶的瀏覽,能夠弄清各種不同的價格降低、廣告、展銷與優(yōu)惠券是如何在一起共同發(fā)揮促銷作用的。9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計4.促銷維9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計945.客戶維超市的客戶維度可以包含客戶賬號、姓名、地址、所在地區(qū)、郵政編碼、電子信箱、電話、日?;顒臃秶?、出生日期、收入、孩子數(shù)量、住房和汽車等內(nèi)容。在客戶維中的地址由于客戶可能會給出其家庭地址、工作地址或其它一些常用地址,因此在維表中可以設(shè)置4個地址,對于電話的設(shè)置也是出于相同因素的考慮。在數(shù)據(jù)倉庫的應(yīng)用中有時需要對客戶按照不同的地區(qū)進(jìn)行分析,為此,在維表中就按照省、市、縣(區(qū))郵政編碼進(jìn)行地區(qū)的設(shè)置。性別、婚姻狀況、家庭人口、住房條件和自有汽車情況均是超市銷售管理人員對超市營銷策略進(jìn)行分析的主要依據(jù)。出于超市營銷策略制定的考慮,還需要了解客戶的日?;顒臃秶?,以便有針對性地進(jìn)行促銷廣告的發(fā)送。9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計5.客戶維9.1.4超市營銷系統(tǒng)數(shù)據(jù)倉庫維模型設(shè)計959.1.5超市數(shù)據(jù)倉庫模型的關(guān)鍵字設(shè)計采用代理關(guān)鍵字技術(shù),而不是依賴業(yè)務(wù)系統(tǒng)中的各種關(guān)鍵字(許多業(yè)務(wù)系統(tǒng)中的各種編碼往往具有某種特定的含義)代理關(guān)鍵字一般采用在填充維度時按需要而順序分配的整數(shù)值。例如,為第一條商品記錄分配一個值為1的商品代理關(guān)鍵字,第二條分配2,第n條分配n等。代理關(guān)鍵字僅僅用于維度表到事實表的連接。
代理關(guān)鍵字的好處還能夠?qū)?shù)據(jù)倉庫環(huán)境的操作型變化進(jìn)行緩沖,不會受到商品編碼生成、更新、刪除、再生與重用等操作型規(guī)則的妨礙。代理關(guān)鍵字允許數(shù)據(jù)倉庫對來自多個業(yè)務(wù)型系統(tǒng)的數(shù)據(jù)進(jìn)行合并,即使它們之間缺乏一致的源關(guān)鍵字也無所謂。9.1.5超市數(shù)據(jù)倉庫模型的關(guān)鍵字設(shè)計采用代理關(guān)鍵字技術(shù)969.1.5超市數(shù)據(jù)倉庫模型的關(guān)鍵字設(shè)計使用代理關(guān)鍵字還可以獲得性能上的優(yōu)勢。代理關(guān)鍵字可能只有一個整數(shù)所占據(jù)的空間大小,卻能確保充裕地容納維度行以后可能需要的序號或者最大編號。而業(yè)務(wù)型編碼常常是一個混合了字母與數(shù)字的區(qū)間編碼體系。代理關(guān)鍵字還能夠用于記錄那些諸如“不在促銷之列”這樣的可能沒有業(yè)務(wù)系統(tǒng)中編碼的維度情形。通過對數(shù)據(jù)倉庫的關(guān)鍵字施加控制,就能夠做到不管是否缺少業(yè)務(wù)型編碼,總可以分配一個代理關(guān)鍵字將這類情況標(biāo)識出來。將代理日期關(guān)鍵字處理成日期序號,可以允許事實表在日期關(guān)鍵字基礎(chǔ)上進(jìn)行物理分區(qū)。9.1.5超市數(shù)據(jù)倉庫模型的關(guān)鍵字設(shè)計使用代理關(guān)鍵字還可979.1.5超市數(shù)據(jù)倉庫模型的關(guān)鍵字設(shè)計目前在超市數(shù)據(jù)倉庫中已經(jīng)包含了6個實際的表:營銷事實表與日期、商品、門市、促銷和客戶維表。每個維表有一個主關(guān)鍵字,而事實表除了有一個退化的銷售事務(wù)編號之外,還有由五個外關(guān)鍵字組成的一個復(fù)合關(guān)鍵字。如果五個關(guān)鍵字都是進(jìn)行了緊湊處理的連續(xù)整數(shù),那么僅僅需要為所有五個關(guān)鍵字保留19個字節(jié)的小存儲空間(日期、商品、促銷和客戶維各用4個字節(jié),而門市用2個字節(jié))。同時,銷售事務(wù)編號可能另外需要9個字節(jié)。如果事實表4類事實(銷售量、銷售額、成本和利潤)中的任何一個都是4字節(jié)的整數(shù),則僅僅需要再保留另外的16個字節(jié),這樣事實表只有42個字節(jié)寬。對一個10億行的事實表也只占用大約42GB的存儲空間就可以存儲所有事實數(shù)據(jù)。9.1.5超市數(shù)據(jù)倉庫模型的關(guān)鍵字設(shè)計目前在超市數(shù)據(jù)倉庫989.1.6超市數(shù)據(jù)倉庫元數(shù)據(jù)設(shè)計銷售主題元數(shù)據(jù)名稱Sales描述整個超市中每個門市中每個POS機(jī)所記載的商品銷售狀況目的用于進(jìn)行超市銷售狀況和促銷情況的分析聯(lián)系人各個門市銷售經(jīng)理維時間、商品、客戶、商店、促銷事實銷售事實表度量值銷售成本、銷售額、銷售利潤、銷售量9.1.6超市數(shù)據(jù)倉庫元數(shù)據(jù)設(shè)計銷售主題元數(shù)據(jù)名稱Sa99銷售事實元數(shù)據(jù)名稱Sales_Fact_年份描述記錄每個門市每個POS機(jī)所發(fā)生的銷售數(shù)據(jù)目的作為銷售主題的分析事實使用狀況每天平均查詢次數(shù)每天平均查詢返回行數(shù)每天查詢平均執(zhí)行時間(分鐘)每天最大查詢次數(shù)每天查詢返回最大行數(shù)每天查詢最大執(zhí)行時間(分鐘)存檔規(guī)則每個月將前36個月的數(shù)據(jù)存檔存檔狀況最近存檔處理日期已經(jīng)存檔數(shù)據(jù)日期更新規(guī)則每個月將前60個月的數(shù)據(jù)從數(shù)據(jù)倉庫中刪除更新狀況最近更新處理日期已更新數(shù)據(jù)日期銷售事實元數(shù)據(jù)名稱Sales_Fact_年份描述記錄每個門市100銷售事實元數(shù)據(jù)數(shù)據(jù)質(zhì)量要求及確認(rèn)由于從各個門市POS機(jī)上所產(chǎn)生的數(shù)據(jù)可能會由于極少的人工輸入,而使數(shù)據(jù)質(zhì)量不能得到保證,但也真實地反映了銷售現(xiàn)狀,不能隨意修改,應(yīng)被認(rèn)可。數(shù)據(jù)準(zhǔn)確性要求必須百分百地反映各個門市銷售狀況數(shù)據(jù)粒度要求能夠反映每一項商品的銷售狀況,不對數(shù)據(jù)進(jìn)行匯總表鍵事實表的鍵是時間、商品、客戶、商店和促銷維中鍵的組合數(shù)據(jù)來源超市銷售業(yè)務(wù)系統(tǒng)中的銷售表(sales_fact_年份)加載周期每天一次加載狀況最后加載日期加載的行數(shù)加載規(guī)則每天清晨3:00將各個超市門市中前一天的銷售事實數(shù)據(jù)拷貝到本表,拷貝過程中要根據(jù)各個數(shù)據(jù)成員所定義的加載規(guī)則進(jìn)行篩選和清理銷售事實元數(shù)據(jù)數(shù)據(jù)質(zhì)量要求及確認(rèn)由于從各個門市POS機(jī)上所產(chǎn)101維元數(shù)據(jù)名稱客戶(Customer)定義從超市任何一個門市購買貨物的任何個人或組織都稱為客戶,一個客戶可以與多個銷售地區(qū)發(fā)生聯(lián)系(即出現(xiàn)在地理維的不同層次體系中)層次結(jié)構(gòu)一個客戶的數(shù)據(jù)可以在3個級別上進(jìn)行統(tǒng)計:最低級別是出現(xiàn)在客戶所在的縣/區(qū),其上為市、省更改規(guī)則新的客戶位置作為新的一行插入維中。對已有位置的修改,則在原處更新加載頻率每天一次加載統(tǒng)計數(shù)據(jù)最后加載日期加載的行數(shù)使用的統(tǒng)計數(shù)據(jù)每天平均查詢個數(shù)每天查詢返回的平均行數(shù)每天查詢平均執(zhí)行時間(分鐘)每天最大的查詢個數(shù)每天查詢返回的最大行數(shù)每天查詢執(zhí)行的最長時間(分鐘)維元數(shù)據(jù)名稱客戶(Customer)定義從超市任何一個門市102維元數(shù)據(jù)存檔規(guī)則每個月將前36個月的數(shù)據(jù)存檔已經(jīng)存檔數(shù)據(jù)日期更新規(guī)則每個月將前60個月的數(shù)據(jù)從數(shù)據(jù)倉庫中刪除更新狀況最近更新處理日期已經(jīng)更新數(shù)據(jù)日期數(shù)據(jù)質(zhì)量增加一個新客戶時,先檢查是否已在其他地方和該客戶做過交易。少數(shù)情況下,由于檢查失敗,會將一個客戶的不同部門作為不同客戶保存。直到客戶注意到在不同的地方與公司交易時,以前的記錄仍保持不變。地區(qū)屬性并不是銷售業(yè)務(wù)系統(tǒng)原有的,而是根據(jù)送貨地址屬性中的郵政編碼進(jìn)行區(qū)分?jǐn)?shù)據(jù)的準(zhǔn)確程度一個客戶與其地理位置的關(guān)聯(lián)出錯的可能性在某一百分比以下,該百分比大小要根據(jù)對業(yè)務(wù)數(shù)據(jù)的研究情況確定關(guān)鍵字客戶維的關(guān)鍵字是系統(tǒng)產(chǎn)生的數(shù)字維元數(shù)據(jù)存檔規(guī)則每個月將前36個月的數(shù)據(jù)存檔已經(jīng)存檔數(shù)據(jù)日103維元數(shù)據(jù)產(chǎn)生關(guān)鍵字的方法從銷售業(yè)務(wù)系統(tǒng)中拷貝一個客戶時,將檢查轉(zhuǎn)換表,檢查該客戶是否已經(jīng)存在于數(shù)據(jù)倉庫中。如果否,就產(chǎn)生一個新的關(guān)鍵字。然后將這個關(guān)鍵字和銷售業(yè)務(wù)系統(tǒng)中的Custom~ID和地區(qū)ID插入轉(zhuǎn)換表中。如果該客戶和位置已經(jīng)存在于轉(zhuǎn)換表,就根據(jù)表中的關(guān)鍵字決定數(shù)據(jù)倉庫中要更新的記錄源表名稱超市銷售業(yè)務(wù)系統(tǒng)中的Customer表加載規(guī)則每天拷貝每個Customer表中的行。對于已存在的客戶,進(jìn)行更新。對于新客戶,確定其所在地理位置之后,產(chǎn)生一個關(guān)鍵字,然后插入一行新記錄。在更新/插入操作之前,需要檢查是否有重復(fù)的客戶名。如果有,則在客戶名后增加一個順序號,直到名字以及名字和順序號的組合都沒有重復(fù)為止。加載規(guī)則只選擇新的和發(fā)生變化的行源表名稱Customer_Location表轉(zhuǎn)換規(guī)則每天拷貝一次Customer_Location表。對于已存在的客戶,更新其送貨地址;對于新的客戶,則產(chǎn)生一個鍵,并插入一行。維元數(shù)據(jù)產(chǎn)生關(guān)鍵字的方法從銷售業(yè)務(wù)系統(tǒng)中拷貝一個客戶時,將104數(shù)據(jù)成員元數(shù)據(jù)名稱客戶關(guān)鍵字(Customer_ID)定義用以唯一標(biāo)識客戶和位置的值更新規(guī)則一旦分配,就不改變數(shù)據(jù)類型數(shù)值型值域1—999,999,999產(chǎn)生規(guī)則由系統(tǒng)自動產(chǎn)生,將當(dāng)前最大值增l來源系統(tǒng)自動生成數(shù)據(jù)成員元數(shù)據(jù)名稱客戶關(guān)鍵字(Customer_ID)定義105數(shù)據(jù)成員元數(shù)據(jù)名稱客戶名稱(Customer_Name)定義客戶的名稱更新規(guī)則客戶名稱發(fā)生改變時,就在原來的記錄上更新數(shù)據(jù)類型Char(30)值域保證能區(qū)分不同客戶的名稱。對不同而具有相同名稱的客戶,可在名稱后依次加1來區(qū)分相同名稱來源超市銷售業(yè)務(wù)系統(tǒng)中Customer表中的Name產(chǎn)生規(guī)則對于零售客戶,其名稱由姓和名組成。對于公司,則將公司名作為客戶名稱數(shù)據(jù)成員元數(shù)據(jù)名稱客戶名稱(Customer_Name)定1069.2商務(wù)智能開發(fā)工具簡介9.2.1數(shù)據(jù)倉庫開發(fā)工具目前已有許多數(shù)據(jù)倉庫開發(fā)工具供應(yīng)商,可以提供各種構(gòu)建數(shù)據(jù)倉庫的工具。但有些數(shù)據(jù)倉庫開發(fā)工具還要結(jié)合第三方供應(yīng)商工具才能完成整個數(shù)據(jù)倉庫的構(gòu)建。1.Oracle商務(wù)智能開發(fā)工具Oracle數(shù)據(jù)庫10g是一個基于標(biāo)準(zhǔn)的獨(dú)立平臺,可滿足服務(wù)器一側(cè)商務(wù)智能和數(shù)據(jù)倉庫的各種要求,包括提取、轉(zhuǎn)換和裝載(ETL),在線分析處理(OLAP)和數(shù)據(jù)挖掘。Oracle還推出了針對中小型企業(yè)的需求打包和配置的、完全集成的BI系統(tǒng)——OracleBusinessIntelligenceStandardEditionOne。9.2商務(wù)智能開發(fā)工具簡介9.2.1數(shù)據(jù)倉庫開發(fā)工具1072.IBM商務(wù)智能開發(fā)工具一整套面向商業(yè)智能應(yīng)用的軟件產(chǎn)品包——IBMDB2DWE(DataWarehouseEdition),包含十多個工具,給商業(yè)智能提供了全面、堅實的支持,DB2Alphablox是新版的DWE,是一套基于Java開發(fā)的分析組件DB2CubeViews是DB2通用數(shù)據(jù)庫的附加功能部件DB2UDBDataWarehouseEdition(WDE)是一個用于靈活、可伸縮和集成的數(shù)據(jù)倉庫和分析應(yīng)用程序的業(yè)務(wù)智能平臺。2.IBM商務(wù)智能開發(fā)工具一整套面向商業(yè)智能應(yīng)用的軟件產(chǎn)品包1083.Sybase數(shù)據(jù)倉庫開發(fā)工具數(shù)據(jù)倉庫解決方案為WarehouseStudio,包括數(shù)據(jù)倉庫的建模、數(shù)據(jù)抽取與轉(zhuǎn)換、數(shù)據(jù)存儲與管理、元數(shù)據(jù)管理以及可視化數(shù)據(jù)分析等工具。其中,WarehouseArchitect是PowerDesigner中的一個設(shè)計模塊,它支持星形模型、雪花模型和ER模型;數(shù)據(jù)抽取與轉(zhuǎn)換工具包括PowerStage、ReplicationServer、CarletonPASSPORT
AdaptiveServerEnterprise是Sybase企業(yè)級關(guān)系數(shù)據(jù)庫,AdaptiveServerIQ是Sybase公司專為數(shù)據(jù)倉庫設(shè)計的關(guān)系數(shù)據(jù)庫SybaseIQ支持各種流行的前端展現(xiàn)工具,如CognosImpromptu、BusinessObjects、BrioQuery等。數(shù)據(jù)分析與展現(xiàn)工具包括PowerDimensions、EnglishWizard、InfoMaker、PowerDynamo等,PowerDimensions是圖形化的OLAP分析工具,支持SMP和多維緩存技術(shù),能夠集成異構(gòu)的關(guān)系型數(shù)據(jù)倉庫和分布式數(shù)據(jù)集市。數(shù)據(jù)倉庫的維護(hù)與管理工具包括WarehouseControlCenter、SybaseCentral、DistributionDirector,其中WarehouseControlCenter是為數(shù)據(jù)倉庫開發(fā)人員提供的元數(shù)據(jù)管理工具。
3.Sybase數(shù)據(jù)倉庫開發(fā)工具數(shù)據(jù)倉庫解決方案為Wareh1094.NCR商務(wù)智能開發(fā)工具2006年9月宣布推出全新TeradataWarehouse8.2版,這是一套包括硬件、軟件以及專業(yè)咨詢服務(wù)的全面套件,為前端操作、客戶服務(wù)和策略計劃提供實時商業(yè)智能,以支持策略決策和數(shù)以萬計的日常運(yùn)營事務(wù)。Teradata數(shù)據(jù)挖掘器(TeradataWarehouseMiner)專為分析大規(guī)模數(shù)據(jù)而設(shè)計,工作在Teradata數(shù)據(jù)庫中Teradata數(shù)據(jù)加載工具允許從任何平臺的任何數(shù)據(jù)源中導(dǎo)入或?qū)С鰯?shù)據(jù)TeradataParallelTransporter允許并行多功能裝載環(huán)境TeradataFastLoad用來將從通道或聯(lián)網(wǎng)客戶機(jī)的數(shù)據(jù)源上收集到的大量數(shù)據(jù)裝入到Teradata數(shù)據(jù)庫中的空表中TeradataFastExport可以快速地將數(shù)據(jù)從Teradata數(shù)據(jù)庫中的表或視圖導(dǎo)出到客戶機(jī)系統(tǒng)TeradataTpump用來連續(xù)地將數(shù)據(jù)從數(shù)據(jù)源導(dǎo)入Teradata表中,4.NCR商務(wù)智能開發(fā)工具2006年9月宣布推出全新Tera1105.SAS商務(wù)智能開發(fā)工具SAS提供的工具包括30多個專用模塊。其中:SAS/WA(WarehouseAdministrator)是建立數(shù)據(jù)倉庫的集成管理工具;SAS/MDDB是SAS用于在線分析的多維數(shù)據(jù)庫服務(wù)器;SAS/AF提供了屏幕設(shè)計功能和用于開發(fā)的SCL(屏幕控制語言)。SAS公司的增強(qiáng)數(shù)據(jù)挖掘軟件EnterpriseMiner集成了一套豐富的數(shù)據(jù)挖掘工具SASTextMiner擴(kuò)展了數(shù)據(jù)挖掘功能,包括文本數(shù)據(jù)的大規(guī)模存儲。SAS借助于100多個native訪問引擎,涵蓋所有數(shù)據(jù)庫、操作系統(tǒng)、外部數(shù)據(jù)源、電子數(shù)據(jù)源等,。SAS是唯一在數(shù)據(jù)質(zhì)量和ETL方面提供全面集成的供應(yīng)商,稱之為ETLtothePowerofQ(ETLQ)。倉庫數(shù)據(jù)還可以存儲到第三方層次和關(guān)系數(shù)據(jù)庫中。SAS/ACCESS接口提供了工具,可以快速、有效地進(jìn)行數(shù)據(jù)加載。5.SAS商務(wù)智能開發(fā)工具SAS提供的工具包括30多個專用模1116.BusinessObjects商務(wù)智能開發(fā)工具BusinessObjects的商務(wù)智能平臺提供了一組公共服務(wù)包含有合作伙伴集成工具包,使用戶能夠直接從企業(yè)應(yīng)用程序中訪問BI信息。BusinessObjec
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025合同違約賠償協(xié)議書10篇
- 公司股份轉(zhuǎn)讓協(xié)議書七篇
- 公司盤活閑置資產(chǎn)和清收清欠工作專題會講話
- 單位租車協(xié)議書標(biāo)準(zhǔn)范本7篇
- 自發(fā)性細(xì)菌性腹膜炎病因介紹
- (立項備案申請模板)低溫預(yù)浸纖維項目可行性研究報告參考范文
- 1.1《沁園春·長沙》【中職專用】高一語文(高教版2023基礎(chǔ)模塊上冊)
- (2024)旅游集散中心建設(shè)項目申請報告可行性研究報告(一)
- 房屋構(gòu)造識圖與建模- 趙靖 任務(wù)三 基礎(chǔ)類型與 構(gòu)61課件講解
- 2023年浸漬、涂布或包覆處理紡織物項目融資計劃書
- 語文修改語病-三年(2022-2024)高考病句試題真題分析及 備考建議(課件)
- 國家開放大學(xué)電大《計算機(jī)應(yīng)用基礎(chǔ)(本)》終結(jié)性考試試題答案(格式已排好)任務(wù)一
- 中華護(hù)理學(xué)會會員申請表(普通+資深會員)
- 電子政務(wù)教案人民大學(xué)
- 最新國家電網(wǎng)公司電力安全工作規(guī)程
- (完整版)HSE管理體系及措施
- 淺談吉林省中藥材產(chǎn)業(yè)發(fā)展
- 職業(yè)生涯規(guī)劃檔案建立過程
- 圖形找規(guī)律專項練習(xí)60題(有答案)
- 小型步進(jìn)電機(jī)控制系統(tǒng)設(shè)計
- 普通發(fā)票銷售清單
評論
0/150
提交評論