數(shù)據(jù)挖掘與商業(yè)智能完全解決方案_第1頁
數(shù)據(jù)挖掘與商業(yè)智能完全解決方案_第2頁
數(shù)據(jù)挖掘與商業(yè)智能完全解決方案_第3頁
數(shù)據(jù)挖掘與商業(yè)智能完全解決方案_第4頁
數(shù)據(jù)挖掘與商業(yè)智能完全解決方案_第5頁
已閱讀5頁,還剩135頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第1章發(fā)掘數(shù)據(jù)金礦的工具:BI與DW、OLAP、DM本章導(dǎo)讀:“工欲善其事,必先利其器”。信息技術(shù)在商業(yè)領(lǐng)域應(yīng)用的卓越成效在經(jīng)過近20年的信息化建設(shè)已經(jīng)初步顯現(xiàn)。企業(yè)通過MIS(管理信息系統(tǒng))快速收集和處理商業(yè)信息,通過ERP(企業(yè)資源計(jì)劃系統(tǒng))準(zhǔn)確監(jiān)控信息流,從而對(duì)企業(yè)經(jīng)營(yíng)的各個(gè)方面進(jìn)行管理。這些系統(tǒng)除了本身的應(yīng)用外,還積累了大量的數(shù)據(jù),如來自業(yè)務(wù)系統(tǒng)的訂單、庫存、交易賬目、客戶和供應(yīng)商資料,來自企業(yè)所處行業(yè)和競(jìng)爭(zhēng)對(duì)手的數(shù)據(jù),以及來自企業(yè)所處的其他外部環(huán)境中的各種數(shù)據(jù),這是一筆寶貴的財(cái)富。信息系統(tǒng)應(yīng)該具備把這些龐大的數(shù)據(jù)轉(zhuǎn)化為知識(shí),進(jìn)而輔助企業(yè)經(jīng)營(yíng)決策,甚至自動(dòng)生成商業(yè)決策的能力,這就是商業(yè)智能。信息系統(tǒng)正在經(jīng)歷著“MIS→ERP→BI”的演變過程。本章將對(duì)于商業(yè)智能涉及到的相關(guān)技術(shù),如數(shù)據(jù)倉庫(DW)、數(shù)據(jù)挖掘(DM)等進(jìn)行概要地分析,同時(shí)從理論上明確商業(yè)智能在企業(yè)經(jīng)營(yíng)決策過程中的價(jià)值發(fā)揮原理。本章先簡(jiǎn)單地說明企業(yè)經(jīng)營(yíng)管理活動(dòng)對(duì)商業(yè)智能的需求,從而明確實(shí)施BI的原因,解決Why的問題;再闡述商業(yè)智能的技術(shù)構(gòu)成,大概了解如何實(shí)現(xiàn)商業(yè)智能,解決What和How的問題;最后列舉一些實(shí)際部署的部署商業(yè)智能項(xiàng)目結(jié)果,解決WhatEffect的問題。1.1

企業(yè)經(jīng)營(yíng)管理活動(dòng)對(duì)商業(yè)智能的需求信息系統(tǒng)在企業(yè)管理中的應(yīng)用不僅隨著管理理念的更新而發(fā)展,還在很大程度上依賴于企業(yè)商業(yè)信息的存儲(chǔ)量。隨著社會(huì)節(jié)奏的加快,企業(yè)信息積累越來越多,而商業(yè)知識(shí)的需求卻得不到滿足,于是就提出了商業(yè)智能的概念。這一節(jié)將對(duì)商業(yè)智能系統(tǒng)應(yīng)用的深層原因進(jìn)行探討。1.1.1

企業(yè)經(jīng)營(yíng)活動(dòng)面臨的挑戰(zhàn)企業(yè)經(jīng)營(yíng)活動(dòng)包括采購、生產(chǎn)、銷售、商貿(mào)磋商、價(jià)格比較、經(jīng)營(yíng)決策、營(yíng)銷策略、推銷促銷、公關(guān)宣傳、售前/售后服務(wù)、客戶關(guān)系和咨詢服務(wù)等。這些活動(dòng)的背后實(shí)際上有3種“流”在支持著整個(gè)企業(yè)的運(yùn)轉(zhuǎn):物流、資金流和信息流?!拔锪鳌笔菑脑牧虾土闩浼匠善氛麄€(gè)物資流通的過程。它將運(yùn)輸、倉儲(chǔ)、加工、整理和配送等整個(gè)物資流通過程通過信息有機(jī)結(jié)合,形成完整的供應(yīng)和需求鏈?!百Y金流”是資金在企業(yè)內(nèi)部和企業(yè)之間的流動(dòng)過程。它包括融資、應(yīng)收賬款和應(yīng)付賬款的管理等,涉及財(cái)務(wù)的各個(gè)方面?!靶畔⒘鳌笔瞧髽I(yè)管理的各個(gè)環(huán)節(jié)產(chǎn)生的信息的規(guī)律性流動(dòng)。如業(yè)務(wù)運(yùn)作過程產(chǎn)生的單據(jù)及其處理過程;經(jīng)營(yíng)管理過程中的成本、收入、利潤(rùn)報(bào)表及其相互關(guān)聯(lián);戰(zhàn)略決策規(guī)劃過程中的產(chǎn)品結(jié)構(gòu)及市場(chǎng)定位信息;企業(yè)的經(jīng)營(yíng)目標(biāo)和策略信息等。實(shí)際上,每個(gè)時(shí)期的企業(yè)經(jīng)營(yíng)活動(dòng)過程都可以抽象出這“三流”。只不過傳統(tǒng)企業(yè)管理由于企業(yè)規(guī)模和經(jīng)營(yíng)過程產(chǎn)生的信息量等還不是十分龐大,所以對(duì)這“三流”沒有進(jìn)行深入的研究和給予更多的重視。然而,信息時(shí)代的企業(yè)經(jīng)營(yíng)活動(dòng)在這3個(gè)方面卻面臨著兩個(gè)很大的挑戰(zhàn)。1.商務(wù)工具的變遷技術(shù)總是不斷地影響著商務(wù)模式。自從人類社會(huì)有商業(yè)活動(dòng)以來,采用新進(jìn)有效的商業(yè)工具往往能在競(jìng)爭(zhēng)中先發(fā)制人。這里不討論生產(chǎn)工具和交通工具,只著眼于和商業(yè)智能關(guān)聯(lián)的信息工具來看現(xiàn)代企業(yè)在這方面面臨的這一挑戰(zhàn)。每一次科學(xué)技術(shù)的進(jìn)步,總是會(huì)在很短的時(shí)間內(nèi)在商業(yè)領(lǐng)域得到普遍的應(yīng)用。圖1-1的上面部分展示了從電報(bào)到互聯(lián)網(wǎng)在不同階段有代表性的商業(yè)工具,伴隨著商業(yè)工具的變遷,人們處理信息的能力在工具的幫助下變得越來越強(qiáng)大,信息量的增長(zhǎng)也越來越快。在此圖的下半部分是與商業(yè)工具的發(fā)展相對(duì)應(yīng)的信息量的增長(zhǎng)。可以說,對(duì)商業(yè)活動(dòng)影響最大的工具是計(jì)算機(jī)在商業(yè)領(lǐng)域的應(yīng)用,它標(biāo)志著商業(yè)活動(dòng)真正進(jìn)入信息化的時(shí)代,這時(shí)候的信息處理方式以數(shù)據(jù)庫為主?,F(xiàn)階段企業(yè)的很多商業(yè)活動(dòng)的信息化都還屬于這個(gè)階段?;ヂ?lián)網(wǎng)在商業(yè)活動(dòng)中的應(yīng)用不僅從某種程度上改變了傳統(tǒng)的商業(yè)模式,在信息增長(zhǎng)和信息處理方式上也發(fā)生了前所未有的變化。在這個(gè)階段,伴隨著網(wǎng)絡(luò)的使用,商業(yè)信息呈爆炸狀增長(zhǎng),企業(yè)從以前使用的系統(tǒng)中繼承了相當(dāng)多的數(shù)據(jù),如從ERP中繼承的生產(chǎn)運(yùn)作相關(guān)信息、從CRM中繼承的客戶信息和從HR系統(tǒng)中繼承得到的員工信息等,這些信息只有共同作用才能發(fā)揮其效益,故信息處理方式以數(shù)據(jù)倉庫和數(shù)據(jù)集市等為主。圖1-1

商業(yè)工具的發(fā)展及其相對(duì)應(yīng)的信息量正是由于信息工具的變化和信息量的不斷增長(zhǎng),人們針對(duì)這些不同時(shí)期的不同信息類型一直在探索管理好它們的方法,也伴隨著產(chǎn)生了一些工具。在使用電報(bào)、電話和傳真等商業(yè)工具的階段,信息量還不是很龐大,人們自身的能力還可以處理它們,這段時(shí)間出現(xiàn)的都是手工處理信息的方法,如文件的編目和文件系統(tǒng)的管理等。計(jì)算機(jī)的商業(yè)應(yīng)用出現(xiàn)后,信息處理的方式發(fā)生了革命性的變化,先是商業(yè)單據(jù)的電子化,即EDI(電子數(shù)據(jù)交換),然后是MIS(管理信息系統(tǒng))的廣泛應(yīng)用。隨著信息的持續(xù)增長(zhǎng),一些新的商業(yè)信息處理方式被提了出來,如企業(yè)資源規(guī)劃、供應(yīng)鏈管理、客戶關(guān)系管理和人力資源管理等,對(duì)應(yīng)的商業(yè)信息處理工具分別有ERP、SCM、CRM和HR等。這一過程如圖1-2所示。圖1-2

信息管理工具的演變?cè)谶@個(gè)變化的時(shí)代,能適應(yīng)變化并趨利避害者才能在競(jìng)爭(zhēng)中取得勝利。對(duì)于企業(yè)經(jīng)營(yíng)管理來說,這既是機(jī)遇又是威脅。新的商業(yè)工具在成本和效率等方面都有優(yōu)勢(shì),如何使新的商業(yè)工具得到使用并使企業(yè)快速適應(yīng)使用這種工具的環(huán)境,揚(yáng)其長(zhǎng)避其短,這是企業(yè)經(jīng)營(yíng)活動(dòng)面臨的一個(gè)重要挑戰(zhàn)。2.信息囚籠、信息孤島和信息對(duì)抗的問題企業(yè)里有大量的分布于各個(gè)計(jì)算機(jī)系統(tǒng)的數(shù)據(jù),人們使用信息處理工具的目的就是希望把這些數(shù)據(jù)進(jìn)行整理和分析,找到其中有價(jià)值的信息,為企業(yè)的經(jīng)營(yíng)決策提供依據(jù)。但是實(shí)際情況往往和這個(gè)愿望大相徑庭,在現(xiàn)有的信息傳統(tǒng)中,存在著信息化系統(tǒng)與傳統(tǒng)業(yè)務(wù)系統(tǒng)脫節(jié)、信息化各子系統(tǒng)脫節(jié)、信息化整合傳統(tǒng)資源脫節(jié)的“三脫節(jié)”現(xiàn)象,這直接導(dǎo)致了企業(yè)信息囚籠、信息孤島和信息對(duì)抗的問題。在信息化過程中,企業(yè)積累了大量的數(shù)據(jù),包括生產(chǎn)運(yùn)作、客戶、產(chǎn)品和銷售等方面,但這些數(shù)據(jù)卻被深埋在單獨(dú)的計(jì)算機(jī)系統(tǒng)中未加以或難以運(yùn)用,其潛力也不能發(fā)揮出來。而另一方面,企業(yè)在維護(hù)這些計(jì)算機(jī)設(shè)備和數(shù)據(jù)庫系統(tǒng)上進(jìn)行了可觀的投資,很多管理者甚至不無感慨地說:“在信息系統(tǒng)上的投資就像一個(gè)黑洞,花了很多錢,卻不見成效”。不僅豐富的數(shù)據(jù)被深埋著,企業(yè)自身好像也被這些系統(tǒng)套著,這就是信息的囚籠現(xiàn)象。系統(tǒng)間的相互交互、兼容和集成問題是另一個(gè)重要的問題。信息化有一個(gè)從初級(jí)階段到中級(jí)階段,再到高級(jí)階段的發(fā)展過程。在計(jì)算機(jī)應(yīng)用的初級(jí)階段,人們?nèi)菀讖奈淖痔幚怼?bào)表打印開始使用計(jì)算機(jī),進(jìn)而圍繞一項(xiàng)項(xiàng)業(yè)務(wù)工作,開發(fā)或引進(jìn)一個(gè)個(gè)應(yīng)用系統(tǒng)。這些分散開發(fā)或引進(jìn)的應(yīng)用系統(tǒng),一般不會(huì)統(tǒng)一考慮數(shù)據(jù)標(biāo)準(zhǔn)或信息共享問題,如某企業(yè)財(cái)務(wù)管理用“管家婆”,生產(chǎn)運(yùn)作用“用友”,銷售管理用“金蝶”,客戶關(guān)系管理和人力資源管理自己開發(fā),這樣,各個(gè)系統(tǒng)之間的數(shù)據(jù)很難進(jìn)行交換。信息系統(tǒng)往往被其所屬的部門隔絕,決策者很難得到一個(gè)基于對(duì)大量數(shù)據(jù)進(jìn)行運(yùn)算后得到的企業(yè)經(jīng)營(yíng)運(yùn)作總體圖景,這種現(xiàn)象就稱為“信息孤島”。企業(yè)中的信息流、資金流和物流應(yīng)該能夠相互驗(yàn)證,協(xié)調(diào)一致,但由于數(shù)據(jù)的分散和不兼容性,不同部門也有各自不同的體制,這樣導(dǎo)致信息流所反映的資金流和物流的情況在很多時(shí)候還存在矛盾,這必然會(huì)導(dǎo)致信息之間的相互對(duì)抗。如何解決信息囚籠、信息孤島和信息對(duì)抗的問題是現(xiàn)代企業(yè)經(jīng)營(yíng)管理中面臨的又一個(gè)挑戰(zhàn)。雖然進(jìn)行信息系統(tǒng)建設(shè)非常麻煩,但卻不能放棄。正如不能因?yàn)榛疖噳核肋^人就不使用火車一樣,決不能因?yàn)榇嬖谌毕菥途芙^新思想新技術(shù)的使用,應(yīng)該想辦法去消除信息孤島、信息囚籠和信息對(duì)抗,趨利避害方能有所成。實(shí)際上在本書的姐妹篇《SQLServer2005數(shù)據(jù)庫管理與應(yīng)用高手修煉指南》中的最后一章,已經(jīng)簡(jiǎn)單地闡述了從數(shù)據(jù)到智能的相關(guān)理論,那么在這里,需要解決的問題就是從現(xiàn)有系統(tǒng)中的數(shù)據(jù)出發(fā),如何得到能真正輔助商業(yè)活動(dòng)的智能,進(jìn)而轉(zhuǎn)化為利潤(rùn),也就是完成信息系統(tǒng)的“數(shù)據(jù)→信息→知識(shí)→利潤(rùn)”轉(zhuǎn)化過程。在《SQLServer2005數(shù)據(jù)庫管理與應(yīng)用高手修煉指南》一書中,筆者詳細(xì)地論述了3個(gè)相關(guān)問題:數(shù)據(jù)、信息、知識(shí)和智慧有何區(qū)別;一般情況下數(shù)據(jù)如何經(jīng)由信息和知識(shí)生成智慧;基于數(shù)據(jù)庫系統(tǒng)的智慧是如何產(chǎn)生的。本書將在以上問題的基礎(chǔ)上進(jìn)一步探討由數(shù)據(jù)轉(zhuǎn)化為商業(yè)智能后如何發(fā)揮其作用,即商業(yè)活動(dòng)決策中的信息需求問題,在此基礎(chǔ)上才能明確一個(gè)提供商業(yè)智能的系統(tǒng)到底應(yīng)該包含哪些功能。1.1.2

企業(yè)決策實(shí)現(xiàn)過程的信息需求管理就是決策,決策需要信息。決策過程實(shí)際上就是一個(gè)信息輸入、信息輸出及信息反饋的循環(huán)過程。原來的決策支持系統(tǒng),現(xiàn)在流行的商業(yè)智能,其目的都是為了輔助決策,讓管理者從拍腦袋做決策到依據(jù)數(shù)據(jù)和事實(shí)做決策。這些依賴的數(shù)據(jù)和事實(shí)來源于兩個(gè)方面,一是來源于競(jìng)爭(zhēng)環(huán)境,這包括內(nèi)部信息源(主要是存在于決策主體的經(jīng)驗(yàn)信息)和外部信息源(主要是決策主體和咨詢機(jī)構(gòu)從社會(huì)中通過各種渠道獲取的信息),另一方面來源于企業(yè)多年信息化建設(shè)中積累的數(shù)據(jù)庫信息。對(duì)于第1個(gè)方面,信息的非結(jié)構(gòu)化特征決定了其隨意性和不確定性,這是決策理論中研究的問題,而對(duì)于第2個(gè)方面的信息,即使用存在于數(shù)據(jù)庫中的信息來輔助決策的問題,就是可以通過商業(yè)智能從技術(shù)上來得到很大程度的解決。要基于計(jì)算機(jī)輔助決策的軟件系統(tǒng)(商業(yè)智能系統(tǒng)就是其中最典型的代表)進(jìn)行決策,需要經(jīng)過5個(gè)步驟:1.決策信息請(qǐng)求(商務(wù)查詢需求)的發(fā)起。例如,現(xiàn)在某公司的決策層次年度在不同的地區(qū)投資的力度,需要知道本年度和前5年華中、華北、華東和華南等區(qū)域的銷售量和銷售額,并且要有很美觀的界面和直觀的圖示來表達(dá)這些來源于數(shù)據(jù)庫中的數(shù)據(jù),這就為此決策發(fā)出了信息請(qǐng)求。2.調(diào)用商業(yè)智能應(yīng)用程序。決策者可以直接使用原來的系統(tǒng),如ERP和CRM等來訪問相關(guān)的銷售數(shù)據(jù),但是,這些數(shù)據(jù)往往分散在不同的數(shù)據(jù)庫中,原來的系統(tǒng)也可能并沒有提供十分富有個(gè)性化的查詢需求。比如,在上述的決策中,原系統(tǒng)可能只提供了所有年度的銷售數(shù)據(jù),而不會(huì)具體到某一年甚至某一個(gè)月,那么這時(shí)候要滿足決策信息需求就必須使用基于數(shù)據(jù)倉庫技術(shù)的商業(yè)智能應(yīng)用程序。3.基于已發(fā)布的模型、規(guī)則或是策略確定適當(dāng)?shù)臎Q策。這一步是用計(jì)算機(jī)輔助決策的重要步驟。也是智能化體現(xiàn)的地方。決策(特別是結(jié)構(gòu)化決策)是有一定規(guī)律的,這些規(guī)律可以從以往的決策過程或者從以往的數(shù)據(jù)中抽象獲得,把抽象得到的這些規(guī)律放在經(jīng)過特別組織的庫中,可以構(gòu)成模型庫、規(guī)則庫和策略庫,智能決策可以在這些庫的基礎(chǔ)上獲得。4.發(fā)布決策。決策最終是人的行為,計(jì)算機(jī)輔助了決策過程中信息的提取和規(guī)律性決策的結(jié)果,但最終的決策行為還是掌握在決策者自己的手中。5.采取行動(dòng)。這是檢驗(yàn)決策正確性的唯一途徑。圖1-3是把以上決策過程中對(duì)信息的需求和計(jì)算機(jī)輔助決策的過程及其相互關(guān)系進(jìn)行歸納所得。其中,圖的左邊部分是決策的信息源,右邊部分借鑒了DSS(決策支持系統(tǒng))的相關(guān)理論,表達(dá)了計(jì)算機(jī)輔助決策過程的全貌。圖1-3

決策信息源及基于計(jì)算機(jī)系統(tǒng)的決策過程商業(yè)智能系統(tǒng)建設(shè)的目標(biāo)就是要為企業(yè)提供一個(gè)統(tǒng)一的分析平臺(tái),充分利用原有系統(tǒng)中積累的寶貴數(shù)據(jù),對(duì)其進(jìn)行深層次的發(fā)掘,并從不同的角度分析企業(yè)的各種業(yè)務(wù)指標(biāo)和構(gòu)建業(yè)務(wù)知識(shí)模型,進(jìn)而滿足決策的信息需求和實(shí)現(xiàn)通過技術(shù)輔助決策的功能。1.1.3

企業(yè)信息化系統(tǒng)的進(jìn)化信息流的質(zhì)量、速度和覆蓋范圍,可以反映企業(yè)的生產(chǎn)、管理和決策等各方面的優(yōu)劣度。企業(yè)的“生命活動(dòng)”最終都將以信息流的形式展現(xiàn)。因此企業(yè)管理者十分重視信息流的管理。隨著技術(shù)的發(fā)展,企業(yè)信息化系統(tǒng)也圍繞著對(duì)信息流的更合理、更有效率的管理而努力著,這一點(diǎn)在圖1-2信息管理工具的演變中已經(jīng)明確。實(shí)際上,如果把相似的系統(tǒng)進(jìn)行歸一,如把對(duì)于企業(yè)相關(guān)領(lǐng)域的信息進(jìn)行細(xì)節(jié)管理的系統(tǒng)都?xì)w一為管理信息系統(tǒng),把通過資源管理的整合來實(shí)現(xiàn)全局利益最大化的系統(tǒng)歸一為企業(yè)資源計(jì)劃系統(tǒng),那么企業(yè)信息化系統(tǒng)的轉(zhuǎn)化可以表示為這樣的一種路徑:MIS→ERP→BI→智能決策系統(tǒng)。在這個(gè)路徑中相應(yīng)的管理對(duì)象就是:數(shù)據(jù)→信息→知識(shí)→利潤(rùn)。這里將通過描述這些系統(tǒng)的區(qū)別來明確商業(yè)智能系統(tǒng)在企業(yè)信息化浪潮中的位置。管理信息系統(tǒng)和企業(yè)資源計(jì)劃系統(tǒng)積累了大量的歷史數(shù)據(jù),這些數(shù)據(jù)是不同歷史時(shí)期,根據(jù)不同業(yè)務(wù)的需要,由不同供應(yīng)商提供的,體系結(jié)構(gòu)和管理實(shí)施等方面存在著較大的差異,各系統(tǒng)間的數(shù)據(jù)也相對(duì)分散和獨(dú)立,難以共享,沒有建立起統(tǒng)一的能用于分析處理的基礎(chǔ)數(shù)據(jù)平臺(tái)。若一種類型的業(yè)務(wù)數(shù)據(jù)用一個(gè)三角形代表,那么這些百家爭(zhēng)鳴、百花齊放的系統(tǒng)數(shù)據(jù)就猶如圖1-4所示的狀態(tài),可見,要一下子明確整個(gè)企業(yè)中的業(yè)務(wù)數(shù)據(jù)和相互關(guān)系(即圖示中三角形的數(shù)量和聯(lián)系)是有較大困難的。圖1-4

百家爭(zhēng)鳴、百花齊放的管理系統(tǒng)數(shù)據(jù)(共有多少個(gè)三角形?)在來自不同系統(tǒng)的大量數(shù)據(jù)中往往隱藏著重要的規(guī)律和商業(yè)規(guī)則,這些是企業(yè)管理者需要從系統(tǒng)中尋找的“金礦”。此“金礦”的形成過程實(shí)際上就是“數(shù)據(jù)→信息→知識(shí)→智慧”的轉(zhuǎn)化過程:對(duì)數(shù)據(jù)進(jìn)行整理得到信息,深入的分析信息得到關(guān)于這些事實(shí)的相關(guān)情況,這就是知識(shí)。知識(shí)是寶貴的,如果將這些知識(shí)用在輔助決策上,會(huì)使決策更具科學(xué)性和可行性,這些決策可以是操作層面的,也可以是戰(zhàn)術(shù)層面和戰(zhàn)略層面的,于是,知識(shí)又轉(zhuǎn)化成了智慧。若決策是用于企業(yè)經(jīng)營(yíng)管理中的,那么這種智慧就可以稱為商業(yè)智慧,也就是商務(wù)智能,或者叫商業(yè)智能(BusinessIntelligence,BI)。商業(yè)智能過程實(shí)際上包含2個(gè)層次。第1個(gè)層次是在整合系統(tǒng)數(shù)據(jù)的基礎(chǔ)上提供靈活的前端展現(xiàn),例如,通過直方圖等形式表現(xiàn)來自銷售管理系統(tǒng)的地區(qū)銷售情況報(bào)表,對(duì)復(fù)雜的計(jì)算則通過計(jì)算機(jī)的手段輔助完成。如圖1-5所示的即是這種商業(yè)智能功能的直觀表現(xiàn)。圖1-5

經(jīng)過數(shù)據(jù)整合的BI系統(tǒng)功能(現(xiàn)在有多少個(gè)三角形?)商業(yè)智能的第2個(gè)層次是數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)。許多商業(yè)、政府和科學(xué)數(shù)據(jù)庫的爆炸性增長(zhǎng)已遠(yuǎn)遠(yuǎn)超出了能夠解釋和消化這些數(shù)據(jù)的能力,需要新一代的工具和技術(shù)對(duì)數(shù)據(jù)庫進(jìn)行自動(dòng)和智能地分析。這些工具和技術(shù)正是知識(shí)發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase,KDD)。知識(shí)發(fā)現(xiàn)的主要技術(shù)構(gòu)成就是數(shù)據(jù)挖掘(DataMining),“啤酒與尿布”的故事是在商業(yè)領(lǐng)域使用數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)的一個(gè)典型的案例(見《SQLServer2005數(shù)據(jù)庫管理與應(yīng)用高手修煉指南》第18章)。圖1-6描述了加入智能數(shù)據(jù)挖掘算法后的系統(tǒng)功能。具備數(shù)據(jù)挖掘功能的商業(yè)智能系統(tǒng)能夠在對(duì)歷史數(shù)據(jù)分析的基礎(chǔ)上,通過特定的算法,獲取這些歷史數(shù)據(jù)中的規(guī)律,進(jìn)而完成預(yù)測(cè)、聚類和關(guān)聯(lián)等功能。例如,通過系統(tǒng)對(duì)銷售數(shù)據(jù)的分析,可能會(huì)發(fā)現(xiàn)“在購買面包和黃油的顧客中,有90%的人同時(shí)也買了牛奶”,即“面包+黃油+牛奶”是一種常見的顧客購買方式。這是關(guān)聯(lián)規(guī)則分析的結(jié)果。使用關(guān)聯(lián)規(guī)則還可以發(fā)現(xiàn)商品在時(shí)間或序列上的規(guī)律。這些規(guī)律對(duì)于商務(wù)的智能化和決策的科學(xué)化將有十分重要的意義。圖1-6

加入智能挖掘算法的系統(tǒng)功能(最后一個(gè)框中應(yīng)該有多少個(gè)三角形?)知識(shí)經(jīng)濟(jì)的主要資產(chǎn)是“知本(知識(shí)資本)”,應(yīng)用在商務(wù)領(lǐng)域,“知本”包括對(duì)客戶需求的認(rèn)識(shí)、市場(chǎng)定位和市場(chǎng)細(xì)分的方式、正確的定價(jià)方案等。要獲取這些“知本”,就要在已有資源(其中很重要的就是信息資源)的基礎(chǔ)上,充分分析,獲取這些“知本”,從而做出可信和可行的決策。1.2

商業(yè)智能的技術(shù)構(gòu)成上一節(jié)可以說從多個(gè)層面明確了商業(yè)智能系統(tǒng)的重要性和必要性,但是,到底如何理解商業(yè)智能?商業(yè)智能如何實(shí)現(xiàn)?本節(jié)將解決這些問題。對(duì)這些問題的深刻認(rèn)識(shí)是保證在商業(yè)智能應(yīng)用技術(shù)實(shí)現(xiàn)過程中有一個(gè)清晰的思路。1.2.1

什么是商業(yè)智能商業(yè)智能的概念最早是GartnerGroup于1996年提出來的。當(dāng)時(shí)將商業(yè)智能定義為一類由數(shù)據(jù)倉庫(或數(shù)據(jù)集市)、查詢報(bào)表、聯(lián)機(jī)分析、數(shù)據(jù)挖掘、數(shù)據(jù)備份和恢復(fù)等部分組成的,以幫助企業(yè)決策為目的的技術(shù)及其應(yīng)用。而后隨著商務(wù)環(huán)境的變遷和技術(shù)的進(jìn)步,人們對(duì)于BI有了更多和更深的認(rèn)識(shí),下面將從兩個(gè)方面探索商業(yè)智能的內(nèi)涵。1.不同視角的BIBI本身是一個(gè)復(fù)雜的體系,況且應(yīng)用環(huán)境復(fù)雜,這就形成了從不同視角看BI的情況。GartnerGroup認(rèn)為:商業(yè)智能技術(shù)提供使企業(yè)迅速分析數(shù)據(jù)的技術(shù)和方法,包括收集、管理和分析數(shù)據(jù),將這些數(shù)據(jù)轉(zhuǎn)化為有用的信息,然后再分發(fā)到企業(yè)各處,輔助商業(yè)決策的制定。IDC將BI定義為:商業(yè)智能是終端用戶查詢和報(bào)告的工具、OLAP工具、數(shù)據(jù)挖掘軟件、數(shù)據(jù)集市和數(shù)據(jù)倉庫產(chǎn)品等軟件工具的集合。IBM認(rèn)為:商業(yè)智能是一系列由系統(tǒng)和技術(shù)支持的以簡(jiǎn)化信息收集和分析的策略集合,它應(yīng)該包括企業(yè)需要收集什么信息、誰需要去訪問這些數(shù)據(jù)、如何把原始數(shù)據(jù)轉(zhuǎn)化為最終導(dǎo)致戰(zhàn)略性決策的智能、客戶服務(wù)和供應(yīng)鏈管理。Microsoft認(rèn)為:商業(yè)智能是任何嘗試獲取、分析企業(yè)數(shù)據(jù)以更清楚地了解市場(chǎng)和客戶、改進(jìn)企業(yè)流程和更有效地參與競(jìng)爭(zhēng)的努力。SAP認(rèn)為:商業(yè)智能是一大類收集、存儲(chǔ)、分析和訪問數(shù)據(jù)以幫助企業(yè)用戶更好地進(jìn)行決策的應(yīng)用程序與技術(shù)。SAS認(rèn)為:商業(yè)智能是關(guān)于在組織內(nèi)部和組織周圍正在發(fā)生的智能或知識(shí)。MSTR認(rèn)為:商業(yè)智能是一系列能夠使公司分析數(shù)據(jù)庫中的數(shù)據(jù)并根據(jù)收集的信息獲得的洞察力來作決策的軟件系統(tǒng)。DWReview認(rèn)為:從數(shù)據(jù)分析的觀點(diǎn),商業(yè)智能是收集與研究主題相關(guān)的、高質(zhì)量的、有意義的信息、以幫助分析信息、得出結(jié)論或做出假設(shè)的過程。這些觀點(diǎn)代表了最典型的BI視角,有一個(gè)名為《ttnnBI觀點(diǎn)》的電子期刊也對(duì)此進(jìn)行了研究,把這些對(duì)BI的認(rèn)識(shí)由虛到實(shí)探索其本質(zhì),大致分成如下4類。1.是努力,MS主張的。2.是智能和知識(shí),SAS倡導(dǎo)的。3.是過程,DMReview的定義。4.是工具和技術(shù)集合,Gartner、IDC、IBM、SAP和MSTR代表的。任何技術(shù)的出現(xiàn)都是為了解決現(xiàn)實(shí)中存在的問題。把以上的觀點(diǎn)與本章第1節(jié)的知識(shí)結(jié)合起來,應(yīng)該對(duì)商業(yè)智能形成以下的認(rèn)識(shí)。商業(yè)智能是商業(yè)數(shù)據(jù)海洋中的指南針,它從歷史數(shù)據(jù)中提取信息,搞清楚經(jīng)營(yíng)狀況,通過信息的分析獲取對(duì)經(jīng)營(yíng)決策有價(jià)值的知識(shí),從而幫助用戶對(duì)自身的業(yè)務(wù)經(jīng)營(yíng)做出正確而明智的決定。比如,通過商業(yè)智能可以解決客戶在不同地域的分布情況,可以對(duì)客戶進(jìn)行各個(gè)角度的分類,還可以把客戶和訂單聯(lián)系起來,找出其變化趨勢(shì)。2.BI中的統(tǒng)計(jì)、報(bào)表與分析、挖掘按照智能應(yīng)用的范圍,商業(yè)智能系統(tǒng)可以產(chǎn)生客戶智能、營(yíng)銷智能、銷售智能和財(cái)務(wù)智能。這些智能的產(chǎn)生包括3個(gè)部分的具體功能:信息處理、分析處理和知識(shí)發(fā)現(xiàn)。前2個(gè)部分是商業(yè)智能的前端展現(xiàn)對(duì)象,第3個(gè)部分則屬于數(shù)據(jù)挖掘?qū)哟?。信息處理包括查詢和基本的統(tǒng)計(jì)分析,如使用交叉表、圖表或者圖進(jìn)行報(bào)表的展示。分析處理是支持基本的OLAP操作,如上鉆、下鉆、旋轉(zhuǎn)、切片和切塊等,其表現(xiàn)形式也以報(bào)表為主。明確了這一點(diǎn),就能解開大多數(shù)BI初學(xué)者的疑惑:既然是“智能”的了,為什么還是報(bào)表的天下。實(shí)際上,統(tǒng)計(jì)和報(bào)表在很長(zhǎng)一段時(shí)間內(nèi)還是BI的重點(diǎn),但這里的統(tǒng)計(jì)和報(bào)表與基于數(shù)據(jù)庫的統(tǒng)計(jì)和報(bào)表有本質(zhì)的區(qū)別,在BI系統(tǒng)中,報(bào)表的數(shù)據(jù)來源不是關(guān)系型數(shù)據(jù)庫,而是從許多來自不同的企業(yè)運(yùn)作系統(tǒng)的數(shù)據(jù)中提取出的有用數(shù)據(jù),同時(shí)對(duì)這些數(shù)據(jù)進(jìn)行清理以保證數(shù)據(jù)的正確性,然后經(jīng)過抽取、轉(zhuǎn)換和裝載(即ETL過程),合并到一個(gè)企業(yè)級(jí)的數(shù)據(jù)倉庫里,再經(jīng)過聯(lián)機(jī)分析處理(OLAP)而獲得的企業(yè)數(shù)據(jù)的一個(gè)全局視圖。都是報(bào)表,BI系統(tǒng)中的報(bào)表往往有很強(qiáng)的自定義功能(如可以針對(duì)某一個(gè)維度隨意上鉆和下鉆)和很強(qiáng)的表現(xiàn)能力(如可以在不同的圖形表現(xiàn)形式上隨意切換)。BI的應(yīng)用必須基于數(shù)據(jù)倉庫技術(shù),因?yàn)閿?shù)據(jù)倉庫夠大、夠清楚、夠全面,并且對(duì)統(tǒng)計(jì)分析需要的數(shù)據(jù)源支持得夠好,這些優(yōu)點(diǎn)是傳統(tǒng)的數(shù)據(jù)庫沒有的。筆者所接觸到的很多BI與DW的初學(xué)者對(duì)于商業(yè)智能和數(shù)據(jù)挖掘這兩者的關(guān)系都存在著認(rèn)識(shí)上的誤區(qū),他們要么把它們獨(dú)立開來,要么把它們等同起來。而實(shí)際上,通常講到BI,更多時(shí)候指的是前端應(yīng)用部分,如現(xiàn)階段聲稱是BI提供商的,大多數(shù)提供的是前端展現(xiàn)工具;而DW更多時(shí)候指的是后端部分,包括架構(gòu)體系的設(shè)計(jì)和多維模型的建立等。還有一個(gè)問題就是數(shù)據(jù)挖掘(DM,DataMining),說得學(xué)術(shù)化一點(diǎn)就是知識(shí)發(fā)現(xiàn)的問題,這是商業(yè)智能過程的第2個(gè)層次的應(yīng)用,通過它可以找出隱藏的模式和關(guān)聯(lián),進(jìn)行分類和預(yù)測(cè)。本書主要描述的是基于數(shù)據(jù)倉庫的商業(yè)智能和數(shù)據(jù)挖掘的技術(shù)實(shí)現(xiàn),對(duì)其關(guān)系的準(zhǔn)確認(rèn)識(shí)是學(xué)習(xí)過程中進(jìn)行整體把握的基礎(chǔ)。對(duì)商業(yè)智能體系結(jié)構(gòu)的深入探究將有助于達(dá)到這一目的。1.2.2

商業(yè)智能的結(jié)構(gòu)描述商業(yè)智能的實(shí)現(xiàn)包含了“數(shù)據(jù)→信息→知識(shí)→行動(dòng)→智慧”這一過程所運(yùn)用的技術(shù)和方法。在國(guó)外,有人曾經(jīng)把BI作為一種數(shù)據(jù)的提純工廠。BI過程以來自業(yè)務(wù)系統(tǒng)的數(shù)據(jù)為基礎(chǔ),經(jīng)過數(shù)據(jù)倉庫技術(shù)的處理,整合數(shù)據(jù)并將其轉(zhuǎn)化為有序的信息;這些信息經(jīng)過聯(lián)機(jī)分析處理(OLAP)技術(shù)的分析后,可以表達(dá)出數(shù)據(jù)內(nèi)部的各種關(guān)聯(lián),這是對(duì)商業(yè)管理活動(dòng)有很大幫助的知識(shí);經(jīng)營(yíng)活動(dòng)中很多時(shí)候還要進(jìn)一步明確數(shù)據(jù)中隱藏的規(guī)則,這要靠數(shù)據(jù)挖掘技術(shù)的幫助,最后要采取行動(dòng)時(shí),可以用模型庫和方法庫等決策支持的相關(guān)技術(shù)來輔助決策;而決策和行動(dòng)的結(jié)果又可以作為業(yè)務(wù)數(shù)據(jù)反應(yīng)在業(yè)務(wù)環(huán)境中,為以后的決策提供數(shù)據(jù)源支持。如此循環(huán)往復(fù),商務(wù)活動(dòng)就在BI系統(tǒng)的支持下變得智能了。圖1-7表達(dá)了這一過程。在圖1-7中可以發(fā)現(xiàn),商業(yè)智能系統(tǒng)是建立在數(shù)據(jù)倉庫、OLAP和數(shù)據(jù)挖掘等技術(shù)的基礎(chǔ)之上,通過收集、整理和分析企業(yè)內(nèi)外部的各種數(shù)據(jù),加深企業(yè)對(duì)客戶及市場(chǎng)的了解,并使用一定的工具對(duì)企業(yè)運(yùn)營(yíng)狀況、客戶需求和市場(chǎng)動(dòng)態(tài)等做出合理的評(píng)價(jià)及預(yù)測(cè),為企業(yè)管理層提供科學(xué)的決策依據(jù)。圖1-7

BI過程及其對(duì)應(yīng)的技術(shù)與方法把商業(yè)智能系統(tǒng)工作的這一過程進(jìn)行技術(shù)上的抽象,可以把商業(yè)智能的體系結(jié)構(gòu)分為源數(shù)據(jù)層、數(shù)據(jù)轉(zhuǎn)換層、數(shù)據(jù)倉庫(數(shù)據(jù)集市)層、OLAP及數(shù)據(jù)挖掘?qū)雍陀脩粽宫F(xiàn)層。這幾層通過密切的協(xié)作完成商業(yè)智能的功能,它們的相互依賴關(guān)系如圖1-8所示。在圖1-8中可以看到,實(shí)現(xiàn)商業(yè)智能應(yīng)用有4個(gè)十分關(guān)鍵的環(huán)節(jié),包括數(shù)據(jù)源、ETL過程、數(shù)據(jù)倉庫及其應(yīng)用和BI前端展現(xiàn)。數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)來源主要是外部的操作性應(yīng)用系統(tǒng),這些數(shù)據(jù)源包括數(shù)據(jù)的業(yè)務(wù)含義和業(yè)務(wù)規(guī)則,表達(dá)業(yè)務(wù)數(shù)據(jù)的表、字段、視圖、列和索引等。圖1-8

BI解決方案的體系結(jié)構(gòu)ETL過程即抽?。‥xtraction)、轉(zhuǎn)換(Transformation)和裝載(Load)。ETL過程負(fù)責(zé)將業(yè)務(wù)系統(tǒng)中各種關(guān)系型數(shù)據(jù)、外部數(shù)據(jù)、遺留數(shù)據(jù)和其他相關(guān)數(shù)據(jù)經(jīng)過清洗、轉(zhuǎn)化和整理后放進(jìn)中心數(shù)據(jù)倉庫。數(shù)據(jù)倉庫是商業(yè)智能系統(tǒng)的基礎(chǔ),是面向主題的、集成的、穩(wěn)定的和隨時(shí)間不斷變化的數(shù)據(jù)集合。數(shù)據(jù)倉庫的應(yīng)用包括聯(lián)機(jī)在線分析處理(OLAP)和數(shù)據(jù)挖掘(DM)。通過對(duì)數(shù)據(jù)倉庫中多維數(shù)據(jù)的鉆取、切片及旋轉(zhuǎn)等分析動(dòng)作,可以完成決策支持需要的查詢及報(bào)表。通過數(shù)據(jù)挖掘,可以發(fā)現(xiàn)隱藏在數(shù)據(jù)中的潛在規(guī)則。前端展現(xiàn)可以提供各種能幫助人們快速理解數(shù)據(jù)內(nèi)涵的可視化手段。它是數(shù)據(jù)倉庫的門面,包括各種報(bào)表工具、查詢工具和數(shù)據(jù)分析工具以表格或圖形化的手段對(duì)數(shù)據(jù)的展現(xiàn)。這是一種具有層次關(guān)系的體系結(jié)構(gòu)。實(shí)際上,這種結(jié)構(gòu)是極為穩(wěn)定的,這是自然界的普遍規(guī)律,如生態(tài)系統(tǒng)中有層次,食物鏈中有層次,良好的軟件構(gòu)架有層次(如MVC結(jié)構(gòu))。分層處理的同時(shí)也是解決復(fù)雜問題的一種基本思考方法,如管理中的層次?;跀?shù)據(jù)倉庫的商業(yè)智能和數(shù)據(jù)挖掘應(yīng)用采用這種結(jié)構(gòu)已經(jīng)通過實(shí)踐證明是可行的。因此本書將依據(jù)圖1-8所示的商業(yè)智能系統(tǒng)實(shí)現(xiàn)的技術(shù)階段來組織相關(guān)內(nèi)容。事實(shí)上,這一結(jié)構(gòu)圖是較為通用的,包括SQLServer2005在內(nèi)的很多數(shù)據(jù)挖掘和商業(yè)智能工具都是基于此圖所描述的過程來實(shí)現(xiàn)其功能的。1.2.3

數(shù)據(jù)挖掘和商業(yè)智能工具商業(yè)智能具有極為廣闊的應(yīng)用前景,吸引了相當(dāng)多的軟件產(chǎn)商為BI提供解決方案。其中包括軟件巨人Microsoft、Oracle、IBM和Sybase等。所以,商業(yè)智能工具的選擇余地還是很大的。根據(jù)BI解決方案的體系結(jié)構(gòu),一個(gè)完整的BI應(yīng)用需要ETL工具、數(shù)據(jù)倉庫管理工具、OLAP工具、數(shù)據(jù)挖掘工具和報(bào)表查詢工具5種工具協(xié)同工作。如表1-1所示列出了其中一些軟件廠商在這些工具方面的主要產(chǎn)品。表1-1

一些廠商提供的數(shù)據(jù)倉庫工具公司名稱ETL工具數(shù)據(jù)倉庫管理工具OLAP工具數(shù)據(jù)挖掘工具報(bào)表工具IBMWarehouseManagerVisualWarehouseOLAPServerIntelligentMinerInsight&QucikviewOracleOracleETLServerEnterpriseManagerExpressServerDarwinExpressAnalyserSybaseReplicationServerPowerStageWarehouseStudioWarehouseAnalyzerSASSPSSInfoMakerCAInfoPumpPLATINUMERWinPLATINUMInfoPumpDecisionBaseInfoBeaconNeugentAionForest&TreesInfoReportsSAS第三方WarehouseAdministratorSASMDDBEnterpriseMinerEISERMicrosoftSSISSQLServerSSASSSASSSRS目前BI在開放源碼方面也有發(fā)展,最著名的是Pentaho開源BI系統(tǒng),該系統(tǒng)的OLAP服務(wù)器采用Mondrian,OLAP展示使用JPivot,關(guān)系型數(shù)據(jù)庫使用FirebirdRDBMS,ETL工具使用Enhydra,服務(wù)器使用JBoss,數(shù)據(jù)挖掘使用Weka,集成管理和開發(fā)環(huán)境使用Eclipse。這些都是開源項(xiàng)目。關(guān)于SQLServer2005的商業(yè)智能解決方案將在1.2.5節(jié)講解。1.2.4

商業(yè)智能工具的選擇通過上面的討論,可以看出IBM、Oracle、NCR、CA、SAS和Sybase等著名數(shù)據(jù)倉庫廠商在數(shù)據(jù)倉庫管理、OLAP和報(bào)表、數(shù)據(jù)挖掘方面都提供了豐富的工具。各類產(chǎn)品各有其特點(diǎn),并且有各自的適用環(huán)境,需要從商業(yè)需求和技術(shù)兩個(gè)角度來選擇。一般來說,產(chǎn)品選擇需要進(jìn)行如下4個(gè)方面的基本工作。1.了解商業(yè)需求了解商業(yè)需求首先要了解應(yīng)用的范圍和級(jí)別。這需要確定建立企業(yè)級(jí)數(shù)據(jù)倉庫、部門級(jí)數(shù)據(jù)倉庫和個(gè)人級(jí)數(shù)據(jù)倉庫中的哪一級(jí)數(shù)據(jù)倉庫。還需要了解系統(tǒng)預(yù)期使用的用戶群體是哪些、預(yù)期的用戶數(shù)量是多少、用戶在地理上的位置怎樣、是集中在一起還是分散在網(wǎng)絡(luò)的不同位置,然后需要了解建立數(shù)據(jù)倉庫的用途和功能。了解用戶想利用數(shù)據(jù)倉庫進(jìn)行哪些領(lǐng)域的工作,需要哪些功能,是簡(jiǎn)單的多維查詢,還是需要進(jìn)行多維分析,甚至是復(fù)雜的數(shù)據(jù)挖掘。了解現(xiàn)在進(jìn)行數(shù)據(jù)分析的工作人員是如何進(jìn)行工作的,他們的工作流程是怎樣的,在他們的工作過程中遇到了哪些比較棘手的問題和困難。2.了解信息系統(tǒng)需求在商業(yè)需求的基礎(chǔ)上,需要進(jìn)一步了解信息系統(tǒng)本身的需求。估算系統(tǒng)的數(shù)據(jù)量,了解數(shù)據(jù)的穩(wěn)定性。這是首當(dāng)其沖的工作。另外,元數(shù)據(jù)的維護(hù)要求也非常重要。如果元數(shù)據(jù)由專業(yè)的技術(shù)人員來維護(hù),則可以注重工具的效率;如果元數(shù)據(jù)由非專業(yè)的用戶群體來維護(hù),則可以注重工具表達(dá)的直觀性。還需要了解企業(yè)用戶現(xiàn)有的技術(shù)情況,比如企業(yè)現(xiàn)在經(jīng)常使用哪些工具進(jìn)行數(shù)據(jù)處理。在選擇工具時(shí),需要考慮選擇的工具是否能夠同用戶已經(jīng)使用習(xí)慣了的工具互通。3.工具功能評(píng)估在獲取上述需求后,應(yīng)當(dāng)對(duì)各大數(shù)據(jù)倉庫廠商的工具進(jìn)行客觀的功能評(píng)估。功能評(píng)估可能包括:系統(tǒng)結(jié)構(gòu)(操作系統(tǒng)平臺(tái)、系統(tǒng)的跨平臺(tái)性、系統(tǒng)的可靠性、安全性和系統(tǒng)備份恢復(fù)的能力等)、數(shù)據(jù)抽取能力(定時(shí)調(diào)度的能力、數(shù)據(jù)抽取的速率和數(shù)據(jù)轉(zhuǎn)化功能的強(qiáng)弱等)、數(shù)據(jù)存取呈現(xiàn)能力(支持多維查詢的能力、是否具有OLAP分析的功能和是否有良好的客戶界面等)、應(yīng)用支持(是否有良好應(yīng)用程序開發(fā)語言、數(shù)據(jù)庫對(duì)存儲(chǔ)過程的支持情況、系統(tǒng)提供的可重用軟件成分的多少和軟件的跨平臺(tái)性等)、用戶接口(用戶界面的美觀性和對(duì)Web平臺(tái)的支持情況)和工具的互操作性(數(shù)據(jù)庫、數(shù)據(jù)倉庫、OLAP分析、數(shù)據(jù)挖掘和前端展現(xiàn)工具間的互通情況)。4.工具組合和測(cè)試在對(duì)各種產(chǎn)品進(jìn)行客觀評(píng)價(jià)后,可以選擇某個(gè)廠商的產(chǎn)品或者選擇多個(gè)廠商產(chǎn)品的組合。在選定產(chǎn)品后還需要對(duì)產(chǎn)品進(jìn)行現(xiàn)場(chǎng)測(cè)試,看產(chǎn)品是否能夠滿足實(shí)際需求。需要特別注意的是數(shù)據(jù)倉庫將隨著時(shí)間的推移不斷增大。因此,我們?cè)谶M(jìn)行產(chǎn)品選擇和測(cè)試時(shí),必須對(duì)將來的情況進(jìn)行預(yù)測(cè)。對(duì)于數(shù)據(jù)挖掘工具,第11章介紹的5A模型具有很好的指導(dǎo)意義。5A模型認(rèn)為任何數(shù)據(jù)挖掘方法學(xué)都由5個(gè)基本元素組成,即Assess、Access、Analyze、Act和Automate。在選擇數(shù)據(jù)挖掘軟件產(chǎn)品時(shí),要注意某些軟件所采用的算法雖然名稱可能完全一樣,但它們的實(shí)現(xiàn)方法通常都不一樣。這些算法的不同影響了軟件對(duì)內(nèi)存和硬盤的需求不同及性能上的差異。1.2.5

SQLServer2005的商業(yè)智能構(gòu)架SQLServer2005相關(guān)的知識(shí)綜合起來有兩大體系,一是關(guān)于數(shù)據(jù)庫管理的,一是關(guān)于商業(yè)智能應(yīng)用的。不同的服務(wù)各司其職,共同完成數(shù)據(jù)管理和應(yīng)用的功能。把這些服務(wù)和相應(yīng)的程序分配到這兩大知識(shí)體系就是如圖1-9所示的樣子。圖1-9

SQLServer2005的兩大知識(shí)體系SQLServer2005在商業(yè)智能方面提供了三大服務(wù)和一個(gè)工具來實(shí)現(xiàn)系統(tǒng)的整合。三大服務(wù)是SQLServer2005AnalysisServices(SSAS)、SQLServer2005IntegrationServices(SSIS)和SQLServer2005ReportingServices(SSRS),一個(gè)工具是BusinessIntelligenceDevelopmentStudio。它們的關(guān)系如圖1-10所示。圖1-10

三大服務(wù)一個(gè)工具實(shí)現(xiàn)BI的體系圖從圖1-10中可以看出,三大服務(wù)都整合在BIStudio中,其中SSIS能從各種異構(gòu)數(shù)據(jù)源中整合BI需要的業(yè)務(wù)數(shù)據(jù),同時(shí)可以實(shí)現(xiàn)與商務(wù)流程統(tǒng)一。這項(xiàng)功能在以前是通過DTS服務(wù)(即數(shù)據(jù)轉(zhuǎn)換服務(wù))來實(shí)現(xiàn)的。SSAS是從數(shù)據(jù)中產(chǎn)生智能的關(guān)鍵,通過這種服務(wù),可以構(gòu)建數(shù)據(jù)立方(Cube),也就是多維數(shù)據(jù)集,然后進(jìn)行OLAP分析,SSAS也提供數(shù)據(jù)挖掘的功能。有了這種服務(wù)就能夠很容易找出隱藏在數(shù)據(jù)中的金礦。一個(gè)BI項(xiàng)目一般要為不同的人提供不同特點(diǎn)的報(bào)表,如總經(jīng)理和部門經(jīng)理對(duì)報(bào)表的內(nèi)容要求是完全不一樣的,SSRS服務(wù)為滿足這一要求提供了相應(yīng)的工具,通過它可以對(duì)分析結(jié)果提供類型多樣、美觀且適合不同需求的圖表和報(bào)表。通過以上體系結(jié)構(gòu)的設(shè)計(jì),SQLServer2005可以實(shí)現(xiàn)建模、ETL、建立查詢分析或圖表、定制KPI、建立報(bào)表和構(gòu)造數(shù)據(jù)挖掘應(yīng)用及發(fā)布等功能。1.3

部署商業(yè)智能企業(yè)要能維持競(jìng)爭(zhēng)優(yōu)勢(shì),持續(xù)改進(jìn)流程與精確的商業(yè)決策是相輔相成的兩把利劍。正確的信息才能引導(dǎo)合理而高效率的企業(yè)流程。商業(yè)智能系統(tǒng)致力于企業(yè)管理信息的即時(shí)獲取,使得企業(yè)管理者能將這些信息轉(zhuǎn)化為決策,從而實(shí)現(xiàn)經(jīng)營(yíng)目標(biāo)。商業(yè)智能系統(tǒng)可以在大多數(shù)企業(yè)經(jīng)營(yíng)管理領(lǐng)域起到重要的作用。1.3.1

商業(yè)智能如何協(xié)助企業(yè)管理高科技行銷泰斗麥肯納在其著作《即時(shí)行銷革命》中認(rèn)為,信息技術(shù)促使時(shí)間與空間瓦解,企業(yè)必須采用即時(shí)管理,以滿足客戶需求;而實(shí)現(xiàn)即時(shí)管理的企業(yè),又必須以獲得即時(shí)信息為根基。即時(shí)信息加工后成為企業(yè)經(jīng)營(yíng)的知識(shí),把知識(shí)進(jìn)一步與企業(yè)的經(jīng)營(yíng)目標(biāo)相結(jié)合,即可實(shí)現(xiàn)商業(yè)智能。商業(yè)智能主要通過4種方式協(xié)助企業(yè)管理。1.輔助目標(biāo)管理(ManagementByObjective,MBO)-個(gè)企業(yè)可能有上百個(gè)績(jī)效目標(biāo)?;跈M跨全企業(yè)的信息系統(tǒng),輔以擷取自外界的資料,商業(yè)智能系統(tǒng)能即時(shí)計(jì)算跨組織的績(jī)效目標(biāo),與同行業(yè)或工業(yè)標(biāo)準(zhǔn)相比較,便于企業(yè)了解自身的競(jìng)爭(zhēng)優(yōu)勢(shì)。2.輔助例外管理(ManagementByException)由于能即時(shí)而持續(xù)地計(jì)算各種績(jī)效目標(biāo),商業(yè)智能系統(tǒng)可監(jiān)測(cè)其與計(jì)劃目標(biāo)的偏差。當(dāng)偏差過大時(shí),系統(tǒng)立即以各種通信方式,比如電子郵件,來通知主管人員。例外管理可與工作流技術(shù)結(jié)合,進(jìn)一步使整個(gè)例外處理自動(dòng)化。3.輔助事實(shí)管理(ManagementByFact)無論目標(biāo)或例外,背后支持的力量都來自于事實(shí)。維持企業(yè)營(yíng)運(yùn)的ERP系統(tǒng)在每日的交易之中,累積了無數(shù)的事實(shí)與知識(shí)。商業(yè)智能系統(tǒng)將企業(yè)目標(biāo)與例外結(jié)合事實(shí),使主管得以進(jìn)一步分析原因或趨勢(shì),查詢并探測(cè)相關(guān)信息。4.智能協(xié)同管理(ManagementByIntelligentCooperation)它將企業(yè)外部資源和內(nèi)部資源的信息智能實(shí)時(shí)協(xié)同集成,輔助企業(yè)管理者不僅可以充分協(xié)同調(diào)度企業(yè)內(nèi)部資源,而且可以及時(shí)集成客戶和供應(yīng)商等變化信息,實(shí)現(xiàn)與客戶、供應(yīng)商及業(yè)務(wù)環(huán)境的協(xié)同同步和協(xié)同進(jìn)化。智能協(xié)同管理,將有效改善企業(yè)管理者之間及企業(yè)與環(huán)境之間的信息交流,改進(jìn)商務(wù)協(xié)作及決策的方式,從而有效地解決目前信息系統(tǒng)應(yīng)用中存在的諸多資源管理失調(diào)問題,輔助企業(yè)實(shí)現(xiàn)實(shí)時(shí)智能商務(wù)聯(lián)盟和智能協(xié)同決策,提高企業(yè)供應(yīng)鏈價(jià)值及企業(yè)綜合競(jìng)爭(zhēng)力。1.3.2

商業(yè)智能在各領(lǐng)域的應(yīng)用商業(yè)智能的應(yīng)用具有很強(qiáng)的普適性。只要一個(gè)企業(yè)積累了歷史數(shù)據(jù),并且有對(duì)這些數(shù)據(jù)進(jìn)行分析的需求,商業(yè)智能都有用武之地。下面列舉企業(yè)管理和客戶服務(wù)兩個(gè)典型的應(yīng)用領(lǐng)域。1.在企業(yè)管理中的應(yīng)用以生產(chǎn)制造企業(yè)為例,一般需要管理的領(lǐng)域包括庫存管理、采購管理、銷售管理、財(cái)務(wù)報(bào)表、賬務(wù)管理、應(yīng)收賬管理、應(yīng)付賬管理、工資核算、質(zhì)量管理和成本管理等。商業(yè)智能系統(tǒng)應(yīng)用于這類企業(yè)主要完成以下功能。1)銷售分析把握市場(chǎng)動(dòng)向,提高銷售利潤(rùn)是企業(yè)的最終目標(biāo)。在企業(yè)管理日趨科學(xué)化的今天,如何準(zhǔn)確及時(shí)地進(jìn)行生產(chǎn)經(jīng)營(yíng)決策是企業(yè)老總面臨的嚴(yán)峻問題。這要求決策者準(zhǔn)確及時(shí)地捕捉到銷售信息,分析銷售情況,隨時(shí)根據(jù)歷史的銷售情況,對(duì)下一步的生產(chǎn)經(jīng)營(yíng)科學(xué)地進(jìn)行決策。銷售分析需要的基礎(chǔ)數(shù)據(jù)涉及到的模塊有銷售、庫存、財(cái)務(wù)和人事,能夠圍繞銷售合同,從人員績(jī)效、應(yīng)收款、財(cái)務(wù)和庫存等多角度進(jìn)行分析,并給出如銷售趨勢(shì)和產(chǎn)品需求趨勢(shì)等輔助決策信息。商業(yè)智能系統(tǒng)根據(jù)企業(yè)需要解決的問題,幫助企業(yè)建立相應(yīng)的分析主題和分析指標(biāo),從業(yè)務(wù)系統(tǒng)的基礎(chǔ)數(shù)據(jù)庫中抽取需要的數(shù)據(jù),按預(yù)先建立的業(yè)務(wù)模型進(jìn)行分析決策。分析結(jié)果顯示直觀而形象,決策者只需要簡(jiǎn)單地點(diǎn)取操作,便可以從商業(yè)智能強(qiáng)大的銷售分析工具中獲得所需的決策信息。2)庫存分析良好的庫存管理是企業(yè)正常運(yùn)作的基礎(chǔ)之一。一方面保證生產(chǎn)所需原材料的及時(shí)供應(yīng),生產(chǎn)半成品的合理周轉(zhuǎn),另一方面保證產(chǎn)品銷售的及時(shí)供給。同時(shí)要求資金占用少,周轉(zhuǎn)快捷,即達(dá)到最優(yōu)庫存?;谏虡I(yè)智能系統(tǒng)構(gòu)建的庫存分析,既可滿足一般用戶對(duì)庫存物品的數(shù)量、庫存成本和資金占用進(jìn)行級(jí)別、類別、貨位、批次和單件等不同角度的查詢,又能輔助決策解決企業(yè)深層次的相關(guān)問題,如呆滯物品的分析和處理,根據(jù)盤點(diǎn)結(jié)果及時(shí)進(jìn)行庫存調(diào)整及優(yōu)化等。庫存分析的基礎(chǔ)數(shù)據(jù)取自于采購、銷售、生產(chǎn)和財(cái)務(wù)等業(yè)務(wù)模塊。3)采購分析生產(chǎn)原材料采購是企業(yè)生產(chǎn)的基礎(chǔ),采購物品的價(jià)格及質(zhì)量問題直接影響到產(chǎn)品的質(zhì)量與成本。采取正確的采購策略是企業(yè)不容忽視的問題,一個(gè)好的全面的采購分析對(duì)于領(lǐng)導(dǎo)制定下一步采購策略是至關(guān)重要的?;跀?shù)據(jù)倉庫技術(shù)的商業(yè)智能系統(tǒng)可實(shí)現(xiàn)供應(yīng)商信用評(píng)價(jià)和業(yè)務(wù)員業(yè)績(jī)考核等決策分析,幫助企業(yè)順利生產(chǎn)打下堅(jiān)實(shí)的基礎(chǔ),為最終產(chǎn)品在質(zhì)量和成本上的定位提供科學(xué)的依據(jù)。供應(yīng)商信用分析是采購分析很重要的一部分,往往作為采購分析的主題之一。采購分析的基礎(chǔ)數(shù)據(jù)來自財(cái)務(wù)、生產(chǎn)部門和庫存部門。商業(yè)智能的采購分析決策支持系統(tǒng)輔助企業(yè)選擇最佳的供應(yīng)商及采購策略,確保采購工作的高質(zhì)量、高效率和低成本。4)財(cái)務(wù)分析商業(yè)智能基于數(shù)據(jù)倉庫技術(shù)的財(cái)務(wù)分析能夠滿足企業(yè)領(lǐng)導(dǎo)對(duì)各業(yè)務(wù)部門費(fèi)用支出情況查詢的要求,并實(shí)現(xiàn)了對(duì)應(yīng)收款,應(yīng)付款的決策分析。企業(yè)決策層通過使用這一功能,進(jìn)一步提高從現(xiàn)金流量、資產(chǎn)負(fù)債和資金回收率等角度決策企業(yè)運(yùn)營(yíng)的科學(xué)化水平。商業(yè)智能可以進(jìn)行賬務(wù)分析、應(yīng)收賬分析和應(yīng)付款分析等各種財(cái)務(wù)方面的分析。5)成本分析成本分析的目的在于進(jìn)一步加強(qiáng)成本的事前控制,同時(shí)有助于通過盈虧平衡分析,輔助產(chǎn)品科學(xué)的報(bào)價(jià)。影響成本的因素有多種,相應(yīng)地也會(huì)有多種類型的發(fā)生費(fèi)用。企業(yè)關(guān)心這些費(fèi)用在總成本中的重要程度,尤其是管理費(fèi)用占總成本的比重,輔助發(fā)現(xiàn)生產(chǎn)與管理環(huán)節(jié)的不足,輔助決策改進(jìn)措施。商業(yè)智能的產(chǎn)品成本分析突出成本與庫存、生產(chǎn)和賬務(wù)等ERP功能模塊的集成。從成本BOM的分析出發(fā),對(duì)庫存管理和生產(chǎn)過程的發(fā)生費(fèi)用進(jìn)行監(jiān)控。并且,與銷售過程的發(fā)生費(fèi)用和銷售收入一起進(jìn)行量本利分析,并得出諸如保本成本、保本價(jià)格、目標(biāo)成本和目標(biāo)價(jià)格等決策信息,指導(dǎo)以后的成本控制和定價(jià)。6)人力資源規(guī)劃分析基于數(shù)據(jù)倉庫技術(shù)的商業(yè)智能系統(tǒng)解決方案提供的勞動(dòng)規(guī)劃應(yīng)用,應(yīng)在企業(yè)翔實(shí)的人力資源數(shù)據(jù)基礎(chǔ)之上,完成決策者多視角的人力資源統(tǒng)計(jì)分析,并通過對(duì)現(xiàn)有的人力資源的使用狀況,預(yù)測(cè)勞動(dòng)滿員和緊缺,分析超時(shí)和工作量,鑒別無效的工作和優(yōu)秀的雇員,計(jì)算出某段時(shí)間內(nèi)勞動(dòng)的收益率等,使勞動(dòng)資源得到最大的利用。商業(yè)智能的人力規(guī)劃分析也可以實(shí)現(xiàn)不同角度的員工工資查詢和分析,結(jié)合完成的工作量,提高員工利益分配的科學(xué)性。2.在客戶服務(wù)中的應(yīng)用現(xiàn)代商業(yè)競(jìng)爭(zhēng)越來越激烈,客戶群體越來越龐大,客戶對(duì)服務(wù)的要求也越來越高,因此客戶關(guān)系管理(CustomerRelationManagement,CRM)僅靠手工是難以完成的。由于不同企業(yè)的客戶群各不相同,客戶管理的內(nèi)容也千差萬別。商業(yè)智能應(yīng)用在客戶服務(wù)中可以進(jìn)行7個(gè)方面的分析,即Sybase提出的“7P”,具體內(nèi)容如下。l

客戶概況分析(Profiling):包括客戶的層次、風(fēng)險(xiǎn)、愛好和習(xí)慣等。l

客戶忠誠度分析(Persistency):指客戶對(duì)某個(gè)產(chǎn)品或商業(yè)機(jī)構(gòu)的忠實(shí)程度、持久性和變動(dòng)情況等。l

客戶利潤(rùn)分析(Profitability):指不同客戶所消費(fèi)的產(chǎn)品的邊緣利潤(rùn)、總利潤(rùn)額和凈利潤(rùn)等。l

客戶性能分析(Performance):指不同客戶所消費(fèi)的產(chǎn)品按種類、渠道和銷售地點(diǎn)等指標(biāo)劃分的銷售額。l

客戶未來分析(Prospecting):包括客戶數(shù)量及類別等情況的未來發(fā)展趨勢(shì)和爭(zhēng)取客戶的手段等。l

客戶產(chǎn)品分析(Product):包括產(chǎn)品設(shè)計(jì)、關(guān)聯(lián)性和供應(yīng)鏈等。l

客戶促銷分析(Promotion):包括廣告和宣傳等促銷活動(dòng)的管理。以上是兩個(gè)商業(yè)智能應(yīng)用得比較廣泛的領(lǐng)域。其實(shí)在不同的行業(yè)中,商業(yè)智能的應(yīng)用都有很重要的價(jià)值。例如在保險(xiǎn)業(yè)中,可以使用BI進(jìn)行關(guān)鍵業(yè)務(wù)指標(biāo)分析、業(yè)績(jī)分析、財(cái)務(wù)分析、市場(chǎng)分析、重要險(xiǎn)種分析、重大事件分析、即席分析、風(fēng)險(xiǎn)評(píng)估、業(yè)務(wù)預(yù)測(cè)、風(fēng)險(xiǎn)告警和風(fēng)險(xiǎn)預(yù)測(cè)等;在證券業(yè)可以進(jìn)行客戶分析、賬戶分析、證券交易數(shù)據(jù)分析和非資金交易分析等。下面從具體應(yīng)用的角度講解幾個(gè)商業(yè)智能的實(shí)例。1.3.3

商業(yè)智能應(yīng)用實(shí)例這一節(jié)將列舉某電信無線市話分析項(xiàng)目、某商委決策支持系統(tǒng)和AdventureWorksCycle公司BI應(yīng)用3個(gè)商業(yè)智能應(yīng)用的實(shí)例。其中前兩個(gè)來源于實(shí)際項(xiàng)目,第3個(gè)是本書后面將要構(gòu)建的項(xiàng)目。這里的實(shí)例不涉及到技術(shù),主要是通過它們來更透徹地理解商業(yè)智能運(yùn)用的方法、過程和商業(yè)效果。1.某電信無線市話分析項(xiàng)目此公司是一家大型電信企業(yè),下屬超過20家分公司。無線市話事業(yè)部即小靈通業(yè)務(wù)部,目前用戶共140萬左右,每天產(chǎn)生的話務(wù)量在800萬條左右?,F(xiàn)行業(yè)務(wù)系統(tǒng)運(yùn)行非常良好,并在各個(gè)部門廣泛使用,現(xiàn)行系統(tǒng)主要存在查詢速度慢,而且在查詢的過程影響業(yè)務(wù)系統(tǒng)的處理性能。在統(tǒng)計(jì)分析中,也沒有整個(gè)業(yè)務(wù)系統(tǒng)數(shù)據(jù)的統(tǒng)計(jì)分析報(bào)表。業(yè)務(wù)數(shù)據(jù)若能更好地進(jìn)行查詢和分析,便有利于各個(gè)決策部門做出更好的市場(chǎng)決策,有利于商業(yè)智能項(xiàng)目的開展。這是一個(gè)較大的商業(yè)智能項(xiàng)目,因此下面以彩鈴增值業(yè)務(wù)分析和用戶消費(fèi)情況分析兩個(gè)主題為例來說明商業(yè)智能在無線市話分析過程中的相關(guān)應(yīng)用。1)彩鈴增值業(yè)務(wù)分析該主題主要分析不同類型用戶的彩鈴使用習(xí)慣及相應(yīng)的人數(shù)。主要分析彩鈴使用金額、彩鈴定制金額和總費(fèi)用等指標(biāo)。系統(tǒng)的用戶能夠得到按各分類條件任意組合各分析指標(biāo)的數(shù)據(jù)和報(bào)表。圖1-11是這個(gè)分析主題的分析視圖。圖1-11

彩鈴分析視圖由圖1-11可知,對(duì)于系統(tǒng)的用戶可以從多個(gè)視角對(duì)彩鈴增值業(yè)務(wù)進(jìn)行分析,如時(shí)間段、用戶價(jià)格計(jì)劃、用戶開戶時(shí)間和號(hào)碼屬性等。這就是商業(yè)智能系統(tǒng)提供的的多維分析功能。2)用戶消費(fèi)情況分析該主題主要分析不同類型用戶的充值習(xí)慣和欠費(fèi)情況,以及相應(yīng)的用戶數(shù)量。主要分析充值金額、用戶個(gè)數(shù)、充值時(shí)間間隔、使用時(shí)長(zhǎng)、上次充值金額、上次充值時(shí)間、欠費(fèi)用戶數(shù)和欠費(fèi)金額等指標(biāo)。圖1-12是與此主題對(duì)應(yīng)的分析視圖。從圖中可以發(fā)現(xiàn),系統(tǒng)的用戶可以按日期和用戶所屬地區(qū)等多個(gè)角度選擇分析的對(duì)象。圖1-12

用戶消費(fèi)情況分析視圖2.某商委決策支持系統(tǒng)這是一個(gè)大型電子政務(wù)系統(tǒng)的一個(gè)子系統(tǒng)。決策支持系統(tǒng)作為支撐電子政務(wù)的核心系統(tǒng),通過對(duì)政務(wù)數(shù)據(jù)進(jìn)行定性分析和定量分析,為各級(jí)管理決策人員提供全面、準(zhǔn)確和快捷的決策信息,對(duì)政府的相關(guān)業(yè)務(wù)起到事前決策、事中控制和事后反映的作用。電子政務(wù)的決策支持系統(tǒng)是政府從經(jīng)驗(yàn)型管理向科學(xué)型管理轉(zhuǎn)變的一個(gè)過程,是建立在其他所有應(yīng)用系統(tǒng)之上的分析管理系統(tǒng),是要充分利用各種數(shù)據(jù)和信息,對(duì)復(fù)雜的、動(dòng)態(tài)的社會(huì)環(huán)境做出及時(shí)的響應(yīng)的系統(tǒng)。此系統(tǒng)以數(shù)據(jù)倉庫與模型庫一起支撐OLAP分析,如圖1-13所示是該系統(tǒng)的方案示意圖。圖1-13

商委決策支持系統(tǒng)方案圖此改進(jìn)方案主要包括數(shù)據(jù)采集、數(shù)據(jù)倉庫、OLAP數(shù)據(jù)分析模塊和OLAP數(shù)據(jù)導(dǎo)航平臺(tái)4部分,是圖1-8所示的BI解決方案的體系結(jié)構(gòu)的典型應(yīng)用。不過為了能支持決策,該方案在OLAP分析方面進(jìn)行了擴(kuò)展,采用數(shù)據(jù)倉庫和模型庫一起支撐分析,數(shù)據(jù)倉庫和模型庫相互支撐,在數(shù)據(jù)分析方面將提供更加強(qiáng)大的功能。圖1-14是使用這個(gè)系統(tǒng)進(jìn)行分析時(shí)的操作界面。圖1-14

商委決策支持系統(tǒng)OLAP操作頁面可以看到,此系統(tǒng)通過報(bào)表和圖形兩種方式共同表現(xiàn)多維數(shù)據(jù)集,可以通過系統(tǒng)提供的工具欄對(duì)分析的視角進(jìn)行添加和刪除操作,也可以把分析結(jié)果導(dǎo)出為Excel格式。這種靈活的報(bào)表形式是傳統(tǒng)業(yè)務(wù)系統(tǒng)所無法企及的。3.AdventureWorks項(xiàng)目的前端展現(xiàn)效果商業(yè)智能系統(tǒng)的構(gòu)建是基于歷史數(shù)據(jù)庫的,本書后面將以FoodMart數(shù)據(jù)庫和AdventureWorks數(shù)據(jù)庫為基礎(chǔ)創(chuàng)建商業(yè)智能系統(tǒng)。下面展示的是在微軟示例數(shù)據(jù)庫AdventureWorks基礎(chǔ)上構(gòu)建數(shù)據(jù)倉庫,然后進(jìn)行多維分析,進(jìn)而從數(shù)據(jù)中獲取智能的分析界面。圖1-15是使用BI前端展現(xiàn)工具來對(duì)數(shù)據(jù)庫中各種商務(wù)數(shù)據(jù)進(jìn)行分析的界面。從圖中可以看到,它類似于傳統(tǒng)的靜態(tài)報(bào)表,但是也有十分明顯的區(qū)別。首先在圖1-15的分析中,數(shù)據(jù)表不是二維的,而是有3個(gè)維度,分別是產(chǎn)品目錄、銷售渠道和銷售時(shí)間,衡量產(chǎn)品成本和總的銷售量可以在這3個(gè)維度中任意選擇和變化,通過這樣的報(bào)表,業(yè)務(wù)人員看到的就是立體的、可變化的數(shù)據(jù),而不是平面的固定數(shù)據(jù)。另一方面,這里不同的維度是可以更改不同的聚合程度的,比如時(shí)間的角度,可以看到從銷售日到銷售年度的任意時(shí)間層面的統(tǒng)計(jì)數(shù)據(jù),在商業(yè)智能分析中,從高聚合到低聚合的操作稱為下鉆,反之稱為上鉆。還有一個(gè)很重要的特點(diǎn),在BI系統(tǒng)中,可以把一些管理上的思想方法在技術(shù)上進(jìn)行實(shí)現(xiàn)。在圖1-15中,用可視化的形式表達(dá)出了KPI的趨勢(shì),而且可以隨著數(shù)據(jù)的上鉆和下鉆看到各個(gè)層次的KPI,實(shí)現(xiàn)了對(duì)企業(yè)關(guān)鍵性能指標(biāo)的全方位監(jiān)控。圖1-15展示出來的效果必須在后臺(tái)有數(shù)據(jù)倉庫的支持,傳統(tǒng)數(shù)據(jù)庫就不能很好地達(dá)到多維分析的目的。在構(gòu)建數(shù)據(jù)倉庫過程中,有很多技術(shù)細(xì)節(jié)需要處理,比如怎樣把業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換成數(shù)據(jù)倉庫中的數(shù)據(jù),怎樣實(shí)現(xiàn)數(shù)據(jù)倉庫數(shù)據(jù)對(duì)于用戶的友好性,怎樣設(shè)計(jì)分析的層次等。當(dāng)然還有一個(gè)最直觀的問題就是怎樣展現(xiàn)數(shù)據(jù)。所有這些內(nèi)容都將在本書后面一一講述。這個(gè)前端展現(xiàn)效果的獲得將在10.5節(jié)“用專業(yè)前端展現(xiàn)工具呈現(xiàn)商業(yè)信息”中有進(jìn)行相應(yīng)的說明。圖1-15

AdventureWorks項(xiàng)目的前端展現(xiàn)效果第2章構(gòu)建簡(jiǎn)單的BI應(yīng)用:福馬特商業(yè)智能系統(tǒng)這一章總體上說是實(shí)踐上“務(wù)虛”,理論上“務(wù)實(shí)”。對(duì)商業(yè)智能的各個(gè)方面進(jìn)行了“鳥瞰”,特別是明確了實(shí)現(xiàn)商業(yè)智能所需要的各種技術(shù)及其相互關(guān)系,這一關(guān)系將成為本書構(gòu)建基于SQLServer2005BI平臺(tái)的商業(yè)智能和數(shù)據(jù)挖掘理論及實(shí)踐體系的框架。2.1

設(shè)計(jì)和創(chuàng)建數(shù)據(jù)倉庫FoodMart數(shù)據(jù)庫涉及到公司經(jīng)營(yíng)的各個(gè)方面,包括產(chǎn)品、庫存、人事、客戶和銷售等。一個(gè)真正的商業(yè)智能應(yīng)用應(yīng)該對(duì)這些業(yè)務(wù)需求進(jìn)行全面地考慮。本章截取這些需求中的銷售部分構(gòu)建商業(yè)智能。2.1.1

原始業(yè)務(wù)數(shù)據(jù)分析打開配套文件中附帶的foodmart.mdb文件,可以看到如圖2-1所示的24張表,雖然以前在設(shè)計(jì)這個(gè)數(shù)據(jù)庫的時(shí)候加入了數(shù)據(jù)倉庫的某些特點(diǎn),但由于它本身源于以前的系統(tǒng),也存儲(chǔ)了全部的業(yè)務(wù)數(shù)據(jù),因此這里作為初學(xué)可以把它理解為福馬特商店的原始數(shù)據(jù)。在這個(gè)數(shù)據(jù)庫中,包含了福馬特商店日常經(jīng)營(yíng)業(yè)務(wù)的數(shù)據(jù),如人事管理中的員工信息存儲(chǔ)在employee表中,員工所屬部門信息存儲(chǔ)在department表中,職務(wù)信息則存儲(chǔ)在position表中,庫存管理業(yè)務(wù)中的倉庫類型存儲(chǔ)在warehouse_class表中,具體的倉庫存儲(chǔ)在warehouse中。圖2-1

福馬特商店的業(yè)務(wù)數(shù)據(jù)2.1.2

設(shè)計(jì)數(shù)據(jù)倉庫邏輯模型福馬特市場(chǎng)部的商務(wù)需求是要對(duì)1998年進(jìn)行的所有銷售業(yè)務(wù)數(shù)據(jù)進(jìn)行多角度分析,以便市場(chǎng)分析人員能在查詢數(shù)據(jù)庫時(shí)獲取快速的響應(yīng),高層管理人員也能從總體上把握影響本年度銷售的因素。這需要利用存儲(chǔ)在公司業(yè)務(wù)數(shù)據(jù)庫中的數(shù)據(jù),建立數(shù)據(jù)倉庫,進(jìn)而創(chuàng)建可用于分析的多維數(shù)據(jù)結(jié)構(gòu)。如前所述,這里只著眼于銷售方面的數(shù)據(jù),因而把與銷售相關(guān)的表提煉出來進(jìn)行分析。在foodmart.mdb數(shù)據(jù)庫中,銷售業(yè)務(wù)的數(shù)據(jù)和時(shí)間、促銷手段、產(chǎn)品和店鋪等都有關(guān)系,它們的關(guān)系體現(xiàn)在表與表之間的邏輯關(guān)系上。要從業(yè)務(wù)數(shù)據(jù)出發(fā)設(shè)計(jì)數(shù)據(jù)倉庫的結(jié)構(gòu),必須明確業(yè)務(wù)數(shù)據(jù)本身的結(jié)構(gòu),而業(yè)務(wù)數(shù)據(jù)的關(guān)系一般是基于關(guān)系數(shù)據(jù)庫設(shè)計(jì)的范式。數(shù)據(jù)倉庫中表的關(guān)系不受關(guān)系數(shù)據(jù)庫設(shè)計(jì)范式的約束,但也要遵循一定的結(jié)構(gòu)規(guī)范,如星形結(jié)構(gòu)和雪花形結(jié)構(gòu)即是這種類型的規(guī)范。同時(shí)這也是數(shù)據(jù)倉庫邏輯結(jié)構(gòu)的兩種類型。關(guān)于數(shù)據(jù)庫和數(shù)據(jù)倉庫邏輯結(jié)構(gòu)設(shè)計(jì)的異同將在第3章講解。這里希望用雪花形結(jié)構(gòu)來構(gòu)建福馬特商店的銷售數(shù)據(jù)倉庫,邏輯結(jié)構(gòu)設(shè)計(jì)圖如圖2-2所示。圖2-2

銷售數(shù)據(jù)倉庫雪花形結(jié)構(gòu)設(shè)計(jì)圖在數(shù)據(jù)倉庫的邏輯結(jié)構(gòu)中,數(shù)據(jù)表可以劃分為兩類:一類是事實(shí)數(shù)據(jù)表(簡(jiǎn)稱為“事實(shí)表”),用來存儲(chǔ)數(shù)據(jù)倉庫中的實(shí)際數(shù)據(jù),如這里存儲(chǔ)1998年銷售數(shù)據(jù)的sales_fact_1998表即為事實(shí)表;另一類是維度數(shù)據(jù)表(簡(jiǎn)稱為“維度表”),用來存儲(chǔ)數(shù)據(jù)倉庫中的維度數(shù)據(jù),如這里的關(guān)于時(shí)間、促銷手段和產(chǎn)品等分析要素的表均為維度表。關(guān)于事實(shí)表和維度表的具體知識(shí)也在第3章學(xué)習(xí)。注意,在本例中設(shè)計(jì)的維度表和事實(shí)表與原始數(shù)據(jù)中的表名及結(jié)構(gòu)都一致,這主要是由原始數(shù)據(jù)的特點(diǎn)和本章作為入門章節(jié)的定位決定的。在實(shí)際設(shè)計(jì)的時(shí)候,通常需要根據(jù)需求情況重新建立與原始數(shù)據(jù)不同的表結(jié)構(gòu)。這主要是由于傳統(tǒng)業(yè)務(wù)的數(shù)據(jù)庫是用來進(jìn)行事務(wù)處理的(即OLTP),而數(shù)據(jù)倉庫則是用來進(jìn)行分析處理的(即OLAP),用途的不同決定了其結(jié)構(gòu)的不同。這一點(diǎn)在以后復(fù)雜的數(shù)據(jù)倉庫設(shè)計(jì)中會(huì)通過示例體現(xiàn)出來。2.1.3

創(chuàng)建foodmartsaleDW數(shù)據(jù)倉庫數(shù)據(jù)倉庫也是一種數(shù)據(jù)庫,其管理同樣是通過數(shù)據(jù)庫管理系統(tǒng)(DBMS)來進(jìn)行的。因此數(shù)據(jù)倉庫可以像普通數(shù)據(jù)庫一樣進(jìn)行創(chuàng)建、修改和刪除。當(dāng)數(shù)據(jù)倉庫的邏輯結(jié)構(gòu)設(shè)計(jì)完后,就可以創(chuàng)建物理數(shù)據(jù)倉庫了。這時(shí)可以在SQLServerManagementStudio中按照一般的建立數(shù)據(jù)庫的方法建立一個(gè)名為“foodmartsaleDW”的數(shù)據(jù)庫,然后把這里設(shè)計(jì)的表創(chuàng)建好,數(shù)據(jù)類型依據(jù)原始數(shù)據(jù)庫中的各個(gè)表和字段的數(shù)據(jù)類型設(shè)置。具體操作方法可以參閱本書的姊妹篇《SQLServer2005數(shù)據(jù)庫管理與應(yīng)用高手修煉指南》。但由于這里數(shù)據(jù)倉庫的表結(jié)構(gòu)與原始數(shù)據(jù)庫中的表結(jié)構(gòu)基本一致,因此,創(chuàng)建foodmartsaleDW數(shù)據(jù)倉庫的物理結(jié)構(gòu)過程也可以在ETL階段完成。2.2

設(shè)計(jì)和使用ETL數(shù)據(jù)倉庫的設(shè)計(jì)可以說是數(shù)據(jù)分析和商業(yè)智能的最基礎(chǔ)的工作。良好的數(shù)據(jù)倉庫結(jié)構(gòu)設(shè)計(jì)是以后工作能順利進(jìn)行的保證。而數(shù)據(jù)倉庫中的數(shù)據(jù)則一般要經(jīng)過“提?。D(zhuǎn)換-加載”的過程從原始業(yè)務(wù)數(shù)據(jù)中獲取,這就是ETL過程。這里的任務(wù)就是要把數(shù)據(jù)從foodmart.mdb數(shù)據(jù)庫中裝載到foodmartsaleDW數(shù)據(jù)倉庫中。需要使用到SQLServerIntegrationServices服務(wù),即SSIS,其操作步驟如下。(1)打開BusinessIntelligenceDevelopmentStudio,選擇【文件】→【新建】→【項(xiàng)目】命令,彈出“新建項(xiàng)目”對(duì)話框,展開“商業(yè)智能項(xiàng)目”,在“模板”窗格中,單擊“IntegrationServices項(xiàng)目”,把項(xiàng)目命名為“foodmartsaleETL”,如圖2-3所示。圖2-3

創(chuàng)建“foodmartsaleETL”項(xiàng)目這時(shí)會(huì)在BIStudio環(huán)境中打開用于設(shè)計(jì)SSIS的各種工具和窗口,數(shù)據(jù)提取、轉(zhuǎn)換和加載的操作都在這個(gè)界面下進(jìn)行。(2)選擇【項(xiàng)目】→【SSIS導(dǎo)入和導(dǎo)出向?qū)А棵?,這時(shí)會(huì)彈出SSIS導(dǎo)入和導(dǎo)出向?qū)У臍g迎界面,單擊【下一步】按鈕。(3)在“選擇數(shù)據(jù)源”窗口中的“數(shù)據(jù)源”下拉列表框中選擇Access數(shù)據(jù)源選項(xiàng),如圖2-4所示。然后在路徑選擇中選擇此項(xiàng)目文件夾中的foodmart2000.mdb文件。圖2-4

選擇foodmart2000.mdb數(shù)據(jù)源(4)在隨即彈出的窗口中選擇數(shù)據(jù)的導(dǎo)出目標(biāo),這里選擇“SQLNativeClient”,如圖2-5所示。設(shè)置好服務(wù)器及其登錄信息后,選擇foodmartsaleDW數(shù)據(jù)倉庫作為目標(biāo)數(shù)據(jù)庫,如果在以前的步驟中沒有創(chuàng)建此數(shù)據(jù)庫,可以在此窗口中單擊【新建】按鈕,在彈出的“創(chuàng)建數(shù)據(jù)庫”窗口中創(chuàng)建此數(shù)據(jù)庫,單擊【下一步】按鈕繼續(xù)。圖2-5

選擇數(shù)據(jù)倉庫目標(biāo)(5)此時(shí)將彈出如圖2-6所示的窗口,通過這個(gè)窗口可以選擇需要復(fù)制的是數(shù)據(jù)源的多個(gè)表和視圖,還是自定義的查詢,這里選擇“復(fù)制一個(gè)或多個(gè)表或視圖的數(shù)據(jù)”單選按鈕;單擊【下一步】按鈕繼續(xù)。圖2-6

指定復(fù)制類型(6)這時(shí)會(huì)讓用戶選擇源表和源視圖,如圖2-7所示。按照前面對(duì)數(shù)據(jù)倉庫的設(shè)計(jì),這里選擇原始表中的time_by_day、promotion、product、product_class、customer、store和sales_fact_1998表作為需要輸入的表。這里對(duì)原始表中需要導(dǎo)入到數(shù)據(jù)倉庫的數(shù)據(jù)有很強(qiáng)的可定制性,對(duì)這些已經(jīng)選擇的表中的字段還可以進(jìn)行篩選和改變,對(duì)不需要的字段進(jìn)行去除操作,這就是所謂的數(shù)據(jù)清洗。當(dāng)然也可以選擇其他的表一起導(dǎo)入數(shù)據(jù)倉庫中??梢钥吹?,不一定所有的業(yè)務(wù)數(shù)據(jù)庫中的數(shù)據(jù)都必須體現(xiàn)在數(shù)據(jù)倉庫中,數(shù)據(jù)倉庫中的數(shù)據(jù)也有可能是經(jīng)過業(yè)務(wù)數(shù)據(jù)庫中的數(shù)據(jù)運(yùn)算而得到的,這都取決于具體商務(wù)活動(dòng)的需求。在圖2-7的界面中,還可以對(duì)數(shù)據(jù)導(dǎo)入的目標(biāo)進(jìn)行定制,可以對(duì)映射方式進(jìn)行編輯,甚至可以自己寫“CREATETABLE”語句作為復(fù)制的目標(biāo)表。這些改變都可以體現(xiàn)在數(shù)據(jù)倉庫的物理結(jié)構(gòu)中。圖2-7

選擇源表和源視圖并定制映射方式這里不對(duì)映射及其目標(biāo)進(jìn)行變更,保持默認(rèn)的狀態(tài),使生成的數(shù)據(jù)倉庫的物理模型完全符合前面對(duì)數(shù)據(jù)倉庫的邏輯模型的設(shè)計(jì)。(7)以上操作完成后,單擊【下一步】按鈕,系統(tǒng)將會(huì)把前面的操作列表并要求用戶確認(rèn),并提示將會(huì)把包以“Package1.dtsx”作為文件名保存在項(xiàng)目文件夾下面,而且不會(huì)立即執(zhí)行。確認(rèn)無誤后單擊【完成】按鈕。(8)在“解決方案資源管理器”中展開“SSIS包”文件夾,在Package1.dtsx上單擊鼠標(biāo)右鍵,在彈出的快捷菜單中選擇【設(shè)為啟動(dòng)對(duì)象】命令,如圖2-8所示。(9)單擊工具條上的

按鈕運(yùn)行這個(gè)工程,可以發(fā)現(xiàn)在SSIS設(shè)計(jì)界面的“控制流”和“數(shù)據(jù)流”等選項(xiàng)卡內(nèi)都有對(duì)象在活動(dòng),這是系統(tǒng)正在把數(shù)據(jù)從foodmart2000.mdb數(shù)據(jù)庫中按照前面所確定的規(guī)則裝載入foodmartsaleDW數(shù)據(jù)倉庫中。(10)數(shù)據(jù)裝載過程完成后,切換到SQLServerManagementStudio,展開foodmartsaleDW數(shù)據(jù)倉庫可以發(fā)現(xiàn),已經(jīng)按照設(shè)計(jì)要求建立好了數(shù)據(jù)倉庫,并且倉庫中已經(jīng)存儲(chǔ)了業(yè)務(wù)數(shù)據(jù),如圖2-9所示。

圖2-8

設(shè)置Package1.dtsx為啟動(dòng)對(duì)象

圖2-9

完成數(shù)據(jù)裝載后的foodmartsaleDW數(shù)據(jù)倉庫2.3

創(chuàng)建OLAP數(shù)據(jù)立方設(shè)計(jì)好了結(jié)構(gòu)良好的數(shù)據(jù)倉庫,并且將需要分析的業(yè)務(wù)數(shù)據(jù)裝載到了數(shù)據(jù)倉庫中之后,就為滿足商務(wù)決策的全方位需求打下了根基,以后的操作都是基于這些擁有數(shù)據(jù)的數(shù)據(jù)倉庫進(jìn)行的。但是,對(duì)數(shù)據(jù)的多維分析卻并不是主要針對(duì)數(shù)據(jù)倉庫,而是針對(duì)從數(shù)據(jù)倉庫中提取的子集,如數(shù)據(jù)集市和多維數(shù)據(jù)集(也稱為數(shù)據(jù)立方)。因此通常還需要在具體分析數(shù)據(jù)之前創(chuàng)建數(shù)據(jù)立方。數(shù)據(jù)立方的創(chuàng)建和管理需要用到SQLServer2005中BusinessIntelligenceDevelopmentStudio的AnalysisServices組件,即SSAS。這里將創(chuàng)建用于福馬特商店銷售分析的數(shù)據(jù)立方,首先要?jiǎng)?chuàng)建一個(gè)SSAS的項(xiàng)目。打開BusinessIntelligenceDevelopmentStudio,選擇【文件】→【新建】→【項(xiàng)目】命令,或按【Ctrl+Shift+N】組合鍵以顯示“新建項(xiàng)目”對(duì)話框。在“新建項(xiàng)目”對(duì)話框中,從“項(xiàng)目類型”選項(xiàng)組中選擇“商業(yè)智能項(xiàng)目”。從“VisualStudio已安裝的模板”選項(xiàng)組中選擇“AnalysisServices項(xiàng)目”。在“名稱”文本框中輸入“foodmartsaleAS”作為項(xiàng)目名稱,如圖2-10所示。單擊【確定】按鈕進(jìn)入SSAS的工作界面。、55鬧翻天圖2-10

建立foodmartsaleAS項(xiàng)目打開“解決方案資源管理器”,可以看到數(shù)據(jù)源、數(shù)據(jù)源視圖、多維數(shù)據(jù)集、維度和挖掘結(jié)構(gòu)等8個(gè)文件夾對(duì)象,建立和管理數(shù)據(jù)立方也是主要針對(duì)這8個(gè)對(duì)象進(jìn)行的。下面介紹創(chuàng)建數(shù)據(jù)立方的步驟。2.3.1

定義數(shù)據(jù)源這是創(chuàng)建數(shù)據(jù)立方的第1步。在“解決方案資源管理器”中的“數(shù)據(jù)源”文件夾上單擊鼠標(biāo)右鍵,在彈出的快捷菜單中選擇【新建數(shù)據(jù)源】命令,如圖2-11所示。圖2-11

新建數(shù)據(jù)源在彈出的“選擇如何定義連接”窗口中選擇“基于現(xiàn)有連接或新連接創(chuàng)建數(shù)據(jù)源”單選按鈕,在“數(shù)據(jù)連接”列表框中選擇foodmartsaleDW數(shù)據(jù)源,如果沒有此連接,可以單擊【新建】按鈕,定義指向foodmartsaleDW數(shù)據(jù)倉庫的連接。設(shè)置完成后的頁面如圖2-12所示。由于向?qū)旅娴牟僮魇菦]有必要的,所以這里可以直接單擊【完成】按鈕結(jié)束數(shù)據(jù)源向?qū)?。圖2-12

定義數(shù)據(jù)連接2.3.2

定義數(shù)據(jù)源視圖數(shù)據(jù)源提供與數(shù)據(jù)庫的簡(jiǎn)單連接,但更多高級(jí)功能,如緩存元數(shù)據(jù)、添加關(guān)系、創(chuàng)建計(jì)算和設(shè)置邏輯鍵等還需要使用數(shù)據(jù)源視圖來完成。為了對(duì)多維數(shù)據(jù)集進(jìn)行這些高級(jí)操作,這一步定義數(shù)據(jù)源視圖??梢栽凇皵?shù)據(jù)源視圖”文件夾對(duì)象上單擊鼠標(biāo)右鍵,在彈出的快捷菜單中選擇【新建數(shù)據(jù)源視圖】命令,然后在彈出的“數(shù)據(jù)源視圖向?qū)А贝翱谥羞x擇foodmartsaleDW選項(xiàng)作為關(guān)系數(shù)據(jù)源,單擊【下一步】按鈕。這時(shí)會(huì)彈出如圖2-13所示的“名稱匹配”窗口,其原因是在前面SSIS的數(shù)據(jù)裝載操作中沒有為數(shù)據(jù)倉庫中的表設(shè)置主鍵及其關(guān)系,SSAS試圖在匹配的列上創(chuàng)建邏輯關(guān)系,可以選擇“與主鍵同名”單選按鈕,單擊【下一步】按鈕繼續(xù)。圖2-13

設(shè)置名稱匹配這時(shí)進(jìn)入“選擇表和視圖”窗口,如圖2-14所示??梢詮倪x定的數(shù)據(jù)源提供的對(duì)象列表中選擇表和視圖。這里主要的商務(wù)需求是對(duì)銷售數(shù)據(jù)進(jìn)行分析,所以可以把相關(guān)的數(shù)據(jù)表都選入數(shù)據(jù)源視圖,對(duì)數(shù)據(jù)源中與分析需求關(guān)聯(lián)不大的要素也可以不選入此分析視圖,例如此處的region表可以不用選入數(shù)據(jù)源視圖。以上操作完成后,單擊【下一步】按鈕,為此數(shù)據(jù)源視圖命名為Vfoodmartsale,再單擊【完成】按鈕結(jié)束此向?qū)АD2-14

選擇表和視圖同樣也是由于數(shù)據(jù)源中的表沒有設(shè)置主鍵的原因,現(xiàn)在打開的數(shù)據(jù)源視圖上的表都是獨(dú)立的,相互之間沒有關(guān)系,還需要我們?cè)O(shè)置各個(gè)表的主鍵及其關(guān)系才能成為可用的視圖。一般來說,事實(shí)表是沒有主鍵的,而維度表都有主鍵,且每一個(gè)維度表的主鍵都是事實(shí)表的外鍵,因而,需要為每一個(gè)維度表設(shè)置主鍵,如圖2-15所示,在維度表中選擇應(yīng)該為主鍵的字段,然后單擊鼠標(biāo)右鍵,在彈出的快捷菜單中選擇【設(shè)置邏輯主鍵】命令,即可設(shè)置維度表的主鍵。圖2-15

設(shè)置維度表的主鍵對(duì)每一個(gè)維度表設(shè)置好主鍵后,應(yīng)該設(shè)置維度表和事實(shí)表之間的關(guān)系,方法是把事實(shí)表中的外鍵作為源,拖動(dòng)到維度表中的相關(guān)字段,這時(shí)會(huì)彈出“創(chuàng)建關(guān)系”窗口,如圖2-16所示。需要注意的是一定要把外鍵表作為源,主鍵表作為目標(biāo),如果方向錯(cuò)了,可以單擊圖2-16的【反向】按鈕以保證其關(guān)系符合業(yè)務(wù)數(shù)據(jù)中的邏輯關(guān)系。圖2-16“創(chuàng)建關(guān)系”對(duì)話框按照以上的步驟,設(shè)置好維度表和事實(shí)表之間的關(guān)系后,數(shù)據(jù)源視圖將會(huì)如圖2-17所示。圖2-17

設(shè)置好表間關(guān)系后的數(shù)據(jù)源視圖2.3.3

生成多維數(shù)據(jù)集這一步在上面創(chuàng)建的數(shù)據(jù)源視圖的基礎(chǔ)上生成多維數(shù)據(jù)集,方法如下。(1)在“解決方案資源管理器”中用鼠標(biāo)右鍵單擊“多維數(shù)據(jù)集”文件夾對(duì)象,在彈出的快捷菜單中選擇【新建多維數(shù)據(jù)集】命令。(2)在彈出的“多維數(shù)據(jù)集向?qū)А睔g迎界面中單擊【下一步】按鈕進(jìn)入“選擇生成方法”窗口,如圖2-18所示。在此窗口中選擇“使用數(shù)據(jù)源生成多維數(shù)據(jù)集”單選按鈕,并且確認(rèn)選中了“自動(dòng)生成”復(fù)選框,并在下拉列表框中選擇“創(chuàng)建屬性和層次結(jié)構(gòu)”選項(xiàng),以便向?qū)転榫S度表中的大多數(shù)列創(chuàng)建屬性,并嘗試建立包含多級(jí)的層次結(jié)構(gòu)。圖2-18“選擇生成方法”窗口在這一步可以發(fā)現(xiàn),生成多維數(shù)據(jù)集可以暫時(shí)不用基于數(shù)據(jù)源,這實(shí)際代表了數(shù)據(jù)立方的兩種創(chuàng)建方法。關(guān)于它們之間的區(qū)別和聯(lián)系,將在第5章中講解。(3)單擊【下一步】按鈕,選擇前面創(chuàng)建的數(shù)據(jù)源視圖來為多維數(shù)據(jù)集提供數(shù)據(jù)。再單擊【下一步】按鈕,向?qū)呙桕P(guān)系架構(gòu),以識(shí)別事實(shí)表和維度表。識(shí)別完成后,單擊【下一步】按鈕將會(huì)彈出如圖2-19所示的“標(biāo)識(shí)事實(shí)數(shù)據(jù)表和維度表”窗口。選擇“time_by_day”作為時(shí)間維度表,并且按照?qǐng)D中所示來分別設(shè)置各表為事實(shí)表或是維度表。設(shè)置好后單擊【下一步】按鈕繼續(xù)。圖2-19

標(biāo)識(shí)事實(shí)數(shù)據(jù)表和維度表(4)由于上一步選擇了“time_by_day”作為時(shí)間維度表,這一步需要設(shè)置時(shí)間維度的層次結(jié)構(gòu)。在所有維度的層次結(jié)構(gòu)中,只有時(shí)間維度最為特殊。其他維度系統(tǒng)可以根據(jù)數(shù)據(jù)之間的關(guān)系檢測(cè)其層次結(jié)構(gòu),而時(shí)間維度則需要指定其時(shí)間上的層次。如圖2-20所示,依據(jù)時(shí)間表中的具體情況,為年月日等時(shí)間屬性指定時(shí)間表列。設(shè)置好后單擊【下一步】按鈕繼續(xù)。圖2-20

指定時(shí)間維度層次結(jié)構(gòu)(5)這時(shí)系統(tǒng)將會(huì)讓用戶選擇度量值,如圖2-21所示。度量是來源于事實(shí)表中的數(shù)據(jù),在圖中選擇“StoreSales”、“StoreCost”和“UnitSales”為度量。單擊【下一步】按鈕繼續(xù)。圖2-21

選擇度量值(6)這時(shí)系統(tǒng)將會(huì)依據(jù)前面對(duì)維度表和事實(shí)表的設(shè)置來檢測(cè)層次結(jié)構(gòu)。如果前面的設(shè)置都是正確的,則會(huì)成功檢測(cè)其層次結(jié)構(gòu),檢測(cè)完畢,單擊【下一步】按鈕繼續(xù)。(7)由于前面系統(tǒng)自動(dòng)檢測(cè)了維度之間的層次關(guān)系,因此,產(chǎn)生了一些新的維度,這一步向?qū)⑻峁┮粋€(gè)窗口來查看新建維度的結(jié)構(gòu)并根據(jù)需要進(jìn)行更改。此例中的新建維度結(jié)構(gòu)關(guān)系如圖2-22所示??梢姡沙绦蜃詣?dòng)分析出來的層次結(jié)構(gòu)和用戶自己設(shè)置的時(shí)間層次結(jié)構(gòu)都是和業(yè)務(wù)數(shù)據(jù)中的邏輯結(jié)構(gòu)相符合的。如果不符合,則可以在這一步進(jìn)行修改。設(shè)置完成后單擊【下一步】按鈕,為多維數(shù)據(jù)集指定一個(gè)名稱,再單擊【完成】按鈕,結(jié)束多維數(shù)據(jù)集的創(chuàng)建向?qū)?。圖2-22

維度層次結(jié)構(gòu)關(guān)系(8)完成向?qū)Ш螅梢圆榭唇⒌亩嗑S數(shù)據(jù)集結(jié)構(gòu),如圖2-23所示為多維數(shù)據(jù)集的數(shù)據(jù)源視圖,與2.3.2節(jié)的數(shù)據(jù)源視圖相比較,這里的視圖表達(dá)的是多維數(shù)據(jù)集的表間關(guān)系,而且用黃色標(biāo)記了事實(shí)表,藍(lán)色標(biāo)記了維度表。圖2-23

多維數(shù)據(jù)集的數(shù)據(jù)源視圖(9)雙擊剛才創(chuàng)建的多維數(shù)據(jù)集,系統(tǒng)將會(huì)切換到多維數(shù)據(jù)集設(shè)計(jì)窗口,如圖2-24所示的是該窗口的主要標(biāo)簽,它們標(biāo)識(shí)了可以針對(duì)多維數(shù)據(jù)集進(jìn)行的各種操作,包括添加各種商業(yè)智能功能和數(shù)據(jù)展示等。這些功能將在第5章中講解。圖2-24

多維數(shù)據(jù)集設(shè)計(jì)界面的主要標(biāo)簽(10)這一步將把創(chuàng)建好的多維數(shù)據(jù)集部署到AnalysisServices數(shù)據(jù)庫中,如圖2-25所示,在多維數(shù)據(jù)集上單擊鼠標(biāo)右鍵,在彈出的快捷菜單中選擇【處理】命令,在“是否生成和部署項(xiàng)目”的對(duì)話框中選擇“是”選項(xiàng)。待部署結(jié)束,系統(tǒng)將會(huì)彈出“處理多維數(shù)據(jù)集”對(duì)話框,單擊【運(yùn)行】按鈕,程序?qū)?huì)對(duì)多維數(shù)據(jù)集進(jìn)行處理,處理完畢后,在“處理進(jìn)度”對(duì)話框中單擊【關(guān)閉】按鈕結(jié)束處理過程。如果以上操作都順利進(jìn)行,則此多維數(shù)據(jù)集已經(jīng)順利地部署到了AnalysisServices數(shù)據(jù)庫。打開SQLServerManagementStudio,在對(duì)象資源管理器中的連接下拉菜單中選擇【AnalysisServices】命令,如圖2-26所示。輸入相應(yīng)的認(rèn)證信息,即可進(jìn)入AnalysisServices,如果部署成功,則會(huì)有如圖2-27所示的界面。

圖2-25

處理多維數(shù)據(jù)集

圖2-26

連接AnalysisServices圖2-27

成功部署多維數(shù)據(jù)集后AnalysisServices的界面2.4

創(chuàng)建和使用報(bào)表創(chuàng)建基于多維數(shù)據(jù)集的報(bào)表可以對(duì)數(shù)據(jù)立方進(jìn)行全方位地鉆取,按照第1章對(duì)商業(yè)智能的認(rèn)識(shí)可知道,這是商業(yè)智能的重要表現(xiàn)。按照BI解決方案的體系結(jié)構(gòu)(圖1-8),如果說SSIS整合了不同源的數(shù)據(jù),實(shí)現(xiàn)了ETL的功能;SSAS對(duì)數(shù)據(jù)進(jìn)行了相應(yīng)的分析,創(chuàng)建了Cube和OLAP服務(wù)所需的數(shù)據(jù)庫;那么報(bào)表應(yīng)該是屬于BI體系中的前端展現(xiàn)部分,需要使用SSRS報(bào)表服務(wù)來實(shí)現(xiàn)。2.4.1

創(chuàng)建報(bào)表報(bào)表可以使用完全自定義的方式來創(chuàng)建,也可以使用報(bào)表向?qū)韯?chuàng)建,本節(jié)將使用后者來創(chuàng)建福馬特商店的智能報(bào)表,其操作步驟如下。(1)打開BusinessIntelligenceDevelopmentStudio,選擇【文件】→【新建】→【項(xiàng)目】命令,彈出“新建項(xiàng)目”對(duì)話框。在“項(xiàng)目類型”選項(xiàng)組中,選擇“商業(yè)智能項(xiàng)目”選項(xiàng),在“模板”選項(xiàng)組中,選擇“報(bào)表服務(wù)器項(xiàng)目向?qū)А边x項(xiàng)。將報(bào)表服務(wù)器項(xiàng)目取名為foodmartsaleRPT,單擊【確定】按鈕,如圖2-28所示。圖2-28

新建報(bào)表項(xiàng)目向?qū)В?)系統(tǒng)將彈出“報(bào)表向?qū)А贝翱冢⒏嬖V我們此向?qū)⑼瓿蛇x擇從中獲取數(shù)據(jù)的數(shù)據(jù)源、設(shè)計(jì)對(duì)數(shù)據(jù)源執(zhí)行的查詢、選擇要?jiǎng)?chuàng)建的報(bào)表類型、指定報(bào)表的基本布局、指定報(bào)表的格式設(shè)置等步驟,單擊【下一步】按鈕繼續(xù)。(3)此時(shí)系統(tǒng)彈出“選擇數(shù)據(jù)源”窗口,為報(bào)表選擇或創(chuàng)建所需數(shù)據(jù)的來源,輸入“foodmartsale”作為名稱,選擇AnalysisServices作為數(shù)據(jù)連接的類型,如圖2-29所示。再單擊【編輯】按鈕,設(shè)置此數(shù)據(jù)源的連接屬性,注意數(shù)據(jù)庫要選擇在2.3節(jié)部署到“AnalysisServices”的數(shù)據(jù)庫,可以通過單擊【測(cè)試連接】按鈕確認(rèn)此連接的正確性。設(shè)置好后,單擊【確定】按鈕返回“選擇數(shù)據(jù)源”窗口,單擊【下一步】按鈕繼續(xù)操作。(4)在彈出的“設(shè)計(jì)查詢”窗口中單擊【查詢生成器】按鈕,得到如圖2-30所示的查詢生成器窗口。該窗口主要有4個(gè)部分組成,左上角為元數(shù)據(jù),左下角為計(jì)算成員,右上角為維度篩選,右下角是相應(yīng)維度和量度組成的查詢結(jié)果。在此例中,選擇“TimeByDay”維度的“the_month”字段和“Product”維度中具有層次結(jié)構(gòu)的“Product_Category”、“Product_Class”和“Product”3個(gè)字段,而量度選擇“StoreCost”和“StoreSales”2個(gè)字段,最后結(jié)果如圖2-29所示。圖2-29

選擇數(shù)據(jù)源窗口圖2-30

查詢生成器窗口(5)由于這里只需要分析1998年的銷售數(shù)據(jù),可以把TimeByDay維度從“元數(shù)據(jù)”窗格拖曳到維度篩選窗格中,進(jìn)行如圖2-31所示的設(shè)置。完成后單擊【確定】按鈕回到“設(shè)計(jì)查詢”對(duì)話框,可以看到在“查詢字符串”中已經(jīng)有剛才設(shè)計(jì)的查詢的代碼,這就是專門針對(duì)多維數(shù)據(jù)集的MDX代碼,在以后將會(huì)學(xué)習(xí)到。單擊【下一步】按鈕繼續(xù)操作。圖2-31

進(jìn)行維度篩選(6)這時(shí)系統(tǒng)將要讓用戶選擇要?jiǎng)?chuàng)建的表報(bào)類型,選擇“表格格式”,單擊【下一步】按鈕進(jìn)入如圖2-32所示的“設(shè)計(jì)表”窗口。把“the_month”字段作為分頁所用的字段,Product維度的3個(gè)層次的字段依次作為分組字段,而2個(gè)量度則作為詳細(xì)信息字段,其結(jié)果如圖2-32所示。單擊【下一步】按鈕繼

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論