




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
商務(wù)智能入門培訓(xùn)
BusinessIntelligence
一、概念篇實例:沃爾瑪?shù)匿N售部在總結(jié)歷史銷售記錄的時候發(fā)現(xiàn),每到周末的時候,啤酒和尿布的銷量都比平時要高很多,這是一個巧合還是這個現(xiàn)象的背后隱藏著一定的必然因素?銷售人員展開了調(diào)查,結(jié)果發(fā)現(xiàn):每到周末,有孩子的家庭主婦就會讓他們的丈夫去超市給孩子買足一周用的尿布,這些丈夫們必然會選擇一些自己愛喝的啤酒,以便周末在欣賞橄欖球賽和籃球賽的時候可以和朋友們一起慶祝。原因找到了之后,銷售部采取了措施,每到周末將超市的啤酒和尿布捆綁銷售,這樣,啤酒和尿布的銷量又同時增加了一成。什么是商務(wù)智能?二、市場分析篇商務(wù)智能的應(yīng)用分為縱向商務(wù)智能和橫向商務(wù)智能??v向商務(wù)智能是指企業(yè)分別實施多個信息化系統(tǒng),比如財務(wù)系統(tǒng)中的管理會計就是商務(wù)智能的一部分,從以前只關(guān)注運(yùn)營報表,到關(guān)注整個財務(wù)的運(yùn)作情況,像現(xiàn)金流、資產(chǎn)負(fù)債等。而人力資源系統(tǒng)可以稱為智能人力資源,關(guān)注員工的流失率,分析從什么途徑招聘的員工流失率最高,分析公司人才結(jié)構(gòu)、人才培養(yǎng)方向等。總而言之,企業(yè)有了核心業(yè)務(wù)系統(tǒng)、管理信息系統(tǒng),在這些系統(tǒng)之上做智能的分析,而這些分析得到的信息完全是來自單獨的系統(tǒng)。那么橫向商務(wù)智能指的是什么呢?舉例來說,比如汽車制造廠生產(chǎn)多款不同的車型,公司老總會問,生產(chǎn)哪一款車型、生產(chǎn)多少,企業(yè)的效率能夠達(dá)到最高?這樣的問題,不能通過分析單獨的系統(tǒng)得到,因為效益最高取決于生產(chǎn)成本、人力資源成本、市場的需求、競爭對手、市場定價等多方面的信息。而這些信息則分散在財務(wù)系統(tǒng)、人力資源系統(tǒng)、采購系統(tǒng)中,這就需要系統(tǒng)和信息有效的整合才能解決這個問題,所以稱為橫向商務(wù)智能。商業(yè)智能應(yīng)用領(lǐng)域?商業(yè)智能是一種整體化的解決方案,他可以幫助企業(yè)做出明智的業(yè)務(wù)經(jīng)營決策,而依據(jù)則是企業(yè)內(nèi)部的各種數(shù)據(jù),例如訂單、庫存、交易賬目、客戶和供應(yīng)商資料、行業(yè)數(shù)據(jù)和競爭對手信息等等。商業(yè)智能其實是一種將企業(yè)信息數(shù)據(jù)轉(zhuǎn)化為決策的重要工具。商業(yè)智能的應(yīng)用是需要一定的基礎(chǔ)的。實施商業(yè)智能的企業(yè)至少應(yīng)該具備以下幾個條件:用戶的數(shù)據(jù)已達(dá)到一定的規(guī)模;用戶面臨激烈的市場競爭:用戶在IT方面的資金能得到保障。滿足以上幾點的行業(yè)集中在重要的政府機(jī)構(gòu)(如財務(wù)、稅務(wù)、審計、工商、海關(guān)等)、零售業(yè)(連鎖店、網(wǎng)上零售等)、大型現(xiàn)代化的制造業(yè)(如寶鋼、上汽集團(tuán)等)、金融(包括銀行、證券、保險等)、電信業(yè)(如中國電信、中國網(wǎng)通、中國移動等)、能源業(yè)(電力)、運(yùn)輸?shù)?,這也是目前國內(nèi)急需要數(shù)據(jù)倉庫和商業(yè)智能技術(shù)來提升企業(yè)競爭力的主要行業(yè)。金融、電信行業(yè)是BI應(yīng)用最集中的行業(yè),約占40%的市場分額,保險、能源、煙草、政務(wù)行業(yè)約占30%的市場份額,制造、零售行業(yè)約占30%的市場份額,是BI應(yīng)用最具潛力的行業(yè)。金融:隨著國內(nèi)五大商業(yè)銀行的信息化不斷發(fā)展,在BI領(lǐng)域投資穩(wěn)步增長,每年均有大量的BI需求,其中BI已經(jīng)不僅局限于高層管理者的決策,操作型BI應(yīng)用越來越廣泛,尤其是信貸評審領(lǐng)域。中小型銀行BI需求也不斷涌現(xiàn),未來將是金融行業(yè)BI市場的主要增長點。電信:電信行業(yè)信息化程度很高,對信息化依賴很強(qiáng),積累了大量的數(shù)據(jù),具有實施商業(yè)智能項目的基礎(chǔ)條件和資金實力。電信行業(yè)對于BI深入應(yīng)用是最渴望的,在話費(fèi)套餐設(shè)置、客戶潛力分析等都需要數(shù)據(jù)挖掘技術(shù)來提供決策依據(jù)。行業(yè)現(xiàn)狀?行業(yè)市場規(guī)模?發(fā)展趨勢?發(fā)展趨勢及預(yù)測移動商業(yè)智能
商業(yè)智能系統(tǒng)會把大量數(shù)據(jù)轉(zhuǎn)變成可視化形式(如圖形和表格),以便使用者詳細(xì)深入地分析潛在商業(yè)趨勢。因此如果為這種分析賦予移動性——通常利用功能強(qiáng)大的智能終端,許多公司就能與客戶和商業(yè)合作伙伴進(jìn)行實時互動,從而改善服務(wù)、提高工作效率。SaaSBI將得到快速發(fā)展 SaaS是基于互聯(lián)網(wǎng)提供軟件服務(wù)的軟件應(yīng)用模式,企業(yè)根據(jù)實際需要,從SaaS提供商租賃軟件服務(wù)。SaaS模式在CRM領(lǐng)域獲得了成功,不論是國外還是國內(nèi)具有成熟的產(chǎn)品,并取得了不錯的收益。SAAS在BI領(lǐng)域的應(yīng)用的挑戰(zhàn)是應(yīng)用于互聯(lián)網(wǎng)上的SAAS軟件無法處理BI所需的海量數(shù)據(jù)。商業(yè)智能日漸與業(yè)務(wù)融合
業(yè)務(wù)分析作為商業(yè)智能領(lǐng)域中最貼近業(yè)務(wù)的層面,在2010年成為業(yè)界關(guān)注的重點,不管是SAP還是IBM,都將業(yè)務(wù)分析作為今年的業(yè)務(wù)發(fā)展重點。企業(yè)希望由BI系統(tǒng)帶來的透明度和洞察力能夠幫助企業(yè)降低成本,提高生產(chǎn)率和業(yè)務(wù)敏捷性。通過商業(yè)智能,企業(yè)能更清晰更深刻的了解包括公司管理、利潤分析、市場競爭、財務(wù)狀況等信息,而未來商業(yè)智能的這種特性還將繼續(xù)加強(qiáng)。操作型BI應(yīng)用得到發(fā)展
目前商業(yè)智能技術(shù)不僅僅應(yīng)用于企業(yè)高層管理者的決策分析,越來越多的商業(yè)智能分析結(jié)果正被用于普通員工的日常工作流程中,直接推動業(yè)務(wù)的執(zhí)行。例如:在家樂福購物時,收銀員已經(jīng)可以根據(jù)顧客的購物籃進(jìn)行產(chǎn)品推薦。發(fā)展趨勢?數(shù)據(jù)集成應(yīng)用得到重視
在一些大型企業(yè)中往往有幾十個甚至幾百個信息系統(tǒng),將這些數(shù)據(jù)整合到數(shù)據(jù)倉庫中,一般采取ETL工具抽取多個廠商數(shù)據(jù)庫的數(shù)據(jù),有些甚至還包含非結(jié)構(gòu)化數(shù)據(jù),例如XML、EXCEL、文本等。這些數(shù)據(jù)往往需要加工和整理放入ODS(中間庫),最后以規(guī)范、標(biāo)準(zhǔn)的格式存儲到數(shù)據(jù)倉庫。在這個數(shù)據(jù)集成的過程中,要做到系統(tǒng)兼容性好、開發(fā)效率高、處理性能好,而且能夠捕捉數(shù)據(jù)的變化處理增量數(shù)據(jù)。數(shù)據(jù)集成是建立實用的數(shù)據(jù)倉庫的關(guān)鍵,而且數(shù)據(jù)集成的過程占商業(yè)智能應(yīng)用中一半以上的工作量,因此越是大型企業(yè)越是重視數(shù)據(jù)集成。中小企業(yè)BI應(yīng)用逐漸擴(kuò)大市場
份額
中國中小企業(yè)逐漸呈現(xiàn)對管理軟件旺盛的需求態(tài)勢,很多廠商發(fā)布了專門針對中小企業(yè)的BI套件,例如CognosExpress等。中小企業(yè)在實施ERP、CRM產(chǎn)品后,必將應(yīng)用商業(yè)智能,中小企業(yè)市場是BI應(yīng)用非常重要的組成部分。BI企業(yè)將在壟斷中不斷新生
中國商業(yè)智能市場兩極競爭趨勢日益加劇。在高端市場,由國際廠商壟斷與競爭的局面是2010年的主流,其中IBM、Oracle、SAP、Microsoft擁有完整的BI產(chǎn)品線,將占據(jù)70%以上的市場份額。剩余的30%市場將由其他外資企業(yè)和國內(nèi)企業(yè)分享。隨著國內(nèi)企業(yè)的成長與并購,國內(nèi)廠商的實力不斷壯大,但是主要集中于中低端市場,在2010年優(yōu)秀的國產(chǎn)BI產(chǎn)品將開始不斷向四大國際廠商發(fā)起挑戰(zhàn),但是競爭的過程將是極其漫長的。1)國際BI廠商,如BO公司(SAP)、Hyperion公司(Oracle)、微軟公司、SAS公司等。這些國際廠商的品牌與規(guī)模優(yōu)勢非常突出,是國內(nèi)大部分BI廠商難以與之匹敵的。2)起步比較早的國內(nèi)BI廠商,如菲奈特(成立于1995年10月,從1997年開始進(jìn)入BI領(lǐng)域)、先進(jìn)數(shù)通公司(成立于2000年)、吉貝克公司(成立于2002年)等。這些國內(nèi)BI廠商憑借本土化的優(yōu)勢以及對國內(nèi)BI用戶所需要的應(yīng)用的獨特見解,也在國內(nèi)的BI市場上占有超過30%的市場份額。3)非專業(yè)BI廠商,主要有以下幾類:一、從事某些行業(yè)核心業(yè)務(wù)系統(tǒng)建設(shè)的公司;二、從事系統(tǒng)集成的公司;三、從事專業(yè)財務(wù)系統(tǒng)及個別ERP廠商。商務(wù)智能主要廠商有哪些?廠商產(chǎn)品及簡介IBMDB2以及Cognos、SPSS、DataStage,覆蓋BI全部領(lǐng)域。數(shù)據(jù)倉庫產(chǎn)品結(jié)合了DB2數(shù)據(jù)服務(wù)器的長處和IBM的商業(yè)智能基礎(chǔ)設(shè)施,集成了用于倉庫管理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘以及OLAP分析和報告的核心組件,提供了一套基于可視數(shù)據(jù)倉庫的商業(yè)智能解決方案。OracleOracle、Hyperion,覆蓋BI全部領(lǐng)域,數(shù)據(jù)挖掘領(lǐng)域有待加強(qiáng)。數(shù)據(jù)倉庫解決方案包含了業(yè)界領(lǐng)先的數(shù)據(jù)庫平臺、開發(fā)工具和應(yīng)用系統(tǒng),能夠提供一系列的數(shù)據(jù)倉庫工具集和服務(wù),具有多用戶數(shù)據(jù)倉庫管理能力,多種分區(qū)方式,較強(qiáng)的與OLAP工具的交互能力及快速和便捷的數(shù)據(jù)移動機(jī)制等特性。SAPBusinessObjects、CrystalReports,主要是OLAP和報表領(lǐng)域。Sybase(SAP)提供了稱為WarehouseStudio的一整套覆蓋整個數(shù)據(jù)倉庫建立周期的產(chǎn)品包,包括數(shù)據(jù)倉庫的建模、數(shù)據(jù)集成和轉(zhuǎn)換、數(shù)據(jù)存儲和管理、元數(shù)據(jù)管理和數(shù)據(jù)可視化分析等產(chǎn)品。BusinessObjects(SAP)是集查詢、報表和OLAP技術(shù)為一身的智能決策支持系統(tǒng),具有較好的查詢和報表功能,提供多維分析技術(shù),支持多種數(shù)據(jù)庫,同時它還支持基于Web瀏覽器的查詢、報表和分析決策。MicrosoftSQLServer,覆蓋BI全部領(lǐng)域,適合中小型企業(yè),性價比高。它提供了三大服務(wù)和一個工具來實現(xiàn)數(shù)據(jù)倉庫系統(tǒng)的整合,為用戶提供了可用于構(gòu)建典型和創(chuàng)新的分析應(yīng)用程序所需的各種特性、工具和功能,可以實現(xiàn)建模、ETL、建立查詢分析或圖表、定制KPI、建立報表和構(gòu)造數(shù)據(jù)挖掘應(yīng)用及發(fā)布等功能。TeradataTeradata,主要是數(shù)據(jù)倉庫領(lǐng)域。它提出了可擴(kuò)展數(shù)據(jù)倉庫基本架構(gòu),包括數(shù)據(jù)裝載、數(shù)據(jù)管理和信息訪問幾個部分,是高端數(shù)據(jù)倉庫市場最有力競爭者,主要運(yùn)行在基于Unix操作系統(tǒng)平臺的NCR硬件設(shè)備上。SASSAS,數(shù)據(jù)挖掘領(lǐng)域領(lǐng)先。SAS公司的數(shù)據(jù)倉庫解決方案是一個由30多個專用模塊構(gòu)成的架構(gòu)體系,適應(yīng)于對企業(yè)級的數(shù)據(jù)進(jìn)行重新整合,支持多維、快速查詢,提供服務(wù)于OLAP操作和決策支持的數(shù)據(jù)采集、管理、處理和展現(xiàn)功能。國內(nèi)其他菲奈特(BIoffice)、和勤(Hinge)、奧威智動(Power-BI)、科加諾(QlikView)、尚南(BlueQuery),潤乾、探智(Trinity)。目前活躍在國內(nèi)BI市場上的廠商大致可分為以下三類:商務(wù)智能主要要廠商產(chǎn)品鏈鏈介紹?廠商數(shù)據(jù)庫數(shù)據(jù)倉庫設(shè)計、管理ETLOLAP數(shù)據(jù)挖掘報表IBMDB2IBMDWEDesignStudioIBMWebshpereDatastage、DecisionStream(Cognos)IBMDB2OLAPServerIBMIntelligentMiner、SPSSIBMCognosReportOracleOracleOracleWarehouseBuilderOracleWarehouseBuilderOracleExpress/DiscovererOracleDataMinerOracleReportsSAP-BusinessObjectsRapidMartsBusinessObjectsDataIntegratoinBusinessObjectsOLAPIntelligence-BusinessObjectsCrystalReportMicrosoftSQLServerSQLServerManagementStudioSQLServerIntegrationServicesSQLServerAnalysisServicesSQLServerDataMinerSQLServerReportingServicesTeradataTeradataTeradataRDBMS/TeradataMetaDataServicesTeradataETLAutomation-TeradataWarehouseMinerBTEQSybaseSybase
IQPowerDesinger/WarehouseControlCenterDataIntegratoinSuitePowerDimension-InfoMakerSAS-SASWarehouseAdministratorSASETLStudioSASOLAPServerSASEnterpriseMinerSASReportStudio三、技術(shù)篇商務(wù)智能總體體解決方案財務(wù)信息“ETL”Extract–Transform-Load數(shù)據(jù)倉庫/數(shù)據(jù)集市/ODS商務(wù)智能平臺臺信息展現(xiàn)*決策者分析員管理者業(yè)務(wù)員數(shù)據(jù)查詢報表分析多維分析數(shù)據(jù)挖掘分析門戶數(shù)據(jù)整合*OracleDB2SQLServerSybaseTeraData……銷售信息庫存信息DataIntegrationRapidMart商務(wù)智能核心心技術(shù)有哪些些?三.ETL技術(shù)二.元數(shù)據(jù)管理技技術(shù)一.數(shù)據(jù)倉庫技術(shù)四.在線聯(lián)機(jī)分析析處理技術(shù)((OLAP)五.數(shù)據(jù)挖掘技術(shù)術(shù)數(shù)據(jù)倉庫是一一個面向主題題的、集成的的、時變的、、非易失的數(shù)數(shù)據(jù)集合,支支持管理部門門的決策過程程。面向主題的((subject-oriented):數(shù)據(jù)倉庫圍繞繞一些主題,,如顧客、供供應(yīng)商、產(chǎn)品品和銷售組織織。數(shù)據(jù)倉庫庫關(guān)注決策者者的數(shù)據(jù)建模模與分析,而而不是集中于于組織機(jī)構(gòu)的的日常操作和和事務(wù)處理。。因此,數(shù)據(jù)據(jù)倉庫排除對對決策無用的的數(shù)據(jù),提供供特定主題的的簡明視圖。。集成的(integrated):通常,構(gòu)造數(shù)數(shù)據(jù)倉庫是將將多個異種數(shù)數(shù)據(jù)源,如關(guān)關(guān)系數(shù)據(jù)庫、、一般文件和和聯(lián)機(jī)事務(wù)處處理記錄集成成在一起。使使用數(shù)據(jù)清理理和數(shù)據(jù)集成成技術(shù),確保保命名約定、、編碼結(jié)構(gòu)和和屬性度量等等指標(biāo)的一致致性。時變的(time-variant):數(shù)據(jù)存儲從歷歷史的角度提提供信息。數(shù)數(shù)據(jù)倉庫中的的關(guān)鍵結(jié)構(gòu),,隱式或顯式式地包含時間間元素。非易失的(nonvolatile):數(shù)據(jù)倉庫的數(shù)數(shù)據(jù)是有歷史史保存意義的的,數(shù)據(jù)倉庫庫的數(shù)據(jù)也只只使用添加的的方式,進(jìn)入入了數(shù)據(jù)倉庫庫的數(shù)據(jù)一般般情況下是不不需要更新的的,這樣就保保證了數(shù)據(jù)的的穩(wěn)定性。通通常,它只需需要三種數(shù)據(jù)據(jù)訪問:數(shù)據(jù)據(jù)的初始化裝裝入、數(shù)據(jù)的的添加和數(shù)據(jù)據(jù)查詢訪問。。數(shù)據(jù)倉庫定義義事實表是用來記錄具具體事件的,,包含了每個個事件的具體體要素,以及及具體發(fā)生的的事情;維度表是對事實表中中事件的要素素的描述信息息;數(shù)據(jù)倉庫相關(guān)關(guān)概念一個事實表和和多個維度表表構(gòu)成一個立立方體(主題),一個或者者多個相關(guān)主主題構(gòu)成一個個數(shù)據(jù)集市,一個或者多多個數(shù)據(jù)集市市構(gòu)成了數(shù)據(jù)倉庫。數(shù)據(jù)倉庫的架架構(gòu)模型包括括了星型架構(gòu)與雪花型架構(gòu)兩種模式。星型架構(gòu)的中中間為事實表表,四周為維維度表,類似似星星;雪花型架構(gòu)的的中間為事實實表,兩邊的的維度表可以以再有其關(guān)聯(lián)聯(lián)子表,從而而表達(dá)了清晰晰的維度層次次關(guān)系。步驟一:確定定主題即確定數(shù)據(jù)分分析或前端展展現(xiàn)的主題。。例如:我們們希望分析某某年某月某一一地區(qū)的啤酒酒銷售情況,,這就是一個個主題。主題題要體現(xiàn)出某某一方面的各各分析角度(維度)和統(tǒng)計數(shù)據(jù)(量度)之間的關(guān)系,,確定主題時時要綜合考慮慮。我們可以以形象的將一一個主題想象象為一顆星星星:統(tǒng)計數(shù)據(jù)據(jù)(量度)存在于星星中中間的事實表表;分析角度度(維度)是星星的各個個角;我們將將通過維度的的組合,來考考察量度。那那么,“某年年某月某一地地區(qū)的啤酒銷銷售情況”這這樣一個主題題,就要求我我們通過時間和地區(qū)兩個維度的組組合,來考察察銷售情況這個量度。步驟二:確定定量度在確定了主題題以后,我們們將考慮要分分析的技術(shù)指指標(biāo),諸如年年銷售額之類類。它們一般般為數(shù)值,稱稱為量度。量量度是統(tǒng)計的的指標(biāo),必須須事先選擇恰恰當(dāng),基于不不同的量度可可以進(jìn)行復(fù)雜雜關(guān)鍵性能指指標(biāo)(KPI)的設(shè)計和計算算。數(shù)據(jù)倉庫構(gòu)建建步驟步驟二:確定定量度在確定了主題題以后,我們們將考慮要分分析的技術(shù)指指標(biāo),諸如年年銷售額之類類。它們一般般為數(shù)值,稱稱為量度。量量度是統(tǒng)計的的指標(biāo),必須須事先選擇恰恰當(dāng),基于不不同的量度可可以進(jìn)行復(fù)雜雜關(guān)鍵性能指指標(biāo)(KPI)的設(shè)計和計算算。步驟三:確定定事實數(shù)據(jù)粒粒度在確定了量度度之后,我們們要考慮到該該量度的匯總總情況和不同同維度下量度度的聚合情況況??紤]到量量度的聚合程程度不同,或或采用“最小小粒度原則””,即將量度度的粒度設(shè)置置到最小。數(shù)據(jù)倉庫構(gòu)建建步驟步驟四:確定定維度維度是指分析析的各個角度度。例如我們們希望按照時時間,或者按按照地區(qū),或或者按照產(chǎn)品品進(jìn)行分析,,那么這里的的時間、地區(qū)區(qū)、產(chǎn)品就是是相應(yīng)的維度度?;诓煌木S度,我我們可以看到到各量度的匯匯總情況,也也可以基于所所有的維度進(jìn)進(jìn)行交叉分析析。步驟五:創(chuàng)建事實表在確定好事實實數(shù)據(jù)和維度度后,我們將將考慮加載事事實表。在公公司的大量數(shù)數(shù)據(jù)堆積如山山時,我們想想看看里面究究竟是什么,,結(jié)果發(fā)現(xiàn)里里面是一筆筆筆生產(chǎn)記錄,,一筆筆交易易記錄…那么這些記錄錄是我們將要要建立的事實實表的原始數(shù)數(shù)據(jù),即關(guān)于于某一主題的的事實記錄表表。事實表是是數(shù)據(jù)倉庫的的核心。數(shù)據(jù)倉庫構(gòu)建建步驟商務(wù)智能核心心技術(shù)有哪些些?三.ETL技術(shù)二.元數(shù)據(jù)管理技技術(shù)一.數(shù)據(jù)倉庫技術(shù)術(shù)四.在線聯(lián)機(jī)分析析處理技術(shù)((OLAP)五.數(shù)據(jù)挖掘技術(shù)術(shù)元數(shù)據(jù)通常定定義“關(guān)于數(shù)據(jù)的的數(shù)據(jù)(例如如視圖,查詢詢SQL,事務(wù),存儲儲過程)”,,是描述和管管理數(shù)據(jù)倉庫庫自身內(nèi)容對對象、用來表表示數(shù)據(jù)項的的意義及其在在系統(tǒng)各組成成部件之間的的關(guān)系的數(shù)據(jù)據(jù)。元數(shù)據(jù)作作用于數(shù)據(jù)倉倉庫的創(chuàng)建,,維護(hù),管理理和使用的各各個方面。是是從廣義上來來講,用元數(shù)數(shù)據(jù)來描述數(shù)數(shù)據(jù)倉庫對象象的任何東西西——無論是一個表表、一個列、、一個查詢、、一個商業(yè)規(guī)規(guī)則,或者是是數(shù)據(jù)倉庫內(nèi)內(nèi)部的數(shù)據(jù)轉(zhuǎn)轉(zhuǎn)移。它在數(shù)數(shù)據(jù)源的抽取取、數(shù)據(jù)加工工、訪問與使使用等過程中中都會存在。。實現(xiàn)元數(shù)據(jù)據(jù)管理的主要要目標(biāo)就是使使企業(yè)內(nèi)部元元數(shù)據(jù)的定義義標(biāo)準(zhǔn)化。數(shù)數(shù)據(jù)倉庫的維維護(hù)工具可以以根據(jù)元數(shù)據(jù)據(jù)完成數(shù)據(jù)的的抽取、清洗洗和轉(zhuǎn)換,并并做適度的匯匯總。數(shù)據(jù)倉庫的元元數(shù)據(jù)包括::(1)數(shù)據(jù)資源::包括各個數(shù)數(shù)據(jù)源的模型型,描述源數(shù)數(shù)據(jù)表字段屬屬性及業(yè)務(wù)含含義,源數(shù)據(jù)據(jù)到數(shù)據(jù)倉庫庫的映射關(guān)系系;(2)數(shù)據(jù)組織::數(shù)據(jù)倉庫、、數(shù)據(jù)集市表表的結(jié)構(gòu)、屬屬性及業(yè)務(wù)含含義,多維結(jié)結(jié)構(gòu)等等;(3)數(shù)據(jù)應(yīng)用::查詢與報表表輸出格式描描述、OLAP、數(shù)據(jù)挖掘等等的數(shù)據(jù)模型型的信息展現(xiàn)現(xiàn);(4)數(shù)據(jù)管理::這里包括數(shù)數(shù)據(jù)倉庫過程程以及數(shù)據(jù)倉倉庫操作結(jié)果果的模型,包包括描述數(shù)據(jù)據(jù)抽取和清洗洗規(guī)則、數(shù)據(jù)據(jù)加載控制、、臨時表結(jié)構(gòu)構(gòu)、用途和使使用情況、數(shù)數(shù)據(jù)匯總控制制。元數(shù)據(jù)分析用戶數(shù)據(jù)庫、數(shù)據(jù)據(jù)倉庫我想知道今年年、做得最好好的5個產(chǎn)品數(shù)據(jù)倉庫中有有80張數(shù)據(jù)表無語義層的工工作模式無語義層的工工作模式以往的兩種主主要的解決數(shù)數(shù)據(jù)訪問問題題的方法:TheBureauApproach:業(yè)務(wù)人員技術(shù)人員SQLTheSQLEducationApproach:業(yè)務(wù)人員技術(shù)人員SQL透過語義層訪訪問數(shù)據(jù)設(shè)計語義層Universe設(shè)計數(shù)據(jù)庫和和數(shù)據(jù)安全機(jī)機(jī)制企業(yè)數(shù)據(jù)庫業(yè)務(wù)人員的要要求業(yè)務(wù)人員可以以基于語義層層進(jìn)行數(shù)據(jù)查查詢和分析不需要了解數(shù)數(shù)據(jù)庫內(nèi)部結(jié)結(jié)構(gòu)不需要學(xué)習(xí)SQL語句股票財經(jīng)銷售IT人員的要求專注于數(shù)據(jù)庫庫維護(hù)專注于語義層層開發(fā)有語義層的工工作模式商務(wù)智能核心心技術(shù)有哪些些?三.ETL技術(shù)二.元數(shù)據(jù)管理技技術(shù)一.數(shù)據(jù)倉庫技術(shù)術(shù)四.在線聯(lián)機(jī)分析析處理技術(shù)((OLAP)五.數(shù)據(jù)挖掘技術(shù)術(shù)商業(yè)智能的核核心內(nèi)容是從從許多來自企企業(yè)不同的業(yè)業(yè)務(wù)處理系統(tǒng)統(tǒng)的數(shù)據(jù)(分分布的、異構(gòu)構(gòu)的源數(shù)據(jù)))中,提取出出有用的數(shù)據(jù)據(jù),進(jìn)行清理理以保證數(shù)據(jù)據(jù)的正確性,,然后經(jīng)過抽抽?。‥xtraction)、轉(zhuǎn)換(Transformation)和裝載(Load),即ETL過程(本質(zhì)上上是樣本提取取的過程),,整合到一個個企業(yè)級的數(shù)數(shù)據(jù)倉庫里,,從而得到企企業(yè)信息的一一個全局視圖圖,在此基礎(chǔ)礎(chǔ)上利用合適適的查詢和分分析工具、數(shù)數(shù)據(jù)挖掘工具具等對數(shù)據(jù)倉倉庫里的數(shù)據(jù)據(jù)進(jìn)行分析和和處理,形成成信息,甚至至進(jìn)一步把信信息提煉出輔輔助決策的知知識,最后把把知識呈現(xiàn)給給管理者,為為管理者的決決策過程提供供支持。ETL概念ETL特征:以串行/并行方式,從從不同異構(gòu)數(shù)數(shù)據(jù)源流向統(tǒng)統(tǒng)一的目標(biāo)數(shù)數(shù)據(jù),核心在在于轉(zhuǎn)換過程程(關(guān)聯(lián),聚聚集),而抽抽取和裝載一一般可以作為為轉(zhuǎn)換的輸入入和輸出。ETL元數(shù)據(jù)主要包包括每次轉(zhuǎn)換換前后的數(shù)據(jù)據(jù)結(jié)構(gòu)和轉(zhuǎn)換換的規(guī)則。數(shù)據(jù)同步,數(shù)數(shù)據(jù)ETL是經(jīng)常性的活活動,按照固固定周期運(yùn)行行,甚至實時時運(yùn)行。流程控制和數(shù)數(shù)據(jù)驗證機(jī)制制。字段映射;映射的自動匹匹配;字段的拆分;;多字段的混合合運(yùn)算;跨異構(gòu)數(shù)據(jù)庫庫的關(guān)聯(lián);自定義函數(shù);;多數(shù)據(jù)類型支支持;復(fù)雜條件過濾濾;支持臟讀;數(shù)據(jù)的批量裝裝載;時間類型的轉(zhuǎn)轉(zhuǎn)換;對各種碼表的的支持;環(huán)境變量是否否可以動態(tài)修修改;去重復(fù)記錄;;抽取斷點;記錄間合并或或計算;記錄拆分;抽取的字段是是否可以動態(tài)態(tài)修改;行、列變換;;排序;統(tǒng)計;度量衡等常用用的轉(zhuǎn)換函數(shù)數(shù);代理主鍵的生生成;調(diào)試功能;抽取遠(yuǎn)程數(shù)據(jù)據(jù);增量抽取的處處理方式;制造樣品數(shù)據(jù)據(jù);在轉(zhuǎn)換過程中中是否支持?jǐn)?shù)數(shù)據(jù)比較的功功能;數(shù)據(jù)預(yù)覽;性能監(jiān)控;數(shù)據(jù)清洗及標(biāo)標(biāo)準(zhǔn)化;按行、按列的的分組聚合等等ETL技術(shù)功能清單單增量數(shù)據(jù)ETL解決方案比較較技術(shù)路線相關(guān)產(chǎn)品適用場合優(yōu)點缺點觸發(fā)器(Trigger)客戶自己非常熟悉自己開發(fā)的業(yè)務(wù)系統(tǒng)的數(shù)據(jù)存儲邏輯,而且數(shù)據(jù)的實時性要求非常高,整表數(shù)據(jù)量大于100萬的情況獲取增量數(shù)據(jù)實時性好;性能好;實現(xiàn)容易容易導(dǎo)致原業(yè)務(wù)系統(tǒng)不能正常工作;觸發(fā)器狀態(tài)不易監(jiān)控和管理;觸發(fā)器失效容易造成監(jiān)控期間的增量數(shù)據(jù)丟失時間戳客戶自己對業(yè)務(wù)系統(tǒng)數(shù)據(jù)存儲邏輯不是很熟,業(yè)務(wù)系統(tǒng)安全性要求很高,對增量數(shù)據(jù)的實時性要求不是很高,整表的數(shù)據(jù)量不大于100萬的情況不需要對原系統(tǒng)進(jìn)行任何修改;實現(xiàn)容易增量數(shù)據(jù)的獲取和更新機(jī)制對目的數(shù)據(jù)庫和源數(shù)據(jù)庫都存在較大性能影響。數(shù)據(jù)庫日志CDC(IBM)在不適合觸發(fā)器、時間戳的情況下,通過數(shù)據(jù)庫日志的方式通過第三方監(jiān)聽工具實現(xiàn)增量數(shù)據(jù)的同步不用對業(yè)務(wù)系統(tǒng)表結(jié)構(gòu)進(jìn)行直接修改;對數(shù)據(jù)ETL過程進(jìn)行監(jiān)控,有利于后續(xù)日常管理需要源數(shù)據(jù)庫支持日志功能,并且修改源數(shù)據(jù)庫的日志監(jiān)控選項;啟動日志監(jiān)控會適當(dāng)?shù)赜绊懺磾?shù)據(jù)庫的性能;購買專業(yè)的數(shù)據(jù)庫監(jiān)控軟件增加項目的成本。ETL技術(shù)與數(shù)據(jù)庫庫復(fù)制技術(shù)比比較序號項目ETL數(shù)據(jù)庫復(fù)制1適用場合適合于數(shù)據(jù)倉庫系統(tǒng),尤其適合于數(shù)據(jù)抽取中需要進(jìn)行數(shù)據(jù)清晰、轉(zhuǎn)換和運(yùn)算的情況適合數(shù)據(jù)庫的數(shù)據(jù)復(fù)制,可用于數(shù)據(jù)庫系統(tǒng)的備份、數(shù)據(jù)容災(zāi)、以及備份數(shù)據(jù)的再利用,在備份系統(tǒng)上開發(fā)新的業(yè)務(wù)模塊。2性能性能比較低非常高(高兩個數(shù)量級)3相關(guān)產(chǎn)品SSIS,CDC,Datastage等DSGRealsync,QUESTShareplex以及ORACLEDataGuard、HighVolumeReplicator等7、商務(wù)智能核核心技術(shù)有哪哪些?三.ETL技術(shù)二.元數(shù)據(jù)據(jù)管理理技術(shù)術(shù)一.數(shù)據(jù)倉倉庫技技術(shù)四.在線聯(lián)聯(lián)機(jī)分分析處處理技技術(shù)((OLAP)五.數(shù)據(jù)挖挖掘技技術(shù)聯(lián)機(jī)分分析處處理((OLAP)是對對立方方體中中的數(shù)數(shù)據(jù)進(jìn)進(jìn)行在在線的的分析析,可可以包包括切片、、切塊塊、鉆鉆取、、旋轉(zhuǎn)轉(zhuǎn)、鉆鉆透等分析析方法法;根據(jù)數(shù)數(shù)據(jù)的的存儲儲模式式不同同OLAP可劃分分為:MOLAP、ROLAP、HOLAP三種OLAP概念主流的的OLAP產(chǎn)品有有OracleExpress/Discoverer、SQLServerAnalysisServices、DB2OLAPServer、SASOLAPServer等,這這些產(chǎn)產(chǎn)品都都可以以生成成多維維數(shù)據(jù)據(jù)立方方體,,提供供多維維數(shù)據(jù)據(jù)的快快速分分析,,支持持所有有主流流關(guān)系系型數(shù)數(shù)據(jù)庫庫如DB2,Oracle,SQLServer,Sybase等,同同時可可讀取取關(guān)系系數(shù)據(jù)據(jù)庫中中細(xì)節(jié)節(jié)數(shù)據(jù)據(jù),實實現(xiàn)混混合在在線分分析(HOLAP)或關(guān)系系型在在線分分析(ROLAP)商務(wù)智智能核核心技技術(shù)-OLAP旋轉(zhuǎn)、、切片片、鉆鉆取、、鉆透透分析析聯(lián)動分分析模型預(yù)預(yù)測分分析7、商務(wù)務(wù)智能能核心心技術(shù)術(shù)有哪哪些??三.ETL技術(shù)二.元數(shù)據(jù)據(jù)管理理技術(shù)術(shù)一.數(shù)據(jù)倉倉庫技技術(shù)四.在線聯(lián)聯(lián)機(jī)分分析處處理技技術(shù)((OLAP)五.數(shù)據(jù)挖挖掘技技術(shù)數(shù)據(jù)挖挖掘((DataMining)是采采用數(shù)數(shù)學(xué)的的、統(tǒng)統(tǒng)計的的、人人工智智能和和神經(jīng)經(jīng)網(wǎng)絡(luò)絡(luò)等領(lǐng)領(lǐng)域的的科學(xué)學(xué)方法法,從從大量量數(shù)據(jù)據(jù)中挖挖掘出出隱含含的、、先前前未知知的、、對決決策有有潛在在價值值的關(guān)關(guān)系、、模式式和趨趨勢,,并用用這些些知識識和規(guī)規(guī)則建建立用用于決決策支支持的的模型型,為為商業(yè)業(yè)智能能系統(tǒng)統(tǒng)服務(wù)務(wù)的各各業(yè)務(wù)務(wù)領(lǐng)域域提供供預(yù)測測性決決策支支持的的方法法、工工具和和過程程。數(shù)據(jù)挖挖掘前前身是是知識識發(fā)現(xiàn)現(xiàn)(KDD,KnowledgeDiscoveryinDatabases),屬屬于機(jī)機(jī)器學(xué)學(xué)習(xí)的的范疇疇,所所用技技術(shù)和和工具具主要要有統(tǒng)統(tǒng)計分分析((或數(shù)數(shù)據(jù)分分析))和知知識發(fā)發(fā)現(xiàn)。。知識識發(fā)現(xiàn)現(xiàn)與數(shù)數(shù)據(jù)挖挖掘是是人工工智能能、機(jī)機(jī)器學(xué)學(xué)習(xí)與與數(shù)據(jù)據(jù)庫技技術(shù)相相結(jié)合合的產(chǎn)產(chǎn)物,,是從從數(shù)據(jù)據(jù)中發(fā)發(fā)現(xiàn)有有用知知識的的整個個過程程。數(shù)據(jù)挖挖掘概概念1.?dāng)?shù)據(jù)據(jù)選擇擇數(shù)據(jù)選選擇過過程是是根據(jù)據(jù)用戶戶的挖挖掘目目標(biāo),,交互互式地地完成成對源源數(shù)據(jù)據(jù)的裁裁減,,使生生成的的目標(biāo)標(biāo)數(shù)據(jù)據(jù)只集集中在在與挖挖掘目目標(biāo)相相一致致的數(shù)數(shù)據(jù)上上。目目標(biāo)數(shù)數(shù)據(jù)應(yīng)應(yīng)該以以適合合于挖挖掘的的形式式進(jìn)行行組織織,常常用的的是關(guān)關(guān)系數(shù)數(shù)據(jù)庫庫或多多維數(shù)數(shù)據(jù)立立方體體等形形式。。2.模型型建立立數(shù)據(jù)特特征探探索、、分析析和預(yù)預(yù)處理理,消消除數(shù)數(shù)據(jù)中中的噪噪聲,,然后后建立立挖掘掘模型型并實實施對對應(yīng)的的算法法。3.模型型驗證證不論是是自己己建立立挖掘掘模型型還是是選取取或改改進(jìn)已已有模模型都都必須須要進(jìn)進(jìn)行驗驗證。。這種種驗證證最常常用的的方法法是樣樣本學(xué)學(xué)習(xí)。。先用用一部部分?jǐn)?shù)數(shù)據(jù)建建立模模型,,然后后再用用剩下下的數(shù)數(shù)據(jù)來來測試試和驗驗證這這個模模型。。數(shù)據(jù)挖挖掘是是一個個反復(fù)復(fù)的過過程。。通過過反復(fù)復(fù)的交交互式式執(zhí)行行和驗驗證才才能找找到解解決問問題的的最好好途徑徑。通通過不不斷地地產(chǎn)生生、篩篩選和和驗證證,才才能能把有有意義義的知知識集集成到到企業(yè)業(yè)的知知識庫庫或商商業(yè)智智能系系統(tǒng)中中去。。數(shù)據(jù)挖挖掘三三個步步驟分類::樣本本分析析貝葉斯斯分類類貝葉斯斯分類類是利利用貝貝葉斯斯公式式,通通過計計算每每個特特征下下分類類的條條件概概率,,來計計算某某個特特征組組合實實例的的分類類概率率,選選取最最大概概率的的分類類作為為分類類結(jié)果果,樸樸素貝貝葉斯斯分類類要求求各特特征間間是相相互獨獨立的的,對對異常常的反反應(yīng)敏敏感。。常見見的貝貝葉斯斯分類類器有有NaiveBayes,TAN,BAN,GBN等方法法。KNN法KNN(K-NearestNeighbor)法即即K最近鄰鄰法,,最初初由Cover和Hart于1968年提出出的,,是一一個理理論上上比較較成熟熟的方方法。。該方方法的的思路路非常常簡單單直觀觀:如如果一一個樣樣本在在特征征空間間中的的K個最相相似((即特特征空空間中中最鄰鄰近))的樣樣本中中的大大多數(shù)數(shù)屬于于某一一個類類別,,則該該樣本本也屬屬于這這個類類別。。該方方法在在定類類決策策上只只依據(jù)據(jù)最鄰鄰近的的一個個或者者幾個個樣本本的類類別來來決定定待分分樣本本所屬屬的類類別。。該方方法的的不足足之處處是計計算量量較大大。SVM法SVM法即支支持向向量機(jī)機(jī)(SupportVectorMachine)法,,由Vapnik等人于于1995年提出出,具具有相相對優(yōu)優(yōu)良的的性能能指標(biāo)標(biāo)。該該方法法是建建立在在統(tǒng)計計學(xué)習(xí)習(xí)理論論基礎(chǔ)礎(chǔ)上的的機(jī)器器學(xué)習(xí)習(xí)方法法。通通過學(xué)學(xué)習(xí)算算法,,SVM可以自自動尋尋找出出那些些對分分類有有較好好區(qū)分分能力力的支支持向向量,,由此此構(gòu)造造出的的分類類器可可以最最大化化類與與類的的間隔隔,因因而有有較好好的適適應(yīng)能能力和和較高高的分分準(zhǔn)率率。該該方法法只需需要由由各類類域的的邊界界樣本本的類類別來來決定定最后后的分分類結(jié)結(jié)果。。數(shù)據(jù)挖挖掘方方法聚類分分析::馬氏氏距離離,K距離聚類分分析((Cluster)根據(jù)據(jù)已知知數(shù)據(jù)據(jù),計計算各各觀察察個體體或變變量之之間親親疏關(guān)關(guān)系的的統(tǒng)計計量((距離離或相相關(guān)系系數(shù)))。根根據(jù)某某種準(zhǔn)準(zhǔn)則((最短短距離離法、、最長長距離離法、、中間間距離離法、、重心心法等等),,使同同一類類內(nèi)的的差別別較小小,而而類與與類之之間的的差別別較大大,最最終將將觀察察個體體或變變量分分為若若干類類。聚類分分析主主要用用在客客戶和和市場場細(xì)分分方面面。以以客戶戶關(guān)系系管理理為例例,利利用聚聚類分分析,,根據(jù)據(jù)客戶戶在不不同特特征如如性別別、年年齡、、收入入水平平、交交易歷歷史、、教育育狀況況、家家庭情情況等等方面面的相相似程程度,,對客客戶進(jìn)進(jìn)行分分類。。通過過聚類類分析析,企企業(yè)往往往可可以發(fā)發(fā)現(xiàn)客客戶的的喜好好或行行為模模式,,了解解客戶戶的共共性,,從而而提供供有針針對性性的客客戶服服務(wù),,提高高企業(yè)業(yè)服務(wù)務(wù)成功功率,,如提提供針針對性性的產(chǎn)產(chǎn)品組組合等等等。。關(guān)聯(lián)分分析::發(fā)現(xiàn)現(xiàn)關(guān)聯(lián)聯(lián)規(guī)則則,事事件序序列,,相似似性時時間序序列關(guān)聯(lián)分分析((Association)反映映一個個事件件和其其它事事件之之間的的依賴賴或關(guān)關(guān)聯(lián)。。數(shù)據(jù)據(jù)庫中中的數(shù)數(shù)據(jù)關(guān)關(guān)聯(lián)是是現(xiàn)實實世界界中事事物聯(lián)聯(lián)系的的表現(xiàn)現(xiàn)。關(guān)關(guān)聯(lián)可可分為為簡單單關(guān)聯(lián)聯(lián)、時時序((TimeSeries)關(guān)聯(lián)聯(lián)、因因果關(guān)關(guān)聯(lián)、、數(shù)量量關(guān)聯(lián)聯(lián)等。。這些些關(guān)聯(lián)聯(lián)并不不總是是事先先知道道的,,而而是通通過數(shù)數(shù)據(jù)庫庫中數(shù)數(shù)據(jù)的的關(guān)聯(lián)聯(lián)分析析獲得得的,,因而而對商商業(yè)決決策具具有新新價值值。關(guān)聯(lián)聯(lián)分分析析常常被被用用于于市市場場購購物物籃籃分分析析、、交交叉叉銷銷售售,,促促銷銷計計劃劃等等。。例例如如,,在在尋尋求求諸諸如如當(dāng)當(dāng)購購買買油油漆漆時時是是否否購購買買刷刷子子一一類類的的模模式式過過程程中中,,人人們們發(fā)發(fā)現(xiàn)現(xiàn),,如如果果顧顧客客購購買買了了油油漆漆,,有有20%的可可能能性性也也會會購購買買刷刷子子。。統(tǒng)計計分分析析方方法法非線線性性回回歸歸分分析析((Nonlinearregression)、、邏邏輯輯回回歸歸分分析析、、單單變變量量分分析析、、多多變變量量分分析析、、時時間間序序列列分分析析、、最最近近鄰鄰算算法法。。數(shù)據(jù)據(jù)挖挖掘掘方方法法T檢驗驗假設(shè)設(shè)檢檢驗驗方方法法,,主主要要用用來來比比較較兩兩個個總總體體均均值值的的差差異異是是否否顯顯著著。。方差差分分析析((AnalysisofVariance,ANOVA)超過過兩兩個個總總體體的的均均值值檢檢驗驗,,也也經(jīng)經(jīng)常常用用于于實實驗驗設(shè)設(shè)計計后后的的檢檢驗驗問問題題。。主成成分分分分析析和和因因子子分分析析主成成分分分分析析((PrincipleAnalysis)和和因因子子分分析析((FactorAnalysis)目目標(biāo)標(biāo)是是找找出出多多個個潛潛藏藏的的變變量量之之間間的的關(guān)關(guān)系系,,主主要要用用在在消消費(fèi)費(fèi)者者行行為為態(tài)態(tài)度度等等研研究究、、價價值值觀觀態(tài)態(tài)度度語語句句的的分分析析、、市市場場細(xì)細(xì)分分之之前前的的因因子子聚聚類類等等,,問問卷卷的的信信度度和和效效度度檢檢驗驗等等,,因因子子分分析析也也可可算算是是數(shù)數(shù)據(jù)據(jù)的的預(yù)預(yù)處處理理技技術(shù)術(shù)。。主主成成分分分分析析與與因因子子分分析析是是兩兩種種方方法法,,要要能能夠夠區(qū)區(qū)分分。。主主成成分分分分析析可可以以消消減減變變量量,,權(quán)權(quán)重重等等,,主主成成分分還還可可以以用用作作構(gòu)構(gòu)建建綜綜合合排排名名統(tǒng)統(tǒng)計計分分析析方方法法。。時間間序序列列分分析析時間間序序列列分分析析((TimeSequence)用用于于識識別別具具體體具具有有先先后后次次序序的的不不同同時時間間之之間間的的關(guān)關(guān)聯(lián)聯(lián)性性。。比比如如,,客客戶戶一一月月購購買買了了飯飯盒盒和和帳帳篷篷,,二二月月購購買買了了旅旅行行背背包包和和錄錄像像帶帶,,三三月月購購買買了了睡睡袋袋。。時時間間序序列列分分析析查查看看所所有有記記錄錄并并返返回回如如下下規(guī)規(guī)則則::如如果果一一月月的的購購買買目目標(biāo)標(biāo)中中包包括括飯飯盒盒,,則則三三月月購購買買睡睡袋袋的的機(jī)機(jī)率率是是30%。關(guān)關(guān)聯(lián)聯(lián)分分析析可可發(fā)發(fā)現(xiàn)現(xiàn)時時間間相相關(guān)關(guān)性性。。回歸歸分分析析回歸歸分分析析((RegressionAnalysis)是是重重要要的的認(rèn)認(rèn)識識多多變變量量分分析析的的基基礎(chǔ)礎(chǔ)方方法法,,只只有有掌掌握握了了回回歸歸我我們們才才能能進(jìn)進(jìn)入入多多變變量量分分析析,,其其它它很很多多方方法法都都是是變變種種。。主主要要用用在在影影響響研研究究、、滿滿意意度度研研究究等等,,當(dāng)當(dāng)然然市市場場研研究究基基本本上上是是解解釋釋性性回回歸歸分分析析,,也也就就是是不不注注重重預(yù)預(yù)測測而而關(guān)關(guān)注注解解釋釋自自變變量量對對因因變變量量的的影影響響。。主主要要把把握握R平方方、、逐逐步步回回歸歸、、標(biāo)標(biāo)準(zhǔn)準(zhǔn)化化回回歸歸系系數(shù)數(shù)((當(dāng)當(dāng)作作權(quán)權(quán)重重或或重重要要性性))等等;;回回歸歸也也是是預(yù)預(yù)處處理理技技術(shù)術(shù),,缺缺省省值值處處理理等等。。數(shù)據(jù)據(jù)挖挖掘掘方方法法Logistics回歸歸技技術(shù)術(shù)分類類技技術(shù)術(shù),,主主要要針針對對因因變變量量是是0-1情況況下下的的判判別別,,該該技技術(shù)術(shù)是是我我們們認(rèn)認(rèn)識識非非線線性性關(guān)關(guān)系系的的重重要要基基礎(chǔ)礎(chǔ),,很很多多情情況況下下,,我我們們需需要要作作出出是是與與否否的的判判斷斷,,基基礎(chǔ)礎(chǔ)模模型型就就是是它它了了,,像像客客戶戶離離網(wǎng)網(wǎng)分分析析、、客客戶戶價價值值分分析析、、客客戶戶信信用用等等都都用用這這個個模模型型;;方方差差分分析析((AnalysisofVariance,ANOVA)。。決策策樹樹((Decisiontrees)::主主要要用用于于分分類類和和細(xì)細(xì)分分,,分分析析事事件件分分支支及及概概率率分分布布。。決策策樹樹是是將將特特征征的的判判別別序序列列形形成成一一顆顆樹樹,,從從樹樹根根到到葉葉子子節(jié)節(jié)點點進(jìn)進(jìn)行行每每個個節(jié)節(jié)點點的的判判斷斷,,葉葉子子節(jié)節(jié)點點處處對對應(yīng)應(yīng)某某個個類類別別標(biāo)標(biāo)號號,,就就是是最最終終的的分分類類結(jié)結(jié)果果。。決策策樹樹分分類類的的關(guān)關(guān)鍵鍵是是樹樹的的構(gòu)構(gòu)造造,,由由每每個個節(jié)節(jié)點點引引申申每每個個屬屬性性的的判判別別分分支支。。如如何何選選擇擇特特征征屬屬性性的的判判別別順順序序??一一種種方方法法是是利利用用每每個個特特征征對對最最終終分分類類結(jié)結(jié)果果的的區(qū)區(qū)分分度度((訓(xùn)訓(xùn)練練集集中中)),,常常用用的的區(qū)區(qū)分分標(biāo)標(biāo)準(zhǔn)準(zhǔn)有有卡卡方方,,信信息息增增益益,,信信息息增增益益率率。。主主要要的的決決策策樹樹算算法法有有ID3,C4.5,CHAID,CART,Quest和C5.0。神經(jīng)經(jīng)網(wǎng)網(wǎng)絡(luò)絡(luò)方方法法::正正向向傳傳播播和和反反向向傳傳播播神經(jīng)經(jīng)網(wǎng)網(wǎng)絡(luò)絡(luò)((Neuralnetworks)方方法法的的目目標(biāo)標(biāo)是是捕捕獲獲市市場場巴巴素素((如如廣廣告告等等促促銷銷手手段段))與與總總的的銷銷售售額額間間的的復(fù)復(fù)雜雜關(guān)關(guān)系系,,找找出出輸輸人人量量變變化化引引起起的的輸輸出出量量波波動動之之間間的的映映射射關(guān)關(guān)系系,,通通過過神神經(jīng)經(jīng)網(wǎng)網(wǎng)絡(luò)絡(luò)的的預(yù)預(yù)報報模模型型和和敏敏感感性性分分析析可可能能找找出出重重要要的的影影響響因因子子,,此此模模型型能能夠夠在在給給定定的的短短期期預(yù)預(yù)報報中中取取得得良良好好的的性性能能。。反向傳播播神經(jīng)網(wǎng)網(wǎng)絡(luò)適合合于每日日或每周周數(shù)據(jù)預(yù)預(yù)報.與反向傳傳播相比比,正向向傳播神神經(jīng)網(wǎng)絡(luò)絡(luò)在速度度方面更更具優(yōu)勢勢。遺傳算法法(人工工生命))博弈算法法數(shù)據(jù)挖掘掘方法三、實施施篇商務(wù)智能能一個成功功商務(wù)智智能案例例需要做做些什么么?商務(wù)智能能實施三.商務(wù)智能能實施方方法二.商務(wù)智能能實施經(jīng)經(jīng)驗一.商務(wù)智能實施層次一、商務(wù)務(wù)智能實實施層次次實施商務(wù)務(wù)智能一一定是業(yè)業(yè)務(wù)驅(qū)動動,目標(biāo)標(biāo)導(dǎo)向。。與ERP等系統(tǒng)最最大的區(qū)區(qū)別是,,ERP是企業(yè)的的運(yùn)營系系統(tǒng),管管理企業(yè)業(yè)的日常常流程,,以流程程為導(dǎo)向向。而商商務(wù)智能能是目標(biāo)標(biāo)導(dǎo)向,,那么要要做好商商務(wù)智能能,企業(yè)業(yè)要明確確解決什什么問題題。當(dāng)企企業(yè)明確確了要解解決的問問題后,,再分析析為了解解決這些些問題要要采取哪哪些方式式。企業(yè)級商商業(yè)智能能的構(gòu)建建是一個個系統(tǒng)工工程,它它有三個個層次,,需要一一步一步步建設(shè)。。第一個層層次BusinessInformation-Mode是整個BI工程的基基礎(chǔ);第二個層層次BusinessIntegration是整個BI工程的技技術(shù)實現(xiàn)現(xiàn)基礎(chǔ);;第三個層層次BusinessIntelligence才是真正正意義上上的商業(yè)業(yè)智能的的軟件實實現(xiàn)。4、商務(wù)智智能實施施三.商務(wù)智能能實施方方法一.商務(wù)智能能實施層層次二.商務(wù)智能實施經(jīng)驗二、商務(wù)務(wù)智能實實施經(jīng)驗驗1)數(shù)據(jù)據(jù)種類少少、數(shù)據(jù)據(jù)量大是是企業(yè)實實施商業(yè)業(yè)智能應(yīng)應(yīng)用的最最佳環(huán)境境,因為為這將有有利于數(shù)數(shù)據(jù)整合合、轉(zhuǎn)換換、清洗洗、抽取取、裝載載及數(shù)據(jù)據(jù)模型的的建立。。2)先導(dǎo)導(dǎo)入ERP有利于數(shù)數(shù)據(jù)整合合,減少少導(dǎo)入BI系統(tǒng)的工工作量,,缺點是是需要增增加ERP的導(dǎo)入周周期。3)首先先確定企企業(yè)需求求,定義義明確的的目標(biāo)和和收益率率,以重重點業(yè)務(wù)務(wù)為突破破口(自自上而下下),選選擇合適適的數(shù)據(jù)據(jù)倉庫產(chǎn)產(chǎn)品和系系統(tǒng)架構(gòu)構(gòu),迅速速部署,,風(fēng)險控控制,然然后在使使用中逐逐步調(diào)整
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鞏義市2024-2025學(xué)年六年級下學(xué)期小升初真題數(shù)學(xué)試卷含解析
- 昆明幼兒師范高等專科學(xué)?!督ㄖY(jié)構(gòu)選型》2023-2024學(xué)年第二學(xué)期期末試卷
- 武漢華夏理工學(xué)院《文本挖掘》2023-2024學(xué)年第二學(xué)期期末試卷
- 黑龍江省七臺河市勃利縣小五站鎮(zhèn)慶云村小學(xué)2025屆數(shù)學(xué)三下期末考試試題含解析
- 浙江農(nóng)林大學(xué)《泌尿、生殖與內(nèi)分泌系統(tǒng)醫(yī)學(xué)教程》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年鉆石市場分析:中國產(chǎn)能沖擊下全球格局劇變與核心數(shù)據(jù)解讀
- 2025年光伏市場分析:供需格局與價格走勢解析
- 樁間擋板施工方案
- 東側(cè)樓梯施工方案
- 彩鋼瓦清洗噴漆施工方案
- 2024-2025學(xué)年第二學(xué)期天域全國名校協(xié)作體高三3月聯(lián)考 地理試卷(含答案)
- 修理木橋施工合同范本
- 學(xué)校2025年每日兩小時體育活動方案-陽光體育活力四溢
- GB/T 45107-2024表土剝離及其再利用技術(shù)要求
- 5G優(yōu)化案例:5G波束配置優(yōu)化提升CQI優(yōu)良比案例
- JT-T-1202-2018城市公共汽電車場站配置規(guī)范
- DZ∕T 0201-2020 礦產(chǎn)地質(zhì)勘查規(guī)范 鎢、錫、汞、銻(正式版)
- 新教科版六年級科學(xué)下冊教學(xué)計劃
- GB/T 18747.1-2002厭氧膠粘劑扭矩強(qiáng)度的測定(螺紋緊固件)
- 2023年廣州港集團(tuán)有限公司校園招聘筆試題庫及答案解析
- 《書憤》PPT課件
評論
0/150
提交評論