下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
題型:選擇10*1分,單項(xiàng)選擇10*1分,填空8*1分,計(jì)算4*9分,問答4*9分。商務(wù)智能概述1.數(shù)據(jù)數(shù)據(jù)是可以記錄、通信和能識(shí)別的符號(hào),它通過有意義的組合來表達(dá)現(xiàn)實(shí)世界中的某種實(shí)體〔具體對(duì)象、事件、狀態(tài)或活動(dòng)〕的特征。商務(wù)智能技術(shù)可以分析結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)、靜態(tài)的歷史數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)流等各種類型的數(shù)據(jù)。2.3.BI定義定義一:BusinessIntelligenceisaprocessofturningdataintoknowledgeandknowledgeintoactionforbusinessgain.(DataWarehouseInstitute)標(biāo)準(zhǔn)定義:商務(wù)智能是企業(yè)利用現(xiàn)代信息技術(shù)收集、管理和分析結(jié)構(gòu)化和非結(jié)構(gòu)化的商務(wù)數(shù)據(jù)和信息,創(chuàng)造和累計(jì)商務(wù)知識(shí)和見解,改善商務(wù)決策水平,采取有效的商務(wù)行動(dòng),完善各種商務(wù)流程,提升各方面商務(wù)績效,增強(qiáng)綜合競(jìng)爭力的智慧和能力。4.商務(wù)智能的結(jié)構(gòu)〔1〕商務(wù)智能的結(jié)構(gòu)主要由兩局部組成:數(shù)據(jù)倉庫環(huán)境分析環(huán)境〔2〕商務(wù)智能主要由三種技術(shù)構(gòu)成:數(shù)據(jù)倉庫〔DataWarehouse〕聯(lián)機(jī)分析處理〔On-lineAnalysis,OLAP〕數(shù)據(jù)挖掘〔DataMining〕在三大技術(shù)支柱中,數(shù)據(jù)倉庫是商務(wù)智能的根底。聯(lián)機(jī)分析處理〔OLAP〕是以海量數(shù)據(jù)為根底的復(fù)雜分析技術(shù)。數(shù)據(jù)挖掘(DataMining)是從海量數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的但又可能有用的信息和知識(shí)的過程。決策支持系統(tǒng)結(jié)構(gòu)化:數(shù)據(jù)結(jié)構(gòu)字段含義確定、清晰。典型的如數(shù)據(jù)庫中的表結(jié)構(gòu)半結(jié)構(gòu)化:具有一定結(jié)構(gòu),但語義不夠確定典型的如HTML網(wǎng)頁,有些字段是確定的(title),有些不確定(table)非結(jié)構(gòu)化:雜亂無章的數(shù)據(jù),很難按照一個(gè)概念去進(jìn)行抽取,無規(guī)律性DSS的產(chǎn)生背景電子數(shù)據(jù)處理——EDP〔ElectronicData Processing〕管理信息系統(tǒng)——MIS〔ManagementInformationSystems〕決策支持系統(tǒng)——DSS〔DecisionSupportSystems〕〔70年代中期提出〕3.DSS的定義決策支持系統(tǒng)(DSS)是以管理科學(xué),運(yùn)籌學(xué),控制論和行為科學(xué)為根底,以計(jì)算機(jī)技術(shù),仿真技術(shù)和信息技術(shù)為手段,針對(duì)半結(jié)構(gòu)化和非結(jié)構(gòu)化的決策問題,支持決策活動(dòng)的具有智能作用的人機(jī)系統(tǒng).DSS的構(gòu)造DSS的構(gòu)造研究主要解決DSS的組成問題,即組成DSS的部件。現(xiàn)在,經(jīng)典提法是:DSS=四庫系統(tǒng)+對(duì)話系統(tǒng)〔人機(jī)界面〕四庫系統(tǒng):數(shù)據(jù)庫系統(tǒng)、模型庫系統(tǒng)、方法庫系統(tǒng)、知識(shí)庫系統(tǒng)。4.模型庫〔ModelBase〕提供模型的存儲(chǔ)和表示模式。模型庫管理系統(tǒng)提供模型的提取、訪問、更新和合成等操作。數(shù)據(jù)倉庫數(shù)據(jù)倉庫〔DataWarehouse,DW〕的概念是92年提出來的。2.?dāng)?shù)據(jù)處理被分為兩大類:操作型處理〔OLTP〕和分析型處理〔OLAP〕(1)區(qū)別:操作型處理以傳統(tǒng)的數(shù)據(jù)庫為中心進(jìn)行企業(yè)的日常業(yè)務(wù)處理。如電信部門部門的計(jì)費(fèi)數(shù)據(jù)庫用于記錄客戶的通信消費(fèi)情況;銀行的數(shù)據(jù)庫用于記錄客戶的帳號(hào)、密碼、存入和支出等一系列業(yè)務(wù)行為。分析型處理以數(shù)據(jù)倉庫為中心分析數(shù)據(jù)背后的關(guān)聯(lián)和規(guī)律,為企業(yè)決策提供可靠有效的依據(jù)。如對(duì)超市近期數(shù)據(jù)進(jìn)行分析可以發(fā)現(xiàn)近期暢銷的產(chǎn)品,從而為公司采購部門提供指導(dǎo)信息。(2)操作型處理&分析型處理的比擬1〕使用的人員和處理的數(shù)據(jù)操作型系統(tǒng)的使用人員通常是企業(yè)的具體操作人員,處理的數(shù)據(jù)通常是企業(yè)業(yè)務(wù)的細(xì)節(jié)信息,其目標(biāo)是實(shí)現(xiàn)企業(yè)的業(yè)務(wù)運(yùn)營。分析型系統(tǒng)的使用人員通常是企業(yè)的中高層管理者,或者是從事數(shù)據(jù)分析的工程師,分析型系統(tǒng)包含的信息往往是企業(yè)的宏觀信息而非具體細(xì)節(jié),其目的是為企業(yè)的決策者提供支持信息。2〕環(huán)境操作型處理和分析型處理的別離,劃清了數(shù)據(jù)處理的分析型環(huán)境與操作型環(huán)境之間的界限,從而由原來以單一數(shù)據(jù)庫為中心的數(shù)據(jù)環(huán)境開展為以數(shù)據(jù)庫為中心的業(yè)務(wù)處理系統(tǒng)和以數(shù)據(jù)倉庫為根底的分析系統(tǒng)。3.商業(yè)智能系統(tǒng)由3個(gè)層次的內(nèi)容組成:數(shù)據(jù)倉庫、聯(lián)機(jī)分析處理〔OLAP〕和數(shù)據(jù)挖掘。商業(yè)智能系統(tǒng)的數(shù)據(jù)處理循環(huán):數(shù)據(jù)倉庫的體系結(jié)構(gòu)由于數(shù)據(jù)庫和數(shù)據(jù)倉庫應(yīng)用的出發(fā)點(diǎn)不同,數(shù)據(jù)倉庫將獨(dú)立于業(yè)務(wù)數(shù)據(jù)庫系統(tǒng),但是數(shù)據(jù)倉庫又同業(yè)務(wù)數(shù)據(jù)庫系統(tǒng)息息相關(guān)。也就是說,數(shù)據(jù)倉庫不是簡單地對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ),而是對(duì)數(shù)據(jù)進(jìn)行“再組織〞。數(shù)據(jù)清洗——數(shù)據(jù)不一致和不同步1〕數(shù)據(jù)不一致企業(yè)常常為不同的應(yīng)用對(duì)象建立不同的業(yè)務(wù)數(shù)據(jù)庫,這些業(yè)務(wù)系統(tǒng)中可能包含重復(fù)的信息;不同的數(shù)據(jù)庫可能使用不同數(shù)據(jù)庫公司的產(chǎn)品;不同的業(yè)務(wù)系統(tǒng)可能由不同的軟件開發(fā)商提供。這使得各個(gè)業(yè)務(wù)數(shù)據(jù)庫中的數(shù)據(jù)存在不一致的現(xiàn)象。數(shù)據(jù)庫使用人員的操作失誤也會(huì)造成數(shù)據(jù)的不一致。2〕數(shù)據(jù)不同步由于冗余的數(shù)據(jù)存放在不同的數(shù)據(jù)庫中,如果不同數(shù)據(jù)庫間的數(shù)據(jù)更新不是實(shí)時(shí)的,那么可能出現(xiàn)數(shù)據(jù)不同步的情況。6.數(shù)據(jù)轉(zhuǎn)化由于業(yè)務(wù)系統(tǒng)可能使用不同的數(shù)據(jù)庫廠商的產(chǎn)品,各種數(shù)據(jù)庫產(chǎn)品提供的數(shù)據(jù)類型可能不同,因此需要將不同格式的數(shù)據(jù)轉(zhuǎn)化成統(tǒng)一的數(shù)據(jù)格式。7.元數(shù)據(jù)〔數(shù)據(jù)的數(shù)據(jù)〕數(shù)據(jù)倉庫的元數(shù)據(jù)主要包括兩類:〔1〕第一種是為了從操作型環(huán)境向數(shù)據(jù)倉庫環(huán)境轉(zhuǎn)換而建立的元數(shù)據(jù),它包括所有源數(shù)據(jù)項(xiàng)的名稱、屬性及其在提取倉庫中的轉(zhuǎn)化;〔2〕第二種元數(shù)據(jù)在數(shù)據(jù)倉庫中是用來與最終用戶的多維商業(yè)模型和前端工具之間建立映射的,這種數(shù)據(jù)成為BI元數(shù)據(jù),它包括:1〕數(shù)據(jù)倉庫中信息的種類、存儲(chǔ)位置、存儲(chǔ)格式;2〕信息之間的關(guān)系、信息和業(yè)務(wù)的關(guān)系,數(shù)據(jù)使用的業(yè)務(wù)規(guī)那么;〔如:何時(shí)數(shù)據(jù)倉庫中的所有數(shù)據(jù)才能用于生成報(bào)表〕3〕數(shù)據(jù)模型;4〕數(shù)據(jù)模型和數(shù)據(jù)倉庫的關(guān)系。8.數(shù)據(jù)集市數(shù)據(jù)倉庫面向整個(gè)企業(yè),而數(shù)據(jù)集市那么是面向企業(yè)中的某個(gè)部門。面向企業(yè)中的某個(gè)部門〔主題〕而在邏輯上或物理上劃分出來的數(shù)據(jù)倉庫中的數(shù)據(jù)子集稱為數(shù)據(jù)集市。當(dāng)部門人員使用數(shù)據(jù)時(shí),不需要到數(shù)據(jù)倉庫的巨量數(shù)據(jù)中檢索,而只需在這些數(shù)據(jù)上進(jìn)行分析,因此從效率和處理速度的角度出發(fā),這種劃分是合理的。獨(dú)立和依賴的數(shù)據(jù)集市。9.數(shù)據(jù)倉庫的功能和特征傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)由于主要用于企業(yè)的日常事務(wù)處理工作,存放在數(shù)據(jù)庫中的數(shù)據(jù)根本符合操作型數(shù)據(jù)的特點(diǎn)。而為了適應(yīng)數(shù)據(jù)分析處理的要求而產(chǎn)生的數(shù)據(jù)倉庫中存放的數(shù)據(jù),根本符合分析型數(shù)據(jù)的特點(diǎn)。10.區(qū)別:11.數(shù)據(jù)轉(zhuǎn)化數(shù)據(jù)轉(zhuǎn)化通??赡馨缦聠栴}:〔1〕數(shù)據(jù)格式〔2〕測(cè)量單位〔3〕數(shù)據(jù)代碼含義混亂〔4〕數(shù)據(jù)名稱混亂12.BI需要的不是靜態(tài)的集成,而是動(dòng)態(tài)的集成。13.數(shù)據(jù)庫系統(tǒng)中數(shù)據(jù)是不穩(wěn)定的,數(shù)據(jù)倉庫中的數(shù)據(jù)相對(duì)穩(wěn)定。數(shù)據(jù)倉庫的數(shù)據(jù)只增不刪,這使得數(shù)據(jù)倉庫的數(shù)據(jù)總是擁有時(shí)間維度。14.硬件的利用模式在數(shù)據(jù)庫環(huán)境下,硬件資源的利用率總保持在一個(gè)相對(duì)穩(wěn)定的狀態(tài),這是由于不斷地有事務(wù)需要處理。而在數(shù)據(jù)倉庫環(huán)境下,硬件資源的利用率常常在高利用率和低利用率之間切換。當(dāng)系統(tǒng)進(jìn)行數(shù)據(jù)分析應(yīng)用時(shí),硬件資源的利用率將很高;而系統(tǒng)空閑時(shí),系統(tǒng)的硬件利用率很低。15.數(shù)據(jù)倉庫的數(shù)據(jù)組織結(jié)構(gòu)在數(shù)據(jù)倉庫中,數(shù)據(jù)被分成4種級(jí)別,分別是:高度綜合級(jí)輕度綜合級(jí)當(dāng)前細(xì)節(jié)級(jí)早期細(xì)節(jié)級(jí)16.OLAP中的數(shù)據(jù)顆粒度粒度就是對(duì)數(shù)據(jù)倉庫中數(shù)據(jù)綜合程度的一個(gè)度量。數(shù)據(jù)粒度與數(shù)據(jù)量數(shù)據(jù)的綜合程度不同,其數(shù)據(jù)量將相差很大。數(shù)據(jù)粒度越小,信息越細(xì)節(jié),數(shù)據(jù)量越大。數(shù)據(jù)粒度越大,忽略了眾多的細(xì)節(jié),數(shù)據(jù)量越小。17.數(shù)據(jù)的分割所謂數(shù)據(jù)分割是指將數(shù)據(jù)分散到各自的物理單元中以便能夠獨(dú)立處理,提高數(shù)據(jù)處理的效率。數(shù)據(jù)分割后的數(shù)據(jù)單元稱為分片。數(shù)據(jù)分割沒有固定的標(biāo)準(zhǔn),分割的方法和粒度應(yīng)當(dāng)根據(jù)實(shí)際情況來確定。分割方法常??梢赃x擇時(shí)間、地點(diǎn)、業(yè)務(wù)領(lǐng)域來劃分。18.數(shù)據(jù)倉庫的數(shù)據(jù)追加技術(shù)〔1〕時(shí)標(biāo)法〔2〕前后映像比擬法〔3〕DELTA文件法〔4〕日志文件法19.清理數(shù)據(jù)倉庫的數(shù)據(jù)數(shù)據(jù)倉庫的清理與普通系統(tǒng)中數(shù)據(jù)清理的含義有區(qū)別。在普通的系統(tǒng)中,數(shù)據(jù)清理意味著將數(shù)據(jù)刪除。而數(shù)據(jù)倉庫系統(tǒng)中清理并不是簡單地刪除,而是從細(xì)化級(jí)別的數(shù)據(jù)逐漸上升為高級(jí)綜合度的數(shù)據(jù),直到數(shù)據(jù)已經(jīng)不再具備任何意義時(shí)被去除的過程。數(shù)據(jù)倉庫中清理的過程如下:數(shù)據(jù)從操作型環(huán)境進(jìn)入分析型環(huán)境;數(shù)據(jù)從細(xì)節(jié)數(shù)據(jù)逐漸轉(zhuǎn)換為綜合數(shù)據(jù);數(shù)據(jù)從高速磁盤中轉(zhuǎn)移到低速存儲(chǔ)介質(zhì)上;數(shù)據(jù)失去實(shí)際意義,最終被去除。這個(gè)過程實(shí)際上也是數(shù)據(jù)在數(shù)據(jù)倉庫中的生命周期。20.操作數(shù)據(jù)存儲(chǔ)〔ODS〕ODS是用于支持企業(yè)日常的全局應(yīng)用的數(shù)據(jù)集合。ODS解決的是“日常〞性問題,因而具有引入數(shù)據(jù)是可變的、數(shù)據(jù)是當(dāng)前或者近期的特點(diǎn),這個(gè)特點(diǎn)類似于傳統(tǒng)的數(shù)據(jù)庫。ODS是面向全局應(yīng)用的〔數(shù)據(jù)涉及多個(gè)部門〕,這使得ODS中的數(shù)據(jù)需要面向主題來組織,并且應(yīng)當(dāng)是實(shí)時(shí)集成的。所謂面向主題的,是指數(shù)據(jù)倉庫圍繞一些主題,并且更關(guān)注決策者的數(shù)據(jù)建模與分析,而不是集中于組織機(jī)構(gòu)的日常操作和事務(wù)處理21.記錄系統(tǒng)和參考表建立ODS實(shí)際上是建立了一個(gè)全局?jǐn)?shù)據(jù)庫,它通過在ODS中的記錄系統(tǒng)定義和參考表來建立一系列DB和ODS記錄間的雙向聯(lián)系,以實(shí)現(xiàn)數(shù)據(jù)在企業(yè)級(jí)上的同步。ODS的記錄系統(tǒng)就是說明如何從DB中向ODS進(jìn)行數(shù)據(jù)抽取。有了ODS記錄系統(tǒng)后,DB中對(duì)應(yīng)的數(shù)據(jù)項(xiàng)發(fā)生的變化,都將反映到相應(yīng)的ODS記錄中。參考表建立的是從ODS數(shù)據(jù)項(xiàng)到DB數(shù)據(jù)項(xiàng)的反向映射。當(dāng)ODS中的記錄發(fā)生變化時(shí),將通過參考表去修改與之相關(guān)的DB中所有數(shù)據(jù)項(xiàng)。其過程如下圖。數(shù)據(jù)庫A、B、C都存在相同含義的數(shù)據(jù)。數(shù)據(jù)庫A中的數(shù)據(jù)項(xiàng)發(fā)生變化后,通過ODS記錄系統(tǒng)定義,反映到ODS中對(duì)應(yīng)的數(shù)據(jù)項(xiàng);再通過參考表去更新數(shù)據(jù)庫B和C。通過記錄系統(tǒng)定義和參考表,使得原先分散的數(shù)據(jù)庫系統(tǒng)被緊密的結(jié)合起來,一點(diǎn)動(dòng),全局變。21.在DB—ODS—DW三層結(jié)構(gòu)中數(shù)據(jù)是如何流動(dòng)的在三層結(jié)構(gòu)中,數(shù)據(jù)的傳輸控制是通過兩級(jí)記錄系統(tǒng)的定義來實(shí)現(xiàn)的。ODS系統(tǒng)和DW系統(tǒng)都有各自的記錄系統(tǒng)和記錄系統(tǒng)的定義。ODS的記錄系統(tǒng)是定義在原有的數(shù)據(jù)庫系統(tǒng)中,DW的記錄系統(tǒng)是定義在ODS一致性數(shù)據(jù)環(huán)境中。ODS記錄系統(tǒng)的定義作為ODS元數(shù)據(jù)的一局部保存放在ODS區(qū)中,它指明需要如何從數(shù)據(jù)庫系統(tǒng)中提取數(shù)據(jù)。DW記錄系統(tǒng)的定義作為DW元數(shù)據(jù)的一局部存放在DW中,它指明需要如何從ODS環(huán)境中提取數(shù)據(jù),如圖2-45所示。聯(lián)機(jī)分析處理——OLAP1.OLAP系統(tǒng)按照其存儲(chǔ)器的數(shù)據(jù)存儲(chǔ)格式可以分為關(guān)系OLAP〔RelationalOLAP,簡稱ROLAP〕、多維OLAP〔MultidimensionalOLAP,簡稱MOLAP〕和混合型OLAP〔HybridOLAP,簡稱HOLAP〕三種類型。鉆取〔Dillup/Drilldown〕〔上鉆、下鉆〕電子商務(wù)與數(shù)據(jù)挖掘電子商務(wù)與數(shù)據(jù)挖掘結(jié)合的原因〔1〕電子商務(wù)提供海量的數(shù)據(jù)如果一個(gè)電子商務(wù)網(wǎng)站平均每個(gè)小時(shí)賣出五件物品,那么它一個(gè)月的平均點(diǎn)擊量是160萬次?!?〕豐富的記錄信息良好的WEB站點(diǎn)設(shè)計(jì)將有助于獲得豐富的信息〔3〕干凈的數(shù)據(jù)從電子商務(wù)站點(diǎn)收集的都是電子數(shù)據(jù),無需人工輸入或者是從歷史系統(tǒng)進(jìn)行整合〔4〕研究成果容易轉(zhuǎn)化在電子商務(wù)中,很多知識(shí)發(fā)現(xiàn)都可以進(jìn)行直接應(yīng)用投資收益容易衡量2.可以在一個(gè)電子商務(wù)網(wǎng)站挖掘些什么東西?內(nèi)容挖掘(WebConten
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度戶外廣告租賃合同最長期限標(biāo)準(zhǔn)
- 二零二五年度海綿城市建設(shè)簡易版施工合同
- 二零二五年度舞蹈教育家長參與權(quán)益保障合同
- 二零二五年度租賃合同解除與租戶個(gè)人信息保護(hù)協(xié)議
- 二零二五年度冷鏈物流聘用司機(jī)聘用合同
- 2025年度租房合同終止及換房事宜處理合同
- 2025年度二零二五年度生態(tài)農(nóng)業(yè)門面使用權(quán)轉(zhuǎn)讓合同
- 超市裝修預(yù)定金合同范本
- 酒店裝修合同驗(yàn)收注意事項(xiàng)
- 司機(jī)運(yùn)輸合同
- 2025年上半年長沙市公安局招考警務(wù)輔助人員(500名)易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025河北邯鄲世紀(jì)建設(shè)投資集團(tuán)招聘專業(yè)技術(shù)人才30人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 慈溪高一期末數(shù)學(xué)試卷
- 貴州省黔東南州2024年七年級(jí)上學(xué)期數(shù)學(xué)期末考試試卷【附答案】
- 醫(yī)院廉潔自律承諾書
- 企業(yè)招聘技巧培訓(xùn)
- 學(xué)校校本課程《英文電影鑒賞》文本
- 重大事故隱患判定標(biāo)準(zhǔn)與相關(guān)事故案例培訓(xùn)課件
- 2024年度節(jié)后復(fù)工建筑施工安全培訓(xùn)交底
- 皮內(nèi)注射技術(shù)操作考核評(píng)分標(biāo)準(zhǔn)
- 個(gè)人借條電子版模板
評(píng)論
0/150
提交評(píng)論