![商務(wù)智能期末考試整理_第1頁](http://file4.renrendoc.com/view/a0f5208f0ae73832eb1ed77609e1a167/a0f5208f0ae73832eb1ed77609e1a1671.gif)
![商務(wù)智能期末考試整理_第2頁](http://file4.renrendoc.com/view/a0f5208f0ae73832eb1ed77609e1a167/a0f5208f0ae73832eb1ed77609e1a1672.gif)
![商務(wù)智能期末考試整理_第3頁](http://file4.renrendoc.com/view/a0f5208f0ae73832eb1ed77609e1a167/a0f5208f0ae73832eb1ed77609e1a1673.gif)
![商務(wù)智能期末考試整理_第4頁](http://file4.renrendoc.com/view/a0f5208f0ae73832eb1ed77609e1a167/a0f5208f0ae73832eb1ed77609e1a1674.gif)
![商務(wù)智能期末考試整理_第5頁](http://file4.renrendoc.com/view/a0f5208f0ae73832eb1ed77609e1a167/a0f5208f0ae73832eb1ed77609e1a1675.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
-z.第一講商務(wù)智能概述〔綜合論述題〕學(xué)習(xí)本課程的原因:現(xiàn)代管理需要基于計算機(jī)的方法讓決策更有有效性企業(yè)需要有智能A:在分析型商務(wù)智能軟件的幫助下,用戶可以建立統(tǒng)一的企業(yè)數(shù)據(jù)倉庫平臺,并收集,訪問,分析每個商業(yè)領(lǐng)域的數(shù)據(jù),同時,數(shù)據(jù)庫技術(shù)的進(jìn)步,效勞器性能的提升以及分析軟件算法的優(yōu)化,是的訪問大型數(shù)據(jù)庫處理海量信息變得更加容易便捷。B:商務(wù)智能可以提供個性化效勞,以滿足不同用戶的需求,智能搜索可以給決策者以很好的數(shù)據(jù)分析。與本專業(yè)的關(guān)聯(lián)性:信息技術(shù)迅速開展的今天,電子商務(wù)已在國民經(jīng)濟(jì)中顯現(xiàn)出極其重要的作用。伴隨著效勞形態(tài)在全球擴(kuò),市場需求多樣化,社會網(wǎng)絡(luò)的廣泛建立等社會經(jīng)濟(jì)巨大變革;數(shù)據(jù)量正以每年翻倍的速度擴(kuò)增,然而數(shù)據(jù)源分散,異構(gòu)數(shù)據(jù)庫難以整合,數(shù)據(jù)接口復(fù)雜等問題嚴(yán)重,導(dǎo)致大量數(shù)據(jù)中真正能被利用來分析和運(yùn)用的數(shù)據(jù)缺乏10%。如何將數(shù)據(jù)有效轉(zhuǎn)化為決策者所需要的信息,提升電子商務(wù)整體應(yīng)用水平,已經(jīng)成為政府,企業(yè)界和軟件開發(fā)界關(guān)注的一個研究方向。〔BI開展趨勢:績效管理,產(chǎn)品模塊的集成,構(gòu)造化和非構(gòu)造化數(shù)據(jù),數(shù)據(jù)質(zhì)量,預(yù)測分析,客戶定制化?!掣鶕?jù)商務(wù)智能的主要技術(shù),以及電子商務(wù)的移動,虛擬性,個性化,社會性等新型特征,把商務(wù)智能同電子商務(wù)根底性規(guī)律結(jié)合起來,完善商務(wù)節(jié)點(diǎn)的數(shù)據(jù)挖掘,抽取,轉(zhuǎn)化集成和應(yīng)用。提升電子商務(wù)中的智能搜索,精度營銷,比擬購物,供給鏈、配送優(yōu)化等現(xiàn)實(shí)需求。描述商務(wù)智能融合技術(shù)在電子商務(wù)中的應(yīng)用展望。商務(wù)智能在電子商務(wù)中的典型應(yīng)用數(shù)據(jù)挖掘的應(yīng)用:挖掘主要是挖掘出有潛力價值數(shù)據(jù)的信息拘束,主要應(yīng)用在情報分析,數(shù)據(jù)庫營銷,識別用戶消費(fèi)行為,客戶流失分析,劃分客戶群體等相關(guān)應(yīng)用。〔沃爾瑪超市尿布與啤酒的銷售〕智能搜索的應(yīng)用:人們運(yùn)用關(guān)鍵詞進(jìn)展搜索返還的結(jié)果信息之間缺乏有效的關(guān)聯(lián),不僅增加了用戶篩選結(jié)果信息的時間,而且也為用戶查找有效信息增加了復(fù)雜的。更重要的是傳統(tǒng)搜索系統(tǒng)基于信息共享平臺設(shè)計,缺乏有效的權(quán)限管理策略和平安機(jī)制,無法有效的保證資訊信息合法使用。結(jié)合新興電子商務(wù)的特征與精度營銷,比擬購物,供給鏈、配送優(yōu)化等現(xiàn)實(shí)需求,研究電子商務(wù)中的知識管理與智能搜索的理論和方法。主要容可包括:具有智能的商務(wù)知識表達(dá)與數(shù)據(jù)挖掘方法,非構(gòu)造信息中的知識獲取技術(shù),網(wǎng)頁數(shù)據(jù)有效提取與實(shí)時動態(tài)分析技術(shù),個性化推薦技術(shù)的應(yīng)用等問題??梢暬夹g(shù)的應(yīng)用:基于有限的離散采樣,三維數(shù)據(jù)比幾何形態(tài)的信息更為豐富和完整,而且更適合于表達(dá)不規(guī)則的研究對象。知識管理的應(yīng)用:隨著知識管理在科研機(jī)構(gòu)的應(yīng)用,所有的科研成果和業(yè)最新信息都可以共享在知識庫中,方便使用人員檢索知識,參考經(jīng)歷,從而到達(dá)商務(wù)成果信息的有效利用。個性推薦技術(shù)的應(yīng)用:個性化推薦必須能夠?qū)τ脩舻南埠锰峁┫嚓P(guān)性強(qiáng)的準(zhǔn)確的推薦,盡可能減少個性化用戶的查找時間,推薦結(jié)果必須能夠?qū)崟r計算。商務(wù)智能在電子商務(wù)中的未來開展趨勢(1)商務(wù)智能簡易型趨勢〔簡便易用的交互界面;良好的適用性;實(shí)施與管理的便捷性;〕〔2〕商務(wù)智能平臺化開展〔3〕商務(wù)智能嵌入化趨勢〔4〕商務(wù)智能同群眾決策互補(bǔ)開展第二講商務(wù)智能導(dǎo)論1:BI的作用1.1商務(wù)智能與信息社會處在信息社會的一個重要標(biāo)志性特征就是信息融合。由信息技術(shù)的進(jìn)步和廣泛應(yīng)用驅(qū)動的技術(shù)融合不斷深化,從兩個方面對于人們的社會生活和經(jīng)濟(jì)活動產(chǎn)生影響。(一方面,企業(yè)中許多傳統(tǒng)的業(yè)務(wù)決策問題逐漸變成信息決策問題.另一方面,信息產(chǎn)品及其應(yīng)用隨著技術(shù)創(chuàng)新呈現(xiàn)出越來越豐富的形態(tài)和特征)商務(wù)智能開展起來的四種推手:1:傳統(tǒng)業(yè)務(wù)報告數(shù)據(jù)充分而知識匱乏;2:傳統(tǒng)報告不能滿足用戶需求3:傳統(tǒng)分析工具的整合能力有限〔用戶被限定在數(shù)據(jù)對象中,而不能進(jìn)一步分析和整合〕4:信息技術(shù)及應(yīng)用的推廣〔大容量數(shù)據(jù)存儲,互聯(lián)網(wǎng),并行處理,云技術(shù)〕商務(wù)智能是信息社會繁榮的推動力—從傳統(tǒng)的商業(yè)領(lǐng)域逐步拓展到政務(wù)領(lǐng)域、教育領(lǐng)域、醫(yī)療領(lǐng)域等其他各領(lǐng)域。1.2商務(wù)智能與企業(yè)管理商務(wù)智能對企業(yè)的戰(zhàn)略決策也同樣具有非常重要的影響,這種影響表達(dá)在3個方面:公司戰(zhàn)略、業(yè)務(wù)戰(zhàn)略和職能戰(zhàn)略。(商務(wù)智能可以根據(jù)公司各戰(zhàn)略業(yè)務(wù)單元的經(jīng)營業(yè)績和經(jīng)營定位來選擇合格的投資組合戰(zhàn)略商務(wù)智能可以進(jìn)展企業(yè)外部因素分析:外部環(huán)境分析、行業(yè)狀況分析、競爭對手分析等商務(wù)智能可以在分析企業(yè)部因素(勞動力,本錢,技術(shù),競爭等)的根底上為職能戰(zhàn)略提供科學(xué)的決策依據(jù))改善關(guān)系:提供有關(guān)業(yè)務(wù)狀況的有用信息,提高企業(yè)知名度,改善全信息鏈的效率。理解業(yè)務(wù):可以對各項(xiàng)業(yè)務(wù)進(jìn)展準(zhǔn)確的評估,幫助理解業(yè)務(wù)的驅(qū)動因素,識別對業(yè)務(wù)產(chǎn)生影響的關(guān)鍵因素,積極推動業(yè)務(wù)開展,培養(yǎng)良好開展態(tài)勢。創(chuàng)造商業(yè)時機(jī):掌握各種商務(wù)數(shù)據(jù)和信息的企業(yè)可以出手這些信息而獲利。衡量績效:從企業(yè)各個應(yīng)用系統(tǒng)中提取各種根底績效指標(biāo)與關(guān)鍵績效指標(biāo),對員工的工作績效進(jìn)展追蹤、衡量和評價。商務(wù)智能是如何協(xié)助企業(yè)進(jìn)展管理的呢?(基于目標(biāo)的管理:能計算跨組織的績效目標(biāo).基于異常的管理:檢測實(shí)際指標(biāo)與方案目標(biāo)之間的偏差.基于事實(shí)的管理:將企業(yè)目標(biāo)與事實(shí)結(jié)合.基于智能協(xié)同的管理:實(shí)現(xiàn)企業(yè)部與外部資源的協(xié)同)商務(wù)智能的商業(yè)價值主要有三個方面的表達(dá):省錢,提高效率和提高競爭力。2.1BI的概念商務(wù)智能是企業(yè)利用現(xiàn)代信息技術(shù)收集、管理和分析構(gòu)造化和非構(gòu)造化的商務(wù)數(shù)據(jù)和信息,創(chuàng)造和累計商務(wù)知識和見解,改善商務(wù)決策水平,采取有效的商務(wù)行動,完善各種商務(wù)流程,提升各方面商務(wù)績效,增強(qiáng)綜合競爭力的智慧和能力。2.2BI的理解商務(wù)智能是通過對來自不同的數(shù)據(jù)源進(jìn)展統(tǒng)一處理及管理,通過靈活的展現(xiàn)方法來幫助企業(yè)進(jìn)展決策支持。2.3BI的四層面〔個數(shù)據(jù)分析層面;信息系統(tǒng)層面;知識發(fā)現(xiàn)層面;戰(zhàn)略層面〕3商務(wù)智能的系統(tǒng)構(gòu)成3.1四個階段:數(shù)據(jù)收集→強(qiáng)大的分析工具→專業(yè)的分析知識→改善決策水平3.2關(guān)鍵技術(shù):數(shù)據(jù)倉庫,聯(lián)機(jī)分析處理技術(shù),數(shù)據(jù)挖掘,可視化技術(shù)。4商務(wù)智能的開發(fā)方法〔規(guī)劃,需求分析,設(shè)計,實(shí)現(xiàn)?!?.1商務(wù)智能系統(tǒng)成功的關(guān)鍵因素:培訓(xùn),循序漸進(jìn),業(yè)務(wù)人員與IT人員合作,高層支持,業(yè)務(wù)驅(qū)動5商務(wù)智能的開展趨勢?融合加強(qiáng),演變成門戶化?日趨“傻瓜〞,表達(dá)人性化?可視化數(shù)據(jù)和自助式BI?基于云計算的BI?移動BI?致力于搜索領(lǐng)域的BI第三講數(shù)據(jù)倉庫的概述不應(yīng)該說數(shù)據(jù)庫到數(shù)據(jù)倉庫是技術(shù)的進(jìn)步。數(shù)據(jù)倉庫并不是對數(shù)據(jù)庫的徹底拋棄。數(shù)據(jù)庫與數(shù)據(jù)倉庫的比擬:2數(shù)據(jù)集市數(shù)據(jù)集市(DataMart)又叫數(shù)據(jù)市場,是部門級的數(shù)據(jù)倉庫,或者是為*種專門的用途開發(fā)的數(shù)據(jù)存儲系統(tǒng)。數(shù)據(jù)集市:規(guī)模較小,本錢較低,針對性更強(qiáng)。數(shù)據(jù)倉庫:數(shù)據(jù)來源于各個部門的不同應(yīng)用系統(tǒng),可保證數(shù)據(jù)的整合性。數(shù)據(jù)集市的兩種根本形式A:附屬的數(shù)據(jù)集市〔自上而下構(gòu)建數(shù)據(jù)集市〕數(shù)據(jù)是從企業(yè)的數(shù)據(jù)倉庫獲得,可看作是數(shù)據(jù)倉庫的一個子集。因此具有較好的數(shù)據(jù)整合性。假設(shè)需要的數(shù)據(jù)在數(shù)據(jù)集市中沒有,則要先修改數(shù)據(jù)倉庫的構(gòu)造,使這種數(shù)據(jù)先進(jìn)入數(shù)據(jù)倉庫,再進(jìn)入數(shù)據(jù)集市。這種數(shù)據(jù)集市適合用于對數(shù)據(jù)倉庫的訪問量比擬大的關(guān)鍵業(yè)務(wù)部門。B:獨(dú)立的數(shù)據(jù)集市〔自下而上構(gòu)建數(shù)據(jù)集市〕沒有數(shù)據(jù)倉庫作為它的數(shù)據(jù)來源,而是直接從各個應(yīng)用系統(tǒng)取得數(shù)據(jù),因此,本錢低,靈活性好,需要一種新的數(shù)據(jù)時不必修改企業(yè)級的數(shù)據(jù)倉庫。可提供個別部門所需要的數(shù)據(jù),整合性較差。第四講數(shù)據(jù)倉庫的分析1數(shù)據(jù)倉庫的體系構(gòu)造數(shù)據(jù)倉庫是面向主題、面向分析和知識發(fā)現(xiàn)的一種數(shù)據(jù)處理技術(shù),對數(shù)據(jù)倉庫的使用沒有固定的模式,因此數(shù)據(jù)倉庫與操作型事務(wù)處理系統(tǒng)的構(gòu)造有很大的不同。對于用戶,數(shù)據(jù)倉庫就是由數(shù)據(jù)源、數(shù)據(jù)倉庫的數(shù)據(jù)存儲、數(shù)據(jù)倉庫的應(yīng)用工具和可視化用戶界面組成的。2粒度越是詳細(xì)的數(shù)據(jù),粒度級別越?。辉绞歉爬ǖ臄?shù)據(jù),粒度級別越大。?雙重粒度指輕度綜合數(shù)據(jù)級和真實(shí)細(xì)節(jié)數(shù)據(jù)級(最低粒度級)。3確定粒度大小一般考慮的原則:?假設(shè)數(shù)據(jù)倉庫的空間很有限,為節(jié)省存儲空間,宜采用大粒度級表示數(shù)據(jù);?假設(shè)追求數(shù)據(jù)倉庫能夠答復(fù)的問題類型的能力,要求能夠答復(fù)非常具體的問題,則使用較小的數(shù)據(jù)粒度級別;?假設(shè)想要減輕處理器的負(fù)擔(dān),提高查詢性能,則采用較大的數(shù)據(jù)粒度級別;?假設(shè)沒有存儲空間的限制,則可在一個數(shù)據(jù)倉庫中采用多重粒度級別,既存儲低粒度級別的數(shù)據(jù),也存儲高粒度級別的數(shù)據(jù),以同時獲得高的查詢效率和查詢能力。第五講DW的設(shè)計與開發(fā)概念模型設(shè)計關(guān)鍵任務(wù):分析和理解DW中的主題,確定主題的要素及描述屬性。邏輯模型設(shè)計關(guān)鍵任務(wù):粒度的劃分、數(shù)據(jù)分割策略確實(shí)定、關(guān)系模式的定義、數(shù)據(jù)源及數(shù)據(jù)抽取模型等問題。物理模型設(shè)計關(guān)鍵任務(wù):物理數(shù)據(jù)庫表及其存儲構(gòu)造設(shè)計。2概念模型設(shè)計確定主題〔借助一些根本的方向性需求〕對每個主題的容進(jìn)展描述〔描述容〕?需要做哪些類型的決策??分析問題時所關(guān)心的事實(shí);?決策者感興趣的是什么問題??分析問題時的各種觀察角度;?這些問題需要什么樣的信息?描述事實(shí)及觀察角度的屬性。?要得到這些信息需要包含哪些數(shù)據(jù)?3分析問題的維度市場經(jīng)理:產(chǎn)品種類、時間、銷售地區(qū)、銷售渠道等。市場部部長:時間、地區(qū)、客戶統(tǒng)計特征、分銷機(jī)構(gòu)、產(chǎn)品型號等。財務(wù)經(jīng)理:預(yù)算、時間、地區(qū)4信息包圖〔用戶信息需求表〕*連鎖旅館入住情況〔核心問題是客房的使用量〕維度包括:客房類型,旅館,時間關(guān)鍵指標(biāo):已占用客房,空房間,不可用房間,入住人數(shù),收入等。對維度客房類型的分析:房間類型,房間大小,床位數(shù),床位類型,最多容納人數(shù),套房家具,冰箱,廚房等。對維度旅館的分析:分支機(jī)構(gòu)代碼,分支機(jī)構(gòu)名稱,國家,省份,地區(qū),城市,建立年份,修繕年份等。對維度時間的分析:年份,季度,月份,星期幾,日期,假日標(biāo)準(zhǔn)等。5數(shù)據(jù)倉庫工程的開發(fā)過程:工程規(guī)劃,需求分析,概念設(shè)計,ETL設(shè)計,邏輯和物理設(shè)計,實(shí)現(xiàn)與培訓(xùn)。第六講OLAP1多維數(shù)據(jù)庫〔MOLAP〕與關(guān)系數(shù)據(jù)庫〔ROLAP〕在存儲上的不同對關(guān)系數(shù)據(jù)庫來說,任何數(shù)據(jù)集均用二維表來存放;對多維數(shù)據(jù)庫也是用二維表來存放的,但其存放方式和效率不同。–假設(shè)增加匯總,存儲空間的占用情況也不同。–假設(shè)增加一個時間維——季度,采用關(guān)系數(shù)據(jù)庫存儲時仍使用二維表,多維數(shù)據(jù)庫則采用數(shù)據(jù)立方體這樣的三維數(shù)組來存儲。2MOLAP與ROLAP的特征一般情況,MOLAP和ROLAP的選擇主要看應(yīng)用的規(guī)模。假設(shè)要建立功能復(fù)雜、規(guī)模較大的企業(yè)級數(shù)據(jù)倉庫,則一般選擇ROLAP方式;假設(shè)是建立功能單一、小型的數(shù)據(jù)集市則更適合采用MOLAP方式。第七講DM的概述1產(chǎn)生DM的原因:A:數(shù)據(jù)挖掘技術(shù)產(chǎn)生的動力:數(shù)據(jù)爆炸問題;數(shù)據(jù)過量而知識貧乏〔新理論、新材料、新工藝、新方法的不斷出現(xiàn),使知識老化的速度加快?!矪:從商業(yè)數(shù)據(jù)到商業(yè)信息的進(jìn)化C:實(shí)施數(shù)據(jù)挖掘的目的:不再是單純?yōu)榱搜芯浚饕氖菫樯虡I(yè)決策提供真正有價值的信息,進(jìn)而獲得利潤。所有企業(yè)面臨的一個共同問題是:企業(yè)數(shù)據(jù)量非常大,而其中真正有價值的信息卻很少,因此需要從大量的數(shù)據(jù)中經(jīng)過深層分析,獲得有利于商業(yè)運(yùn)作、提高競爭力的信息,就像從礦石中淘金一樣,數(shù)據(jù)挖掘也由此而得名。2數(shù)據(jù)挖掘與信息處理、知識發(fā)現(xiàn)–數(shù)據(jù)挖掘從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。與之相似的概念稱為知識發(fā)現(xiàn)。–信息處理基于查詢,可以發(fā)現(xiàn)有用的信息。但是這種查詢答復(fù)反映的是直接存放在數(shù)據(jù)庫中的信息。它們不反映復(fù)雜的模式,或隱藏在數(shù)據(jù)庫中的規(guī)律。–知識發(fā)現(xiàn)(KnowledgeDiscoveryinDatabases)是用數(shù)據(jù)庫管理系統(tǒng)來存儲數(shù)據(jù),用機(jī)器學(xué)習(xí)的方法來分析數(shù)據(jù),挖掘大量數(shù)據(jù)背后隱藏的知識,稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)。3數(shù)據(jù)挖掘與數(shù)據(jù)倉庫的區(qū)別聯(lián)系–數(shù)據(jù)挖掘是數(shù)據(jù)倉庫開展的必然結(jié)果。–數(shù)據(jù)倉庫為數(shù)據(jù)挖掘提供給用根底:?大多數(shù)數(shù)據(jù)挖掘工具要在集成的、一致的、經(jīng)過清理的數(shù)據(jù)上進(jìn)展挖掘;?數(shù)據(jù)倉庫構(gòu)造過程中已組建了數(shù)據(jù)處理和數(shù)據(jù)分析的根底設(shè)施,數(shù)據(jù)挖掘可借此進(jìn)展,不必重新組建根底設(shè)施;?數(shù)據(jù)倉庫中的OLAP完全可為數(shù)據(jù)挖掘提供有關(guān)的數(shù)據(jù)操作支持;?在數(shù)據(jù)挖掘中,如果將數(shù)據(jù)挖掘與數(shù)據(jù)倉庫進(jìn)展有效地聯(lián)結(jié),將增加數(shù)據(jù)挖掘的聯(lián)機(jī)挖掘功能。4數(shù)據(jù)挖掘與OLAP–OLAP分析過程在本質(zhì)上是一個演繹推理的過程,是決策支持領(lǐng)域的一局部。傳統(tǒng)的查詢和報表工具是告訴你數(shù)據(jù)庫中都有什么(whathappened),OLAP則更進(jìn)一步告訴你下一步會怎么樣(Whatne*t)和如果采取這樣的措施又會怎么樣(Whatif)。用戶首先建立一個假設(shè),然后用OLAP檢索數(shù)據(jù)庫來驗(yàn)證這個假設(shè)是否正確。–數(shù)據(jù)挖掘在本質(zhì)上是一個歸納推理的過程,與OLAP不同的地方是,數(shù)據(jù)挖掘不是用于驗(yàn)證*個假定的模式(模型)的正確性,而是在數(shù)據(jù)庫中自己尋找模型。–數(shù)據(jù)挖掘和OLAP具有一定的互補(bǔ)性。在利用數(shù)據(jù)挖掘出來的結(jié)論采取行動之前,OLAP工具能起輔助決策作用。而且在知識發(fā)現(xiàn)的早期階段,OLAP工具用來探索數(shù)據(jù),找到哪些是對一個問題比擬重要的變量,發(fā)現(xiàn)異常數(shù)據(jù)和互相影響的變量。這都有助于更好地理解數(shù)據(jù),加快知識發(fā)現(xiàn)的過程。5數(shù)據(jù)挖掘的應(yīng)用?銀行–分析客戶使用分銷渠道的情況和分銷渠道的容量;建立利潤評測模型;客戶關(guān)系優(yōu)化;風(fēng)險控制等?電子商務(wù)–網(wǎng)上商品推薦;個性化網(wǎng)頁;自適應(yīng)??生物制藥、基因研究–DNA序列查詢和匹配;識別基因序列的共發(fā)生性??電信–欺詐甄別;客戶流失??保險、零售……決策樹?傾向性分析聚類分析?客戶細(xì)分?市場細(xì)分關(guān)聯(lián)分析?市場組合分析?套裝產(chǎn)品分析?目錄設(shè)計?穿插銷售神經(jīng)網(wǎng)絡(luò)?傾向性分析?客戶保存?目標(biāo)市場?欺詐檢測6DW解決的商業(yè)問題:推薦信息的生成,異常檢測,客戶流失分析,風(fēng)險管理,客戶細(xì)分,廣告定位,預(yù)測。第八講數(shù)據(jù)挖掘的過程1數(shù)據(jù)挖掘可以為公司提供哪些幫助,如何使用聚類、分類、關(guān)聯(lián)規(guī)則挖掘和離群點(diǎn)檢測等技術(shù)為企業(yè)效勞。(1)使用聚類發(fā)現(xiàn)互聯(lián)網(wǎng)中的不同群體,用于網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn);(2)使用分類對客戶進(jìn)展等級劃分,從而實(shí)施不同的效勞;(3)使用關(guān)聯(lián)規(guī)則發(fā)現(xiàn)大型數(shù)據(jù)集中間存在的關(guān)系,用于推薦搜索。如大局部搜索了“廣外〞的人都會繼續(xù)搜索“信息學(xué)院〞,則在搜索“廣外〞后會提示是否進(jìn)進(jìn)一步搜索“信息學(xué)院〞。(4)使用離群點(diǎn)挖掘發(fā)現(xiàn)與大局部對象不同的對象,用于分析針對網(wǎng)絡(luò)的秘密收集信息的攻擊。CRISP-DM六階段–商業(yè)理解:確定業(yè)務(wù)目標(biāo)、評估商業(yè)環(huán)境、確定數(shù)據(jù)挖掘目標(biāo)、提出工程方案–數(shù)據(jù)理解:收集原始數(shù)據(jù)、描述數(shù)據(jù)、探索數(shù)據(jù)、檢查數(shù)據(jù)質(zhì)量–數(shù)據(jù)準(zhǔn)備:數(shù)據(jù)選擇、數(shù)據(jù)清洗、數(shù)據(jù)創(chuàng)立、數(shù)據(jù)合并、數(shù)據(jù)格式化–建模:選擇建模技術(shù)、測試方案設(shè)計–評估:結(jié)果評估、過程回憶、確定下一步工作–部署:部署方案、監(jiān)控和維護(hù)方案、做出最終報告、工程回憶四層次:階段劃分、定義通用任務(wù)、定義專用任務(wù)、處理實(shí)例上兩層獨(dú)立于具體數(shù)據(jù)挖掘方法,是一般數(shù)據(jù)挖掘工程均需實(shí)施的步驟(這解決了“WHATTODO?〞的問題)。這兩層的任務(wù)將結(jié)合具體數(shù)據(jù)挖掘工程的“上下文〞(CONTE*T)映射到下兩層的具體任務(wù)和過程。下兩層注重解決如何完成每個階段所要完成的任務(wù)和任務(wù)的輸出所要求的必要映射活動(這用于解決“HOWTODO〞的問題)。第九講關(guān)聯(lián)分析例1:通過統(tǒng)計用戶主叫的業(yè)務(wù)使用情況,進(jìn)展業(yè)務(wù)的關(guān)聯(lián)分析。設(shè)有10項(xiàng)業(yè)務(wù),記0—語音信箱,…,5—移動秘書,6—信息點(diǎn)播,…,9—呼叫轉(zhuǎn)移,統(tǒng)計10個主叫及使用業(yè)務(wù)如下表所示。主叫使用業(yè)務(wù)類型主叫使用業(yè)務(wù)類型設(shè)A為業(yè)務(wù)5,B為業(yè)務(wù)6,T為事務(wù)總數(shù)(主叫統(tǒng)計數(shù)),則業(yè)務(wù)AB出現(xiàn)的支持度為P(A∪B)=AB出現(xiàn)次數(shù)/事務(wù)總數(shù)T=4/10=0.4對于具有支持度0.4的項(xiàng)集AB,規(guī)則A→B的可信度為P(B|A)=P(AB)/P(A)=(4/10)/(5/10)=0.4/0.5=0.8同理,規(guī)則B→A的可信度為P(A|B)=P(AB)/P(B)=0.4/0.6=0.67假設(shè)用戶給出的最小可信度為0.3,最小支持度為0.3,則項(xiàng)集AB滿足最小支持度,是二項(xiàng)頻繁集,規(guī)則A→B,B→A兩條規(guī)則滿足最小可信度Apriori算法過程〔根本思想:頻繁項(xiàng)集的任何子集也一定是頻繁的。〕(1)制定最小支持度及最小置信度;(2)Apriori算法使用候選項(xiàng)集的概念,首先掃描數(shù)據(jù)庫產(chǎn)生候選工程集,假設(shè)候選工程集的支持度≥最小支持度,則該候選項(xiàng)集合為頻繁項(xiàng)集;(3)在Apriori算法的過程中,首先由數(shù)據(jù)庫讀入所有的事務(wù)數(shù)據(jù),得出候選1_項(xiàng)集合C1及相應(yīng)的支持度數(shù)據(jù),通過將每個1_項(xiàng)集合的支持度與最小支持度比擬,得出頻繁1_項(xiàng)集合L1,然后將這些頻繁1_項(xiàng)集兩兩進(jìn)展連接,產(chǎn)生候選2_項(xiàng)集合C2;(4)然后再次掃描數(shù)據(jù)庫得到候選2_項(xiàng)集合C2的支持度,將2_項(xiàng)集的支持度與最小支持度比擬,確定頻繁2_項(xiàng)集L2,類似地,利用這些頻繁2_項(xiàng)集產(chǎn)生候選3_項(xiàng)集和確定頻繁3_項(xiàng)集,以此類推;(5)反復(fù)掃描數(shù)據(jù)庫與最小支持度比擬,產(chǎn)生更高項(xiàng)的頻繁項(xiàng)集合,再結(jié)合產(chǎn)生下一級候選項(xiàng)集,直到不再結(jié)合產(chǎn)生出新的候選項(xiàng)集為止。例2:假定最小支持度是2,最小置信度為50%,求大項(xiàng)集。第十講分類1熵〔Entropy〕:針對一個給定的屬性(可預(yù)測屬性)找出一個數(shù)學(xué)公式,來度量數(shù)據(jù)集的純度。2ID3算法構(gòu)建決策樹Step1:建立相關(guān)性計數(shù)表Step2:選擇一個屬性,然后在根層次進(jìn)展拆分。例:3從樹中生成分類規(guī)則–用IF-THEN這種形式來表示規(guī)則–對從根到葉節(jié)點(diǎn)的每條路徑創(chuàng)立一條規(guī)則–沿著一條路徑的每個屬性值對構(gòu)成“并〞連接
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 45153-2024老齡化社會照顧人員包容性組織通用要求與指南
- 手術(shù)室護(hù)士工作小結(jié)范文(5篇)
- 我愛讀書演講稿15篇
- 護(hù)理督查工作匯報
- 感恩節(jié)前的精彩講話稿(9篇)
- 情感電臺廣播稿集錦15篇
- 市場營銷畢業(yè)的實(shí)習(xí)總結(jié)
- 師德師風(fēng)宣講活動簡報(18篇)
- 初級會計實(shí)務(wù)-2021年5月16日上午初級會計職稱考試《初級會計實(shí)務(wù)》真題
- 初級會計經(jīng)濟(jì)法基礎(chǔ)-初級會計《經(jīng)濟(jì)法基礎(chǔ)》模考試卷817
- 搞笑小品劇本《大城小事》臺詞完整版
- 《大模型原理與技術(shù)》全套教學(xué)課件
- 2023年護(hù)理人員分層培訓(xùn)、考核計劃表
- 《銷售培訓(xùn)實(shí)例》課件
- 2025年四川省新高考八省適應(yīng)性聯(lián)考模擬演練(二)地理試卷(含答案詳解)
- 【經(jīng)典文獻(xiàn)】《矛盾論》全文
- Vue3系統(tǒng)入門與項(xiàng)目實(shí)戰(zhàn)
- 2024年寧夏回族自治區(qū)中考英語試題含解析
- 光伏發(fā)電項(xiàng)目試驗(yàn)檢測計劃
- 房屋建筑工程投標(biāo)方案(技術(shù)方案)
- 2025年高考語文作文備考:議論文萬能模板
評論
0/150
提交評論