商務(wù)智能期末考試_第1頁
商務(wù)智能期末考試_第2頁
商務(wù)智能期末考試_第3頁
商務(wù)智能期末考試_第4頁
商務(wù)智能期末考試_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第一講商務(wù)智能歸納(綜合論述題)學(xué)習(xí)本課程的原因:現(xiàn)代管理需要基于計(jì)算機(jī)的方法讓決策更有有效性企業(yè)需要有智能在解析型商務(wù)智能軟件的幫助下,用戶能夠成立一致的企業(yè)數(shù)據(jù)庫房平臺(tái),并收集,接見,解析每個(gè)商業(yè)領(lǐng)域的數(shù)據(jù),同時(shí),數(shù)據(jù)庫技術(shù)的進(jìn)步,服務(wù)器性能的提升以及解析軟件算法的優(yōu)化,是的接見大型數(shù)據(jù)庫辦理海量信息變得更加簡單便利。商務(wù)智能能夠供應(yīng)個(gè)性化服務(wù),以滿足不同樣用戶的需求,智能找尋能夠給決策者以很好的數(shù)據(jù)解析。與本專業(yè)的關(guān)系性:信息技術(shù)迅速發(fā)展的今天,電子商務(wù)已在公民經(jīng)濟(jì)中展現(xiàn)出極其重要的作用。陪同著服務(wù)形態(tài)在全球擴(kuò)大,市場需求多樣化,社會(huì)網(wǎng)絡(luò)的廣泛成立等社會(huì)經(jīng)濟(jì)巨大改革;數(shù)據(jù)量正以每年翻倍的

2、速度擴(kuò)增,但是數(shù)據(jù)源分別,異構(gòu)數(shù)據(jù)庫難以整合,數(shù)據(jù)接口復(fù)雜等問題嚴(yán)重,以致大量數(shù)據(jù)中真實(shí)能被利用來解析和運(yùn)用的數(shù)據(jù)不足10%。如何將數(shù)據(jù)有效轉(zhuǎn)變成決策者所需要的信息,提升電子商務(wù)整體應(yīng)用水平,已經(jīng)成為政府,企業(yè)界和軟件開發(fā)界關(guān)注的一個(gè)研究方向。(BI發(fā)展趨勢:績效管理,產(chǎn)品模塊的集成,構(gòu)造化和非構(gòu)造化數(shù)據(jù),數(shù)據(jù)質(zhì)量,展望解析,客戶定制化。)依照商務(wù)智能的主要技術(shù),以及電子商務(wù)的搬動(dòng),虛假性,個(gè)性化,社會(huì)性等新式特點(diǎn),把商務(wù)智能同電子商務(wù)基礎(chǔ)性規(guī)律結(jié)合起來,完滿商務(wù)節(jié)點(diǎn)的數(shù)據(jù)挖掘,抽取,轉(zhuǎn)變集成和應(yīng)用。提升電子商務(wù)中的智能找尋,精度營銷,比較購物,供應(yīng)鏈、配送優(yōu)化等現(xiàn)實(shí)需求。描述商務(wù)智能交融技術(shù)

3、在電子商務(wù)中的應(yīng)用展望。商務(wù)智能在電子商務(wù)中的典型應(yīng)用(1)數(shù)據(jù)挖掘的應(yīng)用:挖掘主若是挖掘出有潛力價(jià)值數(shù)據(jù)的信息拘束,主要應(yīng)用在情報(bào)解析,數(shù)據(jù)庫營銷,鑒別用戶花銷行為,客戶流失解析,劃分客戶集體等相關(guān)應(yīng)用。(沃爾瑪商場尿布與啤酒的銷售)(2)智能找尋的應(yīng)用:人們運(yùn)用要點(diǎn)詞進(jìn)行找尋返還的結(jié)果信息之間缺乏有效的關(guān)系,不但增加了用戶精選結(jié)果信息的時(shí)間,而且也為用戶查找有效信息增加了復(fù)雜的。更重要的是傳統(tǒng)找尋系統(tǒng)基于信息共享平臺(tái)設(shè)計(jì),缺乏有效的權(quán)限管理策略和安全體系,無法有效的保證資訊信息合法使用。結(jié)合新興電子商務(wù)的特點(diǎn)與精度營銷,比較購物,供應(yīng)鏈、配送優(yōu)化等現(xiàn)實(shí)需求,研究電子商務(wù)中的知識(shí)管理與智能找

4、尋的理論和方法。主要內(nèi)容可包括:擁有智能的商務(wù)知識(shí)表達(dá)與數(shù)據(jù)挖掘方法,非構(gòu)造信息中的知識(shí)獲取技術(shù),網(wǎng)頁數(shù)據(jù)有效提取與實(shí)時(shí)動(dòng)向解析技術(shù),個(gè)性化介紹技術(shù)的應(yīng)用等問題。(3)可視化技術(shù)的應(yīng)用:基于有限的失散采樣,三維數(shù)據(jù)比幾何形態(tài)的信息更加豐富和完滿,而且更適合于表達(dá)不規(guī)則的研究對象。(4)知識(shí)管理的應(yīng)用:隨著知識(shí)管理在科研機(jī)構(gòu)內(nèi)的應(yīng)用,所有的科研成就和業(yè)內(nèi)最新信息都能夠共享在知識(shí)庫中,方便使用人員檢索知識(shí),參照經(jīng)驗(yàn),進(jìn)而達(dá)到商務(wù)成就信息的有效利用。(5)個(gè)性介紹技術(shù)的應(yīng)用:個(gè)性化介紹必定能夠?qū)τ脩舻南埠霉?yīng)相關(guān)性強(qiáng)的精確的介紹,盡可能減少個(gè)性化用戶的查找時(shí)間,介紹結(jié)果必定能夠?qū)崟r(shí)計(jì)算。商務(wù)智能在電

5、子商務(wù)中的未來發(fā)展趨勢商務(wù)智能簡單型趨勢(簡略易用的交互界面;優(yōu)異的合用性;推行與管理的便利性;)(2)商務(wù)智能平臺(tái)化發(fā)展(3)商務(wù)智能嵌入化趨勢(4)商務(wù)智能同公眾決策互補(bǔ)發(fā)展第二講商務(wù)智能導(dǎo)論1:BI的作用頁眉內(nèi)容1.1商務(wù)智能與信息社會(huì)處在信息社會(huì)的一個(gè)重要標(biāo)志性特點(diǎn)就是信息交融。由信息技術(shù)的進(jìn)步和廣泛應(yīng)用驅(qū)動(dòng)的技術(shù)交融不斷深入,從兩個(gè)方面對于人們的社會(huì)生活和經(jīng)濟(jì)活動(dòng)產(chǎn)生影響。(一方面,企業(yè)中好多傳統(tǒng)的業(yè)務(wù)決策問題逐漸變成信息決策問題.另一方面,信息產(chǎn)品及其應(yīng)用隨著技術(shù)創(chuàng)新表現(xiàn)出越來越豐富的形態(tài)和特點(diǎn))商務(wù)智能發(fā)展起來的四種推手:1:傳統(tǒng)業(yè)務(wù)報(bào)告數(shù)據(jù)充分而知識(shí)困窮;2:傳統(tǒng)報(bào)告不能夠滿足

6、用戶需求3:傳統(tǒng)解析工具的整合能力有限(用戶被限制在數(shù)據(jù)對象中,而不能夠進(jìn)一步解析和整合)4:信息技術(shù)及應(yīng)用的推行(大容量數(shù)據(jù)儲(chǔ)藏,互聯(lián)網(wǎng),并行辦理,云技術(shù))商務(wù)智能是信息社會(huì)繁榮的推動(dòng)力從傳統(tǒng)的商業(yè)領(lǐng)域逐漸拓展到政務(wù)領(lǐng)域、教育領(lǐng)域、醫(yī)療領(lǐng)域等其他各領(lǐng)域。1.2商務(wù)智能與企業(yè)管理商務(wù)智能對企業(yè)的戰(zhàn)略決策也同樣擁有特別重要的影響,這種影響表現(xiàn)在3個(gè)方面:企業(yè)戰(zhàn)略、業(yè)務(wù)戰(zhàn)略和職能戰(zhàn)略。(商務(wù)智能能夠依照企業(yè)各戰(zhàn)略業(yè)務(wù)單元的經(jīng)營業(yè)績和經(jīng)營定位來選擇合格的投資組合戰(zhàn)略商務(wù)智能能夠進(jìn)行企業(yè)外面要素解析:外面環(huán)境解析、行業(yè)情況解析、競爭對手解析等商務(wù)智能能夠在解析企業(yè)內(nèi)部要素(勞動(dòng)力,成本,技術(shù),競爭等)

7、的基礎(chǔ)上為職能戰(zhàn)略供應(yīng)科學(xué)的決策依照)改進(jìn)關(guān)系:供應(yīng)相關(guān)業(yè)務(wù)情況的適用信息,提升企業(yè)有名度,改進(jìn)全信息鏈的效率。理解業(yè)務(wù):能夠?qū)Ω黜?xiàng)業(yè)務(wù)進(jìn)行正確的評估,幫助理解業(yè)務(wù)的驅(qū)動(dòng)要素,鑒別對業(yè)務(wù)產(chǎn)生影響的要點(diǎn)要素,積極推動(dòng)業(yè)務(wù)發(fā)展,培養(yǎng)優(yōu)異發(fā)展態(tài)勢。創(chuàng)辦商業(yè)機(jī)遇:掌握各種商務(wù)數(shù)據(jù)和信息的企業(yè)能夠出手這些信息而盈利。衡量績效:從企業(yè)各個(gè)應(yīng)用系統(tǒng)中提取各種基礎(chǔ)績效指標(biāo)與要點(diǎn)績效指標(biāo),對員工的工作績效進(jìn)行追蹤、衡量和議論。商務(wù)智能是如何協(xié)助企業(yè)進(jìn)行管理的呢?(基于目標(biāo)的管理:能計(jì)算跨組織的績效目標(biāo).基于異常的管理:檢測實(shí)質(zhì)指標(biāo)與計(jì)劃目標(biāo)之間的誤差.基于事實(shí)的管理:將企業(yè)目標(biāo)與事實(shí)結(jié)合.基于智能共同的管理:實(shí)

8、現(xiàn)企業(yè)內(nèi)部與外面資源的共同)商務(wù)智能的商業(yè)價(jià)值主要有三個(gè)方面的表現(xiàn):省錢,提升效率和提升競爭力。2.1BI的看法商務(wù)智能是企業(yè)利用現(xiàn)代信息技術(shù)收集、管理和解析構(gòu)造化和非構(gòu)造化的商務(wù)數(shù)據(jù)和信息,創(chuàng)辦和累計(jì)商務(wù)知識(shí)和見解,改進(jìn)商務(wù)決策水平,采用有效的商務(wù)行動(dòng),完滿各種商務(wù)流程,提升各方面商務(wù)績效,加強(qiáng)綜合競爭力的智慧和能力。2.2BI的理解商務(wù)智能是經(jīng)過對來自不同樣的數(shù)據(jù)源進(jìn)行一致辦理及管理,經(jīng)過靈便的展現(xiàn)方法來幫助企業(yè)進(jìn)行決策支持。2.3BI的四層面(個(gè)數(shù)據(jù)解析層面;信息系統(tǒng)層面;知識(shí)發(fā)現(xiàn)層面;戰(zhàn)略層面)商務(wù)智能的系統(tǒng)組成3.1四個(gè)階段:數(shù)據(jù)收集富強(qiáng)的解析工具專業(yè)的解析知識(shí)改進(jìn)決策水平3.2要點(diǎn)

9、技術(shù):數(shù)據(jù)庫房,聯(lián)機(jī)解析辦理技術(shù),數(shù)據(jù)挖掘,可視化技術(shù)。商務(wù)智能的開發(fā)方法(規(guī)劃,需求解析,設(shè)計(jì),實(shí)現(xiàn)。)4.1商務(wù)智能系統(tǒng)成功的要點(diǎn)要素:培訓(xùn),次序漸進(jìn),業(yè)務(wù)人員與IT人員合作,高層支持,業(yè)務(wù)驅(qū)動(dòng)商務(wù)智能的發(fā)展趨勢交融加強(qiáng),演變成門戶化?日趨“傻瓜”,表現(xiàn)人性化?可視化數(shù)據(jù)和自助式BI基于云計(jì)算的BI?搬動(dòng)BI?致力于找尋領(lǐng)域的BI第三講數(shù)據(jù)庫房的歸納不應(yīng)當(dāng)說數(shù)據(jù)庫到數(shù)據(jù)庫房是技術(shù)的進(jìn)步。數(shù)據(jù)庫房其實(shí)不是對數(shù)據(jù)庫的完整拋棄。數(shù)據(jù)庫與數(shù)據(jù)庫房的比較:數(shù)據(jù)集市頁眉內(nèi)容數(shù)據(jù)集市(DataMart)又叫數(shù)據(jù)市場,是部門級(jí)的數(shù)據(jù)庫房,也許是為某種特地的用途開發(fā)的數(shù)據(jù)儲(chǔ)藏系統(tǒng)。數(shù)據(jù)集市:規(guī)模較小,成本較

10、低,針對性更強(qiáng)。數(shù)據(jù)庫房:數(shù)據(jù)本源于各個(gè)部門的不同樣應(yīng)用系統(tǒng),可保證數(shù)據(jù)的整合性。數(shù)據(jù)集市的兩種基本形式A:隸屬的數(shù)據(jù)集市(自上而下成立數(shù)據(jù)集市)數(shù)據(jù)是從企業(yè)的數(shù)據(jù)庫房獲取,可看作是數(shù)據(jù)庫房的一個(gè)子集。因此擁有較好的數(shù)據(jù)整合性。若需要的數(shù)據(jù)在數(shù)據(jù)集市中沒有,則要先更正數(shù)據(jù)庫房的構(gòu)造,使這種數(shù)據(jù)先進(jìn)入數(shù)據(jù)庫房,再進(jìn)入數(shù)據(jù)集市。這種數(shù)據(jù)市會(huì)集合用于對數(shù)據(jù)庫房的接見量比較大的要點(diǎn)業(yè)務(wù)部門。獨(dú)立的數(shù)據(jù)集市(自下而上成立數(shù)據(jù)集市)沒有數(shù)據(jù)庫房作為它的數(shù)據(jù)本源,而是直接從各個(gè)應(yīng)用系統(tǒng)獲取數(shù)據(jù),因此,成本低,靈便性好,需要一種新的數(shù)據(jù)時(shí)不用更正企業(yè)級(jí)的數(shù)據(jù)庫房。可供應(yīng)個(gè)別部門所需要的數(shù)據(jù),整合性較差。第四講

11、數(shù)據(jù)庫房的解析數(shù)據(jù)庫房的系統(tǒng)構(gòu)造數(shù)據(jù)庫房是面向主題、面向解析和知識(shí)發(fā)現(xiàn)的一種數(shù)據(jù)辦理技術(shù),對數(shù)據(jù)庫房的使用沒有固定的模式,因此數(shù)據(jù)庫房與操作型事務(wù)辦理系統(tǒng)的構(gòu)造有很大的不同樣。對于用戶,數(shù)據(jù)庫房就是由數(shù)據(jù)源、數(shù)據(jù)庫房的數(shù)據(jù)儲(chǔ)藏、數(shù)據(jù)庫房的應(yīng)用工具和可視化用戶界面組成的。粒度越是詳細(xì)的數(shù)據(jù),粒度級(jí)別越??;越是歸納的數(shù)據(jù),粒度級(jí)別越大。雙重粒度指輕度綜合數(shù)據(jù)級(jí)和真實(shí)細(xì)節(jié)數(shù)據(jù)級(jí)(最低粒度級(jí))。3確定粒度大小一般考慮的原則:若數(shù)據(jù)庫房的空間很有限,為節(jié)約儲(chǔ)藏空間,宜采用大粒度級(jí)表示數(shù)據(jù);若追求數(shù)據(jù)庫房能夠回答的問題種類的能力,要求能夠回答特別詳細(xì)的問題,則使用較小的數(shù)據(jù)粒度級(jí)別;若想要減少辦理器的負(fù)擔(dān)

12、,提升盤問性能,則采用較大的數(shù)據(jù)粒度級(jí)別;若沒有儲(chǔ)藏空間的限制,則可在一個(gè)數(shù)據(jù)庫房中采用多重粒度級(jí)別,既儲(chǔ)藏低粒度級(jí)其他數(shù)據(jù),也儲(chǔ)藏高粒度級(jí)其他數(shù)據(jù),以同時(shí)獲取高的盤問效率和盤問能力。第五講DW的設(shè)計(jì)與開發(fā)看法模型設(shè)計(jì)要點(diǎn)任務(wù):解析和理解DW中的主題,確定主題的要素及描述屬性。邏輯模型設(shè)計(jì)要點(diǎn)任務(wù):粒度的劃分、數(shù)據(jù)切割策略的確定、關(guān)系模式的定義、數(shù)據(jù)源及數(shù)據(jù)抽取模型等問題。物理模型設(shè)計(jì)要點(diǎn)任務(wù):物理數(shù)據(jù)庫表及其儲(chǔ)藏構(gòu)造設(shè)計(jì)。看法模型設(shè)計(jì)確定主題(借助一些基本的方向性需求)?需要做哪些種類的決策??決策者感興趣的是什么問題?對每個(gè)主題的內(nèi)容進(jìn)行描述(描述內(nèi)容)?解析問題時(shí)所關(guān)心的事實(shí);?解析問題

13、時(shí)的各種觀察角度;?這些問題需要什么樣的信息?描述事實(shí)及觀察角度的屬性。?要獲取這些信息需要包括哪些數(shù)據(jù)?解析問題的維度市場經(jīng)理:產(chǎn)品種類、時(shí)間、銷售地區(qū)、銷售渠道等。市場部部長:時(shí)間、地區(qū)、客戶統(tǒng)計(jì)特點(diǎn)、分銷機(jī)構(gòu)、產(chǎn)品型號(hào)等。財(cái)務(wù)經(jīng)理:估量、時(shí)間、地區(qū)信息包圖(用戶信息需求表)某連鎖酒店入住情況(核心問題是客房的使用量)維度包括:客房種類,酒店,時(shí)間要點(diǎn)指標(biāo):已占用客房,空房間,不能用房間,入住人數(shù),收入等。頁眉內(nèi)容對維度客房種類的解析:房間種類,房間大小,床位數(shù),床位種類,最多容納人數(shù),套房家具,冰箱,廚房等。對維度酒店的解析:分支機(jī)構(gòu)代碼,分支機(jī)構(gòu)名稱,國家,省份,地區(qū),城市,建設(shè)年份,

14、修葺年份等。對維度時(shí)間的解析:年份,季度,月份,星期幾,日期,假日標(biāo)準(zhǔn)等。5數(shù)據(jù)庫房項(xiàng)目的開發(fā)過程:項(xiàng)目規(guī)劃,需求解析,看法設(shè)計(jì),ETL設(shè)計(jì),邏輯和物理設(shè)計(jì),實(shí)現(xiàn)與培訓(xùn)。第六講OLAP多維數(shù)據(jù)庫(MOLAP)與關(guān)系數(shù)據(jù)庫(ROLAP)在儲(chǔ)藏上的不同樣對關(guān)系數(shù)據(jù)庫來說,任何數(shù)據(jù)集均用二維表來存放;對多維數(shù)據(jù)庫也是用二維表來存放的,但其存放方式和效率不同樣。若增加匯總,儲(chǔ)藏空間的占用情況也不同樣。若增加一個(gè)時(shí)間維季度,采用關(guān)系數(shù)據(jù)庫儲(chǔ)藏時(shí)仍使用二維表,多維數(shù)據(jù)庫則采用數(shù)據(jù)立方體這樣的三維數(shù)組來儲(chǔ)藏。2MOLAP與ROLAP的特點(diǎn)一般情況,MOLAP和ROLAP的選擇主要看應(yīng)用的規(guī)模。若要成立功能復(fù)

15、雜、規(guī)模較大的企業(yè)級(jí)數(shù)據(jù)庫房,則一般選擇ROLAP方式;若是成立功能單一、小型的數(shù)據(jù)集市則更適合采用MOLAP方式。第七講DM的歸納產(chǎn)生DM的原因:數(shù)據(jù)挖掘技術(shù)產(chǎn)生的動(dòng)力:數(shù)據(jù)爆炸問題;數(shù)據(jù)過分而知識(shí)困窮(新理論、新資料、新工藝、新方法的不斷出現(xiàn),使知識(shí)老化的速度加快。)從商業(yè)數(shù)據(jù)到商業(yè)信息的進(jìn)化推行數(shù)據(jù)挖掘的目的:?不再是單純?yōu)榱搜芯?,更主要的是為商業(yè)決策供應(yīng)真實(shí)有價(jià)值的信息,進(jìn)而獲取利潤。所有企業(yè)面對的一個(gè)共同問題是:企業(yè)數(shù)據(jù)量特別大,而其中真實(shí)有價(jià)值的信息卻很少,因此需要從大量的數(shù)據(jù)中經(jīng)過深層解析,獲取有利于商業(yè)運(yùn)作、提升競爭力的信息,就像從礦石中淘金同樣,數(shù)據(jù)挖掘也由此而得名。數(shù)據(jù)挖掘

16、與信息辦理、知識(shí)發(fā)現(xiàn)數(shù)據(jù)挖掘從大量的、不完滿的、有噪聲的、模糊的、隨機(jī)的實(shí)質(zhì)應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們早先不知道的、但又是潛藏適用的信息和知識(shí)的過程。與之相似的看法稱為知識(shí)發(fā)現(xiàn)。信息辦理基于盤問,能夠發(fā)現(xiàn)適用的信息。但是這種盤問回答反響的是直接存放在數(shù)據(jù)庫中的信息。它們不反響復(fù)雜的模式,或隱蔽在數(shù)據(jù)庫中的規(guī)律。知識(shí)發(fā)現(xiàn)(KnowledgeDiscoveryinDatabases)是用數(shù)據(jù)庫管理系統(tǒng)來儲(chǔ)藏?cái)?shù)據(jù),用機(jī)器學(xué)習(xí)的方法來解析數(shù)據(jù),挖掘大量數(shù)據(jù)背后隱蔽的知識(shí),稱為數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)。數(shù)據(jù)挖掘與數(shù)據(jù)庫房的差異聯(lián)系數(shù)據(jù)挖掘是數(shù)據(jù)庫房發(fā)展的必然結(jié)果。數(shù)據(jù)庫房為數(shù)據(jù)挖掘供應(yīng)給用基礎(chǔ):大多數(shù)

17、數(shù)據(jù)挖掘工具要在集成的、一致的、經(jīng)過清理的數(shù)據(jù)進(jìn)步行挖掘;數(shù)據(jù)庫房構(gòu)造過程中已組建了數(shù)據(jù)辦理和數(shù)據(jù)解析的基礎(chǔ)設(shè)施,數(shù)據(jù)挖掘可借此進(jìn)行,不用重新組建基礎(chǔ)設(shè)施;數(shù)據(jù)庫房中的OLAP完滿可為數(shù)據(jù)挖掘供應(yīng)相關(guān)的數(shù)據(jù)操作支持;在數(shù)據(jù)挖掘中,若是將數(shù)據(jù)挖掘與數(shù)據(jù)庫房進(jìn)行有效地聯(lián)系,將增加數(shù)據(jù)挖掘的聯(lián)機(jī)挖掘功能。數(shù)據(jù)挖掘與OLAPOLAP解析過程在實(shí)質(zhì)上是一個(gè)演繹推理的過程,是決策支持領(lǐng)域的一部分。傳統(tǒng)的盤問和報(bào)表工具是告訴你數(shù)據(jù)庫中都有什么(whathappened),OLAP則更進(jìn)一步告訴你下一步會(huì)怎么樣(Whatnext)和若是采用這樣的措施又會(huì)怎么樣(Whatif)。用戶第一成立一個(gè)假設(shè),爾后用OL

18、AP檢索數(shù)據(jù)庫來考據(jù)這個(gè)假設(shè)可否正確。頁眉內(nèi)容數(shù)據(jù)挖掘在本上是一個(gè)推理的程,與OLAP不同樣的地方是,數(shù)據(jù)挖掘不是用于某個(gè)假設(shè)的模式(模型)的正確性,而是在數(shù)據(jù)中自己找模型。數(shù)據(jù)挖掘和OLAP擁有必然的互性。在利用數(shù)據(jù)挖掘出來的采用行從前,OLAP工具能起助決策作用。而且在知的早期段,OLAP工具用來研究數(shù)據(jù),找到哪些是一個(gè)比重要的量,異常數(shù)據(jù)和互相影響的量。都有助于更好地理解數(shù)據(jù),加快知的程。數(shù)據(jù)挖掘的用?行解析客使用分渠道的情況和分渠道的容量;成立利模型;客關(guān)系化;控制等?子商網(wǎng)上商品介紹;個(gè)性化網(wǎng);自適網(wǎng)站?生物制、基因研究DNA序列和般配;基因序列的共生性?信欺甄;客流失?保、零售決策

19、?向性解析聚解析?客分?市分關(guān)解析?市合解析?套裝品解析?目?交織售神網(wǎng)?向性解析?客保留?目市?欺DW解決的商:介紹信息的生成,異常,客流失解析,管理,客分,廣告定位,。第八數(shù)據(jù)挖掘的程數(shù)據(jù)挖掘能夠企業(yè)供應(yīng)哪些幫助,如何使用聚、分、關(guān)挖掘和離群點(diǎn)等技企服。使用聚互網(wǎng)中的不同樣集體,用于網(wǎng)社區(qū);(2)?使用分客行等劃分,進(jìn)而施不同樣的服;?(3)?使用關(guān)大型數(shù)據(jù)集中存在的關(guān)系,用于介紹找尋。如大多數(shù)找尋了“廣外”的人都會(huì)找尋“信息學(xué)院”,那么在找尋“廣外”后會(huì)提示可否一步找尋“信息學(xué)院”。?(4)?使用離群點(diǎn)挖掘與大多數(shù)象不同樣的象,用于解析網(wǎng)的奧秘收集信息的攻。CRISP-DM六段商理解:確

20、定目、估商境、確定數(shù)據(jù)挖掘目、提出目劃數(shù)據(jù)理解:收集原始數(shù)據(jù)、描述數(shù)據(jù)、研究數(shù)據(jù)、數(shù)據(jù)量數(shù)據(jù)準(zhǔn):數(shù)據(jù)、數(shù)據(jù)沖刷、數(shù)據(jù)建、數(shù)據(jù)合并、數(shù)據(jù)格式化建模:建模技、方案估:果估、程回、確定下一步工作部署:部署劃、控和劃、做出最告、目回四次:段劃分、定通用任、定用任、理例上兩獨(dú)立于詳細(xì)數(shù)據(jù)挖掘方法,是一般數(shù)據(jù)挖掘目均需施的步(解決了“WHATTODO?”的)。兩的任將合詳細(xì)數(shù)據(jù)挖掘目的“上下文”(CONTEXT)照射到下兩的詳細(xì)任和程。下兩側(cè)重解決如何完成每個(gè)段所要完成的任和任的出所要求的必要照射活(用于解決“HOWTODO”的)。第九關(guān)解析1:通用主叫號(hào)的使用情況,行的關(guān)解析。有10,0音信箱,5移秘,

21、6信息點(diǎn)播,9呼叫移,10個(gè)主叫號(hào)及使用以下表所示。主叫號(hào)使用型主叫號(hào)使用型?A5,B6,T事數(shù)(主叫號(hào)數(shù)),AB出的支持度P(AB)=AB出次數(shù)/事數(shù)T=4/10=0.4眉內(nèi)容?對于擁有支持度0.4的項(xiàng)集AB,規(guī)則AB的可信度為P(B|A)=P(AB)/P(A)=(4/10)/(5/10)=0.4/0.5=0.8?同理,規(guī)則BA的可信度為P(A|B)=P(AB)/P(B)=0.4/0.6=0.67若用戶給出的最小可信度為0.3,最小支持度為0.3,則項(xiàng)集AB滿足最小支持度,是二項(xiàng)頻頻集,規(guī)則AB,BA兩條規(guī)則滿足最小可信度Apriori算法過程(基本思想:頻頻項(xiàng)集的任何子集也必然是頻頻的。)

22、(1)擬定最小支持度及最小置信度;(2)Apriori算法使用候選項(xiàng)集的看法,第一掃描數(shù)據(jù)庫產(chǎn)生候選項(xiàng)目集,若候選項(xiàng)目集的支持度最小支持度,則該候選項(xiàng)會(huì)集為頻頻項(xiàng)集;(3)在Apriori算法的過程中,第一由數(shù)據(jù)庫讀入所有的事務(wù)數(shù)據(jù),得出候選1_項(xiàng)會(huì)集C1及相應(yīng)的支持度數(shù)據(jù),經(jīng)過將每個(gè)1_項(xiàng)會(huì)集的支持度與最小支持度比較,得出頻頻1_項(xiàng)會(huì)集L1,爾后將這些頻頻1_項(xiàng)集兩兩進(jìn)行連接,產(chǎn)生候選2_項(xiàng)會(huì)集C2;(4)爾后再次掃描數(shù)據(jù)庫獲取候選2_項(xiàng)會(huì)集C2的支持度,將2_項(xiàng)集的支持度與最小支持度比較,確定頻頻2_項(xiàng)集L2,近似地,利用這些頻頻2_項(xiàng)集產(chǎn)生候選3_項(xiàng)集和確定頻頻3_項(xiàng)集,以此類推;(5)頻頻掃描數(shù)據(jù)庫與最小支持度比較,產(chǎn)生更高項(xiàng)的頻頻項(xiàng)會(huì)集,再結(jié)合產(chǎn)生下一級(jí)候選項(xiàng)集,直到不再結(jié)合產(chǎn)生出新的候選項(xiàng)集為止。2:假設(shè)最小支持度是2,最小置信度為50%,求大項(xiàng)集。第十講分類1熵(Entropy):針對一個(gè)給定的屬性(可展望屬性)找出一個(gè)數(shù)學(xué)公式,來胸襟數(shù)據(jù)集的純度。2ID3算法成立決策樹Step1:成立相關(guān)性計(jì)數(shù)表Step2:選擇一個(gè)屬性,爾后在根層次進(jìn)行拆分。例:3從樹中生成分類規(guī)則用IF-THEN這種形式來表示規(guī)則對從根到葉節(jié)點(diǎn)的每條路徑創(chuàng)辦一條規(guī)則沿著一條路徑的每個(gè)屬性值對組成“并”連接葉子節(jié)點(diǎn)中的種類就是所展望的類規(guī)則更簡單被人們理解4決策樹相關(guān)問

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論