數(shù)據(jù)挖掘——關(guān)聯(lián)分析_第1頁
數(shù)據(jù)挖掘——關(guān)聯(lián)分析_第2頁
數(shù)據(jù)挖掘——關(guān)聯(lián)分析_第3頁
數(shù)據(jù)挖掘——關(guān)聯(lián)分析_第4頁
數(shù)據(jù)挖掘——關(guān)聯(lián)分析_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、奇怪的現(xiàn)象:啤酒和尿不濕沃爾瑪曾在對賣場銷售數(shù)據(jù)進(jìn)行分析時發(fā)現(xiàn)一個很奇怪的現(xiàn)象:尿不濕和啤酒的銷售額增幅極其相近。這兩個完全沒有關(guān)系的產(chǎn)品的銷售變化情況怎么會如此一致?引言通過分析發(fā)現(xiàn):很多年輕的父親被妻子打發(fā)出來給孩子買尿不濕,他們都有喝啤酒的習(xí)慣。每次都會順帶著買些啤酒回家。沃爾瑪超市:嬰兒的尿不濕和啤酒陳列在一起銷售?結(jié)果: 尿不濕銷量增長18% 啤酒銷量30%關(guān)聯(lián)分析關(guān)聯(lián)分析引言關(guān)聯(lián)分析是什么1原理與基礎(chǔ)概念2關(guān)聯(lián)分析的應(yīng)用3案例分析4目錄關(guān)聯(lián)分析是數(shù)據(jù)挖掘領(lǐng)域常用的一類算法,主要用于發(fā)現(xiàn)隱藏在大型數(shù)據(jù)集中有意義的聯(lián)系,所發(fā)現(xiàn)的模式通常用關(guān)聯(lián)規(guī)則或頻繁項集的形式表示。能夠幫助企業(yè)做很多

2、很有用的產(chǎn)品組合推薦、優(yōu)惠促銷組合,同時也能指導(dǎo)貨架擺放是否合理,還能夠找到更多的潛在客戶,真正的把數(shù)據(jù)挖掘落到實處。關(guān)聯(lián)分析是什么簡單的說,就是發(fā)現(xiàn)大量數(shù)據(jù)中項集之間有趣的關(guān)聯(lián)。在交易數(shù)據(jù)、關(guān)系數(shù)據(jù)或其他信息載體中,查找存在于項目集合或?qū)ο蠹现g的頻繁模式、關(guān)聯(lián)、相關(guān)性或因果結(jié)構(gòu)。 關(guān)聯(lián)分析是什么原理與基礎(chǔ)概念l 關(guān)聯(lián)規(guī)則 關(guān)聯(lián)規(guī)則是形如X-Y的蘊含表達(dá)式,X和Y是不相交的項集 例子:Mike,Diaper-Beerl 主要步驟: 大多數(shù)關(guān)聯(lián)規(guī)則挖掘算法通常采用的一種策略是將關(guān)聯(lián)規(guī)則挖掘任務(wù)分解為如下兩個主要的子任務(wù): 頻繁項集產(chǎn)生(Frequent Itemset Generation)

3、 其目標(biāo)是發(fā)現(xiàn)滿足最小支持度閾值的所有項集,這些項集稱作頻繁項集。 規(guī)則的產(chǎn)生(Rule Generation) 其目標(biāo)是從上一步發(fā)現(xiàn)的頻繁項集中提取高置信度的規(guī)則,這些規(guī)則稱作強(qiáng)規(guī)則原理與基礎(chǔ)概念原理與基礎(chǔ)概念 就啤酒、尿不濕案例而言,首先必須要設(shè)定最小支持度與最小可信度兩個閾值,在此假設(shè)最小支持度min-support=5%且最小可信度min-confidence=65%。用公式可以描述為:SupportDiaper,Beer5%and ConfidenceDiaper,Beer65% 其中,SupportDiaper,Beer5%于此應(yīng)用范例中的意義為:在所有的交易記錄資料中,至少有5%

4、的交易呈現(xiàn)尿布與啤酒這兩項商品被同時購買的交易行為。ConfidenceDiaper,Beer65%于此應(yīng)用范例中的意義為:在所有包含尿布的交易記錄資料中,至少有65%的交易會同時購買啤酒。l客戶需求預(yù)測:顧客還喜歡什么、還想買啥 最常見的是你在一些電商平臺上,如淘寶、亞馬遜等,旁邊會出現(xiàn)購買該商品的人,有百分之多少還會購買如下的產(chǎn)品,快速幫助顧客找到其共同愛好的產(chǎn)品。關(guān)聯(lián)分析的應(yīng)用關(guān)聯(lián)分析的應(yīng)用l促銷禮包或優(yōu)惠組合套裝 通過關(guān)聯(lián)規(guī)則,推出相應(yīng)的促銷禮包或優(yōu)惠組合套裝,快速幫助提高銷售額。如:飄柔洗發(fā)水+玉蘭油沐浴露、海飛絲洗發(fā)水+舒膚佳沐浴露等促銷禮包;天貓雙十一組合套餐關(guān)聯(lián)分析的應(yīng)用l零售

5、超市或商場,產(chǎn)品合理擺放 零售超市或商場,可以通過產(chǎn)品關(guān)聯(lián)程度大小,指導(dǎo)產(chǎn)品合理擺放,方便顧客最購買更多其所需要的產(chǎn)品。最常見的就是超市里面購買肉和購買蔬菜水果等貨架會擺放得很近,目前就是很多人會同時購買肉與蔬菜。淘寶店鋪裝修分析也可參考該策略。l尋找更多潛在的目標(biāo)客戶 70人里面,購買A的有60人,購買B的有40人,同時購買A和B的有30人,說明A有一半的顧客會購買B,反推而言。如果推出類似B的產(chǎn)品,除了向產(chǎn)品B的用戶推薦(因為新產(chǎn)品與B的功能效果比較類似)之外,還可以向A的客戶進(jìn)行推薦,這樣就能最大限度地尋找更多的目標(biāo)客戶。關(guān)聯(lián)分析的應(yīng)用案例分析描述超市購物籃內(nèi)容(所購買的全部商品的集合)的虛構(gòu)數(shù)據(jù),以及購買的相關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論