人工智能基礎(chǔ)與應(yīng)用-物以類聚發(fā)現(xiàn)新簇群-人工智能案例電商用戶分類

上傳人：黃*** IP屬地：湖南上傳時(shí)間：2023-12-06 格式：PPTX 頁數(shù)：29 大?。?.28MB 積分：12 舉報(bào) 版權(quán)申訴

人工智能基礎(chǔ)與應(yīng)用-物以類聚發(fā)現(xiàn)新簇群-人工智能案例電商用戶分類_第2頁

人工智能基礎(chǔ)與應(yīng)用-物以類聚發(fā)現(xiàn)新簇群-人工智能案例電商用戶分類_第3頁

人工智能基礎(chǔ)與應(yīng)用-物以類聚發(fā)現(xiàn)新簇群-人工智能案例電商用戶分類_第4頁

人工智能基礎(chǔ)與應(yīng)用-物以類聚發(fā)現(xiàn)新簇群-人工智能案例電商用戶分類_第5頁

已閱讀5頁，還剩24頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

案例二

電商用戶分類授課:目錄零一提出問題零二解決方案零三預(yù)備知識(shí)零四任務(wù)一——從鍵盤輸入方程地系數(shù)零五任務(wù)二——調(diào)用roots函數(shù)求解方程零六任務(wù)三——為三類客戶提出營銷建議PART零一提出問題隨著信息技術(shù)地快速發(fā)展與電商市場線上消費(fèi)日趨壯大,使得眾多地企業(yè)將營銷重點(diǎn)從產(chǎn)品轉(zhuǎn)向客戶,維持良好地客戶關(guān)系逐漸成為企業(yè)地核心問題。那如何精準(zhǔn)區(qū)分電商系統(tǒng)用戶目前地狀態(tài),并根據(jù)用戶群分結(jié)果采取不同地措施保持客戶戶粘度是一個(gè)挑戰(zhàn)地問題。本案例將基于該場景采用聚類分析算法將電商用戶行合理群分,并基于不同類別用戶群體特征采用不同地營銷措施來保持用戶活躍度。提出問題PART零二解決方案以"客戶為心"地營銷模式在電商世界被提升到前所未有地高度,這與如下地一些營銷經(jīng)驗(yàn)密切有關(guān):l企業(yè)八零%以上地收入來自二零%地重要客戶;l絕大數(shù)利潤來自現(xiàn)有地客戶;l由于客戶群分不準(zhǔn)確,浪費(fèi)了多數(shù)營銷經(jīng)費(fèi);l對潛力客戶行升級,就意味著利潤成倍增加無論上述經(jīng)驗(yàn)是否完全準(zhǔn)確,但它至少說明了對客戶群分地重要,如果企業(yè)想獲得長期發(fā)展,不斷提升銷售利潤,就需要對客戶行有效地識(shí)別與管理。為此,我們對某知名電商公司地銷售數(shù)據(jù)從消費(fèi)間隔,消費(fèi)頻次與消費(fèi)總金額三個(gè)維度行統(tǒng)計(jì),并對數(shù)據(jù)行適當(dāng)?shù)厍逑磁c標(biāo)準(zhǔn)化,然后迭代尋找最佳聚類數(shù)k,最后行用戶群分,結(jié)合業(yè)務(wù)場景提供營銷建議。解決方案本案例地解決方案如下圖所示。解決方案PART零三預(yù)備知識(shí)一.RFM模型介紹客戶群分就是通過客戶數(shù)據(jù)來識(shí)別不同價(jià)值地客戶,那靠什么來識(shí)別客戶呢？這就要構(gòu)建相應(yīng)地客戶評價(jià)指標(biāo),RFM模型就是應(yīng)用最廣地識(shí)別客戶地模型。預(yù)備知識(shí)二.k-means模型主要屬屬名意義備注cluster_centers_聚類質(zhì)心,表示各簇地均值是一個(gè)ndarray向量labels_聚類標(biāo)簽,表示各樣本所屬地簇地標(biāo)記是一個(gè)ndarray向量inertia_組內(nèi)方差與,表示各樣本到各自簇質(zhì)心地距離地方與是一個(gè)float值k-means模型主要屬預(yù)備知識(shí)引例五-二對比聚類后三種鳶尾花地質(zhì)心數(shù)據(jù)。一iris_datas=pd.read_csv(r'data\iris.csv',sep=',')二kmeans三=KMeans(n_clusters=三,random_state=一五一).fit(iris_datas)三cluster_centers=kmeans三.cluster_centers_#獲取各簇地質(zhì)心四feature=['Sepal.Length','Sepal.Width','Petal.Length','Petal.Width']五angles=np.linspace(零,二*np.pi,len(feature),endpoint=False)六angles=np.concatenate((angles,[angles[零]]))#定義鳶尾花地花萼長度,花萼寬度,花蕊長度,花蕊寬度在極坐標(biāo)系上對應(yīng)地角度坐標(biāo)。七plt.figure(figsize=(八,四))八ax一=plt.subplot(一一一,polar=True)#在子圖ax一上按極坐標(biāo)系繪制圖形九i=零一零forvaluesincluster_centers:#代碼一零-一三以循環(huán)地方式依次繪制出各類質(zhì)心地雷達(dá)圖一一values=np.concatenate((values,[values[零]]))一二ax一.plot(angles,values,'o-',linewidth=二,label='類'+str(i)+'質(zhì)心')一三i+=一一四ax一.set_thetagrids(angles*一八零/np.pi,feature)#為質(zhì)心地各數(shù)據(jù)點(diǎn)定義標(biāo)簽一五plt.legend()一六plt.show()預(yù)備知識(shí)引例五-二對比聚類后三種鳶尾花地質(zhì)心數(shù)據(jù)。三類鳶尾花質(zhì)心分布圖由左圖可以看出,三個(gè)品種地鳶尾花在花萼長度,花萼寬度方面地特征差異并明顯,但在花蕊長度,花蕊寬度方面地特征值有明顯差異,說明不同品種鳶尾花地花蕊表現(xiàn)特征顯著不同,基于該特征描述,就可以據(jù)此來辨別鳶尾花地種類,該結(jié)論與案例一地分析結(jié)果一致。預(yù)備知識(shí)PART零四任務(wù)一選擇最佳地客戶群分?jǐn)?shù)目k下面我們根據(jù)RFM模型來統(tǒng)計(jì)出客戶三個(gè)重要地特征值,對客戶原始地消費(fèi)記錄行匯總統(tǒng)計(jì),計(jì)算出客戶最近地一次消費(fèi)間隔R,近半年地消費(fèi)頻次F與消費(fèi)總金額M,這涉及到數(shù)據(jù)地統(tǒng)計(jì)與預(yù)處理方法,在此從略,直接給出處理后地結(jié)果,保存在RFM.csv文件。任務(wù)目地:對文件RFM.csv行聚類分析,通過不同k值地聚類能評價(jià)指標(biāo)地對比,選擇最佳地客戶群分?jǐn)?shù)目k,為后續(xù)地客戶分群及營銷對策打下基礎(chǔ)。實(shí)現(xiàn)步驟:一.清洗掉無關(guān)地?cái)?shù)據(jù)。二.對數(shù)據(jù)行標(biāo)準(zhǔn)化處理三.求不同k值下客戶群分地能指標(biāo)四.繪制三個(gè)內(nèi)部能指標(biāo)地變化圖任務(wù)一——選擇最佳地客戶群分?jǐn)?shù)目k一.清洗掉無關(guān)地?cái)?shù)據(jù)。通過以下了代碼導(dǎo)入數(shù)據(jù)后,觀察前五行數(shù)據(jù)地結(jié)構(gòu),如下圖所示。fromsklearn.clusterimportKMeansfromsklearnimportmetricsfromsklearnimportpreprocessingimportmatplotlib.pyplotaspltimportpandasaspdkfm_datas=pd.read_csv(r'data\RFM.csv')原始樣本數(shù)據(jù)原始樣本數(shù)據(jù),第一列user_id地?cái)?shù)據(jù)只是標(biāo)識(shí)客戶地編號,不能作為聚類地特征值來使用,因此要把該列從原樣本集從剔除掉,實(shí)現(xiàn)代碼如下。 kfm_datas一=kfm_datas.iloc[:,一:] 這樣,我們按索引對原始樣本集行切片,只取第一列以后地所有行數(shù)據(jù)。任務(wù)一——選擇最佳地客戶群分?jǐn)?shù)目k二.對數(shù)據(jù)行標(biāo)準(zhǔn)化處理從右圖可以看出,R,F,M三個(gè)特征值大小差距很大,為消除不同量綱對聚類模型地影響,加快模型計(jì)算效率,通過以下代碼對樣本數(shù)據(jù)行標(biāo)準(zhǔn)化處理。 X=preprocessing.StandardScaler().fit_transform(kfm_datas一) 標(biāo)準(zhǔn)化處理后,得到新地樣本數(shù)據(jù)集X。三類鳶尾花質(zhì)心分布圖任務(wù)一——選擇最佳地客戶群分?jǐn)?shù)目k三.求不同k值下客戶群分地能指標(biāo) 由于樣本事先沒有標(biāo)注簇號,因此我們采用聚類地內(nèi)部指標(biāo):輪廓系數(shù),CH分?jǐn)?shù)與慣方差inertia來評價(jià)聚類效果,代碼如下。一 ch_score=[]#保存CH分?jǐn)?shù)二 ss_score=[]#輪廓系數(shù)三 inertia=[]#慣方差值四 forkinrange(二,一零):五 kmeans=KMeans(n_clusters=k,max_iter=一零零零)六 pred=kmeans.fit_predict(X)#對樣本集X行聚類,返回聚類標(biāo)簽保存在變量pred七 ch=metrics.calinski_harabasz_score(X,pred)八 ss=metrics.silhouette_score(X,pred)九 ch_score.append(ch)一零 ss_score.append(ss)一一 inertia.append(kmeans.inertia_)把客戶按R,F,M三個(gè)特征值分別劃分為三個(gè)等級,等同于最多可以將客戶劃分為三×三×三=二七種類型,但劃分太細(xì)不利于營銷活動(dòng)地開展與客戶管理,因此,此處將客戶類型個(gè)數(shù)k地取值范圍指定在[二,九]之間,然后計(jì)算每個(gè)k值對應(yīng)地聚類指標(biāo)。任務(wù)一——選擇最佳地客戶群分?jǐn)?shù)目k四.繪制三個(gè)內(nèi)部能指標(biāo)地變化圖有了不同k值下客戶聚類能指標(biāo)值,據(jù)此分別繪制出CH分?jǐn)?shù),輪廓系數(shù)SS與慣方差inertia隨k變化地折線圖,然后綜合觀察三個(gè)能指標(biāo)地變化特征,最終確定最佳地客戶群分?jǐn)?shù)k。繪制折線圖地代碼如下。一 plt.figure(figsize=(一零,四))二 plt.rcParams['font.sans-serif']=['SimHei']三 ax一=plt.subplot(一三一)#指定在一行三列地第一張子圖上繪圖四 plt.plot(list(range(二,一零)),ch_score,label='ch分?jǐn)?shù)',c='y')#以k為橫坐標(biāo),CH分?jǐn)?shù)為縱坐標(biāo)繪制折線圖,圖例標(biāo)簽為"ch分?jǐn)?shù)",線條顏色為黃色。五 plt.legend()六 ax二=plt.subplot(一三二)七 plt.plot(list(range(二,一零)),ss_score,label='輪廓系數(shù)ss',c='b')八 plt.legend()九 ax三=plt.subplot(一三三)一零 plt.plot(list(range(二,一零)),inertia,label='方差與inertia',c='g')一一 plt.legend()一二 plt.show()任務(wù)一——選擇最佳地客戶群分?jǐn)?shù)目kPART零五任務(wù)二計(jì)算三類客戶地RFM均值根據(jù)最佳k值三重新對客戶行聚類,根據(jù)各類地質(zhì)心來了解不同客戶群體在R,F,M三個(gè)特征上地均值情況,據(jù)此結(jié)合業(yè)務(wù)實(shí)情來辨別三個(gè)具體地客戶類型,如哪類是重要客戶,哪類是重要發(fā)展或挽留客戶,哪類是一般或低價(jià)值客戶等。新建文件五-四_task二.ipynb,根據(jù)任務(wù)目地,按照以下步驟與操作,完成任務(wù)二。任務(wù)目地:對樣本數(shù)據(jù)按k=三重新聚類,求聚類結(jié)果地質(zhì)心。實(shí)現(xiàn)步驟: 一.重新聚類。二.求質(zhì)心數(shù)據(jù)任務(wù)二——計(jì)算三類客戶地RFM均值一.重新聚類按簇類數(shù)三對客戶行重新聚類,得到各客戶群地質(zhì)心與對應(yīng)地標(biāo)簽,因?yàn)樵诰垲惽皩υ紨?shù)據(jù)行了標(biāo)準(zhǔn)化處理,所有要對質(zhì)心行反標(biāo)準(zhǔn)化轉(zhuǎn)換,得到質(zhì)心地原始值,即RFM指標(biāo)地原始均值。代碼如下。一 kfm_datas=pd.read_csv(r'data\RFM.csv')二 kfm_datas一=kfm_datas.iloc[:,一:]三 stand_scaler=preprocessing.StandardScaler()四 X=stand_scaler.fit_transform(kfm_datas一)五 kmeans=KMeans(n_clusters=三,random_state=一五一,max_iter=一零零零)

#按聚類數(shù)目三對客戶行聚類,迭代次數(shù)為一零零零次。六 labels=pd.Series(kmeans.fit_predict(X)) #得到聚類后地各樣本標(biāo)簽。任務(wù)二——計(jì)算三類客戶地RFM均值一.重新聚類按簇類數(shù)三對客戶行重新聚類,得到各客戶群地質(zhì)心與對應(yīng)地標(biāo)簽,因?yàn)樵诰垲惽皩υ紨?shù)據(jù)行了標(biāo)準(zhǔn)化處理,所有要對質(zhì)心行反標(biāo)準(zhǔn)化轉(zhuǎn)換,得到質(zhì)心地原始值,即RFM指標(biāo)地原始均值。代碼如下。一 kfm_datas=pd.read_csv(r'data\RFM.csv')二 kfm_datas一=kfm_datas.iloc[:,一:]三 stand_scaler=preprocessing.StandardScaler()四 X=stand_scaler.fit_transform(kfm_datas一)五 kmeans=KMeans(n_clusters=三,random_state=一五一,max_iter=一零零零)

#按聚類數(shù)目三對客戶行聚類,迭代次數(shù)為一零零零次。六 labels=pd.Series(kmeans.fit_predict(X)) #得到聚類后地各樣本標(biāo)簽。任務(wù)二——計(jì)算三類客戶地RFM均值二.求質(zhì)心數(shù)據(jù)一 centers=stand_scaler.inverse_transform(kmeans.cluster_centers_) #對各類質(zhì)心行反標(biāo)準(zhǔn)化轉(zhuǎn)換,以便得到原始數(shù)據(jù)值。二 centers=pd.DataFrame(centers) #將質(zhì)心數(shù)據(jù)由數(shù)組類型轉(zhuǎn)換成數(shù)據(jù)框架類型,方便觀察與后續(xù)數(shù)據(jù)處理。各客戶類型在RFM三個(gè)指標(biāo)方向地均數(shù)據(jù)centers如右圖所示。三類質(zhì)心原始數(shù)據(jù)任務(wù)二——計(jì)算三類客戶地RFM均值二.求質(zhì)心數(shù)據(jù)一result=pd.concat([centers,labels.value_counts().sort_index(ascending=True)],axis=一)#對聚類后地標(biāo)簽行分類計(jì)數(shù),并按標(biāo)簽升序?qū)τ?jì)數(shù)結(jié)果排序,然后將排序結(jié)果與質(zhì)心數(shù)據(jù)組合起來。二result.columns=list(kfm_datas一.columns)+['counts']#為分類計(jì)數(shù)結(jié)果添加一個(gè)列名"'counts'"。對質(zhì)心數(shù)據(jù)行處理:任務(wù)二——計(jì)算三類客戶地RFM均值PART零六任務(wù)三為三類客戶提出營銷建議根據(jù)對各個(gè)客戶群行特征分析,對各類客戶群行價(jià)值排名,針對不同類型地客戶群提供不同地產(chǎn)品或服務(wù),以達(dá)到提升客戶消費(fèi)水地目地。新建文件五-四_task三.ipynb,根據(jù)任務(wù)目地,按照以下步驟與操作,完成任務(wù)三。任務(wù)目地:分析各客戶群特征,提供相應(yīng)地營銷建議或策略。實(shí)現(xiàn)步驟: 一.繪制客戶群地R,F,M指標(biāo)折線圖二.提供營銷建議任務(wù)三——為三類客戶提出營銷建議一.繪制客戶群地R,F,M指標(biāo)折線圖在任務(wù)二地基礎(chǔ)上,繪制出各類客戶在最近一次消費(fèi)時(shí)間間隔,消費(fèi)頻次與消費(fèi)總金額方面地對比圖,以便直觀觀測各類客戶地消費(fèi)特征與差異,為制定營銷策略提供依據(jù)。實(shí)現(xiàn)代碼如右。一 fig=plt.figure(figsize=(一零,四))二 plt.rcParams['font.sans-serif']=['SimHei']三 ax一=plt.subplot(一三

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

人工智能基礎(chǔ)與應(yīng)用-物以類聚發(fā)現(xiàn)新簇群-人工智能案例電商用戶分類

文檔簡介

溫馨提示

最新文檔

評論

人工智能基礎(chǔ)與應(yīng)用-物以類聚發(fā)現(xiàn)新簇群-人工智能案例電商用戶分類

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔