![電信客戶流失分析(第九組)_第1頁](http://file4.renrendoc.com/view/bf70c900180545ec81284917c691ad18/bf70c900180545ec81284917c691ad181.gif)
![電信客戶流失分析(第九組)_第2頁](http://file4.renrendoc.com/view/bf70c900180545ec81284917c691ad18/bf70c900180545ec81284917c691ad182.gif)
![電信客戶流失分析(第九組)_第3頁](http://file4.renrendoc.com/view/bf70c900180545ec81284917c691ad18/bf70c900180545ec81284917c691ad183.gif)
![電信客戶流失分析(第九組)_第4頁](http://file4.renrendoc.com/view/bf70c900180545ec81284917c691ad18/bf70c900180545ec81284917c691ad184.gif)
![電信客戶流失分析(第九組)_第5頁](http://file4.renrendoc.com/view/bf70c900180545ec81284917c691ad18/bf70c900180545ec81284917c691ad185.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
電信業(yè)客戶流失分析電信市場競爭比較激烈,挽留一個(gè)老客戶能夠帶來很大的收益,,可是這個(gè)客戶挽留活動(dòng)畢竟只是公司眾多市場活動(dòng)中的一個(gè),預(yù)算也有限。因此分析流失客戶的特征是很關(guān)鍵的,現(xiàn)要求對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分析,看看哪些客戶可能會(huì)流失?這些客戶都有哪些特征?根據(jù)流失客戶的特征組織一個(gè)市場營銷活動(dòng)來遏制這種趨勢。數(shù)據(jù)表一:客戶基本信息表(custinfo.csv)customerlD:客戶編號;gender:性別;age:年齡;L_O_S:在網(wǎng)時(shí)間;tariff:話費(fèi)方案;Handset:手機(jī)品牌;表二:客戶通話情況表的結(jié)構(gòu)Peak_calls:高峰時(shí)期電話數(shù);peak_mins:高峰時(shí)期電話時(shí)長;offpeak_calls:低谷時(shí)期電話數(shù);offpeak_mins:低谷時(shí)期電話時(shí)長;weekend_calls:周末時(shí)期電話數(shù):weekend_mins:周末時(shí)期電話時(shí)長:international_mins:國際電話時(shí)長;Net_call_cost:國內(nèi)電話時(shí)長;Month:月份;表三:話費(fèi)方案表Tariff:話費(fèi)類型;fixed_cost:固定費(fèi)用;free_mins:免費(fèi)時(shí)長;peak_rate:高峰時(shí)期單價(jià);pffpeak_rate:非高峰時(shí)期單價(jià);weekend_rate:周末單價(jià);international_rate:國際長途單價(jià)二、問題分析根據(jù)已有的結(jié)果—流失客戶,尋找他們流失的原因,即流失客戶的特征。通過數(shù)據(jù)處理,統(tǒng)合數(shù)據(jù),將用戶通話總話費(fèi)求出,代表一個(gè)特征來描述客戶。在綜合數(shù)據(jù)求出一些派生的特征指標(biāo),例如高峰比率、低峰比率等。綜合這些特征的指標(biāo),我們通過用“特征選擇模型”,選出對流失客戶影響大的指標(biāo),再用決策樹將選出的指標(biāo)進(jìn)行分析可以得到這些指標(biāo)對流失客戶的具體影響。三、模型的建立和求解數(shù)據(jù)預(yù)處理1、數(shù)據(jù)理解字段名稱指標(biāo)解釋套餐類型固定費(fèi)用每月需支付固定費(fèi)用免費(fèi)時(shí)長每月提供免費(fèi)(國內(nèi))時(shí)長高峰時(shí)費(fèi)率咼峰時(shí)期每分鐘話費(fèi)(超過免費(fèi)時(shí)長部分)低谷時(shí)費(fèi)率低谷時(shí)期每分鐘話費(fèi)(超過免費(fèi)時(shí)長部分)周末時(shí)費(fèi)率周末時(shí)期每分鐘話費(fèi)(超過免費(fèi)時(shí)長部分)國際費(fèi)率國際長途電話每分鐘話費(fèi)語音信箱語信信箱收費(fèi)(未用)短信服務(wù)短信服務(wù)收費(fèi)(未用)國內(nèi)通話話費(fèi)-咼峰+低谷+周末2、數(shù)據(jù)預(yù)處理根據(jù)所給數(shù)據(jù)分別計(jì)算出高峰平均每次通話時(shí)長、低峰平均每次通話時(shí)長、周末平均每次通話時(shí)長、國內(nèi)通話總次數(shù)、國內(nèi)通話總時(shí)長,進(jìn)而求出國內(nèi)平均每次通話時(shí)長以及全部時(shí)長、總費(fèi)用,由國內(nèi)通話費(fèi)用=高峰+低谷+周末,得到總費(fèi)用=國內(nèi)通話費(fèi)用+國際通話費(fèi)用。模型建立1、特征選擇的算法:為了縮小選擇范圍,可以使用特征選擇算法來識別對某給定分析最為重要的字段特征選擇由以下三個(gè)步驟組成:(1)刪除不重要或有問題的輸入、記錄或個(gè)案(例如輸入字段含有過多缺失值,或者輸入字段的變異太大或太少而變得無用)。(2) 對剩余輸入進(jìn)行排序并根據(jù)重要性進(jìn)行分級。主要運(yùn)用Persron卡方統(tǒng)計(jì)量進(jìn)行排序(3) 識別在后續(xù)模型中使用的功能子集,例如通過僅保留最重要的輸入,過濾或排除所有其它輸入。Persron卡方統(tǒng)計(jì)量算法:2、C5.0的算法C5.0來處理數(shù)值型或分類型的資料,它的分類預(yù)測是基于邏輯的,即通過對輸入變量取值的布爾比較實(shí)現(xiàn)對輸出變量的分類預(yù)測,在眾多的輸出變量中選擇一個(gè)當(dāng)前最佳的分組變量,并從分組變量的眾多取值中找到一個(gè)最佳的分割點(diǎn),且為了清楚的表示分析結(jié)果,可用決策樹(decisiontrees)或是if-then的關(guān)系顯示.C5.0模型基本算法設(shè)R是非標(biāo)稱屬性集;C是標(biāo)稱屬性;S是訓(xùn)練集;trees()是決策樹生成的函數(shù):trees(R,C,S)//函數(shù)返回值類型為決策樹{/*****************相關(guān)定義********************bIj二1,2,…,m}為屬性D的值;j*Ij二1,2,…,m}為S的子集,分別包含屬性D的不同值d;j******************************************************/if(S為空) then返回單一失敗節(jié)點(diǎn);if(R包含的記錄的標(biāo)稱屬性值均相同)then返回具有該標(biāo)稱屬性值的單一節(jié)點(diǎn);if(R為空)then返回用S的最常見值賦值的單一節(jié)點(diǎn);/*此時(shí)為出錯(cuò),記錄沒有被適當(dāng)分類*/在R中找尋具有最大信息增益的屬性D;;生成一棵以D為根的樹,分支為d,d,…,d;12m遞歸調(diào)用函數(shù)trees(R-{D},C,S);trees(R-{D},C,S);???,trees(R-{D},C,S);12m}模型的求解1、運(yùn)用spssmodeler利用特征選擇模型對合并后的數(shù)據(jù)進(jìn)行重要性選擇,選擇對流失影響比較大的16個(gè)屬性,整理成如下表(表一):字段重要性值Handset重要1.0Age重要1.0Tariff重要1.0OffPeakminsSum重要1.0OffPeakcallsSum重要1.0國內(nèi)通話總次數(shù)重要1.0國內(nèi)總的通話時(shí)長重要1.0.全部時(shí)長重要1.0Fixedcost重要1.0PeakminsSum重要0.999PeakcallsSum重要0.997高峰平均每次通話時(shí)長重要0.992國內(nèi)平均每次通話時(shí)長重要0.989WeekendminsSum重要0.989LOS重要0.97Gender一般重要0.9472、利用C5.0決策模型建立模型,以客戶流失與否為目標(biāo),上述表一得出的重要屬性為影響目標(biāo)的決策因素(圖一):
IIWeChurnitt萍恥腰 皿訊牌3、(1)不同手機(jī)品牌的流失平均值(表二):H日門dsEtUhu「nSum|Reco「dGount|手機(jī)流失平均fl1ICAS60斗4810.00&2WC951227100.0043BS21056104-50.0544BS11023932220.0745CAS302574100.6276ASAD904176410.65173804430250.0158S5033242560.07&gASAD1701525710.00610SOP1057&50.67111SOP20691040.6632)不同套餐的流失平均值(表三):TariffChurnSumRecordCount夷餐流失平均值1Play30013224150.0552CAT20060S&1&50.0743CAT10032440510.0304-Play10034927&20.1255CAT50&911070.030由表三和表四可以看出,由于手機(jī)品牌不同的流失平均值比由于套餐不同流失的平均值相對都要大,這說明,手機(jī)品牌比套餐影響客戶流失的作用大。這也正好應(yīng)正3.2.2圖二的內(nèi)容。模型準(zhǔn)確性評價(jià)準(zhǔn)確率結(jié)果評估表(表五)
曰輸出字段Churn的結(jié)果自“比較^C-Churn與Churn正確17,69495.39%錯(cuò)誤8564.61%莒計(jì)18,550A-SCC-Churn的置信度值報(bào)告范圉0.567-0.991平均正確性0.96平均不正確性0.7S2正確性恰絡(luò)高于0.991(觀測值的0%)不正確性怡鏤低于0.567(觀測值的0%)95-39%以上的淮確性0.02-C以上的折趣正確性0.979(觀測值的72.09%)結(jié)果分析:由樹形決策圖可以看出:手機(jī)型號對客戶流失的影響最大
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國協(xié)同辦公行業(yè)市場調(diào)研及投資戰(zhàn)略規(guī)劃建議報(bào)告
- 企業(yè)員工退休合同范本
- 冷庫儲存生姜合同范本
- 農(nóng)村買墓地合同范本
- 會(huì)場責(zé)任合同范本
- 保價(jià)合同范本
- 2025年無機(jī)陶瓷膜超濾設(shè)備行業(yè)深度研究分析報(bào)告
- 安徽省壽縣眾興鎮(zhèn)方言淺談
- 會(huì)場綠植租賃合同范例
- 公司組建合同范例
- 火力發(fā)電廠水、汽試驗(yàn)方法(標(biāo)準(zhǔn)規(guī)程匯編)
- 傷寒論類方整理
- 休閑農(nóng)業(yè)與鄉(xiāng)村旅游(課件)
- GB/T 19675.2-2005管法蘭用金屬?zèng)_齒板柔性石墨復(fù)合墊片技術(shù)條件
- 社會(huì)工作綜合能力上(初級)課件
- 《數(shù)據(jù)結(jié)構(gòu)》課件(完整版)
- 2023年春節(jié)后建筑施工復(fù)工復(fù)產(chǎn)專項(xiàng)方案
- 污水處理廠化驗(yàn)管理手冊
- 出納收入支出記賬表Excel模板
- 叉車操作規(guī)程
- 土建工程技術(shù)標(biāo)范本(DOC167頁)
評論
0/150
提交評論