四川經(jīng)分應(yīng)用模型-準(zhǔn)沉默客戶識(shí)別模型設(shè)計(jì)說(shuō)明書(shū)_第1頁(yè)
四川經(jīng)分應(yīng)用模型-準(zhǔn)沉默客戶識(shí)別模型設(shè)計(jì)說(shuō)明書(shū)_第2頁(yè)
四川經(jīng)分應(yīng)用模型-準(zhǔn)沉默客戶識(shí)別模型設(shè)計(jì)說(shuō)明書(shū)_第3頁(yè)
四川經(jīng)分應(yīng)用模型-準(zhǔn)沉默客戶識(shí)別模型設(shè)計(jì)說(shuō)明書(shū)_第4頁(yè)
四川經(jīng)分應(yīng)用模型-準(zhǔn)沉默客戶識(shí)別模型設(shè)計(jì)說(shuō)明書(shū)_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

四川 移動(dòng) 準(zhǔn) 沉默客戶識(shí)別 模型 分析設(shè)計(jì)說(shuō)明書(shū) 版本號(hào) 1.0 2 項(xiàng)目名稱(chēng) 四川移動(dòng) 準(zhǔn) 沉默客戶 模型建設(shè) 文檔名稱(chēng) 四川移動(dòng) 準(zhǔn) 沉默客戶 模型分析設(shè)計(jì)說(shuō)明書(shū) 版本號(hào) 1.0 發(fā)布日期 2010.6 文檔變更記錄 版本 修改章節(jié) 修改類(lèi)型 日期 修改人 備注 目 錄 1. 模型概述 . 1 2. 業(yè)務(wù)理解與目標(biāo)定義 . 1 2.1 模型定義 . 1 2.2 目標(biāo)定義 . 1 3. 數(shù)據(jù)準(zhǔn)備與數(shù)據(jù)探索 . 2 3.1 數(shù)據(jù)準(zhǔn)備 . 2 3.2 數(shù)據(jù)探索 . 7 4. 模型構(gòu)建 . 8 4.1 建模工具 . 8 4.2 建模流程 . 8 5. 模型評(píng)估 . 9 5.1 模型評(píng)估 . 9 5.2 結(jié)果解釋 . 10 6. 模型部署 . 14 附錄 . 14 本文件屬保密資料 1 1. 模型 概述 沉默客戶的存在,不僅造成了資源的大量浪費(fèi),也為市場(chǎng)運(yùn)營(yíng)及營(yíng)銷(xiāo)工作帶來(lái)了困難,同時(shí),也造成了離網(wǎng)用戶的大量增加和挽留難度的大幅提升。 準(zhǔn) 沉默客戶識(shí)別 模型的目標(biāo) 在于為 營(yíng)銷(xiāo) 工作 提供決策參考 , 協(xié)助需求部門(mén) 有效的進(jìn)行營(yíng)銷(xiāo)前移,通過(guò)沉默客戶預(yù)判工作,在客戶接觸點(diǎn)尚未消失前進(jìn)行 針對(duì)性的 營(yíng)銷(xiāo)及挽留 相關(guān)工作 , 保證其資源利用和效率提升,進(jìn)一步深入進(jìn)行市場(chǎng)精細(xì)化 運(yùn)營(yíng) 。 由于最后一次通話狀態(tài)和用戶在網(wǎng)時(shí)長(zhǎng)在用戶沉默原因上的差異 性較明顯,如最后一次通話為漫游狀態(tài)的用戶一般認(rèn)為是自然流失客戶,如網(wǎng) 3 個(gè)月以?xún)?nèi)的號(hào)碼穩(wěn)定性一般較差,受渠道、 SP 廠商的影響也較大。因此, 在進(jìn)行模型建設(shè)的具體工作的之前,結(jié)合業(yè)務(wù)經(jīng)驗(yàn)及具體數(shù)據(jù)分析,為使模型結(jié)果更能夠符合實(shí)際使用需要,將 準(zhǔn) 沉默客戶細(xì)分成三類(lèi):最后一次通話為漫游的客戶、最后一次通話非漫游且在網(wǎng)時(shí)長(zhǎng) 3個(gè)月以?xún)?nèi)的客戶和最后一次通話非漫游且在網(wǎng)時(shí)長(zhǎng) 3 個(gè)月以上的客戶,針對(duì)每一類(lèi)客戶均建立了預(yù)測(cè)模型。 2. 業(yè)務(wù) 理解與 目標(biāo) 定義 2.1 模型定義 沉默客戶 定義: 指上月上網(wǎng)本月未上網(wǎng) 的客戶 上網(wǎng)客戶定義:當(dāng)月產(chǎn)生語(yǔ) 音、短信、 GPRS 等話單的客戶 凈增客戶定義:當(dāng)月上網(wǎng)客戶數(shù)減去上月上網(wǎng)客戶數(shù) 2.2 目標(biāo)定義 建立 準(zhǔn) 沉默客戶 識(shí)別 預(yù)測(cè)模型并且產(chǎn)生最可能的 目標(biāo)客戶 的名單,結(jié)合每個(gè)客戶的價(jià)值評(píng)分 ,用 0 到 1 之間的值來(lái)量化 目標(biāo) 客戶的可能性大小。 本文件屬保密資料 2 3. 數(shù)據(jù) 準(zhǔn)備 與數(shù)據(jù)探索 3.1 數(shù)據(jù)準(zhǔn)備 基礎(chǔ)變量表: 字段名 數(shù)據(jù)類(lèi)型 解釋 ID_NO_1 BIGINT 用戶編碼 PHONE_NO_1 VARCHAR(20) 手機(jī)號(hào)碼 RUN_NAME VARCHAR(32) 截止提數(shù)日用戶狀態(tài) RUN_CODEOLD CHARACTER(10) 截止提數(shù)日用戶狀態(tài)編碼 GROUP_ID VARCHAR(32) 入網(wǎng)渠道編碼 GROUP_NAME VARCHAR(300) 入網(wǎng)渠道名稱(chēng) AREA_NAME VARCHAR(32) 歸屬地市 COUNTY_NAME VARCHAR(64) 歸屬區(qū)縣 OPEN_TIME VARCHAR(20) 入網(wǎng)時(shí)間 SM_CODE CHARACTER(10) 資費(fèi)代碼 BRAND_NAME VARCHAR(100) 品牌名稱(chēng) MODE_NAME CHARACTER(100) 資費(fèi)名稱(chēng) VIPFLAG INTEGER vip 客戶標(biāo)記 VIP_CLASS VARCHAR(10) vip 客戶等級(jí) GRPFLAG INTEGER 歸屬集團(tuán)編碼 GRP_NAME VARCHAR(300) 歸屬集團(tuán)名稱(chēng) HIGHFLAG INTEGER 中高端客戶標(biāo)記 ALLDURATION05 INTEGER 總通話時(shí)長(zhǎng) ALLCALLTIMES05 INTEGER 總通話次數(shù) ALLDURATION04 INTEGER 上月通話時(shí)長(zhǎng) ALLCALLTIMES04 INTEGER 上月總通話次數(shù) ALLDURATION03 INTEGER 上上月通話時(shí)長(zhǎng) ALLCALLTIMES03 INTEGER 上上月總通話次數(shù) BDDURATION05 INTEGER 本地通話時(shí)長(zhǎng) BDCALLTIMES05 INTEGER 本地通話次數(shù) BDDURATION04 INTEGER 上月本地通話時(shí)長(zhǎng) BDCALLTIMES04 INTEGER 上月本地通話次數(shù) BDDURATION03 INTEGER 上上月本地通話時(shí)長(zhǎng) BDCALLTIMES03 INTEGER 上上月本地通話次數(shù) CTDURATION05 INTEGER 長(zhǎng)途通話時(shí)長(zhǎng) CTCALLTIMES05 INTEGER 長(zhǎng)途通話次數(shù) 本文件屬保密資料 3 CTDURATION04 INTEGER 上月長(zhǎng)途通話時(shí)長(zhǎng) CTCALLTIMES04 INTEGER 上月長(zhǎng)途通話次數(shù) CTDURATION03 INTEGER 上上月長(zhǎng)途通話時(shí)長(zhǎng) CTCALLTIMES03 INTEGER 上上月長(zhǎng)途通話次數(shù) MYDURATION05 INTEGER 漫游通話時(shí)長(zhǎng) MYCALLTIMES05 INTEGER 漫游通話次數(shù) MYDURATION04 INTEGER 上月漫游通話時(shí)長(zhǎng) MYCALLTIMES04 INTEGER 上月漫游通話次數(shù) MYDURATION03 INTEGER 上上月漫游通話時(shí)長(zhǎng) MYCALLTIMES03 INTEGER 上上月漫游通話次數(shù) ZJDURATION05 INTEGER 主叫通話時(shí)長(zhǎng) ZJCALLTIMES05 INTEGER 主叫通話次數(shù) ZJDURATION04 INTEGER 上月主叫通話時(shí)長(zhǎng) ZJCALLTIMES04 INTEGER 上月主叫通話次數(shù) ZJDURATION03 INTEGER 上上 月主叫通話時(shí)長(zhǎng) ZJCALLTIMES03 INTEGER 上上月主叫通話次數(shù) BJDURATION05 INTEGER 被叫通話時(shí)長(zhǎng) BJCALLTIMES05 INTEGER 被叫通話次數(shù) BJDURATION04 INTEGER 上月被叫通話時(shí)長(zhǎng) BJCALLTIMES04 INTEGER 上月被叫通話次數(shù) BJDURATION03 INTEGER 上上月被叫通話時(shí)長(zhǎng) BJCALLTIMES03 INTEGER 上上月被叫通話次數(shù) LTDURATION05 INTEGER 與聯(lián)通通話時(shí) 長(zhǎng) LTCALLTIMES05 INTEGER 與聯(lián)通通話次數(shù) LTDURATION04 INTEGER 上月與聯(lián)通通話時(shí)長(zhǎng) LTCALLTIMES04 INTEGER 上月與聯(lián)通通話次數(shù) LTDURATION03 INTEGER 上上月與聯(lián)通通話時(shí)長(zhǎng) LTCALLTIMES03 INTEGER 上上月與聯(lián)通通話次數(shù) DXDURATION05 INTEGER 與電信通話時(shí)長(zhǎng) DXCALLTIMES05 INTEGER 與電信話次數(shù) DXDURATION04 INTEGER 上月與電信通話時(shí)長(zhǎng) DXCALLTIMES04 INTEGER 上月與電信通話次數(shù) DXDURATION03 INTEGER 上上月與電信通話時(shí)長(zhǎng) DXCALLTIMES03 INTEGER 上上月與電信通話次數(shù) DDUSRS05 INTEGER 通話對(duì)端用戶數(shù) DDUSRS04 INTEGER 上月通話對(duì)端用戶數(shù) DDUSRS03 INTEGER 上上月通話對(duì)端用戶數(shù) YDDDUSRS05 INTEGER 移動(dòng)通話對(duì)端用戶數(shù) 本文件屬保密資料 4 YDDDUSRS04 INTEGER 上月移動(dòng)通話對(duì)端用戶數(shù) YDDDUSRS03 INTEGER 上上月移動(dòng)通話對(duì)端用戶數(shù) LTDDUSRS05 INTEGER 聯(lián)通通話對(duì)端用戶數(shù) LTDDUSRS04 INTEGER 上月聯(lián)通通話對(duì)端用戶數(shù) LTDDUSRS03 INTEGER 上上月聯(lián)通通話對(duì)端用戶數(shù) DXDDUSRS05 INTEGER 電信通話對(duì)端用戶數(shù) DXDDUSRS04 INTEGER 上月電信通話對(duì)端用戶數(shù) DXDDUSRS03 INTEGER 上上月電信通話對(duì)端用戶數(shù) BD1008605 INTEGER 撥打 10086 次數(shù) BD1008604 INTEGER 上月?lián)艽?10086 次數(shù) BD1008603 INTEGER 上上月?lián)艽?10086 次數(shù) BD1000005 INTEGER 撥打 10000 次數(shù) BD1000004 INTEGER 上月?lián)艽?10000 次數(shù) BD1000003 INTEGER 上上月?lián)艽?10000 次數(shù) BD1001005 INTEGER 撥打 10010 次數(shù) BD1001004 INTEGER 上月?lián)艽?10010 次數(shù) BD1001003 INTEGER 上上月?lián)艽?10010 次數(shù) HZCALLTIMES05 INTEGER 呼轉(zhuǎn)次數(shù) HZCALLTIMES04 INTEGER 上月呼轉(zhuǎn)次數(shù) HZCALLTIMES03 INTEGER 上上月呼轉(zhuǎn)次數(shù) YDHZCALLTIMES05 INTEGER 呼轉(zhuǎn)移動(dòng)次數(shù) YDHZCALLTIMES04 INTEGER 上月呼轉(zhuǎn)移動(dòng)次數(shù) YDHZCALLTIMES03 INTEGER 上上月呼轉(zhuǎn)移動(dòng)次數(shù) LTHZCALLTIMES05 INTEGER 呼轉(zhuǎn)聯(lián)通次數(shù) LTHZCALLTIMES04 INTEGER 上月呼轉(zhuǎn)聯(lián)通次數(shù) LTHZCALLTIMES03 INTEGER 上上月呼轉(zhuǎn)聯(lián)通次數(shù) DXHZCALLTIMES05 INTEGER 呼轉(zhuǎn)電信次數(shù) DXHZCALLTIMES04 INTEGER 上月呼轉(zhuǎn)電信次數(shù) DXHZCALLTIMES03 INTEGER 上上月呼轉(zhuǎn)電信次數(shù) SMSFS05 INTEGER 點(diǎn)對(duì)點(diǎn)短信發(fā)送量 SMSFS04 INTEGER 上月點(diǎn)對(duì)點(diǎn)短信發(fā)送量 SMSFS03 INTEGER 上上月點(diǎn)對(duì)點(diǎn)短信發(fā)送量 LASTROMA INTEGER 最后通話為漫游標(biāo)記 GPRSFLOW05 DECIMAL(16,4) GPRS 流量 GPRSFLOW04 DECIMAL(16,4) 上月 GPRS 流量 GPRSFLOW03 DECIMAL(16,4) 上上月 GPRS 流量 ID_NO BIGINT 用戶編碼 PREPAY_FEE DECIMAL(16,4) 截止取數(shù)日話費(fèi)余額 本文件屬保密資料 5 ARPU DECIMAL(16,4) ARPU MONTH_FEE DECIMAL(16,4) 月租費(fèi) PAY_COUNT BIGINT 充值次數(shù) PAY_MONTY DECIMAL(16,4) 充值金額 LPREPAY_FEE DECIMAL(16,4) 上月月底話費(fèi)余額 LARPU DECIMAL(16,4) 上月 ARPU LMONTH_FEE DECIMAL(16,4) 上月月租費(fèi) LPAY_COUNT BIGINT 上月充值次數(shù) LPAY_MONTY DECIMAL(16,4) 上月充值金額 LLPREPAY_FEE DECIMAL(16,4) 上上月月底話費(fèi)余額 LLARPU DECIMAL(16,4) 上上月 ARPU LLMONTH_FEE DECIMAL(16,4) 上上月月租費(fèi) LLPAY_COUNT BIGINT 上 上月充值次數(shù) LLPAY_MONTY DECIMAL(16,4) 上上月充值金額 CUNFEI_FLAG VARCHAR(2) 是否參與存送捆綁標(biāo)記 INNET_TIME VARCHAR(20) 存送捆綁到期時(shí)間 FAMILY_FLAG VARCHAR(2) 合家歡客戶標(biāo)記 CHANGTU_FLAG VARCHAR(2) 長(zhǎng)途風(fēng)暴客戶標(biāo)記 YANG_FLAG VARCHAR(2) 疑似渠道養(yǎng)卡標(biāo)記 SHOUJIBAO_FLAG VARCHAR(2) 手機(jī)報(bào)客戶標(biāo)記 FEIXIN_FLAG VARCHAR(2) 飛信客戶標(biāo)記 TOUSHU_FLAG VARCHAR(2) 投訴客戶標(biāo)記 TOUSHU_NUMS BIGINT 投訴次數(shù) SHUXIN_FEE DECIMAL(16,4) 數(shù)信業(yè)務(wù)費(fèi)用 CHENGSHI_FLAG VARCHAR(10) 城市農(nóng)村客戶標(biāo)記 ZHONGDUAN_FLAG DECIMAL(16,4) 是否參與終端捆綁標(biāo)記 ZD_BEGIN_TIME VARCHAR(10) 參與終端捆綁時(shí)間 ZD_END_TIME VARCHAR(10) 終端捆綁到期時(shí)間 TERM_BIND_NAME VARCHAR(200) 參與終端捆綁活動(dòng)名稱(chēng) SAVE_BIND_NAME VARCHAR(200) 存送捆綁活動(dòng)名稱(chēng) ACCOUNT_TYPE VARCHAR(32) 賬戶類(lèi)型 INNET_FEE DECIMAL(16,4) 開(kāi)戶繳費(fèi)金額 生成衍生變量表: 字段名 數(shù)據(jù)類(lèi)型 解釋 ID_NO BIGINT 用戶編碼 PHONE_NO_1 VARCHAR(20) 手機(jī)號(hào)碼 CHANNEL_NAME VARCHAR(300) 入網(wǎng)渠道 BRAND_NAME VARCHAR(100) 品牌 本文件屬保密資料 6 MODE_NAME CHARACTER(100) 資費(fèi) OPEN_TIME VARCHAR(20) 開(kāi)戶時(shí)間 NET_AGE INTEGER 網(wǎng)齡 RUN_NAME VARCHAR(32) 截止取數(shù)日期用戶狀態(tài) FAMILY_FLAG VARCHAR(2) 合家歡客戶標(biāo)記 CHANGTU_FLAG VARCHAR(2) 長(zhǎng)途風(fēng)暴客戶標(biāo)記 LASTCALL_ROAM INTEGER 最后一次通話為漫游標(biāo)記 CHENGSHI_FLAG VARCHAR(10) 城市農(nóng)村客戶 標(biāo)記 TOUSHU_NUMS BIGINT 投訴次數(shù) SHOUJIBAO_FLAG VARCHAR(2) 手機(jī)報(bào)用戶標(biāo)記 FETION_FLAG VARCHAR(2) 飛信用戶標(biāo)記 VIPFLAG INTEGER VIP 客戶標(biāo)記 HIGHFLAG INTEGER 中高端客戶標(biāo)記 GRPFLAG INTEGER 集團(tuán)客戶標(biāo)記 GRP_NAME VARCHAR(300) 歸屬集團(tuán)名稱(chēng) CUNFEI INTEGER 是否參與存送捆綁活動(dòng)標(biāo)記 ZHONGDUAN INTEGER 是否參與終端捆綁活 動(dòng)標(biāo)記 KUNBANG_LEFTTIME INTEGER 捆綁剩余周期 SHUXIN_RATIO_08 DECIMAL(31,14) 數(shù)信業(yè)務(wù)費(fèi)用占比 =數(shù)信業(yè)務(wù)費(fèi)用 /ARPU MONTHFEE_RATIO_08 DECIMAL(31,14) 月租費(fèi)用占比 =月租 /ARPU LEFT_FEE DECIMAL(19,4) 話費(fèi)余額 PAY_COUNT BIGINT 充值次數(shù) PAY_MONEY DECIMAL(16,4) 充值金額 ARPU_AVG DECIMAL(31,18) 近三月 ARPU 平均值 MOU_AVG INTEGER 近三月 MOU 平均值 BD_DURA_AVG INTEGER 近三月本地通話時(shí)長(zhǎng)平均值 CT_DURA_AVG INTEGER 近三月長(zhǎng)途通話時(shí)長(zhǎng)平均值 MY_DURA_AVG INTEGER 近三月漫游通話時(shí)長(zhǎng)平均值 LT_DURA_AVG INTEGER 近三月與聯(lián)通通話時(shí)長(zhǎng)平均值 DX_DURA_AVG INTEGER 近三月與電信通話時(shí)長(zhǎng)平均值 DD_NMB_AVG INTEGER 近三月通話對(duì)端數(shù)量平均值 LT_NMB_AVG INTEGER 近三月 聯(lián)通通話對(duì)端數(shù)量平均值 DX_NMB_AVG INTEGER 近三月電信通話對(duì)端數(shù)量平均值 BD1008605 INTEGER 撥打 10086 次數(shù) BD1000005 INTEGER 撥打 10000 次數(shù) BD1001005 INTEGER 撥打 10010 次數(shù) HZCALLTIMES05 INTEGER 呼轉(zhuǎn)次數(shù) YDHZCALLTIMES05 INTEGER 呼轉(zhuǎn)移動(dòng)次數(shù) 本文件屬保密資料 7 LTHZCALLTIMES05 INTEGER 呼轉(zhuǎn)聯(lián)通次數(shù) DXHZCALLTIMES05 INTEGER 呼轉(zhuǎn)電信次 數(shù) SMS_FASONG_AVG INTEGER 點(diǎn)對(duì)點(diǎn)短信發(fā)送量 GPRS_MOUNT_AVG DECIMAL(31,18) GPRS 流量 BD_DURA_RATIO DECIMAL(31,19) 近三月本地通話時(shí)長(zhǎng)占比 CT_DURA_RATIO DECIMAL(31,19) 近三月長(zhǎng)途通話時(shí)長(zhǎng)占比 MY_DURA_RATIO DECIMAL(31,19) 近三月漫游通話時(shí)長(zhǎng)占比 DD_YD DECIMAL(31,19) 近三月移動(dòng)通話對(duì)端占比 DD_LT DECIMAL(31,19) 近 三月聯(lián)通通話對(duì)端占比 DD_DX DECIMAL(31,19) 近三月電信通話對(duì)端占比 ARPU_STD DOUBLE 近三月 ARPU 波動(dòng)值 MOU_STD DOUBLE 近三月 MOU 波動(dòng)值 BD_DURA_STD DOUBLE 近三月本地通話時(shí)長(zhǎng)波動(dòng)值 CT_DURA_STD DOUBLE 近三月長(zhǎng)途通話時(shí)長(zhǎng)波動(dòng)值 MY_DURA_STD DOUBLE 近三月漫游通話時(shí)長(zhǎng)波動(dòng)值 LT_DURA_STD DOUBLE 近三月聯(lián)通通話時(shí)長(zhǎng)波動(dòng)值 DX_DURA_STD DOUBLE 近三月電信 通話時(shí)長(zhǎng)波動(dòng)值 HUZHUAN_STD DOUBLE 近三月呼轉(zhuǎn)通話次數(shù)波動(dòng)值 YDHUZHUAN_STD DOUBLE 近三月呼轉(zhuǎn)移動(dòng)通話次數(shù)波動(dòng)值 LTHUZHUAN_STD DOUBLE 近三月呼轉(zhuǎn)聯(lián)通通話次數(shù)波動(dòng)值 DXHUZHUAN_STD DOUBLE 近三月呼轉(zhuǎn)電信通話次數(shù)波動(dòng)值 SMS_FASONG_STD DOUBLE 近三月點(diǎn)對(duì)點(diǎn)短信發(fā)送量波動(dòng)值 GPRS_MOUNT_STD DOUBLE 近三月 GPRS 流量波動(dòng)值 3.2 數(shù)據(jù)探索 利用 SPSS 的 Clementine 軟件 對(duì)建模字段進(jìn)行數(shù)據(jù)審核和探索。 本文件屬保密資料 8 4. 模型 構(gòu)建 4.1 建模工具 經(jīng)過(guò)數(shù)據(jù)預(yù)處理、探索型數(shù)據(jù)分析, 最終確定了 準(zhǔn)沉默 客戶預(yù)測(cè)分析模型的變量, 采用 SPSS 公司的 Clementine 軟件 的 決策樹(shù) 結(jié)點(diǎn)作為數(shù)據(jù)挖掘工具及數(shù)據(jù)挖掘技術(shù)來(lái)建立 準(zhǔn) 沉默客戶 識(shí)別 模型。 4.2 建模流程 為使模型盡量精確,針對(duì)每一個(gè)地市均單獨(dú)進(jìn)行識(shí)別模型的建設(shè)工作。以宜賓分公司為例,建模流程如下: TOUSHU_NUMS( 投訴次數(shù) ) 、VIPFLAG( VIP 標(biāo)識(shí))等 字段經(jīng)審核無(wú)法用于建立模型,需剔除 本文件屬保密資料 9 選 擇 建 設(shè) 模 型 需 要的 目 標(biāo) 客 戶數(shù) 量 : 約 1 2 1 萬(wàn)已 知 沉 默 用 戶數(shù) 量 : 約 1 1 萬(wàn)已 知 非 沉 默 用 戶數(shù) 量 : 約 1 1 0 萬(wàn)數(shù) 據(jù) 準(zhǔn) 備擬 定 數(shù) 據(jù) 需 求 字 段并 進(jìn) 行 統(tǒng) 計(jì)數(shù) 據(jù) 審 核 清 洗通 過(guò) 數(shù) 據(jù) 審 核 選 擇 輸 入 字 段字 段 數(shù) 量 : 6 0數(shù) 據(jù) 分 區(qū)將 數(shù) 據(jù) 分 為 用 于 生 成 模 型 的 訓(xùn) 練 區(qū)和 用 于 評(píng) 估 模 型 效 果 的 測(cè) 試 區(qū)訓(xùn) 練 區(qū)隨 機(jī) 抽 取8 0 %測(cè) 試 區(qū)隨 機(jī) 抽 取2 0 %模 型 構(gòu) 建通 過(guò) 軟 件 自 帶 的 二 元 分 類(lèi) 器 對(duì) 不 同 算 法 進(jìn) 行 初 步評(píng) 估 并 生 成 模 型數(shù) 據(jù) 平 衡使 沉 默 用 戶 與 非 沉 默 用 戶 在 數(shù) 量 上成 1 : 4 左 右 的 比 例模 型 生 成利 用 測(cè) 試 區(qū)數(shù) 據(jù) 對(duì) 模 型進(jìn) 行 評(píng) 估形 成 查 全 查 準(zhǔn) 評(píng) 估結(jié) 果數(shù) 據(jù) 輸 入將 準(zhǔn) 備 的 數(shù) 據(jù) 輸 入 建 模 軟 件字 段 數(shù) 量 : 6 6用 戶 編 碼 、 號(hào) 碼 、 品 牌 、 入 網(wǎng) 渠 道 、 主 資 費(fèi) 、入 網(wǎng) 時(shí) 間 、 在 網(wǎng) 時(shí) 長(zhǎng) 、 家 庭 用 戶 標(biāo) 識(shí) 、 長(zhǎng) 途 產(chǎn)品 包 標(biāo) 識(shí) 、 最 后 一 次 通 話 漫 游 標(biāo) 識(shí) 、 投 訴 次數(shù) 、 月 均 A R P U 及 變 動(dòng) 值 、 月 均 本 長(zhǎng) 漫 費(fèi) 用 及 變動(dòng) 值 、 月 均 數(shù) 據(jù) 業(yè) 務(wù) 費(fèi) 占 比 、 飛 信 標(biāo) 識(shí) 、 交 往圈 人 數(shù) 、 月 均 M O U 、 手 機(jī) 報(bào) 標(biāo) 識(shí) 等 品 牌 、 在 網(wǎng) 時(shí) 長(zhǎng) 、 月 均 A R P U 及 變 動(dòng) 值 、 月 均 本長(zhǎng) 漫 費(fèi) 用 及 變 動(dòng) 值 和 占 比 、 月 均 數(shù) 據(jù) 業(yè) 務(wù) 費(fèi) 及占 比 、 飛 信 標(biāo) 識(shí) 、 手 機(jī) 報(bào) 標(biāo) 識(shí) 、 捆 綁 剩 余 時(shí)間 、 呼 轉(zhuǎn) 次 數(shù) 、 呼 轉(zhuǎn) 競(jìng) 爭(zhēng) 對(duì) 手 次 數(shù) 、 月 均 M O U及 變 動(dòng) 值 等 賬 戶 余 額 較 少 、 月 均 A R P U 低 且 波 動(dòng) 性 大 、在 網(wǎng) 時(shí) 間 短 、 交 往 圈 人 數(shù) 少 、 繳 費(fèi) 次 數(shù) 和金 額 均 較 少 等 特 征 的 用 戶 成 為 沉 默 用 戶 的可 能 性 較 大5. 模型 評(píng) 估 5.1 模型評(píng)估 用模型增益 和 測(cè)試集查全查準(zhǔn)率進(jìn)行模型評(píng)估工作。 以最 后一次通話非漫游且在網(wǎng)時(shí)長(zhǎng) 3 個(gè)月以上的客戶識(shí)別模型為例。 1、 增益評(píng)估 增益圖是不同閥值下命中率( PV+,正確預(yù)測(cè)到的正例數(shù)占預(yù)測(cè)正例總數(shù)的比例)與預(yù)測(cè)成正例的比例( Depth)的軌跡。隨著閾值的減小,更多的客戶就會(huì)被歸為正例,也就是 Depth 變大,這樣 PV+就相應(yīng)減小。一個(gè)好的模型,在閾值變大時(shí),相應(yīng)的 PV+就要變大,曲線足夠陡峭。 如下圖所示,在閥值設(shè)定為 20%的時(shí)候,曲線足夠陡峭,模型效果較好 ,使用模 本文件屬保密資料 10 型之后效果提升了約 4.2 倍。 2、 查全查準(zhǔn)評(píng)估 查全率 =模型準(zhǔn)確識(shí)別出的 準(zhǔn) 沉默客戶數(shù) /實(shí)際總的沉 默用戶數(shù) 查準(zhǔn)率 =模型準(zhǔn)確識(shí)別出的 準(zhǔn) 沉默用戶數(shù) /模型識(shí)別出的總用戶數(shù) 5.2 結(jié)果解釋 準(zhǔn) 沉默用戶識(shí)別 模型的規(guī)則 非常復(fù)雜,適用于 準(zhǔn) 沉默用戶的規(guī)則就達(dá) 658 個(gè),無(wú)法在文檔中進(jìn)行詳細(xì)展示,如圖所示(以最后一次通話非漫游且在網(wǎng)時(shí)長(zhǎng)在 3個(gè)月以上的沉默用戶識(shí)別模型為例): 因此,僅將決策樹(shù)的前四層節(jié)點(diǎn)展示如下: 本文件屬保密資料 11 模型規(guī)則概率如下表所示: 本文件屬保密資料 12 篩選規(guī)則 概率余額/ A R P U 0 .1 1 1 A ND 月均本地通話時(shí)長(zhǎng) 0 .1 1 1 A ND 月均本地通話時(shí)長(zhǎng) 0 .1 0 08 7 . 5 %余額/ A R P U 4 4 分鐘 A ND 網(wǎng)齡 = 2 個(gè)月A ND 捆綁剩余時(shí)間 = 1 個(gè)月5 5 . 7 %其規(guī)則 大致可總結(jié)為: 1、賬戶余額很低、且與月均 ARPU 的比例在 0.01 以下的客戶容易產(chǎn)生沉默,有約70%以上的客戶具有此特征 2、 準(zhǔn) 沉默客戶一般為網(wǎng)齡較短的客戶,有約 60%的沉默客戶網(wǎng)齡小于 5 個(gè)月 3、 準(zhǔn) 沉默客戶的 MOU 波動(dòng)性及月均本地通話時(shí)長(zhǎng)較短的特征也很明顯,一般 MOU波動(dòng)較大且呈減少趨勢(shì)、本地通話時(shí)長(zhǎng)小于 20 分鐘的客戶有 90%左右的可能性會(huì)沉默 4、捆綁剩余時(shí)間低于 12 個(gè)月的客戶有 60%左右的可能性會(huì)沉默,低于 1個(gè)月的客戶有超過(guò) 80%的可能性會(huì)沉默 5、月繳費(fèi)次數(shù)在 2次以上、平均繳費(fèi)金額低于 2元或平均繳費(fèi)金額與 ARPU 的比值在 0.21 以下的客戶有約 60%的可能性會(huì)沉默 本文件屬保密資料 13 同時(shí), 在 準(zhǔn) 沉默客戶識(shí)別的基礎(chǔ)上進(jìn)行聚類(lèi): 分析 并總結(jié) 客戶沉默原因及規(guī)則: 準(zhǔn) 沉默客戶 模型 主要 輸出 三 個(gè)字段: 沉默 標(biāo)識(shí)( $C-SILENCE_FLAG)和 沉默概率( $CC-SILENCE_FLAG) 、沉默原因( reason) 。 沉默 標(biāo)識(shí)可以用來(lái)識(shí)別用戶是否 疑似沉默客戶 ( 0:否 1:是); 沉默概率 可以用來(lái)作為用戶是否 疑似沉默客戶 的概率(介于 0 到 1之間),如一個(gè) 客戶 的目標(biāo)標(biāo)識(shí)為 1,目標(biāo)可能性為 0.9 的要比 0.7 的更可能成為 沉默客戶 。 如下圖所示: 本文件屬保密資料 14 6. 模型部署 準(zhǔn) 沉默客戶識(shí)別 模型的主要成果為提供 各地市分公司當(dāng)月疑似沉默客戶 清單, 營(yíng)銷(xiāo)策劃 人員可以依據(jù)這份清單進(jìn)行針對(duì)性的 疑似沉默客戶挽留及激活 工作。 附錄 模型分析 報(bào)告 四川經(jīng)分應(yīng)用模型-準(zhǔn)沉默客戶識(shí)別模型分析報(bào)告.pptx感謝您的使用 “小萍

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論