版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
家庭關(guān)聯(lián)(guānlián)關(guān)系識(shí)別模型精品資料
-2現(xiàn)狀(xiànzhuàng)背景模型目標(biāo)建模步驟模型解讀應(yīng)用價(jià)值目錄(mùlù)精品資料
-3
行業(yè)競(jìng)爭(zhēng)日趨激烈中國(guó)的通信行業(yè)走過(guò)了“引入競(jìng)爭(zhēng)”和“市場(chǎng)嘗試”兩個(gè)過(guò)渡階段,已經(jīng)開始逐步進(jìn)入“充分競(jìng)爭(zhēng)”的階段,行業(yè)競(jìng)爭(zhēng)日趨激烈。
固定電話用戶數(shù)移動(dòng)電話用戶數(shù)3G用戶數(shù)固定寬帶用戶數(shù)其中:集團(tuán)客戶寬帶用戶數(shù)集團(tuán)IDC用戶數(shù)注:上述數(shù)據(jù)來(lái)源于賽立信通信競(jìng)爭(zhēng)情報(bào)月刊2010年4月
截止2009年底,三大運(yùn)營(yíng)商用戶分布情況1.89億約2500萬(wàn)1.03億5609萬(wàn)5.22億1.45億675萬(wàn)551萬(wàn)274萬(wàn)5346萬(wàn)約600萬(wàn)3855萬(wàn)約1700萬(wàn)家(ADSL/LAN/各種光纖、專線)約2.2萬(wàn)家(專線用戶)約900萬(wàn)家(ADSL/LAN/各種光纖、專線)約3萬(wàn)家約3200家約2萬(wàn)家如何利用已有的固網(wǎng)和寬帶(kuāndài)客戶資源優(yōu)勢(shì)實(shí)現(xiàn)移動(dòng)客戶的增長(zhǎng)?行業(yè)(hángyè)背景精品資料
-4業(yè)務(wù)(yèwù)背景無(wú)法提供有效的策反政策營(yíng)銷手段模糊化營(yíng)銷效率低下已有客戶資源的閑置傳統(tǒng)本網(wǎng)融合/異網(wǎng)策反方法不足移動(dòng)、聯(lián)通、電信手機(jī)客戶群能提供適配用戶的資費(fèi)政策外呼用戶信息(xìnxī)明確,指導(dǎo)性強(qiáng)名單準(zhǔn)確率高,效率大大提高充分利用了固網(wǎng)、寬帶客戶資源基于家庭關(guān)聯(lián)關(guān)系的精確營(yíng)銷優(yōu)點(diǎn)電信個(gè)人用戶異網(wǎng)集團(tuán)網(wǎng)用戶異網(wǎng)個(gè)人用戶電信家庭固話電信固話客戶群家庭關(guān)系精品資料
-5現(xiàn)狀背景(bèijǐng)模型目標(biāo)建模步驟模型解讀應(yīng)用價(jià)值目錄(mùlù)精品資料-6家庭關(guān)聯(lián)關(guān)系識(shí)別模型的主要目標(biāo):通過(guò)移動(dòng)電話(yídònɡdiànhuà)與固定電話之間的通話頻率、通話時(shí)長(zhǎng)、通話時(shí)段、通話周期和交際圈相似度等變量,進(jìn)行分類預(yù)測(cè)建模,從而準(zhǔn)確地識(shí)別出手機(jī)號(hào)碼與固定電話之間的家庭關(guān)聯(lián)關(guān)系;根據(jù)模型預(yù)測(cè)結(jié)果,對(duì)于本網(wǎng)手機(jī)進(jìn)行融合套餐營(yíng)銷,對(duì)于異網(wǎng)手機(jī)進(jìn)行策反活動(dòng)。通過(guò)營(yíng)銷活動(dòng),實(shí)現(xiàn)兩個(gè)提升:提升市場(chǎng)份額、提升品牌力度建模目標(biāo)(mùbiāo)符合家庭特征電信單固話C網(wǎng)手機(jī)符合家庭特征電信單固話G網(wǎng)手機(jī)融合套餐營(yíng)銷異網(wǎng)客戶策反精品資料
-7現(xiàn)狀背景模型目標(biāo)建模步驟(bùzhòu)模型解讀應(yīng)用價(jià)值目錄(mùlù)精品資料
-8●假設(shè)條件:家庭用戶與非家庭用戶,在通話行為上存在顯著差異(chāyì),并且一個(gè)有固話的家庭至少存在一個(gè)家庭手機(jī)用戶.●基本思想:根據(jù)固定電話的個(gè)性化特征,得到與之關(guān)聯(lián)手機(jī)號(hào)碼的家庭關(guān)系評(píng)分,最高分即為家庭關(guān)系(最高分須不小于0.5)?!窕玖鞒蹋簶颖具x?。赫页霰揪W(wǎng)屬于家庭關(guān)系的號(hào)碼對(duì)作為正樣本,并找出不屬于家庭關(guān)系的號(hào)碼對(duì)作為負(fù)樣本;寬表設(shè)計(jì):分析正樣本中號(hào)碼對(duì)的通信行為特征,設(shè)計(jì)寬表;模型建立:使用挖掘工具clementine建立挖掘模型;模型驗(yàn)證:根據(jù)技術(shù)指標(biāo)以及抽樣驗(yàn)證,對(duì)模型進(jìn)行調(diào)優(yōu)。分析(fēnxī)思路精品資料
-9樣本(yàngběn)選取正樣本需剔除以下幾類情況:資料不符:剔除客戶(kèhù)編碼、賬戶、身份證號(hào)碼三者中有不相同項(xiàng)的號(hào)碼對(duì);互通異常:剔除兩個(gè)月中有一月無(wú)互通行為的號(hào)碼對(duì);證件異常:剔除機(jī)主身份證號(hào)碼不合理、年齡大于70歲或小于18歲的號(hào)碼對(duì);狀態(tài)異常:剔除非在用狀態(tài)、新增、公免的號(hào)碼對(duì);匹配多元:剔除固話與手機(jī)為一對(duì)多關(guān)系的號(hào)碼對(duì);最終選取符合上述規(guī)則的正樣本1653號(hào)碼對(duì),負(fù)樣本9152號(hào)碼對(duì),構(gòu)成模型的樣本集。樣本選取寬表設(shè)計(jì)模型建立模型驗(yàn)證正樣本負(fù)樣本已經(jīng)辦理e6或e9套餐的【固話,手機(jī)】號(hào)碼對(duì)有通話但客戶賬戶證件均不同且非e家的【固話,手機(jī)】號(hào)碼對(duì)精品資料
-10寬表設(shè)計(jì)(shèjì)–基礎(chǔ)字段樣本(yàngběn)選取寬表設(shè)計(jì)模型建立模型驗(yàn)證字段名稱描述字段名稱描述CALLING_TIMES平均主叫次數(shù)WEEK_AM_CALLINGTIMES平均周中17-19:00主叫次數(shù)CALLED_TIMES平均被叫次數(shù)WEEK_AM_CALLEDTIMES平均周中17-19:00被叫次數(shù)CALL_TIMES總呼叫次數(shù)WEEK_AM_CALLTIMES平均周中17-19:00總呼叫次數(shù)CALLING_DURATION平均主叫時(shí)長(zhǎng)WEEK_PM_CALLINGTIMES平均周中11-13:00主叫次數(shù)CALLED_DURATION平均被叫時(shí)長(zhǎng)WEEK_PM_CALLEDTIMES平均周中11-13:00被叫次數(shù)CALL_DURATION總呼叫時(shí)長(zhǎng)WEEK_PM_CALLTIMES平均周中11-13:00總呼叫次數(shù)SHORT_TIMES90秒以內(nèi)通話次數(shù)WEEKED_CALLINGTIMES平均周末主叫次數(shù)LONG_TIMES90秒以上通話次數(shù)WEEKED_CALLEDTIMES平均周末被叫次數(shù)MIN_DURATION平均最短一次通話時(shí)長(zhǎng)WEEKED_CALLTIMES周末呼叫次數(shù)MAX_DURATION平均最長(zhǎng)一次通話時(shí)長(zhǎng)AVG_DURATION平均通話時(shí)長(zhǎng)FLAG2家庭關(guān)系標(biāo)志設(shè)計(jì)字段原則:在該字段中,家庭用戶和非家庭用戶存在較顯著的統(tǒng)計(jì)差異。精品資料
-11寬表設(shè)計(jì)(shèjì)–標(biāo)準(zhǔn)化字段樣本(yàngběn)選取寬表設(shè)計(jì)模型建立模型驗(yàn)證字段名稱描述字段名稱描述CALLING_TIMES_R平均主叫次數(shù)比WEEK_AM_CALLINGTIMES_R平均周中17-19主叫次數(shù)比CALLED_TIMES_R平均被叫次數(shù)比WEEK_AM_CALLEDTIMES_R平均周中17-19被叫次數(shù)比CALL_TIMES_R總呼叫次數(shù)比WEEK_AM_CALLTIMES_R平均周中17-19總呼叫次數(shù)比CALLING_DURATION_R平均主叫時(shí)長(zhǎng)比WEEK_PM_CALLINGTIMES_R平均周中11-13主叫次數(shù)比CALLED_DURATION_R平均被叫時(shí)長(zhǎng)比WEEK_PM_CALLEDTIMES_R平均周中11-13被叫次數(shù)比CALL_DURATION_R總呼叫時(shí)長(zhǎng)比WEEK_PM_CALLTIMES_R平均周中11-13總呼叫次數(shù)比SHORT_TIMES_R90秒以內(nèi)通話次數(shù)比WEEKED_CALLINGTIMES_R平均周末主叫次數(shù)比LONG_TIMES_R90秒以上通話次數(shù)比WEEKED_CALLEDTIMES_R平均周末被叫次數(shù)比MIN_DURATION_R平均最短一次通話時(shí)長(zhǎng)比WEEKED_CALLTIMES_R周末呼叫次數(shù)比MAX_DURATION_R平均最長(zhǎng)一次通話時(shí)長(zhǎng)比設(shè)計(jì)字段原則:不同的家庭用戶在通信行為上存在較大差異,單純用絕對(duì)值作為預(yù)測(cè)變量導(dǎo)致模型存在偏差,需要將其標(biāo)準(zhǔn)化,得出相對(duì)值。說(shuō)明:比值是根據(jù)該固定電話用戶與某一手機(jī)號(hào)碼的變量值和該固定電話與全部手機(jī)號(hào)碼的最大值的比例。精品資料
-12寬表設(shè)計(jì)(shèjì)–衍生字段樣本(yàngběn)選取寬表設(shè)計(jì)模型建立模型驗(yàn)證字段名稱描述字段名稱描述CALLING_TIMESRANK當(dāng)月主叫次數(shù)排名WEEK_AM_CALLINGTIMESRANK當(dāng)月周中17-19主叫次數(shù)排名CALLED_TIMESRANK當(dāng)月被叫次數(shù)排名WEEK_AM_CALLEDTIMESRANK當(dāng)月周中17-19被叫次數(shù)排名CALL_TIMESRANK總呼叫次數(shù)排名WEEK_AM_CALLTIMESRANK當(dāng)月周中17-19總呼叫次數(shù)排名CALLING_DURATIONRANK當(dāng)月主叫時(shí)長(zhǎng)排名WEEK_PM_CALLINGTIMESRANK當(dāng)月周中11-13主叫次數(shù)排名CALLED_DURATIONRANK當(dāng)月被叫時(shí)長(zhǎng)排名WEEK_PM_CALLEDTIMESRANK當(dāng)月周中11-13被叫次數(shù)排名CALL_DURATIONRANK總呼叫時(shí)長(zhǎng)排名WEEK_PM_CALLTIMESRANK當(dāng)月周中11-13總呼叫次數(shù)排名SHORT_TIMESRANK90秒以內(nèi)通話次數(shù)排名WEEKED_CALLINGTIMESRANK當(dāng)月周末主叫次數(shù)排名LONG_TIMESRANK90秒以上通話次數(shù)排名WEEKED_CALLEDTIMESRANK當(dāng)月周末被叫次數(shù)排名MIN_DURATIONRANK當(dāng)月最短一次通話時(shí)長(zhǎng)排名WEEKED_CALLTIMESRANK周末呼叫次數(shù)排名MAX_DURATIONRANK當(dāng)月最長(zhǎng)一次通話時(shí)長(zhǎng)排名JW_GUHUA_RATION重合度在固話交往圈占比JW_SHUOJI_RATION重合度在手機(jī)交往圈占比設(shè)計(jì)字段原則:利用排名的連貫性和區(qū)間性,能消除數(shù)值的影響,并且數(shù)據(jù)字段穩(wěn)定的特性。精品資料-13模型(móxíng)建立1,數(shù)據(jù)探索,處理正負(fù)樣本比例,2,比較算法,選取最優(yōu)算法3,最優(yōu)算法建模,4,使用模型節(jié)點(diǎn)預(yù)測(cè)家庭關(guān)系,并進(jìn)行模型評(píng)估,5,家庭關(guān)系打分,輸出家庭關(guān)系清單模型(móxíng)流展示:樣本選取寬表設(shè)計(jì)模型建立模型驗(yàn)證使用clementine工具的決策樹算法建立模型,通過(guò)固話與手機(jī)之間的通話行為,提煉家庭成員的通化特征,形成可應(yīng)用的業(yè)務(wù)規(guī)則。精品資料
-14模型(móxíng)驗(yàn)證樣本(yàngběn)選取寬表設(shè)計(jì)模型建立模型驗(yàn)證預(yù)測(cè)非家庭預(yù)測(cè)家庭合計(jì)實(shí)際非家庭86924609152實(shí)際家庭34013131653合計(jì)9032177310805判斷一個(gè)模型是否可接受,主要根據(jù)該模型對(duì)已有數(shù)據(jù)集的分類效果。其中幾個(gè)重要的檢測(cè)指標(biāo)為:準(zhǔn)確率、命中率、覆蓋率、提升度。3401313460實(shí)際家庭預(yù)測(cè)家庭8692非家庭預(yù)測(cè)為非家庭準(zhǔn)確率:(8692+1313)/10805=92.60%命中率:1313/1773=74.06%覆蓋率:1313/1653=79.43%提升度:打分前10%成功率提升5.45倍精品資料
-15模型(móxíng)驗(yàn)證樣本(yàngběn)選取寬表設(shè)計(jì)模型建立模型驗(yàn)證通過(guò)小范圍調(diào)查,驗(yàn)證模型的實(shí)際預(yù)測(cè)效果。在下述12個(gè)預(yù)測(cè)為家庭關(guān)系的號(hào)碼對(duì)中,經(jīng)實(shí)際調(diào)查,有9對(duì)正確,3對(duì)錯(cuò)誤,準(zhǔn)確率為75%。姓名固話手機(jī)識(shí)別結(jié)果錯(cuò)誤原因陳琳莉87****06153****7327正確
李俊犀87****87153****7678正確
昌國(guó)朋友187****70138****6785正確
昌國(guó)朋友287****27189****2572錯(cuò)誤對(duì)應(yīng)手機(jī)是固話朋友徐芳82****10135****1767正確
凱祥志84****38189****0099正確
張柳85****57133****0720錯(cuò)誤未知陳琳莉同事185****50133****5727正確
陳琳莉同事284****46189****8989正確
陳琳莉同事384****23153****7778正確
陳琳莉同事487****98189****0037錯(cuò)誤對(duì)應(yīng)手機(jī)是固話堂弟龐敏61****31153****7912正確
精品資料
-16現(xiàn)狀背景模型目標(biāo)建模步驟模型解讀(jiědú)應(yīng)用價(jià)值目錄(mùlù)精品資料
-1790秒以內(nèi)(yǐnèi)通話排名相互呼叫次數(shù)(cìshù)與最大相互呼叫次數(shù)(cìshù)的比值周末主叫次數(shù)排名90秒內(nèi)通話次數(shù)與最大90秒內(nèi)通話次數(shù)的比值當(dāng)月被叫次數(shù)排名排名第一的號(hào)碼對(duì),屬于家庭的概率為78.1%比值超過(guò)99%的號(hào)碼對(duì),屬于家庭的概率為87.8%排名第一的號(hào)碼對(duì),屬于家庭的概率為87.4%比值低于12.5%的,屬于非家庭的概率為95.7%排名非首位的號(hào)碼對(duì),屬于非家庭的概率為81.6%不同的變量對(duì)于模型分類起著不同的作用,通過(guò)各變量的交叉判定,可以準(zhǔn)確的預(yù)測(cè)出結(jié)果。變量重要性…… ………………精品資料-18判定決策樹及業(yè)務(wù)(yèwù)規(guī)則短時(shí)次數(shù)排名第一、主叫時(shí)長(zhǎng)排名第一、周末(zhōumò)主叫次數(shù)排名第一、總呼叫次數(shù)占比超過(guò)99%、周中17-19點(diǎn)固話呼叫手機(jī)次數(shù)排名第一同時(shí)滿足上述條件的號(hào)碼對(duì)有1542對(duì),其中符合家庭關(guān)系的占87.8%決策樹業(yè)務(wù)規(guī)則精品資料-19固話號(hào)碼手機(jī)號(hào)碼是否家庭關(guān)系判斷概率787211518955105685是0.9706726199213355511528是0.8921346671613966694966否0.9565517137413866754174是0.7762766149713349193152否0.8643757139013205606569否0.6818431317518905609494是0.8182將模型的分類規(guī)則(guīzé)作用于關(guān)系未知的【固話,手機(jī)】號(hào)碼對(duì),可預(yù)測(cè)出其是否屬于家庭關(guān)系、以及判斷為該結(jié)果的概率。模型預(yù)測(cè)(yùcè)輸出結(jié)果精品資料-20現(xiàn)狀背景模型目標(biāo)(mùbiāo)建模步驟模型解讀應(yīng)用價(jià)值目錄(mùlù)精品資料
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度三方勞務(wù)派遣與派遣人員培訓(xùn)合同3篇
- 2024年度供應(yīng)鏈金融質(zhì)押擔(dān)保貸款合同3篇
- 2024年標(biāo)準(zhǔn)設(shè)備維護(hù)保養(yǎng)服務(wù)協(xié)議模板一
- 2024年版特許經(jīng)營(yíng)合同服務(wù)內(nèi)容詳解與標(biāo)的約定
- 2024年嬰幼兒奶粉OEM貼牌生產(chǎn)合作協(xié)議3篇
- 洛陽(yáng)科技職業(yè)學(xué)院《現(xiàn)代生活化學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年度版權(quán)質(zhì)押合同標(biāo)的及質(zhì)押條件和質(zhì)押期限
- 2025鄉(xiāng)鎮(zhèn)醫(yī)療機(jī)構(gòu)聘用合同
- 汽車用品貨車司機(jī)勞動(dòng)合同
- 咨詢行業(yè)客服聘用合同
- 河南省鄭州市2023-2024學(xué)年高二上學(xué)期期期末生物試題【含答案解析】
- 經(jīng)方論治冠心病九法
- 《體育校本課程的建設(shè)與開發(fā)》課題研究實(shí)施方案
- 抵制不健康讀物“讀書與人生”
- (醫(yī)學(xué)課件)帶狀皰疹PPT演示課件
- 特種設(shè)備使用單位落實(shí)使用安全主體責(zé)任監(jiān)督管理規(guī)定(第74號(hào))宣貫
- 人工智能與生命科學(xué)融合
- 小學(xué)生憤怒情緒管理策略
- 醫(yī)務(wù)科管理制度培訓(xùn)的效果評(píng)估與持續(xù)改進(jìn)
- 手術(shù)器械采購(gòu)?fù)稑?biāo)方案(技術(shù)標(biāo))
- MSOP(測(cè)量標(biāo)準(zhǔn)作業(yè)規(guī)范)測(cè)量SOP
評(píng)論
0/150
提交評(píng)論