家庭關(guān)聯(lián)關(guān)系識別模型_第1頁
家庭關(guān)聯(lián)關(guān)系識別模型_第2頁
家庭關(guān)聯(lián)關(guān)系識別模型_第3頁
家庭關(guān)聯(lián)關(guān)系識別模型_第4頁
家庭關(guān)聯(lián)關(guān)系識別模型_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

家庭關(guān)聯(lián)(guānlián)關(guān)系識別模型精品資料

-2現(xiàn)狀(xiànzhuàng)背景模型目標建模步驟模型解讀應(yīng)用價值目錄(mùlù)精品資料

-3

行業(yè)競爭日趨激烈中國的通信行業(yè)走過了“引入競爭”和“市場嘗試”兩個過渡階段,已經(jīng)開始逐步進入“充分競爭”的階段,行業(yè)競爭日趨激烈。

固定電話用戶數(shù)移動電話用戶數(shù)3G用戶數(shù)固定寬帶用戶數(shù)其中:集團客戶寬帶用戶數(shù)集團IDC用戶數(shù)注:上述數(shù)據(jù)來源于賽立信通信競爭情報月刊2010年4月

截止2009年底,三大運營商用戶分布情況1.89億約2500萬1.03億5609萬5.22億1.45億675萬551萬274萬5346萬約600萬3855萬約1700萬家(ADSL/LAN/各種光纖、專線)約2.2萬家(專線用戶)約900萬家(ADSL/LAN/各種光纖、專線)約3萬家約3200家約2萬家如何利用已有的固網(wǎng)和寬帶(kuāndài)客戶資源優(yōu)勢實現(xiàn)移動客戶的增長?行業(yè)(hángyè)背景精品資料

-4業(yè)務(wù)(yèwù)背景無法提供有效的策反政策營銷手段模糊化營銷效率低下已有客戶資源的閑置傳統(tǒng)本網(wǎng)融合/異網(wǎng)策反方法不足移動、聯(lián)通、電信手機客戶群能提供適配用戶的資費政策外呼用戶信息(xìnxī)明確,指導性強名單準確率高,效率大大提高充分利用了固網(wǎng)、寬帶客戶資源基于家庭關(guān)聯(lián)關(guān)系的精確營銷優(yōu)點電信個人用戶異網(wǎng)集團網(wǎng)用戶異網(wǎng)個人用戶電信家庭固話電信固話客戶群家庭關(guān)系精品資料

-5現(xiàn)狀背景(bèijǐng)模型目標建模步驟模型解讀應(yīng)用價值目錄(mùlù)精品資料-6家庭關(guān)聯(lián)關(guān)系識別模型的主要目標:通過移動電話(yídònɡdiànhuà)與固定電話之間的通話頻率、通話時長、通話時段、通話周期和交際圈相似度等變量,進行分類預(yù)測建模,從而準確地識別出手機號碼與固定電話之間的家庭關(guān)聯(lián)關(guān)系;根據(jù)模型預(yù)測結(jié)果,對于本網(wǎng)手機進行融合套餐營銷,對于異網(wǎng)手機進行策反活動。通過營銷活動,實現(xiàn)兩個提升:提升市場份額、提升品牌力度建模目標(mùbiāo)符合家庭特征電信單固話C網(wǎng)手機符合家庭特征電信單固話G網(wǎng)手機融合套餐營銷異網(wǎng)客戶策反精品資料

-7現(xiàn)狀背景模型目標建模步驟(bùzhòu)模型解讀應(yīng)用價值目錄(mùlù)精品資料

-8●假設(shè)條件:家庭用戶與非家庭用戶,在通話行為上存在顯著差異(chāyì),并且一個有固話的家庭至少存在一個家庭手機用戶.●基本思想:根據(jù)固定電話的個性化特征,得到與之關(guān)聯(lián)手機號碼的家庭關(guān)系評分,最高分即為家庭關(guān)系(最高分須不小于0.5)?!窕玖鞒蹋簶颖具x?。赫页霰揪W(wǎng)屬于家庭關(guān)系的號碼對作為正樣本,并找出不屬于家庭關(guān)系的號碼對作為負樣本;寬表設(shè)計:分析正樣本中號碼對的通信行為特征,設(shè)計寬表;模型建立:使用挖掘工具clementine建立挖掘模型;模型驗證:根據(jù)技術(shù)指標以及抽樣驗證,對模型進行調(diào)優(yōu)。分析(fēnxī)思路精品資料

-9樣本(yàngběn)選取正樣本需剔除以下幾類情況:資料不符:剔除客戶(kèhù)編碼、賬戶、身份證號碼三者中有不相同項的號碼對;互通異常:剔除兩個月中有一月無互通行為的號碼對;證件異常:剔除機主身份證號碼不合理、年齡大于70歲或小于18歲的號碼對;狀態(tài)異常:剔除非在用狀態(tài)、新增、公免的號碼對;匹配多元:剔除固話與手機為一對多關(guān)系的號碼對;最終選取符合上述規(guī)則的正樣本1653號碼對,負樣本9152號碼對,構(gòu)成模型的樣本集。樣本選取寬表設(shè)計模型建立模型驗證正樣本負樣本已經(jīng)辦理e6或e9套餐的【固話,手機】號碼對有通話但客戶賬戶證件均不同且非e家的【固話,手機】號碼對精品資料

-10寬表設(shè)計(shèjì)–基礎(chǔ)字段樣本(yàngběn)選取寬表設(shè)計模型建立模型驗證字段名稱描述字段名稱描述CALLING_TIMES平均主叫次數(shù)WEEK_AM_CALLINGTIMES平均周中17-19:00主叫次數(shù)CALLED_TIMES平均被叫次數(shù)WEEK_AM_CALLEDTIMES平均周中17-19:00被叫次數(shù)CALL_TIMES總呼叫次數(shù)WEEK_AM_CALLTIMES平均周中17-19:00總呼叫次數(shù)CALLING_DURATION平均主叫時長WEEK_PM_CALLINGTIMES平均周中11-13:00主叫次數(shù)CALLED_DURATION平均被叫時長WEEK_PM_CALLEDTIMES平均周中11-13:00被叫次數(shù)CALL_DURATION總呼叫時長WEEK_PM_CALLTIMES平均周中11-13:00總呼叫次數(shù)SHORT_TIMES90秒以內(nèi)通話次數(shù)WEEKED_CALLINGTIMES平均周末主叫次數(shù)LONG_TIMES90秒以上通話次數(shù)WEEKED_CALLEDTIMES平均周末被叫次數(shù)MIN_DURATION平均最短一次通話時長WEEKED_CALLTIMES周末呼叫次數(shù)MAX_DURATION平均最長一次通話時長AVG_DURATION平均通話時長FLAG2家庭關(guān)系標志設(shè)計字段原則:在該字段中,家庭用戶和非家庭用戶存在較顯著的統(tǒng)計差異。精品資料

-11寬表設(shè)計(shèjì)–標準化字段樣本(yàngběn)選取寬表設(shè)計模型建立模型驗證字段名稱描述字段名稱描述CALLING_TIMES_R平均主叫次數(shù)比WEEK_AM_CALLINGTIMES_R平均周中17-19主叫次數(shù)比CALLED_TIMES_R平均被叫次數(shù)比WEEK_AM_CALLEDTIMES_R平均周中17-19被叫次數(shù)比CALL_TIMES_R總呼叫次數(shù)比WEEK_AM_CALLTIMES_R平均周中17-19總呼叫次數(shù)比CALLING_DURATION_R平均主叫時長比WEEK_PM_CALLINGTIMES_R平均周中11-13主叫次數(shù)比CALLED_DURATION_R平均被叫時長比WEEK_PM_CALLEDTIMES_R平均周中11-13被叫次數(shù)比CALL_DURATION_R總呼叫時長比WEEK_PM_CALLTIMES_R平均周中11-13總呼叫次數(shù)比SHORT_TIMES_R90秒以內(nèi)通話次數(shù)比WEEKED_CALLINGTIMES_R平均周末主叫次數(shù)比LONG_TIMES_R90秒以上通話次數(shù)比WEEKED_CALLEDTIMES_R平均周末被叫次數(shù)比MIN_DURATION_R平均最短一次通話時長比WEEKED_CALLTIMES_R周末呼叫次數(shù)比MAX_DURATION_R平均最長一次通話時長比設(shè)計字段原則:不同的家庭用戶在通信行為上存在較大差異,單純用絕對值作為預(yù)測變量導致模型存在偏差,需要將其標準化,得出相對值。說明:比值是根據(jù)該固定電話用戶與某一手機號碼的變量值和該固定電話與全部手機號碼的最大值的比例。精品資料

-12寬表設(shè)計(shèjì)–衍生字段樣本(yàngběn)選取寬表設(shè)計模型建立模型驗證字段名稱描述字段名稱描述CALLING_TIMESRANK當月主叫次數(shù)排名WEEK_AM_CALLINGTIMESRANK當月周中17-19主叫次數(shù)排名CALLED_TIMESRANK當月被叫次數(shù)排名WEEK_AM_CALLEDTIMESRANK當月周中17-19被叫次數(shù)排名CALL_TIMESRANK總呼叫次數(shù)排名WEEK_AM_CALLTIMESRANK當月周中17-19總呼叫次數(shù)排名CALLING_DURATIONRANK當月主叫時長排名WEEK_PM_CALLINGTIMESRANK當月周中11-13主叫次數(shù)排名CALLED_DURATIONRANK當月被叫時長排名WEEK_PM_CALLEDTIMESRANK當月周中11-13被叫次數(shù)排名CALL_DURATIONRANK總呼叫時長排名WEEK_PM_CALLTIMESRANK當月周中11-13總呼叫次數(shù)排名SHORT_TIMESRANK90秒以內(nèi)通話次數(shù)排名WEEKED_CALLINGTIMESRANK當月周末主叫次數(shù)排名LONG_TIMESRANK90秒以上通話次數(shù)排名WEEKED_CALLEDTIMESRANK當月周末被叫次數(shù)排名MIN_DURATIONRANK當月最短一次通話時長排名WEEKED_CALLTIMESRANK周末呼叫次數(shù)排名MAX_DURATIONRANK當月最長一次通話時長排名JW_GUHUA_RATION重合度在固話交往圈占比JW_SHUOJI_RATION重合度在手機交往圈占比設(shè)計字段原則:利用排名的連貫性和區(qū)間性,能消除數(shù)值的影響,并且數(shù)據(jù)字段穩(wěn)定的特性。精品資料-13模型(móxíng)建立1,數(shù)據(jù)探索,處理正負樣本比例,2,比較算法,選取最優(yōu)算法3,最優(yōu)算法建模,4,使用模型節(jié)點預(yù)測家庭關(guān)系,并進行模型評估,5,家庭關(guān)系打分,輸出家庭關(guān)系清單模型(móxíng)流展示:樣本選取寬表設(shè)計模型建立模型驗證使用clementine工具的決策樹算法建立模型,通過固話與手機之間的通話行為,提煉家庭成員的通化特征,形成可應(yīng)用的業(yè)務(wù)規(guī)則。精品資料

-14模型(móxíng)驗證樣本(yàngběn)選取寬表設(shè)計模型建立模型驗證預(yù)測非家庭預(yù)測家庭合計實際非家庭86924609152實際家庭34013131653合計9032177310805判斷一個模型是否可接受,主要根據(jù)該模型對已有數(shù)據(jù)集的分類效果。其中幾個重要的檢測指標為:準確率、命中率、覆蓋率、提升度。3401313460實際家庭預(yù)測家庭8692非家庭預(yù)測為非家庭準確率:(8692+1313)/10805=92.60%命中率:1313/1773=74.06%覆蓋率:1313/1653=79.43%提升度:打分前10%成功率提升5.45倍精品資料

-15模型(móxíng)驗證樣本(yàngběn)選取寬表設(shè)計模型建立模型驗證通過小范圍調(diào)查,驗證模型的實際預(yù)測效果。在下述12個預(yù)測為家庭關(guān)系的號碼對中,經(jīng)實際調(diào)查,有9對正確,3對錯誤,準確率為75%。姓名固話手機識別結(jié)果錯誤原因陳琳莉87****06153****7327正確

李俊犀87****87153****7678正確

昌國朋友187****70138****6785正確

昌國朋友287****27189****2572錯誤對應(yīng)手機是固話朋友徐芳82****10135****1767正確

凱祥志84****38189****0099正確

張柳85****57133****0720錯誤未知陳琳莉同事185****50133****5727正確

陳琳莉同事284****46189****8989正確

陳琳莉同事384****23153****7778正確

陳琳莉同事487****98189****0037錯誤對應(yīng)手機是固話堂弟龐敏61****31153****7912正確

精品資料

-16現(xiàn)狀背景模型目標建模步驟模型解讀(jiědú)應(yīng)用價值目錄(mùlù)精品資料

-1790秒以內(nèi)(yǐnèi)通話排名相互呼叫次數(shù)(cìshù)與最大相互呼叫次數(shù)(cìshù)的比值周末主叫次數(shù)排名90秒內(nèi)通話次數(shù)與最大90秒內(nèi)通話次數(shù)的比值當月被叫次數(shù)排名排名第一的號碼對,屬于家庭的概率為78.1%比值超過99%的號碼對,屬于家庭的概率為87.8%排名第一的號碼對,屬于家庭的概率為87.4%比值低于12.5%的,屬于非家庭的概率為95.7%排名非首位的號碼對,屬于非家庭的概率為81.6%不同的變量對于模型分類起著不同的作用,通過各變量的交叉判定,可以準確的預(yù)測出結(jié)果。變量重要性…… ………………精品資料-18判定決策樹及業(yè)務(wù)(yèwù)規(guī)則短時次數(shù)排名第一、主叫時長排名第一、周末(zhōumò)主叫次數(shù)排名第一、總呼叫次數(shù)占比超過99%、周中17-19點固話呼叫手機次數(shù)排名第一同時滿足上述條件的號碼對有1542對,其中符合家庭關(guān)系的占87.8%決策樹業(yè)務(wù)規(guī)則精品資料-19固話號碼手機號碼是否家庭關(guān)系判斷概率787211518955105685是0.9706726199213355511528是0.8921346671613966694966否0.9565517137413866754174是0.7762766149713349193152否0.8643757139013205606569否0.6818431317518905609494是0.8182將模型的分類規(guī)則(guīzé)作用于關(guān)系未知的【固話,手機】號碼對,可預(yù)測出其是否屬于家庭關(guān)系、以及判斷為該結(jié)果的概率。模型預(yù)測(yùcè)輸出結(jié)果精品資料-20現(xiàn)狀背景模型目標(mùbiāo)建模步驟模型解讀應(yīng)用價值目錄(mùlù)精品資料

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論