預測電信行業(yè)客戶流失-基于一種SAS生存分析模式的應用程序_第1頁
預測電信行業(yè)客戶流失-基于一種SAS生存分析模式的應用程序_第2頁
預測電信行業(yè)客戶流失-基于一種SAS生存分析模式的應用程序_第3頁
預測電信行業(yè)客戶流失-基于一種SAS生存分析模式的應用程序_第4頁
預測電信行業(yè)客戶流失-基于一種SAS生存分析模式的應用程序_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

標題:PredictingCustomerChurnintheTelecommunicationsIndustry––AnApplicationofSurvivalAnalysisModelingUsingSAS原文:ABSTRACTConventionalstatisticalmethods(e.g.logisticsregression,decisiontree,andetc.)areverysuccessfulinpredictingcustomerchurn.However,thesemethodscouldhardlypredictwhencustomerswillchurn,orhowlongthecustomerswillstaywith.Thegoalofthisstudyistoapplysurvivalanalysistechniquestopredictcustomerchurnbyusingdatafromatelecommunicationscompany.Thisstudywillhelptelecommunicationscompaniesunderstandcustomerchurnriskandcustomerchurnhazardinatimingmannerbypredictingwhichcustomerwillchurnandwhentheywillchurn.Thefindingsfromthisstudyarehelpfulfortelecommunicationscompaniestooptimizetheircustomerretentionand/ortreatmentresourcesintheirchurnreductionefforts.INTRODUCTIONInthetelecommunicationindustry,customersareabletochooseamongmultipleserviceprovidersandactivelyexercisetheirrightsofswitchingfromoneserviceprovidertoanother.Inthisfiercelycompetitivemarket,customersdemandtailoredproductsandbetterservicesatlessprices,whileserviceprovidersconstantlyfocusonacquisitionsastheirbusinessgoals.Giventhefactthatthetelecommunicationsindustryexperiencesanaverageof30-35percentannualchurnrateanditcosts5-10timesmoretorecruitanewcustomerthantoretainanexistingone,customerretentionhasnowbecomeevenmoreimportantthancustomeracquisition.Formanyincumbentoperators,retaininghighprofitablecustomersisthenumberonebusinesspain.Manytelecommunicationscompaniesdeployretentionstrategiesinsynchronizingprogramsandprocessestokeepcustomerslongerbyprovidingthemwithtailoredproductsandservices.Withretentionstrategiesinplace,manycompaniesstarttoincludechurnreductionasoneoftheirbusinessgoals.Inordertosupporttelecommunicationscompaniesmanagechurnreduction,notonlydoweneedtopredictwhichcustomersareathighriskofchurn,butalsoweneedtoknowhowsoonthesehigh-riskcustomerswillchurn.Thereforethetelecommunicationscompaniescanoptimizetheirmarketinginterventionresourcestopreventasmanycustomersaspossiblefromchurning.Inotherwords,ifthetelecommunicationscompaniesknowwhichcustomersareathighriskofchurnandwhentheywillchurn,theyareabletodesigncustomizedcustomercommunicationandtreatmentprogramsinatimelyefficientmanner.Conventionalstatisticalmethods(e.g.logisticsregression,decisiontree,andetc.)areverysuccessfulinpredictingcustomerchurn.Thesemethodscouldhardlypredictwhencustomerswillchurn,orhowlongthecustomerswillstaywith.However,survivalanalysiswas,attheverybeginning,designedtohandlesurvivaldata,andthereforeisanefficientandpowerfultooltopredictcustomerchurn.OBJECTIVESTheobjectivesofthisstudyareintwofolds.Thefirstobjectiveistoestimatecustomersurvivalfunctionandcustomerhazardfunctiontogainknowledgeofcustomerchurnoverthetimeofcustomertenure.Thesecondobjectiveistodemonstratehowsurvivalanalysistechniquesareusedtoidentifythecustomerswhoareathighriskofchurnandwhentheywillchurn.DEFINITIONSANDEXCLUSIONSThissectionclarifiessomeoftheimportantconceptsandexclusionsusedinthisstudy.Churn–Inthetelecommunicationsindustry,thebroaddefinitionofchurnistheactionthatacustomer’stelecommunicationsserviceiscanceled.Thisincludesbothservice-providerinitiatedchurnandcustomerinitiatedchurn.Anexampleofservice-providerinitiatedchurnisacustomer’saccountbeingclosedbecauseofpaymentdefault.Customerinitiatedchurnismorecomplicatedandthereasonsbehindvary.Inthisstudy,onlycustomerinitiatedchurnisconsideredanditisdefinedbyaseriesofcancelreasoncodes.Examplesofreasoncodesare:unacceptablecallquality,morefavorablecompetitor’spricingplan,misinformationgivenbysales,customerexpectationnotmet,billingproblem,moving,changeinbusiness,andsoon.High-ValueCustomers–Onlycustomerswhohavereceivedatleastthreemonthlybillsareconsideredinthestudy.High-valuecustomersarethesewithmonthlyaveragerevenueof$Xormoreforthelastthreemonths.Ifacustomer’sfirstinvoicecoverslessthan30daysofservice,thenthecustomermonthlyrevenueisproratedtoafullmonth’srevenue.Granularity–Thisstudyexaminescustomerchurnattheaccountlevel.Exclusions–Thisstudydoesnotdistinguishinternationalcustomersfromdomesticcustomers.Howeveritisdesirabletoinvestigateinternationalcustomerchurnseparatelyfromdomesticcustomerchurninthefuture.Also,thisstudydoesnotincludeemployeeaccounts,sincechurnforemployeeaccountsisnotofaproblemoraninterestforthecompany.SURVIVALANALYSISANDCUSTOMERCHURNSurvivalanalysisisaclanofstatisticalmethodsforstudyingtheoccurrenceandtimingofevents.Fromthebeginning,survivalanalysiswasdesignedforlongitudinaldataontheoccurrenceofevents.Keepingtrackofcustomerchurnisagoodexampleofsurvivaldata.Survivaldatahavetwocommonfeaturesthataredifficulttohandlewithconventionalstatisticalmethods:censoringandtime-dependentcovariates.Generally,survivalfunctionandhazardfunctionareusedtodescribethestatusofcustomersurvivalduringthetenureofobservation.Thesurvivalfunctiongivestheprobabilityofsurvivingbeyondacertaintimepointt.However,thehazardfunctiondescribestheriskofevent(inthiscase,customerchurn)inanintervaltimeaftertimet,conditionalonthecustomeralreadysurvivedtotimet.Thereforethehazardfunctionismoreintuitivetouseinsurvivalanalysisbecauseitattemptstoquantifytheinstantaneousriskthatcustomerchurnwilltakeplaceattimetgiventhatthecustomeralreadysurvivedtotimet.Forsurvivalanalysis,thebestobservationplanisprospective.Webeginobservingasetofcustomersatsomewell-definedpointoftime(calledtheoriginoftime)andthenfollowthemforsomesubstantialperiodoftime,recordingthetimesatwhichcustomerchurnsoccur.It’snotnecessarythateverycustomerexperiencechurn(customerswhoareyettoexperiencechurnarecalledcensoredcases,whilethosecustomerswhoalreadychurnedarecalledobservedcases).Typically,notonlydowepredictthetimingofcustomerchurn,wealsowanttoanalyzehowtime-dependentcovariates(e.g.customerscallstoservicecenters,customerschangeplantypes,customerschangebillingoptions,andetc.)impacttheoccurrenceandtimingofcustomerchurn.SAS/STAThastwoproceduresforsurvivalanalysis:PROCLIFEREGandPROCPHREG.TheLIFEREGprocedureproducesparametricregressionmodelswithcensoredsurvivaldatausingmaximumlikelihoodestimation.ThePHREGprocedureisasemi-parametricregressionanalysisusingpartiallikelihoodestimation.PROCPHREGhasgainedpopularityoverPROCLIFEREGinthelastdecadesinceithandlestimedependent.Howeveriftheshapesofsurvivaldistributionandhazardfunctionareknown,PROCLIFEREGproducesmoreefficientestimates(withsmallerstandarderror)thanPROCPHREGdoes.SAMPLINGSTRATEGYOnAugust16,2000,asampleof41,374activehigh-valuecustomerswasrandomlyselectedfromtheentirecustomerbasefromatelecommunicationscompany.Allthesecustomerwerefollowedforthenext15months.ThereforeAugust16,2000istheoriginoftimeandNovember15,2001istheobservationterminationtime.Duringthis15-monthobservationperiod,thetimingofcustomerchurnwasrecorded.Foreachcustomerinthesample,avariableofDURisusedtoindicatethetimethatcustomerchurnoccurred,orforcensoredcases,thelasttimeatwhichcustomerswereobserved,bothmeasuredfromtheoriginoftime(August16,2000).AsecondvariableofSTATUSisusedtodistinguishthecensoredcasesfromobservedcases.ItiscommontohaveSTATUS=1forobservedcasesandSTATUS=0forcensoredcases.Inthisstudy,thesurvivaldataaresinglyrightcensoredsothatallthecensoredcaseshaveavalueof15(months)forthevariableDUR.DATASOURCESTherearefourmajordatasourcesforthisstudy:blocklevelmarketingandfinancialinformation,customerleveldemographicdataprovidedthroughathirdpartyvendor,customerinternaldata,andcustomercontactrecords.Abriefdescriptionofsomeofthedatasourcesfollows.DemographicData–Demographicdadaisfromathirdpartyvendor.Inthisstudy,thefollowingareexamplesofcustomerleveldemographicinformation:-Primaryhouseholdmember’sage-Genderandmaritalstatus-Numberofadults-Primaryhouseholdmember’soccupation-Householdestimatedincomeandwealthranking-Numberofchildrenandchildren’sage-Numberofvehiclesandvehiclevalue-Creditcard-Frequenttraveler-Respondertomailorders-DwellingandlengthofresidenceCustomerInternalData–Customerinternaldataisfromthecompany’sdatawarehouse.Itconsistsoftwoparts.Thefirstpartisaboutcustomerinformationlikemarketchannel,plantype,billagency,customersegmentationcode,ownershipofthecompany’sotherproducts,dispute,latefeecharge,discount,promotion/savepromotion,additionallines,tollfreeservices,rewardsredemption,billingdispute,andsoon.Thesecondpartofcustomerinternaldataiscustomer’stelecommunicationsusagedata.Examplesofcustomerusagevariablesare:-Weeklyaveragecallcounts-Percentagechangeofminutes-Shareofdomestic/internationalrevenueCustomerContactRecords–TheCompany’sCustomerInformationSystem(CIS)storesdetailedrecordsofcustomercontacts.Thisbasicallyincludescustomercallstoservicecentersandthecompany’smailcontactstocustomers.Thecustomercontactrecordsarethenclassifiedintocustomercontactcategories.Amongthecustomercontactcategoriesarecustomergeneralinquiry,customerrequeststochangeservice,customerinquiryaboutcancel,andsoon.MODELINGPROCESSModelprocessincludesthefollowingfourmajorsteps.ExplanatoryDataAnalysis(EDA)–Explanatorydataanalysiswasconductedtopreparethedataforthesurvivalanalysis.Anunivariatefrequencyanalysiswasusedtopinpointvaluedistributions,missingvaluesandoutliers.Variabletransformationwasconductedforsomenecessarynumericalvariablestoreducethelevelofskewness,becausetransformationsarehelpfultoimprovethefitofamodeltothedata.Outliersarefilteredtoexcludeobservations,suchasoutliersorotherextremevaluesthataresuggestednottobeincludedinthedatamininganalysis.Filteringextremevaluesfromthetrainingdatatendstoproducebettermodelsbecausetheparameterestimatesaremorestable.Variableswithmissingvaluesarenotabigissue,exceptforthosedemographicvariables.Thedemographicvariableswithmorethan20%ofmissingvalueswereeliminated.Forobservationswithmissingvalues,onechoiceistouseincompleteobservations,butthatmayleadtoignoreusefulinformationfromthevariablesthathavenonmissingvalues.Itmayalsobiasthesamplesinceobservationsthathavemissingvaluesmayhaveotherthingsincommonaswell.Therefore,inthisstudy,missingvalueswerereplacedbyappropriatemethods.Forintervalvariables,replacementvalueswerecalculatedbasedontherandompercentilesofthevariable’sdistribution,i.e.,valueswereassignedbasedontheprobabilitydistributionofthenonmissingobservations.Missingvaluesforclassvariableswerereplacedwiththemostfrequentvalues(countormode).Variablereduction–Startedwith212variablesintheoriginaldataset,byusingPROCFREQ,aninitialunivariateanalysisofallcategoricalvariablescrossedwithcustomerchurnstatus(STATUS)wascarriedouttodeterminethestatisticallysignificantcategoricalvariablestobeincludedinthenextmodelingstep.Allthecategoricalvariableswithachi-squarevalueortstatisticsof0.05orlesswerekept.Thisstepreducedthenumberofvariablesto115(&VARLIST1)–includingallthenumericalvariablesandthekeptcategoricalvariablesfromthestepone.ThenextstepistousePROCPHREGtofurtherreducethenumberofvariables.Astepwiseselectionmethodwasusedtocreateafinalmodelwithstatisticallysignificanteffectsof29exploratoryvariablesoncustomerchurnovertime.PROCPHREGDATA=SASOUT2.ALL2OUTEST=SASOUT2.BETA;MODELDUR*STATUS(0)=&VARLIST1/SELECTION=STEPWISESLENTRY=0.0025SLSTAY=0.0025DETAILS;ModelEstimation–Withonly29exploratoryvariables,thefinaldatasethasreasonablenumberofvariablestoperformsurvivalanalysis.Beforeapplyingsurvivalanalysisprocedurestothefinaldataset,thecustomersurvivalfunctionandhazardfunctionwereestimatedusingthefollowingcode.Thepurposeofestimatingcustomersurvivalfunctionandcustomerhazardfunctionistogainknowledgeofcustomerchurnhazardcharacteristics.Fromtheshapeofhazardfunction,customerchurninthisstudydemonstratesatypicalhazardfunctionofaLog-Normalmodel.Aspreviouslydiscussed,sincetheshapeofsurvivaldistributionandhazardfunctionwasknown,PROCLIFEREGproducesmoreefficientestimates(withsmallerstandarderror)thanPROCPHREGdoes.PROCLIFETESTDATA=SASOUT2.ALL3OUTSURV=SASOUT2.OUTSURVMETHOD=LIFEPLOT=(S,H)WIDTH=1GRAPHICS;TIMEDUR*STATUS(0);RUN;Thefinalstepistoestimatecustomerchurn.PROCLIFEREGwasusedtocalculatecustomersurvivalprobability.Atthisstepthefinaldatasetwasdivided50/50intotwodatasets:modeldatasetandvalidationdataset.Themodeldatasetisusedtofitthemodelandthevalidationdatasetisusedtoscorethesurvivalprobabilityforeachcustomer.AvariableofUSEisusedtodistinguishthemodeldataset(setUSE=0)andvalidationdataset(setUSE=1).Inthevalidationdataset,setbothDURandSTATUSmissingsothatcasesinthevalidationdatasetwerenottobeusedinmodelestimation.出處:JunXiangLu,Ph.D.PredictingCustomerChurnintheTelecommunicationsIndustry––AnApplicationofSurvivalAnalysisModelingUsingSAS:SASUserGroupInternational(SUGI27)OnlineProceedings,2002,PaperNo.114-27.譯文:預測電信行業(yè)客戶流失——基于一種SAS生存分析模式的應用程序JunXiangLu,Ph.D.SprintCommunicationsCompanyOverlandPark摘要傳統(tǒng)的統(tǒng)計方法(如logistic回歸,決策樹等等)都是能非常成功的預測客戶流失的。但是,這些方法是很難預測什么時候客戶會流失,或者這些客戶還能保留多久。這項研究的目的是運用生存分析技術通過使用來自電信公司的數(shù)據(jù)來預測客戶流失。這項研究將會幫助電信公司了解客戶流失的風險和通過預測那些和何時客戶將要流失的一種時間方式的危害。這一研究的結果有助于電信公司優(yōu)化客戶的保留和(或)處理資源來努力降低他們的客戶流失。引言在電信行業(yè),客戶可以在多個提供服務的供應者中進行選擇,積極運用他們從一個服務供應商轉換到另一個供應商的權利。在這個競爭激烈的市場,客戶需要用低價格獲得的按要求特質非產品和更好的服務,服務的供應商要不斷的專注于收購作為他們的業(yè)務目標。鑒于電信業(yè)的經驗是30-35%的平均客戶流失率,開發(fā)一個新客戶的成本是保留原有客戶成本的5-10倍。對于許多老牌的運營商,企業(yè)的主要頭痛的是留住高利潤的客戶。許多電信公司在協(xié)調方案和過程時使用保持戰(zhàn)略通過提供量身定做的產品和服務來更長時間的保持客戶。隨著各地方使用客戶保持戰(zhàn)略,很多公司開始把降低客戶流失作為他們業(yè)務的目標之一。為了支持電信企業(yè)管理客戶流失的減少,我們不僅需要預測那些客戶存在流失的高風險,還需要知道什么時候這些高風險的客戶要流失。因此,電信公司優(yōu)化了其市場營銷的資源來防止很多可能的客戶流失。換句話說,如果電信公司知道他們的客戶有流失的高風險和什么時候他們將要流失,他們就設計出與客戶即使有效的交流溝通的方案。傳統(tǒng)的統(tǒng)計方法(如logistic回歸,決策樹等等)都是能非常成功的預測客戶流失的。但是,這些方法是很難預測什么時候客戶會流失,或者這些客戶還能保留多久。然而,生存分析的最初設計是用于處理存在的數(shù)據(jù),因此是預測客戶流失的一種有效和強大的工具。目標這項預測研究的目標有兩個。第一個目標是為了建立客戶生存函數(shù)和客戶風險函數(shù)來獲取在客戶的任期時間的客戶流失的知識。第二個目標是演示用來識別那些是高風險流失的客戶和什么時候他們將要流失的生存分析技術。定義和排除本問澄清一些重要的概念和排除在本次研究之外的使用。流失——在電信含有,客戶流失的廣泛定義是指一個客戶的電信服務被取消了。這包括服務提供者引發(fā)的客戶流失,和客戶主動的流失。一個服務提供者引發(fā)的客戶流失的例子有客戶的賬戶因為客戶欠費被關閉??蛻糁鲃恿魇Ь捅容^復雜,流失的原因也是不同的。在這項研究中只研究客戶的主動流失,它被定義為由一系列取消原因代碼,原因代碼的舉例有:不能接受通話質量,競爭對手的更優(yōu)惠的定價計劃,在銷售中誤傳了信息,客戶的期望得不到滿足,計費問題,移動,業(yè)務上的變化等等。高價值客戶——僅僅只那些已經接受至少有三個月賬單的客戶。高價值客戶是那些在過去三個月每個月平均收益在x美元或以上的客戶。如果客戶的第一張發(fā)票少于30天的服務,那么客戶的每個月的收益是按比例分配到一個整月的收入。尺度——本研究討論關于賬戶的客戶流失率排除——這項研究沒有區(qū)分國內客戶和國際客戶,實際上把國際客戶流失從國內客戶流失中分開是值得做的。此外,這項研究不包括員工的賬戶,因為員工賬戶的流失不只是一個問題或是企業(yè)的一種權利。生存分析和客戶流失生存分析是為學習發(fā)生的事情和實時的事件的一種統(tǒng)計研究方法。從一開始,生存分析對發(fā)生的事件的設計縱向數(shù)據(jù)。對客戶流失的跟蹤時一個生存數(shù)據(jù)的很好的例子。生存數(shù)據(jù)有兩個共同的特點,很難用傳統(tǒng)的統(tǒng)計方法處理:審查和時間上的依賴性變量。一般情況下,生存函數(shù)和風險函數(shù)是用來描述在任期間觀察客戶存在的狀態(tài)。生存函數(shù)給出了超過一定時間t的存在概率,而風險寒素描述在間隔時間t的事件風險(在這種情況下,客戶流失)在時間t后的一段間隔時間,在時間t中考慮已經生存下來的客戶。因此,風險功能更直觀的在生存分析中的使用,因為它試圖把風險量化,客戶流失將在這個客戶存貨的時間t內發(fā)生。為了生存分析,最佳觀測計劃是有前瞻性,我開始觀測在一些時間定義的明確點(成為時間的起源)的客戶集,然后按照相當長的一段時間記錄在那時間所發(fā)生的客戶流失。每個客戶體驗流失(客戶沒有體驗流失被稱為審查情況,這些客戶已經流失的稱為觀察情況)是不必要的。通常情況下,我們不僅預測客戶流失的時間,我們也需要分析如何隨著時間變化(如客戶服務呼叫中心,客戶變更計劃類型,客戶改變結算方式等)發(fā)生和時間影響流失的客戶。SAS/STAT對生存分析有兩個程序:LIFEREG程序和PHREG程序。LIFEREG程序產生的參數(shù)回歸模式對生存分析的數(shù)據(jù)使用最大可能的估計。PHREG過程時一個半?yún)?shù)回歸分析使用部分可能的估計。PHREG程序在過去的十年里依賴它處理的時間性,已經獲得了的普及超過LIFEREG程序。但是,如果生存分布和風險函數(shù)的形狀是已知的,LIFEREG程序比PHREG程序更有效的估計(標準誤差較?。?。抽樣策略2000年8月16日,41374活動的高價值客戶的樣本是從整個電信公司的客戶群中隨機挑選的。所有的客戶在未來的15個月的跟隨,2000年8月16日是時間的起點,2001年11月15日時觀察的終止時間。在這15個月的觀察期,客戶流失的時間被記錄。對于樣本中的每一個客戶,一個變量的總指數(shù)是用來表示在客戶流失情況或者審查情況下的時間,最后一次客戶進行觀察,從開始的時間(2000年8月16日)進行測量。第二個變量狀態(tài)是用來區(qū)分審查情況和觀察情況的。在觀察情況下狀態(tài)=1和在審查情況下狀態(tài)=0都是常見的。在這項研究中,生存數(shù)據(jù)是單獨正確的審查情況,所有的審查情況有15個(月)有價值的總指數(shù)為變量值。資料來源這里有四個主要數(shù)據(jù)來源的研究:數(shù)據(jù)營銷和財務信息,客戶水平,通過第三方的供應商提供的人口統(tǒng)計數(shù)據(jù),客戶內部數(shù)據(jù)和客戶聯(lián)系記錄。一個數(shù)據(jù)源的一些簡要說明如下。人口數(shù)據(jù)——人口數(shù)據(jù)時來自第三方的廠商。在這項研究中,以下是客戶級別的人口信息的例子:小學家庭成員的年齡性別和婚姻狀況成人人數(shù)小學家庭成員的職業(yè)家用估計收入和財富排名兒童和兒童人數(shù)的年齡車輛輛數(shù)和車輛價值信用卡頻繁游客有響應的郵件訂單住宅與居住期限客戶內部數(shù)據(jù)——客戶內部數(shù)據(jù)是從該公司的數(shù)據(jù)倉庫得到的。它由兩部分組成。第一部分是關于客戶如市場渠道,計劃的類型,票據(jù)代理,客戶細分的代碼,該公司的其他產品的所有權,糾紛,滯納金費用,折扣,促銷信息/保存推廣,額外的線路,免費服務,獎勵贖回,結算糾紛等等。對客戶內部數(shù)據(jù)的第二個部分是客戶的電信使用數(shù)據(jù)。客戶使用變量的例子有:每周平均通話次數(shù)會議紀要變動百分率應占的國內/國際業(yè)務收入客戶聯(lián)系記錄——該公司的客戶信息系統(tǒng)(CIS)存儲客戶接觸的詳細記錄。這基本上包括客戶呼叫服務中心和公司的郵件往來的客戶??蛻袈?lián)系記錄為客戶聯(lián)系的類別分類。其中客戶聯(lián)系客戶類別有一般查詢,客戶要求變更服務,客戶查詢有關取消等等。模型建立過程模型建立的過程包括以下四個主要步驟。說明資料分析(EDA)——說明數(shù)據(jù)進行分析,以備生存分析的數(shù)據(jù)。一個的頻率分析被使用于精確值分布,遺漏值和離群值。變量變換進行了一些必要的數(shù)字變量,以減少偏度水平,因為有利于提高轉換一種模式適合數(shù)據(jù)。離群的篩選,以排除如離群或其他不建議在數(shù)據(jù)挖掘分析包括極端值的觀察。從訓練數(shù)據(jù)篩選極端值往往會產生更好的模型,因為參數(shù)估計更穩(wěn)定。變量有遺漏值不是一個大問題,除了這些人口統(tǒng)計變數(shù)。超過20%的人口遺漏值的變量被淘汰。對于遺漏值的觀察,一個選擇是使用不完整的意見,但可能導致忽略的變量有沒有遺漏價值的有用信息。它也可能帶有偏見的誤差樣本,因為意見有遺漏值在其他中可能有共同的東西。因此,在這項研究中,遺漏值改為適當?shù)姆椒?。對于區(qū)間變量,重置價值計算依據(jù)變量的分布,即價值被分配的基礎上,在沒有遺漏觀測概率分布的隨機百分點。為類變量遺漏值被替換最頻繁值(計數(shù)或模式)。減少變項——212中的原始數(shù)據(jù)集的變量使用了FREQ程序,初步的交叉與客戶的所有分類變量單因素分析,流失狀態(tài)進行了以決定在未來包括分類變量顯著建模步驟。所有一卡方值的分類變量或t為0.05統(tǒng)計或更小統(tǒng)計分類變量統(tǒng)統(tǒng)保留。這一步變量的數(shù)目減少了115(&變量1)---包括所有的數(shù)字變量,從一個步驟保持絕對的變數(shù)。接下來的步驟是使用PHREG程序進一步減少變數(shù)。一個逐步選擇方法被用于創(chuàng)建與探索29客戶顯著影響一個變量的最終模型隨著時間的推移流失。PHREG程序數(shù)據(jù)=SASOUT2.ALL2OUTEST=SASOUT2.;指數(shù)模型*狀態(tài)(0)=&變量/選擇=遞進SLENTRY=0.0025SLSTAY=0.0025詳情;模型的估計——只有29探索變量,最終的數(shù)據(jù)集有合理數(shù)量的變量進行生存分析。在申請程序,以存活分析最終數(shù)據(jù)集,客戶生存函數(shù)和風險函數(shù)估計采用下面的代碼。顧客的生存函數(shù)估計和客戶風險函數(shù)的目的是為了獲取客戶知識流失的危險特性。從風險函數(shù)的形,狀,這項研究的客戶流失是對數(shù)正態(tài)模型典型的風險函數(shù)。如前所述,由于生存分布和危害函數(shù)的形狀是眾所周知的LIFEREG程序比PHREG程序的估計數(shù)(標準誤差較?。└行?。LIFETEST程序數(shù)據(jù)=SASOUT2.ALL3OUTSURVSASOUT2.OUTSURV方法=上升容積=(面積,高)寬=1圖形;時間總指數(shù)*狀態(tài)(0);運行;最后一步是評估客戶流失。LIFEREG程序是用來計算客戶的生存概率。在這一步最后的數(shù)據(jù)集被分成50/50的兩組數(shù)據(jù):模型數(shù)據(jù)集和驗證數(shù)據(jù)集。該模型的數(shù)據(jù)集是用于擬合模型和驗證數(shù)據(jù)集是用于評分為每一個客戶的生存概率。USE的一個變量是用來區(qū)分模型數(shù)據(jù)集(設置使用=0)和驗證數(shù)據(jù)集(設置使用=1)。在驗證數(shù)據(jù)集,總指數(shù)和狀態(tài)都設置失蹤,以便在驗證數(shù)據(jù)集是不能在模型的估計使用。出處:JunXiangLu,Ph.D.PredictingCustomerChurnintheTelecommunicationsIndustry––AnApplicationofSurvivalAnalysisModelingUsingSAS:SASUserGroupInternational(SUGI27)OnlineProceedings.2002,PaperNo.114-27,基于C8051F單片機直流電動機反饋控制系統(tǒng)的設計與研究基于單片機的嵌入式Web服務器的研究MOTOROLA單片機MC68HC(8)05PV8/A內嵌EEPROM的工藝和制程方法及對良率的影響研究基于模糊控制的電阻釬焊單片機溫度控制系統(tǒng)的研制基于MCS-51系列單片機的通用控制模塊的研究基于單片機實現(xiàn)的供暖系統(tǒng)最佳啟停自校正(STR)調節(jié)器單片機控制的二級倒立擺系統(tǒng)的研究基于增強型51系列單片機的TCP/IP協(xié)議棧的實現(xiàn)基于單片機的蓄電池自動監(jiān)測系統(tǒng)基于32位嵌入式單片機系統(tǒng)的圖像采集與處理技術的研究基于單片機的作物營養(yǎng)診斷專家系統(tǒng)的研究基于單片機的交流伺服電機運動控制系統(tǒng)研究與開發(fā)基于單片機的泵管內壁硬度測試儀的研制基于單片機的自動找平控制系統(tǒng)研究基于C8051F040單片機的嵌入式系統(tǒng)開發(fā)基于單片機的液壓動力系統(tǒng)狀態(tài)監(jiān)測儀開發(fā)模糊Smith智能控制方法的研究及其單片機實現(xiàn)一種基于單片機的軸快流CO〈,2〉激光器的手持控制面板的研制基于雙單片機沖床數(shù)控系統(tǒng)的研究基于CYGNAL單片機的在線間歇式濁度儀的研制基于單片機的噴油泵試驗臺控制器的研制基于單片機的軟起動器的研究和設計基于單片機控制的高速快走絲電火花線切割機床短循環(huán)走絲方式研究基于單片機的機電產品控制系統(tǒng)開發(fā)基于PIC單片機的智能手機充電器基于單片機的實時內核設計及其應用研究基于單片機的遠程抄表系統(tǒng)的設計與研究基于單片機的煙氣二氧化硫濃度檢測儀的研制基于微型光譜儀的單片機系統(tǒng)單片機系統(tǒng)軟件構件開發(fā)的技術研究基于單片機的液體點滴速度自動檢測儀的研制基于單片機系統(tǒng)的多功能溫度測量儀的研制基于PIC單片機的電能采集終端的設計和應用基于單片機的光纖光柵解調儀的研制氣壓式線性摩擦焊機單片機控制系統(tǒng)的研制基于單片機的數(shù)字磁通門傳感器基于單片機的旋轉變壓器-數(shù)字轉換器的研究基于單片機的光纖Bragg光柵解調系統(tǒng)的研究單片機控制的便攜式多功能乳腺治療儀的研制基于C8051F020單片機的多生理信號檢測儀基于單片機的電機運動控制系統(tǒng)設計Pico專用單片機核的可測性設計研究基于MCS-51單片機的熱量計基于雙單片機的智能遙測微型氣象站MCS-51單片機構建機器人的實踐研究基于單片機的輪軌力檢測基于單片機的GPS定位儀的研究與實現(xiàn)基于單片機的電液伺服控制系統(tǒng)用于單片機系統(tǒng)的MMC卡文件系統(tǒng)研制基于單片機的時控和計數(shù)系統(tǒng)性能優(yōu)化的研究基于單片機和CPLD的粗光柵位移測量系統(tǒng)研究單片機控制的后備式方波UPS提升高職學生單片機應用能力的探究基于單片機控制的自動低頻減載裝置研究基于單片機控制的水下焊接電源的研究基于單片機的多通道數(shù)據(jù)采集系統(tǒng)基于uPSD3234單片機的氚表面污染測量儀的研制基于單片機的紅外測油儀的研究96系列單片機仿真器研究與設計基于單片機的單晶金剛石刀具刃磨設備的數(shù)控改造基于單片機的溫度智能控制系統(tǒng)的設計與實現(xiàn)基于MSP430單片機的電梯門機控制器的研制基于單片機的氣體測漏儀的研究基于三菱M16C/6N系列單片機的CAN/USB協(xié)議轉換器基于單片機和DSP的變壓器油色譜在線監(jiān)測技術研究基于單片機的膛壁溫度報警系統(tǒng)設計基于AVR單片機的低壓無功補償控制器的設計基于單片機船舶電力推進電機監(jiān)測系統(tǒng)基于單片機網(wǎng)絡的振動信號的采集系統(tǒng)基于單片機的大容量數(shù)據(jù)存儲技術的應用研究基于單片機的疊圖機研究與教學方法實踐基于單片機嵌入式Web服務器技術的研究及實現(xiàn)基于AT89S52單片機的通用數(shù)據(jù)采集系統(tǒng)基于單片機的多道脈沖幅度分析儀研究機器人旋轉電弧傳感角焊縫跟蹤單片機控制系統(tǒng)基于單片機的控制系統(tǒng)在PLC虛擬教學實驗中的應用研究基于單片機系統(tǒng)的網(wǎng)絡通信研究與應用基于PI

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論