存活分析 Survival Analysis課件_第1頁(yè)
存活分析 Survival Analysis課件_第2頁(yè)
存活分析 Survival Analysis課件_第3頁(yè)
存活分析 Survival Analysis課件_第4頁(yè)
存活分析 Survival Analysis課件_第5頁(yè)
已閱讀5頁(yè),還剩147頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Chapter12

Knowingwhentoworry:HazardFunctionsandSurvivalAnalysis

inMarketing林家如張惠盈國(guó)立中興大學(xué)行銷研究所危險(xiǎn)函數(shù)及存活分析8June20061HazardFunctioinandSurvivalAnalysisChapter12

Knowingwhentowor報(bào)告流程專有名詞介紹存活分析之基本概念顧客維持(CustomerRetention)危險(xiǎn)(Hazards)由“危險(xiǎn)”推導(dǎo)“存活”(FromHazardtoSurvival)比例危險(xiǎn)(ProportionalHazards)課程回顧SAS操作示範(fàn)8June20062HazardFunctioinandSurvivalAnalysis報(bào)告流程專有名詞介紹8June20062HazardF專有名詞介紹CustomerTenure顧客資歷

CustomerLifetime顧客生命MediancustomerlifetimeCustomerhalf-life顧客生命之中位數(shù)Averagecustomerlifetime平均顧客生命CustomerRetention顧客維持 RetentionCurve維持曲線Hazard危險(xiǎn)Censoring設(shè)限8June20063HazardFunctioinandSurvivalAnalysis專有名詞介紹CustomerTenure顧客資歷8Ju存活分析之基本概念根源功能重要性行銷應(yīng)用存活分析(survivalanalysis)又稱事件史分析(time-to-eventanalysis)醫(yī)學(xué)研究與製造業(yè)的失效分析(FailureAnalysis)了解顧客何時(shí)需開(kāi)始擔(dān)心顧客的重要舉動(dòng)?何種因素與這些事件最有關(guān)係?Ex.對(duì)於某顧客於近期內(nèi)將離開(kāi),該有多擔(dān)心?此顧客最近尚未採(cǎi)購(gòu),是否該開(kāi)始擔(dān)心將永遠(yuǎn)流失此顧客?幫助我們了解事件史(Time-To-Event)的特性:顧客何時(shí)可能會(huì)離開(kāi)?下次顧客可能遷移至另一新顧客區(qū)隔的時(shí)機(jī)?下次顧客可能拓展或緊縮顧客關(guān)係的時(shí)機(jī)?顧客關(guān)係之中,增加或減少資歷(Tenure)的因素為何?不同因素對(duì)於顧客資歷(Tenure)的量化影響了解不同族群的顧客維持,以及這些區(qū)隔可能帶來(lái)的利益預(yù)測(cè)顧客數(shù)量了解何種因素具有最大的影響力,可使顧客維持最久8June20064HazardFunctioinandSurvivalAnalysis存活分析之基本概念根源存活分析(survivalanaly顧客維持

Customerretention與存活很接近,尤其是探討同時(shí)間開(kāi)始的顧客,因此可幫助我們了解存活分析計(jì)算顧客維持維持曲線平均顧客資歷放射性元素之衰退8June20065HazardFunctioinandSurvivalAnalysis顧客維持

Customerretention與存活很接近計(jì)算顧客維持利用顧客資歷(tenure)計(jì)算面臨挑戰(zhàn):開(kāi)始點(diǎn)及停止點(diǎn)的決定。取決於企業(yè)型態(tài)與可得之資料。Subscriptionandaccount-basedbusinessTransactionalbusiness

技術(shù)問(wèn)題:在可得的資料中尋找起始與停止日期,可能不如初呈現(xiàn)時(shí)顯著起始於簽名當(dāng)天?雜誌送達(dá)當(dāng)天?促銷結(jié)束開(kāi)始付費(fèi)時(shí)?8June20066HazardFunctioinandSurvivalAnalysis計(jì)算顧客維持利用顧客資歷(tenure)計(jì)算面臨挑戰(zhàn):8J計(jì)算出tenure後即可畫(huà)出顧客維持曲線可顯示出在特定期間內(nèi),顧客維持的比例。累進(jìn)圖表,由100%開(kāi)始若顧客起始點(diǎn)近似,則維持曲線接近於存活曲線。假設(shè)顧客起始點(diǎn)相同,從顧客維持曲線可比較不同族群顧客的顧客維持:從特定時(shí)間點(diǎn)看,看其維持之比例。顧客生命之中位數(shù)(mediancustomerlifetime;customerhalf-life):一半之顧客流失需多久時(shí)間。維持曲線RetentionCurve8June20067HazardFunctioinandSurvivalAnalysis計(jì)算出tenure後即可畫(huà)出顧客維持曲線維持曲線RetentNote顧客生命中位數(shù)無(wú)法解答這段期間顧客之平均價(jià)值是多少?一般顧客優(yōu)質(zhì)顧客利用維持曲線比較顧客不同顧客群8June20068HazardFunctioinandSurvivalAnalysisNote一般顧客優(yōu)質(zhì)顧客利用維持曲線比較顧客不同顧客群8J平均顧客資歷

AverageTenureAveragetenure=Averageremaininglifetime=TruncatedMeanlifetime無(wú)法計(jì)算「真正」的平均生命,除非所有的顧客均離開(kāi)。因此特定時(shí)間內(nèi)的平均生命,統(tǒng)計(jì)學(xué)家稱為截距式平均生命8June20069HazardFunctioinandSurvivalAnalysis平均顧客資歷

AverageTenureAveraget1020/10201/10平均顧客資歷:特定期間內(nèi),位於維持曲線下方的面積8June200610HazardFunctioinandSurvivalAnalysis1020/10201/10平均顧客資歷:特定期間內(nèi),位於維Example:顧客價(jià)值的計(jì)算一般顧客平均資歷優(yōu)質(zhì)顧客平均資歷每年平均顧客價(jià)值=$100一般顧客平均生命=3.7年,10-year顧客價(jià)值:$100*3.7=$370優(yōu)質(zhì)顧客平均生命=6.1年,10-year顧客價(jià)值:$100*6.1=$6108June200611HazardFunctioinandSurvivalAnalysisExample:顧客價(jià)值的計(jì)算一般顧客平均資歷優(yōu)質(zhì)顧客平均資好的顧客是鈾,離開(kāi)的顧客是鉛。鈾的衰減量,類似維持曲線。呈指數(shù)衰減:無(wú)論時(shí)間的長(zhǎng)短,元素皆以固定比例衰減。能幫助了解顧客維持概念,但事實(shí)上顧客極少呈現(xiàn)指數(shù)衰減。原因:太簡(jiǎn)單預(yù)測(cè)其未來(lái)現(xiàn)象。無(wú)法呈現(xiàn)顧客忠誠(chéng)度。留下的顧客和離開(kāi)的顧客,並不相同。4.放射性元素之衰減8June200612HazardFunctioinandSurvivalAnalysis好的顧客是鈾,離開(kāi)的顧客是鉛。鈾的衰減量,類似維持曲線。4.危險(xiǎn)Hazards屬無(wú)母數(shù)(non-parametric)之統(tǒng)計(jì)方法可延伸出更有用之存活曲線危險(xiǎn)機(jī)率HazardProbability危險(xiǎn)函數(shù)HazardFunction設(shè)限Censoring8June200613HazardFunctioinandSurvivalAnalysis危險(xiǎn)Hazards屬無(wú)母數(shù)(non-parametric)危險(xiǎn)機(jī)率

HazardProbability定義:假設(shè)某顧客目前tenure為t(即已存活至t),那其在t+1前離開(kāi)的機(jī)率為多少?亦即:t時(shí)之危險(xiǎn)為:t至t+1期間顧客流失之風(fēng)險(xiǎn)。為條件機(jī)率的概念值介於0-1之間計(jì)算公式於t離開(kāi)之顧客人數(shù)所有可能於t離開(kāi)之顧客人數(shù)風(fēng)險(xiǎn)人口(populationatrisk):所有tenure大於或等於t之顧客,亦包含了在t點(diǎn)流失之顧客8June200614HazardFunctioinandSurvivalAnalysis危險(xiǎn)機(jī)率

HazardProbability定義:假設(shè)危險(xiǎn)的例子

U.SLifetable:屬於浴缸型的危險(xiǎn)函數(shù),開(kāi)始時(shí)高,接著急降,然後逐漸攀升在某條件年齡下死亡之機(jī)率tenure8June200615HazardFunctioinandSurvivalAnalysis危險(xiǎn)的例子

U.SLifetable:屬於浴缸型的危2.危險(xiǎn)函數(shù)的型態(tài)ConstantHazard固定型危險(xiǎn)無(wú)論顧客已存在多久時(shí)間,危險(xiǎn)機(jī)率都是一樣的(常數(shù)),在圖表上呈現(xiàn)水平線。顧客離開(kāi)的機(jī)率不隨著顧客維持時(shí)間而改變。類似放射性元素衰減的型態(tài)。BathtubHazard浴缸型危險(xiǎn)開(kāi)始時(shí)很高,接著下降並維持平坦一段時(shí)間,最後Hazard又再次提高。有綁約期間的客戶。早期顧客因產(chǎn)品不適合,或是尚未付費(fèi)而離開(kāi),接著進(jìn)入漫長(zhǎng)的約期,顧客可能因?yàn)檫`約金或履約的義務(wù)而不離開(kāi)。約期結(jié)束後,顧客時(shí)常急於離開(kāi)。(市場(chǎng)改變,投入競(jìng)爭(zhēng)者懷抱,較好的服務(wù)與價(jià)格等)8June200616HazardFunctioinandSurvivalAnalysis2.危險(xiǎn)函數(shù)的型態(tài)ConstantHazard固定型危實(shí)際範(fàn)例一開(kāi)始很高:顧客已經(jīng)簽約,但可能因某些技術(shù)因素而無(wú)法開(kāi)始。某些客戶忘記自己已簽約因而尚未開(kāi)始。M-ShapedFeature

在9及11週出現(xiàn)高峰。1.在兩個(gè)月左右,可能是未繳款。2.在三個(gè)月左右。優(yōu)惠促銷期結(jié)束,顧客認(rèn)為不再需要此服務(wù),很可能又參加另一種優(yōu)惠活動(dòng)緩慢的衰退,表示顧客滯留越久,越不可能離開(kāi)??赡芊磻?yīng)維持時(shí)間越久顧客的忠誠(chéng)度越高三個(gè)月後,不再有高峰,每隔四到五週,會(huì)有小的高峰週期,這反應(yīng)每月付費(fèi)的週期,消費(fèi)者通常在收到帳單後離開(kāi)。8June200617HazardFunctioinandSurvivalAnalysis實(shí)際範(fàn)例一開(kāi)始很高:顧客已經(jīng)簽約,但可能因某些技術(shù)因素而無(wú)法3.設(shè)限Censoring存活分析中最重要的概念: 為了計(jì)算更精確之危險(xiǎn)機(jī)率時(shí)將某些顧客排除不予計(jì)算在內(nèi)HazardProbability:於T點(diǎn)離開(kāi)之顧客人數(shù)T點(diǎn)之風(fēng)險(xiǎn)人口CENSORED:於T點(diǎn)之前已經(jīng)離開(kāi)的顧客,不可再算為人口(Tenure<T)Tenure=T,但仍然存活者,不能算為人口,因?yàn)樗钥赡茉赥+1之前離去8June200618HazardFunctioinandSurvivalAnalysis3.設(shè)限Censoring存活分析中最重要的概念:於TExample:圖示+計(jì)算白圈圈:顧客已經(jīng)離開(kāi),確實(shí)tenure已知黑圈圈:顧客尚存活,確實(shí)tenure未知,必須設(shè)限36752148June200619HazardFunctioinandSurvivalAnalysisExample:圖示+計(jì)算白圈圈:顧客已經(jīng)離開(kāi),確實(shí)teCustomerCensoredTeunreTime0Time1Time2Time3Time4Time51Y5ActiveActiveActiveActiveActiveActive2N4ActiveActiveActiveActiveStoppedCensored3N3ActiveActiveActiveStoppedCensoredCensored4Y3ActiveActiveActiveActiveCensoredCensored5N2ActiveActiveStoppedCensoredCensoredCensored6Y1ActiveActiveCensoredCensoredCensoredCensored7N1ActiveStoppedCensoredCensoredCensoredCensoredTime0Time1Time2Time3Time4Time5Active764311Stopped011110Censored002356Hazard0/(0+7)=0%1/(1+6)=14%1/(1+4)=20%1/(1+3)=25%1/(1+1)=50%0/(0+1)=0%8June200620HazardFunctioinandSurvivalAnalysisCustomerCensoredTeunreTime0Tim其它設(shè)限型態(tài)競(jìng)爭(zhēng)風(fēng)險(xiǎn)CompetingRisk:必須針對(duì)每種風(fēng)險(xiǎn)發(fā)展出不同之Hazard例如:顧客離去的原因可分成:自願(yuàn)離去強(qiáng)制離去8June200621HazardFunctioinandSurvivalAnalysis其它設(shè)限型態(tài)競(jìng)爭(zhēng)風(fēng)險(xiǎn)CompetingRisk:8Ju被強(qiáng)制驅(qū)離的顧客,應(yīng)標(biāo)示Censored而不是Stopped8June200622HazardFunctioinandSurvivalAnalysis被強(qiáng)制驅(qū)離的顧客,應(yīng)標(biāo)示Censored而不是StoppedFromHazardtoSurvival

由“危險(xiǎn)”推導(dǎo)“存活”維持曲線由危險(xiǎn)函數(shù)推導(dǎo)更為精準(zhǔn)的存活曲線8June200623HazardFunctioinandSurvivalAnalysisFromHazardtoSurvival

由“危險(xiǎn)”推維持曲線

--顯示出特定期間內(nèi)顧客維持的比例方法:一星期前開(kāi)始之顧客:衡量一星期之維持狀況二星期前開(kāi)始之顧客:衡量二星期之維持狀況以此類推…….8June200624HazardFunctioinandSurvivalAnalysis維持曲線

--顯示出特定期間內(nèi)顧客維持的比例方法:8Jun呈“鋸齒狀”之維持曲線維持曲線可能會(huì)有許多鋸齒狀。1.十星期的維持竟然比九星期高2.顧客生命中位數(shù)竟然不只一個(gè)原因:顧客起始點(diǎn)不同不同時(shí)段所獲得的顧客品質(zhì)(好壞)不同不同時(shí)間行銷活動(dòng)的差異,吸引不同品質(zhì)的顧客。8June200625HazardFunctioinandSurvivalAnalysis呈“鋸齒狀”之維持曲線維持曲線可能會(huì)有許多鋸齒狀。1.存活(survival):Hazards:顧客在某特定時(shí)間點(diǎn)上可能離開(kāi)的機(jī)率。Survival:顧客存活至某特定時(shí)間點(diǎn)的機(jī)率。Caculation:S(t)=S(t–1)*(1–h(t–1))S(0)=100%(所有的顧客在分析開(kāi)始時(shí)都是存活的。)Note:存活值介於0和1。但存活本身不斷的變小,因?yàn)槊總€(gè)接續(xù)的值,都乘以一個(gè)小於1的數(shù)。因此生存曲線由100%開(kāi)始,慢慢的下降,有時(shí)平坦,但絕對(duì)不會(huì)上升。8June200626HazardFunctioinandSurvivalAnalysis存活(survival):Hazards:顧客在某特定時(shí)間存活曲線(SurvivalCurve)較平滑較精準(zhǔn)逐漸下降8June200627HazardFunctioinandSurvivalAnalysis存活曲線(SurvivalCurve)較平滑8Jun比例危險(xiǎn)

ProportionalHazards範(fàn)例分層(Stratification)Cox比例危險(xiǎn)回歸比例危險(xiǎn)的限制8June200628HazardFunctioinandSurvivalAnalysis比例危險(xiǎn)

ProportionalHazards範(fàn)例8創(chuàng)始者:SirDavidCox研究Hazards的零時(shí)共變數(shù)TimeZeroCovariates(即初始因子)時(shí),假設(shè)這些因素對(duì)於Hazards的影響具有一致的比例,且不隨時(shí)間改變,因此能夠測(cè)量出不同因素的影響。8June200629HazardFunctioinandSurvivalAnalysis創(chuàng)始者:SirDavidCox8June200629範(fàn)例吸煙者罹患白血病的風(fēng)險(xiǎn)是非吸煙者的1.53倍。初始狀態(tài):研究者知道對(duì)象是不是吸煙者(範(fàn)例中忽略已戒菸者)。只有兩種初始因子必須考慮,可以只看Hazards曲線並取得整體危險(xiǎn)的平均。8June200630HazardFunctioinandSurvivalAnalysis範(fàn)例吸煙者罹患白血病的風(fēng)險(xiǎn)是非吸煙者的1.53倍。8Jun電話行銷與DM行銷顧客流失的危險(xiǎn)機(jī)率(HazardsProbabilities)初始狀態(tài):如何成為顧客?(電話行銷或是Dm)電話行銷的危險(xiǎn)比DM多了將近兩倍。8June200631HazardFunctioinandSurvivalAnalysis電話行銷與DM行銷顧客流失的危險(xiǎn)機(jī)率(HazardsPro分層(Stratification)定義測(cè)量初始因子對(duì)存活的影響由初始狀態(tài)定義不同族群的量測(cè)方式,每一群都獨(dú)立分析。有好的視覺(jué)效果,並能產(chǎn)生精確的存活值。不同族群顧客的Hazard機(jī)率,可以分別繪製危險(xiǎn)(Hazards)機(jī)率曲線,並產(chǎn)生存活(Survival)曲線。使用1-Year存活(1-YearSurvival)、Median存活或平均截距資歷,表現(xiàn)出差異。8June200632HazardFunctioinandSurvivalAnalysis分層(Stratification)定義8June200分層的假設(shè)(限制)初始的影響必須是類別變數(shù)。處理連續(xù)變數(shù)時(shí),需拆解為不連續(xù)的區(qū)塊(Chunk)。每個(gè)群組都必須很大。當(dāng)有興趣的變數(shù)很多時(shí),分類的數(shù)量會(huì)增加的很快,則危險(xiǎn)(Hazard)會(huì)越來(lái)越不可靠。8June200633HazardFunctioinandSurvivalAnalysis分層的假設(shè)(限制)8June200633HazardCox比例危險(xiǎn)迴歸

CoxProportionalHazardsCox比例危險(xiǎn)可以使用類別/連續(xù)變數(shù)表示危險(xiǎn)因子,並計(jì)算這種比例。電話行銷的離開(kāi)(Attrition)危險(xiǎn)較DM行銷多了1.5倍。(類別)每增加一個(gè)包裝年(Pack-Year)罹患直腸癌的危險(xiǎn)增加6.7個(gè)百分比。(連續(xù))可以估算出類別以及連續(xù)共變數(shù)的影響。包裝年:量測(cè)個(gè)人長(zhǎng)時(shí)間吸煙量的方式,例如,1個(gè)包裝年相當(dāng)於一年之中美天吸煙1包,2個(gè)包裝年相當(dāng)於半年之中,每天吸煙1包....。8June200634HazardFunctioinandSurvivalAnalysisCox比例危險(xiǎn)迴歸

CoxProportionalHaz偏概度(PartialLikelihood)假設(shè)只有一個(gè)顧客在T時(shí)間停止,那麼時(shí)間T的偏概度就是正好某位特定顧客a停止的Likelihood。偏概度若所有顧客的危險(xiǎn)率(HazardRates)均相等,偏概度是常數(shù)(該時(shí)間點(diǎn),個(gè)體除以population)。但危險(xiǎn)並不是常數(shù),且通常是初始狀態(tài)的某種函數(shù)呈現(xiàn)。8June200635HazardFunctioinandSurvivalAnalysis偏概度(PartialLikelihood)8June假設(shè)初始狀態(tài)一致地(常數(shù)n)影響所有的危險(xiǎn)(Hazards),和時(shí)間無(wú)關(guān)-這和分層的假設(shè)相同。危險(xiǎn)(Hazards)出現(xiàn)於乘以初始狀況為基礎(chǔ)的複雜算式的分子與分母中。由於相互約分,剩下的就是包含複雜初始狀況的複雜公式。8June200636HazardFunctioinandSurvivalAnalysis假設(shè)8June200636HazardFunctioi計(jì)算某一特定群體的概度(Likelihood)群體中每個(gè)偏概度相乘統(tǒng)計(jì)學(xué)利用最大概數(shù)法估計(jì),可以找到使結(jié)果最可能發(fā)生的參數(shù),這種參數(shù)可以用來(lái)表現(xiàn)初始狀態(tài)對(duì)Hazards的影響??梢蕴幚磉B續(xù)及類別變數(shù)。8June200637HazardFunctioinandSurvivalAnalysis計(jì)算某一特定群體的概度(Likelihood)8June參考資料最大概數(shù)估算(MaximumLikelihoodEstimation)FindLikelihoodFunctionTaking

8June200638HazardFunctioinandSurvivalAnalysis參考資料最大概數(shù)估算(MaximumLikelihood比例危險(xiǎn)的限制將時(shí)間視為連續(xù)的概念比例危險(xiǎn)回歸常處理不連續(xù)時(shí)間的危險(xiǎn)假設(shè)只有一位顧客在特定時(shí)間停止比例危險(xiǎn)回歸常處理同一時(shí)間有多個(gè)人停止。假設(shè)初始狀況對(duì)危險(xiǎn)的影響,不會(huì)隨著時(shí)間影響實(shí)際上初始狀況很少具有這樣完美的比例性(即使在科學(xué)研究)。行銷並非受到控制的實(shí)驗(yàn),事物總是不斷的變遷。8June200639HazardFunctioinandSurvivalAnalysis比例危險(xiǎn)的限制將時(shí)間視為連續(xù)的概念8June200639雖然沒(méi)有簡(jiǎn)單的算術(shù)可以解釋初始狀態(tài)對(duì)不同時(shí)間的影響,但事實(shí)上通常沒(méi)有太大的差異。即使假設(shè)具有比例性,Cox回歸仍可以判定哪些共變異數(shù)對(duì)危險(xiǎn)有最重大的影響??山忉尯畏N初始狀況和顧客離去具有相關(guān)性。8June200640HazardFunctioinandSurvivalAnalysis雖然沒(méi)有簡(jiǎn)單的算術(shù)可以解釋初始狀態(tài)對(duì)不同時(shí)間的影響,但事實(shí)上Cox方式是為零時(shí)共變數(shù)而設(shè)計(jì),統(tǒng)計(jì)學(xué)家稱為初始值(InitialValue)可延伸處理發(fā)生於顧客生命期之中的事件-如升級(jí)他們的產(chǎn)品,或是產(chǎn)生抱怨。在統(tǒng)計(jì)術(shù)語(yǔ)中,這些是依時(shí)相依性共變數(shù)(Time-dependentCovariance)附加的因子能夠在顧客資歷期間的任何時(shí)間點(diǎn)出現(xiàn),而不只是在關(guān)係的開(kāi)始而已。這種因子可能是顧客對(duì)於維持活動(dòng)的回應(yīng),或是抱怨。8June200641HazardFunctioinandSurvivalAnalysisCox方式是為零時(shí)共變數(shù)而設(shè)計(jì),統(tǒng)計(jì)學(xué)家稱為初始值(Init存活分析之應(yīng)用處理不同型態(tài)的離開(kāi)(Attrition)顧客何時(shí)回來(lái)預(yù)測(cè)隨時(shí)間改變的危險(xiǎn)8June200642HazardFunctioinandSurvivalAnalysis存活分析之應(yīng)用處理不同型態(tài)的離開(kāi)(Attrition)8J處理不同型態(tài)的離開(kāi)(Attrition)傳統(tǒng)作法企圖將被迫離去的顧客整個(gè)由危險(xiǎn)計(jì)算中移除,這是一種錯(cuò)誤的方式問(wèn)題點(diǎn):必須等到顧客已經(jīng)被強(qiáng)制停止之後,才知道哪些顧客必須被移除。但在之前,這筆資料一直被算在風(fēng)險(xiǎn)人口中。使用顧客關(guān)係結(jié)束所得到的知識(shí)來(lái)進(jìn)行顧客分析,並不是一種很好的方式。8June200643HazardFunctioinandSurvivalAnalysis處理不同型態(tài)的離開(kāi)(Attrition)傳統(tǒng)作法8June正確的方法將問(wèn)題拆開(kāi)為自願(yuàn)離開(kāi)的危險(xiǎn)與強(qiáng)制離開(kāi)的危險(xiǎn)。使用所有顧客資料,並設(shè)限(Censoring)因其他因素離開(kāi)的顧客。計(jì)算自願(yuàn)耗損的危險(xiǎn):當(dāng)顧客被強(qiáng)制要求離去顧客離去之前,包含在分析裡面自離去的時(shí)間之後,被設(shè)限。因?yàn)楫?dāng)顧客被要求離去的時(shí)間點(diǎn),他並不是出於自願(yuàn)離去。8June200644HazardFunctioinandSurvivalAnalysis正確的方法8June200644HazardFunct顧客何時(shí)回來(lái)評(píng)估失而復(fù)得的顧客時(shí),將危險(xiǎn)視為顧客在離開(kāi)數(shù)日後重返的機(jī)率。存活曲線(上方曲線)與危險(xiǎn)(下方曲線)-行動(dòng)電話顧客8June200645HazardFunctioinandSurvivalAnalysis顧客何時(shí)回來(lái)評(píng)估失而復(fù)得的顧客時(shí),將危險(xiǎn)視為顧客在離開(kāi)數(shù)日後初始的回復(fù)比例很高。第一周有超過(guò)1/3的顧客回復(fù)。許多顧客只是來(lái)不及付清帳單。超過(guò)90天後,危險(xiǎn)接近於0,沒(méi)有顧客失而復(fù)得。電話號(hào)碼為顧客保留三個(gè)月。維持退租復(fù)租的[風(fēng)險(xiǎn)]8June200646HazardFunctioinandSurvivalAnalysis初始的回復(fù)比例很高。第一周有超過(guò)1/3的顧客回復(fù)。許多顧客只確定新(失而復(fù)得)顧客與停止顧客之間的關(guān)係在這個(gè)例子中使用顧客id(行動(dòng)電話號(hào)碼)。保守有效,但有可能遺漏了願(yuàn)意享有新客戶優(yōu)惠的顧客。確認(rèn)個(gè)人資料,即使在一段時(shí)間後,使用不同帳號(hào)??梢杂缮鐣?huì)福利號(hào)碼或駕照號(hào)碼來(lái)連接顧客的資料。8June200647HazardFunctioinandSurvivalAnalysis確定新(失而復(fù)得)顧客與停止顧客之間的關(guān)係8June20失而復(fù)得顧客的初始共變數(shù)初始:所有已知有關(guān)顧客離去時(shí)的資料。初始產(chǎn)品與促銷離去前的顧客行為。是不是常抱怨、是不是難失而復(fù)得?遊蕩(Roam)的顧客、延遲繳費(fèi)的顧客等。8June200648HazardFunctioinandSurvivalAnalysis失而復(fù)得顧客的初始共變數(shù)8June200648Hazar了解事件史(Time-To-Event)問(wèn)題客戶一開(kāi)始加入的是低價(jià)計(jì)畫(huà),有多久的時(shí)間他們會(huì)想要升級(jí)到高價(jià)計(jì)畫(huà)?顧客升級(jí)到高價(jià)計(jì)畫(huà),有多久可能會(huì)降級(jí)?由顧客過(guò)去的行為,以及不同的顧客具有不同的購(gòu)買期間,顧客兩次購(gòu)買之間的期待時(shí)間長(zhǎng)度為何?存活分析可以知道不同初始狀況的效果,使用比例危險(xiǎn)可以判定何種共變數(shù)對(duì)期望的成果有最大的影響力。8June200649HazardFunctioinandSurvivalAnalysis了解事件史(Time-To-Event)問(wèn)題8June2預(yù)測(cè)預(yù)測(cè)顧客未來(lái)的數(shù)量未來(lái)某個(gè)時(shí)間點(diǎn),停止的顧客數(shù)量預(yù)測(cè)的構(gòu)成要素現(xiàn)有顧客的模型新顧客對(duì)預(yù)測(cè)的影響8June200650HazardFunctioinandSurvivalAnalysis預(yù)測(cè)預(yù)測(cè)8June200650HazardFuncti現(xiàn)有顧客的模型找出影響顧客生命週期中不同的共變數(shù)。利用全部顧客的一個(gè)或多個(gè)存活模型。8June200651HazardFunctioinandSurvivalAnalysis現(xiàn)有顧客的模型8June200651HazardFun如果顧客存活100天,那麼他在明天停止的機(jī)率,是第100天的危險(xiǎn)計(jì)算顧客後天停止的機(jī)會(huì),先假設(shè)顧客明天不會(huì)停止,並且在第101天停止。這是在100天的條件存活(1-危險(xiǎn)=不停止的機(jī)率)*101天的危險(xiǎn)。將所有的顧客維持做這樣的處理,就有可能預(yù)測(cè)現(xiàn)有顧客在未來(lái)停止。8June200652HazardFunctioinandSurvivalAnalysis如果顧客存活100天,那麼他在明天停止的機(jī)率,是第100天的預(yù)測(cè)一個(gè)月的停止。預(yù)測(cè)已被證實(shí)很接近真實(shí)發(fā)生的狀態(tài)利用危險(xiǎn)的參數(shù)模型,不是經(jīng)驗(yàn)危險(xiǎn)率(EmpiricalHazardRates)和星期幾有關(guān),結(jié)果呈現(xiàn)以週為週期的停止現(xiàn)象。預(yù)測(cè)真實(shí)8June200653HazardFunctioinandSurvivalAnalysis預(yù)測(cè)一個(gè)月的停止。預(yù)測(cè)真實(shí)8June200653Haza預(yù)測(cè)時(shí),新顧客的影響。挑戰(zhàn):要如何估計(jì)新的開(kāi)始?利用包含新開(kāi)始的預(yù)算資料,有時(shí)依產(chǎn)品、地理、通路等分類,利用這些影響調(diào)整存活模型。結(jié)果如這些預(yù)算資料一般準(zhǔn)確。依照存活技巧的預(yù)測(cè),可以結(jié)合管理真實(shí)等級(jí)的程序,而不是這些資料的等級(jí)。預(yù)測(cè)現(xiàn)有顧客的停止,與預(yù)測(cè)新顧客的停止,能夠估計(jì)未來(lái)的不同顧客等級(jí)。有案例成功使用這種預(yù)測(cè)方式很多年,因?yàn)榘佑|管道的新顧客模型,預(yù)測(cè)模型能夠完美適用於未來(lái)的接觸管道組合。8June200654HazardFunctioinandSurvivalAnalysis預(yù)測(cè)時(shí),新顧客的影響。8June200654Hazard隨時(shí)間改變的危險(xiǎn)(Hazards)和去年停止的顧客有關(guān)的危險(xiǎn),是否和前年停止顧客危險(xiǎn)有顯著的差異?將危險(xiǎn)架構(gòu)在停止的顧客,而不是開(kāi)始的顧客結(jié)果是估算依照在特定時(shí)間內(nèi)停止為基礎(chǔ)的危險(xiǎn)非正規(guī)統(tǒng)計(jì)方式:時(shí)間窗(TimeWindow)8June200655HazardFunctioinandSurvivalAnalysis隨時(shí)間改變的危險(xiǎn)(Hazards)和去年停止的顧客有關(guān)的危險(xiǎn)估計(jì)2003年停止的顧客危險(xiǎn)(Hazards)在2003年停止的顧客在2003年第一天仍活躍在2003年期間成為新顧客顧客只能成為,他們?cè)?003年第一天為止的資歷的風(fēng)險(xiǎn)人口(Population),不管他們的資歷為何(對(duì)新客戶而言資歷就是0)。8June200656HazardFunctioinandSurvivalAnalysis估計(jì)2003年停止的顧客危險(xiǎn)(Hazards)8JuneTenure=1,並在2003年停止的顧客風(fēng)險(xiǎn)人口在2002年12月31日與2002年12月30日之間開(kāi)始的顧客,可能有一天的資歷,並在2003年停止12/3112/30Tenure=18June200657HazardFunctioinandSurvivalAnalysisTenure=1,並在2003年停止的顧客風(fēng)險(xiǎn)人口12/31Tenure=365,並在2003年停止的顧客風(fēng)險(xiǎn)人口2002/12/312002/1/1Tenure=3658June200658HazardFunctioinandSurvivalAnalysisTenure=365,並在2003年停止的顧客風(fēng)險(xiǎn)人口200為了比較的目的,存活較危險(xiǎn)本身更有用存活的確在若干年內(nèi)逐漸遞減。存活的差異很小。然而,若是顧客是以數(shù)十萬(wàn)計(jì),這樣就顯示了顧客品質(zhì)的降低。8June200659HazardFunctioinandSurvivalAnalysis為了比較的目的,存活較危險(xiǎn)本身更有用8June20065課程回顧危險(xiǎn)與存活分析是設(shè)計(jì)來(lái)了解顧客。本章介紹危險(xiǎn)是一種顧客在特定時(shí)間點(diǎn)離去的條件機(jī)率。這種對(duì)存活分析的處理,在統(tǒng)計(jì)學(xué)上是非正統(tǒng)的。統(tǒng)計(jì)上採(cǎi)用連續(xù)比例的方式而非不連續(xù)的時(shí)間機(jī)率。然而這種處理能更直覺(jué)分析顧客。危險(xiǎn)就像是顧客生命週期的X光,相關(guān)概念:存活,是顧客生存至某一特定時(shí)間點(diǎn)的比例,這可以比較不同顧客族群,並將結(jié)果轉(zhuǎn)換為金錢(qián)。8June200660HazardFunctioinandSurvivalAnalysis課程回顧危險(xiǎn)與存活分析是設(shè)計(jì)來(lái)了解顧客。8June200有充分的顧客時(shí),為不同族群的顧客分別繪製曲線,可以做很清楚的比較??梢栽谔囟〞r(shí)間點(diǎn)研究存活,或是顧客半衰期,以及平均資歷,以更了解顧客。某些顧客必須由分析中排除。設(shè)限的概念能夠被延伸並了解競(jìng)爭(zhēng)危險(xiǎn)(CompetingRisk),如自願(yuàn)離去或是強(qiáng)制離去。設(shè)限也可以去除某些結(jié)果,如抵制,讓結(jié)果不會(huì)偏斜。8June200661HazardFunctioinandSurvivalAnalysis有充分的顧客時(shí),為不同族群的顧客分別繪製曲線,可以做很清楚的危險(xiǎn)能夠判定在一開(kāi)始時(shí),何種因素對(duì)提昇或降低危險(xiǎn)有關(guān)。將顧客分層後,還有另一種COX比例危險(xiǎn)回歸。量測(cè)顧客離去的機(jī)率之外,存活分析有很多應(yīng)用:預(yù)測(cè)顧客等級(jí)預(yù)測(cè)顧客生命周其中的其他事件8June200662HazardFunctioinandSurvivalAnalysis危險(xiǎn)能夠判定在一開(kāi)始時(shí),何種因素對(duì)提昇或降低危險(xiǎn)有關(guān)。將顧客SAS操作示範(fàn)客戶資料說(shuō)明操作示範(fàn)8June200663HazardFunctioinandSurvivalAnalysisSAS操作示範(fàn)客戶資料說(shuō)明8June200663Haza客戶資料說(shuō)明VariablesCUSTOMER_ID:行動(dòng)電話號(hào)碼RATE_PLAN:費(fèi)率(高、中、低)MONTHLY_FEE:每月電話費(fèi)MARKET:地點(diǎn)CHANNEL:通路START_DATE:起租日CANCEL_DATE:終止日CANCEL_TYPE:N活躍、V自願(yuàn)離去、I被迫離去8June200664HazardFunctioinandSurvivalAnalysis客戶資料說(shuō)明Variables8June200664Ha操作示範(fàn)新建立Library時(shí),勾選Enableatstartup8June200665HazardFunctioinandSurvivalAnalysis操作示範(fàn)新建立Library時(shí),勾選EnableatstInputDataSource8June200666HazardFunctioinandSurvivalAnalysisInputDataSource8June200666OpenInputDataSourceNode選擇RAW選擇整筆資料8June200667HazardFunctioinandSurvivalAnalysisOpenInputDataSourceNode選擇R增加SASCodeNode8June200668HazardFunctioinandSurvivalAnalysis增加SASCodeNode8June200668HaProgram>Score輸入設(shè)限指令尚存活的顧客tenure=20061231-起租日,標(biāo)注設(shè)限其他:終止日-起始日,不設(shè)限8June200669HazardFunctioinandSurvivalAnalysisProgram>Score8June200669HazaExport增加score選項(xiàng)8June200670HazardFunctioinandSurvivalAnalysisExport增加score選項(xiàng)8June200670Ha增加ScoreNode執(zhí)行SASCode進(jìn)行設(shè)限增加tenure,censored二個(gè)變數(shù)8June200671HazardFunctioinandSurvivalAnalysis增加ScoreNode8June200671HazarData>對(duì)應(yīng)到資料8June200672HazardFunctioinandSurvivalAnalysisData>對(duì)應(yīng)到資料8June200672HazardSetting>Applytrainingdatascorecodetoscoredataset8June200673HazardFunctioinandSurvivalAnalysisSetting>Applytrainingdatasc執(zhí)行scorenode,新增的兩個(gè)變數(shù)已經(jīng)加入8June200674HazardFunctioinandSurvivalAnalysis執(zhí)行scorenode,新增的兩個(gè)變數(shù)已經(jīng)加入8June再新增一個(gè)SASCODE對(duì)應(yīng)到Score的資料Program>run(執(zhí)行SASProcess)proclifetestdata=emdata.sd_k8xbwoutsurv=lifetestmethod=actintervals=0to1000by1plots=(s,h);timetenure*censored(1);run;8June200675HazardFunctioinandSurvivalAnalysis再新增一個(gè)SASCODE8June200675HazaSurvivalCurve8June200676HazardFunctioinandSurvivalAnalysisSurvivalCurve8June200676HazHazardsCurve8June200677HazardFunctioinandSurvivalAnalysisHazardsCurve8June200677HazaTheend

Thankyouforyourlistening8June200678HazardFunctioinandSurvivalAnalysisTheendThankyouforyourlisChapter12

Knowingwhentoworry:HazardFunctionsandSurvivalAnalysis

inMarketing林家如張惠盈國(guó)立中興大學(xué)行銷研究所危險(xiǎn)函數(shù)及存活分析8June200679HazardFunctioinandSurvivalAnalysisChapter12

Knowingwhentowor報(bào)告流程專有名詞介紹存活分析之基本概念顧客維持(CustomerRetention)危險(xiǎn)(Hazards)由“危險(xiǎn)”推導(dǎo)“存活”(FromHazardtoSurvival)比例危險(xiǎn)(ProportionalHazards)課程回顧SAS操作示範(fàn)8June200680HazardFunctioinandSurvivalAnalysis報(bào)告流程專有名詞介紹8June20062HazardF專有名詞介紹CustomerTenure顧客資歷

CustomerLifetime顧客生命MediancustomerlifetimeCustomerhalf-life顧客生命之中位數(shù)Averagecustomerlifetime平均顧客生命CustomerRetention顧客維持 RetentionCurve維持曲線Hazard危險(xiǎn)Censoring設(shè)限8June200681HazardFunctioinandSurvivalAnalysis專有名詞介紹CustomerTenure顧客資歷8Ju存活分析之基本概念根源功能重要性行銷應(yīng)用存活分析(survivalanalysis)又稱事件史分析(time-to-eventanalysis)醫(yī)學(xué)研究與製造業(yè)的失效分析(FailureAnalysis)了解顧客何時(shí)需開(kāi)始擔(dān)心顧客的重要舉動(dòng)?何種因素與這些事件最有關(guān)係?Ex.對(duì)於某顧客於近期內(nèi)將離開(kāi),該有多擔(dān)心?此顧客最近尚未採(cǎi)購(gòu),是否該開(kāi)始擔(dān)心將永遠(yuǎn)流失此顧客?幫助我們了解事件史(Time-To-Event)的特性:顧客何時(shí)可能會(huì)離開(kāi)?下次顧客可能遷移至另一新顧客區(qū)隔的時(shí)機(jī)?下次顧客可能拓展或緊縮顧客關(guān)係的時(shí)機(jī)?顧客關(guān)係之中,增加或減少資歷(Tenure)的因素為何?不同因素對(duì)於顧客資歷(Tenure)的量化影響了解不同族群的顧客維持,以及這些區(qū)隔可能帶來(lái)的利益預(yù)測(cè)顧客數(shù)量了解何種因素具有最大的影響力,可使顧客維持最久8June200682HazardFunctioinandSurvivalAnalysis存活分析之基本概念根源存活分析(survivalanaly顧客維持

Customerretention與存活很接近,尤其是探討同時(shí)間開(kāi)始的顧客,因此可幫助我們了解存活分析計(jì)算顧客維持維持曲線平均顧客資歷放射性元素之衰退8June200683HazardFunctioinandSurvivalAnalysis顧客維持

Customerretention與存活很接近計(jì)算顧客維持利用顧客資歷(tenure)計(jì)算面臨挑戰(zhàn):開(kāi)始點(diǎn)及停止點(diǎn)的決定。取決於企業(yè)型態(tài)與可得之資料。Subscriptionandaccount-basedbusinessTransactionalbusiness

技術(shù)問(wèn)題:在可得的資料中尋找起始與停止日期,可能不如初呈現(xiàn)時(shí)顯著起始於簽名當(dāng)天?雜誌送達(dá)當(dāng)天?促銷結(jié)束開(kāi)始付費(fèi)時(shí)?8June200684HazardFunctioinandSurvivalAnalysis計(jì)算顧客維持利用顧客資歷(tenure)計(jì)算面臨挑戰(zhàn):8J計(jì)算出tenure後即可畫(huà)出顧客維持曲線可顯示出在特定期間內(nèi),顧客維持的比例。累進(jìn)圖表,由100%開(kāi)始若顧客起始點(diǎn)近似,則維持曲線接近於存活曲線。假設(shè)顧客起始點(diǎn)相同,從顧客維持曲線可比較不同族群顧客的顧客維持:從特定時(shí)間點(diǎn)看,看其維持之比例。顧客生命之中位數(shù)(mediancustomerlifetime;customerhalf-life):一半之顧客流失需多久時(shí)間。維持曲線RetentionCurve8June200685HazardFunctioinandSurvivalAnalysis計(jì)算出tenure後即可畫(huà)出顧客維持曲線維持曲線RetentNote顧客生命中位數(shù)無(wú)法解答這段期間顧客之平均價(jià)值是多少?一般顧客優(yōu)質(zhì)顧客利用維持曲線比較顧客不同顧客群8June200686HazardFunctioinandSurvivalAnalysisNote一般顧客優(yōu)質(zhì)顧客利用維持曲線比較顧客不同顧客群8J平均顧客資歷

AverageTenureAveragetenure=Averageremaininglifetime=TruncatedMeanlifetime無(wú)法計(jì)算「真正」的平均生命,除非所有的顧客均離開(kāi)。因此特定時(shí)間內(nèi)的平均生命,統(tǒng)計(jì)學(xué)家稱為截距式平均生命8June200687HazardFunctioinandSurvivalAnalysis平均顧客資歷

AverageTenureAveraget1020/10201/10平均顧客資歷:特定期間內(nèi),位於維持曲線下方的面積8June200688HazardFunctioinandSurvivalAnalysis1020/10201/10平均顧客資歷:特定期間內(nèi),位於維Example:顧客價(jià)值的計(jì)算一般顧客平均資歷優(yōu)質(zhì)顧客平均資歷每年平均顧客價(jià)值=$100一般顧客平均生命=3.7年,10-year顧客價(jià)值:$100*3.7=$370優(yōu)質(zhì)顧客平均生命=6.1年,10-year顧客價(jià)值:$100*6.1=$6108June200689HazardFunctioinandSurvivalAnalysisExample:顧客價(jià)值的計(jì)算一般顧客平均資歷優(yōu)質(zhì)顧客平均資好的顧客是鈾,離開(kāi)的顧客是鉛。鈾的衰減量,類似維持曲線。呈指數(shù)衰減:無(wú)論時(shí)間的長(zhǎng)短,元素皆以固定比例衰減。能幫助了解顧客維持概念,但事實(shí)上顧客極少呈現(xiàn)指數(shù)衰減。原因:太簡(jiǎn)單預(yù)測(cè)其未來(lái)現(xiàn)象。無(wú)法呈現(xiàn)顧客忠誠(chéng)度。留下的顧客和離開(kāi)的顧客,並不相同。4.放射性元素之衰減8June200690HazardFunctioinandSurvivalAnalysis好的顧客是鈾,離開(kāi)的顧客是鉛。鈾的衰減量,類似維持曲線。4.危險(xiǎn)Hazards屬無(wú)母數(shù)(non-parametric)之統(tǒng)計(jì)方法可延伸出更有用之存活曲線危險(xiǎn)機(jī)率HazardProbability危險(xiǎn)函數(shù)HazardFunction設(shè)限Censoring8June200691HazardFunctioinandSurvivalAnalysis危險(xiǎn)Hazards屬無(wú)母數(shù)(non-parametric)危險(xiǎn)機(jī)率

HazardProbability定義:假設(shè)某顧客目前tenure為t(即已存活至t),那其在t+1前離開(kāi)的機(jī)率為多少?亦即:t時(shí)之危險(xiǎn)為:t至t+1期間顧客流失之風(fēng)險(xiǎn)。為條件機(jī)率的概念值介於0-1之間計(jì)算公式於t離開(kāi)之顧客人數(shù)所有可能於t離開(kāi)之顧客人數(shù)風(fēng)險(xiǎn)人口(populationatrisk):所有tenure大於或等於t之顧客,亦包含了在t點(diǎn)流失之顧客8June200692HazardFunctioinandSurvivalAnalysis危險(xiǎn)機(jī)率

HazardProbability定義:假設(shè)危險(xiǎn)的例子

U.SLifetable:屬於浴缸型的危險(xiǎn)函數(shù),開(kāi)始時(shí)高,接著急降,然後逐漸攀升在某條件年齡下死亡之機(jī)率tenure8June200693HazardFunctioinandSurvivalAnalysis危險(xiǎn)的例子

U.SLifetable:屬於浴缸型的危2.危險(xiǎn)函數(shù)的型態(tài)ConstantHazard固定型危險(xiǎn)無(wú)論顧客已存在多久時(shí)間,危險(xiǎn)機(jī)率都是一樣的(常數(shù)),在圖表上呈現(xiàn)水平線。顧客離開(kāi)的機(jī)率不隨著顧客維持時(shí)間而改變。類似放射性元素衰減的型態(tài)。BathtubHazard浴缸型危險(xiǎn)開(kāi)始時(shí)很高,接著下降並維持平坦一段時(shí)間,最後Hazard又再次提高。有綁約期間的客戶。早期顧客因產(chǎn)品不適合,或是尚未付費(fèi)而離開(kāi),接著進(jìn)入漫長(zhǎng)的約期,顧客可能因?yàn)檫`約金或履約的義務(wù)而不離開(kāi)。約期結(jié)束後,顧客時(shí)常急於離開(kāi)。(市場(chǎng)改變,投入競(jìng)爭(zhēng)者懷抱,較好的服務(wù)與價(jià)格等)8June200694HazardFunctioinandSurvivalAnalysis2.危險(xiǎn)函數(shù)的型態(tài)ConstantHazard固定型危實(shí)際範(fàn)例一開(kāi)始很高:顧客已經(jīng)簽約,但可能因某些技術(shù)因素而無(wú)法開(kāi)始。某些客戶忘記自己已簽約因而尚未開(kāi)始。M-ShapedFeature

在9及11週出現(xiàn)高峰。1.在兩個(gè)月左右,可能是未繳款。2.在三個(gè)月左右。優(yōu)惠促銷期結(jié)束,顧客認(rèn)為不再需要此服務(wù),很可能又參加另一種優(yōu)惠活動(dòng)緩慢的衰退,表示顧客滯留越久,越不可能離開(kāi)。可能反應(yīng)維持時(shí)間越久顧客的忠誠(chéng)度越高三個(gè)月後,不再有高峰,每隔四到五週,會(huì)有小的高峰週期,這反應(yīng)每月付費(fèi)的週期,消費(fèi)者通常在收到帳單後離開(kāi)。8June200695HazardFunctioinandSurvivalAnalysis實(shí)際範(fàn)例一開(kāi)始很高:顧客已經(jīng)簽約,但可能因某些技術(shù)因素而無(wú)法3.設(shè)限Censoring存活分析中最重要的概念: 為了計(jì)算更精確之危險(xiǎn)機(jī)率時(shí)將某些顧客排除不予計(jì)算在內(nèi)HazardProbability:於T點(diǎn)離開(kāi)之顧客人數(shù)T點(diǎn)之風(fēng)險(xiǎn)人口CENSORED:於T點(diǎn)之前已經(jīng)離開(kāi)的顧客,不可再算為人口(Tenure<T)Tenure=T,但仍然存活者,不能算為人口,因?yàn)樗钥赡茉赥+1之前離去8June200696HazardFunctioinandSurvivalAnalysis3.設(shè)限Censoring存活分析中最重要的概念:於TExample:圖示+計(jì)算白圈圈:顧客已經(jīng)離開(kāi),確實(shí)tenure已知黑圈圈:顧客尚存活,確實(shí)tenure未知,必須設(shè)限36752148June200697HazardFunctioinandSurvivalAnalysisExample:圖示+計(jì)算白圈圈:顧客已經(jīng)離開(kāi),確實(shí)teCustomerCensoredTeunreTime0Time1Time2Time3Time4Time51Y5ActiveActiveActiveActiveActiveActive2N4ActiveActiveActiveActiveStoppedCensored3N3ActiveActiveActiveStoppedCensoredCensored4Y3ActiveActiveActiveActiveCensoredCensored5N2ActiveActiveStoppedCensoredCensoredCensored6Y1ActiveActiveCensoredCensoredCensoredCensored7N1ActiveStoppedCensoredCensoredCensoredCensoredTime0Time1Time2Time3Time4Time5Active764311Stopped011110Censored002356Hazard0/(0+7)=0%1/(1+6)=14%1/(1+4)=20%1/(1+3)=25%1/(1+1)=50%0/(0+1)=0%8June200698HazardFunctioinandSurvivalAnalysisCustomerCensoredTeunreTime0Tim其它設(shè)限型態(tài)競(jìng)爭(zhēng)風(fēng)險(xiǎn)CompetingRisk:必須針對(duì)每種風(fēng)險(xiǎn)發(fā)展出不同之Hazard例如:顧客離去的原因可分成:自願(yuàn)離去強(qiáng)制離去8June200699HazardFunctioinandSurvivalAnalysis其它設(shè)限型態(tài)競(jìng)爭(zhēng)風(fēng)險(xiǎn)CompetingRisk:8Ju被強(qiáng)制驅(qū)離的顧客,應(yīng)標(biāo)示Censored而不是Stopped8June2006100HazardFunctioinandSurvivalAnalysis被強(qiáng)制驅(qū)離的顧客,應(yīng)標(biāo)示Censored而不是StoppedFromHazardtoSurvival

由“危險(xiǎn)”推導(dǎo)“存活”維持曲線由危險(xiǎn)函數(shù)推導(dǎo)更為精準(zhǔn)的存活曲線8June2006101HazardFunctioinandSurvivalAnalysisFromHazardtoSurvival

由“危險(xiǎn)”推維持曲線

--顯示出特定期間內(nèi)顧客維持的比例方法:一星期前開(kāi)始之顧客:衡量一星期之維持狀況二星期前開(kāi)始之顧客:衡量二星期之維持狀況以此類推…….8June2006102HazardFunctioinandSurvivalAnalysis維持曲線

--顯示出特定期間內(nèi)顧客維持的比例方法:8Jun呈“鋸齒狀”之維持曲線維持曲線可能會(huì)有許多鋸齒狀。1.十星期的維持竟然比九星期高2.顧客生命中位數(shù)竟然不只一個(gè)原因:顧客起始點(diǎn)不同不同時(shí)段所獲得的顧客品質(zhì)(好壞)不同不同時(shí)間行銷活動(dòng)的差異,吸引不同品質(zhì)的顧客。8June2006103HazardFunctioinandSurvivalAnalysis呈“鋸齒狀”之維持曲線維持曲線可能會(huì)有許多鋸齒狀。1.存活(survival):Hazards:顧客在某特定時(shí)間點(diǎn)上可能離開(kāi)的機(jī)率。Survival:顧客存活至某特定時(shí)間點(diǎn)的機(jī)率。Caculation:S(t)=S(t–1)*(1–h(t–1))S(0)=100%(所有的顧客在分析開(kāi)始時(shí)都是存活的。)Note:存活值介於0和1。但存活本身不斷的變小,因?yàn)槊總€(gè)接續(xù)的值,都乘以一個(gè)小於1的數(shù)。因此生存曲線由100%開(kāi)始,慢慢的下降,有時(shí)平坦,但絕對(duì)不會(huì)上升。8June2006104HazardFunctioinandSurvivalAnalysis存活(survival):Hazards:顧客在某特定時(shí)間存活曲線(SurvivalCurve)較平滑較精準(zhǔn)逐漸下降8June2006105HazardFunctioinandSurvivalAnalysis存活曲線(SurvivalCurve)較平滑8Jun比例危險(xiǎn)

ProportionalHazards範(fàn)例分層(Stratification)Cox比例危險(xiǎn)回歸比例危險(xiǎn)的限制8June2006106HazardFunctioinandSurvivalAnalysis比例危險(xiǎn)

ProportionalHazards範(fàn)例8創(chuàng)始者:SirDavidCox研究Hazards的零時(shí)共變數(shù)TimeZeroCovariates(即初始因子)時(shí),假設(shè)這些因素對(duì)於Hazards的影響具有一致的比例,且不隨時(shí)間改變,因此能夠測(cè)量出不同因素的影響。8June2006107HazardFunctioinandSurvivalAnalysis創(chuàng)始者:SirDavidCox8June200629範(fàn)例吸煙者罹患白血病的風(fēng)險(xiǎn)是非吸煙者的1.53倍。初始狀態(tài):研究者知道對(duì)象是不是吸煙者(範(fàn)例中忽略已戒菸者)。只有兩種初始因子必須考慮,可以只看Hazards曲線並取得整體危險(xiǎn)的平均。8June2006108HazardFunctioinandSurvivalAnalysis範(fàn)例吸煙者罹患白血病的風(fēng)險(xiǎn)是非吸煙者的1.53倍。8Jun電話行銷與DM行銷顧客流失的危險(xiǎn)機(jī)率(HazardsProbabilities)初始狀態(tài):如何成為顧客?(電話行銷或是Dm)電話行銷的危險(xiǎn)比DM多了將近兩倍。8June2006109HazardFunctioinandSurvivalAnalysis電話行銷與DM行銷顧客流失的危險(xiǎn)機(jī)率(HazardsPro分層(Stratification)定義測(cè)量初始因子對(duì)存活的影響由初始狀態(tài)定義不同族群的量測(cè)方式,每一群都獨(dú)立分析。有好的視覺(jué)效果,並能產(chǎn)生精確的存活值。不同族群顧客的Hazard機(jī)率,可以分別繪製危險(xiǎn)(Hazards)機(jī)率曲線,並產(chǎn)生存活(Survival)曲線。使用1-Year存活(1-YearSurvival)、Median存活或平均截距資歷,表現(xiàn)出差異。8June2006110HazardFunctioinandSurvivalAnalysis分層(Stratification)定義8June200分層的假設(shè)(限制)初始的影響必須是類別變數(shù)。處理連續(xù)變數(shù)時(shí),需拆解為不連續(xù)的區(qū)塊(Chunk)。每個(gè)群組都必須很大。當(dāng)有興趣的變數(shù)很多時(shí),分類的數(shù)量會(huì)增加的很快,則危險(xiǎn)(Hazard)會(huì)越來(lái)越不可靠。8June2006111HazardFunctioinandSurvivalAnalysis分層的假設(shè)(限制)8June200633HazardCox比例危險(xiǎn)迴歸

CoxProportionalHazardsCox比例危險(xiǎn)可以使用類別/連續(xù)變數(shù)表示危險(xiǎn)因子,並計(jì)算這種比例。電話行銷的離開(kāi)(Attrition)危險(xiǎn)較DM行銷多了1.5倍。(類別)每增加一個(gè)包裝年(Pack-Year)罹患直腸癌的危險(xiǎn)增加6.7個(gè)百分比。(連續(xù))可以估算出類別以及連續(xù)共變數(shù)的影響。包裝年:量測(cè)個(gè)人長(zhǎng)時(shí)間吸煙量的方式,例如,1個(gè)包裝年相當(dāng)於一年之中美天吸煙1包,2個(gè)包裝年相當(dāng)於半年之中,每天吸煙1包....。8June2006112HazardFunctioinandSurvivalAnalysisCox比例危險(xiǎn)迴歸

CoxProportionalHaz偏概度(PartialLikelihood)假設(shè)只有一個(gè)顧客在T時(shí)間停止,那麼時(shí)間T的偏概度就是正好某位特定顧客a停止的Likelihood。偏概度若所有顧客的危險(xiǎn)率(HazardRates)均相等,偏概度是常數(shù)(該時(shí)間點(diǎn),個(gè)體除以population)。但危險(xiǎn)並不是常數(shù),且通常是初始狀態(tài)的某種函數(shù)呈現(xiàn)。8June2006113HazardFunctioinandSurvivalAnalysis偏概度(PartialLikelihood)8June假設(shè)初始狀態(tài)一致地(常數(shù)n)影響所有的危險(xiǎn)(Hazards),和時(shí)間無(wú)關(guān)-這和分層的假設(shè)相同。危險(xiǎn)(Hazards)出現(xiàn)於乘以初始狀況為基礎(chǔ)的複雜算式的分子與分母中。由於相互約分,剩下的就是包含複雜初始狀況的複雜公式。8June2006114HazardFunctioinandSurvivalAnalysis假設(shè)8June200636HazardFunctioi計(jì)算某一特定群體的概度(Likelihood)群體中每個(gè)偏概度相乘統(tǒng)計(jì)學(xué)利用最大概數(shù)法估計(jì),可以找到使結(jié)果最可能發(fā)生的參數(shù),這種參數(shù)可以用來(lái)表現(xiàn)初始狀態(tài)對(duì)Hazards的影響。可以處理連續(xù)及類別變數(shù)。8June2006115HazardFunctioinandSurvivalAnalysis計(jì)算某一特定群體的概度(Likelihood)8June參考資料最大概數(shù)估算(MaximumLikelihoodEstimation)FindLikelihoodFunctionTaking

8June2006116HazardFunctioinandSurvivalAnalysis參考資料最大概數(shù)估算(MaximumLikelihood比例危險(xiǎn)的限制將時(shí)間視為連續(xù)的概念比例危險(xiǎn)回歸常處理不連續(xù)時(shí)間的危險(xiǎn)假設(shè)只有一位顧客在特定時(shí)間停止比例危險(xiǎn)回歸常處理同一時(shí)間有多個(gè)人停止。假設(shè)初始狀況對(duì)危險(xiǎn)的影響,不會(huì)隨著時(shí)間影響實(shí)際上初始狀況很少具有這樣完美的比例性(即使在科學(xué)研究)。行銷並非受到控制的實(shí)驗(yàn),事物總是不斷的變遷。8June2006117HazardFunctioinandSurvivalAnalysis比例危險(xiǎn)的限制將時(shí)間視為連續(xù)的概念8June200639雖然沒(méi)有簡(jiǎn)單的算術(shù)可以解釋初始狀態(tài)對(duì)不同時(shí)間的影響,但事實(shí)上通常沒(méi)有太大的差異。即使假設(shè)具有比例性,Cox回歸仍可以判定哪些共變異數(shù)對(duì)危險(xiǎn)有最重大的影響??山忉尯畏N初始狀況和顧客離去具有相關(guān)性。8June2006118HazardFunctioinandSurvivalAnalysis雖然沒(méi)有簡(jiǎn)單的算術(shù)可以解釋初始狀態(tài)對(duì)不同時(shí)間的影響,但事實(shí)上Cox方式是為零時(shí)共變數(shù)而設(shè)計(jì),統(tǒng)計(jì)學(xué)家稱為初始值(InitialValue)可延伸處理發(fā)生於顧客生命期之中的事件-如升級(jí)他們的產(chǎn)品,或是產(chǎn)生抱怨。在統(tǒng)計(jì)術(shù)語(yǔ)中,這些是依時(shí)相依性共變數(shù)(Time-dependentCovariance)附加的因子能夠在顧客資歷期間的任何時(shí)間點(diǎn)出現(xiàn),而不只是在關(guān)係的開(kāi)始而已。這種因子可能是顧客對(duì)於維持活動(dòng)的回應(yīng),或是抱怨。8June2006119HazardFunctioinandSurvivalAnalysisCox方式是為零時(shí)共變數(shù)而設(shè)計(jì),統(tǒng)計(jì)學(xué)家稱為初始值(Init存活分析之應(yīng)用處理不同型態(tài)的離開(kāi)(Attrition)顧客何時(shí)回來(lái)預(yù)測(cè)隨時(shí)間改變的危險(xiǎn)8June2006120HazardFunctioinandSurvivalAnalysis存活分析之應(yīng)用處理不同型態(tài)的離開(kāi)(Attrition)8J處理不同型態(tài)的離開(kāi)(Attrition)傳統(tǒng)作法企圖將被迫離去的顧客整個(gè)由危險(xiǎn)計(jì)算中移除,這是一種錯(cuò)誤的方式問(wèn)題點(diǎn):必須等到顧客已經(jīng)被強(qiáng)制停止之後,才知道哪些顧客必須被移除。但在之前,這筆資料一直被算在風(fēng)險(xiǎn)人口中。使用顧客關(guān)係結(jié)束所得到的知識(shí)來(lái)進(jìn)行顧客分析,並不是一種很好的方式。8June2006121HazardFunctioinandSurvivalAnalysis處理不同型態(tài)的離開(kāi)(Attrition)傳統(tǒng)作法8June正確的方法將問(wèn)題拆開(kāi)為自願(yuàn)離開(kāi)的危險(xiǎn)與強(qiáng)制離開(kāi)的危險(xiǎn)。使用所有顧客資料,並設(shè)限(Censoring)因其他因素離開(kāi)的顧客。計(jì)算自願(yuàn)耗損的危險(xiǎn):當(dāng)顧客被強(qiáng)制要求離去顧客離去之前,包含在分析裡面自離去的時(shí)間之後,被設(shè)限。因?yàn)楫?dāng)顧客被要求離去的時(shí)間點(diǎn),他並不是出於自願(yuàn)離去。8June2006122HazardFunctioinandSurvivalAnalysis正確的方法8June200644HazardFunct顧客何時(shí)回來(lái)評(píng)估失而復(fù)得的顧客時(shí),將危險(xiǎn)視為顧客在離開(kāi)數(shù)日後重返的機(jī)率。存活曲線(上方曲線)與危險(xiǎn)(下方曲線)-行動(dòng)電話顧客8June2006123HazardFunctioinandSurvivalAnalysis顧客何時(shí)回來(lái)評(píng)估失而復(fù)得的顧客時(shí),將危險(xiǎn)視為顧客在離開(kāi)數(shù)日後初始的回復(fù)比例很高。第一周有超過(guò)1/3的顧客回復(fù)。許多顧客只是來(lái)不及付清帳單。超過(guò)90天後,危險(xiǎn)接近於0,沒(méi)有顧客失而復(fù)得。電話號(hào)碼為顧客保留三個(gè)月。維持退租復(fù)租的[風(fēng)險(xiǎn)]8June2006124HazardFunctioinandSurvivalAnalysis初始的回復(fù)比例很高。第一周有超過(guò)1/3的顧客回復(fù)。許多顧客只確定新(失而復(fù)得)顧客與停止顧客之間的關(guān)係在這個(gè)例子中使用顧客id(行動(dòng)電話號(hào)碼)。保守有效,但有可能遺漏了願(yuàn)意享有新客戶優(yōu)惠的顧客。確認(rèn)個(gè)人資料,即使在一段時(shí)間後,使用不同帳號(hào)??梢杂缮鐣?huì)福利號(hào)碼或駕照號(hào)碼來(lái)連接顧客的資料。8June2006125HazardFunctioinandSurvivalAnalysis確定新(失而復(fù)得)顧客與停止顧客之間的關(guān)係8June20失而復(fù)得顧客的初始共變數(shù)初始:所有已知有關(guān)顧客離去時(shí)的資料。初始產(chǎn)品與促銷離去前的顧客行為。是不是常抱怨、是不是難失而復(fù)得?遊蕩(Roam)的顧客、延遲繳費(fèi)的顧客等。8June2006126HazardFunctioinandSurvivalAnalysis失而復(fù)得顧客的初始共變數(shù)8June200648Hazar了解事件史(Time-To-Event)問(wèn)題客戶一開(kāi)始加入的是低價(jià)計(jì)畫(huà),有多久的時(shí)間他們會(huì)想要升級(jí)到高價(jià)計(jì)畫(huà)?顧客升級(jí)到高價(jià)計(jì)畫(huà),有多久可能會(huì)降級(jí)?由顧客過(guò)去的行為,以及不同的顧客具有不同的購(gòu)買期間,顧客兩次購(gòu)買之間的期待時(shí)間長(zhǎng)度為何?存活分析可以知道不同初始狀況的效果,使用比例危險(xiǎn)可以判定何種共變數(shù)對(duì)期望的成果有最大的影響力。8June2006127HazardFunctioinandSurvivalAnalysis了解事件史(Time-To-Event)問(wèn)題8June2預(yù)測(cè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論