數(shù)據(jù)挖掘論文_第1頁
數(shù)據(jù)挖掘論文_第2頁
數(shù)據(jù)挖掘論文_第3頁
數(shù)據(jù)挖掘論文_第4頁
數(shù)據(jù)挖掘論文_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、.濱 江 學(xué) 院題 目 基于數(shù)據(jù)挖掘的客戶流失問題 院 系 計(jì)算機(jī)系 專業(yè)班級 軟件工程 學(xué)生姓名 許燕 學(xué) 號 20082344908 指導(dǎo)教師 閆雷鳴 二一一年 五 月 二十六 日基于數(shù)據(jù)挖掘的客戶流失問題 摘要:在營銷手段日益成熟的今天,我們的客戶仍然是一個很不穩(wěn)定的群體,因?yàn)樗麄兊氖袌隼骝?qū)動杠桿還是偏向于人、情、理的。如何來提高客戶的忠誠度是現(xiàn)代企業(yè)營銷人一直在研討的問題。關(guān)鍵詞:客戶流失,數(shù)據(jù)挖掘,決策樹,聚類引言:客戶的變動,往往意味著一個市場的變更和調(diào)整,一不小心甚至?xí)植浚▍^(qū)域)市場帶來致命的打擊。這個現(xiàn)象在醫(yī)藥企業(yè)的處方產(chǎn)品中突顯,一個醫(yī)院由一個代表做到一定的銷售量,但是

2、這個醫(yī)藥代表離開后,那么銷量的下滑是很明顯的。如果你是公司的管理者,請務(wù)必在關(guān)鍵時刻擦亮你的眼睛,以免你的客戶在不經(jīng)意間流失,給公司的市場運(yùn)作帶來不利影響。當(dāng)然,這其中的因素和地區(qū)的主管、經(jīng)理也有很大的直接關(guān)系。所以,我們通過數(shù)據(jù)挖掘來分析數(shù)據(jù)挖掘問題。我們也可以對比已有的方法發(fā)現(xiàn)不足之處,然后進(jìn)行改進(jìn)。一、數(shù)據(jù)挖掘數(shù)據(jù)挖掘又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn),是一個利用各種分析工具在海量數(shù)據(jù)中發(fā)現(xiàn)模型和數(shù)據(jù)間關(guān)系的過程, 這些模型和關(guān)系可以用來做出預(yù)測。數(shù)據(jù)挖掘?qū)嵤┑牟襟E一般包括三個部分?jǐn)?shù)據(jù)的準(zhǔn)備、模型的建模型驗(yàn)證圖數(shù)據(jù)挖掘的步驟圖所示的各個步驟并不是線性的, 要取得好的結(jié)果就要不斷重復(fù)這些步驟。在客戶流

3、失分析系統(tǒng)中, 數(shù)據(jù)挖掘只是一小部分, 卻是關(guān)鍵的一個部分, 系統(tǒng)中把數(shù)據(jù)挖掘得到的知識和市場的經(jīng)驗(yàn)、客服的信息結(jié)合起來, 應(yīng)用于數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行流失客戶的預(yù)測、分析, 對確認(rèn)有流失傾向的客戶根據(jù)不同的情況進(jìn)行預(yù)苦處理, 包括套餐資費(fèi)調(diào)整、服務(wù)方式更改、競爭對手調(diào)查等, 同時將預(yù)誓客戶名單通過公司的數(shù)據(jù)交換平臺下發(fā)給各個業(yè)務(wù)分區(qū), 進(jìn)行摸底跟蹤, 實(shí)施關(guān)懷工程。整個系統(tǒng)的業(yè)務(wù)流程如圖所示, 其中流失客戶的預(yù)測和分析是兩個關(guān)鍵的環(huán)節(jié), 需要選擇討, 實(shí)用案例,計(jì)算機(jī)系統(tǒng)應(yīng)用年第期合適的數(shù)據(jù)挖掘算法, 獲取有用的模型和知識應(yīng)用于系統(tǒng)中, 才能進(jìn)行科學(xué)的輔助決策。二、數(shù)據(jù)挖掘在系統(tǒng)中的應(yīng)用流失又分

4、為被動流失和主動流失, 被動流失是因?yàn)榭蛻羟焚M(fèi)或不履行責(zé)任而被移動停機(jī)。主動流失有不同的原因, 一類是客觀原因限制所引起的異動, 如搬遷等, 另一類是客戶主動放棄, 如因?yàn)楦偁帉κ值膬?yōu)惠政策, 對目前的服務(wù)不滿意等。在這些群體中, 那些主動流失的客戶是我們要分析的對象, 在這類群體中, 用戶價值和信用度高的可能流失客戶是我們最關(guān)心的對象, 如果能夠成功預(yù)測出這類將要流失的客戶, 并且能夠成功的挽留這類大客戶, 將給移動公司帶來可觀的利潤。三、基于數(shù)據(jù)挖掘的電信客戶流失分析步驟1、商業(yè)理解商業(yè)理解是從業(yè)務(wù)角度來理解數(shù)據(jù)挖掘的目標(biāo)和要求,再轉(zhuǎn)化為數(shù)據(jù)挖掘問題。本文的目標(biāo)確定為:針對目前在網(wǎng)客戶進(jìn)行

5、流失概率的預(yù)測。電信領(lǐng)域的客戶流失有3 方面的含義3 : 一是指客戶從本電信運(yùn)營商轉(zhuǎn)往到其他的電信運(yùn)營商; 二是指客戶使用的手機(jī)品牌發(fā)生改變, 從本電信運(yùn)營商的高價值品牌轉(zhuǎn)向低價值品牌; 三是指客戶月平均消費(fèi)量降低, 從高價值客戶成為低價值客戶。在以上3 類客戶流失中,第一類是客戶流失分析的重點(diǎn),本文將第一類作為分析的對象。而在第一類客戶中,又可具體將其分為被動停機(jī)3 個月、主動退網(wǎng)和注銷用戶。2、數(shù)據(jù)理解。數(shù)據(jù)理解包括收集原始數(shù)據(jù)、數(shù)據(jù)描述、數(shù)據(jù)探索分析和數(shù)據(jù)質(zhì)量描述。(1) 收集原始數(shù)據(jù)當(dāng)進(jìn)行數(shù)據(jù)挖掘時,首先要從企業(yè)數(shù)據(jù)倉庫中取出一個與要搜索問題相關(guān)的數(shù)據(jù)子集。該問題的數(shù)據(jù)來源是某電信公司

6、某年度1 月7 月在某地區(qū)的數(shù)據(jù)。(2) 數(shù)據(jù)描述信息類別數(shù)據(jù)源時間窗口流失 自然用戶 屬性相關(guān) 行為信息 屬性在網(wǎng) 自然用戶 屬性相關(guān) 行為信息 屬性USER_BASIC_INFOUSER_BEHAVIOR_INFOUSER_BASIC_INFOUSER_BEHAVIOR_INFO某年7月某年1月、2月、3月某年7月某年7月某年4月、5月、5月、6月某年7月(3) 數(shù)據(jù)探索分析。在使用收集到的原始數(shù)據(jù)之前,必須要保證所有數(shù)據(jù)在數(shù)量和質(zhì)量上符合要求。在數(shù)據(jù)探索階段,對獲取的各變量進(jìn)行分析探索,選擇對目標(biāo)變量的影響相對較大的關(guān)鍵變量。此處,通過可視化的方式來展現(xiàn),即利用Clementine 中的

7、分布圖節(jié)點(diǎn)展示用戶流失狀態(tài)在每個變量上的分布圖。從各分布圖得出,用戶的自然屬性,例如性別、年齡等信息缺失值比較多,且存在較多的非法數(shù)據(jù),所以在本文的分析中,不選該類變量,該類變量不參與建模。另外,像通話次數(shù)、通話時長等變量和客戶流失概率之間存在著反比關(guān)系,即該類變量的值越大,則客戶流失的概率相對來說就越小,所以在接下來的分析中,應(yīng)該將該類變量或與該類變量相關(guān)的導(dǎo)出值作為分析的重點(diǎn)。通過上面對樣本數(shù)據(jù)變量的數(shù)據(jù)探索工作,對各變量屬性有了基本的了解,可以有針對性地選擇適用變量或?qū)σ恍┳兞窟M(jìn)行過濾。3. 數(shù)據(jù)準(zhǔn)備。數(shù)據(jù)準(zhǔn)備階段初步完成變量的選擇和導(dǎo)出變量的生成,同時對一些存在數(shù)據(jù)質(zhì)量問題的字段進(jìn)行相

8、應(yīng)的處理。在本次客戶流失分析過程中,對數(shù)據(jù)的處理過程包括以下幾個方面:(1) 整合數(shù)據(jù)。首先將流失客戶的行為信息進(jìn)行整合。為了便于后續(xù)建模,將行為信息按月份進(jìn)行拆分與合并,并通過計(jì)算均值和比率來表示流失用戶在流失前的消費(fèi)行為突變情況。具體計(jì)算方法如下:FEE A V G = ( FEE 1 + FEE 2) / 2FEE ADD RA T E = ( FEE 3 +FEE A V G) / FEE A V G其中FEE 1 表示流失用戶1 月份的消費(fèi)額;FEE 2 表示流失用戶2 月份的消費(fèi)額; FEE 3 表示流失用戶3 月份的消費(fèi)額; FEE A V G表示流失用戶在前2 個月的消費(fèi)額平均

9、; FEE ADDRA T E 表示3 月的消費(fèi)額占其前2 個月消費(fèi)額平均值的比率,該指標(biāo)反映了用戶在離網(wǎng)前的消費(fèi)行為突變情況。其次將現(xiàn)有在網(wǎng)客戶的行為信息進(jìn)行整合。整合方法同上。最后,將用戶自然屬性和行為屬性進(jìn)行整合。整合時將流失用戶信息和在網(wǎng)用戶信息分開進(jìn)行整合。流失用戶的用戶信息與其行為特征數(shù)據(jù)進(jìn)行合并,在網(wǎng)用戶的用戶信息與其行為特征數(shù)據(jù)進(jìn)行整合。整合之將其拆分成訓(xùn)練集和測試集。訓(xùn)練集用于訓(xùn)練模型,測試集用于對模型進(jìn)行檢驗(yàn)。(2) 清洗數(shù)據(jù)。在數(shù)據(jù)探索分析階段,通過觀察各變量分布圖,我們得到了性別和年齡這2 個存在大量缺失值的字段,且通過變量分布圖,發(fā)現(xiàn)這2 個字段對于目標(biāo)字段的分布沒有

10、顯著影響,即客戶流失在這2個字段上的分布不存在顯著的差異,所以可以對這2 個字段采用過濾的操作。此外,對于在網(wǎng)狀態(tài)字段,由于某些原因,可能有極少數(shù)屬性值丟失了。對于這部分丟失的值,可以加上默認(rèn)值,假設(shè)為在網(wǎng)狀態(tài),或者直接過濾掉。而不能將丟失的數(shù)據(jù)默認(rèn)為離網(wǎng),因?yàn)殡x網(wǎng)的記錄在整個記錄中比例過小,如果把丟失的記錄直接加到離網(wǎng)中,勢必會影響整個模型的可信度。相比而言,丟失的記錄與在網(wǎng)記錄比只是很小的一部分,不會影響大的趨勢。當(dāng)然,在不同的建模過程中,對于不同的原始數(shù)據(jù)集,對相同字段的處理是存在差異的。(3) 構(gòu)造屬性。從數(shù)據(jù)集中得到的原始字段,并不是所有的都適合直接用來建模分析,例如,以上在整合數(shù)據(jù)

11、階段,利用導(dǎo)出節(jié)點(diǎn),我們得到了消費(fèi)額平均值字段和消費(fèi)額增長率字段,并使用這些字段來對客戶流失的情況做出更好的預(yù)測。可見,在數(shù)據(jù)準(zhǔn)備過程中,各個階段之間是沒有明確的界限的,各個階段是交叉進(jìn)行,并不斷重復(fù)的過程,只有通過這種方式,才能得到我們所需要的用于建模的數(shù)據(jù)。(4) 選擇數(shù)據(jù)。選擇數(shù)據(jù)過程包括字段的選擇和記錄的選擇。在從業(yè)務(wù)系統(tǒng)獲得的數(shù)據(jù)中會有許多字段是和分析無關(guān)的,這些字段在數(shù)據(jù)整合過程中被過濾掉。另外,從實(shí)際情況上看,國內(nèi)電信企業(yè)每月的客戶流失率一般在1 %3 % ,如果直接采用決策樹模型,可能會因?yàn)閿?shù)據(jù)概率太小而導(dǎo)致模型的失效,因此我們需要加大客戶流失在總樣本中的比例,但是這種過度抽樣

12、必須謹(jǐn)慎小心,要充分考慮它的負(fù)面效應(yīng)。4. 建立模型。運(yùn)用數(shù)據(jù)準(zhǔn)備階段得到的訓(xùn)練集,并利用決策樹對客戶流失概率進(jìn)行預(yù)測。決策樹方法是一種從機(jī)器學(xué)習(xí)中引出的一種較為通用并被深入研究的分類函數(shù)逼近方法,在本文中運(yùn)用Clementine 中的C5. 0 算法。該算法速度快、內(nèi)存占用小、修剪能力和交互驗(yàn)證的特征能夠使預(yù)測更精確。(1) C5. 0 決策樹算法原理。將原始數(shù)據(jù)中的ON TA G和OU T TA G合并為僅含2 個變量, 即離網(wǎng)與不離網(wǎng)的新字段客戶是否流失CHU RN 。將CHU RN 作為目標(biāo)字段, 計(jì)算與CHU RN 相關(guān)的字段的信息增益的大小,按照由大到小的順序?qū)v史數(shù)據(jù)進(jìn)行分類,最

13、后得到歷史數(shù)據(jù)的n 個集合, 每個集合滿足一定的規(guī)律。當(dāng)新記錄需要該模型對其確定CHURN 的值,則看其字段滿足哪條規(guī)律。設(shè)S 是訓(xùn)練樣本數(shù)據(jù)集, 該數(shù)據(jù)集中有m 個獨(dú)立的類,記為Ci ( i = 1 ,2 , , m) 。Ri 為數(shù)據(jù)集S中屬于Ci 類的子集, ri 表示Ri 中元組的數(shù)量。集合S 在分類中的期望信息量由以下公式給出4 :期望信息I ( r1 , r2 , , rm) = - mi =1Pilog2 Pi其中Pi = ri/ r ,表示任意一個樣本屬于Ci 類的概率( r 為總樣本個數(shù)、ri 為類Ci 中的樣本個數(shù)) 。若屬性A 有v 個不同的取值,分別為 a1 , a2 ,

14、 av ,根據(jù)屬性A 將數(shù)據(jù)集S 劃分為v 個子集 S 1 , S 2 , , S v ,其中S j 表示S 中A 的值為aj 的那些樣本。如果A 被選為決策屬性,則這些樣本將對應(yīng)該節(jié)點(diǎn)的不同分枝。設(shè)S j 包含類Ci 的樣本有sij個。屬性A 的這種劃分的期望信息稱作A 的熵:E( A ) = vj = 1s1 j + s2 j + + smjs·I ( s1 j , s2 j , , smj)屬性A 作為決策分類屬性的信息增益為Gai n ( A ) = I ( r1 , r2 , , rm) - E( A )本模型中, S 為用以建立模型的客戶集, 將客戶集S 分為兩個類: 在

15、網(wǎng)( C1) 和離網(wǎng)( C2) 。S i ( i = 1 ,2) 分別表示S 中在網(wǎng)和離網(wǎng)的客戶數(shù)。C5. 0 決策樹的工作原理是根據(jù)提供最大信息增益的字段分割樣本。然后通常會根據(jù)不同的字段再次分割由第一次分割定義的每個子樣本,且此過程會重復(fù)下去,直到無法繼續(xù)分割子樣本。最后,將重新檢查最底層分割,并刪除或修剪對模型值沒有顯著貢獻(xiàn)的分割。(2) 模型構(gòu)建。建立數(shù)據(jù)模型的數(shù)據(jù)流程圖如圖1 所示 圖1 中, TRAIN. dat 是數(shù)據(jù)準(zhǔn)備階段得到的訓(xùn)練集。使用Clementine 的C5. 0 建模節(jié)點(diǎn)來建立預(yù)測模型,將“churn”變量設(shè)置為“輸出”,其他變量設(shè)置為“輸入”。決策樹是對這種算法

16、建立分割的簡單描述。每一個終端節(jié)點(diǎn)描述了訓(xùn)練數(shù)據(jù)的一個特定子集,而訓(xùn)練數(shù)據(jù)集中的每一種情況(離網(wǎng)或在網(wǎng)) 恰好屬于樹上的一個終端節(jié)點(diǎn)。以上模型得到的只是對用戶離網(wǎng)狀態(tài)的一個預(yù)測(離網(wǎng)或在網(wǎng)) ,我們所需要得到的不只是其狀態(tài),還要具體地了解其離網(wǎng)的可能性的大小,這樣才能對高離失可能性的客戶展開一定的挽留措施。通過建立導(dǎo)出字段CHURN PROB 來計(jì)算客戶的離網(wǎng)可能性,其計(jì)算公式如下:CHURN PROB = 0. 5 +CC - CHU RN2if C - CHURN = 1CHURN PROB = 0. 5 -CC - CHU RN2if C - CHURN = 0式中: C - CHURN

17、 為CHU RN 字段的預(yù)測值;CC - CHURN 為置信度。最后,將計(jì)算得到的流失概率值按從大到小的順序排列,為后續(xù)的潛在流失客戶的挽留做好準(zhǔn)備工作。5. 模型評估。運(yùn)用分析節(jié)點(diǎn)預(yù)測分析模型的精確性,其結(jié)果如圖2 所示。由圖2 可以看出,模型的正確率為86. 01 %。及價值等因素對客戶進(jìn)行分類,并提供有針對性的產(chǎn)品、服務(wù)和營銷模式。圖3 評估結(jié)果流失分析過程中,我們將預(yù)測的概率按從大到小的順序排列,取前35 %作為高流失概率客戶群,但并不是所有的高流失概率客戶都值得我們?nèi)ネ炝?。如果挽留住的某些客戶帶來的盈利小于客戶回奪時投入的營銷成本,那么該類客戶即不值得運(yùn)營商挽留。從這些高流失概率用戶

18、中過濾掉那些低價值”客戶即FEE(出賬收入) < 50 元的客戶。在高價值客戶里我們也應(yīng)針對不同的客戶制定相應(yīng)的營銷方案,避免付出不必要的挽留成本。本文使用Kohonen 算法對高流失率高價值客戶進(jìn)行聚類分析,得出具有不同特征的客戶群,以便根據(jù)其特征制定相應(yīng)的挽留策略。選取其中的兩類作簡要分析。a. 以本地通話為主,很少有漫游通話和國內(nèi)長途通話, S FEE A V G(平均短信出賬收入) 相對較高, 但最近一個月S FEE ADD RA T E < 0 ,V FEE (語音出賬收入) 呈現(xiàn)明顯下降趨勢。針對這類客戶,運(yùn)營商可以通過贈送短信等方式來挽留客戶。b. 長途通話次數(shù)和長途

19、通話總時長都遠(yuǎn)高于其他用戶,同時本地通話次數(shù)也相對較高,漫游通話次數(shù)很少,很少發(fā)短信息。針對這類高流失概率的用戶,可以通過減免月租費(fèi)、降低長話費(fèi)等方式來吸引并挽留客戶。四、移動電話客戶流失分析( 一) 收集資料為了能夠定量地了解影響移動電話號碼用戶與手機(jī)用戶之間的關(guān)系。我們對此做了一次資料收集。并對數(shù)據(jù)進(jìn)行了數(shù)據(jù)挖掘, 數(shù)據(jù)挖掘的主要框架如圖1 所示。收集資料的內(nèi)容主要包括以下幾個方面的內(nèi)容:1、 移動電話客戶的個人情況, 如年齡、職業(yè)、教育程度、籍貫等;2、 付費(fèi)方式;3、 不同場所移動電話的接收質(zhì)量;4、 電信公司的服務(wù)質(zhì)量;5、 是否更換移動電話服務(wù)商及次數(shù);6、 手機(jī)品牌與型號;7、

20、是否換過手機(jī)及次數(shù);8、 購買手機(jī)優(yōu)先考慮的因素;9、 對于所使用手機(jī)外型、功能等的滿意程度;10、 手機(jī)對電磁輻射的態(tài)度;11、 每月本地話費(fèi)數(shù)量或次數(shù);12、 每月長途話費(fèi)數(shù)量;13、 是否經(jīng)常使用呼叫轉(zhuǎn)移;14、 發(fā)送和接收短信的次數(shù);15、 通話弧度的大小, 即每個月平均與多少個人通話;16、 每月收發(fā)短信息的個數(shù);( 二) 數(shù)據(jù)處理在進(jìn)行數(shù)據(jù)處理的時候, 我們使用STAT IST ICS 軟件進(jìn)行處理, 其中包括如下幾個過程,在這里給出簡要描述。1、 數(shù)據(jù)凈化與處理分析數(shù)據(jù)的原始樣本數(shù)據(jù)為131, 024 筆, 數(shù)據(jù)屬性( 字段) 部分共有33 個項(xiàng)目。因有些樣本數(shù)據(jù)中的項(xiàng)目有過多的

21、缺失值, 不適用于分析, 因此在這個階段會將數(shù)據(jù)作數(shù)據(jù)凈化與處理。步驟如下:步驟一: 將數(shù)據(jù)表中有缺失值的記錄先給予刪除。步驟二: 將數(shù)據(jù)中不分析的屬性刪除, 刪除后所剩樣本為57194 筆。2、 母體與樣本的結(jié)構(gòu)比較為了減少數(shù)據(jù)分析的數(shù)據(jù)量, 提高分析的效率, 我們采用隨機(jī)抽樣方法, 從步驟二中抽取5%的樣本來作分析, 共有2892 筆樣本。當(dāng)然, 在做分析前, 還必須比較樣本是否能夠代表母體的特征, 我們利用性別、年齡、教育程度、職業(yè)以及戶籍來比較母體與樣本的結(jié)構(gòu)是否有差異, 以確定樣本抽樣的無誤。結(jié)果( 數(shù)據(jù)略) 顯示結(jié)構(gòu)比例在統(tǒng)計(jì)意義上無差別。因而可以利用抽樣的數(shù)據(jù)來代表母體數(shù)據(jù)進(jìn)行分

22、析。3、 進(jìn)行數(shù)據(jù)的結(jié)構(gòu)分析數(shù)據(jù)的結(jié)構(gòu)分析, 主要使用交叉列聯(lián)表的方法來進(jìn)行。分析的主要內(nèi)容是研究更換手機(jī)與人口結(jié)構(gòu)的關(guān)系, 更換號碼與人口結(jié)構(gòu)的關(guān)系。我們利用Pearson 的卡方檢驗(yàn)( Yates 修正) 進(jìn)行卡方分析, 分析結(jié)果如下:性別教育程度職業(yè)卡方值p. 值卡方值p. 值卡方值p . 值換過手機(jī)64. 6736 0.0000 3. 5377 0. 1705 113.0173 0. 0000換過號碼22. 3073 0.0000 0. 358 0. 8361 30.7756 0. 0002從結(jié)果可以看出, 從性別與職業(yè)角度看, 不同性別與不同職業(yè)的人都對換手機(jī)和換號碼都有顯著影響,

23、而從教育程度, 教育程度的不同并不影響人們的換手機(jī)和換號碼。從分析結(jié)果我們還知道( 數(shù)據(jù)列表略) , 男性換手機(jī)和號碼的人數(shù)比例要明顯大于女性。在職業(yè)方面, 電信運(yùn)營商換過手機(jī)和換過號碼的比例都是最高的, 換手機(jī)比例最低的是失業(yè)退休人員, 換過號碼比例最低的是專業(yè)技術(shù)人員, 其次是退休人員。4、 聚類分析( k- means 聚類)( 1) 電話號碼的聚類分析表1􀀁 兩類的典型代表Cluster 1 Cluster2室內(nèi)信號質(zhì)量1􀀁834574 1􀀁831028室外信號質(zhì)量1􀀁940957 1􀀁91600

24、8郊外信號質(zhì)量1􀀁837766 1􀀁911067車上信號質(zhì)量1􀀁968617 1􀀁988142通話清晰度1􀀁995745 2􀀁433794計(jì)費(fèi)方式2􀀁502128 3􀀁084980服務(wù)效率2􀀁041489 3􀀁459486服務(wù)態(tài)度1􀀁751596 4􀀁497036整體品質(zhì)1􀀁940957 2􀀁936759􀀁 表2𙦙

25、7; 兩類之間的歐氏距離NO. 1 NO. 2NO. 1 0􀀁000000 1􀀁230863NO. 2 1􀀁109443 0􀀁000000􀀁 表3􀀁 方差分析Between df Within Df F signif.室內(nèi)信號質(zhì)量0. 008 1 533. 658 2890 0. 045 0. 832355室外信號質(zhì)量0. 410 1 236. 307 2890 5. 008 0. 025303郊外信號質(zhì)量3. 535 1 911. 515 2890 11. 207 0. 000825車

26、上信號質(zhì)量0. 251 1 319. 006 2890 2. 272 0. 131828通話清晰度126. 237 1 1948. 530 2890 187. 231 0. 000000計(jì)費(fèi)方式223. 490 1 3660. 683 2890 176. 438 0. 000000服務(wù)效率1322. 789 1 3372. 103 2890 1133. 673 0. 000000服務(wù)態(tài)度4958. 655 1 1683. 986 2890 8509. 875 0. 000000整體品質(zhì)652. 357 1 2662. 399 2890 708. 126 0. 000000( 2) 手機(jī)型號的聚

27、類分析( 三) 結(jié)果分析針對所收集數(shù)據(jù), 以換過號碼做為主要變量, 利用CHAID 分析方法進(jìn)行分析, 發(fā)現(xiàn)其中性別、年齡、永籍及職業(yè)四個人口統(tǒng)計(jì)變量在區(qū)隔數(shù)據(jù)上有顯著影響, 將資料做適當(dāng)?shù)膮^(qū)隔, 根據(jù)CHAID 分析方法所區(qū)隔出的各群, 找出各群中不同的趨勢、特征及各群之間的相關(guān)性, 還可以建立判別模式進(jìn)行預(yù)測。( 四) 營銷建議數(shù)據(jù)挖掘的目的是從數(shù)據(jù)中發(fā)掘客戶價值, 因此分析結(jié)果只有應(yīng)用到企業(yè)的實(shí)際營銷策略中, 并給企業(yè)帶來顯著的利潤, 才是資料挖掘的初衷。對移動服務(wù)提供商來說, 利用數(shù)據(jù)挖掘的結(jié)果還要綜合考慮企業(yè)的自身狀況, 例如, 先弄清楚客戶流失對企業(yè)到底有多大影響??梢韵葘⒖蛻粢镭?/p>

28、獻(xiàn)價值分級, 如果A 級占相當(dāng)比例, 那表示問題就比較嚴(yán)重了, 如果都是C級, 那么也不一定需要花大量的人力、物力和財(cái)力來處理。找出那些A 級流失客戶, 邀請他們來個面對面的深度討論( 如: Focus Group) , 了解他們走失的原因, 如何能改變他們的想法。依照這些原因設(shè)計(jì)改善方案或挽回方案, 立刻聯(lián)系那些已走或快走的人。設(shè)立監(jiān)控機(jī)制紀(jì)錄, 每周或每月份分析所有客戶的RFM( Recency , Frequency, Monetary) 的變動, 隨時找出貢獻(xiàn)度高( M 高的) , 但最近消費(fèi)次數(shù)降低( R 或F) 的人, 先給予問候, 再看看是否有任何不滿意見, 必要時給予一些預(yù)先計(jì)

29、劃好的糖#, 在事發(fā)前就先避免??蛻絷P(guān)系管理對企業(yè)而言乃是將客戶關(guān)系放在企業(yè)經(jīng)營的核心, 規(guī)劃以滿足客戶需求的營銷理念; 而利用數(shù)據(jù)挖掘分析客戶數(shù)據(jù), 有效掌握客戶特性、發(fā)掘客戶價值, 并配合企業(yè)的實(shí)際營銷策略, 才能有效的給企業(yè)帶來顯著的利潤。( 下轉(zhuǎn)第44 頁)68 中文核心期刊􀀁 􀀁 􀀁 􀀁 􀀁 數(shù)理統(tǒng)計(jì)與管理􀀁 􀀁 􀀁 􀀁 24 卷􀀁 1 期􀀁 2005 年1 月􀀁行以中央

30、銀行建立的中央信貸登記為主體的企業(yè)征信評價體系, 并輔以商業(yè)銀行協(xié)會建立的會員制征信機(jī)構(gòu)與商業(yè)性征信機(jī)構(gòu)為主體的企業(yè)征信管理體系。從長期來看, 隨著我國市場經(jīng)濟(jì)和現(xiàn)代企業(yè)制度的逐步完善, 以征信公司的商業(yè)運(yùn)作為主體的企業(yè)征信管理體系應(yīng)該作為我國企業(yè)信用評價體系的基本模式。其次, 在指標(biāo)體系的選擇方面, 不僅要選擇各種財(cái)務(wù)指標(biāo), 還要用管理、人才資源、制度建設(shè)、歷史記錄等指標(biāo)全面考察企業(yè)的信用狀況, 而且還應(yīng)該將企業(yè)放在整個行業(yè)甚至整個國民經(jīng)濟(jì)中考察其信用狀況。只有將行業(yè)指標(biāo)及國民經(jīng)濟(jì)指標(biāo)納入信用評價指標(biāo)體系內(nèi), 才能全面、系統(tǒng)地評估企業(yè)的信用狀況。最后, 在評估模型的選擇方面, 應(yīng)該選擇發(fā)展比較成熟的評估模型。上述幾種模型在實(shí)際應(yīng)用中各有優(yōu)劣, 在實(shí)際操作中應(yīng)該用不同的模型進(jìn)行評估, 然后對各種模型的評估結(jié)果進(jìn)行擬合、檢驗(yàn)與比較, 找出滿意的評估模型。五

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論