數(shù)據(jù)挖掘在電信行業(yè)精準(zhǔn)營(yíng)銷的應(yīng)用研究_第1頁(yè)
數(shù)據(jù)挖掘在電信行業(yè)精準(zhǔn)營(yíng)銷的應(yīng)用研究_第2頁(yè)
數(shù)據(jù)挖掘在電信行業(yè)精準(zhǔn)營(yíng)銷的應(yīng)用研究_第3頁(yè)
數(shù)據(jù)挖掘在電信行業(yè)精準(zhǔn)營(yíng)銷的應(yīng)用研究_第4頁(yè)
數(shù)據(jù)挖掘在電信行業(yè)精準(zhǔn)營(yíng)銷的應(yīng)用研究_第5頁(yè)
已閱讀5頁(yè),還剩76頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第73頁(yè)畢業(yè)論文數(shù)據(jù)挖掘在電信行業(yè)精準(zhǔn)營(yíng)銷的應(yīng)用研究院別專業(yè)名稱班級(jí)學(xué)號(hào)學(xué)生姓名指導(dǎo)教師年月日第PAGEI頁(yè)數(shù)據(jù)挖掘在電信行業(yè)精準(zhǔn)營(yíng)銷的應(yīng)用研究摘要21世紀(jì)以來(lái),快速增長(zhǎng)著的數(shù)據(jù)為企業(yè)和學(xué)者在各個(gè)領(lǐng)域的研究提供了豐富的資源,為了從這些海量數(shù)據(jù)中提取出有用的信息,數(shù)據(jù)挖掘應(yīng)運(yùn)而生;與此同時(shí),越來(lái)越多的企業(yè)意識(shí)到傳統(tǒng)的營(yíng)銷方式已經(jīng)不適合現(xiàn)在的市場(chǎng),企業(yè)紛紛由原來(lái)的以產(chǎn)品和服務(wù)為中心的營(yíng)銷模式轉(zhuǎn)換為以客戶需求為中心的營(yíng)銷模式,因此產(chǎn)生了精準(zhǔn)營(yíng)銷的理念。本文的研究工作涉及兩方面內(nèi)容,一是數(shù)據(jù)挖掘,二是精準(zhǔn)營(yíng)銷,考慮到電信行業(yè)數(shù)據(jù)資源豐富的特點(diǎn),本文即對(duì)二者在電信行業(yè)的應(yīng)用展開研究。首先借助SPSSClementine工具利用數(shù)據(jù)挖掘中的聚類技術(shù),根據(jù)電信行業(yè)用戶的通話時(shí)間、通話次數(shù)、通話習(xí)慣等對(duì)用戶進(jìn)行聚類;其次利用關(guān)聯(lián)規(guī)則算法得出用戶通話規(guī)律之間的關(guān)聯(lián)關(guān)系;最后根據(jù)聚類后的群體特征,對(duì)不同類別的用戶進(jìn)行分類營(yíng)銷,并根據(jù)關(guān)聯(lián)關(guān)系進(jìn)行捆綁銷售和交叉銷售,這兩種方法均實(shí)現(xiàn)了精準(zhǔn)營(yíng)銷,從而達(dá)到提高企業(yè)收益,同時(shí)滿足用戶需求的雙贏目的。關(guān)鍵詞:電信行業(yè),精準(zhǔn)營(yíng)銷,數(shù)據(jù)挖掘,SPSSClementine

ResearchonDataMiningApplicationinTelecommunicationsPreciseMarketingAbstractSincethe21stcentury,thedatagrowingatanunprecedentedrateprovidesawealthofresourcesfortheresearchofenterpriseandscholarsinvariousfields.Inordertoextractusefulinformationfromthesemassivedata,dataminingcameintobeing.Atthesametime,moreandmoreenterpriseshaverealizedthattraditionalmarketingmethodsarenotsuitableforthecurrentmarket,somostofthemaretransformingthemarketingmodelfromtheoriginalproductandservice-centrictocustomer-centric,whichistheprecisemarketing.Thepaperwillfinishtwoparties:First,datamining,andsecond,precisemarketing.Consideringthereisawealthofdataresourcesinthetelecommunicationsindustry,thispaperwillhavearesearchandapplicationaboutthetwomethodsabove-mentionedinthetelecommunicationsindustry.Firstly,thispaperwilluseclusteringalgorithm,oneofthedataminingalgorithms.Thisalgorithmcanmakethetargetdatadividedintoseveralkindsofgroups,whichisbasedonthebehaviorsofcustomerswhentheyusethetelephone.Secondly,thispaperwillusethealgorithmofassociationrulestodiscovertherelationshipbetweentheregularpatternwhenusersusethetelephone.Finally,thispaperachievesprecisemarketingprocessthroughmakingdifferentmarketingstrategybyanalyzingthebasisofclusteringanalysisandassociationrules.Thetwowaysabovearetheso-calledprecisemarketing,andtheybothachieveawin-winofimprovingtheprofitsofenterpriseandmeetingtheneedsofcustomers.Keywords:TelecommunicationsIndustry,PreciseMarketing,DataMining,SPSSClementine.

目錄1緒論 11.1課題來(lái)源及研究背景介紹 11.2研究目的和意義 11.2.1研究目的 11.2.2研究意義 11.3國(guó)內(nèi)外研究現(xiàn)狀 21.4研究?jī)?nèi)容和組織結(jié)構(gòu) 41.4.1主要研究?jī)?nèi)容 41.4.2研究方法 41.4.3論文組織結(jié)構(gòu) 52數(shù)據(jù)挖掘及精準(zhǔn)營(yíng)銷理論基礎(chǔ) 62.1數(shù)據(jù)挖掘基本理論 62.1.1數(shù)據(jù)挖掘定義及過(guò)程 62.1.2數(shù)據(jù)挖掘工具及選擇 72.1.3數(shù)據(jù)挖掘的未來(lái) 92.2精準(zhǔn)營(yíng)銷基本理論 92.2.1精準(zhǔn)營(yíng)銷的概念 92.2.2精準(zhǔn)營(yíng)銷的特點(diǎn) 102.2.3精準(zhǔn)營(yíng)銷的實(shí)施策略 112.3本章小結(jié) 113數(shù)據(jù)挖掘與精準(zhǔn)營(yíng)銷的結(jié)合應(yīng)用 123.1應(yīng)用模型 123.2應(yīng)用領(lǐng)域 143.3應(yīng)用中可能存在的問(wèn)題及對(duì)策 153.4本章小結(jié) 164數(shù)據(jù)挖掘在電信行業(yè)精準(zhǔn)營(yíng)銷的實(shí)例研究 174.1實(shí)例背景介紹 174.2使用方法介紹 174.2.1聚類分析 174.2.2關(guān)聯(lián)規(guī)則發(fā)現(xiàn) 194.3需求分析 204.4數(shù)據(jù)準(zhǔn)備 214.4.1數(shù)據(jù)選擇 224.4.2數(shù)據(jù)預(yù)處理 224.5聚類分析 234.5.1K-means算法 234.5.2TwoStep算法 284.5.3判斷聚類依據(jù) 314.5.4查看用戶歸屬類別 344.6關(guān)聯(lián)規(guī)則分析 354.7制定精準(zhǔn)營(yíng)銷策略 404.7.1細(xì)分客戶 404.7.2交叉銷售和捆綁銷售 414.8本章小結(jié) 42結(jié)論 43致謝 44參考文獻(xiàn) 45附錄 47附錄A 47附錄B 52

第1頁(yè)1緒論1.1課題來(lái)源及研究背景介紹近些年,隨著互聯(lián)網(wǎng)和移動(dòng)終端的發(fā)展,人們對(duì)電信行業(yè)的依賴和需求日益增加,急劇地促進(jìn)了電信行業(yè)的發(fā)展。隨著電信行業(yè)的不斷發(fā)展,電信業(yè)務(wù)有了很大的改變,并且由于許多國(guó)家電信業(yè)的開放和新興技術(shù)的發(fā)展,電信市場(chǎng)正在迅速擴(kuò)張并越發(fā)競(jìng)爭(zhēng)激烈[1]。與此同時(shí),電信行業(yè)的發(fā)展使得電信企業(yè)與客戶的交互也發(fā)生了巨大的變化。因?yàn)榭蛻粲辛烁嗟倪x擇,電信企業(yè)只有深入了解客戶的需求,并為客戶提供精準(zhǔn)的營(yíng)銷服務(wù),更好地滿足客戶物質(zhì)和心理上的雙重需求,才能保留住自己的客戶并吸引更多的客戶。精準(zhǔn)營(yíng)銷在電信行業(yè)的應(yīng)用應(yīng)運(yùn)而生。21世紀(jì)以來(lái),各種快速增長(zhǎng)著的數(shù)據(jù)充斥著人們的生活,但是由于出現(xiàn)了“數(shù)據(jù)豐富,但知識(shí)匱乏”的現(xiàn)象,人們需要一個(gè)強(qiáng)有力的工具對(duì)數(shù)據(jù)進(jìn)行分析,并從大量數(shù)據(jù)中提取出有效的信息即“知識(shí)”,因此產(chǎn)生了數(shù)據(jù)挖掘(DataMining,DM),也稱知識(shí)發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase,KDD)。1.2研究目的和意義1.2.1研究目的本文的目的在于探討數(shù)據(jù)挖掘技術(shù)在電信行業(yè)精準(zhǔn)營(yíng)銷的應(yīng)用,即利用數(shù)據(jù)挖掘中的聚類技術(shù),根據(jù)電信行業(yè)用戶的通話時(shí)間、通話次數(shù)、通話習(xí)慣等對(duì)用戶進(jìn)行聚類,幫助電信企業(yè)對(duì)不同類別的用戶進(jìn)行分類營(yíng)銷,同時(shí)利用關(guān)聯(lián)規(guī)則算法得出用戶通話規(guī)律之間的關(guān)聯(lián)關(guān)系,進(jìn)行捆綁銷售和交叉銷售,這兩種精準(zhǔn)營(yíng)銷方式可以達(dá)到提高企業(yè)收益,同時(shí)滿足用戶需求的雙贏目的。1.2.2研究意義眾所周知,在營(yíng)銷過(guò)程中了解客戶的消費(fèi)習(xí)慣并挖掘其潛在需求,制定出有針對(duì)性的營(yíng)銷策略,就可以有效地增加客戶的終身價(jià)值,提高營(yíng)銷成功的概率[2]。而數(shù)據(jù)挖掘技術(shù)可以很好地滿足上述要求,顯然數(shù)據(jù)挖掘技術(shù)和精準(zhǔn)營(yíng)銷的結(jié)合在任何營(yíng)銷過(guò)程中的應(yīng)用都是意義非凡的。隨著手機(jī)等移動(dòng)終端的不斷發(fā)展,人們對(duì)于移動(dòng)終端的需求和依賴性也日益增長(zhǎng),電信業(yè)在為人類提供便捷、娛樂(lè)的同時(shí)也積累了大量的客戶數(shù)據(jù),這些數(shù)據(jù)無(wú)疑是一筆寶貴的財(cái)富,只有盡早意識(shí)到這一點(diǎn),并利用現(xiàn)代技術(shù)對(duì)這些數(shù)據(jù)加以挖掘和利用,創(chuàng)造出數(shù)據(jù)本身之外的價(jià)值,企業(yè)乃至整個(gè)行業(yè)才能擁有自己的核心競(jìng)爭(zhēng)力。同時(shí),隨著現(xiàn)代生活水平的不斷提高,各行各業(yè)競(jìng)爭(zhēng)壓力巨大,各式各樣的營(yíng)銷手段鋪天蓋地包圍著人們的生活。原有的營(yíng)銷手段和大眾的營(yíng)銷方式早已讓客戶感到厭倦且不再適應(yīng)市場(chǎng),而精準(zhǔn)營(yíng)銷可以準(zhǔn)確地了解客戶真實(shí)需求,以客戶需求為出發(fā)點(diǎn)設(shè)計(jì)出真正讓客戶滿意的產(chǎn)品,對(duì)不同群體的客戶提供一對(duì)一和差異化的服務(wù),提高企業(yè)利潤(rùn)和降低企業(yè)成本,同時(shí)幫助企業(yè)更好地應(yīng)對(duì)競(jìng)爭(zhēng),脫離“價(jià)格戰(zhàn)”的泥潭[2]。1.3國(guó)內(nèi)外研究現(xiàn)狀目前,數(shù)據(jù)挖掘技術(shù)和知識(shí)已經(jīng)發(fā)展成為計(jì)算機(jī)科學(xué)界乃至各行各業(yè)的研究熱點(diǎn)。國(guó)外數(shù)據(jù)挖掘的最新發(fā)展主要有對(duì)知識(shí)發(fā)現(xiàn)方法的進(jìn)一步研究,如近年來(lái)提出多種對(duì)Bayes(貝葉斯)方法和Boosting方法的研究和改進(jìn);KDD與數(shù)據(jù)庫(kù)的緊密結(jié)合等。數(shù)據(jù)挖掘的開發(fā)應(yīng)用也得到許多計(jì)算機(jī)公司和研究機(jī)構(gòu)的高度重視[3]。例如由IBM公司研究開發(fā)的多任務(wù)數(shù)據(jù)挖掘系統(tǒng)Quest面向大型數(shù)據(jù)庫(kù)系統(tǒng),包括序列模式、相似序列、關(guān)聯(lián)規(guī)則和分類規(guī)則等[4]。國(guó)內(nèi)相比于國(guó)外對(duì)數(shù)據(jù)挖掘開始研究的時(shí)間較晚,研究成果也沒(méi)有國(guó)外成熟。當(dāng)前,我國(guó)對(duì)于數(shù)據(jù)挖掘的研究項(xiàng)目多是政府資助進(jìn)行的,如國(guó)家自然科學(xué)基金,九八五計(jì)劃等[3]。數(shù)據(jù)挖掘是一個(gè)多學(xué)科領(lǐng)域,它融合了多種最新技術(shù)的研究成果,其應(yīng)用領(lǐng)域得到了廣泛的拓展,精準(zhǔn)營(yíng)銷便是一個(gè)很好的實(shí)例。通過(guò)學(xué)校圖書館各類相關(guān)書籍、電子期刊數(shù)據(jù)庫(kù)等多種渠道查找國(guó)內(nèi)外相關(guān)論文資料,尤其重視對(duì)相關(guān)博士、碩士?jī)?yōu)秀畢業(yè)論文的參考學(xué)習(xí),整理出本次論文的參考文獻(xiàn),并以此為基礎(chǔ)完成本次論文寫作。通過(guò)對(duì)參考資料的研究,以及對(duì)“中國(guó)知網(wǎng)”提供的文獻(xiàn)數(shù)量進(jìn)行統(tǒng)計(jì),可以發(fā)現(xiàn),數(shù)據(jù)挖掘相關(guān)論文以及數(shù)據(jù)挖掘技術(shù)在各行業(yè)精準(zhǔn)營(yíng)銷應(yīng)用的相關(guān)論文數(shù)量隨年遞增。圖1.1和1.2顯示了在“中國(guó)知網(wǎng)”數(shù)據(jù)庫(kù)分別以“數(shù)據(jù)挖掘”和“數(shù)據(jù)挖掘和精準(zhǔn)營(yíng)銷”為關(guān)鍵字搜索出的文獻(xiàn)數(shù)量隨年份增長(zhǎng)的趨勢(shì)??梢钥闯觯?-10年,國(guó)內(nèi)學(xué)者對(duì)這兩種技術(shù)的研究在文獻(xiàn)數(shù)量上有了突飛猛進(jìn)的發(fā)展。圖1.1“數(shù)據(jù)挖掘”相關(guān)文獻(xiàn)數(shù)量變化圖圖1.2“數(shù)據(jù)挖掘和精準(zhǔn)營(yíng)銷”相關(guān)文獻(xiàn)數(shù)量變化圖但是,數(shù)據(jù)挖掘技術(shù)與精準(zhǔn)營(yíng)銷結(jié)合應(yīng)用的相關(guān)論文多為高校教師和學(xué)生撰寫,利用這兩種技術(shù)在商業(yè)和企業(yè)中解決實(shí)際問(wèn)題的實(shí)質(zhì)性論文較少,說(shuō)明目前國(guó)內(nèi)在該方向的研究主要基于高校的假想性研究。同樣以高校發(fā)表論文為主,近些年也出現(xiàn)了利用數(shù)據(jù)挖掘技術(shù)設(shè)計(jì)與實(shí)現(xiàn)精準(zhǔn)營(yíng)銷的信息系統(tǒng),如浙江大學(xué)陳秋陽(yáng)發(fā)表的《基于數(shù)據(jù)挖掘技術(shù)的精準(zhǔn)營(yíng)銷系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)》。1.4研究?jī)?nèi)容和組織結(jié)構(gòu)1.4.1主要研究?jī)?nèi)容本論文主要的研究?jī)?nèi)容如下:1、數(shù)據(jù)挖掘理論數(shù)據(jù)挖掘作為本論文核心研究工具,是本論文的主要研究?jī)?nèi)容之一。它是一個(gè)包括問(wèn)題界定、數(shù)據(jù)收集與預(yù)處理、數(shù)據(jù)挖掘過(guò)程執(zhí)行以及對(duì)結(jié)果的分析和解釋,最后得出合理結(jié)論的綜合性、系統(tǒng)性過(guò)程。2、數(shù)據(jù)挖掘算法挖掘算法眾多,每一種算法在不同應(yīng)用方面都有其獨(dú)有的優(yōu)勢(shì)。針對(duì)本文的實(shí)際情況,選擇了聚類算法中的K-means和TwoStep兩種算法及關(guān)聯(lián)規(guī)則中的Apriori算法,利用聚類和關(guān)聯(lián)規(guī)則兩種不同的思路對(duì)用戶數(shù)據(jù)進(jìn)行處理。3、電信行業(yè)的精準(zhǔn)營(yíng)銷理論模型有了強(qiáng)有力的工具,就要應(yīng)用在生活中去解決實(shí)際的問(wèn)題。在經(jīng)歷了傳統(tǒng)營(yíng)銷之后,精準(zhǔn)營(yíng)銷的優(yōu)勢(shì)越來(lái)越明顯,結(jié)合電信行業(yè)數(shù)據(jù)資源豐富的特點(diǎn),本文即以電信行業(yè)的精準(zhǔn)營(yíng)銷為主要研究?jī)?nèi)容。1.4.2研究方法本文在借鑒多篇國(guó)內(nèi)外相關(guān)文獻(xiàn)的基礎(chǔ)上,選擇了聚類技術(shù)和關(guān)聯(lián)規(guī)則作為前期技術(shù)對(duì)客戶進(jìn)行精準(zhǔn)營(yíng)銷,基于該思路,本文采用了以下研究方法:1、理論學(xué)習(xí)的方法由于自身所學(xué)知識(shí)限制,進(jìn)行論文寫作前對(duì)數(shù)據(jù)挖掘和精準(zhǔn)營(yíng)銷的知識(shí)只是有大概的了解。通過(guò)閱讀大量文獻(xiàn)和相關(guān)書籍,了解了數(shù)據(jù)挖掘和精準(zhǔn)營(yíng)銷的基本理論,為論文的完成做好了前期準(zhǔn)備。2、比較分析的方法一方面,在確定K-means聚類數(shù)目時(shí),比較分析了當(dāng)聚類數(shù)目分別為3、4、5、6、7時(shí)的迭代次數(shù),在選擇TwoStep聚類數(shù)目時(shí),比較分析了自動(dòng)確定和手動(dòng)確定兩種方式,從而確定了最佳聚類數(shù)目。另一方面,對(duì)K-means和TwoStep兩種方法聚類后的標(biāo)準(zhǔn)差進(jìn)行比較,最終選擇了K-means聚類結(jié)果對(duì)用戶進(jìn)行分類。3、建模的方法本文通過(guò)創(chuàng)建K-means、TwoStep及Apriori模型對(duì)數(shù)據(jù)進(jìn)行挖掘,根據(jù)模型結(jié)果制定精準(zhǔn)營(yíng)銷策略。1.4.3論文組織結(jié)構(gòu)各章的安排內(nèi)容如下:第一章是緒論,介紹了課題的研究背景、研究目的及意義,國(guó)內(nèi)外的研究現(xiàn)狀以及行文結(jié)構(gòu);第二章是理論基礎(chǔ),對(duì)數(shù)據(jù)挖掘和精準(zhǔn)營(yíng)銷的基本理論進(jìn)行闡述;第三章將數(shù)據(jù)挖掘與精準(zhǔn)營(yíng)銷兩種方法相結(jié)合,介紹了二者結(jié)合后的應(yīng)用模型、應(yīng)用領(lǐng)域、應(yīng)用過(guò)程中可能存在的問(wèn)題及對(duì)策;第四章為本文的核心部分,即借助實(shí)例完成數(shù)據(jù)挖掘和精準(zhǔn)營(yíng)銷的過(guò)程;結(jié)論總結(jié)了在本次論文完成過(guò)程中我所做的工作,并對(duì)下一步工作進(jìn)行了展望。

2數(shù)據(jù)挖掘及精準(zhǔn)營(yíng)銷理論基礎(chǔ)2.1數(shù)據(jù)挖掘基本理論2.1.1數(shù)據(jù)挖掘定義及過(guò)程近些年來(lái),隨著各行各業(yè)的不斷發(fā)展,人們?cè)谌粘I钪挟a(chǎn)生的數(shù)據(jù)以前所未有的速度增長(zhǎng)著,但出現(xiàn)了“數(shù)據(jù)豐富,而知識(shí)匱乏”的現(xiàn)象。因此需要一個(gè)強(qiáng)有力的數(shù)據(jù)分析工具從海量數(shù)據(jù)和大量繁雜信息中提取出對(duì)人們有用的知識(shí)。由此數(shù)據(jù)挖掘相應(yīng)的研究逐步展開。就技術(shù)層面來(lái)說(shuō),數(shù)據(jù)挖掘最權(quán)威同時(shí)也是最常見的定義是“數(shù)據(jù)挖掘就是從大量不完全的、隨機(jī)的、模糊的、有噪聲的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程”[5]。其中隨機(jī)性是指事件發(fā)生與否的不確定性,而模糊是指事物本身從屬概念的不確定性。由于數(shù)據(jù)挖掘已經(jīng)被廣泛應(yīng)用于現(xiàn)代商業(yè)的各個(gè)領(lǐng)域,因此可以將數(shù)據(jù)挖掘理解為一種新的商業(yè)信息處理技術(shù),其重點(diǎn)是對(duì)商業(yè)數(shù)據(jù)庫(kù)中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和模型化處理,從中得出關(guān)鍵性數(shù)據(jù),以輔助商業(yè)決策。知識(shí)發(fā)現(xiàn)的過(guò)程如圖2.1所示。圖2.1數(shù)據(jù)挖掘流程圖根據(jù)紀(jì)希禹主編的《數(shù)據(jù)挖掘技術(shù)應(yīng)用案例》一書中介紹,數(shù)據(jù)挖掘的四個(gè)過(guò)程描述如下[6]:1、問(wèn)題界定任何研究都是在一個(gè)特定的背景下展開的,數(shù)據(jù)挖掘也不例外。在數(shù)據(jù)挖掘之前首先要對(duì)挖掘的目的進(jìn)行分析和界定。比如本文是在電信行業(yè)中利用數(shù)據(jù)挖掘技術(shù)達(dá)到精準(zhǔn)營(yíng)銷的目的,而精準(zhǔn)營(yíng)銷的方式有很多,如本文使用的細(xì)分客戶和捆綁銷售,因此本文著重采用了數(shù)據(jù)挖掘方法中的聚類和關(guān)聯(lián)規(guī)則技術(shù)。2、數(shù)據(jù)準(zhǔn)備階段數(shù)據(jù)準(zhǔn)備階段包括對(duì)數(shù)據(jù)進(jìn)行選擇、集成、清洗等工作,這是由于數(shù)據(jù)挖掘要處理的數(shù)據(jù)來(lái)自不同的數(shù)據(jù)源,并且有大量噪聲數(shù)據(jù)和冗余數(shù)據(jù)。數(shù)據(jù)準(zhǔn)備階段在數(shù)據(jù)挖掘過(guò)程中起著十分關(guān)鍵的作用,因?yàn)閿?shù)據(jù)準(zhǔn)備是數(shù)據(jù)挖掘工作的基礎(chǔ)。3、數(shù)據(jù)挖掘階段通過(guò)數(shù)據(jù)準(zhǔn)備階段的一系列操作,基本上就可以擁有一個(gè)高質(zhì)量、可操作的數(shù)據(jù)集合了。下面就該進(jìn)行最核心的步驟——數(shù)據(jù)挖掘了。通過(guò)問(wèn)題界定可以確定數(shù)據(jù)挖掘要發(fā)現(xiàn)的任務(wù)是什么,由此判斷屬于哪種挖掘類型,并選擇合適的數(shù)據(jù)挖掘算法和工具。目前流行的數(shù)據(jù)挖掘工具有很多,如SAS、SPSS等,這些都是國(guó)外經(jīng)典的數(shù)據(jù)挖掘工具,算法齊全,實(shí)用性高。中國(guó)也有一些自主知識(shí)產(chǎn)權(quán)的軟件,如MSMiner[7]。最后,利用工具,按照選擇的算法在數(shù)據(jù)集合中完成數(shù)據(jù)挖掘的操作。4、結(jié)果評(píng)價(jià)經(jīng)過(guò)數(shù)據(jù)挖掘的一系列過(guò)程,得出的結(jié)果應(yīng)有助于決策,如將所有用戶進(jìn)行聚類并針對(duì)不同類別的用戶實(shí)施不同的營(yíng)銷手段。對(duì)挖掘結(jié)果的評(píng)價(jià)依賴于此次挖掘的任務(wù),由本領(lǐng)域的專家對(duì)所挖掘結(jié)果的實(shí)用性和有效性進(jìn)行評(píng)價(jià)。經(jīng)過(guò)專家或機(jī)器的評(píng)估后,將不滿足任務(wù)的結(jié)果返回到前面的步驟去反復(fù)處理,直到挖掘出有效、準(zhǔn)確的知識(shí);另外如果在數(shù)據(jù)挖掘的過(guò)程中發(fā)現(xiàn)數(shù)據(jù)不能產(chǎn)生期望的結(jié)果,則要重新處理數(shù)據(jù)甚至重新選擇數(shù)據(jù)。總之,數(shù)據(jù)挖掘是一個(gè)需要不斷反饋與改進(jìn)的閉環(huán)過(guò)程。2.1.2數(shù)據(jù)挖掘工具及選擇數(shù)據(jù)挖掘理論的不斷發(fā)展使得數(shù)據(jù)挖掘工具得到廣泛應(yīng)用,只有通過(guò)合適的工具才能從海量的數(shù)據(jù)中提取出人們想要的信息,得到人們想要的結(jié)論,將理論付諸實(shí)踐。事實(shí)上,數(shù)據(jù)挖掘工具有很多如SASEnterpriseMiner、IntelligentMiner、Darwin等,在此僅對(duì)本文使用的工具SPSSClementine進(jìn)行介紹[8]。SPSS是一款功能齊全且強(qiáng)大的統(tǒng)計(jì)工具,包含數(shù)據(jù)錄入、整理、分析及數(shù)據(jù)探索、發(fā)布和集成等功能,適用于多種操作系統(tǒng),支持腳本功能,支持多種數(shù)據(jù)類型,鼓勵(lì)人工參與和改進(jìn),比較容易掌握,性價(jià)比較高。Clementine是SPSS公司的代表產(chǎn)品,擁有功能強(qiáng)大的數(shù)據(jù)挖掘算法和良好的用戶界面。圖2.2和2.3分別是該軟件12.0版本的啟動(dòng)界面和主界面。圖2.2SPSSClementine12.0啟動(dòng)界面圖2.3SPSSClementine12.0主界面那么如何在眾多工具中選擇最適合自己的是一個(gè)企業(yè)或?qū)W者在數(shù)據(jù)挖掘之前必須要考慮的,同時(shí)這是一個(gè)非常具有挑戰(zhàn)性的工作,因?yàn)楣ぞ叩倪x擇決定了數(shù)據(jù)挖掘結(jié)果的質(zhì)量。由于各個(gè)公司的技術(shù)水平、文化背景、財(cái)務(wù)水平都不盡相同,對(duì)數(shù)據(jù)挖掘的要求和目的也不盡相同,到目前為止,可供參考的權(quán)威評(píng)估標(biāo)準(zhǔn)少之又少,因此一般可從兩個(gè)角度考慮,一個(gè)是工具的角度,另一則是從公司的角度。從工具的角度來(lái)說(shuō)[8]:應(yīng)考慮數(shù)據(jù)挖掘工具的功能、簡(jiǎn)易性、開放性及可視化是否能滿足用戶需求;從公司的角度來(lái)說(shuō)[9],要考慮公司的數(shù)據(jù)挖掘需求時(shí)間長(zhǎng)短,公司的數(shù)據(jù)狀態(tài)、預(yù)算以及數(shù)據(jù)挖掘經(jīng)驗(yàn)和水平等。然而,上述介紹的這些標(biāo)準(zhǔn)都是一些比較權(quán)威和常見的,至于具體到一個(gè)企業(yè)到底選擇何種數(shù)據(jù)挖掘工具還要具體問(wèn)題具體分析,判斷的標(biāo)準(zhǔn)當(dāng)然也不止局限于此,要結(jié)合企業(yè)自身各個(gè)方面的條件和要求綜合考評(píng)選擇一款性價(jià)比最高的軟件進(jìn)行數(shù)據(jù)挖掘,從而為企業(yè)創(chuàng)造更多未知的價(jià)值,這才是數(shù)據(jù)挖掘真正的目的。2.1.3數(shù)據(jù)挖掘的未來(lái)就目前來(lái)看,數(shù)據(jù)挖掘的研究熱點(diǎn)主要包括以下幾點(diǎn):生物信息或基因的數(shù)據(jù)挖掘及其文本的數(shù)據(jù)挖掘、網(wǎng)站的數(shù)據(jù)挖掘。目前數(shù)據(jù)挖掘已成功應(yīng)用于社會(huì)生活的各個(gè)方面,大多數(shù)研究者目前采用的有效技術(shù)是將多種理論與方法的合理整合,相比來(lái)說(shuō),數(shù)據(jù)挖掘未來(lái)的發(fā)展趨勢(shì)主要體現(xiàn)在以下幾個(gè)方面:探索數(shù)據(jù)挖掘過(guò)程中的可視化方法,即人機(jī)交互;網(wǎng)絡(luò)與分布式環(huán)境下的KDD問(wèn)題;數(shù)據(jù)挖掘語(yǔ)言的標(biāo)準(zhǔn)化描述;數(shù)據(jù)挖掘與數(shù)據(jù)庫(kù)系統(tǒng)和Web數(shù)據(jù)庫(kù)系統(tǒng)的集成[3];應(yīng)用領(lǐng)域的不斷擴(kuò)充,如在生物醫(yī)學(xué)、電信業(yè)的應(yīng)用;與特定數(shù)據(jù)存儲(chǔ)類型的適應(yīng)問(wèn)題,與數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的緊耦合是未來(lái)數(shù)據(jù)挖掘系統(tǒng)的理想體系結(jié)構(gòu)[10]。2.2精準(zhǔn)營(yíng)銷基本理論2.2.1精準(zhǔn)營(yíng)銷的概念隨著時(shí)代的發(fā)展和科技的不斷進(jìn)步,21世紀(jì)的人們無(wú)論是消費(fèi)理念還是消費(fèi)模式都發(fā)生了巨大的變化,越來(lái)越多的企業(yè)也逐步意識(shí)到傳統(tǒng)的營(yíng)銷方式已經(jīng)不適合現(xiàn)在的市場(chǎng),企業(yè)紛紛由原來(lái)的以產(chǎn)品和服務(wù)為中心的營(yíng)銷模式轉(zhuǎn)換為以客戶需求為中心的營(yíng)銷模式,精準(zhǔn)營(yíng)銷的理念應(yīng)運(yùn)而生。世界級(jí)營(yíng)銷大師菲利普·科特勒在2005年第一次提出精準(zhǔn)營(yíng)銷的概念:“公司需要更精準(zhǔn)、可衡量和高投資回報(bào)的營(yíng)銷溝通,需要更注重結(jié)果和行動(dòng)的營(yíng)銷傳播計(jì)劃,還有越來(lái)越注重對(duì)直接銷售溝通的投資。”這是精準(zhǔn)營(yíng)銷理論的正式起源[11]。該理論一提出,便得到了社會(huì)各界的廣泛關(guān)注和認(rèn)可,各行各業(yè)開始嘗試?yán)迷摾碚撝笇?dǎo)實(shí)踐。通過(guò)長(zhǎng)期實(shí)踐證明,精準(zhǔn)營(yíng)銷可以很好地為客戶提供一對(duì)一和差異化服務(wù),真正實(shí)現(xiàn)在合適的時(shí)間和地點(diǎn)替客戶所想,為客戶所需,增強(qiáng)了產(chǎn)品價(jià)值的適應(yīng)性,為企業(yè)帶來(lái)更大的利益,因此精準(zhǔn)營(yíng)銷能夠很好地實(shí)現(xiàn)企業(yè)與客戶之間的共贏。目前,我國(guó)著名的精準(zhǔn)營(yíng)銷學(xué)者徐海亮提出了一個(gè)比較權(quán)威的定義,他認(rèn)為:“精準(zhǔn)營(yíng)銷就是以精準(zhǔn)定位為核心,依托現(xiàn)代信息技術(shù)手段,建立個(gè)性化的顧客溝通體系,實(shí)現(xiàn)企業(yè)可度量的低成本擴(kuò)張”。由此可知精準(zhǔn)營(yíng)銷必須具備的條件有:精準(zhǔn)定位,可度量和高效益[11]。2.2.2精準(zhǔn)營(yíng)銷的特點(diǎn)精準(zhǔn)營(yíng)銷的概念一經(jīng)提出,便受到了各個(gè)行業(yè)的重視,企業(yè)紛紛嘗試這種營(yíng)銷方式并取得了良好的效果,這是因?yàn)榫珳?zhǔn)營(yíng)銷有非常多的特點(diǎn),下面就幾個(gè)主要方面進(jìn)行討論。1、營(yíng)銷對(duì)象的針對(duì)性精準(zhǔn)營(yíng)銷最大的特點(diǎn)是精準(zhǔn)和準(zhǔn)確,對(duì)目標(biāo)對(duì)象進(jìn)行細(xì)分是實(shí)施精準(zhǔn)營(yíng)銷的前提,選擇對(duì)最有可能購(gòu)買自己產(chǎn)品或服務(wù)的那一部分消費(fèi)者進(jìn)行營(yíng)銷活動(dòng)[11],這樣的針對(duì)性營(yíng)銷大大減少了營(yíng)銷的成本,提高了營(yíng)銷的收益,從而實(shí)現(xiàn)低投資高回報(bào)的營(yíng)銷目的。2、營(yíng)銷效果的可衡量性精準(zhǔn)營(yíng)銷另一個(gè)顯著特點(diǎn)就是對(duì)效果的可衡量和可評(píng)估。就傳統(tǒng)營(yíng)銷方式而言,如電視媒體、平面廣告,由于受眾人數(shù)和對(duì)象無(wú)法確定,營(yíng)銷效果也無(wú)法評(píng)估和改進(jìn)。而在精準(zhǔn)營(yíng)銷方式中,無(wú)論是搜索引擎的競(jìng)價(jià)排名,還是廣告聯(lián)盟等,它們都因事先了解受眾人群的年齡、性別和學(xué)歷等基本信息,對(duì)營(yíng)銷效果可以進(jìn)行較好的評(píng)估,同時(shí)可以根據(jù)評(píng)估結(jié)果改進(jìn)營(yíng)銷策略,從而取得更優(yōu)的效果。3、營(yíng)銷策略的高效性基于以上兩個(gè)特點(diǎn),可以看出精準(zhǔn)營(yíng)銷具有高效性。這種高效性既體現(xiàn)在企業(yè)信息對(duì)目標(biāo)客戶的傳播上,也體現(xiàn)在企業(yè)產(chǎn)品和服務(wù)的銷售上。由于營(yíng)銷之前對(duì)顧客有充分的了解,顧客也更容易接受企業(yè)的產(chǎn)品和服務(wù),使企業(yè)的營(yíng)銷活動(dòng)起到預(yù)期的作用。4、營(yíng)銷過(guò)程的動(dòng)態(tài)性精準(zhǔn)營(yíng)銷的“精準(zhǔn)程度”本身是動(dòng)態(tài)的、相對(duì)的,是指現(xiàn)在的營(yíng)銷方式比過(guò)去更“精準(zhǔn)”了,而未來(lái)會(huì)比現(xiàn)在更“精準(zhǔn)”[12]。2.2.3精準(zhǔn)營(yíng)銷的實(shí)施策略精準(zhǔn)營(yíng)銷發(fā)展至今,實(shí)施策略非常豐富,歸結(jié)起來(lái)可以分為三大類[12]。1、基于數(shù)據(jù)庫(kù)的營(yíng)銷方法進(jìn)行精準(zhǔn)營(yíng)銷的重要基礎(chǔ)是要建立一個(gè)相關(guān)信息比較完備的潛在消費(fèi)者數(shù)據(jù)庫(kù),但由于其耗時(shí)、任務(wù)艱巨,需要企業(yè)持續(xù)努力、不斷積累。企業(yè)如果一時(shí)難以建立起自己的消費(fèi)者數(shù)據(jù)庫(kù),可以參考其他組織的消費(fèi)者數(shù)據(jù)庫(kù),從中選擇滿足企業(yè)自身需要的消費(fèi)者信息,以開展自己的營(yíng)銷活動(dòng)。2、基于互聯(lián)網(wǎng)的營(yíng)銷方法互聯(lián)網(wǎng)的快速發(fā)展使得現(xiàn)代人們生活的方方面面都離不開網(wǎng)絡(luò),相關(guān)企業(yè)可以充分利用這一點(diǎn),通過(guò)研究網(wǎng)民在互聯(lián)網(wǎng)的行為特征,開展針對(duì)性很強(qiáng)的精準(zhǔn)營(yíng)銷活動(dòng)。目前,基于互聯(lián)網(wǎng)的精準(zhǔn)營(yíng)銷方法也有很多,除了門戶網(wǎng)站廣告、博客、E-mail這些常見的方式,也有關(guān)鍵詞搜索、電子優(yōu)惠券、來(lái)電廣告等諸多不常見的方式。3、基于第三方渠道的營(yíng)銷方法在初始階段,一些企業(yè)難以確定自己的潛在消費(fèi)者的特性,但其他成熟的企業(yè)(通常是非競(jìng)爭(zhēng)性企業(yè))可能與自身的潛在客戶群相同。因?yàn)閮蓚€(gè)企業(yè)的產(chǎn)品或服務(wù)雖然不同,但正好針對(duì)相同的目標(biāo)客戶群,如中年女性。這樣通過(guò)第三方的渠道就能夠很好地把握目標(biāo)客戶并展開營(yíng)銷活動(dòng)。這里需要強(qiáng)調(diào)的是精準(zhǔn)營(yíng)銷不是要否定傳統(tǒng)的營(yíng)銷理論和方法,而是要推廣和發(fā)展他們。精準(zhǔn)營(yíng)銷是目前營(yíng)銷界的熱點(diǎn)話題,我們相信隨著各類營(yíng)銷理論的不斷發(fā)展和實(shí)踐,精準(zhǔn)營(yíng)銷的理論也將會(huì)得到更好地闡釋和實(shí)施。2.3本章小結(jié)良好的理論基礎(chǔ)是技術(shù)實(shí)施的有力保障,本章對(duì)數(shù)據(jù)挖掘和精準(zhǔn)營(yíng)銷理論進(jìn)行了詳細(xì)闡述,為后文的寫作打下了扎實(shí)的基礎(chǔ)。數(shù)據(jù)挖掘部分具體介紹了數(shù)據(jù)挖掘的定義及過(guò)程、工具及選擇,以及數(shù)據(jù)挖掘的未來(lái);精準(zhǔn)營(yíng)銷部分闡述了精準(zhǔn)營(yíng)銷的概念、特點(diǎn)和實(shí)施策略。

3數(shù)據(jù)挖掘與精準(zhǔn)營(yíng)銷的結(jié)合應(yīng)用3.1應(yīng)用模型精準(zhǔn)營(yíng)銷相比于傳統(tǒng)粗放型營(yíng)銷方式,營(yíng)銷思維發(fā)生了很大的變化,它是在客戶信息和行為的基礎(chǔ)上,利用數(shù)據(jù)挖掘細(xì)分市場(chǎng)并制定精準(zhǔn)化的營(yíng)銷策略。進(jìn)行精準(zhǔn)營(yíng)銷不但可以幫助企業(yè)節(jié)省營(yíng)銷成本,以低投資高回報(bào)的方式開展?fàn)I銷活動(dòng);更能有效地提升用戶的感知和滿意度,提高企業(yè)的核心競(jìng)爭(zhēng)力。根據(jù)傳統(tǒng)營(yíng)銷策略(如4P、4C理論)的思想,精準(zhǔn)營(yíng)銷模式可以概括為5W營(yíng)銷分析框架,即在恰當(dāng)?shù)臅r(shí)機(jī)(When),將合適的業(yè)務(wù)(Which),通過(guò)正確的渠道(Where),采取正確的行動(dòng)(What),營(yíng)銷給需要的客戶(Who)?!耙钥蛻魹橹行摹钡睦砟钬灤┱麄€(gè)精準(zhǔn)營(yíng)銷過(guò)程,這也是精準(zhǔn)營(yíng)銷的核心所在[12]。事實(shí)上,精準(zhǔn)營(yíng)銷的模型有很多,不同行業(yè)的精準(zhǔn)營(yíng)銷模型都是不同的,電信行業(yè)由于受到資金、人才以及相關(guān)軟件產(chǎn)品等因素的制約,很多企業(yè)目前并沒(méi)有在精準(zhǔn)營(yíng)銷方面建立專門的系統(tǒng)。本文在此介紹一種以數(shù)據(jù)挖掘作為精準(zhǔn)營(yíng)銷的前期技術(shù)且行之有效、簡(jiǎn)單易用的精準(zhǔn)營(yíng)銷模型。模型結(jié)構(gòu)如圖3.1。圖3.1精準(zhǔn)營(yíng)銷模型圖1、需求分析和確定目標(biāo)不同的精準(zhǔn)營(yíng)銷目標(biāo)決定了不同的精準(zhǔn)營(yíng)銷方法和過(guò)程,因此,在進(jìn)行精準(zhǔn)營(yíng)銷之前要對(duì)精準(zhǔn)營(yíng)銷的目標(biāo)進(jìn)行明確界定,是為了降低客戶流失率還是為了挖掘潛在客戶,還是為了提高市場(chǎng)占有率等等。對(duì)于不同的目標(biāo),所采用的數(shù)據(jù)挖掘方法和算法也不同。本文所涉及的領(lǐng)域?yàn)殡娦判袠I(yè),目前這一行業(yè)在國(guó)內(nèi)有著其他行業(yè)不具備的顯著特點(diǎn)即由聯(lián)通、電信、移動(dòng)三大支柱產(chǎn)業(yè)完全壟斷市場(chǎng),三者都擁有各自龐大的客戶群,實(shí)力相當(dāng)、競(jìng)爭(zhēng)激烈,電信企業(yè)紛紛尋求一種方式,想要在留住現(xiàn)有客戶的同時(shí)吸引更多客戶。本文通過(guò)數(shù)據(jù)挖掘的聚類技術(shù)將客戶劃分到不同類別,針對(duì)不同類別的客戶采取不同的營(yíng)銷手段。同時(shí)根據(jù)關(guān)聯(lián)規(guī)則技術(shù)找出用戶通話規(guī)律之間的關(guān)系,為其推薦或定制差異化的產(chǎn)品,讓客戶的需求得到更好地滿足,提高客戶忠誠(chéng)度的同時(shí)吸引更多客戶。2、選擇業(yè)務(wù)變量由于電信行業(yè)自身的特點(diǎn),無(wú)論是企業(yè)還是個(gè)人,每天都在為電信行業(yè)提供著大量的數(shù)據(jù),且由于每個(gè)人的通話習(xí)慣和需求不同,電信行業(yè)涉及的業(yè)務(wù)數(shù)據(jù)極其復(fù)雜,要想選擇有效的變量進(jìn)行數(shù)據(jù)挖掘就需要前期的比較分析和篩選。3、數(shù)據(jù)準(zhǔn)備在確定目標(biāo)變量之后,我們需要對(duì)數(shù)據(jù)樣本進(jìn)行提取,并對(duì)數(shù)據(jù)進(jìn)行清理和預(yù)處理,我們稱之為數(shù)據(jù)準(zhǔn)備階段。之所以要進(jìn)行這步工作,是由于雖然有海量數(shù)據(jù),但是這些數(shù)據(jù)不同于可用的信息,要想完成精準(zhǔn)營(yíng)銷的目標(biāo),需要對(duì)數(shù)據(jù)進(jìn)行篩選,去除噪聲數(shù)據(jù)和冗余數(shù)據(jù),以免影響挖掘結(jié)果。這部分的工作量較大,將占到整個(gè)工作量的50%左右。4、建模和調(diào)優(yōu)數(shù)據(jù)準(zhǔn)備好了,就要實(shí)現(xiàn)挖掘,也就是完成數(shù)據(jù)挖掘最為關(guān)鍵的工作。在這一階段,我們要依照挖掘任務(wù)和目標(biāo)變量的特征,選擇合適的數(shù)據(jù)模型。模型建立之后,需要判斷模型是否有效,判斷規(guī)則要遵循以下原則:(1)達(dá)到最高盈利規(guī)模,我們都知道,營(yíng)銷是市場(chǎng)經(jīng)濟(jì)的產(chǎn)物,而精準(zhǔn)營(yíng)銷更加注重用最低的成本創(chuàng)造最大的價(jià)值,因此只有達(dá)到了最高的盈利規(guī)模才能實(shí)現(xiàn)精準(zhǔn)營(yíng)銷的價(jià)值;(2)目標(biāo)需求有明顯差異,這也是精準(zhǔn)營(yíng)銷的前提所在。只有目標(biāo)客戶群體的需求有明顯差異,進(jìn)行市場(chǎng)細(xì)分才是有意義的;也只有目標(biāo)客戶需求有明顯差異,才便于我們識(shí)別,從而利用數(shù)據(jù)挖掘的聚類方法實(shí)現(xiàn)細(xì)分;(3)市場(chǎng)開發(fā)具有可行性,要開發(fā)市場(chǎng),我們必須能夠接觸到這個(gè)市場(chǎng),對(duì)其施加一定的影響,從而提高市場(chǎng)占有率或者加強(qiáng)客戶忠誠(chéng)度。5、結(jié)果描述和特征歸納數(shù)據(jù)挖掘工具將數(shù)據(jù)挖掘的結(jié)果直接地展現(xiàn)給我們,但要想得出什么樣的結(jié)論需要研究者理性的思維加工過(guò)程,對(duì)結(jié)果進(jìn)行描述。例如在聚類分析中,數(shù)據(jù)挖掘工具只是將全部用戶分類,我們要找出不同群體之間的差異,提煉出關(guān)鍵的要素,即分群的依據(jù),并根據(jù)這些依據(jù)給每個(gè)群起一個(gè)簡(jiǎn)短且能反映該群特征的名字,便于在后續(xù)營(yíng)銷過(guò)程中使用。在電信行業(yè),我們就可以根據(jù)客戶的消費(fèi)特征和消費(fèi)習(xí)慣將客戶分為本地繁忙組,指絕大部分通話業(yè)務(wù)集中在本地,漫游少;漫游組,指通話集中在漫游業(yè)務(wù)上,漫游業(yè)務(wù)量大。6、制定對(duì)應(yīng)的營(yíng)銷策略精準(zhǔn)營(yíng)銷是一個(gè)閉環(huán)循環(huán)過(guò)程。在精準(zhǔn)營(yíng)銷的過(guò)程中,數(shù)據(jù)挖掘技術(shù)對(duì)用戶數(shù)據(jù)進(jìn)行處理只是第一個(gè)步驟,依據(jù)數(shù)據(jù)挖掘結(jié)果制定精準(zhǔn)營(yíng)銷策略并實(shí)施,最終根據(jù)從市場(chǎng)獲得的反饋不斷改進(jìn)營(yíng)銷策略才是完成了整個(gè)精準(zhǔn)營(yíng)銷的過(guò)程。這里反饋是指根據(jù)從營(yíng)銷活動(dòng)執(zhí)行過(guò)程中收集到的數(shù)據(jù)以及客戶的反應(yīng)程度,對(duì)營(yíng)銷活動(dòng)的執(zhí)行、渠道、產(chǎn)生和廣告進(jìn)行評(píng)價(jià),找出有待改進(jìn)和優(yōu)化的地方,總結(jié)在執(zhí)行期間遇到的相關(guān)問(wèn)題及經(jīng)驗(yàn)教訓(xùn),為下一次的營(yíng)銷活動(dòng)奠定良好的基礎(chǔ)。3.2應(yīng)用領(lǐng)域1、潛在用戶挖掘隨著國(guó)內(nèi)外電信市場(chǎng)競(jìng)爭(zhēng)的日趨激烈,各大運(yùn)營(yíng)商為了提高自身核心競(jìng)爭(zhēng)力,已經(jīng)從原來(lái)的被動(dòng)式營(yíng)銷改為主動(dòng)式營(yíng)銷。雖然現(xiàn)在國(guó)內(nèi)電信行業(yè)呈現(xiàn)幾大巨頭企業(yè)完全壟斷市場(chǎng)的局面,各自擁有龐大的客戶群,但從商家頻繁推出各類促銷形式吸引顧客來(lái)看,彼此之間競(jìng)爭(zhēng)是十分激烈的,如何從大量客戶中,挖掘出潛在客戶,將競(jìng)爭(zhēng)對(duì)手的客戶轉(zhuǎn)變?yōu)樽约旱目蛻簦瑪U(kuò)大市場(chǎng)占有率是電信行業(yè)主要考慮的問(wèn)題之一。可通過(guò)建立各類數(shù)據(jù)挖掘預(yù)測(cè)模型,預(yù)測(cè)潛在用戶使用該業(yè)務(wù)的可能性大小,為運(yùn)營(yíng)商實(shí)行主動(dòng)性和精確化營(yíng)銷提供依據(jù)。2、客戶流失預(yù)測(cè)很長(zhǎng)一段時(shí)間,由于我國(guó)各電信運(yùn)營(yíng)商進(jìn)行價(jià)格競(jìng)爭(zhēng),客戶不得不頻繁地更換運(yùn)營(yíng)商,這種現(xiàn)象導(dǎo)致客戶流失成為中國(guó)電信企業(yè)發(fā)展中面臨的一個(gè)日趨嚴(yán)重的問(wèn)題。因此要在客戶流失之前做出相關(guān)預(yù)測(cè),并采取相應(yīng)營(yíng)銷手段挽留客戶??梢岳脭?shù)據(jù)挖掘技術(shù)建立客戶流失預(yù)測(cè)模型,找出即將離開該模型的用戶,也就是即將流失的客戶,并通過(guò)預(yù)測(cè)分析過(guò)程中的相關(guān)數(shù)據(jù)確定用戶類型,依據(jù)此類型的用戶特征采用挽留的營(yíng)銷手段[13]。3、客戶消費(fèi)模式分析由于電信消費(fèi)具有長(zhǎng)期性和持續(xù)性的特點(diǎn),可以對(duì)電信行業(yè)逐日積累的海量客戶數(shù)據(jù),如客戶的個(gè)人信息、歷年來(lái)長(zhǎng)話、市話、集中通話時(shí)段等等數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,從消費(fèi)行為和習(xí)慣等方面對(duì)客戶的消費(fèi)模式展開研究,這樣有利于電信運(yùn)營(yíng)商的營(yíng)銷人員在進(jìn)行營(yíng)銷活動(dòng)時(shí)可以從客戶行為和客戶心理雙重層面上把握客戶的消費(fèi)習(xí)慣和潛在消費(fèi)可能性,也有利于營(yíng)銷人員爭(zhēng)取到更多優(yōu)質(zhì)的客戶資源。4、客戶欺詐行為分析通過(guò)數(shù)據(jù)挖掘技術(shù),不僅可以得出正常的顧客消費(fèi)規(guī)律,也能得到各種騙費(fèi)、欠費(fèi)的行為規(guī)律??衫眠@類數(shù)據(jù)建立一套欠費(fèi)和欺詐行為的規(guī)則庫(kù)。當(dāng)某一客戶的消費(fèi)行為與規(guī)則庫(kù)的某條規(guī)則匹配時(shí),系統(tǒng)就會(huì)提示運(yùn)營(yíng)商提高警惕并采取相關(guān)措施,從而降低損失的風(fēng)險(xiǎn)。3.3應(yīng)用中可能存在的問(wèn)題及對(duì)策1、數(shù)據(jù)質(zhì)量不高電信行業(yè)由于其自身的行業(yè)特點(diǎn),擁有龐大的數(shù)據(jù)資源,但是這些海量的數(shù)據(jù)資源中不乏很多的臟數(shù)據(jù)和缺失數(shù)據(jù),反而一些有用的數(shù)據(jù)無(wú)法收集,例如客戶的基本信息,如性別和年齡[14]。因?yàn)椴煌男詣e和年齡消費(fèi)模式和習(xí)慣必定不同,知道客戶的基本信息可以很好地將廣大用戶進(jìn)行初步分類以輔助后續(xù)營(yíng)銷策略的制定。因此應(yīng)注重?cái)?shù)據(jù)的收集過(guò)程,提高數(shù)據(jù)的收集質(zhì)量,并建立一個(gè)統(tǒng)一的數(shù)據(jù)庫(kù)平臺(tái),為企業(yè)應(yīng)用提供數(shù)據(jù)服務(wù)。值得強(qiáng)調(diào)的是數(shù)據(jù)庫(kù)建設(shè)本身是一個(gè)長(zhǎng)期的、漸進(jìn)的項(xiàng)目,企業(yè)應(yīng)做好持續(xù)努力的準(zhǔn)備。2、缺乏專業(yè)的數(shù)據(jù)建模人員雖然數(shù)據(jù)挖掘已成為近年來(lái)的熱門話題,但電信行業(yè)企業(yè)內(nèi)部即可利用數(shù)據(jù)挖掘技術(shù)解決企業(yè)實(shí)際問(wèn)題的情況并未普及,這是因?yàn)槔脭?shù)據(jù)挖掘方法建模,需要很強(qiáng)的專業(yè)知識(shí),包括數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)以及機(jī)器學(xué)習(xí)等等,另外能否選擇合適的挖掘工具和算法是決定挖掘結(jié)果是否能引導(dǎo)營(yíng)銷人員得出正確結(jié)論的關(guān)鍵因素;與此同時(shí),又需要扎實(shí)的業(yè)務(wù)知識(shí),可以將挖掘結(jié)果進(jìn)行分析比較,從而得出有效的結(jié)論并作用于企業(yè)。因此要求建模人員既要有專業(yè)的數(shù)據(jù)挖掘背景同時(shí)對(duì)企業(yè)的業(yè)務(wù)了然于胸,簡(jiǎn)單地依賴某些數(shù)據(jù)挖掘工具,脫離實(shí)際的應(yīng)用背景,會(huì)使數(shù)據(jù)挖掘的效果事倍功半。因此企業(yè)只有從一開始就有針對(duì)性地培養(yǎng)數(shù)據(jù)挖掘人才,使其具備行業(yè)背景的同時(shí)深知數(shù)據(jù)挖掘原理和操作,才能使數(shù)據(jù)挖掘成功地應(yīng)用于企業(yè)并為自身創(chuàng)造價(jià)值??傊珳?zhǔn)營(yíng)銷是近些年來(lái)營(yíng)銷界熱門的話題,因?yàn)榫珳?zhǔn)營(yíng)銷相比原來(lái)的傳統(tǒng)式營(yíng)銷可以節(jié)約成本,提高效率,擴(kuò)大市場(chǎng)占有率。利用數(shù)據(jù)挖掘技術(shù)進(jìn)行數(shù)據(jù)分析和統(tǒng)計(jì),可以在很大程度上輔助營(yíng)銷策略的制定,這一做法已經(jīng)成為精準(zhǔn)營(yíng)銷領(lǐng)域普遍采取的方法。電信行業(yè)由于其自身行業(yè)特征擁有海量數(shù)據(jù),我們可以充分利用這些數(shù)據(jù),為企業(yè)和行業(yè)創(chuàng)造價(jià)值。3.4本章小結(jié)本章在第二章的基礎(chǔ)上,將兩種概念相結(jié)合,對(duì)二者在電信行業(yè)的結(jié)合應(yīng)用進(jìn)行了理論闡述,具體介紹了二者結(jié)合應(yīng)用的應(yīng)用模型、應(yīng)用領(lǐng)域以及在應(yīng)用過(guò)程中可能出現(xiàn)的問(wèn)題及對(duì)策。本章為第四章的實(shí)例研究提供了理論依據(jù)。

4數(shù)據(jù)挖掘在電信行業(yè)精準(zhǔn)營(yíng)銷的實(shí)例研究4.1實(shí)例背景介紹近些年,移動(dòng)終端的不斷發(fā)展極大地促進(jìn)了世界各地電信業(yè)務(wù)突飛猛進(jìn)的發(fā)展。據(jù)統(tǒng)計(jì),2012年8月,中國(guó)移動(dòng)新增移動(dòng)電話用戶512.2萬(wàn)戶,同比增速-11.34%;中國(guó)電信新增移動(dòng)電話用戶251萬(wàn)戶,同比增長(zhǎng)-3.09%;中國(guó)聯(lián)通新增移動(dòng)電話用戶340.5萬(wàn)戶,同比增長(zhǎng)44.04%。就該數(shù)據(jù)來(lái)看,在新增用戶中中國(guó)移動(dòng)仍然占較大比重,達(dá)到46.85%,但這一比重呈下滑趨勢(shì)。研究中國(guó)電信行業(yè)用戶消費(fèi)行為,并提供精準(zhǔn)化的營(yíng)銷服務(wù),降低客戶流失率的同時(shí)增強(qiáng)客戶忠誠(chéng)度,成為目前電信行業(yè)亟待解決的問(wèn)題。本文的實(shí)例研究以2012年中國(guó)某地區(qū)移動(dòng)用戶的通話記錄作為原始數(shù)據(jù)集,該數(shù)據(jù)集包含了共65500個(gè)用戶的個(gè)人信息和長(zhǎng)達(dá)六個(gè)月的通話記錄。本文將利用這些數(shù)據(jù)進(jìn)行聚類和關(guān)聯(lián)規(guī)則兩種數(shù)據(jù)挖掘方法,根據(jù)挖掘結(jié)果制定有針對(duì)性的營(yíng)銷策略,從而實(shí)現(xiàn)精準(zhǔn)營(yíng)銷的過(guò)程,而精準(zhǔn)營(yíng)銷可以很好地幫助電信行業(yè)解決降低客戶流失率和增強(qiáng)客戶忠誠(chéng)度的問(wèn)題。4.2使用方法介紹在整個(gè)數(shù)據(jù)挖掘過(guò)程中最為關(guān)鍵的便是數(shù)據(jù)挖掘算法,而算法的選擇取決于挖掘的目的和任務(wù)。從任務(wù)層面來(lái)說(shuō),常見的數(shù)據(jù)挖掘技術(shù)主要分為三類,分別是關(guān)聯(lián)規(guī)則發(fā)現(xiàn),分類分析以及聚類分析。下面分別結(jié)合本文使用的算法予以簡(jiǎn)要介紹。4.2.1聚類分析聚類分析是指將一個(gè)集合劃分成為由相似的對(duì)象組成的對(duì)象類(即簇)的一個(gè)過(guò)程,聚類分析也稱為群分析[15]。它與分類有一個(gè)明顯不同的特點(diǎn),即分類中數(shù)據(jù)的類別是已知的,通過(guò)這些數(shù)據(jù)類型構(gòu)建模型并對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè);而聚類中所有的數(shù)據(jù)類型以及有幾個(gè)數(shù)據(jù)類型都是未知的,要對(duì)所有對(duì)象進(jìn)行分組,而分組的依據(jù)是對(duì)象之間的相似程度。最終使得一個(gè)組內(nèi)的數(shù)據(jù)對(duì)象盡可能相似,而不同組中的數(shù)據(jù)對(duì)象不相似[16]。1、K-means聚類算法K-means算法是最為經(jīng)典的聚類算法之一。該算法是把對(duì)象集合X劃分為一組聚類{C1,C2,...,Ck},這里k是最終的聚類個(gè)數(shù)。首先隨機(jī)選取初始聚類中心,通過(guò)計(jì)算各個(gè)點(diǎn)到初始聚類中心的距離對(duì)所有數(shù)據(jù)點(diǎn)進(jìn)行分類,然后計(jì)算每個(gè)聚類的平均值調(diào)整聚類中心,以此不斷地迭代循環(huán)。最終使每個(gè)對(duì)象歸屬一個(gè)類,并滿足同一類內(nèi)的對(duì)象盡可能相似,類間對(duì)象不相似。通常,采用目標(biāo)函數(shù)是平方誤差函數(shù),見公式4.1。E=i=1kp∈c這里,E是表示數(shù)據(jù)集中所有對(duì)象的平方誤差和,p為一個(gè)數(shù)據(jù)對(duì)象,mi是聚類Ci的中心,這個(gè)目標(biāo)函數(shù)使得生成的簇盡可能地緊湊和獨(dú)立。K-means聚類算法用流程圖和示意圖分別表示為圖4.1和圖4.2。圖4.1K-means算法流程圖K-means算法之所以成為聚類的經(jīng)典算法,主要因?yàn)槠渌惴ê?jiǎn)潔、快速的優(yōu)點(diǎn)。另外,這種算法面對(duì)大規(guī)模數(shù)據(jù)集時(shí)具有較高的效率,這正好符合本文涉及行業(yè)的特點(diǎn)。但是這種算法有一個(gè)很大的缺點(diǎn),就是要求事先人為地給出要生成的簇的數(shù)目并指定各聚類的中心。由于初始聚類中心的選擇對(duì)聚類效果有較大的影響,如果選擇不合適,會(huì)出現(xiàn)局部最優(yōu)解,而這是我們不希望得到的結(jié)果。圖4.2K-means算法示意圖2、TwoStep聚類算法這里所指的TwoStep聚類算法是二階段群集算法(TwoStepCluster)的簡(jiǎn)寫。二階段群集算法是一種分層群集算法,目前多用于資料統(tǒng)計(jì)采礦與多元統(tǒng)計(jì)的交叉領(lǐng)域,其算法適合于任何尺度的變數(shù)。此算法可自動(dòng)確定類的數(shù)目,也能由使用者自己設(shè)定聚類數(shù)目,能夠處理連續(xù)變量和分類變量的混合數(shù)據(jù)。TwoStep算法是分前后兩步進(jìn)行的,也即“兩步”或“二階段”的意義所在。第一步使用的是分層群集中針對(duì)大樣本群集產(chǎn)生的Birch算法,將樣本分成許多子類。該算法是傳統(tǒng)分層群集算法的改進(jìn),其實(shí)質(zhì)是層次群集方法與其他群集方法相結(jié)合的多階段群集。第二步使用對(duì)數(shù)似然函數(shù)作為距離測(cè)量公式,利用第一步的結(jié)果對(duì)每個(gè)樣本再次群集,對(duì)在一定范圍的每個(gè)群集成員計(jì)算一些判別值,并用來(lái)估計(jì)類的最初數(shù)目。我們常用的算法是分層群集算法。4.2.2關(guān)聯(lián)規(guī)則發(fā)現(xiàn)關(guān)聯(lián)規(guī)則發(fā)現(xiàn)是另一類數(shù)據(jù)挖掘算法。關(guān)聯(lián)規(guī)則的挖掘是在數(shù)據(jù)庫(kù)中發(fā)現(xiàn)數(shù)據(jù)間強(qiáng)關(guān)聯(lián)特征的模式,目的是以有效的方式提取最有趣的模式[17]。關(guān)聯(lián)規(guī)則在市場(chǎng)營(yíng)銷領(lǐng)域主要可以解決精準(zhǔn)營(yíng)銷的兩類問(wèn)題:一是交叉銷售,即對(duì)用戶進(jìn)行產(chǎn)品推薦;二是捆綁銷售,即分析哪些商品在一起銷售更好,著名的“啤酒與尿布”就是這類問(wèn)題的典型應(yīng)用。Apriori是關(guān)聯(lián)規(guī)則最經(jīng)典的算法之一。其基本思想是首先從事件集中尋找所有頻繁出現(xiàn)的事件子集,然后在這些頻繁事件子集中發(fā)現(xiàn)可信度較高的規(guī)則。關(guān)聯(lián)規(guī)則有兩個(gè)重要的評(píng)價(jià)指標(biāo):支持度和可信度。支持度是指事物A、B同時(shí)發(fā)生的可能性,用來(lái)衡量關(guān)聯(lián)規(guī)則的重要性程度。而可信度是指事物A發(fā)生的同時(shí)B發(fā)生的可能性,用來(lái)衡量關(guān)聯(lián)規(guī)則的準(zhǔn)確度。圖4.3為Apriori算法流程圖。圖4.3Apriori算法流程圖4.3需求分析開發(fā)任何項(xiàng)目之前,都要進(jìn)行需求分析,數(shù)據(jù)挖掘因涉及的項(xiàng)目領(lǐng)域、工具、算法眾多,更加需要需求分析。一個(gè)標(biāo)準(zhǔn)的數(shù)據(jù)挖掘需求分析模型應(yīng)由功能、數(shù)據(jù)和方法三部分組成,在此結(jié)合本文研究實(shí)例進(jìn)行分析:1、功能部分既是目標(biāo)又是結(jié)果。本文的目標(biāo)是對(duì)電信用戶進(jìn)行精準(zhǔn)營(yíng)銷,一般來(lái)說(shuō)精準(zhǔn)營(yíng)銷的內(nèi)容包括:客戶流失預(yù)測(cè)、潛在客戶挖掘、客戶欺詐行為分析等;2、任何一個(gè)數(shù)據(jù)挖掘模型都離不開數(shù)據(jù)部分。數(shù)據(jù)的準(zhǔn)備和預(yù)處理是產(chǎn)生真實(shí)有效的挖掘模式的保證;3、方法部分是模型的核心部分。通過(guò)功能部分可以清楚地知道數(shù)據(jù)挖掘的目標(biāo)和期望得到的結(jié)果,由此決定選擇哪一種挖掘方法。本文希望對(duì)不同消費(fèi)特征的用戶采取精準(zhǔn)營(yíng)銷策略,因此首先需要將海量客戶進(jìn)行區(qū)分,而由于事先難以確定各類客戶的特征,這里選用了無(wú)監(jiān)督模式的聚類分析。在聚類分析中,本文采用了K-means和TwoStep兩種算法。同時(shí)為了挖掘客戶通話規(guī)律之間的關(guān)聯(lián)關(guān)系,又采用了關(guān)聯(lián)規(guī)則算法中最為經(jīng)典的Apriori算法。4.4數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備是數(shù)據(jù)挖掘過(guò)程中非常重要的環(huán)節(jié),因?yàn)樵谠撾A段要將最初的、未加工的原始數(shù)據(jù)轉(zhuǎn)換為最終可以進(jìn)行數(shù)據(jù)挖掘的數(shù)據(jù)集,而優(yōu)質(zhì)的數(shù)據(jù)集是數(shù)據(jù)挖掘的基礎(chǔ)和保障。數(shù)據(jù)準(zhǔn)備階段工作量較大,占到整個(gè)數(shù)據(jù)挖掘過(guò)程中工作量的50%左右。4.4.1數(shù)據(jù)選擇據(jù)挖掘數(shù)據(jù)部分的第一個(gè)步驟是數(shù)據(jù)選擇,也稱為數(shù)據(jù)獲取。數(shù)據(jù)選擇是指初步獲取數(shù)據(jù)挖掘過(guò)程中所用的數(shù)據(jù)集合,目的是選擇挖掘任務(wù)的操作對(duì)象,即目標(biāo)數(shù)據(jù)。數(shù)據(jù)選擇的方法有很多,在本文實(shí)例中,如果能夠從實(shí)際生活中直接獲取到某一地區(qū)電信運(yùn)營(yíng)商在某一階段的真實(shí)通信數(shù)據(jù),則能夠?qū)?shù)據(jù)挖掘的結(jié)果作用于該地區(qū)電信運(yùn)營(yíng)商的實(shí)際分析當(dāng)中,但限于行業(yè)機(jī)密,這一做法并不容易實(shí)現(xiàn)。本文所使用的數(shù)據(jù)是由某權(quán)威科研數(shù)據(jù)共享平臺(tái)提供的科研數(shù)據(jù)。依靠國(guó)家科技部的大力支持,并通過(guò)與國(guó)內(nèi)外著名科研機(jī)構(gòu)、高等院校的通力合作,該平臺(tái)積累了豐富的科研數(shù)據(jù)資源。本文使用的數(shù)據(jù)是2012年中國(guó)某地區(qū)移動(dòng)用戶通信記錄的數(shù)據(jù)集。該數(shù)據(jù)集中包含了大量信息,就屬性字段而言,共有用戶ID、姓名、年齡、職業(yè)、通信時(shí)長(zhǎng)、本地接聽次數(shù)、本地市話撥打次數(shù)、本地長(zhǎng)途次數(shù)、漫游接聽次數(shù)、漫游撥打次數(shù)、呼叫聯(lián)通次數(shù)、呼叫電信次數(shù)、呼叫聯(lián)通時(shí)長(zhǎng)、呼叫電信時(shí)長(zhǎng)、本地接聽時(shí)長(zhǎng)、本地市話撥打時(shí)長(zhǎng)、本地長(zhǎng)途撥打時(shí)長(zhǎng)、漫游接聽時(shí)長(zhǎng)、漫游撥打時(shí)長(zhǎng)、本地基本通話費(fèi)(主叫)、本地基本通話費(fèi)(被叫)、漫游主費(fèi)用、聯(lián)通聯(lián)系次數(shù)、電信聯(lián)系次數(shù)共24個(gè)屬性。數(shù)據(jù)記錄條數(shù)高達(dá)65500條,海量的數(shù)據(jù)信息和較高的可信度和真實(shí)度為本次數(shù)據(jù)挖掘提供了良好的保障。4.4.2數(shù)據(jù)預(yù)處理雖然擁有如此多的數(shù)據(jù),但是一般情況下這些原始數(shù)據(jù)中存在著大量的不完整、冗余性和模糊性的數(shù)據(jù),無(wú)法滿足數(shù)據(jù)挖掘算法的要求,嚴(yán)重影響了數(shù)據(jù)挖掘算法的執(zhí)行,因此在真正挖掘工作之前,需要進(jìn)行數(shù)據(jù)預(yù)處理。常見的數(shù)據(jù)預(yù)處理方法有:數(shù)據(jù)抽取、數(shù)據(jù)集成、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)歸約。1、數(shù)據(jù)抽取又稱數(shù)據(jù)采集,就是從不同的數(shù)據(jù)源中抽取數(shù)據(jù)。由于實(shí)際問(wèn)題的需要,往往要從不同數(shù)據(jù)源中獲取數(shù)據(jù),而這些數(shù)據(jù)大部分是沒(méi)有聯(lián)系的,如果不進(jìn)行數(shù)據(jù)抽取,將所有數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,一般挖掘算法都可以在這些不相關(guān)的數(shù)據(jù)中也挖掘出“規(guī)律”來(lái),而這并不是我們需要的,因此數(shù)據(jù)抽取顯得尤為重要。2、數(shù)據(jù)集成數(shù)據(jù)集成廣義上是指將多個(gè)數(shù)據(jù)源系統(tǒng)數(shù)據(jù)合并存放在一個(gè)統(tǒng)一的數(shù)據(jù)存儲(chǔ)中,統(tǒng)一業(yè)務(wù)規(guī)則和編碼規(guī)則,消除數(shù)據(jù)本身的冗余等,數(shù)據(jù)集成一般來(lái)說(shuō)涉及2個(gè)問(wèn)題[18]:(1)模式集成,涉及實(shí)體識(shí)別,即同一個(gè)實(shí)體在不同數(shù)據(jù)集中用不同的屬性來(lái)表示,通常借助于數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中元數(shù)據(jù)的查詢來(lái)解決這一問(wèn)題;(2)冗余,數(shù)據(jù)集成往往導(dǎo)致數(shù)據(jù)冗余,如同一個(gè)屬性命名不一致或者同一個(gè)屬性多次出現(xiàn)等情況,利用相關(guān)分析可以檢測(cè)到屬性間冗余,然后刪除即可。3、數(shù)據(jù)清洗數(shù)據(jù)清洗主要包括處理空缺值、平滑噪聲數(shù)據(jù)(臟數(shù)據(jù))。空缺值是指某個(gè)或某些數(shù)據(jù)的缺失,可以利用回歸、貝葉斯等方法填充空缺值;噪聲是指一個(gè)數(shù)據(jù)集中的隨機(jī)錯(cuò)誤或偏差,包括錯(cuò)誤的值或偏離期望的孤立點(diǎn)值,可以利用平滑技術(shù)處理噪聲數(shù)據(jù)??杖敝岛驮肼晹?shù)據(jù)在實(shí)際數(shù)據(jù)集中都是無(wú)法避免的,數(shù)據(jù)清洗可以提高數(shù)據(jù)質(zhì)量,大大減少了數(shù)據(jù)變換過(guò)程異常處理的工作量[18,19]。4、數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)轉(zhuǎn)換就是對(duì)數(shù)據(jù)進(jìn)行規(guī)范化,從而使數(shù)據(jù)轉(zhuǎn)換成一個(gè)適合數(shù)據(jù)挖掘的形式。數(shù)據(jù)轉(zhuǎn)換一般包括以下內(nèi)容:(1)平滑處理,就是再次進(jìn)行噪聲處理;(2)數(shù)據(jù)泛化處理,用更抽象或更高層次的概念來(lái)取代低層次的對(duì)象;(3)屬性構(gòu)造,指根據(jù)已有屬性構(gòu)造新的屬性,以輔助數(shù)據(jù)挖掘的過(guò)程。5、數(shù)據(jù)歸約數(shù)據(jù)歸約是指在盡可能保證數(shù)據(jù)完整性的基礎(chǔ)上,獲得數(shù)據(jù)的簡(jiǎn)化表示,以減少數(shù)據(jù)存儲(chǔ)空間,使挖掘過(guò)程更有效,數(shù)據(jù)規(guī)約的概念很大,數(shù)據(jù)挖掘中常用和有效的是維歸約,也稱變量簡(jiǎn)約[20]。按照上述數(shù)據(jù)預(yù)處理原理,考慮到聚類和關(guān)聯(lián)規(guī)則算法都只是對(duì)客戶通話記錄進(jìn)行數(shù)據(jù)挖掘,因此客戶姓名、年齡、職業(yè)等信息顯然是冗余信息,在進(jìn)行數(shù)據(jù)預(yù)處理時(shí)筆者刪除了這些信息,并對(duì)數(shù)據(jù)集中的空缺數(shù)據(jù)和噪聲數(shù)據(jù)都進(jìn)行了處理,至此得到了質(zhì)量較高,可以進(jìn)行挖掘的優(yōu)質(zhì)數(shù)據(jù)集。4.5聚類分析4.5.1K-means算法通過(guò)前文介紹,我們已經(jīng)清楚地知道,本次數(shù)據(jù)挖掘的背景和任務(wù),并且得到了經(jīng)過(guò)預(yù)處理的優(yōu)質(zhì)數(shù)據(jù)集,下面就可以在SPSSClementine中實(shí)現(xiàn)數(shù)據(jù)挖掘。首先我們實(shí)現(xiàn)K-means算法的聚類分析。1、由于數(shù)據(jù)集以Excel形式存儲(chǔ),而SPPSClementine提供了與多種源文件形式的接口,因此可以直接以Excel文件形式讀取數(shù)據(jù)集,如圖4.4所示。圖4.4導(dǎo)入數(shù)據(jù)2、在接入其他運(yùn)算節(jié)點(diǎn)之前,需要先檢驗(yàn)剛剛讀取的數(shù)據(jù)是否正確或者確認(rèn)將要聚類的屬性都有哪些,因此接入Table節(jié)點(diǎn)(圖4.5-4.6),即以表格的形式查看接入的數(shù)據(jù)集(圖4.7)。圖4.5選擇Table節(jié)點(diǎn)圖4.6接入Table節(jié)點(diǎn)圖4.7查看數(shù)據(jù)3、確定之后接入類型節(jié)點(diǎn),在字段選項(xiàng)中選擇“類型”節(jié)點(diǎn),即Type節(jié)點(diǎn)。如圖4.8所示。圖4.8接入Type節(jié)點(diǎn)雙擊該節(jié)點(diǎn),設(shè)置該節(jié)點(diǎn)的值。在K-means算法中,要求所有參與聚類的屬性“方向值”都必須為“輸入”(In),設(shè)置結(jié)果如圖4.9所示。圖4.9設(shè)置字段屬性4、選擇模型:選擇聚類分析中最為經(jīng)典的K-means模型,如圖4.10所示;構(gòu)建好的模型整體示意圖如圖4.11所示。圖4.10選擇K-means模型圖4.11接入K-means模型5、設(shè)置K-means屬性,尤其是聚類數(shù),如圖4.12所示;設(shè)置好聚類數(shù)后執(zhí)行算法,圖4.13為執(zhí)行過(guò)程。圖4.12設(shè)置模型屬性圖4.13模型執(zhí)行過(guò)程圖聚類數(shù)目的選擇是K-means算法的關(guān)鍵,這里采用比較分析的方法確定聚類數(shù)目。根據(jù)經(jīng)驗(yàn),一般情況下聚類數(shù)目為5類左右,因此這里分別設(shè)置聚類數(shù)目為3、4、5、6、7并執(zhí)行算法。圖4.14表示當(dāng)聚類數(shù)目不同時(shí),迭代次數(shù)和誤差值也不同。圖4.14聚類數(shù)目不同時(shí)的迭代次數(shù)比較圖從上圖可以看出,當(dāng)聚類數(shù)目為3或4時(shí),迭代次數(shù)少,聚類效果好,結(jié)合實(shí)際情況考慮,最終選擇4作為聚類數(shù)目,即將所有數(shù)據(jù)聚為4類。每類的記錄條數(shù)及百分比如圖4.15和圖4.16所示。圖4.15各聚類記錄條數(shù)示意圖圖4.16各聚類記錄百分比示意圖SPSSClementine12.0使用方差分析的F檢驗(yàn)方法識(shí)別變量的均值是否存在顯著差異,查看器為我們提供了各屬性值對(duì)每一類的重要性程度,如圖4.17所示。圖4.17屬性重要程度示意圖4.5.2TwoStep算法1、在Type節(jié)點(diǎn)之后接入兩步模型,如圖4.18所示。圖4.18TwoStep模型圖2、由于該算法可以自己設(shè)定聚類數(shù)目,我們先按此方法執(zhí)行模型,如圖4.19所示。圖4.20為模型執(zhí)行過(guò)程。圖4.19設(shè)置模型屬性圖4.20模型執(zhí)行過(guò)程圖圖4.21各聚類記錄條數(shù)示意圖3、如圖4.21和4.22,查看執(zhí)行結(jié)果可知該算法將全部用戶聚類2類,通過(guò)查看器(圖4.23)可知,所有屬性對(duì)聚類1的重要程度為1.00,對(duì)聚類2的重要程度為0.00,這顯然是不符合實(shí)際情況的。因此該算法執(zhí)行結(jié)果不列入比較結(jié)果中。圖4.22查看器結(jié)果圖圖4.23各屬性對(duì)聚類的影響程度示例圖4、顯然本文使用的數(shù)據(jù)并不適合讓Twostep算法自動(dòng)確定聚類數(shù)目,因此為了提高算法的有效性,也為了更好地與K-means算法進(jìn)行比較,在這里將兩步模型的聚類數(shù)目手動(dòng)設(shè)置為4,并執(zhí)行,如圖4.24所示。圖4.24設(shè)置模型屬性5、對(duì)比該執(zhí)行結(jié)果與K-means結(jié)果(圖4.25),可以發(fā)現(xiàn),TwoStep每個(gè)聚類中屬性的標(biāo)準(zhǔn)差普遍大于K-means的標(biāo)準(zhǔn)差,我們都知道,標(biāo)準(zhǔn)差越小,聚類效果越好,因此可得出在本例中K-means的聚類效果明顯優(yōu)于TwoStep的結(jié)論,究其原因,可能是因?yàn)镵-means這種算法面對(duì)大規(guī)模數(shù)據(jù)集時(shí)具有較高的效率。圖4.25兩種聚類算法對(duì)比圖4.5.3判斷聚類依據(jù)根據(jù)查看器中的重要性程度指標(biāo)我們可以判斷出每一個(gè)屬性主要影響的聚類類別,綜合這些屬性便可以得出每個(gè)聚類的特征。下面舉例說(shuō)明:根據(jù)圖4.26可以很明顯看出,“呼叫電信次數(shù)”這一屬性對(duì)聚類4的重要性程度為0.97,代表“重要”,而對(duì)其他三類重要性程度小于0.9代表“不重要”,因此,“呼叫電信次數(shù)”這一屬性影響聚類4的屬性特征。將每一個(gè)屬性按照上述方法分析,即可得出每個(gè)類的屬性特征,由此判斷出算法聚類的依據(jù)。表4.1表示了每個(gè)屬性對(duì)各個(gè)類是否重要,重要用“√”表示,不重要用“×”表示。圖4.26各屬性對(duì)聚類的影響程度示例圖表4.1各屬性對(duì)聚類的影響程度判斷表聚類1聚類2聚類3聚類4呼轉(zhuǎn)“電信”次數(shù)×××√呼轉(zhuǎn)“電信”時(shí)長(zhǎng)×××√呼轉(zhuǎn)“聯(lián)通”時(shí)長(zhǎng)×××√呼轉(zhuǎn)“聯(lián)通”次數(shù)√××√本地基本通話費(fèi)(主叫)√√××本地基本通話費(fèi)(被叫)√××√本地市話撥打時(shí)長(zhǎng)√√××本地市話撥打次數(shù)√√××本地接聽時(shí)長(zhǎng)√√××本地接聽次數(shù)√√××本地長(zhǎng)途撥打時(shí)長(zhǎng)×√××本地長(zhǎng)途撥打次數(shù)×√××漫游總費(fèi)用√×××漫游撥打時(shí)長(zhǎng)××√×漫游撥打次數(shù)××√×漫游接聽時(shí)長(zhǎng)××√×漫游接聽次數(shù)√××ד電信”聯(lián)系次數(shù)√√×ד聯(lián)通”聯(lián)系次數(shù)√√××通信時(shí)長(zhǎng)√√××由表4.1可以看出,聚類1區(qū)別于其他類的類別特征影響因素主要是本地業(yè)務(wù),再由SPSSClementine查看器(圖4.27)可知,聚類1的被叫通話費(fèi)用超過(guò)了主叫通過(guò)費(fèi)用,因此把該組稱為“被動(dòng)呼叫組”;圖4.27類1的聚類依據(jù)圖圖4.28類2的聚類依據(jù)圖聚類2區(qū)別于其他類的類別特征影響因素也主要是本地業(yè)務(wù),但是該組主叫費(fèi)用明顯多于被叫費(fèi)用(圖4.27),且在本地各項(xiàng)業(yè)務(wù)中該類別業(yè)務(wù)量都最大(圖4.28),因此將該組稱為“本地繁忙組”;聚類3只有三個(gè)屬性影響其特征,即“漫游撥打時(shí)長(zhǎng)”、“漫游撥打次數(shù)”、“漫游接聽時(shí)長(zhǎng)”,說(shuō)明該組的業(yè)務(wù)都集中在漫游上,因此稱該組為“漫游組”;聚類4有5個(gè)屬性影響其特征,區(qū)別其他類別,選出關(guān)鍵影響因素,可以看出該組與“聯(lián)通”、“電信”用戶聯(lián)系頻繁(圖4.29),因此稱為“聯(lián)通電信組”。由此給出了4個(gè)聚類各自的關(guān)鍵特征。圖4.29類4的聚類依據(jù)圖4.5.4查看用戶歸屬類別在Type節(jié)點(diǎn)之后接入K-means聚類結(jié)果,并在之后接入Table節(jié)點(diǎn)(圖4.30),可以知道每個(gè)用戶分別歸屬于哪個(gè)聚類(圖4.31)??梢钥闯鰣D4.31比圖4.7多了兩列,分別表示每個(gè)用戶歸屬的聚類類別以及每個(gè)用戶與其所在類的類中心的距離,距離越近,表示它聚在該類的效果越好。至此,利用聚類K-means算法進(jìn)行數(shù)據(jù)挖掘的全部過(guò)程都已完成。圖4.30接入Table節(jié)點(diǎn)圖4.31聚類結(jié)果圖4.6關(guān)聯(lián)規(guī)則分析1、替換數(shù)據(jù)關(guān)聯(lián)規(guī)則是挖掘事件A發(fā)生時(shí)事件B或C發(fā)生的可能性,為了便于關(guān)聯(lián)規(guī)則分析的進(jìn)行,這里需要將原數(shù)據(jù)的屬性進(jìn)行篩選和修改。選取有關(guān)時(shí)長(zhǎng)的字段,包括通信時(shí)長(zhǎng)、本地接聽時(shí)長(zhǎng)、本地市話撥打時(shí)長(zhǎng)、本地長(zhǎng)途撥打時(shí)長(zhǎng)、漫游接聽時(shí)長(zhǎng)和漫游撥打時(shí)長(zhǎng)共六個(gè)字段進(jìn)行關(guān)聯(lián)分析,并在Excel中借助IF函數(shù)將數(shù)值大于其所在組平均值的定義為通話時(shí)間長(zhǎng),數(shù)值小于其所在組平均值的定義為通話時(shí)間短。同時(shí)關(guān)聯(lián)規(guī)則算法要求一次最多運(yùn)行250條數(shù)據(jù),為了提高運(yùn)算效率,這里從原始數(shù)據(jù)中隨機(jī)抽取了200條進(jìn)行修改。2、在模型中接入數(shù)據(jù)源節(jié)點(diǎn)和Table節(jié)點(diǎn),并查看數(shù)據(jù),如圖4.32和4.33。圖4.32接入Table節(jié)點(diǎn)圖4.33查看數(shù)據(jù)3、接入Type節(jié)點(diǎn),并設(shè)置數(shù)據(jù)方向值(圖4.34),在這里將不需要進(jìn)行分析的屬性方向值更改為None(無(wú)),要分析的屬性方向值更改為Both(兩者),因?yàn)殛P(guān)聯(lián)規(guī)則分析的是兩個(gè)屬性間的關(guān)系,每個(gè)屬性既作為模型的輸入又作為模型的輸出,因此屬性方向是雙向的,且是離散型的數(shù)據(jù)。圖4.34設(shè)置字段屬性4、接入模型:SPSSClementine12.0提供了三種關(guān)聯(lián)規(guī)則算法,在這里我們選用最為經(jīng)典的Apriori算法,如圖4.35接入模型,圖4.36設(shè)置屬性并執(zhí)行。圖4.35接入Apriori模型圖4.36設(shè)置模型屬性5、查看模型執(zhí)行結(jié)果(圖4.37),可以得出前項(xiàng)與后項(xiàng)的支持度和置信度,例如“本地接聽時(shí)長(zhǎng)”長(zhǎng)和“通信時(shí)長(zhǎng)”長(zhǎng)同時(shí)發(fā)生的可能性是41.206%,當(dāng)已知“本地接聽時(shí)長(zhǎng)”長(zhǎng)時(shí),“通信時(shí)長(zhǎng)”長(zhǎng)的可能性是81.707%。圖4.37模型結(jié)果圖圖4.38接入Web圖節(jié)點(diǎn)6、關(guān)聯(lián)規(guī)則分析的結(jié)果還可以以各類圖形的方式表示出來(lái),這也是SPSSClementine12.0的一大優(yōu)勢(shì),即提供了良好的圖形化界面,便于用戶對(duì)結(jié)果的觀察與分析。在Type節(jié)點(diǎn)后接入Web圖節(jié)點(diǎn),如圖4.38所示,并設(shè)置節(jié)點(diǎn)屬性(圖4.39)。圖4.39設(shè)置節(jié)點(diǎn)屬性圖4.40劃桿值為18的Web結(jié)果圖7、分析圖形化結(jié)果。圖4.40—4.42為模型執(zhí)行結(jié)果圖。圖4.40是一張全連圖,任意兩個(gè)屬性之間都有線連接,但線的粗細(xì)不同,代表二者關(guān)聯(lián)程度不同,這里我們?cè)O(shè)定線越粗關(guān)聯(lián)程度越大,另外還可以調(diào)節(jié)劃桿,縮小屬性范圍,留下關(guān)聯(lián)程度較大的屬性。圖4.40—4.42分別是劃桿值為18、40、66時(shí)的情況。可以看出本地接聽時(shí)長(zhǎng)與通信時(shí)長(zhǎng)的關(guān)聯(lián)度最強(qiáng),這與上面第6步得出的結(jié)論是相符的。另外,Web圖還提供文字化結(jié)果,給出了強(qiáng)鏈接、中等鏈接和弱鏈接三種情況下屬性的關(guān)聯(lián)關(guān)系以及有多少用戶符合這種關(guān)聯(lián)規(guī)則,如圖4.43所示。圖4.41劃桿值為40的Web結(jié)果圖圖4.42劃桿值為60的Web結(jié)果圖4.7制定精準(zhǔn)營(yíng)銷策略4.7.1細(xì)分客戶劃分好客戶群后,就可以根據(jù)每個(gè)群的特征制定針對(duì)性的營(yíng)銷策略,由于數(shù)據(jù)集是中國(guó)移動(dòng)客戶數(shù)據(jù),這里以中國(guó)移動(dòng)為例進(jìn)行具體闡述:聚類1“被動(dòng)呼叫組”,由于該組被叫通話費(fèi)用超過(guò)了主叫通過(guò)費(fèi)用,因此要向其推薦全國(guó)接聽免費(fèi)等類似服務(wù),同時(shí)為了吸引其增加主叫時(shí)長(zhǎng)和費(fèi)用,可推薦其選擇含有最低消費(fèi)的相關(guān)業(yè)務(wù),即主叫時(shí)長(zhǎng)達(dá)到某一水平時(shí)可積分或優(yōu)惠的活動(dòng);圖4.43文字化的Web圖結(jié)果圖聚類2“本地繁忙組”,可以看出該組主叫費(fèi)用明顯多于被叫費(fèi)用,且在本地各項(xiàng)業(yè)務(wù)中業(yè)務(wù)量都很大,說(shuō)明該組有著很大的市場(chǎng)需求和市場(chǎng)占有率,因此應(yīng)作為精準(zhǔn)營(yíng)銷的主要目標(biāo)客戶群體??上蚱渫扑]性價(jià)比較高、涵蓋業(yè)務(wù)種類較廣的套餐;另一方面由于業(yè)務(wù)量大,企業(yè)中任何新推出的活動(dòng)都應(yīng)積極向該組用戶推薦介紹,如親情號(hào)碼、閑時(shí)優(yōu)惠等,以滿足客戶各個(gè)方面的需求;與此同時(shí),對(duì)該類客戶還應(yīng)進(jìn)行捆綁銷售,讓其考慮為家人購(gòu)買合適套餐,如“神州行夕陽(yáng)紅”,一款特別為老年人定做的移動(dòng)套餐等;聚類3“漫游組”,作為本次數(shù)據(jù)挖掘結(jié)果聚類數(shù)目最多,群體特征最明顯的一個(gè)簇,可以推斷出該組用戶由于生活或工作的原因經(jīng)常各地奔波,漫游業(yè)務(wù)使用頻繁,因此應(yīng)向其推薦漫游類優(yōu)惠套餐如“全球通”等;聚類4“聯(lián)通電信組”,該組與“聯(lián)通”、“電信”用戶聯(lián)系頻繁,對(duì)于該類用戶則應(yīng)向其推薦親情號(hào)碼,同時(shí)為了吸引其他企業(yè)客戶,可推出若能將聯(lián)系頻繁的用戶都更換為中國(guó)移動(dòng)用戶,通信更加優(yōu)惠的活動(dòng)。4.7.2交叉銷售和捆綁銷售關(guān)聯(lián)規(guī)則分析也叫購(gòu)物籃分析,最早用于零售行業(yè)。利用關(guān)聯(lián)規(guī)則算法,通過(guò)分析顧客的銷售記錄,可知哪兩種或幾種商品同時(shí)被購(gòu)買的機(jī)率大,便將這幾種商品擺放在一起銷售,這種做法稱為捆綁銷售,根據(jù)分析結(jié)果對(duì)顧客進(jìn)行產(chǎn)品推薦的行為叫做交叉銷售,二者都是關(guān)聯(lián)規(guī)則算法在精準(zhǔn)營(yíng)銷領(lǐng)域主要解決的問(wèn)題。在4.6節(jié)筆者利用SPSSClementine對(duì)數(shù)據(jù)源數(shù)據(jù)執(zhí)行Apriori算法,結(jié)果用數(shù)值和圖形兩種方式展示,都表示“本地接聽時(shí)長(zhǎng)”和“通信時(shí)長(zhǎng)”的關(guān)聯(lián)程度最大。由于關(guān)聯(lián)規(guī)則中屬性間的關(guān)系是雙向的,因此可知通信時(shí)長(zhǎng)較長(zhǎng)的用戶,本地接聽時(shí)長(zhǎng)很有可能較長(zhǎng),同樣,本地接聽時(shí)長(zhǎng)長(zhǎng)的用戶,通信時(shí)長(zhǎng)也會(huì)較長(zhǎng)。利用這一點(diǎn),可以推斷出本地接聽時(shí)長(zhǎng)長(zhǎng)的用戶可能整體通話業(yè)務(wù)量都很大,因此可以為其推薦適合業(yè)務(wù)量大的人群的套餐,如滿定額按比例返話費(fèi)等,定額越高,返利越多,而這種業(yè)務(wù)對(duì)于通話時(shí)長(zhǎng)一般的人群來(lái)說(shuō)顯然是不合適的,這樣便實(shí)現(xiàn)了交叉銷售?;蛘邽樵擃惾巳和瞥鲆豢顦I(yè)務(wù),接聽免費(fèi),但整體通話業(yè)務(wù)量要有保證,即最低消費(fèi),滿足消費(fèi)下限后便可按比例返話費(fèi),從而實(shí)現(xiàn)了捆綁銷售。這里需要指出的是,在實(shí)際生活中,考慮到全國(guó)各省市電信行業(yè)發(fā)展水平不同,對(duì)于上述模型思路不可一概而論,因此在實(shí)際業(yè)務(wù)推廣中應(yīng)首先選擇一個(gè)試點(diǎn)進(jìn)行測(cè)試,并隨時(shí)了解模型應(yīng)用的收益情況。若在一段時(shí)間內(nèi),收益有明顯提高,則可考慮大范圍推廣,若收益并無(wú)增長(zhǎng),則考慮修正模型并再次測(cè)試??傊?,電信行業(yè)實(shí)現(xiàn)精準(zhǔn)化營(yíng)銷是一個(gè)涉及客戶洞察、客戶細(xì)分、產(chǎn)品研發(fā)、市場(chǎng)營(yíng)銷,以及營(yíng)銷結(jié)果評(píng)估的閉環(huán)過(guò)程,只有不斷追蹤市場(chǎng)反應(yīng)、企業(yè)收益并以此修正營(yíng)銷策略才是精準(zhǔn)營(yíng)銷的真正意義所在。4.8本章小結(jié)有了第二章和第三章的理論綜述,本章為論文的核心部分,即完成實(shí)例的數(shù)據(jù)挖掘和精準(zhǔn)營(yíng)銷過(guò)程。首先介紹了實(shí)例的背景和使用的數(shù)據(jù)挖掘算法;然后進(jìn)行了需求分析和數(shù)據(jù)準(zhǔn)備,數(shù)據(jù)準(zhǔn)備包括數(shù)據(jù)選擇和數(shù)據(jù)預(yù)處理;之后從聚類和關(guān)聯(lián)規(guī)則兩個(gè)方面對(duì)數(shù)據(jù)進(jìn)行挖掘,聚類結(jié)果將所有用戶聚類4類,針對(duì)每類用戶的聚類特征制定了不同的營(yíng)銷策略,關(guān)聯(lián)規(guī)則挖掘出兩個(gè)屬性的強(qiáng)關(guān)聯(lián)關(guān)系,利用該強(qiáng)關(guān)聯(lián)關(guān)系進(jìn)行交叉銷售和捆綁銷售,實(shí)現(xiàn)了精準(zhǔn)營(yíng)銷的過(guò)程。

結(jié)論本文到此主體內(nèi)容已經(jīng)完成,經(jīng)過(guò)幾個(gè)月的努力,筆者對(duì)本文涉及的相關(guān)理論和算法應(yīng)用都有了深入的了解,現(xiàn)對(duì)本文內(nèi)容從以下兩個(gè)方面進(jìn)行總結(jié):1、理論方面:良好的理論基礎(chǔ)是技術(shù)實(shí)施的有力保障,本文共涉及兩大方面的理論知識(shí),數(shù)據(jù)挖掘和精準(zhǔn)營(yíng)銷。數(shù)據(jù)挖掘方面,具體介紹了數(shù)據(jù)挖掘的定義及過(guò)程、工具及選擇,以及數(shù)據(jù)挖掘的未來(lái);精準(zhǔn)營(yíng)銷部分闡述了精準(zhǔn)營(yíng)銷的概念、特點(diǎn)和實(shí)施策略,并將兩種概念相結(jié)合,對(duì)二者的結(jié)合應(yīng)用進(jìn)行了理論闡述。這些內(nèi)容為應(yīng)用部分打下了良好的理論基礎(chǔ)。2、應(yīng)用方面:依據(jù)前三章的理論綜述,在本文第四章節(jié),實(shí)現(xiàn)了兩個(gè)方面的應(yīng)用。一是利用工具對(duì)真實(shí)數(shù)據(jù)源實(shí)現(xiàn)了完整的數(shù)據(jù)挖掘過(guò)程,包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)預(yù)處理及數(shù)據(jù)挖掘;二是通過(guò)對(duì)數(shù)據(jù)挖掘結(jié)果的分析,制定了有針對(duì)性的營(yíng)銷策略,實(shí)現(xiàn)了精準(zhǔn)營(yíng)銷,完成了由理論到實(shí)踐的過(guò)程。下一步工作:1、事實(shí)上數(shù)據(jù)挖掘方法主要有三類,本文只采用了其中的兩類,即聚類算法和關(guān)聯(lián)規(guī)則,沒(méi)有使用分類技術(shù)。該技術(shù)在電信行業(yè)的精準(zhǔn)營(yíng)銷上有很多應(yīng)用實(shí)例,例如利用決策樹算法構(gòu)建客戶流失預(yù)測(cè)模型,從而預(yù)測(cè)客戶流失情況;2、本文由于借助工具實(shí)現(xiàn)數(shù)據(jù)挖掘過(guò)程,無(wú)法將算法結(jié)合實(shí)際情況進(jìn)行改進(jìn),例如改進(jìn)K-means計(jì)算變量之間距離的公式。要想達(dá)到這一目的,應(yīng)使用Java編程語(yǔ)言完成數(shù)據(jù)挖掘過(guò)程;3、利用JSP、Servlet等技術(shù)可創(chuàng)建一個(gè)聚類分析的應(yīng)用系統(tǒng),包括用戶登錄與管理、聚類分析等模塊,可以通過(guò)該系統(tǒng)選擇不同聚類方法和指標(biāo)參數(shù),直接對(duì)數(shù)據(jù)進(jìn)行挖掘。

致謝經(jīng)過(guò)一段時(shí)間的努力,本論文至此已接近尾聲,回憶過(guò)去的這段時(shí)間,需要感謝的人有很多,特此致謝。首先感謝我的導(dǎo)師丁老師。丁老師作為信管專業(yè)授課門數(shù)最多的老師,教授了我們很多專業(yè)知識(shí),陪伴我們走過(guò)了三年的學(xué)習(xí)路程。老師平日里工作繁多,但在我們撰寫論文期間,每周都會(huì)與我們開會(huì)討論論

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論