基于數(shù)據(jù)挖掘技術(shù)的用戶信息分析系統(tǒng)的研究與實(shí)現(xiàn)_第1頁
基于數(shù)據(jù)挖掘技術(shù)的用戶信息分析系統(tǒng)的研究與實(shí)現(xiàn)_第2頁
基于數(shù)據(jù)挖掘技術(shù)的用戶信息分析系統(tǒng)的研究與實(shí)現(xiàn)_第3頁
基于數(shù)據(jù)挖掘技術(shù)的用戶信息分析系統(tǒng)的研究與實(shí)現(xiàn)_第4頁
基于數(shù)據(jù)挖掘技術(shù)的用戶信息分析系統(tǒng)的研究與實(shí)現(xiàn)_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、電 子 科 技 大 學(xué) 工程碩士學(xué)位論文開題報告學(xué)位論文題目:基于數(shù)據(jù)挖掘技術(shù)的用戶信息分析系統(tǒng)的研 究與實(shí)現(xiàn)工程領(lǐng)域名稱: 軟件工程 學(xué) 號: 姓 名: 校內(nèi)導(dǎo)師姓名: 企業(yè)方導(dǎo)師姓名: 碩士生所在單位名稱: 填表日期:2014年3月1日填 表 說 明1、 研究生須認(rèn)真填寫本表相關(guān)內(nèi)容。2、 開題報告內(nèi)容見電子科技大學(xué)在職攻讀工程碩士專業(yè)學(xué)位研究生管理暫行規(guī)定3、 所列欄目填寫不下的,可以另加附頁。4、 本表采取雙面印制,且保持原格式不變,紙張限用 A4(頁邊距為上、下:2.5cm, 左為2.6cm,右為2.1cm;字體為宋體小四,行間距為18磅),整齊裝訂。5、 開題報告完成,此表經(jīng)相關(guān)人

2、員簽字后,須交學(xué)院研究生教務(wù)秘書保存?;跀?shù)據(jù)挖掘技術(shù)的用戶信息分析系統(tǒng)的研究與實(shí)現(xiàn)一、課題背景與研究意義移動行業(yè)發(fā)展到今天,各種移動企業(yè)與客戶的交往發(fā)生了很大的變化,誰也不能保證客戶從一而終,各移動企業(yè)要想保留住自己的客戶,就必須更多地了解客戶的需求,客戶關(guān)系管理技術(shù)就使企業(yè)為了保持企業(yè)競爭力而采取的面向客戶、以客戶為驅(qū)動和以客戶為中心的決策技術(shù)。移動企業(yè)要想與自己的客戶建立一種持久的關(guān)系,從每個客戶身上獲取最大的利潤,降低企業(yè)運(yùn)營成本,減少因客戶的離去而產(chǎn)生的損失和無效的經(jīng)營決策而產(chǎn)生的浪費(fèi),就要求各企業(yè)能夠深入了解客戶的習(xí)慣、喜好,依此正確地估計(jì)到客戶對移動產(chǎn)品的各種需求,并在最短的時間

3、內(nèi)滿足客戶的各種需求要做到這些,就必須對客戶在與企業(yè)交互過程中的各種客戶數(shù)據(jù)收集、整理和分析,然后根據(jù)收集到的數(shù)據(jù),挖掘出隱含在這些數(shù)據(jù)中的有用信息和知識。只有在正確的時間里通過正確的渠道給正確的客戶提供恰當(dāng)?shù)姆?wù)才能實(shí)現(xiàn)客戶關(guān)系管理的目標(biāo)。但是隨著數(shù)據(jù)庫技術(shù)的廣泛應(yīng)用于發(fā)展,企業(yè)客戶數(shù)據(jù)量爆炸式的膨脹,很多企業(yè)由于缺乏發(fā)現(xiàn)隱含在眾多數(shù)據(jù)中有用信息的能力,他們就沒有辦法將隱含在這些數(shù)據(jù)中的信息轉(zhuǎn)化為有用的知識。數(shù)據(jù)挖掘技術(shù)就是幫助各移動企業(yè)解決同客戶在交互過程中遇到的各種問題的最重要的技術(shù)之一,客戶關(guān)系管理系統(tǒng)就是決策科學(xué)技術(shù)和數(shù)據(jù)挖掘技術(shù)應(yīng)用中發(fā)展最快的領(lǐng)域之一。隨著移動業(yè)的競爭日益白熱化,

4、移動巨頭們紛紛引入數(shù)據(jù)挖掘技術(shù),利用數(shù)據(jù)挖掘技術(shù)來指導(dǎo)和做出市場決策,贏得了市場先機(jī)。CRM(Customer Relationship Management,客戶關(guān)系管理)恰恰切合了這種需要。它面對企業(yè)市場和銷售部門,核心內(nèi)容是管理分析客戶行為信息,構(gòu)建客戶交流渠道,為客戶提供完善周到的售后服務(wù)。應(yīng)用CRM重構(gòu)移動業(yè)的管理模式是移動企業(yè)信息化管理發(fā)展的必然趨勢。目前,一些世界級的移動運(yùn)營商,如英國移動、AT&T,德國移動、MCI,SPRINT,TELIA等,無不把CRM作為企業(yè)競爭的利器。在國內(nèi)當(dāng)前的競爭形勢下,CRM業(yè)務(wù)已經(jīng)最能撥動各移動運(yùn)營商管理層的心弦。與此同時,數(shù)據(jù)挖掘、數(shù)據(jù)

5、倉庫等一些先進(jìn)技術(shù)也被企業(yè)作為數(shù)據(jù)分析的工具引入到客戶關(guān)系管理中,為企業(yè)經(jīng)營決策提供科學(xué)、準(zhǔn)確的依據(jù)。有鑒于此,本文針對移動企業(yè)CRM實(shí)施中的數(shù)據(jù)挖掘及其算法實(shí)現(xiàn)進(jìn)行了一些有意義的探討以其為移動企業(yè)決策者決策提供有力的依據(jù)。本課題的主要任務(wù)是分析數(shù)據(jù)挖掘技術(shù)中關(guān)聯(lián)規(guī)則在移動CRM中的應(yīng)用情況,隨時了解移動企業(yè)客戶的需求變化,改進(jìn)對客戶的服務(wù)水平,從而提高客戶的忠誠度,進(jìn)而提升移動運(yùn)營企業(yè)在市場中的競爭力。二、 國內(nèi)外相關(guān)領(lǐng)域研究現(xiàn)狀1、移動CRM中的數(shù)據(jù)挖掘應(yīng)用現(xiàn)狀評述數(shù)據(jù)挖掘的任務(wù)就是從數(shù)據(jù)中發(fā)現(xiàn)模式。計(jì)算機(jī)中能夠存儲已知了結(jié)果的大量不同數(shù)據(jù),然后由數(shù)據(jù)挖掘工具從大量的信息里面將能夠產(chǎn)生模型

6、的信息提取出來,一旦模型建立好了以后,就可以應(yīng)用在那些情形相似但結(jié)果尚未可知的決策中。在移動企業(yè)管理客戶生命周期的各個階段都會用到數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘能夠幫助企業(yè)確定客戶的特點(diǎn),從而可以為客戶提供有針對性的服務(wù)。通過數(shù)據(jù)挖掘,可以發(fā)現(xiàn)使用某一業(yè)務(wù)的客戶的特征,從而可以向那些也同樣具有這些特征卻沒有使用該業(yè)務(wù)的客戶進(jìn)行有目的的推銷;還可以找到流失客戶的特征,在那些具有相似特征的客戶還未流失之前,采取針對性的措施。目前數(shù)據(jù)挖掘技術(shù)在移動CRM系統(tǒng)中的應(yīng)用可總結(jié)為以下幾方面:1)客戶獲得對于移動運(yùn)營公司來說,企業(yè)的增長需要不斷地獲得新的客戶。新的客戶包括以前沒有聽說過企業(yè)的人、以前不需要服務(wù)的人和

7、競爭對手的客戶。數(shù)據(jù)挖掘能夠辨別潛在的客戶群,并提高市場活動的響應(yīng)率。2)客戶保持由于移動市場競爭越來越激烈,使企業(yè)獲得新客戶的成本正不斷地上升,因此保持原有客戶就顯得越來越重要。數(shù)據(jù)挖掘可以發(fā)現(xiàn)易流失的客戶,企業(yè)就可以針對客戶的需求,采取相應(yīng)的措施。出色的客戶保持程序先對流失的客戶建模,識別導(dǎo)致轉(zhuǎn)移的模式,然后就可以用這些模式找出當(dāng)前客戶中潛在的“背叛者”,以便采取預(yù)防措施。3)交叉銷售在目前競爭激烈的移動市場中,企業(yè)和客戶之間的關(guān)系是經(jīng)常變動的,一旦成為企業(yè)的客戶,企業(yè)就要盡力保持這種客戶關(guān)系??蛻絷P(guān)系的最佳境界體現(xiàn)在3個方面:最長時間地保持這種關(guān)系;最多次數(shù)地和客戶交易;保證每次交易的利

8、潤最大化。因此,企業(yè)需要對已有的客戶進(jìn)行交叉銷售。交叉銷售是指企業(yè)向原有客戶銷售新的產(chǎn)品或服務(wù)的過程。交叉銷售是建立在雙贏的基礎(chǔ)之上的,客戶因得到更多更好符合其需要的服務(wù)而獲益,企業(yè)也因銷售增長而獲益。在企業(yè)所掌握的客戶信息,尤其是以前購買行為的信息中,可能正包含有這個客戶決定下一次購買行為的關(guān)鍵因素。數(shù)據(jù)挖掘可以幫助企業(yè)尋找影響客戶購買行為的因素。4)客戶細(xì)分與一對一營銷CRM系統(tǒng)可以把大量的客戶分成不同的類,在每個類里的客戶擁有相似的屬性,而不同類里的客戶屬性也不同。企業(yè)可以做到給不同類客戶提供完全不同的服務(wù)來提高客戶的滿意度。數(shù)據(jù)挖掘可以幫助企業(yè)針對不同類別的客戶,提供個性化的服務(wù)。通過

9、收集、加工和處理涉及消費(fèi)行為的大量信息,確定特定消費(fèi)群體或個體的興趣、消費(fèi)習(xí)慣、消費(fèi)傾向和消費(fèi)需求,進(jìn)而推斷出相應(yīng)消費(fèi)群體或個體下一步的消費(fèi)行為,然后以次為基礎(chǔ),對所識別出的消費(fèi)群體進(jìn)行特定內(nèi)容的定向營銷,這與傳統(tǒng)的不區(qū)分消費(fèi)者對象特征的大規(guī)模營銷手段相比,大大節(jié)省了營銷成本,提高了營銷效果。5)盜用和異常行為分析盜用行為每年可以消耗移動企業(yè)數(shù)以億萬的資產(chǎn),確定潛在的盜用者和異常使用模式,檢測想侵入用戶賬戶的企圖,以及發(fā)現(xiàn)需要引起注意的異常模式,這都是非常重要的。通過數(shù)據(jù)挖掘中的多維分析、聚類分析和孤立點(diǎn)分析可以發(fā)現(xiàn)潛在盜用者和非典型的使用模式。從以上的總結(jié)可以看出,數(shù)據(jù)挖掘在移動CRM中的應(yīng)

10、用幾乎涉及到方方面面,而且就現(xiàn)在的研究情況看,大部分研究和別的行業(yè)有類似之處,其研究也相對成熟,但仍有一些領(lǐng)域帶有很鮮明的移動企業(yè)特征。2、國內(nèi)外研究現(xiàn)狀數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用研究是從二十世紀(jì)九十年代后期才開始的,主要集中在零售、銀行、移動、保險等行業(yè)。國內(nèi)外對基于數(shù)據(jù)挖掘的客戶關(guān)系管理的應(yīng)用研究主要集中在以下幾個方面:1)新挖掘技術(shù)的應(yīng)用研究。數(shù)據(jù)挖掘技術(shù)隨著其它的相關(guān)學(xué)科,如計(jì)算機(jī)技術(shù)、統(tǒng)計(jì)學(xué)等學(xué)科的發(fā)展而不斷發(fā)展,新挖掘技術(shù)有效性、可伸縮性和應(yīng)用效益性的研究已經(jīng)成為當(dāng)前研究的熱點(diǎn)。2)數(shù)據(jù)的處理研究。CRM中存在海量數(shù)據(jù),其中包括很多不完善、有噪聲、待處理的數(shù)據(jù),尋找合適的數(shù)據(jù)挖

11、掘技術(shù)對這些不完美數(shù)據(jù)進(jìn)行處理使其顯露潛在有用知識也成了近年來研究方向之一。3)此外還有對挖掘結(jié)果的研究。數(shù)據(jù)挖掘必須有明確的目的,其構(gòu)造的模型必須簡潔,其挖掘出來的知識必須易于用戶理解,可視化技術(shù)和模型簡化的研究也吸引了很多學(xué)者的關(guān)注。除此以外,目前的研究還包括數(shù)據(jù)倉庫技術(shù)和聯(lián)機(jī)分析處理(OLAP)在CRM的應(yīng)用等等。1999年初,我國的CRM市場幾乎為零。從1999年下半年開始,CRM就開始在中國IT業(yè)內(nèi)迅速地發(fā)展起來,不管是投資商、用戶還是國內(nèi)外軟件廠商都開始關(guān)注它。我國的CRM市場具有如下特點(diǎn):3、國內(nèi)CRM市場處于萌芽時期國內(nèi)市場無論是從產(chǎn)品結(jié)構(gòu)、區(qū)域結(jié)構(gòu)、行業(yè)結(jié)構(gòu),還是從銷售渠道來

12、看,整個市場體態(tài)都還不健全。市場區(qū)域主要集中在北京、上海等經(jīng)濟(jì)發(fā)達(dá)地區(qū)。CRM的應(yīng)用行業(yè)以郵電、金融等經(jīng)濟(jì)實(shí)力較強(qiáng)、信息化程度較高的行業(yè)為主。1)提供CRM產(chǎn)品的廠商較少CRM進(jìn)入國內(nèi)時間不長,無論用戶還是廠商都非常關(guān)注這個產(chǎn)品,很多軟件廠商紛紛推出自己的CRM產(chǎn)品,但是能夠提供功能比較全面的CRM產(chǎn)品的國內(nèi)廠商很少,有些只能提供實(shí)現(xiàn)客戶管理中的幾個應(yīng)用模塊,有的只是在ERP的某些模塊上稍作修改,并沒有真正實(shí)現(xiàn)客戶關(guān)系管理系統(tǒng)的“客戶為中心”的理念。2)市場需求量大在競爭激烈的信息化時代,客戶關(guān)系管理系統(tǒng)提出的“幫助提高本產(chǎn)品用戶營業(yè)額、擴(kuò)大市場占有率以及提高客戶忠誠度”等功能,使得很多企事業(yè)

13、用戶對此產(chǎn)品情有獨(dú)鐘,市場需求相應(yīng)加大。三、 研究內(nèi)容及技術(shù)路線針對如上提到的課題研究目的與意義,本課題的主要任務(wù)是采用數(shù)據(jù)挖掘技術(shù)對移動CRM中的用戶信息進(jìn)行分析,以隨時了解移動企業(yè)客戶的需求變化,改進(jìn)客戶服務(wù)水平,從而提高客戶的忠誠度,分析移動業(yè)務(wù)關(guān)聯(lián)情況,促進(jìn)交叉銷售,并因此為企業(yè)帶來更多的利潤,減少不必要的損失,提升企業(yè)運(yùn)作的效率。研究內(nèi)容:本文通過數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則,實(shí)現(xiàn)實(shí)現(xiàn)基于徐州移動公司CRM系統(tǒng)的用戶信息分析系統(tǒng),在系統(tǒng)中,運(yùn)用關(guān)聯(lián)規(guī)則對客戶信息進(jìn)行了分析,力圖挖掘出客戶特性和消費(fèi)傾向之間的關(guān)聯(lián),并根據(jù)分析結(jié)果對移動公司做出經(jīng)營策略上的建議、指導(dǎo)功能。該系統(tǒng)基于數(shù)據(jù)挖掘的

14、關(guān)聯(lián)規(guī)則,利用FP-Growth算法,通過vb語言開發(fā)徐州移動分公司CRM系統(tǒng)中的分析系統(tǒng)。實(shí)現(xiàn)對某高校典型消費(fèi)的分析和決策。該系統(tǒng)由如下幾個功能模塊組成:1、數(shù)據(jù)分析模塊數(shù)據(jù)分析模塊利用FP-Growth算法,通過VB語言設(shè)計(jì),對海量數(shù)據(jù)進(jìn)行分析,針對用戶各個特點(diǎn)進(jìn)行逐一篩選,(1)職業(yè)上的區(qū)別,例如學(xué)生和老師之間的消費(fèi)差異,(2)年齡上的區(qū)別,不同年齡層次人的消費(fèi)差異(3)用戶消費(fèi)結(jié)構(gòu),推薦潛在增值業(yè)務(wù),(4)手機(jī)型號的區(qū)別,針對手機(jī)的增值業(yè)務(wù)推送,該分析模塊首先對客戶數(shù)據(jù)進(jìn)行預(yù)處理,然后應(yīng)用算法生成頻繁項(xiàng)集,進(jìn)而得到關(guān)聯(lián)規(guī)則。2、業(yè)務(wù)推送模塊根據(jù)數(shù)據(jù)分析模塊的結(jié)果,我們可以對用戶的消費(fèi)情

15、況可以得到一些結(jié)論,從而掌握不同消費(fèi)群體消費(fèi)有著不同的特點(diǎn)和傾向性。然后本系統(tǒng)自動向移動公司相關(guān)人員發(fā)送經(jīng)營策略的建議,協(xié)助移動公司針對這些特點(diǎn)有目的的推廣自己的業(yè)務(wù)。、數(shù)據(jù)導(dǎo)出模塊該模塊利用vb語言設(shè)計(jì),將分析結(jié)果連接到建議推廣的業(yè)務(wù)上,供使用者進(jìn)行選擇。這樣不僅增加企業(yè)效益,同時還能提高消費(fèi)者的消費(fèi)體驗(yàn),而且可以通過類似挖掘去發(fā)現(xiàn)更多的集團(tuán)內(nèi)部特點(diǎn)來指導(dǎo)企業(yè)下一步的營銷策略。技術(shù)路線:1、從基本理論出發(fā),分別介紹數(shù)據(jù)挖掘和CRM相關(guān)概念和基本理論,介紹關(guān)聯(lián)規(guī)則在CRM中使用的重要性和必要性。 2、使用關(guān)聯(lián)規(guī)則的 Apriori 算法找出數(shù)據(jù)庫中的頻繁項(xiàng)目集,并用這些頻繁項(xiàng)目集生成的關(guān)聯(lián)規(guī)則

16、來分析各業(yè)務(wù)類型之間的關(guān)聯(lián)程度及相互之間的影響,特別是目前各個企事業(yè)單位的集團(tuán)網(wǎng)中存在的有獨(dú)特性的關(guān)系和影響。3、數(shù)據(jù)導(dǎo)入;由于待挖掘的屬性有的來自客戶表,有的來自推廣方案信息表,而兩者是分散存放的不同服務(wù)器上的,所以,本文首先利用SQL Server 2005的數(shù)據(jù)導(dǎo)入導(dǎo)出功能,將三張表先統(tǒng)一導(dǎo)入到一張Excel表中,然后在作者的計(jì)算機(jī)的SQL Server 2005數(shù)據(jù)庫服務(wù)器上新建了一個數(shù)據(jù)庫Lastdatabase,并將這張Excel表導(dǎo)入到該數(shù)據(jù)庫中。4、關(guān)聯(lián)規(guī)則算法的比較;本文將Apriori算法與FP-Growth算法進(jìn)行對比,選出適合本軟件使用的最佳算法。在FP-Growth算

17、法中只需要對數(shù)據(jù)庫進(jìn)行兩次掃描,一次是為了得到頻繁1-項(xiàng)集,一次是為了建立FP樹。掃描數(shù)據(jù)庫的次數(shù)要遠(yuǎn)遠(yuǎn)小于Apriori算法。與Apriori算法通過候選項(xiàng)集來產(chǎn)生頻繁項(xiàng)集不同,F(xiàn)P算法并不產(chǎn)生候選項(xiàng)集,而是利用了條件FP樹直接生成頻繁項(xiàng)集。通過對比,選擇FP-Growth算法進(jìn)行分析計(jì)算。5、基于FP-Growth算法的CRM系統(tǒng)的決策模塊實(shí)現(xiàn);通過FP-Growth算法挖掘集團(tuán)內(nèi)各信息之間的關(guān)系,從而實(shí)現(xiàn)關(guān)聯(lián)規(guī)則在移動CRM中的決策功能。四、 預(yù)期成果 1、基于徐州移動公司CRM系統(tǒng)的用戶信息分析系統(tǒng);2、研究生學(xué)位論文學(xué)位論文工作計(jì)劃表論文題目:基于數(shù)據(jù)挖掘技術(shù)的用戶信息分析系統(tǒng)的研究

18、與實(shí)現(xiàn)論文工作起止日期:2014.3-2015.6工作項(xiàng)目工作內(nèi)容計(jì)劃完成日期文獻(xiàn)閱讀 和科學(xué)調(diào)研(調(diào)研課題主要內(nèi)容、閱讀主要文獻(xiàn)資料)1、閱讀關(guān)聯(lián)規(guī)則相關(guān)書籍2、閱讀數(shù)據(jù)挖掘相關(guān)書籍3、文獻(xiàn)研究與移動數(shù)據(jù)分析需求調(diào)研4、了解現(xiàn)關(guān)聯(lián)規(guī)則研究的方向13.11-14.1方案論證(課題的應(yīng)用價值與可行性)通過對相關(guān)文獻(xiàn)的閱讀,掌握國內(nèi)外數(shù)據(jù)挖掘技術(shù)的研究進(jìn)展和相關(guān)理論知識,調(diào)查、收集國內(nèi)外數(shù)據(jù)挖掘相關(guān)的算法和分析方法。進(jìn)行數(shù)據(jù)分析指標(biāo)體系的研究和設(shè)計(jì),系統(tǒng)分析,設(shè)計(jì)和技術(shù)實(shí)現(xiàn),完成開題報告。14.1-14.3設(shè)計(jì)或研究階段(研究方法、技術(shù)路線、實(shí)驗(yàn)方案)1、對關(guān)聯(lián)規(guī)則算法中Apriori進(jìn)行探討,并

19、針對企業(yè)實(shí)際情況進(jìn)行算法的改進(jìn)2、 通過關(guān)聯(lián)規(guī)則的對企業(yè)客戶信息進(jìn)行分析,作出評估,為企業(yè)下一步的工作提供依據(jù)3、系統(tǒng)運(yùn)行測試,及迭代式地系統(tǒng)修正14.3-14.11論文撰寫完成論文的寫作。結(jié)合所收集整理的資料,在導(dǎo)師的指導(dǎo)下進(jìn)行論文的編寫搜集中國Internet的相關(guān)數(shù)據(jù)爭14.12-15.6課題研制條件落實(shí)情況:1、導(dǎo)師具有強(qiáng)有力的科研網(wǎng)絡(luò),制定了科學(xué)有效、規(guī)范的培養(yǎng)計(jì)劃。2、學(xué)校提供固定場地為課題研究活動室,不固定的場地為資料室、電教室、圖書室、教室等。 3、學(xué)校閱覽室、圖書館,可以隨時閱讀。信息系統(tǒng)完善,可以24小時查閱資料。 4、本研究自2013年11月起,每周不低于20小時,研究時

20、間充足,可確保課題研究的順利開展和結(jié)題。 課題來源(下達(dá)部門):軟件學(xué)院課題名稱:基于數(shù)據(jù)挖掘技術(shù)的用戶信息分析系統(tǒng)的研究與實(shí)現(xiàn)課題負(fù)責(zé)人:呂淑玲論文類型:1)工程設(shè)計(jì) 2)產(chǎn)品研制報告 3)研究論文 (請打 )導(dǎo)師對開題報告和論文計(jì)劃的可行性提出意見:校內(nèi)導(dǎo)師: 企業(yè)方導(dǎo)師: (手寫)學(xué)院審批意見: 學(xué)院主管領(lǐng)導(dǎo)(簽字、蓋章): 日期: 年 月 日電子科技大學(xué)工程碩士學(xué)位論文文獻(xiàn)綜述姓名:呂淑玲學(xué)號:201192230642工程領(lǐng)域:軟件工程綜述題目:基于數(shù)據(jù)挖掘技術(shù)的用戶信息分析系統(tǒng)的研究與實(shí)現(xiàn)導(dǎo)師意見:校內(nèi)導(dǎo)師:企業(yè)方導(dǎo)師: (手寫)注:1、文獻(xiàn)綜述加頁附后,整齊裝訂。 2、紙張限用 A

21、4(頁邊距為上、下:2.5cm, 左為2.6cm,右為2.1cm;字體為宋體小四,行間距為18磅)。 3、文獻(xiàn)綜述應(yīng)對選題所涉及的工程技術(shù)問題或研究課題的國內(nèi)外狀況有清晰的描述與分析,一般不少于3000字。4、至少應(yīng)閱讀20篇中外文獻(xiàn),其中英文文獻(xiàn)不少于5篇?;跀?shù)據(jù)挖掘技術(shù)的用戶信息分析系統(tǒng)的研究與實(shí)現(xiàn)一、 前言光明日報北京2013年2月25日電(記者郭麗君)工業(yè)和信息化部今天發(fā)布的通信業(yè)運(yùn)行狀況報告顯示,截至到2013年1月份,全國移動電話用戶超11.22億。移動電話用戶中,3G用戶達(dá)到24588萬。1月份,全國電信業(yè)務(wù)總量完成1111.6億元,比上年同期增長9.1;移動通信收入完成630

22、.1億元,比上年同期增長6.7。移動行業(yè)發(fā)展到今天,各種移動企業(yè)與客戶的交往發(fā)生了很大的變化,誰也不能保證客戶從一而終,各移動企業(yè)要想保留住自己的客戶,就必須更多地了解客戶的需求,客戶關(guān)系管理技術(shù)就使企業(yè)為了保持企業(yè)競爭力而采取的面向客戶、以客戶為驅(qū)動和以客戶為中心的決策技術(shù)。移動企業(yè)要想與自己的客戶建立一種持久的關(guān)系,從每個客戶身上獲取最大的利潤,降低企業(yè)運(yùn)營成本,減少因客戶的離去而產(chǎn)生的損失和無效的經(jīng)營決策而產(chǎn)生的浪費(fèi),就要求各企業(yè)能夠深入了解客戶的習(xí)慣、喜好,依此正確地估計(jì)到客戶對移動產(chǎn)品的各種需求,并在最短的時間內(nèi)滿足客戶的各種需求要做到這些,就必須對客戶在與企業(yè)交互過程中的各種客戶數(shù)

23、據(jù)收集、整理和分析,然后根據(jù)收集到的數(shù)據(jù),挖掘出隱含在這些數(shù)據(jù)中的有用信息和知識。只有在正確的時間里通過正確的渠道給正確的客戶提供恰當(dāng)?shù)姆?wù)才能實(shí)現(xiàn)客戶關(guān)系管理的目標(biāo)。但是隨著數(shù)據(jù)庫技術(shù)的廣泛應(yīng)用于發(fā)展,企業(yè)客戶數(shù)據(jù)量爆炸式的膨脹,很多企業(yè)由于缺乏發(fā)現(xiàn)隱含在眾多數(shù)據(jù)中有用信息的能力,他們就沒有辦法將隱含在這些數(shù)據(jù)中的信息轉(zhuǎn)化為有用的知識。數(shù)據(jù)挖掘技術(shù)就是幫助各移動企業(yè)解決同客戶在交互過程中遇到的各種問題的最重要的技術(shù)之一,客戶關(guān)系管理系統(tǒng)就是決策科學(xué)技術(shù)和數(shù)據(jù)挖掘技術(shù)應(yīng)用中發(fā)展最快的領(lǐng)域之一。二、主題中國移動通信最主要的工作就是為移動用戶提供各種各樣的通信服務(wù),而用戶使用的各種服務(wù)都需要到中國

24、移動通信的營業(yè)部門辦理相應(yīng)的業(yè)務(wù),在中國移動 CRM 系統(tǒng)內(nèi)部,辦理業(yè)務(wù)都是由 CRM 系統(tǒng)內(nèi)部的服務(wù)開通體系模塊來為用戶開通的,由此可見,服務(wù)開通這個子系統(tǒng)模塊在整個移動系統(tǒng)中占據(jù)著極其重要的地位和作用。CRM(Customer Relationship Management,客戶關(guān)系管理),它面對企業(yè)市場和銷售部門,核心內(nèi)容是管理分析客戶行為信息,構(gòu)建客戶交流渠道,為客戶提供完善周到的售后服務(wù)。應(yīng)用CRM重構(gòu)移動業(yè)的管理模式是移動企業(yè)信息化管理發(fā)展的必然趨勢。目前,一些世界級的移動運(yùn)營商,如英國移動、AT&T,德國移動、MCI,SPRINT,TELIA等,無不把CRM作為企業(yè)競爭的

25、利器。在國內(nèi)當(dāng)前的競爭形勢下,CRM業(yè)務(wù)已經(jīng)最能撥動各移動運(yùn)營商管理層的心弦。與此同時,數(shù)據(jù)挖掘、數(shù)據(jù)倉庫等一些先進(jìn)技術(shù)也被企業(yè)作為數(shù)據(jù)分析的工具引入到客戶關(guān)系管理中,為企業(yè)經(jīng)營決策提供科學(xué)、準(zhǔn)確的依據(jù)。有鑒于此,本文針對移動企業(yè)CRM實(shí)施中的數(shù)據(jù)挖掘及其算法實(shí)現(xiàn)進(jìn)行了一些有意義的探討以其為移動企業(yè)決策者決策提供有力的依據(jù)。本課題的主要任務(wù)是分析數(shù)據(jù)挖掘技術(shù)中關(guān)聯(lián)規(guī)則在移動CRM中的應(yīng)用情況,隨時了解移動企業(yè)客戶的需求變化,改進(jìn)對客戶的服務(wù)水平,從而提高客戶的忠誠度,進(jìn)而提升移動運(yùn)營企業(yè)在市場中的競爭力。1、國內(nèi)外研究現(xiàn)狀數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用研究是從二十世紀(jì)九十年代后期才開始的,主要

26、集中在零售、銀行、移動、保險等行業(yè)。國內(nèi)外對基于數(shù)據(jù)挖掘的客戶關(guān)系管理的應(yīng)用研究主要集中在以下幾個方面:1)新挖掘技術(shù)的應(yīng)用研究。數(shù)據(jù)挖掘技術(shù)隨著其它的相關(guān)學(xué)科,如計(jì)算機(jī)技術(shù)、統(tǒng)計(jì)學(xué)等學(xué)科的發(fā)展而不斷發(fā)展,新挖掘技術(shù)有效性、可伸縮性和應(yīng)用效益性的研究已經(jīng)成為當(dāng)前研究的熱點(diǎn)。2)數(shù)據(jù)的處理研究。CRM中存在海量數(shù)據(jù),其中包括很多不完善、有噪聲、待處理的數(shù)據(jù),尋找合適的數(shù)據(jù)挖掘技術(shù)對這些不完美數(shù)據(jù)進(jìn)行處理使其顯露潛在有用知識也成了近年來研究方向之一。3)此外還有對挖掘結(jié)果的研究。數(shù)據(jù)挖掘必須有明確的目的,其構(gòu)造的模型必須簡潔,其挖掘出來的知識必須易于用戶理解,可視化技術(shù)和模型簡化的研究也吸引了很多

27、學(xué)者的關(guān)注。除此以外,目前的研究還包括數(shù)據(jù)倉庫技術(shù)和聯(lián)機(jī)分析處理(OLAP)在CRM的應(yīng)用等等。1999年初,我國的CRM市場幾乎為零。從1999年下半年開始,CRM就開始在中國IT業(yè)內(nèi)迅速地發(fā)展起來,不管是投資商、用戶還是國內(nèi)外軟件廠商都開始關(guān)注它。我國的CRM市場具有如下特點(diǎn):2、國內(nèi)CRM市場處于萌芽時期國內(nèi)市場無論是從產(chǎn)品結(jié)構(gòu)、區(qū)域結(jié)構(gòu)、行業(yè)結(jié)構(gòu),還是從銷售渠道來看,整個市場體態(tài)都還不健全。市場區(qū)域主要集中在北京、上海等經(jīng)濟(jì)發(fā)達(dá)地區(qū)。CRM的應(yīng)用行業(yè)以郵電、金融等經(jīng)濟(jì)實(shí)力較強(qiáng)、信息化程度較高的行業(yè)為主。1)提供CRM產(chǎn)品的廠商較少CRM進(jìn)入國內(nèi)時間不長,無論用戶還是廠商都非常關(guān)注這個產(chǎn)

28、品,很多軟件廠商紛紛推出自己的CRM產(chǎn)品,但是能夠提供功能比較全面的CRM產(chǎn)品的國內(nèi)廠商很少,有些只能提供實(shí)現(xiàn)客戶管理中的幾個應(yīng)用模塊,有的只是在ERP的某些模塊上稍作修改,并沒有真正實(shí)現(xiàn)客戶關(guān)系管理系統(tǒng)的“客戶為中心”的理念。2)市場需求量大在競爭激烈的信息化時代,客戶關(guān)系管理系統(tǒng)提出的“幫助提高本產(chǎn)品用戶營業(yè)額、擴(kuò)大市場占有率以及提高客戶忠誠度”等功能,使得很多企事業(yè)用戶對此產(chǎn)品情有獨(dú)鐘,市場需求相應(yīng)加大。 三、研究內(nèi)容及技術(shù)路線針對如上提到的課題研究目的與意義,本課題的主要任務(wù)是分析數(shù)據(jù)挖掘技術(shù)在移動行業(yè)CRM中的應(yīng)用情況,隨時了解移動企業(yè)客戶的需求變化,改進(jìn)對客戶的服務(wù)水平,從而提高客

29、戶的滿意度、忠誠度,分析移動業(yè)務(wù)關(guān)聯(lián)情況,促進(jìn)交叉銷售,并因此為企業(yè)帶來更多的利潤,減少不必要的損失,提升企業(yè)運(yùn)作的效率。研究內(nèi)容:本文通過對用戶人口信息、用戶行為和價值進(jìn)行數(shù)據(jù)挖掘,得出客戶分群和基本特征,實(shí)現(xiàn)徐州移動公司CRM系統(tǒng)中的決策管理模塊,完成對移動客戶數(shù)據(jù)信息分析并提出了具體的營銷方案,使得企業(yè)獲得滿意的回報成為可能。1)通過該軟件發(fā)現(xiàn)不同群體、不同職業(yè)甚至不同年齡層次帶來的消費(fèi)差異,進(jìn)而發(fā)現(xiàn)指導(dǎo)信息。在這個模塊中,首先對客戶數(shù)據(jù)進(jìn)行預(yù)處理,然后應(yīng)用算法生成頻繁項(xiàng)集,進(jìn)而得到關(guān)聯(lián)規(guī)則。2)通過挖掘,我們可以得到一些結(jié)論,不同消費(fèi)群體消費(fèi)有著不同的特點(diǎn)和傾向性,移動公司應(yīng)該針對這些

30、特點(diǎn)有目的的推廣自己的業(yè)務(wù),這樣不僅增加企業(yè)效益,同時還能抓住消費(fèi)者的心,讓消費(fèi)者有依賴感和幸福感。而且可以通過類似挖掘去發(fā)現(xiàn)更多的集團(tuán)內(nèi)部特點(diǎn)來提出了具體的營銷方案,推送給客戶。技術(shù)路線:本文通過vb語言實(shí)現(xiàn)軟件開發(fā),利用SQL sever實(shí)現(xiàn)數(shù)據(jù)處理,具體步驟如下:1)數(shù)據(jù)導(dǎo)入;由于待挖掘的屬性有的來自客戶表,有的來自推廣方案信息表,而兩者是分散存放的不同服務(wù)器上的,所以,本文首先利用SQL Server 2005的數(shù)據(jù)導(dǎo)入導(dǎo)出功能,將三張表先統(tǒng)一導(dǎo)入到一張Excel表中,然后在作者的計(jì)算機(jī)的SQL Server 2005數(shù)據(jù)庫服務(wù)器上新建了一個數(shù)據(jù)庫Lastdatabase,并將這張Ex

31、cel表導(dǎo)入到該數(shù)據(jù)庫中。2)數(shù)據(jù)清理和規(guī)約導(dǎo)入后的lastdatabase數(shù)據(jù)庫包含三張表。根據(jù)挖掘的目的,有許多屬性和挖掘無關(guān),為此對該三張表進(jìn)行消減維度。消減的步驟如下:首先利用SQL語句新建一張表lasttable,然后利用SQL語句將有關(guān)的列插入到該lasttable中。這樣,lasttable就是最后要挖掘的對象。新生成的lasttable表中有一些噪聲數(shù)據(jù),比如,一些客戶信息不完整,對這些不完整的數(shù)據(jù),本文選用了數(shù)據(jù)清理中的忽略元組的方法,編寫了SQL語句的delete語句,以Customerid為關(guān)鍵字刪除這些元組。3)關(guān)聯(lián)規(guī)則算法的比較;本文將Apriori算法與FP-Gro

32、wth算法進(jìn)行對比,選出適合本軟件使用的最佳算法。在FP-Growth算法中只需要對數(shù)據(jù)庫進(jìn)行兩次掃描,一次是為了得到頻繁1-項(xiàng)集,一次是為了建立FP樹。掃描數(shù)據(jù)庫的次數(shù)要遠(yuǎn)遠(yuǎn)小于Apriori算法。與Apriori算法通過候選項(xiàng)集來產(chǎn)生頻繁項(xiàng)集不同,F(xiàn)P算法并不產(chǎn)生候選項(xiàng)集,而是利用了條件FP樹直接生成頻繁項(xiàng)集。通過對比,選擇FP-Growth算法進(jìn)行分析計(jì)算。4)基于FP-Growth算法的CRM系統(tǒng)的決策模塊實(shí)現(xiàn);通過FP-Growth算法挖掘集團(tuán)內(nèi)各信息之間的關(guān)系,從而實(shí)現(xiàn)關(guān)聯(lián)規(guī)則在移動CRM中的決策管理功能。四、預(yù)期成果基于數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則,利用FP-Growth算法,通過vb語言

33、開發(fā)徐州移動分公司CRM系統(tǒng)中的決策支持模塊。實(shí)現(xiàn)對某高校典型消費(fèi)的分析和決策。1、從基本理論出發(fā),分別介紹數(shù)據(jù)挖掘和CRM相關(guān)概念和基本理論,介紹關(guān)聯(lián)規(guī)則在CRM中使用的重要性和必要性。 2、使用關(guān)聯(lián)規(guī)則的 Apriori 算法找出數(shù)據(jù)庫中的頻繁項(xiàng)目集,并用這些頻繁項(xiàng)目集生成的關(guān)聯(lián)規(guī)則來分析各業(yè)務(wù)類型之間的關(guān)聯(lián)程度及相互之間的影響,特別是目前各個企事業(yè)單位的集團(tuán)網(wǎng)中存在的有獨(dú)特性的關(guān)系和影響。1) 找出客戶之間相互關(guān)聯(lián)度,對數(shù)據(jù)進(jìn)行分類,挖掘可能出現(xiàn)的消費(fèi)傾向,及時調(diào)整產(chǎn)品銷售傾向。2) 找出各個集團(tuán)網(wǎng)內(nèi)部個體存在的關(guān)聯(lián)度與獨(dú)特性,促進(jìn)銷售方法和手段的革新。五、本文的安排第一章提出了本課題研

34、究背景,重點(diǎn)介紹了關(guān)聯(lián)規(guī)則研究內(nèi)容及技術(shù)路線以及關(guān)聯(lián)規(guī)則在國內(nèi)外研究現(xiàn)狀、存在問題和全文主要安排。第二章:數(shù)據(jù)挖掘的定義、產(chǎn)生、發(fā)展、任務(wù)、方法為第五章研究并聯(lián)規(guī)則的應(yīng)用奠定基礎(chǔ)。第三章:關(guān)聯(lián)規(guī)則挖掘的基本概念、挖掘的類型、步驟以及Apriori算法。第四章:CRM產(chǎn)生的背景、定義系統(tǒng)功能以及在移動通訊業(yè)的應(yīng)用。第五章:關(guān)聯(lián)規(guī)則在 CRM 中的應(yīng)用主要有分類和預(yù)測,概括起來有客戶群體分類、客戶盈利能力分析、客戶獲取和保持以及客戶滿意度分析等多個方面。第六章:對本論文的工作進(jìn)行總結(jié),并對今后研究工作做了展望。六、參考文獻(xiàn)1 劉國利客戶關(guān)系管理初探電腦與信用卡,2012,(08):53552 陶紅

35、超.農(nóng)村商業(yè)銀行客戶滿意度研究D.南京:南京林業(yè)大學(xué),2012. 3Song Zi-lin,Zheng Shi-ming,Zhou Ning,Ren Zai-an,Zheng Shi-jun,DaiRong-rong,Yang Jun-qiang.The Research about the Application of Data Miningtechnology Based on SLIG in the CRMJ.Computer Science and SoftwareEngineering.2008,451-454.4 劉 晶.基于層次分析法的客戶滿意度模型和改善研究D.上海:上海交通大學(xué),2011. 5毛國君,段立娟,王實(shí),石云著數(shù)據(jù)挖掘原理與算法(第二版)M.北京:清華大學(xué)出版社,2007.6 Li TongYan,Li XingMing.”Study of the neural network applied to weightedassociation rules mining,”Proceedings of the 2007 International Conference on Wavelet Analysis and Pattern Recognition,ICWAPR07,vol.2,2008,pp.742-745.7

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論