基于Web的數(shù)據(jù)挖掘在電子商務(wù)中的研究與應(yīng)用_第1頁
基于Web的數(shù)據(jù)挖掘在電子商務(wù)中的研究與應(yīng)用_第2頁
基于Web的數(shù)據(jù)挖掘在電子商務(wù)中的研究與應(yīng)用_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、基于Web的數(shù)據(jù)挖掘在電子商務(wù)中的研究與應(yīng)用【摘要】 市場競爭的加劇和日益?zhèn)€性化的需求使消費者的意見和反饋在企業(yè)生產(chǎn)、管理、營銷等各個方面占據(jù)的位置越來越重要??蛻糍Y料數(shù)據(jù)的龐大與復(fù)雜要求一種新的方式來管理和處理。在這種新型的商務(wù)模式下,如何對 網(wǎng)絡(luò) 上大量的信息進行有效組織利用,幫助海量數(shù)據(jù)的擁有者們找出真正有價值的信息和知識,以指導(dǎo)他們的商業(yè)決策行為,成為電子商務(wù)經(jīng)營者關(guān)注的問題。迅速 發(fā)展 的基于Web的數(shù)據(jù)挖掘技術(shù),為解決電子商務(wù)所面臨的問題提供了有效途徑。【關(guān)鍵詞】 Web數(shù)據(jù)挖掘概述 電子商務(wù)應(yīng)用 客戶關(guān)系應(yīng)用 一、Web數(shù)據(jù)挖掘 1.1 Web數(shù)據(jù)挖掘概述 :數(shù)據(jù)挖掘(Data

2、Mining)是從大量的、不完全的、有噪聲的、模糊的和隨機的數(shù)據(jù)中提取人們事先不知道的、潛在有用的信息和知識的非平凡過程。 Web數(shù)據(jù)挖掘(Web Mining)是從Web文檔和Web活動中抽取感興趣的、潛在的有用模式和隱藏的信息,是數(shù)據(jù)庫、數(shù)據(jù)挖掘、人工智能、信息檢索、 自然 語言理解等技術(shù)的綜合 應(yīng)用 ,是在一定基礎(chǔ)上應(yīng)用數(shù)據(jù)挖掘的 方法 以發(fā)現(xiàn)有用的知識來幫助人們從WWW中提取知識。Web數(shù)據(jù)挖掘可以分為Web 內(nèi)容 挖掘(Web Content Mining)、Web結(jié)構(gòu)挖掘(Web Structure Mining)、Web使用記錄挖掘(Web Usage Mining)三類。Web

3、內(nèi)容挖掘是指從文檔內(nèi)容或其描述中抽取知識的過程。Web結(jié)構(gòu)挖掘是指從Web組織結(jié)構(gòu)和鏈接關(guān)系中推導(dǎo)知識。Web使用記錄挖掘是指從服務(wù)器端記錄的客戶訪問日志或從客戶的瀏覽信息中抽取感興趣的模式。 1.2 電子商務(wù)中Web數(shù)據(jù)挖掘的步驟 :電子商務(wù)中Web數(shù)據(jù)挖掘的步驟如下: 明確數(shù)據(jù)挖掘的對象業(yè)務(wù)對象,確定商業(yè)應(yīng)用主題,不能盲目地進行挖掘; 將與業(yè)務(wù)對象的各類原始數(shù)據(jù)收集起來作為挖掘的數(shù)據(jù)源泉; 對收集的數(shù)據(jù)進行預(yù)處理,一般包括數(shù)據(jù)凈化、用戶識別、會話識別、路徑補充、事務(wù)識別和格式化等階段,以提高挖掘效率,剔除無用、無關(guān)信息并對信息進行必要的整理。 根據(jù)需要解決的問題建立合適的數(shù)據(jù)挖掘模型,然后

4、利用已知數(shù)據(jù)對模型進行訓(xùn)練和測試,并應(yīng)用該模型得到挖掘結(jié)果; 利用可視化技術(shù),驗證、解釋挖掘的結(jié)果,并據(jù)此做出決策或豐富知識,即進行模式分析與應(yīng)用。 在整個Web數(shù)據(jù)挖掘的過程中,被明確的業(yè)務(wù)對象是挖掘過程的基礎(chǔ),它驅(qū)動整個Web數(shù)據(jù)挖掘的全過程; 同時,也是檢驗挖掘結(jié)果和引導(dǎo)分析人員完成挖掘的依據(jù)。 1.3 電子商務(wù)中Web數(shù)據(jù)挖掘的數(shù)據(jù)源 在電子商務(wù)中,可以用來作為數(shù)據(jù)挖掘分析的數(shù)據(jù)量比較大,而且類型眾多,總結(jié)起來有以下幾種類型的數(shù)據(jù)可用于Web數(shù)據(jù)挖掘技術(shù)產(chǎn)生各種知識模式。 服務(wù)器數(shù)據(jù)??蛻粼L問站點時會在Web服務(wù)器上留下相應(yīng)的日志數(shù)據(jù),這些日志數(shù)據(jù)通常以文本文件的形式存儲在服務(wù)器上。一

5、般包括servers logs、error logs、cookies logs等。 查詢數(shù)據(jù)。它是電子商務(wù)站點在服務(wù)器上產(chǎn)生的一種典型數(shù)據(jù)。例如,對于再現(xiàn)存儲的客戶也許會搜索一些產(chǎn)品或某些廣告信息。 在線市場數(shù)據(jù)。這類數(shù)據(jù)主要是傳統(tǒng)關(guān)系數(shù)據(jù)庫里存儲的有關(guān)電子商務(wù)站點信息、用戶購買信息、商品信息等數(shù)據(jù)。 Web頁面。主要是指HTML和XML頁面的內(nèi)容,包括文本、圖片、語音、圖像等。 Web頁面超級鏈接關(guān)系。主要是指頁面之間存在的超級鏈接關(guān)系,這也是一種重要的資源。 客戶登記信息。客戶登記信息是指客戶通過Web頁輸入的、要提交給服務(wù)器的相關(guān)用戶信息,這些信息通常是關(guān)于用戶的人口特征。 二、Web數(shù)

6、據(jù)挖掘在電子商務(wù)中的應(yīng)用 2.1數(shù)據(jù)抽取方法在電子商務(wù)中的應(yīng)用 與傳統(tǒng)商務(wù)活動相比,電子商務(wù)具有更多的虛擬和不確定的因素:如客戶購買的心理、動機、能力、欲望等。Web數(shù)據(jù)挖掘要解決的問題就是如何從零散的無規(guī)則的網(wǎng)絡(luò)數(shù)據(jù)中找到有用的和有規(guī)則的數(shù)據(jù)和知識,也就是進行數(shù)據(jù)抽取,以期對數(shù)據(jù)進行濃縮,給出它的緊湊描述,從數(shù)據(jù)泛化的角度討論數(shù)據(jù)總結(jié),把最原始、基本的信息數(shù)據(jù)從低層次抽象到高層次,以便于企業(yè)決策。 2.2 基于Web數(shù)據(jù)挖掘的智能化搜索引擎 電子商務(wù)企業(yè)在活動過程中面臨的問題之一是如何通過Internet全面、準確、及時地收集到企業(yè)內(nèi)、外部的環(huán)境信息,尤其是一些隱性的、關(guān)系到企業(yè)經(jīng)營成敗的關(guān)

7、鍵信息,以提高競爭力。將Web數(shù)據(jù)挖掘技術(shù)應(yīng)用于搜索引擎,使之成為智能搜索引擎,從而提高性能,滿足電子商務(wù)企業(yè)的需要。Web挖掘技術(shù)主要在以下幾個方面對搜索引擎有借鑒作用:文檔的自動分類、自動摘要的形成、檢索結(jié)果的聯(lián)機聚類和相關(guān)度排序及實現(xiàn)個性化的搜索引擎。經(jīng)過文檔的分類處理,可以對搜索結(jié)果進行分門別類,幫助用戶快速的對目標知識進行定位,從而提高用戶進行網(wǎng)上信息搜索的效率;自動摘要能夠解決大部分搜索引擎機械地截取文檔的前幾句和固定字數(shù)的摘要使信息反映不完整的缺陷,使用戶能較準確、快速、方便地了解檢索信息;通過對檢索結(jié)果的文檔集合進行聚類,可以使得與用戶檢索結(jié)果相關(guān)的文檔集中在一起,從而將大大縮

8、小所需瀏覽的頁面數(shù)量;將Web使用挖掘中的個性化技術(shù)應(yīng)用在搜索引擎中,可以在大量訓(xùn)練樣本的基礎(chǔ)上,得到數(shù)據(jù)對象間的內(nèi)在特征,并以此為依據(jù)進行有目的的信息提取,使得搜索引擎可以按照用戶的興趣偏好擴充用戶搜索的關(guān)鍵詞,個性化的搜索引擎可以提高用戶檢索的查全率與查準率。 三、 Web數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用 客戶關(guān)系管理的核心 客戶關(guān)系管理(Customer Relationship Management,簡稱CRM)的核心是通過客戶和他們行為的有效數(shù)據(jù)收集,發(fā)現(xiàn)潛在的市場和客戶,從而獲得更高的商業(yè)利潤,通過完善的客戶服務(wù)和深入的客戶分析來滿足客戶的需求,保證實現(xiàn)客戶的終生價值。 Web數(shù)據(jù)挖

9、掘在客戶關(guān)系管理中的應(yīng)用 Web數(shù)據(jù)挖掘能夠幫助企業(yè)確定客戶的特點,使企業(yè)能夠為客戶提供有針對性的服務(wù)。將Web數(shù)據(jù)挖掘用在電子商務(wù)CRM中主要體現(xiàn)在客戶的獲取和保持、價值客戶鑒別、客戶滿意度分析及改善站點結(jié)構(gòu)等幾方面。 通過Web數(shù)據(jù)挖掘,可以理解訪問者的動態(tài)行為,據(jù)此優(yōu)化電子商務(wù)網(wǎng)站的經(jīng)營模式。通過把所掌握的大量客戶分成不同的類,對不同類的客戶提供個性化服務(wù)來提高客戶的滿意度,從而保持老客戶;通過對新訪問者的網(wǎng)頁瀏覽記錄進行分析,就可以判斷出該訪問者是屬于哪一類客戶,是有利可圖的潛在客戶還是毫無價值的過客,達到區(qū)別對待、節(jié)省銷售成本、提高訪問者到購買者的轉(zhuǎn)化率的目的,從而挖掘潛在客戶;通過

10、對具有相似瀏覽行為的客戶進行分組,提取組中客戶的共同特征,從而實現(xiàn)客戶的聚類,這可以幫助電子商務(wù)企業(yè)更好地了解客戶的興趣、消費習慣和消費傾向,預(yù)測他們的需求,有針對性地向他們推薦特定的商品并實現(xiàn)交叉銷售,可以提高交易成功率和交易量,提高營銷效果。 此外,站點的結(jié)構(gòu)和內(nèi)容是吸引客戶的關(guān)鍵。利用關(guān)聯(lián)規(guī)則的發(fā)現(xiàn),針對不同客戶動態(tài)調(diào)整站點結(jié)構(gòu)和頁面內(nèi)容,把具有一定支持度和信任度的相關(guān)聯(lián)的物品放在一起以有助于銷售;通過路徑分析等技術(shù)可以判定出一類用戶對Web站點頻繁訪問的路徑,這些路徑反映這類用戶瀏覽站點頁面的順序和習慣,將客戶訪問的有關(guān)聯(lián)的文件實現(xiàn)直接鏈接,讓客戶容易地訪問到想要的頁面。這樣的網(wǎng)站會給客戶留下好印象,提高客戶忠誠度,吸引客戶,延長他們在網(wǎng)站上的駐留時間以及提高再次訪問的機率。 通過挖掘客戶的行為記錄和反饋情況,進一步優(yōu)化網(wǎng)站組織結(jié)構(gòu)和服務(wù)方式以提高網(wǎng)站的效率。通過Web數(shù)據(jù)挖掘,可以得到可靠的市場反

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論