數(shù)據(jù)挖掘數(shù)據(jù)匯編_第1頁(yè)
數(shù)據(jù)挖掘數(shù)據(jù)匯編_第2頁(yè)
數(shù)據(jù)挖掘數(shù)據(jù)匯編_第3頁(yè)
數(shù)據(jù)挖掘數(shù)據(jù)匯編_第4頁(yè)
數(shù)據(jù)挖掘數(shù)據(jù)匯編_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)挖掘數(shù)據(jù)匯編從Internet如果大家有補(bǔ)充的可隨時(shí)交流、增加、修改。中國(guó)大陸數(shù)據(jù)挖掘討論組

精品文檔放心下載2000年12月1.數(shù)據(jù)挖掘技術(shù)的由來(lái)........................................................................................................4

1.1網(wǎng)絡(luò)之后的下一個(gè)技術(shù)熱點(diǎn)...................................................................................4

1.2數(shù)據(jù)爆炸但知識(shí)貧乏..............................................................................................4

1.3支持?jǐn)?shù)據(jù)挖掘技術(shù)的基礎(chǔ)......................................................................................4

1.4從商業(yè)數(shù)據(jù)到商業(yè)信息的進(jìn)化..............................................................................5

1.5數(shù)據(jù)挖掘逐漸演變的過(guò)程......................................................................................5

2數(shù)據(jù)挖掘的定義................................................................................................................6

2.1技術(shù)上的定義及含義..............................................................................................6

2.2商業(yè)角度的定義......................................................................................................7

2.3數(shù)據(jù)挖掘與傳統(tǒng)分析方法的區(qū)別....................................................................7

3資料挖掘的研究歷史和現(xiàn)狀............................................................................................7

3.1研究歷史............................................................................................................7

3.2出版物及工具....................................................................................................8

3.3國(guó)內(nèi)現(xiàn)狀............................................................................................................8

3.4業(yè)界觀點(diǎn)............................................................................................................8

4資料挖掘研究?jī)?nèi)容和本質(zhì)................................................................................................9

4.1廣義知識(shí)(Generalization)............................................................................9

4.2關(guān)聯(lián)知識(shí)(Association).......................................................................................9

4.3分類知識(shí)(Classification&Clustering).....................................................................9

4.4預(yù)測(cè)型知識(shí)(Prediction).....................................................................................10

4.5偏差型知識(shí)(Deviation)...........................................................................................10

5數(shù)據(jù)挖掘的功能..............................................................................................................10

5.1自動(dòng)預(yù)測(cè)趨勢(shì)和行為......................................................................................10

5.2關(guān)聯(lián)分析..........................................................................................................10

5.3聚類..................................................................................................................11

5.4概念描述.................................................................................................................11

5.5偏差檢測(cè).................................................................................................................11

6數(shù)據(jù)挖掘常用技術(shù)..........................................................................................................11

6.1人工神經(jīng)網(wǎng)絡(luò)..................................................................................................11

6.2決策樹(shù).....................................................................................................................11

6.3遺傳算法.................................................................................................................11

6.4近鄰算法.................................................................................................................11

6.5規(guī)則推導(dǎo).................................................................................................................11

7數(shù)據(jù)挖掘工具..................................................................................................................12

7.1基于神經(jīng)網(wǎng)絡(luò)的工具......................................................................................12

7.2基于規(guī)則和決策樹(shù)的工具..............................................................................12

7.3基于模糊邏輯的工具......................................................................................12

7.4綜合多方法工具..............................................................................................12

8數(shù)據(jù)挖掘的流程..............................................................................................................12

8.1數(shù)據(jù)挖掘環(huán)境.........................................................................................................12

8.2數(shù)據(jù)挖掘過(guò)程圖.....................................................................................................12

8.3數(shù)據(jù)挖掘過(guò)程工作量......................................................................................13

8.4數(shù)據(jù)挖掘過(guò)程簡(jiǎn)介.................................................................................................13

8.5數(shù)據(jù)挖掘需要的人員.............................................................................................14

9資料挖掘未來(lái)研究方向..................................................................................................14感謝閱讀10數(shù)據(jù)挖掘熱點(diǎn)..................................................................................................................15精品文檔放心下載10.1網(wǎng)站的數(shù)據(jù)挖掘(Websitedatamining)........................................................15精品文檔放心下載10.2生物信息或基因的數(shù)據(jù)挖掘..............................................................................16感謝閱讀10.3文本的數(shù)據(jù)挖掘(Textualmining)...................................................................16感謝閱讀11Web數(shù)據(jù)挖掘與XML..................................................................................................16精品文檔放心下載11.1Web數(shù)據(jù)挖掘的難點(diǎn)...........................................................................................16謝謝閱讀11.2XML與Web數(shù)據(jù)挖掘技術(shù)................................................................................17謝謝閱讀12數(shù)據(jù)挖掘應(yīng)用..................................................................................................................20精品文檔放心下載12.1數(shù)據(jù)挖掘解決的典型商業(yè)問(wèn)題.........................................................................20感謝閱讀12.2數(shù)據(jù)挖掘在市場(chǎng)營(yíng)銷的應(yīng)用.............................................................................20謝謝閱讀12.3成功案例.............................................................................................................21謝謝閱讀13實(shí)施資料挖掘項(xiàng)目考慮的問(wèn)題......................................................................................23謝謝閱讀14實(shí)施資料挖掘項(xiàng)目考慮的問(wèn)題......................................................................................24感謝閱讀1.1.數(shù)據(jù)挖掘技術(shù)的由來(lái)1.1網(wǎng)絡(luò)之后的下一個(gè)技術(shù)熱點(diǎn)精品文檔放心下載社會(huì)。如果用芯片集成度來(lái)衡量微電子技術(shù),用CPU處理速度來(lái)衡量計(jì)算機(jī)技術(shù),用信道感謝閱讀傳輸速率來(lái)衡量通信技術(shù),那么摩爾定律告訴我們,它們都是以每18個(gè)月翻一番的速度在感謝閱讀增長(zhǎng),這一勢(shì)頭已經(jīng)維持了十多年。在美國(guó),廣播達(dá)到5000萬(wàn)戶用了38年;電視用了13感謝閱讀Internet撥號(hào)上網(wǎng)達(dá)到5000萬(wàn)戶僅用了4年。全球IP網(wǎng)發(fā)展速度達(dá)到每6個(gè)月翻一番,謝謝閱讀國(guó)內(nèi)情況亦然。1999年初,中國(guó)上網(wǎng)用戶為210萬(wàn),現(xiàn)在已經(jīng)達(dá)到600萬(wàn)。網(wǎng)絡(luò)的發(fā)展導(dǎo)精品文檔放心下載1998年全球產(chǎn)值排序前1005149個(gè)。感謝閱讀謝謝閱讀感謝閱讀技術(shù)呢?有人甚至提出要把網(wǎng)絡(luò)技術(shù)與火的發(fā)明相比擬?;鸬陌l(fā)明區(qū)別了動(dòng)物和人,種種科精品文檔放心下載精品文檔放心下載量和人的素質(zhì),使人成為社會(huì)人、全球人。精品文檔放心下載象:《紐約時(shí)報(bào)》由60年代的10~20版擴(kuò)張至現(xiàn)在的100~200版,最高曾達(dá)1572版;謝謝閱讀《北京青年報(bào)》也已是16~40版;市場(chǎng)營(yíng)銷報(bào)已達(dá)100版。然而在現(xiàn)實(shí)社會(huì)中,人均日閱感謝閱讀讀時(shí)間通常為30~4524謝謝閱讀謝謝閱讀安全難以保證;第四是信息形式不一致,難以統(tǒng)一處理。人們開(kāi)始提出一個(gè)新的口號(hào):“要謝謝閱讀學(xué)會(huì)拋棄信息”。人們開(kāi)始考慮:“如何才能不被信息淹沒(méi),而是從中及時(shí)發(fā)現(xiàn)有用的知識(shí)、精品文檔放心下載提高信息利用率?”面對(duì)這一挑戰(zhàn),數(shù)據(jù)開(kāi)采和知識(shí)發(fā)現(xiàn)(DMKD)技術(shù)應(yīng)運(yùn)而生,并顯示出強(qiáng)大的生命感謝閱讀力。1.2數(shù)據(jù)爆炸但知識(shí)貧乏感謝閱讀謝謝閱讀精品文檔放心下載等功能,但無(wú)法發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)系和規(guī)則,無(wú)法根據(jù)現(xiàn)有的資料預(yù)測(cè)未來(lái)的發(fā)展趨勢(shì)。謝謝閱讀缺乏挖掘數(shù)據(jù)背后隱藏的知識(shí)的手段,導(dǎo)致了“數(shù)據(jù)爆炸但知識(shí)貧乏”的現(xiàn)象。感謝閱讀1.3支持?jǐn)?shù)據(jù)挖掘技術(shù)的基礎(chǔ)感謝閱讀謝謝閱讀謝謝閱讀謝謝閱讀精品文檔放心下載成熟,他們是:--海量資料搜集--強(qiáng)大的多處理器計(jì)算機(jī)--數(shù)據(jù)挖掘算法Friedman[1997]--超大規(guī)模數(shù)據(jù)庫(kù)的出現(xiàn),例如商業(yè)數(shù)據(jù)倉(cāng)庫(kù)和計(jì)算機(jī)自動(dòng)收集的數(shù)據(jù)記錄;

--先進(jìn)的計(jì)算機(jī)技術(shù),例如更快和更大的計(jì)算能力和并行體系結(jié)構(gòu);

--對(duì)巨大量數(shù)據(jù)的快速訪問(wèn);謝謝閱讀--對(duì)這些資料應(yīng)用精深的統(tǒng)計(jì)方法計(jì)算的能力。感謝閱讀對(duì)計(jì)算機(jī)硬件性能越來(lái)越高的要求,也可以用現(xiàn)在已經(jīng)成熟的并行多處理機(jī)的技術(shù)來(lái)滿足;感謝閱讀另外數(shù)據(jù)挖掘算法經(jīng)過(guò)了這10多年的發(fā)展也已經(jīng)成為一種成熟,穩(wěn)定,且易于理解和操作謝謝閱讀的技術(shù)。1.4從商業(yè)數(shù)據(jù)到商業(yè)信息的進(jìn)化謝謝閱讀精品文檔放心下載庫(kù)技術(shù)已經(jīng)可以快速地回答商業(yè)上的很多問(wèn)題了。進(jìn)化階段商業(yè)問(wèn)題支持技術(shù)產(chǎn)品廠家產(chǎn)品特點(diǎn)資料搜集(60年代)“過(guò)去五年中我的總收入是多少?”盤(pán)IBM,CDC態(tài)的數(shù)據(jù)信息資料訪問(wèn)(80年代)關(guān)系數(shù)據(jù)庫(kù)“在新英格蘭的分Oracle、Sybase、在記錄級(jí)提供歷(RDBMS構(gòu)部去年三月的銷Informix、IBM、化查詢語(yǔ)言售額是多少?”Microsoft信息(SQLODBC“在新英格蘭的分資料倉(cāng)庫(kù);決策支部去年三月的銷聯(lián)機(jī)分析處理Pilot、Comshare、在各種層次上提謝謝閱讀援售額是多少?波(OLAPArbor、Cognos、謝謝閱讀(90年代)士頓據(jù)此可得出據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)Microstrategy數(shù)據(jù)信息精品文檔放心下載什么結(jié)論?”數(shù)據(jù)挖掘(正在流行)“下個(gè)月波士頓的Pilot、Lockheed、銷售會(huì)怎么樣?器計(jì)算機(jī)、海量數(shù)IBM、SGI、其它為什么?”據(jù)庫(kù)初創(chuàng)公司提供預(yù)測(cè)性的信息表一、數(shù)據(jù)挖掘的進(jìn)化歷程。謝謝閱讀感謝閱讀掘技術(shù)在當(dāng)前的數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中進(jìn)入了實(shí)用的階段。1.5數(shù)據(jù)挖掘逐漸演變的過(guò)程數(shù)據(jù)挖掘其實(shí)是一個(gè)逐漸演變的過(guò)程,電子數(shù)據(jù)處理的初期,人們就試圖通過(guò)某些方法精品文檔放心下載來(lái)實(shí)現(xiàn)自動(dòng)決策支持,當(dāng)時(shí)機(jī)器學(xué)習(xí)成為人們關(guān)心的焦點(diǎn).機(jī)器學(xué)習(xí)的過(guò)程就是將一些已知的謝謝閱讀并已被成功解決的問(wèn)題作為范例輸入計(jì)算機(jī),機(jī)器通過(guò)學(xué)習(xí)這些范例總結(jié)并生成相應(yīng)的規(guī)則,感謝閱讀這些規(guī)則具有通用性,使用它們可以解決某一類的問(wèn)題.隨后,隨著神經(jīng)網(wǎng)絡(luò)技術(shù)的形成和發(fā)感謝閱讀展,人們的注意力轉(zhuǎn)向知識(shí)工程,知識(shí)工程不同于機(jī)器學(xué)習(xí)那樣給計(jì)算機(jī)輸入范例,讓它生成精品文檔放心下載精品文檔放心下載些問(wèn)題。專家系統(tǒng)就是這種方法所得到的成果,但它有投資大、效果不甚理想等不足。80感謝閱讀感謝閱讀80精品文檔放心下載KDD(Knowledgediscoveryindatabase).它泛指所有從源數(shù)據(jù)中發(fā)掘模式或聯(lián)系的方法,人們精品文檔放心下載KDD來(lái)描述整個(gè)數(shù)據(jù)發(fā)掘的過(guò)程,包括最開(kāi)始的制定業(yè)務(wù)目標(biāo)到最精品文檔放心下載終的結(jié)果分析,而用數(shù)據(jù)挖掘(datamining)來(lái)描述使用挖掘算法進(jìn)行數(shù)據(jù)挖掘的子過(guò)程。精品文檔放心下載精品文檔放心下載略是將統(tǒng)計(jì)方法與資料挖掘有機(jī)的結(jié)合起來(lái)。謝謝閱讀感謝閱讀從操作數(shù)據(jù)源中挖掘信息2數(shù)據(jù)挖掘的定義2.1技術(shù)上的定義及含義數(shù)據(jù)挖掘(DataMining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際感謝閱讀精品文檔放心下載謝謝閱讀感謝閱讀可接受、可理解、可運(yùn)用;并不要求發(fā)現(xiàn)放之四海皆準(zhǔn)的知識(shí),僅支持特定的發(fā)現(xiàn)問(wèn)題。謝謝閱讀----何為知識(shí)?從廣義上理解,數(shù)據(jù)、信息也是知識(shí)的表現(xiàn)形式,但是人們更把概念、規(guī)則、精品文檔放心下載謝謝閱讀感謝閱讀精品文檔放心下載謝謝閱讀精品文檔放心下載感謝閱讀精品文檔放心下載感謝閱讀形成新的技術(shù)熱點(diǎn)。感謝閱讀精品文檔放心下載精品文檔放心下載語(yǔ)言表達(dá)所發(fā)現(xiàn)的結(jié)果。2.2商業(yè)角度的定義進(jìn)行抽取、轉(zhuǎn)換、分析和其它模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。

由于純機(jī)會(huì)的(Opportunistic)商業(yè)運(yùn)作而產(chǎn)生。分析這些數(shù)據(jù)也不再是單純?yōu)榱搜芯康男?/p>

因此而得名。感謝閱讀揭示隱藏的、未知的或驗(yàn)證已知的規(guī)律性,并進(jìn)一步將其模型化的先進(jìn)有效的方法。感謝閱讀2.3數(shù)據(jù)挖掘與傳統(tǒng)分析方法的區(qū)別數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析()的本質(zhì)區(qū)別是數(shù)據(jù)挖掘是在

沒(méi)有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí).數(shù)據(jù)挖掘所得到的信息應(yīng)具有先未知,有效和

可實(shí)用三個(gè)特征.謝謝閱讀先前未知的信息是指該信息是預(yù)先未曾預(yù)料到的,既數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺(jué)

發(fā)現(xiàn)的信息或知識(shí),甚至是違背直覺(jué)的信息或知識(shí),挖掘出的信息越是出乎意料,就可能越有

價(jià)值.在商業(yè)應(yīng)用中最典型的例子就是一家連鎖店通過(guò)數(shù)據(jù)挖掘發(fā)現(xiàn)了小孩尿布和啤酒之間

有著驚人的聯(lián)系.謝謝閱讀3資料挖掘的研究歷史和現(xiàn)狀3.1研究歷史從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)知識(shí)(KDD1989年舉行的第十一屆國(guó)際聯(lián)合人工智謝謝閱讀KDD國(guó)際研討會(huì)已經(jīng)召開(kāi)了8次,謝謝閱讀規(guī)模由原來(lái)的專題討論會(huì)發(fā)展到國(guó)際學(xué)術(shù)大會(huì)(見(jiàn)表1精品文檔放心下載系統(tǒng)應(yīng)用,注重多種發(fā)現(xiàn)策略和技術(shù)的集成,以及多種學(xué)科之間的相互滲透。1999年,亞精品文檔放心下載太地區(qū)在北京召開(kāi)的第三屆PAKDD會(huì)議收到158篇論文,空前熱烈。IEEE的Knowledge精品文檔放心下載andDataEngineering會(huì)刊率先在1993年出版了KDD技術(shù)??2⑿杏?jì)算、計(jì)算機(jī)網(wǎng)絡(luò)和謝謝閱讀精品文檔放心下載到了膾炙人口的程度。3.2出版物及工具此外,在Internet上還有不少KDD電子出版物,其中以半月刊KnowledgeDiscovery感謝閱讀Nuggets最為權(quán)威(/subscribe.html)。在網(wǎng)上還有許多自由論壇,感謝閱讀如DMEmailClub等。至于DMKD書(shū)籍,可以在任意一家計(jì)算機(jī)書(shū)店找到十多本。目前,精品文檔放心下載世界上比較有影響的典型數(shù)據(jù)挖掘系統(tǒng)有:SAS公司的EnterpriseMiner、IBM公司的精品文檔放心下載IntelligentMinerSGI公司的SetMinerSPSS公司的ClementineSybase公司的Warehouse精品文檔放心下載StudioRuleQuestResearch公司的See5CoverStoryEXPLORAKnowledgeDiscovery感謝閱讀Workbench、DBMiner、Quest等。讀者可以訪問(wèn).網(wǎng)站,該網(wǎng)感謝閱讀站提供了許多數(shù)據(jù)挖掘系統(tǒng)和工具的性能測(cè)試報(bào)告。3.3國(guó)內(nèi)現(xiàn)狀DMKD1993年國(guó)家自然科學(xué)基感謝閱讀精品文檔放心下載感謝閱讀精品文檔放心下載感謝閱讀精品文檔放心下載感謝閱讀數(shù)據(jù)的知識(shí)發(fā)現(xiàn)以及Web數(shù)據(jù)挖掘。3.4業(yè)界觀點(diǎn)GartnerGroup的一次高級(jí)技術(shù)調(diào)查將數(shù)據(jù)挖掘和人工智能列為“未來(lái)三到五年內(nèi)精品文檔放心下載將對(duì)工業(yè)產(chǎn)生深遠(yuǎn)影響的五大關(guān)鍵技術(shù)”之首,并且還將并行處理體系和數(shù)據(jù)挖掘列為未來(lái)感謝閱讀五年內(nèi)投資焦點(diǎn)的十大新興技術(shù)前兩位。根據(jù)最近Gartner的HPC研究表明,“隨著資料捕精品文檔放心下載謝謝閱讀價(jià)值,采用更為廣闊的并行處理系統(tǒng)來(lái)創(chuàng)建新的商業(yè)增長(zhǎng)點(diǎn)?!敝x謝閱讀4資料挖掘研究?jī)?nèi)容和本質(zhì)----隨著DMKD精品文檔放心下載支柱:數(shù)據(jù)庫(kù)、人工智能和數(shù)理統(tǒng)計(jì)。因此,KDD大會(huì)程序委員會(huì)曾經(jīng)由這三個(gè)學(xué)科的權(quán)感謝閱讀威人物同時(shí)來(lái)任主席。目前DMKD的主要研究?jī)?nèi)容包括基礎(chǔ)理論、發(fā)現(xiàn)算法、數(shù)據(jù)倉(cāng)庫(kù)、謝謝閱讀精品文檔放心下載結(jié)構(gòu)化數(shù)據(jù)中的知識(shí)發(fā)現(xiàn)以及網(wǎng)上數(shù)據(jù)挖掘等。----數(shù)據(jù)挖掘所發(fā)現(xiàn)的知識(shí)最常見(jiàn)的有以下四類:4.1廣義知識(shí)(Generalization)----廣義知識(shí)指類別特征的概括性描述知識(shí)。根據(jù)資料的微觀特性發(fā)現(xiàn)其表征的、帶有普遍精品文檔放心下載感謝閱讀煉和抽象。----廣義知識(shí)的發(fā)現(xiàn)方法和實(shí)現(xiàn)技術(shù)有很多,如數(shù)據(jù)立方體、面向?qū)傩缘臍w約等。數(shù)據(jù)立方感謝閱讀體還有其它一些別名,如“多維數(shù)據(jù)庫(kù)”、“實(shí)現(xiàn)視圖”、“OLAP"等。該方法的基本思想是實(shí)感謝閱讀據(jù)視圖。另一種廣義知識(shí)發(fā)現(xiàn)方法是加拿大SimonFraser大學(xué)提出的面向?qū)傩缘臍w約方法。

這種方法以類SQL語(yǔ)言表示數(shù)據(jù)挖掘查詢,收集數(shù)據(jù)庫(kù)中的相關(guān)數(shù)據(jù)集,然后在相關(guān)數(shù)據(jù)

集上應(yīng)用一系列數(shù)據(jù)推廣技術(shù)進(jìn)行數(shù)據(jù)推廣,包括屬性刪除、概念樹(shù)提升、屬性閾值控制、

計(jì)數(shù)及其它聚集函數(shù)傳播等。4.2關(guān)聯(lián)知識(shí)(Association)感謝閱讀----那么其中一項(xiàng)的屬性值就可以依據(jù)其它屬性值進(jìn)行預(yù)測(cè)。最為著名的關(guān)聯(lián)規(guī)則發(fā)現(xiàn)方法是

R.Agrawal提出的Apriori算法。關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)可分為兩步。第一步是疊代識(shí)別所有的頻

的核心,也是計(jì)算量最大的部分。謝謝閱讀4.3分類知識(shí)(Classification&Clustering)精品文檔放心下載----它反映同類事物共同性質(zhì)的特征型知識(shí)和不同事物之間的差異型特征知識(shí)。最為典型的

為典型的決策樹(shù)學(xué)習(xí)系統(tǒng)是ID3,它采用自頂向下不回溯策略,能保證找到一個(gè)簡(jiǎn)單的樹(shù)。

算法C4.5和C5.0都是ID3的擴(kuò)展,它們將分類領(lǐng)域從類別屬性擴(kuò)展到數(shù)值型屬性。

----資料分類還有統(tǒng)計(jì)、粗糙集(RoughSet)等方法。線性回歸和線性辨別分析是典型的統(tǒng)

網(wǎng)絡(luò)方法在數(shù)據(jù)庫(kù)中進(jìn)行分類和規(guī)則提取。謝謝閱讀4.4預(yù)測(cè)型知識(shí)(Prediction)----它根據(jù)時(shí)間序列型資料,由歷史的和當(dāng)前的數(shù)據(jù)去推測(cè)未來(lái)的數(shù)據(jù),也可以認(rèn)為是以時(shí)謝謝閱讀間為關(guān)鍵屬性的關(guān)聯(lián)知識(shí)。----目前,時(shí)間序列預(yù)測(cè)方法有經(jīng)典的統(tǒng)計(jì)方法、神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)等。1968年Box和

Jenkins提出了一套比較完善的時(shí)間序列建模理論和分析方法,這些經(jīng)典的數(shù)學(xué)方法通過(guò)建

立新的模型。也有許多系統(tǒng)借助并行算法的計(jì)算優(yōu)勢(shì)進(jìn)行時(shí)間序列預(yù)測(cè)。謝謝閱讀4.5偏差型知識(shí)(Deviation)----(Deviation)以滿足不同用戶不同層次決策的需要。感謝閱讀5數(shù)據(jù)挖掘的功能從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)隱含的、有意義的知識(shí),主要有以下五類功能。謝謝閱讀5.1自動(dòng)預(yù)測(cè)趨勢(shì)和行為精品文檔放心下載謝謝閱讀感謝閱讀對(duì)指定事件最可能作出反應(yīng)的群體。5.2關(guān)聯(lián)分析感謝閱讀感謝閱讀謝謝閱讀確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。5.3聚類精品文檔放心下載精品文檔放心下載分類學(xué)。80年代初,Mchalski提出了概念聚類技術(shù)牞其要點(diǎn)是,在劃分對(duì)象時(shí)不僅考慮對(duì)精品文檔放心下載象之間的距離,還要求劃分出的類具有某種內(nèi)涵描述,從而避免了傳統(tǒng)技術(shù)的某些片面性。謝謝閱讀5.4概念描述感謝閱讀謝謝閱讀生成一個(gè)類的特征性描述只涉及該類對(duì)象中所有對(duì)象的共性。生成區(qū)別性描述的方法很多,精品文檔放心下載如決策樹(shù)方法、遺傳算法等。5.5偏差檢測(cè)感謝閱讀感謝閱讀值隨時(shí)間的變化等。偏差檢測(cè)的基本方法是,尋找觀測(cè)結(jié)果與參照值之間有意義的差別。精品文檔放心下載6數(shù)據(jù)挖掘常用技術(shù)6.1人工神經(jīng)網(wǎng)絡(luò)仿照生理神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的非線形預(yù)測(cè)模型,通過(guò)學(xué)習(xí)進(jìn)行模式識(shí)別。謝謝閱讀6.2決策樹(shù)代表著決策集的樹(shù)形結(jié)構(gòu)。6.3遺傳算法基于進(jìn)化理論,并采用遺傳結(jié)合、遺傳變異、以及自然選擇等設(shè)計(jì)方法的優(yōu)化技術(shù)。感謝閱讀6.4近鄰算法將數(shù)據(jù)集合中每一個(gè)記錄進(jìn)行分類的方法。6.5規(guī)則推導(dǎo)從統(tǒng)計(jì)意義上對(duì)數(shù)據(jù)中的“如果-那么”規(guī)則進(jìn)行尋找和推導(dǎo)。謝謝閱讀感謝閱讀精品文檔放心下載機(jī)分析系統(tǒng)中去了。7數(shù)據(jù)挖掘工具7.1基于神經(jīng)網(wǎng)絡(luò)的工具感謝閱讀感謝閱讀據(jù),所以在市場(chǎng)數(shù)據(jù)庫(kù)的分析和建模方面應(yīng)用廣泛。7.2基于規(guī)則和決策樹(shù)的工具謝謝閱讀謝謝閱讀據(jù)進(jìn)行分析和預(yù)測(cè)。這類工具的主要優(yōu)點(diǎn)是,規(guī)則和決策樹(shù)都是可讀的。感謝閱讀7.3基于模糊邏輯的工具“最近”搜索謝謝閱讀謝謝閱讀有記錄,并對(duì)結(jié)果進(jìn)行評(píng)估。7.4綜合多方法工具謝謝閱讀括并行數(shù)據(jù)庫(kù)牘。這類工具開(kāi)采能力很強(qiáng),但價(jià)格昂貴,并要花很長(zhǎng)時(shí)間進(jìn)行學(xué)習(xí)。謝謝閱讀8數(shù)據(jù)挖掘的流程8.1數(shù)據(jù)挖掘環(huán)境數(shù)據(jù)挖掘是指一個(gè)完整的過(guò)程,該過(guò)程從大型數(shù)據(jù)庫(kù)中挖掘先前未知的,有效的,可實(shí)用感謝閱讀的信息,并使用這些信息做出決策或豐富知識(shí).數(shù)據(jù)挖掘環(huán)境可示意如下圖:數(shù)據(jù)庫(kù)數(shù)據(jù)挖可視化掘工具工具數(shù)據(jù)挖掘環(huán)境框圖8.2數(shù)據(jù)挖掘過(guò)程圖下圖描述了數(shù)據(jù)挖掘的基本過(guò)程和主要步驟邏輯數(shù)被選擇被轉(zhuǎn)換被抽取被同化

預(yù)處理?yè)?jù)庫(kù)的數(shù)據(jù)的數(shù)據(jù)的信息的知識(shí)

后的數(shù)選擇預(yù)處理轉(zhuǎn)換挖掘分析和同數(shù)據(jù)挖掘過(guò)程的步驟8.3數(shù)據(jù)挖掘過(guò)程工作量在數(shù)據(jù)挖掘中被研究的業(yè)務(wù)對(duì)象是整個(gè)過(guò)程的基礎(chǔ),它驅(qū)動(dòng)了整個(gè)數(shù)據(jù)挖掘過(guò)程,也是檢精品文檔放心下載驗(yàn)最后結(jié)果和指引分析人員完成資料挖掘的依據(jù)和顧問(wèn).圖2各步驟是按一定順序完成的,當(dāng)謝謝閱讀然整個(gè)過(guò)程中還會(huì)存在步驟間的反饋.數(shù)據(jù)挖掘的過(guò)程并不是自動(dòng)的,絕大多數(shù)的工作需要人感謝閱讀工完成.圖3給出了各步驟在整個(gè)過(guò)程中的工作量之比.可以看到,60%的時(shí)間用在數(shù)據(jù)準(zhǔn)備感謝閱讀上,這說(shuō)明了數(shù)據(jù)挖掘?qū)?shù)據(jù)的嚴(yán)格要求,而后挖掘工作僅占總工作量的10%.精品文檔放心下載確定業(yè)務(wù)對(duì)象數(shù)據(jù)準(zhǔn)備數(shù)據(jù)處理結(jié)果分析和知識(shí)的同化圖3數(shù)據(jù)挖掘過(guò)程工作量比例8.4數(shù)據(jù)挖掘過(guò)程簡(jiǎn)介過(guò)程中各步驟的大體內(nèi)容如下:1.1.確定業(yè)務(wù)物件清晰地定義出業(yè)務(wù)問(wèn)題,認(rèn)清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步.挖掘的最后結(jié)構(gòu)是謝謝閱讀不可預(yù)測(cè)的,但要探索的問(wèn)題應(yīng)是有預(yù)見(jiàn)的,為了數(shù)據(jù)挖掘而數(shù)據(jù)挖掘則帶有盲目性,是不會(huì)精品文檔放心下載成功的.2.2.資料準(zhǔn)備1)1)數(shù)據(jù)的選擇搜索所有與業(yè)務(wù)對(duì)象有關(guān)的內(nèi)部和外部數(shù)據(jù)信息,并從中選擇出適用于數(shù)據(jù)挖掘應(yīng)謝謝閱讀用的數(shù)據(jù).2)2)數(shù)據(jù)的預(yù)處理研究資料的質(zhì)量,為進(jìn)一步的分析作準(zhǔn)備.并確定將要進(jìn)行的挖掘操作的類型.精品文檔放心下載3)3)數(shù)據(jù)的轉(zhuǎn)換將數(shù)據(jù)轉(zhuǎn)換成一個(gè)分析模型.這個(gè)分析模型是針對(duì)挖掘算法建立的.建立一個(gè)真正適精品文檔放心下載合挖掘算法的分析模型是數(shù)據(jù)挖掘成功的關(guān)鍵.3.3.數(shù)據(jù)挖掘?qū)λ玫降慕?jīng)過(guò)轉(zhuǎn)換的數(shù)據(jù)進(jìn)行挖掘.除了完善從選擇合適的挖掘算法外,其余一切工感謝閱讀作都能自動(dòng)地完成.4.4.結(jié)果分析解釋并評(píng)估結(jié)果.其使用的分析方法一般應(yīng)作數(shù)據(jù)挖掘操作而定,通常會(huì)用到可視化技精品文檔放心下載術(shù).5.5.知識(shí)的同化將分析所得到的知識(shí)集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去.謝謝閱讀8.5數(shù)據(jù)挖掘需要的人員數(shù)據(jù)挖掘過(guò)程的分步實(shí)現(xiàn),不同的步會(huì)需要是有不同專長(zhǎng)的人員,他們大體可以分為三

類.感謝閱讀業(yè)務(wù)分析人員:要求精通業(yè)務(wù),能夠解釋業(yè)務(wù)對(duì)象,并根據(jù)各業(yè)務(wù)對(duì)象確定出用于數(shù)據(jù)定

義和挖掘算法的業(yè)務(wù)需求.感謝閱讀資料分析人員:精通資料分析技術(shù),并對(duì)統(tǒng)計(jì)學(xué)有較熟練的掌握,有能力把業(yè)務(wù)需求轉(zhuǎn)化

為數(shù)據(jù)挖掘的各步操作,并為每步操作選擇合適的技術(shù).謝謝閱讀數(shù)據(jù)管理人員:精通數(shù)據(jù)管理技術(shù),并從數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中收集數(shù)據(jù).感謝閱讀從上可見(jiàn),資料挖掘是一個(gè)多種專家合作的過(guò)程,也是一個(gè)在資金上和技術(shù)上高投入的感謝閱讀過(guò)程.這一過(guò)程要反復(fù)進(jìn)行牞在反復(fù)過(guò)程中,不斷地趨近事物的本質(zhì),不斷地優(yōu)先問(wèn)題的解謝謝閱讀決方案。數(shù)據(jù)重組和細(xì)分添加和拆分記錄選取數(shù)據(jù)樣本可視化數(shù)據(jù)探索聚類分析神經(jīng)網(wǎng)絡(luò)、謝謝閱讀謝謝閱讀價(jià)。9資料挖掘未來(lái)研究方向----當(dāng)前,DMKD研究方興未艾,其研究與開(kāi)發(fā)的總體水平相當(dāng)于數(shù)據(jù)庫(kù)技術(shù)在70年代所精品文檔放心下載處的地位,迫切需要類似于關(guān)系模式、DBMS系統(tǒng)和SQL查詢語(yǔ)言等理論和方法的指導(dǎo),感謝閱讀才能使DMKD的應(yīng)用得以普遍推廣。預(yù)計(jì)在本世紀(jì),DMKD的研究還會(huì)形成更大的高潮,謝謝閱讀研究焦點(diǎn)可能會(huì)集中到以下幾個(gè)方面:發(fā)現(xiàn)語(yǔ)言的形式化描述,即研究專門(mén)用于知識(shí)發(fā)現(xiàn)的數(shù)據(jù)挖掘語(yǔ)言,也許會(huì)像SQL感謝閱讀語(yǔ)言一樣走向形式化和標(biāo)準(zhǔn)化;尋求數(shù)據(jù)挖掘過(guò)程中的可視化方法,使知識(shí)發(fā)現(xiàn)的過(guò)程能夠被用戶理解,也便于在感謝閱讀知識(shí)發(fā)現(xiàn)的過(guò)程中進(jìn)行人機(jī)交互;研究在網(wǎng)絡(luò)環(huán)境下的數(shù)據(jù)挖掘技術(shù)(WebMiningDMKD感謝閱讀服務(wù)器,并且與數(shù)據(jù)庫(kù)服務(wù)器配合,實(shí)現(xiàn)WebMining;謝謝閱讀DataMiningforAudio&Video精品文檔放心下載形數(shù)據(jù)、視頻圖像數(shù)據(jù)、聲音數(shù)據(jù)乃至綜合多媒體數(shù)據(jù)的開(kāi)采;謝謝閱讀處理的數(shù)據(jù)將會(huì)涉及到更多的數(shù)據(jù)類型,這些數(shù)據(jù)類型或者比較復(fù)雜,或者是結(jié)構(gòu)感謝閱讀比較獨(dú)特。為了處理這些復(fù)雜的資料,就需要一些新的和更好的分析和建立模型的精品文檔放心下載方法,同時(shí)還會(huì)涉及到為處理這些復(fù)雜或獨(dú)特?cái)?shù)據(jù)所做的費(fèi)時(shí)和復(fù)雜數(shù)據(jù)準(zhǔn)備的一謝謝閱讀些工具和軟件。交互式發(fā)現(xiàn);知識(shí)的維護(hù)更新。DMKD將首先滿足信息時(shí)代用戶的急感謝閱讀需,大量的基于DMKD的決策支持軟件產(chǎn)品將會(huì)問(wèn)世。只有從數(shù)據(jù)中有效地提取信息,從謝謝閱讀感謝閱讀夠真正成為與物質(zhì)、能源相媲美的資源,信息時(shí)代才會(huì)真正到來(lái)。謝謝閱讀10數(shù)據(jù)挖掘熱點(diǎn)就目前來(lái)看,將來(lái)的幾個(gè)熱點(diǎn)包括網(wǎng)站的數(shù)據(jù)挖掘(Websitedatamining)、生物信息感謝閱讀或基因(Bioinformatics/genomics)的數(shù)據(jù)挖掘及其文本的數(shù)據(jù)挖掘(Textualmining)。下謝謝閱讀面就這幾個(gè)方面加以簡(jiǎn)單介紹。10.1網(wǎng)站的數(shù)據(jù)挖掘(Websitedatamining)精品文檔放心下載需求隨著Web技術(shù)的發(fā)展,各類電子商務(wù)網(wǎng)站風(fēng)起云涌,建立起一個(gè)電子商務(wù)網(wǎng)站并不困謝謝閱讀謝謝閱讀謝謝閱讀謝謝閱讀謝謝閱讀感謝閱讀量的記錄文件(Logfiles)和登記表,如何對(duì)這些數(shù)據(jù)進(jìn)行分析和挖掘,充分了解客戶的喜感謝閱讀精品文檔放心下載精品文檔放心下載了解客戶。電子商務(wù)網(wǎng)站數(shù)據(jù)挖掘息,此部分信息主要來(lái)自于客戶的登記表;而另外一部分?jǐn)?shù)據(jù)主要來(lái)自瀏覽者的點(diǎn)擊流

(Click-stream),此部分資料主要用于考察客戶的行為表現(xiàn)。但有的時(shí)候,客戶對(duì)自己的

據(jù)準(zhǔn)備。目前,有很多廠商正在致力于開(kāi)發(fā)專門(mén)用于網(wǎng)站挖掘的軟件。精品文檔放心下載10.2生物信息或基因的數(shù)據(jù)挖掘這都需要數(shù)據(jù)挖掘技術(shù)的支持。精品文檔放心下載精品文檔放心下載精品文檔放心下載謝謝閱讀的地步。10.3文本的數(shù)據(jù)挖掘(Textualmining)感謝閱讀精品文檔放心下載感謝閱讀謝謝閱讀謝謝閱讀謝謝閱讀精品文檔放心下載分析功能。精品文檔放心下載數(shù)據(jù)挖掘?qū)l(fā)揮出越來(lái)越大的作用。11Web數(shù)據(jù)挖掘與XML11.1Web數(shù)據(jù)挖掘的難點(diǎn)Web上有海量的數(shù)據(jù)信息,怎樣對(duì)這些數(shù)據(jù)進(jìn)行復(fù)雜的應(yīng)用成了現(xiàn)今數(shù)據(jù)庫(kù)技術(shù)的研感謝閱讀謝謝閱讀Web精品文檔放心下載的數(shù)據(jù)而言,傳統(tǒng)的數(shù)據(jù)庫(kù)中的數(shù)據(jù)結(jié)構(gòu)性很強(qiáng),即其中的數(shù)據(jù)為完全結(jié)構(gòu)化的數(shù)據(jù),而精品文檔放心下載Web上的數(shù)據(jù)最大特點(diǎn)就是半結(jié)構(gòu)化。所謂半結(jié)構(gòu)化是相對(duì)于完全結(jié)構(gòu)化的傳統(tǒng)數(shù)據(jù)庫(kù)的謝謝閱讀數(shù)據(jù)而言。顯然,面向Web的數(shù)據(jù)挖掘比面向單個(gè)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘要復(fù)雜得多。感謝閱讀1.異構(gòu)數(shù)據(jù)庫(kù)環(huán)境從數(shù)據(jù)庫(kù)研究的角度出發(fā),Web網(wǎng)站上的信息也可以看作一個(gè)數(shù)據(jù)庫(kù),一個(gè)更大、更謝謝閱讀復(fù)雜的數(shù)據(jù)庫(kù)。Web上的每一個(gè)站點(diǎn)就是一個(gè)數(shù)據(jù)源,每個(gè)數(shù)據(jù)源都是異構(gòu)的,因而每一謝謝閱讀感謝閱讀感謝閱讀謝謝閱讀西。其次,還要解決Web上的數(shù)據(jù)查詢問(wèn)題,因?yàn)槿绻璧臄?shù)據(jù)不能很有效地得到,對(duì)謝謝閱讀這些數(shù)據(jù)進(jìn)行分析、集成、處理就無(wú)從談起。2.半結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)Web上的數(shù)據(jù)與傳統(tǒng)的數(shù)據(jù)庫(kù)中的數(shù)據(jù)不同,傳統(tǒng)的數(shù)據(jù)庫(kù)都有一定的數(shù)據(jù)模型,可

以根據(jù)模型來(lái)具體描述特定的數(shù)據(jù)。而Web上的數(shù)據(jù)非常復(fù)雜,沒(méi)有特定的模型描述,每

一站點(diǎn)的數(shù)據(jù)都各自獨(dú)立設(shè)計(jì),并且數(shù)據(jù)本身具有自述性和動(dòng)態(tài)可變性。因而,Web上的

之為半結(jié)構(gòu)化數(shù)據(jù)。半結(jié)構(gòu)化是Web上數(shù)據(jù)的最大特點(diǎn)。謝謝閱讀3.解決半結(jié)構(gòu)化的數(shù)據(jù)源問(wèn)題Web數(shù)據(jù)挖掘技術(shù)首要解決半結(jié)構(gòu)化數(shù)據(jù)源模型和半結(jié)構(gòu)化數(shù)據(jù)模型的查詢與集成問(wèn)

WebWeb上

的數(shù)據(jù)。針對(duì)Web上的數(shù)據(jù)半結(jié)構(gòu)化的特點(diǎn),尋找一個(gè)半結(jié)構(gòu)化的數(shù)據(jù)模型是解決問(wèn)題的

動(dòng)地從現(xiàn)有數(shù)據(jù)中抽取半結(jié)構(gòu)化模型的技術(shù)。面向Web的數(shù)據(jù)挖掘必須以半結(jié)構(gòu)化模型和

半結(jié)構(gòu)化數(shù)據(jù)模型抽取技術(shù)為前提。謝謝閱讀11.2XML與Web數(shù)據(jù)挖掘技術(shù)以XML為基礎(chǔ)的新一代WWW環(huán)境是直接面對(duì)Web數(shù)據(jù)的,不僅可以很好地兼容原

有的Web應(yīng)用,而且可以更好地實(shí)現(xiàn)Web中的信息共享與交換。XML可看作一種半結(jié)構(gòu)感謝閱讀XML感謝閱讀精確地查詢與模型抽取。1.XML的產(chǎn)生與發(fā)展XML(extensibleMarkupLanguage)是由萬(wàn)維網(wǎng)協(xié)會(huì)(W3C)Web應(yīng)用服務(wù)的謝謝閱讀SGML(StandardGeneralMarkupLanguage)的一個(gè)重要分支??偟膩?lái)說(shuō),XML是一種中介標(biāo)感謝閱讀示語(yǔ)言(Meta-markupLanguage)XML是一種類謝謝閱讀似于HTML,被設(shè)計(jì)用來(lái)描述數(shù)據(jù)的語(yǔ)言。XML提供了一種獨(dú)立的運(yùn)行程序的方法來(lái)共享謝謝閱讀數(shù)據(jù),它是用來(lái)自動(dòng)描述信息的一種新的標(biāo)準(zhǔn)語(yǔ)言,它能使計(jì)算機(jī)通信把Internet的功能由感謝閱讀信息傳遞擴(kuò)大到人類其它多種多樣的活動(dòng)中去。XML由若干規(guī)則組成,這些規(guī)則可用于創(chuàng)精品文檔放心下載建標(biāo)記語(yǔ)言,并能用一種被稱作分析程序的簡(jiǎn)明程序處理所有新創(chuàng)建的標(biāo)記語(yǔ)言,正如謝謝閱讀HTML為第一個(gè)計(jì)算機(jī)用戶閱讀Internet文文件提供一種顯示方式一樣,XML也創(chuàng)建了一謝謝閱讀種任何人都能讀出和寫(xiě)入的世界語(yǔ)。XML解決了HTML不能解決的兩個(gè)Web問(wèn)題,即感謝閱讀Internet發(fā)展速度快而接入速度慢的問(wèn)題,以及可利用的信息多,但難以找到自己需要的那精品文檔放心下載部分信息的問(wèn)題。XML能增加結(jié)構(gòu)和語(yǔ)義信息,可使計(jì)算機(jī)和服務(wù)器實(shí)時(shí)處理多種形式的感謝閱讀信息。因此,運(yùn)用XML的擴(kuò)展功能不僅能從Web服務(wù)器下載大量的信息,還能大大減少感謝閱讀網(wǎng)絡(luò)業(yè)務(wù)量。XML中的標(biāo)志(TAG)XML是能精品文檔放心下載夠進(jìn)行自解釋(SelfDescribing)的語(yǔ)言。XML使用DTD(DocumentTypeDefinition文文件類謝謝閱讀型定義)來(lái)顯示這些數(shù)據(jù),XSL(eXtensibleStyleSheetLanguage)是一種來(lái)描述這些文文件如謝謝閱讀何顯示的機(jī)制,它是XML的樣式表描述語(yǔ)言。XSL的歷史比HTML用的CSS(層迭式樣式謝謝閱讀表CascadingStyleSheets)還要悠久,XSLXML謝謝閱讀個(gè)用來(lái)格式化XML文檔的方法。XLL(eXtensibleLinkLanguage)是XML謝謝閱讀XMLHTMLXLL精品文檔放心下載XML謝謝閱讀使用戶很輕松地找到他們需要的信息。利用XML,Web設(shè)計(jì)人員不僅能創(chuàng)建文字和圖形,感謝閱讀精品文檔放心下載樣式表。2.XML的主要特點(diǎn)正是XML的特點(diǎn)決定了其卓越的性能表現(xiàn)。XML作為一種標(biāo)記語(yǔ)言,有許多特點(diǎn):謝謝閱讀(1)XML經(jīng)過(guò)精心設(shè)計(jì),整個(gè)規(guī)范簡(jiǎn)單明了,它由若干規(guī)則組成,這些規(guī)則可用感謝閱讀于創(chuàng)建標(biāo)記語(yǔ)言,并能用一種常常稱作分析程序的簡(jiǎn)明程序處理所有新創(chuàng)建的標(biāo)記語(yǔ)言。精品文檔放心下載XML謝謝閱讀如XML創(chuàng)建的標(biāo)記總是成對(duì)出現(xiàn),以及依靠稱作統(tǒng)一代碼的新的編碼標(biāo)準(zhǔn)。精品文檔放心下載(2)開(kāi)放。XML是SGML在市場(chǎng)上有許多成熟的軟件可用來(lái)幫助編寫(xiě)、管理等,開(kāi)放式謝謝閱讀標(biāo)準(zhǔn)XML的基礎(chǔ)是經(jīng)過(guò)驗(yàn)證的標(biāo)準(zhǔn)技術(shù),并針對(duì)網(wǎng)絡(luò)做最佳化。眾多業(yè)界頂尖公司,與感謝閱讀W3C的工作群組并肩合作,協(xié)助確保交互作業(yè)性,支持各式系統(tǒng)和瀏覽器上的開(kāi)發(fā)人員、謝謝閱讀XML標(biāo)準(zhǔn)。XML解釋器可以使用編程的方法來(lái)加載一個(gè)XML的謝謝閱讀,用戶就可以通過(guò)XML文件對(duì)象模型來(lái)獲取和操縱整個(gè)文文精品文檔放心下載件的信息,加快了網(wǎng)絡(luò)運(yùn)行速度。(3)高效且可擴(kuò)充。支持復(fù)用文檔片斷,使用者可以發(fā)明和使用自己的標(biāo)簽,也可與他謝謝閱讀人共享,可延伸性大,在XML中,可以定義無(wú)限量的一組標(biāo)注。XML提供了一個(gè)標(biāo)示結(jié)精品文檔放心下載XML謝謝閱讀XML精品文檔放心下載精品文檔放心下載轉(zhuǎn)交到其它應(yīng)用程序做進(jìn)一步的處理。XML提供了一個(gè)獨(dú)立的運(yùn)用程序的方法來(lái)共享數(shù)據(jù),謝謝閱讀使用DTDDTD謝謝閱讀個(gè)標(biāo)準(zhǔn)的DTD來(lái)驗(yàn)證你接受到的資料是否有效,你也可以使用一個(gè)DTD來(lái)驗(yàn)證你自己的感謝閱讀資料。(4)國(guó)際化。標(biāo)準(zhǔn)國(guó)際化,且支持世界上大多數(shù)文字。這源于依靠它的統(tǒng)一代碼的新的精品文檔放心下載編碼標(biāo)準(zhǔn),這種編碼標(biāo)準(zhǔn)支持世界上所有以主要語(yǔ)言編寫(xiě)的混合文本。在HTML中,就大謝謝閱讀精品文檔放心下載XML謝謝閱讀語(yǔ)言的軟件就能順利處理這些不同語(yǔ)言字符的任意組合。因此,XML不僅能在不同的計(jì)算謝謝閱讀機(jī)系統(tǒng)之間交換信息,而且能跨國(guó)界和超越不同文化疆界交換信息。謝謝閱讀3.XML在Web數(shù)據(jù)挖掘中的應(yīng)用XMLXMLXML在三謝謝閱讀層架構(gòu)上為數(shù)據(jù)處理提供了很好的方法。使用可升級(jí)的三層模型,XML可以從存在的資料精品文檔放心下載中產(chǎn)生出來(lái),使用XML結(jié)構(gòu)化的數(shù)據(jù)可以從商業(yè)規(guī)范和表現(xiàn)形式中分離出來(lái)。感謝閱讀促進(jìn)XML應(yīng)用的是那些用標(biāo)準(zhǔn)的HTML無(wú)法完成的Web應(yīng)用。這些應(yīng)用從大的方面謝謝閱讀講可以被分成以下四類:需要Web客戶端在兩個(gè)或更多異質(zhì)數(shù)據(jù)庫(kù)之間進(jìn)行通信的應(yīng)用;謝謝閱讀試圖將大部分處理負(fù)載從Web服務(wù)器轉(zhuǎn)到Web客戶端的應(yīng)用;需要Web客戶端將同樣的感謝閱讀數(shù)據(jù)以不同的瀏覽形式提供給不同的用戶的應(yīng)用;需要智能Web代理根據(jù)個(gè)人用戶的需要謝謝閱讀Web的數(shù)據(jù)挖掘技術(shù)有著重要的聯(lián)系,基于謝謝閱讀Web的數(shù)據(jù)挖掘必須依靠它們來(lái)實(shí)現(xiàn)。XML給基于Web感謝閱讀了許多好處。比如進(jìn)行更有意義的搜索,并且Web數(shù)據(jù)可被XML唯一地標(biāo)識(shí)。沒(méi)有謝謝閱讀XML,搜索軟件必須了解每個(gè)數(shù)據(jù)庫(kù)是如何構(gòu)建的,但這實(shí)際上是不可能的,因?yàn)槊總€(gè)數(shù)精品文檔放心下載謝謝閱讀的不兼容的數(shù)據(jù)庫(kù)實(shí)際上是不可能的。XML能夠使不同來(lái)源的結(jié)構(gòu)化的數(shù)據(jù)很容易地結(jié)合謝謝閱讀謝謝閱讀成。然后,數(shù)據(jù)就能被發(fā)送到客戶或其它服務(wù)器做進(jìn)一步的集合、處理和分發(fā)。XML的擴(kuò)感謝閱讀展性和靈活性允許它描述不同種類應(yīng)用軟件中的數(shù)據(jù),從描述搜集的Web頁(yè)到數(shù)據(jù)記錄,精品文檔放心下載XML感謝閱讀XMLXML格式的謝謝閱讀感謝閱讀不同的方法處理資料,而不僅僅是顯示它。XML文文件對(duì)象模式(DOM)允許用腳本或其它精品文檔放心下載編程語(yǔ)言處理數(shù)據(jù),數(shù)據(jù)計(jì)算不需要回到服務(wù)器就能進(jìn)行。XML可以被利用來(lái)分離使用者精品文檔放心下載觀看數(shù)據(jù)的接口,使用簡(jiǎn)單靈活開(kāi)放的格式,可以給Web創(chuàng)建功能強(qiáng)大的應(yīng)用軟件,而原感謝閱讀來(lái)這些軟件只能建立在高端數(shù)據(jù)庫(kù)上。另外,資料發(fā)到桌面后,能夠用多種方式顯示。感謝閱讀XMLXML補(bǔ)充了HTML謝謝閱讀HTMLXML精品文檔放心下載與內(nèi)容分開(kāi),XML定義的資料允許指定不同的顯示方式,使數(shù)據(jù)更合理地表現(xiàn)出來(lái)。本地謝謝閱讀的數(shù)據(jù)能夠以客戶配置、使用者選擇或其它標(biāo)準(zhǔn)決定的方式動(dòng)態(tài)地表現(xiàn)出來(lái)。CSS和XSL感謝閱讀為數(shù)據(jù)的顯示提供了公布的機(jī)制。通過(guò)XML,數(shù)據(jù)可以粒狀地更新。每當(dāng)一部分?jǐn)?shù)據(jù)變化感謝閱讀感謝閱讀謝謝閱讀重建。這嚴(yán)重限制了服務(wù)器的升級(jí)性能。XML也允許加進(jìn)其它數(shù)據(jù),比如預(yù)測(cè)的溫度。加謝謝閱讀入的信息能夠進(jìn)入存在的頁(yè)面,不需要瀏覽器重新發(fā)一個(gè)新的頁(yè)面。XML應(yīng)用于客戶需要精品文檔放心下載與不同的數(shù)據(jù)源進(jìn)行交互時(shí),數(shù)據(jù)可能來(lái)自不同的數(shù)據(jù)庫(kù),它們都有各自不同的復(fù)雜格式。謝謝閱讀但客戶與這些數(shù)據(jù)庫(kù)間只通過(guò)一種標(biāo)準(zhǔn)語(yǔ)言進(jìn)行交互,那就是XML。由于XML的自定義感謝閱讀精品文檔放心下載數(shù)據(jù)庫(kù)間進(jìn)行傳遞??傊?,在這類應(yīng)用中,XML解決了數(shù)據(jù)的統(tǒng)一接口問(wèn)題。但是,與其謝謝閱讀它的數(shù)據(jù)傳遞標(biāo)準(zhǔn)不同的是,XML并沒(méi)有定義數(shù)據(jù)文件中數(shù)據(jù)出現(xiàn)的具體規(guī)范,而是在數(shù)精品文檔放心下載據(jù)中附加TAGXML成為一種程序能自動(dòng)理解的規(guī)范。精品文檔放心下載XML應(yīng)用于將大量運(yùn)算負(fù)荷分布在客戶端,即客戶可根據(jù)自己的需求選擇和制作不同感謝閱讀XML“Client/Server”工謝謝閱讀感謝閱讀感謝閱讀感謝閱讀程人員可能來(lái)不及滿足眾多的應(yīng)用需求,也來(lái)不及跟上需求的變化,雙方都很被動(dòng)。應(yīng)用感謝閱讀XML則將處理資料的主動(dòng)權(quán)交給了客戶,服務(wù)器所作的只是盡可能完善、準(zhǔn)確地將數(shù)據(jù)封感謝閱讀裝進(jìn)XML文件中,正是各取所需、各司其職。XML的自解釋性使客戶端在收到數(shù)據(jù)的同謝謝閱讀時(shí)也理解數(shù)據(jù)的邏輯結(jié)構(gòu)與含義,從而使廣泛、通用的分布式計(jì)算成為可能。精品文檔放心下載XML還被應(yīng)用于網(wǎng)絡(luò)代理,以便對(duì)所取得的信息進(jìn)行編輯、增減以適應(yīng)個(gè)人用戶的需謝謝閱讀要。有些客戶取得數(shù)據(jù)并不是為了直接使用而是為了根據(jù)需要組織自己的數(shù)據(jù)庫(kù)。比方說(shuō),精品文檔放心下載感謝閱讀進(jìn)XML精品文檔放心下載精品文檔放心下載此外,XML文件中還可以包含進(jìn)諸如難度系數(shù)、往年錯(cuò)誤率等其它相關(guān)信息,這樣只需幾謝謝閱讀個(gè)小程序,同一個(gè)XML文件便可變成多個(gè)文件傳送到不同的用戶手中。感謝閱讀面向WebWeb數(shù)據(jù)挖掘比單個(gè)數(shù)據(jù)倉(cāng)庫(kù)的挖掘要感謝閱讀WebXML的出現(xiàn)為解決Web謝謝閱讀XML能夠使不同來(lái)源的結(jié)構(gòu)化的數(shù)據(jù)很容易地結(jié)合在一感謝閱讀起,因而使搜索多樣的不兼容的數(shù)據(jù)庫(kù)能夠成為可能,從而為解決Web數(shù)據(jù)挖掘難題帶來(lái)感謝閱讀了希望。XML的擴(kuò)展性和靈活性允許XML描述不同種類應(yīng)用軟件中的數(shù)據(jù),從而能描述謝謝閱讀搜集的Web頁(yè)中的數(shù)據(jù)記錄。同時(shí),由于基于XML的數(shù)據(jù)是自我描述的,數(shù)據(jù)不需要有謝謝閱讀內(nèi)部描述就能被交換和處理。作為表示結(jié)構(gòu)化數(shù)據(jù)的一個(gè)工業(yè)標(biāo)準(zhǔn),XML為組織、軟件開(kāi)精品文檔放心下載發(fā)者、Web站點(diǎn)和終端使用者提供了許多有利條件。相信在以后,隨著XML作為在Web謝謝閱讀上交換數(shù)據(jù)的一種標(biāo)準(zhǔn)方式的出現(xiàn),面向Web的數(shù)據(jù)挖掘?qū)?huì)變得非常輕松。精品文檔放心下載12數(shù)據(jù)挖掘應(yīng)用12.1數(shù)據(jù)挖掘解決的典型商業(yè)問(wèn)題精品文檔放心下載(datamining)都是一個(gè)很時(shí)髦的詞,尤其是在如銀行、電信、保險(xiǎn)、交通、零售(如超級(jí)市謝謝閱讀場(chǎng))等商業(yè)領(lǐng)域。數(shù)據(jù)挖掘所能解決的典型商業(yè)問(wèn)題包括:數(shù)據(jù)庫(kù)營(yíng)銷(Database謝謝閱讀Marketing)、客戶群體劃分(CustomerSegmentation&Classification)、背景分析(Profile感謝閱讀Analysis)、交叉銷售(Cross-selling)等市場(chǎng)分析行為,以及客戶流失性分析(Churn精品文檔放心下載Analysis)、客戶信用記分(CreditScoring)、欺詐發(fā)現(xiàn)(FraudDetection)等等。感謝閱讀12.2數(shù)據(jù)挖掘在市場(chǎng)營(yíng)銷的應(yīng)用精品文檔放心下載原理為基礎(chǔ),其基本假定是“消費(fèi)者過(guò)去的行為是其今后消費(fèi)傾向的最好說(shuō)明”。精品文檔放心下載精品文檔放心下載趣、消費(fèi)習(xí)慣、消費(fèi)傾向和消費(fèi)需求,進(jìn)而推斷出相應(yīng)消費(fèi)群體或個(gè)體下一步的消費(fèi)行為,感謝閱讀謝謝閱讀感謝閱讀帶來(lái)更多的利潤(rùn)。謝謝閱讀謝謝閱讀精品文檔放心下載的公司。資料挖掘構(gòu)筑競(jìng)爭(zhēng)優(yōu)勢(shì)。挖掘?qū)I(yè)務(wù)信息進(jìn)行深加工,以構(gòu)筑自己的競(jìng)爭(zhēng)優(yōu)勢(shì),擴(kuò)大自己的營(yíng)業(yè)額。美國(guó)運(yùn)通公司

(AmericanExpress)有一個(gè)用于記錄信用卡業(yè)務(wù)的數(shù)據(jù)庫(kù),數(shù)據(jù)量達(dá)到54億字符,并仍在隨

著業(yè)務(wù)進(jìn)展不斷更新。運(yùn)通公司通過(guò)對(duì)這些數(shù)據(jù)進(jìn)行挖掘,制定了“關(guān)聯(lián)結(jié)算(Relationship

Billing)優(yōu)惠”的促銷策略,即如果一個(gè)顧客在一個(gè)商店用運(yùn)通卡購(gòu)買一套時(shí)裝,那么在同一

航班去過(guò)巴黎,那么他可能會(huì)得到一個(gè)周末前往紐約的機(jī)票打折優(yōu)惠卡。感謝閱讀夫(Kraft)食品公司建立了一個(gè)擁有3000萬(wàn)客戶數(shù)據(jù)的數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)是通過(guò)收集對(duì)公司發(fā)

(Reader'sDigest)出版公司運(yùn)

行著一個(gè)積累了40年的業(yè)務(wù)數(shù)據(jù)庫(kù),其中容納有遍布全球的一億多個(gè)訂戶的數(shù)據(jù),數(shù)據(jù)庫(kù)

每天24小時(shí)連續(xù)運(yùn)行,保證數(shù)據(jù)不斷得到實(shí)時(shí)的更新,正是基于對(duì)客戶數(shù)據(jù)數(shù)據(jù)庫(kù)進(jìn)行數(shù)

版和發(fā)行業(yè)務(wù),極大地?cái)U(kuò)展了自己的業(yè)務(wù)。感謝閱讀肯定會(huì)比漫無(wú)目的的營(yíng)銷效果要好得多。謝謝閱讀12.3成功案例1電話收費(fèi)和管理辦法加拿大BC省電話公司要求加拿大Simon

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論