下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 基于云計算的海量數(shù)據(jù)挖掘研究 陳健摘要:基于云計算的海量數(shù)據(jù)挖掘模型中,進(jìn)行海量數(shù)據(jù)的處理和存儲時都是在云計算的環(huán)境之中所進(jìn)行的。隨著時代的不斷發(fā)展所需進(jìn)行數(shù)據(jù)挖掘的數(shù)量也在逐漸增加,這種新的數(shù)據(jù)挖掘方式更加能適應(yīng)時代的發(fā)展。關(guān)鍵詞:云計算;海量數(shù)據(jù)挖掘研究;數(shù)據(jù)預(yù)處理:tp391.41 :a :1007-9416(2017)07-0131-02隨著時代的不斷發(fā)展,信息技術(shù)的發(fā)展也越來越快,所產(chǎn)生的數(shù)據(jù)的數(shù)量也在快速上升,據(jù)不完全統(tǒng)計現(xiàn)今18月的數(shù)據(jù)產(chǎn)生量相當(dāng)與以前幾千年所產(chǎn)生的數(shù)據(jù)量的總和1。隨著數(shù)據(jù)產(chǎn)生的量的不斷增多,人們可以得到的信息
2、也在不斷增多,但隨著而來的是從海量數(shù)據(jù)中挖掘有用信息的難度也在不斷的增加。基于云計算的海量數(shù)據(jù)挖掘是在云計算平臺基礎(chǔ)之上進(jìn)行海量數(shù)據(jù)挖掘,云計算平臺可以進(jìn)行動態(tài)資源調(diào)度和分配、具有高度虛擬化和高可用性等特點2,因此可以在很大程度上滿足海量數(shù)據(jù)挖掘的要求。1 云計算概述云計算從其開發(fā)到現(xiàn)在已經(jīng)有很長一段時間了,在其運用方面仍然還存在一定的問題,因此從其開發(fā)到現(xiàn)在仍然沒有確切的定義。維基百科對其的定義為:云計算是一種能夠通過互聯(lián)網(wǎng)為用戶提供服務(wù)的計算模式,云計算提供的主要是能夠進(jìn)行動態(tài)伸縮地虛擬化了的資源,用戶不需要了解如何管理那些支持云計算的基礎(chǔ)設(shè)施3。簡而言之就是可以將云計算看作一種比較新的商
3、業(yè)模式,在進(jìn)行任務(wù)的處理時低成本的特點,因為它在工作時只需要大量的低成本的相互連接在互聯(lián)網(wǎng)上的計算機(jī)就可以完成。2 基于云計算的海量數(shù)據(jù)挖掘2.1 數(shù)據(jù)挖掘數(shù)據(jù)挖掘是指從海量數(shù)據(jù)中發(fā)現(xiàn)一些比較新的、有效的或者存在潛在價值的模式的過程4。而對于一個企業(yè)而言,海量數(shù)據(jù)挖掘就是從海量的數(shù)據(jù)中挖掘出有用的、有價值的知識,同時要求數(shù)據(jù)的規(guī)模要盡可能的大,數(shù)據(jù)的規(guī)模越大從中所挖掘的信息的準(zhǔn)確性也就越高。企業(yè)對于數(shù)據(jù)挖掘的要求是非常高的,為了達(dá)到高要求的海量數(shù)據(jù)挖掘的目的,就需要創(chuàng)造出高要求的開發(fā)環(huán)境和應(yīng)用環(huán)境。針對這一情況來說,采用基于云計算的海量數(shù)據(jù)挖掘是最好的方式,因為云計算平臺具有存儲量大、可以進(jìn)行
4、動態(tài)資源調(diào)度和分配、高度虛擬化和高可用性等特點,采用云計算技術(shù)來結(jié)合海量數(shù)據(jù)挖掘技術(shù)可以在很大程度上保證數(shù)據(jù)挖掘的高效率和準(zhǔn)確性。2.2 基于云計算的海量數(shù)據(jù)挖掘模型基于云計算的海量數(shù)據(jù)挖掘服務(wù)是在云計算的基礎(chǔ)之上所進(jìn)行的,它主要是通過云計算的特性來進(jìn)行海量數(shù)據(jù)的挖掘,如圖1所示。可以看出,整個基于云計算的海量數(shù)據(jù)挖掘模型總體來說可以分為三個層次,分別是云計算服務(wù)層、數(shù)據(jù)挖掘處理層和與用戶層。對于云計算服務(wù)服層而言,它主要的任務(wù)是提供分布式并行數(shù)據(jù)處理及數(shù)據(jù)的海量存儲。對于數(shù)據(jù)挖掘處理層而言,它主要任務(wù)可以分為兩個方面:一方面是數(shù)據(jù)的預(yù)處理,其主要內(nèi)容是將海量的數(shù)據(jù)先進(jìn)行預(yù)處理,將一些不規(guī)則的
5、數(shù)據(jù)先進(jìn)行一定的處理方便云計算進(jìn)行數(shù)據(jù)的處理;一方面是海量數(shù)據(jù)挖掘算法并行化,這是海量數(shù)據(jù)挖掘的關(guān)鍵點。對于用戶層而言,它所面對的是用戶,主要是接收用戶的請求并將其傳送給其他兩層進(jìn)行處理,處理完成以后將結(jié)果反饋給用戶。3 結(jié)語隨著時代的不斷變化,信息技術(shù)的不斷發(fā)展,現(xiàn)如今所產(chǎn)生的數(shù)據(jù)量也在逐年快速增長,傳統(tǒng)的數(shù)據(jù)挖掘方式已經(jīng)逐漸不能跟上時代的變化了,因此為了改善這一情況就需要改變以往的數(shù)據(jù)挖掘方法了。云計算技術(shù)是一種很早之前就存在的技術(shù),具有動態(tài)資源調(diào)度和分配、高度虛擬化和高可用性等特點,與此同時云計算在使用時的效率是非產(chǎn)高的,且所需要的成本也是非常低的,因此將云計算技術(shù)運用到海量數(shù)據(jù)挖掘技術(shù)中可以在很大程度上改善傳統(tǒng)海量數(shù)據(jù)挖掘方式所存在的問題??偟膩碚f,基于云計算的海量數(shù)據(jù)挖掘是一種非常好的方式來進(jìn)行海量數(shù)據(jù)的處理,并且在未來具有良好的發(fā)展趨勢,雖然云計算的安全還存在一些問題,但仍然值得推廣和發(fā)展。參考文獻(xiàn)1丁巖,楊慶平,錢煜明.基于云計算的數(shù)據(jù)挖掘平臺架構(gòu)及其關(guān)鍵技術(shù)研究j.中興通訊技術(shù),2013,19(1):53-56.2趙華茗. 搭建基于云計算的開源海量數(shù)據(jù)挖掘平臺c.全國計算機(jī)信息管理學(xué)術(shù)研討會.2010:76-81.3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度綠色建筑材料產(chǎn)銷合作框架協(xié)議書3篇
- 專項舊房翻新改造授權(quán)合同2024版一
- 專項消防工程:2024年中央空調(diào)安全系統(tǒng)協(xié)議版B版
- 2025年度時尚秀場場地租賃拍攝合同4篇
- 2025年度產(chǎn)業(yè)園企業(yè)入駐綠色生產(chǎn)技術(shù)轉(zhuǎn)移合作協(xié)議4篇
- 2025年度工業(yè)0智能廠房租賃合作協(xié)議2篇
- 2025年度汽車零部件全球采購合同4篇
- 2025年度虛擬現(xiàn)實設(shè)備檢測服務(wù)合同范本4篇
- 二零二五年度綜合醫(yī)院設(shè)備采購協(xié)議-64排螺旋CT設(shè)備3篇
- 2024年藥品供應(yīng)鏈管理合作協(xié)議6篇
- GB/T 8005.2-2011鋁及鋁合金術(shù)語第2部分:化學(xué)分析
- GB/T 37234-2018文件鑒定通用規(guī)范
- GB/T 31888-2015中小學(xué)生校服
- 質(zhì)量檢查考核辦法
- 不動產(chǎn)登記實務(wù)培訓(xùn)教程課件
- 云南省普通初中學(xué)生成長記錄-基本素質(zhì)發(fā)展初一-初三
- 2023年系統(tǒng)性硬化病診斷及診療指南
- 外科醫(yī)師手術(shù)技能評分標(biāo)準(zhǔn)
- 《英語教師職業(yè)技能訓(xùn)練簡明教程》全冊配套優(yōu)質(zhì)教學(xué)課件
- 采購控制程序
- 六年級上冊數(shù)學(xué)簡便計算題200題專項練習(xí)
評論
0/150
提交評論