大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)庫(kù)的區(qū)別智慧養(yǎng)老技術(shù)概論_第1頁(yè)
大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)庫(kù)的區(qū)別智慧養(yǎng)老技術(shù)概論_第2頁(yè)
大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)庫(kù)的區(qū)別智慧養(yǎng)老技術(shù)概論_第3頁(yè)
大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)庫(kù)的區(qū)別智慧養(yǎng)老技術(shù)概論_第4頁(yè)
大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)庫(kù)的區(qū)別智慧養(yǎng)老技術(shù)概論_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

智慧養(yǎng)老技術(shù)概論大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)庫(kù)的區(qū)別大數(shù)據(jù)不僅僅是“大”多大?PB級(jí)比大更重要的是數(shù)據(jù)的復(fù)雜性,有時(shí)甚至大數(shù)據(jù)中的小數(shù)據(jù)如一條微博就具有顛覆性的價(jià)值大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的區(qū)別首先,大數(shù)據(jù)是永遠(yuǎn)在線的,不在線的數(shù)據(jù)就不能稱之為“大數(shù)據(jù)”。目前大數(shù)據(jù)的概念一般是指“無法用現(xiàn)有的軟件工具提取、儲(chǔ)存、搜索、共享、分析和處理的、海量的、復(fù)雜的數(shù)據(jù)集合?!币蚨髷?shù)據(jù)必須是隨時(shí)隨地能調(diào)用,并且馬上被計(jì)算的,而不是儲(chǔ)存在磁帶、U盤等軟件工具中的數(shù)據(jù)。其次,大數(shù)據(jù)必須反應(yīng)迅速及時(shí)。比如在購(gòu)物網(wǎng)站搜索一個(gè)商品,后臺(tái)便會(huì)自動(dòng)在數(shù)十億商品中進(jìn)行篩選,將符合你要要求的產(chǎn)品瞬間呈現(xiàn)。如果要等上一個(gè)小時(shí)才會(huì)出現(xiàn)搜索結(jié)果,相信沒有用戶愿意再上天貓購(gòu)物。數(shù)十億商品、幾百萬個(gè)賣家、一億的消費(fèi)者,瞬間完成匹配呈現(xiàn),這才能稱之為“大數(shù)據(jù)”。最后,大數(shù)據(jù)還有一個(gè)特征,就是數(shù)據(jù)的全面性。大數(shù)據(jù)不是樣本思維,它是一個(gè)完整的全面的系統(tǒng)。在現(xiàn)在的互聯(lián)網(wǎng)時(shí)代,我們要的是盡可能全面的數(shù)據(jù),而不是數(shù)據(jù)的某一個(gè)樣本或抽樣。因而也有人將大數(shù)據(jù)稱為全數(shù)據(jù)。與傳統(tǒng)數(shù)據(jù)相比,大數(shù)據(jù)的價(jià)值和優(yōu)勢(shì)更加凸顯,這也是大數(shù)據(jù)廣泛應(yīng)用的根本原因所在,如今,大數(shù)據(jù)對(duì)我們的生活正在產(chǎn)生廣泛影響,但是,傳統(tǒng)數(shù)據(jù)并沒有退出歷史舞臺(tái),在某些特殊的領(lǐng)域,傳統(tǒng)數(shù)據(jù)發(fā)揮的作用還是無可替代的。大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)庫(kù)的區(qū)別大數(shù)據(jù)是傳統(tǒng)數(shù)據(jù)庫(kù)學(xué)科的分支——數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的基礎(chǔ)上進(jìn)一步發(fā)展起來的。但有兩點(diǎn)主要的不同:

結(jié)構(gòu)化程度傳統(tǒng)數(shù)據(jù)庫(kù)保存的是結(jié)構(gòu)化或者半結(jié)構(gòu)化的數(shù)據(jù),以二維表或者標(biāo)準(zhǔn)XML文件的方式存儲(chǔ)數(shù)據(jù),由于結(jié)構(gòu)清晰,處理相對(duì)容易;大數(shù)據(jù)面向的是一切計(jì)算機(jī)可以存儲(chǔ)的數(shù)據(jù)格式,包括互聯(lián)網(wǎng)上的各種網(wǎng)頁(yè)、圖片、音頻、視頻,包括辦公文檔、報(bào)表,包括人們?cè)谒阉饕嬷休斎氲年P(guān)鍵詞、在社交網(wǎng)絡(luò)中的留言、喜好,也包括各種傳感器自動(dòng)收集的監(jiān)控結(jié)果等等,顯然不同的格式處理起來更加困難。

異常數(shù)據(jù)的處理傳統(tǒng)數(shù)據(jù)庫(kù)通常把異常數(shù)據(jù)先剔除,應(yīng)用在需要高精確度的領(lǐng)域,如銀行對(duì)每個(gè)賬戶的管理;大數(shù)據(jù)則允許異常數(shù)據(jù)存在,更多應(yīng)用在預(yù)測(cè)方面,找出大量數(shù)據(jù)中隱藏的關(guān)聯(lián)關(guān)系,少量異常數(shù)據(jù)不會(huì)對(duì)總體結(jié)果產(chǎn)生影響。大數(shù)據(jù)分析vs.傳統(tǒng)數(shù)據(jù)分析大數(shù)據(jù)分析帶來的思維方式的變化(1)處理的對(duì)象往往是全部數(shù)據(jù),而不是部分?jǐn)?shù)據(jù)的采樣。采樣的不合理會(huì)導(dǎo)致預(yù)測(cè)結(jié)果的偏差,在大數(shù)據(jù)時(shí)代,依靠強(qiáng)大的數(shù)據(jù)處理能力,應(yīng)該去處理全部的數(shù)據(jù)(2)不再執(zhí)迷于精確性。精確的、規(guī)范化的、可以被傳統(tǒng)數(shù)據(jù)庫(kù)處理的數(shù)據(jù)只占全部數(shù)據(jù)的5%,必須接受不精確性才能處理另外95%的數(shù)據(jù)。錯(cuò)誤的數(shù)據(jù)是客觀存在的,竭力避免它就失去了應(yīng)有的客觀性和公平性。大數(shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更有效。更加關(guān)注相關(guān)性,而不是因果性預(yù)測(cè)依靠的是相關(guān)性。很多情況下知道“是什么”即可,不必知道“為什么”。PPT模板下載:/moban/行業(yè)PPT模板:/hangye/節(jié)日PPT模板:/jieri/PPT素材下載:/sucai/PPT背景圖片:/beijing/PPT圖表下載:/tubiao/優(yōu)秀PPT下載:/xiazai/PPT教程:/powerpoint/Word教程:/word/Excel教程:/excel/資料下載:/ziliao/PPT課件下載:/kejian/范文下載:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論