




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1.5數(shù)據(jù)與大數(shù)據(jù)1大數(shù)據(jù)
問題提出導航上交通擁堵情況怎么判斷?導航上最佳路線怎么計算的?導航根據(jù)什么來確定未來用時?
一、大數(shù)據(jù)概念★大數(shù)據(jù):代表著數(shù)據(jù)量大、速度快、種類繁多的信息資產,需要特定的技術和分析方法將其轉化為價值。在大數(shù)據(jù)時代,任何微小的數(shù)據(jù)都可能產生不可思議的價值
二、大數(shù)據(jù)4V特征數(shù)量(volume)大數(shù)據(jù)4V特征速度(Velocity)多樣(Variety)價值(Value)速度(Velocity):數(shù)據(jù)產生的速度快,數(shù)據(jù)處理的速度快價值(Value):價值高,但價值密度低,且價值與數(shù)量成反比
二、大數(shù)據(jù)4V特征數(shù)量(volume):數(shù)據(jù)體量巨大,TB\PB\EB\ZBK
1KB=1024ByteM(兆)字節(jié)
1MB=1024KBG(吉)字節(jié)
1GB=1024MBT(太)字節(jié)
1TB=1024GBP(拍)字節(jié)
1PB=1024TBE(艾)字節(jié)
1EB=1024PBZ(澤)字節(jié)
1ZB=1024EBY(堯)字節(jié)
1YB=1024ZB
二、大數(shù)據(jù)4V特征數(shù)量(volume):數(shù)據(jù)體量巨大,TB\PB\EB\ZB1Byte1KB1MB1GB1TB1PB1EB1ZB1YB1PB相當于50%的全美學術研究圖書館藏書信息內容5EB相當于至今全世界人類所講過的話語1ZB如同全世界海灘上的沙子數(shù)量總和1YB相當于7000位人類體內的微細胞總和一般情況下,大數(shù)據(jù)以PB、EB、ZB為單位進行計量
二、大數(shù)據(jù)4V特征速度(Velocity):數(shù)據(jù)產生的速度快,數(shù)據(jù)處理的速度快“1秒定律”或者秒級定律,就是說對處理速度有要求,一般要在秒級時間范圍內給出分析結果,時間太長就失去價值了。這個速度要求是大數(shù)據(jù)處理技術和傳統(tǒng)的數(shù)據(jù)挖掘技術最大的區(qū)別。道路監(jiān)控攝像頭24小時不間斷地記錄著視頻數(shù)據(jù),根據(jù)第3節(jié)中圖像數(shù)據(jù)的計算公式,引入幀頻參數(shù)進行計算,對于1個720p(1280×720像素、24位色)的高清攝像頭,按25FPS拍攝,可以計算出每秒的數(shù)據(jù)量,乘以86400秒就是1天的數(shù)據(jù)量。若按200:
1的壓縮比進行存儲,大致可以估算出1個720p高清攝像頭1天產生的數(shù)據(jù)量。
二、大數(shù)據(jù)4V特征多樣(Variety):數(shù)據(jù)來源多,有人工產生的+機器自動產生,所以數(shù)據(jù)類型多。短信、微信、視頻、語音、電子郵件結構化、半結構化、非結構化結構化——數(shù)據(jù)庫中數(shù)據(jù);非結構化——word、ppt、圖片和視頻等半結構化——電子郵件等。拓展知識10結構化數(shù)據(jù)行數(shù)據(jù),是由二維表結構來進行邏輯表達和實現(xiàn)的數(shù)據(jù)嚴格遵守數(shù)據(jù)格式與長度規(guī)范通過關系型數(shù)據(jù)庫進行存儲和管理半結構化數(shù)據(jù)介于結構化數(shù)據(jù)和非結構化數(shù)據(jù)之間的數(shù)據(jù)具有一定的結構性非結構化數(shù)據(jù)數(shù)據(jù)結構不規(guī)則或不完整,沒有預定義的數(shù)據(jù)模型,不方便用數(shù)據(jù)庫二維邏輯表來表現(xiàn)的數(shù)據(jù)各類格式的辦公文檔、文本、圖片、HTML、各類報表、圖像、音頻、視頻等。
二、大數(shù)據(jù)4V特征價值(Value):價值高但價值密度低,且價值與數(shù)量成反比挖掘大數(shù)據(jù)的價值類似沙里淘金,從海量數(shù)據(jù)中挖掘稀疏但珍貴的信息;價值密度低,是大數(shù)據(jù)的一個典型特征;
二、大數(shù)據(jù)4V特征三、大數(shù)據(jù)思維大數(shù)據(jù)是一場變革,
改變的不僅是數(shù)據(jù),還有人們的思維。
大數(shù)據(jù)要分析的是全體數(shù)據(jù),而不是抽樣數(shù)據(jù)。
對于數(shù)據(jù)不再追求精確性,而是能夠接受數(shù)據(jù)的混雜性。
不一定強調對事物因果關系的探求,而是更加注重它們的相關性。
三、大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的區(qū)別對比項采集方法分析方法表示方法……大數(shù)據(jù)傳統(tǒng)數(shù)據(jù)采用自動化方法采集數(shù)據(jù)采用分布式數(shù)據(jù)庫對數(shù)據(jù)進行處理PB(拍字節(jié))以上數(shù)量級表示GB(吉字節(jié))或TB(太字節(jié))表示采用手工方法采集數(shù)據(jù)大多采用關系型數(shù)據(jù)庫和并行數(shù)據(jù)倉庫即可處理大數(shù)據(jù):認識全面、信息詳盡傳統(tǒng)數(shù)據(jù):樣本隨機、結論不準大數(shù)據(jù):關注關聯(lián),較為準確傳統(tǒng)數(shù)據(jù):樣本少、局限多傳統(tǒng)數(shù)據(jù):容錯低、數(shù)據(jù)量小大數(shù)據(jù):容錯強、弱化個體樣本的影響四、大數(shù)據(jù)對社會的影響
大數(shù)據(jù)已經滲入到社會的各個層面,不斷提高工作效率與生活便利性
大數(shù)據(jù)讓決策更加精準
大數(shù)據(jù)帶來新的就業(yè)機會
大數(shù)據(jù)帶來新的社會問題一起討論★
大數(shù)據(jù)背景下,我們該如何保護自己信息不被泄露?保護自己的隱私不被偷窺?★下列關于大數(shù)據(jù)思維的描述,錯誤的是()A.大數(shù)據(jù)時代,人們可以采集全體數(shù)據(jù)進行分析,避免樣本不同導致結論不同B.基于大數(shù)據(jù)技術,我們能夠接受數(shù)據(jù)的混雜性,個別數(shù)據(jù)的不準確不影響數(shù)據(jù)分析C.數(shù)據(jù)總量變大會導致大量不相干的數(shù)據(jù)增加,大數(shù)據(jù)具有價值密度低的特點D.使用大數(shù)據(jù)思維,我們更強調事物因果關系的探求,而不僅僅是數(shù)據(jù)之間的相關性課堂練習D★下列數(shù)據(jù)中屬于大數(shù)據(jù)的是()①各地交通攝像頭記錄的全部數(shù)據(jù)②學生
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 有效管理時間的月度工作方案計劃
- 儀表知識溫度培訓課件
- 第24課《唐詩三首》之《茅屋為秋風所破歌》教學設計 2023-2024學年統(tǒng)編版語文八年級下冊
- 某婦產醫(yī)院品牌推廣部網絡推廣工作思路
- 2025年青海普通貨運從業(yè)資格證模擬考試
- 2025年淮南駕駛資格證模擬考試
- 2025年杭州貨運從業(yè)資格模擬考試
- 2025年上海貨運從業(yè)資格證考試試題及答案
- 2025年德州c1貨運從業(yè)資格證考試內容
- 2025年陜西貨運叢業(yè)資格證考試題目及答案
- 化工生產中的智能優(yōu)化
- 配電室安全規(guī)定樣本(3篇)
- 《西方經濟學》(上冊)課程教案
- 移動政企部年終總結
- 施工合同協(xié)議書樣本
- 醫(yī)學綜合題庫(含答案)
- 人教版化學九年級下冊全冊綜合考試試題(九年級下學期期中考試化學試卷)
- 中考英語高頻語法小專題考點講練系列十五+spend+take+pay+cost+花費系列
- 工會一函兩書模板
- 四年級語文下冊第六單元【集體備課】(教材解讀+教學設計)
- 2024版義務教育小學科學課程標準
評論
0/150
提交評論