版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
目錄:什么是大數(shù)據(jù)Hadoop介紹-HDFS、MR、Hbase大數(shù)據(jù)平臺(tái)應(yīng)用舉例-騰訊公司的大數(shù)據(jù)平臺(tái)架構(gòu)“就像望遠(yuǎn)鏡讓我們能夠感受宇宙,顯微鏡讓我們能夠觀測(cè)微生物一樣,大數(shù)據(jù)正在改變我們的生活以及理解世界的方式……”。大數(shù)據(jù)的4V特征-來(lái)源公司的“大數(shù)據(jù)”隨著公司業(yè)務(wù)的增長(zhǎng),大量和流程、規(guī)則相關(guān)的非結(jié)構(gòu)化數(shù)據(jù)也爆發(fā)式增長(zhǎng)。比如:1、業(yè)務(wù)系統(tǒng)現(xiàn)在平均每天存儲(chǔ)20萬(wàn)張圖片,磁盤空間每天消耗100G;2、平均每天產(chǎn)生簽約視頻文件6000個(gè),每個(gè)平均250M,磁盤空間每天消耗1T;……三國(guó)里的“大數(shù)據(jù)”“草船借箭”和大數(shù)據(jù)有什么關(guān)系呢?對(duì)天象的觀察是基于一種對(duì)風(fēng)、云、溫度、濕度、光照和所處節(jié)氣的綜合分析這些數(shù)據(jù)來(lái)源于多元化的“非結(jié)構(gòu)”類型,并且數(shù)據(jù)量較大,只不過(guò)這些數(shù)據(jù)輸入到的不是電腦,而是人腦并最終通過(guò)計(jì)算分析得出結(jié)論。Google分布式計(jì)算的三駕馬車GoogleFileSystem用來(lái)解決數(shù)據(jù)存儲(chǔ)的問(wèn)題,采用N多臺(tái)廉價(jià)的電腦,使用冗余(也就是一份文件保存多份在不同的電腦之上)的方式,來(lái)取得讀寫速度與數(shù)據(jù)安全并存的結(jié)果。Map-Reduce說(shuō)穿了就是函數(shù)式編程,把所有的操作都分成兩類,map與reduce,map用來(lái)將數(shù)據(jù)分成多份,分開(kāi)處理,reduce將處理后的結(jié)果進(jìn)行歸并,得到最終的結(jié)果。BigTable是在分布式系統(tǒng)上存儲(chǔ)結(jié)構(gòu)化數(shù)據(jù)的一個(gè)解決方案,解決了巨大的Table的管理、負(fù)載均衡的問(wèn)題。Hadoop體系架構(gòu)Hbase——分布式數(shù)據(jù)存儲(chǔ)系統(tǒng)
Client:使用HBaseRPC機(jī)制與HMaster和HRegionServer進(jìn)行通信Zookeeper:協(xié)同服務(wù)管理,HMaster通過(guò)Zookeepe可以隨時(shí)感知各個(gè)HRegionServer的健康狀況HMaster:
管理用戶對(duì)表的增刪改查操作HRegionServer:HBase中最核心的模塊,主要負(fù)責(zé)響應(yīng)用戶I/O請(qǐng)求,向HDFS文件系統(tǒng)中讀寫數(shù)據(jù)HRegion:Hbase中分布式存儲(chǔ)的最小單元,可以理解成一個(gè)TableHStore:HBase存儲(chǔ)的核心。由MemStore和StoreFile組成。HLog:每次用戶操作寫入Memstore的同時(shí),也會(huì)寫一份數(shù)據(jù)到HLog文件還有哪些NoSQL產(chǎn)品?
為什么要使用NoSQL?一個(gè)高并發(fā)網(wǎng)站的DB進(jìn)化史關(guān)系模型>聚合數(shù)據(jù)模型的轉(zhuǎn)換-基本變換
關(guān)系模型>聚合數(shù)據(jù)模型的轉(zhuǎn)換-內(nèi)嵌變換
關(guān)系模型>聚合數(shù)據(jù)模型的轉(zhuǎn)換-分割變換
關(guān)系模型>聚合數(shù)據(jù)模型的轉(zhuǎn)換-內(nèi)聯(lián)變換
Hadoop2.0MapReduce:
JobTracker:協(xié)調(diào)作業(yè)的運(yùn)行。
TaskTracker:運(yùn)行作業(yè)劃分后的任務(wù)。大數(shù)據(jù)的技術(shù)領(lǐng)域騰訊大數(shù)據(jù)現(xiàn)狀(資料來(lái)自2014.4.11騰訊分享日大會(huì))
騰訊大數(shù)據(jù)平臺(tái)產(chǎn)品架構(gòu)騰訊大數(shù)據(jù)平臺(tái)與業(yè)務(wù)平臺(tái)的關(guān)系公司數(shù)據(jù)處理平臺(tái)的基礎(chǔ)架構(gòu)公司
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 仁愛(ài)版初中英語(yǔ)單詞表
- 高一化學(xué)教案:第二單元食品中的有機(jī)化合物
- 2024高中地理第1章區(qū)域地理環(huán)境與人類活動(dòng)第3節(jié)第2課時(shí)南方與北方西部大開(kāi)發(fā)學(xué)案湘教版必修3
- 2024高中語(yǔ)文第2單元孟子蚜第4課樂(lè)民之樂(lè)憂民之憂練習(xí)含解析新人教版選修先秦諸子蚜
- 2024高中語(yǔ)文第六單元文無(wú)定格貴在鮮活春夜宴從弟桃花園序訓(xùn)練含解析新人教版選修中國(guó)古代詩(shī)歌散文欣賞
- 2024高考化學(xué)一輪復(fù)習(xí)第四章非金屬及其化合物第三講硫及其化合物規(guī)范演練含解析新人教版
- 2024高考?xì)v史一輪復(fù)習(xí)方案專題四世界政治制度的演變與發(fā)展第12講解放人類的陽(yáng)光大道教學(xué)案+練習(xí)人民版
- 2024高考地理一輪復(fù)習(xí)第二部分人文地理-重在運(yùn)用第四章工業(yè)地域的形成與發(fā)展第23講工業(yè)地域的形成與工業(yè)區(qū)學(xué)案新人教版
- 小學(xué)2024-2025年第二學(xué)期小學(xué)科學(xué)教學(xué)計(jì)劃
- 鋼結(jié)構(gòu)廠房施工準(zhǔn)備
- 2025寒假散學(xué)典禮(休業(yè)式)上校長(zhǎng)精彩講話:以董宇輝的創(chuàng)新、羅振宇的堅(jiān)持、馬龍的熱愛(ài)啟迪未來(lái)
- 招標(biāo)代理機(jī)構(gòu)選取技術(shù)標(biāo)投標(biāo)方案(技術(shù)方案)
- 無(wú)人機(jī)培訓(xùn)可行性方案
- 關(guān)于礦棉裝飾吸聲板檢驗(yàn)報(bào)告加圖標(biāo)版
- 大紅色節(jié)word感謝信信紙背景模板
- 安全檢查匯報(bào)材料
- 2005年海南高考理科綜合真題及答案
- 機(jī)房巡檢記錄表.doc
- [初一數(shù)學(xué)]初一數(shù)學(xué)上冊(cè)期末復(fù)習(xí)測(cè)試
- 煤礦機(jī)電事故影響考核管理辦法
- 人教版小學(xué)英語(yǔ)·(三年級(jí)起點(diǎn))單詞表(帶音標(biāo))
評(píng)論
0/150
提交評(píng)論