




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、培訓目標了解HADOOP生態(tài)系統(tǒng)123了解HADOOP應用環(huán)境及解決方案培訓目錄Hadoop 的創(chuàng)立和沿革1Hadoop的基本概念2HDFS基礎知識3Map/Reduce基礎知識4Hadoop生態(tài)系統(tǒng)介紹5培訓目錄Hadoop 的創(chuàng)立和沿革1Hadoop的基本概念2HDFS基礎知識3Map/Reduce基礎知識4Hadoop生態(tài)系統(tǒng)介紹5Hadoop的創(chuàng)立和沿革起源:谷歌三大論文GFS(2003)Sanjay Ghemawat(美國工程院士)(GFS,MR,Bigtable)Howard GobioffShun-Tak Leungmap/reduce (2004)Dean Jeffrey(美國
2、工程院士)(Adsense,pb,News,Code search)Sanjay GhemawatBigtable(2006)Fay ChangDean JeffreySanjay Ghemawat.Doug Cutting和YahooLucene - Nutch - Hadoop培訓目錄Hadoop 的創(chuàng)立和沿革1Hadoop的基本概念2HDFS基礎知識3Map/Reduce基礎知識4Hadoop生態(tài)系統(tǒng)介紹5Hadoop的基本概念分布式存儲分布式存儲HDFS文件分塊自行備份分布式計算分布式計算Map/Reduce函數式設計將計算移動到數據Hadoop解決了什么難題? 移動計算而非移動數據,
3、化整為零,分片處理; 本地化計算,并行IO,降低網絡通信Hadoop 前的數據倉庫流程反饋決策周期!快 ?反饋決策粒度! 細 ?反饋決策準確性! 準 ? 反饋總體成本! 廉價 ? perl,shell,awk Hadoop后的數據倉庫流程反饋決策周期!快 ?反饋決策粒度! 細 ?反饋決策準確性! 準 ? 反饋總體成本! 廉價 ?持續(xù)擴展成本 ? Hql,Pig,Mapreduce,工作流 培訓目錄Hadoop 的創(chuàng)立和沿革1Hadoop的基本概念2HDFS基礎知識3Map/Reduce基礎知識4Hadoop生態(tài)系統(tǒng)介紹5HDFS基礎知識Rack1Rack2NN meta - foo.barbl
4、k1,blk2,blk3,blk4,blk5DN1blk1,blk2,blk3,blk5DN2blk1,blk4,blk5DN3DN4DN5blk2,blk3,blk5blk1,blk3,blk4blk2,blk4培訓目錄Hadoop 的創(chuàng)立和沿革1Hadoop的基本概念2HDFS基礎知識3Map/Reduce基礎知識4Hadoop生態(tài)系統(tǒng)介紹5Map/Reduce基礎知識培訓目錄Hadoop 的創(chuàng)立和沿革1Hadoop的基本概念2HDFS基礎知識3Map/Reduce基礎知識4Hadoop生態(tài)系統(tǒng)介紹5Hadoop生態(tài)系統(tǒng)介紹Hive-SQL/MR編譯器Pig-Pig-Latin/MR編譯器
5、Zookeeper-分布式協同調度和鎖Avro-接口開發(fā)工具HBase-基于列簇的分布式NoSQLFlume/NG/Scribe-日志流匯總工具Mahout-基于MR的算法庫Drill/Impala-內存SQL引擎,Dremel開源實現Thrift-接口開發(fā)工具Sqoop-ETL工具Oozie-工作流案例解析:暴風數據組簡介關于我們:關于我們:人員規(guī)模15人9開發(fā)/4報表/1經理/1運維加開發(fā)(Me)集群接收日志超過2TB/天7000+任務/日任務數據吞吐60TB+/天,離線小時數據分析我們做的:我們做的:常規(guī)運營數據分析數據挖掘和用戶精分推薦系統(tǒng)用戶按地域收入年齡性別收入層次劃分廣告系統(tǒng)暴風Hadoop集群架構使用的Hadoop生態(tài)圈Hadoop 1.0.3基礎計算框架 Hive 離線數據分析 95%任務 Pig 離線數據分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 文具安全教案課件
- 印刷業(yè)互聯網+與融合發(fā)展考核試卷
- 冷藏車運輸企業(yè)風險管理與內部控制系統(tǒng)考核試卷
- 天然氣藏動態(tài)模擬與預測考核試卷
- 影視錄放設備顯示技術考核試卷
- 文化藝術與城市品牌建設考核試卷
- 木片干燥技術與木材應力釋放考核試卷
- 健身器材行業(yè)企業(yè)文化建設與品牌形象提升考核試卷
- 保險業(yè)與新能源保險市場的機遇與挑戰(zhàn)應對策略案例分析考核試卷
- 制糖業(yè)的可持續(xù)發(fā)展評估考核試卷
- 項目合作分潤合同范例
- 2025年中國艾草行業(yè)市場現狀、發(fā)展概況、未來前景分析報告
- 高中 人音版 音樂鑒賞 第二單元《漢族民歌》課件
- 射頻消融在室性早搏治療中的應用
- 2024年濰坊工程職業(yè)學院單招職業(yè)適應性測試題庫完美版
- 人音版音樂七年級上冊《友誼地久天長》課件
- 承包送貨合同模板
- 第一章-社會心理學概論
- GB 26920-2024商用制冷器具能效限定值及能效等級
- 2024年江蘇省中等職業(yè)學校學生學業(yè)水平考試機械CAD繪圖試卷(含5張圖)
- 2024年7天雙方無責任試崗期協議書模板
評論
0/150
提交評論