




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
Hadoop大數(shù)據(jù)解決方案進階應用Hadoop講師:迪倫(北風網版權所有)MapReduce高階實現(xiàn)(7)hadoop開發(fā)視頻教程共10頁,您現(xiàn)在瀏覽的是第1頁!計數(shù)器
內置計數(shù)器
用戶定義的Java計數(shù)器
計數(shù)器名稱的易讀性課程目標hadoop開發(fā)視頻教程共10頁,您現(xiàn)在瀏覽的是第2頁!計數(shù)器通過計數(shù)器了解待分析的數(shù)據(jù),比如分析數(shù)據(jù)集中的無效記錄計數(shù)器是一種手機作業(yè)統(tǒng)計信息的有效手段,用于質量控制或應用級統(tǒng)計計數(shù)器可輔助診斷系統(tǒng)故障對于大型分布式作業(yè)而言,使用計數(shù)器檢測事件更為方便獲取計數(shù)器比輸出日志更方便根據(jù)計數(shù)器值統(tǒng)計特定時間的發(fā)生次數(shù)要比分析一堆日志文件容易得多計數(shù)器由其關聯(lián)任務維護,并定期傳給tasktracker,再由tasktracker傳給jobtracker用戶可以自定義計數(shù)器,需要在整個網絡中發(fā)送一個任務的計數(shù)器值每次都是完整傳輸?shù)模窃隽總鬏斨挥挟斪鳂I(yè)執(zhí)行成功后,計數(shù)器的值才是完整可靠的hadoop開發(fā)視頻教程共10頁,您現(xiàn)在瀏覽的是第3頁!用戶定義的Java計數(shù)器MapReduce允許用戶編寫程序來定義計數(shù)器,計數(shù)器的值可在mapper或reducer中增加多個計數(shù)器由一個Java枚舉(enum)類型來定義,以便對計數(shù)器分組一個作業(yè)可以定義的枚舉類型數(shù)量不限,各個枚舉類型所包含的字段數(shù)量也不限枚舉類型名稱即為組的名稱,枚舉類型的字段就是計數(shù)器名稱MapReduce框架將跨所有map和reduce聚集這些計數(shù)器,并在作業(yè)結束時產生一個最終結果hadoop開發(fā)視頻教程共10頁,您現(xiàn)在瀏覽的是第4頁!用戶自定義計數(shù)器實例實例:統(tǒng)計最高氣溫的作業(yè),也統(tǒng)計氣溫值缺失的記錄,不規(guī)范的字段和質量代碼hadoop開發(fā)視頻教程共10頁,您現(xiàn)在瀏覽的是第5頁!用戶自定義計數(shù)器實例運行程序:
$hadoopjarjob.jarMaxTemperatureWithCountersinput/ncdc/alloutput-counters作業(yè)成功完成執(zhí)行后,可以看到如下輸出:hadoop開發(fā)視頻教程共10頁,您現(xiàn)在瀏覽的是第6頁!內置計數(shù)器Hadoop為每個作業(yè)維護若干內置計數(shù)器,以描述該作業(yè)的各項指標Map-Reduce框架計數(shù)器map輸入的記錄、跳過的記錄、輸入的字節(jié),輸出的記錄、輸出的字節(jié)Combine輸入的記錄、輸出的記錄Reduce輸入的記錄、輸出的記錄、跳過的組、溢出的記錄文件系統(tǒng)計數(shù)器文件系統(tǒng)讀的字節(jié)文件系統(tǒng)寫的字節(jié)作業(yè)計數(shù)器已啟用的map任務、reduce任務(包括推測執(zhí)行的任務)失敗的map任務、reduce任務數(shù)據(jù)本地/機架本地/其他本地的map任務hadoop開發(fā)視頻教程共10頁,您現(xiàn)在瀏覽的是第7頁!動態(tài)計數(shù)器動態(tài)計數(shù)器不由Java枚舉類型定義的計數(shù)器定義動態(tài)計數(shù)器:
publicvoidincrCounter(Stringgroup,Stringcounter,longamount)Hadoop會先將Java枚舉類型轉變成String類型,再通過RPC發(fā)送計數(shù)器值使用枚舉類型和String類型在事實上是等價的枚舉類型易于使用,還提供類型安全,適合大多數(shù)作業(yè)使用某些特定場合需要動態(tài)創(chuàng)建計數(shù)器,可以使用String接口hadoop開發(fā)視頻教程共10頁,您現(xiàn)在瀏覽的是第8頁!用戶自定義計數(shù)器實例ha
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2020-2021廣東省深圳市寶安區(qū)寶城小學六年級小升初語文綜合測試卷及答案
- 主體模板工程施工方案
- 扣盤式腳手架施工方案
- 2025年中考物理模擬試卷猜題卷3(含答案)
- 2025屆浙江省臺州市團隊六校中考生物模擬預測題含解析
- 勞務合同保密合同范例
- 肝移植GVHD的護理
- 農資服務代辦合同范例
- 學校秋季志愿服務計劃
- 制定有效的輪崗計劃
- 2025年初級社會工作者綜合能力全國考試題庫(含答案)
- 2024解析:第十章 浮力綜合應用-講核心(解析版)
- Unit4BodylanguageUsingLanguage肢體語言在續(xù)寫中的運用課件高中英語人教版選擇性
- 大數(shù)據(jù)與人工智能營銷(南昌大學)知到智慧樹章節(jié)答案
- 《讓座》(課件)西師大版音樂二年級上冊
- 廣告創(chuàng)作與視覺傳媒考核試卷
- 2024年江西省公務員考試《行測》真題及答案解析
- 醫(yī)學裝備管理工作總結
- 2024-2025學年湖南省雅禮集團高二(上)第一次月考數(shù)學試卷(含答案)
- 現(xiàn)代家政導論-課件 4.1.3認識我國家政教育發(fā)展
- 《互聯(lián)網應用新特征》課件 2024-2025學年人教版(2024)初中信息科技七年級全一冊
評論
0/150
提交評論