版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1主要內(nèi)容Hadoop項(xiàng)目簡介HDFS體系結(jié)構(gòu)HDFS關(guān)鍵運(yùn)行機(jī)制HadoopVS.Google(分布式文件系統(tǒng))HadoopAPIHadoop環(huán)境搭建2Hadoop項(xiàng)目簡介吃水不忘挖井人DougCutting簡介:Lucene(開源的全文檢索包人)、Nutch(開源搜索引擎)、hadoop創(chuàng)始人。曾經(jīng)在是雅虎搜索工程師,后面加入Cloudera,發(fā)展hadoop的企業(yè)級應(yīng)用。一位盜火者,把高深的搜索引擎技術(shù)帶給普通大眾。3Hadoop項(xiàng)目簡介Apache的解決方案Google云計算MapReduceBigTableGFSChubbyGFS-->HDFSMapReduce-->Hadoop
BigTable-->HBase
5
HDFS體系結(jié)構(gòu)
NameNodeMasterDataNodeChunksever6一個名字節(jié)點(diǎn)和多個數(shù)據(jù)節(jié)點(diǎn)數(shù)據(jù)復(fù)制(冗余機(jī)制)
--存放的位置(機(jī)架感知策略)故障檢測--數(shù)據(jù)節(jié)點(diǎn)心跳包(檢測是否宕機(jī))塊報告(安全模式下檢測)數(shù)據(jù)完整性檢測(校驗(yàn)和比較)--名字節(jié)點(diǎn)(日志文件,鏡像文件)空間回收機(jī)制
HDFS關(guān)鍵運(yùn)行機(jī)制
--保障可靠性的措施7HDFS關(guān)鍵運(yùn)行機(jī)制
--寫文件流程客戶端緩存流水線復(fù)制并發(fā)寫控制流程:1.客戶端把數(shù)據(jù)緩存到本地臨時文件夾2.臨時文件夾數(shù)據(jù)超過64M,客戶端聯(lián)系NameNode,NameNode分配DataNode,DataNode依照客戶端的位置被排列成一個有著最近物理距離和最小的序列3.與序列的第一個數(shù)據(jù)服務(wù)器建立Socket連接,發(fā)送請求頭,然后等待回應(yīng),依次下傳,客戶端得到回包,流水線建立成功,4.正式發(fā)送數(shù)據(jù),以4K為大小傳送9HDFSVS.GFS總體架構(gòu)的比較數(shù)據(jù)結(jié)構(gòu)化管理組件:Hbase→BigTable并行計算模型:MapReduce→MapReduce分布式文件系統(tǒng):HDFS→GFSHadoop缺少分布式鎖服務(wù)ChubbyHBaseMapReduceHDFSBigTableMapReduceGFSHadoop云計算應(yīng)用Google云計算應(yīng)用10HDFSVS.GFSHDFS與GFS比較中心服務(wù)器模式的差異GFS:多臺物理服務(wù)器,選擇一臺對外服務(wù),損壞時可選擇另外一臺提供服務(wù)HDFS:單一中心服務(wù)器模式,存在單點(diǎn)故障原因:Hadoop缺少分布式鎖服務(wù)11HDFSVS.GFSHDFS與GFS比較子服務(wù)器管理模式差異GFS:ChunkServer在Chubby中獲取獨(dú)占鎖表示其生存狀態(tài),Master通過輪詢這些獨(dú)占鎖獲知ChunkServer的生存狀態(tài)HDFS:DataNode通過心跳的方式告知NameNode其生存狀態(tài)GFS中,Master損壞時,替補(bǔ)服務(wù)器可以快速獲知ChunkServer的狀態(tài)HDFS中,NameNode損壞后,NameNode恢復(fù)時需要花費(fèi)一段時間獲知DataNode的狀態(tài)在添加數(shù)據(jù)存儲節(jié)點(diǎn)時,GFS的伸縮性較HDFS要好原因:Hadoop缺乏分布式鎖服務(wù)13HDFSVS.GFSHDFS與GFS比較HDFS具備空間回收機(jī)制文件刪除時,僅刪除目錄結(jié)構(gòu)實(shí)際數(shù)據(jù)的刪除在等待一段時間后實(shí)施優(yōu)點(diǎn):便于恢復(fù)文件14HDFS
API簡單的HDFSAPI:
hdfs.copyFromLocalFile(pathsrcPath,pathdstPath)
上傳本地文件到HDFS的指定位置上eg: 1.Configurationconfig=newConfiguration();
2.hdfs=(config);
3.PathsrcPath=newPath(srcFile);
4.PathdstPath=newPath(dstFile);
5.hdfs.copyFromLocal,dstPath);
hdfs.create(pathpath)
創(chuàng)建HDFS文件 1.Configurationconfig=newConfiguration();
2.hdfs=(config);
3.Pathpath=newPath();
4.FSDataOutputStreamoutputStream=hdfs.create(path);
5.outputStream.write(buff,0,buff.length);15HDFS
API常用的HDFSAPI:hdfs.rename(PathfromPath,PathtoPath) 重命名hdfs文件hdfs.delete(Pathf,Booleanrecursive) 刪除指定HDFS文件hdfs.exists(Pathpath) 檢查指定路徑是否存在
17HDFS
--安防行業(yè)的應(yīng)用前景HDFS存儲相對傳統(tǒng)存儲的優(yōu)勢海量數(shù)據(jù)存儲傳統(tǒng)存儲:海量視頻存儲對硬盤要求過高,不能動態(tài)增加硬盤容量,擴(kuò)展容量方便HDFS存儲:可以動態(tài)增加容量,容量抽象為沒有上限,流式存儲很適合視頻數(shù)據(jù)。18HDFS
--安防行業(yè)的應(yīng)用前景HDFS存儲相對傳統(tǒng)存儲的優(yōu)勢海量數(shù)據(jù)分析傳統(tǒng)存儲:從海量視頻數(shù)據(jù)存儲中分析數(shù)據(jù)基本無法實(shí)現(xiàn)。HDFS存儲:和hadoop另外的MapReduce分布式計算架構(gòu)配合,可以進(jìn)行海量視頻數(shù)據(jù)的分析。19HDFS
--安
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度專業(yè)職業(yè)測評與居間合同3篇
- 二零二五年度P2P出借平臺投資者教育與服務(wù)合同3篇
- 二零二五年度企業(yè)破產(chǎn)財產(chǎn)清算協(xié)議2篇
- 個性化條款:20249A文離婚合同案例分析版
- 二零二五版房屋征收拆遷補(bǔ)償協(xié)議書3篇
- 二零二五年度建筑工程招投標(biāo)與合同質(zhì)量保證金管理協(xié)議書3篇
- 物業(yè)管理處與2025年度收費(fèi)員服務(wù)協(xié)議3篇
- 2025年度門衛(wèi)人員崗位職責(zé)優(yōu)化聘用協(xié)議3篇
- 2025年度內(nèi)蒙古自治區(qū)農(nóng)業(yè)廢棄物資源化利用承包合同3篇
- 二零二五年度城鄉(xiāng)汽車租賃及售后服務(wù)合同4篇
- 2025年山東華魯海運(yùn)有限公司招聘筆試參考題庫含答案解析
- 人教版物理八年級下冊 專項(xiàng)訓(xùn)練卷 (一)力、運(yùn)動和力(含答案)
- 山東省房屋市政工程安全監(jiān)督機(jī)構(gòu)人員業(yè)務(wù)能力考試題庫-中(多選題)
- 《七律二首 送瘟神》教案- 2023-2024學(xué)年高教版(2023)中職語文職業(yè)模塊
- 2024年中考語文滿分作文6篇(含題目)
- 北師大版 2024-2025學(xué)年四年級數(shù)學(xué)上冊典型例題系列第三單元:行程問題“拓展型”專項(xiàng)練習(xí)(原卷版+解析)
- 2023年譯林版英語五年級下冊Units-1-2單元測試卷-含答案
- 施工管理中的文檔管理方法與要求
- DL∕T 547-2020 電力系統(tǒng)光纖通信運(yùn)行管理規(guī)程
- 種子輪投資協(xié)議
- 執(zhí)行依據(jù)主文范文(通用4篇)
評論
0/150
提交評論