




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、百度大數(shù)據(jù)離線計(jì)算平臺(tái)流式Shuffle服務(wù)目錄背景架構(gòu)關(guān)鍵技術(shù)收益與總結(jié)下一步計(jì)劃背景-百度私有云FPGAGPU整機(jī)柜Machine Management環(huán)境 初始化機(jī)器故障 自動(dòng)化機(jī)器 自動(dòng)流轉(zhuǎn)Container仲裁器StateManagement調(diào)度算法隊(duì)列/優(yōu)先級(jí)資源位移MetaServerNameSpaceStateCenterIterativeRealTimeBatchNFSTableOjbect搜索金融糯米AI開(kāi)放云ADU服 務(wù) 托 管研 發(fā) 效 率 相 關(guān) 工 具預(yù) 算交 付 管 理結(jié) 算高精硬件集群/機(jī)器管理集群操作系統(tǒng)-Matrix統(tǒng)一資源調(diào)度-Normandy分布式文件系
2、統(tǒng)-AFS分布式計(jì)算分布式存儲(chǔ)產(chǎn)品生態(tài)背景-百度大數(shù)據(jù)計(jì)算平臺(tái)C+PythonJavaSimplified Unified APITMDStreamDCE(MR/DAG)MPI/ELFSparkNormandyMatrixIDC計(jì)算引擎資源調(diào)度資源管理機(jī)器資源API層20142007百度DAG引擎上線20062004MapReduce論文發(fā)表Hadoop開(kāi)源百度MR上線基于Hadoop 0.15.12011百度MR單集群規(guī)模 超過(guò)5000臺(tái)2013百度MR單集群規(guī)模13000臺(tái)2015內(nèi)存流式Shuffle上線2014百度統(tǒng)一計(jì)算表 示層發(fā)布背景-百度大數(shù)據(jù)離線計(jì)算平臺(tái)發(fā)展歷程背景-DAG引擎
3、背景-一般的Shuffle模式MapperMapperReducerMapperReducer目錄背景架構(gòu)關(guān)鍵技術(shù)收益與總結(jié)下一步計(jì)劃架構(gòu)架構(gòu) JobMasterMap WorkerMap WorkerMap Worker ShuffleMasterShufflerShufflerShuffler Reduce WorkerReduce WorkerReduce Worker HDFS7. map push to shufflerHDFSHDFS1. create shuffle sessionControl messageData Flow架構(gòu)-基本概念ShuffleMasterShuffl
4、er(Shuffle Worker)WriterReaderSessionShard目錄背景架構(gòu)關(guān)鍵技術(shù)收益與總結(jié)下一步計(jì)劃關(guān)鍵技術(shù)-ShuffleMaster智能調(diào)度全局視圖異常檢測(cè)負(fù)載均衡負(fù)載均衡ShufflerShardSessionManagerJobMasterRpcServerCreateSession DeleteSessionShufflerWriterShufflerShufflerWriterWriterHeartBeatSessionUpdatespushShuffleWorkerInfopushSessionUpdateDataPusherRpcClientAssgnI
5、nfoAssgnInfoAssgnInfoAssgnInfoAssgnInfoAssgnInfoAssgnInfoAssgnInfoSession AShard0Shard1Shard2Shard3Shard4Shard5writer決定 primary 和 backup 的切換HeartBeatpushMapperInfoDataCollectorRpcServerWriter上報(bào)ShufflerExceptionShuffler上報(bào)負(fù)載情況增量更新MapperInfoMapperIDAddressSessonIDUpdateInfoShuffle Worker InfoSWIDAddres
6、sStatusLoadAssignment InfoAssginIdShardIDSWIDPrimarySession InfoShuffle Master關(guān)鍵技術(shù)-Writer數(shù)據(jù)緩存與異步發(fā)送異常處理MapProcessWriterSession ASession BWriterBufferDataSenderShuffler分配信息Shuffler分配信息WriterBufferDataSenderSession更新ShuffleMasterShufflersK VrpcK Vrpcrpc狀態(tài)匯報(bào)Shuffler狀態(tài)關(guān)鍵技術(shù)-Writer異常處理wriRPC回調(diào)返回Successter發(fā)
7、送buffer發(fā)送RPC給某個(gè) ShufflerShuffler掛了超時(shí)也沒(méi)有回調(diào)重試其他Shuffler所有RPC不再?lài)L試此Shuffler 此Buffer重試其他Shuffler返回給Writer數(shù)據(jù)發(fā)送成功Cancle此Buffer對(duì)其他Shuffler的RPCShuffer太忙此Buffer的發(fā)送暫時(shí)回避這個(gè)ShufflerBusy關(guān)鍵技術(shù)-Shuffler內(nèi)存聚合流控Sort&FlushShuffler相同Partition的數(shù)據(jù)交給一個(gè)active Sorter每個(gè)Sorter限制一定的內(nèi)存大小,滿內(nèi)存后交給排序線程Sorter等待過(guò)長(zhǎng)時(shí)間后,也交給排序線程所有Sorter使用內(nèi)存
8、不超過(guò)閾值Rpc with dataRpc with dataRpc with dataRpc with ackSortflushandackSessionHandlerShardHandlerSH.SHSorter.SorterSorterSessionHandlerShardHandlerSH.SHSorterSorterRpc with ackSortflushandackSortflushandackN個(gè)排序線程,排序之后寫(xiě)入DFS,并Ack相應(yīng)數(shù)據(jù)塊待排序的Sorter個(gè)數(shù)多于排序線程數(shù)時(shí),部分Sorter等待RPC ServerCreateSession DeleteSession
9、WritersShuffleMaster關(guān)鍵技術(shù)-Reader所有Map完成后,調(diào)度Reduce直接讀取DFS排好序的數(shù)據(jù)去重&數(shù)據(jù)驗(yàn)證多路歸并排序關(guān)鍵技術(shù)-Map PipelineMap端Writer,要等Shuffler將數(shù)據(jù)持久化到DFS后,才能將發(fā) 送的rpc buffer釋放所有發(fā)送的數(shù)據(jù)被Shuffler持久化后,Map才能安全退出MapperMapperMapperWaitingFor FlushMapper關(guān)鍵技術(shù)-MIMO無(wú)MIMO時(shí):Vetex3和vertex4 收到vertex2的全 部?jī)陕窋?shù)據(jù)再做filter。此業(yè)務(wù)作業(yè)多shuffle近10T 數(shù)據(jù)關(guān)鍵技術(shù)-MIMO方
10、案不同邊可對(duì)應(yīng)不同 session不同session對(duì)應(yīng)不同的dfs結(jié)果目錄vertex0vertex1vertex3vertex2broadcastmimonormal shufflebroadcast關(guān)鍵技術(shù)-Runtime PartitionSplit1Split2Split3Task1Task2Task3ShuffleAppMa sterSplit1Split2Split3Task1ShuffleAppMa ster目錄背景架構(gòu)關(guān)鍵技術(shù)收益與總結(jié)下一步計(jì)劃收益與總結(jié)收益流式shuffle:減少舊shuffle mapmerge、reduce pull時(shí)間消耗內(nèi)存Push:map端不落盤(pán)
11、Shuffler內(nèi)存聚合:聚合度高,減少 map端seek,減少reduce端merge路 數(shù),減少I(mǎi)OPipeline:大大提高中小作業(yè)map端 運(yùn)行速度中間數(shù)據(jù)持久化:避免重算(對(duì)dag 作業(yè)尤為重要)收益與總結(jié)流式Shuffle服務(wù)push instead of pullShuffle過(guò)程交給能拿到更多全局信息、更專(zhuān)業(yè)的shuffler來(lái)做Map、Shuffler、Reduce,每個(gè)都做自己最適合做且擅長(zhǎng)做的事情Shuffle與Reduce解耦,簡(jiǎn)化Reduce,也為解決分桶不均問(wèn)題提供可能Pipeline。無(wú)縫的流線,減少無(wú)謂的等待問(wèn)題更多的網(wǎng)絡(luò)io(萬(wàn)兆網(wǎng)卡,網(wǎng)絡(luò)不是瓶頸)Shuffler資源共享,作業(yè)間可能互相影響(讓Shuffler資源非瓶頸)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 云南省楚雄彝族自治州祿豐市2024-2025學(xué)年八年級(jí)下學(xué)期開(kāi)學(xué)生物學(xué)試題(含答案)
- 農(nóng)業(yè)政策支持措施作業(yè)指導(dǎo)書(shū)
- 私人美容師服務(wù)合同
- 基于大數(shù)據(jù)的商業(yè)決策支持系統(tǒng)開(kāi)發(fā)合同
- 電子支付結(jié)算合作協(xié)議
- 農(nóng)業(yè)自動(dòng)化系統(tǒng)安裝維護(hù)合同
- 活動(dòng)籌備報(bào)告
- 《現(xiàn)代酒店管理基礎(chǔ)》(第二版)課件 任務(wù)7 酒店服務(wù)質(zhì)量管理
- 企業(yè)員工健康管理與促進(jìn)計(jì)劃指南
- 春蕾百合幼兒園入學(xué)條件
- 江蘇2024年江蘇省新聞出版學(xué)校招聘人員筆試歷年典型考題及考點(diǎn)附答案解析
- 大酒店風(fēng)險(xiǎn)分級(jí)管控和隱患排查治理雙體系文件
- 美容衛(wèi)生管理制度打印版
- 2024CSCO非小細(xì)胞肺癌診療指南解讀
- HJ 1131-2020 固定污染源廢氣 二氧化硫的測(cè)定 便攜式紫外吸收法(正式版)
- (高清版)JTGT 3610-2019 公路路基施工技術(shù)規(guī)范
- 湖南省建設(shè)工程竣工驗(yàn)收備案表
- 2022年江蘇省五年制專(zhuān)轉(zhuǎn)本考試英語(yǔ)真題(試卷+答案)
- 手術(shù)室穿脫手術(shù)衣小講課
- 2024年蕪湖職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)及答案解析
- (正式版)SHT 3075-2024 石油化工鋼制壓力容器材料選用規(guī)范
評(píng)論
0/150
提交評(píng)論