版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、基于Alluxio提升Spark和HadoopHDFS的系統(tǒng)性能與穩(wěn)定性技術(shù)創(chuàng)新,變革未來內(nèi)容Alluxio基本原理回顧與最新特性介紹基于Alluxio的Spark DataFrame/RDD性能調(diào)優(yōu)基于Alluxio提升HDFS集群的性能和SLA穩(wěn)定性總結(jié)BIG DATA ECOSYSTEM YesterdayBIG DATA ECOSYSTEM Today4BIG DATA ECOSYSTEM Issue5BIG DATA ECOSYSTEM With Alluxio6BIG DATA ECOSYSTEM With Alluxio7Alluxio是什么Alluxio是世界上第一個以內(nèi)存為中
2、心 (memory-centric)的虛擬的分布式存儲系統(tǒng)。Alluxio介于計算框架和現(xiàn)有的存儲系統(tǒng)之間, 為大數(shù)據(jù)軟件棧帶來了顯著的性能提升。Alluxio的發(fā)展2012年12月,Alluxio(Tachyon)發(fā)布了第一個版本0.1.02017年1月,Alluxio的最新發(fā)布版本為1.4Alluxio的發(fā)展自2013年4月開源以來,已有超過100個組織機構(gòu)的400多貢獻(xiàn)者參 與到Alluxio的開發(fā)中。包括阿里巴巴,Alluxio,百度,卡內(nèi)基梅隆 大學(xué),IBM,Intel,南京大學(xué),Red Hat,UC Berkeley和Yahoo?;钴S的開源社區(qū)Popular Open Source
3、 Projects Growth關(guān)于南大PASALab和我的貢獻(xiàn)情況INDUSTRY ADOPTION121314Alluxio整體架構(gòu)Master-WorkerMaster管理全部元數(shù)據(jù)監(jiān)控各個Worker狀態(tài)Worker管理本地MEM、SSD和HDDClient向用戶和應(yīng)用提供訪問接口向Master和Worker發(fā)送請求Under File System用于備份Under File SystemMasterClient Worker1MEM SSD HDDnode 1Worker3MEM SSD HDDnode 3Worker2MEM SSD HDDnode 2Alluxio文件組織元數(shù)據(jù)
4、為Inode Tree形式樹狀結(jié)構(gòu)文件和目錄都為一個Inode文件屬性構(gòu)成Inode的基本信息:id、名稱、長度、創(chuàng)建/修改時間等塊信息備份信息/Dir0/Dir1/Dir2/File1File0name : File1 List : Block0, Block1, . checkPointPath : hdfs:/xxx:yyy/zzz.Alluxio讀寫行為使用讀寫類型控制數(shù)據(jù)的存儲層位置ReadType - 控制讀數(shù)據(jù)時的行為WriteType - 控制寫數(shù)據(jù)時的行為類型取值含義讀類型ReadTypeCACHE_PROMOTE(默認(rèn))如果讀取的數(shù)據(jù)塊在Worker上時,該數(shù)據(jù)塊被移動到W
5、orker的最高層。如果該數(shù)據(jù)塊不在本地Worker中,那么就將一個副本添加到本地Worker中。CACHE如果該數(shù)據(jù)塊不在本地Worker中,那么就將一個副本添加到本地Worker中。NO_CACHE不會創(chuàng)建副本。寫類型WriteTypeCACHE_THROUGH數(shù)據(jù)被同步地寫入到Worker和底層存儲系統(tǒng)。MUST_CACHE(默認(rèn))數(shù)據(jù)被同步地寫入到Worker,但不會寫入底層存儲系統(tǒng)。THROUGH數(shù)據(jù)被同步地寫入到底層存儲系統(tǒng),但不會寫入Worker。ASYNC_THROUGH數(shù)據(jù)被同步地寫入到Worker,并異步地寫入底層存儲系統(tǒng)。Alluxio容錯機制Master支持使用ZooK
6、eeper啟動多個Master日 志 Journal : EditLog + ImageWorker由Master監(jiān)控,失效時自動重啟備份Checkpoint & 世系關(guān)系 Lineage命令行接口運行方式bin/alluxio fs commandcatchmodcopyFromLocalcopyToLocalfileInfols路徑表示alluxio:/:/支持通配符 *,如:bin/alluxio fs rm /data/2014*mkdirmvrmtouchmountunmount文件系統(tǒng)API以Java API的方式提供Alluxio的訪問接口創(chuàng)建、寫文件FileSystem fs
7、= FileSystem.Factory.get(); AlluxioURI path = new AlluxioURI(/myFile); FileOutStream out = fs.createFile(path); out.write(.);out.close();讀文件FileSystem fs = FileSystem.Factory.get(); AlluxioURI path = new AlluxioURI(/myFile); FileInStream in = fs.openFile(path); in.read(.);in.close();最新版本Java API Doc
8、(/documentation/master/api/java/)兼容現(xiàn)有的Hadoop FileSystem接口在MapReduce、Spark等作業(yè)中以“alluxio:/”代替“hdfs:/”Alluxio-FUSE能夠在Linux的本地文件系統(tǒng)中掛載Alluxio利用Linux libfuse功能包掛載為Linux本地文件系統(tǒng)中的一個目錄方便快捷的使用方式$ alluxio-fuse.sh mount 像使用本地文件系統(tǒng)一樣使用支持的操作openreadlseekwriteKernelUserspacecat /tmp/alluxio-fileglibcVFSFUSENFSExt4.g
9、libclibfuseAlluxio鍵值存儲庫APIAlluxio的鍵值(key-value)存儲功能創(chuàng)建一個鍵值存儲庫并且把鍵值對放入其中鍵值對放入存儲后是不可變的鍵值存儲庫完整保存后,打開并使用該鍵值存儲庫API樣例KeyValueSystem kvs = KeyValueSystem.Factory().create();KeyValueStoreWriter writer = kvs.createStore(new AlluxioURI(alluxio:/path/my-kvstore); writer.put(100, foo);writer.put(200, bar); write
10、r.close();KeyValueStoreReader reader = kvs.openStore( new AlluxioURI(alluxio:/path/kvstore/);reader.get(100);reader.get(“300”);/null reader.close();Alluxio KV Storebatch put K1 get 2 V1foo分層存儲為什么需要多級存儲?內(nèi)存大小有限兩個概念StorageTier存儲層,對應(yīng)存儲介質(zhì),如內(nèi)存、SSD、硬盤StorageDir數(shù)據(jù)塊存放在Alluxio Worker的本地目錄,通常對應(yīng)一塊磁盤設(shè)備一個StorageT
11、ier包含一個或多個StorageDir數(shù)據(jù)塊管理Allocator- 選擇分配哪個StorageDir里的空間GreedyAllocator、MaxFreeAllocator、RoundRobinAllocatorEvictor- 選擇撤銷哪個StorageDir里的哪些數(shù)據(jù)塊GreedyEvictor、LRUEvictor、LRFUEvictor、PartialLRUEvictor統(tǒng)一命名空間統(tǒng)一命名空間能夠?qū)⒍鄠€數(shù)據(jù)源中的數(shù)據(jù)掛載到Alluxio中多個數(shù)據(jù)源使用統(tǒng)一的命名空間用戶使用統(tǒng)一路徑訪問統(tǒng)一命名空間的適用場景將數(shù)據(jù)遷移至Alluxio將數(shù)據(jù)從原先基于磁盤的存儲遷移至Alluxio
12、,利用內(nèi)存加速在應(yīng)用中使用統(tǒng)一路徑訪問Alluxio和底層存儲系統(tǒng)管理不同數(shù)據(jù)源中的數(shù)據(jù)將數(shù)據(jù)從不同數(shù)據(jù)源遷移至Alluxio,利用內(nèi)存加速在應(yīng)用中使用統(tǒng)一路徑訪問不同數(shù)據(jù)源中的數(shù)據(jù)實現(xiàn)不同數(shù)據(jù)源之間的數(shù)據(jù)共享與計算框架相結(jié)合使用Alluxio作為計算框架的存儲系統(tǒng)Spark、Hadoop MapReduce、FlinkH20、Impala、不需改動現(xiàn)有應(yīng)用源碼存儲路徑 “hdfs:/ip:port/xxx” - “alluxio:/ip:port/xxx”Zeppelin默認(rèn)集成Alluxio,使用Alluxio作為解釋器安全性安全認(rèn)證Alluxio能夠識別訪問用戶的身份,這是訪問權(quán)限以及加
13、密等其他安 全特性的基礎(chǔ)當(dāng)用戶(客戶端)連接Alluxio(服務(wù)端)時,需要特定的用戶、密 碼或其他認(rèn)證方式訪問權(quán)限控制以文件為粒度進行訪問權(quán)限控制類似POSIX標(biāo)準(zhǔn)的訪問權(quán)限模型用戶權(quán)限、用戶組權(quán)限、其他用戶權(quán)限讀r、寫w、執(zhí)行xWeb界面Master WebUI例Worker WebUI例技術(shù)特點小結(jié)Co-located compute and data with memory-speed access to dataVirtualized different storage systems under a unified namespaceScale-out architectureFi
14、le system API, software only系統(tǒng)優(yōu)勢小結(jié)UnificationNew workflows across any data in any storage systemPerformanceOrders of magnitude improvement in run timeFlexibilityChoice in compute and storage grow each independently, buy only what is neededAlluxio 1.4版本的重要新特性介紹優(yōu)化Alluxio底層對象存儲API優(yōu)化的對象存儲連接器Alluxio 1.4.
15、0在對象存儲上的小文件和小規(guī)模讀取的性能方面有了 重大改進。改進UFS API提升了對象存儲中獲取元數(shù)據(jù)的性能。簡化的對象存儲集成如今集成新的對象存儲只需要原先實現(xiàn)的方法中的一半即可。在源代碼行數(shù)方面,現(xiàn)在僅需要不到400行代碼即可完成新的對象存 儲的集成,不到原來的一半。Alluxio 1.4版本的重要新特性介紹文件系統(tǒng)原生REST接口新引入的REST接口提供了同Alluxio native Java API的對等性,其 目的是促進非Java環(huán)境與Alluxio的交互。REST接口通過Alluxio代理進程實現(xiàn),該進程使用一個內(nèi)部Alluxio Java客戶端代理REST接口和Alluxio
16、服務(wù)器之間的通信為了獲得最佳性能,推薦將Alluxio代理與Alluxio服務(wù)進程放在一起。這 可以讓非java應(yīng)用以內(nèi)存級的速度訪問Alluxio中的數(shù)據(jù),同時最小化Alluxio代理和Alluxio服務(wù)之間額外網(wǎng)絡(luò)的開銷。Alluxio 1.4版本的重要新特性介紹數(shù)據(jù)包流(Packet Streaming)Alluxio 1.4.0引入了一種新的網(wǎng)絡(luò)傳輸協(xié)議,旨在充分利用Alluxio組件之間的可用網(wǎng)絡(luò)帶寬在標(biāo)準(zhǔn)網(wǎng)絡(luò)中高達(dá)2倍的IO性能改進,以及在高延遲吞吐量產(chǎn)品環(huán)境下取 得更好的結(jié)果減少了網(wǎng)絡(luò)傳輸期間使用的緩存,并且依賴于使用連續(xù)流傳輸協(xié)議取 代數(shù)據(jù)傳輸中的請求-響應(yīng)協(xié)議通過使用這種方法
17、,能確保網(wǎng)絡(luò)管道持續(xù)飽和,因為我們不需要 發(fā)送周期性的額外數(shù)據(jù)請求Alluxio 1.4版本的重要新特性介紹支持Apache Hive(Contributed By PASALab)將Apache Hive集成運行在Alluxio上,具體看使用文檔 (/docs/master/en/Running-Hive- with-Alluxio.html)提升了與基于YARN的應(yīng)用的集成工作支持在用戶/權(quán)限打開的模式下將YARN的應(yīng)用運行在Alluxio上Alluxio 1.4版本的重要新特性介紹提升了Alluxio Master中的鎖管理機制使得基于MapReduce的計算框架能夠有更高并發(fā)的元數(shù)據(jù)操
18、作性能對緩慢底層文件系統(tǒng)進行元數(shù)據(jù)操作(例如在云存儲中進行重命名) 的性能能夠提升1個數(shù)量級左右指定層級寫操作用戶能夠?qū)?shù)據(jù)顯式地寫到Alluxio存儲層級中的指定層,而不是原 先默認(rèn)的最頂層內(nèi)容Alluxio基本原理回顧與1.4的最新特性介紹基于Alluxio的Spark DataFrame性能調(diào)優(yōu)基于Alluxio提升HDFS集群的性能和SLA穩(wěn)定性總結(jié)實驗環(huán)境Spark 2.0.0 + Alluxio 1.2.0Single worker: Amazon r3.2xlarge(61 GB MEM, 8- core CPU)Comparisons:AlluxioSpark Storage
19、Level: MEMORY_ONLYSpark Storage Level: MEMORY_ONLY_SERSpark Storage Level: DISK_ONLY19232502001501005000104050Time seconds2030DataFrame Size GBREADING CACHED DATAFRAME (PARQUET)Alluxio (textFile) MEMORY_ONLY_SERDISK_ONLY MEMORY_ONLY24050200250AlluxioNo Alluxio100150Time seconds新場景:READ 50 GB DATAFRA
20、ME(SSD)250250500125015001750AlluxioNo Alluxio7501000Time seconds新場景:READ 50 GB DATAFRAME(S3)10 x average speedup, 17x peak speedup內(nèi)容Alluxio基本原理回顧與1.4的最新特性介紹基于Alluxio的Spark DataFrame/RDD性能調(diào)優(yōu)基于Alluxio提升HDFS集群的性能和SLA穩(wěn)定性總結(jié)使用Alluxio提升HDFS集群的性能和SLA穩(wěn)定性Alluxio可以給與HDFS共同部署的計算集群的兩 大好處提升高達(dá)10倍的性能提升性能的高可預(yù)測性使得SLA(service-level agreement服務(wù)級 別協(xié)議)很容易滿足例:作業(yè)運行時間的變化范圍從100秒以上縮短至2秒場景 1周作業(yè)和月作業(yè)都是IO密集型結(jié)論:Alluxio對這兩種作業(yè)的性能提升都很明顯。在不使用Alluxio的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024綜合崗位勞動協(xié)議模板版B版
- 2024年版城市出租車租賃協(xié)議樣式版B版
- 2025年消防安全管理咨詢及標(biāo)準(zhǔn)制定合同2篇
- 2024-2025學(xué)年高中歷史第七單元復(fù)雜多樣的當(dāng)代世界第24課兩極對峙格局的形成學(xué)案含解析岳麓版必修1
- 2024-2025學(xué)年高中語文課時分層作業(yè)4歸去來兮辭并序含解析新人教版必修5
- 二零二四年度時尚傳媒廣告投放及制作合同
- 2025年度道路照明燈具批發(fā)合同范本3篇
- 2025年酒店客房銷售渠道建設(shè)與維護合同3篇
- 2025年度綠色生態(tài)農(nóng)業(yè)種植承包合同范本3篇
- 2025年蔬菜種植戶與農(nóng)產(chǎn)品電商平臺合作合同范本3篇
- GB/T 8005.2-2011鋁及鋁合金術(shù)語第2部分:化學(xué)分析
- GB/T 37234-2018文件鑒定通用規(guī)范
- GB/T 31888-2015中小學(xué)生校服
- 質(zhì)量檢查考核辦法
- 不動產(chǎn)登記實務(wù)培訓(xùn)教程課件
- 云南省普通初中學(xué)生成長記錄-基本素質(zhì)發(fā)展初一-初三
- 2023年系統(tǒng)性硬化病診斷及診療指南
- 外科醫(yī)師手術(shù)技能評分標(biāo)準(zhǔn)
- 《英語教師職業(yè)技能訓(xùn)練簡明教程》全冊配套優(yōu)質(zhì)教學(xué)課件
- 采購控制程序
- 六年級上冊數(shù)學(xué)簡便計算題200題專項練習(xí)
評論
0/150
提交評論