![數(shù)據(jù)庫系統(tǒng)原理與開發(fā)-列存儲數(shù)據(jù)庫-2_第1頁](http://file4.renrendoc.com/view12/M0A/35/38/wKhkGWa0zdeADLXCAACnzclwKSg780.jpg)
![數(shù)據(jù)庫系統(tǒng)原理與開發(fā)-列存儲數(shù)據(jù)庫-2_第2頁](http://file4.renrendoc.com/view12/M0A/35/38/wKhkGWa0zdeADLXCAACnzclwKSg7802.jpg)
![數(shù)據(jù)庫系統(tǒng)原理與開發(fā)-列存儲數(shù)據(jù)庫-2_第3頁](http://file4.renrendoc.com/view12/M0A/35/38/wKhkGWa0zdeADLXCAACnzclwKSg7803.jpg)
![數(shù)據(jù)庫系統(tǒng)原理與開發(fā)-列存儲數(shù)據(jù)庫-2_第4頁](http://file4.renrendoc.com/view12/M0A/35/38/wKhkGWa0zdeADLXCAACnzclwKSg7804.jpg)
![數(shù)據(jù)庫系統(tǒng)原理與開發(fā)-列存儲數(shù)據(jù)庫-2_第5頁](http://file4.renrendoc.com/view12/M0A/35/38/wKhkGWa0zdeADLXCAACnzclwKSg7805.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
七.二列存儲數(shù)據(jù)庫鳳荔用本節(jié)學(xué)目地?HBASE地存儲架構(gòu)?HBASE地系統(tǒng)架構(gòu)及基本組件一鳳荔用一,HBASE存儲結(jié)構(gòu)--意義?回顧HBASE地邏輯模型:表表地形式表達(dá)與存儲數(shù)據(jù),表--行與列---若干個列族。表基于行鍵,列族,列限定符與時間版本。每個c列族—DFS上單獨文件,空值不會被保存。?Key與Versionnumber在每個columnfamily均有一份;?HBase為每個值維護(hù)了多級索引,即:<key,columnfamily,columnname,timestamp>?物理存儲----上面地邏輯模型對于物理文件地過程二鳳荔用一,HBASE存儲結(jié)構(gòu)—物理存儲?一,表所有行都按照rowkey地字典序排列;?二,Table在行地方向上分割為多個Region;?三,Region按大小分割地,每個表開始只有一個region,隨著數(shù)據(jù)增多,region不斷增大,當(dāng)增大到一個閥值地時候,region就會等分會兩個新地region,之后會有越來越多地region;?四,Region是Hbase分布式存儲與負(fù)載均衡地最小單元,不同Region分布到不同RegionServer上三鳳荔用一,HBASE存儲結(jié)構(gòu)—存儲模型圖?模型層次圖四鳳荔用一,HBASE存儲結(jié)構(gòu)--存儲部件?一)表Table:面向列(族)地存儲與權(quán)限控制,列(族)獨立檢稀疏存儲。按行健地字典排序;Table在行地方向上分割多個Region。?2區(qū)域Region(表地Regions):每個Region存儲著Table地若干Region是分布式存儲地最小單元。?3Store(Region以列族為單位地單元):區(qū)域由一個或者多個Sto組成,每個store保存一個列族。Strore由memStore與零至多個StoreFile?4StoreFile:以HFile地格式存儲在分布式文件系統(tǒng)(HDFS)上五鳳荔用一,HBASE存儲結(jié)構(gòu)—storefile地結(jié)構(gòu)?StoreFile:以HFile存儲在HDFS)上,組成成?一)DataBlock保存表地數(shù)據(jù),可壓縮;?二)MetaBlock用戶自定義地鍵值對,可壓縮;?3)FileInfo存儲HFile地元信息,不能壓縮,用戶也可以在這分添加自己地元信息;?4)DataBlockIndex存儲數(shù)據(jù)塊索引,索引地鍵值是第一條記錄地鍵值(key);?五)MetaBlockIndex元數(shù)據(jù)塊地索引;?六)Trailer保存每一段地偏移量,讀取一個HFile時Trailer(段地開始位置)。Block(讀寫最小單元),存儲管理地最單位。六鳳荔用HBase數(shù)據(jù)存儲地層次地關(guān)系?1)Table與Region地關(guān)系一—多?二)Region與Store地關(guān)系:每一行都包含一或多個列Region包括一到多個Store。一—多?三)Store與HFile地關(guān)系:每個store由一個memStore與零至多個HFile組成,在client行數(shù)據(jù)寫過程,數(shù)據(jù)會先寫入緩沖(memStore),當(dāng)緩沖(memStore)到達(dá)一定大小地時候,就會flush到硬盤生成一個Hfile。一—多七鳳荔用二,HBASE地系統(tǒng)構(gòu)架--集群?Hbase是一個分布式地數(shù)據(jù)庫,使用Zookeeper來管理集群。?在架構(gòu)層面上分為Master與多個RegionServer。?在分布式地生產(chǎn)環(huán)境,HBase需要運(yùn)行在HDFS之上,由HDFS提供基礎(chǔ)地存儲設(shè)施,上層提供訪問地數(shù)據(jù)地API,對HBase地數(shù)據(jù)行管理,?集群主要主服務(wù)器(Master),區(qū)域服務(wù)器(RegionServer),調(diào)者服務(wù)器(Zookeeper)等組成,八鳳荔用二,HBASE地系統(tǒng)構(gòu)架--集群圖示?集群構(gòu)架圖九鳳荔用二,HBASE地系統(tǒng)構(gòu)架—主服務(wù)器?管理區(qū)域服務(wù)器;?指派區(qū)域服務(wù)器對特定區(qū)域服務(wù);?恢復(fù)失效地區(qū)域服務(wù)器,負(fù)載均衡與修復(fù)時區(qū)域服務(wù)器?監(jiān)聽ZooKeeper地狀態(tài),其管理職能包括創(chuàng)建,刪除,修改表地義等;?負(fù)責(zé)分配區(qū)域給區(qū)域服務(wù)器。?多個Master節(jié)點存,只有一個Master是提供服務(wù)地,其它地Master節(jié)點處于待命地狀態(tài)。當(dāng)正在工作地Master節(jié)點失效時,其它地Master則會接管集群。成鳳荔用二,HBASE地系統(tǒng)構(gòu)架-區(qū)域服務(wù)器?為區(qū)域地訪問提供服務(wù),直接為用戶提供服務(wù);?負(fù)責(zé)維護(hù)區(qū)域地合并與分割;負(fù)責(zé)數(shù)據(jù)存持久化。?管理表格,實現(xiàn)讀寫操作。?客戶端直接連接區(qū)域服務(wù)器,并通信獲取HBase地數(shù)據(jù)。鳳荔用二,HBASE地系統(tǒng)構(gòu)架--client?Client:請求發(fā)起者,通過API,包含訪問Hbase地接口,維護(hù)著一些cache來加快對Hbase地訪問,比如region地位置信息。?訪問HBase地接口,并維護(hù)cache來加快對HBase地訪問,比如region地位置信息.使用HBaseRPC機(jī)制與HMaster與區(qū)域服務(wù)器行通信.?Client與HMaster行通信行管理類操作.?Client與區(qū)域服務(wù)器行數(shù)據(jù)讀寫類操作鳳荔用二,HBASE地系統(tǒng)—基本組件?HBase采用Master/Slave架構(gòu)搭建集群,由HMaster節(jié)點,區(qū)域服務(wù)器節(jié)點,ZooKeeper集群組成,?在底層,它將數(shù)據(jù)存儲于分布式文件系統(tǒng)。區(qū)域服務(wù)器包含多個HRegion,由WAL(HLog),BlockCache,MemStore,HFile組成,鳳荔用二,HBASE地系統(tǒng)構(gòu)架--組件圖?組件圖鳳荔用二,HBASE地系統(tǒng)構(gòu)架--組件解釋?HLog(WALWALahead用做災(zāi)難恢復(fù),Hlog記錄數(shù)據(jù)地所有變更?WAL是HDFS上地一個文件,寫操作都先將數(shù)據(jù)寫入日志后,才會真正更新MemStore,最后寫入HFile。?區(qū)域服務(wù)器失效后,可以從日志文件讀取數(shù)據(jù),重做所有地操作,來保證數(shù)據(jù)地一致。?日志文件會定期刪除舊地文件(已寫到HFile地Log可以刪除)鳳荔用二,HBASE數(shù)據(jù)庫系統(tǒng)構(gòu)架--HLOG每個區(qū)域服務(wù)器維護(hù)一個Hlog,而不是每個Region一個。HLog是一個普通地Hadoop序列文件,它地Key是HLogKey對象,HLogKey記錄了寫入數(shù)據(jù)地歸屬信息,包括table與region名字,sequencenumber與timestamp,HLogSequeceFile地Value是Hbase地鍵值對象,即對應(yīng)HFile地鍵值。鳳荔用二,HBASE數(shù)據(jù)庫系統(tǒng)構(gòu)架—Hlog有關(guān)?LogFlusher,數(shù)據(jù)以鍵值形式到達(dá)區(qū)域服務(wù)器,寫入WAL,之后一個SequenceFile。日志文件先寫內(nèi)存,LogFlusher定期把緩沖器數(shù)據(jù)寫到Hfile(磁盤上)。?LogRoller調(diào)用HLog.rollWriter(),定時滾動日志,利用HLog.cleanOldLogs()可以清除舊地日志。取得存儲文件地最大地sequencenumber,存在一個log所有地條目地"sequencenumber"均低于這個值,如果存在,將刪除這個log鳳荔
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高效照明電器產(chǎn)品項目提案報告
- 2025年住宅用地購買與建設(shè)合同
- 2025年汽車尾氣凈化三效催化劑項目規(guī)劃申請報告
- 2025年個人對公商業(yè)租賃協(xié)議分析與
- 2025年債轉(zhuǎn)股增資擴(kuò)股項目協(xié)議書
- 2025年離婚雙方權(quán)益平衡協(xié)議策劃
- 2025年住宅消防設(shè)施建設(shè)協(xié)議范本
- 2025年企業(yè)投資策劃合作合同協(xié)議范本
- 職業(yè)技能培訓(xùn)管理協(xié)議書
- 2025年終止軟件工程師職業(yè)勞動合同協(xié)議
- 化工設(shè)計自動控制方案
- 幼兒園幼小銜接考試試題一
- 天津事業(yè)單位筆試試題2024
- 《化妝品穩(wěn)定性試驗規(guī)范》
- (2024版)小學(xué)六年級數(shù)學(xué)考試命題趨勢分析
- 四年級下冊數(shù)學(xué)單位換算題200道及答案
- 變電站現(xiàn)場運(yùn)行通用規(guī)程考試試題及答案
- 攪拌車駕駛員安全培訓(xùn)
- 船舶管理(電子電氣員)5.船舶安全用電
- 中儲糧油脂公司考試題
- 車輛車身結(jié)構(gòu)設(shè)計的創(chuàng)新思路
評論
0/150
提交評論