塊存儲、文件存儲、對象存儲的區(qū)別與聯(lián)系_第1頁
塊存儲、文件存儲、對象存儲的區(qū)別與聯(lián)系_第2頁
塊存儲、文件存儲、對象存儲的區(qū)別與聯(lián)系_第3頁
塊存儲、文件存儲、對象存儲的區(qū)別與聯(lián)系_第4頁
塊存儲、文件存儲、對象存儲的區(qū)別與聯(lián)系_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、塊存儲典型設(shè)備:磁盤陣列,硬盤塊存儲主要是將裸磁盤空間整個映射給主機(jī)使用的,就是說例如磁盤陣列里面有5塊硬盤(為方便說明,假設(shè)每個硬盤1G),然后可以通過劃邏輯盤、做Raid、或者LVM(邏輯卷)等種種方式邏輯劃分出N個邏輯的硬盤。(假設(shè)劃分完的邏輯盤也是5個,每個也是1G,但是這5個1G的邏輯盤已經(jīng)與原來的5個物理硬盤意義完全不同了。例如第一個邏輯硬盤A里面,可能第一個200M是來自物理硬盤1,第二個200M是來自物理硬盤2,所以邏輯硬盤A是由多個物理硬盤邏輯虛構(gòu)出來的硬盤。)接著塊存儲會采用映射的方式將這幾個邏輯盤映射給主機(jī),主機(jī)上面的操作系統(tǒng)會識別到有5塊硬盤,但是操作系統(tǒng)是區(qū)分不出到底是邏輯還是物理的,它一概就認(rèn)為只是5塊裸的物理硬盤而已,跟直接拿一塊物理硬盤掛載到操作系統(tǒng)沒有區(qū)別的,至少操作系統(tǒng)感知上沒有區(qū)別。此種方式下,操作系統(tǒng)還需要對掛載的裸硬盤進(jìn)行分區(qū)、格式化后,才能使用,與平常主機(jī)內(nèi)置硬盤的方式完全無異。優(yōu)點:1、這種方式的好處當(dāng)然是因為通過了Raid與LVM等手段,對數(shù)據(jù)提供了保護(hù)。2、另外也可以將多塊廉價的硬盤組合起來,成為一個大容量的邏輯盤對外提供服務(wù),提高了容量。3、寫入數(shù)據(jù)的時候,由于是多塊磁盤組合出來的邏輯盤,所以幾塊磁盤可以并行寫入的,提升了讀寫效率。4、很多時候塊存儲采用SAN架構(gòu)組網(wǎng),傳輸速率以及封裝協(xié)議的原因,使得傳輸速度與讀寫速率得到提升。缺點:1、采用SAN架構(gòu)組網(wǎng)時,需要額外為主機(jī)購買光纖通道卡,還要買光纖交換機(jī),造價成本高。2、主機(jī)之間的數(shù)據(jù)無法共享,在服務(wù)器不做集群的情況下,塊存儲裸盤映射給主機(jī),再格式化使用后,對于主機(jī)來說相當(dāng)于本地盤,那么主機(jī)A的本地盤根本不能給主機(jī)B去使用,無法共享數(shù)據(jù)。3、不利于不同操作系統(tǒng)主機(jī)間的數(shù)據(jù)共享:另外一個原因是因為操作系統(tǒng)使用不同的文件系統(tǒng),格式化完之后,不同文件系統(tǒng)間的數(shù)據(jù)是共享不了的。例如一臺裝了WIN,文件系統(tǒng)是FAT32/NTFS,而Linux是EXT4,EXT4是無法識別NTFS的文件系統(tǒng)的。就像一只NTFS格式的U盤,插進(jìn)Linux的筆記本,根本無法識別出來。所以不利于文件共享。2、文件存儲典型設(shè)備:FTP、NFS服務(wù)器為了克服上述文件無法共享的問題,所以有了文件存儲。文件存儲也有軟硬一體化的設(shè)備,但是其實普通拿一臺服務(wù)器/筆記本,只要裝上合適的操作系統(tǒng)與軟件,就可以架設(shè)FTP與NFS服務(wù)了,架上該類服務(wù)之后的服務(wù)器,就是文件存儲的一種了。主機(jī)A可以直接對文件存儲進(jìn)行文件的上傳下載,與塊存儲不同,主機(jī)A是不需要再對文件存儲進(jìn)行格式化的,因為文件管理功能已經(jīng)由文件存儲自己搞定了。優(yōu)點:1、造價較低:隨便一臺機(jī)器就可以了,另外普通以太網(wǎng)就可以,根本不需要專用的SAN網(wǎng)絡(luò),所以造價低。2、方便文件共享:例如主機(jī)A(WIN,NTFS文件系統(tǒng)),主機(jī)B(Linux,EXT4文件系統(tǒng)),想互拷一部電影,本來不行。加了個主機(jī)C(NFS服務(wù)器),然后可以先A拷到C,再C拷到B就OK了。(例子比較膚淺,請見諒……)缺點:讀寫速率低,傳輸速率慢:以太網(wǎng),上傳下載速度較慢,另外所有讀寫都要1臺服務(wù)器里面的硬盤來承擔(dān),相比起磁盤陣列動不動就幾十上百塊硬盤同時讀寫,速率慢了許多。3、對象存儲典型設(shè)備:內(nèi)置大容量硬盤的分布式服務(wù)器對象存儲最常用的方案,就是多臺服務(wù)器內(nèi)置大容量硬盤,再裝上對象存儲軟件,然后再額外搞幾臺服務(wù)作為管理節(jié)點,安裝上對象存儲管理軟件。管理節(jié)點可以管理其他服務(wù)器對外提供讀寫訪問功能。之所以出現(xiàn)了對象存儲這種東西,是為了克服塊存儲與文件存儲各自的缺點,發(fā)揚(yáng)它倆各自的優(yōu)點。簡單來說塊存儲讀寫快,不利于共享,文件存儲讀寫慢,利于共享。能否弄一個讀寫快,利于共享的出來呢。于是就有了對象存儲。首先,一個文件包含了了屬性(術(shù)語叫metadata,元數(shù)據(jù),例如該文件的大小、修改時間、存儲路徑等)以及內(nèi)容(以下簡稱數(shù)據(jù))。以往像FAT32這種文件系統(tǒng),是直接將一份文件的數(shù)據(jù)與metadata一起存儲的,存儲過程先將文件按照文件系統(tǒng)的最小塊大小來打散(如4M的文件,假設(shè)文件系統(tǒng)要求一個塊4K,那么就將文件打散成為1000個小塊),再寫進(jìn)硬盤里面,過程中沒有區(qū)分?jǐn)?shù)據(jù)/metadata的。而每個塊最后會告知你下一個要讀取的塊的地址,然后一直這樣順序地按圖索驥,最后完成整份文件的所有塊的讀取。這種情況下讀寫速率很慢,因為就算你有100個機(jī)械手臂在讀寫,但是由于你只有讀取到第一個塊,才能知道下一個塊在哪里,其實相當(dāng)于只能有1個機(jī)械手臂在實際工作。而對象存儲則將元數(shù)據(jù)獨立了出來,控制節(jié)點叫元數(shù)據(jù)服務(wù)器(服務(wù)器+對象存儲管理軟件),里面主要負(fù)責(zé)存儲對象的屬性(主要是對象的數(shù)據(jù)被打散存放到了那幾臺分布式服務(wù)器中的信息),而其他負(fù)責(zé)存儲數(shù)據(jù)的分布式服務(wù)器叫做OSD,主要負(fù)責(zé)存儲文件的數(shù)據(jù)部分。當(dāng)用戶訪問對象,會先訪問元數(shù)據(jù)服務(wù)器,元數(shù)據(jù)服務(wù)器只負(fù)責(zé)反饋對象存儲在哪些OSD,假設(shè)反饋文件A存儲在B、C、D三臺OSD,那么用戶就會再次直接訪問3臺OSD服務(wù)器去讀取數(shù)據(jù)。這時候由于是3臺OSD同時對外傳輸數(shù)據(jù),所以傳輸?shù)乃俣染图涌炝?。?dāng)OSD服務(wù)器數(shù)量越多,這種讀寫速度的提升就越大,通過此種方式,實現(xiàn)了讀寫快的目的。另一方面,對象存儲軟件是有專門的文件系統(tǒng)的,所以O(shè)SD對外又相當(dāng)于文件服務(wù)器,那么就不存在文件共享方面的困難了,也解決了文件共享方面的問題。所以對象存儲的出現(xiàn),很好地結(jié)合了塊存儲與文件存儲的優(yōu)點。最后,為什么對象存儲兼具塊存儲與文件存儲的好處,還要使用塊存儲或文件存儲呢?1、有一類應(yīng)用是需要存儲直接裸盤映射的,例如數(shù)據(jù)庫。因為數(shù)據(jù)庫需要存儲裸盤映射給自己后,再根據(jù)自己的數(shù)據(jù)庫文件系統(tǒng)來對裸盤進(jìn)行格式化的,所以是不能夠采用其他已經(jīng)被格式化為某種文件系統(tǒng)的存儲的。此類應(yīng)用更適合使用塊存儲。2、對象存儲的成本比起普通的文件存儲還是較高,需要購買專門的對象存儲軟件以及大容量硬盤。如果對數(shù)據(jù)量要求不是海量,只是為了做文件共享的時候,直接用文件存儲的形式好了,性價比高。二、從應(yīng)用角度比較塊存儲、文件存儲、對象存儲產(chǎn)品和市場需求有各種相互影響的關(guān)系,但不管是哪一種,最終呈現(xiàn)都是產(chǎn)品和應(yīng)用需求需要對應(yīng)匹配。應(yīng)用需求越多樣化,市場也就劃分得更加細(xì),產(chǎn)品種類也就更加豐富。在存儲行業(yè),我們也可以從“應(yīng)用適配”這個角度來聊聊各類存儲。傳統(tǒng)認(rèn)知上來說,IT設(shè)備分為計算/存儲/網(wǎng)絡(luò)三大類,相互之間是有明顯的楚河漢界的。計算大家都清楚,服務(wù)器,小型機(jī),大型機(jī);網(wǎng)絡(luò)也就是路由器交換機(jī);存儲有內(nèi)置存儲和外置存儲,最常見的就是磁盤陣列。在HCI(超融合)這個概念沒被熱炒之前,計算網(wǎng)絡(luò)存儲還都是涇渭分明,各擔(dān)其責(zé)的。今天我們先不討論超融合的情況,僅基于傳統(tǒng)理解,看看存儲的情況。從邏輯上存儲通常分為塊存儲,文件存儲,對象存儲。這三類存儲在實際應(yīng)用中的適配環(huán)境還是有著明顯的不同的。塊存儲(DAS/SAN)通常應(yīng)用在某些專有的系統(tǒng)中,這類應(yīng)用要求很高的隨機(jī)讀寫性能和高可靠性,上面搭載的通常是Oracle/DB2這種傳統(tǒng)數(shù)據(jù)庫,連接通常是以FC光纖(8Gb/16Gb)為主,走光纖協(xié)議。如果要求稍低一些,也會出現(xiàn)基于千兆/萬兆以太網(wǎng)的連接方式,MySQL這種數(shù)據(jù)庫就可能會使用IPSAN,走iSCSI協(xié)議。通常使用塊存儲的都是系統(tǒng)而非用戶,并發(fā)訪問不會很多,經(jīng)常出現(xiàn)一套存儲只服務(wù)一個應(yīng)用系統(tǒng),例如如交易系統(tǒng),計費系統(tǒng)。典型行業(yè)如金融,制造,能源,電信等。文件存儲(NAS)相對來說就更能兼顧多個應(yīng)用和更多用戶訪問,同時提供方便的數(shù)據(jù)共享手段。畢竟大部分的用戶數(shù)據(jù)都是以文件的形式存放,在PC時代,數(shù)據(jù)共享也大多是用文件的形式,比如常見的的FTP服務(wù),NFS服務(wù),Samba共享這些都是屬于典型的文件存儲。幾十個用戶甚至上百用戶的文件存儲共享訪問都可以用NAS存儲加以解決。在中小企業(yè)市場,一兩臺NAS存儲設(shè)備就能支撐整個IT部門了。CRM系統(tǒng),SCM系統(tǒng),OA系統(tǒng),郵件系統(tǒng)都可以使用NAS存儲統(tǒng)統(tǒng)搞定。甚至在公有云發(fā)展的早幾年,用戶規(guī)模沒有上來時,云存儲的底層硬件也有用幾套NAS存儲設(shè)備就解決的,甚至云主機(jī)的鏡像也有放在NAS存儲上的例子。文件存儲的廣泛兼容性和易用性,是這類存儲的突出特點。但是從性能上來看,相對SAN就要低一些。NAS存儲基本上是以太網(wǎng)訪問模式,普通千兆網(wǎng),走NFS/CIFS協(xié)議。對象存儲概念出現(xiàn)得晚一些,存儲標(biāo)準(zhǔn)化組織SINA早在2004年就給出了定義,但早期多出現(xiàn)在超大規(guī)模系統(tǒng),所以并不為大眾所熟知,相關(guān)產(chǎn)品一直也不溫不火。一直到云計算和大數(shù)據(jù)的概念全民強(qiáng)推,才慢慢進(jìn)入公眾視野。前面說到的塊存儲和文件存儲,基本上都還是在專有的局域網(wǎng)絡(luò)內(nèi)部使用,而對象存儲的優(yōu)勢場景卻是互聯(lián)網(wǎng)或者公網(wǎng),主要解決海量數(shù)據(jù),海量并發(fā)訪問的需求?;诨ヂ?lián)網(wǎng)的應(yīng)用才是對象存儲的主要適配(當(dāng)然這個條件同樣適用于云計算,基于互聯(lián)網(wǎng)的應(yīng)用最容易遷移到云上,因為沒出現(xiàn)云這個名詞之前,他們已經(jīng)在上面了),基本所有成熟的公有云都提供了對象存儲產(chǎn)品,不管是國內(nèi)還是國外。對象存儲常見的適配應(yīng)用如網(wǎng)盤、媒體娛樂,醫(yī)療PACS,氣象,歸檔等數(shù)據(jù)量超大而又相對“冷數(shù)據(jù)”和非在線處理的應(yīng)用類型。這類應(yīng)用單個數(shù)據(jù)大,總量也大,適合對象存儲海量和易擴(kuò)展的特點。網(wǎng)盤類應(yīng)用也差不多,數(shù)據(jù)總量很大,另外還有并發(fā)訪問量也大,支持10萬級用戶訪問這種需求就值得單列一個項目了(這方面的掃盲可以想想12306)。歸檔類應(yīng)用只是數(shù)據(jù)量大的冷數(shù)據(jù),并發(fā)訪問的需求倒是不太突出。另外基于移動端的一些新興應(yīng)用也是適合的,智能手機(jī)和移動互聯(lián)網(wǎng)普及的情況下,所謂UGD(用戶產(chǎn)生的數(shù)據(jù),手機(jī)的照片視頻)總量和用戶數(shù)都是很大挑戰(zhàn)。畢竟直接使用HTTPget/put就能直接實現(xiàn)數(shù)據(jù)存取,對移動應(yīng)用來說還是有一定吸引力的。對象存儲的訪問通常是在互聯(lián)網(wǎng),走HTTP協(xié)議,性能方面,單獨看一個連接的是不高的(還要解決掉線斷點續(xù)傳之類的可靠性問題),主要強(qiáng)大的地方是支持的并發(fā)數(shù)量,聚合起來的性能帶寬就非??捎^了。從產(chǎn)品形態(tài)上來看,塊存儲和文件存儲都是成熟產(chǎn)品,各種規(guī)格形態(tài)的硬件已經(jīng)是琳瑯滿目了。但是對象存儲通常你看到都是一堆服務(wù)器或者增強(qiáng)型服務(wù)器,畢竟這東西現(xiàn)在還是互聯(lián)網(wǎng)行業(yè)用得多點,DIY風(fēng)格。關(guān)于性能容量等方面,我做了個圖,對三種存儲做直觀對比。塊存儲就像超跑,根本不在意能不能多載幾個人,要的就是極限速度和高速下的穩(wěn)定性和可靠性,各大廠商出新產(chǎn)品都要去紐北賽道刷個單圈最快紀(jì)錄,千方百計就為提高一兩秒,跑不進(jìn)7分以內(nèi)都看不到前三名。(塊存儲容量也不大,TB這個數(shù)量級,支持的應(yīng)用和適用的環(huán)境也比較專業(yè)(FC+Oracle),在乎的都是IOPS的性能值,廠商出新產(chǎn)品也都想去刷個SPC-1,測得好的得意洋洋,測得不好自動忽略。)文件存儲像集卡,普適各種場合,又能裝數(shù)據(jù)(數(shù)百TB),而且兼容性好,只要你是文件,各種貨物都能往里塞,在不超過性能載荷的前提下,能拉動常見的各種系統(tǒng)。標(biāo)準(zhǔn)POXIS接口,后車門打開就能裝卸??ㄜ囈膊惶袈?,不像塊存儲非要上賽道才能開,普通的千兆公路就能暢通無阻。速度雖然沒有塊存儲超跑那么塊,但跑個80/100碼還是穩(wěn)穩(wěn)當(dāng)當(dāng).而對象存儲就像海運(yùn)貨輪,應(yīng)對的是"真·海量",幾十上百PB的數(shù)據(jù),以集裝箱/container(桶/bucket)為單位碼得整整齊齊,里面裝滿各種對象數(shù)據(jù),十萬客戶發(fā)的貨(數(shù)據(jù)),一條船就都處理得過來,按照鍵值(KeyVaule)記得清清楚楚。海運(yùn)速度慢是慢點,有時候遇到點網(wǎng)絡(luò)風(fēng)暴還不穩(wěn)定,但支持?jǐn)帱c續(xù)傳,最終還是能安全送達(dá)的,對大宗貨物尤其是非結(jié)構(gòu)化數(shù)據(jù),整體上來看是最快捷便利的。從訪問方式來說,塊存儲通常都是通過光纖網(wǎng)絡(luò)連接,服務(wù)器/小機(jī)上配置FC光纖HBA卡,通過光纖交換機(jī)連接存儲(IPSAN可以通過千兆以太網(wǎng),以iSCSI客戶端連接存儲),主機(jī)端以邏輯卷(Volume)的方式訪問。連接成功后,應(yīng)用訪問存儲是按起始地址,偏移量Offset的方法來訪問的。而NAS文件存儲通常只要是局域網(wǎng)內(nèi),千兆/百兆的以太網(wǎng)環(huán)境皆可。網(wǎng)線連上,服務(wù)器端通過操作系統(tǒng)內(nèi)置的NAS客戶端,如NFS/CIFS/FTP客戶端掛載存儲成為一個本地的文件夾后訪問,只要符合POXIS標(biāo)準(zhǔn),應(yīng)用就可以用標(biāo)準(zhǔn)的open,seek,write/read,close這些方法對其訪問操作。對象存儲不在乎網(wǎng)絡(luò),而且它的訪問比較有特色,只能存取刪(put/get/delete),不能打開修改存盤。只能取下來改好后上傳,去覆蓋原對象。(因為中間是不可靠的互聯(lián)網(wǎng)啊,不能保證你在修改時候不掉線啊。所謂你在這頭,對象在那頭,所愛對象隔山海,山海不可平。)另外再說一點分布式存儲的問題,以上三種存儲都可以和分布式概念結(jié)合,成為分布式文件系統(tǒng),分布式塊存儲,還有天生分布式的對象存儲。對象存儲的定義就把元數(shù)據(jù)管理和數(shù)據(jù)存儲訪問分開在不同的節(jié)點上,多個節(jié)點應(yīng)對多并發(fā)的訪問,這自然就是一個分布式的存儲產(chǎn)品。而分布式文件系統(tǒng)就很多了,各種開源閉源的產(chǎn)品數(shù)得出幾十個,在不同的領(lǐng)域各有應(yīng)用。至于分布式的塊存儲產(chǎn)品就比較少,也很難做好。我個人認(rèn)為這個產(chǎn)品形態(tài)有點違和,分布式的思想和塊存儲的設(shè)計追求其實是沖突的。前面講過,塊存儲主要是圖快,一上分布式肯定嚴(yán)重拖后腿,既然都分布開了,節(jié)點之間的通信必然增加額外負(fù)擔(dān),再加上CAP,為了保持一致性犧牲響應(yīng)速度,得到的好處就是擴(kuò)展性。這就像把超跑弄個鐵索連環(huán),哪里還可能跑出高速?鏈條比車都重了,穿起來當(dāng)火車開嗎?而文件存儲原來也就是集裝箱貨車,大家連起來扮火車還是有可行性的。三、塊存儲、文件存儲、對象存儲的層次關(guān)系應(yīng)用的角度聊過了,我們再看看這三種存儲的一些技術(shù)細(xì)節(jié),首先看看在系統(tǒng)層級的分布。我們從底層往上看,最底層就是硬盤,多個硬盤可以做成RAID組,無論是單個硬盤還是RAID組,都可以做成PV,多個PV物理卷捏在一起構(gòu)成VG卷組,這就做成一塊大蛋糕了。接下來,可以從蛋糕上切下很多塊LV邏輯卷,這就到了存儲用戶最熟悉的卷這層。到這一層為止,數(shù)據(jù)一直都是以Block塊的形式存在的,這時候提供出來的服務(wù)就是塊存儲服務(wù)。你可以通過FC協(xié)議或者iSCSI協(xié)議對卷訪問,映射到主機(jī)端本地,成為一個裸設(shè)備。在主機(jī)端可以直接在上面安裝數(shù)據(jù)庫,也可以格式化成文件系統(tǒng)后交給應(yīng)用程序使用,這時候就是一個標(biāo)準(zhǔn)的SAN存儲設(shè)備的訪問模式,網(wǎng)絡(luò)間傳送的是塊。如果不急著訪問,也可以在本地做文件系統(tǒng),之后以NFS/CIFS協(xié)議掛載,映射到本地目錄,直接以文件形式訪問,這就成了NAS訪問的模式,在網(wǎng)絡(luò)間傳送的是文件。如果不走NAS,在本地文件系統(tǒng)上面部署OSD服務(wù)端,把整個設(shè)備做成一個OSD,這樣的節(jié)點多來幾個,再加上必要的MDS節(jié)點,互聯(lián)網(wǎng)另一端的應(yīng)用程序再通過HTTP協(xié)議直接進(jìn)行訪問,這就變成了對象存儲的訪問模式。當(dāng)然對象存儲通常不需要專業(yè)的存儲設(shè)備,前面那些LV/VG/PV層也可以統(tǒng)統(tǒng)不要,直接在硬盤上做本地文件系統(tǒng),之后再做成OSD,這種才是對象存儲的標(biāo)準(zhǔn)模式,對象存儲的硬件設(shè)備通常就用大盤位的服務(wù)器。從系統(tǒng)層級上來說,這三種存儲是按照塊->文件->對象逐級向上的。文件一定是基于塊上面去做,不管是遠(yuǎn)端還是本地。而對象存儲的底層或者說后端存儲通常是基于一個本地文件系統(tǒng)(XFS/Ext4..)。這樣做是比較合理順暢的架構(gòu)。但是大家想法很多,還有各種特異的產(chǎn)品出現(xiàn),我們逐個來看看:對象存儲除了基于文件,可以直接基于塊,但是做這個實現(xiàn)的很少,畢竟你還是得把文件系統(tǒng)的活給干了,自己實現(xiàn)一套元數(shù)據(jù)管理,也挺麻煩的。另外對象存儲還能基于對象存儲,這就有點尷尬了,就是轉(zhuǎn)一下,何必呢?但是這都不算最奇怪的,最奇怪的是把對象存儲放在最底層,那就是這兩年大紅的Ceph。Ceph是個開源的分布式存儲,相信類似的架構(gòu)圖大家都見過,我把底層細(xì)節(jié)也畫出來,方便分析。底層是RADOS,這是個標(biāo)準(zhǔn)的對象存儲。以RADOS為基礎(chǔ),Ceph能夠提供文件,塊和對象三種存儲服務(wù)。其中通過RBD提供出來的塊存儲是比較有價值的地方,畢竟因為市面上開源的分布式塊存儲少見嘛(以前倒是有個sheepdog,但是現(xiàn)在不當(dāng)紅了)。當(dāng)然它也通過CephFS模塊和相應(yīng)的私有Client提供了文件服務(wù),這也是很多人認(rèn)為Ceph是個文件系統(tǒng)的原因。另外它自己原生的對象存儲可以通過RadosGW存儲網(wǎng)關(guān)模塊向外提供對象存儲服務(wù),并且和對象存儲的事實標(biāo)準(zhǔn)AmazonS3以及Swift兼容。所以能看出來這其實是個大一統(tǒng)解決方案,啥都齊全。上面講的大家或多或少都有所了解,但底層的RADOS的細(xì)節(jié)可能會忽略,RADOS也是個標(biāo)準(zhǔn)對象存儲,里面也有MDS的元數(shù)據(jù)管理和OSD的數(shù)據(jù)存儲,而OSD本身是可以基于一個本地文件系統(tǒng)的,比如XFS/EXT4/Brtfs。在早期版本,你在部署Ceph的時候,是不是要給OSD創(chuàng)建數(shù)據(jù)目錄?。窟@一步其實就已經(jīng)在本地文件系統(tǒng)上做操作了(現(xiàn)在的版本Ceph可以直接使用硬盤)?,F(xiàn)在我們來看數(shù)據(jù)訪問路徑,如果看Ceph的文件接口,自底層向上,經(jīng)過了硬盤(塊)->文件->對象->文件的路徑;如果看RBD的塊存儲服務(wù),則經(jīng)過了硬盤(塊)->文件->對象->塊,也可能是硬盤(塊)->對象->塊的路徑;再看看對象接口(雖然用的不多),則是經(jīng)過了硬盤(塊)->文件->對象或者硬盤(塊)->對象的路徑。雖說現(xiàn)在大家都這么隨便結(jié)合,但是這三種存儲本質(zhì)上還是有不同的,我們回到計算機(jī)的基礎(chǔ)課程,從數(shù)據(jù)結(jié)構(gòu)來看,這三種存儲有著根本不同。塊存儲的數(shù)據(jù)結(jié)構(gòu)是數(shù)組,而文件存儲是二叉樹(B,B-,B+,B*各種樹),對象存儲基本上都是哈希表。數(shù)組和二叉樹都是老生常談,沒有太多值得說的,而對象存儲使用的哈希表也就是常聽說的鍵值(KeyVaule型)存儲的核心數(shù)據(jù)結(jié)構(gòu),每個對象找一個UID(所謂的“鍵”KEY),算哈希值(所謂的“值Vaule”)以后和目標(biāo)對應(yīng)。找了一個哈希表例子如下:鍵值對應(yīng)關(guān)系簡單粗暴,畢竟算個hash值是很快的,這種扁平

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論