




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)保護(hù)技術(shù)淺述隨著社會(huì)信息化的突飛猛進(jìn),數(shù)據(jù)在人們?nèi)粘I詈推髽I(yè)業(yè)務(wù)運(yùn)營(yíng)中的重要性日益凸顯。近年來(lái),從海嘯、地震、戰(zhàn)爭(zhēng)等大型災(zāi)害到黑客攻擊、病毒入侵、人為失誤等數(shù)據(jù)安全事故頻繁發(fā)生,依賴于數(shù)據(jù)的業(yè)務(wù)正面臨著高度風(fēng)險(xiǎn)。圍繞數(shù)據(jù)可用性、完整性、性能優(yōu)化等方面的研究已經(jīng)成為數(shù)據(jù)保護(hù)學(xué)界及業(yè)界的主要課題。這些研究工作涉及設(shè)備、網(wǎng)絡(luò)、系統(tǒng)和應(yīng)用四個(gè)層次。在設(shè)備層,主要有磁盤(pán)到光盤(pán)(D20、磁盤(pán)到磁帶(D2T),磁盤(pán)到磁盤(pán)(D2D、冗余磁盤(pán)陣列(RAID)等解決方案。在網(wǎng)絡(luò)層,隨著對(duì)備份系統(tǒng)容量和速度的需求越來(lái)越高,附網(wǎng)存儲(chǔ)(NAS、存儲(chǔ)區(qū)域網(wǎng)(SAN已逐漸取代了傳統(tǒng)的直連存儲(chǔ)(DASo在系統(tǒng)層,主要研
2、究方向是快照、版本文件系統(tǒng)和連續(xù)數(shù)據(jù)保護(hù)技術(shù)。在應(yīng)用層,典型的有數(shù)據(jù)庫(kù)備份技術(shù)。數(shù)據(jù)的持續(xù)增長(zhǎng)和應(yīng)用的高連續(xù)性對(duì)備份性能的要求越來(lái)越高,未來(lái)該領(lǐng)域尚有待于在數(shù)據(jù)去重、備份驗(yàn)證、I/O優(yōu)化、節(jié)能技術(shù)等方面進(jìn)行更深入的研究。1設(shè)備層備份技術(shù)傳統(tǒng)的數(shù)據(jù)備份就是定期把數(shù)據(jù)從硬盤(pán)備份至其他存儲(chǔ)介質(zhì)如光存儲(chǔ)設(shè)備、磁帶和磁盤(pán)。小規(guī)模的數(shù)據(jù)備份,例如單服務(wù)器環(huán)境,光存儲(chǔ)(D20不失為一種低成本和便攜式解決方案。不過(guò),光器件備份的容量、讀寫(xiě)次數(shù)和速度都有限,難以滿足高可用性要求。磁帶備份(D2T一直是企業(yè)級(jí)備份的主要媒介。磁帶是順序存儲(chǔ)設(shè)備,特別適用于作周期性全量備份的媒介。止匕外,通過(guò)加載相對(duì)廉價(jià)的磁帶可以輕
3、易擴(kuò)大備份端的存儲(chǔ)容量。但是,當(dāng)用戶想恢復(fù)某個(gè)時(shí)間點(diǎn)的數(shù)據(jù)時(shí),緩慢的倒帶速度使得恢復(fù)過(guò)程相當(dāng)漫長(zhǎng)。隨著磁盤(pán)容量和可靠性的不斷增強(qiáng)、磁盤(pán)到磁盤(pán)存儲(chǔ)(D2D技術(shù)逐步流行。D2D相較于D2T具有快速備份/恢復(fù)的優(yōu)勢(shì),能在幾個(gè)小時(shí)內(nèi)完成往常需要數(shù)天才能完成的備份/恢復(fù)過(guò)程。一些商業(yè)產(chǎn)品融合了基于D2D備份的速度和基于D2T備份的容量?jī)?yōu)勢(shì),實(shí)現(xiàn)了被稱為磁盤(pán)到磁盤(pán)到磁帶(D2D2T的數(shù)據(jù)保護(hù)技術(shù)。在這項(xiàng)技術(shù)下,數(shù)據(jù)被周期性地備份到磁盤(pán)上,然后再?gòu)拇疟P(pán)定期歸檔到磁帶庫(kù)。磁盤(pán)陣列(RAID)4利用冗余技術(shù)提供數(shù)據(jù)保護(hù),共有六個(gè)級(jí)別的RAID。RAIDO把數(shù)據(jù)條帶性地分布在多個(gè)磁盤(pán)上,提供任但不何數(shù)據(jù)保護(hù)機(jī)制。
4、RAID1-5能容忍一個(gè)磁盤(pán)的數(shù)據(jù)丟失。RAID1提供100%數(shù)據(jù)冗余,它能夠容忍對(duì)等盤(pán)中的任何一個(gè)盤(pán)的數(shù)據(jù)丟失。RAID3-5通過(guò)對(duì)所有磁盤(pán)上同一條帶上的數(shù)據(jù)單元進(jìn)行異或(X0R運(yùn)算而存儲(chǔ)條帶的效驗(yàn)值達(dá)到了RAID1的數(shù)據(jù)保護(hù)效果又提高了磁盤(pán)的空間利用效率。RAID6E5采用先進(jìn)的編碼技術(shù)能夠容忍多于一個(gè)的磁盤(pán)數(shù)據(jù)失效,從而進(jìn)一步提高了RAID的數(shù)據(jù)可靠性。2網(wǎng)絡(luò)層數(shù)據(jù)備份技術(shù)后端備份設(shè)備(光存儲(chǔ)設(shè)備、磁帶、硬盤(pán))通過(guò)存儲(chǔ)網(wǎng)絡(luò)連接到客戶機(jī)和服務(wù)器。傳統(tǒng)上,備份設(shè)備通過(guò)本地的互連設(shè)施如PCI、PCI-X直接連接到備份服務(wù)器,被稱為直連存儲(chǔ)(DAS)oDAS的總線帶寬有限,限制了后端存儲(chǔ)系統(tǒng)的性
5、能和可擴(kuò)展性。現(xiàn)代存儲(chǔ)網(wǎng)絡(luò)主要采用附網(wǎng)存儲(chǔ)(NAS和存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN7架構(gòu)。不同于DAS中基于總線的共享網(wǎng)絡(luò),NAS和SAN建立在高速交換網(wǎng)絡(luò)比如VIA、InfiniBand和高速以太網(wǎng)上,它在備份設(shè)備和備份服務(wù)器之間提供了專用的高速交換通道。NAS實(shí)現(xiàn)了存儲(chǔ)子系統(tǒng)和服務(wù)器之間的物理分離。存儲(chǔ)服務(wù)器和存儲(chǔ)設(shè)備之間的高速交換通道顯著地提高了存儲(chǔ)系統(tǒng)的整體吞吐量。盡管中央處理器的MIPS在近年來(lái)得到了巨大提高,但是其I/O中斷處理能力并沒(méi)有得到相應(yīng)數(shù)量級(jí)的提高。NAS通過(guò)把服務(wù)器從費(fèi)時(shí)的I/O中斷處理中解放出來(lái)從而極大地增強(qiáng)了存儲(chǔ)服務(wù)器的處理效率。最后,由于NAS中每一個(gè)組件的可用性都不依賴于
6、其它組件的可用性,使得NAS具有良好的容錯(cuò)性能。典型的基于NAS的備份解決方案包括EMC勺NetWin和Celerra,惠普的StorageWorksNAS和Netapp的NASfiero°SAN使用專用的網(wǎng)絡(luò)連接存儲(chǔ)設(shè)備和存儲(chǔ)服務(wù)器。SAN把I/O流量由局域網(wǎng)轉(zhuǎn)載到了專用高速存儲(chǔ)子網(wǎng)上,使它在性能和容量上更勝于NAS在基于SAN的備份系統(tǒng)上,服務(wù)器系統(tǒng)的備份負(fù)載對(duì)性能的影響也因?yàn)橛辛藢S玫拇鎯?chǔ)網(wǎng)絡(luò)設(shè)計(jì)而被最小化了。3系統(tǒng)層備份技術(shù)系統(tǒng)層備份技術(shù)主要包括快照、版本文件系統(tǒng)和連續(xù)數(shù)據(jù)保護(hù)技術(shù)等。快照技術(shù)幾乎被使用在所有的現(xiàn)代備份和恢復(fù)系統(tǒng)中。它允許系統(tǒng)迅速備份和恢復(fù)大量數(shù)據(jù)的同時(shí)不危及
7、數(shù)據(jù)完整性和在線服務(wù)性能。對(duì)數(shù)據(jù)集的一個(gè)快照生成這個(gè)數(shù)據(jù)集的一個(gè)即時(shí)鏡像??煺湛梢允且粋€(gè)數(shù)據(jù)卷的全量拷貝或差量拷貝。全量快照拷貝數(shù)據(jù)集的全部?jī)?nèi)容,差量快照僅僅存儲(chǔ)改變了的數(shù)據(jù)。差量快照節(jié)省了存儲(chǔ)空間,但恢復(fù)時(shí)間較長(zhǎng)。在實(shí)現(xiàn)方式上,差量快照有寫(xiě)時(shí)拷貝(CO)和重定向(A0兩種。為了克服差量快照恢復(fù)時(shí)間長(zhǎng)的缺陷,人們開(kāi)發(fā)了版本文件系統(tǒng)技術(shù)(VFSo現(xiàn)在,版本文件系統(tǒng)已廣泛應(yīng)用于許多關(guān)鍵性領(lǐng)域,如醫(yī)院的病人監(jiān)護(hù)系統(tǒng)和軟件開(kāi)發(fā)中的源代碼控制系統(tǒng)。版本文件系統(tǒng)保存了文件系統(tǒng)中所有重要文件的快照歷史,它使得文件系統(tǒng)能從用戶操作錯(cuò)誤或系統(tǒng)崩潰中恢復(fù)過(guò)來(lái)。版本文件系統(tǒng)的部署開(kāi)銷會(huì)很高,因?yàn)樗鼈兇蠖嗍菫樘囟ǖ奈?/p>
8、件系統(tǒng)而設(shè)計(jì)的。為了解決這個(gè)問(wèn)題,Peabody在塊級(jí)而不是文件系統(tǒng)層實(shí)現(xiàn)版本機(jī)制,它兼容所有的文件系統(tǒng)和高層應(yīng)用?;诳煺盏奶幚矸绞饺匀挥衼G失數(shù)據(jù)的可能性,因?yàn)樵趦蓚€(gè)相鄰的快照之間對(duì)一個(gè)文件存在多個(gè)寫(xiě)操作時(shí),快照會(huì)丟失這些寫(xiě)操作對(duì)文件的更新。連續(xù)數(shù)據(jù)保護(hù)(CDP技術(shù)用來(lái)提供任意時(shí)間點(diǎn)的可恢復(fù)性。連續(xù)數(shù)據(jù)保護(hù)捕捉塊級(jí)或文件級(jí)的所有數(shù)據(jù)變化,并且為所有的歷史數(shù)據(jù)狀態(tài)提供運(yùn)行恢復(fù)點(diǎn)。相較于快照,數(shù)據(jù)保護(hù)已經(jīng)從離散的時(shí)間點(diǎn)轉(zhuǎn)換到更具靈活性的連續(xù)時(shí)間點(diǎn)模式。連續(xù)數(shù)據(jù)保護(hù)技術(shù)在密集型寫(xiě)負(fù)載下很容易耗盡存儲(chǔ)媒介上的空閑空間。數(shù)據(jù)冗余和壓縮技術(shù)能夠用來(lái)降低連續(xù)數(shù)據(jù)保護(hù)存儲(chǔ)系統(tǒng)的空間需求。TRAP車列在RAI
9、D3-5上使用冗余以最小的空間開(kāi)銷實(shí)現(xiàn)了任意時(shí)間點(diǎn)恢復(fù)。4應(yīng)用層備份技術(shù)現(xiàn)代數(shù)據(jù)庫(kù)系統(tǒng)使用“事務(wù)”這一概念保證系統(tǒng)崩潰或用戶操作錯(cuò)誤后數(shù)據(jù)的一致性。事務(wù)的基本操作包括讀取、提交和夭折。每個(gè)事務(wù)必須滿足四項(xiàng)要求,即ACID(原子性、一致性、隔離性和持久性)。為了滿足事務(wù)的持久性和原子性,數(shù)據(jù)庫(kù)系統(tǒng)使用備份與恢復(fù)技術(shù)來(lái)保證當(dāng)出現(xiàn)系統(tǒng)崩潰、交易錯(cuò)誤、系統(tǒng)錯(cuò)誤或磁盤(pán)失敗等異常情況時(shí)數(shù)據(jù)的一致性。這些技術(shù)包括影子分頁(yè)(ShadowPaging八預(yù)寫(xiě)日志(WriteAheadLog)和檢查點(diǎn)(Checkpoint)技術(shù)等。MVMHSystemRrecoverymanagerL13J首次使用影子分頁(yè)技術(shù)使數(shù)
10、據(jù)庫(kù)事務(wù)具有可恢復(fù)性和隔離性。SystemR的所有持久性數(shù)據(jù)都以文件存儲(chǔ)在以4K大小頁(yè)面為單位的動(dòng)態(tài)分配的線型空間中。每個(gè)文件都關(guān)聯(lián)著一個(gè)特定的恢復(fù)協(xié)議:非附影的文件不存儲(chǔ)冗余副本,故不支持自動(dòng)恢復(fù)。附影文件在線維護(hù)著兩個(gè)互為影子的文件版本,即影子版本和當(dāng)前版本。事務(wù)操作僅僅影響文件的當(dāng)前版本(SAVE和REST0R操作除外)。當(dāng)系統(tǒng)崩潰后重新啟動(dòng)時(shí),影子版本總是幸存的。結(jié)合數(shù)據(jù)庫(kù)日志和最近的影子狀態(tài),數(shù)據(jù)庫(kù)可以通過(guò)丟棄夭折的事務(wù)并重做已提交的事務(wù)來(lái)迅速恢復(fù)到一致?tīng)顟B(tài)。影子分頁(yè)和事務(wù)日志保證恢復(fù)過(guò)程總是始于一個(gè)活動(dòng)一致性狀態(tài)。預(yù)寫(xiě)日志以一種頁(yè)面一致性狀態(tài)的輕量級(jí)方式取得相似的目標(biāo)。預(yù)寫(xiě)日志首先
11、在IBM公司的IMS/VS系統(tǒng)中實(shí)施。預(yù)寫(xiě)日志在任何頁(yè)面更新執(zhí)行之前把頁(yè)面更新日志記錄在二級(jí)存儲(chǔ)器中。在大規(guī)模數(shù)據(jù)庫(kù)中,預(yù)寫(xiě)日志比影子分頁(yè)更有效率。首先,它節(jié)省了一致性數(shù)據(jù)恢復(fù)對(duì)內(nèi)存和二級(jí)存儲(chǔ)空間的需求,因?yàn)樗灰蕾嚾魏斡白痈北尽5诙膶?shí)施較影子分頁(yè)要簡(jiǎn)單得多,并無(wú)必要維持頁(yè)面描述符和空閑空間位圖。第三,更重要的是,預(yù)寫(xiě)日志具有較好的性能,因?yàn)榫晚?yè)面I/O的幾率來(lái)說(shuō),預(yù)寫(xiě)日志要小于影子分頁(yè)。Checkpoint技術(shù)幫助在系統(tǒng)重啟時(shí)高效地協(xié)調(diào)數(shù)據(jù)庫(kù)狀態(tài)和日志狀態(tài)。保存一個(gè)checkpoint時(shí),所有的內(nèi)存緩沖區(qū)都作為一個(gè)checkpoint記錄被寫(xiě)到磁盤(pán)上,附加在事務(wù)日志的后面。相較于影子分
12、頁(yè)來(lái)說(shuō),checkpoint的開(kāi)銷要高得多,因?yàn)樗鼘?dǎo)致更多的磁盤(pán)I/Oso5研究展望數(shù)據(jù)的持續(xù)增長(zhǎng)和應(yīng)用的高連續(xù)性對(duì)備份性能的要求越來(lái)越高,未來(lái)該領(lǐng)域尚有待于在數(shù)據(jù)去重、備份驗(yàn)證、I/O優(yōu)化、節(jié)能技術(shù)等方面進(jìn)行更深入的研究。數(shù)據(jù)去重是指消除冗余的文件、數(shù)據(jù)塊、或字節(jié)以保證只有單一的數(shù)據(jù)實(shí)例存儲(chǔ)在系統(tǒng)中的過(guò)程。這一技術(shù)能有效克服傳統(tǒng)的數(shù)據(jù)保護(hù)技術(shù)比如周期性備份、快照、連續(xù)數(shù)據(jù)保護(hù)和版本文件系統(tǒng)等會(huì)產(chǎn)生了大量重復(fù)數(shù)據(jù)的缺點(diǎn)。未來(lái)需要進(jìn)一步研究該技術(shù)在海量數(shù)據(jù)備份系統(tǒng)中的實(shí)現(xiàn)機(jī)制,提高重復(fù)數(shù)據(jù)刪除性能實(shí)現(xiàn)系統(tǒng)在容量和性能方面的高度可擴(kuò)展性。數(shù)據(jù)結(jié)構(gòu)的復(fù)雜性、數(shù)據(jù)價(jià)值的增加以及日益增長(zhǎng)的數(shù)據(jù)依賴性,使得對(duì)數(shù)據(jù)的成功備份必不可少并倍受關(guān)注。大量備份失敗案例(例如使用未格式化的磁帶) 明備份驗(yàn)證和備份本身同等重要。備份驗(yàn)證對(duì)主數(shù)據(jù)集性能的影響,更多備份副本并使用Byzantine都是人為錯(cuò)誤造成的,這表在高可用性環(huán)境下,為了減少可以為驗(yàn)證需要而維護(hù)兩個(gè)或容錯(cuò)協(xié)議驗(yàn)證備份副本的正確性。一直以來(lái),I/O子系統(tǒng)被不斷優(yōu)化以縮小磁盤(pán)系統(tǒng)和中央處理器之間的性能鴻溝。例如,I/O緩沖和高速緩存技術(shù)已成功應(yīng)用在I/O路徑上的許多部位。雖然這些技術(shù)中的某些技術(shù)適用于備份和恢復(fù)系統(tǒng),但大多數(shù)因?yàn)樨?fù)載特性的差異而不適用。因此,目前的I/O優(yōu)化的效率在備份負(fù)載的環(huán)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年控、緩釋新型肥料項(xiàng)目項(xiàng)目投資申請(qǐng)報(bào)告代可行性研究報(bào)告
- 2025年上半年安徽合肥蜀山區(qū)區(qū)直機(jī)關(guān)事業(yè)單位吸納青年參加就業(yè)見(jiàn)習(xí)32人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年上半年寧波市余姚市黃家埠鎮(zhèn)招考勞動(dòng)保障協(xié)理員易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2024西安水務(wù)(集團(tuán))有限責(zé)任公司招聘初錄人員筆試參考題庫(kù)附帶答案詳解
- 2024福建福州雙福高速公路有限責(zé)任公司招聘2人筆試參考題庫(kù)附帶答案詳解
- 2025年礦物質(zhì)藥品專利藥項(xiàng)目合作計(jì)劃書(shū)
- 浙江專用2024-2025學(xué)年高中歷史專題八當(dāng)今世界經(jīng)濟(jì)的全球化趨勢(shì)三經(jīng)濟(jì)全球化的世界課時(shí)作業(yè)人民版必修2
- 2025年全封閉直冷牛奶冷卻罐項(xiàng)目可行性研究報(bào)告
- 2025年(相復(fù)勵(lì))三相交流同步發(fā)電機(jī)項(xiàng)目可行性研究報(bào)告
- 浙江專用2024-2025學(xué)年高中歷史專題四中國(guó)近現(xiàn)代社會(huì)生活的變遷二交通和通信工具的進(jìn)步課時(shí)作業(yè)人民版必修2
- 浙江省金華市2024年初中畢業(yè)升學(xué)適應(yīng)性檢測(cè) 科學(xué)試題卷
- 2024年六年級(jí)語(yǔ)文下冊(cè)全冊(cè)單元教材分析
- 2024年江西省中考生物·地理合卷試卷真題(含答案逐題解析)
- 延長(zhǎng)石油招聘筆試試題
- DB-T 29-22-2024 天津市住宅設(shè)計(jì)標(biāo)準(zhǔn)
- 2024年贛州職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)及答案解析
- DL∕T 5209-2020 高清版 混凝土壩安全監(jiān)測(cè)資料整編規(guī)程
- 2024年湖南新課標(biāo)卷高考生物真題試卷(無(wú)答案)
- 2024年湖南鐵路科技職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)附答案
- 醫(yī)療器械質(zhì)量安全風(fēng)險(xiǎn)會(huì)商管理制度
- 降低用藥錯(cuò)誤發(fā)生率
評(píng)論
0/150
提交評(píng)論