數(shù)據(jù)中心解決方案之災(zāi)備方案設(shè)計(jì)_第1頁
數(shù)據(jù)中心解決方案之災(zāi)備方案設(shè)計(jì)_第2頁
數(shù)據(jù)中心解決方案之災(zāi)備方案設(shè)計(jì)_第3頁
數(shù)據(jù)中心解決方案之災(zāi)備方案設(shè)計(jì)_第4頁
數(shù)據(jù)中心解決方案之災(zāi)備方案設(shè)計(jì)_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)中心解決方案之災(zāi)備方案設(shè)計(jì)1.數(shù)據(jù)中心容災(zāi)備份解決方案 隨著社會(huì)的發(fā)展和科技的進(jìn)步,政府日常工作越來越依賴于數(shù)據(jù)處理來進(jìn)行, 政務(wù)系統(tǒng)的連續(xù)性依賴于數(shù)據(jù)中心系統(tǒng)的穩(wěn)定運(yùn)行。然而,災(zāi)難就像灰塵一樣 伏擊在運(yùn)營環(huán)境周圍,政務(wù)系統(tǒng)的數(shù)據(jù)中心可能正在一個(gè)充滿風(fēng)險(xiǎn)和威脅的環(huán) 境下運(yùn)行。如果不能對這些風(fēng)險(xiǎn)采取有效治理,一旦數(shù)據(jù)由于某種原因丟失, 就很有可能對政府的日常工作造成嚴(yán)重的影響。如果核心數(shù)據(jù)丟失,將會(huì)使得 某些核心功能陷入癱瘓,造成不可估量的損失。因此,保證政務(wù)的連續(xù)性和數(shù) 據(jù)的高可靠性和可用性,已經(jīng)成為政府部門在數(shù)據(jù)中心建設(shè)中,必須要考慮的 問題。1.1 災(zāi)備解決方案原則首先,在制定容災(zāi)系統(tǒng)

2、方案的過程中要考慮的就是容災(zāi)系統(tǒng)建設(shè)對原有業(yè)務(wù)系 統(tǒng)帶來的影響。比如,采用數(shù)據(jù)復(fù)制技術(shù)對系統(tǒng) I/O 帶來的延遲,應(yīng)用數(shù)據(jù)同 步對日常業(yè)務(wù)處理系統(tǒng)帶來的壓力等。因此,企業(yè)要通過周密的測試和分析來 規(guī)避容災(zāi)系統(tǒng)建設(shè)時(shí)帶來的這些風(fēng)險(xiǎn),以保證業(yè)務(wù)系統(tǒng)不會(huì)因容災(zāi)系統(tǒng)的建設(shè) 而出現(xiàn)在處理性能上下降的問題。第二,數(shù)據(jù)狀態(tài)要保持同步。為保證在災(zāi)難發(fā)生時(shí),業(yè)務(wù)可以成功地切換到備 份中心,就必須保證容災(zāi)系統(tǒng)數(shù)據(jù)同步機(jī)制的可靠性。因此,建立可靠的數(shù)據(jù) 同步校驗(yàn)機(jī)制是必須的 ; 同時(shí),還要考慮建立定時(shí)的、自動(dòng)的數(shù)據(jù)同步核查對 比機(jī)制,以檢驗(yàn)兩個(gè)中心數(shù)據(jù)的一致性,這是數(shù)據(jù)容災(zāi)工作中非常重要的一部 分。第三,容災(zāi)系統(tǒng)的

3、日常維護(hù)工作要盡可能輕,并能承擔(dān)部分業(yè)務(wù)處理和測試的 工作。容災(zāi)系統(tǒng)的維護(hù)和管理是容災(zāi)切換成功的重要保證,在系統(tǒng)建設(shè)中,就 必須要考慮系統(tǒng)的維護(hù)管理流程。生產(chǎn)中心任何業(yè)務(wù)處理過程的改變都必須完 整地復(fù)制到備份中心 ; 所有新業(yè)務(wù)系統(tǒng)上線時(shí),必須通知備份中心,并在備份 中心配置好數(shù)據(jù)同步機(jī)制 ; 對原程序的改動(dòng)也必須保證兩個(gè)中心同時(shí)上線。第四,系統(tǒng)恢復(fù)時(shí)間要盡可能短。容災(zāi)系統(tǒng)主要是為了實(shí)現(xiàn)在主中心系統(tǒng)發(fā)生 災(zāi)難時(shí),可以在規(guī)定時(shí)間切換到備份中心,保證數(shù)據(jù)不會(huì)丟失,并且繼續(xù)向用 戶提供服務(wù)。但往往在災(zāi)難發(fā)生時(shí),主要技術(shù)人員不能及時(shí)到達(dá)現(xiàn)場,為了順 利實(shí)現(xiàn)系統(tǒng)間的切換,應(yīng)該讓系統(tǒng)切換操作盡可能地簡單

4、; 并建立固定化的、 標(biāo)準(zhǔn)化的切換流程,要求維護(hù)人員在切換演習(xí)時(shí)嚴(yán)格按照流程的指導(dǎo)步驟進(jìn)行 操作。第五,可實(shí)現(xiàn)部分業(yè)務(wù)子系統(tǒng)的切換和回切。當(dāng)人事變動(dòng)、業(yè)務(wù)變化、 IT 設(shè)施 變化以及其他可能引起恢復(fù)規(guī)劃文檔失效的變化發(fā)生時(shí),應(yīng)及時(shí)更新各恢復(fù)規(guī) 劃文檔,并在必要時(shí)啟動(dòng)模擬測試或演習(xí),確保業(yè)務(wù)連續(xù)性系統(tǒng)的工作能力。第六,技術(shù)方案選擇要遵循成熟穩(wěn)定、高可靠性、可擴(kuò)展性、透明性的原則。 目前,國際上比較成熟的容災(zāi)技術(shù)包括: SAN/NAS 技術(shù)、遠(yuǎn)程鏡像技術(shù)、虛 擬存儲(chǔ)、基于 IP 的 SAN 互連技術(shù)以及快照技術(shù)等。其中基于 IP 的 SAN 遠(yuǎn)程 數(shù)據(jù)容災(zāi)備份技術(shù)應(yīng)用比較廣泛,其是利用基于 IP

5、的 SAN 的互連協(xié)議,將主 數(shù)據(jù)中心 SAN 中的信息通過現(xiàn)有的 TCP/IP 網(wǎng)絡(luò),遠(yuǎn)程復(fù)制到備份中心的 SAN 中的。當(dāng)備份中心存儲(chǔ)的數(shù)據(jù)量過大時(shí),可利用快照技術(shù)將其備份到磁帶 庫或光盤庫。這種基于 IP 的 SAN 遠(yuǎn)程容災(zāi)備份,可以跨越 LAN 、MAN 和 WAN ,成本低、可擴(kuò)展性好?;?IP 的互連協(xié)議主要包括 FCIP、 iFCP、 InfiniBand 、iSCSI 等。第七,構(gòu)建系統(tǒng)方案可以選擇多種技術(shù)組合方式。目前,業(yè)內(nèi)應(yīng)用較多的容災(zāi) 方案是基于智能存儲(chǔ)系統(tǒng)的遠(yuǎn)程數(shù)據(jù)復(fù)制技術(shù),它是由智能存儲(chǔ)系統(tǒng)自身實(shí)現(xiàn) 的數(shù)據(jù)遠(yuǎn)程復(fù)制和同步,即智能存儲(chǔ)系統(tǒng)將對該系統(tǒng)中的存儲(chǔ)器 I/O

6、 操作請求 復(fù)制到遠(yuǎn)端的存儲(chǔ)系統(tǒng)中并執(zhí)行。由于在這種方式下,數(shù)據(jù)復(fù)制軟件運(yùn)行在存 儲(chǔ)系統(tǒng)內(nèi),因此較容易實(shí)現(xiàn)主中心和容災(zāi)備份中心的操作系統(tǒng)、數(shù)據(jù)庫、系統(tǒng) 庫和目錄的實(shí)時(shí)拷貝及維護(hù)能力,且不會(huì)影響主中心主機(jī)系統(tǒng)的性能。如果在 系統(tǒng)恢復(fù)場具備了實(shí)時(shí)數(shù)據(jù),那么就可以做到在災(zāi)難發(fā)生時(shí),及時(shí)開始應(yīng)用處 理過程的恢復(fù)。但這種方案也有開放性差 ( 不同廠家的存儲(chǔ)設(shè)備系統(tǒng)一般不能配 合使用 )、對于主、備中心之間的網(wǎng)絡(luò)條件 (穩(wěn)定性、帶寬、鏈路空間距離 )要求 較苛刻等缺點(diǎn)。1.2 災(zāi)備解決方案設(shè)計(jì)需要考慮的因素1.2.1 RTO 和 RPORTO(RecoveryTime Object ):是指災(zāi)難發(fā)生后,從

7、 IT 系統(tǒng)宕機(jī)導(dǎo)致業(yè)務(wù)停 頓之刻開始,到 IT 系統(tǒng)恢復(fù)至可以支持各部門運(yùn)作,業(yè)務(wù)恢復(fù)運(yùn)營之時(shí),此兩 點(diǎn)之間的時(shí)間段成為RTO。RTO是反映業(yè)務(wù)恢復(fù)及時(shí)性的指標(biāo),表示業(yè)務(wù)從中 斷到回復(fù)正常所需要的時(shí)間。 RTO 值越小,代表容災(zāi)系統(tǒng)的數(shù)據(jù)恢復(fù)能力越強(qiáng)。各種容災(zāi)解決方案的 RTO 有較大差別,基于光通道技術(shù)的同步數(shù)據(jù)復(fù)制, 配合異地備用的業(yè)務(wù)系統(tǒng)和跨業(yè)務(wù)中心與備份中心的高可用管理,這種容災(zāi)解 決方案具有最小的 RTO 。RPO(Recovery Point Objective ),是指從系統(tǒng)和應(yīng)用數(shù)據(jù)而言,要實(shí)現(xiàn)能 夠恢復(fù)至可以支持各部門業(yè)務(wù)運(yùn)作,系統(tǒng)及生產(chǎn)數(shù)據(jù)應(yīng)恢復(fù)到怎樣的更新程 度。 RP

8、O 是反映恢復(fù)數(shù)據(jù)完整性的指標(biāo),在同步數(shù)據(jù)復(fù)制方式下,RPO 等于數(shù)據(jù)傳輸延遲的時(shí)間;在異步數(shù)據(jù)復(fù)制下, RPO 基本為異步傳輸數(shù)據(jù)排隊(duì)的時(shí) 間。在實(shí)際應(yīng)用中,考慮導(dǎo)數(shù)據(jù)傳輸?shù)囊蛩?,業(yè)務(wù)數(shù)據(jù)庫與容災(zāi)備份數(shù)據(jù)庫的 一致性(SCN)是不同的,RPO表示業(yè)務(wù)數(shù)據(jù)庫與容災(zāi)備份數(shù)據(jù)庫 SCN的時(shí) 間差。發(fā)生災(zāi)難后,啟動(dòng)容災(zāi)系統(tǒng)完成數(shù)據(jù)恢復(fù), RPO 就是新恢復(fù)業(yè)務(wù)系統(tǒng)的 數(shù)據(jù)損失量。設(shè)計(jì)容災(zāi)系統(tǒng)不能只看 RTO和RPO,對于不同的業(yè)務(wù)系統(tǒng)和用戶特殊的要 求,其它一些指標(biāo)有可能成為選擇容災(zāi)解決方案的主要因素。例如,某些地區(qū) 為了防范一些特定自然災(zāi)害的風(fēng)險(xiǎn),要求容災(zāi)備份中心與業(yè)務(wù)中心保持足夠的 距離,在這種

9、情況下,容災(zāi)備份中心與業(yè)務(wù)中心的距離要求就是容災(zāi)系統(tǒng)的重 要指標(biāo)。1.2.2 數(shù)據(jù)安全數(shù)據(jù)的完整性,一致性是保證業(yè)務(wù)連續(xù)的關(guān)鍵。在本地,數(shù)據(jù)安全需要使用RAID 技術(shù)來保證。在災(zāi)備方案的設(shè)計(jì)中,數(shù)據(jù)復(fù)制方案的設(shè)計(jì)是整個(gè)設(shè)計(jì)的 基礎(chǔ)。目前業(yè)界主流的數(shù)據(jù)復(fù)制技術(shù)有:基于數(shù)據(jù)庫本身的復(fù)制技術(shù),基于操 作系統(tǒng)的數(shù)據(jù)復(fù)制,基于虛擬存儲(chǔ)的復(fù)制技術(shù)和基于存儲(chǔ)的復(fù)制技術(shù)。在方案 所用技術(shù)的選擇時(shí),應(yīng)當(dāng)根據(jù)客戶的預(yù)算,現(xiàn)場的條件,綜合來進(jìn)行考量。后 續(xù)在 1.6.1 數(shù)據(jù)同步章節(jié),將會(huì)有這 4 類數(shù)據(jù)復(fù)制技術(shù)的綜合對比,可以作為 選擇的參考。1.2.3 網(wǎng)絡(luò)安全通信網(wǎng)絡(luò)是容災(zāi)系統(tǒng)的組成部分,通信線路的質(zhì)量也是容

10、災(zāi)系統(tǒng)的性能指標(biāo)之 一,其中包括網(wǎng)絡(luò)的數(shù)據(jù)傳輸帶寬、網(wǎng)絡(luò)傳輸通道的冗余和網(wǎng)絡(luò)服務(wù)商的服務(wù) 水平(網(wǎng)絡(luò)年中斷率)。如果容災(zāi)系統(tǒng)使用的通信網(wǎng)絡(luò)是確定的,為了比較不 同容災(zāi)解決方案,可以用單位存儲(chǔ)容量的數(shù)據(jù)庫在同一通信網(wǎng)絡(luò)上的數(shù)據(jù)完全 恢復(fù)時(shí)間作為一項(xiàng)設(shè)計(jì)指標(biāo)。124業(yè)務(wù)連續(xù)性業(yè)務(wù)連續(xù)性是災(zāi)備方案的最終目標(biāo),是方案的價(jià)值所在。為了保證業(yè)務(wù)的連 續(xù),首先需要數(shù)據(jù)的連續(xù),之前我們討論了數(shù)據(jù)安全相關(guān)的內(nèi)容。其次,在數(shù) 據(jù)連續(xù)的基礎(chǔ)上,出現(xiàn)災(zāi)難時(shí),系統(tǒng)需要能夠滿足(1)網(wǎng)絡(luò)切換(2)應(yīng)用切換。以此,來保證系統(tǒng)能夠順利切換到災(zāi)備地,繼續(xù)安全運(yùn)營,最大化保證客 戶利益。1.3國標(biāo)系統(tǒng)災(zāi)備等級(jí)劃分及應(yīng)對措施國家信

11、息系統(tǒng)災(zāi)難恢復(fù)規(guī)范( GB/T 20988-2007 )規(guī)定了六個(gè)級(jí)別的容 災(zāi),下表分別針對每個(gè)級(jí)別給出了相應(yīng)的應(yīng)對措施。級(jí)別內(nèi)容措施Level6數(shù)據(jù)零丟失和遠(yuǎn)程集群支持實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)實(shí)時(shí)備份,實(shí)現(xiàn)零丟失; 應(yīng)用軟件可以實(shí)現(xiàn)實(shí)時(shí)無縫切換; 遠(yuǎn)程集群系統(tǒng)的實(shí)時(shí)監(jiān)控和自動(dòng)切換能力;Level5實(shí)時(shí)數(shù)據(jù)傳輸及完整設(shè)備支持實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)復(fù)制技術(shù);備用網(wǎng)絡(luò)也具備子哦那個(gè)或集中切換能力;Level4電子傳輸及完整設(shè)備支持配置所需要的全部數(shù)據(jù)和通訊線路及網(wǎng)絡(luò)設(shè)備,并處于就緒7*24運(yùn)行;更咼的技術(shù)支持和運(yùn)維管理;Level3電子傳輸和部分設(shè)備支持配置部分?jǐn)?shù)據(jù),通信線路和網(wǎng)絡(luò)設(shè)備; 每天實(shí)現(xiàn)多次的數(shù)據(jù)電子傳輸;

12、備用場地配置專制的運(yùn)行管理人員;Level2備用場地支持預(yù)定時(shí)間調(diào)配數(shù)據(jù),通信線路和網(wǎng)絡(luò)設(shè)備;備用場地管理制度;設(shè)備及網(wǎng)絡(luò)緊急供貨協(xié)議;Level1基本支持每周至少做一次完全數(shù)據(jù)備份;制定介質(zhì)存取/驗(yàn)證和轉(zhuǎn)儲(chǔ)的管理制度; 完整測試和演練的災(zāi)難恢復(fù)計(jì)劃;1.4容災(zāi)技術(shù)分析(1) 冷備份1.4.1備份方式備份系統(tǒng)未安裝或未配置成與當(dāng)前使用的系統(tǒng)相同或相似的運(yùn)行環(huán)境 , 應(yīng)用系 統(tǒng)數(shù)據(jù)沒有及時(shí)裝入備份系統(tǒng)。一旦發(fā)生災(zāi)難,需安裝配置所需的運(yùn)行環(huán)境, 用數(shù)據(jù)備份介質(zhì)(磁帶或光盤)恢復(fù)應(yīng)用數(shù)據(jù),手工逐筆或自動(dòng)批量追補(bǔ)孤立 數(shù)據(jù),將終端用戶通過通訊線路切換到備份系統(tǒng),恢復(fù)業(yè)務(wù)運(yùn)行。優(yōu)點(diǎn):設(shè)備 投資較少,節(jié)省

13、通信費(fèi)用,通信環(huán)境要求不高。缺點(diǎn):恢復(fù)時(shí)間較長,一般要 數(shù)天至 1 周,數(shù)據(jù)完整性與一致性較差。(2) 溫備份將備份系統(tǒng)已安裝配置成與當(dāng)前使用的系統(tǒng)相同或相似的系統(tǒng)和網(wǎng)絡(luò)運(yùn)行環(huán) 境,安裝了應(yīng)用系統(tǒng)業(yè)務(wù)定期備份數(shù)據(jù)。一旦發(fā)生災(zāi)難,直接使用定期備份數(shù) 據(jù),手工逐筆或自動(dòng)批量追補(bǔ)孤立數(shù)據(jù)或?qū)⒔K端用戶通過通訊線路切換到備份 系統(tǒng),恢復(fù)業(yè)務(wù)運(yùn)行。優(yōu)點(diǎn):設(shè)備投資較少,通信環(huán)境要求不高。缺點(diǎn):恢復(fù) 時(shí)間長,一般要十幾個(gè)小時(shí)至數(shù)天,數(shù)據(jù)完整性與一致性較差。(3) 熱備份備份處于聯(lián)機(jī)狀態(tài),當(dāng)前應(yīng)用系統(tǒng)通過高速通信線路將數(shù)據(jù)實(shí)時(shí)傳送到備份系 統(tǒng),保持備份系統(tǒng)與當(dāng)前應(yīng)用系統(tǒng)數(shù)據(jù)的同步;也可定時(shí)在備份系統(tǒng)上恢復(fù)應(yīng) 用

14、系統(tǒng)的數(shù)據(jù)。一旦發(fā)生災(zāi)難,不用追補(bǔ)或只需追補(bǔ)很少的孤立數(shù)據(jù),備份系 統(tǒng)可快速接替生產(chǎn)系統(tǒng)運(yùn)行,恢復(fù)營業(yè)。優(yōu)點(diǎn):恢復(fù)時(shí)間短,一般幾十分鐘到 數(shù)小時(shí),數(shù)據(jù)完整性與一致性最好,數(shù)據(jù)丟失可能性最小。缺點(diǎn):設(shè)備投資 大,通信費(fèi)用高,通信環(huán)境要求高,平時(shí)運(yùn)行管理較復(fù)雜。在計(jì)算機(jī)服務(wù)器備份和恢復(fù)中,冷備份服務(wù)器( cold server )是在主服務(wù)器丟 失的情況下才使用的備份服務(wù)器。冷備份服務(wù)器基本上只在軟件安裝和配置的 情況下打開,然后關(guān)閉直到需要時(shí)再打開。溫備份服務(wù)器( warm server )一般都是周期性開機(jī),根據(jù)主服務(wù)器內(nèi)容進(jìn)行 更新,然后關(guān)機(jī)。經(jīng)常用溫備份服務(wù)器來進(jìn)行復(fù)制和鏡像操作。熱備份服

15、務(wù)器( hot server )時(shí)刻處于開機(jī)狀態(tài),同主機(jī)保持同步。當(dāng)主機(jī)失 靈時(shí),可以隨時(shí)啟用熱備份服務(wù)器來代替。對于關(guān)鍵的業(yè)務(wù), Primeton 建議采用同城熱備異地?zé)醾涞姆绞竭M(jìn)行部署, 對于一般性的業(yè)務(wù),建議采用同城熱備異地溫備(應(yīng)用不啟動(dòng),數(shù)據(jù)保持異 步復(fù)制)的方式進(jìn)行部署。1.4.2數(shù)據(jù)復(fù)制技術(shù)目前數(shù)據(jù)復(fù)制技術(shù)主要有如下表所列4種,基于紅色字體部分的要求,結(jié)合客戶的需要,Primet on推薦采用基于存儲(chǔ)或者基于應(yīng)用程序的數(shù)據(jù)復(fù)制技術(shù)來 進(jìn)行數(shù)據(jù)同步。基本原理數(shù)據(jù)的復(fù)制過程通過本 地的存儲(chǔ)系統(tǒng)和遠(yuǎn)端的 存儲(chǔ)系統(tǒng)之間的通信完 成。復(fù)制技術(shù)是伴隨著存 儲(chǔ)局 域網(wǎng)的出現(xiàn)引入的,通過 構(gòu)建虛

16、擬存儲(chǔ)上實(shí)現(xiàn)數(shù)據(jù) 復(fù)制。通過操作系統(tǒng)或者數(shù) 據(jù)卷管理器來實(shí)現(xiàn)對 數(shù)據(jù)的遠(yuǎn)程復(fù)制。數(shù)據(jù)庫的異地復(fù)制技術(shù) 日志復(fù)制功能,依靠本 機(jī)間的日志歸檔與傳遞 的數(shù)據(jù)一致。平臺(tái) 要求同構(gòu)存儲(chǔ)與平臺(tái)無關(guān),需要增加專有的復(fù)制服務(wù) 器或帶有復(fù)制功能的 SAN 交換機(jī)同構(gòu)主機(jī)、異構(gòu)存儲(chǔ)與平臺(tái)無關(guān)復(fù)制性能高高高較咼資源 占用對生產(chǎn)系統(tǒng)存儲(chǔ)性能有 影響對網(wǎng)絡(luò)要求咼對生產(chǎn)系統(tǒng)主機(jī)性能 有影響占用部分生產(chǎn)系統(tǒng)數(shù)據(jù)技術(shù) 成熟 度成熟成熟度有待提咼,非主流 復(fù)制技術(shù)。成熟成熟投入成本高,需要同構(gòu)存儲(chǔ)較高,需要專有設(shè)備較高,需要同構(gòu)主機(jī)一般部分軟件免費(fèi),如Data復(fù)制 軟件IBM PPRCEMC SRDFHP CA( Conti

17、nuesAccess)HDS TrueCopyBrocade Tapestry DMMUIT SVMEMC VSM原廠技術(shù):IBM AIX LVMHP-UINX MirrorDiskSun Solaris SVM專業(yè)的復(fù)制軟件:Syma ntec SF/VVROracle DataGuardOracle Golde nGateDNT IDRDSG RealS yncQuest SharePlex重復(fù)數(shù)據(jù)刪除技術(shù)是指將存儲(chǔ)系統(tǒng)中存在的大量內(nèi)容相同的數(shù)據(jù)刪除,只保留其中一份,從而縮減存儲(chǔ)空間的技術(shù)。在云災(zāi)備中,該技術(shù)既能大幅減少災(zāi)備中心存儲(chǔ)的數(shù)據(jù)量,降低災(zāi)備中心的建設(shè)和運(yùn)維成本,又能大幅減少數(shù)據(jù)備

18、份和恢復(fù)過程中用戶和災(zāi)備提供商間的數(shù)據(jù)傳輸量,提高備份和恢復(fù)的性能,是 一項(xiàng)十分重要的技術(shù)。隨著災(zāi)備中心的規(guī)模不斷增大,存儲(chǔ)的數(shù)據(jù)量和訪問量不斷增加,單一節(jié)點(diǎn)上 的重復(fù)數(shù)據(jù)刪除方法已不能滿足性能和容量的需求。除上述基本重復(fù)數(shù)據(jù)刪除 技術(shù)外,一些優(yōu)化和改進(jìn)技術(shù)對云災(zāi)備是至關(guān)重要的,包括高性能、可擴(kuò)展 的、分布式的重復(fù)數(shù)據(jù)刪除技術(shù),以及為提高災(zāi)備中心數(shù)據(jù)可靠性的高可靠重 復(fù)數(shù)據(jù)刪除技術(shù)。1.4.4 操作系統(tǒng)虛擬化技術(shù) ?除了數(shù)據(jù)級(jí)的災(zāi)備,還應(yīng)提供系統(tǒng)級(jí)的災(zāi)備。即在將數(shù)據(jù)復(fù)制到云端的同時(shí), 也將受保護(hù)的應(yīng)用程序的狀態(tài)復(fù)制到云端,當(dāng)災(zāi)難發(fā)生時(shí)可以立即切換到云端 的應(yīng)用程序運(yùn)行,保證業(yè)務(wù)連續(xù)性。系統(tǒng)級(jí)災(zāi)

19、備是通過操作系統(tǒng)虛擬化和檢查 點(diǎn)實(shí)現(xiàn)的。檢查點(diǎn)用來捕獲進(jìn)程某一時(shí)刻的運(yùn)行狀態(tài),從而實(shí)現(xiàn)進(jìn)程遷移。進(jìn) 程遷移既可以是用戶應(yīng)用程序進(jìn)程到云災(zāi)備中心的遷移,也可以是云災(zāi)備中心 內(nèi)部的虛擬機(jī)池間進(jìn)程遷移,以實(shí)現(xiàn)根據(jù)前端用戶的需求自動(dòng)地調(diào)節(jié)災(zāi)備服務(wù) 提供商有限的硬件與軟件資源,動(dòng)態(tài)地、彈性的反應(yīng)前端業(yè)務(wù)對災(zāi)備的需求。當(dāng)程序因故障中斷,如果不能保留其中間運(yùn)行狀態(tài),恢復(fù)后從頭運(yùn)行將會(huì)帶來極大的消耗。檢查點(diǎn)技術(shù)能夠解決這個(gè)問題。通過保留各個(gè)進(jìn)程的運(yùn)行狀態(tài), 恢復(fù)時(shí)能夠復(fù)原到最近一次保留的數(shù)據(jù)映像。傳統(tǒng)的檢查員機(jī)制是基于庫的檢查點(diǎn)機(jī)制。例如以靜態(tài)庫的形式實(shí)現(xiàn),或通過加載動(dòng)態(tài)鏈接庫來追蹤程序運(yùn)行過程中的數(shù)據(jù)變化。

20、也有一些檢查點(diǎn)機(jī)制實(shí)現(xiàn) 于內(nèi)核級(jí)別甚至硬件級(jí)別。例如通過在文件系統(tǒng)層之上引入一個(gè)中間層來實(shí)現(xiàn) 保留文件系統(tǒng)狀態(tài)的檢查點(diǎn)機(jī)制;或者借助 Fuse 內(nèi)核模塊實(shí)現(xiàn)的支持檢查點(diǎn) 機(jī)制的文件系統(tǒng),通過 Fuse 偵測、攔截內(nèi)核級(jí)別的文件系統(tǒng)操作并將控制權(quán) 傳遞給用戶,從而能夠在用戶空間對文件系統(tǒng)狀態(tài)進(jìn)行保留。隨著操作系統(tǒng)虛擬化技術(shù)的發(fā)展,基于虛擬容器的檢查點(diǎn)技術(shù)也得到了很好的 應(yīng)用。虛擬容器是通過系統(tǒng)虛擬化技術(shù)構(gòu)建出來的一個(gè)進(jìn)程運(yùn)行的較獨(dú)立的上下文環(huán)境。虛擬容器檢查點(diǎn)技術(shù)能夠有效保護(hù)容器內(nèi)運(yùn)行的應(yīng)用程序和服務(wù)而 不需要對應(yīng)用進(jìn)行修改。1.5 總體架構(gòu)設(shè)計(jì)1.5.1Primeton “兩地三中心”容災(zāi)解決

21、方案架構(gòu)設(shè)計(jì)結(jié)合近年國內(nèi)出現(xiàn)的大范圍自然災(zāi)害,以同城雙中心加異地災(zāi)備中心的“兩地 三中心”的災(zāi)備模式也隨之出現(xiàn),這一方案兼具高可用性和災(zāi)難備份的能力。1.5.1.1 “兩地三中心”本地高可用和容災(zāi)保護(hù)策略(1)本地保護(hù)策略:? 本地高可用? 本地 clone? 持續(xù)數(shù)據(jù)保護(hù)? B2D BVTL? 磁帶備份? Archive Log 備份(2)容災(zāi)保護(hù)策略? 應(yīng)用級(jí)或者數(shù)據(jù)級(jí)容災(zāi)? 同級(jí)容災(zāi)、降級(jí)容災(zāi)? 同步數(shù)據(jù)保護(hù)異步數(shù)據(jù)保護(hù)? 容災(zāi)數(shù)據(jù)復(fù)制技術(shù)? 主備中心運(yùn)營方式雙主中心運(yùn)營方式多中心運(yùn)營方式? 短、中、遠(yuǎn)期容災(zāi)策略生產(chǎn)中心同城備份中心異地災(zāi)備中心生產(chǎn)生產(chǎn)(雙活或熱備)生產(chǎn)備份備份備份災(zāi)備災(zāi)

22、備災(zāi)備開發(fā)監(jiān)控測試測試監(jiān)控監(jiān)控管理管理同城雙中心是指在同城或鄰近城市建立兩個(gè)可獨(dú)立承擔(dān)關(guān)鍵系統(tǒng)運(yùn)行的數(shù)據(jù)中 心,雙中心具備基本等同的業(yè)務(wù)處理能力并通過高速鏈路實(shí)時(shí)同步數(shù)據(jù),日常 情況下可同時(shí)分擔(dān)業(yè)務(wù)及管理系統(tǒng)的運(yùn)行,并可切換運(yùn)行;災(zāi)難情況下可在基 本不丟失數(shù)據(jù)的情況下進(jìn)行災(zāi)備應(yīng)急切換,保持業(yè)務(wù)連續(xù)運(yùn)行。與異地災(zāi)備模 式相比較,同城雙中心具有投資成本低、建設(shè)速度快、運(yùn)維管理相對簡單、可 靠性更高等優(yōu)點(diǎn)。異地災(zāi)備中心是指在異地的城市建立一個(gè)備份的災(zāi)備中心,用于雙中心的數(shù)據(jù) 備份,當(dāng)雙中心出現(xiàn)自然災(zāi)害等原因而發(fā)生故障時(shí),異地災(zāi)備中心可以用備份 數(shù)據(jù)進(jìn)行業(yè)務(wù)的恢復(fù)。1.5.1.3 “兩地三中心”容災(zāi)架

23、構(gòu)設(shè)計(jì)邏輯架構(gòu)模型設(shè)計(jì):備用數(shù)據(jù)縫理備用網(wǎng)絡(luò)Site B(同城容災(zāi))amnmMum慮用悴與中伶BS*tf敢份SAN交機(jī)Site A住產(chǎn)中心)(B»M)用BHttW (i»耳is用5)(nta7c*av)»)物理架構(gòu)設(shè)計(jì)mu 異步數(shù)據(jù)U制r_*巧二匚 tL-P- I-*-萬案特點(diǎn):?同城范圍有效保證了數(shù)據(jù)的安全性和業(yè)務(wù)連續(xù)性;?異地復(fù)制數(shù)據(jù)根據(jù)災(zāi)難情形,盡可能降低數(shù)據(jù)丟失機(jī)率;?同城雙中心為同步復(fù)制,數(shù)據(jù)實(shí)時(shí)同步,RPO=0 ;?異地?zé)o距離限制,保證數(shù)據(jù)一致性,保證了數(shù)據(jù)的有效保護(hù);?異地容災(zāi)帶寬要求低,先進(jìn)的復(fù)制機(jī)制提高帶寬利用率 對于本地本級(jí)備份,應(yīng)建立在線、近

24、線、離線等多級(jí)存儲(chǔ)備份系統(tǒng),充分利用 先進(jìn)的備份手段和備份策略,形成完整的本地備份管理解決方案;備份的數(shù)據(jù) 包括操作系統(tǒng)、數(shù)據(jù)文件以及應(yīng)用服務(wù)環(huán)境等多個(gè)方面;日常訪問的重要數(shù)據(jù) 采用磁盤或者虛擬帶庫方式備份,歸檔數(shù)據(jù)和非重要數(shù)據(jù)采用磁帶庫方式備 份;重要數(shù)據(jù)應(yīng)至少保證每周做一個(gè)全量備份,平時(shí)做增量備份。對于數(shù)據(jù)級(jí)異地災(zāi)備中心,選址上,應(yīng)進(jìn)行風(fēng)險(xiǎn)分析,避免異地備份中心與主 中心同時(shí)遭受同類風(fēng)險(xiǎn);網(wǎng)絡(luò)備用系統(tǒng)上,必須在核心網(wǎng)絡(luò)層面實(shí)現(xiàn)熱備,保 證災(zāi)備中心區(qū)域內(nèi)通信的可靠性;數(shù)據(jù)備份系統(tǒng)上,主中心與備份中心的備份 鏈路應(yīng)有冗余,并確保 2小時(shí)內(nèi)將主中心的增量數(shù)據(jù)復(fù)制或備份到災(zāi)備中心; 數(shù)據(jù)處理備用系

25、統(tǒng)上,配備災(zāi)難恢復(fù)所需的全部數(shù)據(jù)處理設(shè)備,并處于就緒狀 態(tài)或運(yùn)行狀態(tài),與主中心共同承擔(dān)部分核心應(yīng)用的查詢服務(wù)功能。對于同城應(yīng)用級(jí)災(zāi) 備中心,選址上,主中心 與同城 災(zāi)備中 心距離 應(yīng)小于 100KM ;網(wǎng)絡(luò)備用系統(tǒng)上,在核心網(wǎng)絡(luò)層面實(shí)現(xiàn)熱備,主中心與應(yīng)用級(jí)災(zāi)備中 心間通過裸光纖互聯(lián)或 VPLS互聯(lián),部署TRILL構(gòu)建大二層網(wǎng)絡(luò),滿足虛擬化 需求;網(wǎng)絡(luò)負(fù)載均衡上,主中心網(wǎng)絡(luò)與災(zāi)備中心網(wǎng)絡(luò)的負(fù)載均衡,提高災(zāi)備網(wǎng) 絡(luò)利用率與災(zāi)備網(wǎng)絡(luò)可用性,正常情況下數(shù)據(jù)流同時(shí)使用兩個(gè)中心的網(wǎng)絡(luò),主 中心網(wǎng)絡(luò)出現(xiàn)故障時(shí),貝U全部數(shù)據(jù)流向?yàn)?zāi)備網(wǎng)絡(luò);應(yīng)用集群切換上,關(guān)鍵業(yè)務(wù) 系統(tǒng)集群實(shí)現(xiàn)手動(dòng)切換,主中心與同城災(zāi)備中心之間

26、建立高可用性監(jiān)控技術(shù), 實(shí)現(xiàn)災(zāi)備中心應(yīng)用服務(wù)器集群與主中心生產(chǎn)服務(wù)器集群之間的高可用性切換; 云計(jì)算技術(shù)采用上,采用虛擬化技術(shù)對同城災(zāi)備中心進(jìn)行規(guī)劃建設(shè),同時(shí),根 據(jù)業(yè)務(wù)關(guān)鍵程度、對性能的要求,系統(tǒng)平臺(tái)選擇不同檔次和不同平臺(tái)的主機(jī)資 源池、存儲(chǔ)資源池。1.5.2基于不同服務(wù)需求選擇不同可靠性“兩地三中心”架構(gòu)1.521服務(wù)等級(jí)劃分的可靠性服 務(wù) 級(jí) 別tierltier2tier3服關(guān)鍵任務(wù)服務(wù),需要最高級(jí)別的可靠性。高端技術(shù)關(guān)鍵業(yè)務(wù)服務(wù)的運(yùn)維和tierl 一樣,高端技術(shù)和工務(wù)和工具將會(huì)被用來滿足最高級(jí)別的可靠性。如果但是某些限制非可靠級(jí)別的服務(wù)可以盡量(略低于內(nèi)丟失一個(gè)組件,如服務(wù)器,一塊存

27、儲(chǔ),或者一個(gè)容忍短時(shí)間的不可恢復(fù)的影響。咼端和 tier2 ) 被容通信鏈接,都將會(huì)導(dǎo)致服務(wù)不可靠。每個(gè)應(yīng)用和 基礎(chǔ)服務(wù)都會(huì)制定性能指標(biāo)。這些指標(biāo)都將會(huì)被 監(jiān)控,并會(huì)通過業(yè)務(wù)支持的流程以特疋格式輸 出。這個(gè)site不僅僅包含基礎(chǔ)架構(gòu)組件。技術(shù)和工具將會(huì)盡量(略低于tierl )被用來滿足最高級(jí)別的可靠 性。系統(tǒng)設(shè)計(jì)和指導(dǎo)里面必須包含一 沒有單點(diǎn)故障。足最高級(jí)別的 性。允許有多 故障。僅僅在 有一些伸縮性關(guān) 鍵 指 標(biāo)99.99%的可靠性,數(shù)據(jù)中性能夠切換,廠家支持 (小于2小時(shí)的響應(yīng)時(shí)間),硬件容錯(cuò)性,沒有 單點(diǎn)故障,N+1,數(shù)據(jù)中心的切換選擇,硬件冗余99.5%的可靠性,數(shù)據(jù)中性能夠切 換,

28、廠家支持(小于 4小時(shí)的響應(yīng)時(shí) 間),硬件具備容錯(cuò)性,沒有單點(diǎn)故障,N+195%的可靠性 性能夠切換, 持(小于24 應(yīng)時(shí)間)分 鐘 宕機(jī)/月4.32216.002160.001.522 Primet on通用的基于服務(wù)的“兩地三中心”架構(gòu)示意圖服務(wù)HA苴礎(chǔ)架構(gòu)計(jì)劃內(nèi)更新/可靠性級(jí)別:99.XXX本地:生產(chǎn)環(huán)境十同城備份yv.、入、|廠井她±和車地環(huán)境輜同或新和、牛:產(chǎn)壞境杷同或舟汝召活躍的CA)割門*耳si*ta 沖TiTJLrifffcFWi*.flR+X”應(yīng)蚩專此:«r«a+tet4fir)nW托Eig理冋*耳本地 ”皿兀Aft*HUM1; FlRI也暑mj

29、n«ri龍列也賈松陽握遠(yuǎn) 的肺地1.5.2.3 Primeton基于不同的服務(wù)質(zhì)量,達(dá)到不同級(jí)別的整體可靠性(tier )(1)場景1AOLTP: 100%* IA 樣 OLTAP: N/A 杜處理】WAtier 2 or 17556和本地-*樣2*-1. 町林性j&|l99.999Ki2. HA+DRim所有組井均冗余配置j4 町釆用Art陽佃鴕嗅式來保證業(yè)務(wù)連續(xù)性<A/P1100%和A樣1 4|44111?75%和本地一樣I1IOnline 10094 A*ff 槪址艸=H/AOLTP” 0L4P.75%和本地一樣本地生產(chǎn)環(huán)境* H 異地災(zāi)備愛infx倍主環(huán)境如圖中A所示,包含了數(shù)據(jù)庫,應(yīng)用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論