異地數(shù)據(jù)備份方案_第1頁
異地數(shù)據(jù)備份方案_第2頁
異地數(shù)據(jù)備份方案_第3頁
異地數(shù)據(jù)備份方案_第4頁
異地數(shù)據(jù)備份方案_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、新一篇: VERITAS的全線存儲備份容災解決方案第一章災難備份背景及優(yōu)勢31.1 什么是計算機業(yè)務系統(tǒng)的災難31.2國外計算機業(yè)務系統(tǒng)災難備份應用情況31.3國內計算機系統(tǒng)的災難備份計劃的應用情況41.4建設災難備份中心的重要意義4第二章災難分析7第三章災難備份設計目標83.1災難備份的設計目標8第四章災難備份設計思路及模型94.1容災項目開始94.2災難風險分析94.3制定恢復計劃94.4方案實施94.5支持與維護9第五章xxxx業(yè)務系統(tǒng)災難備份恢復體系設計125.1災難備份恢復體系總體設計125.2應用層方式容災結構簡介135.3數(shù)據(jù)庫方式容災結構簡介155.4鏡像軟件容災方式

2、結構簡介195.5XP磁盤陣列容災方式結構簡介21551災難恢復系統(tǒng)硬件,軟件配置說明23552 XP CA軟件容災原理24553 切換步驟26555 XP容災方案性能分析30第六章災難備份恢復流程31第七章培訓測試及維護337.1培訓337.2測試災難備份計劃337.3維護34第八章成功案例介紹358.1國外成功案例358.2國內成功案例35  第一章災難備份背景及優(yōu)勢1.1 什么是計算機業(yè)務系統(tǒng)的災難今天,XXXX比以往任何時候都更加依賴于計算機系統(tǒng),計算機系統(tǒng)在為XXXX迅猛發(fā)展提供技術基礎架構的同時,由于用戶業(yè)務處理的高度集中,以及不可預見的故障和災難,導致整個系統(tǒng)

3、存在很多災難性破壞的隱患,有可能成為整體系統(tǒng)中的單故障點。因此,業(yè)務的拓展與災難的防范是所有用戶都必須同步重視的問題。那么,什么是計算機業(yè)務系統(tǒng)的災難呢?通常的定義是指采用計算機系統(tǒng)處理的重要電子數(shù)據(jù)丟失至不可恢復或由此導致業(yè)務中斷以至于延長到不可接受的時間。1.2國外計算機業(yè)務系統(tǒng)災難備份應用情況災難備份計劃在發(fā)達國家電信行業(yè)和金融行業(yè)得到了較早的實施,現(xiàn)已較為普遍。例如在美國,因一九八五年紐約銀行計算機故障,聯(lián)邦管理部門更加強了在這方面的監(jiān)管力度?,F(xiàn)美國計算機業(yè)務系統(tǒng)一般出于以下三方面來考慮災難備份計劃:重要數(shù)據(jù)保護與業(yè)務連續(xù)運行的需要:在美國,各行業(yè)內部競爭激烈;在計算機管理制度上較為完

4、善;一旦因突發(fā)災難而造成數(shù)據(jù)丟失或業(yè)務中斷,將會造成重大乃至致命的打擊。審計的要求:美國較大型的企業(yè)一般會由第三家獨立審計公司來提供其資信業(yè)務、管理等方面咨詢服務,而世界著名的六大審計公司在對企業(yè)的評估項目中均包含災難備份計劃一項;評估企業(yè)數(shù)據(jù)在災難等威脅破壞下數(shù)據(jù)的完整性,一致性與安全性,及業(yè)務的可恢復性等,有些咨詢審計公司還會參與驗證所制訂的容災計劃的具體過程和其可行性。缺少災難備份計劃及其危害性會在評估報告中被顯示出來。法律的要求:美國政府及州政府通過多項法律強制性要求電信、金融業(yè)等大型企業(yè)備有計算機安全及災難備份計劃。對于沒有遵守這項災難備份計劃的企業(yè),會遭受曝光及罰款等嚴重處理,同時

5、亦可能對相關責任人采取罰款甚至監(jiān)禁等處罰。已知的災難例子有:日本神戶大地震、美國佛羅里達州颶風(數(shù)百家企業(yè)實施了災難備份計劃)、臺灣大地震等。1.3國內計算機系統(tǒng)的災難備份計劃的應用情況隨著我國入“世”的腳步越來越近,傳統(tǒng)產(chǎn)業(yè)在進入新市場新方式的競爭中,企業(yè)的電子信息架構的搭建,成為最具有戰(zhàn)略意義的資源投資。作為信息架構核心的數(shù)據(jù),其安全備份和災難恢復隨著世紀交替Y2K問題的引發(fā),逐漸引起人們的思考和重視。現(xiàn)代企業(yè)必須直面一個迫在眉睫的問題:如何對數(shù)據(jù)進行持續(xù)不斷地存儲,并通過有效地應用這些信息,提高企業(yè)的利潤率和競爭力。所以,在當今企業(yè)運營電子化的進程中,存儲將與網(wǎng)絡、軟件應用和系統(tǒng)CPU處

6、于同等重要的地位,成為決定系統(tǒng)成熟與否的關鍵。由于存在著各種數(shù)據(jù)丟失的可能,隨著人們對網(wǎng)絡系統(tǒng)的依賴日益增加,從硬件到軟件對數(shù)據(jù)的保護和備份確實是不容忽視的環(huán)節(jié)。企業(yè)的IT專家們逐漸認識到,可能造成數(shù)據(jù)丟失的因素主要有三種:自然災害的災難性破壞造成數(shù)據(jù)永久丟失,最佳的解決方案就是異地數(shù)據(jù)備份;計算機和網(wǎng)絡系統(tǒng)的硬件和軟件故障,這種損失也只有通過完整的數(shù)據(jù)備份來彌補;另外,自然免不了黑客的破壞以及人員的操作失誤。這些事故的發(fā)生都是防不勝防的,唯一能把損失降到最低的辦法就只有依賴具有數(shù)據(jù)備份和災難恢復功能的存儲設備。近年來國內用戶在計算機應用方面的飛速發(fā)展,計算機系統(tǒng)基礎架構的建設、特別是計算機容

7、災系統(tǒng)的設計與建設正逐漸被用戶所重視。不言而喻,如果用戶的業(yè)務系統(tǒng)有一套完備的災難備份/恢復體系,當突發(fā)性災難發(fā)生后,業(yè)務系統(tǒng)關鍵業(yè)務數(shù)據(jù)的損失將減至最小。特別是隨著中國加入WTO的日益臨近和行業(yè)競爭越來越激烈, 完善的災難備份/恢復體系在不遠的將來將是國內企業(yè)發(fā)展的可靠保障。在國內,隨著Internet的逐漸普及和電子商務熱潮的興起,企業(yè)需要整合越來越多的數(shù)據(jù),而數(shù)據(jù)的合并、管理、分享、保護都需要一個強大的、高可靠性的數(shù)據(jù)中心;同時,隨著國內企業(yè)經(jīng)營者對企業(yè)數(shù)據(jù)信息的價值和數(shù)據(jù)安全備份的認識的提高,存儲設備的投資也正在企業(yè)信息化建設的投入中占據(jù)著越來越高的比重。IT行業(yè)權威人士認為,在將來的

8、一至兩年中,數(shù)據(jù)存儲系統(tǒng)要花費所有企業(yè)計算系統(tǒng)投資的70。1.4建設災難備份中心的重要意義隨著計算機管理技術和網(wǎng)絡技術的發(fā)展,為了提高企業(yè)業(yè)務管理水平、增強企業(yè)市場競爭能力,越來越多的企業(yè)開始使用計算機來處理內部日常事務和外部業(yè)務往來,從而使得這些企業(yè)越來越依賴于系統(tǒng)管理數(shù)據(jù)和業(yè)務信息。尤其是在企業(yè)業(yè)務不斷增加、數(shù)據(jù)量成倍增長乃至出現(xiàn)數(shù)據(jù)膨脹現(xiàn)象時,由此引發(fā)的企業(yè)從數(shù)據(jù)膨脹、到計算機性能提高、再導致新一輪數(shù)據(jù)膨脹的循環(huán)不斷加劇,進而在企業(yè)中引起新的數(shù)據(jù)安全恐慌,數(shù)據(jù)失效問題時有發(fā)生。建設災難備份中心的目的就是在于防止一些災難性的小概率事件可能對集中式信息系統(tǒng)造成的不可恢復的原始數(shù)據(jù)的丟失,這些

9、災難性事件可能包括為火災,地震,電源故障及一些人為的操作失誤等,如下圖所示。  現(xiàn)代企業(yè)管理非常重視總體擁有成本(TCO)。所謂TCO,實際上是由實際成本、使用成本和風險成本三項組成。實際成本和使用成本在企業(yè)的建設與生產(chǎn)中往往容易引起人們重視,因而考慮得非常周到。而風險成本不僅是企業(yè)看不見、摸不著的東西,也是企業(yè)運作時很難預料和把握的內容。在使用計算機系統(tǒng)的企業(yè)中,風險成本包含用于管理關系到企業(yè)生命的各項數(shù)據(jù)與信息的安全、正常、可靠的高速運行的所需費用。所以,為將風險成本降至最低,同時使企業(yè)長期處于最佳狀態(tài),對企業(yè)業(yè)務和計算機管理與控制系統(tǒng)數(shù)據(jù)進行全面存儲備份是一項絕對值得

10、的、也是必要的投資。我們知道,隨著企業(yè)計算機系統(tǒng)建設計劃的逐步實施,XXXX的日常業(yè)務同計算機系統(tǒng)的聯(lián)系越來越緊密。因此,業(yè)務主機系統(tǒng)的運行出現(xiàn)故障所帶來的業(yè)務影響范圍會被迅速擴大,而客戶對企業(yè)計算機業(yè)務系統(tǒng)的連續(xù)運行,業(yè)務系統(tǒng)、用戶數(shù)據(jù)的高可用性以及業(yè)務計算機系統(tǒng)抵御突發(fā)性災難的能力的要求也必然急劇提高。XXXX建設災難備份/恢復中心有如下的意義:Ø           重要業(yè)務數(shù)據(jù)在災難發(fā)生后得以有效保護Ø     

11、60;     重要業(yè)務在災難發(fā)生后可以在設定的時間內恢復,從而實現(xiàn)業(yè)務的連續(xù)運行Ø           業(yè)務計算機系統(tǒng)抵御突發(fā)性災難的能力和級別提高Ø           進一步提高XXXX聲譽,增強客戶及潛在客戶的信心Ø         

12、;  擴大對同行業(yè)競爭對手的優(yōu)勢 第二章災難分析可能發(fā)生的災難因各城市/地域的地理、氣候、社會治安、城市管理,如供水、供電、通訊條件等差異而有所不同。仔細地分析各種突發(fā)性災害發(fā)生的可能性以及由此所造成的后果,對于制定和構建完整的和有很強針對性的災難備份體系是有很大幫助的。 下表是一張分析表樣本,可使我們對于可能發(fā)生的突發(fā)性災難評估有較為清晰的概念。  可能的災難可能性: 12345工作場所火災     數(shù)據(jù)中心火災     電源故障&#

13、160;    氣候災難(臺風,洪水等)     工業(yè)破壞     城市事件(罷工,動亂等)     硬件故障     軟件故障     設備問題(如管道漏水等)     供水故障     通訊系統(tǒng)故障

14、0;    計算機故意破壞(如病毒等)     爆炸威脅     工作場所的環(huán)境緊急事件(化學污染等)       第三章災難備份設計目標3.1災難備份的設計目標采用何種容災方式(邏輯數(shù)據(jù)復制物理數(shù)據(jù)復制)實現(xiàn)災難備份系統(tǒng)的設計目標主要應從以下四個方面來考慮:具體數(shù)據(jù)類型與目標的災難保護:從用戶業(yè)務系統(tǒng)正常運作的角度分析各種關鍵業(yè)務數(shù)據(jù),作出重要性與可恢復性要求的評估,并由此制定系統(tǒng)的數(shù)

15、據(jù)災難保護政策。災難發(fā)生后的可恢復業(yè)務分析:對用戶各種業(yè)務與管理流程進行分析評估,并據(jù)此制定出用戶核心業(yè)務系統(tǒng)的災難備份/恢復策略。災難發(fā)生后的可恢復分析:對于突發(fā)性災難這樣的重大事件,有時受災地區(qū)并不茍求所有業(yè)務系統(tǒng)都能夠可持續(xù)運營,故可按實際需求和比例進行分析,并由此配置相應的容災設備。災難發(fā)生后的業(yè)務可恢復時間指標:可以將災難的發(fā)生分為兩類,一類是可以預計具體時間的災難,如損害性極大的臺風等;另一類是不可預計具體時間的突發(fā)性的災難,如地震、主機系統(tǒng)的非計劃性Down 機等。針對兩種不同的災難類型,要設定不同的業(yè)務恢復時間指標。一般來說,對第一類災難的業(yè)務恢復時間要大大短于對第二類突發(fā)性災

16、難的業(yè)務恢復時間根據(jù)用戶對系統(tǒng)容災能力的不同要求以及投資方面的因素,HP公司提供多種容災解決方案,各有側重不同,我們會從不同的角度介紹容災系統(tǒng)的實現(xiàn)方法,以及系統(tǒng)的典型配置。 第四章災難備份設計思路及模型為了設計與實施xxxx的災難備份系統(tǒng),按照大型項目的管理方法和公司在項目管理方面所積累的豐富經(jīng)驗,在這里將整體項目的設計與實施分為五個階段:4.1容災項目開始Ø           明確xxxx災難備份恢復計劃的必要性Ø    

17、;       明確災難備份計劃的負責人和實施隊伍Ø           制定項目實施時間表。4.2災難風險分析Ø           確定對xxxx業(yè)務至關重要的系統(tǒng)、網(wǎng)絡和用戶Ø           確定由

18、于自然或人為災難對這些造成的威脅和損失,并盡可能準確為具體的損失Ø           收集各種業(yè)務和用戶對系統(tǒng)中斷時間等的要求4.3制定恢復計劃制定當災難發(fā)生,原業(yè)務主機系統(tǒng)或網(wǎng)絡系統(tǒng)不可用時,提供第二主機(災備主機)或網(wǎng)絡(災備網(wǎng)絡)的選擇策略。4.4方案實施開始實施災難備份計劃,如數(shù)據(jù)實時在線備份、應用系統(tǒng)切換、記錄本地數(shù)據(jù)備份的磁帶管理等。4.5支持與維護由指定的人員、部門或公司提供容災系統(tǒng)的日常支持與維護服務,保證災難備份恢復系統(tǒng)的可持續(xù),高可用運行。以下為容災方案實施各階段

19、的框圖:項目開始災難風險分析方案實施支持與維護制定恢復計劃  對于其中的核心部分第三項“制定恢復計劃”,根據(jù)xxxx的業(yè)務特點,這里分為以下幾個步驟:1、制定業(yè)務主機系統(tǒng)集群系統(tǒng)熱備份計劃:包括對服務器、操作系統(tǒng)、應用系統(tǒng)、數(shù)據(jù)庫系統(tǒng)、重要數(shù)據(jù)等的熱備份計劃。2、制定位于生產(chǎn)地的、與業(yè)務主機系統(tǒng)相關的前置服務器數(shù)據(jù)熱備份計劃:包括對其他機型的操作系統(tǒng)、數(shù)據(jù)庫系統(tǒng)、應用系統(tǒng)、重要數(shù)據(jù)和通訊配置等的熱備份計劃。3、制定網(wǎng)絡通訊備份計劃:對網(wǎng)絡設備、網(wǎng)絡協(xié)議、網(wǎng)絡參數(shù)設定、故障切換的邏輯過程、通訊線路的備份計劃等。4、制定客戶端備份計劃:包括終端設備,終端用戶的注冊與權限管理的備

20、份。5、制定磁帶備份計劃:包括系統(tǒng)備份、非系統(tǒng)數(shù)據(jù)文件備份、業(yè)務數(shù)據(jù)庫數(shù)據(jù)備份,及與備份系統(tǒng)相關的其他全量備份、增量備份等,以構成完整的系統(tǒng)保護措施。6、制定災難備份指示系統(tǒng):此系統(tǒng)用來提供清晰全面的災難備份指南,可以在災難發(fā)生時在最短時間內找到災難備份流程,與相關負責人和供應商的聯(lián)系方式,以及應當采取的應急措施等。 如下為流程框圖:   第五章xxxx業(yè)務系統(tǒng)災難備份恢復體系設計5.1災難備份恢復體系總體設計惠普公司為xxxx業(yè)務系統(tǒng)提供的災難備份恢復方案可以滿足用戶對于計算機系統(tǒng)、數(shù)據(jù)的最高保護要求,保證即使發(fā)生斷電,火災等嚴重災難時,用戶業(yè)務也可以

21、7x24小時的連續(xù)運行,同時確保業(yè)務數(shù)據(jù)在主中心和備份中心得到及時的更新,保證用戶數(shù)據(jù)最大的完整性。根據(jù)惠普公司多年來所積累的實施高可靠性災難備份恢復解決方案的成功經(jīng)驗,我們可以承諾用戶在最小的投資范圍內,按照惠普公司的項目實施流程,在最短的時間周期內達到整個項目的設計目標,并且通過惠普公司完善周全的售后服務體系,確保XXXX核心業(yè)務計算機系統(tǒng)的全天候、安全、穩(wěn)定的運行。由于用戶數(shù)據(jù)中心的核心業(yè)務系統(tǒng)相對集中,因此在數(shù)據(jù)中心實現(xiàn)關鍵業(yè)務數(shù)據(jù)的規(guī)范化的本地數(shù)據(jù)備份是災備系統(tǒng)建設的前提基礎;同時通過進行重要業(yè)務數(shù)據(jù)的遠程同步實現(xiàn)用戶重要業(yè)務數(shù)據(jù)的遠程異地存儲,為實現(xiàn)業(yè)務系統(tǒng)的遠程正常運作奠定堅實的

22、基礎;容災系統(tǒng)的關鍵就是遠程生產(chǎn)數(shù)據(jù)的自動復制,由于用戶的應用均為基于數(shù)據(jù)庫的聯(lián)機事務處理()業(yè)務系統(tǒng),所以業(yè)務數(shù)據(jù)遠程復制的關鍵就是確保數(shù)據(jù)庫數(shù)據(jù)的完整性、連續(xù)性,實時性和可恢復性。而現(xiàn)在惠普公司基于用戶不同的容災需求所提供的災難備份恢復方案主要有以下四大類型:1)         通過應用程序來進行遠程數(shù)據(jù)復制(應用層次);其主要原理就是通過修改應用程序或者使用BEA等公司的中間件產(chǎn)品,使得前端平臺在向數(shù)據(jù)庫服務器發(fā)送生產(chǎn)數(shù)據(jù)時,同時向主數(shù)據(jù)中心和備份數(shù)據(jù)中心均發(fā)送交易數(shù)據(jù),主數(shù)據(jù)中心處理交易數(shù)據(jù)并返回處理結果

23、,備份中心在正常情況下,只處理交易數(shù)據(jù),當主數(shù)據(jù)中心無法正常工作時,備份中心服務器接替主中心服務器向前端平臺返回處理結果。2)         利用數(shù)據(jù)庫廠家的軟件產(chǎn)品完成遠程數(shù)據(jù)備份(數(shù)據(jù)庫層次);現(xiàn)有的一些數(shù)據(jù)庫廠家例如Oracle數(shù)據(jù)庫可以提供STANDBY數(shù)據(jù)庫功能,通過通信網(wǎng)絡將實際數(shù)據(jù)庫日志文件傳至備份中心存儲系統(tǒng),備份中心的STANDBY數(shù)據(jù)庫按照主數(shù)據(jù)庫結構從日志文件中重新恢復數(shù)據(jù)庫;又例如Informix數(shù)據(jù)庫可以提供HADR(High-Availability Data Replication)

24、功能,在初始化時將主數(shù)據(jù)中心的數(shù)據(jù)庫中的所有dbspace進行一次零級備份,并恢復到備份數(shù)據(jù)中心的數(shù)據(jù)庫中,之后主數(shù)據(jù)中心的數(shù)據(jù)庫服務器可以通過通信網(wǎng)絡將生產(chǎn)數(shù)據(jù)庫的邏輯日志文件傳送至備份中心的數(shù)據(jù)庫服務器,備份中心的secondary數(shù)據(jù)庫將這些邏輯日志恢復到相應的dbspace上3)         利用主機上安裝的操作系統(tǒng)級鏡像軟件進行遠程數(shù)據(jù)鏡像(系統(tǒng)軟件,如HP-UX MirrorDisk/UX,Veritas Volume Replicator等);主中心存儲設備與備份中心存儲設備進行邏輯卷鏡像,主機同

25、時將數(shù)據(jù)分別寫到本地和遠程的磁盤設備上,實現(xiàn)業(yè)務數(shù)據(jù)的遠程復制。4)         通過惠普最新存儲產(chǎn)品XP系列磁盤陣列(磁盤陣列硬件層次),可以實現(xiàn)主數(shù)據(jù)中心和備份中心的操作系統(tǒng)、文件系統(tǒng)、數(shù)據(jù)庫、應用程序的實時遠程拷貝復制。主、備中心磁盤陣列本身就可以通過陣列上的微處理器完成數(shù)據(jù)的實時同步功能,將災難發(fā)生時關鍵數(shù)據(jù)的損失降至最低,而且不需要主機干涉或占用主機資源,可以做到災難發(fā)生的同時實現(xiàn)應用處理過程的恢復。遠程備份系統(tǒng)的重新啟動可以做到象一般輸入電源故障后的重新啟動那么簡單。以下是對各種容災實現(xiàn)方案的總體比

26、較: 數(shù)據(jù)量應用復雜度數(shù)據(jù)實時性對主機性能影響帶寬投資成本交易數(shù)據(jù)備份交易數(shù)據(jù)高(可能修改應用)低<10%幾十萬數(shù)據(jù)庫日志備份2-4倍交易數(shù)據(jù)數(shù)據(jù)庫工具可能至少丟失1個LOG較高(10-20%)幾十萬鏡像軟件4-8倍交易數(shù)據(jù)應用透明高(I/O級),網(wǎng)絡鏡像軟件故障影響主機業(yè)務高(10-30%)幾百萬磁盤陣列4-8倍交易數(shù)據(jù)應用透明高(I/O級)無幾百萬 5.2應用層方式容災結構簡介利用應用層容災方式建立針對用戶業(yè)務的災難備份系統(tǒng),其主要原理是通過應用程序或者中間件產(chǎn)品同時向主中心和備份中心傳輸未經(jīng)處理的生產(chǎn)數(shù)據(jù),主中心服務器和備份中心服務器同時處理數(shù)據(jù)。在正常情況下,

27、只用主中心和業(yè)務系統(tǒng)聯(lián)系,備份中心只在后臺處理數(shù)據(jù);當主中心癱瘓時,由于備份中心也存有生產(chǎn)數(shù)據(jù)庫,也存有生產(chǎn)數(shù)據(jù),所以可以迅速接管業(yè)務。由于是利用應用軟件來實現(xiàn)數(shù)據(jù)同步及保證一致性的,因而對于硬件方面的影響較小。如圖所示:這種方案的主要優(yōu)點就是:a)           由于通過網(wǎng)絡傳輸交易數(shù)據(jù)時未經(jīng)數(shù)據(jù)庫處理,所以傳輸數(shù)據(jù)量小,對傳輸數(shù)據(jù)的網(wǎng)絡帶寬要求不高;b)          傳輸數(shù)據(jù)過程中,主中心和

28、備份中心異步進行,由傳輸距離產(chǎn)生的延遲和通信帶寬瓶頸不會對應用產(chǎn)生較大影響缺點是:a)           對應用程序修改較大,增加應用軟件商二次開發(fā)負擔;b)          由于主,備數(shù)據(jù)中心的業(yè)務處理過程為異步進行,如何保障數(shù)據(jù)的一致性非常困難,需要在應用中對數(shù)據(jù)的同步進行周密的設計; 這種容災方式適合于傳輸距離極長(幾千公里),且網(wǎng)絡傳輸帶寬和通信質量無法得到有效保證的用戶環(huán)境而對于存儲

29、設備則沒有嚴格的限制,用戶可以靈活的選擇滿足容量和速度要求的存儲設備。5.3數(shù)據(jù)庫方式容災結構簡介531 原理數(shù)據(jù)庫方式由于只是傳送數(shù)據(jù)庫日志,與應用沒有直接關系,因此無須對應用程序作大量修改。以下介紹主要以Oracle和Informix數(shù)據(jù)庫為主。數(shù)據(jù)庫方式容災通過數(shù)據(jù)復制把數(shù)據(jù)定期、在線地復制到目的地的機器上去,以保持分布在不同地方的兩個或多個數(shù)據(jù)庫系統(tǒng)內容的一致性,來實現(xiàn)數(shù)據(jù)保護。但它將消耗大量的主機資源(至少要占用監(jiān)控和復制兩個進程)。復制的對象是數(shù)據(jù)庫的處理單位,如事務日志(邏輯日志),實現(xiàn)方式也有同步與異步兩種,嚴格來講,這種方法很難有真正的同步方案。因為同步數(shù)據(jù)復制要求做任何一筆

30、交易,都要實時地將結果發(fā)送到遠程的站點中,等遠程操作結束后,再執(zhí)行下一筆交易;而在實際操作中,很難做到這一點,只能做異步的數(shù)據(jù)復制。所以一個實時應用系統(tǒng)中,一般采用異步方式。 備份數(shù)據(jù)中心通過網(wǎng)絡連接到中央數(shù)據(jù)中心。在正常情況下,Oracle數(shù)據(jù)庫運行在主數(shù)據(jù)中心的服務器上,數(shù)據(jù)存儲于主數(shù)據(jù)中心的磁盤陣列中。利用Oracle數(shù)據(jù)庫提供的STANDBY數(shù)據(jù)庫功能,可以通過通信網(wǎng)絡將實際數(shù)據(jù)庫日志文件傳至備份中心存儲系統(tǒng),備份中心的STANDBY數(shù)據(jù)庫按照主數(shù)據(jù)庫結構從日志文件中重新恢復數(shù)據(jù)庫,以保持數(shù)據(jù)的一致性。一旦中央數(shù)據(jù)中心出現(xiàn)問題,用戶可以立即啟動備份數(shù)據(jù)中心的備份數(shù)據(jù)庫以及相關

31、應用。Achivelog的備份方式  這一實現(xiàn)方式的關鍵在于通過一個專用程序將主數(shù)據(jù)中心的數(shù)據(jù)庫中的Achive Log 定時通過通信網(wǎng)絡傳輸?shù)絺浞葜行牡臄?shù)據(jù)庫中。一旦主數(shù)據(jù)中心不能提供服務,備份中心首先通過Redo Log恢復數(shù)據(jù),然后再代替主數(shù)據(jù)中心恢復應用?;跀?shù)據(jù)庫方式的容災能夠把變化了的數(shù)據(jù)定期、在線地復制到目的地的機器上去。對用戶來說,這種復制方式的優(yōu)點是能夠較好地保證數(shù)據(jù)的一致性,但它將消耗大量的主機資源(至少要占用監(jiān)控和復制兩個進程)。此方案可以做到在有限的投資范圍內,充分利用現(xiàn)有機器設備,實現(xiàn)應用系統(tǒng)和重要數(shù)據(jù)的災難恢復功能。作為惠普公司成熟的災難恢復技術

32、,此方案已經(jīng)在國內許多用戶中成功實施過。其中包括:上海浦東國際機場災難恢復系統(tǒng)等。 建立遠程容災環(huán)境:l          利用中央數(shù)據(jù)庫的全備份(零級備份)建立災難備份數(shù)據(jù)庫l          由專門進程負責傳輸中央數(shù)據(jù)庫生成的日志文件到遠地,這里可以通過定義日志文件大小及傳輸時機來控制災難發(fā)生時的數(shù)據(jù)損失盡量降低,并可加快容災應用切換速度,盡快恢復業(yè)務在備份數(shù)據(jù)中心系統(tǒng)上運行。l  

33、;        災難備份數(shù)據(jù)庫使用傳輸來的日志文件(Archive log或Logical log)不斷更新備份數(shù)據(jù)庫,這時數(shù)據(jù)庫一直處于恢復狀態(tài)(Informix數(shù)據(jù)庫為quiescent狀態(tài)),其數(shù)據(jù)不可被訪問(對于Informix數(shù)據(jù)庫,備份數(shù)據(jù)庫中的數(shù)據(jù)可被用來進行讀操作,但無法進行寫操作)。l          災難備份數(shù)據(jù)庫更新出錯且無法解決時,應重新建立備份數(shù)據(jù)庫。l    

34、60;     災難備份數(shù)據(jù)庫應定期做激活測試,以確保其在關鍵時刻的可用性。l          應用系統(tǒng)需考慮發(fā)生災難時如何將聯(lián)接切換到災難備份數(shù)據(jù)庫。 容災切換:l          將中央數(shù)據(jù)庫的可取得的日志文件傳至災難數(shù)據(jù)庫后,將災難備份數(shù)據(jù)庫更新到最近點,并開啟數(shù)據(jù)庫供應用系統(tǒng)使用;l      &

35、#160;   立即對災難數(shù)據(jù)庫做數(shù)據(jù)庫全備份;l          對損失的數(shù)據(jù)進行修補;l          以建立災難數(shù)據(jù)庫的同樣方式建立中央數(shù)據(jù)庫,并將運行系統(tǒng)切換回中央數(shù)據(jù)庫,該次切換可做到數(shù)據(jù)無損失;l          立即對中央數(shù)據(jù)庫做數(shù)據(jù)庫全備份;l   

36、60;      重新建立災難備份環(huán)境,恢復容災系統(tǒng)532容災環(huán)境維護(中央數(shù)據(jù)庫結構發(fā)生變化)日常管理中,需對中央數(shù)據(jù)庫的歸檔日志(邏輯日志)目錄定期進行備份和清理,亦需清除災難備份數(shù)據(jù)庫的歸檔日志(邏輯日志)目錄中使用過的歸檔日志(邏輯日志)。在系統(tǒng)運行過程中,可能發(fā)生改變中央數(shù)據(jù)庫結構的情況,這時需要進行適當?shù)牟僮魇篂碾y備份數(shù)據(jù)庫跟上更新變化,保持數(shù)據(jù)庫結構的一致和同步:1 增加數(shù)據(jù)文件在中央數(shù)據(jù)庫上增加數(shù)據(jù)文件將產(chǎn)生相應的日志,當被施用到災難備份數(shù)據(jù)庫時控制文件中會加入此數(shù)據(jù)文件名,此時如災難備份數(shù)據(jù)庫能在相應目錄找到此數(shù)據(jù)文件,恢復操

37、作繼續(xù);否則會停止,在繼續(xù)恢復操作之前,需選擇以下操作:- 將此新數(shù)據(jù)文件拷貝到災難備份節(jié)點的相應目錄下;- 在災難備份數(shù)據(jù)庫上執(zhí)行命令Alter Database Create Datafile filename2 數(shù)據(jù)文件更名對中央數(shù)據(jù)庫的數(shù)據(jù)文件進行更名,需要刷新災難備份數(shù)據(jù)庫控制文件,或在對中央數(shù)據(jù)庫作該操作時亦對災難備份數(shù)據(jù)庫作類似操作,即可確保中央與災難備份數(shù)據(jù)庫的同步。3 修改聯(lián)機日志文件設置在對中央數(shù)據(jù)庫的聯(lián)機日志文件進行增加、刪除等操作后,都不會影響災難備份數(shù)據(jù)庫。但在中央數(shù)據(jù)庫上執(zhí)行命令Alter Database Clear Unarchived Logfile,或以Re

38、setlogs選項打開數(shù)據(jù)庫,則會使容災備份數(shù)據(jù)庫失效,因為容災備份數(shù)據(jù)庫無法得到進行恢復操作所需的歸檔日志文件,這時需要重新建立容災環(huán)境。4 修改控制文件若在中央數(shù)據(jù)庫上使用Create Controlfile命令執(zhí)行以下操作,將使容災數(shù)據(jù)庫的控制文件失效:- 改變聯(lián)機日志組或文件的最大數(shù)目參數(shù)- 改變數(shù)據(jù)文件的最大數(shù)目參數(shù)- 改變并發(fā)打開數(shù)據(jù)庫的實例的最大數(shù)目參數(shù)此時需要刷新災難備份數(shù)據(jù)庫控制文件。在中央數(shù)據(jù)庫上使用帶Resetlogs選項的Create Controlfile命令將在下一次打開中央數(shù)據(jù)庫時重置聯(lián)機日志,日志序列回到1,從而導致容災備份數(shù)據(jù)庫失效。5 數(shù)據(jù)庫啟動參數(shù)建議使中

39、央數(shù)據(jù)庫與災難備份數(shù)據(jù)庫的參數(shù)配置相同,以免因參數(shù)不同影響容災數(shù)據(jù)庫的性能甚至恢復操作的實現(xiàn)。6 刷新災難備份數(shù)據(jù)庫控制文件當中央數(shù)據(jù)庫控制文件發(fā)生改變時,依照以下步驟刷新災難備份數(shù)據(jù)庫的控制文件:- 停止災難備份數(shù)據(jù)庫的恢復操作- 關閉災難備份數(shù)據(jù)庫- 在中央數(shù)據(jù)庫上執(zhí)行命令Alter Database Create Standby Database Controlfile As filename 創(chuàng)建供災難備份數(shù)據(jù)庫使用的控制文件- 在中央數(shù)據(jù)庫上執(zhí)行命令Alter System Archive Log Current歸檔出當前日志- 將上兩步產(chǎn)生的控制文件及歸檔日志文件傳送至容災節(jié)點-

40、啟動災難備份數(shù)據(jù)庫在Nomount狀態(tài),執(zhí)行Alter Database Mount Standby Database使數(shù)據(jù)庫處于Mount狀態(tài)- 進行災難備份數(shù)據(jù)庫的正?;謴筒僮? 關于Unrecoverable操作產(chǎn)生的數(shù)據(jù)中央數(shù)據(jù)庫上用Unrecoverable選項操作(如Create Tableunrecoverable)產(chǎn)生的數(shù)據(jù)更新不生產(chǎn)日志,因此無法傳送到災難備份數(shù)據(jù)庫,此時只能采用以下三種方法之一:- 在災難備份數(shù)據(jù)庫中,使受該操作影響的數(shù)據(jù)文件處于Offline狀態(tài)。災難切換后,刪除災難備份數(shù)據(jù)庫中相應的表空間。該方法在允許損失此整個表空間數(shù)據(jù)時才能使用。- 重建容災環(huán)境-

41、在中央數(shù)據(jù)庫上備份該操作影響的表空間,歸檔當前的日志,傳送到容災節(jié)點后,開啟災難備份數(shù)據(jù)庫的恢復操作。注意:如在中央數(shù)據(jù)庫做了Unrecoverable操作,而未采用以上方法進行操作,仍在災難備份數(shù)據(jù)庫上進行正常恢復,將不會有錯誤信息提示,該錯誤信息將出現(xiàn)在數(shù)據(jù)庫日記中($ORACLE_BASE/admin/<sid>/bdump/alert_<sid>.log)。因此管理員必須定期檢查數(shù)據(jù)庫日記。533 優(yōu)缺點比較用數(shù)據(jù)庫功能實現(xiàn)遠程數(shù)據(jù)復制的優(yōu)點為:a)         

42、60;   支持廣域網(wǎng)協(xié)議,備份中心地點不受傳輸距離影響;b)            硬件軟件投資較少;缺點主要為:a) 傳輸歸檔日志或邏輯日志需占用主機資源(,內存,網(wǎng)絡等,具體指標未確定);b)              當災難發(fā)生時,業(yè)務無法在備份中心得到迅速恢復;c)     &#

43、160;        備份中心的數(shù)據(jù)無法快速恢復回主數(shù)據(jù)中心,從而應用無法快速切換回主中心運行;d)              無法實現(xiàn)非數(shù)據(jù)庫數(shù)據(jù)的遠程復制; 此種容災方式適合于只遠程備份數(shù)據(jù)庫數(shù)據(jù),傳輸距離較長(幾百公里以上),且網(wǎng)絡傳輸帶寬不大的用戶環(huán)境5.4鏡像軟件容災方式結構簡介利用操作系統(tǒng)層的鏡像軟件,如HP-UX MirrorDisk/UX,實現(xiàn)本地主數(shù)據(jù)中心的邏輯卷和遠

44、端備份數(shù)據(jù)中心的邏輯卷之間的實時同步數(shù)據(jù)復制當主數(shù)據(jù)中心發(fā)生突發(fā)性災難時,用戶可以通過在備份中心服務器上激活相應的卷組和邏輯卷,進而啟動備份中心服務器上的數(shù)據(jù)庫和應用系統(tǒng),從而實現(xiàn)業(yè)務系統(tǒng)災難恢復的目標 正常情況下,業(yè)務系統(tǒng)運行在主中心服務器上,數(shù)據(jù)存儲在主中心磁盤陣列中,同時在備份中心配置相同容量的磁盤陣列。主中心和備份中心的距離通常限制在10公里左右,主中心的服務器使用光纖通道卡通過光纖交換機和光纜分別連接兩個中心的磁盤陣列,利用服務器端的鏡像軟件對數(shù)據(jù)鏡像存儲。 在發(fā)生災難時最嚴重的損失就是數(shù)據(jù)本身的丟失,而磁盤鏡像要求向磁盤進行的每個物理寫操作都被復制到另一個地點的另一個磁盤

45、。因為復制是向磁盤進行的物理寫操作,所以它與應用程序無關。在主中心因故出現(xiàn)存儲陣列損壞、癱瘓時,備份中心的數(shù)據(jù)仍然完好。主中心的服務器仍能正常的訪問備份中心的數(shù)據(jù)。一旦主中心的磁盤陣列恢復后,可以在系統(tǒng)上使用磁盤重新鏡像的命令將數(shù)據(jù)進行同步,從而備份中心的陣列中的數(shù)據(jù)會拷貝到主中心的存儲陣列中。 鏡像軟件容災方式優(yōu)缺點比較優(yōu)點:·   可完全確保數(shù)據(jù)復制的完整性,一致性;·   容災結構相對簡單;·   對磁盤子系統(tǒng)透明,主備數(shù)據(jù)中心可采用不同的磁盤陣列設備缺點:· 

46、0; 遠程數(shù)據(jù)復制操作占用主機較多資源();·   主中心應用系統(tǒng)寫操作性能受主備中心傳輸距離影響較大;·   網(wǎng)絡連接和鏡像軟件故障將導致主中心業(yè)務系統(tǒng)的中止;·   備份中心更新數(shù)據(jù)無法快速恢復回主數(shù)據(jù)中心; 這種容災方式適用于對主機寫操作性能要求不高,而且業(yè)務系統(tǒng)可以忍受因光纖傳輸線路的臨時故障而導致業(yè)務中止的用戶環(huán)境5.5XP磁盤陣列容災方式結構簡介惠普公司XP陣列由 Continuous Access XP/XP Extension軟件提供完全的災難備份/恢復功能。 主數(shù)據(jù)中

47、心和備份數(shù)據(jù)中心的結構基本一致:采用HP XP系列磁盤陣列作為中心存儲,所有主機通過光纖與磁盤陣列相連。磁盤陣列上運行Continue Access XP容災軟件。主中心與備份中心之間的XP磁盤陣列物理上通過兩條光纖通道直聯(lián),采用XP磁盤陣列上的容災軟件Continue Access做到兩地數(shù)據(jù)實時同步。兩套磁盤陣列之間數(shù)據(jù)一致性依靠磁盤陣列本身的專用軟件(直接運行在磁盤陣列上)來完成,完全不依賴主機系統(tǒng),也不影響本地應用的響應速度。當配置了Continuous Access XP/XP Extension軟件的兩臺XP陣列分別處于兩數(shù)據(jù)中心時,通過光纖線路進行連接,主數(shù)據(jù)中心的XP存儲磁盤陣

48、列可以隨時自動將更新后的數(shù)據(jù)傳送至異地的備份XP存儲設備,以保持兩臺XP陣列數(shù)據(jù)的完全一致性。整個工作由XP陣列本身完成,對主機系統(tǒng)完全透明,不需占用任何主機資源。當主數(shù)據(jù)中心由于地震,火災等各種意外原因導致整個主中心核心業(yè)務系統(tǒng)崩潰時,異地備份系統(tǒng)將完全接管全部工作,在極短時間內,恢復業(yè)務系統(tǒng)的運行。客戶端也是災難備份恢復系統(tǒng)防護的對象,需要通過網(wǎng)絡連接到災難備份中心運行系統(tǒng)。災難備份中心運行系統(tǒng)具有重構運行環(huán)境的能力,在災難發(fā)生后替代生產(chǎn)中心行使運行系統(tǒng)職能,接受客戶端注冊和訪問,其運行環(huán)境和業(yè)務數(shù)據(jù)由備份服務器和備份數(shù)據(jù)系統(tǒng)提供。特點:傳統(tǒng)的災難備份系統(tǒng)主備機切換的過程為1) 

49、         主機發(fā)生故障2)          系統(tǒng)切換到備機3)          修復主機4)          關閉全套系統(tǒng)包括主機及備機5)        

50、  將系統(tǒng)從新切換回主機其中在第4個步驟中,用戶將不得不承受停機所帶來的損失。而惠普公司SureStore E Continuous Access XP/XP Extension軟件將使用戶避免這一損失,因為當系統(tǒng)從主機切換到備機后,備機將成為主機,修復后的“主機”成為備機使用。此方案最大的優(yōu)勢就是對主機應用完全透明,所有數(shù)據(jù)復制工作由磁盤陣列硬件層完成,不需修改應用,而且可以保證大量數(shù)據(jù)復制的性能。由于磁盤陣列數(shù)據(jù)復制原理是利用磁盤遠程鏡像功能,所以可以保證主數(shù)據(jù)中心關鍵業(yè)務數(shù)據(jù)和備份中心關鍵業(yè)務數(shù)據(jù)的完全一致,而且容災系統(tǒng)實現(xiàn)起來非常簡便。還可以充分利用現(xiàn)有服務器設備,實現(xiàn)應用系

51、統(tǒng)和重要數(shù)據(jù)的災難恢復功能。作為惠普公司成熟的災難備份恢復技術,此方案已經(jīng)在國內外許多用戶環(huán)境中成功實施過。其中包括上海熱線,大連電信,云南建行,湖南建行等災難備份恢復系統(tǒng)。由于XXXX的容災距離,用戶環(huán)境和業(yè)務需求也十分適合于使用磁盤陣列實現(xiàn)存儲硬件層的災難備份恢復方案,因此公司也向XXXX推薦這種容災方式而這種容災方案的主要限制就是由于在磁盤一級進行數(shù)據(jù)復制,對應用系統(tǒng)完全透明,所以相比應用層和數(shù)據(jù)庫層的容災方式,復制的數(shù)據(jù)量較大,對光纖數(shù)據(jù)鏈路傳輸質量和傳輸帶寬要求較高優(yōu)點:1、         

52、目前而言是所有異地容災方式中最為可靠和成熟的技術;2、          有磁盤陣列自身來完成,完全不影響主機的性能,也不依賴于操作系統(tǒng)的平臺,因此形式所有實現(xiàn)方式中性能最好,使用范圍最廣泛的一種;3、          通過磁盤陣列之間的專用互連完成通信,因此不占用局域網(wǎng)資源。缺點: 投資較大 551災難恢復系統(tǒng)硬件,軟件配置說明我們推薦數(shù)據(jù)中心的中心磁盤陣列采用HP的高性能全光纖通道交換式結構的磁盤陣列

53、XP512。為了適應當前數(shù)據(jù)中心越來越明顯的存儲中心化趨勢(即:存儲作為整套系統(tǒng)的關鍵,各種平臺的服務器作為存儲的外設),XP512與傳統(tǒng)的磁盤陣列相比已經(jīng)不是單純的硬盤堆疊,而是新一代的存儲+服務器結構。無論從它的硬件結構還是直接運行在XP512上的多種多樣的軟件都可以明顯的感覺到這一點。系統(tǒng)的數(shù)據(jù)存儲在主中心存儲磁盤陣列XP512中。同時在異地備份中心配置相同結構的存儲磁盤陣列XP。由于XXXX的容災環(huán)境距離為10公里左右,從數(shù)據(jù)復制的性能以及數(shù)據(jù)復制的完整性和一致性方面考慮,建議用戶在主中心和備份中心之間構建單模光纖線路用于傳輸備份數(shù)據(jù),并選用DWDM(密集波分復用)設備實現(xiàn)數(shù)據(jù)復制鏈路

54、的多路復用,從而提高數(shù)據(jù)復制的傳輸帶寬,并改善遠程數(shù)據(jù)傳輸性能。通過HP公司提供的災難備份恢復軟件(HP Continuous Access XP) 可以自動實現(xiàn)主中心存儲數(shù)據(jù)與備份中心數(shù)據(jù)的實時完整備份。在主數(shù)據(jù)中心,按照用戶要求,還可以配置磁帶備份服務器,用來安裝HP備份軟件Omniback II,以及Sure Store E磁帶庫。備份服務器直接連接到存儲陣列和磁帶庫,控制業(yè)務系統(tǒng)的日常數(shù)據(jù)的磁帶備份。 為確保用戶主數(shù)據(jù)中心的主機系統(tǒng)的負載分擔,容錯能力等功能,惠普公司提供了先進的,具有高度可靠性的群集結構。該結構可由兩臺或多臺HP 9000/800 系列高檔服務器組成,并通過LAN 和

55、共用硬盤構成協(xié)調、高效的群集結構。當Cluster中的某個節(jié)點出現(xiàn)異常(服務器硬件,系統(tǒng)軟件,應用程序和局域網(wǎng)故障等)時,MC/ServiceGuard可以及時發(fā)現(xiàn)故障節(jié)點,自動將故障節(jié)點的當前應用系統(tǒng)遷移到其它正常節(jié)點中,使之繼續(xù)進行正常的業(yè)務處理,并可自動隔離故障節(jié)點以便于技術人員的故障排除工作,從而消除核心業(yè)務系統(tǒng)中的單故障點。主數(shù)據(jù)中心的配置為:部件名稱數(shù)量說明XP512 1臺:高速數(shù)據(jù)緩存44塊x 4GB(每塊) =8GB磁盤柜1 73GB光纖磁盤8822組x 4(每組) x 73GB =6424GBHOT SPARE 磁盤222組x 4(每組) x 73GB =6424G

56、B指令內存2 主機接口卡2 Command View XP1不依賴于平臺的基于Web的控制管理軟件LUN Configuration XP1LUN配置、管理軟件存儲光纖交換機 2臺:光纖端口24  備份數(shù)據(jù)中心的配置為:部件名稱數(shù)量說明XP512 1臺:高速數(shù)據(jù)緩存44塊x 4GB(每塊) =8GB磁盤柜1 73GB光纖磁盤8822組x 4(每組) x 73GB =6424GBHOT SPARE 磁盤222組x 4(每組) x 73GB =6424GB指令內存2 主機接口卡2 Command View XP1不依賴于平臺的基

57、于Web的控制管理軟件LUN Configuration XP1LUN配置、管理軟件存儲光纖交換機 2臺:光纖端口24  552 XP CA軟件容災原理  XP (MCU)RCP  XP (RCU)服務器(主) 服務器(備)Fiber Channel連接CA磁盤卷組 拷貝方向SVPM-VOLRVOLRVOLLCPREMOTE CONTROLREMOTE CONTROL(TCP/IP)M-VOLSVP(TCP/IP)          (1)CA 磁 盤 卷

58、 組CA的磁盤卷組由不同的XP磁盤陣列裝置內或不同CLUSTER內命名為MVOL和RVOL的2個邏輯磁盤卷構成。在具有CA磁盤卷組關系后,MVOL被稱為主磁盤卷。MVOL可被讀/寫。RVOL(遠程磁盤卷)被稱為副磁盤卷。在XP磁盤陣列內部的控制裝置的作用下,MVOL的內容和服務器來的寫數(shù)據(jù)被拷貝到RVOL。CA卷組建立后,RVOL為只讀磁盤卷。在一個XP設備內部,既可有MVOL,也可有RVOL。這樣可以實現(xiàn)雙向的數(shù)據(jù)境像。 (2MCU 和RCUMCU(主磁盤控制器)和RCU(遠程磁盤控制器)分別和MVOL,RVOL相連,MCU控制由服務器來的寫向MVOL的數(shù)據(jù)的寫操作,還控制MVOL

59、和RVOL之間數(shù)據(jù)拷貝的操作。并且提供CA磁盤卷組的狀態(tài)和構成的管理。RCU執(zhí)行由MCU發(fā)出的寫命令操作。寫操作的執(zhí)行方法和執(zhí)行服務器來的寫操作過程相同。除此之外,RCU還具有管理一部分CA磁盤卷組的狀態(tài)和構成信息的能力。對于任何一個磁盤卷組,都需要定義MCU/RCU。一個XP設備的磁盤控制裝置在控制MVOL時,可作為MCU使用,當控制RVOL的時侯,又可作為RCU使用。(3)遠程備份的連接 MCU和RCU之間由專用光纖(ESCON)來連結。當光纖直聯(lián),不增加任何設備時,兩臺XP512之間最遠可相隔3KM。 在兩臺XP512之間加入ESCON的延長裝置(ESCONDIRECTOR或REPATE

60、R)可使磁盤陣列間的距離最大延長至43KM。如果使用E3或ATM遠程電信協(xié)議,在兩臺XP512之間將不會有距離的限制。加入ESCON延長裝置的連接圖如下圖所示: 通過ESCON光纖通道,MCU和RCU可相互進行數(shù)據(jù)傳送和控制命的傳送。在構筑CA時,考慮到消除單點故障的引患,兩臺XP512之間的ESCON光纖最低需要2根。這樣當一根光纖出現(xiàn)意外不能使用時,利用剩下的一根可完成MCU和RCU間的通信。不至引起系統(tǒng)數(shù)據(jù)傳輸?shù)闹袛唷?(4)Remote control Remote Control可完成CA的構成設定,卷組的狀態(tài)變更和表示。  553 高可靠性方案與高可用性方案的選擇當主運用

61、端發(fā)生不可恢復的數(shù)據(jù)損失后,遠地備份中心的鏡象磁盤卷R VOL里的數(shù)據(jù)與數(shù)據(jù)損失發(fā)生前的主中心磁盤卷MVOL的一致性往往會決定系統(tǒng)損失大小以及把主應用恢復到正常狀態(tài)所需時間。鏡象卷組間數(shù)據(jù)完全一致時,只要將遠地備份中心的數(shù)據(jù)拷回到主運用端起動修復程序便可恢復到正常業(yè)務處理。但是由于數(shù)據(jù)傳輸是通過ESCON及CNT進行, 并且路徑較遠,鏈路的中斷等原因都有可能造成鏡象卷組間數(shù)據(jù)不完全一致。在鏡象卷組失去同步時,主運用端發(fā)生不可恢復的數(shù)據(jù)損失后,將會造成部分數(shù)據(jù)丟失。當然,鏈路故障與主運用端同時發(fā)生損壞的可能性非常低?;谟脩粝到y(tǒng)是否有優(yōu)先保證在任何時候鏡象卷組都要一致的需要,CA XP提供兩種運

62、行方案:高可靠性方案與高可用性方案。·             高可靠性方案:在此方案中,將日志文件和表數(shù)據(jù)的更新拷貝模式都設為“DATA”。在這種拷貝模式下,在MVOL和RVOL鏡象卷組失去同步前,MCU會據(jù)絕服務器對MVOL發(fā)出的寫操作并發(fā)出寫錯誤信息。因此,MVOL和RVOL鏡象卷組的一致性得到保證。這種模式雖然提供了良好的一致性保證,但是對應用環(huán)境也有較高的要求。當兩條ESCON鏈路全部斷掉或者遠地備份中心的XP512因停電造成運行中斷等偶發(fā)性故障發(fā)生時,C

63、A XP鏡象卷組的M VOL的狀態(tài)變?yōu)椤癝USPEND”,MCU檢測出此狀態(tài)后為了保證鏡象卷組的一致性將禁止MVOL的寫操作即有可能中斷主運用端應用的正常運行。因此,此方案要求系統(tǒng)具有忍受應用暫時停止的能力。當由于MVOL以外的地方發(fā)生故障引起主運用端應用運行的中斷時,系統(tǒng)管理員又想繼續(xù)應用的進行,可以用命令刪除CA XP鏡象卷組的邏輯關系 ,使MVOL的狀態(tài)該變?yōu)椤癝IMPLEX”,開放對MVOL的寫操作。此后,主運用對MVOL的更新不會被反映到RVOL端,即鏡象卷組失去同步。鏡像失去同步后建議增加對在本地MVOL的在線BACKUP的頻度。高可靠性方案能夠保證MVOL和RVOL嚴格同步。但即

64、使主運用端不發(fā)生故障也有可能造成應用中斷。此方案適用于優(yōu)先磁盤卷組內容一致的系統(tǒng)運用,且此方案要求系統(tǒng)具有忍受應用暫時停止的能力。 ·             高可用性方案在此方案中,將日志文件與表數(shù)據(jù)的更新拷貝模式都設為“NEVER”。在這種拷貝模式下建立起來的CA XP鏡像卷組即使在光纖或RVOL故障引起 MVOL和RVOL鏡象卷組失去同步后,只要MVOL沒有遭到損壞,MCU就不會據(jù)絕服務器對MVOL發(fā)出的寫操作。從服務器端來看,MVOL對R VOL鏡象卷的數(shù)據(jù)更新象在正常進行,服務器的應用也不會被中斷。但是實際當光纖鏈路故障發(fā)生后,對RVOL的更新會被停止,MVOL里被更新的磁道會被標上標記,并且MCU向服務器和RETOME CONTROL發(fā)出磁盤卷組 異常信息的提示。當出現(xiàn)光纖、CNT、遠地備份中心XP512停電等故障時,因為不影響應用的運行,所以沒有必要象“DATA”那樣強制中斷CA XP卷組。在此期間M VOL的更新數(shù)據(jù)會被記錄下來。故障修復后,可用激活命令執(zhí)行MVOL更新部分的拷備再同步磁盤卷組。鏡像卷失去同步后建議增加對在本地M VOL的在線BACK

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論