




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、業(yè)務連續(xù)性容災解決方案兩地三中心解決方案技術(shù)白皮書業(yè)務連續(xù)性容災解決方案兩地三中心解決方案技術(shù)白皮書目錄 HYPERLINK l _bookmark0 概述7 HYPERLINK l _bookmark1 數(shù)據(jù)中心業(yè)務連續(xù)性的挑戰(zhàn)7 HYPERLINK l _bookmark2 方案概述7 HYPERLINK l _bookmark3 方案亮點7 HYPERLINK l _bookmark4 兩地三中心方案架構(gòu)9 HYPERLINK l _bookmark5 級聯(lián)組網(wǎng)架構(gòu)9 HYPERLINK l _bookmark7 同步+異步級聯(lián)方案9 HYPERLINK l _bookmark8 異步+
2、異步級聯(lián)方案10 HYPERLINK l _bookmark9 并聯(lián)組網(wǎng)架構(gòu)10 HYPERLINK l _bookmark11 同步+異步并聯(lián)方案10 HYPERLINK l _bookmark12 異步+異步并聯(lián)方案11 HYPERLINK l _bookmark13 雙活組網(wǎng)架構(gòu)11 HYPERLINK l _bookmark14 HyperMetro+異步級聯(lián)方案11 HYPERLINK l _bookmark16 2.4 關(guān)鍵組件技術(shù)實施要求12 HYPERLINK l _bookmark17 兩地三中心方案工作原理13 HYPERLINK l _bookmark18 同步+異步級聯(lián)
3、工作原理13 HYPERLINK l _bookmark19 初始同步處理13 HYPERLINK l _bookmark20 IO 處理流程14 HYPERLINK l _bookmark22 災難切換處理14 HYPERLINK l _bookmark23 災難恢復處理15 HYPERLINK l _bookmark24 鏈路和災備端故障處理15 HYPERLINK l _bookmark25 同步+異步并聯(lián)工作原理15 HYPERLINK l _bookmark26 初始同步處理15 HYPERLINK l _bookmark27 IO 處理流程16 HYPERLINK l _bookm
4、ark29 災難切換處理16 HYPERLINK l _bookmark30 災難恢復處理17 HYPERLINK l _bookmark31 鏈路和災備端故障17 HYPERLINK l _bookmark32 異步+異步級聯(lián)工作原理17 HYPERLINK l _bookmark33 初始同步處理17 HYPERLINK l _bookmark34 正常狀態(tài)處理18 HYPERLINK l _bookmark35 災難切換處理19 HYPERLINK l _bookmark36 災難恢復處理20 HYPERLINK l _bookmark37 鏈路和災備端故障20 HYPERLINK l
5、_bookmark38 異步+異步并聯(lián)工作原理20 HYPERLINK l _bookmark39 初始同步處理20 HYPERLINK l _bookmark40 正常狀態(tài)處理21 HYPERLINK l _bookmark41 災難切換處理22 HYPERLINK l _bookmark42 災難恢復處理23 HYPERLINK l _bookmark43 鏈路和災備端故障23 HYPERLINK l _bookmark44 HyperMetro+異步級聯(lián)工作原理23 HYPERLINK l _bookmark45 初始同步處理23 HYPERLINK l _bookmark46 正常狀態(tài)
6、處理24 HYPERLINK l _bookmark47 災難切換處理24 HYPERLINK l _bookmark48 災難恢復處理25 HYPERLINK l _bookmark49 鏈路和災備端故障26 HYPERLINK l _bookmark50 兩地三中心容災關(guān)鍵技術(shù)原理26 HYPERLINK l _bookmark54 容災管理29 HYPERLINK l _bookmark59 兩地三中心容災業(yè)務恢復流程32 HYPERLINK l _bookmark60 容災測試流程32 HYPERLINK l _bookmark62 計劃性遷移流程33 HYPERLINK l _boo
7、kmark64 故障切換流程34 HYPERLINK l _bookmark66 5 總結(jié)35 HYPERLINK l _bookmark67 6 縮略語36插圖目錄 HYPERLINK l _bookmark6 圖 2-1 級聯(lián)組網(wǎng)的兩地三中心容災架構(gòu)9 HYPERLINK l _bookmark10 圖 2-2 并聯(lián)組網(wǎng)的兩地三中心容災架構(gòu)10 HYPERLINK l _bookmark15 圖 2-3 HyperMetro+異步的兩地三中心容災架構(gòu)11 HYPERLINK l _bookmark21 圖 3-1 級聯(lián)組網(wǎng)(同步+異步)IO 處理流程14 HYPERLINK l _book
8、mark28 圖 3-2 并聯(lián)組網(wǎng)(同步+異步)IO 處理流程16 HYPERLINK l _bookmark52 圖 3-3 遠程復制狀態(tài)轉(zhuǎn)移圖27 HYPERLINK l _bookmark53 圖 3-4 Cache 多時間戳復制原理28 HYPERLINK l _bookmark55 圖 3-5 容災管理 DashBoard29 HYPERLINK l _bookmark56 圖 3-6 容災管理配置向?qū)?0 HYPERLINK l _bookmark57 圖 3-7 容災管理組網(wǎng)拓撲展示31 HYPERLINK l _bookmark58 圖 3-8 一鍵式災難恢復介紹31 HYPE
9、RLINK l _bookmark61 圖 4-1 一鍵式測試操作32 HYPERLINK l _bookmark63 圖 4-2 一鍵式計劃性遷移33 HYPERLINK l _bookmark65 圖 4-3 一鍵式故障切換34表格目錄 HYPERLINK l _bookmark51 表 3-1 遠程復制狀態(tài)描述26 1 概 述數(shù)據(jù)中心業(yè)務連續(xù)性的挑戰(zhàn)隨著信息化技術(shù)的飛速發(fā)展,信息系統(tǒng)在各種行業(yè)的關(guān)鍵業(yè)務中扮演著越來越重要的角色。在通訊、金融、醫(yī)療、電子商務、物流、政府等領(lǐng)域,信息系統(tǒng)業(yè)務中斷會導致巨大經(jīng)濟損失、影響品牌形象并可能導致重要數(shù)據(jù)丟失。因此,保證業(yè)務連續(xù)性是信息系統(tǒng)建設的關(guān)鍵。
10、近年來,大范圍自然災害時常發(fā)生,為保障業(yè)務連續(xù)性,同城災備中心結(jié)合異地災備中心的“兩地三中心”容災解決方案越來越受到業(yè)界重視和認可。方案概述兩地三中心容災解決方案中的“兩地三中心”一般指的是一個生產(chǎn)中心、一個同城災難備份中心、一個異地災難備份中心。生產(chǎn)中心的數(shù)據(jù)同步地復制到同城災難備份中心,同時,生產(chǎn)中心的數(shù)據(jù)異步地復制到異地災難備份中心。同城災備中心通常具備與生產(chǎn)中心等同業(yè)務處理能力,應用可在不丟失數(shù)據(jù)的情況下切換到同城災備中心運行,保持業(yè)務連續(xù)運行。在出現(xiàn)小概率的大范圍的災難時,如自然災害地震,造成同城災難備份中心與生產(chǎn)中心同時不可用,應用可以切換到異地災難備份中心。通過實施經(jīng)過日常災難演
11、練的步驟,應用可在業(yè)務容許的時間內(nèi),在異地的災難備份中心恢復,保證業(yè)務連續(xù)運行。但異地恢復通常會丟失少量的數(shù)據(jù)。相比僅建立同城災難備份中心或異地災難備份中心,“兩地三中心”的方式結(jié)合兩者的優(yōu)點,能夠適應更大范圍的災難場景,對于小范圍的區(qū)域性災難和較大范圍的自然災害,都能夠通過災難備份系統(tǒng)較快地響應,盡可能保全業(yè)務數(shù)據(jù)不丟失,實現(xiàn)更優(yōu)的RPO 和 RTO。所以,兩地三中心容災解決方案得到了廣泛的應用。方案亮點華為兩地三中心解決方案的亮點和優(yōu)勢如下:高中低端陣列復制技術(shù)互通華為全系列存儲產(chǎn)品都采用統(tǒng)一的存儲操作系統(tǒng)平臺,高、中、低端陣列之間都可建立遠程復制關(guān)系??蛻粼诋a(chǎn)品選型時,可以根據(jù)業(yè)務需要選
12、擇匹配的異地災備中心磁盤陣列,顯著提升容災建設投入產(chǎn)出比。秒級異步復制 RPO,分鐘級 RTO基于 Cache 多時間戳的異步遠程復制,最小支持 3s 的復制周期。華為容災管理軟件OceanStor BCManager 提供的一鍵式容災測試和容災切換功能大大簡化災備恢復操作, 使災備端數(shù)據(jù)庫的恢復時間達到分鐘級,縮短恢復時間。容災業(yè)務和拓撲可視化管理華為容災管理軟件 OceanStor BCManager 支持可視化展示兩地三中心的物理拓撲和業(yè)務邏輯拓撲。并且支持一鍵式容災測試和切換,支持客戶定制腳本一鍵恢復備用業(yè)務系統(tǒng),簡化災備系統(tǒng)的管理和維護。 2 兩地三中心方案架構(gòu)兩地三中心的容災方式是
13、當前容災建設的一個重要趨勢,在電信、金融、制造等領(lǐng)域得到廣泛的使用。通過建設近距離的數(shù)據(jù)中心(同城數(shù)據(jù)中心)獲得接近于零數(shù)據(jù)丟失的數(shù)據(jù)保護,通過建設較遠距離的數(shù)據(jù)中心(異地數(shù)據(jù)中心)獲得遠距離的數(shù)據(jù)保護,避免區(qū)域性的災難導致業(yè)務無法恢復。華為兩地三中心解決方案支持級聯(lián)組網(wǎng)(同步+異步,異步+ 異步)方案(即“A-B,B-C”組網(wǎng))、并聯(lián)組網(wǎng)(同步+異步,異步+異步)方案(即“A-B,A-C”組網(wǎng))和雙活組網(wǎng)(雙活+異步)方案(即“AB,B-C”組網(wǎng))。級聯(lián)組網(wǎng)架構(gòu)圖2-1 級聯(lián)組網(wǎng)的兩地三中心容災架構(gòu)同步+異步級聯(lián)方案如 HYPERLINK l _bookmark6 圖 2-1 所示,在生產(chǎn)中
14、心部署磁盤陣列 A;在同城災備中心部署磁盤陣列 B,兩個數(shù)據(jù)中心之間通過 FC 鏈路實現(xiàn)互聯(lián),生產(chǎn)中心的磁盤陣列 A 與同城災備中心磁盤陣列B 建立同步遠程復制,將磁盤陣列 A 的數(shù)據(jù)實時同步到磁盤陣列 B;在異地災備中心, 部署磁盤陣列 C,與同城災備中心的磁盤陣列 B 建立異步遠程復制,將磁盤陣列 B 的數(shù)據(jù)定時地同步到陣列 C。在同城災備中心和異地災備中心部署容災管理軟件,實現(xiàn)對 3 個數(shù)據(jù)中心的統(tǒng)一容災管理。容災管理軟件可以展示兩地三中心容災方案物理拓撲和業(yè)務邏輯拓撲,并且支持在同城災備中心以及異地災備中心一鍵式容災測試以及一鍵式容災恢復。異步+異步級聯(lián)方案如 HYPERLINK l
15、_bookmark6 圖 2-1 所示,在生產(chǎn)中心部署磁盤陣列 A;在同城災備中心部署磁盤陣列 B,兩個數(shù)據(jù)中心之間根據(jù)數(shù)據(jù)變化量對帶寬的需求,可以通過 FC 鏈路或者 IP 鏈路實現(xiàn)互聯(lián), 生產(chǎn)中心的磁盤陣列 A 與同城災備中心磁盤陣列 B 建立異步遠程復制,將磁盤陣列 A 的數(shù)據(jù)定時同步到磁盤陣列 B;在異地災備中心,部署磁盤陣列 C,與同城災備中心的磁盤陣列 B 建立異步遠程復制,將陣列 B 的數(shù)據(jù)定時的地同步到陣列 C。在同城災備中心和異地災備中心部署容災管理軟件,實現(xiàn)對 3 個數(shù)據(jù)中心的統(tǒng)一容災管理。容災管理軟件可以展示兩地三中心容災方案物理拓撲和業(yè)務邏輯拓撲,并且支持在同城災備中心
16、以及異地災備中心一鍵式容災測試以及一鍵式容災恢復。并聯(lián)組網(wǎng)架構(gòu)圖2-2 并聯(lián)組網(wǎng)的兩地三中心容災架構(gòu)同步+異步并聯(lián)方案如 HYPERLINK l _bookmark10 圖 2-2,在生產(chǎn)中心部署磁盤陣列 A;在同城災備中心部署磁盤陣列 B,兩個數(shù)據(jù)中心之間通過 FC 鏈路實現(xiàn)互聯(lián),生產(chǎn)中心的磁盤陣列 A 與同城災備中心磁盤陣列 B 建立同步遠程復制,將陣列 A 的數(shù)據(jù)實時同步到陣列 B;在異地災備中心,部署磁盤陣列 C,通過生產(chǎn)中心與異地災備中心的 IP 鏈路,實現(xiàn)生產(chǎn)中心的磁盤陣列 A 與異地災備中心磁盤陣列 C 建立異步遠程復制,異步地將數(shù)據(jù)同步到磁盤陣列 C。在同城災備中心和異地災備中
17、心部署容災管理軟件,實現(xiàn)對 3 個數(shù)據(jù)中心的統(tǒng)一容災管理。容災管理軟件可以展示兩地三中心容災方案物理拓撲和業(yè)務邏輯拓撲,并且支持在同城災備中心以及異地災備中心一鍵式容災測試以及一鍵式容災恢復。異步+異步并聯(lián)方案如 HYPERLINK l _bookmark10 圖 2-2,在生產(chǎn)中心部署磁盤陣列 A;在同城災備中心部署磁盤陣列 B,兩個數(shù)據(jù)中心之間根據(jù)數(shù)據(jù)變化量對帶寬的需求,可以通過 FC 鏈路或者 IP 鏈路實現(xiàn)互聯(lián),生產(chǎn)中心的磁盤陣列 A 與同城災備中心建立異步遠程復制,將磁盤陣列 A 的數(shù)據(jù)定時同步到磁盤陣列 B;在異地災備中心部署磁盤陣列 C,與生產(chǎn)中心的磁盤陣列建立異步遠程復制,將磁
18、盤陣列 A 的數(shù)據(jù)定時地同步到陣列 C。在同城災備中心和異地災備中心部署容災管理軟件,實現(xiàn)對 3 個數(shù)據(jù)中心的統(tǒng)一容災管理。容災管理軟件可以可視化的展示兩地三中心容災方案物理拓撲和業(yè)務邏輯拓撲, 并且支持在同城災備中心以及異地災備中心一鍵式容災測試以及一鍵式容災恢復。雙活組網(wǎng)架構(gòu)HyperMetro+異步級聯(lián)方案圖2-3 HyperMetro+異步的兩地三中心容災架構(gòu)如 HYPERLINK l _bookmark10 2-4,在生產(chǎn)中心 A 和生產(chǎn)中心 B 位于同城,可通過裸光纖或波分設備實現(xiàn) FC 網(wǎng)絡互聯(lián),也支持通過 10GE 網(wǎng)絡互聯(lián)。生產(chǎn)中心 A 和生產(chǎn)中心 B 同時對外提供業(yè)務,Hy
19、perMetro 不僅實現(xiàn)數(shù)據(jù)實時雙向鏡像,而且保證任何數(shù)據(jù)中心陣列故障,對上層業(yè)務透明切換,業(yè)務不中斷。在異地災備中心,部署磁盤陣列 C,與生產(chǎn)中心 A 或 B 任意磁盤陣列建立異步遠程復制,將雙活鏡像的磁盤陣列數(shù)據(jù)周期性的同步到磁盤陣列C。在生產(chǎn)中心 B 和異地災備中心部署容災管理軟件,實現(xiàn)對雙活+異步復制統(tǒng)一容災管理。容災管理軟件可以展示兩地三中心容災方案物理拓撲和業(yè)務邏輯拓撲,并且支持在異地災備中心一鍵式容災測試以及一鍵式容災恢復。2.4 關(guān)鍵組件技術(shù)實施要求城域網(wǎng)要求:(同步遠程復制,雙活)容災網(wǎng)絡距離:100km,雙活建議100km,裸光纖連接。傳輸延遲:業(yè)務的峰值寫 IO 帶寬。
20、廣域網(wǎng)要求:(異步遠程復制)容災網(wǎng)絡距離:無限制。傳輸延遲:業(yè)務的平均寫 IO 帶寬。管理工作站:管理工作站需要三中心間通信。網(wǎng)絡距離要求:無限制。通信網(wǎng)絡帶寬要求:10Mb/s。 3 兩地三中心方案工作原理同步+異步級聯(lián)工作原理初始同步處理同步遠程復制關(guān)系建立時,系統(tǒng)自動啟動初始同步,將主 LUN 的數(shù)據(jù)全部復制到從LUN,復制期間,主 LUN 如果接收到生產(chǎn)主機新寫入的數(shù)據(jù),也會將其復制到從LUN。初始同步完成后,主 LUN 與從 LUN 的數(shù)據(jù)完全一致,同步遠程復制進入正常狀態(tài)。遠程復制關(guān)系建立時,系統(tǒng)自動啟動初始同步,將主 LUN 的數(shù)據(jù)全部復制到從 LUN。初始同步完成后,異步遠程復
21、制進入正常狀態(tài)。IO 處理流程圖3-1 級聯(lián)組網(wǎng)(同步+異步)IO 處理流程級聯(lián)組網(wǎng)(同步+異步)方案 IO 處理流程如上圖所示:主機下發(fā) IO 到磁盤陣列 A 的 LUN1。IO 寫入 A 站點的 LUN1,并通過同步復制同時寫入 B 站點的 LUN12(LUN12 既是同步遠程復制的從 LUN,又是異步遠程復制的主 LUN)。當異步遠程復制同步周期到來,磁盤陣列 B 生成 LUN12 在此時間點的數(shù)據(jù)(如 t1時間點數(shù)據(jù))。磁盤陣列 C 生成同步開始前 LUN2 的該時間點數(shù)據(jù)(如 t2 時間點數(shù)據(jù))。如果異步遠程復制同步失敗,當需要使用 LUN2 運行業(yè)務時,系統(tǒng)自動回滾到該時間點數(shù)據(jù),
22、以保證磁盤陣列 C 中數(shù)據(jù)的可用性。后臺啟動由 LUN12 在 t1 時間點的數(shù)據(jù)到 LUN2 的周期性同步。如果在異步遠程復制啟動同步時,同步遠程復制的從 LUN(LUN12)狀態(tài)不允許啟動同步,則周期性同步不會被啟動,直到從 LUN 狀態(tài)允許啟動同步時才生成多時間點數(shù)據(jù),并啟動同步。災難切換處理1)生產(chǎn)中心故障當生產(chǎn)中心發(fā)生災難后,不能再提供業(yè)務。同城災備中心的從 LUN 保存著與主 LUN 完全同步的數(shù)據(jù),保障數(shù)據(jù)不丟失。如果同城災備中心部署有備用主機,則備用主機可以訪問從 LUN,接管業(yè)務。從 LUN 開始被主機訪問后,每次收到新寫入的數(shù)據(jù),遠程復制會自動記錄其地址,以便用于后續(xù)增量恢
23、復,縮短業(yè)務回切的時間。2)生產(chǎn)中心和同城災備中心同時故障當生產(chǎn)中心和同城災備中心在重大災難導致數(shù)據(jù)都不可用時,異地備中心的從 LUN 保存著與主 LUN 相隔一定時間周期(1-2 個復制周期)之前的數(shù)據(jù),保障數(shù)據(jù)絕大部分不丟失。如果異地同城災備中心部署有備用主機,則備用主機可以訪問從 LUN,接管業(yè)務。異地災備中心從 LUN 開始被主機訪問后,每次收到新寫入的數(shù)據(jù),遠程復制會自動記錄其地址,以便用于后續(xù)增量恢復,縮短業(yè)務回切的時間。災難恢復處理1)數(shù)據(jù)未被破壞時當生產(chǎn)中心災難恢復后,如果磁盤陣列 A 和 B 沒有受到破壞,主 LUN 能夠恢復其原有數(shù)據(jù),則遠程復制可以將主 LUN 故障期間,
24、從 LUN 12 或者 LUN2 新寫入的數(shù)據(jù)增量復制到主 LUN。復制完成后,主、從 LUN 保持復制關(guān)系。此時,可以將業(yè)務切換回生產(chǎn)中心,重新由生產(chǎn)主機訪問磁盤陣列 A 的主 LUN,遠程復制重新保持由主LUN 向從 LUN 實時同步數(shù)據(jù)。2)數(shù)據(jù)完全被破壞時當磁盤陣列 A 或 B 被破壞,數(shù)據(jù)不可修復時,需要重建磁盤陣列 A 或者磁盤陣列 B, 將從端數(shù)據(jù)反向復制到主端 B 和主端 A 上,調(diào)整主從關(guān)系,在生產(chǎn)中心恢復業(yè)務。鏈路和災備端故障處理當生產(chǎn)中心與同城災備中心的復制鏈路故障或者任意災備中心設備故障,則遠程復制自動斷開復制,不影響生產(chǎn)系統(tǒng)的正常運行。生產(chǎn)中心主 LUN 將記錄故障期
25、間的數(shù)據(jù)差異變化,待故障恢復后,自動將增量數(shù)據(jù)同步到從 LUN。同步+異步并聯(lián)工作原理初始同步處理同步遠程復制關(guān)系建立時,系統(tǒng)自動啟動初始同步,將主 LUN 的數(shù)據(jù)全部復制到從LUN,復制期間,主 LUN 如果接收到新的生產(chǎn)主機的寫入的數(shù)據(jù),也會將其復制到從LUN。初始同步完成后,主 LUN 與從 LUN 的數(shù)據(jù)完全一致,同步遠程復制進入正常狀態(tài)。異步遠程復制關(guān)系建立時,系統(tǒng)自動啟動初始同步,將主 LUN 的數(shù)據(jù)全部復制到從LUN。初始同步完成后,異步遠程復制進入正常狀態(tài)。IO 處理流程圖3-2 并聯(lián)組網(wǎng)(同步+異步)IO 處理流程具體的處理流程如下:主機下發(fā) IO 到磁盤陣列 A 的 LUN
26、1。A 站點主機寫 IO 雙寫到 LUN1 和 B 站點 LUN12(LUN1 既是同步遠程復制的主LUN,又是異步遠程復制的主 LUN)。當異步遠程復制同步周期到來,磁盤陣列 A 生成 LUN1 在此時間點的數(shù)據(jù)(如 t1時間點數(shù)據(jù))。磁盤陣列 C 生成 LUN2 的該時間點數(shù)據(jù)(如 t2 時間點數(shù)據(jù))。如果異步遠程復制同步失敗,當需要使用 LUN2 運行業(yè)務時,系統(tǒng)自動回滾到該時間點數(shù)據(jù),以保證磁盤陣列 C 中數(shù)據(jù)的可用性。后臺啟動由 LUN1 在 t1 時間點的數(shù)據(jù)到 LUN2 的周期性同步。災難切換處理1)生產(chǎn)中心故障當生產(chǎn)中心發(fā)生災難后,不能再提供業(yè)務。同城災備中心的從 LUN 保存
27、著與主 LUN 完全同步的數(shù)據(jù),保障數(shù)據(jù)不丟失。如果同城災備中心部署有備用主機,則備用主機可以訪問從 LUN,接管業(yè)務。從 LUN 開始被主機訪問后,每次收到新寫入的數(shù)據(jù),遠程復制會自動記錄其地址,以便用于后續(xù)增量恢復,縮短業(yè)務回切的時間。2)生產(chǎn)中心和同城災備中心同時故障當生產(chǎn)中心和同城災備中心在遭遇重大災難導致數(shù)據(jù)均不可用時,異地災備中心的從LUN 保存著與主 LUN 間隔一定時間周期(復制周期)之前的數(shù)據(jù),保障數(shù)據(jù)絕大部分不丟失。如果異地同城災備中心部署有備用主機,則備用主機可以訪問從 LUN,接管業(yè)務。異地災備中心從 LUN 開始被主機訪問后,每次收到新寫入的數(shù)據(jù),遠程復制會自動記錄其
28、地址,以便用于后續(xù)增量恢復,縮短業(yè)務回切的時間。災難恢復處理1)數(shù)據(jù)未被破壞時當生產(chǎn)中心災難恢復后,如果磁盤陣列 A 和 B 沒有受到破壞,主 LUN 能夠恢復其原有數(shù)據(jù),則遠程復制可以將主 LUN 故障期間,從 LUN 1新寫入的數(shù)據(jù)增量復制到主LUN。復制完成后,主、從 LUN 保持復制關(guān)系。此時,可以將業(yè)務切換回生產(chǎn)中心, 重新由生產(chǎn)主機訪問磁盤陣列 A 的主 LUN,遠程復制重新保持由主 LUN 向從 LUN 實時同步數(shù)據(jù)。2)數(shù)據(jù)完全被破壞時當磁盤陣列 A 或 B 被破壞,數(shù)據(jù)不可修復時,需要重建磁盤陣列 A 或者磁盤陣列 B, 將從端數(shù)據(jù)反向復制到主端磁盤陣列 A 和磁盤陣列 B
29、上,調(diào)整主從關(guān)系,在生產(chǎn)中心恢復業(yè)務。鏈路和災備端故障當生產(chǎn)中心與災備中心的復制鏈路故障或者災備中心存儲設備故障,則遠程復制自動斷開復制,不影響生產(chǎn)系統(tǒng)的正常運行。生產(chǎn)中心主 LUN 將記錄故障期間的數(shù)據(jù)差異變化,待故障恢復后,自動將增量數(shù)據(jù)同步到從 LUN。異步+異步級聯(lián)工作原理初始同步處理生產(chǎn)中心與同城災備中心異步復制主從 LUN 之間和同城災備中心與異地災備中心異步復制主從 LUN 之間都需要進行初始同步,初始同步可以在線進行。復制帶寬足夠的情況下可以配置完就啟動初始同步,帶寬不足情況下,可以有幾種初始同步方式:1.臨時增加復制帶寬完成初始同步。2.將設備搬遷到一起來完成初始同步。3.通
30、過移動介質(zhì)存儲中轉(zhuǎn)進行初始同步。異步復制初始同步系統(tǒng)自動創(chuàng)建快照,將主 LUN 數(shù)據(jù)全部復制到從 LUN,復制期間新增數(shù)據(jù)不會復制到從 LUN 中。正常狀態(tài)處理具體處理流程如下:主機下發(fā) IO 到存儲系統(tǒng) A 的 LUN1。LUN2 和 LUN3 分別是 LUN1 不同時間點的副本,LUN3 的數(shù)據(jù)副本比 LUN2 的數(shù)據(jù)副本時間要早。LUN2 既是存儲系統(tǒng) A 與存儲系統(tǒng) B 異步遠程復制的從 LUN, 又是存儲系統(tǒng) B 與存儲系統(tǒng) C 異步遠程復制的主 LUN),B 站點、C 站點 LUN 對于主機默認均為只讀。當 A-B 異步遠程復制同步周期到來,存儲系統(tǒng) A 生成 LUN1 在此時間點
31、的數(shù)據(jù)(如 t1 時間點數(shù)據(jù))。存儲系統(tǒng) B 生成同步開始前 LUN2 的多時間點數(shù)據(jù)(如 t2 時間點數(shù)據(jù))。如果異步遠程復制同步失敗,當需要使用 LUN2 運行業(yè)務時,系統(tǒng)自動回滾多時間點數(shù)據(jù),以保證存儲系統(tǒng) B 中數(shù)據(jù)的可用性。當 B-C 異步遠程復制同步周期到老,存儲系統(tǒng) B 生成 LUN2 在此時間點的數(shù)據(jù)(如 t2 時間點數(shù)據(jù))后臺啟動由 LUN1 在 t1 時間點的數(shù)據(jù)到 LUN2 的周期性同步。存儲系統(tǒng) C 生成同步開始前 LUN3 的多時間點數(shù)據(jù)(如臺 t3 時間點數(shù)據(jù))。如果異步復制失敗,當需要使用 LUN3 運行業(yè)務時,系統(tǒng)自動回滾多時間點數(shù)據(jù)。后臺啟動由 LUN2 在
32、t2 時間點的數(shù)據(jù)到 LUN3 的周期性同步。異步復制處理過程如下:主 LUN1 的寫 IO 處理在周期 N,將新寫入主 LUN 的數(shù)據(jù)寫入 Cache 中。在下一個周期 N+1,將周期 N 緩存的數(shù)據(jù)復制到從 LUN2,同時將周期 N+1 新收到的寫數(shù)據(jù)繼續(xù)寫入 Cache 中。數(shù)據(jù)復制完成后,進入下一周期。按照步驟 2)重復進行。從 LUN 2 的寫 IO 處理周期 N 開始時,對從 LUN 進行快照 activating,即對周期 N-1 的數(shù)據(jù)在 Cache 和存儲介質(zhì)中進行快照 activating。在周期 N 中,接收由主 LUN 同步而來的數(shù)據(jù),寫入從 LUN 的 Cache。該
33、周期復制完成后,disable 從 LUN 的快照。從 LUN3 的寫 IO 處理周期 N-1 開始時,對從 LUN 進行 activating,即對周期 N-2 的數(shù)據(jù)在 Cache 和存儲介質(zhì)中進行快照 activating在周期 N-1 中,接收由主 LUN 同步而來的數(shù)據(jù),寫入從 LUN 的 Cache。該周期復制完成后,Disable 從 LUN 的快照。如果主 LUN 的寫 IO 帶寬臨時性增大,或者陣列間鏈路帶寬臨時減小使得復制周期變長,導致周期內(nèi)寫入數(shù)據(jù)過多,超過了 Cache 所能緩存的寫數(shù)據(jù)量,則遠程復制會采用日志對超出部分進行記錄,不會中斷周期性同步。遠程復制會嚴格保證從
34、 LUN 的數(shù)據(jù)一致性,即寫 IO 的依賴關(guān)系。在主 LUN 的 IO 處理中,在每次周期間切換時,遠程復制會保證將有依賴關(guān)系的兩個寫 IO 納入同一個周期,或者按照其順序分別納入先、后周期,不會出現(xiàn)先寫入的 IO 納入后一周期,而后寫入的 IO 納入前一周期的情況。在從 LUN 的 IO 處理中,當主 LUN 故障后需要訪問從 LUN 時,遠程復制會檢查從 LUN 是否完成當前周期的復制,如果沒有完成,則使用快照對從 LUN 進行回滾,使其數(shù)據(jù)保證為周期切換點時的狀態(tài),保證其數(shù)據(jù)一致性。通過 Cache 中的異步復制,最高可以實現(xiàn) 16s 的秒級 RPO 的數(shù)據(jù)災備要求。災難切換處理1)生產(chǎn)
35、中心故障當生產(chǎn)中心發(fā)生災難后,不能再提供業(yè)務。同城災備中心的從 LUN 保存著與主 LUN 較近時間點的數(shù)據(jù),保障盡量少的數(shù)據(jù)丟失。如果同城災備中心部署有備用主機,則備用主機可以訪問從 LUN,接管業(yè)務,實現(xiàn)最短的業(yè)務恢復。從 LUN 開始被主機訪問后,每次收到新寫入的數(shù)據(jù),遠程復制會自動記錄其地址,以便用于后續(xù)增量恢復,縮短業(yè)務回切的時間。2)生產(chǎn)中心和同城災備中心都故障當生產(chǎn)中心和同城中心在重大災難或者都故障后,異地備中心的從 LUN 保存著與主LUN 間隔一定時間周期(復制周期)之前的數(shù)據(jù),保障數(shù)據(jù)絕大部分不丟失。如果異地同城災備中心部署有備用主機,則備用主機可以訪問從 LUN,接管業(yè)務
36、。異地災備中心從 LUN 開始被主機訪問后,每次收到新寫入的數(shù)據(jù),遠程復制會自動記錄其地址, 以便用于后續(xù)增量恢復,縮短業(yè)務回切的時間。災難恢復處理數(shù)據(jù)未被破壞時當生產(chǎn)中心災難恢復后,如果存儲系統(tǒng) A 和 B 沒有受到破壞,主 LUN 能夠恢復其原有數(shù)據(jù),則遠程復制可以將主 LUN 故障期間,從 LUN 1新寫入的數(shù)據(jù)增量復制到主LUN。復制完成后,主、從 LUN 保持復制關(guān)系。此時,可以將業(yè)務切換回生產(chǎn)中心, 重新由生產(chǎn)主機訪問存儲陣列 A 的主 LUN,遠程復制重新保持由主 LUN 向從 LUN 實時同步數(shù)據(jù)。數(shù)據(jù)完全被破壞時當存儲系統(tǒng) A 或 B 被破壞,數(shù)據(jù)不可修復時,需要重建存儲系統(tǒng)
37、 A 或者存儲系統(tǒng) B, 將從端數(shù)據(jù)反向復制到主端存儲系統(tǒng) A 和存儲系統(tǒng) B 上,調(diào)整主從關(guān)系,在生產(chǎn)中心恢復業(yè)務。鏈路和災備端故障當生產(chǎn)中心與災備中心的復制鏈路故障或者災備中心設備故障,則遠程復制自動斷開復制,不影響生產(chǎn)系統(tǒng)的正常運行。生產(chǎn)中心主 LUN 將記錄故障期間的數(shù)據(jù)差異變化, 待故障恢復后,自動將增量數(shù)據(jù)同步到從 LUN。異步+異步并聯(lián)工作原理初始同步處理生產(chǎn)中心與同城災備中心異步復制主從 LUN 之間和同城災備中心與異地災備中心異步復制主從 LUN 之間都需要進行初始同步,初始同步可以在線進行。復制帶寬足夠的情況下可以配置完就啟動初始同步,帶寬不足情況下,可以有幾種初始同步方式
38、:1.臨時增加復制帶寬完成初始同步。2.將設備搬遷到一起來完成初始同步。3.通過移動介質(zhì)存儲中轉(zhuǎn)進行初始同步。異步復制初始同步系統(tǒng)自動創(chuàng)建快照,將主 LUN 數(shù)據(jù)全部復制到從 LUN,復制期間新增數(shù)據(jù)不會復制到從 LUN 中。正常狀態(tài)處理具體處理流程如下:主機下發(fā) IO 到存儲系統(tǒng) A 的 LUN1。 LUN2 和 LUN3 分別是 LUN1 不同時間點的副本,LUN3 的數(shù)據(jù)副本一般比 LUN2的數(shù)據(jù)副本時間要早(如果 LUN2 是 10 點的,LUN3 可能是 9 點的數(shù)據(jù))。LUN1 既是存儲系統(tǒng) A 與存儲系統(tǒng) B 異步遠程復制的主 LUN,又是存儲系統(tǒng) A 與存儲系統(tǒng) C 異步遠程復
39、制的主 LUN),B 站點、C 站點 LUN 對于主機默認均為只讀。當 A-B 異步遠程復制同步周期到來,存儲系統(tǒng) A 生成 LUN1 在此時間點的數(shù)據(jù)(如 t1 時間點數(shù)據(jù))。存儲系統(tǒng) B 生成同步開始前 LUN2 的多時間點數(shù)據(jù)(如 t2 時間點數(shù)據(jù))。如果異步遠程復制同步失敗,當需要使用 LUN2 運行業(yè)務時,系統(tǒng)自動回滾多時間點數(shù)據(jù),以保證存儲系統(tǒng) B 中數(shù)據(jù)的可用性。當 B-C 異步遠程復制同步周期到老,存儲系統(tǒng) B 生成 LUN2 在此時間點的數(shù)據(jù)(如 t2 時間點數(shù)據(jù))后臺啟動由 LUN1 在 t1 時間點的數(shù)據(jù)到 LUN2 的周期性同步。當 A-C 異步遠程復制同步周期到來,存
40、儲系統(tǒng) A 生成 LUN1 在此時間點的數(shù)據(jù)(如 t3 時間點數(shù)據(jù))存儲系統(tǒng) C 生成同步開始前 LUN3 的多時間點數(shù)據(jù)(如臺 t4 時間點數(shù)據(jù))。如果異步復制失敗,當需要使用 LUN3 運行業(yè)務時,系統(tǒng)自動回滾多時間點數(shù)據(jù)。后臺啟動由 LUN1 在 t3 時間點的數(shù)據(jù)到 LUN3 的周期性同步。異步復制處理過程如下:主 LUN1 的寫 IO 處理在周期 N,將新寫入主 LUN 的數(shù)據(jù)寫入 Cache 中。在下一個周期 N+1,將周期 N 緩存的數(shù)據(jù)復制到從 LUN12,同時將周期 N+1 新收到的寫數(shù)據(jù)繼續(xù)寫入 Cache 中。數(shù)據(jù)復制完成后,進入下一周期。按照步驟 2)重復進行。從 LU
41、N 1的寫 IO 處理周期 N 開始時,對從 LUN 進行快照 activating,即對周期 N-1 的數(shù)據(jù)在 Cache 和存儲介質(zhì)中進行快照 activating。在周期 N 中,接收由主 LUN 同步而來的數(shù)據(jù),寫入從 LUN 的 Cache。該周期復制完成后,disable 從 LUN 的快照。從 LUN2 的寫 IO 處理周期 N-1 開始時,對從 LUN 進行 activating,即對周期 N-2 的數(shù)據(jù)在 Cache 和存儲介質(zhì)中進行快照 activating在周期 N-1 中,接收由主 LUN 同步而來的數(shù)據(jù),寫入從 LUN 的 Cache。該周期復制完成后,Disable
42、 從 LUN 的快照。如果主 LUN 的寫 IO 帶寬臨時性增大,或者陣列間鏈路帶寬臨時減小使得復制周期變長,導致周期內(nèi)寫入數(shù)據(jù)過多,超過了 Cache 所能緩存的寫數(shù)據(jù)量,則遠程復制會采用日志對超出部分進行記錄,不會中斷周期性同步。遠程復制會嚴格保證從 LUN 的數(shù)據(jù)一致性,即寫 IO 的依賴關(guān)系。在主 LUN 的 IO 處理中,在每次周期間切換時,遠程復制會保證將有依賴關(guān)系的兩個寫 IO 納入同一個周期,或者按照其順序分別納入先、后周期,不會出現(xiàn)先寫入的 IO 納入后一周期,而后寫入的 IO 納入前一周期的情況。在從 LUN 的 IO 處理中,當主 LUN 故障后需要訪問從 LUN 時,遠
43、程復制會檢查從 LUN 是否完成當前周期的復制,如果沒有完成,則使用快照對從 LUN 進行回滾,使其數(shù)據(jù)保證為周期切換點時的狀態(tài),保證其數(shù)據(jù)一致性。通過 Cache 中的異步復制,最高可以實現(xiàn) 16s 的秒級 RPO 的數(shù)據(jù)災備要求。災難切換處理1)生產(chǎn)中心故障當生產(chǎn)中心發(fā)生災難后,不能再提供業(yè)務。同城災備中心的從 LUN 保存著與主 LUN 較短時間間隔的數(shù)據(jù),保障盡量少的數(shù)據(jù)丟失,RPO 可達 06s,如果同城災備中心部署有備用主機,則備用主機可以訪問從 LUN,接管業(yè)務,保證最短時間的業(yè)務接管。從 LUN 開始被主機訪問后,每次收到新寫入的數(shù)據(jù),遠程復制會自動記錄其地址,以便用于后續(xù)增量
44、恢復,縮短業(yè)務回切的時間。2)生產(chǎn)中心和同城災備中心都故障當生產(chǎn)中心和同城中心在重大災難或者都故障后,異地備中心的從 LUN 保存著與主LUN 間隔一定時間周期(復制周期)之前的數(shù)據(jù),保障數(shù)據(jù)絕大部分不丟失。如果異地同城災備中心部署有備用主機,則備用主機可以訪問從 LUN,接管業(yè)務。異地災備中心從 LUN 開始被主機訪問后,每次收到新寫入的數(shù)據(jù),遠程復制會自動記錄其地址, 以便用于后續(xù)增量恢復,縮短業(yè)務回切的時間。災難恢復處理數(shù)據(jù)未被破壞時當生產(chǎn)中心災難恢復后,如果存儲系統(tǒng) A 和 B 沒有受到破壞,主 LUN 能夠恢復其原有數(shù)據(jù),則遠程復制可以將主 LUN 故障期間,從 LUN 1新寫入的數(shù)
45、據(jù)增量復制到主LUN。復制完成后,主、從 LUN 保持復制關(guān)系。此時,可以將業(yè)務切換回生產(chǎn)中心, 重新由生產(chǎn)主機訪問存儲陣列 A 的主 LUN,遠程復制重新保持由主 LUN 向從 LUN 實時同步數(shù)據(jù)。數(shù)據(jù)完全被破壞時當存儲系統(tǒng) A 或 B 被破壞,數(shù)據(jù)不可修復時,需要重建存儲系統(tǒng) A 或者存儲系統(tǒng) B, 將從端數(shù)據(jù)反向復制到主端存儲系統(tǒng) A 和存儲系統(tǒng) B 上,調(diào)整主從關(guān)系,在生產(chǎn)中心恢復業(yè)務。鏈路和災備端故障當生產(chǎn)中心與災備中心的復制鏈路故障或者災備中心設備故障,則遠程復制自動斷開復制,不影響生產(chǎn)系統(tǒng)的正常運行。生產(chǎn)中心主 LUN 將記錄故障期間的數(shù)據(jù)差異變化, 待故障恢復后,自動將增量數(shù)
46、據(jù)同步到從 LUN。HyperMetro+異步級聯(lián)工作原理HyperMetro 支持通過異步級聯(lián)和異步并聯(lián)兩種模式組成 3DC,技術(shù)原理上比較類似,下面介紹HyperMetro+異步級聯(lián)模式的工作原理。初始同步處理HyperMetro+異步復制初始同步主要包括雙活數(shù)據(jù)中心之間初始同步和雙活到異地災備中心異步復制主從 LUN 之間的初始同步。HyperMetro 雙活站點間推薦 FC 互聯(lián),可直接通過配置完成初始同步,與異地容災中心根據(jù)互聯(lián)帶寬的情況可選擇下面幾種初始同步方式的一種完成初始同步。1.臨時增加復制帶寬完成初始同步。2.將設備搬遷到一起來完成初始同步。3.通過移動介質(zhì)存儲中轉(zhuǎn)進行初始
47、同步。異步復制初始同步系統(tǒng)自動創(chuàng)建快照,將主 LUN 數(shù)據(jù)全部復制到從 LUN,復制期間新增數(shù)據(jù)不會復制到從 LUN 中。正常狀態(tài)處理HyperMtro 雙活+異步復制的寫 I/O 流程如下:寫請求到雙活 LUN;雙活 LUN 將寫請求雙寫到兩中心的雙活數(shù)據(jù) LUN;雙活數(shù)據(jù) LUN 返回寫操作完成;雙活數(shù)據(jù) LUN 返回寫 I/O 操作完成周期性的啟動異步模式,主端創(chuàng)建時間戳快照,并通知災備中心創(chuàng)建也創(chuàng)建時間戳快照增量數(shù)據(jù)復制完成后,異地災備中心陣列創(chuàng)建時間戳快照(用于復制過程中,出現(xiàn)任何異常,可在災備中心拉起業(yè)務)將增量數(shù)據(jù)復制到異地災備中心增量數(shù)據(jù)復制完成后,異地災備中心從 LUN 置為
48、數(shù)據(jù)完整狀態(tài),復制置為正常關(guān)系通過雙活+陣列復制的兩地三中心可實現(xiàn)同城業(yè)務 RPO=0,RTO=0,對異地災備中心通過多時間點技術(shù)可實現(xiàn)秒級 RPO,通過容災一鍵式恢復,可實現(xiàn) RTO 分鐘級。災難切換處理雙活+異步復制的災難切換分成生產(chǎn)中心 A、生產(chǎn)中心 B 和生產(chǎn)中心 A 和 B 均故障時的切換處理。1)生產(chǎn)中心 A 故障當生產(chǎn)中心 A 發(fā)生災難后,生產(chǎn)中心 B 自動接管業(yè)務,生產(chǎn)中心 B 記錄與生產(chǎn)中心 A的數(shù)據(jù)差異,與災備中心的異步復制不受影響。當生產(chǎn)中心 A 的存儲設備可修復并且雙活數(shù)據(jù) LUN 和雙活配置都正常的情況下,生產(chǎn)中心 B 將故障期間的差量數(shù)據(jù)復制到生產(chǎn)中心 A,直到雙活
49、工作狀態(tài)全部恢復正常。2)生產(chǎn)中心 B 故障當生產(chǎn)中心 B 與異地災備中心實現(xiàn)異步復制時,生產(chǎn)中心 B 發(fā)生災難后,不影響生產(chǎn)業(yè)務的接管。由于生產(chǎn)中心與異地災備中心通過異步復制容災,生產(chǎn)中心 B 發(fā)生災難后,生產(chǎn)系統(tǒng)當前的數(shù)據(jù)無法繼續(xù)異步復制到異地。當生產(chǎn)中心 B 在可修復并且雙活數(shù)據(jù) LUN 和雙活配置都正常的情況下,修復后自動將差異數(shù)據(jù)同步到生產(chǎn)中心 B 磁盤陣列中,異步復制繼續(xù)增量復制到異地災備中心。當生產(chǎn)中心 B 無法修復的條件下,雙活需要重新初始同步鏡像數(shù)據(jù),并重新初始復制到異地災備中心。3)生產(chǎn)中心 A 和生產(chǎn)中心 B 都故障當生產(chǎn)中心 A 和生產(chǎn)中心 B 分布較近,在重大災難時均
50、可能出現(xiàn)故障,此時可在異地災備中心拉起業(yè)務。在災備中心拉起業(yè)務時,數(shù)據(jù)要回滾到最近的一致性點,最多可能丟失兩個復制周期的數(shù)據(jù)。異地災備中心從 LUN 接管業(yè)務后,遠程復制會記錄差異數(shù)據(jù),以便用于后續(xù)增量恢復,縮短業(yè)務回切的時間。災難恢復處理1)生產(chǎn)中心 A 故障的恢復當生產(chǎn)中心 A 的存儲設備可修復并且雙活數(shù)據(jù) LUN 和雙活配置都正常的情況下, 生產(chǎn)中心 B 將故障期間的差量數(shù)據(jù)復制到生產(chǎn)中心 A,直到雙活工作狀態(tài)全部恢復正常。當生產(chǎn)中心 A 無法修復的條件下,需要在生產(chǎn)中心 A 與生產(chǎn)中心 B 重新建立雙活配置,重新完成初始數(shù)據(jù)同步。2)生產(chǎn)中心 B 故障的恢復當生產(chǎn)中心 B 在可修復并且
51、雙活數(shù)據(jù) LUN 和雙活配置都正常的情況下,修復后自動將差異數(shù)據(jù)同步到生產(chǎn)中心 B 磁盤陣列中,異步復制繼續(xù)增量復制到異地災備中心。當生產(chǎn)中心 B 無法修復的條件下,需要在生產(chǎn)中心 A 與生產(chǎn)中心 B 重新建立雙活配置,在生產(chǎn)中心 B 與災備中心建立異步復制配置,并完成初始數(shù)據(jù)同步,恢復生產(chǎn)中心 A 與生產(chǎn)中心 B 的雙活關(guān)系,生產(chǎn)中心 B 與災備中心異步復制關(guān)系,雙活狀態(tài)和異步復制狀態(tài)均恢復正常后,結(jié)束故障恢復操作。3)生產(chǎn)中心 A 和生產(chǎn)中心 B 都故障當生產(chǎn)中心 A 和生產(chǎn)中心 B 在均可修復并且雙活數(shù)據(jù) LUN 和雙活配置都正常的情況下,確認是否需要將災備中心的數(shù)據(jù)同步到生產(chǎn)中心,如果
52、需要,先將災備中心數(shù)據(jù)復制到 B,然后由生產(chǎn)中心 B 同步到生產(chǎn)中心 A,完成后再恢復業(yè)務。如果不需要將災備中心數(shù)據(jù)復制到生產(chǎn)中心 B,可在生產(chǎn)中心 A 和生產(chǎn)中心 B 上直接恢復業(yè)務, 災備中心的新增數(shù)據(jù)會被覆蓋。當生產(chǎn)中心 A 和生產(chǎn)中心 B 完全被破壞時,需要將災備中心的數(shù)據(jù)同步到生產(chǎn)中心 B,然后重建生產(chǎn)中心 A 和生產(chǎn)中心 B 雙活配置,完成初始同步,然后再建立生產(chǎn)中心 B 到災備中心異步復制關(guān)系,雙活狀態(tài)和異步復制狀態(tài)均恢復正常后,結(jié)束故障恢復操作。鏈路和災備端故障為了應對無仲裁或仲裁故障的場景,HyperMetro 有優(yōu)先站點的概念,就是當網(wǎng)絡故障后,優(yōu)先站點會獲得更多的機會接管
53、業(yè)務。在 HyperMetro+異步級聯(lián)模式下,建議將優(yōu)先站點設置在生產(chǎn)中心 B,以便 HyperMetro 在網(wǎng)絡故障或生產(chǎn)中心 A 故障,會仲裁到生產(chǎn)中心 B 承擔業(yè)務,生產(chǎn)中心 B 與災備中心的容災仍能正常工作,保證 RPO 的達成。當生產(chǎn)中心 A 與生產(chǎn)中心 B 鏈路故障,HyperMetro 將業(yè)務優(yōu)先仲裁到數(shù)據(jù)中心 B,數(shù)據(jù)中心 B 與災備中心的復制不受影響。業(yè)務切換到數(shù)據(jù)中心 B 后,數(shù)據(jù)中心 B 會記錄與數(shù)據(jù)中心 A 的差量數(shù)據(jù),當網(wǎng)絡恢復后,數(shù)據(jù)中心 B 同步差量數(shù)據(jù)到數(shù)據(jù)中心 A, 同步完成后,雙活恢復到正常狀態(tài)。當生產(chǎn)中心 B 與災備中心的復制鏈路故障或者災備中心設備故障
54、,則遠程復制自動斷開,不影響生產(chǎn)系統(tǒng)的正常運行。遠程復制自動斷開后,生產(chǎn)中心 B 將記錄故障期間的差量數(shù)據(jù),待故障恢復后,自動將差量數(shù)據(jù)同步到災備中心。兩地三中心容災關(guān)鍵技術(shù)原理存儲雙活訪問兩地三中心方案中雙活+異步復制實現(xiàn)的容災方案中,同城雙活涉及到的關(guān)鍵技術(shù)包括: 跨中心存儲集群,故障不間斷訪問和地域優(yōu)化訪問等幾大技術(shù),相關(guān)技術(shù)主要利用集群技術(shù)提供雙活的存儲架構(gòu),每個節(jié)點以共享卷方式向應用服務器提供無差異的并行訪問,同時處理應用服務器的 I/O 請求;各節(jié)點間互為備份,均衡負載,任何節(jié)點故障后,其承接的業(yè)務自動切換到正常節(jié)點,保證系統(tǒng)的可靠性、業(yè)務的連續(xù)性。相關(guān)詳細介紹請參考雙活數(shù)據(jù)中心技
55、術(shù)白皮書遠程復制狀態(tài)轉(zhuǎn)移圖遠程復制有“同步中”、“已分裂”、“正?!薄ⅰ爱惓嚅_”、“失效”幾種狀態(tài),對各種狀態(tài)的描述如下表:表3-1 遠程復制狀態(tài)描述Pair 狀態(tài)狀態(tài)描述正常(Normal)同步復制初始創(chuàng)建時選擇主、從 LUN 無差異、或者主、從 LUN 同步完成后進入該狀態(tài)已分裂(Splited)同步復制初始創(chuàng)建時選擇主、從 LUN 數(shù)據(jù)有差異,或者同步中或正?;虍惓嚅_時選擇執(zhí)行分裂操作同步中(Synchronizing)分裂或者異常斷開后執(zhí)行同步操作異常斷開(Interrupted)正?;蛘咄街袪顟B(tài)時出現(xiàn) IO 失敗、LUN 故障、復制鏈路故障進入該狀態(tài)Pair 狀態(tài)狀態(tài)描述鏡像失
56、效主從陣列的 Pair 基本屬性配置不一致各種狀態(tài)的轉(zhuǎn)換關(guān)系如下圖所示:圖3-3 遠程復制狀態(tài)轉(zhuǎn)移圖基于 Cache 的多時間點復制技術(shù)HyperReplication/A 基于 cache 多時間快照技術(shù),主端需要做 COW 時,主機 IO 寫入Cache 即可返回,不需要等 COW 完成后才返回,減少了 COW 對主機性能的影響,極大降低了遠程復制同步數(shù)據(jù)時對主機的性能影響,同時遠程復制拷貝數(shù)據(jù)時,主端直接從 Cache 讀取拷貝數(shù)據(jù),拷貝時延較小,使異步遠程復制支持秒級 RPO。圖3-4 Cache 多時間戳復制原理Block IO 技術(shù)遠程復制一致性組在特定場景下需要懸掛主機 IO,阻
57、止主機 IO 下發(fā),保證一致性組中成員數(shù)據(jù)一致性。OceanStor 企業(yè)統(tǒng)一存儲系統(tǒng)基于 Block IO 技術(shù),多控下懸掛主機 IO 耗時能夠達到微妙級,而業(yè)界懸掛 IO 耗時基本為秒級。通過 Block IO 技術(shù),可以減少遠程復制對主機IO 性能的影響,提升控制流程效率??缯军c壞塊修復技術(shù)當磁盤陣列的硬盤出現(xiàn)壞道,且無法利用 RAID 重構(gòu)技術(shù)進行修復時,或在主機向存儲讀寫過程中發(fā)生 DIF 校驗失敗時,都可能導致主機業(yè)務中斷。華為存儲兩地三中心解決方案提供了一種增強的壞塊修復技術(shù),當生產(chǎn) LUN 出現(xiàn)不可修復的壞塊或者 DIF 錯誤時,只要相關(guān)的數(shù)據(jù)已經(jīng)復制到同城災備 LUN 上,系
58、統(tǒng)可自動將主機讀請求重定向到同城災備 LUN,讀到正確的數(shù)據(jù)并返回主機和修復生產(chǎn) LUN,大大提高整體解決方案的可靠性。反向增量同步技術(shù)OceanStor 企業(yè)統(tǒng)一存儲系統(tǒng)支持反向增量同步,在設置從 LUN 可寫之后,便可將原災備中心的 LUN 映射給備用生產(chǎn)主機,恢復生產(chǎn)業(yè)務,此時會對主從 LUN 的寫記錄差異。主從切換后,可以通過合并主從差異,進行反向的增量同步來使得災難恢復后業(yè)務快速回切,避免拷貝全量拷貝數(shù)據(jù)帶來的時間和資源開銷。對于兩地三中心容災場景,不論是主站點故障還是主站點及同城災備中心同時故障, 業(yè)務在同城災備中心或異地災備中心恢復過程中都可以采用反向增量同步技術(shù),大大提高了災難恢復后業(yè)務回切的速度,減小業(yè)務切換過程中的影響。容災管理容災管理軟件,相當于整個容災系統(tǒng)的大腦,對系統(tǒng)中各種資源如服務器、存儲設備、軟件等進行管理,針對容災全流程如容災遷移、容災恢復、容災巡檢、容災分析、容災報表等提供業(yè)務管理,大大簡化容災系統(tǒng)的管理工作,降低容災系統(tǒng)維護成本。DashBoard 信息縱覽DashBoard 讓容災狀態(tài)盡在掌握。主頁面中直觀展示任務執(zhí)行的成功失敗的運行情況, 任務執(zhí)行時間的長度,對 ORACLE,SQL Server 等應用的保護設置情況,統(tǒng)計信息
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030中國液壓濾清器行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 2025-2030中國洗護用品行業(yè)發(fā)展趨勢與前景展望戰(zhàn)略研究報告
- 2025-2030中國沒藥油行業(yè)市場運行分析及競爭格局與投資發(fā)展研究報告
- 2024年護士資格證真相揭秘試題及答案
- 2025年公共衛(wèi)生執(zhí)業(yè)醫(yī)師考試的局限試題及答案
- 實踐應用稅務師考試試題及答案
- 大學英語一理試題及答案
- 母豬場管理制度考試試題及答案
- 關(guān)鍵要素在2025年企業(yè)人力資源管理師考試中的表現(xiàn)試題及答案
- 2024-2025學年新教材高中歷史 第八單元 中華民族的抗日戰(zhàn)爭和人民解放戰(zhàn)爭 第23課 從局部抗戰(zhàn)到全面抗戰(zhàn)教學設計1 新人教版必修《中外歷史綱要(上)》
- 2025年鄭州衛(wèi)生健康職業(yè)學院單招職業(yè)傾向性測試題庫含答案
- 腫瘤預防宣傳
- 管理學基礎-形考任務一-國開-參考資料
- 體育體感游戲創(chuàng)業(yè)計劃
- 部編人教版道德與法治6年級下冊全冊課時練習講解課件
- 2025年湖北三江航天江河化工科技限公司招聘高頻重點模擬試卷提升(共500題附帶答案詳解)
- 法律實務案例分析卷集及參考答案解析
- 小學生風電知識科普課件
- 建筑施工各崗位安全生產(chǎn)責任書標準范本
- 2025年中考語文復習知識清單:語法知識與修辭手法(2類常考知識3個易錯點)(原卷版+解析)
- 2025-2030年中國可降解塑料行業(yè)發(fā)展狀況及投資前景規(guī)劃研究報告
評論
0/150
提交評論