構建HyperSwap雙活數(shù)據(jù)中心_第1頁
構建HyperSwap雙活數(shù)據(jù)中心_第2頁
構建HyperSwap雙活數(shù)據(jù)中心_第3頁
構建HyperSwap雙活數(shù)據(jù)中心_第4頁
構建HyperSwap雙活數(shù)據(jù)中心_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 構建HyperSwap雙活數(shù)據(jù)中心為確保數(shù)據(jù)始終可用,為保證業(yè)務持續(xù)在線,CIO們在過去花費了大量的時間、精力和金錢,但每每到關鍵時刻,往往事與愿違哪怕是斥巨資建立了所謂的“雙活數(shù)據(jù)中心”。CIO們一度對“雙活數(shù)據(jù)中心”給予了充分的信任,他們希望,雙站點數(shù)據(jù)中心的可用性和恢復能力、從存儲故障中斷中立即恢復的能力、服務器故障“零延遲”切換的能力可以幫助他們實現(xiàn)對7x24苛刻可用性、可服務性的要求,能夠滿足公司領導層、業(yè)務層對IT業(yè)務服務水平協(xié)議的嚴格要求。但正如上面所說,他們當中的大部分人都以失望告終。在建設“雙活數(shù)據(jù)中心”的過程中,許多CIO隨著對“雙活(Active-Active)”技術的

2、深入了解,吃驚的發(fā)現(xiàn)自己所正在建設的“雙活數(shù)據(jù)中心”其實只是一種“代名詞”而已,實則難以滿足其雙活、即時切換的能力,CIO們面對著這樣的現(xiàn)實:“不同廠家對雙活數(shù)據(jù)中心之理解和定義并不一致。部分廠家往往只著重市場影響力,將雙活數(shù)據(jù)中心需求等同于該廠家提供之產品功能,但缺乏考慮總體擁有成本、應用交易性能影響、數(shù)據(jù)中心可維護性等因素?!笨山⒁粋€高可靠性、高可用性、高可切換的“雙活數(shù)據(jù)中心”的訴求卻并未在CIO們的心中減退,他們清醒的知道,對于一些關鍵的、核心的、維系企業(yè)信譽與存儲的業(yè)務來說,他們必須要尋找到可靠的雙活數(shù)據(jù)中心建設解決方案,他們了解,即便是有高度可靠的硬件體系、高可用的CDP(持續(xù)數(shù)

3、據(jù)保護)技術或是某些特殊的軟件方法,一個由互為鏡像的、雙活的硬件架構與軟件平臺維系的“雙活數(shù)據(jù)中心”仍然是災難或某些特殊情況下所必不可少的?!?x24小時的可用性、多重的數(shù)據(jù)保護需求、客戶已經興建的多個數(shù)據(jù)中心把業(yè)務風險分散的需求、多個數(shù)據(jù)中心的使用率、企業(yè)級數(shù)據(jù)中心整體切換的需求以及利用雙活數(shù)據(jù)中心實現(xiàn)業(yè)務或技術創(chuàng)新的需求等等構成了眾多CIO對雙活數(shù)據(jù)中心迫切的需求?!盜BM技術專家曾經在2012 IBM Unix World高峰論壇上指出:“客戶的需求雖然在演變,但作為可靠的、最后一道防范業(yè)務風險、提高業(yè)務終極可用性可靠性的方法,雙活數(shù)據(jù)中心是無可取代的?!倍鼮橹匾氖牵S著存儲系統(tǒng)的設

4、計越來越復雜,數(shù)據(jù)尤其是在大數(shù)據(jù)時代的重要性越來越高,很多CIO也認識到,在雙活數(shù)據(jù)中心內,存儲系統(tǒng)的“零延遲”切換,無論是在主機故障還是存儲子系統(tǒng)故障時,能夠順利的切換存儲子系統(tǒng)、切換存儲卷、確保數(shù)據(jù)一致性,是雙活數(shù)據(jù)中心中面對的又一個新的難題。CIO們不是第一次陷入左右為難的境地:一邊是業(yè)界“名詞化”的雙活數(shù)據(jù)中心,一邊是迫切的需求與最可靠的業(yè)務風險“防火墻”,到底如何建設雙活數(shù)據(jù)中心?又如何鑒定雙活數(shù)據(jù)中心?又有哪些特色技術與解決方案、應用實例在雙活數(shù)據(jù)中心解決方案中舉足輕重?CIO如何確保存儲系統(tǒng)的切換與數(shù)據(jù)一致性?我們將在此通過IBM Power Active-Active 雙活數(shù)據(jù)

5、中心解決方案中的PowerHA HyperSwap 解決方案及參考架構略窺一二。建設雙活數(shù)據(jù)中心: “最后防線”需細致考慮很多CIO將雙活數(shù)據(jù)中心(Active-Active)稱作企業(yè)數(shù)據(jù)中心的“最后防線”,這也就意味著,雙活數(shù)據(jù)中心必須要在最關鍵的時刻確保最重要業(yè)務的近乎100%的應用可用性和業(yè)務可靠性,而要想達到這一水平,有不少問題需要提前考慮。無論任何廠商、任何解決方案,雙活數(shù)據(jù)中心都必須解決以下技術挑戰(zhàn):1、雙活數(shù)據(jù)中心要降低延遲,由于距離和傳輸環(huán)境的限制,越遠距離的雙活數(shù)據(jù)中心存在的延遲越大,由于光速限制,每 100km 所產生的數(shù)據(jù)來回延遲約為1ms。該延遲已經跟一般硬盤讀寫可比。

6、因此,會對實際應用性能構成影響。2、Quorum / Tie-Breaker 之需求 : 為了避免雙活數(shù)據(jù)中心產生腦裂(Split Brain)或場地分割(site isolation) 狀況,解決方案需要提供有效的Quorum / Tie-Breaker方式來保證數(shù)據(jù)完整性。3、業(yè)務交易中,應用所產生之寫操作 (INSERT, UPDATE, DELETE)比例越高,則約多數(shù)據(jù)需要跨數(shù)據(jù)中心傳送。這類型業(yè)務交易不利于雙活數(shù)據(jù)中心設計。4、雙活數(shù)據(jù)中心并不緊緊意味著服務器的雙活和切換,存儲系統(tǒng)的切換往往是雙活數(shù)據(jù)中心建設中容易忽略的部分,在某些切換失敗的案例或特殊情況下如僅需要從主存儲系統(tǒng)的數(shù)

7、據(jù)卷切換熱備存儲系統(tǒng)的數(shù)據(jù)卷,數(shù)據(jù)卷與存儲系統(tǒng)的切換失敗,也是導致數(shù)據(jù)中心熱備失效的重要原因。5、可以進行完整過程演練與業(yè)務模擬測試的雙活數(shù)據(jù)中心意味著不會出現(xiàn)“書到用時方恨少”的尷尬情況,不少CIO在建立了雙活數(shù)據(jù)中心之后,并未著手進行長期、常態(tài)化的演練,而是將“切換鍵”束之高閣,這往往會導致切換時出現(xiàn)難以預料的問題。除此以外,雙活數(shù)據(jù)中心的一個重要作用是保證計劃內停機維護的可能性,如果不能夠滿足計劃內停機維護的需求,雙活數(shù)據(jù)中心在災難發(fā)生時更是難以奏效。6、明確雙活數(shù)據(jù)中心的“雙活(Active-Active)”是一種對稱的工作負載關系,而不是主備關系(Activ-Standby)或“生產

8、和查詢關系(Active-Query)”的快速接管/數(shù)據(jù)延續(xù)、非對稱工作負載的關系,也就說,要明確雙活數(shù)據(jù)中心中的兩個數(shù)據(jù)中心都是活躍的且功能相同,這兩個數(shù)據(jù)中心互為鏡像而非誰或誰的備份、誰或誰的查詢,其中任意一個數(shù)據(jù)中心都能夠擔當起相同的功能和工作負載。在上面的六條中,最后一條尤為值得注意,事實上,這也是雙活數(shù)據(jù)中心之所以區(qū)別于此前的兩類“雙數(shù)據(jù)中心”建設模式的核心:首先,“雙活”充分利用資源,避免了一個數(shù)據(jù)中心常年處于閑置狀態(tài)而造成浪費。通過資源整合,“雙活”數(shù)據(jù)中心的服務能力是雙倍;其次,“雙活”數(shù)據(jù)中心如果斷了一個數(shù)據(jù)中心,另外一個數(shù)據(jù)中心還在運行,對用戶來說是不可感知的。而一個災備中

9、心的模式,如果生產數(shù)據(jù)中心癱瘓,需要半個小時、甚至兩個小時、甚至更長時間才能啟動災備中心,在啟動災備中心的時間里,用戶交易會嚴重受損。但雙活數(shù)據(jù)中心也有一點存在極大的挑戰(zhàn),那就是數(shù)據(jù)的同步問題:兩邊的數(shù)據(jù)庫都在受理業(yè)務,這就涉及雙向數(shù)據(jù)同步問題,數(shù)據(jù)同步有存儲層面的數(shù)據(jù)同步技術,也有數(shù)據(jù)庫級的同步工具,而在雙活數(shù)據(jù)中心的建設中,存儲系統(tǒng)能否實現(xiàn)與主機的自由切換和業(yè)務延續(xù),是雙活數(shù)據(jù)中心中目前為止最具挑戰(zhàn)性的技術難點。數(shù)據(jù)中心和服務可用性是 IT 基礎架構的最重要課題之一,并且每天都會吸引更多的關注。站點之間的數(shù)據(jù)復制是一個最大限度地減少業(yè)務中斷的好辦法,因為備份還原操作所用的時間太長,無法滿足

10、業(yè)務需求,或者設備可能被損壞,無法用于數(shù)據(jù)恢復,這取決于災難程度。從最便宜的(恢復需要較長的時間)恢復到最昂貴的(提供最短的恢復時間,并且最接近零數(shù)據(jù)丟失)恢復,恢復選項的成本各不相同。PowerHA SystemMirror 7.1.2 Enterprise Edition 提供一個災難恢復和高可用性解決方案,有助于自動化節(jié)點故障和應用程序事件,并提供高可用性。它有助于為選定存儲的存儲故障自動化恢復操作,控制站點(單獨的數(shù)據(jù)中心)之間的存儲復制,并支持整個站點故障的恢復,確保副本處于一致的狀態(tài),從而實現(xiàn)故障轉移,使您能夠構建一個災難恢復解決方案。HyperSwap 是 PowerHA Sys

11、temMirror 7.1.2 Enterprise Edition 產品組合中的一個產品。這是一個針對存儲錯誤而提供的功能,提供它是為了獲得持續(xù)可用性。它以基于存儲的同步復制 Peer-to-Peer Remote Copy (PPRC) 或 Metro Mirror 為基礎。在被定向(或磁盤發(fā)生故障)時,訪問主磁盤子系統(tǒng)的 IBM AIX 主機可以透明地切換到數(shù)據(jù)的備份副本,這樣磁盤(如中間件)的使用者就不會受到影響。PowerHA HyperSwap:雙活數(shù)據(jù)中心的基礎架構解決方案HyperSwap 是一個幾年前在 GDPS 中初次引入的特性,適用于 Metro Mirror PPRC(

12、同步)環(huán)境,它有助于即時切換 PPRC 鏡像的磁盤子系統(tǒng),從而增強 Parallel Sysplex 的彈性。假如主機和輔助存儲子系統(tǒng)之間存在物理連接,那么 HyperSwap 技術可以讓主機能夠透明地將應用程序的 I/O 操作切換到輔助 Metro Mirror 卷。這使得用戶能夠從單一站點或所覆蓋的多個位置提供持續(xù)運營。通過實現(xiàn) HyperSwap,可以執(zhí)行磁盤故障和維護功能,不會發(fā)生任何應用程序服務中斷。該解決方案可為客戶提供了更好的災難恢復解決方案,并能證明 PowerHA 與 IBM 存儲的緊密集成。HyperSwap 技術使得 PowerHA SystemMirror 能夠為客戶支

13、持以下功能:讓主磁盤子系統(tǒng)不會成為單點故障,在所覆蓋范圍內提供更高水平的持續(xù)運營支持。支持無任何應用程序停機的存儲維護。支持從舊到新的存儲遷移。所有這些用例都被劃分為兩種類型的 HyperSwap 活動:計劃外的 HyperSwap:當主存儲發(fā)生故障時,托管應用程序的操作系統(tǒng)將會檢測事件并做出反應,執(zhí)行 PPRC 故障轉移,因此,應用程序的 I/O 活動被透明地重定向到二級存儲子系統(tǒng),以便允許應用程序沒有任何中斷地繼續(xù)運行。請注意,在本例中,操作系統(tǒng)的 Small Computer System Interface (SCSI) 磁盤驅動程序檢測到錯誤,并跨多個主機做出決定,完全切換到輔助存儲

14、子系統(tǒng)。在 HyperSwap 交換過程中,會暫時凍結 I/O 活動的進一步處理。請注意,應用程序在此期間不會遇到故障,而是遇到非致命性的延遲。計劃內的 HyperSwap:在這種情況下,管理員主動發(fā)起一個從主存儲子系統(tǒng)到輔助存儲子系統(tǒng)的 HyperSwap。當管理員請求執(zhí)行計劃內 HyperSwap 時,會在集群中的主機之間進行協(xié)調,然后凍結 I/O 活動。先執(zhí)行交換,然后允許繼續(xù)執(zhí)行 I/O 操作。計劃內的 HyperSwap 有助于在主存儲上執(zhí)行維護任務,還有助于將數(shù)據(jù)從舊存儲遷移到新購買的存儲子系統(tǒng)。圖 1:PowerHA SystemMirror HyperSwap 配置示例 HYP

15、ERLINK /developerworks/cn/aix/library/au-aix-hyper-swap/ l ibm-pcon 回頁首AIX 的 HyperSwap 支持圖 2 顯示了支持 HyperSwap 的組件。圖 2:支持 HyperSwap 的 AIX 組件AIX 的與 HyperSwap 相關的組件包括:Cluster Aware AIX (CAA)協(xié)調集群范圍內的操作PowerHA HyperSwap 內核擴展與 CAA 配合,協(xié)調與其他節(jié)點的操作分析來自 PowerHA 框架和 AIX 存儲框架的消息,并采取適當?shù)拇胧┐_定交換操作AIX 存儲框架對存儲使用 AIX 接口

16、與 PowerHA HyperSwap 內核擴展緊密配合管理存儲的狀態(tài)將有關 I/O 錯誤的消息告訴 PowerHA HyperSwap 內核擴展從 PowerHA HyperSwap 內核擴展獲取交換決定,并發(fā)送命令到 AIX PCM (MPIO)作為IBM雙活數(shù)據(jù)中心的基礎架構解決方案,PowerHA HyperSwap并非是一項技術那么簡單,在PowerHA HyperSwap解決方案中,實際上包括了IBM整個中、高端數(shù)據(jù)中心的建設與運維解決方案,這一解決方案也依靠著IBM在主機、高端存儲、災難備份、數(shù)據(jù)中心建設上的經驗而形成。PowerHA HyperSwap基于IBM完整的數(shù)據(jù)中心基

17、礎架構,其中包括兩套Power 7服務器、IBM的Unix操作系統(tǒng)AIX的6.1版本、PowerHA Enterprise Ed.7軟件、最少兩套IBM DS8800高端存儲系統(tǒng)以及站點間高速互聯(lián)解決方案。在PowerHA HyperSwap的解決方案中規(guī)劃了兩套完整的、互為“鏡像”的、基于IBM Power7服務器和DS8800高端存儲系統(tǒng)的數(shù)據(jù)中心基礎架構,提高了雙站點可用性和恢復能力,并且提供從存儲中斷立即恢復的能力:PowerHA HyperSwap將確保數(shù)據(jù)中心在服務器失效或存儲失效的情況下,業(yè)務的連續(xù)性。同時,對于計劃內的停機,其支持在對業(yè)務沒有影響的情況下維護存儲及進行存儲遷移。

18、除此以外,PowerHA HyperSwap基礎架構解決方案能夠實現(xiàn)雙活數(shù)據(jù)中心中很重要的“透明切換”功能,通過與PowerHA的整個解決方案整合,基于此建設的雙活數(shù)據(jù)中心能夠提供更完整的自動接管能力,而不需要過多的人工干預,且對用戶的應用保持透明的狀態(tài)這畢竟是由經過長期驗證的IBM大型主機HyperSwap方案移植而來的技術,其現(xiàn)在雖然存在于IBM的Power服務器Power 770、Power 780身上,但卻來自于像是zEnterprise EC12這樣的大型主機系統(tǒng)。從功能上來說,PowerHA HyperSwap基本上遵循了雙活數(shù)據(jù)中心的最基本的核心功能,在三類常見的場景中都能發(fā)揮其作用:1、 存儲故障:DS8800存儲系統(tǒng)發(fā)生故障,HyperSwap快速存儲切換,RTO=秒級,RPO=0,應用不中斷,數(shù)據(jù)庫無需Rollback。2、 服務器故障:服務器發(fā)生故障,PowerHA觸發(fā)服務器切換,數(shù)據(jù)庫/應用需要重啟,RTO=分鐘級,RPO=0,應用重新連接。3、 數(shù)據(jù)中心全面故障:服務器和存儲全部故障,PowerHA觸發(fā)服務器切換,數(shù)據(jù)庫/應用需

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論