




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
TheStratus?ftServer?WSeriesFamilyV090402容錯(cuò)概念按時(shí)間劃分的故障的分類永久性故障permanent永遠(yuǎn)持續(xù)下去直至修復(fù)為止間歇性故障intermittent短暫的,但卻是斷續(xù)的,既有其偶然性,又有其不定期的重復(fù)性偶然性故障transient暫時(shí)的,且可能是非重復(fù)性的間歇性故障和偶然性故障占所有現(xiàn)場(chǎng)失效的90%消除其影響是容錯(cuò)技術(shù)研究的重點(diǎn)課題容錯(cuò)技術(shù)發(fā)展60‘70‘80‘90‘2000‘專有容錯(cuò)系統(tǒng)軟件容錯(cuò)系統(tǒng)硬件容錯(cuò)系統(tǒng)單機(jī)雙機(jī)Cluster集群Stratus的容錯(cuò)產(chǎn)品線ftServerW-SeriesWindows-basedsolutionftServerT-Series/L-SeriesTelco/EnterpriseLinuxSolutionftServerV-SeriesVOSUNIXsolutionContinuumVOSUNIX&HPUNIXsolutionStratus的服務(wù)領(lǐng)域所有持續(xù)可用性屬于必須的地方任何停機(jī)時(shí)間都是不能容忍的場(chǎng)合委曲求全的“容錯(cuò)”方案
——ClusterHA方案,HighAvailability但這并不是真正意義上的容錯(cuò)?。?!或者,我們就使用容錯(cuò)計(jì)算機(jī)在整個(gè)設(shè)計(jì)過程中無時(shí)不刻不為可靠性考慮的產(chǎn)品硬件級(jí)的容錯(cuò)提供實(shí)測(cè)高達(dá)99.9997%的可靠性使用標(biāo)準(zhǔn)的intelXEONCPU運(yùn)行標(biāo)準(zhǔn)的MicrosoftWindows2000AdvancedServer/Windows2008EnterpriseEdition不會(huì)出現(xiàn)軟件切換不會(huì)因?yàn)橛布收蠈?dǎo)致應(yīng)用失敗在線更換部件……CA方案,ContinuousAvailability服務(wù)器可用性級(jí)別的概念I(lǐng)nternationalDateCorp.(IDC)AL0-1ConventionalServersAL2-3BusinessCriticalAL4MissionCriticalAL4---關(guān)系到整個(gè)企業(yè)甚至公眾的關(guān)鍵應(yīng)用AL2-3---關(guān)系到企業(yè)和政府的日常運(yùn)行AL0-1---關(guān)系到計(jì)算機(jī)的應(yīng)用和普及服務(wù)器可用性級(jí)別的定義不同技術(shù)的可靠性對(duì)比方案可靠性99.999%99.99%99.9%99%容錯(cuò)服務(wù)器獨(dú)立服務(wù)器使用外部磁陣的獨(dú)立服務(wù)器簡易的集群系統(tǒng)消除單點(diǎn)故障的集群系統(tǒng)大型主機(jī)開始考慮總成本(TCO)吧!典型IT環(huán)境的構(gòu)建與運(yùn)行費(fèi)用分析
一個(gè)IT環(huán)境5年總費(fèi)用的典型例子“Thesmallestelementofthecostofrunningservers
isactualserverpurchaseprice.”
JayBretzmannDirectorofIBM’sxSeriesMarketingStratusTechnologies1980--硬件級(jí)容錯(cuò)計(jì)算機(jī)系統(tǒng)廠商Stratus成立1981--首先推出基于硬件的容錯(cuò)計(jì)算機(jī)系統(tǒng)1988--建立世界上第一個(gè)提供24小時(shí)服務(wù)的遠(yuǎn)程服務(wù)網(wǎng)1990—推出世界上第一個(gè)容錯(cuò)的UNIX操作系統(tǒng)-FTX1991--推出RISC結(jié)構(gòu)的XA/R系列容錯(cuò)計(jì)算機(jī)系統(tǒng)1995--推出RISC結(jié)構(gòu)的Continuum系列容錯(cuò)計(jì)算機(jī)系統(tǒng)1997--推出容錯(cuò)的HP-UX操作系統(tǒng)2001--推出世界上第一臺(tái)Windows2000硬件容錯(cuò)服務(wù)器ftServerStratusTechnologiesftServer?的研發(fā)基于行業(yè)標(biāo)準(zhǔn)的容錯(cuò)體系結(jié)構(gòu)硬件容錯(cuò)機(jī)制對(duì)標(biāo)準(zhǔn)操作系統(tǒng)的進(jìn)一步增強(qiáng)為可靠性、可用性最高要求而組建的客戶服務(wù)在過去的28個(gè)月中研發(fā)申請(qǐng)了42項(xiàng)專利技術(shù)TheSmarterApproachtoUptimeTMINVESTCORPIntelOtherMidOceanPartners雄厚的資金20多年的容錯(cuò)研究經(jīng)驗(yàn)MidOceanPartnersStratus的合作伙伴在操作系統(tǒng)可靠特性上密切合作內(nèi)存重新同步強(qiáng)化驅(qū)動(dòng)程序支持核心業(yè)務(wù)應(yīng)用程序的模式ftServer?
服務(wù)器被布署在Redmond測(cè)試實(shí)驗(yàn)室中長期良好的合作計(jì)劃可以提前使用最新芯片進(jìn)行整合測(cè)試ftServer?
服務(wù)器被布署在intel實(shí)驗(yàn)室中ftServer?
服務(wù)器被布署在EMC認(rèn)證實(shí)驗(yàn)室中EMCCLARiiON?的代理關(guān)系合作支持模式ContinuousProcessing?
ContinuousProcessing?Systems硬件冗錯(cuò)SecondGenerationftServer?FamilyPassiveBackplaneStratusSSPASICPCIDuplex
ExpansionI/O6600SeriesTMR6600StratusSNPASICCPUN-waySMPChipsetMemoryStratusSSPASICPCIDuplex
CoreI/ODMR6600StratusSNPASICCPUN-waySMPChipsetMemoryStratusSNPASICCPUN-waySMPChipsetMemoryLockstepCPUs鎖步技術(shù)(LockstepTechnology)6600參與相同計(jì)算的冗余部件保證了系統(tǒng)遠(yuǎn)離停機(jī)PassiveBackplaneSSPSSPSNPSNPI/OI/O正常工作的容錯(cuò)機(jī)CPUCPU1+1=?1+1=?MEMMEM22DiskDisk所有運(yùn)算在不同板上同時(shí)進(jìn)行I/O板CPU/MEM板當(dāng)CPU板出問題時(shí)…PassiveBackplaneSSPSNPI/OI/OCPUCPU1+1=?1+1=?MEMXDiskDiskSNPSSP2MEM2任何一塊CPU板上的任何部件損壞,都不會(huì)影響系統(tǒng)的正常運(yùn)行。正在進(jìn)行的運(yùn)算和操作會(huì)象沒發(fā)生問題一樣繼續(xù)下去。I/O板CPU/MEM板如果I/O板再出問題呢?PassiveBackplaneSSPSNPI/OI/OCPU1+1=?DiskDiskSSP2MEM2X任何一塊I/O板上的任何部件損壞,也不會(huì)影響系統(tǒng)的正常運(yùn)行。正在進(jìn)行的運(yùn)算和操作同樣象沒發(fā)生問題一樣繼續(xù)下去。I/O板CPU/MEM板Cluster會(huì)如何呢?I/OCPU1+1=?MEM2I/OCPU1+1=?MEM2Disk0100010110100010101010111010111010010110001100011101X1+2=3CPU、內(nèi)存和等待I/O的所有數(shù)據(jù)丟失,數(shù)據(jù)庫、應(yīng)用、文件系統(tǒng)都沒有被安全關(guān)閉需要時(shí)間等待備機(jī)檢測(cè)到故障發(fā)生需要時(shí)間和運(yùn)氣進(jìn)行磁盤組切換、需要時(shí)間和運(yùn)氣進(jìn)行文件系統(tǒng)檢查需要時(shí)間重新啟動(dòng)應(yīng)用程序,需要重新進(jìn)行一些運(yùn)算以回到斷點(diǎn)需要時(shí)間和運(yùn)氣重新啟動(dòng)數(shù)據(jù)庫并進(jìn)行數(shù)據(jù)庫修復(fù)工作最重要的是:切換并不一定總是成功?。。∠到y(tǒng)A系統(tǒng)BHA與CA的區(qū)別HACA交易丟失選擇新平臺(tái)業(yè)務(wù)延滯故障出現(xiàn)故障恢復(fù)容錯(cuò)服務(wù)器的可靠性數(shù)學(xué)基礎(chǔ)容錯(cuò)技術(shù)的可靠性數(shù)學(xué)模型------連續(xù)可靠性容錯(cuò)設(shè)計(jì)架橋式結(jié)構(gòu)CPUI/OCPUI/O集群技術(shù)的可靠性數(shù)學(xué)模型------提高可靠性避錯(cuò)設(shè)計(jì)平行式結(jié)構(gòu)CPUI/OCPUI/O當(dāng)我們有徹底避免災(zāi)難的方案時(shí)
為什么還要選擇災(zāi)難恢復(fù)方案呢災(zāi)難恢復(fù)Clusters,Mainframes災(zāi)難預(yù)防ftServer“Whychooseaserverdesignedtorecoverfromafailure,ratherthanaserverdesignednottofail?”
VernonTurner,IDCContinuousProcessing?ContinuousProcessing?Systems瞬時(shí)硬件故障通過軟件屏蔽掉強(qiáng)化的驅(qū)動(dòng)程序可預(yù)防軟件故障軟件的問題被可靠地捕捉、分析和糾正內(nèi)存和硬盤中的數(shù)據(jù)均被可靠地保護(hù)高度地集成;錯(cuò)誤防真測(cè)試故障預(yù)防FailsafeSoftware軟件可靠性預(yù)防、診斷并解決軟件問題容錯(cuò)操作透明的
I/O切換完善的熱插拔支持系統(tǒng)保護(hù)錯(cuò)誤診斷和隔離PCI總線保護(hù)驅(qū)動(dòng)模式在線診斷主動(dòng)式維護(hù)接口兼容Microsoft?WMI
驅(qū)動(dòng)模式強(qiáng)化驅(qū)動(dòng)PreventOutagesftServer?Failsafe軟件結(jié)構(gòu)PCIDriversFailoverDriversStratus?HotplugDriverNTOSKERNELVirtualizedLegacyDeviceSupportStratus?HALExtensionsHALContinuousProcessing?$100,000可用性保證計(jì)劃名稱PerfectPerformanceAssuredAvailability事件意外的機(jī)器硬件、系統(tǒng)軟件或操作系統(tǒng)故障意外的機(jī)器硬件、系統(tǒng)軟件或操作系統(tǒng)故障補(bǔ)償Stratus支付$100,000現(xiàn)金Stratus從服務(wù)費(fèi)中作出適當(dāng)補(bǔ)償產(chǎn)品ftServer6600TMR任何在AssuredAvailabilityPlusserviceagreement內(nèi)的ftServerftServer?集群技術(shù)可靠性指標(biāo)99.999+%(不受任何其它因素的影響,實(shí)際統(tǒng)計(jì)結(jié)果為99.9997%)99.9%~99.99%(具體水平依賴于實(shí)施水平、應(yīng)用類型、數(shù)據(jù)規(guī)模、切換原因等許多不確定因素)系統(tǒng)體系結(jié)構(gòu)通過系統(tǒng)內(nèi)部冗余部件配合先進(jìn)的鎖步技術(shù)防止故障,不依賴于其它軟件。結(jié)構(gòu)簡單直觀。使用兩套或兩套以上的計(jì)算機(jī)、磁盤陣列甚至光纖交換機(jī)等通過復(fù)雜的拓樸結(jié)構(gòu)再配合以Cluster軟件來實(shí)現(xiàn)故障恢復(fù)。結(jié)構(gòu)復(fù)雜。硬件故障是否會(huì)導(dǎo)致應(yīng)用中斷不會(huì)會(huì)硬件故障是否會(huì)帶來數(shù)據(jù)丟失不會(huì)CPU中、內(nèi)存中、等待I/O的數(shù)據(jù)均有可能丟失典型切換時(shí)間和應(yīng)用中斷時(shí)間冗余部件鎖步工作,無切換,應(yīng)用不受任何影響幾分鐘~幾十分鐘不等(具體水平依賴于實(shí)施水平、應(yīng)用類型、數(shù)據(jù)規(guī)模、切換原因等許多不確定因素)。切換期間應(yīng)用對(duì)外無法響應(yīng),且切換完成后有可能導(dǎo)致性能下降是否需要做負(fù)載均衡不需要不是必需,但不做就浪費(fèi)一臺(tái)機(jī)器的計(jì)算資源操作系統(tǒng)映像數(shù)量單份。只需要一個(gè)許可證雙份或多份。每一份操作系統(tǒng)都需要一個(gè)許可證與集群技術(shù)的對(duì)比——1ftServer?集群技術(shù)數(shù)據(jù)庫與應(yīng)用軟件許可證數(shù)量單份。只需要一個(gè)許可證雙份或多份。具體看應(yīng)用軟件的要求應(yīng)用程序有無移植要求無需要編寫應(yīng)用程序的切換腳本,并應(yīng)該做嚴(yán)格測(cè)試以確保在不同負(fù)載下均能正常工作。此外推薦對(duì)應(yīng)用程序作修改以確??梢哉_運(yùn)行在雙機(jī)或多機(jī)環(huán)境中。對(duì)數(shù)據(jù)一致性有無影響無依賴于實(shí)施的好壞各部件是否支持在線更換支持通常僅電源、風(fēng)扇、磁盤支持。維護(hù)難易程度易,無需專門培訓(xùn)需要培訓(xùn)和演練以熟悉Cluster軟件服務(wù)技術(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 四年級(jí)信息技術(shù)上冊(cè) 粗心的小天文學(xué)家教學(xué)設(shè)計(jì) 華中師大版
- 《可愛的家-牧場(chǎng)上的家》(教學(xué)設(shè)計(jì))-2024-2025學(xué)年人音版(2012)音樂五年級(jí)上冊(cè)
- 人教版初中七年級(jí)下冊(cè)歷史與社會(huì) 6.3.1絲路明珠 教學(xué)設(shè)計(jì)
- 一年級(jí)道德與法治下冊(cè) 第一單元 班級(jí)小主人 第二課 今天我值日教學(xué)設(shè)計(jì) 粵教版
- 門店運(yùn)營管理方案
- 父母的愛三下語文園地五課件
- 華為榮耀8培訓(xùn)
- 教科版(2024)八年級(jí)2025年3 跨學(xué)科實(shí)踐:船閘教案及反思
- 蘇科版七年級(jí)上冊(cè)2.5 有理數(shù)的加法與減法教學(xué)設(shè)計(jì)及反思
- 靜脈炎的預(yù)防及護(hù)理
- 期中檢測(cè)卷2023-2024學(xué)年人教版數(shù)學(xué)八年級(jí)下冊(cè)
- 小炮車計(jì)算書
- 靜脈采血技術(shù)新版培訓(xùn)課件
- 戰(zhàn)時(shí)飲食保障總結(jié)匯報(bào)
- 數(shù)字人民幣推廣方案范文
- 兒童腰椎穿刺術(shù)課件
- 社會(huì)工作概論 個(gè)案工作方法
- 酒精戒斷患者的護(hù)理查房課件
- 人工智能導(dǎo)論-課件 第1章 人工智能的前世今生
- 2024年中國人壽招聘筆試參考題庫含答案解析
- 票據(jù)業(yè)務(wù)承諾函
評(píng)論
0/150
提交評(píng)論