HACMP系列教程_第1頁
HACMP系列教程_第2頁
HACMP系列教程_第3頁
HACMP系列教程_第4頁
HACMP系列教程_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、HACMP系列教程(一):基本概念現(xiàn) 代企業(yè)的應(yīng)用和數(shù)據(jù)都儲存在計算機中,由計算機來處理,一旦計算機系統(tǒng)發(fā)生意外故障,而引起應(yīng)用停止甚至重要數(shù)據(jù)失,必將造成巨大損失,因此企業(yè)計算對高 可用性和可靠性的要求非常高。IBM RS6000系列通過AIX 操作系統(tǒng)的支持,利用HACMP 實現(xiàn)了多種功能的高可用群集多處理方案,為高可用性計算提供了一個完美的解決方案。IBM的高可靠性群集系統(tǒng)軟件HACMP-High Availability Cluster Multi-Processing提供了RS/6000平臺上關(guān)鍵應(yīng)用的高可靠性解決方案,該軟件能使一個群集內(nèi)的所有的RS/6000系統(tǒng)不存在單點失 效(

2、在群集中單獨某一部分出現(xiàn)故障而引起對用戶端的服務(wù)效)。HACMP系統(tǒng)能自動地檢測系統(tǒng)硬件失效,重新配置群集系統(tǒng),使得所有的資源完全不受系統(tǒng)硬 件失效的影響,從而提供了可靠的應(yīng)用平臺。HACMP可用來最多將32部RS/6000服務(wù)器或SP的節(jié)點連結(jié)成高可用性的群集結(jié)構(gòu)。對于企業(yè)關(guān)鍵性的應(yīng)用程序而言,群集式的服務(wù)器或節(jié)點提供代理式的數(shù)據(jù)訪問,具備復(fù)制性(redundancy),使得系統(tǒng)應(yīng)用程序具有靈活的容錯能力。HACMP所具有靈活的結(jié)構(gòu)和簡單的使用。從單一處理機(SMP)主機到SP節(jié)點皆可結(jié)構(gòu)成高可用性之群集,您可混用,且跨越系統(tǒng)大小及性能等級,將各種網(wǎng)絡(luò)適配卡和磁盤子系統(tǒng)融合在一起來滿足您的應(yīng)

3、用程序、網(wǎng)絡(luò)等方面的需求。HACMP的群集因不同的處理需求可以結(jié)構(gòu)成三種不同的模式:并行模式、互備模式、主備模式同時訪問模式(Concurrent access mode,并行模式)適用在所有處理機必須在相同的工作負載及在相同的時間共享相同的數(shù)據(jù)之環(huán)境。相互備援模式(mutual takeover mode)則是群集中的各個節(jié)點分別承擔有應(yīng)用和任務(wù),并且各節(jié)點間相互備援。而熱待機模式則為一節(jié)點備援任何群集上的另一節(jié)點。無論您選擇哪一種備援模式,HACMP所提供的數(shù)據(jù)訪問及備援方案都將應(yīng)用程序的執(zhí)行及增長性在避免不正常死機狀況下做了最佳化處理。HACMP用戶界面相當簡易,AIX的系統(tǒng)管理界面工具

4、(SMIT)及視覺化系統(tǒng)管理(VSM)圖形界面兩者皆提供非常簡易的方式,給予您在高可用性的集群中針對服務(wù)器處理機執(zhí)行安裝、結(jié)構(gòu)及系統(tǒng)管理工作。對 于一般的群集管理工作(例如HACMP啟動/停止 、用戶及群集管理、卷組、邏輯卷(Logic Volume)及文件系統(tǒng)),您可以使用群集單點控制(CSPOC)工具來執(zhí)行這些工作,即使是二個節(jié)點之群集,您完全無需考慮群集資源的所有權(quán),并且借 助于HAView功能,您可使用Tivoli的TME 10中的NetView for AIX圖形網(wǎng)絡(luò)管理界面由單一節(jié)點來監(jiān)控群集及它的元件??墒褂肏ACMP來處理以下幾件事:針對許多企業(yè)關(guān)鍵的應(yīng)用程序,建立高效益的群集

5、環(huán)境。例如:針對在場顧客的零售、即時銀行、電信業(yè)務(wù)、數(shù)據(jù)處理或其他特定交易信息處理的應(yīng)用程序。建立一個更復(fù)雜的群集使其高達八個節(jié)點,執(zhí)行相同的應(yīng)用程序且共享相同的資源,而僅有極小的損壞后重新啟動的延遲。執(zhí)行升級及維護確保您的系統(tǒng)沒有毀損之虞。籍由AIX邏輯卷管理器(LVM)磁盤鏡像功能來改善磁盤的可靠性。HACMP系列教程(二):規(guī)劃(上)群集的規(guī)劃不僅僅包括在群集中所要使用的硬件類型(CPU、Networks 、disks),也包括其它方面的規(guī)劃,如:資源的規(guī)劃-在故障情況下所希望的群集的表現(xiàn)以及應(yīng)用的考慮等。群集節(jié)點HACMP 支持所有RS/6000系列產(chǎn)品(單處理器、多處理器服務(wù)器以及S

6、P并行機),一個HACMP 群集現(xiàn)在最多可由32個RS6000 服務(wù)器組成,這些服務(wù)器稱為群集節(jié)點。群集節(jié)點及網(wǎng)絡(luò)客戶端通過一個或多個網(wǎng)絡(luò)相互連接,每連接一個網(wǎng)絡(luò)群集節(jié)點需要2塊網(wǎng)卡,第一塊網(wǎng)卡,即網(wǎng)絡(luò)客戶端 連接的網(wǎng)卡(提供給客戶訪問應(yīng)用服務(wù)的網(wǎng)卡),稱做為“服務(wù)/Service”網(wǎng)卡,第二塊網(wǎng)卡稱做為“待機/Standby”網(wǎng)卡,用來在“服務(wù)”網(wǎng)卡 失效時接替其工作。任何RS6000服務(wù)器都能做HACMP群集的群集節(jié)點,在一個群集中的群集節(jié)點沒有嚴格的匹配要求。在選擇 Cluster Node 時,主要是根據(jù)用戶的應(yīng)用和數(shù)據(jù)以及在故障接管后的性能表現(xiàn)來選擇每個系統(tǒng)的CPU和最小配置,而且由

7、于每種類型的機器所提供I/O擴展槽數(shù)不同,為了將 來連接多個網(wǎng)絡(luò)、擴展共享磁盤以及消除網(wǎng)卡、I/O適配器等方面的單點失效問題,應(yīng)有足夠的I/O擴展槽去提供冗余。一般來說,一個節(jié)點對于它所連接的每 一網(wǎng)絡(luò)最多可有7塊standby適配器卡。HACMP和AIX本身對群集節(jié)點的最小要求為16M內(nèi)存和400M硬盤,真正的需求取決于群集節(jié)點上的應(yīng)用。群集網(wǎng)絡(luò)HACMP 群集支持兩種類型的網(wǎng)絡(luò):TCP/IP網(wǎng)絡(luò)和非TCP/IP網(wǎng)絡(luò),它利用這兩種網(wǎng)絡(luò)交換“心跳”信息,來診斷群集中是否出現(xiàn)失效。非TCP/IP網(wǎng)絡(luò)用來 將真正的硬件失效從由于TCP/IP軟件失效而引起的系統(tǒng)失效中區(qū)別開來。如果只使用TCP/IP

8、網(wǎng)絡(luò),當TCP/IP軟件失效時,引起“心跳”停止, HACMP將錯誤地診斷為群集節(jié)點失效,而此時群集節(jié)點仍正常工作。通常,在節(jié)點間所有的網(wǎng)絡(luò)也用于檢查、同步、通訊及觸發(fā)事件。HACMP支持以下TCP/IP網(wǎng)絡(luò)類型:Ethernet、Token-Ring、ATM、FDDI、SLIP、FCS、SP Switch、SOCC、Generic IP。HACMP For AIX在標準以太網(wǎng)接口(en)上經(jīng)過了測試,但在IEEE 802.3 以太網(wǎng)接口(et)上沒有經(jīng)過測試。HACMP 在每個群集中支持32個網(wǎng)絡(luò),每個群集節(jié)點上最多可以有24個TCP/IP 網(wǎng)卡。這些對于網(wǎng)絡(luò)配置提供了很大的靈活性。每一種類

9、型的網(wǎng)絡(luò)接口都有不同的特性,如:speed、ARP等,當使用某種適配器時,需要知道其特性,在 HACMP中一般考慮:Hardware Address Swap- 如果計劃在群集中配置硬件地址交換,則所選擇的網(wǎng)絡(luò)適配器應(yīng)支持此功能。網(wǎng)絡(luò)速度、距離及在同一物理網(wǎng)上的適配器個數(shù)是另一個考慮的因素。如:Ethernet:支持10/100Mbps和硬件地址交換,同一物理網(wǎng)上的適配器個數(shù)限制為29個。FDDI:是100Mpbs的光纖網(wǎng),也支持硬件地址交換。ATM:是155Mbps/625 Mbps點到點連接網(wǎng)絡(luò),不能使用硬件地址交換,在HACMP中它必須做為“private”網(wǎng)絡(luò)來配置。非TCP/IP 網(wǎng)

10、絡(luò)在群集節(jié)點間作為一條專用通路用于互換訊息和“心跳”,以區(qū)別網(wǎng)絡(luò)故障與節(jié)點故障。建議在群集節(jié)點間至少使用一條non-TCP/IP 連接。HACMP支持以下類型的非TCP/IP網(wǎng)絡(luò)類型:Serial(RS-232)、Target-Mode SCSI、Target-Mode SSA。所有以上非TCP/IP網(wǎng)絡(luò)類型都必須在HACMP配置“Network Type”定義中定義為Serial。Serial (RS-232) :每個群集節(jié)點在有一個串行網(wǎng)絡(luò)時需要一個串行端口;若一個群集內(nèi)有兩個以上的群集節(jié)點,串行網(wǎng)絡(luò)要把所有群集節(jié)點連成一個環(huán),這時每個節(jié)點需要兩個串行端口。Target-mode SSA

11、:當使用共享SSA設(shè)備時,在HACMP中可用Target-Mode SSA作為串行網(wǎng)絡(luò)。為了使用Target-Mode SSA,必須使用增強的RAID-5卡(#6215或#5219),卡的微碼水平必須高于1801。Target mode SCSI:當使用共享SCSI設(shè)備時,可以利用SCSI總線交換“心跳”信息。Target-Mode SCSI僅支持差分SCSI-2和差分Wide/FAST SCSI-2設(shè)備,HACMP串行網(wǎng)絡(luò)不支持SCSI/SE及SCSI-2/SE設(shè)備。在一個群集中,不推薦使用超過4個Target-Mode SCSI網(wǎng)絡(luò)。HACMP中網(wǎng)絡(luò)分做公共網(wǎng)絡(luò)、私有網(wǎng)絡(luò)和串行網(wǎng)絡(luò)。公共網(wǎng)

12、絡(luò)用于在群集節(jié)點之間通信和與網(wǎng)絡(luò)客戶端通信,通常是 TCP/IP網(wǎng)絡(luò);私有網(wǎng)絡(luò)僅用于群集之間通信,網(wǎng)絡(luò)客戶端不能訪問,它主要用于在“Concurrent”訪問工作時,群集的“加鎖”管理員通信,它可 以是任何網(wǎng)絡(luò)類型;串行網(wǎng)絡(luò)僅用于“心跳”信息交換(在配置hacmp中,配置network type時,將IP網(wǎng)絡(luò)心跳網(wǎng)絡(luò)定位private,將service/boot/standby定為public)。HACMP上的 TCP/IP網(wǎng)絡(luò)有三個接口,Service、Standby和Boot,實際上是兩塊物理網(wǎng)卡,Service、Boot在一塊物理網(wǎng)卡上, Standby在另一網(wǎng)卡上。三個接口定義三個IP

13、地址,Service地址用于群集節(jié)點之間相互通信和節(jié)點與網(wǎng)絡(luò)客戶端之間相互通信,定義 ServiceIP地址;Boot接口是Service接口的臨時定義,在其上定義BootIP地址,Boot地址是系統(tǒng)啟動時Service網(wǎng)卡的臨時 地址,它僅僅當其節(jié)點失效而其地址被接管后才需要;StandbyIP地址隨時準備接管群集中任何節(jié)點上ServiceIP地址的失效。 ServiceIP地址和BootIP地址在一個邏輯子網(wǎng)上;ServiceIP地址和StandbyIP地址一定在不同邏輯子網(wǎng)上。群集磁盤HACMP群集支持SSA和SCSI磁盤系統(tǒng)。SSA是一種開放的工業(yè)標準,它是一種將主機適配卡與硬盤設(shè)備連

14、接起來的高性能串行互連技術(shù)。SSA 磁盤子系統(tǒng)將適配卡和磁盤連接在一個環(huán)內(nèi),能提供80M 的存取速度。SSA 支持熱拔插,在系統(tǒng)不關(guān)電的情況下可進行SSA磁盤、電纜等部件的更換 。在 每個SSA機箱的背部有4塊“bypass ”卡,每塊卡上有一對連接器用于連接外部SSA電纜或磁盤。bypass卡通過改變跨接位置能夠被設(shè)置為:Automatic mode和Forced Inline mode。當bypass 卡是操作在Automatic mode,它檢測這兩個外部連接器,若至少有一個連接器是連接到power-on SSA 部件或設(shè)備,則它轉(zhuǎn)換到Inline state(連接內(nèi)部SSA環(huán)到外部連接

15、器);如果它檢測到這兩個外部連接器都沒有連接到power-on SSA 部件或設(shè)備,則轉(zhuǎn)換到Bypass state(連接內(nèi)部SSA串),斷開與外部連接器的連接。當bypass卡是操作在Forced Inline mode,它不能實現(xiàn)轉(zhuǎn)換。SSA 技術(shù)有以下優(yōu)點:雙設(shè)備訪問通道;電纜連接簡單,不需要終結(jié)器;更快的訪問速度;可以實現(xiàn)對設(shè)備的并發(fā)存?。徊恍枰隨CSI那樣的仲裁機制;熱插拔的電 纜和磁盤;每個SSA適配器卡提供了非常高的容量,高達127個設(shè)備可以在一個SSA環(huán)中;設(shè)備之間的距離用銅纜時可以長達25米,用光纖可以達到10公 里;自動配置,不需要手工設(shè)置設(shè)備號;SSA是一個開放的標準。

16、在SSA磁盤子系統(tǒng)發(fā)布之后,SCSI磁盤子系統(tǒng)已很少在HACMP高可靠性群集系統(tǒng)中使用。HACMP系列教程(二):規(guī)劃(中)資源規(guī)劃HACMP 給客戶端提供高可用性的資源環(huán)境,當HACMP集群中的節(jié)點失效或按正常程序退出群集時,群集管理器將重新在剩余的節(jié)點中分配資源。在HACMP中定義了 以下資源類型:卷組、磁盤、文件系統(tǒng)、要“Mount”到“網(wǎng)絡(luò)文件系統(tǒng)”上的文件系統(tǒng)、要“Export”到“網(wǎng)絡(luò)文件系統(tǒng)”上的文件系統(tǒng)、 Service IP地址、應(yīng)用程序。· 資源組群集中的每個資源被定義為資源組的一部分,這樣 做可以將有關(guān)聯(lián)的資源聚集在一起,以提供特殊服務(wù);同時,資源組還包括能夠獲

17、得資源及提供這些資源到客戶端的節(jié)點列表。有三種類型的資源組: Cascading、Rotating、Concurrent。每種類型的資源組描述了節(jié)點在群集中的不同關(guān)系類型,及節(jié)點進入或離開群集的不同表現(xiàn)。Cascading資源組中的節(jié)點設(shè)置優(yōu)先等級,優(yōu)先級最高的節(jié)點是活動節(jié)點,控制著整個資源組。當優(yōu)先級最高的節(jié)點失效時,次高優(yōu)先級的節(jié)點控制資源組;當優(yōu)先級最高的節(jié)點重新加入群集時,它將重新獲得對資源組的控制權(quán)。Rotating 資源組涉及的不是連接某一個節(jié)點,而是和多個節(jié)點都有能力采用的共享的IP地址相聯(lián)系,當定義了共享適配卡的第一個節(jié)點加入群集時,它將獲得和共享IP地 址相關(guān)聯(lián)的Rotati

18、ng資源組。當控制Rotating資源組的節(jié)點離開群集時,下一個存在的節(jié)點獲得該Rotating資源組;當該節(jié)點重新加入群 集時,它將處于待機狀態(tài),而不重新獲得該Rotating資源組的控制權(quán)。Concurrent資源組能被多個節(jié)點同時共享,當一個節(jié)點失效時,沒有任何接管工作發(fā)生;當失效節(jié)點重新加入群集時,它將和其它節(jié)點同時訪問Concurrent資源組。對于上述三種資源組分別可用一句話來進行概述:Cascading - 活動節(jié)點使用最高優(yōu)先級控制資源組。Concurrent - 所有活動節(jié)點可訪問資源組。Rotating - 節(jié)點使用rotating資源組的相關(guān)的service IP地址來控

19、制資源組。· 共享邏輯卷在設(shè)計群集時需考慮是否需要配置非同時訪問磁盤和同時訪問磁盤的環(huán)境。非 同時訪問共享磁盤有以下配置方式:Hot-Standby(主備模式,通常為雙機熱備)、Rotating Standby(循環(huán)備份模式)、Mutual Takeover(相互接管,通常為雙機互備)、Third-Party Takeover(第三方接管,三節(jié)點群集)。同時訪問磁盤的配置,通常是所有的磁盤都定義為Concurrent 資源組的一部分,與Concurrent 資源組相關(guān)的節(jié)點無優(yōu)先級之分,當群集中某一節(jié)點出現(xiàn)故障時,發(fā)生的接管不明顯,因為Concurrent 資源組已經(jīng)在群集中的其它節(jié)

20、點上處于激活狀態(tài)了(實際是不存在接管,只是工作量集中到單節(jié)點上)。· IP地址接管IP 地址接管目的是保證服務(wù)器的服務(wù)地址(Service地址)的高可用性,以保證網(wǎng)絡(luò)客戶端能以此相同的地址一直保持與網(wǎng)絡(luò)的連接。為了確證IP地址接管的 實現(xiàn),必須定義:群集中使用的網(wǎng)絡(luò)類型;網(wǎng)絡(luò)的拓撲結(jié)構(gòu);每塊網(wǎng)卡的IP地址,包括ServiceIP、StandbyIP、BootIP和網(wǎng)絡(luò)掩碼;為 Service網(wǎng)卡定義一個交替網(wǎng)卡硬件地址,以便在IP地址接管時實現(xiàn)硬件地址的替換(很少使用)。網(wǎng)絡(luò)拓撲結(jié)構(gòu)有單網(wǎng)絡(luò)結(jié)構(gòu)、雙網(wǎng)絡(luò)結(jié) 構(gòu)和點到點的連接三種類型。如果采用單網(wǎng)絡(luò)結(jié)構(gòu),在這種配置中,群集中的每一個節(jié)點

21、僅連接到一個網(wǎng)絡(luò),對客戶端來說僅一塊service卡是有效的,若 service網(wǎng)卡出現(xiàn)問題,其備援的 standby 卡將獲得它的 IP 地址,繼續(xù)為客戶端提供服務(wù),然而當網(wǎng)絡(luò)本身出現(xiàn)問題時,該網(wǎng)絡(luò)結(jié)構(gòu)出現(xiàn)了單點失效。如果采用雙網(wǎng)絡(luò)結(jié)構(gòu),在這種配置中,每個群集節(jié)點上有兩塊服務(wù)網(wǎng)卡, 連接于兩個不同的網(wǎng)絡(luò),對網(wǎng)絡(luò)客戶端來講有兩個Service地址,當一個網(wǎng)絡(luò)失效時,另一個網(wǎng)絡(luò)還在正常工作,使該節(jié)點繼續(xù)給網(wǎng)絡(luò)客戶端提供服務(wù),從而 避免了由于網(wǎng)絡(luò)故障而出現(xiàn)的單點失效。點到點的連接是相鄰的群集節(jié)點直接互連,SOCC、SLIP、ATM等都是點到點的連接類型。在群集中兩節(jié)點間連接 了一條專用線路,當pu

22、blic網(wǎng)絡(luò)出現(xiàn)故障時,在節(jié)點間提供一替代的通路。在HACMP 群集中,每一個網(wǎng)絡(luò)是由網(wǎng)絡(luò)的名字和屬性定義的。網(wǎng)絡(luò)名:在HACMP環(huán)境中網(wǎng)絡(luò)名是用于標識網(wǎng)絡(luò)的符號值,群集進程使用此信息去確定哪一塊adapter 是連接到了相同的物理網(wǎng)上。如果多個adapter 共享同一物理網(wǎng),當定義這些adapter 時應(yīng)使用相同的網(wǎng)絡(luò)。屬性:區(qū)別該網(wǎng)絡(luò)是Public、Private 還是Serial 。Public:一個public網(wǎng)絡(luò)可連結(jié)2-32個節(jié)點,并允許客戶端去檢測和存取群集節(jié)點。Ethernet、Token-Ring、FDDI、SLIP等都被認為是public網(wǎng)絡(luò),但SLIP不提供客戶端的存取。

23、Private:僅在節(jié)點間提供通信,不支持客戶端的存取。Serial:這個網(wǎng)絡(luò)特性僅用于“non-TCP/IP”網(wǎng)絡(luò)。網(wǎng)絡(luò)適配器用于連接節(jié)點到網(wǎng)絡(luò),在HACMP中,節(jié)點每連接一個網(wǎng)絡(luò),至少要有兩塊網(wǎng)卡:service和standby ,如果定義了IP地址接管,則這塊service網(wǎng)卡也必須定義一個boot地址。每個節(jié)點所允許的最大的網(wǎng)卡個數(shù)是24。在HACMP中,網(wǎng)絡(luò)適配器是由其標記、功能定義的。標記(label):即為/etc/hosts 文件中與IP地址相對應(yīng)的名字。功能(function): 描述該網(wǎng)卡在HACMP中是Service、Standby及Boot。Service 適配器:是在

24、節(jié)點與網(wǎng)絡(luò)之間的主要連接,一個節(jié)點對于它所連接的每一物理網(wǎng)都有一個service 網(wǎng)卡。standby 適配器:是service adapter 的備援。如果service 網(wǎng)卡出現(xiàn)故障時,群集管理器使用service網(wǎng)卡的IP 地址替代了standby 網(wǎng)卡的地址,從而消除了網(wǎng)卡故障所引起的單點失效。對于所連接的每個網(wǎng)絡(luò),節(jié)點可以不要standby 網(wǎng)卡或有17 個網(wǎng)卡,根據(jù)所配置的軟件和硬件插槽而定。在同一系統(tǒng)上,standby adapter 與service adapter 應(yīng)配置為不同的子網(wǎng)。Boot 適配器:如果在群集中定義了IP 地址接管,允許一個節(jié)點去獲得群集中其它節(jié)點的網(wǎng)絡(luò)地

25、址,在群集節(jié)點上,一個boot adapter 地址必須分配給service adapter,也可以說boot 地址是service adapter 的第二個名字和IP 地址。在一個節(jié)點reboot 之后以及HACMP啟動之前使用這個boot 地址,當HACMP軟件在節(jié)點上啟動之后,service adapter 使用service IP地址替代boot 地址而重新被配置。· 定義硬件地址網(wǎng)絡(luò)硬件地址的替換是與IP地址接管合作使用的,它能夠維持IP地址和硬件地址的綁定,當發(fā)生IP地址接管時,將不必要進行網(wǎng)絡(luò)客戶端ARP緩存的刷新。HACMP系列教程(二):規(guī)劃(下)應(yīng)用系統(tǒng)規(guī)劃在HA

26、CMP 內(nèi)組合節(jié)點的中心目的是為了給用戶的重要應(yīng)用和數(shù)據(jù)提供高可用性的環(huán)境,為了將應(yīng)用系統(tǒng)置于HACMP的控制之下,需定義“應(yīng)用服務(wù)器”這樣一個群集資 源,應(yīng)用服務(wù)器是書寫的Script,在其中定義了啟動和停止應(yīng)用系統(tǒng)的命令及路徑;當接管發(fā)生時,HACMP能夠在接管節(jié)點上啟動應(yīng)用。為 了規(guī)劃應(yīng)用,必須要對應(yīng)用比較了解,如:需要多大的磁盤空間、用戶怎樣訪問應(yīng)用等;還應(yīng)該清楚應(yīng)用是否需要license,應(yīng)用系統(tǒng)的“許可證”是 HACMP中必須考慮的問題,有時它是基于CPU的,當主應(yīng)用節(jié)點發(fā)生失效時,另一節(jié)點接管過去,但沒有應(yīng)用系統(tǒng)的“許可證”系統(tǒng)也沒法正常工作。有兩種 方法解決這一問題,一是采用“

27、浮動許可證”,另一是購買“節(jié)點鎖定許可證”。還應(yīng)考慮的一個因素是在接管發(fā)生后,一個節(jié)點將要同時運行幾個應(yīng)用,必須保證應(yīng)用數(shù)據(jù)或資源不能彼此間相互沖突。注意:應(yīng)用服務(wù)器文本在同步期間不被傳輸,在主節(jié)點和接管節(jié)點上應(yīng)保持其有相同的路徑和權(quán)限。用戶ID規(guī)劃對 于HACMP用戶,系統(tǒng)管理員必須在群集節(jié)點上產(chǎn)生相同的用戶帳號,用戶信息也必須保持一致,這樣,當群集節(jié)點出故障時,用戶能夠login 到其它節(jié)點而無需考慮由于UID/GID不一致所引起的問題。用戶的home directory 在群集節(jié)點上也應(yīng)具有相同的路徑和權(quán)限,以保證用戶能夠方便的存取到他們自己的文件。有三種比較好的解決辦法:可以把home

28、 directory建在共享卷組上。NFS - Mount home directory。使用此方法時,但當NFS Server有問題,對home directory 的存取將被拒絕。NFS - Mount共享卷組上的home directory。這是一種組合方法,把home directory 作為資源組的一部分且放在共享卷組上,所有的群集節(jié)點能夠存取。HACMP系列教程(三):安裝準備在安裝HACMP軟件之前,應(yīng)首先安裝AIX操作系統(tǒng)、配置網(wǎng)卡、設(shè)置共享卷組及編輯AIX配置文件。AIX的準備為了使群集中的每個節(jié)點都能夠解析地址,在每個節(jié)點上,編輯/etc/hosts文件,確保群集內(nèi)的所有的

29、接口的IP地址都列在里面。如果使用了域名解析配置,則編輯/etc/resolv.conf 文件。下面是/etc/hosts文件的示例:下面是/etc/resolv.conf 文件示例:編 輯/.rhosts文件,確保群集中每個節(jié)點的服務(wù)網(wǎng)卡和Boot地址都列在里面,這樣做的目的是為了能夠運行 /usr/sbin/cluster/utilities/clruncmd命令和執(zhí)行/usr/sbin/cluster/godm進程。當以一個節(jié)點 為中心配置整個群集時要用到/usr/sbin/cluster/godm進程。同時,在群集同步和檢測功能使用rcmd、rsh命令要用到 /.rhosts 文件,若

30、使用C-SPOC命令也需要此文件。下面是/.rhosts文件的示例:網(wǎng)絡(luò)的連接與測試在網(wǎng)絡(luò)的連接配置中,給系統(tǒng)中的每一塊網(wǎng)卡分配相應(yīng)的IP地址,但是要注意,standby網(wǎng)卡與service網(wǎng)卡應(yīng)在不同的子網(wǎng)上??梢允褂肁IX提供的系統(tǒng)管理工具smit去配置相應(yīng)的網(wǎng)卡,在配置完成之后,能夠使用AIX 命令檢測TCP/IP 子系統(tǒng)是否正常工作。使用ping 命令檢查兩節(jié)點間點到點的連接;在所有adapter上使用ifconfig命令去檢查是否有不正確的IP 地址、子網(wǎng)掩碼和廣播地址;使用lssrc g tcpip命令去確定inetd daemon 是運行的;使用lssrc g portmap命令

31、去確定portmap daemon是運行的;使用arp命令去確定群集中的節(jié)點沒有使用相同的IP 和硬件地址;使用smit tty命令在節(jié)點上產(chǎn)生一個tty 設(shè)備,注意Enable login field應(yīng)設(shè)置為disable 。在配置完之后也應(yīng)測試其功能,可以使用下列命令從一設(shè)備上寫而從另一設(shè)備上讀:cat < /dev/ttyx - 在一節(jié)點上從 /dev/ttyx 設(shè)備讀。cat  /etc/hosts > /dev/ttyy - 在另一設(shè)備/dev/ttyy 上寫。應(yīng)能夠看到,在鍵入第一個命令后處于等待狀態(tài)直到第二個命令被鍵入,才顯示它的輸出。群集磁盤的配置對于群集

32、磁盤的配置,以SSA 為例來說明。在系統(tǒng)boot 期間,AIX配置管理器配置所有available的設(shè)備,當SSA子系統(tǒng)沒有連接或SSA 軟件沒有安裝時,則不能配置。配置管理器將配置以下設(shè)備:Adapter Router (ssar)ssar 僅是概念上的配置幫助且總是定義為“Defined”狀態(tài),不能改變其為“Available”,使用下面的命令可顯示ssar。# lsdev C |grep ssarAdapter定義使用下列命令,可以檢查正確的適配器配置。這個適配器必須處于“Available”狀態(tài)。#lsdev C|grep ssa磁盤定義SSA磁盤在AIX中可表示為SSA 邏輯磁盤(h

33、disk1、hdisk2 )和SSA 物理磁盤(pdisk1、pdisk2 ) ,用下列命令可列出所定義的SSA 邏輯磁盤:#lsdev -Cc disk| grep SSA用下列命令可列出所定義的SSA物理磁盤:#lsdev -Cc pdisk| grep SSA共享邏輯卷的配置在所有節(jié)點上產(chǎn)生VG、LV和文件系統(tǒng),通常采用先在一個節(jié)點上定義,然后在其它節(jié)點上“import”卷組,這保證了定義在ODM 庫中的共享部分在群集中的所有節(jié)點上是相同的。產(chǎn)生non-concurrent 卷組non-concurrent 存取是使用日志文件系統(tǒng)管理數(shù)據(jù)。使用smit mkvg 去產(chǎn)生卷組。產(chǎn)

34、生concurrent卷組concurrent存取是使用原邏輯卷去管理數(shù)據(jù)。必須作為concurrentg capable卷組,使用smit mkvg來產(chǎn)生。產(chǎn)生共享邏輯卷和文件系統(tǒng)使用smit mklv和smit crjfs來產(chǎn)生共享邏輯卷和文件系統(tǒng)。在完成了上述配置后,應(yīng)運行一致性檢查,測試每一個文件系統(tǒng)。1) fsck /filesystem_name2)檢查能夠mount或者umount這個文件系統(tǒng)。#mount /filesystem_name#umount /filesystem_name在群集內(nèi)的其它節(jié)點上import 卷組在原節(jié)點上vary off 卷組(將主節(jié)點上的

35、vg停用)在完成了前面的任務(wù)之后,使用varyoffvg 命令在原節(jié)點上去deactivate 這個共享卷組。#varyoffvg volume_group_name 在卷組上的文件系統(tǒng)應(yīng)被unmount ,否則varyoffvg 命令將報錯。在目標節(jié)點上import 卷組使用smit 或TaskGuide工具在目標節(jié)點上import 卷組。#smit importvg改變卷組的啟動狀態(tài)卷組在import后的缺省配置為自動激活狀態(tài),HACMP環(huán)境要求在系統(tǒng)重新啟動時卷組為非自動激活狀態(tài),因此,在import 卷組后,須重新配置卷組,使用smit chvg命令。#smit 

36、chvg 在目標節(jié)點上vary off卷組使用varyoffvg命令去deactivate這個共享卷組,以使其能夠在群集內(nèi)的其它節(jié)點上import 此卷組。#varyoffvg volume_group_nameHACMP系列教程(四):安裝HACMPHACMP的安裝,涉及大量的文件集,下面對其功能簡單做一描述。cluster.basecluster.cspoccluster.adtcluster.vsm這個可視化系統(tǒng)管理文件集含有HACMP資源圖形化管理的圖標和位圖。cluster.vsm;        

37、60;      HACMP X11 Dependentcluster.haview這個文件集含有在TME 10 Netview環(huán)境下能監(jiān)控HACMP群集所需的文件。它安裝在裝有TME 10 Netview網(wǎng)絡(luò)管理的機器上,而不是裝在群集節(jié)點上。它含有:cluster.haview;            HACMP HAViewcluster.taskguidescluster.clvm.0;   

38、60;        AIX Run-time Executablecluster.hcHACMP系列教程(五):配置定義群集拓撲結(jié)構(gòu)群 集拓撲結(jié)構(gòu)的定義包括:群集的定義、群集節(jié)點定義、網(wǎng)絡(luò)適配器定義、網(wǎng)絡(luò)modules。通過將上述部件的信息輸入到與HACMP關(guān)聯(lián)的ODM庫中來定義 群集拓撲結(jié)構(gòu)。可以利用HACMP SMIT接口或VSM的應(yīng)用xhacmpm來將上述信息輸入到ODM庫中。xhacmpm是一個X Windows工具,它利用圖標來代表HACMP部件來產(chǎn)生群集的配置。· 群集的定義通過群集的ID和名字在HA

39、CMP環(huán)境中定義群集,每一個被定義的群集其ID和名字必須是唯一的。群集的ID是從199999范圍內(nèi)的正整數(shù);名字最多為31個字符。HACMP軟件使用這些信息在ODM庫中產(chǎn)生群集記錄。· 群集節(jié)點定義群集的ID和名字定義完后,需定義群集中的各個節(jié)點,每一個群集節(jié)點需要唯一的名字,群集管理者通過名字去訪問這些節(jié)點。節(jié)點名字最多為31個字符,能夠使用空格符隔開而一次附加多個節(jié)點。節(jié)點名在HACMP中是以它們的ascii順序邏輯的排序,這主要是為了去確定相鄰節(jié)點的“心跳”,為了創(chuàng)建一個邏輯環(huán),一個節(jié)點總是告訴它相鄰的節(jié)點它們的名字的ascii 碼順序。· 網(wǎng)絡(luò)適配器定義在HACMP

40、配置中有許多與網(wǎng)絡(luò)適配器有關(guān)的屬性需要配置,它們是:網(wǎng)絡(luò)適配器IP標簽:即該網(wǎng)卡的名字,如果此網(wǎng)卡作為ServiceIP定義且允許IP地址接管,也須為此網(wǎng)卡定義一BootIP地址。網(wǎng)絡(luò)類型:指明此網(wǎng)卡所連接的網(wǎng)絡(luò)類型,從預(yù)先安裝的網(wǎng)絡(luò)類型中選?。╡ther、rs232)。網(wǎng)絡(luò)名字:該網(wǎng)絡(luò)的標識,群集使用它來確定哪塊適配器連到同一物理網(wǎng),若多個適配器共享同一物理網(wǎng)時,應(yīng)確保每一塊卡使用相同的網(wǎng)絡(luò)名字。網(wǎng)絡(luò)屬性:指明這個網(wǎng)絡(luò)是否為:Public,Private,Serial。網(wǎng) 卡功能:指明這個網(wǎng)卡的功能是否為:Service、Standby、Boot。節(jié)點對于每一個public、private網(wǎng)

41、絡(luò)有單獨的service adapter;一個單獨的serial網(wǎng)絡(luò)僅有一個單獨的service adapter。對于每一個public網(wǎng)絡(luò)節(jié)點可沒有、有一個或多個standby網(wǎng)卡;而對于private、serial網(wǎng)絡(luò)除ATM外,沒有 standby網(wǎng)卡。網(wǎng)卡標識:IP地址,在non-serial網(wǎng)絡(luò)適配器僅要求IP地址;serial網(wǎng)絡(luò)適配器必須為設(shè)備文件名,如:rs232為/dev/ttyx 。網(wǎng)卡的硬件地址:這是一個可選項,僅當定義服務(wù)網(wǎng)卡時,此網(wǎng)卡上已定義了BOOT IP地址,而又希望硬件地址交換時定義,這個硬件地址在物理網(wǎng)上應(yīng)是唯一的。節(jié)點名字:這些網(wǎng)卡所在的節(jié)點的名字。

42、3; 網(wǎng)絡(luò)modules的定義在 被配置的HACMP群集中,每一個被支持的群集網(wǎng)絡(luò)都有一個相應(yīng)的群集網(wǎng)絡(luò)module,用于監(jiān)視到它的群集網(wǎng)絡(luò)的所有I/O 。網(wǎng)絡(luò)module是在HACMP軟件安裝時預(yù)安裝了。在群集中,每一個module維護與其它網(wǎng)絡(luò)module的連接,群集管理者通過這些連接在群集節(jié) 點上相互發(fā)送信息,它也通過周期性的發(fā)送、接收群集內(nèi)其它網(wǎng)絡(luò)module 的“心跳”信息來檢測互通性,當“心跳”數(shù)少于臨界值時,報告群集管理者有一個真實的故障。(群集通過network的modules之間的通信來檢測心 跳信息)當前,網(wǎng)絡(luò)modules在下列網(wǎng)絡(luò)類型上支持通信:serial ( rs2

43、32 )、Target mode SCSI 、Targer mode SSA 、IP、Ethernet 、Token Ring、FDDI 、ATM、SLIP 、SP Switch、SOCC。一般情況下,不需要改變網(wǎng)絡(luò)module 的屬性,其改變將影響對故障的檢測速率。有三種值可選:Fast、Normal、Slow。缺省值為:Normal。在決定改變時應(yīng)注意:故障的檢測速率 是依賴于兩節(jié)點間的最快的網(wǎng)絡(luò)連接;較快的“心跳”速率可以導(dǎo)致錯誤的故障檢測,特別是在繁忙的網(wǎng)絡(luò)上,可引起“心跳”延遲,從而導(dǎo)致節(jié)點不真實地從群集 中退出,并且較快的“心跳”也將增加網(wǎng)絡(luò)負擔。如果出現(xiàn)了上述故障,可以調(diào)慢“心跳

44、”的檢測速率去避免這種問題的再次發(fā)生。同步群集的拓撲結(jié)構(gòu)節(jié) 點的同步是為了保障在一個群集中所有節(jié)點的ODM庫是一致的,否則HACMP在啟動時將發(fā)生運行錯誤。即使群集內(nèi)僅定義了一個節(jié)點,也必須進行節(jié)點的同 步。在同步群集的拓撲結(jié)構(gòu)之前,應(yīng):群集內(nèi)的所有節(jié)點必須加電;HACMP 軟件必須要安裝;所有節(jié)點上的/etc/hosts和/.rhosts文件要包含全部群集的Boot、Service、Standby IP Labels。定義資源HACMP中主要包括以下硬件和軟件資源:磁盤、卷組、文件系統(tǒng)、網(wǎng)絡(luò)地址、應(yīng)用系統(tǒng)。將 相關(guān)聯(lián)的資源為了管理和配置方便邏輯上組織在一起,就是資源組??梢耘渲妹總€資源組在一

45、組節(jié)點中有一個特定類型的相互關(guān)系,相互關(guān)系的類型有: Cascading, Rotating, Concurrent三種。因此,在定義完群集拓撲結(jié)構(gòu)后,必須定義資源,它包括:配置資源組(定義相互關(guān)系類型);為每個資源組添加資源;為每個節(jié)點設(shè) 置運行時間參數(shù);同步群集節(jié)點。配置資源組主要是告訴ODM庫資源組的名字,參與的節(jié)點及相互關(guān)系。在參與節(jié)點選項的區(qū)域中,節(jié)點輸入的順序,代表節(jié)點的優(yōu)先級高低,高者在前,低者在后。配置完資源組后,就要依次為每個資源組添加資源。有兩個運行時間參數(shù)可以調(diào)整,一個是為調(diào)試方便設(shè)置的Log文件的水平;另一個是依據(jù)節(jié)點是否使用NIS或DNS,當它們干擾運行時HACMP管

46、理員是否可以關(guān)掉它們。應(yīng)用服務(wù)器也是能夠在資源組中配置的一種資源,它表明了啟動和停止應(yīng)用程序的Script的名字、路徑。在每個服務(wù)節(jié)點上,Script必須具有相同的路徑和名字,但內(nèi)容可有所不同。在 資源組中定義完資源及相互關(guān)系后,必須在所有節(jié)點上進行資源的同步,但應(yīng)注意,當群集被配置且首次同步時,群集內(nèi)的所有被配置節(jié)點使用的是它們的boot 地址,如果沒有boot 地址,HACMP將不更新/etc/ 文件,這在節(jié)點重新進入群集時將產(chǎn)生問題。HACMP系列教程(六):狀態(tài)檢查在開始測試HACMP配置之前,首先必須保證群集節(jié)點是在一穩(wěn)定的狀態(tài),主要包括以下方面:設(shè)備狀態(tài)、系統(tǒng)參數(shù)、進程、網(wǎng)絡(luò)適配器

47、、群集。設(shè)備狀態(tài)運行diag a清除VPD。使用命令errpt  -a |more檢查不正常的錯誤。使用命令lsattr El ascsi0檢查在共享總線上的適配器scsi 地址。系統(tǒng)參數(shù)使用命令date檢查群集內(nèi)所有節(jié)點的時鐘是相同的。確定license 的用戶數(shù)是正確的。使用命令sysdumpdev l 和sysdumpdev e確定dump空間是足夠的。使用命令crontab l檢查定時提交的作業(yè)。進程狀態(tài)檢查頁空間(lsps a)檢查不期望的進程(ps ef |more)網(wǎng)絡(luò)狀態(tài)檢查網(wǎng)卡的狀態(tài)(ifconfig en0)檢查節(jié)點的網(wǎng)絡(luò)配置(netstat in)檢查

48、路由(netstat nr)檢查ipforwarding和ipsendredirects的設(shè)置(no a |more)檢查所有接口的通信(ping < ip-address > )檢查TCP/IP daemon的狀態(tài)(lssrc g tcpip)確定/etc/hosts文件的內(nèi)容是正確的如果使用了DNS,檢查定義的DNS服務(wù)器是正確的(more /etc/resolv.conf )群集狀態(tài)檢查群集進程的狀態(tài)(lssrc g lock 和lssrc g cluster)運行/usr/sbin/cluster /clstat 檢查群集和網(wǎng)絡(luò)接口的狀態(tài) 檢查群集的log文件 tail f

49、 /tmp/hacmp.out tail f /var/adm/cluster.log more /tmp/cm.log more /usr/sbin/cluster/history/cluster.mmdd檢查節(jié)點名是正確的(odmget HACMPcluster)運行/usr/sbin/cluster/diag/clconfig v 'tr' 檢查群集的配置運行/usr/sbin/cluster/utilities/cllscf 顯示群集的配置確定群集的版本:snmpinfo m dump o /usr/sbin/cluster/hacmp.defs clstrmgrHAC

50、MP系列教程(七):故障模擬為了檢測HACMP的配置是否正確,我們可以模擬一些硬件和軟件錯誤。假如現(xiàn)有一環(huán)境:群集中定義了兩個節(jié)點,配置了 cascading資源組,使用“ nodeF ”表示故障節(jié)點,“nodeT”表示接管節(jié)點。適配器故障· 接口故障檢查群集內(nèi)的所有節(jié)點是運行的。在節(jié)點nodeF上使用命令(errclear 0)刪除錯誤記錄。監(jiān)視節(jié)點nodeT上的群集log 文件。在節(jié)點nodeF上shut off 服務(wù)(service)接口(如:ifconfig en0 down),這將引起本節(jié)點的standby接管service IP地址。HACMP轉(zhuǎn)換原來的服務(wù)(s

51、ervice)接口為備援(standby)接口。使用ifconfig命令(如:ifconfig en1 down)轉(zhuǎn)換服務(wù)地址(service IP)返回到原來的服務(wù)接口。· 適配器或電纜故障檢查群集內(nèi)的所有節(jié)點是運行的。在節(jié)點nodeF上使用命令(errclear 0)刪除錯誤記錄。監(jiān)視節(jié)點nodeT上的群集log文件。在節(jié)點nodeF上從服務(wù)接口(service)斷開網(wǎng)絡(luò)電纜,這將引起本節(jié)點的standby接管service IP 地址。檢查是否接管。重新連接網(wǎng)絡(luò)電纜到服務(wù)(service )接口,將使得原來的服務(wù)接口(service)成為備援接口(standby)。從新的服務(wù)接

52、口(原來的 standby)斷開網(wǎng)絡(luò)電纜,這將使服務(wù)接口接管回service IP地址。檢查是否接管。重新連接網(wǎng)絡(luò)電纜到原來的備援(standby)接口,檢查此接口是使用standby IP地址操作。節(jié)點故障· AIX crash檢查群集內(nèi)的所有節(jié)點是運行的。在節(jié)點nodeF上使用命令(errclear 0)刪除錯誤記錄。在節(jié)點nodeT上監(jiān)測群集log 文件。使用命令(cat  /etc/hosts > /dev/kmem)去crash節(jié)點nodeF,(在nodeF上LED將顯示888)。在節(jié)點nodeF上操作系統(tǒng)(OS)故障將引起節(jié)點nodeT 去接管。檢測這個接

53、管的發(fā)生。使用命令ping或netstat i檢查網(wǎng)絡(luò)。使用命令lsvg 0或vi檢測卷組和文件。使用命令ps ef 檢測應(yīng)用進程。重新加電節(jié)點nodeF且啟動HACMP(smitty clstart),節(jié)點nodeF將接管回Casscading 資源組。檢測這個節(jié)點重新加入群集后所發(fā)生的資源接管。使用命令ping或netstat i檢查網(wǎng)絡(luò)。使用命令lsvg 0 或vi檢測卷組和文件。使用命令ps ef 檢測應(yīng)用進程。· cpu 損壞檢查群集內(nèi)的所有節(jié)點是運行的。在節(jié)點nodeF上使用命令(errclear 0)刪除錯誤記錄。在節(jié)點nodeT上監(jiān)測群集log 文件。power of

54、f 節(jié)點nodeF,將引起節(jié)點nodeT去接管節(jié)點nodeT的資源。檢測這個接管的發(fā)生。使用命令ping 或netstat i 檢查網(wǎng)絡(luò)。使用命令lsvg 0 或vi檢測卷組和文件。使用命令ps ef檢測應(yīng)用進程。重新加電節(jié)點nodeF且啟動HACMP(smitty clstart),節(jié)點nodeF將接管回Casscading 資源組。檢測節(jié)點重新加入群集后所發(fā)生的資源接管。使用命令ping 或netstat i 檢查網(wǎng)絡(luò)。使用命令lsvg 0 或vi 檢測卷組和文件。使用命令ps ef 檢測應(yīng)用進程。網(wǎng)絡(luò)故障· TCP/IP子系統(tǒng)故障檢查群集內(nèi)的所有節(jié)點是運行的。在節(jié)點nodeF上

55、使用命令(errclear 0)刪除錯誤記錄。在節(jié)點nodeT上監(jiān)測群集log文件。在 節(jié)點nodeF上,停止TCP/IP子系統(tǒng)(sh /etc/tcp.clean)或通過增大sb_max 和thewall參數(shù)值去crash 這個子系統(tǒng),ping節(jié)點nodeT 。(no o sb_max=10000 ;no o thewall=10000)記住原來的值以便恢復(fù)。TCP/IP子系統(tǒng)故障在節(jié)點nodeF上將產(chǎn)生一個網(wǎng)絡(luò)故障。檢查是否發(fā)生接管。使用命startsrc g tcpip重新啟動TCP/IP daemon。· 網(wǎng)絡(luò)故障檢查群集內(nèi)的所有節(jié)點是運行的。在節(jié)點nodeF上使用命令(er

56、rclear 0)刪除錯誤記錄。在節(jié)點nodeT上監(jiān)測群集log文件。同時斷開服務(wù)(service)接口和備援(standby)接口的網(wǎng)絡(luò)電纜,將引起HACMP檢測到一network_down事件。檢查是否發(fā)生接管。應(yīng)用故障在缺省情況下,HACMP不識別應(yīng)用故障,但可以通過用戶化定義,使應(yīng)用故障升級為HACMP可識別的故障,所以須熟悉應(yīng)用及分析應(yīng)用可能的故障。HACMP系列教程(八):管理(上)通常HACMP在正常工作情況下很少要求干預(yù),但如果出現(xiàn)一些問題,應(yīng)能夠通過故障現(xiàn)象、系統(tǒng)和用戶提供的信息、錯誤log以及診斷來確定,及時的加以解決。群集的log文件含有HACMP在運行中,它的scrip

57、t 和daemon 產(chǎn)生的信息,一般這些信息是發(fā)送到系統(tǒng)控制臺和相關(guān)的群集log文件 。對于HACMP群集的啟動/停止、資源的改變與配置以及群集的監(jiān)測,有多種方法和工具。HACMP提供以下工具去檢測群集:clstat 命令HACMP 提供/usr/sbin/cluster/clstat 命令去監(jiān)測群集和它的各個部分,可以在字符終端和圖形終端上運行,它主要報告cluster是否 up、down or unstable,也報告群集node是否up /down / joining / leaving  or  reconfiguring以及cluster中的number of&#

58、160; node。對于每一個群集node,clstat顯示node中所接的每塊網(wǎng)卡的address和IP label,以及這個接口是否up or down。HAviewHAview(AIX graphical network management interface)是一個群集檢測工具,使用SNMP(Simple Network Management Protocol )協(xié)議,NetView通過網(wǎng)絡(luò)從單一node去監(jiān)測cluster和相關(guān)部件的狀態(tài)。Daemon 狀態(tài)使用SMIT Show Cluster Services顯示HACMP的daemon的狀態(tài)。Cluster log fileHACMP 將它所產(chǎn)生的信息寫到system console和若干log文件,因為每一個log文件包含有不同的內(nèi)容,應(yīng)查看不同的log文件以確定群集的狀態(tài)。/var/adm/cluster.log是一個主要的HACMP log文件,有關(guān)HACMP的錯誤信息及相關(guān)事件的信息按照它們發(fā)生的日期和時間順序記錄在這個log文件中。/tmp/hacmp.out此文件記錄configuration和startup scripts在執(zhí)行中產(chǎn)生的輸出。這些信息增補和擴展了/var/adm/cluster.l

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論