easystack云平臺(tái)運(yùn)維操作守則_第1頁(yè)
easystack云平臺(tái)運(yùn)維操作守則_第2頁(yè)
easystack云平臺(tái)運(yùn)維操作守則_第3頁(yè)
easystack云平臺(tái)運(yùn)維操作守則_第4頁(yè)
easystack云平臺(tái)運(yùn)維操作守則_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、目 錄1、總則. - 2 -2、編制方法. - 2 -4、運(yùn)維服務(wù)管理體系. - 4 -4.1 運(yùn)維服務(wù)管理對(duì)象. - 4 -4.2 運(yùn)維系統(tǒng)功能框架 . - 5 -4.4臺(tái)運(yùn)維服務(wù)流程. - 6 -臺(tái)工作流程圖. - 6 -4.4.14.4.2 服務(wù)臺(tái). - 6 -4.4.3 事件管理. - 7 -4.4.4 工單管理. - 7 -4.4.5 問(wèn)題管理. - 7 -4.4.6 變更管理. - 8 -4.4.7 配置管理. - 9 -4.4.8 知識(shí)庫(kù)管理.- 10 -.- 10 -4.4.9 統(tǒng)計(jì)及5、臺(tái)運(yùn)維服務(wù)內(nèi)容.- 10 -5.2IT 資產(chǎn)統(tǒng)計(jì)服務(wù). - 10 -5.1 服務(wù)目標(biāo). -

2、 11 -5.3臺(tái)運(yùn)維服務(wù). - 11 -6、應(yīng)急服務(wù)響應(yīng)措施.- 12 -6.1 突發(fā)事件應(yīng)急策略. - 12 -7、服務(wù)管理制度規(guī)范.- 13 -7.1 服務(wù)時(shí)間. - 13 -1、總則第一條為保障 EasyStack 客戶私有臺(tái)的良好運(yùn)行,使運(yùn)維的運(yùn)維工作制度化、流程化、規(guī)范化,特制訂本制度。第二條運(yùn)維工作總體目標(biāo):立足根本促發(fā)展,開(kāi)拓運(yùn)維新局面。在企業(yè)發(fā)展壯大時(shí)期,通過(guò)網(wǎng)絡(luò)、系統(tǒng)等的運(yùn)維,促進(jìn)客戶云穩(wěn)定可持續(xù)性發(fā)展。第三條運(yùn)維管理制度的適用范圍:EasyStack 運(yùn)維和實(shí)施全體。2、編制方法本實(shí)施細(xì)則包括運(yùn)維服務(wù)全生命周期管理方法、管理、管理模式、管理支撐工具、管理對(duì)象以及基于流程的

3、管理方法。本實(shí)施細(xì)則以ITIL/ISO20000為基礎(chǔ),以信息化項(xiàng)目的運(yùn)維為目標(biāo),以管理支撐工具為,以流程化、規(guī)范化、標(biāo)準(zhǔn)化管理為方法,以全生命周期的PDCA循環(huán)為途徑,體現(xiàn)了對(duì)openstack運(yùn)維服務(wù)全過(guò)程的體系化管理。3、運(yùn)維部工作職責(zé)一、負(fù)責(zé)臺(tái)項(xiàng)目運(yùn)維和技術(shù)支持(一)支持和保障客戶臺(tái)日常運(yùn)維和緊急故障處理,根據(jù)客戶所遇到的運(yùn)維問(wèn)題進(jìn)行快速響應(yīng)、處理、恢復(fù),以保障臺(tái)健康,平穩(wěn)運(yùn)行。(二)根據(jù)客戶對(duì)臺(tái)的項(xiàng)目的需求,負(fù)責(zé) ESCloud臺(tái)項(xiàng)目整體規(guī)劃、項(xiàng)目實(shí)施、實(shí)施方案編寫、項(xiàng)目,保障臺(tái)按照客戶需求順利實(shí)施。(三)負(fù)責(zé)臺(tái)使用培訓(xùn)和操作使用指南編寫,對(duì)用戶使用過(guò)出現(xiàn)問(wèn)題的溝通和解決;(四)ES

4、Cloud臺(tái)作規(guī)程和應(yīng)用管理制度的制定,并負(fù)責(zé)監(jiān)督執(zhí)行。(五)臺(tái)日常運(yùn)行過(guò)和技術(shù)問(wèn)題的協(xié)調(diào)解決,保障臺(tái) 24 小時(shí)安全穩(wěn)定運(yùn)行。(六)負(fù)責(zé)臺(tái)系統(tǒng)及設(shè)備口令的設(shè)置和保存,口令設(shè)置后備案,口令設(shè)定后任何人不得隨意更改。(七)負(fù)責(zé)臺(tái)新程序、新系統(tǒng)和臺(tái)升級(jí)方案技術(shù)的設(shè)計(jì)開(kāi)發(fā)。二、負(fù)責(zé)臺(tái)信息和技術(shù)安全(一)執(zhí)行國(guó)家和省上有關(guān)網(wǎng)絡(luò)安全的,與通信管理和部門聯(lián)絡(luò),及時(shí)處理臺(tái)安全方面存在,確保臺(tái)安全、穩(wěn)定、可靠運(yùn)行。(二)ESCloud臺(tái)安全制度和工作流程的制定,安全責(zé)任制,執(zhí)行“誰(shuí)主管、誰(shuí)負(fù)責(zé),誰(shuí)主辦、誰(shuí)負(fù)責(zé)”的原則,責(zé)任到人。( 三 )在服務(wù)器和計(jì)算機(jī)之間設(shè)置硬件,在服務(wù)器及工作站上均安裝防,進(jìn)行硬件和技術(shù)

5、雙保護(hù),確保 ESCloud臺(tái)不受和。(四)負(fù)責(zé)臺(tái)安全應(yīng)急處理預(yù)案制定和實(shí)施。(五)安排專人臺(tái)各頻道,各頁(yè)面,各版塊,各欄目信息內(nèi)容,建立臺(tái)安全值班登記制度,發(fā)現(xiàn)問(wèn)題及時(shí)處理,并登記問(wèn)題和處理結(jié)果登記;(六)建立多機(jī)備份臺(tái)信息服務(wù)系統(tǒng)機(jī)制,一旦主系統(tǒng)遇到故障或受到導(dǎo)致不能正常運(yùn)行,可以在最短的時(shí)間內(nèi)替換主系統(tǒng)提供服務(wù)。4、運(yùn)維服務(wù)管理體系運(yùn)維服務(wù)管理體系規(guī)定了運(yùn)維活動(dòng)涉及的各類實(shí)體,以及這些實(shí)體間的相互關(guān)系。相關(guān)的實(shí)體按照運(yùn)維服務(wù)管理體系進(jìn)行有機(jī)組織,并協(xié)調(diào)工作,按照服務(wù)協(xié)議要求提供不同級(jí)別的IT運(yùn)維服務(wù)。4.1 運(yùn)維服務(wù)管理對(duì)象運(yùn)維服務(wù)管理對(duì)象包括基礎(chǔ)設(shè)施、應(yīng)用系統(tǒng)、用戶、供應(yīng)商、以及IT運(yùn)

6、維部門和,具體內(nèi)容如下:(1)基礎(chǔ)設(shè)施包括網(wǎng)絡(luò)、主機(jī)系統(tǒng)、/備份系統(tǒng)、終端系統(tǒng)、安全系統(tǒng)、以及機(jī)房動(dòng)力環(huán)境等。(2)應(yīng)用系統(tǒng)包括辦公系統(tǒng)、面向公眾的應(yīng)用系統(tǒng)等。(3)用戶包括使用如上應(yīng)用系統(tǒng)的用戶。(4)供應(yīng)商包括基礎(chǔ)設(shè)施和應(yīng)用系統(tǒng)的供應(yīng)商以及IT運(yùn)維服務(wù)的供應(yīng)商。(5)運(yùn)維部門和包括參與運(yùn)維活動(dòng)的相關(guān)部門和,以及提供運(yùn)維服務(wù)的企業(yè)和相關(guān)。4.2 運(yùn)維系統(tǒng)功能框架根據(jù)建設(shè)的系統(tǒng)結(jié)構(gòu)和業(yè)務(wù)開(kāi)展需要,運(yùn)維項(xiàng)目組將項(xiàng)目的框架分為9個(gè)具體組成部分,分別為:服務(wù)臺(tái)、時(shí)間管理。工單管理、問(wèn)題管理、變更管理、配置管理、工程師考核、知識(shí)庫(kù)管理、統(tǒng)計(jì)、系統(tǒng)管理等9個(gè)子項(xiàng)。而具體運(yùn)維流程將以此為依據(jù)開(kāi)展工作。4.

7、4臺(tái)運(yùn)維服務(wù)流程臺(tái)運(yùn)維服務(wù)管理流程涉及服務(wù)臺(tái)、事件管理、問(wèn)題管理、配置管理、變更管理、發(fā)布管理、服務(wù)級(jí)別管務(wù)管理、能力管理、可用性管理、服務(wù)持續(xù)性管理、知識(shí)管理及供應(yīng)商管理等,隨著運(yùn)維活動(dòng)的不斷深入和持續(xù)改進(jìn),其他流程可能會(huì)逐步獨(dú)立并規(guī)范。4.4.1臺(tái)工作流程圖4.4.2 服務(wù)臺(tái)服務(wù)臺(tái)是支持運(yùn)維服務(wù)的功能,與各個(gè)流程聯(lián)系密切。所有管理流程都要通過(guò)服務(wù)臺(tái)為用戶提供單點(diǎn)聯(lián)系,解答用戶的相關(guān)問(wèn)題和需求,或?yàn)橛脩魧で笙鄳?yīng)的支持,EasyStack 為客戶提供了 400接入,7*24 接受客戶運(yùn)維事件,根據(jù)事件的類型分類處理;4.4.3 事件管理事件管理流程的主要目標(biāo)是盡快恢復(fù)服務(wù)提供并減少其對(duì)業(yè)務(wù)的不

8、利影響,盡可能保證最好的服務(wù)質(zhì)量和可用性等級(jí)。事件管理流程通常涉及事件的偵測(cè)和、事件的分類和支持、事件的和、事件的解決和恢復(fù)以及事件的關(guān)閉。Easystack 把服務(wù)請(qǐng)求和歸結(jié)為事件。事件管理是提供服務(wù)臺(tái)和事件管理者對(duì)于事件、處理、查詢、審核、派發(fā)等功能。它也包括通過(guò)和第系統(tǒng)對(duì)接,把其發(fā)送形成事件的功能。4.4.4 工單管理工單管理:工單是現(xiàn)場(chǎng)運(yùn)維、二線支持的任務(wù)載體,運(yùn)維工程依據(jù)所接收工單進(jìn)行運(yùn)維工作。工單管理是對(duì)工單實(shí)現(xiàn)創(chuàng)建、變更、查詢?yōu)g覽、派發(fā)、監(jiān)督等功能的模塊。4.4.5 問(wèn)題管理問(wèn)題管理流程的主要目標(biāo)是預(yù)防問(wèn)題和事故的再次發(fā)生,并將未能解決的事件的影響降低到最小。問(wèn)題管理流程包括事件

9、根本原因和確定問(wèn)題解決方案所需要的活動(dòng),通過(guò)合適的控制過(guò)程,尤其是變更管理和發(fā)布管理,負(fù)責(zé)確保解決方案的實(shí)施。問(wèn)題管理還將有關(guān)問(wèn)題、應(yīng)急方案和解決方案的信息。EasyStack 會(huì)針對(duì)客戶反饋和處理的結(jié)果在每個(gè)客戶的所歸類處理情況中,以和每個(gè)客戶環(huán)境的處理情況。4.4.6 變更管理變更管理實(shí)現(xiàn)所有基礎(chǔ)設(shè)施和應(yīng)用系統(tǒng)的變更,變更管理應(yīng)并對(duì)所有要求的變更進(jìn)行分類,應(yīng)評(píng)估變更請(qǐng)求的風(fēng)險(xiǎn)、影響和業(yè)務(wù)收益。其主要目標(biāo)是以對(duì)服務(wù)最小的干擾實(shí)現(xiàn)有益的變更。變更管理是要對(duì)資源的新增、變更、升級(jí)等運(yùn)維活動(dòng)進(jìn)行審核的功能,以免這些活動(dòng)對(duì)現(xiàn)有資源的可用性造成沒(méi)有必要的影響和破壞;同時(shí),他還要實(shí)現(xiàn)在工單中產(chǎn)生的變化進(jìn)

10、行后審計(jì)的功能。EasyStack 針對(duì)客戶環(huán)境中運(yùn)維配置變更,需要以郵件的形式發(fā)配置變更流程,模板如下:xx 客戶環(huán)境變更操作單客戶名稱:變更時(shí)間YYYY-MM-DDHH:mm操作人/李四審核人風(fēng)險(xiǎn)能否回退變更 目的風(fēng)險(xiǎn) 描述4.4.7 配置管理配置管理流程負(fù)責(zé)核實(shí)基礎(chǔ)設(shè)施和應(yīng)用系統(tǒng)中實(shí)施的變更以及配置項(xiàng)之間的關(guān)系是否已經(jīng)被正確下來(lái);確保配置管理數(shù)據(jù)庫(kù)能夠準(zhǔn)確地反映現(xiàn)存配置項(xiàng)的實(shí)際版本狀態(tài)。配置管理實(shí)際上是全部資源的管理的功能,包括資源整個(gè)生變更 步驟回滾 步驟命周期的參數(shù)或配置的變化的管理。管理信息主要涉及分類、型號(hào)、版本、位置,狀態(tài)、相關(guān)資料等基本信息還包括參數(shù)等 ,對(duì)于運(yùn)維過(guò)的每次配置

11、變更,EasyStack 會(huì)將配置變更在confluence 上,以追蹤客戶環(huán)境的變更情況。4.4.8 知識(shí)庫(kù)管理知識(shí)庫(kù)管理:知識(shí)庫(kù)是提供給運(yùn)維重要的技術(shù)資料內(nèi)容,他匯集在工作的遇到的典型案例歸納總結(jié)的知識(shí)要點(diǎn)和全面實(shí)用資料手冊(cè),提供了的 wiki 站點(diǎn),匯集日常運(yùn)維處理,并定期更新到 EasyStack 運(yùn)維操作手冊(cè)。4.4.9 統(tǒng)計(jì)及運(yùn)維管理系統(tǒng)提供一線解決率統(tǒng)計(jì)、客戶滿意度統(tǒng)計(jì)、按分類的事件匯總統(tǒng)計(jì)、生成的功能,按照一定格式根據(jù)事件數(shù)據(jù)、工單數(shù)據(jù)、問(wèn)題數(shù)據(jù)、配置數(shù)據(jù)、變更數(shù)據(jù)可以幫助運(yùn)維管理者能把運(yùn)維的所做的工作內(nèi)容清晰的羅列出來(lái)。5、臺(tái)運(yùn)維服務(wù)內(nèi)容5.2IT 資產(chǎn)統(tǒng)計(jì)服務(wù)服務(wù)內(nèi)容包括:

12、硬件設(shè)備型號(hào)、數(shù)量、版本等信息統(tǒng)計(jì)產(chǎn)品型號(hào)、版本和補(bǔ)丁等信息統(tǒng)計(jì)網(wǎng)絡(luò)結(jié)構(gòu)、網(wǎng)絡(luò)路由、網(wǎng)絡(luò) IP 地址統(tǒng)計(jì)綜合布線系統(tǒng)結(jié)構(gòu)圖的繪制其它附屬設(shè)備的統(tǒng)計(jì)5.1 服務(wù)目標(biāo)臺(tái)運(yùn)維項(xiàng)目組提供的運(yùn)行服務(wù)包括,信息系統(tǒng)相關(guān)的主機(jī)設(shè)備、操作系統(tǒng)、數(shù)據(jù)庫(kù)和設(shè)備的運(yùn)行服務(wù),保證用戶現(xiàn)有的信息系統(tǒng)的正常運(yùn)行,降低整體管理成本,提高網(wǎng)絡(luò)信息系統(tǒng)的整體服務(wù)水平。同時(shí)根據(jù)日常的數(shù)據(jù)和,提供用戶信息系統(tǒng)的整體建設(shè)規(guī)劃和建議,更好的為用戶的信息化發(fā)展提供有力的保障。用戶信息系統(tǒng)的組成主要可分為兩類:硬件設(shè)備和系統(tǒng)。硬件設(shè)備包括網(wǎng)絡(luò)設(shè)備、主機(jī)設(shè)備、設(shè)備等;設(shè)備可分為操作系統(tǒng)、典型應(yīng)用(如:數(shù)據(jù)庫(kù)、中間件等)、業(yè)務(wù)應(yīng)用等。服務(wù)項(xiàng)目

13、范圍覆蓋的信息系統(tǒng)資源以下方面的關(guān)鍵狀態(tài)及參數(shù)指標(biāo):運(yùn)行狀態(tài)、故障情況配置信息可用性情況及健康狀況性能指標(biāo)5.3臺(tái)運(yùn)維服務(wù)提供的Openstack臺(tái)、分布式系統(tǒng)ceph 的運(yùn)維服務(wù)包括:臺(tái)控制節(jié)點(diǎn)、臺(tái)計(jì)算節(jié)點(diǎn)、臺(tái)節(jié)點(diǎn)的日常,設(shè)備的運(yùn)行狀態(tài),故障處理,操作,補(bǔ)丁升級(jí)等內(nèi)容。進(jìn)行管理的內(nèi)容包括:CPU 性能管理;內(nèi)存使用情況管理;硬盤利用情況管理;系統(tǒng)進(jìn)程管理;主機(jī)性能管理;主機(jī)硬盤運(yùn)行狀態(tài);主機(jī)系統(tǒng)文件系統(tǒng)管理;交換機(jī)設(shè)備狀態(tài)、端口狀態(tài)、傳輸速度;對(duì)的性能(如高速緩存、光纖通道等)進(jìn)行。6、應(yīng)急服務(wù)響應(yīng)措施運(yùn)維項(xiàng)目組制定了詳盡的應(yīng)急處理預(yù)案,整個(gè)流程嚴(yán)謹(jǐn)而有序。但在服務(wù)過(guò),意外情況將難以完全避免

14、。對(duì)項(xiàng)目實(shí)施的突發(fā)風(fēng)險(xiǎn)進(jìn)行詳細(xì)分析,并且針對(duì)各類突發(fā)事件,設(shè)計(jì)了相應(yīng)的預(yù)防與解決措施,同時(shí)提供了完整的應(yīng)急處理流程。6.1 突發(fā)事件應(yīng)急策略(1)值班平時(shí)應(yīng)做好應(yīng)急事件的工作,對(duì)于突發(fā)事件應(yīng)認(rèn)真分析、準(zhǔn)確判定故障發(fā)生的數(shù)據(jù)域,負(fù)責(zé)該事件直至其結(jié)束。對(duì)于不在運(yùn)維中心的故障,應(yīng)在第一時(shí)間內(nèi)通知去現(xiàn)場(chǎng)處理,密切關(guān)注事件流程及進(jìn)展情況,并做好登記工作上報(bào)。(2)正常情況下,要求值班在 10 分鐘內(nèi)進(jìn)行事件確認(rèn)。如果屬于一般事件則按照事件流程進(jìn)行分派處理,否則應(yīng)迅速啟動(dòng)應(yīng)急預(yù)案,并嚴(yán)格按照應(yīng)急預(yù)案所規(guī)定的步驟快速實(shí)施應(yīng)急處置,及時(shí)匯報(bào),掌握實(shí)時(shí)處理情況。(3)在處理過(guò),如需其他部門去現(xiàn)場(chǎng)增援處理,應(yīng)及時(shí)

15、向上級(jí)部門匯報(bào),協(xié)調(diào)溝通,協(xié)調(diào)研發(fā)同事資源介入。7、服務(wù)管理制度規(guī)范7.1 服務(wù)時(shí)間(1)在 5*8 小時(shí)工作時(shí)間內(nèi)設(shè)置由專人職守的,接聽(tīng)內(nèi)部的服務(wù)請(qǐng)求,并服務(wù)臺(tái)事件處理結(jié)果。(2)在非工作時(shí)間設(shè)置有專人 7*24 小時(shí)接聽(tīng)的移動(dòng),用于解決的技術(shù)問(wèn)題以及接聽(tīng) 7*24 小時(shí)機(jī)房的機(jī)房突況匯報(bào)。(3)服務(wù)響應(yīng)時(shí)間:故障級(jí)別故障現(xiàn)象響應(yīng)速度到達(dá)現(xiàn)場(chǎng)時(shí)間執(zhí)行響應(yīng)人一級(jí)由于硬件或系統(tǒng)的原因造 成系統(tǒng)停機(jī),整個(gè)系統(tǒng)處于癱瘓狀態(tài),不能正常運(yùn)行對(duì)客戶的業(yè)務(wù)造成嚴(yán)影響。一小時(shí)2 小時(shí)資深研發(fā)行為規(guī)范遵守用戶的各項(xiàng)規(guī)章制度,嚴(yán)格按照用戶相應(yīng)的規(guī)章制度辦事。(2)與用戶運(yùn)行體系其他部門和環(huán)節(jié)協(xié)同工作,密切配合,共同開(kāi)展技術(shù)支持工作。(3)出現(xiàn)疑難技術(shù)、業(yè)務(wù)問(wèn)題和緊急情況時(shí),及時(shí)向。(4)現(xiàn)場(chǎng)技術(shù)支持時(shí)要精神飽滿,穿著得體

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論