IT基礎(chǔ)設(shè)施運維管理規(guī)范方案_第1頁
IT基礎(chǔ)設(shè)施運維管理規(guī)范方案_第2頁
IT基礎(chǔ)設(shè)施運維管理規(guī)范方案_第3頁
IT基礎(chǔ)設(shè)施運維管理規(guī)范方案_第4頁
IT基礎(chǔ)設(shè)施運維管理規(guī)范方案_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

IT基礎(chǔ)設(shè)施運維管理規(guī)范

文件編號:版本號:

一、總則

為了規(guī)范本部門的運維管理工作,使得相關(guān)工作具有持續(xù)改善性及相互協(xié)作性,能夠

支撐公司系統(tǒng)的健康可靠的運行,由此制定本規(guī)范。

本規(guī)范適用于信息管理中心技術(shù)保障部所有崗位人員。

二、部門職能

(1)負(fù)責(zé)信息化基礎(chǔ)設(shè)施的技術(shù)保障,包括網(wǎng)絡(luò)、電話、機房、服務(wù)器系統(tǒng)、數(shù)

據(jù)安全等技術(shù)支持;

(2)負(fù)責(zé)所有服務(wù)器系統(tǒng)的技術(shù)運維工作

(3)負(fù)責(zé)核心數(shù)據(jù)庫的性能調(diào)優(yōu)及技術(shù)運維工作

(4)負(fù)責(zé)各種網(wǎng)絡(luò)設(shè)施、線路的技術(shù)運維保障工作

(5)負(fù)責(zé)其他設(shè)施的運維保障工作,如機房設(shè)施、一卡通、考勤機等智能化設(shè)

施。

(6)負(fù)責(zé)信息化安全的建設(shè)與執(zhí)行;

三、崗位職責(zé)

(1)經(jīng)理:

負(fù)責(zé)信息化基礎(chǔ)設(shè)施的技術(shù)保障,包括,電腦終端、網(wǎng)絡(luò)、電話、機房、服務(wù)器

系統(tǒng)、數(shù)據(jù)安全等技術(shù)支持;

負(fù)責(zé)信息化安全的建設(shè)與執(zhí)行;

負(fù)責(zé)本部門的組織管理,包括,修訂組織職責(zé)、架構(gòu)編制、崗位職級、分工授權(quán)

等;

負(fù)責(zé)本部業(yè)務(wù)制度流程規(guī)范的制定和監(jiān)督執(zhí)行;

負(fù)責(zé)本部團隊建設(shè),包括,新員工入職、員工培訓(xùn)、績效考核、員工心政、團隊

活動等;

負(fù)責(zé)本部門工作管理,包括,預(yù)算編制與管控、計劃管理、匯報管理、會議管理

等;

(2)系統(tǒng)工程師:

負(fù)責(zé)所有服務(wù)器系統(tǒng)的技術(shù)運維工作

負(fù)責(zé)核心數(shù)據(jù)庫的性能調(diào)優(yōu)及技術(shù)運維工作

(3)網(wǎng)絡(luò)工程師:

負(fù)責(zé)各種網(wǎng)絡(luò)設(shè)施、線路的技術(shù)運維保障工作

負(fù)責(zé)其他設(shè)施的運維保障工作,如機房設(shè)施、一卡通、考勤機等智能化設(shè)施

(4)安全工程師:

負(fù)責(zé)信息化安全的建設(shè)與執(zhí)行;

(5)其他說明事項:

系統(tǒng)工程師、DBA.網(wǎng)絡(luò)工程師、安全工程師,以下統(tǒng)稱運維工程師;

權(quán)限控制:除負(fù)責(zé)基礎(chǔ)設(shè)施的網(wǎng)絡(luò)工程師,其余工程師不得擁有進(jìn)入數(shù)據(jù)中心機

房的權(quán)限。網(wǎng)絡(luò)工程師不得擁有系統(tǒng)工程師的管理權(quán)限。

各崗位周期性工作清單見附一。

四、管理對象

IT基礎(chǔ)設(shè)施管理對象包括網(wǎng)絡(luò)、電話、機房、服務(wù)器、系統(tǒng)、信息安全等,具體內(nèi)容

如下:

(1)網(wǎng)絡(luò):XXXX運營中心、UJJ工業(yè)園、WWWW工業(yè)園、數(shù)據(jù)中心、北京辦事

處的網(wǎng)絡(luò)建設(shè)與維護。

(2)電話:XXXX運營中心、JJJJ工業(yè)園、WWWW工業(yè)園的電話網(wǎng)絡(luò)建設(shè)與維

護。

(3)機房:數(shù)據(jù)中心機房的建設(shè)與日常維護。

(4)服務(wù)器:服務(wù)器軟硬件的采購、建設(shè)與日常維護。

(5)系統(tǒng):操作系統(tǒng)、數(shù)據(jù)庫、應(yīng)用系統(tǒng)、虛擬化的日常維護。

(6)信息安全:信息安全建設(shè)與維護。

五、運維規(guī)范

內(nèi)部運維

(1)運維工程師,負(fù)責(zé)崗位職責(zé)內(nèi)相應(yīng)的IT設(shè)施的《維護手冊》的制定和完善、并

按照本運維規(guī)范執(zhí)行維護管理工作和巡檢工作。

(2)運維工程師應(yīng)當(dāng)依據(jù)運維過程收集的記錄信息,每月整理出當(dāng)月的《月度運

維報告?》提報部門經(jīng)理,報告中要重點關(guān)注IT設(shè)施的問題和改進(jìn)分析,并提出改進(jìn)措施

和建議。

(3)部門經(jīng)理,負(fù)責(zé)保障運維管理體系的有效執(zhí)行,包括本運維管理規(guī)范的制定

和完善,督導(dǎo)維護工程師完善各設(shè)施維護手冊。

(4)部門經(jīng)理在月度工作會議上就當(dāng)月各個運維工作報告與團隊溝通共識出整改

措施,并形成新的工作計劃,推動落實執(zhí)行。

參考運維手冊:

《網(wǎng)絡(luò)維護手冊》

《系統(tǒng)維護手冊》

巡檢管理

(1)巡檢對象:機房、數(shù)據(jù)備份、網(wǎng)絡(luò)、服務(wù)器、系統(tǒng)的運行狀態(tài)。

(2)巡檢周期:每日、每周、每月,詳見附一《周期性工作清單》。

(3)每位運維工程師依據(jù)各自維護設(shè)施,按時對檢核內(nèi)容進(jìn)行檢查。每日:當(dāng)日下班

前要把當(dāng)天檢查情況填報檢核表。

(4)部門經(jīng)理將不定期檢查巡檢的完成情況。

(5)巡檢期間,如果發(fā)現(xiàn)設(shè)備或系統(tǒng)異常,應(yīng)立即上報部門經(jīng)理并展開調(diào)查,確認(rèn)故

障的應(yīng)立即進(jìn)入故障處理環(huán)節(jié)。

(1)使用*******作為統(tǒng)一的監(jiān)控中心,提供在線監(jiān)控、流量分析、故障告警;

(2)設(shè)定告警閥值:磁盤閥值95%,非數(shù)據(jù)庫系統(tǒng)內(nèi)存閥值70%,CPU閥值70%。

(3)告警:達(dá)到閥值或系統(tǒng)中斷時,平臺通過短信通知到運維工程師,運維工程師收

到告警后,應(yīng)該立即檢查系統(tǒng)的健康狀況,并在應(yīng)急預(yù)案規(guī)定時間內(nèi)恢復(fù)正常;

(1)根據(jù)公司《應(yīng)急預(yù)案》的要求,在規(guī)定時限內(nèi)進(jìn)行故障恢復(fù);

(2)預(yù)案的安全等級:(詳細(xì)系統(tǒng)的安全要求,見《應(yīng)急預(yù)案》)

安全等級非常重要重要一般

RTO不間斷1小時以內(nèi)24小時以內(nèi)

RPO不間斷1小時以內(nèi)24小時以內(nèi)

(3)故障發(fā)生時,運維工程師在無法鎖定問題根源時,應(yīng)該立即啟動應(yīng)急機制,在規(guī)

定時間內(nèi)先恢兔業(yè)務(wù)使用,并在非工作時間進(jìn)行詳細(xì)的故障排杳;

(4)經(jīng)過排查仍然無法解決時,應(yīng)立即向部門經(jīng)理匯報,并尋求外部資源直至問題解

決;

(1)三權(quán)分立:角色分為審計員、設(shè)備管理員、運維人員,審計員僅能進(jìn)行審計工作,

對設(shè)備管理員和運維人員的行為進(jìn)行審計,不能創(chuàng)建運維賬號,沒有系統(tǒng)權(quán)限和賬號,

無法進(jìn)行運維工作。設(shè)備管理員保管系統(tǒng)賬號及權(quán)限分配,但不能創(chuàng)建運維賬號,也

無法進(jìn)行運維工作。運維人員只能進(jìn)行運維工作,沒有系統(tǒng)賬號及設(shè)備管理權(quán)限;

(2)內(nèi)部運維工程師使用AD賬號登錄堡壘機,進(jìn)行日常的運維工作;

(3)外協(xié)人員通過恰時創(chuàng)建的運維賬號登錄堡壘機,進(jìn)行相關(guān)工作;

(4)任何人員都嚴(yán)禁擅自更改系統(tǒng)的密碼、端口等配置;

(5)審計記錄保留一年,審計人員不定期進(jìn)行抽檢;

跨部門協(xié)作

作為信息服務(wù)部門的二線支持,各運維工程師在收到服務(wù)部門的工單請求時,應(yīng)及時

反饋或處理請求。半小時內(nèi)的反饋和4小時內(nèi)的處理被認(rèn)為是及時的。詳見信息服務(wù)部IT設(shè)

施服務(wù)管理系統(tǒng)。

六、運維流程

IT基礎(chǔ)設(shè)施運維作業(yè)過程中,出現(xiàn)問題需要用到的流程:事件管理、問題管理、變更管理,

隨著運維活動的不斷深入和持續(xù)改進(jìn),其他流程可能會逐步獨立并規(guī)范。

事件管理

事件管理流程的主要目標(biāo)是盡快恢復(fù)IT服務(wù),減少其對業(yè)務(wù)的不利影響,盡可能保證最

佳的IT服務(wù)質(zhì)量和可用性。

(1)事件流程:

事件管理流程

處理人經(jīng)理

2)事件表單

處理人事件分類網(wǎng)絡(luò)、電話、機房、服

務(wù)器、系統(tǒng)、虛擬化、

數(shù)據(jù)庫、信息安全

標(biāo)題事件編號系統(tǒng)自動生成

事件描述事件描述:

錯誤代碼:如果有請?zhí)顚?/p>

解決方案

事件開始時間事件結(jié)束時間

事件原因分析口人為過失口設(shè)備故障口外部原因_________

(3)流程說明

任何引起服務(wù)中斷和服務(wù)質(zhì)量下降的現(xiàn)象,統(tǒng)稱事件。處理人:表示事件的受理人,

并負(fù)責(zé)整個事件的解決,直到事件結(jié)束。受理人負(fù)責(zé)事件流程的發(fā)起,經(jīng)理負(fù)責(zé)審核

事件的狀態(tài)及表單信息的完整性。事件結(jié)束自動轉(zhuǎn)入問題管理。

問題管理

問題管理流程的主要目標(biāo)是預(yù)防問題和事故的再次發(fā)生,并且在事故的再次發(fā)生時,可以

找到有效的處理方法。問題管理流程包括診斷事件根本原因和確定問題解決方案所需要的

活動,問題管理還將維護有關(guān)問題、應(yīng)急方案和解決方案的信息。

(1)問題流程

問題管理流程

發(fā)起人經(jīng)理總監(jiān)

問題識制

氐提交解決

整方系評佶

方案

!E

匿問題解決

_T

問題關(guān)閉

2)問題表單

發(fā)起人問題分類網(wǎng)絡(luò)、電話、機房、服

務(wù)器、系統(tǒng)、虛擬化、

數(shù)據(jù)庫、信息安全

標(biāo)題問題編號系統(tǒng)自動生成

影響范圍口影響較大口影響較小

主要即響用戶:

問題描述問題描述:

影響范圍:受影響的用戶及系統(tǒng)

解決方案

計劃開始日期計劃結(jié)束日期

用戶通知通知受影響用戶

(3)流程說明

所有問題都應(yīng)該被完整準(zhǔn)確的記錄下來,并保證相關(guān)信息應(yīng)盡可能詳細(xì)。明確問題管

理的問題信息來源,問題可能來源于某些事件的進(jìn)一步調(diào)查,也可能來源于主動巡檢

和事件報表分析。問題發(fā)起人首先識別問題,分析可能造成的危害,提出解決方案,

計劃好問題的處置時間,并通知受影響的用戶.經(jīng)理負(fù)責(zé)評估方案的合理性。

影響較大:涉及全公司使用、門店使用,用戶范圍較廣的系統(tǒng)或關(guān)鍵業(yè)務(wù)系統(tǒng),需總

監(jiān)審核。

影響較?。壕植坑脩羰褂?、豐關(guān)鍵業(yè)務(wù)系統(tǒng)。

變更管理

變更管理實現(xiàn)所有IT基礎(chǔ)設(shè)施和應(yīng)用系統(tǒng)的變更,變更管理應(yīng)記錄并對所有要求的變更進(jìn)

行分類,應(yīng)評估變更請求的風(fēng)險、影響和業(yè)務(wù)收益。其主要目標(biāo)是以對服務(wù)最小的干擾實

現(xiàn)有益的變更。

(1)變更流程

變更管理流程

發(fā)起人經(jīng)理總監(jiān)變更委員會

Y變更發(fā)起

提交變更

方案

影響裝小

不同意變更委員

限執(zhí)行變更

Lt

E驗證關(guān)訊

*

(2)變更表單

發(fā)起人變更分類網(wǎng)絡(luò)、電話、機房、服

務(wù)器、系統(tǒng)、虛擬化、

數(shù)據(jù)庫、信息安全

標(biāo)題變更編號系統(tǒng)自動生成

影響范圍口影響較大口影響較小

主要影響用戶:

變更描述變更描述:

影響范圍:受影響的用戶及系統(tǒng)

變更方案變更方案:

方案測試:如果有

變更后測試方案:

變更失敗回滾方案:

計劃開始日期計劃結(jié)束日期

用戶通知通知受影響用戶

(3)流程說明

所有涉及運維生產(chǎn)環(huán)境的變化,都必須走變更流程。變更的發(fā)起人,負(fù)費發(fā)起變更,提交變

更方案,并負(fù)責(zé)變更的執(zhí)行。經(jīng)理負(fù)責(zé)評估變更方案的可行性。

變更委員會:變更發(fā)起部門經(jīng)理及各部門指定對接人員組成,變更發(fā)起部門經(jīng)理主持變更會

議,評估變更對各部門業(yè)務(wù)的影響,各部門委員負(fù)責(zé)協(xié)調(diào)相關(guān)資源和用戶,以及安排變更后

的測試工作。

七、IT運維服務(wù)質(zhì)量指標(biāo)

IT運維服務(wù)質(zhì)量指標(biāo)體系是用來衡量整個運維服務(wù)工作質(zhì)量的標(biāo)準(zhǔn)規(guī)范,指標(biāo)標(biāo)準(zhǔn)如下:

運維服務(wù)體系質(zhì)量指標(biāo)

衡量指標(biāo)指標(biāo)說明指標(biāo)公式

投訴一次扣20分,扣完為止。

用戶投訴次數(shù)IT故障服務(wù)投訴

本項總分100分,權(quán)重20%。

在《應(yīng)急預(yù)案》當(dāng)前恢復(fù)時間范圍之

內(nèi)恢復(fù)的,屬于正常事故,公司應(yīng)急

考核期內(nèi)無事故100分,重大事故一次扣

預(yù)案范圍外的系統(tǒng),按一般安全級

100分,中等事故一次扣50分,一般事

事故別考核。

故一次扣20分,扣完為止。

超過4小時不能恢復(fù),定義為一次重

本項總分100分,權(quán)重20%。

大事故;1-4小時之間定義為中等事

故;1小時以內(nèi)定義為一般事故。

1)公司網(wǎng)絡(luò)被黑客攻擊導(dǎo)致中斷;

2)被非授權(quán)終端設(shè)備登入公司內(nèi)

一次扣10分,扣完為止。

安全網(wǎng);

本項總分100分,權(quán)重20%。

3)公司內(nèi)部發(fā)牛已知病毒大范用感

染(5臺以上電腦同時爆發(fā)病毒);

附一:周期性工作清單

周期工作內(nèi)容角色范圍或行為

機房環(huán)境巡檢網(wǎng)絡(luò)工程師配電、室內(nèi)環(huán)境、設(shè)備狀態(tài)

設(shè)備健康巡檢網(wǎng)絡(luò)工程師網(wǎng)絡(luò)設(shè)備、信息安全設(shè)備、服務(wù)器、系統(tǒng)

備份狀態(tài)檢查系統(tǒng)工程師業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫每日備份計劃的完成情況

0A單據(jù)處理ALL各日常運維單據(jù)

周例會ALL組織每周例會

周備份狀態(tài)檢查系統(tǒng)工程師業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫每周備份計劃的完成情況

運維周報ALL各自動負(fù)責(zé)系統(tǒng)的周運維報告

月運維報告ALL每月第一周,各系統(tǒng)工程師提交上月運維報告

運營商付費及對賬網(wǎng)絡(luò)工程師

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論