IT運維服務(wù)體系建設(shè)思路_第1頁
IT運維服務(wù)體系建設(shè)思路_第2頁
IT運維服務(wù)體系建設(shè)思路_第3頁
IT運維服務(wù)體系建設(shè)思路_第4頁
IT運維服務(wù)體系建設(shè)思路_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、IT運維服務(wù)體系建設(shè),應包含運維服務(wù)制度、流程、組織、隊伍、技術(shù)和對象等方面的內(nèi)容。同時結(jié)合人民銀行的業(yè)務(wù)特色,整合運維服務(wù)資源,規(guī)范運維行為,確保服務(wù)質(zhì)效,形成統(tǒng)一管理、集約高效的一體化運維體系,從而保障人民銀行數(shù)據(jù)集中條件下網(wǎng)絡(luò)和應用系統(tǒng)安全、穩(wěn)定、高效、持續(xù)運行。一、運維服務(wù)體系建設(shè)原則 運維服務(wù)體系建設(shè)的原則有以下幾個方面。 一是以完善的運維服務(wù)制度、流程為基礎(chǔ)。為保障運行維護工作的質(zhì)量和效率,應制定相對完善、切實可行的運行維護管理制度和規(guī)范,確定各項運維活動的標準流程和相關(guān)崗位設(shè)置等,使運維人員在制度和流程的規(guī)范和約束下協(xié)同操作。 二是以先進、成熟的運維管理平臺為手段。通過建立統(tǒng)一、

2、集成、開放并可擴展的運維管理平臺,實現(xiàn)對各類運維事件的全面采集、及時處理與合理分析,實現(xiàn)運行維護工作的智能化和高效率。 三是以高素質(zhì)的運維服務(wù)隊伍為保障。運維服務(wù)的順利實施離不開高素質(zhì)的運維服務(wù)人員,因此必須不斷提高運維服務(wù)隊伍的專業(yè)化水平,才能有效利用技術(shù)手段和工具,做好各項運維工作。圖1 運維服務(wù)體系架構(gòu)二、運維服務(wù)體系的總體架構(gòu) 運維服務(wù)體系由運維服務(wù)制度、運維服務(wù)流程、運維服務(wù)組織、運維服務(wù)隊伍、運維技術(shù)服務(wù)平臺以及運行維護對象六部分組成,涉及制度、人、技術(shù)、對象四類因素,其總體架構(gòu)如圖1所示。制度是規(guī)范運維管理工作的基本保障,也是流程建立的基礎(chǔ)。運維服務(wù)組織中的相關(guān)人員遵照制度要求和

3、標準化的流程,采用先進的運維管理平臺對各類運維對象進行規(guī)范化的運行管理和技術(shù)操作。 1.運維服務(wù)制度和流程 為確保運維服務(wù)工作正常、有序、高效、協(xié)調(diào)地進行,需要根據(jù)管理內(nèi)容和要求制定一系列管理制度,覆蓋各類運維對象,包括從投產(chǎn)管理、日常運維管理到下線管理以及應急處理的各個方面。此外,為實現(xiàn)運維服務(wù)工作流程的規(guī)范化和標準化,還需要制定流程規(guī)范,確定各流程中的崗位設(shè)置、職責分工以及流程執(zhí)行過程中的相關(guān)約束。 2.運維服務(wù)組織和隊伍 人民銀行科技部門根據(jù)其運維服務(wù)工作的內(nèi)容和流程確定各項工作中的崗位設(shè)置和職責分工,并按照相應崗位的要求配備所需不同專業(yè)、不同層次的人員,組成專業(yè)分工下高效協(xié)作的運維隊伍

4、。分行科技處負責數(shù)據(jù)省級集中處理的應用系統(tǒng)和本機構(gòu)開發(fā)的應用系統(tǒng)部署和運行維護,承擔轄內(nèi)網(wǎng)絡(luò)的運行管理。轄內(nèi)各中支和支行科技人員承擔本行系統(tǒng)運行維護和故障處理。 3.運維服務(wù)工作流程 為保障運行維護體系的高效、協(xié)調(diào)運行,應依據(jù)管理環(huán)節(jié)、管理內(nèi)容、管理要求制定統(tǒng)一的運行維護工作流程,實現(xiàn)運行維護工作的標準化、規(guī)范化。其環(huán)節(jié)包括事件管理、問題管理、變更管理和配置管理。 4.運維技術(shù)服務(wù)平臺 運維技術(shù)服務(wù)平臺包含實施運行維護和技術(shù)服務(wù)的各種手段和工具,通過技術(shù)手段固化標準化的流程、積累和管理運維知識并開展主動性運維工作。三、運維的范圍 1.全國集中的核心應用系統(tǒng) 全國集中的核心應用系統(tǒng)的運維由總行負

5、責,分行中心負責業(yè)務(wù)咨詢工作和向總行反饋使用情況等。 2.分行部署的核心應用系統(tǒng) 分行部署的核心應用系統(tǒng)的運維由分行中心負責,分行中心負責技術(shù)性維護,業(yè)務(wù)維護由分行業(yè)務(wù)部門負責。 3.分行自建系統(tǒng) 分行自建系統(tǒng)可以分為以下三類: (1)全轄使用,這類系統(tǒng)的運維由分行中心負責,分行中心負責技術(shù)性維護,業(yè)務(wù)維護由各分行業(yè)務(wù)部門自行負責; (2)省內(nèi)使用,這類系統(tǒng)的運維由分行中心負責,分行中心負責技術(shù)性維護,業(yè)務(wù)維護由分行業(yè)務(wù)部門自行負責; (3)分行機關(guān)使用,這類系統(tǒng)的運維由分行中心全面負責。四、運維服務(wù)體系建設(shè)的內(nèi)容 1.運維管理制度建設(shè) 總結(jié)現(xiàn)有的運維管理經(jīng)驗,遵照國內(nèi)外相關(guān)運維標準,結(jié)合目前

6、的實際情況,統(tǒng)一制定運維管理制度和規(guī)范。通過定期和不定期的檢查,促進各項制度規(guī)范在分行數(shù)據(jù)中心的貫徹落實,從而建立起全轄統(tǒng)一、規(guī)范的運行維護管理工作方式。同時,隨著人民銀行信息化建設(shè)的不斷發(fā)展,也要確保各項制度的及時更新。制度體系內(nèi)容要涵蓋機房管理、網(wǎng)絡(luò)管理、資產(chǎn)管理、主機和應用管理、存儲和備份管理、技術(shù)服務(wù)管理、安全管理、文檔管理以及人員管理等類別。各類制度具體內(nèi)容因需要而定,如網(wǎng)絡(luò)管理制度需覆蓋網(wǎng)絡(luò)的接入管理、用戶管理、配置管理及網(wǎng)絡(luò)日常運行管理和應急處理等。安全管理制度需覆蓋包括機房設(shè)施、網(wǎng)絡(luò)、主機、數(shù)據(jù)庫、中間件、應用軟件、數(shù)據(jù)信息的安全管理、其他機密資源和人員的安全管理以及安全事件的

7、應急處理等。 2.運維技術(shù)服務(wù)平臺 運維技術(shù)服務(wù)平臺由運維事件響應中心、運維管理系統(tǒng)、運維知識庫和運維輔助分析系統(tǒng)構(gòu)成(如圖2所示)。平臺采用分行級、中支級分布式管理模式,在分行科技處和各中支分別部署。 (1)整合分行IT監(jiān)控平臺 將分行級數(shù)據(jù)中心的監(jiān)控數(shù)據(jù)交換到運維事件響應中心、運維流程管理系統(tǒng)、運維知識庫、運維輔助分析系統(tǒng),支撐運維體系。 分行級中心向總行中心傳送的信息包括:網(wǎng)絡(luò)管理、主機管理、數(shù)據(jù)庫管理、存儲備份管理、中間件管理、應用系統(tǒng)管理的相關(guān)信息,報表系統(tǒng)產(chǎn)生的設(shè)備資產(chǎn)、運行性能和運行事件報表,事件告警機制產(chǎn)生的關(guān)聯(lián)和上報信息;省級中心和地市中心支行之間傳送的管理信息為網(wǎng)絡(luò)管理信息

8、。 (2)運維事件響應中心 負責客戶端運行和應用系統(tǒng)問題的接收及轉(zhuǎn)發(fā)的部門是各級科技部門。問題接收分為網(wǎng)絡(luò)響應和電話響應兩種方式,對于響應人員無法當場解決的問題,轉(zhuǎn)發(fā)到運維部門的相應崗位,并向用戶反饋解決情況。對于分行級數(shù)據(jù)中心運維難以解決的問題,上報總行并配合總行進行問題的解決。同時,實現(xiàn)問題庫的維護、解決情況的反饋、解決方案的查詢等功能。 (3)運維服務(wù)管理系統(tǒng) 運維流程管理系統(tǒng)的建立,可以使日常的運維工作有序化,職責角色清晰化,能夠有效地提高解決問題的速度和質(zhì)量,使運維部門內(nèi)的相關(guān)支持信息更為暢通、透明、完整,實現(xiàn)知識的積累和管理,更好地進行量化管理和設(shè)定優(yōu)化指標,進行持續(xù)地服務(wù)改進,最

9、終提高整個運維工作的效率和質(zhì)量。 (4)運維知識庫建設(shè) 知識庫建設(shè)是人民銀行信息系統(tǒng)運維體系的重要組成部分,基于統(tǒng)一的技術(shù)支持平臺,通過整合總行、分行數(shù)據(jù)中心、合作單位和協(xié)作廠商的技術(shù)資源和解決方案,實現(xiàn)對全行有效的技術(shù)支持工作。 運行維護知識庫由知識庫平臺和知識庫內(nèi)容兩部分組成。知識庫平臺包括知識檢索、知識維護與管理等,可以通過純Web方式向服務(wù)請求對象提供基于Web的查詢服務(wù)和檢索服務(wù),以完全共享知識庫中的知識,在提供Web服務(wù)時,還可通過響應中心平臺來即時地響應用戶請求的服務(wù)。 (5)運維輔助分析系統(tǒng) 以日常監(jiān)控平臺、運維響應中心、運維流程管理系統(tǒng)為基礎(chǔ),通過統(tǒng)計分析,了解運維服務(wù)能力與

10、服務(wù)質(zhì)量的現(xiàn)狀,并可以進行趨勢分析,為運維管理決策提供支持。 3.運行維護管理流程 為加強對信息系統(tǒng)的運行維護管理,確保運行維護體系高效、協(xié)調(diào)運行,應依據(jù)運維管理環(huán)節(jié)、管理內(nèi)容、管理要求制定統(tǒng)一的運行維護工作流程,實現(xiàn)運行維護工作的標準化、規(guī)范化和自動化。通過建立運維管理流程,可以使日常的運維工作流程化,職責角色更加清晰,從而使解決問題的速度和質(zhì)量得到有效提高,實現(xiàn)知識積累和知識管理,并可以幫助運維部門進行持續(xù)的服務(wù)改進,提高服務(wù)對象的滿意度。運行維護流程包含的環(huán)節(jié)有事件管理、問題管理、變更管理及配置管理。 (1)事件管理 所謂事件,是指發(fā)生的對IT體系某一環(huán)節(jié)運行造成影響的事件,包括系統(tǒng)崩潰

11、、軟件故障、任何影響用戶業(yè)務(wù)操作和系統(tǒng)正常運作的故障、以及影響業(yè)務(wù)流程的情況,事件也包括一個用戶的請求。 對日常性運維工作中出現(xiàn)的突發(fā)事件(即日常運行維護管理平臺自動發(fā)現(xiàn)并產(chǎn)生的告警事件)和由用戶/維護人員報告的事件會轉(zhuǎn)入事件管理流程,事件管理流程如圖3所示。 (2)問題管理 問題是指導致事件產(chǎn)生的原因,許多事件往往是由同一個問題引起的。問題的來源主要有以下幾種:已經(jīng)處理的事件,經(jīng)過回顧分析后,可能形成一個問題;重大事件,雖然經(jīng)過緊急處理恢復服務(wù),但未找到根本原因,也形成一個問題;對于趨勢性事件的分析,并形成問題。 問題管理流程可以按照不同領(lǐng)域的問題(如網(wǎng)絡(luò)、主機、中間件、數(shù)據(jù)庫、應用等)由相

12、關(guān)領(lǐng)域的技術(shù)支持專家來處理。原則上這些專家可以是二線支持專家,他們在負責接受來自一線支持人員的支持請求的同時,也負責對以往事件進行分析,找出事件產(chǎn)生的根本原因,從而確定解決方案,消除這些根本原因,最終使此類事件不再發(fā)生;另一方面,也要從發(fā)生的事件中找出事件的發(fā)展趨勢或潛在可能發(fā)生的問題,主動提供預防性措施,提高系統(tǒng)可靠性,降低運維成本。 問題管理流程著重于消除事件或減少事件發(fā)生,確定事件的根本原因,其流程如下:首先,定期分析事件,找出潛在問題,調(diào)查問題以找出其原因,制定解決方案、變通方法或提出預防性措施,以消除產(chǎn)生原因,或在重發(fā)時使其影響力最小化。其次,記錄解決方案、變通方法、預防性措施,根據(jù)

13、需要添加到知識庫中。再次,提出變更請求,對問題的解決方案進行評估,通過提出變更請求以對該方案進行測試和實施。最后,問題必須進行事后回顧以找出改進機會或總結(jié)預防性措施,包括改進事件監(jiān)測、找出技能差距和文檔資料改進等。 (3)變更管理 變更請求通常由于問題的解決方案中需要對生產(chǎn)環(huán)境進行某些改變而產(chǎn)生,變更請求來源于問題管理環(huán)節(jié)或由用戶提交。變更管理通過一個單一的職能流程來控制和管理整個信息系統(tǒng)運行環(huán)境中的一切變更,范圍可包括軟件,硬件,網(wǎng)絡(luò)設(shè)備和文檔等的變更,其流程如下。 由用戶或問題管理環(huán)節(jié)的維護人員提出變更申請,由運維負責人檢查和完善其內(nèi)容,并進行風險等級、優(yōu)先級的初步評估。 通過分類,確定是

14、否為重大變更、緊急變更,如果是常規(guī)變更請求,則由運維負責人安排實施;如果是風險等級為“重大”的變更請求,則應上報變更管理小組。 根據(jù)特定的變更請求成立特定的變更管理小組,成員包括對該變更申請有批準權(quán)的人員、對該變更的評估和批準提供參考意見的技術(shù)人員和管理人員。評估內(nèi)容包括變更的技術(shù)可行性、對系統(tǒng)性能的影響、對現(xiàn)有服務(wù)的影響、對資源的需求等。 變更管理小組評估后決定是否批準變更申請。變更請求得到批準后,運維負責人安排相應資源進行變更的計劃、測試,并制定實施方案,確定實施時間表,分配相應資源,通知請求人。 相應崗位實施變更,運維負責人監(jiān)視實施過程,并在必要時進行協(xié)調(diào)。 定期回顧變更管理流程以提高效

15、率和效能,在實施變更流程不久之后,可以進行第一次回顧,以確保流程得到正確實施并達到預期目的。對發(fā)現(xiàn)的問題必須追根溯源并盡快解決,之后可以定期舉行回顧。 (4)配置管理 配置管理是服務(wù)管理的一個核心流程,能確保應用系統(tǒng)及其運行環(huán)境中所有IT設(shè)備/系統(tǒng)及其配置信息得到有效完整的記錄和維護,包括各IT設(shè)備/系統(tǒng)之間的物理和邏輯關(guān)系,從而為實現(xiàn)有效服務(wù)管理奠定基礎(chǔ)。 配置管理流程著重于管理生產(chǎn)環(huán)境中所有必須控制的組成元素,并為其他相關(guān)流程(如事件管理等)提供信息,使這些流程更有效地運行,從而確保應用系統(tǒng)環(huán)境的完整性和穩(wěn)定性,其主要流程內(nèi)容如下。 識別和維護配置元素:確定需要進行配置管理的元素及所有必需

16、的配置屬性,并指明與生產(chǎn)環(huán)境中其他配置元素之間的關(guān)系。對配置管理數(shù)據(jù)庫提供日常維護。 配置狀態(tài)匯總:根據(jù)需要定期產(chǎn)生配置管理報表,并能使相關(guān)人員進行相關(guān)配置的提取、查詢,定期產(chǎn)生配置項的狀態(tài)報告,并能反映配置項的版本和變動歷史。 審計和確認:定期審核全部或部分配置數(shù)據(jù)庫中的配置項,確認其和物理環(huán)境的一致性,從而確保配置信息的完整性。 計劃、回顧和改進:定期制定計劃(如半年),以明確下階段配置管理工作;定期回顧流程和審核結(jié)果,找出需要改進的配置項。 配置管理數(shù)據(jù)庫(CMDB):配置管理數(shù)據(jù)庫由配置識別活動來定義,配置識別活動不但要定義配置項,還需定義配置結(jié)構(gòu)及配置項的相互關(guān)系。 4.運維項目管理

17、流程 項目管理模塊主要管理IT項目整個生命周期從立項準備、立項、采購、實施、驗收、收尾各個階段的任務(wù)和參與人。從功能上理解項目管理類似于發(fā)布管理流程,即總行部署的應用系統(tǒng)分行僅需要展開實施和驗收工作即可,而分行自建項目是一個完整的項目管理流程。 (1)系統(tǒng)開發(fā)。開發(fā)管理流程需要進一步完善和標準化,特別是文檔管理、測試和版本管理方面需加強。同時,加強開發(fā)計劃管理,在開發(fā)項目管理規(guī)范中明確要求:根據(jù)立項內(nèi)容進行系統(tǒng)、全面的需求調(diào)研,提出短期和長期的開發(fā)計劃,并編寫需求分析報告。根據(jù)需求分析報告對系統(tǒng)進行可行性分析,包括經(jīng)濟可行性分析、技術(shù)可行性分析和操作可行性分析三個方面,并在此基礎(chǔ)上編寫可行性報

18、告。根據(jù)需求分析報告進行系統(tǒng)設(shè)計,同時根據(jù)系統(tǒng)設(shè)計進行系統(tǒng)實施。 (2)系統(tǒng)測試。首先,應制定出詳細的測試計劃和方案及測試數(shù)據(jù)和測試案例,并形成測試大綱。其次,根據(jù)測試大綱對系統(tǒng)反復進行測試并做詳細的測試記錄。為確保系統(tǒng)的正確無誤,應對系統(tǒng)進行實地試運行,試運行應選擇多個環(huán)境且需求比較復雜的機構(gòu)進行,應比照設(shè)計方案對新應用軟件系統(tǒng)的功能和性能進行徹底測試和考核,并形成量化的運行報告。 (3)外部資源管理。外部資源的合理利用是推動分行信息技術(shù)的發(fā)展重要因素,分行的外部資源主要包括設(shè)備供應商、軟件供應商等。 5.運維知識庫系統(tǒng) 運維知識經(jīng)驗的總結(jié)、維護和共享是提高員工運維技能水平、增強單位凝聚力的

19、重要手段,也是把寶貴的經(jīng)驗教訓從支持人員頭腦逐步沉淀、固化的重要方式。知識維護既要鼓勵員工積極提交知識,防止知識庫變成“空庫”;同時又要及時進行審核和維護,防止知識庫變?yōu)椤袄鴰臁薄?(1)知識來源主要有以下幾個方面:一是各級運維支持人員日常工作中積累的經(jīng)驗;二是知識管理員總結(jié)、導入的經(jīng)驗。知識管理員研究、獲取外部的知識和經(jīng)驗后,定期或隨時整理這些知識,導入到知識庫中,供所有用戶共享。知識的獲取、維護是信息網(wǎng)絡(luò)管理員的重要職責之一。 (2)知識提交審核。各個系統(tǒng)管理員提交知識到知識庫之后,需要經(jīng)過知識管理員的審查、修正,才變?yōu)檎桨l(fā)布狀態(tài),以減少知識中的謬誤和差錯。知識管理員定期(每季度一次)

20、檢查所有的正式知識,逐條進行核實、修正和優(yōu)化。修正和維護操作與審核新提交知識草案過程相同。 (3)知識檢索和使用。在知識變?yōu)檎降陌l(fā)布狀態(tài)之后,可以供各類用戶隨時檢索引用。用戶可以研究學習這些知識,也可以在解決問題的過程中有目的地檢索。知識記錄維護用戶閱讀次數(shù)和用戶引用解決問題次數(shù)的計數(shù)器,引用和閱讀次數(shù)越多,該知識的價值越大。 6.運行維護隊伍建設(shè) (1)隊伍組建。針對目前信息系統(tǒng)IT資源現(xiàn)狀以及對技術(shù)支持的需求,組成各類別維護人員的專家隊伍,集中的開展運行維護工作。 (2)人員管理。對各級運行維護人員尤其是高級運行維護人員的管理,應制定一套切實可行的管理辦法,包括人員配置、職責劃分、人才庫建立、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論