




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第 PAGE 48 頁 共 NUMPAGES 54 頁云計算咨詢項目云計算運維變革研究目 錄 TOC o 1-3 h z u HYPERLINK l _Toc475776960 一. 導(dǎo)言 PAGEREF _Toc475776960 h 3 HYPERLINK l _Toc475776961 1.1 目的 PAGEREF _Toc475776961 h 3 HYPERLINK l _Toc475776962 1.2 文檔范圍 PAGEREF _Toc475776962 h 3 HYPERLINK l _Toc475776963 1.3 文檔閱讀對象 PAGEREF _Toc475776963
2、h 3 HYPERLINK l _Toc475776964 1.4 關(guān)鍵術(shù)語 PAGEREF _Toc475776964 h 3 HYPERLINK l _Toc475776965 二. 云平臺運維管理概述 PAGEREF _Toc475776965 h 5 HYPERLINK l _Toc475776966 2.1 云平臺運維特點 PAGEREF _Toc475776966 h 5 HYPERLINK l _Toc475776967 2.2 云平臺運維管理體系設(shè)計要求 PAGEREF _Toc475776967 h 6 HYPERLINK l _Toc475776968 2.3 云平臺運維管
3、理體系框架和范圍 PAGEREF _Toc475776968 h 7 HYPERLINK l _Toc475776969 三. 云平臺維護組織架構(gòu)和方式變革 PAGEREF _Toc475776969 h 12 HYPERLINK l _Toc475776970 3.1 組織管理及支持層 PAGEREF _Toc475776970 h 13 HYPERLINK l _Toc475776971 3.2 平臺優(yōu)化層 PAGEREF _Toc475776971 h 14 HYPERLINK l _Toc475776972 3.2.1 云平臺管理員 PAGEREF _Toc475776972 h 14
4、 HYPERLINK l _Toc475776973 3.2.2 云平臺優(yōu)化分析員 PAGEREF _Toc475776973 h 15 HYPERLINK l _Toc475776974 3.2.3 云平臺安全員 PAGEREF _Toc475776974 h 16 HYPERLINK l _Toc475776975 3.3 系統(tǒng)監(jiān)控層 PAGEREF _Toc475776975 h 16 HYPERLINK l _Toc475776976 3.3.1 云平臺監(jiān)控組 PAGEREF _Toc475776976 h 17 HYPERLINK l _Toc475776977 3.3.2 云管理平
5、臺操作員 PAGEREF _Toc475776977 h 17 HYPERLINK l _Toc475776978 3.4 現(xiàn)場操作層 PAGEREF _Toc475776978 h 18 HYPERLINK l _Toc475776979 3.4.1 虛擬資源池維護人員 PAGEREF _Toc475776979 h 18 HYPERLINK l _Toc475776980 3.4.2 工程建設(shè)方 PAGEREF _Toc475776980 h 19 HYPERLINK l _Toc475776981 3.4.3 應(yīng)用提供商 PAGEREF _Toc475776981 h 19 HYPERL
6、INK l _Toc475776982 3.4.4 應(yīng)用維護方 PAGEREF _Toc475776982 h 19 HYPERLINK l _Toc475776983 四. 云環(huán)境下的業(yè)務(wù)系統(tǒng)運維變革和制度 PAGEREF _Toc475776983 h 20 HYPERLINK l _Toc475776984 4.1 業(yè)務(wù)系統(tǒng)生命周期管理 PAGEREF _Toc475776984 h 20 HYPERLINK l _Toc475776985 4.2 業(yè)務(wù)管理流程概要設(shè)計 PAGEREF _Toc475776985 h 21 HYPERLINK l _Toc475776986 4.3 業(yè)務(wù)
7、管理流程實施說明 PAGEREF _Toc475776986 h 23 HYPERLINK l _Toc475776987 4.3.1 產(chǎn)品上線測試流程 PAGEREF _Toc475776987 h 23 HYPERLINK l _Toc475776988 4.3.2 云平臺故障分級 PAGEREF _Toc475776988 h 27 HYPERLINK l _Toc475776989 五. 企業(yè)運維系統(tǒng)可行性分析 PAGEREF _Toc475776989 h 28 HYPERLINK l _Toc475776990 5.1 運維現(xiàn)狀討論 PAGEREF _Toc475776990 h
8、28 HYPERLINK l _Toc475776991 5.2 運維改革的挑戰(zhàn) PAGEREF _Toc475776991 h 29 HYPERLINK l _Toc475776992 5.3 可行性分析 PAGEREF _Toc475776992 h 29 HYPERLINK l _Toc475776993 六. 虛擬資源池運維方式變更 PAGEREF _Toc475776993 h 30 HYPERLINK l _Toc475776994 6.1 資源生命周期管理流程概述 PAGEREF _Toc475776994 h 30 HYPERLINK l _Toc475776995 6.2 資
9、源管理流程概要設(shè)計 PAGEREF _Toc475776995 h 31 HYPERLINK l _Toc475776996 6.3 管理流程實施說明 PAGEREF _Toc475776996 h 32 HYPERLINK l _Toc475776997 6.3.1 資源(服務(wù))規(guī)劃和設(shè)計流程 PAGEREF _Toc475776997 h 32 HYPERLINK l _Toc475776998 6.3.2 資源服務(wù)訂閱、開通和資源部署流程 PAGEREF _Toc475776998 h 37 HYPERLINK l _Toc475776999 6.3.3 資源(服務(wù))運營和變更流程 PA
10、GEREF _Toc475776999 h 40 HYPERLINK l _Toc475777000 6.3.4 資源運營情況評估 PAGEREF _Toc475777000 h 48導(dǎo)言目的本文檔“云計算運維變革研究”是企業(yè)云計算咨詢 的第二階段交付文檔。用于指導(dǎo)企業(yè)云計算平臺搭建以及云平臺運維的技術(shù)系統(tǒng)建設(shè)和團隊規(guī)范建設(shè)。文檔范圍文檔基于已完成的第一階段調(diào)研報告,分析運維管理現(xiàn)狀存在的問題、云計算承載業(yè)務(wù)后產(chǎn)生的新需求,以及當(dāng)前的運維管理規(guī)范運維流程,對云管理平臺運維層面的變革架構(gòu)以及各部分設(shè)計作出詳細描述。文檔閱讀對象本文檔的閱讀對象為企業(yè)與云平臺規(guī)劃、建設(shè)、管理、運維相關(guān)的主管領(lǐng)導(dǎo)與實
11、際業(yè)務(wù)、應(yīng)用、資源運維人員。關(guān)鍵術(shù)語本文檔中用到的專門術(shù)語如下面表所示:專門術(shù)語名稱解釋ITIL即IT基礎(chǔ)架構(gòu)庫(Information Technology Infrastructure Library),為企業(yè)的IT服務(wù)管理實踐提供了一個客觀、嚴(yán)謹(jǐn)、可量化的標(biāo)準(zhǔn)和規(guī)范。DMZ是英文“demilitarized zone”的縮寫,中文名稱為“隔離區(qū)”, 它是為了解決安裝防火墻后外部網(wǎng)絡(luò)不能訪問內(nèi)部網(wǎng)絡(luò)服務(wù)器的問題,而設(shè)立的一個非安全系統(tǒng)與安全系統(tǒng)之間的緩沖區(qū),這個緩沖區(qū)位于企業(yè)內(nèi)部網(wǎng)絡(luò)和外部網(wǎng)絡(luò)之間的小網(wǎng)絡(luò)區(qū)域內(nèi),在這個小網(wǎng)絡(luò)區(qū)域內(nèi)可以放置一些必須公開的服務(wù)器設(shè)施。AD活動目錄(Active
12、 Directory)是面向Windows Server(2003/2008/2012)的目錄服務(wù),它基于標(biāo)準(zhǔn)的LDAP協(xié)議進行構(gòu)建,提供了用戶管理,角色管理,安全策略管理等企業(yè)信息管理的功能。云平臺運維管理概述云平臺運維特點云計算技術(shù)的引入,可以將傳統(tǒng)運維中相互獨立的物理資源轉(zhuǎn)化為整合的虛擬資源進行統(tǒng)一的劃分和管理,資源的運維管理從各業(yè)務(wù)獨立申請和獨享物理資源的垂直管理模式,轉(zhuǎn)變?yōu)楦鳂I(yè)務(wù)共享虛擬資源池,并統(tǒng)一規(guī)劃管理的水平管理模式。這種管理模式的轉(zhuǎn)變,也為實現(xiàn)虛擬資源的標(biāo)準(zhǔn)化服務(wù)提供了便利。虛擬資源的快速部署和動態(tài)優(yōu)化技術(shù)提升了虛擬資源的部署速度和資源管理的自動化水平,提升了資源現(xiàn)場運維工作
13、的效率。在提升運維效率和自動化水平、提供標(biāo)準(zhǔn)資源服務(wù)和管理模式轉(zhuǎn)變的同時。云平臺的管理層次(增加了虛擬資源服務(wù))、管理對象(虛擬資源)、管理技術(shù)和手段(如自動部署、遷移)也也有所增加,從而帶來了資源管理復(fù)雜度的提升。因此有必要對運維管理規(guī)范的流程和相關(guān)角色進行更新,以適應(yīng)云平臺引入所帶來的變化。而運維管理步驟、方法的增加以及虛擬化相關(guān)資源管理技術(shù),也對開發(fā)云計算管理平臺以實現(xiàn)云平臺資源管理流程的自動化提出了迫切的需求。綜上所述,如下圖所示,云計算帶來了: 資源標(biāo)準(zhǔn)化服務(wù) 資源快速部署和動態(tài)優(yōu)化 管理層次、對象、管理技術(shù)和手段的增加 管理復(fù)雜度的增加 從各業(yè)務(wù)獨立申請和獨享物理資源的垂直管理模式
14、,向各業(yè)務(wù)共享虛擬資源池,并統(tǒng)一規(guī)劃管理的水平管理模式轉(zhuǎn)變 為了應(yīng)對這種改變,應(yīng)從業(yè)務(wù)(套餐式服務(wù))、流程、角色和技術(shù)(云管理平臺)的視角綜合考慮應(yīng)對的措施,建立云平臺環(huán)境下的運維管理體系。本文件即是從角色和流程的視角分析和應(yīng)對云計算的引入對運維管理流程和角色的影響。圖 AUTONUM * Arabic 云計算運維特點云平臺運維管理體系設(shè)計要求為了解決現(xiàn)有運維管理方式面臨的挑戰(zhàn),結(jié)合企業(yè)的運維管理思想,云平臺運維管理體系應(yīng)滿足如下設(shè)計要求:設(shè)備層統(tǒng)一維護,業(yè)務(wù)層分權(quán)維護虛擬資源分配的標(biāo)準(zhǔn)化、柔性化、自動化原則云計算平臺和業(yè)務(wù)平臺的可靠性、高可用性原則行業(yè)應(yīng)用的快速部署原則“主動維護”原則資源、
15、業(yè)務(wù)管理可視化運維管理自動化、標(biāo)準(zhǔn)化原則云平臺運維管理體系框架和范圍如下圖所示,現(xiàn)有運維管理對象在邏輯結(jié)構(gòu)上,可以分為三個層級:業(yè)務(wù)、網(wǎng)絡(luò)資源(又稱核心基礎(chǔ)設(shè)施或資源)、基礎(chǔ)設(shè)施?;A(chǔ)設(shè)施主要包括電力設(shè)備、環(huán)境調(diào)節(jié)設(shè)備和監(jiān)控設(shè)備,用于保證上層計算機設(shè)備正常、安全運行。網(wǎng)絡(luò)資源層主要包括服務(wù)器、存儲設(shè)備和網(wǎng)絡(luò)設(shè)備等,承載上層的業(yè)務(wù)和應(yīng)用。應(yīng)用提供商提供基于應(yīng)用基礎(chǔ)設(shè)施(操作系統(tǒng)、中間件、數(shù)據(jù)庫等)的應(yīng)用系統(tǒng)實現(xiàn)業(yè)務(wù)運行,為客戶提供信息服務(wù)。圖 AUTONUM * Arabic 云平臺運維管理對象在現(xiàn)有運維管理機制中,業(yè)務(wù)和業(yè)務(wù)支撐部門直接參與到資源的分配方案制定和資源利用率和性能的跟蹤及優(yōu)化等活
16、動中,這種情況對業(yè)務(wù)和業(yè)務(wù)支持部門對業(yè)務(wù)運行環(huán)境需求方面的技能要求比較高,而且也牽涉了業(yè)務(wù)和業(yè)務(wù)支撐部門過多的精力在資源的運營和監(jiān)控中。在云平臺中,通過網(wǎng)絡(luò)資源的虛擬化,云平臺的運維管理對象增加了虛擬資源,由云平臺運維管理人員將云平臺虛擬資源抽象化成典型的資源和資源服務(wù)模版和實例,供客戶和業(yè)務(wù)部門方便地訂閱適合自己業(yè)務(wù)特點的標(biāo)準(zhǔn)資源配置,并實現(xiàn)服務(wù)的自動激活和開通,從而實現(xiàn)對虛擬資源的全生命周期管理。因此在IaaS云平臺中,增加了虛擬資源這一管理對象,而且這一對象對于業(yè)務(wù)部門和客戶通過自助式資源服務(wù)的形式來展現(xiàn),如上圖所示,我們將這一管理對象層級稱之為資源服務(wù)層。通過提供上述自助式資源服務(wù),可
17、以將業(yè)務(wù)和業(yè)務(wù)運維支持部門從具體的資源分配和優(yōu)化等操作中解脫出來,由資源運維團隊在資源管理層對資源進行更為專業(yè)的管理和優(yōu)化,這樣更有利于資源的充分利用和運維成本的降低,同時也更容易實現(xiàn)“設(shè)備層統(tǒng)一維護,業(yè)務(wù)層分權(quán)維護”、“虛擬資源分配的標(biāo)準(zhǔn)化、柔性化、自動化原則”、“資源管理可視化”以及“運維管理自動化、標(biāo)準(zhǔn)化原則”的設(shè)計要求?;A(chǔ)設(shè)施部門的管理在云平臺引入前后并沒有實際顯著的變化,因此在本規(guī)范中不再冗述。如下圖所示,云平臺運維管理的體系框架由業(yè)務(wù)生命周期管理、資源服務(wù)生命周期管理、資源生命周期管理組成,參考ITIL V3生命周期模型,每個生命周期又可以分為規(guī)劃、方案和實施、維護和運營三個階段
18、。在業(yè)務(wù)生命周期管理中,業(yè)務(wù)規(guī)劃、產(chǎn)品研發(fā)分別屬于產(chǎn)品規(guī)劃、研發(fā)流程,不在本運維規(guī)范范圍內(nèi)。而在資源生命周期管理中的資源擴容方案和資源建設(shè)或擴容流程屬于云平臺建設(shè)規(guī)范的范疇,在本規(guī)范中也不再涉及。這些范圍外的流程模塊,在圖中以灰色底色標(biāo)識。圖 AUTONUM * Arabic - 云平臺運維管理概要設(shè)計云計算技術(shù)對運維管理帶來的最重大的變化體現(xiàn)在資源申請、部署和優(yōu)化等資源管理模式的徹底改變,如下圖所示,傳統(tǒng)的資源按業(yè)務(wù)獨立規(guī)劃、申請、部署和管理資源,資源的運營中缺乏對資源使用情況的定期回顧和資源分配的重新調(diào)整或回收,容易造成資源的浪費或閑置。圖 AUTONUM * Arabic 資源管理模式的
19、變化引入云平臺管理流程后,資源管理模式在以下幾個方面發(fā)生了重大改變: 資源規(guī)劃流程傳統(tǒng)資源管理模式中多是采用各業(yè)務(wù)或業(yè)務(wù)核心平臺獨立規(guī)劃和管理資源的垂直管理模式,引入了云平臺后,各業(yè)務(wù)共享云平臺虛擬資源池,需要對整個共享資源池進行統(tǒng)一的規(guī)劃、分配和管理,我們稱這種模式為資源的水平管理模式。為了支持這種管理模式的轉(zhuǎn)變,在云平臺運維管理流程中,我們將現(xiàn)有管理模式中的資源規(guī)劃調(diào)整資源服務(wù)規(guī)劃和資源規(guī)劃兩個流程來完成。在資源服務(wù)規(guī)劃階段,主要是基于業(yè)務(wù)規(guī)劃制定云平臺業(yè)務(wù)總體規(guī)劃(又稱云平臺演進規(guī)劃),并定義針對不同業(yè)務(wù)特點的資源差異化分配標(biāo)準(zhǔn)在資源規(guī)劃階段,資源容量規(guī)劃是在云平臺業(yè)務(wù)總體規(guī)劃和資源分配
20、標(biāo)準(zhǔn)的基礎(chǔ)上進行的業(yè)務(wù)共享資源池容量規(guī)劃,確定云平臺的建設(shè)或擴容需求及規(guī)劃,云平臺資源服務(wù)規(guī)劃和資源規(guī)劃流程的實施,提升了資源分配的標(biāo)準(zhǔn)化程度和規(guī)劃水平,促進了資源管理模式從垂直管理向水平管理模式的轉(zhuǎn)變。資源的申請和實施方式傳統(tǒng)資源管理模式中由前端業(yè)務(wù)部門或業(yè)務(wù)運營支撐部門直接向運維部門提交既有資源的申請,或在資源管理平臺中提交新增資源申請。復(fù)雜資源的申請審批通過技術(shù)評審會的形式來進行,從資源的申請到資源采購、部署流程比較復(fù)雜,往往 耗時較長。在云平臺中,在云平臺容量允許范圍內(nèi),資源的申請和部署通過資源服務(wù)訂閱和開通的自助式服務(wù)完成,而且資源服務(wù)訂閱和開通是基于既定的資源服務(wù)模版來實現(xiàn),因此提
21、升了資源分配的標(biāo)準(zhǔn)化程度,極大縮短了從資源申請到資源部署完成的時間,提升了運維部門對業(yè)務(wù)資源需求的快速相應(yīng)能力。當(dāng)云平臺容量無法滿足需求時,由運維部門基于云平臺運營情況的統(tǒng)計分析和云平臺承載業(yè)務(wù)發(fā)展規(guī)劃來統(tǒng)籌考慮,提交擴容建議,由建設(shè)部門組織進行云平臺的新建和擴容規(guī)劃,使資源的新增和擴容能夠更及時、更精確地跟蹤和反應(yīng)業(yè)務(wù)的需求,提升了資源規(guī)劃部門和資源運維管理部門對業(yè)務(wù)部門的理解和支持。資源的運營和優(yōu)化在云平臺中,通過資源部署策略的設(shè)置,實現(xiàn)了虛擬資源的自動遷移和優(yōu)化,提升了資源的利用率和可靠性。同時通過資源運營情況評估流程的增加,對資源分配進行定期回顧、優(yōu)化和調(diào)整,為基于業(yè)務(wù)實際資源使用情況
22、及時調(diào)整業(yè)務(wù)的資源分配方案提供了便利,同傳統(tǒng)運維相比,降低了因業(yè)務(wù)容量迅速增長帶來的資源容量不足和性能、穩(wěn)定性下降的風(fēng)險,避免了因業(yè)務(wù)容量下降而帶來的資源利用率的降低。資源的回收機制在傳統(tǒng)運維中,資源的回收通常是由業(yè)務(wù)的下線觸發(fā),且資源多是由于業(yè)務(wù)下線而轉(zhuǎn)入備件或報廢,因此存在著資源利用率低、閑置率高的弊端。在云平臺中,運維部門會根據(jù)業(yè)務(wù)量的下降提出資源服務(wù)變更的建議,而業(yè)務(wù)下線會觸發(fā)資源服務(wù)的退訂流程,資源服務(wù)變更和退訂將業(yè)務(wù)占有的部分或全部虛擬資源釋放回云平臺資源池,仍由云平臺運維管理人員根據(jù)其他業(yè)務(wù)的資源需求進行再次分配,因此避免了資源利用率低、閑置率高的弊端。本運維規(guī)范只對與傳統(tǒng)運維管
23、理有較大區(qū)別和變化的部分著重說明,對于維持不變的流程這里不再冗述。例如,故障處理、日常維護作業(yè)計劃、版本管理、監(jiān)控、備件管理與原有運維管理基本一致,因此對于上述流程,在管理流程實施說明中,不再給出詳細流程設(shè)計和實施說明,而在各生命周期管理概述中對這些流程在云平臺運維中的變化作簡要說明。云平臺維護組織架構(gòu)和方式變革從管理對象角度來劃分,運維管理的分工可以分為資源管理、資源服務(wù)管理和業(yè)務(wù)管理。這些運維管理的角色和職責(zé)設(shè)計應(yīng)遵循“設(shè)備層統(tǒng)一維護,業(yè)務(wù)層分權(quán)維護”的設(shè)計原則和云計算平臺實際的情況和特點來設(shè)定。圖 AUTONUM * Arabic 云平臺運維管理組織架構(gòu)從運維管理需求出發(fā),整個運維管理組
24、織結(jié)構(gòu)可以劃分為四個管理層級:組織管理及支持層、平臺優(yōu)化層、系統(tǒng)監(jiān)控層、現(xiàn)場操作層,各管理層級的職責(zé)分工如下:組織管理及支持層組織管理及支持層為組織的相關(guān)職能部門部門或支持單位,為云平臺的管理和維護提供必要的支援,屬于組織管理及支持層的部門和組織包括:省信息中心、各級運維部門、前端業(yè)務(wù)部門,其中信息中心為云平臺運維管理部門,對云平臺優(yōu)化層、系統(tǒng)監(jiān)控層、現(xiàn)場操作層的云平臺運維工作提供管理和制度支持,也作為云平臺建設(shè)規(guī)劃方,負責(zé)云平臺的總體、建設(shè)及擴容的規(guī)劃;前端業(yè)務(wù)部門和各級運維部門作為云平臺的用戶,提出各業(yè)務(wù)的資源需求。上述部門在云平臺中新增的職責(zé)如下:省信息中心新增職責(zé)定義,包括:協(xié)調(diào)各部門
25、共同完成資源服務(wù)規(guī)劃,制定資源分配標(biāo)準(zhǔn)主持技術(shù)評審會議審批復(fù)雜資源申請主持技術(shù)評審會議審批云平臺優(yōu)化和擴容方案,資源落實資源服務(wù)重大變更和服務(wù)終止的審批云管理平臺功能規(guī)劃業(yè)務(wù)運營方負責(zé)新業(yè)務(wù)引入、業(yè)務(wù)擴容的規(guī)劃和預(yù)評審云平臺技術(shù)標(biāo)準(zhǔn)的制定、更新和下發(fā)調(diào)度職責(zé),包括:本省通信網(wǎng)的運行維護管理,對各本地網(wǎng)的運行維護工作進行管理和考核。云平臺運維管理云平臺管理規(guī)范的制定、更新和下發(fā)云平臺安全管理策略和規(guī)范的制定云平臺安全評估前端業(yè)務(wù)管理部門負責(zé)業(yè)務(wù)管理各級運維部門包括各市級信息中心,根據(jù)業(yè)務(wù)部門的資源需求,提出資源應(yīng)用需求以及優(yōu)化需求,協(xié)助制定規(guī)范。負責(zé)業(yè)務(wù)部門的信息安全等工作。平臺優(yōu)化層平臺優(yōu)化層
26、負責(zé)云平臺詳細技術(shù)標(biāo)準(zhǔn)、管理規(guī)范的管理和平臺級的功能和能力規(guī)劃及管理。包括云平臺管理員、云平臺安全員、云平臺優(yōu)化分析員。云平臺管理員云平臺管理員的職責(zé)包括:資源服務(wù)和資源模版的創(chuàng)建和維護資源池的劃分;標(biāo)準(zhǔn)資源服務(wù)訂閱申請的審批對經(jīng)過技術(shù)評審會議批準(zhǔn)的非標(biāo)準(zhǔn)的資源服務(wù)訂閱申請進行確認(rèn)。云平臺擴容中虛擬資源接入確認(rèn)和驗收云平臺資產(chǎn)管理云管理平臺系統(tǒng)管理云平臺管理員的技能要求包括:熟悉組織業(yè)務(wù)、資源、應(yīng)用的各項管理制度熟悉資源分配技術(shù)標(biāo)準(zhǔn)和規(guī)范熟悉云計算的最新技術(shù)和相關(guān)產(chǎn)品的性能、最新進展以及云平臺的各項技術(shù)標(biāo)準(zhǔn)和規(guī)范熟悉行業(yè)典型業(yè)務(wù)應(yīng)用或業(yè)務(wù)平臺的等級劃分及其資源容量及性能常規(guī)需求熟悉電網(wǎng)行業(yè)各類
27、網(wǎng)元的選型和建設(shè)、實施標(biāo)準(zhǔn)及性能指標(biāo)熟悉各業(yè)務(wù)之間在資源上的依賴或關(guān)聯(lián)管理,以及對資源分配的影響熟悉云管理平臺的管理功能云平臺優(yōu)化分析員云平臺優(yōu)化分析員的職責(zé)包括:云平臺資源需求匯總;平臺建設(shè)、資源分配總體規(guī)劃的建立和維護;資源實際分配情況跟蹤;虛擬資源、設(shè)備運行分析;性能監(jiān)控和優(yōu)化分析;流量監(jiān)控與分析;云平臺的總體運行質(zhì)量分析;云平臺的優(yōu)化和擴容建議為云平臺管理員和云管理平臺操作員在資源分配和部署上提供技術(shù)支援。作為技術(shù)評審會成員,參加業(yè)務(wù)部門資源申請技術(shù)評審,提供該業(yè)務(wù)當(dāng)前實際容量分析及趨勢預(yù)測、云管理平臺使用情況和性能、業(yè)務(wù)資源分配方案建議、云平臺擴容和優(yōu)化建議等信息。云平臺優(yōu)化分析員的
28、技能要求包括:熟悉業(yè)務(wù)應(yīng)用或業(yè)務(wù)平臺的等級劃分和典型資源及性能要求熟悉資源分配技術(shù)標(biāo)準(zhǔn)和規(guī)范和云計算資源分配和優(yōu)化相關(guān)技術(shù)熟悉行業(yè)典型業(yè)務(wù)應(yīng)用或業(yè)務(wù)平臺的等級劃分及其資源容量及性能常規(guī)需求熟悉各業(yè)務(wù)之間在資源上的依賴或關(guān)聯(lián)管理,以及對資源分配的影響熟悉云平臺資源池的拓撲結(jié)構(gòu)出色的溝通協(xié)調(diào)能力云平臺安全員云平臺安全員的職責(zé)包括:安全策略和規(guī)程執(zhí)行云平臺的系統(tǒng)安全性、用戶信息安全保障和日常的安全操作(如安全管理、安全認(rèn)證,密碼管理,安全備份、日志管理、DDOS、安全掃描和漏洞檢測,巡檢,安全補丁升級和病毒防治等)安全事件處理云平臺安全員的技能要求包括:熟悉業(yè)務(wù)等級劃分和信息安全需求熟悉安全管理規(guī)章
29、制度和相關(guān)國家、國際標(biāo)準(zhǔn)及技術(shù)規(guī)范熟悉各類安全管理機制和技術(shù)系統(tǒng)監(jiān)控層系統(tǒng)監(jiān)控層通過自動化運維系統(tǒng)、云管理平臺、虛擬化管理軟件等對云平臺承載業(yè)務(wù)、應(yīng)用、應(yīng)用基礎(chǔ)設(shè)施(操作系統(tǒng)、中間件、數(shù)據(jù)庫等)、云平臺資源池物理、虛擬設(shè)備(各種計算、存儲和網(wǎng)絡(luò)資源)以及云管理平臺本身的狀態(tài)、性能和故障告警信息進行實時監(jiān)控,對云平臺資源池的設(shè)備進行集中維護和網(wǎng)絡(luò)管理,對資源池設(shè)備實施配置調(diào)度等。系統(tǒng)監(jiān)控層又可以分為云平臺監(jiān)控組、云管理平臺操作員兩個角色。云平臺監(jiān)控組云平臺監(jiān)控組的職責(zé)包括:面向云平臺承載業(yè)務(wù),保證業(yè)務(wù)的可用性和性能負責(zé)資源管理、運行監(jiān)控、數(shù)據(jù)配置、數(shù)據(jù)管理、性能管理、故障管理等。向平臺管理層提交
30、服務(wù)報告、資源分析報告等向云管理平臺操作員和現(xiàn)場操作層分發(fā)告警信息和處理操作命令。在云計算環(huán)境下,云平臺監(jiān)控組的新增技能要求包括:熟悉云管理平臺的監(jiān)控功能和各項監(jiān)控信息的分析處理監(jiān)控信息的匯總、分析和匯報能力能夠快速完成云平臺告警和故障的初步原因分析和緊急處理,并下發(fā)到合適的處理人員云管理平臺操作員云管理平臺操作員的職責(zé)包括:云管理平臺進行日常維護和工單受理資源服務(wù)的實例化和具體部署方案的制定和自動部署的執(zhí)行虛擬化資源動態(tài)遷移和部署的監(jiān)控和處理通過云管理平臺和虛擬化管理軟件對虛擬資源進行操作和管理,如資源池邏輯拓撲管理、虛擬資源的自動部署、虛擬資源狀態(tài)和性能的監(jiān)控和管理資源的調(diào)度和遷移、客戶服
31、務(wù)開通請求的實施等對于無法通過工具自動完成的生產(chǎn)作業(yè),由云管理平臺操作員下發(fā)工單到現(xiàn)場操作層進行處理。云管理平臺操作員的技能要求包括:熟悉云管理平臺、虛擬化管理軟件的相關(guān)虛擬資源部署、監(jiān)控和調(diào)度功能熟悉云平臺資源池的拓撲結(jié)構(gòu),能夠為現(xiàn)場維護人員提供技術(shù)支撐熟悉業(yè)務(wù)應(yīng)用或業(yè)務(wù)平臺的等級劃分和典型資源要求熟悉各業(yè)務(wù)之間在資源上的依賴或關(guān)聯(lián)管理,以及對資源分配的影響熟悉資源分配技術(shù)標(biāo)準(zhǔn)和規(guī)范現(xiàn)場操作層現(xiàn)場操作層作為運維生產(chǎn)作業(yè)層次結(jié)構(gòu)中直接工作于現(xiàn)場環(huán)境的一線工作人員,負責(zé)所轄區(qū)域物理資源池網(wǎng)絡(luò)設(shè)備(網(wǎng)絡(luò)、計算、存儲)、虛擬資源及基礎(chǔ)設(shè)施(動力電源、環(huán)境、機房等)的現(xiàn)場值守、維護、巡檢,并直接接收來
32、自系統(tǒng)監(jiān)控層的任務(wù)工單和系統(tǒng)監(jiān)控層手工或自動發(fā)送的資源、應(yīng)用、業(yè)務(wù)告警信息,實施相關(guān)的故障修復(fù)、資源手工部署、調(diào)配的具體實施與操作。這部分職責(zé)又可按不同的工作對象和技能要求,進一步細分為基礎(chǔ)設(shè)施維護人員、物理資源池維護人員和虛擬資源池維護人員?;A(chǔ)設(shè)施維護人員、物理資源池維護人員的職責(zé)和技能要求與傳統(tǒng)數(shù)據(jù)中心沒有變化。虛擬資源池維護人員虛擬資源池維護人員的職責(zé)包括:虛擬資源的部署接收和處理系統(tǒng)監(jiān)控層下發(fā)的虛擬資源維護任務(wù)工單或告警信息,在規(guī)定的時間內(nèi)解決事件和服務(wù)請求,實施相關(guān)的故障修復(fù)、資源手工部署、調(diào)配的具體實施與操作。在需要時及時利用其它資源(開發(fā)商, 廠家)參與事件、問題解決虛擬資源的
33、監(jiān)控和巡檢虛擬資源池維護人員的技能要求為:熟悉虛擬化平臺和技術(shù)環(huán)境熟悉虛擬化技術(shù),能夠熟練使用虛擬化軟件和虛擬化管理軟件進行虛擬資源實施的相關(guān)操作和問題分析有較強的問題分析和解決能力工程建設(shè)方工程建設(shè)方的新增職責(zé)包括:云平臺擴容情況下,新設(shè)備的接受、點檢、安裝聯(lián)調(diào)、虛擬化以及相關(guān)的測試、驗收工作,將新增設(shè)備納入到云平臺資源池中。在云平臺環(huán)境下,工程建設(shè)方的新增技能要求為:熟悉虛擬化及虛擬化管理軟件的安裝和調(diào)試熟悉云平臺環(huán)境熟悉物理資源虛擬化技術(shù),能夠熟練完成物理資源虛擬化工作能夠熟練使用云管理平臺、虛擬化管理軟件完成虛擬資源的接入、聯(lián)調(diào)、各類測試活動及云平臺接入過程中可能出現(xiàn)的常見問題的快速解
34、決能力等應(yīng)用提供商應(yīng)用提供商的職責(zé)應(yīng)用提供商的職責(zé)與傳統(tǒng)運維系統(tǒng)相同,進行應(yīng)用開發(fā)和部署。應(yīng)用維護方應(yīng)用維護方的新增職責(zé)包括: 應(yīng)用維護人員負責(zé)云平臺承載業(yè)務(wù)的運行維護和支撐,對于業(yè)務(wù)核心平臺和自有應(yīng)用,應(yīng)用維護由各級運維人員負責(zé),非自有應(yīng)用的應(yīng)用維護及職責(zé)由第三方合作伙伴負責(zé)。為不限制云平臺運維管理規(guī)范的適用范圍,這里統(tǒng)一簡稱為應(yīng)用維護方。對于應(yīng)用系統(tǒng)的運維,由應(yīng)用維護人員完成日常的系統(tǒng)升級、應(yīng)用升級/測試以及系統(tǒng)上線前測試、生產(chǎn)環(huán)境檢查和生產(chǎn)環(huán)境接入確認(rèn)等操作。在云平臺環(huán)境下,應(yīng)用維護人員的新增技能要求為:熟悉虛擬鏡像、虛擬器件的創(chuàng)建、發(fā)布和管理操作熟悉應(yīng)用遷移的過程及過程各項步驟中的使用
35、的流程和技術(shù)熟悉應(yīng)用在虛擬環(huán)境下的備份、回復(fù)和回退技術(shù)基于業(yè)務(wù)層分權(quán)維護的原則,應(yīng)用維護人員又可以劃分為行業(yè)應(yīng)用維護人員、業(yè)務(wù)平臺維護人員、云管理平臺維護人員。業(yè)務(wù)平臺維護人員負責(zé)業(yè)務(wù)平臺的維護以及影響多個行業(yè)應(yīng)用的應(yīng)用故障協(xié)調(diào)處理。其中云管理平臺運維人員負責(zé)云管理平臺的維護以及影響超過一個業(yè)務(wù)核心平臺或者影響超過一個資源池的應(yīng)用故障的協(xié)調(diào)處理如果生產(chǎn)云劃分為多個資源池,則管理上相對獨立的資源池也可設(shè)置資源池管理平臺運維人員協(xié)助云管理平臺運維人員對管理平臺進行功能維護和故障管理。云管理平臺維護人員的技能要求為:精通云管理平臺的各項功能和使用有解決跨資源池和全平臺重大問題的分析和解決能力有很強的
36、協(xié)調(diào)能力,能協(xié)調(diào)解決跨業(yè)務(wù)平臺、跨資源池或多個行業(yè)應(yīng)用的重大故障熟悉云管理平臺上的核心應(yīng)用和業(yè)務(wù)云環(huán)境下的業(yè)務(wù)系統(tǒng)運維變革和制度業(yè)務(wù)系統(tǒng)生命周期管理業(yè)務(wù)生命周期可以分為業(yè)務(wù)規(guī)劃設(shè)計、業(yè)務(wù)資源部署、產(chǎn)品研發(fā)、測試上線、業(yè)務(wù)維護和運營、業(yè)務(wù)變更和業(yè)務(wù)退網(wǎng) 等關(guān)鍵流程。業(yè)務(wù)生命周期管理中,業(yè)務(wù)規(guī)劃設(shè)計階段主要由業(yè)務(wù)、業(yè)務(wù)運營和支撐部門負責(zé),產(chǎn)品研發(fā)主要由開發(fā)部門負責(zé),因此這部分流程不在本云平臺運維規(guī)范范圍內(nèi)。產(chǎn)品部署即產(chǎn)品的資源部署,其中業(yè)務(wù)資源部署不在本云平臺運維管理規(guī)范范圍內(nèi),產(chǎn)品的網(wǎng)絡(luò)資源部署通過資源服務(wù)訂閱和開通實現(xiàn)。業(yè)務(wù)管理流程概要設(shè)計業(yè)務(wù)生命周期管理的流程概要設(shè)計如下圖所示,灰色的流程不
37、在本運維管理規(guī)范范圍內(nèi)。圖 AUTONUM * Arabic 業(yè)務(wù)生命周期管理產(chǎn)品的上線測試和驗收包含了測試環(huán)境準(zhǔn)備,產(chǎn)品連接測試、業(yè)務(wù)穿測和計費測試和產(chǎn)品上線/上市等多個環(huán)節(jié),詳細的流程在產(chǎn)品測試和驗收流程實施說明中詳細描述業(yè)務(wù)維護和運營中涉及到業(yè)務(wù)的監(jiān)控和告警、業(yè)務(wù)相關(guān)事件的管理,同時,由于云平臺監(jiān)控組和云平臺優(yōu)化分析員角色的設(shè)置,使得對各業(yè)務(wù)及業(yè)務(wù)應(yīng)用的資源占用情況和性能有了更及時清晰的了解,使得在業(yè)務(wù)運維中調(diào)整業(yè)務(wù)和應(yīng)用的資源分配方案成為可能。例如:在業(yè)務(wù)進入衰退期后,可能會由業(yè)務(wù)部門提出業(yè)務(wù)退網(wǎng)的需求,并引發(fā)該業(yè)務(wù)占用的資源服務(wù)和資源的相關(guān)服務(wù)退訂和資源回收需求,服務(wù)退訂和資源回收流
38、程將分別在資源服務(wù)生命周期管理和資源生命周期管理中具體描述。由業(yè)務(wù)衰退引發(fā)的業(yè)務(wù)占用資源減少或由業(yè)務(wù)成長所引發(fā)的資源需求的增加則可以通過定期的云平臺優(yōu)化和擴容建議觸發(fā),通過云平臺業(yè)務(wù)資源變更管理實現(xiàn)業(yè)務(wù)資源分配方案的調(diào)整。因此,云平臺業(yè)務(wù)資源的定期回顧和彈性管理是業(yè)務(wù)監(jiān)控和運營流程以及資源運營流程中中一個非常顯著的變化,這部分內(nèi)容將在資源服務(wù)生命周期管理的資源服務(wù)運營和變更流程中說明。業(yè)務(wù)管理流程實施說明產(chǎn)品上線測試流程圖 AUTONUM * Arabic 產(chǎn)品上線測試流程流程實施說明:流程環(huán)節(jié)流程步驟牽頭單位或角色支持單位或角色本環(huán)節(jié)具體職責(zé)1測試方案準(zhǔn)備前端業(yè)務(wù)部門應(yīng)用提供商應(yīng)用維護方業(yè)務(wù)
39、運營支撐負責(zé)人應(yīng)用提供商完成應(yīng)用開發(fā)和業(yè)務(wù)接口開發(fā)聯(lián)調(diào)后,通知業(yè)務(wù)運營支撐負責(zé)人及相關(guān)單位。由前端業(yè)務(wù)部門牽頭完成系統(tǒng)配置,并牽頭落實測試方案(含測試計劃、用例)及數(shù)據(jù)準(zhǔn)備。2應(yīng)用測試資源申請應(yīng)用提供商各級運維部門云平臺優(yōu)化分析員如果該應(yīng)用沒有常設(shè)測試資源或為新接入應(yīng)用的首次測試,則應(yīng)用業(yè)務(wù)運營支撐負責(zé)人訂閱適用服務(wù)申請測試資源,由云平臺優(yōu)化分析員進行審批3應(yīng)用測試資源部署云管理平臺操作員虛擬資源池維護人員由云管理平臺操作員負責(zé)為測試資源的服務(wù)實例化和開通,由虛擬資源維護人員做資源部署的現(xiàn)場支持和確認(rèn)4系統(tǒng)配置應(yīng)用維護方應(yīng)用提供商由應(yīng)用維護方組織完成系統(tǒng)配置,以及測試計劃和用例及測試數(shù)據(jù)的準(zhǔn)備
40、。由應(yīng)用維護方對應(yīng)用提供商提供的技術(shù)文件及系統(tǒng)狀態(tài)(如系統(tǒng)告警及進程運行等)進行檢查,確認(rèn)系統(tǒng)及技術(shù)文件已經(jīng)具備測試條件?!咀?】5應(yīng)用測試應(yīng)用維護方應(yīng)用提供商前端業(yè)務(wù)部門網(wǎng)運在上線前,由應(yīng)用維護方根據(jù)應(yīng)用的要求和測試方案對系統(tǒng)進行測試。【注2】對于測試中發(fā)現(xiàn)的問題,由應(yīng)用提供商負責(zé)原因分析和修正。測試完成后,提交測試報告【注3】由前端業(yè)務(wù)部門和網(wǎng)運對測試報告進行評審和確認(rèn)。在上線測試前應(yīng)用維護方應(yīng)進行對生產(chǎn)環(huán)境應(yīng)用進行備份或生成鏡像,以備系統(tǒng)回退方案使用。6業(yè)務(wù)穿測業(yè)務(wù)運營支撐負責(zé)人應(yīng)用維護方前端業(yè)務(wù)部門如果是全新系統(tǒng)上線,在完成應(yīng)用測試后,應(yīng)由前端業(yè)務(wù)部門負責(zé)在規(guī)定的時限內(nèi)完成業(yè)務(wù)穿行測試
41、,由各級運維部門做結(jié)果確認(rèn)。在進行測試前,由前端業(yè)務(wù)部門牽頭完成業(yè)務(wù)穿測。7測試結(jié)果確認(rèn)前端業(yè)務(wù)部門應(yīng)用維護方由各級運維部門和前端業(yè)務(wù)部門對于測試結(jié)果進行確認(rèn),移交納入運維8業(yè)務(wù)試運行和商用前端業(yè)務(wù)部門業(yè)務(wù)運營支撐負責(zé)人各級運維部門信息中心應(yīng)用提供商如果需要進行試運行,由前端業(yè)務(wù)部門牽頭進行試運行?!咀?】注1:應(yīng)用提供商提供的技術(shù)文件應(yīng)包括但不限于設(shè)計文件、交工文件、測試文件、安裝文件、設(shè)備手冊 & 工程驗收報告(如需要)等,其中,測試文件應(yīng)包含測試報告、上線計劃和方案(含回退方案)等。注2:上線前應(yīng)用維護方進行的測試通常可以包括功能測試、性能測試、壓力測試、與周邊網(wǎng)元的聯(lián)調(diào)測試等測試。如該
42、應(yīng)用為業(yè)務(wù)平臺,為保障業(yè)務(wù)平臺上線后的可管可控,在應(yīng)用上網(wǎng)前還應(yīng)進行與IT支撐系統(tǒng)等相關(guān)系統(tǒng)的聯(lián)調(diào)測試。注3:如為后繼版本升級,應(yīng)提交升級方案(含回退),測試一周后,提交測試報告,含版本說明,如測試不成功,執(zhí)行回退方案,應(yīng)在測試報告和版本說明中說明。注4:原則上核心業(yè)務(wù)首次上線應(yīng)在試運行環(huán)境上進行一個月的試運行,然后在生產(chǎn)環(huán)境上正式商用, 由前端業(yè)務(wù)部門部發(fā)布正式商用或產(chǎn)品上線通知通知。正式商用后的版本升級試運行周期為一周,按現(xiàn)有的版本管理流程執(zhí)行。云平臺故障分級云平臺的業(yè)務(wù)維護和運營與傳統(tǒng)業(yè)務(wù)維護運營基本相同,還有一個小的區(qū)別就是在傳統(tǒng)運維中,通常各業(yè)務(wù)彼此間影響較小,因此業(yè)務(wù)和應(yīng)用的事件管
43、理通常只涉及單個業(yè)務(wù)的事件告警和管理。在云平臺中,可能存在影響多個業(yè)務(wù)的事件,因此在此節(jié)簡要介紹一下云平臺的故障分級機制。故障等級故障級別故障特征故障影響范圍A重大故障A云管理平臺關(guān)鍵功能或云平臺及資源區(qū)本身出現(xiàn)系統(tǒng)故障,或者云平臺承載的業(yè)務(wù)核心平臺出現(xiàn)故障導(dǎo)致云平臺承載多個業(yè)務(wù)無法正常使用多個(=3)云平臺承載業(yè)務(wù)多數(shù)云管理平臺用戶或多個云平臺承載業(yè)務(wù)的用戶B重大故障B云管理平臺或云平臺部分物理、虛擬資源出現(xiàn)故障;或者云管理平臺某個門戶或某個功能模塊不能正常使用;或者云平臺承載的某個重要應(yīng)用功能不正常導(dǎo)致部分用戶不能正常使用個別(3)云平臺承載業(yè)務(wù)個別(3)云平臺承載業(yè)務(wù)云管理平臺部分用戶或
44、個別云平臺承載業(yè)務(wù)的用戶C普通故障云管理平臺或云平臺部分物理、虛擬資源出現(xiàn)故障;某個云平臺承載業(yè)務(wù)部分使用功能不正常導(dǎo)致該業(yè)務(wù)的使用或性能受到影響單個云平臺承載業(yè)務(wù)單個云平臺承載業(yè)務(wù)的個別用戶D一般故障和投訴云平臺或云平臺部分物理、虛擬資源出現(xiàn)故障;或者由于本地接入線路、局端配置或用戶故障導(dǎo)致個別用戶無法正常使用單個與平臺承載業(yè)務(wù)單個云平臺承載業(yè)務(wù)單個云平臺承載業(yè)務(wù)的個別用戶企業(yè)運維系統(tǒng)可行性分析運維現(xiàn)狀討論從運維管理的角度去看云計算,云計算平臺的建設(shè)不是一套產(chǎn)品的建設(shè),而是包括管理、運維體系的變革,必須建立相關(guān)標(biāo)準(zhǔn)和手冊,協(xié)助企業(yè)提升管理和運維能力,使現(xiàn)有的運維管理體制和流程可以很好的實現(xiàn)到
45、對整個云平臺的運維,從而使得云計算平臺不僅建起來,還能很好的用起來。這是需要面臨的一個挑戰(zhàn)和新的課題。根據(jù)現(xiàn)有業(yè)務(wù)平臺的建設(shè)、運營、維護實際情況,目前業(yè)務(wù)平臺的維護形式是垂直、分散的維護模型(平臺獨立建設(shè),獨立維護),主要包括如下幾種情況:平臺分散在多個維護單位(或維護部門),平臺集中維護和分散維護方式共存;硬件(包括服務(wù)器、存儲、網(wǎng)絡(luò)設(shè)備等)和軟件(操作系統(tǒng)、數(shù)據(jù)庫、中間件、應(yīng)用軟件)的維護崗位分設(shè)和合設(shè)共存。硬件(包括服務(wù)器、存儲、網(wǎng)絡(luò)設(shè)備等)和軟件(操作系統(tǒng)、數(shù)據(jù)庫、中間件、應(yīng)用軟件)的維護崗位分設(shè)和合設(shè)共存。運維改革的挑戰(zhàn)隨著云計算技術(shù)在業(yè)務(wù)平臺領(lǐng)域大規(guī)模的應(yīng)用,傳統(tǒng)的業(yè)務(wù)平臺運維體系
46、將面臨挑戰(zhàn),主要表現(xiàn)在如下幾個方面:維護管理制度上:云平臺和傳統(tǒng)業(yè)務(wù)平臺的建設(shè)、維護、服務(wù)模式不同,導(dǎo)致現(xiàn)階段缺乏相適應(yīng)的維護制度以適應(yīng)這種變化維護人員經(jīng)驗上:缺乏具備虛擬化技術(shù)應(yīng)用、資源自動化部署、資源綜合調(diào)度、虛擬化技術(shù)安全保障等方面的專業(yè)技術(shù)人才,是快速推進云計算技術(shù)規(guī)?;瘧?yīng)用的瓶頸之一服務(wù)保障要求上:保障難度變大,虛擬化增加了IT基礎(chǔ)架構(gòu)的復(fù)雜性,增加了虛擬化層、物理與邏輯的脫離,故障排查更為困難管理流程適配上:云平臺建設(shè)特點是資源與項目分離,而傳統(tǒng)業(yè)務(wù)平臺的資源是獨立建設(shè)獨立使用,因此需要適配云平臺資源共享的特性,需要引入資源管理和服務(wù)管理等流程維護管理手段上:迫切需要建立健全一套完
47、整的與現(xiàn)有運營支撐系統(tǒng)(如:綜合網(wǎng)管系統(tǒng)、資源管理系統(tǒng)、服務(wù)管理系統(tǒng)等)集成的綜合解決方案??尚行苑治鼍S護管理制度上:當(dāng)前企業(yè)擁有比較完善的維護管理制度,包括各種運維指標(biāo)、巡檢指標(biāo)、SLA標(biāo)準(zhǔn),又采用了南方電網(wǎng)的統(tǒng)一規(guī)范管理制度,在制度的施行上有積極的優(yōu)勢。盡管使用云平臺之后,這些管理制度會做相應(yīng)改變,但仍然能在較短時間內(nèi)完成運維管理制度上的變更。維護人員經(jīng)驗上:對云平臺的維護如前面所述,需要一些專業(yè)的運維崗位和人才,各市級部門的管理員可能不具備這些專業(yè)知識。但在系統(tǒng)大集中的背景下,云平臺會在省信息中心集中實施,而信息中心的專業(yè)技術(shù)人才相對充足,是對云平臺運維的保障。服務(wù)保障要求上:由于云平臺
48、有一整套的監(jiān)控機制,所以在完善運維責(zé)任制的基礎(chǔ)上,充分利用云平臺管理軟件,可以大大降低故障率。管理流程適配上:云平臺的實施流程和運維流程需要完整的人員理論培訓(xùn),管理流程的改變需要人的素質(zhì)提高和制度的實施監(jiān)管。在企業(yè)的日常培訓(xùn)中已經(jīng)取得相應(yīng)經(jīng)驗,而制度的實施監(jiān)管也有一整套的制度體系,且有責(zé)任歸口。維護管理手段上:現(xiàn)有的企業(yè)系統(tǒng)中已經(jīng)有了較為完善的辦公系統(tǒng)和資源管理系統(tǒng),是建立云平臺綜合解決方案的基礎(chǔ)。虛擬資源池運維方式變更資源生命周期管理流程概述資源服務(wù)的生命周期可以劃分為服務(wù)規(guī)劃、服務(wù)設(shè)計、服務(wù)訂閱和開通、服務(wù)維護、運營和變更管理、服務(wù)運營情況評估等階段資源管理的生命周期可以劃分為資源規(guī)劃、云
49、平臺建設(shè)、資源部署、資源維護、運營和變更管理、資源運營情況評估等階段可以看出由于資源服務(wù)生命周期管理流程的引入,單個業(yè)務(wù)資源的申請已經(jīng)由資源服務(wù)訂閱所取代,而云平臺資源的申請和實施則主要通過資源規(guī)劃和云平臺建設(shè)來實現(xiàn)。資源服務(wù)和資源管理在生命周期的各個階段都有緊密的交互,尤其是資源和資源服務(wù)的維護、運營和變更往往會相互影響和轉(zhuǎn)變,因此將這兩個生命周期管理流程在一個二級流程中展現(xiàn),并將資源維護、運營、變更和回顧與資源服務(wù)的對應(yīng)流程合并描述。同現(xiàn)有運維管理相比,云平臺增加了一類管理對象虛擬資源,因此云平臺的資源管理和配置管理也相應(yīng)地增加了虛擬資源信息管理和虛擬資源配置項管理的要求,通過云管理平臺的
50、資產(chǎn)管理、資源封裝、資源模版和部署調(diào)度四個功能模塊,可以實現(xiàn)對各類物理和虛擬資源的自動發(fā)現(xiàn)、自動納管、查詢、拓撲管理(拓撲展示、拓撲變更和故障診斷協(xié)助)、資源池管理、虛擬資源自動部署和遷移策略的制定等功能,同時提供了物理和虛擬資源的手工登記、配置、部署、更新等功能。基于這些功能可以實現(xiàn)虛擬資源及配置項從虛擬資源和配置項登記、虛擬資源自動/手工部署、虛擬資源/配置項動態(tài)監(jiān)控、自動遷移和信息自動更新、虛擬資源/配置項拓撲管理、虛擬資源回收/配置項刪除等的虛擬資源信息管理和虛擬資源配置項管理的完整流程。因此這部分請參考云管理平臺相關(guān)功能描述,在本運維規(guī)范中不再冗述。資源管理流程概要設(shè)計圖 AUTON
51、UM * Arabic 資源(服務(wù))生命周期管理概要設(shè)計管理流程實施說明資源(服務(wù))規(guī)劃和設(shè)計流程圖 AUTONUM * Arabic 資源服務(wù)規(guī)劃設(shè)計流程流程實施說明:流程環(huán)節(jié)流程步驟牽頭單位或角色支持單位或角色本環(huán)節(jié)具體職責(zé)1目標(biāo)業(yè)務(wù)規(guī)劃省信息部省信息中心前端業(yè)務(wù)部門業(yè)務(wù)運營支撐負責(zé)人云平臺管理員牽頭單位協(xié)調(diào)支持單位共同討論制定云平臺演進規(guī)劃,識別云平臺目標(biāo)業(yè)務(wù)2業(yè)務(wù)類別劃分標(biāo)準(zhǔn)制定省信息部省信息中心前端業(yè)務(wù)部門業(yè)務(wù)運營支撐負責(zé)人云平臺管理員牽頭單位協(xié)調(diào)支持單位共同識別與資源分配相關(guān)的業(yè)務(wù)類別劃分要素?!咀?】 據(jù)此調(diào)研、匯總和分析目標(biāo)業(yè)務(wù)信息,識別影響業(yè)務(wù)資源需求的關(guān)鍵因素,定義業(yè)務(wù)類別
52、劃分標(biāo)準(zhǔn)3資源服務(wù)類別、等級制定省信息部省信息中心前端業(yè)務(wù)部門業(yè)務(wù)運營支撐負責(zé)人云平臺管理員牽頭單位協(xié)調(diào)支持單位定義資源服務(wù)類別和等級4資源分配標(biāo)準(zhǔn)制定省信息部省信息中心前端業(yè)務(wù)部門業(yè)務(wù)運營支撐負責(zé)人云平臺管理員牽頭單位協(xié)調(diào)支持單位建立業(yè)務(wù)類別與資源服務(wù)類別、等級的映射關(guān)系,形成資源分配標(biāo)準(zhǔn),由云平臺管理員負責(zé)分配標(biāo)準(zhǔn)的成文和下發(fā),云平臺管理員負責(zé)資源服務(wù)模版的設(shè)計5資源分配標(biāo)準(zhǔn)改進建議提出云平臺優(yōu)化分析員云平臺優(yōu)化分析員定期(月度)對云平臺資源服務(wù)及資源運營情況進行分析,對云平臺資源優(yōu)化、平臺擴容以及資源分配標(biāo)準(zhǔn)提出改進建議6資源分配標(biāo)準(zhǔn)更新省信息部省信息中心前端業(yè)務(wù)部門業(yè)務(wù)運營支撐負責(zé)人云
53、平臺管理員通過定期(季度)的資源運營情況評估會議,省信息中心組織支持單位對資源分配標(biāo)準(zhǔn)改進建議進行評審,如果評審?fù)ㄟ^,形成會議決議,由云平臺管理員負責(zé)分配標(biāo)準(zhǔn)的具體修改,云平臺管理員負責(zé)資源服務(wù)模版的更新7云平臺物理資源需求分析和現(xiàn)狀評估省信息部省信息中心前端業(yè)務(wù)部門業(yè)務(wù)運營支撐負責(zé)人研究院云平臺優(yōu)化分析員通過定期(季度)的資源運營情況評估會議,省信息中心組織支持單位對云平臺優(yōu)化和擴容建議進行,評估云平臺資源使用現(xiàn)狀和預(yù)期資源需求,以及云平臺擴容建議8云平臺建設(shè)或擴容規(guī)劃省信息部省信息中心前端業(yè)務(wù)部門業(yè)務(wù)運營支撐負責(zé)人云平臺優(yōu)化分析員經(jīng)資源運營情況評估會議審議確定云平臺建設(shè)或擴容規(guī)劃,啟動云平
54、臺建設(shè)或擴容流程9資源維護和運營流程細化省信息部云平臺管理員省信息中心依據(jù)資源服務(wù)類別制定資源服務(wù)級別目標(biāo),并對資源維護及運營流程進行細化,并制定資源的部署調(diào)度策略【注2】。網(wǎng)運完成上述管理規(guī)程細化后,下發(fā)各市級信息中心執(zhí)行,由云平臺管理員負責(zé)協(xié)調(diào)這些管理規(guī)程的具體執(zhí)行或在云管理平臺中實現(xiàn)這些管理要求或部署調(diào)度策略10資源模版定義或修改云平臺管理員云平臺管理員依據(jù)資源服務(wù)類別和等級創(chuàng)建資源模板,如已有資源模版,云平臺管理員可基于既有資源模板定制【注3】11服務(wù)創(chuàng)建和注冊云平臺管理員云平臺管理員依據(jù)資源服務(wù)類別和等級以及收費標(biāo)準(zhǔn)定義資源服務(wù),并將其注冊在服務(wù)目錄中?!咀?】注1:業(yè)務(wù)類別劃分要素
55、包括但不限于:業(yè)務(wù)生命周期發(fā)展階段、業(yè)務(wù)用戶數(shù)量、業(yè)務(wù)級別、業(yè)務(wù)并行處理、連續(xù)性(如中游)、可靠性要求、業(yè)務(wù)資源使用特點(計算、存儲或網(wǎng)絡(luò))、特定網(wǎng)段或接口要求等,如果該產(chǎn)品已經(jīng)開發(fā)或上線,還應(yīng)考慮到應(yīng)用基礎(chǔ)設(shè)施(操作系統(tǒng)、數(shù)據(jù)庫、中間件)要求以及應(yīng)用的安全、可靠性等與資源相關(guān)需求;注2:資源部署調(diào)度策略可包括但不限于:高可用調(diào)度策略、負載均衡調(diào)度策略、資源遷移策略、電源節(jié)省調(diào)度策略、存儲部署調(diào)度策略等,具體策略的制定參見云管理平臺部署調(diào)度功能。注3:模板是對VM的一種格式化描述,對應(yīng)于服務(wù)目錄中定義的資源規(guī)格,包括VM的各項軟硬件資源配置參數(shù),其并不是一個具體的文件,但是它的描述是規(guī)范的、唯
56、一的。資源模板屬性可能會因選用不同的云管理平臺/工具而略有區(qū)別,通常,資源模板屬性包括但不限于以下信息:常規(guī)屬性:名稱、描述、用途等硬件配置:分配給VM的cpu和內(nèi)存、軟盤驅(qū)動器、dvd或cd驅(qū)動器、虛擬硬盤、網(wǎng)絡(luò)適配器等。操作系統(tǒng):VM操作系統(tǒng)相關(guān)配置文件注4:完整的資源服務(wù)屬性包括服務(wù)編碼、服務(wù)名稱、服務(wù)權(quán)限、服務(wù)版本、配套計算資源、配套存儲資源、配套網(wǎng)絡(luò)資源、配套軟件資源、服務(wù)費用、策略信息、SLA等信息,具體的屬性信息見云管理平臺服務(wù)目錄功能定義。資源服務(wù)訂閱、開通和資源部署流程圖 AUTONUM * Arabic 資源服務(wù)訂閱、開通和資源部署流程流程環(huán)節(jié)流程步驟牽頭單位或角色支持單位
57、或角色本環(huán)節(jié)具體職責(zé)1用戶選擇所需服務(wù)業(yè)務(wù)運維支持負責(zé)人云平臺管理員、云管理平臺操作員業(yè)務(wù)運營支撐負責(zé)人基于已審批的資源申請,在服務(wù)目錄中選擇所需的資源服務(wù),定制相關(guān)參數(shù)和服務(wù)水平。如為標(biāo)準(zhǔn)服務(wù),經(jīng)云平臺管理員和云管理平臺操作員審批后進入開通流程如不是標(biāo)準(zhǔn)服務(wù),但已經(jīng)過資源審批,由云平臺管理員負責(zé)服務(wù)模版的定義,以及服務(wù)的創(chuàng)建和注冊。由云平臺管理員配準(zhǔn)進入開通流程如未經(jīng)過審批,則應(yīng)經(jīng)資源運營情況評估的資源申請和審批獲得資源開通權(quán)限后訂閱資源服務(wù)2服務(wù)實例生成云管理平臺操作員云管理平臺操作員基于模版和客戶定制參數(shù),創(chuàng)建服務(wù)實例3服務(wù)實例開通云管理平臺操作員云管理平臺操作員下發(fā)服務(wù)自動實例化命令4
58、資源自動部署云管理平臺操作員云管理平臺操作員通過云管理平臺或虛擬化管理軟件實現(xiàn)資源自動部署5資源手工部署虛擬資源池維護人員云管理平臺操作員如果自動部署不成功,云管理平臺操作員下發(fā)工單,并協(xié)助虛擬資源池維護人員進行原因分析和手工部署6部署成功確認(rèn)虛擬資源池維護人員云管理平臺操作員部署成功后,系統(tǒng)自動發(fā)送或由虛擬資源池維護人員發(fā)送資源部署成功確認(rèn)7服務(wù)開通成功云管理平臺操作員服務(wù)部署成功后,由系統(tǒng)自動發(fā)送或由系統(tǒng)管理員通知申請方資源服務(wù)部署成功以及該資源相關(guān)信息(如果云管理平臺不能自動更新資源的狀態(tài),應(yīng)由云平臺優(yōu)化分析員更新資源的狀態(tài)和資源分配計劃),開始服務(wù)計費資源(服務(wù))運營和變更流程圖 AU
59、TONUM * Arabic 資源(服務(wù))運營和變更流程流程實施說明:流程環(huán)節(jié)流程步驟牽頭單位或角色支持單位或角色本環(huán)節(jié)具體職責(zé)1資源(服務(wù))監(jiān)控云平臺監(jiān)控組云平臺監(jiān)控組對資源的使用情況和告警信息進行實時監(jiān)控和告警【注1】2資源動態(tài)優(yōu)化云管理平臺操作員云平臺監(jiān)控組云平臺管理員云平臺優(yōu)化分析員虛擬資源池維護人員由云管理平臺操作人員在云管理平臺的部署策略模塊進行部署策略定制?!咀?】當(dāng)資源部署策略觸發(fā)時,由云管理平臺自動或由現(xiàn)場虛擬資源維護人員執(zhí)行遷移或優(yōu)化?!咀?】資源動態(tài)優(yōu)化導(dǎo)致的資源變更應(yīng)由虛擬資源池維護人員或管理工具進行記錄,并更新配置項信息。3資源(服務(wù))告警及故障處理物理資源池維護人員
60、虛擬資源池維護人員云平臺監(jiān)控組云管理平臺操作員云平臺監(jiān)控組應(yīng)可以通過云管理平臺及其他手段接收、識別、記錄、發(fā)布告警信息,告警信息可按嚴(yán)重程度、影響等進行分類和分級。【注4】4服務(wù)終止省信息中心;云平臺管理員前端業(yè)務(wù)部門業(yè)務(wù)運營支撐負責(zé)人由省信息中心基于各類服務(wù)實際提供和使用情況,提出特定服務(wù)的終止申請。由牽頭和支持單位、該服務(wù)現(xiàn)有使用方共同討論和批準(zhǔn)服務(wù)終止,下發(fā)服務(wù)終止通告,將該服務(wù)從服務(wù)目錄中刪除,同時確定原服務(wù)使用方的新服務(wù)方式,并由正在使用該服務(wù)的部門提交原服務(wù)的服務(wù)退訂申請和新服務(wù)的訂閱申請。5服務(wù)退訂前端業(yè)務(wù)部門云平臺管理員云管理平臺操作員需求單位提交服務(wù)退訂申請,經(jīng)云平臺管理員和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人工智能題庫含參考答案
- 2 我是什么(教學(xué)設(shè)計)-2024-2025學(xué)年統(tǒng)編版語文二年級上冊
- 2024四川雅安市雅茶集團茶業(yè)有限公司第一期招聘擬聘用人員筆試參考題庫附帶答案詳解
- 第1課 古代埃及-2024-2025學(xué)年九年級歷史上冊冊核心素養(yǎng)驅(qū)動教學(xué)設(shè)計
- 03 19 蘇州園林2024-2025學(xué)年八年級語文上冊同步教學(xué)設(shè)計(河北專版)
- 12 《富起來到強起來》教學(xué)設(shè)計-2023-2024學(xué)年道德與法治五年級下冊統(tǒng)編版
- 第三單元 第一節(jié) 運動的水分子 教學(xué)設(shè)計 -2024-2025學(xué)年九年級化學(xué)魯教版上冊
- 2025年針織棉項目合作計劃書
- 《六國論》教學(xué)設(shè)計 2023-2024學(xué)年統(tǒng)編版高中語文必修下冊
- 2025年貴陽康養(yǎng)職業(yè)大學(xué)單招職業(yè)技能測試題庫及參考答案
- 悟哪吒精神做英雄少年開學(xué)第一課主題班會課件-
- 2025年2級注冊計量師專業(yè)實務(wù)真題附答案
- 人教版小學(xué)六年級下冊音樂教案全冊
- 12J201平屋面建筑構(gòu)造圖集(完整版)
- 2024年個人信用報告(個人簡版)樣本(帶水印-可編輯)
- 16J914-1 公用建筑衛(wèi)生間
- 20CS03-1一體化預(yù)制泵站選用與安裝一
- (完整版)四年級上冊數(shù)學(xué)豎式計算題100題直接打印版
- 機器視覺論文(英文)
- 初中花城版八年級下冊音樂6.軍港之夜(15張)ppt課件
- 《供應(yīng)鏈管理》讀書筆記
評論
0/150
提交評論