服務器運維管理_第1頁
服務器運維管理_第2頁
服務器運維管理_第3頁
服務器運維管理_第4頁
服務器運維管理_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、服務器和存儲運維管理的介紹介紹互聯(lián)網(wǎng)最近幾十年發(fā)生了很大變化,從最初的modem撥號接入,經(jīng)歷了 ISDN接入、DSL 接入、cable modem接入、專線接入、光纖接入、無線接入,以及分組交換網(wǎng)、幀中繼網(wǎng)和ATM網(wǎng),每一 次技術變革都代表著更高要求。系統(tǒng)運行有兩種常見的模式,即B/S和C/S,服務器端起著關鍵性作用, 系統(tǒng)運維主要集中于服務器端,其中服務器的web引擎和數(shù)據(jù)庫引擎又是至關重要。隨著電信行業(yè)的飛速發(fā)展,固定電話、數(shù)據(jù)傳輸、互聯(lián)網(wǎng)、寬帶的業(yè)務量急劇增長,而由此帶來 的許多麻煩也在困擾著電信運營商。網(wǎng)絡維護的工作越來越繁重、故障情況無法跟蹤、歷史的故障頻繁發(fā) 生、處理情況、知識資

2、源不能有效的利用,同時對于故障的處理無法進行效率評估和績效考核,諸如此類 的問題使運營商頭疼不已。因此,如何確保電信運營企業(yè)內(nèi)部眾多軟、硬件設備的正常運維就顯得十分重 要。正是在這種情況之下,電信行業(yè)信息系統(tǒng)的運行維護管理引起了一批具有遠見的軟件企業(yè)的關 注。他們認為,目前的網(wǎng)絡運維支撐系統(tǒng)還存在著不少問題,如運維管理主要集中在性能管理與故障管理 的功能實現(xiàn)上,沒有實現(xiàn)完整的運維功能整合。而且,為了解決業(yè)務運營的急需,許多系統(tǒng)都必須在短時 間內(nèi)開發(fā)完成,對系統(tǒng)間的互連互通缺乏周密的考慮,形成各自獨立的系統(tǒng),產(chǎn)生了很多“信息孤島”,不 能充分發(fā)揮信息化系統(tǒng)的威力,沒有能夠為電信運營商帶來更大的效

3、益。例:“電信行業(yè)IT運維管理系統(tǒng)”是以IT部門在日常運行維護管理流程為核心,以事件跟蹤為主 線,以解決IT運維管理中的八大管理問題為目的(流程管理、事件管理、問題管理、變更管理、發(fā)布管 理、運行管理、知識管理、綜合分析管理),為電信行業(yè)IT部門提供了一個高效、規(guī)范的IT運維管理平臺。 該系統(tǒng)不僅實現(xiàn)與目前電信內(nèi)部使用的BOSS系統(tǒng)的接口,而且整合了客服、運維、業(yè)務管理等系統(tǒng)功能, 并可以通過郵件、手機短信等形式對責任人進行階段提示,提高系統(tǒng)維護的服務響應效率。通過信息整合, 實現(xiàn)對各種資源的綜合管理,包括各種靜態(tài)資源、基礎資料、備品備件資源的有效管理。從而全面提高IT 部門運行維護的快速響應

4、能力,同時也為IT部門的業(yè)務知識積累和業(yè)務考核建立了完善的數(shù)據(jù)模型。 此外,系統(tǒng)可以自動做出多種分析報表,不僅可以有效評價IT部門人員工作效率和強度,而且能夠實時、 動態(tài)、統(tǒng)一的了解所有軟、硬件系統(tǒng)的運行、維護情況。運維管理:概述伴隨著企事業(yè)網(wǎng)絡規(guī)模的不斷擴大,企事業(yè)服務器的增多,企事業(yè)管理的信息化,企事業(yè)網(wǎng)絡管理也 變的越來越重要。一旦網(wǎng)絡、服務器、數(shù)據(jù)庫、各種應用出現(xiàn)問題,常常會給企事業(yè)造成很大的損失。怎 樣能7x24小時檢測網(wǎng)絡系統(tǒng)的運行情況,避免各種故障的發(fā)生,改進傳統(tǒng)的網(wǎng)絡管理方式來適企事業(yè)信 息化發(fā)展的需要?因此,運維管理系統(tǒng)就有他的必要性。一個完備的運維管理系統(tǒng)能夠提供7x24小

5、時檢測網(wǎng)絡、服務 器、數(shù)據(jù)庫、各種應用系統(tǒng),及時發(fā)現(xiàn)將要出現(xiàn)的問題,并通過短信、Email、聲音報告給運維管理人員。 運維管理人員就可以及時排除故障,避免造成重大損失。運維管理系統(tǒng)的功能::故障發(fā)現(xiàn)與警報;:記錄日常運維日志信息;服務器故障統(tǒng)計;服務器軟硬件信息統(tǒng)計;服務進程管理; 將數(shù)據(jù)信息存儲到數(shù)據(jù)庫,并使用圖形方式直觀的展示出來;:權限、密碼管理;:將數(shù)據(jù)生成報表。運維管理系統(tǒng)的特點::郵件和短信實時故障報警;: B/S結構,能夠通過web對遠程服務器下達指令;:監(jiān)控服務器和被監(jiān)控服務器之間通過python socket來發(fā)送信息;統(tǒng)計日常故障處理,以便下次出現(xiàn)同樣故障時能夠更快的解決問

6、題;實現(xiàn)自動化管理和自動化監(jiān)控;安全管理服務器性能;操作流程統(tǒng)計與管理。系統(tǒng)結構運維管理系統(tǒng)采用B/S構架,運維管理人員隨時隨地可以對服務器進行管理、配置及故障處理。它是 將部署在同一個局域網(wǎng)內(nèi)的所有服務器統(tǒng)一管理,服務器之間的信息通訊、指令發(fā)送、運維管理都通過 python來實現(xiàn)。監(jiān)控服務器端負責采集、統(tǒng)計和分析數(shù)據(jù),在數(shù)據(jù)出現(xiàn)異常時發(fā)送報警信息到管理員的 email、手機中,并將錯誤日志存儲到數(shù)據(jù)庫中。運維管理系統(tǒng)主要通過LAMP服務器、python編程、snmp和shell編程來實現(xiàn)。在被監(jiān)控端安裝python 服務,并在被監(jiān)控服務器上部署python程序和shell腳本用于接受監(jiān)控服務

7、器端指令、信息采集并發(fā)送會 監(jiān)控服務器端。監(jiān)控服務器端部署python程序和LAMP服務器,用于發(fā)送指令、接受數(shù)據(jù)信息、存儲數(shù) 據(jù)、統(tǒng)計數(shù)據(jù)以及異常報警。運維管理系統(tǒng)架構圖時服務器進行監(jiān) 控、報警.數(shù)據(jù) .瑯果、數(shù)據(jù)統(tǒng) 止.服務敏桂備 管理iiiiM 1運維管理人員日常通過web瀏覽器遠程登錄監(jiān)控管理系統(tǒng),檢測各被監(jiān)控服務器的運行狀態(tài)、服務狀 態(tài)、防火墻配置、進程信息、操作日志等信息。在出現(xiàn)異常時,通過運維系統(tǒng)可以查看到具體的異常服務 器、進程等信息,并根據(jù)這些信息來處理異常。智能管理模塊智能管理通過程序遠程查看被監(jiān)控服務器實時信息,對服務器進行在線管理,對一些業(yè)務執(zhí)行在線操 作,并記錄下遠程

8、操作日志。減少遠程登錄服務器操作,減少故障風險。同時將服務信息儲存在數(shù)據(jù)庫中, 便于形成報表,為企業(yè)運維累計寶貴的運維經(jīng)驗。智能管理主要包括::用戶管理:指遠程服務器的用戶添加、刪除,監(jiān)控管理系統(tǒng)的用戶添加、刪除;:密碼管理:指遠程服務器的用戶密碼更新(或動態(tài)密碼),監(jiān)控管理系統(tǒng)的用戶密碼更新;:權限管理:指遠程服務器用戶權限分配,監(jiān)控管理系統(tǒng)權限分配; 服務器信息管理:記錄服務器的cpu、內(nèi)存、硬盤、網(wǎng)卡等硬件信息,業(yè)務信息,在線時間; 服務管理:對服務器中運行的進程、業(yè)務驚醒管理; 業(yè)務數(shù)據(jù)統(tǒng)計:在線業(yè)務數(shù)據(jù)統(tǒng)計,如:注冊、登錄、充值、消費等信息;系統(tǒng)操作管理:記錄用戶登錄系統(tǒng)操作的日志;

9、運維日志管理:將出現(xiàn)的故障原因和解決方法以運維日志的形式保存下來;: 服務器日志管理:通過遠程查看系統(tǒng)日志信息,并實現(xiàn)系統(tǒng)日志保存到監(jiān)控服務器端。智能監(jiān)控模塊智能監(jiān)控是在原cacti監(jiān)控的基礎上將nagois、cacti和運維管理系統(tǒng)整合,實現(xiàn)同一平臺下的監(jiān)控管 理。并對一些特定的需求進行定制,使監(jiān)控系統(tǒng)能夠更加高效、準確、及時的發(fā)現(xiàn)和報告故障信息,提升 故障處理質量。智能監(jiān)控主要包括:: 服務器網(wǎng)絡:對服務器的網(wǎng)絡狀態(tài)、網(wǎng)絡流量進行監(jiān)控;:服務器硬件:對服務器的硬盤、cpu、內(nèi)存進行檢測;: 服務進程:對服務器上的關鍵服務進行監(jiān)控,并對進程的的總數(shù)進行監(jiān)控;: 系統(tǒng)性能:對服務的負載進行監(jiān)控

10、;: 業(yè)務狀態(tài):對在線的業(yè)務進行檢測,如端口、web頁面檢測。安全管理模塊安全管理是通過運維管理系統(tǒng)執(zhí)行需要執(zhí)行的操作可以減少不必要的誤操作,如刪除不該刪除的文件 導致業(yè)務、系統(tǒng)不能正常工作。對服務器設置一些規(guī)則,當服務器出現(xiàn)異常時能夠預警。安全管理主要包 括三大塊::應用安全:指系統(tǒng)關鍵進程和業(yè)務服務;: 系統(tǒng)安全:指遠程登錄、帳號密碼管理、服務器的端口狀況;:網(wǎng)絡安全:指服務器連接數(shù)、流量信息等。流程管理模塊規(guī)范的流程可以提高工作效率,流程管理可以累積工作經(jīng)驗。許多故障并不是因為程序本身和被入侵 導致的,常常由于疏忽而導致遺漏了一些重要的信息,因此按照流程操作可以減少故障出現(xiàn)的頻率,并且

11、隨著時間的累計流程就成為一種良好的習慣。流程管理是一個企業(yè)規(guī)范的體現(xiàn),并且為運維累積經(jīng)驗。主 要功能包括::服務器部署:指新服務器上架和業(yè)務部署;:新業(yè)務部署:新增在線業(yè)務部署;:版本發(fā)布:指在線業(yè)務版本更新;:定時執(zhí)行:添加、刪除一些定時執(zhí)行的功能;:數(shù)據(jù)備份:手動執(zhí)行和定時執(zhí)行在線業(yè)務系統(tǒng)、數(shù)據(jù)庫的備份。技術簡介運維管理系統(tǒng)使用的開發(fā)語言為:php、python和linux shell。Php用于實現(xiàn)數(shù)據(jù)展示、數(shù)據(jù)存儲、 獲取指令;python soclet編程實現(xiàn)監(jiān)控主機與遠程服務器之間的數(shù)據(jù)通訊、數(shù)據(jù)加密、發(fā)送報警和web 頁面檢測;shell腳本負責執(zhí)行監(jiān)控端發(fā)送過來的指令,并將執(zhí)行

12、結果返還給python程序。以下流程展示 了從指令下達到獲取執(zhí)行結果,并將結果展示到web頁面的一個過程。數(shù)據(jù)采隼流料主機之間的通訊通過python socket編程來實現(xiàn),在下達指令時能夠實時獲取所需要的結果,對于一 些關鍵性服務報警也可以采取這種模式來實現(xiàn)。同時對服務器之間傳遞的信息進行自定義加密,提高安全 性。監(jiān)控服務服務方面將加入nagios,結合cacti和nagois的優(yōu)點,將監(jiān)控系統(tǒng)與運維系統(tǒng)整合到一個統(tǒng) 一的平臺。監(jiān)控系統(tǒng)的數(shù)據(jù)主要還是采用snmp來采集數(shù)據(jù),圖形展示方面需要根據(jù)實際情況進行調整。 支持遠程查看服務器日志功能,加入運維日志管理功能,類似于谷歌日歷,將每天的運維操作日志記錄到 日歷中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論