運維管理系統(tǒng)設計方案_第1頁
運維管理系統(tǒng)設計方案_第2頁
運維管理系統(tǒng)設計方案_第3頁
運維管理系統(tǒng)設計方案_第4頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、運維管理系統(tǒng)方案概述伴隨著企事業(yè)網絡規(guī)模的不斷擴大,企事業(yè)服務器的增多,企事業(yè)管理的信息化,企事業(yè)網絡管理也變的越來越重要。一旦網絡、服務器、數(shù)據(jù)庫、各種應用出現(xiàn)問題,常常會給企事業(yè)造成很大的損失。怎樣能 7x24 小時檢測網絡系統(tǒng)的運行情況,避免各種故障的發(fā)生,改進傳統(tǒng)的網絡管理方式來適企事業(yè)信息化發(fā)展的需要?因此,運維管理系統(tǒng)就有他的必要性。一個完備的運維管理系統(tǒng)能夠提供器、數(shù)據(jù)庫、各種應用系統(tǒng),及時發(fā)現(xiàn)將要出現(xiàn)的問題,并通過短信、員。運維管理人員就可以及時排除故障,避免造成重大損失。7x24 小時檢測網絡、服務 Email 、聲音報告給運維管理人運維管理系統(tǒng)的功能:? 故障發(fā)現(xiàn)與警報;?

2、 記錄日常運維日志信息;? 服務器故障統(tǒng)計;? 服務器軟硬件信息統(tǒng)計;? 服務進程管理;? 將數(shù)據(jù)信息存儲到數(shù)據(jù)庫,并使用圖形方式直觀的展示出來;? 權限、密碼管理;? 將數(shù)據(jù)生成報表。運維管理系統(tǒng)的特點:? 和短信實時故障報警;? B/S 結構,能夠通過 web對遠程服務器下達指令;?監(jiān)控服務器和被監(jiān)控服務器之間通過python socket來發(fā)送信息;? 統(tǒng)計日常故障處理,以便下次出現(xiàn)同樣故障時能夠更快的解決問題;? 實現(xiàn)自動化管理和自動化監(jiān)控;? 安全管理服務器性能;? 操作流程統(tǒng)計與管理。系統(tǒng)結構運維管理系統(tǒng)采用 B/S 構架,運維管理人員隨時隨地可以對服務器進行管理、配置及故障處理。

3、它是將部署在同一個局域網的所有服務器統(tǒng)一管理,服務器之間的信息通訊、指令發(fā)送、運維管理都通過 python 來實現(xiàn)。監(jiān)控服務器端負責采集、統(tǒng)計和分析數(shù)據(jù),在數(shù)據(jù)出現(xiàn)異常時發(fā)送報警信息到管理員的 email 、手機中,并將錯誤日志存儲到數(shù)據(jù)庫中。運維管理系統(tǒng)主要通過LAMP服務器、 python 編程、 snmp 和 shell編程來實現(xiàn)。在被監(jiān)控端安裝python 服務,并在被監(jiān)控服務器上部署python 程序和 shell腳本用于接受監(jiān)控服務器端指令、信息采集并發(fā)送會監(jiān)控服務器端。監(jiān)控服務器端部署 python 程序和 LAMP服務器,用于發(fā)送指令、接受數(shù)據(jù)信息、存儲數(shù)據(jù)、統(tǒng)計數(shù)據(jù)以及異常報

4、警。運維管理人員日常通過 web瀏覽器遠程登錄監(jiān)控管理系統(tǒng),檢測各被監(jiān)控服務器的運行狀態(tài)、服務狀態(tài)、防火墻配置、進程信息、操作日志等信息。在出現(xiàn)異常時,通過運維系統(tǒng)可以查看到具體的異常服務器、進程等信息,并根據(jù)這些信息來處理異常。服務器狀態(tài)信息界面運維管理系統(tǒng)具備后臺管理功能,針對不同的用戶設置不同的權限,通過后臺管理可以添加刪除被監(jiān)控主機、修改用戶權限。操作日志運維監(jiān)控系統(tǒng)具備遠程控制功能,通過遠程重啟業(yè)務、檢查業(yè)務狀態(tài)、查看關鍵服務的配置文件、獲取服務器狀態(tài)信息、查看服務日志、執(zhí)行備份、添加刪除定時計劃任務、添加刪除開機機啟動業(yè)務、在線業(yè)務數(shù)據(jù)統(tǒng)計。并且可以實現(xiàn)在線業(yè)務版本更新,批量業(yè)務處

5、理。服務管理運維監(jiān)控系統(tǒng)設備監(jiān)控主要還是采用snmp,結合 nagios 與運維管理平臺整合。功能模塊運維管理系統(tǒng)根據(jù)不同的需求和智能劃分為以下幾個模塊:智能管理模塊智能管理通過程序遠程查看被監(jiān)控服務器實時信息,對服務器進行在線管理,對一些業(yè)務執(zhí)行在線操作,并記錄下遠程操作日志。減少遠程登錄服務器操作,減少故障風險。同時將服務信息儲存在數(shù)據(jù)庫中,便于形成報表,為企業(yè)運維累計寶貴的運維經驗。智能管理主要包括:? 用戶管理:指遠程服務器的用戶添加、刪除,監(jiān)控管理系統(tǒng)的用戶添加、刪除;? 密碼管理:指遠程服務器的用戶密碼更新(或動態(tài)密碼),監(jiān)控管理系統(tǒng)的用戶密碼更新;? 權限管理:指遠程服務器用戶權

6、限分配,監(jiān)控管理系統(tǒng)權限分配;? 服務器信息管理:記錄服務器的cpu、存、硬盤、網卡等硬件信息,業(yè)務信息,在線時間;? 服務管理:對服務器中運行的進程、業(yè)務驚醒管理;? 業(yè)務數(shù)據(jù)統(tǒng)計:在線業(yè)務數(shù)據(jù)統(tǒng)計,如:注冊、登錄、充值、消費等信息;? 系統(tǒng)操作管理:記錄用戶登錄系統(tǒng)操作的日志;? 運維日志管理:將出現(xiàn)的故障原因和解決方法以運維日志的形式保存下來;? 服務器日志管理:通過遠程查看系統(tǒng)日志信息,并實現(xiàn)系統(tǒng)日志保存到監(jiān)控服務器端。智能監(jiān)控模塊智能監(jiān)控是在原cacti監(jiān)控的基礎上將nagois 、 cacti和運維管理系統(tǒng)整合,實現(xiàn)同一平臺下的監(jiān)控管理。并對一些特定的需求進行定制,使監(jiān)控系統(tǒng)能夠更

7、加高效、準確、及時的發(fā)現(xiàn)和報告故障信息,提升故障處理質量。智能監(jiān)控主要包括:? 服務器網絡:對服務器的網絡狀態(tài)、網絡流量進行監(jiān)控;? 服務器硬件:對服務器的硬盤、cpu、存進行檢測;? 服務進程:對服務器上的關鍵服務進行監(jiān)控,并對進程的的總數(shù)進行監(jiān)控;? 系統(tǒng)性能:對服務的負載進行監(jiān)控;? 業(yè)務狀態(tài):對在線的業(yè)務進行檢測,如端口、 web 頁面檢測。安全管理模塊安全管理是通過運維管理系統(tǒng)執(zhí)行需要執(zhí)行的操作可以減少不必要的誤操作,如刪除不該刪除的文件導致業(yè)務、系統(tǒng)不能正常工作。對服務器設置一些規(guī)則,當服務器出現(xiàn)異常時能夠預警。安全管理主要包括三大塊:? 應用安全:指系統(tǒng)關鍵進程和業(yè)務服務;? 系

8、統(tǒng)安全:指遠程登錄、帳號密碼管理、服務器的端口狀況;? 網絡安全:指服務器連接數(shù)、流量信息等。流程管理模塊規(guī)的流程可以提高工作效率,流程管理可以累積工作經驗。許多故障并不是因為程序本身和被入侵導致的,常常由于疏忽而導致遺漏了一些重要的信息,因此按照流程操作可以減少故障出現(xiàn)的頻率,并且隨著時間的累計流程就成為一種良好的習慣。流程管理是一個企業(yè)規(guī)的體現(xiàn),并且為運維累積經驗。主要功能包括:? 服務器部署:指新服務器上架和業(yè)務部署;? 新業(yè)務部署:新增在線業(yè)務部署;? 版本發(fā)布:指在線業(yè)務版本更新;? 定時執(zhí)行:添加、刪除一些定時執(zhí)行的功能;? 數(shù)據(jù)備份:手動執(zhí)行和定時執(zhí)行在線業(yè)務系統(tǒng)、數(shù)據(jù)庫的備份。

9、技術簡介運維管理系統(tǒng)使用的開發(fā)語言為: php、 python 和 linux shell 。 Php 用于實現(xiàn)數(shù)據(jù)展示、數(shù)據(jù)存儲、獲取指令; python soclet 編程實現(xiàn)監(jiān)控主機與遠程服務器之間的數(shù)據(jù)通訊、數(shù)據(jù)加密、發(fā)送報警和web 頁面檢測; shell腳本負責執(zhí)行監(jiān)控端發(fā)送過來的指令,并將執(zhí)行結果返還給python 程序。以下流程展示了從指令下達到獲取執(zhí)行結果,并將結果展示到web頁面的一個過程。主機之間的通訊通過 python socket 編程來實現(xiàn),在下達指令時能夠實時獲取所需要的結果,對于一些關鍵性服務報警也可以采取這種模式來實現(xiàn)。同時對服務器之間傳遞的信息進行自定義加密

10、,提高安全性。監(jiān)控服務服務方面將加入nagios ,結合 cacti和 nagois 的優(yōu)點,將監(jiān)控系統(tǒng)與運維系統(tǒng)整合到一個統(tǒng)一的平臺。監(jiān)控系統(tǒng)的數(shù)據(jù)主要還是采用 snmp來采集數(shù)據(jù),圖形展示方面需要根據(jù)實際情況進行調整。支持遠程查看服務器日志功能,加入運維日志管理功能,類似于谷歌日歷,將每天的運維操作日志記錄到日歷中,并具有備忘提醒功能。安全管理主要是減少外網遠程登錄服務器帶來的風險,所有的外網服務器的遠程登錄將通過運維管理服務器來做跳轉,業(yè)務服務器只接受網服務器的遠程接入。服務器密碼方面實現(xiàn)動態(tài)密碼管理,根據(jù)各個服務器的實際狀況和一些參數(shù)生成動態(tài)密碼。修改防火墻配置,對于外網非必需端口一律關閉。將日常運維日志、服務器部署、業(yè)務部署、故障發(fā)現(xiàn)及處理通過web 記錄數(shù)據(jù)庫中。SSH遠程登錄流程管理類似于 BBS發(fā)帖功能,將經常涉及到的版本更新、服務器部署、業(yè)務部署以文檔的形式存儲到運維平臺中。新版本發(fā)布采用流程圖的形式,詳細標注發(fā)布的具體步驟和發(fā)布的進程,發(fā)布完畢可以保存本次發(fā)布的具體流程信息。新版本發(fā)布流程

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論