《平安公司活動設(shè)計》_第1頁
《平安公司活動設(shè)計》_第2頁
《平安公司活動設(shè)計》_第3頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

“平安920活動”活動運維方案第一章 項目概述 31. 活動背景 32. 具體情況 32.1 項目的任務(wù)和目標(biāo) 32.2 項目的來源 42.3 實施及地點 4第二章 項目展示 41. 方案分析 42. 設(shè)計依據(jù)與執(zhí)行標(biāo)準(zhǔn) 53. 設(shè)計方法 7(1)“平安920活動”應(yīng)用運維流程管理 7(2)“平安920活動”相關(guān)應(yīng)用監(jiān)控及預(yù)警報告 94. 對設(shè)計方案的評價與分析 9第三章 實施過程 91. 活動之前工作 92. 活動當(dāng)天工作 123. 活動之后工作 12第四章 項目成果及結(jié)論 12

第一章項目概述1.活動背景2019年9月9日由中國平安推出了平安920的活動,這是一種一站式綜合金融服務(wù)的金融生活消費節(jié),大促是類似淘寶雙十一的活動,每年都會舉行,活動內(nèi)容涵蓋醫(yī)療、保險、日用百貨等,在920大促之時利用各類營銷手段,吸引消費者的注意,提高網(wǎng)店的流量,增加店內(nèi)的銷售額,最終使得本店的銷售業(yè)績與在消費者心中的印象在920期間得到良好的提升。在網(wǎng)站簡單的買賣交易背后,需要我們運維人員進(jìn)行保障。隨著信息技術(shù)的發(fā)展以及平安集團(tuán)業(yè)務(wù)的不斷擴(kuò)展,產(chǎn)線鏈路越來越復(fù)雜,參加大促活動的業(yè)務(wù)越來越多,壹錢包有自己的商城平臺,它除了要確保買賣交易可以完成的同時,還要在大訪問量的情況下,保證用戶的購物體驗,不僅如此,還要保證用戶購物的安全。除此之外,“平安920活動”的主題是“以AI之名,為你放價”,對應(yīng)著4個AI主題的場景為大家的不同金融需求提供不同的服務(wù),分別是“AI健康”、“AI出游”、“AI理財”、“AI國潮”。因此這項活動就需要更多的運維去保證用戶的體驗感以及用戶安全。因此提出此次關(guān)于“平安920活動”的應(yīng)用運維方案,為用戶體驗及安全提出保障。2.具體情況基于“平安920大促”應(yīng)用運維的方案設(shè)計與實現(xiàn),在該項目中學(xué)生的角色是應(yīng)用運維助理工程師,承擔(dān)保證活動進(jìn)行的同時,為各個系統(tǒng)和服務(wù)的穩(wěn)定運行提供保障。2.1項目的任務(wù)和目標(biāo)基于“平安920大促”的應(yīng)用運維方案這一項目提出的背景就是在“平安920大促”活動中由于“以AI之名,為你放價”的主題借用了具有自學(xué)習(xí)、自組織、自識別、自協(xié)調(diào)、自適應(yīng)等等智能特性的擁有更高的智能水平的智能控制[1]。對網(wǎng)絡(luò)環(huán)境本身就具有較高的要求,除此之外還因為大促活動參與人數(shù)眾多,運營方需要給大家提供良好的網(wǎng)絡(luò)環(huán)境以保證客戶的良好購物體驗感。項目的任務(wù):進(jìn)行基于“平安920大促”的應(yīng)用運維方案這一項目的主要任務(wù)就是做好活動當(dāng)天的網(wǎng)絡(luò)環(huán)境的維護(hù),運用應(yīng)用運維的網(wǎng)絡(luò)維護(hù)專業(yè)知識為用戶提供良好的購物體驗以及安全保護(hù)工作。項目的目標(biāo):進(jìn)行應(yīng)用系統(tǒng)容量擴(kuò)容、hippo評估擴(kuò)容、redis評估擴(kuò)容,增加備件,做好配置,確?;顒赢?dāng)天能夠靈活的分散訪客流量,保證數(shù)據(jù)中心運行負(fù)荷良好,網(wǎng)絡(luò)崩潰情況減少出現(xiàn)或者盡量不出現(xiàn)此類情況。2.2項目的來源因客戶的不同金融消費需求,“平安920活動”主要聚焦客戶在“醫(yī)食住行玩”等等生活中的金融知識以及客戶在以上這些方面的生活需求,集中推出了中國平安旗下15個專業(yè)子公司精選的不同類型的上百款金融以及生活產(chǎn)品,這15家子公司主要包括平安證券、平安健康險、平安壽險、平安產(chǎn)險、平安銀行、平安好醫(yī)生、陸金所、壹錢包等等。在這項活動的進(jìn)行過程中我們看到有非常多的用戶在920期間選擇自己心儀并且需要方向的金融產(chǎn)品,所以整個后臺會看到有非常多的客流量,即使只是瀏覽的客戶也會很多,因此需要提供更加穩(wěn)定而良好的網(wǎng)絡(luò)環(huán)境。能夠提升企業(yè)的核心競爭力的重要一點就是優(yōu)秀的流程,優(yōu)秀的流程在規(guī)范業(yè)務(wù)運作的同時,也在不斷的總結(jié)和固化優(yōu)秀的經(jīng)驗[2],所以在“平安920大促”活動中就需要這樣的一個項目對平安這個一體式的金融消費大促進(jìn)行一個流程的規(guī)范以及網(wǎng)絡(luò)運營環(huán)境有一個保障,因此“平安920活動”的應(yīng)用運維方案就此產(chǎn)生。2.3實施及地點項目的具體實施分為活動前的準(zhǔn)備、活動當(dāng)天的工作以及活動后的善后工作,每一個階段都需要做不同的準(zhǔn)備工作以及應(yīng)對預(yù)案。因此針對活動不同階段的網(wǎng)絡(luò)環(huán)境需求我們要做出不同的預(yù)案,以應(yīng)對每一個階段有可能發(fā)生的緊急情況,為“平安920活動”提供安全以及良好體驗感的保障。活動開始前兩個月進(jìn)行準(zhǔn)備工作,在壹錢包運維管理系統(tǒng)進(jìn)行準(zhǔn)備工作,包括擴(kuò)容,應(yīng)急預(yù)案,壓測,上線等準(zhǔn)備內(nèi)容;活動當(dāng)天,時刻保持高度的警惕,隨時監(jiān)控有無故障出現(xiàn),故障出現(xiàn)運維人員及時聯(lián)系各個相應(yīng)部門進(jìn)行故障處理;活動之后,對數(shù)據(jù)中心出現(xiàn)的問題進(jìn)行總結(jié)和分析,查找原因,提出解決方案,以確保在以后的類似活動中能夠為用戶提供更優(yōu)質(zhì)的服務(wù)。在項目的實施過程中會運用到一些網(wǎng)絡(luò)運維相關(guān)的專業(yè)知識以及技術(shù),主要技術(shù)為Linux,還會使用到簡單的網(wǎng)絡(luò)知識、Python語言、flask框架、HTML標(biāo)記語言、jQuery+Ajax異步更新網(wǎng)頁、MySQL數(shù)據(jù)庫。第二章項目展示1.方案分析首先,整個方案是基于為“平安920活動”提供更好的體驗感,確保網(wǎng)絡(luò)流暢,即使客流量大也不會出現(xiàn)網(wǎng)絡(luò)擁堵甚至崩潰的情況而出現(xiàn)的運維方案相關(guān)的項目。在這個方案中,會首先根據(jù)活動的時間性質(zhì)進(jìn)行分步的準(zhǔn)備,在活動開始前、活動當(dāng)天以及活動結(jié)束后都有針對性的進(jìn)行活動準(zhǔn)備?;顒娱_始前方案中提及到的主要是對數(shù)據(jù)中心運營以及負(fù)荷情況做一個簡單的評估以根據(jù)所評估的情況進(jìn)行具體操作,達(dá)到在高峰時期靈活分散客流量的效果,做好流量控制與負(fù)載均衡,為大規(guī)模的用戶認(rèn)證提供保障和技術(shù)基礎(chǔ)[3];其次就是進(jìn)行擴(kuò)容,增加備件,在出現(xiàn)不可避免的設(shè)備硬件故障時,就可進(jìn)行及時的更換,保證整個故障的出現(xiàn)在短短幾分鐘內(nèi),減少客流量的損失;在正式活動開始前還應(yīng)做好壓力測試的環(huán)節(jié),因為在如今越來越受到大家認(rèn)可的方式就是數(shù)據(jù)大集中的這種系統(tǒng)方式,但是這種系統(tǒng)性的模式中性能則是系統(tǒng)成功的關(guān)鍵因素,如果系統(tǒng)達(dá)不到應(yīng)有繁榮性能指標(biāo)就投入使用可能會造成非常大的損失。所以在系統(tǒng)正式上線之前我們應(yīng)先進(jìn)行壓力測試,確定系統(tǒng)的承受能力,以確保系統(tǒng)在上線之后能夠穩(wěn)定地運行[4];最后還應(yīng)該做好各種應(yīng)急預(yù)案;活動前的準(zhǔn)備都是從可能發(fā)生的緊急事件的角度出發(fā),以最大可能性的去減少損失為目標(biāo)進(jìn)行整個準(zhǔn)備環(huán)節(jié)的方案設(shè)計?;顒赢?dāng)天,在920活動的24小時里,正所謂與其后悔于已然,不如防患于未然,防患于未然一點就是主要通過監(jiān)控來實現(xiàn)的。通過監(jiān)控,運維人員能夠了解到企業(yè)網(wǎng)絡(luò)的實時運行狀態(tài),一旦出現(xiàn)安全隱患,可以及時預(yù)警或者是以其他方式通知運維人員,讓運維監(jiān)控人員有時間處理和解決,避免影響業(yè)務(wù)系統(tǒng)的正常使用,將一切問題的根源扼殺在搖籃當(dāng)中。主要監(jiān)控業(yè)務(wù)層面、應(yīng)用系統(tǒng)、基礎(chǔ)設(shè)施保障這三個方面?;顒咏Y(jié)束之后并不能掉以輕心,因為這個活動每年都會舉行的這一特殊性,所以在活動結(jié)束后還應(yīng)該做好總結(jié)以及分析的工作,比如說我們所設(shè)計的應(yīng)急預(yù)案是否均有出現(xiàn)、整個數(shù)據(jù)中心還出現(xiàn)了哪些運維人員在之前沒有想到的問題等等,對問題進(jìn)行總結(jié)、類比、分析,查找具體原因并根據(jù)這些問題再次提出解決方案。這就是整個方案的一個基本內(nèi)容,從三個不同時間段的工作入手,以為客戶提供一個更加流暢的良好體驗感、為客戶提供一個更加安全的網(wǎng)絡(luò)環(huán)境等作為此次方案的主要目標(biāo),進(jìn)行方案的設(shè)計、準(zhǔn)備以及實施。2.設(shè)計依據(jù)與執(zhí)行標(biāo)準(zhǔn)設(shè)計依據(jù):進(jìn)行基于“平安920大促”的應(yīng)用運維方案這一項目的主要任務(wù)就是做好活動當(dāng)天的網(wǎng)絡(luò)環(huán)境的維護(hù),運用應(yīng)用運維的網(wǎng)絡(luò)維護(hù)專業(yè)知識為用戶提供良好的購物體驗以及安全保護(hù)工作是“平安920活動”的主要項目任務(wù)以及目標(biāo),因此針對這一目標(biāo)進(jìn)行項目整個框架的構(gòu)建以及設(shè)計。在項目的實施過程中會運用到一些網(wǎng)絡(luò)運維相關(guān)的專業(yè)知識以及技術(shù),主要技術(shù)為Linux,還會使用到簡單的網(wǎng)絡(luò)知識、Python語言、flask框架、HTML標(biāo)記語言、jQuery+Ajax異步更新網(wǎng)頁、MySQL數(shù)據(jù)庫。這些網(wǎng)絡(luò)運維的相關(guān)專業(yè)知識就是我們的設(shè)計依據(jù)。Linux的全稱是GNU/Linux,這是一個網(wǎng)絡(luò)技術(shù)的操作系統(tǒng),基于POSIX和Unix,可以支持多任務(wù)、多用戶、多線程甚至多CPU的一種操作系統(tǒng)。隨著互聯(lián)網(wǎng)漸漸的發(fā)展到更多的領(lǐng)域、范圍,Linux技術(shù)受到了非常廣泛的支持,其中包括來自世界各地的軟件愛好者、軟件相關(guān)組織甚至各大軟件公司的支持。一方面,Linux在服務(wù)器維護(hù)等服務(wù)器相關(guān)方面保持著良好的發(fā)展趨勢,另一方面,在個人電腦以及嵌入式系統(tǒng)上都有著非常明顯進(jìn)步,也給使用者帶來了極大的便利。使用者在可以直截了當(dāng)?shù)墨@取Linux這項技術(shù)操作系統(tǒng)的實現(xiàn)機(jī)制的同時,甚至還可以根據(jù)使用者自身的使用需要來修改并對Linux進(jìn)行完善,在這個過程中是Linux技術(shù)最大程度上去適應(yīng)使用者以及軟件針對用戶的需求。Linux技術(shù)保持著良好且穩(wěn)定的系統(tǒng)性能,作為一項開源軟件。性能高效、配置簡單是Linux核心防火墻組件具有的兩大性能,極大程度的保證了系統(tǒng)的運行安全。該項技術(shù)的應(yīng)用也非常的廣泛,在被使用的過程中,很多的企業(yè)網(wǎng)絡(luò)為了同時追求網(wǎng)絡(luò)速度和網(wǎng)絡(luò)安全兩個要素,Linux技術(shù)不僅僅就是被網(wǎng)絡(luò)運維人員當(dāng)作一款簡單的服務(wù)器使用了,Linux的一大亮點就在于它在被當(dāng)作服務(wù)器的同時又可以被當(dāng)作網(wǎng)絡(luò)防火墻。具有開放源碼是Linux成為開發(fā)路由交換設(shè)備的理想開發(fā)平臺的主要原因,能夠是用戶進(jìn)行自由裁剪、成本低的特點,經(jīng)過適當(dāng)?shù)呐渲眠m配就可以實現(xiàn)這一技術(shù)作為路由器的功能,簡單易上手的特點是其成為理想開發(fā)平臺的主要原因。除了這項作為主要依據(jù)的網(wǎng)絡(luò)運維技術(shù)之外,Python語言、flask框架、HTML標(biāo)記語言、MySQL數(shù)據(jù)庫、jQuery+Ajax異步更新網(wǎng)頁以及簡單的網(wǎng)絡(luò)知識更是項目中不可或缺的設(shè)計依據(jù)。起初的時候Python語言是設(shè)計出來用于編寫自動化腳本的一種計算機(jī)程序語言,Python作為一種計算機(jī)程序的設(shè)計語言,它最大化的結(jié)合了互動性、解釋性、編譯性以及面向?qū)ο蟮哪_本語言;Python語言版本經(jīng)歷了不斷的發(fā)展與更新,故而這項計算機(jī)程序語言被越來越廣泛的運用于獨立大型的項目的開發(fā)設(shè)計,這種解釋性腳本語言被大量的運用于Web和Internet的開發(fā);科學(xué)計算和統(tǒng)計;網(wǎng)絡(luò)爬蟲;軟件開發(fā);后端開發(fā);桌面界面開發(fā)以及人工智能等等的廣泛領(lǐng)域。Flask框架就是一個可定制的框架,它是使用Python語言進(jìn)行編寫的,因為Flask框架是使用Python語言編寫的,所以相較于其他相同類型的框架它具有更靈活、輕便、容易上手且安全的特點;Flask框架還可以結(jié)合MVC模式進(jìn)行開發(fā),經(jīng)過開發(fā)人員的分工合作,小型團(tuán)隊就能夠在非常短的時間里完成實現(xiàn)功能豐富的中小型網(wǎng)站或Web服務(wù);除此之外,F(xiàn)lask框架的制定性非常強(qiáng),用戶可以根據(jù)自己的使用需求進(jìn)行相應(yīng)功能的添加和刪減,實現(xiàn)了保持了最初的核心功能的同時還能夠進(jìn)行豐富的功能擴(kuò)展的效果,實現(xiàn)了用戶根據(jù)自己需求定制的個性化網(wǎng)站的目的。HTML標(biāo)記語言的主要功能就是通過一系列的標(biāo)簽將網(wǎng)絡(luò)上分散的資源連接為一個邏輯性的整體,HTML被稱為是超文本的標(biāo)記語言,它的文本是由可以說明文字、聲音、表格、圖形、動畫、聲音、鏈接等的HTML命令組成的描述性的文本;超文本是通過超鏈接的方式將文本、圖表等和其他信息媒體進(jìn)行關(guān)聯(lián)的組織信息的方式,這種方式可以將信息資源進(jìn)行整合,這些信息資源可以是不同位置的,為人們查找信息提供了方便。MySQL數(shù)據(jù)庫作為一種開放源代碼的關(guān)系型數(shù)據(jù)庫進(jìn)行數(shù)據(jù)庫管理時使用的最常用的數(shù)據(jù)庫管理語言就是結(jié)構(gòu)化查詢語言(SQL),由于MySQL是開放的源代碼,所以所有人都可以在GeneralPublicLicense的許可之下進(jìn)行下載以及個性化的修改,這個數(shù)據(jù)庫是大家認(rèn)為不需要進(jìn)行事務(wù)化處理的情況下管理內(nèi)容的最優(yōu)選擇。執(zhí)行標(biāo)準(zhǔn):網(wǎng)絡(luò)運維服務(wù)中的核心部分運維其實就是對數(shù)據(jù)中心的運維服務(wù)[5]。首先第一點就是要做到項目設(shè)計完成后做好日常的巡檢工作,定時完成云服務(wù)器、儲存設(shè)備等物理和運行狀態(tài)的監(jiān)測,同時也做好定時的數(shù)據(jù)總結(jié)以及分析,進(jìn)行實時監(jiān)控,查看項目進(jìn)行之后的日常運行狀態(tài),做好數(shù)據(jù)庫以及運行狀態(tài)的記錄,及時維護(hù);其次還要做好“平安920活動”承辦軟件比如“壹錢包”等平臺軟件的升級,做好服務(wù)器的及時更新以及防毒軟件的部署、升級以及優(yōu)化等工作;最后一點執(zhí)行標(biāo)準(zhǔn)就是自動化選擇方案進(jìn)行自動化調(diào)控,這一點的主要目的是在于保證系統(tǒng)的穩(wěn)定性和安全性,同時進(jìn)行擴(kuò)容,保證系統(tǒng)正常可用,以確保在“平安920活動”當(dāng)天為廣大用戶提供良好的體驗感以及保證用戶安全。3.設(shè)計方法對于“平安920活動”方案的設(shè)計主要就是基于除了要確保買賣交易可以完成的同時,還要在大訪問量的情況下,保證用戶的購物體驗,不僅如此,還要保證用戶購物的安全的目的。(1)“平安920活動”應(yīng)用運維流程管理整個運維流程管理可以是對整個組織架構(gòu)、工作流程以及服務(wù)水平等的管理,在構(gòu)建“平安920活動”的應(yīng)用運維流程中,以中國平安為服務(wù)的構(gòu)建中心,其次對于為此次活動提供各類金融產(chǎn)品的15家子公司的運維服務(wù)作為協(xié)同運行的一個完整的運維服務(wù)體系。這其中主要包括事件、問題、變更、配置、發(fā)布等環(huán)節(jié)的管理[6]。①服務(wù)臺服務(wù)臺是用戶和“平安920活動”運營方,也就是整個大促活動的服務(wù)部門的一個交流界面,通過對用戶和運營方的協(xié)調(diào)整合,讓兩方產(chǎn)生聯(lián)系,進(jìn)行一個服務(wù)行為的集中,作為用戶體驗以及運營方的一個服務(wù)交流中心,以服務(wù)為基礎(chǔ)架構(gòu)建成,確保在整個活動中用戶可以有更加良好的體驗感。②事件管理事件管理是信息系統(tǒng)運維的一項非常重要的內(nèi)容,它的主要職能就是迅速恢復(fù)系統(tǒng)的正常功能,為整個“平安920活動”提供一種首先監(jiān)測到事件并且準(zhǔn)確確定支持資源,能夠以最快的速度解決問題的能力,主要目的就是在于能夠及時發(fā)現(xiàn)活動中出現(xiàn)的問題,在盡量減小對用戶的影響之前提下是系統(tǒng)問題得到及時的恢復(fù)。③問題管理問題管理簡單來說就是借助所產(chǎn)生的的問題進(jìn)行管理,以解決問題為主要導(dǎo)向,對所發(fā)生的問題進(jìn)行挖掘、表達(dá)、歸納、處理的一套完整的管理方法。在“平安920活動”應(yīng)用運維方案的前期準(zhǔn)備中就通過多次的嘗試與調(diào)整進(jìn)行問題管理,調(diào)查分析出現(xiàn)問題的可能原因,根據(jù)所發(fā)現(xiàn)的問題制定解決方案,以給用戶提供良好的保障。④變更管理變更管理在“平安920活動”的應(yīng)用運維方案中起到確保項目在變更實施的過程中能夠?qū)L(fēng)險和成本處于可控的范圍內(nèi),作為項目管理的最重要的過程之一,變更管理的主要任務(wù)目標(biāo)就是分析變更的必要性并確保項目目標(biāo)實現(xiàn),按照變更后的要求進(jìn)行項目的實施。⑤配置管理配置管理通過識別系統(tǒng)的配置、記錄等等信息,為“平安920活動”提供配置的基礎(chǔ)架構(gòu),用來支撐其他相關(guān)流程的順利運行。⑥發(fā)布管理發(fā)布管理由變更管理控制,這一環(huán)節(jié)需要對變更后的配置進(jìn)行發(fā)布、運維等流程的管理。(2)“平安920活動”相關(guān)應(yīng)用監(jiān)控及預(yù)警報告在做好一些準(zhǔn)備活動之后,對整個活動中提到的“平安920活動”相關(guān)的軟件等要做好實時的監(jiān)控以及預(yù)警報告。①性能管理性能管理的主要作用在于評估整個運營系統(tǒng)的性能,主要包括對運行狀況、通信效率等等方面性能的評估,是為了對網(wǎng)絡(luò)的性能進(jìn)行維護(hù),進(jìn)行數(shù)據(jù)收集,分析當(dāng)前網(wǎng)絡(luò)的性能以及狀況。。②告警管理告警管理是運維服務(wù)中了解網(wǎng)絡(luò)運行情況以及具體故障定位的一個主要的信息來源方式,對告警進(jìn)行有效的監(jiān)控和處理在運維服務(wù)中就非常重要,因此為了保證“平安920活動”網(wǎng)絡(luò)以及服務(wù)器的正常運行,運維人員在活動整個過程中都應(yīng)定期對告警進(jìn)行監(jiān)控和處理。③資源管理建立較為完善的資源管理配置庫,提供并且做一個資源配置信息統(tǒng)計的整體資源管理表,為整個“平安920活動”提供一個資源配置上的運維支持。4.設(shè)計方案的評價與分析整個設(shè)計方案從活動開始之前、活動開始之后、活動結(jié)束后三個不同的時段對網(wǎng)絡(luò)以及服務(wù)器的要求出發(fā)進(jìn)行設(shè)計,基于為“平安920活動”提供更好的體驗感,確保網(wǎng)絡(luò)流暢,即使客流量大也不會出現(xiàn)網(wǎng)絡(luò)擁堵甚至崩潰的情況而出現(xiàn)的運維方案相關(guān)的項目。第三章實施過程1.活動之前工作在活動開始前兩個月,做準(zhǔn)備工作,主要包括:(1)檢查數(shù)據(jù)中心運行負(fù)荷情況,達(dá)到在客流量高峰時期到來時靈活分散訪問流量的目的。運行負(fù)荷分為最大運行負(fù)荷、平均運行負(fù)荷以及最小運行負(fù)荷三類,平均運行負(fù)荷就是指長期供給的運行容量,最大運行和最小運行負(fù)荷分別是指在系統(tǒng)最大功率和最小功率情況下的容量,因此在方案實行過程中首要任務(wù)就是做好對數(shù)據(jù)中心運行負(fù)荷的檢查以及評估,做好應(yīng)對措施,以便在高峰期能夠做好分流工作。(2)進(jìn)行擴(kuò)容工作進(jìn)行應(yīng)用系統(tǒng)容量擴(kuò)容、hippo評估擴(kuò)容、redis評估擴(kuò)容,增加備件,做好配置,面的不可避免出現(xiàn)的大量設(shè)備硬件相關(guān)故障以及問題,應(yīng)在關(guān)鍵的業(yè)務(wù)環(huán)節(jié)準(zhǔn)備好備件,只要發(fā)生故障就立即進(jìn)行更換。①應(yīng)用系統(tǒng)容量擴(kuò)容根據(jù)不同的應(yīng)用系統(tǒng),它的系統(tǒng)容量也會不同,因此針對不同的應(yīng)用系統(tǒng)容量會有不同的管理內(nèi)容。隨著應(yīng)用系統(tǒng)復(fù)雜程度的增加,容量管理的復(fù)雜程度也隨之呈幾何模式的增加,加居容量管理的難度的主要在于龐大的系統(tǒng)間會存在各種各樣的聯(lián)系,因此,為了實現(xiàn)整個應(yīng)用系統(tǒng)容量的更好地分類、分層次以及有目標(biāo)的實施的目的,運維服務(wù)人員對應(yīng)用系統(tǒng)容量進(jìn)行了層次劃分。系統(tǒng)容量管理是系統(tǒng)處理事情能力的象征,簡單來說就是在一定的時間段內(nèi)系統(tǒng)所能夠承受或處理的最大負(fù)載,什么是負(fù)載,就是指系統(tǒng)對于事務(wù)的處理能力或者服務(wù)能力,應(yīng)用系統(tǒng)不同,所表現(xiàn)出的性質(zhì)也會因為其功能的不同而不同。容量管理有包括兩種完全不同的類型,分辨是靜態(tài)類型以及動態(tài)類型,靜態(tài)類型的容量管理一般就是指相對固定的容器可裝載量,簡單舉例來說就是存儲空間等,這部分空間一般都做好了事先的分配工作,滿了就會溢出,一般處理中都會進(jìn)行閥值的預(yù)先設(shè)定,只要一達(dá)到閥值就會立即報警并且進(jìn)行處理,例如進(jìn)行清理空間或擴(kuò)大空間等工作作為處理方式等;動態(tài)類型的容量管理則比較困難,一般就是指負(fù)載能力,有很多原因會造成負(fù)載能力變化,影響的容量指標(biāo)也較多,同樣舉例來說是交易并發(fā)處理到達(dá)一定的并發(fā)量后,就會產(chǎn)生占用大量IO資源、CPU資源甚至內(nèi)存資源等情況的發(fā)生,從而導(dǎo)致服務(wù)器資源調(diào)節(jié)困難、互相等待、服務(wù)響應(yīng)緩慢等結(jié)果,造成服務(wù)能力下降,如果系統(tǒng)沒有負(fù)載控制調(diào)整的機(jī)制,就很容易形成容量和性能問題。因此在擴(kuò)容方面首先進(jìn)行的就是應(yīng)用系統(tǒng)容量的擴(kuò)容,在存儲芯片F(xiàn)LASH的基礎(chǔ)上,采用冗余技術(shù),增加存儲卡作為存儲介質(zhì),從而增加系統(tǒng)的存儲容量[7],根據(jù)這項技術(shù)用戶可以根據(jù)自己的具體需要選擇適合的存儲卡的容量,以此達(dá)到應(yīng)用系統(tǒng)擴(kuò)容的目的。②redis評估擴(kuò)容Redis作為一個高性能的數(shù)據(jù)庫暨存儲系統(tǒng),因其支持?jǐn)?shù)據(jù)從主服務(wù)器向任意數(shù)量的從服務(wù)器上同步的“主從同步”,除此之外從服務(wù)器也可以作為關(guān)聯(lián)其他更多服務(wù)器的主服務(wù)器,由于這一特點redis就可以執(zhí)行“單層樹”復(fù)制的操作。針對redis在存儲方面擁有全量數(shù)據(jù)和增量請求兩種文件格式的特點運維小組人員可以對此進(jìn)行擴(kuò)容。其中的全量數(shù)據(jù)格式就是指一種把內(nèi)存中的數(shù)據(jù)寫入磁盤的方式,這樣一來就可以在下次讀取文件時直接進(jìn)行加載,獲取數(shù)據(jù)等信息非常方便;而增量請求就是把內(nèi)存中的數(shù)據(jù)序列化為操作請求的一種方式,主要通過讀取文件從而得到數(shù)據(jù),舉例來說就是對SADD、ZADD、SET、RPUSH實現(xiàn)操作的序列化。除此之外,redis的存儲被分為內(nèi)存存儲、磁盤存儲和log文件三部分,配置文件也有三項參數(shù)進(jìn)行參考。因此對redis評估擴(kuò)容通過對內(nèi)存存儲、磁盤存儲、log文件三個分開的部分進(jìn)行,增加備件,做好配置,其次,通過redis進(jìn)行擴(kuò)容的做法就是增加Redis服務(wù)器的數(shù)量,在客戶端對存儲的key進(jìn)行hash運算,存入不同的Redis服務(wù)器中,同樣的在讀取時,也進(jìn)行相同的hash運算,找到對應(yīng)的Redis服務(wù)器,由此就可以進(jìn)行容量的擴(kuò)大。大量的設(shè)備硬件出現(xiàn)故障不可避免,在關(guān)鍵業(yè)務(wù)設(shè)備做好備件,一旦出現(xiàn)故障及時更換,將故障時間控制在幾分鐘內(nèi)。(3)協(xié)調(diào)好各種設(shè)備的供應(yīng)商廠家工程師駐場待命,以便出現(xiàn)故障時,和運維團(tuán)隊共同處理,減少中間的溝通環(huán)節(jié),縮短故障處理時間,減少客戶因故障而等待產(chǎn)生的不悅。(4)啟動各種應(yīng)急預(yù)案,對可能發(fā)生的突發(fā)情況進(jìn)行預(yù)判,指定響應(yīng)的方案。(5)進(jìn)行壓力測試,查看擴(kuò)容后可以容納多少用戶同時訪問。壓力測試就是指對服務(wù)器系統(tǒng)在搞強(qiáng)度業(yè)務(wù)以及高壓之下情況下的承受能力的測試[8]。包括可承受的最大并發(fā)量和吞吐能力等,就是對在高壓的情況下能否滿足對“平安920活動”要求性能以及能否穩(wěn)定地運行,如果測試結(jié)果不能達(dá)到“平安920活動”預(yù)期所需的性能要求時,就要重新進(jìn)行分析,對系統(tǒng)重新進(jìn)行調(diào)整優(yōu)化,重新進(jìn)行壓力測試,以在多次試驗之后達(dá)到活動所需的性能要求。(6)測試完成后,進(jìn)行系統(tǒng)上線。2.活動當(dāng)天工作在920活動的24小時里,正所謂與其后悔于已然,不如防患于未然,監(jiān)控的目的就是防患于未然。通過監(jiān)控,運維人員能夠及時了解到企業(yè)網(wǎng)絡(luò)的運行狀態(tài),一旦出現(xiàn)安全隱患,可以及時預(yù)警或者是以其他方式通知運維人員,讓運維監(jiān)控人員有時間處理和解決,避免影響業(yè)務(wù)系統(tǒng)的正常使用,將一切問題的根源扼殺在搖籃當(dāng)中。主要監(jiān)控三個方面的狀況。(1)監(jiān)控業(yè)務(wù)層面,比如本來每秒創(chuàng)建2000筆,突然降為500筆,就出現(xiàn)問題來了,再有可能訂單生成,有丟單等,這些業(yè)務(wù)層面的問題會大大影響銷售額,這時我們就會召集業(yè)務(wù)部門和軟件開發(fā)系統(tǒng)的人員共同分析問題原因。(2)應(yīng)用系統(tǒng)監(jiān)控

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論