版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
云基礎(chǔ)架構(gòu)平臺(tái)管理模塊簡介對(duì)云基礎(chǔ)架構(gòu)平臺(tái)進(jìn)行規(guī)劃管理,包括部門間、項(xiàng)目間安全策略上的資源規(guī)劃,對(duì)云基礎(chǔ)架構(gòu)平臺(tái)的資源使用狀況、平臺(tái)運(yùn)行狀態(tài)進(jìn)行監(jiān)控以及對(duì)突發(fā)故障的應(yīng)急解決與排查進(jìn)行處理。模塊知識(shí)(1)掌握云平臺(tái)資源的管理方法。(2)掌握常見云平臺(tái)監(jiān)控管理工具的使用。(3)具備云平臺(tái)的運(yùn)維、管理和排錯(cuò)的綜合能力。環(huán)境準(zhǔn)備云平臺(tái)資源規(guī)劃已部署完成的OpenStack集群環(huán)境或AllInOne環(huán)境。云平臺(tái)監(jiān)控管理已部署完成的OpenStack集群環(huán)境或AllInOne環(huán)境。云平臺(tái)故障排查已部署完成的OpenStack集群環(huán)境或AllInOne環(huán)境。容器化部署Zabbix監(jiān)控系統(tǒng)使用openEuler22.09操作系統(tǒng)容器化部署Zabbix監(jiān)控系統(tǒng),節(jié)點(diǎn)規(guī)劃見表4-1。表4-1Zabbix-Server節(jié)點(diǎn)規(guī)劃IP主機(jī)名節(jié)點(diǎn)76zabbix-serverZabbix-Server節(jié)點(diǎn)模塊內(nèi)容實(shí)戰(zhàn)案例——云平臺(tái)資源規(guī)劃云平臺(tái)資源規(guī)劃對(duì)于優(yōu)化資源配置、保障業(yè)務(wù)高效運(yùn)行具有重要意義。下面將逐步深入探討三個(gè)核心方面,旨在構(gòu)建一個(gè)既保障部門間資源隔離與安全性,又能促進(jìn)有效資源共享,并借鑒最佳實(shí)踐優(yōu)化企業(yè)級(jí)云平臺(tái)資源規(guī)劃的策略體系。部門資源隔離(1)基于項(xiàng)目的資源隔離創(chuàng)建項(xiàng)目,在云平臺(tái)上創(chuàng)建不同的項(xiàng)目,將同一項(xiàng)目的相關(guān)資源放入該項(xiàng)目中,命令如下所示。#openstackprojectcreatewxicproject#openstackprojectcreatewxicproject創(chuàng)建用戶并加入項(xiàng)目中,在項(xiàng)目中分配資源,如計(jì)算實(shí)例、存儲(chǔ)、網(wǎng)絡(luò)等,確保每個(gè)項(xiàng)目都擁有自己獨(dú)立的計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源。創(chuàng)建“wxicuser”用戶加入到“wxicproject”項(xiàng)目中,命令如下所示。#openstackusercreate--projectwxicproject--password000000#openstackusercreate--projectwxicproject--password000000wxicuser每個(gè)項(xiàng)目都可以設(shè)置特定的訪問權(quán)限,以確保項(xiàng)目資源只被授權(quán)的用戶或團(tuán)隊(duì)訪問,將項(xiàng)目中的用戶激活,命令如下所示。#openstackuserset--enablewxicuser#openstackuserset--enablewxicuser使用下列命令,將“wxicuser”用戶添加為“admin”角色。#openstackroleadd--projectwxicproject--userwxicuseradmin#openstackroleadd--projectwxicproject--userwxicuseradmin(2)基于安全組的資源隔離云平臺(tái)基于安全組的資源隔離是防止不同云服務(wù)之間相互干擾以及對(duì)內(nèi)部和外部的攻擊的重要方法。安全組是云平臺(tái)中一種實(shí)現(xiàn)安全隔離和訪問控制的網(wǎng)絡(luò)級(jí)別的安全管理模型。創(chuàng)建“wxicproject”項(xiàng)目對(duì)應(yīng)的安全組。#openstacksecuritygroupcreate--projectwxicproject#openstacksecuritygroupcreate--projectwxicprojectwxicsecurity添加流量入口方向規(guī)則,命令如下。#openstacksecuritygrouprulecreate--ingress--protocoludpwxicsecurity#openstacksecuritygrouprulecreate--ingress--protocoludpwxicsecurity#openstacksecuritygrouprulecreate--ingress--protocoltcpwxicsecurity#openstacksecuritygrouprulecreate--ingress--protocolicmpwxicsecurity添加流量出口方向規(guī)則,命令如下。#openstacksecuritygrouprulecreate--egress--protocoludpwxicsecurity#openstacksecuritygrouprulecreate--egress--protocoludpwxicsecurity#openstacksecuritygrouprulecreate--egress--protocoltcpwxicsecurity#openstacksecuritygrouprulecreate--egress--protocolicmpwxicsecurity使用安全組命令,檢測安全組規(guī)則,查看根據(jù)IP協(xié)議創(chuàng)建的規(guī)則,命令如下。#openstacksecuritygrouprulelistwxicsecurity#openstacksecuritygrouprulelistwxicsecurity(3)基于區(qū)域的資源隔離云平臺(tái)基于區(qū)域的資源隔離是一種資源隔離方法,將不同的資源放置在不同的區(qū)域中以實(shí)現(xiàn)資源的隔離和保護(hù)。使用命令創(chuàng)建區(qū)域“wxicdomain”,命令如下。#openstackdomaincreatewxicdomain#openstackdomaincreatewxicdomain激活區(qū)域“wxicdomain”,命令如下。#openstackdomainset--enablewxicdomain#openstackdomainset--enablewxicdomain在域中創(chuàng)建項(xiàng)目,命令如下。#openstackprojectcreate--domainwxicdomainwxicproject#openstackprojectcreate--domainwxicdomainwxicproject激活項(xiàng)目,命令如下。#openstackprojectset--domainwxicdomain--enablewxicproject#openstackprojectset--domainwxicdomain--enablewxicproject查詢當(dāng)前域下所有項(xiàng)目,命令如下。#openstackprojectlist--domainwxicdomain#openstackprojectlist--domainwxicdomain在域中創(chuàng)建用戶,可以為每個(gè)區(qū)域設(shè)定訪問權(quán)限,確保只有授權(quán)用戶才能訪問該區(qū)域中的資源,使用命令創(chuàng)建域用戶,命令如下。#openstackusercreate--domainwxicdomain--password000000#openstackusercreate--domainwxicdomain--password000000wxicuser激活域用戶,命令如下。#openstackuserset--domainwxicdomain--enablewxicuser#openstackuserset--domainwxicdomain--enablewxicuser將創(chuàng)建的域用戶“wxicuser”添加到項(xiàng)目“wxicproject”中,命令如下。##openstackroleadd--project-domainwxicdomain--projectwxicproject--user-domainwxicdomain--userwxicuseradmin部門資源共享(1)共享鏡像共享鏡像是指云平臺(tái)上的一種鏡像共享服務(wù),它允許用戶在同一個(gè)區(qū)域或跨區(qū)域共享和使用同一份基礎(chǔ)鏡像軟件,而無需經(jīng)過多次的重復(fù)下載。(2)共享網(wǎng)絡(luò)和子網(wǎng)在云平臺(tái)上,共享網(wǎng)絡(luò)和子網(wǎng)可以讓多個(gè)云主機(jī)共享同一個(gè)網(wǎng)絡(luò),提高網(wǎng)絡(luò)使用效率和降低成本。企業(yè)云平臺(tái)資源規(guī)劃的最佳實(shí)踐(1)規(guī)劃各部門可用的資源配額企業(yè)環(huán)境下,通常由平臺(tái)管理員進(jìn)行設(shè)置和調(diào)整云平臺(tái)的使用配額。管理人員會(huì)通過評(píng)估部門的業(yè)務(wù)負(fù)載,來將資源分配給不同的主機(jī)、環(huán)境。如CPU、內(nèi)存、存儲(chǔ)、帶寬等。(2)資源使用監(jiān)控云平臺(tái)資源使用監(jiān)控是保障云服務(wù)穩(wěn)定性和性能優(yōu)化的重要手段。一般而言,云平臺(tái)監(jiān)控工具可以提供以下功能:實(shí)時(shí)監(jiān)控云資源的使用情況,例如CPU使用率、存儲(chǔ)空間使用率、帶寬使用率等。對(duì)不同的資源使用情況進(jìn)行統(tǒng)計(jì)分析,例如對(duì)CPU使用量的歷史數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,以便更好地進(jìn)行資源規(guī)劃和優(yōu)化。報(bào)警功能,當(dāng)某個(gè)資源使用量超過預(yù)設(shè)的閾值時(shí),可以自動(dòng)發(fā)送警報(bào)通知管理員,以便及時(shí)采取措施。靈活的可視化界面,以便管理員輕松地查看資源使用情況,并進(jìn)行直觀的分析和決策。對(duì)不同應(yīng)用的資源使用情況進(jìn)行詳細(xì)的跟蹤,以便更好地進(jìn)行應(yīng)用調(diào)優(yōu)和性能優(yōu)化。實(shí)戰(zhàn)案例——云平臺(tái)監(jiān)控管理OpenStack平臺(tái)自帶監(jiān)控(1)查看平臺(tái)狀態(tài)及使用情況OpenStack中的服務(wù)是分布式部署,因此,各個(gè)服務(wù)的啟停狀態(tài),決定了此系統(tǒng)的可用性。用戶可以通過OpenStack提供的接口來查看服務(wù)的運(yùn)行狀態(tài),命令如下。#novaservice-list#novaservice-list#neutronagent-list#cinderservice-list#heatservice-list使用nova相關(guān)命令查詢nova資源使用的信息,命令如下。novausage-list //查看所有租戶的信息//查看單一租戶的信息#novausage#gnocchiarchive-policylist(2)使用Ceilometer監(jiān)控平臺(tái)狀態(tài)列出歸檔策略具體如下,命令如下。#gnocchiarchive-policylist顯示當(dāng)前歸檔策略列表,命令如下。#gnocchiarchive-policy-rulelist#gnocchiarchive-policy-rulelist獲得資源使用列表,命令如下。#gnocchiresourcelist#gnocchiresourcelist獲得資源類型列表,命令如下。#gnocchiresource-typelist#gnocchiresource-typelist管理計(jì)量項(xiàng),命令如下。#gnocchimetriclist#gnocchimetriclist(3)使用Aodh警報(bào)服務(wù)監(jiān)控平臺(tái)狀態(tài)Aodh支持多種警報(bào)類型,例如:閾值警報(bào)、復(fù)合警報(bào)等,可以選擇適合場景的警報(bào)類型來定義相應(yīng)的警報(bào)規(guī)則,具體的使用案例如下。設(shè)置特定實(shí)例,基于CPU利用率限制,創(chuàng)建面向閾值警報(bào)的示例,命令如下。#aodhalarmcreate\#aodhalarmcreate\--namecpu_hi\--typegnocchi_resources_threshold\--description'instancerunninghot'\--metriccpu_util\--threshold70.0\--comparison-operatorgt\--aggregation-methodmean\--granularity600\--evaluation-periods3\--alarm-action'log://'\--resource-idINSTANCE_ID\--resource-typeinstance創(chuàng)建一個(gè)復(fù)合警報(bào),當(dāng)任何一個(gè)指定實(shí)例的CPU利用率達(dá)到80%時(shí),將觸發(fā)該警報(bào),警報(bào)將通過HTTP請(qǐng)求通知給指定的地址,命令如下。#aodhalarmcreate\#aodhalarmcreate\--namemeta\--typecomposite\--composite-rule'{"or":[{"threshold":0.8,"metric":"cpu_util",\"type":"gnocchi_resources_threshold","resource_id":INSTANCE_ID1,\"resource_type":"instance","aggregation_method":"last"},\{"threshold":0.8,"metric":"cpu_util",\"type":"gnocchi_resources_threshold","resource_id":INSTANCE_ID2,\"resource_type":"instance","aggregation_method":"last"}]}'\--alarm-action'/notify'基于電源狀態(tài)創(chuàng)建事件警報(bào)的示例,命令如下。#aodhalarmcreate\#aodhalarmcreate\--typeevent\--nameinstance_off\--description'InstancepoweredOFF'\--event-type"compute.instance.power_off.*"\--enableTrue\--query"traits.instance_id=string::INSTANCE_ID"\--alarm-action'log://'\--ok-action'log://'\--insufficient-data-action'log://'使用OpenStack相關(guān)命令,刪除cpu_hi警報(bào),命令如下。#openstackalarmdeletecpu_hi#openstackalarmdeletecpu_hi安裝Zabbix監(jiān)控截至2024年3openEuler操作系統(tǒng)的官方軟件倉庫中,社區(qū)創(chuàng)新版本openEuler22.09尚未針對(duì)Zabbix監(jiān)控提供預(yù)先構(gòu)建的官方軟件包支持,僅在長期支持版本(LTS)進(jìn)行了適配,目前最新的長期支持版本(LTS)為openEuler22.03,故在此案例中,使用openEuler22.03系統(tǒng)。(1)節(jié)點(diǎn)規(guī)劃登錄OpenStack云平臺(tái),分發(fā)兩臺(tái)openEuler22.03的云主機(jī),云主機(jī)類型使用4vCPU/12GB內(nèi)存/60GB硬盤。節(jié)點(diǎn)規(guī)劃見表2-1。表2-1節(jié)點(diǎn)規(guī)劃IP主機(jī)名節(jié)點(diǎn)1zabbix-serverZabbixServer節(jié)點(diǎn)2zabbix-agentZabbixAgent節(jié)點(diǎn)(2)安裝ZabbixServer云主機(jī)創(chuàng)建完成后,使用SecureCRT連接ZabbixServer節(jié)點(diǎn),修改主機(jī)名為“zabbix-server”,命令如下。#hostnamectlset-hostnamezabbix-server#hostnamectlset-hostnamezabbix-server將提供的zabbix6.2-repo文件上傳到系統(tǒng)的/opt目錄,使用離線源進(jìn)行實(shí)驗(yàn),修改方式如下。#mv/etc/yum.repos.d/*/media/#mv/etc/yum.repos.d/*/media/#cat<<MXD>/etc/yum.repos.d/openEuler.repo[openEuler22.03]name=zabbix6.2baseurl=file:///opt/zabbix6.2-repo/gpgcheck=0MXD安裝數(shù)據(jù)庫服務(wù),命令如下。#dnf-yinstallmariadbmariadb-server--nogpgcheck#dnf-yinstallmariadbmariadb-server--nogpgcheck安裝Zabbix服務(wù),命令如下。##dnf-yinstall--nogpgcheckzabbix-server-mysqlzabbix-web-mysqlzabbix-nginx-confzabbix-sql-scriptszabbix-selinuxzabbix-agent使用命令啟動(dòng)數(shù)據(jù)庫服務(wù),并設(shè)置開機(jī)自啟,命令如下。#systemctlenable--nowmariadb#systemctlenable--nowmariadb登錄數(shù)據(jù)庫,創(chuàng)建Zabbix庫(中文編碼格式),命令如下。#mysql#mysqlMariaDB[(none)]>createdatabasezabbixcharactersetutf8mb4collateutf8mb4_bin;QueryOK,1rowaffected(0.000sec)MariaDB[(none)]>createuserzabbix@localhostidentifiedby'zabbix';QueryOK,0rowsaffected(0.001sec)授予Zabbix用戶的訪問權(quán)限,命令如下。MariaDBMariaDB[(none)]>grantallprivilegesonzabbix.*tozabbix@localhostidentifiedby'zabbix';QueryOK,0rowsaffected(0.001sec)log_bin_trust_function_creators的值,防止出現(xiàn)安裝或升級(jí)MySQL后解決一些函數(shù)和存儲(chǔ)過程的語法問題,命令如下。MariaDBMariaDB[(none)]>setgloballog_bin_trust_function_creators=1;QueryOK,0rowsaffected(0.000sec)在ZabbixServer節(jié)點(diǎn)導(dǎo)入初始模式和數(shù)據(jù),系統(tǒng)提示輸入新創(chuàng)建的密碼,命令如下。##zcat/usr/share/doc/zabbix-sql-scripts/mysql/server.sql.gz|mysql--default-character-set=utf8mb4-uzabbix-pzabbixzabbix導(dǎo)入數(shù)據(jù)庫后,使用數(shù)據(jù)庫編輯命令,禁用log_bin_trust_function_creators選項(xiàng),命令如下。#mysql-e"setgloballog_bin_trust_function_creators=0;"#mysql-e"setgloballog_bin_trust_function_creators=0;"編輯文件Zabbix配置文件/etc/zabbix/zabbix_server.conf,修改數(shù)據(jù)庫密碼為zabbix,命令如下。DBPasswordDBPassword=zabbix啟動(dòng)Zabbix服務(wù)器和代理進(jìn)程,使其在系統(tǒng)啟動(dòng)時(shí)啟動(dòng),命令如下。#zabbix_server-c/etc/zabbix/zabbix_server.conf#zabbix_server-c/etc/zabbix/zabbix_server.confzabbix_server:symbollookuperror:zabbix_server:undefinedsymbol:usmDESPrivProtocol//出現(xiàn)這種情況需要先升級(jí)net-snmp,然后啟動(dòng)zabbix-server服務(wù)#dnf-yinstallnet-snmp net-snmp-devel#dnf-yinstallnet-snmp-utils#mv/etc/zabbix/zabbix_server.conf/etc/zabbix/zabbix-server.conf#systemctlrestartzabbix-serverzabbix-agentnginxphp-fpm#systemctlenablezabbix-serverzabbix-agentnginxphp-fpm使用瀏覽器訪問1/zabbix,可在默認(rèn)頁面選擇語言為中文(簡體),單擊右下角“下一步”按鈕,后續(xù)按照頁面提示進(jìn)行操作。(3)安裝ZabbixAgent使用SecureCRT連接ZabbixAgent節(jié)點(diǎn),主機(jī)名為“zabbix-agent”,命令如下。#hostnamectlset-hostnamezabbix-agent#hostnamectlset-hostnamezabbix-agent將提供的zabbix6.2-repo文件上傳到系統(tǒng)的/opt目錄,使用離線源進(jìn)行實(shí)驗(yàn),修改方式如下。#mv/etc/yum.repos.d/*/media/#mv/etc/yum.repos.d/*/media/#cat<<MXD>/etc/yum.repos.d/openEuler.repo[openEuler22.03]name=zabbix6.2baseurl=file:///opt/zabbix6.2-repo/gpgcheck=0MXD安裝zabbix-agent服務(wù),命令如下。#dnf-yinstallzabbix-agent#dnf-yinstallzabbix-agent修改/etc/zabbix/zabbix_agentd.conf配置文件,配置zabbix-agent,修改示例如下。#vi#vi/etc/zabbix/zabbix_agentd.confServer=1ServerActive=1Hostname=Zabbix-agent啟動(dòng)zabbix-agent服務(wù),命令如下。#systemctlenable--nowzabbix-agent#systemctlenable--nowzabbix-agent回到Web界面,單擊左邊導(dǎo)航欄“監(jiān)測→主機(jī)→創(chuàng)建主機(jī)”按鈕轉(zhuǎn)到配置主機(jī)的頁面,然后填寫配置信息,將zabbix-agent節(jié)點(diǎn)添加到被監(jiān)控機(jī)器,主機(jī)群組選擇“Linuxservers”,填寫相關(guān)信息,填寫完成后單擊下方“添加”按鈕即可。(4)配置Zabbix監(jiān)控OpenStack平臺(tái)宿主機(jī)監(jiān)控OpenStack宿主機(jī),需要在“controller”節(jié)點(diǎn)部署ZabbixAgent服務(wù)。將提供的zabbix6.2-repo文件上傳到系統(tǒng)的/opt目錄,使用離線源進(jìn)行實(shí)驗(yàn),修改方式如下。#mv/etc/yum.repos.d/*/media/#mv/etc/yum.repos.d/*/media/#cat<<MXD>/etc/yum.repos.d/openEuler.repo[openEuler22.03]name=zabbix6.2baseurl=file:///opt/zabbix6.2-repo/gpgcheck=0MXD在controller節(jié)點(diǎn)安裝zabbix-agent,命令如下。#dnf-yinstallzabbix-agent#dnf-yinstallzabbix-agent修改ZabbixAgent配置文件zabbix_agentd.conf,指定Server節(jié)點(diǎn),修改示例如下。#vi#vi/etc/zabbix/zabbix_agentd.confServer=1ServerActive=1Hostname=controller啟動(dòng)zabbix-agent服務(wù),命令如下。#systemctlstartzabbix-agent#systemctlstartzabbix-agent回到ZabbixSever節(jié)點(diǎn)的Web界面,選擇左邊導(dǎo)航欄“監(jiān)測→主機(jī)→創(chuàng)建主機(jī)”命令,跳轉(zhuǎn)到配置主機(jī)的頁面,填寫主機(jī)名稱、Agent信息,選擇主機(jī)群組,然后單擊“更新”按鈕,完成配置監(jiān)控OpenStack主機(jī)。(5)配置Zabbix監(jiān)控OpenStack組件使用Zabbix監(jiān)控OpenStack基本上可以分為兩個(gè)部分,監(jiān)控物理節(jié)點(diǎn)的系統(tǒng)信息,如控制、網(wǎng)絡(luò)、計(jì)算Zabbix自帶的item足以滿足需求。監(jiān)控云主機(jī)(實(shí)例),需要給云主機(jī)綁定一個(gè)外網(wǎng)IP(?oatingIP),作為外部訪問的IP,其他配置和監(jiān)控不同主機(jī)一樣。除此之外如果想要監(jiān)控OpenStack云環(huán)境中的服務(wù),那就需要自己寫腳本來完成監(jiān)控了。實(shí)戰(zhàn)案例——云平臺(tái)故障排查云平臺(tái)故障排查是確保云計(jì)算服務(wù)高效穩(wěn)定的關(guān)鍵實(shí)踐,涉及從識(shí)別與確認(rèn)故障范圍到深入解讀OpenStack服務(wù)日志等多個(gè)環(huán)節(jié)。確認(rèn)故障的范圍(1)故障范圍排查在排查云平臺(tái)故障,確認(rèn)故障范圍時(shí),需要采取系統(tǒng)性的方法,從不同的角度進(jìn)行診斷和分析。在某些情況下,可能需要比較復(fù)雜的排查工作,包括調(diào)試代碼、回滾補(bǔ)丁等操作來解決問題。(2)確認(rèn)故障是否與物理基礎(chǔ)設(shè)施相關(guān)物理基礎(chǔ)設(shè)施的檢查和診斷是日常維護(hù)云平臺(tái)正常運(yùn)行的關(guān)鍵舉措,及時(shí)查出故障源頭,以便盡快解決故障,恢復(fù)設(shè)備的正常工作。實(shí)際實(shí)施過程中,運(yùn)維人員也可以尋求專業(yè)硬件技術(shù)人員進(jìn)行協(xié)助和支持。OpenStack服務(wù)日志分析(1)各服務(wù)日志目錄說明/var/log/目錄是日志文件夾的主要存儲(chǔ)位置,根據(jù)服務(wù)名進(jìn)行進(jìn)一步文件夾的劃分,各服務(wù)日志文件名也因版本和配置而有所不同,以下列出的為常見的文件目錄結(jié)構(gòu),命令如下。dnf.librepo.logdnf.librepo.loghorizonmessages rabbitmq tallylog wtmpvmware-vmtoolsd-root.logmemcached_exporter prometheus swtpmheatvmware-vgauthsvc.log.0vmware-vmsvc-root.loghawkey.log mariadbprivateswiftsssdgnocchimai1logplacementchronycindercronbtmp firewalld lastlognova skylinevmware-network.3.logceilometer glance libvirtopenvswitchspoolervmware-network.lognginx secure vmware-network.2.logkeystoneaudit dnf.rpm.logzabbixxferlog#ls/var/log/anaconda dnf.loghttpd neutronREADME vmware-network.1.log(2)如何有效查看相關(guān)服務(wù)的日志在OpenStack中,每個(gè)組件服都有各自的日志文件,查看和分析這些日志文件有助于用戶發(fā)現(xiàn)和診斷各種問題。以下是一些有效查看OpenStack相關(guān)服務(wù)日志的方法:使用命令行工具查看日志。在OpenStack節(jié)點(diǎn)上安裝的組件可以通過命令行工具進(jìn)行訪問和管理,因此可以使用該工具查看日志。使用OpenStackDashboard查看日志。在控制節(jié)點(diǎn)上安裝了OpenStackDashboard組件,可以通過它訪問HorizonWeb界面,從而可以查看組件日志。、Logstash和Kibana)和Prometheus這樣的開源日志管理平臺(tái)。這些開源工具提供了一個(gè)完整的日志解決方案,包括可視化、警報(bào)、搜索、過濾器等。無論哪種方法,總是應(yīng)該能夠根據(jù)需要輕松地搜索、分析和查看OpenStack服務(wù)產(chǎn)生的各種日志信息,從而保持OpenStack環(huán)境的最佳狀態(tài)。常見故障及解決方案(1)OpenStack服務(wù)故障排查OpenStack云平臺(tái)中的服務(wù)故障排查是一項(xiàng)需要耐心和技巧的任務(wù)。通常情況下,可以嘗試以下一些故障排查的基本步驟:第一,記錄錯(cuò)誤信息。OpenStack服務(wù)往往會(huì)輸出一些錯(cuò)誤信息和日志,這些信息能很好地提示服務(wù)出現(xiàn)的故障。針對(duì)異常問題,首先應(yīng)該在服務(wù)日志中查找相關(guān)信息。第二,檢查服務(wù)狀態(tài)。可以在控制節(jié)點(diǎn)上使用命令行工具或面板查看服務(wù)的狀態(tài)。對(duì)于故障服務(wù),可以使用systemctlstatus命令來查看詳細(xì)的狀態(tài)信息。第三,檢查網(wǎng)絡(luò)連接。所有OpenStack服務(wù)都涉及網(wǎng)絡(luò)通信,有時(shí)網(wǎng)絡(luò)問題是產(chǎn)生錯(cuò)誤的罪魁禍?zhǔn)?。可以使用ping、nslookup、tracerout等命令來檢查相應(yīng)IP地址或主機(jī)名稱在網(wǎng)絡(luò)上的可到達(dá)性。第四,檢查配置信息。在OpenStack的配置文件中可能存在錯(cuò)誤或不一致的配置項(xiàng),導(dǎo)致服務(wù)無法正常運(yùn)行。第五,再次縮小范圍。如果在前幾個(gè)步驟中沒有找到失敗的根本原因,那么應(yīng)該再次縮小故障范圍。可以使用strace、tcpdump、sysdig、gdb和其他調(diào)試工具來進(jìn)一步排查逐層的問題。(2)宿主機(jī)故障排查OpenStack宿主機(jī)故障會(huì)給云平臺(tái)正常運(yùn)轉(zhuǎn)帶來很大威脅。宿主機(jī)的故障排查,需要優(yōu)先查看宿主機(jī)進(jìn)程狀態(tài),通過top或者ps命令可以查看宿主機(jī)上所有正在運(yùn)行的進(jìn)程。如果發(fā)現(xiàn)宿主機(jī)正在執(zhí)行任何意外的進(jìn)程,例如病毒或者惡意軟件,需要對(duì)宿主機(jī)進(jìn)行一次完整的檢測,可以通過查看/var/log/wtmp來發(fā)現(xiàn)異常信息。/var/log/wtmp是一個(gè)二進(jìn)制文件,記錄每個(gè)用戶的登錄次數(shù)和持續(xù)時(shí)間等信息。該日志文件永久記錄每個(gè)用戶登錄、注銷及系統(tǒng)的啟動(dòng)、停機(jī)的事件。因此隨著系統(tǒng)正常運(yùn)行時(shí)間的增加,該文件的大小也會(huì)越來越大,增加的速度取決于系統(tǒng)用戶登錄的次數(shù)。該日志文件可以用來查看用戶的登錄記錄,但是需要使用last命令訪問這個(gè)文件獲得這些信息,命令如下。#last-f/var/log/wtmp#last-f/var/log/wtmp命令輸出結(jié)果會(huì)以逆序從后向前顯示用戶的登錄記錄,last也能根據(jù)用戶、終端tty或時(shí)間顯示相應(yīng)的記錄,命令如下。#lastroot-f/var/log/wtmp#lastroot-f/var/log/wtmp#last-t2024-01-0108:00:00-f/var/log/wtmp(3)網(wǎng)絡(luò)故障排查OpenStack網(wǎng)絡(luò)故障是一項(xiàng)常見的問題。通常會(huì)使用以下方式解決OpenStack網(wǎng)絡(luò)故障問題:確認(rèn)網(wǎng)絡(luò)拓?fù)洌簷z查OpenStack網(wǎng)絡(luò)拓?fù)洌ňW(wǎng)絡(luò)配置、VLAN的創(chuàng)建和配置。確保拓?fù)渲械奈锢砭W(wǎng)絡(luò)、網(wǎng)絡(luò)配置和網(wǎng)絡(luò)連接工作正常。檢查虛擬網(wǎng)絡(luò)配置:檢查虛擬交換機(jī)、租戶路由器和所有相關(guān)虛擬網(wǎng)絡(luò)設(shè)備。確保網(wǎng)絡(luò)設(shè)備可以成功啟動(dòng),并啟用相應(yīng)的服務(wù)。檢查網(wǎng)絡(luò)資源:檢查OpenStack網(wǎng)絡(luò)資源,確保沒有沖突或資源耗盡的問題。確保計(jì)算節(jié)點(diǎn)的狀態(tài),以及計(jì)算節(jié)點(diǎn)與其他節(jié)點(diǎn)之間的正常通信,命令如下。#neutronagent-list#neutronagent-list檢查網(wǎng)絡(luò)服務(wù):檢查OpenStack網(wǎng)絡(luò)服務(wù)是否正常,測試和檢查所有網(wǎng)絡(luò)服務(wù)是否正常工作,命令如下。#neutronagent-list#neutronagent-list檢查虛擬機(jī)網(wǎng)絡(luò):檢查虛擬機(jī)的網(wǎng)絡(luò)連接,確保配置了正確的供應(yīng)商網(wǎng)絡(luò)類型、網(wǎng)絡(luò)地址及網(wǎng)關(guān)IP地址。檢查虛擬路由器:檢查路由器的接口,確保虛擬路由器正常工作。檢查日志和錯(cuò)誤:檢查所有錯(cuò)誤信息,找到任何有用的日志,以及“/var/log”中的任何有用信息。網(wǎng)絡(luò)問題往往是頻繁出現(xiàn)和難以解決的問題,需要仔細(xì)地分析和檢查各種網(wǎng)絡(luò)組件和服務(wù),以找到問題的根本原因。(4)存儲(chǔ)故障排查OpenStack平臺(tái)存儲(chǔ)故障排查通常很棘手,因?yàn)榇鎯?chǔ)層是OpenStack的核心組成部分之一,失敗可能會(huì)導(dǎo)致整個(gè)系統(tǒng)的帶寬不足、易出現(xiàn)瓶頸和錯(cuò)誤。以下是一些可能有用的建議,以解決OpenStack存儲(chǔ)故障問題:檢查磁盤空間:檢查OpenStack存儲(chǔ)的基本磁盤空間和網(wǎng)絡(luò)文件系統(tǒng)等,例如NFS,確保磁盤正確格式化且空間充足,命令如下。#df-Th#df-Th檢查存儲(chǔ)狀態(tài):檢查存儲(chǔ)節(jié)點(diǎn)的狀態(tài),例如Ceph集群、LVM和各類存儲(chǔ)后端。確保存儲(chǔ)后端能夠成功啟動(dòng),并啟用相應(yīng)的存儲(chǔ)服務(wù),命令如下。#systemctlstatusopenstack-nova*#systemctlstatusopenstack-nova*檢查硬件狀態(tài):檢查存儲(chǔ)系統(tǒng)的硬件狀態(tài),確保磁盤等硬件正常工作。檢查存儲(chǔ)資源:檢查存儲(chǔ)資源,確保沒有沖突或資源耗盡的問題。如果有默認(rèn)配額,就要調(diào)整配額以滿足實(shí)際存儲(chǔ)需求。在OpenStack中新建的云主機(jī)都存放在計(jì)算節(jié)點(diǎn)/var/lib/nova/instances目錄下,在新建虛擬機(jī)存儲(chǔ)不夠用時(shí),可以將云主機(jī)轉(zhuǎn)移到新的存儲(chǔ)位置,查看云主機(jī)存放目錄的命令如下。#ll/var/lib/nova/instances#ll/var/lib/nova/instances檢查卷狀態(tài):根據(jù)卷的類型和創(chuàng)建方法,驗(yàn)證目標(biāo)設(shè)備的正確性和狀態(tài),盡可能排除卷與其預(yù)期功能不符,命令如下。#lsblk#lsblk檢查日志和錯(cuò)誤:檢查所有與存儲(chǔ)相關(guān)的錯(cuò)誤信息并找到有用的日志,例如Cinder、Glance的日志信息。實(shí)戰(zhàn)案例——容器化部署Zabbix監(jiān)控系統(tǒng)Zabbix作為一款功能強(qiáng)大且廣泛應(yīng)用的企業(yè)級(jí)監(jiān)控解決方案,其傳統(tǒng)的部署方式在面臨復(fù)雜環(huán)境和大規(guī)模應(yīng)用時(shí),可能會(huì)面臨組件眾多、依賴關(guān)系復(fù)雜以及升級(jí)維護(hù)困難等問題。因此,采用容器化部署配置Zabbix-Server節(jié)點(diǎn)基礎(chǔ)環(huán)境修改主機(jī)名,命令如下所示。#hostnamectlset-hostnamezabbix-server#hostnamectlset-hostnamezabbix-server#execbash關(guān)閉防火墻和SELinux,命令如下所示。(此步驟線上環(huán)境不需要)#systemctldisable–nowfirewalld#systemctldisable–nowfirewalld#setenforce0#sed-i's/^SELINUX=.*/SELINUX=permissive/g'/etc/selinux/config將提供的zabbix6.2-repo文件上傳到系統(tǒng)的/opt目錄,使用離線源進(jìn)行實(shí)驗(yàn),修改方式如下。#mv/etc/yum.repos.d/*/media/#mv/etc/yum.repos.d/*/media/#cat<<MXD>/etc/yum.repos.d/openEuler.repo[openEuler22.03]name=zabbix6.2baseurl=file:///opt/zabbix6.2-repo/gpgcheck=0MXD安裝Docker服務(wù),命令如下所示。#dnf-yinstalldocker-engine#dnf-yinstalldocker-engine設(shè)置Docker服務(wù)開機(jī)自啟并立即啟動(dòng),命令如下所示。#systemctlenable--nowdocker#systemctlenable--nowdocker容器化部署Zabbix監(jiān)控系統(tǒng)將提供的離線鏡像文件導(dǎo)入節(jié)點(diǎn),命令如下。#gunzip-cmysql.tar.gz|dockerload#gunzip-cmysql.tar.gz|dockerload#gunzip-czabbix-server-mys
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- DB37T 4791-2024煤礦井下超大斷面硐室施工技術(shù)規(guī)范
- 江西省豐城市第九中學(xué)2025屆高三(復(fù)讀班)上學(xué)期第三次段考政治試卷(含答案)
- 讀書社團(tuán)活動(dòng)策劃(9篇)
- 歌頌教師主題演講稿三分鐘歌頌教師的主題集合4篇
- 光船租賃合同(2篇)
- 《職場溝通》電子教案 項(xiàng)目五 職場溝通中的禮儀準(zhǔn)備
- 2025年紫外光固化油墨合作協(xié)議書
- 2025年付里葉紅外分光光度計(jì)項(xiàng)目合作計(jì)劃書
- 2025年低溫超導(dǎo)材料項(xiàng)目發(fā)展計(jì)劃
- 賣車場地租賃協(xié)議
- 危險(xiǎn)源辨識(shí)及分級(jí)管控管理制度
- GB/T 19752-2024混合動(dòng)力電動(dòng)汽車動(dòng)力性能試驗(yàn)方法
- 和員工簽股權(quán)合同范本
- 07FD02 防空地下室電氣設(shè)備安裝
- 《工程倫理》題集
- 江蘇2024年江蘇省新聞出版學(xué)校招聘人員筆試歷年典型考題及考點(diǎn)附答案解析
- 四川省成都市2023-2024學(xué)年高二歷史上學(xué)期期末聯(lián)考試題
- 河北省2024屆高三大數(shù)據(jù)應(yīng)用調(diào)研聯(lián)合測評(píng)(Ⅵ)英語試題含答案
- 成人手術(shù)后疼痛評(píng)估與護(hù)理-中華護(hù)理學(xué)會(huì)團(tuán)體標(biāo)準(zhǔn)(2023)課件
- 《金屬基增容導(dǎo)線技術(shù)條件+第2部分:鋁包殷鋼芯耐熱鋁合金絞線》
- 園藝植物栽培學(xué)智慧樹知到期末考試答案章節(jié)答案2024年浙江農(nóng)林大學(xué)
評(píng)論
0/150
提交評(píng)論