曙光高性能集群系統(tǒng)管理員手冊_第1頁
曙光高性能集群系統(tǒng)管理員手冊_第2頁
曙光高性能集群系統(tǒng)管理員手冊_第3頁
曙光高性能集群系統(tǒng)管理員手冊_第4頁
曙光高性能集群系統(tǒng)管理員手冊_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、曙光信息產業(yè)(北京)有限公司圖 230的VNC監(jiān)控界面:圖 STYLEREF 1 s 2 SEQ 圖 * ARABIC s 1 30 VNC查看界面注意:1被喚醒的作業(yè)不計入作業(yè)總數(shù)中。2.掛起、恢復和重新運行操作只有管理員才能執(zhí)行,即使是對屬于自己的作業(yè),普通用戶也不能進行掛起、恢復和重新運行操作。刪除作業(yè)在作業(yè)管理頁面的表格中選擇要刪除的一個或多個作業(yè),單擊工具欄中的“刪除作業(yè)”按鈕即可實現(xiàn)刪除操作。注意:如果在某些大型作業(yè)的運行過程中發(fā)現(xiàn)無法刪除該作業(yè),請以root身份登陸到管理節(jié)點,進入/opt/gridview/pbs目錄,應用命令./pbs_killjob.sh JOBID命令刪除

2、作業(yè)名稱為JOBID的作業(yè)。由于該功能是暴力刪除作業(yè)并且不能恢復,所以不建議用戶直接應用該命令。統(tǒng)計視圖功能概述Root、Gridview管理員和普通用戶均可用?!敖y(tǒng)計視圖”以Dashboard的形式呈現(xiàn)作業(yè)系統(tǒng)的各種統(tǒng)計信息,讓用戶對于系統(tǒng)的運行狀態(tài)一目了然。如 REF _Ref298415938 h 圖 23所示。圖 STYLEREF 1 s 2 SEQ 圖 * ARABIC s 1 3 作業(yè)調度統(tǒng)計視圖本頁面主要分為如下的幾個區(qū)域:工具欄位于本頁面的最上方,工具欄上有“手動刷新”、“刷新設置”、“自動刷新”三個控件。其中,“自動刷新”按鈕供用戶手動更新Dashboard的數(shù)據(jù);“刷新設置

3、”用于設置頁面自動刷新時的時間間隔;“自動刷新”勾選框用于控制是否啟用頁面的“自動刷新”功能。視圖列表位于“工具欄”下方的左側部分。通過列表的形式展示當前支持的Dashboard的分類。目前僅有一條記錄,即“作業(yè)調度統(tǒng)計視圖”。展示區(qū)域位于“工具欄”下方的右側部分,用各種flash控件用于展示不同的作業(yè)調度統(tǒng)計信息。目前提供了8個dashboard視圖,分別是:“作業(yè)狀態(tài)”、“節(jié)點狀態(tài)”、“當前用戶資源限額”、“隊列作業(yè)”、“用戶作業(yè)”、“隊列運行作業(yè)數(shù)限額”、“隊列核心數(shù)限額”、“最近30天歷史作業(yè)”。詳細功能作業(yè)狀態(tài)本Dashboard對全體作業(yè)的按狀態(tài)統(tǒng)計個數(shù)。統(tǒng)計的狀態(tài)包括:“運行”、

4、“排隊”、“保留”、“掛起”,除此之外都歸入“其它”狀態(tài)。圖 STYLEREF 1 s 2 SEQ 圖 * ARABIC s 1 4 作業(yè)狀態(tài)統(tǒng)計節(jié)點狀態(tài)本Dashboard對全體計算節(jié)點按照狀態(tài)統(tǒng)計節(jié)點數(shù)。節(jié)點狀態(tài)包括:“已占用”、“空閑”、“繁忙”、“停機”、“下線”。狀態(tài)的含義參考 REF _Ref290298874 r h 1.2節(jié)的名詞解釋。圖 STYLEREF 1 s 2 SEQ 圖 * ARABIC s 1 5 節(jié)點狀態(tài)統(tǒng)計當前用戶資源限額本Dashboard呈現(xiàn)當前登錄用戶的“運行作業(yè)數(shù)限額”和“核心數(shù)限額”兩項指標的限額和當前使用量信息。見 REF _Ref298415988

5、 h 圖 26所示。圖 STYLEREF 1 s 2 SEQ 圖 * ARABIC s 1 6 當前用戶資源限額隊列作業(yè)本Dashboard呈現(xiàn)包含作業(yè)的各個隊列中的作業(yè)的狀態(tài)統(tǒng)計。如果包含作業(yè)的隊列數(shù)超過5個,則只顯示作業(yè)數(shù)最多的前5個。圖 STYLEREF 1 s 2 SEQ 圖 * ARABIC s 1 7 隊列作業(yè)統(tǒng)計用戶作業(yè)本Dashboard按照用戶呈現(xiàn)其作業(yè)狀態(tài)分布情況。如果包含有作業(yè)的用戶數(shù)超過5個,則只呈現(xiàn)擁有作業(yè)數(shù)最多的前5個用戶,并且不管當前用戶有沒有作業(yè)存在,均呈現(xiàn)其統(tǒng)計數(shù)據(jù)。如 REF _Ref298416008 h 圖 28所示。圖 STYLEREF 1 s 2 S

6、EQ 圖 * ARABIC s 1 8 用戶作業(yè)統(tǒng)計隊列運行作業(yè)數(shù)限額本Dashboard呈現(xiàn)各個隊列的運行作業(yè)數(shù)限額和隊列的運行作業(yè)統(tǒng)計。如果按照隊列的作業(yè)限額排序。圖 STYLEREF 1 s 2 SEQ 圖 * ARABIC s 1 9 隊列運行作業(yè)數(shù)限額作業(yè)核心數(shù)限額本Dashboard呈現(xiàn)各個隊列的核心數(shù)限額和隊列的統(tǒng)計。如果按照隊列的核心數(shù)限額排序。圖 STYLEREF 1 s 2 SEQ 圖 * ARABIC s 1 10 隊列核心數(shù)限額最近30天歷史作業(yè)本Dashboard呈現(xiàn)截止至昨天的前30天每天完成的作業(yè)數(shù)以及這些作業(yè)占用的CPU時間的統(tǒng)計曲線。圖 STYLEREF 1

7、s 2 SEQ 圖 * ARABIC s 1 11 最近30天歷史作業(yè)統(tǒng)計VNC管理功能概述Root、Gridview管理員可用、普通用戶均可用。不同的是,root和Gridview管理員可以查詢和打開所有用戶的VNC會話,而普通用戶僅能查看和打開自身VNC會話?!癡NC管理”提供了查詢、打開和刪除等管理操作的功能。單擊“作業(yè)調度”-”VNC管理”菜單項,即可打開“VNC管理”頁面,如 REF _Ref292382362 h 圖 233所示:圖 STYLEREF 1 s 2 SEQ 圖 * ARABIC s 1 33 VNC管理頁面VNC管理頁面可以分為如下的幾個部分:1.工具欄位于頁面最上方

8、,工具欄上有“打開會話”、“刪除會話”、“修改隊列”和“刪除隊列”四種操作。2.集群列表樹請參考 REF _Ref298417666 r h 2.3.1 “作業(yè)管理”中相同部分的說明。3.查詢結果顯示區(qū)位于頁面右側的表格區(qū)域,顯示VNC會話信息,包括“會話編號”、“集群名稱”、 “所有者”、“會話大小”、“關聯(lián)作業(yè)號”和“創(chuàng)建時間”等字段。使用說明打開會話選中樹中想要查看的一個或多個集群,然后單擊頁面上方工具欄上的“手動刷新”按鈕,頁面中右側的表格區(qū)域則會顯示最新的所選集群中的VNC會話列表。Root和Gridview管理員可以查詢或者打開所有的VNC會話,而普通用戶僅能查詢和打開自身的VNC

9、會話。如圖所示,選中某一個VNC會話,然后單擊“打開會話”按鈕,這時系統(tǒng)會打開一個新的“VNC打開”Tab頁來呈現(xiàn)當前選中的VNC會話的窗口內容。如 REF _Ref298417698 h 圖 234所示。圖 STYLEREF 1 s 2 SEQ 圖 * ARABIC s 1 34 VNC打開窗口注意:1每次只能選擇并打開一個VNC會話。如果選擇多個打開,則界面會提示錯誤。2同一時刻只允許打開一個VNC會話。如果在已經有一個會話在“VNC打開”Tab頁中顯示,則再在“VNC管理”中選擇一個會話打開的話,原有Tab頁中只會顯示最新的會話窗口。刪除會話用戶可以選中一個或者多個會話,然后點“刪除會話

10、”按鈕。這時,界面彈出如 REF _Ref298417762 h 圖 235所示的提示窗口,請求用戶確認。圖 STYLEREF 1 s 2 SEQ 圖 * ARABIC s 1 35 會話刪除提示窗口如果用戶選擇“是”,則所選會話會被刪除;否則,取消刪除操作。注意:如果被刪除的會話正在被用戶打開使用,刪除之后那些打開的VNC窗口會被關閉,并且提示網絡錯誤。VNC登錄功能概述Root、Gridview管理員和普通用戶均可用?!癡NC登錄”包含的功能主要是打開一個到某個集群管理節(jié)點的VNC會話。初始界面打開界面如 REF _Ref298417795 h 圖 236所示。圖 STYLEREF 1 s

11、 2 SEQ 圖 * ARABIC s 1 36 VNC登錄初始頁面分為兩部分:1集群列表樹位于頁面的左側,每一個葉子節(jié)點代表一個集群。2VNC會話顯示右側Tab頁窗口,用于顯示已經打開的VNC會話窗口。右側窗口允許同時打開多個VNC會話的Tab頁。使用說明登錄會話在初始打開頁面中,雙擊左側的集群名稱便可以新建并打開一個到該集群管理節(jié)點的VNC會話。如 REF _Ref298417840 h 圖 237所示。圖 STYLEREF 1 s 2 SEQ 圖 * ARABIC s 1 37 VNC登錄會話窗口注意:1每個VNC會話窗口都是在一個Tab頁中打開。2每個集群只能打開一個VNC會話。3關閉

12、Tab頁或者關閉“VNC登錄”頁面時均會關閉的VNC會話。集群系統(tǒng)管理 系統(tǒng)開關機 集群系統(tǒng)設備的開啟和關閉需要安裝一定的順序進行,如果不按照合理順序進行,容易導致集群工作不正常。集群系統(tǒng)開啟的順序機柜上電。將機柜電源箱空開撥至“ON”狀態(tài),將每個機柜PDU的空開撥至“ON”狀態(tài)。一般情況下,機柜上電后,會自動開啟網絡交換機、存儲磁盤陣列、KVM等設備。確保已開啟網絡交換設備,包括以太網交換機、IB交換機、存儲交換機等。確保已開啟磁盤陣列。檢查磁盤陣列指示燈或顯示屏,確保磁盤陣列已啟動。開啟IO節(jié)點,等待操作系統(tǒng)完全啟動后,檢查確保已掛載上磁盤陣列存儲空間。開啟登陸管理節(jié)點,操作系統(tǒng)完全啟動后

13、,檢查是否掛載上IO節(jié)點的網絡共享存儲。開啟計算節(jié)點,包括刀片計算節(jié)點、GPGPU計算節(jié)點等,其中開啟刀片計算節(jié)點前,需要按刀片機箱電源按鈕為刀片機箱上電。clusconf 批量開機當集群規(guī)模較大時,逐臺對集群進行開機工作量較大,可利用clusconf 相關命令對集群進行批量開關機,clusconf 命令利用ipmi 的開關機功能,所以需要使用此功能,需要確認服務器配置或集成了ipmi芯片,并且已經配好了可訪問的ipmi地址:確認系統(tǒng)爭取上點、交換機、存儲設備都已經正常開啟手動打開集群中一臺管理節(jié)點,并登陸到這臺管理節(jié)點上。IO節(jié)點批量開關機:clusconf -p io -in管理節(jié)點批量開

14、關機(多臺管理節(jié)點):clusconf -p admin -in計算節(jié)點批量開關機clusconf -p comput -in掛載首先開機的管理節(jié)點的文件系統(tǒng) 由于首先開啟的管理節(jié)點先于IO節(jié)點開機,所以管理節(jié)點的文件系統(tǒng)并沒有正確掛載,在整個系統(tǒng)開啟后,需要掛載文件系統(tǒng)。掛載文件系統(tǒng)可以讓這個節(jié)點重啟,也可以運行相關命令,一般文件掛載命令均寫在/etc/rc.local 中(suse 系統(tǒng)為/etc/init.d/after.local)中。source /etc/rc.localclusconf 智能批量開機clusconf 也可以根據(jù)集群不同節(jié)點的預定義角色,進行智能開關機。確認系統(tǒng)爭取

15、上點、交換機、存儲設備都已經正常開啟手動打開集群中一臺管理節(jié)點,并登陸到這臺管理節(jié)點上,執(zhí)行。clusconf -iin掛載首先開機的管理節(jié)點的文件系統(tǒng) 由于首先開啟的管理節(jié)點先于IO節(jié)點開機,所以管理節(jié)點的文件系統(tǒng)并沒有正確掛載,在整個系統(tǒng)開啟后,需要掛載文件系統(tǒng)。掛載文件系統(tǒng)可以讓這個節(jié)點重啟,也可以運行相關命令,一般文件掛載命令均寫在/etc/rc.local 中(suse 系統(tǒng)為/etc/init.d/after.local)中。source /etc/rc.local集群系統(tǒng)關閉的順序集群系統(tǒng)關機上與開啟順序相反關閉所有計算節(jié)點,包括刀片計算節(jié)點、GPGPU計算節(jié)點等。關閉登陸管理節(jié)

16、點。關閉IO節(jié)點。clusconf 批量關機當集群規(guī)模較大時,逐臺對集群進行開機工作量較大,可利用clusconf 相關命令對集群進行批量開關機,clusconf 命令利用ipmi 的開關機功能,所以需要使用此功能,需要確認服務器配置或集成了ipmi芯片,并且已經配好了可訪問的ipmi地址:登陸到一臺管理節(jié)點上。計算節(jié)點批量開關機clusconf -p comput if管理節(jié)點批量開關機(多臺管理節(jié)點,需排除目前執(zhí)行命令節(jié)點):clusconf -p admin -n 2 3 4 -ifIO節(jié)點批量開關機:clusconf -p io -if關閉當前執(zhí)行命令節(jié)點shutdown -h now

17、機柜下電,將機柜PDU的空開撥至“OFF”狀態(tài),將機柜電源箱空開也撥至“OFF”狀態(tài)。機柜下電同時也關閉了網絡交換機、磁盤陣列、KVM等設備。clusconf 智能批量關機機clusconf 也可以根據(jù)集群不同節(jié)點的預定義角色,進行智能關機。登陸到一臺管理節(jié)點上。智能關機clusconf -iif關閉當前執(zhí)行命令節(jié)點shutdown -h now機柜下電,將機柜PDU的空開撥至“OFF”狀態(tài),將機柜電源箱空開也撥至“OFF”狀態(tài)。機柜下電同時也關閉了網絡交換機、磁盤陣列、KVM等設備。 操作系統(tǒng)維護集群所有節(jié)點均安裝Red Hat Enterprise Linux Server release

18、 5.6 (Tikanga) x86_64版操作系統(tǒng)。Red Hat Enterprise Linux操作系統(tǒng)的基本配置和管理可以參考其官方網站上的相關文檔,文檔下載地址: HYPERLINK /docs/en-US/Red_Hat_Enterprise_Linux/index.html /docs/en-US/Red_Hat_Enterprise_Linux/index.html另外,Linux操作系統(tǒng)常用的一些命令和工具的用法可以參考附錄。 用戶管理 添加用戶添加用戶需要使用root賬戶在管理節(jié)點上進行,需要確認添加的家目錄為共享目錄 $ clusconf -au username也可以使

19、用Linux自帶命令,添加完成后進行用戶同步useradd -m -d /public/home/username username clusconf -yu 刪除用戶刪除用戶也需要使用root賬戶在管理節(jié)點上進行. $ clusconf -du username也可以使用Linux自帶命令,刪除完成后進行用戶同步userdel -d /public/home/username username clusconf -yu共享存儲與文件系統(tǒng)管理存儲系統(tǒng)架構及連接參考1.6章節(jié),共享存儲。存儲系統(tǒng)的掛載命令一般添加于非IO節(jié)點的/etc/rc.local(suse操作系統(tǒng)位于/etc/init.d

20、/after.local) 中,可手動執(zhí)行掛載/etc/rc.local 中 相關命令,或者手動運行改文件。source /etc/rc.local作業(yè)調度系統(tǒng)管理作業(yè)調度相關的操作,比如新建、修改隊列、控制隊列優(yōu)先級,將某個用戶加入或移除某隊列,設置用戶資源限制等,可通過曙光Gridview管理軟件進行,在WEB瀏覽器地址欄中輸入以下URL: HYPERLINK http:/登陸IP:6080/gridview_portal http:/登陸IP:6080/gridview_portal出現(xiàn)登錄界面后,使用root賬戶登入,在Gridview的“作業(yè)調度”界面就可以進行相關管理和配置。曙光G

21、ridview集群管理軟件的使用可以參考Gridview用戶手冊。作業(yè)調度基本概念,請查看3.4章。gridvew集群監(jiān)控管理可利用gridview對集群進行監(jiān)控,告警設置、統(tǒng)計報表等工作。在WEB瀏覽器地址欄中輸入以下URL: HYPERLINK http:/登陸IP:6080/gridview_portal http:/登陸IP:6080/gridview_portal曙光Gridview集群管理軟件的使用可以參考Gridview用戶手冊。利用IPMI對集群進行管理圖形登陸管理節(jié)點,打開支持java的瀏覽器,輸入設置的IP,出現(xiàn)登錄界面:使用用戶名和密碼登錄后會出現(xiàn)主界面,然后用戶可以通過

22、點擊不同的按鈕實現(xiàn)相應的功能。圖2.3 登陸界面 http方式同樣支持開關機功能 、底層信息監(jiān)控、 事件日志、用戶及權限設置、網絡設置和KVMOver IP、虛擬媒體等功能。IPMI登陸地址,請參看1.5節(jié),節(jié)點主機名及IP地址。IPMI的登陸初始用戶名和密碼,參見下表,也可請詢問原廠商實施工程師。分類機器型號IPMI用戶名IPMI用戶密碼注釋刀片服務器刀片管理模塊adminaccess TC3600/TC4600 管理模塊CB65-G/CB85-G(空字符)(空字符)AMD 2路/4路刀片CB60-G10/CB60-G15adminadminTC4600 Intel 2路刀片CB60-G20

23、rootsuperuserTC3600 Intel 2路刀片Intel 4路及以上服務器I950r-GADMINADMINIntel 8路,支持E7-8800系列處理器I840-G10ADMINADMINIntel 4路,支持E5-4600系列處理器I840r-GP需要在BIOS中自行設置,沒有默認密碼Intel 4路,支持E7-4800系列處理器Intel 2路服務器I420-G10/I410-G10/I450-G10adminadminIntel 低端雙路,支持E5-2400系列處理器I620-G10:ADMINADMINIntel 高端雙路,支持E5-2600系列處理器I620-G15:

24、adminadminIntel 高端雙路,支持E5-2600系列處理器AMD 4路服務器A840r-GrootsuperuserAMD 2路服務器A620r-G/A420r-G adminadmin 附錄一Linux常用命令 瀏覽目錄命令用戶使用命令行所做的大部分工作是用來定位、列出、創(chuàng)建以及刪除文件和目錄,下面列舉最為常用的這類命令及其解釋,更為詳細的用法請參見Linux有關書籍。ls options directory 列出文件常用的命令參數(shù)選項有-l,-a,-t等。ls 代表 list。ls -la 給出當前目錄下所有文件的一個長列表,包括以句點開頭的隱藏文件。ls -l *.doc 列

25、出當前目錄下以字母.doc 結尾的所有文件。ls -a 顯示當前目錄所有文件及目錄。ls -d 將目錄像文件一樣顯示,而不顯示該目錄下的文件。ls -R 列出所有子目錄下的文件。ls -t 將文件依建立時間之先后次序列出。ls -ltr s* 列當前目錄下任何名稱是 s 開頭的文件,愈新的文件排愈后。cd directory 切換目錄cd 代表 change directory。cd 切換到用戶家目錄。cd /tmp 切換到目錄/tmp。cd . 切換到上一層目錄cd / 切換到系統(tǒng)根目錄cd /usr/bin 切換到/usr/bin 目錄。 瀏覽文件命令cat textfile 顯示文本文件

26、內容cat 代表 catenate。cat /etc/passwd 顯示文本文件 passwd 中的內容。cat test.txt | more 逐頁顯示 test.txt 文件中的內容。cat test.txt test1.txt 將 test.txt 的內容附加到 test1.txt 文件之后。cat a.txt b.txt readme.txt 將文件a.txt 和 b.txt 合并成 readme.txt 文件。more textfile 和 less textfile 逐屏顯示文本文件內容more 命令和 less 命令都是用于要顯示的內容會超過一個畫面長度的情況。more 命令讓畫

27、面在顯示滿一頁時暫停,此時可按空格健繼續(xù)顯示下一個畫面;而 less 命令除了可以按空格鍵向下顯示文件外,還可以利用上下鍵來卷動文件。二者都使用熱鍵 q 退出。more /etc/passwd 顯示 etc 目錄下文本文件 passwd 中的內容。ls -al | more 以長格形式顯示當前目錄下的所有內容,顯示滿一個畫面便暫停,可按空格鍵繼續(xù)顯示下一畫面。按熱鍵 q 退出。less /etc/named.conf 顯示 etc 目錄下文本文件 named.conf 中的內容。ls -al | less 以長格形式顯示當前目錄下的所有內容,用戶可按上下鍵瀏覽。按熱鍵 q 退出。head fi

28、les 和 tail files 查看文件前幾行和后幾行的內容head 和 tail 命令用于查看從文件頭或文件尾開始的指定數(shù)量的行的內容。head -10 /etc/passwd 顯示/etc/passwd 文件的前 10 行內容。tail -10 /etc/passwd 顯示/etc/passwd 文件的倒數(shù) 10 行內容。tail +10 /etc/passwd 顯示/etc/passwd 文件的從第 10 行開始到末尾的內容。head -20 file | tail -10 /etc/passwd 結合 head 與 tail 命令,顯示/etc/passwd 文件的第 11 行到第

29、20 行的內容。tail -f /usr/tmp/logs/daemon_log.txt 使用參數(shù) -f 時,tail 不會回傳結束信號,除非我們去自行去中斷它;相反地,它會一直不停地繼續(xù)顯示,直到發(fā)現(xiàn)文件自它最后一次被讀取后,又被加入新的內容時。一般用于監(jiān)視日志文件的動態(tài)更新,有實時監(jiān)視的效果。本例用于顯示/usr/tmp/logs/daemon_log.txt 文件的動態(tài)更新。 目錄操作命令pwd 顯示用戶目前所在的工作目錄的絕對路徑名稱。pwd 代表 print working directorymkdir -p directory 創(chuàng)建目錄mkdir 代表 make directory

30、。mkdir mydir 在當前目錄下建立 mydir 目錄。mkdir -p one/two/three 在當前目錄下建立指定的嵌套子目錄。rmdir -p directory 刪除目錄刪除“空”的子目錄。rmdir 代表 remove directory。rmdir mydir 刪除“空”的子目錄 mydir。rmdir -p one/two/three 刪除“空”的嵌套子目錄 one/two/three。注意:選項“-p”表示可以遞歸刪除多層子目錄,但刪除的目錄須為空目錄,且須具有對該目錄的寫入權限。 文件操作命令cp source target 復制文件將一個文件、多個文件或目錄復制到

31、另一個地方。cp 代表 copy。cp test1 test2 將文件 test1 復制成新文件 test2。cp test3 /home/bible/ 將文件 test3 從當前目錄復制到/home/bible/目錄中。cp -r dir1(目錄)dir2(目錄) 復制目錄 dir1 為目錄 dir2。-r 參數(shù)表示遞歸。注意:cp 命令默認將覆蓋已存在的文件,加 -i 參數(shù)表示覆蓋前將與用戶交互。mv source target 移動文件,文件改名將文件及目錄移到另一目錄下,或更改文件及目錄的名稱。mv 代表 move。mv afile bfile 將文件 afile 改名成新文件 bfi

32、le。mv afile /tmp 將文件 afile 從當前目錄移動到/tmp/目錄下。mv afile ./ 將文件 afile 移動到上層目錄。mv dir1 ./ 將目錄 dir1 移動到上層目錄。rm files 刪除文件或目錄刪除目錄需要加 -r 選項,強制刪除用 -f。rm 代表 remove。rm myfiles 刪除 myfiles 文件。rm * 刪除當前目錄下的所有未隱藏文件。rm -f *.txt 強制刪除所有以后綴名為 txt 文件。rm -rf mydir 刪除目錄 mydir 以及其下的所有內容.rm -ia* 刪除當前目錄下所有以字母a開頭的文件,-i 選項表示將

33、與用戶交互。ln -s source target 建立鏈接在文件和目錄之間建立鏈接,參數(shù) -s為建立軟鏈接(符號鏈接)。ln 代表 link。ln -s /usr/share/doc doc 創(chuàng)建鏈接文件doc,并指向目錄/usr/share/doc。ln -s afile linkafile 為文件afile 創(chuàng)建名為 linkafile 的軟鏈接ln afile bfile 為文件afile 創(chuàng)建名為 bfile 的硬鏈接ln /usr/share/test hard 創(chuàng)建一個硬鏈接文件 hard,這時對于 test 文件對應的存儲區(qū)域來說,又多了一個文件指向它。touch option

34、s filename 新建一個文本文件新建一個文本文件或修改文件的存取/修改的時間記錄值。touch * 將當前目錄下的文件時間修改為系統(tǒng)的當前時間。touch -d 20100101 test 將 test 文件的日期改為 2010 年 1 月 1 日。touch abc 若 abc 文件存在,則修改為系統(tǒng)的當前時間;若不存在,則生成一個為當前時間的空文件。file filename 查看 filename 文件的類型 查找類命令grep string file 在文件中搜索匹配的字符串位置(所在行)并輸出到屏幕grep 代表(global regular expression print,

35、全局正則表達式打印)。grep bible /etc/exports 查找文件/etc/exports 中包含字符串 bible 的所有行。grep -v # /etc/apache2/httpd.conf 在主Apache配置文件中,查找所有非注釋行。tail -100 /var/log/apache/access.log | grep 404 在Web服務器日志的后 100 行中查找包含字符串 404 的行,404 代表 Web 服務器的“文件沒找到”代碼。tail -100 /var/log/apache/access.log | grep v googlebot 在 Web 服務器的后

36、 100 行中,查看沒有被 Google 搜索引擎訪問的行。rpm -qa | grep httpd 搜索已安裝的rpm包中含有 httpd 字符串的文件名。find name filename 和 locate file 查找文件或目錄find 用來查找文件或目錄。locate 用于快速查找定位文件,但只能搜索文件名。find ./ -name httpd.conf 搜索當前目錄下名為 httpd.conf 的文件并顯示結果。find /etc -name httpd.conf 搜索/etc目錄下名為 httpd.conf 的文件并顯示結果。find . | grep page 在當前目錄及

37、其子目錄中,查找文件名包含字符串 page 的文件。locate traceroute 在系統(tǒng)任何地方查找文件名包含字符串 traceroute 的文件。whereis options 查找程序的源、二進制文件或手冊whereis 命令在指定的目錄中查找程序的源、二進制文件或手冊。whereis passwd 將和 passwd 文件相關的文件都查找出來。whereis -b passwd 只將二進制文件查找出來。 用法幫助命令man command 查看 command 命令的說明文檔man 代表 manual pagecommand -h 或 -help, -h, -help查看 comm

38、and 命令的說明文檔info command 查看 command 命令的說明文檔info 代表 informationwhatis command 在 whatis 資料庫(手冊)中搜尋指定命令的簡短描述。 打包、解包,壓縮、解壓縮命令tar options filename 打包命令。tar 代表 tape archive。它能夠將用戶所指定的文件或目錄打包成一個文件,但不做壓縮。一般 Linux/Unix 上常將打包命令 tar 與壓縮 gzip 聯(lián)合使用。Tar 不僅可以打包文件,也可以將硬盤數(shù)據(jù)備份。tar 命令常用參數(shù):-c:創(chuàng)建一個新 tar 文件-v:顯示運行過程的信息-f:

39、指定文件名-z:調用 gzip 壓縮命令進行壓縮或解壓-j:調用 bzip2 壓縮命令進行壓縮或解壓-t:查看壓縮文件的內容-x:解開 tar 文件-p:使用原文件的原來屬性(屬性不會依據(jù)使用者而變)tar -cvf test.tar * 將所有文件打包成 test.tar,擴展名 .tar 需自行加上。tar -zcvf test.tar.gz * 將所有文件打包并調用 gzip 命令壓縮成為 test.tar.gz。tar -tf test.tar 查看 test.tar 文件中包括了哪些文件。tar -xvf test.tar 將 test.tar 文件解開。tar -zxvf foo.

40、tar.gz 將 foo.tar.gz 解壓縮。tar -jxvf foo.tar.bz2 將 foo.tar.bz2 解壓縮。tar -cvf /tmp/etc.tar /etc 將整個/etc 目錄下的文件全部打包成為 /tmp/etc.tar。tar -zcvf /tmp/etc.tar.gz /etc 將整個/etc目錄下的文件全部打包并調用用 gzip 命令壓縮成為/tmp/etc.tar.gz。tar -zxvpf /tmp/etc.tar.gz /etc 將/etc/內的所有文件備份下來,并且保存其權限。參數(shù) -p 非常重要,尤其是當需要保留原文件的屬性時!gzip option

41、s filename 壓縮和解壓縮命令。通過壓縮減少文件大小有兩個明顯的好處,一是可以減少存儲空間,二是通過網絡傳輸文件時,可以減少傳輸?shù)臅r間。gzip 和 gunzip 是在 Linux 系統(tǒng)中經常使用的一個對文件進行壓縮和解壓縮的命令。gzip 代表 GNU zip。GNU 是 Gnu is Not Unix 的縮寫,GNUProject 是自由軟件基金會(Free Software Foundation)的一部分,它對 Linux 下的許多編程工具負責。各選項的含義:-c:將壓縮結果寫入到標準輸出上,原文件保持不變。缺省時 gzip 將原文件壓縮為.gz文件,并刪除原文件。-r:遞歸式地

42、查找指定目錄并壓縮其中的所有文件或者是解壓縮。-d:解壓縮指定文件。-t:測試壓縮文件的完整性。-v:對每一個壓縮和解壓的文件,顯示文件名和壓縮比。gzip usr.tar 壓縮一個文件 usr.tar,此時壓縮文件的擴展名為.tar.gz。gzip -v /mnt/lgx/a1.doc 壓縮文件/mnt/lgx/a1.doc,此時壓縮文件的擴展名為.gz。gzip -d /mnt/lgx/a1.doc.gz 解壓縮文件/mnt/lgx/a1.doc.gz 時間相關命令date 顯示/修改當前的系統(tǒng)時間date 查看系統(tǒng)當前時間。date 121010232009.10 將時間更改為12 月1

43、0 日10 點23 分10 秒2009 年月日時分年.秒。cal 顯示日歷cal 顯示當月日歷。cal 7 2007 顯示 2007 年 7 月份的日歷。cal 2010 顯示 2010 年全年的日歷。hwclock 顯示當前的硬件時鐘hwclock -show 查看硬件當前時鐘。hwclock -set -date=01/17/2010 13:26:00 設置硬件時鐘,格式hwclock -set -date=月/日/年 時:分:秒。hwclock -hctosys 硬件時鐘與系統(tǒng)時間同步。-hctosys 表示 Hardware Clock to SYStem clock。hwclock

44、-systohc 系統(tǒng)時間和硬件時鐘同步。ntpdate 同步網絡時鐘ntpdate 4 與ntp時間服務器進行時間同步。4 是中國國家授時中心的官方服務器。(需要安裝 ntp 的軟件包)。 系統(tǒng)信息類命令dmesg 顯示系統(tǒng)開機信息命令dmesg 代表 diagnostic message。顯示系統(tǒng)診斷信息、操作系統(tǒng)版本號、物理內存的大小以及其它信息。df 用于查看文件系統(tǒng)的各個分區(qū)的占用情況。df 代表 disk free。df -hl 查看磁盤剩余空間信息。df -T 顯示分區(qū)類型。fdisk 磁盤分區(qū)工具fdisk -l 顯示所有硬盤的分區(qū)情況。du options directory

45、 or filename 顯示指定的目錄或文件所占用的磁盤空間。du 代表 disk usagefree 查看系統(tǒng)內存,虛擬內存(交換空間)的大小占用情況who 或 w 查看當前系統(tǒng)中有哪些用戶登錄who 顯示登錄的用戶名、登錄終端和登錄時間。who -uH 帶有標題欄的登錄用戶的詳情,其中 u 選項指定顯示用戶空閑時間。 網絡通訊類命令ifconfig 顯示和設置網絡設備ifconfig eth0 將第一塊網卡的 IP 地址設置為 。ifconfig eth0 down 關閉第一塊網卡。ifconfig eth0 up 啟用第一塊網卡。ifconfig eth0 netmask 將第一塊網卡

46、的子網掩碼設置為。ifconfig eth0 netmask 同時設置 IP 地址和子網掩碼。ifconfig eth0 -broadcast 55 將第一塊網卡的廣播地址設置為55。route 顯示和設置路由route add gw 網關地址 增加一個默認路由。route del gw 網關地址 刪除一個默認路由。route 顯示當前路由表。ping options主機名/IP 地址,檢測是否能夠與遠端機器建立網絡通訊連接netstat options 查看網絡狀態(tài)netstat -i interface,顯示網絡界面信息表單。netstat -s statistice,顯示網絡工作信息統(tǒng)計

47、表。netstat -t tcp,顯示 TCP 傳輸協(xié)議的連接狀態(tài)。netstat -r route,顯示路由表。traceroute 遠程主機 IP 地址或域名 跟蹤路由ftp 文件傳輸telnet 主機名/IP 地址 登錄到遠程計算機finger 查詢遠程計算機(通常是運行 Linux/UNIX 的計算機)上用戶的詳細信息。 軟件包管理命令RPM 的全名是 Red Hat Package Manager。利用 RPM 命令,可以安裝、刪除、升級管理軟件,支持在線安裝和升級軟件。通過 RPM 包管理可以知道軟件包包含哪些文件,也可以查詢系統(tǒng)中的某個文件屬于哪個軟件包,可以查詢系統(tǒng)中的軟件包是

48、否安裝及安裝的版本。具體用法請參見 Linux 相關書籍。下面列舉一些rpm的基本用法。我們得到一個新軟件,在安裝之前,一般都要先查看一下這個軟件包是做什么的,可以用這條命令查看:rpm -qpi strace-4.5.18-10.13.x86_64.rpm系統(tǒng)將會列出這個軟件包的詳細資料。我們可以用下面這條命令查看軟件包將會在系統(tǒng)里安裝哪些文件:rpm -qpl strace-4.5.18-10.13.x86_64.rpm安裝該軟件包:rpm -ivh strace-4.5.18-10.13.x86_64.rpm如果系統(tǒng)已經安裝該軟件包的低版本,可以用下面的命令進行升級安裝:rpm -Uvh

49、 strace-4.5.18-10.13.x86_64.rpm安裝某個軟件時,RPM會自動處理包的依賴關系,如果不想進行依賴檢查,可以給rpm加上 -nodeps 參數(shù),想要強制安裝可以加上 -force 參數(shù)。卸載某個安裝過的軟件,只需執(zhí)行 rpm-e 命令即可。rpm -e strace如果不小心誤刪了某些包的系統(tǒng)文件,可以用下來命令查看有哪些文件損壞,以便進行修復安裝。rpm -Va下面這條命令行可以幫助我們快速判定某個文件是屬于哪個軟件包:rpm -qf 如果想查看當前系統(tǒng)已經安裝了哪些rpm包,可以執(zhí)行:rpm -qa也可以與 grep 聯(lián)用,進行查找操作:rpm -qa | gre

50、p strace 編輯器命令(vim)在 Linux 下編寫文本或語言程序,首先必須選擇一種文本編輯器。VIM編輯器是工作在字符模式下的高效率文本編輯器,它可以執(zhí)行輸出、刪除、查找、替換、塊操作等眾多文本操作,而且用戶可以根據(jù)自己的需要對其進行定制。在命令行里輸入vim即可調用VIM編輯器:vim 調用vim,可以進行編輯工作,編輯完成后可以保存到新文件;vim foo.txt 如果文件已經存在,則打開編輯,如果文件不存在,則新建編輯;VIM有幾種基本工作模式,在VIM里頭執(zhí)行 :help mode 可以看到VIM的所有模式,主要有如下幾種。Normal mode即通常所謂的命令模式,在此模式

51、使用 a、i、A、I、o、O 等進入Insert mode。Insert mode即通常所謂的編輯模式,在此模式使用 ESC 進入Normal mode或者Ctrl-o 臨時進入Normal mode。Command-line mode命令行模式,在Normal mode下按冒號進入,按ESC取消執(zhí)行命令或者回車執(zhí)行命令,然后回到Normal mode。Visual mode即選擇模式(注意跟用鼠標選擇不同),用v,V,C-v或C-q進入 Select mode鼠標選擇Replace mode在Normal mode下按R進入,按ESC返回Normal mode,相當于Windows下命令行中

52、按Insert鍵進入的覆蓋模式從VI/VIM中退出:按ESC確認返回到Normal mode,然后:wq保存并退出 :q!不保存并退出 :x退出,如果文件更改則保存 ZZ退出,如果文件更改則保存(按住Shift,再按兩次z)VIM的命令是非常具有美感的,下面是幾個例子:i在光標前插入;I在行首插入 a在光標后插入;A在行末插入 o在下一行插入;O在上一行插入 x刪除當前字符;X刪除前一個字符類似的還有b,B,ge,gE,w,W,e,E,f,F(xiàn),t,T,這些命令都可以用 :help cmdname查到幫助。dd刪除一行yy拷貝一行 h j k l 左下上右移動光標Ctrl-w h,Ctrl-w

53、j,Ctrl-w k,Ctrl-w l 切換到左下上右窗口VI/VIM的命令大多都可以帶一個數(shù)字前綴或者一個數(shù)字范圍,比如:5dd從當前行開始刪除5行 5yy從當前行開始拷貝5行 1,3d刪除1至3行 1,3y拷貝1至3行(.代表當前行,$代表最后一行)VIM的功能非常強大,想進一步了解和學習VIM,可以參考VIM相關文檔。 用戶管理命令useradd 添加用戶userdel 刪除用戶passwd 為用戶設置密碼usermod 修改用戶的登錄名、用戶的家目錄等id 查看用戶的 UID、GID 及所歸屬的用戶組pwck 校驗用戶配置文件/etc/passwd 和/etc/shadow 文件內容是

54、否合法或完整chfn 更改用戶信息工具??梢粤粝抡鎸嵉男彰⑥k公室、電話等資料。su 用戶切換工具。表示 substitute usersudo 通過另一個用戶來執(zhí)行命令(execute a command as another user)finger 查看用戶信息工具 用戶組管理命令groupadd 添加用戶組groupdel 刪除用戶組groupmod 修改用戶組信息groups 顯示用戶所屬的組grpck 校驗組賬號文件(/etc/group)和影子文件(/etc/gshadow)的一致性和正確性。 輸入/輸出重定向與管道命令commandoutputfile 輸出重定向輸出重定向是指把

55、命令(或可執(zhí)行程序)的標準輸出或標準錯誤輸出重新定向到指定文件中。這樣,該命令的輸出就不顯示在屏幕上,而是寫入到指定文件中。ls -lR dirtree.list 創(chuàng)建一個包含目錄樹列表的文件。command outputfile 輸出追加重定向為避免輸出重定向中指定文件只能存放當前命令的輸出重定向的內容,shell 提供了輸出重定向的一種追加手段。輸出追加重定向與輸出重定向的功能非常相似,區(qū)別僅在于輸出追加重定向的功能是把命令(或可執(zhí)行程序)的輸出結果追加到指定文件的最后,而該文件原有內容不被破壞。如果文件不存在,那么就創(chuàng)建它,如果存在,那么就追加到文件后邊。command1 | comma

56、nd2 把 command1 執(zhí)行的結果作為輸入送到 command2 中執(zhí)行。附錄二 使用clusconf 管理集群高性能集群三要素對于一個高性能集群,至少需要滿足三個要求:1 全網全通,實現(xiàn)rsh或ssh的無密碼訪問2 統(tǒng)一的用戶信息,可以通過同步用戶信息來實現(xiàn)或配置NIS來實現(xiàn)。3 統(tǒng)一的文件印象,可以通過nfs(或并行文件系統(tǒng))來實現(xiàn)。 clusconf功能介紹clusconf為一個設置集群并行環(huán)境的程序,能夠完成Linux系統(tǒng)下的整個集群的配置、管理。默認為根據(jù)/etc/hosts 表來認定集群中所有的節(jié)點,可以通過選項-p prefix和 -n number 來自己定義集群中的節(jié)點

57、包含功能: 集群配置功能為某個用戶設置ssh 無密碼訪問(-set-ssh|-ss)為所有用戶設置rsh 無密碼訪問(-set-rsh|-sr)按照集群規(guī)范設置服務 (-set-service|-sv)設置整個集群的nfs服務 (-set-nfs|-sf)按照預定的流程一鍵配置集群 (-set-all|-sa) 集群管理功能測試全網是否完全通過 (-test-net|-tn)顯示集群信息 (-sys-info|-si)顯示整個集群的cpu負載(負載大于5的進程) (-disp-cpu|-dc)同步整個集群的用戶 (-sync-user|-yu)添加一個用戶到整個集群 (-useradd|-ad

58、duser|-au|-ua username)刪除一個用戶到整個集群 (-deluser|-uerdel|-du|-ud username)同步整個集群的時間 (-sync-time|-yt)同步整個集群的某個文件 (-sync-file|-yf file|files|path|paths)在整個集群上執(zhí)行相同的命令 (-sync-do|-yd command) IPMI配置及管理功能配置ipmi IP地址(-set-ipmi|-si)顯示ipmi的IP地址及顯示電源狀態(tài)(-ipmi-info|-ii)IPMI遠程開機(-ipmi-poweron|-in)IPMI 遠程關機(-ipmi-pow

59、eroff|-if)IPMI 遠程智能開機,可根據(jù)集群的角色自動規(guī)劃開機順序(-ipmi-ipoweron|-iin)IPMI 遠程智能關機,可根據(jù)集群的角色自動規(guī)劃開機順序(-ipmi-ipoweroff|-iif)使用前要求1 整個集群中所有節(jié)點操作系統(tǒng)安裝好。2 整個集群中所有節(jié)點的網絡連接好,IP配置完成。 安裝和配置 安裝clusconf1 tar xvzf clusconf-1.4.tgz2 cd clusconf-1.43 ./install根據(jù)提示輸入安裝路徑,默認路徑為/opt/clusconf查看安裝路徑下是否有2個路徑 bin和etc載入環(huán)境變量4 source /etc

60、/profile.d/clusconf-env.sh5 which clusconf查看安裝路徑 配置/etc/hosts文件/etc/hosts 文件為域名解析服務設置文件,clusconf默認根據(jù)/etc/hosts中定義的節(jié)點(默認前綴為node)對整個集群進行操作和設置。/etc/hosts 文件設置規(guī)范如下假設某集群有30個計算節(jié)點,2個IO節(jié)點,1個管理節(jié)點,系統(tǒng)有1套(或2套)以太管理網,1套IB網絡,1套ipmi網絡,/etc/hosts表的設置規(guī)范如下:localhost node1 comput node2 comput2 .0 node30 comput301 node3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論