




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、并行環(huán)境安裝與調試 本文講解的是基于Red Hat Enterprise Linux 4為平臺的高性能計算集群安裝與調試,假設你使用過Red Hat Enterprise Linux 4并且理解了高性能計算的原理,所以本文稿的重點講解如何安裝與調試,關于高性能計算的原理請自行查閱相關的資料。 你可以拒絕學習 但你的競爭對手不會-杰克.韋爾奇QQ:11217404MAIL:pcstart特洛伊整理,轉載請保留,前言LINUX集群中的每個節(jié)點都有自己的處理器和內存,運行獨立的操作系統(tǒng),不能直接訪問其他節(jié)點的處理器,內存或其他設備。而MPI環(huán)境卻要求這樣的訪問,這就需要內部網絡和協(xié)議的支持。首先,每
2、個節(jié)點要能互訪,需進行基本網絡配置;其次,由于并行計算的特點,每個節(jié)點的計算程序是通常是相同的,只是所分配的計算區(qū)間不同。這就需要:(1)高效率的用戶身份驗證方法,并且能執(zhí)行用戶發(fā)出的計算指令。(2)每個計算節(jié)點能夠使用載入同一個計算程序,并能進行相應初始化。對于第一個要求,可通過網絡信息服務(NIS)和SHELL命令服務(RSH、SSH)實現(xiàn)。對于第二個要求,可以使用Linux的NFS文件系統(tǒng)實現(xiàn),將服務器節(jié)點的用戶文件讓所有計算共享。所以NIS、NFS、RSH、SSH是集群的基本網絡服務。1網絡信息服務(NIS)NIS是一個簡單的客戶機/服務器數(shù)據(jù)庫系統(tǒng),提供一個簡易網絡查詢服務。NIS是
3、網絡信息系統(tǒng)的簡稱,包含了網絡用戶的信息,由數(shù)據(jù)庫與處理程序構成,目的是為網絡上所有機器提供所需信息。數(shù)據(jù)庫建立在服務器上,用于統(tǒng)一管理集群中服務器和節(jié)點機的用戶信息,使得一個用戶可以登入集群中任何一臺節(jié)點機,而不需要管理員另外為用戶在每臺節(jié)點機上設置用戶和密碼。雖然NIS存在一定的安全隱患,但在內部網絡,安全問題不大。2遠程SHELL命令(RSH、SSH)基于MPI的并行計算需要在每個計算節(jié)點啟動并行計算任務,用戶需要登入每個節(jié)點,然后遞交計算任務。不過這通常效率比較低,那么,高效的做法是,不需要登入遠程機器,就可以在遠程機器上啟動并遞交計算任務,而RSH與SSH提供了這樣的機制。MPI安裝
4、于服務器節(jié)點,其啟動命令包含有在每個可供使用的節(jié)點機上啟動計算的批處理命令。NIS為節(jié)點機接受這樣的命令提供身份驗證機制,但是,遠程SHELL命令需要由程序來發(fā)出和響應。RSH與SSH就是這樣的程序。命令執(zhí)行之前,節(jié)點機檢查服務器是否有權限發(fā)出這樣的命令。之后,節(jié)點機通過/etc/hosts.equiv文件對服務器IP做可信賴檢查,通過檢查,就命令執(zhí)行;沒通過,則需口令才能執(zhí)行命令。對于集群來說,做的是高效率的并行計算,無口令登入,無疑帶來了更高的計算效率。 3網絡文件系統(tǒng)(NFS)并行任務啟動時,需要所有節(jié)點都能載入并行計算程序的執(zhí)行代碼。并行計算程序執(zhí)行代碼文件、輸入輸出數(shù)據(jù)文件等必須讓所
5、有節(jié)點機共享,這可以通過NFS實現(xiàn),用戶在任何節(jié)點登入,看到的是單一系統(tǒng)印象,感覺不到多臺計算機的存在。微機集群一般通過NFS來實現(xiàn)文件共享。NFS是一個可靠的協(xié)議,提供服務過程中不保留信息,客戶機出現(xiàn)問題,并不影響服務器。雖然NFS也存在比較大的安全隱患,但在內部網絡,問題就不明顯了。 4MPICH并行環(huán)境MPICH是Linux平臺下最重要的一種MPI實現(xiàn),是一個與MPI規(guī)范同步發(fā)展的版本。每當MPI標準推出新的版本時,MPICH就會有相應的實現(xiàn)版本。MPICH是一個MPI的庫,它提供了不同版本MPI的庫結構,編程人員可以使用MPICH來使用這些MPI接口,以便寫出適合自己的基于消息傳遞的并
6、行程序。編程人員使用C 或者是Fortran語言來調用這些標準庫,實現(xiàn)程序的并行性。MPICH使用的是MPI標準,所以它開發(fā)的程序可移植性很強,而且它提供統(tǒng)一的編程接口,所以程序的可開發(fā)性很強。本次測試就是MPICH的基礎實現(xiàn)的,所以我們將介紹如何的安裝和使用MPICH具體安裝步驟如下(以兩節(jié)點集群為例): 集群中各節(jié)點所安裝的系統(tǒng)為Red Hat Enterprise Linux 4 U3 32bit,在安裝操作系統(tǒng)時,預安裝所有軟件包,以免以后用到的軟件在重新安裝帶來的麻煩,在安裝服務器和節(jié)點機操作系統(tǒng)時,設置服務器和節(jié)點機的主機名分別為:node1,node2;其中node1充當服務器兼
7、管理節(jié)點和I/O節(jié)點,node2充當計算節(jié)點。node1的IP為:eth0: eth1:node2的IP為: eth0: eth1:配置完成后,可以用機群部署系統(tǒng)軟件(曙光DCIS)把node2的系統(tǒng)鏡像分發(fā)到其它計算節(jié)點上。NIS配置在一個大型的網域當中,如果有多部 Linux 主機時,萬一要每部主機都設定相同的賬號與密碼的設定,還真是啰唆。所以,適時的使用一部主要主機 ( master server ) 管理網域中的所有賬號,其它的主機則使用這部主要主機提供的賬號與密碼來達成讓使用者登入的作用即可!這樣的功
8、能有很多的服務器軟件可以達成,這里我們要介紹的則是 Network Information Services, NIS server 這個服務器軟件!NIS服務器具體配置1安裝NIS服務默認配置安裝的RedHat,其安裝程序會將NIS服務安裝在系統(tǒng)上,在RedHat中我們只需使用下面的命令檢查系統(tǒng)是否已經安裝了NIS服務:rootnode1 # rpm -qa |grep yp如果系統(tǒng)顯示有如下軟件包,表示NIS服務已經正確安裝yp-tools-2.8-1ypserv-2.8-1ypbind-1.12-1否則表示還沒有安裝NIS服務,在RedHat AS 4的第1張與第2張安裝光盤的/RedH
9、at/RPMS目錄有NIS服務器的RPM安裝包,該安裝包的文件名分別為ypserv-2.13-9.i386.rpm,yp-tools-2.8-7.i386.rpm, ypbind-1.17.2-8.i386.rpm 。放入光盤然后進行裝載,并使用下面的命令安裝:rootnode1 # mount -t iso9660 /dev/cdrom /mnt/cdromrootnode1 # rpm -ivh /mnt/cdrom/RedHat/RPMS/ypserv-2.13-9.i386.rpmrootnode1 # rpm -ivh /mnt/cdrom/RedHat/RPMS/yp-tools-
10、2.8-7.i386.rpm rootnode1 # rpm -ivh /mnt/cdrom/RedHat/RPMS/ypbind-1.17.2-8.i386.rpm注意:要提供NIS服務,必須安裝portmap服務,并且portmap服務是運行的,查看是否安裝與安裝方法同上,RedHat默認會安裝portmap服務。2配置NIS服務(1)啟動 portmap 并設定開機時啟動:rootnode1 # service portmap startrootnode1 # chkconfig -level 35 portmap on(2)啟動 time 與 time-udprootnode1 # v
11、i /etc/xinetd.d/time#將 disable = yes 改成 disable = no 即可!rootnode1 # vi /etc/xinetd.d/time-udp # 同樣的將 disable = yes 改成 disable = no 即可! rootnode1 # service xinetd restart rootnode1 # chkconfig -level 35 xinetd onrootnode1 # netstat -utl Active Internet connections (only servers) Proto Recv-Q Send-Q L
12、ocal Address Foreign Address State tcp 0 0 *:time *:* LISTEN tcp 0 0 *:sunrpc *:* LISTEN udp 0 0 *:time *:* udp 0 0 *:sunrpc *:*目前至少也要有上面四個 LISTEN 的 port 才行喔!分別是 UDP 與 TCP 封包的啦! (3) 建立 NIS 的領域名稱 ( nisdomainname )建立 NIS 的領域名稱 (我這里是設定為 cluster ): rootnode1 # nisdomainname cluster rootnode1 # vi /etc/r
13、c.d/rc.local # 將底下這一行加入這個檔案的最后一行: /bin/nisdomainname cluster 設定好網絡參數(shù): rootnode1 # vi /etc/sysconfig/network # 加入底下這一行: NISDOMAIN=cluster(3)建立網絡信任群組: rootnode1 # touch /etc/netgroup(4)啟動 ypserv 與yppasswdd,并且設定開機時啟動:rootnode1 # service ypservstart rootnode1 # service yppasswdd startrootnode1 # chkconf
14、ig -level 35 ypserv on rootnode1 # chkconfig -level 35 yppasswdd on(5)制作數(shù)據(jù)庫、并重新啟動 ypserv 與 yppasswd :rootnode1 # /usr/lib/yp/ypinit -mAt this point, we have to construct a list of the hosts which will run NIS servers. server.cluster is in the list of NIS server hosts. Please continue to add the name
15、s for the other hosts, one per line. When you are done with the list, type a . next host to add: node1 next host to add: =在這里按下ctrl + d跳出 The current list of NIS servers looks like this: node1Is this correct? y/n: y y We need a few minutes to build the databases. Building /var/yp/cluster/ypservers.
16、Running /var/yp/Makefile. gmake1: Entering directory /var/yp/cluster Updating passwd.byname. Updating passwd.byuid. Updating group.byname. Updating group.bygid. Updating hosts.byname. Updating hosts.byaddr. Updating rpc.byname. Updating rpc.bynumber. Updating services.byname. Updating services.byser
17、vicename. Updating netid.byname. Updating protocols.bynumber. Updating protocols.byname. Updating mail.aliases. gmake1: Leaving directory /var/yp/cluster node1 has been set up as a NIS master server. Now you can run ypinit -s node1 on all slave server.# 這個動作是每次修改使用者數(shù)據(jù)后一定要做的動作!,就是重新制作數(shù)據(jù)庫, rootnode1 #
18、 service ypserv restart rootnode1 # servcie yppasswdd restart# 然后并且需要重新啟動 ypserv 與 yppasswdd 喔! 3管理NIS服務啟動NIS服務rootnode1 # service ypserv start rootnode1 # service yppasswdd start停止NIS服務rootnode1 # service ypserv stoprootnode1 # service yppasswdd stop重新啟動NIS服務rootnode1 # service ypserv restartrootno
19、de1 # service yppasswdd restartNIS客戶機具體配置1安裝NIS服務默認配置安裝的RedHat,其安裝程序會將NIS服務安裝在系統(tǒng)上,在RedHat中我們只需使用下面的命令檢查系統(tǒng)是否已經安裝了NIS服務:rootnode1 # rpm -qa |grep yp如果系統(tǒng)顯示有如下軟件包,表示NIS服務已經正確安裝yp-tools-2.8-1ypserv-2.8-1ypbind-1.12-1否則表示還沒有安裝NIS服務,在RedHat AS 4的第1張與第2張安裝光盤的/RedHat/RPMS目錄有NIS服務器的RPM安裝包,該安裝包的文件名分別為ypserv-2.
20、13-9.i386.rpm,yp-tools-2.8-7.i386.rpm, ypbind-1.17.2-8.i386.rpm 。放入光盤然后進行裝載,并使用下面的命令安裝:rootnode1 # mount -t iso9660 /dev/cdrom /mnt/cdromrootnode1 # rpm -ivh /mnt/cdrom/RedHat/RPMS/ypserv-2.13-9.i386.rpmrootnode1 # rpm -ivh /mnt/cdrom/RedHat/RPMS/yp-tools-2.8-7.i386.rpm rootnode1 # rpm -ivh /mnt/cdr
21、om/RedHat/RPMS/ypbind-1.17.2-8.i386.rpm注意:要提供NIS服務,必須安裝portmap服務,并且portmap服務是運行的,查看是否安裝與安裝方法同上,RedHat默認會安裝portmap服務。2配置NIS服務(1)啟動 portmap 并設定開機時啟動:rootnode2 # service portmap startrootnode2 # chkconfig -level 35 portmap on(2) 設定 NIS Server 的 IP 對應主機名稱:rootnode2 # vi /etc/hosts # 要有底下這一行喔! 192.168.0.
22、1 node1 gnode1(3) 設定 NIS 的 domain 與 NIS 的主機: 建立 NIS domain name:rootnode2 # nisdomainname cluster rootnode2 # vi /etc/rc.d/rc.local # 加入底下這一行: /bin/nisdomainname cluster rootnode2 # vi /etc/sysconfig/network # 加入底下這一行: NISDOMAIN=cluster 建立 NIS 查尋的主機名稱:rootnode2 # vi /etc/yp.conf # 加入這兩行: d
23、omain cluster ypserver node1 #那個 cluster 是你的 NIS 的 domain ,至于 node1則是 NIS Server 的主機名稱(4) 修改密碼驗證的方式:密碼文件的修改: rootnode2 # vi /etc/passwd # 在這個檔案的最后面加入這一行: +: # 注意喔!在 + 之后連續(xù)加六個 : ,并且中間沒有空格符! 查尋密碼的程序: # 因為我們有很多方式來查尋密碼,需要修改 /etc/nsswitch.conf 這個檔案才行 rootnode2 # vi /etc/nsswitch.conf # 找到相關的參數(shù),并改成底下這樣: p
24、asswd: nis files shadow: nis files group: nis files hosts: nis files dns # 至于 nis 則是透過 NIS 來進行查尋# 這個檔案在設定一些信息的查尋程序!那個 files 指的是本機的相關檔案, 3管理NIS服務啟動 ypbind 與設定開機啟動:rootnode2 # service ypbind startrootnode2 # chkconfig -level 35 ypbind on4測試NIS服務 NIS Client 端檢驗 NIS 設定:yptest, ypwhich, ypcat在node2上運行ypt
25、est:rootnode2 # yptestTest 1: domainnameConfigured domainname is clusterTest 2: ypbindUsed NIS server: node1Test 3: yp_matchWARNING: No such key in map (Map passwd.byname, key nobody)(這里報錯,我也不知為什么)Test 4: yp_firstpc pc:$1$R0RKP5Vx$Wmu79QE1zt43v8L45Orsk1:500:501:/home/pc:/bin/bashTest 5: yp_nextTest
26、6: yp_masternode1Test 7: yp_order1156259277Test 8: yp_maplistprotocols.bynumbergroup.bygidservices.bynamepasswd.bynameypserversrpc.bynumberservices.byservicenamemail.aliasespasswd.byuidhosts.bynameprotocols.bynamerpc.bynamenetid.bynamegroup.bynamehosts.byaddrTest 9: yp_allpc pc:$1$R0RKP5Vx$Wmu79QE1z
27、t43v8L45Orsk1:500:501:/home/pc:/bin/bash1 tests failed#如果你看到以上信息,說明客戶端可以與服務器端正常工作。在node2上運行ypwhich:rootnode2 # ypwhichnode1rootnode2 #如果你看到以上信息,說明客戶端可以與服務器端正常工作。在node2上運行上運行ypcat:rootnode2 # ypcat passwdpc:$1$R0RKP5Vx$Wmu79QE1zt43v8L45Orsk1:500:501:/home/pc:/bin/bashrootnode2 #如果你看到以上信息,說明客戶端可以與服務器端
28、正常工作。NIS服務的配置也很簡單吧!其中node1為NIS服務器端,其它節(jié)點為NIS客戶端,以上的NIS服務器端配置在node1上進行,NIS客戶端配置在其它節(jié)點(如,node2,node3)上進行。在這里有一個特別說明的地方大家一定要注意,當你配置NIS服務成功后,不管你用哪個普通用戶(如本例中的pc)rsh到任何一個節(jié)點,都應是不用輸入用戶名與密碼的,不用在做其它配置!至此NIS服務配置完成!RSH配置在高性能計算集群中,每個節(jié)點都需要分擔一定的任務,而這些任務都是由執(zhí)行任務的主機發(fā)起的,剩余的節(jié)點通過遠程的通信協(xié)議來完成任務的接收和執(zhí)行。當前用于遠程通信的協(xié)議很多,其中比較出名的是SS
29、H(Secure Shell)和RSH。RSH是通過網絡將要執(zhí)行的命令分發(fā)給目的機,目的機在接收命令后根據(jù)用戶的情況和當前的環(huán)境判斷是否執(zhí)行發(fā)送來的命令。SSH是RSH的一種改進,RSH存在一種很大的缺陷那就是安全問題。RSH在發(fā)送命令時使用的是明文的方式,這樣一來命令在網絡中傳輸很容易被截獲,并且會被一些不法份子給竄改。出于這樣的原因,出現(xiàn)了現(xiàn)在比較流行的SSH,它是通過SSL的加密方式來發(fā)送數(shù)據(jù),這樣就避免了數(shù)據(jù)被偷竊和竄改的可能。RSH服務具體配置1安裝RSH服務默認配置安裝的RedHat,其安裝程序會將RSH服務安裝在系統(tǒng)上,在RedHat中我們只需使用下面的命令檢查系統(tǒng)是否已經安裝了
30、NFS服務:rootnode1 # rpm -qa |grep rsh如果系統(tǒng)顯示如下內容,表示NFS服務已經正確安裝rsh-0.17-25.3rsh-server-0.17-25.3否則表示還沒有安裝RSH服務,在RedHat AS 4的第2張與第4張安裝光盤的/RedHat/RPMS目錄分別有RSH服務客戶端與RSH服務器端的RPM安裝包,該安裝包的文件名分別為rsh-0.17-25.3.i386.rpm 與rsh-server-0.17-25.3.i386.rpm。放入光盤然后進行裝載,并使用下面的命令安裝:mount -t iso9660 /dev/cdrom /mnt/cdromrp
31、m -ivh /mnt/cdrom/RedHat/RPMS/rsh-0.17-25.3.i386.rpm (第2張)rpm -ivh /mnt/cdrom/RedHat/RPMS/rsh-server-0.17-25.3.i386.rpm (第4張)以上設置必須得在每一個節(jié)點上運行。2配置RSH服務編輯/etc/hosts.equiv (若不存在,請自行建立)如下: node1node2gnode1gnode2編輯/etc/hosts (若不存在,請自行建立)如下: localhost node1 node2
32、gnode1 gnode2編輯/root/.rhosts (若不存在,請自行建立,其中root為當前用戶目錄下)如下: node1node2gnode1gnode2編輯/etc/securetty文件,在末尾處新起一行加入:rexecrloginrsh 以上設置必須得在每一個節(jié)點上運行。3管理RSH服務啟動RSH服務/etc/rc.d/init.d/rsh start/etc/rc.d/init.d/rlogin start停止RSH服務/etc/rc.d/init.d/rsh stop/etc/rc.d/init.d/rlogin stop重新啟動RSH服務/etc/rc
33、.d/init.d/rsh restart/etc/rc.d/init.d/rlogin restart自動啟動RSH服務chkconfig level 35 rexec onchkconfig level 35 rlogin onchkconfig level 35 rsh on以上設置必須得在每一個節(jié)點上運行。4測試RSH服務首先,在RSH服務器端保證RSH服務啟動,運行如下命令:rootnode1 # rsh node2如果你能看到以下信息,說明RSH服務配置成功,并且不用密碼可以登陸其它節(jié)點。connect to address : Connection refu
34、sedTrying krb4 rlogin.connect to address : Connection refusedtrying normal rlogin (/usr/bin/rlogin)Last login: Fri Aug 25 17:11:38 from node1You have mail.rootnode2 #我想大家都看明白了吧,每個節(jié)點既是RSH服務器,又可充當RSH客戶機,最后要達到的效果是在任何一節(jié)點rsh到任何一節(jié)點上,都能成功并且不需要輸入用戶名與密碼。至此RSH服務配置完成!SSH配置在高性能計算集群中,每個節(jié)點都需要分擔一定的任務,而這
35、些任務都是由執(zhí)行任務的主機發(fā)起的,剩余的節(jié)點通過遠程的通信協(xié)議來完成任務的接收和執(zhí)行。當前用于遠程通信的協(xié)議很多,其中比較出名的是SSH(Secure Shell)和RSH。RSH是通過網絡將要執(zhí)行的命令分發(fā)給目的機,目的機在接收命令后根據(jù)用戶的情況和當前的環(huán)境判斷是否執(zhí)行發(fā)送來的命令。SSH是RSH的一種改進,RSH存在一種很大的缺陷那就是安全問題。RSH在發(fā)送命令時使用的是明文的方式,這樣一來命令在網絡中傳輸很容易被截獲,并且會被一些不法份子給竄改。出于這樣的原因,出現(xiàn)了現(xiàn)在比較流行的SSH,它是通過SSL的加密方式來發(fā)送數(shù)據(jù),這樣就避免了數(shù)據(jù)被偷竊和竄改的可能。SSH服務器具體配置1安裝
36、SSH服務:默認配置安裝的RedHat,其安裝程序會將RSH服務安裝在系統(tǒng)上,在RedHat中我們只需使用下面的命令檢查系統(tǒng)是否已經安裝了SSH服務:rootnode1 # rpm -qa |grep ssh如果系統(tǒng)顯示如下內容,表示SSH服務已經正確安裝openssh-clients-3.9p1-8.RHEL4.9openssh-askpass-3.9p1-8.RHEL4.9openssh-server-3.9p1-8.RHEL4.9openssh-askpass-gnome-3.9p1-8.RHEL4.9openssh-3.9p1-8.RHEL4.9否則表示還沒有安裝SSH服務,在RedH
37、at AS 4的第2張與第4張安裝光盤的/RedHat/RPMS目錄分別有SSH服務客戶端與SSH服務器端的RPM安裝包,放入光盤然后進行裝載,并使用下面的命令安裝:mount -t iso9660 /dev/cdrom /mnt/cdromrpm -ivh /mnt/cdrom/RedHat/RPMS/openssh-clients-3.9p1-8.RHEL4.9.i386.rpmrpm -ivh /mnt/cdrom/RedHat/RPMS/openssh-askpass-3.9p1-8.RHEL4.9.i386.rpmrpm -ivh /mnt/cdrom/RedHat/RPMS/ope
38、nssh-server-3.9p1-8.RHEL4.9.i386.rpmrpm -ivh /mnt/cdrom/RedHat/RPMS/openssh-askpass-gnome-3.9p1-8.RHEL4.9.i386.rpmrpm -ivh /mnt/cdrom/RedHat/RPMS/openssh-3.9p1-8.RHEL4.9.i386.rpm2配置SSH服務在node1生成SSH秘鑰對:rootnode1 # ssh-keygen -t rsa 一路回車即可查看是否有.ssh文件夾:rootnode1 # ls a進入.ssh目錄rootnode1 # cd .sshrootnod
39、e1 .ssh#生成authorized_keys文件:rootnode1 .ssh# cp id_rsa.pub authorized_keys建立本身的信任連接:rootnode1 .ssh# ssh node1 按提示輸入yes(三個字母要打全)設置node2(node2的root目錄下) rootnode2 #ssh-keygen -t rsa 生成.ssh文件夾 rootnode2 #rcp node1:/root/.ssh/* /root/.ssh 拷貝node1上的.ssh文件夾覆蓋本地的 rootnode2 #ssh node1 提示處輸入yes回車 確認兩臺機器的信任連接已建
40、立 對每個節(jié)點執(zhí)行: #ssh node01 #ssh node02 在提示處輸入yes回車,最后確定無需輸入密碼并且沒有任何提示信息即可登陸(Last login:時間日期提示信息除外) 3管理SSH服務啟動SSH服務/etc/rc.d/init.d/sshd start停止SSH服務/etc/rc.d/init.d/sshd stop重新啟動SSH服務/etc/rc.d/init.d/sshd restart自動啟動SSH服務chkconfig -level 35 sshd on以上設置必須得在每一個節(jié)點上運行。4測試SSH服務:首先,在SSH服務器端保證RSH服務啟動,運行如下命令:ro
41、otnode1 # ssh node2如果你能看到以下信息,說明SSH服務配置成功,并且不用密碼可以登陸其它節(jié)點。Last login: Sat Aug 26 19:39:21 2006 from node1rootnode2 #我想大家都看明白了吧,每個節(jié)點既是SSH服務器,又可充當SSH客戶機,最后要達到的效果是在任何一節(jié)點ssh到任何一節(jié)點上,都能成功并且不需要輸入用戶名與密碼。至此SSH服務配置完成!NFS配置編輯文件NFS文件輸出表文件/etc/exports,輸出/usr/local和/home文件讓節(jié)點機共享。其中/usr/local用于安裝MPI并行環(huán)境和存放其他公用程序。/h
42、ome是普通用戶登錄目錄,通過這樣的機制,可以統(tǒng)一集群中的應用程序目錄及用戶目錄,更體現(xiàn)集群的單一系統(tǒng)印象。雖然NFS可以在網絡中進行文件共享。但是NFS協(xié)議本身并沒有提供數(shù)據(jù)傳輸?shù)墓δ?,它必須借助于過程調用(RPC)協(xié)議來實現(xiàn)數(shù)據(jù)的傳輸。RPC定義了一種進程間通過網絡進行交互通信的機制,它允許客戶端進程通過遠程服務器上的服務進程請求服務,而不需要了解底層通信協(xié)議的細節(jié)。 NFS服務器具體配置1安裝NFS服務默認配置安裝的RedHat,其安裝程序會將NFS服務安裝在系統(tǒng)上,在RedHat中我們只需使用下面的命令檢查系統(tǒng)是否已經安裝了NFS服務:rootnode1 root# rpm -qa |
43、grep nfs如果系統(tǒng)顯示如下內容,表示NFS服務已經正確安裝nfs-utils-1.0.6-46否則表示還沒有安裝NFS服務,在RedHat AS 4的第2張安裝光盤的/RedHat/RPMS目錄有NFS服務器的RPM安裝包,該安裝包的文件名為nfs-utils-1.0.6-46.i386.rpm 。放入光盤然后進行裝載,并使用下面的命令安裝:mount -t iso9660 /dev/cdrom /mnt/cdromrpm -ivh /mnt/cdrom/RedHat/RPMS/nfs-utils-1.0.6-46.i386.rpm2配置NFS服務編輯/etc/exports文件內容如下
44、: /home *(rw,sync,no_root_squash)/usr/local *(rw,sync,no_root_squash) 3管理NFS服務啟動NFS服務/etc/rc.d/init.d/nfs start停止NFS服務/etc/rc.d/init.d/nfs stop重新啟動NFS服務/etc/rc.d/init.d/nfs restart自動啟動NFS服務chkconfig level 35 nfs on4測試NFS服務首先,在服務器端保證NFS服務啟動,使用下面的命令來查看NFS服務器的共享使用和相關的配置信息showmount -e 服務器IP也可以輸入:showmou
45、nt -a 服務器IP查看nfs共享在客戶端的加載情形。NFS客戶機具體配置編輯/etc/fstab文件,使節(jié)點機啟動時自動掛載NFS服務器輸出的文件目,在該文件中加入: node1:/home /home nfs defaults 0 0node1:/usr/local /usr/local nfs defaults 0 0 可用mount 命令,測試是否能掛載NFS服務器上的輸出文件目錄 mount -t nfs node1:/home /home 若正確,進入節(jié)點機/home 目錄,可看到服務器上的/home 目錄 。這個NFS也比較簡單了,我們的目地是以node1充當NFS的服務器端,
46、其它節(jié)點充當NFS的客戶端,因此以上的服務器端配置需要在node1上進行,客戶機的配置需要在所有其它節(jié)點機上進行,以達到所以節(jié)點機啟動時能自動掛載node1上的/home與/usr/local目錄,并且對這些目錄有讀寫的權限!至此NFS服務配置完成!MPICH1配置我們要讓我們的集群發(fā)揮它的效能就必須讓它能夠執(zhí)行并行程序,而我們要執(zhí)行并行程序就必須使用并行運算軟件,MPICH是MPI的一種實現(xiàn),下面就介紹安裝的方法。(本次使用的mpich-1.2.7.tar版本的)MPICH1具體配置1安裝MPICH1從/mpi/mpich/index.ht
47、m下載MPICH1安裝包,這里我們下載到/root/mpich1目錄里,并安裝到node1上。rootnode1 mpich1# tar zxvf mpich-1.2.7.tar#解壓mpich-1.2.7.tarrootnode1 mpich1# cd mpich-1.2.7#進入到mpich-1.2.7.tar目錄里rootnode1 mpich-1.2.7# mkdir /usr/local/mpich-1.2.7#建立安裝目錄/usr/local/mpich-1.2.7rootnode1 mpich-1.2.7./configure -prefix=/usr/local/mpich-1
48、.2.7| tee configure.log#配置mpich-1.2.7的安裝目錄rootnode1 mpich-1.2.7make | tee make.log#建筑mpich-1.2.7rootnode1 mpich-1.2.7make install | tee install.log#安裝mpich-1.2.72配置MPICH1編輯/etc/profile,在文件的最后新起一行,新建以下一行如下: PATH=/usr/local/mpich-1.2.7/bin:$PATH#增加mpich1的環(huán)境變量rootnode1 mpich-1.2.7#source /etc/profile#使
49、環(huán)境變量立即生效環(huán)境變量設置完成后,我們需要測試環(huán)境變量設置是否成功,用如下命令:rootnode1 mpich-1.2.7# which mpirun/usr/local/mpich-1.2.7/bin/mpirun如果顯示以上信息,表示設置環(huán)境變量已成功。3測試MPICH13.1 單節(jié)點測試rootnode1 mpich-1.2.7cd /usr/local/mpich-1.2.7/examples#進到/usr/local/mpich-1.2.7/examplesrootnode1 mpich-1.2.7make#Make一下生成算例,如cpi等執(zhí)行如下命令:rootnode1 mpic
50、h-1.2.7mpirun np 4 cpi 如果你看到如下信息,表示安裝成功:Process 1 on node1Process 2 on node1Process 3 on node1Process 0 on node1pi is approximately 3.1416009869231249, Error is 0.0000083333333318wall clock time = 0.0000003.2 多節(jié)點測試rootnode1 mpich-1.2.7 vi /usr/local/mpich-1.2.7/share/machines.LINUX#編輯machines.LINUX文
51、件,內容如下:# Change this file to contain the machines that you want to use# to run MPI jobs on. The format is one host name per line, with either# hostname# or# hostname:n# where n is the number of processors in an SMP. The hostname should# be the same as the result from the command hostnamenode1 在這里,要加
52、上所有的計算節(jié)點,本機為node1,要加入node2、node3等node2rootnode1 mpich-1.2.7 cd /usr/local/mpich-1.2.7/examples#回到/usr/local/mpich-1.2.7/examplesrootnode1 examples# mpirun -np 8 cpi -machinefile#執(zhí)行mpirun -np 8 cpi machinefile,如看到以下信息,說明配置正確!Process 2 on node1Process 6 on node1Process 4 on node1Process 0 on node1Proc
53、ess 1 on node2Process 7 on node2Process 5 on node2Process 3 on node2pi is approximately 3.1416009869231249, Error is 0.0000083333333318wall clock time = 0.003906如果你能看到以上信息,說明MPICH1配置成功,至此MPICH1服務配置完成!MPICH2配置我們要讓我們的集群發(fā)揮它的效能就必須讓它能夠執(zhí)行并行程序,而我們要執(zhí)行并行程序就必須使用并行運算軟件,MPICH是MPI的一種實現(xiàn),下面就介紹安裝的方法。(本次使用的mpich2-1.0.4p1.tar版本的)當前的最新版本。MPICH2具體配置1安裝MPICH2從/mpi/mpich/index.htm下載MPICH2安裝包,這里我們下載到/root/mpich2目錄里,并安裝到node1上。rootnode1 mpich2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 幼兒園戶外活動的教研探討計劃
- 第19課 探索宇宙(教學設計)-2023-2024學年六年級科學下冊同步備課(青島版)
- 加強倉庫流程管理的實施方案計劃
- 《貴州創(chuàng)泰礦業(yè)有限公司修文縣龍場鎮(zhèn)高倉老二洞鋁鐵礦山礦產資源綠色開發(fā)利用方案(三合一)》評審意見
- (高清版)DB3715∕T 7-2022 黑水虻飼養(yǎng)技術規(guī)程
- 統(tǒng)編版小學語文二年級下冊第3課《開滿鮮花的小路》精美課件
- Unit 7 Days and Months Lesson 5 colorful seasons 教學設計 2024-2025學年冀教版(2024)七年級英語上冊
- 固態(tài)電池知識培訓課件
- 能源行業(yè):石油工程師簡歷
- 初中體育與健康 初二上 水平四 八年級(第一學期)籃球大單元教學設計+體前變向換手運球突破投籃教學設計
- 2024年03月中國工商銀行湖南分行2024年度春季校園招考筆試歷年參考題庫附帶答案詳解
- 員工離職面談記錄表范本
- 2025年青島市技師學院招考聘用48人高頻重點提升(共500題)附帶答案詳解
- 2024年08月澳門2024年中國銀行澳門分行校園招考筆試歷年參考題庫附帶答案詳解
- 110KV-GIS設備技術要求
- 《從外觀看豬病診治》課件
- 2024年度城市規(guī)劃與交通設計院深度合作框架協(xié)議3篇
- 李四光《看看我們的地球》原文閱讀
- GA/T 1740.2-2024旅游景區(qū)安全防范要求第2部分:湖泊型
- 2025屆高考數(shù)學專項復習:阿基米德三角形【六大題型】含答案
評論
0/150
提交評論