![Sparkonyarn集群搭建詳細過程_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-4/17/089439af-9980-483f-9423-f00cd7976c05/089439af-9980-483f-9423-f00cd7976c051.gif)
![Sparkonyarn集群搭建詳細過程_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-4/17/089439af-9980-483f-9423-f00cd7976c05/089439af-9980-483f-9423-f00cd7976c052.gif)
![Sparkonyarn集群搭建詳細過程_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-4/17/089439af-9980-483f-9423-f00cd7976c05/089439af-9980-483f-9423-f00cd7976c053.gif)
![Sparkonyarn集群搭建詳細過程_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-4/17/089439af-9980-483f-9423-f00cd7976c05/089439af-9980-483f-9423-f00cd7976c054.gif)
![Sparkonyarn集群搭建詳細過程_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-4/17/089439af-9980-483f-9423-f00cd7976c05/089439af-9980-483f-9423-f00cd7976c055.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、SparkonYarn集群搭建詳細過程由于最近學習大數(shù)據(jù)開發(fā),spark作為分布式內存計算框架,當前十分火熱,因此作為首選學習技術之一。Spark官方提供了三種集群部署方案:Standalone,Mesos,Yarn其中Standalone為spark本身提供的集群模式,搭建過程可以參考官網,本文介紹SparkonYarn集群部署過程。使用3臺普通機器搭建Spark集群,軟件環(huán)境:Ubuntu16.04LTSUbuntu16.04LTSCentOS7Scala-2.10.6Hadoop-2.7.2spark-1.6.1-bin-hadoop2.6Java-1.8.0_77硬件環(huán)境:一個Mast
2、er節(jié)點Intel?Core?i5-2310CPU2.90GHz乂44G內存300G硬盤兩個Slave節(jié)點Intel?Core?i3-2100CPU3.10GHz乂44G內存500G硬盤、配置/etc/hosts及免密碼登錄本文下載安裝的軟件都放在home目錄下1.主機hosts文件配置在每臺主機上修改host文件01B.199.92.225218.199+92.22627210,199.92.222127*0*0*1fang-Lenovofang-centosfang-ubuntulfang-inacbookPro.locallocalhostloc
3、alhost#ThefollowinglinesaredesirableforIPv6capablehosts:ff00:off02:vpfi-locathostip6-loopbacktpe-localnettp6*ncastprefixlp6-allrouterssudovim/etc/hosts27fang-ubuntu1(Master)26fang-centos(Slave)25fang-Lenovo(Slave)localhostlocalhost注:若此地未配置,或者未配置正
4、確會導致集群啟動不正?;蛘呤∨渲弥髉ing一下各機器名稱檢查是否生效,例如sshfangfang-centos2,配置SSH免密碼登錄如果沒有安裝ssh,需要安裝Opensshserver,命令為sudoapt-getinstallopenssh-server1)在所有機器上都生成私鑰和公鑰ssh-keygen-trsa路回車2)需要讓機器間都能相互訪問,就把每個機子上的id_rsa,pub發(fā)給master節(jié)點,傳輸公鑰可以用scp來傳輸。scp/.ssh/id_rsa.pubfangfang-ubuntu1:/.ssh/id_rsa.pub.slave13)在master上,將所有公鑰加
5、到用于認證的公鑰文件authorized_keys中cat/.ssh/id_rsa.pub*-/.ssh/authorized_keys4)將公鑰文件authorized_keys分發(fā)給每臺slavescp-/.ssh/authorized_keysfangfang-centos:/.ssh/5)在每臺機子上驗證SSH無密碼登錄fangfang-ubuntui:-$sshfangfang-centosLastlogtn:FrtApr291S:24:OS2016fangfangcentos-$|在終端中輸入登錄命令,例如:sshfangfang-centos如果直接登錄成功而不需要登錄密碼,則表
6、示設置正確;如果登錄不成功,即仍然需要登錄密碼,則可能需要修改文件authorized_keys的權限。注:.ssh文件夾的權限必須為700,authorized_keys文件權限必須為600使用如下命令改變文件夾權限:chmod600/.ssh/authorized_keys二、安裝Java從官網下載最新版Java,Spark官方說明Java只要是6以上的版本都可以,本文使用的是jdk-8u91-linux-x64.tar.gz。在下載目錄下直接解壓tar-zcvfjdk-8u91-linux-x64.tar.gz并復制文件到/usr/lib/jvm中,命令如下:sudocp-rjdk1,8
7、.0_77/usr/lib/jvm(如果沒有jvm文件夾,則手動創(chuàng)建一個),修改環(huán)境變量sudovim/etc/profile,添加下列內容:exportJAVA_HOME=/usr/lib/jvm/jdk1.8,0_77exportJRE_HOME=$JAVA_HOME/jreexportPATH=$JA/A_HOME/bin:$JAVA_HOME/jre/bin:$PATHexportCLASSPATH=$CLASSPATH:.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib然后使環(huán)境變量生效,并驗證Java是否安裝成功$source/etc/profile#生效環(huán)境變
8、量$java-version#如果打印出如下版本信息,則說明安裝成功fangfang-centos$java-versionjavaversionM1.8.0_77lbJava(TM)SERuntimeEnvironment(build1.S.G_77-b&3)JavaHot$pot(TM)64-BttServerVM(build25-77-b031ntxedmode)fangfang-centos|三、安裝ScalaSpark官方要求Scala版本為2.10.x,注意不要下錯版本,我這里下了2.10.6同樣我們在/中解壓tar-zcvfscala-2.10.6.tar.gz再次修改環(huán)境變量s
9、udovim/etc/profile,添加以下內容:exportSCALA_HOME=/home/fang/scala-2.10.6exportPATH=$PATH:$SCALA_HOME/bin同樣的方法使環(huán)境變量生效,而僉證scala是否安裝成功$source/etc/profile#生效環(huán)境變量$scala-version#如果打印出如下版本信息,則說明安裝成功。fanggfang-centosscala-verstonScalacoderunnerverston2.10.6-Copyright2S62-2013,LAWP/EPFLfarigfang-centos$)四、安裝配置Hado
10、opYARN從官網下載hadoop2.7.2版本,在用戶根目錄解壓tar-zcvfhadoop-2.7.2.tar.gz再次修改環(huán)境變量sudovim/etc/profile,添加以下內容:exportHADOOP_HOME=/home/fang/hadoop-2.7.2exportHADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoopexportYARN_HOME=/home/fang/hadoop-2.7.2exportYARN_CONF_DIR=$YARN_HOME/etc/hadoop同樣的方法使環(huán)境變量生效$source/etc/profile#生效環(huán)境變量注
11、:有時候修改了/etc/profile文件,執(zhí)行命令source之后還是不能達到正常的效果,則需要重新機器,看問題是否能解決。酉己置Hadoop,cd/hadoop-2.7.2/etc/hadoo剛入hadoop酉己置目錄,需要酉己置有以下7個文件:hadoop-env.shyarn-env.sh,slaves,core-site.xml,hdfs-site.xml,maprd-site.xml,yarn-site.xml。在hadoop-env.sh中酉己置JAVA_HOME# Thejavaimplementationtouse.exportJAVA_HOME=/usr/lib/jvm/j
12、dk1.8.0_77在yarn-env.sh中酉己置JAVA_HOME# someJavaparametersexportJAVA_HOME=/usr/lib/jvm/jdk1.8.0_77在slaves中配置slave節(jié)點的ip或者host,fang-centosfang-Lenovo修改core-site.xmlfs.defaultFShdfs:/fang-ubuntu1:9000/hadoop.tmp.dirfile:/home/fang/hadoop-2.7.2/tmp修改node.secondary.http-addressfang-ubun
13、tu1:9001.dirfile:/home/fang/hadoop-2.7.2/dfs/namedfs.datanode.data.dirfile:/home/fang/hadoop-2.7.2/dfs/datadfs.replication3修改yarn修改yarn-site.xmlyarn.nodemanager.aux-servicesmapreduce_shuffleyarn.nodemanager.aux-services.mapreduce.shuffle.classo
14、rg.apache.hadoop.mapred.ShuffleHandleryarn.resourcemanager.addressfang-ubuntu1:8032yarn.resourcemanager.scheduler.addressfang-ubuntu1:8030yarn.resourcemanager.resource-tracker.addressfang-ubuntu1:8035yarn.resourcemanager.admin.addressfang-ubuntu1:8033yarn.resourcemanager.webapp.addressfang-ubuntu1:8
15、088將配置好的hadoop-2.7.2文件夾分發(fā)給所有slaves節(jié)點scp-r/hadoop-2.6.0fangfang-centos:/啟動Hadoop在master節(jié)點上執(zhí)行以下操作,就可以啟動hadoop了。cd/hadoop-2.7.2#進入hadoop目錄bin/hadoopnamenode-format#格式化namenode注:若格式化之后重新修改了配置文件,重新格式化之前需要刪除tmp,dfs,10gs文件夾。sbin/start-dfs.sh#啟動dfssbin/start-yarn.sh#啟動yarn驗證Hadoop是否安裝成功,可以通過jps命令查看各個節(jié)點啟動的進程
16、是否正常。在master上應該有以下幾個進程:fangfang-ubuntul:jps11889NameNode11S22Master12919DataNode12264NodeManager12395Jps12155SecondaryNaneNode在每個slave上應該有以下幾個進程:fangfang-cento5jps16513DataNode17607Jps17656NodeManager在瀏覽器中輸入http:/fang-ubuntu1:8088,可以看到hadoop的管理界面三二|岫取Ahaurnd亡5UBM1TTE口auczm口riNiHHrnfAiirnKIP門Clu44erM
17、eme%Apps-AppflApps-即g口KtEtraMenwryVComVCctwVCqmActv七Oeoeekknic4LeIUnhutTRwidngR%Jmpteud艮仆川Lk4dT2INnlRourv4dIWkNod”hkdMModwaC-C0.口日部由口B024D3Q口口QScheddcfMBtiicsSdwutefTyptiEuduiir4T,|MlArwuiHiMbZMknMdiifYiumAloeAUXiCdipiciySchuMwMEMORYmwnfif1Q34liCatk-nnMMyAISIZvCdmcio.xMadaNodeAdd皿NodeHUP.x,4CfTiiiiw
18、i出VComVDuuVanfaxLobd:Rode,與咖,:,加好4s;LBnhearthulE.;Uq.如一;Scheduler心應場RUNNING府性物麻網五四月及俯,Q值00685U0也了7iFKk的twWZFN整循*TgW小的如RUNNING為附物比iKieE四目粉伸則?07008GB屯fi172rackubunijlisaes3iui皎心3016陽ahhil.RUNNING&ng.也叫星國元國同2916.411:07003BGBDH27JmckLflfKW:l?*5S.unowHlSOd3015Showingla31Hmln1_叫聚4g::NodesoftheclustercbZia
19、.WSJ222r:gC4fdusftrr/hade&五、Spark安裝下載解壓,進入官方下載地址下載最新版Spark。我下載的是spark-1.6.1-bin-hadoop2.6.tar.gz在/目錄下解壓,tar-zcvfspark-1.6.1-bin-hadoop2.6.tar.gz配置Sparkcdspark-1.6.1-bin-hadoop2.6/conf#入spark配置目錄cpspark-env.sh.templatespark-env.sh#從酉己置模板復制vimspark-env.sh#添加配置內容在spark-env.s時尾添加以下內容(這是我的配置,你可以自行修改):exp
20、ortSPARK_HOME=/home/fang/spark-1.6.1-bin-hadoop2.6exportSCALA_HOME=/home/fang/scala-2.10.6exportJAVA_HOME=/usr/lib/jvm/jdk1.8.0_77exportHADOOP_HOME=/home/fang/hadoop-2.7.2exportPATH=$PATH:$JAA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$SCALA_HOME/binexportHADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoopexp
21、ortYARN_CONF_DIR=$YARN_HOME/etc/hadoopexportSPARK_MASTER_IP=27SPARK_LOCAL_DIRS=/home/fang/spark-1.6.1-bin-hadoop2.6SPARK_DRIVER_MEMORY=1GexportSPARK_LIBARY_PATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$HADOOP_HOME/lib/native注:在設置Worker進程的CPU個數(shù)和內存大小,要注意機器的實際硬件條件,如果配置的超過當前Worker節(jié)點的硬件條件,Worker進
22、程會啟動失敗。vimslaves在slaves文件下填上slave主機名:slave1slave2將配置好的spark-1.6.1-bin-hadoop2.6文件夾分發(fā)給所有slaves吧scp-r/spark-1.6.1-bin-hadoop2.6fangfang-cenos:/啟動Spark,sbin/start-all.sh驗證Spark是否安裝成功主節(jié)點上啟動了Master進程:fangfdng-ubuntul:-/spark-l.6rl-btn-hadoop2*6/sbin$jps11522Master在slave上啟動了Worker進程:fanggfang-centos-$jps1
23、8630Jp18252Worker進入Spark的Web管理頁面:http:/fang-ubuntu1:8080ORL;i危i81MK227:7077RESTURL:5(Mricii21B.I9ei.9S-Z2Tj)irnv“4AJiw新M*9E3CornInmm:BFoiaiU&ed“mgvy-wv;5.130Tq.M0Mnd由澗Mmcs:口fbjmrfl,0CanceledMen.口Runrifql-0CMHptalAdSIvIuf:,LWEWot*eraWwfeerIdAddrflK麗心CraE9222M1m2W1的鍛融13WALFWE4/1aMQ立了例QOBU*wtirlffZtllE
24、M29154739-290.199922X223Z1B.19992226323ALTYE4C0Uwd|Z4C3|DJDBUsedjRunningAppllcationis即f川aboriIDNrntMtffiOfyparNbddBuHtSidTIhhLluifSuuuriiienC所pl旭日ApfdgEi0n1口M4nwMrwtiTWUtvf口urpEn六、運行示例本例以集群模式運行SparkPi實例程序(deploy-mode設置為cluster)./bin/spark-submit-classorg.apache.spark.examples.SparkPi-masteryarn-depl
25、oy-modecluster-driver-memory1G-lib/spark-examples-1.6.1-hadoop2.6.0.jar40任務提交時web界面向3喈)-Clusterdu&barMobiesAten細用AmjsApps-QtjrimMarrEiizmtfedPetidingRurfirgCcmKedRunningUs忖miuLab*10-1。12GO皿3Uan5StJidul&r舊li國嚼-的血印TflSdwKLbrR&ssuahiFT團CofMot)1ScheddaWBK3AY川zurrut一皿用口Strawra-tnirr則以位心u口ID弋rK【UPHdWcabwi述MMHlarq0(1.邛第Hyxiric史Kamp蛇SchHuErTpglfSlKMing1tn1uf1wtnssexecutor-memory1G-executor-cores1lotAllApplicationsEqmwyMwncrVCqthVCmwVCom-OKmnnjwiQnedLEUitnwftladTouiLteed.ToladFkdnNodes.Nodn24-GBQB1340J口I0DurccT,pnlAfwuiinAJkiunDTiMxomunijUocawsmemcrylOQ”.vCaresdcnernHy:31
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 城南學校五年級數(shù)學試卷
- 蘇科版數(shù)學七年級下冊聽評課記錄7.4認識三角形2
- 武松打虎聽評課記錄
- 2025年度智慧城市大數(shù)據(jù)中心合同變更及信息安全保障協(xié)議
- 2025年度綠色建筑項目設計施工合同
- 九年級化學上冊 第二單元 課題1 空氣說課稿 (新版)新人教版
- 鴉片戰(zhàn)爭的聽評課記錄
- 粵教版道德與法治九年級上冊2.2.1《依法參與公共事務是人民當家做主的體現(xiàn)》聽課評課記錄
- 現(xiàn)代物流管理中的客戶關系管理
- 2025年度花卉苗木種植與購銷一體化合同
- 氧氣、乙炔工安全操作規(guī)程(3篇)
- 建筑廢棄混凝土處置和再生建材利用措施計劃
- 集裝箱知識培訓課件
- 某縣城區(qū)地下綜合管廊建設工程項目可行性實施報告
- 《架空輸電線路導線舞動風偏故障告警系統(tǒng)技術導則》
- 2024年計算機二級WPS考試題庫
- JJF(京) 92-2022 激光標線儀校準規(guī)范
- 普惠金融政策解讀
- 2024年疾控中心支部工作計劃范本
- 廣東省廣州黃埔區(qū)2023-2024學年八年級上學期期末數(shù)學試卷(含答案)
- 法理學課件馬工程
評論
0/150
提交評論