版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第2章實踐環(huán)境準(zhǔn)備Hadoop集群環(huán)境搭建第一部分環(huán)境準(zhǔn)備啟動Hadoop集群運行經(jīng)典案例wordcount安裝Hadoop學(xué)習(xí)目標(biāo)和要求1、掌握Hadoop集群環(huán)境搭建的環(huán)境準(zhǔn)備工作,包括配置主機名、防火墻設(shè)置、免密登錄設(shè)置、Java環(huán)境設(shè)置。2、掌握安裝Hadoop的過程、配置文件設(shè)置及啟動集群的方法。3、會在Hadoop集群運行經(jīng)典案例wordcount。環(huán)境準(zhǔn)備1、集群節(jié)點規(guī)劃此集群由三個節(jié)點構(gòu)成,分別是master、slaver01、slaver02。集群搭建部署均在虛擬機中完成,使用VMwareWorkstation16Pro虛擬計算機軟件。環(huán)境準(zhǔn)備2、配置主機名和IP(1)修改對應(yīng)虛擬機的IP地址:
vi/etc/sysconfig/network-scripts/ifcfg-ens33(2)將三臺虛擬機的主機名修改為master、slaver01、slaver02。
hostnamectlset-hostname主機名(3)重啟網(wǎng)絡(luò),使網(wǎng)絡(luò)配置生效。
systemctlrestartnetwork環(huán)境準(zhǔn)備3、連接MobaXterm終端工具使用MobaXterm終端工具,為master、slaver01和slaver02創(chuàng)建SSH連接。環(huán)境準(zhǔn)備4、關(guān)閉防火墻
防火墻是對服務(wù)器進行保護的一種服務(wù),但有時候會帶來很多麻煩,它會妨礙Hadoop集群間的相互通信,所以我們要關(guān)閉防火墻。關(guān)閉master、slaver01和slaver02主機的防火墻,并設(shè)置開機不自啟。systemctlstatusfirewalldsystemctlstopfirewalldsystemctldisablefirewalldsystemctlstatusfirewalld環(huán)境準(zhǔn)備5、關(guān)閉SElinuxSELINUX是對系統(tǒng)安全級別更細(xì)粒度的設(shè)置。關(guān)閉master、slaver01和slaver02主機的SElinux。vi/etc/sysconfig/selinux環(huán)境準(zhǔn)備6、修改/etc/hosts文件修改master、slaver01和slaver02主機的/etc/hosts文件,建立主機和ip地址之間的映射關(guān)系。vi/etc/hosts7、配置免密登錄首先在master節(jié)點創(chuàng)建生成密鑰。將密鑰拷貝到slaver01和slaver02兩個節(jié)點,完成免密登錄配置。環(huán)境準(zhǔn)備8、配置Java環(huán)境在master節(jié)點上傳JDK軟件包并解壓。在.bash_profile文件中配置環(huán)境變量。使用source.bash_profile命令,使.bash_profile文件配置生效。查看Java版本,驗證安裝成功。使用scp命令將jdk解壓安裝相關(guān)文件分發(fā)到slaver01和slaver02節(jié)點。安裝Hadoop
由于三個節(jié)點都需要安裝Hadoop,為了提高部署效率,先在master節(jié)點進行部署安裝,然后將相關(guān)的文件和配置拷貝分發(fā)到另外兩個節(jié)點中。上傳Hadoop安裝包并解壓。修改環(huán)境變量。使環(huán)境變量生效。修改hadoop的配置文件hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml、workers。分發(fā)Hadoop和環(huán)境變量文件到slaver01和slaver02。格式化HDFS文件系統(tǒng)。啟動Hadoop集群1、啟動Hadoop集群只需要在master節(jié)點輸入start-all.sh。接著查看各節(jié)點的服務(wù)進程。2、打開Google瀏覽器,輸入地址30:8088,可以打開Yarn頁面。3、輸入地址30:9870,可以打開HDFS頁面。案例wordcount通過經(jīng)典案例wordcount,體驗Hadoop運行MapReduce計算。1、在本地root目錄下創(chuàng)建一個txt文件,輸入一段自定義文字。2、上傳文本到到hdfs。案例wordcount3、運行命令并查看結(jié)果hadoopjarhadoop-mapreduce-examples-3.2.1.jarwordcount/input/outputSpark集群部署與使用第二部分Spark安裝啟動SparkSpark集群測試學(xué)習(xí)目標(biāo)和要求1、掌握Spark集群安裝配置方法。2、會啟動關(guān)閉Spark集群。3、能使用Spark-shell進行簡單編程測試。Spark安裝1、上傳軟件包使用MobaXterm工具,將軟件包上傳至master節(jié)點的root目錄下,然后將其解壓到/usr/local目錄中。Spark安裝2、在.bash_profile文件中修改環(huán)境變量執(zhí)行source.bash_profile使環(huán)境變量生效Spark安裝3、修改Spark配置文件(1)配置spark-env.sh文件(2)配置workers文件4、復(fù)制修改spark啟動腳本,避免和hadoop的啟動腳本沖突。5、分發(fā)Spark安裝文件到slaver01和slaver02。啟動Spark1、在master節(jié)點輸入start-spark-all.sh,啟動Spark。2、查看各節(jié)點服務(wù)進程狀態(tài)(此處已經(jīng)啟動Hadoop集群)啟動Spark3、Web查看Spark主頁情況在瀏覽器中輸入地址30:8080/,進行查看。Spark集群測試1、使用spark-submit工具提交Spark作業(yè)spark-submit提交任務(wù)及參數(shù)說明:--class:應(yīng)用程序的主類,僅針對java或scala應(yīng)用。--master:master的地址,提交任務(wù)到哪里執(zhí)行,例如spark://host:port,yarn,local。--driver-memory:driver進程所使用的內(nèi)存數(shù)量,以字節(jié)為單位??梢灾付ú煌暮缶Y如“512m”或“15g”,默認(rèn)是1G。--executor-memory:executor使用的內(nèi)存數(shù)量,以字節(jié)為單位??梢灾付ú煌暮缶Y如“512m”或“15g”,默認(rèn)是1G。--total-executor-cores:所有executor總共的核數(shù)。僅僅在mesos或者standalone下使用。Spark集群測試Spark集群測試2、使用Spark-sql(1)輸入spark-sql命令,啟動spark-sql。(2)使用SQL命令,執(zhí)行創(chuàng)建數(shù)據(jù)庫、創(chuàng)建表等操作。Spark集群測試3、使用Sparkshell(1)輸入spark-shell命令,啟動spark-shell。(2)執(zhí)行SparkShell常用命令Spark集群測試(2)執(zhí)行SparkShell常用命令①:help命令,查看SparkShell常用的命令Spark集群測試(2)執(zhí)行SparkShell常用命令②:paste命令,進入paster模式Scala安裝第三部分下載安裝包安裝配置學(xué)習(xí)目標(biāo)和要求1、會下載、安裝配置Scala工具。2、能啟動Scala進行編程測試。下載安裝包通過連接地址/download/2.13.6.html直接下載scala-2.13.6.tgz壓縮包。安裝配
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度商業(yè)綜合體戶外廣告牌拆除與升級合同3篇
- 2024年版:機動車抵押借款合同協(xié)議
- 2024年甲乙雙方關(guān)于房產(chǎn)租賃的協(xié)議
- 二零二五年度人工智能輔助駕駛系統(tǒng)研發(fā)人員勞動合同范本2篇
- 2024年版居間服務(wù)協(xié)議法律解釋要點版B版
- 2024年特殊需求兒童輔導(dǎo)與免責(zé)協(xié)議3篇
- 二零二五年度人工智能教育平臺研發(fā)人員雇傭協(xié)議3篇
- 2024版銷售居間范本3篇
- 2024演藝經(jīng)紀(jì)人與新晉歌手簽約推廣合同3篇
- 二零二五年度辦公樓裝修改造工程承包合同2篇
- 93江蘇省宿遷市泗洪縣2023-2024學(xué)年八年級上學(xué)期期末英語試題()
- 教學(xué)能力大賽決賽獲獎-教學(xué)實施報告-(完整圖文版)
- 亞朵酒店管理手冊
- 高一期末家長會課件
- 2024年航空職業(yè)技能鑒定考試-航空乘務(wù)員危險品歷年考試高頻考點試題附帶答案
- 醫(yī)院禁毒行動方案
- 設(shè)立影視服務(wù)公司商業(yè)計劃書
- 《流行性腦脊髓膜炎》課件
- 學(xué)生公寓物業(yè)服務(wù)方案投標(biāo)方案(技術(shù)方案)
- 水上交通安全生產(chǎn)培訓(xùn)
- 超聲影像學(xué)基礎(chǔ)
評論
0/150
提交評論