版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
LET'SMAKESTUDYLET'SMAKESTUDYINTRESTINGRICHAND基于Hadoop的部署與實(shí)施基于Hadoop郭Hadoop的偽分布模式部Hadoop的偽分布模式部Hadoop的集群部在Linux上安裝與配置Hadoop系Hadoop的啟動(dòng)停止及其注意事一二三四九 1234熟練部署各種場景的Hadoop 1234熟練部署各種場景的Hadoop平臺熟悉如何在Windows和Linux上部署數(shù)據(jù)分析平臺熟悉企業(yè)級大規(guī)模Hadoop集群的部署與管理熟悉Hadoop的啟動(dòng)和停止過程Hadoop的偽分布模式部Hadoop的偽分布模式部Hadoop的集群部在Linux上安裝與配置Hadoop系Hadoop的啟動(dòng)停止及其注意事一二三四九 ?– ?––––在單節(jié)點(diǎn)上以偽分布模式運(yùn)使用線程模擬分布 ……JobTrackerMaster ……JobTrackerMasterSecondaryNameNodeMasterNameNode一二三Hadoop的偽分布模一二三Hadoop的偽分布模式部Hadoop的集群部在Linux上安裝與配置Hadoop系Hadoop的啟動(dòng)停止及其注意事四九 ?– ?–––––以非分布式模式運(yùn)行的一個(gè)獨(dú)立Java進(jìn)在這種默認(rèn)模式下所有3個(gè)XML文件均為當(dāng)配置文件為空時(shí),Hadoop會完全運(yùn)行在本 TaskTrackerJobTracker TaskTrackerJobTrackerMasterSecondaryNameNodeMasterNameNode一二三Hadoop的偽分布模一二三Hadoop的偽分布模式部Hadoop的集群部在Linux上安裝與配置Hadoop系Hadoop的啟動(dòng)停止及其注意事四九 ?? ??–––––真正有意義的集由一個(gè)NameNode個(gè)SecondaryNameNode和多個(gè)DataNode組成 Slave-Slave-Slave- Slave-Slave-Slave-一二三Hadoop的偽分布模一二三Hadoop的偽分布模式部Hadoop的集群部在Linux上安裝與配置Hadoop系Hadoop的啟動(dòng)停止及其注意事四九 ?– ?–––????????在ESXi上創(chuàng)建Linux在OpenStack環(huán)境下創(chuàng)建Linux在Windows的VMwareWorkStation上創(chuàng)建Linux虛擬機(jī) ??在OpenStack環(huán)境下創(chuàng)建1臺CentOS ??在OpenStack環(huán)境下創(chuàng)建1臺CentOS6.5Intel(R)Xeon(R)CPUE5-26200@cat/proc/cpuinfo|grep"modelcat/proc/meminfo|grepfree-df?? ?Hadoop–––––Hadoop的可執(zhí)行程 ?Hadoop–––––Hadoop的可執(zhí)行程MapReduce的日志文?Hadoop軟件相關(guān)的文Hadoop數(shù)據(jù)相關(guān)的文文件系統(tǒng)大小用途/安裝操作系操作系統(tǒng)的啟動(dòng)分內(nèi)存交換分用于存放Hadoop的軟用于存放Hadoop的數(shù) ?直接使用root用戶部署Hadoop–––– ?直接使用root用戶部署Hadoop––––權(quán)限最大,可屏蔽關(guān)于文件系統(tǒng)權(quán)限的問風(fēng)險(xiǎn)較出現(xiàn)問題無法?使用特定的組和用戶部署Hadoop––––需要額外規(guī)劃,并創(chuàng)建新的組和用戶,文件系統(tǒng)的權(quán)限也需要修有利于審計(jì)工?? ? ????????????配置Hadoop配置Linux的SSH ?–JDK ?–JDK?/technetwork/java/javase/downloads/jdk7-–JDK?/technetwork/java/javase/downloads/jdk8-其他版–?/technetwork/java/javase/archive- ?使用RPM ?使用RPM的方式安使用tar包解壓的方式安JDK?––––使用root用戶將JDK安裝到/usr/local/java7目錄并將JAVA_HOME下的bin目錄添加到PATH環(huán)境變量?解壓jdktar-zxf?解壓jdktar-zxfjdk-7u79-linux-移動(dòng)jdkmvjdk1.7.0_79/??echo"exportJAVA_HOME=/usr/local/java7"?echo"exportJAVA_HOME=/usr/local/java7">>echo"exportPATH=\$JAVA_HOME/bin:\$PATH">>重新加載source? ?? ??––––lvcreate-L5120-nlvhadoopmkfs-text4/dev/vg00/lvhadoopmkdir-p/hadoopmount/dev/vg00/lvhadoop?––––lvcreate-L20480-nlvdatamkfs-text4/dev/vg00/lvdatamkdir-p/datamount/dev/vg00/lvdata?–修改/etc/fstab文?–修改/etc/fstab文 ?groupadd-g ?groupadd-g3000useradd-u3001-gcloudadminchown-Rhadoop:cloudadminchown-Rhadoop:cloudadminls-l/|grep??? ? ??配置SSH–––ssh-keygen-tcdcatid_rsa.pub>??將key測試SSH–sshlocalhost ?? ??–tar-zxfhadoop- ?––––修改 ?––––修改hadoop-env.sh文件:添加JAVA_HOME配修改mapred-?–––mkdir-pmkdir-pmkdir-p ?conf/hadoop-env.sh ?conf/hadoop-env.shHadoopCore配置選HadoopCore配置選 ?conf/core-site.xml ?conf/hdfs-site.xml ?conf/hdfs-site.xmlMapReduce守護(hù)進(jìn)程配MapReduce守護(hù)進(jìn)程配置選 ?conf/mapred-site.xml ?修改完Hadoop的配置文件后,需要對HDFS ?修改完Hadoop的配置文件后,需要對HDFS–bin/hadoopnamenode-?? ?使用Hadoop– ?使用Hadoop–bin/start-?檢查Hadoop–?–bin/hadoopdfsadmin?–bin/hadoopdfsadmin- ? ? ?一二三Hadoop的偽分布模一二三Hadoop的偽分布模式部Hadoop的集群部在Linux上安裝與配置Hadoop系Hadoop的啟動(dòng)停止及其注意事四九 ?Hadoop系統(tǒng)不能直接在Windows ?Hadoop系統(tǒng)不能直接在Windowscygwin軟件來在Windows下模擬Linux支持的WindowsWindowsXP、7、2003、2008cygwin:用于在Windows下模擬Linux???––––安裝NetCategory下的openssl?––––安裝NetCategory下的openssl的軟件Basatg下的s的軟件包tsatg?–此處省略……10000231231一二三Hadoop的偽分布模一二三Hadoop的偽分布模式部Hadoop的集群部在Linux上安裝與配置Hadoop系Hadoop的啟動(dòng)停止及其注意事四九 ? ???????????如何選擇JDK哪些節(jié)點(diǎn)做datanode ??在OpenStack環(huán)境下創(chuàng)建4臺CentOS ??在OpenStack環(huán)境下創(chuàng)建4臺CentOS6.5Intel(R)Xeon(R)CPUE5-26200@cat/proc/cpuinfo|grep"modelcat/proc/meminfo|grepfree-df-?? ???? ?????IP地址主機(jī)用Hadoop的namenode和Hadoop的datanode和 ? ????????????配置Hadoop配置Linux的SSH ??? ??????上面的步驟和前面的配置一致,這里不再重復(fù)配置主機(jī)名和IP地址對應(yīng)關(guān)配置主機(jī)名和IP地址對應(yīng)關(guān) ?–使用root?––––echoechoechoechohm2">>hd001">>/etc/hostshd002">>hd003">>?–cat在集群中配置SSH在集群中配置SSH免密碼登 ?在集群的master節(jié)點(diǎn)上使用hadoop–ssh-keygen-t在集群的namenode?–––––cdcatid_rsa.pub>>scpauthorized_keys3:/home/hadoop/.ssh/scpauthorized_keysscpauthorized_keys???SSH?SSH ?––––– ?––––––修改hadoop-env.sh文件:添加JAVA_HOME配修改slave文?–––mkdir-pmkdir-pmkdir-p ?conf/hadoop-env.sh ?conf/hadoop-env.shHadoopCore配置選HadoopCore配置選 ?conf/core-site.xml ?conf/hdfs-site.xml ?conf/hdfs-site.xmlMapReduce守護(hù)進(jìn)程配MapReduce守護(hù)進(jìn)程配置選 ?conf/mapred-site.xml ?conf/masters?conf/slaves ?conf/masters?conf/slaves ?–––scp-rhadoop-1.2.1scp-rhadoop-1.2.1scp-rhadoop-1.2.1 ?修改完Hadoop的配置文件后,需要對HDFS ?修改完Hadoop的配置文件后,需要對HDFS–bin/hadoopnamenode- ?使用Hadoop–bin/start- ?使用Hadoop–bin/start-?檢查Hadoop–主節(jié)點(diǎn)的進(jìn)從節(jié)點(diǎn)的進(jìn)程 ?– ?–bin/hadoopdfsadmin-DFSUsedNonDFSDFSUsed%DFS????? ?ddif=/dev/zeroof=/hadoop/test.datbs=1024000上傳文件到HDFSbin/hadoopfs-copyFromLocal/hadoop/test.dat檢查HDFSbin/hadoopfs-ls??一二三Hadoop的偽分布模一二三Hadoop的偽分布模式部Hadoop的集群部在Linux上安裝與配置Hadoop系Hadoop的啟動(dòng)停止及其注意事四九完全分布完全分布式Hadoop系統(tǒng)的實(shí)施步 ????????????配置Hadoop配置Linux的SSH企業(yè)級大規(guī)企業(yè)級大規(guī)模集群部署的問 ?–CPU、內(nèi)存、磁盤、網(wǎng)絡(luò)如何構(gòu)建SSH免密碼登陸Hadoop???? ??Windows下的Active ???再利用NFS將hadoop用戶的home目錄放在NFS一二三Hadoop的偽分布模一二三Hadoop的偽分布模式部Hadoop的集群部在Linux上安裝與配置Hadoop系Hadoop的啟動(dòng)停止及其注意事四九WordCount程序簡 ???WordCount程序簡 ???它可以稱為MapReduce版“Hello?211MapReduce總體過MapReduce總體過 ? ? ?Mapping過 ?Mapping過 ?Reducing過 ?ReducingReducing過 ?Reducing ?–––echo ?–––echo"thisisatestfile">>echo"hadoopissoeasy">>echo"testhadoopprogram">>?上傳測試文件到HDFSbin/hadoopfs-mkdirbin/hadoopfs-copyFromLocal/hadoop/*.txt運(yùn)行wordcountbin/hadoopjarhadoop-examples-1.2.1.jarwordcountin查看wordcountbin/hadoopfs-ls??Reduce的執(zhí)行過程Reduce的執(zhí)行過程過程數(shù)據(jù)統(tǒng)計(jì)信息 ?? ???使用ls指令查看wordcount使用cat指令查看wordcount一二三Hadoop的偽分布模一二三Hadoop的偽分布模式部Hadoop的集群部在Linux上安裝與配置Hado
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025民間借款合同協(xié)議書模板
- 2025深圳市全日制用工勞動(dòng)合同范本
- 2025汽車駕駛員雇傭合同
- 2025股份有限公司分立合同
- 二零二五年度辦公室租賃合同(含企業(yè)國際化運(yùn)營支持)3篇
- 2025年度年度監(jiān)護(hù)權(quán)爭議解決合同3篇
- 2025住宅小區(qū)物業(yè)管理合同范本
- 二零二五年度人工智能與自動(dòng)駕駛公司戰(zhàn)略合作協(xié)議書3篇
- 2025年度網(wǎng)絡(luò)安全公司銷售人員二零二五年度勞動(dòng)合同3篇
- 2025年度養(yǎng)殖企業(yè)產(chǎn)業(yè)鏈優(yōu)化合作協(xié)議3篇
- 九年級化學(xué)下冊 第9單元 課題1《溶液的形成》教案 (新版)新人教版
- 2024年醫(yī)療器械經(jīng)營質(zhì)量管理規(guī)范培訓(xùn)課件
- 2024國家級天然氣購銷合作協(xié)議模板
- 議論文寫作知識基礎(chǔ)(課件)-高中語文議論文寫作入門
- 2024智慧水電廠建設(shè)方案
- 2024浙江金華市明城工程管理限公司招聘7人高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 2024年個(gè)人之間清賬協(xié)議書模板
- CRF病例報(bào)告表模板
- 路燈安裝施工檢驗(yàn)批質(zhì)量檢驗(yàn)記錄表
- 2024年計(jì)算機(jī)二級WPS考試題庫380題(含答案)
- 2023年江蘇省五年制專轉(zhuǎn)本英語統(tǒng)考真題(試卷+答案)
評論
0/150
提交評論