




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
PAGEPAGE1《大數(shù)據(jù)計(jì)算原理與技術(shù)》課程考試復(fù)習(xí)題庫(kù)及答案一、單選題1.關(guān)于大數(shù)據(jù)的主要特征理解和描述錯(cuò)誤的是A、來(lái)源多,格式多B、增長(zhǎng)速度快,處理速度快C、存儲(chǔ)量大計(jì)算量大D、數(shù)據(jù)價(jià)值密度很高答案:D2.關(guān)于checkpoint,說(shuō)法正確的是A、checkpoint可通過(guò)元數(shù)據(jù)文件的大小進(jìn)行控制B、secondarynamenode會(huì)將合并好的元數(shù)據(jù)移動(dòng)到namenodeC、SecondaryNameNode會(huì)將edits文件和fsimage復(fù)制到本地(HTTPGET方式)D、合并元數(shù)據(jù)需要大量的磁盤(pán)進(jìn)行文件的合并操作答案:C3.下列說(shuō)法中,關(guān)于客戶(hù)端從HDFS中讀取數(shù)據(jù)的說(shuō)法錯(cuò)誤的是A、客戶(hù)端會(huì)選取排序靠前的DataNode來(lái)依次讀取Block塊B、客戶(hù)端會(huì)把最終讀取出來(lái)所有的Block塊合并成一個(gè)完整的最終文件C、客戶(hù)端會(huì)選取排序靠后的DataNode來(lái)依讀取Block塊D、如果客戶(hù)端本身就是DataNode,那么將從本地直接獲取數(shù)據(jù)答案:C4.下列說(shuō)法不正確的是?A、數(shù)據(jù)源是數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ),通常包含企業(yè)的各種內(nèi)部信息和外部信息B、數(shù)據(jù)存儲(chǔ)及管理是整個(gè)數(shù)據(jù)倉(cāng)庫(kù)的核心。C、OLAP服務(wù)器對(duì)需要分析的數(shù)據(jù)按照多維數(shù)據(jù)模型進(jìn)行重組、分析,發(fā)現(xiàn)數(shù)據(jù)規(guī)律和趨勢(shì)。D、前端工具主要功能是將數(shù)據(jù)可視化展示在前端頁(yè)面中答案:D5.下面哪個(gè)是Hadoop組件A、yarnB、hdfsC、mapreduceD、以上都是答案:D6.把本地文件放到集群里,可以使用下面哪個(gè)hadoopshell的命令A(yù)、hadoopfs-putB、hadoopfs–push/C、hadoopfs–put/D、hadoop-push/答案:C7.下列選項(xiàng)中,用于刪除HDFS上文件夾的方法是A、delete()B、rename()C、mkdirs()D、copyToLocalFile()答案:A8.下列選項(xiàng)中,哪一項(xiàng)是可以進(jìn)行重啟引導(dǎo)系統(tǒng)A、OKB、CancelC、RebootD、Apply答案:C9.下列關(guān)于HadoopAPI的說(shuō)法錯(cuò)誤的是A、Hadoop的文件API不是通用的,只用于HDFS文件系統(tǒng)B、Configuration類(lèi)的默認(rèn)實(shí)例化方法是以HDFS系統(tǒng)的資源配置為基礎(chǔ)的C、FileStatus對(duì)象存儲(chǔ)文件和目錄的元數(shù)據(jù)D、FSDataInputStream是java.io.DataInputStream的子類(lèi)答案:A10.HDfS中的block默認(rèn)保存幾份A、3B、2C、1D、不確定答案:A11.下面哪個(gè)程序負(fù)責(zé)HDFS數(shù)據(jù)存儲(chǔ)A、NameNodeB、DatanodeC、secondaryNameNodeD、NodeManager答案:B12.以下關(guān)于NameNode說(shuō)法正確的是A、NameNode既可以存儲(chǔ)具體的文件數(shù)據(jù),也可以存儲(chǔ)元數(shù)據(jù)B、可以使用NameNode高可用機(jī)制來(lái)橫向擴(kuò)展其內(nèi)存空間C、NameNode在工作時(shí),元數(shù)據(jù)都是放在硬盤(pán)上D、對(duì)于單節(jié)點(diǎn)集群來(lái)講,NameNode一旦掛掉,整個(gè)HDFS集群將不能工作答案:D13.HDFS的是基于流數(shù)據(jù)模式訪(fǎng)問(wèn)和處理超大文件的需求而開(kāi)發(fā)的,具有高容錯(cuò)、高可靠性、高可擴(kuò)展性、高吞吐率等特征,適合的讀寫(xiě)任務(wù)是A、一次寫(xiě)入,少次讀取B、多次寫(xiě)入,少次讀取C、一次寫(xiě)入,多次讀取D、多次寫(xiě)入,多次讀取答案:C14.以下關(guān)于HDFS讀寫(xiě)操作描述錯(cuò)誤的是A、HDFS在讀取數(shù)據(jù)時(shí)不需要NameNode參與B、HDFS只支持追加寫(xiě)入,不支持對(duì)文件內(nèi)容的隨機(jī)修改C、HDFS執(zhí)行具體的寫(xiě)操作時(shí),需要Client和DataNode之間進(jìn)行數(shù)據(jù)傳輸D、HDFS在讀取數(shù)據(jù)時(shí),一個(gè)文件的多個(gè)BLOCK可以并行讀取答案:A15.下面哪個(gè)程序負(fù)責(zé)HDFS數(shù)據(jù)存儲(chǔ)。A、NameNodeB、JobtrackerC、DatanodeD、secondaryNameNode答案:C16.Client在HDFS上進(jìn)行文件寫(xiě)入時(shí),namenode根據(jù)文件大小和配置情況,返回部分datanode信息,誰(shuí)負(fù)責(zé)將文件劃分為多個(gè)Block,根據(jù)DataNode的地址信息,按順序?qū)懭氲矫恳粋€(gè)DataNode塊A、ClientB、NamenodeC、DatanodeD、Secondarynamenode答案:A17.Client在HDFS上進(jìn)行文件寫(xiě)入時(shí),namenode根據(jù)文件大小和配置情況,返回部分datanode信息,誰(shuí)負(fù)責(zé)將文件劃分為多個(gè)Block,根據(jù)DataNode的地址信息,按順序?qū)懭氲矫恳粋€(gè)DataNode塊A、ClientB、NamenodeC、DatanodeD、Secondarynamenode答案:A18.下列選項(xiàng)中,哪一項(xiàng)是研究大數(shù)據(jù)最重要的意義A、分析B、統(tǒng)計(jì)C、測(cè)試D、預(yù)測(cè)答案:D19.以下關(guān)于HDFS描述錯(cuò)誤是A、HDFS在存儲(chǔ)大文件時(shí)會(huì)將文件進(jìn)行切分B、HDFS可以通過(guò)副本機(jī)制來(lái)解決數(shù)據(jù)丟失問(wèn)題C、HDFS也適合存儲(chǔ)小文件D、HDFS在單節(jié)點(diǎn)模式下,NameNode一旦宕機(jī),則整個(gè)HDFS將不能工作答案:C20.安裝Hadoop時(shí),發(fā)現(xiàn)50070對(duì)應(yīng)的頁(yè)面無(wú)法打開(kāi),可以通過(guò)下面哪個(gè)命令查看某個(gè)端口(TCP或UDP)是否在監(jiān)聽(tīng)A、psB、netstatC、pingD、ifconfig答案:B21.在MapReduce中,下面哪個(gè)數(shù)據(jù)流的順序是正確的a.InputFormatb.Mapperc.Combinerd.Reducere.Partitionerf.OutputFormatg.GroupingA、ebcgdfB、abecgdfC、aebcgcfD、abcdegf答案:B解析:在MapReduce編程模型中,數(shù)據(jù)處理流程遵循特定的順序以保證作業(yè)的正確執(zhí)行。首先,InputFormat負(fù)責(zé)讀取輸入數(shù)據(jù)并將其分割成適合Map任務(wù)處理的分片。接著,Map任務(wù)接收輸入分片,處理后產(chǎn)生鍵值對(duì)。Combiner(可選)對(duì)Map輸出的鍵值對(duì)進(jìn)行局部聚合,減少傳輸?shù)絉educer的數(shù)據(jù)量。然后,Reducer接收Mapper的輸出,按鍵進(jìn)行聚合處理,生成最終結(jié)果。Partitioner根據(jù)鍵值對(duì)的鍵進(jìn)行分區(qū),確保相同鍵的數(shù)據(jù)發(fā)送到同一個(gè)Reducer。最后,OutputFormat負(fù)責(zé)將Reducer的輸出格式化并寫(xiě)入到指定的存儲(chǔ)位置。22.大數(shù)據(jù)至少為以下哪種存儲(chǔ)量級(jí)?A、EBB、PBC、TBD、ZB答案:B23.下面哪個(gè)不是Hadoop進(jìn)程A、NameNodeB、HMasterC、DataNodeD、NodeManager答案:B24.關(guān)于HDFS的文件寫(xiě)入,正確的是A、支持多用戶(hù)對(duì)同一文件的寫(xiě)操作B、用戶(hù)可以在文件任意位置進(jìn)行修改C、默認(rèn)將文件塊復(fù)制成三份存放D、復(fù)制的文件塊默認(rèn)都存在同一機(jī)架上答案:C25.Client在HDFS上進(jìn)行文件寫(xiě)入時(shí),namenode根據(jù)文件大小和配置情況,返回部分datanode信息,誰(shuí)負(fù)責(zé)復(fù)制Block塊A、ClientB、NamenodeC、DatanodeD、Secondarynamenode答案:A26.Hadoop作者A、MartinFowlerB、KentBeckC、DougcuttingD、JamesGosling答案:C解析:Hadoop是由DougCutting和MikeCafarella在2005年創(chuàng)建的一個(gè)開(kāi)源分布式計(jì)算框架。DougCutting不僅是Hadoop的創(chuàng)始人,還參與了Lucene和Nutch的開(kāi)發(fā)。他的職業(yè)生涯始于Xerox,后來(lái)為了推動(dòng)搜索技術(shù)的商業(yè)化,開(kāi)始了Nutch項(xiàng)目,最終演變?yōu)镠adoop。因此,Hadoop的作者是DougCutting,對(duì)應(yīng)選項(xiàng)C。27.下列描述中不符合Map/Reduce的是A、Map結(jié)束后,Partitioner會(huì)將相同Key分到同一個(gè)組交給Reduce進(jìn)程B、Map/Reduce是函數(shù)式的設(shè)計(jì)思想C、Map是將數(shù)據(jù)映射成Key/Value再交給ReduceD、Reduce先運(yùn)行,然后運(yùn)行Map答案:D28.在安裝Hadoop集群時(shí),jdk是配置在下面哪個(gè)文件中A、mapred-site.xmlB、yarn-site.xmlC、hadoop-env.shD、hdfs-site.xml答案:C29.下列選項(xiàng)中,關(guān)于SSH服務(wù)說(shuō)法正確的是A、SSH服務(wù)是一種傳輸協(xié)議B、SSH服務(wù)是一種通信協(xié)議C、SSH服務(wù)是一種數(shù)據(jù)包協(xié)議D、SSH服務(wù)是一種網(wǎng)絡(luò)安全協(xié)議答案:D30.Client端上傳文件的時(shí)候下列哪項(xiàng)正確?A、數(shù)據(jù)經(jīng)過(guò)NameNode傳遞給DataNodeB、Client端將文件切分為Block,依次上傳C、lient只上傳數(shù)據(jù)到一臺(tái)DataNode,然后由NameNode負(fù)責(zé)Block復(fù)制工作D、以上都不正確答案:B31.Ubuntu下,采用用戶(hù)user1安裝hadoop偽分布式時(shí),解壓hadoop安裝包采用下面命令A(yù)、chownuser1:user1hadoop-2.7.5B、chown-Ruser1:user1hadoop-2.7.5C、hmod-R777hadoop-2.7.5D、sudochown-Ruser1:user1hadoop-2.7.5答案:D解析:在Ubuntu系統(tǒng)中,使用`sudochown-Ruser1:user1hadoop-2.7.5`命令可以確保以管理員權(quán)限遞歸地將`hadoop-2.7.5`目錄及其所有子目錄和文件的所有權(quán)賦予用戶(hù)`user1`。這種做法不僅能夠有效避免因權(quán)限不足導(dǎo)致的操作失敗,還能在一定程度上保障系統(tǒng)的安全性,因?yàn)樗粫?huì)過(guò)度放寬文件權(quán)限,從而減少了潛在的安全風(fēng)險(xiǎn)。32.在Hadoop的解壓目錄下,通過(guò)執(zhí)行哪一項(xiàng)指令可以查看Hadoop的目錄結(jié)構(gòu)A、jpsB、llC、tarD、find答案:B33.下面哪個(gè)配置是在mapred-site.xml中配置的A、block塊的副本數(shù)B、Java環(huán)境變量C、存儲(chǔ)hdfs文件的目錄名D、運(yùn)行MapReduce作業(yè)的主機(jī)和端口答案:D34.hadoop2.x采用什么技術(shù)構(gòu)建源代碼A、ntB、ivyC、mavenD、makefile答案:C35.SecondaryNamenode的作用是A、監(jiān)控NamenodeB、管理DatanodeC、合并fsimage和editlogsD、支持NamenodeHA答案:C解析:SecondaryNameNode在Hadoop分布式文件系統(tǒng)(HDFS)中的主要作用是合并fsimage和editlogs。它定期從NameNode獲取editlogs并合并到fsimage文件中,生成新的fsimage,有助于減少NameNode啟動(dòng)時(shí)間并提高系統(tǒng)可靠性。通過(guò)定期合并操作,SecondaryNameNode能夠減輕NameNode在啟動(dòng)和運(yùn)行過(guò)程中的負(fù)載,并提供故障恢復(fù)機(jī)制,確保系統(tǒng)的穩(wěn)定運(yùn)行和高效性能。36.Hadoop完全分布模式配置免密登錄是要A、實(shí)現(xiàn)主節(jié)點(diǎn)到其他節(jié)點(diǎn)免密登錄B、實(shí)現(xiàn)從節(jié)點(diǎn)到主節(jié)點(diǎn)的免密登錄C、主節(jié)點(diǎn)和從節(jié)點(diǎn)任意兩個(gè)節(jié)點(diǎn)之間免密登錄D、以上都不是答案:C37.配置機(jī)架感知的下面哪項(xiàng)正確A、MapReduce會(huì)根據(jù)機(jī)架獲取離自己比較近的網(wǎng)絡(luò)數(shù)據(jù)B、寫(xiě)入數(shù)據(jù)的時(shí)候會(huì)寫(xiě)到不同機(jī)架的DataNodeC、都正確D、如果一個(gè)機(jī)架出問(wèn)題,不會(huì)影響數(shù)據(jù)讀寫(xiě)答案:C38.關(guān)于SecondaryNameNode下面哪項(xiàng)是正確的A、它是NameNode的熱備B、它對(duì)內(nèi)存沒(méi)有要求C、它的目的是幫助NameNode合并編輯日志,減少NameNode啟動(dòng)時(shí)間D、SecondaryNameNode應(yīng)與NameNode部署到一個(gè)節(jié)點(diǎn)答案:C39.下列哪個(gè)屬性是mapred-site.xml中的配置?A、dfs.replicationB、fs.fsdefaultFSC、D、yarn.resourcemanager.address答案:C解析:在Hadoop生態(tài)系統(tǒng)中,各個(gè)組件有其專(zhuān)門(mén)的配置文件。對(duì)于MapReduce組件,其核心配置文件是mapred-site.xml。在這個(gè)文件中,主要配置與MapReduce作業(yè)執(zhí)行相關(guān)的參數(shù)。其中,是一個(gè)關(guān)鍵屬性,用于指定MapReduce框架的名稱(chēng),即是使用經(jīng)典的MapReduce框架還是YARN(YetAnotherResourceNegotiator)上的MapReduce。而dfs.replication是HDFS(HadoopDistributedFileSystem)中的配置,用于設(shè)置文件的副本數(shù);fs.defaultFS指定HDFS的默認(rèn)文件系統(tǒng);yarn.resourcemanager.address則是YARN資源管理器(ResourceManager)的地址配置,與MapReduce框架的直接配置無(wú)關(guān)。因此,正確答案是C。40.有關(guān)MapReduce的輸入輸出,說(shuō)法錯(cuò)誤的是A、鏈接多個(gè)MapReduce作業(yè)時(shí),序列文件是首選格式B、FileInputFormat中實(shí)現(xiàn)的getSplits()可以把輸入數(shù)據(jù)劃分為分片,分片數(shù)目和大小任意定義C、想完全禁止輸出,可以使用NullOutputFormatD、每個(gè)reduce需將它的輸出寫(xiě)入自己的文件中,輸出無(wú)需分片答案:B41.以下哪個(gè)組件負(fù)責(zé)HDFS元數(shù)據(jù)的存儲(chǔ)和管理A、ClientB、NamenodeC、DatanodeD、Secondarynamenode答案:B42.下列選項(xiàng)中,主要用于決定整個(gè)MapReduce程序性能高低的階段是A、MapTaskB、ReduceTaskC、分片、格式化數(shù)據(jù)源D、Shuffle答案:D43.如果想要修改集群的備份數(shù)量,可以修改下面哪個(gè)配置文件?A、mapred-site.xmlB、core-site.xmlC、hdfs-site.xmlD、hadoop-env.sh答案:C44.關(guān)于Hadoop單擊模式和偽分布模式的說(shuō)法正確的是?A、后者比前者增加的HDFS的輸入輸出以及可檢查內(nèi)存的使用情況B、兩者都不與守護(hù)進(jìn)程交互,避免復(fù)雜性C、單機(jī)模式不使用HDFS,但加載守護(hù)進(jìn)程D、兩者都啟動(dòng)守護(hù)進(jìn)程,且守護(hù)進(jìn)程運(yùn)行在一臺(tái)機(jī)器上答案:A45.Hadoop1.0中,Hadoop內(nèi)核的主要組成是A、HDFS和MapReduceB、HDFS和YarnC、YarnD、MapReduce和Yarn答案:A46.關(guān)于Hadoop單機(jī)模式和偽分布式模式的說(shuō)法,正確的是A、兩者都起守護(hù)進(jìn)程,且守護(hù)進(jìn)程運(yùn)行在一臺(tái)機(jī)器上B、單機(jī)模式不使用HDFS,但加載守護(hù)進(jìn)程C、兩者都不與守護(hù)進(jìn)程交互,避免復(fù)雜性D、后者比前者增加了HDFS輸入輸出以及可檢查內(nèi)存使用情況答案:D47.下列選項(xiàng)中哪一門(mén)技術(shù)屬于大數(shù)據(jù)平臺(tái)A、TomcatB、HadoopC、ASP.NETD、Apache答案:B48.HDFS是基于流數(shù)據(jù)模式訪(fǎng)問(wèn)和處理超大文件的需求而開(kāi)發(fā)的,具有高容錯(cuò)、高可靠性、高可擴(kuò)展性、高吞吐率等特征,適合的讀寫(xiě)任務(wù)是A、一次寫(xiě)入,少次讀B、多次寫(xiě)入,少次讀C、多次寫(xiě)入,多次讀D、一次寫(xiě)入,多次讀答案:D49.針對(duì)每行數(shù)據(jù)內(nèi)容為”TimestUrl”的數(shù)據(jù)文件,在用JobConf對(duì)象conf設(shè)置conf.setInputFormat(WhichInputFormat.class)來(lái)讀取這個(gè)文件時(shí),WhichInputFormat應(yīng)該為以下的A、TextInputFormatB、KeyValueTextInputFormatC、SequenceFileInputFormatD、NLineInputFormat答案:B50.使用下面哪個(gè)命令可以將HDFS目錄中的文件下載到本地A、hadoopfs-putB、hadoopfs-catC、hadoopfs-getD、hadoopfs-rm答案:C51.下列哪項(xiàng)通常是集群的最主要瓶頸A、CPUB、網(wǎng)絡(luò)C、磁盤(pán)IOD、內(nèi)存答案:C52.以下關(guān)于NameNode說(shuō)法正確的是A、NameNode既可以存儲(chǔ)具體的文件數(shù)據(jù),也可以存儲(chǔ)元數(shù)據(jù)B、可以使用NameNode高可用機(jī)制來(lái)橫向擴(kuò)展其內(nèi)存空間C、NameNode存儲(chǔ)大文件和小文件的元數(shù)據(jù)所占的空間是不一樣的D、對(duì)于單節(jié)點(diǎn)集群來(lái)講,NameNode一旦掛掉,整個(gè)HDFS集群將不能工作答案:D53.下列哪個(gè)shell命令可以用于HDFS系統(tǒng)之間文件的移動(dòng)A、hadoopfsmvB、hadoopfs-mvC、hadoopfs-cutD、hadoopfs-move答案:B54.在Hadoop中每個(gè)應(yīng)用程序被表示成一個(gè)作業(yè),將作業(yè)的名稱(chēng)設(shè)置為zhangyu,用JAVA代碼編寫(xiě),以下正確的是A、Job.SetJarName(‘zhangyu’);B、Job.SetMapName(‘zhangyu’);C、Job.SetJobName(‘zhangyu’);D、Job.SetInputName(‘zhangyu’);答案:C55.下列關(guān)于HDFS的描述正確的是?A、NameNode磁盤(pán)元數(shù)據(jù)不保存Block的位置信息B、DataNode通過(guò)長(zhǎng)連接與NameNode保持通信C、HDFS集群支持?jǐn)?shù)據(jù)的隨機(jī)讀寫(xiě)D、如果NameNode宕機(jī),SecondaryNameNode會(huì)接替它使集群繼續(xù)工作答案:A56.下列選項(xiàng)中,關(guān)于HDFS說(shuō)法錯(cuò)誤的是A、HDFS是Hadoop的核心之一B、HDFS源于Google的GFS論文C、HDFS用于存儲(chǔ)海量大數(shù)據(jù)D、HDFS是用于計(jì)算海量大數(shù)據(jù)答案:D57.Namenode在啟動(dòng)時(shí)自動(dòng)進(jìn)入安全模式,在安全模式階段,說(shuō)法錯(cuò)誤的是A、安全模式目的是在系統(tǒng)啟動(dòng)時(shí)檢查各個(gè)DataNode上數(shù)據(jù)塊的有效性B、根據(jù)策略對(duì)數(shù)據(jù)塊進(jìn)行必要的復(fù)制或刪除C、當(dāng)數(shù)據(jù)塊最小百分比數(shù)滿(mǎn)足的最小副本數(shù)條件時(shí),會(huì)自動(dòng)退出安全模式D、文件系統(tǒng)允許有修改答案:D58.下列語(yǔ)句中,描述錯(cuò)誤的是A、可以通過(guò)CLI方式、JavaAPI方式調(diào)用Sqoop。B、Sqoop底層會(huì)將Sqoop命令轉(zhuǎn)換為MapReduce任務(wù),并通過(guò)Sqoop連接器進(jìn)行數(shù)據(jù)的導(dǎo)入導(dǎo)出操作。C、Sqoop是獨(dú)立的數(shù)據(jù)遷移工具,可以在任何系統(tǒng)上執(zhí)行。D、如果在Hadoop分布式集群環(huán)境下,連接MySQL服務(wù)器參數(shù)不能是localhos或。答案:C59.下列選項(xiàng)中,若是哪個(gè)節(jié)點(diǎn)關(guān)閉了,就無(wú)法訪(fǎng)問(wèn)Hadoop集群A、namenodeB、datanodeC、secondarynamenodeD、yarn答案:A60.下列選項(xiàng)中,哪一個(gè)可以對(duì)hadoop集群進(jìn)行格式化A、hadoopnamenode-formatB、hadoopnamenode-lsC、hdfsdatanode-lsD、hdfsdatanode-format答案:A61.在Centos7中,如果想要查看本機(jī)的主機(jī)名可以使用下面哪個(gè)命令A(yù)、rebootB、hostnameC、pwdD、tail答案:B62.下列選項(xiàng)中,用于存放部署Hadoop集群服務(wù)器的是A、namenodeB、datanodeC、rackD、metadata答案:C63.每個(gè)Map任務(wù)都有一個(gè)內(nèi)存緩沖區(qū),默認(rèn)大小是A、128MB、64MC、100MD、32M答案:C64.以下哪個(gè)不屬于大數(shù)據(jù)主要解決的問(wèn)題A、海量數(shù)據(jù)存儲(chǔ)B、日常業(yè)務(wù)數(shù)據(jù)處理C、海量數(shù)據(jù)計(jì)算D、通過(guò)數(shù)據(jù)分析以提供決策支持答案:B65.下列語(yǔ)句描述錯(cuò)誤的是()A、可以通過(guò)CLI方式、JavaAPI方式調(diào)用SqoopB、Sqoop底層會(huì)將Sqoop命令轉(zhuǎn)換為MapReduce任務(wù),并通過(guò)Sqoop連接器進(jìn)行數(shù)據(jù)的導(dǎo)入導(dǎo)出操作。C、Sqoop是獨(dú)立的數(shù)據(jù)遷移工具,可以在任何系統(tǒng)上執(zhí)行。D、如果在Hadoop分布式集群環(huán)境下,連接MySQL服務(wù)器參數(shù)不能是localhost或。答案:C66.下列哪個(gè)shell命令可以用于HDFS系統(tǒng)之間文件的復(fù)制A、hadoopfscpB、hadoopfs-copyC、hadoopfs-copyFileD、hdfsfs-cp答案:C67.端口50070默認(rèn)是Hadoop哪個(gè)服務(wù)的端口?A、NameNodeB、DataNodeC、SecondaryNameNodeD、Yarn答案:A68.Hadoopfs中的-get和-put命令操作對(duì)象是A、文件B、目錄C、兩者都是D、都不是答案:C69.Hadoop2.0集群服務(wù)啟動(dòng)進(jìn)程中,下列選項(xiàng)不包含的是A、NameNodeB、JobTrackerC、DataNodeD、ResourceManager答案:B70.以下關(guān)于Hadoop框架說(shuō)法錯(cuò)誤的是A、Hadoop包含HDFS、MapReduce、Yarn三大核心組件B、Hadoop的版本分為開(kāi)源社區(qū)版和商業(yè)版C、Hadoop的運(yùn)行必須依賴(lài)JDKD、Hadoop的核心配置文件所在目錄是在$HADOOOP_HOME/conf目錄答案:D71.下列選項(xiàng)中,最早提出“大數(shù)據(jù)”這一概念的是A、貝恩B、麥肯錫C、吉拉德D、杰弗遜答案:B72.下列哪個(gè)程序通常與NameNode在同一個(gè)節(jié)點(diǎn)啟動(dòng)A、TaskTrackerB、DataNodeC、SecondaryNameNodeD、ResourceManager答案:D73.HDFS無(wú)法高效存儲(chǔ)大量小文件,想讓它能處理好小文件,比較可行的改進(jìn)策略不包括A、利用SequenceFile、MapFile、Har等方式歸檔小文件B、多Master設(shè)計(jì)C、Block大小適當(dāng)調(diào)小D、調(diào)大namenode內(nèi)存或?qū)⑽募到y(tǒng)元數(shù)據(jù)存到硬盤(pán)里答案:D74.Client在HDFS上進(jìn)行文件寫(xiě)入時(shí),namenode根據(jù)文件大小和配置情況,返回部分datanode信息,誰(shuí)負(fù)責(zé)將文件劃分為多個(gè)Block,根據(jù)DataNode的地址信息,按順序?qū)懭氲矫恳粋€(gè)DataNode塊A、ClientB、NamenodeC、DatanodeD、Secondarynamenode答案:A75.目前,Hadoop的最高版本是哪個(gè)A、Hadoop3.xB、Hadoop2.xC、Hadoop1.xD、Hadoop4.x答案:A76.Namenode在啟動(dòng)時(shí)自動(dòng)進(jìn)入安全模式,在安全模式階段,說(shuō)法錯(cuò)誤的是A、安全模式目的是在系統(tǒng)啟動(dòng)時(shí)檢查各個(gè)DataNode上數(shù)據(jù)塊的有效性B、根據(jù)策略對(duì)數(shù)據(jù)塊進(jìn)行必要的復(fù)制或刪除C、當(dāng)數(shù)據(jù)塊最小百分比數(shù)滿(mǎn)足的最小副本數(shù)條件時(shí),會(huì)自動(dòng)退出安全模式D、文件系統(tǒng)允許有修改答案:D77.下列選項(xiàng)中,存放Hadoop配置文件的目錄是A、includeB、inC、libexecD、etc答案:D78.map()函數(shù)接收的數(shù)據(jù)格式是A、字符串B、整型C、LongD、鍵值對(duì)答案:D79.一個(gè)gzip文件大小75MB,客戶(hù)端設(shè)置Block大小為64MB,請(qǐng)問(wèn)其占用幾個(gè)BlockA、3B、2C、4D、1答案:B80.下列選項(xiàng)中,Hadoop2.x版本獨(dú)有的進(jìn)程是A、JobTrackerB、TaskTrackerC、NodeManagerD、NameNode答案:C81.關(guān)于HDFS寫(xiě)數(shù)據(jù)流程,下面說(shuō)法錯(cuò)誤的是A、寫(xiě)數(shù)據(jù)首先需要找NN確定寫(xiě)的位置B、如果pipeline一個(gè)節(jié)點(diǎn)寫(xiě)失敗則重新申請(qǐng)DN節(jié)點(diǎn)再寫(xiě)C、寫(xiě)數(shù)據(jù)是以packet為大小進(jìn)行的,默認(rèn)64KD、pipeline反方向會(huì)進(jìn)行數(shù)據(jù)的ack檢驗(yàn)答案:B82.以下選項(xiàng)中,哪種類(lèi)型間的轉(zhuǎn)換是不被Hive查詢(xún)語(yǔ)言所支持的A、Double—NumberB、igInt—DoubleC、Int—BigIntD、String—Double答案:A83.MapReduce處理數(shù)據(jù)的工作流程大致分為()步A、2B、3C、4D、5答案:D84.下列選項(xiàng)中,關(guān)于HDFS的架構(gòu)說(shuō)法正確的是A、HDFS采用的是主備架構(gòu)B、HDFS采用的是主從架構(gòu)C、HDFS采用的是從備架構(gòu)D、以上說(shuō)法均錯(cuò)誤答案:B85.HDFS默認(rèn)的當(dāng)前工作目錄是/user/$USER,的值需要在哪個(gè)配置文件內(nèi)說(shuō)明A、mapred-site.xmlB、core-site.xmlC、hdfs-site.xmlD、以上均不是答案:B86.下列哪些操作可以設(shè)置一個(gè)監(jiān)聽(tīng)器Watcher()A、getDataB、getChildrenC、existsD、setData答案:D87.關(guān)于SecondaryNameNode哪項(xiàng)是正確的?A、它目的是幫助NameNode合并編輯日志,減少NameNode的負(fù)擔(dān)和冷啟動(dòng)時(shí)的加載時(shí)間B、它對(duì)內(nèi)存沒(méi)有要求C、它是NameNode的熱備D、SecondaryNameNode應(yīng)與NameNode部署到一個(gè)節(jié)點(diǎn)答案:A88.下列哪項(xiàng)通常是集群的最主要的性能瓶頸A、CPUB、網(wǎng)絡(luò)C、磁盤(pán)D、內(nèi)存答案:C89.Hadoop配置文件中,hadoop-site.xml顯示覆蓋hadoop-default.xml里的內(nèi)容。在版本0.20中,hadoop-site.xml被分離成三個(gè)XML文件,不包括A、conf-site.xmlB、mapred-site.xmlC、ore-site.xmlD、hdfs-site.xml答案:A90.在Linux系統(tǒng)中,用于關(guān)閉防火墻開(kāi)機(jī)自啟動(dòng)的指令是A、chkconfigiptablesoffB、serviceiptablesstopC、stop-all.shD、stop-dfs.sh答案:A91.下面哪個(gè)目錄保存了Hadoop集群的命令(比如啟動(dòng)Hadoop)A、binB、sbinC、etcD、share答案:B92.關(guān)于Hadoop單機(jī)模式和偽分布式模式的說(shuō)法,正確的是A、兩者都起守護(hù)進(jìn)程,且守護(hù)進(jìn)程運(yùn)行在一臺(tái)機(jī)器上B、單機(jī)模式不使用HDFS,但加載守護(hù)進(jìn)程C、兩者都不與守護(hù)進(jìn)程交互,避免復(fù)雜性D、后者比前者增加了HDFS輸入輸出以及可檢查內(nèi)存使用情況答案:D93.關(guān)于HadoopFileSystem的說(shuō)法不正確的是A、FileSystem中有很多方法,跟File中的方法一致,如exists,delete,mkdir,create等等一些常用的文件操作方法B、FileStatus中有一系列的方法,可以得到文件的信息。如:getLen()得到文件的長(zhǎng)度,以字節(jié)的形式C、globStatus()方法返回于其路徑匹配的所有文件的FileStatus隊(duì)形數(shù)據(jù),并按路徑排序。D、FileStatus對(duì)象存儲(chǔ)文件和目錄的元數(shù)據(jù)答案:A解析:HadoopFileSystem的方法雖然包括exists,delete,mkdir,create等,但這些方法在功能和使用上與JavaFile類(lèi)的方法有所不同,它們更多地關(guān)注于分布式環(huán)境下的文件操作。HadoopFileSystem提供了一系列專(zhuān)門(mén)針對(duì)分布式文件系統(tǒng)的操作方法,這些方法考慮了分布式存儲(chǔ)的特性,如容錯(cuò)性、高可用性等,因此在設(shè)計(jì)和實(shí)現(xiàn)上與JavaFile類(lèi)的方法存在差異。94.安裝Hadoop集群時(shí),是在哪個(gè)文件指定哪些機(jī)器作為集群的從機(jī)?A、datanodeB、slavesC、yarn-site.xmlD、core-site.xml答案:B解析:在安裝Hadoop集群時(shí),指定哪些機(jī)器作為集群的從機(jī)是通過(guò)編輯slaves文件來(lái)實(shí)現(xiàn)的。slaves文件記錄了所有DataNode的主機(jī)名或IP地址,是NameNode識(shí)別和管理的依據(jù)。其他配置文件如core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml分別用于配置Hadoop的核心參數(shù)、HDFS參數(shù)、MapReduce參數(shù)和YARN參數(shù),但不涉及從機(jī)節(jié)點(diǎn)的指定。95.下列不是FileSystem的常見(jiàn)方法的是A、getDefaultPort()B、getScheme()C、getStatus()D、Path()答案:D96.下面陳述的內(nèi)容哪些是NameNode節(jié)點(diǎn)的功能A、負(fù)責(zé)數(shù)據(jù)的計(jì)算B、調(diào)度客戶(hù)端對(duì)文件的訪(fǎng)問(wèn)C、存儲(chǔ)真實(shí)數(shù)據(jù)D、以上均正確答案:B97.以下哪個(gè)不是HDFS的守護(hù)進(jìn)程A、SecondaryNameNodeB、NameNodeC、MrappMaster/YarnChildD、ataNode答案:C98.在Hadoop中負(fù)責(zé)運(yùn)算的組件是A、HDFSB、YARNC、MapReduceD、以上均是答案:C99.關(guān)于SecondaryNameNode哪項(xiàng)是正確的?A、它是NameNode的熱備B、它對(duì)內(nèi)存沒(méi)有要求C、它的目的是幫助NameNode合并編輯日志,減少NameNode啟動(dòng)時(shí)間D、SecondaryNameNode應(yīng)與NameNode部署到一個(gè)節(jié)點(diǎn)答案:C100.在配置Linux網(wǎng)絡(luò)參數(shù)時(shí),固定IP地址是將路由協(xié)議配置為A、staticB、dynamicC、dhcpD、variable答案:A101.關(guān)于SecondaryNameNode哪項(xiàng)是正確?A、它是NameNode的熱備B、它對(duì)內(nèi)存沒(méi)有要求C、它的目的是幫助NameNode合并編輯日志,減少NameNode啟動(dòng)時(shí)間D、SecondaryNameNode應(yīng)與NameNode部署到一個(gè)節(jié)點(diǎn)答案:C102.DougCutting所創(chuàng)立的項(xiàng)目的名稱(chēng)都受到其家人的啟發(fā),以下項(xiàng)目不是由他創(chuàng)立的項(xiàng)目是A、HadoopB、NutchC、LuceneD、Solr答案:D103.關(guān)系型數(shù)據(jù)庫(kù)與HDFS之間相互數(shù)據(jù)遷移的工具是A、distcpB、fsckC、fastcopyD、sqoop答案:D104.關(guān)于MapReduce的描述錯(cuò)的是A、MapReduce默認(rèn)只能按照Key進(jìn)行排序B、MapReduce在運(yùn)行時(shí)可以沒(méi)有CombinerC、MapReduce在指定多分區(qū)之后一般需要指定Reduce個(gè)數(shù)D、MapReduce中自定義的JavaBean可以不用序列化答案:D105.下列描述說(shuō)法錯(cuò)誤的是?A、SecureCRT是一款支持SSH的終端仿真程序,它能夠在Windows操作系統(tǒng)上遠(yuǎn)程連接Linux服務(wù)器執(zhí)行操作。B、Hadoop是一個(gè)用于處理大數(shù)據(jù)的分布式集群架構(gòu),支持在GNU/Linux系統(tǒng)以及Windows系統(tǒng)上進(jìn)行安裝使用。C、VMwareWorkstation是一款虛擬計(jì)算機(jī)的軟件,用戶(hù)可以在單一的桌面上同時(shí)操作不同的操作系統(tǒng)。D、SSH是一個(gè)軟件,專(zhuān)為遠(yuǎn)程登錄會(huì)話(huà)和其他網(wǎng)絡(luò)服務(wù)提供安全性功能的軟件。答案:D106.MapReduce的Shuffle過(guò)程以下中哪個(gè)操作是最后做的?A、排序B、合并C、分區(qū)D、溢寫(xiě)答案:B107.按粒度大小的順序,Hive數(shù)據(jù)被分為:數(shù)據(jù)庫(kù)、數(shù)據(jù)表、()、桶。A、元祖B、欄C、分區(qū)D、行答案:C108.Hadoop2.x版本中的數(shù)據(jù)塊大小默認(rèn)是多少?A、64MB、128MC、256MD、512M答案:B109.下列選項(xiàng)中,哪項(xiàng)不是Hive系統(tǒng)架構(gòu)的組成部分A、用戶(hù)接口B、跨語(yǔ)言服務(wù)C、HDFSD、底層驅(qū)動(dòng)引擎答案:C110.下面哪個(gè)是Hadoop配置文件A、core-site.xmlB、hdfs-site.xmlC、yarn-site.xmlD、以上均是答案:D111.關(guān)于HDFS的文件寫(xiě)入,正確的是A、支持多用戶(hù)對(duì)同一文件的寫(xiě)操作B、用戶(hù)可以在文件任意位置進(jìn)行修改C、默認(rèn)將文件塊復(fù)制成三份存放D、復(fù)制的文件塊默認(rèn)都存在同一機(jī)架上答案:C112.關(guān)于Haoop體系架構(gòu)說(shuō)法不正確的是?A、NameNode管理文件系統(tǒng)的命名空間B、HDFS集群有兩類(lèi)節(jié)點(diǎn)以管理者和工作者模式運(yùn)行C、HDFS上的文件也被分為塊大小的多個(gè)塊文件作為獨(dú)立的存儲(chǔ)單元D、NameNode永久保存記錄著每個(gè)文件中各個(gè)塊所在的數(shù)據(jù)節(jié)點(diǎn)和位置信息答案:D113.下列關(guān)于HadoopAPI的說(shuō)法錯(cuò)誤的是A、Hadoop的文件API不是通用的,只用于HDFS文件系統(tǒng)B、Configuration類(lèi)的默認(rèn)實(shí)例化方法是以HDFS系統(tǒng)的資源配置為基礎(chǔ)的C、FileStatus對(duì)象存儲(chǔ)文件和目錄的元數(shù)據(jù)D、FSDataInputStream是java.io.DataInputStream的子類(lèi)答案:A114.在高階數(shù)據(jù)處理中,往往無(wú)法把整個(gè)流程寫(xiě)在單個(gè)MapReduce作業(yè)中,下列關(guān)于鏈接MapReduce作業(yè)的說(shuō)法,不正確的是A、Job和JobControl類(lèi)可以管理非線(xiàn)性作業(yè)之間的依賴(lài)B、ChainMapper和ChainReducer類(lèi)可以用來(lái)簡(jiǎn)化數(shù)據(jù)預(yù)處理和后處理的構(gòu)成C、使用ChainReducer時(shí),每個(gè)mapper和reducer對(duì)象都有一個(gè)本地JobConf對(duì)象D、ChainReducer.addMapper()方法中,一般對(duì)鍵/值對(duì)發(fā)送設(shè)置成值傳遞,性能好且安全性高答案:D115.Namenode在啟動(dòng)時(shí)自動(dòng)進(jìn)入安全模式,在安全模式階段,說(shuō)法錯(cuò)誤的是A、安全模式目的是在系統(tǒng)啟動(dòng)時(shí)檢查各個(gè)DataNode上數(shù)據(jù)塊的有效性B、根據(jù)策略對(duì)數(shù)據(jù)塊進(jìn)行必要的復(fù)制或刪除C、當(dāng)數(shù)據(jù)塊最小百分比數(shù)滿(mǎn)足的最小副本數(shù)條件時(shí),會(huì)自動(dòng)退出安全模式D、文件系統(tǒng)允許有修改答案:D116.Hadoop起始于以下哪個(gè)階段A、2004年,Nutch的開(kāi)發(fā)者開(kāi)發(fā)了NDFSB、2004年,Google發(fā)表了關(guān)于MapReduce的論文C、2003年,Google發(fā)布了GFS論文D、2002年,Apach項(xiàng)目的Nutch答案:D117.下面與HDFS類(lèi)似的框架是A、NTFSB、FAT32C、GFSD、EXT3答案:C118.關(guān)于大數(shù)據(jù)的價(jià)值密度描述正確的是以下哪個(gè)?A、大數(shù)據(jù)由于其數(shù)據(jù)量大,所以其價(jià)值密度低。B、大數(shù)據(jù)由于其數(shù)據(jù)量大,所以其價(jià)值也大。C、大數(shù)據(jù)的價(jià)值密度是指其數(shù)據(jù)類(lèi)型多且復(fù)雜。D、大數(shù)據(jù)由于其數(shù)據(jù)量大,所以其價(jià)值密度高答案:A119.hadoop2.X版本默認(rèn)BlockSize的大小是A、32MB、64MC、128MD、256M答案:C120.Namenode在啟動(dòng)時(shí)自動(dòng)進(jìn)入安全模式,在安全模式階段,說(shuō)法錯(cuò)誤的是A、安全模式目的是在系統(tǒng)啟動(dòng)時(shí)檢查各個(gè)DataNode上數(shù)據(jù)塊的有效性B、根據(jù)策略對(duì)數(shù)據(jù)塊進(jìn)行必要的復(fù)制或刪除C、當(dāng)數(shù)據(jù)塊最小百分比數(shù)滿(mǎn)足的最小副本數(shù)條件時(shí),會(huì)自動(dòng)退出安全模式D、文件系統(tǒng)允許有修改答案:D121.HDFS的NameNode負(fù)責(zé)管理文件系統(tǒng)的命名空間,將所有的文件和文件夾的元數(shù)據(jù)保存在一個(gè)文件系統(tǒng)樹(shù)中,這些信息也會(huì)在硬盤(pán)上保存成以下文件A、日志B、命名空間鏡像C、兩者都是D、都不是答案:C122.hadoop1.X版本默認(rèn)BlockSize的大小是A、32MB、64MC、128MD、256M答案:B123.生成秘鑰的命令是A、ssh-keygenB、ssh-addC、ssh-copy-idD、ssh答案:A124.MapReduce框架提供了一種序列化鍵/值對(duì)的方法,支持這種序列化的類(lèi)能夠在Map和Reduce過(guò)程中充當(dāng)鍵或值,以下說(shuō)法錯(cuò)誤的是A、實(shí)現(xiàn)Writable接口的類(lèi)是值B、實(shí)現(xiàn)WritableComparable<T>接口的類(lèi)可以是值或鍵C、Hadoop的基本類(lèi)型Text并不實(shí)現(xiàn)WritableComparable<T>接口D、鍵和值的數(shù)據(jù)類(lèi)型可以超出Hadoop自身支持的基本類(lèi)型答案:C125.在NameNode高可用(HA)中,當(dāng)活動(dòng)節(jié)點(diǎn)失效時(shí),哪個(gè)節(jié)點(diǎn)將成為活動(dòng)節(jié)點(diǎn)A、SecondaryNameNodeB、ackupnodeC、StandbynodeD、Checkpointnode答案:C126.以下四個(gè)Hadoop預(yù)定義的Mapper實(shí)現(xiàn)類(lèi)的描述錯(cuò)誤的是A、IdentityMapper<K,V>實(shí)現(xiàn)Mapper<K,V,K,V>,將輸入直接映射到輸出B、InverseMapper<K,V>實(shí)現(xiàn)Mapper<K,V,K,V>,反轉(zhuǎn)鍵/值對(duì)C、RegexMapper<K>實(shí)現(xiàn)Mapper<K,Text,Text,LongWritable>,為每個(gè)常規(guī)表達(dá)式的匹配項(xiàng)生成一個(gè)(match,1)對(duì)D、TokenCountMapper<K>實(shí)現(xiàn)Mapper<K,Text,Text,LongWritable>,當(dāng)輸入的值為分詞時(shí),生成(taken,1)對(duì)答案:B多選題1.HadoopMapReduce對(duì)外提供了5個(gè)可編程組件,以下哪對(duì)中的方法或任務(wù)不全在這5個(gè)編程組件中A、Partitioner和CombinerB、Split和SortC、InputFormat和OutputFormatD、Mapper和Reducer答案:AB2.常用的HDFSAPI有哪些?A、rename()B、copyFromLocalFile()C、mkdirs()D、elete()答案:ABCD3.以下關(guān)于HDFS體系結(jié)構(gòu)的描述正確的有哪幾項(xiàng)?A、以下關(guān)于HDFS體系結(jié)構(gòu)的描述正確的有哪幾項(xiàng)?B、DataNode作為從結(jié)點(diǎn),用來(lái)管理存儲(chǔ)的數(shù)據(jù)。C、HDFS采用主從結(jié)構(gòu)模型。D、一個(gè)HDFS集群是由一個(gè)NameNode和若干個(gè)DataNode組成的。答案:ABCD4.HDFS中常用命令有下面哪些?A、hadoopfs–rmB、hadoopfs–lsC、hadoopfs–putD、hadoopfs–mv答案:ABCD5.以下哪些說(shuō)法是錯(cuò)誤的A、Zookeeper集群一般用來(lái)實(shí)現(xiàn)大數(shù)據(jù)存儲(chǔ)B、HDFS集群在第一次啟動(dòng)之前必須對(duì)NameNode格式化C、MapReduce中map任務(wù)的個(gè)數(shù)一定是由文件的block數(shù)來(lái)決定D、MapReduce的Shuffle階段組件的順序是:Partitioner、Sort、Combiner、Grouping答案:AC6.下列選項(xiàng)中,關(guān)于數(shù)據(jù)塊說(shuō)法正確的是A、磁盤(pán)進(jìn)行數(shù)據(jù)讀/寫(xiě)的最大單位B、磁盤(pán)進(jìn)行數(shù)據(jù)讀/寫(xiě)的最小單位C、數(shù)據(jù)塊是抽象的塊D、ataNode是按block對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)。答案:BCD7.下列選項(xiàng)中,說(shuō)法錯(cuò)誤的是A、在一個(gè)Agent中,同一個(gè)source可以有多個(gè)channelB、在一個(gè)Agent中,同一個(gè)sink可以有多個(gè)channelC、在一個(gè)Agent中,同一個(gè)source只能多1個(gè)channelD、在一個(gè)Agent中,同一個(gè)sink只能有1個(gè)channel答案:AD8.Hadoop提供的自定義配置時(shí)編輯的配置文件中,包含A、core-site.xmlB、hdfs-site.xmlC、mapred-site.xmlD、yarn-site.xml答案:ABCD9.Hadoop的三種安裝模式包括以下哪種?A、兩分布式模式B、完全分布式模式C、偽分布模式D、單機(jī)模式答案:BCD10.大數(shù)據(jù)的計(jì)算模式主要有哪些?A、圖計(jì)算模式B、流計(jì)算模式C、查詢(xún)分析計(jì)算模式D、批處理計(jì)算模式答案:ABC11.大數(shù)據(jù)采集中面臨的主要問(wèn)題有以下哪些?A、如何避免重復(fù)數(shù)據(jù)B、數(shù)據(jù)源多種多樣,數(shù)據(jù)量大、變化快C、如何保證數(shù)據(jù)的質(zhì)量D、如何保證數(shù)據(jù)采集的可靠性答案:ABCD12.客戶(hù)端上傳文件的時(shí)候哪項(xiàng)是正確的?A、數(shù)據(jù)經(jīng)過(guò)NameNode傳遞給DataNodeB、客戶(hù)端端將文件切分為多個(gè)Block,依次上傳C、客戶(hù)端只上傳數(shù)據(jù)到一臺(tái)DataNode,然后由NameNode負(fù)責(zé)Block復(fù)制工作D、客戶(hù)端發(fā)起文件上傳請(qǐng)求,通過(guò)RPC與NameNode建立通訊。答案:BD13.下列選項(xiàng)中,屬于Google提出的處理大數(shù)據(jù)的技術(shù)手段有A、MapReduceB、MySQLC、BigTableD、GFS答案:ACD14.以下關(guān)于大數(shù)據(jù)特點(diǎn)的描述中,不正確的是()。A、巨大的數(shù)據(jù)量B、多結(jié)構(gòu)化數(shù)據(jù)C、增長(zhǎng)速度快D、價(jià)值密度高答案:ABC15.下面說(shuō)法選項(xiàng)錯(cuò)誤的是A、在一個(gè)Agent中,同一個(gè)source可以有多個(gè)channelB、在一個(gè)Agent中,同一個(gè)sink可以有多個(gè)channelC、在一個(gè)Agent中,同一個(gè)source只能多1個(gè)channelD、在一個(gè)Agent中,同一個(gè)sink只能有1個(gè)channel答案:AD16.下面哪個(gè)組件可以在Hadoop集群中代替MR做一些計(jì)算?A、SparkB、SqoopC、HiveD、Avro答案:AC17.下列說(shuō)法中,關(guān)于配置參數(shù)說(shuō)法錯(cuò)誤的是A、1.sources.r1.channels=c1B、a1.sinks.k1.channel=c1C、a1.source.r1.channels=c1D、a1.sinks.k1.channels=c1答案:CD18.Hadoop核心組成部份包含A、HDFS存儲(chǔ)系統(tǒng)B、Hive數(shù)據(jù)倉(cāng)庫(kù)C、MapReduce運(yùn)算框架D、HBase分布式數(shù)據(jù)庫(kù)答案:AC19.大數(shù)據(jù)中常見(jiàn)的類(lèi)型有哪些?A、視頻B、圖片C、音頻D、日志答案:ABCD20.VMware提供了哪幾種工作模式?A、host-only僅主機(jī)模式B、NAT模式C、自定義除以上3種其他模式D、橋接(bridged)模式答案:ABD21.大數(shù)據(jù)技術(shù)方案為了簡(jiǎn)化并行分布式計(jì)算,采用()軟件模塊進(jìn)行處理A、JavaB、MapC、SQLD、Reduce答案:BD22.Hadoop集群具有以下哪個(gè)優(yōu)點(diǎn)?A、高容錯(cuò)性B、高成本性C、高可靠性D、高擴(kuò)展性答案:ACD23.以下關(guān)于SSH免密碼配置的描述正確的選項(xiàng)有哪個(gè)?A、SSH專(zhuān)為遠(yuǎn)程登錄會(huì)話(huà)和其他網(wǎng)絡(luò)服務(wù)提供安全性的協(xié)議。B、SSH是SecureShell的縮寫(xiě),則IETF的網(wǎng)絡(luò)工作小組制定。C、SSH是建立在應(yīng)用層和傳輸導(dǎo)上的安全協(xié)議。D、使用SSH公鑰登錄可以解決Hadoop集群節(jié)點(diǎn)之前的通信略掉需要輸入密碼才能登錄的步驟。答案:ABCD24.下列說(shuō)法中,關(guān)于使用JavaAPI操作HDFS說(shuō)法正確的是A、需要引入hadoop-common依賴(lài)B、需要引入hadoop-hdfs依賴(lài)C、需要引入hadoop-client依賴(lài)D、以上說(shuō)法均錯(cuò)誤答案:ABC25.以下關(guān)于文件塊的說(shuō)法正確的是?A、文件的所有Block為了容錯(cuò)都會(huì)被冗余復(fù)制。B、除了最后一個(gè)Block,所有的Block都是同樣的大小。C、每個(gè)文件的Block大小和復(fù)制(Replication)因子都是可配置的。D、HDFS將文件存儲(chǔ)成塊序列。答案:ABCD26.Hive數(shù)據(jù)表插入數(shù)據(jù)時(shí),insert()table……,括號(hào)中可使哪些關(guān)鍵字?A、intoB、appendC、overwriteD、add答案:AC27.大數(shù)據(jù)關(guān)鍵技術(shù)包括哪些?A、大數(shù)據(jù)存儲(chǔ)B、大數(shù)據(jù)預(yù)處理C、大數(shù)據(jù)采集D、大數(shù)據(jù)分析挖掘答案:ABCD28.以下關(guān)于序列化Writable的說(shuō)法正確的是?A、反序列化也稱(chēng)反串行化,它是指將字節(jié)流轉(zhuǎn)回結(jié)構(gòu)化對(duì)象的逆過(guò)程。B、Hadoop中使用自己開(kāi)發(fā)的類(lèi):IntWritable、FloatWritable、Text等,都是Writable的實(shí)現(xiàn)類(lèi)。C、序列化和反序列化在分布式數(shù)據(jù)處理中,主要于進(jìn)程間通信和永久存儲(chǔ)兩個(gè)領(lǐng)域。D、Writable接口是一個(gè)序列化對(duì)象的接口,能夠?qū)?shù)據(jù)寫(xiě)入流或者從流中讀出。答案:ABCD解析:A選項(xiàng)正確,反序列化確實(shí)是將字節(jié)流轉(zhuǎn)回結(jié)構(gòu)化對(duì)象的逆過(guò)程。B選項(xiàng)正確,Hadoop中確實(shí)使用了IntWritable、FloatWritable、Text等Writable的實(shí)現(xiàn)類(lèi)。C選項(xiàng)正確,序列化和反序列化在分布式數(shù)據(jù)處理中,主要用于進(jìn)程間通信和永久存儲(chǔ)。D選項(xiàng)正確,Writable接口確實(shí)定義了對(duì)象如何被序列化成字節(jié)流和從字節(jié)流中反序列化回來(lái)。29.下列選項(xiàng)中,在Reducer類(lèi)的run()方法中定義的三個(gè)方法有A、setup()B、reduce()C、leanup()D、map()答案:ABC30.關(guān)于數(shù)據(jù)副本的存放策略正確的有些?A、第三個(gè)副本:與第一個(gè)副本相同機(jī)架的其他節(jié)點(diǎn)上;B、更多副本:隨機(jī)節(jié)點(diǎn)。C、第一個(gè)副本,放置在上傳文件的數(shù)據(jù)節(jié)點(diǎn);D、第二個(gè)副本,放置在與第一個(gè)副本不同的機(jī)架的節(jié)點(diǎn)上;答案:ABCD31.下列說(shuō)法中,關(guān)于zoo.cfg配置文件中的參數(shù)server.1=hadoop01:2888:3888說(shuō)法正確的是A、1表示服務(wù)器的編號(hào)B、hadoop01表示這個(gè)服務(wù)器的IP地址C、2888表示表示Zookeeper服務(wù)器之間的通信心跳號(hào)D、3888表示Leader選舉的端口號(hào)答案:AB32.下列選項(xiàng)中,關(guān)于Metadata元數(shù)據(jù)說(shuō)法正確的是A、元數(shù)據(jù)維護(hù)HDFS文件系統(tǒng)中文件和目錄的信息B、元數(shù)據(jù)記錄與文件內(nèi)容存儲(chǔ)相關(guān)的信息C、元數(shù)據(jù)用來(lái)記錄HDFS中所有DataNode的信息D、元數(shù)據(jù)用于維護(hù)文件系統(tǒng)名稱(chēng)并管理客戶(hù)端對(duì)文件的訪(fǎng)問(wèn)答案:ABC33.下列說(shuō)法中,關(guān)于MapReduce性能調(diào)優(yōu)說(shuō)法正確的是A、在數(shù)據(jù)輸入階段,采用CombineTextInputFormat來(lái)作為輸入,可以解決輸入端大量的小文件場(chǎng)景B、在Map階段,減少溢寫(xiě)次數(shù),可以減少磁盤(pán)IOC、在Map階段,減少合并次數(shù),可以縮短MapReduce處理的時(shí)間D、在Shuffle階段,盡量給Shuffle提供更多的內(nèi)存空間,以防止出現(xiàn)內(nèi)存溢出現(xiàn)象答案:ABCD34.MapRecue的優(yōu)點(diǎn)有哪些?A、可擴(kuò)展性強(qiáng)計(jì)算機(jī)性能高B、容錯(cuò)性強(qiáng)C、開(kāi)發(fā)簡(jiǎn)單D、計(jì)算機(jī)性能高答案:BC35.下列有關(guān)Hadoop的說(shuō)法正確的是()。A、Hadoop最早起源于NutchB、Hadoop中HDFS的理念來(lái)源于谷歌發(fā)表的分布式文件系統(tǒng)(GFS)的論文C、Hadoop中MapReduce的思想來(lái)源于谷歌分布式計(jì)算框架MapReduce的論文D、Hadoop是在分布式服務(wù)器集群上存儲(chǔ)海量數(shù)據(jù)并運(yùn)行分布式分析應(yīng)用的一個(gè)開(kāi)源的軟件框架答案:ABCD36.以下哪個(gè)不是HDFS的組件A、NameNodeB、ResouceMangerC、NodeManagerD、SecondaryNameNode答案:BC37.配置Hadoop集群時(shí),下列哪個(gè)Hadoop配置文件需要進(jìn)行修改?A、hadoop-env.shB、profileC、ore-site.xmlD、ifcfg-eth0答案:AC38.下列說(shuō)法中,關(guān)于InputFormat接口定義的getSplits()方法說(shuō)法正確的是A、用來(lái)從分片中讀取數(shù)據(jù)B、負(fù)責(zé)創(chuàng)建RecordReader對(duì)象C、實(shí)現(xiàn)了邏輯切片機(jī)制D、getSplits()方法的切片大小splitSize是由minSize、maxSize和blockSize的值確定的答案:CD39.Hadoop生態(tài)系統(tǒng)的優(yōu)勢(shì)包含A、高擴(kuò)展B、低成本C、開(kāi)源工具成熟D、型關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)答案:ABC40.以下哪些工具屬于Hadoop生態(tài)系統(tǒng)的開(kāi)源工具A、HiveB、HBaseC、ZookerperD、Mysql答案:ABC41.下列選項(xiàng)中,關(guān)于Hadoop集群說(shuō)法正確的是A、Hadoop集群包含Worker節(jié)點(diǎn)B、Hadoop集群包含Master節(jié)點(diǎn)C、Hadoop集群包含Slave節(jié)點(diǎn)D、Hadoop集群包含HMaster節(jié)點(diǎn)答案:BC判斷題1.執(zhí)行“start-all.sh”指令,可以一鍵啟動(dòng)整個(gè)Hadoop集群的服務(wù)A、正確B、錯(cuò)誤答案:A2.鏈?zhǔn)組apReduce計(jì)算中,對(duì)任意一個(gè)MapReduce作業(yè),Map和Reduce階段可以有無(wú)限個(gè)Mapper,但Reducer只能有一個(gè)A、正確B、錯(cuò)誤答案:A3.每次啟動(dòng)Hadoop都要格式化文件系統(tǒng)A、正確B、錯(cuò)誤答案:B4.ReduceTask作為MapReduce工作流程的后半部分,主要經(jīng)歷了Copy階段、Merge階段、Sort階段、Reduce階段和Write階段。A、正確B、錯(cuò)誤答案:A5.MapReduce的inputsplit一定是一個(gè)blockA、正確B、錯(cuò)誤答案:B6.MapRecue在shuffle階段基于排序的方法會(huì)將key相同的數(shù)據(jù)聚集在一起。A、正確B、錯(cuò)誤答案:A7.再創(chuàng)建外部表的同時(shí)要加載數(shù)據(jù)文件,數(shù)據(jù)文件會(huì)移動(dòng)到數(shù)據(jù)倉(cāng)庫(kù)指定的目錄下。A、正確B、錯(cuò)誤答案:B8.在HDFS中,namenode用于決定數(shù)據(jù)存儲(chǔ)到哪一個(gè)datanode節(jié)點(diǎn)上。A、正確B、錯(cuò)誤答案:A9.對(duì)于MapReduce任務(wù)來(lái)說(shuō),一定需要Reduce過(guò)程。A、正確B、錯(cuò)誤答案:B10.設(shè)置免密登錄需要先用ssh-keygen生成一對(duì)密鑰A、正確B、錯(cuò)誤答案:A11.ResourceManager負(fù)責(zé)監(jiān)控ApplicationMaster,并在ApplicationMaster運(yùn)行失敗的時(shí)候重啟它,因此ResouceManager負(fù)責(zé)ApplicationMaster內(nèi)部任務(wù)的容錯(cuò)A、正確B、錯(cuò)誤答案:B12.DataNode在客戶(hù)端或者NameNode的調(diào)度下,存儲(chǔ)并檢索數(shù)據(jù)塊,對(duì)數(shù)據(jù)塊進(jìn)行創(chuàng)建、刪除等操作。A、正確B、錯(cuò)誤答案:A13.datanode負(fù)責(zé)存儲(chǔ)數(shù)據(jù)A、正確B、錯(cuò)誤答案:A14.非全新集群選舉時(shí)是優(yōu)中選優(yōu),保證Leader是Zookeeper集群中數(shù)據(jù)最完整、最可靠的一臺(tái)服務(wù)器。A、正確B、錯(cuò)誤答案:A15.Hadoop存在多個(gè)副本,且默認(rèn)備份數(shù)量是3。A、正確B、錯(cuò)誤答案:A16.Zookeeper提供的getChildren()方法可以用于獲取指定節(jié)點(diǎn)下的所有子節(jié)點(diǎn)列表。A、正確B、錯(cuò)誤答案:A17.Secondarynamenode就是namenode出現(xiàn)問(wèn)題時(shí)的備用節(jié)點(diǎn)A、正確B、錯(cuò)誤答案:B18.數(shù)據(jù)倉(cāng)庫(kù)可以作為實(shí)時(shí)查詢(xún)系統(tǒng)的數(shù)據(jù)庫(kù)使用,為決策分析提供數(shù)據(jù)。A、正確B、錯(cuò)誤答案:B19.Hadoop支持?jǐn)?shù)據(jù)的隨機(jī)讀寫(xiě)A、正確B、錯(cuò)誤答案:B20.安裝Hadoop時(shí),配置項(xiàng)”dfs.replication”是配置在文件core-site.xmlA、正確B、錯(cuò)誤答案:B21.簡(jiǎn)述ZooKeeper的功能及其在Hadoop高可用中起到的作用。A、正確B、錯(cuò)誤答案:A22.Hive的復(fù)雜數(shù)據(jù)類(lèi)型中,Map是有序鍵值對(duì)類(lèi)型,Key值必須為原始類(lèi)型,Value可以為任意類(lèi)型。A、正確B、錯(cuò)誤答案:B23.MapReduce任務(wù)會(huì)根據(jù)機(jī)架獲取離自己比較近的網(wǎng)絡(luò)數(shù)據(jù)。A、正確B、錯(cuò)誤答案:A24.HadoopHA是兩臺(tái)NameNode同時(shí)執(zhí)行NameNode角色的工作。A、正確B、錯(cuò)誤答案:B25.Combiner組件可以讓Map對(duì)Key進(jìn)行分區(qū),從而可以根據(jù)不同的key分發(fā)到不同的Reduce中去處理。A、正確B、錯(cuò)誤答案:A26.SecondaryNameNode是NameNode的備份,可以有效解決Hadoop集群?jiǎn)吸c(diǎn)故障問(wèn)題。A、正確B、錯(cuò)誤答案:B27.由于Hive系統(tǒng)架構(gòu)中由跨語(yǔ)言服務(wù)ThriftServe組成,它能夠讓不同的編程語(yǔ)言調(diào)用Hive的接口。A、正確B、錯(cuò)誤答案:A28.使用內(nèi)嵌的Derby數(shù)據(jù)庫(kù)存儲(chǔ)元數(shù)據(jù),這種方式是Hive的默認(rèn)安裝方式,配置簡(jiǎn)單,但是一次只能連接一個(gè)客戶(hù)端,適合用來(lái)測(cè)試,不適合生產(chǎn)環(huán)境A、正確B、錯(cuò)誤答案:A29.NameNode本地磁盤(pán)保存了數(shù)據(jù)塊的位置信息。A、正確B、錯(cuò)誤答案:B30.Hadoop是IBM公司開(kāi)發(fā)的一款商用大數(shù)據(jù)軟件A、正確B、錯(cuò)誤答案:B31.因?yàn)镠DFS有多個(gè)副本,所以NameNode是不存在單點(diǎn)問(wèn)題的A、正確B、錯(cuò)誤答案:B32.在Hadoop2.x版本下,Block數(shù)據(jù)塊的默認(rèn)大小是64MA、正確B、錯(cuò)誤答案:B33.創(chuàng)建項(xiàng)目時(shí),創(chuàng)建者將自動(dòng)在項(xiàng)目上給予admin狀態(tài)。允許創(chuàng)建者查看,上傳,更改作業(yè),運(yùn)行流程,刪除并向項(xiàng)目添加用戶(hù)權(quán)限。A、正確B、錯(cuò)誤答案:A34.由于Hadoop是使用Java語(yǔ)言編寫(xiě)的,因此可以使用JavaAPI操作Hadoop文件系統(tǒng)。A、正確B、錯(cuò)誤答案:A35.HDFS中提供SecondaryNameNode節(jié)點(diǎn),是為了取代掉NameNode節(jié)點(diǎn)。A、正確B、錯(cuò)誤答案:B36.Flume采集方案的名稱(chēng)、位置、以及sources、channels、sinks參數(shù)配置信息可以隨定義。A、正確B、錯(cuò)誤答案:B37.Hadoop在設(shè)計(jì)時(shí)考慮到數(shù)據(jù)的安全與高效,數(shù)據(jù)文件默認(rèn)在HDFS上存放一份。A、正確B、錯(cuò)誤答案:B38.HDFS既適合超大數(shù)據(jù)集存儲(chǔ),也適合小數(shù)據(jù)集的存儲(chǔ)。A、正確B、錯(cuò)誤答案:B39.如果沒(méi)有指定“–num-mappers1”(或-m1,即map任務(wù)個(gè)數(shù)為1),那么在指令中必須還要添加“–split-by”參數(shù)A、正確B、錯(cuò)誤答案:A40.由于Zookeeper集群的運(yùn)行不需要Java環(huán)境支持,所以不需要提前安裝JDK。A、正確B、錯(cuò)誤答案:B41.Flume-og與Flume-ng兩個(gè)版本基本相同,開(kāi)發(fā)者可以使用任意一款工具。A、正確B、錯(cuò)誤答案:B42.當(dāng)我們完成Hadoop集群的安裝和配置后,就可以直接啟動(dòng)集群。A、正確B、錯(cuò)誤答案:B43.Map階段處理數(shù)據(jù)時(shí),是按照Key的哈希值與ReduceTask數(shù)量取模進(jìn)行分區(qū)的規(guī)則。A、正確B、錯(cuò)誤答案:A44.啟動(dòng)Hadoop集群,只能有一種方式啟動(dòng),即單節(jié)點(diǎn)逐個(gè)啟動(dòng)A、正確B、錯(cuò)誤答案:B45.在采集數(shù)據(jù)的過(guò)程中,通過(guò)在滾動(dòng)完文件的名稱(chēng)后添加一個(gè)標(biāo)識(shí)的策略,不能避免因日志文件過(guò)大而導(dǎo)致上傳效率低的問(wèn)題。A、正確B、錯(cuò)誤答案:B46.查看Linuxip的命令是ifconfigA、正確B、錯(cuò)誤答案:A47.NameNode本地磁盤(pán)保存了Block的位置信息A、正確B、錯(cuò)誤答案:B48.啟動(dòng)Hadoop集群時(shí),可能出現(xiàn)NodeManager進(jìn)程無(wú)法啟動(dòng)或者啟動(dòng)后自動(dòng)關(guān)閉情況,這是由于系統(tǒng)內(nèi)存和資源分配不足導(dǎo)致的A、正確B、錯(cuò)誤答案:A49.Hadoop下使用MapRecue。用戶(hù)只要繼承MapReduceBase,提供分別實(shí)現(xiàn)Map和Reduce的兩個(gè)類(lèi),并注冊(cè)Job即可自動(dòng)分布式運(yùn)行。A、正確B、錯(cuò)誤答案:A50.–append參數(shù)是將數(shù)據(jù)追加到HDFS上一個(gè)已存在的數(shù)據(jù)集上A、正確B、錯(cuò)誤答案:A51.FlumeAgent是一個(gè)JVM進(jìn)程,它承載著數(shù)據(jù)從外部源流向下一個(gè)目標(biāo)的三個(gè)核心組件是Source、Channel和Sink。A、正確B、錯(cuò)誤答案:A52.“–target-dir”參數(shù)是指定HDFS目標(biāo)目錄地址,因此需要提前創(chuàng)建目標(biāo)文件。A、正確B、錯(cuò)誤答案:B53.TaildirSource用于觀察指定的文件,可以實(shí)時(shí)監(jiān)測(cè)到添加到每個(gè)文件的新行,如果文件正在寫(xiě)入新行,則此采集器將重試采集它們以等待寫(xiě)入完成。A、正確B、錯(cuò)誤答案:A54.偽分布式模式下的Hadoop功能與完全分布式模式下的Hadoop功能相同A、正確B、錯(cuò)誤答案:B55.在/etc/hosts文件映射ip和主機(jī)名稱(chēng)A、正確B、錯(cuò)誤答案:A56.在Linux中,mkdir命令主要用于在指定路徑下創(chuàng)建子目錄。A、正確B、錯(cuò)誤答案:A57.HDFS適用于低延遲數(shù)據(jù)訪(fǎng)問(wèn)的場(chǎng)景,例如毫秒級(jí)實(shí)時(shí)查詢(xún)。A、正確B、錯(cuò)誤答案:B58.雪花模型需要關(guān)聯(lián)多層維度表,這與結(jié)構(gòu)簡(jiǎn)單的星型模型相比性能較低,所以通常不使用。A、正確B、錯(cuò)誤答案:A59.Hadoop是Apache頂級(jí)的開(kāi)源項(xiàng)目A、正確B、錯(cuò)誤答案:A60.由于Combiner組件不允許改變業(yè)務(wù)邏輯,所以無(wú)論調(diào)用多少次Combiner,Reduce的輸出結(jié)果都是一樣的。A、正確B、錯(cuò)誤答案:A61.rop內(nèi)部表時(shí),會(huì)刪除hdfs上的文件夾和元數(shù)據(jù)。A、正確B、錯(cuò)誤答案:A62.在Windows平臺(tái)開(kāi)發(fā)HDFS項(xiàng)目時(shí),若不設(shè)置Hadoop開(kāi)發(fā)環(huán)境,也是沒(méi)問(wèn)題的A、正確B、錯(cuò)誤答案:B63.FlumeAgent是一個(gè)JVM進(jìn)程,它承載著數(shù)據(jù)從外部源流向下一個(gè)目標(biāo)的三個(gè)核心組件是Source、Channel和Sink。A、正確B、錯(cuò)誤答案:A64.MapReduce編程模型借鑒了面向過(guò)程的編程語(yǔ)言的設(shè)計(jì)思想。A、正確B、錯(cuò)誤答案:B65.當(dāng)我們配置好虛擬機(jī)的主機(jī)名和IP映射,就可以正常使用虛擬機(jī)。A、正確B、錯(cuò)誤答案:B66.sortby關(guān)鍵字的作用是保證全局有序A、正確B、錯(cuò)誤答案:A67.ClouderaCDH是需要付費(fèi)使用的A、正確B、錯(cuò)誤答案:B68.HadoopHA集群中,存在SecondaryNameNode進(jìn)程,協(xié)調(diào)NameNode并保持同步狀態(tài)。A、正確B、錯(cuò)誤答案:B69.Hadoop1.x版本中,可以搭建高可用集群,解決單點(diǎn)故障問(wèn)題。A、正確B、錯(cuò)誤答案:B70.在安裝部署Hadoop集群之前,不需要提前安裝并配置好JDK。A、正確B、錯(cuò)誤答案:B71.MapTask作為MapReduce工作流程的前半部分,它主要經(jīng)歷Read階段、Map階段、Collect階段、Spill階段和Shuffle階段。A、正確B、錯(cuò)誤答案:B72.設(shè)計(jì)Flume采集系統(tǒng)架構(gòu)時(shí),Sink組件數(shù)據(jù)可以流向一個(gè)新的Agent的Source組件。A、正確B、錯(cuò)誤答案:A73.Flume負(fù)載均衡接收器處理器能夠在多個(gè)Sink上進(jìn)行均衡流量的功能。A、正確B、錯(cuò)誤答案:A74.Zookeeper的選舉機(jī)制,實(shí)際上是采用算法FastLeaderElection,投票數(shù)大于半數(shù)則勝出的機(jī)制。A、正確B、錯(cuò)誤答案:A75.hadoopdfsadmin–report命令用于檢測(cè)HDFS損壞塊。A、正確B、錯(cuò)誤答案:B76.Hadoop自身具有嚴(yán)格的權(quán)限管理和安全措施保障集群正常運(yùn)行。A、正確B、錯(cuò)誤答案:B77.Hive分區(qū)字段不能與已存在字段重復(fù),且分區(qū)字段是一個(gè)虛擬的字段,它不存放任何數(shù)據(jù),該數(shù)據(jù)來(lái)源于裝載分區(qū)表時(shí)所指定的數(shù)據(jù)文。A、正確B、錯(cuò)誤答案:A78.NameNode負(fù)責(zé)管理元數(shù)據(jù)信息metadata,client端每次讀寫(xiě)請(qǐng)求,它都會(huì)從磁盤(pán)中讀取或會(huì)寫(xiě)入metadata信息并反饋給client端A、正確B、錯(cuò)誤答案:B79.如果一個(gè)機(jī)架出問(wèn)題,Hadoop集群服務(wù)不會(huì)影響數(shù)據(jù)讀寫(xiě)功能A、正確B、錯(cuò)誤答案:A80.MapReduce計(jì)算過(guò)程中,相同的key默認(rèn)會(huì)被發(fā)送到同一個(gè)reducetask處理A、正確B、錯(cuò)誤答案:A81.--target-dir參數(shù)是指定HDFS目標(biāo)目錄地址,因此需要提前創(chuàng)建目標(biāo)文件。A、正確B、錯(cuò)誤答案:B82.通過(guò)使用虛擬機(jī)軟件(如VMwareWorkstation),可以在同一臺(tái)電腦上構(gòu)建多個(gè)Linux虛擬機(jī)環(huán)境A、正確B、錯(cuò)誤答案:A83.偽分布式模式下的Hadoop功能與完全分布式模式下的Hadoop功能相同。A、正確B、錯(cuò)誤答案:A84.LoggerSink通常用于調(diào)試,LoggerSink接收器的不同處是它不需要在記錄原始數(shù)據(jù)部分中說(shuō)明額外的配置。A、正確B、錯(cuò)誤答案:A85.大數(shù)據(jù)在醫(yī)療行業(yè)中可以有效控制疾病的發(fā)生。A、正確B、錯(cuò)誤答案:B86.在安裝配置windows平臺(tái)hadoop,配置后直接運(yùn)行是沒(méi)有問(wèn)題的A、正確B、錯(cuò)誤答案:B87.啟動(dòng)Zookeeper服務(wù)的命令是“zkServer.shstart”A、正確B、錯(cuò)誤答案:A88.在整個(gè)數(shù)據(jù)傳輸?shù)倪^(guò)程中,Flume將流動(dòng)的數(shù)據(jù)封裝到一個(gè)event(事件)中,它是Flume內(nèi)部數(shù)據(jù)傳輸?shù)幕締卧?。A、正確B、錯(cuò)誤答案:A89.Hadoop實(shí)現(xiàn)了一個(gè)分布式文件系統(tǒng),簡(jiǎn)稱(chēng)HDFS。A、正確B、錯(cuò)誤答案:A90.大數(shù)據(jù)提供的是一些描述性的信息,而創(chuàng)新還是需要人類(lèi)自己實(shí)現(xiàn)。A、正確B、錯(cuò)誤答案:A91.DataNode是HDFS集群的主節(jié)點(diǎn),NameNode是HDFS集群的從節(jié)點(diǎn)。A、正確B、錯(cuò)誤答案:B92.創(chuàng)建外部表的同時(shí)要加載數(shù)據(jù)文件,數(shù)據(jù)文件會(huì)移動(dòng)到數(shù)據(jù)倉(cāng)庫(kù)指定的目錄下。A、正確B、錯(cuò)誤答案:B93.Hadoop集群執(zhí)行完MapReduce程序后,會(huì)輸出_SUCCESS和part-r-00000結(jié)果文件。A、正確B、錯(cuò)誤答案:A94.“–where“city=‘sec-bad’””指令表示篩選出MySQL數(shù)據(jù)庫(kù)表字段為city=sec-bad的數(shù)據(jù)。A、正確B、錯(cuò)誤答案:A95.Hive默認(rèn)不支持動(dòng)態(tài)分區(qū)功能,需要手動(dòng)設(shè)置動(dòng)態(tài)分區(qū)參數(shù)開(kāi)啟功能。A、正確B、錯(cuò)誤答案:A96.Flume將流動(dòng)的數(shù)據(jù)封裝到一個(gè)event(事件)中,它是Flume內(nèi)部數(shù)據(jù)傳輸?shù)幕締卧?。A、正確B、錯(cuò)誤答案:A97.MapReduce是Hadoop系統(tǒng)核心組件之一,它是一種可用于大數(shù)據(jù)并行處理的計(jì)算模型、框架和平臺(tái)對(duì)A、正確B、錯(cuò)誤答案:A98.“–query”參數(shù)后的查詢(xún)語(yǔ)句中,如果已經(jīng)使用了WHERE關(guān)鍵字,那么在連接CONDITIONS占位符前必須使用AND關(guān)鍵字;否則,就必須使用WHERE關(guān)鍵字連接。A、正確B、錯(cuò)誤答案:A99.在MapReduce程序中,只有Map階段涉及到Shuffle機(jī)制。A、正確B、錯(cuò)誤答案:B100.NameNode負(fù)責(zé)管理元數(shù)據(jù),客戶(hù)端每次讀寫(xiě)請(qǐng)求時(shí),都會(huì)從磁盤(pán)中讀取或?qū)懭朐獢?shù)據(jù)信息并反饋給客戶(hù)端。A、正確B、錯(cuò)誤答案:A101.寫(xiě)入數(shù)據(jù)的時(shí)候會(huì)寫(xiě)到不同機(jī)架的DataNode中A、正確B、錯(cuò)誤答案:A102.Hive使用MySQL作為存儲(chǔ)元數(shù)據(jù)的數(shù)據(jù)庫(kù)時(shí),在安裝時(shí)需要將MySQL連接驅(qū)動(dòng)Jar包拷貝到lib目錄中。A、正確B、錯(cuò)誤答案:A103.Flume采集方案的名稱(chēng)、位置、以及sources、channels、sinks參數(shù)配置信息可以任意定義A、正確B、錯(cuò)誤答案:A104.配置Hadoop集群只需要修改core-site.xml配置文件就可以。A、正確B、錯(cuò)誤答案:B105.關(guān)于hadoopha說(shuō)法,每一個(gè)集群只有一個(gè)活躍的NNA、正確B、錯(cuò)誤答案:A106.SecondaryNameNode可以有效縮短Hadoop集群的啟動(dòng)時(shí)間。A、正確B、錯(cuò)誤答案:A107.SpoolingDirectorySource對(duì)指定磁盤(pán)上的文件目錄進(jìn)行監(jiān)控并提取數(shù)據(jù),但是不能查看新增文件數(shù)據(jù)A、正確B、錯(cuò)誤答案:B108.HDFS的namenode保存了一個(gè)文件包括哪些數(shù)據(jù)塊,分布在哪些數(shù)據(jù)節(jié)點(diǎn)上,這些信息也存儲(chǔ)在硬盤(pán)上。A、正確B、錯(cuò)誤答案:B109.通過(guò)擴(kuò)容的方式,解決不了傳統(tǒng)文件系統(tǒng)遇到存儲(chǔ)瓶頸的問(wèn)題。A、正確B、錯(cuò)誤答案:B110.帶有倒排索引的文件我們稱(chēng)為倒排索引文件,簡(jiǎn)稱(chēng)倒排文件。A、正確B、錯(cuò)誤答案:A111.HDFS上傳時(shí),數(shù)據(jù)會(huì)經(jīng)過(guò)NameNode然后再傳遞給DataNode。A、正確B、錯(cuò)誤答案:B112.臨時(shí)節(jié)點(diǎn)允許擁有子節(jié)點(diǎn)。A、正確B、錯(cuò)誤答案:B113.Hadoop的開(kāi)源社區(qū)版比較著名的是Cloudera公司的CDH版本。A、正確B、錯(cuò)誤答案:B114.SecondaryNameNode應(yīng)與NameNode部署到一個(gè)節(jié)點(diǎn)A、正確B、錯(cuò)誤答案:B115.Hive使用length()函數(shù)可以求出輸出的數(shù)量。A、正確B、錯(cuò)誤答案:B116.SecureCRT是一款支持SSH的終端仿真程序,它能夠在Windows操作系統(tǒng)上遠(yuǎn)程連接Linux服務(wù)器執(zhí)行操作。A、正確B、錯(cuò)誤答案:A117.命名服務(wù)是分布式系統(tǒng)中比較常見(jiàn)的一類(lèi)場(chǎng)景,發(fā)布者將需要全局統(tǒng)一管理的數(shù)據(jù)發(fā)布到Zookeeper節(jié)點(diǎn)上,供訂閱者動(dòng)態(tài)獲取數(shù)據(jù),實(shí)現(xiàn)配置信息的集中式管理和動(dòng)態(tài)更新。A、正確B、錯(cuò)誤答案:B118.NodeManager是每個(gè)節(jié)點(diǎn)上的資源和任務(wù)管理器。A、正確B、錯(cuò)誤答案:A119.Hive的String類(lèi)型相當(dāng)于MySQL數(shù)據(jù)庫(kù)的varchar類(lèi)型,該類(lèi)型是一個(gè)可變長(zhǎng)度的字符串,理論上可以存儲(chǔ)2GB的字符數(shù)。A、正確B、錯(cuò)誤答案:A120.Slave節(jié)點(diǎn)要存儲(chǔ)數(shù)據(jù),所以它的磁盤(pán)越大越好。A、正確B、錯(cuò)誤答案:B121.processor.backoff屬性默認(rèn)值為true,表示sink處理器會(huì)將失敗的sink列入黑名單。A、正確B、錯(cuò)誤答案:B122.客戶(hù)端上傳文件的時(shí)候會(huì)先將文件切分為多個(gè)Block,依次上傳。A、正確B、錯(cuò)誤答案:A123.Hadoop是一個(gè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架,能夠處理PB級(jí)數(shù)據(jù)A、正確B、錯(cuò)誤答案:A124.TaildirSource用于觀察指定的文件,可以實(shí)時(shí)監(jiān)測(cè)到添加到每個(gè)文件的新行,如果文件正在寫(xiě)入新行,則此采集器將重試采集它們以等待寫(xiě)入完成。A、正確B、錯(cuò)誤答案:A125.NameNode的WebUI端口是50030,它通過(guò)jetty啟動(dòng)的Web服務(wù)A、正確B、錯(cuò)誤答案:B126.Hadoop是Java語(yǔ)言開(kāi)發(fā)的,因此在搭建Hadoop集群時(shí),需要為集群安裝JDK環(huán)境變量。A、正確B、錯(cuò)誤答案:A127.NameNode本地磁盤(pán)保存了Block的位置信息。A、正確B、錯(cuò)誤答案:A128.在大數(shù)據(jù)框架中,批處理系統(tǒng)一般不適用于對(duì)延時(shí)要示較高的場(chǎng)景。A、正確B、錯(cuò)誤答案:A129.MapReduce適于PB級(jí)別以上的海量數(shù)據(jù)在線(xiàn)處理A、正確B、錯(cuò)誤答案:B130.MapReduce的數(shù)據(jù)流模型可能只有Map過(guò)程,由Map產(chǎn)生的數(shù)據(jù)直接被寫(xiě)入HDFS中。A、正確B、錯(cuò)誤答案:A131.HadoopHA是集群中啟動(dòng)兩臺(tái)或兩臺(tái)以上機(jī)器充當(dāng)NameNode,避免一臺(tái)NameNode節(jié)點(diǎn)發(fā)生故障導(dǎo)致整個(gè)集群不可用的情況。A、正確B、錯(cuò)誤答案:A132.使用–create-hive-table指令導(dǎo)入數(shù)據(jù)時(shí),Hive數(shù)據(jù)倉(cāng)庫(kù)中必須存在指定表。A、正確B、錯(cuò)誤答案:B133.HDFS目前不支持并發(fā)多用戶(hù)的寫(xiě)操作,寫(xiě)操作只能在文件末尾追加數(shù)據(jù)。A、正確B、錯(cuò)誤答案:A134.Hadoop的框架最核心的設(shè)計(jì)就是:HDFS和MapReduceA、正確B、錯(cuò)誤答案:A135.分區(qū)表時(shí)Hive數(shù)據(jù)模型的最小單元,在Hive存儲(chǔ)上的體現(xiàn)就是在表的主目錄下的一個(gè)子文件夾。A、正確B、錯(cuò)誤答案:B136.Channel組件對(duì)采集到的數(shù)據(jù)進(jìn)行緩存,可以
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 專(zhuān)項(xiàng)11 古詩(shī)文閱讀(解析版)
- 2025屆四川省成都市高三第二次診斷考試政治試題(原卷版+解析版)
- 《物聯(lián)網(wǎng)技術(shù)案例教程》課件-第8章46
- 勸學(xué)教學(xué)設(shè)計(jì)
- 四海省廣元市蒼溪縣2024-2025學(xué)年九年級(jí)上學(xué)期期末質(zhì)量監(jiān)測(cè)數(shù)學(xué)試題 (原卷版+解析版)
- 《跨境電商》課件-9.跨境店鋪優(yōu)化
- 《Linux操作系統(tǒng)》課件-1.認(rèn)識(shí)Linux(全)
- 景區(qū)開(kāi)發(fā)石子運(yùn)輸合同樣本
- 項(xiàng)目協(xié)作與會(huì)議記錄會(huì)議紀(jì)要
- 廣告行業(yè)廣告投放手冊(cè)
- 2025年高考化學(xué)復(fù)習(xí)策略講座
- 粵教板2019高中信息技術(shù)必修一全冊(cè)練習(xí)附答案
- 二人銷(xiāo)售合作協(xié)議書(shū)模板
- 食品經(jīng)營(yíng)安全管理制度目錄
- 【中職數(shù)學(xué)】北師大版基礎(chǔ)模塊上冊(cè) 第4單元《指數(shù)函數(shù)與對(duì)數(shù)函數(shù)》4.4.2 對(duì)數(shù)函數(shù)的圖像與性質(zhì)(第10-11課時(shí))教學(xué)設(shè)計(jì)
- 第14課推進(jìn)綠色發(fā)展的課件
- 2024上海高考英語(yǔ)句子翻譯模擬試題及答案解析
- 網(wǎng)絡(luò)與信息安全管理員試題庫(kù)(附參考答案)
- 醫(yī)院等級(jí)評(píng)審醫(yī)療組現(xiàn)場(chǎng)檢查路徑
- 2024年江蘇海事職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)及答案解析
- 第1課+古代亞非【中職專(zhuān)用】《世界歷史》(高教版2023基礎(chǔ)模塊)
評(píng)論
0/150
提交評(píng)論