大數(shù)據(jù)分析師理論知識考試復(fù)習(xí)題庫（含答案）

上傳人：r*** IP屬地：山東上傳時(shí)間：2023-08-06 格式：DOCX 頁數(shù)：128 大?。?12.93KB 積分：15 舉報(bào) 版權(quán)申訴

大數(shù)據(jù)分析師理論知識考試復(fù)習(xí)題庫（含答案）_第2頁

大數(shù)據(jù)分析師理論知識考試復(fù)習(xí)題庫（含答案）_第3頁

大數(shù)據(jù)分析師理論知識考試復(fù)習(xí)題庫（含答案）_第4頁

大數(shù)據(jù)分析師理論知識考試復(fù)習(xí)題庫（含答案）_第5頁

已閱讀5頁，還剩123頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

PAGEPAGE1大數(shù)據(jù)分析師理論知識考試復(fù)習(xí)題庫（含答案）一、單選題1.Spark是用以下那種編程語言實(shí)現(xiàn)的？A、cB、C++C、javaD、Scala答案：D解析：Spark中用Scala開發(fā)語法簡潔許多，且支持類型推斷，可大大提升開發(fā)效率。2.在FusinInsightManager界面中，對Lader的操作不包括下列哪個(gè)選項(xiàng)（）A、切換Lader主備節(jié)點(diǎn)B、啟動Lader實(shí)例C、配置Lader參數(shù)D、查看Lader服務(wù)狀態(tài)答案：A解析：在FusinInsight界面中，對Lader的操作不包括切換Lader主備節(jié)點(diǎn)3.Hive不適用于以下哪個(gè)場景單選A、非實(shí)時(shí)分析，例如日析B、數(shù)據(jù)挖掘，例如用戶析，區(qū)域展示C、數(shù)據(jù)匯總，例如母天,每擊數(shù)，點(diǎn)擊排行D、實(shí)時(shí)在線數(shù)答案：D解析：Hive不適用于實(shí)時(shí)在線數(shù)單選。由于hive主要用于數(shù)據(jù)分析，因此延時(shí)比較高，不適用于實(shí)時(shí)場景，適用于離線大數(shù)據(jù)分析4.Hadp平臺中HBase的Regin是由哪個(gè)服務(wù)進(jìn)程來管理？A、HMasterB、DataNdeC、ReginServerD、Zkeeper答案：C解析：Hadp平臺中HBase的Regin是由ReginServer管理5.Hadp組件在企業(yè)應(yīng)用中，能用于大數(shù)據(jù)集實(shí)時(shí)查詢的產(chǎn)品有（）。A、HiveB、PigC、MahutD、Hbase答案：D解析：Hadp組件在企業(yè)應(yīng)用中，能用于大數(shù)據(jù)集實(shí)時(shí)查詢的產(chǎn)品有Hbase。6.下列選項(xiàng)中無法通過大數(shù)據(jù)技術(shù)實(shí)現(xiàn)的是？（）A、商業(yè)模式發(fā)現(xiàn)B、信用評估C、商品推薦D、運(yùn)營分析答案：A解析：商業(yè)模式發(fā)現(xiàn)無法通過大數(shù)據(jù)技術(shù)實(shí)現(xiàn)7.日常數(shù)據(jù)通報(bào)型報(bào)告的特點(diǎn)錯(cuò)誤的是（）。A、進(jìn)度性B、規(guī)范性C、時(shí)效性D、全面性答案：D解析：日常數(shù)據(jù)通報(bào)型報(bào)告的特點(diǎn)有進(jìn)度性，規(guī)范性，時(shí)效性。https://zhuanlan.zhihu./p/53857057日常數(shù)據(jù)通報(bào)是以定期數(shù)據(jù)分析報(bào)表為依據(jù)，反映計(jì)劃執(zhí)行情況，并分析影響和形成原因的一種數(shù)據(jù)分析報(bào)告。這種數(shù)據(jù)分析報(bào)告一般是按日、周、月、季、年等時(shí)間階段定期進(jìn)行，所以也叫定期分析報(bào)告。8.HBase依賴()提供強(qiáng)大的計(jì)算能力A、PrtbufB、JavaC、KafkaD、Chubby答案：D解析：谷歌收購云計(jì)算公司CuldSimple強(qiáng)化云計(jì)算能力9.以下關(guān)于Hive操作描述不正確的是（）。A、Hive是一個(gè)建立在hadp文件系統(tǒng)上的數(shù)據(jù)倉庫架構(gòu)，可以用其對HDFS上B、Hive依賴于MapReduce處理數(shù)據(jù)C、Hive的加載數(shù)據(jù)時(shí)候，可以用lcal進(jìn)行修飾，表示從某個(gè)本地目錄下加載數(shù)據(jù)D、Hive—般可以用于實(shí)時(shí)的查詢分析答案：D解析：Hive不可以用于實(shí)時(shí)的查詢分析10.以下關(guān)于繼承的敘述正確的是（）A、在Java中類只允許單一繼承B、在Java中一個(gè)類只能實(shí)現(xiàn)一個(gè)接nC、在Java中一個(gè)類不能同時(shí)繼承一個(gè)類和實(shí)現(xiàn)一個(gè)接口D、在Java中接口只允許單一繼承答案：A解析：繼承分為單繼承和多繼承兩種形式。單繼承允許一個(gè)類可以有多個(gè)子類，但只能有一個(gè)父類；多繼承則允許一個(gè)類不僅可以有多個(gè)子類，還可以有多個(gè)父類。但需要注意一點(diǎn)，Java只支持單繼承，但可以通過接口實(shí)現(xiàn)多繼承的功能。一個(gè)類可以同時(shí)繼承一個(gè)類和實(shí)現(xiàn)一個(gè)接口。11.關(guān)于HIVE的描述不正確的？A、Hive最佳使用景是大數(shù)據(jù)的批處理作業(yè)B、Hive可以實(shí)現(xiàn)大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢C、Hive構(gòu)建在基于靜態(tài)批處理的Hadp之上，Hadp通常有較高的延遲并且在作業(yè)提交和調(diào)度的時(shí)候需要大量開銷D、Hive查詢操作過程嚴(yán)格遵循HadpMapreduce的作用執(zhí)行模型.Hive將用戶的HveQL語句通過解釋器轉(zhuǎn)換為MapreduceHadp集群上答案：B解析：Hive不可以實(shí)現(xiàn)大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢。Hive構(gòu)建在基于靜態(tài)批處理的Hadp之上，Hadp通常都有較高的延遲并且在作業(yè)提交和調(diào)度的時(shí)候需要大量的開銷。因此，hive并不能夠在大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢12.MapReduce的Shuffle過程以下中哪個(gè)操作是最后做的？A、排序B、合并C、分區(qū)D、溢寫答案：B解析：map階段shuffle過程就是將map結(jié)果進(jìn)行分區(qū)、排序、合并13.以下哪個(gè)方法用于定義線程的執(zhí)行體？A、start()B、init()C、run()D、synchrnized()答案：C解析：run()方法是用來定義這個(gè)線程在啟動的時(shí)候需要做什么，但是，直接執(zhí)行run()方法那就不是線程，必須使用start()啟動，那樣才是線程。線程是進(jìn)程中的實(shí)體，一個(gè)進(jìn)程可以擁有多個(gè)線程，一個(gè)線程必須有一個(gè)父進(jìn)程。線程不擁有系統(tǒng)資源，只有運(yùn)行必須的一些數(shù)據(jù)結(jié)構(gòu)；與父進(jìn)程的其它線程共享該進(jìn)程所擁有的全部資源。線程可以創(chuàng)建和撤消線程，從而實(shí)現(xiàn)程序的并發(fā)執(zhí)行。一般，線程具有就緒、阻塞和運(yùn)行三種基本狀態(tài)。14.以下哪種不是Hive支持的數(shù)據(jù)類型？A、StructB、IntC、MapD、Lng答案：D解析：Hive不支持Lng類型，Lng是Java里面的，在Hive里L(fēng)ng對應(yīng)的應(yīng)該是BIGINT。15.下面說法錯(cuò)誤的是（）。A、Hadp集群采用的是Master/Slave工作模式B、DataNde上保存著的是元數(shù)據(jù)，真正的數(shù)據(jù)是存放在NameNde上的C、HDFS采用了一種對文件切割后分別存放的存儲方式。D、HDFS是為高數(shù)據(jù)吞吐量應(yīng)用優(yōu)化的。答案：B解析：DataNde上數(shù)據(jù)塊以文件形式存儲在磁盤上,包括兩個(gè)文件,一個(gè)是數(shù)據(jù)本身,一個(gè)是數(shù)據(jù)塊元數(shù)據(jù)包括長度、校驗(yàn)、時(shí)間戳;16.請問以下哪個(gè)命令組成是錯(cuò)誤的？A、sbin/stp-dfs.shB、sbin/hdfsdfsadmin-reprtC、bin/hadpnamende-frmatD、bin/hadpfs-cat/hadpdata/my.txt答案：B解析：A選項(xiàng)，sbin/stp-dfs.sh是用來停止日志相關(guān)服務(wù)。C選項(xiàng)，它負(fù)責(zé)管理文件系統(tǒng)的命名空間,維護(hù)文件系統(tǒng)的文件樹以及所有的文件和目錄的元數(shù)據(jù)。D選項(xiàng)，文件目錄有關(guān)。B選項(xiàng)命令不存在。所以選B。17.YARN中默認(rèn)的資源調(diào)度器是？A、FIF調(diào)度器B、容量調(diào)度器C、Fair調(diào)度器D、以上全不是答案：B解析：YARN中默認(rèn)的資源調(diào)度器是容量調(diào)度器18.關(guān)于相關(guān)性rA,B說法錯(cuò)誤的是（）。A、rA,B>0,正相關(guān)。A隨B的值得增大而增大B、rA,B=0不相關(guān)。AB無關(guān)C、rA,B<0,負(fù)相關(guān)。A隨B的值得增大而減少D、不能單純依據(jù)rA,B<0fig定AB相關(guān)性答案：D解析：不能單純依據(jù)rA,B<0fig定AB相關(guān)性是錯(cuò)誤的r為相關(guān)系數(shù)19.HDFS有一個(gè)gzip文件大小75MB,客戶端設(shè)置Blck大小為64MB。當(dāng)運(yùn)行mapreduce任務(wù)讀取該文件時(shí)inputsplit大小為？A、—個(gè)map取64MB,另外一個(gè)map取11MBB、128MBC、64MBD、75MB答案：D解析：gzip不支持split,所以inputsplit大小為文件大小20.以下關(guān)于fusininsightCTbase的描述不正確的是？A、CThase的讀寫數(shù)據(jù)接口，統(tǒng)一封裝了行定義的接口，自動進(jìn)行冷字段的合并和解析,不需要在應(yīng)用程序中進(jìn)行合并和解釋B、CTHBase是基于Hbase的聚簇表開發(fā)框架。云HBASE數(shù)據(jù)庫（CT-Hbase）基于開源HBase引擎，支持NSQL和二級索引的實(shí)時(shí)數(shù)據(jù)分析服務(wù)。C、CTHbase提供了一套Webui進(jìn)行元數(shù)據(jù)定義，提供了只管醫(yī)用的表設(shè)計(jì)工具，降低表設(shè)D、CTHbase的javaAPI提供一套Hbas鏈接池管理的接口,內(nèi)部進(jìn)行連接共享,減少客戶端應(yīng)用開發(fā)難度。答案：B解析：CTHBase不是基于Hbase的聚簇表開發(fā)框架。云HBASE數(shù)據(jù)庫(CT-Hbase)基于開源HBase引擎,支持NSQL和二級索引的實(shí)時(shí)數(shù)據(jù)分析服務(wù)。21.在Webhcat架構(gòu)中，用戶能夠通過安全的HTTPS協(xié)議執(zhí)行以下哪些操作？A、執(zhí)行HiveDDL操作B、運(yùn)行Mapreduce任務(wù)C、運(yùn)行HiveHL任務(wù)D、以上全都正確答案：D解析：在Webhcat架構(gòu)中，用戶能夠通過安全的HTTPS協(xié)議執(zhí)行HiveDDL操作、運(yùn)行Mapreduce任務(wù)、運(yùn)行HiveHL任務(wù)22.HBase依賴()提供消息通信機(jī)制A、ZkeeperB、ChubbyC、RPCD、Scket答案：A解析：ZKeeper是一個(gè)分布式的，開放源碼的分布式應(yīng)用程序協(xié)調(diào)服務(wù)，是Ggle的Chubby一個(gè)開源的實(shí)現(xiàn)，是Hadp和Hbase的重要組件。它是一個(gè)為分布式應(yīng)用提供一致性服務(wù)的軟件，提供的功能包括：配置維護(hù)、域名服務(wù)、分布式同步、組服務(wù)等。23.在Mapper類中，共有4個(gè)函數(shù)：setup()、map()、()、run()。A、Reducer()B、cleanup()C、Split()D、lcal()答案：B解析：在Mapper類中，共有4個(gè)函數(shù)：setup（）、map（）、cleanup（）、run（）。24.kafka-clustermirrring工具可以實(shí)現(xiàn)以下哪個(gè)功能（）A、kafka集群數(shù)據(jù)同步方案B、kafka單集群內(nèi)數(shù)據(jù)備份C、kafka單集群內(nèi)數(shù)據(jù)恢復(fù)D、以上全部不對答案：A解析：kafka-clustermirrring工具可以實(shí)現(xiàn)kafka集群數(shù)據(jù)同步方案25.FusininsightHD系統(tǒng)中Hive不支持的存儲格式包括？A、TextfileB、SequencefileC、RCFILED、Hfile答案：D解析：FusininsightHD系統(tǒng)中Hive不支持的存儲格式包括Hfile。Textfile文本文件SequencefilesequenceFile文件是Hadp用來存儲二進(jìn)制形式的[Key,Value]對而設(shè)計(jì)的一種平面文件(FlatFile)。RCFile文件格式是FaceBk開源的一種Hive的文件存儲格式，首先將表分為幾個(gè)行組，對每個(gè)行組內(nèi)的數(shù)據(jù)進(jìn)行按列存儲，每一列的數(shù)據(jù)都是分開存儲，正是先水平劃分，再垂直劃分的理念。HFile是HBase存儲數(shù)據(jù)的文件組織形式。26.關(guān)于數(shù)據(jù)分析報(bào)告錯(cuò)誤的是（）。A、展示分析結(jié)果B、驗(yàn)證分析質(zhì)量C、展示分析過程D、提供決策依據(jù)答案：C解析：數(shù)據(jù)分析報(bào)告用來展示分析結(jié)果，驗(yàn)證分析質(zhì)量以及提供決策依據(jù)https://zhuanlan.zhihu./p/53857057數(shù)據(jù)分析報(bào)告—項(xiàng)目可行性判斷的重要依據(jù)。27.UMP系統(tǒng)中的角色不包括A、Cntrller服務(wù)器B、Prxy服務(wù)器C、Agent服務(wù)器D、HDFS服務(wù)器答案：D解析：UMP系統(tǒng)中的角色包括Cntrller服務(wù)器、Web控制臺、Prxy服務(wù)器、Agent服務(wù)器、日志分析服務(wù)器、信息統(tǒng)計(jì)服務(wù)器、愚公系統(tǒng)；依賴的開源組件包括Mnesia、RabbitMQ、ZKeeper和LVS。28.Hive是基于Hadp的數(shù)據(jù)倉庫軟件，可以査詢和管理PB級別的分布式數(shù)據(jù)。以下關(guān)于hive特性的描述不正確的是？A、靈活方便的ETLB、易用易編程C、可直接訪可HDFS文件以及HbaseD、僅支持mapreducet計(jì)算引擎答案：D解析：目前Hive支持MapReduce、Tez和Spark3種計(jì)算引擎29.創(chuàng)建Lader作業(yè)中，可以在以下哪個(gè)步驟中設(shè)置過濾器類型（）A、輸入設(shè)置B、轉(zhuǎn)換C、基本信息D、輸出答案：A解析：創(chuàng)建Lader作業(yè)中，可以在輸入設(shè)置中設(shè)置過濾器類型30.YARN的基于標(biāo)準(zhǔn)調(diào)度，是對下列選項(xiàng)中的哪個(gè)進(jìn)行標(biāo)簽化？A、AppmasterB、ResurcemanagerC、NdemanagerD、Cntainer答案：C解析：YARN的基于標(biāo)準(zhǔn)調(diào)度，是對Ndemanager進(jìn)行標(biāo)簽化31.下列哪些語句關(guān)于Java內(nèi)存回收的說明是正確的？A、程序員必須創(chuàng)建一個(gè)線程來釋放內(nèi)存B、內(nèi)存回收程序負(fù)責(zé)釋放無用內(nèi)存C、內(nèi)存回收程序允許程序員直接釋放內(nèi)存D、內(nèi)存回收程序可以在指定的時(shí)間釋放內(nèi)存對象答案：B解析：A：垃圾回收程序是一般是在堆上分配空間不夠的時(shí)候會自己進(jìn)行一次GC（垃圾收集），程序員不需要也不能主動釋放內(nèi)存。B：Java的內(nèi)存釋放由垃圾回收程序來進(jìn)行釋放C：在Java里，內(nèi)存的釋放由垃圾回收程序進(jìn)行管理，程序員不能直接進(jìn)行釋放。D：程序員可以調(diào)用System.gc()運(yùn)行垃圾回收器，但是不能指定時(shí)間。32.Hadp集群中存在的最主要瓶頸是（）。A、CPUB、網(wǎng)絡(luò)C、磁盤I0D、內(nèi)存答案：C解析：面對大數(shù)據(jù)，讀取數(shù)據(jù)需要經(jīng)過I，這里可以把I理解為水的管道。管道越大越強(qiáng)，我們對于T級的數(shù)據(jù)讀取就越快。所以I的好壞，直接影響了集群對于數(shù)據(jù)的處理。33.下面與Zkeepe類似的框架是哪一個(gè)？（）A、PrtbufB、JavaC、KafkaD、Chubby答案：D解析：顧名思義zkeeper就是動物園管理員，他是用來管hadp（大象）、Hive(蜜蜂)、pig(小豬)的管理員，Zkeeper:是一個(gè)分布式的、開源的程序協(xié)調(diào)服務(wù)，是hadp項(xiàng)目下的一個(gè)子項(xiàng)目。他提供的主要功能包括：配置管理、名字服務(wù)、分布式鎖、集群管理。A：PrtclBuffers是一種輕便高效的結(jié)構(gòu)化數(shù)據(jù)存儲格式，可以用于結(jié)構(gòu)化數(shù)據(jù)串行化，或者說序列化。B：面向?qū)ο蟮木幊陶Z言；C：Kafka是由Apache軟件基金會開發(fā)的一個(gè)開源流處理平臺，由Scala和Java編寫。D：Chubby是一個(gè)面向松耦合分布式系統(tǒng)的鎖服務(wù)，通常用于為一個(gè)由大量小型計(jì)算機(jī)構(gòu)成的松耦合分布式系統(tǒng)提供高可用的鎖服務(wù)。一個(gè)分布式鎖服務(wù)的目的是允許他的客戶端進(jìn)程同步彼此的操作，并對當(dāng)前所處環(huán)境的基本狀態(tài)信息達(dá)成一致。34.以下哪個(gè)部分不是一篇數(shù)據(jù)分析報(bào)告必須有的。（）A、標(biāo)題B、正文C、結(jié)論與建議D、附錄答案：D解析：附錄不是一篇數(shù)據(jù)分析報(bào)告必須有的。35.以下關(guān)于Zkeeper的Leader節(jié)點(diǎn)在收到數(shù)據(jù)變更請求后的讀寫流程說法正確的是？A、僅寫入內(nèi)存B、同時(shí)寫入磁盤和內(nèi)存C、先寫入內(nèi)存再寫入磁盤D、先寫磁盤再寫內(nèi)存答案：D解析：Zkeeper的Leader節(jié)點(diǎn)在收到數(shù)據(jù)變更請求后的讀寫流程是先寫磁盤再寫內(nèi)存36.在fusinlnsigh產(chǎn)品中,關(guān)于kafka的tpic,以下描述不正確的是？A、tpic的partitin數(shù)量可以創(chuàng)建時(shí)配置B、每個(gè)tpic只能被分成一個(gè)partitin區(qū)C、每條發(fā)布到kafka的消息都有一個(gè)類別,這個(gè)類別被稱為tpic.也可以理解為一個(gè)存儲消息的隊(duì)列D、每個(gè)partitin在存儲層面對應(yīng)一個(gè)lg文件,lg文件中記錄了所有的消息數(shù)據(jù)答案：B解析：Kafka中Tpic被分成多個(gè)Partitin分區(qū)。tpic是一個(gè)邏輯概念，Partitin是最小的存儲單元，掌握著一個(gè)Tpic的部分?jǐn)?shù)據(jù)。每個(gè)Partitin都是一個(gè)單獨(dú)的lg文件，每條記錄都以追加的形式寫入。37.HBase表中每個(gè)cell的多版本是通過（）表示的。A、timestampB、rwkeyC、blckidD、cellid答案：A解析：HBase通過以下幾個(gè)要素來定位一個(gè)cell：表（table），行（rwkey），列族（clumnfamily），列標(biāo)識（clumnqualifier），時(shí)間戳（timestamp）。每個(gè)Cell可能有多個(gè)版本，它們之間用時(shí)間戳（TimeStamp）區(qū)分。38.FusininsightHD中Lader從SFTP服務(wù)器導(dǎo)入文件時(shí)不需要做編碼轉(zhuǎn)換和數(shù)據(jù)轉(zhuǎn)換且速度最快的文件類型是以下哪項(xiàng)？A、graph-fileB、binary-fileC、text-fileD、sequence-file答案：B解析：binary-file是FusininsightHD中Lader從SFTP服務(wù)器導(dǎo)入文件時(shí)不需要做編碼轉(zhuǎn)換和數(shù)據(jù)轉(zhuǎn)換且速度最快的文件類型39.下面與HDFS類似的框架是？A、NTFSB、FAT32C、GFSD、EXT3答案：C解析：HDF（HarmnySDriverFundatin）驅(qū)動框架，為驅(qū)動開發(fā)者提供驅(qū)動框架能力，包括驅(qū)動加載、驅(qū)動服務(wù)管理和驅(qū)動消息機(jī)制。40.關(guān)于Dataset,下列說法不正確的是？A、Dataset不需要反序列化就可執(zhí)行大部分操作B、Dataset是一個(gè)由特定域的對象組成的強(qiáng)類型集合C、Dataset與RDD高度類似＞性能比RDD好D、Dataset執(zhí)行srt,filter,shuffle登操作需要進(jìn)行反序列化答案：D解析：Dataset執(zhí)行srt,filter,shuffle登操作不需要進(jìn)行反序列化。Java序列化就是指把Java對象轉(zhuǎn)換為字節(jié)序列的過程Java反序列化就是指把字節(jié)序列恢復(fù)為Java對象的過程。序列化最重要的作用：在傳遞和保存對象時(shí).保證對象的完整性和可傳遞性。對象轉(zhuǎn)換為有序字節(jié)流,以便在網(wǎng)絡(luò)上傳輸或者保存在本地文件中。反序列化的最重要的作用：根據(jù)字節(jié)流中保存的對象狀態(tài)及描述信息，通過反序列化重建對象。41.Zkeeper在分布式應(yīng)用中主要的作用不包括以下哪些選項(xiàng)？A、選舉Master節(jié)點(diǎn)B、保證各節(jié)點(diǎn)上數(shù)據(jù)的C、分配集群資源D、存儲及群中答案：C解析：資源分配是Spark任務(wù)中需要深入理解42.Hive是以（）技術(shù)為基礎(chǔ)的數(shù)據(jù)倉庫。A、HDFSB、MAPREDUCEC、HADPD、HBASE答案：C解析：Hive是基于Hadp的一個(gè)數(shù)據(jù)倉庫工具，用來進(jìn)行數(shù)據(jù)提取、轉(zhuǎn)化、加載，這是一種可以存儲、查詢和分析存儲在Hadp中的大規(guī)模數(shù)據(jù)的機(jī)制。A:Hadp分布式文件系統(tǒng)(HDFS)是指被設(shè)計(jì)成適合運(yùn)行在通用硬件上的分布式文件系統(tǒng)。B:MapReduce是一種編程模型，用于大規(guī)模數(shù)據(jù)集的并行運(yùn)算。D:HBase是一個(gè)分布式的、面向列的開源數(shù)據(jù)庫43.關(guān)于fusinInsightHDStreaming的Supervisr描述正確的是（）A、Supervisr是在Tplgy中接受數(shù)據(jù)然后執(zhí)行處理的組件B、Supervisr負(fù)責(zé)接受Nimbus分配的任務(wù),啟動和停止屬于自己管理的Wrker進(jìn)程C、Supervisr負(fù)責(zé)資源分配和任務(wù)調(diào)度D、supervisr是運(yùn)行具體處理邏輯的過程答案：B解析：Blt是在Tplgy中接受數(shù)據(jù)然后執(zhí)行處理的組件；Nimbus:負(fù)責(zé)資源分配和任務(wù)調(diào)度；Supervisr:負(fù)責(zé)接收Nimbus分配的任務(wù)44.在Spark生態(tài)組件中，哪個(gè)產(chǎn)品可用于復(fù)雜的批量數(shù)據(jù)處理。（）A、SparkCreB、SparkSqlC、SparkStreamingD、MLlib答案：A解析：1.在Spark生態(tài)組件中，sparkcre可用于復(fù)雜的批量數(shù)據(jù)處理2.SparkStreaming是一個(gè)對實(shí)時(shí)數(shù)據(jù)流進(jìn)行高吞吐、高容錯(cuò)的流式處理系統(tǒng)3.MLlib：是Spark實(shí)現(xiàn)一些常見的機(jī)器學(xué)習(xí)算法和實(shí)用程序4.SparkSQL是基于sparkcre提供的一個(gè)用來處理結(jié)構(gòu)化數(shù)據(jù)的模塊（庫）45.關(guān)于hive與傳統(tǒng)據(jù)倉庫的對比，以下描述錯(cuò)誤的是？A、數(shù)據(jù)存儲獨(dú)位于數(shù)據(jù)存儲之外，從而解耦合元數(shù)據(jù)和數(shù)據(jù),靈活性高，而傳統(tǒng)數(shù)據(jù)，靈活性低B、Hive基于HDFS存儲理論上存儲量可無限擴(kuò)展，而傳統(tǒng)數(shù)據(jù)倉庫存儲量會有上限C、由于hive的數(shù)據(jù)存儲在HDFS中，所以可以保證數(shù)據(jù)的高容錯(cuò)，高可靠D、由于Hive基于大數(shù)據(jù)平臺，所以查詢效率比傳統(tǒng)數(shù)據(jù)倉庫快答案：D解析：Hive在加載數(shù)據(jù)的過程中不會對數(shù)據(jù)進(jìn)行任何處理，甚至不會對數(shù)據(jù)進(jìn)行掃描，因此也沒有對數(shù)據(jù)中的某些Key建立索引。Hive要訪問數(shù)據(jù)中滿足條件的特定值時(shí)，需要暴力掃描整個(gè)數(shù)據(jù)，因此訪問延遲較高46.關(guān)于HBase與傳統(tǒng)的關(guān)系數(shù)據(jù)庫的區(qū)別說法錯(cuò)誤的是A、數(shù)據(jù)類型：關(guān)系數(shù)據(jù)庫采用關(guān)系模型，具有豐富的數(shù)據(jù)類型和存儲方式，HBase則采用了更加簡單的數(shù)據(jù)模型，它把數(shù)據(jù)存儲為未經(jīng)解釋的字符串B、數(shù)據(jù)操作：關(guān)系數(shù)據(jù)庫中包含了豐富的操作，其中會涉及復(fù)雜的多表連接。HBase則不存在復(fù)雜的表與表之間的關(guān)系，只有簡單的插入、查詢、刪除、清空等，因?yàn)镠Base在設(shè)計(jì)上就避免了復(fù)雜的表和表之間的關(guān)系C、存儲模式：關(guān)系數(shù)據(jù)庫是基于行模式存儲的。HBase是基于列存儲的，每個(gè)列族都由幾個(gè)文件保存，不同列族的文件是分離的D、數(shù)據(jù)維護(hù)：在關(guān)系數(shù)據(jù)庫中執(zhí)行更新操作時(shí)，并不會刪除數(shù)據(jù)舊的版本，而是生成一個(gè)新的版本，舊有的版本仍然保留。在HBase中，更新操作會用最新的當(dāng)前值去替換記錄中原來的舊值，舊值被覆蓋后就不會存在。答案：D解析：數(shù)據(jù)維護(hù)：在關(guān)系數(shù)據(jù)庫中，更新操作會用最新的當(dāng)前值去替換記錄中的原來的舊值，舊值被覆蓋夠就不會存在，而在HBase中執(zhí)行更新操作時(shí)，不糊并不會刪除數(shù)據(jù)舊的版本，而是生成一個(gè)新的版本，舊的有的版本保留。47.以下哪類數(shù)據(jù)不屬于半結(jié)構(gòu)化數(shù)據(jù)？A、HTMLB、XMLC、二維表D、JSN答案：C解析：二維表,數(shù)據(jù)結(jié)構(gòu),是一個(gè)關(guān)系名,意思是指關(guān)系模型中,數(shù)據(jù)結(jié)構(gòu)的表示方法48.在Hadp生態(tài)組件中，哪個(gè)產(chǎn)品可用于復(fù)雜的批量數(shù)據(jù)處理。（）A、MapReduce、HiveB、ImpalaC、StrmD、Mahut答案：A解析：在Hadp生態(tài)組件中，MapReduce、Hive可用于復(fù)雜的批量數(shù)據(jù)處理。49.以下關(guān)于HiveSQL基本操作描述正確的是（）A、創(chuàng)建外部表必須要指定Lcatin信息B、創(chuàng)建外部表使用external關(guān)鍵字，創(chuàng)建普通表需要指定internal關(guān)鍵字C、加載數(shù)據(jù)到Hive時(shí)源數(shù)據(jù)必須是HDFS的一個(gè)路徑D、創(chuàng)建表時(shí)可以指定列分割符答案：D解析：建立外部表可以不指定Lcatin，會在默認(rèn)在/hive/warehuse/數(shù)據(jù)庫名稱/表名,建立目錄。創(chuàng)建內(nèi)部表時(shí)不需要關(guān)鍵字。加載數(shù)據(jù)到Hive時(shí)源數(shù)據(jù)不一定是HDFS的一個(gè)路徑50.HDFS的副本放置策略中，同一機(jī)架不同的服務(wù)器之間的距離是（）A、3B、2C、1D、4答案：B解析：HDFS的副本放置策略中，同一機(jī)架不同的服務(wù)器之間的距離是251.關(guān)于HBaseRegin的定位說法錯(cuò)誤的是A、元數(shù)據(jù)表，又名.META.表，存儲了Regin和Regin服務(wù)器的映射關(guān)系。當(dāng)HBase表很大時(shí)，.META.表也會被分裂成多個(gè)ReginB、為了加快訪問速度，.META.表的全部Regin都會被保存在內(nèi)存中C、根數(shù)據(jù)表，又名-RT-表，記錄所有元數(shù)據(jù)的具體位置。-RT-表只有唯一一個(gè)Regin，名字是在程序中被寫死的。Zkeeper文件記錄了-RT-表的位置D、為了加速尋址，客戶端會緩存位置信息，尋址過程客戶端只需要詢問Zkeeper服務(wù)器，不需要連接Master服務(wù)器，由于數(shù)據(jù)放在內(nèi)存中，因此不存在緩存失效問題。答案：D解析：客戶端訪問數(shù)據(jù)時(shí)的“三級尋址”?為了加速尋址，客戶端會緩存位置信息，同時(shí)，需要解決緩存失效問題?尋址過程客戶端只需要詢問Zkeeper服務(wù)器，不需要連接Master服務(wù)器52.HBasett靠()存儲底層數(shù)據(jù)A、HDFSB、HadpC、MemryD、MapReduce答案：A解析：首先HBase不同于一般的關(guān)系數(shù)據(jù)庫,它是一個(gè)適合于非結(jié)構(gòu)化數(shù)據(jù)存儲的數(shù)據(jù)庫.另一個(gè)不同的是HBase基于列的而不是基于行的模式.53.關(guān)于HBase下面說法正確的是（）。A、HBase?一個(gè)稀疏、多維度、排序的映射表，這張表的索引是行鍵、列B、每個(gè)值是一個(gè)未經(jīng)解釋的字符串，沒有數(shù)據(jù)類型，程序員要自己去對它進(jìn)C、用戶在表中存儲數(shù)據(jù)，每一行都有一個(gè)可排序的行鍵和任意多的列D、以上說法都正確答案：D解析：Hbase是HadpDatabase的簡稱，Hbase是分布式、面向列的開源數(shù)據(jù)庫（準(zhǔn)確是面向列族）。HDFS為Hbase提供可靠的底層數(shù)據(jù)存儲服務(wù)，MapReduce為Hbase提供高性能的計(jì)算能力，Zkeeper為Hbaset提供穩(wěn)定服務(wù)和Failver機(jī)制，因?yàn)槲覀冋fHbase是一個(gè)通過大量廉價(jià)的機(jī)器解決海量數(shù)據(jù)的高速存儲和讀取的分布式數(shù)據(jù)庫解決方案。Hbase的特點(diǎn)：1，海量存儲2，列式存儲3，極易擴(kuò)張4，高并發(fā)5，稀疏（主要針對Hbase的靈活性）54.下列不可作為java語言標(biāo)識符的是A、a1B、1C、1D、11答案：D解析：Java標(biāo)識符由數(shù)字，字母和下劃線（_），美元符號（$）或人民幣符號（￥）組成。在Java中是區(qū)分大小寫的，而且還要求首位不能是數(shù)字。55.從數(shù)據(jù)表中查找記錄用以下哪一項(xiàng)（）A、UPDATEB、FINDC、SELECTD、CREATE答案：C解析：SELECT用于查找記錄56.LSM更能保證哪種操作的性能？A、讀B、寫C、隨機(jī)讀D、合并答案：B解析：B+索引樹和lg型（append）文件操作（數(shù)據(jù)庫WAL日志）是數(shù)據(jù)讀寫的兩個(gè)極端。B+樹讀效率高而寫效率差；lg型文件操作寫效率高而讀效率差；因此要在排序和lg型文件操作之間做個(gè)折中，于是就引入了lg-structedmergetree模型，通過名稱可以看出LSM既有日志型的文件操作，提升寫效率，又在每個(gè)sstable中排序，保證了查詢效率。57.查看kafkaMTpic的partitin詳細(xì)信息時(shí),使用如下那個(gè)命令？A、bin/kakfa-tpicssh—createB、bin/kakfa-tpicssh—deleteC、bin/kakfa-tpics.sh-listD、bin/kakfa-tpics.sh—describe答案：D解析：使用bin/kakfa-tpicssh—describe查看kafkaMTpic的partitin詳細(xì)信息58.關(guān)于HBaseshell命令，哪個(gè)命令是使表無效。（）A、alertB、disableC、drpD、以上都不是答案：B解析：1.alter:修改列族模式2.disable：使表無效3.drp：刪除表59.Kafka集群中，Kafka服務(wù)端部署的角色是A、PrducerB、CnsumerC、ZKeeperD、Brker答案：D解析：一臺kafka服務(wù)器節(jié)點(diǎn)就是一個(gè)brker,負(fù)責(zé)處理消息讀、寫請求,存儲消息,在kafkacluster這一層這里,其實(shí)里面是有很多個(gè)brker一個(gè)集群由多個(gè)brker組成。prducer是向kafkabrker發(fā)消息的客戶端,cnsumer是向kafkabrker取消息的客戶端60.LSM含義是？A、日志結(jié)構(gòu)合并樹B、二叉樹C、平衡二叉樹D、長平衡二叉樹答案：A解析：LSM-Tree全稱是LgStructuredMergeTree，是一種分層，有序，面向磁盤的數(shù)據(jù)結(jié)構(gòu)，其核心思想是充分了利用了，磁盤批量的順序?qū)懸h(yuǎn)比隨機(jī)寫性能高出很多61.FusininsightHD系統(tǒng)審計(jì)日志不可以記錄下面哪些操作？A、手動清除告警B、啟停服務(wù)實(shí)例C、查詢歷史監(jiān)控D、刪除服務(wù)實(shí)例答案：C解析：FusininsightHD系統(tǒng)審計(jì)日志不可以記錄查詢歷史監(jiān)控62.關(guān)于hive建表基本描述正確的是()A、不可再修改表名B、可再增加新列C、創(chuàng)建外部表需要制定external關(guān)鍵字D、不可再修改列名答案：C解析：創(chuàng)建外部表需要制定external關(guān)鍵字63.Hbase中以下對于LSM的描述正確的是（）。A、LSM的讀操作和寫操作是獨(dú)立B、LSM的讀操作和寫操作不是獨(dú)立C、LSM并不區(qū)分讀和寫D、LSM中讀寫是同一種操作答案：A解析：LSM中讀操作和寫操作相互獨(dú)立，且并不相同64.有一段java應(yīng)用程序，它的主類名是a1,那么保存它的源文件名可以是A、a1.javaB、a1.classC、a1D、都對答案：A解析：1、必須以java結(jié)尾。這樣才能被編輯器javacexe所編輯。2、源文件中如果只有一個(gè)類，文件名必須與該類名相同。3、輸入命令：pushd路徑（此命令可將當(dāng)前目錄設(shè)為所希望的任一個(gè)已存在的路徑）。4、輸入命令：e：轉(zhuǎn)移到e盤，然后再輸入cd轉(zhuǎn)移到所希望的已知路徑。65.關(guān)于MapReduce框架中一個(gè)作業(yè)的reduce任務(wù)數(shù)，下列說法正確的是（）A、由自定義的Partitiner來確定B、是分塊總數(shù)目的一半C、可以由用戶來自定義，通過JbCnf.setNumReducetTask（int）來設(shè)定一個(gè)作業(yè)中reduce的任務(wù)數(shù)目D、由MapReduce隨機(jī)確定其數(shù)目答案：C解析：一個(gè)jb的ReduceTasks數(shù)量是通過mapreduce.jb.reduces參數(shù)設(shè)置也可以通過編程的方式，調(diào)用Jb對象的setNumReduceTasks()方法來設(shè)置目66.以下命令組成錯(cuò)誤的是（）。A、vim/etc/prfileB、surce/etc/prfileC、hadpnamende-frmatD、bin/hadpfs-cat/hadpdata/y/txt答案：D解析：394、vim/etc/prfile雖然可以進(jìn)入prfile文件,但是對于普通用戶,無法修改；etc/prfile:在登錄時(shí),操作系統(tǒng)定制用戶環(huán)境時(shí)使用的第一個(gè)文件,此文件為系統(tǒng)的每個(gè)用戶設(shè)置環(huán)境信息,當(dāng)用戶第一次登錄時(shí),該文件被執(zhí)行。使用命令hadpnamende-frmat對namende進(jìn)行格式化。hadpfs-cat>從DFS多個(gè)part文件合并拷貝文件到本地文件系統(tǒng)。67.不屬于HDFS優(yōu)勢是（）?A、時(shí)間快B、超大文件C、大量小文件D、商用硬件答案：A解析：HDFS優(yōu)勢：1、海量數(shù)據(jù)存儲：HDFS可橫向擴(kuò)展，其存儲的文件可以支持PB級別或更高級別的數(shù)據(jù)存儲。2、高容錯(cuò)性：數(shù)據(jù)保存多個(gè)副本，副本丟失后自動恢復(fù)?？蓸?gòu)建在廉價(jià)的機(jī)器上，實(shí)現(xiàn)線性擴(kuò)展。當(dāng)集群增加新節(jié)點(diǎn)之后，namende也可以感知，進(jìn)行負(fù)載均衡，將數(shù)據(jù)分發(fā)和備份數(shù)據(jù)均衡到新的節(jié)點(diǎn)上。3、商用硬件：Hadp并不需要運(yùn)行在昂貴且高可靠的硬件4、大文件存儲68.在創(chuàng)建對象時(shí)必須A、先聲明對象，然后才能使用對象B、先聲明對象，為對象分配內(nèi)存空間，然后才能使用對象C、先聲明對象，為對象分配內(nèi)存空間，對對象初始化，然后才能使用對象D、上述說法都對答案：C解析：Java就是這樣規(guī)定的69.Hbase的某張表的Rwkey劃分splitkey為9.E.a.z請問表里面有幾個(gè)Regin?A、6B、3C、5D、4答案：C解析：Hbase的某張表的Rwkey劃分splitkey為9.E.a.z表里面有5個(gè)Regin70.在Zkeeper和Yarn的協(xié)同工作中，當(dāng)ActiveResurcemanager產(chǎn)生故障時(shí)，StandbyResurcemanager會從以下哪個(gè)目錄中獲取Applicatin相關(guān)信息（）A、metastreB、StatestreC、StreageD、Warehuse答案：B解析：在Zkeeper和Yarn的協(xié)同工作中，當(dāng)ActiveResurcemanager產(chǎn)生故障時(shí)，StandbyResurcemanager會從Statestre目錄中獲取Applicatin相關(guān)信息（）71.Kafka集群在運(yùn)行期間直接依賴于下面哪些組件？A、sparkB、zkeeperC、hdfsD、hbase答案：B解析：ZKeeper作為給分布式系統(tǒng)提供協(xié)調(diào)服務(wù)的工具被kafka所依賴72.下面與Zkeepe淡似的框架是？A、PrtbufB、JavaC、KafkaD、Chubby答案：D解析：，ZKeeper是一個(gè)分布式服務(wù)框架，是ApacheHadp的一個(gè)子項(xiàng)目，主要用來解決分布式應(yīng)用中經(jīng)常遇到的一些數(shù)據(jù)管理問題，如：統(tǒng)一命名服務(wù)、配置管理、集群管理、分布式鎖、發(fā)布/訂閱等。73.HFile數(shù)據(jù)格式中的KeyValue數(shù)據(jù)格式中Value部分是()。A、擁有復(fù)雜結(jié)構(gòu)的字符串B、字符串C、二進(jìn)制數(shù)據(jù)D、壓縮數(shù)據(jù)答案：C解析：元數(shù)據(jù)是key-value類型的值，但元數(shù)據(jù)快只保存元數(shù)據(jù)的value值，元數(shù)據(jù)的key值保存在第五項(xiàng)（元數(shù)據(jù)索引塊）中。74.解壓.tar.gziS尾的HBase壓縮包使用的Linux命令是？A、tar-zxvfB、tar-zxC、tar-sD、tar-nf答案：A解析：tar-zxvf75.Flume用于收集數(shù)據(jù)，其傳輸?shù)臄?shù)據(jù)基本單位是？A、SplitB、BlckC、EventD、Packet答案：C解析：Flume用于收集數(shù)據(jù)，其傳輸?shù)臄?shù)據(jù)基本單位是Event。76.下面哪個(gè)進(jìn)程負(fù)責(zé)MapReduce任務(wù)調(diào)度。A、NameNdeB、JbtrackerC、TaskTrackerD、SecndaryNameNde答案：B解析：Jbtracer負(fù)責(zé)MapReduce任務(wù)調(diào)度77.HFile數(shù)據(jù)格式中的Magic字段用于()。A、存儲隨機(jī)數(shù)，防止數(shù)據(jù)損壞B、存儲數(shù)據(jù)的起點(diǎn)C、存儲數(shù)據(jù)塊的起點(diǎn)D、指定字段的長度答案：A解析：每一個(gè)HFile內(nèi)部包括多種不同類型的塊結(jié)構(gòu)，這些塊結(jié)構(gòu)從邏輯上來講可歸并為兩類。分別用于數(shù)據(jù)存儲和數(shù)據(jù)索引(簡稱數(shù)據(jù)塊和索引塊)78.LSM的讀操作和寫操作是獨(dú)立的？A、是。B、否。C、LSM并不區(qū)分讀和寫D、LSM中讀寫是同一種操作答案：A解析：如果我們對寫性能特別敏感，我們最好怎么做？——Appendnly：所有寫操作都是將數(shù)據(jù)添加到文件末尾。這樣做的寫性能是最好的，大約等于磁盤的理論速度（200~300MB/s）。79.fusininsight對于管理操作，下列錯(cuò)誤的是？A、可對服務(wù)進(jìn)行啟停重啟B、可以添加和卸載服務(wù)C、常用服務(wù)隱藏或顯示D、可查看服務(wù)的當(dāng)前狀態(tài)答案：C解析：可設(shè)置不常用的服務(wù)隱藏或顯示80.Hive中的數(shù)據(jù)類型，下面說正確的是（）。A、TINYINT,1個(gè)字節(jié)（8位）有符號整數(shù)B、SMALLINT，2字節(jié)（16位）有符號整數(shù)C、INT,4個(gè)字節(jié)（32位）有符號整數(shù)D、以上都正確答案：D解析：1.Hive中的數(shù)據(jù)類型分為兩類：基本類型和復(fù)雜類型2.基本類型包含：tinyint，smallint，int，bigint，flat，duble，blean，string，timestamp，binary3.復(fù)雜類型：array，map和structa.array：數(shù)組類型，對應(yīng)了Java中的集合或者數(shù)組。81.以下哪個(gè)不是HDFS的守護(hù)進(jìn)程A、SecndaryNameNdeB、NameNdeC、MrappMaster/YarnChildD、DataNde答案：C解析：namende\Secndnamende\Datande\Jbtracker\Tasktracker都是守護(hù)進(jìn)程82.以下哪個(gè)channel類型的數(shù)據(jù)不會持久化（）?A、FileChannelB、MemryChannelC、JDBCChannelD、HDFSChannel答案：B解析：JDBCChannel的數(shù)據(jù)類型不會持久化83.hadp系統(tǒng)中YARN資源的抽象是用什么表示？A、內(nèi)存B、CPUC、CntainerD、磁盤空間答案：C解析：hadp系統(tǒng)中YARN資源的抽象是用Cntainer表示84.Spark是用以下哪種編程語言實(shí)現(xiàn)的（）？A、CB、C++C、JAVAD、Scala答案：D解析：Scala是Spark的原生語言85.關(guān)系數(shù)據(jù)庫已經(jīng)流行很多年，Hadp已經(jīng)有了HDFS和MapReduce，關(guān)于需要HBase說法錯(cuò)誤的是A、Hadp可以很好地解決大規(guī)模數(shù)據(jù)的離線批量處理問題，但是，受限于HadpMapReduce編程框架的高延遲數(shù)據(jù)處理機(jī)制，使得Hadp無法滿足大規(guī)模數(shù)據(jù)實(shí)時(shí)處理應(yīng)用的需求B、HDFS面向隨機(jī)訪問模式，不是批量訪問模式C、傳統(tǒng)的通用關(guān)系型數(shù)據(jù)庫無法應(yīng)對在數(shù)據(jù)規(guī)模劇增時(shí)導(dǎo)致的系統(tǒng)擴(kuò)展性和性能問題（分庫分表也不能很好解決）D、傳統(tǒng)關(guān)系數(shù)據(jù)庫在數(shù)據(jù)結(jié)構(gòu)變化時(shí)一般需要停機(jī)維護(hù)；空列浪費(fèi)存儲空間答案：B解析：Hadp可以很少地解決大規(guī)模數(shù)據(jù)的離線批量處理問題，但是，受限于hadpMapReduce編程框架的高延遲數(shù)據(jù)處理機(jī)制，使得hadp無法滿足大規(guī)模數(shù)據(jù)實(shí)施處理應(yīng)用的需求HDFS面向批量訪問模式，不是隨機(jī)訪問模式。傳統(tǒng)的通用關(guān)系型數(shù)據(jù)庫無法應(yīng)對在數(shù)據(jù)規(guī)模劇增時(shí)導(dǎo)致的系統(tǒng)擴(kuò)展性和性能問題（分庫分表也不能很好的解決）傳統(tǒng)關(guān)系數(shù)據(jù)庫在數(shù)據(jù)結(jié)構(gòu)變化時(shí)一般需要停機(jī)維護(hù)，空列浪費(fèi)存儲空間因此，業(yè)界出現(xiàn)了一類面向半結(jié)構(gòu)化數(shù)據(jù)存儲和處理的高擴(kuò)展、低寫入、查詢延遲的系統(tǒng)，例如，鍵值數(shù)據(jù)庫、文檔數(shù)據(jù)庫和列族數(shù)據(jù)庫（如BigTable和HDase）Hbase已經(jīng)成功應(yīng)用于互聯(lián)網(wǎng)服務(wù)領(lǐng)域和傳統(tǒng)行業(yè)的眾多在線模式數(shù)據(jù)分析處理系統(tǒng)中86.HBase表中每個(gè)cell的多版本是通過（）表示的？A、timestampB、rwkeyC、blckidD、cellid答案：A解析：每個(gè)Cell可能有多個(gè)版本，它們之間用時(shí)間戳（TimeStamp）區(qū)分。87.為了保障流應(yīng)用的快照存儲的可靠性，快照主要存儲在哪里？A、jbmanager的內(nèi)存中B、可靠性高的單機(jī)數(shù)據(jù)庫中C、本地文件系統(tǒng)中D、hdfs中答案：D解析：為了保障流應(yīng)用的快照存儲的可靠性，快照主要存儲在hdfs中88.關(guān)于HBase的HLg工作原理說法錯(cuò)誤的是A、分布式環(huán)境必須要考慮系統(tǒng)出錯(cuò)。HBase采用HLg保證系統(tǒng)恢復(fù)B、HBase系統(tǒng)為每個(gè)Regin服務(wù)器配置了一個(gè)HLg文件，它是一種預(yù)寫式日志（WriteAheadLg）C、用戶更新數(shù)據(jù)不需要先寫入日志后，才能寫入MemStre緩存，并且，直到MemStre緩存內(nèi)容對應(yīng)的日志已經(jīng)寫入磁盤，該緩存內(nèi)容才能被刷寫到磁盤D、發(fā)生故障后，系統(tǒng)會根據(jù)每條日志記錄所屬的Regin對象對HLg數(shù)據(jù)進(jìn)行拆分，分別放到相應(yīng)Regin對象的目錄下，然后，再將失效的Regin重新分配到可用的Regin服務(wù)器中，并把與該Regin對象相關(guān)的HLg日志記錄也發(fā)送給相應(yīng)的Regin服務(wù)器答案：C解析：Regin服務(wù)器領(lǐng)取到分配給自己的Regin對象以及與之相關(guān)的HLg日志記錄以后，會重新做一遍日志記錄中的各種操作，把日志記錄中的數(shù)據(jù)寫入到MemStre緩存中，然后，刷新到磁盤的StreFile文件中，完成數(shù)據(jù)恢復(fù)。89.釆用Flume傳輸數(shù)據(jù)過程中，為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù)，推薦使用以下哪種channel類型？A、MemryChannelsB、FileChannelC、JDBCChannelD、HDFSChannel答案：B解析：釆用Flume傳輸數(shù)據(jù)過程中，為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù)，推薦使用FileChannel90.加載數(shù)據(jù)到Hive表，哪種方式不正確？A、直接將本地路徑的文件lad到Hive表中B、將HDFS上的文件lad到Hive表中C、Hive支持Insertint單條記錄的方法，所以可以直接在命令行插入單條記錄D、將其他表的結(jié)果集insertint到Hive表答案：C解析：Hive不支持Insertint單條記錄的方法91.關(guān)于HadpMapReduce分片（spit）概念，下列說法不正確的是（）。A、Hadp為每個(gè)split創(chuàng)建一個(gè)Map任務(wù)B、split的多少決定了Map任務(wù)的數(shù)目C、大多數(shù)情況下，理想的分片大小是一個(gè)HDFS塊對應(yīng)一個(gè)spitD、split是一個(gè)物理概念答案：D解析：split不是一個(gè)物理概念，是一個(gè)概念上的切片，blck是物理概念。92.以下選項(xiàng)中，不屬于信息時(shí)代的定律的是()A、吉爾德定律B、摩爾定律C、麥特卡爾夫定律D、達(dá)律多定律答案：A解析：吉爾德定律(Gilder'sLaw)又稱為勝利者浪費(fèi)定律，由喬治·吉爾德提出，最為成功的商業(yè)運(yùn)作模式是價(jià)格最低的資源將會被盡可能的消耗，以此來保存最昂貴的資源。.吉爾德定律(Gilder'sLaw)被描述為：在未來25年，主干網(wǎng)的帶寬每6個(gè)月增長一倍，12個(gè)月增長兩倍。.其增長速度是摩爾定律預(yù)測的CPU增長速度的3倍，并預(yù)言將來上網(wǎng)會免費(fèi)。.93.Javaapplicatin中的主類需包含main方法，main方法的返回類型是什么？A、intB、flatC、dubleD、vid答案：D解析：vid，即不返回對象，main方法是程序執(zhí)行的入口，main方法也不需要初始化對象就能執(zhí)行94.關(guān)于Hadp生態(tài)系統(tǒng)軟件說法錯(cuò)誤的是A、HDFS是分布式文件系統(tǒng)B、YARN是資源管理和調(diào)度器C、Tez是運(yùn)行在YARN之上的下一代Hadp查詢處理框架D、Hive是Hadp上的數(shù)據(jù)倉庫，為了提高效率，可以越過HDFS直接管理數(shù)據(jù)的存儲答案：D解析：hive的表使用的默認(rèn)存儲是hdfs的文件系統(tǒng)，相當(dāng)于表的數(shù)據(jù)是存儲在hdfs文件系統(tǒng)中的。因此無法越過HDFS直接管理數(shù)據(jù)的存儲95.以下哪個(gè)方法用于定義線程的執(zhí)行體？A、start()B、init()C、run()D、synchrnized()答案：C解析：通過繼承Thread類來創(chuàng)建并啟動線程的步驟如下：定義Thread類的子類，并重寫該類的run()方法,該run()方法將作為線程執(zhí)行體。創(chuàng)建Thread子類的實(shí)例，即創(chuàng)建了線程對象。調(diào)用線程對象的start()方法來啟動該線程。96.哪個(gè)命令是刪除文件的？A、dfs-clearB、dfs-IsC、dfs-rmD、dfs-del答案：C解析：dfs-rm命令是用來刪除文件的。dfs-clear沒找到dfs-Is沒找到dfs-del沒找到97.大數(shù)據(jù)的核心價(jià)值是（）。A、數(shù)據(jù)交易B、數(shù)據(jù)分析C、數(shù)據(jù)融合D、數(shù)據(jù)處理答案：B解析：大數(shù)據(jù)的核心價(jià)值是數(shù)據(jù)分析98.HDFS中的數(shù)據(jù)塊（blck）默認(rèn)保存幾份？（）A、3份B、2份C、1份D、不確定答案：A解析：HDFS中的數(shù)據(jù)塊（blck）默認(rèn)保存3份，每份默認(rèn)為128M99.Kafka集群中,Kafka服務(wù)端的角色是？A、BrkerB、CnsumerC、ZkeeperD、Prducer答案：A解析：Kafka集群中,Kafka服務(wù)端的角色是Brker。Cnsumer就是負(fù)責(zé)從Kafka集群中消費(fèi)消息數(shù)據(jù)的應(yīng)用程序Zkeeperl是一個(gè)開源的分布式的，為分布式框架提供協(xié)調(diào)服務(wù)的Apache項(xiàng)目。Prducer就是負(fù)責(zé)向Kafka集群中寫入消息數(shù)據(jù)的應(yīng)用程序100.萬維網(wǎng)之父是（）。A、彼得?德魯克B、舍恩伯格C、蒂姆■伯納斯-李D、斯科特■布朗答案：C解析：萬維網(wǎng)之父是蒂姆·伯納斯·李101.關(guān)于HDFS集群中的DataNde的描述不正確的是？A、—個(gè)DataNde上存儲的所有數(shù)據(jù)塊可以有相同的B、存儲客戶端上傳的數(shù)據(jù)的數(shù)據(jù)塊C、DataNde之間可以互相通信D、響應(yīng)客戶端的所有讀寫數(shù)據(jù)請求,為客戶端的存儲和讀取數(shù)據(jù)提供支撐答案：A解析：出于安全性和高可用性考慮，并不會把一個(gè)blck的多個(gè)副本放在同一個(gè)datande上102.下列關(guān)于HadpAPI的說法錯(cuò)誤的是（）。A、Hadp的API只適用于HDFS文件系統(tǒng)B、Cnfiguratin類的默認(rèn)實(shí)例化方法是以HDFS系統(tǒng)的資源配置為基礎(chǔ)的C、FileStatus對象存儲文件和目錄的元數(shù)據(jù)D、FSDatalnputStream是java.i.DatalnputStream的子類答案：A解析：Hadp的API是通用的，既可以適用于HDFS，又可以適用于Hbase、Mapreduce等103.下列數(shù)據(jù)結(jié)構(gòu)具有記憶功能的是？A、隊(duì)列B、循環(huán)隊(duì)列C、棧D、順序表答案：C解析：具有記憶功能的是棧104.FusininsightHD系統(tǒng)中，下面哪個(gè)方法不能查看到Lader作業(yè)執(zhí)行的結(jié)果（）A、通過LaderUI界面查看B、通過YARN任務(wù)管理C、Ndemanager查看D、通過Manager的查看答案：C解析：FusininsightHD系統(tǒng)中，使用Ndemanager查看不能查看到Lader作業(yè)執(zhí)行的結(jié)果105.Hbase中的Regin是由哪個(gè)服務(wù)進(jìn)程來管理的？A、HreginserverB、ZkeeperC、MasterD、Datande答案：A解析：Hbase中的Regin是由Hreginserver來管理的106.如下哪項(xiàng)不是ZKeeper的關(guān)鍵特性（）?A、最終一致性B、延時(shí)性C、可靠性D、等待無關(guān)性答案：B解析：ZKeeper的關(guān)鍵特性包括最終一致性，可靠性，等待無關(guān)性107.使用Hbase客戶端批量寫入10條數(shù)據(jù)，某個(gè)Hreginserver節(jié)點(diǎn)上包含該表的2個(gè)Regin,分別為A和B,10條數(shù)據(jù)中有6條屬于A.4條屬于B,請問寫入這10條數(shù)據(jù)需要向該HreginServer發(fā)送幾次RPC請求？A、10B、6C、2D、1答案：D解析：使用Hbase客戶端批量寫入10條數(shù)據(jù)，某個(gè)Hreginserver節(jié)點(diǎn)上包含該表的2個(gè)Regin,分別為A和B,10條數(shù)據(jù)中有6條屬于A.4條屬于B,寫入這10條數(shù)據(jù)需要向該HreginServer發(fā)送1次RPC請求108.以下哪個(gè)不屬于Hadp中Mapreduce組件的特點(diǎn)？A、高容錯(cuò)B、良好的擴(kuò)展性C、實(shí)時(shí)計(jì)算D、易于編程答案：C解析：高度抽象的編程思想，良好的擴(kuò)展性，高容錯(cuò)性，適用于并行計(jì)算和離線計(jì)算109.關(guān)于HBase和BigTable說法錯(cuò)誤的是A、HBase是一個(gè)高可靠、高性能、面向列、可伸縮的分布式數(shù)據(jù)庫，是谷歌BigTable的開源實(shí)現(xiàn)，主要用來存儲非結(jié)構(gòu)化和半結(jié)構(gòu)化的松散數(shù)據(jù)B、BigTable和HBase均采用Chubby提供協(xié)同服務(wù)管理C、BigTable和HBase都是一個(gè)分布式存儲系統(tǒng)D、HBase的目標(biāo)是處理非常龐大的表，可以通過水平擴(kuò)展的方式，利用廉價(jià)計(jì)算機(jī)集群處理由超過10億行數(shù)據(jù)和數(shù)百萬列元素組成的數(shù)據(jù)表答案：B解析：BigTable是一個(gè)分布式存儲系統(tǒng)，它利用谷歌提出的MapReduce分布式并行計(jì)算模型來處理海量數(shù)據(jù)，使用谷歌分布式文件系統(tǒng)GFS作為底層數(shù)據(jù)存儲，采用Chubby提供協(xié)同服務(wù)管理。HadpDatabase，是一個(gè)高可靠性、高性能、面向列、可伸縮、實(shí)時(shí)讀寫的分布式數(shù)據(jù)庫。利用HadpHDFS作為其文件存儲系統(tǒng),利用Zkeeper作為其分布式協(xié)同服務(wù)主要用來存儲非結(jié)構(gòu)化和半結(jié)構(gòu)化的松散數(shù)據(jù)。110.使用JAVAAPI進(jìn)行HBase表數(shù)據(jù)添加操作，以下命令輸寫正確的是()。cA、HTable.add(newPut(Bytes.tBytes(rw));B、HTable.insert(newPut(Bytes.tBytes(rw))C、HTable.putfnewPut(Bytes.tBytes(rw));D、HTable.updatefnewPut(Bytes.tBytes(rw))答案：C解析：即table.get(table).scan();111.在Java中，一個(gè)類可同時(shí)定義許多同名的方法，這些方法的形式參數(shù)個(gè)數(shù)、類型或順序各不相同，傳回的值也可以不相同。這種面向?qū)ο蟪绦虻奶匦苑Q為A、隱藏B、覆蓋C、重載D、Java不支持此特性答案：C解析：一個(gè)類可以定義多個(gè)同名的方法，只要這些方法的參數(shù)列表不完全相同，這稱為方法重載。112.HBase依賴（）技術(shù)框架提供消息通信機(jī)制。A、ZkeeperB、ChubbyC、RPCD、Scket答案：A解析：“hbase依賴“Zkeeper”提供消息通信機(jī)制113.用定期數(shù)據(jù)分析報(bào)表作為依據(jù)的反映計(jì)劃執(zhí)行情況的數(shù)據(jù)分析報(bào)告是（）。A、專題分析報(bào)告B、綜合分析報(bào)告C、日常數(shù)據(jù)通報(bào)D、實(shí)時(shí)運(yùn)營報(bào)告答案：C解析：用定期數(shù)據(jù)分析報(bào)表作為依據(jù)的反映計(jì)劃執(zhí)行情況的數(shù)據(jù)分析報(bào)告是日常數(shù)據(jù)通報(bào)114.LSM結(jié)構(gòu)的數(shù)據(jù)首先存儲在()0A、硬盤上B、內(nèi)存中C、磁盤陣列中D、閃存中答案：B解析：LSM樹的核心特點(diǎn)是利用順序?qū)憗硖岣邔懶阅?，但因?yàn)榉謱?此處分層是指的分為內(nèi)存和文件兩部分)的設(shè)計(jì)會稍微降低讀性能，但是通過犧牲小部分讀性能換來高性能寫，使得LSM樹成為非常流行的存儲結(jié)構(gòu)。115.哪一項(xiàng)不屬于Hive的流控特性（）？A、已經(jīng)建立的總連接數(shù)閾值控制B、某個(gè)特定用戶已經(jīng)建立的連接數(shù)閾值控制C、每個(gè)用戶已經(jīng)建立的連接數(shù)閾值控制D、單位時(shí)間內(nèi)所建立的連接數(shù)閾值控制答案：B解析：某個(gè)特定用戶已經(jīng)建立的連接數(shù)閾值控制不屬于Hive的流控特性116.下列關(guān)于Flinkbarrier描述錯(cuò)誤的是？（）A、一個(gè)barrier將本周期快照的數(shù)據(jù)與下一個(gè)周期快照的數(shù)據(jù)分隔開來B、barrier是F1ink快照的核心C、在插入barrier的時(shí)候，會暫時(shí)阻斷數(shù)據(jù)流D、barrier周期性插入到數(shù)據(jù)流中，并作為數(shù)海流的一部分隨之流動答案：C解析：在插入barrier的時(shí)候，不會暫時(shí)阻斷數(shù)據(jù)流117.如果要給隊(duì)列QueueA設(shè)置容量為30%,應(yīng)該設(shè)置哪個(gè)參數(shù)（）?A、yarn.scheduler.capacity.rt.QueueA.minimum-user-limit-percentB、yarn.scheduler.capacity.rt.QueueD.user-limit-factrC、yarn.scheduler.capacity.rt.QueueA.capacityD、yarn.scheduler.capacity.rt.QueueA.state答案：C解析：在YARN中應(yīng)設(shè)置為yarn.scheduler.capacity.rt.QueueA.capacity118.Hadptnryarnschedulercapacity,rt.Queueafinim.m-user-limit-percent設(shè)置為50,下面說法錯(cuò)誤的是？A、一個(gè)用戶提交任務(wù)，可以使用QueueA的100%的資源。B、如果QueueA中已經(jīng)有2個(gè)用戶的任務(wù)運(yùn)行,這時(shí)第3個(gè)用戶提交的任務(wù)需要等待釋放資源。C、QueueA中必須保障毎個(gè)用戶至少得到50%的資源D、QueueA中的每個(gè)用戶最多只能獲得50%的資源答案：D解析：如果有資源需求，每個(gè)隊(duì)列都會對分配給用戶的資源百分比實(shí)施限制。用戶限制可以在最小值和最大值之間變化。前者（最小值）設(shè)置為該屬性值，后者（最大值）取決于已提交應(yīng)用程序的用戶數(shù)。例如，假設(shè)此屬性的值為25。如果兩個(gè)用戶已將應(yīng)用程序提交到隊(duì)列，用戶不可以使用超過50％的隊(duì)列資源。如果第三位用戶提交了一個(gè)應(yīng)用程序，用戶都不能使用超過33％的隊(duì)列資源。如果有4個(gè)或更多用戶，用戶都不能使用超過25％的隊(duì)列資源。值100表示??未施加用戶限制。默認(rèn)值為100。值指定為整數(shù)。119.下列論據(jù)中，能夠支撐“大數(shù)據(jù)無所不能”的觀點(diǎn)的是（）A、互聯(lián)網(wǎng)金融打破了傳統(tǒng)的觀念和行為B、大數(shù)據(jù)存在泡沫C、大數(shù)據(jù)具有非常高的成本D、個(gè)人隱私泄露與信息安全擔(dān)憂答案：D解析：“個(gè)人隱私泄露與信息安全擔(dān)憂”能夠支撐“大數(shù)據(jù)無所不能”的觀點(diǎn)120.關(guān)于MapReduceShuffle過程合并（bine）操作，兩個(gè)健值對<"a"，1＞和＜"a"，1＞經(jīng)過合并操作結(jié)果為（）。A、<"a"，2>B、<"a",<1,1>>C、<"a,a",2>D、<"a,a",<1,1>>答案：A解析：關(guān)于MapReduceShuffle過程合并（bine）操作，兩個(gè)健值對<"a"，1＞和＜"a"，1＞經(jīng)過合并操作結(jié)果為<"a"，2>。歸并的結(jié)果是<"a",<1,1>>。121.KafkaClusterMirrring工具可以實(shí)現(xiàn)以下哪些功能？A、Kafka數(shù)據(jù)同步方案B、Kafka單集群內(nèi)數(shù)據(jù)備份C、Kafka單集群內(nèi)數(shù)據(jù)恢復(fù)D、以上全不正確答案：A解析：可使用MirrrMaker工具創(chuàng)建從源Kafka群集（源群集）到目標(biāo)Kafka群集（目標(biāo)群集）的鏡像，從而實(shí)現(xiàn)數(shù)據(jù)同步122.HBase是分布式列式存儲系統(tǒng)，記錄按什么集中存放。A、列族B、列C、行D、不確定答案：A解析：HBase是一個(gè)分布式列式存儲系統(tǒng),記錄按列簇集中存放,通過主鍵(rw,key)和主鍵的range來檢索數(shù)據(jù)。123.HFile數(shù)據(jù)格式中的Metalndex字段用于()。A、Meta塊的長度B、Meta塊的結(jié)束點(diǎn)C、Meta塊數(shù)據(jù)內(nèi)容D、Meta塊的起始點(diǎn)答案：D解析：HFile是參照谷歌的SSTable存儲格式進(jìn)行設(shè)計(jì)的。全部的數(shù)據(jù)記錄都是通過它來完畢持久化，其內(nèi)部主要採用分塊的方式進(jìn)行存儲124.以下哪個(gè)操作是hive不支持的？（）A、表增加列B、表刪除列C、表修改列D、修改表名答案：B解析：hive不支持表刪除列125.Fusininsight產(chǎn)品中，關(guān)乎Kafka說法不正確的是（）A、Kafka強(qiáng)依賴ZkeeperB、Kafka的服務(wù)端可以產(chǎn)生消息C、Kafka的部署的實(shí)例個(gè)數(shù)不得小于2D、Cnsumer作為Kafka的客戶端角色專門進(jìn)行消息的消費(fèi)答案：B解析：Kafka的服務(wù)端不可以產(chǎn)生消息126.Hadp平臺中啟用YARN組件的日志聚集功能，需要配置哪個(gè)參數(shù)？A、yarn.ndemanager.lcal-dirsB、yarn.ndemanager.lg-dirsC、yarn.acl.enableD、yarn.lg-aggregatin-enable答案：D解析：Hadp平臺中啟用YARN組件的日志聚集功能，需要配置yarn.lg-aggregatin-enable參數(shù)127.下列國家的大數(shù)據(jù)發(fā)展行動中，集中體現(xiàn)“重視基礎(chǔ)、首都先行”的國家是（）。A、美國B、日本C、中國D、韓國答案：D解析：國家的大數(shù)據(jù)發(fā)展行動中，集中體現(xiàn)“重視基礎(chǔ)、首都先行”的國家是韓國128.關(guān)于Kafka的基本概念描述錯(cuò)誤的是（）?A、Kafka集群包含一個(gè)或多個(gè)服務(wù)實(shí)例，這些服務(wù)實(shí)例被稱為BrkerB、每條發(fā)布到Kafka集群的消息都有一個(gè)類別，這個(gè)類別被稱為TpicC、每個(gè)Cnsumer屬于多個(gè)的CnsumerGrupD、Kafka將Tpic分成一個(gè)或者多個(gè)Partitin,每個(gè)Partitin在物理上對應(yīng)一個(gè)文件夾，該文件夾下存儲這個(gè)Partitin的所有消息答案：C解析：每個(gè)Cnsumer進(jìn)程都會劃歸到一個(gè)邏輯的CnsumerGrup中129.以下關(guān)于Zkeeper關(guān)鍵特性中的原子性說法正確的是？A、客戶端發(fā)送的更新會按照他們被發(fā)送的順序進(jìn)行應(yīng)用B、更新只能全部完成或失敗，不會部分完成C、一條消息被一個(gè)server接收，將被所有server接收D、集群中無論哪臺服務(wù)器，對外示均是同一視圖答案：B解析：數(shù)據(jù)更新原子性：一次數(shù)據(jù)更新要么成功，要么失敗。130.SQL語言中，刪除一個(gè)表中所有數(shù)據(jù)，但保留表結(jié)構(gòu)的命令是（）。A、DELETEB、DRPC、DRPD、REMRE答案：A解析：2、truncate和delete只刪除數(shù)據(jù)不刪除表的結(jié)構(gòu)(定義)。DeleteFrmCustmer;DrptableCustmer;drptable表名稱；truncatetable表名稱；deletefrm表名稱where列名稱=值131.Hbase元數(shù)據(jù)MetaRegin/路由信息保存在哪里？A、ZkeeperB、Meta表C、HMasterD、Rt表答案：B解析：Hbase元數(shù)據(jù)MetaRegin/路由信息保存在Meta表中132.在數(shù)據(jù)安全及處理效率方面，不適宜大數(shù)據(jù)分析的軟件是（）。A、SASB、StataC、MatLabD、SPSS答案：D解析：在數(shù)據(jù)安全及處理效率方面，不適宜大數(shù)據(jù)分析的軟件是SPSSSAS（是全球最大的私營軟件公司之一，是由美國北卡羅來納州立大學(xué)1966年開發(fā)的統(tǒng)計(jì)分析軟件。SPSS是由SPSS公司推出的軟件“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”軟件。Stata是一套提供其使用者數(shù)據(jù)分析、數(shù)據(jù)管理以及繪制專業(yè)圖表的完整及整合性統(tǒng)計(jì)軟件。MATLAB是美國MathWrks公司出品的商業(yè)數(shù)學(xué)軟件，用于數(shù)據(jù)分析、無線通信、深度學(xué)習(xí)、圖像處理與計(jì)算機(jī)視覺、信號處理、量化金融與風(fēng)險(xiǎn)管理、機(jī)器人，控制系統(tǒng)等領(lǐng)域。133.硬件故障被認(rèn)為是常態(tài)，為了解決這個(gè)問題.HDFS設(shè)計(jì)了副本機(jī)制。默認(rèn)情況下HDFS會存()份？A、3B、5C、2D、4答案：A解析：默認(rèn)情況下HDFS會存3份134.在HBaseShell操作中，可以使用下面哪個(gè)命令對數(shù)據(jù)表進(jìn)行行數(shù)統(tǒng)計(jì)()。A、selectcunt(0)frm'users'B、sum'users'C、cunt'users'D、truncate'users'答案：C解析：HBase'users'屬性唯一，通過cunt語句，可統(tǒng)計(jì)有多少行數(shù)135.如果需要對HBase表中的數(shù)據(jù)進(jìn)行列表查看，可以使用()命令進(jìn)行操作。A、cuntB、scanC、putD、get答案：B解析：get命令是用來獲取Hbase表中某行的數(shù)據(jù)136.在Fusininsight產(chǎn)品中，關(guān)于創(chuàng)建Kafka的Tpic,以下哪些描述是正確的？A、在創(chuàng)建Kafka的Tpic時(shí),必須設(shè)置Partitin個(gè)數(shù)B、在創(chuàng)建Kafka的tpic時(shí),必須設(shè)置Partitin副本個(gè)數(shù)C、設(shè)置多副本可以増強(qiáng)Kafka服務(wù)的容災(zāi)能力D、以上全都正確答案：C解析：kafka的partitin可以在創(chuàng)建時(shí)候指定，也可以alter（kafka-tpic.sh里面的參數(shù)），但是，這個(gè)修改只能增加partitin數(shù)目，并不能減少137.關(guān)于HBase用戶讀寫數(shù)據(jù)過程說法錯(cuò)誤的是A、用戶寫入數(shù)據(jù)時(shí)，被分配到相應(yīng)Regin服務(wù)器去執(zhí)行B、用戶數(shù)據(jù)首先被寫入到MemStre和Hlg中C、只有當(dāng)操作寫入Hlg之后，mit()調(diào)用才會將其返回給客戶端D、當(dāng)用戶讀取數(shù)據(jù)時(shí)，先去磁盤上面的StreFile中尋找答案：D解析：數(shù)據(jù)讀寫的過程：?用戶寫入數(shù)據(jù)時(shí)，被分配到相應(yīng)Regin服務(wù)器去執(zhí)行?用戶數(shù)據(jù)首先被寫入到MemStre和Hlg中?只有當(dāng)操作寫入Hlg之后，mit()調(diào)用才會將其返回給客戶端?當(dāng)用戶讀取數(shù)據(jù)時(shí)，Regin服務(wù)器會首先訪問MemStre緩存，如果找不到，再去磁盤上面的StreFile中尋找138.如果我們現(xiàn)有一個(gè)安裝26.5版本的hadp集群，在不修改默認(rèn)配置的情況下存儲200個(gè)每個(gè)200M的文本文件，請問最終會在集群中產(chǎn)生多少個(gè)數(shù)據(jù)塊（包括副本）A、200B、40000C、400D、1200答案：D解析：問最終會在集群中產(chǎn)生1200個(gè)數(shù)據(jù)塊139.Hadp中MapReduce組件擅長處理哪種場景的計(jì)算任務(wù)？A、迭代計(jì)算B、離線計(jì)算C、實(shí)時(shí)交互計(jì)算D、流式計(jì)算答案：B解析：海量數(shù)據(jù)在單機(jī)上處理因?yàn)橛布Y源限制，無法勝任。而一旦將單機(jī)版程序擴(kuò)展到集群來分布式運(yùn)行，將極大增加程序的復(fù)雜度和開發(fā)難度。引入mapreduce框架后，開發(fā)人員可以將絕大部分工作集中在業(yè)務(wù)邏輯的開發(fā)上，而將分布式計(jì)算中的復(fù)雜性交由框架來處理。140.下哪種不是Hive支持的數(shù)據(jù)類型（）。A、structB、intC、mapD、lng答案：D解析：Hive支持原始數(shù)據(jù)類型和復(fù)雜類型，原始類型包括數(shù)值型，Blean，字符串，時(shí)間戳,int。復(fù)雜類型包括數(shù)組，map，struct。141.hadp平臺中要查看Yarn服務(wù)中一個(gè)applicatin的信息，通常需要使用什么命令？A、cntainerB、jarC、applicatin-attemptD、Applicatin答案：D解析：hadp平臺中要查看Yarn服務(wù)中一個(gè)applicatin的信息，通常需要使用Applicatin命令。Cntainer將內(nèi)存、CPU、磁盤、網(wǎng)絡(luò)等資源封裝在一起，這樣可以起到限定資源邊界的作用。把本地的java文件打包成jar包，然后放在linux集群上，通過hadp命令來運(yùn)行該jar包。142.HBase來源于哪篇博文？A、TheGgleFileSystemB、MapReduceC、BigTableD、Chubby答案：C解析：Bigtable是一種用于管理結(jié)構(gòu)化數(shù)據(jù)的分布式存儲系統(tǒng)，旨在擴(kuò)展到非常大的尺寸：對數(shù)千臺商品服務(wù)器上的PB數(shù)據(jù)進(jìn)行服務(wù)。Bigtable不支持完整的關(guān)系數(shù)據(jù)模型，相反，它為客戶端提供了一個(gè)簡單的數(shù)據(jù)模型，支持對數(shù)據(jù)布局和格式的動態(tài)控制，并允許客戶端推理底層存儲中表示的數(shù)據(jù)的局部屬性。用戶在Bigtable中可以使用是任意字符串的行和列名稱對數(shù)據(jù)進(jìn)行索引。Bigtable還將數(shù)據(jù)視為字符串，盡管客戶端通常將各種形式的結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)序列化到這些字符串中。143.FusinninsigetHD系統(tǒng)中，F(xiàn)lume數(shù)據(jù)流在節(jié)點(diǎn)內(nèi)不需要經(jīng)過哪個(gè)組件？A、SurceB、SinkC、TpicD、channel答案：C解析：FusinninsigetHD系統(tǒng)中，F(xiàn)lume數(shù)據(jù)流在節(jié)點(diǎn)內(nèi)不需要經(jīng)過Tpic組件。在節(jié)點(diǎn)的內(nèi)部，agent由surce、channel和sink組成。surce負(fù)責(zé)消費(fèi)從上游節(jié)點(diǎn)獲取的events，并將其放到channel中，目前Flume支持Avr、Thrift、Syslg、Netcat等數(shù)據(jù)流。channel分為兩種類型，一種是memrychannel，它適合高吞吐量場景，但節(jié)點(diǎn)掛掉后數(shù)據(jù)可能會丟失。另一種是filechannel，也就是channel里的數(shù)據(jù)會同步到硬盤里，節(jié)點(diǎn)意外掛掉后數(shù)據(jù)可恢復(fù)，但處理時(shí)間會稍長一些，F(xiàn)lume默認(rèn)使用filechannel。sink從channel取數(shù)據(jù)并將其放入下游節(jié)點(diǎn)。144.如果需要由數(shù)據(jù)生產(chǎn)者決定數(shù)據(jù)發(fā)送給目標(biāo)Blt的某一個(gè)確定的Task,應(yīng)選擇以下哪種消息發(fā)布策略（）？A、局部字段分組B、廣播分組C、直接分組D、全局分組答案：C解析：如果需要由數(shù)據(jù)生產(chǎn)者決定數(shù)據(jù)發(fā)送給目標(biāo)Blt的某一個(gè)確定的Task,應(yīng)選擇直接分組發(fā)布策略145.Hadpffl件在企業(yè)應(yīng)用中，能用于數(shù)據(jù)挖掘的產(chǎn)品有（）。A、HiveB、PigC、MahutD、Hbase答案：C解析：Mahut可用于數(shù)據(jù)挖掘，Hive和Hbase是數(shù)據(jù)存儲，pig是一種語言。146.若需要定義一個(gè)類域或類方法，應(yīng)使用哪種修飾符？A、staticB、packageC、privateD、public答案：A解析：類域類方法全局變量全局方法147.以下關(guān)于Flink關(guān)鍵特性描述不正確的是（）A、Sparkstreaming與Flink相比，時(shí)延更低B、F1ink流式處理引撃能夠同時(shí)提供支持流處理和批處理應(yīng)用的功能C、與FusininghtHD中的Streaming相比Flink具有更高的吞吐量D、checkpint實(shí)現(xiàn)了Flink的容錯(cuò)答案：A解析：Flink會比SparkStreaming有更低的流處理延遲性148.關(guān)于Hive中的桶說法不正確的是（）？A、每個(gè)桶是一個(gè)目錄B、建表時(shí)指定桶個(gè)數(shù)，桶內(nèi)可排序C、數(shù)據(jù)按照某個(gè)字段的值Hash后放入某個(gè)桶中D、對于數(shù)據(jù)抽樣、特定jin的優(yōu)化很有意義答案：A解析：一個(gè)分區(qū)就是一個(gè)目錄，而不是桶149.FusininsightManager用戶權(quán)限管理不支持哪個(gè)配置？A、給用戶配置角色B、給用戶組配置角色C、給角色配量權(quán)限D(zhuǎn)、給用戶組配置權(quán)限答案：D解析：FusininsightManager用戶權(quán)限管理不支持給用戶組配置權(quán)限150.Flink中的（）接口用于流數(shù)據(jù)處理,（）接口用于批處理？A、DatabatchAPI,DatastreamAPIB、StreamAPI,BatchAPIC、DatastreamAPI,DatasetAPID、BatchAPI,StreamAPI答案：C解析：Flink中的DatastreamAPI接口用于流數(shù)據(jù)處理,DatasetAPI接口用于批處理151.Flink的數(shù)據(jù)轉(zhuǎn)換操作在以下哪些環(huán)節(jié)中完成（）？A、channelB、TransfrmatinC、sinkD、surce答案：B解析：Flink的數(shù)據(jù)轉(zhuǎn)換操作在Transfrmatin完成152.部署FusininsightHD時(shí),同一集群內(nèi)的FlumeServer節(jié)點(diǎn)建議至少部署幾個(gè)？A、1B、3C、4D、2答案：D解析：部署FusininsightHD時(shí),同一集群內(nèi)的FlumeServer節(jié)點(diǎn)建議至少部署2個(gè)153.整型數(shù)據(jù)類型中，需要內(nèi)存空間最少的是A、shrtB、lngC、intD、byte答案：D解析：byte，一個(gè)字節(jié)（八個(gè)二進(jìn)制位）154.數(shù)據(jù)倉庫的最終目的是（）A、收集業(yè)務(wù)需求B、開發(fā)數(shù)據(jù)倉庫的應(yīng)用分析C、建立數(shù)據(jù)倉庫邏輯模型D、為用戶和業(yè)務(wù)部門提供決策支持答案：A解析：數(shù)據(jù)倉庫的最終目的是收集業(yè)務(wù)需求155.為了保證流應(yīng)用的快照存儲的可靠性，快照主要存儲在（）？A、本地文件系統(tǒng)中B、Jbmanager的內(nèi)存中C、HDFS中D、可靠性高的單機(jī)數(shù)據(jù)庫中答案：C解析：為了保證流應(yīng)用的快照存儲的可靠性，快照主要存儲在HDFS中156.在Spark生態(tài)組件中，哪個(gè)產(chǎn)品可用于基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理（）。A、SparkCreB、SparkSqlC、SparkStreamingD、MLlib答案：C解析：SparkStreaming基于實(shí)時(shí)數(shù)據(jù)流157.使用JAVAAPI進(jìn)行HBaseS表掃描操作，以下命令輸寫正確的是()。A、table.getScanner(scan);B、table.scan(table);C、table.get(table).scan();D、table.Scanner(get);答案：A解析：使用table.getScanner(scan)進(jìn)行掃描158.在數(shù)據(jù)庫模型中，可以指定條件對記錄進(jìn)行排序，使用的方法是（）。A、rder_byB、filterC、rderD、grup()答案：A解析：保證結(jié)果集中的行已排序的方法是使用RDERBY子句159.關(guān)于HBase實(shí)現(xiàn)的三個(gè)主要的功能組件說法錯(cuò)誤的是A、主服務(wù)器Master負(fù)責(zé)管理和維護(hù)HBase表的分區(qū)信息，維護(hù)Regin服務(wù)器列表，分配Regin，負(fù)載均衡B、Regin服務(wù)器負(fù)責(zé)存儲和維護(hù)分配給自己的Regin，處理來自客

人人文庫> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

大數(shù)據(jù)分析師理論知識考試復(fù)習(xí)題庫（含答案）

文檔簡介

溫馨提示

最新文檔

評論

大數(shù)據(jù)分析師理論知識考試復(fù)習(xí)題庫（含答案）

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔