大數(shù)據(jù)分析師理論知識考試復(fù)習(xí)題庫(含答案)_第1頁
大數(shù)據(jù)分析師理論知識考試復(fù)習(xí)題庫(含答案)_第2頁
大數(shù)據(jù)分析師理論知識考試復(fù)習(xí)題庫(含答案)_第3頁
大數(shù)據(jù)分析師理論知識考試復(fù)習(xí)題庫(含答案)_第4頁
大數(shù)據(jù)分析師理論知識考試復(fù)習(xí)題庫(含答案)_第5頁
已閱讀5頁,還剩123頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

PAGEPAGE1大數(shù)據(jù)分析師理論知識考試復(fù)習(xí)題庫(含答案)一、單選題1.Spark是用以下那種編程語言實(shí)現(xiàn)的?A、cB、C++C、javaD、Scala答案:D解析:Spark中用Scala開發(fā)語法簡潔許多,且支持類型推斷,可大大提升開發(fā)效率。2.在FusinInsightManager界面中,對Lader的操作不包括下列哪個(gè)選項(xiàng)()A、切換Lader主備節(jié)點(diǎn)B、啟動Lader實(shí)例C、配置Lader參數(shù)D、查看Lader服務(wù)狀態(tài)答案:A解析:在FusinInsight界面中,對Lader的操作不包括切換Lader主備節(jié)點(diǎn)3.Hive不適用于以下哪個(gè)場景單選A、非實(shí)時(shí)分析,例如日析B、數(shù)據(jù)挖掘,例如用戶析,區(qū)域展示C、數(shù)據(jù)匯總,例如母天,每擊數(shù),點(diǎn)擊排行D、實(shí)時(shí)在線數(shù)答案:D解析:Hive不適用于實(shí)時(shí)在線數(shù)單選。由于hive主要用于數(shù)據(jù)分析,因此延時(shí)比較高,不適用于實(shí)時(shí)場景,適用于離線大數(shù)據(jù)分析4.Hadp平臺中HBase的Regin是由哪個(gè)服務(wù)進(jìn)程來管理?A、HMasterB、DataNdeC、ReginServerD、Zkeeper答案:C解析:Hadp平臺中HBase的Regin是由ReginServer管理5.Hadp組件在企業(yè)應(yīng)用中,能用于大數(shù)據(jù)集實(shí)時(shí)查詢的產(chǎn)品有()。A、HiveB、PigC、MahutD、Hbase答案:D解析:Hadp組件在企業(yè)應(yīng)用中,能用于大數(shù)據(jù)集實(shí)時(shí)查詢的產(chǎn)品有Hbase。6.下列選項(xiàng)中無法通過大數(shù)據(jù)技術(shù)實(shí)現(xiàn)的是?()A、商業(yè)模式發(fā)現(xiàn)B、信用評估C、商品推薦D、運(yùn)營分析答案:A解析:商業(yè)模式發(fā)現(xiàn)無法通過大數(shù)據(jù)技術(shù)實(shí)現(xiàn)7.日常數(shù)據(jù)通報(bào)型報(bào)告的特點(diǎn)錯(cuò)誤的是()。A、進(jìn)度性B、規(guī)范性C、時(shí)效性D、全面性答案:D解析:日常數(shù)據(jù)通報(bào)型報(bào)告的特點(diǎn)有進(jìn)度性,規(guī)范性,時(shí)效性。https://zhuanlan.zhihu./p/53857057日常數(shù)據(jù)通報(bào)是以定期數(shù)據(jù)分析報(bào)表為依據(jù),反映計(jì)劃執(zhí)行情況,并分析影響和形成原因的一種數(shù)據(jù)分析報(bào)告。這種數(shù)據(jù)分析報(bào)告一般是按日、周、月、季、年等時(shí)間階段定期進(jìn)行,所以也叫定期分析報(bào)告。8.HBase依賴()提供強(qiáng)大的計(jì)算能力A、PrtbufB、JavaC、KafkaD、Chubby答案:D解析:谷歌收購云計(jì)算公司CuldSimple強(qiáng)化云計(jì)算能力9.以下關(guān)于Hive操作描述不正確的是()。A、Hive是一個(gè)建立在hadp文件系統(tǒng)上的數(shù)據(jù)倉庫架構(gòu),可以用其對HDFS上B、Hive依賴于MapReduce處理數(shù)據(jù)C、Hive的加載數(shù)據(jù)時(shí)候,可以用lcal進(jìn)行修飾,表示從某個(gè)本地目錄下加載數(shù)據(jù)D、Hive—般可以用于實(shí)時(shí)的查詢分析答案:D解析:Hive不可以用于實(shí)時(shí)的查詢分析10.以下關(guān)于繼承的敘述正確的是()A、在Java中類只允許單一繼承B、在Java中一個(gè)類只能實(shí)現(xiàn)一個(gè)接nC、在Java中一個(gè)類不能同時(shí)繼承一個(gè)類和實(shí)現(xiàn)一個(gè)接口D、在Java中接口只允許單一繼承答案:A解析:繼承分為單繼承和多繼承兩種形式。單繼承允許一個(gè)類可以有多個(gè)子類,但只能有一個(gè)父類;多繼承則允許一個(gè)類不僅可以有多個(gè)子類,還可以有多個(gè)父類。但需要注意一點(diǎn),Java只支持單繼承,但可以通過接口實(shí)現(xiàn)多繼承的功能。一個(gè)類可以同時(shí)繼承一個(gè)類和實(shí)現(xiàn)一個(gè)接口。11.關(guān)于HIVE的描述不正確的?A、Hive最佳使用景是大數(shù)據(jù)的批處理作業(yè)B、Hive可以實(shí)現(xiàn)大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢C、Hive構(gòu)建在基于靜態(tài)批處理的Hadp之上,Hadp通常有較高的延遲并且在作業(yè)提交和調(diào)度的時(shí)候需要大量開銷D、Hive查詢操作過程嚴(yán)格遵循HadpMapreduce的作用執(zhí)行模型.Hive將用戶的HveQL語句通過解釋器轉(zhuǎn)換為MapreduceHadp集群上答案:B解析:Hive不可以實(shí)現(xiàn)大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢。Hive構(gòu)建在基于靜態(tài)批處理的Hadp之上,Hadp通常都有較高的延遲并且在作業(yè)提交和調(diào)度的時(shí)候需要大量的開銷。因此,hive并不能夠在大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢12.MapReduce的Shuffle過程以下中哪個(gè)操作是最后做的?A、排序B、合并C、分區(qū)D、溢寫答案:B解析:map階段shuffle過程就是將map結(jié)果進(jìn)行分區(qū)、排序、合并13.以下哪個(gè)方法用于定義線程的執(zhí)行體?A、start()B、init()C、run()D、synchrnized()答案:C解析:run()方法是用來定義這個(gè)線程在啟動的時(shí)候需要做什么,但是,直接執(zhí)行run()方法那就不是線程,必須使用start()啟動,那樣才是線程。線程是進(jìn)程中的實(shí)體,一個(gè)進(jìn)程可以擁有多個(gè)線程,一個(gè)線程必須有一個(gè)父進(jìn)程。線程不擁有系統(tǒng)資源,只有運(yùn)行必須的一些數(shù)據(jù)結(jié)構(gòu);與父進(jìn)程的其它線程共享該進(jìn)程所擁有的全部資源。線程可以創(chuàng)建和撤消線程,從而實(shí)現(xiàn)程序的并發(fā)執(zhí)行。一般,線程具有就緒、阻塞和運(yùn)行三種基本狀態(tài)。14.以下哪種不是Hive支持的數(shù)據(jù)類型?A、StructB、IntC、MapD、Lng答案:D解析:Hive不支持Lng類型,Lng是Java里面的,在Hive里L(fēng)ng對應(yīng)的應(yīng)該是BIGINT。15.下面說法錯(cuò)誤的是()。A、Hadp集群采用的是Master/Slave工作模式B、DataNde上保存著的是元數(shù)據(jù),真正的數(shù)據(jù)是存放在NameNde上的C、HDFS采用了一種對文件切割后分別存放的存儲方式。D、HDFS是為高數(shù)據(jù)吞吐量應(yīng)用優(yōu)化的。答案:B解析:DataNde上數(shù)據(jù)塊以文件形式存儲在磁盤上,包括兩個(gè)文件,一個(gè)是數(shù)據(jù)本身,一個(gè)是數(shù)據(jù)塊元數(shù)據(jù)包括長度、校驗(yàn)、時(shí)間戳;16.請問以下哪個(gè)命令組成是錯(cuò)誤的?A、sbin/stp-dfs.shB、sbin/hdfsdfsadmin-reprtC、bin/hadpnamende-frmatD、bin/hadpfs-cat/hadpdata/my.txt答案:B解析:A選項(xiàng),sbin/stp-dfs.sh是用來停止日志相關(guān)服務(wù)。C選項(xiàng),它負(fù)責(zé)管理文件系統(tǒng)的命名空間,維護(hù)文件系統(tǒng)的文件樹以及所有的文件和目錄的元數(shù)據(jù)。D選項(xiàng),文件目錄有關(guān)。B選項(xiàng)命令不存在。所以選B。17.YARN中默認(rèn)的資源調(diào)度器是?A、FIF調(diào)度器B、容量調(diào)度器C、Fair調(diào)度器D、以上全不是答案:B解析:YARN中默認(rèn)的資源調(diào)度器是容量調(diào)度器18.關(guān)于相關(guān)性rA,B說法錯(cuò)誤的是()。A、rA,B>0,正相關(guān)。A隨B的值得增大而增大B、rA,B=0不相關(guān)。AB無關(guān)C、rA,B<0,負(fù)相關(guān)。A隨B的值得增大而減少D、不能單純依據(jù)rA,B<0fig定AB相關(guān)性答案:D解析:不能單純依據(jù)rA,B<0fig定AB相關(guān)性是錯(cuò)誤的r為相關(guān)系數(shù)19.HDFS有一個(gè)gzip文件大小75MB,客戶端設(shè)置Blck大小為64MB。當(dāng)運(yùn)行mapreduce任務(wù)讀取該文件時(shí)inputsplit大小為?A、—個(gè)map取64MB,另外一個(gè)map取11MBB、128MBC、64MBD、75MB答案:D解析:gzip不支持split,所以inputsplit大小為文件大小20.以下關(guān)于fusininsightCTbase的描述不正確的是?A、CThase的讀寫數(shù)據(jù)接口,統(tǒng)一封裝了行定義的接口,自動進(jìn)行冷字段的合并和解析,不需要在應(yīng)用程序中進(jìn)行合并和解釋B、CTHBase是基于Hbase的聚簇表開發(fā)框架。云HBASE數(shù)據(jù)庫(CT-Hbase)基于開源HBase引擎,支持NSQL和二級索引的實(shí)時(shí)數(shù)據(jù)分析服務(wù)。C、CTHbase提供了一套Webui進(jìn)行元數(shù)據(jù)定義,提供了只管醫(yī)用的表設(shè)計(jì)工具,降低表設(shè)D、CTHbase的javaAPI提供一套Hbas鏈接池管理的接口,內(nèi)部進(jìn)行連接共享,減少客戶端應(yīng)用開發(fā)難度。答案:B解析:CTHBase不是基于Hbase的聚簇表開發(fā)框架。云HBASE數(shù)據(jù)庫(CT-Hbase)基于開源HBase引擎,支持NSQL和二級索引的實(shí)時(shí)數(shù)據(jù)分析服務(wù)。21.在Webhcat架構(gòu)中,用戶能夠通過安全的HTTPS協(xié)議執(zhí)行以下哪些操作?A、執(zhí)行HiveDDL操作B、運(yùn)行Mapreduce任務(wù)C、運(yùn)行HiveHL任務(wù)D、以上全都正確答案:D解析:在Webhcat架構(gòu)中,用戶能夠通過安全的HTTPS協(xié)議執(zhí)行HiveDDL操作、運(yùn)行Mapreduce任務(wù)、運(yùn)行HiveHL任務(wù)22.HBase依賴()提供消息通信機(jī)制A、ZkeeperB、ChubbyC、RPCD、Scket答案:A解析:ZKeeper是一個(gè)分布式的,開放源碼的分布式應(yīng)用程序協(xié)調(diào)服務(wù),是Ggle的Chubby一個(gè)開源的實(shí)現(xiàn),是Hadp和Hbase的重要組件。它是一個(gè)為分布式應(yīng)用提供一致性服務(wù)的軟件,提供的功能包括:配置維護(hù)、域名服務(wù)、分布式同步、組服務(wù)等。23.在Mapper類中,共有4個(gè)函數(shù):setup()、map()、()、run()。A、Reducer()B、cleanup()C、Split()D、lcal()答案:B解析:在Mapper類中,共有4個(gè)函數(shù):setup()、map()、cleanup()、run()。24.kafka-clustermirrring工具可以實(shí)現(xiàn)以下哪個(gè)功能()A、kafka集群數(shù)據(jù)同步方案B、kafka單集群內(nèi)數(shù)據(jù)備份C、kafka單集群內(nèi)數(shù)據(jù)恢復(fù)D、以上全部不對答案:A解析:kafka-clustermirrring工具可以實(shí)現(xiàn)kafka集群數(shù)據(jù)同步方案25.FusininsightHD系統(tǒng)中Hive不支持的存儲格式包括?A、TextfileB、SequencefileC、RCFILED、Hfile答案:D解析:FusininsightHD系統(tǒng)中Hive不支持的存儲格式包括Hfile。Textfile文本文件SequencefilesequenceFile文件是Hadp用來存儲二進(jìn)制形式的[Key,Value]對而設(shè)計(jì)的一種平面文件(FlatFile)。RCFile文件格式是FaceBk開源的一種Hive的文件存儲格式,首先將表分為幾個(gè)行組,對每個(gè)行組內(nèi)的數(shù)據(jù)進(jìn)行按列存儲,每一列的數(shù)據(jù)都是分開存儲,正是先水平劃分,再垂直劃分的理念。HFile是HBase存儲數(shù)據(jù)的文件組織形式。26.關(guān)于數(shù)據(jù)分析報(bào)告錯(cuò)誤的是()。A、展示分析結(jié)果B、驗(yàn)證分析質(zhì)量C、展示分析過程D、提供決策依據(jù)答案:C解析:數(shù)據(jù)分析報(bào)告用來展示分析結(jié)果,驗(yàn)證分析質(zhì)量以及提供決策依據(jù)https://zhuanlan.zhihu./p/53857057數(shù)據(jù)分析報(bào)告—項(xiàng)目可行性判斷的重要依據(jù)。27.UMP系統(tǒng)中的角色不包括A、Cntrller服務(wù)器B、Prxy服務(wù)器C、Agent服務(wù)器D、HDFS服務(wù)器答案:D解析:UMP系統(tǒng)中的角色包括Cntrller服務(wù)器、Web控制臺、Prxy服務(wù)器、Agent服務(wù)器、日志分析服務(wù)器、信息統(tǒng)計(jì)服務(wù)器、愚公系統(tǒng);依賴的開源組件包括Mnesia、RabbitMQ、ZKeeper和LVS。28.Hive是基于Hadp的數(shù)據(jù)倉庫軟件,可以査詢和管理PB級別的分布式數(shù)據(jù)。以下關(guān)于hive特性的描述不正確的是?A、靈活方便的ETLB、易用易編程C、可直接訪可HDFS文件以及HbaseD、僅支持mapreducet計(jì)算引擎答案:D解析:目前Hive支持MapReduce、Tez和Spark3種計(jì)算引擎29.創(chuàng)建Lader作業(yè)中,可以在以下哪個(gè)步驟中設(shè)置過濾器類型()A、輸入設(shè)置B、轉(zhuǎn)換C、基本信息D、輸出答案:A解析:創(chuàng)建Lader作業(yè)中,可以在輸入設(shè)置中設(shè)置過濾器類型30.YARN的基于標(biāo)準(zhǔn)調(diào)度,是對下列選項(xiàng)中的哪個(gè)進(jìn)行標(biāo)簽化?A、AppmasterB、ResurcemanagerC、NdemanagerD、Cntainer答案:C解析:YARN的基于標(biāo)準(zhǔn)調(diào)度,是對Ndemanager進(jìn)行標(biāo)簽化31.下列哪些語句關(guān)于Java內(nèi)存回收的說明是正確的?A、程序員必須創(chuàng)建一個(gè)線程來釋放內(nèi)存B、內(nèi)存回收程序負(fù)責(zé)釋放無用內(nèi)存C、內(nèi)存回收程序允許程序員直接釋放內(nèi)存D、內(nèi)存回收程序可以在指定的時(shí)間釋放內(nèi)存對象答案:B解析:A:垃圾回收程序是一般是在堆上分配空間不夠的時(shí)候會自己進(jìn)行一次GC(垃圾收集),程序員不需要也不能主動釋放內(nèi)存。B:Java的內(nèi)存釋放由垃圾回收程序來進(jìn)行釋放C:在Java里,內(nèi)存的釋放由垃圾回收程序進(jìn)行管理,程序員不能直接進(jìn)行釋放。D:程序員可以調(diào)用System.gc()運(yùn)行垃圾回收器,但是不能指定時(shí)間。32.Hadp集群中存在的最主要瓶頸是()。A、CPUB、網(wǎng)絡(luò)C、磁盤I0D、內(nèi)存答案:C解析:面對大數(shù)據(jù),讀取數(shù)據(jù)需要經(jīng)過I,這里可以把I理解為水的管道。管道越大越強(qiáng),我們對于T級的數(shù)據(jù)讀取就越快。所以I的好壞,直接影響了集群對于數(shù)據(jù)的處理。33.下面與Zkeepe類似的框架是哪一個(gè)?()A、PrtbufB、JavaC、KafkaD、Chubby答案:D解析:顧名思義zkeeper就是動物園管理員,他是用來管hadp(大象)、Hive(蜜蜂)、pig(小豬)的管理員,Zkeeper:是一個(gè)分布式的、開源的程序協(xié)調(diào)服務(wù),是hadp項(xiàng)目下的一個(gè)子項(xiàng)目。他提供的主要功能包括:配置管理、名字服務(wù)、分布式鎖、集群管理。A:PrtclBuffers是一種輕便高效的結(jié)構(gòu)化數(shù)據(jù)存儲格式,可以用于結(jié)構(gòu)化數(shù)據(jù)串行化,或者說序列化。B:面向?qū)ο蟮木幊陶Z言;C:Kafka是由Apache軟件基金會開發(fā)的一個(gè)開源流處理平臺,由Scala和Java編寫。D:Chubby是一個(gè)面向松耦合分布式系統(tǒng)的鎖服務(wù),通常用于為一個(gè)由大量小型計(jì)算機(jī)構(gòu)成的松耦合分布式系統(tǒng)提供高可用的鎖服務(wù)。一個(gè)分布式鎖服務(wù)的目的是允許他的客戶端進(jìn)程同步彼此的操作,并對當(dāng)前所處環(huán)境的基本狀態(tài)信息達(dá)成一致。34.以下哪個(gè)部分不是一篇數(shù)據(jù)分析報(bào)告必須有的。()A、標(biāo)題B、正文C、結(jié)論與建議D、附錄答案:D解析:附錄不是一篇數(shù)據(jù)分析報(bào)告必須有的。35.以下關(guān)于Zkeeper的Leader節(jié)點(diǎn)在收到數(shù)據(jù)變更請求后的讀寫流程說法正確的是?A、僅寫入內(nèi)存B、同時(shí)寫入磁盤和內(nèi)存C、先寫入內(nèi)存再寫入磁盤D、先寫磁盤再寫內(nèi)存答案:D解析:Zkeeper的Leader節(jié)點(diǎn)在收到數(shù)據(jù)變更請求后的讀寫流程是先寫磁盤再寫內(nèi)存36.在fusinlnsigh產(chǎn)品中,關(guān)于kafka的tpic,以下描述不正確的是?A、tpic的partitin數(shù)量可以創(chuàng)建時(shí)配置B、每個(gè)tpic只能被分成一個(gè)partitin區(qū)C、每條發(fā)布到kafka的消息都有一個(gè)類別,這個(gè)類別被稱為tpic.也可以理解為一個(gè)存儲消息的隊(duì)列D、每個(gè)partitin在存儲層面對應(yīng)一個(gè)lg文件,lg文件中記錄了所有的消息數(shù)據(jù)答案:B解析:Kafka中Tpic被分成多個(gè)Partitin分區(qū)。tpic是一個(gè)邏輯概念,Partitin是最小的存儲單元,掌握著一個(gè)Tpic的部分?jǐn)?shù)據(jù)。每個(gè)Partitin都是一個(gè)單獨(dú)的lg文件,每條記錄都以追加的形式寫入。37.HBase表中每個(gè)cell的多版本是通過()表示的。A、timestampB、rwkeyC、blckidD、cellid答案:A解析:HBase通過以下幾個(gè)要素來定位一個(gè)cell:表(table),行(rwkey),列族(clumnfamily),列標(biāo)識(clumnqualifier),時(shí)間戳(timestamp)。每個(gè)Cell可能有多個(gè)版本,它們之間用時(shí)間戳(TimeStamp)區(qū)分。38.FusininsightHD中Lader從SFTP服務(wù)器導(dǎo)入文件時(shí)不需要做編碼轉(zhuǎn)換和數(shù)據(jù)轉(zhuǎn)換且速度最快的文件類型是以下哪項(xiàng)?A、graph-fileB、binary-fileC、text-fileD、sequence-file答案:B解析:binary-file是FusininsightHD中Lader從SFTP服務(wù)器導(dǎo)入文件時(shí)不需要做編碼轉(zhuǎn)換和數(shù)據(jù)轉(zhuǎn)換且速度最快的文件類型39.下面與HDFS類似的框架是?A、NTFSB、FAT32C、GFSD、EXT3答案:C解析:HDF(HarmnySDriverFundatin)驅(qū)動框架,為驅(qū)動開發(fā)者提供驅(qū)動框架能力,包括驅(qū)動加載、驅(qū)動服務(wù)管理和驅(qū)動消息機(jī)制。40.關(guān)于Dataset,下列說法不正確的是?A、Dataset不需要反序列化就可執(zhí)行大部分操作B、Dataset是一個(gè)由特定域的對象組成的強(qiáng)類型集合C、Dataset與RDD高度類似>性能比RDD好D、Dataset執(zhí)行srt,filter,shuffle登操作需要進(jìn)行反序列化答案:D解析:Dataset執(zhí)行srt,filter,shuffle登操作不需要進(jìn)行反序列化。Java序列化就是指把Java對象轉(zhuǎn)換為字節(jié)序列的過程Java反序列化就是指把字節(jié)序列恢復(fù)為Java對象的過程。序列化最重要的作用:在傳遞和保存對象時(shí).保證對象的完整性和可傳遞性。對象轉(zhuǎn)換為有序字節(jié)流,以便在網(wǎng)絡(luò)上傳輸或者保存在本地文件中。反序列化的最重要的作用:根據(jù)字節(jié)流中保存的對象狀態(tài)及描述信息,通過反序列化重建對象。41.Zkeeper在分布式應(yīng)用中主要的作用不包括以下哪些選項(xiàng)?A、選舉Master節(jié)點(diǎn)B、保證各節(jié)點(diǎn)上數(shù)據(jù)的C、分配集群資源D、存儲及群中答案:C解析:資源分配是Spark任務(wù)中需要深入理解42.Hive是以()技術(shù)為基礎(chǔ)的數(shù)據(jù)倉庫。A、HDFSB、MAPREDUCEC、HADPD、HBASE答案:C解析:Hive是基于Hadp的一個(gè)數(shù)據(jù)倉庫工具,用來進(jìn)行數(shù)據(jù)提取、轉(zhuǎn)化、加載,這是一種可以存儲、查詢和分析存儲在Hadp中的大規(guī)模數(shù)據(jù)的機(jī)制。A:Hadp分布式文件系統(tǒng)(HDFS)是指被設(shè)計(jì)成適合運(yùn)行在通用硬件上的分布式文件系統(tǒng)。B:MapReduce是一種編程模型,用于大規(guī)模數(shù)據(jù)集的并行運(yùn)算。D:HBase是一個(gè)分布式的、面向列的開源數(shù)據(jù)庫43.關(guān)于fusinInsightHDStreaming的Supervisr描述正確的是()A、Supervisr是在Tplgy中接受數(shù)據(jù)然后執(zhí)行處理的組件B、Supervisr負(fù)責(zé)接受Nimbus分配的任務(wù),啟動和停止屬于自己管理的Wrker進(jìn)程C、Supervisr負(fù)責(zé)資源分配和任務(wù)調(diào)度D、supervisr是運(yùn)行具體處理邏輯的過程答案:B解析:Blt是在Tplgy中接受數(shù)據(jù)然后執(zhí)行處理的組件;Nimbus:負(fù)責(zé)資源分配和任務(wù)調(diào)度;Supervisr:負(fù)責(zé)接收Nimbus分配的任務(wù)44.在Spark生態(tài)組件中,哪個(gè)產(chǎn)品可用于復(fù)雜的批量數(shù)據(jù)處理。()A、SparkCreB、SparkSqlC、SparkStreamingD、MLlib答案:A解析:1.在Spark生態(tài)組件中,sparkcre可用于復(fù)雜的批量數(shù)據(jù)處理2.SparkStreaming是一個(gè)對實(shí)時(shí)數(shù)據(jù)流進(jìn)行高吞吐、高容錯(cuò)的流式處理系統(tǒng)3.MLlib:是Spark實(shí)現(xiàn)一些常見的機(jī)器學(xué)習(xí)算法和實(shí)用程序4.SparkSQL是基于sparkcre提供的一個(gè)用來處理結(jié)構(gòu)化數(shù)據(jù)的模塊(庫)45.關(guān)于hive與傳統(tǒng)據(jù)倉庫的對比,以下描述錯(cuò)誤的是?A、數(shù)據(jù)存儲獨(dú)位于數(shù)據(jù)存儲之外,從而解耦合元數(shù)據(jù)和數(shù)據(jù),靈活性高,而傳統(tǒng)數(shù)據(jù),靈活性低B、Hive基于HDFS存儲理論上存儲量可無限擴(kuò)展,而傳統(tǒng)數(shù)據(jù)倉庫存儲量會有上限C、由于hive的數(shù)據(jù)存儲在HDFS中,所以可以保證數(shù)據(jù)的高容錯(cuò),高可靠D、由于Hive基于大數(shù)據(jù)平臺,所以查詢效率比傳統(tǒng)數(shù)據(jù)倉庫快答案:D解析:Hive在加載數(shù)據(jù)的過程中不會對數(shù)據(jù)進(jìn)行任何處理,甚至不會對數(shù)據(jù)進(jìn)行掃描,因此也沒有對數(shù)據(jù)中的某些Key建立索引。Hive要訪問數(shù)據(jù)中滿足條件的特定值時(shí),需要暴力掃描整個(gè)數(shù)據(jù),因此訪問延遲較高46.關(guān)于HBase與傳統(tǒng)的關(guān)系數(shù)據(jù)庫的區(qū)別說法錯(cuò)誤的是A、數(shù)據(jù)類型:關(guān)系數(shù)據(jù)庫采用關(guān)系模型,具有豐富的數(shù)據(jù)類型和存儲方式,HBase則采用了更加簡單的數(shù)據(jù)模型,它把數(shù)據(jù)存儲為未經(jīng)解釋的字符串B、數(shù)據(jù)操作:關(guān)系數(shù)據(jù)庫中包含了豐富的操作,其中會涉及復(fù)雜的多表連接。HBase則不存在復(fù)雜的表與表之間的關(guān)系,只有簡單的插入、查詢、刪除、清空等,因?yàn)镠Base在設(shè)計(jì)上就避免了復(fù)雜的表和表之間的關(guān)系C、存儲模式:關(guān)系數(shù)據(jù)庫是基于行模式存儲的。HBase是基于列存儲的,每個(gè)列族都由幾個(gè)文件保存,不同列族的文件是分離的D、數(shù)據(jù)維護(hù):在關(guān)系數(shù)據(jù)庫中執(zhí)行更新操作時(shí),并不會刪除數(shù)據(jù)舊的版本,而是生成一個(gè)新的版本,舊有的版本仍然保留。在HBase中,更新操作會用最新的當(dāng)前值去替換記錄中原來的舊值,舊值被覆蓋后就不會存在。答案:D解析:數(shù)據(jù)維護(hù):在關(guān)系數(shù)據(jù)庫中,更新操作會用最新的當(dāng)前值去替換記錄中的原來的舊值,舊值被覆蓋夠就不會存在,而在HBase中執(zhí)行更新操作時(shí),不糊并不會刪除數(shù)據(jù)舊的版本,而是生成一個(gè)新的版本,舊的有的版本保留。47.以下哪類數(shù)據(jù)不屬于半結(jié)構(gòu)化數(shù)據(jù)?A、HTMLB、XMLC、二維表D、JSN答案:C解析:二維表,數(shù)據(jù)結(jié)構(gòu),是一個(gè)關(guān)系名,意思是指關(guān)系模型中,數(shù)據(jù)結(jié)構(gòu)的表示方法48.在Hadp生態(tài)組件中,哪個(gè)產(chǎn)品可用于復(fù)雜的批量數(shù)據(jù)處理。()A、MapReduce、HiveB、ImpalaC、StrmD、Mahut答案:A解析:在Hadp生態(tài)組件中,MapReduce、Hive可用于復(fù)雜的批量數(shù)據(jù)處理。49.以下關(guān)于HiveSQL基本操作描述正確的是()A、創(chuàng)建外部表必須要指定Lcatin信息B、創(chuàng)建外部表使用external關(guān)鍵字,創(chuàng)建普通表需要指定internal關(guān)鍵字C、加載數(shù)據(jù)到Hive時(shí)源數(shù)據(jù)必須是HDFS的一個(gè)路徑D、創(chuàng)建表時(shí)可以指定列分割符答案:D解析:建立外部表可以不指定Lcatin,會在默認(rèn)在/hive/warehuse/數(shù)據(jù)庫名稱/表名,建立目錄。創(chuàng)建內(nèi)部表時(shí)不需要關(guān)鍵字。加載數(shù)據(jù)到Hive時(shí)源數(shù)據(jù)不一定是HDFS的一個(gè)路徑50.HDFS的副本放置策略中,同一機(jī)架不同的服務(wù)器之間的距離是()A、3B、2C、1D、4答案:B解析:HDFS的副本放置策略中,同一機(jī)架不同的服務(wù)器之間的距離是251.關(guān)于HBaseRegin的定位說法錯(cuò)誤的是A、元數(shù)據(jù)表,又名.META.表,存儲了Regin和Regin服務(wù)器的映射關(guān)系。當(dāng)HBase表很大時(shí),.META.表也會被分裂成多個(gè)ReginB、為了加快訪問速度,.META.表的全部Regin都會被保存在內(nèi)存中C、根數(shù)據(jù)表,又名-RT-表,記錄所有元數(shù)據(jù)的具體位置。-RT-表只有唯一一個(gè)Regin,名字是在程序中被寫死的。Zkeeper文件記錄了-RT-表的位置D、為了加速尋址,客戶端會緩存位置信息,尋址過程客戶端只需要詢問Zkeeper服務(wù)器,不需要連接Master服務(wù)器,由于數(shù)據(jù)放在內(nèi)存中,因此不存在緩存失效問題。答案:D解析:客戶端訪問數(shù)據(jù)時(shí)的“三級尋址”?為了加速尋址,客戶端會緩存位置信息,同時(shí),需要解決緩存失效問題?尋址過程客戶端只需要詢問Zkeeper服務(wù)器,不需要連接Master服務(wù)器52.HBasett靠()存儲底層數(shù)據(jù)A、HDFSB、HadpC、MemryD、MapReduce答案:A解析:首先HBase不同于一般的關(guān)系數(shù)據(jù)庫,它是一個(gè)適合于非結(jié)構(gòu)化數(shù)據(jù)存儲的數(shù)據(jù)庫.另一個(gè)不同的是HBase基于列的而不是基于行的模式.53.關(guān)于HBase下面說法正確的是()。A、HBase?一個(gè)稀疏、多維度、排序的映射表,這張表的索引是行鍵、列B、每個(gè)值是一個(gè)未經(jīng)解釋的字符串,沒有數(shù)據(jù)類型,程序員要自己去對它進(jìn)C、用戶在表中存儲數(shù)據(jù),每一行都有一個(gè)可排序的行鍵和任意多的列D、以上說法都正確答案:D解析:Hbase是HadpDatabase的簡稱,Hbase是分布式、面向列的開源數(shù)據(jù)庫(準(zhǔn)確是面向列族)。HDFS為Hbase提供可靠的底層數(shù)據(jù)存儲服務(wù),MapReduce為Hbase提供高性能的計(jì)算能力,Zkeeper為Hbaset提供穩(wěn)定服務(wù)和Failver機(jī)制,因?yàn)槲覀冋fHbase是一個(gè)通過大量廉價(jià)的機(jī)器解決海量數(shù)據(jù)的高速存儲和讀取的分布式數(shù)據(jù)庫解決方案。Hbase的特點(diǎn):1,海量存儲2,列式存儲3,極易擴(kuò)張4,高并發(fā)5,稀疏(主要針對Hbase的靈活性)54.下列不可作為java語言標(biāo)識符的是A、a1B、1C、1D、11答案:D解析:Java標(biāo)識符由數(shù)字,字母和下劃線(_),美元符號($)或人民幣符號(¥)組成。在Java中是區(qū)分大小寫的,而且還要求首位不能是數(shù)字。55.從數(shù)據(jù)表中查找記錄用以下哪一項(xiàng)()A、UPDATEB、FINDC、SELECTD、CREATE答案:C解析:SELECT用于查找記錄56.LSM更能保證哪種操作的性能?A、讀B、寫C、隨機(jī)讀D、合并答案:B解析:B+索引樹和lg型(append)文件操作(數(shù)據(jù)庫WAL日志)是數(shù)據(jù)讀寫的兩個(gè)極端。B+樹讀效率高而寫效率差;lg型文件操作寫效率高而讀效率差;因此要在排序和lg型文件操作之間做個(gè)折中,于是就引入了lg-structedmergetree模型,通過名稱可以看出LSM既有日志型的文件操作,提升寫效率,又在每個(gè)sstable中排序,保證了查詢效率。57.查看kafkaMTpic的partitin詳細(xì)信息時(shí),使用如下那個(gè)命令?A、bin/kakfa-tpicssh—createB、bin/kakfa-tpicssh—deleteC、bin/kakfa-tpics.sh-listD、bin/kakfa-tpics.sh—describe答案:D解析:使用bin/kakfa-tpicssh—describe查看kafkaMTpic的partitin詳細(xì)信息58.關(guān)于HBaseshell命令,哪個(gè)命令是使表無效。()A、alertB、disableC、drpD、以上都不是答案:B解析:1.alter:修改列族模式2.disable:使表無效3.drp:刪除表59.Kafka集群中,Kafka服務(wù)端部署的角色是A、PrducerB、CnsumerC、ZKeeperD、Brker答案:D解析:一臺kafka服務(wù)器節(jié)點(diǎn)就是一個(gè)brker,負(fù)責(zé)處理消息讀、寫請求,存儲消息,在kafkacluster這一層這里,其實(shí)里面是有很多個(gè)brker一個(gè)集群由多個(gè)brker組成。prducer是向kafkabrker發(fā)消息的客戶端,cnsumer是向kafkabrker取消息的客戶端60.LSM含義是?A、日志結(jié)構(gòu)合并樹B、二叉樹C、平衡二叉樹D、長平衡二叉樹答案:A解析:LSM-Tree全稱是LgStructuredMergeTree,是一種分層,有序,面向磁盤的數(shù)據(jù)結(jié)構(gòu),其核心思想是充分了利用了,磁盤批量的順序?qū)懸h(yuǎn)比隨機(jī)寫性能高出很多61.FusininsightHD系統(tǒng)審計(jì)日志不可以記錄下面哪些操作?A、手動清除告警B、啟停服務(wù)實(shí)例C、查詢歷史監(jiān)控D、刪除服務(wù)實(shí)例答案:C解析:FusininsightHD系統(tǒng)審計(jì)日志不可以記錄查詢歷史監(jiān)控62.關(guān)于hive建表基本描述正確的是()A、不可再修改表名B、可再增加新列C、創(chuàng)建外部表需要制定external關(guān)鍵字D、不可再修改列名答案:C解析:創(chuàng)建外部表需要制定external關(guān)鍵字63.Hbase中以下對于LSM的描述正確的是()。A、LSM的讀操作和寫操作是獨(dú)立B、LSM的讀操作和寫操作不是獨(dú)立C、LSM并不區(qū)分讀和寫D、LSM中讀寫是同一種操作答案:A解析:LSM中讀操作和寫操作相互獨(dú)立,且并不相同64.有一段java應(yīng)用程序,它的主類名是a1,那么保存它的源文件名可以是A、a1.javaB、a1.classC、a1D、都對答案:A解析:1、必須以java結(jié)尾。這樣才能被編輯器javacexe所編輯。2、源文件中如果只有一個(gè)類,文件名必須與該類名相同。3、輸入命令:pushd路徑(此命令可將當(dāng)前目錄設(shè)為所希望的任一個(gè)已存在的路徑)。4、輸入命令:e:轉(zhuǎn)移到e盤,然后再輸入cd轉(zhuǎn)移到所希望的已知路徑。65.關(guān)于MapReduce框架中一個(gè)作業(yè)的reduce任務(wù)數(shù),下列說法正確的是()A、由自定義的Partitiner來確定B、是分塊總數(shù)目的一半C、可以由用戶來自定義,通過JbCnf.setNumReducetTask(int)來設(shè)定一個(gè)作業(yè)中reduce的任務(wù)數(shù)目D、由MapReduce隨機(jī)確定其數(shù)目答案:C解析:一個(gè)jb的ReduceTasks數(shù)量是通過mapreduce.jb.reduces參數(shù)設(shè)置也可以通過編程的方式,調(diào)用Jb對象的setNumReduceTasks()方法來設(shè)置目66.以下命令組成錯(cuò)誤的是()。A、vim/etc/prfileB、surce/etc/prfileC、hadpnamende-frmatD、bin/hadpfs-cat/hadpdata/y/txt答案:D解析:394、vim/etc/prfile雖然可以進(jìn)入prfile文件,但是對于普通用戶,無法修改;etc/prfile:在登錄時(shí),操作系統(tǒng)定制用戶環(huán)境時(shí)使用的第一個(gè)文件,此文件為系統(tǒng)的每個(gè)用戶設(shè)置環(huán)境信息,當(dāng)用戶第一次登錄時(shí),該文件被執(zhí)行。使用命令hadpnamende-frmat對namende進(jìn)行格式化。hadpfs-cat>從DFS多個(gè)part文件合并拷貝文件到本地文件系統(tǒng)。67.不屬于HDFS優(yōu)勢是()?A、時(shí)間快B、超大文件C、大量小文件D、商用硬件答案:A解析:HDFS優(yōu)勢:1、海量數(shù)據(jù)存儲:HDFS可橫向擴(kuò)展,其存儲的文件可以支持PB級別或更高級別的數(shù)據(jù)存儲。2、高容錯(cuò)性:數(shù)據(jù)保存多個(gè)副本,副本丟失后自動恢復(fù)??蓸?gòu)建在廉價(jià)的機(jī)器上,實(shí)現(xiàn)線性擴(kuò)展。當(dāng)集群增加新節(jié)點(diǎn)之后,namende也可以感知,進(jìn)行負(fù)載均衡,將數(shù)據(jù)分發(fā)和備份數(shù)據(jù)均衡到新的節(jié)點(diǎn)上。3、商用硬件:Hadp并不需要運(yùn)行在昂貴且高可靠的硬件4、大文件存儲68.在創(chuàng)建對象時(shí)必須A、先聲明對象,然后才能使用對象B、先聲明對象,為對象分配內(nèi)存空間,然后才能使用對象C、先聲明對象,為對象分配內(nèi)存空間,對對象初始化,然后才能使用對象D、上述說法都對答案:C解析:Java就是這樣規(guī)定的69.Hbase的某張表的Rwkey劃分splitkey為9.E.a.z請問表里面有幾個(gè)Regin?A、6B、3C、5D、4答案:C解析:Hbase的某張表的Rwkey劃分splitkey為9.E.a.z表里面有5個(gè)Regin70.在Zkeeper和Yarn的協(xié)同工作中,當(dāng)ActiveResurcemanager產(chǎn)生故障時(shí),StandbyResurcemanager會從以下哪個(gè)目錄中獲取Applicatin相關(guān)信息()A、metastreB、StatestreC、StreageD、Warehuse答案:B解析:在Zkeeper和Yarn的協(xié)同工作中,當(dāng)ActiveResurcemanager產(chǎn)生故障時(shí),StandbyResurcemanager會從Statestre目錄中獲取Applicatin相關(guān)信息()71.Kafka集群在運(yùn)行期間直接依賴于下面哪些組件?A、sparkB、zkeeperC、hdfsD、hbase答案:B解析:ZKeeper作為給分布式系統(tǒng)提供協(xié)調(diào)服務(wù)的工具被kafka所依賴72.下面與Zkeepe淡似的框架是?A、PrtbufB、JavaC、KafkaD、Chubby答案:D解析:,ZKeeper是一個(gè)分布式服務(wù)框架,是ApacheHadp的一個(gè)子項(xiàng)目,主要用來解決分布式應(yīng)用中經(jīng)常遇到的一些數(shù)據(jù)管理問題,如:統(tǒng)一命名服務(wù)、配置管理、集群管理、分布式鎖、發(fā)布/訂閱等。73.HFile數(shù)據(jù)格式中的KeyValue數(shù)據(jù)格式中Value部分是()。A、擁有復(fù)雜結(jié)構(gòu)的字符串B、字符串C、二進(jìn)制數(shù)據(jù)D、壓縮數(shù)據(jù)答案:C解析:元數(shù)據(jù)是key-value類型的值,但元數(shù)據(jù)快只保存元數(shù)據(jù)的value值,元數(shù)據(jù)的key值保存在第五項(xiàng)(元數(shù)據(jù)索引塊)中。74.解壓.tar.gziS尾的HBase壓縮包使用的Linux命令是?A、tar-zxvfB、tar-zxC、tar-sD、tar-nf答案:A解析:tar-zxvf75.Flume用于收集數(shù)據(jù),其傳輸?shù)臄?shù)據(jù)基本單位是?A、SplitB、BlckC、EventD、Packet答案:C解析:Flume用于收集數(shù)據(jù),其傳輸?shù)臄?shù)據(jù)基本單位是Event。76.下面哪個(gè)進(jìn)程負(fù)責(zé)MapReduce任務(wù)調(diào)度。A、NameNdeB、JbtrackerC、TaskTrackerD、SecndaryNameNde答案:B解析:Jbtracer負(fù)責(zé)MapReduce任務(wù)調(diào)度77.HFile數(shù)據(jù)格式中的Magic字段用于()。A、存儲隨機(jī)數(shù),防止數(shù)據(jù)損壞B、存儲數(shù)據(jù)的起點(diǎn)C、存儲數(shù)據(jù)塊的起點(diǎn)D、指定字段的長度答案:A解析:每一個(gè)HFile內(nèi)部包括多種不同類型的塊結(jié)構(gòu),這些塊結(jié)構(gòu)從邏輯上來講可歸并為兩類。分別用于數(shù)據(jù)存儲和數(shù)據(jù)索引(簡稱數(shù)據(jù)塊和索引塊)78.LSM的讀操作和寫操作是獨(dú)立的?A、是。B、否。C、LSM并不區(qū)分讀和寫D、LSM中讀寫是同一種操作答案:A解析:如果我們對寫性能特別敏感,我們最好怎么做?——Appendnly:所有寫操作都是將數(shù)據(jù)添加到文件末尾。這樣做的寫性能是最好的,大約等于磁盤的理論速度(200~300MB/s)。79.fusininsight對于管理操作,下列錯(cuò)誤的是?A、可對服務(wù)進(jìn)行啟停重啟B、可以添加和卸載服務(wù)C、常用服務(wù)隱藏或顯示D、可查看服務(wù)的當(dāng)前狀態(tài)答案:C解析:可設(shè)置不常用的服務(wù)隱藏或顯示80.Hive中的數(shù)據(jù)類型,下面說正確的是()。A、TINYINT,1個(gè)字節(jié)(8位)有符號整數(shù)B、SMALLINT,2字節(jié)(16位)有符號整數(shù)C、INT,4個(gè)字節(jié)(32位)有符號整數(shù)D、以上都正確答案:D解析:1.Hive中的數(shù)據(jù)類型分為兩類:基本類型和復(fù)雜類型2.基本類型包含:tinyint,smallint,int,bigint,flat,duble,blean,string,timestamp,binary3.復(fù)雜類型:array,map和structa.array:數(shù)組類型,對應(yīng)了Java中的集合或者數(shù)組。81.以下哪個(gè)不是HDFS的守護(hù)進(jìn)程A、SecndaryNameNdeB、NameNdeC、MrappMaster/YarnChildD、DataNde答案:C解析:namende\Secndnamende\Datande\Jbtracker\Tasktracker都是守護(hù)進(jìn)程82.以下哪個(gè)channel類型的數(shù)據(jù)不會持久化()?A、FileChannelB、MemryChannelC、JDBCChannelD、HDFSChannel答案:B解析:JDBCChannel的數(shù)據(jù)類型不會持久化83.hadp系統(tǒng)中YARN資源的抽象是用什么表示?A、內(nèi)存B、CPUC、CntainerD、磁盤空間答案:C解析:hadp系統(tǒng)中YARN資源的抽象是用Cntainer表示84.Spark是用以下哪種編程語言實(shí)現(xiàn)的()?A、CB、C++C、JAVAD、Scala答案:D解析:Scala是Spark的原生語言85.關(guān)系數(shù)據(jù)庫已經(jīng)流行很多年,Hadp已經(jīng)有了HDFS和MapReduce,關(guān)于需要HBase說法錯(cuò)誤的是A、Hadp可以很好地解決大規(guī)模數(shù)據(jù)的離線批量處理問題,但是,受限于HadpMapReduce編程框架的高延遲數(shù)據(jù)處理機(jī)制,使得Hadp無法滿足大規(guī)模數(shù)據(jù)實(shí)時(shí)處理應(yīng)用的需求B、HDFS面向隨機(jī)訪問模式,不是批量訪問模式C、傳統(tǒng)的通用關(guān)系型數(shù)據(jù)庫無法應(yīng)對在數(shù)據(jù)規(guī)模劇增時(shí)導(dǎo)致的系統(tǒng)擴(kuò)展性和性能問題(分庫分表也不能很好解決)D、傳統(tǒng)關(guān)系數(shù)據(jù)庫在數(shù)據(jù)結(jié)構(gòu)變化時(shí)一般需要停機(jī)維護(hù);空列浪費(fèi)存儲空間答案:B解析:Hadp可以很少地解決大規(guī)模數(shù)據(jù)的離線批量處理問題,但是,受限于hadpMapReduce編程框架的高延遲數(shù)據(jù)處理機(jī)制,使得hadp無法滿足大規(guī)模數(shù)據(jù)實(shí)施處理應(yīng)用的需求HDFS面向批量訪問模式,不是隨機(jī)訪問模式。傳統(tǒng)的通用關(guān)系型數(shù)據(jù)庫無法應(yīng)對在數(shù)據(jù)規(guī)模劇增時(shí)導(dǎo)致的系統(tǒng)擴(kuò)展性和性能問題(分庫分表也不能很好的解決)傳統(tǒng)關(guān)系數(shù)據(jù)庫在數(shù)據(jù)結(jié)構(gòu)變化時(shí)一般需要停機(jī)維護(hù),空列浪費(fèi)存儲空間因此,業(yè)界出現(xiàn)了一類面向半結(jié)構(gòu)化數(shù)據(jù)存儲和處理的高擴(kuò)展、低寫入、查詢延遲的系統(tǒng),例如,鍵值數(shù)據(jù)庫、文檔數(shù)據(jù)庫和列族數(shù)據(jù)庫(如BigTable和HDase)Hbase已經(jīng)成功應(yīng)用于互聯(lián)網(wǎng)服務(wù)領(lǐng)域和傳統(tǒng)行業(yè)的眾多在線模式數(shù)據(jù)分析處理系統(tǒng)中86.HBase表中每個(gè)cell的多版本是通過()表示的?A、timestampB、rwkeyC、blckidD、cellid答案:A解析:每個(gè)Cell可能有多個(gè)版本,它們之間用時(shí)間戳(TimeStamp)區(qū)分。87.為了保障流應(yīng)用的快照存儲的可靠性,快照主要存儲在哪里?A、jbmanager的內(nèi)存中B、可靠性高的單機(jī)數(shù)據(jù)庫中C、本地文件系統(tǒng)中D、hdfs中答案:D解析:為了保障流應(yīng)用的快照存儲的可靠性,快照主要存儲在hdfs中88.關(guān)于HBase的HLg工作原理說法錯(cuò)誤的是A、分布式環(huán)境必須要考慮系統(tǒng)出錯(cuò)。HBase采用HLg保證系統(tǒng)恢復(fù)B、HBase系統(tǒng)為每個(gè)Regin服務(wù)器配置了一個(gè)HLg文件,它是一種預(yù)寫式日志(WriteAheadLg)C、用戶更新數(shù)據(jù)不需要先寫入日志后,才能寫入MemStre緩存,并且,直到MemStre緩存內(nèi)容對應(yīng)的日志已經(jīng)寫入磁盤,該緩存內(nèi)容才能被刷寫到磁盤D、發(fā)生故障后,系統(tǒng)會根據(jù)每條日志記錄所屬的Regin對象對HLg數(shù)據(jù)進(jìn)行拆分,分別放到相應(yīng)Regin對象的目錄下,然后,再將失效的Regin重新分配到可用的Regin服務(wù)器中,并把與該Regin對象相關(guān)的HLg日志記錄也發(fā)送給相應(yīng)的Regin服務(wù)器答案:C解析:Regin服務(wù)器領(lǐng)取到分配給自己的Regin對象以及與之相關(guān)的HLg日志記錄以后,會重新做一遍日志記錄中的各種操作,把日志記錄中的數(shù)據(jù)寫入到MemStre緩存中,然后,刷新到磁盤的StreFile文件中,完成數(shù)據(jù)恢復(fù)。89.釆用Flume傳輸數(shù)據(jù)過程中,為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù),推薦使用以下哪種channel類型?A、MemryChannelsB、FileChannelC、JDBCChannelD、HDFSChannel答案:B解析:釆用Flume傳輸數(shù)據(jù)過程中,為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù),推薦使用FileChannel90.加載數(shù)據(jù)到Hive表,哪種方式不正確?A、直接將本地路徑的文件lad到Hive表中B、將HDFS上的文件lad到Hive表中C、Hive支持Insertint單條記錄的方法,所以可以直接在命令行插入單條記錄D、將其他表的結(jié)果集insertint到Hive表答案:C解析:Hive不支持Insertint單條記錄的方法91.關(guān)于HadpMapReduce分片(spit)概念,下列說法不正確的是()。A、Hadp為每個(gè)split創(chuàng)建一個(gè)Map任務(wù)B、split的多少決定了Map任務(wù)的數(shù)目C、大多數(shù)情況下,理想的分片大小是一個(gè)HDFS塊對應(yīng)一個(gè)spitD、split是一個(gè)物理概念答案:D解析:split不是一個(gè)物理概念,是一個(gè)概念上的切片,blck是物理概念。92.以下選項(xiàng)中,不屬于信息時(shí)代的定律的是()A、吉爾德定律B、摩爾定律C、麥特卡爾夫定律D、達(dá)律多定律答案:A解析:吉爾德定律(Gilder'sLaw)又稱為勝利者浪費(fèi)定律,由喬治·吉爾德提出,最為成功的商業(yè)運(yùn)作模式是價(jià)格最低的資源將會被盡可能的消耗,以此來保存最昂貴的資源。.吉爾德定律(Gilder'sLaw)被描述為:在未來25年,主干網(wǎng)的帶寬每6個(gè)月增長一倍,12個(gè)月增長兩倍。.其增長速度是摩爾定律預(yù)測的CPU增長速度的3倍,并預(yù)言將來上網(wǎng)會免費(fèi)。.93.Javaapplicatin中的主類需包含main方法,main方法的返回類型是什么?A、intB、flatC、dubleD、vid答案:D解析:vid,即不返回對象,main方法是程序執(zhí)行的入口,main方法也不需要初始化對象就能執(zhí)行94.關(guān)于Hadp生態(tài)系統(tǒng)軟件說法錯(cuò)誤的是A、HDFS是分布式文件系統(tǒng)B、YARN是資源管理和調(diào)度器C、Tez是運(yùn)行在YARN之上的下一代Hadp查詢處理框架D、Hive是Hadp上的數(shù)據(jù)倉庫,為了提高效率,可以越過HDFS直接管理數(shù)據(jù)的存儲答案:D解析:hive的表使用的默認(rèn)存儲是hdfs的文件系統(tǒng),相當(dāng)于表的數(shù)據(jù)是存儲在hdfs文件系統(tǒng)中的。因此無法越過HDFS直接管理數(shù)據(jù)的存儲95.以下哪個(gè)方法用于定義線程的執(zhí)行體?A、start()B、init()C、run()D、synchrnized()答案:C解析:通過繼承Thread類來創(chuàng)建并啟動線程的步驟如下:定義Thread類的子類,并重寫該類的run()方法,該run()方法將作為線程執(zhí)行體。創(chuàng)建Thread子類的實(shí)例,即創(chuàng)建了線程對象。調(diào)用線程對象的start()方法來啟動該線程。96.哪個(gè)命令是刪除文件的?A、dfs-clearB、dfs-IsC、dfs-rmD、dfs-del答案:C解析:dfs-rm命令是用來刪除文件的。dfs-clear沒找到dfs-Is沒找到dfs-del沒找到97.大數(shù)據(jù)的核心價(jià)值是()。A、數(shù)據(jù)交易B、數(shù)據(jù)分析C、數(shù)據(jù)融合D、數(shù)據(jù)處理答案:B解析:大數(shù)據(jù)的核心價(jià)值是數(shù)據(jù)分析98.HDFS中的數(shù)據(jù)塊(blck)默認(rèn)保存幾份?()A、3份B、2份C、1份D、不確定答案:A解析:HDFS中的數(shù)據(jù)塊(blck)默認(rèn)保存3份,每份默認(rèn)為128M99.Kafka集群中,Kafka服務(wù)端的角色是?A、BrkerB、CnsumerC、ZkeeperD、Prducer答案:A解析:Kafka集群中,Kafka服務(wù)端的角色是Brker。Cnsumer就是負(fù)責(zé)從Kafka集群中消費(fèi)消息數(shù)據(jù)的應(yīng)用程序Zkeeperl是一個(gè)開源的分布式的,為分布式框架提供協(xié)調(diào)服務(wù)的Apache項(xiàng)目。Prducer就是負(fù)責(zé)向Kafka集群中寫入消息數(shù)據(jù)的應(yīng)用程序100.萬維網(wǎng)之父是()。A、彼得?德魯克B、舍恩伯格C、蒂姆■伯納斯-李D、斯科特■布朗答案:C解析:萬維網(wǎng)之父是蒂姆·伯納斯·李101.關(guān)于HDFS集群中的DataNde的描述不正確的是?A、—個(gè)DataNde上存儲的所有數(shù)據(jù)塊可以有相同的B、存儲客戶端上傳的數(shù)據(jù)的數(shù)據(jù)塊C、DataNde之間可以互相通信D、響應(yīng)客戶端的所有讀寫數(shù)據(jù)請求,為客戶端的存儲和讀取數(shù)據(jù)提供支撐答案:A解析:出于安全性和高可用性考慮,并不會把一個(gè)blck的多個(gè)副本放在同一個(gè)datande上102.下列關(guān)于HadpAPI的說法錯(cuò)誤的是()。A、Hadp的API只適用于HDFS文件系統(tǒng)B、Cnfiguratin類的默認(rèn)實(shí)例化方法是以HDFS系統(tǒng)的資源配置為基礎(chǔ)的C、FileStatus對象存儲文件和目錄的元數(shù)據(jù)D、FSDatalnputStream是java.i.DatalnputStream的子類答案:A解析:Hadp的API是通用的,既可以適用于HDFS,又可以適用于Hbase、Mapreduce等103.下列數(shù)據(jù)結(jié)構(gòu)具有記憶功能的是?A、隊(duì)列B、循環(huán)隊(duì)列C、棧D、順序表答案:C解析:具有記憶功能的是棧104.FusininsightHD系統(tǒng)中,下面哪個(gè)方法不能查看到Lader作業(yè)執(zhí)行的結(jié)果()A、通過LaderUI界面查看B、通過YARN任務(wù)管理C、Ndemanager查看D、通過Manager的查看答案:C解析:FusininsightHD系統(tǒng)中,使用Ndemanager查看不能查看到Lader作業(yè)執(zhí)行的結(jié)果105.Hbase中的Regin是由哪個(gè)服務(wù)進(jìn)程來管理的?A、HreginserverB、ZkeeperC、MasterD、Datande答案:A解析:Hbase中的Regin是由Hreginserver來管理的106.如下哪項(xiàng)不是ZKeeper的關(guān)鍵特性()?A、最終一致性B、延時(shí)性C、可靠性D、等待無關(guān)性答案:B解析:ZKeeper的關(guān)鍵特性包括最終一致性,可靠性,等待無關(guān)性107.使用Hbase客戶端批量寫入10條數(shù)據(jù),某個(gè)Hreginserver節(jié)點(diǎn)上包含該表的2個(gè)Regin,分別為A和B,10條數(shù)據(jù)中有6條屬于A.4條屬于B,請問寫入這10條數(shù)據(jù)需要向該HreginServer發(fā)送幾次RPC請求?A、10B、6C、2D、1答案:D解析:使用Hbase客戶端批量寫入10條數(shù)據(jù),某個(gè)Hreginserver節(jié)點(diǎn)上包含該表的2個(gè)Regin,分別為A和B,10條數(shù)據(jù)中有6條屬于A.4條屬于B,寫入這10條數(shù)據(jù)需要向該HreginServer發(fā)送1次RPC請求108.以下哪個(gè)不屬于Hadp中Mapreduce組件的特點(diǎn)?A、高容錯(cuò)B、良好的擴(kuò)展性C、實(shí)時(shí)計(jì)算D、易于編程答案:C解析:高度抽象的編程思想,良好的擴(kuò)展性,高容錯(cuò)性,適用于并行計(jì)算和離線計(jì)算109.關(guān)于HBase和BigTable說法錯(cuò)誤的是A、HBase是一個(gè)高可靠、高性能、面向列、可伸縮的分布式數(shù)據(jù)庫,是谷歌BigTable的開源實(shí)現(xiàn),主要用來存儲非結(jié)構(gòu)化和半結(jié)構(gòu)化的松散數(shù)據(jù)B、BigTable和HBase均采用Chubby提供協(xié)同服務(wù)管理C、BigTable和HBase都是一個(gè)分布式存儲系統(tǒng)D、HBase的目標(biāo)是處理非常龐大的表,可以通過水平擴(kuò)展的方式,利用廉價(jià)計(jì)算機(jī)集群處理由超過10億行數(shù)據(jù)和數(shù)百萬列元素組成的數(shù)據(jù)表答案:B解析:BigTable是一個(gè)分布式存儲系統(tǒng),它利用谷歌提出的MapReduce分布式并行計(jì)算模型來處理海量數(shù)據(jù),使用谷歌分布式文件系統(tǒng)GFS作為底層數(shù)據(jù)存儲,采用Chubby提供協(xié)同服務(wù)管理。HadpDatabase,是一個(gè)高可靠性、高性能、面向列、可伸縮、實(shí)時(shí)讀寫的分布式數(shù)據(jù)庫。利用HadpHDFS作為其文件存儲系統(tǒng),利用Zkeeper作為其分布式協(xié)同服務(wù)主要用來存儲非結(jié)構(gòu)化和半結(jié)構(gòu)化的松散數(shù)據(jù)。110.使用JAVAAPI進(jìn)行HBase表數(shù)據(jù)添加操作,以下命令輸寫正確的是()。cA、HTable.add(newPut(Bytes.tBytes(rw));B、HTable.insert(newPut(Bytes.tBytes(rw))C、HTable.putfnewPut(Bytes.tBytes(rw));D、HTable.updatefnewPut(Bytes.tBytes(rw))答案:C解析:即table.get(table).scan();111.在Java中,一個(gè)類可同時(shí)定義許多同名的方法,這些方法的形式參數(shù)個(gè)數(shù)、類型或順序各不相同,傳回的值也可以不相同。這種面向?qū)ο蟪绦虻奶匦苑Q為A、隱藏B、覆蓋C、重載D、Java不支持此特性答案:C解析:一個(gè)類可以定義多個(gè)同名的方法,只要這些方法的參數(shù)列表不完全相同,這稱為方法重載。112.HBase依賴()技術(shù)框架提供消息通信機(jī)制。A、ZkeeperB、ChubbyC、RPCD、Scket答案:A解析:“hbase依賴“Zkeeper”提供消息通信機(jī)制113.用定期數(shù)據(jù)分析報(bào)表作為依據(jù)的反映計(jì)劃執(zhí)行情況的數(shù)據(jù)分析報(bào)告是()。A、專題分析報(bào)告B、綜合分析報(bào)告C、日常數(shù)據(jù)通報(bào)D、實(shí)時(shí)運(yùn)營報(bào)告答案:C解析:用定期數(shù)據(jù)分析報(bào)表作為依據(jù)的反映計(jì)劃執(zhí)行情況的數(shù)據(jù)分析報(bào)告是日常數(shù)據(jù)通報(bào)114.LSM結(jié)構(gòu)的數(shù)據(jù)首先存儲在()0A、硬盤上B、內(nèi)存中C、磁盤陣列中D、閃存中答案:B解析:LSM樹的核心特點(diǎn)是利用順序?qū)憗硖岣邔懶阅?,但因?yàn)榉謱?此處分層是指的分為內(nèi)存和文件兩部分)的設(shè)計(jì)會稍微降低讀性能,但是通過犧牲小部分讀性能換來高性能寫,使得LSM樹成為非常流行的存儲結(jié)構(gòu)。115.哪一項(xiàng)不屬于Hive的流控特性()?A、已經(jīng)建立的總連接數(shù)閾值控制B、某個(gè)特定用戶已經(jīng)建立的連接數(shù)閾值控制C、每個(gè)用戶已經(jīng)建立的連接數(shù)閾值控制D、單位時(shí)間內(nèi)所建立的連接數(shù)閾值控制答案:B解析:某個(gè)特定用戶已經(jīng)建立的連接數(shù)閾值控制不屬于Hive的流控特性116.下列關(guān)于Flinkbarrier描述錯(cuò)誤的是?()A、一個(gè)barrier將本周期快照的數(shù)據(jù)與下一個(gè)周期快照的數(shù)據(jù)分隔開來B、barrier是F1ink快照的核心C、在插入barrier的時(shí)候,會暫時(shí)阻斷數(shù)據(jù)流D、barrier周期性插入到數(shù)據(jù)流中,并作為數(shù)海流的一部分隨之流動答案:C解析:在插入barrier的時(shí)候,不會暫時(shí)阻斷數(shù)據(jù)流117.如果要給隊(duì)列QueueA設(shè)置容量為30%,應(yīng)該設(shè)置哪個(gè)參數(shù)()?A、yarn.scheduler.capacity.rt.QueueA.minimum-user-limit-percentB、yarn.scheduler.capacity.rt.QueueD.user-limit-factrC、yarn.scheduler.capacity.rt.QueueA.capacityD、yarn.scheduler.capacity.rt.QueueA.state答案:C解析:在YARN中應(yīng)設(shè)置為yarn.scheduler.capacity.rt.QueueA.capacity118.Hadptnryarnschedulercapacity,rt.Queueafinim.m-user-limit-percent設(shè)置為50,下面說法錯(cuò)誤的是?A、一個(gè)用戶提交任務(wù),可以使用QueueA的100%的資源。B、如果QueueA中已經(jīng)有2個(gè)用戶的任務(wù)運(yùn)行,這時(shí)第3個(gè)用戶提交的任務(wù)需要等待釋放資源。C、QueueA中必須保障毎個(gè)用戶至少得到50%的資源D、QueueA中的每個(gè)用戶最多只能獲得50%的資源答案:D解析:如果有資源需求,每個(gè)隊(duì)列都會對分配給用戶的資源百分比實(shí)施限制。用戶限制可以在最小值和最大值之間變化。前者(最小值)設(shè)置為該屬性值,后者(最大值)取決于已提交應(yīng)用程序的用戶數(shù)。例如,假設(shè)此屬性的值為25。如果兩個(gè)用戶已將應(yīng)用程序提交到隊(duì)列,用戶不可以使用超過50%的隊(duì)列資源。如果第三位用戶提交了一個(gè)應(yīng)用程序,用戶都不能使用超過33%的隊(duì)列資源。如果有4個(gè)或更多用戶,用戶都不能使用超過25%的隊(duì)列資源。值100表示??未施加用戶限制。默認(rèn)值為100。值指定為整數(shù)。119.下列論據(jù)中,能夠支撐“大數(shù)據(jù)無所不能”的觀點(diǎn)的是()A、互聯(lián)網(wǎng)金融打破了傳統(tǒng)的觀念和行為B、大數(shù)據(jù)存在泡沫C、大數(shù)據(jù)具有非常高的成本D、個(gè)人隱私泄露與信息安全擔(dān)憂答案:D解析:“個(gè)人隱私泄露與信息安全擔(dān)憂”能夠支撐“大數(shù)據(jù)無所不能”的觀點(diǎn)120.關(guān)于MapReduceShuffle過程合并(bine)操作,兩個(gè)健值對<"a",1>和<"a",1>經(jīng)過合并操作結(jié)果為()。A、<"a",2>B、<"a",<1,1>>C、<"a,a",2>D、<"a,a",<1,1>>答案:A解析:關(guān)于MapReduceShuffle過程合并(bine)操作,兩個(gè)健值對<"a",1>和<"a",1>經(jīng)過合并操作結(jié)果為<"a",2>。歸并的結(jié)果是<"a",<1,1>>。121.KafkaClusterMirrring工具可以實(shí)現(xiàn)以下哪些功能?A、Kafka數(shù)據(jù)同步方案B、Kafka單集群內(nèi)數(shù)據(jù)備份C、Kafka單集群內(nèi)數(shù)據(jù)恢復(fù)D、以上全不正確答案:A解析:可使用MirrrMaker工具創(chuàng)建從源Kafka群集(源群集)到目標(biāo)Kafka群集(目標(biāo)群集)的鏡像,從而實(shí)現(xiàn)數(shù)據(jù)同步122.HBase是分布式列式存儲系統(tǒng),記錄按什么集中存放。A、列族B、列C、行D、不確定答案:A解析:HBase是一個(gè)分布式列式存儲系統(tǒng),記錄按列簇集中存放,通過主鍵(rw,key)和主鍵的range來檢索數(shù)據(jù)。123.HFile數(shù)據(jù)格式中的Metalndex字段用于()。A、Meta塊的長度B、Meta塊的結(jié)束點(diǎn)C、Meta塊數(shù)據(jù)內(nèi)容D、Meta塊的起始點(diǎn)答案:D解析:HFile是參照谷歌的SSTable存儲格式進(jìn)行設(shè)計(jì)的。全部的數(shù)據(jù)記錄都是通過它來完畢持久化,其內(nèi)部主要採用分塊的方式進(jìn)行存儲124.以下哪個(gè)操作是hive不支持的?()A、表增加列B、表刪除列C、表修改列D、修改表名答案:B解析:hive不支持表刪除列125.Fusininsight產(chǎn)品中,關(guān)乎Kafka說法不正確的是()A、Kafka強(qiáng)依賴ZkeeperB、Kafka的服務(wù)端可以產(chǎn)生消息C、Kafka的部署的實(shí)例個(gè)數(shù)不得小于2D、Cnsumer作為Kafka的客戶端角色專門進(jìn)行消息的消費(fèi)答案:B解析:Kafka的服務(wù)端不可以產(chǎn)生消息126.Hadp平臺中啟用YARN組件的日志聚集功能,需要配置哪個(gè)參數(shù)?A、yarn.ndemanager.lcal-dirsB、yarn.ndemanager.lg-dirsC、yarn.acl.enableD、yarn.lg-aggregatin-enable答案:D解析:Hadp平臺中啟用YARN組件的日志聚集功能,需要配置yarn.lg-aggregatin-enable參數(shù)127.下列國家的大數(shù)據(jù)發(fā)展行動中,集中體現(xiàn)“重視基礎(chǔ)、首都先行”的國家是()。A、美國B、日本C、中國D、韓國答案:D解析:國家的大數(shù)據(jù)發(fā)展行動中,集中體現(xiàn)“重視基礎(chǔ)、首都先行”的國家是韓國128.關(guān)于Kafka的基本概念描述錯(cuò)誤的是()?A、Kafka集群包含一個(gè)或多個(gè)服務(wù)實(shí)例,這些服務(wù)實(shí)例被稱為BrkerB、每條發(fā)布到Kafka集群的消息都有一個(gè)類別,這個(gè)類別被稱為TpicC、每個(gè)Cnsumer屬于多個(gè)的CnsumerGrupD、Kafka將Tpic分成一個(gè)或者多個(gè)Partitin,每個(gè)Partitin在物理上對應(yīng)一個(gè)文件夾,該文件夾下存儲這個(gè)Partitin的所有消息答案:C解析:每個(gè)Cnsumer進(jìn)程都會劃歸到一個(gè)邏輯的CnsumerGrup中129.以下關(guān)于Zkeeper關(guān)鍵特性中的原子性說法正確的是?A、客戶端發(fā)送的更新會按照他們被發(fā)送的順序進(jìn)行應(yīng)用B、更新只能全部完成或失敗,不會部分完成C、一條消息被一個(gè)server接收,將被所有server接收D、集群中無論哪臺服務(wù)器,對外示均是同一視圖答案:B解析:數(shù)據(jù)更新原子性:一次數(shù)據(jù)更新要么成功,要么失敗。130.SQL語言中,刪除一個(gè)表中所有數(shù)據(jù),但保留表結(jié)構(gòu)的命令是()。A、DELETEB、DRPC、DRPD、REMRE答案:A解析:2、truncate和delete只刪除數(shù)據(jù)不刪除表的結(jié)構(gòu)(定義)。DeleteFrmCustmer;DrptableCustmer;drptable表名稱;truncatetable表名稱;deletefrm表名稱where列名稱=值131.Hbase元數(shù)據(jù)MetaRegin/路由信息保存在哪里?A、ZkeeperB、Meta表C、HMasterD、Rt表答案:B解析:Hbase元數(shù)據(jù)MetaRegin/路由信息保存在Meta表中132.在數(shù)據(jù)安全及處理效率方面,不適宜大數(shù)據(jù)分析的軟件是()。A、SASB、StataC、MatLabD、SPSS答案:D解析:在數(shù)據(jù)安全及處理效率方面,不適宜大數(shù)據(jù)分析的軟件是SPSSSAS(是全球最大的私營軟件公司之一,是由美國北卡羅來納州立大學(xué)1966年開發(fā)的統(tǒng)計(jì)分析軟件。SPSS是由SPSS公司推出的軟件“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”軟件。Stata是一套提供其使用者數(shù)據(jù)分析、數(shù)據(jù)管理以及繪制專業(yè)圖表的完整及整合性統(tǒng)計(jì)軟件。MATLAB是美國MathWrks公司出品的商業(yè)數(shù)學(xué)軟件,用于數(shù)據(jù)分析、無線通信、深度學(xué)習(xí)、圖像處理與計(jì)算機(jī)視覺、信號處理、量化金融與風(fēng)險(xiǎn)管理、機(jī)器人,控制系統(tǒng)等領(lǐng)域。133.硬件故障被認(rèn)為是常態(tài),為了解決這個(gè)問題.HDFS設(shè)計(jì)了副本機(jī)制。默認(rèn)情況下HDFS會存()份?A、3B、5C、2D、4答案:A解析:默認(rèn)情況下HDFS會存3份134.在HBaseShell操作中,可以使用下面哪個(gè)命令對數(shù)據(jù)表進(jìn)行行數(shù)統(tǒng)計(jì)()。A、selectcunt(0)frm'users'B、sum'users'C、cunt'users'D、truncate'users'答案:C解析:HBase'users'屬性唯一,通過cunt語句,可統(tǒng)計(jì)有多少行數(shù)135.如果需要對HBase表中的數(shù)據(jù)進(jìn)行列表查看,可以使用()命令進(jìn)行操作。A、cuntB、scanC、putD、get答案:B解析:get命令是用來獲取Hbase表中某行的數(shù)據(jù)136.在Fusininsight產(chǎn)品中,關(guān)于創(chuàng)建Kafka的Tpic,以下哪些描述是正確的?A、在創(chuàng)建Kafka的Tpic時(shí),必須設(shè)置Partitin個(gè)數(shù)B、在創(chuàng)建Kafka的tpic時(shí),必須設(shè)置Partitin副本個(gè)數(shù)C、設(shè)置多副本可以増強(qiáng)Kafka服務(wù)的容災(zāi)能力D、以上全都正確答案:C解析:kafka的partitin可以在創(chuàng)建時(shí)候指定,也可以alter(kafka-tpic.sh里面的參數(shù)),但是,這個(gè)修改只能增加partitin數(shù)目,并不能減少137.關(guān)于HBase用戶讀寫數(shù)據(jù)過程說法錯(cuò)誤的是A、用戶寫入數(shù)據(jù)時(shí),被分配到相應(yīng)Regin服務(wù)器去執(zhí)行B、用戶數(shù)據(jù)首先被寫入到MemStre和Hlg中C、只有當(dāng)操作寫入Hlg之后,mit()調(diào)用才會將其返回給客戶端D、當(dāng)用戶讀取數(shù)據(jù)時(shí),先去磁盤上面的StreFile中尋找答案:D解析:數(shù)據(jù)讀寫的過程:?用戶寫入數(shù)據(jù)時(shí),被分配到相應(yīng)Regin服務(wù)器去執(zhí)行?用戶數(shù)據(jù)首先被寫入到MemStre和Hlg中?只有當(dāng)操作寫入Hlg之后,mit()調(diào)用才會將其返回給客戶端?當(dāng)用戶讀取數(shù)據(jù)時(shí),Regin服務(wù)器會首先訪問MemStre緩存,如果找不到,再去磁盤上面的StreFile中尋找138.如果我們現(xiàn)有一個(gè)安裝26.5版本的hadp集群,在不修改默認(rèn)配置的情況下存儲200個(gè)每個(gè)200M的文本文件,請問最終會在集群中產(chǎn)生多少個(gè)數(shù)據(jù)塊(包括副本)A、200B、40000C、400D、1200答案:D解析:問最終會在集群中產(chǎn)生1200個(gè)數(shù)據(jù)塊139.Hadp中MapReduce組件擅長處理哪種場景的計(jì)算任務(wù)?A、迭代計(jì)算B、離線計(jì)算C、實(shí)時(shí)交互計(jì)算D、流式計(jì)算答案:B解析:海量數(shù)據(jù)在單機(jī)上處理因?yàn)橛布Y源限制,無法勝任。而一旦將單機(jī)版程序擴(kuò)展到集群來分布式運(yùn)行,將極大增加程序的復(fù)雜度和開發(fā)難度。引入mapreduce框架后,開發(fā)人員可以將絕大部分工作集中在業(yè)務(wù)邏輯的開發(fā)上,而將分布式計(jì)算中的復(fù)雜性交由框架來處理。140.下哪種不是Hive支持的數(shù)據(jù)類型()。A、structB、intC、mapD、lng答案:D解析:Hive支持原始數(shù)據(jù)類型和復(fù)雜類型,原始類型包括數(shù)值型,Blean,字符串,時(shí)間戳,int。復(fù)雜類型包括數(shù)組,map,struct。141.hadp平臺中要查看Yarn服務(wù)中一個(gè)applicatin的信息,通常需要使用什么命令?A、cntainerB、jarC、applicatin-attemptD、Applicatin答案:D解析:hadp平臺中要查看Yarn服務(wù)中一個(gè)applicatin的信息,通常需要使用Applicatin命令。Cntainer將內(nèi)存、CPU、磁盤、網(wǎng)絡(luò)等資源封裝在一起,這樣可以起到限定資源邊界的作用。把本地的java文件打包成jar包,然后放在linux集群上,通過hadp命令來運(yùn)行該jar包。142.HBase來源于哪篇博文?A、TheGgleFileSystemB、MapReduceC、BigTableD、Chubby答案:C解析:Bigtable是一種用于管理結(jié)構(gòu)化數(shù)據(jù)的分布式存儲系統(tǒng),旨在擴(kuò)展到非常大的尺寸:對數(shù)千臺商品服務(wù)器上的PB數(shù)據(jù)進(jìn)行服務(wù)。Bigtable不支持完整的關(guān)系數(shù)據(jù)模型,相反,它為客戶端提供了一個(gè)簡單的數(shù)據(jù)模型,支持對數(shù)據(jù)布局和格式的動態(tài)控制,并允許客戶端推理底層存儲中表示的數(shù)據(jù)的局部屬性。用戶在Bigtable中可以使用是任意字符串的行和列名稱對數(shù)據(jù)進(jìn)行索引。Bigtable還將數(shù)據(jù)視為字符串,盡管客戶端通常將各種形式的結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)序列化到這些字符串中。143.FusinninsigetHD系統(tǒng)中,F(xiàn)lume數(shù)據(jù)流在節(jié)點(diǎn)內(nèi)不需要經(jīng)過哪個(gè)組件?A、SurceB、SinkC、TpicD、channel答案:C解析:FusinninsigetHD系統(tǒng)中,F(xiàn)lume數(shù)據(jù)流在節(jié)點(diǎn)內(nèi)不需要經(jīng)過Tpic組件。在節(jié)點(diǎn)的內(nèi)部,agent由surce、channel和sink組成。surce負(fù)責(zé)消費(fèi)從上游節(jié)點(diǎn)獲取的events,并將其放到channel中,目前Flume支持Avr、Thrift、Syslg、Netcat等數(shù)據(jù)流。channel分為兩種類型,一種是memrychannel,它適合高吞吐量場景,但節(jié)點(diǎn)掛掉后數(shù)據(jù)可能會丟失。另一種是filechannel,也就是channel里的數(shù)據(jù)會同步到硬盤里,節(jié)點(diǎn)意外掛掉后數(shù)據(jù)可恢復(fù),但處理時(shí)間會稍長一些,F(xiàn)lume默認(rèn)使用filechannel。sink從channel取數(shù)據(jù)并將其放入下游節(jié)點(diǎn)。144.如果需要由數(shù)據(jù)生產(chǎn)者決定數(shù)據(jù)發(fā)送給目標(biāo)Blt的某一個(gè)確定的Task,應(yīng)選擇以下哪種消息發(fā)布策略()?A、局部字段分組B、廣播分組C、直接分組D、全局分組答案:C解析:如果需要由數(shù)據(jù)生產(chǎn)者決定數(shù)據(jù)發(fā)送給目標(biāo)Blt的某一個(gè)確定的Task,應(yīng)選擇直接分組發(fā)布策略145.Hadpffl件在企業(yè)應(yīng)用中,能用于數(shù)據(jù)挖掘的產(chǎn)品有()。A、HiveB、PigC、MahutD、Hbase答案:C解析:Mahut可用于數(shù)據(jù)挖掘,Hive和Hbase是數(shù)據(jù)存儲,pig是一種語言。146.若需要定義一個(gè)類域或類方法,應(yīng)使用哪種修飾符?A、staticB、packageC、privateD、public答案:A解析:類域類方法全局變量全局方法147.以下關(guān)于Flink關(guān)鍵特性描述不正確的是()A、Sparkstreaming與Flink相比,時(shí)延更低B、F1ink流式處理引撃能夠同時(shí)提供支持流處理和批處理應(yīng)用的功能C、與FusininghtHD中的Streaming相比Flink具有更高的吞吐量D、checkpint實(shí)現(xiàn)了Flink的容錯(cuò)答案:A解析:Flink會比SparkStreaming有更低的流處理延遲性148.關(guān)于Hive中的桶說法不正確的是()?A、每個(gè)桶是一個(gè)目錄B、建表時(shí)指定桶個(gè)數(shù),桶內(nèi)可排序C、數(shù)據(jù)按照某個(gè)字段的值Hash后放入某個(gè)桶中D、對于數(shù)據(jù)抽樣、特定jin的優(yōu)化很有意義答案:A解析:一個(gè)分區(qū)就是一個(gè)目錄,而不是桶149.FusininsightManager用戶權(quán)限管理不支持哪個(gè)配置?A、給用戶配置角色B、給用戶組配置角色C、給角色配量權(quán)限D(zhuǎn)、給用戶組配置權(quán)限答案:D解析:FusininsightManager用戶權(quán)限管理不支持給用戶組配置權(quán)限150.Flink中的()接口用于流數(shù)據(jù)處理,()接口用于批處理?A、DatabatchAPI,DatastreamAPIB、StreamAPI,BatchAPIC、DatastreamAPI,DatasetAPID、BatchAPI,StreamAPI答案:C解析:Flink中的DatastreamAPI接口用于流數(shù)據(jù)處理,DatasetAPI接口用于批處理151.Flink的數(shù)據(jù)轉(zhuǎn)換操作在以下哪些環(huán)節(jié)中完成()?A、channelB、TransfrmatinC、sinkD、surce答案:B解析:Flink的數(shù)據(jù)轉(zhuǎn)換操作在Transfrmatin完成152.部署FusininsightHD時(shí),同一集群內(nèi)的FlumeServer節(jié)點(diǎn)建議至少部署幾個(gè)?A、1B、3C、4D、2答案:D解析:部署FusininsightHD時(shí),同一集群內(nèi)的FlumeServer節(jié)點(diǎn)建議至少部署2個(gè)153.整型數(shù)據(jù)類型中,需要內(nèi)存空間最少的是A、shrtB、lngC、intD、byte答案:D解析:byte,一個(gè)字節(jié)(八個(gè)二進(jìn)制位)154.數(shù)據(jù)倉庫的最終目的是()A、收集業(yè)務(wù)需求B、開發(fā)數(shù)據(jù)倉庫的應(yīng)用分析C、建立數(shù)據(jù)倉庫邏輯模型D、為用戶和業(yè)務(wù)部門提供決策支持答案:A解析:數(shù)據(jù)倉庫的最終目的是收集業(yè)務(wù)需求155.為了保證流應(yīng)用的快照存儲的可靠性,快照主要存儲在()?A、本地文件系統(tǒng)中B、Jbmanager的內(nèi)存中C、HDFS中D、可靠性高的單機(jī)數(shù)據(jù)庫中答案:C解析:為了保證流應(yīng)用的快照存儲的可靠性,快照主要存儲在HDFS中156.在Spark生態(tài)組件中,哪個(gè)產(chǎn)品可用于基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理()。A、SparkCreB、SparkSqlC、SparkStreamingD、MLlib答案:C解析:SparkStreaming基于實(shí)時(shí)數(shù)據(jù)流157.使用JAVAAPI進(jìn)行HBaseS表掃描操作,以下命令輸寫正確的是()。A、table.getScanner(scan);B、table.scan(table);C、table.get(table).scan();D、table.Scanner(get);答案:A解析:使用table.getScanner(scan)進(jìn)行掃描158.在數(shù)據(jù)庫模型中,可以指定條件對記錄進(jìn)行排序,使用的方法是()。A、rder_byB、filterC、rderD、grup()答案:A解析:保證結(jié)果集中的行已排序的方法是使用RDERBY子句159.關(guān)于HBase實(shí)現(xiàn)的三個(gè)主要的功能組件說法錯(cuò)誤的是A、主服務(wù)器Master負(fù)責(zé)管理和維護(hù)HBase表的分區(qū)信息,維護(hù)Regin服務(wù)器列表,分配Regin,負(fù)載均衡B、Regin服務(wù)器負(fù)責(zé)存儲和維護(hù)分配給自己的Regin,處理來自客

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論