版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
PAGEPAGE1華為大數(shù)據(jù)H13-711V3.5認(rèn)證考試復(fù)習(xí)題庫(kù)(含答案)一、單選題1.可以通過(guò)以下哪個(gè)命令創(chuàng)建節(jié)點(diǎn)數(shù)據(jù)?A、set/nodedataB、get/nodeC、reate/nodeD、1s/node答案:C2.在MRS服務(wù)中,關(guān)于Kafka的Topic,以下描述不正確的有?A、每個(gè)Topic只能被分成一個(gè)partition(區(qū))B、每個(gè)Partition在存儲(chǔ)層面對(duì)應(yīng)一個(gè)1og文件,1og文件中記錄了所有的消息數(shù)據(jù)C、每條發(fā)布到Kafka的消息都有一個(gè)類別,這個(gè)類別被稱為Topic,也可以理解為一個(gè)存儲(chǔ)消息的隊(duì)列D、Topic的Partition數(shù)量可以在創(chuàng)建時(shí)配置答案:A3.表引擎在clickhouse中的作用十分關(guān)鍵,以下哪個(gè)選項(xiàng)不屬于表引擎能夠決定的因素?A、支持哪些查詢方式B、數(shù)據(jù)導(dǎo)入導(dǎo)出的格式C、能不能使用索引D、數(shù)據(jù)復(fù)制使用的參數(shù)答案:B4.Flume中數(shù)據(jù)壓縮特性主要是基于以下哪種目的?A、提高可靠性B、增強(qiáng)安全性C、降低磁盤IOD、降低網(wǎng)絡(luò)lO答案:C5.flink報(bào)據(jù)數(shù)據(jù)集類型的不同將核心數(shù)據(jù)處理接口分為兩大類,一類是支持批計(jì)算的接口,另外一類是支持流計(jì)算的接口,以下關(guān)于這兩類接口描述正確的算哪一項(xiàng)?A、僅支持批計(jì)算的接口是datastreamapi,僅支持流計(jì)算的接口是sqlapiB、支持批計(jì)算的接口是datasetapi,支持流計(jì)算的接口是datastreamapiC、支持批計(jì)算的接口是datastreamapi,支持流計(jì)算的接口是datasetapiD、僅支持批計(jì)算的接口是sqlapi,僅支持流計(jì)算的接口是datastreamapi答案:B6.以下關(guān)于clickHouse適用場(chǎng)景的描述,錯(cuò)誤的是哪一項(xiàng)?A、網(wǎng)絡(luò)/APP流量分析B、商業(yè)智能(BI)C、非結(jié)構(gòu)化數(shù)據(jù)D、用戶行為記錄分析答案:C7.以下關(guān)于Flink數(shù)據(jù)處理描述錯(cuò)誤的是哪一項(xiàng)?A、pacheFlink它同時(shí)支持批處理和流處理,也能用來(lái)做一些基于事件的應(yīng)用B、如果處理一個(gè)事件(或—條數(shù)據(jù))的結(jié)果只跟事件本身的內(nèi)容有關(guān),稱為狀態(tài)處理C、流可以分為有界流和無(wú)界流,其中有界流可以在讀取所有數(shù)據(jù)后再進(jìn)行計(jì)算D、ApacheFlink基本數(shù)據(jù)模型是數(shù)據(jù)流,流可以是無(wú)邊界的無(wú)限流答案:B8.以下關(guān)于flume中各個(gè)channel類型描述錯(cuò)誤的是哪一項(xiàng)?A、memorychannel中消息存放在內(nèi)存中,提供高吞吐,但可能丟失數(shù)據(jù)B、jdbcChannel內(nèi)置的derby數(shù)據(jù)庫(kù),對(duì)event進(jìn)行了持久化,但不提供高可靠性。C、hannel支持事務(wù)機(jī)制,提供較弱的順序保證D、filechannel支持對(duì)數(shù)據(jù)持久化,但需要配置數(shù)據(jù)目錄和checkpoint目錄答案:B9.關(guān)于RDD,下列說(shuō)法錯(cuò)誤的是?A、RDD默認(rèn)存儲(chǔ)在磁盤B、RDD是一個(gè)只讀的,可分區(qū)的分布式數(shù)據(jù)集C、RDD是Spark對(duì)基礎(chǔ)數(shù)據(jù)的抽象D、RDD具有血統(tǒng)機(jī)制(Lineage)答案:A10.hdfs是一個(gè)部署在集群上的分布式文件系統(tǒng),因此,很多數(shù)據(jù)需要通過(guò)網(wǎng)絡(luò)進(jìn)行傳輸,以下關(guān)于hdfs的通訊協(xié)議描述錯(cuò)誤的是?A、所有的hdfs通信協(xié)議都是構(gòu)建在tcp/ip協(xié)議基礎(chǔ)之上B、名稱節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)之間則使用名稱節(jié)點(diǎn)協(xié)議進(jìn)行交互C、名稱節(jié)點(diǎn)不會(huì)主動(dòng)發(fā)起rpc,而是響應(yīng)來(lái)自客戶端和數(shù)據(jù)節(jié)點(diǎn)的rpc請(qǐng)求D、客戶端與數(shù)據(jù)節(jié)點(diǎn)的交互是通過(guò)rpc來(lái)實(shí)現(xiàn)的答案:B11.以下關(guān)于ZooKeeper的Leader節(jié)點(diǎn)在收到數(shù)據(jù)變更請(qǐng)求后的讀寫(xiě)流程說(shuō)法正確的是A、先寫(xiě)磁盤再寫(xiě)內(nèi)存B、先寫(xiě)內(nèi)存再寫(xiě)磁盤C、僅寫(xiě)入內(nèi)存D、同時(shí)寫(xiě)入磁盤和內(nèi)存答案:A12.streaming主要通過(guò)zookeeper提供的以下哪項(xiàng)服務(wù)實(shí)現(xiàn)事件偵聽(tīng)?A、ckB、分布式鎖機(jī)制C、heckpointD、watcher答案:D13.下面哪一個(gè)是elasticsearch的節(jié)點(diǎn)?A、clusterB、esmasterC、indexD、esnode答案:D14.YARN的基于標(biāo)簽調(diào)度,是對(duì)下列選項(xiàng)中的哪個(gè)進(jìn)行標(biāo)簽化?A、ppMasterB、NodeManagerC、ontainerD、ResourceManager答案:B15.某證券公司每10秒分析最近5秒的股票指數(shù),若使用SparkStreaming實(shí)現(xiàn),窗口時(shí)間和滑動(dòng)時(shí)間如何設(shè)置?A、窗口時(shí)間10秒滑動(dòng)時(shí)間10秒B、窗口時(shí)間5秒滑動(dòng)時(shí)間10秒C、窗口時(shí)間5秒滑動(dòng)時(shí)間5秒D、窗口時(shí)間10秒滑動(dòng)時(shí)間5秒答案:D16.硬件故障被認(rèn)為是常態(tài),為了解決這個(gè)問(wèn)題hdfs設(shè)計(jì)了副本機(jī)制,默認(rèn)情況下,一份文件,hdfs會(huì)存()份?A、3B、4C、2D、5答案:A17.flume需要實(shí)時(shí)采集點(diǎn)擊流日志到kafka,用于后續(xù)的實(shí)時(shí)分析處理,選澤以下哪種source類型進(jìn)行數(shù)據(jù)采集最為合適?A、syslogsourceB、httpsourceC、spoolingdirectorysourceD、kafkasource答案:C18.kafka-clustermirroring工具可以實(shí)現(xiàn)以下那些功能?A、kafka集群數(shù)據(jù)同步方案B、kafka單集群內(nèi)數(shù)據(jù)備份C、kafka單集群內(nèi)數(shù)據(jù)恢復(fù)D、以全部不對(duì)答案:A19.某網(wǎng)站舉行活動(dòng),要求計(jì)算該網(wǎng)站每分鐘的用戶訪問(wèn)量,若要實(shí)現(xiàn)該需求,下列哪個(gè)選項(xiàng)最合適?A、MapReduceB、sparkC、StormD、Hive答案:B20.Elasticsearch的一個(gè)索引庫(kù)默認(rèn)有幾個(gè)分片?A、4B、5C、6D、3答案:B21.hive組件能支持多接口,以下哪個(gè)接口是不支持的?A、restfulB、odbcC、beelineD、jdbc答案:A22.Producer需要Server接收到數(shù)據(jù)之后發(fā)出的確認(rèn)接收的信號(hào),當(dāng)設(shè)置ACK信號(hào)的值為多少時(shí)表示至少要等待Leader已經(jīng)成功將數(shù)據(jù)寫(xiě)入本地Log,但不要求等待所有Follower都成功寫(xiě)入?A、cks=0B、acks=2C、acks=1D、acks=a11答案:C23.hbase在讀取數(shù)據(jù)時(shí)率先讀取下列哪個(gè)選項(xiàng)數(shù)據(jù)?A、memstore數(shù)據(jù)B、hlog數(shù)據(jù)C、hfile數(shù)據(jù)D、storefile數(shù)據(jù)答案:A24.以下哪個(gè)不屬于hadoop中mapreduce維組件的特點(diǎn)?A、易于編程B、實(shí)時(shí)計(jì)算C、良好擴(kuò)展性D、高容錯(cuò)性答案:B25.可視化運(yùn)維是clickhouse非常重要的待性,以下關(guān)于clickhouse可視化運(yùn)維的描述,錯(cuò)誤的是哪一項(xiàng)?A、提供日志級(jí)別可視化配置,實(shí)時(shí)動(dòng)態(tài)生效B、華為增加審計(jì)日志,針對(duì)ddl,安全,業(yè)務(wù)操作等內(nèi)容記錄審計(jì)C、可以選擇可視化日志下載,并可以選擇下載的節(jié)點(diǎn)以及下載的日志時(shí)間段,后臺(tái)下載日志。D、提供clickhouse安裝配置,啟停,客戶端,70+項(xiàng)監(jiān)控告警指標(biāo),健康檢查等可視化運(yùn)維手段。答案:A26.下列選項(xiàng)對(duì)Compaction描述正確的是哪一項(xiàng)?A、有Minor和Major兩種類型B、Minor觸發(fā)頻率相對(duì)Major較高C、ompation通過(guò)消除過(guò)期數(shù)據(jù)文件減少HFile文件數(shù)D、Compation通過(guò)合并文件減少HFile文件數(shù)答案:A27.以下關(guān)于hasticsearch的特點(diǎn),描述不正確的是哪一項(xiàng)?A、目前只支持結(jié)構(gòu)化數(shù)據(jù)查詢B、自動(dòng)檢測(cè)故障并保障集群的安全性和可用性C、能立即獲得搜索結(jié)果,實(shí)現(xiàn)了用于全文檢索的倒排索引D、支持水平擴(kuò)展,可運(yùn)行于成百上千臺(tái)服務(wù)器上答案:A28.FusionInsightHD集群規(guī)劃中,管理節(jié)點(diǎn)&控制節(jié)點(diǎn)&數(shù)據(jù)節(jié)點(diǎn)合一部署方案適合什么樣的場(chǎng)景?A、30節(jié)點(diǎn)以下B、100節(jié)點(diǎn)以上C、100-200節(jié)點(diǎn)D、200節(jié)點(diǎn)以上答案:A29.hbase的主hmaster是如何選舉的?A、hmaster為雙主模式,不需要進(jìn)行裁決B、隨機(jī)選取C、由Regionserver進(jìn)行裁決D、通過(guò)zookeeper進(jìn)行裁決答案:D30.某HBase服務(wù)查詢性能降低,經(jīng)檢査發(fā)現(xiàn)當(dāng)前HBase中HFile文件數(shù)目過(guò)多,此時(shí)應(yīng)當(dāng)執(zhí)行下列哪個(gè)操作?A、ScanerB、CleanC、reateD、compaction答案:D31.以下關(guān)于Zookeeper的關(guān)鍵特性,描述錯(cuò)誤的是哪—項(xiàng)?A、等待無(wú)關(guān)性:慢的或者失效的client不會(huì)干預(yù)快速的client的請(qǐng)求,使得每個(gè)client都能有效的等待B、無(wú)論哪個(gè)server,對(duì)外展示的均是同一個(gè)視圖C、原子性,更新只能成功或者失敗,沒(méi)有中間狀態(tài)D、一條消息被一個(gè)server接收即完成,其他server不需要再重復(fù)接收該信息答案:D32.以下哪個(gè)選項(xiàng)不是元數(shù)據(jù)管理的目的?A、數(shù)據(jù)平臺(tái)建設(shè)B、業(yè)務(wù)系統(tǒng)建設(shè)C、信息資源規(guī)劃D、數(shù)據(jù)價(jià)值挖掘答案:D33.Hadoop中,如果將yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percent設(shè)置為50,下面說(shuō)法錯(cuò)誤的是?A、QueueA中必須保障每個(gè)用戶至少得到50%的資源B、如果QueueA中已經(jīng)有2個(gè)用戶的任務(wù)運(yùn)行,這時(shí)第3個(gè)用戶提交的任務(wù)需要等待釋放資源C、一個(gè)用戶提交任務(wù),可以使用QueueA的100%的資源。D、QueueA中的每個(gè)用戶最多只能獲得50%的資源答案:D34.Hive運(yùn)行流程包括下面幾步,請(qǐng)選擇正確的順序1:Hive根據(jù)表類型更新HDFS或Hive倉(cāng)庫(kù)中的數(shù)據(jù)2:Client提交HQL命令3:YARN為群集中的應(yīng)用程序分配資源,并為YARN隊(duì)列中的Hive作業(yè)啟用授權(quán)4:Tez執(zhí)行查詢5:Hive通過(guò)JDBC連接返回查詢結(jié)果A、21345B、24315C、24135D、21435答案:B35.MergeTree是用于高負(fù)載任務(wù)的最通用和功能最強(qiáng)大的表引擎,以下關(guān)于MergeTree的關(guān)鍵特征的描述,錯(cuò)誤的是哪項(xiàng)?A、支持二級(jí)索引B、支持主鍵排序C、支持?jǐn)?shù)據(jù)遷移D、支持并發(fā)數(shù)據(jù)訪問(wèn)答案:C36.下列哪個(gè)不是是hbase讀取數(shù)據(jù)流程中涉及的角色或服務(wù)?A、zookeeperB、hasterC、hregionserverD、hdfs答案:B37.elasticsearch的索引可以存儲(chǔ)在多種存儲(chǔ)類型,而以下哪種存儲(chǔ)類型不支持?A、本地文件系統(tǒng)B、hdfsC、共享文件系統(tǒng)D、對(duì)象存儲(chǔ)答案:D38.zookeeper在分布式應(yīng)用中的主要作用不包括以下哪個(gè)選項(xiàng)?A、保證各節(jié)點(diǎn)上數(shù)據(jù)的一致性B、選舉master節(jié)點(diǎn)C、存儲(chǔ)集群中服務(wù)器信息D、分配集群資源答案:D39.以下描述哪一項(xiàng)不是傳統(tǒng)數(shù)據(jù)處理的瓶頸?A、流數(shù)據(jù)的實(shí)時(shí)寫(xiě)入B、數(shù)據(jù)批量處理性能不足C、海量數(shù)據(jù)的高存儲(chǔ)成本D、缺乏流式數(shù)據(jù)處理能力答案:A40.在ZooKeeper和VARN的協(xié)同工作中,當(dāng)ActiveResourceManager產(chǎn)生故障時(shí)時(shí),StandbyResourceManager會(huì)從以下哪個(gè)目錄中獲取Application相關(guān)信息?A、WarehouseB、storageC、StatestoreD、Metastore答案:C41.HBase元數(shù)據(jù)MetaRegion路由信息保存在哪里?A、ZooKeeperB、HMasterC、Meta表D、Root表答案:A42.MapReduce程序由Map和Reduce兩部分組成,現(xiàn)由MapReduce程序,其有5個(gè)reduce任務(wù),該程序最終輸出多少個(gè)結(jié)果文件?A、2B、4C、5D、3答案:C43.HDFS從2.7.3版本開(kāi)始,BlockSize默認(rèn)是多大?A、64MBB、128MBC、16MBD、32MB答案:B44.當(dāng)某RegionServer故障后,Haster若要恢復(fù)數(shù)據(jù)必須依賴下列哪個(gè)選項(xiàng)?A、RegionB、HDFsC、HLogD、RowKey答案:C45.Elasticsearch中的節(jié)點(diǎn)比如共20個(gè),應(yīng)該設(shè)置的最少投票數(shù)量是多少來(lái)避免鬧裂問(wèn)題?A、10B、11C、9D、12答案:B46.以下關(guān)于Kafka特點(diǎn)描述不正確的是哪—項(xiàng)?A、支持在線水平擴(kuò)展B、支持多級(jí)級(jí)聯(lián)C、高吞吐率D、支持消息分區(qū)答案:B47.spark自帶的資源管理框架是?A、dockerB、yarnC、mesosD、standaline答案:D48.以下關(guān)于Kafka消息傳遞方式描述不正確的是哪一項(xiàng)?A、在點(diǎn)對(duì)點(diǎn)消息系統(tǒng)中,可能會(huì)有多個(gè)消費(fèi)者同時(shí)消費(fèi)數(shù)據(jù),因此不能保證數(shù)據(jù)處理的順序B、在點(diǎn)對(duì)點(diǎn)消息系統(tǒng)中,當(dāng)一個(gè)消費(fèi)者消費(fèi)了隊(duì)列中的某條數(shù)據(jù)之后,該條數(shù)據(jù)則從消息隊(duì)列中刪除C、分布式消息傳遞有兩種主要的消息傳遞模式,點(diǎn)對(duì)點(diǎn)傳遞模式、發(fā)布-訂閱模式D、在發(fā)布-訂閱消息系統(tǒng)中,同一條數(shù)據(jù)可以被多個(gè)消費(fèi)者消費(fèi),數(shù)據(jù)被消費(fèi)后不會(huì)立馬刪除答案:A49.yarn服務(wù)中,如果要給隊(duì)列queuea設(shè)置容量為30%,應(yīng)該配置哪個(gè)參數(shù)?A、yarn.scheduler.capacity.root.queuea.capacityB、yarn.scheduler.capacity.root.queuea.minimum-user-limit-percentC、yarn.scheduler.capacity.root.queuea.user-limit-factorD、yarn.scheduler.capacity.root.queuea.state答案:A50.以下關(guān)于MRS使用限制的描述,錯(cuò)誤的是哪—項(xiàng)?A、集群創(chuàng)建完成后,請(qǐng)勿隨意刪除或更改已使用的安全組。B、MRS集群使用的安全組請(qǐng)勿隨意放開(kāi)權(quán)限,避免被惡意訪問(wèn)C、創(chuàng)建MRS集群時(shí),不支持自動(dòng)創(chuàng)建安全組,需要手動(dòng)創(chuàng)建索全組D、IRS集群必須創(chuàng)建在VPC子網(wǎng)內(nèi)。答案:C51.在Hive數(shù)據(jù)存儲(chǔ)模型中,分區(qū)和桶的關(guān)系描述錯(cuò)誤的是哪—項(xiàng)?A、分區(qū)下可再有分區(qū)或者桶B、每個(gè)桶是一個(gè)目錄C、建表時(shí)指定桶個(gè)數(shù),桶內(nèi)可排序。D、分區(qū)數(shù)量不固定答案:B52.hdfs中namenode的主備仲裁,是由哪個(gè)組件控制的?A、hdfsclientB、resourcemanagerC、nodemanagerD、zookeeperfailovercontroller答案:D53.銀行為了數(shù)據(jù)傳輸?shù)目煽啃?,使用Flume采集數(shù)據(jù),主要是利用Flume的哪個(gè)特性?A、支持采集日志文件B、事務(wù)機(jī)制C、支持級(jí)聯(lián)D、支持在定制各類數(shù)據(jù)發(fā)送方答案:B54.在數(shù)據(jù)流處理過(guò)程中,經(jīng)常使用系統(tǒng)時(shí)間(processingtime)作為某個(gè)事件的時(shí)間,關(guān)于procesingtime描述錯(cuò)誤的是哪—項(xiàng)?A、ProcessingTime結(jié)果是不可復(fù)現(xiàn)的,一旦流式計(jì)算版本升級(jí)甚至系統(tǒng)崩潰,計(jì)算將會(huì)停止B、實(shí)際應(yīng)用過(guò)程中,processingtime要落后與eventtimeC、processingtime和eventtime之間存在差異的主要原因是由于網(wǎng)絡(luò)延遲、處理時(shí)間的長(zhǎng)短等造成的D、ProcessingTime適用于處理問(wèn)題復(fù)雜、對(duì)結(jié)果可溯要求較高的場(chǎng)景答案:D55.查看kafka某topic的partion詳細(xì)信息時(shí),使用如下哪個(gè)命令?A、bin/kafka-topics.sh-listB、in/kafka-topics.sh--describeC、bin/kafka-topics.sh--deleteD、bin/kafka-topics.sh-create答案:B56.默認(rèn)情況下F1ink不開(kāi)啟檢查點(diǎn),用戶需要在程序中通過(guò)調(diào)用以下那種方法配置和開(kāi)啟檢查點(diǎn)?A、env.getCheckpointConfig(.setCheckpointingTimeout(60000)B、env.enableCheckpointing(1000)C、env.getCheckpointConfig().setMaxConcurrentCheckpoints(500)D、env.startSetCheckpointing(1000)答案:B57.某公司使用HBase存儲(chǔ)業(yè)務(wù)數(shù)據(jù),由于數(shù)據(jù)規(guī)模較大,所以數(shù)據(jù)存儲(chǔ)在HBase后會(huì)導(dǎo)致頻繁的Region分裂,為了避免這種情況,下列哪個(gè)方法比較適用?A、增加Region大小B、增大MemStore大小C、對(duì)該表預(yù)分區(qū)D、提升RegionServer性能答案:C58.ZooKeeper客戶端獲取節(jié)點(diǎn)數(shù)據(jù)的命令,以下哪個(gè)是正確的?A、set/nodedataB、get/nodeC、show/nodeD、Is/node答案:B59.ElasticSearch有哪些查詢類型?A、基于分值數(shù)檢索B、基于元數(shù)據(jù)檢索C、基于詞條檢索D、基于全文檢索答案:D60.某電信公司計(jì)劃開(kāi)展大數(shù)據(jù)業(yè)務(wù),目標(biāo)業(yè)務(wù)有客戶分群、用戶歷史賬單分析、實(shí)時(shí)話費(fèi)分析等業(yè)務(wù)。若要滿足業(yè)務(wù)需求,從功能和成本考慮,下列哪個(gè)選項(xiàng)最合適?A、部署StormB、單獨(dú)部署SparkC、部署WapReduceD、部署MapReduce與Storm答案:B61.以下不屬于單點(diǎn)登錄特點(diǎn)的是?A、訪問(wèn)其他組件需要重新登錄B、提高運(yùn)維和管理效率C、為用戶提供便捷服務(wù)D、為用戶提供便捷服務(wù)答案:A62.以下選項(xiàng)中,哪一項(xiàng)用于查看clickhouse組件命令幫助?A、clickhousehB、clickhouse-catC、lickhouse-helpD、clickhouse-m答案:C63.hadoop中,如果將yarn.schedulercapacity.root.queueuea.minimum-user-limit-percenti沒(méi)置為50,下面說(shuō)法錯(cuò)誤的是?A、一個(gè)用戶提交任務(wù),可以使用queuea的100%的資源。B、如果queuea中已經(jīng)有2個(gè)用戶的任務(wù)運(yùn)行,這時(shí)第3個(gè)用戶提交的任務(wù)需要等待釋放資源。C、Queuea中必須保障每個(gè)用戶至少得到50%的資源D、Queuea中的每個(gè)用戶最多只能獲得50%的資源。答案:D64.flume采集日志數(shù)據(jù),若不考慮數(shù)據(jù)安全性。要達(dá)到最高采集速度,應(yīng)該用什么類型的channel?A、filechannelB、jdbcchannelC、memorychannelD、hdfschannel答案:C65.某大數(shù)據(jù)公司在處理統(tǒng)計(jì)實(shí)時(shí)用戶消費(fèi)數(shù)據(jù)時(shí),以下能夠?qū)崿F(xiàn)對(duì)一分鐘內(nèi)的窗口數(shù)據(jù)進(jìn)行分組聚合功能的是哪—項(xiàng)?A、overridedefmap(valve:String):WaterSensor={Valdatas:Array[SFing]=value.split(",")WaterSensor(getRuntimeContext.getTaskName,datas(1).tolong,datas(2).toInt)}B、overridedefextractAscendingTimest(element:User):Long=element,timest),KeyBy(.userld)Window(umblingEventTimeWindows.of(Time.seconds(60)))C、DataStream<Tuple2<String,Integer>>windowStreamwindowCount,keyBy(0).timeWindow(Time.minutes(1),Time.seconds(30)).Sum(1):D、ataStream<Tuple2<String,Long>>result=Stream.keyBy(value->value.f0).process(newCountWithTimeoutFunction(1))答案:B66.hbase要實(shí)現(xiàn)數(shù)十億行數(shù)百萬(wàn)列的存儲(chǔ)規(guī)模,需要以下哪個(gè)選項(xiàng)支持?A、redisB、elasticsearchC、kafkaD、hdfs答案:D67.以下關(guān)千KrbServer及LdapServer開(kāi)源增強(qiáng)特性的描述,錯(cuò)誤的是哪一項(xiàng)?A、集群內(nèi)服務(wù)認(rèn)證B、應(yīng)用開(kāi)發(fā)認(rèn)證C、跨系統(tǒng)互信特性D、賬號(hào)身份認(rèn)證答案:D68.以下關(guān)于HBase二級(jí)索引的描述哪一項(xiàng)是正確的?A、二級(jí)索引把要查找的列與rowkey關(guān)聯(lián)成一個(gè)索引B、此時(shí)列成新的rowkey,原rowkey成為valueC、二級(jí)索引查詢了2次D、以上全都正確答案:D69.以下關(guān)于MRS服務(wù)的安全認(rèn)證的描述,正確的是哪一項(xiàng)?A、不提供單點(diǎn)登錄,統(tǒng)一了mrs系統(tǒng)用戶和組件用戶的管理及認(rèn)證。B、對(duì)登錄manager的用戶進(jìn)行審計(jì)。C、支持安全協(xié)議kerberos,mrs使用kerberos作為賬戶管理系統(tǒng),并通過(guò)ldap對(duì)賬戶信息進(jìn)行安全認(rèn)證。D、替于用戶和角色的認(rèn)證統(tǒng)一體系,遵從賬戶/角色rbac(role-basedaccesscontrol)模型,實(shí)現(xiàn)通過(guò)賬戶進(jìn)行權(quán)限管理,對(duì)角色進(jìn)行批量授權(quán)管理。答案:C70.以下關(guān)于clickhouse設(shè)計(jì)優(yōu)點(diǎn)的描述,錯(cuò)誤的是哪一項(xiàng)?A、多核并行計(jì)算B、向量化計(jì)算引擎C、數(shù)據(jù)壓縮比低D、支持嵌套數(shù)據(jù)結(jié)構(gòu)答案:D71.capacity調(diào)度器為每個(gè)隊(duì)列分配資源,下列哪個(gè)選項(xiàng)是隊(duì)列內(nèi)的資源調(diào)度策略?A、fairB、mesosC、fifoD、capacity答案:C72.yarn調(diào)度器分配資源的順序,下面哪一個(gè)描述是正確的?A、本地資源->同機(jī)架->任意機(jī)器B、同機(jī)架->任意機(jī)器->本地資源C、任意機(jī)器->同機(jī)架->本地資源D、任意機(jī)器->本地資源->同機(jī)架答案:A73.HBase表設(shè)計(jì)中,列族和RowKey是表設(shè)計(jì)的重要內(nèi)容。下列哪個(gè)選項(xiàng)不適合做RowKey?A、用戶IDB、用戶名C、身份證號(hào)D、手機(jī)號(hào)答案:B74.關(guān)于hbase的ase的regionsplit分裂流程的描述不正確的是?A、split為了減少region中數(shù)據(jù)大小,從而將一個(gè)region分裂成兩個(gè)region.B、split過(guò)程中論表會(huì)暫停服務(wù)C、split過(guò)程中并沒(méi)有真正的將文件分裂,僅僅是創(chuàng)建了引用文件D、split過(guò)程中被分裂的region會(huì)暫停服務(wù)答案:B75.以下描述中,哪個(gè)不是Hive的優(yōu)點(diǎn)?A、類似SQL語(yǔ)法,內(nèi)置大量函數(shù)B、依賴于高性能的商業(yè)服務(wù)器C、支持自定義存儲(chǔ)格式和自定義函數(shù)D、HiveServer支持集群模式答案:B76.HBase中Region的物理存儲(chǔ)單元是什么?A、ColumnB、ColumnFamilyC、RowD、Region答案:B77.Flink程序由Source、Transformatin和Sink三部分組成,以下關(guān)于這三部分描述錯(cuò)誤的是哪一項(xiàng)?A、Sink負(fù)責(zé)最終數(shù)據(jù)的輸出,支持HDFS、Kafka和文本輸出等B、在各部分之間流轉(zhuǎn)的數(shù)據(jù)會(huì)被封裝成一個(gè)個(gè)EventC、Source主要負(fù)責(zé)數(shù)據(jù)的讀取,支持HDFS、Kafka、HBase和文本等D、Transformatin主要負(fù)責(zé)對(duì)數(shù)據(jù)的轉(zhuǎn)換操作答案:B78.某公司使用spark做大數(shù)據(jù)分析,某次分析任務(wù)中某rdd會(huì)被重復(fù)利用,導(dǎo)致重復(fù)計(jì)算多次,若要避免重復(fù)計(jì)算且能夠重復(fù)利用談rdd,以下哪個(gè)選項(xiàng)更合適?A、增大任務(wù)資源,快速結(jié)束該任務(wù)B、spark計(jì)算很快,無(wú)需優(yōu)化C、寫(xiě)出該rdd,需要時(shí)再重新讀取D、rdd執(zhí)行persist操作答案:D79.以下關(guān)于zookeeper關(guān)鍵特性中的原子性說(shuō)法正確的是?A、一條消息被一個(gè)server接收,將被所有server接收B、更新只能全部完成或失敗,不會(huì)部分完成C、集群中無(wú)論哪臺(tái)服務(wù)器,對(duì)外展示的均是同一視圖D、客戶端發(fā)送的更新會(huì)按照它們被發(fā)送的順序進(jìn)行應(yīng)用答案:B80.HBase的某張表的RowKey劃分SplitKey為9,E,a,z,請(qǐng)問(wèn)該表有幾個(gè)Region?A、5B、4C、3D、6答案:A81.Flume包含Source、Channe1和Sink三大組件,以下關(guān)于這三大組件說(shuō)法錯(cuò)誤的是哪一項(xiàng)?A、當(dāng)Sink成功地將events發(fā)送到下一跳的Channel或最終目的時(shí),events會(huì)從Channel移除B、Channel支持事務(wù),提供較弱的順序保證,可以連接多個(gè)的Source和SinkC、Sink必須作用于一個(gè)確切的ChannelD、Source負(fù)責(zé)接收events或通過(guò)特殊機(jī)制產(chǎn)生events,并將events批量放到多個(gè)Channel中答案:C82.對(duì)干延遲事件出現(xiàn)時(shí)窗口已經(jīng)關(guān)閉并產(chǎn)出了計(jì)算結(jié)果,以下處理方法不合理的是哪一項(xiàng)?A、將延遲事件視為錯(cuò)誤消息并丟棄B、延遲事件—定不能忽略計(jì)算C、重新激活已經(jīng)關(guān)閉的窗并重新計(jì)算以修正結(jié)果D、將延遲事件收集起來(lái)另外處理答案:B83.某公司開(kāi)展大數(shù)據(jù)業(yè)務(wù),其不但要使用MapReduce做離線分析還要使用Spark做實(shí)時(shí)分析。若使用Yarn做統(tǒng)—的資源管理,調(diào)度器如何選擇?A、使用Capacity調(diào)度器B、使用FIFO調(diào)度器C、使用Fair調(diào)度器D、使用Mesos調(diào)度器答案:A84.以下關(guān)于kafkapartion偏移量的描述不正確的是?A、offset是一個(gè)string型字符串B、消費(fèi)者通過(guò)(offset,partition,topic)跟蹤記錄C、每條消息在文件中的位置稱為offset(偏移量)D、唯一標(biāo)記一條消息答案:A85.kafka集群在運(yùn)行期間,直接依賴于下面哪個(gè)組件?A、hdfsB、flumeC、zookeeperD、hbase答案:C86.hadoop平臺(tái)中,要查看yarn服務(wù)中一個(gè)application的信息,通常需要使用什么命令?A、pplicationB、containerC、application-attemptD、jar答案:A87.關(guān)于HDFS數(shù)據(jù)完整性保障,以下哪個(gè)機(jī)制是錯(cuò)誤的?A、快照機(jī)制實(shí)現(xiàn)了文件系統(tǒng)常見(jiàn)的快照機(jī)制,保證數(shù)據(jù)誤操作時(shí),能及時(shí)恢復(fù)B、采用日志機(jī)制操作元數(shù)據(jù),同時(shí)元數(shù)據(jù)存放在主備NameNode上C、節(jié)點(diǎn)性能較高的DataNode會(huì)存放更多的數(shù)據(jù)D、ataNode向NameNode周期上報(bào)失敗任務(wù),NameNode發(fā)起副本重建動(dòng)作以恢復(fù)丟失副本答案:C88.HBase的Region是由哪個(gè)服務(wù)進(jìn)程來(lái)管理的?A、ZooKeeperB、HRegionServerC、DataNodeD、HMaster答案:B89.以下關(guān)于clickHouse的數(shù)據(jù)庫(kù)管理的描述,錯(cuò)誤的是哪一項(xiàng)?A、clickHouse不可以按照用戶粒度設(shè)置數(shù)據(jù)庫(kù)或者表的操作權(quán)限。B、clickHouse可以動(dòng)態(tài)地創(chuàng)建、修改或刪除數(shù)據(jù)庫(kù)、表和視圖,而無(wú)須重啟服務(wù)clickHouseC、提供集群模式,能夠自動(dòng)管理多個(gè)數(shù)據(jù)庫(kù)節(jié)點(diǎn)D、clickHouse提供了數(shù)據(jù)備份導(dǎo)出與導(dǎo)入恢復(fù)機(jī)制答案:A90.默認(rèn)情況下MapReduce程序中reduce任務(wù)數(shù)由下列哪個(gè)選項(xiàng)決定?A、隨機(jī)生成B、用戶指定C、根據(jù)資源自行生成任務(wù)數(shù)D、該任務(wù)所計(jì)算的數(shù)據(jù)塊數(shù)量答案:B91.某公司使用用戶id做hbase的rowey,同時(shí)在列中還存在phone列,該列存儲(chǔ)了用戶的手機(jī)號(hào)碼。該公司要求能夠通過(guò)phone快速查詢到用戶id,下列哪個(gè)方法比較合適?A、get與valuefiler同時(shí)使用B、使用filterC、scan與valuefilter同時(shí)使用D、創(chuàng)建二級(jí)索引答案:D92.以下關(guān)于ClickHouse的數(shù)據(jù)分片和數(shù)據(jù)副本的描述,錯(cuò)誤的是哪—項(xiàng)?A、分片之間的數(shù)據(jù)是完全相同的。B、ClickHouse依靠ReplicatedMergeTree引擎與ZooKeeper實(shí)現(xiàn)了復(fù)制表機(jī)制。C、數(shù)據(jù)副本的主要目的是防止數(shù)據(jù)丟失,增加數(shù)據(jù)存儲(chǔ)的冗余。D、數(shù)據(jù)分片的主要目的是實(shí)現(xiàn)數(shù)據(jù)的水平切分。答案:A93.Hive在處理一些復(fù)雜的統(tǒng)計(jì)或者排序等復(fù)雜任務(wù)的時(shí)候,會(huì)調(diào)用以下哪個(gè)組件?A、HadoopB、HBaseC、MapReduceD、HDFS答案:C94.MapReduce、Spark和Flink都可以同時(shí)支持以下哪種數(shù)據(jù)處理方式?A、Kv查詢B、批處理C、流處理D、實(shí)時(shí)檢索答案:B95.在KafkaHA中,當(dāng)Partition對(duì)應(yīng)的Leader宕機(jī)時(shí),需要從Follower中選舉出新Leader,具體由以下哪個(gè)角色執(zhí)行?A、contrllerB、rokerC、LeaderD、Follower答案:A96.MRS支持與公有云安全服務(wù)集成,采取多種措施確保主機(jī)安全。以下選項(xiàng)中,哪一個(gè)選項(xiàng)不屬于主機(jī)安全的措施?A、操作系統(tǒng)內(nèi)核安加固B、身份鑒別和認(rèn)證C、更新操作系統(tǒng)最新補(bǔ)丁D、操作系統(tǒng)端口管理答案:C97.關(guān)于dataset,下列說(shuō)法不正確的是?A、dataset不需要反序列化就可執(zhí)行大部分操作B、dataset執(zhí)行sort,filter,shuffle等操作需要進(jìn)行反序列化C、dataset是一個(gè)由特定域的對(duì)象組成的強(qiáng)類型集合D、ataset與rdd高度類似,性能比rdd好答案:B98.hbase中數(shù)據(jù)存儲(chǔ)的文件格式是什么?A、hfileB、textfileC、hlogD、sequencefile答案:A99.在dataartsstudio平臺(tái)中,以下哪個(gè)選項(xiàng)不屬于數(shù)據(jù)權(quán)限模塊?A、數(shù)據(jù)表權(quán)限B、審批中心C、用戶管理和角色管理D、數(shù)據(jù)目錄權(quán)限答案:B100.以下關(guān)于kerboers的優(yōu)勢(shì)的描述錯(cuò)誤的是哪個(gè)?A、kerboers支持雙向鑒別,kerboers的serverver端通過(guò)該回ciient發(fā)送的時(shí)間截,向client提供驗(yàn)證自己身份的手段。B、由kdc代為發(fā)送authenticator和sessionticket.有效提高性能。C、用于認(rèn)證的sessionkey是shorttermkey.只在一次會(huì)話中有效防止暴力破解。D、每個(gè)請(qǐng)求都以時(shí)間戳進(jìn)行標(biāo)記,有效防止重放攻擊。答案:B101.下圖展示了structuredstreaming的計(jì)算模型。通過(guò)觀察可以得出最終t3的計(jì)算結(jié)果是?A、cat2;dog4;owl2B、dog1;owl1C、at2;dog3;owl1D、cat1;cat1:dog2:dog2;owl2答案:A102.某大型企業(yè)需要做日志分析,運(yùn)維監(jiān)控,搜索與推薦,數(shù)據(jù)庫(kù)加速,可為該企業(yè)推存哪些服務(wù)?A、云搜索服務(wù)cssB、數(shù)據(jù)可視化服務(wù)C、數(shù)據(jù)湖治理中心DGCD、mapreduce服務(wù)答案:A103.yarn中設(shè)置隊(duì)列queuea的最大使用資源量,需要配置哪個(gè)參數(shù)?A、yarn.scheduler.capacity.root.queuea.minimum-user-limit-percentB、yarn.scheduler.capacity.root.queuea.maximum-capacityC、yarn.scheduler.capacity.root.queuea.user-limit-factorD、yarn.scheduler.capacity.root.queuea.state答案:B104.rdd有transformation和action算子,下列屬于action算子的是?A、reducebykeyB、saveastextfileC、mapD、filter答案:B105.當(dāng)zookeeper集群的節(jié)點(diǎn)數(shù)為5節(jié)點(diǎn)時(shí),請(qǐng)問(wèn)集群的容災(zāi)能力和多少節(jié)點(diǎn)是等價(jià)的?A、3B、4C、6D、7答案:C106.HBase集群定時(shí)執(zhí)行Compaction的目的是什么?A、提升數(shù)據(jù)讀取性能。B、減少同一個(gè)Region的文件數(shù)目。C、減少同一個(gè)Region同一個(gè)ColumrFamily下的文件數(shù)目。D、提升數(shù)據(jù)寫(xiě)入能力答案:C107.HBase命令中下列哪個(gè)選項(xiàng)性能最差?A、scanB、getC、listD、put答案:A108.在clickhuse中創(chuàng)建數(shù)據(jù)表時(shí),指定以下哪一個(gè)表引擎會(huì)導(dǎo)致重新啟動(dòng)服務(wù)器時(shí)表中的數(shù)據(jù)消失,表變?yōu)榭??A、mysqlB、kafkaC、tinylogD、memory答案:D109.默認(rèn)情況下mapreduce程序中map任務(wù)數(shù)由下列哪個(gè)選項(xiàng)決定?A、根據(jù)資源自行生成任務(wù)數(shù)B、用戶指定C、隨機(jī)生成D、該任務(wù)所計(jì)算的數(shù)據(jù)塊數(shù)量答案:D110.以下哪一個(gè)因素助力了大數(shù)據(jù)時(shí)代的蓬勃發(fā)展?A、硬件成本的降低和網(wǎng)絡(luò)帶寬的提升B、云計(jì)算的興起C、智能終端的普及和社交需求的提升D、以上全都正確答案:D多選題1.Hive相較于傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的優(yōu)點(diǎn)有哪些?A、數(shù)據(jù)存儲(chǔ)在HDFS,可靠性高,容錯(cuò)性高B、依賴硬件較低,可適應(yīng)普通的機(jī)器C、索引處理效率高效D、集成—整套成熟的的報(bào)表解決方案,可以較為方便的進(jìn)行數(shù)據(jù)的分析答案:AB2.在MRS服務(wù)中,關(guān)于Kafka組件說(shuō)法正確的是?A、Karka的Producer發(fā)送消息時(shí),可以指定該消息被哪個(gè)Consumer消費(fèi)B、Kaka會(huì)將元數(shù)據(jù)信息存放到ZooKeeper上。C、在創(chuàng)建Topic時(shí),本數(shù)不得大于當(dāng)前存活的Braker實(shí)例個(gè)數(shù),否則創(chuàng)建Topic將會(huì)失敗。D、Kaka安裝完成后就不能再配置數(shù)據(jù)存放目錄答案:ABCD3.Flink提供了內(nèi)置的狀態(tài)管理,可以把工作時(shí)狀態(tài)存儲(chǔ)在Fink內(nèi)部,而不需要把它存儲(chǔ)在外部系統(tǒng)。這樣做的好處包含以下哪些選項(xiàng)?A、降低了計(jì)算引整對(duì)外部系統(tǒng)的依賴,便得部、運(yùn)維更加簡(jiǎn)單B、確保了數(shù)據(jù)在處理過(guò)程中的一致性C、對(duì)性能帶來(lái)了極大的提升D、實(shí)現(xiàn)了高香吐、高性能特性,但無(wú)法做到低延遲佩障答案:ABC4.以下選項(xiàng)中,屬于HDFS架構(gòu)關(guān)鍵特性的是?A、健壯機(jī)制B、多方式訪問(wèn)機(jī)制C、HA高可靠性D、元數(shù)據(jù)持久化機(jī)制答案:ABCD5.關(guān)于HDFS中NameNode的作用描述的正確的是?A、管理HDFS的名稱空間(Namespace)B、配置副本策略通常為3份C、處理客戶端讀寫(xiě)請(qǐng)求D、執(zhí)行數(shù)據(jù)塊的讀/寫(xiě)操作答案:ABC6.下列哪些選項(xiàng)是action算子?A、mapPartitionB、reduceC、reduceByKeyD、collect答案:BD7.以下哪些選項(xiàng)屬于數(shù)據(jù)治理的價(jià)值?A、解決數(shù)據(jù)安全問(wèn)題B、提升業(yè)務(wù)處理效率C、代替管理決策D、降低業(yè)務(wù)運(yùn)營(yíng)成本答案:ABD8.某MapReduce程序運(yùn)行時(shí),AppMaster發(fā)生故障。下列哪些選項(xiàng)對(duì)該任務(wù)描述正確?A、任務(wù)仍可運(yùn)行B、任務(wù)立即停止C、AppMaster不再啟動(dòng)D、AppMaster再次啟動(dòng)答案:AD9.Redis數(shù)據(jù)持久化技術(shù)有RDB和AOF,以下描述正確的是哪些選項(xiàng)?A、Rdb方式的持久化是通過(guò)快照完成的B、RDB和AOF可單獨(dú)使用,也可以配合使用C、RDB方式是默認(rèn)開(kāi)啟的,而AOF功能需要另外開(kāi)啟D、AOF方式的持久化是通過(guò)日志文件的方式完成的答案:ABCD10.Flink中Watermark機(jī)制用來(lái)解決亂序問(wèn)題,可通過(guò)以下哪些方式產(chǎn)生?A、繼承assignerWithPunctuatedWatermarksB、繼承assignerWithPeridicWatermarksC、繼承g(shù)etCurrentWatermarkD、繼承assignerTimestWithWatermark答案:ABCD11.ElasticSearch擴(kuò)容的場(chǎng)景包括哪些?A、集群數(shù)據(jù)量誠(chéng)少B、ElasticSearch單實(shí)例的索引數(shù)據(jù)太大C、節(jié)點(diǎn)需要重新安裝操作系統(tǒng)D、物理資源消耗過(guò)大答案:BD12.下列選項(xiàng)對(duì)列族描述正確的是?A、列族也有版本號(hào)B、由若干列組成C、一個(gè)列族最多容納3個(gè)列D、是基本的訪問(wèn)控制單元答案:BD13.Kafka分布式消息傳遞基于可靠的消息隊(duì)列,包含以下哪兩種主要的消息傳遞模式?A、分發(fā)傳遞模式B、輪詢傳遞模式C、點(diǎn)對(duì)點(diǎn)傳遞模式D、發(fā)布訂閱模式答案:CD14.關(guān)于HDFS命名空間管理,以下選項(xiàng)描述正確的是哪幾項(xiàng)?A、對(duì)文件系統(tǒng)命名空間或其屬性的任何更改由NameNode和DataNode共同記錄B、NameNode維護(hù)文件系統(tǒng)命名空間C、HDFS的命名空間包含目錄、文件和塊D、用戶可以像使用普通文件系統(tǒng)一樣,創(chuàng)建、刪除、轉(zhuǎn)移目錄和文件答案:BCD15.下面哪些場(chǎng)景不是Flink組件擅長(zhǎng)的?A、批處理B、流處理C、數(shù)據(jù)存儲(chǔ)D、迭代計(jì)算答案:CD16.Flink中Watermark機(jī)制用來(lái)解決亂序問(wèn)題,Watermark可通過(guò)以下哪些方式產(chǎn)生?A、繼承assignerWithPunctuatedWatermarksB、繼承assignerTimestWithWatermarkC、繼承assignerWithPeriodicWatermarksD、繼承g(shù)etCurrentWatermark答案:ABC17.以下關(guān)于clickHouse增強(qiáng)特性的描述,正確的是哪些項(xiàng)?A、平滑的彈性擴(kuò)容能力B、實(shí)現(xiàn)滾動(dòng)升級(jí)/滾動(dòng)重啟C、默認(rèn)采用兩副本方式、自動(dòng)生成集群分片拓?fù)銬、提供了基于ELB的HA部署架構(gòu)答案:ABCD18.通過(guò)配置以下哪些參數(shù)可清理Kafka中產(chǎn)生的日志?A、log.cleanup.policyB、log.retention.hoursC、pertiesD、log.retention.Bytes答案:ABD19.HDFS支持通過(guò)以下哪些訪問(wèn)方式來(lái)訪問(wèn)數(shù)據(jù)?A、HTTPB、JAVAAPIC、s3D、She11答案:ABD20.以下關(guān)于HBase中HMaster的功能描述哪些是正確的?A、Region負(fù)載均衡,Region分裂以及分裂后的Region分配B、負(fù)責(zé)建表/修改表/刪除表C、Regionserver失效后的Region遷移D、負(fù)責(zé)RegionServer的負(fù)載均衡答案:ABCD21.Spark框架包括哪些模塊?A、SparkSQLB、SparkM11ibC、SparkStreamingD、SparkGraphX答案:ABCD22.下列哪些選項(xiàng)對(duì)RDD描述正確?A、RDD是只讀的B、RDD進(jìn)行數(shù)據(jù)恢復(fù)時(shí)所有分區(qū)同時(shí)進(jìn)行C、RDD依賴血統(tǒng)機(jī)制恢復(fù)數(shù)據(jù)D、RDD是只讀的所以RDD不支持寫(xiě)操作答案:AC23.以下關(guān)于Hudi支持的視圖的描述,正確的是哪些項(xiàng)?A、增量視圖B、寫(xiě)優(yōu)化視圖C、讀優(yōu)化視圖D、實(shí)時(shí)視圖答案:ABD24.以下屬于Hive內(nèi)置的字符串函數(shù)有哪些?A、bs()B、length0C、substr()D、trim()答案:BCD25.企業(yè)做大數(shù)據(jù)處理,對(duì)數(shù)據(jù)庫(kù)的技術(shù)和架構(gòu)要求具備哪些能力?A、數(shù)據(jù)庫(kù)必須是分布式架構(gòu)B、海量數(shù)據(jù)運(yùn)維需要保證數(shù)據(jù)穩(wěn)定,支持高并發(fā)的同時(shí)減少服務(wù)器負(fù)載C、數(shù)據(jù)庫(kù)要求能處理PB級(jí)別的數(shù)據(jù)D、數(shù)據(jù)庫(kù)規(guī)劃需要考慮結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的支持答案:BCD26.在DataArtsStudio平臺(tái)中,以下哪些選項(xiàng)屬于權(quán)限訪問(wèn)控制的功能特性?A、集中式訪問(wèn)控制B、詳細(xì)的授權(quán)、鑒權(quán)日志審計(jì)C、實(shí)現(xiàn)對(duì)MRS服務(wù)中的資源進(jìn)行精細(xì)訪問(wèn)控制D、豐富的權(quán)限策略配置、答案:ABCD27.在數(shù)據(jù)流處理過(guò)程中,每個(gè)事件的時(shí)間可以分為以下哪些種類?A、delaytime,即事件發(fā)生到處理的延遲時(shí)間B、processingtime,即事件被系統(tǒng)處理的時(shí)間C、lingestiontime.即事件到達(dá)流處理系統(tǒng)的時(shí)間D、eventtime,即事件發(fā)生時(shí)的時(shí)間答案:BCD28.Yarn支持下列哪些調(diào)度器?A、MesosB、FIFOC、apacityD、Fair答案:BCD29.Flink支持的時(shí)間操作類型包括以下哪些選項(xiàng)?A、處理時(shí)間B、結(jié)束時(shí)間C、采集時(shí)間D、事件時(shí)間答案:AD30.Gs_dump和gs_dumpall的異同點(diǎn)是A、二者都支持純文本格式數(shù)據(jù)的導(dǎo)出。B、ds_dump只支持純文本格式的數(shù)據(jù)導(dǎo)出,dsdumpall支持多種數(shù)據(jù)格式的數(shù)據(jù)導(dǎo)出。C、二者都支持公共全局對(duì)象的數(shù)據(jù)導(dǎo)出。D、s_dump針對(duì)的是單個(gè)數(shù)據(jù)庫(kù),ds_dumpall針對(duì)的是所有數(shù)據(jù)庫(kù)。答案:ACD31.Elasticsearch的平衡算法可應(yīng)用于哪些場(chǎng)景?A、導(dǎo)入數(shù)據(jù)B、導(dǎo)出數(shù)據(jù)C、擴(kuò)容D、減容答案:ACD32.關(guān)于HBase組件的描述,正確的是?A、是一種NoSQL數(shù)據(jù)B、是分布式的C、是面向列的D、存儲(chǔ)數(shù)據(jù)是以K-v的形式答案:ACD33.以下關(guān)于華為云MRS海量數(shù)據(jù)離線分析場(chǎng)景描述正確的是哪幾項(xiàng)?A、利用Flink實(shí)現(xiàn)數(shù)據(jù)采集B、利用OBS實(shí)現(xiàn)低成本存儲(chǔ)C、利用Hive實(shí)現(xiàn)TB/PB級(jí)的數(shù)據(jù)分析D、通過(guò)可視化導(dǎo)入導(dǎo)出工具Lader,將數(shù)據(jù)導(dǎo)出到DWS,完成BI分析答案:BCD34.關(guān)于SparkSQL&Hive區(qū)別與聯(lián)系,下列說(shuō)法正確的是?A、SparkSQL依賴Hive的元數(shù)據(jù)B、SparkSQL的執(zhí)行引擎為SparkCore,Hive默認(rèn)執(zhí)行引擎為MapReduceSparkSQL不可以C、使用Hive的自定義函數(shù)D、SparkSQL兼容絕大部分Hive的語(yǔ)法和函數(shù)答案:ABD35.Hive的主要應(yīng)用于以下哪些場(chǎng)景?A、實(shí)現(xiàn)數(shù)據(jù)的流式處理B、海量數(shù)據(jù)的離線分析C、實(shí)現(xiàn)數(shù)據(jù)抽取、數(shù)據(jù)加載、數(shù)據(jù)轉(zhuǎn)換D、大規(guī)模的數(shù)據(jù)挖掘答案:BCD36.HBase可用于下列哪些應(yīng)用場(chǎng)景?A、時(shí)序數(shù)據(jù)存儲(chǔ)B、消息/訂單存儲(chǔ)C、好友推薦D、用戶畫(huà)像答案:ABD37.Hive可以創(chuàng)建托管表和外部表,關(guān)于這兩種表,以下描述正確的是哪些選項(xiàng)?A、使用外部表時(shí),執(zhí)行DROP操作時(shí),元數(shù)據(jù)和數(shù)據(jù)會(huì)被一起刪除B、使用托管表時(shí),執(zhí)行DROP操作時(shí),只刪除元數(shù)據(jù)C、使用托管表時(shí),執(zhí)行DROP操作時(shí),元數(shù)據(jù)和數(shù)據(jù)會(huì)被一起刪除D、使用外部表時(shí),執(zhí)行DROP操作時(shí),只刪除元數(shù)據(jù)答案:CD38.Flume采集海量日志數(shù)據(jù)時(shí),經(jīng)常會(huì)遇到性能瓶頸,可以通過(guò)以下哪些方式提升Flume性能?A、增加Source數(shù)量B、修改batchSize和capacityC、優(yōu)化FlumeGC參數(shù)D、增加Flume級(jí)聯(lián)節(jié)點(diǎn)答案:ABCD39.Flume由哪三部分組成?A、MasterB、SinkC、SourceD、Channel答案:BCD40.MergeTree用于高負(fù)載任務(wù)的最通用和功能最強(qiáng)大的表引擎,以下關(guān)于MergeTree的關(guān)鍵特征的描述,錯(cuò)誤的是哪些項(xiàng)?A、基于分區(qū)鍵的數(shù)據(jù)分區(qū)分塊存儲(chǔ)B、不支持?jǐn)?shù)據(jù)復(fù)制C、不支持?jǐn)?shù)據(jù)抽樣D、數(shù)據(jù)索引排序答案:BC41.以下關(guān)于Loaderserver的主要功能描述正確的有哪些選項(xiàng)?A、執(zhí)行Loader作業(yè)B、管理連接器和元數(shù)據(jù)C、處理客戶端請(qǐng)求D、監(jiān)控Loader作業(yè)狀態(tài)答案:BC42.下圖描述了RDD之間的依賴關(guān)系,其中有哪些是寬依賴?A、map:C->DB、groupby:A->BC、join:B&F->GD、union:D&E->F答案:BC43.Kafka中日志的清理方式包含以下哪些項(xiàng)?A、removeB、updateC、ompactD、elete答案:CD44.某電商平臺(tái)每天產(chǎn)生大量的交易訂單數(shù)據(jù),現(xiàn)在需要對(duì)這些數(shù)據(jù)中的交易金額做統(tǒng)計(jì),可能會(huì)用到如下哪些組件?A、MapReduceB、MySQLC、KafkaD、Flume答案:ABCD45.以下哪些選項(xiàng)不是企業(yè)的主數(shù)據(jù)?A、業(yè)務(wù)活動(dòng)產(chǎn)生的合同、計(jì)劃、單據(jù)等結(jié)果或規(guī)則數(shù)據(jù)B、經(jīng)過(guò)加工、計(jì)算、匯總后的指標(biāo)數(shù)據(jù)C、描述產(chǎn)品、客戶、人員、組織等業(yè)務(wù)實(shí)體的檔案數(shù)據(jù)D、生產(chǎn)線上由設(shè)備自動(dòng)采集的感知、檢測(cè)數(shù)據(jù)答案:AB46.Flink流式處理的數(shù)據(jù)源類型包括?A、SocketstreamsB、JDBCC、FilesD、Collections答案:ACD47.spark有哪些特點(diǎn)?A、輕B、靈C、快D、巧答案:ABCD48.下圖展示了HDFS的標(biāo)簽存儲(chǔ)策略,觀察下圖,HBase的數(shù)據(jù)會(huì)被存儲(chǔ)到哪些數(shù)據(jù)節(jié)點(diǎn)上?A、DataNodeBB、DataNodeEC、DataNodeCD、ataNodeA答案:AD49.以下關(guān)于建設(shè)私有云大數(shù)據(jù)平臺(tái)的痛點(diǎn)的描述,正確的是哪些項(xiàng)?A、安全性差,無(wú)災(zāi)備能力B、提前建設(shè),建設(shè)成本高C、維護(hù)難度大D、業(yè)務(wù)上線速度慢答案:ABCD50.以下哪些選項(xiàng)屬于clickHouse的表引擎?A、CollapsingMergeTreeB、GraphiteMergeTreeC、VersionedCollapsingMergeTreeD、AggregatingMergeTree答案:ABCD51.Flink的兼容性體現(xiàn)在以下哪些方面?A、能夠從本地獲取數(shù)據(jù)B、能夠與Hadoop原有的Mappers和Reducers混合使用C、能夠使用Hadoop的格式化輸入和輸出D、YARN能夠作為Flink集群的資源調(diào)度管理器答案:ABCD52.下列關(guān)于Hive基本操作命令的解釋正確的是哪些項(xiàng)?A、droptableifexistsT1://刪除表T1B、altertableT1renametT2://將表T1重命名為T2C、reatetableifnotexistsT1likeT2://拷貝T2表,包括表里的數(shù)據(jù),并命名為T1D、removetableT1whereid=1://刪除表中符合條件“id=1”的數(shù)據(jù)。答案:AB53.關(guān)于HDFS的NameNode的功能,以下描述錯(cuò)誤的是哪些項(xiàng)?A、維護(hù)了BlockID到DataNode本地文件的映射關(guān)系B、存儲(chǔ)文件內(nèi)容C、保存文件塊和DataNode之間的映射關(guān)系D、用于存儲(chǔ)元數(shù)據(jù)答案:AB54.ZKFC進(jìn)程部署在HDFS中的以下哪些節(jié)點(diǎn)上?A、ctiveNameNodeB、DataNodeC、StandbyNameNode答案:AC55.ZooKeeper的關(guān)鍵特性包括以下哪些選項(xiàng)?A、最終—致性B、可靠性C、等待無(wú)關(guān)性D、原子性答案:ABCD56.ZooKeeper是一個(gè)分布式、高可用性的協(xié)調(diào)服務(wù)。在大數(shù)據(jù)產(chǎn)品中主要提供的功能有哪些?A、幫助系統(tǒng)避免單點(diǎn)故障,建立可靠的應(yīng)用程序B、實(shí)現(xiàn)元數(shù)據(jù)持久化C、提供分布式協(xié)作服務(wù)和維護(hù)配置信息D、為集群提供高并發(fā)能力答案:ACD57.下列哪些措施是為了保障數(shù)據(jù)的完整性?A、元數(shù)據(jù)可靠性保證B、安全模式C、集群數(shù)據(jù)均衡D、重建失效數(shù)據(jù)盤的副本數(shù)據(jù)答案:ABCD58.HBase中包含的一些典型的Filter有哪些?A、SingleColumValueFilterB、RowFilterC、KeyOnlyFilterD、FilterList答案:ABC59.以下哪些選項(xiàng)屬于數(shù)據(jù)地圖支持的功能?A、可以根據(jù)表名直接查看表詳情B、可以通過(guò)關(guān)鍵詞搜索數(shù)據(jù)資產(chǎn)C、通過(guò)血緣分析可以查看每個(gè)數(shù)據(jù)表的來(lái)源、去向D、通過(guò)血緣分析可以查看每個(gè)表及字段的加工邏輯、答案:ABCD60.Flink的時(shí)間窗口根據(jù)實(shí)現(xiàn)原理的不同可分為以下哪些窗口?A、會(huì)話窗口(SessionWindow)B、滾動(dòng)窗口(TumblingWindow)C、滑動(dòng)窗口(SlidingWindowD、計(jì)數(shù)窗口(CountWindow答案:ABC61.以下關(guān)于Flink容錯(cuò)機(jī)制描述錯(cuò)誤的有哪些?A、Savepoint機(jī)制保證了程序在進(jìn)行升級(jí)或者修改并發(fā)度等情況后,還能從保存的狀態(tài)位繼續(xù)啟動(dòng)恢復(fù)B、Checkpoint機(jī)制保證了程序在進(jìn)行升級(jí)或者修改并發(fā)度等情況后,還能從保存的狀態(tài)位繼續(xù)啟動(dòng)恢復(fù)C、Savepoint機(jī)制保證了實(shí)時(shí)程序運(yùn)行時(shí),即使突然遇到異常也能夠進(jìn)行自我恢復(fù)D、checkpoint機(jī)制保證了實(shí)時(shí)程序運(yùn)行時(shí),即使突然遇到異常也能夠進(jìn)行自我恢復(fù)答案:BC62.structuredstreaming在OutPut階段可以定義不同的數(shù)據(jù)寫(xiě)入方式,包括下列喝些方式?A、GeneralModeB、UpdateModeC、AppendModeD、CompleteMode答案:BCD63.HDFS中,抽象的塊可以帶來(lái)哪些好處?A、支持大規(guī)模文件存儲(chǔ)B、滿足I0密集型應(yīng)用的性能要求C、簡(jiǎn)化系統(tǒng)設(shè)計(jì)D、適合數(shù)據(jù)備份答案:ACD64.ElasticSearch對(duì)有結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化類型的數(shù)據(jù)有哪些處理能力?A、寫(xiě)入的數(shù)據(jù)可以實(shí)時(shí)的進(jìn)行檢索B、進(jìn)行清洗、分詞、建立倒排索引等—系列操作C、提供全文檢索的能力,條件可以包括詞或短語(yǔ)D、數(shù)據(jù)寫(xiě)入時(shí)可選重刪和壓縮功能答案:ABC65.Spark發(fā)生Shuffle時(shí)會(huì)延長(zhǎng)任務(wù)執(zhí)行時(shí)間,下列哪些選項(xiàng)能夠不能減少shuffle次數(shù)?A、更換shuffle機(jī)制B、增強(qiáng)集群性能快速執(zhí)行shuffleC、多用transformation算子少用action算子D、避免使用groupBy、reduceByKey等可產(chǎn)生寬依賴的算子答案:AB66.在MRS集群中,Spark主要與以下哪些組件進(jìn)行交互?A、YARNB、HiveC、HdfsD、ZooKeeper答案:ABC67.以下關(guān)于Hive的描述,正確的有哪些選項(xiàng)?A、對(duì)數(shù)據(jù)的ETL過(guò)程自動(dòng)化B、可直接訪問(wèn)HDFS文件以及HBase。C、可以查詢和管理PB級(jí)別的分布式數(shù)據(jù)D、支持Tez,Spark等多種計(jì)算引擎答案:ABCD68.以下哪些選項(xiàng)屬于數(shù)據(jù)治理模塊域?A、數(shù)據(jù)集成B、數(shù)據(jù)服務(wù)C、數(shù)據(jù)開(kāi)發(fā)D、主數(shù)據(jù)管理答案:ABCD69.下列哪些查詢場(chǎng)景使用列存儲(chǔ)更合適?A、條件查詢B、分組查詢C、點(diǎn)查詢D、聚合查詢答案:BD70.數(shù)據(jù)節(jié)點(diǎn)是HDFS的工作節(jié)點(diǎn),以下描述哪些是其功能?A、根據(jù)客戶端或者是名稱節(jié)點(diǎn)的調(diào)度來(lái)進(jìn)行數(shù)據(jù)的存儲(chǔ)和檢索B、向名稱節(jié)點(diǎn)定期發(fā)送自己所存儲(chǔ)的塊的列表。C、負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)和讀取D、記錄了所有針對(duì)文件的創(chuàng)建、刪除、重命名等操作答案:ABC71.下列選項(xiàng)中,哪些是Spark的重要角色?A、DriverB、NodeManagerC、ResourceManagerD、ataNode答案:ABC72.下列哪些選頂對(duì)HBase,讀寫(xiě)數(shù)據(jù)的過(guò)程描述正確?A、客戶端讀取數(shù)據(jù)不需要HMaster參與B、客戶端可以維護(hù)已訪問(wèn)過(guò)的Region位置信息加快查詢C、客戶端讀取數(shù)據(jù)需要HMaster參與D、客戶端不可以維護(hù)已訪問(wèn)過(guò)的Region位置信息加快查詢答案:AB73.客戶端是用戶操作HDFS最常用的方式,以下關(guān)于HDFS客戶端的描述正確的有哪些?A、客戶端可以支持打開(kāi)、讀取、寫(xiě)入等常見(jiàn)的操作B、HDFS客戶端是一個(gè)庫(kù),包含HDFS文件系統(tǒng)接,這些接隱藏了HDFS實(shí)現(xiàn)中的大部分復(fù)雜性C、HDFS客戶端提供了類似Shell的命令行方式來(lái)訪問(wèn)HDFS中的數(shù)據(jù)D、客戶端是HDFS的一部分,是部署HDFS的必備組件答案:ABCD74.Kafka中Partition對(duì)應(yīng)的Leader宕機(jī)時(shí),需要從Follower中選舉出新Leader。當(dāng)所有Replica都不工作時(shí),對(duì)數(shù)據(jù)及時(shí)間要求不高的情況下,以下哪些方案可行?A、等待ISR中的任一個(gè)Replica活過(guò)來(lái),并選它作為L(zhǎng)eaderB、在配置中增加Replica副本數(shù)量C、選擇第一個(gè)活過(guò)來(lái)的Replica(不一定是ISR成員)作為L(zhǎng)eaderD、重啟Kafka集群答案:AC75.MRS服務(wù)中,通過(guò)Loader數(shù)據(jù)轉(zhuǎn)換引擎,可實(shí)現(xiàn)數(shù)據(jù)的哪些操作?A、字符串剪切B、字段類型轉(zhuǎn)換C、字符串反序D、字段合并答案:ACD76.Spark與MapReduce進(jìn)行比較,下列說(shuō)法正確的是哪幾項(xiàng)?A、Spark任務(wù)的中間結(jié)果只能存儲(chǔ)在內(nèi)存B、Spark任務(wù)中shuffle不是必須的過(guò)程C、Spark任務(wù)中shuffle是必須的過(guò)程D、Spark可以緩存中間結(jié)果在內(nèi)存降低磁盤lO答案:BD77.調(diào)用ZooKeeper客戶端命令中包含哪些信息?A、用戶名B、端口號(hào)C、服務(wù)器名稱D、lp地址答案:BD78.若HDFS單名稱節(jié)點(diǎn)部署,可能存在哪些局限性?A、景影響基于HDFS的上層組件的功能實(shí)現(xiàn)B、整個(gè)分布式文件系統(tǒng)的吞吐量,受限于單個(gè)名稱節(jié)點(diǎn)的吞吐量C、一旦這個(gè)唯一的名稱節(jié)點(diǎn)發(fā)生故障,會(huì)導(dǎo)致整個(gè)集群不可用D、名稱節(jié)點(diǎn)能夠容納的對(duì)象(文件、塊)的個(gè)數(shù)會(huì)受到內(nèi)存空間大小的限制答案:BCD79.MRS在基于ApacheHadoop開(kāi)源軟件的基礎(chǔ)上,在主要業(yè)務(wù)部件的可靠性、性能調(diào)優(yōu)等方面進(jìn)行了優(yōu)化和提升。以下關(guān)于MRS平臺(tái)的描述,正確的是哪些項(xiàng)?A、MRS支持將Manager、HBase上的數(shù)據(jù)自動(dòng)備份到第三方服務(wù)器B、MRS支持自動(dòng)處理網(wǎng)絡(luò)故障,自動(dòng)恢復(fù)受影響的業(yè)務(wù)。C、在系統(tǒng)進(jìn)行擴(kuò)容、打補(bǔ)丁等重大操作前,需要通過(guò)手動(dòng)備份集群管理系統(tǒng)的數(shù)據(jù),以便在系統(tǒng)故障時(shí),恢復(fù)集群管理系統(tǒng)功能,D、MRS對(duì)集群管理系統(tǒng)Manager上的數(shù)據(jù)提供自動(dòng)備份功能,根據(jù)制定的備份策略可自動(dòng)備份集群上的數(shù)據(jù)。答案:BCD80.ElasticSearch支持以下哪些訪問(wèn)接?A、PUTB、POSTC、DELETED、GET答案:ABCD81.數(shù)據(jù)操縱語(yǔ)言DML是包括以下哪些字句?A、查找:SELECTB、刪除:DELETEC、插入:INSERTD、更新:UPDATE答案:BCD82.下列關(guān)于Flink中Transformation的說(shuō)法正確的是?A、可以通過(guò)window設(shè)定時(shí)間窗口B、flatMap可以對(duì)文本進(jìn)行切分C、keyBy是將源頭數(shù)據(jù)按照key進(jìn)行分組,以保證同一個(gè)key的源數(shù)據(jù)分到同樣的組中D、filter操作是對(duì)每個(gè)元素執(zhí)行boolean函數(shù)答案:ABCD83.在Kafka中,以下消息傳輸語(yǔ)義中不會(huì)導(dǎo)致消息丟失的是哪些選項(xiàng)?A、最多一次(AtMostOnce)B、最少一次(AtLeaseOnce)C、超過(guò)一次(MoreThanOnce)D、僅有一次(ExactlyOnce)答案:BD84.以下關(guān)于傳統(tǒng)數(shù)據(jù)入湖面臨的挑戰(zhàn)的描述,正確的是哪些項(xiàng)?A、開(kāi)發(fā)難B、成本高C、時(shí)效差D、資源利用率低答案:BCD85.FusionInsightHD產(chǎn)品在部署Kerberos和LDAP服務(wù)時(shí),以下描述正確的是?A、部署Kerberos服務(wù)之前,必須先部署LDAP服務(wù)B、LDAP服務(wù)必須和Kerberos服務(wù)部署在同一個(gè)節(jié)點(diǎn)C、Kerberos服務(wù)和LDAP服務(wù)部署同一個(gè)節(jié)點(diǎn)利于數(shù)據(jù)訪問(wèn),有助于性能提升D、LDAP服務(wù)可以多個(gè)集群共享答案:AC86.以下關(guān)于Hive架構(gòu)中的組件功能,描述正確的是哪些選項(xiàng)?A、Executor負(fù)責(zé)編譯HiveQL并將其轉(zhuǎn)化為一系列相互依賴的Map/Reduce任務(wù)B、Thriftserver提供thrift接,作為JDBC的服務(wù)端,并將Hive和其他應(yīng)用程序集成起來(lái)CompilerC、按照任務(wù)的依賴關(guān)系分別執(zhí)行Map/Reduce任務(wù)D、Optimizer是優(yōu)化器,分為邏輯優(yōu)化器和物理優(yōu)化器,分別對(duì)HiveQL生成的執(zhí)行計(jì)劃和MapReduce任務(wù)進(jìn)行優(yōu)化答案:ABCD87.某電商公司同時(shí)運(yùn)行MapReduce離線分析任務(wù)和Spark實(shí)時(shí)分析任務(wù),若使用Yarn的Capacity調(diào)度器,資源分配如何進(jìn)行?A、離線分析任務(wù)和實(shí)時(shí)分析任務(wù)安排在不同隊(duì)列且優(yōu)先滿足實(shí)時(shí)分析任務(wù)的資源需求B、離線分析任務(wù)和實(shí)時(shí)分析任務(wù)安排在同一隊(duì)列C、離線分析任務(wù)和實(shí)時(shí)分析任務(wù)安排在同一隊(duì)列且優(yōu)先滿足實(shí)時(shí)分析任務(wù)的資源需求D、離線分析任務(wù)和實(shí)時(shí)分析任務(wù)安排在不同隊(duì)列答案:AD88.HBase中以下哪種場(chǎng)景會(huì)觸發(fā)Flush操作?A、HBase定期刷新Memstore,默認(rèn)周期為1小時(shí)B、當(dāng)WALs中文件數(shù)量達(dá)到閾值時(shí)C、Region中MemStore的總大小,達(dá)到了預(yù)設(shè)的FlushSize閾值D、MemStore占用內(nèi)存的總量和RegionServer總內(nèi)存比值超出了預(yù)設(shè)的閾值大小答案:BCD89.FusionlnsightManager的主要功能有以下哪些?A、數(shù)據(jù)集成B、系統(tǒng)管理C、安全管理D、服務(wù)治理答案:BCD90.執(zhí)行HBase讀數(shù)據(jù)業(yè)務(wù),需要讀取哪幾部分?jǐn)?shù)據(jù)?A、MemStoreB、HLOgC、HFileD、HMaster答案:AC91.下面哪些是Elasticsearch的特點(diǎn)?A、高可靠性B、高容錯(cuò)性C、高性能D、高擴(kuò)展性答案:ACD92.下列屬于Dws的典型應(yīng)用場(chǎng)景的是A、數(shù)據(jù)集市B、CRM/ERPC、交易系統(tǒng)D、企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)答案:ABCD93.以下哪些屬于企業(yè)級(jí)大數(shù)據(jù)的應(yīng)用場(chǎng)景?A、內(nèi)部運(yùn)營(yíng)管理B、營(yíng)銷分析C、客戶分析D、供應(yīng)鏈管理答案:ABCD判斷題1.Zookeeper選舉時(shí),當(dāng)某一個(gè)實(shí)例獲得了半數(shù)以上的票數(shù)時(shí),則變?yōu)閘eaderA、正確B、錯(cuò)誤答案:A2.topology的處理邏輯都在bolt中,A、正確B、錯(cuò)誤答案:A3.ClickHuse完全使用SQL作為查詢語(yǔ)言,提供了標(biāo)準(zhǔn)協(xié)議的SQL查詢接A、正確B、錯(cuò)誤答案:A4.Flume是一種分布式,高可靠且高可用的服務(wù),用于有效地收集、聚合和移動(dòng)大量日志數(shù)據(jù)A、正確B、錯(cuò)誤答案:A5.Flume-NG由一個(gè)個(gè)agent來(lái)組成,而每個(gè)agent由Source,Channel,sink三個(gè)模塊組成。其中Source負(fù)責(zé)接收數(shù)據(jù).Channel負(fù)責(zé)數(shù)據(jù)的傳輸,sink則負(fù)責(zé)數(shù)據(jù)向下一端的發(fā)送。A、正確B、錯(cuò)誤答案:A6.在MapReduce編程中,業(yè)務(wù)邏輯一般需要自行寫(xiě)代碼實(shí)現(xiàn)mapper和reducer聲斯頤A、正確B、錯(cuò)誤答案:A7.在點(diǎn)對(duì)點(diǎn)消息系統(tǒng)中,可由一個(gè)或多個(gè)消費(fèi)者消費(fèi)隊(duì)列中的數(shù)據(jù),但是一條消息只能被消費(fèi)一次A、正確B、錯(cuò)誤答案:A8.HBase中penscanner的過(guò)程,會(huì)創(chuàng)建兩種不同的Scanner來(lái)讀取H-File和Memstore的數(shù)據(jù)。HFile對(duì)應(yīng)的Scanner為StoreFileScanner;Memstore對(duì)應(yīng)的Scanner為Memstorescanner.A、正確B、錯(cuò)誤答案:A9.容量調(diào)度器在進(jìn)行資源分配時(shí),現(xiàn)有同級(jí)的2個(gè)列隊(duì)Q1和Q2,它們的容量均為30,其中Q1已使用8,Q2已使用14,則會(huì)優(yōu)先將資源分配給Q1。A、正確B、錯(cuò)誤答案:B10.MapReduce過(guò)程中,默認(rèn)情況下,一個(gè)分片就是一個(gè)塊,也是一個(gè)MapTaskA、正確B、錯(cuò)誤答案:A11.Yarn作為MapReduce的資源管理器,其依賴HDFS.A、正確B、錯(cuò)誤答案:B12.MRS服務(wù)100%兼容開(kāi)源大數(shù)據(jù)生態(tài),結(jié)合周邊豐富的數(shù)據(jù)及應(yīng)用遷移工具,能幫助客戶快速完成自建平臺(tái)的平滑遷移,整個(gè)遷移過(guò)程可做到“代碼修改,業(yè)務(wù)0中斷”。A、正確B、錯(cuò)誤答案:A13.客戶端往任意Zookeeper節(jié)點(diǎn)寫(xiě)數(shù)據(jù)Zookeeper需要將數(shù)據(jù)完全同步到其他節(jié)點(diǎn),才可以返回給客戶端寫(xiě)成功。A、正確B、錯(cuò)誤答案:B14.Elasticsearch默認(rèn)是先把索引存放到內(nèi)存中,當(dāng)內(nèi)存滿了時(shí)再持久化到本地硬盤A、正確B、錯(cuò)誤答案:A15.Kafka中,每個(gè)Consumer都屬于-個(gè)ConsumerGroup,每條消息只能被ConsumerGroup中的一個(gè)Consumer消費(fèi),但可以被多個(gè)ConsumerGroup消。A、正確B、錯(cuò)誤答案:A16.Kafka中,Leader主要負(fù)責(zé)監(jiān)控Fo1lower的運(yùn)行狀態(tài),F(xiàn)o1lower主要負(fù)責(zé)數(shù)據(jù)的讀寫(xiě)A、正確B、錯(cuò)誤答案:B17.Flink用Datastrean來(lái)表示程序中的流式數(shù)據(jù),用戶可以認(rèn)為它們是含有重復(fù)數(shù)據(jù)的可修改的集合(collection),Datastream中元素的數(shù)量是無(wú)限的。A、正確B、錯(cuò)誤答案:A18.Spark任務(wù)的每個(gè)stage劃分為幾個(gè)Job,劃分的標(biāo)記是shuffle.A、正確B、錯(cuò)誤答案:A19.ClickHouse是俄羅斯yandex公司開(kāi)發(fā)的OLTP數(shù)據(jù)庫(kù)管理系統(tǒng)A、正確B、錯(cuò)誤答案:B20.Kafka將Topic分成一個(gè)或者多個(gè)Partition,每個(gè)Partition在物理上對(duì)應(yīng)個(gè)文件夾,該文件夾下存儲(chǔ)這個(gè)Partition的所有消息。A、正確B、錯(cuò)誤答案:A21.HBase的BloomFilter是用來(lái)過(guò)濾數(shù)據(jù)的A、正確B、錯(cuò)誤答案:B22.Flume在傳輸數(shù)據(jù)過(guò)程中,如果下一跳的Flume節(jié)點(diǎn)故障或者數(shù)據(jù)接受異常時(shí),可以自動(dòng)切換到另外一路上繼續(xù)傳輸。A、正確B、錯(cuò)誤答案:A23.數(shù)據(jù)質(zhì)量要求各業(yè)務(wù)部門對(duì)相應(yīng)數(shù)據(jù)領(lǐng)域的數(shù)據(jù)質(zhì)量全權(quán)負(fù)責(zé),按業(yè)務(wù)需求設(shè)計(jì)數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn),制定數(shù)據(jù)質(zhì)量管控目標(biāo),并道循企業(yè)數(shù)據(jù)治理費(fèi)求進(jìn)行數(shù)據(jù)質(zhì)量度量,制定符合各自業(yè)務(wù)情況的數(shù)據(jù)質(zhì)量政策及數(shù)據(jù)質(zhì)量相關(guān)的改進(jìn)計(jì)劃,持續(xù)進(jìn)行數(shù)據(jù)質(zhì)量管控A、正確B、錯(cuò)誤答案:A24.ResourceManager采用高可用方案,當(dāng)ActiveResourceManager發(fā)現(xiàn)故障時(shí),只能通過(guò)內(nèi)置的Zookeeper來(lái)啟動(dòng)Standby的ResourceManager.將其狀態(tài)切換為Active.A、正確B、錯(cuò)誤答案:B25.ApplicationMaster采用輪詢的方式通過(guò)RPC協(xié)議向ResourceManager申請(qǐng)和領(lǐng)取資源A、正確B、錯(cuò)誤答案:A26.大數(shù)據(jù)體量的不斷增加,對(duì)數(shù)據(jù)存儲(chǔ)理安全性要求越來(lái)越高,對(duì)數(shù)據(jù)的多副本與容災(zāi)機(jī)制也提出更高的要求,A、正確B、錯(cuò)誤答案:A27.在FusioninsightHD系統(tǒng),Loader作業(yè)運(yùn)行過(guò)程中,如果產(chǎn)生臟數(shù)據(jù),Loader作業(yè)執(zhí)行結(jié)果的狀態(tài)-定是失敗。A、正確B、錯(cuò)誤答案:B28.Distributed表引擎本身不存儲(chǔ)任何數(shù)據(jù),而是作為數(shù)據(jù)分片的透明代理,能夠自動(dòng)路由數(shù)據(jù)到集群中的各個(gè)節(jié)點(diǎn),分布式表需要和其他本地?cái)?shù)據(jù)表一起協(xié)同工作。A、正確B、錯(cuò)誤答案:A29.Spark的中間數(shù)據(jù)放在內(nèi)存中,對(duì)于迭代運(yùn)算、批處理計(jì)算的效率更高,延遲更高A、正確B、錯(cuò)誤答案:B30.structuredstreaming接收結(jié)構(gòu)化數(shù)據(jù)流生成無(wú)邊界表,隨著時(shí)間積累該表越來(lái)越大最終會(huì)導(dǎo)致數(shù)據(jù)過(guò)大無(wú)法計(jì)算。A、正確B、錯(cuò)誤答案:B31.HBase組件中,數(shù)據(jù)讀寫(xiě)服務(wù)需要連接Master執(zhí)行:A、正確B、錯(cuò)誤答案:B32.MapReduce某一任務(wù)失敗時(shí)可通過(guò)重試機(jī)制重新計(jì)算該任務(wù)。A、正確B、錯(cuò)誤答案:A33.在DataArtsStudio平臺(tái)中,支持自定義業(yè)務(wù)元模型,批量導(dǎo)入業(yè)務(wù)元數(shù)據(jù),關(guān)聯(lián)業(yè)務(wù)和技術(shù)元數(shù)據(jù)、全鏈路的血緣管理和應(yīng)用。A、正確B、錯(cuò)誤答案:A34.在VARN的任務(wù)調(diào)度中,一旦ApplicationMaster申請(qǐng)到資源后,便與對(duì)應(yīng)的ResourceManager通信,要求它啟動(dòng)任務(wù)A、正確B、錯(cuò)誤答案:A35.SparkStreaming容錯(cuò)機(jī)制是指RDD中任意的Partition出錯(cuò),都可以根據(jù)其父RDD重新計(jì)算生成,如果父RDD丟失,則需要去磁盤中查找原始數(shù)據(jù)。A、正確B、錯(cuò)誤答案:B36.Hive是建立在Hadoop上的數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)構(gòu)架。它提供了一系列的工具,可以用來(lái)進(jìn)行數(shù)據(jù)提取轉(zhuǎn)化加載(ETL),這是一種可以存儲(chǔ)、查詢和分析存儲(chǔ)在Hadoop中的大規(guī)模數(shù)據(jù)的機(jī)制。A、正確B、錯(cuò)誤答案:A37.MRS會(huì)保存用戶設(shè)置的登錄Master節(jié)點(diǎn)的初始密碼。為避免被惡意攻擊,建議設(shè)置復(fù)雜度高的密碼A、正確B、錯(cuò)誤答案:A38.ElasticSearch的倒排索引所采用的排序方式,是通過(guò)Value找Key。在全文搜索中Value就是要搜索的關(guān)鍵詞,通過(guò)Vaue找到對(duì)應(yīng)的文檔。A、正確B、錯(cuò)誤答案:A39.華為云眼鵬云服務(wù)基于跟鵬處理器等多元基礎(chǔ)設(shè)施,涵蓋裸機(jī),虛機(jī),容器等形態(tài),具備多核高并發(fā)特點(diǎn),非常適合AI、大數(shù)據(jù)、HPC、云手機(jī)/云游戲等場(chǎng)景。A、正確B、錯(cuò)誤答案:A40.概念視圖里HBase表可以被看成是一個(gè)稀疏的行的集合A、正確B、錯(cuò)誤答案:A41.HDFS中,塊(Block)的大小遠(yuǎn)遠(yuǎn)大于曾通文件系統(tǒng)的最小單元,可以最小化尋址開(kāi)銷.A、正確B、錯(cuò)誤答案:A42.HBase數(shù)據(jù)的存儲(chǔ)在物理上是分列族存儲(chǔ)的A、正確B、錯(cuò)誤答案:A43.RDB支持索引,HBase不支持索引。A、正確B、錯(cuò)誤答案:B44.為減少寫(xiě)入磁盤的數(shù)據(jù)量,MapReduce支持對(duì)MOF(MapOutFile)進(jìn)行壓縮后再寫(xiě)入。A、正確B、錯(cuò)誤答案:A45.Kafka的Producer和Customer數(shù)量必須相同A、正確B、錯(cuò)誤答案:B46.MySQL引擎用于將遠(yuǎn)程的MySQL服務(wù)器中的表映射到clickHouse中,并允許您對(duì)表進(jìn)行INSERT和SELECT查詢,以方便您在clickHouse與MySqL之間進(jìn)行數(shù)據(jù)交換。A、正確B、錯(cuò)誤答案:A47.數(shù)據(jù)集市與數(shù)據(jù)湖最大的區(qū)別是,各個(gè)集市的數(shù)據(jù)無(wú)法互通,也可能存在重復(fù),相比數(shù)據(jù)湖,數(shù)據(jù)集市更像一個(gè)個(gè)數(shù)據(jù)煙囪。A、正確B、錯(cuò)誤答案:A48.數(shù)據(jù)質(zhì)量監(jiān)控DQC(DataQualityControl)模塊是對(duì)數(shù)據(jù)庫(kù)里的數(shù)據(jù)質(zhì)量進(jìn)行質(zhì)量管理的工具,可以從完整性、有效性、及時(shí)性、一致性、準(zhǔn)確性、唯一性六個(gè)維度進(jìn)行單列、跨列、跨行和跨表的分析。A、正確B、錯(cuò)誤答案:A49.ZooKeeper支持對(duì)多個(gè)C1ickHouseserver進(jìn)行負(fù)載均,提高應(yīng)用接入的高可靠性A、正確B、錯(cuò)誤答案:A50.大數(shù)據(jù)體量的不斷增加,對(duì)數(shù)據(jù)存儲(chǔ)的物理安全性要求越來(lái)越高,對(duì)數(shù)據(jù)的多副本與容災(zāi)機(jī)制也提出更高的要求A、正
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023試用期合同協(xié)議書(shū)七篇
- 2025交通事故自行調(diào)解書(shū)協(xié)議書(shū)12篇
- 個(gè)人股權(quán)轉(zhuǎn)讓協(xié)議書(shū)七篇
- 個(gè)人土地轉(zhuǎn)租協(xié)議范本
- 關(guān)注細(xì)節(jié)的“管理新星”-記工程局勞動(dòng)模范經(jīng)管部部長(zhǎng)孫獻(xiàn)龍
- 跖疣病因介紹
- 四大名著之紅樓春趣經(jīng)典解讀2
- 2023-2024學(xué)年天津市河北區(qū)高二(上)期末語(yǔ)文試卷
- 2023年天津市靜海一中高考語(yǔ)文模擬試卷(一)
- 重慶2020-2024年中考英語(yǔ)5年真題回-教師版-專題02 完形填空
- 生命智能學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 專項(xiàng)14-因式分解-專題訓(xùn)練(50道)
- 中華傳統(tǒng)文化之戲曲瑰寶學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 結(jié)構(gòu)化面試的試題及答案
- 新一代信息技術(shù)導(dǎo)論-教案-1章 新一代信息技術(shù)概述
- 2024秋期國(guó)家開(kāi)放大學(xué)《建筑工程項(xiàng)目招投標(biāo)與合同管理》一平臺(tái)在線形考(形考作業(yè)1至4)試題及答案
- 中標(biāo)結(jié)果質(zhì)疑函
- 期末測(cè)試(試題)-2024-2025學(xué)年六年級(jí)上冊(cè)語(yǔ)文統(tǒng)編版
- 2024秋期國(guó)家開(kāi)放大學(xué)專科《監(jiān)督學(xué)》一平臺(tái)在線形考(形成性考核一至四)試題及答案
- QC080000培訓(xùn)資料課件
- 統(tǒng)編版語(yǔ)文二年級(jí)上冊(cè)口語(yǔ)交際做手工 公開(kāi)課一等獎(jiǎng)創(chuàng)新教案
評(píng)論
0/150
提交評(píng)論