HCIP大數(shù)據(jù)練習(xí)測(cè)試題附答案_第1頁
HCIP大數(shù)據(jù)練習(xí)測(cè)試題附答案_第2頁
HCIP大數(shù)據(jù)練習(xí)測(cè)試題附答案_第3頁
HCIP大數(shù)據(jù)練習(xí)測(cè)試題附答案_第4頁
HCIP大數(shù)據(jù)練習(xí)測(cè)試題附答案_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第頁HCIP大數(shù)據(jù)練習(xí)測(cè)試題附答案1.以下關(guān)于SparkSQL中DataSet的描述中,錯(cuò)誤的是哪一項(xiàng)?A、DataSet是一個(gè)由特定域的對(duì)象組成的強(qiáng)類型集合。B、DataSet是"懶惰"的,只在執(zhí)行A,Ction操作時(shí)觸發(fā)計(jì)算C、DataSet需要反序列化才可以執(zhí)行大部分操作。DataSet與RDD高度類似【正確答案】:C2.StructuredStreaming中持續(xù)地查詢最新計(jì)算結(jié)果至寫出。這個(gè)過程叫做什么?()A、ContinuousstringB、continousqueryC、mapqueryD、continousphrase【正確答案】:B3.關(guān)于ElasticSearch的說法,下列錯(cuò)誤的是哪一項(xiàng)?A、不支持非結(jié)構(gòu)化數(shù)據(jù)B、對(duì)Lucene進(jìn)行了擴(kuò)展C、原型環(huán)境和生產(chǎn)環(huán)境可無縫切換D、能夠水平擴(kuò)展【正確答案】:A4.以下哪一項(xiàng)不屬于目前經(jīng)常定義的Sink類型。A、ElasticSearchSinkB、RedisSinkC、KafkaSinkD、ODBCSink【正確答案】:D5.在大數(shù)據(jù)業(yè)務(wù)處理的場(chǎng)景中,常常說不適合存儲(chǔ)大量的小文件。這主要是受以下哪個(gè)組件的影響?A、YarnB、HDFSC、HiveD、MapReduce【正確答案】:B6.下列哪一項(xiàng)是HBase不適合的應(yīng)用場(chǎng)景?A、要求具有完全A,CID特性的應(yīng)用場(chǎng)景。B、半結(jié)構(gòu)化數(shù)據(jù)應(yīng)用場(chǎng)景。C、高吞吐率應(yīng)用場(chǎng)景。D、海量數(shù)據(jù)(TE、PF、應(yīng)用場(chǎng)景【正確答案】:A7.以下關(guān)于Flink的描述,錯(cuò)誤的是哪一項(xiàng)?A、Flink在維護(hù)一次完整的的應(yīng)用狀態(tài)時(shí),不能無縫修復(fù)錯(cuò)誤B、Flink是一個(gè)批處理和流處理結(jié)合的統(tǒng)一計(jì)算框架C、Flink支持大規(guī)模運(yùn)行,在上千個(gè)節(jié)點(diǎn)運(yùn)行時(shí)有很好的吞吐量和低延遲D、Flink沒有單點(diǎn)故障,提供高吞吐量和低延遲的能力【正確答案】:A8.StructuredStreaming程序執(zhí)行過程中,定義流計(jì)算過程之后是哪一個(gè)步驟?A、創(chuàng)建輸入數(shù)據(jù)源B、導(dǎo)入相關(guān)依賴模塊C、啟動(dòng)流計(jì)算并計(jì)算輸出結(jié)果D、創(chuàng)建SparkSession對(duì)象【正確答案】:C9.以下哪一選項(xiàng)不是企業(yè)級(jí)大數(shù)據(jù)平臺(tái)的特點(diǎn)?A、可維護(hù)性差B、可平滑拓展C、數(shù)據(jù)共享D、資源共享【正確答案】:A10.實(shí)時(shí)檢索應(yīng)用場(chǎng)景不包含以下哪一順?A、通過用戶姓名查找購房記錄B、通過用戶銀行卡號(hào)查找轉(zhuǎn)賬記錄C、通過用戶興趣愛好推薦影視作品D、通過用戶身份證號(hào)查找住宿記錄【正確答案】:C11.下列關(guān)于Hive自定義函數(shù)的描述中,正確的是哪一項(xiàng)?A、一般自行編寫的函數(shù)都屬于臨時(shí)函數(shù),每次使用都需要重新創(chuàng)建B、如果創(chuàng)建的函數(shù)名與內(nèi)置的函數(shù)名重復(fù),在使用過程中以內(nèi)置的函數(shù)名為主。C、一般自行編寫的函數(shù)都屬于永久函數(shù),直接引用即可。D、Hive中的min以及max屬于UDAF函數(shù)。【正確答案】:A12.HiveSQL中DDL指定是哪一種語言?A、數(shù)據(jù)刪除語言B、數(shù)據(jù)查詢語言C、數(shù)據(jù)管理語言D、數(shù)據(jù)定義語言【正確答案】:D13.Flume的應(yīng)用中,如果要保證sink的負(fù)載均衡,需要使用以下哪一個(gè)組件?A、DefaultSinkProcessorB、StaticInterceptorC、ReplicatingChannelSelectorD、FailoverSinkProcessor【正確答案】:A14.以下哪一選項(xiàng)不是大數(shù)據(jù)的特點(diǎn)?A、容量大B、種類多C、速度快D、結(jié)構(gòu)單一【正確答案】:D15.Hive中詳細(xì)顯示函數(shù)的用法為以下哪一選項(xiàng)?A、hive>getfunctions;B、hive>descfunctionextendedupper;C、hive>descfunctionupper;D、hive>showfunctions;【正確答案】:B16.GES基于ElasticSearch于的索引機(jī)制,能根據(jù)索引快速查詢數(shù)據(jù)。A、對(duì)(參考答案)B、錯(cuò)【正確答案】:A17.以下哪一項(xiàng)不屬于圖搜索引擎技術(shù)的典型應(yīng)用場(chǎng)景?A、通過關(guān)系網(wǎng)絡(luò),查詢關(guān)聯(lián)關(guān)系,可用于反洗錢、風(fēng)控等場(chǎng)景B、根據(jù)某人的常用聯(lián)系人網(wǎng)絡(luò),查詢其社交關(guān)系最密切的有關(guān)人員C、基于"人、事、地、物、組織、身份"等點(diǎn)狀實(shí)體,查詢?cè)谏鐣?huì)關(guān)系網(wǎng)絡(luò)中的關(guān)聯(lián)關(guān)系D、根據(jù)歷史數(shù)據(jù),擬合函數(shù),預(yù)測(cè)未來手機(jī)流量使用趨勢(shì)【正確答案】:D18.以下關(guān)于HBase緩存刷新的說法中,哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、系統(tǒng)會(huì)周期性地把MemStore緩存里的內(nèi)容刷寫到磁盤的StoreFile文件中,清空緩存,并在Hlog里面寫入一個(gè)標(biāo)記B、每個(gè)HRegionServer都有一個(gè)自己的HLog文件,每次啟動(dòng)都檢查該文件C、如果發(fā)現(xiàn)最近一次執(zhí)行緩存刷新操作之后發(fā)生新的寫入操作,則先寫入MemStore,再刷寫到StoreFileD、每次刷寫都生成一個(gè)新的StoreFile文件,但每個(gè)Store中僅包含一個(gè)StoreFile文件【正確答案】:D19.以下有關(guān)Hive多表關(guān)聯(lián)的描述,正確的是哪一個(gè)選項(xiàng)?A、Hive最右邊的表是大表,且無法通過命令指定哪張表是大表B、Hive在進(jìn)行多表關(guān)聯(lián)時(shí),從右往左進(jìn)行關(guān)聯(lián)操作C、在HiveSQL中,建議把小表寫在右邊,這樣可以提高執(zhí)行效率D、一般情況下有多少張表進(jìn)行join連接操作,就會(huì)啟動(dòng)多少個(gè)MapReduce任務(wù)【正確答案】:B20.關(guān)于HBase中HRegionServer的故障處理機(jī)制,以下說法中哪一項(xiàng)是錯(cuò)誤的?A、共用日志優(yōu)點(diǎn):恢復(fù)時(shí)需要分拆日志;缺點(diǎn):提高對(duì)表的寫操作性能B、根據(jù)日志記錄所屬的Region對(duì)象對(duì)HLog數(shù)據(jù)進(jìn)行拆分,分別放到相應(yīng)Region對(duì)象的目錄下C、Zookeeper會(huì)實(shí)時(shí)監(jiān)測(cè)每個(gè)HRegionServer的狀態(tài),當(dāng)某個(gè)HRegionServer發(fā)生故障時(shí),Zookeeper會(huì)通知HMasterD、HMaster首先會(huì)處理發(fā)生故障的HRegionServer上面遺留的HLog文件,這個(gè)遺留的HLog文件中包含了來自多個(gè)Region對(duì)象的日志記錄【正確答案】:A21.HBase的Region的是由哪個(gè)服務(wù)進(jìn)程來管理的?A、HRegionServerB、ZooKeeperC、DataNodeD、HMaster【正確答案】:A22.下列哪一個(gè)命令可以清空Redis實(shí)例下所有數(shù)據(jù)庫的數(shù)據(jù)A、dropallB、flushallC、dropdbD、flushdb【正確答案】:B23.關(guān)于HBase集群架構(gòu)組成各部分描述錯(cuò)誤的是哪一選項(xiàng)?A、正常HBase表只有一個(gè)Region,不支持分裂B、Client可用于緩存維護(hù)已經(jīng)訪問過的Region的位置信息C、HRegionServer負(fù)責(zé)處理數(shù)據(jù)讀寫請(qǐng)求D、HMaster主要負(fù)責(zé)Region的管理工作【正確答案】:A24.關(guān)于HBase的概念視圖,以下描述中正確的是哪一項(xiàng)?A、HBase是一個(gè)面向列的非關(guān)系型數(shù)據(jù)庫B、HBase的每一行數(shù)據(jù)可以有不同的行鍵C、HBase表格數(shù)據(jù)以文件塊的形式存放在內(nèi)存中D、HBase的每一個(gè)Region都是固定大小,每個(gè)Region都是64MB【正確答案】:A25.編寫Scala代碼時(shí),通過以下哪個(gè)算子可以實(shí)現(xiàn)數(shù)據(jù)過?A、filterB、collectC、mapD、flatmap【正確答案】:A26.企業(yè)數(shù)據(jù)分析平臺(tái)在根據(jù)不同的業(yè)務(wù)場(chǎng)景需求,搭建不同的大數(shù)據(jù)分析平臺(tái),如適應(yīng)離線批處理的Hadoop平臺(tái);適應(yīng)實(shí)時(shí)處理的流計(jì)算平臺(tái)等,這種架構(gòu)屬于哪種類型的架構(gòu)?A、分離架構(gòu)B、融合架構(gòu)C、多維架構(gòu)D、單一架構(gòu)【正確答案】:A27.以下關(guān)于實(shí)時(shí)處理解決方案與其它解決方案的關(guān)系,錯(cuò)誤的是哪一項(xiàng)?A、實(shí)時(shí)處理系統(tǒng)需要備份存儲(chǔ)B、實(shí)時(shí)處理系統(tǒng)不需要考慮HAC、實(shí)時(shí)處理處理后的數(shù)據(jù)可用于實(shí)時(shí)檢索D、實(shí)時(shí)處理處理后的數(shù)據(jù)可直接應(yīng)用至業(yè)務(wù)系統(tǒng)【正確答案】:B28.關(guān)于HBase的RowKey,以下描述中錯(cuò)誤的是哪一項(xiàng)?A、RowKey默認(rèn)最大長(zhǎng)度64KB,實(shí)際應(yīng)用中一般為10~100字節(jié)B、在HBase中,每一個(gè)RowKey都是一串字節(jié)數(shù)組C、RowKey是一個(gè)長(zhǎng)整型對(duì)象D、RowKey默認(rèn)按照字典序存儲(chǔ)【正確答案】:C29.ElasticSearch所采用的搜索方式,是通過VALUE找KEY。而在全文搜索中VALUE就是我們要搜索的關(guān)鍵詞,通過VALUE找到對(duì)應(yīng)的文檔。A、對(duì)(參考答案)B、錯(cuò)【正確答案】:A30.在HBase中,實(shí)現(xiàn)不同HRegionServer之間的負(fù)載均衡是由以下哪一個(gè)組件負(fù)責(zé)管理的?A、HfileB、HlogC、HMasterD、MemStore【正確答案】:C31.Redis中相對(duì)于RDB持久化,以下對(duì)AOF持久化描述錯(cuò)誤的是哪一選項(xiàng)?AOF持久化是用快照的方式實(shí)現(xiàn)的B、發(fā)生故障時(shí)恢復(fù)速度慢C、內(nèi)存占用過多,文件體積大D、占用較多磁盤的10開銷【正確答案】:A32.有關(guān)實(shí)時(shí)檢索技術(shù)在金融行業(yè)的應(yīng)用,以下哪一項(xiàng)說法是錯(cuò)誤的?()A、實(shí)時(shí)檢索技術(shù)可完成查詢交易憑證,追溯交易,以及查詢客戶信用記錄,幫助客戶快速借款等B、底層可以整合多方數(shù)據(jù),形城關(guān)系網(wǎng)絡(luò),查詢關(guān)聯(lián)關(guān)系,可用于反洗錢、風(fēng)控等場(chǎng)景C、對(duì)于簡(jiǎn)單查詢的場(chǎng)景,要求響應(yīng)時(shí)間在10分鐘左右D、可以根據(jù)ID(日志類型、卡號(hào)等)和時(shí)間段進(jìn)行查詢【正確答案】:C33.Spark2.0中引入了()的概念,它為用戶提供了一個(gè)統(tǒng)的切入點(diǎn)來使用Spark的各項(xiàng)功能。A、SparkSessionB、SparkTextC、SparkConfD、SparkContext【正確答案】:A34.以下哪一項(xiàng)不屬于Flink組件的滾動(dòng)聚合算子?A、KeyBy()B、minBy()C、min()D、sum()【正確答案】:A35.以下哪一項(xiàng)不是傳統(tǒng)數(shù)據(jù)處理系統(tǒng)面臨的問題?A、有限的擴(kuò)展能力B、海量數(shù)據(jù)的存儲(chǔ)成本高C、大數(shù)據(jù)處理能力不足D、數(shù)據(jù)源多樣【正確答案】:D36.下列哪一項(xiàng)不是ElasticSearch的擴(kuò)展插件?A、es-HadoopB、ElasticSearch-headC、HadoopD、Logstash【正確答案】:C37.以下哪一項(xiàng)不是SparkSQL的適用場(chǎng)景?A、實(shí)時(shí)數(shù)據(jù)查詢B、需要處理PB級(jí)的大容量數(shù)據(jù)C、結(jié)構(gòu)化數(shù)據(jù)處理D、對(duì)數(shù)據(jù)處理的實(shí)時(shí)性要求不高的場(chǎng)景【正確答案】:A38.Hive中trim()函數(shù)的功能是以下哪一選項(xiàng)?A、字符串截取B、返回近似值。C、計(jì)算絕對(duì)值D、去除空字符串【正確答案】:D39.Kafka的特點(diǎn)包括不包括以下哪一選項(xiàng)?A、消息持久化B、分布式C、高吞吐D、隨機(jī)讀取【正確答案】:D40.以下哪一選項(xiàng)不是統(tǒng)一元數(shù)據(jù)管理的優(yōu)勢(shì)?A、元數(shù)據(jù)統(tǒng)一管理、統(tǒng)一訪問和使用B、提供可視化元數(shù)據(jù)管理工具C、使用事實(shí)標(biāo)準(zhǔn)Hivemetastore接口,業(yè)務(wù)易對(duì)接D、數(shù)據(jù)訪問分散授權(quán),數(shù)據(jù)安全無保障【正確答案】:D41.下列關(guān)于Phoenix的說法錯(cuò)誤的是哪一項(xiàng)?A、將SQL編譯成HBase原生的scansB、確定scan關(guān)鍵字的最佳開始和結(jié)束C、讓scan并行執(zhí)行D、PhoenixSQL只能使用JDBC連接【正確答案】:D42.Spark處理數(shù)據(jù)時(shí)產(chǎn)生的中間產(chǎn)物會(huì)存放到以下哪一選項(xiàng)中?A、磁盤B、網(wǎng)絡(luò)C、內(nèi)存D、云上【正確答案】:C43.以下關(guān)于RDD的描述中,錯(cuò)誤的是哪一項(xiàng)?A、RDD默認(rèn)是存儲(chǔ)于內(nèi)存。B、RDD是分布式彈性數(shù)據(jù)集。C、RDD的創(chuàng)建只能依賴HDFS。D、用戶可以選擇不同的存儲(chǔ)級(jí)別緩存RDD以便重用?!菊_答案】:C44.Hive架構(gòu)中有一個(gè)Driver模塊用于對(duì)SQL語句進(jìn)行轉(zhuǎn)化,那么對(duì)于Driver的描述中,正確的是哪一項(xiàng)?A、Driver中的Compiler負(fù)責(zé)對(duì)HiveQL生成的執(zhí)行計(jì)劃和MapReduce任務(wù)進(jìn)行優(yōu)化B、Driver中的Optimizer負(fù)責(zé)編譯HiveQL并將其轉(zhuǎn)化為一系列相互依賴的Map/Reduce任務(wù)。C、Driver中的Executor負(fù)責(zé)按照任務(wù)的依賴關(guān)系分別執(zhí)行Map/Reduce任務(wù)Driver指Java的JDBC連接所用的Driver類。【正確答案】:C45.在大數(shù)據(jù)分析場(chǎng)景中,以下說法哪一項(xiàng)是不正確的?A、SparkSQL:新型SQL處理引擎,速度比Hive快,處理SQL類的批處理任務(wù)B、HDFS:基于大數(shù)據(jù)的數(shù)據(jù)倉庫平臺(tái)C、FLink:流批一體式計(jì)算引擎D、Hive:類SQL查詢,傳統(tǒng)批處理引擎,速度較慢【正確答案】:B46.StructuredStreaming不能提供以下哪幾種類型的保證?AtmostonceB、AtleastonceC、MorethanonceD、Exactlyonce【正確答案】:C47.關(guān)于HBase建表語句,以下描述中錯(cuò)誤的是哪一項(xiàng)?A、利用HBase的JavaAPI時(shí),需要用put語句完成建表B、在建表時(shí)可以預(yù)先創(chuàng)建多個(gè)RegionC、在華為云MRS提供的HBaseshell客戶端中建表時(shí),需指定至少一個(gè)列族名稱D、在HBaseshell客戶端中可以通過create命令建表【正確答案】:A48.以下哪一個(gè)選項(xiàng)不是ElasticSearch底層存放索引快照的位置?A、HadoopHDFSB、LocalFileSystemC、SharedFileSystemD、IndexModule【正確答案】:D49.以下關(guān)于Flume的描述,錯(cuò)誤的是哪一項(xiàng)?A、Flume不支持級(jí)聯(lián)(多個(gè)Flume對(duì)接起來),合并數(shù)據(jù)的能力B、Flume支持按照用戶定制采集數(shù)據(jù)的能力C、提供實(shí)時(shí)采集日志信息(taildir)到目的地的能力D、提供從固定目錄下采集日志信息到目的地(HDFS,HBase,Kafka)能力【正確答案】:A50.關(guān)于Flink的角色,下列哪一項(xiàng)說法是錯(cuò)誤的?A、Client是Flink程序提交的客戶端,對(duì)用戶提交的Flink程序進(jìn)行預(yù)處理,并提交到Flink集群中處理。B、JobManager扮演著集群中的管理者M(jìn)aster的角色,它是整個(gè)集群的協(xié)調(diào)者。C、TaskManager負(fù)責(zé)從用戶提交的Flink程序配置中獲取JobManager的地址。D、TaskManager是實(shí)際負(fù)責(zé)執(zhí)行計(jì)算的Worker.【正確答案】:C51.StructuredStreaming是構(gòu)建在以下哪個(gè)引擎上的框架?A、SparkSQLB、SparkStreamingC、SparkCoreD、SparkMLlib【正確答案】:A52.ElasticSearch數(shù)據(jù)寫入階段有很多調(diào)優(yōu)方式,下列錯(cuò)誤的是哪一項(xiàng)?A、盡量使用自動(dòng)生成的idB、禁用wildcardC、寫入前副本數(shù)設(shè)置為0D、寫入過程中:采取bulk批量寫入【正確答案】:B53.以下哪個(gè)選項(xiàng)不屬于智慧城市所需要的技術(shù)?AI計(jì)算B、大數(shù)據(jù)C、手工制作D、智慧交通【正確答案】:C54.以下關(guān)于Redis中String類型的描述,錯(cuò)誤的是哪一項(xiàng)?A、一個(gè)字符串類型的值存儲(chǔ)的最大容量是1MBB、字符串類型是Redis中最基本的數(shù)據(jù)類型C、可以存儲(chǔ)圖片D、可以存儲(chǔ)文本數(shù)據(jù)【正確答案】:A55.關(guān)于分布式圖數(shù)據(jù)庫,以下描述正確的是哪一項(xiàng)?A、圖數(shù)據(jù)庫將數(shù)據(jù)切分為多個(gè)數(shù)據(jù)塊進(jìn)行存儲(chǔ),數(shù)據(jù)塊大小固定128MBB、圖數(shù)據(jù)庫以"圖"這種數(shù)據(jù)結(jié)構(gòu)來存儲(chǔ)和查詢數(shù)據(jù)C、圖數(shù)據(jù)庫采用ER實(shí)體關(guān)系進(jìn)行存儲(chǔ)D、圖數(shù)據(jù)庫與關(guān)系型數(shù)據(jù)庫可以靈活轉(zhuǎn)化【正確答案】:B56.關(guān)于HDFS單名稱節(jié)點(diǎn)體系結(jié)構(gòu)的局限性,以下哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、HDFS只設(shè)置唯一一個(gè)名稱節(jié)點(diǎn),一旦這個(gè)唯一的名稱節(jié)點(diǎn)發(fā)生故障,會(huì)導(dǎo)致整個(gè)集群變得不可用B、HDFS只設(shè)置唯一個(gè)名稱節(jié)點(diǎn),資源和數(shù)據(jù)可以方便的完成隔離C、HDFS只設(shè)置唯-一個(gè)名稱節(jié)點(diǎn),會(huì)帶來命名空間的限制D、HDFS只設(shè)置唯一個(gè)名稱節(jié)點(diǎn),會(huì)帶來性能的瓶頸和吞吐量的瓶頸【正確答案】:B57.HDFS里元數(shù)據(jù)持久化過程包括Fslmage持久化和Editlog持久化,其中EditLog持久化是通過以下哪一種方式完成的?A、圖片B、日志C、網(wǎng)頁D、快照【正確答案】:B58.下面哪一選項(xiàng)不屬于Redis的優(yōu)化方法?A、Slowlog配置B、精簡(jiǎn)鍵值C、開啟AOF持久化D、限制Redis內(nèi)存大小【正確答案】:C59.以下關(guān)于KeyBy算子的描述,錯(cuò)誤的是哪一項(xiàng)?A、數(shù)據(jù)類型轉(zhuǎn)換是KeyedStream->DataStreamB、每個(gè)分區(qū)包含具有相同key的元素C、邏輯地將一個(gè)流拆分成不相交的分區(qū)D、在內(nèi)部以hash的形式實(shí)現(xiàn)的【正確答案】:A60.()是一個(gè)實(shí)現(xiàn)了文件系統(tǒng)的抽象類,繼承自org.apache.hadoop.conf.Configured,并實(shí)現(xiàn)了Closeable接口,可以適用于多種文件系統(tǒng)。A、FileSystemB、FSDataOutputStroamC、FSDatalnputStreamD、FileConfiguration【正確答案】:A61.某大數(shù)據(jù)業(yè)務(wù)人員在查詢某張表的業(yè)務(wù)數(shù)據(jù)時(shí),希望查詢出來的數(shù)值結(jié)果保留兩位小數(shù)他應(yīng)該使用哪個(gè)函數(shù)來實(shí)現(xiàn)?A、randB、absC、trimD、round【正確答案】:D62.如果想把Redis的Key中存儲(chǔ)的數(shù)字值減1,該使用下列哪一個(gè)命令?A、incrbyB、decrC、decrbyD、incr【正確答案】:B63.消息系統(tǒng)Kafka如何保證高吞吐能力?A、Partition機(jī)制B、持久性機(jī)制C、多訂閱者機(jī)制D、冗余備份機(jī)制【正確答案】:A64.下面哪一項(xiàng)不是Kafka的組件?A、BrokersB、ConsumerC、TopicD、Zookeeper【正確答案】:D65.以下哪一選項(xiàng)不屬于華為云MRS中Manager的特點(diǎn)?A、一鍵式部署、升級(jí)B、運(yùn)維難度高C、管理員可全面掌握集群運(yùn)行狀態(tài)D、故障快速定位【正確答案】:B66.某大數(shù)據(jù)業(yè)務(wù)人員需針對(duì)某些數(shù)據(jù)創(chuàng)建Hive表結(jié)構(gòu),其中某個(gè)數(shù)據(jù)為時(shí)間類型yyyyMMdd.那么可以使用以下哪一項(xiàng)作為字段類型?A、varcahrB、stringC、intD、double【正確答案】:B67.關(guān)于HBase,以下描述正確的是哪一項(xiàng)?A、對(duì)于絕大部分企業(yè)級(jí)大數(shù)據(jù)平臺(tái)而言,HBase底層需依賴HDFS存儲(chǔ)海量數(shù)據(jù)B、HBase可輕易實(shí)現(xiàn)海量數(shù)據(jù)的全局A,CID特性C、HBase和Zookeeper不是強(qiáng)綁定的D、HBase無法存儲(chǔ)結(jié)構(gòu)稀疏的表格【正確答案】:A68.關(guān)于華為云GES圖數(shù)據(jù)庫的Gremlin語言,以下描述中錯(cuò)誤的是哪一項(xiàng)?A、Gremlin遍歷由一系列步驟組成,這些步驟相互解耦,互不影響,不存在嵌套問題B、Gremlin是一種函數(shù)式數(shù)據(jù)流語言,用戶可以使用簡(jiǎn)潔的方式實(shí)現(xiàn)對(duì)復(fù)雜的屬性圖的遍歷或查詢C、ApacheTinkerPop是圖形數(shù)據(jù)庫和圖形分析系統(tǒng)的圖形計(jì)算框架D、Gremlin是ApacheTinkerPop框架下的圖遍歷語言【正確答案】:A69.Spark讀取任務(wù)參數(shù)優(yōu)先級(jí)最高的是以下哪一選項(xiàng)?A、動(dòng)態(tài)參數(shù)B、代碼配置C、配置文件D、客戶端配置【正確答案】:B70.某大數(shù)據(jù)運(yùn)維人員想通過shell命令上傳某個(gè)文件至HDFS文件系統(tǒng)中。以下哪個(gè)命令能幫助他完成這個(gè)操作?A、-putB、-getC、-uploadD、-cat【正確答案】:A71.以下哪一選項(xiàng)不是基于數(shù)據(jù)湖構(gòu)建一站式Al開發(fā)平臺(tái)ModelArts的特點(diǎn)?AI全流程開發(fā):高精度、高效率完成開發(fā)任務(wù)B、可視化管理:數(shù)據(jù)準(zhǔn)備、模型構(gòu)建部署可視化管理C、需自行安裝下載TensorFlow、PyTorch等主流計(jì)算框架D、在線推理、批量推理和邊緣推理,滿足多種業(yè)務(wù)場(chǎng)景訴求【正確答案】:C72.以下關(guān)于HDFS元數(shù)據(jù)持久化的描述中,哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、SecondaryNameNode合并成FsImage后回傳給主NameNode替換掉原有Fslmage,并將EditLog.new命名為EditLogB、在SecondaryNameNode的內(nèi)存中對(duì)FsImage文件和EditLog文件合并后產(chǎn)生新的Fslmage,叫做Fslmage.ckpC、將數(shù)據(jù)傳到SecondaryNameNode時(shí),因數(shù)據(jù)讀寫不能同步進(jìn)行,此時(shí)NameNode產(chǎn)生一個(gè)新的日志文件EditLog.new用來存放這段時(shí)間的操作日志D、ActiveNameNode中的Fslmage和EditLog可以直接在本地完成合并操作,而不需要被拷貝到SecondaryNameNode中【正確答案】:D73.Hive數(shù)據(jù)存儲(chǔ)模型中不包括以下哪一結(jié)構(gòu)?A、分區(qū)B、表C、桶D、塊【正確答案】:D74.在華為云GES中,想要給圖g中id為"Katherine"的用戶添加朋友為"zhangsan"。以下哪一個(gè)選項(xiàng)能正確實(shí)現(xiàn)上述目的?A、g.addV('friends').from(g.V("Katherine")).to(g.V("zhangsan"))B、g.addV('friends').from(g.V("zhangsan")).to(g.V("Katherine"))C、g.addE('friends').from(g.V("zhangsan")).to(g.V("Katherine"))D、g.addE('friends').from(g.V("Katherine").to(g.V("zhangsan"))【正確答案】:D75.關(guān)于ElasticSearch性能優(yōu)化,以下哪一項(xiàng)說法是錯(cuò)誤的?A、分片數(shù)不超過節(jié)點(diǎn)數(shù)的3倍,用較少的分片獲得更佳的性能B、索引創(chuàng)建好后依然可以動(dòng)態(tài)調(diào)整分片數(shù)量C、分片最大容量不要超過E1asticSearch推薦的最大JVM堆空間32GD、副本數(shù)建議設(shè)置為1,過多的副本需要更多存儲(chǔ)空間【正確答案】:B76.HBase中一張表通過指定Regionf的StartKey為10、20和30進(jìn)行region分裂,那么行鍵為222的數(shù)據(jù)將屬于以下哪一個(gè)Region?A、[10,20]B、[20,30]C、[30,"+inf']D、[0,10]【正確答案】:C77.下列代碼的作用是?Stringvertexld=getVertexldByPropert(api,graphName,"person,name,mark");api.queryVertex(vertexld,graphName):A、查詢點(diǎn)B、查詢屬性C、查詢邊D、以上全不正確【正確答案】:A78.消費(fèi)者在消費(fèi)Kafka中數(shù)據(jù)的時(shí)候需要指定以下哪個(gè)選項(xiàng)的信息?A、TimeB、ObjectC、TopicD、Theme【正確答案】:C79.Spark中A,Ction算子返回的是以下哪一選項(xiàng)?A、依賴關(guān)系B、DAG圖C、RDDD、計(jì)算結(jié)果或者是寫入存儲(chǔ)操作【正確答案】:D80.大數(shù)據(jù)體量范圍一般是以下哪一選項(xiàng)?A、TB-PBB、GB-TBC、HB-GBD、KB-MB【正確答案】:A81.以下哪個(gè)選項(xiàng)屬于大數(shù)據(jù)消息系統(tǒng)?A、HDFSB、MapReduceC、YarnD、Kafka【正確答案】:D82.Kafka運(yùn)行時(shí)直接依賴于以下哪一個(gè)組件?A、HBaseB、HDFSC、SparkD、Zookeeper【正確答案】:D83.Loader是基于哪個(gè)開源組件的圖形化遷移管理工具?A、HueB、spankC、SqoopD、Kettle【正確答案】:C84.以下描述中,哪一項(xiàng)不是實(shí)時(shí)檢索技術(shù)在金融行業(yè)的應(yīng)用特點(diǎn)?A、高并發(fā)B、查詢條件復(fù)雜C、時(shí)延要求高D、存在海量圖片小文件【正確答案】:B85.以下哪一項(xiàng)不屬于Hive的數(shù)學(xué)函數(shù)?A、rand()B、Abs()C、trim()D、round(【正確答案】:C86.對(duì)于數(shù)據(jù)倉庫而言,一般分為四層,ODS層、DWD層、DWS層和ADS層。以下關(guān)于數(shù)據(jù)倉庫分層的描述中,錯(cuò)誤的是哪一項(xiàng)?A、ODS層為原始數(shù)據(jù)層,數(shù)據(jù)無需做變動(dòng)直接導(dǎo)入B、DWS層基于DWD層進(jìn)行了數(shù)據(jù)清洗C、DWD層為數(shù)據(jù)明細(xì)層,也與ODS層數(shù)據(jù)一致。D、ADS層一般面向用戶,會(huì)將數(shù)據(jù)同步到關(guān)系型數(shù)據(jù)庫中【正確答案】:B87.關(guān)于GES特點(diǎn),以下描述中正確的是哪一項(xiàng)?A、簡(jiǎn)單易用:支持SQL查詢語言,兼容不同用戶的使用習(xí)慣B、高性能:對(duì)分布式圖形計(jì)算引警進(jìn)行了深度優(yōu)化,具有高井發(fā)、最快可達(dá)分鐘級(jí)時(shí)延的實(shí)時(shí)查詢能力C、大規(guī)模:最大可支持百萬節(jié)點(diǎn)千萬邊規(guī)模的數(shù)據(jù)進(jìn)行查詢與分析D、查詢分析一體:提供豐富的圖分析算法,實(shí)現(xiàn)了查詢分析一體化【正確答案】:D88.關(guān)于Kalka的Topic,以下哪一項(xiàng)描述是錯(cuò)誤的?A、Topic的Partition數(shù)量可以在創(chuàng)建時(shí)配置。B、Kafka集群中Topic可以設(shè)置多個(gè)。C、設(shè)置多副本可以增強(qiáng)Kaka服務(wù)的容災(zāi)能力。D、在創(chuàng)建Kafka的Topic時(shí),必須設(shè)置Partition個(gè)數(shù)【正確答案】:D89.為了提高Kafka的容錯(cuò)性,Kafka支持Partition的復(fù)制策略,以下關(guān)于LeA,DerPartition和FollowerPartition的描述哪一項(xiàng)是錯(cuò)誤的?A、Kafkat對(duì)Partition的復(fù)制需要選出一個(gè)LeA,Der,由該LeA,Der負(fù)責(zé)Partition的讀寫操作,其他的副本節(jié)點(diǎn)只是負(fù)責(zé)數(shù)據(jù)的同步B、如果LeA,Der失效,那么將會(huì)有其他Follower來接管(成為新的LeA,DerC、一個(gè)Kafka集群各個(gè)節(jié)點(diǎn)間不可能互為L(zhǎng)eA,Der和FollowerD、由于LeA,DerServer承載了全部的請(qǐng)求壓力,因此從集群的整體考慮,Kafka會(huì)將LeA,Der均橫的分散在每個(gè)實(shí)例上,來確保整體的性能穩(wěn)定【正確答案】:C90.以下哪一個(gè)函數(shù)不是Hive內(nèi)置的寧符串函數(shù)?A、substring()B、length()C、trim()D、round()【正確答案】:D91.HBase使用get方法讀取數(shù)據(jù)時(shí),下列哪個(gè)選項(xiàng)是需要的?A、scan.setCaching(1000)B、Deletedelete=newDelete(rowKey)C、byte[]rowKey=Bytes.toBytes("012005000201")D、List<Put>puts=newArrayList<Put>【正確答案】:C92.Redis不適用于以下哪個(gè)應(yīng)用場(chǎng)景?A、獲取TOPN操作B、獲取PB級(jí)Value數(shù)據(jù)C、獲取最新N個(gè)數(shù)據(jù)的操作D、獲取手機(jī)驗(yàn)證碼【正確答案】:B93.在華為云GES服務(wù)中,想要在一張已存在的圖g中添加id為張三,年齡為18-24,性別為M的user用戶。以下哪一個(gè)選項(xiàng)能正確實(shí)現(xiàn)上述目的?單選A、g.addVertex(label,'user',id.'張','Age','18-24')B、g.addE(id,"張三").from(g.V("Katherine").to(g.V("id","張三")C、g.addV("張三").property("Age","18-24").property("Gender","M")D、g.addV("user").property(id,"張三").property("Age","18-24")!property("Gender","M")【正確答案】:D94.altertabletableNamesettblproperties('EXTERNAL'='FALSE'):執(zhí)行該Hive命令能實(shí)現(xiàn)以下哪一個(gè)目標(biāo)?A、修改內(nèi)部表tableName為外部表B、移動(dòng)tableName數(shù)據(jù)到外部存儲(chǔ)系統(tǒng)C、刪除tableName表的元數(shù)據(jù)信息D、修改外部表tableName為內(nèi)部表【正確答案】:D95.Redis默認(rèn)支持的數(shù)據(jù)庫個(gè)數(shù)是多少?A、10B、5C、16D、15【正確答案】:C96.關(guān)于實(shí)時(shí)檢索技術(shù)的應(yīng)用場(chǎng)景,以下描述中錯(cuò)誤的是哪一個(gè)選項(xiàng)?A、運(yùn)營(yíng)商可以借助實(shí)時(shí)檢索技術(shù),查詢某個(gè)時(shí)間段用戶的流量記錄,以應(yīng)對(duì)不良APP偷跑流量引發(fā)的投訴B、實(shí)時(shí)檢索要求在小批量數(shù)據(jù)集上需達(dá)到毫秒級(jí)的時(shí)延C、在金融風(fēng)控場(chǎng)景中,利用實(shí)時(shí)檢索技術(shù),客戶可以在發(fā)生危險(xiǎn)交易前及時(shí)止損D、公安系統(tǒng)數(shù)據(jù)量大、業(yè)務(wù)要求復(fù)雜,因此無法借助實(shí)時(shí)檢索技術(shù)提高處警效率【正確答案】:D97.某電商網(wǎng)站想要實(shí)現(xiàn)熱銷商品的實(shí)時(shí)TopN排名,可以使用哪種技術(shù)實(shí)現(xiàn)?A、Hive的關(guān)聯(lián)查詢分析B、HBaserowkey的索C、Elasticsearch的快速檢索D、Redis的排序計(jì)算【正確答案】:D98.某大數(shù)據(jù)開發(fā)人員在創(chuàng)建Hive表結(jié)構(gòu)時(shí),發(fā)現(xiàn)原先創(chuàng)建的表存儲(chǔ)格式出現(xiàn)了問題。對(duì)于這一現(xiàn)象,以下描述中,錯(cuò)誤的是哪一項(xiàng)?A、不同的存儲(chǔ)格式會(huì)影響表的處理效率B、必須修正回來,不然會(huì)導(dǎo)致數(shù)據(jù)無法查詢C、可以通過alter命令進(jìn)行修改D、錯(cuò)誤的表存儲(chǔ)格式會(huì)影響10A,D命令加載,導(dǎo)致數(shù)據(jù)無法正常導(dǎo)入【正確答案】:B99.以下關(guān)于Sqoop數(shù)據(jù)導(dǎo)入原理的描述中,錯(cuò)誤的是哪一項(xiàng)?A、Sqoop在import時(shí),需要指定split-by參數(shù)。B、Sqoop會(huì)根據(jù)傳入的num-mappers來確定劃分幾個(gè)區(qū)域。C、Sqoop根據(jù)不同的split-by參數(shù)值來進(jìn)行切分,然后將切分出來的區(qū)域分配到不同map中。D、num-nappers越大效率越高。【正確答案】:D100.Hive表與MySQL類似存在分區(qū)的概念,那么對(duì)于Hive的分區(qū),以下描述中,正確的是哪一項(xiàng)?A、Hive的分區(qū)針對(duì)的是文件,分桶針對(duì)的是文件夾。B、Hive的分區(qū)數(shù)量可以通過參數(shù)動(dòng)態(tài)生成。C、Hive的分區(qū)和分桶是以一個(gè)概念。D、Hive的分區(qū)字段與MySQL一樣必須存在?!菊_答案】:B1.關(guān)于ApachePhoenix與HBase的搭配,以下哪些選項(xiàng)是正確的?A、PhoenixSQL只有命令行一種使用模式,無法對(duì)接JDBC進(jìn)行使用B、ApachePhoenix可以將SQL查詢編譯為一系列HBase掃描C、Phoenix在Hadoop中為低延遲應(yīng)用程序提供OLTP和運(yùn)營(yíng)分析能力D、ApachePhoenix可以為小型查詢提供毫秒級(jí)的性能,或者為數(shù)千萬行數(shù)據(jù)提供秒級(jí)的性能【正確答案】:BCD2.下面哪幾項(xiàng)屬于ElasticSearch的RESTful請(qǐng)求方式?A、PostB、UpdateC、DeleteD、Get【正確答案】:ACD3.Flink提供的窗口分配器,包含以下哪些項(xiàng)?A、全局窗口B、滾動(dòng)窗口C、滑動(dòng)窗口D、會(huì)話窗口【正確答案】:ABCD4.Redis包含以下哪些數(shù)據(jù)類型?A、HashB、ListC、StringD、Set【正確答案】:ABCD5.以下哪些選項(xiàng)不屬于HDFS文件系統(tǒng)將文件分塊帶來的好處?A、數(shù)據(jù)備份比較麻煩B、簡(jiǎn)化系統(tǒng)設(shè)計(jì)C、存儲(chǔ)效率有所降低D、支持大規(guī)模文件存儲(chǔ)【正確答案】:AC6.關(guān)于Hive導(dǎo)入數(shù)據(jù)的命令,以下哪些選項(xiàng)是正確的?A、loA,Ddatainpath可用于將HDFS上的數(shù)據(jù)導(dǎo)入Hive表中B、導(dǎo)入數(shù)據(jù)時(shí)必須指定導(dǎo)入哪張表格,也就是需要使用intotable關(guān)鍵詞+表名C、可以使用Local關(guān)鍵詞從本地文件系統(tǒng)導(dǎo)入數(shù)據(jù)至Hive,但是這里的Local指的是hiveserver服務(wù)所在的機(jī)器,而不是beeline客戶端所在的機(jī)器D、如果原先表中有數(shù)據(jù),想用新數(shù)據(jù)覆蓋舊數(shù)據(jù),可以添加overwrite參數(shù)進(jìn)行覆蓋【正確答案】:ABCD7.ElasticSearch的定位包含以下哪些方法?A、文檔檢素B、實(shí)時(shí)搜索C、主鍵查詢D、非主鍵查詢【正確答案】:ABCD8.以下關(guān)于Filnk的窗口描述正確的是()。A、Flink窗口按窗口行為劃分:TumblingWindow-SlidingWindow.SessionWindow.B、窗口可以是時(shí)間驅(qū)動(dòng)的也可以是數(shù)據(jù)驅(qū)動(dòng)的。C、我們可以每30秒計(jì)算一次最近一分鐘用戶購買的商品總數(shù),這個(gè)就是時(shí)間滑動(dòng)窗口的應(yīng)用方式。D、會(huì)話窗口是將數(shù)據(jù)聚合到會(huì)話窗口中,由非活躍的間隙分隔開?!菊_答案】:ABCD9.以下哪些選項(xiàng)屬于Kafka高效文件存儲(chǔ)設(shè)計(jì)的特點(diǎn)?A、通過index元數(shù)據(jù)全部映射到memory,可以避免segmentfile的lo磁盤操作。B、Kafka把topic中一個(gè)parition大文件分成多個(gè)小文件段,通過多個(gè)小文件段,就容易定期清除或刪除已經(jīng)消費(fèi)完文件,減少磁盤占用。C、通過索引信息可以快速定位message和確定response的最大大小。D、通過索引文件稀疏存儲(chǔ),可以大幅降低index文件元數(shù)據(jù)占用空間大小【正確答案】:ABCD10.以下哪些選項(xiàng)屬于HBase常見的應(yīng)用場(chǎng)景?A、消息、訂單數(shù)據(jù)存儲(chǔ)B、用戶畫像數(shù)據(jù)存儲(chǔ)C、氣象數(shù)據(jù)存儲(chǔ)D、全年總銷售額統(tǒng)計(jì)分析【正確答案】:ABC11.通過Loader的可視化界面,可以實(shí)現(xiàn)以下哪些操作?A、數(shù)據(jù)分析任務(wù)B、制定多種不同的數(shù)據(jù)源C、數(shù)據(jù)可視化操作D、配置數(shù)據(jù)的清洗和轉(zhuǎn)換步驟【正確答案】:BCD12.大數(shù)據(jù)融合架構(gòu)具有以下哪些優(yōu)勢(shì)?A、實(shí)現(xiàn)資源共享、實(shí)現(xiàn)管理自動(dòng)化B、同一份數(shù)據(jù)可同時(shí)進(jìn)行批處理C、消除數(shù)據(jù)孤島,減少冗余D、流處理以及查詢多種計(jì)算模型【正確答案】:ABCD13.Flink有哪些狀態(tài)存儲(chǔ)方式?A、MemoryStateBA,CkendB、FsStateBA,CkendC、MySqlStateBA,CkendD、RocksDBStateBA,Ckend【正確答案】:ABD14.關(guān)于MRS的Redis增強(qiáng)特性描述正確的是()。A、支持?jǐn)?shù)據(jù)導(dǎo)入導(dǎo)出工具B、自研Arm架構(gòu)C、集群可靠性保障D、完善的集群管理功能【正確答案】:ABCD15.以下哪些選項(xiàng)是離線批處理的特點(diǎn)?A、多個(gè)作業(yè)調(diào)度復(fù)雜B、容易產(chǎn)生資源搶占C、處理數(shù)據(jù)量巨大,PB級(jí)D、處理時(shí)間要求高【正確答案】:ABC16.關(guān)于ElasticSearch的基本理解,以下哪些選項(xiàng)是正確的?A、ElasticSearch的全文檢索條件可以包括詞或短語B、ElasticSearch可以支持非結(jié)構(gòu)化數(shù)據(jù)檢索C、ElasticSearch自身就可以提供數(shù)據(jù)可視化操作D、ElasticSearch可以支持?jǐn)?shù)據(jù)清洗和分詞【正確答案】:ABD17.在HBase中利用get命令查找某一個(gè)單元格對(duì)應(yīng)的數(shù)據(jù),以下哪些信息是必要的?()A、ColumnQualifier(限定符)信息B、Rowkey(行鍵)信息C、DataBlockID(數(shù)據(jù)塊編號(hào))信息D、ColumnFamily(列族)信息【正確答案】:ABD18.Redis中Key的expire生存時(shí)間不適合以下哪些場(chǎng)景?A、存儲(chǔ)特定用戶所有歷史信息B、限時(shí)優(yōu)惠活動(dòng)C、限制網(wǎng)站訪客訪問頻率D、電商網(wǎng)站過去一年?duì)I銷總額統(tǒng)計(jì)【正確答案】:AD19.以下關(guān)于Channel的描述中,錯(cuò)誤的是哪些項(xiàng)?A、Channel位于Source和Sink之間B、Channels不支持事務(wù)Channel的作用類似隊(duì)列D、Channels提供較強(qiáng)的順序保證【正確答案】:BD20.以下哪些選項(xiàng)是Loader提供的功能?A、可以指定多種不同數(shù)據(jù)源B、提供定時(shí)調(diào)度任務(wù),周期性執(zhí)行作業(yè)C、提供可視化向?qū)降淖鳂I(yè)配置管理界面D、配置數(shù)據(jù)的清洗和轉(zhuǎn)換步驟【正確答案】:ABCD21.以下哪些選項(xiàng)是傳統(tǒng)大數(shù)據(jù)架構(gòu)面臨的挑戰(zhàn)?A、資源無法彈性B、業(yè)務(wù)上線速度慢C、多集群無法統(tǒng)一運(yùn)維D、建設(shè)成本高【正確答案】:ABCD22.以下關(guān)于微批處理模型的描述,正確的是哪些項(xiàng)?A、在下一個(gè)微批處理之前,要將數(shù)據(jù)的偏移范圍保存在日志中B、當(dāng)前到達(dá)的數(shù)據(jù)需要在上一批次處理完,才能下一個(gè)批次數(shù)據(jù)繼續(xù)處理C、會(huì)有一定的延遲D、流計(jì)算引警在處理上一批次數(shù)據(jù)結(jié)束后,再對(duì)新數(shù)據(jù)進(jìn)行批量查詢【正確答案】:ABCD23.某大數(shù)據(jù)業(yè)務(wù)人員在不小心刪除了HDFS某個(gè)文件后,想通過回收站機(jī)制恢復(fù)數(shù)據(jù),但是在對(duì)應(yīng)的回收站目錄/user/root/.Trash中為什么找不到要恢復(fù)的數(shù)據(jù)?A、回收站中的數(shù)據(jù)超過了保留的期限,被系統(tǒng)刪除了。B、回收站機(jī)制并沒有開啟,導(dǎo)致沒有及時(shí)回收C、回收站通過回收間隔,對(duì)數(shù)據(jù)進(jìn)行了整理,需要進(jìn)入到指定時(shí)間間隔下才能找到D、查找的目錄可能出現(xiàn)了問題,需要核實(shí)刪除操作的用戶?!菊_答案】:AB24.Spark中RDD是彈性數(shù)據(jù)集的原因包括以下哪些選項(xiàng)?A、基于Lineage的高效容錯(cuò)B、自動(dòng)進(jìn)行內(nèi)存和磁盤數(shù)據(jù)存儲(chǔ)的切換C、數(shù)據(jù)調(diào)度彈性D、Task失敗自動(dòng)重試【正確答案】:ABC25.以下哪些選項(xiàng)是容易造成Hive數(shù)據(jù)傾斜的原因?()A、groupbyB、joinC、distinctcountD、droptable【正確答案】:ABC26.關(guān)于使用HBase的JavaAPI讀取數(shù)據(jù),以下描述中正確的是哪些項(xiàng)?A、QualifierFilter用于過HBase表中的列族信息B、HBaseFilter主要在Scan和Get過程中進(jìn)行數(shù)據(jù)過濾,通過設(shè)置一些過濾條件來實(shí)現(xiàn)條件查詢C、要從表中讀取數(shù)據(jù),首先需要實(shí)例化該表對(duì)應(yīng)的Table實(shí)例D、為了提高查詢效率,使用Scan命令時(shí)最好指定StartRow和StopRow【正確答案】:ABCD27.以下哪些選項(xiàng)是網(wǎng)站日志的特點(diǎn)?A、價(jià)值密度低B、數(shù)據(jù)的業(yè)務(wù)種類多C、數(shù)據(jù)結(jié)構(gòu)復(fù)雜D、數(shù)據(jù)量大【正確答案】:ABCD28.以下哪些選項(xiàng)可以在華為云GES服務(wù)中實(shí)現(xiàn)?A、根據(jù)用戶的用戶畫像,為用戶推薦最合適的電影(推薦系統(tǒng))B、查詢兩個(gè)用戶Reed和Caspar的最短路徑(計(jì)算最短路徑)C、調(diào)用PageRank算法,查間圖中最關(guān)鍵的數(shù)據(jù)點(diǎn)(PageRank算法)D、查詢Hillary用戶的朋友的朋友的朋友(多級(jí)關(guān)系查詢)【正確答案】:ABCD29.下面選項(xiàng)哪些是HBase數(shù)據(jù)查詢過濾器Filter的比較器?A、BinaryComparatorB、SubStringComparatorC、BinaryPrefixComparatorD、RegexStringComparator【正確答案】:ABCD30.關(guān)于HBaseRegion分裂的描述中,以下哪些選項(xiàng)是正確的?A、Region拆分操作需要消耗大量時(shí)間B、拆分過程中的Region是不可讀的C、直到分裂過程結(jié)束,把存儲(chǔ)文件異步地寫到獨(dú)立的文件之后,才會(huì)讀取新文件D、在RegionSplit時(shí),拆分之后的Regioni讀取的仍然是原存儲(chǔ)文件【正確答案】:BC31.下列關(guān)于大數(shù)據(jù)的說法中,錯(cuò)誤的是哪些選項(xiàng)?A、大數(shù)據(jù)具有體量大、結(jié)構(gòu)單一、時(shí)效性強(qiáng)的特征B、處理大數(shù)據(jù)需采用新型計(jì)算架構(gòu)和智能算法等新技術(shù)C、大數(shù)據(jù)的應(yīng)用注重因果分析而不是相關(guān)分析D、大數(shù)據(jù)的應(yīng)用注重相關(guān)分析而不是因果分析【正確答案】:AC32.HDFS文件系統(tǒng)適用于哪些場(chǎng)景?A、大規(guī)模數(shù)據(jù)(TB及以上)B、流式數(shù)據(jù)訪問(寫一次,讀多次)C、頻繁修改文件(基本就是寫一次)D、商用硬件(一般硬件)【正確答案】:ABD33.以下哪些選項(xiàng)可以提供文檔數(shù)據(jù)檢索服務(wù)?A、HDFSB、MapReduceC、ElasticSearchD、Lucene【正確答案】:CD34.由GESREST接口可以實(shí)現(xiàn)以下哪些操作?A、創(chuàng)建圖B、刪除圖C、創(chuàng)建edgelA,BelD、創(chuàng)建vertexIA,Bel【正確答案】:ABCD35.相較于大數(shù)據(jù)組件,傳統(tǒng)數(shù)據(jù)倉庫存在以下哪些劣勢(shì)?A、I/O存在瓶頸B、大規(guī)模數(shù)據(jù)實(shí)時(shí)性差C、拓展能力差D、架構(gòu)單一【正確答案】:ABCD36.2019年以后,華為云數(shù)據(jù)湖CloudDataLake中數(shù)據(jù)管理包含以下哪些組件。AWSGlueB、DeltaLakeC、AtlasD、HUDI【正確答案】:ABCD37.實(shí)時(shí)檢索的公安和金融行業(yè)應(yīng)用場(chǎng)景有哪些特征?A、高并發(fā)B、存在海量小文件C、查詢速度快D、查詢條件簡(jiǎn)單【正確答案】:ABCD38.關(guān)于HBase中scan和get的描述,以下哪些選項(xiàng)是正確的?A、get命令可以指定查找特定的單元格B、scan可以用于掃描全表數(shù)據(jù)C、get命令必須指定行健信息D、scan命令無法指定行鍵的范圍【正確答案】:ABC39.華為企業(yè)云數(shù)據(jù)湖具有以下哪些優(yōu)勢(shì)?A、開放接口,支持開放實(shí)時(shí)標(biāo)準(zhǔn),構(gòu)建豐富生態(tài),自助式數(shù)據(jù)開發(fā)與分析B、存儲(chǔ)和計(jì)算分離,支持更多用戶并發(fā)和更大數(shù)據(jù)量C、更多數(shù)據(jù)通過實(shí)時(shí)、虛擬方式入湖,數(shù)據(jù)產(chǎn)生即可見、可用D、數(shù)據(jù)集中,開放共享、統(tǒng)一目錄管理,避免跨系統(tǒng)數(shù)據(jù)搬遷【正確答案】:ABCD40.以下關(guān)于AppendMode的描述中,正確的是哪些項(xiàng)?A、只適用于結(jié)果集中已經(jīng)存在的內(nèi)容不希望發(fā)生改變的情況B、當(dāng)時(shí)間間隔觸發(fā)時(shí),只有在ResultTable中新增加的數(shù)據(jù)行會(huì)被寫入到外部存儲(chǔ)C、如果已經(jīng)存在的數(shù)據(jù)會(huì)被更新,推薦使用此方式D、如果已經(jīng)存在的數(shù)據(jù)會(huì)被更新,不適合適用此方式【正確答案】:ABD41.華為混合云MRS服務(wù)的優(yōu)勢(shì)有哪些?A、存算分離,TCO下降B、易管理,駕駛艙體驗(yàn)C、多場(chǎng)景融合,高性能D、易部署,所用即所得【正確答案】:ABCD42.StructuredStreaming可以提供以下哪幾種類型的保證?A、OnlyOnceB、AtmostonceC、ExactlyonceD、Atleastonce【正確答案】:BCD43.離線批處理的數(shù)據(jù)來源可以是以下哪些選項(xiàng)?A、0GG日志流B、日志文件C、批量文件數(shù)據(jù)D、數(shù)據(jù)庫【正確答案】:ABCD44.關(guān)于SparkSQL和Hive的區(qū)別與聯(lián)系,以下哪些選項(xiàng)是正確的?A、SparkSQL的執(zhí)行引擎為SparkCore,Hive默認(rèn)執(zhí)行引擎為TezB、SparkSQL不可以使用Hive的自定義函數(shù)C、SparkSQL依賴Hive的元數(shù)據(jù)D、SparkSQL兼容絕大部分Hive的語法【正確答案】:ACD45.以下關(guān)于有界流的描述,哪些項(xiàng)是正確的?A、有界流處理通常被稱為批處理B、有定義流的開始,也有定義流的結(jié)束C、有界流可以在讀取所有數(shù)據(jù)后再進(jìn)行計(jì)算D、有界流所有數(shù)據(jù)可以被排序,所以并不需要有序攝取【正確答案】:ABCD46.以下哪些選項(xiàng)是GES圖數(shù)據(jù)庫用于存儲(chǔ)海量數(shù)據(jù)的基礎(chǔ)組件?A、SparkB、FlinkC、HBaseD、ElasticSearch【正確答案】:CD47.以下哪些算子是窄依賴?A、filterB、groupyByKeyC、mapD、union【正確答案】:ACD48.以下哪些選項(xiàng)是Hive數(shù)據(jù)倉庫分層的優(yōu)點(diǎn)?A、隔離原始數(shù)據(jù)B、復(fù)雜問題簡(jiǎn)單化C、減少重復(fù)開發(fā)D、清晰數(shù)據(jù)結(jié)構(gòu)【正確答案】:ABCD49.大數(shù)據(jù)的價(jià)值體現(xiàn)在以下哪些方面?A、大數(shù)據(jù)實(shí)現(xiàn)了精準(zhǔn)營(yíng)銷B、大數(shù)據(jù)助力智慧城市提升公共服務(wù)水平C、大數(shù)據(jù)給思維方式帶來了沖擊D、大數(shù)據(jù)為政策制定提供科學(xué)論據(jù)【正確答案】:ABD50.以下哪些選項(xiàng)是華為云MRS使用HetuEngine的根本原因?A、企業(yè)傳統(tǒng)數(shù)倉,缺乏高效、統(tǒng)一的融合分析B、企業(yè)傳統(tǒng)數(shù)倉采用分系統(tǒng)構(gòu)建模式,導(dǎo)致數(shù)據(jù)冗余嚴(yán)重,阻礙企業(yè)快速轉(zhuǎn)型C、隨著數(shù)據(jù)量增長(zhǎng),業(yè)務(wù)對(duì)數(shù)據(jù)分析靈活性要求越來越高D、HetuEngine對(duì)浪涌式的數(shù)據(jù)進(jìn)行整合分析,發(fā)揮最大價(jià)值【正確答案】:ABCD51.實(shí)時(shí)檢索的解決方案中有哪些組件?A、HadoopB、HiveC、ElasticSearchD、HBase【正確答案】:CD52.以下哪些是常用的數(shù)據(jù)采集工具?A、SqoopB、FlumeC、LoaderD、Kafka【正確答案】:ABC53.HBase中HMaster主要負(fù)責(zé)()A、Regionserverf負(fù)載均衡B、表的增刪改查C、Region分布調(diào)整D、用戶數(shù)據(jù)讀寫【正確答案】:ABC54.以下關(guān)于Source的描述中,正確的是哪些項(xiàng)?A、execsource執(zhí)行某個(gè)命令或者腳本,并將其執(zhí)行結(jié)果的輸出作為數(shù)據(jù)源B、httpsource支持http的post發(fā)送數(shù)據(jù)C、spoolingdirectorysource采集本地靜態(tài)文件D、Source有驅(qū)動(dòng)和輪詢兩種類型【正確答案】:ABCD55.下列哪些選項(xiàng)是Flink的高抽象層API?A、DataStreamAPIB、DataSetAPIC、SQLAPID、TableAPI【正確答案】:CD56.有關(guān)實(shí)時(shí)檢索引擎中各組件的聯(lián)系與定位,以下描述中正確的有哪些項(xiàng)?()A、ElasticSearch存儲(chǔ)數(shù)據(jù)性價(jià)比低,但是其能夠滿足場(chǎng)景中多級(jí)索引的實(shí)時(shí)查詢需求,同時(shí)還能夠?qū)ξ臋n分詞建立索引B、圖數(shù)據(jù)庫可以完美的解決復(fù)雜多級(jí)關(guān)系查詢分析,選用GES來解決圖數(shù)據(jù)的實(shí)時(shí)查詢需求C、與HBase相比,ElasticSearch在海量數(shù)據(jù)的情景下存儲(chǔ)性能不如HBase,故選擇HBase作為海量數(shù)據(jù)存儲(chǔ)的基石D、HBase加ElasticSearch的組合滿足了大部分的用戶實(shí)時(shí)檢索訴求【正確答案】:ABCD57.大數(shù)據(jù)技術(shù)在我們身邊應(yīng)用的越來越廣,以下場(chǎng)景中有哪些場(chǎng)景可以應(yīng)用大數(shù)據(jù)技術(shù)?A、廣告精準(zhǔn)營(yíng)銷B、游戲畫面實(shí)時(shí)刷新C、人物畫像D、道路智能規(guī)劃【正確答案】:ACD58.以下關(guān)于Redis使用場(chǎng)景特點(diǎn)的描述,正確的是哪些項(xiàng)?A、數(shù)據(jù)類型豐富B、支持持久化C、高性能D、低時(shí)延【正確答案】:ABCD59.請(qǐng)按步驟將調(diào)用HBase的JavaAPl進(jìn)行scan查詢的流程進(jìn)行排序。()A、針對(duì)查詢條件設(shè)置Scan對(duì)象的參數(shù)值B、創(chuàng)建一個(gè)Scan對(duì)象C、實(shí)例化該表對(duì)應(yīng)的Table實(shí)例D、設(shè)置緩存大小或起始結(jié)束的rowkeyE、解析處理結(jié)果F、提交Scan請(qǐng)求【正確答案】:ABCDEF60.以下關(guān)于Spark的惰性操作描述中,正確的有哪幾項(xiàng)?A、SparkACtion的程序只有執(zhí)行到算子時(shí)才會(huì)觸發(fā)。B、Spark的執(zhí)行需要人為觸發(fā),Spark自身不會(huì)自動(dòng)觸發(fā)。C、SparkACtion程序在還沒有執(zhí)行到算子時(shí),是不會(huì)進(jìn)行編譯的。D、Transformation屬于懶操作。【正確答案】:AD61.有關(guān)HBase中Compaction操作的描述,以下哪些說法是正確的?A、MajorCompaction是小范圍的CompactionB、Compaction操作會(huì)排除當(dāng)前正在執(zhí)行合并的文件C、MinorCompaction是小范圍的CompactionD、Compaction分為Minor和Major兩類【正確答案】:BCD62.關(guān)于GES服務(wù)的常見基本概念,以下哪些選項(xiàng)是正確的?A、GES不存在無向邊B、在GES中,點(diǎn)的屬性(Property)表示了該頂點(diǎn)的附加信息,采用Keyvalue:結(jié)構(gòu)進(jìn)行保存C、個(gè)人的姓名、年齡、身份證、愛好等信息可以用VertexLA,Bel來表示D、"認(rèn)識(shí)/朋友關(guān)系"在圖中可以用邊來表示【正確答案】:ABCD63.HBase數(shù)據(jù)寫入過程會(huì)有多個(gè)步驟,請(qǐng)選擇正確的順序()A、查找對(duì)應(yīng)的region,在region中尋找列族先向memstore中寫入數(shù)據(jù)B、去表所在的regionserver進(jìn)行數(shù)據(jù)的添加C、當(dāng)memstore寫入的值變多,觸發(fā)溢弓操作(flush)D、clienti訪問Zookeeper,獲取元數(shù)據(jù)存儲(chǔ)所在的regionserverE、通過對(duì)應(yīng)的regionserver,拿到對(duì)應(yīng)的表存文的regionserverF、當(dāng)溢寫的文件過多時(shí),會(huì)觸發(fā)文件的合并(Compact)操作【正確答案】:ABCDEF64.以下哪些屬于大數(shù)據(jù)的發(fā)展趨勢(shì)?A、從技術(shù)驅(qū)動(dòng)轉(zhuǎn)變?yōu)樯虡I(yè)驅(qū)動(dòng)B、從統(tǒng)計(jì)分析到認(rèn)知計(jì)算C、生態(tài)合作開放D、數(shù)據(jù)處理逐漸標(biāo)準(zhǔn)化、云化【正確答案】:ABCD65.關(guān)于HBase的基本架構(gòu),以下描述中正確的有哪些項(xiàng)?A、在HBase中,每一個(gè)Store對(duì)應(yīng)一個(gè)ColumnQualifierB、每一次觸發(fā)Flush都會(huì)生成新的HFileC、在HBase中,由HMaster直接管理RegionD、HBase允許多臺(tái)HRegionServer同時(shí)工作【正確答案】:ABD66.某大數(shù)據(jù)業(yè)務(wù)人員因誤操作,導(dǎo)致某條Hive的Insert語句執(zhí)行了多次,使得數(shù)據(jù)出現(xiàn)了重復(fù)的現(xiàn)象,為了避免下次再次出現(xiàn)這種問題,以下哪些操作是可取的?A、改造SQL語句,添加關(guān)鍵字Overwrite使得數(shù)據(jù)以覆蓋的方式寫入B、改造SQL語句,在插入前添加清空操作如truncateC、添加Hive表的唯一索引,保證數(shù)據(jù)不重復(fù)-D、添加權(quán)限,使得業(yè)務(wù)人員只能執(zhí)行單次插入。【正確答案】:CD67.HBase存儲(chǔ)模型包含以下哪些選項(xiàng)?A、列族(ColumnFamily)B、行鍵(RowKey)C、數(shù)據(jù)塊編號(hào)(DataBlockIDD、時(shí)間戳(TimeStamp)【正確答案】:ABCD68.下列是ElasticSearch批量索引流程,請(qǐng)選擇正確的順序()A、主分片節(jié)點(diǎn)按序操作,完成一個(gè)操作后再發(fā)送給其余復(fù)制節(jié)點(diǎn)執(zhí)行B、主分片節(jié)點(diǎn)報(bào)告給請(qǐng)求節(jié)點(diǎn)并返回至客戶端C、客戶端發(fā)送批量索引請(qǐng)求至任意節(jié)點(diǎn)后,節(jié)點(diǎn)將轉(zhuǎn)發(fā)請(qǐng)求至對(duì)應(yīng)主分片節(jié)點(diǎn)D、復(fù)制節(jié)點(diǎn)操作完成報(bào)告給主分片節(jié)點(diǎn)【正確答案】:ABCD69.華為MRS服務(wù)具有以下哪些優(yōu)勢(shì)?A、高可用B、多場(chǎng)景融合C、存算分離D、彈性計(jì)算【正確答案】:ABCD70.數(shù)據(jù)倉庫分層包括以下哪些選項(xiàng)?A、DWD層B、DWS層C、ADS層D、ODS層【正確答案】:ABCD71.關(guān)于GES的RESTful接口,以下描述中正確的有哪些選項(xiàng)?A、GESAPI向上層應(yīng)用提供統(tǒng)一的訪問入口,通過高度靈活的RESTAPI接口,封裝GES平臺(tái)的統(tǒng)一操作B、用戶可以通過GES的REST接口創(chuàng)建edgeIA,BelC、GES的REST請(qǐng)求分為Select,Put,Create和DeleteD、用戶可以通過GES的REST接口查詢數(shù)據(jù)點(diǎn)的信息【正確答案】:ABD72.Hive架構(gòu)中Driver包含以下哪些組件?A、ExecutorB、ChannelC、OptimizerD、Compiler【正確答案】:ACD73.關(guān)于Hive的優(yōu)點(diǎn),以下哪些說法是正確的?A、Hive支持多種編程語言,包括Java和Python都可對(duì)接Hive進(jìn)行使用B、Hive速度非???,可以支特毫秒級(jí)時(shí)延的分析應(yīng)用C、理論上Hive依賴硬件程度較低,可適應(yīng)一般的普通機(jī)器D、Hive支持雙MetaStore機(jī)制,提高容錯(cuò)性【正確答案】:ACD74.以下哪些場(chǎng)景可以使用HBase作為存儲(chǔ)系統(tǒng)?A、Row-Key查詢B、滿足ACID特性C、海量數(shù)據(jù)存儲(chǔ)D、大文件(T【正確答案】:ACD75.Hive可以直接訪問以下哪些組件?A、HDFSB、DockerC、TensorFlowD、HBase【正確答案】:AD76.關(guān)于Flink的任務(wù)調(diào)度,請(qǐng)選擇正確的順序()A、用戶提交的代碼生成StreamGraphB、經(jīng)過優(yōu)化生成JobGraphC、提交給JobManager進(jìn)行處理,根據(jù)JobGraph生成ExecutionGraphD、JobManager根據(jù)ExecutionGraph對(duì)Job進(jìn)行調(diào)度【正確答案】:ABCD77.Kafka創(chuàng)建Topic時(shí)如何將分區(qū)放置到不同的Broker中,請(qǐng)選擇正確的順序()A、第一個(gè)分區(qū)的第一個(gè)副本放置位置是隨機(jī)從brokerList選擇的B、其他分區(qū)的第一個(gè)副本放置位置相對(duì)于第0個(gè)分區(qū)依次往后移C、剩余的副本相對(duì)干第一個(gè)副本放置立置其實(shí)是由nextReplicaShift決定的,而這個(gè)數(shù)也是隨機(jī)產(chǎn)生的D、副本因子不能大于Broker的個(gè)數(shù)【正確答案】:ABCD78.Hive組件的Driver由以下哪些項(xiàng)組成?A、MetaStoreB、CompilerC、ExecutorD、Optimizer【正確答案】:BCD79.以下關(guān)于HBase刪除數(shù)據(jù)操作的描述中,哪些選項(xiàng)是正確的?A、對(duì)于一張正在使用的表,可以直接使用drop命令刪除整張表,而不需要其他任何操作B、HBase可利用Truncate命令清空表中數(shù)據(jù),并創(chuàng)建一張新表,C、刪除某單元格數(shù)據(jù),執(zhí)行命令:delete'cx_table_stu01','20200002','cf1:age'D、刪除整行數(shù)據(jù),執(zhí)行命令:deleteall'cx_table_stu01','20200002'【正確答案】:BCD80.以下哪些選項(xiàng)是Loader組件的特點(diǎn)?()A、圖形化B、高性能C、高可靠D、安全【正確答案】:ABCD81.以下哪些選項(xiàng)為當(dāng)前大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的特點(diǎn)?A、規(guī)模較大B、增速緩慢C、增速很快D、規(guī)模較小【正確答案】:AC82.Flume傳輸數(shù)據(jù)過程中,為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù),可以使用以下哪幾種Channel類型?A、FileChannelB、MemoryChannelC、HDFSChannelD、JDBCChannel【正確答案】:AD83.關(guān)于華為云MRS中Loader的描述,以下哪些選頂是正確的?多選A、Loader頁面是基于開源SqoopWebUI的圖形化數(shù)據(jù)遷移管理工具,該頁面托管在Hue的WebUl中B、Loader提供定時(shí)調(diào)度任務(wù),周期性執(zhí)行ETL作業(yè)C、Loader提供可視化向?qū)降淖鳂I(yè)配置管理界面D、Loader在界面中可指定多種不同的數(shù)據(jù)源、配置數(shù)據(jù)的清洗和轉(zhuǎn)換步驟、配置集群存儲(chǔ)系統(tǒng)等【正確答案】:ABCD84.以下關(guān)于華為云MRS提供的基于天氣大數(shù)據(jù)進(jìn)行海量數(shù)據(jù)離線分析應(yīng)用場(chǎng)景的描述中,哪些選項(xiàng)是正確的?A、可以利用Hive實(shí)現(xiàn)TB/PB級(jí)的數(shù)據(jù)分析B、可以通過可視化ETL工具Loader,將數(shù)據(jù)導(dǎo)出到DWS.完成BI分析C、可以使用OBS實(shí)現(xiàn)低成本存儲(chǔ)D、離線批處理必須依賴Flink組件完成計(jì)算【正確答案】:ABC85.ElasticSearch用于日志搜索和分析,離不開其擁有的生態(tài)圈系統(tǒng)和解決方案,這些開源軟件之間互相配合使用,完美銜接,高效地滿足了多場(chǎng)景的應(yīng)用。那么其生態(tài)系統(tǒng)具體包括以下哪些內(nèi)容?A、數(shù)據(jù)持久化與分析層ElasticsearchB、數(shù)據(jù)接入層LogstashC、用戶接入層KibanaD、插件擴(kuò)展層【正確答案】:ABCD86.HDFS結(jié)構(gòu)中包含以下哪些組件?A、NameNodeB、SourceC、DataNodeD、Sink【正確答案】:AC87.以下哪些選項(xiàng)屬于HBase基本架構(gòu)的一部分?A、HMasterB、DataBlockC、RDDD、Store【正確答案】:AD88.以下關(guān)于無界流的描述,哪些項(xiàng)是正確的?A、處理無界數(shù)據(jù)通常要求以特定順序攝取事件B、無界流的數(shù)據(jù)必須持續(xù)處理,即數(shù)據(jù)被讀取后需要立刻處理C、有定義流的開始,但沒有定義流的結(jié)束D、數(shù)據(jù)源會(huì)無休止地產(chǎn)生數(shù)據(jù)【正確答案】:ABCD89.ElasticSearch在部署時(shí),對(duì)Linux的設(shè)置有哪些優(yōu)化方法?A、堆內(nèi)存設(shè)置為:MinB、設(shè)置最大文件句柄數(shù)C、線程池+隊(duì)列大小根據(jù)業(yè)務(wù)需要做調(diào)整D、關(guān)閉緩存Swap【正確答案】:BC90.2019年以后,華為云數(shù)據(jù)湖CloudDataLake中分析引擎包含以下哪些組件?()A、SparkB、TensorFlowC、FlinkD、Presto【正確答案】:ABCD91.Redis使用場(chǎng)景包含以下哪些特點(diǎn)?A、高性能B、豐富數(shù)據(jù)結(jié)構(gòu)存取C、支持持久化D、低時(shí)延【正確答案】:ABCD92.關(guān)于GES的應(yīng)用場(chǎng)景,以下哪些選項(xiàng)是正確的?A、工業(yè):基于知識(shí)圖譜的設(shè)備故障診斷和預(yù)警B、物流和網(wǎng)規(guī):最優(yōu)路徑推薦C、金融:實(shí)時(shí)推薦、實(shí)時(shí)反欺詐,基于知識(shí)圖譜的風(fēng)控(信貸、保險(xiǎn))D、社交分析:尋找特定愛好的好友,或者通過好友的好友,找到用戶可能認(rèn)識(shí)的好友【正確答案】:ABCD93.以下哪些選項(xiàng)不是GES圖數(shù)據(jù)庫的典型應(yīng)用場(chǎng)景?A、氣象局根據(jù)過去48小時(shí)的氣象數(shù)據(jù),預(yù)測(cè)明天的降雨概率B、某社交軟件根據(jù)用戶的好友信息推薦潛在好友C、某運(yùn)營(yíng)商通過通話記錄來標(biāo)記用戶社交圈D、某商店根據(jù)過去十年的銷售記錄預(yù)測(cè)明年的大致銷量【正確答案】:AD94.Loader具有對(duì)以下哪些數(shù)據(jù)源的讀取能力?A、HBaseB、HDFSC、HiveD、RDB【正確答案】:ABCD95.以下哪些是運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)的能力需求?A、統(tǒng)一數(shù)據(jù)采集和整合能力B、互聯(lián)網(wǎng)化的數(shù)據(jù)開放能力C、大數(shù)據(jù)分析挖掘能力D、大數(shù)據(jù)安全能力【正確答案】:ABCD96.FIink可以部署在各種資源提供者上,也可以作為裸機(jī)硬件上的獨(dú)立群集,這里的資源提供者可以是()A、GESB、KubernetesC、YARND、ApacheMesos【正確答案】:BCD97.以下哪些項(xiàng)屬于實(shí)時(shí)數(shù)據(jù)處理系統(tǒng)的訴求?A、吞吐量高B、多數(shù)據(jù)源支持C、處理速度快D、可靠性高【正確答案】:ABCD98.Kafka消息傳輸保障通常會(huì)選用那種策略?AtMostOnceB、ExA,CtlyOnceC、AtLeaseOnceD、OnlyOnce【正確答案】:ABC99.以下關(guān)于FileChannel的描述中,正確的是哪些項(xiàng)?A、不同的FileChannel均需要配置多個(gè)checkpoint目錄B、不同的FileChannel均需要配置一個(gè)checkpoint目錄C、支持對(duì)數(shù)據(jù)進(jìn)行持久化D、需要配置數(shù)據(jù)目錄和checkpoint目錄【正確答案】:ACD100.某大數(shù)據(jù)業(yè)務(wù)人員因誤操作,導(dǎo)致刪除了部分HDFS的業(yè)務(wù)數(shù)據(jù)。為了避免再次出現(xiàn),如何從技術(shù)角度出發(fā)去規(guī)避這個(gè)問題?A、開啟HDFS的回收站機(jī)制,及時(shí)恢復(fù)數(shù)據(jù)。B、禁止HDFS的刪除操作。C、對(duì)業(yè)務(wù)人員進(jìn)行權(quán)限劃分,避免非法或敏感操作,如刪除等。D、平時(shí)注重安全信息的普及,多加宣傳?!菊_答案】:ABC1.實(shí)時(shí)檢索場(chǎng)景對(duì)于數(shù)據(jù)加載的要求比較高,實(shí)際業(yè)務(wù)中要求每小時(shí)加載TB級(jí)的數(shù)據(jù)。A、正確B、錯(cuò)誤【正確答案】:A2.Flink核心是一個(gè)提供了數(shù)據(jù)分發(fā)以及并行化計(jì)算的流數(shù)據(jù)處理引擎,對(duì)無界和有界數(shù)據(jù)流進(jìn)行狀態(tài)計(jì)算。A、正確B、錯(cuò)誤【正確答案】:A3.數(shù)據(jù)湖需要高性能、Schema校驗(yàn)、事務(wù)型更新等能力,同時(shí)支持多個(gè)開源計(jì)算引擎生態(tài)。A、正確B、錯(cuò)誤【正確答案】:A4.一個(gè)Group內(nèi)的Consumer只能消費(fèi)不同的partition。A、正確B、錯(cuò)誤【正確答案】:A5.在Hive的SQL語句執(zhí)行中,因?yàn)間roupby等關(guān)鍵字的使用會(huì)導(dǎo)致數(shù)據(jù)傾斜。因此為了表面數(shù)據(jù)傾斜,應(yīng)禁止該類操作執(zhí)行。A、正確B、錯(cuò)誤【正確答案】:B6.Impala使用SQL的方式運(yùn)行。A、正確B、錯(cuò)誤【正確答案】:A7.Body用來存放數(shù)據(jù),數(shù)據(jù)結(jié)構(gòu)為字節(jié)數(shù)組(ByteArray)。A、正確B、錯(cuò)誤【正確答案】:A8.實(shí)時(shí)檢索的金融場(chǎng)景應(yīng)用中,可以查詢交易憑證,追溯交易,以及查詢客戶信用記錄,幫助客戶快速借款。A、正確B、錯(cuò)誤【正確答案】:A9.每個(gè)KafkaTopic由一個(gè)或多個(gè)consumergroup組成,屬于同一個(gè)consumergroup的consumer都具有相同的groupID。A、正確B、錯(cuò)誤【正確答案】:B10.某公司大數(shù)據(jù)業(yè)務(wù)存在早高峰特點(diǎn),因此可以借助于華為云MRS服務(wù)依據(jù)用戶的預(yù)設(shè)策略,自動(dòng)調(diào)整計(jì)算資源,使節(jié)點(diǎn)數(shù)自動(dòng)隨業(yè)務(wù)負(fù)載變化而變化,保證業(yè)務(wù)峰值時(shí)集群平穩(wěn)健康運(yùn)行,并降低整體使用成本。A、正確B、錯(cuò)誤【正確答案】:A11.Flink處理數(shù)據(jù)是無狀態(tài)的,處理一個(gè)事件與之前的事件無關(guān)。A、正確B、錯(cuò)誤【正確答案】:B12.大數(shù)據(jù)場(chǎng)景中對(duì)于數(shù)據(jù)的大小而言指的是數(shù)據(jù)的總量需要大,對(duì)于數(shù)據(jù)的數(shù)量要求不高。A、正確B、錯(cuò)誤【正確答案】:B13.GESAPI向上層應(yīng)用提供統(tǒng)一的訪問入口,通過高度靈活的RESTAPI接口,封裝GES平臺(tái)的統(tǒng)一操作。A、正確B、錯(cuò)誤【正確答案】:A14.BloomFilter是一個(gè)列族(cf)級(jí)別的配置屬性,如果你在表中設(shè)置了BloomFilter,那么HBase會(huì)在生成StoreFilel時(shí)包含一份具有BloomFilter結(jié)構(gòu)的數(shù)據(jù),稱其為Metablock.A、正確B、錯(cuò)誤【正確答案】:A15.云數(shù)融合指的是大數(shù)據(jù)基礎(chǔ)設(shè)施上云,改變大數(shù)據(jù)服務(wù)的提供方式,各大云廠商均開始提供各類大數(shù)據(jù)服務(wù)產(chǎn)品,以滿足客戶的需求。()A、正確B、錯(cuò)誤【正確答案】:A16.在海量日志離線分析過程中,數(shù)據(jù)分析師可以將網(wǎng)站日志收集到HDFS上存儲(chǔ),然后把日志加載到Hive中進(jìn)行統(tǒng)計(jì)分析與建模。A、正確B、錯(cuò)誤【正確答案】:A17.Flume支持級(jí)聯(lián)(多個(gè)Flume對(duì)接起來),合并數(shù)據(jù)的能力。A、正確B、錯(cuò)誤【正確答案】:A18.實(shí)時(shí)流處理系統(tǒng)中,要求數(shù)據(jù)權(quán)限和資源隔離,多種流處理應(yīng)用之間要進(jìn)行資源控制和隔離,防止發(fā)生資源爭(zhēng)搶。A、正確B、錯(cuò)誤【正確答案】:A19.Spark中的JDBCServer不是單點(diǎn)服務(wù),因此非常適合處理海量數(shù)據(jù)和高并發(fā)任務(wù)()A、正確B、錯(cuò)誤【正確答案】:B20.實(shí)時(shí)檢索技術(shù)通常需要處理復(fù)雜的統(tǒng)計(jì)類分析和查詢,因此比較適合使用Hive進(jìn)行分析判斷A、正確B、錯(cuò)誤【正確答案】:B21.MRS的Flink不支Kerberos持等進(jìn)行認(rèn)證,但支持SSL加密傳輸。A、正確B、錯(cuò)誤【正確答案】:B22.Kettlel中有兩種transformation腳本文件(轉(zhuǎn)換ktr結(jié)尾)和job(任務(wù)kjb結(jié)尾)。A、正確B、錯(cuò)誤【正確答案】:A23.在數(shù)字化轉(zhuǎn)型以及多樣數(shù)據(jù)、算力、業(yè)務(wù)敏捷的驅(qū)動(dòng)下,大數(shù)據(jù)焦點(diǎn)轉(zhuǎn)向云服務(wù)方式創(chuàng)新,更加敏捷,成本更優(yōu)。A、正確B、錯(cuò)誤【正確答案】:A24.在刪除表的時(shí)候,外部表只刪除元數(shù)據(jù),不刪除實(shí)際數(shù)據(jù)。()A、正確B、錯(cuò)誤【正確答案】:A25.數(shù)據(jù)實(shí)時(shí)處理是指數(shù)據(jù)產(chǎn)生后立即就被消費(fèi)。A、正確B、錯(cuò)誤【正確答案】:B26.Spark支持流與流之間的連接操作。A、正確B、錯(cuò)誤【正確答案】:A27.為了減少磁盤寫入的次數(shù),Broker會(huì)將消息暫時(shí)buffer起來,當(dāng)消息的個(gè)數(shù)達(dá)到一定閥值時(shí),再flush到磁盤,這樣減少了磁盤調(diào)用的次數(shù)。A、正確B、錯(cuò)誤【正確答案】:A28.Redis是一個(gè)高性能key-value內(nèi)存數(shù)據(jù)庫。A、正確B、錯(cuò)誤【正確答案】:A29.在HBase中,BloomFilter的數(shù)據(jù)被存在RDD的元數(shù)據(jù)中,一旦寫入無法更新,因?yàn)镽DD是不可變的。開啟BloomFilter會(huì)有一定的存儲(chǔ)及內(nèi)存cache開銷。A、正確B、錯(cuò)誤【正確答案】:B30.在Spark中,RDD通過數(shù)據(jù)塊的方式將數(shù)據(jù)存放在內(nèi)存中,并且采用三副本機(jī)制提高數(shù)據(jù)的穩(wěn)定性。A、正確B、錯(cuò)誤【正確答案】:B31.Hive中默認(rèn)創(chuàng)建的是外部表A、正確B、錯(cuò)誤【正確答案】:B32.Flume的Source可以不用和channel關(guān)聯(lián),直接連接到sink。A、正確B、錯(cuò)誤【正確答案】:B33.實(shí)時(shí)流處理要求秒級(jí)或者毫秒級(jí)時(shí)延A、正確B、錯(cuò)誤【正確答案】:A34.Consumeri通過Pull的方式從Broker獲取數(shù)據(jù)消費(fèi)。A、正確B、錯(cuò)誤【正確答案】:A解析:

四.填空35.大數(shù)據(jù)離線批處理支持SQL類作業(yè)和自定義作業(yè)。A、正確B、錯(cuò)誤【正確答案】:A36.在使用HBaseJavaAPI時(shí),用戶可以通過org,Apache.Hadoop.hbase.client.A,Dmin實(shí)例的createTable快速建表,創(chuàng)建表后整張表只有一個(gè)Region,隨著數(shù)據(jù)量的增加會(huì)自動(dòng)分裂成多個(gè)Region。A、正確B、錯(cuò)誤【正確答案】:A37.在華為MRS中的Manager上,管理人員可以一鍵式完成集群的安裝部署、升級(jí)、參數(shù)配置、組件啟停等操作。A、正確B、錯(cuò)誤【正確答案】:A38.MRS的安全模式一般是用于生產(chǎn)環(huán)境。A、正確B、錯(cuò)誤【正確答案】:A39.HBase支持存儲(chǔ)大表數(shù)據(jù),表格規(guī)??蛇_(dá)數(shù)十億行、數(shù)百萬列。A、正確B、錯(cuò)誤【正確答案】:A40.任何完整的大數(shù)據(jù)平臺(tái),一般包括以下的幾個(gè)過程,數(shù)據(jù)采集一>數(shù)據(jù)存儲(chǔ)一>數(shù)據(jù)處理一>數(shù)據(jù)展現(xiàn)(可視化,報(bào)表和監(jiān)控)。其中,數(shù)據(jù)采集是所有數(shù)據(jù)系統(tǒng)必不可少的一個(gè)環(huán)節(jié),隨著大數(shù)據(jù)越來越被重視,數(shù)據(jù)采集的挑戰(zhàn)也變的尤為突出。A、正確B、錯(cuò)誤【正確答案】:A41.窄依賴往往對(duì)應(yīng)著shuffle操作,需要在運(yùn)行過程中將同一個(gè)父RDD的分區(qū)傳入到不同的子RDD分區(qū)中,中間可能涉及多個(gè)節(jié)點(diǎn)之間的數(shù)據(jù)傳輸。A、正確B、錯(cuò)誤【正確答案】:A42.某大數(shù)據(jù)業(yè)務(wù)人員希望確保某份關(guān)鍵數(shù)據(jù)在Hive中不會(huì)因?yàn)閐rop操作導(dǎo)致數(shù)據(jù)別除。他可以采用內(nèi)部表的方式來實(shí)現(xiàn),drop操作時(shí)只會(huì)刪除元數(shù)據(jù)而不會(huì)刪除表數(shù)據(jù)。A、正確B、錯(cuò)誤【正確答案】:B43.GES基于MySQL的分布式存儲(chǔ)機(jī)制,能夠處理海量數(shù)據(jù)。A、正確B、錯(cuò)誤【正確答案】:B44.Hive架構(gòu)中Optimizer用于編譯HiveQL并將其轉(zhuǎn)化為一系列相互依賴的Map/Reduce任務(wù)。A、正確B、錯(cuò)誤【正確答案】:B45.Hive中刪除外部表時(shí),元數(shù)據(jù)和數(shù)據(jù)會(huì)一起被刪除。A、正確B、錯(cuò)誤【正確答案】:B46.在ElasticSearch中,用戶可以通過Head請(qǐng)求查詢某個(gè)索引是否存在。A、正確B、錯(cuò)誤【正確答案】:A47.開啟BloomFilter會(huì)有一定的磁盤存儲(chǔ)空間及內(nèi)存cA,Che的額外開銷A、正確B、錯(cuò)誤【正確答案】:A48.對(duì)于大數(shù)據(jù)集群而言,只要開啟了HDFS的回收站機(jī)制,那么可以隨意刪除數(shù)據(jù),出錯(cuò)了恢復(fù)即可。A、正確B、錯(cuò)誤【正確答案】:B49.HBase的Region在split

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論