版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第頁(yè)HCIP大數(shù)據(jù)復(fù)習(xí)測(cè)試附答案1.關(guān)于HBase建表語(yǔ)句,以下描述中錯(cuò)誤的是哪一項(xiàng)?A、利用HBase的JavaAPI時(shí),需要用put語(yǔ)句完成建表B、在建表時(shí)可以預(yù)先創(chuàng)建多個(gè)RegionC、在華為云MRS提供的HBaseshell客戶端中建表時(shí),需指定至少一個(gè)列族名稱D、在HBaseshell客戶端中可以通過create命令建表【正確答案】:A2.關(guān)于HBase中的BloomFilter,以下描述中錯(cuò)誤的是哪一項(xiàng)?A、BloomFilter用來優(yōu)化一些隨機(jī)讀取的場(chǎng)景,即Get場(chǎng)景BloomFilter可以被用來快速的判斷一條數(shù)據(jù)在一個(gè)大的數(shù)據(jù)集合中是否存在C、如果BloomFilter判斷結(jié)果為“該條數(shù)據(jù)不存在”,這一結(jié)果擁有一定的誤判率D、HBase的BloomFilter的相關(guān)數(shù)據(jù),被保存在HFile中【正確答案】:C3.以下哪一選項(xiàng)不是基于數(shù)據(jù)湖構(gòu)建一站式Al開發(fā)平臺(tái)ModelArts的特點(diǎn)?AI全流程開發(fā):高精度、高效率完成開發(fā)任務(wù)B、可視化管理:數(shù)據(jù)準(zhǔn)備、模型構(gòu)建部署可視化管理C、需自行安裝下載TensorFlow、PyTorch等主流計(jì)算框架D、在線推理、批量推理和邊緣推理,滿足多種業(yè)務(wù)場(chǎng)景訴求【正確答案】:C4.如果想把Redis的Key中存儲(chǔ)的數(shù)字值減1,該使用下列哪一個(gè)命令?A、incrbyB、decrC、decrbyD、incr【正確答案】:B5.實(shí)時(shí)檢索應(yīng)用場(chǎng)景不包含以下哪一順?A、通過用戶姓名查找購(gòu)房記錄B、通過用戶銀行卡號(hào)查找轉(zhuǎn)賬記錄C、通過用戶興趣愛好推薦影視作品D、通過用戶身份證號(hào)查找住宿記錄【正確答案】:C6.以下哪一個(gè)選項(xiàng)不是ElasticSearch底層存放索引快照的位置?A、HadoopHDFSB、LocalFileSystemC、SharedFileSystemD、IndexModule【正確答案】:D7.Hive中hive>DESCRIBEinvites這一命令可以實(shí)現(xiàn)以下哪一功能?A、修改表B、瀏覽表C、描述表D、創(chuàng)建表【正確答案】:C8.HBase的主HMaster是如何選舉的?A、由RegionServer進(jìn)行裁決。B、HMaster為雙主模式,不需要進(jìn)行裁決。C、隨機(jī)選取D、通過ZooKeeper進(jìn)行裁決。【正確答案】:D9.關(guān)于ElasticSearch生態(tài)圈,以下描述中錯(cuò)誤的是哪一項(xiàng)?A、elasticsearch-head:深度集成Hadoop和ElasticSearch的項(xiàng)目,是官方維護(hù)的一個(gè)子項(xiàng)目Beats:專門用于發(fā)送數(shù)據(jù)的平臺(tái),可以將數(shù)據(jù)無(wú)縫傳輸給Logstash或是ElasticSearchC、Logstash:具備實(shí)時(shí)數(shù)據(jù)傳輸能力的管道,著重日志相關(guān)處理D、Kibana:開源的分析和可視化平臺(tái),基于ElasticSearch的搜索與分析能力,拿到用于上層分析和可視化需要的結(jié)果【正確答案】:A10.關(guān)于分布式圖數(shù)據(jù)庫(kù),以下描述正確的是哪一項(xiàng)?A、圖數(shù)據(jù)庫(kù)將數(shù)據(jù)切分為多個(gè)數(shù)據(jù)塊進(jìn)行存儲(chǔ),數(shù)據(jù)塊大小固定128MBB、圖數(shù)據(jù)庫(kù)以"圖"這種數(shù)據(jù)結(jié)構(gòu)來存儲(chǔ)和查詢數(shù)據(jù)C、圖數(shù)據(jù)庫(kù)采用ER實(shí)體關(guān)系進(jìn)行存儲(chǔ)D、圖數(shù)據(jù)庫(kù)與關(guān)系型數(shù)據(jù)庫(kù)可以靈活轉(zhuǎn)化【正確答案】:B11.Spark讀取任務(wù)參數(shù)優(yōu)先級(jí)最高的是以下哪一選項(xiàng)?A、動(dòng)態(tài)參數(shù)B、代碼配置C、配置文件D、客戶端配置【正確答案】:B12.HDFS里元數(shù)據(jù)持久化過程包括Fslmage持久化和Editlog持久化,其中EditLog持久化是通過以下哪一種方式完成的?A、圖片B、日志C、網(wǎng)頁(yè)D、快照【正確答案】:B13.以下關(guān)于Flink的描述,錯(cuò)誤的是哪一項(xiàng)?A、Flink在維護(hù)一次完整的的應(yīng)用狀態(tài)時(shí),不能無(wú)縫修復(fù)錯(cuò)誤B、Flink是一個(gè)批處理和流處理結(jié)合的統(tǒng)一計(jì)算框架C、Flink支持大規(guī)模運(yùn)行,在上千個(gè)節(jié)點(diǎn)運(yùn)行時(shí)有很好的吞吐量和低延遲D、Flink沒有單點(diǎn)故障,提供高吞吐量和低延遲的能力【正確答案】:A14.Hive表與MySQL類似存在分區(qū)的概念,那么對(duì)于Hive的分區(qū),以下描述中,正確的是哪一項(xiàng)?A、Hive的分區(qū)針對(duì)的是文件,分桶針對(duì)的是文件夾。B、Hive的分區(qū)數(shù)量可以通過參數(shù)動(dòng)態(tài)生成。C、Hive的分區(qū)和分桶是以一個(gè)概念。D、Hive的分區(qū)字段與MySQL一樣必須存在?!菊_答案】:B15.關(guān)于HBase客戶端的使用,以下描述錯(cuò)誤的是哪一選項(xiàng)?A、插入數(shù)據(jù)需要用到put命令B、無(wú)法通過HBase客戶端創(chuàng)建命名空間C、創(chuàng)建表時(shí)可以指定列族名稱D、使用get命令查詢數(shù)據(jù)時(shí)需要指定行鍵信息【正確答案】:B16.在HDFS的架構(gòu)中NameNode主要存儲(chǔ)元數(shù)據(jù)。以下哪個(gè)不是元數(shù)據(jù)?A、文件位置B、文件大小C、文件權(quán)限D(zhuǎn)、文件數(shù)據(jù)【正確答案】:D17.Redis中Hash數(shù)字類型不含以下哪種操作?A、hgetallB、hsetC、hmgetD、size【正確答案】:D18.關(guān)于Spark中的DataSet,以下哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、DataSet與RDD高度類似,但在利用SparkSQL進(jìn)行處理時(shí)性能比RDD好B、DataSet不需要反序列化就可執(zhí)行大部分操作C、DataSet是一個(gè)由特定域的對(duì)象組成的強(qiáng)類型集合DataSet執(zhí)行sot、filter、shuffle等操作需要進(jìn)行反序列化【正確答案】:A19.關(guān)于StructuredStreaming時(shí)間語(yǔ)義以下哪一項(xiàng)是正確的?A、StructuredStreaming支持watermark機(jī)制處理滯后數(shù)據(jù)參考B、事件時(shí)間是指每臺(tái)機(jī)器的系統(tǒng)時(shí)間,當(dāng)流程序采用處理時(shí)間時(shí),將使用各個(gè)實(shí)例的機(jī)器時(shí)間C、StructuredStreaming僅支持事件時(shí)間D、StructuredStreaming僅支持處理時(shí)間【正確答案】:A20.HDFS基本系統(tǒng)架構(gòu)中,副本配置通常存儲(chǔ)()份。A、1B、2C、3D、4【正確答案】:C21.以下哪個(gè)選項(xiàng)屬于大數(shù)據(jù)消息系統(tǒng)?A、HDFSB、MapReduceC、YarnD、Kafka【正確答案】:D22.以下描述中,哪一個(gè)選項(xiàng)屬于HDFS的使用場(chǎng)景?A、海量氣象數(shù)據(jù)存儲(chǔ)B、集群資源調(diào)配管理C、社交媒體數(shù)據(jù)流式分析D、數(shù)據(jù)采集與分發(fā)【正確答案】:A23.以下關(guān)于實(shí)時(shí)處理解決方案與其它解決方案的關(guān)系,錯(cuò)誤的是哪一項(xiàng)?A、實(shí)時(shí)處理系統(tǒng)需要備份存儲(chǔ)B、實(shí)時(shí)處理系統(tǒng)不需要考慮HAC、實(shí)時(shí)處理處理后的數(shù)據(jù)可用于實(shí)時(shí)檢索D、實(shí)時(shí)處理處理后的數(shù)據(jù)可直接應(yīng)用至業(yè)務(wù)系統(tǒng)【正確答案】:B24.關(guān)于ElasticSearch的說法,下列錯(cuò)誤的是哪一項(xiàng)?A、ElasticSearch可以把一個(gè)完整的索引分成多個(gè)分片B、ElasticSearch可以不需要Zookeeper的支特、C、EsMaster可以臨時(shí)管理集群級(jí)別刷的一些變更D、ElasticSearch可以設(shè)置多個(gè)索引的副本【正確答案】:B25.在華為云GES中,想要給圖g中id為"Katherine"的用戶添加朋友為"zhangsan"。以下哪一個(gè)選項(xiàng)能正確實(shí)現(xiàn)上述目的?A、g.addV('friends').from(g.V("Katherine")).to(g.V("zhangsan"))B、g.addV('friends').from(g.V("zhangsan")).to(g.V("Katherine"))C、g.addE('friends').from(g.V("zhangsan")).to(g.V("Katherine"))D、g.addE('friends').from(g.V("Katherine").to(g.V("zhangsan"))【正確答案】:D26.以下關(guān)于GES四大特點(diǎn)的描述,哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、查詢分析一體:提供豐富的圖分析算法,實(shí)現(xiàn)了查詢分析一體化,可以為關(guān)系分析、路徑規(guī)劃、營(yíng)銷推薦等業(yè)務(wù)提供多樣的分析能力B、高性能:對(duì)分布式圖形計(jì)算引擎進(jìn)行了深度優(yōu)化,能達(dá)到小時(shí)級(jí)響應(yīng)速度的查詢能力C、簡(jiǎn)單易用:支持Gremlin查詢語(yǔ)言,兼容不同用戶的使用習(xí)慣D、大規(guī)模:具有高效的數(shù)據(jù)組織能力,可以更有效地對(duì)百億節(jié)點(diǎn)千億邊規(guī)模的數(shù)據(jù)進(jìn)行查詢與分析【正確答案】:B27.假設(shè)現(xiàn)在要做一個(gè)可以根據(jù)線索指導(dǎo)運(yùn)維人員進(jìn)行排障的功能,你建議選擇下列哪個(gè)工具實(shí)現(xiàn)該功能?A、LuceneB、HBaseC、GESD、ElasticSearch【正確答案】:D28.以下哪一項(xiàng)不是傳統(tǒng)數(shù)據(jù)處理系統(tǒng)面臨的問題?A、有限的擴(kuò)展能力B、海量數(shù)據(jù)的存儲(chǔ)成本高C、大數(shù)據(jù)處理能力不足D、數(shù)據(jù)源多樣【正確答案】:D29.關(guān)于HBase的RowKey,以下描述中錯(cuò)誤的是哪一項(xiàng)?A、RowKey默認(rèn)最大長(zhǎng)度64KB,實(shí)際應(yīng)用中一般為10~100字節(jié)B、在HBase中,每一個(gè)RowKey都是一串字節(jié)數(shù)組C、RowKey是一個(gè)長(zhǎng)整型對(duì)象D、RowKey默認(rèn)按照字典序存儲(chǔ)【正確答案】:C30.以下哪一項(xiàng)不屬于ElasticSearch客戶端可以執(zhí)行的curl命令?A、curl-XPOSTB、curl-XSELECTC、curl-XGETD、curl-XPUT【正確答案】:B31.Spark處理數(shù)據(jù)時(shí)產(chǎn)生的中間產(chǎn)物會(huì)存放到以下哪一選項(xiàng)中?A、磁盤B、網(wǎng)絡(luò)C、內(nèi)存D、云上【正確答案】:C32.編寫Scala代碼時(shí),通過以下哪個(gè)算子可以實(shí)現(xiàn)數(shù)據(jù)過?A、filterB、collectC、mapD、flatmap【正確答案】:A33.以下哪一選項(xiàng)不是企業(yè)級(jí)大數(shù)據(jù)平臺(tái)的特點(diǎn)?A、可維護(hù)性差B、可平滑拓展C、數(shù)據(jù)共享D、資源共享【正確答案】:A34.Redis中哪個(gè)命令是查看鍵的剩余生存時(shí)間?A、ttlB、expireatC、persistD、expire【正確答案】:A35.HBase的Region的是由哪個(gè)服務(wù)進(jìn)程來管理的?A、HRegionServerB、ZooKeeperC、DataNodeD、HMaster【正確答案】:A36.StructuredStreaming不支持以下哪種計(jì)算時(shí)間?A、注入時(shí)間B、事件時(shí)間C、結(jié)束時(shí)間D、處理時(shí)間【正確答案】:C37.以下哪一項(xiàng)不屬于目前經(jīng)常定義的Sink類型。A、ElasticSearchSinkB、RedisSinkC、KafkaSinkD、ODBCSink【正確答案】:D38.Kafka日志數(shù)據(jù)文件默認(rèn)保留的最長(zhǎng)時(shí)間是多少小時(shí)?A、96B、48C、24D、168【正確答案】:D39.以下有關(guān)Hive的左外連接和右外連接的描述中,錯(cuò)誤的是哪一個(gè)選項(xiàng)?A、對(duì)于左外連接和右外連接,where條件是在0n條件執(zhí)行之后才會(huì)執(zhí)行B、左外連接與內(nèi)連接概念相同,但右外連接與內(nèi)連接概念不同C、右外連接以右側(cè)表為基準(zhǔn),如果左側(cè)表和on條件匹配的數(shù)據(jù)則顯示出現(xiàn),不匹配的數(shù)據(jù)顯示NULLD、左外連接以左側(cè)表為基準(zhǔn),如果右側(cè)表和on條件匹配的數(shù)據(jù)則顯示出來,否則顯示NULL【正確答案】:B40.某大數(shù)據(jù)開發(fā)人員在創(chuàng)建Hive表結(jié)構(gòu)時(shí),發(fā)現(xiàn)原先創(chuàng)建的表存儲(chǔ)格式出現(xiàn)了問題。對(duì)于這一現(xiàn)象,以下描述中,錯(cuò)誤的是哪一項(xiàng)?A、不同的存儲(chǔ)格式會(huì)影響表的處理效率B、必須修正回來,不然會(huì)導(dǎo)致數(shù)據(jù)無(wú)法查詢C、可以通過alter命令進(jìn)行修改D、錯(cuò)誤的表存儲(chǔ)格式會(huì)影響10A,D命令加載,導(dǎo)致數(shù)據(jù)無(wú)法正常導(dǎo)入【正確答案】:B41.以下關(guān)于Redis持久化的描述,錯(cuò)誤的是哪一項(xiàng)?A、RDB方式的持久化是通過快照完成的B、AOF方式的持久化是通過日志文件的方式C、可以手動(dòng)執(zhí)行save或者bgsave命令讓redis執(zhí)行快照D、Redis默認(rèn)的持久化方式是AOF【正確答案】:D42.以下哪一選項(xiàng)不是統(tǒng)一元數(shù)據(jù)管理的優(yōu)勢(shì)?A、元數(shù)據(jù)統(tǒng)一管理、統(tǒng)一訪問和使用B、提供可視化元數(shù)據(jù)管理工具C、使用事實(shí)標(biāo)準(zhǔn)Hivemetastore接口,業(yè)務(wù)易對(duì)接D、數(shù)據(jù)訪問分散授權(quán),數(shù)據(jù)安全無(wú)保障【正確答案】:D43.關(guān)于HBase的概念視圖,以下描述中正確的是哪一項(xiàng)?A、HBase是一個(gè)面向列的非關(guān)系型數(shù)據(jù)庫(kù)B、HBase的每一行數(shù)據(jù)可以有不同的行鍵C、HBase表格數(shù)據(jù)以文件塊的形式存放在內(nèi)存中D、HBase的每一個(gè)Region都是固定大小,每個(gè)Region都是64MB【正確答案】:A44.StructuredStreaming的底層源碼是以下哪一項(xiàng)?A、JavaB、PythonCD、Scala【正確答案】:D45.HBase使用get方法讀取數(shù)據(jù)時(shí),下列哪個(gè)選項(xiàng)是需要的?A、scan.setCaching(1000)B、Deletedelete=newDelete(rowKey)C、byte[]rowKey=Bytes.toBytes("012005000201")D、List<Put>puts=newArrayList<Put>【正確答案】:C46.HBase客戶端提供了很多命令,關(guān)于list命令,下列正確是哪一項(xiàng)?A、查看所有的表B、查詢命名空間C、查看幫助命令D、查詢表數(shù)據(jù)【正確答案】:A47.企業(yè)級(jí)數(shù)據(jù)分析平臺(tái)的演進(jìn)趨勢(shì)不包括以下哪一階段A、無(wú)組織架構(gòu)階段B、單一架構(gòu)階段C、存算分離架構(gòu)階段D、存算融合架構(gòu)階段【正確答案】:A48.關(guān)于HBase集群架構(gòu)組成各部分描述錯(cuò)誤的是哪一選項(xiàng)?A、正常HBase表只有一個(gè)Region,不支持分裂B、Client可用于緩存維護(hù)已經(jīng)訪問過的Region的位置信息C、HRegionServer負(fù)責(zé)處理數(shù)據(jù)讀寫請(qǐng)求D、HMaster主要負(fù)責(zé)Region的管理工作【正確答案】:A49.下列哪一個(gè)命令可以清空Redis實(shí)例下所有數(shù)據(jù)庫(kù)的數(shù)據(jù)A、dropallB、flushallC、dropdbD、flushdb【正確答案】:B50.關(guān)于ElasticSearch的說法,下列錯(cuò)誤的是哪一項(xiàng)?A、不支持非結(jié)構(gòu)化數(shù)據(jù)B、對(duì)Lucene進(jìn)行了擴(kuò)展C、原型環(huán)境和生產(chǎn)環(huán)境可無(wú)縫切換D、能夠水平擴(kuò)展【正確答案】:A51.下列關(guān)于ElasticSearch的說法錯(cuò)誤的是哪一項(xiàng)?A、可以擴(kuò)展到上百臺(tái)服務(wù)器,處理PB級(jí)別的結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)B、分布式文件存儲(chǔ),并將每一個(gè)字段都編入索引,使其可以被搜索C、實(shí)時(shí)分析的分布式搜索引擎D、ElasticSearch可以存儲(chǔ)和檢索PB的數(shù)據(jù),只適用于離線批處理場(chǎng)景。【正確答案】:D52.關(guān)于ElasticSearch內(nèi)部架構(gòu),以下描述中錯(cuò)誤的是哪一項(xiàng)?()A、Plugins:插件可以通過自定義的方式擴(kuò)展加強(qiáng)Elasticsearch的基本功能,比如可以自定義類型映射,分詞器,本地腳本等B、transport:代表Elasticsearch內(nèi)部節(jié)點(diǎn)或集群與客戶端的交互方式,默認(rèn)內(nèi)部是使用tcp協(xié)議進(jìn)行交互C、Discovery:該模塊主要負(fù)責(zé)集群中節(jié)點(diǎn)的自動(dòng)發(fā)現(xiàn)和Master節(jié)點(diǎn)的選舉D、Gateway:代表ElasticSearch.與客戶端交流的方式【正確答案】:D53.為了提高Kafka的容錯(cuò)性,Kafka支持Partition的復(fù)制策略,以下關(guān)于LeA,DerPartition和FollowerPartition的描述哪一項(xiàng)是錯(cuò)誤的?A、Kafkat對(duì)Partition的復(fù)制需要選出一個(gè)LeA,Der,由該LeA,Der負(fù)責(zé)Partition的讀寫操作,其他的副本節(jié)點(diǎn)只是負(fù)責(zé)數(shù)據(jù)的同步B、如果LeA,Der失效,那么將會(huì)有其他Follower來接管(成為新的LeA,DerC、一個(gè)Kafka集群各個(gè)節(jié)點(diǎn)間不可能互為L(zhǎng)eA,Der和FollowerD、由于LeA,DerServer承載了全部的請(qǐng)求壓力,因此從集群的整體考慮,Kafka會(huì)將LeA,Der均橫的分散在每個(gè)實(shí)例上,來確保整體的性能穩(wěn)定【正確答案】:C54.Hive中的解釋器(complier)、優(yōu)化器(optimizer)、執(zhí)行器(executor)組件用于HQL語(yǔ)句從詞法分析、語(yǔ)法分析、編譯、優(yōu)化以及查詢計(jì)劃的生成。生成的查詢計(jì)劃存儲(chǔ)在()中,并在隨后由()調(diào)用執(zhí)行。A、內(nèi)存、MapReduceB、HBase、YarnC、HDFS、YarnD、HDFS、Tez【正確答案】:C55.關(guān)于GES技術(shù)原理,下列錯(cuò)誤的是哪一項(xiàng)?A、基于HBase的分布式存儲(chǔ)機(jī)制,能夠處理海量數(shù)據(jù)B、基于Yarn的資源調(diào)度,可以并行執(zhí)行多任務(wù)(參考答案)C、基于ElasticSearch的索引機(jī)制,能夠根據(jù)索引快速查詢數(shù)據(jù)D、基Spak于的分布式內(nèi)存計(jì)算技術(shù),支持?jǐn)?shù)據(jù)快速導(dǎo)入【正確答案】:B56.以下關(guān)于Redis中String類型的描述,錯(cuò)誤的是哪一項(xiàng)?A、一個(gè)字符串類型的值存儲(chǔ)的最大容量是1MBB、字符串類型是Redis中最基本的數(shù)據(jù)類型C、可以存儲(chǔ)圖片D、可以存儲(chǔ)文本數(shù)據(jù)【正確答案】:A57.以下哪一選項(xiàng)不是批流融合的實(shí)時(shí)決策系統(tǒng)的優(yōu)勢(shì)?A、維護(hù)難度大B、吞吐量高C、可靠性高D、批-流融合計(jì)算【正確答案】:A58.Redis不適用于以下哪個(gè)應(yīng)用場(chǎng)景?A、獲取TOPN操作B、獲取PB級(jí)Value數(shù)據(jù)C、獲取最新N個(gè)數(shù)據(jù)的操作D、獲取手機(jī)驗(yàn)證碼【正確答案】:B59.以下關(guān)于KeyBy算子的描述,錯(cuò)誤的是哪一項(xiàng)?A、數(shù)據(jù)類型轉(zhuǎn)換是KeyedStream->DataStreamB、每個(gè)分區(qū)包含具有相同key的元素C、邏輯地將一個(gè)流拆分成不相交的分區(qū)D、在內(nèi)部以hash的形式實(shí)現(xiàn)的【正確答案】:A60.Hive數(shù)據(jù)存儲(chǔ)模型中不包括以下哪一結(jié)構(gòu)?A、分區(qū)B、表C、桶D、塊【正確答案】:D61.Loader是基于哪個(gè)開源組件的圖形化遷移管理工具?A、HueB、spankC、SqoopD、Kettle【正確答案】:C62.關(guān)于ElasticSearch,以下哪一個(gè)選項(xiàng)是正確的?A、ElasticSearch自身不帶RESTFULAPI接口B、ElasticSearch不支持分布式C、ElasticSearch只在數(shù)據(jù)量比較小的時(shí)候才有性能優(yōu)勢(shì)D、ElasticSearch可以支持模糊查詢【正確答案】:D63.以下哪一選項(xiàng)不是大數(shù)據(jù)的特點(diǎn)?A、容量大B、種類多C、速度快D、結(jié)構(gòu)單一【正確答案】:D64.大數(shù)據(jù)的顯著特征不包括以下哪一個(gè)選項(xiàng)?A、數(shù)據(jù)規(guī)模小B、數(shù)據(jù)處理速度快C、數(shù)據(jù)類型多樣D、數(shù)據(jù)價(jià)值密度低【正確答案】:A65.StructuredStreaming程序執(zhí)行過程中,定義流計(jì)算過程之后是哪一個(gè)步驟?A、創(chuàng)建輸入數(shù)據(jù)源B、導(dǎo)入相關(guān)依賴模塊C、啟動(dòng)流計(jì)算并計(jì)算輸出結(jié)果D、創(chuàng)建SparkSession對(duì)象【正確答案】:C66.關(guān)于HBasc的特性描述錯(cuò)誤的是?A、高可靠B、分布式C、不支持?jǐn)U容D、高性能【正確答案】:C67.以下哪一個(gè)組件可以將SQL語(yǔ)句轉(zhuǎn)化為HBase的Scan操作?ApacheStormB、ApachePhoenixC、ApacheMapReduceD、ApacheHDFS【正確答案】:B68.Spark中A,Ction算子返回的是以下哪一選項(xiàng)?A、依賴關(guān)系B、DAG圖C、RDDD、計(jì)算結(jié)果或者是寫入存儲(chǔ)操作【正確答案】:D69.關(guān)于ElasticSearch核心概念,以下哪一項(xiàng)說法是錯(cuò)誤的?A、Document文檔,是可以被素引的基本單位,特指最頂層結(jié)構(gòu)或根對(duì)象序列化成的JSoN數(shù)據(jù)B、Mapping:映射,用來約束字段的類型,可以根據(jù)數(shù)據(jù)自動(dòng)創(chuàng)建,相當(dāng)于數(shù)據(jù)庫(kù)中的ShemaC、Type:文檔類型,文檔類型使得同一個(gè)素引中在存儲(chǔ)結(jié)構(gòu)不同的文檔時(shí),只需要依據(jù)文檔類型就可以找到對(duì)應(yīng)的參數(shù)映射信息,方便文檔的存儲(chǔ)D、Index:是ElasticSearch中一個(gè)邏輯命名空間,與關(guān)系數(shù)據(jù)庫(kù)實(shí)例DatA,Base相當(dāng),只能存放結(jié)構(gòu)化數(shù)據(jù)【正確答案】:D70.關(guān)于ElasticSearch性能優(yōu)化,以下哪一項(xiàng)說法是錯(cuò)誤的?A、分片數(shù)不超過節(jié)點(diǎn)數(shù)的3倍,用較少的分片獲得更佳的性能B、索引創(chuàng)建好后依然可以動(dòng)態(tài)調(diào)整分片數(shù)量C、分片最大容量不要超過E1asticSearch推薦的最大JVM堆空間32GD、副本數(shù)建議設(shè)置為1,過多的副本需要更多存儲(chǔ)空間【正確答案】:B71.以下描述中,哪一項(xiàng)不是實(shí)時(shí)檢索技術(shù)在金融行業(yè)的應(yīng)用特點(diǎn)?A、高并發(fā)B、查詢條件復(fù)雜C、時(shí)延要求高D、存在海量圖片小文件【正確答案】:B72.關(guān)于Flink的角色,下列哪一項(xiàng)說法是錯(cuò)誤的?A、Client是Flink程序提交的客戶端,對(duì)用戶提交的Flink程序進(jìn)行預(yù)處理,并提交到Flink集群中處理。B、JobManager扮演著集群中的管理者M(jìn)aster的角色,它是整個(gè)集群的協(xié)調(diào)者。C、TaskManager負(fù)責(zé)從用戶提交的Flink程序配置中獲取JobManager的地址。D、TaskManager是實(shí)際負(fù)責(zé)執(zhí)行計(jì)算的Worker.【正確答案】:C73.不同的Channel提供的持久化水平也是不一樣的,其中()不會(huì)持久化;A、MemoryChannel、JDBCChannel、FileChannelB、FileChannel、JDBCChannel、MemoryChannelC、JDBCChannel、MemoryChannel、FileChanelD、MemoryChannel、FileChannel、JDBCChannel【正確答案】:D74.Flume的應(yīng)用中,如果要保證sink的負(fù)載均衡,需要使用以下哪一個(gè)組件?A、DefaultSinkProcessorB、StaticInterceptorC、ReplicatingChannelSelectorD、FailoverSinkProcessor【正確答案】:A75.某大數(shù)據(jù)業(yè)務(wù)人員需針對(duì)某些數(shù)據(jù)創(chuàng)建Hive表結(jié)構(gòu),其中某個(gè)數(shù)據(jù)為時(shí)間類型yyyyMMdd.那么可以使用以下哪一項(xiàng)作為字段類型?A、varcahrB、stringC、intD、double【正確答案】:B76.以下哪一項(xiàng)不屬于Flink組件的滾動(dòng)聚合算子?A、KeyBy()B、minBy()C、min()D、sum()【正確答案】:A77.以下哪一選項(xiàng)不是組件混合負(fù)載、資源統(tǒng)一調(diào)度帶來的客戶價(jià)值?A、混合負(fù)載,統(tǒng)一資源池調(diào)度,提升資源利用率B、支持授權(quán)用戶數(shù)量大幅減少CPU、GPU異構(gòu)計(jì)算調(diào)度D、資源池隔離,計(jì)算任務(wù)相互不影響【正確答案】:B78.以下哪一選項(xiàng)不屬于分布式架構(gòu)應(yīng)對(duì)故障的策略?()A、單集群跨AZ高可用B、異地容災(zāi)集群C、數(shù)據(jù)多副本,支持磁盤熱拔插D、滾動(dòng)升級(jí)/補(bǔ)丁【正確答案】:D79.StructuredStreaming不能提供以下哪幾種類型的保證?AtmostonceB、AtleastonceC、MorethanonceD、Exactlyonce【正確答案】:C80.Hive與傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的區(qū)別不包括以下哪一選項(xiàng)?A、索引B、易用性C、面向?qū)ο驞、執(zhí)行引擎【正確答案】:C81.以下哪種資源不是大數(shù)據(jù)集群在進(jìn)行數(shù)據(jù)傳輸過程中遇到的瓶頸?A、網(wǎng)絡(luò)B、CPUC、磁盤/OD、內(nèi)存【正確答案】:B82.以下關(guān)于RDD的描述中,錯(cuò)誤的是哪一項(xiàng)?A、RDD默認(rèn)是存儲(chǔ)于內(nèi)存。B、RDD是分布式彈性數(shù)據(jù)集。C、RDD的創(chuàng)建只能依賴HDFS。D、用戶可以選擇不同的存儲(chǔ)級(jí)別緩存RDD以便重用。【正確答案】:C83.RedisMaster-Slave采用Master-Slave架構(gòu),由Masterslave節(jié)點(diǎn)管理工作。A、對(duì)B、錯(cuò)(參考答案)【正確答案】:B84.以下關(guān)于Flume的描述,錯(cuò)誤的是哪一項(xiàng)?A、Flume不支持級(jí)聯(lián)(多個(gè)Flume對(duì)接起來),合并數(shù)據(jù)的能力B、Flume支持按照用戶定制采集數(shù)據(jù)的能力C、提供實(shí)時(shí)采集日志信息(taildir)到目的地的能力D、提供從固定目錄下采集日志信息到目的地(HDFS,HBase,Kafka)能力【正確答案】:A85.離線批處理工具不包含以下哪項(xiàng)?A、SparkB、SQLC、MapReduceD、Storm【正確答案】:D86.關(guān)于HDFS單名稱節(jié)點(diǎn)體系結(jié)構(gòu)的局限性,以下哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、HDFS只設(shè)置唯一一個(gè)名稱節(jié)點(diǎn),一旦這個(gè)唯一的名稱節(jié)點(diǎn)發(fā)生故障,會(huì)導(dǎo)致整個(gè)集群變得不可用B、HDFS只設(shè)置唯一個(gè)名稱節(jié)點(diǎn),資源和數(shù)據(jù)可以方便的完成隔離C、HDFS只設(shè)置唯-一個(gè)名稱節(jié)點(diǎn),會(huì)帶來命名空間的限制D、HDFS只設(shè)置唯一個(gè)名稱節(jié)點(diǎn),會(huì)帶來性能的瓶頸和吞吐量的瓶頸【正確答案】:B87.在HDFS中"認(rèn)為硬件,總是不可靠的"體現(xiàn)了以下哪一個(gè)特性?A、高吞吐量B、大文件存儲(chǔ)C、高容錯(cuò)性D、彈性伸縮【正確答案】:C88.銀行進(jìn)行客戶購(gòu)買力分析,首先獲取客戶歷史賬單,確定其中各項(xiàng)商品的計(jì)算權(quán)重,得出每位客戶的購(gòu)買力評(píng)分并存儲(chǔ)記錄。最后將結(jié)果以圖表顯示。請(qǐng)問該過程對(duì)應(yīng)于以下哪個(gè)項(xiàng)目數(shù)據(jù)流程設(shè)計(jì)。A、數(shù)據(jù)可視化->數(shù)據(jù)源->數(shù)據(jù)落地->數(shù)據(jù)處理B、數(shù)據(jù)源->數(shù)據(jù)處理->數(shù)據(jù)落地->數(shù)據(jù)可視化C、數(shù)據(jù)源數(shù)據(jù)落地>數(shù)據(jù)處理->數(shù)據(jù)可視化D、數(shù)據(jù)可視化>數(shù)據(jù)源->數(shù)據(jù)處理->數(shù)據(jù)落地【正確答案】:B89.以下哪個(gè)場(chǎng)景是HDFS適合做的?A、大量小文件存儲(chǔ)B、流式數(shù)據(jù)訪問C、隨機(jī)寫入D、低延遲讀取【正確答案】:B90.Kafka運(yùn)行時(shí)直接依賴于以下哪一個(gè)組件?A、HBaseB、HDFSC、SparkD、Zookeeper【正確答案】:D91.在大數(shù)據(jù)業(yè)務(wù)處理的場(chǎng)景中,常常說不適合存儲(chǔ)大量的小文件。這主要是受以下哪個(gè)組件的影響?A、YarnB、HDFSC、HiveD、MapReduce【正確答案】:B92.ElasticSearch數(shù)據(jù)寫入階段有很多調(diào)優(yōu)方式,下列錯(cuò)誤的是哪一項(xiàng)?A、盡量使用自動(dòng)生成的idB、禁用wildcardC、寫入前副本數(shù)設(shè)置為0D、寫入過程中:采取bulk批量寫入【正確答案】:B93.Hive中詳細(xì)顯示函數(shù)的用法為以下哪一選項(xiàng)?A、hive>getfunctions;B、hive>descfunctionextendedupper;C、hive>descfunctionupper;D、hive>showfunctions;【正確答案】:B94.以下關(guān)于Sqoop數(shù)據(jù)導(dǎo)入原理的描述中,錯(cuò)誤的是哪一項(xiàng)?A、Sqoop在import時(shí),需要指定split-by參數(shù)。B、Sqoop會(huì)根據(jù)傳入的num-mappers來確定劃分幾個(gè)區(qū)域。C、Sqoop根據(jù)不同的split-by參數(shù)值來進(jìn)行切分,然后將切分出來的區(qū)域分配到不同map中。D、num-nappers越大效率越高。【正確答案】:D95.大數(shù)據(jù)技術(shù)一站式融合中計(jì)算融合指的是以下哪一選項(xiàng)?A、大數(shù)據(jù)基礎(chǔ)設(shè)施上云B、融合多樣性的算力,提升整體效率C、批、交互式、流等計(jì)算框架共用資源,分時(shí)復(fù)用D、大數(shù)據(jù)平臺(tái)的數(shù)據(jù)分析智能化以及數(shù)據(jù)治理的智能化【正確答案】:C96.以下哪個(gè)選項(xiàng)不屬于智慧城市所需要的技術(shù)?AI計(jì)算B、大數(shù)據(jù)C、手工制作D、智慧交通【正確答案】:C97.Hive架構(gòu)中有一個(gè)Driver模塊用于對(duì)SQL語(yǔ)句進(jìn)行轉(zhuǎn)化,那么對(duì)于Driver的描述中,正確的是哪一項(xiàng)?A、Driver中的Compiler負(fù)責(zé)對(duì)HiveQL生成的執(zhí)行計(jì)劃和MapReduce任務(wù)進(jìn)行優(yōu)化B、Driver中的Optimizer負(fù)責(zé)編譯HiveQL并將其轉(zhuǎn)化為一系列相互依賴的Map/Reduce任務(wù)。C、Driver中的Executor負(fù)責(zé)按照任務(wù)的依賴關(guān)系分別執(zhí)行Map/Reduce任務(wù)Driver指Java的JDBC連接所用的Driver類。【正確答案】:C98.某公司在進(jìn)行大數(shù)據(jù)離線批處理平臺(tái)的前期技術(shù)選型,以下哪個(gè)大數(shù)據(jù)組件不屬于高線批處理業(yè)務(wù)所涉及到的組件?A、HiveB、SparkC、HDFSD、Storm【正確答案】:D99.以下哪一項(xiàng)不是SparkSQL的適用場(chǎng)景?A、實(shí)時(shí)數(shù)據(jù)查詢B、需要處理PB級(jí)的大容量數(shù)據(jù)C、結(jié)構(gòu)化數(shù)據(jù)處理D、對(duì)數(shù)據(jù)處理的實(shí)時(shí)性要求不高的場(chǎng)景【正確答案】:A100.在Flume架構(gòu)中,以下哪一種類型的Sink支持將數(shù)據(jù)寫入到Solr中?A、thiftsinkB、filerollsinkC、MorphlineSolrsinkD、hdfssink【正確答案】:C1.以下哪些選項(xiàng)可以提供文檔數(shù)據(jù)檢索服務(wù)?A、HDFSB、MapReduceC、ElasticSearchD、Lucene【正確答案】:CD2.實(shí)時(shí)檢索的解決方案中有哪些組件?A、HadoopB、HiveC、ElasticSearchD、HBase【正確答案】:CD3.以下哪些項(xiàng)可能是鍵值的返回值類型?A、StringB、zsetC、listD、set【正確答案】:ABCD4.Kafka創(chuàng)建Topic時(shí)如何將分區(qū)放置到不同的Broker中,請(qǐng)選擇正確的順序()A、第一個(gè)分區(qū)的第一個(gè)副本放置位置是隨機(jī)從brokerList選擇的B、其他分區(qū)的第一個(gè)副本放置位置相對(duì)于第0個(gè)分區(qū)依次往后移C、剩余的副本相對(duì)干第一個(gè)副本放置立置其實(shí)是由nextReplicaShift決定的,而這個(gè)數(shù)也是隨機(jī)產(chǎn)生的D、副本因子不能大于Broker的個(gè)數(shù)【正確答案】:ABCD5.關(guān)于GES的GremlinJavaAPI操作,以下描述正確的有哪些項(xiàng)?A、客戶端可以和一個(gè)或多個(gè)Gremlinserver實(shí)例建立鏈接,基于Cluster對(duì)象創(chuàng)建ClientB、JavaAPI僅支持同步提交任務(wù),不支持異步提交任務(wù)C、可以調(diào)用JavaAPI創(chuàng)建Iterator對(duì)象,對(duì)邊和點(diǎn)進(jìn)行遍歷D、GES無(wú)法通過JavaAPI刪除一張圖【正確答案】:AC6.有關(guān)華為實(shí)時(shí)檢索解決方案,以下描述中正確的有哪幾項(xiàng)?A、數(shù)據(jù)采集:文件數(shù)據(jù)通過批量加載寫入數(shù)據(jù);流式數(shù)據(jù)通過實(shí)時(shí)加載寫入數(shù)據(jù),圖數(shù)據(jù)可以使用華為GES的工具導(dǎo)入數(shù)據(jù)B、數(shù)據(jù)源:數(shù)據(jù)源的種類包括文件數(shù)據(jù)和流式數(shù)據(jù)等C、實(shí)時(shí)檢索引擎:適合快速檢索,也就是根據(jù)指定條件查詢結(jié)果,不適用于統(tǒng)計(jì)和復(fù)雜查詢D、GES:基于Hadoop生態(tài)的圖數(shù)據(jù)庫(kù),即存放圖片的數(shù)據(jù)庫(kù)【正確答案】:ABC7.有關(guān)實(shí)時(shí)檢索引擎中各組件的聯(lián)系與定位,以下描述中正確的有哪些項(xiàng)?()A、ElasticSearch存儲(chǔ)數(shù)據(jù)性價(jià)比低,但是其能夠滿足場(chǎng)景中多級(jí)索引的實(shí)時(shí)查詢需求,同時(shí)還能夠?qū)ξ臋n分詞建立索引B、圖數(shù)據(jù)庫(kù)可以完美的解決復(fù)雜多級(jí)關(guān)系查詢分析,選用GES來解決圖數(shù)據(jù)的實(shí)時(shí)查詢需求C、與HBase相比,ElasticSearch在海量數(shù)據(jù)的情景下存儲(chǔ)性能不如HBase,故選擇HBase作為海量數(shù)據(jù)存儲(chǔ)的基石D、HBase加ElasticSearch的組合滿足了大部分的用戶實(shí)時(shí)檢索訴求【正確答案】:ABCD8.Flink的應(yīng)用場(chǎng)景,包含以下哪些項(xiàng)?A、基于規(guī)則的警報(bào)參考答案)B、業(yè)務(wù)流程管理C、異常檢測(cè)D、欺詐識(shí)別【正確答案】:ABCD9.華為企業(yè)云數(shù)據(jù)湖具有以下哪些優(yōu)勢(shì)?A、開放接口,支持開放實(shí)時(shí)標(biāo)準(zhǔn),構(gòu)建豐富生態(tài),自助式數(shù)據(jù)開發(fā)與分析B、存儲(chǔ)和計(jì)算分離,支持更多用戶并發(fā)和更大數(shù)據(jù)量C、更多數(shù)據(jù)通過實(shí)時(shí)、虛擬方式入湖,數(shù)據(jù)產(chǎn)生即可見、可用D、數(shù)據(jù)集中,開放共享、統(tǒng)一目錄管理,避免跨系統(tǒng)數(shù)據(jù)搬遷【正確答案】:ABCD10.關(guān)于華為河圖構(gòu)建融合分析能力與傳統(tǒng)數(shù)倉(cāng)分系統(tǒng)構(gòu)建模式,以下描述正確的有哪些項(xiàng)?A、分系統(tǒng)構(gòu)建模式,導(dǎo)致數(shù)據(jù)冗余嚴(yán)重,阻礙企業(yè)快速轉(zhuǎn)型B、隨著數(shù)據(jù)量增長(zhǎng),業(yè)務(wù)對(duì)數(shù)據(jù)分析靈活性要求越來越高C、華為河圖引擎對(duì)浪涌式的數(shù)據(jù)進(jìn)行整合分析,發(fā)揮最大價(jià)值[D、企業(yè)傳統(tǒng)數(shù)倉(cāng),缺乏高效、統(tǒng)一的融合分析【正確答案】:ABCD11.以下哪些選項(xiàng)不是Flink資源調(diào)度的方式?A、FlinkStandaloneB、FlinkOnZooKeeperC、FlinkOnDocker(參考答案)D、FlinkOnMesos【正確答案】:ABC12.Redis中Key的expire生存時(shí)間不適合以下哪些場(chǎng)景?A、存儲(chǔ)特定用戶所有歷史信息B、限時(shí)優(yōu)惠活動(dòng)C、限制網(wǎng)站訪客訪問頻率D、電商網(wǎng)站過去一年?duì)I銷總額統(tǒng)計(jì)【正確答案】:AD13.以下哪些選項(xiàng)屬于Elasticsearch內(nèi)部架構(gòu)的一部分?A、DistributeLuceneDirectoryB、SearchModuleC、DisoveryModuleD、IndexModule【正確答案】:ABCD14.關(guān)于HBase中scan和get的描述,以下哪些選項(xiàng)是正確的?A、get命令可以指定查找特定的單元格B、scan可以用于掃描全表數(shù)據(jù)C、get命令必須指定行健信息D、scan命令無(wú)法指定行鍵的范圍【正確答案】:ABC15.關(guān)于ApachePhoenix與HBase的搭配,以下哪些選項(xiàng)是正確的?A、PhoenixSQL只有命令行一種使用模式,無(wú)法對(duì)接JDBC進(jìn)行使用B、ApachePhoenix可以將SQL查詢編譯為一系列HBase掃描C、Phoenix在Hadoop中為低延遲應(yīng)用程序提供OLTP和運(yùn)營(yíng)分析能力D、ApachePhoenix可以為小型查詢提供毫秒級(jí)的性能,或者為數(shù)千萬(wàn)行數(shù)據(jù)提供秒級(jí)的性能【正確答案】:BCD16.以下哪些屬于大數(shù)據(jù)的發(fā)展趨勢(shì)?A、從技術(shù)驅(qū)動(dòng)轉(zhuǎn)變?yōu)樯虡I(yè)驅(qū)動(dòng)B、從統(tǒng)計(jì)分析到認(rèn)知計(jì)算C、生態(tài)合作開放D、數(shù)據(jù)處理逐漸標(biāo)準(zhǔn)化、云化【正確答案】:ABCD17.華為數(shù)字化變革ROADS目標(biāo)包括以下哪些體驗(yàn)?A、On-demand按需B、Allonline全在線C、DIYD、Real-time實(shí)時(shí)【正確答案】:ABCD18.以下關(guān)于Redis中set數(shù)據(jù)類型srandmemberkey[count]命令的描述正確的是A、如果count為正數(shù),且小于集合基數(shù),那么命令返回一個(gè)包含count個(gè)元素的數(shù)組,數(shù)組中的元素各不相同B、如果count為負(fù)數(shù),那么命令返回一個(gè)數(shù)組,數(shù)組中的元素可能會(huì)重復(fù)出現(xiàn)多次,而數(shù)組的長(zhǎng)度為count的絕對(duì)值C、如果count大于等于集合基數(shù),那么返回整個(gè)集合。D、如果count為負(fù)數(shù),那么命令返回一個(gè)數(shù)組,數(shù)組中的元素各不相同,且數(shù)組的長(zhǎng)度小于count的絕對(duì)值?!菊_答案】:ABC19.以下哪些場(chǎng)景適合使用實(shí)時(shí)檢索技術(shù)完成部署?A、銀行事后查詢交易憑證,追溯交易B、運(yùn)營(yíng)商實(shí)時(shí)查詢用戶話費(fèi)清單、流量清單C、公安系統(tǒng)實(shí)時(shí)布控,車輛軌跡繪制,快速信息匯集D、公安系統(tǒng)基于"人、事、地、物、組織、身份"等點(diǎn)狀實(shí)體,查詢?cè)谏鐣?huì)關(guān)系網(wǎng)絡(luò)中的關(guān)聯(lián)關(guān)系【正確答案】:ABCD20.關(guān)于Hive架構(gòu)中的Driver,以下哪些選項(xiàng)是正確的?A、Driver中的Compiler子模塊負(fù)責(zé)編譯HiveQL并將其轉(zhuǎn)化為一系列相互依賴的Map/Reduce任務(wù)B、Driver負(fù)責(zé)管理HiveQL執(zhí)行的生命周期,只對(duì)內(nèi)部表有效,外部表的處理流程不由Driver管理C、Driver中的Optimizer可分為邏輯優(yōu)化器和物理優(yōu)化器,分別對(duì)HiveQL生成的執(zhí)行計(jì)劃和MapReduce任務(wù)進(jìn)行優(yōu)化Driver中的Executor按照任務(wù)的依賴關(guān)系分別執(zhí)行Map/Reduce任務(wù)【正確答案】:ACD21.以下哪些選項(xiàng)是Loader組件的特點(diǎn)?()A、圖形化B、高性能C、高可靠D、安全【正確答案】:ABCD22.以下哪些選項(xiàng)屬于HBase基本架構(gòu)的一部分?A、HMasterB、DataBlockC、RDDD、Store【正確答案】:AD23.以下關(guān)于Source的描述中,正確的是哪些項(xiàng)?A、execsource執(zhí)行某個(gè)命令或者腳本,并將其執(zhí)行結(jié)果的輸出作為數(shù)據(jù)源B、httpsource支持http的post發(fā)送數(shù)據(jù)C、spoolingdirectorysource采集本地靜態(tài)文件D、Source有驅(qū)動(dòng)和輪詢兩種類型【正確答案】:ABCD24.以下哪些是運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)的能力需求?A、統(tǒng)一數(shù)據(jù)采集和整合能力B、互聯(lián)網(wǎng)化的數(shù)據(jù)開放能力C、大數(shù)據(jù)分析挖掘能力D、大數(shù)據(jù)安全能力【正確答案】:ABCD25.將Hive數(shù)倉(cāng)分層后各層的名稱和對(duì)應(yīng)的描述進(jìn)行匹配。()A、ODS原始數(shù)據(jù)層B、ADS應(yīng)用層,為各種統(tǒng)計(jì)報(bào)表提供數(shù)據(jù)C、DWS將上一層數(shù)據(jù)進(jìn)行輕度匯總后得到的結(jié)果DWD結(jié)構(gòu)和粒度與原始表保持一-致簡(jiǎn)單清洗得到的結(jié)果【正確答案】:ABCD26.關(guān)于Hive導(dǎo)入數(shù)據(jù)的命令,以下哪些選項(xiàng)是正確的?A、loA,Ddatainpath可用于將HDFS上的數(shù)據(jù)導(dǎo)入Hive表中B、導(dǎo)入數(shù)據(jù)時(shí)必須指定導(dǎo)入哪張表格,也就是需要使用intotable關(guān)鍵詞+表名C、可以使用Local關(guān)鍵詞從本地文件系統(tǒng)導(dǎo)入數(shù)據(jù)至Hive,但是這里的Local指的是hiveserver服務(wù)所在的機(jī)器,而不是beeline客戶端所在的機(jī)器D、如果原先表中有數(shù)據(jù),想用新數(shù)據(jù)覆蓋舊數(shù)據(jù),可以添加overwrite參數(shù)進(jìn)行覆蓋【正確答案】:ABCD27.下列哪些選項(xiàng)是Flink的高抽象層API?A、DataStreamAPIB、DataSetAPIC、SQLAPID、TableAPI【正確答案】:CD28.以下關(guān)于有界流的描述,哪些項(xiàng)是正確的?A、有界流處理通常被稱為批處理B、有定義流的開始,也有定義流的結(jié)束C、有界流可以在讀取所有數(shù)據(jù)后再進(jìn)行計(jì)算D、有界流所有數(shù)據(jù)可以被排序,所以并不需要有序攝取【正確答案】:ABCD29.以下關(guān)于SparkSQL的描述中,正確的有哪幾項(xiàng)?()A、可以看成是對(duì)SparkRDD編程接口的封裝。B、SparkSQL的執(zhí)行效率會(huì)比Hive快的多。C、SQL語(yǔ)句通過SparkSQL模塊解析為RDD執(zhí)行計(jì)劃,交給SparkCore執(zhí)行。D、SparkSQL執(zhí)行時(shí)一定是在本地執(zhí)行的,而不是集群?!菊_答案】:ABC30.以下哪些選項(xiàng)是Loader的特點(diǎn)?A、圖形化配置管理界面B、Kerberos認(rèn)證C、主備雙機(jī)D、利用Spark并行處理數(shù)據(jù)【正確答案】:ABC31.以下關(guān)于事件時(shí)間的描述,正確的是哪些項(xiàng)?A、事件時(shí)間在事件進(jìn)入flink之前已經(jīng)嵌入事件,flink可以提取該時(shí)間B、事件時(shí)間是指事件在其設(shè)備上發(fā)生的時(shí)間C、基于事件時(shí)間進(jìn)行處理的流程序可以保證事件在處理的時(shí)候的順序性D、基于事件時(shí)間的處理往往有一定的滯后性【正確答案】:ABCD32.關(guān)于GES的RESTful接口,以下描述中正確的有哪些選項(xiàng)?A、GESAPI向上層應(yīng)用提供統(tǒng)一的訪問入口,通過高度靈活的RESTAPI接口,封裝GES平臺(tái)的統(tǒng)一操作B、用戶可以通過GES的REST接口創(chuàng)建edgeIA,BelC、GES的REST請(qǐng)求分為Select,Put,Create和DeleteD、用戶可以通過GES的REST接口查詢數(shù)據(jù)點(diǎn)的信息【正確答案】:ABD33.以下哪些選項(xiàng)是Hive數(shù)據(jù)倉(cāng)庫(kù)分層的優(yōu)點(diǎn)?A、隔離原始數(shù)據(jù)B、復(fù)雜問題簡(jiǎn)單化C、減少重復(fù)開發(fā)D、清晰數(shù)據(jù)結(jié)構(gòu)【正確答案】:ABCD34.HBase讀數(shù)據(jù)過程,需要讀取哪幾部分?jǐn)?shù)據(jù)?A、HFileB、MemStoreC、HMasterD、HLog【正確答案】:AB35.關(guān)于HBase中Filter過濾器的描述,以下哪些選項(xiàng)是正確的?A、R果表中有name.age.gender和addressq列數(shù)據(jù),使用scan'cxtablestu01'.FILIER=>"ColumnPrefixFilter('a')"命令會(huì)把a(bǔ)ge和address兩列的數(shù)據(jù)進(jìn)行輸出B、如果表中有單元格的值為英文字符,使用scan'cx_table_stu01',FILTER=>"ValueFilter(>,'binary:20')")命令會(huì)把這些英文字符也一起匹配輸出C、scan'cx_table_stu01',FILTER=>"ValueFilter(=,'binary:20')")表示搜索所有列值恰好等于20的單元格數(shù)據(jù)D、使用scan'cx_table_stu01',FILTER=>"ColumnPrefixFilter('name')ANDValueFilter(=,'binary:hanmeimei')"命令時(shí),只要滿足兩個(gè)條件其中一個(gè)就可以匹配輸出【正確答案】:AC36.實(shí)時(shí)檢索解決方案的項(xiàng)目流程包括以下哪些選項(xiàng)?A、應(yīng)用部署B(yǎng)、代碼工程C、項(xiàng)目環(huán)境準(zhǔn)備D、應(yīng)用開發(fā)【正確答案】:ABCD37.Hive業(yè)務(wù)場(chǎng)景中,一張大表連接一張較小的維表,那么為了提高這個(gè)JOIN操作的效率,可以進(jìn)行如下哪些操作?A、設(shè)置參數(shù)hive.auto.convert.join為trueB、設(shè)置參數(shù)hive.groupby.skewindata為trueC、大表在前小表在后D、小表在前大表在后【正確答案】:ABD38.以下關(guān)于無(wú)界流的描述,哪些項(xiàng)是正確的?A、處理無(wú)界數(shù)據(jù)通常要求以特定順序攝取事件B、無(wú)界流的數(shù)據(jù)必須持續(xù)處理,即數(shù)據(jù)被讀取后需要立刻處理C、有定義流的開始,但沒有定義流的結(jié)束D、數(shù)據(jù)源會(huì)無(wú)休止地產(chǎn)生數(shù)據(jù)【正確答案】:ABCD39.由GESREST接口可以實(shí)現(xiàn)以下哪些操作?A、創(chuàng)建圖B、刪除圖C、創(chuàng)建edgelA,BelD、創(chuàng)建vertexIA,Bel【正確答案】:ABCD40.關(guān)于HDFS數(shù)據(jù)寫入流程的描述,以下哪些選項(xiàng)是正確的?A、在寫入流程的最后一步,HDFSClient聯(lián)系NameNode,確認(rèn)數(shù)據(jù)寫入完成后,由NameNode持久化元數(shù)據(jù)B、客戶端通過自有協(xié)議寫入數(shù)據(jù)到DataNode1,再由DataNode1復(fù)制到DataNode2,DataNode3C、HDFSClient需要聯(lián)系NameNode,由NameNode在元數(shù)據(jù)中創(chuàng)建文件節(jié)點(diǎn)D、業(yè)務(wù)應(yīng)用調(diào)用writeAPI寫入文件【正確答案】:ABCD41.以下關(guān)于Loader的描述中,正確的有哪幾項(xiàng)?A、提供可視化向?qū)降淖鳂I(yè)配置管理界面。B、提供定時(shí)調(diào)度任務(wù),周期性執(zhí)行Loader作業(yè)。C、在界面中可指定多種不同的數(shù)據(jù)源、配置數(shù)據(jù)的清洗和轉(zhuǎn)換步驟、配置集群存儲(chǔ)系統(tǒng)。D、是基于開源Flume研發(fā),做了大量?jī)?yōu)化和擴(kuò)展?!菊_答案】:ABC42.以下關(guān)于Redis使用場(chǎng)景特點(diǎn)的描述,正確的是哪些項(xiàng)?A、數(shù)據(jù)類型豐富B、支持持久化C、高性能D、低時(shí)延【正確答案】:ABCD43.實(shí)時(shí)檢索的公安和金融行業(yè)應(yīng)用場(chǎng)景有哪些特征?A、高并發(fā)B、存在海量小文件C、查詢速度快D、查詢條件簡(jiǎn)單【正確答案】:ABCD44.關(guān)于Spark的應(yīng)用場(chǎng)景,請(qǐng)將場(chǎng)景與描述正確匹配()A、流處理秒級(jí)延遲的處理,可支持多種外部數(shù)B、數(shù)據(jù)挖掘在海量數(shù)據(jù)基礎(chǔ)上進(jìn)行復(fù)雜的挖掘分析C、迭代計(jì)算應(yīng)對(duì)復(fù)雜的數(shù)據(jù)處理邏輯【正確答案】:ABC45.數(shù)據(jù)分析平臺(tái)云化和融合發(fā)展具有以下哪些特點(diǎn)?A、資源彈性分配B、超敏捷應(yīng)用C、交叉融合分析D、多場(chǎng)景分析【正確答案】:ABCD46.關(guān)于MRSHDFS中的df和du命令,以下哪些說法是正確的?A、du命令主要用于統(tǒng)計(jì)某個(gè)文件夾內(nèi)文件的大小信息B、du命令可以添加-v命令,方便用戶了解每個(gè)輸出值的含義C、df命令主要用于統(tǒng)計(jì)文件系統(tǒng)的可用空間信息D、df命令中可以添加-h參數(shù),使得輸出結(jié)果容易被用戶讀懂【正確答案】:ABCD47.大數(shù)據(jù)分離架構(gòu)有以下哪些優(yōu)勢(shì)?A、異構(gòu)流數(shù)據(jù)實(shí)時(shí)處理B、交互式實(shí)時(shí)查間C、結(jié)構(gòu)化數(shù)據(jù)快速查詢D、復(fù)雜計(jì)算模型靈活編程接口【正確答案】:ABCD48.Loader具有對(duì)以下哪些數(shù)據(jù)源的讀取能力?A、HBaseB、HDFSC、HiveD、RDB【正確答案】:ABCD49.699.Spark運(yùn)行前需要讀取任務(wù)參數(shù),包含配置文件、動(dòng)態(tài)參數(shù)、代碼配置等,請(qǐng)連接將他們的優(yōu)先級(jí)進(jìn)行匹配。()A、高代碼配置B、中動(dòng)態(tài)參數(shù)C、低配置文件【正確答案】:ABC50.StructuredStreaming可以把結(jié)果寫入外部的存儲(chǔ)系統(tǒng),下列哪些選項(xiàng)是屬于外部存儲(chǔ)系統(tǒng)的存儲(chǔ)方式?A、CompleteModeB、AppendModeC、UpdateModeD、OutPutMode【正確答案】:ABC51.HBase中會(huì)觸發(fā)Flush操作的有以下哪幾項(xiàng)?A、RegionMemStore中的總大小,達(dá)到了預(yù)設(shè)的FlushSize閾值。B、HBaseMemstore定期刷新,默認(rèn)周期為1小時(shí)。C、MemStoreRegionServer占用內(nèi)存的總量和總內(nèi)存比值超出了預(yù)設(shè)的閾值大小。D、當(dāng)WALs中文件數(shù)量達(dá)到閾值時(shí)?!菊_答案】:ABCD52.關(guān)于使用HBase的JavaAPI讀取數(shù)據(jù),以下描述中正確的是哪些項(xiàng)?A、QualifierFilter用于過HBase表中的列族信息B、HBaseFilter主要在Scan和Get過程中進(jìn)行數(shù)據(jù)過濾,通過設(shè)置一些過濾條件來實(shí)現(xiàn)條件查詢C、要從表中讀取數(shù)據(jù),首先需要實(shí)例化該表對(duì)應(yīng)的Table實(shí)例D、為了提高查詢效率,使用Scan命令時(shí)最好指定StartRow和StopRow【正確答案】:ABCD53.StructuredStreaming觸發(fā)器可以定義的流數(shù)據(jù)處理的計(jì)時(shí),包含以下哪些項(xiàng)?A、Trigger.Once()一次微批處理所有數(shù)據(jù)B、Trigger.ProcessingTime("nseconds"),固定間隔時(shí)間開啟微批處理C、Trigger.Continuous("1second"),連續(xù)處理模式D、沒有指定觸發(fā)器設(shè)置,默認(rèn)為查詢以微批處理模式執(zhí)行【正確答案】:ABCD54.通過Loader的可視化界面,可以實(shí)現(xiàn)以下哪些操作?A、數(shù)據(jù)分析任務(wù)B、制定多種不同的數(shù)據(jù)源C、數(shù)據(jù)可視化操作D、配置數(shù)據(jù)的清洗和轉(zhuǎn)換步驟【正確答案】:BCD55.ELK指的是哪些組件?A、ElasticsearchB、LogstashC、KickstartD、Kibana【正確答案】:ABD56.針對(duì)以下場(chǎng)景描述,可以用于大數(shù)據(jù)實(shí)時(shí)檢索技術(shù)完成的有?A、主要根據(jù)ID(手機(jī)號(hào)碼)、時(shí)間段進(jìn)行用戶話費(fèi)清單、流量清單查詢B、可用于事后查詢交易憑證,追溯交易,以及查詢客戶信用記錄,幫助客戶快速借款等C、要求1秒內(nèi)響應(yīng),高并發(fā)(100以上請(qǐng)求)查詢條件簡(jiǎn)單(80%查詢是主鍵查詢,其他是簡(jiǎn)單條件組合查詢)D、根據(jù)ID(身份證,車牌號(hào)等)進(jìn)行查詢,可用于實(shí)時(shí)布控,車輛軌跡繪制,快速信息匯集【正確答案】:ABCD57.解決離線批處理任務(wù)常用以下哪些組件?A、HDFSB、Hive參考答案)C、YARND、Spark【正確答案】:ABCD58.在HBase中利用get命令查找某一個(gè)單元格對(duì)應(yīng)的數(shù)據(jù),以下哪些信息是必要的?()A、ColumnQualifier(限定符)信息B、Rowkey(行鍵)信息C、DataBlockID(數(shù)據(jù)塊編號(hào))信息D、ColumnFamily(列族)信息【正確答案】:ABD59.Flink支持Source的有以下哪些選項(xiàng)?A、從集合中讀取數(shù)據(jù)B、自定義數(shù)據(jù)讀取C、從文件中讀取數(shù)據(jù)D、從消息隊(duì)列中讀取數(shù)據(jù)rk【正確答案】:ABCD60.華為MRS服務(wù)具有以下哪些優(yōu)勢(shì)?A、高可用B、多場(chǎng)景融合C、存算分離D、彈性計(jì)算【正確答案】:ABCD61.HBase數(shù)據(jù)寫入過程會(huì)有多個(gè)步驟,請(qǐng)選擇正確的順序()A、查找對(duì)應(yīng)的region,在region中尋找列族先向memstore中寫入數(shù)據(jù)B、去表所在的regionserver進(jìn)行數(shù)據(jù)的添加C、當(dāng)memstore寫入的值變多,觸發(fā)溢弓操作(flush)D、clienti訪問Zookeeper,獲取元數(shù)據(jù)存儲(chǔ)所在的regionserverE、通過對(duì)應(yīng)的regionserver,拿到對(duì)應(yīng)的表存文的regionserverF、當(dāng)溢寫的文件過多時(shí),會(huì)觸發(fā)文件的合并(Compact)操作【正確答案】:ABCDEF62.以下關(guān)于KafkaPartition說法正確的有哪幾項(xiàng)?A、每個(gè)Partition在存儲(chǔ)層面對(duì)應(yīng)一個(gè)log文件。B、每個(gè)Partition都是有序且不可變的消息隊(duì)列。C、Partition數(shù)量決定了每個(gè)Consumergroup中并發(fā)消費(fèi)者的最大數(shù)量。D、引入Partition機(jī)制,保證了Kafka的高吞吐能力。【正確答案】:ABCD63.以下關(guān)于KafkaPartition偏移量的描述,哪些選項(xiàng)是正確的?A、每條消息在文件中的位置稱為offset(偏移量)B、offset是一個(gè)String型字符串C、消費(fèi)者通過(offset、partition、topic)跟蹤記錄D、唯一標(biāo)記條消息【正確答案】:ACD64.一個(gè)典型的KafKa集群中包含以下哪些組件?A、一個(gè)ZooKeeper集群B、若干個(gè)BrockerC、若干個(gè)ProducerD、若干個(gè)Consumer【正確答案】:ABCD65.ElasticSearch用于日志搜索和分析,離不開其擁有的生態(tài)圈系統(tǒng)和解決方案,這些開源軟件之間互相配合使用,完美銜接,高效地滿足了多場(chǎng)景的應(yīng)用。那么其生態(tài)系統(tǒng)具體包括以下哪些內(nèi)容?A、數(shù)據(jù)持久化與分析層ElasticsearchB、數(shù)據(jù)接入層LogstashC、用戶接入層KibanaD、插件擴(kuò)展層【正確答案】:ABCD66.關(guān)于ElasticSearch的基本架構(gòu),以下描述中正確的有哪些項(xiàng)?A、ElasticSearch通過Discovery模塊來實(shí)現(xiàn)節(jié)點(diǎn)自動(dòng)發(fā)現(xiàn),以及Master節(jié)點(diǎn)選取B、ElasticSearch底層基于Lucence,將索引存儲(chǔ)在本地文件系統(tǒng)、共享文件系統(tǒng)或HDFS等文件系統(tǒng)中C、ElasticSearch支多種插件來擴(kuò)展加強(qiáng)功能D、ElasticSearch通過Java以及Restfulapi提供【正確答案】:ABCD67.關(guān)于Hive的優(yōu)點(diǎn),以下哪些說法是正確的?A、Hive支持多種編程語(yǔ)言,包括Java和Python都可對(duì)接Hive進(jìn)行使用B、Hive速度非??欤梢灾睾撩爰?jí)時(shí)延的分析應(yīng)用C、理論上Hive依賴硬件程度較低,可適應(yīng)一般的普通機(jī)器D、Hive支持雙MetaStore機(jī)制,提高容錯(cuò)性【正確答案】:ACD68.關(guān)于HBase性能優(yōu)化,以下描述中正確的有哪些選項(xiàng)?A、在使用HBaseJavaAPI時(shí),可以通過調(diào)用Table實(shí)例的get(List)批量讀取多行記錄,只需一次網(wǎng)絡(luò)1/O開銷,可以明顯的提升讀性能B、一張表里不要定義太多的列簇,因?yàn)槟硞€(gè)列簇在flush的時(shí)候,它鄰近的列簇也會(huì)因關(guān)聯(lián)效應(yīng)被觸發(fā)flush,最終導(dǎo)致系統(tǒng)產(chǎn)生更多的I/OC、在建表時(shí)可以預(yù)先創(chuàng)建多個(gè)Region,當(dāng)數(shù)據(jù)寫入HBase時(shí),會(huì)按照RowKey對(duì)應(yīng)Region分區(qū)情況,在集群內(nèi)做數(shù)據(jù)的負(fù)載均衡D、在使用HBaseJavaAPI時(shí),可以通過調(diào)用Table實(shí)例的put(List)批量寫入多行記錄,只需一次網(wǎng)絡(luò)l/O開銷,可以明顯的提升寫性能【正確答案】:ABCD69.以下哪些是常用的數(shù)據(jù)采集工具?A、SqoopB、FlumeC、LoaderD、Kafka【正確答案】:ABC70.以下哪些選項(xiàng)是ZooKeeper在Kafka中的作用?A、索引數(shù)據(jù)的生成B、負(fù)載均衡CPU資源調(diào)配管理D、集群管理【正確答案】:ABD71.關(guān)于SparkRDD的說法中,以下哪些選項(xiàng)是正確的?A、RDD基于Lineage血統(tǒng)機(jī)制的高效容錯(cuò)(第n個(gè)節(jié)點(diǎn)出錯(cuò),可從第n-1個(gè)節(jié)點(diǎn)恢復(fù))B、RDD默認(rèn)存儲(chǔ)于磁盤上,如果磁盤空間不夠,會(huì)由磁盤刷寫至內(nèi)存中C、計(jì)算流程中會(huì)劃分Stage,Stage如果失敗會(huì)進(jìn)行特定次數(shù)的重試,重試時(shí)只計(jì)算失敗的數(shù)據(jù)分片D、RDD是只讀和可分區(qū)的;要想對(duì)RDD進(jìn)行操作,只能重新生成一個(gè)新的RDD【正確答案】:ACD72.以下關(guān)于微批處理模型的描述,正確的是哪些項(xiàng)?A、在下一個(gè)微批處理之前,要將數(shù)據(jù)的偏移范圍保存在日志中B、當(dāng)前到達(dá)的數(shù)據(jù)需要在上一批次處理完,才能下一個(gè)批次數(shù)據(jù)繼續(xù)處理C、會(huì)有一定的延遲D、流計(jì)算引警在處理上一批次數(shù)據(jù)結(jié)束后,再對(duì)新數(shù)據(jù)進(jìn)行批量查詢【正確答案】:ABCD73.Redis包含以下哪些數(shù)據(jù)類型?A、HashB、ListC、StringD、Set【正確答案】:ABCD74.以下關(guān)于Sqoop的描述中,正確的有哪幾項(xiàng)?A、Sqoop可以將HDFS的數(shù)據(jù)導(dǎo)進(jìn)到關(guān)系型數(shù)據(jù)庫(kù)中。B、Sqoop在數(shù)據(jù)導(dǎo)入過程中可以進(jìn)行數(shù)據(jù)清洗。C、Sqoop可以將關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)導(dǎo)進(jìn)到Hadoop的HDFS中。D、Sqoop底層是通過MapReduce去實(shí)現(xiàn)的?!菊_答案】:ABCD75.關(guān)于GESREST接口的描述,以下哪些選項(xiàng)是正確的?A、REST接口請(qǐng)求分為HEA,B、GET、PUT、POST、DELETEC、REST接口通過http協(xié)議進(jìn)行通信,必須等待所發(fā)請(qǐng)求的響應(yīng),之后才可以繼續(xù)發(fā)送請(qǐng)求D、GESAPI向上層應(yīng)用提供統(tǒng)一的訪問入口,通過高度靈活的RESTAPI接口,封裝GES平臺(tái)的統(tǒng)一操作E、GESREST接口對(duì)于GES版本沒有任何要求【正確答案】:ABC76.關(guān)于華為云MRS提供的Loader服務(wù),以下描述正確的有哪些選項(xiàng)?A、在華為云MRS平臺(tái)中,Loader提供定時(shí)調(diào)度任務(wù),可周期性執(zhí)行導(dǎo)入/導(dǎo)出作業(yè)B、在MRS大數(shù)據(jù)平臺(tái)中,Loader需與Flink強(qiáng)綁定C、Loader基于開源Sqoop研發(fā),做了大量?jī)?yōu)化和擴(kuò)展D、Loader底層通過MapReduce去實(shí)現(xiàn)批量數(shù)據(jù)的導(dǎo)入/導(dǎo)出及數(shù)據(jù)轉(zhuǎn)化工作【正確答案】:ACD77.下列哪幾項(xiàng)是Redis的AOF持久化方式中寫命令的時(shí)機(jī)?A、alwaysB、neverC、everysecD、no【正確答案】:ACD78.StructuredStreaming可以提供以下哪幾種類型的保證?A、OnlyOnceB、AtmostonceC、ExactlyonceD、Atleastonce【正確答案】:BCD79.下列選項(xiàng)中哪些框架可以應(yīng)用在實(shí)時(shí)流處理場(chǎng)景中?A、FlinkB、SparkC、YarnD、Hive【正確答案】:ABC80.數(shù)據(jù)倉(cāng)庫(kù)分層包括以下哪些選項(xiàng)?A、DWD層B、DWS層C、ADS層D、ODS層【正確答案】:ABCD81.客戶端使用get方式讀取HBase用戶數(shù)據(jù)時(shí),需要查詢meta表的哪些數(shù)據(jù)?A、RegionServert地址B、Region分裂時(shí)間C、Region起始rowkeyD、Region大小【正確答案】:AC82.計(jì)算十分鐘內(nèi)的單詞,每5分鐘更新一次,若程序在11:00開始運(yùn)行,在12:07收到一個(gè)數(shù)字,這個(gè)數(shù)字應(yīng)該對(duì)應(yīng)于以下哪些窗口的計(jì)算()A、12:05-12:15B、12:10-12:20C、12:00-12:10D、11:55-12:05【正確答案】:AC83.下列關(guān)于大數(shù)據(jù)的說法中,錯(cuò)誤的是哪些選項(xiàng)?A、大數(shù)據(jù)具有體量大、結(jié)構(gòu)單一、時(shí)效性強(qiáng)的特征B、處理大數(shù)據(jù)需采用新型計(jì)算架構(gòu)和智能算法等新技術(shù)C、大數(shù)據(jù)的應(yīng)用注重因果分析而不是相關(guān)分析D、大數(shù)據(jù)的應(yīng)用注重相關(guān)分析而不是因果分析【正確答案】:AC84.有關(guān)HBase中Compaction操作的描述,以下哪些說法是正確的?A、MajorCompaction是小范圍的CompactionB、Compaction操作會(huì)排除當(dāng)前正在執(zhí)行合并的文件C、MinorCompaction是小范圍的CompactionD、Compaction分為Minor和Major兩類【正確答案】:BCD85.關(guān)于MRS的Redis增強(qiáng)特性描述正確的是()。A、支持?jǐn)?shù)據(jù)導(dǎo)入導(dǎo)出工具B、自研Arm架構(gòu)C、集群可靠性保障D、完善的集群管理功能【正確答案】:ABCD86.以下關(guān)于Spark的描述中,正確的有哪幾項(xiàng)?A、寬依賴是指父RDD的每個(gè)分區(qū)都可能被多個(gè)子RDD分區(qū)所使用。B、窄依賴跟寬依賴的區(qū)別是是否發(fā)生Shuffle.C、當(dāng)一個(gè)任務(wù)在spark執(zhí)行時(shí),該任務(wù)會(huì)被拆分成多個(gè)Stage,然后分配到不同的節(jié)點(diǎn)上進(jìn)行執(zhí)行。D、窄依賴是指父RDD的每個(gè)分區(qū)只被子RDD的一個(gè)分區(qū)所使用。【正確答案】:ABD87.請(qǐng)按順序匹配HBase客戶端寫入數(shù)據(jù)的正確流程()A、寫入磁盤上形成StoreFileB、定位HRegionServerC、寫入數(shù)據(jù)到HLog中D、寫入數(shù)據(jù)到MemStore中【正確答案】:ABCD88.以下哪些場(chǎng)景適合使用實(shí)時(shí)檢索技術(shù)輔助完成?A、根據(jù)過去一年的訂單記錄預(yù)測(cè)明年某商品的銷售量B、通過身份證號(hào)查詢某天某酒店入住人信息C、通過手機(jī)號(hào)查詢某日某運(yùn)營(yíng)商的通話記錄D、通過車牌號(hào)查詢某天某高速收費(fèi)站過路車輛信息【正確答案】:BCD89.以下關(guān)于SqoopImport原理的描述中,哪些選項(xiàng)是正確的?A、Sqoop將任務(wù)劃分到每個(gè)map中,再處理數(shù)據(jù)庫(kù)中獲取的一行一行的值,寫入到HDFS中B、Sqoop需要用到Spark或Flink才能完成數(shù)據(jù)的ImportC、split-by根據(jù)不同的參數(shù)類型有不同的切分方法,如比較簡(jiǎn)單的int型,Sqoop會(huì)取最大和最小split-by字段值,然后根據(jù)傳入的num-mappers來確定劃分幾個(gè)區(qū)域D、Sqoop在import時(shí),需要指定split-by參數(shù)。Sgoop根據(jù)不同的split-by參數(shù)值來進(jìn)行切分,然后將切分出來的區(qū)域分配到不同map中【正確答案】:ACD90.Redis的AOF持久化中,寫命令同步的時(shí)機(jī)有以下哪幾項(xiàng)?A、appendfsynceverysecB、appendfsyncnoneC、appendfsyncalwaysD、appendfsyncno【正確答案】:ACD91.關(guān)于GES的應(yīng)用場(chǎng)景,以下哪些選項(xiàng)是正確的?A、工業(yè):基于知識(shí)圖譜的設(shè)備故障診斷和預(yù)警B、物流和網(wǎng)規(guī):最優(yōu)路徑推薦C、金融:實(shí)時(shí)推薦、實(shí)時(shí)反欺詐,基于知識(shí)圖譜的風(fēng)控(信貸、保險(xiǎn))D、社交分析:尋找特定愛好的好友,或者通過好友的好友,找到用戶可能認(rèn)識(shí)的好友【正確答案】:ABCD92.關(guān)于華為云MRS中Loader的描述,以下哪些選頂是正確的?多選A、Loader頁(yè)面是基于開源SqoopWebUI的圖形化數(shù)據(jù)遷移管理工具,該頁(yè)面托管在Hue的WebUl中B、Loader提供定時(shí)調(diào)度任務(wù),周期性執(zhí)行ETL作業(yè)C、Loader提供可視化向?qū)降淖鳂I(yè)配置管理界面D、Loader在界面中可指定多種不同的數(shù)據(jù)源、配置數(shù)據(jù)的清洗和轉(zhuǎn)換步驟、配置集群存儲(chǔ)系統(tǒng)等【正確答案】:ABCD93.Spark中RDD是彈性數(shù)據(jù)集的原因包括以下哪些選項(xiàng)?A、基于Lineage的高效容錯(cuò)B、自動(dòng)進(jìn)行內(nèi)存和磁盤數(shù)據(jù)存儲(chǔ)的切換C、數(shù)據(jù)調(diào)度彈性D、Task失敗自動(dòng)重試【正確答案】:ABC94.2019年以后,華為云數(shù)據(jù)湖CloudDataLake中分析引擎包含以下哪些組件?()A、SparkB、TensorFlowC、FlinkD、Presto【正確答案】:ABCD95.Hive組件的Driver由以下哪些項(xiàng)組成?A、MetaStoreB、CompilerC、ExecutorD、Optimizer【正確答案】:BCD96.實(shí)時(shí)流處理的步驟包含以下哪些選項(xiàng)?A、實(shí)時(shí)計(jì)算B、實(shí)時(shí)落地C、緩存隊(duì)列D、數(shù)據(jù)實(shí)時(shí)采集【正確答案】:ABCD97.以下哪些選項(xiàng)為當(dāng)前大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的特點(diǎn)?A、規(guī)模較大B、增速緩慢C、增速很快D、規(guī)模較小【正確答案】:AC98.HBase讀數(shù)據(jù)時(shí)需要讀取哪幾部分?jǐn)?shù)據(jù)?A、HfileB、MemStoreC、HDFSD、Hlog【正確答案】:AB99.以下哪些選項(xiàng)是華為云MRS使用HetuEngine的根本原因?A、企業(yè)傳統(tǒng)數(shù)倉(cāng),缺乏高效、統(tǒng)一的融合分析B、企業(yè)傳統(tǒng)數(shù)倉(cāng)采用分系統(tǒng)構(gòu)建模式,導(dǎo)致數(shù)據(jù)冗余嚴(yán)重,阻礙企業(yè)快速轉(zhuǎn)型C、隨著數(shù)據(jù)量增長(zhǎng),業(yè)務(wù)對(duì)數(shù)據(jù)分析靈活性要求越來越高D、HetuEngine對(duì)浪涌式的數(shù)據(jù)進(jìn)行整合分析,發(fā)揮最大價(jià)值【正確答案】:ABCD100.以下哪些項(xiàng)屬于實(shí)時(shí)數(shù)據(jù)處理系統(tǒng)的訴求?A、吞吐量高B、多數(shù)據(jù)源支持C、處理速度快D、可靠性高【正確答案】:ABCD1.實(shí)時(shí)流處理系統(tǒng)中,要求數(shù)據(jù)權(quán)限和資源隔離,多種流處理應(yīng)用之間要進(jìn)行資源控制和隔離,防止發(fā)生資源爭(zhēng)搶。A、正確B、錯(cuò)誤【正確答案】:A2.Flume的Source可以不用和channel關(guān)聯(lián),直接連接到sink。A、正確B、錯(cuò)誤【正確答案】:B3.冪等操作每一次請(qǐng)求的結(jié)果都是相同的。A、正確B、錯(cuò)誤【正確答案】:A4.某大數(shù)據(jù)業(yè)務(wù)人員希望確保某份關(guān)鍵數(shù)據(jù)在Hive中不會(huì)因?yàn)閐rop操作導(dǎo)致數(shù)據(jù)別除。他可以采用內(nèi)部表的方式來實(shí)現(xiàn),drop操作時(shí)只會(huì)刪除元數(shù)據(jù)而不會(huì)刪除表數(shù)據(jù)。A、正確B、錯(cuò)誤【正確答案】:B5.在海量日志離線分析過程中,數(shù)據(jù)分析師可以將網(wǎng)站日志收集到HDFS上存儲(chǔ),然后把日志加載到Hive中進(jìn)行統(tǒng)計(jì)分析與建模。A、正確B、錯(cuò)誤【正確答案】:A6.ElasticSearch:緩存主要分三種:RocksDBCache、FileDBCache、StateBackEndCache。A、正確B、錯(cuò)誤【正確答案】:B7.對(duì)企業(yè)來講,建設(shè)大數(shù)據(jù)集群,除了功能上滿足業(yè)務(wù)訴求外,高可靠能力不容忽視,這是是影響大數(shù)據(jù)項(xiàng)目成敗的關(guān)鍵能力之一。A、正確B、錯(cuò)誤【正確答案】:A8.Flink既可以用作批處理場(chǎng)景,也可以用作流處理場(chǎng)景。A、正確B、錯(cuò)誤【正確答案】:A9.Flink處理數(shù)據(jù)是無(wú)狀態(tài)的,處理一個(gè)事件與之前的事件無(wú)關(guān)。A、正確B、錯(cuò)誤【正確答案】:B10.ElasticSearchi能夠支持文檔檢索。A、正確B、錯(cuò)誤【正確答案】:A11.大數(shù)據(jù)技術(shù)的解決方案思路是聚焦在單臺(tái)機(jī)器上,思考如何提升單機(jī)的性能,尋找更貴更好的服務(wù)器。A、正確B、錯(cuò)誤【正確答案】:B12.HBase依賴于Zookeeper完成主備選舉,以及管理root表。A、正確B、錯(cuò)誤【正確答案】:A13.HBase中如果只需要保存最新版本的數(shù)據(jù),可以設(shè)置最大版本數(shù)為1。A、正確B、錯(cuò)誤【正確答案】:A14.Sqoop進(jìn)行數(shù)據(jù)導(dǎo)出時(shí),也會(huì)進(jìn)行數(shù)據(jù)文件切片,與MapReduce切片類似,可以通過修改參數(shù)block塊大小進(jìn)行切片數(shù)量?jī)?yōu)化。A、正確B、錯(cuò)誤【正確答案】:A15.MRS的安全模式一般是用于生產(chǎn)環(huán)境。A、正確B、錯(cuò)誤【正確答案】:A16.ElasticSearch支持QueryCA,Che緩存技術(shù),主要用于緩存Filter中的查詢結(jié)果,即對(duì)一個(gè)查詢中包含的過濾器執(zhí)行結(jié)果進(jìn)行緩存。A、正確B、錯(cuò)誤【正確答案】:A17.任何完整的大數(shù)據(jù)平臺(tái),一般包括以下的幾個(gè)過程,數(shù)據(jù)采集一>數(shù)據(jù)存儲(chǔ)一>數(shù)據(jù)處理一>數(shù)據(jù)展現(xiàn)(可視化,報(bào)表和監(jiān)控)。其中,數(shù)據(jù)采集是所有數(shù)據(jù)系統(tǒng)必不可少的一個(gè)環(huán)節(jié),隨著大數(shù)據(jù)越來越被重視,數(shù)據(jù)采集的挑戰(zhàn)也變的尤為突出。A、正確B、錯(cuò)誤【正確答案】:A18.Redis無(wú)中心自組織的結(jié)構(gòu),節(jié)點(diǎn)之間使用Gossip協(xié)議來交換節(jié)點(diǎn)狀態(tài)信息A、正確B、錯(cuò)誤【正確答案】:A19.高頻交易,市場(chǎng)輿情分析,信貸風(fēng)險(xiǎn)分析等這些金融領(lǐng)域的研究?jī)?nèi)容均可以利用大數(shù)據(jù)技術(shù)進(jìn)行分析。A、正確B、錯(cuò)誤【正確答案】:A20.窄依賴往往對(duì)應(yīng)著shuffle操作,需要在運(yùn)行過程中將同一個(gè)父RDD的分區(qū)傳入到不同的子RDD分區(qū)中,中間可能涉及多個(gè)節(jié)點(diǎn)之間的數(shù)據(jù)傳輸。A、正確B、錯(cuò)誤【正確答案】:A21.Flume的核心是把數(shù)據(jù)從數(shù)據(jù)源收集過來,再將收集到的數(shù)據(jù)送到指定的目的地。A、正確B、錯(cuò)誤【正確答案】:A22.在HBase中,同一個(gè)Key值可以關(guān)聯(lián)多個(gè)Value,每一個(gè)KeyValue都擁有一個(gè)Qualifier標(biāo)識(shí)。判斷A、正確B、錯(cuò)誤【正確答案】:A23.實(shí)時(shí)流處理系統(tǒng)中消費(fèi)后的數(shù)據(jù)可以存儲(chǔ)到關(guān)系型數(shù)據(jù)庫(kù)中,便于實(shí)時(shí)查詢判斷A、正確B、錯(cuò)誤【正確答案】:A24.開啟BloomFilter會(huì)有一定的磁盤存儲(chǔ)空間及內(nèi)存cA,Che的額外開銷A、正確B、錯(cuò)誤【正確答案】:A25.在Hive的SQL語(yǔ)句執(zhí)行中,因?yàn)間roupby等關(guān)鍵字的使用會(huì)導(dǎo)致數(shù)據(jù)傾斜。因此為了表面數(shù)據(jù)傾斜,應(yīng)禁止該類操作執(zhí)行。A、正確B、錯(cuò)誤【正確答案】:B26.ElasticSearch倒排索引是通過關(guān)鍵詞查詢對(duì)應(yīng)的文檔編號(hào),再通過文檔編號(hào)找文檔。A、正確B、錯(cuò)誤【正確答案】:A27.在數(shù)字化轉(zhuǎn)型以及多樣數(shù)據(jù)、算力、業(yè)務(wù)敏捷的驅(qū)動(dòng)下,大數(shù)據(jù)焦點(diǎn)轉(zhuǎn)向云服務(wù)方式創(chuàng)新,更加敏捷,成本更優(yōu)。A、正確B、錯(cuò)誤【正確答案】:A28.MapReduce專注于離線計(jì)算,通常時(shí)間是幾十分鐘甚至更長(zhǎng)時(shí)間。由于實(shí)時(shí)計(jì)算的需求流式計(jì)算引擎開始出現(xiàn),包括Storm、Flink、SparkStreaming。A、正確B、錯(cuò)誤【正確答案】:A29.Redis是個(gè)高性能key-value內(nèi)存數(shù)據(jù)庫(kù)。A、正確B、錯(cuò)誤【正確答案】:A30.ElasticSearch緩存RequestCAChe屬于Node級(jí)別的緩存。A、正確B、錯(cuò)誤【正確答案】:B31.Flume提供實(shí)時(shí)采集日志信息(taildir)到目的地的能力。A、正確B、錯(cuò)誤【正確答案】:A32.Consumeri通過Pull的方式從Broker獲取數(shù)據(jù)消費(fèi)。A、正確B、錯(cuò)誤【正確答案】:A解析:
四.填空33.開放接口就是面向數(shù)據(jù)處理提供一個(gè)開放的、標(biāo)準(zhǔn)的接口,能夠跟各種工具對(duì)接,因?yàn)榇髷?shù)據(jù)生態(tài)里有很多成熟的工具和產(chǎn)品,包含數(shù)據(jù)集成、治理、運(yùn)營(yíng)等等,通過標(biāo)準(zhǔn)接口快速對(duì)接,打造一個(gè)完整的大數(shù)據(jù)系統(tǒng)。A、正確B、錯(cuò)誤【正確答案】:A34.Hive中默認(rèn)創(chuàng)建的是外部表A、正確B、錯(cuò)誤【正確答案】:B35.作為企業(yè)級(jí)大數(shù)據(jù)平臺(tái),F(xiàn)usionInsight具備四大能力包括一站式平臺(tái)、永遠(yuǎn)在線、易用成本
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 天津市和平區(qū)匯文中學(xué)2024-2025學(xué)年八年級(jí)上學(xué)期期末考試物理試卷(含答案)
- 吉林省吉林市2024-2025學(xué)年高一上學(xué)期1月期末地理試題(含答案)
- 浙江省杭州蕭山2023-2024學(xué)年第二學(xué)期期中檢測(cè)卷 六年級(jí)下冊(cè)科學(xué)
- 上半年銷售工作總結(jié)
- 四年級(jí)數(shù)學(xué)(簡(jiǎn)便運(yùn)算)計(jì)算題專項(xiàng)練習(xí)與答案
- 2022年初級(jí)《銀行業(yè)法律法規(guī)與綜合能力》考試題庫(kù)(核心題版)
- 《創(chuàng)意案填寫說明》課件
- 2022《創(chuàng)新設(shè)計(jì)》高考?xì)v史江蘇專用二輪專題復(fù)習(xí):專題一-中外古代文明的演進(jìn)-專題提升練(一)
- 【名師一號(hào)】2021年新課標(biāo)版物理選修3-5-雙基限時(shí)練12-原子結(jié)構(gòu)
- 《典型案例分析圖》課件
- 以案促改心得體會(huì)
- 華東師范大學(xué)《法學(xué)導(dǎo)論(Ⅰ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年公文寫作基礎(chǔ)知識(shí)競(jìng)賽試題庫(kù)及答案(共130題)
- 2023-2024學(xué)年浙江省麗水市蓮都區(qū)教科版三年級(jí)上冊(cè)期末考試科學(xué)試卷
- 空壓機(jī)操作安全培訓(xùn)
- 醫(yī)療組長(zhǎng)競(jìng)聘
- 失禁性皮炎病例護(hù)理查房課件
- 自然辯證法論述題146題帶答案(可打印版)
- 工程施工日志60篇
- 特殊作業(yè)安全管理監(jiān)護(hù)人專項(xiàng)培訓(xùn)課件
- 2024年中國(guó)工業(yè)級(jí)硝酸銨市場(chǎng)調(diào)查研究報(bào)告
評(píng)論
0/150
提交評(píng)論