版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
精選優(yōu)質(zhì)文檔-----傾情為你奉上精選優(yōu)質(zhì)文檔-----傾情為你奉上專心---專注---專業(yè)專心---專注---專業(yè)精選優(yōu)質(zhì)文檔-----傾情為你奉上專心---專注---專業(yè)HCIA-大數(shù)據(jù)試題與答案1.下列選項(xiàng)中無法通過大數(shù)據(jù)技術(shù)實(shí)現(xiàn)的是?()*[單選題]*A.商業(yè)模式發(fā)現(xiàn)B.信用評(píng)估C.商品推薦D.運(yùn)營(yíng)分析(正確答案)2.FusionInsightManager的主要功能有以下哪些?()*[單選題]*A.數(shù)據(jù)集成B.系統(tǒng)管理C.安全管理(正確答案)D.服務(wù)治理(正確答案)(正確答案)3.假設(shè)每個(gè)用戶最低資源保障設(shè)置為yarn,scheduler,capacity,root,QueueA.minimum-user-limit-percent=24。則以下說法錯(cuò)誤的是?()*[單選題]*A.第3個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得33.33%的資源B.第2個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得50%的資源C.第4個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得25%的資源D.第5個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得20%的資源(正確答案)4.華為大數(shù)據(jù)解決方案中平臺(tái)架構(gòu)包括以下哪些組成部分?()*[單選題]*A.Hadoop層B.FusioInghtManager(正確答案)C.GaussDB200D.DataFram(正確答案)(正確答案)5.Spark自帶的資源管理框架是?()*[單選題]*A.StandaloneB.MesosC.YARND.Docker(正確答案)6.關(guān)于RDD,下列說法錯(cuò)誤的是?()*[單選題]*A.RDD具有血統(tǒng)機(jī)制(Lineage)B.RDD默認(rèn)存儲(chǔ)在磁盤C.RDD是一個(gè)只讀的,可分區(qū)的分布式數(shù)據(jù)集D.RDD是Spark對(duì)基礎(chǔ)數(shù)據(jù)的抽象(正確答案)7.關(guān)于SparkSQL&Hive區(qū)別與聯(lián)系,下列說法正確的是?()*[單選題]*A.SparkSQL依賴Hive的元數(shù)據(jù)B.SparkSQL的執(zhí)行引擎為Sparkcore,Hive默認(rèn)執(zhí)行引擎為MapReduceC.SparkSQL不可以使用Hive的自定義函數(shù)(正確答案)D.SparkSQL兼容絕大部分Hive的語法和函數(shù)(正確答案)(正確答案)8.在FusionInsight集群中,Spark主要與以下哪些組件進(jìn)行交互?()*[單選題]*A.HDFSB.YARN(正確答案)C.HiveD.ZooKeeper(正確答案)(正確答案)9.關(guān)于Hive在FusionInsightHD中的架構(gòu)描述錯(cuò)誤的是?()*[單選題]*A.只要有一個(gè)HiveServer不可用,整個(gè)Hive集群便不可用B.MotaStore用于提供元數(shù)據(jù)服務(wù),依賴于DBServiceC.在同一時(shí)間點(diǎn),HiveServer只要一個(gè)處于Active狀態(tài),另一個(gè)則處于Standby狀態(tài)D.HiveServer負(fù)責(zé)接收客戶端請(qǐng)求.解析.執(zhí)行HQL命令并返回查詢結(jié)果(正確答案)10.通常情況下,Hive以文本文件存儲(chǔ)的表會(huì)以回車作為其行分隔符,在華為FusionInsightHive中,可以指定表數(shù)據(jù)的輸入和輸出格式處理。()*[單選題]*A.TRUEB.FALSE(正確答案)11.以下關(guān)于HBase中HMaster的功能描述哪些是正確的?()*[單選題]*A.Region負(fù)載均衡,Region分裂以及分裂后的Region分配B.負(fù)責(zé)建表/修改表/刪除表(正確答案)C.負(fù)責(zé)RegionServer的負(fù)載均衡(正確答案)D.RegionServer失效后的Region遷移(正確答案)(正確答案)12.Nimbus在Streaming架構(gòu)中的功能包括?()*[單選題]*A.監(jiān)控任務(wù)執(zhí)行狀態(tài)B.任務(wù)調(diào)度(正確答案)C.啟動(dòng)/關(guān)閉工作進(jìn)程D.資源分配(正確答案)(正確答案)13.Topology在任務(wù)完成后會(huì)自動(dòng)結(jié)束運(yùn)行。()*[單選題]*A.TRUEB.FALSE(正確答案)14.下面關(guān)于flink窗口的描述錯(cuò)誤的是()*[單選題]*A.滾動(dòng)窗口在時(shí)間上是重疊的B.滾動(dòng)窗口在時(shí)間上是不重疊的C.滑動(dòng)動(dòng)窗口之間時(shí)間點(diǎn)不存在重疊(正確答案)D.滑動(dòng)窗口之間時(shí)間點(diǎn)存在重疊(正確答案)15.在FusionInsightManager界面中,對(duì)Loader的操作不包括下列哪個(gè)選項(xiàng)?()*[單選題]*A.切換Loader主備節(jié)點(diǎn)B.啟動(dòng)Loader實(shí)例C.配置Loader參數(shù)D.查看Loader服務(wù)狀態(tài)(正確答案)16.創(chuàng)建Loader作業(yè)中,可以在以下哪個(gè)步驟中設(shè)置過濾器類型?()*[單選題]*A.輸入設(shè)置B.轉(zhuǎn)換C.基本信息D.輸出(正確答案)17.以下哪些數(shù)據(jù)源可以通過Loader實(shí)現(xiàn)與FusionInghtHD的數(shù)據(jù)交換?()*[單選題]*A.NoSQLB.FTPServer(正確答案)C.SFTPServer(正確答案)D.MySQL(正確答案)(正確答案)18.Kafka日志的清理方式有兩種:delete和compact。默認(rèn)值是delete。()*[單選題]*A.TRUEB.FALSE(正確答案)19.kafka-clustermirroring工具可以實(shí)現(xiàn)以下那些功能?()*[單選題]*A.kafka集群數(shù)據(jù)同步方案B.kafka單集群內(nèi)數(shù)據(jù)備份C.kafka單集群內(nèi)數(shù)據(jù)恢復(fù)D.以全部不對(duì)(正確答案)20.fusioninsightHD產(chǎn)品中,一個(gè)典型的kafka集群包含若干個(gè)producer若干個(gè)consummer和一個(gè)zookeeper集群?()*[單選題]*A.trueB.false(正確答案)21.ZKFC進(jìn)程部署在hdfs中的以下那個(gè)節(jié)點(diǎn)上?()*[單選題]*A.activenamenodeB.standbynamenode(正確答案)C.datanodeD.以上全部不對(duì)(正確答案)22.以下關(guān)于KafkaPartition偏移量的描述不正確的是?()*[單選題]*A.每條消息在文件中的位置稱為offset(偏移量)B.消費(fèi)者通過(offset.partition.topic)跟蹤記錄C.唯一標(biāo)記一條消息D.Offset是一個(gè)String型字符串(正確答案)23.Channel的作用類似隊(duì)列,用于臨時(shí)緩存進(jìn)來的數(shù)據(jù),當(dāng)Sink成功地將數(shù)據(jù)發(fā)送到下一跳的Channel或最終目的,數(shù)據(jù)會(huì)從Channel移除()*[單選題]*A.TRUEB.FALSE(正確答案)24.Zookeeper中的數(shù)據(jù)節(jié)點(diǎn)znode分為哪幾種類型?()*[單選題]*A.semi-persistentB.ephemeralC.temporaryD.persistent(正確答案)(正確答案)25.HDFS聯(lián)邦環(huán)境下,NameSpace(命名空間)包含以下哪些內(nèi)容?()*[單選題]*A.目錄B.文件(正確答案)C.塊(正確答案)D.以上全不正確(正確答案)26.HDFS存儲(chǔ)數(shù)據(jù)時(shí),關(guān)鍵數(shù)據(jù)根據(jù)實(shí)際業(yè)務(wù)需要保存在具有高度可靠性的節(jié)點(diǎn)中,通過修改DataNode的存儲(chǔ)策略,系統(tǒng)可以將數(shù)據(jù)強(qiáng)制保存在指定的節(jié)點(diǎn)組中。()*[單選題]*A.TRUEB.FALSE(正確答案)27.RDD有Transformation和Action算子,下列屬于Action算子的是?()*[單選題]*A.mapB.saveAsTextFileC.FilterD.reduceByKey(正確答案)28.SparkonYarn-client適合用于生產(chǎn)環(huán)境是因?yàn)榭梢愿斓目吹紸PP的輸出。()*[單選題]*A.TRUEB.FALSE(正確答案)29.以下關(guān)于HiveSQL基本操作描述正確的是?()*[單選題]*A.創(chuàng)建外部表必須要指定location信息B.創(chuàng)建外部表使用external關(guān)鍵字,創(chuàng)建普通表需要指定internal關(guān)鍵字C.加載數(shù)據(jù)到Hive時(shí)源數(shù)據(jù)必須是HDFS的一個(gè)路徑D.創(chuàng)建表時(shí)可以指定列分割符(正確答案)30.在Streaming中,消息可靠性級(jí)別中精確一次是通過ACK機(jī)制來實(shí)現(xiàn)的。()*[單選題]*A.TRUEB.FALSE(正確答案)31.Flume適用于以下哪些場(chǎng)景的數(shù)據(jù)收集?()*[單選題]*A.Thrift,Avro,Syslog,Kafka等數(shù)據(jù)源上收集數(shù)據(jù)B.本地文件數(shù)據(jù)采集(正確答案)C.應(yīng)用系統(tǒng)產(chǎn)生的日志采集(正確答案)D.大量數(shù)據(jù)的實(shí)時(shí)數(shù)據(jù)采集(正確答案)32.在Zookeeper和Yarn的協(xié)同工作中,當(dāng)ActiveResourceManager產(chǎn)生故障時(shí),StandbyResourceManager會(huì)從以下哪些目錄中獲取Application相關(guān)信息?()*[單選題]*A.metastoreB.StatestoreC.StoreageD.Warehouse(正確答案)33.ZooKeeper所有節(jié)點(diǎn)都可以處理讀請(qǐng)求。()*[單選題]*A.TRUEB.FALSE(正確答案)34.HDFS的副本放置策略中,同一機(jī)架不同的服務(wù)器之間的距離是()*[單選題]*A.3B.2C.1D.4(正確答案)35.下列哪些措施是為了保障數(shù)據(jù)的完整性()*[單選題]*A.元數(shù)據(jù)可靠性保證B.重建失效數(shù)據(jù)盤的副本數(shù)據(jù)(正確答案)C.安全模式(正確答案)D.集群數(shù)據(jù)均衡(正確答案)(正確答案)36.Zookeeper的Scheme認(rèn)證方式不包括以下哪項(xiàng)?()*[單選題]*A.digestB.saslC.authD.world(正確答案)37.MapReduce過程中,以下屬于Shuffle機(jī)制的是?()*[單選題]*A.CopyB.PartitionC.CombineD.Sort/Merge(正確答案)(正確答案)38.FusionInsightManager可以對(duì)哪些項(xiàng)目進(jìn)行健康檢查?()*[單選題]*A.角色B.主機(jī)(正確答案)C.服務(wù)(正確答案)D.實(shí)例(正確答案)(正確答案)39.FusionInsightManager與外部管理平臺(tái)對(duì)接時(shí),支持哪些接口?()*[單選題]*A.VPNB.SyslogC.FTP(正確答案)D.SNMP(正確答案)(正確答案)40.下列選項(xiàng)中適合MapReduce的場(chǎng)景有?()*[單選題]*A.實(shí)時(shí)交互計(jì)算B.迭代計(jì)算C.流式計(jì)算D.離線計(jì)算(正確答案)41.以下關(guān)于FusionInsight中CarbonData說法正確的有?()*[單選題]*A.使用Carbon的目的是對(duì)大數(shù)據(jù)即席查詢提供超快速響應(yīng)。B.Carbon使用輕量級(jí)壓縮和重量級(jí)壓縮的組合壓縮算法壓縮數(shù)據(jù),可以減少60%-80%數(shù)據(jù)存儲(chǔ)空間,大大節(jié)省硬件存儲(chǔ)成本。(正確答案)C.Carbon是一種新型的ApacheHadoop本地文件格式,使用先進(jìn)的列式存儲(chǔ).索引.壓縮和編碼技術(shù),以提高計(jì)算效率,有助于加速超過PB數(shù)量級(jí)的數(shù)據(jù)查詢,可用于更換的交互查詢。(正確答案)D.Carbon也是一種將數(shù)據(jù)源與Spark集成的高性能分析引擎。(正確答案)(正確答案)42.HDFS聯(lián)邦機(jī)制下,各NameNode間元數(shù)據(jù)是不共享的。()*[單選題]*A.TRUEB.FALSE(正確答案)43.ApplicationMaster采用輪詢的方式通過RPC協(xié)議向ResourceManager申請(qǐng)和領(lǐng)取資源。()*[單選題]*A.TRUEB.FALSE(正確答案)44.在YARN的任務(wù)調(diào)度中,一旦ApplicationMaster申請(qǐng)到資源后,使與對(duì)應(yīng)的ResourceManager通信,要求它啟動(dòng)任務(wù)()*[單選題]*A.TRUEB.FALSE(正確答案)45.如圖所示,下列哪些選項(xiàng)屬于寬依賴()
*[單選題]*A.groupby:A->BB.map:C->DC.union:D&E->FD.join:B&F->G(正確答案)(正確答案)46.HFS的出現(xiàn)解決了需要在HDFS中存儲(chǔ)大量的小文件(10MB以下)。同時(shí)也要存儲(chǔ)一些大文件(10MB以上)的混合的場(chǎng)景()*[單選題]*A.TRUEB.FALSE(正確答案)47.下列哪個(gè)命令是從HDFS下載目錄/文件到本地的?()*[單選題]*A.dfs-putB.dfs-catC.dfs-getD.dfs-mkdir(正確答案)48.以下選項(xiàng)中,屬于HDFS架構(gòu)關(guān)鍵特性的是?()*[單選題]*A.HA高可靠性B.健壯機(jī)制(正確答案)C.元數(shù)據(jù)持久化機(jī)制(正確答案)D.多方式訪問機(jī)制(正確答案)(正確答案)49.HBase的主HMaster是如何選舉的?()*[單選題]*A.由RegionServer進(jìn)行裁決B.HMaster為雙主模式,不需要進(jìn)行裁決C.通過ZooKeeper進(jìn)行裁決D.隨機(jī)選舉(正確答案)50.關(guān)于Hive與Hadoop其他組件的關(guān)系。以下描述錯(cuò)誤的是?()*[單選題]*A.Hive最終將數(shù)據(jù)存儲(chǔ)在HDFS中B.Hive是Hadoop平臺(tái)的數(shù)據(jù)倉庫工具C.HQL可以通過MapReduce執(zhí)行任務(wù)D.Hive對(duì)HBase有強(qiáng)依賴(正確答案)51.Hive不支持超時(shí)重試機(jī)制。()*[單選題]*A.TRUEB.FALSE(正確答案)52.FusionInsight中,HiveServer將用戶提交的HQL語句進(jìn)行編譯,解析成對(duì)應(yīng)的Yarn任務(wù).Spark任務(wù)或者HDFS操作,從而完成數(shù)據(jù)轉(zhuǎn)換,分析。()*[單選題]*A.trueB.False(正確答案)53.HBase的Region是由哪個(gè)服務(wù)進(jìn)程來管理的?()*[單選題]*A.HRegionServerB.ZooKeeperC.HMasterD.DataNode(正確答案)54.Streaming的處理節(jié)點(diǎn)Bolt中,可以完成以下哪些操作?()*[單選題]*A.連接運(yùn)算B.過濾(Filter)(正確答案)C.連接數(shù)據(jù)庫(正確答案)D.業(yè)務(wù)處理(正確答案)(正確答案)55.Flume傳輸?shù)目煽啃允侵窮lume在傳輸數(shù)據(jù)過程中,當(dāng)下一跳的Flume節(jié)點(diǎn)故障或者數(shù)據(jù)接收異常時(shí),可以自動(dòng)切換到另外一路上繼續(xù)傳輸?()*[單選題]*A.TrueB.False(正確答案)56.FusionInsightHD集群中包含了多種服務(wù),每種服務(wù)又由若干角色組成,下面哪些是服務(wù)的角色?()*[單選題]*A.HDFSB.NameNodeC.DataNode(正確答案)D.HBase(正確答案)57.FusionInsightHD系統(tǒng)中使用Streaming客戶端Shell命令提交了拓?fù)渲?,使用StormUI查看發(fā)現(xiàn)該拓?fù)溟L(zhǎng)時(shí)間沒有處理數(shù)據(jù),可能原因有?()*[單選題]*A.查看客戶端異常堆棧,判斷是否客戶端使用問題B.查看主Nimbus的運(yùn)行日志,判斷是否Nimbus服務(wù)端異常(正確答案)C.查看Supervisor運(yùn)行日志,判斷是否Supervisor異常(正確答案)D.查看Worker運(yùn)行日志(正確答案)(正確答案)58.假設(shè)HDFS在寫入數(shù)據(jù)是只存2份,那么在寫入過程中,HDFSClient先將數(shù)據(jù)寫入DataNode1,再將數(shù)據(jù)寫入DataNode2。()*[單選題]*A.TrueB.False(正確答案)59.容力量調(diào)度器在盡心資源分配,現(xiàn)有同級(jí)的2個(gè)隊(duì)列Q1和Q2,他們的容量均為30,期中Q1已使用8.Q2已使用14,則會(huì)優(yōu)先將資源分配Q1。()*[單選題]*A.TrueB.False(正確答案)60.HBase中包含的一些典型的Filter有哪些?()*[單選題]*A.SingleColumnValueFilterB.FilterList(正確答案)C.RowFilter(正確答案)D.KeyOnlyFilter(正確答案)(正確答案)61.Flink流式處理的數(shù)據(jù)源類型包括?()*[單選題]*A.CollectionsB.JDBC(正確答案)C.Socketstreams(正確答案)D.Files(正確答案)(正確答案)62.server.channels.ch1.transactionCapacity表示事務(wù)大小,即當(dāng)前channel支持事務(wù)處理的事件個(gè)數(shù),可和source的batchsize設(shè)置為同樣大小,但不能小于batchsize。()*[單選題]*A.TrueB.False(正確答案)63.Flume架構(gòu)中,一個(gè)sink可以連接多個(gè)channel。()*[單選題]*A.TrueB.False(正確答案)64.以下關(guān)于Flink關(guān)鍵特性描述不正確的是?()[單選題]*A.SparkStreaming與Flink相比,時(shí)延更低*(正確答案)B.Flink流式處理引擎能夠同時(shí)提供支持流處理和批處理應(yīng)用的功能C.與FusionInghtHD中的Streaming相比,F(xiàn)link具有更高的吞吐量D.checkpoint實(shí)現(xiàn)了Flink的容錯(cuò)65.FusionInsight是華為企業(yè)級(jí)大數(shù)據(jù)存儲(chǔ),查詢,分析的統(tǒng)一平臺(tái),能夠幫助企業(yè)快速構(gòu)建海量數(shù)據(jù)信息處理系統(tǒng),通過對(duì)海量信息數(shù)據(jù)實(shí)時(shí)與非實(shí)時(shí)的分析挖掘,發(fā)現(xiàn)全新價(jià)值點(diǎn)和企業(yè)商機(jī)。()*[單選題]*A.TrueB.False(正確答案)66.KafkaClusterMirroring工具可以實(shí)現(xiàn)以下哪項(xiàng)功能?()*[單選題]*A.Kafka跨集群數(shù)據(jù)同步方式B.Kafka單集群內(nèi)數(shù)據(jù)備份C.Kafka單集群內(nèi)數(shù)據(jù)恢復(fù)D.以上全不正確(正確答案)67.FusionInsightTool是為技術(shù)支持工程師和維護(hù)工程師提供的一套健康檢查工具,能夠檢查集群相關(guān)節(jié)點(diǎn),服務(wù)的健康狀態(tài),中潛在的問題。并生成健康檢查報(bào)告。方便技術(shù)支持工程和維護(hù)工程師快速了解系統(tǒng)的健康狀況。()*[單選題]*A.TRUEB.FALSE(正確答案)68.FusionInsight產(chǎn)品中,關(guān)于Kafka說法不正確的是?()*[單選題]*A.Kafka強(qiáng)依賴于ZooKeeperB.Kafka的服務(wù)端可以產(chǎn)生消息C.Kafka部署的實(shí)例個(gè)數(shù)不得小于2D.Consumer作為kafka的客戶端角色專門進(jìn)行消息的消費(fèi)。(正確答案)69.為了提高Kafka的容錯(cuò)性,Kafka支持Partition的復(fù)制策略,以下關(guān)于LeaderPartition和FollowerPartition的描述錯(cuò)誤的是()*[單選題]*A.Kafka針對(duì)Partition的復(fù)制需要選出一個(gè)Leader。由該Leader負(fù)責(zé)Partition的讀寫操作。其他的副本節(jié)點(diǎn)只是負(fù)責(zé)數(shù)據(jù)同步B.由于LeaderServer承載了全部的請(qǐng)求壓力。因此從集群的整體考慮,Kafka會(huì)將Leader均衡的分散在每個(gè)實(shí)例上,來確保數(shù)據(jù)均衡C.一個(gè)Kafka集群各個(gè)節(jié)點(diǎn)間不可能互為L(zhǎng)eader和FlowerD.如果Leader失效。那么將會(huì)有其他follower來接管(成為新的Leader)(正確答案)70.Kafka是一個(gè)高吞吐.分布式.基于發(fā)布訂閱的消息系統(tǒng),利用Kafka技術(shù)可在廉價(jià)PCServer上搭建起大規(guī)模消息系統(tǒng)。()*[單選題]*A.TRUEB.FALSE(正確答案)71.flink是一個(gè)批處理和流處理結(jié)合的統(tǒng)一計(jì)算框架,其核心是一個(gè)數(shù)據(jù)分發(fā)以及并行計(jì)算的流數(shù)據(jù)處理引擎()*[單選題]*A.TrueB.False(正確答案)72.HBase集群定時(shí)執(zhí)行Compaction的目的是什么?()*[單選題]*A.減少同一個(gè)Region同一個(gè)ColumnFamily下的文件數(shù)目B.減少同一個(gè)Region的文件數(shù)目C.提升數(shù)據(jù)讀取性能(正確答案)D.提升數(shù)據(jù)寫入能力(正確答案)(正確答案)73.下列關(guān)于Flinkbarrier描述錯(cuò)誤的是?()*[單選題]*A.一個(gè)barrier將本周期快照的數(shù)據(jù)與下一個(gè)周期快照的數(shù)據(jù)分隔開來B.barrier是Flink快照的核心C.在插入barrier的時(shí)候,會(huì)暫時(shí)阻斷數(shù)據(jù)流D.barrier周期性插入到數(shù)據(jù)流中,并作為數(shù)據(jù)流的一部分隨之流動(dòng)(正確答案)74.Flume進(jìn)程級(jí)聯(lián)時(shí),以下哪些Sink類型用于接收上一跳Flume發(fā)送過來的數(shù)據(jù)?()*[單選題]*A.NullSinkB.thriftsinkC.HivesinkD.avrosink(正確答案)(正確答案)75.Flink可以基于以下哪些窗口進(jìn)行統(tǒng)計(jì)?()*[單選題]*A.時(shí)間窗口B.滑動(dòng)窗口(正確答案)C.會(huì)話窗口(正確答案)D.countWindow(正確答案)(正確答案)76.關(guān)于FusionInsightHDStreaming的Supervisor描述正確的是?()*[單選題]*A.Supervisor是在Topology中接受數(shù)據(jù)然后執(zhí)行處理的組件B.Supervisor負(fù)責(zé)接受Nimbus分配的任務(wù),啟動(dòng)和停止屬于自己管理的Worker進(jìn)程C.Supervisor負(fù)責(zé)資源分配和任務(wù)調(diào)度D.Supervisor是運(yùn)行具體處理邏輯的過程(正確答案)77.Hadoop中,如果yarn.scheduler.capacity.root.QueueA.minim.m-user-limit-percent設(shè)置為50,下面說法錯(cuò)誤的是?()*[單選題]*A.一個(gè)用戶提交任務(wù),可以使用QueueA的100%的資源。B.如果QueueA中已經(jīng)有2個(gè)用戶的任務(wù)運(yùn)行,這時(shí)第3個(gè)用戶提交的任務(wù)需要等待釋放資源。C.QueueA中必須保障每個(gè)用戶至少得到50%的資源。D.QueueA中的每個(gè)用戶最多只能獲得50%的資源。(正確答案)78.關(guān)于Flume,下列說法錯(cuò)誤的是?()*[單選題]*A.Flume級(jí)聯(lián)節(jié)點(diǎn)之間的數(shù)據(jù)傳輸支持加密B.Flume支持多級(jí)聯(lián)和多路復(fù)用C.Source到Channel到Sink等進(jìn)程內(nèi)部有加密的必要D.Flume級(jí)聯(lián)節(jié)點(diǎn)之間的數(shù)據(jù)傳輸不支持壓縮(正確答案)(正確答案)79.以下關(guān)于Kafkalogs中segmentfile的說法正確的是?()*[單選題]*A.通過索引信息可以快速定位messageB.稀疏存儲(chǔ),即將原來的完整數(shù)據(jù),只間隔的選擇多條進(jìn)行存儲(chǔ)(正確答案)C.是index元數(shù)據(jù)全部映射到memory,可以避免segmentfile的index數(shù)據(jù)IO磁盤操作D.索引文件稀疏存儲(chǔ),可以大幅度降低index文件元數(shù)據(jù)占用空間大小(正確答案)(正確答案)80.Streaming主要通過zookeeper提供以下的哪項(xiàng)實(shí)現(xiàn)事件偵聽?()*[單選題]*A.分布式鎖機(jī)制B.WatcherC.CheckpointD.ACK(正確答案)81.Zookeeper在分布式應(yīng)用中的主要作用不包括一下哪些選項(xiàng)?()*[單選題]*A.選舉Master節(jié)點(diǎn)B.保證各節(jié)點(diǎn)上數(shù)據(jù)的一致性C.分配集群資源D.存儲(chǔ)及群中服務(wù)器信息(正確答案)82.Hadoop集群規(guī)模很大時(shí),數(shù)據(jù)的分布情況會(huì)非常關(guān)鍵,用戶需要根據(jù)數(shù)據(jù)分布情況,決定集群是否擴(kuò)容,數(shù)據(jù)是否需要做負(fù)載均衡等,fusionInsight資源分布監(jiān)控說法正確的是?()*[單選題]*A.可以幫助用戶快速聚焦在最關(guān)鍵的資源消耗上。B.通過每個(gè)服務(wù)主業(yè)的資源分布查看界面,看到關(guān)鍵的資源分布情況。(正確答案)C.通過Dashboard界面,可以查看到主機(jī)資源分不清哪個(gè)礦,例如內(nèi)存占用率在50-75%的主機(jī)列表,并提供鏈接跳轉(zhuǎn)。(正確答案)D.幫助用戶迅速找到資源消耗最高的點(diǎn),采取適當(dāng)?shù)拇胧?正確答案)(正確答案)83.以下關(guān)于華為大數(shù)據(jù)解決方案說法正確的是()*[單選題]*A.GaussDB是一款開源數(shù)據(jù)庫產(chǎn)品B.Farmer是數(shù)據(jù)服務(wù)框架(正確答案)C.FusionInsightManager是一個(gè)分布式系統(tǒng)管理框架,管理員可以通過多接入點(diǎn)操控分布式集群(正確答案)D.FusionInsightHD是基于開源大數(shù)據(jù)軟件Hadoop的增強(qiáng)版本(正確答案)(正確答案)84.下圖展示了文件A,B,C的存放位置。其中文件A和D具有關(guān)聯(lián)性,它們的存儲(chǔ)位置符合Colocation同分布策略()*[單選題]*A.TRUEB.FALSE(正確答案)85.HDFS中Namenode的主備仲裁,是由哪個(gè)組件控制的()*[單選題]*A.HDFSClientB.NodeManagerC.ResourceManagerD.ZooKeeperFailoverController(正確答案)86.SparkStreaming計(jì)算基于DStream將流式計(jì)算分解成一系列短小的批處理作業(yè)()*[單選題]*A.TRUEB.FALSE(正確答案)87.導(dǎo)入數(shù)據(jù)到Hive表時(shí),不會(huì)檢查數(shù)據(jù)合法性,只會(huì)在讀取數(shù)據(jù)時(shí)候檢查。()*[單選題]*A.TRUEB.FALSE(正確答案)88.Topology的處理邏輯都在Bolt中()*[單選題]*A.TRUEB.FALSE(正確答案)89.安裝FusionInsightHD的Streaming組件是,Nimbus角色要求安裝幾個(gè)節(jié)點(diǎn)?()*[單選題]*A.4B.3C.2D.1(正確答案)90.Flume的tertises配置文件中可以配置多個(gè)channel來傳輸數(shù)據(jù)()*[單選題]*A.TrueB.False(正確答案)91.驅(qū)動(dòng)型source是flume周期性主動(dòng)去獲取數(shù)據(jù)()*[單選題]*A.TrueB.False(正確答案)92.FusionInsightHD數(shù)據(jù)高可靠性體現(xiàn)在以下哪些方面?()*[單選題]*A.硬盤熱插拔B.關(guān)鍵數(shù)據(jù)掉電保護(hù)(正確答案)C.跨數(shù)據(jù)中心容災(zāi)(正確答案)D.第三方備份系統(tǒng)集成(正確答案)(正確答案)93.FusionInsightHD系統(tǒng)審計(jì)日志不可以記錄下面哪些操作?()*[單選題]*A.手動(dòng)清除告警B.啟停服務(wù)實(shí)例C.查詢歷史監(jiān)控D.刪除服務(wù)實(shí)例(正確答案)94.下圖展示了HDFS的標(biāo)簽存儲(chǔ)策略,觀察下圖,HBase的數(shù)據(jù)會(huì)被存儲(chǔ)到哪些數(shù)據(jù)節(jié)點(diǎn)上()?*[單選題]*A.DataNodeAB.DataNodeB(正確答案)C.DataNodeED.DataNodeF(正確答案)95.HBase的數(shù)據(jù)文件HFile中一個(gè)KeyValue格式包含Key,Value,TimeStamp,KeyType等內(nèi)容()*[單選題]*A.TRUEB.FALSE(正確答案)96.在有N個(gè)節(jié)點(diǎn)FusionInsightHD集群中部署HBase時(shí),推薦部署()個(gè)HMaster進(jìn)程,()個(gè)RegionServer進(jìn)程()?*[單選題]*A.3,NB.N,NC.2,ND.2,2(正確答案)97.Flink的數(shù)據(jù)轉(zhuǎn)換操作在以下哪些環(huán)節(jié)中完成()?*[單選題]*A.channelB.TransformationC.sinkD.source(正確答案)98.Kafka消息傳輸保障通常有以下哪幾種()?*[單選題]*A.僅有一次(ExactlyOnce)B.最少一次(AtLeastOnce)(正確答案)C.最多三次(AtMostThreeTimes)D.最多一次(AtMostOnce)(正確答案)(正確答案)99.KafkaLogssegment文件命名規(guī)則是partion全局的第一個(gè)segment從0開始,后續(xù)每個(gè)segment文件名為上一個(gè)全局partion事務(wù)最大offset(偏移message數(shù))。()*[單選題]*A.TRUEB.FALSE(正確答案)100.HBase的主要特點(diǎn)有哪些?()*[單選題]*A.面向列B.高性能(正確答案)C.可伸縮(正確答案)D.高可靠性(正確答案)(正確答案)101.YARN中,“從”節(jié)點(diǎn)負(fù)責(zé)以下哪些工作?()*[單選題]*A.集群中所有資源的統(tǒng)一管理和分配B.監(jiān)督container的生命周期管理C.監(jiān)控每個(gè)Container的資源使用(內(nèi)存、CPU等)情況(正確答案)D.管理日志和不同應(yīng)用程序用到的附屬服務(wù)(正確答案)102.Spark有哪些特點(diǎn)?()*[單選題]*A.快B.靈(正確答案)C.輕(正確答案)D.巧(正確答案)(正確答案)103.Hive中“Groupby”指的是通過一定的規(guī)則將每一個(gè)數(shù)據(jù)集劃分成若干個(gè)小的數(shù)據(jù)集,然后針對(duì)若干個(gè)小的數(shù)據(jù)集進(jìn)行數(shù)據(jù)分組處理()*[單選題]*A.TrueB.False(正確答案)104.Flink適用于高并發(fā)處理數(shù)據(jù)、毫秒級(jí)時(shí)延的應(yīng)用()*[單選題]*A.TrueB.False(正確答案)105.與開源sqoop相比,loader具有哪些增強(qiáng)特性?()*[單選題]*A.高可靠性B.高性能(正確答案)C.安全性(正確答案)D.圖形化(正確答案)(正確答案)106.FusionInsightHDloader可以將HDFS數(shù)據(jù)導(dǎo)出到以下哪些目標(biāo)端?()*[單選題]*A.orale數(shù)據(jù)庫B.SFTP服務(wù)器(正確答案)C.BD2數(shù)據(jù)庫(正確答案)D.FTP服務(wù)器(正確答案)(正確答案)107.FusionInsightHD的Loader在創(chuàng)建作業(yè)時(shí),連接器有以下哪些作業(yè)?()*[單選題]*A.配置作業(yè)與內(nèi)部數(shù)據(jù)源連接方式B.配置作業(yè)與外部數(shù)據(jù)源連接方式(正確答案)C.確定有轉(zhuǎn)換(正確答案)D.提供優(yōu)化參數(shù),提高數(shù)據(jù)導(dǎo)入導(dǎo)出性能(正確答案)(正確答案)108.當(dāng)zookeeper集群的節(jié)點(diǎn)數(shù)為5節(jié)點(diǎn)時(shí),請(qǐng)問集群的容災(zāi)能力和多少節(jié)點(diǎn)是等價(jià)的?()*[單選題]*A.3B.4C.5D.以上全不正確(正確答案)109.FusionInsight家族包含下列哪些子產(chǎn)品?()*[單選題]*A.FusionInsightFarmerB.FusionInsightMiner(正確答案)C.FusionInsightHD(正確答案)D.GaussDB200(正確答案)(正確答案)110.FusionInsightManager用戶權(quán)限管理不支持哪個(gè)配置?()*[單選題]*A.給用戶配置角色B.給用戶組配置角色C.給角色配置權(quán)限D(zhuǎn).給用戶組配置權(quán)限(正確答案)111.Yarn調(diào)度器分配資源的順序,下面哪一個(gè)描述的正確?()*[單選題]*A.任意機(jī)器——>本地資源——>同機(jī)架B.任意機(jī)器——>同機(jī)架——>本地資源C.本地資源——>同機(jī)架——>任意機(jī)器D.同機(jī)架——>任意機(jī)器——>本地資源(正確答案)112.以下哪個(gè)不屬于Hadoop中MapReduce組件的特點(diǎn)?()*[單選題]*A.高容錯(cuò)B.良好的擴(kuò)展性C.實(shí)時(shí)計(jì)算D.易于編程(正確答案)113.Hbase的最小存儲(chǔ)單元是Region。()*[單選題]*A.TRUEB.FALSE(正確答案)114.Hbase的某張表的RowKey劃分Splitkey為9.E.a.z.請(qǐng)問表里面有幾個(gè)Region?()*[單選題]*A.6B.3C.5D.4(正確答案)115.根據(jù)數(shù)據(jù)流如何在兩個(gè)TransFormation之間傳輸數(shù)據(jù),數(shù)據(jù)流可以分為那些類型?()*[單選題]*A.一對(duì)一流B.distributing流C.一對(duì)多流(正確答案)D.redistributig流(正確答案)116.為了保障流應(yīng)用的快照存儲(chǔ)的可靠性,快照主要存儲(chǔ)在哪里?()*[單選題]*A.jobManager的內(nèi)存中B.可靠性高的單機(jī)數(shù)據(jù)庫中C.本地文件系統(tǒng)中D.hdfs中(正確答案)117.在fusionlnsight產(chǎn)品中,關(guān)于kafka的topic.以下描述不正確的是?()*[單選題]*A.topic的partition數(shù)量可以創(chuàng)建時(shí)配置B.每個(gè)topic只能被分成一個(gè)partition區(qū)C.每條發(fā)布到kafka的消息都有一個(gè)類別,這個(gè)類別被稱為topic.也可以理解為一個(gè)存儲(chǔ)消息的隊(duì)列D.每個(gè)partition在存儲(chǔ)層面對(duì)應(yīng)一個(gè)log文件,log文件中記錄了所有的消息數(shù)據(jù)(正確答案)118.Kafa集群在運(yùn)行期間,直接依賴于下面哪些組件?()*[單選題]*A.sparkB.zookeeperC.hdfsD.hbase(正確答案)119.關(guān)于fusioninsightmanager界面hive日志收集的描述中,哪個(gè)不對(duì)?()*[單選題]*A.可指定實(shí)例進(jìn)行日志收集,比如指定收集metaStore的日志B可指定節(jié)點(diǎn)ip進(jìn)行日志收集,例如僅下載某個(gè)ip的日志C.可指定特定用戶進(jìn)行日志收集,例如僅下載user用戶的日志D.可指定時(shí)間端進(jìn)行日志收集,不如只收集2016-1-1到2016-1-10的日志(正確答案)120.fusioninsightmanager對(duì)于管理操作,下列錯(cuò)誤的是?()*[單選題]*A.可對(duì)服務(wù)進(jìn)行啟停重啟B.可以添加和卸載服務(wù)C.可設(shè)置不常用服務(wù)隱藏或顯示D.可查看服務(wù)的當(dāng)前狀態(tài)(正確答案)121.為減少寫入磁盤的數(shù)據(jù)量,mapreduce支持對(duì)MOF(mapoutfile)進(jìn)行壓縮后再寫入。()*[單選題]*A.TrueB.False(正確答案)122.ResourceManager采用高可用方案,當(dāng)Activeresourcemanager發(fā)現(xiàn)故障時(shí),只能通過內(nèi)置的zookeeper來啟動(dòng)standby的resourcemanager,將其狀態(tài)切換為active。()*[單選題]*A.TrueB.False(正確答案)123.Hive是一種數(shù)據(jù)倉庫處理工具,使用類SQL的HiveQL語言實(shí)現(xiàn)數(shù)據(jù)查詢功能,所有Hive的數(shù)據(jù)都存儲(chǔ)在HDFS中。()*[單選題]*A.TrueB.False(正確答案)124.在WebHCat架構(gòu)中,用戶能夠通過安全的HTTPS協(xié)議執(zhí)行以下哪些操作?()*[單選題]*A.執(zhí)行HiveDDL操作。B.運(yùn)行MapReduce任務(wù)C.運(yùn)行HiveHQL任務(wù)D.以上全都正確(正確答案)125.Flink的兼容性體現(xiàn)在以下哪些方面?()*[單選題]*A.YARN能夠作為F1ink集群的資源調(diào)度管理器B.能夠與Hadoop原有的Mappers和Reducers混合使用(正確答案)C.能夠使用Hadoop的格式化輸入和輸出口(正確答案)D.能夠從本地獲取數(shù)據(jù)(正確答案)(正確答案)126.KafkaConsumer寫數(shù)據(jù)總體流程是,Consumer連接指定TopicPartition所在的LeaderBroker.用主動(dòng)獲取方式從Kafka中獲取消息。()*[單選題]*A.trueB.false(正確答案)127.圖形化的健康巡檢工具FusionInsightTool由FusionCare和SysChecker兩部分組成。()*[單選題]*A.trueB.false(正確答案)128.FusionInsightManager界面上,當(dāng)收到Kafka磁盤容量不足告警,且該告警的原因已經(jīng)排除硬硬件故障時(shí),系統(tǒng)管理員需要考慮擴(kuò)容解決此問題。()*[單選題]*A.trueB.false(正確答案)129.如圖所示,F(xiàn)link流式理接口DataStreamAPI支持的語言包括?()*[單選題]*A.JavaB.C語言C.Scala(正確答案)D.Python(正確答案)130.以下關(guān)于HBase的文件存儲(chǔ)模塊(HBaseFileStream,簡(jiǎn)稱HFS)描述正確的有?()*[單選題]*A.應(yīng)用在FusionInsightHD的上層應(yīng)用B.HFS封裝了HBase與HDFS的接口(正確答案)C.為上層應(yīng)用提供文件的存儲(chǔ).讀取.刪除等功能(正確答案)D.HFS是HBase的獨(dú)立模塊(正確答案)(正確答案)131.若在消息處理過程中允許部分信息丟失,關(guān)閉消息可靠性處理機(jī)制的方式有以下哪些?()*[單選題]*A.將參數(shù)Config.Topology_ACKKRS設(shè)置為0B.將參數(shù)Config.Topology_ACKKRS設(shè)置為FalseC.Spout發(fā)送消息時(shí),使用不指定消息messageID的接口進(jìn)行發(fā)送(正確答案)D.Bolt發(fā)送消息時(shí)使用Unanchor方式發(fā)送(正確答案)(正確答案)132.在Flink技術(shù)架構(gòu)中,以下哪項(xiàng)是流處理和批處理的計(jì)算引擎?()*[單選題]*A.StandaloneB.RuntimeC.FlinkCoreD.DataSteam(正確答案)133.下圖為Flume數(shù)據(jù)傳輸架構(gòu),圖中“?”號(hào)處的組件是?()*[單選題]*A.InterceptorB.ChannelProcessorC.ChannelSelectorD.以上全不正確(正確答案)134.采用Flume傳輸數(shù)據(jù)過程中,為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù),可以使用以下哪種Channel類型?()*[單選題]*A.MemoryChannelB.JDBCChannelC.FileChannel(正確答案)D.HDFSChannel(正確答案)135.華為FusionInsightHD是國(guó)內(nèi)首家符合國(guó)家金融等級(jí)保護(hù)的大數(shù)據(jù)平臺(tái),其安全性現(xiàn)在以下哪些方面?()*[單選題]*A.系統(tǒng)安全B.權(quán)限認(rèn)證C.數(shù)據(jù)安全D.以上全都正確(正確答案)136.在華為大數(shù)據(jù)解決方案中,hadoop底層包含以下那些組件?()*[單選題]*A.finkB.hive(正確答案)C.minerD.spark(正確答案)(正確答案)137.spark的核心模塊是?()*[單選題]*A.sparkstreamingB.sparkcoreC.mapreduceD.sparksql(正確答案)138.關(guān)于hbase存儲(chǔ)模型的描述正確的是?()*[單選題]*A.即使是key值相同,qualifier也相同的多個(gè)keyvalue.也可能有多個(gè),此時(shí)使用時(shí)間戳來區(qū)分B.同一個(gè)key值可以關(guān)聯(lián)多個(gè)value(正確答案)C.keyvalue中期有時(shí)間戳,類型等關(guān)鍵信息(正確答案)D.每一個(gè)keyvalue都有一個(gè)qualifier標(biāo)識(shí)(正確答案)(正確答案)139.hbase的底層數(shù)據(jù)以()的形式存在的?()*[單選題]*A.keyvalueB.列存儲(chǔ)C.行存儲(chǔ)D.實(shí)時(shí)存儲(chǔ)(正確答案)140.二級(jí)索引為hbase提供了按照某些列的值進(jìn)行索引的能力,二級(jí)索引先查索引表,再定位到數(shù)據(jù)表中的位置,不用全表掃描()*[單選題]*A.trueB.false(正確答案)141.colocation(同分布)文件級(jí)的同分布實(shí)現(xiàn)文件的快速訪問,避免了因數(shù)據(jù)遷移帶來的大量網(wǎng)絡(luò)開銷()*[單選題]*A.trueB.false(正確答案)142.fusioninsightHD集群包含多種服務(wù),每種服務(wù)又有若干個(gè)角色組成,下面那些是角色?()*[單選題]*A.namenodeB.hbaseC.datanode(正確答案)(正確答案)143.fusininsightHD平臺(tái)中,那些組件支持對(duì)列表加密?()*[單選題]*A.HDFSB.FlinkC.hbaseD.hive(正確答案)(正確答案)144.Hadoop系統(tǒng)中,如果HDFS文件系統(tǒng)的備份因子是3,那么MapReduce每次允許task都是從3個(gè)有副本的機(jī)器上傳輸需要處理的文件.()*[單選題]*A.TrueB.False(正確答案)145.YARN容量調(diào)度器的主要特點(diǎn)有哪些?()*[單選題]*A.容量保證B.動(dòng)態(tài)更新配置文件(正確答案)C.靈活性(正確答案)D.多重租賃(正確答案)(正確答案)146.KafkaClusterMirroring工具可以實(shí)現(xiàn)以下哪些功能?()[單選]*[單選題]*A.Kafka跨集群數(shù)據(jù)同步方案B.Kafka單集群內(nèi)數(shù)據(jù)備份C.Kafka但集群內(nèi)數(shù)據(jù)恢復(fù)D.以上全不正確(正確答案)147.硬件故障被認(rèn)為是常態(tài),為了解決這個(gè)問題,HDFS設(shè)計(jì)了副本機(jī)制。默認(rèn)情況下,一份文件,HDFS會(huì)存()份?*[單選題]*A.3B.5C.2D.4(正確答案)148.現(xiàn)有3個(gè)機(jī)架,有一個(gè)文件需要存3份,其中副本1和副本2存放在與client相同的機(jī)架且不同的服務(wù)器上。根據(jù)HDFS的副本放置策略一定要存放在其他機(jī)架。()*[單選題]*A.TRUEB.FALSE(正確答案)149.Flume架構(gòu)中,一個(gè)Source可以連接多個(gè)Channel。()*[單選題]*A.TRUEB.FALSE(正確答案)150.FusionInsightHD的HBase中保存了一張用戶信息表msg_table,RowKey為用戶id,其中一類為用戶昵稱,現(xiàn)在按先后順序往這列寫keyValue:001:Li,001:Mary,001:Lily,請(qǐng)問scan‘msg_table’,(VERSIONS=>2)會(huì)返回哪幾條數(shù)據(jù)?()*[單選題]*A.1:LiB.1:LilyC.001:Li,001:Mary,001:LilyD.001:Mary,001:Lily(正確答案)151.Kafka中partitionreplication之間同步數(shù)據(jù),從partition的leader復(fù)制數(shù)據(jù)到follower需要線程(replicationFetcherThread),F(xiàn)ollower(一個(gè)follower相當(dāng)于consumer)主動(dòng)從leader批量拉取消息的,這極大提高了吞吐量。()*[單選題]*A.TrueB.False(正確答案)152.以下哪些選項(xiàng)屬于FusionInsight數(shù)據(jù)安全性?()[多選]*[單選題]*A.操作系統(tǒng)安全加固B.組件數(shù)據(jù)加密C.數(shù)據(jù)完整性校驗(yàn)(正確答案)D.用戶權(quán)限認(rèn)證管理(正確答案)153.NodeManager的內(nèi)存和CPU的數(shù)量,是通過下列哪些選項(xiàng)進(jìn)行配置?()*[單選題]*A.Yarn.scheduler.capacity.root.QueueA.maximum-capacityB.Yarn.nodemanager.resource.cpu-vcoreC.Yarn.nodemanager.vmem-pmom-ratio(正確答案)D.Yarn.modemanager.resource.memory-mb(正確答案)(正確答案)154.下列選項(xiàng)中,哪些是MapReduce一定會(huì)有的過程?()*[單選題]*A.CombineB.MapC.Reduce(正確答案)D.Partition(正確答案)(正確答案)155.下列選項(xiàng)中,哪些是Spark的重要角色()*[單選題]*A.NodemanagerB.ResourceManager(正確答案)C.DataNodeD.Driver(正確答案)(正確答案)156.以下屬于HiveSQL中DDL(數(shù)據(jù)定義語言)的是?()*[單選題]*A.修改表B.刪除表(正確答案)C.數(shù)據(jù)導(dǎo)入D.建表(正確答案)(正確答案)157.關(guān)于HIVE的描述不正確的是?()*[單選題]*A.Hive最佳使用場(chǎng)景是大數(shù)據(jù)集的批處理作業(yè)B.Hive可以實(shí)現(xiàn)在大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢、C.ive構(gòu)建在基于靜態(tài)批量處理的Hadoop之上,Hadoop通常有較高的延遲并且在作業(yè)提交和調(diào)度的時(shí)候需要大量的開銷D.Hive查詢操作過程嚴(yán)格遵循HadoopMapReduce的作用執(zhí)行模型,Hive將用戶的HiveQL語句通過解釋器轉(zhuǎn)換為MapReduceHadoop集群上(正確答案)158.在Flink中,checkpoint機(jī)制能夠保證應(yīng)用在運(yùn)行過程中出現(xiàn)失效時(shí),從某一個(gè)檢查點(diǎn)恢復(fù),在此過程中,流快照是根據(jù)數(shù)據(jù)流入建立的()*[單選題]*A.TRUEB.FALSE(正確答案)159.Hive中的“Groupby”指的是通過一定規(guī)則將一個(gè)數(shù)據(jù)集劃分成若干個(gè)小的數(shù)據(jù)集,然后針對(duì)若干個(gè)小的數(shù)據(jù)集進(jìn)行數(shù)據(jù)分組處理。()*[單選題]*A.TrueB.False(正確答案)160.Hive中~UNIONALL~操作符用于合并兩個(gè)或多個(gè)select語句的結(jié)果集,結(jié)果集中,不允許有重復(fù)的值。()*[單選題]*A.TrueB.False(正確答案)161.StructuredStreaming在OutPut階段可以定義不同的數(shù)據(jù)寫入方式,包括以下哪些方式?()*[單選題]*A.GeneralModeB.AppendMode、C.ompleteMode(正確答案)D.UpdateMode(正確答案)(正確答案)162.Flume數(shù)據(jù)采集的過程中,下列選項(xiàng)中能對(duì)數(shù)據(jù)進(jìn)行過濾和修飾的是?()*[單選題]*A.SinkB.ChannelC.ChannelselectorD.Interceptor(正確答案)163.以下關(guān)于FusionInsightCTBase的描述不正確的是?()*[單選題]*A.CTBase的讀寫數(shù)據(jù)接口,統(tǒng)一封裝了行定義的接口,自動(dòng)進(jìn)行冷字段的合并和解析,不需要在應(yīng)用程序中進(jìn)行合并和解釋B.CTBase是基于HBase的聚簇表開發(fā)框架C.CTBase提供了一套WebUI進(jìn)行元數(shù)據(jù)定義,提供了只管醫(yī)用的表設(shè)計(jì)工具,降低表設(shè)計(jì)的難度D.CTBase的javaAPI提供一套HBase連接池管理的接口,內(nèi)部進(jìn)行連接共享,減少客戶端應(yīng)用開發(fā)難度。(正確答案)164.Kafka是一個(gè)高吞吐,分布式,基于發(fā)布訂閱的消息系統(tǒng),利用Kafka技術(shù)可在廉價(jià)PCServer上搭建起大規(guī)模消息系統(tǒng)。()*[單選題]*A.TRUEB.FALSE(正確答案)165.YARN中設(shè)置隊(duì)列QueueA的最大使用資源量,需要配置哪個(gè)參數(shù)?()*[單選題]*A.yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentB.yarn.scheduler.capacity.root.QueueA.maximum-capacityC.yarn.scheduler.capacity.root.QueueA.minimum.user-limit-factorD.yarn.scheduler.capacity.root.QueueA.state(正確答案)166.如果某些Containers的物理內(nèi)存利用率超過了配置的內(nèi)存閾值,但所有Containers的總內(nèi)存利用率并沒有超過設(shè)置的NodeManager內(nèi)存閾值,那么內(nèi)存使用過多的containers仍可以繼續(xù)運(yùn)行。()*[單選題]*A.TrueB.False(正確答案)167.下圖為Spark&MapReduce的性能對(duì)比數(shù)據(jù),可以得出結(jié)論,與MapReduce計(jì)算相比,Spark用的資源,獲得倍性能?()*[單選題]*A.1/10,4B.1/8,3C.1/8,4D.1/10,3(正確答案)168.FusionInsightHD系統(tǒng)中,HBase支持動(dòng)態(tài)擴(kuò)展列。()*[單選題]*A.TrueB.False(正確答案)169.以下哪些選項(xiàng)屬于Hive的數(shù)據(jù)存儲(chǔ)模型?()*[單選題]*A.桶B.數(shù)據(jù)庫C.分區(qū)D.表E.以上全都正確(正確答案)170.Hive中的這條命令”ALTERTABLEemployeelADDcolumns(columnlstring).”是什么含義?()*[單選題]*A.創(chuàng)建表B.刪除表C.添加列D.修改文件格式(正確答案)171.下列關(guān)于SparkStreaming和Streaming比較說法不正確的是?()*[單選題]*A.SparkStreaming是一個(gè)微批處理框架,事件需要積累到一定量時(shí)才進(jìn)行處理B.Streaming的執(zhí)行邏輯是即時(shí)啟動(dòng),運(yùn)行完后再回收C.SparkStreaming的吞吐量大約是Streaming的2-5倍D.SparkStreaming事件處理時(shí)延比Streaming更高(正確答案)172.以下關(guān)于Flink與其它組件交互說法正確的是?()*[單選題]*A.Flink任務(wù)的運(yùn)行依賴Yarn來進(jìn)行資源的調(diào)度管理B.Flink的checkpoint的實(shí)現(xiàn)依賴于Zookeeper(正確答案)C.Flink可以將接收的組件發(fā)送給Kafka(正確答案)D.Flink在HDFS文件系統(tǒng)中讀寫數(shù)據(jù)(正確答案)(正確答案)173.創(chuàng)建Loader作業(yè)時(shí),可以在以下哪個(gè)步驟中設(shè)置Map數(shù)?()*[單選題]*A.輸出B.輸入設(shè)置C.轉(zhuǎn)換D.基本信息(正確答案)174.Channels支持事務(wù),提供較弱的順序保證,可以連接任何數(shù)量的Source和Sink。()*[單選題]*A.TrueB.False(正確答案)175.Kafka集群中,Kafka服務(wù)端的角色是?()*[單選題]*A.BrokerB.ConsumerC.ZooKeeperD.Producer(正確答案)176.KafkaProducer讀數(shù)據(jù)總體流程是,Producer連接任意存活的Broker,請(qǐng)求制定Topic、Partition的Leader元數(shù)據(jù)信息,然后直接與對(duì)應(yīng)的Broker直接連接,發(fā)布數(shù)據(jù)。()*[單選題]*A.TrueB.False(正確答案)177.下圖所示的Map階段,是描述哪個(gè)過程?()*[單選題]*A.PartitionB.SortC.Splill/MergeD.combine(正確答案)178.Spark根據(jù)RDD的依賴關(guān)系來劃分Stage,調(diào)度器從DAG圖末端出發(fā),逆向遍歷整個(gè)依賴關(guān)系鏈,遇到窄依賴就斷開,遇到寬依賴就將其加入當(dāng)前Stage。()*[單選題]*A.TRUEB.FALSE(正確答案)179.關(guān)于DataSet,下列說法不正確的是?()*[單選題]*A.DataSet不需要反序列化就可執(zhí)行大部分操作B.DataSet是一個(gè)由特定域的對(duì)象組成的強(qiáng)類型集合C.DataSet與RDD高度類似,性能比RDD好D.DataSet執(zhí)行sort,filter,shuffle登操作需要進(jìn)行反序列化(正確答案)180.Hbase中OpenScanner的過程,會(huì)創(chuàng)建兩種不同的Scanner來讀取HFile和MemStore的數(shù)據(jù),HFile對(duì)應(yīng)的Scanner為StoreFileScanner,MemStore對(duì)應(yīng)的Scanner為MemStoreScanner。()*[單選題]*A.TRUEB.FALSE(正確答案)181.執(zhí)行HBase讀取數(shù)據(jù)業(yè)務(wù),需要讀取哪幾部分?jǐn)?shù)據(jù)?()*[單選題]*A.HMasterB.HFileC.HlogD.MemStore(正確答案)(正確答案)182.使用HBase客戶端批量寫入10條數(shù)據(jù),某個(gè)HRegionServer節(jié)點(diǎn)上包含該表的2個(gè)Region,分別為A和B,10條數(shù)據(jù)中有6條屬于A,4條屬于B,請(qǐng)問寫入這10條數(shù)據(jù)需要向該HRegionServer發(fā)送幾次RPC請(qǐng)求?()*[單選題]*A.10B.6C.2D.1(正確答案)183.Hive不適用于以下哪個(gè)場(chǎng)景()*[單選題]*A.非實(shí)時(shí)分析,例如日志分析,統(tǒng)計(jì)分析B.數(shù)據(jù)挖掘,例如用戶行為分析,興趣分析,區(qū)域展示C.數(shù)據(jù)匯總,例如每天,每用戶點(diǎn)擊數(shù),點(diǎn)擊排行D.實(shí)時(shí)在線數(shù)據(jù)分析(正確答案)184.關(guān)于Hive建表基本操作,描述正確的是()*[單選題]*A.一旦表建好,不可再修改表名B.一旦表建好,不可再增加新列C.創(chuàng)建外部表時(shí)需要制定external關(guān)鍵字D.一旦表創(chuàng)建好,不可再修改列名(正確答案)185.FusionInsightHD系統(tǒng)中Hive支持的存儲(chǔ)格式包括?()*[單選題]*A.TextFileB.SequenceFile(正確答案)C.RCFile(正確答案)D.HFile(正確答案)186.在Flink的運(yùn)行流程中,負(fù)責(zé)申請(qǐng)資源的角色是?()*[單選題]*A.ResourceManagerB.JobManagerC.ClientD.TaskManager(正確答案)187.在FuisonInsightHD中,創(chuàng)建Loader作業(yè)的進(jìn)行數(shù)據(jù)轉(zhuǎn)換的正確步驟是?()*[單選題]*A.輸入設(shè)置,轉(zhuǎn)換,輸出B.抽取,轉(zhuǎn)換,輸出C.加載,轉(zhuǎn)換,輸出D.加載,轉(zhuǎn)換,抽取(正確答案)188.Flume用于收集數(shù)據(jù),其傳輸?shù)臄?shù)據(jù)基本單位是?()*[單選題]*A.SplitB.BlockC.EventD.Packet(正確答案)189.FusionnInsigetHD系統(tǒng)中,F(xiàn)lume數(shù)據(jù)流在節(jié)點(diǎn)內(nèi)不需要經(jīng)過哪個(gè)組件?()*[單選題]*A.SourceB.SinkC.TopicD.Channel(正確答案)190.傳統(tǒng)數(shù)據(jù)處理的數(shù)據(jù)規(guī)模的單位是?()*[單選題]*A.TBB.EBC.PBD.GB(正確答案)191.下列哪個(gè)命令是刪除文件的?()*[單選題]*A.dfs-clearB.dfs-lsC.dfs-rmD.dfs-del(正確答案)192.下圖為HDFS分級(jí)存儲(chǔ)的配置,如果Block的副本數(shù)為4,則以下說法錯(cuò)誤的是?()*[單選題]*A.第1個(gè)Block副本將寫入RAM_DISK,其余副本寫入DISKB.如果是第1個(gè)副本之外的其他副本寫入失敗,則嘗試寫入“副本的備選存儲(chǔ)策略”指定的存儲(chǔ)策略C.如果第1個(gè)Block副本寫入RAM_DISK失敗,則嘗試寫入”備選存儲(chǔ)策略”的存儲(chǔ)類型D.4個(gè)Block都將寫入RAM_DISK(正確答案)193.Hadoop平臺(tái)中,要查看YARN服務(wù)中一個(gè)application的信息,通常需要使用什么命令?()*[單選題]*A.containerB.jarC.application-attemptD.Application(正確答案)194.Spark適用于以下哪些場(chǎng)景?()*[單選題]*A.交互式查詢B.實(shí)時(shí)流處理(正確答案)C.批處理(正確答案)D.圖計(jì)算(正確答案)(正確答案)195.下圖展示了StructuredStreaming的計(jì)算模型。通過觀察可以得出最終T3的計(jì)算結(jié)果是?()*[單選題]*A.Dog1,owl1B.Cat2,dog4,owl2C.Cat2,dog3,owl1D.Cat1,cat1,dog2,dog2,owl2(正確答案)196.SparkStreaming容錯(cuò)機(jī)制是指RDD中任意的Partition出錯(cuò),都可以根據(jù)其父RDD重新計(jì)算生成,如果父RDD丟失,則需要去磁盤中查找原始數(shù)據(jù)。()*[單選題]*A.TRUEB.FALSE(正確答案)197.HBase元數(shù)據(jù)MetaRegion路由信息保存在哪里?()*[單選題]*A.ZookeeperB.Meta表C.HMasterD.Root表(正確答案)198.Hbase的BloomFiliter是用來顧慮數(shù)據(jù)的?()*[單選題]*A.TRUEB.FALSE(正確答案)199.執(zhí)行HBase讀數(shù)據(jù)業(yè)務(wù),需要讀取哪幾部分?jǐn)?shù)據(jù)?()*[單選題]*A.HLogB.HMasterC.HFileD.MemStore(正確答案)(正確答案)200.FusionInsight中Hive包含2個(gè)角色,HiverServer和MetaStore?()*[單選題]*A.TRUEB.FALSE(正確答案)201.Colocation同分布文件級(jí)的同分不實(shí)現(xiàn)文件的快速訪問,避免了因數(shù)據(jù)遷移帶來的大量網(wǎng)絡(luò)開銷()*[單選題]*A.TRUEB.FALSE(正確答案)202.關(guān)于Hive與傳統(tǒng)數(shù)據(jù)倉庫的對(duì)比,以下描述錯(cuò)誤的是?()*[單選題]*A.Hive元數(shù)據(jù)存儲(chǔ)獨(dú)立于數(shù)據(jù)存儲(chǔ)之外,從而解耦合元數(shù)據(jù)和數(shù)據(jù),靈活性高,而傳統(tǒng)數(shù)據(jù)倉庫數(shù)據(jù)應(yīng)用單一,靈活性低B.Hive基于HDFS存儲(chǔ),理論上存儲(chǔ)量可無限擴(kuò)展,而傳統(tǒng)數(shù)據(jù)倉庫存儲(chǔ)量會(huì)有上限C.由于Hive的數(shù)據(jù)存儲(chǔ)在HDFS中,所以可以保證數(shù)據(jù)的高容錯(cuò),高可靠D.由于Hive基于大數(shù)據(jù)平臺(tái),所以查詢效率比傳統(tǒng)數(shù)據(jù)倉庫快(正確答案)203.YARN的基于標(biāo)準(zhǔn)調(diào)度,是對(duì)下列選項(xiàng)中的哪個(gè)進(jìn)行標(biāo)簽化?()*[單選題]*A.AppMasterB.ResourceManagerC.NodeManagerD.Container(正確答案)204.對(duì)于Hive中關(guān)于普通表和外部表描述不正確的是?()*[單選題]*A.默認(rèn)創(chuàng)建普通表B.刪除外部表時(shí),只刪除外部表數(shù)據(jù)而不刪除元數(shù)據(jù)C.外部實(shí)質(zhì)是將已存在于HDFS上的文件路徑跟表關(guān)聯(lián)起來D.刪除普通表時(shí),元數(shù)據(jù)和數(shù)據(jù)同時(shí)被刪除(正確答案)205.在FusionInsight產(chǎn)品中,關(guān)于創(chuàng)建Kafka的Topic,以下哪些描述是正確的?()*[單選題]*A.在創(chuàng)建Kafka的Topic時(shí),必須設(shè)置Partition個(gè)數(shù)B.在創(chuàng)建Kafka的Topic時(shí),必須設(shè)置Partition副本個(gè)數(shù)C.設(shè)置多副本可以增強(qiáng)Kafka服務(wù)的容災(zāi)能力D.以上全都正確(正確答案)206.Zookeeper的增強(qiáng)性包括在審計(jì)日志中添加ephemeralnode被刪除的審計(jì)日志()*[單選題]*A.TRUEB.False(正確答案)207.下列選項(xiàng)中,關(guān)于Zookeeper可靠性含義說法正確的是?()*[單選題]*A.可靠性通過主備部署模式實(shí)現(xiàn)B.可靠性是指更新更新只能成功或者失敗,沒有中間狀態(tài)C.可靠性是指無論哪個(gè)server,對(duì)外展示的均是同一個(gè)視圖D.可靠性是指一個(gè)消息被一個(gè)Server接收,它將被所有的Server接受(正確答案)208.華為FusionInsightHD行業(yè)成功案例都有哪些?()*[單選題]*A.數(shù)字政府B.智慧園區(qū)(正確答案)C.智慧交通(正確答案)D.金融(正確答案)(正確答案)209.FusionInsightManager會(huì)定時(shí)備份哪些元數(shù)據(jù)?()*[單選題]*A.OMSB.LDAPServer(正確答案)C.DBService(正確答案)D.Namenode(正確答案)(正確答案)210.YARN中默認(rèn)的資源調(diào)度器是?()*[單選題]*A.FIFO調(diào)度器B.容量調(diào)度器C.Fair調(diào)度器D.以上全不是(正確答案)211.假設(shè)在寫入數(shù)據(jù)時(shí)只存2份,那么寫入過程中,HDFSClient現(xiàn)將數(shù)據(jù)寫入DataNode1,再將數(shù)據(jù)寫入Datanode2()*[單選題]*A.TRUEB.FALSE(正確答案)212.Yarn-Client和Yarn-Cluster主要區(qū)別是ApplicationMaster進(jìn)程的區(qū)別()*[單選題]*A.TRUEB.FALSE(正確答案)213.部署FusionInsightHD時(shí),同一集群內(nèi)的FlumeServer節(jié)點(diǎn)建議至少部署幾個(gè)?()*[單選題]*A.1B.3C.4D.2(正確答案)214.以下哪些是Kafka實(shí)際的應(yīng)用場(chǎng)景?()*[單選題]*A.網(wǎng)站活性跟蹤B.日志收集(正確答案)C.聚合統(tǒng)計(jì)系統(tǒng)運(yùn)營(yíng)數(shù)據(jù)(監(jiān)控?cái)?shù)據(jù))(正確答案)D.資源管理(正確答案)215.FusionInsightHD系統(tǒng)中,下面哪個(gè)方法不能查看到Loader作業(yè)執(zhí)行的結(jié)果()*[單選題]*A.通過LoaderUI界面查看B.通過YARN任務(wù)管理查看C.通過NodeManager查看D.通過Manager的告警查看(正確答案)216.如圖,以下關(guān)于Kafka消息消費(fèi)者Consumer讀取消息的描述,錯(cuò)誤的有?()*[單選題]*A.Consumer使用Offset來記錄讀取的位置B.圖片中的藍(lán)色框?yàn)镵afka的一個(gè)Topic,即可以理解為一個(gè)隊(duì)列,每個(gè)格子代表一條消息。C.生產(chǎn)者產(chǎn)生的消息逐條放到Topic的末尾D.消費(fèi)者從右至左順序讀取消息(正確答案)217.在大數(shù)據(jù)時(shí)代,企業(yè)所面臨的挑戰(zhàn)有以下哪些?()*[單選題]*A.企業(yè)各部門間數(shù)據(jù)分散,相同數(shù)據(jù)在各部門內(nèi)部存儲(chǔ)格式不一致。B.數(shù)據(jù)結(jié)構(gòu)多樣化。(正確答案)C.競(jìng)爭(zhēng)對(duì)手的技術(shù)進(jìn)步。(正確答案)D.數(shù)據(jù)存在噪音、缺失、存儲(chǔ)類型不規(guī)范等問題,需要進(jìn)行大量的數(shù)據(jù)預(yù)處理工作。(正確答案)(正確答案)218.FusionInsightHD中HBase默認(rèn)使用什么組件作為其底層文件存儲(chǔ)系統(tǒng)?()*[單選題]*A.FileB.KafkaC.HDFSD.Memory(正確答案)219.在很多小文件場(chǎng)景下,Spark會(huì)起很多Task,當(dāng)SQL邏輯中存在Shuffle操作時(shí),會(huì)大大增加hash分桶數(shù),嚴(yán)重影響性能。FusionInsight中,針對(duì)小文件的場(chǎng)景通常采用()算子,來對(duì)Table中的小文件生成的partition進(jìn)行合并,減少partition數(shù),從而避免在shuffle的時(shí)候,生成過多的hash分桶,提升性能?()*[單選題]*A.groupbyB.coalosceC.connectD.join(正確答案)220.下列關(guān)于Worker(工作進(jìn)程)、Executor(線程)、Task(任務(wù))說法正確的是?()*[單選題]*A.每個(gè)Executor(線程)可以運(yùn)行多個(gè)Task(任務(wù))B.每個(gè)Worker可以運(yùn)行多個(gè)Executor(線程)(正確答案)C.每個(gè)Worker只能為一個(gè)拓?fù)溥\(yùn)行Executor(線程)D.每個(gè)Executor(線程)可以運(yùn)行不同
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 產(chǎn)品保修合同
- 大型美食城招商合同范本
- 商住樓物業(yè)管理合同
- 汽車維修合同書范本
- 鍋爐工合同書
- 我要出租房屋租賃合同范本
- 室內(nèi)場(chǎng)景識(shí)別定位約束條件下的手機(jī)實(shí)例化AR方法研究
- 2025年外研版三年級(jí)起點(diǎn)七年級(jí)歷史下冊(cè)階段測(cè)試試卷含答案
- 2025年浙教新版九年級(jí)歷史下冊(cè)階段測(cè)試試卷含答案
- 2025年粵人版選修二地理上冊(cè)階段測(cè)試試卷
- 2024統(tǒng)編版新教材道德與法治七年級(jí)全冊(cè)內(nèi)容解讀課件(深度)
- 籃球俱樂部合伙協(xié)議
- 電力基建復(fù)工安全教育培訓(xùn)
- 2018注冊(cè)環(huán)保工程師考試公共基礎(chǔ)真題及答案
- 勞務(wù)經(jīng)紀(jì)人培訓(xùn)
- 如何提高售后服務(wù)的快速響應(yīng)能力
- Unit-3-Reading-and-thinking課文詳解課件-高中英語人教版必修第二冊(cè)
- 高數(shù)(大一上)期末試題及答案
- 婚介公司紅娘管理制度
- 煤礦電氣試驗(yàn)規(guī)程
- 物業(yè)客服培訓(xùn)課件PPT模板
評(píng)論
0/150
提交評(píng)論