大數(shù)據(jù)HCIA練習試題附答案_第1頁
大數(shù)據(jù)HCIA練習試題附答案_第2頁
大數(shù)據(jù)HCIA練習試題附答案_第3頁
大數(shù)據(jù)HCIA練習試題附答案_第4頁
大數(shù)據(jù)HCIA練習試題附答案_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第頁大數(shù)據(jù)HCIA練習試題附答案1.FuskmlnsightHD集群規(guī)劃中,管理節(jié)點&控制節(jié)點&數(shù)據(jù)節(jié)點合一部署方案適合什么樣的場景?A、30節(jié)點以下B、100節(jié)點以上C、100-200節(jié)點D、200節(jié)點以上【正確答案】:A2.在Zookeeper的服務模型中,Leader節(jié)點以主備模式存在,其他節(jié)點都屬于Follower節(jié)點。A、對B、錯【正確答案】:B3.Hadoop平臺中,要查看YARN服務中一個application的信息,通常需要使用什么命令?A、containerB、jarC、application-attemptD、Application【正確答案】:D4.關(guān)于Hive在FusionlnsightHD中的架構(gòu)描述錯誤的是?A、只要有一個HiveServer不可用,整個Hive集群便不可用B、HiveServer負責接受客戶端請求、解析、執(zhí)行HQL命令并返回查詢結(jié)果C、MetaStore用于提供原數(shù)據(jù)服務,依賴于DBServerD、在同一時間點HiveServeir只有一個處于Active狀態(tài),另一個則處于Standby狀態(tài)【正確答案】:A5.大數(shù)據(jù)需要傳統(tǒng)行業(yè)思維的轉(zhuǎn)變,要把數(shù)據(jù)收集,分析中作為業(yè)務流程的重要組成,數(shù)據(jù)端驅(qū)動業(yè)務流程優(yōu)化,實現(xiàn)智能化和自動化,并依托數(shù)據(jù)資產(chǎn)實現(xiàn)跨界拓展A、正確B、錯誤【正確答案】:A6.關(guān)于Hive與傳統(tǒng)數(shù)據(jù)倉庫的對比,以下描述錯誤的是?A、Hive元數(shù)據(jù)存儲獨立于數(shù)據(jù)存儲之外,從而解耦合元數(shù)據(jù)和數(shù)據(jù),靈活性高,而傳統(tǒng)數(shù)據(jù)倉庫數(shù)據(jù)應用單一,靈活性低B、Hive基于HDFS存儲,理論上存儲量可無限擴展,而傳統(tǒng)數(shù)據(jù)倉庫存儲量會有上限C、由于Hive的數(shù)據(jù)存儲在HDFS中,所以可以保證數(shù)據(jù)的高容錯,高可靠D、由于Hive基于大數(shù)據(jù)平臺,所以查詢效率比傳統(tǒng)數(shù)據(jù)倉庫快【正確答案】:D7.kafkalogssegment文件命名規(guī)則是partion全局的第一個segment從0開始,后續(xù)每個segment文件名為上一個全局partion的最大offset(偏移message數(shù))。

()A、TRUEB、FALSE【正確答案】:A8.ResourceManager采用高可用方案,當Activeresourcemanager發(fā)現(xiàn)故障時,只能通過內(nèi)置的zookeeper來啟動standby的resourcemanager,將其狀態(tài)切換為active。A、TrueB、False【正確答案】:B9.在Flink技術(shù)架構(gòu)中,()是流處理和批處理的計算引擎A、Standalone

B、RuntimeC、DataStreamD、FlinkCore

【正確答案】:B10.二級索引為hbase提供了按照某些列的值進行索引的能力,二級索引先查索引表,再定位到數(shù)據(jù)表中的位置,不用全表掃描A、trueB、false【正確答案】:A11.為了保障流應用的快照存儲的可靠性,快照主要存儲在哪里?A、jobManager的內(nèi)存中B、可靠性高的單機數(shù)據(jù)庫中C、本地文件系統(tǒng)中D、hdfs中【正確答案】:D12.Hive在load是不檢索數(shù)據(jù)是否符合schema的,hive遵循的是schemaonread(讀時模式)只有在讀時模式的時候才檢查hive的數(shù)據(jù)字段,schema。A、TRUEB、FALSE【正確答案】:A13.關(guān)于FusionInsightHDStreaming的Supervisor描述正確的是?A、Supervisor負責資源的分配和任務的調(diào)度B、Supervisor負責接受Nimbus分配的任務,啟動停止屬于自己管理的Worker進程C、Supervisor是運行具體處理邏輯的進程D、Supervisor是在Topology中接收數(shù)據(jù)然后執(zhí)行處理的組件?!菊_答案】:B14.安裝FusionInsightHD的Streaming組件Nimbus角色要求安裝幾個節(jié)點?A、4B、3C、2D、1【正確答案】:C15.SparkonYarn-client適合用于生產(chǎn)環(huán)境是因為可以更快的看到APP的輸出。A、TRUEB、FALSE【正確答案】:B16.為減少寫入磁盤的數(shù)據(jù)量,mapreduce支持對MOF(mapoutfile)進行壓縮后再寫入。A、TrueB、False【正確答案】:B17.FusionInsightManager對服務的配置功能說法不正確的是?A、服務級別的配置可對所有實例生效B、實例級別的配置只針對本實例生效C、實例級別的配置對其他實例也生效D、配置保存好需要重啟服務才能生效【正確答案】:C18.以下關(guān)于Hbase中HregionServer的功能描述哪些是不正確的A、RegionServer一般與HDFS集群的NameNode部署在一起,實現(xiàn)數(shù)據(jù)的存儲功能B、Hbase的數(shù)據(jù)處理和計算單元C、RegionServer是Hbase的數(shù)據(jù)服務進程,負責處理用戶數(shù)據(jù)的讀寫請求D、管理所有的Region,Region可以在RegionServer之間遷移【正確答案】:B19.Hive不支持超時重試機制。A、TRUEB、FALSE【正確答案】:B20.如圖,以下關(guān)于kafka消息消費者Consumer讀取消息的描述,錯誤的有?()A、圖片中的藍色為kafka的一個topic,即可以理解為隊列,每個格子代表一條消息。B、生產(chǎn)者產(chǎn)生的消息逐條放到topic的末尾。C、消費者從右至左順序讀取消息。D、Consumer使用offset來記錄讀取的位置?!菊_答案】:C21.在Flink中,checkpoint機制能夠保證應用在運行過程中出現(xiàn)失效時,從某一個檢查點恢復,在此過程中,流快照是根據(jù)數(shù)據(jù)流入建立的A、TRUEB、FALSE【正確答案】:A22.下圖展示了文件A、B、C、D的存放位置,其中文件A和B具有關(guān)聯(lián)性,它們的存儲位置符合Colocation同分布策略。A、TRUEB、FALSE【正確答案】:B23.下圖為HDFS分級存儲的配置,如果block的副本數(shù)為4,則以下說法錯誤的是?()A、4個block都將寫入RAM_DISKB、如果是第1個副本之外的其它副本寫入失敗,則嘗試寫入“副本的備選存儲策略”指定的存儲類型C、第1個block副本將寫入RAM_DISK,其余副本寫入DISKD、如果第1個block副本寫入RAM_DISK失敗,則嘗試寫入“備選存儲策略”指定的存儲類型【正確答案】:A24.FusionInsightHD系統(tǒng)中,HBase支持動態(tài)擴展列。()A、TRUEB、FALSE【正確答案】:A25.Flink是一個批處理和流處理結(jié)合的統(tǒng)一計算框架,其核心是一個數(shù)據(jù)分發(fā)以及并行化計算的流數(shù)據(jù)處理引擎。A、對B、錯【正確答案】:A26.在FusionInsight產(chǎn)品中,關(guān)于創(chuàng)建Kafka的Topic,以下哪些描述是正確的?A、在創(chuàng)建Kafka的Topic時,必須設置Partition個數(shù)B、創(chuàng)建Kafka的Topic時,必須設置Partition副本個數(shù)C、設置多副本可以增強Kafka服務的容災能力D、以上全都正確【正確答案】:C27.創(chuàng)建Loader作業(yè)時,可以在以下哪個步驟中設置Map數(shù)?A、輸出B、輸入設置C、轉(zhuǎn)換D、基本信息【正確答案】:A28.Flume數(shù)據(jù)采集過程中,下列選項中能對數(shù)據(jù)進行過濾和修飾的是()A、ChannelB、ChannelSelectorC、InterceptorD、Sink【正確答案】:C29.下列哪條HDFS命令可用于檢測數(shù)據(jù)塊的完整性?A、hdfsfsck/B、hdfsfsck–deleteC、hdfsdfsadmin–reportD、hdfsbalancer–threshold1【正確答案】:A30.Hive不適用于以下哪個場景A、非實時分析,例如日志分析,統(tǒng)計分析B、數(shù)據(jù)挖掘,例如用戶行為分析,興趣分析,區(qū)域展示C、數(shù)據(jù)匯總,例如每天,每用戶點擊數(shù),點擊排行D、實時在線數(shù)據(jù)分析【正確答案】:D31.在FusionInsightHD中,創(chuàng)建Loader作業(yè)的進行數(shù)據(jù)轉(zhuǎn)換的正確步驟是()A、加載、轉(zhuǎn)換、輸出B、輸入設置、轉(zhuǎn)換、輸出C、加載、轉(zhuǎn)化、抽取D、抽取、轉(zhuǎn)換、輸出【正確答案】:B32.在fusionlnsight產(chǎn)品中,關(guān)于kafka的topic.以下描述不正確的是?A、topic的partition數(shù)量可以創(chuàng)建時配置B、每個topic只能被分成一個partition區(qū)C、每條發(fā)布到kafka的消息都有一個類別,這個類別被稱為topic.也可以理解為一個存儲消息的隊列D、每個partition在存儲層面對應一個log文件,log文件中記錄了所有的消息數(shù)據(jù)【正確答案】:B33.HDFS聯(lián)邦機制下,各NameNode間元數(shù)據(jù)是不共享的。A、TRUEB、FALSE【正確答案】:A34.FusionInsight是華為企業(yè)級大數(shù)據(jù)存儲、查詢、分析的統(tǒng)一平臺,能夠幫助企業(yè)快速構(gòu)建海量數(shù)據(jù)信息處理系統(tǒng),通過對海量信息數(shù)據(jù)實時與非實時的分析挖掘,發(fā)現(xiàn)全新價值點和企業(yè)商機。()A、TRUEB、FALSE【正確答案】:A35.部署FusionInsightHD時,同一集群內(nèi)的FlumeServer節(jié)點建議至少部署幾個?A、1B、2C、3D、4【正確答案】:B36.Hadoop的NameNode用于存儲文件系統(tǒng)的元數(shù)據(jù)。A、正確B、錯誤【正確答案】:A37.在Fusionlnsight集群規(guī)劃部署時,建議管理節(jié)點最好部署()個,控制節(jié)點最少需要部署()數(shù)據(jù)節(jié)點最少需要部署()個。A、1,2,2B、1,3,2C、2,3,1D、2,3,3【正確答案】:D38.Hive中的“Groupby”指的是通過一定規(guī)則將一個數(shù)據(jù)集劃分成若干個小的數(shù)據(jù)集,然后針對若干個小的數(shù)據(jù)集進行數(shù)據(jù)分組處理。A、TrueB、False【正確答案】:A39.FusionInsightHD系統(tǒng)中,flume數(shù)據(jù)流在節(jié)點內(nèi)不需要經(jīng)過哪個組件?()A、sinkB、topicC、SourceD、Channel【正確答案】:B40.在Streaming中,消息可靠性級別中精確一次是通過ACK機制來實現(xiàn)的。A、TRUEB、FALSE【正確答案】:B41.FusionInsightHD系統(tǒng)中,集群中一個Loader節(jié)點異常,其他服務沒有異常的情況下,不會影響Loader服務功能的正常使用A、對B、錯【正確答案】:A42.對高價值高度聚合的信息和知識的批次處理是大數(shù)據(jù)行業(yè)主要商業(yè)訴求A、trueB、false【正確答案】:A43.FusionInisghtHD集群安裝成功后,不允許修改服務、角色和實例的配置。A、正確B、錯誤【正確答案】:B44.HBase中MOB數(shù)據(jù)直接HFile的格式存儲在HDFS上,然后把這個文件的地址信息及大小信息作為value存儲在管理HBase的store上,通過工具集中管理這些文件。這樣就可以大大降低HBase的compation和split頻率,提升性能。A、TRUEB、FALSE【正確答案】:A45.FusioninsightHD產(chǎn)品中,一個典型的kafka集群包含若干個producer若干個Consummer和一個zookeeper

集群?A、trueB、false【正確答案】:B46.Solr創(chuàng)建Collection時,推薦選用路由算法為compositldRouter,那么該Collection可以拓展shard。A、正確B、錯誤【正確答案】:B47.HBase的BloomFilter是用來過濾數(shù)據(jù)的。()A、TRUEB、FALSE【正確答案】:B48.FusionlnsightHD系統(tǒng)中,LDAP數(shù)據(jù)同步方式是哪個?A、單向同步B、雙向同步C、隔離不同步D、數(shù)據(jù)交叉同步【正確答案】:A49.YARN中默認的資源調(diào)度器是?()A、FIFO調(diào)度器B、容量調(diào)度器C、Fair調(diào)度器D、以上全不正確【正確答案】:B50.在Hive中,以下關(guān)于分區(qū)的描述不正確的是()A、分區(qū)下可再有分區(qū)或者桶B、數(shù)據(jù)表可以按照某個字段的值劃分分區(qū)C、每個分區(qū)是一個目錄D、分區(qū)數(shù)量是固定的【正確答案】:D51.關(guān)于Hive建表的基本操作,描述正確的是?A、創(chuàng)建外部表的時需要指定external關(guān)鍵字B、一旦表創(chuàng)建好,不可再修改表名C、一旦表創(chuàng)建好,不可再修改列名D、一旦表創(chuàng)建好,不可再增加新列【正確答案】:A52.Zookeeper在分布式應用中的主要作用不包括一下哪些選項?A、選舉Master節(jié)點B、保證各節(jié)點上數(shù)據(jù)的一致性C、分配集群資源D、存儲及群中服務器信息【正確答案】:C53.Flink中的()接口用于流數(shù)據(jù)處理,()接口用于批處理?A、DataStreamAPI,DataSetAPIB、DatabatchAPI,DataStreamAPIC、StreamAPI,BatchAPID、BatchAPI,StreamAPI【正確答案】:A54.如果需要由數(shù)據(jù)生產(chǎn)者決定數(shù)據(jù)發(fā)送給目標Bolt的某一個確定的Task,應選擇以下哪種消息發(fā)布策略A、局部字段分組B、廣播分組C、直接分組D、全局分組【正確答案】:C55.FusionInsightHD的Streaming是基于開源ApacheStorm開發(fā)的,Storm是一個分布式的離線計算框架。A、對B、錯【正確答案】:B56.topology在任務完成后會自動結(jié)束運行。()A、TRUEB、FALSE【正確答案】:B57.Hadoop的HBase不適合哪些數(shù)據(jù)類型的應用場景?A、大文件應用場景B、海量數(shù)據(jù)應用場景C、高吞吐率應用場景D、半結(jié)構(gòu)化數(shù)據(jù)應用場景【正確答案】:A58.以下關(guān)于HiveSQL基本操作描述正確的是()A、加載數(shù)據(jù)到Hive時源數(shù)據(jù)必須是HDFS的一個路徑B、創(chuàng)建外部表必須要指定location信息C、創(chuàng)建表時可以指定列分隔符D、創(chuàng)建外部表使用external關(guān)鍵字。創(chuàng)建普通表需要指定internal關(guān)鍵字【正確答案】:C59.Hadoop中,如果將yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percent設置為50,下面說法錯誤的是?A、一個用戶提交任務,可以使用QueueA的100%的資源B、QueueA中的每個用戶最多只能獲得50%的資源

C、如果QueueA中已經(jīng)有2個用戶的任務運行,這時第3個用戶提交的任務需要等待釋放資源D、QueueA中必須保障每個用戶至少得到50%的資源

【正確答案】:B60.哪個不是Flume的channel類型A、MemoryChannelB、FileChannelC、JDBCChannelD、HDFSChannel【正確答案】:D61.FusionInsight中Hive包含2個角色,HiveServer和MetaStore.A、TRUEB、FALSE【正確答案】:A62.FusionInsightHD系統(tǒng)中HDFS默認BlockSize是多少?A、32MB、64MC、128MD、256M【正確答案】:C63.FusionInsightHD產(chǎn)品中,一個典型的Kafka集群包含若干Producer,若干Borker,若干Consumer和一個Zookeeper集群A、TrueB、False【正確答案】:A64.Flink適用于高并發(fā)處理數(shù)據(jù)、毫秒級時延的應用A、TrueB、False【正確答案】:A65.FusionlnsightHDLoader作業(yè)前后,需要哪些節(jié)點與外部數(shù)據(jù)源通訊?A、Loadeir服務主節(jié)點B、運行Yarn服務作業(yè)的節(jié)點C、前面兩個都需要D、前面兩個都不需要【正確答案】:C66.以下關(guān)于Flink關(guān)鍵特性描述不正確的是?A、SparkStreaming與Flink相比,時延更低B、Flink流式處理引擎能夠同時提供支持流處理和批處理應用的功能C、與FusionInghtHD中的Streaming相比,Flink具有更高的吞吐量D、checkpoint實現(xiàn)了Flink的容錯【正確答案】:A67.flume架構(gòu)中,一個Source可以連接多個channel。()A、TRUEB、FALSE【正確答案】:A68.華為FusionInsight中,hbase的表設計工具、連接池管理和增強的SDK,可以簡化復雜數(shù)據(jù)表的業(yè)務開發(fā)。()A、TRUEB、FALSE【正確答案】:A69.HBase的最小處理單元是Region,UserRegion和RegionServer之間的路由信息是保存在哪里的?A、ZookeeperB、HDFSC、MasterD、meta表【正確答案】:A70.FusionInsight集群組網(wǎng)設計中,二層組網(wǎng)指集群內(nèi)二層交換,集群節(jié)點在一個子網(wǎng)里,適用節(jié)點小于200的集群場景。A、正確B、錯誤【正確答案】:A71.Kafka中partitionreplication之間同步數(shù)據(jù),從partition的leader復制數(shù)據(jù)到follower需要線程

(replicationFetcherThread),Follower(一個follower相當于consumer)主動從leader批量拉取消息的,這極大提高了吞吐量。A、TrueB、False【正確答案】:A72.Flink是一個批處理和流處理結(jié)合的計算框架,其核心是一個數(shù)據(jù)分類以及并行化計算的流數(shù)據(jù)處理引擎。()A、TRUEB、FALSE【正確答案】:A73.Flume用于收集數(shù)據(jù),其傳輸?shù)臄?shù)據(jù)基本單位是?A、SplitBlockC、EventD、Packet【正確答案】:C74.SparkOnYARN模式下,沒有部署NodeManager的節(jié)點不能啟動executor執(zhí)行TaskA、對B、錯【正確答案】:A75.Flume的數(shù)據(jù)流可以根據(jù)headers的信息發(fā)送到不同的Channel中。A、TrueB、False【正確答案】:A76.Yarn-client和Yarn-cluster主要區(qū)別是ApplicationMaster進程的區(qū)別()A、TRUEB、FALSE【正確答案】:A77.HBase的數(shù)據(jù)文件HFile中一個KeyValue格式包含Key,Value,TimeStamp,KeyType等內(nèi)容A、TRUEB、FALSE【正確答案】:A78.在Flink的運行流程中,負責申請資源的角色是?A、ResourceManagerB、JobManagerClientD、TaskManager【正確答案】:B79.Kafka日志的清理方式有兩種:delete和compact。默認值是delete。A、TRUEB、FALSE【正確答案】:A80.Hive中“UNIONALL”操作符用于合并兩個過多個SELECT語句的結(jié)果集,結(jié)果集中,不允許有重復的值。()A、TRUEB、FALSE【正確答案】:B81.可以通過以下哪個命令創(chuàng)建節(jié)點數(shù)據(jù)?A、get/nodeB、create/nodeC、set/nodedataD、ls/node【正確答案】:B82.以下哪個不屬于Hadoop中MapReduce組件的特點?A、易于編程B、良好的拓展性C、實時計算D、高容錯性【正確答案】:C83.HDFS支持大文件存儲,同時支持多個用戶對同一個文件的寫操作,以及在文件任意位置進行修改。A、正確B、錯誤【正確答案】:B84.HBase中Region的物理存儲單元是什么A、RegionB、ColumnFamilyColumnD、Row【正確答案】:B85.華為FusionInsightHD系統(tǒng)中關(guān)于HDFS的DataNode的說法正確的是?A、不會檢查數(shù)據(jù)的有效性B、周期性地將本節(jié)點的Block相關(guān)信息發(fā)送給NameNodeC、不同的DataNode存儲的Block一定是不同的D、一個DataNode上的Block可以是相同的【正確答案】:B86.Loader僅支持關(guān)系型數(shù)據(jù)庫與HBase之間的數(shù)據(jù)導入導出。A、對B、錯【正確答案】:B87.hbase的底層數(shù)據(jù)以()的形式存在的?A、keyvalueB、列存儲C、行存儲D、實時存儲【正確答案】:A88.在FusionInsight產(chǎn)品中,關(guān)于KafkaTopic,以下描述不正確的有?A、每個Topic只能被分成一個partition(區(qū))B、Topic的partition數(shù)量可以在創(chuàng)建時配置C、每個Partition的存儲層面對應一個log文件,log文件中記錄了所有的信息數(shù)據(jù)D、每條發(fā)布到Kafka的消息都有一個類別,這個類別被稱為Topic,也可以理解為一個存儲消息的隊列【正確答案】:A89.FusionInsightManager界面上,當收到kafka磁盤容量不足告警,且讀告警的原因已經(jīng)排除磁盤硬件故障時,系統(tǒng)管理員需要考慮擴容解決此問題。()A、TRUEB、FALSE【正確答案】:A90.FusionInsightHD系統(tǒng)審計日志不可以記錄下面哪些操作()A、刪除服務實例B、啟停服務實例C、手動清除告警D、查詢歷史監(jiān)控【正確答案】:D91.HBase中數(shù)據(jù)存儲的文件格式是什么?A、HFileB、HLogC、TextFileD、SequenceFile【正確答案】:A92.Spark應用運行時,如果某個Task運行失敗則導致整個app運行失敗。A、對B、錯【正確答案】:B93.FusionInsightHD中Loader作業(yè)提交到Y(jié)ARN后,作業(yè)不能手動停止。A、對B、錯【正確答案】:B94.FusionInsightManager界面上,當收到kafka擦盤容量不足警告,且該警告的原因已經(jīng)排除硬盤硬件故障時,系統(tǒng)管理員需要考慮擴容解決此問題。()A、TRUEB、FALSE【正確答案】:A95.HBase元數(shù)據(jù)MetaRegion路由信息保存在哪里?A、Root表B、ZookeeperC、HMasterD、Meta表【正確答案】:B96.以下關(guān)于Zookeeper的Leader節(jié)點在收到數(shù)據(jù)變更請求后的讀寫流程說法正確的是?A、同時寫入磁盤和內(nèi)存B、先寫磁盤再寫內(nèi)存C、僅寫入內(nèi)存D、先寫內(nèi)存再寫磁盤【正確答案】:B97.以下關(guān)于ZooKeeper關(guān)鍵特性中的原子性說法正確的是A、客戶端發(fā)送的更新會按照他們被發(fā)送的順序進行應用B、更新只能全部完成或失敗,不會部分完成C、一條消息被一個server接收,將被所有server接收D、集群中無論哪臺服務器,對外展示的均是同一視圖【正確答案】:B98.Hive在load時是不檢查數(shù)據(jù)是否符合schema的,hive遵循的是schemaonread(讀時模式),只有在讀的時候hive才檢查、解析具體的數(shù)據(jù)字段、schema。

()A、TRUEB、FALSE【正確答案】:A99.HDFS中Namenode的主備仲裁,是由哪個組件控制的A、HDFSClientB、NodeManagerC、ResourceManagerD、ZooKeeperFailoverController【正確答案】:D100.以下哪些選項屬于Hive的數(shù)據(jù)存儲模型?以上全都正確A、表B、桶C、數(shù)據(jù)庫D、分區(qū)【正確答案】:A101.創(chuàng)建loader作業(yè)中,可以在以下哪個步驟中設置過濾器類型?()A、輸入設置B、轉(zhuǎn)換C、輸出D、基本信息【正確答案】:A102.Kafka是一個分布式的消息發(fā)布訂閱系統(tǒng),它只是進行消息的轉(zhuǎn)發(fā),不會保存消息。A、對B、錯【正確答案】:B103.下列哪個命令是從HDFS下載目錄/文件到本地的?()A、dfs-catB、dfs-mkdirC、dfs-getD、dfs-put【正確答案】:C104.Hadoop系統(tǒng)中,如果HDFS文件系統(tǒng)的備份因子是3,那么MapReduce每次運行Task都要從3個有副本的機器上傳輸需要處理的文件段。A、對B、錯【正確答案】:B105.SparkStreaming計算基于DStream,將流式計算分解成一系列短小的批處理作業(yè)。()A、TRUEB、FALSE【正確答案】:A106.Kafka集群中,Kafka服務端的角色是?A、ProducerB、ConsumerC、ZookeeperD、Broker【正確答案】:A107.FusionInsightHDHBase默認使用什么作為其底層文件存儲系統(tǒng)?A、HDFSB、HadoopC、MemoryD、MapReduce【正確答案】:A108.下圖所示的Map階段,是描述哪個過程?

A、PartitionB、SortC、Splill/MergeD、combine【正確答案】:D109.HDFS的Client寫入文件時,數(shù)據(jù)的第一副本寫入位置是由NameNode確定,其他副本的寫入位置由DataNode確定。A、正確B、錯誤【正確答案】:A110.HDFS的Client寫入文件時,數(shù)據(jù)的第一副本寫入位置由NameNode確定,其他副本的寫入位置由DataNode確定。A、對B、錯【正確答案】:A111.Flink采用checkpoint機制保障應用程序運行中的容錯性。A、TRUEB、FALSE【正確答案】:A112.YARN上有兩個同級隊列Q1與Q2,容量都是50%,Q1上已經(jīng)有10個任務共占用了40的容量,Q2上有兩個任務共占用了30的容量,那么由于Q1的任務數(shù)多,調(diào)度器會優(yōu)先將資源分配給Q1。A、對B、錯【正確答案】:B113.FusionlnsightManager對服務的管理操作,下面說法錯誤的是?A、可對服務進行啟停重啟操作B、可以添加和卸載服務C、可設置不常用的服務隱藏或顯示D、可查看服務的當前狀態(tài)【正確答案】:C114.下圖展示的flume架構(gòu),主要應用于集群外的數(shù)據(jù)導入到集群內(nèi)。()A、TRUEB、FALSE【正確答案】:A115.SoIrCloud模式是集群模式,在此模式下Solr服務器強依賴于以下哪個服務?A、HBaseB、HDFSC、ZooKeeperD、Yarn【正確答案】:C116.YARN服務中,如果要給隊列QuqueA設置容量為30%,應該配置哪個參數(shù)?A、yarn.scheduler.capacity.root.QueueA.user-limit-factorB、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentC、yarn.scheduler.capacity.root.QueueA.capacityD、yarn.scheduler.capacity.root.QueueA.state【正確答案】:C117.Kerberos只能對集群內(nèi)的服務提供安全認證。A、正確B、錯誤【正確答案】:B118.關(guān)于FusionlnsightHD中Loader作業(yè)描述正確的是?A、Loader將作業(yè)提交到Y(jié)am執(zhí)行后,如果此時Loader服務異常,則此作業(yè)執(zhí)行失敗。B、Loader將作業(yè)提交到Y(jié)am執(zhí)行后,如果某個Mapper任務執(zhí)行失敗,能夠自動進行重試C、Loadet作業(yè)執(zhí)行失敗后將會產(chǎn)生垃壩數(shù)據(jù),需要用戶手動清除D、Loader將一個作業(yè)提交至Yam執(zhí)行后,該作業(yè)執(zhí)行完成前,不能再提交其他作業(yè)【正確答案】:B119.下列關(guān)于SparkStreaming和Streaming比較說法不正確的是?A、SparkStreaming是一個微批處理框架,事件需要積累到一定量時才進行處理B、Streaming的執(zhí)行邏輯是即時啟動,運行完后再回收C、SparkStreaming的吞吐量大約是Streaming的2-5倍D、SparkStreaming事件處理時延比Streaming更高【正確答案】:B120.Flume的perties配置文件可以配置多個channel來傳輸數(shù)據(jù)。A、對B、錯【正確答案】:A121.FusionInsightHD平臺中,HBase暫不支持二級索引A、對B、錯【正確答案】:B122.現(xiàn)有3個機架,有一個文件需要存3份,其中副本1和副本2存放在與client相同的機架且不同的服務器上。根據(jù)HDFS的副本放置策略一定要存放在其他機架。A、TRUEB、FALSE【正確答案】:B123.華為FusionInsightHD是國內(nèi)首家符合國家金融等級保護的大數(shù)據(jù)平臺,其安全性現(xiàn)在以下哪些方面?A、系統(tǒng)安全B、權(quán)限認證C、數(shù)據(jù)安全D、以上全都正確【正確答案】:D124.對于容量調(diào)度器的任務選擇,以下說法正確的是()A、最小隊列層級優(yōu)先B、資源回收請求隊列優(yōu)先C、最大隊列層級優(yōu)先D、資源利用量最低的隊列優(yōu)先【正確答案】:B125.HDFS中的主備仲裁,是由哪個組件控制的?A、ZooleeperFailoverControllerB、NodeManagerC、ResourceManagerD、HDFSClient【正確答案】:A126.HDFS機制中NameNode負責管理元數(shù)據(jù),Client端每次讀請求都需要從NameNode的元數(shù)據(jù)磁盤中讀取元數(shù)據(jù)信息,以此獲取所讀文件在DataNode中的位置。A、對B、錯【正確答案】:A127.下面關(guān)于Zookeeper特性的描述錯誤的是?()A、Zookeeper節(jié)點數(shù)必須為奇數(shù)個。B、客戶端所發(fā)送的更新會按照它們被發(fā)送的順序進行應用。C、消息更新只能成功或者失敗,沒有中間狀態(tài)。D、一條消息要被超過半數(shù)的Server接收,它將可以成功寫入磁盤【正確答案】:A128.FusionInsightHD部署過程中,執(zhí)行precheck檢查每個節(jié)點時必須調(diào)用

CheckNode.Config配置文件。A、正確B、錯誤【正確答案】:A129.關(guān)于RDD,下列說法錯誤的是?A、RDD具有血統(tǒng)機制(Lineage)B、RDD默認存儲在磁盤C、RDD是一個只讀的,可分區(qū)的分布式數(shù)據(jù)集D、RDD是Spark對基礎數(shù)據(jù)的抽象【正確答案】:B130.通常情況下,Hive以文本文件存儲的表會以回車作為其行分隔符,在華為FusionInsightHive中,可以指定表數(shù)據(jù)的輸入和輸出格式處理類。()A、TRUEB、FALSE【正確答案】:A131.某用戶需要搭建一個350節(jié)點的FusionlnsightHD集群,哪種規(guī)劃方案最佳?A、管理節(jié)點、控制節(jié)點、數(shù)據(jù)節(jié)點合一部署,二層組網(wǎng)B、管理節(jié)點、控制節(jié)點合一部署、數(shù)據(jù)節(jié)點獨立部署,二層組網(wǎng)C、管理節(jié)點、控制節(jié)點、數(shù)據(jù)節(jié)點都獨立部署,三層組網(wǎng)D、管理節(jié)點、數(shù)據(jù)節(jié)點合一部署,控制節(jié)點獨立部署,二層組網(wǎng)【正確答案】:C132.假設HDFS在寫入數(shù)據(jù)時只存2份,那么在寫入過程中,HDFSClient先將數(shù)據(jù)寫入DataNode1,再將數(shù)據(jù)寫入DataNode2。()A、TRUEB、FALSE【正確答案】:B133.sparkStreaming容錯機制是指RDD中任意的partition出錯,都可以根據(jù)其父

RDD重新計算生成,如果父RDD丟失,則需要去磁盤中查找原始數(shù)據(jù)。()A、TRUEB、FALSE【正確答案】:B134.如果某些Container的物理內(nèi)存利用超過了配置的內(nèi)存閾值,但所有Container的總內(nèi)存利用率并沒有超過設置的NodeManager內(nèi)存閾值,那么內(nèi)存使用過多的Container仍可以繼續(xù)運行。()A、TRUEB、FALSE【正確答案】:A135.Spark和Hadoop都不適用于迭代計算的場景。A、對B、錯【正確答案】:B136.kafka是一個高吞吐、分布式、基于發(fā)布訂閱的消息系統(tǒng),利用kafka技術(shù)可在廉價PCServer上搭建起大規(guī)模消息系統(tǒng)。()A、TRUEB、FALSE【正確答案】:A137.以下關(guān)于FusionInsightCTBase的描述不正確的是?A、CTBase的讀寫數(shù)據(jù)接口,統(tǒng)一封裝了行定義的接口,自動進行冷字段的合并和解析,不需要在應用程序中進行合并解釋B、CTBase是基于HBase的聚簇表開發(fā)框架CTBase提供了一套WebUI進行元數(shù)據(jù)定義,提供了只管醫(yī)用的表設計工具,降低表設計的難度D、CTBase的javaAPI提供一套HBase連接池管理的接口,內(nèi)部進行連接共享,減少客戶端應用開發(fā)難度?!菊_答案】:B138.Flume支持監(jiān)控并傳輸目錄下新增的文件,可實現(xiàn)數(shù)據(jù)傳輸,以上描述的是哪一類source?A、spoolingdirectorysourceB、httpsourceC、execsourceD、syslogsource【正確答案】:A139.Kafka作為一個分布式消息系統(tǒng),支持在線和離線消息處理,并提供了javaAPI以便其他組件對接使用,在FusionInsight解決方案中,Kafka屬于FusionInsightHD模塊。A、TrueB、False【正確答案】:A140.kafka-clustermirroring工具可以實現(xiàn)以下那些功能?A、kafka集群數(shù)據(jù)同步方案B、kafka單集群內(nèi)數(shù)據(jù)備份C、kafka單集群內(nèi)數(shù)據(jù)恢復D、以全部不對【正確答案】:A141.Spark任務的每個stage可劃分為job,劃分的標記是shuffle。A、正確B、錯誤【正確答案】:B142.在WebHCat架構(gòu)中,用戶能夠通過安全的HTTPS協(xié)議執(zhí)行以下哪些操作()A、執(zhí)行HiveDDL操作B、行MapReduce任務C、運行HiveHQL任務D、以上全部正確【正確答案】:D143.Flink中的checkpoint機制不斷繪制流應用的快照,流應用的狀態(tài)快照只能保存在HDFS文件系統(tǒng)中。A、對B、錯【正確答案】:B144.Flink中的()接口用于流數(shù)據(jù)處理,()接口用于批處理A、StreamAPI,BatchAPIB、DataStreamAPI,DataSetAPIC、DataBatchAPI,DataStreamAPID、BatchAPI,StreamAPI【正確答案】:B145.導入數(shù)據(jù)到Hive表時,不會檢查數(shù)據(jù)合法性,只會要讀取數(shù)據(jù)時候檢查。A、TRUEB、FALSE【正確答案】:A146.在YARN的任務調(diào)度流程中,下列哪個是ApplicationMaster負責的任務?A、申請和領(lǐng)取資源B、為任務設置好運行環(huán)境C、分配ContainerD、啟動Map或Reduce任務【正確答案】:A147.在規(guī)劃FuskmlnsightHD集群時候,如果客戶用于功能測試,對性能沒有要求,節(jié)約成本的情況下,可以采用管理節(jié)點、控制節(jié)點、數(shù)據(jù)節(jié)點合一部署,最少需要多少節(jié)點?A、2B、3C、4D、5【正確答案】:B148.YARN中設置隊列QueueA的最大使用資源量,需要配置哪個參數(shù)?A、yarn.scheduler.capacity.root.QueueA.user-limit-factorB、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentC、yarn.scheduler.capacity.root.QueueA.stateD、yarn.scheduler.capacity.root.QueueA.maximum-capacity【正確答案】:D149.Flink與SparkStreaming類似,屬于事件驅(qū)動型實時流系統(tǒng)A、對B、錯【正確答案】:B150.Spark應用在運行時,Stage劃分的依據(jù)是什么?A、taskB、taskSetC、actionD、shuffle【正確答案】:D1.下圖展示了HDFS的標簽存儲策略,觀察下圖,HBase的數(shù)據(jù)會被存儲到哪些數(shù)據(jù)節(jié)點上A、ataNodeAB、ataNodeBC、ataNodeED、ataNodeF【正確答案】:AB2.FusionlnsightHD產(chǎn)品中,關(guān)于Kafka組件說法正確的有?A、刪除Topic時,必須踴保Kafka的服務配置delete.topic.enable配置為trueB、Kafka安裝及運行曰志保存路徑為/srv/Bigdata/kafkaC、ZooKeeper服務不可用會導致Kafka服務不可用D、必須使用admin用戶或者Kafkaadmin組用戶進行創(chuàng)建Topic【正確答案】:ACD3.FusionlnsightHDV100R002C60版本集群中,以下哪些組件需要規(guī)劃元數(shù)據(jù)分區(qū)?A、HDFSB、ZookeeperC、StreamingD、RedisE、HBaseF、Kafka【正確答案】:ABC4.HBase集群定時執(zhí)行Compaction的目的是什么?(ACD)[]A、減少同一個Region同一個ColumnFamily下的文件數(shù)目B、減少同一個Region的文件數(shù)目C、提升數(shù)據(jù)讀取性能D、提升數(shù)據(jù)寫入能力【正確答案】:ACD5.FusionInsightManager會定時備份哪些數(shù)據(jù)?A、NameNodeB、LDAPC、OMSDBService【正確答案】:BC6.在華為大數(shù)據(jù)解決方案中,hadoop底層包含以下那些組件?A、finkB、hiveC、minerD、spark【正確答案】:ABD7.安全模式下安裝FusionlnsightHD集群時,哪些組件是必須安裝的?、A、ZooKeeperB、LDAPServerC、KrbServerD、HDFS【正確答案】:BC8.FusionInsightManager與外部平臺對接時,支持哪些接口?A、SNMPB、VPNC、BGPD、Syslog【正確答案】:AD9.以下關(guān)于FusionInsight中CarbonData說法正確的有?()A、carbon也是一種將數(shù)據(jù)源與spark集成的高性能分析引擎。B、carbon使用輕量級壓縮和重量級壓縮的組合壓縮算法壓縮數(shù)據(jù),可以減少

60%~80%數(shù)據(jù)存儲空間,大大節(jié)省硬件存儲成本。C、carbon是一種新型的ApacheHadoop本地文件格式,使用先進的列式存儲、索引、壓縮和編碼技術(shù),以提高計算效率,有助于加速超過PB數(shù)量級的數(shù)據(jù)查詢,可用于更快的交互查詢。D、使用carbon的目的是對大數(shù)據(jù)即席查詢提供超快速響應?!菊_答案】:ABCD10.FusionInsightHD系統(tǒng)中使用Streaming客戶端shell命令提交了拓撲之后,使用StromUI查看發(fā)現(xiàn)該拓撲長時間沒有處理數(shù)據(jù),可能原因有?()A、Supervisor是在topology中接收數(shù)據(jù)然后執(zhí)行處理的組件B、拓撲業(yè)務存在邏輯錯誤,提交之后無法正常運行C、拓撲過于復雜或者并發(fā)太大,導致worker啟動時間太長,超過Supervisor的等待時間D、Supervisor的slots資源被耗盡,拓撲提交上去之后分不到slot去啟東worker進程【正確答案】:BCD11.FusionlnsightHDLoader可以將HDFS數(shù)據(jù)導出到以下哪些目標端?A、SFTP服務器B、FTP服務器C、Oracle數(shù)據(jù)庫DB2數(shù)據(jù)庫【正確答案】:ABCD12.Loader提供了哪些方式或接口實現(xiàn)作業(yè)管理?A、WEBUIB、Linux命令行C、REST接口D、JavaAPI【正確答案】:ABCD13.采用Flume傳輸數(shù)據(jù)過程中,為了防止因Flume進程重啟而丟失數(shù)據(jù),可以使用以下哪種Channel類型?A、MemoryChannelB、JDBCChannelC、FileChannelD、HDFSChannel【正確答案】:BC14.Hadoop集群規(guī)模很大時,數(shù)據(jù)的分布情況會非常關(guān)鍵,用戶需要根據(jù)數(shù)據(jù)分布情況,決定集群是否擴容,數(shù)據(jù)是否需要做均衡等。以下關(guān)于FusionInsight資源分布監(jiān)控說法正確的有()A、幫助用戶迅速找到資源消耗最高的節(jié)點,采用適當?shù)拇胧〣、通過每個服務主頁的資源分布查看界面,查看到關(guān)鍵的資源分布情況C、可以幫助用戶快速聚集在最關(guān)鍵的資源消耗上D、通過DashBoard界面,可以查看到主機資源分布情況。例如內(nèi)存占有率在50-75%的主機列表,并提供鏈接跳轉(zhuǎn)【正確答案】:ABCD15.下列選項中,哪些是Spark的重要角色()A、DateNodeB、NodemanagerC、DriverD、ResourceManager【正確答案】:BCD16.Flink的兼容性體現(xiàn)在以下哪些方面?()A、能夠與hadoop原有的mappers和reducers混合使用B、YARN能夠作為Flink集群的資源調(diào)度管理器C、能夠使用hadoop的格式化輸入和輸出D、能夠從本地獲取數(shù)據(jù)【正確答案】:ABCD17.FusionInsightHD集群中包含了很多種服務,每種服務又由若干角色組成,下面哪些是服務的角色?()【正確答案】:AA、HDFSB、NameNodeC、DataNodeD、Hbase【正確答案】:BC18.ZKFC進程部署在hdfs中的以下那個節(jié)點上?A、activenamenodeB、standbynamenodeC、datanodeD、以上全部不對【正確答案】:AB19.FusionInsightHD系統(tǒng)中使用Streaming客戶端shell命令查看拓撲或者提交拓撲失敗,以下哪些定位手段的正確的?()A、查看Supervisor運行日志,判斷是否Supervisor異常B、查看worker運行日志C、查看客戶端異常堆棧,判斷是否客戶端使用問題D、查看主nimbus的運行日志,判斷是否nimbus服務器異?!菊_答案】:ABCD20.FusionInsightHD的HBase服務包含哪些進程?A、HMasterB、SlaveC、HRegionServerDataNode【正確答案】:AC21.FusionInsightManager與外部管理平臺對接時,支持哪些接口()A、SNMPB、SyslogC、VPND、FTP【正確答案】:AB22.FusionInsightHD平臺中,哪些組件支持對表、列加密?()A、FlinkB、HBaseC、HiveD、HDFS【正確答案】:BC23.FusionInsightHD數(shù)據(jù)高可靠性體現(xiàn)在以下哪些方面?()A、跨數(shù)據(jù)中心容災B、關(guān)鍵數(shù)據(jù)掉電保護C、硬盤熱插拔D、第三方備份系統(tǒng)集成【正確答案】:ABCD24.華為大數(shù)據(jù)產(chǎn)品FusionInsightHD中的Streaming具有哪些關(guān)鍵特性?()A、靈活性B、可伸縮性C、容災能力D、消息可靠性【正確答案】:ABCD25.與開源sqoop相比,loader具有哪些增強特性?A、高可靠性B、高性能C、安全性D、圖形化【正確答案】:ABCD26.以下屬于hiveSQL中DDL(數(shù)據(jù)定義語言)的是?()A、修改表B、刪除表C、建表D、數(shù)據(jù)導入【正確答案】:ABC27.FusionlnsightHD產(chǎn)品在部署Kerberos和LDAP服務是,以下描述正確的是?(多選)A、部署Kerberos服務之前,必須先部署LDAP服務B、LDAP服務必須和Kerberos服務部署在同一個節(jié)點C、Kerberos服務和LDAP服務部署同一個節(jié)點利于數(shù)據(jù)訪問,有助于性能提升D、LDAP服務可以多個集群共享【正確答案】:AC28.Zookeeper中的數(shù)據(jù)節(jié)點znode分為哪幾種類型?A、semi-persistentB、ephemeralC、temporaryD、persistent【正確答案】:BD29.以下關(guān)于KafkaLogs中segmentfile的說法正確的有?A、index元數(shù)據(jù)全部映射到menory,可以避免sementfile的index數(shù)據(jù)IO磁盤操作B、索引文件稀疏存儲,可以大幅減低index文件元數(shù)據(jù)占用空間大小C、稀疏存儲,即將原來的完整數(shù)據(jù),只間隔的選擇多條進行存儲D、通過索引信息可以快速定位message【正確答案】:ABCD30.關(guān)于SparkSQL&Hive區(qū)別與聯(lián)系,下列說法正確的是?()A、SparkSQL兼容絕大部分Hive的語法和函數(shù)B、SparkSQL不可以使用Hive的自定義函數(shù)C、SparkSQL的執(zhí)行引擎為Sparkcore,Hive默認執(zhí)行引擎為MapReduceD、SparkSQL依賴Hive的元數(shù)據(jù)【正確答案】:ACD31.FusionInsightManager的主要功能有以下哪些?()A、安全管理B、數(shù)據(jù)集成C、系統(tǒng)管理D、服務治理【正確答案】:AC32.FusionInsight家族包含下列哪些子產(chǎn)品?A、HDB、LibraC、ManagerD、MinerE、FarmerF、DWS【正確答案】:ABCDE33.下面關(guān)于flink窗口的描述錯誤的是A、滾動窗口在時間上是重疊的B、滾動窗口在時間上是不重疊的C、滑動動窗口之間時間點不存在重疊D、滑動窗口之間時間點存在重疊【正確答案】:AC34.Flink支持的時間操作類型包括以下哪些選項?A、結(jié)束時間B、處理時間C、采集時間D、事件時間【正確答案】:BD35.在loader歷史作業(yè)記錄中,可以查看以下哪些內(nèi)容?()A、作業(yè)狀態(tài)B、作業(yè)開始/運行時間C、臟數(shù)據(jù)鏈接D、錯誤行/文件數(shù)量【正確答案】:ABCD36.華為FusionInsightHD集群中,Spark服務可以從以下哪些服務讀取數(shù)據(jù)?(多選)A、YARNB、HDFSC、HiveD、HBase【正確答案】:BCD37.以下關(guān)于FusionInsight網(wǎng)絡安全可靠性,說法正確的有()A、避免業(yè)務平面的高負載阻塞集群管理通道B、網(wǎng)絡平面隔離,避免管理與業(yè)務寬帶搶占、互相干擾C、阻止外部攻擊者通過管理通道入侵實際業(yè)務數(shù)據(jù)D、FusionInsight支持將網(wǎng)絡劃分為三級:集群業(yè)務平面、集群管理平面和集群外維護網(wǎng)絡,彼此之間實施物理隔離【正確答案】:ABCD38.HDFS的基本系統(tǒng)構(gòu)架中包含下列哪些節(jié)點?()A、ResourceManagerB、NameNodeC、NodeManagerDataNode【正確答案】:BD39.以下關(guān)于FusionInsight多租戶管理的描述正確的有()A、一站式管理租戶資源,計算資源(CPU/內(nèi)存/IO)、存儲資源(HDFS)、服務資源,(HBase…)B、可視化的多級租戶管理,與企業(yè)組織結(jié)構(gòu)相匹配,簡化系統(tǒng)資源分配與管理C、基于容器機制的租戶資源隔離,為租戶SLA保駕護航D、與企業(yè)組織結(jié)構(gòu)相匹配的多級的租戶模型,不同部門對應不同的租戶、按需動態(tài)增刪租戶【正確答案】:ABCD40.Flink流式處理的數(shù)據(jù)源類型包括?A、CollectionsB、JDBCC、SocketstreamsD、Files【正確答案】:ABCD41.FusionInsightHD安裝前準備,包括哪些步驟?(多選)A、完成硬件安裝B、完成節(jié)點主機操作系統(tǒng)安裝C、準備工具和軟件。例如Putty、LLD、FusionInsightHD軟件安裝包等D、準備規(guī)劃數(shù)據(jù),例如網(wǎng)絡參數(shù)和角色部署位置【正確答案】:ABCD42.下列哪些組件必須依賴于Zookeeper才能運行?A、HDFSB、HBaseC、SparkD、YARN【正確答案】:ABD43.在Kafka中,如下關(guān)于Producer發(fā)送數(shù)據(jù)的說法錯誤的是()A、Proucer負責生產(chǎn)數(shù)據(jù)。Consumer負責消費數(shù)據(jù)。Producer和Consumer之間需要建立連接B、Proucer既可以發(fā)送數(shù)據(jù)到Broker上。又可以發(fā)送數(shù)據(jù)到ConsumerC、Proucer作為消息生產(chǎn)者??梢灾苯訉?shù)據(jù)寫入ZookeeperD、Proucer連接任意一個正常的Broker實例就可以產(chǎn)生數(shù)據(jù)【正確答案】:ABC44.HBase集群定時執(zhí)行Compaction的目的是什么?A、減少同一Region,同一ColumnFamily下的文件數(shù)目B、提升數(shù)據(jù)讀取性能C、減少同一ColumnFamily的文件數(shù)據(jù)D、減少同一Region的文件數(shù)目【正確答案】:ABD45.YARN容量調(diào)度器的主要特點有哪些()A、靈活性B、多重租賃C、動態(tài)更新配置文件D、容量保證【正確答案】:ABCD46.FusionlnsightHadop集群中,就去哪規(guī)模有70個節(jié)點,如果采用推薦部署方案,在管理節(jié)點可能存在哪些分區(qū)?A、/srv/BigData/zookeeperB、/srv/BigData/dbdata_omC、/srv/BigDataD、/srv/BigData/jumalnodeE、/srv/BigData/hadoop/data5【正確答案】:ABCD47.FusionInsightHD集群中包含多種服務,每種服務又由若干角色組成,下面哪些是服務的角色?A、HDFSB、NameNodeC、DataNodeD、HBase【正確答案】:BC48.以下哪些是Kafka實際的應用場景A、日志收集B、網(wǎng)站活性跟蹤C、資源管理D、聚合統(tǒng)計系統(tǒng)運營數(shù)據(jù)【正確答案】:BD49.HBase中以下哪種場景會出發(fā)Flush操作?A、HBase定期刷新Memstore,默認周期為1小時B、當WALs中文件數(shù)量達到閾值時C、Region中MemStore的總大小,達到了預設的FlushSize閾值D、MemStore占用內(nèi)存的總量和RegionServer總內(nèi)存比值超出了預設的閾值大小【正確答案】:ABCD50.以下關(guān)于Flink與其他組件交互說法正確的是?()A、Flink的checkpoint的實現(xiàn)依賴于ZookeeperB、Flink可以將接收的組件發(fā)生給kafkaC、Flink任務的運行依賴Yarn來進行資源的調(diào)度管理D、Flink在HDFS文件系統(tǒng)中讀寫數(shù)據(jù)【正確答案】:ABCD51.FusionInsightHD系統(tǒng)中使用Streaming客戶端Shell命令查看拓撲或提交拓撲失敗,以下哪些定位手段是正確的?A、查看客戶端異常堆棧,判斷是否客戶端使用問題B、查看主Nimbus的運行日志,判斷是否Nimbus服務端異常C、看Supervisor運行日志,判斷是否Supervisor異常D、查看Worker運行日志【正確答案】:AB52.Flume適用于以下哪些場景的數(shù)據(jù)收集?A、Thrift,Avro,Syslog,Kafka等數(shù)據(jù)源上收集數(shù)據(jù)B、本地文件數(shù)據(jù)采集C、應用系統(tǒng)產(chǎn)生的日志采集D、大量數(shù)據(jù)的實時數(shù)據(jù)采集【正確答案】:ABC53.傳統(tǒng)數(shù)據(jù)處理的性能瓶頸有?A、數(shù)據(jù)存儲成本高B、流式數(shù)據(jù)處理性能不足C、擴展能力有限D(zhuǎn)、批量數(shù)據(jù)處理缺失【正確答案】:AC54.在大數(shù)據(jù)時代,企業(yè)所面臨的挑戰(zhàn)有以下哪些?A、企業(yè)各部門間數(shù)據(jù)分散,相同數(shù)據(jù)在各部門內(nèi)部存儲格式不一致。B、數(shù)據(jù)結(jié)構(gòu)多樣化。C、競爭對手的技術(shù)進步。D、數(shù)據(jù)存在噪音、缺失、存儲類型不規(guī)范等問題,需要進行大量的數(shù)據(jù)預處理工作。【正確答案】:ABCD55.HDFS系統(tǒng)中對備用NameNode的作用的描述正確的有?A、主NameNode的熱備B、備NameNode對內(nèi)存沒有要求C、幫助主NameNode合并編輯日志,減少主NameNode的啟動時間D、備NameNode應與主NameNode部署到一個節(jié)點【正確答案】:AC56.FusionInsightHD系統(tǒng)中Hive支持的存儲格式包括?A、HFileB、TextFileC、SequenceFileD、RCFile【正確答案】:BCD57.HBase中包含的一些典型的Filter有哪些?A、ingleColumnValueFilterB、FilterListC、RowFilterD、KeyOnlyFilter【正確答案】:ABCD58.FusionInsightManager的主要功能有以下哪些?A、數(shù)據(jù)集成B、系統(tǒng)管理C、安全管理D、服務治理【正確答案】:BCD59.MapReduce過程中,以下屬于shuffle機制的是?()A、partitionB、sort/mergeC、copyD、combine【正確答案】:BC60.華為FusionInsightHD行業(yè)成功案例都有哪些?A、數(shù)字政府B、智慧園區(qū)C、智慧交通D、金融【正確答案】:ABCD61.Zookeeper可以為FusionInsightHD中哪些組件提供分布式管理支持()A、HBaseB、LoaderC、HiveD、Spark【正確答案】:ABCD62.關(guān)于Flume,下列說法錯誤的是?、A、Flume級聯(lián)節(jié)點之間的數(shù)據(jù)傳輸支持加密B、Flume支持多級聯(lián)和多路復用C、Source到Channel到Sink等進程內(nèi)部有加密的必要D、Flume級聯(lián)節(jié)點之間的數(shù)據(jù)傳輸不支持壓縮【正確答案】:CD63.HBase的主要特點有哪些?A、高可靠性B、高性能C、面向列D、可伸縮【正確答案】:ABCD64.下列選項中,哪些是MapReduce一定會有的過程?A、CombineB、MapC、ReduceD、Partition【正確答案】:BCD65.關(guān)于大數(shù)據(jù)的主要特征的理解和描述正確的有哪些?A、數(shù)據(jù)來源多,格式多B、數(shù)據(jù)增長速度快,處理速度快C、數(shù)據(jù)量大,計算量大D、數(shù)據(jù)價值密度低,價值高【正確答案】:ABCD66.如圖所示,下列哪些選項屬于寬依賴A、groupby:A->BB、map:C->DC、union:D&E->FD、join:B&F->G【正確答案】:AD67.下列哪些OS版本被推薦可以用來搭建FusionlnsightV1R2C60集群?(多選)A、SUSE11SP1/SP2/SP3forAMD64&Inter64B、CentOS6.6C、Redhat-6.4-x86_64D、RedHat-6.5-x86_64E、RedHat-6.7-x86_64F、Ubuntu6.3【正確答案】:ABCDE68.YARN中,“從”節(jié)點負責以下哪些工作?()A、集群中所有資源的統(tǒng)一管理和分配B、監(jiān)督Container的生命周期管理C、管理日志和不同應用程序用到的附屬服務D、監(jiān)控每個Container的資源使用(內(nèi)存,CPU等)情況【正確答案】:BD69.在FusionInsightHD中,以下哪一項不屬于Hive的流控特性A、支持對已建立的總連接數(shù)做閾值控制B、支持對每個用戶已經(jīng)建立的連接數(shù)做閾值控制C、支持對某個特定用戶已建立的連接數(shù)做閾值控制D、支持對單位時間內(nèi)所建立的連接數(shù)做閾值控制【正確答案】:ABD70.以下關(guān)于KafkaPartition副本的特性描述正確的是?A、Follower通過拉取的方式從Leader中同步數(shù)據(jù)B、主副本叫做Leader,從副本叫做FollowerC、消費者和生產(chǎn)者都是從Leader中讀寫數(shù)據(jù),也可直接與Follower交互D、副本以分區(qū)為單位。每個分區(qū)都有各自的主副本的從副本【正確答案】:ABD71.HDFS聯(lián)邦環(huán)境下,NameSpace(命名空間)包含以下哪些內(nèi)容()A、目錄B、文件C、塊D、以上全不正確【正確答案】:ABC72.FusionlnsightHD集群升級,以下描述正確的有?(多選)A、升級過程中不可以手工操作主備OMS倒換B、集群內(nèi)所有主機的root賬戶密碼保持一致C、保持網(wǎng)絡暢通,避免因網(wǎng)絡問題導致升級異常D、觀察期不能做壙容【正確答案】:ABCD73.NodeManager的內(nèi)存和CPU的數(shù)量,是通過下列哪些選項進行配置?A、Yarn.scheduler.capacity.root.QueueA.maximum-capacityB、Yarn.nodemanager.resource.cpu-vcoreC、Yarn.nodemanager.vmem-pmom-ratioD、Yarn.modemanager.resource.memory-mb【正確答案】:BCD74.以下選項中,屬于HDFS架構(gòu)關(guān)鍵特性的是?()A、健壯機制B、多方式訪問機制C、HA高可靠性D、元數(shù)據(jù)持久化機制【正確答案】:ABCD75.在華為大數(shù)據(jù)解決方案中,hadoop層包含以下哪些組件?()A、MinerB、SparkC、HiveD、Flink【正確答案】:BCD76.YARN通過ResourceManager對集群資源進行管理,它的主要功能有?A、集群資源調(diào)度B、應用程序管理C、日志管理D、以上說法都不對【正確答案】:AB77.FuskmlnsightHD集群中,集群規(guī)?,F(xiàn)有300個節(jié)點,如果采用推薦部署方案,控制節(jié)點上一定不會存在哪些分區(qū)?A、/B、/srv/BigData/dbdata_omC、/srv/BigDataD、/srv/Bigdata/umatnodeE、/srv/Bigdata/hadoop/data5【正確答案】:BE78.kafka消息傳輸保障通常有以下哪幾種?()A、最多三次(AtMostThreeTimes)B、僅有一次(ExactlyOnce)C、最少一次(AtLeaseonce)D、最多一次(AtMostonce)【正確答案】:BCD79.在Streaming的處理節(jié)點Bolt中,可以完成以下哪些操作()A、接運算B、接數(shù)據(jù)庫C、濾(filter)D、務處理【正確答案】:ABCD80.spark有哪些特點?()A、快B、巧C、靈D、輕【正確答案】:ABCD81.下列哪些措施是為了保障數(shù)據(jù)的完整性A、元數(shù)據(jù)可靠性保證B、重建失效數(shù)據(jù)盤的副本數(shù)據(jù)C、安全模式D、集群數(shù)據(jù)均衡【正確答案】:ABCD82.大數(shù)據(jù)分析相關(guān)技術(shù)主要特征有哪些?A、機器學習,全量特征B、數(shù)據(jù)背后事件關(guān)聯(lián)性分析C、以海量數(shù)據(jù)為基礎D、以精確樣本為基礎【正確答案】:ABC83.以下哪些選項屬于FusionInsight數(shù)據(jù)安全性?A、操作系統(tǒng)安全加固B、組件數(shù)據(jù)加密C、數(shù)據(jù)完整性校驗D、用戶權(quán)限認證管理【正確答案】:BC84.以下關(guān)于HBase的文件存儲模塊(HBaseFileStream,簡稱HFS)描述正確的有?A、應用在FusionInsightHD的上層應用B、HFS封裝了HBase與HDFS的接口C、為上層應用提供文件的存儲.讀取.刪除等功能D、HFS是HBase的獨立模塊【正確答案】:ABCD85.調(diào)用Zookeeper客戶端命令中包含哪些信息?A、端口號B、ip地址C、服務器名稱D、用戶名【正確答案】:AB86.FusionlnsightManager會定時備份哪些數(shù)據(jù)?A、NameNodeB、LDAPServerC、OMSDBService【正確答案】:BC87.Flink可以基于以下哪些窗口進行統(tǒng)計?A、時間窗口B、滑動窗口C、會話窗口D、countWindow【正確答案】:ABCD88.大數(shù)據(jù)商業(yè)咨詢服務方案在規(guī)劃環(huán)節(jié)主要考慮以下哪些設計?A、大數(shù)據(jù)商業(yè)模式設計B、商業(yè)場景全景規(guī)劃C、典型場景需求設計D、場景分解和業(yè)務設計【正確答案】:ABCD89.若在消息處理過程中允許部分信息丟失,關(guān)閉消息可靠性處理機制的方式有以下哪些?A、將參數(shù)Config.Topology_ACKKRS設置為0B、將參數(shù)Config.Topology_ACKKRS設置為FalseC、Spout發(fā)送消息時,使用不指定消息messageID的接口進行發(fā)送D、Bolt發(fā)送消息時使用Unanchor方式發(fā)送【正確答案】:ACD90.FusionInsight家族包含下列哪些子產(chǎn)品()?A、FusionInsightMinerB、FusionInsightFarmerC、FusionInsightHDD、GaussDB200【正確答案】:ABCD91.FusionlnsightManager與外部管理平臺對接時,支持哪些接口?(多選)A、NMPB、VPNC、FTPD、Syslog【正確答案】:ACD92.以下哪些數(shù)據(jù)源可以通過loader實現(xiàn)與FusionInsightHD的數(shù)據(jù)交換?()A、MySQLB、NoSQLC、FTPServerD、SFTPServer【正確答案】:ABCD93.華為大數(shù)據(jù)解決方案中平臺架構(gòu)包括以下哪些組成部分?()A、Hadoop層B、GaussDB200C、Datafarm層D、FusioInghtManager【正確答案】:ACD94.以下關(guān)于Zookeeper的Leader選舉說法正確的是?A、當實例n為奇數(shù)時,假定n=2x+1,則成為leader節(jié)點需要x+1票B、Zookeeper選舉leader時,需要半數(shù)以上的票數(shù)C、當實例數(shù)為8時,則成為leader節(jié)點需要5票,容災能力為4D、當實例數(shù)n為奇數(shù)時,假定n=2x+1,則成為leader節(jié)點需要x票【正確答案】:AB95.FusionInsightHD的Loader在創(chuàng)建作業(yè)時,連接器有什么作用?A、確定有哪些轉(zhuǎn)換步驟B、提供優(yōu)化參數(shù),提供數(shù)據(jù)導入導出性能C、配置作業(yè)如何與外部數(shù)據(jù)源進行連接D、配置作業(yè)如何與內(nèi)部數(shù)據(jù)源進行連接【正確答案】:ABCD96.HDFS不適用于以下哪些場景?A、流式數(shù)據(jù)訪問B、大量小文件存儲C、大文件存儲與訪問D、隨機寫入【正確答案】:BD97.Loader可以實現(xiàn)以下哪些轉(zhuǎn)換規(guī)則()A、空值轉(zhuǎn)換B、拼接轉(zhuǎn)換C、長整型時間轉(zhuǎn)換D、增量轉(zhuǎn)換【正確答案】:ABCD98.下列關(guān)于worker(工作進程)、Executor(線程)、task(任務)說法正確的是?()A、每個Executor(線程)可以運行多個task(任務)B、每個Executor(線程)可以運行不同組件(spout或bolt)的task(任務)C、每個worker可以運行多個Executor(線程)D、每個worker只能為一個拓撲運行Executor(線程)【正確答案】:ABCD99.以下關(guān)于HBase存儲模型的描述正確的是?()A、每一個KeyValue都擁有一個Qualifier標識B、同一個key值key關(guān)聯(lián)多個valueC、KeyValue中擁有時間戳、類型等關(guān)鍵信息D、即使是key值相同,Qualifier也相同的多個KeyValue,也可能有多個,此時使用時間戳來區(qū)分【正確答案】:ABCD100.Zookeeper的關(guān)鍵特性包括以下哪些選項?()A、原子性B、最終一致性C、等待無關(guān)性D、可靠性【正確答案】:ABCD101.在華為FusionInsightHD中,下面哪些組件是Flink強依賴的?()A、kafkaB、HDFSC、YARND、Zookeeper【正確答案】:BC102.FusionInsightManager界面顯示Hive服務狀態(tài)為Bad時,可能原因有哪些?A、DBService不可用B、HDFS服務不可用C、MetaStore實例不可用D、HBase服務不可用【正確答案】:ABC103.執(zhí)行HBase數(shù)據(jù)讀取業(yè)務時,需要讀取哪幾部分數(shù)據(jù)?A、HFileB、HLogC、MemStoreD、HMa

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論