數(shù)據(jù)工程師培訓題庫一_第1頁
數(shù)據(jù)工程師培訓題庫一_第2頁
數(shù)據(jù)工程師培訓題庫一_第3頁
數(shù)據(jù)工程師培訓題庫一_第4頁
數(shù)據(jù)工程師培訓題庫一_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、TDH數(shù)據(jù)平臺認證工程師試題姓名:分數(shù): 【說明】a)客觀題30題,每題2分,總計60分b)主觀題4題,每題10分,總計40分c) 滿分100分?!静欢椷x擇題(每題 2分共60分)1、在HDFS服務中,為了保證 Name Node高可用性的角色不包括()A . Data NodeB . Journal NodeC.ZKFCD . Zookeeper2、Namenode在啟動時自動進入安全模式,在安全模式階段,說法錯誤的是()A.安全模式目的是在系統(tǒng)啟動時對數(shù)據(jù)有效性進行檢查B.根據(jù)策略對數(shù)據(jù)塊進行必要的復制或刪除C.當數(shù)據(jù)塊的上報數(shù)達到閾值時,會自動退出安全模式D.允許用戶對文件系統(tǒng)進行讀寫

2、操作3、在集群中配置 HDFS的副本數(shù)為3,設置數(shù)據(jù)塊大小為 128M ,此時我們上傳一份 64M 的數(shù)據(jù)文件,該數(shù)據(jù)文件占用HDFS空間大小為()A . 64MB . 128MC . 384MD . 192M4、下列對YARN1色在集群中的作用描述正確的是()A.集群資源管理B.集群任務調度與管理C .存儲部分HDFS上的數(shù)據(jù)塊D.以上都正確5、在Yarn服務中,不包含以下哪種角色()A . ResourceManagerB . NodeManagerC . ApplicationMasterD . Contianer6、下列計算框架中不屬于分布式計算框架的是(A . MapReduceB

3、. MATLABC.SPARKD . Tez7、以下關于外表和托管表描述正確的是()A、外表的數(shù)據(jù)存儲在本地,托管表的數(shù)據(jù)存儲在hdfs上B、刪除托管表只會刪除Inceptor上的元數(shù)據(jù)不會刪除數(shù)據(jù)文件,刪除外表兩者都會被刪除C、刪除外表只會刪除Inceptor上的元數(shù)據(jù)不會刪除數(shù)據(jù)文件,刪除托管表兩者都會被刪除D、刪除托管表或外表,incepotr上的元數(shù)據(jù)和數(shù)據(jù)文件都會被刪除8、以下對分桶表的描述正確的是()A、分桶表通過改變數(shù)據(jù)的存儲分布,對查詢起到一定的優(yōu)化作用B、分桶鍵不能是表中的列C、分桶數(shù)應為素數(shù)D、事物表必須制定分桶,分桶字段可以被更新9、以下關于inceptor excuto

4、r資源配置的說法正確的有()A、Excutor資源配置fixed和ratio兩種模式B、Excutor內核數(shù)配置的是每個 excutor所使用白邏輯 core數(shù)量C、Excutor內核數(shù)和內存配置比例一般為1 core:2G memoryD、 Excutor分布可以指定每個節(jié)點運行的excutor數(shù)量或executor在集群上運行的總數(shù)量,但是不能指定運行的節(jié)點10、假設使用場景中有如下查詢語句SELECT Sex, Region, COUNT(ID), AVG (Salary)FROM EmployeeWHERE Department = 'IT'GROUP BY Sex,

5、RegionORDER BY Sex, Region;通過holodesk的cube和index手段對這種過濾率和聚合率高的業(yè)務進行優(yōu)化,以下建表正確的是()A. CREATE TABLE Employee TBLPROPERTIES ( 'cache' = 'RAM', 'holodesk.index' = 'Department', 'holodesk.dimension' = 'Sex, Region' )B. CREATE TABLE EmployeeTBLPROPERTIES ('

6、cache' = 'RAM', 'holodesk.index' = 'Sex, Region' 'holodesk.dimension' = 'Department' )C. CREATE TABLE EmployeeTBLPROPERTIES ( 'cache' = "Department", 'holodesk.index' = 'Department', 'holodesk.dimension' = 'Sex

7、, Region' )D. CREATE TABLE EmployeeTBLPROPERTIES ('cache' = 'RAM','holodesk.index' = 'Department', 'holodesk.dimension' = 'Sex' )11、關于Hyperbase全局索引的描述,哪些是正確的?()A.核心是倒排表B.全局索引概念是對應Rowkey這個 '級”索引C.全局索引使用平衡二叉樹D.全局索引使用B+樹檢索數(shù)據(jù)12、以下為Hyperbase分布式存儲的最小

8、單元的是()A、Region serverB、RegionC、StoreFileD、Store13、以下有關Hyperbase說法正確的是()A、數(shù)據(jù)類型豐富,支持 String、Int、Char等類型B、Key/value 系統(tǒng),key 由 Row,Column Family,Column Qualfier 組成C、Hyperbase表中rowkey有序,按字典序降序排列D、以上說法都不正確14、以下關于StreamSQL的概念描述正確的是()A. Stream是數(shù)據(jù)流B. Streamjob是對一個或多個 stream進行計算并將結果寫進一個流的任務 C. Application是一個或多

9、個 streamjob的集合D.以上說法都不正確15、某交通部門通過使用流監(jiān)控全市過往24小時各個卡口數(shù)據(jù),要求每分鐘更新一次,原始流為org_stream ,以下實現(xiàn)正確的是()A. CREATE STREAMWINDOW traffic_stream AS SELECT * FROM original_stream STREAM w1 AS (length '1' minute slide '24' hour);B. CREATE STREAMtraffic_streamASSELECT *FROMoriginal_streamSTREAMWINDOW w1

10、 AS (length '1' minute slide '24' hour);C. CREATE STREAMtraffic_streamASSELECT *FROMoriginal_streamSTREAMWINDOW w1 AS (length '24' hour slide '1' minute);D. CREATE STREAM traffic_stream AS SELECT * FROM original_stream AS (length '24' second slide '1'

11、minute);16、以下不是Zookeeper的功能是()A,配置管理B.集群管理C.分布式鎖D.存儲大量數(shù)據(jù)17、以下服務需要與 zookeeper進行通信的是()A. HMasterB. Active NameNodeC. InceptorSQLD. Active ResourceManager18、下列是關于flume和sqoop對比的描述,不正確的是()A . flume主要用來采集日志而sqoop主要用來做數(shù)據(jù)遷移B . flume主要采集流式數(shù)據(jù)而 sqoop主要用來遷移規(guī)范化數(shù)據(jù)C . flume和sqoop都是分布式處理任務D . flume主要用于采集多數(shù)據(jù)源小數(shù)據(jù)而sqo

12、op用來遷移單數(shù)據(jù)源數(shù)據(jù)19、有關使用sqoop抽取數(shù)據(jù)的原理的描述不正確的是()A . sqoop在抽取數(shù)據(jù)的時候可以指定map的個數(shù),map的個數(shù)決定在hdfs生成的數(shù)據(jù)文件的個數(shù)B . sqoop抽取數(shù)據(jù)是個多節(jié)點并行抽取的過程,因此 map的個數(shù)設置的越多性能 越好C . sqoop任務的切分是根據(jù) split字段的(最大值-最小彳K) /map數(shù)D . sqoop抽取數(shù)據(jù)的時候需要保證執(zhí)行當前用戶有權限執(zhí)行相應的操作20、sqoop抽取數(shù)據(jù)時需要做一些數(shù)據(jù)轉換的工作,下面說法不正確的是()A . -fields -terminated -by '01用來設置在hdfs生成的文

13、件的分割符B . -hive-drop-import -delims用來設置在hdfs生成的文件的存儲形式為列存儲C . -null-string 'N'用來把所有的 String類型的空值 轉換成hive的NULL值D . -null-non-string 'N' 用來把非 String類型的空值 轉換成 hive的NULL值21、下列有關flume的描述不正確的是()A . flume是Apache的一個子項目B . flume主要是一個日志采集,傳輸系統(tǒng)C . flume和sqoop功能相似,因此可以相互替代D . flume可以同時采集集群內部和集群外部

14、的日志數(shù)據(jù)22、下列sink中哪些是flume不支持的sink ()A . HDFS sinkB . kafka sinkC . memory sinkD . file roll sink23、以下對 ElasticSearch描述不正確的是()A.日asticSearch是分布式全文搜索引擎E. ElasticSearch集群中分 master 和 data 節(jié)點F. ElasticSearch數(shù)據(jù)存儲在 HDFS上G. ElasticSearch數(shù)據(jù)可以按 Shard分布在不同的節(jié)點上24、下列不屬于kafka應用場景的是()A.常規(guī)的消息收集B.網(wǎng)站活動性跟蹤C.日志收集D.關系型數(shù)據(jù)庫

15、和大數(shù)據(jù)平臺之間的數(shù)據(jù)遷移25、TDH提供哪幾種認證模式?()A.所有服務使用簡單認證模式一一所有服務都無需認證即可互相訪問B.所有服務都啟用 Kerberos認證,用戶要提供 Kerberos principal 和密碼(或者 keytab )來訪問各個服務C.所有服務都啟用 Kerberos同時Inceptor 啟用LDAPU證D.所有服務都啟用LDAPU證26、以下對各組件的運維頁面描述不正確的是()A.通過Name Node的50070頁面對 HDFS進行監(jiān)控B.通過Resource Manager的8180對YARN上運行的任務進行監(jiān)控C.通過HMaster的60010對HBase進

16、行監(jiān)控D.通過Hue Server的8888頁面登入 Hue27、Inceptor server服務無法啟動時,該如何查看日志是()A. 查看 TDH manager所在節(jié)點 /var/log/inceptorsql*/ 目錄下的 hive-server2.log 日志B. 查看 Inceptor server 所在節(jié)點 /var/log/inceptorsql*/ 目錄下的 hive-server2.log 日志C.查看 Resource Manager 所在節(jié)點 /var/log/Yarn*/ 目錄下的 yarn-yarn-resourcemanager-poc-node1.log 日志D

17、.查看任意節(jié)點 /var/log/inceptorsql*/ 目錄下的 hive-server2.log 日志28、以下對Hadoop組件的應用場景描述正確的是()A. Hive主要用于構建大數(shù)據(jù)數(shù)倉,主要做批處理、統(tǒng)計分析型業(yè)務B. Hbase主要用于檢索查詢的 OLTP業(yè)務C. ElasticSearch主要用于全文檢索的關鍵字查詢業(yè)務D. Spark Streaming主要用于實時數(shù)據(jù)的業(yè)務場景29、以下不屬于管理角色的是()A . Name NodeB . HMasterC . Resource ManagerD . Node Manager30、下面哪些工作不屬于集群預安裝工作()A.為集群中每個節(jié)點的安裝操作系統(tǒng)B .選一個節(jié)點作為管理節(jié)點,修改其 /etc/hosts文件C .安裝Transwarp Manager管理界面D.配置集

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論