大數(shù)據(jù)平臺技術知到智慧樹章節(jié)測試課后答案2024年秋山東交通學院_第1頁
大數(shù)據(jù)平臺技術知到智慧樹章節(jié)測試課后答案2024年秋山東交通學院_第2頁
大數(shù)據(jù)平臺技術知到智慧樹章節(jié)測試課后答案2024年秋山東交通學院_第3頁
大數(shù)據(jù)平臺技術知到智慧樹章節(jié)測試課后答案2024年秋山東交通學院_第4頁
大數(shù)據(jù)平臺技術知到智慧樹章節(jié)測試課后答案2024年秋山東交通學院_第5頁
免費預覽已結束,剩余7頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

大數(shù)據(jù)平臺技術知到智慧樹章節(jié)測試課后答案2024年秋山東交通學院第一章單元測試

數(shù)據(jù),就是所有能輸入到計算機,并被計算機程序處理的符號的總稱為()。

A:錯B:對

答案:對大數(shù)據(jù)的4V特征包括()。

A:價值巨大但價值密度低

B:規(guī)模龐大

C:變化頻繁

D:種類繁多

答案:價值巨大但價值密度低

;規(guī)模龐大

;變化頻繁

;種類繁多

2TB數(shù)據(jù)等于多少GB()。

A:2000

B:1024

C:2048

D:1000

答案:2048

大數(shù)據(jù)包含下面類型()。

A:半結構化數(shù)據(jù)

B:純文本數(shù)據(jù)

C:非結構化數(shù)據(jù)

D:結構化數(shù)據(jù)

答案:半結構化數(shù)據(jù)

;純文本數(shù)據(jù)

;非結構化數(shù)據(jù)

;結構化數(shù)據(jù)

大數(shù)據(jù)的生命周期一般會經(jīng)歷這么幾個階段()。

A:存儲與管理

B:可視化

C:分析與挖掘

D:采集與預處理

答案:存儲與管理

;可視化

;分析與挖掘

;采集與預處理

大數(shù)據(jù)平臺的基本架構,從技術架構的角度,可劃分為這幾個層次()。

A:數(shù)據(jù)處理層

B:數(shù)據(jù)采集層

C:數(shù)據(jù)存儲層

D:服務封裝層

答案:數(shù)據(jù)處理層

;數(shù)據(jù)采集層

;數(shù)據(jù)存儲層

;服務封裝層

linux系統(tǒng)中cd命令的作用是()。

A:將源文件復制至目標文件

B:刪除一個目錄中的一個或多個文件

C:移動文件或修改文件名

D:進入指定目錄

答案:進入指定目錄

vi編輯器的操作模式共分為()。

A:底線命令模式

B:編輯模式

C:命令模式

D:輸入模式

答案:底線命令模式

;編輯模式

;命令模式

第二章單元測試

Flume的Agent包含這些組成部分()。

A:Sink

B:Channel

C:Event

D:Source

答案:Sink

;Channel

;Source

Event由這兩部分組成()。

A:Array

B:K-V

C:Body

D:Head

答案:Body

;Head

Source是Flume中事件的源頭,負責接收數(shù)據(jù)到FlumeAgent,可以處理多種類型、多種格式的數(shù)據(jù)()

A:對B:錯

答案:對Channel是位于Source和Sink之間的緩沖區(qū),對Source和Sink進行一對一處理()

A:錯B:對

答案:錯在Flume的配置文件中,對某個目錄下文件進行監(jiān)控的命令是()。

A:flume-ng

B:tail-f

C:/bin/bash-c

D:exec

答案:tail-f

第三章單元測試

以下說法有誤的是()。

A:分布式存儲系統(tǒng)可以實現(xiàn)數(shù)據(jù)容災

B:傳統(tǒng)單機存儲方式擴容成本較低

C:分布式存儲系統(tǒng)需要考慮數(shù)據(jù)的分塊問題

D:“元數(shù)據(jù)”中不包含真正的文件數(shù)據(jù)

答案:傳統(tǒng)單機存儲方式擴容成本較低

Hadoop2.x中HDFS默認的block的大小為()。

A:256MB

B:32MB

C:64MB

D:128MB

答案:128MB

關于SecondaryNameNode哪項是正確的()。

A:SecondaryNameNode應與NameNode部署到一個節(jié)點

B:它對內存沒有要求

C:它的目的是幫助NameNode合并編輯日志,減少NameNode啟動時間

D:它是NameNode的熱備

答案:它的目的是幫助NameNode合并編輯日志,減少NameNode啟動時間

以下哪一項用于配置HDFS的block大?。ǎ?/p>

A:.dir

B:fs.defaultFS

C:dfs.blocksize

D:dfs.replication

答案:dfs.blocksize

HDFS中的NameNode節(jié)點用于存放元數(shù)據(jù),元數(shù)據(jù)內容包含()。

A:數(shù)據(jù)塊與數(shù)據(jù)節(jié)點的映射表

B:客戶端硬件配置數(shù)據(jù)

C:文件與數(shù)據(jù)塊的映射表

D:每個數(shù)據(jù)塊的內容

答案:數(shù)據(jù)塊與數(shù)據(jù)節(jié)點的映射表

;文件與數(shù)據(jù)塊的映射表

如果NameNode意外終止,SecondaryNameNode會接替它使集群繼續(xù)工作。()

A:對B:錯

答案:錯NameNode負責管理元數(shù)據(jù),客戶端每次讀寫請求,它都會從磁盤中讀取或者寫入元數(shù)據(jù)信息并反饋客戶端。()

A:錯B:對

答案:錯因為HDFS有多個數(shù)據(jù)副本,所以NameNode是不存在單點故障問題的。()

A:對B:錯

答案:錯讀取HDFS文件可以使用命令hdfsdfs-get。()

A:對B:錯

答案:對

第四章單元測試

以下說法有誤的是()。

A:MapReduce編程模型的核心思想是分而治之

B:Hadoop的MapReduce框架不能容忍任務出錯

C:MapReduce編程模型可以分為Map和Reduce兩個階段

D:分布式計算框架的實現(xiàn)需要考慮網(wǎng)絡通信

答案:Hadoop的MapReduce框架不能容忍任務出錯

下面說法錯誤的是()。

A:MapReduce可以逐行處理文本數(shù)據(jù)

B:一個集群中某個確定的任務可以存在多個MapTask進程

C:MapTask負責匯總整個任務的執(zhí)行結果

D:MapReduce任務可以不跑在Hadoop集群中

答案:MapTask負責匯總整個任務的執(zhí)行結果

下面哪項是錯誤的()。

A:MapReduce的輸出目錄如果已經(jīng)存在了,任務的輸出結果將會覆蓋該路徑下的原有內容

B:Python提交MapReduce作業(yè)時,可以使用-o參數(shù)指定輸出路徑

C:Python提交MapReduce作業(yè)時,可以使用-rhadoop指定集群模式運行

D:MapReduce作業(yè)的運行內存并非越大越好

答案:MapReduce的輸出目錄如果已經(jīng)存在了,任務的輸出結果將會覆蓋該路徑下的原有內容

MapReduce中Map階段的輸出將作為下面哪個階段的輸入()。

A:Shuffle

B:Reduce

C:Split

D:Join

答案:Reduce

下列關于MapReduce說法正確的是()。

A:MapReduce是一種計算框架

B:MapReduce程序只能用java語言編寫

C:MapReduce隱藏了并行計算的細節(jié),方便使用

D:MapReduce來源于google的學術論文

答案:MapReduce是一種計算框架

;MapReduce隱藏了并行計算的細節(jié),方便使用

;MapReduce來源于google的學術論文

第五章單元測試

以下說法有誤的是()。

A:Kafka支持離線數(shù)據(jù)處理

B:實時數(shù)據(jù)傳輸問題在高并發(fā)場景下尤為明顯

C:Kafka由Scala語言編寫

D:Kafka無法持久化數(shù)據(jù)

答案:Kafka無法持久化數(shù)據(jù)

以下對Kafka名詞解釋錯誤的是()。

A:Offset是數(shù)據(jù)在分區(qū)中的唯一位置

B:Consumer指消息的消費者

C:Partition指Kafka的數(shù)據(jù)副本

D:Broker指Kafka服務器

答案:Partition指Kafka的數(shù)據(jù)副本

對市面上的消息隊列產(chǎn)品描述正確的是()。

A:ActiveMQ不支持集群模式

B:Kafka支持事務

C:RabbitMQ支持動態(tài)擴展

D:Kafka支持動態(tài)擴展

答案:Kafka支持動態(tài)擴展

以下描述正確的是()。

A:utf-8編碼方式不支持中文

B:Kafka的默認客戶端端口號是50070

C:Python語言可以通過kafka-python模塊使用Kafka客戶端

D:數(shù)據(jù)發(fā)送到Kafka需要經(jīng)歷序列化

答案:Python語言可以通過kafka-python模塊使用Kafka客戶端

;數(shù)據(jù)發(fā)送到Kafka需要經(jīng)歷序列化

以下對消息模型的說法正確的是()。

A:發(fā)布訂閱模型消息可以重復消費

B:點對點模型中同一消息只有一個消費者可以消費

C:發(fā)布訂閱模型以主題區(qū)分消息類別

D:點對點模型中消息被消費后即刪除

答案:發(fā)布訂閱模型消息可以重復消費

;點對點模型中同一消息只有一個消費者可以消費

;發(fā)布訂閱模型以主題區(qū)分消息類別

;點對點模型中消息被消費后即刪除

第六章單元測試

Spark框架的特色包括()。

A:通用性

B:容易使用

C:運行模式多樣

D:運行速度快

答案:通用性

;容易使用

;運行模式多樣

;運行速度快

Spark支持的集群管理器包括()。

A:SparkCore

B:HadoopYARN

C:Standalone

D:ApacheMesos

答案:HadoopYARN

;Standalone

;ApacheMesos

下面關于Spark驅動程序driverprogram的說法,正確的是()。

A:驅動程序定義了分布式數(shù)據(jù)集以應用在集群中

B:驅動程序包含Spark應用程序中的主函數(shù)

C:驅動程序負責把并行操作發(fā)布到集群上

D:每個Spark應用程序都包含一個驅動程序

答案:驅動程序定義了分布式數(shù)據(jù)集以應用在集群中

;驅動程序包含Spark應用程序中的主函數(shù)

;驅動程序負責把并行操作發(fā)布到集群上

;每個Spark應用程序都包含一個驅動程序

彈性分布式數(shù)據(jù)集RDD的特性包括()。

A:彈性

B:分區(qū)

C:只讀

D:依賴

答案:彈性

;分區(qū)

;只讀

;依賴

在Spark操作中,map(func)的作用是()。

A:返回一個新的數(shù)據(jù)集,這個數(shù)據(jù)集中的元素是通過func函數(shù)篩選后返回為true的元素

B:返回排序后的數(shù)據(jù)集

C:對元素為鍵值對的RDD中Key相同的元素的value進行reduce

D:對RDD中的數(shù)據(jù)按照func進行計算得到新的RDD

答案:對RDD中的數(shù)據(jù)按照func進行計算得到新的RDD

在Spark操作中,collect()的作用是()。

A:通過函數(shù)func聚合數(shù)據(jù)集中的元素

B:返回數(shù)據(jù)集中的元素個數(shù)

C:以數(shù)組的形式返回數(shù)據(jù)集中的所有元素

D:將數(shù)據(jù)集中的每個元素傳遞到函數(shù)func中運行

答案:以數(shù)組的形式返回數(shù)據(jù)集中的所有元素

從概念上而言,流數(shù)據(jù)(或數(shù)據(jù)流)是指()。

A:數(shù)據(jù)分時段批量到達

B:數(shù)據(jù)采用集中式處理

C:數(shù)據(jù)記錄是流數(shù)據(jù)的最小組成單元

D:在時間分布和數(shù)量上無限的一系列動態(tài)數(shù)據(jù)集合體

答案:數(shù)據(jù)記錄是流數(shù)據(jù)的最小組成單元

;在時間分布和數(shù)量上無限的一系列動態(tài)數(shù)據(jù)集合體

SparkStreaming最主要的抽象是離散化數(shù)據(jù)流,表示連續(xù)不斷的數(shù)據(jù)流。()

A:對B:錯

答案:對在SparkStreaming中,作為一個長期運行的task跑在一個Executor上,用于接收DStream的組件是()。

A:Streaming

B:Receiver

C:Analyzer

D:RDD

答案:Receiver

在SparkStreaming中,可以通過streamingContext.awaitTermination()方法來手動結束流計算進程。()

A:對B:錯

答案:錯

第七章單元測試

以下說法有誤的是()。

A:HBase是一種key-value數(shù)據(jù)庫

B:HBase是非關系型數(shù)據(jù)庫

C:HBase不需要考慮讀寫性能

D:HBase對事務的支持較差

答案:HBase不需要考慮讀寫性能

下面說法錯誤的是()。

A:HBase一個RegionServer服務器中可以有多個Region

B:一個HBase集群中只能有一個RegionServer

C:HBase表的一個列族可以包含多個列

D:HBase的一個表中可以有多個列族

答案:一個HBase集群中只能有一個RegionServer

下面哪項關于HBase的常用命令的描述是錯誤的()。

A:HBase一張正在使用的表可以直接使用drop命令刪除

B:HBase要查看表可以使用list_namespace

C:HBase全表掃描使用get命令

D:HBase使用scan命令時可以指定掃描區(qū)間

答案:HBase一張正在使用的表可以直接使用drop命令刪除

;HBase要查看表可以使用list_name

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論