大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案6-2023練習(xí)版_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案6-2023練習(xí)版_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案6-2023練習(xí)版_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案6-2023練習(xí)版_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案6-2023練習(xí)版_第5頁
已閱讀5頁,還剩102頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

試題說明

本套試題共包括1套試卷

答案和解析在每套試卷后

大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案6(500題)

大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案6

1.[單選題]語義網(wǎng)絡(luò)表達(dá)知識時,有向弧AKO鏈、ISA鏈?zhǔn)怯脕肀磉_(dá)節(jié)點知識的OO

A)無悖性

B)可擴充性

C)繼承性

2.[單選題]大數(shù)據(jù)計算服務(wù)(MaXComPUte,原ODPS)提供了大數(shù)據(jù)的存儲和計算服務(wù),非常適合應(yīng)

用于大數(shù)據(jù)分析的領(lǐng)域。以下說法中錯誤的是:()。

A)可以支持實時OLAP分析

B)提供了便捷的分析處理海量數(shù)據(jù)的手段,用戶可以計算細(xì)節(jié),從而達(dá)到分析大數(shù)據(jù)的目的

C)可以實現(xiàn)大型互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)倉庫和Bl分析

3.[單選題]下面關(guān)于MaPRedUCe模型中MaP函數(shù)與RedUCe函數(shù)的描述正確的是()

A)一個MaP函數(shù)就是對一部分原始數(shù)據(jù)進行指定的操作。

B)一個MaP操作就是對每個RedUCe所產(chǎn)生的一部分中間結(jié)果進行合并操作。

C)MaP與MaP之間不是相互獨立的。

D)RedUCee與RedUCe之間不是相互獨立的。

4.[單選題]HDFS的設(shè)計者采用了(—)的概念,實現(xiàn)了一個高度容錯性的系統(tǒng)。

A)機器學(xué)習(xí)

B)數(shù)據(jù)挖掘

C)集群計算

D)塊復(fù)制

5.[單選題]np.reshape。函數(shù)的作用是(—)□

A)修改數(shù)組大小

B)數(shù)組重組

C)數(shù)組轉(zhuǎn)置

D)對軸進行調(diào)整

6.[單選題]以下關(guān)于ElaStiCSearCh緩存機制的理解不正確的是()。

A)緩存主要分為三種,QueryCache,FielddataCache1RequestCacheo.

B)RequestCaChe:Shards級別的緩存,是為了緩存''分片級”的本地結(jié)果集。

OFielddateCaChe:專門針對分詞的字殷在查詢期間的數(shù)據(jù)結(jié)構(gòu)的緩存。

D)QueryCaehe:Shard級別的緩存,是對一個查詢中包含的過濾器執(zhí)行結(jié)果進行緩存。

7.[單選題]隨機森林中的隨機是指(

A)隨便構(gòu)建樹模

B)隨機選擇一個樹模型

C)隨機選擇多個樹模型

D)在構(gòu)建每個樹模型時隨機選擇樣本和特征

8.[單選題]數(shù)據(jù)清洗的方法不包括Oo

A)缺失值處理

B)噪聲數(shù)據(jù)清除

C)一致性檢查

D)重復(fù)數(shù)據(jù)記錄處理

9.[單選題]彩色圖片(3通道圖片)經(jīng)過一層卷積層后,通道數(shù)一般會產(chǎn)生怎么的變化(等于什么值

)?()

A)batchsize

B)需要根據(jù)卷積的設(shè)置進行判斷

Oi

D)依然會是3

10.[單選題IResultScanner把掃描操作轉(zhuǎn)換為類似get的操作,它將每一行數(shù)據(jù)封裝成一個()實

例,并將所有實例放入一個迭代器中

A)Column

B)Row

C)Result

D)Table

IL[單選題]下列選項中,()能保證表中字段值的唯一性。一

A)默認(rèn)約束

B)非空約束

C)唯一約束

D)以上答案都不正確

12.[單選題]由于不同類別的關(guān)鍵詞對排序的貢獻不同,檢索算法一般把查詢關(guān)鍵詞分為幾類,下

列不屬于此關(guān)鍵詞類型的是()。

A)引用詞

B)普通關(guān)鍵詞

C)高頻詞匯

D)擴展關(guān)鍵詞

13.[單選題]SaaS是()的簡稱

A)軟件即服務(wù)

B)平臺即服務(wù)

C)基礎(chǔ)設(shè)施即服務(wù)

D)硬件即服務(wù)

14.[單選題]執(zhí)行以下代碼段defsay(message,times=l):print(message*

times)say('Hello')say('World',5)時,輸出為(.)o

A)HelIoWorldWor1dWor1dWorIdWorld

B)HelIoWorld5

C)HelIoWorld,World,World,World,World

D)HelIoHelloHelloHelloHelloHello

15.[單選題]任一隨機事件出現(xiàn)的概率為()。

A)在T與1之間

B)小于0

C)不小于1

D)在0與1之間

16.[單選題]網(wǎng)站個性化推薦的背后,可以使用哪些類型的數(shù)據(jù)實現(xiàn)?

A)無結(jié)構(gòu)化

B)非結(jié)構(gòu)化

C)結(jié)構(gòu)化

D)半結(jié)構(gòu)化

17.[單選題]HBase架構(gòu)的四大組件中,OHBaSe具體對外提供服務(wù)的進程。

A)Zookeeper

B)Master

C)RegionServer

D)Client

18.[單選題]下列不屬于深度學(xué)習(xí)內(nèi)容的是()

A)深度直信網(wǎng)絡(luò)

B)受限或爾茲曼機

C)卷和、神經(jīng)網(wǎng)絡(luò)

D)貝葉斯學(xué)習(xí)

19.[單選題]下面哪個是一種編程模型,它將大規(guī)模的數(shù)據(jù)處理工作拆分成互相獨立的任務(wù)然后并行

處理()

A)MapReduce

B)HDFS

OPig

D)Hive

20.[單選題]以下哪個不是典型的分類方法:()

A)決策樹

B)樸素貝葉斯

C)K-Means

D)人工神經(jīng)網(wǎng)絡(luò)

21.[單選題]Python類中包含一個特殊的變量(),它表示當(dāng)前對象自身,可以訪問類的成員。

A)self

B)me

C)this

D)與類同名

22.[單選題]交叉驗證的目的是(一)。

A)提高分類準(zhǔn)確率

B)得到更穩(wěn)定的模型

C)驗證結(jié)果的準(zhǔn)確性

D)增大分類的誤差

23.[單選題]卷積神經(jīng)網(wǎng)絡(luò)調(diào)整參數(shù)時信息的傳播方向是()。

A)后向傳播

B)前向傳播

C)雙向傳播

D)跳躍傳播

24.[單選題]下面關(guān)于MySQL安裝目錄描述錯誤的是()。一

A)Iib目錄用于存儲一系列的庫文件

B)include目錄用于存放一些頭文件

Obin目錄用于存放一些課執(zhí)行文件

D)以上答案都不正確

25.[單選題]假設(shè)一個線性回歸模型完美適合訓(xùn)練數(shù)據(jù)(訓(xùn)練誤差為0),則下列說法正確的是

()。

A)測試集誤差一直為0

B)測試集誤差可能為0

C)測試集誤差不會為0

D)以上都不對

26.[單選題]可用作數(shù)據(jù)挖掘分析中的關(guān)聯(lián)規(guī)則算法有()。

A)機器學(xué)習(xí)、對數(shù)回歸、關(guān)聯(lián)模式

B)K均值法、SOM機器學(xué)習(xí)

C)APriOri算法、FP-Tree算法

D)RBF機器學(xué)習(xí)、K均值法、機器學(xué)習(xí)

27.[單選題]某二叉樹共有12個結(jié)點,其中葉子結(jié)點只有1個。則該二叉樹的深度為(根結(jié)點在第1層

)。

Λ)8

B)12

06

D)3

28.[單選題]HBase依賴O提供消息通信機制

A)Zookeeper

B)Chubby

C)RPC

D)Socket

29.[單選題]HDFS中的塊比磁盤中的塊大,其目的是為了(—)o

A)增加存儲空間

B)便于存儲較大的文件

C)提高存儲空間的利用率

D)最小化尋址開銷

30.[單選題]HDFS是基于流數(shù)據(jù)模式訪問和處理超大文件的需求而開發(fā)的,具有高容錯、高可靠性、

高可擴展性、高吞吐率等特征,適合的讀寫任務(wù)是()。

A)一次寫入,少次讀

B)多次寫入,少次讀

C)多次寫入,多次讀

D)一次寫入,多次讀

31.[單選題]為了統(tǒng)一數(shù)據(jù)各個數(shù)值屬性上量綱,可以進行的操作為()

A)preprocessing,minmaxscale()

B)pd.merge()

C)pd.read_csv

D)np.dtype()

32.[單選題]Kafka集群中,Kafka服務(wù)端的角色是?

A)Broker

B)Consumer

C)ZooKeeper

D)Producer

33.[單選題]關(guān)于ADS的數(shù)據(jù)類型,說法不正確的是:()。

A)布爾類型boolean取值只能為0或1

B)ADS所有的數(shù)據(jù)類型都不支持UnSigned

C)數(shù)值類型float可以指定精度,例如:float(5,3),但是double類型不支持指定精度

D)雙精度浮點數(shù)double類型的存儲字節(jié)數(shù)為4,大整數(shù)類型bigint存儲字節(jié)數(shù)為8

34.[單選題]為了降低MaPRedUCe兩個階段之間的數(shù)據(jù)傳遞量,一般采用(—)函數(shù)對map階段的輸出

進行處理。

A)sort()

B)combiner()

C)join()

D)gather()

35.[單選題]OTS的單個表可以包括:()個屬性列。

A)OT28個

B)OTo24個

C)無限制

D)O-256個

36.[單選題]按照KB、MB、GB、TB、PB的有小到大順序,下列換算錯誤的是

A)lKB=1024Byte

B)1MB=1O24KB

C)1TB=1O24MB

D)1PB=1O24TB

37.[單選題]關(guān)于Python循環(huán)結(jié)構(gòu),以下選項中描述錯誤的是

A)遍歷循環(huán)中的遍歷結(jié)構(gòu)可以是字符串、文件、組合數(shù)據(jù)類型和range。函數(shù)等

B)break用來跳出最內(nèi)層for或者WhiIe循環(huán),脫離該循環(huán)后程序從循環(huán)代碼后繼續(xù)執(zhí)行

C)每個ContinUe語句只有能力跳出當(dāng)前層次的循環(huán)

D)Python通過for、WhiIe等保留字提供遍歷循環(huán)和無限循環(huán)結(jié)構(gòu)

38.[單選題]下列關(guān)于k近鄰算法,正確的是O

A)k近鄰算法對異常數(shù)據(jù)敏感

B)k近鄰算法是一種無監(jiān)督學(xué)習(xí)

C)k近鄰算法需要占用大量內(nèi)存空間

D)k近鄰算法包括訓(xùn)練和預(yù)測過程

39.[單選題]本行()負(fù)責(zé)牽頭開展數(shù)據(jù)治理風(fēng)險管理工作,規(guī)范數(shù)據(jù)風(fēng)險管理

A)風(fēng)險管理部

B)內(nèi)審監(jiān)督部

C)科技部

D)數(shù)據(jù)運管部

40.[單選題]以下()不是大數(shù)據(jù)時代新興的技術(shù)。

A)Hadoop

B)MySQL

C)Spark

D)HBase

41.[單選題]Agg算子的實現(xiàn)策略有:()。

A)4

B)3

02

D)l

42.[單選題]根據(jù)變量取名的規(guī)則,以下變量的命名,合乎規(guī)則的是()

Λ)6S

B)S6

C)while

D)123name

43.[單選題]最早被提出的循環(huán)神經(jīng)網(wǎng)絡(luò)門控算法是什么。()

A)、長短期記憶網(wǎng)絡(luò)

B)、門控循環(huán)單元網(wǎng)絡(luò)

C)、堆疊循環(huán)神經(jīng)網(wǎng)絡(luò)

D)、雙向循環(huán)神經(jīng)網(wǎng)絡(luò)

44.[單選題]Flume數(shù)據(jù)采集的過程中,下列選項中能對數(shù)據(jù)進行過濾和修飾的是?

A)Sink

B)Channel

C)Channelselector

D)Interceptor

45.[單選題]構(gòu)建一個神經(jīng)網(wǎng)絡(luò),將前一層的輸出和它自身作為輸入,則有反饋連接的是()。

A)循環(huán)神經(jīng)網(wǎng)絡(luò)

B)卷積神經(jīng)網(wǎng)絡(luò)

C)限制玻爾茲曼機

D)都不是

46.[單選題]執(zhí)行以下代碼段age=12ifage<4print("Youradmissioncostis$0.")elifage

<18print("Youradmissioncostis$5.")elseprint("Youradmissioncostis$10.")?,輸

出為(一)o

A)Youradmissioncostis$0.

B)Youradmissioncostis$5.

C)Youradmissioncostis$10.

D)以上都不對

47.[單選題]僅個體變元被量化的謂詞稱為()

A)一階謂詞

B)原子公式

C)二階謂詞

D)全稱量詞

48.[單選題]下列說法錯誤的是()

A)GROUPBY子句用來分組WHERE子句的輸出

B)WHERE子句用來篩選FROM子句中指定的操作所產(chǎn)生的行。

C)聚合函數(shù)需要和groupby一起使用

D)HAVING子句用來從FRoM的結(jié)果中篩選行

49.[單選題]當(dāng)訓(xùn)練集特征非常多,而實例非常少的時候,可以采用()。

A)sigmoid核的支持向量機

B)不帶核的支持向量機

C)高斯核的支持向量機

D)多項式核的支持向量機

50.[單選題]下面這條GaUSSDB200的SQL語句"selectname,count(1)fromstudentgroupby

name”可能涉及的算子有哪些?

A)Filter

B)GroupAggregate

C)Streaming

D)HashAggregate

51.[單選題]最小最大正規(guī)化也稱為()

A)非標(biāo)準(zhǔn)化

B)標(biāo)準(zhǔn)化

C)離差標(biāo)準(zhǔn)化

D)以上說法都不對

52.[單選題]關(guān)于FUSionlnSightManager,說法錯誤的是?

A)NTPSeVer/client負(fù)責(zé)集群內(nèi)各節(jié)點的時鐘同步

B)通過FUSiOnlnSightManager,可以對HDFS進行啟??刂?、配置參數(shù)

OFusionInsightManager所有維護操作只能夠通過WebUI來完成,沒有提供SheIl維護命令

D)通過FUSiOnlnSightManager,可以向?qū)桨惭b集群,縮短集群部署時間

53.[單選題]HBase內(nèi)部的.META.表包含所有用戶()的列表。

A)地址

B)時間

C)類別

D)空間區(qū)域

54.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,系統(tǒng)在【客戶信息管理】一級菜單下增加【征

信報告查詢管理】二級菜單,用戶可在此菜單下的【待處理的征信報告】節(jié)點中點擊O按鈕,取

消尚未提交的征信報告查詢申請。

A)新增查詢

B)B.上傳授權(quán)書

OC.取消申請

D)D.提交

55.[單選題]下列關(guān)于數(shù)據(jù)創(chuàng)新的說法正確的是()。

A)多個數(shù)據(jù)集的總和價值等于單個數(shù)據(jù)集價值相加

B)由于數(shù)據(jù)的再利用,數(shù)據(jù)應(yīng)該永久保存下去

C)相同數(shù)據(jù)多次用于相同或類似用途,其有效性會降低

D)數(shù)據(jù)只有開放價值才可以得到真正釋放

56.[單選題]Spark中引人RDD概念的目的是()。

A)數(shù)據(jù)存儲

B)數(shù)據(jù)查重

C)提升容錯能力

D)增強數(shù)據(jù)一致性

57.[單選題]Sqoop是Hadoop和關(guān)系數(shù)據(jù)庫服務(wù)器之間傳送數(shù)據(jù)的工具,下列哪種數(shù)據(jù)庫是不支持

使用Sqoop直接進行數(shù)據(jù)傳送()

A)Postgres

B)Oracle

OMySQL

D)Redis

58.[單選題]在SeIeCt語句的Where子句中,使用正則表達(dá)式過濾數(shù)據(jù)的關(guān)鍵字是()

A)like

B)against

C)match

D)regexp

59.[單選題]特征選擇包括過濾法、包裝法和嵌入法,其中過濾法不包括哪個方法?

A)方差選擇法

B)相關(guān)系數(shù)法

C)遞歸特征消除法

D)互信息法

60.[單選題IElasticsearch采用的搜索方式是()o

A)正排素引

B)倒排素引

C)慢素引

D)快速索引

61.[單選題]下面哪個配置是在mapred-site.Xml中配置的()

A)復(fù)制因子

B)JaVa環(huán)境變量

C)存儲hdfs文件的目錄名

D)運行MaPRedUCe作業(yè)的主機和端口

62.[單選題]以下關(guān)于FusionInsightCTBase的描述不正確的是?

A)CTBase的讀寫數(shù)據(jù)接口,統(tǒng)一封裝了行定義的接口,自動進行冷字段的合并和解析,不需要在應(yīng)用

程序中進行合并和解釋

B)CTBase是基于HBase的聚簇表開發(fā)框架

OCTBase提供了一套WebUI進行元數(shù)據(jù)定義,提供了只管醫(yī)用的表設(shè)計工具,降低表設(shè)計的難度

D)CTBase的javaAPI提供一套HBase連接池管理的接口,內(nèi)部進行連接共享,減少客戶端應(yīng)用開發(fā)

難度。

63.[單選題]下列做法中,對個人信息安全威脅最大的是()。

A)課堂手工簽到

B)手機惡意APP

C)釘釘共享編輯

D)共享加密文件

64.[單選題]在MaPRedUCe中,()階段,RedUCer執(zhí)行reducetask,將最后結(jié)果寫入HDFSo

A)Shuffle

B)Map

C)Reduce

D)Sort

65.[單選題]FusionInsight產(chǎn)品中,關(guān)于Kafka說法不正確的是?

A)Kafka強依賴于ZooKeeper

B)Kafka的服務(wù)端可以產(chǎn)生消息

OKafka部署的實例個數(shù)不得小于2

D)Consumer作為kafka的客戶端角色專門進行消息的消費。

66.[單選題]大數(shù)據(jù)方法的不準(zhǔn)確性,根本原因是()。

A)數(shù)據(jù)量大

B)算法變化

C)信息遺漏

D)以上都正確

67.[單選題]下面不屬于比較檢驗的方法是(_)。

A)假設(shè)檢驗

B)交叉驗證t檢驗

C)MCNemar檢驗

D)留出法

68.[單選題]HBase使用一個master節(jié)點協(xié)調(diào)管理一個或多個()從屬機。

A)namenode

B)datanode

C)regionserver

D)master

69.[單選題]對分類任務(wù)來說,學(xué)習(xí)器從類別標(biāo)記集合中預(yù)測出一個標(biāo)記,最常見的結(jié)合策略是(

)O

A)投票法

B)平均法

C)學(xué)習(xí)法

D)排序法

70.[單選題]在IBM提出的企業(yè)管理范疇中,企業(yè)數(shù)據(jù)不包含(_)。

A)元數(shù)據(jù)

B)主數(shù)據(jù)

C)關(guān)系數(shù)據(jù)

D)業(yè)務(wù)數(shù)據(jù)

71.[單選題]在運行時,由MaXCOmPUte依據(jù)上下文使用環(huán)境及類型轉(zhuǎn)換規(guī)則自動進行的類型轉(zhuǎn)換是

:()O

A)顯示轉(zhuǎn)換

B)影式專換

C)CaSt轉(zhuǎn)換

D)SQL轉(zhuǎn)換

72.[單選題]()能反映出X和Y之間的強相關(guān)性。

A)相關(guān)系數(shù)為0.9

B)對于無效假設(shè),B=O的P值為0.0001

C)對于無效假設(shè),β=0的t值為30

D)以上說法都不對

73.[單選題]Hadoop配置文件中,hadooP-Site.xml顯示覆蓋hadoop-default.XmI里的內(nèi)容。在版本

O20中,hadoop-site.Xml被分離成三個XML文件,不包括()

A)conf-site,xml

B)mapred-site.xml

C)core-site,xml

D)hdfs-site.xml

74.[單選題]下面哪個指標(biāo)不是聚類算法的質(zhì)量特征?O

A)對噪聲數(shù)據(jù)的敏感性。

B)處理多種類型的數(shù)據(jù)。

C)聚類的類別多少

D)可伸縮性

75.[單選題]關(guān)于數(shù)據(jù)、算法、算力的描述以下正確的是:

A)數(shù)據(jù)沒有什么意義

B)算法是最難處理的問題

C)算力問題已經(jīng)不存在瓶頸了

D)數(shù)據(jù)、算法、算力相互依賴、相互支撐

76.[單選題]物聯(lián)網(wǎng)的發(fā)展最終導(dǎo)致了人類社會數(shù)據(jù)量的第三次躍升,使數(shù)據(jù)產(chǎn)生方式進入了:

O

A)手工創(chuàng)建階段

B)運營式系統(tǒng)階段

C)用戶原創(chuàng)內(nèi)容階段

D)感知式系統(tǒng)階段

77.[單選題]下列圖像邊緣檢測算子中抗噪性能最好的是

A)梯度算子

B)Prewitt算子

C)RobertS算子

D)LaPlaCian算子

78.[單選題]RDD有TranSfOrmatiOn和Aetion算子,下列屬于ACtiOn算子的是:()。

?)map

B)SaveAsTextFile

C)Filter

D)reduceByKey

79.[單選題]以下哪種工作是FIUme無法處理的?

A)多個FIUme級聯(lián)合并

B)按照用戶定制采集數(shù)據(jù)

C)直接寫到Fink特定task中

D)從固定目錄下采日信息到目的地

80.[單選題]下列關(guān)于雷達(dá)圖的說法中,正確的是()

A)雷達(dá)圖也稱為網(wǎng)絡(luò)圖,蜘蛛圖,星圖,蜘蛛網(wǎng)圖等

B)雷達(dá)圖不適合展現(xiàn)某個數(shù)據(jù)集的多個關(guān)鍵特征

C)雷達(dá)圖中不同坐標(biāo)的點之間無法連接

D)雷達(dá)圖不常用于多項指標(biāo)的全面分析

81.[單選題]不屬于神經(jīng)網(wǎng)絡(luò)常用學(xué)習(xí)算法的是:

A)有監(jiān)督學(xué)習(xí)

B)增強學(xué)習(xí)

C)觀察與發(fā)現(xiàn)學(xué)習(xí)

D)無監(jiān)督學(xué)習(xí)

82.[單選題]Hive中的解釋器(compiler),優(yōu)化器(optimizer),執(zhí)行器(executor)組件用于

HQL語句從詞法分析,語法分析,編譯,優(yōu)化以及查詢計劃的生成,生成的查詢計劃存儲在O中

,并在隨后由O調(diào)用執(zhí)行。

A)HDFS,MapReduce

B)HBase,Yarm

C)內(nèi)存,MapReduce

D)HDFS,Yarn

83.[單選題]SQL語言中,實現(xiàn)數(shù)據(jù)檢索的語句是

A)SELECT

B)INSERT

C)UPDATE

D)DELETE

84.[單選題]采用模板[T1]主要檢測()方向的邊緣。

A)水平

B)45o

C)垂直

D)135o

85.[單選題]以下哪個不是大數(shù)據(jù)的“4V”特性:()

A)數(shù)據(jù)量

B)數(shù)據(jù)種類繁多

C)處理速度快

D)價值密度高

86.[單選題]在ZookeePer維護的樹形結(jié)構(gòu)中,樹中的節(jié)點被稱為(__)。

A)node

B)block

Ocell

D)znode

87.[單選題]以下關(guān)于函數(shù)的作用描述正確的是(一)o

A)函數(shù)是可重用的程序

B)函數(shù)無法為您的應(yīng)用程序提供更好的模塊化

C)您無法創(chuàng)建自己的函數(shù)

D)以上都是

88.[單選題]在HiVe的條件語句中,“and”連接兩個表達(dá)式,如果其中一個表達(dá)式結(jié)果為true,另一

個表達(dá)式結(jié)果為false,則計算結(jié)果為()

A)TRUE

B)FALSE

C)null

D)以上都不正確

89.[單選題]以下哪一選項不屬于MRS日常運維不影響業(yè)務(wù)這一特性?

A)滾動升級/補丁

B)修改配置滾動重啟

C)單集群跨AZ高可用

D)擴縮容業(yè)務(wù)無感知

90.[單選題]默認(rèn)情況下,HDFS的垃圾回收機制是沒有開啟的,我們可以在O配置文件中開啟

HDFS的垃圾回收機制。

A)core-site,xml

B)hdfs-site.xml

C)yarn-site,xml

D)hadoop-site.xml

9L[單選題]回歸方程判定系數(shù)的計算公式R2=SSR∕SST=I-SSE/SST,對判定系數(shù)描述錯誤的是()。

A)式中的SSE指殘差平方和

B)式中的SSR指總離差平方和

C)判定系數(shù)用來衡量回歸方程的擾合優(yōu)度

D)判定系數(shù)R2等于相關(guān)系數(shù)的平方

92.[單選題]關(guān)于eval函數(shù),以下選項中描述錯誤的是

A)eval函數(shù)的作用是將輸入的字符串轉(zhuǎn)為Python語句,并執(zhí)行該語句

B)如果用戶希望輸入一個數(shù)字,并用程序?qū)@個數(shù)字進行計算,可以采用eval(input())組合

C)執(zhí)行eval("Hello")和執(zhí)行eval("'Hello'")得到相同的結(jié)果

D)eval函數(shù)的定義為:eval(source,globals=None,Iocals=None,/)

93.[單選題]將灰度圖像轉(zhuǎn)換成二值圖像的命令為()。

A)ind2gray

B)ind2rgb

C)im2bw

D)ind2bw

94.[單選題]下列關(guān)于ZooKeeper特點的描述錯誤的是()。

A)復(fù)雜性

B)自我復(fù)制

C)順序訪問

D)高速讀取

95.[單選題]()用于將非線性引人神經(jīng)網(wǎng)絡(luò),它會將值縮小到較小的范圍內(nèi)

A)損失函數(shù)

B)優(yōu)化函數(shù)

C)激活函數(shù)

D)目標(biāo)函數(shù)

96.[單選題]產(chǎn)生式系統(tǒng)的推理不包括()

A)正向推理

B)逆向推理

C)雙向推理

D)簡單推理

97.[單選題]以下關(guān)于程序控制結(jié)構(gòu)描述錯誤的是:

A)單分支結(jié)構(gòu)是用if保留字判斷滿足一個條件,就執(zhí)行相應(yīng)的處理代碼

B)二分支結(jié)構(gòu)是用if-else根據(jù)條件的真假,執(zhí)行兩種處理代碼

C)多分支結(jié)構(gòu)是用if-elif-else處理多種可能的情況

D)在Python的程序流程圖中可以用處理框表示計算的輸出結(jié)果

98.[單選題]以下說法正確的是()

A)關(guān)聯(lián)規(guī)則挖掘過程是發(fā)現(xiàn)滿足最小支持度的所有項集代表的規(guī)則

B)尋找模式和規(guī)則主要是對數(shù)據(jù)進行干擾,使其符合某種規(guī)則以及模式

C)數(shù)據(jù)挖掘的主要任務(wù)是從數(shù)據(jù)中發(fā)現(xiàn)潛在的規(guī)律,從而能更好地完成描述數(shù)據(jù)、預(yù)測數(shù)據(jù)等任務(wù)

D)在聚類分析當(dāng)中,簇內(nèi)的相似性越大,裝間的差別越大,聚類的效果就越差

99.[單選題]以下()是對DMM(數(shù)據(jù)管理成熟度模型)中"已管理級"基本特點的正確表述。

A)組織機構(gòu)的數(shù)據(jù)管理關(guān)鍵活動能夠根據(jù)結(jié)構(gòu)自身的反饋以及外部環(huán)境的變革進行不斷優(yōu)化

B)組織機構(gòu)已用定量化的方式管理其關(guān)鍵過程的執(zhí)行過程

C)組織機構(gòu)只有在項目管理過程中執(zhí)行了D.M給出的關(guān)鍵過程,而缺乏機構(gòu)層次的統(tǒng)籌與管理

D)組織機構(gòu)的數(shù)據(jù)管理工作超出了項目管理的范疇,由組織機構(gòu)統(tǒng)一管理其數(shù)據(jù)管理關(guān)鍵過程

100.[單選題]HBase依靠()提供強大的計算能力。

A)ZooKeeper

B)Chubby

C)RPC

D)MapReduc

IOL[單選題]以下描述正確的是(—)。

A)非結(jié)構(gòu)化數(shù)據(jù)是先有結(jié)構(gòu),后有數(shù)據(jù)

B)XML是非結(jié)構(gòu)化數(shù)據(jù)

C)結(jié)構(gòu)化數(shù)據(jù)是先有數(shù)據(jù),后有結(jié)構(gòu)

D)非結(jié)構(gòu)化數(shù)據(jù)是數(shù)據(jù)科學(xué)與傳統(tǒng)數(shù)據(jù)管理的主要區(qū)別

102.[單選題]深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)屬于機器學(xué)習(xí)中的那哪種模型

A)深度監(jiān)督學(xué)習(xí)

B)深度無監(jiān)督學(xué)習(xí)

C)深度半監(jiān)督學(xué)習(xí)

D)深度強化學(xué)習(xí)

103.[單選題]對銀行業(yè)而言,做好大數(shù)據(jù)分析應(yīng)用的前提是O

A)增加統(tǒng)計種類

B)增加營業(yè)網(wǎng)點

C)增加數(shù)據(jù)來源

D)開展專項活動

104.[單選題]執(zhí)行以下代碼段defsan(x):print(x+1)x=-IOx=IOSan(O)時,輸出為(—)o

A)l

B)-10

OlO

D)ll

105.[單選題]Hive的啟動依賴于()的啟動,因此必須先啟動它

A)Java

B)數(shù)據(jù)庫

C)Hadoop

D)tomcat

106.[單選題]以下哪個不屬于hadoop的核心構(gòu)成

A)HDFS

B)MapReduce

C)Spark

D)YARN

107.[單選題]Python中對變量描述錯誤的選項是:

A)Python不需要顯式聲明變量類型,在第一次變量賦值時由值決定變量的類型

B)變量通過變量名訪問

C)變量必須在創(chuàng)建和賦值后使用

D)變量PI與變量Pi被看作相同的變量

108.[單選題]下面哪一項不屬于計算機集群中的節(jié)點?

A)主節(jié)點(MaSterNode)

B)源節(jié)點(SourceNode)

C)名稱結(jié)點(NameNode)

D)從節(jié)點(SlaveNode)

109.[單選題]以下選項中,不屬于大數(shù)據(jù)對人才能力的要求是O

A)業(yè)務(wù)能力

B)數(shù)學(xué)統(tǒng)計能力

C)IT技術(shù)能力

D)邏輯思維能力

110.[單選題]在MaPRedUCe中,哪個組件是用戶不指定也不會有默認(rèn)的0

A)Combiner

B)OutputFormat

C)Partitioner

D)InputFormat

111.[單選題](_)是一門以可視化交互為基礎(chǔ),綜合運用圖形學(xué)、數(shù)據(jù)挖掘和人機交互等多個領(lǐng)域

的知識,以實現(xiàn)人機協(xié)同完成可視化任務(wù)為主要目的的分析推理性學(xué)科。

A)信息可視化

B)科學(xué)可視化

C)可視分析學(xué)

D)數(shù)據(jù)可視化

112.[單選題]下列哪項通常是集群的最主要瓶頸:

A)CPU

B)網(wǎng)絡(luò)

C)磁盤IO

D)內(nèi)存

113.[單選題]通常,()主要指的是關(guān)系數(shù)據(jù)庫中存儲、計算和管理的數(shù)據(jù)。

A)結(jié)構(gòu)化數(shù)據(jù)

B)海量數(shù)據(jù)

C)半結(jié)構(gòu)化數(shù)據(jù)

D)非結(jié)構(gòu)化數(shù)據(jù)

114.[單選題]下列表述正確的是()。

A)if語句總是與else成對出現(xiàn)

B)if語句總是與elif成對出現(xiàn)

C)if語句分支嵌套實現(xiàn)多分支

D)if語句只能實現(xiàn)二分支

115.[單選題]下面哪個選項不是我們需要HadooP的主要原因O

A)我們需要處理PB級別的數(shù)據(jù)

B)為每個應(yīng)用建立一個可靠的系統(tǒng)是很昂貴的

C)幾乎每天都有結(jié)點壞掉

D)把一個任務(wù)分割成多個子任務(wù)的方式是不好的

116.[單選題]有人發(fā)現(xiàn)統(tǒng)計數(shù)字會撒謊,產(chǎn)生這種現(xiàn)象的原因不包括Oo

A)采集的數(shù)據(jù)不完整

B)存儲的數(shù)據(jù)被篡改

C)數(shù)據(jù)內(nèi)容更新慢

D)可視化技術(shù)效果單一

117.[單選題]在Matplotlib中調(diào)整后可以顯示中文的參數(shù)是()。

A)lines,linestyle

B)lines,linewidth

C)font,sans-serif

D)axes.unicodeminus

118.[單選題]__new_和_init—的區(qū)別,說法不正確的是()。

A)__new_是一個實例方法,而init.是一個靜態(tài)方法

B)__new_方法會返回一個創(chuàng)建的實例,而什么都不返回

C)只有在—new—返回一個CIS的實例時,后面的_init_才能被調(diào)用

D)當(dāng)創(chuàng)建一個新實例時調(diào)用_new—,初始化一個實例時用—init_

119.[單選題]輸入圖像為32x32,經(jīng)過步長為1,不進行Padding,卷積核為5x5的卷積層后,得到的

特征圖尺寸是多少?

A)28x28

B)27x27

C)29x29

D)32x32

120.[單選題]Spark可以處理的數(shù)據(jù)任務(wù)包括()。

A)數(shù)據(jù)流處理

B)交互式處理

C)圖數(shù)據(jù)處理

D)以上都是

121.[單選題]不屬于Mayer-SehnbergerV和CukierK.在其著名論著《BigDataiARevolutionThat

WillTransformHowWeLive,Work,andThink》中提出了大數(shù)據(jù)時代統(tǒng)計的思維變革的是()。

A)不是隨機樣本,而是全體數(shù)據(jù)

B)不是精確性,而是混雜性

C)不是描述性分析,而是預(yù)測性分析

D)不是因果關(guān)系,而是相關(guān)關(guān)系

122.[單選題]()負(fù)責(zé)HDFS數(shù)據(jù)存儲。

A)NameNode

B)JobTracker

ODataNode

D)SecondaryNameNode

123.[單選題]HDFS無法高效存儲大量小文件,想讓它能處理好小文件,比較可行的改進策略不包括

A)利用SeqUenCeFiIe、MapFilesHar等方式歸檔小文件

B)多MaSter設(shè)計

C)BlOCk大小適當(dāng)調(diào)小

D)調(diào)大namenode內(nèi)存或?qū)⑽募到y(tǒng)元數(shù)據(jù)存到硬盤里

124.[單選題]在HBaSe系統(tǒng)架構(gòu)中,每一個HRegiOnSerVer中的所有對象會共享一個()實例

A)HLog

B)Master

OClient

D)ZooKeeper

125.[單選題]從MaXComPUte導(dǎo)入到ADS中時,可以從()表中查詢導(dǎo)入狀態(tài)。

A)master.job_status

B)information_schema.job_instances

C)user.job_instances

D)performance_schema.job_status

126.[單選題]如果有變量a=[l,2,3,4,5,6],能夠得到列表[3,4,5]的表達(dá)式為O

A)a[2:5]

B)a[3:5]

C)a[3:-1]

D)a[3,4,5]

127.[單選題]圖靈獎獲得者JimGray提出的"科學(xué)研究第四范式"的全稱為()。

A)數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)

B)以數(shù)據(jù)為中心的科學(xué)發(fā)現(xiàn)

C)數(shù)據(jù)驅(qū)動型的科學(xué)發(fā)現(xiàn)

D)大數(shù)據(jù)科學(xué)研究

128.[單選題]個棧的初始狀態(tài)為空。現(xiàn)將元素1、2、3、4、5、A、B、C、D、E依次入棧,然后再依

次出棧,則元素出棧的順序是

A)12345ABCDE

B)EDCBA54321

C)5432IEDCBA

D)ABCDE12345

129.[單選題]GaussDB200支持實例故障發(fā)生時,業(yè)務(wù)不中斷。因此()。

A)不用擔(dān)心實例故障帶來的影響,無需處理故障問題。

B)在實例恢復(fù)或主備切換成功之后,能夠繼續(xù)提供服務(wù)。

C)不用擔(dān)心CN故障導(dǎo)致SQL執(zhí)行失敗,保證SQLlo0%執(zhí)行成功。

D)實例故障之后GaUSSDB200會自動重啟,無需人為關(guān)注。

130.[單選題]下列選項中,關(guān)于duplicated。方法描述正確的是()。

A)duplicate()方法用于刪除重復(fù)值

B)duplicate。方法用于標(biāo)記重復(fù)值

C)duplicate。方法會改變原始數(shù)據(jù)

D)duplicate()方法會將重復(fù)的數(shù)據(jù)標(biāo)記為FaISe

131.[單選題]下列關(guān)于DNN的說法不正確的是()。

A)層數(shù)多

B)抽象能力強

C)模擬更復(fù)雜模型

D)廣義上包含CNN、DBN,SVM等

132.[單選題]SQL語言中,刪除一個視圖的命令是()

A)REMOVE

B)CLEAR

C)DELETE

D)DROP

133.[單選題]卷積的過程是讓過濾器在圖像上進行()

A)縮放

B)剪切

C)窗口滑動

D)鏡像對稱

134.[單選題]Hadoop的哪個包的功能是根據(jù)DDL(數(shù)據(jù)描述語言)自動生成他們的編解碼函數(shù)。

A)record

B)metrics

C)util

D)tool

135.[單選題]下列算法中,Sklearn中未提及的是O0

A)K-Means聚類算法

B)LogisticRegression

C)KNN最近鄰分類算法

D)APriori關(guān)聯(lián)規(guī)則算法

136.[單選題]以下兩種描述分別對應(yīng):()兩種分類算法的評價標(biāo)準(zhǔn)。

A)Precision,Recall

B)Recall,Precision

C)Precision,Roc

D)Recall,Roc

137.[單選題]某公司營銷總監(jiān)在年度報告中,需要直觀地展示出最近五年公司某產(chǎn)品的銷售額變化趨

勢,以下可視化圖表中,最適合他的是()

A)明細(xì)表

B)熱力點圖

C)線形圖

D)漏斗圖

138.[單選題]Pandas在執(zhí)行算術(shù)運算時,沒有對齊的位置會使用()進行補齊。

A)Null

B)0

ONaN

D)null_values

139.[單選題]np.dsplit()函數(shù)的作用是(_)。

A)沿著它的水平軸分割

B)沿著縱向的軸分割

C)允許指定沿哪個軸分割

D)按深度方向分割

140.[單選題]下列論據(jù)中,能夠支撐“大數(shù)據(jù)無所不能”的觀點的是O-

A)互聯(lián)網(wǎng)金融打破了傳統(tǒng)的觀念和行為

B)大數(shù)據(jù)存在泡沫

C)大數(shù)據(jù)具有非常高的成本

D)個人隱私泄露與信息安全擔(dān)憂

141.[單選題]numPy中實現(xiàn)豎直軸分割數(shù)組的函數(shù)是(—)。

A)np.split

B)np.hsplits

C)np.dsplits

D)np.vsplit

142.[單選題]下述O不是知識的特征。

A)復(fù)雜性與明確性

B)進化與相對性

C)客觀性與依附性

D)可重用性與共享性

143.[單選題]大數(shù)據(jù)要求企業(yè)設(shè)置的崗位是()。

A)首席信息官和首席數(shù)據(jù)官

B)首席信息官和首席工程師

C)首席分析師和首席工程師

D)首席分析師和首席數(shù)據(jù)官

144.[單選題]下面算法屬于局部處理的是()。

A)、灰度線性變換

B)、二值化

C)、傅里葉變換

D)、中值濾波

145.[單選題]下列選項中,哪個方法可以一次性輸出多個統(tǒng)計指標(biāo)()。

A)describe()

B)mean()

C)median()

D)sum()

146.[單選題]用PyinStaIl工具把PythOn源文件打包成一個獨立的可執(zhí)行文件,使用的參數(shù)是:

A)-D

B)-L

C)-i

D)-F

147.[單選題]下列哪些不是HBase的特點()

A)高可靠性

B)高性能

C)面向列

D)緊密性

148.[單選題]運行以下程序,輸出結(jié)果的是:print("IOVe

".join(["Everyday","Yourself","Python",1))

A)EverydayloveYourself

B)EverydaylovePython

C)loveYourselflovePython

D)EverydayloveYourselflovePython

149.[單選題]創(chuàng)建一個HDFS客戶端對象時,COnfigUratiOn實例會自動加載HDFS的配置文件(),從

中獲取HadOoP集群的配置信息。

A)hadoop-default.xml

B)hadoop-env.sh

C)hadoop-site.xml

D)core-site,xml

150.[單選題]使用HBase客戶端批量寫入10條數(shù)據(jù),某個HRegionServer節(jié)點上包含該表的2

個Region,分別為A和B,10條數(shù)據(jù)中有6條屬于

A,4條屬于

B,請問寫入這10條數(shù)據(jù)需要向該HRegionServer發(fā)送幾次RPC請求?

A)10

B)6

02

D)l

151.[單選題]聚類是一種典型的無監(jiān)督學(xué)習(xí)任務(wù),然而在現(xiàn)實聚類任務(wù)中我們往往能獲得一些額外

的監(jiān)督信息,于是可通過()來利用監(jiān)督信息以獲得更好的聚類效果

A)監(jiān)督聚類

B)半監(jiān)督聚類

C)聚類

D)直推聚類

152.[單選題]下列關(guān)于誤差的說法,正確的是()。

A)訓(xùn)練樣本容量增加,泛化誤差也會增加

B)過擬合指數(shù)據(jù)在訓(xùn)練集上的誤差過大

C)過擬合可以通過減少模型參數(shù)數(shù)量解決

D)交叉驗證不重復(fù)使用數(shù)據(jù)

153.[單選題]線性模型中的權(quán)重W值可以看做各個屬性X的()

A)正則化革數(shù)

B)對最終決策結(jié)果的貢獻皮

C)高維映射

D)取值

154.[單選題]視圖是一種常用的數(shù)據(jù)對象,它是提供()和()數(shù)據(jù)的另一種途徑,可以簡化數(shù)據(jù)庫

操作

A)插入,更新

B)查看,檢索

C)查看,存放

D)檢索,插入

155.[單選題]Hadoop2.x版本中的數(shù)據(jù)塊大小默認(rèn)是多少?()

Λ)64M

B)128M

C)256M

D)512M

156.[單選題]命令行客戶端工具的選項中,()用于指定連接的端口號。-

A)-h

B)-u

C)-p

D)-P

157.[單選題]下面哪個不是PythOn合法的變量名

A)int_l

B)40XL

C)self123

D)Name

158.[單選題]習(xí)近平總書記在2016年O月主持召開了網(wǎng)絡(luò)安全和信息化工作座談會

A)4月

B)2月

03月

D)5月

159.[單選題]以下關(guān)于函數(shù)的描述,錯誤的是:

A)函數(shù)是一種功能抽象

B)使用函數(shù)的目的只是為了增加代碼復(fù)用

C)函數(shù)名可以是任何有效的Python標(biāo)識符

D)使用函數(shù)后,代碼的維護難度降低了

160.[單選題]決策樹的父節(jié)點和子節(jié)點的燧的大小關(guān)系是什么?

A)決策樹的父節(jié)點更大

B)子節(jié)點的端更大

C)兩者相等

D)根據(jù)具體情況而定

161.[單選題]按照姓名升序序排列()

A)ORDERBYNAMEASC

B)ORDERBYASCNAME

C)ORDERBYNAMEDESC

D)ORDERBYDESCNAME

162.[單選題]Numpy中創(chuàng)建全為1的矩陣使用什么?

A)np.zeros()

B)np.ones()

C)np.empty()

D)np.arange()

163.[單選題]在MapReduce中,如果要編寫自己的數(shù)據(jù)類型,需要實現(xiàn)哪個接口?()

A)Writable

B)Nul!Writable

C)IntWritable

D)Text

164.[單選題]Hbase的底層以()形式存在。

A)keyvalue

B)列存儲

C)行存儲

D)實時存儲

165.[單選題]在Hadoop配置文件中,以下屬于core-site,xml文件主要內(nèi)容的是()

A)用于定義系統(tǒng)級別的參數(shù),如

B)名稱節(jié)點和數(shù)據(jù)節(jié)點的存放位置、文件副本的個數(shù)文件讀取權(quán)限等。

C)配置

D)包括

166.[單選題]大數(shù)據(jù)平臺技術(shù)架構(gòu)不包含的是()

A)數(shù)據(jù)整合

B)數(shù)據(jù)存儲

C)數(shù)據(jù)計算

D)數(shù)據(jù)溯源

167.[單選題]一個HDFS集群是由一個(__)和多個數(shù)據(jù)節(jié)點組成。

A)索引節(jié)點

B)根節(jié)點

C)名字節(jié)點

D)數(shù)據(jù)節(jié)點

168.[單選題]華為FusionInsightHD是國內(nèi)首家符合國家金融等級保護的大數(shù)據(jù)平臺,其安全性現(xiàn)

在以下哪些方面?

A)系統(tǒng)安全

B)權(quán)限認(rèn)證

C)數(shù)據(jù)安全

D)以上全都正確

169.[單選題]下列關(guān)于大數(shù)據(jù)的分析理念的說法錯誤的是()。

A)在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)

B)在分析方法上更注重相關(guān)分析而不是因果分析

C)在分析效果上更追求效率而不是絕對精確

D)在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)

170.[單選題]在網(wǎng)絡(luò)日志數(shù)據(jù)分析場景中,日志服務(wù)器通過log4將數(shù)據(jù)傳給O,O會對數(shù)據(jù)進

行簡單的處理過濾,然后將數(shù)據(jù)按照日期存儲到O上。

A)Flume.Flume.HDFS

B)HDFS、Flume、Flume

C)Spark.Sgoop.Flume

D)Hive,Flume、Loader

171.[單選題]Hadoop平臺中,要查看YARN服務(wù)中一個application的信息,通常需要使用什么命令

?

A)container

B)jar

C)application-attempt

D)Application

172.[單選題]在機器學(xué)習(xí)中,不屬于常用的沖突消解策略是()

A)投票法

B)排序法

C)元規(guī)則法

D)加權(quán)法

173.[單選題IMapReduce框架對中間結(jié)果中相同“鍵”的所有“值”進行規(guī)約,是在J)階段。

A)Splitting

B)Mapping

C)Shuffling

D)Reducing

174.[單選題]Maxcompute表T中某列C的數(shù)據(jù)類型為bigint,需要修改為double,以下()方式可以

實現(xiàn)。

A)將表T刪掉重建

B)ALTERTABLETCOLUMNCRENAMETOCDOUBLE;

C)ALTERTABLETDROPCOLUMNCJALTERTABLETADDCDOUBLE;

D)ALTERTABLETCHANGECOLUMNSCBIGINT

175.[單選題]現(xiàn)在有一億條數(shù)據(jù)要插入HBaSe,使用下列哪個方式最好?

A)PUt方法

B)bulkload方法

C)Shell端PUt命令

D)insert方法

176.[單選題]下列關(guān)于計算機存儲容量單位的說法中,錯的是O0

A)1KB<1MB<1GB

B)基本單位是字節(jié)(Byte)

C)一個漢字需要一個字節(jié)的存儲空間

D)一個字節(jié)能夠容納一個英文字符,

177.[單選題]數(shù)據(jù)庫(DB)、數(shù)據(jù)庫系統(tǒng)(DBS)和數(shù)據(jù)庫管理系統(tǒng)(DBMS)三者之間的關(guān)系是

A)DBS包括DB和DBMS

B)DDMS包括DB和DBS

C)DB包括DBS和DBMS

D)DBS就是DB,也就是DBMS

178.[單選題]Pig在本地模式下,運行在單個(—)中,訪問本地文件系統(tǒng)。

A)ETL

B)JRM

C)JVM

D)Pig

179.[單選題](一)數(shù)據(jù)庫使用哈希表來存儲數(shù)據(jù)。

A)列存儲

B)文檔型

C)圖形

D)key-value

180.[單選題]DESC查看添加了主鍵約束的表結(jié)構(gòu),則Key字段的值為()?!?/p>

A)PRI

B)UNI

C)NOTNULL

D)NULL

18L[單選題]執(zhí)行下列語句后的顯示結(jié)果是什么??>s='hi'>>>print('hi',2*s)

A)hihihi

B)"hi"hihi

C)hihihi

D)hihihi

182.[單選題]通常來說,()能夠用來預(yù)測連續(xù)因變量

A)線性回歸

B)邏輯回歸

C)線性回歸和邏輯回歸

D)以上答案都不正確

183.[單選題]在Flink技術(shù)架構(gòu)中,以下哪項是流處理和批處理的計算引擎?

A)Standalone

B)Runtime

C)FlinkCore

D)DataSteam

184.[單選題]下列關(guān)于支持向量的說法,正確的是()。

A)到分類超平面的距離最近的且滿足一定條件的幾個訓(xùn)練樣本點是支持向量

B)訓(xùn)練集中的所有樣本點都是支持向量

C)每一類樣本集中都分別只有一個支持向量

D)支持向量的個數(shù)越多越好

185.[單選題]在GraPhbaSh上,創(chuàng)建一個新的圖,必須使用的參數(shù)是?

A)graphName

B)Iable

C)edge

D)vertex

186.[單選題]優(yōu)化內(nèi)部管理,促進質(zhì)效提升,重點圍繞營配貫通和()體系變革兩條主線,打破專業(yè)

壁壘,打造業(yè)務(wù)中臺。

A)優(yōu)化客戶服務(wù)

B)多維精益管理

C)營銷服務(wù)

D)計量計費

187.[單選題]概率模型的訓(xùn)練過程就是()過程。

A)分類

B)聚類

C)參數(shù)估計

D)參數(shù)選擇

188.[單選題]與卷積神經(jīng)網(wǎng)絡(luò)相比,循環(huán)神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)()。

A)細(xì)節(jié)信息

B)文章長度

C)單詞之間的長距離依賴關(guān)系

D)歧義

189.[單選題]在HDFS中的塊默認(rèn)大小為()。

A)16MB

B)32MB

O64MB

D)128MB

190.[單選題]下面不屬于數(shù)據(jù)歸約方法有(_)。

A)維歸約

B)度歸約

C)值歸約

D)數(shù)據(jù)壓縮

191.[單選題]使用Pig語句實現(xiàn)分組查詢,下列語句正確的是(—)。

A)SELECT*FROMtmptableGROUPBYis_male;

B)DUMPtmp_tableGROUPBYis_male;

C)GROUPtmp_tableBYisjnale;

D)tmp_table_group=GROUPtmp_tableBYis_male;DUMPtmp_tab1e_group;

192.[單選題]下列關(guān)于列族數(shù)據(jù)庫的描述,哪一項是錯誤的:()

A)查找速度慢,可擴展性差

B)功能較少,大都不支持強事務(wù)一致性

C)容易進行分布式擴展

D)復(fù)雜性低

193.[單選題]以下幾種模型方法屬于判別式模型(DiSCriminatiVeMOdeD的有()D混合高斯模型

2)條件隨機場模型3)支持向量機4)隱馬爾科夫模型

A)l,2

B)3,4

02,3

D)l,4

194.[單選題]下列關(guān)于數(shù)據(jù)科學(xué)流程與方法的描述中,錯誤的是()。

A)數(shù)據(jù)科學(xué)的基本流程包括數(shù)據(jù)化、數(shù)據(jù)加工(DataWrangling或DataMunging),數(shù)據(jù)規(guī)整化、

探索性分析、數(shù)據(jù)分析與洞見、結(jié)果展現(xiàn)以及數(shù)據(jù)產(chǎn)品的提供

B)對于數(shù)據(jù)形態(tài)不符合要求的亂數(shù)據(jù),要通過清洗成為規(guī)整數(shù)據(jù)

C)數(shù)據(jù)分析包括描述性分析、診斷性分析、預(yù)測性分析和規(guī)范性分析

D)數(shù)據(jù)可視化會遇到視覺假象問題,人眼對亮度和顏色,的相對判斷容易造成視,覺假象

195.[單選題]下列關(guān)于BigTable的描述,哪個是錯誤的?()

A)爬蟲持續(xù)不斷地抓取新頁面,這些頁面每隔一段時間地存儲到BigTabIe里

B)BigTabIe是一個分布式存儲系統(tǒng)

C)BigTabIe起初用于解決典型的互聯(lián)網(wǎng)搜索問題

D)網(wǎng)絡(luò)搜索應(yīng)用查詢建立好的索引,從BigTabIe得到網(wǎng)頁

196.[單選題]Python中自定義函數(shù)的關(guān)鍵字為()。

A)from

B)def

C)return

D)del

197.[單選題]對于運行在MaPRedUCe平臺上的應(yīng)用程序,此應(yīng)用程序所依賴的jar包會被放到()。

A)HIVE

B)HBASE

OHDFS

D)DB

198.[單選題]下列不屬于Action操作的是()。

A)collect

B)Iter

C)reduce

D)count

199.[單選題]下面哪項是HadooP的作者?()

A)Martin

B)Doug

C)Mark

D)Kent

200.[單選題]在HBaSe中,改變表屬性的關(guān)鍵字是()

A)update

B)alter

C)set

D)以上都不正確

201.[單選題]下列關(guān)于數(shù)據(jù)產(chǎn)品的說法錯誤的是()。

A)數(shù)據(jù)產(chǎn)品的存在形式是數(shù)據(jù)集

B)與傳統(tǒng)物質(zhì)產(chǎn)品不同的是,數(shù)據(jù)產(chǎn)品的消費者不僅限于人類用戶,還可以是計算機以及其他軟硬

件系統(tǒng)

C)數(shù)據(jù)產(chǎn)品不僅包括數(shù)據(jù)科學(xué)項目的最終產(chǎn)品,也包括其中間產(chǎn)品以及副產(chǎn)品

D)數(shù)據(jù)產(chǎn)品開發(fā)涉及數(shù)據(jù)科學(xué)項目流程的全部活動

202.[單選題]python中,()是字符串格式化的方法

A)count

B)format

C)in

D)replace

203.[單選題]getcwd()的作用是(一)o

A)刪除指定路徑的目錄

B)改變當(dāng)前工作目錄到指定的路徑

C)以數(shù)字權(quán)限模式創(chuàng)建目錄

D)返回當(dāng)前工作目錄

204.[單選題]將原始數(shù)據(jù)進行集成、變換、維度規(guī)約、數(shù)值規(guī)約是以下哪個步驟的任務(wù)()。

A)頻繁模式挖掘

B)分類和預(yù)測

C)數(shù)據(jù)預(yù)處理

D)數(shù)據(jù)流挖掘

205.[單選題]Hive適合()環(huán)境

A)Hive適合用于聯(lián)機(Online)事務(wù)處理

B)提供實時查詢功能

C)適合應(yīng)用在大量不可變數(shù)據(jù)的批處理作業(yè)

D)Hive適合關(guān)系型數(shù)據(jù)環(huán)境

206.[單選題]在Hadoop中.()是默認(rèn)的InPUtFormat類型,它將每行內(nèi)容作為新值,而將字節(jié)偏

移量作為keyo

A)FiIeInputFormat

B)TextInputFormat

C)KeyvalueTextInputFormat

D)CombineTextlnputFormat

207.[單選題]大數(shù)據(jù)的4V特征中的VelOCity是指()。

A)價值密度低

B)處理速度快

C)數(shù)據(jù)類型繁多

D)數(shù)據(jù)體量巨大

208.[單選題]關(guān)于LogiStiC回歸和SVM的描述,不正確的是()。

A)Logistic回歸本質(zhì)上是一種根據(jù)樣本對權(quán)值進行極大似然估計的方法,用先驗概率的乘積代替后

驗概率

B)Logistic回歸的輸出就是樣本屬于正類別的概率

C)SVM的目標(biāo)是找到使得訓(xùn)練數(shù)據(jù)盡可能分開且分類間隔最大的超平面,屬于結(jié)構(gòu)風(fēng)險最小化

D)SVM可以通過正則化系數(shù)控制模型的復(fù)雜度,避免過擬合

209.[單選題]在集成學(xué)習(xí)中,對于數(shù)據(jù)型輸出,最常見的結(jié)合策略是()

A)平均法

B)投票法

C)學(xué)習(xí)法

D)以上答案都正確

210.[單選題]聚類是一種典型的無監(jiān)督學(xué)習(xí)任務(wù),然而在現(xiàn)實聚類任務(wù)中我們往往能獲得一些額外的

監(jiān)督信息,于是可通過()來利用監(jiān)督信息以獲得更好的聚類效果。

A)監(jiān)督聚類

B)半監(jiān)督聚類

C)聚類

D)直推聚類

211.[單選題]Hive最重視的性能是可測量性、延展性、()和對于輸入格式的寬松匹配性

A)較低恢復(fù)性

B)容錯性

C)快速查詢

D)可處理大量數(shù)據(jù)

212.[單選題]有關(guān)HiVe支持的基本數(shù)據(jù)類型,Binary表示()

A)集合數(shù)據(jù)

B)字節(jié)數(shù)組

C)字符序列

D)文件數(shù)據(jù)

213.[單選題]HBase中的批量加載底層使用。實現(xiàn)。

A)MapReduce

B)Hive

C)Coprocessor

D)BloomFilter

214.[單選題]關(guān)于ADS的聚集列,下列說法不正確的是:()。

A)如果用戶的查詢Quew的條件中會指定聚集列的內(nèi)容或范圍,那么這樣的查詢性能便會有較大的提

B)聚集列可以在建表后進行修改,修改后DB會在后臺自動刷新數(shù)據(jù)

C)一個分區(qū)內(nèi)聚集列內(nèi)容相同的數(shù)據(jù)會盡可能的分布在同樣的區(qū)塊內(nèi)存

D)創(chuàng)建表時可以指定一列或者若干列作為聚集列

215.[單選題]以下選項中,不是PiP工具進行第三方庫安裝的作用的是:

A)安裝一個庫

B)卸載一個已經(jīng)安裝的第三方庫

C)列出當(dāng)前系統(tǒng)已經(jīng)安裝的第三方庫

D)腳本程序轉(zhuǎn)變?yōu)榭蓤?zhí)行程序

216.[單選題]調(diào)用ZoOkeePer對象創(chuàng)建的節(jié)點,不包括()。

A)持久節(jié)點

B)臨時節(jié)點

C)持久順序節(jié)點

D)DataNOde節(jié)點

217.[單選題]np.floor。函數(shù)的作用是(_)o

A)計算每個元素的模

B)計算每個元素的符號

C)計算每個元素的最小整數(shù)值

D)計算每個元素的小數(shù)部分

218.[單選題]關(guān)于大數(shù)據(jù)與區(qū)塊鏈的聯(lián)系,下面描述錯誤的是:()

A)區(qū)塊鏈?zhǔn)勾髷?shù)據(jù)極大降低信用成本

B)區(qū)塊鏈?zhǔn)菢?gòu)建大數(shù)據(jù)時代的信任基石

C)區(qū)塊鏈?zhǔn)谴龠M大數(shù)據(jù)價值流通的管道

D)區(qū)塊鏈會提升大數(shù)據(jù)的信用成本

219.[單選題]軟件開發(fā)的結(jié)構(gòu)化生命周期方法將軟件生命周期劃分成

A)定義、開發(fā)、運行維護

B)設(shè)計階段、編程階段、測試階段

C)總體設(shè)計、詳細(xì)設(shè)計、編程調(diào)試

D)需求分析、功能定義、系統(tǒng)設(shè)計

220.[單選題]HDfS中的block默認(rèn)保存幾份?

Λ)3

B)2

01

D)不確定

221.[單選題]下列選項中,一鍵啟動HDFS集群的指令是O

A)Start-namenode.sh

B)start-datanode.sh

C)start-dfs.sh

D)start-slave.sh

222.[單選題]消息系統(tǒng)Kafka如何保證高吞吐能力?。

A)持久性機制

B)Partition機制

C)冗余備份機制

D)多訂閱者機制

223.[單選題]以下代碼段當(dāng)你鍵入21時的輸出為(__)Oage=input("Howoldareyou?

")print(age>=18)

A)True

B)False

C)None

D)Error

224.[單選題]Hadoop配置文件中,hadoop-site.Xml顯示覆蓋hadoop-default.Xml里的內(nèi)容。在版本

0.20中,hadoop-site.Xml被分離成三個XML文件,不包括

A)conf-site,xml

B)mapred-site.xml

C)core-site,xml

D)hdfs-site.xml

225.[單選題]以下名詞解釋不正確的是()

A)Zookeeper:針對谷歌ChUbby的一個開源實現(xiàn),是高效可靠的協(xié)同工作系統(tǒng)

B)HBase:提供高可靠性、高性能、分布式的行式數(shù)據(jù)庫,是谷歌BigTable的開源實現(xiàn)

OHive:一個基于HadooP的數(shù)據(jù)倉庫工具,用于對HadooP文件中的數(shù)據(jù)集進行數(shù)據(jù)整理、特殊查詢

和分析存儲

D)HDFS:分布式文件系統(tǒng),是HadOOP項目的兩大核心之一,是谷歌GFS的開源實現(xiàn)

226.[單選題]已知文件abc.txt的內(nèi)容如下:HellO,AB通過如下代碼讀取上述文件的內(nèi)容,讀取的結(jié)

果為()0f=open('abc.txt','r')content=f.read(7)print(content)

A)Hell

B)Hello

C)Hello,

D)Hello,A

227.[單選題]采用主成分分析法映射到低維空間,將最小的d-d/個特征向量舍棄,產(chǎn)生的影響是(

A)使樣本采樣密度增大

B)丟失最優(yōu)解

C)增大噪聲

D)使樣本采樣密度減小

228.[單選題]下面哪個操作是窄依賴O

A)join

B)filter

C)group

D)sort

229.[單選題]下列大數(shù)據(jù)的特點中,O無助于推動網(wǎng)絡(luò)安全治理模式的改進提升。

A)扁平化

B)個性化

C)交互性

D)隔絕性

230.[單選題]數(shù)據(jù)探索是指針對目標(biāo)可變、持續(xù)、多角度的搜索或分析任務(wù),下列哪項不是其搜索過

程的特點()。

A)有選擇

B)有策略

C)有目標(biāo)

D)反復(fù)進行的

231.[單選題]執(zhí)行以下代碼段Print(not(15<20)andnot(20>30))時,輸出為C_)。

A)True

B)False

C)None

D)Error

232.[單選題]Hbase元數(shù)據(jù)MetaRegion路由器信息存放在()。

A)Zookeeper

B)Meta表

C)HMaster

D)RoOt表

233.[單選題]Python使用()關(guān)鍵字自定義一個函數(shù)。

A)function

B)func

C)def

D)lambda

234.[單選題]在進行算術(shù)運算時,如果希望一次性輸出多個統(tǒng)計指標(biāo)可以使用()方法。

A)statistics()

B)describe()

C)all()

D)results()

235.[單選題]ApacheKylin是通過什么方式來提高OLAP性能的?

A)預(yù)計算

B)列式存儲

C)內(nèi)存存儲

D)硬件加速

236.[單選題]下列的SQL語句中,()不是數(shù)據(jù)定義語句。

A)CREATETABLE

B)GRANT

C)CREATEVIEW

D)DROPVIEW

237.[單選題]MapReducevl和MapReducev2的主要區(qū)別在(_)部分。

A)編程模型

B)數(shù)據(jù)處理引擎

C)運行時環(huán)境

D)任務(wù)備份機制

238.[單選題]使用梯度下降算法的步驟

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論