大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案3-2023練習(xí)版_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案3-2023練習(xí)版_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案3-2023練習(xí)版_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案3-2023練習(xí)版_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案3-2023練習(xí)版_第5頁
已閱讀5頁,還剩104頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

試題說明

本套試題共包括1套試卷

答案和解析在每套試卷后

大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案3(500題)

大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案3

L[單選題]下列關(guān)于機器學(xué)習(xí)模型的說法正確的是()。

A)一個機器學(xué)習(xí)模型如果有較高準(zhǔn)確率,總是說明這個分類器是好的

B)如果增加模型復(fù)雜度,那么模型的測試錯誤率不一定會降低

C)如果增加模型復(fù)雜度,那么模型的訓(xùn)練錯誤率總是會降低

2.[單選題]大數(shù)據(jù)環(huán)境下,為了從大量電子數(shù)據(jù)中挖掘有用的信息,一些數(shù)據(jù)分析工具被開發(fā)出來

,主要有三類工具:批處理工具、流處理工具、交互式分析工具

A)交互式分析工具

B)嵌入式分析工具

C)模擬仿真工具

3.[單選題]MapReduce任務(wù)最終是在下列()中被執(zhí)行的。

A)NodeManager

B)container

C)ResourceManager

D)AppMaster

4.[單選題]什么是詞向量?

A)句子分詞得到的向量

B)多個詞組成的向量

C)對每個詞進行編碼得到的向量

D)文檔的向量表示

5.[單選題]下列關(guān)于誤差的說法,正確的是O

A)訓(xùn)練樣本容量增加,泛化誤差也會增加

B)過擬合指數(shù)據(jù)在訓(xùn)練集上的誤差過大

C)過擬合可以通過減少模型參數(shù)數(shù)量解決

D)交叉驗證不重復(fù)使用數(shù)據(jù)

6.[單選題]在其它條件不變的前提下,以下哪種做法容易引起機器學(xué)習(xí)中的過擬合問題

A)增加訓(xùn)練集數(shù)量

B)減少神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點數(shù)

C)刪除稀疏的特征

D)SVM算法中使用高斯核/RBF核代替

7.[單選題]()是用來解決海量大數(shù)據(jù)文件存儲問題的,是目前應(yīng)用最廣泛的分布式文件系統(tǒng)。

A)HDFS

B)HBase

OHIve

D)Kafka

8.[單選題]以下關(guān)于turtle庫的描述,正確的是:

A)在importturtle之后就可以用CirCle()語句,來畫一個圓圈

B)要用fromturtleimportturtle來導(dǎo)入所有的庫函數(shù)

OhomeO函數(shù)設(shè)置當(dāng)前畫筆位置到原點,朝向東

D)seth(x)是Setheading(X)函數(shù)的別名,讓畫筆向前移動X

9.[單選題]IDC的定義除了揭示大數(shù)據(jù)傳統(tǒng)3V基本特征,即VOlUme、Variety和VeIOCity,還增添了

一個新特征是

A)量大

B)速度快

C)應(yīng)用廣

D)價值

10.[單選題]下列關(guān)于可視化工具中高級分析工具的說法,錯誤的是?()

A)R是屬于GNU系統(tǒng)的一個自由、免費、源代碼開放的軟件

B)Weka主要用于社交圖譜數(shù)據(jù)可視化分析,可以生成非??犰诺目梢暬瘓D形

C)GePhi主要用于社交圖譜數(shù)據(jù)可視化分析,可以生成非常酷炫的可視化圖形

D)R通常用于大數(shù)據(jù)集的統(tǒng)計與分析

11.[單選題]執(zhí)行以下代碼段Print(bool('FaISe'))Print(bool())時,輸出為(.)。

A)TrueTrue

B)TrueFalse

C)FalseTrue

D)FalseFalse

12.[單選題]關(guān)系云的一個重要功能是提供()。

A)數(shù)據(jù)庫即服務(wù)

B)虛擬服務(wù)

C)彈性計算

D)按需服務(wù)

13.[單選題]python語句Print(type({}))的結(jié)果是。()

A)class'dict'

B)class'tuple'

C)class'set'

D)class'list'

14.[單選題]第3次信息化浪潮的標(biāo)志是:O

A)個人計算機的普及

B)互聯(lián)網(wǎng)的普及

C)云計算、大數(shù)據(jù)和物聯(lián)網(wǎng)技術(shù)的普及

D)人工智能化

15.[單選題]針對MaXCOnIPUteSQL做邏輯分析的時候,會進行一些優(yōu)化,不包括:()優(yōu)化。

A)常量表達式(ConStantExpression)

B)列映射(ColumnProjection)

C)謂語動詞下沉(PredictPushDown)

D)掃描方式(ScanMethod)

16.[單選題]在早期版本低的HadooP中使用的是()方法來調(diào)度用戶的作業(yè)。

A)短作業(yè)優(yōu)先

B)高響應(yīng)比優(yōu)選

C)基于時間片輪轉(zhuǎn)

D)先進先出

17.[單選題]以下風(fēng)險管理工作,哪些可運用大數(shù)據(jù)實現(xiàn)?

A)貸款催收

B)憑證審閱

C)風(fēng)險模型預(yù)警

D)以上都是

18.[單選題]數(shù)據(jù)資產(chǎn)應(yīng)用以安全可控為前提,按照()的原則,落實安全與保密責(zé)任。

A)誰經(jīng)手,誰使用,誰負責(zé)

B)誰主管,誰負責(zé)

C)誰使用,誰主管,誰負責(zé)

D)誰錄入,誰使用,誰負責(zé)

19.[單選題]哪個軟件架構(gòu)是GOogIe提出的用于處理海量數(shù)據(jù)的并行編程模式和大規(guī)模數(shù)據(jù)集的

A)GFS

B)MapReduce

C)Chubby

D)Bigtable

20.[單選題]關(guān)于數(shù)據(jù)相關(guān)性,以下說法錯誤的是(一)。

A)相關(guān)性體現(xiàn)了大數(shù)據(jù)的靈魂

B)相關(guān)性思維實現(xiàn)了從“為什么”到“是什么”的思維轉(zhuǎn)變

C)相關(guān)性關(guān)注事物的因果關(guān)系

D)相關(guān)性關(guān)注事物的相關(guān)關(guān)系

21.[單選題]HDFS中當(dāng)前block大小為128M,如果當(dāng)前要上傳到HDFS中的文件大小為300M,那么在存

儲時會分配()個block進行存儲。

A)l

B)2

03

D)4

22.[單選題]第一數(shù)字定律中使用概率最大的數(shù)字是()。

A)0

B)l

02

D)3

23.[單選題]下列關(guān)于HiVe中連接查詢描述正確的是()

A)HiVe中連接查詢只支持相等連接而不支持不等連接

B)HiVe中連接查詢支持相等連接和不等連接

C)HiVe中連接查詢只支持不等連接而不支持相等連接

D)以上都不對

24.[單選題]在TF-IDF算法中,在計算完詞頻與逆文檔頻率后,將兩者()后得到最終的結(jié)果。

A)相加

B)相減

C)相乘

D)相除

25.[單選題]下列選項中,關(guān)于HBaSe特性描述不正確的一項是()。

A)高可靠性

B)高性能

C)面向行

D)可伸縮

26.[單選題]對于二分類問題,線性分類器用一個超平面將兩類樣本分開,對于二維平面,這個超平面

是一條()

A)折線

B)曲線

C)直線

D)以上說法都不對

27.[單選題]由于不同類別的關(guān)鍵詞對排序的貢獻不同,檢索算法一般把查詢關(guān)鍵詞分為幾類,

以下哪一類不屬于此關(guān)鍵詞類型的是()。

A)、引用詞

B)、普通關(guān)鍵詞

C)、高頻詞匯

D)、擴展關(guān)鍵詞

28.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,系統(tǒng)在【客戶信息管理】一級菜單下增加【征

信報告查詢管理】二級菜單,用戶可在此菜單下的O節(jié)點查看否決意見。

A)待處理的征信報告

B)B.審批中的征信報告

C)C.審批批準(zhǔn)

D)D.審批否決

29.[單選題]如果問題存在最優(yōu)解,則下面幾種搜索算法中,()必然可以得到該最優(yōu)解。

A)廣度優(yōu)先搜索

B)深度優(yōu)先搜索

C)有界深度優(yōu)先搜索

D)啟發(fā)式搜索

30.[單選題]組合多條SQL查詢語句形成組合查詢的操作符是()

A)SELECT

B)ALL

C)LINK

D)UNION

31.[單選題]下列不屬于TranSfOrmation操作的是0

A)map

B)fIter

C)sample

D)count

32.[單選題]某單位運用隨機森林算法思想建立搶修熱點模型。該模型主要預(yù)測下期臺區(qū)工單數(shù)量

,構(gòu)建搶修熱點。模型構(gòu)建步驟如下:①將歷史數(shù)據(jù)進行隨機自助法重抽樣,生成N個訓(xùn)練樣本集;②將

N個訓(xùn)練樣本集分別做決策樹,生成N棵決策樹;③將N棵決策樹隨機構(gòu)成隨機森林;④未來根據(jù)預(yù)測樣

本氣候環(huán)境、設(shè)備屬性、設(shè)備工況進行隨機森林決策投票,得出針對該預(yù)測樣本最優(yōu)的決策樹進行運

算,并計算出最終結(jié)果。模型算法構(gòu)建步驟合理的順序是()。

A)①②③④

B)①③②④

C)④①②③

D)④②①③

33.[單選題]執(zhí)行以下代碼段ClaSSA:def_init_(self,x=1):self,x=xclassder(A):def

—init一(self,y=2):super().—init—()self,y=ydefmain():obj=der()print(obj.x,

Obj.y)main()時,輸出為(一)0

A)l1

B)l2

C)22

D)21

34.[單選題]在Matplotlib中設(shè)置X軸、y軸的刻度位置可用函數(shù)()。

A)xlabel()、ylabel()

B)xlimO、ylimO

C)Xscale()、yscale()

D)xticks()、yticks()

35.[單選題]以下哪個選項對Redis數(shù)據(jù)讀寫流程描述是正確的?(

A)ServerA節(jié)點返回集群拓撲-客戶端選擇集群任意一個serverA節(jié)點連接客戶端計算Key歸屬的槽

位以及對應(yīng)SerVerB節(jié)點并連接-Servere節(jié)點返回業(yè)務(wù)操作結(jié)果

B)客戶端選擇集群任意一個SerVerA節(jié)點連接-Servera節(jié)點返回集群拓撲客戶端計算Key歸屬的槽

位以及對應(yīng)SerVerB節(jié)點并連接一ServerB節(jié)點返回業(yè)務(wù)操作結(jié)果

C)ServerA節(jié)點返回集群拓撲-喜戶端計算Key歸屬的槽位以及對應(yīng)SerVerB節(jié)點并連接戶端選擇集

群任意一個SerVerA節(jié)點連接-eerB節(jié)點返回業(yè)務(wù)操作結(jié)果

D)客戶端選擇集群任意一個SerVera節(jié)點連接客戶端計算Key歸屬的槽位以及對應(yīng)SerVerB節(jié)點并連

接-ServerA節(jié)點返回集群拓撲-ServerB節(jié)點返回業(yè)務(wù)操作結(jié)果

36.[單選題]以下描述中不屬于"規(guī)整數(shù)據(jù)(TidyData)"三個基本原則的是()。

A)每一類觀察單元構(gòu)成一個關(guān)系(表)

B)每個觀察占且僅占一行

C)每個變量占且僅占一列

D)每個觀察占且僅占一個關(guān)系(表)

37.[單選題]關(guān)于MaXCOmPUte用戶和權(quán)限,說法正確的是:()。

A)每一個項目空間在創(chuàng)建后,需要手工創(chuàng)建一個admin的角色,并且為該角色授予了確定的權(quán)限

B)admin角色可以將admin權(quán)限指派給用戶

C)Admin可以設(shè)定項目空間的安全配置,但是不能修改項目空間的鑒權(quán)模型

D)MaXComPUte目前不支持在項目空間中徹底移除一個用戶及其所有權(quán)限數(shù)據(jù)。

38.[單選題]考察一個由三個卷積層組成的CNN:kernel=3×3,stride=2,padding=SAME0最低層

輸出100個特征映射(featuremap),中間層200個特征映射,最高層400個特征映射。輸入是

200X300的RGB圖片,則總參數(shù)的數(shù)量是()。

A)903400

B)2800

C)180200

D)720400

39.[單選題]F1參數(shù)(一),說明模型越穩(wěn)定。

A)越小

B)越大

C)越趨近于某一特定值

D)Fl參數(shù)和模型穩(wěn)定性沒有關(guān)系

40.[單選題]數(shù)據(jù)使用環(huán)節(jié)的安全技術(shù)措施除防火墻、()、防病毒、防DDOS、漏洞檢測等網(wǎng)絡(luò)安全

防護技術(shù)措施外,還需實現(xiàn)以下安全技術(shù)能力:賬號權(quán)限管理、數(shù)據(jù)安全域、數(shù)據(jù)脫敏、日志管理和

審計、異常行為實時監(jiān)控和終端數(shù)據(jù)防泄漏。

A)入侵檢測

B)病毒檢測

C)程序檢測

D)進程檢測

41.[單選題]下列哪個程序通常與NameNode在同一個節(jié)點啟動

A)TaskTracker

B)DataNode

C)SecondaryNameNode

D)Jobtracker

42.[單選題]大數(shù)據(jù)計算服務(wù)項目空間Prjl中存在表tl,其中包含一列名字為id,OWner打開

LabelSeCUrity設(shè)置后,執(zhí)行如下命令:SETLABEL1TOTABLEtl;SETLABEL2TOTABLE

tl(id);SETLABEL3TOTABLEtl;此時,tl表中的id列的敏感等級標(biāo)簽()。

A)I級

B)3級

C)2級

D)O級

43.[單選題](一)是一種建立在HadooP之上的數(shù)據(jù)倉庫架構(gòu)。

A)HDFS

B)Flume

C)Sqoop

D)Hive

44.[單選題]長短時記憶神經(jīng)網(wǎng)絡(luò)被設(shè)計用來解決什么問題?()

A)、傳統(tǒng)RNN存在的梯度消失/爆炸問題

B)、傳統(tǒng)RNN計算量大的問題

C)、傳統(tǒng)RNN速度較慢的問題

D)、傳統(tǒng)RNN容易過過擬合的問題

45.[單選題]下面哪一個不屬于大數(shù)據(jù)倫理問題:()

A)隱私泄露問題

B)數(shù)據(jù)安全問題

C)數(shù)字鴻溝問題

D)數(shù)據(jù)冗余問題

46.[單選題]執(zhí)行以下代碼段CiaSSFather():def_init_(self,a,b):self,b=bifa<b:

self,a=aelse:self,a=bdefaction(self):self,a+=4classSon(Father):def

init_(self,a,b):self,a=8self,b=4defaction(self):self,a+=7self,b*=

2classGrandSon(Son):def—init—(self,a,b):Father.—init—(self,a,b)grandson=

GrandSon(9,6)grandson,action()print(grandson,a)?,輸出為()0

A)10

B)13

C)15

D)16

47.[單選題]以等可能性為基礎(chǔ)的概率是O。

A)古典概率

B)經(jīng)驗概率

C)試驗概率

D)主觀概率

48.[單選題]在神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中,感知機輸出層中的M-P神經(jīng)元通常被稱為()。

A)閾值邏輯單元

B)激活函數(shù)

C)擠壓函數(shù)

D)連接函數(shù)

49.[單選題]以下對于離線批處理的概念理解錯誤的是哪-項?

A)離線批處理對數(shù)據(jù)處理的時延要求不高。

B)離線批處理占用的內(nèi)存資源較多。

C)離線批處理通常通過眠作業(yè)、SPark作業(yè)或者HQL作業(yè)實現(xiàn)。

D)離線批處理針對的數(shù)據(jù)量較大。

50.[單選題]MapReduce默認的分區(qū)函數(shù)是()。

A)hash

B)disk

C)reduce

D)map

51.[單選題]查找表結(jié)構(gòu)用以下哪一項()

A)FIND

B)SELETE

C)ALTER

D)DESC

52.[單選題]Flink的數(shù)據(jù)轉(zhuǎn)換操作在:()環(huán)節(jié)中完成。

A)channel

B)Transformation

C)sink

D)source

53.[單選題]下列哪項通常是集群的最主要瓶頸_

A)CPU

B)網(wǎng)絡(luò)

C)磁盤IO

D)內(nèi)存

54.[單選題]在比較模型的擬合效果時,甲、乙、丙蘭個模型的相關(guān)指數(shù)R2的值分別約為0.71、

0.85.0.90,則擬合效果較好的模型是()。

A)甲

B)乙

C)丙

D)效果一樣

55.[單選題]下列代碼中最適合接受系統(tǒng)輸入是一個整數(shù)的是()。

A)num=input()

B)num=input("6")

C)num=int(input)

D)num=oat(input)

56.[單選題]使用Pig語句查詢一張名為tmp_table的表的前50行,下列語句正確的是()。

A)SELECT*FROMtmp_tableLIMIT50;

B)tmp_table_limit=LIMITtmp_table50;DUMPtmp_table_limit;

ODUMPtmp_tableLIMIT50

D)DUMPtmp_tableLIMIT=50;

57.[單選題]推薦系統(tǒng)為客戶推薦商品,自動完成個性化選擇商品的過程,滿足客戶的個性化需求,推

薦基于網(wǎng)站最熱賣商品、客戶所處城市、(),推測客戶將來可能的購買行為。

A)客戶的朋友

B)客戶的個人信息

C)客戶的興趣愛好

D)客戶過去的購買行為和購買記錄

58.[單選題]下面關(guān)于數(shù)據(jù)粒度的描述不正確的是:

A)粒度是指數(shù)據(jù)倉庫小數(shù)據(jù)單元的詳細程度和級別

B)數(shù)據(jù)越詳細,粒度就越小,級別也就越高

C)數(shù)據(jù)綜合度越高,粒度也就越大,級別也就越高

D)粒度的具體劃分將直接影響數(shù)據(jù)倉庫中的數(shù)據(jù)量以及查詢質(zhì)量

59.[單選題]留出法直接將數(shù)據(jù)集劃分為()個互斥的集合

A)一

B)二

C)三

D)四

60.[單選題]決策樹的基本流程遵循()的策略。

A)貪心

B)最優(yōu)化

C)分而治之

D)順序

61.[單選題]關(guān)于數(shù)據(jù)整合和分組的說法,不E確的是

A)數(shù)據(jù)連接可以用concat或merge函數(shù)

B)axis=l表示軸向連接

C)數(shù)據(jù)分組可以使用mean函數(shù)

D)使用agg可以自定義多個聚合函數(shù)

62.[單選題]遺忘門的作用是()。

A)保留重要信息

B)去除不重要信息

C)信息增加

D)輸出

63.[單選題]創(chuàng)建數(shù)據(jù)庫使用以下哪項()

A)createmytest

B)createtablemytest

C)databasemytest

D)createdatabasemytest

64.[單選題]下列關(guān)于MaPRedUCe計算原理敘述不正確的一項是()0

A)將大數(shù)據(jù)集劃分為小數(shù)據(jù)集,小數(shù)據(jù)集劃分為更小數(shù)據(jù)集

B)將最終劃分的小數(shù)據(jù)分發(fā)布到集群節(jié)點上

C)以串行的方式完成計算處理

D)將計算結(jié)果遞歸融匯,得到最后的結(jié)果

65.[單選題]在SeleCt語句中,實現(xiàn)選擇操作的子句是()

A)select

B)groupby

C)where

D)from

66.[單選題]Python源程序文件的擴展名為()

A)pdb

B)db

Opy

D)exe

67.[單選題]決策樹中,同一路徑上的所有屬性之間是()關(guān)系

A)因果

B)相關(guān)

C)邏輯或

D)邏輯與

68.[單選題]()是SPark中用于結(jié)構(gòu)化數(shù)據(jù)處理的軟件包。

A)SPARKCORE

B)SparkSQL

C)SparkStreaming

D)Mllib

69.[單選題]下面關(guān)于MaPRedUCe模型中MaP函數(shù)與RedUCe函數(shù)的描述正確的是()

A)一個MaP函數(shù)就是對一部分原始數(shù)據(jù)進行指定的操作。

B)一個MaP操作就是對每個RedUCe所產(chǎn)生的一部分中間結(jié)果進行合并操作。

C)MaP與MaP之間不是相互獨立的。

D)RedUCee與RedUCe之間不是相互獨立的。

70.[單選題]數(shù)據(jù)資產(chǎn)應(yīng)用O以為前提,按照“誰經(jīng)手,誰使用,誰負責(zé)”的原則,落實安全與保

密責(zé)任。

A)來源明確

B)冗余率低

C)分類清晰

D)安全可控

71.[單選題]下面不屬于NoSQL的有(_)。

A)ORACLE

B)Redislabs

C)couchbase

D)paradigm4

72.[單選題]數(shù)據(jù)抽取是從數(shù)據(jù)源中抽取數(shù)據(jù)的過程,數(shù)據(jù)抽取的方式有全量抽取和()。

A)重點抽取

B)個別抽取

C)抽樣抽取

D)增量抽取

73.[單選題]一般情況下,若要提高EIaStiCSearCh檢索效率,可以采取什么操作?

A)調(diào)整索引分片數(shù)

B)使用HiVe做底層存儲

C)壓縮素引

D)正價ESMaSter節(jié)點

74.[單選題]下面屬于批處理技術(shù)的是:()

A)MapReduce

B)Storm

C)Spark

D)GraphX

75.[單選題]下列關(guān)于數(shù)據(jù)交易市場的說法中,錯誤的是()。

A)數(shù)據(jù)交易市場是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展到一定程度的產(chǎn)物

B)商業(yè)化的數(shù)據(jù)交易活動催生了多方參與的第三方數(shù)據(jù)交易市場

C)數(shù)據(jù)交易市場通過生產(chǎn)、研發(fā)和分析數(shù)據(jù),為數(shù)據(jù)交易提供幫助

D)數(shù)據(jù)交易市場是大數(shù)據(jù)資源化的必然產(chǎn)物

76.[單選題]下面幾種梯度下降方法中,哪種是速度最慢的:()

A)SGD

B)Adagrad

ORMSProp

D)Adam

77.[單選題]在我們神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,每次dropout想去掉20%的參數(shù),下面有關(guān)激活函數(shù)說法錯

誤的是:()

A)SigmOid容易飽和,出現(xiàn)梯度消失。

B)LeakyRelU是ReiU的一個變種,他在X

C)Tanh存在梯度消失問題,但是是0均值,而且收斂速度比Sigmoid慢。

D)ReIU收斂速度比Sigmoid和tanh快很多,可以緩解梯度消失現(xiàn)象。

78.[單選題]()反映數(shù)據(jù)的精細化程度,越細化的數(shù)據(jù),價值越高。

A)規(guī)模

B)活性

0關(guān)聯(lián)度

D)顆粒度

79.[單選題]HBase使用get方法讀取數(shù)據(jù)時,下列哪個選項是需要的?

A)Deletedelete=newDelete(rowkey)

B)scan.SetCaching(1000)

C)bytellrowkey=Bytes.toBytesC"012005000201")

D)List<Put>]putS=newArraylist<Put>0

80.[單選題]與以下代碼段foriinranged,101):ifint(i*0.5)==i*0.5:Print(i)等效

的列表描述(一)o

A)[iforiinrange(1,100)ifint(i*0.5)==(i*0.5)]

B)[iforiinrange(1,101)ifint(i*0.5)==(i*0.5)]

C)[iforiinrange(1,101)ifint(i*0.5)=(i*0.5)]

D)[iforiinrange(1,100)ifint(i*0.5)=(i*0.5)]

81.[單選題]在支持向量機中,軟間隔支持向量機的目標(biāo)函數(shù)比硬間隔支持向量機多了一個(_)。

A)偏置項b

B)系數(shù)

C)松弛變量

D)兩種情況的目標(biāo)函數(shù)相同

82.[單選題]Hive創(chuàng)建。時,會將數(shù)據(jù)移動到數(shù)據(jù)倉庫指向的路徑;創(chuàng)建O,僅記錄數(shù)據(jù)所在的

路徑,不對數(shù)據(jù)的位置做任何改變

A)內(nèi)部表.外部表

B)內(nèi)部表.元數(shù)據(jù)

C)原元數(shù)據(jù).外部表

D)外部表.托管表

83.[單選題]若不針對MapReduce編程模型中的key和VaIUe值進行特別設(shè)置,下列哪一項是

MapReduce不適宜的運算。()

A)Max

B)Min

C)Count

D)Average

84.[單選題]()可用來展示持續(xù)性數(shù)據(jù),可很好地表示趨勢、累積、減少以及變化。

A)柱形圖

B)地圖

C)面積圖

D)雷達圖

85.[單選題]Spark的核心概念不包括?

A)RDD

B)Hoq

C)寬套依賴

D)Shuffle

86.[單選題]以下哪個不是大數(shù)據(jù)的“4V”特性:()

A)數(shù)據(jù)量大

B)數(shù)據(jù)類型繁多

C)處理速度快

D)價值密度高

87.[單選題]關(guān)于FusionlnsightHD中Loader作業(yè)描述正確的是

A)Load可將作業(yè)提交到Y(jié)arn執(zhí)行后,如果此時Loader服務(wù)出現(xiàn)異常,則此作業(yè)執(zhí)行失敗。

B)LOader將作業(yè)提交至Yarn執(zhí)行后,如果某個MaPPer任務(wù)執(zhí)行失敗,能夠自動進行重試。

C)Loader作業(yè)執(zhí)行共敗后將會產(chǎn)生垃圾數(shù)據(jù),需要用戶手動清除

D)LOader將一個作業(yè)提交至Yarn執(zhí)行后,該作讓執(zhí)行完成前,不能再提交其他作業(yè)

88.[單選題]落實國家大數(shù)據(jù)安全保護要求時,需進一步明確大數(shù)據(jù)采集、傳輸、存儲、使用、開放

等各環(huán)節(jié)的O和具體措施。

A)責(zé)任主體

B)生產(chǎn)成本

C)關(guān)鍵技術(shù)

D)標(biāo)準(zhǔn)規(guī)范

89.[單選題]評估完模型之后,發(fā)現(xiàn)模型存在高偏差(highbi踴),應(yīng)采取的解決方法是0

A)減少模型的特征數(shù)量

B)增加模型的特征數(shù)量

C)增加樣本數(shù)量

D)以上答案都正確

90.[單選題]相對于HadoopMapReducel.0,Spark的特點不包括()。

A)速度快

B)并發(fā)多

C)通用性

D)易用性

91.[單選題]Flink的窗口,按窗口行為劃分不包含以下哪種?

A)容量窗口

B)滑動窗

C)滾動窗口

D)會話窗口

92.[單選題]一張表的主鍵個數(shù)為()

A)至多3個

B)沒有限制

C)至多1個

D)至多2個

93.[單選題]下面的循環(huán)會打印多少次"ILovePythonw?foriinrange(0,10,2):print('ILove

Python')

A)2

B)5

C)6

D)10

94.[單選題]下列關(guān)于類屬性和實例屬性的說法中,描述正確的是。。

A)類屬性既可以顯式定義,又能在方法中定義

B)公有類屬性可以通過類和類的實例訪問

C)通過類可以獲取實例屬性的值

D)類的實例只能獲取實例屬性的值

95.[單選題]Maxcompute拓展MR的主要特點是:()。

A)支持計算在內(nèi)存中進行,中間結(jié)果不落地

B)支持MaP后連續(xù)任意多個RedUCe操作

C)可以在上一次的reduce結(jié)束之后,直接增加一次map

D)從MaP直接到RedUCe,省去ShUffle階段

96.[單選題]有關(guān)HiVe支持的基本數(shù)據(jù)類型,TimeStamP表示()

A)時間戳

B)字符序列,可以指定字符集

C)字節(jié)數(shù)組

D)集合數(shù)據(jù)類型

97.[單選題]Flume中最小的獨立運行單位是()。

A)Source

B)Agent

C)Channel

D)Sink

98.[單選題IStructuredStreaming中通過什么機制解決數(shù)據(jù)的無序和滯后問題?

A)事件時間

B)流連接

C)Watermark機制

D)持續(xù)查詢

99.[單選題]輸入圖像為32x32,經(jīng)過步長為1,不進行Padding,卷積核為5x5的卷積層后,得到的特

征圖尺寸是多少?O

A)28x28

B)27x27

C)29x29

D)32x32

100.[單選題]下列關(guān)于SkIearn說法錯誤的是Oo

A)sklearn全稱為SCikitTearn

B)sklearn在官網(wǎng)被分為7個大塊

C)sklearn的聚類算法幾乎都已經(jīng)放在CIUSter模塊中了

D)sklearn需要NUmPy和SCiPy庫的支持

IOL[單選題]執(zhí)行"abedef''[::-l]語句時輸出是(Jo

A)fedcba

B)f

C)abcdef

D)abcde

102.[單選題]業(yè)務(wù)中臺方面,以業(yè)務(wù)為導(dǎo)向,優(yōu)先建設(shè)()和客戶服務(wù)業(yè)務(wù)中臺,后期逐步視

情況拓展賬務(wù)結(jié)算等業(yè)務(wù)共享服務(wù)

A)電網(wǎng)服務(wù)業(yè)務(wù)中臺

B)電網(wǎng)資源業(yè)務(wù)中臺

C)電網(wǎng)優(yōu)化業(yè)務(wù)中臺

D)電網(wǎng)環(huán)境業(yè)務(wù)中臺

103.[單選題]()屬于SVM應(yīng)用。

A)文本和超文本分類

B)圖像分類

C)新文章聚類

D)以上均是

104.[單選題]Relief的時間開銷隨采樣次數(shù)以及原始特征數(shù)(_)。

A)線性增長

B)指數(shù)型增長

C)快速增長

D)負增長

105.[單選題]Reduce階段不包括以下哪一步?。

A)排序

B)分區(qū)

C分組

D)規(guī)約

106.[單選題]YARN分層結(jié)構(gòu)的本質(zhì)是(一),負責(zé)整個系統(tǒng)的資源管理和分配。

A)ResourceManger

B)NodeManger

C)ApplicationMaster

D)Container

107.[單選題]下列哪個命令是刪除文件的?

A)dfs-clear

B)dfs-Is

C)dfs-rm

D)dfs-del

108.[單選題]下面程序段執(zhí)行后的輸出結(jié)果是()。

N=Is=l

Whilen<5:

S=s*nn=n+lprint(s)

A)24

B)10

C)120

D)15

109.[單選題]Hadoopl.0默認的調(diào)度器策略是哪個。()

A)先進先出調(diào)度器

B)計算能力調(diào)度器

C)公平調(diào)度器

D)優(yōu)先級調(diào)度器

110.[單選題]一幅大小為512X512的8比特圖像,則該圖像大小為(一)。

A)32KB

B)128KB

C)16KB

D)256KB

Ill.[單選題]一切皆可連,任何數(shù)據(jù)之間邏輯上都有可能存在聯(lián)系,這體現(xiàn)了大數(shù)據(jù)思維維度中的

()O

A)定量思維

B)相關(guān)思維

C)因果思維

D)檢驗思維

112.[單選題]O以上地方人民政府有關(guān)部門的網(wǎng)絡(luò)安全保護和監(jiān)督管理職責(zé),按照國家有關(guān)規(guī)定

確定

A)鄉(xiāng)級

B)縣級

C)市級

D)省級

113.[單選題]數(shù)據(jù)管理成熟度模型將機構(gòu)數(shù)據(jù)管理能力定義為(_)個不同成熟度等級,并給出了

(_)類關(guān)鍵過程域,共(_)個關(guān)鍵活動。

A)3,7,21

B)4,6,24

05,6,25

D)6,7,28

114.[單選題IMapReduce編程模型,鍵值對<key,value>的key必須實現(xiàn)哪個接口?()

A)WritableComparab1e

B)ComparabIe

OWritable

D)LongWritable

115.[單選題]CNN神經(jīng)網(wǎng)絡(luò)對圖像特征提取帶來了變革性的變化,使之前的人工特征提取升級到數(shù)據(jù)

驅(qū)動的自動特征提取,在αN中,起到特征提取作用的網(wǎng)絡(luò)層是()

A)ConVoIUtion層

B)fullConneet層

C)maxpooling層

D)norm層

116.[單選題]Maxcompute中,當(dāng)一個用戶被移除后,與該用戶有關(guān)的()授權(quán)會保留。

?)PaCkage授權(quán)

B)POIiCy授權(quán)

C)ACL授權(quán)

D)項目空間授權(quán)

117.[單選題]關(guān)于缺失值填補,不正確的說法是()。

A)填補數(shù)據(jù)可以用中位數(shù)或者眾數(shù)等

B)Pandas,dropna可以用來填補缺失值

C)用平均值填補會引入相關(guān)性

D)啞變量填補是將缺失值當(dāng)做一類新特征處理

118.[單選題]Hadoop環(huán)境下HDFS系統(tǒng)中的NameNOde實現(xiàn)的功能是()。

A)管理文件系統(tǒng)的命名空間

B)管理存儲空間

C)分配算力

D)調(diào)控算法

119.[單選題]下列關(guān)于GaUSSDB200的TOAST機制說法正確的是O?

A)存儲超過2KB的字段時,會觸發(fā)TOAST機制.

B)支持變長(Varlena)表現(xiàn)形式的數(shù)據(jù)類型.

C)存儲超過1/2KB的字段時,會觸發(fā)TOAST機制。

D)存儲超過IKB的字段時,會觸發(fā)ToAST機制。

120.[單選題]執(zhí)行以下代碼段IiStl=[1,5,9]Print(SUnI(IiStI))時,輸出為(_)。

A)l

B)5

09

D)15

121.[單選題]假如使用LaSSO回歸來擬合數(shù)據(jù)集,該數(shù)據(jù)集輸入特征有100個(XI,X2,…,

XlOO)O現(xiàn)在,把其中一個特征的值擴大10倍(如特征XD,然后用相同的正則化參數(shù)對LaSSO

回歸進行修正。那么下列說法正確的是()。

A)特征Xl很可能被排除在模型之外

B)特征Xl很可能還包含在模型之中

C)無法確定特征Xl是否被舍

D)以上答案都不正確

122.[單選題]防火墻、漏洞掃描、病毒防范和系統(tǒng)加固等服務(wù)屬于O

A)安全增值服務(wù)

B)代理代維服務(wù)

C)優(yōu)化類服務(wù)

D)容災(zāi)服務(wù)

123.[單選題]K折交叉驗證器是()函數(shù)。

A)model_selection.GroupKFold()

B)model_SeleCtion.GroupShufeSplit()

C)model_selection.KFold()

D)model_seIection.RepeatedKFold()

124.[單選題]閱讀以下代碼,回答問題,當(dāng)n是11的時候,S為多少1deftotal(n):2s=03i=14

while(i

A)55

B)66

C)44

D)50

125.[單選題]已知初始問題的描述,通過一系列變換把此問題最終變?yōu)橐粋€子問題集合;這些子問題

的解可以直接得到,從而解決了初始問題。這是知識表示法叫OO

A)狀態(tài)空間法

B)問題歸約法

C)謂詞邏輯法

D)語義網(wǎng)絡(luò)法

126.[單選題]下面哪個是分布式數(shù)據(jù)庫O

?)HDFS

B)HBase

C)Oracle

D)Mysql

127.[單選題]HBase的物理存儲單元是什么?

A)Region

B)ColumnFamily

C)Column

D)ROW

128.[單選題]numPy中實現(xiàn)豎直軸分割數(shù)組的函數(shù)是什么?

A)np.vsplit

B)np.hsplit

C)np.dsplit

D)np.split

129.[單選題]假設(shè)現(xiàn)在要做一個可以根據(jù)線索指導(dǎo)運維人員進行排障的功能,你建議選擇下列哪個

工具實現(xiàn)該功能?

A)Lucene

B)HBase

C)ElasticSearch

D)GraphBase

130.[單選題]關(guān)于HiVe在FUSiOnlnSightHD中的架構(gòu)描述錯誤的是?

A)只要有一個HiVeSerVer不可用,整個HiVe集群便不可用

B)MOtaStOre用于提供元數(shù)據(jù)服務(wù),依賴于DBSerViCe

C)在同一時間點,HiVeSerVer只要一個處于ACtiVe狀態(tài),另一個則處于Standby狀態(tài)

D)HiVeSerVer負責(zé)接收客戶端請求.解析.執(zhí)行HQL命令并返回查詢結(jié)果

131.[單選題]哪一項不屬于FUSiOnInSightHD中HiVe的流控特性的描述?

A)支持對已經(jīng)建立的總連接數(shù)做閥值控制

B)支持對每個用戶已經(jīng)建立的連接數(shù)做閥值控制

C)支持對某個特定用戶已經(jīng)建立的連接數(shù)做閥值控制

D)支持對單位時間所建立的連接數(shù)做閥值控制

132.[單選題]()是GOOgle提出的用于處理海量數(shù)據(jù)的并行編程模式和大規(guī)模數(shù)據(jù)集的并行運算的

軟件架構(gòu)。

Λ)GFS

B)MapReduce

C)Chubby

D)BitTable

133.[單選題]下列關(guān)于數(shù)據(jù)交易市場的說法中,錯誤的是()。

A)數(shù)據(jù)交易市場是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展到一定程度的產(chǎn)物

B)咱商業(yè)化的數(shù)據(jù)交易活動催生了多方參與的第三方數(shù)據(jù)交易市場

C)數(shù)據(jù)交易市場通過生產(chǎn)、研友和分析數(shù)據(jù),為數(shù)據(jù)交易提供幫助

D)數(shù)據(jù)交易市場是大數(shù)據(jù)資源化的必然產(chǎn)物

134.[單選題]下列對于ADS中表和表組的描述正確的是()。

A)維度表在創(chuàng)建時不需要指定表組,但是需要配置分區(qū)信息

B)維度表可以和除維度表組外的任意表組中的表關(guān)聯(lián)

C)批量插入的表如果只有一級分區(qū),每次導(dǎo)入數(shù)據(jù)是會覆蓋掉已有數(shù)據(jù)

D)維度表組有且只有一個,用戶可以修改表組屬性,但是不能刪除

135.[單選題]np.arraySPIit()函數(shù)的作用是(_)o

A)沿著它的水平軸分割

B)沿著縱向的軸分割

C)允許指定沿哪個軸分割

D)按深度方向分割

136.[單選題]sciPy中模塊Signal.的作用是什么?

A)信號處理

B)程序輸入輸出

C)程序輸入輸出

D)計算積分

137.[單選題]大數(shù)據(jù)產(chǎn)業(yè)指什么?

A)一切與支撐大數(shù)據(jù)組織管理和價值發(fā)現(xiàn)相關(guān)的企業(yè)經(jīng)濟活動的集合

B)提供智能交通、智慧醫(yī)療、智能物流、智能電網(wǎng)等行業(yè)應(yīng)用的企業(yè)

C)提供數(shù)據(jù)分享平臺、數(shù)據(jù)分析平臺、數(shù)據(jù)租售平臺等服務(wù)的企業(yè)

D)提供分布式計算、數(shù)據(jù)挖掘、統(tǒng)計分析等服務(wù)的各類企業(yè)

138.[單選題]為保證流應(yīng)用的快照存儲的可靠性,快照主要存儲在:()。

A)本地文件系統(tǒng)中

B)JObManager的內(nèi)存中

C)HDFS中

D)可靠性高的單擊數(shù)據(jù)庫中

139.[單選題]下列選項中,用于標(biāo)識為靜態(tài)方法的是OO

A)@classmethod

B)PythOn標(biāo)示注釋使用符號是以下哪個?

C)?staticmethod

D)'?privatemethod

140.[單選題]HBase為什么適用于海量數(shù)據(jù)存儲?

A)集群規(guī)模小

B)支持列存表

C)多列簇特性

D)HDFS做底層存儲

141.[單選題]下列關(guān)于RDD說法,描述有誤的是?

A)一個RDD就是一個分布式對象集合,本質(zhì)上是一個只讀的分區(qū)記錄集合

B)每個RDD可分成多個分區(qū),每個分區(qū)就是一個數(shù)據(jù)集片段

C)RDD是可以直接修改的

D)RDD提供了一種高度受限的共享內(nèi)存模型

142.[單選題]以下不屬于生成式模型的是:

A)樸素貝葉斯

B)K近鄰

C)高斯混合模型

D)馬爾科夫隨機場

143.[單選題]在其他條件不變的前提下,()容易引起機器學(xué)習(xí)中的過擬合問題

A)增加訓(xùn)練集量

B)減少神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點數(shù)

C)刪除稀疏的特征

D)SVM算法中使用高斯拉底BF桂代替線性

144.[單選題]信息安全管理最關(guān)注的是?()

A)外部惡意攻擊

B)病毒對PC的影響

C)內(nèi)部惡意攻擊

D)病毒對網(wǎng)絡(luò)的影響

145.[單選題]數(shù)據(jù)、信息與知識三者之間的變化趨勢是O

A)宏課程

B)大課程

C)小課程

D)微課程

146.[單選題]在留出法、交叉驗證法和自助法三種評估方法中,()更適用于數(shù)據(jù)集較小、難以劃分訓(xùn)

練集和測試集的情況。

A)留出法

B)交叉驗證法

C)自助法

D)留一法

147.[單選題]下列關(guān)于鍵值數(shù)據(jù)庫的描述,哪一項是錯誤的:()

A)擴展性好,靈活性好

B)大量寫操作時性能高

C)無法存儲結(jié)構(gòu)化信息

D)條件查詢效率高

148.[單選題]下列操作是創(chuàng)建目錄的是(__)。

A)mkdir

B)chdir

C)rmdir

D)move

149.[單選題IFusionInsightHD集群組網(wǎng)設(shè)計中,有一種機架可以按照業(yè)務(wù)需求線性擴展,這種機

架被稱為()

A)基本框

B)擴展框

C)管理框

D)數(shù)據(jù)框

150.[單選題]下面說法錯誤的是()。

A)可以利用統(tǒng)計量對缺失值進行填補

B)可以利用K近鄰值對缺失值進行填補

C)只要有缺失值就必須把對應(yīng)記錄刪除

D)對于缺失值較多的屬性可以考慮刪除

151.[單選題]下列選項中,不屬于PythOn特點的是。()

A)面向?qū)ο?/p>

B)運行效率高

C)可移植性

D)免費和開源

152.[單選題]MySQL數(shù)據(jù)庫驅(qū)動文件放置于hive哪個目錄下O

A)jar

B)lib

Obin

D)sbin

153.[單選題]在HadoOP的分區(qū)階段,默認的PartitiOner是()。

A)RangePartitioner

B)Partitioner

C)HashPartitioner

D)用戶自定義的Partitioner

154.[單選題]大數(shù)據(jù)計算服務(wù)(MaxCompute,原ODPS)的運維人員想要知道一張日志表IOg已經(jīng)占

用了多少存儲空間,可以在命令行工具OdPSemd中使用()命令查看。

A)Islog;

B)desclog;

C)select*fromlog;

D)sizelog;

155.[單選題]下列選項中,哪個配置文件可以配置HDFS地址、端口號以及臨時文件目錄()

A)core-site,xml

B)hdfs-site.xml

C)mapred-site.xml

D)yarn-site,xml

156.[單選題]有N個樣本,一般用于訓(xùn)練,一般用于測試若N增大,則訓(xùn)練誤差和測試誤差之間的差

距會()

A)增大

B)減小

C)無法確定

D)無明顯變化

157.[單選題]下面哪個RDD操作肯定是寬依賴()

A)map

B)fIatMap

OreduceByKey

D)sample

158.[單選題]下面哪個不屬于matplotlib基本圖表包含的元素

A)坐標(biāo)軸

B)刻度

C)刻度標(biāo)簽

D)參考區(qū)域

159.[單選題]表A為ADS中的普通表,列a為其中一個普通列,類型為int,以下SQL()是正確的。

A)SELECTa+COUNT(*)FROMA

B)SELECTUDF_SYS_COUNT_COLUMN(a)FROMA

C)SELECTSUM(COUNT(*))FROMA

D)以上都正確

160.[單選題]下列關(guān)于Python文件處理的描述錯誤的是()。

A)Python能處理jpg圖像文件

B)Python不可以處理PDF文件

OPython能處理CSV文件

D)Python能處理Excel文件

161.[單選題]在空間維度上刻畫數(shù)據(jù)連續(xù)性是數(shù)據(jù)的()特點。

A)可關(guān)聯(lián)性

B)可溯源性

C)可理解性

D)可復(fù)制性

162.[單選題]()是指為最小化總體風(fēng)險,只需在每個樣本上選擇能使特定條件風(fēng)險最小的類別標(biāo)記。

A)支持向量機

B)間隔最大化

C)線性分類器

D)貝葉斯判定準(zhǔn)則

163.[單選題]Flume中基于WAL(預(yù)寫式日志W(wǎng)rite-AheadLog)實現(xiàn)ChanneI持久化的是?

A)JDBCChannel

B)KafkaChannel

C)MemoryChannel

D)FiIeChannel

164.[單選題]情感信息抽取不包括以下哪些方法?()

A)、基于命名實體識別的抽取方法

B)、基于重復(fù)段落的識別方法

0、基于語義角色標(biāo)注的抽取方法

D)、基于監(jiān)督學(xué)習(xí)抽取的學(xué)習(xí)方法

165.[單選題]下列的處理過程與RedUCe處理過程相似的是(一)0

A)Shuffle

B)Combiner

C)Partition

D)Map

166.[單選題]假設(shè)每個用戶最低資源保障設(shè)置為yarn,scheduler,capacity,root,

QueueA.minimum-userTimit-PerCent=24。則以下說法錯誤的是?

A)第3個用戶提交任務(wù)時,每個用戶最多獲得33.33%的資源

B)第2個用戶提交任務(wù)時,每個用戶最多獲得50%的資源

C)C第4個用戶提交任務(wù)時,每個用戶最多獲得25%的資源

D)D第5個用戶提交任務(wù)時,每個用戶最多獲得20%的資源

167.[單選題]CSV是一種通用的、相對簡單的文件格式,被用戶、商業(yè)和科學(xué)廣泛應(yīng)用。現(xiàn)在需要在

DEEP平臺中將多個字符串拼接成CSV格式的字符串。請選擇適用的數(shù)值轉(zhuǎn)換器:

A)Ceiling

B)CsvAssemble

C)CsnToString

D)TermExtract

168.[單選題]下面插入數(shù)據(jù)操作錯誤的是()。-

A)INSERT數(shù)據(jù)表名VALUE(值列表)

B)INSERTINTO數(shù)據(jù)表名VALUES(值列表)

C)INSERT數(shù)據(jù)表名VALUES(值列表)

D)INSERT數(shù)據(jù)表名(值列表)

169.[單選題]執(zhí)行以下代碼段deffl(a,b=[]):b.append(a)returnbprint(fl(1,[2,3]))時

,輸出為()o

A)[1,2,3]

B)[1,3,2]

C)[3,2,1]

D)[2,3,1]

170.[單選題]在hadoop配置中yarn-site,xml作用是()

A)用于定義系統(tǒng)級別的參數(shù)

B)用于名稱節(jié)點和數(shù)據(jù)節(jié)點的存放位置

C)用于配置

D)配置

171.[單選題]當(dāng)(_)過高,會出現(xiàn)欠擬合現(xiàn)象

A)偏差

B)方差

C)噪聲

D)泛化誤差

172.[單選題]YARN調(diào)度器分配資源的順序是:()o

A)任意機器一本地資源一同機架

B)任意機器一同機架一本地資源

C)本地資源一同機架一任意機器

D)同機架一任意機器一本地資源

173.[單選題]假設(shè)PreCiSiOn=TP/(TP+FP),recall=TP/(TP+FN),則在二分類問題中,當(dāng)測試集的正例

和負例數(shù)量不均衡時,以下評價方案中()是相對不合理的。

A)Accuracy:(TP+TN)/all

B)F-value:2recallprecision/(recal!+precision)

C)G-mean:sqrt(precision*recall)

D)AUC:曲線下面積

174.[單選題]國網(wǎng)數(shù)據(jù)中臺,是在下面()數(shù)據(jù)中心階段的基礎(chǔ)上發(fā)展過來的。

A)營銷服務(wù)中心

B)全業(yè)務(wù)統(tǒng)一數(shù)據(jù)中心

C)海量歷史/實時數(shù)據(jù)中心

D)電網(wǎng)GlS數(shù)據(jù)中心

175.[單選題]執(zhí)行下列語句后的顯示結(jié)果是什么?>>>World="world"?>print"hello"+

world

A)helloworld

B)“hello"world

C)helloworld

D)語法錯誤

176.[單選題]在MaPRedUCe中,以下描述錯誤的有()。

A)WOrker缸故障和MaSter故障的處理方法不相同

B)Map和Reduce的處理結(jié)果都存儲在本地文件件統(tǒng)

C)一個WOrker發(fā)生故障時,該節(jié)點上執(zhí)行完成的Map任務(wù)需要再次執(zhí)行

D)MapReduce具有很強的容錯機制

177.[單選題]離線批處理方案的應(yīng)用場景不包括?

A)占用計算存儲資源多

B)快速高效,實時的數(shù)據(jù)處理

C)數(shù)據(jù)處理格式多樣

D)處理大規(guī)模數(shù)據(jù)

178.[單選題]Hive中distributeby和Sortby的功能結(jié)合的是()

A)orderby

B)sortby

C)distributeby

D)clusterby

179.[單選題]大數(shù)據(jù)在餐飲行業(yè)的應(yīng)用不包括以下哪項?O

A)大數(shù)據(jù)驅(qū)動的團購模式

B)利用大數(shù)據(jù)為用戶推薦消費內(nèi)容

C)利用大數(shù)據(jù)調(diào)整線下門店布局

D)利用大數(shù)據(jù)控制消費人群的口味喜好

180.[單選題]如果x=5.5,則表達式x>0andx==int(x)的運算結(jié)果為;表達式x>0or

x==int(x)的運算結(jié)果為?

A)TrUe、False

B)False,True

C)TrUe、True

D)False,False

181.[單選題]以下語句錯誤的是()

A)selectsal+1fromemp;

B)selectsal*10,sal*deptnofromemp;

C)不能使用運算符號

D)selectsal*10,deptno*10fromemp;

182.[單選題]在一個簡單的線性回歸模型中(只有一個變量),如果將輸入變量改變一個單位

(增加或減少),那么輸出將改變()。

A)一個單位

B)不變

C)截距

D)回歸模型的尺度因子

183.[單選題]MaxCompute中負責(zé)對等待提交的task進行排序的模塊是:()。

A)Worker

B)Executor

C)Scheduler

D)controller

184.[單選題]把圖像分割問題與圖的最小割(mincut)問題相關(guān)聯(lián)的方法是()。

A)基于圖論的分割方法

B)分水嶺算法

OSLIC算法

D)基于閾值的方法

185.[單選題]對于缺失值的處理中,不屬于數(shù)據(jù)補齊的是()

A)熱卡填充

B)期望值最大化方法

C)人工填寫

D)隨機補充

186.[單選題]從數(shù)據(jù)庫架構(gòu)設(shè)計來看,主要有以下哪些設(shè)計思路?

A)Shared-Disk

B)Shared-Everying

C)Shared-Nothing

D)以上全都正確

187.[單選題]下列選項中,若是哪個節(jié)點關(guān)閉了,就無法訪問HadooP集群()。

A)namenode

B)datanode

C)secondarynamenode

D)yarn

188.[單選題]現(xiàn)階段的大數(shù)據(jù)技術(shù)體系主要類型不包括()。

A)數(shù)據(jù)源與App

B)基礎(chǔ)設(shè)施

OHadoop

D)D.數(shù)據(jù)資源

189.[單選題]下面()表示日期和時間的數(shù)據(jù)類型。--

A)DECIMAL(6,2)

B)DATE

OYEAR

D)TIMESTAMP

190.[單選題]在DlKW金字塔中屬于未來的是(一)。

A)信息

B)數(shù)據(jù)

C)知識

D)智慧

191.[單選題]下列選項中適合MapReduce的場景有?

A)實時交互計算

B)迭代計算

C)流式計算

D)離線計算

192.[單選題]綜合類大數(shù)據(jù)應(yīng)用管理主要包括應(yīng)用需求、分析應(yīng)用和O,由互聯(lián)網(wǎng)部統(tǒng)一組織開

展。

A)數(shù)據(jù)安全

B)成果管理

C)商務(wù)拓展

D)推廣應(yīng)用

193.[單選題]大數(shù)據(jù)的起源是()。

A)金融

B)電信

C)互聯(lián)網(wǎng)

D)公共管理

194.[單選題]()表達了在當(dāng)前任務(wù)上任何學(xué)習(xí)算法所能達到的期望泛化誤差的下界,即刻畫了學(xué)習(xí)問

題本身的難度。

A)偏差

B)方差

C)噪聲

D)泛化誤差

195.[單選題]在多元線性回歸模型中,若某個解釋變量對其余解釋變量的判定系數(shù)接近于1,則表明

模型中存在()

A)異方差

B)嘈序列相關(guān)

C)多重共線性

D)高擬合優(yōu)皮

196.[單選題]下列哪一種不屬于Bl工具數(shù)據(jù)集的數(shù)據(jù)字段類型?()

A)文本

B)數(shù)值

C)日期

D)整型

197.[單選題]數(shù)據(jù)科學(xué)是一門以“數(shù)據(jù)”,尤其是“大數(shù)據(jù)”為研究對象,并以數(shù)據(jù)統(tǒng)計、機器學(xué)

習(xí)、數(shù)據(jù)可視化等為理論基礎(chǔ),主要研究數(shù)據(jù)加工、數(shù)據(jù)管理、數(shù)據(jù)計算等活動的(一)o

A)新興科學(xué)

B)交叉性學(xué)科

C)獨立學(xué)科

D)一整套知識體系

198.[單選題]在計算擬合曲線時,如果擬合曲線始終沒有收斂,應(yīng)調(diào)整哪個參數(shù)?

A)增加迭代步數(shù)

B)減少迭代步數(shù)

C)增大收斂系數(shù)

D)減小收斂系數(shù)

199.[單選題]SQL語言的數(shù)據(jù)操縱語句包括SELECT、INSERT、UPDATE、DELETE等。其中最重要的,也

是使用最頻繁的語句是()。

A)UPDATE

B)SELECT

C)DELETE

D)INSERT

200.[單選題]下列算法中,()更適合做時間序列建模。

A)CNN

B)決策樹

C)LSTM

D)貝葉斯算法

201.[單選題]s=On=int(input())foriinrange(1,n+1):al=0forjinrange(1,i+

1):al+=ja=1.0/als+=aprint("s=%.If"%S)當(dāng)輸入的n為4時,輸出S=()。

A)l.5

B)1.4

01.6

D)l.7

202.[單選題]以下可以在字符串中表示單引號的是()。-

A)?"

B)??'

C)?'

D)'

203.[單選題]Spark的技術(shù)架構(gòu)中,SPark核心層的作用是什么?

A)資源管理

B)提供內(nèi)存計算框架

C)提供面向特定類型的計算服務(wù)

D)分布式數(shù)據(jù)存取

204.[單選題]神經(jīng)網(wǎng)絡(luò)研究屬于下列O學(xué)派

A)符號主義

B)連接主義

C)行為主義

D)都不是

205.[單選題]使用似然函數(shù)的目的是()。

A)求解目標(biāo)函數(shù)

B)得到最優(yōu)數(shù)據(jù)樣本

C)找到最適合數(shù)據(jù)的參數(shù)

D)改變目標(biāo)函數(shù)分布

206.[單選題]如果要將讀寫位置移動到文件開頭,需要使用的命令是()。

A)close

B)seek(0)

C)truncate

D)write(1stuff')

207.[單選題]FusionInsightHD中LOader從SFTP服務(wù)器導(dǎo)入文件,如果不需要做編碼轉(zhuǎn)換和數(shù)據(jù)轉(zhuǎn)

換且速度最快,選擇下面哪個文件類型?

A)test_file

B)sequence_file

C)binary_file

D)graph_file

208.[單選題](_)在劃分屬性時是在當(dāng)前結(jié)點的屬性集合中選擇一個最優(yōu)屬性。

A)AdaBoost

B)RF

C)Bagging

D)傳統(tǒng)決策樹

209.[單選題]以下哪些情景可以使用機器學(xué)習(xí)技術(shù)?O

A)記錄過去一段時間內(nèi)某移動運營商客戶轉(zhuǎn)移到競爭對手的案例

B)統(tǒng)計電商網(wǎng)站某類別商品在一定時間內(nèi)的銷量均值

C)統(tǒng)計某零售超市一個月內(nèi)哪類牛奶的銷量最大

D)為攜程在線旅游公司的客戶推薦度假產(chǎn)品

210.[單選題]下列不是數(shù)據(jù)科學(xué)項目的主要角色()。

A)項目發(fā)起人

B)項目經(jīng)理

C)操作員

D)驗收人員

211.[單選題]Python運算符中用來計算集合并集的是()。

A)l

B)&

Oll

D)+

212.[單選題]以下選項哪個是MapReduce正確的運行模型()

?)Reduce-Map-Shuffie

B)Shuffle-Map-Reduce

C)Map-Shuff1e-Reduce

D)Map-Reduce-Shuffie

213.[單選題]下列哪一種命令格式是不正確的()

?)get表行健列族

B)scan表時間戳起始行健結(jié)束行健

C)alter表列族

D)put表行鍵列族:列值

214.[單選題]關(guān)于計算機技術(shù)的描述以下正確的是,:

A)計算機是革命性技術(shù)

B)計算機早于工業(yè)革命時代誕生

C)計算機運行算法的時候跟CPU速度沒關(guān)系

D)計算機不能用來收集數(shù)據(jù)

215.[單選題]下列不屬于無監(jiān)督學(xué)習(xí)方法的是O

A)K-means

B)線性降維

C)DBSCAN

D)支持向量機

216.[單選題]以下()屬于DMM(數(shù)據(jù)管理成熟度模型)中的關(guān)鍵過程域"數(shù)據(jù)戰(zhàn)略"。

A)數(shù)據(jù)戰(zhàn)略制定

B)嘈業(yè)務(wù)術(shù)語表

C)數(shù)據(jù)質(zhì)量評估

D)過程質(zhì)量保障

217.[單選題]優(yōu)化管理體系,實現(xiàn)管理模式從(_)向(_)轉(zhuǎn)變,向各級組織和業(yè)務(wù)賦能。

A)數(shù)據(jù)化,業(yè)務(wù)化

B)平臺化,集約化

C)條塊化,共享化

D)縱向貫通,橫向貫通

218.[單選題]namenode默認的WebUl訪問端口號是()

A)50070

B)50060

C)50050

D)50040

219.[單選題]()選擇成為支持向量機的最大變數(shù)

A)核函數(shù)

B)樣本空間

C)模型

D)算法

220.[單選題]下列描述說法錯誤的是?O

A)SeCUreCRT是一款支持SSH的終端仿真程序,它能夠在WindoWS操作系統(tǒng)上遠程連接LinUX服務(wù)器執(zhí)

行操作。

B)HadOoP是一個用于處理大數(shù)據(jù)的分布式集群架構(gòu),支持在GNU/Linux系統(tǒng)以及WindOWS系統(tǒng)上進行

安裝使用。

C)VMware

D)SSH是一個軟件,專為遠程登錄會話和其他網(wǎng)絡(luò)服務(wù)提供安全性功能的軟件。

221.[單選題]以下哪項用來分組()

A)ORDERBY

B)ORDEREDBY

C)GROUPBY

D)GROUPEDBY

222.[單選題]假設(shè)我們使用原始的非線性可分版本的SOft-SVM優(yōu)化目標(biāo)函數(shù)。我們可通過0來保證

得到的模型是線性可分離的。

A)C=O

B)C=1

C)C正無窮大

D)C負無窮大

223.[單選題]創(chuàng)建分支語句如下,CREATEORREPLACEPROCEDUREproccase,branch(pi_result

ininteger,pi_returnoutinteger)ASBEGINCASEpi_resultWHEN!THENpi_return;=

1:WHEN2THENpi_return:=3:WHEN3THENpireturn:5:WHEN6THENPi_return:-7:WHEN

7THENpi_return

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論