大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案4-2023練習(xí)版_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案4-2023練習(xí)版_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案4-2023練習(xí)版_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案4-2023練習(xí)版_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案4-2023練習(xí)版_第5頁
已閱讀5頁,還剩103頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

試題說明

本套試題共包括1套試卷

答案和解析在每套試卷后

大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案4(500題)

大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案4

L[單選題]下列關(guān)于極大似然估計的描述,錯誤的是()

A)極大似然估計先假定其具有某種確定的概率分布形式

B)極大似然估計沒有確定的概率分布形式巳概率模型的訓(xùn)練過程就是參數(shù)估計

C)貝葉斯學(xué)派認(rèn)為參數(shù)本身也有分布,是未觀察的隨機變量

2.[單選題]當(dāng)前歸結(jié)式是O時,則定理得證。

A)永真式

B)包孕式(subsumed)

C)空子句

3.[單選題]Stage的TaSk的數(shù)量由什么決定()

A)Partition

B)Job

C)Stage

D)TaskScheduler

4.[單選題]在當(dāng)前社會中,最為突出的大數(shù)據(jù)環(huán)境是()

A)互聯(lián)網(wǎng)

B)物聯(lián)網(wǎng)

C)合國力

D)自然資源

5.[單選題IMapReduce通常將輸入的數(shù)據(jù)集分割為一些獨立的(),然后由一些MaP任務(wù)在服務(wù)器

集群上以完全并行的方式進(jìn)行處理。

A)鍵

B)值

C)鍵值對

D)數(shù)據(jù)塊

6.[單選題]Hadoop是一個實現(xiàn)了MaPRedUCe模式的開源的分布式并行的()。

A)編程語言

B)數(shù)據(jù)庫

C)編程范式

D)存儲單元

7.[單選題]信息系統(tǒng)安全等級保護(hù)是指()。

A)對國家安全、法人和其他組織及公民的專有信息以及公開信息和存儲、傳輸、處理這些信息的信

息系統(tǒng)分等級實行安全保護(hù)。

B)對國家安全、法人和其他組織及公民的專有信息以及公開信息和存儲、傳輸、處理這些信息的信

息系統(tǒng)分等級實行安全保護(hù),對信息系統(tǒng)中使用的信息安全產(chǎn)品實行按等級管理。

C)對國家安全、法人和其他組織及公民的專有信息以及公開信息和存儲、傳輸、處理這些信息的信

息系統(tǒng)分等級實行安全保護(hù),對信息系統(tǒng)中使用的信息安全產(chǎn)品實行按等級管理,對信息系統(tǒng)中發(fā)

生的信息安全事件分等級響應(yīng)和處置。

D)對國家安全、法人和其他組織及公民的專有信息以及公開信息和存儲、傳輸、處理這些信息的信

息系統(tǒng)分等級實行安全保護(hù),對信息系統(tǒng)中發(fā)生的信息安全事件分等級響應(yīng)和處置。

8.[單選題]Zookeeper啟動時會最多監(jiān)聽幾個端口()

A)l

B)2

03

D)4

9.[單選題]創(chuàng)建DRDS庫的時候,每個掛載的RDS實例默認(rèn)創(chuàng)建的庫的個數(shù)為:()。

A)16

B)8

04

D)2

10.[單選題]使用類間最大距離法進(jìn)行圖像分割時,下列步驟正確的是①計算相對距離度量值。②給

定一個初始閾值,將圖像分成目標(biāo)和背景兩類。③分別計算出兩類的灰度均值。④選擇最佳的閾值

,使得圖像按照該閾值分成兩類后,相對距離度量值達(dá)到最大。

A)①②③④

B)②①③④

C)②③①④

D)①③②④

11.[單選題]MapReducevl和MapReducev2的主要區(qū)別在哪里?

A)編程模型

B)數(shù)據(jù)處理引擎

C)運行時環(huán)境

D)任務(wù)備份機制

12.[單選題]關(guān)于高偏差說法錯誤的是()

A)、隨著訓(xùn)練樣本數(shù)增多,訓(xùn)練準(zhǔn)確率和交叉驗證準(zhǔn)確率趨于收斂,但與理想取值的偏

差很大

B)、高偏差意味著模型在訓(xùn)練集和交叉驗證集上的準(zhǔn)確率都很低,很可能存在“欠擬合”

現(xiàn)象。

0、造成欠擬合的主要原因有兩個:一是所訓(xùn)練出的模型過于簡單;二是所選擇的特征

32屬性并不提供充分信息,與本模型的功能并不相關(guān)。

D)、高偏差表示對應(yīng)模型很可能存在“過擬合”現(xiàn)象。

13.[單選題]支持向量回歸與傳統(tǒng)回歸模型的差別(一)。

A)模型輸出與真實值相同

B)模型輸出與真實值存在£偏差

C)模型輸出大于真實值

D)模型輸出小于真實值

14.[單選題]世界一流能源互聯(lián)網(wǎng)企業(yè)辦公室統(tǒng)籌組織,下設(shè)技術(shù)組、商務(wù)組和管理優(yōu)化組3個常設(shè)

小組,以下哪個不是管理優(yōu)化組的成員部門O

A)國網(wǎng)互聯(lián)網(wǎng)部

B)國網(wǎng)能源院

C)中國電科院

D)國調(diào)中心

15.[單選題]為提高計算性能,SPark中TranSformatiOn操作采用的是(__)計算模式。

A)活性

B)惰性

C)實時

D)非實時

16.[單選題]關(guān)于hive錯誤的是

A)數(shù)據(jù)存儲在HDFS中

B)通過類SQL語句快速實現(xiàn)MaPRedUCe統(tǒng)計

C)HiVe的設(shè)計目標(biāo)為適用于OLTP業(yè)務(wù)場景

D)不提供行級數(shù)據(jù)更新操作

17.[單選題]在Python3中執(zhí)行以下代碼段a=21b=IOprint(ab)時,輸出為()。

A)True

B)False

C)None

D)Error

18.[單選題]Hadoop中,()執(zhí)行文件系統(tǒng)命名空間操作。

A)DataNode

B)NameNode

C)JobTracker

D)TaskTracker

19.[單選題]一個正常的SPark任務(wù)會產(chǎn)生哪些調(diào)度任務(wù)?

A)DAG

B)RDD

OTask

D)Job

20.[單選題]機器學(xué)習(xí)中,基于樣本分布的距離是()。

A)馬氏距離

B)歐式距離

C)曼哈頓距離

D)閔可夫斯基距離

21.[單選題]數(shù)據(jù)資產(chǎn)維護(hù)是指為保證數(shù)據(jù)質(zhì)量,對數(shù)據(jù)進(jìn)行()等處理的過程。

A)更正

B)刪除

C)補充錄入

D)以上答案都正確

22.[單選題]HBase中數(shù)據(jù)存儲的文件格式是什么?

A)File

B)SequencefiIe

C)Log

D)TXTFiIe

23.[單選題]有關(guān)kmeans算法,正確的說法是?()

Qkmeans算法對異常樣本非常敏感,因此在聚類前要把異常樣本直接刪除。

B)kmeans只能處理凸型分布的非數(shù)值型樣本。

Okmeans聚類的過程與初始的k個假設(shè)的聚類中心的選擇沒關(guān)。

D)kmeans算法需要在聚類前確定類數(shù)k,這個k值需要有助于解釋各類的業(yè)務(wù)含義。

24.[單選題]若是想要實現(xiàn)自定義分組規(guī)則,則需要自定義Class類,然后繼承O類。

A)WritableComparator

B)Comparator

OWritable

D)WritableComparab1e

25.[單選題]下列關(guān)于PandaS庫的說法中正確的是()

A)Pandas中只有兩種數(shù)據(jù)結(jié)構(gòu)

B)PandaS不支持讀取文本數(shù)據(jù)

C)Pandas是在NUmPy基礎(chǔ)上建立的新程序庫

D)PandaS中SerieS和DataFrame可以解決數(shù)據(jù)分析中一切的問題

26.[單選題IFusionnInsigetHD系統(tǒng)中,F(xiàn)lume數(shù)據(jù)流在節(jié)點內(nèi)不需要經(jīng)過哪個組件?

A)Source

B)Sink

C)Topic

D)Channel

27.[單選題]根據(jù)《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》(國發(fā)(2015)50號),大數(shù)據(jù)發(fā)展和應(yīng)用在未來

5T0年確定要逐步實現(xiàn)的目標(biāo)不包括Oo

A)培育高端智能、新興繁榮的產(chǎn)業(yè)發(fā)展新生態(tài)

B)構(gòu)建以人為本、惠及全民的民生服務(wù)新體系

C)建立運行平穩(wěn)、安全高效的經(jīng)濟(jì)運行新機制

D)開啟軍民協(xié)同、軍地兩用的創(chuàng)新驅(qū)動新格局

28.[單選題]以下選項中,哪個程序負(fù)責(zé)HDFS數(shù)據(jù)存儲()。

A)NameNode

B)DataNode

C)Secondary

D)ResourceManager

29.[單選題]以下不屬于大數(shù)據(jù)在社會活動中的典型應(yīng)用的是()。

A)美團(tuán)實現(xiàn)了快速精準(zhǔn)的送餐服務(wù)

B)共享單豐、滴滴打車方便了人們的日常出行

C)快遞實現(xiàn)了訂單的實時跟蹤

D)供電公司提供電費賬單查詢

30.[單選題]HBase獲得COnneCtion連接正確的是()

A)Connectionconn=ConnectionFactory.CreateConnection(conf);

B)Connectionconn=ConnectionFactory.CreateConnectionO;

C)Connectionconn=Connection.CreateConnection(conf);

D)Connectionconn=Connection.CreateConnection();

31.[單選題]下列哪一個不屬于第三次信息化浪潮中新興的技術(shù)?

A)互聯(lián)網(wǎng)

B)云計算

C)大數(shù)據(jù)

D)物聯(lián)網(wǎng)

32.[單選題]若采用留出法將數(shù)據(jù)集D劃分為訓(xùn)練集S和測試集T,其中D包含1300個樣本,S包含700個

樣本,模型在T上有60個樣本分類錯誤,那么該模型的精度為(一)。

A)95.40%

B)90%

C)10%

D)4.90%

33.[單選題]在二分類問題中,當(dāng)測試集的正例和負(fù)例數(shù)量不均衡時,以下評價方案哪個是相對不合

理的()(假設(shè)PreCiSiOn=TP/(TP+FP),recall=TP/(TP+FN)。)

A)Accuracy:(TP+TN)∕all

B)F-value:2*recall*precision/(recal!+precision)

C)G-mean:sqrt(precision*recall)

D)AUC:ROC曲線下面積

34.[單選題]大數(shù)據(jù)的特點不包括下面哪一項()

A)、巨大的數(shù)據(jù)量

B)、多結(jié)構(gòu)化數(shù)據(jù)

C)、增長速度快

D)、價值密度高

35.[單選題]以下Python在數(shù)據(jù)科學(xué)中應(yīng)用的缺點的是()

A)、Python中可用于數(shù)據(jù)科學(xué)的第三方擴展包的數(shù)量多、功能強

B)、Python是一種解釋型語言,因此能較好地支持?jǐn)?shù)據(jù)科學(xué)中的交互式分析任務(wù)

C)、Python編寫的源代碼跨平臺性高,可擴展性和可移植性強

D)、Python代碼不能加密,因此安全性較低

36.[單選題]以下關(guān)于HiVe內(nèi)置函效描述正確的是?

A)to_data():獲取當(dāng)前日期

B)descfunctionsupper:查看系統(tǒng)自帶的函效

C)substr():求字符串長度

D)trim():去除空字符

37.[單選題]下列圖像邊緣檢測算子中抗噪性能最好的是()。

A)梯度算子

B)Prewitt算子

C)Roberts算子

D)Laplacian算子

38.[單選題]MaxCompute中,A和B都是bigint類型,進(jìn)行A/B運算,返回結(jié)果為:()。

A)double

B)int

C)bigint

D)float

39.[單選題]下列關(guān)于Bagging的說法錯誤的是()。

A)各基分類器之間有較強依賴,不可以進(jìn)行并行訓(xùn)練

B)最著名的算法之一是基于決策樹基分類器的隨機森林

C)當(dāng)訓(xùn)練樣本數(shù)量較少時,子集之間可能有重疊

D)為了讓基分類器之間互相獨立,需要將訓(xùn)練集分為若干子集

40.[單選題]Hive將表中的數(shù)據(jù)保存到文本,并使用命令插入到emplOyee表中的命令正確是()

A)loadlocalinpath'∕opt∕data∕test.txt'overwriteintotableemployee;

B)loaddatainpath'∕opt∕data∕test.txt'overwriteintotableemployee;

C)loaddatalocalinpathl∕opt∕data∕test.txt'intotableemployee;

D)loaddatalocalinpath1∕opt∕data∕test.txt'overwriteintotableemployee;

41.[單選題]Hadoop框架中最核心的設(shè)計是什么?

A)為海量數(shù)據(jù)提供存儲的HDFS和對數(shù)據(jù)進(jìn)行計算的MaPRedUCe

B)提供整個HDFS文件系統(tǒng)的NameSPaCe(命名空間)管理、塊管理等所有服務(wù)

C)HadOOP不僅可以運行在企業(yè)內(nèi)部的集群中,也可以運行在云計算環(huán)境中

D)HadooP被視為事實上的大數(shù)據(jù)處理標(biāo)準(zhǔn)

42.[單選題]()算法假設(shè)聚類結(jié)構(gòu)能通過樣本分布的緊密程度確定。

A)原型聚類

B)密度聚類

C)層次聚類

D)模型聚類

43.[單選題]回歸分析的任務(wù),就是根據(jù)()和因變量的觀察值,估計這個函數(shù),并討論與之有關(guān)的種種

統(tǒng)計推斷的問題。

A)相關(guān)變量

B)樣本

C)已知數(shù)據(jù)

D)自變量

44.[單選題]若學(xué)習(xí)如何種瓜,在種瓜過程中不斷摸索,從而總結(jié)出好的種瓜策略。這個過程抽象出

來,就是(_)。

A)機器學(xué)習(xí)

B)深度學(xué)習(xí)

C)強化學(xué)習(xí)

D)有監(jiān)督學(xué)習(xí)

45.[單選題]數(shù)據(jù)產(chǎn)品開發(fā)工作之中需要特別注意的基本活動不包括()。

A)創(chuàng)造性設(shè)計

B)數(shù)據(jù)洞見

C)虛擬化

D)個性化描述

46.[單選題]出現(xiàn)在datanode的VERSloN文件格式中但不出現(xiàn)在namenode的VERSlON文件格式中的是

A)namespaceID

B)StorageID

C)StorageType

D)IayoutVersion

47.[單選題]下面不屬于維歸約方法的是(_)。

A)PCA

B)SVD

ODWT

D)KNN

48.[單選題]以下代碼會打印多少次"ILovePythOn"?While'":print('ILove

Python')print('ILovePython')

A)0

B)100

C)程序錯誤不執(zhí)行

D)l

49.[單選題]關(guān)于“三型兩網(wǎng)”建設(shè),以下()說法不正確:

?)以建設(shè)泛在電力物聯(lián)網(wǎng)為主攻方向

B)進(jìn)一步改造提升傳統(tǒng)業(yè)務(wù)

C)發(fā)揮電網(wǎng)企業(yè)的平臺和資源優(yōu)勢,著力拓展新市場、開辟新領(lǐng)域、打造新業(yè)務(wù)

D)大力開拓互聯(lián)網(wǎng)經(jīng)濟(jì)這一巨大藍(lán)海市場

50.[單選題]具體來說,MaP對數(shù)據(jù)進(jìn)行指定的操作,生成(一)形式的中間結(jié)果。

A)數(shù)組

B)矩陣

0隊列

D)鍵值對

51.[單選題]定義域為{1,2,3}的離散屬性也可稱為稱為(_)。

A)無序?qū)傩?/p>

B)有序?qū)傩?/p>

C)連續(xù)屬性

D)離散屬性

52.[單選題]詞袋模型是在自然語言處理和信息檢索中的一種簡單假設(shè)。在這種模型中,文本(段落

或者文檔)被看作是()的詞匯集合,忽略語法甚至是單詞的順序。

A)無序

B)有序

C)無意義

D)規(guī)范

53」單選題]DougCUtting所創(chuàng)立的項目的名稱都受到其家人的啟發(fā),以下項目不是由他創(chuàng)立的項目

是()

A)Hadoop

B)Nutch

C)Lucene

D)Solr

54.[單選題]下列方法中,可以將字符串中的字母全部轉(zhuǎn)換為大寫的是()。

A)upper()

B)lower()

Otitle()

D)capitalize()

55.[單選題]以下說法正確的是()。

A)關(guān)聯(lián)規(guī)則挖掘過程是發(fā)現(xiàn)滿足最小支持度的所有項集代表的規(guī)則

B)尋找模式和規(guī)則主要是對數(shù)據(jù)進(jìn)行干擾,使其符合某種規(guī)則以及模式

C)數(shù)據(jù)挖掘的主要任務(wù)是從數(shù)據(jù)中發(fā)現(xiàn)潛在的規(guī)律,從而能更好地完成描述數(shù)據(jù)、預(yù)測數(shù)據(jù)等任務(wù)

D)在聚類分析當(dāng)中,簇內(nèi)的相似性越大,簇間的差別越大,聚類的效果就越差

56.[單選題]()對應(yīng)于決策樹結(jié)果,其他節(jié)點對應(yīng)于()。

A)葉節(jié)點,屬性測試

B)根結(jié)點,學(xué)習(xí)測試

C)內(nèi)部節(jié)點,學(xué)習(xí)測試

D)葉節(jié)點,分類測試

57.[單選題]Matplotlib中的legend()函數(shù)的作用是()。

A)設(shè)置標(biāo)簽文本

B)繪制網(wǎng)格線

C)標(biāo)示不同圖形的文本標(biāo)簽圖例

D)設(shè)置X軸的數(shù)值顯示范圍

58.[單選題]下列不屬于專家系統(tǒng)的解釋功能的主要作用是()。

A)對用戶說明為什么得到這個結(jié)論

B)對用戶說明如何得到這個結(jié)論

C)提高專家系統(tǒng)的信賴程度

D)對用戶說明專家系統(tǒng)的知識結(jié)構(gòu)

59.[單選題]執(zhí)行一個job,如果這個job的輸出路徑已經(jīng)存在,那么程序會()。

A)覆蓋這個輸出路徑

B)拋出警告,但是能夠繼續(xù)執(zhí)行

C)拋出一個異常,然后退出

D)創(chuàng)建一個新的輸出路徑

60.[單選題]Spark那個組件用于支持實時計算需求()

A)SparkSQL

B)SparkStreaming

C)SparkGraphX

D)SparkMLLib

61.[單選題]在“大數(shù)據(jù)財務(wù)分析”的可視化模塊中,下列說法錯誤的是()

A)每一個圖表類型均可以設(shè)置其圖形屬性

B)每一個圖表類型均可以設(shè)置其組件樣式

C)絕大部分的圖表在坐標(biāo)系中完成,坐標(biāo)系主要由橫軸與縱軸組成

D)一個坐標(biāo)系中只允許設(shè)置一個參數(shù)(維度或指標(biāo))

62.[單選題]numPy對數(shù)組進(jìn)行排序用什么函數(shù)?

A)np.sqrt()

B)np.eye()

C)np.identity()

D)np.sort()

63.[單選題]可視化中的組件樣式不包括()

A)標(biāo)題

B)自適應(yīng)顯示

C)標(biāo)簽

D)軸線

64.[單選題]()分類方法可以較好地避免樣本的不平衡問題

A)KNN

B)SVM

C)Bayes

D)神經(jīng)網(wǎng)絡(luò)

65.[單選題]在HDFS的數(shù)據(jù)讀取過程中,客服端首先調(diào)用。的實例的。pen()方法打開一個文件。

A)DistributedFiIeSystem

B)FileSystem

C)FSDataOutputStream

D)FSDataInputStream

66.[單選題]在HadooP框架中(—)為大數(shù)據(jù)提供了計算。

A)HDFS

B)MapReduce

C)YARN

D)Container

67.[單選題]以下描述中,哪一個選項屬于HDFS的使用場景?

A)海量氣象數(shù)據(jù)存儲

B)社交媒體數(shù)據(jù)流式分析

C)數(shù)據(jù)采集與開發(fā)

D)集群資源調(diào)配管理

68.[單選題]數(shù)據(jù)倉庫是隨著時間變化的,下面的描述不正確的是()。

A)數(shù)據(jù)倉庫隨時間的變化不斷增加新的數(shù)據(jù)內(nèi)容

B)捕捉到的新數(shù)據(jù)會覆蓋原來的快照

C)數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容

D)數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會隨著時間的變化不斷地進(jìn)行重新綜合

69.[單選題]學(xué)習(xí)率對機器學(xué)習(xí)模型結(jié)果會產(chǎn)生影響,通常希望學(xué)習(xí)率()

A)越小越好

B)越大越好

C)較小而選代次數(shù)較多

D)較大而選代次數(shù)較小

70.[單選題]Gateway在EIaStiCSearCh中的含義是?

A)網(wǎng)關(guān)

B)素引的存儲方式

C)rpc請求接

D)索引快照的存儲方式

71.[單選題]下列關(guān)于支持向量機優(yōu)化性問題的形式,說法正確的是()。

A)它是一個凸二次規(guī)劃問題

B)它是一個凸一次規(guī)劃問題

C)它是一個凹二次規(guī)劃問題

D)它是一個凹一次規(guī)劃問題

72.[單選題]Matplotlib的核心是面向()。

A)過程

B)對象

C)結(jié)果

D)服務(wù)

73.[單選題]國家電網(wǎng)有限公司數(shù)據(jù)管理辦法規(guī)定,在集中共享、服務(wù)應(yīng)用方面,依托全業(yè)務(wù)統(tǒng)一數(shù)

據(jù)中心和O進(jìn)行數(shù)據(jù)歸集、共享應(yīng)用,推動跨專業(yè)數(shù)據(jù)貫通融合。

A)企業(yè)中臺

B)業(yè)務(wù)中臺

C)數(shù)據(jù)中臺

D)國網(wǎng)云

74.[單選題]在HDFS中()是文件系統(tǒng)的工作節(jié)點。

A)DataNode

B)Client

ONameNode

D)Flume

75.[單選題]面向?qū)ο蟪绦蛟O(shè)計的缺點是(一)。

A)可擴展性

B)編程復(fù)雜度

C)共享性

D)易維護(hù)性

76.[單選題]圍繞()大領(lǐng)域開展泛在電力物聯(lián)建設(shè)任務(wù)

A)五

B)六

C)四

D)八

77.[單選題]kNN最近鄰方法在()情況下效果較好。

A)樣本較多但典型性不好

B)樣本較少但典型性好

C)樣本呈團(tuán)狀分布

D)樣本呈鏈狀分布

78.[單選題]從源數(shù)據(jù)源系統(tǒng)抽取目的數(shù)據(jù)源系統(tǒng)需要的數(shù)據(jù)這一過程稱為(—)。

A)數(shù)據(jù)抽取

B)數(shù)據(jù)轉(zhuǎn)換

C)數(shù)據(jù)加載

D)數(shù)據(jù)存儲

79.[單選題]下列關(guān)于IPython的說法,錯誤的是()

A)IPython集成了交互式Python的很多優(yōu)點

B)IPython的性能遠(yuǎn)遠(yuǎn)優(yōu)于標(biāo)準(zhǔn)的PythOn的Shell

C)IPythOn支持變量自動補全,自動收縮

D)與標(biāo)準(zhǔn)的PythOn相比,IPython缺少內(nèi)置的功能和函數(shù)

80.[單選題]下列屬于無監(jiān)督學(xué)習(xí)的是()。

A)K-means

B)SVM

C)最大蜻

D)CRF

8L[單選題]以下描述中不正確的是(—)o

A)歸納是指從特殊到一般的泛化過程

B)歸納是指從具體的事實歸結(jié)出一般性規(guī)律

C)演繹是指從特殊到一般的特化過程

D)演繹是指從基礎(chǔ)原理推演出具體情況

82.[單選題]內(nèi)外部合作單位和供應(yīng)商的數(shù)據(jù)安全管理過程中,應(yīng)確保內(nèi)部合作單位開發(fā)測試環(huán)境與

互聯(lián)網(wǎng)O,嚴(yán)禁外部合作單位、技術(shù)支持單位和供應(yīng)商在對互聯(lián)網(wǎng)提供服務(wù)的網(wǎng)絡(luò)和信息系統(tǒng)中

存儲或運行公司商業(yè)秘密數(shù)據(jù)和重要數(shù)據(jù)。

A)物理隔離

B)邏輯隔離

C)相互連接

D)間接連接

83.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,集團(tuán)圖譜頁面右側(cè)展示【放大】、【縮小】、

【刷新】、【展開】4個按鈕,其中具有“將展示的集團(tuán)圖譜刷新,并將其恢復(fù)到剛進(jìn)入頁面時的狀

態(tài)”功能的是O按鈕。

A)放大

B)B.縮小

OC.刷新

D)D.展開

84.[單選題]ApacheKUdU是通過什么方式來提高OLAP性能的?

A)預(yù)計算

B)列式存儲

C)內(nèi)存存儲

D)硬件加速

85.[單選題]下列代碼的運行結(jié)果是()。print('a'<'b'<'c')

A)a

B)b

OO

D)l

86.[單選題]Sqoop將導(dǎo)入或?qū)С雒罘g成什么程序來實現(xiàn)導(dǎo)入導(dǎo)出()

A)Spark

B)Storm

OMapReduce

D)Tez

87.[單選題]依托(),結(jié)合應(yīng)用推進(jìn)數(shù)據(jù)歸集,形成統(tǒng)一的數(shù)據(jù)資源中心。

A)全業(yè)務(wù)數(shù)據(jù)中心和數(shù)據(jù)平臺

B)營銷基礎(chǔ)數(shù)據(jù)平臺和大數(shù)據(jù)平臺

C)全業(yè)務(wù)中心和營銷基礎(chǔ)數(shù)據(jù)平臺

D)全業(yè)務(wù)數(shù)據(jù)中心和大數(shù)據(jù)平臺

88.[單選題]按粒度大小的順序,HiVe數(shù)據(jù)被分為:數(shù)據(jù)庫.數(shù)據(jù)表.()?桶?

A)元祖

B)欄

C)分區(qū)

D)行

89.[單選題]下列關(guān)于FIinkbarrier描述錯誤的是:()。

A)barrier周期性的插入到數(shù)據(jù)流中,并作為數(shù)據(jù)流的一部分隨之流動

B)barrier是Flink快照的核心

C)一個barrier將本周期快照的數(shù)據(jù)與下一周期快照的數(shù)據(jù)分隔開來

D)在插入barrier的時候,會暫時阻斷數(shù)據(jù)

90.[單選題]Hadoop平臺中;要查看YARN服務(wù)中一個application的信息;通常需要使用什么命令

A)container

B)applIcationattermpt

C)jar

D)application

91.[單選題]下列關(guān)于熱力點圖的說法中,錯誤的是()

A)熱力點圖是指根據(jù)數(shù)據(jù)的結(jié)果、以不同熱力色展示出數(shù)據(jù)大小的圖表

B)在熱力點圖中,顏色越熱烈往往意味著數(shù)值越大

C)我們可以設(shè)置熱力點圖中的點的大小,使其反應(yīng)出原始數(shù)據(jù)中其他指標(biāo)的狀況

D)熱力點圖中無法設(shè)置標(biāo)簽屬性

92.[單選題]下列程序執(zhí)行后輸出的結(jié)果為()X='abc,Y=XY=IOOPrint(X)

A)“abc”

B)100

097,98,99

D)以上三項均錯誤

93.[單選題]下列說法哪項有誤?

A)相對于SPark來說,使用HadOOP進(jìn)行迭代計算非常耗資源

B)SPark將數(shù)據(jù)載入內(nèi)存后,之后的迭代計算都可以直接使用內(nèi)存中的中間結(jié)果作運算,避免了從磁

盤中頻繁讀取數(shù)據(jù)

C)HadOoP的設(shè)計遵循“一個軟件棧滿足不同應(yīng)用場景”的理念

D)SPark可以部署在資源管理器YARN之上,提供一站式的大數(shù)據(jù)解決方案

94.[單選題]Hive交互ShelI指執(zhí)行$HlVEjOME∕bin∕hive之后,交互式命令行的提示符是()

A)help>

B)hive>

C)user>

D)cmd>

95.[單選題]HBase在新建表的時候必須指定表名和(),不需要指定列,所有的列在后續(xù)添加數(shù)據(jù)的

時候動態(tài)添加。

A)行

B)單元格

C)時間戳

D)列族

96.[單選題]以下選項中由客戶端編碼決定的是()。-

A)CharaCtejSet.server

B)character_set_database

C)CharaCtejsets_dir

D)character_set_results

97.[單選題]preprocessing,normalize。函數(shù)中的norm參數(shù)代表(—)。

A)需要正則化的對象

B)正則化的方式

C)對象的大小

D)返回值的維度

98.[單選題]執(zhí)行一個job,如果這個job的輸出路徑已經(jīng)存在,那么程序會()。

A)覆蓋這個輸出路徑

B)拋出警告,但是能夠繼續(xù)執(zhí)行

C)拋出一個異常,然后退出

D)創(chuàng)建一個新的輸出路徑

99.[單選題]3**3的結(jié)果為(—)。

A)l

B)3

09

D)27

100.[單選題]循環(huán)神經(jīng)網(wǎng)絡(luò)簡寫是O

A)CNN

B)RNN

OLSTM

D)SRN

IOL[單選題]開發(fā)MaXComPUte的用戶自定義標(biāo)量函數(shù),主要是實現(xiàn)其中的()方法。

A)evaluate

B)main

C)iterate

D)process

102.[單選題]運行下面代碼,輸出結(jié)果是()。

Importnumpyasnp

N=np.array([El,2,3],[4,5,6]])print(n.size)

A)2

B)6

C)(2,3)

D)(3,2)

103.[單選題]在一些算法中,為了進(jìn)行屬性之間的比較或運算,需要把不同屬性的不同變量取值范

圍變換成同一范圍,以免使得結(jié)果發(fā)生扭曲,偏向取值范圍大的變量這一過程稱為()。

A)合并

B)嘈數(shù)據(jù)聚合

C)歸一化

D)數(shù)據(jù)處理

104.[單選題]查找數(shù)據(jù)庫中所有的數(shù)據(jù)表用以下哪一項()

A)SHOWDATABASE

B)SHOWTABLES

C)SHOWDATABASES

D)SHOWTABLE

105.[單選題]SciPy庫中用于物理和數(shù)學(xué)常量計算的模塊是(_)。

A)scipy.cluster

B)scipy.io

C)scipy.constants

D)scipy.Iinalg

106.[單選題]企業(yè)中臺是一種實現(xiàn)公司核心資源共享化、服務(wù)化的理念和模式,從管理視角上強調(diào)

O,從技術(shù)視角上強調(diào)OO

A)服務(wù)化、企業(yè)級

B)企業(yè)級、服務(wù)化

C)共享化、服務(wù)化

D)服務(wù)化、共享化

107.[單選題]下面關(guān)于關(guān)系數(shù)據(jù)庫特點的描述,錯誤的是:O

A)采用表格的儲存方式,數(shù)據(jù)以行和列的方式進(jìn)行存儲,要讀取和查詢都方便

B)為了規(guī)范化數(shù)據(jù)、減少重復(fù)數(shù)據(jù)以及利用好存儲空間,把數(shù)據(jù)按照蟻小關(guān)系表的形式進(jìn)行存儲

C)由于關(guān)系數(shù)據(jù)庫將數(shù)據(jù)存儲在數(shù)據(jù)表中,數(shù)據(jù)操作的瓶頸出現(xiàn)在多張數(shù)據(jù)表的操作中.而且數(shù)據(jù)

表越多這個問題越嚴(yán)重

D)關(guān)系數(shù)據(jù)庫采用非結(jié)構(gòu)化查詢語言來對數(shù)據(jù)庫進(jìn)行查詢

108.[單選題]執(zhí)行以下代碼段importmathprint(math,modf(2.0))時,輸出為()0

A)(0.0,1.0)

B)(1.0,0.0)

C)(0.0,2.0)

D)(2.0,0.0)

109.[單選題]下列關(guān)于Numpy中秩(rank)的說法正確的是()。

A)在Numpy數(shù)組中,秩(rank)和形狀類似

B)在Numpy數(shù)組中,秩(rank)和軸是一個概念

C)在Numpy數(shù)組中,維數(shù)稱為秩(rank),一維數(shù)組的秩為1,二維數(shù)組的秩為2,以此類推

D)在Numpy數(shù)組中,沒有秩(rank)這個概念

110.[單選題]關(guān)于機器學(xué)習(xí)中的目標(biāo)函數(shù),說法錯誤的是()

A)、目標(biāo)函數(shù)(TA、rgetFunC,tion)又稱為"評價函數(shù)(EvA、IUA、tionFUnC、tion)w

B)、是機器學(xué)習(xí)算法中需要最大化或最小化一個函數(shù)

C)、可以直接、精確地表示目標(biāo)函數(shù)

D)、目標(biāo)函數(shù)包含誤差函數(shù)和正則化項。

Ill.[單選題]在HBaSe數(shù)據(jù)模型中,不可以作為行鍵的是。。

A)字符串

B)整數(shù)

C)二進(jìn)制串

D)并行化的結(jié)構(gòu)

112.[單選題]泛在電力物聯(lián)網(wǎng)的總體架構(gòu),以下哪個不是外部客戶O

A)能源供應(yīng)商

B)政府部門

C)能源服務(wù)商

D)生產(chǎn)客戶

113.[單選題]函數(shù)如下defchanagelnt(number2):number2=number2+lprintCchangeInt:

number2=",number2)#調(diào)用number1=2chanagelnt(numberl)print("nUInber:",numberl)打印結(jié)果

哪項是正確的()

A)changelnt:number2=3number:3

B)changelnt:number2=3number:2

C)number:2changelnt:number2=2

D)number:2changelnt:number2=3

∏4.[單選題]由于大數(shù)據(jù)要處理大量、非結(jié)構(gòu)化的數(shù)據(jù),所以在各處理環(huán)節(jié)中都可以采用()處理

A)串行

B)并行

C)邏輯

D)科學(xué)

115.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,從【集團(tuán)客戶管理】節(jié)點路徑進(jìn)入集團(tuán)圖譜

,在修訂模式下的集團(tuán)圖譜頁面,對于【行內(nèi)客戶已認(rèn)定】節(jié)點下的O客戶,鼠標(biāo)右鍵單擊,鼠

標(biāo)箭頭右下角除懸浮【新增】按鈕外,還懸浮【添加到信貸關(guān)系中】按鈕,點擊此按鈕,可將此節(jié)

點的未認(rèn)定客戶添加至【集團(tuán)家譜】菜單的集團(tuán)成員列表中。

A)行內(nèi)客戶未認(rèn)定

B)B.核心企業(yè)

OC.行內(nèi)客戶已認(rèn)定

D)D.行內(nèi)客戶認(rèn)定中

116.[單選題]下列關(guān)于Python中的OS模塊常見方法的描述錯誤的是()。

A)os.remove()刪除文件

B)os.rename()重命名文件

C)os.walk()讀取所有的目錄名

D)os.chdir()改變目錄

117.[單選題]執(zhí)行引擎的類型包括:()。

A)行執(zhí)行引擎

B)向量化執(zhí)行引擎

C)行列混合執(zhí)行引擎

D)以上都是

118.[單選題]對ElaStiCSearCh檢索流程描述正確的是?

A)檢索節(jié)點匯總結(jié)果發(fā)送給客戶端

B)分片節(jié)點不需要匯總結(jié)果直接把結(jié)果發(fā)送給客戶端

C)分片節(jié)點匯總結(jié)果發(fā)送給客戶端

D)檢索節(jié)點不需要匯總結(jié)果直接把結(jié)果發(fā)送給客戶端

119.[單選題]HDFS讀取文件時用的是哪一個read方法?

A)DataInputStream

B)FSDataInputStreani

C)DataOutputStream

D)FSDataOutputStream

120.[單選題]在WebHCat架構(gòu)中,用戶能夠通過安全的HTTPS協(xié)議執(zhí)行以下()操作。

A)執(zhí)行HiVeDDL操作

B)運行MaPRedUCe任務(wù)

C)運行HiVeSQL任務(wù)

D)以上全部正確

121.[單選題]以下程序的輸出結(jié)果是:d={"zhang":"China","Jone":"America",

"Natan":"Japan"}print(max(d),min(d))

A)JapanAmerica

B)zhang:ChinaJone=America

C)ChinaAmerica

D)zhangJone

122.[單選題]下列有關(guān)HiVe建表語句寫法正確的是CJ0

A)NEWTABLEemployees(empIDINT,nameSTRING);

B)CREATETABLEemployees(empIDINT,nameSTRING);

ONEWTABLEemployees(INTempID,STRINGname);

D)CREATETABLEemployees(INTempID,STRINGname);

123.[單選題]下面哪個不屬于RedUCer階段O

A)Shuffle

B)Sort

OMap

D)Reduce

124.[單選題]下列不屬于聚類性能度量外部指標(biāo)的是(_)。

A)JaCCard系數(shù)

B)FM系數(shù)

C)Rand指數(shù)

D)DB指數(shù)

125.[單選題]在Windows系統(tǒng)中,關(guān)閉Python終端會話常用的快捷鍵是()。

A)Ctrl+C

B)Ctrl+D

C)Ctrl+E

D)Ctrl+Z

126.[單選題]假設(shè)有n組數(shù)據(jù)集,每組數(shù)據(jù)集中X的平均值都是9,X的方差都是11,y的平

均值都是7.50,X與y的相關(guān)系數(shù)都是0.816,擬合的線性回歸方程都是y=3.00+0.500x。那么這

n組數(shù)據(jù)集()。

A)一樣

B)不一樣

C)無法確定是否一樣

D)以上都不對

127.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,系統(tǒng)在【客戶信息管理】一級菜單下增加【

征信報告查詢管理】二級菜單,用戶可在此菜單下發(fā)起征信報告查詢申請,以及查看審批批準(zhǔn)客戶

的征信報告。該菜單下設(shè)置【待處理的征信報告】、【審批中的征信報告】等O個節(jié)點,對應(yīng)征

信報告查詢申請的各節(jié)點。

A)l

B)B.2

OC.3

D)D.4

128.[單選題]scipy.StatS模塊中隨機變量的概率密度函數(shù)是什么?

A)stats

B)fit

C)pdf

D)ppf

129.[單選題]在HBaSe系統(tǒng)架構(gòu)中,HBaSe中最核心的模塊是()

A)HMaster

B)HRegionServer

C)ZooKeeper

D)Client

130.[單選題]下列對于等距離散化和等頻離散化的敘述中,不正確的是O

A)等距離散化是將連續(xù)型特征的取值區(qū)間均勻的劃分成多個區(qū)間段

B)等距離散化對數(shù)據(jù)離群值不敏感

C)等頻離散化考慮了區(qū)間段中的樣本個數(shù),使每個區(qū)間段的樣本數(shù)相同

D)等頻離散化會將相似的樣本劃分到不同的區(qū)間

131.[單選題]完全不考慮程序的內(nèi)部結(jié)構(gòu)和內(nèi)部特征,而只是根據(jù)程序功能導(dǎo)出測試用例的測試方

法是

A)錯誤推測法

B)白箱測試法

C)黑箱測試法

D)安裝測試法

132.[單選題]以下哪種方法屬于判別式模型(discriminativemodel)

A)隱馬模型(HMM)

B)樸素貝葉斯

C)LDA

D)支持向量機

133.[單選題]Namenode在啟動時自動進(jìn)入安全模式,在安全模式階段,說法錯誤的是()

A)安全模式目的是在系統(tǒng)啟動時檢查各個DataNOde上數(shù)據(jù)塊的有效性

B)根據(jù)策略對數(shù)據(jù)塊進(jìn)行必要的復(fù)制或刪除

C)當(dāng)數(shù)據(jù)塊最小百分比數(shù)滿足的最小副本數(shù)條件時,會自動退出安全模式

D)文件系統(tǒng)允許有修改

134.[單選題]線性判別分析是一種經(jīng)典的(_)學(xué)習(xí)方法。

A)線性

B)非線性

C)聚類

D)降維

135.[單選題]()不是HDFS的設(shè)計目標(biāo)。

A)流式數(shù)據(jù)訪問

B)大規(guī)模數(shù)據(jù)集

C)移動計算

D)”多次寫入,多次讀取”的文件訪問模型

136.[單選題]機器學(xué)習(xí)是對于一個計算機程序給定一個()和一個(),如果在()的影響下,P對

T的測量結(jié)果得到了改進(jìn),則可以認(rèn)為程序在E中學(xué)習(xí)了。

A)經(jīng)驗E、性能測量方法P、任務(wù)T

B)任務(wù)T、性能測量方法P、經(jīng)驗E

C)任務(wù)T、經(jīng)驗E、性能測量方法P

D)性能測量方法P、經(jīng)驗E、任務(wù)T

137.[單選題]Action是RDD的算子的一個類型,不可以將結(jié)果寫入O.

A)磁盤

B)CPU

OHDFS

D)數(shù)據(jù)庫

138.[單選題]對于ADS,()說法不正確。

A)ADS表存在主鍵,即可根據(jù)主鍵使用delete刪除紀(jì)錄

B)普通表分區(qū)列如果是字符串型,則不支持普通表之間的join

C)自查詢之間不支持join

D)ADS通過UNlON(ALL)各個分區(qū)內(nèi)的查詢結(jié)果實現(xiàn)自查詢

139.[單選題]資源注冊頁面,點擊Solr增量索引的作用是:()。

A)創(chuàng)建索引

B)增加索引

C)更新索引

D)刪除索引

140.[單選題]用戶輸入整數(shù)的時候不合規(guī)導(dǎo)致程序出錯,為了不讓程序異常中斷,需要用到的語句

是:

A)if語句

B)eval語句

C)try-except語句

D)循環(huán)語句

141.[單選題]()不是Hive支持的數(shù)據(jù)類型。

Λ)Struct

B)Int

OMap

D)Long

142.[單選題]以下關(guān)于異常處理try語句塊的說法,不正確的是。。

A)finalIy語句中的代碼段始終要被執(zhí)行

B)一個try塊后接一個或多個except塊

C)一個try語句塊后接一個或多個finalIy塊

D)try塊必須與except或finalIy塊一起用

143.[單選題]下面關(guān)于分析學(xué)習(xí)描述正確的是(_)。

A)分析學(xué)習(xí)的缺陷在于不完美的領(lǐng)域理論

B)分析學(xué)習(xí)的目標(biāo)是擬合數(shù)據(jù)假設(shè)

C)分析學(xué)習(xí)通過演繹推理

D)分析學(xué)習(xí)無需先驗知識

144.[單選題]RDD中的數(shù)據(jù)被()在集群中,使得任務(wù)可以并行執(zhí)行。

A)順序存儲

B)連續(xù)存儲

C)分塊存儲

D)分區(qū)存儲

145.[單選題]以下是字符轉(zhuǎn)換成字節(jié)的方法是

A)decode()

B)encode()

C)upper()

D)rstrip()

146.[單選題]大數(shù)據(jù)產(chǎn)業(yè)全景圖中包含以下選項():1.基礎(chǔ)設(shè)施;2.企業(yè)應(yīng)用;3.分析工具;4.行

業(yè)行為;5.開源工具;6.數(shù)據(jù)資源;7.跨平臺基礎(chǔ)設(shè)施和分析工具;8.數(shù)據(jù)源和APPs。

A)1234

B)12345678

02345678

D)5678

147.[單選題]Kafa集群在運行期間,直接依賴于下面哪些組件?

A)spark

B)zookeeper

Ohdfs

D)hbase

148.[單選題]將兩篇文本通過詞袋模型變?yōu)橄蛄磕P?,通過計算向量的()來計算兩個文本間的相

似度。

A)正弦距離

B)余弦距離

C)長度

D)方向

149.[單選題]下列選項中,不屬于個人隱私的是OO

A)個人工作職責(zé)

B)個人健康狀況

C)個人位置信息

D)個人家庭信息

150.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,在征信報告頁面,點擊底部【打印報告】按

鈕,彈出打印機選擇頁面。用戶在彈出的打印機選擇頁面,選擇O項,點擊【打印】按鈕,選擇

保存路徑,即可保存PDF版本征信報告文件到指定路徑。

A)Fax

B)B.MicrosoftprinttoPDF

C)C.MicrosoftXPSDocumentWriter

D)D.OneNote

151.[單選題]以下acl授權(quán)里,()是對MaXComPUte的表賦予SeIeet權(quán)限。

A)grantreadontabletable_nametouser<full_name>

B)grantselectontabletable_nametouser<full_name>

C)grantreadonprojectproject_nametouser<fule_name>

D)grantdesconprojectproject_nametouser<fule_name>

152.[單選題]可用信息增益來進(jìn)行決策樹的(_)。

A)樹高

B)葉子結(jié)點數(shù)

C)總結(jié)點數(shù)

D)劃分屬性選擇

153.[單選題]MapReduce里面的query、SOrt和Iimit等都是針對哪個階段的操作?

?)Map()之前

B)Reduce()之前

C)Reduce()之后

D)finalize()之后

154.[單選題]下列代碼執(zhí)行結(jié)果是()0[i*iforiinrange(3)]

A)[l,1,4]

B)[O,1,4]

C)[1,2,3]

D)(l,1,4)

155.[單選題]SQL語言集數(shù)據(jù)查詢、數(shù)據(jù)操縱、數(shù)據(jù)定義和數(shù)據(jù)控制功能于一體,其中,CREATE、

DROP、ALTER語句是實現(xiàn)哪種功能()

A)數(shù)據(jù)操縱

B)數(shù)據(jù)控制

C)數(shù)據(jù)定義

D)數(shù)據(jù)查詢

156.[單選題]Flume中最小的獨立運行單位是()。

A)Source

B)Agent

C)Channel

D)Sink

157.[單選題]隱馬爾可夫模型是一種著名的(_)模型。

A)無向圖

B)有向圖

C)樹形圖

D)環(huán)形圖

158.[單選題]依托(),結(jié)合應(yīng)用推進(jìn)數(shù)據(jù)歸集,形成統(tǒng)一的數(shù)據(jù)資源中心。

A)全業(yè)務(wù)數(shù)據(jù)中心和數(shù)據(jù)平臺

B)營銷基礎(chǔ)數(shù)據(jù)平臺和大數(shù)據(jù)平臺

C)全業(yè)務(wù)中心和營銷基礎(chǔ)數(shù)據(jù)平臺

D)企業(yè)務(wù)數(shù)據(jù)中心和大數(shù)據(jù)平臺

159.[單選題]執(zhí)行以下代碼段ClaSSchange:def—init_(self,x,y,z):self,a=χ+y**

zx=change(1,2,3)y=getattr(x,'a')setattr(x,'a',y+I)Print(x.a)時,輸出為

(一)o

A)7

B)8

C)9

D)10

160.[單選題]查找數(shù)據(jù)表中的記錄用以下哪一項()

A)ALTRE

B)UPDATE

C)SELECT

D)DELETE

161.[單選題]在SPark技術(shù)中,RDD實現(xiàn)了用戶的邏輯,而(_)是StOrage模塊與其他模塊交互最

主要的類,它提供了讀和寫B(tài)lOCk的接口。

A)org.apache,spark,storage.Block

B)org.spark,storage.BlockManager

C)org.apache,spark.BlockManager

D)org.apache,spark,storage.BlockManager

162.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,日常工作提示(預(yù)警)中,外部風(fēng)險信息提

示近O天的外部風(fēng)險信息。

A)15

B)B.30

OC.60

D)D.90

163.[單選題]可以對用戶的行為或相關(guān)事件進(jìn)行實時監(jiān)測和分析的產(chǎn)品的是:()。

A)AnalyticDB

B)流計算

OMaxCompute

D)TS

164.[單選題]關(guān)于基于HadoOP的MaPRedUCe編程的環(huán)境配置,下面哪一步是不必要的。

A)安裝IinUX或者在WindOWS下安裝CgyWin

B)安裝java

C)安裝MaPRedUCe

D)配置HadOOP參數(shù)

165.[單選題]matplotlib中設(shè)置X軸數(shù)值顯示范圍的函數(shù)是什么()

A)xrange()

B)xspan()

C)xlabel()

D)xlim()

166.[單選題]Maxcompute項目Prjl中存在表t,同時使用下述SQL創(chuàng)建視圖v:createviewvas

select*fromt;Prjl的OWner把視圖V的讀權(quán)限賦給了用戶AIiCe,以下()說法是正確的。

A)因為沒有表t的訪問權(quán)限,所以AliCe無法訪問視圖V

B)由于權(quán)限的依賴關(guān)系,AIiCe既可以訪問視圖V又可以表t

C)AIiCe可以通過訪問視圖V來查詢表t的數(shù)據(jù)

D)AliCe可以訪問表t,因為她具有了視圖V的訪問權(quán)限,自然獲得了表t的訪問權(quán)限

167.[單選題]Flink中的答案:接口用于流數(shù)據(jù)處理,答案:接口用于批處理?

A)DataBatchAPI1DataStreamAPI

B)StreamAPI,BatchAPI

C)DataStreamAPI,DataSetAPI

D)BatchAPI,StreamAPI

168.[單選題]HDFS默認(rèn)的最基本的儲存單位是?

A)數(shù)據(jù)塊

B)元數(shù)據(jù)節(jié)點

C)數(shù)據(jù)節(jié)點

D)從元數(shù)據(jù)節(jié)點

169.[單選題]()不可以直接來對文本分類。

A)K-means

B)決策樹

C)支持向量機

D)KNN

170.[單選題]HBase在新建表的時候必須指定表名和(),不需要指定列,所有的列在后續(xù)添加數(shù)據(jù)

的時候動態(tài)添加。

A)行

B)單元格

C)時間戳

D)列族

171.[單選題]()與HDFS類似。

A)NTFS

B)FAT32

OGFS

D)EXT3

172.[單選題]實時處理的步驟中,實時計算的前一步是以下哪一項?.

A)實時展示

B)實時緩存存儲

C)實時采集

D)實時落地

173.[單選題]以下哪一項不屬于HadOoP可以運行的模式。

A)單機(本地)模式

B)偽分布式模式

C)互聯(lián)模式

D)分布式模式

174.[單選題]大數(shù)據(jù)時代,數(shù)據(jù)使用的關(guān)鍵是

A)數(shù)據(jù)收集

B)數(shù)據(jù)存儲

C)數(shù)據(jù)分析

D)數(shù)據(jù)再利用

175.[單選題]DataFrame和RDD最大的區(qū)別()

A)科學(xué)統(tǒng)計支持

B)多了schema

C)存儲方式不一樣

D)外部數(shù)據(jù)源支持

176.[單選題]Python中使用()轉(zhuǎn)義字符。

A)/

B)?

0$

D)%

177.[單選題]kafka-clustermirroring工具可以實現(xiàn)以下那些功能?

A)kafka集群數(shù)據(jù)同步方案

B)kafka單集群內(nèi)數(shù)據(jù)備份

Okafka單集群內(nèi)數(shù)據(jù)恢復(fù)

D)以全部不對

178.[單選題]通過DMS()管理其他阿里云帳號下的RDS實例。

A)只要有數(shù)據(jù)庫帳號即可管理

B)通過DMS”實例授權(quán)”功能授權(quán)后即可管理

C)完全不可以

D)通過RAM授權(quán)后才能管理

179.[單選題]()是一個分布式的基于發(fā)布/訂閱模式的消息隊列。

A)Flume

B)Kafka

C)Zookeeper

D)Hive

180.[單選題]在【連接】面板,join條件中輸入正確的一項是()

A)'差旅費超額百分比'.userid='用戶'.id

B)“差旅費超額百分比.userid=用戶.id”

C)“差旅費超額百分比.userid==用戶.id”

D)''差旅費超額百分比''.userid=''用戶''.id

181.[單選題]以下關(guān)于數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)訪問權(quán)限的說法正確的有Oo

A)數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)權(quán)限賬號僅供責(zé)任人登錄使用,不得借與他人

B)數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)權(quán)限賬號密碼不超過6個月要更換一次

C)為了保密,對數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)權(quán)限賬號的登錄時間、時長等實行無痕跡管理

D)數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)訪問權(quán)限實行匿名制管理

182.[單選題]下列代碼中輸出結(jié)果是False的是()。

A)?>5isnot4

B)>>>5!=4

C)>>>False!=0

D)>>>5is5

183.[單選題]MapReduce編程模型,鍵值對<;key,value>;的key必須實現(xiàn)哪個接口()。

A)WritableComparab1e

B)Comparable

OWritable

D)LongWritable

184.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,系統(tǒng)在【客戶信息管理】一級菜單下增加【

征信報告查詢管理】二級菜單,用戶可在此菜單下的【待處理的征信報告】節(jié)點中點擊O按鈕

,提交征信報告查詢申請。

A)新增查詢

B)B.上傳授權(quán)書

OC.取消申請

D)D.提交

185.[單選題]查看HDFS的報告命令是()

A)bin/hdfsdfsadmin-report

B)bin∕hdfs-report

C)bin/hdfsdeadmin-report

D)bin/hdfsdfs-report

186.[單選題]剪枝是決策樹學(xué)習(xí)算法對付(一)的主要手段。

A)欠擬合

B)過擬合

C)計算速度

D)計算效率

187.[單選題]大數(shù)據(jù)平臺核心分布式存儲與計算組件采用Hadoop技術(shù)體系中的分布式存儲、分布

式計算框架及Spark等開源產(chǎn)品和技術(shù),實現(xiàn)對數(shù)據(jù)的安全控制和管理功能,其中分布式存儲不包

括()。

A)HDFS

B)Postgresql

OHive

D)HBase

188.[單選題]以下哪項不屬于批量數(shù)據(jù)采集工具?。

A)MapReduce

B)Flume

C)Scoop

D)其他ETL工具

189.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,系統(tǒng)在【大數(shù)據(jù)貸后預(yù)警處置】菜單下設(shè)置

【待處置】、【處置中】等4個節(jié)點。其中,用戶在()節(jié)點可對審批退回的客戶重新查看其預(yù)警信

號詳情,填寫相關(guān)處置措施,并選擇性的進(jìn)行貸后影像資料補充,提交審核。

A)待處置

B)B.處置中

C)C.退回

D)D.處置完成

190.[單選題]下面與HDFS類似的框架是?

A)NTFS

B)FAT32

OGFS

D)EXT3

191.[單選題]下列(—)是對目錄操作。

A)mkdir

B)print

C)close

D)remove

192.[單選題]下列哪個屬性是hdfs-site.Xml中的配置?()

A)dfs.replication

B)fs.defaultFS

Omapreduce.framework,name

D)yarn,resourcemanager,address

193.[單選題]下列有關(guān)OGG的描述錯誤的是(一)。

A)OGG可以實現(xiàn)一對一、廣播、聚合、級聯(lián)等多種靈活的拓?fù)浣Y(jié)構(gòu)

B)OGG管理維護(hù)相對直觀,使用自帶的管理工具,能夠?qū)ζ溥M(jìn)行圖形化界面的管理

C)OGG支持異構(gòu)復(fù)制

D)OGG不支持異構(gòu)復(fù)制

194.[單選題]K-Means算法無法聚()樣本。

A)圓形分布

B)螺旋分布

C)帶狀分布

D)凸多邊形分布

195.[單選題]小A匯總統(tǒng)計了各省收入,并設(shè)置了降序排列,如何實現(xiàn)toplθ?()

A)篩選器-精確篩選

B)篩選器-條件篩選

C)顯示條目數(shù)

D)無法實現(xiàn)

196.[單選題]已知一個數(shù)據(jù)集,n為特征數(shù),m為訓(xùn)練樣本數(shù),如果n較小,而且m大小中等(例如n為

Γ1000,而m為I(Tloooo),則一般選擇()。

A)邏輯回歸模型

B)不帶核的支持向量機

C)高斯核的支持向量機

D)多項式核的支持向量機

197.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,集團(tuán)圖譜頁面右側(cè)展示【放大】、【縮小】

、【刷新】、【展開】4個按鈕,其中具有“將展示的集團(tuán)圖譜縮小”功能的是()按鈕。

A)放大

B)B.縮小

OC.刷新

D)D.展開

198.[單選題]在Hadoop生態(tài)系統(tǒng)中,()建立在MapReduce之上,主要用來彌補MaPRedUCe

編程的復(fù)雜性。

A)Hbase

B)Flume

OPig

D)Sqoop

199.[單選題]下列關(guān)于MapReduce說法不正確的是()。

A)MaPRedUCe是一種計算框架

B)MapReduce來源于google的學(xué)術(shù)論文

C)MapReduce程序只能用java語言編寫

D)MaPRedUCe隱藏了并行計算的細(xì)節(jié),方便使用

200.[單選題]刪除數(shù)據(jù)庫表使用的是O

A)DROP

B)UPDATE

C)DELETE

D)DELETED

201.[單選題]HDFS默認(rèn)的當(dāng)前工作目錄是/user/$USER,fs.default,name的值需要在哪個配置文件

內(nèi)說明。

A)mapred-site.xml

B)core-site,xml

C)hdfs-site.xml

D)yarn-site,xml

202.[單選題]()是一種著名的密度聚類算法,它基于一組鄰域參數(shù)來刻畫樣本的緊密程度

A)DBSCAN

B)原型聚類

C)密度聚類

D)層次聚類

203.[單選題]下面關(guān)于MaPRedUCe的描述中正確的是?

A)MaPRedUCe程序必須包含MaPPer和Reducer

B)MaPRedUCe程序的MaPTaSk可以任意指定

C)MaPRedUCe程序的RedUCeTaSk可以任意指定

D)MaPRedUCe程序的默認(rèn)數(shù)據(jù)讀取組件是TextlnputFormat

204.[單選題]在數(shù)據(jù)管理技術(shù)的發(fā)展過程中,經(jīng)歷了人工管理階段、文件系統(tǒng)階段和數(shù)據(jù)庫系統(tǒng)階

段。在這幾個階段,數(shù)據(jù)獨立性最高的是O階段

A)數(shù)據(jù)庫系統(tǒng)

B)文件系統(tǒng)

C)人工管理

D)數(shù)據(jù)項管理

205.[單選題]下列算法中屬于局部處理的是

A)灰度線性變換

B)二值化

C)傅立葉變換

D)中值濾波

206.[單選題]使用Pig語句實現(xiàn)右外連接,下列語句正確的是(一)。

A)SELECT*FROMtmp_tableARIGHTJOINtmp_table_2BONA.age=B.age;

B)DUMPtmp_tableBYageRIGHTJOINtmp_table_2BYage;

C)tmp_table_join=JOINtmp_tableByageRIGHTOUTER,tmp_table_2BYage;DUMP

tmp_table_join;

D)JOINtmp_tableBYageRIGHTOUTER,tmp_table_2BYage;

207.[單選題]以下關(guān)于DataNOde的描述不正確的是?

A)DataNOde管理數(shù)據(jù)塊元數(shù)據(jù)

B)DataNode執(zhí)行數(shù)據(jù)塊的讀/寫操作。

C)DataNOde的數(shù)量受數(shù)據(jù)規(guī)模影響。

D)DataNode是用來存儲數(shù)據(jù)庫。

208.[單選題]有如下程序:defcube(x):returnx*x*xx=cube(3)Print(X)程序的輸出結(jié)

果是(一)o

A)3

B)9

C)27

D)81

209.[單選題]在使用FiIeChannel傳輸數(shù)據(jù)時,F(xiàn)lUme可以達(dá)到的數(shù)據(jù)傳輸語義是?

A)Atmostonce

B)Atleastonce

C)Exactlyonce

D)Notonlyonce

210.[單選題]分布式文件系統(tǒng)HDFS采用了主從結(jié)構(gòu)模型,由計算機集群中的多個節(jié)點構(gòu)成的,這些

節(jié)點分為兩類,一類存儲元數(shù)據(jù)叫(),另一類存儲具體數(shù)據(jù)叫().

A)名稱節(jié)點,主節(jié)點

B)從節(jié)點,主節(jié)點

C)名稱節(jié)點,數(shù)據(jù)節(jié)點

D)數(shù)據(jù)節(jié)點,名稱節(jié)點

211.[單選題]下列可以用來降低深度學(xué)習(xí)模型的過擬合問題的方法有①增加更多的數(shù)據(jù);②使用數(shù)據(jù)

擴增技術(shù)(也,taaugmen飽創(chuàng)咀);③使用歸納性更好的架構(gòu);④正規(guī)化數(shù)據(jù);

A)①④⑤

B)①②③

C)①③④⑤

D)所有項目都有用

212.[單選題]執(zhí)行以下代碼段CIaSSGraph():definit_(self):self,a=10def

action(self):self,a//=4self,b**=2%3classMyGraph(Graph):def—init_(self):

self,a=8self,b=4defaction(self):self,a+=7*2self,b**=2+Iclass

LastGraph(MyGraph):passg2=LaStGraPh()g2.action。print(g2.b)時,輸出為()。

A)17

B)l

C)16

D)64

213.[單選題]下列屬于分組表中的是()

A)形狀

B)風(fēng)格

C)背景

D)標(biāo)題

214.[單選題]在hadoop配置中yarn-site,xml作用是()

A)用于定義系統(tǒng)級別的參數(shù)

B)用于名稱節(jié)點和數(shù)據(jù)節(jié)點的存放位置

C)用于配置JObHiStOryServer和應(yīng)用程序參數(shù)

D)配置ResourceManager,NodeManager的通信端口

215.[單選題]Hive是建立在()之上的一個數(shù)據(jù)倉庫

A)HDFS

B)MapReduce

OHadoop

D)HBase

216.[單選題]以下掃描算子中用于對列存表進(jìn)行掃描

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論