版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
試題說明
本套試題共包括1套試卷
每題均顯示答案和解析
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案14(500題)
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案14
L[單選題]下列哪個不是RDD的緩存方法()
A)persist()
B)cache()
C)memory()
答案:C
解析:
2.[單選題]Spark中Job的劃分依據(jù)是()。
A)依賴
B)Action算子
C)Transformation算子
答案:B
解析:Action的觸發(fā)會生成一個Job,Job會提交給DAGScheduler分解成Stage。因此Job是由
Action算子劃分的,B正確。
3.[單選題]下列方法中,不可以用于特征降維的方法包括
A)主成分分析PCA
B)線性判別分析LDA
C)深度學(xué)習(xí)SparseAutoEncoder
D)矩陣奇異值分解SVD
答案:C
解析:
4.[單選題]MaxCompute服務(wù)是以RESTfulAPI的形式對外提供。下列()方法可以更新資源。
A)UPDATE
B)POST
OGET
D)PUT
答案:D
解析:
5.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,全景風(fēng)險視圖模塊,為了用戶能便捷查看客戶
的關(guān)聯(lián)風(fēng)險,實(shí)現(xiàn)客群風(fēng)險監(jiān)測和關(guān)聯(lián)客戶風(fēng)險聯(lián)防聯(lián)控,系統(tǒng)在全景風(fēng)險視圖的客戶名稱下放置
了()按鈕,方便用戶查看關(guān)鍵信息。
A)【權(quán)限申請】、【集團(tuán)圖譜】、【最終受益人】
B)B.【數(shù)據(jù)補(bǔ)錄】、【集團(tuán)圖譜】、【最終受益人】
C)C.【影像操作】、【企業(yè)信用智能分析報告】、【集團(tuán)圖譜】、【最終受益人】
D)D.【擔(dān)保圈鏈】、【關(guān)聯(lián)關(guān)系圖譜】、【企業(yè)信用智能分析報告】、【集團(tuán)圖譜】、【最終受益
人】
答案:D
解析:
6.[單選題]假設(shè)你正在訓(xùn)練一個LSTM網(wǎng)絡(luò),你有一個10000詞的詞匯表,并且使用一個激活值維度
為100的LSTM塊,在每一個時間步中,幾的維度是()
A)1
B)100
C)300
D)10000
答案:B
解析:
7.[單選題]Hive不適用于以下哪個場景
A)非實(shí)時分析,例如日志分析,統(tǒng)計分析
B)數(shù)據(jù)挖掘,例如用戶行為分析,興趣分析,區(qū)域展示
C)數(shù)據(jù)匯總,例如每天,每用戶點(diǎn)擊數(shù),點(diǎn)擊排行
D)實(shí)時在線數(shù)據(jù)分析
答案:D
解析:
8.[單選題]Kafka集群在運(yùn)行期間,直接依賴于下面那些組件?
A)Spark
B)Zookeeper
OHBase
D)HDFS
答案:B
解析:
9.[單選題]內(nèi)部用戶有作業(yè)層、管理層、()
A)執(zhí)行層
B)決策層
C)建議層
D)推送層
答案:B
解析:
10.[單選題]數(shù)據(jù)的故事化描述是指為了提升數(shù)據(jù)的(),將數(shù)據(jù)還原成關(guān)聯(lián)至特定的情景的過程
A)可理解性、可記憶性、可體驗性
B)可接受性、可記憶性、可體驗性
C)可接受性、可記憶性、可呈現(xiàn)性
D)可理解性、可記憶性、可呈線性
答案:A
解析:數(shù)據(jù)的故事化描述(Storytelling)是指為了提升數(shù)據(jù)的可理解性、可記憶性及可體驗性,將
數(shù)據(jù)還原成關(guān)聯(lián)至特定的情景的過程。
11.[單選題]迪士尼MagicBand手環(huán),體現(xiàn)了哪種大數(shù)據(jù)思維方式:()
A)我為人人,人人為我
B)全樣而非抽樣
C)效率而非精確
D)相關(guān)而非因果
答案:A
解析:
12.[單選題]以下不屬于大數(shù)據(jù)系統(tǒng)端風(fēng)險的是。
A)數(shù)據(jù)系統(tǒng)的申請、查看流程
B)數(shù)據(jù)查看權(quán)限
C)系統(tǒng)平臺的穩(wěn)定性
D)數(shù)據(jù)庫管理、存儲
答案:A
解析:
13.[單選題]下列語句執(zhí)行的結(jié)果是()>>>a=l?>b=2*a/4〉>>a="one">>>print(a,b)
A)one0
B)10
C)one0.5
D)one,0.5
答案:C
解析:
14.[單選題]以下關(guān)于關(guān)系數(shù)據(jù)模型的論述正確的是()
A)只能表示實(shí)體間的1:1聯(lián)系
B)只能表示實(shí)體間的l:n聯(lián)系
C)只能表示實(shí)體間的m:n聯(lián)系
D)可以表示實(shí)體間上述三種聯(lián)系
答案:D
解析:
15.[單選題]在Hive中,以下那一個查詢語句可以將2個或多個表集合進(jìn)行合并()
A)unionfull
B)unionall
Ounionfor
D)unionon
答案:B
解析:
16.[單選題]與生成方法、半監(jiān)督SVM、圖半監(jiān)督學(xué)習(xí)等基于單學(xué)習(xí)機(jī)器利用未標(biāo)記數(shù)據(jù)不同,基于
分歧的方法(disagreement-basedme也ods)使用多學(xué)習(xí)器,而學(xué)習(xí)器之間的分歧(disagreement)對未
標(biāo)記數(shù)據(jù)的利用至關(guān)重要()是此類方法的重要代表
A)協(xié)同訓(xùn)練
B)組合訓(xùn)練
C)配合訓(xùn)練
D)陪同訓(xùn)練
答案:A
解析:
17.[單選題]大數(shù)據(jù)的4V特性不包括
A)Volume(大量)
B)Velocity(高速)
C)Visual(可視)
D)Variety(多樣)
答案:C
解析:
18.[單選題]下面關(guān)于Hadoop的描述錯誤的是:()
A)Hadoop是一個能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架
B)作為并行分布式計算平臺,Hadoop采用分布式存儲和分布式處理兩大核心技術(shù),能夠高效地處理
PB級數(shù)據(jù)
C)Hadoop只支持Java編程語言
D)Hadoop可以高效穩(wěn)定地運(yùn)行在廉價的計算機(jī)集群上,可以擴(kuò)展到數(shù)以千計的計算機(jī)節(jié)點(diǎn)上
答案:C
解析:
19.[單選題]type(complex(2,4))的結(jié)果為(___)0
A)class'int'
B)class'float'
C)class'complex'
D)class'bool'
答案:C
解析:
20.[單選題]以下四種描述中,正確的是()
A)、大數(shù)據(jù)和海量數(shù)據(jù)是同一個事物的不同描述
B)、數(shù)據(jù)和數(shù)值是同一個事物的不同描述
C)、數(shù)據(jù)和數(shù)字是同一個事物的不同描述
D)、以上說法均不正確
答案:D
解析:
21.[單選題](_)是M-P神經(jīng)元,也稱為“閾值邏輯單元”。
A)輸入層
B)輸出層
C)第一層
D)第二層
答案:B
解析:
22.[單選題]Python使用()符號標(biāo)示注釋。
A)&
B)*
C)#
D)//
答案:C
解析:單行注釋使用#號。
23.[單選題]大數(shù)據(jù)時代,數(shù)據(jù)使用的關(guān)鍵是().
A)數(shù)據(jù)收集
B)數(shù)據(jù)存儲
C)數(shù)據(jù)分析
D)低容錯性
答案:D
解析:
24.[單選題]下面哪項操作能實(shí)現(xiàn)跟神經(jīng)網(wǎng)絡(luò)中Dropout的類似效果?
A)Boosting
B)bagging
C)Stacking
D)Mapping
答案:B
解析:
25.[單選題]網(wǎng)站在運(yùn)營過程中,會有用戶訪問并產(chǎn)生行為數(shù)據(jù),要想對這些數(shù)據(jù)進(jìn)行處理挖掘,如
果是離線批處理下的方案配置,描述不正確的是
A)數(shù)據(jù)導(dǎo)入導(dǎo)出,Loader
B)數(shù)據(jù)采集傳輸:Flume
C)數(shù)據(jù)計算,Storm
D)數(shù)據(jù)存儲.HDFS或MySql
答案:C
解析:
26.[單選題]機(jī)器學(xué)習(xí)中L1正則化和L2正則化的區(qū)別是?()
A)使用L1可以得到稀疏的權(quán)值,使用L2可以得到平滑的權(quán)值
B)使用L1可以得到平滑的權(quán)值,使用L2可以得到平滑的權(quán)值
C)使用L1可以得到平滑的權(quán)值,使用L2可以得到稀疏的權(quán)值
D)使用L1可以得到稀疏的權(quán)值,使用L2可以得到稀疏的權(quán)值
答案:A
解析:
27.[單選題]我國首家大數(shù)據(jù)交易所是:()
A)貴陽大數(shù)據(jù)交易所
B)上海數(shù)據(jù)交易中心
C)華東江蘇大數(shù)據(jù)交易中心
D)浙江大數(shù)據(jù)交易中心
答案:A
解析:
28.[單選題]下列哪個標(biāo)識符是合法的()
A)print
B)_100
C)12name
D)name
答案:B
解析:
29.[單選題](_)是從海量文本中查詢到觀點(diǎn)信息,根據(jù)主題相關(guān)度和觀點(diǎn)傾向性對結(jié)果排序。
A)情感分類
B)情感檢索
C)情感抽取
D)情感分析
答案:B
解析:
30.[單選題]下面不屬于大數(shù)據(jù)4V特性有(一)。
A)容量大
B)類型多
C)速度快
D)應(yīng)用價值高
答案:D
解析:
31.[單選題]設(shè)2={1,1,1,1,1,2,3,4,5,5,5,5},貝。面小(1611g))的顯示結(jié)果為()。
A)5
B)12
03
D)Error
答案:A
解析:
32.[單選題]支撐大數(shù)據(jù)業(yè)務(wù)的基礎(chǔ)是()
A)數(shù)據(jù)科學(xué)
B)數(shù)據(jù)應(yīng)用
C)數(shù)據(jù)硬件
D)數(shù)據(jù)人才
答案:B
解析:
33.[單選題]以下關(guān)于Zookeeper的Leader節(jié)點(diǎn)在收到數(shù)據(jù)變更請求后的讀寫流程說法正確的是?
A)僅寫入內(nèi)存
B)同時寫入磁盤和內(nèi)存
C)先寫入內(nèi)存再寫入磁盤
D)先寫磁盤再寫內(nèi)存
答案:D
解析:
34.[單選題]numpy中向量轉(zhuǎn)成矩陣使用什么函數(shù)?
A)np.reshape()
B)np.reval()
C)np.arange()
D)np.random()
答案:A
解析:
35.[單選題]對線下零售而言,做好大數(shù)據(jù)分析應(yīng)用的前提是。
A)增加統(tǒng)計種類
B)擴(kuò)大營業(yè)面積
C)增加數(shù)據(jù)來源
D)開展優(yōu)惠促銷
答案:C
解析:
36.[單選題]以下名稱中不屬于“屬性張成的空間”的是(—)o
A)屬性空間
B)樣本空間
C)輸入空間
D)對偶空間
答案:D
解析:
37.[單選題]關(guān)于賦值語句,以下選項中描述錯誤的是
A)在Python語言中,有一種賦值語句,可以同時給多個變量賦值
B)設(shè)x="alice";y="kate",執(zhí)行x,y=y,x可以實(shí)現(xiàn)變量x和y值的互換
C)設(shè)a=10;b=20,執(zhí)行a,b=a,a+bprint(a,b)和a=bb=a+bprint(a,b)之后,得到
同樣的輸出結(jié)果:1030
D)在Python語言中,“=”表示賦值,即將“=”右側(cè)的計算結(jié)果賦值給左側(cè)變量,包含“=”的語
句稱為賦值語句
答案:C
解析:
38.[單選題]關(guān)于基本數(shù)據(jù)的元數(shù)據(jù)是指:
A)基本元數(shù)據(jù)與數(shù)據(jù)源,數(shù)據(jù)倉庫,數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息
B)基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息
C)基本元數(shù)據(jù)包括日志文件和簡歷執(zhí)行處理的時序調(diào)度信息
D)基本元數(shù)據(jù)包括關(guān)于裝載和更新處理,分析處理以及管理方面的信息
答案:D
解析:
39.[單選題]以下不屬于關(guān)系型數(shù)據(jù)庫的是()
A)DB2
B)HBase
C)MySQL
D)Oracle
答案:B
解析:
40.[單選題]下列數(shù)據(jù)類型中不可以作為索引對Numpy數(shù)組進(jìn)行選取的是()。
A)boolean
B)tuple
C)diet
D)int
答案:C
解析:Numpy數(shù)組可以由整數(shù)、整數(shù)數(shù)組和布爾數(shù)組進(jìn)行索引,不包括字典類型。
41.[單選題]scipy.stats模塊中對隨機(jī)變量進(jìn)行隨機(jī)取值的函數(shù)是()。
A)rvs
B)pdf
Ocdf
D)sf
答案:A
解析:stats模塊中的rvs函數(shù)對隨機(jī)變量進(jìn)行取值。
42.[單選題]以下哪項用來排序()
A)ORDEREDBY
B)ORDERBY
C)GROUPBY
D)GROUPEDBY
答案:B
解析:
43.[單選題]Relief的擴(kuò)展變體Relief-F能夠處理(_)問題。
A)二分類
B)多分類
C)回歸
D)降維
答案:B
解析:
44.[單選題]信息安全事件的處理不遵循的原則是()
A)統(tǒng)一領(lǐng)導(dǎo)
B)綜合協(xié)調(diào)
C)快速處理
D)集體責(zé)任
答案:D
解析:
45.[單選題]下列哪一項不屬于儀表板的布局模式()
A)標(biāo)準(zhǔn)模式
B)自由模式
C)標(biāo)準(zhǔn)模式(分頁)
D)自由模式(分頁)
答案:C
解析:
46.[單選題]若設(shè)1.啟動,2.診斷,3.建立,4.行動,5.學(xué)習(xí),貝UDMM模型中的順序為(_)。
A)12345
B)12354
C)13254
D)13245
答案:A
解析:
47.[單選題]以下關(guān)于函數(shù)參數(shù)和返回值的描述,正確的是:
A)采用名稱傳參的時候,實(shí)參的順序需要和形參的順序一致
B)可選參數(shù)傳遞指的是沒有傳入對應(yīng)參數(shù)值的時候,就不使用該參數(shù)
C)函數(shù)能同時返回多個參數(shù)值,需要形成一個列表來返回
D)Python支持按照位置傳參也支持名稱傳參,但不支持地址傳參
答案:D
解析:
48.[單選題]高斯核也稱為(_)。
A)多項式核
B)拉普拉斯核
ORBF核
D)Sigmoid核
答案:C
解析:
49.[單選題]數(shù)據(jù)產(chǎn)品開發(fā)的關(guān)鍵環(huán)節(jié)是()
A)數(shù)據(jù)收集
B)數(shù)據(jù)預(yù)處理
C)數(shù)據(jù)學(xué)習(xí)
D)數(shù)據(jù)加工
答案:D
解析:數(shù)據(jù)加工(DataWrangling或DataMunging)是數(shù)據(jù)產(chǎn)品開發(fā)的關(guān)鍵環(huán)節(jié)。
50.[單選題]Flume的高級組件不包含以下哪個?
A)SinkProcessor
B)ChannelInterceptor
C)ChannelSelector
D)SourceInterceptor
答案:B
解析:
51.[單選題]以下()組件負(fù)責(zé)存儲業(yè)務(wù)數(shù)據(jù)、執(zhí)行數(shù)據(jù)查詢?nèi)蝿?wù)以及向CN返回執(zhí)行結(jié)果。
A)GTM
B)WLM
C)CN
D)DN
答案:D
解析:
52.[單選題]下列語句中不能創(chuàng)建一個字典的是()。
A)dictl={}
B)dict2={3:5}
C)dict3={[1,2,3]:"uestc")
D)dict4={(1,2,3):"uestc")
答案:C
解析:字典key不可以是可變類型,C選項中列表為可變類型。
246
53.[單選題]下列有關(guān)Hive中分桶表理解不正確的是()
A)Hive不能針對分區(qū)進(jìn)行桶的組織
B)Hive可以針對某一列進(jìn)行桶的組織
C)把表組織成桶可以獲得更高的查詢處理效率
D)把表組織成桶可以使取樣更高效
答案:A
解析:
54.[單選題]國網(wǎng)公司泛在電力物聯(lián)網(wǎng)2019年建設(shè)方案要求,推進(jìn)營配貫通優(yōu)化提升,貫通率提升
()O
A)5%
B)7%
010%
D)15%
答案:A
解析:
55.[單選題]某公司在進(jìn)行大數(shù)據(jù)離線批處理平臺的前期技術(shù)選型,以下哪個大數(shù)據(jù)組件不屬于離線
批處理業(yè)務(wù)所涉及到的組件?
A)HDFS
B)Spark
C)Storm
D)Hive
答案:C
解析:
56.[單選題]下面python循環(huán)體執(zhí)行的次數(shù)與其他不同的是。。
A)i=0while(i
B)i=10while(i>0):print(i)i=i-l
C)forIinrange(10):Print(i)
D)forIinrange(10,0,-1):print(i)
答案:A
解析:
57.[單選題]以下關(guān)于ElasticSearch介紹錯誤的是?(
A)Document文檔,被素引的基本單位
B)EsMaster主節(jié)點(diǎn)
C)Index親弓I,與關(guān)系型數(shù)據(jù)庫中的索引概念一樣
D)EsNode:Elasticsearch節(jié)點(diǎn),一個節(jié)點(diǎn)就是一個Elasticsearch實(shí)例
答案:C
解析:
58.[單選題]以下不是NoSQL常用數(shù)據(jù)模型的是()
A)Key-Value
B)Key-Colum
C)圖存儲
D)關(guān)系數(shù)據(jù)模型
答案:D
解析:
59.[單選題](一)返回模塊名稱空間的字典,(—)返回當(dāng)前名稱空間的字典。
A)locals()locals()
B)global()locals()
C)locals()global()
D)globals()globals()
答案:B
解析:
60.[單選題]以P(w)表示詞條w的概率,假設(shè)已知P(南京)=0.8,P(市長)=0.6,P(江大橋
)=0.4;P(南京市)=0.3,P(長江大橋)=0.5o如果假設(shè)前后兩個詞的出現(xiàn)是獨(dú)立的,那么分詞
結(jié)果就是()。
A)南京市*長江*大橋
B)南京*市長*江大橋
C)南京市長*江大橋
D)南京市*長江大橋
答案:B
解析:最大概率分詞基本思想:一句話有多種切割方法,我們選擇聯(lián)合概率最大的結(jié)果。
P(A)=0;P(B)=0.8X0.6X0,4=0.192;P(C)=0;P(D)=0.3X0.5=0.15o所以這
道題選擇Bo
61.[單選題]Hive在處理數(shù)據(jù)時,默認(rèn)的分隔復(fù)合類型中元素的分隔符是()
A)"A
B[B
c)'c
D)\n
答案:B
解析:
62.[單選題]常用的數(shù)據(jù)歸約方法可以分為()。
A)維歸約、數(shù)據(jù)壓縮
B)維歸約、參數(shù)歸約
C)維歸約、值歸約
D)數(shù)據(jù)壓縮、值歸約
答案:C
解析:常用的數(shù)據(jù)歸約方法有維歸約和值歸約兩種。
63.[單選題]ApacheHadoop可以在(_)平臺上運(yùn)行。
A)Ubuntu
B)Debian
C)Windows
D)跨平臺
答案:D
解析:
64.[單選題]某電商公司數(shù)據(jù)庫高級工程師進(jìn)行大數(shù)據(jù)分析,現(xiàn)在界面提示:"0:
jdbe:hive2://192.168.0.186:2181/>"信息,那么他最有可能在進(jìn)行什么場錄的數(shù)據(jù)分析工作?
A)實(shí)時檢素場景
B)離線批處理場景
C)圖搜索場景
D)實(shí)時流開發(fā)場景
答案:B
解析:
65.[單選題]HDFS的優(yōu)點(diǎn)不包含哪個?
A)處理超大文件
B)運(yùn)行于廉價機(jī)器上
C)高效存儲大量小文件
D)流式的訪問數(shù)據(jù)
答案:C
解析:
66.[單選題]MapReduce流程有()各階段。
A)三
B)二
C)四
D)五
答案:A
解析:
67.[單選題]Hive常被用來處理()場景。
A)事務(wù)性處理
B)批量計算
C)實(shí)時性計算
D)流計算
答案:B
解析:
68.[單選題]下列關(guān)于Numpy的數(shù)組Ndarray對象屬性的描述錯誤的是()。
A)Ndarray.ndim秩,即軸的數(shù)量或維度的數(shù)量
B)Ndarray.shape數(shù)組的維度,對于矩陣來說是n行m列
C)Ndarray.size數(shù)組元素的總個數(shù),也是shape屬性中nXm的值
D)Ndarray.itemsizeNdarray對象的元素類型
答案:D
解析:itemsize是每個數(shù)組元素的字節(jié)大小。
69.[單選題]下列算法中屬于圖像平滑處理的是。。
A)梯度銳化
B)直方圖均衡化
0中值濾波
D)Laplacian增強(qiáng)
答案:C
解析:
70.[單選題]在MaxCompute中,可以通過Tunnel命令行來完成數(shù)據(jù)的上傳下載。如果要下載
test_project項目空間下的一個帶分區(qū)的表test_table_p的內(nèi)容到log.txt文件中,使用命令
tunneldownloadtest_project.test_table_plog.txt;結(jié)果報錯,其中出錯的部分為:()。
A)tunnel
B)download
C)test_project.test_table_p
D)log_txt
答案:C
解析:
71.[單選題]假設(shè)我們要解決一個二類分類問題,我們已經(jīng)建立好了模型,輸出是0或1,初始時設(shè)閾
值為0.5,超過0.5概率估計,就判別為1,否則就判別為0;如果我們現(xiàn)在用另一個大于0.5的閾值,
那么現(xiàn)在關(guān)于模型說法,正確的是:
A)模型分類的召回率會降低或不變
B)模型分類的召回率會升高
C)模型分類準(zhǔn)確率會升高或不變
D)模型分類準(zhǔn)確率會降低
答案:A
解析:
72.[單選題](_)通過構(gòu)建并結(jié)合多個學(xué)習(xí)器來完成學(xué)習(xí)任務(wù)。
A)支持向量機(jī)
B)貝葉斯分類器
C)神經(jīng)網(wǎng)絡(luò)
D)集成學(xué)習(xí)
答案:D
解析:
73.[單選題]如想定義字符串,應(yīng)使用()
A)list
B)set
C)str
D)dict
答案:C
解析:
74.[單選題]關(guān)于基于Hadoop的MapReduce編程的環(huán)境配置,下面哪一步是不必要的()
A)配置java環(huán)境變量
B)配置Hadoop環(huán)境變量
C)配置Eclipse
D)配置ssh
答案:C
解析:記住即可
75.[單選題]以下哪項不是“大數(shù)據(jù)”和傳統(tǒng)的“小數(shù)據(jù)”的區(qū)別?
A)數(shù)據(jù)規(guī)模的采樣聚合與全量
B)數(shù)據(jù)結(jié)構(gòu)的結(jié)構(gòu)化與非結(jié)構(gòu)化
C)數(shù)據(jù)來源的集中于分散
D)數(shù)據(jù)質(zhì)量的高低參差不齊
答案:C
解析:
76.[單選題]在邏輯回歸輸出與日標(biāo)對比的情況下,以下評估指標(biāo)中()不適用
A)AUC-ROC
B)準(zhǔn)確度
C)Logloss
D)均方誤差
答案:D
解析:
77.[單選題]能實(shí)現(xiàn)將一維數(shù)據(jù)寫入CSV文件中的是
A)fo=open("price2016bj.csv","w")Is=['AAA','BBB','CCC','DDD']
fo.write(",join(ls)+"\n")fo.close()
B)fr=open("price2016.csv","w")Is=[]forlineinfo:line=
line.replace("\n","")Is.append(line,split(","))print(Is)fo.close()
C)fo=open("price2016bj.csv","r")Is=['AAA','BBB','CCC',
"DDD']fo.write(",join(ls)+"\n")fo.close()
D)fname=input("請輸入要寫入的文件:")fo=open(fname,"w+")ls=["AAA","BBB",
"CCC"]fo.writelines(Is)forlineinfo:print(line)fo.close()
答案:A
解析:
78.[單選題]在線性回歸問題中,我們用R方來衡量擬合的好壞。在線性回歸模型中增加特征值并再訓(xùn)
練同一模型。下列說法正確的是()。
A)如果R方上升,則該變量是顯著的
B)如果R方下降,則該變量不顯著
C)單單R方不能反映變量重要性,不能就此得出正確結(jié)論
D)以上答案都不正確
答案:C
解析:單單R方不能表示變量顯著性,因為每次加入一個特征值,R方都會上升或維持不變。但在調(diào)整R
方的情況下這也有誤(如果特征值顯著的話,調(diào)整R方會上升)。
79.[單選題]當(dāng)數(shù)據(jù)集非常大的時候,對全體數(shù)據(jù)進(jìn)行處理存在困難時,通過什么方式可以估計和推
斷出整體的特性()
A)抽樣查詢
B)模糊查詢
C)條件查詢
D)連接查詢
答案:A
解析:
80.[單選題]下列選項中,Python不支持的數(shù)據(jù)類型有()。
A)int
B)char
C)float
D)dictionary
答案:B
解析:
81.[單選題]np.square(2)的結(jié)果是多少?
A)1
B)4
C)3
D)2
答案:B
解析:
82.[單選題]下列哪項通常是集群的最主要的性能瓶頸?()
A)CPU
B)網(wǎng)絡(luò)
C)磁盤
D)內(nèi)存
答案:C
解析:
83.[單選題]下列關(guān)于BigTable的描述,哪個是錯誤的?()
A)爬蟲持續(xù)不斷地抓取新頁面,這些頁面每隔一段時間地存儲到BigTable里
B)BigTable是一布式存儲系統(tǒng)
OBigTable起初用于解決典型的互聯(lián)網(wǎng)搜索問題
D)網(wǎng)絡(luò)搜索應(yīng)用查詢建立好的索引,從BigTable到網(wǎng)頁
答案:A
解析:
84.[單選題]選擇哪一個解作為輸出,將由學(xué)習(xí)算法的歸納偏好決定,常見的做法是引人()。
A)線性回歸
B)線性判別分析
C)正則化項
D)偏置項
答案:C
解析:
85.[單選題]變量的不確定性越大,相對應(yīng)信息'腦的變化是()
A)蜻變小
B)蜻變大
C)不變
D)以上答案都不正確
答案:B
解析:
86.[單選題]可用作數(shù)據(jù)挖掘分析中的關(guān)聯(lián)規(guī)則算法有()。
A)機(jī)器學(xué)習(xí)、對數(shù)回歸、關(guān)聯(lián)模式
B)K均值法、SOM機(jī)器學(xué)習(xí)
C)Apriori算法、FP-Tree算法
D)RBF機(jī)器學(xué)習(xí)、K均值法、機(jī)器學(xué)習(xí)
答案:C
解析:關(guān)聯(lián)規(guī)則包括Apriori、FP-Tree等算法。
87.[單選題]以下關(guān)于DataNode的描述不正確的是?
A)DataNode執(zhí)行數(shù)據(jù)塊的讀/寫操作
B)DataNode是用來存儲數(shù)據(jù)塊
C)DataNode管理數(shù)據(jù)塊元數(shù)據(jù)
D)DataNode的數(shù)量受數(shù)據(jù)規(guī)模影響
答案:C
解析:
88.[單選題]()是基于規(guī)則的分類器
A)C4.S
B)KNN
C)NaiveBayes
D)C.ANN
答案:A
解析:
89.[單選題]關(guān)于數(shù)據(jù)備份的做法不對的是:()
A)確認(rèn)備份操作步驟準(zhǔn)確無誤后進(jìn)行備份操作。
B)各業(yè)務(wù)部門應(yīng)將計算機(jī)信息數(shù)據(jù)備份媒體視同重要空白憑證,指定專人負(fù)責(zé)備份數(shù)據(jù)媒體的簽收
和入庫管理。
C)備份數(shù)據(jù)媒體應(yīng)按要求寫明標(biāo)識,交辦公室檔案管理員異地存放,要確保存放地的安全,并定期
進(jìn)行檢查,確保數(shù)據(jù)的完整性、可用性。
D)涉密信息媒體的備份媒體(磁帶、磁盤、光盤、紙媒體等)應(yīng)有密級及保密期限標(biāo)志,統(tǒng)一編號
,各單位保密機(jī)構(gòu)負(fù)責(zé)涉密信息媒體的界定和銷毀。
答案:C
解析:
90.[單選題]智能健康手環(huán)的應(yīng)用,體現(xiàn)了()數(shù)據(jù)采集技術(shù)的應(yīng)用。
A)統(tǒng)計報表
B)網(wǎng)絡(luò)爬蟲
C)傳感器
D)API接口
答案:C
解析:
91.[單選題]以下關(guān)于數(shù)據(jù)倉庫的敘述中,正確的是()
A)數(shù)據(jù)倉庫主要用于支持決策管理
B)數(shù)據(jù)倉庫的數(shù)據(jù)源相對比較單一
C)存放在數(shù)據(jù)倉庫中的數(shù)據(jù)一般是實(shí)時更新的
D)數(shù)據(jù)倉庫為企業(yè)的特定應(yīng)用服務(wù)、強(qiáng)調(diào)處理的響應(yīng)時間,數(shù)據(jù)的安全性和完整性等
答案:A
解析:
92.[單選題]若2=叩.abs(-5),則print(a)輸出為(—)。
A)-6
B)-4
0-5
D)5
答案:D
解析:
93.[單選題]下列語句會無限循環(huán)下去的是()。
A)forainrange(10):timesleep(10)
B)whilei<10:
Timesleep(10)
C)whileTrue:
Break
D)a=[3,-1,']
Foriina[:]:ifnota:
Break
答案:B
解析:B中條件l<10恒成立。
94.[單選題]()是指過濾器在圖像上滑動的距離。
A)卷積核大小
B)卷積步長
C)過濾器大小
D)圖像大小
答案:B
解析:
95.[單選題]任何一個核函數(shù)都隱式地定義了一個(_)空間。
A)希爾伯特空間
B)再生希爾伯特空間
C)再生核希爾伯特空間
D)歐式空間
答案:C
解析:
96.[單選題]我想使用JavaAPI刪除HDFS中的非空文件夾/123,以下選項正確的是。
A)fs.delete(newPath("/123"));
B)fs.delete(newPath("/123"),false);
C)fs.delete(newPath("/123"),true);
D)delete()方法只能刪除文件或非空文件夾,不能直接刪除非空文件夾
答案:C
解析:
97.[單選題]例如數(shù)據(jù)庫中有A表,包括學(xué)生,學(xué)科,成績?nèi)齻€字段,數(shù)據(jù)庫結(jié)構(gòu)為學(xué)生學(xué)科成
績張三語文60張三數(shù)學(xué)100李四語文70李四數(shù)學(xué)80李四英語80如何統(tǒng)計最高分>80的
學(xué)科()
A)SELECTMAX(成績)FROMAGROUPBY學(xué)科HAVINGMAX(成績)>80;
B)SELECT學(xué)科FROMAGROUPBY學(xué)科HAVING成績>80;
C)SELECT學(xué)科FROMAGROUPBY學(xué)科HAVINGMAX(成績)>80;
D)SELECT學(xué)科FROMAGROUPBY學(xué)科WHEREMAX(成績)>80;
答案:C
解析:
98.[單選題]下列關(guān)于支持向量機(jī)優(yōu)化性問題的形式說法正確的是(_)。
A)它是一個凸二次規(guī)劃問題
B)它是一個凸一次規(guī)劃問題
0它是一個凹二次規(guī)劃問題
D)它是一個凹一次規(guī)劃問題
答案:A
解析:
99.[單選題]HFile數(shù)據(jù)格式中的Data字段用于()。
A)存儲實(shí)際的KeyValue數(shù)據(jù)
B)存儲數(shù)據(jù)的起點(diǎn)
C)指定字段的長度
D)存儲數(shù)據(jù)塊的起點(diǎn)
答案:A
解析:記住即可。畢竟Data字段用來存儲數(shù)據(jù)?
100.[單選題]多分類學(xué)習(xí)中,最經(jīng)典的三種拆分策略不包括()。
A)一對一
B)一對其余
C)一對多
D)多對多
答案:A
解析:多分類學(xué)習(xí)中,最經(jīng)典的三種拆分策略包括一對多、多對多、一對其余。
101.[單選題]下面關(guān)于機(jī)械思維的核心思想,描述錯誤的是:()
A)世界變化的規(guī)律是確定的
B)lit界變化的規(guī)律是無法確定的
C)規(guī)律不僅是可以被認(rèn)識的,而且可以用簡單的公式或者語言描述清楚
D)這些規(guī)律應(yīng)該是放之四海而皆準(zhǔn)的.可以應(yīng)用到各種未知領(lǐng)域指導(dǎo)實(shí)踐
答案:B
解析:
102.[單選題]在Matplotlib中,在當(dāng)前圖形上添加一個子圖需要用到的函數(shù)是()。
A)pit.stackplot()
B)plt.suptitle()
C)pit.subplot()
D)pit.imshow()
答案:C
解析:matplotlib.pyplot.subplot()函數(shù)的作用是在當(dāng)前圖形上添加一個子圖。
103.[單選題]電影評分是以下哪些的應(yīng)用實(shí)例(—)。
A)分類
B)聚類
C)強(qiáng)化學(xué)習(xí)
D)回歸
答案:D
解析:
104.[單選題]在HBase的專用過濾器中,單列排除過濾器是()
A)SingleValueExcludeFilter
B)SingleColumnExcludeFiIter
C)SingleColumnValueExcludeFilter
D)ColumnValueExcludeFilter
答案:C
解析:
105.[單選題]通過(),持續(xù)降低自動采集成本和操作難度,不斷提高公司數(shù)據(jù)的自動采集水平。
A)組織開展數(shù)據(jù)轉(zhuǎn)換技術(shù)及應(yīng)用研究
B)組織開展數(shù)據(jù)分類技術(shù)及應(yīng)用研究
C)組織開展數(shù)據(jù)錄入技術(shù)及應(yīng)用研究
D)組織開展數(shù)據(jù)自動采集技術(shù)及應(yīng)用研究
答案:D
解析:
106.[單選題]回歸方程判定系數(shù)的計算公式R2=SSR/SST=bSSE/SST,對判定系數(shù)描述錯誤的是()
A)式中的SSE指殘差平方和
B)式中的SSR指總離差平方和
C)判定系數(shù)用來衡量回歸方程的抗合優(yōu)皮
D)判定系教K等于相關(guān)系數(shù)的平方
答案:B
解析:
107.[單選題]下列哪個程序通常與NameNode在一個節(jié)點(diǎn)啟動?
A)SecondaryNameNode
B)DataNode
C)TaskTracker
D)Jobtracker
答案:D
解析:hadoop的集群是基于master/slave模式,namenode和jobtracker屬于master,datanode和
tasktracker屬于slave,master只有一個,而slave有多個。
JobTracker對應(yīng)于NameNode;
TaskTracker對應(yīng)于DataNode。
108.[單選題]a和b為兩個整數(shù),以下關(guān)系表達(dá)式語法錯誤的是?
A)a==b
B)ab
C)a>=b
D)a!=b
答案:B
解析:
109.[單選題]Oracle數(shù)據(jù)庫最近使用過的SQL語句存儲在
A)共享池
B)數(shù)據(jù)高速緩沖區(qū)
C)私有全局區(qū)
D)用戶全局區(qū)
答案:B
解析:
110.[單選題]K-搖臂賭博機(jī)屬于()算法。
A)機(jī)器學(xué)習(xí)
B)深度學(xué)習(xí)
C)強(qiáng)化學(xué)習(xí)
D)有監(jiān)督學(xué)習(xí)
答案:C
解析:
11L[單選題]二項分布的數(shù)學(xué)期望為()
A)n(l-n)p
B)np(1-p)
C)np
D)n(1-p)
答案:C
解析:
112.[單選題]MapReduce框架對()按照鍵值排序。。
A)中間結(jié)果
B)最終結(jié)果
C)輸入數(shù)據(jù)
D)輸出數(shù)據(jù)
答案:A
解析:
113.[單選題]對于ADS的主鍵,()說法是正確的。
A)對于updateType=realtime的表來講,主鍵是必須的,且主鍵中不能包含作為一級hash分區(qū)的分區(qū)
列
B)對于ADS的普通表,無論updateType如何取值,主鍵是必要的
C)對于updateType=batch的表來講,主鍵是必須的,主要是約束導(dǎo)入數(shù)據(jù)時的重復(fù)記錄
D)有主鍵的表的性能和用法上和沒有主鍵的表之間沒有任何區(qū)別
答案:D
解析:
114.[單選題]進(jìn)入要操作的數(shù)據(jù)庫TEST用以下哪一項()
A)INTEST
B)SHOWTEST
OUSERTEST
D)USETEST
答案:D
解析:
115.[單選題]在圖集合中發(fā)現(xiàn)一組公共子結(jié)構(gòu),這樣的任務(wù)稱為()
A)頻繁子集挖掘
B)頻繁于圈挖掘
C)頻繁數(shù)據(jù)項挖掘
D)頻繁模式挖掘
答案:B
解析:
116.[單選題]以下哪一項不是Spark框架可用的資源調(diào)度系統(tǒng)?
A)Mesos
B)Yarn
C)deremel
D)aws
答案:C
解析:
117.[單選題](_)是一類用圖來表達(dá)變量相關(guān)關(guān)系的概率模型。
A)神經(jīng)元模型
B)感知機(jī)模型
C)概率圖模型
D)SVM
答案:C
解析:
118.[單選題]以下描述中錯誤的是()。
A)數(shù)據(jù)化與數(shù)字化是兩個不同概念
B)數(shù)據(jù)與數(shù)值是一個概念
C)大數(shù)據(jù)與海量數(shù)據(jù)是兩個不同的概念
D)數(shù)據(jù)和信息是兩個不同的概念
答案:B
解析:
119.[單選題]()對監(jiān)管數(shù)據(jù)質(zhì)量承擔(dān)最終責(zé)任
A)董事長
B)風(fēng)險管理部
C)行長
D)數(shù)據(jù)運(yùn)管部
答案:A
解析:
120.[單選題]阿里巴巴旗下的數(shù)據(jù)管理平臺,被稱為:
A)達(dá)摩盤
B)支付寶
C)螞蟻花唄
D)招財寶
答案:A
解析:
121.[單選題]感知層是物聯(lián)網(wǎng)體系架構(gòu)的()層。
A)第一層
B)第二層
C)第三層
D)第四層
答案:A
解析:
122.[單選題]執(zhí)行后可以查看Python的版本的是
A)importsysprint(sys.Version)
B)importsystemprint(system,version)
C)importsystemprint(system.Version)
D)importsysprint(sys.version)
答案:D
解析:
123.[單選題]一般地,”人“與”馬“分別與”人馬“相似,但”人“與”馬”很不相似;要達(dá)到
這個目的,可以令”人“”馬“與”人馬”之間的距離都比較小,但”人“與”馬”之間的距離很
大,此時該距離不滿足(―)。
A)非負(fù)性
B)同一性
C)對稱性
D)直遞性
答案:D
解析:
124.[單選題]MapReduce中的歸約過程是
A)Map
B)Guiyue
C)Summary
D)Reduce
答案:D
解析:
125.[單選題]HDFS采用塊復(fù)制的概念,讓數(shù)據(jù)在集群的節(jié)點(diǎn)間進(jìn)行復(fù)制,從而實(shí)現(xiàn)了一個(—)的
系統(tǒng)。
A)云計算
B)分布式文件
C)流處理
D)高度容錯性
答案:D
解析:
126.[單選題]實(shí)現(xiàn)One-Hot編碼可以用Pandas中()函數(shù)。
A)groupby()
B)merge()
C)get_dummies()
D)llna()
答案:C
解析:get_dummies()生成啞變量,與One-Hot編碼一致。
127.[單選題]kafka-clustermirroring工具可以實(shí)現(xiàn)()功能。
A)kafka集群數(shù)據(jù)同步方案
B)kafka單集群內(nèi)數(shù)據(jù)備份
Okafka單集群內(nèi)數(shù)據(jù)恢復(fù)
D)以全部不對
答案:A
解析:
128.[單選題]線性回歸的基本假設(shè)不包括()。
A)隨機(jī)誤差項是一個期望值為0的隨機(jī)變量
B)對于解釋變量的所有觀測值,隨機(jī)誤差項有相同的方差
C)隨機(jī)誤差項彼此相關(guān)
D)解釋變量是確定性變量不是隨機(jī)變量,與隨機(jī)誤差項之間相互獨(dú)立
答案:C
解析:線性回歸的基本假設(shè)有:(1)線性關(guān)系假設(shè)。(2)正態(tài)性假設(shè)。指回歸分析中的Y服從正
態(tài)分布。(3)獨(dú)立性假設(shè)。包含兩個意思:①與某一個X對應(yīng)的一組Y和與另一個X對應(yīng)的一
組Y之間沒有關(guān)系,彼此獨(dú)立;②誤差項獨(dú)立,不同的X所產(chǎn)生的誤差之間應(yīng)相互獨(dú)立,無自相
關(guān)。(4)誤差等分散性假設(shè)。特定X水平的誤差,除了應(yīng)呈隨機(jī)化的常態(tài)分配,其變異量也應(yīng)相
等,稱為誤差等分散性。
129.[單選題]執(zhí)行以下代碼段時a=set('apple')b=set('orange')print(a&b)時,輸出為
(一)。
A){'r,'e','a','p')
\(iitfiiftiitr)
nBMr,a,g,e,n,o)
Cr>)\tf?11,?pf,?g1,tof,?e?,tnf,ia?,frt)1
D){,e:H}
答案:D
解析:
130.[單選題]BP算法基于(一)策略,以目標(biāo)的(―)梯度方向為參數(shù)進(jìn)行調(diào)整。
A)前向傳播,正
B)梯度下降,負(fù)
C)前向傳播,負(fù)
D)梯度下降,正
答案:B
解析:
131.[單選題]下列有關(guān)Hive和Impala的對比錯誤的是()。
A)Hive與Impala中對SQL的解釋處理比較相似,都是通過詞法分析生成執(zhí)行計劃
B)Hive與Impala使用相同的元數(shù)據(jù)
C)Hive適合于長時間的批處理查詢分析,而Impala適合于實(shí)時交互式SQL查詢
D)Hive在內(nèi)存不足以存儲所有數(shù)據(jù)時,會使用外存,而Impala也是如此
答案:D
解析:
132.[單選題]選擇哪一個解作為輸出,將由學(xué)習(xí)算法的歸納偏好決定,常見的做法是引人()
A)線性回歸
B)線性判別分析
C)正則化項
D)偏置項
答案:C
解析:
133.[單選題]下面哪個功能不是大數(shù)據(jù)平臺安全管理組件提供的功能0。
A)接口代理
B)接口認(rèn)證
C)接口授權(quán)
D)路由代理
答案:D
解析:接口可以對用戶的身份和請求的參數(shù)進(jìn)行驗證,以保證接口的安全。通過添加身份驗證和數(shù)字
簽名的方法提高接口安全性,防止數(shù)據(jù)被集改和信息泄露。
134.[單選題]在完整的異常語句中,語句出現(xiàn)的順序正確的是()o
A)try—exceptfelseffinally
B)try->else-*except-*finally
C)tryfexceptffinally—else
D)try-*else-*else-*except
答案:A
解析:
135.[單選題]Gremlin中查詢單個點(diǎn)的信息該用什么命令
A)g.VO.hasLabel("test")
B)g.VOhasLabel("test"),values("age")
C)9.VO.hasLabel("test).valueMap("String,list","age")
D)gV(13464736).valueMapO自
答案:D
解析:
136.[單選題]大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity,Variety,Veracity,其中Volume的含義是()
A)價值密度低
B)處理速度快
C)數(shù)據(jù)類型繁多
D)數(shù)據(jù)體量巨大
答案:D
解析:
137.[單選題]下列操作是只能刪除空目錄的是(—)。
A)rmtree
B)mkdir
C)chdir
D)rmdir
答案:D
解析:
138.[單選題]向量空間模型的缺陷不包括()
A)維度災(zāi)難
B)模型稀疏性
C)語義信息缺失
D)無法計算文本相似度
答案:D
解析:
139.[單選題]()和假設(shè)檢驗又可歸結(jié)為統(tǒng)計推斷的范疇,即對總體的數(shù)量特征做出具有一定可靠程度
的估計和判斷。
A)參數(shù)估計
B)邏輯分析
C)方差分析
D)回歸分析
答案:A
解析:推斷統(tǒng)計包括參數(shù)估計和假設(shè)檢驗兩方面的內(nèi)容。
140.[單選題]摩爾定律指出,當(dāng)價格不變時,集成電路上可容納的晶體管數(shù)目,約每隔()便會增
加一倍,性能也將提升一倍。
A)6個月
B)18個月
012個月
D)24個月
答案:B
解析:
141.[單選題]下列操作屬于預(yù)剪枝的是()。
A)信息增益
B)計算最好的特征切分點(diǎn)
C)限制樹模型的深度
D)可視化樹模型
答案:C
解析:預(yù)剪枝是指在決策樹生成過程中,對每個結(jié)點(diǎn)在劃分前先進(jìn)行估計,若當(dāng)前結(jié)點(diǎn)的劃分不能帶
來決策樹泛化性能提升,則停止劃分并將當(dāng)前結(jié)點(diǎn)標(biāo)記為葉結(jié)點(diǎn)。限制樹模型的深度屬于預(yù)剪枝。
142.[單選題]公司()負(fù)責(zé)研究審議網(wǎng)絡(luò)與數(shù)據(jù)安全總體方針、重大政策和重大事項。
A)國網(wǎng)安質(zhì)部
B)國網(wǎng)信通部
C)網(wǎng)絡(luò)安全和信息化領(lǐng)導(dǎo)小組
D)國網(wǎng)辦公廳
答案:C
解析:
143.[單選題]下列關(guān)于HDFS為存儲MapReduce并行切分和處理的數(shù)據(jù)做的設(shè)計,錯誤的是()
A)FSDataInputStream擴(kuò)展了DatalnputStream以支持隨機(jī)讀
B)為實(shí)現(xiàn)細(xì)粒度并行,輸入分片(InputSplit)應(yīng)該越小越好
C)一臺機(jī)器可能被指派從輸入文件的任意位置開始處理一個分片
D)輸入分片是一種記錄的邏輯劃分,而HDFS數(shù)據(jù)塊是對輸入數(shù)據(jù)的物理分割
答案:B
解析:
144.[單選題](一)是一個在HDFS上開發(fā)的面向列的分布式數(shù)據(jù)庫。
A)Hive
B)Pig
C)Mahout
D)Hbase
答案:D
解析:
145.[單選題]以下()在關(guān)系模型中表示屬性的取值范圍。-
A)元組
B)鍵
C)屬性
D)域
答案:D
解析:
146.[單選題]啟動hadoop所有進(jìn)程的命令是()。
A)start-dfs.sh
B)start-all.sh
C)start-hadoop.sh
D)start-hdfs.sh
答案:B
解析:
147.[單選題]以下圖像分割方法中,不屬于基于圖像灰度分布的閾值方法的是
A)類間最大距離法
B)最大類間、內(nèi)方差比法
C)p-參數(shù)法
D)區(qū)域生長法
答案:D
解析:
148.[單選題]數(shù)據(jù)管理成熟度模型中成熟度等級最高的是()。
A)已優(yōu)化級
B)已測量級
C)已定義級
D)已管理級
答案:A
解析:已優(yōu)化是數(shù)據(jù)管理成熟度模型中成熟度的最高等級。
149.[單選題]int('Oxa',16)的結(jié)果為(—)。
A)10
B)12
016
D)a
答案:A
解析:
150.[單選題]大數(shù)據(jù)的起源是().
A)金融
B)電信
C)互聯(lián)網(wǎng)
D)公共管理
答案:D
解析:
151.[單選題]業(yè)務(wù)中臺方面,以業(yè)務(wù)為導(dǎo)向,優(yōu)先建設(shè)()和客戶服務(wù)業(yè)務(wù)中臺,后期逐步視情況
拓展賬務(wù)結(jié)算等業(yè)務(wù)共享服務(wù)
A)電網(wǎng)服務(wù)業(yè)務(wù)中臺
B)電網(wǎng)資源業(yè)務(wù)中臺
C)電網(wǎng)優(yōu)化業(yè)務(wù)中臺
D)電網(wǎng)環(huán)境業(yè)務(wù)中臺
答案:B
解析:
152.[單選題]ElasticSearch中構(gòu)建一個query需要用到下列哪個代碼?
A)QueryBuilders.putQuery()
B)QueryBuilders.matchQuery()
C)QueryBuiIdersgetQuery()
D)QueryBuiIderscreateQuery()
答案:B
解析:
153.[單選題]關(guān)系云的一個重要功能是提供()。
A)數(shù)據(jù)庫即服務(wù)
B)虛擬服務(wù)
C)彈性計算
D)按需服務(wù)
答案:A
解析:關(guān)系云的一個重要功能是提供數(shù)據(jù)庫即服務(wù)(DatabaseasaService),用戶無須在本機(jī)安
裝數(shù)據(jù)庫管理軟件,也不需要搭建自己的數(shù)據(jù)管理集群,而只需要使用服務(wù)提供商提供的數(shù)據(jù)庫服
務(wù)。
154.[單選題]下列不屬于Transformation操作的是()。
A)map
B)filter
C)sample
D)count
答案:D
解析:
155.[單選題]使用池化層相比于相同步長的卷積層的優(yōu)勢在于?
A)參數(shù)更少
B)可以獲得更大下采樣
C)速度更快
D)有助于提升精度
答案:A
解析:
156.[單選題]下列關(guān)于線性回歸分析中的殘差說法正確的是()。
A)殘差均值總是為零
B)殘差均值總是約等于零
C)殘差均值總是大于本
D)以上答案都不正確
答案:A
解析:
157.[單選題]執(zhí)行以下代碼段x=32deffl():globalxx=14deff2():globalxx=
29print(x)時,輸出為()。
A)32
B)14
029
D)以上都不是
答案:A
解析:
158.[單選題]以下插入記錄正確的()
A)insertintoemp(ename,hiredate,sal)values(valuel,value2,value3);
B)insertintoemp(ename,sal)values(valuel,value2,value3);
C)insertintoemp(ename)values(valuel,value2,value3);
D)insertintoemp(ename,hiredate,sal)values(valuel,value2);
答案:A
解析:
159.[單選題]給定訓(xùn)練樣例集,設(shè)法將樣例投影到一條直線上,使得同類樣例的投影點(diǎn)盡可能接近、
異類樣例的投影點(diǎn)盡可能遠(yuǎn)離,這說的是()算法。
A)PCA
B)SVM
C)K-means
D)LDA
答案:D
解析:
160.[單選題]FusioninsightHD系統(tǒng)中,下面哪個方法不能查看到Loader作業(yè)執(zhí)行的結(jié)果
A)通過LoaderUI界面查看
B)通過YARN任務(wù)管理查看
C)通過NodeManager查看
D)通過Manager的告警查看
答案:C
解析:
161.[單選題]關(guān)于“from-import”形式,以下錯誤的選項是(—)。
A)從模塊名導(dǎo)入標(biāo)識符
B)這種導(dǎo)入形式可以防止名稱沖突
C)被導(dǎo)入模塊的命名空間是模塊導(dǎo)入的一部分
D)模塊中的標(biāo)識符可直接訪問為標(biāo)識符
答案:B
解析:
162.[單選題]下列模型中與文本分類相關(guān)的是()。
A)決策樹
B)神經(jīng)網(wǎng)絡(luò)
OKNN算法
D)以上都對
答案:D
解析:決策樹、神經(jīng)網(wǎng)絡(luò)、KNN算法都屬于統(tǒng)計學(xué)習(xí)方法,是文本分類領(lǐng)域的主流。
163.[單選題]()屬于Spark框架中的可擴(kuò)展機(jī)器學(xué)習(xí)庫。
A)MLib
B)GraphX
C)Streaming
D)SparkSQL
答案:A
解析:MLib是可擴(kuò)展機(jī)器學(xué)習(xí)庫。
164.[單選題]關(guān)于RDD,下列說法錯誤的是?
A)RDD具有血統(tǒng)機(jī)制答案:Lineage
B)RDD默認(rèn)存儲在磁盤
ORDD是一個只讀的,可分區(qū)的分布式數(shù)據(jù)集
D)RDD是Spark對基礎(chǔ)數(shù)據(jù)的抽象
答案:B
解析:
165.[單選題]Spark的集群管理模式不包含()。
A)Standalone模式
B)Message模式
OYARN模式
D)Mesos模式
答案:B
解析:Spark的集群管理主要有Standalone模式、YARN模式和Mesos模式三種。
166.[單選題]在Kafka集群中,Kafka服務(wù)端的角色是下列哪-項?
A)Producer
B)ZooKeeper
C)Consumer
D)Broker
答案:D
解析:
167.[單選題]()是!!。:?.rvs(5)的結(jié)果。
A)7.1316243700758
B)array([-0.35687759,1.34347647,-0.11710531,-1.00725181,-0.51275702])
C)array([1,2,3,4,5])
D)array([5,4,3,2,1])
答案:A
解析:
168.[單選題](_)不屬于基本分析方法。
A)回歸分析
B)分類分析
C)聚類分析
D)元分析
答案:D
解析:
169.[單選題]Hadoop使用了一套獨(dú)有的配置文件管理系統(tǒng),并提供自己的API,即使用()處理配
置信息。
A)org.apache,hadoop.conf.Configuration
B)org.apache,hadoop.conf.Config
C)org.apache,hadoop.fs.FileSystem
D)org.apache,hadoop.fs.Path
答案:A
解析:
170.[單選題]大數(shù)據(jù)的起源()
A)電信
B)互聯(lián)網(wǎng)
C)金融
D)公共管理
答案:B
解析:
171.[單選題]在Hadoop生態(tài)系統(tǒng)的組件中()是可擴(kuò)展可伸縮的工作流協(xié)調(diào)管理器。
A)Oozie
B)Flume
C)Sqoop
D)Hue
答案:A
解析:
172.[單選題]執(zhí)行以下代碼段cars=L'bmw','audi",'toyota",
'subaru']cars,sort()print(cars)時,輸出為()。
A)['audi','bmw','subaru','toyota']
B)['toyota','subaru','bmw','audi']
C)['bmw','audi','toyota','subaru']
D)['bmw','toyota','audi','subaru']
答案:A
解析:
173.[單選題]Flume中一個ChannelSelector的作用是什么?
A)設(shè)置多個channel發(fā)往多個sink的策略
B)設(shè)置一個source發(fā)往多個channel的策略
C)設(shè)置多個source發(fā)往多個channel的策略
D)設(shè)置一個channel發(fā)往多個sink的策略角
答案:B
解析:
174.[單選題]Hadoop2.x版本中的數(shù)據(jù)塊大小默認(rèn)是多少?()
A)64M
B)128M
O256M
D)512M
答案:B
解析:
175.[單選題]下列有關(guān)KNN算法的流程順序,描述正確的是()①確定K的大小,和距離的計算方法
②根據(jù)K個樣本的所屬類別,投票決定測試樣本的類別歸屬③計算訓(xùn)練集樣本與測試樣本的舉例,選
出K個與測試樣本最相似的樣本
A)①②③
B)③②①
C)①③②
D)②①③
答案:c
解析:
176.[單選題]HAVING子句的位置放在GROUPBY子句之()
A)前后都可以
B)前
C)后
D)以上都不對
答案:C
解析:
177.[單選題]以下哪項屬于Flume的基本數(shù)據(jù)單位?
A)Subject
B)Topic
C)Object
D)Event
答案:D
解析:
178.[單選題]消費(fèi)信息是否屬于用戶信息?()
A)屬于
B)不屬于
C)未定義
D)以上都不對
答案:A
解析:
179.[單選題]與生成方法、半監(jiān)督SVM、圖半監(jiān)督學(xué)習(xí)等基于單學(xué)習(xí)機(jī)器利用未標(biāo)記數(shù)據(jù)不同,基于
分歧的方法(disagreement-basedmethods)使用多學(xué)習(xí)器,而學(xué)習(xí)器之間的分歧(disagreement)對未
標(biāo)記數(shù)據(jù)的利用至關(guān)重要。()是此類方法的重要代表。
A)協(xié)同訓(xùn)練
B)組合訓(xùn)練
C)配合訓(xùn)練
D)陪同訓(xùn)練
答案:A
解析:協(xié)同訓(xùn)練是此類方法的重要代表,它很好地利用了多視圖的相容互補(bǔ)性。
180.[單選題]下列關(guān)于Python模塊的理解錯誤的是()。
A)模塊是包含函數(shù)和變量的Python文件
B)不可以使用"操作符訪問模塊中的函數(shù)和變量
C)可以導(dǎo)入模塊中的所有類
D)可以在一個模塊中導(dǎo)入另一個模塊
答案:B
解析:導(dǎo)入模塊后,可直接使用“模塊.函數(shù)名/變量名”訪問函數(shù)或變量。
181.[單選題]k-means算法中K指的是:()
A)K個樣本
B)K個質(zhì)心
C)K次迭代
D)K次方
答案:B
解析:
182.[單選題]某電商網(wǎng)站想要實(shí)現(xiàn)熱銷商品的實(shí)時TopN排名,可以使用哪種技術(shù)實(shí)現(xiàn)?
A)Elasticsearch的快速檢索
B)HBase的rowkey索引
C)Hive的關(guān)聯(lián)查詢分析
D)Redis的排序計算
答案:D
解析:
183.[單選題]()是表管理類,提供了一個接口來管理HBase數(shù)據(jù)庫的表信息。它提供的方法包括
:創(chuàng)建表、刪除表、列出表項、使表有效或無效,以及添加或刪除表列簇成員等。
A)Admin
B)Table
C)HTableDescriptor
D)HColumnDescriptor
答案:A
解析:
184.[單選題]以下不屬于維度建模過程的是()
A)選擇業(yè)務(wù)過程
B)定義粒度
C)建立模型
D)確定事實(shí)
答案:C
解析:
185.[單選題]下列哪個不屬于可視化工具?()
A)Google
B)D3
C)Visual.ly
D)Spark
答案:D
解析:
186.[單選題]與以下代碼段var=lOOifvar==200:print("1-Gotatrueexpression
value")print(var)elifvar==150:print("2-Gotatrueexpressionvalue")
print(var)elifvar==100:print("3-Gotatrueexpressionvalue")print(var)else:
print("4-Gotafalseexpressionvalue")print(var)等效的列表描述(___)0
A)1-GotatrueexpressionvaluelOO
B)2-GotatrueexpressionvaluelOO
C)3-GotatrueexpressionvaluelOO
D)4-GotatrueexpressionvaluelOO
答案:C
解析:
187.[單選題]數(shù)學(xué)關(guān)系式2
A)2
B)2
C)2
D)x>2orx
答案:B
解析:
188.[單選題]在Numpy中,數(shù)組拼接的函數(shù)不包括()。
A)append()
B)insert()
C)vstack()
D)where()
答案:D
解析:append()函數(shù)可向數(shù)組橫縱坐標(biāo)添加數(shù)組,insert()函數(shù)可向一維數(shù)組后添加數(shù)據(jù)
,vstack()函數(shù)可以進(jìn)行數(shù)組拼接,where()函數(shù)是對數(shù)據(jù)進(jìn)行條件篩選。
189.[單選題]HBase依賴提供強(qiáng)大的計算能力。
A)Zookeeper
B)Chubby
ORPC
D)MapReduce
答案:D
解析:記住即可
190.[單選題]在k近鄰學(xué)習(xí)算法中,隨著k的增加,上界將逐漸降低,當(dāng)k區(qū)域無窮大時,上界和下界
碰到一起,k近鄰法就達(dá)到了(_)。
A)貝葉斯錯誤率
B)漸進(jìn)錯誤率
C)最優(yōu)值
D)上界
答案:A
解析:
191.[單選題]()屬于淺層學(xué)習(xí)模
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人抵押貸款協(xié)議模板版
- 專業(yè)借款中介服務(wù)協(xié)議2024版B版
- 月度團(tuán)隊總結(jié)模板
- 2025年度茶葉品牌加盟連鎖經(jīng)營協(xié)議范本4篇
- 個人吊車租賃協(xié)議
- 二零二五年度跨境電商進(jìn)口貿(mào)易合同樣本3篇
- 2025年度智能家居系統(tǒng)定制銷售合同4篇
- 2025年度智能交通管理系統(tǒng)全國代理合同4篇
- 二零二五年度存單質(zhì)押養(yǎng)老產(chǎn)業(yè)金融服務(wù)合同3篇
- 2024版移動通信網(wǎng)絡(luò)建設(shè)與維護(hù)合同
- 中國的世界遺產(chǎn)智慧樹知到答案章節(jié)測試2023年遼寧科技大學(xué)
- 急診與災(zāi)難醫(yī)學(xué)課件 03 呼吸困難大課何琳zhenshi
- 急性腹瀉與慢性腹瀉修改版
- 先天性肌性斜頸的康復(fù)
- 《國際市場營銷》案例
- GB/T 37518-2019代理報關(guān)服務(wù)規(guī)范
- GB/T 156-2017標(biāo)準(zhǔn)電壓
- PPT溝通的藝術(shù)課件
- 內(nèi)科學(xué):巨幼細(xì)胞性貧血課件
- 暑假家校聯(lián)系情況記錄表
- 周計劃工作安排日程表Excel模板
評論
0/150
提交評論