版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
試題說明
本套試題共包括1套試卷
答案和解析在每套試卷后
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案3(500題)
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案3
L[單選題]下列關(guān)于機器學(xué)習(xí)模型的說法正確的是()。
A)一個機器學(xué)習(xí)模型如果有較高準(zhǔn)確率,總是說明這個分類器是好的
B)如果增加模型復(fù)雜度,那么模型的測試錯誤率不一定會降低
C)如果增加模型復(fù)雜度,那么模型的訓(xùn)練錯誤率總是會降低
2.[單選題]大數(shù)據(jù)環(huán)境下,為了從大量電子數(shù)據(jù)中挖掘有用的信息,一些數(shù)據(jù)分析工具被開發(fā)出來
,主要有三類工具:批處理工具、流處理工具、交互式分析工具
A)交互式分析工具
B)嵌入式分析工具
C)模擬仿真工具
3.[單選題]MapReduce任務(wù)最終是在下列()中被執(zhí)行的。
A)NodeManager
B)container
C)ResourceManager
D)AppMaster
4.[單選題]什么是詞向量?
A)句子分詞得到的向量
B)多個詞組成的向量
C)對每個詞進行編碼得到的向量
D)文檔的向量表示
5.[單選題]下列關(guān)于誤差的說法,正確的是O
A)訓(xùn)練樣本容量增加,泛化誤差也會增加
B)過擬合指數(shù)據(jù)在訓(xùn)練集上的誤差過大
C)過擬合可以通過減少模型參數(shù)數(shù)量解決
D)交叉驗證不重復(fù)使用數(shù)據(jù)
6.[單選題]在其它條件不變的前提下,以下哪種做法容易引起機器學(xué)習(xí)中的過擬合問題
A)增加訓(xùn)練集數(shù)量
B)減少神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點數(shù)
C)刪除稀疏的特征
D)SVM算法中使用高斯核/RBF核代替
7.[單選題]()是用來解決海量大數(shù)據(jù)文件存儲問題的,是目前應(yīng)用最廣泛的分布式文件系統(tǒng)。
A)HDFS
B)HBase
OHIve
D)Kafka
8.[單選題]以下關(guān)于turtle庫的描述,正確的是:
A)在importturtle之后就可以用CirCle()語句,來畫一個圓圈
B)要用fromturtleimportturtle來導(dǎo)入所有的庫函數(shù)
OhomeO函數(shù)設(shè)置當(dāng)前畫筆位置到原點,朝向東
D)seth(x)是Setheading(X)函數(shù)的別名,讓畫筆向前移動X
9.[單選題]IDC的定義除了揭示大數(shù)據(jù)傳統(tǒng)3V基本特征,即VOlUme、Variety和VeIOCity,還增添了
一個新特征是
A)量大
B)速度快
C)應(yīng)用廣
D)價值
10.[單選題]下列關(guān)于可視化工具中高級分析工具的說法,錯誤的是?()
A)R是屬于GNU系統(tǒng)的一個自由、免費、源代碼開放的軟件
B)Weka主要用于社交圖譜數(shù)據(jù)可視化分析,可以生成非??犰诺目梢暬瘓D形
C)GePhi主要用于社交圖譜數(shù)據(jù)可視化分析,可以生成非常酷炫的可視化圖形
D)R通常用于大數(shù)據(jù)集的統(tǒng)計與分析
11.[單選題]執(zhí)行以下代碼段Print(bool('FaISe'))Print(bool())時,輸出為(.)。
A)TrueTrue
B)TrueFalse
C)FalseTrue
D)FalseFalse
12.[單選題]關(guān)系云的一個重要功能是提供()。
A)數(shù)據(jù)庫即服務(wù)
B)虛擬服務(wù)
C)彈性計算
D)按需服務(wù)
13.[單選題]python語句Print(type({}))的結(jié)果是。()
A)class'dict'
B)class'tuple'
C)class'set'
D)class'list'
14.[單選題]第3次信息化浪潮的標(biāo)志是:O
A)個人計算機的普及
B)互聯(lián)網(wǎng)的普及
C)云計算、大數(shù)據(jù)和物聯(lián)網(wǎng)技術(shù)的普及
D)人工智能化
15.[單選題]針對MaXCOnIPUteSQL做邏輯分析的時候,會進行一些優(yōu)化,不包括:()優(yōu)化。
A)常量表達式(ConStantExpression)
B)列映射(ColumnProjection)
C)謂語動詞下沉(PredictPushDown)
D)掃描方式(ScanMethod)
16.[單選題]在早期版本低的HadooP中使用的是()方法來調(diào)度用戶的作業(yè)。
A)短作業(yè)優(yōu)先
B)高響應(yīng)比優(yōu)選
C)基于時間片輪轉(zhuǎn)
D)先進先出
17.[單選題]以下風(fēng)險管理工作,哪些可運用大數(shù)據(jù)實現(xiàn)?
A)貸款催收
B)憑證審閱
C)風(fēng)險模型預(yù)警
D)以上都是
18.[單選題]數(shù)據(jù)資產(chǎn)應(yīng)用以安全可控為前提,按照()的原則,落實安全與保密責(zé)任。
A)誰經(jīng)手,誰使用,誰負責(zé)
B)誰主管,誰負責(zé)
C)誰使用,誰主管,誰負責(zé)
D)誰錄入,誰使用,誰負責(zé)
19.[單選題]哪個軟件架構(gòu)是GOogIe提出的用于處理海量數(shù)據(jù)的并行編程模式和大規(guī)模數(shù)據(jù)集的
A)GFS
B)MapReduce
C)Chubby
D)Bigtable
20.[單選題]關(guān)于數(shù)據(jù)相關(guān)性,以下說法錯誤的是(一)。
A)相關(guān)性體現(xiàn)了大數(shù)據(jù)的靈魂
B)相關(guān)性思維實現(xiàn)了從“為什么”到“是什么”的思維轉(zhuǎn)變
C)相關(guān)性關(guān)注事物的因果關(guān)系
D)相關(guān)性關(guān)注事物的相關(guān)關(guān)系
21.[單選題]HDFS中當(dāng)前block大小為128M,如果當(dāng)前要上傳到HDFS中的文件大小為300M,那么在存
儲時會分配()個block進行存儲。
A)l
B)2
03
D)4
22.[單選題]第一數(shù)字定律中使用概率最大的數(shù)字是()。
A)0
B)l
02
D)3
23.[單選題]下列關(guān)于HiVe中連接查詢描述正確的是()
A)HiVe中連接查詢只支持相等連接而不支持不等連接
B)HiVe中連接查詢支持相等連接和不等連接
C)HiVe中連接查詢只支持不等連接而不支持相等連接
D)以上都不對
24.[單選題]在TF-IDF算法中,在計算完詞頻與逆文檔頻率后,將兩者()后得到最終的結(jié)果。
A)相加
B)相減
C)相乘
D)相除
25.[單選題]下列選項中,關(guān)于HBaSe特性描述不正確的一項是()。
A)高可靠性
B)高性能
C)面向行
D)可伸縮
26.[單選題]對于二分類問題,線性分類器用一個超平面將兩類樣本分開,對于二維平面,這個超平面
是一條()
A)折線
B)曲線
C)直線
D)以上說法都不對
27.[單選題]由于不同類別的關(guān)鍵詞對排序的貢獻不同,檢索算法一般把查詢關(guān)鍵詞分為幾類,
以下哪一類不屬于此關(guān)鍵詞類型的是()。
A)、引用詞
B)、普通關(guān)鍵詞
C)、高頻詞匯
D)、擴展關(guān)鍵詞
28.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,系統(tǒng)在【客戶信息管理】一級菜單下增加【征
信報告查詢管理】二級菜單,用戶可在此菜單下的O節(jié)點查看否決意見。
A)待處理的征信報告
B)B.審批中的征信報告
C)C.審批批準(zhǔn)
D)D.審批否決
29.[單選題]如果問題存在最優(yōu)解,則下面幾種搜索算法中,()必然可以得到該最優(yōu)解。
A)廣度優(yōu)先搜索
B)深度優(yōu)先搜索
C)有界深度優(yōu)先搜索
D)啟發(fā)式搜索
30.[單選題]組合多條SQL查詢語句形成組合查詢的操作符是()
A)SELECT
B)ALL
C)LINK
D)UNION
31.[單選題]下列不屬于TranSfOrmation操作的是0
A)map
B)fIter
C)sample
D)count
32.[單選題]某單位運用隨機森林算法思想建立搶修熱點模型。該模型主要預(yù)測下期臺區(qū)工單數(shù)量
,構(gòu)建搶修熱點。模型構(gòu)建步驟如下:①將歷史數(shù)據(jù)進行隨機自助法重抽樣,生成N個訓(xùn)練樣本集;②將
N個訓(xùn)練樣本集分別做決策樹,生成N棵決策樹;③將N棵決策樹隨機構(gòu)成隨機森林;④未來根據(jù)預(yù)測樣
本氣候環(huán)境、設(shè)備屬性、設(shè)備工況進行隨機森林決策投票,得出針對該預(yù)測樣本最優(yōu)的決策樹進行運
算,并計算出最終結(jié)果。模型算法構(gòu)建步驟合理的順序是()。
A)①②③④
B)①③②④
C)④①②③
D)④②①③
33.[單選題]執(zhí)行以下代碼段ClaSSA:def_init_(self,x=1):self,x=xclassder(A):def
—init一(self,y=2):super().—init—()self,y=ydefmain():obj=der()print(obj.x,
Obj.y)main()時,輸出為(一)0
A)l1
B)l2
C)22
D)21
34.[單選題]在Matplotlib中設(shè)置X軸、y軸的刻度位置可用函數(shù)()。
A)xlabel()、ylabel()
B)xlimO、ylimO
C)Xscale()、yscale()
D)xticks()、yticks()
35.[單選題]以下哪個選項對Redis數(shù)據(jù)讀寫流程描述是正確的?(
A)ServerA節(jié)點返回集群拓撲-客戶端選擇集群任意一個serverA節(jié)點連接客戶端計算Key歸屬的槽
位以及對應(yīng)SerVerB節(jié)點并連接-Servere節(jié)點返回業(yè)務(wù)操作結(jié)果
B)客戶端選擇集群任意一個SerVerA節(jié)點連接-Servera節(jié)點返回集群拓撲客戶端計算Key歸屬的槽
位以及對應(yīng)SerVerB節(jié)點并連接一ServerB節(jié)點返回業(yè)務(wù)操作結(jié)果
C)ServerA節(jié)點返回集群拓撲-喜戶端計算Key歸屬的槽位以及對應(yīng)SerVerB節(jié)點并連接戶端選擇集
群任意一個SerVerA節(jié)點連接-eerB節(jié)點返回業(yè)務(wù)操作結(jié)果
D)客戶端選擇集群任意一個SerVera節(jié)點連接客戶端計算Key歸屬的槽位以及對應(yīng)SerVerB節(jié)點并連
接-ServerA節(jié)點返回集群拓撲-ServerB節(jié)點返回業(yè)務(wù)操作結(jié)果
36.[單選題]以下描述中不屬于"規(guī)整數(shù)據(jù)(TidyData)"三個基本原則的是()。
A)每一類觀察單元構(gòu)成一個關(guān)系(表)
B)每個觀察占且僅占一行
C)每個變量占且僅占一列
D)每個觀察占且僅占一個關(guān)系(表)
37.[單選題]關(guān)于MaXCOmPUte用戶和權(quán)限,說法正確的是:()。
A)每一個項目空間在創(chuàng)建后,需要手工創(chuàng)建一個admin的角色,并且為該角色授予了確定的權(quán)限
B)admin角色可以將admin權(quán)限指派給用戶
C)Admin可以設(shè)定項目空間的安全配置,但是不能修改項目空間的鑒權(quán)模型
D)MaXComPUte目前不支持在項目空間中徹底移除一個用戶及其所有權(quán)限數(shù)據(jù)。
38.[單選題]考察一個由三個卷積層組成的CNN:kernel=3×3,stride=2,padding=SAME0最低層
輸出100個特征映射(featuremap),中間層200個特征映射,最高層400個特征映射。輸入是
200X300的RGB圖片,則總參數(shù)的數(shù)量是()。
A)903400
B)2800
C)180200
D)720400
39.[單選題]F1參數(shù)(一),說明模型越穩(wěn)定。
A)越小
B)越大
C)越趨近于某一特定值
D)Fl參數(shù)和模型穩(wěn)定性沒有關(guān)系
40.[單選題]數(shù)據(jù)使用環(huán)節(jié)的安全技術(shù)措施除防火墻、()、防病毒、防DDOS、漏洞檢測等網(wǎng)絡(luò)安全
防護技術(shù)措施外,還需實現(xiàn)以下安全技術(shù)能力:賬號權(quán)限管理、數(shù)據(jù)安全域、數(shù)據(jù)脫敏、日志管理和
審計、異常行為實時監(jiān)控和終端數(shù)據(jù)防泄漏。
A)入侵檢測
B)病毒檢測
C)程序檢測
D)進程檢測
41.[單選題]下列哪個程序通常與NameNode在同一個節(jié)點啟動
A)TaskTracker
B)DataNode
C)SecondaryNameNode
D)Jobtracker
42.[單選題]大數(shù)據(jù)計算服務(wù)項目空間Prjl中存在表tl,其中包含一列名字為id,OWner打開
LabelSeCUrity設(shè)置后,執(zhí)行如下命令:SETLABEL1TOTABLEtl;SETLABEL2TOTABLE
tl(id);SETLABEL3TOTABLEtl;此時,tl表中的id列的敏感等級標(biāo)簽()。
A)I級
B)3級
C)2級
D)O級
43.[單選題](一)是一種建立在HadooP之上的數(shù)據(jù)倉庫架構(gòu)。
A)HDFS
B)Flume
C)Sqoop
D)Hive
44.[單選題]長短時記憶神經(jīng)網(wǎng)絡(luò)被設(shè)計用來解決什么問題?()
A)、傳統(tǒng)RNN存在的梯度消失/爆炸問題
B)、傳統(tǒng)RNN計算量大的問題
C)、傳統(tǒng)RNN速度較慢的問題
D)、傳統(tǒng)RNN容易過過擬合的問題
45.[單選題]下面哪一個不屬于大數(shù)據(jù)倫理問題:()
A)隱私泄露問題
B)數(shù)據(jù)安全問題
C)數(shù)字鴻溝問題
D)數(shù)據(jù)冗余問題
46.[單選題]執(zhí)行以下代碼段CiaSSFather():def_init_(self,a,b):self,b=bifa<b:
self,a=aelse:self,a=bdefaction(self):self,a+=4classSon(Father):def
init_(self,a,b):self,a=8self,b=4defaction(self):self,a+=7self,b*=
2classGrandSon(Son):def—init—(self,a,b):Father.—init—(self,a,b)grandson=
GrandSon(9,6)grandson,action()print(grandson,a)?,輸出為()0
A)10
B)13
C)15
D)16
47.[單選題]以等可能性為基礎(chǔ)的概率是O。
A)古典概率
B)經(jīng)驗概率
C)試驗概率
D)主觀概率
48.[單選題]在神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中,感知機輸出層中的M-P神經(jīng)元通常被稱為()。
A)閾值邏輯單元
B)激活函數(shù)
C)擠壓函數(shù)
D)連接函數(shù)
49.[單選題]以下對于離線批處理的概念理解錯誤的是哪-項?
A)離線批處理對數(shù)據(jù)處理的時延要求不高。
B)離線批處理占用的內(nèi)存資源較多。
C)離線批處理通常通過眠作業(yè)、SPark作業(yè)或者HQL作業(yè)實現(xiàn)。
D)離線批處理針對的數(shù)據(jù)量較大。
50.[單選題]MapReduce默認的分區(qū)函數(shù)是()。
A)hash
B)disk
C)reduce
D)map
51.[單選題]查找表結(jié)構(gòu)用以下哪一項()
A)FIND
B)SELETE
C)ALTER
D)DESC
52.[單選題]Flink的數(shù)據(jù)轉(zhuǎn)換操作在:()環(huán)節(jié)中完成。
A)channel
B)Transformation
C)sink
D)source
53.[單選題]下列哪項通常是集群的最主要瓶頸_
A)CPU
B)網(wǎng)絡(luò)
C)磁盤IO
D)內(nèi)存
54.[單選題]在比較模型的擬合效果時,甲、乙、丙蘭個模型的相關(guān)指數(shù)R2的值分別約為0.71、
0.85.0.90,則擬合效果較好的模型是()。
A)甲
B)乙
C)丙
D)效果一樣
55.[單選題]下列代碼中最適合接受系統(tǒng)輸入是一個整數(shù)的是()。
A)num=input()
B)num=input("6")
C)num=int(input)
D)num=oat(input)
56.[單選題]使用Pig語句查詢一張名為tmp_table的表的前50行,下列語句正確的是()。
A)SELECT*FROMtmp_tableLIMIT50;
B)tmp_table_limit=LIMITtmp_table50;DUMPtmp_table_limit;
ODUMPtmp_tableLIMIT50
D)DUMPtmp_tableLIMIT=50;
57.[單選題]推薦系統(tǒng)為客戶推薦商品,自動完成個性化選擇商品的過程,滿足客戶的個性化需求,推
薦基于網(wǎng)站最熱賣商品、客戶所處城市、(),推測客戶將來可能的購買行為。
A)客戶的朋友
B)客戶的個人信息
C)客戶的興趣愛好
D)客戶過去的購買行為和購買記錄
58.[單選題]下面關(guān)于數(shù)據(jù)粒度的描述不正確的是:
A)粒度是指數(shù)據(jù)倉庫小數(shù)據(jù)單元的詳細程度和級別
B)數(shù)據(jù)越詳細,粒度就越小,級別也就越高
C)數(shù)據(jù)綜合度越高,粒度也就越大,級別也就越高
D)粒度的具體劃分將直接影響數(shù)據(jù)倉庫中的數(shù)據(jù)量以及查詢質(zhì)量
59.[單選題]留出法直接將數(shù)據(jù)集劃分為()個互斥的集合
A)一
B)二
C)三
D)四
60.[單選題]決策樹的基本流程遵循()的策略。
A)貪心
B)最優(yōu)化
C)分而治之
D)順序
61.[單選題]關(guān)于數(shù)據(jù)整合和分組的說法,不E確的是
A)數(shù)據(jù)連接可以用concat或merge函數(shù)
B)axis=l表示軸向連接
C)數(shù)據(jù)分組可以使用mean函數(shù)
D)使用agg可以自定義多個聚合函數(shù)
62.[單選題]遺忘門的作用是()。
A)保留重要信息
B)去除不重要信息
C)信息增加
D)輸出
63.[單選題]創(chuàng)建數(shù)據(jù)庫使用以下哪項()
A)createmytest
B)createtablemytest
C)databasemytest
D)createdatabasemytest
64.[單選題]下列關(guān)于MaPRedUCe計算原理敘述不正確的一項是()0
A)將大數(shù)據(jù)集劃分為小數(shù)據(jù)集,小數(shù)據(jù)集劃分為更小數(shù)據(jù)集
B)將最終劃分的小數(shù)據(jù)分發(fā)布到集群節(jié)點上
C)以串行的方式完成計算處理
D)將計算結(jié)果遞歸融匯,得到最后的結(jié)果
65.[單選題]在SeleCt語句中,實現(xiàn)選擇操作的子句是()
A)select
B)groupby
C)where
D)from
66.[單選題]Python源程序文件的擴展名為()
A)pdb
B)db
Opy
D)exe
67.[單選題]決策樹中,同一路徑上的所有屬性之間是()關(guān)系
A)因果
B)相關(guān)
C)邏輯或
D)邏輯與
68.[單選題]()是SPark中用于結(jié)構(gòu)化數(shù)據(jù)處理的軟件包。
A)SPARKCORE
B)SparkSQL
C)SparkStreaming
D)Mllib
69.[單選題]下面關(guān)于MaPRedUCe模型中MaP函數(shù)與RedUCe函數(shù)的描述正確的是()
A)一個MaP函數(shù)就是對一部分原始數(shù)據(jù)進行指定的操作。
B)一個MaP操作就是對每個RedUCe所產(chǎn)生的一部分中間結(jié)果進行合并操作。
C)MaP與MaP之間不是相互獨立的。
D)RedUCee與RedUCe之間不是相互獨立的。
70.[單選題]數(shù)據(jù)資產(chǎn)應(yīng)用O以為前提,按照“誰經(jīng)手,誰使用,誰負責(zé)”的原則,落實安全與保
密責(zé)任。
A)來源明確
B)冗余率低
C)分類清晰
D)安全可控
71.[單選題]下面不屬于NoSQL的有(_)。
A)ORACLE
B)Redislabs
C)couchbase
D)paradigm4
72.[單選題]數(shù)據(jù)抽取是從數(shù)據(jù)源中抽取數(shù)據(jù)的過程,數(shù)據(jù)抽取的方式有全量抽取和()。
A)重點抽取
B)個別抽取
C)抽樣抽取
D)增量抽取
73.[單選題]一般情況下,若要提高EIaStiCSearCh檢索效率,可以采取什么操作?
A)調(diào)整索引分片數(shù)
B)使用HiVe做底層存儲
C)壓縮素引
D)正價ESMaSter節(jié)點
74.[單選題]下面屬于批處理技術(shù)的是:()
A)MapReduce
B)Storm
C)Spark
D)GraphX
75.[單選題]下列關(guān)于數(shù)據(jù)交易市場的說法中,錯誤的是()。
A)數(shù)據(jù)交易市場是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展到一定程度的產(chǎn)物
B)商業(yè)化的數(shù)據(jù)交易活動催生了多方參與的第三方數(shù)據(jù)交易市場
C)數(shù)據(jù)交易市場通過生產(chǎn)、研發(fā)和分析數(shù)據(jù),為數(shù)據(jù)交易提供幫助
D)數(shù)據(jù)交易市場是大數(shù)據(jù)資源化的必然產(chǎn)物
76.[單選題]下面幾種梯度下降方法中,哪種是速度最慢的:()
A)SGD
B)Adagrad
ORMSProp
D)Adam
77.[單選題]在我們神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,每次dropout想去掉20%的參數(shù),下面有關(guān)激活函數(shù)說法錯
誤的是:()
A)SigmOid容易飽和,出現(xiàn)梯度消失。
B)LeakyRelU是ReiU的一個變種,他在X
C)Tanh存在梯度消失問題,但是是0均值,而且收斂速度比Sigmoid慢。
D)ReIU收斂速度比Sigmoid和tanh快很多,可以緩解梯度消失現(xiàn)象。
78.[單選題]()反映數(shù)據(jù)的精細化程度,越細化的數(shù)據(jù),價值越高。
A)規(guī)模
B)活性
0關(guān)聯(lián)度
D)顆粒度
79.[單選題]HBase使用get方法讀取數(shù)據(jù)時,下列哪個選項是需要的?
A)Deletedelete=newDelete(rowkey)
B)scan.SetCaching(1000)
C)bytellrowkey=Bytes.toBytesC"012005000201")
D)List<Put>]putS=newArraylist<Put>0
80.[單選題]與以下代碼段foriinranged,101):ifint(i*0.5)==i*0.5:Print(i)等效
的列表描述(一)o
A)[iforiinrange(1,100)ifint(i*0.5)==(i*0.5)]
B)[iforiinrange(1,101)ifint(i*0.5)==(i*0.5)]
C)[iforiinrange(1,101)ifint(i*0.5)=(i*0.5)]
D)[iforiinrange(1,100)ifint(i*0.5)=(i*0.5)]
81.[單選題]在支持向量機中,軟間隔支持向量機的目標(biāo)函數(shù)比硬間隔支持向量機多了一個(_)。
A)偏置項b
B)系數(shù)
C)松弛變量
D)兩種情況的目標(biāo)函數(shù)相同
82.[單選題]Hive創(chuàng)建。時,會將數(shù)據(jù)移動到數(shù)據(jù)倉庫指向的路徑;創(chuàng)建O,僅記錄數(shù)據(jù)所在的
路徑,不對數(shù)據(jù)的位置做任何改變
A)內(nèi)部表.外部表
B)內(nèi)部表.元數(shù)據(jù)
C)原元數(shù)據(jù).外部表
D)外部表.托管表
83.[單選題]若不針對MapReduce編程模型中的key和VaIUe值進行特別設(shè)置,下列哪一項是
MapReduce不適宜的運算。()
A)Max
B)Min
C)Count
D)Average
84.[單選題]()可用來展示持續(xù)性數(shù)據(jù),可很好地表示趨勢、累積、減少以及變化。
A)柱形圖
B)地圖
C)面積圖
D)雷達圖
85.[單選題]Spark的核心概念不包括?
A)RDD
B)Hoq
C)寬套依賴
D)Shuffle
86.[單選題]以下哪個不是大數(shù)據(jù)的“4V”特性:()
A)數(shù)據(jù)量大
B)數(shù)據(jù)類型繁多
C)處理速度快
D)價值密度高
87.[單選題]關(guān)于FusionlnsightHD中Loader作業(yè)描述正確的是
A)Load可將作業(yè)提交到Y(jié)arn執(zhí)行后,如果此時Loader服務(wù)出現(xiàn)異常,則此作業(yè)執(zhí)行失敗。
B)LOader將作業(yè)提交至Yarn執(zhí)行后,如果某個MaPPer任務(wù)執(zhí)行失敗,能夠自動進行重試。
C)Loader作業(yè)執(zhí)行共敗后將會產(chǎn)生垃圾數(shù)據(jù),需要用戶手動清除
D)LOader將一個作業(yè)提交至Yarn執(zhí)行后,該作讓執(zhí)行完成前,不能再提交其他作業(yè)
88.[單選題]落實國家大數(shù)據(jù)安全保護要求時,需進一步明確大數(shù)據(jù)采集、傳輸、存儲、使用、開放
等各環(huán)節(jié)的O和具體措施。
A)責(zé)任主體
B)生產(chǎn)成本
C)關(guān)鍵技術(shù)
D)標(biāo)準(zhǔn)規(guī)范
89.[單選題]評估完模型之后,發(fā)現(xiàn)模型存在高偏差(highbi踴),應(yīng)采取的解決方法是0
A)減少模型的特征數(shù)量
B)增加模型的特征數(shù)量
C)增加樣本數(shù)量
D)以上答案都正確
90.[單選題]相對于HadoopMapReducel.0,Spark的特點不包括()。
A)速度快
B)并發(fā)多
C)通用性
D)易用性
91.[單選題]Flink的窗口,按窗口行為劃分不包含以下哪種?
A)容量窗口
B)滑動窗
C)滾動窗口
D)會話窗口
92.[單選題]一張表的主鍵個數(shù)為()
A)至多3個
B)沒有限制
C)至多1個
D)至多2個
93.[單選題]下面的循環(huán)會打印多少次"ILovePythonw?foriinrange(0,10,2):print('ILove
Python')
A)2
B)5
C)6
D)10
94.[單選題]下列關(guān)于類屬性和實例屬性的說法中,描述正確的是。。
A)類屬性既可以顯式定義,又能在方法中定義
B)公有類屬性可以通過類和類的實例訪問
C)通過類可以獲取實例屬性的值
D)類的實例只能獲取實例屬性的值
95.[單選題]Maxcompute拓展MR的主要特點是:()。
A)支持計算在內(nèi)存中進行,中間結(jié)果不落地
B)支持MaP后連續(xù)任意多個RedUCe操作
C)可以在上一次的reduce結(jié)束之后,直接增加一次map
D)從MaP直接到RedUCe,省去ShUffle階段
96.[單選題]有關(guān)HiVe支持的基本數(shù)據(jù)類型,TimeStamP表示()
A)時間戳
B)字符序列,可以指定字符集
C)字節(jié)數(shù)組
D)集合數(shù)據(jù)類型
97.[單選題]Flume中最小的獨立運行單位是()。
A)Source
B)Agent
C)Channel
D)Sink
98.[單選題IStructuredStreaming中通過什么機制解決數(shù)據(jù)的無序和滯后問題?
A)事件時間
B)流連接
C)Watermark機制
D)持續(xù)查詢
99.[單選題]輸入圖像為32x32,經(jīng)過步長為1,不進行Padding,卷積核為5x5的卷積層后,得到的特
征圖尺寸是多少?O
A)28x28
B)27x27
C)29x29
D)32x32
100.[單選題]下列關(guān)于SkIearn說法錯誤的是Oo
A)sklearn全稱為SCikitTearn
B)sklearn在官網(wǎng)被分為7個大塊
C)sklearn的聚類算法幾乎都已經(jīng)放在CIUSter模塊中了
D)sklearn需要NUmPy和SCiPy庫的支持
IOL[單選題]執(zhí)行"abedef''[::-l]語句時輸出是(Jo
A)fedcba
B)f
C)abcdef
D)abcde
102.[單選題]業(yè)務(wù)中臺方面,以業(yè)務(wù)為導(dǎo)向,優(yōu)先建設(shè)()和客戶服務(wù)業(yè)務(wù)中臺,后期逐步視
情況拓展賬務(wù)結(jié)算等業(yè)務(wù)共享服務(wù)
A)電網(wǎng)服務(wù)業(yè)務(wù)中臺
B)電網(wǎng)資源業(yè)務(wù)中臺
C)電網(wǎng)優(yōu)化業(yè)務(wù)中臺
D)電網(wǎng)環(huán)境業(yè)務(wù)中臺
103.[單選題]()屬于SVM應(yīng)用。
A)文本和超文本分類
B)圖像分類
C)新文章聚類
D)以上均是
104.[單選題]Relief的時間開銷隨采樣次數(shù)以及原始特征數(shù)(_)。
A)線性增長
B)指數(shù)型增長
C)快速增長
D)負增長
105.[單選題]Reduce階段不包括以下哪一步?。
A)排序
B)分區(qū)
C分組
D)規(guī)約
106.[單選題]YARN分層結(jié)構(gòu)的本質(zhì)是(一),負責(zé)整個系統(tǒng)的資源管理和分配。
A)ResourceManger
B)NodeManger
C)ApplicationMaster
D)Container
107.[單選題]下列哪個命令是刪除文件的?
A)dfs-clear
B)dfs-Is
C)dfs-rm
D)dfs-del
108.[單選題]下面程序段執(zhí)行后的輸出結(jié)果是()。
N=Is=l
Whilen<5:
S=s*nn=n+lprint(s)
A)24
B)10
C)120
D)15
109.[單選題]Hadoopl.0默認的調(diào)度器策略是哪個。()
A)先進先出調(diào)度器
B)計算能力調(diào)度器
C)公平調(diào)度器
D)優(yōu)先級調(diào)度器
110.[單選題]一幅大小為512X512的8比特圖像,則該圖像大小為(一)。
A)32KB
B)128KB
C)16KB
D)256KB
Ill.[單選題]一切皆可連,任何數(shù)據(jù)之間邏輯上都有可能存在聯(lián)系,這體現(xiàn)了大數(shù)據(jù)思維維度中的
()O
A)定量思維
B)相關(guān)思維
C)因果思維
D)檢驗思維
112.[單選題]O以上地方人民政府有關(guān)部門的網(wǎng)絡(luò)安全保護和監(jiān)督管理職責(zé),按照國家有關(guān)規(guī)定
確定
A)鄉(xiāng)級
B)縣級
C)市級
D)省級
113.[單選題]數(shù)據(jù)管理成熟度模型將機構(gòu)數(shù)據(jù)管理能力定義為(_)個不同成熟度等級,并給出了
(_)類關(guān)鍵過程域,共(_)個關(guān)鍵活動。
A)3,7,21
B)4,6,24
05,6,25
D)6,7,28
114.[單選題IMapReduce編程模型,鍵值對<key,value>的key必須實現(xiàn)哪個接口?()
A)WritableComparab1e
B)ComparabIe
OWritable
D)LongWritable
115.[單選題]CNN神經(jīng)網(wǎng)絡(luò)對圖像特征提取帶來了變革性的變化,使之前的人工特征提取升級到數(shù)據(jù)
驅(qū)動的自動特征提取,在αN中,起到特征提取作用的網(wǎng)絡(luò)層是()
A)ConVoIUtion層
B)fullConneet層
C)maxpooling層
D)norm層
116.[單選題]Maxcompute中,當(dāng)一個用戶被移除后,與該用戶有關(guān)的()授權(quán)會保留。
?)PaCkage授權(quán)
B)POIiCy授權(quán)
C)ACL授權(quán)
D)項目空間授權(quán)
117.[單選題]關(guān)于缺失值填補,不正確的說法是()。
A)填補數(shù)據(jù)可以用中位數(shù)或者眾數(shù)等
B)Pandas,dropna可以用來填補缺失值
C)用平均值填補會引入相關(guān)性
D)啞變量填補是將缺失值當(dāng)做一類新特征處理
118.[單選題]Hadoop環(huán)境下HDFS系統(tǒng)中的NameNOde實現(xiàn)的功能是()。
A)管理文件系統(tǒng)的命名空間
B)管理存儲空間
C)分配算力
D)調(diào)控算法
119.[單選題]下列關(guān)于GaUSSDB200的TOAST機制說法正確的是O?
A)存儲超過2KB的字段時,會觸發(fā)TOAST機制.
B)支持變長(Varlena)表現(xiàn)形式的數(shù)據(jù)類型.
C)存儲超過1/2KB的字段時,會觸發(fā)TOAST機制。
D)存儲超過IKB的字段時,會觸發(fā)ToAST機制。
120.[單選題]執(zhí)行以下代碼段IiStl=[1,5,9]Print(SUnI(IiStI))時,輸出為(_)。
A)l
B)5
09
D)15
121.[單選題]假如使用LaSSO回歸來擬合數(shù)據(jù)集,該數(shù)據(jù)集輸入特征有100個(XI,X2,…,
XlOO)O現(xiàn)在,把其中一個特征的值擴大10倍(如特征XD,然后用相同的正則化參數(shù)對LaSSO
回歸進行修正。那么下列說法正確的是()。
A)特征Xl很可能被排除在模型之外
B)特征Xl很可能還包含在模型之中
C)無法確定特征Xl是否被舍
D)以上答案都不正確
122.[單選題]防火墻、漏洞掃描、病毒防范和系統(tǒng)加固等服務(wù)屬于O
A)安全增值服務(wù)
B)代理代維服務(wù)
C)優(yōu)化類服務(wù)
D)容災(zāi)服務(wù)
123.[單選題]K折交叉驗證器是()函數(shù)。
A)model_selection.GroupKFold()
B)model_SeleCtion.GroupShufeSplit()
C)model_selection.KFold()
D)model_seIection.RepeatedKFold()
124.[單選題]閱讀以下代碼,回答問題,當(dāng)n是11的時候,S為多少1deftotal(n):2s=03i=14
while(i
A)55
B)66
C)44
D)50
125.[單選題]已知初始問題的描述,通過一系列變換把此問題最終變?yōu)橐粋€子問題集合;這些子問題
的解可以直接得到,從而解決了初始問題。這是知識表示法叫OO
A)狀態(tài)空間法
B)問題歸約法
C)謂詞邏輯法
D)語義網(wǎng)絡(luò)法
126.[單選題]下面哪個是分布式數(shù)據(jù)庫O
?)HDFS
B)HBase
C)Oracle
D)Mysql
127.[單選題]HBase的物理存儲單元是什么?
A)Region
B)ColumnFamily
C)Column
D)ROW
128.[單選題]numPy中實現(xiàn)豎直軸分割數(shù)組的函數(shù)是什么?
A)np.vsplit
B)np.hsplit
C)np.dsplit
D)np.split
129.[單選題]假設(shè)現(xiàn)在要做一個可以根據(jù)線索指導(dǎo)運維人員進行排障的功能,你建議選擇下列哪個
工具實現(xiàn)該功能?
A)Lucene
B)HBase
C)ElasticSearch
D)GraphBase
130.[單選題]關(guān)于HiVe在FUSiOnlnSightHD中的架構(gòu)描述錯誤的是?
A)只要有一個HiVeSerVer不可用,整個HiVe集群便不可用
B)MOtaStOre用于提供元數(shù)據(jù)服務(wù),依賴于DBSerViCe
C)在同一時間點,HiVeSerVer只要一個處于ACtiVe狀態(tài),另一個則處于Standby狀態(tài)
D)HiVeSerVer負責(zé)接收客戶端請求.解析.執(zhí)行HQL命令并返回查詢結(jié)果
131.[單選題]哪一項不屬于FUSiOnInSightHD中HiVe的流控特性的描述?
A)支持對已經(jīng)建立的總連接數(shù)做閥值控制
B)支持對每個用戶已經(jīng)建立的連接數(shù)做閥值控制
C)支持對某個特定用戶已經(jīng)建立的連接數(shù)做閥值控制
D)支持對單位時間所建立的連接數(shù)做閥值控制
132.[單選題]()是GOOgle提出的用于處理海量數(shù)據(jù)的并行編程模式和大規(guī)模數(shù)據(jù)集的并行運算的
軟件架構(gòu)。
Λ)GFS
B)MapReduce
C)Chubby
D)BitTable
133.[單選題]下列關(guān)于數(shù)據(jù)交易市場的說法中,錯誤的是()。
A)數(shù)據(jù)交易市場是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展到一定程度的產(chǎn)物
B)咱商業(yè)化的數(shù)據(jù)交易活動催生了多方參與的第三方數(shù)據(jù)交易市場
C)數(shù)據(jù)交易市場通過生產(chǎn)、研友和分析數(shù)據(jù),為數(shù)據(jù)交易提供幫助
D)數(shù)據(jù)交易市場是大數(shù)據(jù)資源化的必然產(chǎn)物
134.[單選題]下列對于ADS中表和表組的描述正確的是()。
A)維度表在創(chuàng)建時不需要指定表組,但是需要配置分區(qū)信息
B)維度表可以和除維度表組外的任意表組中的表關(guān)聯(lián)
C)批量插入的表如果只有一級分區(qū),每次導(dǎo)入數(shù)據(jù)是會覆蓋掉已有數(shù)據(jù)
D)維度表組有且只有一個,用戶可以修改表組屬性,但是不能刪除
135.[單選題]np.arraySPIit()函數(shù)的作用是(_)o
A)沿著它的水平軸分割
B)沿著縱向的軸分割
C)允許指定沿哪個軸分割
D)按深度方向分割
136.[單選題]sciPy中模塊Signal.的作用是什么?
A)信號處理
B)程序輸入輸出
C)程序輸入輸出
D)計算積分
137.[單選題]大數(shù)據(jù)產(chǎn)業(yè)指什么?
A)一切與支撐大數(shù)據(jù)組織管理和價值發(fā)現(xiàn)相關(guān)的企業(yè)經(jīng)濟活動的集合
B)提供智能交通、智慧醫(yī)療、智能物流、智能電網(wǎng)等行業(yè)應(yīng)用的企業(yè)
C)提供數(shù)據(jù)分享平臺、數(shù)據(jù)分析平臺、數(shù)據(jù)租售平臺等服務(wù)的企業(yè)
D)提供分布式計算、數(shù)據(jù)挖掘、統(tǒng)計分析等服務(wù)的各類企業(yè)
138.[單選題]為保證流應(yīng)用的快照存儲的可靠性,快照主要存儲在:()。
A)本地文件系統(tǒng)中
B)JObManager的內(nèi)存中
C)HDFS中
D)可靠性高的單擊數(shù)據(jù)庫中
139.[單選題]下列選項中,用于標(biāo)識為靜態(tài)方法的是OO
A)@classmethod
B)PythOn標(biāo)示注釋使用符號是以下哪個?
C)?staticmethod
D)'?privatemethod
140.[單選題]HBase為什么適用于海量數(shù)據(jù)存儲?
A)集群規(guī)模小
B)支持列存表
C)多列簇特性
D)HDFS做底層存儲
141.[單選題]下列關(guān)于RDD說法,描述有誤的是?
A)一個RDD就是一個分布式對象集合,本質(zhì)上是一個只讀的分區(qū)記錄集合
B)每個RDD可分成多個分區(qū),每個分區(qū)就是一個數(shù)據(jù)集片段
C)RDD是可以直接修改的
D)RDD提供了一種高度受限的共享內(nèi)存模型
142.[單選題]以下不屬于生成式模型的是:
A)樸素貝葉斯
B)K近鄰
C)高斯混合模型
D)馬爾科夫隨機場
143.[單選題]在其他條件不變的前提下,()容易引起機器學(xué)習(xí)中的過擬合問題
A)增加訓(xùn)練集量
B)減少神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點數(shù)
C)刪除稀疏的特征
D)SVM算法中使用高斯拉底BF桂代替線性
144.[單選題]信息安全管理最關(guān)注的是?()
A)外部惡意攻擊
B)病毒對PC的影響
C)內(nèi)部惡意攻擊
D)病毒對網(wǎng)絡(luò)的影響
145.[單選題]數(shù)據(jù)、信息與知識三者之間的變化趨勢是O
A)宏課程
B)大課程
C)小課程
D)微課程
146.[單選題]在留出法、交叉驗證法和自助法三種評估方法中,()更適用于數(shù)據(jù)集較小、難以劃分訓(xùn)
練集和測試集的情況。
A)留出法
B)交叉驗證法
C)自助法
D)留一法
147.[單選題]下列關(guān)于鍵值數(shù)據(jù)庫的描述,哪一項是錯誤的:()
A)擴展性好,靈活性好
B)大量寫操作時性能高
C)無法存儲結(jié)構(gòu)化信息
D)條件查詢效率高
148.[單選題]下列操作是創(chuàng)建目錄的是(__)。
A)mkdir
B)chdir
C)rmdir
D)move
149.[單選題IFusionInsightHD集群組網(wǎng)設(shè)計中,有一種機架可以按照業(yè)務(wù)需求線性擴展,這種機
架被稱為()
A)基本框
B)擴展框
C)管理框
D)數(shù)據(jù)框
150.[單選題]下面說法錯誤的是()。
A)可以利用統(tǒng)計量對缺失值進行填補
B)可以利用K近鄰值對缺失值進行填補
C)只要有缺失值就必須把對應(yīng)記錄刪除
D)對于缺失值較多的屬性可以考慮刪除
151.[單選題]下列選項中,不屬于PythOn特點的是。()
A)面向?qū)ο?/p>
B)運行效率高
C)可移植性
D)免費和開源
152.[單選題]MySQL數(shù)據(jù)庫驅(qū)動文件放置于hive哪個目錄下O
A)jar
B)lib
Obin
D)sbin
153.[單選題]在HadoOP的分區(qū)階段,默認的PartitiOner是()。
A)RangePartitioner
B)Partitioner
C)HashPartitioner
D)用戶自定義的Partitioner
154.[單選題]大數(shù)據(jù)計算服務(wù)(MaxCompute,原ODPS)的運維人員想要知道一張日志表IOg已經(jīng)占
用了多少存儲空間,可以在命令行工具OdPSemd中使用()命令查看。
A)Islog;
B)desclog;
C)select*fromlog;
D)sizelog;
155.[單選題]下列選項中,哪個配置文件可以配置HDFS地址、端口號以及臨時文件目錄()
A)core-site,xml
B)hdfs-site.xml
C)mapred-site.xml
D)yarn-site,xml
156.[單選題]有N個樣本,一般用于訓(xùn)練,一般用于測試若N增大,則訓(xùn)練誤差和測試誤差之間的差
距會()
A)增大
B)減小
C)無法確定
D)無明顯變化
157.[單選題]下面哪個RDD操作肯定是寬依賴()
A)map
B)fIatMap
OreduceByKey
D)sample
158.[單選題]下面哪個不屬于matplotlib基本圖表包含的元素
A)坐標(biāo)軸
B)刻度
C)刻度標(biāo)簽
D)參考區(qū)域
159.[單選題]表A為ADS中的普通表,列a為其中一個普通列,類型為int,以下SQL()是正確的。
A)SELECTa+COUNT(*)FROMA
B)SELECTUDF_SYS_COUNT_COLUMN(a)FROMA
C)SELECTSUM(COUNT(*))FROMA
D)以上都正確
160.[單選題]下列關(guān)于Python文件處理的描述錯誤的是()。
A)Python能處理jpg圖像文件
B)Python不可以處理PDF文件
OPython能處理CSV文件
D)Python能處理Excel文件
161.[單選題]在空間維度上刻畫數(shù)據(jù)連續(xù)性是數(shù)據(jù)的()特點。
A)可關(guān)聯(lián)性
B)可溯源性
C)可理解性
D)可復(fù)制性
162.[單選題]()是指為最小化總體風(fēng)險,只需在每個樣本上選擇能使特定條件風(fēng)險最小的類別標(biāo)記。
A)支持向量機
B)間隔最大化
C)線性分類器
D)貝葉斯判定準(zhǔn)則
163.[單選題]Flume中基于WAL(預(yù)寫式日志W(wǎng)rite-AheadLog)實現(xiàn)ChanneI持久化的是?
A)JDBCChannel
B)KafkaChannel
C)MemoryChannel
D)FiIeChannel
164.[單選題]情感信息抽取不包括以下哪些方法?()
A)、基于命名實體識別的抽取方法
B)、基于重復(fù)段落的識別方法
0、基于語義角色標(biāo)注的抽取方法
D)、基于監(jiān)督學(xué)習(xí)抽取的學(xué)習(xí)方法
165.[單選題]下列的處理過程與RedUCe處理過程相似的是(一)0
A)Shuffle
B)Combiner
C)Partition
D)Map
166.[單選題]假設(shè)每個用戶最低資源保障設(shè)置為yarn,scheduler,capacity,root,
QueueA.minimum-userTimit-PerCent=24。則以下說法錯誤的是?
A)第3個用戶提交任務(wù)時,每個用戶最多獲得33.33%的資源
B)第2個用戶提交任務(wù)時,每個用戶最多獲得50%的資源
C)C第4個用戶提交任務(wù)時,每個用戶最多獲得25%的資源
D)D第5個用戶提交任務(wù)時,每個用戶最多獲得20%的資源
167.[單選題]CSV是一種通用的、相對簡單的文件格式,被用戶、商業(yè)和科學(xué)廣泛應(yīng)用。現(xiàn)在需要在
DEEP平臺中將多個字符串拼接成CSV格式的字符串。請選擇適用的數(shù)值轉(zhuǎn)換器:
A)Ceiling
B)CsvAssemble
C)CsnToString
D)TermExtract
168.[單選題]下面插入數(shù)據(jù)操作錯誤的是()。-
A)INSERT數(shù)據(jù)表名VALUE(值列表)
B)INSERTINTO數(shù)據(jù)表名VALUES(值列表)
C)INSERT數(shù)據(jù)表名VALUES(值列表)
D)INSERT數(shù)據(jù)表名(值列表)
169.[單選題]執(zhí)行以下代碼段deffl(a,b=[]):b.append(a)returnbprint(fl(1,[2,3]))時
,輸出為()o
A)[1,2,3]
B)[1,3,2]
C)[3,2,1]
D)[2,3,1]
170.[單選題]在hadoop配置中yarn-site,xml作用是()
A)用于定義系統(tǒng)級別的參數(shù)
B)用于名稱節(jié)點和數(shù)據(jù)節(jié)點的存放位置
C)用于配置
D)配置
171.[單選題]當(dāng)(_)過高,會出現(xiàn)欠擬合現(xiàn)象
A)偏差
B)方差
C)噪聲
D)泛化誤差
172.[單選題]YARN調(diào)度器分配資源的順序是:()o
A)任意機器一本地資源一同機架
B)任意機器一同機架一本地資源
C)本地資源一同機架一任意機器
D)同機架一任意機器一本地資源
173.[單選題]假設(shè)PreCiSiOn=TP/(TP+FP),recall=TP/(TP+FN),則在二分類問題中,當(dāng)測試集的正例
和負例數(shù)量不均衡時,以下評價方案中()是相對不合理的。
A)Accuracy:(TP+TN)/all
B)F-value:2recallprecision/(recal!+precision)
C)G-mean:sqrt(precision*recall)
D)AUC:曲線下面積
174.[單選題]國網(wǎng)數(shù)據(jù)中臺,是在下面()數(shù)據(jù)中心階段的基礎(chǔ)上發(fā)展過來的。
A)營銷服務(wù)中心
B)全業(yè)務(wù)統(tǒng)一數(shù)據(jù)中心
C)海量歷史/實時數(shù)據(jù)中心
D)電網(wǎng)GlS數(shù)據(jù)中心
175.[單選題]執(zhí)行下列語句后的顯示結(jié)果是什么?>>>World="world"?>print"hello"+
world
A)helloworld
B)“hello"world
C)helloworld
D)語法錯誤
176.[單選題]在MaPRedUCe中,以下描述錯誤的有()。
A)WOrker缸故障和MaSter故障的處理方法不相同
B)Map和Reduce的處理結(jié)果都存儲在本地文件件統(tǒng)
C)一個WOrker發(fā)生故障時,該節(jié)點上執(zhí)行完成的Map任務(wù)需要再次執(zhí)行
D)MapReduce具有很強的容錯機制
177.[單選題]離線批處理方案的應(yīng)用場景不包括?
A)占用計算存儲資源多
B)快速高效,實時的數(shù)據(jù)處理
C)數(shù)據(jù)處理格式多樣
D)處理大規(guī)模數(shù)據(jù)
178.[單選題]Hive中distributeby和Sortby的功能結(jié)合的是()
A)orderby
B)sortby
C)distributeby
D)clusterby
179.[單選題]大數(shù)據(jù)在餐飲行業(yè)的應(yīng)用不包括以下哪項?O
A)大數(shù)據(jù)驅(qū)動的團購模式
B)利用大數(shù)據(jù)為用戶推薦消費內(nèi)容
C)利用大數(shù)據(jù)調(diào)整線下門店布局
D)利用大數(shù)據(jù)控制消費人群的口味喜好
180.[單選題]如果x=5.5,則表達式x>0andx==int(x)的運算結(jié)果為;表達式x>0or
x==int(x)的運算結(jié)果為?
A)TrUe、False
B)False,True
C)TrUe、True
D)False,False
181.[單選題]以下語句錯誤的是()
A)selectsal+1fromemp;
B)selectsal*10,sal*deptnofromemp;
C)不能使用運算符號
D)selectsal*10,deptno*10fromemp;
182.[單選題]在一個簡單的線性回歸模型中(只有一個變量),如果將輸入變量改變一個單位
(增加或減少),那么輸出將改變()。
A)一個單位
B)不變
C)截距
D)回歸模型的尺度因子
183.[單選題]MaxCompute中負責(zé)對等待提交的task進行排序的模塊是:()。
A)Worker
B)Executor
C)Scheduler
D)controller
184.[單選題]把圖像分割問題與圖的最小割(mincut)問題相關(guān)聯(lián)的方法是()。
A)基于圖論的分割方法
B)分水嶺算法
OSLIC算法
D)基于閾值的方法
185.[單選題]對于缺失值的處理中,不屬于數(shù)據(jù)補齊的是()
A)熱卡填充
B)期望值最大化方法
C)人工填寫
D)隨機補充
186.[單選題]從數(shù)據(jù)庫架構(gòu)設(shè)計來看,主要有以下哪些設(shè)計思路?
A)Shared-Disk
B)Shared-Everying
C)Shared-Nothing
D)以上全都正確
187.[單選題]下列選項中,若是哪個節(jié)點關(guān)閉了,就無法訪問HadooP集群()。
A)namenode
B)datanode
C)secondarynamenode
D)yarn
188.[單選題]現(xiàn)階段的大數(shù)據(jù)技術(shù)體系主要類型不包括()。
A)數(shù)據(jù)源與App
B)基礎(chǔ)設(shè)施
OHadoop
D)D.數(shù)據(jù)資源
189.[單選題]下面()表示日期和時間的數(shù)據(jù)類型。--
A)DECIMAL(6,2)
B)DATE
OYEAR
D)TIMESTAMP
190.[單選題]在DlKW金字塔中屬于未來的是(一)。
A)信息
B)數(shù)據(jù)
C)知識
D)智慧
191.[單選題]下列選項中適合MapReduce的場景有?
A)實時交互計算
B)迭代計算
C)流式計算
D)離線計算
192.[單選題]綜合類大數(shù)據(jù)應(yīng)用管理主要包括應(yīng)用需求、分析應(yīng)用和O,由互聯(lián)網(wǎng)部統(tǒng)一組織開
展。
A)數(shù)據(jù)安全
B)成果管理
C)商務(wù)拓展
D)推廣應(yīng)用
193.[單選題]大數(shù)據(jù)的起源是()。
A)金融
B)電信
C)互聯(lián)網(wǎng)
D)公共管理
194.[單選題]()表達了在當(dāng)前任務(wù)上任何學(xué)習(xí)算法所能達到的期望泛化誤差的下界,即刻畫了學(xué)習(xí)問
題本身的難度。
A)偏差
B)方差
C)噪聲
D)泛化誤差
195.[單選題]在多元線性回歸模型中,若某個解釋變量對其余解釋變量的判定系數(shù)接近于1,則表明
模型中存在()
A)異方差
B)嘈序列相關(guān)
C)多重共線性
D)高擬合優(yōu)皮
196.[單選題]下列哪一種不屬于Bl工具數(shù)據(jù)集的數(shù)據(jù)字段類型?()
A)文本
B)數(shù)值
C)日期
D)整型
197.[單選題]數(shù)據(jù)科學(xué)是一門以“數(shù)據(jù)”,尤其是“大數(shù)據(jù)”為研究對象,并以數(shù)據(jù)統(tǒng)計、機器學(xué)
習(xí)、數(shù)據(jù)可視化等為理論基礎(chǔ),主要研究數(shù)據(jù)加工、數(shù)據(jù)管理、數(shù)據(jù)計算等活動的(一)o
A)新興科學(xué)
B)交叉性學(xué)科
C)獨立學(xué)科
D)一整套知識體系
198.[單選題]在計算擬合曲線時,如果擬合曲線始終沒有收斂,應(yīng)調(diào)整哪個參數(shù)?
A)增加迭代步數(shù)
B)減少迭代步數(shù)
C)增大收斂系數(shù)
D)減小收斂系數(shù)
199.[單選題]SQL語言的數(shù)據(jù)操縱語句包括SELECT、INSERT、UPDATE、DELETE等。其中最重要的,也
是使用最頻繁的語句是()。
A)UPDATE
B)SELECT
C)DELETE
D)INSERT
200.[單選題]下列算法中,()更適合做時間序列建模。
A)CNN
B)決策樹
C)LSTM
D)貝葉斯算法
201.[單選題]s=On=int(input())foriinrange(1,n+1):al=0forjinrange(1,i+
1):al+=ja=1.0/als+=aprint("s=%.If"%S)當(dāng)輸入的n為4時,輸出S=()。
A)l.5
B)1.4
01.6
D)l.7
202.[單選題]以下可以在字符串中表示單引號的是()。-
A)?"
B)??'
C)?'
D)'
203.[單選題]Spark的技術(shù)架構(gòu)中,SPark核心層的作用是什么?
A)資源管理
B)提供內(nèi)存計算框架
C)提供面向特定類型的計算服務(wù)
D)分布式數(shù)據(jù)存取
204.[單選題]神經(jīng)網(wǎng)絡(luò)研究屬于下列O學(xué)派
A)符號主義
B)連接主義
C)行為主義
D)都不是
205.[單選題]使用似然函數(shù)的目的是()。
A)求解目標(biāo)函數(shù)
B)得到最優(yōu)數(shù)據(jù)樣本
C)找到最適合數(shù)據(jù)的參數(shù)
D)改變目標(biāo)函數(shù)分布
206.[單選題]如果要將讀寫位置移動到文件開頭,需要使用的命令是()。
A)close
B)seek(0)
C)truncate
D)write(1stuff')
207.[單選題]FusionInsightHD中LOader從SFTP服務(wù)器導(dǎo)入文件,如果不需要做編碼轉(zhuǎn)換和數(shù)據(jù)轉(zhuǎn)
換且速度最快,選擇下面哪個文件類型?
A)test_file
B)sequence_file
C)binary_file
D)graph_file
208.[單選題](_)在劃分屬性時是在當(dāng)前結(jié)點的屬性集合中選擇一個最優(yōu)屬性。
A)AdaBoost
B)RF
C)Bagging
D)傳統(tǒng)決策樹
209.[單選題]以下哪些情景可以使用機器學(xué)習(xí)技術(shù)?O
A)記錄過去一段時間內(nèi)某移動運營商客戶轉(zhuǎn)移到競爭對手的案例
B)統(tǒng)計電商網(wǎng)站某類別商品在一定時間內(nèi)的銷量均值
C)統(tǒng)計某零售超市一個月內(nèi)哪類牛奶的銷量最大
D)為攜程在線旅游公司的客戶推薦度假產(chǎn)品
210.[單選題]下列不是數(shù)據(jù)科學(xué)項目的主要角色()。
A)項目發(fā)起人
B)項目經(jīng)理
C)操作員
D)驗收人員
211.[單選題]Python運算符中用來計算集合并集的是()。
A)l
B)&
Oll
D)+
212.[單選題]以下選項哪個是MapReduce正確的運行模型()
?)Reduce-Map-Shuffie
B)Shuffle-Map-Reduce
C)Map-Shuff1e-Reduce
D)Map-Reduce-Shuffie
213.[單選題]下列哪一種命令格式是不正確的()
?)get表行健列族
B)scan表時間戳起始行健結(jié)束行健
C)alter表列族
D)put表行鍵列族:列值
214.[單選題]關(guān)于計算機技術(shù)的描述以下正確的是,:
A)計算機是革命性技術(shù)
B)計算機早于工業(yè)革命時代誕生
C)計算機運行算法的時候跟CPU速度沒關(guān)系
D)計算機不能用來收集數(shù)據(jù)
215.[單選題]下列不屬于無監(jiān)督學(xué)習(xí)方法的是O
A)K-means
B)線性降維
C)DBSCAN
D)支持向量機
216.[單選題]以下()屬于DMM(數(shù)據(jù)管理成熟度模型)中的關(guān)鍵過程域"數(shù)據(jù)戰(zhàn)略"。
A)數(shù)據(jù)戰(zhàn)略制定
B)嘈業(yè)務(wù)術(shù)語表
C)數(shù)據(jù)質(zhì)量評估
D)過程質(zhì)量保障
217.[單選題]優(yōu)化管理體系,實現(xiàn)管理模式從(_)向(_)轉(zhuǎn)變,向各級組織和業(yè)務(wù)賦能。
A)數(shù)據(jù)化,業(yè)務(wù)化
B)平臺化,集約化
C)條塊化,共享化
D)縱向貫通,橫向貫通
218.[單選題]namenode默認的WebUl訪問端口號是()
A)50070
B)50060
C)50050
D)50040
219.[單選題]()選擇成為支持向量機的最大變數(shù)
A)核函數(shù)
B)樣本空間
C)模型
D)算法
220.[單選題]下列描述說法錯誤的是?O
A)SeCUreCRT是一款支持SSH的終端仿真程序,它能夠在WindoWS操作系統(tǒng)上遠程連接LinUX服務(wù)器執(zhí)
行操作。
B)HadOoP是一個用于處理大數(shù)據(jù)的分布式集群架構(gòu),支持在GNU/Linux系統(tǒng)以及WindOWS系統(tǒng)上進行
安裝使用。
C)VMware
D)SSH是一個軟件,專為遠程登錄會話和其他網(wǎng)絡(luò)服務(wù)提供安全性功能的軟件。
221.[單選題]以下哪項用來分組()
A)ORDERBY
B)ORDEREDBY
C)GROUPBY
D)GROUPEDBY
222.[單選題]假設(shè)我們使用原始的非線性可分版本的SOft-SVM優(yōu)化目標(biāo)函數(shù)。我們可通過0來保證
得到的模型是線性可分離的。
A)C=O
B)C=1
C)C正無窮大
D)C負無窮大
223.[單選題]創(chuàng)建分支語句如下,CREATEORREPLACEPROCEDUREproccase,branch(pi_result
ininteger,pi_returnoutinteger)ASBEGINCASEpi_resultWHEN!THENpi_return;=
1:WHEN2THENpi_return:=3:WHEN3THENpireturn:5:WHEN6THENPi_return:-7:WHEN
7THENpi_return
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度貸款代理中介業(yè)務(wù)持續(xù)發(fā)展合同4篇
- 2025年度個人持有的礦產(chǎn)資源開采權(quán)轉(zhuǎn)讓合同范本4篇
- 二零二五年度智能化采光井改造工程合同3篇
- 二零二五年度腳手架租賃與現(xiàn)場安全培訓(xùn)及維護合同4篇
- 2025年度水電設(shè)施拆除與重建工程承包協(xié)議4篇
- 二零二五倉儲中心智能監(jiān)控系統(tǒng)安裝合同2篇
- 2025年度展覽中心場地租賃合同終止及展覽品退回協(xié)議4篇
- 二零二四年度園林景觀防腐木板材采購合同
- 二零二五版馬戲團演出知識產(chǎn)權(quán)保護與維權(quán)合同4篇
- 2025版學(xué)校教育教學(xué)輔助勞務(wù)派遣服務(wù)合同3篇
- 醫(yī)院三基考核試題(康復(fù)理療科)
- 2024-2030年中國招標(biāo)代理行業(yè)深度分析及發(fā)展前景與發(fā)展戰(zhàn)略研究報告
- 醫(yī)師定期考核 (公共衛(wèi)生)試題庫500題(含答案)
- 基因突變和基因重組(第1課時)高一下學(xué)期生物人教版(2019)必修2
- 內(nèi)科學(xué)(醫(yī)學(xué)高級):風(fēng)濕性疾病試題及答案(強化練習(xí))
- 音樂劇好看智慧樹知到期末考試答案2024年
- 辦公設(shè)備(電腦、一體機、投影機等)采購 投標(biāo)方案(技術(shù)方案)
- 案卷評查培訓(xùn)課件模板
- 2024年江蘇省樣卷五年級數(shù)學(xué)上冊期末試卷及答案
- 人教版初中英語七八九全部單詞(打印版)
- 波浪理論要點圖解完美版
評論
0/150
提交評論