




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
試題說明
本套試題共包括1套試卷
答案和解析在每套試卷后
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案4(500題)
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案4
L[單選題]下列關(guān)于極大似然估計的描述,錯誤的是()
A)極大似然估計先假定其具有某種確定的概率分布形式
B)極大似然估計沒有確定的概率分布形式巳概率模型的訓(xùn)練過程就是參數(shù)估計
C)貝葉斯學(xué)派認(rèn)為參數(shù)本身也有分布,是未觀察的隨機變量
2.[單選題]當(dāng)前歸結(jié)式是O時,則定理得證。
A)永真式
B)包孕式(subsumed)
C)空子句
3.[單選題]Stage的TaSk的數(shù)量由什么決定()
A)Partition
B)Job
C)Stage
D)TaskScheduler
4.[單選題]在當(dāng)前社會中,最為突出的大數(shù)據(jù)環(huán)境是()
A)互聯(lián)網(wǎng)
B)物聯(lián)網(wǎng)
C)合國力
D)自然資源
5.[單選題IMapReduce通常將輸入的數(shù)據(jù)集分割為一些獨立的(),然后由一些MaP任務(wù)在服務(wù)器
集群上以完全并行的方式進(jìn)行處理。
A)鍵
B)值
C)鍵值對
D)數(shù)據(jù)塊
6.[單選題]Hadoop是一個實現(xiàn)了MaPRedUCe模式的開源的分布式并行的()。
A)編程語言
B)數(shù)據(jù)庫
C)編程范式
D)存儲單元
7.[單選題]信息系統(tǒng)安全等級保護(hù)是指()。
A)對國家安全、法人和其他組織及公民的專有信息以及公開信息和存儲、傳輸、處理這些信息的信
息系統(tǒng)分等級實行安全保護(hù)。
B)對國家安全、法人和其他組織及公民的專有信息以及公開信息和存儲、傳輸、處理這些信息的信
息系統(tǒng)分等級實行安全保護(hù),對信息系統(tǒng)中使用的信息安全產(chǎn)品實行按等級管理。
C)對國家安全、法人和其他組織及公民的專有信息以及公開信息和存儲、傳輸、處理這些信息的信
息系統(tǒng)分等級實行安全保護(hù),對信息系統(tǒng)中使用的信息安全產(chǎn)品實行按等級管理,對信息系統(tǒng)中發(fā)
生的信息安全事件分等級響應(yīng)和處置。
D)對國家安全、法人和其他組織及公民的專有信息以及公開信息和存儲、傳輸、處理這些信息的信
息系統(tǒng)分等級實行安全保護(hù),對信息系統(tǒng)中發(fā)生的信息安全事件分等級響應(yīng)和處置。
8.[單選題]Zookeeper啟動時會最多監(jiān)聽幾個端口()
A)l
B)2
03
D)4
9.[單選題]創(chuàng)建DRDS庫的時候,每個掛載的RDS實例默認(rèn)創(chuàng)建的庫的個數(shù)為:()。
A)16
B)8
04
D)2
10.[單選題]使用類間最大距離法進(jìn)行圖像分割時,下列步驟正確的是①計算相對距離度量值。②給
定一個初始閾值,將圖像分成目標(biāo)和背景兩類。③分別計算出兩類的灰度均值。④選擇最佳的閾值
,使得圖像按照該閾值分成兩類后,相對距離度量值達(dá)到最大。
A)①②③④
B)②①③④
C)②③①④
D)①③②④
11.[單選題]MapReducevl和MapReducev2的主要區(qū)別在哪里?
A)編程模型
B)數(shù)據(jù)處理引擎
C)運行時環(huán)境
D)任務(wù)備份機制
12.[單選題]關(guān)于高偏差說法錯誤的是()
A)、隨著訓(xùn)練樣本數(shù)增多,訓(xùn)練準(zhǔn)確率和交叉驗證準(zhǔn)確率趨于收斂,但與理想取值的偏
差很大
B)、高偏差意味著模型在訓(xùn)練集和交叉驗證集上的準(zhǔn)確率都很低,很可能存在“欠擬合”
現(xiàn)象。
0、造成欠擬合的主要原因有兩個:一是所訓(xùn)練出的模型過于簡單;二是所選擇的特征
32屬性并不提供充分信息,與本模型的功能并不相關(guān)。
D)、高偏差表示對應(yīng)模型很可能存在“過擬合”現(xiàn)象。
13.[單選題]支持向量回歸與傳統(tǒng)回歸模型的差別(一)。
A)模型輸出與真實值相同
B)模型輸出與真實值存在£偏差
C)模型輸出大于真實值
D)模型輸出小于真實值
14.[單選題]世界一流能源互聯(lián)網(wǎng)企業(yè)辦公室統(tǒng)籌組織,下設(shè)技術(shù)組、商務(wù)組和管理優(yōu)化組3個常設(shè)
小組,以下哪個不是管理優(yōu)化組的成員部門O
A)國網(wǎng)互聯(lián)網(wǎng)部
B)國網(wǎng)能源院
C)中國電科院
D)國調(diào)中心
15.[單選題]為提高計算性能,SPark中TranSformatiOn操作采用的是(__)計算模式。
A)活性
B)惰性
C)實時
D)非實時
16.[單選題]關(guān)于hive錯誤的是
A)數(shù)據(jù)存儲在HDFS中
B)通過類SQL語句快速實現(xiàn)MaPRedUCe統(tǒng)計
C)HiVe的設(shè)計目標(biāo)為適用于OLTP業(yè)務(wù)場景
D)不提供行級數(shù)據(jù)更新操作
17.[單選題]在Python3中執(zhí)行以下代碼段a=21b=IOprint(ab)時,輸出為()。
A)True
B)False
C)None
D)Error
18.[單選題]Hadoop中,()執(zhí)行文件系統(tǒng)命名空間操作。
A)DataNode
B)NameNode
C)JobTracker
D)TaskTracker
19.[單選題]一個正常的SPark任務(wù)會產(chǎn)生哪些調(diào)度任務(wù)?
A)DAG
B)RDD
OTask
D)Job
20.[單選題]機器學(xué)習(xí)中,基于樣本分布的距離是()。
A)馬氏距離
B)歐式距離
C)曼哈頓距離
D)閔可夫斯基距離
21.[單選題]數(shù)據(jù)資產(chǎn)維護(hù)是指為保證數(shù)據(jù)質(zhì)量,對數(shù)據(jù)進(jìn)行()等處理的過程。
A)更正
B)刪除
C)補充錄入
D)以上答案都正確
22.[單選題]HBase中數(shù)據(jù)存儲的文件格式是什么?
A)File
B)SequencefiIe
C)Log
D)TXTFiIe
23.[單選題]有關(guān)kmeans算法,正確的說法是?()
Qkmeans算法對異常樣本非常敏感,因此在聚類前要把異常樣本直接刪除。
B)kmeans只能處理凸型分布的非數(shù)值型樣本。
Okmeans聚類的過程與初始的k個假設(shè)的聚類中心的選擇沒關(guān)。
D)kmeans算法需要在聚類前確定類數(shù)k,這個k值需要有助于解釋各類的業(yè)務(wù)含義。
24.[單選題]若是想要實現(xiàn)自定義分組規(guī)則,則需要自定義Class類,然后繼承O類。
A)WritableComparator
B)Comparator
OWritable
D)WritableComparab1e
25.[單選題]下列關(guān)于PandaS庫的說法中正確的是()
A)Pandas中只有兩種數(shù)據(jù)結(jié)構(gòu)
B)PandaS不支持讀取文本數(shù)據(jù)
C)Pandas是在NUmPy基礎(chǔ)上建立的新程序庫
D)PandaS中SerieS和DataFrame可以解決數(shù)據(jù)分析中一切的問題
26.[單選題IFusionnInsigetHD系統(tǒng)中,F(xiàn)lume數(shù)據(jù)流在節(jié)點內(nèi)不需要經(jīng)過哪個組件?
A)Source
B)Sink
C)Topic
D)Channel
27.[單選題]根據(jù)《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》(國發(fā)(2015)50號),大數(shù)據(jù)發(fā)展和應(yīng)用在未來
5T0年確定要逐步實現(xiàn)的目標(biāo)不包括Oo
A)培育高端智能、新興繁榮的產(chǎn)業(yè)發(fā)展新生態(tài)
B)構(gòu)建以人為本、惠及全民的民生服務(wù)新體系
C)建立運行平穩(wěn)、安全高效的經(jīng)濟(jì)運行新機制
D)開啟軍民協(xié)同、軍地兩用的創(chuàng)新驅(qū)動新格局
28.[單選題]以下選項中,哪個程序負(fù)責(zé)HDFS數(shù)據(jù)存儲()。
A)NameNode
B)DataNode
C)Secondary
D)ResourceManager
29.[單選題]以下不屬于大數(shù)據(jù)在社會活動中的典型應(yīng)用的是()。
A)美團(tuán)實現(xiàn)了快速精準(zhǔn)的送餐服務(wù)
B)共享單豐、滴滴打車方便了人們的日常出行
C)快遞實現(xiàn)了訂單的實時跟蹤
D)供電公司提供電費賬單查詢
30.[單選題]HBase獲得COnneCtion連接正確的是()
A)Connectionconn=ConnectionFactory.CreateConnection(conf);
B)Connectionconn=ConnectionFactory.CreateConnectionO;
C)Connectionconn=Connection.CreateConnection(conf);
D)Connectionconn=Connection.CreateConnection();
31.[單選題]下列哪一個不屬于第三次信息化浪潮中新興的技術(shù)?
A)互聯(lián)網(wǎng)
B)云計算
C)大數(shù)據(jù)
D)物聯(lián)網(wǎng)
32.[單選題]若采用留出法將數(shù)據(jù)集D劃分為訓(xùn)練集S和測試集T,其中D包含1300個樣本,S包含700個
樣本,模型在T上有60個樣本分類錯誤,那么該模型的精度為(一)。
A)95.40%
B)90%
C)10%
D)4.90%
33.[單選題]在二分類問題中,當(dāng)測試集的正例和負(fù)例數(shù)量不均衡時,以下評價方案哪個是相對不合
理的()(假設(shè)PreCiSiOn=TP/(TP+FP),recall=TP/(TP+FN)。)
A)Accuracy:(TP+TN)∕all
B)F-value:2*recall*precision/(recal!+precision)
C)G-mean:sqrt(precision*recall)
D)AUC:ROC曲線下面積
34.[單選題]大數(shù)據(jù)的特點不包括下面哪一項()
A)、巨大的數(shù)據(jù)量
B)、多結(jié)構(gòu)化數(shù)據(jù)
C)、增長速度快
D)、價值密度高
35.[單選題]以下Python在數(shù)據(jù)科學(xué)中應(yīng)用的缺點的是()
A)、Python中可用于數(shù)據(jù)科學(xué)的第三方擴展包的數(shù)量多、功能強
B)、Python是一種解釋型語言,因此能較好地支持?jǐn)?shù)據(jù)科學(xué)中的交互式分析任務(wù)
C)、Python編寫的源代碼跨平臺性高,可擴展性和可移植性強
D)、Python代碼不能加密,因此安全性較低
36.[單選題]以下關(guān)于HiVe內(nèi)置函效描述正確的是?
A)to_data():獲取當(dāng)前日期
B)descfunctionsupper:查看系統(tǒng)自帶的函效
C)substr():求字符串長度
D)trim():去除空字符
37.[單選題]下列圖像邊緣檢測算子中抗噪性能最好的是()。
A)梯度算子
B)Prewitt算子
C)Roberts算子
D)Laplacian算子
38.[單選題]MaxCompute中,A和B都是bigint類型,進(jìn)行A/B運算,返回結(jié)果為:()。
A)double
B)int
C)bigint
D)float
39.[單選題]下列關(guān)于Bagging的說法錯誤的是()。
A)各基分類器之間有較強依賴,不可以進(jìn)行并行訓(xùn)練
B)最著名的算法之一是基于決策樹基分類器的隨機森林
C)當(dāng)訓(xùn)練樣本數(shù)量較少時,子集之間可能有重疊
D)為了讓基分類器之間互相獨立,需要將訓(xùn)練集分為若干子集
40.[單選題]Hive將表中的數(shù)據(jù)保存到文本,并使用命令插入到emplOyee表中的命令正確是()
A)loadlocalinpath'∕opt∕data∕test.txt'overwriteintotableemployee;
B)loaddatainpath'∕opt∕data∕test.txt'overwriteintotableemployee;
C)loaddatalocalinpathl∕opt∕data∕test.txt'intotableemployee;
D)loaddatalocalinpath1∕opt∕data∕test.txt'overwriteintotableemployee;
41.[單選題]Hadoop框架中最核心的設(shè)計是什么?
A)為海量數(shù)據(jù)提供存儲的HDFS和對數(shù)據(jù)進(jìn)行計算的MaPRedUCe
B)提供整個HDFS文件系統(tǒng)的NameSPaCe(命名空間)管理、塊管理等所有服務(wù)
C)HadOOP不僅可以運行在企業(yè)內(nèi)部的集群中,也可以運行在云計算環(huán)境中
D)HadooP被視為事實上的大數(shù)據(jù)處理標(biāo)準(zhǔn)
42.[單選題]()算法假設(shè)聚類結(jié)構(gòu)能通過樣本分布的緊密程度確定。
A)原型聚類
B)密度聚類
C)層次聚類
D)模型聚類
43.[單選題]回歸分析的任務(wù),就是根據(jù)()和因變量的觀察值,估計這個函數(shù),并討論與之有關(guān)的種種
統(tǒng)計推斷的問題。
A)相關(guān)變量
B)樣本
C)已知數(shù)據(jù)
D)自變量
44.[單選題]若學(xué)習(xí)如何種瓜,在種瓜過程中不斷摸索,從而總結(jié)出好的種瓜策略。這個過程抽象出
來,就是(_)。
A)機器學(xué)習(xí)
B)深度學(xué)習(xí)
C)強化學(xué)習(xí)
D)有監(jiān)督學(xué)習(xí)
45.[單選題]數(shù)據(jù)產(chǎn)品開發(fā)工作之中需要特別注意的基本活動不包括()。
A)創(chuàng)造性設(shè)計
B)數(shù)據(jù)洞見
C)虛擬化
D)個性化描述
46.[單選題]出現(xiàn)在datanode的VERSloN文件格式中但不出現(xiàn)在namenode的VERSlON文件格式中的是
A)namespaceID
B)StorageID
C)StorageType
D)IayoutVersion
47.[單選題]下面不屬于維歸約方法的是(_)。
A)PCA
B)SVD
ODWT
D)KNN
48.[單選題]以下代碼會打印多少次"ILovePythOn"?While'":print('ILove
Python')print('ILovePython')
A)0
B)100
C)程序錯誤不執(zhí)行
D)l
49.[單選題]關(guān)于“三型兩網(wǎng)”建設(shè),以下()說法不正確:
?)以建設(shè)泛在電力物聯(lián)網(wǎng)為主攻方向
B)進(jìn)一步改造提升傳統(tǒng)業(yè)務(wù)
C)發(fā)揮電網(wǎng)企業(yè)的平臺和資源優(yōu)勢,著力拓展新市場、開辟新領(lǐng)域、打造新業(yè)務(wù)
D)大力開拓互聯(lián)網(wǎng)經(jīng)濟(jì)這一巨大藍(lán)海市場
50.[單選題]具體來說,MaP對數(shù)據(jù)進(jìn)行指定的操作,生成(一)形式的中間結(jié)果。
A)數(shù)組
B)矩陣
0隊列
D)鍵值對
51.[單選題]定義域為{1,2,3}的離散屬性也可稱為稱為(_)。
A)無序?qū)傩?/p>
B)有序?qū)傩?/p>
C)連續(xù)屬性
D)離散屬性
52.[單選題]詞袋模型是在自然語言處理和信息檢索中的一種簡單假設(shè)。在這種模型中,文本(段落
或者文檔)被看作是()的詞匯集合,忽略語法甚至是單詞的順序。
A)無序
B)有序
C)無意義
D)規(guī)范
53」單選題]DougCUtting所創(chuàng)立的項目的名稱都受到其家人的啟發(fā),以下項目不是由他創(chuàng)立的項目
是()
A)Hadoop
B)Nutch
C)Lucene
D)Solr
54.[單選題]下列方法中,可以將字符串中的字母全部轉(zhuǎn)換為大寫的是()。
A)upper()
B)lower()
Otitle()
D)capitalize()
55.[單選題]以下說法正確的是()。
A)關(guān)聯(lián)規(guī)則挖掘過程是發(fā)現(xiàn)滿足最小支持度的所有項集代表的規(guī)則
B)尋找模式和規(guī)則主要是對數(shù)據(jù)進(jìn)行干擾,使其符合某種規(guī)則以及模式
C)數(shù)據(jù)挖掘的主要任務(wù)是從數(shù)據(jù)中發(fā)現(xiàn)潛在的規(guī)律,從而能更好地完成描述數(shù)據(jù)、預(yù)測數(shù)據(jù)等任務(wù)
D)在聚類分析當(dāng)中,簇內(nèi)的相似性越大,簇間的差別越大,聚類的效果就越差
56.[單選題]()對應(yīng)于決策樹結(jié)果,其他節(jié)點對應(yīng)于()。
A)葉節(jié)點,屬性測試
B)根結(jié)點,學(xué)習(xí)測試
C)內(nèi)部節(jié)點,學(xué)習(xí)測試
D)葉節(jié)點,分類測試
57.[單選題]Matplotlib中的legend()函數(shù)的作用是()。
A)設(shè)置標(biāo)簽文本
B)繪制網(wǎng)格線
C)標(biāo)示不同圖形的文本標(biāo)簽圖例
D)設(shè)置X軸的數(shù)值顯示范圍
58.[單選題]下列不屬于專家系統(tǒng)的解釋功能的主要作用是()。
A)對用戶說明為什么得到這個結(jié)論
B)對用戶說明如何得到這個結(jié)論
C)提高專家系統(tǒng)的信賴程度
D)對用戶說明專家系統(tǒng)的知識結(jié)構(gòu)
59.[單選題]執(zhí)行一個job,如果這個job的輸出路徑已經(jīng)存在,那么程序會()。
A)覆蓋這個輸出路徑
B)拋出警告,但是能夠繼續(xù)執(zhí)行
C)拋出一個異常,然后退出
D)創(chuàng)建一個新的輸出路徑
60.[單選題]Spark那個組件用于支持實時計算需求()
A)SparkSQL
B)SparkStreaming
C)SparkGraphX
D)SparkMLLib
61.[單選題]在“大數(shù)據(jù)財務(wù)分析”的可視化模塊中,下列說法錯誤的是()
A)每一個圖表類型均可以設(shè)置其圖形屬性
B)每一個圖表類型均可以設(shè)置其組件樣式
C)絕大部分的圖表在坐標(biāo)系中完成,坐標(biāo)系主要由橫軸與縱軸組成
D)一個坐標(biāo)系中只允許設(shè)置一個參數(shù)(維度或指標(biāo))
62.[單選題]numPy對數(shù)組進(jìn)行排序用什么函數(shù)?
A)np.sqrt()
B)np.eye()
C)np.identity()
D)np.sort()
63.[單選題]可視化中的組件樣式不包括()
A)標(biāo)題
B)自適應(yīng)顯示
C)標(biāo)簽
D)軸線
64.[單選題]()分類方法可以較好地避免樣本的不平衡問題
A)KNN
B)SVM
C)Bayes
D)神經(jīng)網(wǎng)絡(luò)
65.[單選題]在HDFS的數(shù)據(jù)讀取過程中,客服端首先調(diào)用。的實例的。pen()方法打開一個文件。
A)DistributedFiIeSystem
B)FileSystem
C)FSDataOutputStream
D)FSDataInputStream
66.[單選題]在HadooP框架中(—)為大數(shù)據(jù)提供了計算。
A)HDFS
B)MapReduce
C)YARN
D)Container
67.[單選題]以下描述中,哪一個選項屬于HDFS的使用場景?
A)海量氣象數(shù)據(jù)存儲
B)社交媒體數(shù)據(jù)流式分析
C)數(shù)據(jù)采集與開發(fā)
D)集群資源調(diào)配管理
68.[單選題]數(shù)據(jù)倉庫是隨著時間變化的,下面的描述不正確的是()。
A)數(shù)據(jù)倉庫隨時間的變化不斷增加新的數(shù)據(jù)內(nèi)容
B)捕捉到的新數(shù)據(jù)會覆蓋原來的快照
C)數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容
D)數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會隨著時間的變化不斷地進(jìn)行重新綜合
69.[單選題]學(xué)習(xí)率對機器學(xué)習(xí)模型結(jié)果會產(chǎn)生影響,通常希望學(xué)習(xí)率()
A)越小越好
B)越大越好
C)較小而選代次數(shù)較多
D)較大而選代次數(shù)較小
70.[單選題]Gateway在EIaStiCSearCh中的含義是?
A)網(wǎng)關(guān)
B)素引的存儲方式
C)rpc請求接
D)索引快照的存儲方式
71.[單選題]下列關(guān)于支持向量機優(yōu)化性問題的形式,說法正確的是()。
A)它是一個凸二次規(guī)劃問題
B)它是一個凸一次規(guī)劃問題
C)它是一個凹二次規(guī)劃問題
D)它是一個凹一次規(guī)劃問題
72.[單選題]Matplotlib的核心是面向()。
A)過程
B)對象
C)結(jié)果
D)服務(wù)
73.[單選題]國家電網(wǎng)有限公司數(shù)據(jù)管理辦法規(guī)定,在集中共享、服務(wù)應(yīng)用方面,依托全業(yè)務(wù)統(tǒng)一數(shù)
據(jù)中心和O進(jìn)行數(shù)據(jù)歸集、共享應(yīng)用,推動跨專業(yè)數(shù)據(jù)貫通融合。
A)企業(yè)中臺
B)業(yè)務(wù)中臺
C)數(shù)據(jù)中臺
D)國網(wǎng)云
74.[單選題]在HDFS中()是文件系統(tǒng)的工作節(jié)點。
A)DataNode
B)Client
ONameNode
D)Flume
75.[單選題]面向?qū)ο蟪绦蛟O(shè)計的缺點是(一)。
A)可擴展性
B)編程復(fù)雜度
C)共享性
D)易維護(hù)性
76.[單選題]圍繞()大領(lǐng)域開展泛在電力物聯(lián)建設(shè)任務(wù)
A)五
B)六
C)四
D)八
77.[單選題]kNN最近鄰方法在()情況下效果較好。
A)樣本較多但典型性不好
B)樣本較少但典型性好
C)樣本呈團(tuán)狀分布
D)樣本呈鏈狀分布
78.[單選題]從源數(shù)據(jù)源系統(tǒng)抽取目的數(shù)據(jù)源系統(tǒng)需要的數(shù)據(jù)這一過程稱為(—)。
A)數(shù)據(jù)抽取
B)數(shù)據(jù)轉(zhuǎn)換
C)數(shù)據(jù)加載
D)數(shù)據(jù)存儲
79.[單選題]下列關(guān)于IPython的說法,錯誤的是()
A)IPython集成了交互式Python的很多優(yōu)點
B)IPython的性能遠(yuǎn)遠(yuǎn)優(yōu)于標(biāo)準(zhǔn)的PythOn的Shell
C)IPythOn支持變量自動補全,自動收縮
D)與標(biāo)準(zhǔn)的PythOn相比,IPython缺少內(nèi)置的功能和函數(shù)
80.[單選題]下列屬于無監(jiān)督學(xué)習(xí)的是()。
A)K-means
B)SVM
C)最大蜻
D)CRF
8L[單選題]以下描述中不正確的是(—)o
A)歸納是指從特殊到一般的泛化過程
B)歸納是指從具體的事實歸結(jié)出一般性規(guī)律
C)演繹是指從特殊到一般的特化過程
D)演繹是指從基礎(chǔ)原理推演出具體情況
82.[單選題]內(nèi)外部合作單位和供應(yīng)商的數(shù)據(jù)安全管理過程中,應(yīng)確保內(nèi)部合作單位開發(fā)測試環(huán)境與
互聯(lián)網(wǎng)O,嚴(yán)禁外部合作單位、技術(shù)支持單位和供應(yīng)商在對互聯(lián)網(wǎng)提供服務(wù)的網(wǎng)絡(luò)和信息系統(tǒng)中
存儲或運行公司商業(yè)秘密數(shù)據(jù)和重要數(shù)據(jù)。
A)物理隔離
B)邏輯隔離
C)相互連接
D)間接連接
83.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,集團(tuán)圖譜頁面右側(cè)展示【放大】、【縮小】、
【刷新】、【展開】4個按鈕,其中具有“將展示的集團(tuán)圖譜刷新,并將其恢復(fù)到剛進(jìn)入頁面時的狀
態(tài)”功能的是O按鈕。
A)放大
B)B.縮小
OC.刷新
D)D.展開
84.[單選題]ApacheKUdU是通過什么方式來提高OLAP性能的?
A)預(yù)計算
B)列式存儲
C)內(nèi)存存儲
D)硬件加速
85.[單選題]下列代碼的運行結(jié)果是()。print('a'<'b'<'c')
A)a
B)b
OO
D)l
86.[單選題]Sqoop將導(dǎo)入或?qū)С雒罘g成什么程序來實現(xiàn)導(dǎo)入導(dǎo)出()
A)Spark
B)Storm
OMapReduce
D)Tez
87.[單選題]依托(),結(jié)合應(yīng)用推進(jìn)數(shù)據(jù)歸集,形成統(tǒng)一的數(shù)據(jù)資源中心。
A)全業(yè)務(wù)數(shù)據(jù)中心和數(shù)據(jù)平臺
B)營銷基礎(chǔ)數(shù)據(jù)平臺和大數(shù)據(jù)平臺
C)全業(yè)務(wù)中心和營銷基礎(chǔ)數(shù)據(jù)平臺
D)全業(yè)務(wù)數(shù)據(jù)中心和大數(shù)據(jù)平臺
88.[單選題]按粒度大小的順序,HiVe數(shù)據(jù)被分為:數(shù)據(jù)庫.數(shù)據(jù)表.()?桶?
A)元祖
B)欄
C)分區(qū)
D)行
89.[單選題]下列關(guān)于FIinkbarrier描述錯誤的是:()。
A)barrier周期性的插入到數(shù)據(jù)流中,并作為數(shù)據(jù)流的一部分隨之流動
B)barrier是Flink快照的核心
C)一個barrier將本周期快照的數(shù)據(jù)與下一周期快照的數(shù)據(jù)分隔開來
D)在插入barrier的時候,會暫時阻斷數(shù)據(jù)
90.[單選題]Hadoop平臺中;要查看YARN服務(wù)中一個application的信息;通常需要使用什么命令
A)container
B)applIcationattermpt
C)jar
D)application
91.[單選題]下列關(guān)于熱力點圖的說法中,錯誤的是()
A)熱力點圖是指根據(jù)數(shù)據(jù)的結(jié)果、以不同熱力色展示出數(shù)據(jù)大小的圖表
B)在熱力點圖中,顏色越熱烈往往意味著數(shù)值越大
C)我們可以設(shè)置熱力點圖中的點的大小,使其反應(yīng)出原始數(shù)據(jù)中其他指標(biāo)的狀況
D)熱力點圖中無法設(shè)置標(biāo)簽屬性
92.[單選題]下列程序執(zhí)行后輸出的結(jié)果為()X='abc,Y=XY=IOOPrint(X)
A)“abc”
B)100
097,98,99
D)以上三項均錯誤
93.[單選題]下列說法哪項有誤?
A)相對于SPark來說,使用HadOOP進(jìn)行迭代計算非常耗資源
B)SPark將數(shù)據(jù)載入內(nèi)存后,之后的迭代計算都可以直接使用內(nèi)存中的中間結(jié)果作運算,避免了從磁
盤中頻繁讀取數(shù)據(jù)
C)HadOoP的設(shè)計遵循“一個軟件棧滿足不同應(yīng)用場景”的理念
D)SPark可以部署在資源管理器YARN之上,提供一站式的大數(shù)據(jù)解決方案
94.[單選題]Hive交互ShelI指執(zhí)行$HlVEjOME∕bin∕hive之后,交互式命令行的提示符是()
A)help>
B)hive>
C)user>
D)cmd>
95.[單選題]HBase在新建表的時候必須指定表名和(),不需要指定列,所有的列在后續(xù)添加數(shù)據(jù)的
時候動態(tài)添加。
A)行
B)單元格
C)時間戳
D)列族
96.[單選題]以下選項中由客戶端編碼決定的是()。-
A)CharaCtejSet.server
B)character_set_database
C)CharaCtejsets_dir
D)character_set_results
97.[單選題]preprocessing,normalize。函數(shù)中的norm參數(shù)代表(—)。
A)需要正則化的對象
B)正則化的方式
C)對象的大小
D)返回值的維度
98.[單選題]執(zhí)行一個job,如果這個job的輸出路徑已經(jīng)存在,那么程序會()。
A)覆蓋這個輸出路徑
B)拋出警告,但是能夠繼續(xù)執(zhí)行
C)拋出一個異常,然后退出
D)創(chuàng)建一個新的輸出路徑
99.[單選題]3**3的結(jié)果為(—)。
A)l
B)3
09
D)27
100.[單選題]循環(huán)神經(jīng)網(wǎng)絡(luò)簡寫是O
A)CNN
B)RNN
OLSTM
D)SRN
IOL[單選題]開發(fā)MaXComPUte的用戶自定義標(biāo)量函數(shù),主要是實現(xiàn)其中的()方法。
A)evaluate
B)main
C)iterate
D)process
102.[單選題]運行下面代碼,輸出結(jié)果是()。
Importnumpyasnp
N=np.array([El,2,3],[4,5,6]])print(n.size)
A)2
B)6
C)(2,3)
D)(3,2)
103.[單選題]在一些算法中,為了進(jìn)行屬性之間的比較或運算,需要把不同屬性的不同變量取值范
圍變換成同一范圍,以免使得結(jié)果發(fā)生扭曲,偏向取值范圍大的變量這一過程稱為()。
A)合并
B)嘈數(shù)據(jù)聚合
C)歸一化
D)數(shù)據(jù)處理
104.[單選題]查找數(shù)據(jù)庫中所有的數(shù)據(jù)表用以下哪一項()
A)SHOWDATABASE
B)SHOWTABLES
C)SHOWDATABASES
D)SHOWTABLE
105.[單選題]SciPy庫中用于物理和數(shù)學(xué)常量計算的模塊是(_)。
A)scipy.cluster
B)scipy.io
C)scipy.constants
D)scipy.Iinalg
106.[單選題]企業(yè)中臺是一種實現(xiàn)公司核心資源共享化、服務(wù)化的理念和模式,從管理視角上強調(diào)
O,從技術(shù)視角上強調(diào)OO
A)服務(wù)化、企業(yè)級
B)企業(yè)級、服務(wù)化
C)共享化、服務(wù)化
D)服務(wù)化、共享化
107.[單選題]下面關(guān)于關(guān)系數(shù)據(jù)庫特點的描述,錯誤的是:O
A)采用表格的儲存方式,數(shù)據(jù)以行和列的方式進(jìn)行存儲,要讀取和查詢都方便
B)為了規(guī)范化數(shù)據(jù)、減少重復(fù)數(shù)據(jù)以及利用好存儲空間,把數(shù)據(jù)按照蟻小關(guān)系表的形式進(jìn)行存儲
C)由于關(guān)系數(shù)據(jù)庫將數(shù)據(jù)存儲在數(shù)據(jù)表中,數(shù)據(jù)操作的瓶頸出現(xiàn)在多張數(shù)據(jù)表的操作中.而且數(shù)據(jù)
表越多這個問題越嚴(yán)重
D)關(guān)系數(shù)據(jù)庫采用非結(jié)構(gòu)化查詢語言來對數(shù)據(jù)庫進(jìn)行查詢
108.[單選題]執(zhí)行以下代碼段importmathprint(math,modf(2.0))時,輸出為()0
A)(0.0,1.0)
B)(1.0,0.0)
C)(0.0,2.0)
D)(2.0,0.0)
109.[單選題]下列關(guān)于Numpy中秩(rank)的說法正確的是()。
A)在Numpy數(shù)組中,秩(rank)和形狀類似
B)在Numpy數(shù)組中,秩(rank)和軸是一個概念
C)在Numpy數(shù)組中,維數(shù)稱為秩(rank),一維數(shù)組的秩為1,二維數(shù)組的秩為2,以此類推
D)在Numpy數(shù)組中,沒有秩(rank)這個概念
110.[單選題]關(guān)于機器學(xué)習(xí)中的目標(biāo)函數(shù),說法錯誤的是()
A)、目標(biāo)函數(shù)(TA、rgetFunC,tion)又稱為"評價函數(shù)(EvA、IUA、tionFUnC、tion)w
B)、是機器學(xué)習(xí)算法中需要最大化或最小化一個函數(shù)
C)、可以直接、精確地表示目標(biāo)函數(shù)
D)、目標(biāo)函數(shù)包含誤差函數(shù)和正則化項。
Ill.[單選題]在HBaSe數(shù)據(jù)模型中,不可以作為行鍵的是。。
A)字符串
B)整數(shù)
C)二進(jìn)制串
D)并行化的結(jié)構(gòu)
112.[單選題]泛在電力物聯(lián)網(wǎng)的總體架構(gòu),以下哪個不是外部客戶O
A)能源供應(yīng)商
B)政府部門
C)能源服務(wù)商
D)生產(chǎn)客戶
113.[單選題]函數(shù)如下defchanagelnt(number2):number2=number2+lprintCchangeInt:
number2=",number2)#調(diào)用number1=2chanagelnt(numberl)print("nUInber:",numberl)打印結(jié)果
哪項是正確的()
A)changelnt:number2=3number:3
B)changelnt:number2=3number:2
C)number:2changelnt:number2=2
D)number:2changelnt:number2=3
∏4.[單選題]由于大數(shù)據(jù)要處理大量、非結(jié)構(gòu)化的數(shù)據(jù),所以在各處理環(huán)節(jié)中都可以采用()處理
A)串行
B)并行
C)邏輯
D)科學(xué)
115.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,從【集團(tuán)客戶管理】節(jié)點路徑進(jìn)入集團(tuán)圖譜
,在修訂模式下的集團(tuán)圖譜頁面,對于【行內(nèi)客戶已認(rèn)定】節(jié)點下的O客戶,鼠標(biāo)右鍵單擊,鼠
標(biāo)箭頭右下角除懸浮【新增】按鈕外,還懸浮【添加到信貸關(guān)系中】按鈕,點擊此按鈕,可將此節(jié)
點的未認(rèn)定客戶添加至【集團(tuán)家譜】菜單的集團(tuán)成員列表中。
A)行內(nèi)客戶未認(rèn)定
B)B.核心企業(yè)
OC.行內(nèi)客戶已認(rèn)定
D)D.行內(nèi)客戶認(rèn)定中
116.[單選題]下列關(guān)于Python中的OS模塊常見方法的描述錯誤的是()。
A)os.remove()刪除文件
B)os.rename()重命名文件
C)os.walk()讀取所有的目錄名
D)os.chdir()改變目錄
117.[單選題]執(zhí)行引擎的類型包括:()。
A)行執(zhí)行引擎
B)向量化執(zhí)行引擎
C)行列混合執(zhí)行引擎
D)以上都是
118.[單選題]對ElaStiCSearCh檢索流程描述正確的是?
A)檢索節(jié)點匯總結(jié)果發(fā)送給客戶端
B)分片節(jié)點不需要匯總結(jié)果直接把結(jié)果發(fā)送給客戶端
C)分片節(jié)點匯總結(jié)果發(fā)送給客戶端
D)檢索節(jié)點不需要匯總結(jié)果直接把結(jié)果發(fā)送給客戶端
119.[單選題]HDFS讀取文件時用的是哪一個read方法?
A)DataInputStream
B)FSDataInputStreani
C)DataOutputStream
D)FSDataOutputStream
120.[單選題]在WebHCat架構(gòu)中,用戶能夠通過安全的HTTPS協(xié)議執(zhí)行以下()操作。
A)執(zhí)行HiVeDDL操作
B)運行MaPRedUCe任務(wù)
C)運行HiVeSQL任務(wù)
D)以上全部正確
121.[單選題]以下程序的輸出結(jié)果是:d={"zhang":"China","Jone":"America",
"Natan":"Japan"}print(max(d),min(d))
A)JapanAmerica
B)zhang:ChinaJone=America
C)ChinaAmerica
D)zhangJone
122.[單選題]下列有關(guān)HiVe建表語句寫法正確的是CJ0
A)NEWTABLEemployees(empIDINT,nameSTRING);
B)CREATETABLEemployees(empIDINT,nameSTRING);
ONEWTABLEemployees(INTempID,STRINGname);
D)CREATETABLEemployees(INTempID,STRINGname);
123.[單選題]下面哪個不屬于RedUCer階段O
A)Shuffle
B)Sort
OMap
D)Reduce
124.[單選題]下列不屬于聚類性能度量外部指標(biāo)的是(_)。
A)JaCCard系數(shù)
B)FM系數(shù)
C)Rand指數(shù)
D)DB指數(shù)
125.[單選題]在Windows系統(tǒng)中,關(guān)閉Python終端會話常用的快捷鍵是()。
A)Ctrl+C
B)Ctrl+D
C)Ctrl+E
D)Ctrl+Z
126.[單選題]假設(shè)有n組數(shù)據(jù)集,每組數(shù)據(jù)集中X的平均值都是9,X的方差都是11,y的平
均值都是7.50,X與y的相關(guān)系數(shù)都是0.816,擬合的線性回歸方程都是y=3.00+0.500x。那么這
n組數(shù)據(jù)集()。
A)一樣
B)不一樣
C)無法確定是否一樣
D)以上都不對
127.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,系統(tǒng)在【客戶信息管理】一級菜單下增加【
征信報告查詢管理】二級菜單,用戶可在此菜單下發(fā)起征信報告查詢申請,以及查看審批批準(zhǔn)客戶
的征信報告。該菜單下設(shè)置【待處理的征信報告】、【審批中的征信報告】等O個節(jié)點,對應(yīng)征
信報告查詢申請的各節(jié)點。
A)l
B)B.2
OC.3
D)D.4
128.[單選題]scipy.StatS模塊中隨機變量的概率密度函數(shù)是什么?
A)stats
B)fit
C)pdf
D)ppf
129.[單選題]在HBaSe系統(tǒng)架構(gòu)中,HBaSe中最核心的模塊是()
A)HMaster
B)HRegionServer
C)ZooKeeper
D)Client
130.[單選題]下列對于等距離散化和等頻離散化的敘述中,不正確的是O
A)等距離散化是將連續(xù)型特征的取值區(qū)間均勻的劃分成多個區(qū)間段
B)等距離散化對數(shù)據(jù)離群值不敏感
C)等頻離散化考慮了區(qū)間段中的樣本個數(shù),使每個區(qū)間段的樣本數(shù)相同
D)等頻離散化會將相似的樣本劃分到不同的區(qū)間
131.[單選題]完全不考慮程序的內(nèi)部結(jié)構(gòu)和內(nèi)部特征,而只是根據(jù)程序功能導(dǎo)出測試用例的測試方
法是
A)錯誤推測法
B)白箱測試法
C)黑箱測試法
D)安裝測試法
132.[單選題]以下哪種方法屬于判別式模型(discriminativemodel)
A)隱馬模型(HMM)
B)樸素貝葉斯
C)LDA
D)支持向量機
133.[單選題]Namenode在啟動時自動進(jìn)入安全模式,在安全模式階段,說法錯誤的是()
A)安全模式目的是在系統(tǒng)啟動時檢查各個DataNOde上數(shù)據(jù)塊的有效性
B)根據(jù)策略對數(shù)據(jù)塊進(jìn)行必要的復(fù)制或刪除
C)當(dāng)數(shù)據(jù)塊最小百分比數(shù)滿足的最小副本數(shù)條件時,會自動退出安全模式
D)文件系統(tǒng)允許有修改
134.[單選題]線性判別分析是一種經(jīng)典的(_)學(xué)習(xí)方法。
A)線性
B)非線性
C)聚類
D)降維
135.[單選題]()不是HDFS的設(shè)計目標(biāo)。
A)流式數(shù)據(jù)訪問
B)大規(guī)模數(shù)據(jù)集
C)移動計算
D)”多次寫入,多次讀取”的文件訪問模型
136.[單選題]機器學(xué)習(xí)是對于一個計算機程序給定一個()和一個(),如果在()的影響下,P對
T的測量結(jié)果得到了改進(jìn),則可以認(rèn)為程序在E中學(xué)習(xí)了。
A)經(jīng)驗E、性能測量方法P、任務(wù)T
B)任務(wù)T、性能測量方法P、經(jīng)驗E
C)任務(wù)T、經(jīng)驗E、性能測量方法P
D)性能測量方法P、經(jīng)驗E、任務(wù)T
137.[單選題]Action是RDD的算子的一個類型,不可以將結(jié)果寫入O.
A)磁盤
B)CPU
OHDFS
D)數(shù)據(jù)庫
138.[單選題]對于ADS,()說法不正確。
A)ADS表存在主鍵,即可根據(jù)主鍵使用delete刪除紀(jì)錄
B)普通表分區(qū)列如果是字符串型,則不支持普通表之間的join
C)自查詢之間不支持join
D)ADS通過UNlON(ALL)各個分區(qū)內(nèi)的查詢結(jié)果實現(xiàn)自查詢
139.[單選題]資源注冊頁面,點擊Solr增量索引的作用是:()。
A)創(chuàng)建索引
B)增加索引
C)更新索引
D)刪除索引
140.[單選題]用戶輸入整數(shù)的時候不合規(guī)導(dǎo)致程序出錯,為了不讓程序異常中斷,需要用到的語句
是:
A)if語句
B)eval語句
C)try-except語句
D)循環(huán)語句
141.[單選題]()不是Hive支持的數(shù)據(jù)類型。
Λ)Struct
B)Int
OMap
D)Long
142.[單選題]以下關(guān)于異常處理try語句塊的說法,不正確的是。。
A)finalIy語句中的代碼段始終要被執(zhí)行
B)一個try塊后接一個或多個except塊
C)一個try語句塊后接一個或多個finalIy塊
D)try塊必須與except或finalIy塊一起用
143.[單選題]下面關(guān)于分析學(xué)習(xí)描述正確的是(_)。
A)分析學(xué)習(xí)的缺陷在于不完美的領(lǐng)域理論
B)分析學(xué)習(xí)的目標(biāo)是擬合數(shù)據(jù)假設(shè)
C)分析學(xué)習(xí)通過演繹推理
D)分析學(xué)習(xí)無需先驗知識
144.[單選題]RDD中的數(shù)據(jù)被()在集群中,使得任務(wù)可以并行執(zhí)行。
A)順序存儲
B)連續(xù)存儲
C)分塊存儲
D)分區(qū)存儲
145.[單選題]以下是字符轉(zhuǎn)換成字節(jié)的方法是
A)decode()
B)encode()
C)upper()
D)rstrip()
146.[單選題]大數(shù)據(jù)產(chǎn)業(yè)全景圖中包含以下選項():1.基礎(chǔ)設(shè)施;2.企業(yè)應(yīng)用;3.分析工具;4.行
業(yè)行為;5.開源工具;6.數(shù)據(jù)資源;7.跨平臺基礎(chǔ)設(shè)施和分析工具;8.數(shù)據(jù)源和APPs。
A)1234
B)12345678
02345678
D)5678
147.[單選題]Kafa集群在運行期間,直接依賴于下面哪些組件?
A)spark
B)zookeeper
Ohdfs
D)hbase
148.[單選題]將兩篇文本通過詞袋模型變?yōu)橄蛄磕P?,通過計算向量的()來計算兩個文本間的相
似度。
A)正弦距離
B)余弦距離
C)長度
D)方向
149.[單選題]下列選項中,不屬于個人隱私的是OO
A)個人工作職責(zé)
B)個人健康狀況
C)個人位置信息
D)個人家庭信息
150.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,在征信報告頁面,點擊底部【打印報告】按
鈕,彈出打印機選擇頁面。用戶在彈出的打印機選擇頁面,選擇O項,點擊【打印】按鈕,選擇
保存路徑,即可保存PDF版本征信報告文件到指定路徑。
A)Fax
B)B.MicrosoftprinttoPDF
C)C.MicrosoftXPSDocumentWriter
D)D.OneNote
151.[單選題]以下acl授權(quán)里,()是對MaXComPUte的表賦予SeIeet權(quán)限。
A)grantreadontabletable_nametouser<full_name>
B)grantselectontabletable_nametouser<full_name>
C)grantreadonprojectproject_nametouser<fule_name>
D)grantdesconprojectproject_nametouser<fule_name>
152.[單選題]可用信息增益來進(jìn)行決策樹的(_)。
A)樹高
B)葉子結(jié)點數(shù)
C)總結(jié)點數(shù)
D)劃分屬性選擇
153.[單選題]MapReduce里面的query、SOrt和Iimit等都是針對哪個階段的操作?
?)Map()之前
B)Reduce()之前
C)Reduce()之后
D)finalize()之后
154.[單選題]下列代碼執(zhí)行結(jié)果是()0[i*iforiinrange(3)]
A)[l,1,4]
B)[O,1,4]
C)[1,2,3]
D)(l,1,4)
155.[單選題]SQL語言集數(shù)據(jù)查詢、數(shù)據(jù)操縱、數(shù)據(jù)定義和數(shù)據(jù)控制功能于一體,其中,CREATE、
DROP、ALTER語句是實現(xiàn)哪種功能()
A)數(shù)據(jù)操縱
B)數(shù)據(jù)控制
C)數(shù)據(jù)定義
D)數(shù)據(jù)查詢
156.[單選題]Flume中最小的獨立運行單位是()。
A)Source
B)Agent
C)Channel
D)Sink
157.[單選題]隱馬爾可夫模型是一種著名的(_)模型。
A)無向圖
B)有向圖
C)樹形圖
D)環(huán)形圖
158.[單選題]依托(),結(jié)合應(yīng)用推進(jìn)數(shù)據(jù)歸集,形成統(tǒng)一的數(shù)據(jù)資源中心。
A)全業(yè)務(wù)數(shù)據(jù)中心和數(shù)據(jù)平臺
B)營銷基礎(chǔ)數(shù)據(jù)平臺和大數(shù)據(jù)平臺
C)全業(yè)務(wù)中心和營銷基礎(chǔ)數(shù)據(jù)平臺
D)企業(yè)務(wù)數(shù)據(jù)中心和大數(shù)據(jù)平臺
159.[單選題]執(zhí)行以下代碼段ClaSSchange:def—init_(self,x,y,z):self,a=χ+y**
zx=change(1,2,3)y=getattr(x,'a')setattr(x,'a',y+I)Print(x.a)時,輸出為
(一)o
A)7
B)8
C)9
D)10
160.[單選題]查找數(shù)據(jù)表中的記錄用以下哪一項()
A)ALTRE
B)UPDATE
C)SELECT
D)DELETE
161.[單選題]在SPark技術(shù)中,RDD實現(xiàn)了用戶的邏輯,而(_)是StOrage模塊與其他模塊交互最
主要的類,它提供了讀和寫B(tài)lOCk的接口。
A)org.apache,spark,storage.Block
B)org.spark,storage.BlockManager
C)org.apache,spark.BlockManager
D)org.apache,spark,storage.BlockManager
162.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,日常工作提示(預(yù)警)中,外部風(fēng)險信息提
示近O天的外部風(fēng)險信息。
A)15
B)B.30
OC.60
D)D.90
163.[單選題]可以對用戶的行為或相關(guān)事件進(jìn)行實時監(jiān)測和分析的產(chǎn)品的是:()。
A)AnalyticDB
B)流計算
OMaxCompute
D)TS
164.[單選題]關(guān)于基于HadoOP的MaPRedUCe編程的環(huán)境配置,下面哪一步是不必要的。
A)安裝IinUX或者在WindOWS下安裝CgyWin
B)安裝java
C)安裝MaPRedUCe
D)配置HadOOP參數(shù)
165.[單選題]matplotlib中設(shè)置X軸數(shù)值顯示范圍的函數(shù)是什么()
A)xrange()
B)xspan()
C)xlabel()
D)xlim()
166.[單選題]Maxcompute項目Prjl中存在表t,同時使用下述SQL創(chuàng)建視圖v:createviewvas
select*fromt;Prjl的OWner把視圖V的讀權(quán)限賦給了用戶AIiCe,以下()說法是正確的。
A)因為沒有表t的訪問權(quán)限,所以AliCe無法訪問視圖V
B)由于權(quán)限的依賴關(guān)系,AIiCe既可以訪問視圖V又可以表t
C)AIiCe可以通過訪問視圖V來查詢表t的數(shù)據(jù)
D)AliCe可以訪問表t,因為她具有了視圖V的訪問權(quán)限,自然獲得了表t的訪問權(quán)限
167.[單選題]Flink中的答案:接口用于流數(shù)據(jù)處理,答案:接口用于批處理?
A)DataBatchAPI1DataStreamAPI
B)StreamAPI,BatchAPI
C)DataStreamAPI,DataSetAPI
D)BatchAPI,StreamAPI
168.[單選題]HDFS默認(rèn)的最基本的儲存單位是?
A)數(shù)據(jù)塊
B)元數(shù)據(jù)節(jié)點
C)數(shù)據(jù)節(jié)點
D)從元數(shù)據(jù)節(jié)點
169.[單選題]()不可以直接來對文本分類。
A)K-means
B)決策樹
C)支持向量機
D)KNN
170.[單選題]HBase在新建表的時候必須指定表名和(),不需要指定列,所有的列在后續(xù)添加數(shù)據(jù)
的時候動態(tài)添加。
A)行
B)單元格
C)時間戳
D)列族
171.[單選題]()與HDFS類似。
A)NTFS
B)FAT32
OGFS
D)EXT3
172.[單選題]實時處理的步驟中,實時計算的前一步是以下哪一項?.
A)實時展示
B)實時緩存存儲
C)實時采集
D)實時落地
173.[單選題]以下哪一項不屬于HadOoP可以運行的模式。
A)單機(本地)模式
B)偽分布式模式
C)互聯(lián)模式
D)分布式模式
174.[單選題]大數(shù)據(jù)時代,數(shù)據(jù)使用的關(guān)鍵是
A)數(shù)據(jù)收集
B)數(shù)據(jù)存儲
C)數(shù)據(jù)分析
D)數(shù)據(jù)再利用
175.[單選題]DataFrame和RDD最大的區(qū)別()
A)科學(xué)統(tǒng)計支持
B)多了schema
C)存儲方式不一樣
D)外部數(shù)據(jù)源支持
176.[單選題]Python中使用()轉(zhuǎn)義字符。
A)/
B)?
0$
D)%
177.[單選題]kafka-clustermirroring工具可以實現(xiàn)以下那些功能?
A)kafka集群數(shù)據(jù)同步方案
B)kafka單集群內(nèi)數(shù)據(jù)備份
Okafka單集群內(nèi)數(shù)據(jù)恢復(fù)
D)以全部不對
178.[單選題]通過DMS()管理其他阿里云帳號下的RDS實例。
A)只要有數(shù)據(jù)庫帳號即可管理
B)通過DMS”實例授權(quán)”功能授權(quán)后即可管理
C)完全不可以
D)通過RAM授權(quán)后才能管理
179.[單選題]()是一個分布式的基于發(fā)布/訂閱模式的消息隊列。
A)Flume
B)Kafka
C)Zookeeper
D)Hive
180.[單選題]在【連接】面板,join條件中輸入正確的一項是()
A)'差旅費超額百分比'.userid='用戶'.id
B)“差旅費超額百分比.userid=用戶.id”
C)“差旅費超額百分比.userid==用戶.id”
D)''差旅費超額百分比''.userid=''用戶''.id
181.[單選題]以下關(guān)于數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)訪問權(quán)限的說法正確的有Oo
A)數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)權(quán)限賬號僅供責(zé)任人登錄使用,不得借與他人
B)數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)權(quán)限賬號密碼不超過6個月要更換一次
C)為了保密,對數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)權(quán)限賬號的登錄時間、時長等實行無痕跡管理
D)數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)訪問權(quán)限實行匿名制管理
182.[單選題]下列代碼中輸出結(jié)果是False的是()。
A)?>5isnot4
B)>>>5!=4
C)>>>False!=0
D)>>>5is5
183.[單選題]MapReduce編程模型,鍵值對<;key,value>;的key必須實現(xiàn)哪個接口()。
A)WritableComparab1e
B)Comparable
OWritable
D)LongWritable
184.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,系統(tǒng)在【客戶信息管理】一級菜單下增加【
征信報告查詢管理】二級菜單,用戶可在此菜單下的【待處理的征信報告】節(jié)點中點擊O按鈕
,提交征信報告查詢申請。
A)新增查詢
B)B.上傳授權(quán)書
OC.取消申請
D)D.提交
185.[單選題]查看HDFS的報告命令是()
A)bin/hdfsdfsadmin-report
B)bin∕hdfs-report
C)bin/hdfsdeadmin-report
D)bin/hdfsdfs-report
186.[單選題]剪枝是決策樹學(xué)習(xí)算法對付(一)的主要手段。
A)欠擬合
B)過擬合
C)計算速度
D)計算效率
187.[單選題]大數(shù)據(jù)平臺核心分布式存儲與計算組件采用Hadoop技術(shù)體系中的分布式存儲、分布
式計算框架及Spark等開源產(chǎn)品和技術(shù),實現(xiàn)對數(shù)據(jù)的安全控制和管理功能,其中分布式存儲不包
括()。
A)HDFS
B)Postgresql
OHive
D)HBase
188.[單選題]以下哪項不屬于批量數(shù)據(jù)采集工具?。
A)MapReduce
B)Flume
C)Scoop
D)其他ETL工具
189.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,系統(tǒng)在【大數(shù)據(jù)貸后預(yù)警處置】菜單下設(shè)置
【待處置】、【處置中】等4個節(jié)點。其中,用戶在()節(jié)點可對審批退回的客戶重新查看其預(yù)警信
號詳情,填寫相關(guān)處置措施,并選擇性的進(jìn)行貸后影像資料補充,提交審核。
A)待處置
B)B.處置中
C)C.退回
D)D.處置完成
190.[單選題]下面與HDFS類似的框架是?
A)NTFS
B)FAT32
OGFS
D)EXT3
191.[單選題]下列(—)是對目錄操作。
A)mkdir
B)print
C)close
D)remove
192.[單選題]下列哪個屬性是hdfs-site.Xml中的配置?()
A)dfs.replication
B)fs.defaultFS
Omapreduce.framework,name
D)yarn,resourcemanager,address
193.[單選題]下列有關(guān)OGG的描述錯誤的是(一)。
A)OGG可以實現(xiàn)一對一、廣播、聚合、級聯(lián)等多種靈活的拓?fù)浣Y(jié)構(gòu)
B)OGG管理維護(hù)相對直觀,使用自帶的管理工具,能夠?qū)ζ溥M(jìn)行圖形化界面的管理
C)OGG支持異構(gòu)復(fù)制
D)OGG不支持異構(gòu)復(fù)制
194.[單選題]K-Means算法無法聚()樣本。
A)圓形分布
B)螺旋分布
C)帶狀分布
D)凸多邊形分布
195.[單選題]小A匯總統(tǒng)計了各省收入,并設(shè)置了降序排列,如何實現(xiàn)toplθ?()
A)篩選器-精確篩選
B)篩選器-條件篩選
C)顯示條目數(shù)
D)無法實現(xiàn)
196.[單選題]已知一個數(shù)據(jù)集,n為特征數(shù),m為訓(xùn)練樣本數(shù),如果n較小,而且m大小中等(例如n為
Γ1000,而m為I(Tloooo),則一般選擇()。
A)邏輯回歸模型
B)不帶核的支持向量機
C)高斯核的支持向量機
D)多項式核的支持向量機
197.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,集團(tuán)圖譜頁面右側(cè)展示【放大】、【縮小】
、【刷新】、【展開】4個按鈕,其中具有“將展示的集團(tuán)圖譜縮小”功能的是()按鈕。
A)放大
B)B.縮小
OC.刷新
D)D.展開
198.[單選題]在Hadoop生態(tài)系統(tǒng)中,()建立在MapReduce之上,主要用來彌補MaPRedUCe
編程的復(fù)雜性。
A)Hbase
B)Flume
OPig
D)Sqoop
199.[單選題]下列關(guān)于MapReduce說法不正確的是()。
A)MaPRedUCe是一種計算框架
B)MapReduce來源于google的學(xué)術(shù)論文
C)MapReduce程序只能用java語言編寫
D)MaPRedUCe隱藏了并行計算的細(xì)節(jié),方便使用
200.[單選題]刪除數(shù)據(jù)庫表使用的是O
A)DROP
B)UPDATE
C)DELETE
D)DELETED
201.[單選題]HDFS默認(rèn)的當(dāng)前工作目錄是/user/$USER,fs.default,name的值需要在哪個配置文件
內(nèi)說明。
A)mapred-site.xml
B)core-site,xml
C)hdfs-site.xml
D)yarn-site,xml
202.[單選題]()是一種著名的密度聚類算法,它基于一組鄰域參數(shù)來刻畫樣本的緊密程度
A)DBSCAN
B)原型聚類
C)密度聚類
D)層次聚類
203.[單選題]下面關(guān)于MaPRedUCe的描述中正確的是?
A)MaPRedUCe程序必須包含MaPPer和Reducer
B)MaPRedUCe程序的MaPTaSk可以任意指定
C)MaPRedUCe程序的RedUCeTaSk可以任意指定
D)MaPRedUCe程序的默認(rèn)數(shù)據(jù)讀取組件是TextlnputFormat
204.[單選題]在數(shù)據(jù)管理技術(shù)的發(fā)展過程中,經(jīng)歷了人工管理階段、文件系統(tǒng)階段和數(shù)據(jù)庫系統(tǒng)階
段。在這幾個階段,數(shù)據(jù)獨立性最高的是O階段
A)數(shù)據(jù)庫系統(tǒng)
B)文件系統(tǒng)
C)人工管理
D)數(shù)據(jù)項管理
205.[單選題]下列算法中屬于局部處理的是
A)灰度線性變換
B)二值化
C)傅立葉變換
D)中值濾波
206.[單選題]使用Pig語句實現(xiàn)右外連接,下列語句正確的是(一)。
A)SELECT*FROMtmp_tableARIGHTJOINtmp_table_2BONA.age=B.age;
B)DUMPtmp_tableBYageRIGHTJOINtmp_table_2BYage;
C)tmp_table_join=JOINtmp_tableByageRIGHTOUTER,tmp_table_2BYage;DUMP
tmp_table_join;
D)JOINtmp_tableBYageRIGHTOUTER,tmp_table_2BYage;
207.[單選題]以下關(guān)于DataNOde的描述不正確的是?
A)DataNOde管理數(shù)據(jù)塊元數(shù)據(jù)
B)DataNode執(zhí)行數(shù)據(jù)塊的讀/寫操作。
C)DataNOde的數(shù)量受數(shù)據(jù)規(guī)模影響。
D)DataNode是用來存儲數(shù)據(jù)庫。
208.[單選題]有如下程序:defcube(x):returnx*x*xx=cube(3)Print(X)程序的輸出結(jié)
果是(一)o
A)3
B)9
C)27
D)81
209.[單選題]在使用FiIeChannel傳輸數(shù)據(jù)時,F(xiàn)lUme可以達(dá)到的數(shù)據(jù)傳輸語義是?
A)Atmostonce
B)Atleastonce
C)Exactlyonce
D)Notonlyonce
210.[單選題]分布式文件系統(tǒng)HDFS采用了主從結(jié)構(gòu)模型,由計算機集群中的多個節(jié)點構(gòu)成的,這些
節(jié)點分為兩類,一類存儲元數(shù)據(jù)叫(),另一類存儲具體數(shù)據(jù)叫().
A)名稱節(jié)點,主節(jié)點
B)從節(jié)點,主節(jié)點
C)名稱節(jié)點,數(shù)據(jù)節(jié)點
D)數(shù)據(jù)節(jié)點,名稱節(jié)點
211.[單選題]下列可以用來降低深度學(xué)習(xí)模型的過擬合問題的方法有①增加更多的數(shù)據(jù);②使用數(shù)據(jù)
擴增技術(shù)(也,taaugmen飽創(chuàng)咀);③使用歸納性更好的架構(gòu);④正規(guī)化數(shù)據(jù);
A)①④⑤
B)①②③
C)①③④⑤
D)所有項目都有用
212.[單選題]執(zhí)行以下代碼段CIaSSGraph():definit_(self):self,a=10def
action(self):self,a//=4self,b**=2%3classMyGraph(Graph):def—init_(self):
self,a=8self,b=4defaction(self):self,a+=7*2self,b**=2+Iclass
LastGraph(MyGraph):passg2=LaStGraPh()g2.action。print(g2.b)時,輸出為()。
A)17
B)l
C)16
D)64
213.[單選題]下列屬于分組表中的是()
A)形狀
B)風(fēng)格
C)背景
D)標(biāo)題
214.[單選題]在hadoop配置中yarn-site,xml作用是()
A)用于定義系統(tǒng)級別的參數(shù)
B)用于名稱節(jié)點和數(shù)據(jù)節(jié)點的存放位置
C)用于配置JObHiStOryServer和應(yīng)用程序參數(shù)
D)配置ResourceManager,NodeManager的通信端口
215.[單選題]Hive是建立在()之上的一個數(shù)據(jù)倉庫
A)HDFS
B)MapReduce
OHadoop
D)HBase
216.[單選題]以下掃描算子中用于對列存表進(jìn)行掃描
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 聘用項目總工合同
- 個體診所聘用合同
- 預(yù)定租房合同協(xié)議
- 攝像攝影服務(wù)合同
- 工地門衛(wèi)勞動合同
- 勞務(wù)派遣人員勞動合同書
- 13足球運球繞桿 教學(xué)設(shè)計 -九年級體育與健康
- 天津音樂學(xué)院《寫作與溝通》2023-2024學(xué)年第二學(xué)期期末試卷
- 江蘇科技大學(xué)《大數(shù)據(jù)處理框架》2023-2024學(xué)年第二學(xué)期期末試卷
- 對外經(jīng)濟(jì)貿(mào)易大學(xué)《兒童文學(xué)與中學(xué)語文教學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 一年級美術(shù)課后輔導(dǎo)教案-1
- 智慧社區(qū)建設(shè)中的智能化醫(yī)療與康養(yǎng)服務(wù)
- 2023-2024年人教版八年級上冊數(shù)學(xué)期末模擬試卷(含答案)
- 數(shù)據(jù)采集管理制度范文
- 幼兒園小班開學(xué)家長會課件
- 中藥抗骨質(zhì)疏松作用
- 中建綜合支吊架施工方案
- 建筑施工規(guī)范大全
- 幼兒園開學(xué)家長會PPT模板(含完整內(nèi)容)
- 表冷器更換施工方案
- 瀝青集料篩分反算計算表格(自動計算)
評論
0/150
提交評論