版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
試題說明
本套試題共包括1套試卷
答案和解析在每套試卷后
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案6(500題)
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案6
1.[單選題]語義網(wǎng)絡(luò)表達(dá)知識時,有向弧AKO鏈、ISA鏈?zhǔn)怯脕肀磉_(dá)節(jié)點知識的OO
A)無悖性
B)可擴充性
C)繼承性
2.[單選題]大數(shù)據(jù)計算服務(wù)(MaXComPUte,原ODPS)提供了大數(shù)據(jù)的存儲和計算服務(wù),非常適合應(yīng)
用于大數(shù)據(jù)分析的領(lǐng)域。以下說法中錯誤的是:()。
A)可以支持實時OLAP分析
B)提供了便捷的分析處理海量數(shù)據(jù)的手段,用戶可以計算細(xì)節(jié),從而達(dá)到分析大數(shù)據(jù)的目的
C)可以實現(xiàn)大型互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)倉庫和Bl分析
3.[單選題]下面關(guān)于MaPRedUCe模型中MaP函數(shù)與RedUCe函數(shù)的描述正確的是()
A)一個MaP函數(shù)就是對一部分原始數(shù)據(jù)進行指定的操作。
B)一個MaP操作就是對每個RedUCe所產(chǎn)生的一部分中間結(jié)果進行合并操作。
C)MaP與MaP之間不是相互獨立的。
D)RedUCee與RedUCe之間不是相互獨立的。
4.[單選題]HDFS的設(shè)計者采用了(—)的概念,實現(xiàn)了一個高度容錯性的系統(tǒng)。
A)機器學(xué)習(xí)
B)數(shù)據(jù)挖掘
C)集群計算
D)塊復(fù)制
5.[單選題]np.reshape。函數(shù)的作用是(—)□
A)修改數(shù)組大小
B)數(shù)組重組
C)數(shù)組轉(zhuǎn)置
D)對軸進行調(diào)整
6.[單選題]以下關(guān)于ElaStiCSearCh緩存機制的理解不正確的是()。
A)緩存主要分為三種,QueryCache,FielddataCache1RequestCacheo.
B)RequestCaChe:Shards級別的緩存,是為了緩存''分片級”的本地結(jié)果集。
OFielddateCaChe:專門針對分詞的字殷在查詢期間的數(shù)據(jù)結(jié)構(gòu)的緩存。
D)QueryCaehe:Shard級別的緩存,是對一個查詢中包含的過濾器執(zhí)行結(jié)果進行緩存。
7.[單選題]隨機森林中的隨機是指(
A)隨便構(gòu)建樹模
B)隨機選擇一個樹模型
C)隨機選擇多個樹模型
D)在構(gòu)建每個樹模型時隨機選擇樣本和特征
8.[單選題]數(shù)據(jù)清洗的方法不包括Oo
A)缺失值處理
B)噪聲數(shù)據(jù)清除
C)一致性檢查
D)重復(fù)數(shù)據(jù)記錄處理
9.[單選題]彩色圖片(3通道圖片)經(jīng)過一層卷積層后,通道數(shù)一般會產(chǎn)生怎么的變化(等于什么值
)?()
A)batchsize
B)需要根據(jù)卷積的設(shè)置進行判斷
Oi
D)依然會是3
10.[單選題IResultScanner把掃描操作轉(zhuǎn)換為類似get的操作,它將每一行數(shù)據(jù)封裝成一個()實
例,并將所有實例放入一個迭代器中
A)Column
B)Row
C)Result
D)Table
IL[單選題]下列選項中,()能保證表中字段值的唯一性。一
A)默認(rèn)約束
B)非空約束
C)唯一約束
D)以上答案都不正確
12.[單選題]由于不同類別的關(guān)鍵詞對排序的貢獻不同,檢索算法一般把查詢關(guān)鍵詞分為幾類,下
列不屬于此關(guān)鍵詞類型的是()。
A)引用詞
B)普通關(guān)鍵詞
C)高頻詞匯
D)擴展關(guān)鍵詞
13.[單選題]SaaS是()的簡稱
A)軟件即服務(wù)
B)平臺即服務(wù)
C)基礎(chǔ)設(shè)施即服務(wù)
D)硬件即服務(wù)
14.[單選題]執(zhí)行以下代碼段defsay(message,times=l):print(message*
times)say('Hello')say('World',5)時,輸出為(.)o
A)HelIoWorldWor1dWor1dWorIdWorld
B)HelIoWorld5
C)HelIoWorld,World,World,World,World
D)HelIoHelloHelloHelloHelloHello
15.[單選題]任一隨機事件出現(xiàn)的概率為()。
A)在T與1之間
B)小于0
C)不小于1
D)在0與1之間
16.[單選題]網(wǎng)站個性化推薦的背后,可以使用哪些類型的數(shù)據(jù)實現(xiàn)?
A)無結(jié)構(gòu)化
B)非結(jié)構(gòu)化
C)結(jié)構(gòu)化
D)半結(jié)構(gòu)化
17.[單選題]HBase架構(gòu)的四大組件中,OHBaSe具體對外提供服務(wù)的進程。
A)Zookeeper
B)Master
C)RegionServer
D)Client
18.[單選題]下列不屬于深度學(xué)習(xí)內(nèi)容的是()
A)深度直信網(wǎng)絡(luò)
B)受限或爾茲曼機
C)卷和、神經(jīng)網(wǎng)絡(luò)
D)貝葉斯學(xué)習(xí)
19.[單選題]下面哪個是一種編程模型,它將大規(guī)模的數(shù)據(jù)處理工作拆分成互相獨立的任務(wù)然后并行
處理()
A)MapReduce
B)HDFS
OPig
D)Hive
20.[單選題]以下哪個不是典型的分類方法:()
A)決策樹
B)樸素貝葉斯
C)K-Means
D)人工神經(jīng)網(wǎng)絡(luò)
21.[單選題]Python類中包含一個特殊的變量(),它表示當(dāng)前對象自身,可以訪問類的成員。
A)self
B)me
C)this
D)與類同名
22.[單選題]交叉驗證的目的是(一)。
A)提高分類準(zhǔn)確率
B)得到更穩(wěn)定的模型
C)驗證結(jié)果的準(zhǔn)確性
D)增大分類的誤差
23.[單選題]卷積神經(jīng)網(wǎng)絡(luò)調(diào)整參數(shù)時信息的傳播方向是()。
A)后向傳播
B)前向傳播
C)雙向傳播
D)跳躍傳播
24.[單選題]下面關(guān)于MySQL安裝目錄描述錯誤的是()。一
A)Iib目錄用于存儲一系列的庫文件
B)include目錄用于存放一些頭文件
Obin目錄用于存放一些課執(zhí)行文件
D)以上答案都不正確
25.[單選題]假設(shè)一個線性回歸模型完美適合訓(xùn)練數(shù)據(jù)(訓(xùn)練誤差為0),則下列說法正確的是
()。
A)測試集誤差一直為0
B)測試集誤差可能為0
C)測試集誤差不會為0
D)以上都不對
26.[單選題]可用作數(shù)據(jù)挖掘分析中的關(guān)聯(lián)規(guī)則算法有()。
A)機器學(xué)習(xí)、對數(shù)回歸、關(guān)聯(lián)模式
B)K均值法、SOM機器學(xué)習(xí)
C)APriOri算法、FP-Tree算法
D)RBF機器學(xué)習(xí)、K均值法、機器學(xué)習(xí)
27.[單選題]某二叉樹共有12個結(jié)點,其中葉子結(jié)點只有1個。則該二叉樹的深度為(根結(jié)點在第1層
)。
Λ)8
B)12
06
D)3
28.[單選題]HBase依賴O提供消息通信機制
A)Zookeeper
B)Chubby
C)RPC
D)Socket
29.[單選題]HDFS中的塊比磁盤中的塊大,其目的是為了(—)o
A)增加存儲空間
B)便于存儲較大的文件
C)提高存儲空間的利用率
D)最小化尋址開銷
30.[單選題]HDFS是基于流數(shù)據(jù)模式訪問和處理超大文件的需求而開發(fā)的,具有高容錯、高可靠性、
高可擴展性、高吞吐率等特征,適合的讀寫任務(wù)是()。
A)一次寫入,少次讀
B)多次寫入,少次讀
C)多次寫入,多次讀
D)一次寫入,多次讀
31.[單選題]為了統(tǒng)一數(shù)據(jù)各個數(shù)值屬性上量綱,可以進行的操作為()
A)preprocessing,minmaxscale()
B)pd.merge()
C)pd.read_csv
D)np.dtype()
32.[單選題]Kafka集群中,Kafka服務(wù)端的角色是?
A)Broker
B)Consumer
C)ZooKeeper
D)Producer
33.[單選題]關(guān)于ADS的數(shù)據(jù)類型,說法不正確的是:()。
A)布爾類型boolean取值只能為0或1
B)ADS所有的數(shù)據(jù)類型都不支持UnSigned
C)數(shù)值類型float可以指定精度,例如:float(5,3),但是double類型不支持指定精度
D)雙精度浮點數(shù)double類型的存儲字節(jié)數(shù)為4,大整數(shù)類型bigint存儲字節(jié)數(shù)為8
34.[單選題]為了降低MaPRedUCe兩個階段之間的數(shù)據(jù)傳遞量,一般采用(—)函數(shù)對map階段的輸出
進行處理。
A)sort()
B)combiner()
C)join()
D)gather()
35.[單選題]OTS的單個表可以包括:()個屬性列。
A)OT28個
B)OTo24個
C)無限制
D)O-256個
36.[單選題]按照KB、MB、GB、TB、PB的有小到大順序,下列換算錯誤的是
A)lKB=1024Byte
B)1MB=1O24KB
C)1TB=1O24MB
D)1PB=1O24TB
37.[單選題]關(guān)于Python循環(huán)結(jié)構(gòu),以下選項中描述錯誤的是
A)遍歷循環(huán)中的遍歷結(jié)構(gòu)可以是字符串、文件、組合數(shù)據(jù)類型和range。函數(shù)等
B)break用來跳出最內(nèi)層for或者WhiIe循環(huán),脫離該循環(huán)后程序從循環(huán)代碼后繼續(xù)執(zhí)行
C)每個ContinUe語句只有能力跳出當(dāng)前層次的循環(huán)
D)Python通過for、WhiIe等保留字提供遍歷循環(huán)和無限循環(huán)結(jié)構(gòu)
38.[單選題]下列關(guān)于k近鄰算法,正確的是O
A)k近鄰算法對異常數(shù)據(jù)敏感
B)k近鄰算法是一種無監(jiān)督學(xué)習(xí)
C)k近鄰算法需要占用大量內(nèi)存空間
D)k近鄰算法包括訓(xùn)練和預(yù)測過程
39.[單選題]本行()負(fù)責(zé)牽頭開展數(shù)據(jù)治理風(fēng)險管理工作,規(guī)范數(shù)據(jù)風(fēng)險管理
A)風(fēng)險管理部
B)內(nèi)審監(jiān)督部
C)科技部
D)數(shù)據(jù)運管部
40.[單選題]以下()不是大數(shù)據(jù)時代新興的技術(shù)。
A)Hadoop
B)MySQL
C)Spark
D)HBase
41.[單選題]Agg算子的實現(xiàn)策略有:()。
A)4
B)3
02
D)l
42.[單選題]根據(jù)變量取名的規(guī)則,以下變量的命名,合乎規(guī)則的是()
Λ)6S
B)S6
C)while
D)123name
43.[單選題]最早被提出的循環(huán)神經(jīng)網(wǎng)絡(luò)門控算法是什么。()
A)、長短期記憶網(wǎng)絡(luò)
B)、門控循環(huán)單元網(wǎng)絡(luò)
C)、堆疊循環(huán)神經(jīng)網(wǎng)絡(luò)
D)、雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
44.[單選題]Flume數(shù)據(jù)采集的過程中,下列選項中能對數(shù)據(jù)進行過濾和修飾的是?
A)Sink
B)Channel
C)Channelselector
D)Interceptor
45.[單選題]構(gòu)建一個神經(jīng)網(wǎng)絡(luò),將前一層的輸出和它自身作為輸入,則有反饋連接的是()。
A)循環(huán)神經(jīng)網(wǎng)絡(luò)
B)卷積神經(jīng)網(wǎng)絡(luò)
C)限制玻爾茲曼機
D)都不是
46.[單選題]執(zhí)行以下代碼段age=12ifage<4print("Youradmissioncostis$0.")elifage
<18print("Youradmissioncostis$5.")elseprint("Youradmissioncostis$10.")?,輸
出為(一)o
A)Youradmissioncostis$0.
B)Youradmissioncostis$5.
C)Youradmissioncostis$10.
D)以上都不對
47.[單選題]僅個體變元被量化的謂詞稱為()
A)一階謂詞
B)原子公式
C)二階謂詞
D)全稱量詞
48.[單選題]下列說法錯誤的是()
A)GROUPBY子句用來分組WHERE子句的輸出
B)WHERE子句用來篩選FROM子句中指定的操作所產(chǎn)生的行。
C)聚合函數(shù)需要和groupby一起使用
D)HAVING子句用來從FRoM的結(jié)果中篩選行
49.[單選題]當(dāng)訓(xùn)練集特征非常多,而實例非常少的時候,可以采用()。
A)sigmoid核的支持向量機
B)不帶核的支持向量機
C)高斯核的支持向量機
D)多項式核的支持向量機
50.[單選題]下面這條GaUSSDB200的SQL語句"selectname,count(1)fromstudentgroupby
name”可能涉及的算子有哪些?
A)Filter
B)GroupAggregate
C)Streaming
D)HashAggregate
51.[單選題]最小最大正規(guī)化也稱為()
A)非標(biāo)準(zhǔn)化
B)標(biāo)準(zhǔn)化
C)離差標(biāo)準(zhǔn)化
D)以上說法都不對
52.[單選題]關(guān)于FUSionlnSightManager,說法錯誤的是?
A)NTPSeVer/client負(fù)責(zé)集群內(nèi)各節(jié)點的時鐘同步
B)通過FUSiOnlnSightManager,可以對HDFS進行啟??刂?、配置參數(shù)
OFusionInsightManager所有維護操作只能夠通過WebUI來完成,沒有提供SheIl維護命令
D)通過FUSiOnlnSightManager,可以向?qū)桨惭b集群,縮短集群部署時間
53.[單選題]HBase內(nèi)部的.META.表包含所有用戶()的列表。
A)地址
B)時間
C)類別
D)空間區(qū)域
54.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,系統(tǒng)在【客戶信息管理】一級菜單下增加【征
信報告查詢管理】二級菜單,用戶可在此菜單下的【待處理的征信報告】節(jié)點中點擊O按鈕,取
消尚未提交的征信報告查詢申請。
A)新增查詢
B)B.上傳授權(quán)書
OC.取消申請
D)D.提交
55.[單選題]下列關(guān)于數(shù)據(jù)創(chuàng)新的說法正確的是()。
A)多個數(shù)據(jù)集的總和價值等于單個數(shù)據(jù)集價值相加
B)由于數(shù)據(jù)的再利用,數(shù)據(jù)應(yīng)該永久保存下去
C)相同數(shù)據(jù)多次用于相同或類似用途,其有效性會降低
D)數(shù)據(jù)只有開放價值才可以得到真正釋放
56.[單選題]Spark中引人RDD概念的目的是()。
A)數(shù)據(jù)存儲
B)數(shù)據(jù)查重
C)提升容錯能力
D)增強數(shù)據(jù)一致性
57.[單選題]Sqoop是Hadoop和關(guān)系數(shù)據(jù)庫服務(wù)器之間傳送數(shù)據(jù)的工具,下列哪種數(shù)據(jù)庫是不支持
使用Sqoop直接進行數(shù)據(jù)傳送()
A)Postgres
B)Oracle
OMySQL
D)Redis
58.[單選題]在SeIeCt語句的Where子句中,使用正則表達(dá)式過濾數(shù)據(jù)的關(guān)鍵字是()
A)like
B)against
C)match
D)regexp
59.[單選題]特征選擇包括過濾法、包裝法和嵌入法,其中過濾法不包括哪個方法?
A)方差選擇法
B)相關(guān)系數(shù)法
C)遞歸特征消除法
D)互信息法
60.[單選題IElasticsearch采用的搜索方式是()o
A)正排素引
B)倒排素引
C)慢素引
D)快速索引
61.[單選題]下面哪個配置是在mapred-site.Xml中配置的()
A)復(fù)制因子
B)JaVa環(huán)境變量
C)存儲hdfs文件的目錄名
D)運行MaPRedUCe作業(yè)的主機和端口
62.[單選題]以下關(guān)于FusionInsightCTBase的描述不正確的是?
A)CTBase的讀寫數(shù)據(jù)接口,統(tǒng)一封裝了行定義的接口,自動進行冷字段的合并和解析,不需要在應(yīng)用
程序中進行合并和解釋
B)CTBase是基于HBase的聚簇表開發(fā)框架
OCTBase提供了一套WebUI進行元數(shù)據(jù)定義,提供了只管醫(yī)用的表設(shè)計工具,降低表設(shè)計的難度
D)CTBase的javaAPI提供一套HBase連接池管理的接口,內(nèi)部進行連接共享,減少客戶端應(yīng)用開發(fā)
難度。
63.[單選題]下列做法中,對個人信息安全威脅最大的是()。
A)課堂手工簽到
B)手機惡意APP
C)釘釘共享編輯
D)共享加密文件
64.[單選題]在MaPRedUCe中,()階段,RedUCer執(zhí)行reducetask,將最后結(jié)果寫入HDFSo
A)Shuffle
B)Map
C)Reduce
D)Sort
65.[單選題]FusionInsight產(chǎn)品中,關(guān)于Kafka說法不正確的是?
A)Kafka強依賴于ZooKeeper
B)Kafka的服務(wù)端可以產(chǎn)生消息
OKafka部署的實例個數(shù)不得小于2
D)Consumer作為kafka的客戶端角色專門進行消息的消費。
66.[單選題]大數(shù)據(jù)方法的不準(zhǔn)確性,根本原因是()。
A)數(shù)據(jù)量大
B)算法變化
C)信息遺漏
D)以上都正確
67.[單選題]下面不屬于比較檢驗的方法是(_)。
A)假設(shè)檢驗
B)交叉驗證t檢驗
C)MCNemar檢驗
D)留出法
68.[單選題]HBase使用一個master節(jié)點協(xié)調(diào)管理一個或多個()從屬機。
A)namenode
B)datanode
C)regionserver
D)master
69.[單選題]對分類任務(wù)來說,學(xué)習(xí)器從類別標(biāo)記集合中預(yù)測出一個標(biāo)記,最常見的結(jié)合策略是(
)O
A)投票法
B)平均法
C)學(xué)習(xí)法
D)排序法
70.[單選題]在IBM提出的企業(yè)管理范疇中,企業(yè)數(shù)據(jù)不包含(_)。
A)元數(shù)據(jù)
B)主數(shù)據(jù)
C)關(guān)系數(shù)據(jù)
D)業(yè)務(wù)數(shù)據(jù)
71.[單選題]在運行時,由MaXCOmPUte依據(jù)上下文使用環(huán)境及類型轉(zhuǎn)換規(guī)則自動進行的類型轉(zhuǎn)換是
:()O
A)顯示轉(zhuǎn)換
B)影式專換
C)CaSt轉(zhuǎn)換
D)SQL轉(zhuǎn)換
72.[單選題]()能反映出X和Y之間的強相關(guān)性。
A)相關(guān)系數(shù)為0.9
B)對于無效假設(shè),B=O的P值為0.0001
C)對于無效假設(shè),β=0的t值為30
D)以上說法都不對
73.[單選題]Hadoop配置文件中,hadooP-Site.xml顯示覆蓋hadoop-default.XmI里的內(nèi)容。在版本
O20中,hadoop-site.Xml被分離成三個XML文件,不包括()
A)conf-site,xml
B)mapred-site.xml
C)core-site,xml
D)hdfs-site.xml
74.[單選題]下面哪個指標(biāo)不是聚類算法的質(zhì)量特征?O
A)對噪聲數(shù)據(jù)的敏感性。
B)處理多種類型的數(shù)據(jù)。
C)聚類的類別多少
D)可伸縮性
75.[單選題]關(guān)于數(shù)據(jù)、算法、算力的描述以下正確的是:
A)數(shù)據(jù)沒有什么意義
B)算法是最難處理的問題
C)算力問題已經(jīng)不存在瓶頸了
D)數(shù)據(jù)、算法、算力相互依賴、相互支撐
76.[單選題]物聯(lián)網(wǎng)的發(fā)展最終導(dǎo)致了人類社會數(shù)據(jù)量的第三次躍升,使數(shù)據(jù)產(chǎn)生方式進入了:
O
A)手工創(chuàng)建階段
B)運營式系統(tǒng)階段
C)用戶原創(chuàng)內(nèi)容階段
D)感知式系統(tǒng)階段
77.[單選題]下列圖像邊緣檢測算子中抗噪性能最好的是
A)梯度算子
B)Prewitt算子
C)RobertS算子
D)LaPlaCian算子
78.[單選題]RDD有TranSfOrmatiOn和Aetion算子,下列屬于ACtiOn算子的是:()。
?)map
B)SaveAsTextFile
C)Filter
D)reduceByKey
79.[單選題]以下哪種工作是FIUme無法處理的?
A)多個FIUme級聯(lián)合并
B)按照用戶定制采集數(shù)據(jù)
C)直接寫到Fink特定task中
D)從固定目錄下采日信息到目的地
80.[單選題]下列關(guān)于雷達(dá)圖的說法中,正確的是()
A)雷達(dá)圖也稱為網(wǎng)絡(luò)圖,蜘蛛圖,星圖,蜘蛛網(wǎng)圖等
B)雷達(dá)圖不適合展現(xiàn)某個數(shù)據(jù)集的多個關(guān)鍵特征
C)雷達(dá)圖中不同坐標(biāo)的點之間無法連接
D)雷達(dá)圖不常用于多項指標(biāo)的全面分析
81.[單選題]不屬于神經(jīng)網(wǎng)絡(luò)常用學(xué)習(xí)算法的是:
A)有監(jiān)督學(xué)習(xí)
B)增強學(xué)習(xí)
C)觀察與發(fā)現(xiàn)學(xué)習(xí)
D)無監(jiān)督學(xué)習(xí)
82.[單選題]Hive中的解釋器(compiler),優(yōu)化器(optimizer),執(zhí)行器(executor)組件用于
HQL語句從詞法分析,語法分析,編譯,優(yōu)化以及查詢計劃的生成,生成的查詢計劃存儲在O中
,并在隨后由O調(diào)用執(zhí)行。
A)HDFS,MapReduce
B)HBase,Yarm
C)內(nèi)存,MapReduce
D)HDFS,Yarn
83.[單選題]SQL語言中,實現(xiàn)數(shù)據(jù)檢索的語句是
A)SELECT
B)INSERT
C)UPDATE
D)DELETE
84.[單選題]采用模板[T1]主要檢測()方向的邊緣。
A)水平
B)45o
C)垂直
D)135o
85.[單選題]以下哪個不是大數(shù)據(jù)的“4V”特性:()
A)數(shù)據(jù)量
B)數(shù)據(jù)種類繁多
C)處理速度快
D)價值密度高
86.[單選題]在ZookeePer維護的樹形結(jié)構(gòu)中,樹中的節(jié)點被稱為(__)。
A)node
B)block
Ocell
D)znode
87.[單選題]以下關(guān)于函數(shù)的作用描述正確的是(一)o
A)函數(shù)是可重用的程序
B)函數(shù)無法為您的應(yīng)用程序提供更好的模塊化
C)您無法創(chuàng)建自己的函數(shù)
D)以上都是
88.[單選題]在HiVe的條件語句中,“and”連接兩個表達(dá)式,如果其中一個表達(dá)式結(jié)果為true,另一
個表達(dá)式結(jié)果為false,則計算結(jié)果為()
A)TRUE
B)FALSE
C)null
D)以上都不正確
89.[單選題]以下哪一選項不屬于MRS日常運維不影響業(yè)務(wù)這一特性?
A)滾動升級/補丁
B)修改配置滾動重啟
C)單集群跨AZ高可用
D)擴縮容業(yè)務(wù)無感知
90.[單選題]默認(rèn)情況下,HDFS的垃圾回收機制是沒有開啟的,我們可以在O配置文件中開啟
HDFS的垃圾回收機制。
A)core-site,xml
B)hdfs-site.xml
C)yarn-site,xml
D)hadoop-site.xml
9L[單選題]回歸方程判定系數(shù)的計算公式R2=SSR∕SST=I-SSE/SST,對判定系數(shù)描述錯誤的是()。
A)式中的SSE指殘差平方和
B)式中的SSR指總離差平方和
C)判定系數(shù)用來衡量回歸方程的擾合優(yōu)度
D)判定系數(shù)R2等于相關(guān)系數(shù)的平方
92.[單選題]關(guān)于eval函數(shù),以下選項中描述錯誤的是
A)eval函數(shù)的作用是將輸入的字符串轉(zhuǎn)為Python語句,并執(zhí)行該語句
B)如果用戶希望輸入一個數(shù)字,并用程序?qū)@個數(shù)字進行計算,可以采用eval(input())組合
C)執(zhí)行eval("Hello")和執(zhí)行eval("'Hello'")得到相同的結(jié)果
D)eval函數(shù)的定義為:eval(source,globals=None,Iocals=None,/)
93.[單選題]將灰度圖像轉(zhuǎn)換成二值圖像的命令為()。
A)ind2gray
B)ind2rgb
C)im2bw
D)ind2bw
94.[單選題]下列關(guān)于ZooKeeper特點的描述錯誤的是()。
A)復(fù)雜性
B)自我復(fù)制
C)順序訪問
D)高速讀取
95.[單選題]()用于將非線性引人神經(jīng)網(wǎng)絡(luò),它會將值縮小到較小的范圍內(nèi)
A)損失函數(shù)
B)優(yōu)化函數(shù)
C)激活函數(shù)
D)目標(biāo)函數(shù)
96.[單選題]產(chǎn)生式系統(tǒng)的推理不包括()
A)正向推理
B)逆向推理
C)雙向推理
D)簡單推理
97.[單選題]以下關(guān)于程序控制結(jié)構(gòu)描述錯誤的是:
A)單分支結(jié)構(gòu)是用if保留字判斷滿足一個條件,就執(zhí)行相應(yīng)的處理代碼
B)二分支結(jié)構(gòu)是用if-else根據(jù)條件的真假,執(zhí)行兩種處理代碼
C)多分支結(jié)構(gòu)是用if-elif-else處理多種可能的情況
D)在Python的程序流程圖中可以用處理框表示計算的輸出結(jié)果
98.[單選題]以下說法正確的是()
A)關(guān)聯(lián)規(guī)則挖掘過程是發(fā)現(xiàn)滿足最小支持度的所有項集代表的規(guī)則
B)尋找模式和規(guī)則主要是對數(shù)據(jù)進行干擾,使其符合某種規(guī)則以及模式
C)數(shù)據(jù)挖掘的主要任務(wù)是從數(shù)據(jù)中發(fā)現(xiàn)潛在的規(guī)律,從而能更好地完成描述數(shù)據(jù)、預(yù)測數(shù)據(jù)等任務(wù)
D)在聚類分析當(dāng)中,簇內(nèi)的相似性越大,裝間的差別越大,聚類的效果就越差
99.[單選題]以下()是對DMM(數(shù)據(jù)管理成熟度模型)中"已管理級"基本特點的正確表述。
A)組織機構(gòu)的數(shù)據(jù)管理關(guān)鍵活動能夠根據(jù)結(jié)構(gòu)自身的反饋以及外部環(huán)境的變革進行不斷優(yōu)化
B)組織機構(gòu)已用定量化的方式管理其關(guān)鍵過程的執(zhí)行過程
C)組織機構(gòu)只有在項目管理過程中執(zhí)行了D.M給出的關(guān)鍵過程,而缺乏機構(gòu)層次的統(tǒng)籌與管理
D)組織機構(gòu)的數(shù)據(jù)管理工作超出了項目管理的范疇,由組織機構(gòu)統(tǒng)一管理其數(shù)據(jù)管理關(guān)鍵過程
100.[單選題]HBase依靠()提供強大的計算能力。
A)ZooKeeper
B)Chubby
C)RPC
D)MapReduc
IOL[單選題]以下描述正確的是(—)。
A)非結(jié)構(gòu)化數(shù)據(jù)是先有結(jié)構(gòu),后有數(shù)據(jù)
B)XML是非結(jié)構(gòu)化數(shù)據(jù)
C)結(jié)構(gòu)化數(shù)據(jù)是先有數(shù)據(jù),后有結(jié)構(gòu)
D)非結(jié)構(gòu)化數(shù)據(jù)是數(shù)據(jù)科學(xué)與傳統(tǒng)數(shù)據(jù)管理的主要區(qū)別
102.[單選題]深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)屬于機器學(xué)習(xí)中的那哪種模型
A)深度監(jiān)督學(xué)習(xí)
B)深度無監(jiān)督學(xué)習(xí)
C)深度半監(jiān)督學(xué)習(xí)
D)深度強化學(xué)習(xí)
103.[單選題]對銀行業(yè)而言,做好大數(shù)據(jù)分析應(yīng)用的前提是O
A)增加統(tǒng)計種類
B)增加營業(yè)網(wǎng)點
C)增加數(shù)據(jù)來源
D)開展專項活動
104.[單選題]執(zhí)行以下代碼段defsan(x):print(x+1)x=-IOx=IOSan(O)時,輸出為(—)o
A)l
B)-10
OlO
D)ll
105.[單選題]Hive的啟動依賴于()的啟動,因此必須先啟動它
A)Java
B)數(shù)據(jù)庫
C)Hadoop
D)tomcat
106.[單選題]以下哪個不屬于hadoop的核心構(gòu)成
A)HDFS
B)MapReduce
C)Spark
D)YARN
107.[單選題]Python中對變量描述錯誤的選項是:
A)Python不需要顯式聲明變量類型,在第一次變量賦值時由值決定變量的類型
B)變量通過變量名訪問
C)變量必須在創(chuàng)建和賦值后使用
D)變量PI與變量Pi被看作相同的變量
108.[單選題]下面哪一項不屬于計算機集群中的節(jié)點?
A)主節(jié)點(MaSterNode)
B)源節(jié)點(SourceNode)
C)名稱結(jié)點(NameNode)
D)從節(jié)點(SlaveNode)
109.[單選題]以下選項中,不屬于大數(shù)據(jù)對人才能力的要求是O
A)業(yè)務(wù)能力
B)數(shù)學(xué)統(tǒng)計能力
C)IT技術(shù)能力
D)邏輯思維能力
110.[單選題]在MaPRedUCe中,哪個組件是用戶不指定也不會有默認(rèn)的0
A)Combiner
B)OutputFormat
C)Partitioner
D)InputFormat
111.[單選題](_)是一門以可視化交互為基礎(chǔ),綜合運用圖形學(xué)、數(shù)據(jù)挖掘和人機交互等多個領(lǐng)域
的知識,以實現(xiàn)人機協(xié)同完成可視化任務(wù)為主要目的的分析推理性學(xué)科。
A)信息可視化
B)科學(xué)可視化
C)可視分析學(xué)
D)數(shù)據(jù)可視化
112.[單選題]下列哪項通常是集群的最主要瓶頸:
A)CPU
B)網(wǎng)絡(luò)
C)磁盤IO
D)內(nèi)存
113.[單選題]通常,()主要指的是關(guān)系數(shù)據(jù)庫中存儲、計算和管理的數(shù)據(jù)。
A)結(jié)構(gòu)化數(shù)據(jù)
B)海量數(shù)據(jù)
C)半結(jié)構(gòu)化數(shù)據(jù)
D)非結(jié)構(gòu)化數(shù)據(jù)
114.[單選題]下列表述正確的是()。
A)if語句總是與else成對出現(xiàn)
B)if語句總是與elif成對出現(xiàn)
C)if語句分支嵌套實現(xiàn)多分支
D)if語句只能實現(xiàn)二分支
115.[單選題]下面哪個選項不是我們需要HadooP的主要原因O
A)我們需要處理PB級別的數(shù)據(jù)
B)為每個應(yīng)用建立一個可靠的系統(tǒng)是很昂貴的
C)幾乎每天都有結(jié)點壞掉
D)把一個任務(wù)分割成多個子任務(wù)的方式是不好的
116.[單選題]有人發(fā)現(xiàn)統(tǒng)計數(shù)字會撒謊,產(chǎn)生這種現(xiàn)象的原因不包括Oo
A)采集的數(shù)據(jù)不完整
B)存儲的數(shù)據(jù)被篡改
C)數(shù)據(jù)內(nèi)容更新慢
D)可視化技術(shù)效果單一
117.[單選題]在Matplotlib中調(diào)整后可以顯示中文的參數(shù)是()。
A)lines,linestyle
B)lines,linewidth
C)font,sans-serif
D)axes.unicodeminus
118.[單選題]__new_和_init—的區(qū)別,說法不正確的是()。
A)__new_是一個實例方法,而init.是一個靜態(tài)方法
B)__new_方法會返回一個創(chuàng)建的實例,而什么都不返回
C)只有在—new—返回一個CIS的實例時,后面的_init_才能被調(diào)用
D)當(dāng)創(chuàng)建一個新實例時調(diào)用_new—,初始化一個實例時用—init_
119.[單選題]輸入圖像為32x32,經(jīng)過步長為1,不進行Padding,卷積核為5x5的卷積層后,得到的
特征圖尺寸是多少?
A)28x28
B)27x27
C)29x29
D)32x32
120.[單選題]Spark可以處理的數(shù)據(jù)任務(wù)包括()。
A)數(shù)據(jù)流處理
B)交互式處理
C)圖數(shù)據(jù)處理
D)以上都是
121.[單選題]不屬于Mayer-SehnbergerV和CukierK.在其著名論著《BigDataiARevolutionThat
WillTransformHowWeLive,Work,andThink》中提出了大數(shù)據(jù)時代統(tǒng)計的思維變革的是()。
A)不是隨機樣本,而是全體數(shù)據(jù)
B)不是精確性,而是混雜性
C)不是描述性分析,而是預(yù)測性分析
D)不是因果關(guān)系,而是相關(guān)關(guān)系
122.[單選題]()負(fù)責(zé)HDFS數(shù)據(jù)存儲。
A)NameNode
B)JobTracker
ODataNode
D)SecondaryNameNode
123.[單選題]HDFS無法高效存儲大量小文件,想讓它能處理好小文件,比較可行的改進策略不包括
A)利用SeqUenCeFiIe、MapFilesHar等方式歸檔小文件
B)多MaSter設(shè)計
C)BlOCk大小適當(dāng)調(diào)小
D)調(diào)大namenode內(nèi)存或?qū)⑽募到y(tǒng)元數(shù)據(jù)存到硬盤里
124.[單選題]在HBaSe系統(tǒng)架構(gòu)中,每一個HRegiOnSerVer中的所有對象會共享一個()實例
A)HLog
B)Master
OClient
D)ZooKeeper
125.[單選題]從MaXComPUte導(dǎo)入到ADS中時,可以從()表中查詢導(dǎo)入狀態(tài)。
A)master.job_status
B)information_schema.job_instances
C)user.job_instances
D)performance_schema.job_status
126.[單選題]如果有變量a=[l,2,3,4,5,6],能夠得到列表[3,4,5]的表達(dá)式為O
A)a[2:5]
B)a[3:5]
C)a[3:-1]
D)a[3,4,5]
127.[單選題]圖靈獎獲得者JimGray提出的"科學(xué)研究第四范式"的全稱為()。
A)數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)
B)以數(shù)據(jù)為中心的科學(xué)發(fā)現(xiàn)
C)數(shù)據(jù)驅(qū)動型的科學(xué)發(fā)現(xiàn)
D)大數(shù)據(jù)科學(xué)研究
128.[單選題]個棧的初始狀態(tài)為空。現(xiàn)將元素1、2、3、4、5、A、B、C、D、E依次入棧,然后再依
次出棧,則元素出棧的順序是
A)12345ABCDE
B)EDCBA54321
C)5432IEDCBA
D)ABCDE12345
129.[單選題]GaussDB200支持實例故障發(fā)生時,業(yè)務(wù)不中斷。因此()。
A)不用擔(dān)心實例故障帶來的影響,無需處理故障問題。
B)在實例恢復(fù)或主備切換成功之后,能夠繼續(xù)提供服務(wù)。
C)不用擔(dān)心CN故障導(dǎo)致SQL執(zhí)行失敗,保證SQLlo0%執(zhí)行成功。
D)實例故障之后GaUSSDB200會自動重啟,無需人為關(guān)注。
130.[單選題]下列選項中,關(guān)于duplicated。方法描述正確的是()。
A)duplicate()方法用于刪除重復(fù)值
B)duplicate。方法用于標(biāo)記重復(fù)值
C)duplicate。方法會改變原始數(shù)據(jù)
D)duplicate()方法會將重復(fù)的數(shù)據(jù)標(biāo)記為FaISe
131.[單選題]下列關(guān)于DNN的說法不正確的是()。
A)層數(shù)多
B)抽象能力強
C)模擬更復(fù)雜模型
D)廣義上包含CNN、DBN,SVM等
132.[單選題]SQL語言中,刪除一個視圖的命令是()
A)REMOVE
B)CLEAR
C)DELETE
D)DROP
133.[單選題]卷積的過程是讓過濾器在圖像上進行()
A)縮放
B)剪切
C)窗口滑動
D)鏡像對稱
134.[單選題]Hadoop的哪個包的功能是根據(jù)DDL(數(shù)據(jù)描述語言)自動生成他們的編解碼函數(shù)。
A)record
B)metrics
C)util
D)tool
135.[單選題]下列算法中,Sklearn中未提及的是O0
A)K-Means聚類算法
B)LogisticRegression
C)KNN最近鄰分類算法
D)APriori關(guān)聯(lián)規(guī)則算法
136.[單選題]以下兩種描述分別對應(yīng):()兩種分類算法的評價標(biāo)準(zhǔn)。
A)Precision,Recall
B)Recall,Precision
C)Precision,Roc
D)Recall,Roc
137.[單選題]某公司營銷總監(jiān)在年度報告中,需要直觀地展示出最近五年公司某產(chǎn)品的銷售額變化趨
勢,以下可視化圖表中,最適合他的是()
A)明細(xì)表
B)熱力點圖
C)線形圖
D)漏斗圖
138.[單選題]Pandas在執(zhí)行算術(shù)運算時,沒有對齊的位置會使用()進行補齊。
A)Null
B)0
ONaN
D)null_values
139.[單選題]np.dsplit()函數(shù)的作用是(_)。
A)沿著它的水平軸分割
B)沿著縱向的軸分割
C)允許指定沿哪個軸分割
D)按深度方向分割
140.[單選題]下列論據(jù)中,能夠支撐“大數(shù)據(jù)無所不能”的觀點的是O-
A)互聯(lián)網(wǎng)金融打破了傳統(tǒng)的觀念和行為
B)大數(shù)據(jù)存在泡沫
C)大數(shù)據(jù)具有非常高的成本
D)個人隱私泄露與信息安全擔(dān)憂
141.[單選題]numPy中實現(xiàn)豎直軸分割數(shù)組的函數(shù)是(—)。
A)np.split
B)np.hsplits
C)np.dsplits
D)np.vsplit
142.[單選題]下述O不是知識的特征。
A)復(fù)雜性與明確性
B)進化與相對性
C)客觀性與依附性
D)可重用性與共享性
143.[單選題]大數(shù)據(jù)要求企業(yè)設(shè)置的崗位是()。
A)首席信息官和首席數(shù)據(jù)官
B)首席信息官和首席工程師
C)首席分析師和首席工程師
D)首席分析師和首席數(shù)據(jù)官
144.[單選題]下面算法屬于局部處理的是()。
A)、灰度線性變換
B)、二值化
C)、傅里葉變換
D)、中值濾波
145.[單選題]下列選項中,哪個方法可以一次性輸出多個統(tǒng)計指標(biāo)()。
A)describe()
B)mean()
C)median()
D)sum()
146.[單選題]用PyinStaIl工具把PythOn源文件打包成一個獨立的可執(zhí)行文件,使用的參數(shù)是:
A)-D
B)-L
C)-i
D)-F
147.[單選題]下列哪些不是HBase的特點()
A)高可靠性
B)高性能
C)面向列
D)緊密性
148.[單選題]運行以下程序,輸出結(jié)果的是:print("IOVe
".join(["Everyday","Yourself","Python",1))
A)EverydayloveYourself
B)EverydaylovePython
C)loveYourselflovePython
D)EverydayloveYourselflovePython
149.[單選題]創(chuàng)建一個HDFS客戶端對象時,COnfigUratiOn實例會自動加載HDFS的配置文件(),從
中獲取HadOoP集群的配置信息。
A)hadoop-default.xml
B)hadoop-env.sh
C)hadoop-site.xml
D)core-site,xml
150.[單選題]使用HBase客戶端批量寫入10條數(shù)據(jù),某個HRegionServer節(jié)點上包含該表的2
個Region,分別為A和B,10條數(shù)據(jù)中有6條屬于
A,4條屬于
B,請問寫入這10條數(shù)據(jù)需要向該HRegionServer發(fā)送幾次RPC請求?
A)10
B)6
02
D)l
151.[單選題]聚類是一種典型的無監(jiān)督學(xué)習(xí)任務(wù),然而在現(xiàn)實聚類任務(wù)中我們往往能獲得一些額外
的監(jiān)督信息,于是可通過()來利用監(jiān)督信息以獲得更好的聚類效果
A)監(jiān)督聚類
B)半監(jiān)督聚類
C)聚類
D)直推聚類
152.[單選題]下列關(guān)于誤差的說法,正確的是()。
A)訓(xùn)練樣本容量增加,泛化誤差也會增加
B)過擬合指數(shù)據(jù)在訓(xùn)練集上的誤差過大
C)過擬合可以通過減少模型參數(shù)數(shù)量解決
D)交叉驗證不重復(fù)使用數(shù)據(jù)
153.[單選題]線性模型中的權(quán)重W值可以看做各個屬性X的()
A)正則化革數(shù)
B)對最終決策結(jié)果的貢獻皮
C)高維映射
D)取值
154.[單選題]視圖是一種常用的數(shù)據(jù)對象,它是提供()和()數(shù)據(jù)的另一種途徑,可以簡化數(shù)據(jù)庫
操作
A)插入,更新
B)查看,檢索
C)查看,存放
D)檢索,插入
155.[單選題]Hadoop2.x版本中的數(shù)據(jù)塊大小默認(rèn)是多少?()
Λ)64M
B)128M
C)256M
D)512M
156.[單選題]命令行客戶端工具的選項中,()用于指定連接的端口號。-
A)-h
B)-u
C)-p
D)-P
157.[單選題]下面哪個不是PythOn合法的變量名
A)int_l
B)40XL
C)self123
D)Name
158.[單選題]習(xí)近平總書記在2016年O月主持召開了網(wǎng)絡(luò)安全和信息化工作座談會
A)4月
B)2月
03月
D)5月
159.[單選題]以下關(guān)于函數(shù)的描述,錯誤的是:
A)函數(shù)是一種功能抽象
B)使用函數(shù)的目的只是為了增加代碼復(fù)用
C)函數(shù)名可以是任何有效的Python標(biāo)識符
D)使用函數(shù)后,代碼的維護難度降低了
160.[單選題]決策樹的父節(jié)點和子節(jié)點的燧的大小關(guān)系是什么?
A)決策樹的父節(jié)點更大
B)子節(jié)點的端更大
C)兩者相等
D)根據(jù)具體情況而定
161.[單選題]按照姓名升序序排列()
A)ORDERBYNAMEASC
B)ORDERBYASCNAME
C)ORDERBYNAMEDESC
D)ORDERBYDESCNAME
162.[單選題]Numpy中創(chuàng)建全為1的矩陣使用什么?
A)np.zeros()
B)np.ones()
C)np.empty()
D)np.arange()
163.[單選題]在MapReduce中,如果要編寫自己的數(shù)據(jù)類型,需要實現(xiàn)哪個接口?()
A)Writable
B)Nul!Writable
C)IntWritable
D)Text
164.[單選題]Hbase的底層以()形式存在。
A)keyvalue
B)列存儲
C)行存儲
D)實時存儲
165.[單選題]在Hadoop配置文件中,以下屬于core-site,xml文件主要內(nèi)容的是()
A)用于定義系統(tǒng)級別的參數(shù),如
B)名稱節(jié)點和數(shù)據(jù)節(jié)點的存放位置、文件副本的個數(shù)文件讀取權(quán)限等。
C)配置
D)包括
166.[單選題]大數(shù)據(jù)平臺技術(shù)架構(gòu)不包含的是()
A)數(shù)據(jù)整合
B)數(shù)據(jù)存儲
C)數(shù)據(jù)計算
D)數(shù)據(jù)溯源
167.[單選題]一個HDFS集群是由一個(__)和多個數(shù)據(jù)節(jié)點組成。
A)索引節(jié)點
B)根節(jié)點
C)名字節(jié)點
D)數(shù)據(jù)節(jié)點
168.[單選題]華為FusionInsightHD是國內(nèi)首家符合國家金融等級保護的大數(shù)據(jù)平臺,其安全性現(xiàn)
在以下哪些方面?
A)系統(tǒng)安全
B)權(quán)限認(rèn)證
C)數(shù)據(jù)安全
D)以上全都正確
169.[單選題]下列關(guān)于大數(shù)據(jù)的分析理念的說法錯誤的是()。
A)在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)
B)在分析方法上更注重相關(guān)分析而不是因果分析
C)在分析效果上更追求效率而不是絕對精確
D)在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)
170.[單選題]在網(wǎng)絡(luò)日志數(shù)據(jù)分析場景中,日志服務(wù)器通過log4將數(shù)據(jù)傳給O,O會對數(shù)據(jù)進
行簡單的處理過濾,然后將數(shù)據(jù)按照日期存儲到O上。
A)Flume.Flume.HDFS
B)HDFS、Flume、Flume
C)Spark.Sgoop.Flume
D)Hive,Flume、Loader
171.[單選題]Hadoop平臺中,要查看YARN服務(wù)中一個application的信息,通常需要使用什么命令
?
A)container
B)jar
C)application-attempt
D)Application
172.[單選題]在機器學(xué)習(xí)中,不屬于常用的沖突消解策略是()
A)投票法
B)排序法
C)元規(guī)則法
D)加權(quán)法
173.[單選題IMapReduce框架對中間結(jié)果中相同“鍵”的所有“值”進行規(guī)約,是在J)階段。
A)Splitting
B)Mapping
C)Shuffling
D)Reducing
174.[單選題]Maxcompute表T中某列C的數(shù)據(jù)類型為bigint,需要修改為double,以下()方式可以
實現(xiàn)。
A)將表T刪掉重建
B)ALTERTABLETCOLUMNCRENAMETOCDOUBLE;
C)ALTERTABLETDROPCOLUMNCJALTERTABLETADDCDOUBLE;
D)ALTERTABLETCHANGECOLUMNSCBIGINT
175.[單選題]現(xiàn)在有一億條數(shù)據(jù)要插入HBaSe,使用下列哪個方式最好?
A)PUt方法
B)bulkload方法
C)Shell端PUt命令
D)insert方法
176.[單選題]下列關(guān)于計算機存儲容量單位的說法中,錯的是O0
A)1KB<1MB<1GB
B)基本單位是字節(jié)(Byte)
C)一個漢字需要一個字節(jié)的存儲空間
D)一個字節(jié)能夠容納一個英文字符,
177.[單選題]數(shù)據(jù)庫(DB)、數(shù)據(jù)庫系統(tǒng)(DBS)和數(shù)據(jù)庫管理系統(tǒng)(DBMS)三者之間的關(guān)系是
A)DBS包括DB和DBMS
B)DDMS包括DB和DBS
C)DB包括DBS和DBMS
D)DBS就是DB,也就是DBMS
178.[單選題]Pig在本地模式下,運行在單個(—)中,訪問本地文件系統(tǒng)。
A)ETL
B)JRM
C)JVM
D)Pig
179.[單選題](一)數(shù)據(jù)庫使用哈希表來存儲數(shù)據(jù)。
A)列存儲
B)文檔型
C)圖形
D)key-value
180.[單選題]DESC查看添加了主鍵約束的表結(jié)構(gòu),則Key字段的值為()?!?/p>
A)PRI
B)UNI
C)NOTNULL
D)NULL
18L[單選題]執(zhí)行下列語句后的顯示結(jié)果是什么??>s='hi'>>>print('hi',2*s)
A)hihihi
B)"hi"hihi
C)hihihi
D)hihihi
182.[單選題]通常來說,()能夠用來預(yù)測連續(xù)因變量
A)線性回歸
B)邏輯回歸
C)線性回歸和邏輯回歸
D)以上答案都不正確
183.[單選題]在Flink技術(shù)架構(gòu)中,以下哪項是流處理和批處理的計算引擎?
A)Standalone
B)Runtime
C)FlinkCore
D)DataSteam
184.[單選題]下列關(guān)于支持向量的說法,正確的是()。
A)到分類超平面的距離最近的且滿足一定條件的幾個訓(xùn)練樣本點是支持向量
B)訓(xùn)練集中的所有樣本點都是支持向量
C)每一類樣本集中都分別只有一個支持向量
D)支持向量的個數(shù)越多越好
185.[單選題]在GraPhbaSh上,創(chuàng)建一個新的圖,必須使用的參數(shù)是?
A)graphName
B)Iable
C)edge
D)vertex
186.[單選題]優(yōu)化內(nèi)部管理,促進質(zhì)效提升,重點圍繞營配貫通和()體系變革兩條主線,打破專業(yè)
壁壘,打造業(yè)務(wù)中臺。
A)優(yōu)化客戶服務(wù)
B)多維精益管理
C)營銷服務(wù)
D)計量計費
187.[單選題]概率模型的訓(xùn)練過程就是()過程。
A)分類
B)聚類
C)參數(shù)估計
D)參數(shù)選擇
188.[單選題]與卷積神經(jīng)網(wǎng)絡(luò)相比,循環(huán)神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)()。
A)細(xì)節(jié)信息
B)文章長度
C)單詞之間的長距離依賴關(guān)系
D)歧義
189.[單選題]在HDFS中的塊默認(rèn)大小為()。
A)16MB
B)32MB
O64MB
D)128MB
190.[單選題]下面不屬于數(shù)據(jù)歸約方法有(_)。
A)維歸約
B)度歸約
C)值歸約
D)數(shù)據(jù)壓縮
191.[單選題]使用Pig語句實現(xiàn)分組查詢,下列語句正確的是(—)。
A)SELECT*FROMtmptableGROUPBYis_male;
B)DUMPtmp_tableGROUPBYis_male;
C)GROUPtmp_tableBYisjnale;
D)tmp_table_group=GROUPtmp_tableBYis_male;DUMPtmp_tab1e_group;
192.[單選題]下列關(guān)于列族數(shù)據(jù)庫的描述,哪一項是錯誤的:()
A)查找速度慢,可擴展性差
B)功能較少,大都不支持強事務(wù)一致性
C)容易進行分布式擴展
D)復(fù)雜性低
193.[單選題]以下幾種模型方法屬于判別式模型(DiSCriminatiVeMOdeD的有()D混合高斯模型
2)條件隨機場模型3)支持向量機4)隱馬爾科夫模型
A)l,2
B)3,4
02,3
D)l,4
194.[單選題]下列關(guān)于數(shù)據(jù)科學(xué)流程與方法的描述中,錯誤的是()。
A)數(shù)據(jù)科學(xué)的基本流程包括數(shù)據(jù)化、數(shù)據(jù)加工(DataWrangling或DataMunging),數(shù)據(jù)規(guī)整化、
探索性分析、數(shù)據(jù)分析與洞見、結(jié)果展現(xiàn)以及數(shù)據(jù)產(chǎn)品的提供
B)對于數(shù)據(jù)形態(tài)不符合要求的亂數(shù)據(jù),要通過清洗成為規(guī)整數(shù)據(jù)
C)數(shù)據(jù)分析包括描述性分析、診斷性分析、預(yù)測性分析和規(guī)范性分析
D)數(shù)據(jù)可視化會遇到視覺假象問題,人眼對亮度和顏色,的相對判斷容易造成視,覺假象
195.[單選題]下列關(guān)于BigTable的描述,哪個是錯誤的?()
A)爬蟲持續(xù)不斷地抓取新頁面,這些頁面每隔一段時間地存儲到BigTabIe里
B)BigTabIe是一個分布式存儲系統(tǒng)
C)BigTabIe起初用于解決典型的互聯(lián)網(wǎng)搜索問題
D)網(wǎng)絡(luò)搜索應(yīng)用查詢建立好的索引,從BigTabIe得到網(wǎng)頁
196.[單選題]Python中自定義函數(shù)的關(guān)鍵字為()。
A)from
B)def
C)return
D)del
197.[單選題]對于運行在MaPRedUCe平臺上的應(yīng)用程序,此應(yīng)用程序所依賴的jar包會被放到()。
A)HIVE
B)HBASE
OHDFS
D)DB
198.[單選題]下列不屬于Action操作的是()。
A)collect
B)Iter
C)reduce
D)count
199.[單選題]下面哪項是HadooP的作者?()
A)Martin
B)Doug
C)Mark
D)Kent
200.[單選題]在HBaSe中,改變表屬性的關(guān)鍵字是()
A)update
B)alter
C)set
D)以上都不正確
201.[單選題]下列關(guān)于數(shù)據(jù)產(chǎn)品的說法錯誤的是()。
A)數(shù)據(jù)產(chǎn)品的存在形式是數(shù)據(jù)集
B)與傳統(tǒng)物質(zhì)產(chǎn)品不同的是,數(shù)據(jù)產(chǎn)品的消費者不僅限于人類用戶,還可以是計算機以及其他軟硬
件系統(tǒng)
C)數(shù)據(jù)產(chǎn)品不僅包括數(shù)據(jù)科學(xué)項目的最終產(chǎn)品,也包括其中間產(chǎn)品以及副產(chǎn)品
D)數(shù)據(jù)產(chǎn)品開發(fā)涉及數(shù)據(jù)科學(xué)項目流程的全部活動
202.[單選題]python中,()是字符串格式化的方法
A)count
B)format
C)in
D)replace
203.[單選題]getcwd()的作用是(一)o
A)刪除指定路徑的目錄
B)改變當(dāng)前工作目錄到指定的路徑
C)以數(shù)字權(quán)限模式創(chuàng)建目錄
D)返回當(dāng)前工作目錄
204.[單選題]將原始數(shù)據(jù)進行集成、變換、維度規(guī)約、數(shù)值規(guī)約是以下哪個步驟的任務(wù)()。
A)頻繁模式挖掘
B)分類和預(yù)測
C)數(shù)據(jù)預(yù)處理
D)數(shù)據(jù)流挖掘
205.[單選題]Hive適合()環(huán)境
A)Hive適合用于聯(lián)機(Online)事務(wù)處理
B)提供實時查詢功能
C)適合應(yīng)用在大量不可變數(shù)據(jù)的批處理作業(yè)
D)Hive適合關(guān)系型數(shù)據(jù)環(huán)境
206.[單選題]在Hadoop中.()是默認(rèn)的InPUtFormat類型,它將每行內(nèi)容作為新值,而將字節(jié)偏
移量作為keyo
A)FiIeInputFormat
B)TextInputFormat
C)KeyvalueTextInputFormat
D)CombineTextlnputFormat
207.[單選題]大數(shù)據(jù)的4V特征中的VelOCity是指()。
A)價值密度低
B)處理速度快
C)數(shù)據(jù)類型繁多
D)數(shù)據(jù)體量巨大
208.[單選題]關(guān)于LogiStiC回歸和SVM的描述,不正確的是()。
A)Logistic回歸本質(zhì)上是一種根據(jù)樣本對權(quán)值進行極大似然估計的方法,用先驗概率的乘積代替后
驗概率
B)Logistic回歸的輸出就是樣本屬于正類別的概率
C)SVM的目標(biāo)是找到使得訓(xùn)練數(shù)據(jù)盡可能分開且分類間隔最大的超平面,屬于結(jié)構(gòu)風(fēng)險最小化
D)SVM可以通過正則化系數(shù)控制模型的復(fù)雜度,避免過擬合
209.[單選題]在集成學(xué)習(xí)中,對于數(shù)據(jù)型輸出,最常見的結(jié)合策略是()
A)平均法
B)投票法
C)學(xué)習(xí)法
D)以上答案都正確
210.[單選題]聚類是一種典型的無監(jiān)督學(xué)習(xí)任務(wù),然而在現(xiàn)實聚類任務(wù)中我們往往能獲得一些額外的
監(jiān)督信息,于是可通過()來利用監(jiān)督信息以獲得更好的聚類效果。
A)監(jiān)督聚類
B)半監(jiān)督聚類
C)聚類
D)直推聚類
211.[單選題]Hive最重視的性能是可測量性、延展性、()和對于輸入格式的寬松匹配性
A)較低恢復(fù)性
B)容錯性
C)快速查詢
D)可處理大量數(shù)據(jù)
212.[單選題]有關(guān)HiVe支持的基本數(shù)據(jù)類型,Binary表示()
A)集合數(shù)據(jù)
B)字節(jié)數(shù)組
C)字符序列
D)文件數(shù)據(jù)
213.[單選題]HBase中的批量加載底層使用。實現(xiàn)。
A)MapReduce
B)Hive
C)Coprocessor
D)BloomFilter
214.[單選題]關(guān)于ADS的聚集列,下列說法不正確的是:()。
A)如果用戶的查詢Quew的條件中會指定聚集列的內(nèi)容或范圍,那么這樣的查詢性能便會有較大的提
升
B)聚集列可以在建表后進行修改,修改后DB會在后臺自動刷新數(shù)據(jù)
C)一個分區(qū)內(nèi)聚集列內(nèi)容相同的數(shù)據(jù)會盡可能的分布在同樣的區(qū)塊內(nèi)存
D)創(chuàng)建表時可以指定一列或者若干列作為聚集列
215.[單選題]以下選項中,不是PiP工具進行第三方庫安裝的作用的是:
A)安裝一個庫
B)卸載一個已經(jīng)安裝的第三方庫
C)列出當(dāng)前系統(tǒng)已經(jīng)安裝的第三方庫
D)腳本程序轉(zhuǎn)變?yōu)榭蓤?zhí)行程序
216.[單選題]調(diào)用ZoOkeePer對象創(chuàng)建的節(jié)點,不包括()。
A)持久節(jié)點
B)臨時節(jié)點
C)持久順序節(jié)點
D)DataNOde節(jié)點
217.[單選題]np.floor。函數(shù)的作用是(_)o
A)計算每個元素的模
B)計算每個元素的符號
C)計算每個元素的最小整數(shù)值
D)計算每個元素的小數(shù)部分
218.[單選題]關(guān)于大數(shù)據(jù)與區(qū)塊鏈的聯(lián)系,下面描述錯誤的是:()
A)區(qū)塊鏈?zhǔn)勾髷?shù)據(jù)極大降低信用成本
B)區(qū)塊鏈?zhǔn)菢?gòu)建大數(shù)據(jù)時代的信任基石
C)區(qū)塊鏈?zhǔn)谴龠M大數(shù)據(jù)價值流通的管道
D)區(qū)塊鏈會提升大數(shù)據(jù)的信用成本
219.[單選題]軟件開發(fā)的結(jié)構(gòu)化生命周期方法將軟件生命周期劃分成
A)定義、開發(fā)、運行維護
B)設(shè)計階段、編程階段、測試階段
C)總體設(shè)計、詳細(xì)設(shè)計、編程調(diào)試
D)需求分析、功能定義、系統(tǒng)設(shè)計
220.[單選題]HDfS中的block默認(rèn)保存幾份?
Λ)3
B)2
01
D)不確定
221.[單選題]下列選項中,一鍵啟動HDFS集群的指令是O
A)Start-namenode.sh
B)start-datanode.sh
C)start-dfs.sh
D)start-slave.sh
222.[單選題]消息系統(tǒng)Kafka如何保證高吞吐能力?。
A)持久性機制
B)Partition機制
C)冗余備份機制
D)多訂閱者機制
223.[單選題]以下代碼段當(dāng)你鍵入21時的輸出為(__)Oage=input("Howoldareyou?
")print(age>=18)
A)True
B)False
C)None
D)Error
224.[單選題]Hadoop配置文件中,hadoop-site.Xml顯示覆蓋hadoop-default.Xml里的內(nèi)容。在版本
0.20中,hadoop-site.Xml被分離成三個XML文件,不包括
A)conf-site,xml
B)mapred-site.xml
C)core-site,xml
D)hdfs-site.xml
225.[單選題]以下名詞解釋不正確的是()
A)Zookeeper:針對谷歌ChUbby的一個開源實現(xiàn),是高效可靠的協(xié)同工作系統(tǒng)
B)HBase:提供高可靠性、高性能、分布式的行式數(shù)據(jù)庫,是谷歌BigTable的開源實現(xiàn)
OHive:一個基于HadooP的數(shù)據(jù)倉庫工具,用于對HadooP文件中的數(shù)據(jù)集進行數(shù)據(jù)整理、特殊查詢
和分析存儲
D)HDFS:分布式文件系統(tǒng),是HadOOP項目的兩大核心之一,是谷歌GFS的開源實現(xiàn)
226.[單選題]已知文件abc.txt的內(nèi)容如下:HellO,AB通過如下代碼讀取上述文件的內(nèi)容,讀取的結(jié)
果為()0f=open('abc.txt','r')content=f.read(7)print(content)
A)Hell
B)Hello
C)Hello,
D)Hello,A
227.[單選題]采用主成分分析法映射到低維空間,將最小的d-d/個特征向量舍棄,產(chǎn)生的影響是(
A)使樣本采樣密度增大
B)丟失最優(yōu)解
C)增大噪聲
D)使樣本采樣密度減小
228.[單選題]下面哪個操作是窄依賴O
A)join
B)filter
C)group
D)sort
229.[單選題]下列大數(shù)據(jù)的特點中,O無助于推動網(wǎng)絡(luò)安全治理模式的改進提升。
A)扁平化
B)個性化
C)交互性
D)隔絕性
230.[單選題]數(shù)據(jù)探索是指針對目標(biāo)可變、持續(xù)、多角度的搜索或分析任務(wù),下列哪項不是其搜索過
程的特點()。
A)有選擇
B)有策略
C)有目標(biāo)
D)反復(fù)進行的
231.[單選題]執(zhí)行以下代碼段Print(not(15<20)andnot(20>30))時,輸出為C_)。
A)True
B)False
C)None
D)Error
232.[單選題]Hbase元數(shù)據(jù)MetaRegion路由器信息存放在()。
A)Zookeeper
B)Meta表
C)HMaster
D)RoOt表
233.[單選題]Python使用()關(guān)鍵字自定義一個函數(shù)。
A)function
B)func
C)def
D)lambda
234.[單選題]在進行算術(shù)運算時,如果希望一次性輸出多個統(tǒng)計指標(biāo)可以使用()方法。
A)statistics()
B)describe()
C)all()
D)results()
235.[單選題]ApacheKylin是通過什么方式來提高OLAP性能的?
A)預(yù)計算
B)列式存儲
C)內(nèi)存存儲
D)硬件加速
236.[單選題]下列的SQL語句中,()不是數(shù)據(jù)定義語句。
A)CREATETABLE
B)GRANT
C)CREATEVIEW
D)DROPVIEW
237.[單選題]MapReducevl和MapReducev2的主要區(qū)別在(_)部分。
A)編程模型
B)數(shù)據(jù)處理引擎
C)運行時環(huán)境
D)任務(wù)備份機制
238.[單選題]使用梯度下降算法的步驟
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人租車合同2024年度版:短期租賃轎車協(xié)議2篇
- 二零二五年度水電工程保險服務(wù)合同
- 渠道施工方案
- 砼污水處理池施工方案
- 二零二五年戶外廣告牌經(jīng)營權(quán)轉(zhuǎn)讓合同范本3篇
- 二零二五年度礦業(yè)并購項目全程法律支持合同3篇
- 個性化游艇租賃服務(wù)協(xié)議范本2024版
- 二手房改造裝修合同(2024年)
- 二零二五年度定制工作服設(shè)計與生產(chǎn)服務(wù)合同15篇
- 2025年房產(chǎn)項目管理合同8篇
- 向女朋友認(rèn)錯保證書范文
- 五分?jǐn)?shù)加法和減法(課件)-數(shù)學(xué)五年級下冊
- 2024年四川省綿陽市中考語文試卷(附真題答案)
- 設(shè)計材料與工藝課程 課件 第1章 產(chǎn)品設(shè)計材料與工藝概述
- 幼兒園反恐防暴技能培訓(xùn)內(nèi)容
- 食品企業(yè)質(zhì)檢員聘用合同
- 中醫(yī)診所內(nèi)外部審計制度
- 自然辯證法學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 2024年國家危險化學(xué)品經(jīng)營單位安全生產(chǎn)考試題庫(含答案)
- 護理員技能培訓(xùn)課件
- 河南省鄭州市2023-2024學(xué)年高二上學(xué)期期末考試 數(shù)學(xué) 含答案
評論
0/150
提交評論