大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷19)

上傳人：w*** IP屬地：重慶上傳時(shí)間：2023-11-15 格式：DOCX 頁(yè)數(shù)：65 大?。?4.49KB 積分：3.6 舉報(bào) 版權(quán)申訴

大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷19)_第2頁(yè)

大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷19)_第3頁(yè)

大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷19)_第4頁(yè)

大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷19)_第5頁(yè)

已閱讀5頁(yè)，還剩60頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試卷科目：大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷19)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分：?jiǎn)雾?xiàng)選擇題，共145題，每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.Hadoopfs中的-get和-put命令操作對(duì)象是A)文件B)目錄C)兩者都是[單選題]2.Hbase的某張表的RowKey劃分Splitkey為9.E.a.z.請(qǐng)問(wèn)表里面有（）個(gè)Region。A)6B)5C)4D)3[單選題]3.(__)是指能夠通過(guò)數(shù)據(jù)來(lái)幫助用戶實(shí)現(xiàn)其某一個(gè)目標(biāo)的產(chǎn)品。A)數(shù)據(jù)產(chǎn)品B)電子產(chǎn)品C)數(shù)據(jù)系統(tǒng)D)電子系統(tǒng)[單選題]4.以下有關(guān)特征數(shù)據(jù)歸一化的說(shuō)法錯(cuò)誤的是()A)特征數(shù)據(jù)歸一化加速梯度下降優(yōu)化的速度B)特征數(shù)據(jù)歸一化有可能提高模型的精度C)線性歸一化適用于特征數(shù)值分化比較大的情況D)概率模型不需要做歸一化處理[單選題]5.產(chǎn)生式系統(tǒng)的推理不包括（）A)正向推理B)逆向推理C)雙向推理D)簡(jiǎn)單推理[單選題]6.可以用()來(lái)聲明游標(biāo)A)CREATECURSORB)ALTERCURSORC)SETCURSORD)DECLARECURSOR[單選題]7.one-hot單個(gè)屬性編碼的個(gè)數(shù)取決于（）A)所有樣本中該屬性出現(xiàn)的最高頻率的取值B)樣本個(gè)數(shù)C)所有樣本中該屬性的最大值D)所有樣本中該屬性可取值的個(gè)數(shù)[單選題]8.以下描述中不正確的是（___）。A)歸納是指從特殊到一般的泛化過(guò)程B)歸納是指從具體的事實(shí)歸結(jié)出一般性規(guī)律C)演繹是指從特殊到一般的特化過(guò)程D)演繹是指從基礎(chǔ)原理推演出具體情況[單選題]9.下列用于關(guān)閉文件的是（）。A)read（）B)tell（）C)seek（）D)close（）[單選題]10.Python中定義私有屬性的方法是（）。A)使用private關(guān)鍵字B)使用public關(guān)鍵字C)使用__XX__定義屬性名D)使用__XX定義屬性名[單選題]11.數(shù)據(jù)抽取是從數(shù)據(jù)源中抽取數(shù)據(jù)的過(guò)程，實(shí)際應(yīng)用中，數(shù)據(jù)源較多采用的是()。A)關(guān)系型數(shù)據(jù)庫(kù)B)圖形數(shù)據(jù)庫(kù)C)文檔型數(shù)據(jù)庫(kù)D)列存儲(chǔ)型數(shù)據(jù)庫(kù)[單選題]12.下列的SQL語(yǔ)句中，()不是數(shù)據(jù)定義語(yǔ)句。A)CREATETABLEB)GRANTC)CREATEVIEWD)DROPVIEW[單選題]13.Numpy中對(duì)數(shù)組進(jìn)行轉(zhuǎn)置的函數(shù)是（）。A)transpose（）B)rollaxis（）C)swapaxes（）D)tan（）[單選題]14.()是以樣本統(tǒng)計(jì)量作為未知總體參數(shù)的估計(jì)量,并通過(guò)對(duì)樣本單位的實(shí)際觀察取得樣本數(shù)據(jù),計(jì)算樣本統(tǒng)計(jì)量的取值作為被估計(jì)參數(shù)的估計(jì)值。A)參數(shù)估計(jì)B)邏輯分析C)方差分析D)回歸分析[單選題]15.Hive交互Shell指執(zhí)行$HIVE_HOME/bin/hive之后，交互式命令行的提示符是（）A)help>B)hive>C)user>D)cmd>[單選題]16.特征選擇包括過(guò)濾法、包裝法和嵌入法，其中過(guò)濾法不包括哪個(gè)方法？A)方差選擇法B)相關(guān)系數(shù)法C)遞歸特征消除法D)互信息法[單選題]17.在HBase的表的每個(gè)區(qū)域是由表中的()的子集構(gòu)成。A)行B)列C)單元D)塊[單選題]18.物聯(lián)網(wǎng)是在計(jì)算機(jī)的（）基礎(chǔ)上，構(gòu)造一個(gè)覆蓋世界上萬(wàn)事萬(wàn)物的?InternetofThings?A)有線數(shù)據(jù)通信B)無(wú)線數(shù)據(jù)通信C)RFIDD)互聯(lián)網(wǎng)[單選題]19.np.abs()函數(shù)可以實(shí)現(xiàn)什么功能？A)計(jì)算絕對(duì)值B)計(jì)算相反數(shù)C)計(jì)算方差D)計(jì)算均值[單選題]20.以下關(guān)于函數(shù)的作用描述正確的是()。A)函數(shù)是可重用的程序B)函數(shù)無(wú)法為您的應(yīng)用程序提供更好的模塊化C)您無(wú)法創(chuàng)建自己的函數(shù)D)以上都是[單選題]21.（__）是具有適應(yīng)性的簡(jiǎn)單單元組成的廣泛并行互聯(lián)的網(wǎng)絡(luò)。A)神經(jīng)系統(tǒng)B)神經(jīng)網(wǎng)絡(luò)C)神經(jīng)元D)感知機(jī)[單選題]22.將數(shù)據(jù)更新寫入（），只有其寫入完成后，commit()才返回給客戶端。A)ZookeeperB)HMasterC)RegionServerD)HLog[單選題]23.成員資格判斷常使用的關(guān)鍵字是A)inB)forC)lenD)print[單選題]24.訓(xùn)練樣本集S含有天氣、氣溫、人體感受、風(fēng)力4個(gè)指標(biāo),已知天氣的熵為0.694,溫度的熵為0.859,人體感受的熵為0.952,風(fēng)力的熵為0.971,如使用ID3算法,選擇()為樹模型的分界點(diǎn)。A)天氣B)氣溫C)人體感受D)風(fēng)力[單選題]25.以下哪種操作能夠?qū)崿F(xiàn)實(shí)體完整性()A)設(shè)置唯一鍵B)設(shè)置外鍵C)減少數(shù)據(jù)冗余D)設(shè)置主鍵[單選題]26.以下屬于分類分析的是()A)、線性回歸B)、平穩(wěn)序列預(yù)測(cè)C)、決策樹分析D)、單因素方差分析[單選題]27.Hadoop生態(tài)系統(tǒng)中,HBase是一種()。A)分布式文件系統(tǒng)B)數(shù)據(jù)倉(cāng)庫(kù)C)實(shí)時(shí)分布式數(shù)據(jù)庫(kù)D)分布式計(jì)算系統(tǒng)[單選題]28.Python中自定義函數(shù)的關(guān)鍵字為（）。A)fromB)defC)returnD)del[單選題]29.在Hadoop上提交Job時(shí)不涉及哪個(gè)實(shí)體（）A)客戶端B)HDFSC)SecondaryNodeD)JobTracker[單選題]30.在分析型數(shù)據(jù)庫(kù)AnalyticDB中可以通過(guò)DML命令導(dǎo)入導(dǎo)出數(shù)據(jù)到MaxCompute中，以下導(dǎo)入、導(dǎo)出命令中正確的有：（）。A)loaddatafrom'odps://odps_project/odps_table'intotablemy_ads.my_table;B)uploaddatafrom'MaxCompute://odps_project/odps_table'intotablemy_ads.my_table;C)dumpdatainto'odps://odps_project/odps_table'selectid,namefrommy_ads.my_tableD)downloaddatainto'odps://odps_project_odps_table'selectid,namefrommyads.my_table[單選題]31.DAGScheduler將每個(gè)()打包成TaskSet交給TaskScheduler調(diào)度。A)TaskB)JobC)DAGD)Stage[單選題]32.云計(jì)算是對(duì)()技術(shù)的發(fā)展與運(yùn)用A)并行計(jì)算B)網(wǎng)格計(jì)算C)分布式計(jì)算D)三個(gè)選項(xiàng)都是[單選題]33.如果想獲取一個(gè)序列有多少元素可以使用A)最大值B)最小值C)求和D)len[單選題]34.字符串?Hi,Andy?中（該字符串中沒有空格），字符?A?對(duì)應(yīng)的索引為（）。A)1B)2C)3D)4[單選題]35.在線性回歸中，(__)試圖找到一條直線，使所有樣本到直線上的歐氏距離之和最小。A)最小二乘法B)拉格朗日乘子法C)歐氏距離D)均方誤差[單選題]36.關(guān)于SOM神經(jīng)網(wǎng)絡(luò)的描述，錯(cuò)誤的是()A)一種競(jìng)爭(zhēng)學(xué)習(xí)型的無(wú)監(jiān)督神經(jīng)網(wǎng)絡(luò)B)將高雄輸入數(shù)據(jù)映射到低維空間，保持輸入數(shù)據(jù)在高維空間的拓?fù)浣Y(jié)構(gòu)C)SOM尋優(yōu)目標(biāo)為每個(gè)輸出神經(jīng)元找到合適的權(quán)重D)輸出層神經(jīng)元以矩陣方式排列在二維空間[單選題]37.下面關(guān)于基礎(chǔ)理論相關(guān)描述正確的有(__)。A)基礎(chǔ)理論等于理論基礎(chǔ)B)基礎(chǔ)理論在數(shù)據(jù)科學(xué)研究邊界之外C)理論基礎(chǔ)在數(shù)據(jù)科學(xué)研究邊界之內(nèi)D)基礎(chǔ)理論包含理念、理論、方法、技術(shù)等[單選題]38.()不適合使用機(jī)器學(xué)習(xí)方法解決A)判斷電子郵件是否是垃圾郵件B)判斷給定的圖中是否有環(huán)C)是否給指定用戶辦理信用卡D)咱對(duì)滴滴拼車乘客分簇[單選題]39.在Hadoop的解壓目錄下，通過(guò)執(zhí)行哪一項(xiàng)指令可以查看Hadoop的目錄結(jié)構(gòu)A)jpsB)llC)tarD)find[單選題]40.()屬于Spark框架中的可擴(kuò)展機(jī)器學(xué)習(xí)庫(kù)。A)MLibB)GraphXC)StreamingD)SparkSQL[單選題]41.選擇哪一個(gè)解作為輸出,將由學(xué)習(xí)算法的歸納偏好決定,常見的做法是引人()。A)線性回歸B)線性判別分析C)正則化項(xiàng)D)偏置項(xiàng)[單選題]42.以下關(guān)于python內(nèi)置函數(shù)的描述，錯(cuò)誤的是：A)id()返回一個(gè)變量的一個(gè)編號(hào)，是其在內(nèi)存中的地址B)all(ls)返回True，如果ls的每個(gè)元素都是TrueC)type()返回一個(gè)對(duì)象的類型D)sorted()對(duì)一個(gè)序列類型數(shù)據(jù)進(jìn)行排序，將排序后的結(jié)果寫回到該變量中[單選題]43.對(duì)于Maxcompute，下列描述正確的是：（）．A)在使用多路插入時(shí)，可對(duì)同一張表同時(shí)執(zhí)行insertinto和insertoverwriteB)使用動(dòng)態(tài)分區(qū)插入時(shí)，動(dòng)態(tài)分區(qū)列必須在select列表中C)MaxcomputeSQL支持between子句D)對(duì)于分區(qū)表，可指定某個(gè)分區(qū)的lifecycle，其中n為正整數(shù)，單位為天[單選題]44.核矩陣是（__)的。A)沒有規(guī)律B)半正定C)正定D)樣本矩陣[單選題]45.Loader作業(yè)運(yùn)行前后，需要保證哪些節(jié)點(diǎn)與外部數(shù)據(jù)源通訊？A)Loader進(jìn)程所在的節(jié)點(diǎn)B)運(yùn)行MapReduce作業(yè)的節(jié)點(diǎn)C)前面兩個(gè)都需要D)前面兩個(gè)都不需要[單選題]46.以下關(guān)于大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)的區(qū)別，描述錯(cuò)誤的是：（）A)大數(shù)據(jù)側(cè)重于對(duì)海量數(shù)據(jù)的存儲(chǔ)、處理析，從海量數(shù)據(jù)中發(fā)現(xiàn)價(jià)值,服務(wù)于.生產(chǎn)和生活B)云計(jì)算本質(zhì)上旨在整合和優(yōu)化各種IT資源并通過(guò)網(wǎng)絡(luò)以服務(wù)的方式，廉價(jià)地提供給用戶C)云計(jì)算旨在從海量數(shù)據(jù)中發(fā)現(xiàn)價(jià)值，服務(wù)于生產(chǎn)和生活D)物聯(lián)網(wǎng)的發(fā)展目標(biāo)是實(shí)現(xiàn)物物相連.應(yīng)用創(chuàng)新是物聯(lián)網(wǎng)發(fā)展的核心[單選題]47.numpy默認(rèn)產(chǎn)生的數(shù)據(jù)類型是（__)。A)int16B)float32C)charD)float64[單選題]48.下列關(guān)于人工智能的敘述不正確的有:（）。A)人工智能技術(shù)它與其他科學(xué)技術(shù)相結(jié)合極大地提高了應(yīng)用技術(shù)的智能化水平。B)人工智能是科學(xué)技術(shù)發(fā)展的趨勢(shì)。C)因?yàn)槿斯ぶ悄艿南到y(tǒng)研究是從上世紀(jì)五十年代才開始的，非常新，所以十分重要。D)人工智能有力地促進(jìn)了社會(huì)的發(fā)展。[單選題]49.關(guān)于虛擬私有云（VPC）描述不對(duì)的是（）A)VPC支持專線接入B)VPC的多個(gè)子網(wǎng)可以創(chuàng)建在同一Region內(nèi)的不同AZ中C)可以通過(guò)安全組實(shí)現(xiàn)不同VPC之間的云主機(jī)互通D)每個(gè)用戶可以創(chuàng)建多個(gè)VPC及子網(wǎng)[單選題]50.Spark的特點(diǎn)不包括()。A)速度快B)通用性C)易用性D)單一操作性[單選題]51.HBase使用一個(gè)master節(jié)點(diǎn)協(xié)調(diào)管理一個(gè)或多個(gè)()從屬機(jī)。A)namenodeB)datanodeC)regionserverD)master[單選題]52.下列哪一個(gè)屬于浮點(diǎn)型數(shù)據(jù)？A)a=1B)a=3.14C)a='3.14'D)a=True[單選題]53.按照姓名降序排列()A)ORDERBYDESCNAMEB)ORDERBYNAMEDESCC)ORDERBYNAMEASCD)ORDERBYASCNAME[單選題]54.在Numpy中，數(shù)組拼接的函數(shù)不包括（）。A)append（）B)insert（）C)vstack（）D)where（）[單選題]55.以下關(guān)于常見數(shù)據(jù)庫(kù)描述正確的是?（A)HBase基于ZooKeeper,Hadoop,適合非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ),是高可靠性高性能,面向行,可伸縮的分布式存儲(chǔ)系B)Oracle:關(guān)系型數(shù)據(jù)庫(kù),行式存儲(chǔ),支持SQL,中量級(jí)數(shù)據(jù)分析存儲(chǔ)不可分布式,開源軟件。C)Redis:開源key-value數(shù)據(jù)庫(kù),讀寫性能極高,數(shù)據(jù)類型豐富,可以與Storm結(jié)合進(jìn)行實(shí)時(shí)查詢分析D)Mysql關(guān)系型數(shù)據(jù)庫(kù),列式存儲(chǔ),支持SQL,輕量級(jí)數(shù)據(jù)分析存儲(chǔ),僅有商業(yè)版本。[單選題]56.scikit-learn中的k-means類，哪個(gè)參數(shù)是用來(lái)調(diào)節(jié)k值的（）A)n_clustersB)max_iterC)n_initD)init[單選題]57.決策論中，將?期望損失?稱為（__）。A)均值B)方差C)風(fēng)險(xiǎn)D)概率[單選題]58.selectget_json_object('{"name":"jack","score":"100"}','$.name')的結(jié)果是A)nameB)jackC)scoreD)100[單選題]59.劃分聚類算法是一種簡(jiǎn)單的較為基本的重要聚類方法。它的主要思想是通過(guò)將數(shù)據(jù)點(diǎn)集分為()個(gè)劃分,并使用重復(fù)的控制策略使某個(gè)準(zhǔn)則最優(yōu)化,以達(dá)到最終的結(jié)果A)DB)KC)ED)F[單選題]60.無(wú)條件共享:是指可對(duì)（）提供的數(shù)據(jù)。A)公司外部所有人員B)公司內(nèi)部所有人員C)所有人員D)公司內(nèi)部特定人員[單選題]61.關(guān)于HIVE的描述不正確的是?A)Hive最佳使用場(chǎng)景是大數(shù)據(jù)集的批處理作業(yè)B)Hive可以實(shí)現(xiàn)在大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢、C)ive構(gòu)建在基于靜態(tài)批量處理的Hadoop之上,Hadoop通常有較高的延遲并且在作業(yè)提交和調(diào)度的時(shí)候需要大量的開銷D)Hive查詢操作過(guò)程嚴(yán)格遵循HadoopMapReduce的作用執(zhí)行模型,Hive將用戶的HiveQL語(yǔ)句通過(guò)解釋器轉(zhuǎn)換為MapReduceHadoop集群上[單選題]62.Redis中哪個(gè)命令是查看鍵的剩余生存時(shí)間?A)ttlB)expireatC)persistD)expire[單選題]63.下列選項(xiàng)中，一鍵啟動(dòng)HDFS集群的指令是（）A)start-namenode.shB)start-datanode.shC)start-dfs.shD)start-slave.sh[單選題]64.以下關(guān)于MaxcomputeMR中的歸并操作（Combiner）的說(shuō)中，正確的是：（）。A)通常下combiner的處理邏輯和map一致B)Combiner函數(shù)將shutffle階段所有key值相等的記錄進(jìn)行歸并C)當(dāng)map輸出數(shù)據(jù)后，框架會(huì)在map端對(duì)相同key值的數(shù)據(jù)進(jìn)行本地的歸并操作D)Combiner是必須的，可以減少傳輸帶寬[單選題]65.()先對(duì)數(shù)據(jù)集進(jìn)行特征選擇，然后再訓(xùn)練學(xué)習(xí)器A)過(guò)濾式選擇B)包裹式選擇C)稀疏表示D)嵌入式選擇[單選題]66.以下（）不屬于MaxComputeSQL物理優(yōu)化的優(yōu)化原則。A)一般情況下，部分分區(qū)數(shù)據(jù)即可滿足需求，無(wú)需全表掃描B)分析讀取哪些分區(qū)有必須要，將其放入TableScanOperator即可C)當(dāng)用戶寫了LEFTJOIN,RIGHTJOIN,FULLOUTERJOIN時(shí),如果在JOIN條件中涉及到了分區(qū)字段，那么就可以完成分區(qū)裁剪的優(yōu)化D)減少不必要的shuffle-sort算子，即減少數(shù)據(jù)分區(qū)排序落地[單選題]67.下列選項(xiàng)中，符合類的命名規(guī)范的是（）。A)HolidayResortB)HolidayResortC)holidayResortD)holidayresort[單選題]68.關(guān)于數(shù)據(jù)組織的維度描述正確的是A)二維數(shù)據(jù)由對(duì)等關(guān)系的有序或無(wú)序數(shù)據(jù)構(gòu)成B)高維數(shù)據(jù)由關(guān)聯(lián)關(guān)系數(shù)據(jù)構(gòu)成C)CSV是一維數(shù)據(jù)D)一維數(shù)據(jù)采用線性方式存儲(chǔ)[單選題]69.大數(shù)據(jù)分析人員小張發(fā)現(xiàn),所在的互聯(lián)網(wǎng)公司的注冊(cè)人數(shù)往往會(huì)隨著時(shí)間有一定的變化,為了更加直觀展示這種趨勢(shì),最合適的圖表是()A)點(diǎn)圖B)熱力點(diǎn)圖C)線型圖D)雷達(dá)圖[單選題]70.在Oracle數(shù)據(jù)庫(kù)中一個(gè)表的唯一標(biāo)識(shí)稱為()。A)主鍵B)IDC)索引D)key[單選題]71.()是整個(gè)文件系統(tǒng)的管理節(jié)點(diǎn)。A)AvroB)HttPFSBC)NameNodeD)Whirr[單選題]72.（__）由兩層神經(jīng)元組成。A)M-P模型B)神經(jīng)網(wǎng)絡(luò)C)神經(jīng)元D)感知機(jī)[單選題]73.np.eye()的作用是（__)。A)創(chuàng)建全零矩陣B)創(chuàng)建全1矩陣C)創(chuàng)建對(duì)角全1的矩陣D)顯示矩陣[單選題]74.以下哪個(gè)不是技術(shù)組的職責(zé)（）A)負(fù)責(zé)組織編制泛在電力物聯(lián)網(wǎng)建設(shè)方案和規(guī)劃B)組織審核各單位泛在電力物聯(lián)網(wǎng)建設(shè)方案C)負(fù)責(zé)泛在電力物聯(lián)網(wǎng)組織優(yōu)化診斷D)統(tǒng)一組織項(xiàng)目管控和架構(gòu)管控[單選題]75.刪除在my_ns命名空間下my_table表中，行鍵為1的一行數(shù)據(jù)的命令為（）A)deleteall'my_ns:my_table','1'B)delete'my_ns:my_table','1'C)delete'my_ns:my_table'wherekey=1D)deleteall'my_ns:my_table'wherekey=1[單選題]76.Hadoop中,如果yarn.scheduler.capacity.root.QueueA.minim.m-user-limit-percent設(shè)置為50,下面說(shuō)法錯(cuò)誤的是?A)一個(gè)用戶提交任務(wù),可以使用QueueA的100%的資源。B)如果QueueA中已經(jīng)有2個(gè)用戶的任務(wù)運(yùn)行,這時(shí)第3個(gè)用戶提交的任務(wù)需要等待釋放資源。C)QueueA中必須保障每個(gè)用戶至少得到50%的資源。D)QueueA中的每個(gè)用戶最多只能獲得50%的資源。[單選題]77.()是二維隨機(jī)變量的分布。A)正態(tài)分布B)二項(xiàng)分布C)邊緣分布D)指數(shù)分布[單選題]78.(__)為數(shù)據(jù)科學(xué)和大數(shù)據(jù)產(chǎn)業(yè)生態(tài)系統(tǒng)提供數(shù)據(jù)內(nèi)容的捕獲和獲取服務(wù)。A)數(shù)據(jù)源和APPsB)數(shù)據(jù)資源C)數(shù)據(jù)端D)基礎(chǔ)設(shè)施[單選題]79.下列關(guān)于SparkStreaming和Streaming比較說(shuō)法不正確的是?A)SparkStreaming是一個(gè)微批處理框架,事件需要積累到一定量時(shí)才進(jìn)行處理B)Streaming的執(zhí)行邏輯是即時(shí)啟動(dòng),運(yùn)行完后再回收C)SparkStreaming的吞吐量大約是Streaming的2-5倍D)SparkStreaming事件處理時(shí)延比Streaming更高[單選題]80.創(chuàng)建一個(gè)3x3的數(shù)組，下列代碼中錯(cuò)誤的是（）。A)np.arange(0,9).reshape(3,3)B)np.eye(3)C)np.random.random([3,3,3])D)np.mat("123;456;789")[單選題]81.當(dāng)需要將一個(gè)數(shù)組改變形狀時(shí)，應(yīng)使用numpy的哪個(gè)屬性？A)shape()B)reshape()C)arrange()D)array()[單選題]82.下列選項(xiàng)中，關(guān)于fillna()方法描述正確的是（）A)fillna()方法只能填充替換值為NaN的數(shù)據(jù)B)只支持前向填充方式C)默認(rèn)可支持填充的最大數(shù)量為1D)fillna()方法可以填充替換值為NaN和None的數(shù)據(jù)[單選題]83.云計(jì)算的數(shù)據(jù)中心主要是由以下哪種硬件構(gòu)成的？A)內(nèi)存B)CPUC)大存儲(chǔ)硬盤D)刀片服務(wù)器[單選題]84.自行車用戶信息表中收集了用戶的各類信息,包括用戶的出生日期及用戶第一次購(gòu)買自行車的日期。為了得到用戶第一次購(gòu)買自行車的年齡,應(yīng)使用()函數(shù)。A)DateDiffB)DatePartC)DatetimeToStringD)FormatDate[單選題]85.()是指針對(duì)用戶非常明確的數(shù)據(jù)查詢和處理任務(wù),以高性能和高吞吐量的方式實(shí)現(xiàn)大眾化的服務(wù),是數(shù)據(jù)價(jià)值最重要也是最直接的發(fā)現(xiàn)方式。A)數(shù)據(jù)服務(wù)B)數(shù)據(jù)分析C)數(shù)據(jù)治理D)數(shù)據(jù)應(yīng)用[單選題]86.假設(shè)一行數(shù)據(jù)內(nèi)容有1列字段內(nèi)容是不定長(zhǎng)字符串STR："|張山:23歲|李四:27歲|王五:29歲||劉N:T歲|"。請(qǐng)使用hive的函數(shù)解析出"李四"的年齡。A)str_to_map(STR,':','|')['李四']B)str_to_map(STR,'|',':')['李四']C)find_in_set(STR,'李四','|',':')D)find_in_set(STR,'李四',':','|')[單選題]87.在數(shù)據(jù)科學(xué)中，通?？梢圆捎?)有效避免數(shù)據(jù)加工和數(shù)據(jù)備份的偏見。A)A/B測(cè)試B)訓(xùn)練集和測(cè)試集的劃分C)測(cè)試集和驗(yàn)證集的劃分D)圖靈測(cè)試[單選題]88.下面不屬于NewSQL的有(__)。A)memsqlB)trafodionC)mariaDBD)objectivity[單選題]89.RDD中的數(shù)據(jù)被()在集群中，使得任務(wù)可以并行執(zhí)行。A)順序存儲(chǔ)B)連續(xù)存儲(chǔ)C)分塊存儲(chǔ)D)分區(qū)存儲(chǔ)[單選題]90.()是指理解挖掘項(xiàng)日的目標(biāo)業(yè)務(wù)需求。A)業(yè)務(wù)理解B)數(shù)據(jù)理解C)數(shù)據(jù)準(zhǔn)備D)數(shù)據(jù)建模[單選題]91.下面屬于查詢分析計(jì)算技術(shù)的是：()A)SparkB)StormC)HiveD)Pregel[單選題]92.決策樹的生成是一個(gè)（__）過(guò)程。A)循環(huán)B)迭代C)遞歸D)排序[單選題]93.在數(shù)據(jù)庫(kù)發(fā)展史上，先后出現(xiàn)過(guò)多種數(shù)據(jù)庫(kù)類型，但是不包括（）。A)網(wǎng)狀數(shù)據(jù)庫(kù)B)球形數(shù)據(jù)庫(kù)C)層次數(shù)據(jù)庫(kù)D)關(guān)系數(shù)據(jù)庫(kù)[單選題]94.構(gòu)建一個(gè)神經(jīng)網(wǎng)絡(luò)，將前一層的輸出和它自身作為輸入()有反饋連接A)循環(huán)神經(jīng)網(wǎng)絡(luò)B)卷積神經(jīng)網(wǎng)絡(luò)C)限制玻爾茲曼機(jī)D)都不是[單選題]95.大數(shù)據(jù)參考架構(gòu)的水平軸和垂直軸分別為()。A)信息(活動(dòng))價(jià)值鏈和信息技術(shù)價(jià)值鏈B)信息技術(shù)價(jià)值鏈和信息(活動(dòng))價(jià)值鏈C)信息交互價(jià)值鏈和信息技術(shù)價(jià)值鏈D)信息(活動(dòng))價(jià)值鏈和信息交互價(jià)值鏈[單選題]96.利用公共網(wǎng)絡(luò)來(lái)構(gòu)建的私人專用網(wǎng)絡(luò)稱為：（）A)VLANB)VMRC)VPND)VPP[單選題]97.馬爾可夫隨機(jī)場(chǎng)有一組（__），這是定義在變量子集上的非負(fù)實(shí)函數(shù)，主要用于定義概率分布函數(shù)。A)損失函數(shù)B)優(yōu)化函數(shù)C)激活函數(shù)D)勢(shì)函數(shù)[單選題]98.大數(shù)據(jù)的價(jià)值是通過(guò)數(shù)據(jù)共享、（）后獲取最大的數(shù)據(jù)價(jià)值A(chǔ))算法共享B)共享應(yīng)用C)數(shù)據(jù)交換D)交叉復(fù)用[單選題]99.以下哪個(gè)不是Storm的特點(diǎn)：()A)可擴(kuò)展性B)可靠的消息處理C)支持各種編程語(yǔ)言D)復(fù)雜的API[單選題]100.下面哪種不屬于數(shù)據(jù)預(yù)處理的方法？A)變量代換B)離散化C)聚集D)估計(jì)遺漏值[單選題]101.對(duì)于ADS的hash分區(qū)，（）說(shuō)法是正確的。A)ADS表的第一級(jí)分區(qū)必須為hash分區(qū)，第二級(jí)沒有強(qiáng)制要求，目前可以為list或者h(yuǎn)ashB)hash分區(qū)時(shí)一種動(dòng)態(tài)分區(qū)類型，需要指定具體的分區(qū)列，最多為2列C)ADS表的一級(jí)hash分區(qū)數(shù)最大為1000D)若一張表為batch更新類型，且僅有一級(jí)hash分區(qū)，則每次導(dǎo)入數(shù)據(jù)時(shí)，會(huì)對(duì)已有數(shù)據(jù)進(jìn)行全量覆蓋[單選題]102.以下不屬于大數(shù)據(jù)重要意義的是()。A)大數(shù)據(jù)成為推動(dòng)經(jīng)濟(jì)轉(zhuǎn)型發(fā)展的新動(dòng)力B)大數(shù)據(jù)成為重塑國(guó)家競(jìng)爭(zhēng)優(yōu)勢(shì)的新機(jī)遇C)大數(shù)據(jù)成為提升政府治理能力的新途徑D)大數(shù)據(jù)會(huì)增加經(jīng)濟(jì)發(fā)展的成本[單選題]103.下列選項(xiàng)中關(guān)于統(tǒng)一數(shù)據(jù)訪問(wèn)接口功能敘述不正確的一項(xiàng)為（）。A)不同的數(shù)據(jù)展示、存儲(chǔ)和管理B)訪問(wèn)接口與實(shí)現(xiàn)代碼分離的原則C)屏蔽了數(shù)據(jù)源的差異和數(shù)據(jù)庫(kù)操作細(xì)節(jié)D)提供一個(gè)統(tǒng)一的訪問(wèn)界面和一種統(tǒng)一的查詢語(yǔ)言[單選題]104.下面關(guān)于SET和ENUM說(shuō)法錯(cuò)誤的是()。--A)只能插入規(guī)定的數(shù)據(jù)項(xiàng)B)節(jié)省存儲(chǔ)空間C)查詢速度比VARCHAR類型快D)列表中不支持中文[單選題]105.HDFS適合的讀寫任務(wù)是？A)一次寫入，少次讀取B)多次寫入，少次讀取C)一次寫入，多次讀取D)多次寫入，多次讀取[單選題]106.下列哪-項(xiàng)是HBase不適合的應(yīng)用場(chǎng)景?A)海量數(shù)據(jù)（TB，PB）應(yīng)用場(chǎng)景。B)半結(jié)構(gòu)化數(shù)據(jù)應(yīng)用場(chǎng)景。C)要求具有完全ACID特性的應(yīng)用場(chǎng)景。D)高吞吐率應(yīng)用場(chǎng)景。[單選題]107.FusioninsightHD部署過(guò)程中，以下關(guān)于安裝集群說(shuō)法正確的是？A)支持模板安裝和手動(dòng)安裝B)首次登錄不用修改admin賬戶密碼C)對(duì)于組網(wǎng)隔離場(chǎng)景，在發(fā)現(xiàn)節(jié)點(diǎn)步驟的IP輸入框中，應(yīng)該輸入各個(gè)節(jié)點(diǎn)的業(yè)務(wù)IPD)選擇服務(wù)時(shí)，系統(tǒng)會(huì)自動(dòng)為其選擇依賴的底層服務(wù)[單選題]108.安裝FusionlnsightHD的Streaming組件時(shí)，Nimbus角色要求安裝幾個(gè)節(jié)點(diǎn)A)1B)2C)3D)4[單選題]109.在源和通道之間可以插入一個(gè)或多個(gè)()，來(lái)動(dòng)態(tài)檢查和修改Flume事件。A)Flume通道選擇器B)Flume接收器C)Flume攔截器D)Flume事件[單選題]110.Flink的Checkpoint機(jī)制繪制的流應(yīng)用快照不能被保存在以下哪個(gè)位置?A)LocalB)TaskManager的內(nèi)存C)JoblManager的內(nèi)存D)HDFS[單選題]111.下列方法中，能夠讓所有單詞的首字母變成大寫的方法是（）。A)capitalizeB)titleC)upperD)Ijust[單選題]112.在數(shù)據(jù)科學(xué)中，有時(shí)需要通過(guò)樣本對(duì)總體進(jìn)行(__)。A)描述統(tǒng)計(jì)B)洞見統(tǒng)計(jì)C)推斷統(tǒng)計(jì)D)歸納統(tǒng)計(jì)[單選題]113.數(shù)據(jù)的原始內(nèi)容及其備份數(shù)據(jù)，是數(shù)據(jù)產(chǎn)品的研發(fā)的哪個(gè)階段()。A)零次數(shù)據(jù)B)一次數(shù)據(jù)C)二次數(shù)據(jù)D)采集數(shù)據(jù)[單選題]114.從優(yōu)化角度來(lái)看，大數(shù)據(jù)計(jì)算服務(wù)的MapReduce對(duì)于哪個(gè)節(jié)點(diǎn)處理哪個(gè)分片這個(gè)問(wèn)題，采用了（）策略。A)本地性原理，即數(shù)據(jù)在哪臺(tái)機(jī)器上，就在哪臺(tái)機(jī)器上啟動(dòng)mapB)能者多勞原理，將數(shù)據(jù)移動(dòng)到計(jì)算能力最強(qiáng)的節(jié)點(diǎn)上，啟動(dòng)mapC)基于歷史處理信息的優(yōu)化原理，即將數(shù)據(jù)移到從歷史執(zhí)行信息看處理效果最好的機(jī)器上，啟動(dòng)mapD)負(fù)載均衡原理，即將數(shù)據(jù)放在當(dāng)前負(fù)載最小的節(jié)點(diǎn)上啟動(dòng)map[單選題]115.關(guān)于DataSet,下列說(shuō)法不正確的是?A)DataSet不需要反序列化就可執(zhí)行大部分操作B)DataSet是一個(gè)由特定域的對(duì)象組成的強(qiáng)類型集合C)DataSet與RDD高度類似,性能比RDD好D)DataSet執(zhí)行sort,filter,shuffle登操作需要進(jìn)行反序列化[單選題]116.一切可連，任何數(shù)據(jù)之間邏輯上都有可能存在聯(lián)系，這體現(xiàn)了大數(shù)據(jù)思維中的（）A)相關(guān)思維B)因果思維C)定量思維D)實(shí)驗(yàn)思維[單選題]117.一個(gè)屬性具有n個(gè)可取值，對(duì)該屬性進(jìn)行onehot編碼至少需要（）位二進(jìn)制進(jìn)行表示A)2nB)2的n次方C)nD)n的平方[單選題]118.假定你在神經(jīng)網(wǎng)絡(luò)中的隱藏層中使用激活函數(shù)X。在特定神經(jīng)元給定任意輸入，你會(huì)得到輸出「-0.0001」。X可能是以下哪一個(gè)激活函數(shù)？A)ReLUB)tanhC)SIGMOIDD)以上都可以[單選題]119.OLAM技術(shù)一般簡(jiǎn)稱為?數(shù)據(jù)聯(lián)機(jī)分析挖掘?，下面說(shuō)法正確的是：A)OLAP和OLAM都基于客戶機(jī)/服務(wù)器模式，只有后者有與用戶的交互性B)由于OLAM的立方體和用于OLAP的立方體有本質(zhì)的區(qū)別C)基于WEB的OLAM是WEB技術(shù)與OLAM技術(shù)的結(jié)合D)OLAM服務(wù)器通過(guò)用戶圖形借口接收用戶的分析指令，在元數(shù)據(jù)的知道下，對(duì)超級(jí)立方體作一定的操作[單選題]120.()將觀測(cè)值分為相同數(shù)目的兩部分,當(dāng)統(tǒng)計(jì)結(jié)果為非對(duì)稱分布時(shí),經(jīng)常使用它。A)眾數(shù)B)標(biāo)準(zhǔn)差C)中位數(shù)D)均值[單選題]121.下列可分解為偏差、方差與噪聲之和的是（）。A)訓(xùn)練誤差（trainingerror）B)經(jīng)驗(yàn)誤差（empiricalerror）C)均方誤差（meansquarederror）D)泛化誤差（generalizationerror）[單選題]122.下列不屬于大數(shù)據(jù)4V特性的是().A)大量B)多樣C)高速D)快捷[單選題]123.CDSW是基于Hadoop的企業(yè)級(jí)數(shù)據(jù)科學(xué)平臺(tái)，以下哪些不是他支持主流的開源深度學(xué)習(xí)算法庫(kù)？（）A)TensorFlowB)CoffeC)TorchD)Theano[單選題]124.（）向用戶提供辦公軟件、工作流等服務(wù)，使軟件提供商從軟件產(chǎn)品的生產(chǎn)者轉(zhuǎn)變成服務(wù)的運(yùn)營(yíng)者A)IaasB)PaasC)SaasD)Daas[單選題]125.某地區(qū)級(jí)網(wǎng)絡(luò)提供商使用Maxcompute存儲(chǔ)、分析寬帶用戶的流量信息，用戶每登陸一次產(chǎn)生一條紀(jì)錄，日均記錄數(shù)在2000萬(wàn)條左右，目前最常見為基于區(qū)縣（該市共有12個(gè)區(qū)縣）、日期（天）的各種查詢，其中部分查詢只帶有區(qū)縣信息。架構(gòu)師在設(shè)計(jì)用戶登陸信息表時(shí)，決定建成分區(qū)表，對(duì)于分區(qū)列的選取，以下性能最好的是：（）。A)以字符串型日期信息（天）為分區(qū)別B)以字段組合（字符串型區(qū)縣信息，字符串型日期信息（天））為分區(qū)列C)以字符串型區(qū)縣信息為分區(qū)列D)以字符串型日期信息（天）為第一級(jí)分區(qū)列，以字符串型區(qū)縣為第二級(jí)分區(qū)列[單選題]126.在邏輯回歸輸出與目標(biāo)對(duì)比的情況下,以下評(píng)估指標(biāo)中()不適用。A)AUC-ROCB)準(zhǔn)確度C)LoglossD)均方誤差[單選題]127.《云主機(jī)基礎(chǔ)版（IDC）維護(hù)管理辦法》不涉及哪種業(yè)務(wù)（）。A)互聯(lián)網(wǎng)帶寬出租B)工作區(qū)出租C)專線電路出租D)電力出租[單選題]128.下列選項(xiàng)中，哪一個(gè)可以對(duì)Hadoop集群進(jìn)行格式化（）A)hadoopnamenode-formatB)hadoopnamenode-lsC)hdfsdatanode-lsD)hdfsdatanode-format[單選題]129.（）模塊是Python標(biāo)準(zhǔn)庫(kù)中最常用的模塊之一。通過(guò)它可以獲取命令行參數(shù)，從而實(shí)現(xiàn)從程序外部向程序內(nèi)部傳遞參數(shù)的功能，也可以獲取程序路徑和當(dāng)前系統(tǒng)平臺(tái)等信息。A)sysB)platformC)mathD)time[單選題]130.一般來(lái)說(shuō),以下哪項(xiàng)不是大數(shù)據(jù)應(yīng)用開發(fā)必備的能力?A)理解相關(guān)業(yè)務(wù)背景B)熟悉LinuxShell命令C)具備JAVA/Scalla編程能力,熟悉SQLD)掌握機(jī)房硬件運(yùn)維技巧[單選題]131.kNN最近鄰方法在()情況下效果較好。A)樣本較多但典型性不好B)樣本呈團(tuán)狀分布C)樣本呈鏈狀分布D)樣本較少但典型性好[單選題]132.執(zhí)行下面操作后，list2的值是[()]。$;$list1=[4,5,6]$;$list2=list1$;$list1[2]=3A)4,5,6B)4,3,6C)4,5,3D)其他答案都不正確[單選題]133.Spark可以處理的數(shù)據(jù)任務(wù)包括（）。A)數(shù)據(jù)流處理B)交互式處理C)圖數(shù)據(jù)處理D)以上都是[單選題]134.關(guān)于進(jìn)行圖像分割時(shí)使用的最大類間、類內(nèi)方差比法，下列說(shuō)法正確的是A)選擇的閾值使得兩類數(shù)據(jù)間的方差越小越好B)選擇的閾值使得同一類的數(shù)據(jù)之間的方差越大越好C)使用類間、類內(nèi)方差比作為選擇閾值的評(píng)價(jià)參數(shù)D)使用類內(nèi)、類間方差比作為選擇閾值的評(píng)價(jià)參數(shù)[單選題]135.Flume的應(yīng)用中，如果要保證sink的負(fù)載均衡，需要使用以下哪一個(gè)組件?A)StaticInterceptorB)DefaultSinkProcessorC)ReplicatingChannelSelectorD)FailoverSinkProcessor[單選題]136.在文件處理中，模式?r，a?是指()。A)以只讀方式打開文件；打開一個(gè)文件用于追加。B)打開一個(gè)文件只用于寫入；打開一個(gè)文件用于追加。C)以二進(jìn)制模式打開文件；打開一個(gè)文件用于追加。D)打開一個(gè)文件用于讀寫；打開一個(gè)文件用于追加。[單選題]137.有如下程序：defcube(x):returnx*x*xx=cube(3)print(x)程序的輸出結(jié)果是()。A)3B)9C)27D)81[單選題]138.下面在python3中合法的語(yǔ)句為()。A)a=xrange(8)B)a=xrange(0,8)C)a=xrange(1,8)D)a=range(8)[單選題]139.Flume中一個(gè)ChannelSelector的作用是什么?A)設(shè)置多個(gè)channel發(fā)往多個(gè)sink的策略B)設(shè)置一個(gè)source發(fā)往多個(gè)channel的策略C)設(shè)置多個(gè)source發(fā)往多個(gè)channel的策略D)設(shè)置一個(gè)channel發(fā)往多個(gè)sink的策略角[單選題]140.在同一個(gè)問(wèn)題中，錯(cuò)誤率和精度的關(guān)系是（__）。A)錯(cuò)誤率等于精度值加1B)錯(cuò)誤率加精度等于1C)精度減錯(cuò)誤率等于1D)兩者之間沒有關(guān)系[單選題]141.在Hive的連接查詢中，內(nèi)連接通過(guò)關(guān)鍵字（）進(jìn)行標(biāo)識(shí)A)innerjoinB)leftouterjoinC)rightouterjoinD)fullouterjoin[單選題]142.數(shù)據(jù)分析的第一步是()。A)探索性分析B)描述性分析C)診斷性分析D)規(guī)范性分析[單選題]143.關(guān)于表連接算子的說(shuō)法錯(cuò)誤的是（?A)聚合操作如groupby會(huì)觸發(fā)NergeJoinB)表連接算子主要有NestloopMergeJoin.Minorjoin.HashJoinC)算子的選擇是SQL根據(jù)邏輯≡行選擇的,與人為無(wú)關(guān)。D)默認(rèn)情況下,執(zhí)行效率來(lái)說(shuō)Hashjoin最高。[單選題]144.把基于使用DMSquid作為模型的Predict輸出進(jìn)行反向轉(zhuǎn)換得到原始的標(biāo)簽值,會(huì)采用哪個(gè)數(shù)值轉(zhuǎn)換器?A)JobldB)InverseQuantifyC)DMSquidD)InverseNormalizer第2部分：多項(xiàng)選擇題，共62題，每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]145.下列關(guān)于AUC面積的描述,正確的是()。A)AUC被定義為ROC曲線下與坐標(biāo)軸圍成的面積B)AUC面積的值大于1C)AUC等于0.5時(shí),則真實(shí)性最低,無(wú)應(yīng)用價(jià)值D)AUC越接近1.0,檢測(cè)方法真實(shí)性越高[多選題]146.圖像分割中常使用的領(lǐng)域有（）。A)0鄰域B)4鄰域C)8鄰域D)24鄰域[多選題]147.針對(duì)學(xué)習(xí)器的泛化誤差問(wèn)題，主要的評(píng)估方法有()。A)留出法B)交叉驗(yàn)證法C)自助法D)測(cè)試誤差法[多選題]148.NoSQL數(shù)據(jù)庫(kù)常用的數(shù)據(jù)模型包括()。A)Key-ValueB)Key-DocumentC)Key-ColumnD)圖存儲(chǔ)[多選題]149.HDFS要實(shí)現(xiàn)以下哪幾個(gè)目標(biāo)？A)兼容廉價(jià)的硬件設(shè)備B)流數(shù)據(jù)讀寫C)大數(shù)據(jù)集D)復(fù)雜的文件模型[多選題]150.MapReduce分布式計(jì)算的主要特點(diǎn)有哪些A)每節(jié)點(diǎn)計(jì)算規(guī)?？s小B)各節(jié)點(diǎn)間計(jì)算能力相互依賴C)采用就近計(jì)算原則D)各節(jié)點(diǎn)分布進(jìn)行并行計(jì)算[多選題]151.根據(jù)《承德銀行大數(shù)據(jù)貸后風(fēng)險(xiǎn)預(yù)警信號(hào)管理辦法（試行）》，大數(shù)據(jù)貸后預(yù)警信號(hào)包括（）倆大類。A)客戶經(jīng)理手動(dòng)添加的信號(hào)B)大數(shù)據(jù)智能風(fēng)控平臺(tái)主動(dòng)推送的內(nèi)外部數(shù)據(jù)信號(hào)C)既為借款人同時(shí)也為擔(dān)保人觸發(fā)D)以上都不對(duì)[多選題]152.下列屬于Flume數(shù)據(jù)監(jiān)控的指標(biāo)是?A)Sink寫入數(shù)據(jù)量B)DataNode數(shù)量C)Channel緩存數(shù)據(jù)量D)Source接受數(shù)據(jù)量[多選題]153.Loader可以實(shí)現(xiàn)以下哪些轉(zhuǎn)換規(guī)則?A)長(zhǎng)整型時(shí)間轉(zhuǎn)換B)增量轉(zhuǎn)換C)拼接轉(zhuǎn)換D)空值轉(zhuǎn)換[多選題]154.下列說(shuō)法中，關(guān)于MapReduce性能調(diào)優(yōu)說(shuō)法正確的是（）。A)在數(shù)據(jù)輸入階段，采用CombineTextInputFormat來(lái)作為輸入，可以解決輸入端大量的小文件場(chǎng)景B)在Map階段，減少溢寫次數(shù)，可以減少磁盤IOC)在Map階段，減少合并次數(shù)，可以縮短MapReduce處理的時(shí)間D)在Shuffle階段，盡量給Shuffle提供更多的內(nèi)存空間，以防止出現(xiàn)內(nèi)存溢出現(xiàn)象[多選題]155.關(guān)于Excel數(shù)據(jù)庫(kù)應(yīng)用的描述正確的有()。A)是一個(gè)數(shù)據(jù)清單B)是按一定組織方式存儲(chǔ)在一起的相關(guān)數(shù)據(jù)的集合C)是一個(gè)數(shù)組D)是程序化的電子表格[多選題]156.屬于特征選擇的優(yōu)點(diǎn)有()。A)解決模型自身的缺陷B)減少過(guò)擬合C)提升模型的性能D)增強(qiáng)模型的泛化能力[多選題]157.數(shù)據(jù)節(jié)點(diǎn)（DataNode）的主要功能包括哪些？A)負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)和讀取B)根據(jù)客戶端或者是名稱節(jié)點(diǎn)的調(diào)度來(lái)進(jìn)行數(shù)據(jù)的存儲(chǔ)和檢索C)向名稱節(jié)點(diǎn)定期發(fā)送自己所存儲(chǔ)的塊的列表D)用來(lái)保存名稱節(jié)點(diǎn)中對(duì)HDFS元數(shù)據(jù)信息的備份，并減少名稱節(jié)點(diǎn)重啟的時(shí)間[多選題]158.關(guān)于Pig的說(shuō)法正確的是()。A)Pig的主要目的是彌補(bǔ)MapReduce編程的復(fù)雜性B)Pig的核心是一種數(shù)據(jù)分析語(yǔ)言C)Pig程序的結(jié)構(gòu)適合于串行處理D)Pig主要包含PigLatin和Pig執(zhí)行環(huán)境兩部分[多選題]159.以下哪些選項(xiàng)屬于集群資源規(guī)劃設(shè)計(jì)考慮的角度?A)容量預(yù)留B)數(shù)據(jù)質(zhì)量C)數(shù)據(jù)總規(guī)模D)單條數(shù)據(jù)大小[多選題]160.下列關(guān)于Python中標(biāo)識(shí)符的命名規(guī)則的說(shuō)法正確的有（）。A)只能以下劃線或者A-Z/a-z中的字母開頭B)關(guān)鍵字不能作為標(biāo)識(shí)符C)Python標(biāo)識(shí)符區(qū)分大小寫D)不能以數(shù)字開頭[多選題]161.構(gòu)建spark集群經(jīng)典4部曲：（1）搭建hadoop單機(jī)和偽分布式環(huán)境；（2）（__）;(3)構(gòu)造分布式spark集群；（4）（__）；A)安裝sshB)構(gòu)造分布式spark集群C)測(cè)試spark集群D)安裝rsync[多選題]162.下列屬于卷積神經(jīng)網(wǎng)絡(luò)組成部分的有（）。A)卷積層B)中間層C)池化層D)全連接層[多選題]163.請(qǐng)找出下列對(duì)字典操作正確的選項(xiàng)（）dict={?name?:?python?,?age?:17,?class?:?first?}A)dict[?age?]=18更新字典age的值B)dict[?scholl?]=?云課堂?添加信息schollC)deldict[?name?]刪除?name?一個(gè)元素值D)dict[?first?]=?class?取字典的值[多選題]164.在哪些場(chǎng)景下不能使用HBase作為存儲(chǔ)系統(tǒng)（）?A)需要ACID特性B)海量數(shù)據(jù)存儲(chǔ)C)主鍵查詢D)大文件，視頻等[多選題]165.數(shù)據(jù)關(guān)聯(lián)包含哪幾種?()A)簡(jiǎn)單關(guān)聯(lián)B)時(shí)序關(guān)聯(lián)C)因果關(guān)聯(lián)D)無(wú)限關(guān)聯(lián)[多選題]166.物聯(lián)網(wǎng)主要由下列哪些部分組成的？A)應(yīng)用層B)處理層C)感知層D)網(wǎng)絡(luò)層[多選題]167.參數(shù)估計(jì)可以分為()。A)點(diǎn)估計(jì)B)一致估計(jì)C)區(qū)間估計(jì)D)無(wú)偏估計(jì)[多選題]168.Hive特性包括哪些?A)易用易編程。B)靈活方便的ETL（extract/transform/load）。C)可直接訪問(wèn)HDFS文件以及HBase。D)支持MapReduce.Tez、Spark等多種計(jì)算引擎。[多選題]169.對(duì)GaussDB200集群管理模塊（CM）描述不正確的是?A)負(fù)責(zé)接收來(lái)自應(yīng)用的訪問(wèn)請(qǐng)求B)負(fù)責(zé)存儲(chǔ)數(shù)據(jù)C)全局事務(wù)管理D)由CMAgent.OMMonito和主備CMServer組成[多選題]170.已定義級(jí)（DefinedLevel）的主要特點(diǎn)包括（）。A)組織機(jī)構(gòu)已明確給出了關(guān)鍵過(guò)程的標(biāo)準(zhǔn)定義，并定期對(duì)其進(jìn)行改進(jìn)B)已提供了關(guān)鍵過(guò)程的測(cè)量與預(yù)測(cè)方法C)關(guān)鍵過(guò)程的執(zhí)行過(guò)程并不是簡(jiǎn)單或死板地執(zhí)行組織機(jī)構(gòu)給出的標(biāo)準(zhǔn)定義，而是根據(jù)具體業(yè)務(wù)進(jìn)行了一定的裁剪工作D)數(shù)據(jù)的重要性已成為組織機(jī)構(gòu)層次的共識(shí)，將數(shù)據(jù)當(dāng)作成功實(shí)現(xiàn)組織機(jī)構(gòu)使命的關(guān)鍵因素之一[多選題]171.Spark采用RDD以后能夠?qū)崿F(xiàn)高效計(jì)算的原因主要在于？A)高效的容錯(cuò)性B)中間結(jié)果持久化到內(nèi)存，數(shù)據(jù)在內(nèi)存中的多個(gè)C)存放的數(shù)據(jù)可以是Java對(duì)象，避免了不必要的對(duì)象序列化和反序列化D)采用數(shù)據(jù)復(fù)制實(shí)現(xiàn)容錯(cuò)[多選題]172.Flume中的Source工作方式可以分為以下哪幾種?A)廣播B)輪詢C)中斷D)驅(qū)動(dòng)[多選題]173.以下哪些數(shù)據(jù)源可以通過(guò)Loader實(shí)現(xiàn)與FusionInghtHD的數(shù)據(jù)交換?A)NoSQLB)FTPServerC)SFTPServerD)MySQL[多選題]174.ADS支持（）連接方式。A)安裝了php-mysql-5.1.x模塊的php環(huán)境B)使用版本為5.4系列的mysql－jdbc驅(qū)動(dòng)C)用戶管理控制臺(tái)中的DMSD)mysql5.6的客戶端[多選題]175.一次BSP計(jì)算過(guò)程包括一系列全局超步（超步就是指計(jì)算中的一次迭代），每個(gè)超步主要包括哪幾個(gè)組件：()A)局部計(jì)算B)中間計(jì)算C)通信D)柵欄同步[多選題]176.可以通過(guò)Java調(diào)用API對(duì)HDFS文件系統(tǒng)操作的內(nèi)容包括?（）A)查詢HDFS指走目錄下的文件B)讀取HDFS中指定文件C)在HDFS上創(chuàng)建文件夾D)上傳文件到HDFS上[多選題]177.FusionInsightManager的主要功能有以下哪些?A)數(shù)據(jù)集成B)系統(tǒng)管理C)安全管理D)服務(wù)治理[多選題]178.Excel中有關(guān)數(shù)據(jù)庫(kù)內(nèi)容,描述正確的有()。A)每一個(gè)Excel數(shù)據(jù)庫(kù)對(duì)應(yīng)一個(gè)工作簿文件B)一列為一個(gè)字段,描述實(shí)體對(duì)象的屬性C)Excel數(shù)據(jù)庫(kù)屬于?關(guān)系數(shù)據(jù)模型?,又稱為關(guān)系型數(shù)據(jù)庫(kù)D)一行為一個(gè)記錄,描述某個(gè)實(shí)體對(duì)象[多選題]179.下列與人工智能場(chǎng)景相關(guān)的有（）。A)圖像識(shí)別B)人臉識(shí)別C)語(yǔ)音識(shí)別D)語(yǔ)義分析[多選題]180.分布式列式存儲(chǔ)的功能有()。A)支持在線快速讀寫B(tài))支持線性擴(kuò)展C)具備節(jié)點(diǎn)監(jiān)控管理D)數(shù)據(jù)同源不壓縮[多選題]181.大數(shù)據(jù)全鏈路處理工作流程有()A)數(shù)據(jù)湖B)數(shù)據(jù)加工C)可視化D)分析挖機(jī)[多選題]182.關(guān)于Maxcompute中tunnelupload的分隔符，說(shuō)法正確的是:（）。A)列分隔符不能包含行分隔符B)支持多個(gè)字符的行列分隔符C)轉(zhuǎn)義字符分隔符，在命令行方式下在只支持\r、\n和\tD)缺省為空格[多選題]183.MapReduce與HBase的關(guān)系，哪些描述是正確的？A)兩者不可或缺，MapReduce是HBase可以正常運(yùn)行的保證B)兩者不是強(qiáng)關(guān)聯(lián)關(guān)系，沒有MapReduce，HBase可以正常運(yùn)行C)MapReduce可以直接訪問(wèn)HBaseD)它們之間沒有任何關(guān)系[多選題]184.Hadoop組件Zookeeper的設(shè)計(jì)目標(biāo)和主要特點(diǎn)包括()。A)簡(jiǎn)單性B)自我復(fù)制C)順序訪問(wèn)D)高速讀取[多選題]185.下列關(guān)于DataFrame說(shuō)法正確的是（）A)DataFrame是一個(gè)類似二維數(shù)組的對(duì)象B)DataFrame是由數(shù)據(jù)和索引組成C)DataFrame有行索引與列索引D)默認(rèn)情況下DataFrame的行索引在最右側(cè)[多選題]186.以下說(shuō)法正確的是（）A)數(shù)組第一維的大小可以通過(guò)ndim()函數(shù)獲得B)數(shù)組的形狀可以通過(guò)shape()獲得C)數(shù)組元素的類型通過(guò)dtype屬性獲得D)數(shù)組元素的字節(jié)數(shù)可以用過(guò)itemsize獲得[多選題]187.下列哪種服務(wù)可以用于存儲(chǔ)數(shù)據(jù)()。A)MapReduceB)YARNC)HBaseD)HDFS[多選題]188.下列屬于Spark集群搭建前的需要完成的工作是（__)。A)搭建hadoop集群B)配置集群hostC)安裝jdkD)啟動(dòng)Spark集群[多選題]189.獲得采樣數(shù)據(jù)的常用方式有（）【選三項(xiàng)】A)隨機(jī)抽樣B)桶表抽樣C)數(shù)據(jù)塊抽樣D)順序抽樣[多選題]190.下面選項(xiàng)哪些是HBase數(shù)據(jù)查詢過(guò)濾器Filter的比較器?A)BinaryComparatorB)BinaryProfixComparatorC)RegexStringComparatorD)SubStringComparator[多選題]191.下列函數(shù)屬于二元通用函數(shù)（binaryuniversalfunctions）的有（）。A)addB)substractC)multiplyD)power[多選題]192.下面那些函數(shù)屬于常用的激活函數(shù)。（）A)SigmoidB)TanhC)MeanD)Relu[多選題]193.云管理平臺(tái)的作用包括（）。A)將各種接口，工具和流程進(jìn)行組合以提供定義的服務(wù)B)將軟件和硬件進(jìn)行組合C)自動(dòng)化各種工作流程D)提供平臺(tái)的監(jiān)控，運(yùn)維，擴(kuò)展，計(jì)費(fèi)等功能[多選題]194.執(zhí)行以下代碼段Age=12ifage<4print("Youradmissioncostis$0.")時(shí)，輸出為()。A)invalidsyntaxB)expectedanindentedblockC)name'age'isnotdefinedD)unexpectedEOFwhileparsing[多選題]195.我們希望減少數(shù)據(jù)集中的特征數(shù)量。你可以采取以下哪一個(gè)步驟來(lái)減少特征（）？A)使用正向選擇法（ForwardSelection）B)使用反向消除法（BackwardElimination）C)逐步選擇消除法（Stepwise）D)計(jì)算不同特征之間的相關(guān)系數(shù)，刪去相關(guān)系數(shù)高的特征之一[多選題]196.下面對(duì)HBase的描述哪些是正確的？A)不是開源的B)是面向列的C)是分布式的D)是一種NoSQL數(shù)據(jù)庫(kù)[多選題]197.現(xiàn)代企業(yè)數(shù)據(jù)分析平臺(tái)向著云化和融合發(fā)展的優(yōu)勢(shì)有哪些?A)超敏捷應(yīng)用B)資源單性分配C)多場(chǎng)景分析D)交叉融合分析[多選題]198.Spark容錯(cuò)性的方式有哪些()。A)數(shù)據(jù)檢查點(diǎn)B)存儲(chǔ)原始數(shù)據(jù)C)記錄數(shù)據(jù)的更新D)自建數(shù)據(jù)版本[多選題]199.從加工程度看，以下關(guān)于數(shù)據(jù)說(shuō)法正確的是（）A)零次數(shù)據(jù)就是沒有經(jīng)過(guò)預(yù)處理的原始數(shù)據(jù)B)一次數(shù)據(jù)就是預(yù)處理過(guò)的數(shù)據(jù)，即干凈數(shù)據(jù)C)二次數(shù)據(jù)就是分析處理的結(jié)果，即增值數(shù)據(jù)D)三次數(shù)據(jù)就是可以直接用于決策的洞見數(shù)據(jù)[多選題]200.下列集合操作結(jié)果正確的有（）。A)name={'d'，'s'}nameadd（'sd'），name值為{'sd'，'d'，'s'}B)name={'sd'，d'，'s'}nameremove（'s'），name值為{'sd'，'d'}C)name={'sd'，d'，'s'}nameclear），name值為{}D)name={'sd'，d'，'s'}nameupdate（'df'），name值為{'sd'，'d'，?f'，'s'，'j'}[多選題]201.哪些數(shù)據(jù)特性是對(duì)聚類分析具有很強(qiáng)影響?A)高維性B)規(guī)模C)稀疏性D)噪聲和離群點(diǎn)[多選題]202.智能物流具有哪幾個(gè)方面的重要作用：()A)提高物流的信息化和智能化水平B)降低物流成本和提高物流效率C)提高物流活動(dòng)的一體化D)提高了物流的復(fù)雜性[多選題]203.關(guān)于數(shù)據(jù)產(chǎn)品研發(fā)，下列說(shuō)法錯(cuò)誤的是()。A)從加工程度看，可以將數(shù)據(jù)分為一次數(shù)據(jù)、二次數(shù)據(jù)和三次數(shù)據(jù)B)一次數(shù)據(jù)中往往存在缺失值、噪聲、錯(cuò)誤或虛假數(shù)據(jù)等質(zhì)量問(wèn)題C)二次數(shù)據(jù)是對(duì)一次數(shù)據(jù)進(jìn)行深度處理或分析后得到的"增值數(shù)據(jù)"D)三次數(shù)據(jù)是對(duì)二次數(shù)據(jù)進(jìn)行洞察與分析后得到的、可以直接用于決策支持的"洞見數(shù)據(jù)"[多選題]204.下列關(guān)于標(biāo)簽的說(shuō)法,正確的有()A)對(duì)同一個(gè)用戶,可以打上很多個(gè)標(biāo)簽B)每個(gè)標(biāo)簽都指向用戶的一類屬性或行為C)標(biāo)簽在在精準(zhǔn)營(yíng)銷方面能夠發(fā)揮了獨(dú)特的效用D)標(biāo)簽可以更好的顯示和突出搜索的關(guān)鍵詞條[多選題]205.項(xiàng)目管理涉及(__)和整體、質(zhì)量、人力資源、溝通、風(fēng)險(xiǎn)、采購(gòu)的管理。A)時(shí)間B)空間C)成本D)范圍[多選題]206.當(dāng)數(shù)據(jù)集中樣本類別不均衡時(shí)，常采用哪些方法來(lái)解決？（）A)降采樣B)升采樣C)人造數(shù)據(jù)D)更換分類算法E)以上都不是第3部分：判斷題，共42題，請(qǐng)判斷題目是否正確。[判斷題]207.MRS的安全模式一般是用于生產(chǎn)環(huán)境。A)正確B)錯(cuò)誤[判斷題]208.云計(jì)算是信息技術(shù)發(fā)展和集成應(yīng)用到新階段產(chǎn)生的新技術(shù)。A)正確B)錯(cuò)誤[判斷題]209.find()方法返回-1說(shuō)明子串在指定的字符串中。（）A)正確B)錯(cuò)誤[判斷題]210.在設(shè)計(jì)正則表達(dá)式時(shí)，字符_？緊隨任何其他限定符(*、+、?、{n}、{n,}、{n,m})之后時(shí)，匹配模式是?非貪心的?，匹配搜索到的、盡可能短的字符串。A)正確B)錯(cuò)誤[判斷題]211.下列創(chuàng)建propertykey的代碼正確嗎?PropertyKeypropertyKey=newPropertyKey（）;PropertyKey.setDataType（DataType.String）;PropertyKey.setName（"name"）;Api.addPropertyKey（propertyKey）;A)正確B)錯(cuò)誤[判斷題]212.儀表板可以隨數(shù)據(jù)變化是否正確()A)正確B)錯(cuò)誤[判斷題]213.數(shù)據(jù)科學(xué)家應(yīng)該學(xué)會(huì)數(shù)據(jù)科學(xué)的基礎(chǔ)理論，尤其是其主要理念、原則、理論和方十法。()A)正確B)錯(cuò)誤[判斷題]214.任何數(shù)據(jù)流都必須經(jīng)過(guò)數(shù)據(jù)匯集()A)正確B)錯(cuò)誤[判斷題]215.特征提取技術(shù)并不依賴于特定的領(lǐng)域。()A)正確B)錯(cuò)誤[判斷題]216.Hive基于Hadoop，安裝Hive之前先安裝好Hadoop。()A)正確B)錯(cuò)誤[判斷題]217.對(duì)于SVM分類算法，待分樣本集中的大部分樣本不是支持向量，移去或者減少這些樣本對(duì)分類結(jié)果沒有影響A)正確B)錯(cuò)誤[判斷題]218.print("AD">"ADC")的運(yùn)行結(jié)果False。A)正確B)錯(cuò)誤[判斷題]219.正則表達(dá)式元字符？用來(lái)表示該符號(hào)前面的字符或子模式0次或多次出現(xiàn)。A)正確B)錯(cuò)誤[判斷題]220.具有較高的支持度的項(xiàng)集具有較高的置信度A)正確B)錯(cuò)誤[判斷題]221.分類算法的召回率是指檢索出的相關(guān)文檔數(shù)和文檔庫(kù)中所有的相關(guān)文檔數(shù)的比率，衡量的是檢索系統(tǒng)的查全率A)正確B)錯(cuò)誤[判斷題]222.數(shù)據(jù)庫(kù)架構(gòu)設(shè)計(jì)SharedEverying是指服務(wù)器的所有資源（包括磁盤、CPU、顯卡、網(wǎng)絡(luò)）都共享。A)正確B)錯(cuò)誤[判斷題]223.批處理優(yōu)先推薦使用Spark或SparkSQL模式，也可以使用MapReduce或Hive模式。兩種批處理模式可以同時(shí)使用。（）A)正確B)錯(cuò)誤[判斷題]224.數(shù)據(jù)科學(xué)流程的特殊性在于需要將科學(xué)家的3C精神融人業(yè)務(wù)流程之中。()A)正確B)錯(cuò)誤[判斷題]225.孤立點(diǎn)在數(shù)據(jù)挖掘時(shí)總是被視為異常、元用數(shù)據(jù)而丟棄。()A)正確B)錯(cuò)誤[判斷題]226.大數(shù)據(jù)技術(shù)的解決方案思路是聚焦在單臺(tái)機(jī)器上，思考如何提升單機(jī)的性能，尋找更貴更好的服務(wù)器。A)正確B)錯(cuò)誤[判斷題]227.Hbase中OpenScanner的過(guò)程，會(huì)創(chuàng)建兩種不同的Scanner來(lái)讀取Hfile和MetaStore的數(shù)據(jù)，Hfile對(duì)應(yīng)的scanner為StoreFileScanner，MetaStore對(duì)應(yīng)的Scanner為MetaStoreScanner。A)正確B)錯(cuò)誤[判斷題]228.HDFS對(duì)大文件的處理能力較強(qiáng)，但是對(duì)于小文件，尤其是大量的小文件的處理能力反而較弱。A)正確B)錯(cuò)誤[判斷題]229.NameNode負(fù)責(zé)管理元數(shù)據(jù)，客戶端每次讀寫請(qǐng)求時(shí)，都會(huì)從磁盤中讀取或?qū)懭朐獢?shù)據(jù)信息并反饋給客戶端。()A)正確B)錯(cuò)誤[判斷題]230.只能通過(guò)切片訪問(wèn)元組中的元素，不能使用切片修改元組中的元素。A)正確B)錯(cuò)誤[判斷題]231.DSS主要是基于數(shù)據(jù)倉(cāng)庫(kù).聯(lián)機(jī)數(shù)據(jù)分析和數(shù)據(jù)挖掘技術(shù)的應(yīng)用A)正確B)錯(cuò)誤[判斷題]232.在大數(shù)據(jù)時(shí)代，我們無(wú)須再緊盯事物之間的因果關(guān)系。A)正確B)錯(cuò)誤[判斷題]233.假設(shè)有列表a=['name','age','sex']和b=['Dong',38,'Male']，請(qǐng)使用一個(gè)語(yǔ)句將這兩個(gè)列表的內(nèi)容轉(zhuǎn)換為字典，并且以列表a中的元素為?鍵?，以列表b中的元素為?值?，這個(gè)語(yǔ)句可以寫為c=dict(zip(a,b)。A)正確B)錯(cuò)誤[判斷題]234.已知x={'a':'b','c':'d'}，那么表達(dá)式'a'inx的值為True。A)正確B)錯(cuò)誤[判斷題]235.()select語(yǔ)句的過(guò)濾條件既可以放在where子句中，也可以放在from子句中。A)正確B)錯(cuò)誤[判斷題]236.數(shù)據(jù)倉(cāng)庫(kù)的最終目的是為用戶和業(yè)務(wù)部門提供決策支持。A)正確B)錯(cuò)誤[判斷題]237.表達(dá)式min(['11','2','3'])的值為'3'A)正確B)錯(cuò)誤[判斷題]238.由于Hadoop是使用Java語(yǔ)言編寫的，因此可以使用JavaAPI操作Hadoop文件系統(tǒng)。A)正確B)錯(cuò)誤[判斷題]239.9+4j是合法Python數(shù)字類型。A)正確B)錯(cuò)誤[判斷題]240.正則表達(dá)式'^http'只能匹配所有以'http'開頭的字符串。A)正確B)錯(cuò)誤[判斷題]241.在操作DataFrame對(duì)象時(shí)，可以通過(guò)指定索引名的方式獲取數(shù)據(jù)。()A)正確B)錯(cuò)誤[判斷題]242.已知x是個(gè)列表對(duì)象，那么執(zhí)行語(yǔ)句y=x[:]之后，對(duì)y所做的任何操作都會(huì)同樣作用到x上。A)正確B)錯(cuò)誤[判斷題]243.Kettle中有兩種腳本文件transformation(轉(zhuǎn)換ktr結(jié)尾)和job(任務(wù)kjb結(jié)尾)A)正確B)錯(cuò)誤[判斷題]244.離線批處理通常通過(guò)MR作業(yè)、Spark作業(yè)或者HQL作業(yè)實(shí)現(xiàn)。A)正確B)錯(cuò)誤[判斷題]245.省聯(lián)社審計(jì)系統(tǒng)主要分為現(xiàn)場(chǎng)設(shè)計(jì)模塊和非現(xiàn)場(chǎng)審計(jì)模塊A)正確B)錯(cuò)誤[判斷題]246.基于大數(shù)據(jù)的數(shù)據(jù)真實(shí)性分析技術(shù)能夠提高垃圾信息的鑒別能力。A)正確B)錯(cuò)誤[判斷題]247.基于集中式架構(gòu)，融合結(jié)構(gòu)化、非結(jié)構(gòu)化、海量歷史/準(zhǔn)實(shí)時(shí)、電網(wǎng)地理信息四類數(shù)據(jù)中心，整合、優(yōu)化公司現(xiàn)有技術(shù)組件，構(gòu)建公司級(jí)大數(shù)據(jù)平臺(tái)。()A)正確B)錯(cuò)誤[判斷題]248.GDS的并行導(dǎo)入導(dǎo)出流程都是首先準(zhǔn)備數(shù)據(jù),然后啟動(dòng)服務(wù),創(chuàng)外部表,最后執(zhí)行數(shù)據(jù)導(dǎo)入導(dǎo)出操作A)正確B)錯(cuò)誤第4部分：?jiǎn)柎痤}，共11題，請(qǐng)?jiān)诳瞻滋幪顚懻_答案。[問(wèn)答題]249.如果需要由數(shù)據(jù)生產(chǎn)者決定數(shù)據(jù)發(fā)送給目標(biāo)Bolt的某一個(gè)確定的Task,應(yīng)選擇（）發(fā)布策略[問(wèn)答題]250.mapred.job.tracker命令的作用？[問(wèn)答題]251.默認(rèn)NameNode周期性從DataNode接收心跳信號(hào)的時(shí)間間隔為()秒。[問(wèn)答題]252.Redis采用Master-Slave架構(gòu),由Master節(jié)點(diǎn)管理Slave工作A)TRUEB)FALSE[問(wèn)答題]253.目前ApacheHadoop發(fā)布的版本主要有()。[問(wèn)答題]254.Spark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的快速通用的計(jì)算引擎，將Job中間輸出結(jié)果可以保存在()中，從而不再需要讀寫HDFS。因此Spark能更好地適用于數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)等需要迭代的MapReduce的算法。[問(wèn)答題]255.HDFS存儲(chǔ)數(shù)據(jù)時(shí),關(guān)鍵數(shù)據(jù)根據(jù)實(shí)際業(yè)務(wù)需要保存在具有高度可靠性的節(jié)點(diǎn)中,通過(guò)修改DataNode的存儲(chǔ)策略,系統(tǒng)可以將數(shù)據(jù)強(qiáng)制保存在指定的節(jié)點(diǎn)組中。A)TRUEB)FALSE[問(wèn)答題]256.Hadoop默認(rèn)開設(shè)HDFS文件系統(tǒng)端口號(hào)()和監(jiān)控Yarn集群端口號(hào)()。[問(wèn)答題]257.Flink適用于高并發(fā)處理數(shù)據(jù)、毫秒級(jí)時(shí)延的應(yīng)用A)TrueB)False[問(wèn)答題]258.Flume的Channel有多種類型，其中（）在機(jī)器宕機(jī)時(shí)可能丟失數(shù)據(jù)。[問(wèn)答題]259.如何檢查Namenode是否正常運(yùn)行？[單選題]260.以下哪些選項(xiàng)屬于Hive的數(shù)據(jù)存儲(chǔ)模型?A)桶B)數(shù)據(jù)庫(kù)C)分區(qū)D)表E)以上全都正確1.答案:C解析:HDFS命令2.答案:B解析:3.答案:A解析:4.答案:C解析:5.答案:D解析:6.答案:D解析:7.答案:D解析:8.答案:C解析:9.答案:D解析:read（）函數(shù)為讀取操作；tell（）函數(shù)用于判斷文件指針當(dāng)前所處的位置操作；Seek（）函數(shù)為用于將文件指針移動(dòng)至指定位置操作；close（）函數(shù)為關(guān)閉文件操作。10.答案:D解析:11.答案:A解析:12.答案:B解析:13.答案:A解析:transpose（）對(duì)矩陣進(jìn)行矩陣轉(zhuǎn)置，rollaxis（）向后滾動(dòng)指定的軸，swapaxes（）對(duì)換數(shù)組的兩個(gè)軸，tan（）求三角函數(shù)，29114.答案:A解析:參數(shù)估計(jì)是統(tǒng)計(jì)推斷的一種。根據(jù)從總體中抽取的隨機(jī)樣本來(lái)估計(jì)總體分布中未知參數(shù)的過(guò)程。15.答案:B解析:16.答案:C解析:17.答案:A解析:18.答案:D解析:19.答案:A解析:20.答案:A解析:21.答案:B解析:22.答案:D解析:23.答案:A解析:24.答案:A解析:信息熵(informationentropy)是度量樣本集合純度最常用的一種指標(biāo),信息熵越大,變量的不確定性越大,反之越小。樹模型的分界點(diǎn)應(yīng)選擇信息熵最小的元素,本體選天氣。25.答案:B解析:26.答案:C解析:27.答案:C解析:HBase是一個(gè)面向列的實(shí)時(shí)分布式數(shù)據(jù)庫(kù)。28.答案:B解析:def是Python中自定義函數(shù)的關(guān)鍵字。29.答案:C解析:涉及TaskTracker不是SecondaryNode一個(gè)job的運(yùn)行，涉及4個(gè)實(shí)體：客戶端，JobTracker，TaskTracker，HDFS30.答案:C解析:31.答案:D解析:32.答案:D解析:33.答案:D解析:34.答案:C解析:35.答案:A解析:36.答案:C解析:37.答案:D解析:38.答案:B解析:39.答案:B解析:通過(guò)?ll?指令查看Hadoop的目錄結(jié)構(gòu)40.答案:A解析:MLib是可擴(kuò)展機(jī)器學(xué)習(xí)庫(kù)。41.答案:C解析:42.答案:D解析:43.答案:B解析:44.答案:B解析:45.答案:C解析:46.答案:C解析:47.答案:D解析:48.答案:C解析:49.答案:C解析:50.答案:D解析:51.答案:C解析:52.答案:B解析:53.答案:B解析:54.答案:D解析:append（）函數(shù)可向數(shù)組橫縱坐標(biāo)添加數(shù)組，insert（）函數(shù)可向一維數(shù)組后添加數(shù)據(jù)，vstack（）函數(shù)可以進(jìn)行數(shù)組拼接，where（）函數(shù)是對(duì)數(shù)據(jù)進(jìn)行條件篩選。55.答案:C解析:56.答案:A解析:57.答案:C解析:58.答案:B解析:59.答案:B解析:劃分聚類算法K-Means將數(shù)據(jù)點(diǎn)集分為K個(gè)子集。60.答案:B解析:61.答案:B解析:62.答案:A解析:63.答案:C解析:通過(guò)執(zhí)行?start-dfs.sh?指令，可以一鍵啟動(dòng)HDFS集群64.答案:C解析:65.答案:A解析:66.答案:C解析:67.答案:A解析:68.答案:D解析:69.答案:C解析:70.答案:A解析:71.答案:C解析:72.答案:D解析:73.答案:C解析:74.答案:C解析:75.答案:A解析:76.答案:D解析:77.答案:C解析:二維隨機(jī)變量的分布有邊緣分布和條件分布。78.答案:A解析:79.答案:B解析:80.答案:C解析:81.答案:B解析:82.答案:D解析:83.答案:D解析:84.答案:A解析:85.答案:A解析:數(shù)據(jù)服務(wù)指針對(duì)用戶非常明確的數(shù)據(jù)查詢和處理任務(wù),以高性能和高吞吐量的方式實(shí)現(xiàn)大眾化的服務(wù),是數(shù)據(jù)價(jià)值最重要也是最直接的發(fā)現(xiàn)方式。86.答案:B解析:87.答案:A解析:88.答案:D解析:89.答案:D解析:90.答案:A解析:91.答案:C解析:92.答案:C解析:93.答案:B解析:94.答案:A解析:95.答案:A解析:96.答案:C解析:97.答案:D解析:98.答案:D解析:99.答案:D解析:100.答案:D解析:101.答案:D解析:102.答案:D解析:大數(shù)據(jù)可以促進(jìn)經(jīng)濟(jì)的發(fā)展,催生新的業(yè)態(tài),在輔助商業(yè)決策、降低運(yùn)營(yíng)成本、精準(zhǔn)市場(chǎng)的營(yíng)銷方面都能發(fā)揮作用,進(jìn)一步提升企業(yè)競(jìng)爭(zhēng)力。103.答案:A解析:104.答案:D解析:105.答案:C解析:106.答案:C解析:107.答案:A解析:108.答案:B解析:109.答案:C解析:110.答案:B解析:111.答案:B解析:112.答案:C解析:113.答案:A解析:114.答案:A解析:115.答案

人人文庫(kù)> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷19)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論