大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷1)_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷1)_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷1)_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷1)_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷1)_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷1)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:單項選擇題,共57題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.以下哪一項不屬于Hadoop可以運行的模式______。A)單機(本地)模式B)偽分布式模式C)互聯(lián)模式D)分布式模式答案:C解析:Hadoop的三種運行模式:單機(本地)模式、偽分布式模式和分布式模式。/qiulinsama/article/details/86216394[單選題]2.SQL語言是()的語言,輕易學(xué)習(xí)。A)導(dǎo)航式B)過程化C)格式化D)非過程化答案:D解析:[單選題]3.Spark中的Storage模塊存取的最小單位是A)ByteB)WordC)BlockD)Page答案:C解析:[單選題]4.企業(yè)數(shù)據(jù)分析平臺在根據(jù)不同的業(yè)務(wù)場景需求,搭建不同的大數(shù)據(jù)分析平臺,如適應(yīng)離線批處理的Hadoop平臺;適應(yīng)實時處理的流計算平臺等,這種架構(gòu)屬于哪種類型的架構(gòu)?A)分離架構(gòu)B)單一架構(gòu)C)融合架構(gòu)D)多維架構(gòu)答案:B解析:[單選題]5.HDfS中的block默認(rèn)保存幾份?A)3B)2C)1D)不確定答案:A解析:[單選題]6.以數(shù)據(jù)為中心的思考解決問題的方式優(yōu)勢逐漸得到體現(xiàn)的原因不包括()A)各個領(lǐng)域的數(shù)據(jù)不斷擴(kuò)展B)各個領(lǐng)域的數(shù)據(jù)交叉編制成網(wǎng)C)數(shù)據(jù)之間的關(guān)聯(lián)性大大增強D)人是數(shù)據(jù)的中心答案:D解析:[單選題]7.Hive的數(shù)據(jù)最終存儲在()。A)HDFSB)HBaseC)RDBMSD)MetaStore答案:A解析:[單選題]8.以下哪項用來分組()A)ORDERBYB)ORDEREDBYC)GROUPBYD)GROUPEDBY答案:C解析:[單選題]9.plt.plot()函數(shù)的功能是(__)。A)展現(xiàn)變量的趨勢變化B)尋找變量之間的關(guān)系C)設(shè)置x軸的數(shù)值顯示范圍D)設(shè)置x軸的標(biāo)簽文本答案:A解析:[單選題]10.在線性回歸問題中,我們用R方來衡量擬合的好壞在線性回歸模型中增加特征值并再訓(xùn)練同一模型下列說法正確的是()A)如果R方上升,則該變量是顯著的B)如果R方下降,則該變量不顯著C)羊羊R方不能反映變量重要性,不能就此得出正確結(jié)論D)以上答案都不正確答案:C解析:[單選題]11.HBase交互模式中,查看當(dāng)前版本的命令是()A)versionB)versionsC)showsD)show答案:A解析:[單選題]12.Numpy中創(chuàng)建全為1的矩陣使用什么?A)np.zeros()B)np.ones()C)np.empty()D)np.arange()答案:B解析:[單選題]13.下列關(guān)于python的類的說法錯誤的是()。A)類的實例方法必須創(chuàng)建對象后才可以調(diào)用B)類的實例方法必須創(chuàng)建對象前才可以調(diào)用C)類的類方法可以用對象和類名來調(diào)用D)類的靜態(tài)屬性可以用類名和對象來調(diào)用答案:B解析:類的實例方法必須創(chuàng)建對象后才可以調(diào)用。[單選題]14.HFile數(shù)據(jù)格式中的MetaIndex字段用于()。A)Meta塊的長度B)Meta塊的結(jié)束點C)Meta塊數(shù)據(jù)內(nèi)容D)Meta塊的起始點答案:D解析:index索引地址的意思就是起始點。[單選題]15.大數(shù)據(jù)時代的一大特征是萬物互聯(lián)與融合,下列說法錯誤的是()。A)人均入網(wǎng)設(shè)備增加B)融入各個領(lǐng)域行業(yè)C)個人信息安全問題凸顯D)信息安全領(lǐng)域影響不大答案:D解析:[單選題]16.()數(shù)據(jù)庫將結(jié)構(gòu)化、半結(jié)構(gòu)化的文檔以特定格式存儲。A)列存儲B)文檔型C)圖形D)key-value答案:B解析:[單選題]17.某學(xué)生正在學(xué)習(xí)ElasticSearch,請你幫他分析下,下列代碼的作用是什么?VX:HWRZKSTKA)插入數(shù)據(jù),更新素引B)插入數(shù)據(jù),創(chuàng)建素引C)更新索引D)創(chuàng)建數(shù)據(jù)答案:B解析:[單選題]18.以下不屬于高維數(shù)據(jù)可視化類別的是()。A)平行坐標(biāo)圖B)降維投影圖C)散點圖矩陣D)河流圖答案:D解析:[單選題]19.關(guān)于HIVE的描述不正確的是?A)Hive最佳使用場景是大數(shù)據(jù)集的批處理作業(yè)B)Hive可以實現(xiàn)在大規(guī)模數(shù)據(jù)集上實現(xiàn)低延遲快速的查詢、C)ive構(gòu)建在基于靜態(tài)批量處理的Hadoop之上,Hadoop通常有較高的延遲并且在作業(yè)提交和調(diào)度的時候需要大量的開銷D)Hive查詢操作過程嚴(yán)格遵循HadoopMapReduce的作用執(zhí)行模型,Hive將用戶的HiveQL語句通過解釋器轉(zhuǎn)換為MapReduceHadoop集群上答案:B解析:[單選題]20.下列哪些選項不是HBase為nul1的列不占用存儲空間的原因?A)Region分裂B)列存儲C)行存儲D)Key-Value結(jié)構(gòu)答案:D解析:[單選題]21.以下關(guān)于關(guān)聯(lián)分析的敘述,錯誤的是:A)關(guān)聯(lián)規(guī)則的強度可以用它的支持度和置信度度量B)Apriori算法是第一個關(guān)聯(lián)規(guī)則挖掘算法C)關(guān)聯(lián)規(guī)則是形如X->Y的蘊含表達(dá)式,其中X和Y是不相交的項集D)Apriori算法使用了基于置信度的剪枝技術(shù)答案:D解析:[單選題]22.下列不屬于聚類性能度量外部指標(biāo)的是(__)。A)Jaccard系數(shù)B)FM系數(shù)C)Rand指數(shù)D)DB指數(shù)答案:D解析:[單選題]23.下列不屬于大數(shù)據(jù)在社會活動中的典型應(yīng)用的是()。A)美團(tuán)實現(xiàn)了快速精準(zhǔn)的送餐服務(wù)B)共享單車、滴滴打車方便了人們的日常出行C)快遞實現(xiàn)了訂單的實時跟蹤D)供電公司提供電費賬單查詢答案:D解析:電費賬單查詢屬于簡單報表查詢,用電情況分析、竊電行為分析、基于交易大數(shù)據(jù)分析用戶的購買習(xí)慣、基于傳感器感知的海量數(shù)據(jù)分析自然災(zāi)害的危害程度、基于搜索引擎的搜索關(guān)鍵詞分析社會熱點等屬于大數(shù)據(jù)應(yīng)用。[單選題]24.以下哪一個不是長短時記憶神經(jīng)網(wǎng)絡(luò)三個門中中的一個門?()A)輸入門B)輸出門C)遺忘門D)進(jìn)化門答案:D解析:[單選題]25.下面關(guān)于對Zookeeper的stat命令描述正確的是()。A)輸出服務(wù)器的統(tǒng)計信息B)重置服務(wù)器的統(tǒng)計信息C)輸出服務(wù)器的配置信息D)輸出服務(wù)器的統(tǒng)計信息和已連接的客戶端答案:D解析:[單選題]26.以下不屬于馬爾可夫隨機場模型與條件隨機場模型的差別的是()。A)馬爾可夫隨機場與條件隨機場都是無向圖模型B)馬爾可夫隨機場是生成式模型,條件隨機場是判別式模型C)馬爾可夫隨機場處理條件概率,條件隨機場處理聯(lián)合概率D)馬爾可夫隨機場處理聯(lián)合概率,條件隨機場處理條件概率答案:C解析:[單選題]27.在數(shù)據(jù)庫建模的過程中,E-R圖屬于()的產(chǎn)物。--A)物理模型B)邏輯模型C)概念模型D)以上答案都不正確答案:C解析:[單選題]28.設(shè)計坐出租車收費程序,3公里內(nèi)按10元收取,超3公里不超10公里按每公里1.5元收取,超過10公里按每公里1.3元收取,請問根據(jù)以上情況用什么語句合適A)ifB)if…elif…elseC)whileD)以上都不對答案:B解析:[單選題]29.業(yè)務(wù)系統(tǒng)功能設(shè)計需嚴(yán)格執(zhí)行公司信息化和數(shù)據(jù)資產(chǎn)標(biāo)準(zhǔn),數(shù)據(jù)應(yīng)按()準(zhǔn)確錄入和采集,關(guān)鍵數(shù)據(jù)應(yīng)進(jìn)行初審和復(fù)核,保證數(shù)據(jù)真實,避免數(shù)據(jù)缺失A)規(guī)定的時間、頻度B)數(shù)據(jù)類型C)數(shù)據(jù)大小D)數(shù)據(jù)重要性答案:A解析:[單選題]30.在抽樣方法中,當(dāng)合適的樣本容量很難確定時,可以使用的抽樣方法是()。A)有放回的簡單隨機抽樣B)無放回的簡單隨機抽樣C)分層抽樣D)漸進(jìn)抽樣答案:D解析:略。[單選題]31.本行()負(fù)責(zé)牽頭開展數(shù)據(jù)治理風(fēng)險管理工作,規(guī)范數(shù)據(jù)風(fēng)險管理A)風(fēng)險管理部B)內(nèi)審監(jiān)督部C)科技部D)數(shù)據(jù)運管部答案:A解析:[單選題]32.ADS一個普通表組最多可以包含:()個表。A)256個B)1000個C)無限制D)128個答案:A解析:[單選題]33.大型會員制連鎖超市S使用OTS來存儲消費記錄表,里面包含了客戶的vip卡號、訂單標(biāo)識,超市分店標(biāo)識,商品標(biāo)識,購買時間等,業(yè)務(wù)邏輯遵循以下規(guī)則:每個vip卡號對應(yīng)一個客戶,同時一個客戶職能擁有一個vip卡號;該連鎖超市的不同分店都擁有唯一的分店標(biāo)識;訂單標(biāo)識按照時間順序產(chǎn)生;為了讓數(shù)據(jù)分布和訪問了的分布盡可能均勻,一下備注主鍵中()最合適。A)購買時間,vip卡號B)vip卡號,購買時間C)vip卡號D)訂單標(biāo)識,vip卡號答案:B解析:[單選題]34.關(guān)系數(shù)據(jù)庫中存儲、計算和管理的數(shù)據(jù)是()。A)結(jié)構(gòu)化數(shù)據(jù)B)海量數(shù)據(jù)C)半結(jié)構(gòu)化數(shù)據(jù)D)非結(jié)構(gòu)化數(shù)據(jù)答案:A解析:通常,結(jié)構(gòu)化數(shù)據(jù)是指直接可以用傳統(tǒng)關(guān)系數(shù)據(jù)庫存儲、計算和管理的數(shù)據(jù)。A)辛普森悖論B)大數(shù)據(jù)悖論C)大數(shù)據(jù)偏見D)幸存者偏差正確答案A辛普森悖論是概率和統(tǒng)計學(xué)中的一種現(xiàn)象,即幾組不同的數(shù)據(jù)中均存在一種趨勢,41但當(dāng)這些數(shù)據(jù)組組合在一起后,這種趨勢將消失或反轉(zhuǎn)。例如,在腎結(jié)石治療數(shù)據(jù)分析中,比較兩種腎結(jié)石治療的成功率。[單選題]35.MapJoin適用于()的連接情況。A)有一份數(shù)據(jù)比較小B)兩份數(shù)據(jù)都比較小C)兩份數(shù)據(jù)都比較大D)沒有嚴(yán)格的規(guī)定答案:A解析:[單選題]36.RDD操作包括轉(zhuǎn)換(Transformation)和動作(Action)兩種類型,下列RDD操作屬于動作(Action)類型的是()。A)joinB)mapC)collectD)groupBy答案:C解析:[單選題]37.以下關(guān)于Python的控制結(jié)構(gòu),錯誤的是:A)每個if條件后要使用冒號(:)B)在Python中,沒有switch-case語句C)Python中的pass是空語句,一般用作占位語句D)elif可以單獨使用答案:D解析:[單選題]38.構(gòu)造方法的作用是()。A)一般成員方法B)類的初始化C)對象的初始化D)對象的建立答案:C解析:構(gòu)造方法的作用初始化對象。[單選題]39.BP神經(jīng)網(wǎng)絡(luò)經(jīng)常遭遇(),其訓(xùn)練誤差持續(xù)降低,但測試誤差卻可能上升A)欠擬合B)誤差過大C)誤差過小D)過擬合答案:D解析:[單選題]40.下列說法錯誤的是()A)MapReduce中maperconbinerreducer缺一不可B)在JobConf中InputFormat參數(shù)可以不設(shè)C)在JobConf中MapperClass參數(shù)可以不設(shè)D)在JobConf中OutputKeyComparator參數(shù)可以不設(shè)答案:A解析:有可能缺少combiner,例如如果在wordcount中不用combiner,那么所有的結(jié)果都是reduce完成,也只是效率會相對低下/2015/12/19/hadoop-MapReduce-Combiner/[單選題]41.下列Python文件模式中,(___)表示創(chuàng)建一個新文件。如果文件已經(jīng)存在,則操作失敗。A)?r?B)?W?C)?x?D)?+?答案:C解析:[單選題]42.下面符合數(shù)據(jù)產(chǎn)品鏈的有(__):1.數(shù)據(jù),2.元數(shù)據(jù),3.數(shù)據(jù)對象,4.輔助服務(wù),5.集成應(yīng)用,6.軟件系統(tǒng),7.增值服務(wù),8.基礎(chǔ)設(shè)施,9.硬件系統(tǒng)A)23657B)234C)135D)238497答案:A解析:[單選題]43.()能反映出X和Y之間的強相關(guān)性。A)相關(guān)系數(shù)為0.9B)對于無效假設(shè),β=0的p值為0.0001C)對于無效假設(shè),β=0的t值為30D)以上說法都不對答案:A解析:相關(guān)系數(shù)反映了不同變量之間線性相關(guān)程度,取值范圍為[-1,1],值越大表示相關(guān)程度越高。因此,A選項中r=0.9,表示X和Y之間有較強的相關(guān)性。p和t的數(shù)值大小沒有統(tǒng)計意義,只是將其與某一個閾值進(jìn)行比對,以得到二選一的結(jié)論。[單選題]44.下列有關(guān)數(shù)據(jù)基本單位換算錯誤的是()A)1Byte=8bitB)1KB=1024BytesC)1MB=1024GBD)1GB=1024MB答案:C解析:[單選題]45.下列方法中,可以將元組轉(zhuǎn)換為MultiIndex對象的是()A)from_tuples()B)from_arrays()C)from_product()D)from_list()答案:A解析:[單選題]46.在Shuffle的整個處理過程中,一部分處理過程是在Map端,另一部分的處理過程是在()端。A)CombinerB)PartitionC)ReduceD)Split答案:C解析:[單選題]47.執(zhí)行以下代碼段classGraph():def__init__(self):self.a=10defaction(self):self.a//=4classMyGraph(Graph):def__init__(self):self.a=8self.b=4defaction(self):self.a+=7*2self.b//=2classLastGraph(MyGraph):passg2=LastGraph()g2.action()print(g2.a)時,輸出為()。A)22B)84C)16D)34答案:A解析:[單選題]48.在MapReduce中,下列組件中用戶不指定也不會有默認(rèn)的是()。A)CombinerB)OutputFormatC)PartitionerD)InputFormat答案:A解析:在MapReduce編程模型中,Combiner是可有可無的組件,它的作用是給MapTask的結(jié)果數(shù)據(jù)做局部合并以減少ReduceTask接收的數(shù)據(jù)量,以減少網(wǎng)絡(luò)數(shù)據(jù)傳輸;OutputFormat的默認(rèn)組件是TextOutputFormat;InputFormat的默認(rèn)組件是TextInputFormat;Partitioner的默認(rèn)實現(xiàn)是HashPartitioner。[單選題]49.在使用Formatdate轉(zhuǎn)換器對于日期2020-9-28的最佳格式是()A)yymmddB)yyyymmddC)yyyy-MM-ddD)yyyy-mm-dd答案:C解析:[單選題]50.人工智能是一門()A)數(shù)學(xué)與生理學(xué)B)心理學(xué)與生理學(xué)C)語言學(xué)D)綜合性的交叉學(xué)科與邊緣學(xué)科答案:D解析:[單選題]51.以下符合大數(shù)據(jù)問題處理范疇的是:()。A)1KB數(shù)據(jù),1小時內(nèi)提交結(jié)果B)1MB數(shù)據(jù),2小時內(nèi)提交結(jié)果C)1GB數(shù)據(jù),3小時內(nèi)提交結(jié)果D)1TB數(shù)據(jù),0.5小時內(nèi)提交結(jié)果答案:D解析:[單選題]52.下面組件哪個是負(fù)責(zé)分布式資源調(diào)度與管理的:()A)YARNB)FlumeC)ZookeeperD)Kafka答案:A解析:[單選題]53.當(dāng)數(shù)據(jù)出現(xiàn)較多缺失值時,下面哪些處理方法不不夠合理?A)把NaN直接作為一個特征,把變量映射到高維空間B)用均值、中值、分位數(shù)、眾數(shù)、隨機值填充C)用插值法填充D)把具有缺失值的樣本刪除掉答案:D解析:[單選題]54.下列關(guān)于氣泡圖的說法中,錯誤的是()A)氣泡圖中氣泡的顏色是系統(tǒng)統(tǒng)一設(shè)置的,無法人為調(diào)整B)氣泡大小的不同意味著所代表的的數(shù)值的不同C)氣泡圖中的圖形形狀不一定是圓形D)可以為每個氣泡打上標(biāo)簽使其展示的數(shù)值更加直觀化答案:A解析:第2部分:多項選擇題,共23題,每題至少兩個正確答案,多選或少選均不得分。[多選題]55.行存表相比于列存表的區(qū)別是(?A)同樣的教據(jù),采用行存表存儲比列存儲所耗的時間更少。B)行存表適合數(shù)據(jù)更新,列存表適合做數(shù)據(jù)聚合。C)行存表面向百萬級以下數(shù)據(jù)量,列存表面向千萬級以上數(shù)據(jù)量D)行存表按行存儲數(shù)據(jù),列存表按列存儲教據(jù)答案:ABD解析:[多選題]56.強化學(xué)習(xí)中的?策略?就相當(dāng)于監(jiān)督學(xué)習(xí)中(__)或(__)。A)分類器B)決策樹C)隨機森林D)回歸器答案:AD解析:[多選題]57.HBase中HMaster主要負(fù)責(zé)()。A)表的增冊刪改查B)Regionservert負(fù)載均衡C)用戶數(shù)據(jù)讀寫回D)Region分布調(diào)整答案:ABD解析:[多選題]58.以下哪些是Spark服務(wù)的常駐進(jìn)程A)JobHistoryB)JDBCServerC)SparkResourceD)NodeManger答案:AB解析:[多選題]59.以下哪些選項屬于集群資源規(guī)劃設(shè)計?A)數(shù)據(jù)質(zhì)量B)數(shù)據(jù)總規(guī)模C)容量預(yù)留D)單條數(shù)據(jù)大小答案:BC解析:[多選題]60.ADS創(chuàng)建普通表的時候限制有:()。A)一張普通表至少有一級Hash分區(qū)并且分區(qū)數(shù)不能小于8個B)一個普通表組最多可以創(chuàng)建256個普通表C)一個普通表最多不能超過1024列D)一張普通表至少有一級Hash分區(qū)并且分區(qū)數(shù)不能多于1000個答案:ABC解析:[多選題]61.下列關(guān)于字典的遍歷的描述正確的有()。A)forin變量i,字典:使用i遍歷所有的鍵,有鍵就可以通過變量訪問其值B)for變量iin字典:使用i遍歷所有的鍵,有鍵就可以通過變量訪問其值C)for變量i,變量jin字典items):使用變量i遍歷所有鍵,通過變量j遍歷所有值D)forin變量i,變量j字典items):使用變量i遍歷所有鍵,通過變量j遍歷所有值答案:BC解析:item默認(rèn)迭代所有字典的鍵值。[多選題]62.所謂的大數(shù)據(jù)技術(shù)融合主要指哪些方面?A)數(shù)據(jù)融合B)算力融合C)計算融合D)批-流融合答案:ABCD解析:[多選題]63.ZKFC進(jìn)程部署在hdfs中的以下那個節(jié)點上?A)activenamenodeB)standbynamenodeC)datanodeD)以上全部不對答案:AB解析:[多選題]64.關(guān)于SparkSQL&Hive區(qū)別與聯(lián)系,下列說法正確的是?A)SparkSQL依賴Hive的元數(shù)據(jù)B)SparkSQL的執(zhí)行引擎為Sparkcore,Hive默認(rèn)執(zhí)行引擎為MapReduceC)SparkSQL不可以使用Hive的自定義函數(shù)D)SparkSQL兼容絕大部分Hive的語法和函數(shù)答案:BCD解析:[多選題]65.以下可以作為數(shù)據(jù)倉庫業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)來源的選項有()【選三項】A)Oracle、MySQL和SQLServer等關(guān)系數(shù)據(jù)庫里的結(jié)果化數(shù)據(jù)B)視頻、音頻文件C)HTML、XML等自描敘的半結(jié)構(gòu)化數(shù)據(jù)D)Word或Excel文檔中的非結(jié)構(gòu)化數(shù)據(jù)答案:ACD解析:[多選題]66.下列屬于樸素貝葉斯分類器的特點的是(__)。A)算法邏輯簡單,易于實現(xiàn)B)算法邏輯復(fù)雜,不易于實現(xiàn)C)分類過程中時空開銷小D)分類過程中時空開銷大答案:AC解析:[多選題]67.下列屬于數(shù)值優(yōu)化算法的是()。A)梯度下降法B)牛頓法C)極大似然法D)邏輯回歸答案:AB解析:在機器學(xué)習(xí)的優(yōu)化問題中,梯度下降法和牛頓法是常用的兩種凸函數(shù)求極值的方法,他們都是為了求得目標(biāo)函數(shù)的近似解。極大似然法是一種應(yīng)用非常廣泛的參數(shù)估計方法。邏輯回歸是一種廣義的線性回歸分析模型,常用于分類問題。[多選題]68.以下關(guān)于Fink的窗口描述正確的是()。A)會話窗口是將數(shù)據(jù)聚合到會話窗口中,由非活躍的間隙分隔開。B)我們可以每30秒計算一次最近一分鐘用戶購買的商品總數(shù),這個就是時間滑動窗口的應(yīng)用方式C)窗口可以是時間驅(qū)動的也可以是數(shù)據(jù)驅(qū)動的。D)Flink窗口按窗口行為劃分:TumblingWindow.SlidingWindow.SessionWindow。答案:ABCD解析:[多選題]69.常用的代價函數(shù)有()。A)均方誤差B)均方根誤差C)平均絕對誤差D)交叉熵答案:ABCD解析:[多選題]70.關(guān)于關(guān)聯(lián)分析說法正確的是()A)支持度表示A和B同時出現(xiàn)的概率占A出現(xiàn)概率的比值B)置信度表示A和B同時出現(xiàn)的概率C)Apriori算法是種挖掘關(guān)聯(lián)規(guī)則的頻繁項集算法D)該算法的基本思想是:首先找出所有的頻集,這些項集出現(xiàn)的頻繁性至少和預(yù)定義的最小支持度一樣。答案:CD解析:[多選題]71.ApacheFlume主要解決的是日志數(shù)據(jù)的收集和處理問題,Flume的主要設(shè)計目的和特征是()。A)高可靠性B)可擴(kuò)展性C)管理復(fù)雜D)不支持用戶自定義答案:AB解析:Flume的主要設(shè)計目的和特征包括高可靠性、可擴(kuò)展性、支持方便管理、支持用戶自定義。[多選題]72.某池塘有1400條鯉魚,300只蝦,300只鱉?,F(xiàn)在以捕鯉魚為目的。撒一大網(wǎng),逮著了700條鯉魚,200只蝦,100只鱉。那么,下列指標(biāo)正確的是(___)。A)F值40%B)查全率50%C)查準(zhǔn)率70%D)F值65%答案:BC解析:[多選題]73.Spark中的Scheduler模塊可以分為以下哪幾個部分?A)DAGSchedulerB)ResourceSchedulerC)TaskSchedulerD)JobScheduler答案:AC解析:[多選題]74.下面與數(shù)據(jù)科學(xué)相關(guān)的正確描述有(__)。A)數(shù)據(jù)科學(xué)中的?數(shù)據(jù)?并不僅僅是?數(shù)值?也不等同?數(shù)值?B)數(shù)據(jù)科學(xué)中?計算?包括查詢、洞見、可視化等C)數(shù)據(jù)科學(xué)關(guān)注的是?單一學(xué)科?D)數(shù)據(jù)科學(xué)并不僅僅是?理論研究?也不是?領(lǐng)域務(wù)實知識?答案:ABD解析:[多選題]75.下列屬于聚類性能度量內(nèi)部指標(biāo)的是(__)。A)DB指數(shù)B)Dunn指數(shù)C)Jaccard系數(shù)D)FM系數(shù)答案:AB解析:[多選題]76.電信大數(shù)據(jù)PaaS平臺產(chǎn)品基本包包含以下哪幾類服務(wù):()A)數(shù)據(jù)存儲服務(wù)B)離線分析服務(wù)C)應(yīng)用開發(fā)環(huán)境及框架服務(wù)D)數(shù)據(jù)挖掘服務(wù)、MPPDB服務(wù)答案:ABC解析:[多選題]77.下列關(guān)于范數(shù)規(guī)則化的描述正確的有()。A)L0是指向量中0的元素的個數(shù)B)L1范數(shù)是指向量中各個元素絕對值之和C)L2范數(shù)向量元素絕對值的平方和再開平方D)L0是指向量中非0的元素的個數(shù)153答案:BCD解析:L0是指向量中非0的元素的個數(shù),L1范數(shù)是指向量中各個元素絕對值之和,L2范數(shù)向量元素絕對值的平方和再開平方。第3部分:判斷題,共16題,請判斷題目是否正確。[判斷題]78.在HBase表中,通過行、列族和列限定符確定一個單元格(cell),且表中存儲的數(shù)據(jù)需要嚴(yán)格定義好數(shù)據(jù)類型,比如Name列需定義為string類型,且定義之后就不能修改。A)正確B)錯誤答案:錯解析:[判斷題]79.Set集合中的元素不能重復(fù)。A)正確B)錯誤答案:對解析:[判斷題]80.在連接云數(shù)據(jù)時,無需輸入文件路徑,即可連接并抽取數(shù)據(jù)。A)正確B)錯誤答案:錯解析:[判斷題]81.對于生成器對象x=(3foriinrange(5)),連續(xù)兩次執(zhí)行l(wèi)ist(x)的結(jié)果是一樣的。A)正確B)錯誤答案:錯解析:[判斷題]82.華為云GES圖搜索引擎服務(wù)可以為知識圖譜技術(shù)提供數(shù)據(jù)存儲和查詢功能。A)正確B)錯誤答案:對解析:[判斷題]83.Python通過類可以創(chuàng)建對象,有且只有一個對象。()A)正確B)錯誤答案:錯解析:[判斷題]84.()所創(chuàng)建的數(shù)據(jù)庫和表的名字,都可以使用中文。A)正確B)錯誤答案:對解析:[判斷題]85.Hive構(gòu)建數(shù)據(jù)倉庫時通常需要進(jìn)行分層。A)正確B)錯誤答案:對解析:[判斷題]86.本行數(shù)據(jù)質(zhì)量管理的目標(biāo)是提升數(shù)據(jù)質(zhì)量,發(fā)揮數(shù)據(jù)應(yīng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論