北方民族大學《大數(shù)據(jù)管理實驗》2022-2023學年期末試卷_第1頁
北方民族大學《大數(shù)據(jù)管理實驗》2022-2023學年期末試卷_第2頁
北方民族大學《大數(shù)據(jù)管理實驗》2022-2023學年期末試卷_第3頁
北方民族大學《大數(shù)據(jù)管理實驗》2022-2023學年期末試卷_第4頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

裝訂線裝訂線PAGE2第1頁,共3頁北方民族大學《大數(shù)據(jù)管理實驗》

2022-2023學年期末試卷院(系)_______班級_______學號_______姓名_______題號一二三總分得分一、單選題(本大題共20個小題,每小題2分,共40分.在每小題給出的四個選項中,只有一項是符合題目要求的.)1、大數(shù)據(jù)中的數(shù)據(jù)歸檔的目的是?()A.節(jié)省存儲空間B.提高查詢效率C.增加數(shù)據(jù)安全性D.以上都是2、大數(shù)據(jù)處理的流程不包括以下哪個步驟?()A.數(shù)據(jù)采集B.數(shù)據(jù)存儲C.數(shù)據(jù)銷毀D.數(shù)據(jù)分析3、以下哪項不是大數(shù)據(jù)的特點?()A.數(shù)據(jù)量大B.數(shù)據(jù)類型多樣C.數(shù)據(jù)價值密度高D.處理速度快4、以下哪種技術(shù)用于大數(shù)據(jù)的實時處理?()A.StormB.HiveC.PigD.Sqoop5、大數(shù)據(jù)中的數(shù)據(jù)質(zhì)量評估指標不包括()A.準確性B.完整性C.一致性D.美觀性6、在大數(shù)據(jù)處理中,MapReduce是一種什么框架?()A.分布式計算框架B.數(shù)據(jù)存儲框架C.數(shù)據(jù)分析框架D.數(shù)據(jù)可視化框架7、在大數(shù)據(jù)中,數(shù)據(jù)采樣的目的是()A.減少數(shù)據(jù)量B.提高數(shù)據(jù)處理速度C.保證數(shù)據(jù)準確性D.以上都是8、以下哪種技術(shù)用于大數(shù)據(jù)的搜索?()A.ElasticsearchB.SolrC.LuceneD.以上都是9、Hadoop生態(tài)系統(tǒng)中的哪個組件用于資源管理?()A.YARNB.MapReduceC.HDFSD.HBase10、Hadoop生態(tài)系統(tǒng)中的哪個組件用于協(xié)調(diào)分布式應用?()A.ZooKeeperB.YARNC.HBaseD.Hive11、在大數(shù)據(jù)中,數(shù)據(jù)清洗的主要目的是什么?()A.提高數(shù)據(jù)質(zhì)量B.減少數(shù)據(jù)量C.改變數(shù)據(jù)格式D.增加數(shù)據(jù)復雜性12、大數(shù)據(jù)的來源不包括()A.傳感器B.社交網(wǎng)絡C.個人電腦D.紙質(zhì)文件13、以下哪個不是大數(shù)據(jù)中的數(shù)據(jù)質(zhì)量問題?()A.缺失值B.重復值C.錯誤值D.小數(shù)據(jù)量14、大數(shù)據(jù)中的數(shù)據(jù)融合方法不包括?()A.基于規(guī)則的融合B.基于機器學習的融合C.隨機融合D.基于本體的融合15、以下哪種語言常用于大數(shù)據(jù)處理?()A.CB.JavaC.PythonD.Fortran16、大數(shù)據(jù)中的數(shù)據(jù)預處理步驟不包括?()A.數(shù)據(jù)清洗B.數(shù)據(jù)轉(zhuǎn)換C.數(shù)據(jù)壓縮D.數(shù)據(jù)刪除17、在大數(shù)據(jù)中,數(shù)據(jù)備份的策略不包括?()A.全量備份B.增量備份C.差異備份D.隨機備份18、大數(shù)據(jù)中的數(shù)據(jù)隱私保護方法不包括()A.數(shù)據(jù)加密B.匿名化C.公開所有數(shù)據(jù)D.差分隱私19、在大數(shù)據(jù)中,數(shù)據(jù)倉庫和數(shù)據(jù)集市的區(qū)別是?()A.數(shù)據(jù)量大小B.數(shù)據(jù)粒度C.數(shù)據(jù)來源D.以上都是20、以下哪個不是大數(shù)據(jù)可視化的工具?()A.TableauB.ExcelC.PowerBID.Photoshop二、簡答題(本大題共4個小題,共40分)1、(本題10分)簡述大數(shù)據(jù)在游戲用戶體驗優(yōu)化中的方法。2、(本題10分)簡述Spark相對于Hadoop的優(yōu)勢。3、(本題10分)說明數(shù)據(jù)采集在大數(shù)據(jù)處理中的方法和技術(shù)。4、(本題10分)簡述大數(shù)據(jù)在電商領(lǐng)域的精準推薦原理。三、綜合分析題(本大題共2個小題,共20分)1、(本題10分)對一家制造業(yè)企業(yè)的質(zhì)量檢驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論