2024年秋江蘇開放大學(xué)大數(shù)據(jù)庫管理過程性考核作業(yè)1-3

上傳人：??*** IP屬地：重慶上傳時(shí)間：2024-12-02 格式：DOCX 頁數(shù)：24 大小：34.81KB 積分：80 舉報(bào) 版權(quán)申訴

2024年秋江蘇開放大學(xué)大數(shù)據(jù)庫管理過程性考核作業(yè)1-3_第2頁

2024年秋江蘇開放大學(xué)大數(shù)據(jù)庫管理過程性考核作業(yè)1-3_第3頁

2024年秋江蘇開放大學(xué)大數(shù)據(jù)庫管理過程性考核作業(yè)1-3_第4頁

2024年秋江蘇開放大學(xué)大數(shù)據(jù)庫管理過程性考核作業(yè)1-3_第5頁

已閱讀5頁，還剩19頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2024年秋江蘇開放大學(xué)大數(shù)據(jù)庫管理060602第一次過程性考核作業(yè)（1~3單元）單選題1、Hadoop框架中最核心的設(shè)計(jì)是什么？A、為海量數(shù)據(jù)提供存儲(chǔ)的HDFS和對(duì)數(shù)據(jù)進(jìn)行計(jì)算的MapReduceB、Hadoop被視為事實(shí)上的大數(shù)據(jù)處理標(biāo)準(zhǔn)C、Hadoop不僅可以運(yùn)行在企業(yè)內(nèi)部的集群中，也可以運(yùn)行在云計(jì)算環(huán)境中D提供整個(gè)HDFS文件系統(tǒng)的NameSpace(命名空間)管理、塊管理等所有服務(wù)學(xué)生答案：A2下面對(duì)SecondaryNameNode第二名稱節(jié)點(diǎn)的描述，哪個(gè)是錯(cuò)誤的？A、SecondaryNameNode一般是并行運(yùn)行在多臺(tái)機(jī)器上B、SecondaryNameNode是HDFS架構(gòu)中的一個(gè)組成部分C、SecondaryNameNode用來保存名稱節(jié)點(diǎn)中對(duì)HDFS元數(shù)據(jù)信息的備份D、SecondaryNameNode通過HTTPGET方式從NameNode上獲取到FsImage和EditLog文件，并下載到本地的相應(yīng)目錄下學(xué)生答案：A3在一個(gè)基本的Hadoop集群中，DataNode主要負(fù)責(zé)什么？A負(fù)責(zé)協(xié)調(diào)集群中的數(shù)據(jù)存儲(chǔ)B存儲(chǔ)被拆分的數(shù)據(jù)塊C負(fù)責(zé)執(zhí)行由JobTracker指派的任務(wù)D協(xié)調(diào)數(shù)據(jù)計(jì)算任務(wù)學(xué)生答案：B4在HDFS中，NameNode的主要功能是什么？A維護(hù)blockid到DataNode本地文件的映射關(guān)系B存儲(chǔ)元數(shù)據(jù)C文件內(nèi)容保存在磁盤中D存儲(chǔ)文件內(nèi)容學(xué)生答案：B5下列哪一項(xiàng)不屬于HDFS采用抽象的塊概念帶來的好處？A強(qiáng)大的跨平臺(tái)兼容性B適合數(shù)據(jù)備份C簡(jiǎn)化系統(tǒng)設(shè)計(jì)D支持大規(guī)模文件存儲(chǔ)學(xué)生答案：A6在Hadoop項(xiàng)目結(jié)構(gòu)中，MapReduce指的是什么？A、Hadoop上的工作流管理系統(tǒng)B分布式并行編程模型C流計(jì)算框架D提供分布式協(xié)調(diào)一致性服務(wù)學(xué)生答案：B7第一次信息化浪潮主要解決什么問題？A信息轉(zhuǎn)換B信息處理C信息爆炸D信息傳輸學(xué)生答案：B8下面對(duì)FsImage的描述，哪個(gè)是正確的？A、FsImage記錄了每個(gè)塊具體被存儲(chǔ)在哪個(gè)數(shù)據(jù)節(jié)點(diǎn)B、FsImage用于維護(hù)文件系統(tǒng)樹以及文件樹中所有的文件和文件夾的元數(shù)據(jù)C、FsImage用于存儲(chǔ)文件內(nèi)容D、FsImage記錄了所有針對(duì)文件的創(chuàng)建、刪除、重命名等操作學(xué)生答案：B9下列哪一個(gè)不屬于Hadoop的大數(shù)據(jù)層的功能？A實(shí)時(shí)計(jì)算B數(shù)據(jù)挖掘C離線分析DBI分析學(xué)生答案：A10下列哪個(gè)不屬于Hadoop的特性？A成本高B運(yùn)行在Linux平臺(tái)上C高可靠性D高容錯(cuò)性學(xué)生答案：A11在Hadoop項(xiàng)目結(jié)構(gòu)中，HDFS指的是什么？A資源管理和調(diào)度器B、Hadoop上的數(shù)據(jù)倉庫C分布式文件系統(tǒng)D分布式并行編程模型學(xué)生答案：C12在大數(shù)據(jù)的計(jì)算模式中，流計(jì)算解決的是什么問題？A針對(duì)大規(guī)模圖結(jié)構(gòu)數(shù)據(jù)的處理B針對(duì)大規(guī)模數(shù)據(jù)的批量處理C針對(duì)流數(shù)據(jù)的實(shí)時(shí)計(jì)算D大規(guī)模數(shù)據(jù)的存儲(chǔ)管理和查詢分析學(xué)生答案：C13下面哪個(gè)不是Hadoop1.0的組件？A、NameNode和DataNodeB、YARNC、MapReduceD、HDFS學(xué)生答案：B14在Hadoop生態(tài)系統(tǒng)中，HBase指的是什么？A數(shù)據(jù)流處理環(huán)境B分布式數(shù)據(jù)庫C、Hadoop上的數(shù)據(jù)倉庫D分布式文件系統(tǒng)學(xué)生答案：B15下面哪個(gè)選項(xiàng)屬于大數(shù)據(jù)技術(shù)的“數(shù)據(jù)存儲(chǔ)和管理”技術(shù)層面的功能？A利用分布式并行編程模型和計(jì)算框架，結(jié)合機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法，實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的處理和分析B把實(shí)時(shí)采集的數(shù)據(jù)作為流計(jì)算系統(tǒng)的輸入，進(jìn)行實(shí)時(shí)處理分析C利用分布式文件系統(tǒng)、數(shù)據(jù)倉庫、關(guān)系數(shù)據(jù)庫等實(shí)現(xiàn)對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化海量數(shù)據(jù)的存儲(chǔ)和管理D構(gòu)建隱私數(shù)據(jù)保護(hù)體系和數(shù)據(jù)安全體系，有效保護(hù)個(gè)人隱私和數(shù)據(jù)安全學(xué)生答案：C判斷題1大數(shù)據(jù)的特點(diǎn)包括數(shù)據(jù)的“大量化”、快速化”、“多樣化”、“高價(jià)值”。A正確B錯(cuò)誤學(xué)生答案：B2、Hadoop可以部署在廉價(jià)的計(jì)算機(jī)集群中。A正確B錯(cuò)誤學(xué)生答案：A3、HDFS采用了分層模型。A正確B錯(cuò)誤學(xué)生答案：B4第三次信息化浪潮主要解決信息處理問題。A正確B錯(cuò)誤學(xué)生答案：B5在HDFS中，默認(rèn)一個(gè)塊的大小是64KB。A正確B錯(cuò)誤學(xué)生答案：B多選題1下面哪個(gè)屬于大數(shù)據(jù)的應(yīng)用領(lǐng)域？A實(shí)時(shí)掌握交通狀況B監(jiān)控身體情況C金融交易D智能醫(yī)療研發(fā)學(xué)生答案：A；B；C；D2、HDFS的應(yīng)用局限性，主要包括以下哪幾個(gè)方面？A不支持多用戶寫入及任意修改文件B較差的跨平臺(tái)兼容性C無法高效存儲(chǔ)大量小文件D不適合低延遲數(shù)據(jù)訪問學(xué)生答案：A；C；D3、Hadoop的特性包括哪些？A高可擴(kuò)展性B支持多種編程語言C運(yùn)行在Linux平臺(tái)上D高效性學(xué)生答案：A；B；C；D4、HDFS具有較高的容錯(cuò)性，設(shè)計(jì)了哪些相應(yīng)的機(jī)制檢測(cè)數(shù)據(jù)錯(cuò)誤和進(jìn)行自動(dòng)恢復(fù)？A數(shù)據(jù)出錯(cuò)B名稱節(jié)點(diǎn)出錯(cuò)C數(shù)據(jù)節(jié)點(diǎn)出錯(cuò)D數(shù)據(jù)源太大學(xué)生答案：A；B；C5下列關(guān)于Hadoop的描述，哪些是正確的？A曾經(jīng)被公認(rèn)為行業(yè)大數(shù)據(jù)標(biāo)準(zhǔn)開源軟件B具有很好的跨平臺(tái)特性C可以部署在廉價(jià)的計(jì)算機(jī)集群中D為用戶提供了系統(tǒng)底層細(xì)節(jié)透明的分布式基礎(chǔ)架構(gòu)學(xué)生答案：A；B；C；D6數(shù)據(jù)節(jié)點(diǎn)（DataNode）的主要功能包括哪些？A負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)和讀取B用來保存名稱節(jié)點(diǎn)中對(duì)HDFS元數(shù)據(jù)信息的備份，并減少名稱節(jié)點(diǎn)重啟的時(shí)間C根據(jù)客戶端或者是名稱節(jié)點(diǎn)的調(diào)度來進(jìn)行數(shù)據(jù)的存儲(chǔ)和檢索D向名稱節(jié)點(diǎn)定期發(fā)送自己所存儲(chǔ)的塊的列表學(xué)生答案：A；C；D7HDFS特殊的設(shè)計(jì)，在實(shí)現(xiàn)優(yōu)良特性的同時(shí)，也使得自身具有一些應(yīng)用局限性，主要包括以下哪幾個(gè)方面？A不支持多用戶寫入及任意修改文件B較差的跨平臺(tái)兼容性C不適合低延遲數(shù)據(jù)訪問D無法高效存儲(chǔ)大量小文件學(xué)生答案：A；C；D8Hadoop集群的整體性能主要受到什么因素影響？ACPU性能B內(nèi)存C網(wǎng)絡(luò)D存儲(chǔ)容量學(xué)生答案：A；B；C；D9、對(duì)于HDFS中的客戶端，下列描述哪些是正確的？A、HDFS客戶端是一個(gè)庫，暴露了HDFS文件系統(tǒng)接口B客戶端是用戶操作HDFS最常用的方式，HDFS在部署時(shí)都提供了客戶端C客戶端可以支持打開、讀取、寫入等常見的操作D嚴(yán)格來說，客戶端并不算是HDFS的一部分學(xué)生答案：A；B；C；D10、HDFS數(shù)據(jù)塊多副本存儲(chǔ)具備以下哪些優(yōu)點(diǎn)？A加快數(shù)據(jù)傳輸速度B適合多平臺(tái)上運(yùn)行C保證數(shù)據(jù)可靠性D容易檢查數(shù)據(jù)錯(cuò)誤學(xué)生答案：A；C；D簡(jiǎn)答題1請(qǐng)闡述大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)三者之間的關(guān)系。參考答案：從整體上看,大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)是相輔相成的。---(1分)(1)大數(shù)據(jù)根植于云計(jì)算,大數(shù)據(jù)分析的很多技術(shù)來之云計(jì)算,云計(jì)算的分布式數(shù)據(jù)存儲(chǔ)和管理系統(tǒng)、分布式并行處理框架MapReduce,都是大數(shù)據(jù)技術(shù)的基礎(chǔ),反之,大數(shù)據(jù)為云計(jì)算提供了“用武之地”......(2分)(2)物聯(lián)網(wǎng)是大數(shù)據(jù)的重要來源,大數(shù)據(jù)技術(shù)為物聯(lián)網(wǎng)數(shù)據(jù)分析提供支撐............(2分)(3)云計(jì)算為物聯(lián)網(wǎng)提供海量數(shù)據(jù)存儲(chǔ)能力,物聯(lián)網(wǎng)為云計(jì)算技術(shù)提供了廣闊的應(yīng)用空間。....(2分)

2024年秋江蘇開放大學(xué)大數(shù)據(jù)庫管理060602第二次過程性考核作業(yè)（4~6單元）單選題1下列關(guān)于NoSQL與關(guān)系數(shù)據(jù)庫的比較，哪個(gè)說法是錯(cuò)誤的？A在數(shù)據(jù)完整性方面，RDBMS容易實(shí)現(xiàn)B擴(kuò)展性方面，NoSQL比較好C在一致性方面，RDBMS強(qiáng)于NoSQLD在可用性方面，NoSQL優(yōu)于RDBMS學(xué)生答案：D2關(guān)于文檔數(shù)據(jù)庫的說法，下列哪一項(xiàng)是錯(cuò)誤的？A性能好（高并發(fā)）B缺乏統(tǒng)一的查詢語法C數(shù)據(jù)是規(guī)則的D復(fù)雜性低學(xué)生答案：C3下列哪一個(gè)不屬于云數(shù)據(jù)庫產(chǎn)品？A阿里云RDSB百度云數(shù)據(jù)庫C本地安裝MySQLD、OracleCloud學(xué)生答案：C4、HBase系統(tǒng)架構(gòu)中，主服務(wù)器Master主要負(fù)責(zé)表和Region的管理工作，下面有關(guān)描述哪個(gè)是錯(cuò)誤的？A管理用戶對(duì)表的增加、刪除、修改、查詢等操作B不支持不同Region服務(wù)器之間的負(fù)載均衡C對(duì)發(fā)生故障失效的Region服務(wù)器上的Region進(jìn)行遷移D在Region分裂或合并后，負(fù)責(zé)重新調(diào)整Region的分布學(xué)生答案：B5下面關(guān)于NoSQL和關(guān)系數(shù)據(jù)庫的簡(jiǎn)單比較，哪個(gè)是錯(cuò)誤的？A、RDBMS借助于索引機(jī)制可以實(shí)現(xiàn)快速查詢，很多NoSQL數(shù)據(jù)庫沒有面向復(fù)雜查詢的索引B、NoSQL很難實(shí)現(xiàn)橫向擴(kuò)展，RDBMS可以很容易通過添加更多設(shè)備來支持更大規(guī)模的數(shù)據(jù)C、RDBMS需要定義數(shù)據(jù)庫模式，嚴(yán)格遵守?cái)?shù)據(jù)定義，NoSQL一般不存在數(shù)據(jù)庫模式，可以自由靈活定義并存儲(chǔ)各種不同類型的數(shù)據(jù)D、RDBMS有關(guān)系代數(shù)理論作為基礎(chǔ)，NoSQL沒有統(tǒng)一的理論基礎(chǔ)學(xué)生答案：B6、UMP系統(tǒng)是構(gòu)建在一個(gè)大的集群之上的，下列哪一項(xiàng)不屬于系統(tǒng)向用戶提供的功能？A分庫分表B資源合并C讀寫分離D數(shù)據(jù)安全學(xué)生答案：B7、HBase只有一個(gè)針對(duì)行鍵的索引，如果要訪問HBase表中的行，下面哪種方式是不可行的？A通過一個(gè)行鍵的區(qū)間來訪問B通過單個(gè)行鍵訪問C通過時(shí)間戳訪問D全表掃描學(xué)生答案：C8下列關(guān)于鍵值數(shù)據(jù)庫的描述，哪一項(xiàng)是錯(cuò)誤的？A大量寫操作時(shí)性能高B條件查詢效率高C擴(kuò)展性好，靈活性好D無法存儲(chǔ)結(jié)構(gòu)化信息學(xué)生答案：B9、HBase中需要根據(jù)“四維坐標(biāo)”來確定一個(gè)單元格，下面哪個(gè)不屬于“四維坐標(biāo)”？A、時(shí)間戳B、行鍵C關(guān)鍵字D列族學(xué)生答案：C10下列關(guān)于云數(shù)據(jù)庫的描述，哪個(gè)是錯(cuò)誤的？A云數(shù)據(jù)庫是部署和虛擬化在云計(jì)算環(huán)境中的數(shù)據(jù)庫B云數(shù)據(jù)庫具有高可擴(kuò)展性、高可用性、采用多租形式和支持資源有效分發(fā)等特點(diǎn)C云數(shù)據(jù)庫是在云計(jì)算的大背景下發(fā)展起來的一種新興的共享基礎(chǔ)架構(gòu)的方法D云數(shù)據(jù)庫價(jià)格不菲，維護(hù)費(fèi)用極其昂貴學(xué)生答案：D11下列哪個(gè)不屬于NoSQL數(shù)據(jù)庫的特點(diǎn)？A靈活的數(shù)據(jù)模型B靈活的可擴(kuò)展性C數(shù)據(jù)存儲(chǔ)規(guī)模有限D(zhuǎn)與云計(jì)算緊密融合學(xué)生答案：C12下面關(guān)于HBase中Region的說法，哪個(gè)是錯(cuò)誤的？A同一個(gè)Region不會(huì)被分拆到多個(gè)Region服務(wù)器B為了加快訪問速度，.META.表的全部Region都會(huì)被保存在內(nèi)存中C為了加速尋址，客戶端會(huì)緩存位置信息D一個(gè)-ROOT-表可以有多個(gè)Region學(xué)生答案：D13下列哪一項(xiàng)不屬于NoSQL的四大類型？A圖數(shù)據(jù)庫B列族數(shù)據(jù)庫C時(shí)間戳數(shù)據(jù)庫D文檔數(shù)據(jù)庫學(xué)生答案：C14關(guān)于HBase的三層結(jié)構(gòu)中各層次的名稱和作用的說法，哪個(gè)是錯(cuò)誤的？A、.META.表保存了HBase中所有用戶數(shù)據(jù)表的Region位置信息B、-ROOT-表記錄了.META.表的Region位置信息C、Zookeeper文件記錄了-ROOT-表的位置信息D、Zookeeper文件記錄了用戶數(shù)據(jù)表的Region位置信息學(xué)生答案：D15下列關(guān)于列族數(shù)據(jù)庫的描述，哪一項(xiàng)是錯(cuò)誤的？A復(fù)雜性低B容易進(jìn)行分布式擴(kuò)展C功能較少，大都不支持強(qiáng)事務(wù)一致性D查找速度慢，可擴(kuò)展性差學(xué)生答案：D判斷題1、HBase是基于列存儲(chǔ)的，操作不存在復(fù)雜的表與表之間的關(guān)系，不支持修改操作。A正確B錯(cuò)誤學(xué)生答案：B2、Web2.0網(wǎng)站系統(tǒng)基本上不用關(guān)系數(shù)據(jù)庫來存儲(chǔ)數(shù)據(jù)。A正確B錯(cuò)誤學(xué)生答案：B3同一個(gè)公司只能提供采用單一數(shù)據(jù)模型的單個(gè)云數(shù)據(jù)庫服務(wù)。A正確B錯(cuò)誤學(xué)生答案：B4圖數(shù)據(jù)庫專門用于處理具有高度相互關(guān)聯(lián)關(guān)系的數(shù)據(jù)。A正確B錯(cuò)誤學(xué)生答案：A5在HBase訪問接口中，Pig適合用于并行批處理HBase表數(shù)據(jù)。A正確B錯(cuò)誤學(xué)生答案：B多選題1下列關(guān)于圖數(shù)據(jù)庫的描述，哪些是正確的？A靈活性高，支持復(fù)雜的圖算法B復(fù)雜性高，只能支持一定的數(shù)據(jù)規(guī)模C專門用于處理具有高度相互關(guān)聯(lián)關(guān)系的數(shù)據(jù)D比較適合于社交網(wǎng)絡(luò)、模式識(shí)別、依賴分析、推薦系統(tǒng)以及路徑尋找等問題學(xué)生答案：A；B；C；D2、HBase訪問接口類型包括哪些？A、ThriftGatewayB、NativeJavaAPIC、RESTGatewayD、HBaseShell學(xué)生答案：A；B；C；D3下列關(guān)于HBase中HLog工作原理的描述，哪些是正確的？A用戶更新數(shù)據(jù)必須首先寫入日志后，才能寫入MemStore緩存B系統(tǒng)出錯(cuò)時(shí)，HBase采用HLog保證系統(tǒng)恢復(fù)C、HBase系統(tǒng)為每個(gè)Region服務(wù)器配置了一個(gè)HLog文件D、當(dāng)某個(gè)Region服務(wù)器發(fā)生故障時(shí)，Master首先會(huì)處理該服務(wù)器上面遺留的HLog文件學(xué)生答案：A；B；C；D4下列關(guān)于MySQL集群的描述，哪些是正確的？A擴(kuò)容問題：如果系統(tǒng)壓力過大需要增加新的機(jī)器，這個(gè)過程涉及數(shù)據(jù)重新劃分B動(dòng)態(tài)數(shù)據(jù)遷移問題：如果某個(gè)數(shù)據(jù)庫組壓力過大，需要將其中部分?jǐn)?shù)據(jù)遷移出去C復(fù)雜性：部署、管理、配置很復(fù)雜D數(shù)據(jù)庫復(fù)制：MySQL主備之間一般采用復(fù)制方式，很多時(shí)候是異步復(fù)制學(xué)生答案：A；B；C；D5當(dāng)處理CAP的問題時(shí)，可以有哪幾個(gè)明顯的選擇？A、AP：也就是強(qiáng)調(diào)可用性（A）和分區(qū)容忍性（P），放棄一致性（C）B、CA：也就是強(qiáng)調(diào)一致性（C）和可用性（A），放棄分區(qū)容忍性（P）C、CAP：也就是同時(shí)兼顧可用性（A）、分區(qū)容忍性（P）和一致性（C）D、CP：也就是強(qiáng)調(diào)一致性（C）和分區(qū)容忍性（P），放棄可用性（A）學(xué)生答案：A；B；D6關(guān)系數(shù)據(jù)庫已經(jīng)無法滿足Web2.0的需求，主要表現(xiàn)在以下幾個(gè)方面？A無法滿足海量數(shù)據(jù)的管理需求B使用難度高C無法滿足高可擴(kuò)展性和高可用性的需求D無法滿足數(shù)據(jù)高并發(fā)的需求學(xué)生答案：A；C；D7為什么說云數(shù)據(jù)庫是個(gè)性化數(shù)據(jù)存儲(chǔ)需求的理想選擇？A云數(shù)據(jù)庫可以滿足大企業(yè)的海量數(shù)據(jù)存儲(chǔ)需求B前期零投入、后期免維護(hù)的數(shù)據(jù)庫服務(wù)，可以很好地滿足需求C云數(shù)據(jù)庫可以滿足中小企業(yè)的低成本數(shù)據(jù)存儲(chǔ)需求D云數(shù)據(jù)庫可以滿足企業(yè)動(dòng)態(tài)變化的數(shù)據(jù)存儲(chǔ)需求學(xué)生答案：A；B；C；D8下列關(guān)于云數(shù)據(jù)庫與其他數(shù)據(jù)庫的關(guān)系，哪些是正確的？A許多公司在開發(fā)云數(shù)據(jù)庫時(shí)，后端數(shù)據(jù)庫都是直接使用現(xiàn)有的各種關(guān)系數(shù)據(jù)庫或NoSQL數(shù)據(jù)庫產(chǎn)品B同一個(gè)公司只能提供采用不同數(shù)據(jù)模型的單個(gè)云數(shù)據(jù)庫服務(wù)C從數(shù)據(jù)模型的角度來說，云數(shù)據(jù)庫并非一種全新的數(shù)據(jù)庫技術(shù)D云數(shù)據(jù)庫并沒有專屬于自己的數(shù)據(jù)模型，云數(shù)據(jù)庫所采用的數(shù)據(jù)模型可以是關(guān)系數(shù)據(jù)庫所使用的關(guān)系模型學(xué)生答案：A；C；D9、HBase的三層結(jié)構(gòu)中，三層指的是哪三層？A、-ROOT-表B、.META.表C、數(shù)據(jù)類型D、Zookeeper文件學(xué)生答案：A；B；D10下列關(guān)于UMP系統(tǒng)架構(gòu)的描述，哪些是正確的？A、UMP系統(tǒng)借助于LVS來實(shí)現(xiàn)集群內(nèi)部的負(fù)載均衡B、信息統(tǒng)計(jì)服務(wù)器定期將采集到的用戶的連接數(shù)進(jìn)行統(tǒng)計(jì)C、LVS(LinuxVirtualServer)即Linux虛擬服務(wù)器D、Web控制臺(tái)無法向用戶提供系統(tǒng)管理界面學(xué)生答案：A；B；C簡(jiǎn)答題1.請(qǐng)描述作為NoSQL數(shù)據(jù)庫的基石之一的BASE的含義。參考答案：BASE的基本含義如下:（1）基本可用(BasicallyAvailble):是指一個(gè)分布式系統(tǒng)的一部分發(fā)生問題變得不可用時(shí),其他部分仍然可以正常使用,也就是允許分區(qū)失敗的情形出現(xiàn).。....................(2分)（2）軟狀態(tài)(Soft-state):是指與“硬狀態(tài)”相對(duì)應(yīng)的一種提法。數(shù)據(jù)庫保存的數(shù)據(jù)是“硬狀態(tài)”時(shí),可以保證數(shù)據(jù)一致性,即保證數(shù)據(jù)一直是正確的?！败洜顟B(tài)”是指狀態(tài)可以有一段時(shí)間不同步,具有一定的滯后性。.....................(2分)（3）最終一致性(Eventualconsistency):是指允許后續(xù)的訪問操作可以暫時(shí)讀不到更新后的數(shù)據(jù),但是經(jīng)過一段時(shí)間之后,必須最終讀到更新后的數(shù)據(jù),這也是ACID的最終目的,最終數(shù)據(jù)是一致的就可以了,而不是實(shí)時(shí)都保持一致。...............................(2分)

2024年秋江蘇開放大學(xué)大數(shù)據(jù)庫管理第三次過程性考核作業(yè)（7~10單元）單選題1、關(guān)于HDFSFederation的設(shè)計(jì)的描述，哪個(gè)是錯(cuò)誤的？A、HDFS的命名服務(wù)能夠水平擴(kuò)展B屬于不同命名空間的塊可以構(gòu)成同一個(gè)“塊池”C設(shè)計(jì)了多個(gè)相互獨(dú)立的名稱節(jié)點(diǎn)D、HDFSFederation中，所有名稱節(jié)點(diǎn)會(huì)共享底層的數(shù)據(jù)節(jié)點(diǎn)存儲(chǔ)資源，數(shù)據(jù)節(jié)點(diǎn)向所有名稱節(jié)點(diǎn)匯報(bào)學(xué)生答案：B2下列關(guān)于推薦系統(tǒng)的描述，有誤的是？A專家推薦：人工推薦，由資深的專業(yè)人士來進(jìn)行物品的篩選和推薦，需要較多的人力成本性B協(xié)同過濾推薦：應(yīng)用最早和最為成功的推薦方法之一C混合推薦：結(jié)合多種推薦算法來提升推薦效果D基于統(tǒng)計(jì)的推薦：通過機(jī)器學(xué)習(xí)的方法去描述內(nèi)容的特征，并基于內(nèi)容的特征來發(fā)現(xiàn)與之相似的內(nèi)容學(xué)生答案：D3下列哪個(gè)不屬于YARN體系結(jié)構(gòu)中ResourceManager的功能？A處理來自ApplicationMaster的命令B監(jiān)控NodeManagerC處理客戶端請(qǐng)求D資源分配與調(diào)度學(xué)生答案：A4下列說法哪項(xiàng)有誤？A、Spark可以部署在資源管理器YARN之上，提供一站式的大數(shù)據(jù)解決方案B、Hadoop的設(shè)計(jì)遵循“一個(gè)軟件棧滿足不同應(yīng)用場(chǎng)景”的理念C相對(duì)于Spark來說，使用Hadoop進(jìn)行迭代計(jì)算非常耗資源D、Spark將數(shù)據(jù)載入內(nèi)存后，之后的迭代計(jì)算都可以直接使用內(nèi)存中的中間結(jié)果作運(yùn)算，避免了從磁盤中頻繁讀取數(shù)據(jù)學(xué)生答案：B5下列關(guān)于Scala特性的描述，錯(cuò)誤的是哪一項(xiàng)？A、Scala是Spark的主要編程語言B、Scala兼容Java，運(yùn)行速度快，且能融合到Hadoop生態(tài)圈中C、Scala語法復(fù)雜，但是能提供優(yōu)雅的APID、Scala具備強(qiáng)大的并發(fā)性，支持函數(shù)式編程，可以更好地支持分布式系統(tǒng)學(xué)生答案：C6下列關(guān)于Spark中RDD的說法，描述有誤的是？A、RDD是可以直接修改的B、每個(gè)RDD可分成多個(gè)分區(qū)，每個(gè)分區(qū)就是一個(gè)數(shù)據(jù)集片段C、一個(gè)RDD就是一個(gè)分布式對(duì)象集合，本質(zhì)上是一個(gè)只讀的分區(qū)記錄集合D、RDD提供了一種高度受限的共享內(nèi)存模型學(xué)生答案：A7下列關(guān)于Map和Reduce函數(shù)的描述，哪個(gè)是錯(cuò)誤的？A、Map每一個(gè)輸入的<k1,v1>會(huì)輸出一批<k2,v2>，B、Reduce輸入的中間結(jié)果<k2,List(v2)>中的List(v2)表示是一批屬于不同k2的valueC、Reduce輸入的中間結(jié)果<k2,List(v2)>中的List(v2)表示是一批屬于同一個(gè)k2的valueD、Map將小數(shù)據(jù)集進(jìn)一步解析成一批<key,value>對(duì)，輸入Map函數(shù)中進(jìn)行處理學(xué)生答案：B8、MapReduce1.0的體系結(jié)構(gòu)中，JobTracker的主要任務(wù)是什么？A會(huì)周期性地通過“心跳”將本節(jié)點(diǎn)上資源的使用情況和任務(wù)的運(yùn)行進(jìn)度匯報(bào)給TaskTrackerB會(huì)跟蹤任務(wù)的執(zhí)行進(jìn)度、資源使用量等信息，并將這些信息告訴任務(wù)（Task）C使用“slot”等量劃分本節(jié)點(diǎn)上的資源量（CPU、內(nèi)存等）D負(fù)責(zé)資源監(jiān)控和作業(yè)調(diào)度，監(jiān)控所有TaskTracker與Job的健康狀況學(xué)生答案：D9下列關(guān)于推薦系統(tǒng)的描述，哪一項(xiàng)是錯(cuò)誤的？A推薦系統(tǒng)分為基于物品的協(xié)同過濾和基于商家的協(xié)同過濾B推薦系統(tǒng)可以創(chuàng)造全新的商業(yè)和經(jīng)濟(jì)模式，幫助實(shí)現(xiàn)長(zhǎng)尾商品的銷售C推薦系統(tǒng)是自動(dòng)聯(lián)系用戶和物品的一種工具D推薦系統(tǒng)是大數(shù)據(jù)在互聯(lián)網(wǎng)領(lǐng)域的典型應(yīng)用學(xué)生答案：A10下列傳統(tǒng)并行計(jì)算框架，說法錯(cuò)誤的是哪一項(xiàng)？A實(shí)時(shí)、細(xì)粒度計(jì)算、計(jì)算密集型B編程難度高C刀片服務(wù)器、高速網(wǎng)、SAN，價(jià)格貴，擴(kuò)展性差D共享式(共享內(nèi)存/共享存儲(chǔ))，容錯(cuò)性好學(xué)生答案：D11關(guān)于Spark運(yùn)行架構(gòu)，下列說法錯(cuò)誤的是？A一個(gè)Job包含多個(gè)RDD及作用于相應(yīng)RDD上的各種操作B、DAG反映RDD之間的依賴關(guān)系C、RDD是運(yùn)行在工作節(jié)點(diǎn)（WorkerNode）的一個(gè)進(jìn)程，負(fù)責(zé)運(yùn)行TaskD、Application是用戶編寫的Spark應(yīng)用程序?qū)W生答案：C12在Hadoop生態(tài)系統(tǒng)中，Kafka主要解決Hadoop中存在哪些的問題？A、Hadoop生態(tài)系統(tǒng)中各個(gè)組件和其他產(chǎn)品之間缺乏統(tǒng)一的、高效的數(shù)據(jù)交換中介B、不同的MapReduce任務(wù)之間存在重復(fù)操作，降低了效率C、抽象層次低，需要手工編寫大量代碼D、延遲高，而且不適合執(zhí)行迭代計(jì)算學(xué)生答案：A13下列關(guān)于Spark的描述，錯(cuò)誤的是哪一項(xiàng)？A提供了完整而強(qiáng)大的技術(shù)棧，包括SQL查詢、流式計(jì)算、機(jī)器學(xué)習(xí)和圖算法組件B使用DAG執(zhí)行引擎以支持循環(huán)數(shù)據(jù)流與內(nèi)存計(jì)算C支持使用Scala、Java、Python和R語言進(jìn)行編程，但是不可以通過SparkShell進(jìn)行交互式編程D可運(yùn)行于獨(dú)立的集群模式中，可運(yùn)行于Hadoop中，也可運(yùn)行于AmazonEC2等云環(huán)境中學(xué)生答案：C14下列哪個(gè)不屬于YARN體系結(jié)構(gòu)中ApplicationMaster的功能？A將申請(qǐng)的資源分配給內(nèi)部任務(wù)B處理來自ResourceManger的命令C為應(yīng)用程序申請(qǐng)資源D任務(wù)調(diào)度、監(jiān)控與容錯(cuò)學(xué)生答案：B15在Spark生態(tài)系統(tǒng)組件的應(yīng)用場(chǎng)景中，下列哪項(xiàng)說法是錯(cuò)誤的？A、SparkCore應(yīng)用在復(fù)雜的批量數(shù)據(jù)處理B、SparkSQL是基于歷史數(shù)據(jù)的交互式查詢C、GraphX是圖結(jié)構(gòu)數(shù)據(jù)的處理D、SparkStreaming是基于歷史數(shù)據(jù)的數(shù)據(jù)挖掘?qū)W生答案：D判斷題1、MapReduce將復(fù)雜的、運(yùn)行于大規(guī)模集群上的并行計(jì)算過程高度地抽象到了兩個(gè)函數(shù)。A正確B錯(cuò)誤學(xué)生答案：A2、MapReduce計(jì)算模型主要用于實(shí)時(shí)、計(jì)算密集型應(yīng)用。A正確B錯(cuò)誤學(xué)生答案：B3、推薦系統(tǒng)是大數(shù)據(jù)在互聯(lián)網(wǎng)領(lǐng)域的典型應(yīng)用，是自動(dòng)聯(lián)系用戶和愛好的一種工具。A正確B錯(cuò)誤學(xué)生答案：B4、Spark運(yùn)行架構(gòu)中，每個(gè)Application都有自己專屬的Executor進(jìn)程，該進(jìn)程在Application運(yùn)行期間一直駐留。A正確B錯(cuò)誤學(xué)生答案：A5、在Hadoop生態(tài)系統(tǒng)中，Pig主要解決Hadoop中存在的延遲高、不適合執(zhí)行迭代計(jì)算的問題。A正確B錯(cuò)誤學(xué)生答案：B多選題1、MapReduce體系結(jié)構(gòu)主要由以下那幾個(gè)部分構(gòu)成？A、JobTrackerB、ClientC、TaskD、TaskTracker學(xué)生答案：A；B；C；D2下列關(guān)于MapReduce的體系結(jié)構(gòu)的描述，說法正確的有？A、TaskTracker監(jiān)控所有TaskTracker與Job的健康狀況B、TaskTracker使用“slot”等量劃分本節(jié)點(diǎn)上的資源量（CPU、內(nèi)存等）C、JobTracker負(fù)責(zé)資源監(jiān)控和作業(yè)調(diào)度D、用戶編寫的MapReduce程序通過Client提交到JobTracker端學(xué)生答案：B；C；D3、MapReduce的具體應(yīng)用包括哪些？A矩陣-向量乘法B關(guān)系代數(shù)運(yùn)算（選擇、投影、并、交、差、連接）C矩陣乘法D分組與聚合運(yùn)算學(xué)生答案：A；B；C；D4下列哪些屬于大數(shù)據(jù)應(yīng)用？A物流：基于大數(shù)據(jù)和物聯(lián)網(wǎng)技術(shù)的智能物流B汽車：無人駕駛汽車，實(shí)時(shí)采集車輛各種行駛數(shù)據(jù)和周圍環(huán)境C智能交通：利用交通大數(shù)據(jù)，實(shí)現(xiàn)交通實(shí)時(shí)監(jiān)控D推薦系統(tǒng)：為用戶推薦相關(guān)商品學(xué)生答案：A；B；C；D5在實(shí)際大數(shù)據(jù)處理應(yīng)用中，當(dāng)采用多種計(jì)算架構(gòu)來滿足不同應(yīng)用場(chǎng)景需求時(shí)，會(huì)帶來哪些問題？A比較難以對(duì)同一個(gè)集群中的各個(gè)系統(tǒng)進(jìn)行統(tǒng)一的資源協(xié)調(diào)和分配B不同的軟件需要不同的開發(fā)和維護(hù)團(tuán)隊(duì)C不同場(chǎng)景之間輸入輸出數(shù)據(jù)無法做到無縫共享，通常需要進(jìn)行數(shù)據(jù)格式的轉(zhuǎn)換D需要較高的使用成本學(xué)生答案：A；B；C；D6下面哪個(gè)屬于不斷完善的Hadoop生態(tài)系統(tǒng)中的組件？A、KafkaB、TezC、DN8D、Pig學(xué)生答案：A；B；D7、MapReduce相較于傳統(tǒng)的并行計(jì)算框架有什么優(yōu)勢(shì)？A非共享式，容錯(cuò)性好B使用普通PC機(jī)，便宜，擴(kuò)展性好C編程簡(jiǎn)單，只要告訴MapReduce做什么即可D批處理、非實(shí)時(shí)、數(shù)據(jù)密集型學(xué)生答案：A；B；C；D8、Spark采用RDD以后能夠?qū)崿F(xiàn)高效計(jì)算的原因主要在于？A中間結(jié)果持久化到內(nèi)存，避免了不必要的讀寫磁盤開銷B存放的數(shù)據(jù)可以是Java對(duì)象，避免了不必要的對(duì)象序列化和反序列化C采用數(shù)據(jù)復(fù)制實(shí)現(xiàn)容錯(cuò)D高效的容錯(cuò)性學(xué)生答案：A；B；D9在實(shí)際應(yīng)用中，大數(shù)據(jù)處理主要包括以下哪三個(gè)類型？A基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理：通常時(shí)間跨度在數(shù)百毫秒到數(shù)秒之間B基于歷史數(shù)據(jù)的交互式查詢：通常時(shí)間跨度在數(shù)十秒到數(shù)分鐘之間C復(fù)雜的批量數(shù)據(jù)處理：通常時(shí)間跨度在數(shù)十分鐘到數(shù)小時(shí)之間D基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理：通常時(shí)間跨度在數(shù)十秒到數(shù)分鐘之間學(xué)生答案：A；B；C10下列選項(xiàng)中，哪些屬于Hadoop1.0的核心組件的不足之處？A實(shí)時(shí)性差（適合批處理，不支持實(shí)時(shí)交互式）B執(zhí)行迭代操作效率低C資源浪費(fèi)（Map和Reduce分兩階段執(zhí)行）D難以看到程序整體邏輯學(xué)生答案：A；B；C；D簡(jiǎn)答題1.關(guān)于Spark，（1）相對(duì)于MapReduce而言，在執(zhí)行迭代計(jì)算方面，為什么Spark具有更好的性能？（2）為什么說Spark的設(shè)計(jì)具有天生的容錯(cuò)性？（3）Spark有哪三種部署方式？答案：關(guān)于Spark的相關(guān)問題，以下是詳細(xì)解答：（1）相對(duì)于MapReduce而言，在執(zhí)行迭代計(jì)算方面，Spark具有更

人人文庫> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

2024年秋江蘇開放大學(xué)大數(shù)據(jù)庫管理過程性考核作業(yè)1-3

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

2024年秋江蘇開放大學(xué)大數(shù)據(jù)庫管理過程性考核作業(yè)1-3

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔