版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2024年秋江蘇開放大學(xué)大數(shù)據(jù)庫管理060602第一次過程性考核作業(yè)(1~3單元)單選題1、Hadoop框架中最核心的設(shè)計(jì)是什么?A、為海量數(shù)據(jù)提供存儲(chǔ)的HDFS和對(duì)數(shù)據(jù)進(jìn)行計(jì)算的MapReduceB、Hadoop被視為事實(shí)上的大數(shù)據(jù)處理標(biāo)準(zhǔn)C、Hadoop不僅可以運(yùn)行在企業(yè)內(nèi)部的集群中,也可以運(yùn)行在云計(jì)算環(huán)境中D提供整個(gè)HDFS文件系統(tǒng)的NameSpace(命名空間)管理、塊管理等所有服務(wù)學(xué)生答案:A2下面對(duì)SecondaryNameNode第二名稱節(jié)點(diǎn)的描述,哪個(gè)是錯(cuò)誤的?A、SecondaryNameNode一般是并行運(yùn)行在多臺(tái)機(jī)器上B、SecondaryNameNode是HDFS架構(gòu)中的一個(gè)組成部分C、SecondaryNameNode用來保存名稱節(jié)點(diǎn)中對(duì)HDFS元數(shù)據(jù)信息的備份D、SecondaryNameNode通過HTTPGET方式從NameNode上獲取到FsImage和EditLog文件,并下載到本地的相應(yīng)目錄下學(xué)生答案:A3在一個(gè)基本的Hadoop集群中,DataNode主要負(fù)責(zé)什么?A負(fù)責(zé)協(xié)調(diào)集群中的數(shù)據(jù)存儲(chǔ)B存儲(chǔ)被拆分的數(shù)據(jù)塊C負(fù)責(zé)執(zhí)行由JobTracker指派的任務(wù)D協(xié)調(diào)數(shù)據(jù)計(jì)算任務(wù)學(xué)生答案:B4在HDFS中,NameNode的主要功能是什么?A維護(hù)blockid到DataNode本地文件的映射關(guān)系B存儲(chǔ)元數(shù)據(jù)C文件內(nèi)容保存在磁盤中D存儲(chǔ)文件內(nèi)容學(xué)生答案:B5下列哪一項(xiàng)不屬于HDFS采用抽象的塊概念帶來的好處?A強(qiáng)大的跨平臺(tái)兼容性B適合數(shù)據(jù)備份C簡(jiǎn)化系統(tǒng)設(shè)計(jì)D支持大規(guī)模文件存儲(chǔ)學(xué)生答案:A6在Hadoop項(xiàng)目結(jié)構(gòu)中,MapReduce指的是什么?A、Hadoop上的工作流管理系統(tǒng)B分布式并行編程模型C流計(jì)算框架D提供分布式協(xié)調(diào)一致性服務(wù)學(xué)生答案:B7第一次信息化浪潮主要解決什么問題?A信息轉(zhuǎn)換B信息處理C信息爆炸D信息傳輸學(xué)生答案:B8下面對(duì)FsImage的描述,哪個(gè)是正確的?A、FsImage記錄了每個(gè)塊具體被存儲(chǔ)在哪個(gè)數(shù)據(jù)節(jié)點(diǎn)B、FsImage用于維護(hù)文件系統(tǒng)樹以及文件樹中所有的文件和文件夾的元數(shù)據(jù)C、FsImage用于存儲(chǔ)文件內(nèi)容D、FsImage記錄了所有針對(duì)文件的創(chuàng)建、刪除、重命名等操作學(xué)生答案:B9下列哪一個(gè)不屬于Hadoop的大數(shù)據(jù)層的功能?A實(shí)時(shí)計(jì)算B數(shù)據(jù)挖掘C離線分析DBI分析學(xué)生答案:A10下列哪個(gè)不屬于Hadoop的特性?A成本高B運(yùn)行在Linux平臺(tái)上C高可靠性D高容錯(cuò)性學(xué)生答案:A11在Hadoop項(xiàng)目結(jié)構(gòu)中,HDFS指的是什么?A資源管理和調(diào)度器B、Hadoop上的數(shù)據(jù)倉庫C分布式文件系統(tǒng)D分布式并行編程模型學(xué)生答案:C12在大數(shù)據(jù)的計(jì)算模式中,流計(jì)算解決的是什么問題?A針對(duì)大規(guī)模圖結(jié)構(gòu)數(shù)據(jù)的處理B針對(duì)大規(guī)模數(shù)據(jù)的批量處理C針對(duì)流數(shù)據(jù)的實(shí)時(shí)計(jì)算D大規(guī)模數(shù)據(jù)的存儲(chǔ)管理和查詢分析學(xué)生答案:C13下面哪個(gè)不是Hadoop1.0的組件?A、NameNode和DataNodeB、YARNC、MapReduceD、HDFS學(xué)生答案:B14在Hadoop生態(tài)系統(tǒng)中,HBase指的是什么?A數(shù)據(jù)流處理環(huán)境B分布式數(shù)據(jù)庫C、Hadoop上的數(shù)據(jù)倉庫D分布式文件系統(tǒng)學(xué)生答案:B15下面哪個(gè)選項(xiàng)屬于大數(shù)據(jù)技術(shù)的“數(shù)據(jù)存儲(chǔ)和管理”技術(shù)層面的功能?A利用分布式并行編程模型和計(jì)算框架,結(jié)合機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法,實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的處理和分析B把實(shí)時(shí)采集的數(shù)據(jù)作為流計(jì)算系統(tǒng)的輸入,進(jìn)行實(shí)時(shí)處理分析C利用分布式文件系統(tǒng)、數(shù)據(jù)倉庫、關(guān)系數(shù)據(jù)庫等實(shí)現(xiàn)對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化海量數(shù)據(jù)的存儲(chǔ)和管理D構(gòu)建隱私數(shù)據(jù)保護(hù)體系和數(shù)據(jù)安全體系,有效保護(hù)個(gè)人隱私和數(shù)據(jù)安全學(xué)生答案:C判斷題1大數(shù)據(jù)的特點(diǎn)包括數(shù)據(jù)的“大量化”、快速化”、“多樣化”、“高價(jià)值”。A正確B錯(cuò)誤學(xué)生答案:B2、Hadoop可以部署在廉價(jià)的計(jì)算機(jī)集群中。A正確B錯(cuò)誤學(xué)生答案:A3、HDFS采用了分層模型。A正確B錯(cuò)誤學(xué)生答案:B4第三次信息化浪潮主要解決信息處理問題。A正確B錯(cuò)誤學(xué)生答案:B5在HDFS中,默認(rèn)一個(gè)塊的大小是64KB。A正確B錯(cuò)誤學(xué)生答案:B多選題1下面哪個(gè)屬于大數(shù)據(jù)的應(yīng)用領(lǐng)域?A實(shí)時(shí)掌握交通狀況B監(jiān)控身體情況C金融交易D智能醫(yī)療研發(fā)學(xué)生答案:A;B;C;D2、HDFS的應(yīng)用局限性,主要包括以下哪幾個(gè)方面?A不支持多用戶寫入及任意修改文件B較差的跨平臺(tái)兼容性C無法高效存儲(chǔ)大量小文件D不適合低延遲數(shù)據(jù)訪問學(xué)生答案:A;C;D3、Hadoop的特性包括哪些?A高可擴(kuò)展性B支持多種編程語言C運(yùn)行在Linux平臺(tái)上D高效性學(xué)生答案:A;B;C;D4、HDFS具有較高的容錯(cuò)性,設(shè)計(jì)了哪些相應(yīng)的機(jī)制檢測(cè)數(shù)據(jù)錯(cuò)誤和進(jìn)行自動(dòng)恢復(fù)?A數(shù)據(jù)出錯(cuò)B名稱節(jié)點(diǎn)出錯(cuò)C數(shù)據(jù)節(jié)點(diǎn)出錯(cuò)D數(shù)據(jù)源太大學(xué)生答案:A;B;C5下列關(guān)于Hadoop的描述,哪些是正確的?A曾經(jīng)被公認(rèn)為行業(yè)大數(shù)據(jù)標(biāo)準(zhǔn)開源軟件B具有很好的跨平臺(tái)特性C可以部署在廉價(jià)的計(jì)算機(jī)集群中D為用戶提供了系統(tǒng)底層細(xì)節(jié)透明的分布式基礎(chǔ)架構(gòu)學(xué)生答案:A;B;C;D6數(shù)據(jù)節(jié)點(diǎn)(DataNode)的主要功能包括哪些?A負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)和讀取B用來保存名稱節(jié)點(diǎn)中對(duì)HDFS元數(shù)據(jù)信息的備份,并減少名稱節(jié)點(diǎn)重啟的時(shí)間C根據(jù)客戶端或者是名稱節(jié)點(diǎn)的調(diào)度來進(jìn)行數(shù)據(jù)的存儲(chǔ)和檢索D向名稱節(jié)點(diǎn)定期發(fā)送自己所存儲(chǔ)的塊的列表學(xué)生答案:A;C;D7HDFS特殊的設(shè)計(jì),在實(shí)現(xiàn)優(yōu)良特性的同時(shí),也使得自身具有一些應(yīng)用局限性,主要包括以下哪幾個(gè)方面?A不支持多用戶寫入及任意修改文件B較差的跨平臺(tái)兼容性C不適合低延遲數(shù)據(jù)訪問D無法高效存儲(chǔ)大量小文件學(xué)生答案:A;C;D8Hadoop集群的整體性能主要受到什么因素影響?ACPU性能B內(nèi)存C網(wǎng)絡(luò)D存儲(chǔ)容量學(xué)生答案:A;B;C;D9、對(duì)于HDFS中的客戶端,下列描述哪些是正確的?A、HDFS客戶端是一個(gè)庫,暴露了HDFS文件系統(tǒng)接口B客戶端是用戶操作HDFS最常用的方式,HDFS在部署時(shí)都提供了客戶端C客戶端可以支持打開、讀取、寫入等常見的操作D嚴(yán)格來說,客戶端并不算是HDFS的一部分學(xué)生答案:A;B;C;D10、HDFS數(shù)據(jù)塊多副本存儲(chǔ)具備以下哪些優(yōu)點(diǎn)?A加快數(shù)據(jù)傳輸速度B適合多平臺(tái)上運(yùn)行C保證數(shù)據(jù)可靠性D容易檢查數(shù)據(jù)錯(cuò)誤學(xué)生答案:A;C;D簡(jiǎn)答題1請(qǐng)闡述大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)三者之間的關(guān)系。參考答案:從整體上看,大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)是相輔相成的。---(1分)(1)大數(shù)據(jù)根植于云計(jì)算,大數(shù)據(jù)分析的很多技術(shù)來之云計(jì)算,云計(jì)算的分布式數(shù)據(jù)存儲(chǔ)和管理系統(tǒng)、分布式并行處理框架MapReduce,都是大數(shù)據(jù)技術(shù)的基礎(chǔ),反之,大數(shù)據(jù)為云計(jì)算提供了“用武之地”......(2分)(2)物聯(lián)網(wǎng)是大數(shù)據(jù)的重要來源,大數(shù)據(jù)技術(shù)為物聯(lián)網(wǎng)數(shù)據(jù)分析提供支撐............(2分)(3)云計(jì)算為物聯(lián)網(wǎng)提供海量數(shù)據(jù)存儲(chǔ)能力,物聯(lián)網(wǎng)為云計(jì)算技術(shù)提供了廣闊的應(yīng)用空間。....(2分)
2024年秋江蘇開放大學(xué)大數(shù)據(jù)庫管理060602第二次過程性考核作業(yè)(4~6單元)單選題1下列關(guān)于NoSQL與關(guān)系數(shù)據(jù)庫的比較,哪個(gè)說法是錯(cuò)誤的?A在數(shù)據(jù)完整性方面,RDBMS容易實(shí)現(xiàn)B擴(kuò)展性方面,NoSQL比較好C在一致性方面,RDBMS強(qiáng)于NoSQLD在可用性方面,NoSQL優(yōu)于RDBMS學(xué)生答案:D2關(guān)于文檔數(shù)據(jù)庫的說法,下列哪一項(xiàng)是錯(cuò)誤的?A性能好(高并發(fā))B缺乏統(tǒng)一的查詢語法C數(shù)據(jù)是規(guī)則的D復(fù)雜性低學(xué)生答案:C3下列哪一個(gè)不屬于云數(shù)據(jù)庫產(chǎn)品?A阿里云RDSB百度云數(shù)據(jù)庫C本地安裝MySQLD、OracleCloud學(xué)生答案:C4、HBase系統(tǒng)架構(gòu)中,主服務(wù)器Master主要負(fù)責(zé)表和Region的管理工作,下面有關(guān)描述哪個(gè)是錯(cuò)誤的?A管理用戶對(duì)表的增加、刪除、修改、查詢等操作B不支持不同Region服務(wù)器之間的負(fù)載均衡C對(duì)發(fā)生故障失效的Region服務(wù)器上的Region進(jìn)行遷移D在Region分裂或合并后,負(fù)責(zé)重新調(diào)整Region的分布學(xué)生答案:B5下面關(guān)于NoSQL和關(guān)系數(shù)據(jù)庫的簡(jiǎn)單比較,哪個(gè)是錯(cuò)誤的?A、RDBMS借助于索引機(jī)制可以實(shí)現(xiàn)快速查詢,很多NoSQL數(shù)據(jù)庫沒有面向復(fù)雜查詢的索引B、NoSQL很難實(shí)現(xiàn)橫向擴(kuò)展,RDBMS可以很容易通過添加更多設(shè)備來支持更大規(guī)模的數(shù)據(jù)C、RDBMS需要定義數(shù)據(jù)庫模式,嚴(yán)格遵守?cái)?shù)據(jù)定義,NoSQL一般不存在數(shù)據(jù)庫模式,可以自由靈活定義并存儲(chǔ)各種不同類型的數(shù)據(jù)D、RDBMS有關(guān)系代數(shù)理論作為基礎(chǔ),NoSQL沒有統(tǒng)一的理論基礎(chǔ)學(xué)生答案:B6、UMP系統(tǒng)是構(gòu)建在一個(gè)大的集群之上的,下列哪一項(xiàng)不屬于系統(tǒng)向用戶提供的功能?A分庫分表B資源合并C讀寫分離D數(shù)據(jù)安全學(xué)生答案:B7、HBase只有一個(gè)針對(duì)行鍵的索引,如果要訪問HBase表中的行,下面哪種方式是不可行的?A通過一個(gè)行鍵的區(qū)間來訪問B通過單個(gè)行鍵訪問C通過時(shí)間戳訪問D全表掃描學(xué)生答案:C8下列關(guān)于鍵值數(shù)據(jù)庫的描述,哪一項(xiàng)是錯(cuò)誤的?A大量寫操作時(shí)性能高B條件查詢效率高C擴(kuò)展性好,靈活性好D無法存儲(chǔ)結(jié)構(gòu)化信息學(xué)生答案:B9、HBase中需要根據(jù)“四維坐標(biāo)”來確定一個(gè)單元格,下面哪個(gè)不屬于“四維坐標(biāo)”?A、時(shí)間戳B、行鍵C關(guān)鍵字D列族學(xué)生答案:C10下列關(guān)于云數(shù)據(jù)庫的描述,哪個(gè)是錯(cuò)誤的?A云數(shù)據(jù)庫是部署和虛擬化在云計(jì)算環(huán)境中的數(shù)據(jù)庫B云數(shù)據(jù)庫具有高可擴(kuò)展性、高可用性、采用多租形式和支持資源有效分發(fā)等特點(diǎn)C云數(shù)據(jù)庫是在云計(jì)算的大背景下發(fā)展起來的一種新興的共享基礎(chǔ)架構(gòu)的方法D云數(shù)據(jù)庫價(jià)格不菲,維護(hù)費(fèi)用極其昂貴學(xué)生答案:D11下列哪個(gè)不屬于NoSQL數(shù)據(jù)庫的特點(diǎn)?A靈活的數(shù)據(jù)模型B靈活的可擴(kuò)展性C數(shù)據(jù)存儲(chǔ)規(guī)模有限D(zhuǎn)與云計(jì)算緊密融合學(xué)生答案:C12下面關(guān)于HBase中Region的說法,哪個(gè)是錯(cuò)誤的?A同一個(gè)Region不會(huì)被分拆到多個(gè)Region服務(wù)器B為了加快訪問速度,.META.表的全部Region都會(huì)被保存在內(nèi)存中C為了加速尋址,客戶端會(huì)緩存位置信息D一個(gè)-ROOT-表可以有多個(gè)Region學(xué)生答案:D13下列哪一項(xiàng)不屬于NoSQL的四大類型?A圖數(shù)據(jù)庫B列族數(shù)據(jù)庫C時(shí)間戳數(shù)據(jù)庫D文檔數(shù)據(jù)庫學(xué)生答案:C14關(guān)于HBase的三層結(jié)構(gòu)中各層次的名稱和作用的說法,哪個(gè)是錯(cuò)誤的?A、.META.表保存了HBase中所有用戶數(shù)據(jù)表的Region位置信息B、-ROOT-表記錄了.META.表的Region位置信息C、Zookeeper文件記錄了-ROOT-表的位置信息D、Zookeeper文件記錄了用戶數(shù)據(jù)表的Region位置信息學(xué)生答案:D15下列關(guān)于列族數(shù)據(jù)庫的描述,哪一項(xiàng)是錯(cuò)誤的?A復(fù)雜性低B容易進(jìn)行分布式擴(kuò)展C功能較少,大都不支持強(qiáng)事務(wù)一致性D查找速度慢,可擴(kuò)展性差學(xué)生答案:D判斷題1、HBase是基于列存儲(chǔ)的,操作不存在復(fù)雜的表與表之間的關(guān)系,不支持修改操作。A正確B錯(cuò)誤學(xué)生答案:B2、Web2.0網(wǎng)站系統(tǒng)基本上不用關(guān)系數(shù)據(jù)庫來存儲(chǔ)數(shù)據(jù)。A正確B錯(cuò)誤學(xué)生答案:B3同一個(gè)公司只能提供采用單一數(shù)據(jù)模型的單個(gè)云數(shù)據(jù)庫服務(wù)。A正確B錯(cuò)誤學(xué)生答案:B4圖數(shù)據(jù)庫專門用于處理具有高度相互關(guān)聯(lián)關(guān)系的數(shù)據(jù)。A正確B錯(cuò)誤學(xué)生答案:A5在HBase訪問接口中,Pig適合用于并行批處理HBase表數(shù)據(jù)。A正確B錯(cuò)誤學(xué)生答案:B多選題1下列關(guān)于圖數(shù)據(jù)庫的描述,哪些是正確的?A靈活性高,支持復(fù)雜的圖算法B復(fù)雜性高,只能支持一定的數(shù)據(jù)規(guī)模C專門用于處理具有高度相互關(guān)聯(lián)關(guān)系的數(shù)據(jù)D比較適合于社交網(wǎng)絡(luò)、模式識(shí)別、依賴分析、推薦系統(tǒng)以及路徑尋找等問題學(xué)生答案:A;B;C;D2、HBase訪問接口類型包括哪些?A、ThriftGatewayB、NativeJavaAPIC、RESTGatewayD、HBaseShell學(xué)生答案:A;B;C;D3下列關(guān)于HBase中HLog工作原理的描述,哪些是正確的?A用戶更新數(shù)據(jù)必須首先寫入日志后,才能寫入MemStore緩存B系統(tǒng)出錯(cuò)時(shí),HBase采用HLog保證系統(tǒng)恢復(fù)C、HBase系統(tǒng)為每個(gè)Region服務(wù)器配置了一個(gè)HLog文件D、當(dāng)某個(gè)Region服務(wù)器發(fā)生故障時(shí),Master首先會(huì)處理該服務(wù)器上面遺留的HLog文件學(xué)生答案:A;B;C;D4下列關(guān)于MySQL集群的描述,哪些是正確的?A擴(kuò)容問題:如果系統(tǒng)壓力過大需要增加新的機(jī)器,這個(gè)過程涉及數(shù)據(jù)重新劃分B動(dòng)態(tài)數(shù)據(jù)遷移問題:如果某個(gè)數(shù)據(jù)庫組壓力過大,需要將其中部分?jǐn)?shù)據(jù)遷移出去C復(fù)雜性:部署、管理、配置很復(fù)雜D數(shù)據(jù)庫復(fù)制:MySQL主備之間一般采用復(fù)制方式,很多時(shí)候是異步復(fù)制學(xué)生答案:A;B;C;D5當(dāng)處理CAP的問題時(shí),可以有哪幾個(gè)明顯的選擇?A、AP:也就是強(qiáng)調(diào)可用性(A)和分區(qū)容忍性(P),放棄一致性(C)B、CA:也就是強(qiáng)調(diào)一致性(C)和可用性(A),放棄分區(qū)容忍性(P)C、CAP:也就是同時(shí)兼顧可用性(A)、分區(qū)容忍性(P)和一致性(C)D、CP:也就是強(qiáng)調(diào)一致性(C)和分區(qū)容忍性(P),放棄可用性(A)學(xué)生答案:A;B;D6關(guān)系數(shù)據(jù)庫已經(jīng)無法滿足Web2.0的需求,主要表現(xiàn)在以下幾個(gè)方面?A無法滿足海量數(shù)據(jù)的管理需求B使用難度高C無法滿足高可擴(kuò)展性和高可用性的需求D無法滿足數(shù)據(jù)高并發(fā)的需求學(xué)生答案:A;C;D7為什么說云數(shù)據(jù)庫是個(gè)性化數(shù)據(jù)存儲(chǔ)需求的理想選擇?A云數(shù)據(jù)庫可以滿足大企業(yè)的海量數(shù)據(jù)存儲(chǔ)需求B前期零投入、后期免維護(hù)的數(shù)據(jù)庫服務(wù),可以很好地滿足需求C云數(shù)據(jù)庫可以滿足中小企業(yè)的低成本數(shù)據(jù)存儲(chǔ)需求D云數(shù)據(jù)庫可以滿足企業(yè)動(dòng)態(tài)變化的數(shù)據(jù)存儲(chǔ)需求學(xué)生答案:A;B;C;D8下列關(guān)于云數(shù)據(jù)庫與其他數(shù)據(jù)庫的關(guān)系,哪些是正確的?A許多公司在開發(fā)云數(shù)據(jù)庫時(shí),后端數(shù)據(jù)庫都是直接使用現(xiàn)有的各種關(guān)系數(shù)據(jù)庫或NoSQL數(shù)據(jù)庫產(chǎn)品B同一個(gè)公司只能提供采用不同數(shù)據(jù)模型的單個(gè)云數(shù)據(jù)庫服務(wù)C從數(shù)據(jù)模型的角度來說,云數(shù)據(jù)庫并非一種全新的數(shù)據(jù)庫技術(shù)D云數(shù)據(jù)庫并沒有專屬于自己的數(shù)據(jù)模型,云數(shù)據(jù)庫所采用的數(shù)據(jù)模型可以是關(guān)系數(shù)據(jù)庫所使用的關(guān)系模型學(xué)生答案:A;C;D9、HBase的三層結(jié)構(gòu)中,三層指的是哪三層?A、-ROOT-表B、.META.表C、數(shù)據(jù)類型D、Zookeeper文件學(xué)生答案:A;B;D10下列關(guān)于UMP系統(tǒng)架構(gòu)的描述,哪些是正確的?A、UMP系統(tǒng)借助于LVS來實(shí)現(xiàn)集群內(nèi)部的負(fù)載均衡B、信息統(tǒng)計(jì)服務(wù)器定期將采集到的用戶的連接數(shù)進(jìn)行統(tǒng)計(jì)C、LVS(LinuxVirtualServer)即Linux虛擬服務(wù)器D、Web控制臺(tái)無法向用戶提供系統(tǒng)管理界面學(xué)生答案:A;B;C簡(jiǎn)答題1.請(qǐng)描述作為NoSQL數(shù)據(jù)庫的基石之一的BASE的含義。參考答案:BASE的基本含義如下:(1)基本可用(BasicallyAvailble):是指一個(gè)分布式系統(tǒng)的一部分發(fā)生問題變得不可用時(shí),其他部分仍然可以正常使用,也就是允許分區(qū)失敗的情形出現(xiàn).。....................(2分)(2)軟狀態(tài)(Soft-state):是指與“硬狀態(tài)”相對(duì)應(yīng)的一種提法。數(shù)據(jù)庫保存的數(shù)據(jù)是“硬狀態(tài)”時(shí),可以保證數(shù)據(jù)一致性,即保證數(shù)據(jù)一直是正確的?!败洜顟B(tài)”是指狀態(tài)可以有一段時(shí)間不同步,具有一定的滯后性。.....................(2分)(3)最終一致性(Eventualconsistency):是指允許后續(xù)的訪問操作可以暫時(shí)讀不到更新后的數(shù)據(jù),但是經(jīng)過一段時(shí)間之后,必須最終讀到更新后的數(shù)據(jù),這也是ACID的最終目的,最終數(shù)據(jù)是一致的就可以了,而不是實(shí)時(shí)都保持一致。...............................(2分)
2024年秋江蘇開放大學(xué)大數(shù)據(jù)庫管理第三次過程性考核作業(yè)(7~10單元)單選題1、關(guān)于HDFSFederation的設(shè)計(jì)的描述,哪個(gè)是錯(cuò)誤的?A、HDFS的命名服務(wù)能夠水平擴(kuò)展B屬于不同命名空間的塊可以構(gòu)成同一個(gè)“塊池”C設(shè)計(jì)了多個(gè)相互獨(dú)立的名稱節(jié)點(diǎn)D、HDFSFederation中,所有名稱節(jié)點(diǎn)會(huì)共享底層的數(shù)據(jù)節(jié)點(diǎn)存儲(chǔ)資源,數(shù)據(jù)節(jié)點(diǎn)向所有名稱節(jié)點(diǎn)匯報(bào)學(xué)生答案:B2下列關(guān)于推薦系統(tǒng)的描述,有誤的是?A專家推薦:人工推薦,由資深的專業(yè)人士來進(jìn)行物品的篩選和推薦,需要較多的人力成本性B協(xié)同過濾推薦:應(yīng)用最早和最為成功的推薦方法之一C混合推薦:結(jié)合多種推薦算法來提升推薦效果D基于統(tǒng)計(jì)的推薦:通過機(jī)器學(xué)習(xí)的方法去描述內(nèi)容的特征,并基于內(nèi)容的特征來發(fā)現(xiàn)與之相似的內(nèi)容學(xué)生答案:D3下列哪個(gè)不屬于YARN體系結(jié)構(gòu)中ResourceManager的功能?A處理來自ApplicationMaster的命令B監(jiān)控NodeManagerC處理客戶端請(qǐng)求D資源分配與調(diào)度學(xué)生答案:A4下列說法哪項(xiàng)有誤?A、Spark可以部署在資源管理器YARN之上,提供一站式的大數(shù)據(jù)解決方案B、Hadoop的設(shè)計(jì)遵循“一個(gè)軟件棧滿足不同應(yīng)用場(chǎng)景”的理念C相對(duì)于Spark來說,使用Hadoop進(jìn)行迭代計(jì)算非常耗資源D、Spark將數(shù)據(jù)載入內(nèi)存后,之后的迭代計(jì)算都可以直接使用內(nèi)存中的中間結(jié)果作運(yùn)算,避免了從磁盤中頻繁讀取數(shù)據(jù)學(xué)生答案:B5下列關(guān)于Scala特性的描述,錯(cuò)誤的是哪一項(xiàng)?A、Scala是Spark的主要編程語言B、Scala兼容Java,運(yùn)行速度快,且能融合到Hadoop生態(tài)圈中C、Scala語法復(fù)雜,但是能提供優(yōu)雅的APID、Scala具備強(qiáng)大的并發(fā)性,支持函數(shù)式編程,可以更好地支持分布式系統(tǒng)學(xué)生答案:C6下列關(guān)于Spark中RDD的說法,描述有誤的是?A、RDD是可以直接修改的B、每個(gè)RDD可分成多個(gè)分區(qū),每個(gè)分區(qū)就是一個(gè)數(shù)據(jù)集片段C、一個(gè)RDD就是一個(gè)分布式對(duì)象集合,本質(zhì)上是一個(gè)只讀的分區(qū)記錄集合D、RDD提供了一種高度受限的共享內(nèi)存模型學(xué)生答案:A7下列關(guān)于Map和Reduce函數(shù)的描述,哪個(gè)是錯(cuò)誤的?A、Map每一個(gè)輸入的<k1,v1>會(huì)輸出一批<k2,v2>,B、Reduce輸入的中間結(jié)果<k2,List(v2)>中的List(v2)表示是一批屬于不同k2的valueC、Reduce輸入的中間結(jié)果<k2,List(v2)>中的List(v2)表示是一批屬于同一個(gè)k2的valueD、Map將小數(shù)據(jù)集進(jìn)一步解析成一批<key,value>對(duì),輸入Map函數(shù)中進(jìn)行處理學(xué)生答案:B8、MapReduce1.0的體系結(jié)構(gòu)中,JobTracker的主要任務(wù)是什么?A會(huì)周期性地通過“心跳”將本節(jié)點(diǎn)上資源的使用情況和任務(wù)的運(yùn)行進(jìn)度匯報(bào)給TaskTrackerB會(huì)跟蹤任務(wù)的執(zhí)行進(jìn)度、資源使用量等信息,并將這些信息告訴任務(wù)(Task)C使用“slot”等量劃分本節(jié)點(diǎn)上的資源量(CPU、內(nèi)存等)D負(fù)責(zé)資源監(jiān)控和作業(yè)調(diào)度,監(jiān)控所有TaskTracker與Job的健康狀況學(xué)生答案:D9下列關(guān)于推薦系統(tǒng)的描述,哪一項(xiàng)是錯(cuò)誤的?A推薦系統(tǒng)分為基于物品的協(xié)同過濾和基于商家的協(xié)同過濾B推薦系統(tǒng)可以創(chuàng)造全新的商業(yè)和經(jīng)濟(jì)模式,幫助實(shí)現(xiàn)長(zhǎng)尾商品的銷售C推薦系統(tǒng)是自動(dòng)聯(lián)系用戶和物品的一種工具D推薦系統(tǒng)是大數(shù)據(jù)在互聯(lián)網(wǎng)領(lǐng)域的典型應(yīng)用學(xué)生答案:A10下列傳統(tǒng)并行計(jì)算框架,說法錯(cuò)誤的是哪一項(xiàng)?A實(shí)時(shí)、細(xì)粒度計(jì)算、計(jì)算密集型B編程難度高C刀片服務(wù)器、高速網(wǎng)、SAN,價(jià)格貴,擴(kuò)展性差D共享式(共享內(nèi)存/共享存儲(chǔ)),容錯(cuò)性好學(xué)生答案:D11關(guān)于Spark運(yùn)行架構(gòu),下列說法錯(cuò)誤的是?A一個(gè)Job包含多個(gè)RDD及作用于相應(yīng)RDD上的各種操作B、DAG反映RDD之間的依賴關(guān)系C、RDD是運(yùn)行在工作節(jié)點(diǎn)(WorkerNode)的一個(gè)進(jìn)程,負(fù)責(zé)運(yùn)行TaskD、Application是用戶編寫的Spark應(yīng)用程序?qū)W生答案:C12在Hadoop生態(tài)系統(tǒng)中,Kafka主要解決Hadoop中存在哪些的問題?A、Hadoop生態(tài)系統(tǒng)中各個(gè)組件和其他產(chǎn)品之間缺乏統(tǒng)一的、高效的數(shù)據(jù)交換中介B、不同的MapReduce任務(wù)之間存在重復(fù)操作,降低了效率C、抽象層次低,需要手工編寫大量代碼D、延遲高,而且不適合執(zhí)行迭代計(jì)算學(xué)生答案:A13下列關(guān)于Spark的描述,錯(cuò)誤的是哪一項(xiàng)?A提供了完整而強(qiáng)大的技術(shù)棧,包括SQL查詢、流式計(jì)算、機(jī)器學(xué)習(xí)和圖算法組件B使用DAG執(zhí)行引擎以支持循環(huán)數(shù)據(jù)流與內(nèi)存計(jì)算C支持使用Scala、Java、Python和R語言進(jìn)行編程,但是不可以通過SparkShell進(jìn)行交互式編程D可運(yùn)行于獨(dú)立的集群模式中,可運(yùn)行于Hadoop中,也可運(yùn)行于AmazonEC2等云環(huán)境中學(xué)生答案:C14下列哪個(gè)不屬于YARN體系結(jié)構(gòu)中ApplicationMaster的功能?A將申請(qǐng)的資源分配給內(nèi)部任務(wù)B處理來自ResourceManger的命令C為應(yīng)用程序申請(qǐng)資源D任務(wù)調(diào)度、監(jiān)控與容錯(cuò)學(xué)生答案:B15在Spark生態(tài)系統(tǒng)組件的應(yīng)用場(chǎng)景中,下列哪項(xiàng)說法是錯(cuò)誤的?A、SparkCore應(yīng)用在復(fù)雜的批量數(shù)據(jù)處理B、SparkSQL是基于歷史數(shù)據(jù)的交互式查詢C、GraphX是圖結(jié)構(gòu)數(shù)據(jù)的處理D、SparkStreaming是基于歷史數(shù)據(jù)的數(shù)據(jù)挖掘?qū)W生答案:D判斷題1、MapReduce將復(fù)雜的、運(yùn)行于大規(guī)模集群上的并行計(jì)算過程高度地抽象到了兩個(gè)函數(shù)。A正確B錯(cuò)誤學(xué)生答案:A2、MapReduce計(jì)算模型主要用于實(shí)時(shí)、計(jì)算密集型應(yīng)用。A正確B錯(cuò)誤學(xué)生答案:B3、推薦系統(tǒng)是大數(shù)據(jù)在互聯(lián)網(wǎng)領(lǐng)域的典型應(yīng)用,是自動(dòng)聯(lián)系用戶和愛好的一種工具。A正確B錯(cuò)誤學(xué)生答案:B4、Spark運(yùn)行架構(gòu)中,每個(gè)Application都有自己專屬的Executor進(jìn)程,該進(jìn)程在Application運(yùn)行期間一直駐留。A正確B錯(cuò)誤學(xué)生答案:A5、在Hadoop生態(tài)系統(tǒng)中,Pig主要解決Hadoop中存在的延遲高、不適合執(zhí)行迭代計(jì)算的問題。A正確B錯(cuò)誤學(xué)生答案:B多選題1、MapReduce體系結(jié)構(gòu)主要由以下那幾個(gè)部分構(gòu)成?A、JobTrackerB、ClientC、TaskD、TaskTracker學(xué)生答案:A;B;C;D2下列關(guān)于MapReduce的體系結(jié)構(gòu)的描述,說法正確的有?A、TaskTracker監(jiān)控所有TaskTracker與Job的健康狀況B、TaskTracker使用“slot”等量劃分本節(jié)點(diǎn)上的資源量(CPU、內(nèi)存等)C、JobTracker負(fù)責(zé)資源監(jiān)控和作業(yè)調(diào)度D、用戶編寫的MapReduce程序通過Client提交到JobTracker端學(xué)生答案:B;C;D3、MapReduce的具體應(yīng)用包括哪些?A矩陣-向量乘法B關(guān)系代數(shù)運(yùn)算(選擇、投影、并、交、差、連接)C矩陣乘法D分組與聚合運(yùn)算學(xué)生答案:A;B;C;D4下列哪些屬于大數(shù)據(jù)應(yīng)用?A物流:基于大數(shù)據(jù)和物聯(lián)網(wǎng)技術(shù)的智能物流B汽車:無人駕駛汽車,實(shí)時(shí)采集車輛各種行駛數(shù)據(jù)和周圍環(huán)境C智能交通:利用交通大數(shù)據(jù),實(shí)現(xiàn)交通實(shí)時(shí)監(jiān)控D推薦系統(tǒng):為用戶推薦相關(guān)商品學(xué)生答案:A;B;C;D5在實(shí)際大數(shù)據(jù)處理應(yīng)用中,當(dāng)采用多種計(jì)算架構(gòu)來滿足不同應(yīng)用場(chǎng)景需求時(shí),會(huì)帶來哪些問題?A比較難以對(duì)同一個(gè)集群中的各個(gè)系統(tǒng)進(jìn)行統(tǒng)一的資源協(xié)調(diào)和分配B不同的軟件需要不同的開發(fā)和維護(hù)團(tuán)隊(duì)C不同場(chǎng)景之間輸入輸出數(shù)據(jù)無法做到無縫共享,通常需要進(jìn)行數(shù)據(jù)格式的轉(zhuǎn)換D需要較高的使用成本學(xué)生答案:A;B;C;D6下面哪個(gè)屬于不斷完善的Hadoop生態(tài)系統(tǒng)中的組件?A、KafkaB、TezC、DN8D、Pig學(xué)生答案:A;B;D7、MapReduce相較于傳統(tǒng)的并行計(jì)算框架有什么優(yōu)勢(shì)?A非共享式,容錯(cuò)性好B使用普通PC機(jī),便宜,擴(kuò)展性好C編程簡(jiǎn)單,只要告訴MapReduce做什么即可D批處理、非實(shí)時(shí)、數(shù)據(jù)密集型學(xué)生答案:A;B;C;D8、Spark采用RDD以后能夠?qū)崿F(xiàn)高效計(jì)算的原因主要在于?A中間結(jié)果持久化到內(nèi)存,避免了不必要的讀寫磁盤開銷B存放的數(shù)據(jù)可以是Java對(duì)象,避免了不必要的對(duì)象序列化和反序列化C采用數(shù)據(jù)復(fù)制實(shí)現(xiàn)容錯(cuò)D高效的容錯(cuò)性學(xué)生答案:A;B;D9在實(shí)際應(yīng)用中,大數(shù)據(jù)處理主要包括以下哪三個(gè)類型?A基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理:通常時(shí)間跨度在數(shù)百毫秒到數(shù)秒之間B基于歷史數(shù)據(jù)的交互式查詢:通常時(shí)間跨度在數(shù)十秒到數(shù)分鐘之間C復(fù)雜的批量數(shù)據(jù)處理:通常時(shí)間跨度在數(shù)十分鐘到數(shù)小時(shí)之間D基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理:通常時(shí)間跨度在數(shù)十秒到數(shù)分鐘之間學(xué)生答案:A;B;C10下列選項(xiàng)中,哪些屬于Hadoop1.0的核心組件的不足之處?A實(shí)時(shí)性差(適合批處理,不支持實(shí)時(shí)交互式)B執(zhí)行迭代操作效率低C資源浪費(fèi)(Map和Reduce分兩階段執(zhí)行)D難以看到程序整體邏輯學(xué)生答案:A;B;C;D簡(jiǎn)答題1.關(guān)于Spark,(1)相對(duì)于MapReduce而言,在執(zhí)行迭代計(jì)算方面,為什么Spark具有更好的性能?(2)為什么說Spark的設(shè)計(jì)具有天生的容錯(cuò)性?(3)Spark有哪三種部署方式?答案:關(guān)于Spark的相關(guān)問題,以下是詳細(xì)解答:(1)相對(duì)于MapReduce而言,在執(zhí)行迭代計(jì)算方面,Spark具有更
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 海關(guān)報(bào)關(guān)實(shí)務(wù)4-第三章2知識(shí)課件
- 二零二五年度高端家庭養(yǎng)老護(hù)理員專業(yè)服務(wù)合同范本3篇
- 二零二五年房產(chǎn)租賃中介客戶隱私保護(hù)合同3篇
- 社會(huì)保險(xiǎn)法培訓(xùn)培訓(xùn)課件
- 2024年浙江商業(yè)職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試歷年參考題庫含答案解析
- 2024年隴南市婦幼保健院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點(diǎn)附帶答案
- 2024年河北機(jī)電職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測(cè)驗(yàn)歷年參考題庫(頻考版)含答案解析
- 2024年長(zhǎng)順縣人民醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點(diǎn)附帶答案
- 2024年江西航空職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測(cè)驗(yàn)歷年參考題庫(頻考版)含答案解析
- 2024年廣東創(chuàng)新科技職業(yè)學(xué)院高職單招職業(yè)技能測(cè)驗(yàn)歷年參考題庫(頻考版)含答案解析
- 河南省鄭州外國語高中-【高二】【上期中】【把握現(xiàn)在 蓄力高三】家長(zhǎng)會(huì)【課件】
- 2025年中煤電力有限公司招聘筆試參考題庫含答案解析
- 2024-2025學(xué)年烏魯木齊市數(shù)學(xué)三上期末檢測(cè)試題含解析
- 企業(yè)內(nèi)部控制與財(cái)務(wù)風(fēng)險(xiǎn)防范
- 2025年初級(jí)經(jīng)濟(jì)師之初級(jí)經(jīng)濟(jì)師基礎(chǔ)知識(shí)考試題庫及完整答案【全優(yōu)】
- 建設(shè)項(xiàng)目施工現(xiàn)場(chǎng)春節(jié)放假期間的安全管理方案
- 胃潴留護(hù)理查房
- 污水處理廠運(yùn)營方案計(jì)劃
- 眼科慢病管理新思路
- 劉先生家庭投資理財(cái)規(guī)劃方案設(shè)計(jì)
- 寵物養(yǎng)護(hù)與經(jīng)營-大學(xué)專業(yè)介紹
評(píng)論
0/150
提交評(píng)論