




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第頁大數(shù)據(jù)期末復習題練習試題附答案1.對HDFS通信協(xié)議的理解錯誤的是()A、HDFS通信協(xié)議都是構建在IoT協(xié)議基礎之上的B、客戶端與數(shù)據(jù)節(jié)點的交互是通過RPC(RemoteProcedureCall)來實現(xiàn)的C、名稱節(jié)點和數(shù)據(jù)節(jié)點之間則使用數(shù)據(jù)節(jié)點協(xié)議進行交互D、客戶端通過一個可配置的商品向名稱節(jié)點主動發(fā)起TCP連接,并使用客戶端協(xié)議與名稱節(jié)點進行交互【正確答案】:A2.SparkSQL目前暫時不支持下列哪種語言()A、JavaB、MatlabC、PythonD、Scala【正確答案】:B3.第三次信息化浪潮的標志是:()A、互聯(lián)網(wǎng)的普及B、云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)技術的普及C、虛擬現(xiàn)實技術的普及D、個人電腦的普及【正確答案】:B4.以下對各類數(shù)據(jù)庫的理解錯誤的是()A、文檔數(shù)據(jù)庫的數(shù)據(jù)是松散的,XML和Json文檔等都可以作為數(shù)據(jù)存儲在文檔數(shù)據(jù)庫中B、HBase數(shù)據(jù)庫是列族數(shù)據(jù)庫,可擴展性強,支持事務一致性【正確答案】:B5.HBase三層結構的順序是()A、MEATA表,Zookeeper文件,-Root表B、Zookeeper文件,.MEATA表,-Root表C、Zookeeper文件,-Root表,.MEATA表D、–Root表,Zookeeper文件,.MEATA表【正確答案】:C6.下列說法錯誤的是()A、UserCF算法推薦的是那些和目標用戶有共同興趣愛好的其他用戶所喜歡的物品B、基于用戶的協(xié)同過濾算法(簡稱UserCF算法)是目前業(yè)界應用最多的算法C、ItemCF算法推薦的是那些和目標用戶之前喜歡的物品類似的其他物品D、UserCF算法的推薦更偏向社會化,而ItemCF算法的推薦更偏向于個性化【正確答案】:B7.下列說法正確的是()A、HDFSHA提供高可用性,可以實現(xiàn)可擴展性、系統(tǒng)性能和隔離性B、第二名稱節(jié)點是熱備份C、HDFSHA可用性不好D、第二名稱節(jié)點無法解決單點故障問題【正確答案】:D8.假設已經(jīng)配置好環(huán)境變量,啟動Hadoop和關閉Hadoop的命令分別是()A、Start-hdfs.sh,,stop-dfs.shB、Start-dfs.sh,stop-hdfs.shC、Start-dfs.sh,stop-dfs.shD、Start-hdfs.sh,stop-hdfs.sh【正確答案】:C9.下列數(shù)據(jù)庫屬于文檔數(shù)據(jù)庫的是()A、HBaseB、MongoDBC、RedisD、MySQL【正確答案】:B10.在使用MapReduce程序WordCount進行詞頻統(tǒng)計時,對于文本行“hellohadoophelloworld”,經(jīng)過WordCount程序的Map函數(shù)處理后直接輸出的中間結果,應該是下面哪種形式()A、<”hello”,2>、<”hadoop”,1>和<”word”,1>B、<”hello”,<1,1>>、<hadoop”,1>和<”world”,1>C、<”hello”,1>、<”hello”,1>、<”hadoop”,1>和<”world”,1>D、<”hello”,1,1>、<”hadoop”,1>和<”world”,1>【正確答案】:C11.RDD操作分為轉(zhuǎn)換(Transformation)和動作(Action)兩種類型,下列屬于動作(Action)類型的操作是()A、CountB、FilterC、GroupbyD、Map【正確答案】:A12.下列說法正確的是()A、如果通過HBaseShell插入表數(shù)據(jù),可以插入一行數(shù)據(jù)或一個單元格數(shù)據(jù)B、如果不啟動Hadoop,則HBase完全無法使用C、Zookeeper是一個集群管理工具,常用于分布式計算,提供配置維護、域名服務、分布式同步等D、HBase的實現(xiàn)包括的主要功能組件是庫函數(shù),一個Master主服務器和一個Region服務器【正確答案】:C13.下列關于NoSQL數(shù)據(jù)庫和關系型數(shù)據(jù)庫的比較,不正確的是()A、NoSQL數(shù)據(jù)庫缺乏統(tǒng)一的查詢語言,而關系型數(shù)據(jù)庫有標準化查詢語言B、NoSQL數(shù)據(jù)庫具有弱一致性,關系型數(shù)據(jù)庫具有強一致性C、NoSQL數(shù)據(jù)庫的可擴展性比傳統(tǒng)的關系型數(shù)據(jù)庫更好D、NoSQL數(shù)據(jù)庫很容易實現(xiàn)數(shù)據(jù)完整性,關系型數(shù)據(jù)庫很難實現(xiàn)數(shù)據(jù)完整性【正確答案】:D14.就數(shù)據(jù)的量級而言,1PB數(shù)據(jù)是()TBA、1024B、2048C、1000D、512【正確答案】:A15.以下關于云計算、大數(shù)據(jù)和物聯(lián)網(wǎng)之間的關系,論述錯誤的是:()A、云計算、大數(shù)據(jù)和物聯(lián)網(wǎng)三者緊密相關,相輔相成B、云計算側重于數(shù)據(jù)分析C、物聯(lián)網(wǎng)可以借助于云計算實現(xiàn)海量級數(shù)據(jù)的存儲D、物聯(lián)網(wǎng)可以借助于大數(shù)據(jù)實現(xiàn)海量數(shù)據(jù)的分析【正確答案】:B16.對于文本行:”hellohadoophelloworld”經(jīng)過WordCount的Reduce函數(shù)處理后的結果是()A、<”hello”,2><”hadoop”,1><”world”,1>B、<”hello”,1,1><”hadoop”,1><”world”,1>C、<”hello”,1><”hello”,1><”hadoop”,1><”world”,1>D、<”hello”,<1,1>><”hadoop”,1><”world”,1>【正確答案】:A17.NoSQL數(shù)據(jù)庫的三大理論基石不包括()ACIDBASEC、最終一致性D、CAP【正確答案】:A18.采用多副本冗余存儲的優(yōu)勢不包含()A、容易檢查數(shù)據(jù)錯誤B、保證數(shù)據(jù)可靠性C、節(jié)約存儲空間D、加快數(shù)據(jù)傳輸速度【正確答案】:C19.分布式文件系統(tǒng)HDFS采用了主從結構模型,由計算機集群中的多個節(jié)點構成的,這些節(jié)點分類兩類,一類存儲元數(shù)據(jù)叫(),另一類存儲具體數(shù)據(jù)叫()A、從節(jié)點,主節(jié)點B、名稱節(jié)點,主節(jié)點C、名稱節(jié)點,數(shù)據(jù)節(jié)點D、數(shù)據(jù)節(jié)點,名稱節(jié)點【正確答案】:C20.HDFS的命名空間不包含()A、目錄B、字節(jié)C、文件D、塊【正確答案】:B21.每個Region的建議最佳大小是()A、500MB-1000MBB、1GB-2GBC、100MB-200MBD、2GB-4GB【正確答案】:B22.下列說法錯誤的是()A、Map函數(shù)將輸入的元素轉(zhuǎn)換成<key,value>形式的鍵值對B、不同的Map任務之間不能互相通信C、MapReduce框架采用了Master/Slave架構,包括一個Master和若干個SlaveD、Hadoop框架是用Java實現(xiàn)的,MapReduce應用程序則一定要用Java來寫【正確答案】:D23.以下哪個不是Hadoop的特性()A、高可靠性B、支持多種編程語言C、高容錯性D、成本高【正確答案】:D24.以下對hadoop的說法錯誤的是()A、HaddopMapReduce是針對谷歌MapReduce的開源實現(xiàn),通常用于大規(guī)模數(shù)據(jù)集的并行計算B、Hadoop2.0增加了NameNodeHA和Wire-compatibility兩個重大特性C、Hadoop的核心是HDFS和MapReduceD、Hadoop是基于Java語言開發(fā)的,只支持Java語言編程【正確答案】:D25.關于HBaseShell命令解釋錯誤的是()A、Put:向表、行、列指定的單元格添加數(shù)據(jù)B、List:顯示表的所有數(shù)據(jù)Create:創(chuàng)建表D、get:通過表名、行、列、時間戳、時間范圍和版本號來獲得相應單元格的值【正確答案】:B26.HBase是一種()數(shù)據(jù)庫A、關系數(shù)據(jù)庫B、列式數(shù)據(jù)庫C、鍵值數(shù)據(jù)庫D、文檔數(shù)據(jù)庫【正確答案】:B27.下列說法錯誤的是()A、RDD提供的轉(zhuǎn)換接口既適用filter等粗粒度的轉(zhuǎn)換,也適合某一數(shù)據(jù)項的細粒度轉(zhuǎn)換B、在選擇SparkStreaming和Storm時,對實時性要求高(比如要求毫秒級響應)的企業(yè)更傾向于選擇流計算框架StormC、Spark支持三種類型的部署方式:Standalone,SparkonMesos,SparkonYarnD、RDD采用惰性調(diào)用,遇到“轉(zhuǎn)換(Transformation)”類型的操作時,只會記錄RDD生成的軌跡,只有遇到動作(Action)類型的操作時才會觸發(fā)真正的計算?!菊_答案】:A28.下面關于分岸上式文件系統(tǒng)HDFs的描述正確的是()A、分布文件系統(tǒng)HDFS是一種關系型數(shù)據(jù)庫B、分布式文件系統(tǒng)HDFS比較適合存儲大量零碎的小文件C、分布式文件系統(tǒng)HDFS是谷歌分布式文件系統(tǒng)GFS(GoogleFileSystem)的一種開源實現(xiàn)D、分布式文件系統(tǒng)HDFS是GoogleBigTable的一種開源實現(xiàn)【正確答案】:C29.每種大數(shù)據(jù)產(chǎn)品都有特定的應用場景,以下哪個產(chǎn)品用于批處理的:()A、DremelB、MapReduceC、PregelD、Storm【正確答案】:B30.下列關于常見的動作(Action)和轉(zhuǎn)換(Transformation)操作的API解釋錯誤的是()A、Filter(func):篩選出滿足函數(shù)func的元素,并返回一個新的數(shù)據(jù)集。B、Count():返回數(shù)據(jù)集中的元素個數(shù)C、Take(n):返回數(shù)據(jù)集中的元素個數(shù)D、Map(func):將每個元素傳遞到函數(shù)func中,并將結果返回為一個新的數(shù)據(jù)集?!菊_答案】:C31.下列對HBase數(shù)據(jù)模型的描述錯誤的是()A、HBase是一個稀疏、多維度、排序的映射表,這張表的索引是行鍵、列族、列限定符和時間戳B、HBase列族支持動態(tài)擴展,可以輕松地添加一個列族或列C、每個HBase表都由若干行組成,每個行由行鍵(rowkey)來標識D、HBase中執(zhí)行更新操作時,會刪除數(shù)據(jù)舊的版本,并生成一個新的版本【正確答案】:D32.下列大數(shù)據(jù)類型與其對應的軟件框架不適應的是()A、基于歷史數(shù)據(jù)的交互式查詢:ImpalaB、圖結構數(shù)據(jù)的計算:HiveC、基于實時數(shù)據(jù)流的數(shù)據(jù)處理:StormD、復雜的批量數(shù)據(jù)處理:MapReduce【正確答案】:B33.以下名詞解釋不正確的是()A、Zookeeper:針對谷歌chubby的一個開源實現(xiàn),是高可靠的協(xié)同工作系統(tǒng)B、HDFS:分布式文件系統(tǒng),是Hadoop項目的兩大核心之一,是谷歌GFS的開源實現(xiàn)C、HBASD、提供高可靠性、高性能、分布式的行式數(shù)據(jù)庫,是谷歌BigTable的開源實現(xiàn)E、Hive:一個基于Hadoop的數(shù)據(jù)倉庫工具,用于對Hadoop文件中的數(shù)據(jù)集進行數(shù)據(jù)整理、特殊查詢和分析存儲【正確答案】:C34.客戶端是通過()級尋址來定位RegionA、四B、一C、三D、二【正確答案】:C35.啟動hadoop所有進程的命令是()A、Start-hadoop.shB、Start-hdfs.shC、Start-all.shD、Start-dfs.sh【正確答案】:C36.每種大數(shù)據(jù)產(chǎn)品都有特定的應用場景,以下哪個產(chǎn)品用于查詢分析計算的()A、S4B、DremelC、HDFSD、MapReduce【正確答案】:B解析:
二、多選37.HDFSFederation設計不能解決“單名稱節(jié)點存在的哪個問題()A、性能高效B、單點故障問題C、HDFS集群擴展性D、良好的隔離性【正確答案】:B1.(多選)以下哪些組件是Hadoop的生態(tài)系統(tǒng)的組件()A、HDFSB、HBaseC、MapReduceD、Oracel【正確答案】:ABC解析:
第三章:
一、簡述題:請簡述第二名稱節(jié)點的作用
二、選擇題:2.多選:以下HDFS相關的shell命令不正確的是()A、Hadoopdfsmkdir<path>:創(chuàng)建<path>指定的文件夾B、Hadoopfs–copyFromLocal<path1><path2>:將路徑<path2>指定的文件或文件夾復制到路徑<path1>指定的文件夾中C、Hadoopfs–ls<path>:顯示<path>指定的文件的詳細信息D、Hdfsdfs–rm<path>:刪除路徑<path>指定的文件【正確答案】:AB解析:
第四章:分布式數(shù)據(jù)庫HBase3.大數(shù)據(jù)發(fā)展的三個階段是:()A、成熟期B、低谷期C、大規(guī)模應用期D、萌芽期【正確答案】:ACD4.多選:下列關于Scala的說法正確的是()A、Scala是Spark的主要編程語言,但Spark還支持Java、python、R作為編程語言B、Scala運行于java平臺,兼容現(xiàn)有的java程序C、SCala是一種多范式編程語言D、Scala具備強大的并發(fā)性,支持函數(shù)式編程【正確答案】:ABCD5.多選:MapReduce體系結構主要由哪幾個部分組成()A、ClientB、JobTrackerC、TaskTrackerD、Task【正確答案】:ABCD6.多選:對新一代資源管理調(diào)度框架YARN的理解正確的是()A、YARN的體系統(tǒng)結構包含三個組件:ResourceManage,NodeManager,ApplicationMaster;B、MapReduce2.0是運行在YARN之上的計算框架,由YARN來為MapReduce提供資源管理調(diào)度服務C、YARN既是資源管理調(diào)度框架郵局是一個計算框架D、YARN可以實現(xiàn)“一個集群多個框架”,即在一個集群上部署一個統(tǒng)一的資源調(diào)度管理框架【正確答案】:ABD7.多選:下列對HBase的理解正確的是()A、HBase是針對谷歌BigTable的開源實現(xiàn)B、HBase是一種關系型數(shù)據(jù)庫,現(xiàn)成功應用于互聯(lián)網(wǎng)服務領域C、HBase是一個行式分布式數(shù)據(jù)庫,是Hadoop生態(tài)系統(tǒng)中的一個組件D、HBase多用于存儲非結構化和半結構化的松散數(shù)據(jù)【正確答案】:AD8.多選:關于NoSQL數(shù)據(jù)庫和關系數(shù)據(jù)庫,下列說法正確的是()A、大多數(shù)NoSQL數(shù)據(jù)庫很難實現(xiàn)數(shù)據(jù)完整性B、關系數(shù)據(jù)庫有關系代數(shù)理論作為基礎,NoSQL數(shù)據(jù)庫沒有統(tǒng)一的理論基礎C、NoSQL數(shù)據(jù)庫可以支持超大規(guī)模數(shù)據(jù)存儲,具有強大的橫向擴展能力D、NoSQL數(shù)據(jù)庫和關系數(shù)據(jù)庫各有優(yōu)缺點,但隨著NoSQL的發(fā)展,終將取代關系數(shù)據(jù)庫【正確答案】:ABC9.云計算的典型服務模式包括三種:()
第2章A、IaasB、MaasC、SaasD、Paas【正確答案】:ACD解析:
一、10.數(shù)據(jù)產(chǎn)生方式大致經(jīng)歷了三個階段,包括:()A、運營式系統(tǒng)階段B、感知式系統(tǒng)階段C、用戶原創(chuàng)內(nèi)容階段D、移動互聯(lián)網(wǎng)數(shù)據(jù)階段【正確答案】:ABC11.多選:訪問HBase表中的行,有哪些方式()A、通過單個行鍵訪問B、全表掃描C、通過一個行鍵的區(qū)間來訪問D、通過某列的值區(qū)間【正確答案】:ABC解析:
第五章:NoSQL數(shù)據(jù)庫12.圖靈獎獲得者、著名數(shù)據(jù)庫專家JimGray博士認為,人類自古以來在科學研究上先后經(jīng)歷了四種范式,具體包括()A、實驗科學B、數(shù)據(jù)密集型科學C、計算科學D、理論科學【正確答案】:ABCD13.多選:CAP是指()A、持久性B、一致性C、分區(qū)容忍性D、可用性【正確答案】:BCD14.大數(shù)據(jù)帶來思維方式的三個轉(zhuǎn)是:()A、全樣而非抽樣B、效率而非精確C、相關而非因果D、精確而非全面【正確答案】:ABC15.多選:推薦方法包括哪些類型()A、協(xié)同過濾推薦B、專家推薦C、混合推薦D、基于內(nèi)容的推薦【正確答案】:ABCD16.多選:以下對名稱節(jié)點理解正確的是()A、名稱節(jié)點的數(shù)據(jù)保存在內(nèi)存中B、名稱節(jié)點作為中心服務器,負責管理文件系統(tǒng)的命名空間及客戶端對文件的訪問C、名稱節(jié)點用來負責具體用戶數(shù)據(jù)的存儲D、名稱節(jié)點通常用來保存元數(shù)據(jù)【正確答案】:ABD17.多選:下列哪些是Hadoop1.0存在的問題()A、開發(fā)者自己管理作業(yè)之間的依賴關系B、抽象層次低C、執(zhí)行迭代操作效率低D、表達能力有限【正確答案】:ABCD18.多選:Apache軟件基金會最重要的三大分布式計算系統(tǒng)開源項目包括:()A、MapReduceB、StormC、HadoopD、Spark【正確答案】:BCD19.多選:NoSQL數(shù)據(jù)庫的類型包括()A、鍵值數(shù)據(jù)庫B、列族數(shù)據(jù)庫C、圖形數(shù)據(jù)庫D、文檔數(shù)據(jù)庫【正確答案】:ABCD20.多選:spark運行架構包括()A、集群資源管理器ClusterManagerB、運行作業(yè)任務的工作節(jié)點WorkNodeC、每個工作節(jié)點上負責具體任務的執(zhí)行進行ExecutorD、每個應用的任務控制節(jié)點Driver【正確答案】:ABCD21.NoSQL數(shù)據(jù)庫的BASE特性是指()A、最終一致性B、軟狀態(tài)C、持續(xù)性D、基本可用【正確答案】:ABD22.多選:以下對數(shù)據(jù)節(jié)點理解正確的是()A、數(shù)據(jù)節(jié)點的數(shù)據(jù)保存在磁盤中B、數(shù)據(jù)節(jié)點用來存儲具體的文件內(nèi)容C、數(shù)據(jù)節(jié)點在名稱節(jié)點的統(tǒng)一調(diào)度下進行數(shù)據(jù)塊的創(chuàng)建、刪除和復制等操作D、數(shù)據(jù)節(jié)點通常只有一個【正確答案】:ABC23.多選:下列關于傳統(tǒng)并行計算框架(比如MPI)和MapReduce并行計算框架正確的是()A、前者是共享式(共享內(nèi)存/共享存儲),容錯性差,后者是非共享式的,容錯性好B、前者適用于實時、細粒度計算、計算密集型,后者適用于批處理、非實時、數(shù)據(jù)密集型C、前者所需硬件價格貴,可擴展性差,后者硬件便宜,擴展性好D、前者相比后者學習起來更難【正確答案】:ABCD24.多選:下列對Hadoop各組件的理解正確的是()A、OOzie:工作流和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中歐客機采購合同范例
- 入學租房合同范例
- 使用天津市商品房合同范例
- 2025年宿遷中考試題及答案英語
- 會議服務策劃合同范例
- 借款房產(chǎn)合同范例
- 農(nóng)機新機銷售合同范例
- 農(nóng)村無證蓋房合同范例
- 關于賣車合同范例
- 代理藥品銷售合同范例
- 醫(yī)院醫(yī)用耗材SPD服務項目投標方案
- 2025年保密知識試題庫附參考答案(精練)
- 全國普通高等學校2025屆高三第二次調(diào)研數(shù)學試卷含解析
- 南昌起義模板
- “互聯(lián)網(wǎng)+”大學生創(chuàng)新創(chuàng)業(yè)大賽計劃書一等獎
- 2024年10月高等教育自學考試13015計算機系統(tǒng)原理試題及答案
- GB/T 3324-2024木家具通用技術條件
- 2024秋期國家開放大學本科《古代小說戲曲專題》一平臺在線形考(形考任務4)試題及答案
- 血吸蟲病知識宣傳講座
- 詩經(jīng)的課件教學課件
- 人工智能講座模板
評論
0/150
提交評論