大數(shù)據(jù)技術(shù)原理與應(yīng)用_第1頁
大數(shù)據(jù)技術(shù)原理與應(yīng)用_第2頁
大數(shù)據(jù)技術(shù)原理與應(yīng)用_第3頁
大數(shù)據(jù)技術(shù)原理與應(yīng)用_第4頁
大數(shù)據(jù)技術(shù)原理與應(yīng)用_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

大數(shù)據(jù)技術(shù)原理與應(yīng)用1.數(shù)據(jù)產(chǎn)生方式的變革主要經(jīng)歷了三個階段,以下哪個不屬于這三個階段:1.數(shù)據(jù)產(chǎn)生方式的變革主要經(jīng)歷了三個階段,以下哪個不屬于這三個階段:()[單選題]*A.數(shù)據(jù)流階段(正確答案)B.運(yùn)營式系統(tǒng)階段C.用戶原創(chuàng)內(nèi)容階段D.感知式系統(tǒng)階段2.2單選(2分)第三次信息化浪潮的發(fā)生標(biāo)志是以下哪種技術(shù)的普及()[單選題]*A.物聯(lián)網(wǎng)、云計算和大數(shù)據(jù)(正確答案)B.CPUC.個人計算機(jī)D.互聯(lián)網(wǎng)3.3單選(2分)1TB=()MB()[單選題]*A.2^20(備注:2的20次方)(正確答案)B.1024C.1000D.2^10(備注:2的10次方)4.4單選(2分)Hadoop的兩大核心是和()[單選題]*A.HDFS;HBaseB.MapReduce;HBaseC.GFS;MapReduceD.HDFS;MapReduce(正確答案)5.5單選(2分)HDFS默認(rèn)的一個塊大小是()[單選題]*A.32KBB.8KBC.64MB(正確答案)D.16KB6.6單選(2分)在分布式文件系統(tǒng)HDFS中,負(fù)責(zé)數(shù)據(jù)的存儲和讀取()[單選題]*A.數(shù)據(jù)節(jié)點(diǎn)(正確答案)B.名稱節(jié)點(diǎn)C.主節(jié)點(diǎn)D.第二名稱節(jié)點(diǎn)7.7單選(2分)上傳當(dāng)前目錄下的本地文件file.txt到分布式文件系統(tǒng)HDFS的“/path”目錄下的Shell命令是()[單選題]*A.hdfsfs-putfile.txt/pathB.hdfsdfs-putfile.txt/path(正確答案)C.hadoopdfs-put/pathfile.txtD.hdfsdfs-put/pathfile.txt8.8單選(2分)在HDFS根目錄下創(chuàng)建一個文件夾/test,且/test文件夾內(nèi)還包含一個文件夾dir,正確的shell命令是()[單選題]*A.hadoopdfs-mkdir/test/dirB.hadoopfs-mkdir-p/test/dir(正確答案)C.hdfsfs-mkdir-p/test/dirD.hdfsdfs*mkdir-p/test/dir9.9單選(2分)下列有關(guān)HBase的說法正確的是()[單選題]*A.HBase是針對谷歌BigTable的開源實(shí)現(xiàn),是高可靠、高性能的圖數(shù)據(jù)庫B.在向數(shù)據(jù)庫中插入記錄時,HBase和關(guān)系數(shù)據(jù)庫一樣,每次都是以“行”為單位把整條記錄插入數(shù)據(jù)庫C.HBase數(shù)據(jù)庫表可以設(shè)置該表任意列作為索引D.HBase是一種NoSQL數(shù)據(jù)庫(正確答案)10.10單選(2分)已知一張表student存儲在HBase中,向表中插入一條記錄{id:2015001,name:Mary{score:math}:88},其id作為行鍵,其中,在插入數(shù)學(xué)成績88分時,正確的命令是()[單選題]*A.put‘student’,‘score:math’,‘88’B.put‘student’,‘2015001’,‘score:math’,'88’(正確答案)C.put‘student’,‘2015001’,‘88’D.put‘student’,‘2015001’,‘math’,‘88’11.11單選(2分)NoSQL數(shù)據(jù)庫的三大理論基石不包括()[單選題]*A.ACID(正確答案)B.CAPC.最終一致性D.BASE12.12單選(2分)在設(shè)計詞頻統(tǒng)計的MapReduce程序時,對于文本行“hellobigdatahellohadoop”,經(jīng)過map函數(shù)處理后直接輸出的結(jié)果應(yīng)該是(沒有發(fā)生combine和merge操作)()[單選題]*A.B.C.D.(正確答案)13.13單選(2分)假設(shè)已經(jīng)配置好PATH環(huán)境變量,啟動hadoop的命令是()[單選題]*A.start-hadoop.shB.start-hdfs.shC.start-fs.shD.start-dfs.sh(正確答案)14.14單選(2分)下列說法錯誤的是()[單選題]*A.HDFSHA可以解決單點(diǎn)故障問題B.HDFSFederation使得HDFS的命名服務(wù)能夠水平擴(kuò)展C.第二名稱節(jié)點(diǎn)無法解決單點(diǎn)故障問題D.第二名稱節(jié)點(diǎn)是熱備份,而HDFSHA不是熱備份(正確答案)15.15單選(2分)RDD操作包括轉(zhuǎn)換(Transformation)和動作(Action)兩種類型,下列RDD操作屬于動作(Action)類型的是()[單選題]*A.mapB.joinC.groupByD.collect(正確答案)16.16單選(2分)下列關(guān)于Hive的說法正確的是()[單選題]*A.Hive不支持索引B.Hive支持批量導(dǎo)入(正確答案)C.Hive的可擴(kuò)展性差D.Hive支持頻繁數(shù)據(jù)更新17.17多選(3分)大數(shù)據(jù)的特點(diǎn)包括()*A.數(shù)據(jù)種類繁多(正確答案)B.價值密度低(正確答案)C.處理速度快(正確答案)D.數(shù)據(jù)量大(正確答案)18.18多選(3分)下列適用于批處理計算的框架有哪些()*A.MapReduce(正確答案)B.PregelC.StormD.Spark(正確答案)19.19多選(3分)下列適用于流計算的框架有哪些()*A.SparkStreaming(正確答案)B.DremelC.PregelD.Storm(正確答案)20.20多選(3分)下列適用于圖計算的框架有哪些()*A.Hama(正確答案)B.GraphX(正確答案)C.Pregel(正確答案)D.Impala21.21多選(3分)從技術(shù)架構(gòu)上來看,物聯(lián)網(wǎng)可以分為哪幾層()*A.網(wǎng)絡(luò)層(正確答案)B.應(yīng)用層(正確答案)C.處理層(正確答案)D.感知層(正確答案)22.22多選(3分)HBase需要根據(jù)哪些屬性來唯一地確定一個單元格(cell)中的某個版本數(shù)據(jù)()*A.列限定符(正確答案)B.行鍵(正確答案)C.時間戳(正確答案)D.列族(正確答案)23.23多選(3分)典型的NoSQL數(shù)據(jù)庫的類型包括()*A.鍵值數(shù)據(jù)庫(正確答案)B.列族數(shù)據(jù)庫(正確答案)C.文檔數(shù)據(jù)庫(正確答案)D.圖數(shù)據(jù)庫(正確答案)24.24多選(3分)CAP是指()*A.持久性B.一致性(正確答案)C.可用性(正確答案)D.分區(qū)容忍性(正確答案)25.25多選(3分)云計算主要包括哪3種類型()*A.SaaS(正確答案)B.PaaS(正確答案)C.CaaSD.IaaS(正確答案)26.26多選(3分)以下屬于流計算的應(yīng)用有哪些()*A.購物網(wǎng)站的廣告推薦(正確答案)B.根據(jù)過去一年購物記錄判斷用戶的消費(fèi)能力C.數(shù)據(jù)倉庫數(shù)據(jù)批處理分析D.實(shí)時交通路線推薦(正確答案)27.27多選(3分)下列關(guān)于圖計算說法正確的是()*A.傳統(tǒng)的圖計算框架通常表現(xiàn)出比較好的內(nèi)存訪問局部性B.當(dāng)多個頂點(diǎn)的操作請求發(fā)生沖突時,Pregel采用局部有序和Handler來解決沖突(正確答案)C.Pregel是一種基于BSP模型實(shí)現(xiàn)的并行圖處理系統(tǒng)(正確答案)D.在每個超步中,每個頂點(diǎn)會根據(jù)其接收消息的最大值和自身值比較,來確定自己狀態(tài)作何種改變。(正確答案)28.28多選(3分)下列哪些是圖計算框架Pregel的應(yīng)用()*A.PageRank(正確答案)B.單源最短路徑(正確答案)C.二分匹配(正確答案)D.流數(shù)據(jù)處理29.29多選(3分)關(guān)于Spark的特性說法正確的是()*A.Spark基于DAG的任務(wù)調(diào)度執(zhí)行機(jī)制,要優(yōu)于HadoopMapReduce的迭代執(zhí)行機(jī)制(正確答案)B.Spark的計算模式也屬于MapReduce,但編程模型比HadoopMapReduce更靈活(正確答案)C.Scala是Spark的主要編程語言,但Spark還支持Java、Python、R作為編程語言(正確答案)D.Spark提供了內(nèi)存計算,可將中間結(jié)果放到內(nèi)存中,對于迭代運(yùn)算效率更高(正確答案)30.30多選(3分)BASE的基本含義是()*A.基本可用(正確答案)B.軟狀態(tài)(正確答案)C.持續(xù)性D.最終一致性(正確答案)31.31判斷(2分)Hadoop是Apache軟件基金會旗下的一個開源分布式計算平臺,是基于Java語言開發(fā)的,具有很好的跨平臺特性。[判斷題]*對(正確答案)錯32.32判斷(2分)HDFS分布式文件系統(tǒng),是谷歌文件系統(tǒng)GFS的開源實(shí)現(xiàn),而HadoopMapReduce也是針對谷歌MapReduce的開源實(shí)現(xiàn)。[判斷題]*對(正確答案)錯33.33判斷(2分)在分布式文件系統(tǒng)HDFS中,名稱節(jié)點(diǎn)負(fù)責(zé)管理HDFS的元數(shù)據(jù),這些元數(shù)據(jù)被保存在磁盤中。[判斷題]*對錯(正確答案)34.34判斷(2分)HDFS可以高效存儲大量的小文件。[判斷題]*對錯(正確答案)35.35判斷(2分)FsImage用于維護(hù)文件系統(tǒng)樹以及文件樹中所有的文件和文件夾的元數(shù)據(jù)。[判斷題]*對(正確答案)錯36.36判斷(2分)第二名稱節(jié)點(diǎn)(SecondaryNameNode)是HDFS架構(gòu)中的一個組成部分,它是用來保存名稱節(jié)點(diǎn)中對HDFS元數(shù)據(jù)信息的備份,并減少名稱節(jié)點(diǎn)重啟的時間。[判斷題]*對(正確答案)錯37.37判斷(2分)HDFS采用了主從(Master/Slave)架構(gòu)模型,一個HDFS集群包括一個名稱節(jié)點(diǎn)和若干個數(shù)據(jù)節(jié)點(diǎn)。[判斷題]*對(正確答案)錯38.38判斷(2分)NoSQL數(shù)據(jù)庫的數(shù)據(jù)庫模式靈活,可擴(kuò)展性好,同時,所有NoSQL數(shù)據(jù)庫都支持事務(wù)的ACID四性。[判斷題]*對錯(正確答案)39.39判斷(2分)傳統(tǒng)的關(guān)系數(shù)據(jù)庫和NoSQL數(shù)據(jù)庫各有所長,不存在一方完全取代另一方的問題,在很長的一段時期內(nèi),二者都會共同存在,滿足不同應(yīng)用的差異化需求。[判斷題]*對(正確答案)錯40.40判斷(2分)MongoDB是一種圖數(shù)據(jù)庫,由C++語言編寫的,其數(shù)據(jù)類型類似于JSON對象。[判斷題]*對錯(正確

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論