版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
大數(shù)據(jù)平臺(tái)搭建與配置管理第11頁(yè)共11頁(yè)《大數(shù)據(jù)平臺(tái)搭建與配置管理》期中試題期中試題(閉卷B)題號(hào)一二三四五六七八九十成績(jī)滿分30202030100得分【本套試卷共有4大題,計(jì)66小題】一、選擇題(20題,每題1.5分,共30分)1、欲把當(dāng)前目錄下的file1.txt復(fù)制為file2.txt,以下正確的命令是()。A.copyfile1.txtfile2.txtB.cpfile1.txt|file2.txtC.catfile2.txtfile1.txtD.catfile1.txt>file2.txt2、下面哪個(gè)命令可以用來(lái)切換使用者的身份()。A.passwdB.logC.whoD.su3、以下哪個(gè)不是HDFS的守護(hù)進(jìn)程()。A.datanodeB.namenodeC.secondarynamenodeD.mrappmaster/yarnchild4、Hadoop-2.6.5集群中的HDFS的默認(rèn)的數(shù)據(jù)塊的大小是()。A.32MBB.64MBC.128MBD.256MB5、HDFS集群中的namenode職責(zé)不包括()。A.維護(hù)HDFS集群的目錄樹(shù)結(jié)構(gòu)B.維護(hù)HDFS集群的所有數(shù)據(jù)塊的分布、副本數(shù)和負(fù)載均衡C.負(fù)責(zé)保存客戶端上傳的數(shù)據(jù)D.響應(yīng)客戶端的所有讀寫(xiě)數(shù)據(jù)請(qǐng)求6、下列關(guān)于HDFS的描述正確的是()。A.如果NameNode宕機(jī),SecondaryNameNode會(huì)接替它使集群繼續(xù)工作B.HDFS集群支持?jǐn)?shù)據(jù)的隨機(jī)讀寫(xiě)C.NameNode磁盤(pán)元數(shù)據(jù)不保存Block的位置信息D.DataNode通過(guò)長(zhǎng)連接與NameNode保持通信7、MapReduce是()上的并行計(jì)算。A.運(yùn)行于大規(guī)模集群B.運(yùn)行于磁盤(pán)C.運(yùn)行于小規(guī)模集群D.運(yùn)行在復(fù)雜的系統(tǒng)中8、MapReduce框架會(huì)將Map程序就近地在()數(shù)據(jù)所在的節(jié)點(diǎn)運(yùn)行。A.HDFSB.SparkC.MapReduceD.Zookeeper9、MapReduce為了保證任務(wù)的正常執(zhí)行,采用()等多種容錯(cuò)機(jī)制。A.重復(fù)執(zhí)行B.重新開(kāi)始整個(gè)任務(wù)C.直接丟棄執(zhí)行效率低的作業(yè)D.以上都是10、ZooKeeper是集群的(),監(jiān)視著集群中各個(gè)節(jié)點(diǎn)的狀態(tài)根據(jù)節(jié)點(diǎn)提交的反饋進(jìn)行下一步合理操作。A.領(lǐng)導(dǎo)者B.執(zhí)行者C.管理者D.以上都不是11、ZK提供了一定的()可以用來(lái)獲取一個(gè)順序增長(zhǎng)的,可以在集群環(huán)境下使用的ID。A.函數(shù)B.接口C.方法D.類12、名稱空間由()組成。A.磁盤(pán)寄存器B.表C.內(nèi)存寄存器D.數(shù)據(jù)寄存器13、hive數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù),不可能的來(lái)源有哪些?()A.Mysql或Oracle數(shù)據(jù)庫(kù)B.行為數(shù)據(jù)C.業(yè)務(wù)數(shù)據(jù)系統(tǒng)D.娛樂(lè)資料14、解壓.tar.gz結(jié)尾的HBase壓縮包使用的Linux命令是什么?()A.tar-vfB.tarC.tar-zxD.tar-zxvf15、下以下數(shù)據(jù)第三列,應(yīng)該用哪種數(shù)據(jù)類型存儲(chǔ):1,zhangsan,[90,79.88]。()A.mapB.intC.arrayD.struct16、查詢速度的提升是以額外的()為代價(jià)的。A.創(chuàng)建索引B.創(chuàng)建索引和存儲(chǔ)索引C.刪除索引D.存儲(chǔ)索引17、當(dāng)客戶端發(fā)起一個(gè)Put請(qǐng)求時(shí),首先它從()表中查出該P(yáng)ut數(shù)據(jù)。A.hbase:metaB.hbase:valueC.-ROOT-D.hbase:key18、HBase構(gòu)建二級(jí)索引的實(shí)現(xiàn)方式有哪些?()A.MapReduceB.HiveC.BloomFilterD.Filter19、Storm將()組成的網(wǎng)絡(luò)抽象成Topology。A.Spouts和BoltsB.字段C.GFSD.Tuple20、Storm運(yùn)行在分布式集群中,其運(yùn)行任務(wù)的方式與()類似。A.HDFSB.HBaseC.HadoopD.Zookeeper二、填空題(20題,每題1分,共10分)21、鏈接分為:。22、JDK下解釋執(zhí)行Java的程序是。23、是客戶端需要執(zhí)行的一個(gè)工作單元。24、HDFS在設(shè)計(jì)上采取了多種機(jī)制保證在硬件出錯(cuò)的環(huán)境中實(shí)現(xiàn)數(shù)據(jù)的。25、HDFS不適合用在的應(yīng)用場(chǎng)合。26、HDFS集群中只有唯一一個(gè)名稱節(jié)點(diǎn),該節(jié)點(diǎn)負(fù)責(zé)所有的。27、Map的輸出結(jié)果首先被寫(xiě)入。28、磁盤(pán)包含機(jī)械部件,它是通過(guò)和來(lái)尋址定位數(shù)據(jù)。29、Shuffle優(yōu)化的原則是給Shuffle過(guò)程盡可能多的。30、ZooKeeper允許分布式進(jìn)程通過(guò)共享的相互協(xié)調(diào)。31、分布式應(yīng)用正在運(yùn)行的一組系統(tǒng)稱為。32、ZooKeeper類通過(guò)其構(gòu)造函數(shù)提供功能。33、Hive中創(chuàng)建的目的就是在查詢一個(gè)表中某列值時(shí)提升速度。34、使用命令可以創(chuàng)建一個(gè)指定名字的表。35、WHERE子句是一個(gè)。36、HBase主要用來(lái)存儲(chǔ)和的松散數(shù)據(jù)。37、在HBase中執(zhí)行操作時(shí),并不會(huì)刪除數(shù)據(jù)舊的版本。38、服務(wù)器負(fù)責(zé)存儲(chǔ)和維護(hù)分配給自己的。39、Storm可以用來(lái)實(shí)時(shí)處理新數(shù)據(jù)和。40、Topology中每一個(gè)計(jì)算組件都有一個(gè)執(zhí)行度。三、判斷題,正確填“T”,錯(cuò)誤填“F”(20題,每題1分,共20分)41、Hive本地模式和遠(yuǎn)程模式,最關(guān)鍵的差別是存儲(chǔ)元數(shù)據(jù)的mysql數(shù)據(jù)庫(kù)的安裝位置是在本地還是在遠(yuǎn)端。()42、Hive數(shù)據(jù)類型中date類型是與時(shí)區(qū)無(wú)關(guān)的類型。()43、Hive數(shù)據(jù)類型中,Timestamp類型是與時(shí)區(qū)無(wú)關(guān)的類型。()44、Hive中的表,對(duì)應(yīng)hdfs中文件的目錄。()45、外部表和內(nèi)部表的差別,只是需要添加External關(guān)鍵詞就可以了。()46、刪除外部表,只會(huì)刪除外部表的元數(shù)據(jù)信息,并不會(huì)將外部表的數(shù)據(jù)刪除。()47、刪除外部表,會(huì)同時(shí)刪除外部表的數(shù)據(jù)和元數(shù)據(jù)。()48、在Hive中,執(zhí)行分桶操作,具體哪個(gè)值,分到哪個(gè)桶中,可以通過(guò)對(duì)數(shù)據(jù)進(jìn)行Hash運(yùn)算取得。()49、HBase是一套高性能的分布式數(shù)據(jù)集群,必須在大型機(jī)或者高性能的服務(wù)器上進(jìn)行搭建。()50、HBase是Apache的Hadoop項(xiàng)目的子項(xiàng)目,利用HadoopHDFS作為其文件存儲(chǔ)系統(tǒng),適合于非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)。()51、MapReduce程序可以直接讀取HBase內(nèi)存儲(chǔ)的數(shù)據(jù)內(nèi)容。()52、HBase系統(tǒng)適合進(jìn)行多表聯(lián)合查詢以及復(fù)雜性讀寫(xiě)操作。()53、Hadoop是IBM公司開(kāi)發(fā)的一款商用大數(shù)據(jù)軟件。()54、Hadoop是一個(gè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架,能夠處理PB級(jí)數(shù)據(jù)。()55、Hadoop存儲(chǔ)系統(tǒng)HDFS的文件是分塊存儲(chǔ),每個(gè)文件塊默認(rèn)大小為32MB。()56、HDFS系統(tǒng)為了容錯(cuò)保證數(shù)據(jù)塊完整性,每一塊數(shù)據(jù)都采用2份副本。()57、HDFS系統(tǒng)采用NameNode定期向DataNode發(fā)送心跳消息,用于檢測(cè)系統(tǒng)是否正常運(yùn)行。()58、用戶可以通過(guò)”hadoopfs–put”命令獲取遠(yuǎn)端文件數(shù)據(jù)。()59、Nagios不可以監(jiān)控Hadoop集群,因?yàn)樗惶峁〩adoop支持()。60、Ganglia不僅可以進(jìn)行監(jiān)控,也可以進(jìn)行報(bào)警()。四、簡(jiǎn)答題(6題,每題5分,共30分)61、試論述實(shí)現(xiàn)矩陣向量乘法與矩陣乘法采用不同MapReduce策略的原因。62、試論述HBase的三層結(jié)構(gòu)中各層次的名稱和作用。答:63、Storm集群中的Master節(jié)點(diǎn)和Work節(jié)點(diǎn)各自運(yùn)行什么后臺(tái)進(jìn)程?這些進(jìn)程又分別負(fù)責(zé)什么工作?答:64、試論述Storm框架的工作流程。答:65、試論述Hadoop和谷歌的mapreduce、gfs等技術(shù)之間的關(guān)系。答:66、試論述Hadoop在各個(gè)領(lǐng)域的應(yīng)用情況。答:《大數(shù)據(jù)平臺(tái)搭建與配置管理》期中標(biāo)答期中標(biāo)答B(yǎng)(閉卷)題號(hào)一二三四五六七八九十成績(jī)滿分30202030100得分一、選擇題(20題,每題1.5分,共30分)1-5:DDDCD 6-10:CAAAC11-15:BDDDC16-20:BAAAC二、填空題(20題,每題1分,共20分)21、軟鏈接和硬鏈接 22、java.exe23、job24、完整性25、低延遲26、元數(shù)據(jù)的管理27、緩存28、磁頭移動(dòng)盤(pán)片的轉(zhuǎn)動(dòng)29、內(nèi)存30、分層命名空間31、集群32、connect33、索引34、CREATETABLE35、邏輯表達(dá)式36、非結(jié)構(gòu)化半結(jié)構(gòu)化37、更新38、RegionRegion39、更新數(shù)據(jù)庫(kù)40、并行三、判斷題(20題,每題1分,共20分)41-45:FFTTF46-50:TFTFT51-55:TFFTF56-60:FFFFT四、簡(jiǎn)答題(6題,每題5分,共60分)61、答:矩陣向量乘法:Map函數(shù):每個(gè)Map任務(wù)將整個(gè)向量V和矩陣M的一個(gè)文件塊作為輸入。對(duì)每個(gè)元素Mij,Map任務(wù)會(huì)產(chǎn)生鍵值對(duì)。Reduce函數(shù):Reduce任務(wù)將所有與給定鍵i關(guān)聯(lián)的值相加即可得到<i,xi>。矩陣乘法:1.自然連接:Map函數(shù):對(duì)每個(gè)矩陣元素My產(chǎn)生一個(gè)鍵值對(duì),對(duì)每個(gè)矩陣元素Njk產(chǎn)生一個(gè)鍵值對(duì)。Reduce函數(shù):對(duì)每個(gè)相同鍵j,輸出所有滿足形式<j,<i,k,mijnjk>>的元組。62、答:63、答:Storm采用“Master-Worker”的節(jié)點(diǎn)方式:Master節(jié)點(diǎn)運(yùn)行名為“Nimbus”的后臺(tái)程序,負(fù)責(zé)在集群范圍內(nèi)分發(fā)代碼、為Work
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023年浸漬、涂布或包覆處理紡織物項(xiàng)目融資計(jì)劃書(shū)
- 《法語(yǔ)學(xué)習(xí)課件》課件
- 《社會(huì)體育指導(dǎo)學(xué)》課件
- 養(yǎng)老院老人興趣小組活動(dòng)制度
- 養(yǎng)老院老人康復(fù)理療師培訓(xùn)制度
- 《g無(wú)線基礎(chǔ)知識(shí)》課件
- 國(guó)際經(jīng)濟(jì)與貿(mào)易課件
- 房屋租賃防火合同
- 2024年度綠色建筑節(jié)能改造示范項(xiàng)目土建施工分包合同2篇
- 2024年汽車(chē)銷售應(yīng)收賬款質(zhì)押擔(dān)保與市場(chǎng)拓展合作合同3篇
- 2024-2025學(xué)年語(yǔ)文二年級(jí)上冊(cè) 部編版期末測(cè)試卷 (含答案)
- 單位信息安全保障制度及管理辦法例文(3篇)
- 《傳媒文化發(fā)展》課件
- 2024版版權(quán)許可合同協(xié)議音樂(lè)作品授權(quán)3篇
- 資金托盤(pán)業(yè)務(wù)協(xié)議
- 電動(dòng)葫蘆安全事故應(yīng)急救援措施及預(yù)案模版(3篇)
- 湘豫名校聯(lián)考2024年11月高三一輪復(fù)習(xí)診斷 語(yǔ)文試卷(含答案)
- 消防水帶使用培訓(xùn)
- DB11T 2078-2023 建筑垃圾消納處置場(chǎng)所設(shè)置運(yùn)行規(guī)范
- 滑坡治理工程監(jiān)測(cè)實(shí)施方案
- 大學(xué)生創(chuàng)新創(chuàng)業(yè)基礎(chǔ)(創(chuàng)新創(chuàng)業(yè)課程)完整全套教學(xué)課件
評(píng)論
0/150
提交評(píng)論