




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
2024年大數(shù)據(jù)智能辦公系統(tǒng)知識歷年考試高頻考點(diǎn)試題附帶答案(圖片大小可自由調(diào)整)第1卷一.參考題庫(共25題)1.DAG調(diào)度器會將結(jié)果以什么樣的形式傳給Task調(diào)度器()A、TaskSetB、TaskC、DAGD、Job2.flume中數(shù)據(jù)以Dstream的形式進(jìn)行傳輸3.Spark也可以不依賴于第三方的資源管理和調(diào)度器,它實現(xiàn)了()作為其內(nèi)置的資源管理和調(diào)度框架A、StandaloneB、YARNC、MesosD、redis4.類默認(rèn)是()級別的A、publicB、privateC、protectedD、以上都不是5.以下使用scala語言,定義一個List,其中語法不正確的是?()A、vallist=List(1,2,3)B、vallist=List[Int](1,2,3)C、vallist=List[String](‘a(chǎn)’,’b’,’c’)D、vallist=List[String]()6.rdd是由一系列的什么組成的()A、jobB、driverC、partitionD、worker7.以下選項組合后能夠執(zhí)行spark程序的是,換句話說spark程序計算結(jié)果必須包含哪幾個算子?()A、轉(zhuǎn)換算子,action算子B、轉(zhuǎn)換算子,控制算子C、轉(zhuǎn)換算子,tracform算子D、轉(zhuǎn)換算子8.以下選項中可以在spark中編寫sql的框架是()A、sparkcoreB、sparkstreamingC、mlbaseD、sparksql9.以下對于這些列表操作正確的是vart=List(1,2,3)vart2=t.:+("test")()A、返回結(jié)果為List("test",1,2,3)B、返回結(jié)果為List(1,2,3,"test")C、不同類型的元素不能進(jìn)行列表相加D、以上說法都不對10.flume中channel組件有什么作用()A、計算數(shù)據(jù)B、緩存數(shù)據(jù)C、輸出數(shù)據(jù)D、清理數(shù)據(jù)11.通過如下程序塊可以知道其輸出結(jié)果為varlist=List(1,2,99,4,100)varjs=list.reduceRight(_min_)println(js)()A、100B、1C、206D、以上答案都不對12.在linux中新增用戶的指令是哪個()A、useraddB、adduserC、usergroupD、groupadd13.flume中的基本存儲單元是?()A、agentB、eventC、sourceD、channel14.Spark生態(tài)系統(tǒng)已經(jīng)發(fā)展成為一個包含多個子項目的集合,其中包含SparkSQL、SparkStreaming、GraphX、MLlib等子項目15.以下屬于消息中間件的是哪些()A、ActiveMQB、RabbitMQC、KafkaD、Mysql16.在linux中文件權(quán)限有哪些字母構(gòu)成()A、xB、wC、rD、o17.flume中的agent包含四大組件分別為source、task、channel、sink18.最開始Flume組件是哪個公司開發(fā)的()A、ClouderaB、阿里巴巴C、京東D、google19.spark架構(gòu)中的persist算子在源碼中最多有()備份A、2B、3C、4D、120.spark基于客戶端模式運(yùn)行時,driver會隨機(jī)啟動21.flume的組件包括如下幾種?()A、sourceB、ChannelC、GridFSD、Sink22.以下語句的運(yùn)行結(jié)果為varj=2;vari=0;while(i<5){i+=2;j*=2};println(j)()A、4B、8C、16D、3223.下面輸出與其他不一致的是?()A、valw="World";println(s"Hello$w")B、valw="World";println("Hello$w")C、println("HelloWorld")D、valw="World";println("Hello"+w)24.一個application就是一個spark程序25.下面有關(guān)元組的說明那些正確?()A、元組是不同類型元素的集合B、元組中的下標(biāo)是從1開始C、元組中的下標(biāo)是從0開始D、通過productArity可以知道元組的個數(shù)productElement(下標(biāo))獲取元組的值第2卷一.參考題庫(共25題)1.SparkSQL的應(yīng)運(yùn)而生,它是將SparkSQL轉(zhuǎn)換成RDD,然后提交到集群執(zhí)行,執(zhí)行效率非???.spark中cache算子和persist算子的關(guān)系()A、_useDiskB、_useMemoryC、_useOffHeapD、_useDes3.以下單詞不可當(dāng)做變量名的是()A、varB、valC、forD、hello4.下面有關(guān)迭代器說法錯誤的是?()A、迭代器it的兩個基本操作是next和hasNextB、調(diào)用迭代器next()會返回迭代器的下一個元素,并且更新迭代器的狀態(tài)C、ScalaIterator(迭代器)不是一個集合,它是一種用于訪問集合的方法D、ScalaIterator(迭代器)是一個集合5.以下算子屬于執(zhí)行算子的是()A、mapB、foreachC、flatmapD、join6.以下哪些屬于動作算子()A、foreachB、reduceC、countD、map7.跟在類名后面的是主構(gòu)造器8.關(guān)于元組Tuple,哪種說法是錯誤的()A、元組的可以包含不同類型的元素B、元組是不可變的C、訪問元組第一個元素的方式為?pair._1D、元組最多只有2個元素9.下面那些屬于轉(zhuǎn)化算子?()A、unionB、distinctC、groupByKeyD、count10.分區(qū)是kafka消息隊列的最小單位11.interSection算子對源RDD和參數(shù)RDD求交集后返回一個新的RDD12.如果想正常啟動flume,需要給flume進(jìn)行哪些配置()A、配置sourceB、配置sinkC、配置channelD、將source、channel、sink連接起來13.flume中的sink組件是專門用來收集數(shù)據(jù)的14.sparkSql可以讀取json格式的數(shù)據(jù)15.以下選項中正確的是varlbiao=List(1,2,3,4,5)varjs=lbiao.foldRight(100)(_-_);println(js)()A、foldRight第一個參數(shù)為種子的初始值,計算過程會從右往左拿第一個數(shù)減去種子數(shù)得到的數(shù)據(jù),拿第二個數(shù)再減去剛才的合計值,依次類推B、foldRight與fold沒有區(qū)別C、foldRight表示數(shù)據(jù)從右往左進(jìn)行迭代按括號內(nèi)的邏輯進(jìn)行操作D、fold表示數(shù)據(jù)從左往右進(jìn)行迭代按括號內(nèi)的邏輯進(jìn)行操作,與foldRight是一個相反的過程16.mesos是一個()平臺A、資源調(diào)度平臺B、任務(wù)調(diào)度平臺C、發(fā)送系統(tǒng)D、以上都不是17.storm和?spark?streaming?最大的區(qū)別?()A、科學(xué)統(tǒng)計支持B、是否具有schemaC、是否是真正的實時計算框架D、不同公司的產(chǎn)品18.count算子返回RDD的元素個數(shù)19.SparkSQL是Spark用來處理結(jié)構(gòu)化數(shù)據(jù)的一個模塊,它提供了一個編程抽象叫做DataFrame并且作為分布式SQL查詢引擎的作用20.RDD中的所有轉(zhuǎn)換都是通過轉(zhuǎn)化算子延遲加載的,也就是說,它們并不會直接計算結(jié)果21.java中的continue的作用是跳出當(dāng)前循環(huán)22.spark中可以整合機(jī)器學(xué)習(xí)庫,并可以對外提供接口的框架是()A、sparkcoreB、sparkstreamingC、mlbaseD、sparksql23.下面選項中哪個是scala中所有類的父類()A、AnyB、AnyIntC、AnyRefD、AnyVal24.在大數(shù)據(jù)系統(tǒng)中的日志收集系統(tǒng)flume現(xiàn)在使用的版本是()A、OGB、NGC、MGD、BG25.scala中String類沒有插值器的概念第3卷一.參考題庫(共25題)1.SparkSQL有如下優(yōu)點(diǎn)()A、最基本也是最常用的單元B、都是通過new出來的C、其實例保存在spring容器中D、在spring技術(shù)中是基于組件的2.driver的特性的說法,哪些是正確的()A、driver只有一個創(chuàng)建連接的功能B、driver可以分發(fā)task任務(wù)C、driver可以對task任務(wù)的執(zhí)行情況進(jìn)行檢測D、driver可以回收task運(yùn)行的結(jié)果3.spark生態(tài)圈不能進(jìn)行實時計算4.下列關(guān)于kafka在進(jìn)行消費(fèi)數(shù)據(jù)消費(fèi)時候的敘述正確的是()A、消費(fèi)者主動拉取數(shù)據(jù)消費(fèi)B、kafka推送數(shù)據(jù)到消費(fèi)者進(jìn)行消費(fèi)C、kafka在進(jìn)行消費(fèi)數(shù)據(jù)的時候是延時的D、以上說法都不對5.flume在大數(shù)據(jù)架構(gòu)中的作用是()A、監(jiān)測收集數(shù)據(jù)B、處理數(shù)據(jù)C、計算數(shù)據(jù)D、存儲數(shù)據(jù)6.scala中,關(guān)于類和函數(shù),以下說法錯誤是()A、scala中,可以在類中定義類。B、scala中,可以在函數(shù)中定義函數(shù)。C、scala中,不可以在類中定義objectD、scala中,可以在函數(shù)中定義類7.使用scala語言編寫的源程序時的文件擴(kuò)展名是:(.scala)8.下列關(guān)于for循環(huán)的語句,正確的是()A、for(i<-1.to(10)){println(i)}B、for(i<-1to10){println(i)}C、for(i<-1until10){println(i)}D、for(i<-1unit10){println(i)}9.scala和java一樣,在for循環(huán)中都可以使用continue關(guān)鍵字10.安裝Hbase的壓縮包,使用的Linux命令是()A、tar?-zxvfB、tar?-zxC、tar?-sD、tar?-nf11.內(nèi)存計算下,Spark?比?Hadoop?快10倍12.spark內(nèi)部集成的standalone功能為()A、任務(wù)調(diào)度框架B、任務(wù)模式C、資源調(diào)度框架D、任務(wù)整合13.saveAsSequenceFile動作算子將數(shù)據(jù)集中的元素以Hadoopsequencefile的格式保存到指定的目錄下,可以使HDFS或者其他Hadoop支持的文件系統(tǒng)14.scala中,類成員的缺省訪問級別是()A、publicB、privateC、protectD、以上都不是15.storm系統(tǒng)和spark?streaming系統(tǒng)最大的區(qū)別是哪個?(?)()A、科學(xué)統(tǒng)計支持B、是否具有schemaC、是否是真正的實時計算框架D、不同公司的產(chǎn)品16.高階函數(shù)是指?()A、在程序中應(yīng)該首先被定義的函數(shù)。B、將函數(shù)作為參數(shù),并返回結(jié)果為函數(shù)的函數(shù)。C、函數(shù)參數(shù)為函數(shù)或返回結(jié)果為函數(shù)的函數(shù)。D、執(zhí)行時間長的函數(shù)。17.spark架構(gòu)中的的cache算子想要正常使用,必須使用action算子觸發(fā)執(zhí)行18.yarn是一個資源調(diào)度平臺19.SortedMap為Map的子類,其中有排序的特點(diǎn)20.以下關(guān)于特征的說法正確的是()A、類可以實現(xiàn)任意數(shù)量的特質(zhì)B、特質(zhì)可以要求實現(xiàn)它們的類具備特定的字段、方法或超類C、與Java接口(Interface)相同,Scala特質(zhì)也可以提供方法和字段的實現(xiàn)D、當(dāng)將多個特質(zhì)疊加在一起時,順序很重要——其方法先被執(zhí)行的特質(zhì)排在更后面21.下列語句中能夠輸出1-30之內(nèi)所有奇數(shù)的是()A、vari=1;while(i<=30){if(i%2==1){println(i)}}B、vari=1;while(i<=30){if(i/2==1){println(i)}}C、for(i<-1to30){if(i%2==1)println(i)}D、for(i<-1to30){if(i/2==1)println(i)}22.當(dāng)我們在scala語言中書寫for循環(huán)塊用到的關(guān)鍵字to與until說法正確的是()A、to:左閉右閉循環(huán)體中包括左邊與右邊的數(shù)值B、until:左閉右開循環(huán)體中包括左邊的數(shù)值,不包括右邊的數(shù)值C、until和to的不同之處在于不包括最后一個元素。D、to與until用法一致,包括循環(huán)次數(shù)也一樣23.Linux中重啟系統(tǒng)的指令有哪些()A、rebootB、haltC、shutdown-rD、shutdown-h24.提供一個列表,要對其所有元素全部加2得到一個新的列表,下面那些選項正確vart=List(1,8,3,5,5)()A、t.map(x=>{x+2})B、t.map(_+2)C、其中A選項是通過一個匿名函數(shù)進(jìn)行操作,B選項是通過更加簡寫的通配符+2表示所有元素進(jìn)行加2處理,所以都正確D、以上做法都不對25.什么是日志收集系統(tǒng)flume的基本存儲單元?()A、agentB、eventC、sourceD、channel第1卷參考答案一.參考題庫1.參考答案:A2.參考答案:錯誤3.參考答案:A4.參考答案:A5.參考答案:C6.參考答案:C7.參考答案:A8.參考答案:D9.參考答案:B10.參考答案:B11.參考答案:B12.參考答案:A,B13.參考答案:B14.參考答案:正確15.參考答案:A,B,C16.參考答案:A,B,C17.參考答案:錯誤18.參考答案
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 化工項目建設(shè)合同范本
- 0物業(yè)合同范本
- 廠家和平臺合同范本
- 吊車交易合同范例
- 吹塑加工采購合同范例
- 單位貨車出售合同范本
- 農(nóng)村公墓建設(shè)合同范本
- 信貸擔(dān)保合同范本
- 吊裝安裝服務(wù)合同范本
- 個人投資股票借款合同范本
- 2022云南省中考道法真題試卷和答案
- 跨文化商務(wù)交際導(dǎo)論-教學(xué)課件Unit 3 Cultural patterns
- 成語故事-引狼入室
- 勞務(wù)經(jīng)濟(jì)人培訓(xùn)課件
- 漢字真有趣教學(xué)設(shè)計
- 綠色金融案例分析實證分析報告
- 【屋頂花園的防水設(shè)計與施工探究6500字(論文)】
- 自導(dǎo)式教學(xué)心得體會范文【3篇】
- 防范游戲充值詐騙保護(hù)個人游戲賬號安全
- 數(shù)學(xué)與體育融合課程設(shè)計
- 七年級英語閱讀理解專項訓(xùn)練(含答案)共20篇
評論
0/150
提交評論