大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷68)_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷68)_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷68)_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷68)_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷68)_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷68)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:單項(xiàng)選擇題,共54題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.根據(jù)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》(國發(fā)〔2015〕50號(hào)),大數(shù)據(jù)對(duì)推動(dòng)經(jīng)濟(jì)的重要意義不包括()。A)大數(shù)據(jù)成為推動(dòng)經(jīng)濟(jì)轉(zhuǎn)型發(fā)展的新動(dòng)力B)大數(shù)據(jù)成為重塑國家競(jìng)爭(zhēng)優(yōu)勢(shì)的新機(jī)遇C)大數(shù)據(jù)成為企業(yè)轉(zhuǎn)型升級(jí)的新常態(tài)D)大數(shù)據(jù)成為提升政府治理能力的新途徑答案:C解析:[單選題]2.下面哪個(gè)協(xié)議用于Datanode和Namenode之間的通信()A)DatanodeProtocolB)NamenodeProcotolC)ClientProtocolD)ClientDatanodeProtocol答案:A解析:A、DatanodeProtocol【DataNode與NameNode通信的信息接口】B、NamenodeProcotol【SecondaryNamenode與NameNode通信】C、ClientProtocol【表示安裝在客戶端實(shí)例上的網(wǎng)絡(luò)協(xié)議】D、ClientDatanodeProtocol【用戶進(jìn)程(包括客戶端進(jìn)程與Datanode進(jìn)程)與Namenode進(jìn)程之間進(jìn)行通信所使用的協(xié)議】[單選題]3.下列關(guān)于MaxCompute的描述中,錯(cuò)誤的是:()。A)一種快速、完全托管的TB/PB級(jí)數(shù)據(jù)倉庫解決方案B)向用戶提供了完善的數(shù)據(jù)導(dǎo)入方案C)多種經(jīng)典的分布式計(jì)算模型,能夠更t央速的解決用戶海量數(shù)據(jù)計(jì)算問題D)提供了完善的SQL訪問,有效支持事務(wù)答案:D解析:[單選題]4.在源和通道之間可以插入一個(gè)或多個(gè)(),來動(dòng)態(tài)檢查和修改Flume事件。A)Flume通道選擇器B)Flume接收器C)Flume攔截器D)Flume事件答案:C解析:[單選題]5.Zookeeper維護(hù)著一個(gè)()的層次結(jié)構(gòu)。A)鏈型B)網(wǎng)格型C)樹形D)隊(duì)列行答案:C解析:[單選題]6.SEQUENCEFILE是HadoopAPI提供的一種()進(jìn)制文件支持,其具有使用方便、可分割、可壓縮的特點(diǎn)A)二B)八C)十D)十六答案:A解析:[單選題]7.在同一個(gè)問題中,錯(cuò)誤率和精度的關(guān)系是(__)。A)錯(cuò)誤率等于精度值加1B)錯(cuò)誤率加精度等于1C)精度減錯(cuò)誤率等于1D)兩者之間沒有關(guān)系答案:B解析:[單選題]8.下列語句描述錯(cuò)誤的是()A)可以通過CLI方式、JavaAPI方式調(diào)用SqoopB)Sqoop底層會(huì)將Sqoop命令轉(zhuǎn)換為MapReduce任務(wù),并通過Sqoop連接器進(jìn)行數(shù)據(jù)的導(dǎo)入導(dǎo)出操作。C)Sqoop是獨(dú)立的數(shù)據(jù)遷移工具,可以在任何系統(tǒng)上執(zhí)行。D)如果在Hadoop分布式集群環(huán)境下,連接MySQL服務(wù)器參數(shù)不能是localhost或127.0.0.1。答案:C解析:[單選題]9.(__)在訓(xùn)練的每一輪都要檢查當(dāng)前生成的基學(xué)習(xí)器是否滿足基本條件。A)支持向量機(jī)B)Boosting算法C)貝葉斯分類器D)神經(jīng)網(wǎng)絡(luò)答案:B解析:[單選題]10.決策樹的基本流程遵循()的策略。A)貪心B)最優(yōu)化C)分而治之D)順序答案:C解析:[單選題]11.在HDFS中依賴于哪個(gè)組件來完成兩個(gè)NameNode之間的主備選舉?A)JournalNodeB)SecondNameNodeC)ZooKeeperD)DataNode答案:C解析:[單選題]12.銳化(高通)濾波器的作用()。A)能消減或削弱傅里葉空間的低頻分量,但不影響高頻分量B)能消減或削弱傅里葉空間的高頻分量,但不影響低頻分量C)對(duì)傅里葉空間的低、高頻分量均有削弱或消除作用D)對(duì)傅里葉空間的低、高頻分量均有增強(qiáng)作用答案:A解析:高通濾波與低通濾波正好相反,是頻域圖像的高頻部分通過而抑制低頻部分。在圖像中圖像的邊緣對(duì)應(yīng)高頻分量,因此高通濾波的效果是圖像銳化。[單選題]13.HBase架構(gòu)的四大組件中,()包含訪問HBase的接口。A)ZookeeperB)MasterC)RegionServerD)Client答案:D解析:[單選題]14.HFile數(shù)據(jù)格式中的KeyValue數(shù)據(jù)格式中Value部分是()。A)擁有復(fù)雜結(jié)構(gòu)的字符串B)字符串C)二進(jìn)制數(shù)據(jù)D)壓縮數(shù)據(jù)答案:C解析:二進(jìn)制呀二進(jìn)制,記住就行了。[單選題]15.列表對(duì)象的sort()函數(shù)用來對(duì)列表元素進(jìn)行原地排序,該函數(shù)返回值為()。A)FalseB)NoneC)TrueD)報(bào)錯(cuò)答案:B解析:列表對(duì)象的sort()函數(shù)用來對(duì)列表元素進(jìn)行原地排序,該函數(shù)返回值為None。[單選題]16.下列關(guān)于提升算法,不正確的是()A)提升算法中,后一個(gè)分類器的訓(xùn)練基于前一個(gè)分類器的表現(xiàn)B)后面的分類器更側(cè)重分類錯(cuò)誤的樣本C)Adaboost算法有許多復(fù)雜參數(shù)D)Adaboost模型可解釋性較低答案:C解析:[單選題]17.hadoop中什么類提供了連接到HDFS系統(tǒng)并執(zhí)行文件操作的基本功能()A)FSDirectoryB)DFSClientC)ClientProtocolD)FSInputStream答案:B解析:A、FSDirectory【HDFS文件系統(tǒng)的整個(gè)命名空間是通過FSDirectory類來管理的】B、DFSClient【DFSClient會(huì)連接到HDFS,對(duì)外提供管理文件/目錄、讀寫文件以及管理與配置HDFS系統(tǒng)等功能?!緾、ClientProtocol【這個(gè)接口中有兩類方法,一是操縱命名空間的方法,二是操縱文件流的方法】D、FSInputStream【在FSInputStream類中,通過Seekable接口的seek()方法實(shí)現(xiàn)了PositionedReadable接口中的read()方法】[單選題]18.()選擇是直接把最終將要使用的學(xué)習(xí)器的性能作為特征子集的評(píng)價(jià)準(zhǔn)則。A)嵌入式B)過濾式C)包裹式D)一體式答案:C解析:包裹式特征選擇直接把最終將要使用的學(xué)習(xí)器的性能作為特征子集的評(píng)價(jià)準(zhǔn)則。[單選題]19.從Maxcompute導(dǎo)入數(shù)據(jù)到ADS的時(shí)候,導(dǎo)入路徑格式為:()。A)odps://project_name/table_namepartiton_specB)odps://project_name/table_name:partiton_specC)odps://project_name/table_name(partiton_spec)D)odps://project_name/table_name/partiton_spec答案:D解析:[單選題]20.核矩陣是()的。A)沒有規(guī)律B)半正定C)正定D)樣本矩陣答案:B解析:只要一個(gè)對(duì)稱函數(shù)所對(duì)應(yīng)的核矩陣半正定,它就能作為核函數(shù)使用。[單選題]21.下面代碼中,創(chuàng)建的是一個(gè)3行3列數(shù)組的是()。A)arr=np.array([1,2,3])B)arr=np.array([[1,2,3],[4,5,6]])C)arr=np.array([[1,2],[3,4]])D)np.ones((3,3))答案:D解析:[單選題]22.偽彩色處理和假彩色處理是兩種不同的色彩增強(qiáng)處理方法,說出下面屬于偽彩色增強(qiáng)的處理?A)將景象中的藍(lán)天邊為紅色,綠草變?yōu)樗{(lán)色B)用自然色復(fù)制多光譜的景象C)將灰度圖經(jīng)頻域高通/低通后的信號(hào)分別送入紅/藍(lán)顏色顯示控制通道D)將紅、綠、藍(lán)彩色信號(hào)分別送入藍(lán)、紅、綠顏色顯示控制通道答案:C解析:[單選題]23.下列說法正確的是()。A)HDFSHA可用性不好B)第二名稱節(jié)點(diǎn)是熱備份C)HDFSHA提供高可用性,可以實(shí)現(xiàn)可擴(kuò)展性、系統(tǒng)性能和隔離性D)第二名稱節(jié)點(diǎn)無法解決單點(diǎn)故障問題答案:D解析:[單選題]24.Hadoop工作在()風(fēng)格下A)master-workerB)worker/salveC)master-slaveD)集中式答案:C解析:[單選題]25.管理網(wǎng)絡(luò)中跨多臺(tái)計(jì)算機(jī)存儲(chǔ)的文件系統(tǒng)稱為()。A)MapReduceB)HDFSC)HadoopD)Hive答案:B解析:[單選題]26.默認(rèn)的Namenodeweb管理端口是()A)50070B)8020C)50030D)22答案:A解析:[單選題]27.在一個(gè)MR程序的運(yùn)行過程中,哪個(gè)步驟會(huì)涉及到多個(gè)節(jié)點(diǎn)之間的數(shù)據(jù)交換?A)MapB)CombineC)ShuffleD)Reduce答案:C解析:[單選題]28.一張數(shù)據(jù)表中出現(xiàn)多個(gè)重復(fù)的字段屬于不滿足()。--A)1NFB)2NFC)3NFD)以上答案都不正確答案:A解析:[單選題]29.LasVegasWrapper是一種典型的(__)算法。A)過濾式選擇B)嵌入式選擇C)包裹式選擇D)正則化答案:C解析:[單選題]30.Kafka集群中。Kafka服務(wù)端部署的角色時(shí)?A)ProducerB)ConsumerC)ZooKeeperD)Broker答案:D解析:[單選題]31.云計(jì)算就是把資源都放到()A)對(duì)等網(wǎng)B)互聯(lián)網(wǎng)C)廣域網(wǎng)D)無線網(wǎng)答案:B解析:[單選題]32.Python類中包含一個(gè)特殊的變量(),它表示當(dāng)前對(duì)象自身,可以訪問類的成員。A)selfB)meC)thisD)與類同名答案:A解析:[單選題]33.Spark的集群部署模式不包括()A)standaloneB)sparkonmesosC)sparkonYARND)Local答案:D解析:[單選題]34.如果想獲取一個(gè)序列內(nèi)最小數(shù)字會(huì)使用內(nèi)置函數(shù)A)minB)maxC)lenD)for答案:A解析:[單選題]35.type(complex(2,4))的結(jié)果為()。A)class'int'B)class'float'C)class'complex'D)class'bool'答案:C解析:[單選題]36.Mapper排序后的輸出將作為下面哪個(gè)的輸入()A)ReducerB)MapperC)ShuffleD)Sort答案:A解析:[單選題]37.下列關(guān)于離群值的說法中,哪一項(xiàng)是不正確的(___)A)在樣本總量中類別比重很小(少數(shù)類)的都是離群值B)也稱逸出值,是指在數(shù)據(jù)中有一個(gè)或幾個(gè)數(shù)值與其他數(shù)值相比差異較大C)在統(tǒng)計(jì)學(xué)中,上下α點(diǎn)分位以外的值認(rèn)為是離群值D)可以通過樣本點(diǎn)鄰域點(diǎn)的密度判斷是否屬于離群值答案:A解析:[單選題]38.下列選項(xiàng)錯(cuò)誤的是()。--A)ALTERUSER'root'@'localhost'IDENTIFIED、BY'000'B)SETPASSWORD、FOR'root'@'localhost'='000'C)mysqladmin-uroot-ppassworD、000D)以上答案都不正確答案:D解析:[單選題]39.在分類問題中,經(jīng)常會(huì)遇到正負(fù)樣本數(shù)據(jù)量不等的情況,比如正樣本為100萬條數(shù)據(jù),負(fù)樣本只有1萬條數(shù)據(jù),以下最合適的處理方法是()。A)從100萬正樣本中隨機(jī)抽取1萬參與分類B)將負(fù)樣本每個(gè)權(quán)重設(shè)置為100,正樣本權(quán)重為1,參與訓(xùn)練過程C)直接進(jìn)行分類,可以最大限度利用數(shù)據(jù)D)將負(fù)樣本重復(fù)100次,生成100萬樣本量,打亂順序參與分類答案:B解析:[單選題]40.下列選擇Logistic回歸中的One-Vs-All方法中,()是真實(shí)的A)我們需要在n類分類問題中適合n個(gè)模型B)我們需要適合n-l個(gè)模型來分類為n個(gè)類C)我們需要只適合1個(gè)模型來分類為n個(gè)類D)以上答案都不正確答案:A解析:[單選題]41.Saprk中默認(rèn)的存儲(chǔ)級(jí)別是()A)MEMORY_ONLYB)MEMORY_ONLY_SERC)MEMORY_AND_DISKD)MEMORY_AND_DISK_SER答案:A解析:[單選題]42.決策樹的父節(jié)點(diǎn)和子節(jié)點(diǎn)的熵的大小關(guān)系是()。A)父節(jié)點(diǎn)的熵更小B)子節(jié)點(diǎn)的熵更小C)兩者相等D)根據(jù)具體情況而定答案:B解析:決策樹分解策略是保證子結(jié)點(diǎn)的熵小于父結(jié)點(diǎn)的熵。但子結(jié)點(diǎn)的熵是該父結(jié)點(diǎn)所有孩子結(jié)點(diǎn)的熵的總和,因此,并保證任意一個(gè)子節(jié)點(diǎn)的熵都小于父結(jié)點(diǎn)病。[單選題]43.根據(jù)國網(wǎng)公司泛在電力物聯(lián)網(wǎng)建設(shè)方案,2019年圍繞()大領(lǐng)域開展泛在電力物聯(lián)網(wǎng)建設(shè),共計(jì)開展57項(xiàng)建設(shè)任務(wù)。A)五B)六C)四D)八答案:B解析:[單選題]44.某銷售人員擁有線索數(shù)據(jù)、商機(jī)數(shù)據(jù)、銷售數(shù)據(jù)等各個(gè)階段的占比情況,下面哪個(gè)圖表最適合展示()A)文本圖B)熱力點(diǎn)圖C)面積圖D)漏斗圖答案:D解析:[單選題]45.在一些算法中,為了進(jìn)行屬性之間的比較或運(yùn)算,需要把不同屬性的不同變量取值范圍變換成同一范圍,以免使得結(jié)果發(fā)生扭曲,偏向取值范圍大的變量。這一過程稱為()。A)合并B)數(shù)據(jù)聚合C)歸一化D)數(shù)據(jù)處理答案:C解析:歸一化是一種無量綱處理手段,使物理系統(tǒng)數(shù)值的絕對(duì)值變成某種相對(duì)值關(guān)系,是簡化計(jì)算、縮小量值的有效辦法。[單選題]46.RDD中的數(shù)據(jù)被()在集群中,使得任務(wù)可以并行執(zhí)行。A)順序存儲(chǔ)B)連續(xù)存儲(chǔ)C)分塊存儲(chǔ)D)分區(qū)存儲(chǔ)答案:D解析:[單選題]47.閱讀下面的程序:li_one=[2,1,5,6]print(sorted(li_one[:2]))運(yùn)行程序,輸出結(jié)果是()。A)[1,2]B)[2,1]C)[1,2,5,6]D)[6,5,2,1]答案:A解析:[單選題]48.將平臺(tái)作為服務(wù)的云計(jì)算服務(wù)類型是A)IaaSB)SaaSC)PaaSD)以上三項(xiàng)都是答案:C解析:[單選題]49.根據(jù)建議,/srv/BigDate分區(qū)應(yīng)該部署在什么磁盤上?A)OS盤B)元數(shù)據(jù)盤C)數(shù)據(jù)盤D)管理盤答案:A解析:[單選題]50.以下關(guān)于人機(jī)交互,描述錯(cuò)誤的是:()A)人機(jī)交互是一門研究系統(tǒng)與用戶之間的交互關(guān)系的學(xué)科B)人機(jī)交互界面通常是指用戶不可見的C)系統(tǒng)可以是各種各樣的機(jī)器.也可以是計(jì)算機(jī)化的系統(tǒng)和軟件D)用戶通過人機(jī)交互界面與系統(tǒng)交流.并進(jìn)行操作答案:B解析:[單選題]51.ndarry對(duì)象的dtype屬性表示(__)。A)數(shù)組中包含數(shù)據(jù)的類型B)該數(shù)組的類型C)數(shù)組的大小D)數(shù)組的元素個(gè)數(shù)答案:A解析:[單選題]52.下列哪一項(xiàng)不是StructuredStreaming支持的Source數(shù)據(jù)源。A)KafkaB)SocektC)HiveD)Hdfs答案:C解析:[單選題]53.大數(shù)據(jù)計(jì)算服務(wù)提供了大數(shù)據(jù)的存儲(chǔ)和計(jì)算服務(wù),非常適合應(yīng)用于大數(shù)據(jù)分析的領(lǐng)域。以下說法中錯(cuò)誤的是:()。A)可以實(shí)現(xiàn)大型互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)倉庫和BI分析B)提供了便捷的分析處理海量數(shù)據(jù)的手段,用戶可以不必關(guān)心分布式計(jì)算細(xì)節(jié),從而達(dá)到分析大數(shù)據(jù)的目的C)可以支持實(shí)時(shí)OLAP分析D)可以基于歷史數(shù)據(jù),進(jìn)行用戶特征和興趣挖掘答案:C解析:[單選題]54.假設(shè)已經(jīng)配置好PATH環(huán)境變量,啟動(dòng)Hadoop的命令是()。A)start-hdfs.shB)start-fs.shC)start-dfs.shD)start-hadoop.sh答案:C解析:第2部分:多項(xiàng)選擇題,共26題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]55.下列哪些是詞語情感分析的方法?A)基于網(wǎng)絡(luò)的分析方法B)基于word-embedding的分析方法C)基于詞典的分析方法D)基于詞頻的分析方法答案:AC解析:[多選題]56.若name=np.array(['Bob','Joe','Will','Bob','Joe','Will','Joe']),則以下可以的到['Bob','Joe','Will']的代碼是(__)。A)np.unique(name)B)sorted(set(name))C)np.sort(name)D)name答案:AB解析:[多選題]57.數(shù)據(jù)中臺(tái)是在全業(yè)務(wù)統(tǒng)一數(shù)據(jù)中心管理域和分析域的基礎(chǔ)上,進(jìn)一步提升數(shù)據(jù)接入整合、共享分析、資源管理等能力構(gòu)建而成,主要包括()、數(shù)據(jù)資產(chǎn)管理等。A)貼源層B)共享層C)分析層D)統(tǒng)一數(shù)據(jù)服務(wù)答案:ABCD解析:[多選題]58.HBase構(gòu)建二級(jí)索引的實(shí)現(xiàn)方式有哪些?A)MapReduceB)CoprocessorC)BloomFilterD)Filter答案:AB解析:常見的二級(jí)索引方案:1.MapReduce方案2.ITHBASE(Indexed-TransanctionalHBase)方案3.IHBASE(IndexHBase)方案4.HbaseCoprocessor(協(xié)處理器)方案5.Solr+hbase方案6.CCIndex(complementalclusteringindex)方案[多選題]59.下列有關(guān)類的說法正確的是(___)。A)類是用來描述具體相同的屬性和方法的對(duì)象的集合B)定義了該集合中每個(gè)對(duì)象所共有的屬性和方法。C)類是對(duì)象的示例D)屬于類級(jí)別的變量,在使用它的時(shí)候一定要帶上類型名字答案:ABD解析:[多選題]60.零售數(shù)據(jù)的線上來源包括()。A)產(chǎn)品條目B)合作電商的數(shù)據(jù)C)利用大數(shù)據(jù)對(duì)非合作電商的推算D)全渠道覆蓋答案:BC解析:[多選題]61.ElasticSearch支持的gateway類型有A)HDFSB)本地文件系統(tǒng)C)AmazonS3D)AmazonS5答案:ABCD解析:[多選題]62.關(guān)于降維說法正確的是()。A)PA是根據(jù)方差這一屬性降維的B)降維可以防止模型過擬合C)降維降低了數(shù)據(jù)集特征的維度D)降維方法有PLA等答案:ACD解析:降維不能用于防止模型過擬合。[多選題]63.關(guān)于GES的應(yīng)用場(chǎng)景,以下哪些選項(xiàng)是正確的?A)金融:實(shí)時(shí)推薦、實(shí)時(shí)反欺詐,基于知識(shí)圖譜的風(fēng)控(信貸、保險(xiǎn))B)物流和網(wǎng)規(guī):最優(yōu)路徑推薦C)T業(yè):基于知識(shí)圖譜的設(shè)備故障診斷和預(yù)警D)社交分析,尋找特定愛好的好友,或者通過好友的好友,找到用戶可能認(rèn)識(shí)的好友答案:ABCD解析:[多選題]64.Spark運(yùn)行架構(gòu)具有以下哪些特點(diǎn)?A)每個(gè)Application都有自己專屬的Executor進(jìn)程,并且該進(jìn)程在Application運(yùn)行期間一直駐留B)Executor進(jìn)程以多線程的方式運(yùn)行TaskC)Spark運(yùn)行過程與資源管理器無關(guān),只要能夠獲取Executor進(jìn)程并保持通信即可D)Task采用了數(shù)據(jù)本地性和推測(cè)執(zhí)行等優(yōu)化機(jī)制答案:ABCD解析:[多選題]65.數(shù)據(jù)備份的操作應(yīng)包括:()A)確認(rèn)備份操作步驟準(zhǔn)確無誤后進(jìn)行備份操作。B)各業(yè)務(wù)部門應(yīng)將計(jì)算機(jī)信息數(shù)據(jù)備份媒體視同重要空白憑證,指定專人負(fù)責(zé)備份數(shù)據(jù)媒體的簽收和入庫管理。C)備份數(shù)據(jù)媒體應(yīng)按要求寫明標(biāo)識(shí),交科技檔案管理員異地存放,要確保存放地的安全,并定期進(jìn)行檢查,確保數(shù)據(jù)的完整性、可用性。D)涉密信息媒體的備份媒體(磁帶、磁盤、光盤、紙媒體等)應(yīng)有密級(jí)及保密期限標(biāo)志,統(tǒng)一編號(hào),各單位保密機(jī)構(gòu)負(fù)責(zé)涉密信息媒體的界定和銷毀。答案:ABCD解析:[多選題]66.我們建立一個(gè)5000個(gè)特征,100萬數(shù)據(jù)的機(jī)器學(xué)習(xí)模型.我們?cè)趺从行У貞?yīng)對(duì)這樣的大數(shù)據(jù)訓(xùn)練A)我們隨機(jī)抽取一些樣本,在這些少量樣本之上訓(xùn)練B)我們可以試用在線機(jī)器學(xué)習(xí)算法C)我們應(yīng)用PCA算法降維,減少特征數(shù)D)無法應(yīng)對(duì)答案:ABC解析:[多選題]67.各單位應(yīng)深入分析數(shù)據(jù)資產(chǎn)質(zhì)量問題產(chǎn)生的原因,以()為基本策略,制定數(shù)據(jù)資產(chǎn)質(zhì)量提升措施,從數(shù)據(jù)源頭解決數(shù)據(jù)資產(chǎn)質(zhì)量問題。A)控制增量B)遏制增量C)減少存量D)消除存量答案:AD解析:[多選題]68.企業(yè)中臺(tái)的建設(shè)原則是()A)堅(jiān)持企業(yè)級(jí)建設(shè)B)堅(jiān)持以用戶為中心C)堅(jiān)持以應(yīng)用為導(dǎo)向D)堅(jiān)持統(tǒng)一創(chuàng)新結(jié)合答案:ABCD解析:[多選題]69.模式識(shí)別中,馬式距離較之于歐式距離的優(yōu)點(diǎn)是()A)平移不變性B)旋轉(zhuǎn)不變性C)尺度不變性D)考慮了模式的分布答案:CD解析:[多選題]70.以下幾種模型方法屬于判別式模型的有()A)混合高斯B)CRFC)區(qū)分度訓(xùn)練D)隱馬爾科夫模型答案:BC解析:[多選題]71.可以從哪些維度評(píng)價(jià)數(shù)據(jù)價(jià)值:()A)數(shù)據(jù)樣本量B)數(shù)據(jù)品種C)數(shù)據(jù)完整性D)數(shù)據(jù)實(shí)時(shí)性答案:ABCD解析:[多選題]72.mySQL支持哪些邏輯運(yùn)算符A)&&B)||C)NOTD)AND答案:CD解析:[多選題]73.泛在電力物聯(lián)網(wǎng)就是圍繞電力系統(tǒng)各環(huán)節(jié),充分應(yīng)用()等現(xiàn)代信息技術(shù)、先進(jìn)通信技術(shù),實(shí)現(xiàn)電力系統(tǒng)各個(gè)環(huán)節(jié)萬物互聯(lián)、人機(jī)交互A)移動(dòng)互聯(lián)B)創(chuàng)新應(yīng)用C)人工智能D)高效技術(shù)答案:AC解析:[多選題]74.下列關(guān)于PCA的說法,正確的是()。A)在使用PCA之前,我們必須標(biāo)準(zhǔn)化數(shù)據(jù)B)應(yīng)該選擇具有最大方差的主成分C)應(yīng)該選擇具有最小方差的主成分D)可以使用PCA在低維空間中可視化數(shù)據(jù)答案:ABD解析:PCA對(duì)數(shù)據(jù)中變量的尺度非常敏感,因此需要對(duì)各個(gè)變量進(jìn)行標(biāo)準(zhǔn)化。方差越大,說明在該特征上分布越廣泛,說明該特征越有用,影響越大。PCA有時(shí)在較低維度上繪制數(shù)據(jù)是非常有用,可以提取前2個(gè)主要組成部分,在二維平面上使用散點(diǎn)圖可視化數(shù)據(jù)。[多選題]75.大數(shù)據(jù)計(jì)算框架Spark中除了RDD,還有哪些數(shù)據(jù)類型?A)DataTypeB)DataSchemaC)DataSetD)DataFrame答案:CD解析:[多選題]76.HBASE中Hmaster主要負(fù)責(zé)什么?A)表的增刪改查B)用戶數(shù)據(jù)讀寫C)Region分布調(diào)整D)Regionserver負(fù)戴均衡答案:ACD解析:[多選題]77.半監(jiān)督學(xué)習(xí)中,對(duì)未標(biāo)記樣本所揭示的數(shù)據(jù)分布信息與類別標(biāo)記相聯(lián)系的假設(shè)的有(__)和(__)。A)歸納假設(shè)B)聚類假設(shè)C)流形假設(shè)D)基本假設(shè)答案:BC解析:第3部分:判斷題,共16題,請(qǐng)判斷題目是否正確。[判斷題]78.在Linux中,mkdir命令主要用于在指定路徑下創(chuàng)建子目錄。A)正確B)錯(cuò)誤答案:對(duì)解析:mkdir命令主要用于在指定路徑下創(chuàng)建子目錄。[判斷題]79.實(shí)時(shí)流處理對(duì)時(shí)延的要求不高。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]80.DWS采用計(jì)算分布、數(shù)據(jù)分布的MPP架構(gòu)。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]81.建立外鍵約束時(shí),主表被引用的字段必須具有主鍵約束。--A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]82.describe()方法可以一次性輸出多個(gè)統(tǒng)計(jì)指標(biāo)。()A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]83.Flink采用checkpoint機(jī)制保障應(yīng)用程序運(yùn)行中的容錯(cuò)性。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]84.如果需要連接大量字符串成為一個(gè)字符串,那么使用字符串對(duì)象的join()方法比運(yùn)算符+具有更高的效率A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]85.大數(shù)據(jù)安全與大數(shù)據(jù)應(yīng)用是一體之兩翼,同等重要,不可偏廢。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]86.每個(gè)DataWorks任務(wù)使用0或0個(gè)以上的數(shù)據(jù)表(數(shù)據(jù)集)作為輸入,生成一個(gè)或多個(gè)數(shù)據(jù)表(數(shù)據(jù)集)作為輸出。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]87.在HDFS里,若打開其回收站機(jī)制,則刪除文件時(shí),文件不會(huì)立即徹底被刪除。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]88.表達(dá)式min(['11','2','3'])的值為'3'A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]89.Hive在刪除表的時(shí)候,內(nèi)部表的元數(shù)據(jù)和實(shí)際數(shù)據(jù)不會(huì)被一起刪除。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]90.數(shù)據(jù)中臺(tái)主要覆蓋數(shù)據(jù)接入、存儲(chǔ)計(jì)算、數(shù)據(jù)分析、數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)運(yùn)營管理以及數(shù)據(jù)服務(wù)等方面能力。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]91.在MySQL配置文件中,basedir用于指定數(shù)據(jù)庫文件的保存目錄。--A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]92.正則表達(dá)式模塊re的match()方法是從字符串的開始匹配特定模式,而search()方法是在整個(gè)字符串中尋找模式,這兩個(gè)方法如果匹配成功則返回match對(duì)象,匹配失敗則返回空值None。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]93.在產(chǎn)業(yè)發(fā)展領(lǐng)域,大數(shù)據(jù)加速了產(chǎn)業(yè)優(yōu)化升級(jí)的步伐A)正確B)錯(cuò)誤答案:對(duì)解析:第4部分:問答題,共4題,請(qǐng)?jiān)诳瞻滋幪顚懻_答案。[問答題]94.()是一個(gè)高可靠性、高性能、面向列、可伸縮的系統(tǒng),可在廉價(jià)PC服務(wù)器上搭建起大規(guī)模結(jié)構(gòu)化存儲(chǔ)集群。答案:HBASE或分布式解析:[問答題]95.Hadoop發(fā)行版本分為()。答案:開源社區(qū)版、商業(yè)版解析:[問答題]96.在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論