大數(shù)據(jù)練習卷附答案_第1頁
大數(shù)據(jù)練習卷附答案_第2頁
大數(shù)據(jù)練習卷附答案_第3頁
大數(shù)據(jù)練習卷附答案_第4頁
大數(shù)據(jù)練習卷附答案_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

大數(shù)據(jù)練習卷附答案單選題(總共40題)1.()肯定是寬依賴操作。(1分)A、mapB、?atMapC、reduceByKeyD、sample答案:C解析:

暫無解析2.有N個樣本,一半用于訓練,一半用于測試。若N增大,則訓練誤差和測試誤差之間的差距會()。(1分)A、增大B、減小C、無法確定D、無明顯變化答案:B解析:

暫無解析3.下列函數(shù)能夠讓所有單詞的首字母變成大寫的是()。(1分)A、capitalize()B、title()C、upper()D、ijust()答案:B解析:

暫無解析4.下列不屬于模型集成方法的是()。(1分)A、直接集成法B、增強法C、堆疊法D、遞歸法答案:D解析:

暫無解析5.下列關于分類算法的準確率、召回率、F2值的描述錯誤的是()。(1分)A、準確率是檢索出相關文檔數(shù)與檢索出的文檔總數(shù)的比率,衡量的是檢索系統(tǒng)的查準率B、召回率是指檢索出的相關文檔數(shù)和文檔庫中所有的相關文檔數(shù)的比率,衡量的是檢索系統(tǒng)的查全率C、正確率、召回率和F1值取值都在0和1之間,數(shù)值越接近0,查準率或查全率就越高D、為了解決準確率和召回率沖突問題,引入了F2分數(shù)答案:C解析:

暫無解析6.下列不屬于PythonIDE的是()。(1分)A、PyCharmB、JupyterNotebookC、SpyderD、Rstudio答案:D解析:

暫無解析7.下列關于長短時神經(jīng)網(wǎng)絡的敘述錯誤的是()。(1分)A、引用自循環(huán)思想B、產(chǎn)生梯度長時間持續(xù)流動的路徑C、積累的時間尺度不可以因輸入序列而改變D、可應用于語音識別和機器翻譯答案:C解析:

暫無解析8.利用到每個聚類中心和的遠近判斷離群值的方法,可以基于的算法為()。(1分)A、K-meansB、KNNC、SVMD、LinearRegression答案:A解析:

暫無解析9.下列算法中不屬于基于深度學習的圖像分割算法的是()。(1分)A、FCNB、DeeplabC、Mask-RCNND、KNN答案:D解析:

暫無解析10.分布式應用程序可以基于分布式應用程序協(xié)調(diào)服務實現(xiàn)同步服務,配置維護和命名服務等的工具是()。(1分)A、FlumeB、ZookeeperC、StormD、SparkStreaming答案:B解析:

暫無解析11.()不屬于聚類性能度量外部指標。(1分)A、Jaccard系數(shù)B、FM系數(shù)C、Rand指數(shù)D、DB指數(shù)答案:D解析:

暫無解析12.當不知道數(shù)據(jù)所帶標簽時,可以使用()促使帶同類標簽的數(shù)據(jù)與帶其他標簽的數(shù)據(jù)相分離。(1分)A、分類B、聚類C、關聯(lián)分析D、隱馬爾可夫鏈答案:B解析:

暫無解析13.下列算法中更適合做時間序列建模的是。(1分)A、CNNB、決策樹C、LSTMD、貝葉斯算法答案:C解析:

暫無解析14.下列方法中不屬于圖像分割方法的是()。(1分)A、邊緣檢測法B、閾值分割法C、區(qū)域分割法D、特征提取法答案:D解析:

暫無解析15.Python中定義私有屬性的方法是()。(1分)A、使用private關鍵字B、使用public關鍵字C、使用××定義屬性名D、使用××定義屬性名答案:D解析:

暫無解析16.下列關于面向過程和面向?qū)ο蟮恼f法錯誤的是?(1分)A、面向過程和面向?qū)ο蠖际墙鉀Q問題的一種思路B、面向過程是基于面向?qū)ο蟮腃、面向過程強調(diào)的是解決問題的步驟D、面向?qū)ο髲娬{(diào)的是解決問題的對象答案:B解析:

暫無解析17.下列函數(shù)用于向文件中寫內(nèi)容的是()。(1分)A、open()B、write()C、close()D、read()答案:B解析:

暫無解析18.下列描述不屬于圖像分割內(nèi)容的是()。(1分)A、把不同類別分開B、提取不同區(qū)域的特征C、識別圖像內(nèi)容或?qū)D像進行分類D、對未處理圖像進行平滑答案:D解析:

暫無解析19.下列關于Boosting算法的描述錯誤的是。(1分)A、可將強學習器降為弱學習器B、從初始訓練集訓練基學習器C、對訓練樣本分布進行調(diào)整D、做錯的訓練樣本多次訓練答案:A解析:

暫無解析20.下列關于Sigmoid函數(shù)的說法錯誤的是。(1分)A、存在梯度爆炸的問題B、不是關于原點對稱C、計算exp比較耗時D、存在梯度消失的問題答案:A解析:

暫無解析21.假負率是指()。(1分)A、正樣本預測結(jié)果數(shù)/正樣本實際數(shù)B、被預測為負的正樣本結(jié)果數(shù)/正樣本實際數(shù)C、被預測為正的負樣本結(jié)果數(shù)/負樣本實際數(shù)D、負樣本預測結(jié)果數(shù)/負樣本實際數(shù)答案:B解析:

暫無解析22.運行下面程序,輸出的結(jié)果是()。defchanageInt(number2):number2=number2+1print("changeInt:number2=",number2)#調(diào)用number1=2;ChanageInt(number1)print("number:",number1)(1分)A、changeInt:number2=3number:3B、changeInt:number2=3number:2C、number:2changeInt:number2=2D、number:2changeInt:number2=3答案:B解析:

暫無解析23.()是指針對用戶非常明確的數(shù)據(jù)查詢和處理任務,以高性能和高吞吐量的方式實現(xiàn)大眾化的服務,是數(shù)據(jù)價值最重要也是最直接的發(fā)現(xiàn)方式。(1分)A、數(shù)據(jù)服務B、數(shù)據(jù)分析C、數(shù)據(jù)治理D、數(shù)據(jù)應用答案:A解析:

暫無解析24.信息增益、增益率分別對可取值數(shù)目()的屬性有所偏好。(1分)A、較高,較高B、較高,較低C、較低,較高D、較低,較低答案:B解析:

暫無解析25.在一個線性回歸問題中,通常使用R平方(R-Squared)來判斷擬合度。此時,如果增加一個特征,模型不變,則下面說法正確的是()。(1分)A、如果R-Squared增加,則這個特征有意義B、如果R-Squared減小,則這個特征沒有意義C、僅看R-Squared單一變量,無法確定這個特征是否有意義D、以上說法都不對答案:C解析:

暫無解析26.下列關于代碼規(guī)范的描述錯誤的是()(1分)A、類總是使用駝峰格式命名,即所有單詞首字母大寫其余字母小寫B(tài)、除特殊模塊init之外,模塊名稱都使用不帶下劃線的小寫字母C、不要濫用*args和**kwargsD、建議把所有方法都放在一個類中答案:D解析:

暫無解析27.下列內(nèi)容符合物體識別任務的是()。(1分)A、不能對圖像進行壓縮或剪裁B、遵守誤差最小準則和最佳近似準則C、可以不指定分類的類別數(shù)量D、事先給定樣本的分布特征答案:B解析:

暫無解析28.下列關于組織機構的數(shù)據(jù)管理成熟度等級劃分中的已執(zhí)行級的描述錯誤的是?(1分)A、在具體項目中,DMM關鍵過程域(KPA)中給出的關鍵過程已被執(zhí)行,但隨意性和臨時性較大B、DMM關鍵過程的執(zhí)行不僅僅局限于特定業(yè)務范疇,存在跨越不同業(yè)務領域的關鍵過程C、缺少針對DMM關鍵過程的反饋與優(yōu)化D、雖然有可能在特定業(yè)務過程中進行了基礎性改進,但沒有進行持續(xù)跟進,也未拓展到整個組織機構答案:B解析:

暫無解析29.下列方法中屬于映射數(shù)據(jù)到新的空間的是()(1分)A、傅里葉變換B、特征加權C、漸進抽樣D、維歸約答案:A解析:

暫無解析30.BASE原則的含義不包括()。(1分)A、基本可用B、柔性狀態(tài)C、最終一致D、基礎條件答案:D解析:

暫無解析31.下列關于Python語言特點的描述錯誤的是。(1分)A、Python語言時非開源語言B、Python語言是跨平臺語言C、Python語言時多模型語言D、Python語言時腳本語言答案:A解析:

暫無解析32.下列關于Hive說法正確的是。(1分)A、一種數(shù)據(jù)倉庫工具B、一種數(shù)據(jù)處理工具C、一種可視化工具D、一種分析算法答案:A解析:

暫無解析33.下列關于數(shù)據(jù)的存儲結(jié)構的描述正確的是()(1分)A、數(shù)據(jù)所占的存儲空間量B、存儲在外存中的數(shù)據(jù)C、數(shù)據(jù)在計算機中的順序存儲方式D、數(shù)據(jù)的邏輯結(jié)構在計算機中的表示答案:D解析:

暫無解析34.下列關于數(shù)據(jù)科學的描述錯誤的是()(1分)A、數(shù)據(jù)科學中的數(shù)據(jù)不僅僅是數(shù)值,也不等同于數(shù)值B、數(shù)據(jù)科學中的計算包括數(shù)據(jù)的查詢、挖掘、洞見等C、數(shù)據(jù)科學強調(diào)的是跨學科視角D、數(shù)據(jù)科學不包括理論知識,只包括領域?qū)崉战?jīng)驗答案:D解析:

暫無解析35.運行代碼,輸出結(jié)果為()。#!/usr/bin/envpython3n=100sum=0counter=1whilecounter<=n:sum+countercounter+=1print("1到%d之和為:%d"%(n,sum))(1分)A、1到100之和為5000:B、1到100之和為:0C、1到100之和為:2050D、1到100之和為:5020答案:B解析:

暫無解析36.下列關于缺失值填補的說法不正確的是?(1分)A、填補數(shù)據(jù)可以用中位數(shù)或者眾數(shù)等B、Pandas.dropna可以用來填補缺失值C、用平均值填補會引入相關性D、啞變量填補是將缺失值當做一類新特征處理答案:B解析:

暫無解析37.下列關于Boosting的說法錯誤的是?(1分)A、Boosting方法的主要思想是迭代式學習B、訓練基分類器時采用并行的方式C、測試時,根據(jù)各層分類器的結(jié)果的加權得到最終結(jié)果D、基分類器層層疊加,每一層在訓練時,對前一層基分類器分錯的樣本給予更高的權值答案:B解析:

暫無解析38.下列關于Python語句:f=open()中f的描述錯誤的是?(1分)A、*f是文件句柄,用來在程序中表達文件B、表達式print(f)執(zhí)行將報錯C、*f是一個Python內(nèi)部變量類型D、將f當作文件對象,f.read()可以讀入文件全部信息答案:B解析:

暫無解析39.下列可分解為偏差、方差與噪聲之和的是?(1分)A、訓練誤差(trainingerror)B、經(jīng)驗誤差(empiricalerror)C、均方誤差(meansquarederror)D、泛化誤差(generalizationerror)答案:D解析:

暫無解析40.()的本質(zhì)是將低層次數(shù)據(jù)轉(zhuǎn)換為高層次數(shù)據(jù)的過程。(1分)A、數(shù)據(jù)處理B、數(shù)據(jù)計算C、數(shù)據(jù)加工D、整齊數(shù)據(jù)答案:C解析:

暫無解析多選題(總共30題)1.LSTM應用場景有()。(1分)A、翻譯語言B、語音識別C、圖像識別D、股票預測答案:ABD解析:

暫無解析2.可作為決策樹選擇劃分屬性的參數(shù)有()。(1分)A、信息增益B、信息增益率C、基尼指數(shù)D、密度函數(shù)答案:ABC解析:

暫無解析3.聚類性能度量的指標主要分為外部指標和內(nèi)部指標,其中屬于內(nèi)部指標的是()。(1分)A、Jaccard指數(shù)B、FM指數(shù)C、DB指數(shù)D、Dunn指數(shù)答案:CD解析:

暫無解析4.name=np.array(['Liu','Wang','Zhu','Wang','Zhu','Wang','Zhu']),則下列可以得到['Liu','Wang','Zhu']的代碼是()。(1分)A、np.unique(name)B、sorted(set(name))C、np.sort(name)D、name答案:AB解析:

暫無解析5.下列關于隨機變量及其概率分布的說法正確的有()。(1分)A、隨機變量可以分為離散型隨機變量和連續(xù)型隨機變量B、隨機變量的概率分布指的是一個隨機變量所有取值的可能性C、扔5次硬幣,正面朝上次數(shù)的可能取值是0、1、2、3、4、5,其中正面朝上次數(shù)為0與正面朝上次數(shù)為5的概率是一樣的D、扔5次硬幣,正面朝上次數(shù)的可能取值是0、1、2、3、4、5,其中正面朝上次數(shù)為5的概率是最大的答案:ABC解析:

暫無解析6.卷積神經(jīng)網(wǎng)絡中常用的池化函數(shù)包括()。(1分)A、最大池化函數(shù)B、L2范數(shù)C、相鄰矩形區(qū)域內(nèi)的平均值D、基于據(jù)中心像素距離的加權平均函數(shù)答案:ABCD解析:

暫無解析7.HIS表色系的三屬性包含()。(1分)A、色調(diào)B、飽和度C、亮度D、色度答案:ABC解析:

暫無解析8.Spark的基本流程主要涉及()等角色。(1分)A、DriverProgramB、ClusterManagerC、WorkerNodeD、Executor答案:ABCD解析:

暫無解析9.RNN在NLP領域的應用包括()。(1分)A、語言模型與文本生成B、機器翻譯C、語音識別D、圖像描述生成答案:ABCD解析:

暫無解析10.下列關于單樣本Z檢驗的說法正確的有()。(1分)A、在Python中,單樣本Z檢驗可以使用scipy.stats.ttest_1samp()實現(xiàn)B、單樣本Z檢驗適用于樣本量較大的情況C、單樣本Z檢驗假設要檢驗的統(tǒng)計量(近似)滿足正態(tài)分布D、單樣本Z檢驗常用于檢驗總體平均值是否等于某個常量答案:BCD解析:

暫無解析11.特征選擇在子集生成與搜索方面引入了人工智能搜索技術和子集評價方法。其中人工智能搜索技術有()。(1分)A、分支界限法B、浮動搜索法C、信息熵D、AIC答案:ABCD解析:

暫無解析12.完整性約束通常包括()。.(1分)A、實體完整性B、域完整性C、參照完整性D、用戶定義完整性答案:ABCD解析:

暫無解析13.如果將A、B、C三個分類器的P-R曲線畫在一個圖中,其中A、B的P-R曲線可以完全包含住C的P-R曲線,A、B的P-R曲線有交點,A、B、C的平衡點分別為0.79、0.66、0.58,則下列說法中正確的有()。(1分)A、學習器A的性能優(yōu)于學習器CB、學習器A的性能優(yōu)于學習器BC、學習器B的性能優(yōu)于學習器CD、學習器C的性能優(yōu)于學習器B答案:ABC解析:

暫無解析14.特征選擇方法有()。(1分)A、AIC赤池信息準則B、LARS嵌入式特征選擇方法C、LVW包裹式特征選擇方法D、Relief過濾式特征選擇方法答案:BCD解析:

暫無解析15.類的特點有()。(1分)A、封裝B、繼承C、多態(tài)D、重復答案:ABC解析:

暫無解析16.數(shù)據(jù)科學以數(shù)據(jù)尤其是大數(shù)據(jù)為研究對象,主要研究內(nèi)容包括()。(1分)A、數(shù)據(jù)加工B、數(shù)據(jù)管理C、數(shù)據(jù)計算D、數(shù)據(jù)產(chǎn)品開發(fā)答案:ABCD解析:

暫無解析17.在數(shù)據(jù)安全領域常用的P2DR模型中,P、D和R代表的是()。(1分)A、策略B、防護C、檢測D、響應答案:ABCD解析:

暫無解析18.常用分詞方法包含()。(1分)A、基于Binarytree的分詞方法B、基于HMM的分詞方法C、基于CRF的分詞方法D、基于K-means的分詞方法答案:BC解析:

暫無解析19.影響Apriori算法的計算復雜度的有()。(1分)A、支持度閾值B、項數(shù)(維度)C、事務數(shù)D、事務平均寬度答案:ABCD解析:

暫無解析20.長短時記憶神經(jīng)網(wǎng)絡三個門是()。(1分)A、進化門B、輸出門C、輸入門D、遺忘門答案:BCD解析:

暫無解析21.Hadoop的優(yōu)點包括()。(1分)A、可靠性B、高效性C、可伸縮性D、成本低答案:ABCD解析:

暫無解析22.關于特征向量的缺失值處理方式如下:缺失值較多,直接將該特征舍棄掉,否則可能會帶入較大的noise,對結(jié)果造成不良影響;缺失值較少,其余的特征缺失值都在10%以內(nèi),可以采取的處理方式有()。(1分)A、把NaN直接作為一個特征,假設用0表示B、用均值填充C、用隨機森林等算法預測填充D、以上選項都不正確答案:ABC解析:

暫無解析23.假設目標遍歷的類別非常不平衡,即主要類別占據(jù)了訓練數(shù)據(jù)的99%,假設現(xiàn)在模型在訓練集上表現(xiàn)為99%的準確度,那么下列說法正確的有()。(1分)A、準確度并不適合衡量不平衡類別問題B、準確度適合衡量不平衡類別問題C、精確度和召回率適合于衡量不平衡類別問題D、精確度和召回率不適合衡量不平衡類別問題答案:AC解析:

暫無解析24.特征向量的歸一化方法有()。(1分)A、線性函數(shù)轉(zhuǎn)換B、對數(shù)函數(shù)轉(zhuǎn)換C、反余切函數(shù)轉(zhuǎn)換D、減去均值,除以方差答案:ABCD解析:

暫無解析25.數(shù)據(jù)可視化是利用計算機圖形學和圖像處理技術,將數(shù)據(jù)轉(zhuǎn)換成()在屏幕上顯示出來,并進行交互處理的理論、方法和技術。(1分)A、文字B、圖形C、圖像D、視頻答案:BC解析:

暫無解析26.分布式列式存儲的功能有()。(1分)A、支持在線快速讀寫B(tài)、支持線性擴展C、具備節(jié)點監(jiān)控管理D、數(shù)據(jù)同源不壓縮答案:ABC解析:

暫無解析27.如果希望減少數(shù)據(jù)集中的特征數(shù)量,則可以采取的措施有()。(1分)A、使用正向選擇法(ForwardSelection)B、使用反向消除法(BackwardElimination)C、逐步選擇消除法(Stepwise)D、計算不同特征之間的相關系數(shù),刪去相關系數(shù)高的特征之一答案:ABCD解析:

暫無解析28.()是scipy.stats可實現(xiàn)的連續(xù)隨機變量方法。(1分)A、rvsB、pdfC、ppfD、cdf答案:ABCD解析:

暫無解析29.在數(shù)據(jù)科學中,計算模式發(fā)生了根本性的變化——從集中式計算、分布式計算、網(wǎng)格計算等傳統(tǒng)計算過渡至云計算,有一定的代表性的是Google云計算三大技術,這三大技術包括()。(1分)A、HadoopYRN資源管理器B、GFS分布式存儲系統(tǒng)C、MapRedue分布式處理技術D、BigTable分布式數(shù)據(jù)庫答案:BCD解析:

暫無解析30.常見的回歸分析的種類有()。(1分)A、線性回歸B、系數(shù)回歸C、邏輯回歸D、曲線回歸答案:ACD解析:

暫無解析判斷題(總共30題)1.類中的每個屬性必須有初始值()(1分)A、正確B、錯誤答案:A解析:

暫無解析2.df1=pD.DataFrame([[5,2,3],[4,5,6],[7,8,9]],index=['A','B','D'],columns=['C1','C2','C3']),那么df1.loc[2,1]=8。()(1分)A、正確B、錯誤答案:B解析:

暫無解析3.分布式數(shù)據(jù)庫是指物理上分散在不同的地點,但在邏輯上是統(tǒng)一的數(shù)據(jù)庫因此,分布式數(shù)據(jù)庫具有物理上的獨立性、邏輯上的一體性、性能上的可擴展性等特點()(1分)A、正確B、錯誤答案:A解析:

暫無解析4.MapReduce性能優(yōu)化的評估大部分都是基于Counter的數(shù)值表現(xiàn)出來的;()(1分)A、正確B、錯誤答案:A解析:

暫無解析5.大數(shù)據(jù)的存儲方案通常對一份數(shù)據(jù)在不同節(jié)點上存儲多份副本,以提高系統(tǒng)容錯性()(1分)A、正確B、錯誤答案:A解析:

暫無解析6.關鍵字參數(shù)返回的是字典。()(1分)A、正確B、錯誤答案:A解析:

暫無解析7.關鍵字參數(shù)可以和其他類型的參數(shù)一起來使用,如果要一起使用的話,關鍵字參數(shù)必須在最后面。()(1分)A、正確B、錯誤答案:A解析:

暫無解析8.沿負梯度下降的方向一定是最優(yōu)的方向;()(1分)A、正確B、錯誤答案:B解析:

暫無解析9.假設x是含有5個元素的列表,那么切片操作x[10:]是無法執(zhí)行的,會拋出異常()(1分)A、正確B、錯誤答案:A解析:

暫無解析10.類的封裝是將抽象得到的屬性和方法封裝到一個類中,增強安全性和簡化編程,使用者不必了解具體的實現(xiàn)細節(jié),只需要通過外部接口,依據(jù)特定的訪問權限來使用類的成員和方法;()(1分)A、正確B、錯誤答案:A解析:

暫無解析11.靜態(tài)方法、類方法都可以被對象調(diào)用;()(1分)A、正確B、錯誤答案:A解析:

暫無解析12.對于文本分類來說,最重要的是如何將一句話映射到向量空間,同時保持其語義特征。(1分)A、正確B、錯誤答案:A解析:

暫無解析13.類多態(tài)是不同的對象調(diào)用相同的函數(shù),產(chǎn)生不同的效果()(1分)A、正確B、錯誤答案:A解析:

暫無解析14.Spark基于內(nèi)存計算,本身可以直接讀寫Hadoop上任何格式數(shù)據(jù),其應用程序在集群上以獨立的進程集合的形式運行()(1分)A、正確B、錯誤答案:A解析:

暫無解析15.類別不平衡就是指分類任務中相同類別的訓練樣例數(shù)目差別很大的情況。()(1分)A、正確B、錯誤答案:B解析:

暫無解析16.在Python中,元組與列表類似,區(qū)別是在列表中任意元素可以通過索引進行修改,而元組中元素不可更改只能讀?。?)(1分)A、正確B、錯誤答案:A解析:

暫無解析17.鏈式MapReduce計算中,對任意一個MapReduce作業(yè),Map和Red

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論