版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
試卷科目:大數(shù)據(jù)挖掘技術練習大數(shù)據(jù)挖掘技術練習(習題卷7)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)挖掘技術練習第1部分:單項選擇題,共51題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.如下表所示,交易號(D)商品(tems)1beer,diaper,nuts2beer,biscuit,diaper3bread,butter,cheese4beer,cheese,diaper,nuts5beer,butter,cheese,nuts1)X={butter,cheese},則支持度support()=()。A)2/5B)4/5C)1/5D)3/5答案:A解析:[單選題]2.S6a接口基于以下哪個協(xié)議A)GTPB)SCTPC)DiameterD)S1-AP答案:C解析:[單選題]3.協(xié)同過濾分析用戶興趣,在用戶群中找到指定用戶的相似(興趣)用戶,綜合這些用戶對某一信息的評價,形成系統(tǒng)對該指定用戶對此信息的喜好程度(),并將這些用戶喜歡的項推薦給有相似興趣的用戶。A)相似B)相同C)推薦D)預測答案:D解析:[單選題]4.聯(lián)機分析處理包括以下不是基本分析功能的為:()A)聚類B)切片C)轉軸D)切塊答案:A解析:[單選題]5.線性模型中使用的函數(shù)不包括()A)g(x)聯(lián)系函數(shù)B)單位階躍函數(shù)C)Sigmoid函數(shù)D)API函數(shù)答案:D解析:[單選題]6.有關數(shù)據(jù)倉庫的開發(fā)特點,下列說法()是不正確的。A)數(shù)據(jù)倉庫開發(fā)要從數(shù)據(jù)出發(fā)B)數(shù)據(jù)倉庫使用的需求在開發(fā)出來后才會明確C)數(shù)據(jù)倉庫開發(fā)是一個不斷循環(huán)的過程D)數(shù)據(jù)倉庫中數(shù)據(jù)的分析和處理十分靈活,沒有固定的開發(fā)模式答案:B解析:[單選題]7.某超市研究銷售記錄發(fā)現(xiàn),購買奶的很概率會購買包,這種屬于數(shù)據(jù)挖掘的哪類問題?()A)聚類分析B)關聯(lián)規(guī)則C)分類分析D)自然語言處理答案:B解析:[單選題]8.在BP神經(jīng)網(wǎng)絡中,只有相鄰的神經(jīng)層的各個單元之間有聯(lián)系,除了輸出層外,每一層都有一個()A)關聯(lián)B)連接C)偏置結點D)輸入答案:C解析:[單選題]9.矩估計的基本原理是()A)用樣本矩估計總體矩B)使得似然函數(shù)達到最大C)使得似然函數(shù)達到最小D)小概率事件在一次試驗中是不可能發(fā)生的答案:A解析:[單選題]10.視頻業(yè)務流程可以分為播放準備階段和播放階段,其中屬于播放階段KQI指標有()A)停頓次數(shù)B)視頻播放等待時長C)初始緩沖成功率D)初始緩沖時長答案:A解析:[單選題]11.使用python處理缺失值的方法中敘述錯誤的是()。A)fillna()填充缺失值B)dropna()刪除缺失值C)isnull()判斷缺失值D)interpolate()使用中位數(shù)填充缺失值答案:D解析:[單選題]12.考慮值集{12243324556826},其四分位數(shù)極差是:A)31B)24C)55D)3答案:A解析:[單選題]13.查詢x的字符集需要使用______函數(shù)?A)charset(x)B)collation(x)C)convert(x)D)set(x)答案:A解析:[單選題]14.以下那一項不是大數(shù)據(jù)提供的用戶交互方式是()。A)企業(yè)報表;B)查詢C)大數(shù)據(jù)分析挖掘D)可視化答案:A解析:[單選題]15.如何在瀏覽器中查找Namenode?A)如果你確實需要在瀏覽器中查找Namenode,Namenode的端口號是30070B)如果你確實需要在瀏覽器中查找Namenode,Namenode的端口號是40070C)如果你確實需要在瀏覽器中查找Namenode,Namenode的端口號是50070D)如果你確實需要在瀏覽器中查找Namenode,Namenode的端口號是60070答案:C解析:[單選題]16.以下哪條屬于個人信息影響的評估場景:()A)處理敏感個人信息,利用個人信息進行自動化決策B)委托處理個人信息、向第三方提供個人信息、公開個人信息C)向境外提供個人信息D)以上皆是答案:D解析:[單選題]17.設X={1,2,3}是頻繁項集,則可由X可產(chǎn)生()個關聯(lián)規(guī)則。A)3B)4C)5D)6答案:D解析:[單選題]18.已知對一組觀察值(xi,yi)作出散點圖后確定具有線性相關關系,若對于y=bx+a,求得b=0.51,x=61.75,y=38.14,則線性回歸方程為()。A)y=0.51x+6.65B)y=42.30x+0.51C)y=6.65x+0.51D)y=0.51x+42.30答案:A解析:[單選題]19.考慮值集{12,24,33,2,4,55,68,26},其四分位數(shù)極差是:()A)31B)24C)55D)3答案:A解析:[單選題]20.下面哪個協(xié)議用于發(fā)現(xiàn)設備的硬件地址A)IPB)RARPC)ARPD)ICMP答案:C解析:[單選題]21.AI是()的英文縮寫A)AutomaticIntelligenceB)ArtificialIntelligenceC)AutomaticInformationD)ArtificialInformation答案:B解析:[單選題]22.os的下列函數(shù)中,用來給文件重命名的是?A)remove()B)rename()C)system()D)listdir()答案:B解析:[單選題]23.最小最大規(guī)范化方法MinMaxScaler屬于python中的哪個包()。A)numpyB)scipyC)pandasD)sklearn答案:D解析:[單選題]24.大數(shù)據(jù)背景下,數(shù)據(jù)支撐業(yè)務的目的是()A)建立數(shù)據(jù)科學B)完成數(shù)據(jù)應用C)配備數(shù)據(jù)硬件D)吸納數(shù)據(jù)人才答案:B解析:[單選題]25.OnRetDW系統(tǒng)建模采用的是()。A)星形模型B)雪花模型C)事實星座模型D)關系數(shù)據(jù)庫模型答案:A解析:[單選題]26.在一個C類地址的網(wǎng)段中要劃分出15個子網(wǎng),下面哪個子網(wǎng)掩碼比較適合A)255.255.255.252B)255.255.255.240C)255.255.255.248D)255.255.255.255答案:B解析:[單選題]27.Python標準庫os中用來列出指定文件夾中的文件和子文件夾列表的方式是A)dir()B)isfile()C)listdir()D)isdir()答案:C解析:[單選題]28.在Excel工作表中,在某單元格內輸入數(shù)值123,不正確的輸入形式是()A)123B)=123C)+123D)*123答案:D解析:[單選題]29.基于()算法,實現(xiàn)人流量、業(yè)務量、話務量等因素對無線資源的精準預測A)神經(jīng)網(wǎng)絡B)K-meansC)K-medoidsD)FP-growth答案:A解析:[單選題]30.模型樹的葉子結點對應()。A)一個數(shù)值B)以上都可以C)一個線性回歸方程D)某個類別答案:C解析:[單選題]31.面對人工智能可能存在高度風險,暗藏危機,我們應()A)因人類的生物進化速度相當有限,終將被人工智能淘汰,所以要阻斷人工智能發(fā)展B)人工智能對人類造成威脅論調沒有科研依據(jù),人工智能可以隨意發(fā)展C)以盡力發(fā)展為前提,擁抱AI技術的同時,多多考慮如何避免損害人類D)不必去面對此類問題答案:C解析:[單選題]32.下面度量方法中不屬于評價不平衡類問題分類的是()。A)F1度量B)召回率C)精度D)廣度答案:D解析:[單選題]33.DBSCAN在最壞情況下的時間復雜度是()。A)O(m)B)O(m2)C)O(logm)D)O(m*logm)答案:B解析:[單選題]34.通過加入特定的____,可以將爬蟲發(fā)出的請求偽裝成瀏覽器。A)RequestB)openerC)HeadersD)User_Agent答案:C解析:[單選題]35.《數(shù)據(jù)安全法》發(fā)布執(zhí)行時間()。A)2021年9月1日;B)2021年10月1日;C)2021年11月1日D)2021年12月1日答案:A解析:[單選題]36.selectright('長江長城黃山黃河',2)返回的是______。A)長江B)長城C)黃山D)黃河答案:D解析:[單選題]37.下面關于因子分析的說法正確的是()A)因子分析就是主成分分析B)因子之間可相關也可不相關C)因子受量綱的影響D)可以對因子進行旋轉,使其意義更明顯答案:D解析:[單選題]38.Python語句A=[1,2,3,None,[[]],[]]Print(len(a))以上代碼的運行結果是()A)4B)5C)6D)7答案:C解析:[單選題]39.以下關于SELECT語句敘述錯誤的是______。A)SELECT語句中可以使用別名B)SELECT語句中只能包含表中的字段列及其構成的表達式C)SELECT語句規(guī)定了結果集中的列順序D)如果FROM子句引用的兩個表有同名的列,則SELECT語句引用這些列時必須添加表名稱作為前綴答案:B解析:[單選題]40.KNN算法可以用于()A)分類B)回歸C)測試D)分類和回歸答案:D解析:[單選題]41.BeautifulSoup庫在進行標簽樹下行遍歷時,以列表形式返回兒子節(jié)點的代碼是哪個?A)contentB)childrenC)descendantsD)string答案:A解析:[單選題]42.下列算法中,不屬于外推法的是()。A)移動平均法B)回歸分析法C)指數(shù)平滑法D)季節(jié)指數(shù)法答案:B解析:[單選題]43.下面哪個關鍵字用來定義函數(shù)?A)defB)defineC)functionD)class答案:A解析:[單選題]44.lr.fit(X_train,y_train)語句的目的為()A)建立LR模型B)導入數(shù)據(jù)并觀察C)查看數(shù)據(jù)框D)用處理好的數(shù)據(jù)訓練模型答案:D解析:[單選題]45.下述哪種方法可以對評估模型發(fā)現(xiàn)模型存在偏差的問題進行改進A)增加特征B)減少特征C)增加數(shù)據(jù)D)減少數(shù)據(jù)答案:A解析:[單選題]46.考慮這么一種情況:一個對象碰巧與另一個對象相對接近,但屬于不同的類,因為這兩個對象一般不會共享許多近鄰,所以應該選擇()的相似度計算方法。A)平方歐幾里德距離B)余弦距離C)直接相似度D)共享最近鄰答案:D解析:[單選題]47.服務器返回某個響應報頭的取值如下:Content-Type:text/html;charset=utf-8對于上述報頭所表示的含義,描述正確的是()。A)客戶端使用utf-8格式對資源進行解碼,然后對資源進行HTML解析B)客戶端使用HTML格式對資源進行解碼,然后對資源進行utf-8解析C)客戶端使用utf-8格式對資源進行編碼,然后對資源進行HTML解析D)客戶端使用HIML格式對資源進行編碼,然后對資源進行utf-8解析答案:C解析:[單選題]48.把多維空間劃分成組屬于數(shù)據(jù)挖掘的哪一類任務A)探索性數(shù)據(jù)分析B)建模描述C)預測建模D)尋找模式和規(guī)則答案:B解析:[單選題]49.向量x=[1,2,3,4,5,0]的L1范數(shù)是多少A)5B)15C)6D)55答案:B解析:[單選題]50.執(zhí)行以下操作后,list_two的值是:List_one=[4,5,6]list_two=list_onelist_one[2]=3A)[4,5,6]B)[4,3,6]C)[4,5,3]D)都不對答案:C解析:[單選題]51.下列關于數(shù)據(jù)重組的說法中,錯誤的是()A)數(shù)據(jù)重組是數(shù)據(jù)的重新生產(chǎn)和重新采集B)數(shù)據(jù)重組能夠使數(shù)據(jù)煥發(fā)新的光芒C)數(shù)據(jù)重組實現(xiàn)的關鍵在于多源數(shù)據(jù)融合和數(shù)據(jù)集成D)數(shù)據(jù)重組有利于實現(xiàn)新穎的數(shù)據(jù)模式創(chuàng)新答案:A解析:第2部分:多項選擇題,共17題,每題至少兩個正確答案,多選或少選均不得分。[多選題]52.KQI與KPI指標做關聯(lián)分析,通??刹捎媚膬深愃惴ǚ謩e做強、弱關聯(lián)關系的識別A)聚類B)相關系數(shù)C)決策樹D)邏輯回歸答案:AB解析:[多選題]53.在集團公司四維十輪網(wǎng)絡質量評估體系中,評估共享單車業(yè)務感知的主要指標包括:A)共享單車業(yè)務響應成功率(%)B)共享單車業(yè)務響應時延(ms)C)共享單車業(yè)務下載速率(kbps)D)共享單車業(yè)務解鎖時延(ms)答案:AB解析:[多選題]54.XDR共享審核記錄中,至少包括以下哪些共享信息A)系統(tǒng)名稱B)使用數(shù)據(jù)用途C)共享數(shù)據(jù)類型D)共享數(shù)據(jù)范圍答案:ABCD解析:[多選題]55.在比較不同預測方法的精確度時,通常采用()等誤差指標來衡量預測誤差的大小。A)絕對誤差B)相對誤差C)平均誤差D)隨機誤差答案:ABC解析:[多選題]56.EPC中的專有承載建立流程涉及哪些網(wǎng)元?()A)CGB)MMEC)SGWD)PGW答案:BCD解析:[多選題]57.模型選擇有哪三個關鍵問題()A)評估方法。如何獲得測試結果B)性能度量。如何評估性能優(yōu)劣C)比較檢驗。如何判斷實質差別D)實施分析。如何更快更好實施答案:ABC解析:[多選題]58.定基發(fā)展速度與環(huán)比發(fā)展速度的關系有()。A)各環(huán)比發(fā)展速度之和等于相應的定基發(fā)展速度B)各環(huán)比發(fā)展速度之積等于相應的定基發(fā)展速度C)兩個環(huán)比發(fā)展速度之商等于相應的定基發(fā)展速度D)兩個定基發(fā)展速度之商等于相應的環(huán)比發(fā)展速度答案:BD解析:[多選題]59.以下哪個用戶上網(wǎng)流程不屬于業(yè)務面A)網(wǎng)絡附著B)TCP握手C)承載建立D)TAU更新答案:ACD解析:[多選題]60.分箱方法有哪些?()A)等深分箱B)等寬分箱C)數(shù)據(jù)標準化D)自定義區(qū)間法答案:ABD解析:[多選題]61.HDFS(分布式文件系統(tǒng))作為Hadoop生態(tài)系統(tǒng)的數(shù)據(jù)存儲基礎,其特點為()A)支持超大文件B)基于商用硬件C)流式數(shù)據(jù)訪問D)高吞吐量答案:ABCD解析:[多選題]62.數(shù)據(jù)挖掘(DataMining)就是從()實際應用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。A)大量的B)不完全的C)有噪聲的D)模糊的答案:ABCD解析:[多選題]63.隨機數(shù)的產(chǎn)生取決于種子,隨機數(shù)和種子之間的關系遵從以下兩個規(guī)則()A)種子不同,產(chǎn)生不同的隨機數(shù)B)種子不同,產(chǎn)生的隨機數(shù)可相同C)種子相同,即使實例不同也產(chǎn)生相同的隨機數(shù)D)種子相同,實例不同產(chǎn)生不同的隨機數(shù)答案:AC解析:[多選題]64.下列項目中,其變動可以改變盈虧平衡點位置的因素有()A)單價B)單位變動成本C)銷量D)固定成本答案:ABCD解析:[多選題]65.根據(jù)《終端分芯片版本精細化分析落地手冊》,終端分析呈現(xiàn)的指標維度可以包括A)終端級B)版本級C)芯片級D)地市級答案:ABCD解析:[多選題]66.在日常分析中,端到端上行丟包率差,以下哪個無線因素會對該指標造成影響A)弱覆蓋B)干擾C)基站故障D)數(shù)據(jù)制作錯誤答案:ABC解析:[多選題]67.在有關數(shù)據(jù)倉庫測試,下列說法中正確的是()A)在完成數(shù)據(jù)倉庫的實施過程中,需要對數(shù)據(jù)倉庫進行各種測試.測試工作中要包括單元測試和系統(tǒng)測試B)當數(shù)據(jù)倉庫的每個單獨組件完成后,就需要對他們進行單元測試C)系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進行大量的功能測試和回歸測試D)在測試之前可以不制定詳細的測試計劃,測試過程中實時調整。答案:ABC解析:[多選題]68.下面屬于數(shù)據(jù)集的一般特性的有:()A)連續(xù)性B)維度C)稀疏性D)分辨率E)相異性答案:BCD解析:第3部分:判斷題,共20題,請判斷題目是否正確。[判斷題]69.seleinum支持瀏覽器的功能,可以直接被用來執(zhí)行命令。A)正確B)錯誤答案:錯解析:[判斷題]70.爬蟲的主要目的是將互聯(lián)網(wǎng)上的網(wǎng)頁下載到本地形成一個或聯(lián)網(wǎng)內容的鏡像備份。A)正確B)錯誤答案:對解析:[判斷題]71.分類問題屬于有監(jiān)督學習任務。A)正確B)錯誤答案:對解析:[判斷題]72.回歸系數(shù)的檢驗可以采用t檢驗。A)正確B)錯誤答案:對解析:[判斷題]73.Apriori算法是一種典型的關聯(lián)規(guī)則挖掘算法。()A)正確B)錯誤答案:對解析:[判斷題]74.攝氏溫度屬于比例屬性。A)正確B)錯誤答案:錯解析:[判斷題]75.Bayes法是一種在已知后驗概率與類條件概率的情況下的模式分類方法,待分樣本的分類結果取決于各類域中樣本的全體。A)正確B)錯誤答案:錯解析:[判斷題]76.定量屬性可以是整數(shù)值或者是連續(xù)值。A)正確B)錯誤答案:對解析:[判斷題]77.在K-中心點聚類算法中,非中心對象可以替代中心對象的條件是替代后總代價大于零。A)正確B)錯誤答案:錯解析:[判斷題]78.k均值算法對于離群點不敏感。()A)正確B)錯誤答案:錯解析:[判斷題]79.數(shù)據(jù)挖掘的目標不在于數(shù)據(jù)采集策略,而在于對于已經(jīng)存在的數(shù)據(jù)進行模式的發(fā)掘。A)正確B)錯誤答案:對解析:[判斷題]80.使用write方法寫入文件時,數(shù)據(jù)會追加到文件的末尾。A)正確B)錯誤答案:錯解析:a的方式是追加[判斷題]81.對于非對稱的二元屬性,兩個都取值1的情況(正匹配)被認為比兩個都取值0的情況(負匹配)更有意義,其中負匹配數(shù)t被認為是不重要的,因此在計算時可以忽略。A)正確B)錯誤答案:對解析:[判斷題]82.read方法只能一次性讀取文件中的所有數(shù)據(jù)。A)正確B)錯誤答案:錯解析:錯誤,可以按字節(jié)大小讀取數(shù)據(jù),例如:read(3),表示讀取3個字節(jié)的數(shù)據(jù)。[判斷題]83.關聯(lián)規(guī)則挖掘過程是發(fā)現(xiàn)滿足最小支持度的所有項集代表的規(guī)則。A)正確B)錯誤答案:錯解析:[判斷題]84.創(chuàng)建只包含一個元素的元組時,必須在元素后面加一個逗號,例如(3,)。A)正確B)錯誤答案:對解析:[判斷題]85.一個函數(shù)如果帶有默認值參數(shù),那么必須所有參數(shù)都設置默認值。A)正確B)錯誤答案:錯解析:[判斷題]86.使用列表對象的remove()方法可以刪除列表中首次出現(xiàn)的指定元素,如果列中不存在要刪除的指定元素則拋出異常。A)正確B)錯誤答案:對解析:[判斷題]87.假設x是含有5個元素的列表,那么切片操作x[10:]是無法執(zhí)行的,會拋出異常。A)正確B)錯誤答案:錯解析:[判斷題]88.利用項的概念層次信息,不僅可以發(fā)現(xiàn)涉及那些出現(xiàn)頻率比較低的商品的頻繁模式和關聯(lián)規(guī)則,而且還可以發(fā)現(xiàn)概括性更強的規(guī)則。A)正確B)錯誤答案:對解析:第4部分:問答題,共12題,請在空白處填寫正確答案。[問答題]89.在FP-Growth算法中,F(xiàn)P-Tree的構建過程是將事務數(shù)據(jù)表中的各個事務數(shù)據(jù)項按照____排序后,把每個事務中的數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 施工現(xiàn)場施工防臺風災害威脅制度
- 數(shù)字化時代下的客戶分析與銷售策略
- 現(xiàn)代辦公技術與應用實踐培訓
- 數(shù)學圖形在兒童智力開發(fā)中的作用
- 科學實驗教學對小學生綜合素質的培養(yǎng)策略
- 項目突發(fā)環(huán)境事件應急預案
- 二手車批發(fā)合作合同協(xié)議
- 個人向個人臨時借款合同模板
- 上海市租賃合同模板及示例
- 不銹鋼期貨電子交易合同
- 云南省曲靖市羅平縣2024-2025學年高二上學期期末地理試題( 含答案)
- 中國糖尿病防治指南(2024版)要點解讀
- Unit 1 Nice boys and girls【知識精研】-一年級英語下學期(人教PEP版一起)
- 2024年高考數(shù)學(理)試卷(全國甲卷)(空白卷)
- 2024版CSCO胰腺癌診療指南解讀課件
- 《應急管理行政執(zhí)法人員依法履職管理規(guī)定》知識培訓
- 九宮數(shù)獨200題(附答案全)
- 中考數(shù)學試題(含答案)共12套
- 公司財務制度及流程
- 深圳版初中英語單詞匯總
- 健康養(yǎng)生,快樂生活課件
評論
0/150
提交評論