大數(shù)據(jù)挖掘技術練習(習題卷17)_第1頁
大數(shù)據(jù)挖掘技術練習(習題卷17)_第2頁
大數(shù)據(jù)挖掘技術練習(習題卷17)_第3頁
大數(shù)據(jù)挖掘技術練習(習題卷17)_第4頁
大數(shù)據(jù)挖掘技術練習(習題卷17)_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

試卷科目:大數(shù)據(jù)挖掘技術練習大數(shù)據(jù)挖掘技術練習(習題卷17)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)挖掘技術練習第1部分:單項選擇題,共51題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.通過4G信令+寬帶信令+掌廳APP數(shù)據(jù)關聯(lián)分析,可以對用戶終端連接WIFI識別的行為不包括A)移動終端WIFI連移動寬帶B)移動終端WIFI連異網(wǎng)寬帶C)異網(wǎng)終端WIFI連移動寬帶D)異網(wǎng)終端WIFI連異網(wǎng)寬帶答案:D解析:[單選題]2.()博士和洪小文一起構建了世界上第一個大詞匯量、非特定人、連續(xù)語音A)瑞迪B)李開復C)吳軍D)弗雷德答案:B解析:[單選題]3.EPC核心網(wǎng)網(wǎng)元SGW主要功能不包括()A)移動性及切換支持B)計費C)IP地址分配D)合法監(jiān)聽答案:C解析:[單選題]4.在計算時,取其中,是()A)一個學習率,取值為0~1B)一個學習率,取值為-1~1C)一個閾值,取值為0~1D)一個閾值,取值為一1~1答案:A解析:[單選題]5.有些數(shù)據(jù)挖掘算法,要求數(shù)據(jù)屬性是標稱類別,當數(shù)據(jù)中包含數(shù)值屬性時,為了使用這些算法需要將數(shù)值屬性轉(zhuǎn)換成標稱屬性。通過采取各種方法將數(shù)值屬性的值域劃分成一些小的區(qū)間,并將這連續(xù)的小區(qū)間與離散的值關聯(lián)起來,每個區(qū)間看作一個類別。例如,某個問題中的年齡屬性一種可能的劃分成類別操作是:[0…11]→兒童,[12…17]→青少年,[18…44]→青年,[45…69]→中年,[69…∞]→老年。這種將連續(xù)變量劃分成不同類別的過程通常稱為()。A)特征化B)優(yōu)化C)標準化D)離散化答案:D解析:[單選題]6.只有非零值才重要的二元屬性被稱作A)計數(shù)屬性B)離散屬性C)非對稱的二元屬性D)對稱屬性答案:C解析:[單選題]7.容量估算與()互相影響A)鏈路預算B)PCI規(guī)劃C)建網(wǎng)成本D)網(wǎng)絡優(yōu)化答案:A解析:[單選題]8.GY口通過什么消息進行能力協(xié)商A)CER/CEAB)CER/CCAC)DWR/DWAD)RAR/RAA答案:A解析:[單選題]9.RFM方法中的F說明客戶的()A)興趣度B)粘性C)當前價值D)未來價值答案:A解析:[單選題]10.關于OLAP和OLTP的區(qū)別描述,不正確的是:()A)OLAP主要是關于如何理解聚集的大量不同的數(shù)據(jù).它與OTAP應用程序不同B)與OLAP應用程序不同,OLTP應用程序包含大量相對簡單的事務C)OLAP的特點在于事務量大,但事務內(nèi)容比較簡單且重復率高D)OLAP是以數(shù)據(jù)倉庫為基礎的,但其最終數(shù)據(jù)來源與OLTP一樣均來自底層的數(shù)據(jù)庫系統(tǒng),兩者面對的用戶是相同的答案:C解析:[單選題]11.在數(shù)據(jù)預處理中,將錯誤的、不一致的數(shù)據(jù)予以更正或刪除,以免影響挖掘結果的正確性,這一過程稱為()A)數(shù)據(jù)提取B)數(shù)據(jù)轉(zhuǎn)換C)數(shù)據(jù)清理D)數(shù)據(jù)加載答案:C解析:[單選題]12.()是統(tǒng)計學的基礎,是統(tǒng)計學里面最重要的概率分布A)正態(tài)分布;B)靜態(tài)分布C)動態(tài)分布D)穩(wěn)態(tài)分布答案:A解析:[單選題]13.在基本K均值算法里,當鄰近度函數(shù)采用()的時候,合適的質(zhì)心是簇中各點的中位數(shù)。A)曼哈頓距離B)平方歐幾里德距離C)余弦距離D)Bregman散度答案:A解析:[單選題]14.()是K-Means內(nèi)部指標A)Jaccard系數(shù)B)FM指數(shù)C)DB指數(shù)D)Rand(蘭德)指數(shù)答案:C解析:[單選題]15.物聯(lián)網(wǎng)業(yè)務的DNS解析環(huán)節(jié)DNS解析返回的錯誤碼為Resultcode=1,代表何種含義A)成功B)格式錯誤,無法解析C)域名服務器錯誤D)DNS不支持該請求答案:B解析:[單選題]16.關于OLAP和OLTP的說法,下列不正確的是:A)OLAP事務量大,但事務內(nèi)容比較簡單且重復率高.B)OLAP的最終數(shù)據(jù)來源與OLTP不一樣.C)OLTP面對的是決策人員和高層管理人員.D)OLTP以應用為核心,是應用驅(qū)動的.答案:A解析:[單選題]17.IP報文頭中固定長度部分為多少字節(jié)()A)10B)20C)30D)40答案:B解析:[單選題]18.在數(shù)據(jù)分析和處理方面具有分析方法豐富、分析模型擴展差、數(shù)據(jù)挖掘能力強等特點的分析工具是()。A)WekaB)SPSSC)SASD)R答案:B解析:[單選題]19.LTE中的TA概念哪個是錯誤的()A)TAI由MCC+MNC+TAC三部分組成B)TAC的FQDN格式為:tac-hb<x1x2>.tac-lb<x3x4>.tac.epc.mnc<MNC>.mcc<MCC>.3C)TAC與LAC可重疊使用D)一個TA可由一個或多個小區(qū)構成答案:B解析:[單選題]20.下列選取節(jié)點的表達式中,代表著從根節(jié)點開始選取的是____。A)/B)//C)nameD)@答案:A解析:[單選題]21.有關OnRetDw系統(tǒng)的敘述中正確的是()A)OnRetDW系統(tǒng)是一個實現(xiàn)在線交易的系統(tǒng)B)OnRetDW系統(tǒng)是一個可以完成任意商品信息分析的系統(tǒng)C)OnRetDW系統(tǒng)是一個面向特定主題的數(shù)據(jù)倉庫系統(tǒng)D)以上都不對答案:C解析:[單選題]22.資金的時間價值是()A)同一資金在同一時點上價值量的差額B)同一資金在不同時點上價值量的差額C)不同資金在同一時點上價值量的差額D)不同資金在不同時點上價值量的差額答案:B解析:[單選題]23.請問以下何者屬于時間序列的問題?A)信用卡發(fā)卡銀行偵測潛在的卡奴B)基金經(jīng)理人針對個股做出未來價格預測C)電信公司將人戶區(qū)分為數(shù)個群體D)以上均不是答案:B解析:[單選題]24.在Scikit-learn模塊下,不同分類模型在預測時,調(diào)用的方法名稱()。A)相同B)視情況而定C)不知道D)不同答案:A解析:[單選題]25.要求滿足連接條件的記錄,以及連接條件左側(cè)表中的記錄都包含在結果中,應使用______。A)左連接B)右連接C)內(nèi)部連接D)完全連接答案:A解析:[單選題]26.什么是KDD?A)數(shù)據(jù)挖掘與知識發(fā)現(xiàn)B)領域知識發(fā)現(xiàn)C)文檔知識發(fā)現(xiàn)D)動態(tài)知識發(fā)現(xiàn)答案:A解析:[單選題]27.在比較模型的擬合效果時,甲、乙、丙、丁四個模型的決定系數(shù)R^2的值分別約為0.96、0.85、0.80和0.7,則擬合效果好的模型是()。A)丁B)乙C)丙D)甲答案:D解析:[單選題]28.關于python說法錯誤的是()A)python字典中的?健?可以是元組B)python集合中元素不允許重復C)python字典中的?值?不允許重復D)python集合中的元素可以是列表答案:D解析:[單選題]29.有關樸素貝葉斯分類算法的敘述中正確的是()A)樸素貝葉斯分類算法是一種精確的分類算法B)采用樸素貝葉斯分類算法將一個樣本分到某個類別中,表示它100%屬于該類別C)樸素貝葉斯分類算法是一種基于概率的分類算法D)以上都不對答案:C解析:[單選題]30.以下哪個指標不能用于線性回歸中的模型比較()A)R方B)調(diào)整R方C)AICD)BIC答案:A解析:[單選題]31.建立一個模型,通過這個模型根據(jù)已知的變量值來預測其他某個變量值屬于數(shù)據(jù)挖掘的哪一類任務?A)根據(jù)內(nèi)容檢索B)建模描述C)預測建模D)尋找模式和規(guī)則答案:C解析:[單選題]32.在上題中,屬于定量的屬性類型是:A)標稱B)序數(shù)C)區(qū)間D)相異答案:C解析:[單選題]33.UE和MME間的RRC連接以及s1連接釋放后,UE的EMM和ECM狀態(tài)正確的是A)Deregistered;idleB)Registered;ConnectedC)Registered;idleD)Deregistered;Connected答案:A解析:[單選題]34.運行以下代碼?importmatplotlib.pyplotasplt?引入plt后,要繪制折線圖,需要利用的函數(shù)為()。A)plt.pie()B)plt.hist()C)plt.plot()D)plt.bar()答案:C解析:[單選題]35.準備好數(shù)據(jù),進行深度學習建模時,第一步需要做的是()A)確定激活函數(shù)B)選擇網(wǎng)絡結構C)定義學習目標D)選擇優(yōu)化算法答案:B解析:[單選題]36.人工智能時代來臨,新競技將更加殘酷,在商場上可行的是()A)不放棄既原有市場,寄望通過專利保護來阻擋新技術B)面對革命性的技術出現(xiàn),依然固守傳統(tǒng)思維與產(chǎn)品C)退出商場D)開放的心態(tài)迎接人工智能的到來,積極適應新市場,學習創(chuàng)造新技術答案:D解析:[單選題]37.設X={1,2,3}是頻繁項集,則可由X產(chǎn)生____個關聯(lián)規(guī)則。A)4B)5C)6D)7答案:C解析:[單選題]38.對MOLAP和ROLAP的比較中錯誤的是()A)MOLAP的查詢能力一般較好,而在ROLPA中進行查詢,往往很難預料查詢結果B)MOLAP所需要的數(shù)據(jù)加載時間較長,而ROLAP的數(shù)據(jù)加載時間比MOLAP短C)ROLAP比MOLAP的分析速度要快很多D)MOLAP在分析過程中精度較高,具有分析的優(yōu)勢答案:C解析:[單選題]39.有關數(shù)據(jù)抽取工具的敘述中正確的是()A)只能使用數(shù)據(jù)倉庫開發(fā)工具所提供的數(shù)據(jù)抽取工具B)只能使用開發(fā)人員自己開發(fā)的數(shù)據(jù)抽取工具C)根據(jù)實際需要確定是否自己開發(fā)數(shù)據(jù)抽取工具D)以上都不對答案:C解析:[單選題]40.邁克爾·波特的?五力模型?中,五種競爭力量中不包括()A)新進入者B)供應商議價能力C)其他利益相關者力量D)行業(yè)中現(xiàn)有競爭者答案:C解析:[單選題]41.數(shù)值預測用于連續(xù)變量的取值,常用的預測方法是()A)關聯(lián)B)聚類C)回歸分析D)分類答案:C解析:[單選題]42.在進行VOLTE端到端八元六階定界時,下列哪個不屬于六階A)附著B)TAUC)eSRVCC切換D)語音質(zhì)量答案:B解析:[單選題]43.Logistic回歸是在商業(yè)領域上使用最廣泛的預測模型,常用于()分類變量預測和概率預測。A)四值B)三值C)二值D)一值答案:C解析:[單選題]44.OLAP的含義是()A)面向?qū)ο蠓治鎏幚鞡)面向過程分析處理C)聯(lián)機事務處理D)聯(lián)機分析處理答案:D解析:[單選題]45.三層神經(jīng)網(wǎng)絡中,()可以有一層或多層。A)輸入層B)輸出層C)隱藏層D)前饋層答案:C解析:[單選題]46.關于SQLServer分析服務的敘述中正確的是()A)SQLServer分析服務是關系數(shù)據(jù)庫開發(fā)工具限B)SQLServer分析服務可以用于OLAPC)SQLServer分析服務是操作型數(shù)據(jù)庫系統(tǒng)開發(fā)工具D)以上都不對答案:B解析:[單選題]47.在FP-GROWTH算法中,已構造FP-Tree如圖則項I5的條件模式基為A)<(I1,I2:1)>、<I1,I3:1>B)<(I2,I1:1)>、<I2,I1,I3:1>C)<(I2,I1:1)>、<I1,I3,I2:1>D)<(I1,I2:1)>、<I2,I1,I3:1>答案:B解析:[單選題]48.當時間序列數(shù)據(jù)點的一階差分近似為一常數(shù),可配合以下哪種預測模型()A)直線B)二次拋物線C)三次拋物線D)指數(shù)曲線答案:A解析:[單選題]49.來自集中性能管理系統(tǒng)的指標是A)4G最差小區(qū)占比(%)B)交通樞紐VoLTE接通率(%)C)高利用率MGCF占比(%)D)網(wǎng)絡安全重大事件次數(shù)(次)答案:B解析:[單選題]50.哪個是在后續(xù)平行節(jié)點中返回一個a標簽的方法?A)find('a')B)find_previous_sibling(a)C)find_next_siblings('a')D)find_next_sibling('a')答案:D解析:題型:[單選題]51.模型構建指基于()數(shù)據(jù)構建數(shù)據(jù)挖掘模型。A)線上B)線下C)實時D)歷史答案:D解析:第2部分:多項選擇題,共17題,每題至少兩個正確答案,多選或少選均不得分。[多選題]52.預處理的任務有哪些()。A)特征提取與特征選擇B)數(shù)據(jù)清洗C)數(shù)據(jù)規(guī)范化D)數(shù)據(jù)離散化答案:ABCD解析:[多選題]53.以下說法正確的有()A)評價預測精度是通過測量與分析預測誤差進行的B)絕對誤差是實際觀測值與預測值的離差C)相對誤差反映實際觀測值與預測值之間差異的相對程度D)平均誤差反映實際觀測值與預測值之間的平均差異答案:ABCD解析:[多選題]54.以下算法中對缺失值敏感的有()A)Logistic回歸B)SVM算法C)CART決策樹D)樸素貝葉斯答案:AB解析:[多選題]55.TD-LTE室內(nèi)覆蓋面臨的挑戰(zhàn)()A)覆蓋場景復雜多樣B)信號頻段較高,覆蓋能力差C)雙流模式對室分系統(tǒng)工程改造要求較高D)與WLAN系統(tǒng)存在復雜的互干擾問題答案:ABCD解析:[多選題]56.噪聲數(shù)據(jù)處理的方法主要有:()A)分箱B)聚類C)關聯(lián)分析D)回歸答案:ABD解析:[多選題]57.界面整體規(guī)劃設計時涉及的工作包括A)確定主題B)選擇合適制作工具C)收集材料D)制作DEMO答案:ABCD解析:[多選題]58.以下關于非頻繁模式說法,正確的是()A)其支持度小于閾值B)都是不讓人感興趣的C)包含負模式和負相關模式D)對異常數(shù)據(jù)項敏感答案:AD解析:[多選題]59.構造線性模型時在發(fā)現(xiàn)(Var1和Var2,Var2和Var3,Var3和Var1)變量間的相關系數(shù)分別是-0.98,0.45,1.23,則下述說法正確的是A)Var1和Var2非常相關B)Var和Var2可以去除其中一個C)Var3和Var1的相關系數(shù)是錯誤的D)Var2和Var3不存在相關性答案:ABC解析:[多選題]60.視頻業(yè)務流程可以分為播放準備階段和播放階段,其中播放準備階段KQI指標包括()A)播放成功率B)視頻播放等待時長C)初始緩沖成功率D)初始緩沖時長答案:ABCD解析:[多選題]61.敏感個人信息劃定依據(jù)()A)與人格尊嚴相關B)與人身.財產(chǎn)安全相關C)不滿十四周歲未成年人的個人信息D)與公司管理要求相關答案:ABC解析:[多選題]62.下列對于IP地址的描述正確的是A)主機部分全為?1?的IP址址稱為有限廣播B)0.x.y.z表示本網(wǎng)絡的指定主機C)一個A類網(wǎng)的IP址址x.0.0.0表示x這個網(wǎng)絡D)IP地址~55屬于保留地址答案:BCD解析:[多選題]63.貝葉斯信念網(wǎng)絡(BBN)有如下哪些特點。()A)構造網(wǎng)絡費時費力B)對模型的過分問題非常魯棒C)貝葉斯網(wǎng)絡不適合處理不完整的數(shù)據(jù)D)網(wǎng)絡結構確定后,添加變量相當麻煩答案:AB解析:[多選題]64.下列哪些指標用于聚類模型的估計()A)silhouette_scoreB)calinski_harabaszC)R2D)F1答案:AB解析:[多選題]65.PCRF支持的邏輯接口包括A)RxB)GxcC)GxD)X2答案:ABC解析:[多選題]66.以下有關隨機森林算法的說法正確的是()A)隨機森林算法的分類精度不會隨著決策樹數(shù)量的增加而提高。B)隨機森林算法對異常值和缺失值不敏感。C)隨機森林算法不需要考慮過擬合問題。D)決策樹之間相關系數(shù)越低.每棵決策樹分類精度越高的隨機森林模型的分類效果越好。答案:ABD解析:[多選題]67.隨機抽樣方法有()A)等距隨機抽樣B)綜合隨機抽樣C)簡單隨機抽樣D)分群隨機抽樣答案:ACD解析:[多選題]68.下面哪些屬于可視化高維數(shù)據(jù)技術()A)矩陣B)平行坐標系C)星形坐標D)散布圖E)Chernoff臉答案:ABCE解析:第3部分:判斷題,共20題,請判斷題目是否正確。[判斷題]69.在AGNES算法中,兩個簇合并的條件是兩個簇的數(shù)據(jù)點間最小距離是所有簇中最小的。A)正確B)錯誤答案:對解析:[判斷題]70.在一元線性回歸模型中,變量顯著性檢驗與方程顯著性檢驗都要進行,不能相互替代。A)正確B)錯誤答案:錯解析:[判斷題]71.創(chuàng)建BeautifulSoup類實例時,如果沒有明確指定解析器,那么該實例肯定會選擇Python標準庫。A)正確B)錯誤答案:錯解析:[判斷題]72.數(shù)據(jù)根據(jù)計量尺度不同可以分為分類數(shù)據(jù)和數(shù)值型數(shù)據(jù)。A)正確B)錯誤答案:錯解析:[判斷題]73.字典中鍵必須唯一,但值不必。A)正確B)錯誤答案:對解析:[判斷題]74.如果事件A,B互斥,且P(A)>0,P(B)>0,則A,B獨立。A)正確B)錯誤答案:錯解析:[判斷題]75.?k近鄰方法不需要事先學習分類模型,當需要預測的時候,根據(jù)預測樣本的特性和已知訓練數(shù)據(jù)集中的數(shù)據(jù)進行類別的判斷。A)正確B)錯誤答案:對解析:[判斷題]76.回歸分析主要確定變量之間是否存在相關關系,而相關關系是一種確定性的關系。A)正確B)錯誤答案:錯解析:[判斷題]77.數(shù)據(jù)庫類型是按照數(shù)據(jù)存取的方法來劃分的。A)正確B)錯誤答案:錯解析:[判斷題]78.聚類分析的過程中,聚類效果較好時屬于同一個簇的對象相似度很高,而屬于不同簇的對象相似度很低。A)正確B)錯誤答案:對解析:[判斷題]79.線性回歸模型的擬合優(yōu)度可采用可決系數(shù)進行評判??蓻Q系數(shù)越高,模型擬合效果越好;可決系數(shù)越小,模型擬合效果越差。A)正確B)錯誤答案:錯解析:[判斷題]80.使用正則表達式對字符串進行分割時,可以指定多個分隔符,而字符串對象的split()方法無法做到這一點。A)正確B)錯誤答案:對解析:[判斷題]81.已知x為非空列表,那么表達式sorted(x,reverse=True)==list(reversed(x))的值一定是True。A)正確B)錯誤答案:錯解析:[判斷題]82.Python字典和集合屬于無序序列。A)正確B)錯誤答案:對解析:[判斷題]83.提取聲波的頻率,是數(shù)據(jù)挖掘任務。A)正確B)錯誤答案:錯解析:[判斷題]84.給定最小支持度閾值minsup,一個頻繁項集的所有非空子集都是頻繁的。A)正確B)錯誤答案:對解析:[判斷題]85.假設x為列表對象,那么x.pop()和x.pop(-1)的作用是一樣的。A)正確B)錯誤答案:對解析:[判斷題]86.SVM是這樣一個分類器,他尋找具有最小邊緣的超平面,因此它也經(jīng)常被稱為最小邊緣分類器(minimalmarginclassifier)()A)正確B)錯誤答案:錯解析:[判斷題]87.Python標準庫os中的方法startfile()可以啟動任何已關聯(lián)應用程序的文件,并自動調(diào)用關聯(lián)的程序。A)正確B)錯誤答案:對解析:[判斷題]88.datahoop中輸入的數(shù)據(jù)必須是數(shù)值型的。A)正確B)錯誤答案:錯解析:第4部分:問答題,共12題,請在空白處填寫正確答案。[問答題]89.在sklearn中,為了展示某個因子的不同取值對算法的性能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論