大數(shù)據(jù)挖掘技術(shù)練習練習題及答案2-2023-背題版_第1頁
大數(shù)據(jù)挖掘技術(shù)練習練習題及答案2-2023-背題版_第2頁
大數(shù)據(jù)挖掘技術(shù)練習練習題及答案2-2023-背題版_第3頁
大數(shù)據(jù)挖掘技術(shù)練習練習題及答案2-2023-背題版_第4頁
大數(shù)據(jù)挖掘技術(shù)練習練習題及答案2-2023-背題版_第5頁
已閱讀5頁,還剩90頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

試題說明

本套試題共包括1套試卷

每題均顯示答案和解析

大數(shù)據(jù)挖掘技術(shù)練習練習題及答案2(500題)

大數(shù)據(jù)挖掘技術(shù)練習練習題及答案2

1.[單選題]SAEGateway的功能包括?

A)數(shù)據(jù)的路由和傳播、用戶面數(shù)據(jù)的加密

B)數(shù)據(jù)的路由和傳播、用戶面數(shù)據(jù)的加密、尋呼消息的發(fā)送

C)用戶面數(shù)據(jù)的加密、尋呼消息的發(fā)送、NAC層信令的加密

答案:A

解析:

2.[單選題]凈現(xiàn)值、內(nèi)部收益率、獲利指數(shù)指標之間的數(shù)量關(guān)系()NPV>0

A)當PI<1,時,IRR>iNPV>0

B)當PI>1,時,IRR>iNPV<0

C)當PI<1時,IRR>i,NPVCO、當DPD1IRR>i,時,

答案:B

解析:

3.[單選題]檢測一元正態(tài)分布中的離群點,屬于異常檢測中的基于()的離群點檢測。

A)統(tǒng)計方法

B)鄰近度

C)密度D.聚類技術(shù)

答案:A

解析:

4.[單選題]在無線網(wǎng)絡(luò)覆蓋指標體系中,4G用戶4G流量駐留比的指標定義是?

A)4G活躍用戶群產(chǎn)生的4G上網(wǎng)流量/(4G活躍用戶群產(chǎn)生的移動互聯(lián)網(wǎng)上網(wǎng)總流量)

B)4G活躍用戶群產(chǎn)生的4G上網(wǎng)流量/(2G+3G+4G活躍用戶群產(chǎn)生的移動互聯(lián)網(wǎng)上網(wǎng)總流量)

C)4G活躍用戶群產(chǎn)生的移動互聯(lián)網(wǎng)上網(wǎng)流量/(2G+3G+4G活躍用戶群產(chǎn)生的移動互聯(lián)網(wǎng)上網(wǎng)總流量

答案:A

解析:

5.[單選題]對于DBSCAN,參數(shù)Eps固定,當MinPts取值較大時,會導(dǎo)致()

A)能很好的區(qū)分各類簇

B)只有高密度的點的聚集區(qū)劃為簇,其余劃為噪聲

C)低密度的點的聚集區(qū)劃為簇,其余的劃為噪聲

D)無影響

答案:B

解析:

6.[單選題]以下哪個是不合法的HTTPURL?

A)https://223.252.199.7/course/BIT-1001871002#/

B)news.sina.com.cn:80

C)https://dwz.cn/hMvN8

D)https://210.14.148.99/

答案:B

解析:題型:

7.[單選題]決策樹中不包含以下哪種結(jié)點()。

A)根結(jié)點

B)葉結(jié)點

C)外部結(jié)點

D)內(nèi)部結(jié)點

答案:C

解析:

8.[單選題]下面哪個屬于映射數(shù)據(jù)到新的空間的方法()

A)傅立葉變換

B)特征加權(quán)

C)漸進抽樣

D)維歸約

答案:A

解析:

9.[單選題]設(shè)乂={1,2,3}是頻繁項集,則可由X產(chǎn)生__個關(guān)聯(lián)規(guī)則。

A)4

B)5

06

D)7

答案:C

解析:

10.[單選題]根據(jù)高斯樸素貝葉斯計算后驗概覽比值,確定每個數(shù)據(jù)點可能性最大的標簽,可以采用

哪個評估器

A)skiearn.naive_bayes.GaussianNB

B)sklearn.naivebayes.Gaussian

C)skiearn.naive_bayes.Predict_proba

D)sklearn.naivebayes.PredictSet

答案:A

解析:

11.[單選題]3GppR8及以后的SGSN與MME之間的接口是()

A)S3

B)S12

C)S6

D)S4

答案:A

解析:

12.[單選題]Python科學計算的基本包是()。

A)Matplotlib

B)Pandas

C)Numpy

D)Scikit-learn

答案:C

解析:

13.[單選題]()數(shù)據(jù)挖掘方法能夠幫助市場分析人員找出顧客購買的商品之間的關(guān)聯(lián)關(guān)系

A)分類

B)預(yù)測

C)關(guān)聯(lián)分析

D)聚類

答案:C

解析:

14.[單選題]C4.5算法以()作為分類選擇的依據(jù)。

A)信息炳最大

B)條件嫡最大

C)信息增益最大

D)信息增益率最大

答案:D

解析:

15.[單選題]python不支持的數(shù)據(jù)類型有()

A)char

B)int

C)float

D)list

答案:A

解析:

16.[單選題]下列選項中屬于現(xiàn)金流入的項目是()

A)所得稅

B)建設(shè)投資

C)經(jīng)營成本

D)營業(yè)收入

答案:D

解析:

17.[單選題]樸素貝葉斯算法是一種()數(shù)據(jù)挖掘算法。

A)關(guān)聯(lián)分析

B)預(yù)測

C)分類

D)聚類

答案:C

解析:

18.[單選題]發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的算法通常要經(jīng)過以下三個步驟:連接數(shù)據(jù),作數(shù)據(jù)準備;給定最小支持

度和(D),利用數(shù)據(jù)挖掘工具提供的算法發(fā)現(xiàn)關(guān)聯(lián)規(guī)則;可視化顯示、理解、評估關(guān)聯(lián)規(guī)

A)最小興趣度

B)最小置信度

C)最大支持度

D)最小可信度

答案:D

解析:

19.[單選題]請問以下何者屬于時間序列的問題?

A)信用卡發(fā)卡銀行偵測潛在的卡奴

B)基金經(jīng)理人針對個股做出未來價格預(yù)測

0電信公司將人戶區(qū)分為數(shù)個群體

D)以上均不是

答案:B

解析:

20.[單選題]某項目預(yù)計運行5年后的凈現(xiàn)值為4500萬元,如折現(xiàn)率為16%,其終值應(yīng)為()萬元

(說明:結(jié)果保留兩位小數(shù))

A)8045.86

B)6996.21

09451.54

D)7000.02

答案:C

解析:

21.[單選題]能夠在字符串中匹配“aab”,而不能匹配“aaab”和“aaaab”的正則表達式()

A)r"a*?b”

B)r“a{,2}b”

Or“aa??b"

D)r"aaa??b"

答案:B

解析:

22.[單選題]在TDLTE網(wǎng)絡(luò)中,用戶的業(yè)務(wù)屬性數(shù)據(jù)是在哪個網(wǎng)元上配置?

A)MME

B)PDNGateway

OHSS

D)eNodeB

答案:C

解析:

23.[單選題]使用零均值規(guī)范化方法,年收入屬性的均值為65,標準差為12,則年收入59萬元規(guī)范化

后為()。

A)0.3

B)-0.5

0-0.2

D)0.5

答案:B

解析:

24.[單選題]字符串是一個字符序列,給字符串s,以下表示s從右側(cè)向左第三個字符的是:()

A)s[-3]

B)s[:-3j

Os[3]

D)s[0:-3]

答案:A

解析:

25.[單選題]在有關(guān)數(shù)據(jù)倉庫測試,下列說法不正確的是:()

A)在完成數(shù)據(jù)倉庫的實施過程中,需要對數(shù)據(jù)倉庫進行各種測試.測試工作中要包括單元測試和系統(tǒng)

測試.

B)當數(shù)據(jù)倉庫的每個單獨組件完成后,就需要對他們進行單元測試

C)系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進行大量的功能測試和回歸測試.

D)在測試之前沒必要制定詳細的測試計劃.

答案:D

解析:

26.[單選題]數(shù)據(jù)中心側(cè)的數(shù)據(jù)流轉(zhuǎn)方式未為()

A)D.XP;

B)E.SP

OOGG

D)E.TL

答案:D

解析:

27.[單選題]一所大學內(nèi)的各年紀人數(shù)分別為:一年級200人,二年級160人,三年級130人

,四年級110人。則年級屬性的眾數(shù)是:()

A)一年級

B)二年級

C)三年級

D)四年級

答案:A

解析:

28.[單選題]將原始數(shù)據(jù)進行集成、變換、維度規(guī)約、數(shù)據(jù)規(guī)約是在以下哪個步驟的任務(wù)()

A)頻繁模式挖掘

B)分類和預(yù)測

C)數(shù)據(jù)預(yù)處理

D)數(shù)據(jù)流挖掘

答案:C

解析:

29.[單選題]720P視頻源分辨率為()

A)4096*2304

B)1920*1080

0720*576

D)1280*720

答案:D

解析:

30.[單選題]下面關(guān)于Jarvis-Patrick(JP)聚類算法的說法不正確的是()

A)JP聚類擅長處理噪聲和離群點,并且能夠處理不同大小、形狀和密度的簇。

B)JP算法對高維數(shù)據(jù)效果良好,尤其擅長發(fā)現(xiàn)強相關(guān)對象的緊致簇。

0JP聚類是基于SNN相似度的概念。

D)JP聚類的基本時間復(fù)雜度為0(m)。

答案:D

解析:

31.[單選題]OLAP技術(shù)的核心是:

A)在線性;

B)對用戶的快速響應(yīng);

C)互操作性.

D)多維分析;

答案:D

解析:

32.[單選題]將原始數(shù)據(jù)進行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務(wù)?

A)頻繁模式挖掘

B)分類和預(yù)測

C)數(shù)據(jù)預(yù)處理

D)數(shù)據(jù)流挖掘

答案:C

解析:

33.[單選題]決策樹算法是一種。數(shù)據(jù)挖掘算法。

A)關(guān)聯(lián)分析

B)預(yù)測

C)分類

D)聚類

答案:C

解析:

34.[單選題]在數(shù)據(jù)挖掘中,將大數(shù)據(jù)集轉(zhuǎn)換為保持原數(shù)據(jù)完整性的小數(shù)據(jù)集,這一過程稱

為⑻

A)數(shù)據(jù)提取

B)數(shù)據(jù)變換

C)數(shù)據(jù)清理合

D)數(shù)據(jù)歸約

答案:D

解析:

35.[單選題]DPI設(shè)備對業(yè)務(wù)流量的統(tǒng)計維度應(yīng)與現(xiàn)網(wǎng)計費系統(tǒng)保持一致,通常為用戶實際發(fā)送和接

收的報文的()層及以上部分。

A)二

B)三

C)四

D)五

答案:B

解析:

36.[單選題]下面代碼的輸出結(jié)果是?foriinrange(3):print(2,end=1,1)

A)2,2,2,

B)2,2,2

C)222

D)222,

答案:A

解析:

37.[單選題]有關(guān)數(shù)據(jù)倉庫分割策略的敘述中正確的是()

A)分割越細越好

B)分割策略與數(shù)據(jù)量大小和速度等因素有關(guān)

C)分割越粗越好

D)以上都不對

答案:B

解析:

38.[單選題]()將兩個簇的鄰近度定義為不同簇的所有點對的平均逐對鄰近度,它是一種凝聚層

次聚類技術(shù)。

A)MIN(單鏈)

B)MAX(全鏈)

C)組平均

D)Ward方法

答案:C

解析:

39.[單選題]若I={a,b,c,d},D中含有10個事務(wù),(a,b}和{a,c}是一個頻繁項集,則以下敘述中

正確的是()。

A){a,b,d}一定是頻繁項集

B){a,b,c}一定是頻繁項集

C){b,c}一定是頻繁項集

D)以上都不對

答案:D

解析:

40.[單選題]無線網(wǎng)性能劣化可能導(dǎo)致以下哪個指標出現(xiàn)問題?()

A)小區(qū)RTT下行時延

B)TCP一二次握手時延

0服務(wù)器側(cè)下行RTT

D)小區(qū)RTT上行時延

答案:A

解析:

41.[單選題]bootstrap數(shù)據(jù)是指

A)從總共M個特征中有放回地抽樣m個特征

B)從總共M個特征中無放回地抽樣m個特征

C)從總共N個樣本中有放回地抽樣n個樣本

D)從總共N個樣本中無放回地抽樣n個樣本

答案:C

解析:

42.[單選題]在SELECT語句中,用來指定查詢所用的表的子句是____。

A)WHERE

B)GROUPBY

C)ORDERBY

D)FR0M

答案:D

解析:

43.[單選題]如果對屬性值的任一組合,R中都存在一條規(guī)則加以覆蓋,則稱規(guī)則集R中的規(guī)則為

A)無序規(guī)則

B)窮舉規(guī)則

C)互斥規(guī)則

D)有序規(guī)則

答案:B

解析:

44.[單選題]可以最全面反映整個網(wǎng)絡(luò)缺省EPS承載的建立成功率的指標是

A)PDN連接建立成功率

B)缺省承載激活成功率

C)MME建立缺省S5s8承載成功率

D)位置更新的成功率

答案:A

解析:

45.[單選題]Mapreduce適用于()

A)任意應(yīng)用程序

B)任意可在windowsservet2008上運行的程序

C)可以串行處理的應(yīng)用程序

D)可以并行處理的應(yīng)用程序

答案:D

解析:

46.[單選題]Python文件讀取方法read(size)的含義是

A)從頭到尾讀取文件所有內(nèi)容

B)從文件中讀取一行數(shù)據(jù)

C)從文件中讀取多行數(shù)據(jù)

D)從文件中讀取指定size大小的數(shù)據(jù),如果size為負數(shù)或者空,則讀取到文件結(jié)束。

答案:D

解析:

47.[單選題]自然界中某種事物發(fā)生時其他事物也會發(fā)生,則這種聯(lián)系稱之為()。

A)連接

B)聯(lián)絡(luò)

C關(guān)聯(lián)

D)聯(lián)系

答案:C

解析:

48.[單選題]以下哪項不屬于分類算法。

A)決策樹

B)隨機森林

C)神經(jīng)網(wǎng)絡(luò)

D)K-means算法

答案:D

解析:

49.[單選題]回歸分析的第一步是()

A)確定解釋量和被解釋變量

B)確定回歸模型

C)建立回歸方程

D)進行檢驗

答案:A

解析:

50.[單選題]《個人信息保護法》發(fā)布執(zhí)行時間()。

A)2021年9月10;

B)2021年10月1日

C)2021年11月10

D)2021年12月1日

答案:C

解析:

51.[單選題]某文本分類需求,存在一定的數(shù)據(jù)缺失情況且數(shù)據(jù)規(guī)模較小,能做增量式訓練要求的是

哪種算法

A)貝葉斯

B)決策樹

C)SVM

D)邏輯回歸

答案:A

解析:

52.[單選題]只有非零值才重要的二元屬性被稱作:

A)計數(shù)屬性

B)離散屬性

C)非對稱的二元屬性

D)對稱屬性

答案:C

解析:

53.[單選題]以下哪個指標不是手機上網(wǎng)感知指標

A)TCP一二次握手時延

B)TCP二三次握手時延

OARPU

D)ERAB建立成功率

答案:C

解析:

54.[單選題]關(guān)于OUVP的特性,下面正確的是:()(1)快速性(2)可分析性(3)多維性(4)信

息性(5)共享性

A)(1)(2)(3)

B)(2)(3)(4)

C)⑴⑵⑶(4)

D)(1)(2)(3)(4)(5)

答案:D

解析:

55.[單選題]設(shè)X={1,2,3)是頻繁項集,則可由X產(chǎn)生()個關(guān)聯(lián)規(guī)則。

A)4

B)5

C)6

D)7

答案:C

解析:

56.[單選題]在SELECT語句中,以下有關(guān)HAVING子句的正確敘述是。

A)HAVING子句可以在任意位置出現(xiàn)

B)使用HAVING子句的同時不能使用WHERE子句

OHAVING子句必須與GROUPBY子句同時使用

D)HAVING子句與WHERE子句功能相同

答案:C

解析:

57.[單選題]在圖集合中發(fā)現(xiàn)一組公共子結(jié)構(gòu),這樣的任務(wù)稱為()

A)頻繁子集挖掘

B)頻繁子圖挖掘

C)頻繁數(shù)據(jù)項挖掘

D)頻繁模式挖掘

答案:B

解析:

58.[單選題]如果規(guī)則集中的規(guī)則按照優(yōu)先級降序排列,則稱規(guī)則集是

A)無序規(guī)則

B)窮舉規(guī)則

C)互斥規(guī)則

D)有序規(guī)則

答案:D

解析:

59.[單選題]Hive通常被稱作()。

A)數(shù)據(jù)地圖

B)數(shù)據(jù)能力

C)數(shù)據(jù)倉庫

D)數(shù)據(jù)應(yīng)用

答案:C

解析:

60.[單選題]每次從指定的文件中讀取一行的方法是:

A)read()

B)readline()

C)readlines()

D)reads()

答案:B

解析:

61.[單選題]數(shù)據(jù)記錄內(nèi)容完整比例,包括指標單位維度、業(yè)務(wù)維度組合記錄條數(shù)完整,指標字段值完

整稱為()

A)指標數(shù)據(jù)自動采集率;

B)指標數(shù)據(jù)接入率

C)指標數(shù)據(jù)接入及時率;

D)指標數(shù)據(jù)完整率

答案:D

解析:

62.[單選題]下面選項中t不是s的子序列的是()

A)s=<{2,4},{3,5,6},{8}>

B)s=<{2,4},{3,5,6},{8}>

C)S=<{1,2},{3,4}>

D)s=<{2,4},{2,4}>

答案:C

解析:

63.[單選題]如果規(guī)則集R中不存在兩條規(guī)則被同一條記錄觸發(fā),則稱規(guī)則集R中的規(guī)則為

A)無序規(guī)則

B)窮舉規(guī)則

C)互斥規(guī)則

D)有序規(guī)則

答案:C

解析:

64.[單選題]在數(shù)據(jù)挖掘過程中,()可以看作是承載數(shù)據(jù)和挖掘算法的基礎(chǔ)設(shè)施。

A)云平臺

B)物聯(lián)網(wǎng)

OSPSS

D)WEKA

答案:A

解析:

65.[單選題]下列函數(shù)中,用于返回元組中元素最小值的是()

A)len

B)max

C)min

D)tuple

答案:C

解析:

66.[單選題]決策樹的葉子結(jié)點對應(yīng)()。

A)一個線性回歸方程

B)某個類別

C)以上都可以

D)一個數(shù)值

答案:B

解析:

67.[單選題]訂單表order包含用戶信息uid和產(chǎn)品信息pid等屬性列,以下語句能夠返回至少被訂購過

三次的

Pid是o

A)SELECTpidFROMorderWHEREcount(pid)>3;

B)SELECTpidFROMorderWHEREmax(pid)>=3;

C)SELECTpidFROMorderGROUPBYpidHAVINGcount(pid)>3;

D)SELECTpidFROMorderGROUPBYpidHAVINGcount(pid)>=3;

答案:D

解析:

68.[單選題]假設(shè)12個銷售價格記錄組已經(jīng)排序如下:5,10,11,13,15,35,50,55,72,92,

204,215使用如下每種方法將它們劃分成四個箱。等頻(等深)劃分時,15在第幾個箱子內(nèi)?()

A)第一個

B)第二個

C)第三個

D)第四個

答案:B

解析:

69.[單選題]BIRCH是一種()。

A)分類器

B)聚類算法

C)關(guān)聯(lián)分析算法

D)特征選擇算法

答案:B

解析:

70.[單選題]如果允許一條記錄觸發(fā)多條分類規(guī)則,把每條被觸發(fā)規(guī)則的后件看作是對相應(yīng)類的一

次投票,然后計票確定測試記錄的類標號,稱為()

A)無序規(guī)則

B)窮舉規(guī)則

C)互斥規(guī)則

D)有序規(guī)則

答案:A

解析:

71.[單選題]以下哪個指標不是用來評估回歸模型()

A)R2

B)MSE(MeanSquaredError)

C)MAE(MeanAbsoluteError)

D)Recall

答案:D

解析:

72.[單選題]基于0算法,實現(xiàn)人流量、業(yè)務(wù)量、話務(wù)量等因素對無線資源的精準預(yù)測

A)神經(jīng)網(wǎng)絡(luò)

B)K-means

C)K-medoids

D)FP-growth

答案:A

解析:

73.[單選題]VOLTE的語音靜默期是()

A)20ms

B)80ms

C)160ms

D)40ms

答案:C

解析:

74.[單選題]以下哪些分類方法可以較好地避免樣本的不平衡問題?

0

A)KNN

B)SVM

C)Bayes

D)神經(jīng)網(wǎng)絡(luò)

答案:A

解析:

75.[單選題]依照《中華人民共和國數(shù)據(jù)安全法》和有關(guān)法律、行政法規(guī)的規(guī)定,()負責統(tǒng)籌協(xié)調(diào)網(wǎng)

絡(luò)數(shù)據(jù)安全和相關(guān)監(jiān)管工作。

A)工業(yè)和信息化部

B)國家安全部門

C)國家網(wǎng)信部門

D)通信主管部門

答案:C

解析:

76.[單選題]若P(H)==0.5,P(X)==0.8,P(X|H)=0.7.則P(H|X)為()。

A)0.475

B)0.57

00.4375

D)0.5

答案:C

解析:

77.[單選題]一個3層的神經(jīng)網(wǎng)絡(luò)中,各層分別是()

A)輸入層、隱藏層和輸出層

B)輸入層、計算層和輸出層

C)輸入層、隱藏層和統(tǒng)計層

D)預(yù)處理層、隱藏層和輸出層

答案:A

解析:

78.[單選題]如果對屬性值的任一組合,R中都存在一條規(guī)則加以覆蓋,則稱規(guī)則集R中的規(guī)則為

()

A)無序規(guī)則

B)窮舉規(guī)則

C)互斥規(guī)則

D)有序規(guī)則

答案:B

解析:

79.[單選題]泊松回歸是一種廣泛應(yīng)用的()回歸模型。

A)線性

B)非線性

C)預(yù)測

D)估算

答案:B

解析:

80.[單選題]在ID3算法中信息增益是指()

A)信息的溢出程度

B)信息的增加效益

C)炳增加的程度最大

D)嫡減少的程度最大

答案:D

解析:

81.[單選題]在CBD商圈,以下哪款手機的滲透率最高

A)華為

B)小米

C)三星

D)蘋果

答案:D

解析:

82.[單選題]如果允許一條記錄觸發(fā)多條分類規(guī)則,把每條被觸發(fā)規(guī)則的后件看作是對相應(yīng)類的一次

投票,然后計票確定測試記錄的類標號,稱為()

A)無序規(guī)則

B)窮舉規(guī)則

C)互斥規(guī)則

D)有序規(guī)則

答案:A

解析:

83.[單選題]在Numpy包中,計算中位數(shù)的函數(shù)為()。

A)numpy.median()

B)numpy.var()

C)numpy.std()

D)numpy.mean()

答案:A

解析:

84.[單選題]假設(shè)file是文本文件對象,下列選項中,哪個用于讀取一行?()

A)file,read()

B)file.read(200)

C)file.readline()

D)file.readlines()

答案:C

解析:File,read():讀取全部內(nèi)容

File,read(200):讀取200個字節(jié)內(nèi)容

File,readline():讀取一行內(nèi)容

File,readlines():讀取所有行,返回一個list對象,每一行對應(yīng)list對象的一個元素。

85.[單選題]在數(shù)據(jù)預(yù)處理中,將多個數(shù)據(jù)源中的數(shù)據(jù)整合到一個一致的數(shù)據(jù)存儲(如數(shù)據(jù)倉庫)中

,這一過程稱為

A)數(shù)據(jù)提取

B)數(shù)據(jù)集成

C)數(shù)據(jù)清理

D)數(shù)據(jù)加載

答案:B

解析:

86.[單選題]下列錯誤的是()

A)查準率/準確率(precision):P=TP/(TP-FP)

B)查準率(precision):被認定為正例的里面,判斷正確的比例

C)查全率/召回率/靈敏度(recall):R=TP/(TP+FN)

D)查全率(recall):真實正例里,被判斷出為正例的比例

答案:A

解析:

87.[單選題]CRISP-DM是跨行業(yè)數(shù)據(jù)挖掘過程標準,下述哪項工作是在datapreperation階段完成

A)數(shù)據(jù)收集

B)數(shù)據(jù)清洗

C)建立模型

D)數(shù)據(jù)理解

答案:B

解析:

88.[單選題]在以下不同的場景中,使用的分析方法不正確的是?()

A)根據(jù)商家最近一年的經(jīng)營及服務(wù)數(shù)據(jù),用聚類算法判斷出天貓商家在各自主營類目下所屬的商

家層級

B)根據(jù)商家近幾年的成交數(shù)據(jù),用聚類算法擬合出用戶未來一個月可能的消費金額公式

C)用關(guān)聯(lián)規(guī)則算法分析出購買了汽車坐墊的買家,是否適合推薦汽車腳墊

D)根據(jù)用戶最近購買的商品信息,用決策樹算法識別出淘寶買家可能是男還是女

答案:B

解析:

89.[單選題]獲取網(wǎng)絡(luò)上某個URL對應(yīng)的圖片或視頻等二進制資源,應(yīng)該采用Response類的哪個屬性

?

A)status_code

B)head

C)text

D)content

答案:D

解析:題型:

90.[單選題]檢查省公司統(tǒng)一DPI系統(tǒng)設(shè)備安全配置合規(guī)率情況,安全配置合規(guī)率應(yīng)不低于()

A)99%

B)95%

090%

D)85%

答案:D

解析:

91.[單選題]在利用lineajmodel.LinearRegressionO構(gòu)造的reg對象訓練模型后,可以通過以下哪

行代碼查看回歸模型系數(shù)()。

A)reg._coefficient

B)reg._coef

Oreg,coefficient-

D)reg.coef_

答案:D

解析:

92.[單選題]想根據(jù)顧客的年齡,性別,收入和工作地點的特征劃分不同的群體,可以使用()

A)回歸方法

B)分類方法

C)聚類方法

D)關(guān)聯(lián)分析

答案:C

解析:

93.[單選題]面不屬于創(chuàng)建新屬性的相關(guān)方法的是()

A)特征提取

B)特征修改

C)映射數(shù)據(jù)到新的空間

D)特征構(gòu)造

答案:B

解析:

94.[單選題]設(shè)乂={1,2,3}是頻繁項集,則可由X產(chǎn)生一個關(guān)聯(lián)規(guī)則。

A)4

B)5

06

D)7

答案:C

解析:

95.[單選題]下述算法中屬于基于規(guī)則的分類器的是

A)C4.5

B)KNN

C)DBSCAN

D)ANN

答案:A

解析:

96.[單選題]在數(shù)據(jù)分析和處理方面具有分析方法豐富、分析模型擴展差、數(shù)據(jù)挖掘能力強等特點的

分析工具是()。

A)Weka

B)SPSS

OSAS

D)R

答案:B

解析:

97.[單選題]性能分析主要包括采集原始的性能指標、性能指標的預(yù)處理、。、對網(wǎng)絡(luò)優(yōu)化工作完

成情況進行跟蹤和評估四個階段

A)生成性能分析報告

B)生成性能告警

C)制定性能分析規(guī)則

D)性能與故障、投訴關(guān)聯(lián)

答案:A

解析:

98.[單選題]()算法是最廣泛使用的聚類算法,算法簡單,易于理解和操作。

A)gglomerative

B)C.URE

C)K-means

D)k-中心點算法

答案:C

解析:

99.[單選題]利用內(nèi)置函數(shù),定義一個1行6列元素全為1的數(shù)組N3

A)N3=np.ones(6).reshaped,6)

B)N3=np.ones(6).shape(1,6)

C)N3=np.arange(6).reshaped,6)

D)N3=np.arange(6).shape(1,6)

答案:A

解析:

100.[單選題]把多維空間劃分成組屬于數(shù)據(jù)挖掘的哪一類任務(wù)

A)探索性數(shù)據(jù)分析

B)建模描述

C)預(yù)測建模

D)尋找模式和規(guī)則

答案:B

解析:

101.[單選題]一般,k-NN最近鄰方法在()的情況下效果較好

A)樣本較多但典型性不好

B)樣本較少但典型性好

C)樣本呈團狀分布

D)樣本呈鏈狀分布

答案:B

解析:

102.[單選題]IMEI中哪部分與終端型號相關(guān)()

A)SNR

B)TAC

C)CD

D)MSISDN

答案:B

解析:

103.[單選題]變量的量綱比如以厘米或者米為單位對下面哪種方法會有影響()

A)方差分析

B)回歸分析

C)聚類分析

D)主成分分析

答案:C

解析:

104.[單選題]如下表所示,X={butter,cheese},Y={beer},則置信度confidence(XfY)=()。

交易號(TID)

商品(Items)

Ibeer,diaper,nuts

2beer,biscuit,diaper

3bread,butter,cheese

4beer,cheese,diaper,nuts

5beer,butter,cheese,nuts

A)2/5

B)l/3

01/2

D)l/4

答案:C

解析:

105.[單選題]SPSS最突出的特點是

A)處理效率高

B)界面友好

C)結(jié)果準確

D)操作方便

答案:B

解析:

106.[單選題]對KPI指標中S1接口流量描述不正確

A)S1接口流量可分為S1接口上行流量和S1接口下行流量

B)S1接口流量指的是物理層流量

C)S1接口流量指的是IP層流量

D)反映S1接口的系統(tǒng)負荷情況

答案:B

解析:

107.[單選題]與WHEREdnoIN('IM','CS')條件等價的查詢表達式是。

A)WHEREdnoBETWEEN'IM'OR'CS'

B)WHEREdnoBETWEEN'IM'AND'CS'

C)WHEREdno='IM'ORdno='CS'

D)WHEREdno='IM'ANDdno='CS'

答案:C

解析:

108.[單選題]()的目的縮小數(shù)據(jù)的取值范圍,使其更適合于數(shù)據(jù)挖掘算法的需要,并且能夠得到

和原始數(shù)據(jù)相同的分析結(jié)果

A)數(shù)據(jù)清洗

B)數(shù)據(jù)集成

C)數(shù)據(jù)變換

D)數(shù)據(jù)歸約

答案:D

解析:

109.[單選題]對于開通4G業(yè)務(wù)的用戶,如果需要使用VoLTE業(yè)務(wù),是否需要更換手機卡,是否需要更

換VoLTE終端?

A)不需要更換手機卡,需要使用VoLTE終端

B)不需要更換手機卡,不需要使用VoLTE終端

C)需要更換手機卡,需要使用VoLTE終端

D)需要更換手機卡,不需要使用VoLTE終端

答案:A

解析:

110.[單選題]當你輸入hadoopfsck/造成"connectionrefusedjavaexception'”時,系統(tǒng)究竟

發(fā)生了什么?

A)datanode出現(xiàn)故障

B)resoucemanger出現(xiàn)故障

C)nodemanger出現(xiàn)故障

D)Namenode出現(xiàn)故障

答案:D

解析:

111.[單選題]居民區(qū)4G&寬帶網(wǎng)絡(luò)能力全景分析的指標采集最小粒度不包括

A)月粒度

B)地市粒度

C)居民區(qū)粒度

D)SAEGW網(wǎng)元粒度

答案:D

解析:

112.[單選題]SQL語言中,刪除一個表中所有數(shù)據(jù),但保留表結(jié)構(gòu)的命令是()

A)DELETE

B)DROP

C)CLEAR

D)REMORE

答案:A

解析:

113.[單選題]如下哪些不是最近鄰分類器的特點,()

A)它使用具體的訓練實例進行預(yù)測,不必維護源自數(shù)據(jù)的模型

B)分類一個測試樣例開銷很大

0最近鄰分類器基于全局信息進行預(yù)測

D)可以生產(chǎn)任意形狀的決策邊界

答案:C

解析:

H4.[單選題]在Scikit-learn模塊下,不同分類模型在訓練時,調(diào)用的方法名稱()。

A)相同

B)視情況而定

C)不同

D)不知道

答案:A

解析:

115.[單選題]有關(guān)數(shù)據(jù)倉庫的開發(fā)特點,下列說法()是不正確的。

A)數(shù)據(jù)倉庫開發(fā)要從數(shù)據(jù)出發(fā)

B)數(shù)據(jù)倉庫使用的需求在開發(fā)出來后才會明確

C)數(shù)據(jù)倉庫開發(fā)是一個不斷循環(huán)的過程

D)數(shù)據(jù)倉庫中數(shù)據(jù)的分析和處理十分靈活,沒有固定的開發(fā)模式

答案:B

解析:

116.[單選題]P-R圖一般為。曲線

A)光滑非單調(diào)

B)非光滑非單調(diào)

C)非光滑單調(diào)

D)光滑單調(diào)

答案:B

解析:

117.[單選題]下面不是造成“塔下黑”的原因的一項為

A)站點過高

B)天線規(guī)格不達標

C)功率過高

D)下傾角過小

答案:C

解析:

118.[單選題]辦理不限流量套餐的用戶群體主要的流量消費去向是

A)即時通信

B)音樂

C)下載

D)視頻

答案:D

解析:

119.[單選題]下面哪個不屬于數(shù)據(jù)的屬性類型:

A)標稱

B)序數(shù)

C)區(qū)間

D)相異

答案:D

解析:

120.[單選題]建立一個模型,通過這個模型根據(jù)已知的變量值來預(yù)測其他某個變量值屬于數(shù)據(jù)挖掘的

哪一類任務(wù)?

A)根據(jù)內(nèi)容檢索

B)建模描述

C)預(yù)測建模

D)尋找模式和規(guī)則

答案:C

解析:

121.[單選題]()是一個觀測值,它與其他觀測值的差別如此之大,以至于懷疑它是由不同的機制

產(chǎn)生的

A)邊界點

B)質(zhì)心

C)離群點

D)核心點

答案:C

解析:

122.[單選題]關(guān)于決策樹算法描述錯誤的是()

A)決策樹包含根結(jié)點、內(nèi)部結(jié)點和葉結(jié)點

B)決策樹算法對噪聲的干擾十分敏感

C)尋找最佳決策樹是完全問題

D)冗余屬性不會對決策樹的準確性造成不良影響

答案:B

解析:

123.[單選題]人工智能研究的基本內(nèi)容不包括()

A)組裝機器

B)機器思維

C)機器行為

D)機器感知

答案:A

解析:

124.[單選題]以下不屬于互聯(lián)網(wǎng)電視性能分析指標的是()

A)卡頓時長

B)掉話率

C)緩沖時長

D)卡頓次數(shù)

答案:B

解析:

125.[單選題]以下不是Python數(shù)據(jù)類型的是:

A)實數(shù)

B)整數(shù)

C)列表

D)字符串

答案:A

解析:實數(shù)是數(shù)學中的概念,在Python中對應(yīng)浮點數(shù)。

126.[單選題]以下哪個指標不能用于線性回歸中的模型比較()

A)R方

B)調(diào)整R方

C)AIC

D)BIC

答案:A

解析:

127.[單選題]以下敘述正確的是()

A)極差較少受異常值的影響

B)四分位差較少受異常值的影響

C)方差較少受異常值的影響

D)標準差較少受異常值的影響

答案:B

解析:

128.[單選題]哪個選項不是Python語言的整數(shù)類型?

A)0B1010

B)0E99

C)0x9a

D)88

答案:B

解析:

129.[單選題]通過數(shù)據(jù)收集和展示數(shù)據(jù)背后的(),運用豐富的、具有互動性的可視化手段數(shù)據(jù)新

聞學成為新聞學作為一門新的分支進入主流媒體,即用數(shù)據(jù)報道新聞。

A)數(shù)據(jù)收集

B)數(shù)據(jù)挖掘

C)真相

D)關(guān)聯(lián)與模式

答案:D

解析:

130.[單選題]將多個指標轉(zhuǎn)化為少數(shù)幾個指標的一種統(tǒng)計分析方法是()。

A)數(shù)據(jù)預(yù)處理;

B)數(shù)據(jù)降維

C)主成分分析

D)假設(shè)檢驗

答案:C

解析:

131.[單選題]個性化推薦系統(tǒng)是建立在海量數(shù)據(jù)挖掘基礎(chǔ)上的一種高級商務(wù)智能平臺,以幫助(

)為其顧客購物提供完全個性化的決策支持和信息服務(wù)。

A)公司

B)各單位

C)跨國企業(yè)

D)電子商務(wù)網(wǎng)站

答案:D

解析:

132.[單選題]樸素貝葉斯算法是一種()數(shù)據(jù)挖掘算法。

A)關(guān)聯(lián)分析

B)預(yù)測

C)分類

D)聚類

答案:C

解析:

133.[單選題]下列屬于數(shù)據(jù)倉庫特點的是()

A)綜合性和提煉性數(shù)據(jù)

B)重復(fù)性的、可預(yù)測的處理

C)一次處理的數(shù)據(jù)量小

D)面向操作人員,支持日常操作

答案:A

解析:

134.[單選題]下面哪個說法是不正確的?

A)Robots協(xié)議告知網(wǎng)絡(luò)爬蟲哪些頁面可以抓取,哪些不可以。

B)Robots協(xié)議是互聯(lián)網(wǎng)上的國際準則,必須嚴格遵守。

0Robots協(xié)議是一種約定。

D)Robots協(xié)議可以作為法律判決的參考性“行業(yè)共識”。

答案:B

解析:題型:

135.[單選題]變量y與x之間的回歸方程()。

A)表示y與x之間的函數(shù)關(guān)系

B)表示y與x之間的不確定性關(guān)系

C)反映y與x之間真實關(guān)系的形式

D)反映y與x之間的真實關(guān)系達到最大限度的吻合

答案:D

解析:

136.[單選題]在數(shù)據(jù)預(yù)處理中,將錯誤的、不一致的數(shù)據(jù)予以更正或刪除,以免影響挖掘結(jié)果的正確

性,這一過程稱為()

A)數(shù)據(jù)提取

B)數(shù)據(jù)轉(zhuǎn)換

C)數(shù)據(jù)清理

D)數(shù)據(jù)加載

答案:C

解析:

137.[單選題]Requests庫中,下面哪個是檢查Response對象返回是否成功的狀態(tài)屬性?

A)raise_for_status

B)headers

C)status_code

D)status

答案:C

解析:題型:

138.[單選題]HTTP響應(yīng)中404代碼指的是()

A)請求被服務(wù)器拒絕

B)服務(wù)器無法找到請求的URL

C)不允許使用此方法請求相應(yīng)的URL

D)服務(wù)器內(nèi)部錯誤

答案:B

解析:

139.[單選題]數(shù)據(jù)框中方法中dropna()的作用是

A)去掉空值,并以默認值填充

B)去掉空值所在的行

C)去掉指定的某行

D)去掉指定的某些值

答案:B

解析:

140.[單選題]下面哪個屬于映射數(shù)據(jù)到新的空間的方法?()

A)傅立葉變換

B)特征加權(quán)

C)漸進抽樣

D)維歸約

答案:A

解析:

141.[單選題]假設(shè)某分類器在一個測試數(shù)據(jù)集上的分類結(jié)果的混淆矩陣如下所示,該分類器的準確

率為()。

Predicted

yesno

Actualyesl55

nol020

A)75%

B)80%

060%

D)70%

答案:D

解析:

142.[單選題]簡單地將數(shù)據(jù)對象集劃分成不重疊的子集,使得每個數(shù)據(jù)對象恰在一個子集中,這種聚

類類型稱作

A)層次聚類

B)劃分聚類

0非互斥聚類

D)模糊聚類

答案:B

解析:

143.[單選題]關(guān)于0LAP的特性,下面不正確的是:()

A)快速性

B)可分析性

C)多維性

D)魯棒性

答案:D

解析:

144.[單選題]下面哪個關(guān)鍵字用來定義函數(shù)?

A)function

B)define

Odef

D)class

答案:C

解析:

145.[單選題]決策樹中的InformationGain的計算是用來?

A)剪枝

B)使樹成長

C)處理缺失值和異常值

D)砍樹

答案:B

解析:

146.[單選題]以下哪項關(guān)于決策樹的說法是錯誤的()

A)冗余屬性不會對決策樹的準確率造成不利的影響

B)子樹可能在決策樹中重復(fù)多次

C)決策樹算法對于噪聲的干擾非常敏感

D)尋找最佳決策樹是NP完全問題

答案:C

解析:

147.[單選題]目前數(shù)據(jù)分析和數(shù)據(jù)挖掘面臨的挑戰(zhàn)性問題不包括()。

A)數(shù)據(jù)類型的多樣化

B)高維度數(shù)據(jù)

C)數(shù)據(jù)稀少

D)數(shù)據(jù)挖掘結(jié)果的表示和可視化

答案:C

解析:

148.[單選題]將兩個簇的鄰近度定義為不同簇的所有點對的鄰近度的平均值,它是一種()連接方

式。

A)單鏈接

B)全鏈接

C)組平均

D)質(zhì)心距離

答案:C

解析:

149.[單選題]delta法則的關(guān)鍵思想:使用()來搜索可能權(quán)向量的假設(shè)空間,以找到最佳擬合訓練

樣例的權(quán)向量

A)梯度下降

B)聚類分析

C)決策樹

D)判別分析

答案:A

解析:

150.[單選題]()用于計算最近鄰的算法

A)metric_params=None

B)metric='minkowski'

C)algorithm='auto'

D)weights='uniform'

答案:C

解析:

151.[單選題]若I={a,b,c,d},D中含有10個事務(wù),{a,b)和{a,c}是一個頻繁項集,則以下敘

述中正確的是()

A){a,b,d}一定是頻繁項集

B){a,b,c}一定是頻繁項集

C){b,c}一定是頻繁項集

D)以上都不對

答案:D

解析:

152.[單選題]假定屬性age的值如下:10,20,20,30,30,30,400則該組數(shù)據(jù)的眾數(shù)是()。

A)10

B)20

C)30

D)40

答案:C

解析:

153.[單選題]下面購物藍能夠提取的3-項集的最大數(shù)量是多少()

TID項集

1牛奶,啤酒,尿布

2面包,黃油,牛奶

3牛奶,尿布,餅干

4面包,黃油,餅干

5啤酒,餅干,尿布

6牛奶,尿布,面包,黃油

7面包,黃油,尿布

8啤酒,尿布

9牛奶,尿布,面包,黃油

10啤酒,餅干

A)1

B)2

03

D)4

答案:C

解析:

154.[單選題]ATTACH請求次數(shù)為統(tǒng)計一定的時間粒度及網(wǎng)元粒度下,ProcedureType為()的Sb

MME接口XDR的個數(shù)

A)1

B)2

03

D)4

答案:A

解析:

155.[單選題]用于分類與回歸應(yīng)用的主要算法有()

A)Apriori算法、HotSpot算法

B)RBF神經(jīng)網(wǎng)絡(luò)、K均值法、決策樹

C)K均值法、S0M神經(jīng)網(wǎng)絡(luò)

D)決策樹、BP神經(jīng)網(wǎng)絡(luò)、貝葉斯

答案:D

解析:

156.[單選題]有如下兩個表:部門(部門號,部門名,負責人,電話),職工(部門號,職工號,姓名

,性別,

出生日期)??梢哉_查詢1980年8月20日出生的職工信息的SQLSELECT命令是.

A)SELECT*FROM職工WHERE出生日期=1980-8-20;

B)SELECT*FROM職工WHERE出生日期='1980-8-20';

C)SELECT*FROM職工WHERE出生日期={1980-8-20};

D)SELECT*FROM職工WHERE出生白期=[1980-8-20];

答案:B

解析:

157.[單選題]倒傳遞神經(jīng)網(wǎng)絡(luò)(BP神經(jīng)網(wǎng)絡(luò))的訓練順序為何?(A:調(diào)整權(quán)重;B:計算誤差值;

C:利用隨機的權(quán)重產(chǎn)生輸出的結(jié)果)

A)BCA

B)CAB

OBAC

D)CBA

答案:D

解析:

158.[單選題]HTTP響應(yīng)中500代碼指的是()

A)服務(wù)器內(nèi)部錯誤

B)代理服務(wù)器從上級收到了一條偽響應(yīng)

C)服務(wù)器此時無法提供服務(wù);但是將來可能可用

D)不允許使用此方法請求相應(yīng)的URL

答案:A

解析:

159.[單選題]關(guān)于DBSCAN聚類算法的描述錯誤的是()

A)是一種基于密度的聚類算法

B)能夠處理各種形狀和大小的簇

C)能夠處理密度變化較大的簇

D)處理高維數(shù)據(jù)時開銷較大

答案:C

解析:

160.[單選題]關(guān)于K均值和DBSCAN的比較,以下說法不正確的是()。

A)K均值丟棄被它識別為噪聲的對象,而DBSCAN一般聚類所有對象。

B)K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念。

C)K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同形狀的簇。

D)K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會合并有重疊的簇。

答案:A

解析:

161.[單選題]市場部門提出高價值終端換機用戶的識別需求,利用某段時間的0域數(shù)據(jù)暫無法挖掘的

特征是

A)重度游戲用戶識別

B)終端性能不匹配用戶識別

C)高頻次換機用戶識別

D)終端質(zhì)差用戶識別

答案:C

解析:

162.[單選題]給定df是一個DataFrame對象,對df所有字段進行描述性統(tǒng)計,可以利用的方法為()。

A)df.mean()

B)df.statistics()

C)df.summary()

D)df.describe()

答案:D

解析:

163.[單選題]使用交互式的和可視化的技術(shù),對數(shù)據(jù)進行探索屬于數(shù)據(jù)挖掘的哪一類任務(wù)?()

A)探索性數(shù)據(jù)分析

B)建模描述

C)預(yù)測建模

D)尋找模式和規(guī)則

答案:A

解析:

164.[單選題]運行以下代碼"importmatplotlib.pyplotaspit”引入pit后,要繪制直方圖,需要

利用的函數(shù)為()。

A)pit.plot()

B)pit.bar()

C)pit.hist()

D)plt.pie()

答案:C

解析:

165.[單選題]HDFS的數(shù)據(jù)塊大小通常為()

A)1M

B)64M

C)12M

D)8M

答案:B

解析:

166.[單選題]輿情研判,信息科學側(cè)重(),社會和管理科學側(cè)重突發(fā)群體事件管理中的群體心理

行為及輿論控制研究,新聞傳播學側(cè)重對輿論的本體進行規(guī)律性的探索和研究。

A)輿論的本體進行規(guī)律性的探索和研究

B)輿論控制研究

0互聯(lián)網(wǎng)文本挖掘和分析技術(shù)

D)用戶行為分析

答案:C

解析:

167.[單選題]以下哪項關(guān)于決策樹的說法是錯誤的

A)冗余屬性不會對決策樹的準確率造成不利的影響

B)子樹可能在決策樹中重復(fù)多次

C)決策樹算法對于噪聲的干擾非常敏感

D)尋找最佳決策樹是NP完全問題

答案:C

解析:

168.[單選題]業(yè)務(wù)請求次數(shù)為統(tǒng)計一定的時間粒度及網(wǎng)元粒度下,ProcedureType為()的S1-

MME接口XDR的個數(shù)

A)2

B)3

04

D)5

答案:A

解析:

169.[單選題]目前常用的識別異常數(shù)據(jù)的方法有物理判別法和()。

A)化學判別法

B)統(tǒng)計判別法

C)靜態(tài)判別法

D)動態(tài)判別法

答案:B

解析:

170.[單選題]/etc/init.d命令的作用是?

A)/etc/init.d說明了守護進程(服務(wù))的位置或狀態(tài)

B)指定hadoop的啟動路徑

C)指定HDFS的啟動路徑

D)指定YARN的啟動路徑

答案:A

解析:

171.[單選題]在SELECT查詢語句中對字段排序的命令子句是。

A)ORDERBY

B)GROUPBY

C)INSERT

D)UPDATA

答案:A

解析:

172.[單選題]在圖集合中發(fā)現(xiàn)一組公共子結(jié)構(gòu),這樣的任務(wù)稱為

A)頻繁子集挖掘

B)頻繁子圖挖掘

C)頻繁數(shù)據(jù)項挖掘

D)頻繁模式挖掘

答案:B

解析:

173.[單選題]設(shè)乂={1,2,3}是頻繁項集,則可由X可產(chǎn)生()個關(guān)聯(lián)規(guī)則。

A)3

B)4

05

D)6

答案:D

解析:

174.[單選題]回歸樹的葉子結(jié)點對應(yīng)()。

A)一個線性回歸方程

B)一個數(shù)值

C)以上都可以

D)某個類別

答案:B

解析:

175.[單選題]假定用于分析的數(shù)據(jù)包含屬性age。數(shù)據(jù)元組中age的值如下(按遞增序

):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45

,46,52,70,問題:使用按箱平均值平滑方法對上述數(shù)據(jù)進行平滑,箱的深度為3。第二個箱子值

為:()

A)18.3

B)22.6

026.8

D)27.9

答案:A

解析:

176.[單選題]用于分類與回歸應(yīng)用的主要算法有(C)0

A)K均值法、S0M神經(jīng)網(wǎng)絡(luò)

B)Apriori算法、HotSpot算法

C)決策樹、BP神經(jīng)網(wǎng)絡(luò)、貝葉斯

D)RBF神經(jīng)網(wǎng)絡(luò)、K均值法、決策樹

答案:C

解析:

177.[單選題]在抽樣方法中,當合適的樣本容量很難確定時,可以使用的抽樣方法是:()

A)有放回的簡單隨機抽樣

B)無放回的簡單隨機抽樣

C)分層抽樣

D)漸進抽樣

答案:D

解析:

178.[單選題]SGW和PGWS5/S8協(xié)議棧自上而下正確的順序是()

A)GTP/TCP/IP/L2/L1

B)GTP/UDP/IP/L2/L1

OGTP/SCTP/IP/L2/L1

D)GTP/RLC/MAC/L1

答案:B

解析:

179.[單選題]假設(shè)有n個數(shù)據(jù)點,其中一半用于訓練,另一半用于測試,隨著n的增加而訓練誤差和

測試誤差之間的差別會

A)增加

B)減少

C)不變

D)無法判斷

答案:B

解析:

180.[單選題]關(guān)于0LAP和OLTP的區(qū)別描述,不正確的是:()

A)OLAP主要是關(guān)于如何理解聚集的大量不同的數(shù)據(jù).它與OTAP應(yīng)用程序不同.

B)與OLAP應(yīng)用程序不同,OLTP應(yīng)用程序包含大量相對簡單的事務(wù).

O0LAP的特點在于事務(wù)量大,但事務(wù)內(nèi)容比較簡單且重復(fù)率高.

D)OLAP是以數(shù)據(jù)倉庫為基礎(chǔ)的,但其最終數(shù)據(jù)來源與OLTP一樣均來自底層的數(shù)據(jù)庫系統(tǒng),兩者面

對的用戶是相同的.

答案:C

解析:

181.[單選題]以下關(guān)于數(shù)據(jù)倉庫與操作型數(shù)據(jù)庫的敘述中錯誤的是()

A)數(shù)據(jù)倉庫是面向主題的,而操作型數(shù)據(jù)庫是面向應(yīng)用的

B)數(shù)據(jù)倉庫中保存當前數(shù)據(jù),而操作型數(shù)據(jù)庫中保存歷史數(shù)據(jù)

C)數(shù)據(jù)倉庫中數(shù)據(jù)常冗余,而操作型數(shù)據(jù)庫中數(shù)據(jù)非冗余

D)數(shù)據(jù)倉庫是支持決策分析的,而操作型數(shù)據(jù)庫是支持事務(wù)處理的

答案:B

解析:

182.[單選題]關(guān)于方差的描述錯誤的是()

A)用于兩個或兩個以上樣本均數(shù)差異的顯著性檢驗。

B)原假設(shè)是無差異。

C)對立假設(shè)是無差異

D)在概率論和統(tǒng)計方差衡量隨機變量或一組數(shù)據(jù)時離散程度的度量

答案:C

解析:

183.[單選題]以下哪項關(guān)于決策樹的說法是錯誤的()

A)冗余屬性不會對決策樹的準確率造成不利的影響

B)子樹可能在決策樹中重復(fù)多次

C)決策樹算法對于噪聲的干擾非常敏感

D)尋找最佳決策樹是NP完全問題

答案:C

解析:

184.[單選題]若{a,b}、{a,c}、{b,c}和(a,b,c}都是頻繁項集,它們的計數(shù)分別是6、5、4、3,則關(guān)

聯(lián)規(guī)則aandc-b的置信度是()

A)1/2

B)3/5

03/4

D)以上都不對

答案:B

解析:

185.[單選題]下列選取節(jié)點的表達式中,代表著從根節(jié)點開始選取的是。

A)/

B)//

C)name

D)@

答案:A

解析:

186.[單選題]用戶有一種感興趣的模式并且希望在數(shù)據(jù)集中找到相似的模式,屬于數(shù)據(jù)挖掘哪一類任

務(wù)?

A)根據(jù)內(nèi)容檢索

B)建模描述

C)預(yù)測建模

D)尋找模式和規(guī)則

答案:A

解析:

187.[單選題]以下哪種算法是分類算法()。

A)EM

B)C4.5

ODBSCAN

D)K-Mean

答案:B

解析:

188.[單選題]已知x=[1,2,3,4,5,6,7],那么x.pop()的結(jié)果是?

A)1

B)4

C)7

D)5

答案:C

解析:

189.[單選題]以下哪個聚類算法不是屬于基于原型的聚類()。

A)模糊c均值

B)EM算法

C)SOM

D)CLIQUE

答案:D

解析:

190.[單選題]依據(jù)歷史數(shù)據(jù)形成刻畫用戶特征的類標識,進而可以預(yù)測未來數(shù)據(jù)的歸類情況,屬于()

A)聚類

B)分類

C)預(yù)測

D)關(guān)聯(lián)

答案:B

解析:

191.[單選題]Logistic回歸是在商業(yè)領(lǐng)域上使用最廣泛的預(yù)測模型,常用于()分類變量預(yù)測和概

率預(yù)測。

A)四值

B)三值

C)二值

D)一值

答案:C

解析:

192.[單選題]如果規(guī)則集R中不存在兩條規(guī)則被同一條記錄觸發(fā),則稱規(guī)則集R中的規(guī)則為

A)無序規(guī)則

B)窮舉規(guī)則

C)互斥規(guī)則

D)有序規(guī)則

答案:C

解析:

193.[單選題]基本數(shù)據(jù)的元數(shù)據(jù)是指()

A)基本元數(shù)據(jù)包括與數(shù)據(jù)源、數(shù)據(jù)倉庫、數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息

B)基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息

C)基本元數(shù)據(jù)包括日志文件和建立執(zhí)行處理的時序調(diào)度信息

D)基本元數(shù)據(jù)包括關(guān)于裝載和更新處理、分析處理以及管理方面的信息

答案:A

解析:

194.[單選題]如果要在網(wǎng)管上建立GE級別的業(yè)務(wù)路徑,下面哪一個不是必需的

A)完整的Och路徑

B)完整的0DU1路徑

C)完整的0MS路徑

D)完整的OSC路徑

答案:D

解析:

195.[單選題]Hadoop集群是(),通常情況下()。

A)完全開放,可以從互聯(lián)網(wǎng)進行操作

B)半開放,特殊情況下可以從互聯(lián)網(wǎng)進行操作

C)半開放,無法從互聯(lián)網(wǎng)進行操作

D)完全隔離,無法從互聯(lián)網(wǎng)進行操作

答案:D

解析:

196.[單選題]運行以下代碼

Fromsklearn.datasetsimportload_iris

Iris_data=load_iris0

Iris_data.data,shape

輸出結(jié)果為(150,4)。則表示iris數(shù)據(jù)集包括樣本個數(shù)為()o

A)154

B)150

04

D)600

答案:C

解析:

197.[單選題]將原始數(shù)據(jù)進行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務(wù)?()

A)數(shù)據(jù)獲取

B)分類和預(yù)測

C)數(shù)據(jù)預(yù)處理

D)數(shù)據(jù)可視化

答案:C

解析:

198.[單選題]關(guān)于OLAP的特性,下面正確的是:(1)快速性(2)可分析性(3)多維性(4)信息性(5)共

享性

A)(1)(2)(3)

B)(2)(3)(4)

0(1)(2)(3)(4)

D)(1)(2)(3)(4)(5)

答案:D

解析:

199.[單選題]下列屬于數(shù)據(jù)挖掘任務(wù)的是()

A)收集公司的銷售數(shù)據(jù)

B)協(xié)調(diào)公司各部門工作

C)預(yù)測一對骰子的結(jié)果

D)通過銷售數(shù)據(jù)分析哪些商品經(jīng)常會被同時購買

答案:D

解析:

200.[單選題]在發(fā)生或者可能發(fā)生個人信息泄露、毀損、丟失的情況時,應(yīng)當立即采取()措施,按照

規(guī)定及時告知用戶并向有關(guān)主管部門報告。()

A)彌補

B)補救

C)救援

D)相關(guān)

答案:B

解析:

201.[單選題]用于分類與回歸應(yīng)用的主要算法有:()

A)Apriori算法、HotSpot算法

B)RBF神經(jīng)網(wǎng)絡(luò)、K均值法、決策樹

C)K均值法、S0M神經(jīng)網(wǎng)絡(luò)

D)決策樹、BP神經(jīng)網(wǎng)絡(luò)、貝葉斯

答案:D

解析:

202.[單選題]通用人工智能面對大型即時策略游戲,面臨很多亟待解決的問題,不包括()

A)通用人工智能需要平衡價值目標和策略目標,價值目標服務(wù)于長期目標,策略目標服務(wù)于短期目

標。這就需要通用人工智能,掌握博弈論的精髓。

B)通用人工智能,需要能夠主動挖掘游戲情報,并通過局部信息或不完美的信息做出游戲決策。

C)像許多現(xiàn)實世界的問題一樣,因果關(guān)系不是即時的。這意味著游戲早期采取的行動可能無法在很

長一段時間內(nèi)獲得回報。這就需要通用人工智能,具有長期規(guī)劃能力

D)智能匹配隊友

答案:D

解析:

203.[單選題]數(shù)據(jù)集成的內(nèi)容不包括()

A)實體識別

B)冗余處理

C)數(shù)據(jù)規(guī)約

D)數(shù)值沖突處理

答案:C

解析:

204.[單選題]如果規(guī)則集中的規(guī)則按照優(yōu)先級降序排列,則稱規(guī)則集是()

A)無序規(guī)則

B)窮舉規(guī)則

C)互斥規(guī)則

D)有序規(guī)則

答案:D

解析:

205.[單選題]如何在瀏覽器中查找Namenode?

A)如果你確實需要在瀏覽器中查找Namenode,Namenode的端口號是30070

B)如果你確實需要在瀏覽器中查找Namenode,Namenode的端口號是40070

C)如果你確實需要在瀏覽器中查找Namenode,Namenode的端口號是50070

D)如果你確實需要在瀏覽器中查找Namenode,Namenode的端口號是60070

答案:C

解析:

206.[單選題]因子分析的主要作用有()

A)對變量進行降維

B)對變量進行判別

C)對變量進行聚類

D)以上都不對

答案:A

解析:

207.[單選題]建立一個模型,通過這個模型根據(jù)已知的變量值來預(yù)測其他某個變量值屬于數(shù)據(jù)挖掘

的哪一類任務(wù)?()

A)根據(jù)內(nèi)容檢索

B)建模描述

C)預(yù)測建模

D)尋找模式和規(guī)則

答案:C

解析:

208.[單選題]考慮這么一種情況:一個對象碰巧與另一個對象相對接近,但屬于不同的類,因為

這兩個對象一般不會共享許多近鄰,所以應(yīng)該選擇()的相似度計算方法。

A)平方歐幾里德距離

B)余弦距離

C)直接相似度

D)共享最近鄰

答案:D

解析:

209.[單選題]以下哪條屬于個人信息影響的評估場景:()

A)處理敏感個人信息,利用個人信息進行自動化決策

B)委托處理個人信息、向第三方提供個人信息、公開個人信息

C)向境外提供個人信息

D)以上皆是

答案:D

解析:

210.[單選題]關(guān)于數(shù)據(jù)挖據(jù)工具,下列說法不正確的是()

A)Weka是機器學習或數(shù)據(jù)挖掘的庫與工具

B)Tableau是廣義數(shù)據(jù)挖掘中可視化工具

OOrange可通過Java編程和命令行來調(diào)用其分析組件

D)OracleDarwin是企業(yè)數(shù)據(jù)挖據(jù)工具

答案:C

解析:

211.[單選題]以下哪些分類方法可以較好地避免樣本的不平衡問題,

A)KNN

B)SVM

C)Bayes

D)神經(jīng)網(wǎng)絡(luò)

答案:A

解析:

212.[單選題]Python在調(diào)用efficient-apriori包中的apriori函數(shù)進行挖掘關(guān)聯(lián)規(guī)則時,第二個返

回值是()。

A)最小支持度

B)關(guān)聯(lián)規(guī)則

C)頻繁項集

D)最小置信度

答案:B

解析:

213.[單選題]按A,B,C,D打分的考試成績數(shù)據(jù)屬于

A)數(shù)值型(連續(xù))

B)數(shù)值型(離散)

C)序數(shù)型(Ordinal)

D)標稱型(Nominal)

答案:C

解析:

214.[單選題]在有指導(dǎo)的數(shù)據(jù)挖掘中,有關(guān)測試集的說法錯誤的是()

A)測試集和訓練集是相互聯(lián)系的

B)測試集是用以測試模型的數(shù)據(jù)集

0通常測試集大約占總樣本的三分之一

D)K-次交叉驗證中,測試集只有1個,訓練集有K-1個

答案:A

解析:

215.[單選題]()將兩個簇的鄰近度定義為兩個簇合并時導(dǎo)致的平方誤差的增量,它是一種凝聚層次

聚類技術(shù)。

A)MIN(單鏈)

B)MAX(全鏈)

C)組平均

D)Ward方法

答案:D

解析:

216.[單選題]OLAP的基本操作不包括()。

A)上鉆

B)下鉆

C)切片

D)平移

答案:D

解析:

217.[單選題]以下哪個聚類算法不屬于基于網(wǎng)格的聚類算法()。

A)STING

B)WaveCluster

C)MAFIA

D)BIRCH

答案:D

解析:

218.[單選題]下列哪項不可以用于評價視頻業(yè)務(wù)的體驗()

A)流媒體播放成功次數(shù)

B)流媒體包下載時長

C)初始緩沖平均時長

D)ATTACH成功率

答案:D

解析:

219.[單選題]時間序列與一般的有序變量數(shù)列()

A)都是根據(jù)時間順序排列的

B)都是根據(jù)變量值大小排列的

C)前者是根據(jù)時間順序排列的,后者是根據(jù)變量值大小排列的

D)前者是根據(jù)變量值大小排列的,后者是根據(jù)時間順序排列的

答案:C

解析:

220.[單選題]Python在調(diào)用efficient-apriori包中的apriori函數(shù)進行挖掘關(guān)聯(lián)規(guī)則時,第二個返回

值是()。

A)最小置信度

B)最小支持度

0關(guān)聯(lián)規(guī)則

D)頻繁項集

答案:C

解析:

221.[單選題]下面哪個算法可以將文本數(shù)據(jù)轉(zhuǎn)換為數(shù)值數(shù)據(jù)?()

A)TF-IDF

B)決策樹

OPCA

D)DBSCAN

答案:A

解析:

222.[單選題]基于輸入的用戶信息,通過模型的訓練學習,找出數(shù)據(jù)中的規(guī)律和趨勢,以確定未來目標

數(shù)據(jù)的預(yù)測值()

A)聚類

B)分類

C)預(yù)測

D)關(guān)聯(lián)

答案:C

解析:

223.[單選題]下列不屬于數(shù)據(jù)變換策略的是()。

A)光滑

B)聚集

C)規(guī)范化

D)集成

答案:D

解析:

224.[單選題]將原始數(shù)據(jù)進行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務(wù)?

A)頻繁模式挖掘

B)分類和預(yù)測

C)數(shù)據(jù)預(yù)處理

D)數(shù)據(jù)流挖掘

答案:C

解析:

225.[單選題]使用python處理缺失值的方法中敘述錯誤的是()。

A)isnull()判斷缺失值

B)dropna()刪除缺失值

C)interpolate()使用中位數(shù)填充缺失值

D)fillna()填充缺失值

答案:C

解析:interpolate。指用線性插值法

226.[單選題]關(guān)于性能度量不正確的是()

A)性能度量是衡量模型泛化能力的評價標準,反映了任務(wù)需求

B)在對比不同模型的能力時,使用不同的性能度量會導(dǎo)致不同的評判結(jié)果,這就意味著模型的“好

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論