2024年大數(shù)據(jù)應(yīng)用及處理技術(shù)能力知識考試題庫與答案

上傳人：追*** IP屬地：河北上傳時間：2024-09-08 格式：PDF 頁數(shù)：33 大小：8.01MB 積分：12 舉報 版權(quán)申訴

2024年大數(shù)據(jù)應(yīng)用及處理技術(shù)能力知識考試題庫與答案_第2頁

2024年大數(shù)據(jù)應(yīng)用及處理技術(shù)能力知識考試題庫與答案_第3頁

2024年大數(shù)據(jù)應(yīng)用及處理技術(shù)能力知識考試題庫與答案_第4頁

2024年大數(shù)據(jù)應(yīng)用及處理技術(shù)能力知識考試題庫與答案_第5頁

已閱讀5頁，還剩28頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2024年大數(shù)據(jù)應(yīng)用及處理技術(shù)能力知識考試題庫與答案

一、單選題

1.當(dāng)圖像通過信道傳輸時，噪聲一般與（）無關(guān)。

A、信道傳輸?shù)馁|(zhì)量

B、出現(xiàn)的圖像信號

C、是否有中轉(zhuǎn)信道的過程

D、圖像在信道前后的處理

參考答案：B

2.在留出法、交叉驗證法和自助法三種評估方法中，（）更適用于數(shù)據(jù)集較

小、難以劃分訓(xùn)練集和測試集的情況。

A、留出法

B、交叉驗證法

C、自助法

D、留一法

參考答案：C

3.在數(shù)據(jù)科學(xué)中，通?？梢圆捎茫ǎ┓椒ㄓ行П苊鈹?shù)據(jù)加工和數(shù)據(jù)備份的

偏見。

A、A/B測試

B、訓(xùn)練集和測試集的劃分

C、測試集和驗證集的劃分

D、圖靈測試

參考答案：A

4.下列不屬于深度學(xué)習(xí)內(nèi)容的是（_）。

A、深度置信網(wǎng)絡(luò)

B、受限玻爾茲曼機(jī)

C、卷積神經(jīng)網(wǎng)絡(luò)

D、貝葉斯學(xué)習(xí)

參考答案：D

5.在大數(shù)據(jù)項目中，哪個階段可能涉及使用數(shù)據(jù)工程師來優(yōu)化數(shù)據(jù)查詢性

能？

A、數(shù)據(jù)采集

B、數(shù)據(jù)清洗

C、數(shù)據(jù)存儲與管理

D、數(shù)據(jù)分析與可視化

參考答案：C

6.假定你現(xiàn)在訓(xùn)練了一個線性SVM并推斷出這個模型出現(xiàn)了欠擬合現(xiàn)象,

在下一次訓(xùn)練時,應(yīng)該采取下列什么措施()

A、增加數(shù)據(jù)點

B、減少數(shù)據(jù)點

C、增加特征

D、減少特征

參考答案：C

7.兩個變量相關(guān)，它們的相關(guān)系數(shù)r可能為0?這句話是否正確()

A、正確

B、錯誤

參考答案：A

8.一幅數(shù)字圖像是()。

A、一個觀測系統(tǒng)

B、一個由許多像素排列而成的實體

C、一個2-D數(shù)組中的元素

D、一個3-D空間中的場景

參考答案：C

9.以下說法正確的是：()。一個機(jī)器學(xué)習(xí)模型，如果有較高準(zhǔn)確率，總是說

明這個分類器是好的如果增加模型復(fù)雜度，那么模型的測試錯誤率總是會降低如

果增加模型復(fù)雜度,那么模型的訓(xùn)練錯誤率總是會降低

A、1

B、2

C、3

D、land3

參考答案：c

10.從網(wǎng)絡(luò)的原理上來看，結(jié)構(gòu)最復(fù)雜的神經(jīng)網(wǎng)絡(luò)是（）。

A、卷積神經(jīng)網(wǎng)絡(luò)

B、長短時記憶神經(jīng)網(wǎng)絡(luò)

C、GRU

D、BP神經(jīng)網(wǎng)絡(luò)

參考答案：B

11.LSTM中，（_）的作用是確定哪些新的信息留在細(xì)胞狀態(tài)中，并更新細(xì)胞

狀態(tài)。

A、輸入門

B、遺忘門

G輸出門

D、更新門

參考答案：A

12.Matplotiib的核心是面向（）。

A、過程

B、對象

C、結(jié)果

D、服務(wù)

參考答案：B

13.診斷性分析主要采取的分析方法是（）和（）。

A、關(guān)聯(lián)分析和因果分析法

B、關(guān)聯(lián)分析和分類分析法

C、關(guān)聯(lián)分析和運籌學(xué)

D、因果分析和分類分析法

參考答案：A

14.信息增益對可取值數(shù)目（）的屬性有所偏好,增益率對可取值數(shù)目（）的屬

性有所偏好。

A、較高，較高

B、較高，較低

C、較低，較高

D、較低，較低

參考答案：B

15.關(guān)于基本數(shù)據(jù)的元數(shù)據(jù)是指()。

A、基本元數(shù)據(jù)與數(shù)據(jù)源，數(shù)據(jù)倉庫，數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息

B、基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息

C、基本元數(shù)據(jù)包括日志文件和簡歷執(zhí)行處理的時序調(diào)度信息

D、基本元數(shù)據(jù)包括關(guān)于裝載和更新處理,分析處理以及管理方面的信息

參考答案：D

16.標(biāo)準(zhǔn)BP算法的目標(biāo)是使訓(xùn)練集上的()為最小。

A、累積方差

B、累積誤差

C、累積協(xié)方差

D、累積偏差

參考答案：B

17.假負(fù)率是指()。

A、正樣本預(yù)測結(jié)果數(shù)/正樣本實際數(shù)

B、被預(yù)測為負(fù)的正樣本結(jié)果數(shù)/正樣本實際數(shù)

C、被預(yù)測為正的負(fù)樣本結(jié)果數(shù)/負(fù)樣本實際數(shù)

D、負(fù)樣本預(yù)測結(jié)果數(shù)/負(fù)樣本實際數(shù)

參考答案：B

18.bootstrap數(shù)據(jù)是什么意思()。

A、有放回地從總共M個特征中抽樣m個特征

B、無放回地從總共M個特征中抽樣m個特征

C、有放回地從總共N個樣本中抽樣n個樣本

D、無放回地從總共N個樣本中抽樣n個樣本

參考答案：C

19.劃分聚類算法是一種簡單的較為基本的重要聚類方法。它的主要思想是

通過將數(shù)據(jù)點集分為()個劃分，并使用重復(fù)的控制策略使某個準(zhǔn)則最優(yōu)化，以達(dá)

到最終的結(jié)果

A、D

B、K

C、E

D、F

參考答案：B

20.有N個樣本，一般用于訓(xùn)練，一般用于測試。若增大N值,則訓(xùn)練誤差和

測試誤差之間的差距會如何變化()。

A、增大

B、減小

C、無法確定

D、無明顯變化

參考答案：B

21.()是指給目標(biāo)用戶產(chǎn)生的錯誤或不準(zhǔn)確的視覺感知，而這種感知與數(shù)據(jù)

可視化者的意圖或數(shù)據(jù)本身的真實情況不一致。

A、視覺假象

B、視覺認(rèn)知

C、視覺感知

D、數(shù)據(jù)可視

參考答案：A

22.以下濾波器對圖像中的椒鹽噪聲濾波效果最好的是()。

A、中值濾波

B、均值濾波

C、最大值濾波

D、最小值濾波

參考答案：A

23.MapReduce中，Shuffle操作的作用是()。

A、合并

B、排序

C、降維

D、分區(qū)

參考答案：B

24.對于SVM分類算法,待分樣本集中的大部分樣本不是支持向量,下列說法

正確的是()。

A、需要將這些樣本全部強(qiáng)制轉(zhuǎn)換為支持向量

B、需要將這些樣本中可以轉(zhuǎn)化的樣本轉(zhuǎn)換為支持向量,不能轉(zhuǎn)換的直接刪除

C、移去或者減少這些樣本對分類結(jié)果沒有影響

D、以上都不對

參考答案：C

25.下列對于sigmoid函數(shù)的說法，錯誤的是()

A、存在梯度爆炸的問題

B、不是關(guān)于原點對稱

C、計算exp比較耗時

D、存在梯度消失的問題

參考答案：A

26.決策樹模型的規(guī)模應(yīng)當(dāng)是()。

A、越復(fù)雜越好

B、越簡單越好

C、適當(dāng)限制其復(fù)雜程度

D、盡可能利用所有特征

參考答案：C

27.在大數(shù)據(jù)分析中，使用K-means聚類算法時，通常需要預(yù)先指定哪個參

數(shù)？

A、聚類的中心數(shù)(K值)

B、數(shù)據(jù)集的大小

C、數(shù)據(jù)的維度

D、聚類的形狀

參考答案：A

28.在大數(shù)據(jù)可視化中，哪種圖表最適合展示數(shù)據(jù)的層次結(jié)構(gòu)或分類關(guān)系？

A、樹狀圖

B、折線圖

C、散點圖

D、熱力圖

參考答案：A

29.在大數(shù)據(jù)處理中，使用流式處理(StreamProcessing)的主要優(yōu)勢是

什么？

A、實時性

B、更高的數(shù)據(jù)處理精度

C、更好的數(shù)據(jù)一致性

D、更低的存儲成本

參考答案：A

30.以下哪個不是大數(shù)據(jù)處理中常見的機(jī)器學(xué)習(xí)算法？

A、線性回歸

B、決策樹

C、傅里葉變換

D、隨機(jī)森林

參考答案：C(傅里葉變換主要用于信號處理，不是機(jī)器學(xué)習(xí)算法)

31.在大數(shù)據(jù)項目中，哪個階段可能涉及使用數(shù)據(jù)科學(xué)家來評估模型的準(zhǔn)確

性和性能？

A、數(shù)據(jù)采集

B、數(shù)據(jù)清洗

C、模型評估與調(diào)優(yōu)

D、數(shù)據(jù)可視化

參考答案：C

32.在大數(shù)據(jù)安全中，哪種技術(shù)或措施常用于保護(hù)數(shù)據(jù)在存儲過程中的安全

性？

A、加密技術(shù)

B、防火墻

C、訪問控制

D、入侵檢測系統(tǒng)

參考答案：A

33.以下哪個是ApacheKafka在大數(shù)據(jù)生態(tài)系統(tǒng)中的主要角色？

A、實時數(shù)據(jù)處理引擎

B、分布式文件系統(tǒng)

C、高吞吐量分布式發(fā)布-訂閱消息系統(tǒng)

D、數(shù)據(jù)倉庫

參考答案：C

34.在大數(shù)據(jù)項目中，哪個階段通常涉及對數(shù)據(jù)分析結(jié)果的解讀和向非技術(shù)

用戶展示分析結(jié)果？

A、數(shù)據(jù)采集

B、數(shù)據(jù)預(yù)處理

C、數(shù)據(jù)分析

D、數(shù)據(jù)可視化與報告

參考答案：D

35.在大數(shù)據(jù)分析中，使用決策樹算法的主要目的是什么？

A、預(yù)測分類結(jié)果

B、發(fā)現(xiàn)數(shù)據(jù)中的關(guān)聯(lián)規(guī)則

C、壓縮數(shù)據(jù)大小

D、實時處理數(shù)據(jù)流

參考答案：A

36.以下哪個不是大數(shù)據(jù)處理中常見的非結(jié)構(gòu)化數(shù)據(jù)類型？

A、文本文件

B、音頻文件

C、數(shù)據(jù)庫表

D、視頻文件

參考答案：C（數(shù)據(jù)庫表通常被認(rèn)為是結(jié)構(gòu)化數(shù)據(jù)）

37.在大數(shù)據(jù)項目中，哪個階段可能涉及使用數(shù)據(jù)科學(xué)家來構(gòu)建預(yù)測模型？

A、數(shù)據(jù)采集

B、數(shù)據(jù)清洗

C、數(shù)據(jù)分析與建模

D、數(shù)據(jù)可視化

參考答案：C

38.在大數(shù)據(jù)可視化中，使用哪種圖表可以更好地展示數(shù)據(jù)隨時間變化的趨

勢？

A、面積圖

B、餅圖

C、雷達(dá)圖

D、散點圖

參考答案：A

39.在大數(shù)據(jù)處理中，為了提高處理效率，通常會采用哪種策略來減少數(shù)據(jù)

傳輸量？

A、數(shù)據(jù)壓縮

B、增加數(shù)據(jù)節(jié)點

C、降低處理精度

D、使用更快的網(wǎng)絡(luò)

參考答案：A

40.在大數(shù)據(jù)安全中，哪種技術(shù)或措施通常用于防止SQL注入攻擊？

A、加密技術(shù)

B、訪問控制

C、參數(shù)化查詢

D、數(shù)據(jù)脫敏

參考答案：C

41.在大數(shù)據(jù)項目中，哪個階段可能涉及使用數(shù)據(jù)工程師來設(shè)計和優(yōu)化數(shù)據(jù)

存儲架構(gòu)？

A、數(shù)據(jù)采集

B、數(shù)據(jù)清洗

C、數(shù)據(jù)存儲與管理

D、數(shù)據(jù)分析與可視化

參考答案：C

42.下面關(guān)于詞袋模型說法錯誤的是()。

A、詞袋模型使用一個多重集對文本中出現(xiàn)的單詞進(jìn)行編碼

B、詞袋模型不考慮詞語原本在句子中的順序

C、詞袋模型可以應(yīng)用于文檔分類和檢索，同時受到編碼信息的限制

D、詞袋模型產(chǎn)生的靈感來源于包含類似單詞的文檔經(jīng)常有相似的含義

參考答案：C

43.以下哪個不是大數(shù)據(jù)處理中常見的ETL(Extract,Transform,Load)過

程的一部分？

A、數(shù)據(jù)提取

B、數(shù)據(jù)清洗

C、數(shù)據(jù)可視化

D、數(shù)據(jù)加載

參考答案：C

44.在大數(shù)據(jù)分析中，使用神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像識別時，哪一層通常負(fù)責(zé)學(xué)習(xí)

數(shù)據(jù)的特征表示？

A、輸入層

B、隱藏層

C、輸出層

D、激活層

參考答案：B

45.在大數(shù)據(jù)可視化中，哪種圖表最適合用于比較不同類別的數(shù)據(jù)占比？

A、餅圖

B、折線圖

C、箱線圖

D、雷達(dá)圖

參考答案：A

46.在大數(shù)據(jù)可視化中，哪種圖表最適合用于展示多個變量之間的關(guān)系？

A、散點圖

B、折線圖

C、餅圖

D、熱力圖

參考答案：A

47.當(dāng)相關(guān)系數(shù)r=0時，說明（）。

A、現(xiàn)象之間相關(guān)程度較小

B、現(xiàn)象之間完全相關(guān)

C、現(xiàn)象之間無直線相關(guān)

D、現(xiàn)象之間完全無關(guān)

參考答案：C

48.在大數(shù)據(jù)項目中，哪個階段可能涉及使用數(shù)據(jù)科學(xué)家來制定數(shù)據(jù)科學(xué)策

略？

A、數(shù)據(jù)采集

B、項目規(guī)劃

C、數(shù)據(jù)清洗

D、數(shù)據(jù)可視化

參考答案：B

49.大數(shù)據(jù)的“Variety”特性主要指的是什么？

A、數(shù)據(jù)量的大小

B、數(shù)據(jù)處理的速度

C、數(shù)據(jù)的類型和結(jié)構(gòu)多樣性

D、數(shù)據(jù)的真實性和準(zhǔn)確性

參考答案：C

50.在大數(shù)據(jù)安全中，哪種技術(shù)或措施常用于保護(hù)數(shù)據(jù)傳輸過程中的安全

性？

A、加密技術(shù)

B、訪問控制

C、防火墻

D、入侵檢測系統(tǒng)

參考答案：A

51.關(guān)于數(shù)據(jù)分析，下列說法正確的是()。

A、描述性分析和預(yù)測性分析是對診斷性分析的基礎(chǔ)

B、斷性分析分析是對規(guī)范性分析的進(jìn)一步理解

C、預(yù)測性分析是規(guī)范性分析的基礎(chǔ)

D、規(guī)范性分析是數(shù)據(jù)分析的最高階段，可以直接產(chǎn)生產(chǎn)業(yè)價值

參考答案：C

52.增加卷積核的大小對于改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)的效果是必要的嗎()

A、是的，增加卷積核尺寸一定能提高性能

B、不是，增加核函數(shù)的大小不一定會提高性能

參考答案：B

53.三維以上數(shù)組是以()的形式輸出的。

A、按行輸出

B、按矩陣輸出

C、按矩陣列表輸出

D、按字符串輸出

參考答案：C

54.從連續(xù)圖像到數(shù)字圖像需要()。

A、圖像灰度級設(shè)定

B、圖像分辨率設(shè)定

C、確定圖像的存儲空間

D、采樣和量化

參考答案：D

55.以下分割方法中不屬于區(qū)域算法的是()。

A、分裂合并

B、閾值分割

C、區(qū)域生長

D、邊緣檢測

參考答案：D

56.以下哪個不屬于數(shù)據(jù)治理的內(nèi)容。

A、理解自己的數(shù)據(jù)

B、行為規(guī)范的制定

C、崗位職責(zé)的定義

D、獲得更多的數(shù)據(jù)

參考答案：D

57.數(shù)據(jù)故事話的“情景'不包括0。

A、還原情景

B、統(tǒng)計情景

C、移植情景

D、虛構(gòu)情景

參考答案：B

58.為了觀察測試Y與X之間的線性關(guān)系,X是連續(xù)變量，使用下列()比較

適合。

A、散點圖

B、柱形圖

G直方圖

D、以上答案都不正確

參考答案：A

59.下列哪個用于說明在R加上執(zhí)行何種計算()。

A、分區(qū)；

B、算子；

C、日志；

D、數(shù)據(jù)塊；

參考答案：B

60.情感信息歸納常見的存在形式是()。

A、語料庫

B、情感文摘

C、情感評論

D、情感傾向

參考答案：B

61.平滑圖像()處理可以采用RGB彩色模型。

A、直方圖均衡化

B、直方圖均衡化

C、加權(quán)均值濾波

D、中值濾波

參考答案：C

62.在抽樣估計中，隨著樣本容量的增大，樣本統(tǒng)計量接近總體參數(shù)的概率

就越大,這一性質(zhì)稱為()

A、無偏性

B、有效性

C、及時性

D、一致性

參考答案：D

63.下列場景中最有可能應(yīng)用人工智能的是()。

A、刷臉辦電

B、輿情分析

C、信通巡檢機(jī)器人

D、以上答案都正確

參考答案：D

64.過濾式特征選擇與學(xué)習(xí)器()，包裹式特征選擇與學(xué)習(xí)器()。

A、相關(guān)相關(guān)

B、相關(guān)不相關(guān)

C、不相關(guān)相關(guān)

D、不相關(guān)不相關(guān)

參考答案：C

65.()是數(shù)據(jù)庫管理系統(tǒng)運行的基本工作單位。

A、事務(wù)

B、數(shù)據(jù)倉庫

C、數(shù)據(jù)單元

D、數(shù)據(jù)分析

參考答案：A

66.DAGScheduler的作用是什么()

A、負(fù)責(zé)分配任務(wù)；

B、負(fù)責(zé)調(diào)度Worker的運行；

C、負(fù)責(zé)創(chuàng)建執(zhí)行計劃；

D、負(fù)責(zé)清理執(zhí)行完畢的任務(wù)；

參考答案：C

67.數(shù)據(jù)安全不只是技術(shù)問題，還涉及到()。

A、人員問題

B、管理問題

C、行政問題

D、領(lǐng)導(dǎo)問題

參考答案：B

68.關(guān)于表述數(shù)據(jù)可視化在數(shù)據(jù)科學(xué)中重要地位說法中，下列不正確的是()。

A、視覺是人類獲得信息的最主要途徑

B、數(shù)據(jù)可視化處理可以洞察統(tǒng)計分析無法發(fā)現(xiàn)的結(jié)構(gòu)和細(xì)節(jié)

C、數(shù)據(jù)可視化處理結(jié)果的解讀對用戶知識水平的要求較高

D、可視化能夠幫助人們提高理解與處理數(shù)據(jù)的效率

參考答案：C

69.下列關(guān)于文本分類的說法不正確的是()

A、文本分類是指按照預(yù)先定義的主題類別，由計算機(jī)自動地為文檔集合中

的每個文檔確定一個類別

B、文本分類大致可分為基于知識工程的分類系統(tǒng)和基于機(jī)器學(xué)習(xí)的分類系

統(tǒng)

C、文本的向量形式一般基于詞袋模型構(gòu)建，該模型考慮了文本詞語的行文順

序

D、構(gòu)建文本的向量形式可以歸結(jié)為文本的特征選擇與特征權(quán)重計算兩個步

驟

參考答案：C

70.關(guān)于函數(shù)的關(guān)鍵字參數(shù)使用限制，以下選項中描述錯誤的是()。

A、關(guān)鍵字參數(shù)必須位于位置參數(shù)之前

B、不得重復(fù)提供實際參數(shù)

C、關(guān)鍵字參數(shù)必須位于位置參數(shù)之后

D、關(guān)鍵字參數(shù)順序無限制

參考答案：A

71.Apriori算法的核心思想是()。

A、通過頻繁項集生成和情節(jié)的向下封閉檢測兩個階段來挖掘候選集

B、通過候選集生成和情節(jié)的向下封閉檢測兩個階段來挖掘頻繁項集

C、數(shù)據(jù)集中包含該項集的數(shù)據(jù)所占數(shù)據(jù)集的比例，度量一個集合在原始數(shù)據(jù)

中出現(xiàn)的頻率

D、若某條規(guī)則不滿足最小置信度要求,則該規(guī)則的所有子集也不滿足最小置

信度要求

參考答案：B

72.kNN最近鄰算法在什么情況下效果較好0。

A、樣本較多但典型性不好

B、樣本較少但典型性好

C、樣本呈團(tuán)狀分布

D、樣本呈鏈狀分布

參考答案：B

73.數(shù)據(jù)銷毀環(huán)節(jié)的安全技術(shù)措施有通過軟件或物理方式保障磁盤中存儲數(shù)

據(jù)的()、不可恢復(fù)，如數(shù)據(jù)銷毀軟件、硬盤消磁機(jī)、硬盤粉碎機(jī)等。

A、暫時隔離

B、暫時刪除

C、永久刪除

D、不作處理

參考答案：C

74.對于一個分類任務(wù),如果開始時神經(jīng)網(wǎng)絡(luò)的權(quán)重不是隨機(jī)賦值的,而是都

設(shè)成0,下面哪個敘述是正確的()

A、其他選項都不對

B、沒啥問題，神經(jīng)網(wǎng)絡(luò)會正常開始訓(xùn)練

C、神經(jīng)網(wǎng)絡(luò)可以訓(xùn)練,但是所有的神經(jīng)元最后都會變成識別同樣的東西

D、神經(jīng)網(wǎng)絡(luò)不會開始訓(xùn)練,因為沒有梯度改變

參考答案：C

75.關(guān)于層次聚類算法：⑴不斷重復(fù)直達(dá)達(dá)到預(yù)設(shè)的聚類簇數(shù)⑵不斷合并距

離最近的聚類簇⑶對初始聚類簇和相應(yīng)的距離矩陣初始化⑷對合并得到的聚類

簇進(jìn)行更新。正確的執(zhí)行順序為()。

A、1234

B、1324

C、3241

D、3412

參考答案：C

76.以下()屬于DMM(數(shù)據(jù)管理成熟度模型)中的關(guān)鍵過程域“數(shù)據(jù)戰(zhàn)略”。

A、數(shù)據(jù)戰(zhàn)略制定

B、業(yè)務(wù)術(shù)語表

C、數(shù)據(jù)質(zhì)量評估

D、過程質(zhì)量保障

參考答案：A

77.下列關(guān)于大數(shù)據(jù)的分析理念的說法中，錯誤的是0。

A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)

B、在分析方法上更注重相關(guān)分析而不是因果分析

C、在分析效果上更追求效率而不是絕對精確

D、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)

參考答案：D

78.以下關(guān)于圖像的平滑處理錯誤的說法是()。

A、圖像的平滑處理是指在盡量保留原有信息的情況下,過濾掉圖像內(nèi)部的噪

音

B、圖像平滑處理會對圖像中與周圍像素點的像素值差異較大的像素點進(jìn)行

處理,將其值調(diào)整為周圍像素點像素值的近似值

C、講過平滑處理后圖像質(zhì)量會下降

D、以上答案都正確

參考答案：C

79.在抽樣方法中，當(dāng)合適的樣本容量很難確定時，可以使用的抽樣方法是:

()

A、有放回的簡單隨機(jī)抽樣

B、無放回的簡單隨機(jī)抽樣

C、分層抽樣

D、漸進(jìn)抽樣

參考答案：D

80.數(shù)據(jù)安全技術(shù)保護(hù)與信息系統(tǒng)“三同步”原則不包括以下哪項()。

A、同步規(guī)劃

B、同步建設(shè)

C、同步使用

D、同步運維

參考答案：D

81.()將觀測值分為相同數(shù)目的兩部分,當(dāng)統(tǒng)計結(jié)果為非對稱分布時，經(jīng)常使

用它。

A、眾數(shù)

B、標(biāo)準(zhǔn)差

C、中位數(shù)

D、均值

參考答案：C

82.()是指針對用戶非常明確的數(shù)據(jù)查詢和處理任務(wù)，以高性能和高吞吐量

的方式實現(xiàn)大眾化的服務(wù),是數(shù)據(jù)價值最重要也是最直接的發(fā)現(xiàn)方式。

A、數(shù)據(jù)服務(wù)

B、數(shù)據(jù)分析

C、數(shù)據(jù)治理

D、數(shù)據(jù)應(yīng)用

參考答案：A

83.數(shù)據(jù)斐產(chǎn)維護(hù)是指為保證數(shù)據(jù)質(zhì)量,對數(shù)據(jù)進(jìn)行()等處理的過程。

A、更正

B、刪除

C、補(bǔ)充錄入

D、以上答案都正確

參考答案：D

84.以下可以應(yīng)用關(guān)鍵詞提取的是()。

A、文獻(xiàn)檢索

B、自動文摘

C、文本聚類/分類

D、以上答案都正確

參考答案：D

85.()是實現(xiàn)數(shù)據(jù)戰(zhàn)略的重要保障。

A、數(shù)據(jù)管理

B、數(shù)據(jù)分析

C、數(shù)據(jù)治理

D、數(shù)據(jù)規(guī)劃

參考答案：C

86.ggplot2的核心理念是()o

A、繪圖與數(shù)據(jù)分離

B、結(jié)構(gòu)與數(shù)據(jù)分離

C、繪圖與結(jié)構(gòu)分離

D、繪圖與數(shù)據(jù)和結(jié)構(gòu)分離

參考答案：A

87.最早被提出的循環(huán)神經(jīng)網(wǎng)絡(luò)門控算法是什么()

A、長短期記憶網(wǎng)絡(luò)

B、門控循環(huán)單元網(wǎng)絡(luò)

C、堆疊循環(huán)神經(jīng)網(wǎng)絡(luò)

D、雙向循環(huán)神經(jīng)網(wǎng)絡(luò)

參考答案：A

88.在其他條件不變的前提下，以下哪種做法容易引起機(jī)器學(xué)習(xí)中的過擬合

問題()o

A、增加訓(xùn)練集量

B、減少神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點數(shù)

C、刪除稀疏的特征

D、SVM算法中使用高斯核/RBF核代替線性核

參考答案：D

89.下列的哪種方法可以用來降低深度學(xué)習(xí)模型的過擬合問題()。

1增加更多的數(shù)據(jù)

2使用數(shù)據(jù)擴(kuò)增技術(shù)(dataaugmentation)

3使用歸納性更好的架構(gòu)

4正規(guī)化數(shù)據(jù)

5降低架構(gòu)的復(fù)雜度

A、145

B、123

C、1345

D、所有項目都有用

參考答案：D

90.神經(jīng)網(wǎng)絡(luò)感知機(jī)只有(_)神經(jīng)元進(jìn)行激活函數(shù)處理，即只擁有一層功能神

經(jīng)兀。

A、輸出層

B、輸入層

G感知層

D、網(wǎng)絡(luò)層

參考答案：A

91.大數(shù)據(jù)的實時分析通常指的是什么？

A、批量處理數(shù)據(jù)

B、流式處理數(shù)據(jù)

C、離線分析數(shù)據(jù)

D、數(shù)據(jù)挖掘

參考答案：B

92.下列哪個是大數(shù)據(jù)分析的典型應(yīng)用場景？

A、財務(wù)報告編制

B、客戶行為分析

C、產(chǎn)品成本核算

D、員工績效評估

參考答案：B

93.在大數(shù)據(jù)架構(gòu)中，MapReduce通常用于什么？

A、數(shù)據(jù)存儲

B、數(shù)據(jù)查詢

C、數(shù)據(jù)處理

D、數(shù)據(jù)可視化

參考答案：C

94.以下哪個不是大數(shù)據(jù)應(yīng)用的領(lǐng)域？

A、金融

B、醫(yī)療

C、教育

D、農(nóng)業(yè)

參考答案：C

95.圖像平滑會造成什么效果？

A、圖像邊緣模糊化

B、圖像邊緣清晰化

C、無影響

D、以上答案都不正確

參考答案：A

96.關(guān)于Spark的說法中，哪個是錯誤的？

A、采用內(nèi)存計算模式

B、可利用多種語言編程

C、主要用于批處理

D、可進(jìn)行map()操作

參考答案：C

97.大數(shù)據(jù)分析中，數(shù)據(jù)清洗的主要目的是什么？

A、增加數(shù)據(jù)量

B、去除重復(fù)數(shù)據(jù)

C、提高數(shù)據(jù)質(zhì)量

D、轉(zhuǎn)換數(shù)據(jù)格式

參考答案：C

98.在大數(shù)據(jù)環(huán)境中，NoSQL數(shù)據(jù)庫相對于傳統(tǒng)關(guān)系型數(shù)據(jù)庫的主要優(yōu)勢是

什么？

A、更好的數(shù)據(jù)一致性

B、嚴(yán)格的數(shù)據(jù)模式

C、高可擴(kuò)展性和靈活性

D、適用于所有數(shù)據(jù)類型

參考答案：C

99.大數(shù)據(jù)可視化通常用于什么目的？

A、隱藏復(fù)雜數(shù)據(jù)中的模式

B、直觀展示數(shù)據(jù)分析結(jié)果

C、加密敏感數(shù)據(jù)

D、減小數(shù)據(jù)存儲空間

參考答案：B

100.HadoopYARN的主要功能是什么？

A、數(shù)據(jù)存儲

B、資源管理和作業(yè)調(diào)度

C、數(shù)據(jù)處理

D、實時分析

參考答案：B

101.大數(shù)據(jù)的“Veracity”特性主要指的是什么?

A、數(shù)據(jù)量的大小

B、數(shù)據(jù)處理的速度

C、數(shù)據(jù)的多樣性

D、數(shù)據(jù)的真實性和準(zhǔn)確性

參考答案：D

102.在大數(shù)據(jù)處理中，使用PCA（主成分分析）的主要目的是什么？

A、數(shù)據(jù)降維

B、數(shù)據(jù)分類

C、數(shù)據(jù)預(yù)測

D、數(shù)據(jù)清洗

參考答案：A

103.以下哪個不是大數(shù)據(jù)處理中常見的挑戰(zhàn)之一？

A、數(shù)據(jù)隱私和合規(guī)性

B、數(shù)據(jù)質(zhì)量和一致性

C、數(shù)據(jù)存儲和處理的成本

D、數(shù)據(jù)必須完全實時處理

參考答案：D

104.在大數(shù)據(jù)分析中，使用RFM模型主要用于什么目的？

A、預(yù)測股票價格

B、客戶細(xì)分

C、異常檢測

D、情感分析

參考答案：B

105.在大數(shù)據(jù)項目中，哪個階段可能涉及使用數(shù)據(jù)架構(gòu)師來設(shè)計數(shù)據(jù)存儲

和處理方案？

A、項目規(guī)劃

B、數(shù)據(jù)清洗

C、數(shù)據(jù)分析

D、數(shù)據(jù)可視化

參考答案：A

106.大數(shù)據(jù)的“Volume”特性主要指的是什么？

A、數(shù)據(jù)處理的速度

B、數(shù)據(jù)的類型和結(jié)構(gòu)多樣性

C、數(shù)據(jù)量的大小

D、數(shù)據(jù)的真實性和準(zhǔn)確性

參考答案：C

107.在大數(shù)據(jù)安全中，哪種技術(shù)或措施常用于實現(xiàn)數(shù)據(jù)訪問的細(xì)粒度控制？

A、加密技術(shù)

B、訪問控制列表(ACL)

C、防火墻

D、入侵檢測系統(tǒng)

參考答案：B

108.文本信息往往包含客觀事實和主觀情感,對于文本的情感分析主要是識

別文章中的主觀類詞語，其中()不適用于情感分析。

A、表達(dá)觀點的關(guān)鍵詞

B、表達(dá)程度的關(guān)鍵詞

C、表達(dá)情緒的關(guān)鍵詞

D、表達(dá)客觀事實的關(guān)鍵詞

參考答案：D

109.scipy.stats,moment函數(shù)的作用是()。

A、隨機(jī)變量的概率密度函數(shù)

B、隨機(jī)變量的累積分布函數(shù)

C、隨機(jī)變量的生存函數(shù)

D、計算分布的非中心矩

參考答案：D

110.以下不屬于大數(shù)據(jù)重要意義的是()。

A、大數(shù)據(jù)成為推動經(jīng)濟(jì)轉(zhuǎn)型發(fā)展的新動力

B、大數(shù)據(jù)成為重塑國家競爭優(yōu)勢的新機(jī)遇

C、大數(shù)據(jù)成為提升政府治理能力的新途徑

D、大數(shù)據(jù)會增加經(jīng)濟(jì)發(fā)展的成本

參考答案：D

111.機(jī)器學(xué)習(xí)中L1正則化和L2正則化的區(qū)別是()。

A、使用L1可以得到稀疏的權(quán)值,使用L2可以得到平滑的權(quán)值

B、使用L1可以得到平滑的權(quán)值,使用L2可以得到平滑的權(quán)值

C、使用L1可以得到平滑的權(quán)值,使用L2可以得到稀疏的權(quán)值

D、使用L1可以得到稀疏的權(quán)值,使用L2可以得到稀疏的權(quán)值

參考答案：A

112.數(shù)據(jù)科學(xué)中，人們開始注意到傳統(tǒng)數(shù)據(jù)處理方式

中普遍存在的“信息丟失”現(xiàn)象,進(jìn)而數(shù)據(jù)處理范式從()轉(zhuǎn)向()。

A、產(chǎn)品在先，數(shù)據(jù)在后范式;數(shù)據(jù)在先，產(chǎn)品在后范式或無模式

B、模式在先，產(chǎn)品在后范式;產(chǎn)品在先，模式在后范式或無模式

C、數(shù)據(jù)在先，模式在后范式或無模式;模式在先,數(shù)據(jù)在后范式

D、模式在先，數(shù)據(jù)在后范式;數(shù)據(jù)在先，模式在后范式或無模式

參考答案：D

113.哪個是ApacheHive的主要用途？

A、數(shù)據(jù)存儲

B、實時查詢

C、批處理SQL查詢

D、流式處理

參考答案：C

114.在大數(shù)據(jù)安全中，以下哪個措施不是主要的關(guān)注點？

A、數(shù)據(jù)加密

B、訪問控制

C、數(shù)據(jù)清洗

D、審計和日志記錄

參考答案：C

115.以下哪個是大數(shù)據(jù)預(yù)測分析的關(guān)鍵步驟？

A、數(shù)據(jù)采集

B、數(shù)據(jù)清洗

C、模型構(gòu)建和訓(xùn)練

D、可視化報告

參考答案：C

116.大數(shù)據(jù)的實時流處理中，Kafka主要用于什么？

A、數(shù)據(jù)存儲

B、實時數(shù)據(jù)發(fā)布和訂閱

C、數(shù)據(jù)處理

D、數(shù)據(jù)可視化

參考答案：B

117.在大數(shù)據(jù)處理中，哪個是ApacheSpark相對于Hadoop的主要優(yōu)勢？

A、更高的數(shù)據(jù)存儲能力

B、更好的數(shù)據(jù)一致性

C、更快的處理速度

D、更簡單的部署

參考答案：C

118.以下哪個不是大數(shù)據(jù)處理中常見的挑戰(zhàn)？

A、數(shù)據(jù)安全和隱私保護(hù)

B、數(shù)據(jù)質(zhì)量問題

C、數(shù)據(jù)存儲成本

D、數(shù)據(jù)分析結(jié)果總是準(zhǔn)確的

參考答案：D

119.在大數(shù)據(jù)分析中，使用聚類算法的主要目的是什么？

A、預(yù)測未來趨勢

B、識別數(shù)據(jù)中的群組或類別

C、找出數(shù)據(jù)中的異常值

D、優(yōu)化數(shù)據(jù)處理流程

參考答案：B

120.在大數(shù)據(jù)可視化中，哪種圖表最適合表示時間序列數(shù)據(jù)？

A、散點圖

B、折線圖

C、熱力圖

D、樹狀圖

參考答案：B

121.在大數(shù)據(jù)項目中，哪個階段通常涉及數(shù)據(jù)倉庫的構(gòu)建？

A、數(shù)據(jù)采集

B、數(shù)據(jù)預(yù)處理

C、數(shù)據(jù)存儲與管理

D、數(shù)據(jù)分析與可視化

參考答案：C

122.在大數(shù)據(jù)分析中，使用機(jī)器學(xué)習(xí)算法的主要目的是什么？

A、自動化數(shù)據(jù)清洗

B、自動化數(shù)據(jù)收集

C、從數(shù)據(jù)中學(xué)習(xí)并做出預(yù)測或決策

D、優(yōu)化數(shù)據(jù)存儲性能

參考答案：C

123.大數(shù)據(jù)的“冷存儲”和“熱存儲”主要區(qū)別在于什么？

A、數(shù)據(jù)的大小

B、數(shù)據(jù)的處理速度

C、數(shù)據(jù)的訪問頻率

D、數(shù)據(jù)的存儲介質(zhì)

參考答案：C

124.在大數(shù)據(jù)處理中，數(shù)據(jù)傾斜(DataSkew)問題通常指的是什么？

A、數(shù)據(jù)量過大導(dǎo)致處理緩慢

B、數(shù)據(jù)分布不均導(dǎo)致某些節(jié)點處理壓力過大

C、數(shù)據(jù)質(zhì)量差導(dǎo)致分析結(jié)果不準(zhǔn)確

D、數(shù)據(jù)傳輸過程中發(fā)生丟失

參考答案：B

125.在大數(shù)據(jù)分析中，進(jìn)行情感分析(SentimentAnalysis)通常使用哪

種技術(shù)？

A、機(jī)器學(xué)習(xí)

B、深度學(xué)習(xí)

C、兩者都可能

D、數(shù)據(jù)挖掘

參考答案：C

126.大數(shù)據(jù)中的"數(shù)據(jù)湖"(DataLake)與"數(shù)據(jù)倉庫”(DataWarehouse)

的主要區(qū)別是什么？

A、數(shù)據(jù)湖存儲原始數(shù)據(jù)，數(shù)據(jù)倉庫存儲加工后的數(shù)據(jù)

B、數(shù)據(jù)倉庫支持實時分析，數(shù)據(jù)湖不支持

C、數(shù)據(jù)湖通常比數(shù)據(jù)倉庫更昂貴

D、數(shù)據(jù)倉庫主要用于非結(jié)構(gòu)化數(shù)據(jù)，數(shù)據(jù)湖主要用于結(jié)構(gòu)化數(shù)據(jù)

參考答案：A

127.在大數(shù)據(jù)安全中，哪種技術(shù)常用于保護(hù)數(shù)據(jù)在傳輸過程中的安全性？

A、加密技術(shù)

B、防火墻

C、訪問控制

D、數(shù)據(jù)備份

參考答案：A

128.以下哪個不是大數(shù)據(jù)分析的常見應(yīng)用場景？

A、客戶關(guān)系管理

B、社交網(wǎng)絡(luò)分析

C、天氣預(yù)報

D、人工智能算法開發(fā)

參考答案：D

129.在大數(shù)據(jù)可視化中，使用哪種技術(shù)可以交互式地探索數(shù)據(jù)并發(fā)現(xiàn)其中

的模式和趨勢？

A、靜態(tài)圖表

B、交互式儀表板

C、數(shù)據(jù)報告

D、數(shù)據(jù)挖掘算法

參考答案：B

130.在大數(shù)據(jù)項目中，哪個階段通常涉及從多個數(shù)據(jù)源中提取和整合數(shù)據(jù)？

A、數(shù)據(jù)清洗

B、數(shù)據(jù)集成

C、數(shù)據(jù)分析

D、數(shù)據(jù)可視化

參考答案：B

131.在大數(shù)據(jù)分析中，使用A/B測試的主要目的是什么？

A、驗證不同算法的效果

B、比較不同用戶群體對同一功能的反應(yīng)

C、預(yù)測未來市場趨勢

D、優(yōu)化數(shù)據(jù)存儲性能

參考答案：B

132.以下哪個不是大數(shù)據(jù)處理中常見的挑戰(zhàn)？

A、數(shù)據(jù)隱私保護(hù)

B、數(shù)據(jù)實時性

C、數(shù)據(jù)源多樣性

D、數(shù)據(jù)絕對準(zhǔn)確性

參考答案：D(因為數(shù)據(jù)絕對準(zhǔn)確性在現(xiàn)實中很難達(dá)到，尤其是在大數(shù)據(jù)環(huán)

境下)

133.在大數(shù)據(jù)分析中，以下哪個步驟通常是最耗時的？

A、數(shù)據(jù)采集

B、數(shù)據(jù)清洗

C、數(shù)據(jù)分析

D、數(shù)據(jù)可視化

參考答案：B(數(shù)據(jù)清洗往往涉及復(fù)雜的數(shù)據(jù)處理過程，包括去重、填充缺

失值、異常值處理等)

134.在大數(shù)據(jù)安全中，哪個技術(shù)

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

2024年大數(shù)據(jù)應(yīng)用及處理技術(shù)能力知識考試題庫與答案

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔