版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
一'單選題
1.以下哪些分類方法可以較好地避免樣本的不平衡問題?
O
AxKNN
BxSVM
CvBayes
D、神經(jīng)網(wǎng)絡(luò)
答案:A
2.()算法是最廣泛使用的聚類算法,算法簡單,易于理解和操作。
Axgglomerative
BxC.URE
CvK-means
Dvk-中心點(diǎn)算法
答案:C
3.貝葉斯決策是根據(jù)()進(jìn)行決策的一種方法。
A、極大似然概率
B、先驗(yàn)概率
C、邊際概率
D、后驗(yàn)概率
答案:D
第1頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
4.回歸分析的第一步是()
A、確定解釋量和被解釋變量
Bv確定回歸模型
C、建立回歸方程
D、進(jìn)行檢驗(yàn)
答案:A
5.當(dāng)所有觀測值都落在回歸直線上,則這兩個(gè)變量之間的相關(guān)系數(shù)為()
Av1
Bv-1
C、+1或T
DxO
答案:C
6.()是進(jìn)行項(xiàng)目投資效益評價(jià)的最終依據(jù)。
A、現(xiàn)金流量
B、盈虧平衡點(diǎn)
C、凈現(xiàn)金流量
D、現(xiàn)金流入量
答案:C
7.被廣泛用于購物籃分析的是()。
A、關(guān)聯(lián)分析;
B、分類和預(yù)測
C、聚類分析
第2頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
D、演變分析
答案:A
8.下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?()
Ax變量代換
Bv離散化
C、聚集
D、估計(jì)遺漏值
答案:D
9.下列不屬于關(guān)聯(lián)分析的關(guān)鍵要素的是O
A、支持度
B、置信度
C、滿意度
D、提升度
答案:C
10.NoSQL含義是指()
AvNO!SQL;
BxNomberSQL;
CxNotOnIySQL
D、NOLLSQL
答案:C
11.個(gè)人信息的收集、處理和利用應(yīng)當(dāng)遵循0的原則,不得違反法律、法規(guī)的規(guī)定
和雙方的約定收集、處理和利用個(gè)人信息。()
第3頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
A、正規(guī)、合法'必要
B、合法、正當(dāng)'必要
Cv合法、合規(guī)、正當(dāng)
Dx合法、合理、合規(guī)
答案:B
12.TabIeau能夠?qū)?shù)據(jù)進(jìn)行處理包括()。
A、將多個(gè)數(shù)據(jù)源數(shù)據(jù)拼接為一個(gè)寬表;
B、修改、刪除、新增數(shù)據(jù)行;
C、對數(shù)據(jù)進(jìn)行行列轉(zhuǎn)換、重命名'格式修改;
Dx對數(shù)據(jù)進(jìn)行計(jì)算、合并生成新的數(shù)據(jù)列
答案:A
13.()是數(shù)據(jù)倉庫體系架構(gòu)的重要組成部分,具備數(shù)據(jù)倉庫的部分特征和OLTP系
統(tǒng)的部分特征。
A、E.SB;
B、D.M
C、ODS
D、E.TL
答案:C
14.RFM方法中的F說明客戶的()
A、興趣度
B、粘性
C、當(dāng)前價(jià)值
第4頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
D、未來價(jià)值
答案:A
15.關(guān)于主成分?jǐn)?shù)目的選取,正確的是O
A、保留多少個(gè)主成分取決于累計(jì)方差在方差總和中所占百分比
B、一般選擇50%以上
C、選擇前兩個(gè)就可以
D、選擇的數(shù)目和變量的個(gè)數(shù)一致
答案:A
16.下列關(guān)于數(shù)據(jù)重組的說法中,錯(cuò)誤的是()
A、數(shù)據(jù)重組是數(shù)據(jù)的重新生產(chǎn)和重新采集
B、數(shù)據(jù)重組能夠使數(shù)據(jù)煥發(fā)新的光芒
C、數(shù)據(jù)重組實(shí)現(xiàn)的關(guān)鍵在于多源數(shù)據(jù)融合和數(shù)據(jù)集成
D、數(shù)據(jù)重組有利于實(shí)現(xiàn)新穎的數(shù)據(jù)模式創(chuàng)新
答案:A
17.在SQL中,創(chuàng)建數(shù)據(jù)庫用的命令是0
A、CREATESCHEMA
B、CREATETABLE
GCREATEVIEW
DVCREATEDATABASE
答案:D
18.當(dāng)時(shí)間序列數(shù)據(jù)點(diǎn)的一階差分近似為一常數(shù),可配合以下哪種預(yù)測模型()
A、直線
第5頁,共IOO頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
B、二次拋物線
C、三次拋物線
D、指數(shù)曲線
答案:A
19.對于企業(yè)來說,數(shù)據(jù)使用的關(guān)鍵是()
A、數(shù)據(jù)收集
B、數(shù)據(jù)存儲
C、數(shù)據(jù)分析
D、數(shù)據(jù)再利用
答案:D
20.線性回歸算法尋找()與預(yù)測目標(biāo)之間的線性關(guān)系。
Av屬性
Bx根因
Cx表象
答案:A
21.下面不屬于明細(xì)數(shù)據(jù)質(zhì)量評價(jià)指標(biāo)的是()。
A、接入率;
B、自動采集率
C、及時(shí)率
D、完整率
答案:B
22,資金的時(shí)間價(jià)值是()
第6頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
A、同一資金在同一時(shí)點(diǎn)上價(jià)值量的差額
B、同一資金在不同時(shí)點(diǎn)上價(jià)值量的差額
C、不同資金在同一時(shí)點(diǎn)上價(jià)值量的差額
D、不同資金在不同時(shí)點(diǎn)上價(jià)值量的差額
答案:B
23.以下哪種方法不屬于于監(jiān)督學(xué)習(xí)模型()
A、決策樹
B、線性回歸
Cv關(guān)聯(lián)分析
D、判別分析
答案:C
24.在多元回歸模型的檢驗(yàn)中,目的是檢驗(yàn)每一個(gè)自變量與因變量在指定顯著性
水平上是否存在線性相關(guān)關(guān)系的檢驗(yàn)是()
Avr檢驗(yàn)
Bxt檢驗(yàn)
Cxf檢驗(yàn)
D、DW檢驗(yàn)
答案:B
25.關(guān)于混合模型聚類算法的優(yōu)缺點(diǎn),下面說法正確的是()
A、當(dāng)簇只包含少量數(shù)據(jù)點(diǎn),或者數(shù)據(jù)點(diǎn)近似協(xié)線性時(shí),混
合模型也能很好地處理。
B、混合模型比K均值或模糊C均值更一般,因?yàn)樗梢允褂酶鞣N類型的分布。
第7頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
C、混合模型很難發(fā)現(xiàn)不同大小和橢球形狀的簇。
D、混合模型在有噪聲和離群點(diǎn)時(shí)不會存在問題。
答案:B
26.大數(shù)據(jù)背景下,數(shù)據(jù)支撐業(yè)務(wù)的目的是()
A、建立數(shù)據(jù)科學(xué)
B'完成數(shù)據(jù)應(yīng)用
C、配備數(shù)據(jù)硬件
D、吸納數(shù)據(jù)人才
答案:B
27.下面關(guān)于因子分析的說法正確的是()
A、因子分析就是主成分分析
B、因子之間可相關(guān)也可不相關(guān)
C、因子受量綱的影響
D、可以對因子進(jìn)行旋轉(zhuǎn),使其意義更明顯
答案:D
28.快速實(shí)現(xiàn)簡單的MapReduce統(tǒng)計(jì),不必開發(fā)專門的MapReduce應(yīng)用,十分適合
數(shù)據(jù)倉庫的統(tǒng)計(jì)分析的是O。
A4Map;
B?Reduce
C、H.ive
DvSQL語句
答案:D
第8頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
29.企業(yè)要建立預(yù)測模型,需準(zhǔn)備建模數(shù)據(jù)集,以下四條描述建模數(shù)據(jù)集正確的是
O
A、數(shù)據(jù)越多越好
Bx盡可能多的適合的數(shù)據(jù)
C、數(shù)據(jù)越少越好
D、以上三條都不正確
答案:B
30.以下哪個(gè)類型的變量在作預(yù)測客戶流失的模型中最有解釋力度?
Av人口基本數(shù)據(jù),比如年齡和性別
B、基本社會狀態(tài)數(shù)據(jù),比如收入和職業(yè)
C、業(yè)務(wù)數(shù)據(jù),比如消費(fèi)頻次
D、業(yè)務(wù)數(shù)據(jù)的衍生變量,比如最近3個(gè)月消費(fèi)頻次的變化情況
答案:D
31.將復(fù)雜的地址簡化成北、中、南、東四區(qū),是在進(jìn)行?
A、數(shù)據(jù)正規(guī)化
B、數(shù)據(jù)一般化
C、數(shù)據(jù)離散化
D、數(shù)據(jù)整合
答案:B
32.Hadoop是一個(gè)開發(fā)和運(yùn)行處理大規(guī)模數(shù)據(jù)的軟件平臺,是APPaCh的一個(gè)用()
語言實(shí)現(xiàn)開源軟件框架。
Axjava
第9頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
BxC.++
c、R語言
答案:A
33.大數(shù)據(jù)特征錯(cuò)誤的是()。
Ax容量大;
B、類型多
C、價(jià)值高
D、系統(tǒng)多
答案:D
34.Apriori算法是最基本的一種關(guān)聯(lián)規(guī)則算法,它采用布爾關(guān)聯(lián)規(guī)則的挖掘頻
繁項(xiàng)集的算法,利用()搜索的方法挖掘頻繁項(xiàng)集。
A、逐層
B、逐級
C、自底向上
D?自上而下
答案:A
35.分類算法以()定理為基礎(chǔ),采用概率方法對數(shù)據(jù)進(jìn)行建模
A、決策樹
BvK-最鄰近
C、SVM
D、貝葉斯
答案:D
第10頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
36.自然界中某種事物發(fā)生時(shí)其他事物也會發(fā)生,則這種聯(lián)系稱之為Oo
A、連接
B、聯(lián)絡(luò)
C、關(guān)聯(lián)
D、聯(lián)系
答案:C
37.源業(yè)務(wù)系統(tǒng)接入數(shù)據(jù)中心的方式主要有:JDBCESB和()。
AvD.XP;
BvE.SP
CvOGG
DxE.TL
答案:C
38.下列哪個(gè)不屬于個(gè)人信息影響評估原則()
A、個(gè)人信息的處理目的、處理方式等是否合法、正當(dāng)、必要
B、對個(gè)人的影響及風(fēng)險(xiǎn)程度
Cv誰主管誰負(fù)責(zé)
D、所采取的安全保護(hù)措施是否合法、有效并與風(fēng)險(xiǎn)程度相適應(yīng)。
答案:C
39.以下哪項(xiàng)關(guān)于決策樹的說法是錯(cuò)誤的()
A、冗余屬性不會對決策樹的準(zhǔn)確率造成不利的影響
B、子樹可能在決策樹中重復(fù)多次
C、決策樹算法對于噪聲的干擾非常敏感
第11頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
D、尋找最佳決策樹是NP完全問題
答案:C
40.Hadoop框架中兩大核心是:()和MapReducE
A、H.CFS;
B、H.DFS
GH.EFS
D、H.FFS
答案:B
41.將數(shù)據(jù)轉(zhuǎn)換為可視化的形式,便于直觀快速發(fā)現(xiàn)數(shù)據(jù)規(guī)律。的數(shù)據(jù)探索方法是
0?
A、匯總統(tǒng)計(jì)法
B、概率統(tǒng)計(jì)法
C、可視化法
答案:C
42.矩估計(jì)的基本原理是()
Av用樣本矩估計(jì)總體矩
B、使得似然函數(shù)達(dá)到最大
C、使得似然函數(shù)達(dá)到最小
D、小概率事件在一次試驗(yàn)中是不可能發(fā)生的
答案:A
43.數(shù)據(jù)預(yù)處理目前常用的異常數(shù)據(jù)識別方法包括業(yè)務(wù)判別法'()、箱線圖判別
法、統(tǒng)計(jì)判別法
第12頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
A、聚類判別法;
B、回歸判別法
C、抽樣判別法
答案:A
44.算法的核心思想是()逐層構(gòu)造一個(gè)樹。
A、自上而下
Bv自下而上
C、自左向右
D、自右向左
答案:A
45.下列關(guān)于大數(shù)據(jù)的分析理念的說法中,錯(cuò)誤的是O
A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)
B、在分析方法上更注重相關(guān)分析而不是因果分析
C、在分析效果上更追究效率而不是絕對精確
D、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)
答案:D
46.什么是KDD?()
A、數(shù)據(jù)挖掘與知識發(fā)現(xiàn)
B、領(lǐng)域知識發(fā)現(xiàn)
C、文檔知識發(fā)現(xiàn)
D、動態(tài)知識發(fā)現(xiàn)
答案:A
第13頁,共IOO頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
47.某家長為了使孩子在第3-6年上大學(xué)的4年中,每年
年初得到10000元助學(xué)基金,他應(yīng)在2年前在銀行存入多少錢?(年利率按5%計(jì)算)
O
A、33771
B、30291
G32163
D、45256
答案:A
48.關(guān)于K均值和DBSCAN的比較,以下說法不正確的是()。
A、K均值丟棄被它識別為噪聲的對象,而DBSCAN一般聚類
所有對象
B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念
C、K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同
形狀的簇
D、K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會
合并有重疊的簇
答案:A
49.SQL查詢語句中HAVING子句的作用是()
A、指出分組查詢的范圍
B、指出分組查詢的值
C、指出分組查詢的條件
D、指出分組查詢的內(nèi)容
第14頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
答案:C
50.一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)稱為()。
A、分位數(shù)
B、中位數(shù)
C、眾數(shù)
答案:C
51.JSON中的中括號一般來表示()。
A、數(shù)組;
B?標(biāo)點(diǎn)符號
C、對象
D、注釋
答案:C
52.模型構(gòu)建指基于()數(shù)據(jù)構(gòu)建數(shù)據(jù)挖掘模型。
A、線上
B、線下
C、實(shí)時(shí)
D、歷史
答案:D
53.Tableau在處理離線地圖時(shí),需要將標(biāo)記設(shè)置為()。
A、路徑;
B、區(qū)域
C、邊形
第15頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
D、已填充地圖
答案:A
54.以下關(guān)于人工神經(jīng)網(wǎng)絡(luò)(ANN)的描述錯(cuò)誤的有O
A、神經(jīng)網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)中的噪聲非常魯棒
B、可以處理冗余特征
Cx訓(xùn)練ANN是一個(gè)很耗時(shí)的過程
D、至少含有一個(gè)隱藏層的多層神經(jīng)網(wǎng)絡(luò)
答案:A
55.美國海軍軍官莫里通過對前人航海日志的分析,繪制了新的航海路線圖,標(biāo)明
了大風(fēng)與洋流可能發(fā)生的地點(diǎn)。這體現(xiàn)了大數(shù)據(jù)分析理念中的()
A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)
B、在分析方法上更注重相關(guān)分析而不是因果分析
C、在分析效果上更追究效率而不是絕對精確
D、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)
答案:B
56.當(dāng)時(shí)間序列的環(huán)比增長速度大體相同時(shí),適宜擬合O
A、指數(shù)曲線
B、拋物線
C、直線
D、對數(shù)曲線
答案:A
57.將多個(gè)指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)指標(biāo)的一種統(tǒng)計(jì)分析方法是()。
第16頁,共IOO頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
A、數(shù)據(jù)預(yù)處理;
B、數(shù)據(jù)降維
C、主成分分析
D、假設(shè)檢驗(yàn)
答案:C
58.設(shè)X={1,2,3)是頻繁項(xiàng)集,則可由X可產(chǎn)生()個(gè)關(guān)聯(lián)規(guī)則。
A、3
Bv4
Cv5
Dx6
答案:D
59.當(dāng)一個(gè)連續(xù)變量的缺失值占比在85%左右時(shí),以下哪種方式最合理O
A、直接使用該變量
B、根據(jù)是否缺失,生成指示變量,僅使用指示變量作為解釋變量
C、使用多重插補(bǔ)的方法進(jìn)行缺失值填補(bǔ)
Dv直接刪除該變量
答案:B
60.大數(shù)據(jù)分析挖掘流程正確的是O。
Av業(yè)務(wù)理解T數(shù)據(jù)理解T數(shù)據(jù)準(zhǔn)備T建立模型T模型評估;
B、業(yè)務(wù)理解T數(shù)據(jù)準(zhǔn)備T數(shù)據(jù)理解T建立模型T模型評估;
C、業(yè)務(wù)理解T數(shù)據(jù)準(zhǔn)備T數(shù)據(jù)理解T模型評估T建立模型;
D、業(yè)務(wù)理解T數(shù)據(jù)準(zhǔn)備T模型評估T數(shù)據(jù)理解T建立模型
第17頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
答案:A
61.()是統(tǒng)計(jì)學(xué)的基礎(chǔ),是統(tǒng)計(jì)學(xué)里面最重要的概率分布
Av正態(tài)分布;
Bx靜態(tài)分布
C、動態(tài)分布
D、穩(wěn)態(tài)分布
答案:A
62.因子分析的主要作用有()
Av對變量進(jìn)行降維
B、對變量進(jìn)行判別
C、對變量進(jìn)行聚類
D、以上都不對
答案:A
63.數(shù)據(jù)中心側(cè)的數(shù)據(jù)流轉(zhuǎn)方式未為O
A、D.XP;
B、E.SP
C、OGG
D、E.TL
答案:D
64.給定歷史時(shí)間數(shù)據(jù),通過擬合時(shí)序模型,分析研究時(shí)序數(shù)據(jù)的發(fā)展變化規(guī)律,
得出觀測數(shù)據(jù)的歷史統(tǒng)計(jì)特征,再據(jù)此進(jìn)行外推預(yù)測目標(biāo)的分析方法是0。
A、聚類;
第18頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
B、回歸
Cv時(shí)間序列
D、匯總統(tǒng)計(jì)
答案:C
65.智能健康手環(huán)的應(yīng)用開發(fā),體現(xiàn)了()的數(shù)據(jù)采集技術(shù)的應(yīng)。
A、統(tǒng)計(jì)報(bào)表
Bx網(wǎng)絡(luò)爬蟲
GAPI接口
Dv傳感器
答案:D
66.假設(shè)檢驗(yàn)中顯著性水平是O
A、推斷時(shí)犯取偽錯(cuò)誤的概率
B、推斷時(shí)取偽棄真的概率
Cx正確推斷的概率
D、是推斷的可信度
答案:B
67.以下哪些算法是分類算法()
AvDBSCAN
B、C4.5
CxK-Mean
D、EM
答案:B
第19頁,共IOO頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
68.以下關(guān)于大數(shù)據(jù)應(yīng)用說法錯(cuò)誤的是()。
A、大數(shù)據(jù)起源互聯(lián)網(wǎng),目前處于成熟期;
B、目前金融、電信'零售、公共服務(wù)等領(lǐng)域在積極的探索和應(yīng)用大數(shù)據(jù);
C、互聯(lián)網(wǎng)是大數(shù)據(jù)的發(fā)源地;
D、互聯(lián)網(wǎng)上形成了多種相對成熟的應(yīng)用模式。
答案:A
69.下列關(guān)于計(jì)算機(jī)存儲容量單位的說法中,錯(cuò)誤的是()
A、1KB<1MB<1GB
Bv基本單位是字節(jié)(Byte)
C、一個(gè)漢字需要一個(gè)字節(jié)的存儲空間
D、一個(gè)字節(jié)能夠容納一個(gè)英文字符
答案:C
70.當(dāng)置信水平一定時(shí),置信區(qū)間的寬度()
A、隨著樣本量的增大而減小
B、隨著樣本量的增大而增大
C、與樣本量的大小無關(guān)
D、先隨著樣本量的增大而減小,到一定程度后會隨著樣本
量的增大而增大。
答案:A
71.倒傳遞神經(jīng)網(wǎng)絡(luò)(BP神經(jīng)網(wǎng)絡(luò))的訓(xùn)練順序?yàn)楹危浚ˋ:調(diào)整權(quán)重;B:計(jì)算誤差值;
C:利用隨機(jī)的權(quán)重產(chǎn)生輸出的結(jié)果)
A、BCA
第20頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
B、CAB
C、BAC
D、CBA
答案:D
72.個(gè)人信息保護(hù)影響評估報(bào)告和處理情況記錄應(yīng)當(dāng)至少保存()年。
A、—
Bv十
Cv五
Dv三
答案:D
73.資金的時(shí)間價(jià)值是()
A、同一資金在同一時(shí)點(diǎn)上價(jià)值量的差額
B、同一資金在不同時(shí)點(diǎn)上價(jià)值量的差額
C、不同資金在同一時(shí)點(diǎn)上價(jià)值量的差額
D、不同資金在不同時(shí)點(diǎn)上價(jià)值量的差額
答案:B
74.有一條關(guān)聯(lián)規(guī)則為A→
B,此規(guī)則的信心水平(confidence)為60%,則代表()
Ax買B商品的顧客中,有60%的顧客會同時(shí)購買A
B、同時(shí)購買
A,B兩商品的顧客,占所有顧客的60%
C、買A商品的顧客中,有60%的顧客會同時(shí)購買B
第21頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
Dx兩商品
A,B在交易數(shù)據(jù)庫中同時(shí)被購買的機(jī)率為60%
答案:C
75.有一組數(shù)據(jù)其均值是20,對其中的每一個(gè)數(shù)據(jù)都加上
10,那么得到的這組新數(shù)據(jù)的均值是()。
A、20
B、10
Cv15
Dv30
答案:D
76.與大數(shù)據(jù)密切相關(guān)的技術(shù)是()。
Ax藍(lán)牙;
B、云計(jì)算
GWi-Fi
D、博弈論
答案:B
77.在數(shù)據(jù)分析和處理方面具有分析方法豐富'分析模型擴(kuò)展強(qiáng)、數(shù)據(jù)挖掘能力
強(qiáng)等特點(diǎn)的分析工具是()。
A、Weka
B、SPSS
C、SAS
D、R
第22頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
答案:D
78.用于分類與回歸應(yīng)用的主要算法有:()
AvApriori算法、HOtSPot算法
B、RBF神經(jīng)網(wǎng)絡(luò)、K均值法'決策樹
C、K均值法、SOM神經(jīng)網(wǎng)絡(luò)
D'決策樹、BP神經(jīng)網(wǎng)絡(luò)、貝葉斯
答案:D
79.()提供的支撐技術(shù),有效解決了大數(shù)據(jù)分析、研發(fā)的問題,比如虛擬化技術(shù)、
并行計(jì)算、海量存儲和海量管理等。
A、點(diǎn)計(jì)算
B、線計(jì)算
Cv云計(jì)算
D、面計(jì)算
答案:C
80.描述一組對稱(或正態(tài))分布數(shù)據(jù)的離散程度時(shí),最適宜選擇的指標(biāo)是()
A、極差
B、標(biāo)準(zhǔn)差
C4均值
D、變異系數(shù)
答案:B
81.考慮下面的頻繁3-項(xiàng)集的集合:{1,2.3},{1,2,
4},{1,3,4},{1,3,5},{2,3,4},{2,3.5),
第23頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
(3,4,5}假定數(shù)據(jù)集中只有5個(gè)項(xiàng),若采用合并策略,則由候選產(chǎn)生過程得到4-項(xiàng)
集不包含O
A、1,2,3,4
Bx1,2,3,5
C、1,2,4,5
D、1,3,4,5
答案:C
82.相關(guān)分析與回歸分析的一個(gè)重要區(qū)別是O
A、前者研究變量之間關(guān)系的密切程度,后者研究變量間的變動關(guān)系,并用方程式
表小
B、前者研究變量之間的變動關(guān)系,后者研究變量間關(guān)系的密切程度
C、兩者都研究變量間的變動關(guān)系
D、兩者都不研究變量間的變動關(guān)系
答案:A
83.SQL語句中刪除表的命令是()
A、DROPTABLE
B、DELETETABLE
GERASETABLE
D、DELETEDBF
答案:A
84.已知事件A的概率P(A)=0.6,U為必然事件,則P(A+U)=1,P(AU)=
A、0.4
第24頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
B、0.6
C、0
D、1
答案:B
85.邁克爾?波特的“五力模型”中,五種競爭力量中不包括()
A、新進(jìn)入者
B、供應(yīng)商議價(jià)能力
C、其他利益相關(guān)者力量
D、行業(yè)中現(xiàn)有競爭者
答案:C
86.假設(shè)12個(gè)銷售價(jià)格記錄組已經(jīng)排序如下:5,10,11,13,
15,35,50,55,72,92,204,215使用等寬劃分(寬度為50)
方法將它們劃分成四個(gè)箱,求15在哪個(gè)箱子?()
A、第1個(gè)
B、第2個(gè)
C、第3個(gè)
D、第4個(gè)
答案:A
87.()是研究一種或者多種因素的變化對試驗(yàn)結(jié)果的觀測值是否有顯著影響的統(tǒng)
計(jì)方法。
A、因子分析;
B、數(shù)據(jù)降維
第25頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
C、方差分析
Dv假設(shè)檢驗(yàn)
答案:C
88.某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬
于數(shù)據(jù)挖掘的哪類問題?()
A、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)
B、聚類
C、分類
Dv自然語言處理
答案:A
89.以下哪個(gè)指標(biāo)不能用于線性回歸中的模型比較()
A、R方
B、調(diào)整R方
C、AIC
D、BIC
答案:A
90.下面關(guān)于聚類分析說法錯(cuò)誤的是()
A、一定存在一個(gè)最優(yōu)的分類
B、聚類分析是無監(jiān)督學(xué)習(xí)
C、聚類分析可以用于判斷異常值
D、聚類分析即:物以類聚,人以群分
答案:A
第26頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
91.分類變量使用以下哪個(gè)統(tǒng)計(jì)量進(jìn)行缺失值填補(bǔ)較合適
A、均值
B、最大值
C、眾數(shù)
D、中位數(shù)
答案:C
92.若數(shù)據(jù)量較大,下面哪種方式比較適合()
A、系統(tǒng)聚類
B、快速聚類(k-means)
C'A和B都可以
D、A和B都不可以
答案:B
93.在對歷史數(shù)據(jù)集進(jìn)行分區(qū)之前進(jìn)行數(shù)據(jù)清洗(缺失值填補(bǔ)等)的缺點(diǎn)是什么
A、違反了建模的假設(shè)條件
B、加大了處理的難度
Cv無法針對分區(qū)后各個(gè)數(shù)據(jù)集的特征分別做數(shù)據(jù)清洗
D、無法對不同數(shù)據(jù)清理的方法進(jìn)行比較,以選擇最優(yōu)方法
答案:D
94.數(shù)據(jù)倉庫是隨著時(shí)間變化的,下面的描述不正確的是()
A、數(shù)據(jù)倉庫隨時(shí)間的變化不斷增加新的數(shù)據(jù)內(nèi)容
B、捕捉到的新數(shù)據(jù)會覆蓋原來的快照
C、數(shù)據(jù)倉庫隨時(shí)間變化不斷刪去舊的數(shù)據(jù)內(nèi)容
第27頁,共IOO頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
D、數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會隨著時(shí)間的變化不斷地進(jìn)行
重新綜合
答案:C
95.SQL語言中,刪除一個(gè)表中所有數(shù)據(jù),但保留表結(jié)構(gòu)的命令是()
AxDELETE
B、DROP
GCLEAR
D、REMORE
答案:A
96.依照《中華人民共和國數(shù)據(jù)安全法》和有關(guān)法律、行政法規(guī)的規(guī)定,()負(fù)責(zé)統(tǒng)
籌協(xié)調(diào)網(wǎng)絡(luò)數(shù)據(jù)安全和相關(guān)監(jiān)管工作。
A、工業(yè)和信息化部
B、國家安全部門
C、國家網(wǎng)信部門
D、通信主管部門
答案:C
97.假設(shè)屬性ine的最大最小值分別是12000
元和98000元。利用最大-最小規(guī)范化的方法將屬性的值映射到0至1的范圍內(nèi)。
對屬性ine的73600元將被轉(zhuǎn)化為()
A、0.751
B、0.163
C、0.457
第28頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
D、0.716
答案:D
98.建立一個(gè)模型,通過這個(gè)模型根據(jù)已知的變量值來預(yù)測其他某個(gè)變量值屬于
數(shù)據(jù)挖掘的哪一類任務(wù)?()
A、根據(jù)內(nèi)容檢索
B、建模描述
C、預(yù)測建模
D、尋找模式和規(guī)則
答案:C
99.自動化高級分析實(shí)驗(yàn)室,實(shí)現(xiàn)與統(tǒng)一數(shù)據(jù)資源庫互聯(lián),實(shí)現(xiàn)數(shù)據(jù)的自助組表、
自助分析功能,滿足不同層級、不同水平的用戶需求的是()
A、初級分析;
B、綜合分析
C、典型分析
D、高級分析
答案:D
100.下列選項(xiàng)中屬于現(xiàn)金流入的項(xiàng)目是0
A、所得稅
B、建設(shè)投資
C、經(jīng)營成本
D、營業(yè)收入
答案:D
第29頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
101.一組N個(gè)觀測值按數(shù)值大小排列,分成100份,處于X%位置的值稱第X個(gè)百
分位數(shù)稱為()。
A、分位數(shù)
Bx中位數(shù)
C、眾數(shù)
答案:A
102.開始將N個(gè)樣品各自作為一類,將規(guī)定樣品之間的距離和類與類之間的距離,
然后將距離最近的兩類合并成一個(gè)新類,計(jì)算新類與其他類的距離,重復(fù)進(jìn)行兩
個(gè)最近類的合并,每次減少一類,直至所有的樣品合并為一類,此種聚類方法是()
AxK-means
B、SOM聚類
C、系統(tǒng)聚類
D、有序聚類
答案:C
103.指數(shù)平滑法可以用以下哪種指標(biāo)來反映對時(shí)間序列資料的修正程度()
A、平滑常數(shù)
B、指數(shù)平滑數(shù)初始值
C4跨越期
D、季節(jié)指數(shù)
答案:A
104.變量的量綱比如以厘米或者米為單位對下面哪種方法會有影響0
A、方差分析
第30頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
B、回歸分析
C、聚類分析
D、主成分分析
答案:C
105.關(guān)于Tableau的特點(diǎn),以下說法錯(cuò)誤的是()
A、學(xué)習(xí)成本低,簡單易用;
B、圖表精美;
C、開發(fā)快速,分享便捷;
D、需要IT大量人員參與
答案:D
106.在ID3算法中信息增益是指()
A、信息的溢出程度
B、信息的增加效益
C、烯增加的程度最大
D、熠減少的程度最大
答案:D
107.一組數(shù)據(jù)中最大值與最小值的差值稱為(),也稱全距。
A、極差
B、極距
C?距離
D、方差
答案:A
第31頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
108.()是一種開源軟件編程語言,主要用于統(tǒng)計(jì)分析,繪圖和數(shù)據(jù)挖掘,內(nèi)置多種
統(tǒng)計(jì)及分析功能。
A、H.IVE;
B、H.ADOOP
C、R;
D、H.FDS
答案:C
109.決策樹中的InformationGain的計(jì)算是用來?
A、剪枝
B、使樹成長
C、處理缺失值和異常值
D、砍樹
答案:B
110.泊松回歸是一種廣泛應(yīng)用的()回歸模型。
A、線性
Bv非線性
C、預(yù)測
D、估算
答案:B
111.數(shù)據(jù)庫系統(tǒng)是由()組成的
A、數(shù)據(jù)庫'數(shù)據(jù)庫管理系統(tǒng)和用戶
B、數(shù)據(jù)文件、命令文件和報(bào)表
第32頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
C、數(shù)據(jù)庫文件結(jié)構(gòu)和數(shù)據(jù)
D、常量、變量和函數(shù)
答案:A
112.下列四項(xiàng)中,不屬于數(shù)據(jù)庫特點(diǎn)的是()
A、數(shù)據(jù)共享
B、數(shù)據(jù)完整性
C、數(shù)據(jù)冗余很高
D、數(shù)據(jù)獨(dú)立性高
答案:C
113.某小區(qū)60%居民訂晚報(bào),45%訂青年報(bào),30%兩報(bào)均訂,隨機(jī)抽一戶。則至少訂
一種報(bào)的概率為()
A、0.82
B、0.85
C、0.80
D、0.75
答案:D
114.關(guān)于統(tǒng)計(jì)學(xué)和大數(shù)據(jù)之間的關(guān)系,一下說法錯(cuò)誤的是0。
A、面臨大數(shù)據(jù),統(tǒng)計(jì)學(xué)的研究對象有所改變;
Bv在大數(shù)據(jù)環(huán)境中,需要首先將未知的問題轉(zhuǎn)化為可用的統(tǒng)計(jì)方法;
C、在大數(shù)據(jù)分析過程中,傳統(tǒng)的統(tǒng)計(jì)分析過程“定量一定位一再定性”轉(zhuǎn)變?yōu)椤岸?/p>
量一定性”;
D、在大數(shù)據(jù)環(huán)境中,需要將統(tǒng)計(jì)研究的對象范圍擴(kuò)展到一切數(shù)據(jù)。
第33頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
答案:A
115.在數(shù)據(jù)分析和處理方面具有分析方法豐富、分析模型擴(kuò)展差、數(shù)據(jù)挖掘能力
強(qiáng)等特點(diǎn)的分析工具是()。
AxWeka
B、SPSS
C、SAS
D、R
答案:B
116.下列說明錯(cuò)誤的是()
A、性別="男”=>職業(yè)="司機(jī)”,是布爾型關(guān)聯(lián)規(guī)則
B、性別="女”=>avg(收入)=2300,是一個(gè)數(shù)值型
關(guān)聯(lián)規(guī)則
C、肝炎=>ALT(丙氨酸轉(zhuǎn)氨酶)升高,是一個(gè)單層關(guān)聯(lián)規(guī)則
D、性別="女”=>職業(yè)="秘書”,是多維關(guān)聯(lián)規(guī)則
答案:C
117.Hive是基于Hadoop的一個(gè)數(shù)據(jù)()工具
A、分析;
B、倉庫
G制圖
D、可視化
答案:B
第34頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
118.數(shù)據(jù)記錄內(nèi)容完整比例,包括指標(biāo)單位維度、業(yè)務(wù)維度組合記錄條數(shù)完整,
指標(biāo)字段值完整稱為()
A、指標(biāo)數(shù)據(jù)自動采集率;
B、指標(biāo)數(shù)據(jù)接入率
C、指標(biāo)數(shù)據(jù)接入及時(shí)率;
D'指標(biāo)數(shù)據(jù)完整率
答案:D
119.EXCEL中,求標(biāo)準(zhǔn)差的函數(shù)是O
A、AVERAGE
B、MEDIAN
C、MODE
DvSTDEV
答案:D
120.對于下列實(shí)驗(yàn)數(shù)據(jù):1,108,11,8,5,6,8,
8,7,11,描述其集中趨勢用()最為適宜,其值是()。
A、平均數(shù),14.4
B、中位數(shù),8.5
G眾數(shù),8
D、以上都可以
答案:C
121.《個(gè)人信息保護(hù)法》發(fā)布執(zhí)行時(shí)間()。
A、2021年9月1日;
第35頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
B、2021年10月1日;
C、2021年11月1日
Dv2021年12月1日
答案:C
122.檢測一元正態(tài)分布中的離群點(diǎn),屬于異常檢測中的基于
()的離群點(diǎn)檢測
Av統(tǒng)計(jì)方法
Bv鄰近度
C、密度
Dx聚類技術(shù)
答案:A
123.下列關(guān)于聚類挖掘技術(shù)的說法中,錯(cuò)誤的是()
A、不預(yù)先設(shè)定數(shù)據(jù)歸類類目,完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類別
B、要求同類數(shù)據(jù)的內(nèi)容相似度盡可能
C、要求不同類數(shù)據(jù)的內(nèi)容相似度盡可能
D'與分類挖掘技術(shù)相似的是,都是要對數(shù)據(jù)進(jìn)行分類處理
答案:B
124.按數(shù)據(jù)的結(jié)構(gòu)程度來劃分,分為()
Av結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)
B、強(qiáng)結(jié)構(gòu)化數(shù)據(jù)、弱結(jié)構(gòu)化數(shù)據(jù)
C、截面數(shù)據(jù)、面板數(shù)據(jù)
D、一級數(shù)據(jù)、二級數(shù)據(jù)、三級數(shù)據(jù)
第36頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
答案:A
125.當(dāng)前國內(nèi)社會中,最為突出的大數(shù)據(jù)環(huán)境是O
A、互聯(lián)網(wǎng)
Bx物聯(lián)網(wǎng)
C?綜合國力
Dx自然資源
答案:A
126.()是一種松散耦合的服務(wù)和應(yīng)用之間標(biāo)準(zhǔn)的集成方式。
AvE.SB;
B、D.M
C、ODS
D、E.TL
答案:A
127.在建立線性回歸(LinearRegression)之前我們可以利用何種方法挑選重要
屬性,以降低模型的復(fù)雜度?
A、皮爾森相關(guān)系數(shù)
B、卡方檢定
C、T-檢定
DxZ-Score
答案:A
128.給定一個(gè)置信概率和置信區(qū)域,若誤差超過置信區(qū)域,則認(rèn)為誤差不是隨機(jī)
誤差引起,視為異常值的判別方法0。
第37頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
A、聚類判別法;
Bv回歸判別法
C、抽樣判別法
D、統(tǒng)計(jì)判別法
答案:D
129.ROC曲線凸向哪個(gè)角,代表模型越理想?
A、左上角
Bv右上角
C、左下角
D、右下角
答案:A
130.?給出下列結(jié)論:
1)在回歸分析中,可用指數(shù)系數(shù)R方的值判斷模型的擬合效果,R方越大,模型的
擬合效果越好;
2)在回歸分析中,可用殘差平方和判斷模型的擬合效果,殘差平方和越大,模型的
擬合效果越好;
⑶在回歸分析中,可用相關(guān)系數(shù)r的值判斷模型的擬合效果,r越小,模型的擬合
效果越好;
(4)在回歸分析中,可用殘差圖判斷模型的擬合效果,殘差點(diǎn)比較均勻地落在水平
的帶狀區(qū)域中,說明這樣的模型比較
合適.帶狀區(qū)域的寬度越寬,說明模型的擬合精度越高.以上結(jié)論中,正確的有()
個(gè).
第38頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
A、1
B、2
C、3
D、4
答案:A
131.回歸是一種預(yù)測建模技術(shù),研究()和()的依存關(guān)系。
A、預(yù)測值、實(shí)際值
B、自變量、因變量
Cv絕對誤差、平方誤差
Dx測試樣本'集合
答案:B
132.ODS是指()
A、企業(yè)數(shù)據(jù)中心;
B、數(shù)據(jù)倉庫
C、操作型存儲
D、總線
答案:B
133.用簡單隨機(jī)重復(fù)抽樣方法抽取樣本單位,如果要使抽樣平均誤差降低50%,
則樣本容量需要擴(kuò)大到原來的()
A、2倍
B、3倍
C、4倍
第39頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
D、5倍
答案:C
134.假設(shè){BCE}為一頻繁項(xiàng)目集(FrequentItemset),則根據(jù)AprIoriPrincipIe
以下何者不是子頻繁項(xiàng)目?
A、BC
B、CE
C、C
DvCD
答案:D
135.假如學(xué)生考試成績以“優(yōu)”.“良”.“及格”和“不及格”來記錄,為了說
明全班同學(xué)考試成績的水平高低,其集中趨勢的測度()
A、可以采用算術(shù)平均數(shù)
B、可以采用眾數(shù)或中位數(shù)
C、只能采用眾數(shù)
D、只能采用四分位數(shù)
答案:C
136.將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約'數(shù)值規(guī)約是在以下哪個(gè)步驟的任務(wù)?
0
A、數(shù)據(jù)獲取
B、分類和預(yù)測
C、數(shù)據(jù)預(yù)處理
D、數(shù)據(jù)可視化
第40頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
答案:C
137.在有指導(dǎo)的數(shù)據(jù)挖掘中,有關(guān)測試集的說法錯(cuò)誤的是()
A、測試集和訓(xùn)練集是相互聯(lián)系的
B、測試集是用以測試模型的數(shù)據(jù)集
C、通常測試集大約占總樣本的三分之一
D、K-次交叉驗(yàn)證中,測試集只有1個(gè),訓(xùn)練集有K-1個(gè)
答案:A
138.以下那一項(xiàng)不是大數(shù)據(jù)提供的用戶交互方式是()。
A、企業(yè)報(bào)表;
B、查詢
C、大數(shù)據(jù)分析挖掘
Dv可視化
答案:A
139.表示職稱為副教授、性別為男的表達(dá)式為O
A、職稱='副教授'OR性別='男’
B、職稱='副教授'AND性別=,男’
GBETWEEN'副教授'AND'男'
D、INC副教授‘,'男')
答案:B
140.Logistic回歸是在商業(yè)領(lǐng)域上使用最廣泛的預(yù)測模型,常用于()分類變量
預(yù)測和概率預(yù)測。
A、四值
第41頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
B、三值
C、二值
D、一值
答案:C
141.檢查異常值常用的統(tǒng)計(jì)圖形是()
A、柱狀圖
B、箱線圖
C、帕累托圖
D、氣泡圖
答案:B
142.以下哪條屬于個(gè)人信息影響的評估場景:()
A、處理敏感個(gè)人信息,利用個(gè)人信息進(jìn)行自動化決策
B、委托處理個(gè)人信息'向第三方提供個(gè)人信息、公開個(gè)人信息
C、向境外提供個(gè)人信息
D、以上皆是
答案:D
143.《個(gè)人信息保護(hù)法》對于企業(yè)的影響不包括()
A、需要強(qiáng)化個(gè)人信息處理這主體責(zé)任
B、明確了可以量化的中國版執(zhí)行罰則
C、需要設(shè)立負(fù)責(zé)處理個(gè)人信息保護(hù)相關(guān)事務(wù)的專門機(jī)構(gòu)和指定代表
D、收集和處理數(shù)據(jù)時(shí)可以不遵循“最小化”原則
答案:D
第42頁,共IOO頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
144.實(shí)際由源業(yè)務(wù)系統(tǒng)自動接入的指標(biāo)數(shù)據(jù)占指標(biāo)體系中應(yīng)接指標(biāo)總數(shù)的比例
稱為()
A、指標(biāo)數(shù)據(jù)自動采集率;
B、指標(biāo)數(shù)據(jù)接入率
C、指標(biāo)數(shù)據(jù)接入及時(shí)率;
D'指標(biāo)數(shù)據(jù)完整率
答案:A
145.假設(shè)檢驗(yàn)中,拒絕域的邊界稱為O
A、臨界值
B、臨界點(diǎn)
Cx置信水平
D、邊際值
答案:A
146.以下關(guān)于大數(shù)據(jù)的概念和理解不正確的是()
A、大數(shù)據(jù)是指無法再容許的時(shí)間內(nèi)用常規(guī)的軟件工具對其內(nèi)容進(jìn)行抓取、管理
和處理的數(shù)據(jù)集合,大數(shù)據(jù)規(guī)模的標(biāo)準(zhǔn)是持續(xù)變化的,當(dāng)前泛指單一的數(shù)據(jù)集的
大小在幾十TB和PB之間;
B、大數(shù)據(jù)是一項(xiàng)技術(shù),能夠?qū)?fù)雜海量數(shù)據(jù)進(jìn)行實(shí)時(shí)獲取'
傳輸、存儲'加工和利用的高薪技術(shù);
C、大數(shù)據(jù)是一種挑戰(zhàn),現(xiàn)有的數(shù)據(jù)采集、傳輸、存儲、處理和分析技術(shù)已無法適
用于現(xiàn)有的需要;
第43頁,共IOO頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
D、大數(shù)據(jù)是一個(gè)時(shí)代,擁有大數(shù)據(jù)是時(shí)代的特征'解讀大數(shù)據(jù)是時(shí)代的任務(wù)、應(yīng)
用大數(shù)據(jù)是時(shí)代的機(jī)遇。
答案:A
147.數(shù)據(jù)收集的標(biāo)準(zhǔn)為。而非動用企業(yè)全部數(shù)據(jù)。
A、一致性、可靠性、時(shí)效性
B'相同性、可靠性、時(shí)效性
C、C相關(guān)性'可靠性、時(shí)效性
D、一致性、可靠性、實(shí)際性
答案:C
148.MySQL是()
A、操作系統(tǒng);
B、數(shù)據(jù)庫
C、聊天軟件
D、瀏覽器
答案:B
149.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其
他標(biāo)簽的數(shù)據(jù)相分離?()
A、分類
B、聚類
C、關(guān)聯(lián)分析
D、主成分分析
答案:B
第44頁,共IOO頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
150.某超市研究銷售記錄發(fā)現(xiàn),購買奶的很概率會購買包,這種屬于數(shù)據(jù)挖掘的
哪類問題?()
A、聚類分析
Bx關(guān)聯(lián)規(guī)則
C、分類分析
D、自然語言處理
答案:B
151.蘋果公司對IPHONE的降價(jià)行為屬于()
Av地域性差別定價(jià)
Bx時(shí)間性差別定價(jià)
C、非線性定價(jià)或數(shù)量折扣定價(jià)
D、其他形式的定價(jià)
答案:B
152.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其
他標(biāo)簽的數(shù)據(jù)相分離?
A、分類
B、聚類
C、關(guān)聯(lián)分析
D、隱馬爾可夫鏈
答案:B
153.NaiveBayes是屬于數(shù)據(jù)挖掘中的什么方法?
A、聚類
第45頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
B、分類
Cv時(shí)間序列
D、關(guān)聯(lián)規(guī)則
答案:B
154.《中華人民共和國數(shù)據(jù)安全法》中的數(shù)據(jù),是指任何以電子或者其他方式對()
的記錄。
A、數(shù)據(jù)
Bv信息
C、文件
D、知識
答案:B
155.下列不屬于原始數(shù)據(jù)來源的是()
A、行政記錄
B、統(tǒng)計(jì)調(diào)查
C、統(tǒng)計(jì)年鑒
D、實(shí)驗(yàn)
答案:C
156.數(shù)據(jù)挖掘技術(shù)包括三個(gè)主要的部分()
A、數(shù)據(jù)、模型'技術(shù)
B、算法'技術(shù)、領(lǐng)域知識
C、數(shù)據(jù)、建模能力、算法與技術(shù)
D、建模能力、算法與技術(shù)、領(lǐng)域知識
第46頁,共IOO頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
答案:C
157.(),用于顯示樹狀結(jié)構(gòu)數(shù)據(jù)。
A、矩形式樹狀結(jié)構(gòu)圖;
Bx平行結(jié)構(gòu)樹
C、垂直結(jié)構(gòu)樹
答案:A
158.在Excel工作表中,在某單元格內(nèi)輸入數(shù)值123,不正確的輸入形式是()
A、123
Bv=123
Cx+123
Dv*123
答案:D
159.分析顧客消費(fèi)行業(yè),以便有針對性的向其推薦感興趣的服務(wù),屬于()問題。
A、關(guān)聯(lián)規(guī)則挖掘
B、分類與回歸
Cv聚類分析
Dv時(shí)序預(yù)測
答案:A
160.在有關(guān)數(shù)據(jù)倉庫測試,下列說法不正確的是0
A、在完成數(shù)據(jù)倉庫的實(shí)施過程中,需要對數(shù)據(jù)倉庫進(jìn)行各種測試.測試工作中要
包括單元測試和系統(tǒng)測試
B、當(dāng)數(shù)據(jù)倉庫的每個(gè)單獨(dú)組件完成后,就需要對他們進(jìn)行單元測試
第47頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
C、系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進(jìn)行大量的
功能測試和回歸測試
D、在測試之前沒必要制定詳細(xì)的測試計(jì)劃
答案:D
161.Byte代表一個(gè)字節(jié),及()的數(shù)值范圍。
A、OlOO
B、0~155
C、0~200
Dv0~255
答案:D
162.目前常用的識別異常數(shù)據(jù)的方法有物理判別法和()。
A、化學(xué)判別法
B、統(tǒng)計(jì)判別法
Cx靜態(tài)判別法
D、動態(tài)判別法
答案:B
163.下列有關(guān)Apriori算法的說法中不正確的是()
A.Apriori算法是關(guān)聯(lián)分析中最常用的算法之一。
B、應(yīng)用APriori算法時(shí),需要先設(shè)定模型的最小支持度,最小置信度等閾值。
C、應(yīng)用APriOri算法時(shí),輸入的數(shù)據(jù)可以是連續(xù)型數(shù)據(jù)也可以是離散型數(shù)據(jù)。
D、APriori算法掃描數(shù)據(jù)庫的次數(shù)依賴于最大頻繁項(xiàng)集中項(xiàng)的數(shù)量。
答案:C
第48頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
164.VBA語言中,聲明變量的關(guān)鍵字是()。
A、SET:
B、C.ONST
C、PRIVATE
D、IM
答案:D
165.下列四項(xiàng)中,不屬于數(shù)據(jù)庫特點(diǎn)的是()
A、數(shù)據(jù)共享
B、數(shù)據(jù)完整性
C、數(shù)據(jù)冗余很高
D、數(shù)據(jù)獨(dú)立性高
答案:C
166.維度規(guī)約是在以下哪個(gè)步驟的任務(wù)?()
A、頻繁模式挖掘
B、降維
C、數(shù)據(jù)預(yù)處理
D、數(shù)據(jù)流挖掘
答案:C
167.屬于財(cái)務(wù)專業(yè)明細(xì)數(shù)據(jù)表的是()
A、客戶收費(fèi)流水表;
B、應(yīng)收票據(jù)信息表;
C、公司分壓線損統(tǒng)計(jì)表;
第49頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
D、供應(yīng)計(jì)劃表
答案:B
168.以下哪個(gè)變量可以反映客戶的忠誠度?O
Ax購買頻次
B、購買金額
C、最后一次購買時(shí)間
D、購買金額波動率
答案:A
169.某項(xiàng)目預(yù)計(jì)運(yùn)行5年后的凈現(xiàn)值為4500萬元,如折現(xiàn)率為16%,其終值應(yīng)為()
萬元(說明:結(jié)果保留兩位小數(shù))
A、8045.86
Bv6996.21
G9451.54
D、7000.02
答案:C
170.數(shù)據(jù)在規(guī)定的時(shí)間前和頻度周期內(nèi)接入系統(tǒng)的比例稱為0
A、指標(biāo)數(shù)據(jù)自動采集率;
B、指標(biāo)數(shù)據(jù)接入率
C、指標(biāo)數(shù)據(jù)接入及時(shí)率;
D、指標(biāo)數(shù)據(jù)完整率
答案:C
第50頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
171.數(shù)據(jù)正規(guī)化(DataNormaIization)是在知識發(fā)掘處理
(KnowIedgeDiScoveryProcess)中的哪—Is■階段進(jìn)行?
A、數(shù)據(jù)清洗
Bx數(shù)據(jù)選擇
C、數(shù)據(jù)編碼
D、數(shù)據(jù)擴(kuò)充
答案:C
172.東北人養(yǎng)了一只雞和一頭豬。一天雞問豬:"主人呢?"豬說:"出去買蘑菇了。
“雞聽了撒丫子就跑。豬說:“你跑什么?"雞叫道:"有本事主人買粉條的時(shí)候你小
子別跑!"
以上對話體現(xiàn)了數(shù)據(jù)分析方法中的0
A、關(guān)聯(lián)
B、聚類
C、分類
D、自然語言處理
答案:A
173.以下敘述正確的是()
A、極差較少受異常值的影響
B、四分位差較少受異常值的影響
C、方差較少受異常值的影響
D、標(biāo)準(zhǔn)差較少受異常值的影響
答案:B
第51頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
174.大數(shù)據(jù)應(yīng)用需求分為年度需求和()兩類。
Av季度需求
B、月度需求
C、周需求
D、即時(shí)需求
答案:D
175.關(guān)聯(lián)規(guī)則是反映事物之間的依賴關(guān)系,典型例子是購物籃分析,常見算法有
Apriori關(guān)聯(lián)算法和()算法。
Av貝葉斯算法
B、線性回歸
C、F.P-growth關(guān)聯(lián)算法
D、聚類算法
答案:C
176.無監(jiān)督學(xué)習(xí),應(yīng)用最廣的是()算法
A、聚類算法;
Bv降維算法;
C、關(guān)聯(lián)規(guī)則算法;
D、文本挖掘
答案:A
177.以下哪些分類方法可以較好地避免樣本的不平衡問題?
0
A、KNN
第52頁,共100頁5/7
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)
基礎(chǔ)(精講)+沖刺(仿真)+督學(xué)(測評)+口訣(速記)+經(jīng)典(資料)
BxSVM
C
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版建筑安全監(jiān)測與評估合同意向書3篇
- 二零二五年度酒店餐飲承包合作協(xié)議2篇
- 2025中外合資經(jīng)營企業(yè)合同(工業(yè)類合資經(jīng)營)
- 2025-2030年(全新版)中國tbhp有機(jī)過氧化物行業(yè)市場前景趨勢調(diào)研及發(fā)展戰(zhàn)略分析報(bào)告
- 2025-2030年中國風(fēng)電涂料市場發(fā)展?fàn)顩r及未來投資戰(zhàn)略決策報(bào)告
- 2025-2030年中國鍍鋅層鈍化劑行業(yè)市場運(yùn)行狀況及發(fā)展趨勢預(yù)測報(bào)告
- 二零二五年度煤礦垃圾清運(yùn)與環(huán)保處理合同范本4篇
- 2025-2030年中國色帶市場運(yùn)行狀況及發(fā)展趨勢預(yù)測報(bào)告
- 二零二五版智能家居家電預(yù)約系統(tǒng)精裝修合同范本3篇
- 2025-2030年中國紡織阻燃劑產(chǎn)業(yè)未來發(fā)展趨勢及前景調(diào)研分析報(bào)告
- 建筑保溫隔熱構(gòu)造
- 智慧財(cái)務(wù)綜合實(shí)訓(xùn)
- 安徽省合肥市2021-2022學(xué)年七年級上學(xué)期期末數(shù)學(xué)試題(含答案)3
- 教育專家報(bào)告合集:年度得到:沈祖蕓全球教育報(bào)告(2023-2024)
- 肝臟腫瘤護(hù)理查房
- 護(hù)士工作壓力管理護(hù)理工作中的壓力應(yīng)對策略
- 2023年日語考試:大學(xué)日語六級真題模擬匯編(共479題)
- 皮帶拆除安全技術(shù)措施
- ISO9001(2015版)質(zhì)量體系標(biāo)準(zhǔn)講解
- 《培訓(xùn)資料緊固》課件
- 黑龍江省政府采購評標(biāo)專家考試題
評論
0/150
提交評論