![2025年CPDA考試真題與答案_第1頁](http://file4.renrendoc.com/view10/M02/2F/30/wKhkGWeo06KAPG6HAAGLsHDeWdo893.jpg)
![2025年CPDA考試真題與答案_第2頁](http://file4.renrendoc.com/view10/M02/2F/30/wKhkGWeo06KAPG6HAAGLsHDeWdo8932.jpg)
![2025年CPDA考試真題與答案_第3頁](http://file4.renrendoc.com/view10/M02/2F/30/wKhkGWeo06KAPG6HAAGLsHDeWdo8933.jpg)
![2025年CPDA考試真題與答案_第4頁](http://file4.renrendoc.com/view10/M02/2F/30/wKhkGWeo06KAPG6HAAGLsHDeWdo8934.jpg)
![2025年CPDA考試真題與答案_第5頁](http://file4.renrendoc.com/view10/M02/2F/30/wKhkGWeo06KAPG6HAAGLsHDeWdo8935.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
一、判斷題(題數(shù):15,共15.0分)1.定量屬性可以是整數(shù)值或者是持續(xù)值。()對(duì)的答案:√2.分類模型的誤差大體分為兩種:訓(xùn)練誤差(trainingerror)和泛化誤差(generalizationerror)。()對(duì)的答案:√3.在決策樹中,伴隨樹中結(jié)點(diǎn)數(shù)變得太大,雖然模型的訓(xùn)練誤差還在繼續(xù)減低,不過檢查誤差開始增大,這是出現(xiàn)了模型擬合局限性的問題。()對(duì)的答案:×4.在聚類分析當(dāng)中,簇內(nèi)的相似性越大,簇間的差異越大,聚類的效果就越差。()對(duì)的答案:×5.聚類分析可以看作是一種非監(jiān)督的分類。()對(duì)的答案:√6.假如一種對(duì)象不強(qiáng)屬于任何簇,那么該對(duì)象是基于聚類的離群點(diǎn)。()對(duì)的答案:√7.容許誤差應(yīng)根據(jù)錯(cuò)誤記錄對(duì)整個(gè)系統(tǒng)也許帶來的破壞來確定,一般正是那些低使用率的產(chǎn)品或不常使用的產(chǎn)品為庫存誤差帶來很大麻煩,因此應(yīng)結(jié)合數(shù)量方差比例和絕對(duì)值方差來確定誤差。()對(duì)的答案:√8.召回率反應(yīng)的是預(yù)測為正中的樣本中正例的概率。()對(duì)的答案:×9.支持度表達(dá)前項(xiàng)與後項(xiàng)在一種數(shù)據(jù)集中同步出現(xiàn)的頻率。()對(duì)的答案:√10.最大最小值原則化法也叫極值法,該措施合用于已知數(shù)據(jù)集的最小值或最大值狀況。()對(duì)的答案:√11.波特五力模型中五個(gè)壓力來源是供應(yīng)商議價(jià)能力、購置者的議價(jià)能力、行業(yè)新進(jìn)入者的威脅、替代產(chǎn)品的威脅及企業(yè)內(nèi)部的管理壓力。()(1.0分)1.0分對(duì)的答案:×12.異常值在數(shù)理記錄裏一般是指一組觀測值中與平均值的偏差超過三倍原則差的測定值。()對(duì)的答案:×13.數(shù)據(jù)可視化可以便于人們對(duì)數(shù)據(jù)的理解。()對(duì)的答案:√14.大數(shù)據(jù)思維,是指一種意識(shí),認(rèn)為公開的數(shù)據(jù)一旦處理得當(dāng)可認(rèn)為人類急需處理的問題提供答案。()對(duì)的答案:√15.資金自身具有時(shí)間價(jià)值。()對(duì)的答案:×二、單項(xiàng)選擇題(題數(shù):30,共45.0分)1.某超市研究銷售記錄發(fā)現(xiàn),購置牛奶的人很大概率會(huì)購置面包,這種屬于數(shù)據(jù)挖掘的哪類問題?()A、聚類分析B、關(guān)聯(lián)規(guī)則C、分類分析D、自然語言處理對(duì)的答案:B2.如下兩種描述分別對(duì)應(yīng)哪兩種對(duì)分類算法的評(píng)價(jià)原則?()(a)警察抓殺人犯,描述警察抓的人中有多少個(gè)是殺人犯的原則。(b)描述有多少比例的殺人犯給警察抓了的原則。A、Precision,RecallB、Recall,PrecisionC、Precision,ROCD、Recall,ROC對(duì)的答案:A3.將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在如下哪個(gè)環(huán)節(jié)的任務(wù)?()A、數(shù)據(jù)獲取B、分類和預(yù)測C、數(shù)據(jù)預(yù)處理D、數(shù)據(jù)可視化對(duì)的答案:C4.當(dāng)不懂得數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離?()A、分類B、聚類C、關(guān)聯(lián)分析D、主成分分析對(duì)的答案:B5.下面哪種不屬于數(shù)據(jù)預(yù)處理的措施?()A、變量代換B、離散化C、匯集D、估計(jì)遺漏值對(duì)的答案:D6.假設(shè)12個(gè)銷售價(jià)格記錄組已經(jīng)排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用等寬劃分(寬度為50)措施將它們劃提成四個(gè)箱,求15在哪個(gè)箱子裏?()A、第一種B、第二個(gè)C、第三個(gè)D、第四個(gè)對(duì)的答案:A7.如下哪些算法是分類算法?()A、DBSCANB、C4.5C、K-MeanD、K-medoids對(duì)的答案:B8.如下哪些分類措施可以很好地防止樣本的不平衡問題?()A、KNNB、SVMC、BayesD、神經(jīng)網(wǎng)絡(luò)對(duì)的答案:A9.有關(guān)K均值和DBSCAN的比較,如下說法不對(duì)的的是()。A、K均值丟棄被它識(shí)別為噪聲的對(duì)象,而DBSCAN一般聚類所有對(duì)象B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念C、K均值很難處理非球形的簇和不一樣大小的簇,DBSCAN可以處理不一樣大小和不一樣形狀的簇D、K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),不過DBSCAN會(huì)合并有重疊的簇對(duì)的答案:A10.下列不屬于關(guān)聯(lián)分析的關(guān)鍵要素的是()A、支持度B、置信度C、滿意度D、提高度對(duì)的答案:C11.因子分析的重要作用有()A、對(duì)變量進(jìn)行降維B、對(duì)變量進(jìn)行鑒別C、對(duì)變量進(jìn)行聚類D、以上都不對(duì)對(duì)的答案:A12.ROC曲線凸向哪個(gè)角,代表模型越理想?()A、左上角B、左下角C、右上角D、右下角對(duì)的答案:A13.SQL語句中刪除表的命令是()A、DROPTABLEB、DELETETABLEC、ERASETABLED、DELETEDBF對(duì)的答案:A14.在多元回歸模型的檢查中,目的是檢查每一種自變量與因變量在指定明顯性水平上與否存在線性有關(guān)關(guān)系的檢查是()A、r檢查B、t檢查C、f檢查D、DW檢查對(duì)的答案:B15.()提供的支撐技術(shù),有效處理了大數(shù)據(jù)分析、研發(fā)的問題,例如虛擬化技術(shù)、并行計(jì)算、海量存儲(chǔ)和海量管理等。A、點(diǎn)計(jì)算B、線計(jì)算C、雲(yún)計(jì)算D、面計(jì)算對(duì)的答案:C16.智能健康手環(huán)的應(yīng)用開發(fā),體現(xiàn)了()的數(shù)據(jù)采集技術(shù)的應(yīng)用。A、記錄報(bào)表B、網(wǎng)絡(luò)爬蟲C、API接口D、傳感器對(duì)的答案:D17.下列有關(guān)數(shù)據(jù)重組的說法中,錯(cuò)誤的是()A、數(shù)據(jù)重組是數(shù)據(jù)的重新生產(chǎn)和重新采集B、數(shù)據(jù)重組可以使數(shù)據(jù)煥發(fā)新的光輝C、數(shù)據(jù)重組實(shí)現(xiàn)的關(guān)鍵在于多源數(shù)據(jù)融合和數(shù)據(jù)集成D、數(shù)據(jù)重組有助于實(shí)現(xiàn)新奇的數(shù)據(jù)模式創(chuàng)新對(duì)的答案:A18.美國海軍軍官莫裏通過對(duì)前人航海曰志的分析,繪制了新的航海路線圖,標(biāo)明了大風(fēng)與洋流也許發(fā)生的地點(diǎn)。這體現(xiàn)了大數(shù)據(jù)分析理念中的()A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B、在分析措施上更重視有關(guān)分析而不是因果分析C、在分析效果上更追究效率而不是絕對(duì)精確D、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)對(duì)的答案:B19.目前國內(nèi)社會(huì)中,最為突出的大數(shù)據(jù)環(huán)境是()A、互聯(lián)網(wǎng)B、物聯(lián)網(wǎng)C、綜合國力D、自然資源對(duì)的答案:A20.下列有關(guān)聚類挖掘技術(shù)的說法中,錯(cuò)誤的是()A、不預(yù)先設(shè)定數(shù)據(jù)歸類類目,完全根據(jù)數(shù)據(jù)自身性質(zhì)將數(shù)據(jù)聚合成不一樣類別B、規(guī)定同類數(shù)據(jù)的內(nèi)容相似度盡量小C、規(guī)定不一樣類數(shù)據(jù)的內(nèi)容相似度盡量小D、與分類挖掘技術(shù)相似的是,都是要對(duì)數(shù)據(jù)進(jìn)行分類處理對(duì)的答案:B21.下列有關(guān)大數(shù)據(jù)的分析理念的說法中,錯(cuò)誤的是()A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B、在分析措施上更重視有關(guān)分析而不是因果分析C、在分析效果上更追究效率而不是絕對(duì)精確D、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)對(duì)的答案:D22.對(duì)于企業(yè)來說,數(shù)據(jù)使用的關(guān)鍵是()A、數(shù)據(jù)搜集B、數(shù)據(jù)存儲(chǔ)C、數(shù)據(jù)分析D、數(shù)據(jù)再運(yùn)用對(duì)的答案:D23.數(shù)據(jù)倉庫的最終目的是()A、搜集業(yè)務(wù)需求B、建立數(shù)據(jù)倉庫邏輯模型C、開發(fā)數(shù)據(jù)倉庫的應(yīng)用分析D、為顧客和業(yè)務(wù)部門提供決策支持對(duì)的答案:D24.大數(shù)據(jù)背景下,數(shù)據(jù)支撐業(yè)務(wù)的目的是()A、建立數(shù)據(jù)科學(xué)B、完畢數(shù)據(jù)應(yīng)用C、配置數(shù)據(jù)硬件D、吸納數(shù)據(jù)人才對(duì)的答案:B25.在SQL中,創(chuàng)立數(shù)據(jù)庫用的命令是()A、CREATESCHEMAB、CREATETABLEC、CREATEVIEWD、CREATEDATABASE對(duì)的答案:D26.下列四項(xiàng)中,不屬于數(shù)據(jù)庫特點(diǎn)的是()A、數(shù)據(jù)共享B、數(shù)據(jù)完整性C、數(shù)據(jù)冗余很高D、數(shù)據(jù)獨(dú)立性高對(duì)的答案:C27.資金的時(shí)間價(jià)值是()A、同一資金在同一時(shí)點(diǎn)上價(jià)值量的差額B、同一資金在不一樣步點(diǎn)上價(jià)值量的差額C、不一樣資金在同一時(shí)點(diǎn)上價(jià)值量的差額D、不一樣資金在不一樣步點(diǎn)上價(jià)值量的差額對(duì)的答案:B28.下列選項(xiàng)中屬于現(xiàn)金流入的項(xiàng)目是()A、所得稅B、建設(shè)投資C、經(jīng)營成本D、營業(yè)收入對(duì)的答案:D29.下列有關(guān)計(jì)算機(jī)存儲(chǔ)容量單位的說法中,錯(cuò)誤的是()A、1KB<1MB<1GBB、基本單位是字節(jié)(Byte)C、一種中文需要一種字節(jié)的存儲(chǔ)空間D、一種字節(jié)可以容納一種英文字符對(duì)的答案:C30.按數(shù)據(jù)的構(gòu)造程度來劃分,分為()A、構(gòu)造化數(shù)據(jù)半構(gòu)造化數(shù)據(jù)非構(gòu)造化數(shù)據(jù)B、強(qiáng)構(gòu)造化數(shù)據(jù)弱構(gòu)造化數(shù)據(jù)C、截面數(shù)據(jù)面板數(shù)據(jù)D、一級(jí)數(shù)據(jù)二級(jí)數(shù)據(jù)三級(jí)數(shù)據(jù)對(duì)的答案:A三、多選題(題數(shù):20,共40.0分)1.如下屬于數(shù)據(jù)預(yù)處理的是()A、缺失值填充B、噪聲數(shù)據(jù)剔除C、異常值識(shí)別D、數(shù)據(jù)可視化對(duì)的答案:ABC2.缺失值的處理措施有哪些?()A、用平均值填充B、忽視缺失記錄C、以任意數(shù)據(jù)填充D、用默認(rèn)值填充對(duì)的答案:ABD3.如下屬于數(shù)據(jù)規(guī)約措施的是()A、數(shù)據(jù)離散化B、數(shù)據(jù)原則化C、噪聲數(shù)據(jù)識(shí)別D、數(shù)據(jù)壓縮對(duì)的答案:AD4.數(shù)據(jù)挖掘的預(yù)測建模任務(wù)重要包括哪幾大類問題?()A、分類B、回歸C、模式發(fā)現(xiàn)D、模式匹配對(duì)的答案:AB5.如下說法對(duì)的的有哪些?()A、大數(shù)據(jù)僅僅是講數(shù)據(jù)的體量大B、大數(shù)據(jù)對(duì)老式行業(yè)有協(xié)助C、大數(shù)據(jù)會(huì)帶來機(jī)器智能D、大數(shù)據(jù)是一種思維方式對(duì)的答案:BCD6.有關(guān)大數(shù)據(jù)的來源,如下理解對(duì)的的是()A、大數(shù)據(jù)是數(shù)據(jù)量變積累到達(dá)質(zhì)變的成果B、數(shù)據(jù)的產(chǎn)生需要經(jīng)歷很長時(shí)間C、我們每個(gè)人都是數(shù)據(jù)的制造者D、當(dāng)今的世界,基本上一切都可以用數(shù)字體現(xiàn),因此叫數(shù)字化的世界對(duì)的答案:ACD7.大數(shù)據(jù)在今天這個(gè)時(shí)間點(diǎn)上爆發(fā)的原因有哪些?()A、多種傳感器無時(shí)無刻不在為我們提供大量的數(shù)據(jù)B、多種監(jiān)控設(shè)備無時(shí)無刻不在為我們提供大量的數(shù)據(jù)C、多種智能設(shè)備無時(shí)無刻不在為我們提供大量的數(shù)據(jù)D、互聯(lián)網(wǎng)的搜集和積累對(duì)的答案:ABCD8.()這些數(shù)據(jù)特性都是對(duì)聚類分析具有很強(qiáng)影響的。A、高維性B、規(guī)模C、稀疏性D、噪聲和離群點(diǎn)對(duì)的答案:ABCD9.如下哪個(gè)分布是右偏分布?()A、均勻分布B、卡方分布C、F分布D、對(duì)數(shù)正態(tài)分布對(duì)的答案:BCD10.如下哪些變量使用RFM措施構(gòu)造出來的?()A、近來3期境外消費(fèi)金額B、近來6期網(wǎng)銀消費(fèi)交易筆數(shù)C、信用額度D、距近來一次逾期的月數(shù)對(duì)的答案:ABD11.如下表student中,怎樣篩選type為包括數(shù)學(xué)或語文的記錄?()A、select*fromstudentwheretype=“數(shù)學(xué)”andtype=“語文”B、select*fromstudentwheretype=“數(shù)學(xué)”ortype=“語文”C、select*fromstudentwheretypein(“數(shù)學(xué)”,“語文”)D、select*fromstudentwheretypein(“數(shù)學(xué)”?“語文”)對(duì)的答案:BC12.主成分分析計(jì)算選擇有關(guān)系數(shù)計(jì)算法時(shí),確定主成分個(gè)數(shù)的大體原則包括()A、特性根值不小于1B、特性根值不小于0.8C、累積特性根值加總占總特性根值的80%以上D、累積特性根值加總占總特性根值的90%以上對(duì)的答案:AC13.在客戶關(guān)系管理中,客戶的生命周期都包括()階段。A、潛在客戶B、響應(yīng)客戶C、即得客戶D、流失客戶對(duì)的答案:ABCD14.分箱措施有哪些?()(2.0分)0.0分A、等深分箱B、等寬分箱C、數(shù)據(jù)原則化D、自定義區(qū)間法對(duì)的答案:ABD15.運(yùn)用Apriori算法計(jì)算頻繁項(xiàng)集可以有效減少計(jì)算頻繁集的時(shí)間復(fù)雜度。在如下的購物籃中產(chǎn)生支持度不不不小于3的候選3-項(xiàng)集,在候選2-項(xiàng)集中需要剪枝的是()ID項(xiàng)集。1面包、牛奶2面包、尿布、啤酒、雞蛋3牛奶、尿布、啤酒、可樂4面包、牛奶、尿布、啤酒5面包、牛奶、尿布、可樂A、啤酒、尿布B、啤酒、面包C、面包、尿布D、啤酒、牛奶對(duì)的答案:BD16.我們可以用哪種方式來防止決策樹過度擬合的問題?()A、運(yùn)用修剪法來限制樹的深度B、運(yùn)用盆栽法規(guī)定每個(gè)節(jié)點(diǎn)下的最小的記錄數(shù)目C、運(yùn)用逐漸回歸法來刪除部分?jǐn)?shù)據(jù)D、目前并無適合的措施來處理這問題對(duì)的答案:A
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度深圳租房合同:租賃保證金退還流程規(guī)范
- 二零二五年度酒店入股與旅游產(chǎn)業(yè)鏈整合合同
- 《路基翻漿的防治》課件
- 《古代詩歌鑒賞》課件
- 《IT治理概述》課件
- 《腳手架規(guī)范》課件
- 《語文下冊(cè)園地》課件
- 《愛護(hù)公物珍愛校園》課件
- 《軟包裝性能測試》課件
- 三年級(jí)語文上冊(cè) 第四單元 語文園地說課稿 新人教版
- 《學(xué)習(xí)地圖》課件
- 抓住人工智能科學(xué)機(jī)遇 A new golden age of discovery Seizing the AI for Science opportunity 2024
- 松材線蟲調(diào)查培訓(xùn)
- 方志敏《可愛的中國》全文閱讀
- 2024年廣西區(qū)公務(wù)員錄用考試《行測》真題及答案解析
- DB12-T 3034-2023 建筑消防設(shè)施檢測服務(wù)規(guī)范
- 銷售人員崗位職責(zé)培訓(xùn)
- 助理醫(yī)師醫(yī)院協(xié)議書(2篇)
- 短暫性腦缺血發(fā)作
- 父親歸來那一天(2022年四川廣元中考語文試卷記敘文閱讀題及答案)
- 小學(xué)數(shù)學(xué)五年級(jí)上冊(cè)奧數(shù)應(yīng)用題100道(含答案)
評(píng)論
0/150
提交評(píng)論