




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
目錄第一章單元測試第二章單元測試第三章單元測試第四章單元測試第五章單元測試第六章單元測試第七章單元測試第一章單元測試1【單選題】(20分)正確答案:A2011年麥肯錫研究院提出的大數(shù)據(jù)定義是:大數(shù)據(jù)是指其大小超出了常規(guī)數(shù)據(jù)庫工具獲取、儲存、管理和()能力的數(shù)據(jù)集。A.分析B.應(yīng)用C.計算D.訪問2【單選題】(20分)正確答案:D用4V來概括大數(shù)據(jù)的特點的話,一般是指:Value、Velocity、Volume和()。A.VagaryB.VainlyC.ValleyD.Variety3【單選題】(20分)正確答案:D大數(shù)據(jù)分析四個方面的工作主要是:數(shù)據(jù)分類、()、關(guān)聯(lián)規(guī)則挖掘和時間序列預(yù)測。A.數(shù)據(jù)清洗B.數(shù)據(jù)統(tǒng)計C.數(shù)據(jù)計算D.數(shù)據(jù)聚類4【判斷題】(20分)正確答案:A新浪和京東聯(lián)合推出的大數(shù)據(jù)商品推薦,是由京東盲目推送到當(dāng)前瀏覽新浪網(wǎng)站的用戶的頁面上的。A.錯B.對5【判斷題】(20分)正確答案:A目前的大數(shù)據(jù)處理技術(shù)只能處理結(jié)構(gòu)化數(shù)據(jù)。A.錯B.對第二章單元測試1【單選題】(10分)正確答案:D我們常用的微軟Office套件中的Access數(shù)據(jù)庫軟件的數(shù)據(jù)庫文件格式后綴名是()。A.mdfB.xlsC.dbfD.mdb2【單選題】(10分)正確答案:C大多數(shù)日志文件的后綴名是()。A.txtB.xmlC.logD.csv3【單選題】(10分)正確答案:C本課程重點介紹的weka軟件的專有文件格式是()。A.MongoDBB.C.ARFFD.keymap4【單選題】(10分)正確答案:C數(shù)據(jù)清洗工作的目的主要是要解決數(shù)據(jù)的完整性、唯一性、合法性和()。A.專業(yè)性B.排他性C.一致性D.共享性5【單選題】(10分)正確答案:D八爪魚軟件的“自定義采集”工作方式下,需要在軟件里輸入一個()來作為采集的目標(biāo)。A.用戶名B.關(guān)鍵詞C.電話號碼D.網(wǎng)頁地址6【單選題】(10分)正確答案:D八爪魚軟件的采集規(guī)則可以通過文件的形式來導(dǎo)入或者導(dǎo)出,這種文件的后綴名是()。A.gifB.pngC.jpgD.otd7【判斷題】(10分)正確答案:AExcel可以通過“數(shù)據(jù)有效性”按鈕操作來規(guī)范數(shù)據(jù)輸入的范圍。A.對B.錯8【判斷題】(10分)正確答案:AExcel不能導(dǎo)入txt或csv格式的文件。A.錯B.對9【判斷題】(10分)正確答案:B八爪魚軟件只能對軟件內(nèi)建了“簡易采集”規(guī)則的網(wǎng)站采集數(shù)據(jù)。A.對B.錯10【判斷題】(10分)正確答案:B八爪魚軟件進(jìn)行自定義采集時,需要了解對網(wǎng)頁的頁面結(jié)構(gòu)。A.錯B.對第三章單元測試1【單選題】(5分)正確答案:D使用DBSCAN算法對鳶尾花數(shù)據(jù)集(Iris.arff)進(jìn)行聚類,將epsilon參數(shù)設(shè)置為0.2,minPoints參數(shù)設(shè)置為5,忽略class屬性,那么將形成()個簇。A.3B.1C.4D.22【單選題】(5分)正確答案:D使用EM算法對天氣數(shù)據(jù)集(weather.numeric.arff)進(jìn)行聚類,將numClusters設(shè)置為4,即簇數(shù)為4,其他參數(shù)保持默認(rèn)值,忽略play屬性,從結(jié)果中可知,下列選項中,()是錯誤的。A.第四個簇的先驗概率是0.14B.這組數(shù)據(jù)用算法迭代15次C.模型的最大似然估計值是-7.18D.第四個簇的實例數(shù)為43【單選題】(5分)正確答案:A使用SimpleKMeans算法對天氣數(shù)據(jù)集(weather.numeric.arff)進(jìn)行聚類,保持默認(rèn)參數(shù),即3個簇以及歐氏距離。選擇play屬性為忽略屬性,從結(jié)果中可知,下列選項中,()是錯誤。A.這組數(shù)據(jù)用算法迭代四次B.平方和誤差為8.928C.產(chǎn)生了三個中心點D.聚合為3個簇,分別有7,3,4個實例4【單選題】(5分)正確答案:B使用線性回歸(LinearRegression)分類器和用M5P分類器對cpu.arff分別進(jìn)行分類,由其輸出的誤差指標(biāo)可知()。A.LinearRegression的相對誤差比M5P的相對誤差小B.LinearRegression的平均方根誤差比M5P的平均方根誤差大C.LinearRegression的標(biāo)準(zhǔn)誤差比M5P的標(biāo)準(zhǔn)誤差小D.LinearRegression的平均絕對誤差比M5P的平均絕對誤差小5【單選題】(5分)正確答案:C刪去cpu.arff數(shù)據(jù)文件中的CACH屬性后,使用M5P分類器構(gòu)建方案,在結(jié)果中,到達(dá)LM2的實例數(shù)有()個。A.23B.165C.21D.306【單選題】(5分)正確答案:B根據(jù)J48分類器訓(xùn)練weather.nominal.arff所生產(chǎn)的決策樹,當(dāng)outlook=sunny;temperature=cool;humidity=high;windy=TRUE時,分類的結(jié)果是()。A.YesB.NoC.無法分類D.沒有結(jié)果7【單選題】(5分)正確答案:B根據(jù)J48分類器訓(xùn)練iris.arff所生產(chǎn)的決策樹,當(dāng)sepallength=4.4;sepalwidth=3.0;petallength=1.3;petalwidth=0.2時,分類的結(jié)果是()。A.Iris-virginicaB.Iris-setosaC.無法分類D.Iris-versicolor8【單選題】(5分)正確答案:A關(guān)于Weka離散化說明正確的是()。A.離散化包括無監(jiān)督離散化和有監(jiān)督離散化B.離散化是將數(shù)值屬性轉(zhuǎn)換為字符串型屬性C.等寬離散化是使實例分布均勻的D.有監(jiān)督離散化有兩種等寬和等頻方法9【單選題】(5分)正確答案:D以下()不是Weka的數(shù)據(jù)類型。A.stringB.nominalC.numericD.decimal10【單選題】(5分)正確答案:D關(guān)于Weka的文件類型描述錯誤的是()。A.@relation定義數(shù)據(jù)集名稱,@data之后呈現(xiàn)實例,每一行就是一個實例B.Weka處理的數(shù)據(jù)集類似于關(guān)系數(shù)據(jù)庫橫行實例,豎行屬性C.arff是ASCII文件,可以用Word等文本編輯器打開查看D.Weka可以打開文件格式有.arff、.csv、.xlsx11【單選題】(5分)正確答案:D以下屬于關(guān)聯(lián)分析的是()。A.自動判斷鳶尾花類別B.CPU性能預(yù)測C.股票趨勢建模D.購物籃分析12【單選題】(5分)正確答案:A大數(shù)據(jù)時代的到來,使我們無法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奧妙,與此同時,我們更應(yīng)該注重數(shù)據(jù)中的相關(guān)關(guān)系,而不是因果關(guān)系。其中,數(shù)據(jù)之間的相關(guān)關(guān)系可以通過以下()算法直接挖掘。A.AprioriB.K-meansC.BayesNetworkD.C4.513【單選題】(5分)正確答案:A某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據(jù)挖掘的()問題。A.關(guān)聯(lián)規(guī)則發(fā)現(xiàn)B.分類C.自然語言處理D.聚類14【單選題】(5分)正確答案:A在進(jìn)行自動選擇屬性時,必須設(shè)立兩個對象,其中確定使用什么方法為每個屬性子集分配一個評估值的對象是下面的()。A.屬性評估器B.搜索方法C.元分類器D.規(guī)則挖掘15【單選題】(5分)正確答案:D以下屬于屬性空間的搜索方法的是()。A.GainRatioAttributeEvalB.SymmetricalUncertAttributeEvalC.PrincipalComponentsD.BestFirst16【單選題】(5分)正確答案:D在weka軟件探索者界面中,利用Visualize標(biāo)簽頁通過更改各個參數(shù)來進(jìn)行數(shù)據(jù)集的可視化屬性設(shè)置后,需要單擊以下()按鈕,所有更改才會生效。A.FastscrollingB.SelectAttributeC.SubSampleD.Update17【判斷題】(5分)正確答案:B給定關(guān)聯(lián)規(guī)則AB,意味著:若A發(fā)生,B也會發(fā)生。A.對B.錯18【判斷題】(5分)正確答案:A支持度是衡量關(guān)聯(lián)規(guī)則重要性的一個指標(biāo)。A.對B.錯19【判斷題】(5分)正確答案:BRanker方法既可以用于單個屬性評估器,又可以用于屬性子集評估器。A.對B.錯20【判斷題】(5分)正確答案:A利用weka軟件進(jìn)行數(shù)據(jù)可視化時,用戶可以選擇類別屬性對數(shù)據(jù)點著色,如果類別屬性是標(biāo)稱型,則顯示為彩色條。A.錯B.對第四章單元測試1【單選題】(10分)正確答案:D貝葉斯網(wǎng)絡(luò)中的節(jié)點代表()。A.隨機(jī)函數(shù)B.變量C.隨機(jī)過程D.隨機(jī)變量2【單選題】(10分)正確答案:C貝葉斯網(wǎng)絡(luò)中,節(jié)點需給出概率分布描述,對于離散型隨機(jī)變量而言,可以用()的形式表示。A.條件概率密度函數(shù)B.均勻分布C.條件概率表D.正態(tài)分布3【單選題】(10分)正確答案:C貝葉斯網(wǎng)絡(luò)中節(jié)點之間的邊代表()。A.隨機(jī)結(jié)果B.概率因果C.隨機(jī)關(guān)系D.組合關(guān)系4【單選題】(10分)正確答案:B貝葉斯網(wǎng)絡(luò)保存的文件格式是()。A.DOCXB.XMLBIFC.TXTD.XLS5【單選題】(10分)正確答案:D下面()不是反向傳播神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。A.輸出層B.輸入層C.隱含層D.計算層6【單選題】(10分)正確答案:C神經(jīng)網(wǎng)絡(luò)中的節(jié)點代表()。A.激勵變量B.隨機(jī)函數(shù)C.激勵函數(shù)D.隨機(jī)變量7【單選題】(10分)正確答案:C下列()不是常見的激勵函數(shù)。A.線性函數(shù)B.閾值函數(shù)C.正弦函數(shù)D.Sigmoid函數(shù)8【單選題】(10分)正確答案:A在貝葉斯網(wǎng)絡(luò)編輯界面時,如果節(jié)點的名稱沒法完全顯示,需要從()菜單項進(jìn)行調(diào)整。A.Tools|LayoutB.Tools|SetDataC.View|ZoomInD.View|ZoomOut9【單選題】(10分)正確答案:BWEKA中選擇神經(jīng)網(wǎng)絡(luò)分類器操作時,應(yīng)該選擇()。A.functions條目下的SGD分類器B.functions條目下的MultilayerPerceptron分類器C.默認(rèn)的分類器D.rules條目下的PART10【單選題】(10分)正確答案:A下面關(guān)于PackageManager安裝后的目錄說明不正確的是()。A.lib子目錄存放包所需要的說明文件B.doc子目錄存放API文檔C.src子目錄存放源代碼文件D.sample-data子目錄存放數(shù)據(jù)集文件第五章單元測試1【單選題】(10分)正確答案:ATableau是一款定位于數(shù)據(jù)可視化敏捷開發(fā)和實現(xiàn)()展現(xiàn)工具。Tableau連續(xù)第6年在Gartner分析和商業(yè)智能魔力象限中蟬聯(lián)領(lǐng)導(dǎo)者殊榮。A.商務(wù)智能B.商務(wù)計算C.商業(yè)統(tǒng)計D.商業(yè)行為2【單選題】(10分)正確答案:C以下()不是Tableau的數(shù)據(jù)類型?A.BooleanB.DateC.DecimalD.String3【單選題】(10分)正確答案:CTableau可以用來實現(xiàn)交互的、()的分析和儀表板應(yīng)用,從而幫助我們快速地認(rèn)識和理解數(shù)據(jù)。A.離散性B.連續(xù)性C.可視化D.智能化4【單選題】(10分)正確答案:A下列說法錯誤的是()。A.Tableau不提供應(yīng)用編程接口B.用戶僅需要通過輕點鼠標(biāo)和簡單拖放就可以迅速創(chuàng)建出智能、精美、直觀和具有強(qiáng)交互性的報表和儀表盤C.Tableau通過內(nèi)存數(shù)據(jù)引擎,可以直接查詢外部數(shù)據(jù)庫同時動態(tài)的從數(shù)據(jù)倉庫抽取實時數(shù)據(jù),極大的提高了數(shù)據(jù)訪問和查詢效率D.Tableau允許從多個數(shù)據(jù)源訪問數(shù)據(jù),包括帶分隔符的文本文件、Excel文件、SQL數(shù)據(jù)庫、Oracle數(shù)據(jù)庫和多維數(shù)據(jù)庫等5【單選題】(10分)正確答案:A度量往往是()字段,度量是我們的指標(biāo)。度量常常是連續(xù)的,連續(xù)的字段在圖表中形成軸.將其拖放到功能區(qū)時,Tableau默認(rèn)會進(jìn)行()。A.數(shù)值,聚合運算B.數(shù)值,混合運算C.分類,聚合運算D.分類,混合運算6【單選題】(10分)正確答案:D關(guān)于數(shù)據(jù)分層描述錯誤的是()。A.數(shù)據(jù)分層的層次結(jié)構(gòu)可以手工調(diào)整B.數(shù)據(jù)分層的層級結(jié)構(gòu)由數(shù)據(jù)維度的上下順序決定C.數(shù)據(jù)分層可以實現(xiàn)向下鉆取D.數(shù)據(jù)分層可以實現(xiàn)向上鉆取7【單選題】(10分)正確答案:C以下不屬于集的創(chuàng)建方式的是()。A.[條件]創(chuàng)建B.[頂部]創(chuàng)建C.[分組]創(chuàng)建D.[常規(guī)]創(chuàng)建8【單選題】(10分)正確答案:BTableau右邊數(shù)據(jù)目錄欄中,不能單擊右鍵創(chuàng)建參數(shù)的緯度是()。A.度量B.集C.參數(shù)D.緯度9【單選題】(10分)正確答案:D以下不是創(chuàng)建計算字段時的運算邏輯的是()。A.日期B.用戶C.數(shù)字D.表結(jié)構(gòu)10【單選題】(10分)正確答案:A儀表板版面大小設(shè)計選項,()不屬于大小設(shè)計選項。A.自定義B.固定大小C.自動D.范圍第六章單元測試1【單選題】(10分)正確答案:CLogistic函數(shù)的定義域是()。A.(0,+INF)B.[0,1]C.(-INF,+INF)D.(-INF,1)2【單選題】(20分)正確答案:D下列敘述錯誤的是()。A.邏輯回歸采用Sigmoid函數(shù)對樣本數(shù)據(jù)進(jìn)行擬合,以構(gòu)建回歸模型B.邏輯回歸是一種監(jiān)督機(jī)器學(xué)習(xí)算法C.邏輯回歸預(yù)測事件發(fā)生的概率并分析導(dǎo)致事件發(fā)生的因素D.邏輯回歸主要用于回歸分析3【單選題】(10分)正確答案:A使用IBk分類器和SMO分類器對vote.arff分別進(jìn)行分類,由其輸出的結(jié)果可知()。A.SMO對democrat和republican的分類正確率都比IBk大B.SMO對democrat的分類正確率比IBk小C.IBk對republican的分類正確率比SMO大D.IBk正確分類百分比比SMO大4【單選題】(20分)正確答案:BA.true或falseB.1或-1C.0或1D.0或-15【單選題】(20分)正確答案:D以下描述錯誤的是()。A.SVM對噪聲不具備魯棒性B.k-最近鄰算法(K-NN)是一種消極學(xué)習(xí)器C.聚類分析可以看作是一種非監(jiān)督的分類D.SVM尋找具有最小邊緣的超平面,因此經(jīng)常被稱為最小邊緣分類器第七章單元測試1【單選題】(10分)正確答案:D以下數(shù)據(jù)和信息的說法,不正確的是()。A.凡是可以電子化記錄下來的都是數(shù)據(jù)B.數(shù)據(jù)的形式是多樣化的C.信息是客觀世界各種事物特征的反映D.數(shù)據(jù)對用戶來說是有價值的2【單選題】(10分)正確答案:A以下關(guān)于數(shù)據(jù)分析的方法,正確的是()。A.數(shù)據(jù)分析的目的就是解決我們現(xiàn)實中的某個問題B.所有的分析都是要從“過程”出發(fā),沒有結(jié)論的數(shù)字羅列并不是分析C.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年通信廣場營業(yè)員工作個人計劃
- 新財務(wù)總監(jiān)11月工作總結(jié)
- 小學(xué)美術(shù)教育實習(xí)工作總結(jié)(3篇)
- 爆破安全責(zé)任書(3篇)
- 民事裝修合同糾紛(3篇)
- 生態(tài)文明建設(shè)的實施方案(3篇)
- 北交大實習(xí)報告
- 新電力專業(yè)技術(shù)年度總結(jié)
- 食品加工廠建筑施工合同
- 2024年公司網(wǎng)管年度工作總結(jié)
- 部編版三年級下冊語文第一單元教材解讀PPT課件
- 【2022】154號文附件一:《江蘇省建設(shè)工程費用定額》(2022年)營改增后調(diào)整內(nèi)容[10頁]
- 二年級剪窗花
- 分子生物學(xué)在醫(yī)藥中的研究進(jìn)展及應(yīng)用
- 《對折剪紙》)ppt
- 03SG520-1實腹式鋼吊車梁(中輕級工作制A1~A5_Q235鋼_跨度6.0m、7.5m、9.0m)
- 以虛報注冊資本、虛假出資、抽逃出資為由對實行認(rèn)繳資本登記制的公司進(jìn)行處罰無法律依據(jù)
- 風(fēng)電場生產(chǎn)運營準(zhǔn)備大綱11.14
- 人教版八年級語文下冊教材研說
- 《機(jī)械制造裝備設(shè)計》ppt課件
- 中學(xué)家訪記錄大全100篇 關(guān)于中學(xué)家訪隨筆
評論
0/150
提交評論