南開21春學(xué)期《大數(shù)據(jù)導(dǎo)論》在線作業(yè)答案_第1頁
南開21春學(xué)期《大數(shù)據(jù)導(dǎo)論》在線作業(yè)答案_第2頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、21春學(xué)期(1709、1803、1809、1903、1909、2003、2009、2103)大數(shù)據(jù)導(dǎo)論在線作業(yè)試卷總分:100 得分:100一、單選題 (共 15 道試題,共 30 分)1.數(shù)據(jù)產(chǎn)生方式變革中數(shù)據(jù)產(chǎn)生方式是被動(dòng)的主要是來自哪個(gè)階段( )。A.運(yùn)營式系統(tǒng)階段B.用戶原創(chuàng)內(nèi)容階段C.感知式系統(tǒng)階段答案:A2.第一個(gè)提出大數(shù)據(jù)概念的公司是( )。A.麥肯錫公司B.谷歌公司C.微軟公司D.臉譜公司答案:A3.以下不是數(shù)據(jù)倉庫基本特征的是()A.數(shù)據(jù)倉庫是面向主題的B.數(shù)據(jù)倉庫是面向事務(wù)的C.數(shù)據(jù)倉庫的數(shù)據(jù)是相對穩(wěn)定的D.數(shù)據(jù)倉庫的數(shù)據(jù)是反映歷史變化的答案:B4.基礎(chǔ)設(shè)施即服務(wù)的英文簡稱

2、是A.IaaSB.PaaSC.SaaS答案:A5.大數(shù)據(jù)的特點(diǎn)不包含A.數(shù)據(jù)體量大B.價(jià)值密度高C.處理速度快D.數(shù)據(jù)不統(tǒng)一答案:D6.SAN是一種()A.存儲(chǔ)設(shè)備B.專為數(shù)據(jù)存儲(chǔ)而設(shè)計(jì)構(gòu)建的網(wǎng)絡(luò)C.光纖交換機(jī)D.HBA答案:B7.數(shù)據(jù)產(chǎn)生方式變革中數(shù)據(jù)產(chǎn)生方式是自動(dòng)的主要是來自哪個(gè)階段( )。A.運(yùn)營式系統(tǒng)階段B.用戶原創(chuàng)內(nèi)容階段C.感知式系統(tǒng)階段答案:C8.醫(yī)療健康數(shù)據(jù)的基本情況不包括以下哪項(xiàng)?A.診療數(shù)據(jù)B.個(gè)人健康管理數(shù)據(jù)C.公共安全數(shù)據(jù)D.健康檔案數(shù)據(jù)答案:C9.()是Microsoft Office的核心組件A.SQLB.WORDC.PPTD.EXCEL答案:D10.哪個(gè)選項(xiàng)不屬于

3、大數(shù)據(jù)4V特點(diǎn)?A.VolumeB.ValidC.VarietyD.Value答案:B11.以下哪項(xiàng)不是數(shù)據(jù)可視化工具的特性()A.實(shí)時(shí)性B.簡單操作C.更豐富的展現(xiàn)D.僅需一種數(shù)據(jù)支持方式即可答案:D12.大數(shù)據(jù)的最顯著特征是() 。A.數(shù)據(jù)規(guī)模大B.數(shù)據(jù)類型多樣C.數(shù)據(jù)處理速度快D.數(shù)據(jù)價(jià)值密度高答案:A13.MapReduce中的Map和Reduce函數(shù)使用()進(jìn)行輸入輸出A.key/value對B.隨機(jī)數(shù)值C.其他計(jì)算結(jié)果答案:A14.數(shù)據(jù)倉庫是隨著時(shí)間變化的,下列不正確的是()A.數(shù)據(jù)倉庫隨時(shí)間變化不斷增加新內(nèi)容B.捕捉到的新數(shù)據(jù)會(huì)覆蓋原來的快照C.數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)

4、內(nèi)容D.數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會(huì)隨時(shí)間的變化不斷進(jìn)行重新綜合答案:C15.GFS中的文件切分成()的塊進(jìn)行存儲(chǔ)A.32MBB.64MBC.128MBD.1G答案:B二、多選題 (共 15 道試題,共 30 分)16.開放云()A.價(jià)值呈現(xiàn):大數(shù)據(jù)應(yīng)用價(jià)值呈現(xiàn)和創(chuàng)新不足B.應(yīng)用建設(shè):周期長、門檻高、多冗余、體驗(yàn)差C.組織流程:應(yīng)用跨部門,缺乏流程貫串和使能業(yè)務(wù)生產(chǎn)D.生態(tài)建設(shè):無法有效構(gòu)建和融入新的數(shù)字生態(tài)圈答案:ABCD17.#和#,它們把原數(shù)據(jù)變換或投影到較小的空間。A.小波變換B.中心化變換C.主成分分析D.對數(shù)變換答案:AC18.下列屬于傳統(tǒng)統(tǒng)計(jì)學(xué)展示方法的是()A.

5、柱狀圖B.餅狀圖C.曲線圖D.網(wǎng)絡(luò)圖答案:ABC19.數(shù)據(jù)工廠包括A.低能耗數(shù)據(jù)中心B.超大規(guī)模講分布式架構(gòu)C.新一代智能自動(dòng)化運(yùn)維D.超強(qiáng)云安全答案:ABCD20.數(shù)據(jù)變換的常用方法有#,#,#,#A.中心化變換B.極差規(guī)格化變換C.標(biāo)準(zhǔn)化變換D.對數(shù)變換答案:ABCD21.大數(shù)據(jù)在醫(yī)療中的應(yīng)用有()A.流行性疾病預(yù)防B.慢性病健康管理C.臨床決策支持D.醫(yī)療器械研發(fā)答案:ABCD22.可視化工具包括()A.ExcelB.Google ChartC.GephiD.ppt答案:ABC23.大數(shù)據(jù)時(shí)代預(yù)測人類移動(dòng)行為的數(shù)據(jù)來源有A.志愿者定位數(shù)據(jù)B.裝有導(dǎo)航設(shè)備的出租車軌跡數(shù)據(jù)C.手機(jī)終端定位于

6、通訊記錄D.社會(huì)網(wǎng)絡(luò)簽到數(shù)據(jù)答案:ABCD24.大數(shù)據(jù)帶來的挑戰(zhàn)有哪些( )。A.會(huì)導(dǎo)致數(shù)據(jù)盲點(diǎn)B.危及個(gè)人隱私C.造成群體歧視D.產(chǎn)生龐大能耗答案:ABCD25.傳感器工作模式類別包括()A.基于位置B.基于活動(dòng)C.基于設(shè)備答案:ABC26.去除噪聲使得數(shù)據(jù)光滑的技術(shù)主要有:A.分箱B.回歸C.離群點(diǎn)分析答案:ABC27.可使用#,#,#進(jìn)行光滑。A.最大值B.箱中位數(shù)C.箱邊界D.箱均值答案:BCD28.最常用的方式是企業(yè)自己搜集自己生產(chǎn)系統(tǒng)所產(chǎn)生的數(shù)據(jù),除生產(chǎn)系統(tǒng)的數(shù)據(jù)外,企業(yè)的信息系統(tǒng)還充斥著大量的()等。A.用戶行為數(shù)據(jù)B.日志式的活動(dòng)數(shù)據(jù)C.事件信息答案:ABC29.大數(shù)據(jù)存儲(chǔ)的特

7、點(diǎn)與挑戰(zhàn)有()A.容量問題B.延遲問題C.安全問題D.成本問題答案:ABCD30.統(tǒng)計(jì)圖表的可視化方法主要包括()A.散點(diǎn)圖B.折線圖C.條形圖D.餅圖答案:ABCD三、判斷題 (共 20 道試題,共 40 分)31.Spark的亮點(diǎn)是充分利用內(nèi)存承載工作集,而且能保證容錯(cuò)。答案:正確32.知識(shí)圖譜的構(gòu)建屬于大數(shù)據(jù)在社交網(wǎng)絡(luò)中的應(yīng)用答案:正確33.道路速度視圖顯示每條道路的速度模式答案:正確34.越來越多的企業(yè)通過架設(shè)海量數(shù)據(jù)采集系統(tǒng),多用于系統(tǒng)日志采集,這些工具均采用分布式架構(gòu),能滿足每秒數(shù)百兆的日志數(shù)據(jù)采集和傳輸需求。答案:正確35.Apriori算法掃描數(shù)據(jù)庫的次數(shù)等于最大頻繁項(xiàng)集的項(xiàng)數(shù)

8、。答案:正確36.數(shù)據(jù)倉庫中的元數(shù)據(jù)分為技術(shù)元數(shù)據(jù)和業(yè)務(wù)元數(shù)據(jù)答案:正確37.大數(shù)據(jù)數(shù)據(jù)量一定是PB,TB級的答案:錯(cuò)誤38.21世紀(jì)時(shí)數(shù)據(jù)信息大發(fā)展的時(shí)代,移動(dòng)互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)等極大拓寬了互聯(lián)網(wǎng)的邊界和應(yīng)用范圍,各種數(shù)據(jù)正在迅速膨脹并變大。答案:正確39.數(shù)據(jù)獲取方式分為主動(dòng)式獲取和被動(dòng)式獲取答案:正確40.數(shù)據(jù)存取和共享機(jī)制是大數(shù)據(jù)發(fā)展面臨的挑戰(zhàn)答案:正確41.發(fā)現(xiàn)滿足最小支持度閾值的所有項(xiàng)集,這些項(xiàng)集被稱為頻繁項(xiàng)集。答案:正確42.利用大數(shù)據(jù)技術(shù)對電子病歷中的數(shù)字化信息進(jìn)行分析處理,既能夠讓醫(yī)生的診療有跡可循,還可以發(fā)現(xiàn)最有效的臨床路徑,從而及時(shí)為醫(yī)生提供最佳的診療建議。答案:正

9、確43.數(shù)據(jù)清洗主要是刪除原始數(shù)據(jù)集中的無關(guān)數(shù)據(jù)、重復(fù)數(shù)據(jù),平滑噪聲數(shù)據(jù),篩選掉與挖掘主題無關(guān)的數(shù)據(jù),處理缺失值、異常值。答案:正確44.分類是在給定數(shù)據(jù)基礎(chǔ)上構(gòu)建分類函數(shù)或分類模型,將數(shù)據(jù)劃分到預(yù)定義的目標(biāo)類中的某一種類別。答案:正確45.大數(shù)據(jù)的挑戰(zhàn)僅僅來自于數(shù)據(jù)的增長。答案:錯(cuò)誤46.Excel采用插件的形式來實(shí)現(xiàn)數(shù)據(jù)挖掘功能,其數(shù)據(jù)挖掘插件主要包括Excel表分析工具和Excel數(shù)據(jù)挖掘客戶端答案:正確47.不同類型的大數(shù)據(jù)可以揭示一個(gè)區(qū)域或城市的活動(dòng)以及人口分布狀態(tài)( )答案:正確48.Paas:軟件即服務(wù)。它是一種通過Internet提供軟件的模式,用戶無需購買軟件,而是向提供商租用基于Web的軟

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論