大數(shù)據(jù)采集與存儲(chǔ)智慧樹知到答案章節(jié)測(cè)試2023年山東交通學(xué)院_第1頁
大數(shù)據(jù)采集與存儲(chǔ)智慧樹知到答案章節(jié)測(cè)試2023年山東交通學(xué)院_第2頁
大數(shù)據(jù)采集與存儲(chǔ)智慧樹知到答案章節(jié)測(cè)試2023年山東交通學(xué)院_第3頁
免費(fèi)預(yù)覽已結(jié)束,剩余4頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一章測(cè)試關(guān)系模式學(xué)生信息(學(xué)號(hào),姓名,年齡,性別,籍貫),其中的主鍵是()

A:性別

B:年齡

C:學(xué)號(hào)

D:姓名

答案:COracle是一個(gè)開源、免費(fèi)的中小型關(guān)系型數(shù)據(jù)庫管理系統(tǒng)。()

A:對(duì)

B:錯(cuò)

答案:BNoSQL的全稱是()

A:其余選項(xiàng)都不是

B:NotOnlySql

C:NoSql

D:NotSql

答案:B鍵值數(shù)據(jù)庫,是基于key-value模式,它使用簡單的鍵值方法來存儲(chǔ)數(shù)據(jù)。()

A:對(duì)

B:錯(cuò)

答案:A()是最原始的SQLOnHadoop的解決方案,它是基于Hadoop實(shí)現(xiàn)的分布式數(shù)據(jù)倉庫。

A:ZooKeeper

B:Hbase

C:Hadoop

D:Hive

答案:D圖數(shù)據(jù)庫,以“圖”數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)和查詢數(shù)據(jù),使用節(jié)點(diǎn)表示數(shù)據(jù)模型中的實(shí)體,節(jié)點(diǎn)之間的邊表示實(shí)體之間的關(guān)系。()

A:對(duì)

B:錯(cuò)

答案:A第二章測(cè)試關(guān)于數(shù)據(jù)模型,下列說法正確的是()。

A:數(shù)據(jù)操作是對(duì)數(shù)據(jù)庫靜態(tài)特性的描述。

B:3種基本數(shù)據(jù)模型有圖形模型、層次模型和關(guān)系模型

C:數(shù)據(jù)模型是對(duì)數(shù)據(jù)庫動(dòng)態(tài)特性的描述。

D:數(shù)據(jù)模型的三要素是數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)操作和數(shù)據(jù)完整性約束

答案:D關(guān)于學(xué)生關(guān)系,下列哪一個(gè)屬性適合作為候選碼()。

A:班級(jí)

B:學(xué)號(hào)。

C:性別

D:年齡。

答案:B有學(xué)生表Student(S#char(8),Snamechar(10),Ssexchar(2),Sageinteger,D#char(2),Sclasschar(6))。要檢索學(xué)生表中“所有年齡小于等于19歲的學(xué)生的年齡及姓名”,SQL語句正確的是()

A:Select*FromStudentWhereSage<=19

B:SelectSnameFromStudentWhereSage<=19

C:SelectSage,SnameFromStudentWhereSage<=19

D:SelectSage,SnameFromStudent

答案:C有學(xué)生表Student(S#char(8),Snamechar(10),Ssexchar(2),Sageinteger,D#char(2),Sclasschar(6))。若要“檢索名字為姓張的所有同學(xué)姓名”,SQL語句正確的是()

A:SelectSnameFromStudentWhereSnameLike‘張%’

B:SelectSnameFromStudentWhereSnameLike‘張_’

C:SelectSnameFromStudentWhereSnameLike’張_’

D:SelectSnameFromStudentWhereSnameNotLike’張_’

答案:ASQL語言中,刪除一個(gè)表的命令是()

A:DROP

B:CLEAR

C:REMOVE

D:DELETE

答案:A在下列關(guān)于視圖的敘述中,正確的是()

A:當(dāng)某一視圖刪除后,由該視圖導(dǎo)出的其它視圖也將自動(dòng)刪除;

B:若導(dǎo)出某視圖的基本表被刪除,該視圖將不受任何影響;

C:視圖—旦建立,就不能被刪除;

D:當(dāng)修改某一視圖時(shí),導(dǎo)出該視圖的基本表也隨之修改。

答案:D查詢時(shí),若要輸出無重復(fù)的記錄,SELECT子句中使用的保留字是:()

A:TOPN

B:ALL

C:TOPNPERCENT

D:DISTINCT

答案:D查詢結(jié)果輸出時(shí)要求按“總評(píng)成績”降序排列,相同者按“性別”升序,正確的子句是()

A:ORDERBY總評(píng)成績ASC,性別DESC

B:ORDERBY總評(píng)成績DESC,性別DESC

C:ORDERBY總評(píng)成績,性別DESC

D:ORDERBY總評(píng)成績DESC,性別

答案:D參照完整性規(guī)則是指表的()必須是另一個(gè)表主鍵的有效值,或者是空值。

A:主鍵

B:外鍵

C:候選鍵

D:主屬性

答案:B下面有關(guān)HAVING子句,說法不正確的是()

A:使用HAVING子句的同時(shí)不能使用WHERE子句

B:使用HAVING子句的同時(shí)可以使用WHERE子句

C:使用HAVING子句的作用是過濾掉不滿足條件的分組

D:HAVING子句必須與GROUPBY子句同時(shí)使用,不能單獨(dú)使用

答案:A第三章測(cè)試MongoDB是一個(gè)開源、高性能、無模式的文檔型數(shù)據(jù)庫。()

A:對(duì)

B:錯(cuò)

答案:AMongoDB通過()來描述和存放數(shù)據(jù)。

A:BSON

B:JSON

C:XML

答案:A查看當(dāng)前正在使用的數(shù)據(jù)庫命令()

A:db

B:use

C:get

D:set

答案:A查找kate同學(xué)的專業(yè),使用指令()完成。

答案:AMongoDB中,用戶可以將_id字段上的索引刪除。()

A:對(duì)

B:錯(cuò)

答案:B關(guān)系型數(shù)據(jù)庫遵循BASE和CAP理論。()

A:錯(cuò)

B:對(duì)

答案:A第四章測(cè)試大數(shù)據(jù)采集,又稱大數(shù)據(jù)獲取,是指從()等獲取數(shù)據(jù)的過程。

A:傳感器

B:企業(yè)系統(tǒng)

C:其它智能設(shè)備

D:社交網(wǎng)絡(luò)

答案:ABCD網(wǎng)絡(luò)爬蟲的步驟是1)選取一部分種子URL;2)從待抓取URL隊(duì)列中取出待抓取的URL,解析DNS,得到主機(jī)的IP地址,并將URL對(duì)應(yīng)的網(wǎng)頁下載下來,存儲(chǔ)到已下載網(wǎng)頁庫中。此外,將這些URL放進(jìn)已抓取URL隊(duì)列;3)將這些URL放到待抓取URL中;4)分析已抓取URL隊(duì)列中的URL,分析其中的其他URL,并且將這些URL放入待抓取URL隊(duì)列,從而進(jìn)入下一個(gè)循環(huán)。()

A:2)4)1)3)

B:1)3)2)4)

C:2)3)4)1)

D:1)2)3)4)

答案:B數(shù)據(jù)完整性指的是數(shù)據(jù)具有一個(gè)實(shí)體描述的所有必需的部分。()

A:對(duì)

B:錯(cuò)

答案:A在大數(shù)據(jù)預(yù)處理中,需要數(shù)據(jù)清洗的主要類型包括以下幾類()

A:異常值數(shù)據(jù)

B:重復(fù)值數(shù)據(jù)

C:需要標(biāo)準(zhǔn)化的數(shù)據(jù)

D:缺失值數(shù)據(jù)

答案:ABD數(shù)據(jù)清洗時(shí)重復(fù)值數(shù)據(jù)不能夠刪除。()

A:對(duì)

B:錯(cuò)

答案:B在數(shù)據(jù)離散化中,常見的離散化方法有()

A:基于卡方分箱的方法

B:基于熵的離散化

C:等頻劃分

D:聚類劃分

E:等寬劃分

答案:ABCDE第五章測(cè)試爬蟲就是能夠?qū)崿F(xiàn)網(wǎng)頁數(shù)據(jù)爬取的程序。()

A:錯(cuò)

B:對(duì)

答案:BPython中提供的requests庫的get()方法能夠?qū)崿F(xiàn)爬取網(wǎng)頁信息的功能。()

A:錯(cuò)

B:對(duì)

答案:B在使用requests庫獲取網(wǎng)頁資源過程中,最重要的兩個(gè)對(duì)象就是Request和Response,()負(fù)責(zé)將客戶端的請(qǐng)求發(fā)送給服務(wù)器。

A:Response

B:Request

答案:BHTML語言使用“標(biāo)簽對(duì)”來標(biāo)記信息。其中,<html>……</html>標(biāo)記一個(gè)HTML文件中標(biāo)題的開始和結(jié)束。()

A:對(duì)

B:錯(cuò)

答案:B以下程序段的運(yùn)行結(jié)果是frombs4importBeautifulSouphtmlText=‘<p>解析頁面</p>’soup=BeautifulSoup(htmlText,’html.parser’)print(soup.p)()

答案:B如果有網(wǎng)絡(luò)爬蟲頻繁的訪問服務(wù)器,則容易引發(fā)()問題。

A:個(gè)人隱私問題

B:網(wǎng)站的性能下降

C:法律風(fēng)險(xiǎn)

答案:B任何網(wǎng)站都有自己的Robots協(xié)議,用來保護(hù)網(wǎng)站的信息不會(huì)被惡意訪問。()

A:對(duì)

B:錯(cuò)

答案:B第六章測(cè)試Kettle是一種常用的ETL工具,它支持圖形化的GUI設(shè)計(jì)界面。()

A:對(duì)

B:錯(cuò)

答案:A在數(shù)據(jù)清洗中,“輸入”功能主要是實(shí)現(xiàn)ETL的數(shù)據(jù)抽取、加載、格式轉(zhuǎn)換。()

A:對(duì)

B:錯(cuò)

答案:BKettle能夠支持多種格式的數(shù)據(jù)輸出,但不支持下面()文件格式。

A:excel

B:txt

C:word

D:json

E:MySql數(shù)據(jù)庫

答案:Ckettle中的以下組件中,屬于基本數(shù)據(jù)清洗的是()

A:連接字段

B:數(shù)據(jù)替換

C:數(shù)據(jù)排序

D:刪除數(shù)據(jù)

答案:ABCDKettle讓我們?cè)诳梢暬慕缑嬷?,通過拖拽實(shí)現(xiàn)數(shù)據(jù)處理。無需掌握復(fù)雜的編程技術(shù)也可以幫助我們完成數(shù)據(jù)的ETL處理。()

A:對(duì)

B:錯(cuò)

答案:AKettle中的job作業(yè)是指定時(shí)完成一系列指定的數(shù)據(jù)轉(zhuǎn)換,并將結(jié)果以郵件的方式告知給我們。()

A:對(duì)

B:錯(cuò)

答案:A第七章測(cè)試在本案例中,數(shù)據(jù)采集是通過()獲取。

A:傳感器數(shù)據(jù)

B:網(wǎng)絡(luò)爬蟲

C:企業(yè)管理系統(tǒng)

D:社交網(wǎng)絡(luò)

答案:B在數(shù)據(jù)采集后,python中使用()庫把數(shù)據(jù)存儲(chǔ)到csv文件中。

A:pandas庫

B:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論