網(wǎng)絡(luò)數(shù)據(jù)爬取與處理知到智慧樹章節(jié)測試課后答案2024年秋上海商學(xué)院_第1頁
網(wǎng)絡(luò)數(shù)據(jù)爬取與處理知到智慧樹章節(jié)測試課后答案2024年秋上海商學(xué)院_第2頁
網(wǎng)絡(luò)數(shù)據(jù)爬取與處理知到智慧樹章節(jié)測試課后答案2024年秋上海商學(xué)院_第3頁
網(wǎng)絡(luò)數(shù)據(jù)爬取與處理知到智慧樹章節(jié)測試課后答案2024年秋上海商學(xué)院_第4頁
網(wǎng)絡(luò)數(shù)據(jù)爬取與處理知到智慧樹章節(jié)測試課后答案2024年秋上海商學(xué)院_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

網(wǎng)絡(luò)數(shù)據(jù)爬取與處理知到智慧樹章節(jié)測試課后答案2024年秋上海商學(xué)院第一章單元測試

以下描述錯誤的是()。

A:Anaconda是一個開源的Python發(fā)行版本B:Jupyternotebook可通過Markdown語法編寫說明文檔C:Anaconda只提供了Jupyternotebook編程環(huán)境D:Jupyternotebook是一個基于網(wǎng)頁交互的編程環(huán)境

答案:Anaconda只提供了Jupyternotebook編程環(huán)境以下描述錯誤的是(C)。

以下哪一項不屬于數(shù)據(jù)科學(xué)的基本任務(wù)()。

A:處理數(shù)據(jù)B:獲取數(shù)據(jù)C:存儲數(shù)據(jù)D:分析數(shù)據(jù)

答案:存儲數(shù)據(jù)以下關(guān)于數(shù)據(jù)科學(xué)的說法中,正確的是()。

A:數(shù)據(jù)科學(xué)就是研究數(shù)學(xué)的科學(xué)B:數(shù)據(jù)科學(xué)只適用于科學(xué)研究,對我們?nèi)粘I顩]有關(guān)系C:計算工具的革新,數(shù)據(jù)量的持續(xù)增長推動了數(shù)據(jù)科學(xué)的發(fā)展。D:對大數(shù)據(jù)的采集就是數(shù)據(jù)科學(xué)

答案:計算工具的革新,數(shù)據(jù)量的持續(xù)增長推動了數(shù)據(jù)科學(xué)的發(fā)展。智能健康手環(huán)的運用了以下哪一項數(shù)據(jù)采集技術(shù)()。

A:統(tǒng)計報表B:網(wǎng)絡(luò)爬蟲C:API接口D:傳感器

答案:傳感器下列關(guān)于大數(shù)據(jù)特點的說法中,錯誤的是().

A:數(shù)據(jù)價值密度高。B:數(shù)據(jù)類型多樣C:數(shù)據(jù)規(guī)模大D:數(shù)據(jù)生成和處理速度快

答案:數(shù)據(jù)價值密度高。

第二章單元測試

下列選項哪不是爬蟲程序的常見類型()。

A:聚焦網(wǎng)絡(luò)爬蟲B:通用網(wǎng)絡(luò)爬蟲C:增量式網(wǎng)絡(luò)爬蟲D:深層式網(wǎng)絡(luò)爬蟲

答案:深層式網(wǎng)絡(luò)爬蟲以下關(guān)于實現(xiàn)網(wǎng)絡(luò)爬蟲程序的描述中,錯誤的是()。

A:通過Python編寫網(wǎng)絡(luò)爬蟲程序,本質(zhì)上是模擬人類瀏覽網(wǎng)頁的行為B:編寫爬蟲程序前,可以使用瀏覽器自帶的開發(fā)者工具,對我們發(fā)出的請求和接受到的響應(yīng)進行分析C:通過爬蟲程序獲取的數(shù)據(jù)文件均為HTML文件D:網(wǎng)絡(luò)爬蟲是自動獲取互聯(lián)網(wǎng)上公開數(shù)據(jù)的程序

答案:通過爬蟲程序獲取的數(shù)據(jù)文件均為HTML文件通過瀏覽器訪問網(wǎng)站服務(wù)器的過程,描述錯誤的是()。

A:參與對象包:括瀏覽器、域名解析服務(wù)器、網(wǎng)站服務(wù)器B:HTTP協(xié)議規(guī)范了請求與響應(yīng)的過程C:TCP協(xié)議規(guī)范了超文本標(biāo)記語言的語法格式D:互聯(lián)網(wǎng)上公開數(shù)據(jù)的地址是由URL協(xié)議規(guī)范

答案:TCP協(xié)議規(guī)范了超文本標(biāo)記語言的語法格式下列不屬于常用反爬蟲手段的是()。

A:驗證碼校驗B:限制訪問頻率C:對請求頭的檢測D:人工篩查

答案:人工篩查以下關(guān)于爬蟲程序的描述中,正確的是()。

A:爬蟲程序可以爬取互聯(lián)網(wǎng)上任意數(shù)據(jù)B:通過爬蟲程序獲取的數(shù)據(jù)可用于商業(yè)用途C:通過爬蟲程序獲取的數(shù)據(jù)可在互聯(lián)網(wǎng)上公開D:爬蟲程序執(zhí)行時應(yīng)避免對服務(wù)器造成過載

答案:爬蟲程序執(zhí)行時應(yīng)避免對服務(wù)器造成過載

第三章單元測試

以下關(guān)于re庫的描述中,錯誤的是()。

A:可re庫提取HTML文檔中的數(shù)據(jù)B:可通過re庫實現(xiàn)字符串的正則表達式匹配C:re庫是Python的第三方庫D:re.findall()方法返回的數(shù)據(jù)類型為列表

答案:re庫是Python的第三方庫?正則表達式中能夠匹前面的字符或子表達式1次或多次的符號是()。

A:*B:?C:|D:+

答案:+?以下不能夠匹配任意數(shù)字字符的正則表達式的是()。

A:[0-9]B:\dC:[0123456789]D:{0123456789}

答案:{0123456789}執(zhí)行以下程序輸出的結(jié)果是(D)。

importre

s='ABC123abc456'

a=re.findall('[A-Za-z]{2}',s)

print()

A:['AB','ab']B:['BC']C:['ABC']D:['AB']

答案:['AB']執(zhí)行以下程序輸出的結(jié)果是(B)。

importre

s='Bob:12+Alex:23+Emily:33'

a=re.findall('\+*(.+?)\+',s)

print()

A:['Bob:12+','Alex:23+']B:['Alex:23']C:['Bob:12','Alex:23']D:['Bob:12','Alex:23','Emily:33',]

答案:['Bob:12','Alex:23','Emily:33',]

第四章單元測試

HTML是整個網(wǎng)頁的結(jié)構(gòu),相當(dāng)于整個網(wǎng)站的框架。帶“<”、“>”符號的都是屬于HTML的標(biāo)簽,并且標(biāo)簽都是成對出現(xiàn)的。下列說法中,錯誤的是()。

A:有的標(biāo)記附標(biāo)簽是可以帶有屬性參數(shù),表示為<標(biāo)記屬性="參數(shù)值">B:<img>..</img>表示該標(biāo)簽是標(biāo)題C:<html>..</html>表示標(biāo)記中間的元素是網(wǎng)頁D:表示超鏈接標(biāo)簽

答案:<img>..</img>表示該標(biāo)簽是標(biāo)題下列關(guān)于BeautifulSoup中對象類型描述錯誤的是()。

A:name屬性可獲取標(biāo)簽名B:attrs屬性可獲取標(biāo)簽的屬性C:string屬性可獲取標(biāo)簽的id屬性D:NavigableString屬性可獲取標(biāo)簽內(nèi)非屬性字符串

答案:string屬性可獲取標(biāo)簽的id屬性執(zhí)行以下程序輸出的結(jié)果是()。

frombs4importBeautifulSoup

html='<html><pclass="story">ss<aid="name1">Alice</a></p><aid="name2">Amy</a></html>'

soup=BeautifulSoup(html,'html.parser')

print(soup.a.string)

A:AliceAmyB:AmyC:ssD:Alice

答案:Alice執(zhí)行以下程序輸出的結(jié)果是()。

frombs4importBeautifulSoup

html='<html><pclass="story">ss<aid="name1">Alice</a></p><aid="name2">Amy</a></html>'

soup=BeautifulSoup(html,'html.parser')

soup.find_all(name='a',id='name2')

A:[<aid="name1">Alice</a>]B:[<aid="name1">Alice</a>,<aid="name2">Amy</a>]C:[<pclass="story">ss<aid="name1">Alice</a></p>]D:[<aid="name2">Amy</a>]

答案:[<aid="name2">Amy</a>]執(zhí)行以下程序輸出的結(jié)果是()。

frombs4importBeautifulSoup

html='<html><pclass="story">ss<aid="name1">Alice</a></p><aid="name2">Amy</a></html>'

soup=BeautifulSoup(html,'html.parser')

soup.select('p~a')

A:[<pclass="story">ss<aid="name1">Alice</a></p>]B:[<aid="name1">Alice</a>]C:[<aid="name2">Amy</a>]D:[<aid="name1">Alice</a>,<aid="name2">Amy</a>]

答案:[<aid="name2">Amy</a>]

第五章單元測試

以下關(guān)于JSON模塊描述錯誤的是()。

A:json.loads()只只能將json字符串解析為字典B:json.dumps()能夠?qū)⒁粋€Python數(shù)據(jù)類型編碼為json字符串C:JSON模塊可對JSON數(shù)據(jù)進行解析與編碼D:json.loads()能夠?qū)son字符串解析為Python數(shù)據(jù)類型

答案:json.loads()只只能將json字符串解析為字典以下關(guān)于json數(shù)據(jù)的描述中,錯誤的是()

A:JSON是非常利于人閱讀,但是不太利于機器解析和生成的。B:JSON數(shù)據(jù)非常簡潔,層次結(jié)構(gòu)非常清晰C:JSON是以文本格式來存儲和表示D:JSON是一種輕量級的數(shù)據(jù)交換格式

答案:JSON是非常利于人閱讀,但是不太利于機器解析和生成的。表單登陸需要使用的請求方法是()

A:DELETEB:PUTC:GETD:POST

答案:POST以下關(guān)于Ajax技術(shù)描述錯誤的是()

A:Ajax可以在不刷新整個頁面的情況下,對網(wǎng)頁進行部分更新B:瀏覽器通過Ajax向服務(wù)器發(fā)送請求的類型為XMLHttpC:網(wǎng)絡(luò)爬蟲程序不能從采用Ajax技術(shù)的網(wǎng)頁中爬取數(shù)據(jù)D:Ajax通過JavaScript發(fā)送請求、解析數(shù)據(jù)、渲染網(wǎng)頁

答案:網(wǎng)絡(luò)爬蟲程序不能從采用Ajax技術(shù)的網(wǎng)頁中爬取數(shù)據(jù)以下描述錯誤的是()

A:可通過CSS設(shè)置網(wǎng)頁的樣式B:可通過Ajax可實現(xiàn)網(wǎng)頁的靜態(tài)加載C:可通過HTML語言定義網(wǎng)頁結(jié)構(gòu)D:可通過javascript可控制網(wǎng)頁的動態(tài)功能

答案:可通過Ajax可實現(xiàn)網(wǎng)頁的靜態(tài)加載

第六章單元測試

Pandas提供的數(shù)據(jù)類型中,以下哪一項是帶索引的一維數(shù)組()。

A:DataFrameB:SeriesC:ArrayD:Panel

答案:Series執(zhí)行以下程序輸出的結(jié)果是()。

importpandasaspd

s=pd.Series([3,5,6,7,9],index=['a','b','c','d','e'])

print(list(s[2:4]))

A:[5,6,7]B:[6,7,9]C:[6,7]D:[5,6]

答案:[6,7]執(zhí)行以下程序輸出的結(jié)果是()。

importpandasaspd

s1=pd.Series([3,5,6,7,9])

s2=pd.Series([1,2,3,4,1])

print((s1+s2).sum())

A:4B:[3,5,6,7,9,1,2,3,4,1]C:[4,7,9,11,10]D:41

答案:41執(zhí)行以下程序輸出的結(jié)果是(A)。

importpandasaspd

d={'one':[1,3,5,7],'two':[2,4,6,8]}

df=pd.DataFrame()

df['three']=df['two']-df['one']

df.drop(2)

print(df)

A:B:C:D:

答案:執(zhí)行以下程序輸出的結(jié)果是(A)。

importpandasaspd

d={'one':[1,3,5,7],'two':[2,4,6,8]}

df=pd.DataFrame()

df['three']=df['two']-df['one']

print(df[(df.one>3)&(df.two<8)])

A:B:C:D:

答案:

第七章單元測試

關(guān)于pandas的merge方法描述錯誤的是()。

A:merge方法可以將兩個dataframe在任意列上對齊連接B:merge方法可以將兩個dataframe在名稱不同的列上對齊連接C:merge方法默認(rèn)執(zhí)行內(nèi)連接D:merge方法可以將兩個dataframe在行索引上對齊連接

答案:merge方法可以將兩個dataframe在行索引上對齊連接關(guān)于pandas的concat方法描述錯誤的是()。

A:concat方法可以將兩個dataframe在列索引上對齊連接B:concat方法可以將兩個dataframe在行索引上對齊連接C:concat方法可以將兩個dataframe在任意列上對齊連接D:concat方法可以將兩個series在行索引上對齊連接

答案:concat方法可以將兩個dataframe在任意列上對齊連接變量df1與df3的值如下圖所示,執(zhí)行以下程序后,變量df的值為()。

df=pd.concat([df1,df3],axis=1,join='inner')

A:B:報錯C:D:

答案:變量df1與df2的值如下圖所示,執(zhí)行以下程序后,變量df的值為()。

df=pd.merge(df1,df2,on=['key1','key2'],how='left')

A:B:C:D:

答案:變量df1與df2的值如下圖所示,執(zhí)行以下程序后,變量df的值為()。

df=pd.merge(df1,df2,on=['key1','key2'],how='right')

A:B:C:D:

答案:

第八章單元測試

以下描述錯誤的是()。

A:可通過groupby方法對dataframe進行分組聚合變換B:可通過pandas庫的read_csv方法將文本文件讀入dataframeC:apply方法可將函數(shù)功能應(yīng)用到dataframe上的每一個元素D:可通過pandas庫的to_csv方法將dataframe寫入文本文件

答案:apply方法可將函數(shù)功能應(yīng)用到dataframe上的每一個元素以下關(guān)于缺失值的處理描述錯誤的是()。

A:通過dataframe的dropna()方法可查刪除缺失值B:對于dataframe中具有缺失值的行可以進行刪除或填充處理C:通過dataframe的isnull()方法可直接查詢到每一列缺失值的個數(shù)D:通過dataframe的fillna()方法可填充缺失值

答案:通過dataframe的isnull()方法可直接查詢到每一列缺失值的個數(shù)變量df的值如圖所示,執(zhí)行以下代碼后輸出的結(jié)果是()。

print(df.isnull().sum().sum())

A:B:C:7D:3

答案:7變量df的值如圖所示,執(zhí)行以下代碼后返回的結(jié)果是()。

df.dropna(thresh=3)

A:B:C:D:

答案:變量df的值如圖所示,執(zhí)行以下代碼后返回的結(jié)果是()。

df.dr

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論