版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
網(wǎng)絡(luò)數(shù)據(jù)爬取與處理知到智慧樹章節(jié)測試課后答案2024年秋上海商學(xué)院第一章單元測試
以下描述錯誤的是()。
A:Anaconda是一個開源的Python發(fā)行版本B:Jupyternotebook可通過Markdown語法編寫說明文檔C:Anaconda只提供了Jupyternotebook編程環(huán)境D:Jupyternotebook是一個基于網(wǎng)頁交互的編程環(huán)境
答案:Anaconda只提供了Jupyternotebook編程環(huán)境以下描述錯誤的是(C)。
以下哪一項不屬于數(shù)據(jù)科學(xué)的基本任務(wù)()。
A:處理數(shù)據(jù)B:獲取數(shù)據(jù)C:存儲數(shù)據(jù)D:分析數(shù)據(jù)
答案:存儲數(shù)據(jù)以下關(guān)于數(shù)據(jù)科學(xué)的說法中,正確的是()。
A:數(shù)據(jù)科學(xué)就是研究數(shù)學(xué)的科學(xué)B:數(shù)據(jù)科學(xué)只適用于科學(xué)研究,對我們?nèi)粘I顩]有關(guān)系C:計算工具的革新,數(shù)據(jù)量的持續(xù)增長推動了數(shù)據(jù)科學(xué)的發(fā)展。D:對大數(shù)據(jù)的采集就是數(shù)據(jù)科學(xué)
答案:計算工具的革新,數(shù)據(jù)量的持續(xù)增長推動了數(shù)據(jù)科學(xué)的發(fā)展。智能健康手環(huán)的運用了以下哪一項數(shù)據(jù)采集技術(shù)()。
A:統(tǒng)計報表B:網(wǎng)絡(luò)爬蟲C:API接口D:傳感器
答案:傳感器下列關(guān)于大數(shù)據(jù)特點的說法中,錯誤的是().
A:數(shù)據(jù)價值密度高。B:數(shù)據(jù)類型多樣C:數(shù)據(jù)規(guī)模大D:數(shù)據(jù)生成和處理速度快
答案:數(shù)據(jù)價值密度高。
第二章單元測試
下列選項哪不是爬蟲程序的常見類型()。
A:聚焦網(wǎng)絡(luò)爬蟲B:通用網(wǎng)絡(luò)爬蟲C:增量式網(wǎng)絡(luò)爬蟲D:深層式網(wǎng)絡(luò)爬蟲
答案:深層式網(wǎng)絡(luò)爬蟲以下關(guān)于實現(xiàn)網(wǎng)絡(luò)爬蟲程序的描述中,錯誤的是()。
A:通過Python編寫網(wǎng)絡(luò)爬蟲程序,本質(zhì)上是模擬人類瀏覽網(wǎng)頁的行為B:編寫爬蟲程序前,可以使用瀏覽器自帶的開發(fā)者工具,對我們發(fā)出的請求和接受到的響應(yīng)進行分析C:通過爬蟲程序獲取的數(shù)據(jù)文件均為HTML文件D:網(wǎng)絡(luò)爬蟲是自動獲取互聯(lián)網(wǎng)上公開數(shù)據(jù)的程序
答案:通過爬蟲程序獲取的數(shù)據(jù)文件均為HTML文件通過瀏覽器訪問網(wǎng)站服務(wù)器的過程,描述錯誤的是()。
A:參與對象包:括瀏覽器、域名解析服務(wù)器、網(wǎng)站服務(wù)器B:HTTP協(xié)議規(guī)范了請求與響應(yīng)的過程C:TCP協(xié)議規(guī)范了超文本標(biāo)記語言的語法格式D:互聯(lián)網(wǎng)上公開數(shù)據(jù)的地址是由URL協(xié)議規(guī)范
答案:TCP協(xié)議規(guī)范了超文本標(biāo)記語言的語法格式下列不屬于常用反爬蟲手段的是()。
A:驗證碼校驗B:限制訪問頻率C:對請求頭的檢測D:人工篩查
答案:人工篩查以下關(guān)于爬蟲程序的描述中,正確的是()。
A:爬蟲程序可以爬取互聯(lián)網(wǎng)上任意數(shù)據(jù)B:通過爬蟲程序獲取的數(shù)據(jù)可用于商業(yè)用途C:通過爬蟲程序獲取的數(shù)據(jù)可在互聯(lián)網(wǎng)上公開D:爬蟲程序執(zhí)行時應(yīng)避免對服務(wù)器造成過載
答案:爬蟲程序執(zhí)行時應(yīng)避免對服務(wù)器造成過載
第三章單元測試
以下關(guān)于re庫的描述中,錯誤的是()。
A:可re庫提取HTML文檔中的數(shù)據(jù)B:可通過re庫實現(xiàn)字符串的正則表達式匹配C:re庫是Python的第三方庫D:re.findall()方法返回的數(shù)據(jù)類型為列表
答案:re庫是Python的第三方庫?正則表達式中能夠匹前面的字符或子表達式1次或多次的符號是()。
A:*B:?C:|D:+
答案:+?以下不能夠匹配任意數(shù)字字符的正則表達式的是()。
A:[0-9]B:\dC:[0123456789]D:{0123456789}
答案:{0123456789}執(zhí)行以下程序輸出的結(jié)果是(D)。
importre
s='ABC123abc456'
a=re.findall('[A-Za-z]{2}',s)
print()
A:['AB','ab']B:['BC']C:['ABC']D:['AB']
答案:['AB']執(zhí)行以下程序輸出的結(jié)果是(B)。
importre
s='Bob:12+Alex:23+Emily:33'
a=re.findall('\+*(.+?)\+',s)
print()
A:['Bob:12+','Alex:23+']B:['Alex:23']C:['Bob:12','Alex:23']D:['Bob:12','Alex:23','Emily:33',]
答案:['Bob:12','Alex:23','Emily:33',]
第四章單元測試
HTML是整個網(wǎng)頁的結(jié)構(gòu),相當(dāng)于整個網(wǎng)站的框架。帶“<”、“>”符號的都是屬于HTML的標(biāo)簽,并且標(biāo)簽都是成對出現(xiàn)的。下列說法中,錯誤的是()。
A:有的標(biāo)記附標(biāo)簽是可以帶有屬性參數(shù),表示為<標(biāo)記屬性="參數(shù)值">B:<img>..</img>表示該標(biāo)簽是標(biāo)題C:<html>..</html>表示標(biāo)記中間的元素是網(wǎng)頁D:表示超鏈接標(biāo)簽
答案:<img>..</img>表示該標(biāo)簽是標(biāo)題下列關(guān)于BeautifulSoup中對象類型描述錯誤的是()。
A:name屬性可獲取標(biāo)簽名B:attrs屬性可獲取標(biāo)簽的屬性C:string屬性可獲取標(biāo)簽的id屬性D:NavigableString屬性可獲取標(biāo)簽內(nèi)非屬性字符串
答案:string屬性可獲取標(biāo)簽的id屬性執(zhí)行以下程序輸出的結(jié)果是()。
frombs4importBeautifulSoup
html='<html><pclass="story">ss<aid="name1">Alice</a></p><aid="name2">Amy</a></html>'
soup=BeautifulSoup(html,'html.parser')
print(soup.a.string)
A:AliceAmyB:AmyC:ssD:Alice
答案:Alice執(zhí)行以下程序輸出的結(jié)果是()。
frombs4importBeautifulSoup
html='<html><pclass="story">ss<aid="name1">Alice</a></p><aid="name2">Amy</a></html>'
soup=BeautifulSoup(html,'html.parser')
soup.find_all(name='a',id='name2')
A:[<aid="name1">Alice</a>]B:[<aid="name1">Alice</a>,<aid="name2">Amy</a>]C:[<pclass="story">ss<aid="name1">Alice</a></p>]D:[<aid="name2">Amy</a>]
答案:[<aid="name2">Amy</a>]執(zhí)行以下程序輸出的結(jié)果是()。
frombs4importBeautifulSoup
html='<html><pclass="story">ss<aid="name1">Alice</a></p><aid="name2">Amy</a></html>'
soup=BeautifulSoup(html,'html.parser')
soup.select('p~a')
A:[<pclass="story">ss<aid="name1">Alice</a></p>]B:[<aid="name1">Alice</a>]C:[<aid="name2">Amy</a>]D:[<aid="name1">Alice</a>,<aid="name2">Amy</a>]
答案:[<aid="name2">Amy</a>]
第五章單元測試
以下關(guān)于JSON模塊描述錯誤的是()。
A:json.loads()只只能將json字符串解析為字典B:json.dumps()能夠?qū)⒁粋€Python數(shù)據(jù)類型編碼為json字符串C:JSON模塊可對JSON數(shù)據(jù)進行解析與編碼D:json.loads()能夠?qū)son字符串解析為Python數(shù)據(jù)類型
答案:json.loads()只只能將json字符串解析為字典以下關(guān)于json數(shù)據(jù)的描述中,錯誤的是()
A:JSON是非常利于人閱讀,但是不太利于機器解析和生成的。B:JSON數(shù)據(jù)非常簡潔,層次結(jié)構(gòu)非常清晰C:JSON是以文本格式來存儲和表示D:JSON是一種輕量級的數(shù)據(jù)交換格式
答案:JSON是非常利于人閱讀,但是不太利于機器解析和生成的。表單登陸需要使用的請求方法是()
A:DELETEB:PUTC:GETD:POST
答案:POST以下關(guān)于Ajax技術(shù)描述錯誤的是()
A:Ajax可以在不刷新整個頁面的情況下,對網(wǎng)頁進行部分更新B:瀏覽器通過Ajax向服務(wù)器發(fā)送請求的類型為XMLHttpC:網(wǎng)絡(luò)爬蟲程序不能從采用Ajax技術(shù)的網(wǎng)頁中爬取數(shù)據(jù)D:Ajax通過JavaScript發(fā)送請求、解析數(shù)據(jù)、渲染網(wǎng)頁
答案:網(wǎng)絡(luò)爬蟲程序不能從采用Ajax技術(shù)的網(wǎng)頁中爬取數(shù)據(jù)以下描述錯誤的是()
A:可通過CSS設(shè)置網(wǎng)頁的樣式B:可通過Ajax可實現(xiàn)網(wǎng)頁的靜態(tài)加載C:可通過HTML語言定義網(wǎng)頁結(jié)構(gòu)D:可通過javascript可控制網(wǎng)頁的動態(tài)功能
答案:可通過Ajax可實現(xiàn)網(wǎng)頁的靜態(tài)加載
第六章單元測試
Pandas提供的數(shù)據(jù)類型中,以下哪一項是帶索引的一維數(shù)組()。
A:DataFrameB:SeriesC:ArrayD:Panel
答案:Series執(zhí)行以下程序輸出的結(jié)果是()。
importpandasaspd
s=pd.Series([3,5,6,7,9],index=['a','b','c','d','e'])
print(list(s[2:4]))
A:[5,6,7]B:[6,7,9]C:[6,7]D:[5,6]
答案:[6,7]執(zhí)行以下程序輸出的結(jié)果是()。
importpandasaspd
s1=pd.Series([3,5,6,7,9])
s2=pd.Series([1,2,3,4,1])
print((s1+s2).sum())
A:4B:[3,5,6,7,9,1,2,3,4,1]C:[4,7,9,11,10]D:41
答案:41執(zhí)行以下程序輸出的結(jié)果是(A)。
importpandasaspd
d={'one':[1,3,5,7],'two':[2,4,6,8]}
df=pd.DataFrame()
df['three']=df['two']-df['one']
df.drop(2)
print(df)
A:B:C:D:
答案:執(zhí)行以下程序輸出的結(jié)果是(A)。
importpandasaspd
d={'one':[1,3,5,7],'two':[2,4,6,8]}
df=pd.DataFrame()
df['three']=df['two']-df['one']
print(df[(df.one>3)&(df.two<8)])
A:B:C:D:
答案:
第七章單元測試
關(guān)于pandas的merge方法描述錯誤的是()。
A:merge方法可以將兩個dataframe在任意列上對齊連接B:merge方法可以將兩個dataframe在名稱不同的列上對齊連接C:merge方法默認(rèn)執(zhí)行內(nèi)連接D:merge方法可以將兩個dataframe在行索引上對齊連接
答案:merge方法可以將兩個dataframe在行索引上對齊連接關(guān)于pandas的concat方法描述錯誤的是()。
A:concat方法可以將兩個dataframe在列索引上對齊連接B:concat方法可以將兩個dataframe在行索引上對齊連接C:concat方法可以將兩個dataframe在任意列上對齊連接D:concat方法可以將兩個series在行索引上對齊連接
答案:concat方法可以將兩個dataframe在任意列上對齊連接變量df1與df3的值如下圖所示,執(zhí)行以下程序后,變量df的值為()。
df=pd.concat([df1,df3],axis=1,join='inner')
A:B:報錯C:D:
答案:變量df1與df2的值如下圖所示,執(zhí)行以下程序后,變量df的值為()。
df=pd.merge(df1,df2,on=['key1','key2'],how='left')
A:B:C:D:
答案:變量df1與df2的值如下圖所示,執(zhí)行以下程序后,變量df的值為()。
df=pd.merge(df1,df2,on=['key1','key2'],how='right')
A:B:C:D:
答案:
第八章單元測試
以下描述錯誤的是()。
A:可通過groupby方法對dataframe進行分組聚合變換B:可通過pandas庫的read_csv方法將文本文件讀入dataframeC:apply方法可將函數(shù)功能應(yīng)用到dataframe上的每一個元素D:可通過pandas庫的to_csv方法將dataframe寫入文本文件
答案:apply方法可將函數(shù)功能應(yīng)用到dataframe上的每一個元素以下關(guān)于缺失值的處理描述錯誤的是()。
A:通過dataframe的dropna()方法可查刪除缺失值B:對于dataframe中具有缺失值的行可以進行刪除或填充處理C:通過dataframe的isnull()方法可直接查詢到每一列缺失值的個數(shù)D:通過dataframe的fillna()方法可填充缺失值
答案:通過dataframe的isnull()方法可直接查詢到每一列缺失值的個數(shù)變量df的值如圖所示,執(zhí)行以下代碼后輸出的結(jié)果是()。
print(df.isnull().sum().sum())
A:B:C:7D:3
答案:7變量df的值如圖所示,執(zhí)行以下代碼后返回的結(jié)果是()。
df.dropna(thresh=3)
A:B:C:D:
答案:變量df的值如圖所示,執(zhí)行以下代碼后返回的結(jié)果是()。
df.dr
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 三體讀書筆記
- 簡歷的自我評價(合集15篇)
- 售后客服工作總結(jié)合集15篇
- xxx生態(tài)養(yǎng)豬場建設(shè)產(chǎn)業(yè)化項目商業(yè)計劃書
- 南京某煤氣站鋼結(jié)構(gòu)氣柜施工組織設(shè)計
- 房地產(chǎn)銷售個人季度工作總結(jié)(合集六篇)
- 七年級人教版復(fù)習(xí)提綱
- 《職場溝通》電子教案 項目十 商務(wù)宴請溝通(4課時)
- 2025年硅力敏傳感器項目發(fā)展計劃
- 門面房出租合同范文
- 《新編MPA英語閱讀教程教學(xué)參考書》正文(第一-第十五單元)第二稿
- “青藍工程”師徒結(jié)對體育青年教師總結(jié)反思
- 設(shè)備維護檢查修理三級保養(yǎng)記錄表
- 施工安全風(fēng)險分析及應(yīng)對措施表
- 《針灸推拿》題庫
- 2023年上海市初中物理競賽復(fù)賽試題銀光杯
- GB/T 20475.2-2006煤中有害元素含量分級第2部分:氯
- GB 18218-2000重大危險源辨識
- 油田視頻監(jiān)控綜合應(yīng)用平臺解決方案
- 福建省泉州市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名明細及行政區(qū)劃代碼
- 酒精性腦病的護理查房實用版課件
評論
0/150
提交評論