網(wǎng)絡(luò)爬蟲開發(fā)（楊凌職業(yè)技術(shù)學(xué)院）知到智慧樹答案

上傳人：z*** IP屬地：貴州上傳時(shí)間：2024-12-19 格式：DOCX 頁數(shù)：12 大?。?4.33KB 積分：6 舉報(bào) 版權(quán)申訴

網(wǎng)絡(luò)爬蟲開發(fā)（楊凌職業(yè)技術(shù)學(xué)院）知到智慧樹答案_第2頁

網(wǎng)絡(luò)爬蟲開發(fā)（楊凌職業(yè)技術(shù)學(xué)院）知到智慧樹答案_第3頁

網(wǎng)絡(luò)爬蟲開發(fā)（楊凌職業(yè)技術(shù)學(xué)院）知到智慧樹答案_第4頁

網(wǎng)絡(luò)爬蟲開發(fā)（楊凌職業(yè)技術(shù)學(xué)院）知到智慧樹答案_第5頁

已閱讀5頁，還剩7頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

項(xiàng)目一單元測試項(xiàng)目二單元測試項(xiàng)目三單元測試項(xiàng)目四單元測試項(xiàng)目五單元測試項(xiàng)目六單元測試項(xiàng)目七單元測試項(xiàng)目八單元測試1【單選題】(2分)下列不屬于常見爬蟲類型的是（）。正確答案：CA.增量式網(wǎng)絡(luò)爬蟲B.通用網(wǎng)絡(luò)爬蟲C.淺層網(wǎng)絡(luò)爬蟲D.聚焦網(wǎng)絡(luò)爬蟲2【單選題】(2分)下列不屬于聚焦網(wǎng)絡(luò)爬蟲的常用策略的是（）。正確答案：AA.基于深度優(yōu)先的爬取策略B.基于內(nèi)容評價(jià)的爬取策略C.基于語境圖的爬取策略D.基于鏈接結(jié)構(gòu)評價(jià)的爬取策略3【單選題】(2分)下列不屬于常用反爬手段的是（）。正確答案：BA.賬號權(quán)限B.人工篩選C.驗(yàn)證碼校驗(yàn)D.反爬頻度4【單選題】(2分)下列屬于反爬蟲目的的是（）。正確答案：DA.變換網(wǎng)頁結(jié)構(gòu)B.限制訪問人數(shù)C.限制用戶訪問權(quán)限D(zhuǎn).防止網(wǎng)站信息被競爭對手隨意獲取5【單選題】(2分)下列屬關(guān)于Python爬蟲庫的功能描述不正確的是（）。正確答案：BA.通用爬蟲庫RequestsB.HTML/XML解析器pycurl`C.爬蟲框架ScrapyD.通用爬蟲庫urllib36【判斷題】(2分)搜索引擎使用了網(wǎng)絡(luò)爬蟲不停地從互聯(lián)網(wǎng)抓取網(wǎng)站數(shù)據(jù)，并將網(wǎng)站鏡像保存在本地。（）正確答案：BA.錯(cuò)B.對7【判斷題】(2分)robots.txt文件中，User-agent后面跟的是爬蟲的名稱，Disallow后面跟著的是可以爬蟲的網(wǎng)頁。（）正確答案：BA.對B.錯(cuò)8【判斷題】(2分)爬蟲是手動請求萬維網(wǎng)網(wǎng)站且提取網(wǎng)頁數(shù)據(jù)的程序。（）正確答案：BA.對B.錯(cuò)9【判斷題】(2分)每個(gè)網(wǎng)站都有robots.txt文件。（）正確答案：AA.錯(cuò)B.對10【判斷題】(2分)爬蟲爬取的是網(wǎng)站后臺的數(shù)據(jù)。（）正確答案：AA.錯(cuò)B.對1【單選題】(2分)吉多設(shè)計(jì)Python的靈感來源于（）。正確答案：CA.UnixshellB.C語言C.ABC語言D.Java語言2【單選題】(4分)下列關(guān)于Python語言的特點(diǎn)說法中，錯(cuò)誤的是（）。正確答案：CA.GoB.ANSICC.Python語言是非開源語言D.Python語言是跨平臺語言3【單選題】(4分)Python源代碼文件的后綴名是（）正確答案：CA.pdfB.docC.pyD.png4【單選題】(4分)列表list=[1,2,3,4,5]，下列選項(xiàng)中為空的是（）正確答案：BA.list[1:-1]B.ist[1:1]C.list[1:]D.list[:-2]5【單選題】(2分)Python語言中用來定義函數(shù)的關(guān)鍵字是（）正確答案：CA.classB.functionC.defD.return6【判斷題】(2分)在安裝Python時(shí)，需要根據(jù)已有的系統(tǒng)來選擇相應(yīng)的安裝程序。安裝后，也需要配置環(huán)境變量。（）正確答案：AA.對B.錯(cuò)7【判斷題】(4分)elif語句可以單獨(dú)使用。（）正確答案：BA.對B.錯(cuò)8【判斷題】(4分)元組的元素不能修改。（）正確答案：BA.錯(cuò)B.對9【多選題】(4分)下列選項(xiàng)中，不能創(chuàng)建元組的語句是（）。正確答案：CDA.tup=(1,2,98)B.tup=tuple([1,2,3])C.tup=(2)D.tup=[1,2,3]1【單選題】(2分)如果站點(diǎn)服務(wù)器支持安全套接層(SSL)，那么連接到安全站點(diǎn)上的所有URL開頭是()。正確答案：DA.SHTTPB.HTTPC.SSLD.HTTPS2【單選題】(2分)body元素用于背景顏色的屬性是()。正確答案：BA.vlinkB.background-colorC.alinkD.color3【單選題】(2分)為了標(biāo)識一個(gè)HTML文件開始應(yīng)該使用的HTML標(biāo)記是()。正確答案：AA.＜html＞B.＜body＞C.＜table＞D.＜a＞4【單選題】(2分)在HTML中，單元格的標(biāo)記是()。正確答案：DA.＜span＞B.＜tr＞C.＜body＞D.＜td＞5【單選題】(2分)CSS中的選擇器不包括包括（）正確答案：BA.ID選擇器B.超文本標(biāo)記選擇器C.元素選擇器D.類選擇器6【單選題】(2分)()是網(wǎng)頁與網(wǎng)頁之間聯(lián)系的紐帶，也是網(wǎng)頁的重要特色。正確答案：BA.表格B.超鏈接C.框架D.導(dǎo)航條7【單選題】(2分)在HTML中，下面是段落標(biāo)簽的是：（）。正確答案：DA.＜head＞＜/head＞B.＜html＞＜/html＞C.＜body＞＜/body＞D.＜p＞＜/p＞8【單選題】(2分)（）標(biāo)簽可以應(yīng)用于〈head〉中。正確答案：AA.＜title＞B.＜html＞C.＜image＞D.＜body＞9【單選題】(2分)下列哪一項(xiàng)是css添加背景圖片的正確語法構(gòu)成？（）正確答案：BA.background-colorB.background-imageC.background-positionD.background-size10【單選題】(2分)在HTML開發(fā)中,制作網(wǎng)站時(shí)首先需要考慮內(nèi)容是()正確答案：DA.文字字體B.圖片色彩C.頁面內(nèi)容D.頁面布局1【單選題】(2分)HTTPError是URLError的子類，專門用來處理HTTP請求錯(cuò)誤，比如認(rèn)證請求失敗等。它有3個(gè)屬性，下列選項(xiàng)哪一個(gè)不是它的屬性（）。正確答案：AA.ResponseB.codeC.reasonD.headers2【單選題】(2分)下列屬于HTTP必須實(shí)現(xiàn)的請求方法的是（）。正確答案：AA.GET與HEADB.OPTIONS和CONNECTC.POST與DELED.TRACE和OPTIONS3【單選題】(2分)下列關(guān)于HTTP狀態(tài)碼類型描述錯(cuò)誤的是（）。正確答案：AA.1XX表示請求已被服務(wù)器接受，無須后續(xù)處理B.4XX表示客戶端可能發(fā)生錯(cuò)誤C.3XX表示客戶端的請求需采取進(jìn)一步操作D.5XX表示服務(wù)器可能發(fā)生錯(cuò)誤4【單選題】(2分)通過加入特定的____，可以將爬蟲發(fā)出的請求偽裝成瀏覽器。（）正確答案：CA.HeadersB.RequestC.User_AgentD.opener5【判斷題】(2分)urlopen方法中的data參數(shù)可以不是bytes類型。（）正確答案：BA.對B.錯(cuò)6【判斷題】(2分)requests庫中的requests.get(url)方法是請求目標(biāo)網(wǎng)站，類型是一個(gè)HTTPresponse類型。（）正確答案：BA.錯(cuò)B.對7【判斷題】(2分)如果訪問某網(wǎng)站的頻率太高，則這個(gè)網(wǎng)站可能會禁止訪問。（）正確答案：AA.對B.錯(cuò)8【判斷題】(2分)requests庫中的requests.get(url)方法中包括兩個(gè)（對象）請求，其中一個(gè)為Request請求，即向服務(wù)器請求資源的request對象，第二個(gè)是Response請求，即包含從服務(wù)器返回的所有資源。（）正確答案：BA.錯(cuò)B.對9【判斷題】(2分)Response類用于動態(tài)地響應(yīng)客戶端的請求，控制發(fā)送給用戶的信息，并且將動態(tài)地生成響應(yīng)，包括狀態(tài)碼、網(wǎng)頁的內(nèi)容等。（）正確答案：BA.錯(cuò)B.對1【單選題】(2分)下列不屬于HTTP請求過程的是（）。正確答案：CA.超時(shí)設(shè)置B.生成請求C.搜索文檔D.請求重定向2【單選題】(2分)下列關(guān)于Chrome開發(fā)者工具描述錯(cuò)誤的是（）正確答案：AA.網(wǎng)絡(luò)面板無法查看HTML源碼B.網(wǎng)絡(luò)面板可查看HTTP頭部信息C.元素面板可查看元素在頁面的對應(yīng)位置D.源代碼面板可查看HTML源碼3【單選題】(2分)下列關(guān)于Xpah中功能函數(shù)描述錯(cuò)誤的是（）正確答案：BA.text函數(shù)可提取節(jié)點(diǎn)文本內(nèi)容B.contains方法可用于選取以指定值開頭的節(jié)點(diǎn)C.text函數(shù)可用于選取包含指定文本內(nèi)容的節(jié)點(diǎn)D.and方法可用于選取同時(shí)包含兩種指定值的節(jié)點(diǎn)4【單選題】(2分)下列關(guān)于Beautifulsoup中對象類型描述錯(cuò)誤的是（）正確答案：BA.string方法可獲取Tag對象中的文本字符串內(nèi)容B.attrs方法可獲取Tag對象的HTML屬性，返回值為列表形式C.name方法可以獲取及修改Tag對象名稱D.NavigableString對象無法被編輯，但可以進(jìn)行替換5【單選題】(2分)下列選項(xiàng)中，屬于非結(jié)構(gòu)化數(shù)據(jù)的是：（）正確答案：BA.HTMLB.圖像C.JSOND.XML6【判斷題】(2分)對服務(wù)器端來說，它返回給客戶端的數(shù)據(jù)格式可分為非結(jié)構(gòu)化和結(jié)構(gòu)化兩種。（）正確答案：AA.對B.錯(cuò)7【判斷題】(2分)網(wǎng)頁中的非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整，沒有預(yù)定義的數(shù)據(jù)模型，不方便使用數(shù)據(jù)庫二維邏輯來表現(xiàn)的數(shù)據(jù)，包括所有格式的辦公文檔、文本、圖像等。（）正確答案：AA.對B.錯(cuò)8【判斷題】(2分)結(jié)構(gòu)化數(shù)據(jù)就是能夠用數(shù)據(jù)或統(tǒng)一的結(jié)構(gòu)加以表示，具有模式的數(shù)據(jù)，包括HTML、XML和JSON等。（）正確答案：BA.錯(cuò)B.對9【判斷題】(2分)正則表達(dá)式、XPath和BeautifulSoup都是基于HTML/XML文檔的層次結(jié)構(gòu)來確定到達(dá)指定節(jié)點(diǎn)的路徑。（）正確答案：BA.對B.錯(cuò)10【判斷題】(2分)XPath是一門在XML文檔中查找信息的語言。XPath可用來在XML文檔中對元素和屬性進(jìn)行遍歷。（）正確答案：AA.對B.錯(cuò)1【單選題】(2分)使用以下哪個(gè)函數(shù)可以打開一個(gè)已經(jīng)存在的文件？()正確答案：DA.readB.fileC.closeD.open2【單選題】(2分)文件訪問的默認(rèn)模式為()。正確答案：AA.rB.wC.aD.ab3【單選題】(2分)以二進(jìn)制格式打開一個(gè)文件用于追加的訪問模式為()。正確答案：CA.r+B.wC.abD.r4【單選題】(2分)改變文件目錄所用的方法是()。正確答案：AA.chdir()B.remove()C.rename()D.read()5【單選題】(2分)文件刪除所用的方法是（）正確答案：AA.remove()B.read()C.rename()D.readlines()6【判斷題】(2分)使用withas語法。在with控制塊結(jié)束時(shí)，文件會自動關(guān)閉（）。正確答案：BA.錯(cuò)B.對7【判斷題】(2分)JSON也就是JavaScript對象標(biāo)記（）。正確答案：AA.對B.錯(cuò)8【判斷題】(2分)使調(diào)用dumps()方法將JSON字符串轉(zhuǎn)化為對象()。正確答案：BA.對B.錯(cuò)9【判斷題】(2分)使用readines（）方法不可以把整個(gè)文件中的內(nèi)容進(jìn)行一次性讀取（）。正確答案：BA.對B.錯(cuò)10【判斷題】(2分)向文件中寫入數(shù)據(jù)，需要使用write方法()。正確答案：AA.對B.錯(cuò)1【單選題】(2分)以下哪個(gè)技術(shù)不是Ajax技術(shù)體系的組成部分？()正確答案：CA.DOMB.XMLHttpRequestC.DHTMLD.CSS2【單選題】(2分)下列哪些方法或?qū)傩允荳eb標(biāo)準(zhǔn)中規(guī)定的？()正確答案：DA.innerHTMLB.all()C.innerTextD.getElementsByTagName()3【單選題】(2分)下列selenium庫的方法中，通過元素名稱定位的是()。正確答案：AA.find_element_by_nameB.find_element_by_tag_nameC.find_element_by_class_nameD.find_element_by_id4【單選題】(2分)下面方法中，進(jìn)行瀏覽器頁面前進(jìn)的方法是()。正確答案：AA.driver.forward()B.driver.go()C.driver.back()D.driver.refresh()5【單選題】(2分)關(guān)閉當(dāng)前頁面的方法是（）正確答案：CA.driver.forward()B.driver.quit()C.driver.close()D.driver.back()6【判斷題】(2分)Ajax不能實(shí)現(xiàn)頁面的交互（）。正確答案：BA.對B.錯(cuò)7【判斷題】(2分)可以使用request向服務(wù)器發(fā)送請求，然后得到響應(yīng)（）。正確答案：AA.對B.錯(cuò)8【判斷題】(2分)使用driver.get()方法可以得到網(wǎng)頁窗口的位置()。正確答案：AA.錯(cuò)B.對9【判斷題】(2分)使用Ajax解析內(nèi)容時(shí)，得到響應(yīng)后，觸發(fā)onreadystatechange屬性對應(yīng)的方法（）。正確答案：BA.錯(cuò)B.對10【判斷題】(2分)DOM操作，即對Document網(wǎng)頁文檔進(jìn)行操作，如更改、刪除等()。正確答案：AA.對B.錯(cuò)1【單選題】(2分)下列不屬于Scrapy框架的基本組成部分的是（）正確答案：BA.解析中間件B.引擎與調(diào)度器C.下載器與SpidersD.ItemPipelines2【單選題】(2分)下列對于Scrapy數(shù)據(jù)流向描述錯(cuò)誤的是（）正確答案：CA.調(diào)度器返回下一個(gè)要爬取的URL給引擎，引擎將URL通過下載器中間件（請求方向）轉(zhuǎn)發(fā)給下載器DownloadB.一旦網(wǎng)頁下載完畢,下載器會生成一個(gè)該網(wǎng)頁的響應(yīng),并將其通過下載器中間件（返回響應(yīng)方向）發(fā)送給引擎C.Spiders處理響應(yīng)并返同爬取到的Items及(跟進(jìn)的)新的請求給引擎解析中間件D.引擎僅負(fù)責(zé)打開一個(gè)網(wǎng)站，并找到該網(wǎng)站的Spiders，并向該Spiders請求第一個(gè)要爬取的URL3【單選題】(2分)下列對于Scrapy常用命令及其作用描述正確的是（）正確答案：CA.List是一個(gè)全局命令，主要用于列出項(xiàng)目中所有可用的爬蟲B.crawl是一個(gè)項(xiàng)目命令，主要用于啟動限蟲C.startproject是一個(gè)全局命令，主要用于運(yùn)行一個(gè)獨(dú)立的爬蟲D.genspider是一個(gè)項(xiàng)目命令，主要用于創(chuàng)建爬蟲模板4【單選題】(2分)下列對于Scrapy蟲項(xiàng)目目錄說法錯(cuò)誤的是（）。正確答案：AA.items腳本定義了一個(gè)Item類，能夠存儲爬取的數(shù)據(jù)B.pipelines

人人文庫> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

網(wǎng)絡(luò)爬蟲開發(fā)（楊凌職業(yè)技術(shù)學(xué)院）知到智慧樹答案

文檔簡介

溫馨提示

最新文檔

評論

網(wǎng)絡(luò)爬蟲開發(fā)（楊凌職業(yè)技術(shù)學(xué)院）知到智慧樹答案

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔