網(wǎng)絡(luò)爬蟲開發(fā)(楊凌職業(yè)技術(shù)學院)知到智慧樹答案_第1頁
網(wǎng)絡(luò)爬蟲開發(fā)(楊凌職業(yè)技術(shù)學院)知到智慧樹答案_第2頁
網(wǎng)絡(luò)爬蟲開發(fā)(楊凌職業(yè)技術(shù)學院)知到智慧樹答案_第3頁
網(wǎng)絡(luò)爬蟲開發(fā)(楊凌職業(yè)技術(shù)學院)知到智慧樹答案_第4頁
網(wǎng)絡(luò)爬蟲開發(fā)(楊凌職業(yè)技術(shù)學院)知到智慧樹答案_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

項目一單元測試項目二單元測試項目三單元測試項目四單元測試項目五單元測試項目六單元測試項目七單元測試項目八單元測試1【單選題】(2分)下列不屬于常見爬蟲類型的是()。正確答案:CA.增量式網(wǎng)絡(luò)爬蟲B.通用網(wǎng)絡(luò)爬蟲C.淺層網(wǎng)絡(luò)爬蟲D.聚焦網(wǎng)絡(luò)爬蟲2【單選題】(2分)下列不屬于聚焦網(wǎng)絡(luò)爬蟲的常用策略的是()。正確答案:AA.基于深度優(yōu)先的爬取策略B.基于內(nèi)容評價的爬取策略C.基于語境圖的爬取策略D.基于鏈接結(jié)構(gòu)評價的爬取策略3【單選題】(2分)下列不屬于常用反爬手段的是()。正確答案:BA.賬號權(quán)限B.人工篩選C.驗證碼校驗D.反爬頻度4【單選題】(2分)下列屬于反爬蟲目的的是()。正確答案:DA.變換網(wǎng)頁結(jié)構(gòu)B.限制訪問人數(shù)C.限制用戶訪問權(quán)限D(zhuǎn).防止網(wǎng)站信息被競爭對手隨意獲取5【單選題】(2分)下列屬關(guān)于Python爬蟲庫的功能描述不正確的是()。正確答案:BA.通用爬蟲庫RequestsB.HTML/XML解析器pycurl`C.爬蟲框架ScrapyD.通用爬蟲庫urllib36【判斷題】(2分)搜索引擎使用了網(wǎng)絡(luò)爬蟲不停地從互聯(lián)網(wǎng)抓取網(wǎng)站數(shù)據(jù),并將網(wǎng)站鏡像保存在本地。()正確答案:BA.錯B.對7【判斷題】(2分)robots.txt文件中,User-agent后面跟的是爬蟲的名稱,Disallow后面跟著的是可以爬蟲的網(wǎng)頁。()正確答案:BA.對B.錯8【判斷題】(2分)爬蟲是手動請求萬維網(wǎng)網(wǎng)站且提取網(wǎng)頁數(shù)據(jù)的程序。()正確答案:BA.對B.錯9【判斷題】(2分)每個網(wǎng)站都有robots.txt文件。()正確答案:AA.錯B.對10【判斷題】(2分)爬蟲爬取的是網(wǎng)站后臺的數(shù)據(jù)。()正確答案:AA.錯B.對1【單選題】(2分)吉多設(shè)計Python的靈感來源于()。正確答案:CA.UnixshellB.C語言C.ABC語言D.Java語言2【單選題】(4分)下列關(guān)于Python語言的特點說法中,錯誤的是()。正確答案:CA.GoB.ANSICC.Python語言是非開源語言D.Python語言是跨平臺語言3【單選題】(4分)Python源代碼文件的后綴名是()正確答案:CA.pdfB.docC.pyD.png4【單選題】(4分)列表list=[1,2,3,4,5],下列選項中為空的是()正確答案:BA.list[1:-1]B.ist[1:1]C.list[1:]D.list[:-2]5【單選題】(2分)Python語言中用來定義函數(shù)的關(guān)鍵字是()正確答案:CA.classB.functionC.defD.return6【判斷題】(2分)在安裝Python時,需要根據(jù)已有的系統(tǒng)來選擇相應(yīng)的安裝程序。安裝后,也需要配置環(huán)境變量。()正確答案:AA.對B.錯7【判斷題】(4分)elif語句可以單獨使用。()正確答案:BA.對B.錯8【判斷題】(4分)元組的元素不能修改。()正確答案:BA.錯B.對9【多選題】(4分)下列選項中,不能創(chuàng)建元組的語句是()。正確答案:CDA.tup=(1,2,98)B.tup=tuple([1,2,3])C.tup=(2)D.tup=[1,2,3]1【單選題】(2分)如果站點服務(wù)器支持安全套接層(SSL),那么連接到安全站點上的所有URL開頭是()。正確答案:DA.SHTTPB.HTTPC.SSLD.HTTPS2【單選題】(2分)body元素用于背景顏色的屬性是()。正確答案:BA.vlinkB.background-colorC.alinkD.color3【單選題】(2分)為了標識一個HTML文件開始應(yīng)該使用的HTML標記是()。正確答案:AA.<html>B.<body>C.<table>D.<a>4【單選題】(2分)在HTML中,單元格的標記是()。正確答案:DA.<span>B.<tr>C.<body>D.<td>5【單選題】(2分)CSS中的選擇器不包括包括()正確答案:BA.ID選擇器B.超文本標記選擇器C.元素選擇器D.類選擇器6【單選題】(2分)()是網(wǎng)頁與網(wǎng)頁之間聯(lián)系的紐帶,也是網(wǎng)頁的重要特色。正確答案:BA.表格B.超鏈接C.框架D.導航條7【單選題】(2分)在HTML中,下面是段落標簽的是:()。正確答案:DA.<head></head>B.<html></html>C.<body></body>D.<p></p>8【單選題】(2分)()標簽可以應(yīng)用于〈head〉中。正確答案:AA.<title>B.<html>C.<image>D.<body>9【單選題】(2分)下列哪一項是css添加背景圖片的正確語法構(gòu)成?()正確答案:BA.background-colorB.background-imageC.background-positionD.background-size10【單選題】(2分)在HTML開發(fā)中,制作網(wǎng)站時首先需要考慮內(nèi)容是()正確答案:DA.文字字體B.圖片色彩C.頁面內(nèi)容D.頁面布局1【單選題】(2分)HTTPError是URLError的子類,專門用來處理HTTP請求錯誤,比如認證請求失敗等。它有3個屬性,下列選項哪一個不是它的屬性()。正確答案:AA.ResponseB.codeC.reasonD.headers2【單選題】(2分)下列屬于HTTP必須實現(xiàn)的請求方法的是()。正確答案:AA.GET與HEADB.OPTIONS和CONNECTC.POST與DELED.TRACE和OPTIONS3【單選題】(2分)下列關(guān)于HTTP狀態(tài)碼類型描述錯誤的是()。正確答案:AA.1XX表示請求已被服務(wù)器接受,無須后續(xù)處理B.4XX表示客戶端可能發(fā)生錯誤C.3XX表示客戶端的請求需采取進一步操作D.5XX表示服務(wù)器可能發(fā)生錯誤4【單選題】(2分)通過加入特定的____,可以將爬蟲發(fā)出的請求偽裝成瀏覽器。()正確答案:CA.HeadersB.RequestC.User_AgentD.opener5【判斷題】(2分)urlopen方法中的data參數(shù)可以不是bytes類型。()正確答案:BA.對B.錯6【判斷題】(2分)requests庫中的requests.get(url)方法是請求目標網(wǎng)站,類型是一個HTTPresponse類型。()正確答案:BA.錯B.對7【判斷題】(2分)如果訪問某網(wǎng)站的頻率太高,則這個網(wǎng)站可能會禁止訪問。()正確答案:AA.對B.錯8【判斷題】(2分)requests庫中的requests.get(url)方法中包括兩個(對象)請求,其中一個為Request請求,即向服務(wù)器請求資源的request對象,第二個是Response請求,即包含從服務(wù)器返回的所有資源。()正確答案:BA.錯B.對9【判斷題】(2分)Response類用于動態(tài)地響應(yīng)客戶端的請求,控制發(fā)送給用戶的信息,并且將動態(tài)地生成響應(yīng),包括狀態(tài)碼、網(wǎng)頁的內(nèi)容等。()正確答案:BA.錯B.對1【單選題】(2分)下列不屬于HTTP請求過程的是()。正確答案:CA.超時設(shè)置B.生成請求C.搜索文檔D.請求重定向2【單選題】(2分)下列關(guān)于Chrome開發(fā)者工具描述錯誤的是()正確答案:AA.網(wǎng)絡(luò)面板無法查看HTML源碼B.網(wǎng)絡(luò)面板可查看HTTP頭部信息C.元素面板可查看元素在頁面的對應(yīng)位置D.源代碼面板可查看HTML源碼3【單選題】(2分)下列關(guān)于Xpah中功能函數(shù)描述錯誤的是()正確答案:BA.text函數(shù)可提取節(jié)點文本內(nèi)容B.contains方法可用于選取以指定值開頭的節(jié)點C.text函數(shù)可用于選取包含指定文本內(nèi)容的節(jié)點D.and方法可用于選取同時包含兩種指定值的節(jié)點4【單選題】(2分)下列關(guān)于Beautifulsoup中對象類型描述錯誤的是()正確答案:BA.string方法可獲取Tag對象中的文本字符串內(nèi)容B.attrs方法可獲取Tag對象的HTML屬性,返回值為列表形式C.name方法可以獲取及修改Tag對象名稱D.NavigableString對象無法被編輯,但可以進行替換5【單選題】(2分)下列選項中,屬于非結(jié)構(gòu)化數(shù)據(jù)的是:()正確答案:BA.HTMLB.圖像C.JSOND.XML6【判斷題】(2分)對服務(wù)器端來說,它返回給客戶端的數(shù)據(jù)格式可分為非結(jié)構(gòu)化和結(jié)構(gòu)化兩種。()正確答案:AA.對B.錯7【判斷題】(2分)網(wǎng)頁中的非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒有預定義的數(shù)據(jù)模型,不方便使用數(shù)據(jù)庫二維邏輯來表現(xiàn)的數(shù)據(jù),包括所有格式的辦公文檔、文本、圖像等。()正確答案:AA.對B.錯8【判斷題】(2分)結(jié)構(gòu)化數(shù)據(jù)就是能夠用數(shù)據(jù)或統(tǒng)一的結(jié)構(gòu)加以表示,具有模式的數(shù)據(jù),包括HTML、XML和JSON等。()正確答案:BA.錯B.對9【判斷題】(2分)正則表達式、XPath和BeautifulSoup都是基于HTML/XML文檔的層次結(jié)構(gòu)來確定到達指定節(jié)點的路徑。()正確答案:BA.對B.錯10【判斷題】(2分)XPath是一門在XML文檔中查找信息的語言。XPath可用來在XML文檔中對元素和屬性進行遍歷。()正確答案:AA.對B.錯1【單選題】(2分)使用以下哪個函數(shù)可以打開一個已經(jīng)存在的文件?()正確答案:DA.readB.fileC.closeD.open2【單選題】(2分)文件訪問的默認模式為()。正確答案:AA.rB.wC.aD.ab3【單選題】(2分)以二進制格式打開一個文件用于追加的訪問模式為()。正確答案:CA.r+B.wC.abD.r4【單選題】(2分)改變文件目錄所用的方法是()。正確答案:AA.chdir()B.remove()C.rename()D.read()5【單選題】(2分)文件刪除所用的方法是()正確答案:AA.remove()B.read()C.rename()D.readlines()6【判斷題】(2分)使用withas語法。在with控制塊結(jié)束時,文件會自動關(guān)閉()。正確答案:BA.錯B.對7【判斷題】(2分)JSON也就是JavaScript對象標記()。正確答案:AA.對B.錯8【判斷題】(2分)使調(diào)用dumps()方法將JSON字符串轉(zhuǎn)化為對象()。正確答案:BA.對B.錯9【判斷題】(2分)使用readines()方法不可以把整個文件中的內(nèi)容進行一次性讀?。ǎU_答案:BA.對B.錯10【判斷題】(2分)向文件中寫入數(shù)據(jù),需要使用write方法()。正確答案:AA.對B.錯1【單選題】(2分)以下哪個技術(shù)不是Ajax技術(shù)體系的組成部分?()正確答案:CA.DOMB.XMLHttpRequestC.DHTMLD.CSS2【單選題】(2分)下列哪些方法或?qū)傩允荳eb標準中規(guī)定的?()正確答案:DA.innerHTMLB.all()C.innerTextD.getElementsByTagName()3【單選題】(2分)下列selenium庫的方法中,通過元素名稱定位的是()。正確答案:AA.find_element_by_nameB.find_element_by_tag_nameC.find_element_by_class_nameD.find_element_by_id4【單選題】(2分)下面方法中,進行瀏覽器頁面前進的方法是()。正確答案:AA.driver.forward()B.driver.go()C.driver.back()D.driver.refresh()5【單選題】(2分)關(guān)閉當前頁面的方法是()正確答案:CA.driver.forward()B.driver.quit()C.driver.close()D.driver.back()6【判斷題】(2分)Ajax不能實現(xiàn)頁面的交互()。正確答案:BA.對B.錯7【判斷題】(2分)可以使用request向服務(wù)器發(fā)送請求,然后得到響應(yīng)()。正確答案:AA.對B.錯8【判斷題】(2分)使用driver.get()方法可以得到網(wǎng)頁窗口的位置()。正確答案:AA.錯B.對9【判斷題】(2分)使用Ajax解析內(nèi)容時,得到響應(yīng)后,觸發(fā)onreadystatechange屬性對應(yīng)的方法()。正確答案:BA.錯B.對10【判斷題】(2分)DOM操作,即對Document網(wǎng)頁文檔進行操作,如更改、刪除等()。正確答案:AA.對B.錯1【單選題】(2分)下列不屬于Scrapy框架的基本組成部分的是()正確答案:BA.解析中間件B.引擎與調(diào)度器C.下載器與SpidersD.ItemPipelines2【單選題】(2分)下列對于Scrapy數(shù)據(jù)流向描述錯誤的是()正確答案:CA.調(diào)度器返回下一個要爬取的URL給引擎,引擎將URL通過下載器中間件(請求方向)轉(zhuǎn)發(fā)給下載器DownloadB.一旦網(wǎng)頁下載完畢,下載器會生成一個該網(wǎng)頁的響應(yīng),并將其通過下載器中間件(返回響應(yīng)方向)發(fā)送給引擎C.Spiders處理響應(yīng)并返同爬取到的Items及(跟進的)新的請求給引擎解析中間件D.引擎僅負責打開一個網(wǎng)站,并找到該網(wǎng)站的Spiders,并向該Spiders請求第一個要爬取的URL3【單選題】(2分)下列對于Scrapy常用命令及其作用描述正確的是()正確答案:CA.List是一個全局命令,主要用于列出項目中所有可用的爬蟲B.crawl是一個項目命令,主要用于啟動限蟲C.startproject是一個全局命令,主要用于運行一個獨立的爬蟲D.genspider是一個項目命令,主要用于創(chuàng)建爬蟲模板4【單選題】(2分)下列對于Scrapy蟲項目目錄說法錯誤的是()。正確答案:AA.items腳本定義了一個Item類,能夠存儲爬取的數(shù)據(jù)B.pipelines

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論