版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第頁大數(shù)據(jù)采集與處理復(fù)習(xí)試題有答案1.下列選項(xiàng)中,在JSONPath中表示選取根對(duì)象的是()A、$B、/C、@D、*【正確答案】:A2.關(guān)于BeautifulSoup的描述,說法錯(cuò)誤的是()。A、BeautifulSoup是一個(gè)用于從HTML或XML文檔中提取目標(biāo)數(shù)據(jù)的Python庫B、BeautifulSoup支持CSS選擇器C、BeautifulSoup可以將HTML或XML文檔、片段轉(zhuǎn)換成節(jié)點(diǎn)樹D、BeautifulSoup會(huì)將整個(gè)節(jié)點(diǎn)樹看作一個(gè)Python類的對(duì)象【正確答案】:D3.下列選項(xiàng)中,關(guān)于動(dòng)態(tài)頁面的描述說法錯(cuò)誤的是()A、動(dòng)態(tài)網(wǎng)頁的內(nèi)容不一定呈現(xiàn)在網(wǎng)頁源代碼中。B、動(dòng)態(tài)網(wǎng)頁的訪問速度相較于靜態(tài)網(wǎng)頁更快。C、采用動(dòng)態(tài)網(wǎng)頁技術(shù)的網(wǎng)站可以實(shí)現(xiàn)更多的功能,如用戶注冊(cè)、用戶登錄等功能D、動(dòng)態(tài)網(wǎng)頁相比靜態(tài)網(wǎng)頁,動(dòng)態(tài)網(wǎng)頁有數(shù)據(jù)庫支撐?!菊_答案】:B4.下列XPath路徑表達(dá)式中。用于選取第一個(gè)app元素的是()A、/appstore/app(1)B、/appstore/app(first)C、/appstore/app[1]D、/appstore/app[first]【正確答案】:C5.lxml庫中,用于解析xml文件的方法是()A、etree.parse()B、etree.XML()C、etree.HTML()D、etree.fromstring()【正確答案】:A6.關(guān)于CSS選擇器的描述,說法錯(cuò)誤的是()A、類別選擇器是根據(jù)類名選擇元素,類名前面用“.”進(jìn)行標(biāo)注B、ID選擇器是根據(jù)特定ID選擇元素,ID前面加上“$”進(jìn)行標(biāo)注C、屬性選擇器是根據(jù)元素的屬性選擇元素,屬性必須用中括號(hào)進(jìn)行包裹D、元素選擇器是根據(jù)元素名稱選擇元素【正確答案】:B7.selenium中,用于關(guān)閉瀏覽器對(duì)象的是()。A、driver.cancel()B、driver.exit()C、driver.quit()D、driver.close()【正確答案】:C8.下列選項(xiàng)中,用于查看響應(yīng)狀態(tài)碼的屬性是()。A、contentB、headersC、textD、status_code【正確答案】:D9.能將’baidu_logo.png’正確的保存到文件中的代碼是()A、withopen('baidu_logo.png','wb')asfile:B、withopen('baidu_logo.png','w')asfile:C、withopen('baidu_logo.png','wr')asfile:D、withopen('baidu_logo.png','a+')asfile:【正確答案】:A10.關(guān)于Requests庫中g(shù)et()函數(shù)的說法錯(cuò)誤的是()。A、get()函數(shù)既可以發(fā)送GET請(qǐng)求也可以發(fā)送POST請(qǐng)求B、get()函數(shù)中參數(shù)url是必選參數(shù),該參數(shù)含義為請(qǐng)求地址C、get()函數(shù)會(huì)根據(jù)傳入的URL構(gòu)建一個(gè)請(qǐng)求D、使用get()函數(shù)發(fā)送GET請(qǐng)求時(shí)可以攜帶請(qǐng)求參數(shù)【正確答案】:A11.當(dāng)正則表達(dá)式中包含能接受重復(fù)的限定符時(shí),匹配盡可能少的字符,這被稱為()。A、貪婪匹配B、懶惰匹配C、占有匹配D、隨機(jī)匹配【正確答案】:B12.下列選項(xiàng)中,關(guān)于設(shè)置代理服務(wù)器目的的說法正確的是()A、加快網(wǎng)絡(luò)爬蟲抓取數(shù)據(jù)的速度B、識(shí)別網(wǎng)站驗(yàn)證碼C、降低訪問網(wǎng)站速度D、防止IP被封禁【正確答案】:D13.下列選項(xiàng)中,關(guān)于靜態(tài)頁面的描述說法錯(cuò)誤的是()。A、靜態(tài)網(wǎng)頁的交互性較差,在功能方面有較大的限制B、靜態(tài)網(wǎng)頁的訪問速度快,訪問過程中無需連接數(shù)據(jù)庫C、靜態(tài)網(wǎng)頁沒有數(shù)據(jù)庫的支持,內(nèi)容更新與維護(hù)比較復(fù)雜D、靜態(tài)網(wǎng)頁的內(nèi)容可根據(jù)用戶信息進(jìn)行定制化展示【正確答案】:D14.下列選項(xiàng)中,關(guān)于Cookie的描述錯(cuò)誤的是()。A、Cookie是一段文本數(shù)據(jù),由一個(gè)名稱和一個(gè)值組成B、Cookie的生存期可以由開發(fā)人員設(shè)置C、Cookie數(shù)據(jù)存儲(chǔ)在網(wǎng)站服務(wù)器中D、Cookie是為了網(wǎng)站辨別用戶身份、進(jìn)行會(huì)話跟蹤而存儲(chǔ)的數(shù)據(jù)【正確答案】:C15.GET請(qǐng)求方法通過請(qǐng)求參數(shù)傳輸數(shù)據(jù),最多能傳輸?shù)臄?shù)據(jù)量是()A、2KBB、4KBC、1MD、無限制【正確答案】:A16.關(guān)于JSONPath的描述,說法錯(cuò)誤的是()。A、JSONPath只適用于JSON文檔B、JSONPath提供了描述JSON文檔層次結(jié)構(gòu)的表達(dá)式C、JSONPath提供的語法與XPath提供的語法相同D、JSONPath可以看作定位目標(biāo)對(duì)象位置的語言【正確答案】:C17.下列選項(xiàng)中,用于標(biāo)識(shí)客戶端身份的是()A、HOSTB、User-AgentC、AcceptD、Refere【正確答案】:B18.()會(huì)將數(shù)據(jù)包原封不動(dòng)地轉(zhuǎn)發(fā)給服務(wù)器,讓服務(wù)器認(rèn)為當(dāng)前訪問的用戶只是一個(gè)普通客戶端,而不是代理服務(wù)器。A、高度匿名代理服務(wù)器B、普通匿名代理服務(wù)器C、透明代理服務(wù)器D、所有選項(xiàng)均不對(duì)【正確答案】:A19.關(guān)于正則表達(dá)式的描述,說法錯(cuò)誤的是()A、一條正則表達(dá)式也稱為一個(gè)模式。B、正則表達(dá)式匹配HTML時(shí)會(huì)根據(jù)其層次結(jié)構(gòu)進(jìn)行匹配。C、正則表達(dá)式由普通字符、元字符或預(yù)定義字符集組成。D、正則表達(dá)式是對(duì)字符串操作的一種邏輯公式?!菊_答案】:B20.下列正則表達(dá)式中,表示只能匹配任意數(shù)字的是()。A、\wB、\sC、\dD、\b【正確答案】:C21.下列響應(yīng)頭中,用于告訴客戶端資源文件的類型和編碼的是()。A、ConnectionB、Content-EncodingC、Content-TypeD、Server。【正確答案】:C22.下列選項(xiàng)中,關(guān)于處理響應(yīng)的描述說法錯(cuò)誤的是()A、當(dāng)服務(wù)器返回的響應(yīng)狀態(tài)碼為200時(shí),表明可以接收到由服務(wù)器返回的響應(yīng)信息。B、Response類的對(duì)象中封裝了服務(wù)器返回的響應(yīng)信息。C、響應(yīng)內(nèi)容中只能包含文本內(nèi)容。D、若想獲取響應(yīng)的最終URL,可通過url屬性獲取?!菊_答案】:C23.以下Python語言關(guān)鍵字在異常處理結(jié)構(gòu)中用來捕獲特定類型異常的選項(xiàng)是()A、forB、lambdaC、inD、expect【正確答案】:D24.下列不能匹配任意字符的正則表達(dá)式是()A、[\d\D]B、[\w\W]C、[\s\S]D、[\a\A]【正確答案】:D25.XPath路徑表達(dá)式中,在搜索節(jié)點(diǎn)是會(huì)忽略層級(jí)關(guān)系的是()。A、/B、//C、[]D、@【正確答案】:B26.下列選項(xiàng)中,表示超文本傳輸協(xié)議的是()A、FileB、HTTPC、FTPD、Mailto【正確答案】:B27.下列選項(xiàng)中,被稱為主題網(wǎng)絡(luò)爬蟲的是()。A、增量式網(wǎng)絡(luò)爬蟲B、通用網(wǎng)絡(luò)爬蟲C、深層爬蟲D、聚焦網(wǎng)絡(luò)爬蟲【正確答案】:D28.requests庫中,get()函數(shù)能用于設(shè)置是否啟用SSL證書的參數(shù)是()。A、urlB、headersC、verifyD、proxies【正確答案】:C29.https的端口號(hào)是()A、80B、8080C、443D、433【正確答案】:C30.以下關(guān)于列表操作的描述,錯(cuò)誤的是()A、通過append方法可以向列表添加元素B、通過extend方法可以將另一個(gè)列表中的元素逐一添加到列表中C、通過insert(index,object)方法,在指定位置index前插入元素D、通過add方法可以向列表添加元素【正確答案】:D31.下列選項(xiàng)中,關(guān)于聚焦網(wǎng)絡(luò)爬蟲的描述錯(cuò)誤的是()。A、聚焦網(wǎng)絡(luò)爬蟲會(huì)隨機(jī)抓取網(wǎng)頁與主題相關(guān)的數(shù)據(jù)B、聚焦網(wǎng)絡(luò)爬蟲比通用網(wǎng)絡(luò)爬蟲目的性更強(qiáng)C、聚焦網(wǎng)絡(luò)爬蟲會(huì)根據(jù)一定的網(wǎng)頁分析算法對(duì)網(wǎng)頁進(jìn)行篩選D、聚焦網(wǎng)絡(luò)爬蟲會(huì)根據(jù)預(yù)先設(shè)定的主題順著某個(gè)垂直領(lǐng)域進(jìn)行抓取【正確答案】:A32.下列哪個(gè)正則表達(dá)式與1\d{5,9}不相同()A、[1]\d{5,9}B、1[0-9]{5,9}C、1[0123456789]{5,9}D、[1]\D{5,9}【正確答案】:D33.下列選項(xiàng)中,關(guān)于設(shè)置代理服務(wù)器的描述錯(cuò)誤的是()A、降低單個(gè)IP訪問頻率B、防止IP被封禁C、加快訪問網(wǎng)站的速度D、代理IP的壽命是有限的【正確答案】:C34.URL地址'?ie=utf-8&wd=python',其中屬于表示查詢字符串的是()A、ie=utf-8&wd=pythonB、httpsC、D、wd=python【正確答案】:A35.使用xpath獲取文本使用()。A、textB、text()C、contentD、content()【正確答案】:B36.關(guān)于jsonpath模塊的描述,說法錯(cuò)誤的是()。A、jsonpath是一個(gè)解析JSON文檔的模塊B、jsonpath()函數(shù)根據(jù)JSONPath的表達(dá)式定位目標(biāo)對(duì)象C、jsonpath函數(shù)會(huì)返回包含解析后的結(jié)果的列表D、jsonpath模塊可以解析XML文檔中的數(shù)據(jù)【正確答案】:D37.下列選項(xiàng)中,關(guān)于網(wǎng)絡(luò)爬蟲合法性探究的描述說法錯(cuò)誤的是()A、Robots協(xié)議又稱爬蟲協(xié)議B、Robots協(xié)議能夠有效防范網(wǎng)絡(luò)爬蟲C、爬蟲會(huì)給網(wǎng)站增加不小的壓力D、Robots協(xié)議沒有實(shí)際的約束力【正確答案】:B38.在匹配嵌套了HTML內(nèi)容的文本時(shí),會(huì)忽略HTML內(nèi)容本身存在的層次結(jié)構(gòu)的解析語言是()A、正則表達(dá)式B、XPathC、BeautifulSoupD、所有選項(xiàng)均正確【正確答案】:A39.下列選項(xiàng)中,關(guān)于Selenium的描述說法錯(cuò)誤的是()A、Selenium是一個(gè)開源的、便攜式的自動(dòng)化測試工具。B、Selenium可以模擬用戶使用瀏覽器完成一些動(dòng)作。C、Selenium最初的目的是為了便于網(wǎng)絡(luò)爬蟲抓取動(dòng)態(tài)網(wǎng)頁數(shù)據(jù)。D、Selenium需要通過瀏覽器驅(qū)動(dòng)程序WebDriver才能與所選瀏覽器進(jìn)行交互。【正確答案】:C40.關(guān)于定制請(qǐng)求頭的描述說法錯(cuò)誤的是()。A、參數(shù)headers可以接收列表類型的數(shù)據(jù)B、定制的請(qǐng)求頭需要由參數(shù)headers中傳遞C、get()函數(shù)和post()函數(shù)均可以添加定制請(qǐng)求頭D、定制請(qǐng)求的目的是將發(fā)送的請(qǐng)求偽裝成瀏覽器發(fā)送的請(qǐng)求【正確答案】:A41.下列選項(xiàng)中,表示圖像標(biāo)簽的是(D)。A、<html>B、<h1>C、<p>D、<img>【正確答案】:D42.下列選項(xiàng)中,不屬于防爬蟲策略的是()。A、添加User-agent字段B、降低訪問頻率C、反復(fù)使用同一IP抓取數(shù)據(jù)D、識(shí)別驗(yàn)證碼【正確答案】:C43.下列選項(xiàng)中,不屬于請(qǐng)求行組成的是()。A、請(qǐng)求方法B、URLC、協(xié)議版本D、請(qǐng)求數(shù)據(jù)【正確答案】:D44."發(fā)布人:張三□□發(fā)布時(shí)間:2022-11-18□□來源:圖情信息中心".split('□□')的執(zhí)行結(jié)果是()A、['發(fā)布人:張三','□','發(fā)布時(shí)間:2022-11-18','□','來源:圖情信息中心']B、['發(fā)布人:張三','發(fā)布時(shí)間:2022-11-18','來源:圖情信息中心']C、('發(fā)布人:張三','□','發(fā)布時(shí)間:2022-11-18','□','來源:圖情信息中心')D、('發(fā)布人:張三','發(fā)布時(shí)間:2022-11-18','來源:圖情信息中心')【正確答案】:B45.請(qǐng)閱讀下列一段示例程序:importrequestsurl="/"response=Requests.get(url)response.encoding='ISO-8859-1'print(response.text)上述程序運(yùn)行后,會(huì)使用哪種編碼方式返回文本()。A、utf-8B、gbkC、gbk2312D、ISO-8859-1【正確答案】:D46.以下XPath謂語中,能獲得滿足條件的第一個(gè)節(jié)點(diǎn)的是()A、[0]B、[1]C、[first()]D、[min()+1]【正確答案】:B47.下列選項(xiàng)中,屬于Selenium訪問指定URL地址的方法是()A、get()B、post()C、head()D、put()【正確答案】:A48.下列選項(xiàng)中,關(guān)于檢測代理IP有效性的描述說法錯(cuò)誤的是()。A、當(dāng)使用代理訪問網(wǎng)站時(shí),返回的狀態(tài)碼為200時(shí)表示代理可用B、當(dāng)代理無效時(shí),不能返回響應(yīng)信息C、使用的代理IP通過參數(shù)proxies傳遞D、post()函數(shù)無法使用代理ip【正確答案】:D49.關(guān)于抓取靜態(tài)網(wǎng)頁實(shí)現(xiàn)技術(shù)的說法,下列描述錯(cuò)誤的是()A、如果要抓取靜態(tài)網(wǎng)頁的數(shù)據(jù),只需要獲得網(wǎng)頁的源代碼即可。B、通過urllib、urllib3和Requests等庫抓取靜態(tài)網(wǎng)頁數(shù)據(jù)。C、Requests庫只能發(fā)送網(wǎng)絡(luò)請(qǐng)求不能獲取網(wǎng)頁源碼。D、抓取靜態(tài)網(wǎng)頁數(shù)據(jù)的整個(gè)過程是模仿用戶通過瀏覽器訪問網(wǎng)頁的過程。【正確答案】:C50.下列選項(xiàng)中,用于以二進(jìn)制形式獲取響應(yīng)內(nèi)容的屬性是()A、status_codeB、textC、contentD、string【正確答案】:C51.【】img標(biāo)簽中的什么屬性,用于指圖片地址。()。A、srcB、hrefC、titleD、alt【正確答案】:A52.的元素的表達(dá)式是()Selenium中,能查找A、find_element_by_css_selector('hello')B、find_element_by_class_name('hello')C、find_element_by_tag_name('hello')D、find_element_by_name('hello')【正確答案】:D53.selenium中,瀏覽器對(duì)象往網(wǎng)頁的輸入框中輸入文字需要調(diào)用的方法是()。A、get()B、save_screenshot()C、send_keys()D、find_element_by_id()【正確答案】:C54.正則表達(dá)式[a-z].*3可以配置abc3abc3a3幾次()。A、0B、1C、2D、3【正確答案】:B55.下列選項(xiàng)中,不屬于Python開發(fā)網(wǎng)絡(luò)爬蟲優(yōu)勢(shì)的是()A、語法簡潔,容易上手B、開發(fā)效率高C、豐富的模塊D、運(yùn)行速度快、性能強(qiáng)【正確答案】:D56.下列選項(xiàng)中,關(guān)于HTTP協(xié)議的描述說法錯(cuò)誤的是()。A、HTTP協(xié)議能夠高效準(zhǔn)確的傳送超文本資源B、若協(xié)議類型為HTTP,則每次連接可以處理多個(gè)請(qǐng)求C、HTTP協(xié)議中的每個(gè)請(qǐng)求都是獨(dú)立的D、HTTP協(xié)議用于將Web服務(wù)器的超文本資源傳送到瀏覽器中【正確答案】:B57.下列選項(xiàng)中,表示向服務(wù)器提交表單或上傳文件的請(qǐng)求方法是()A、GETB、POSTC、HEADD、PUT【正確答案】:B58.下列選項(xiàng)中,BeautifulSoup使用CSS選擇器的方法是()A、search()B、findall()C、find()D、select()【正確答案】:D59.關(guān)于XPath的描述,說法錯(cuò)誤的是()A、XPath基于XML或HTML的節(jié)點(diǎn)樹定位目標(biāo)節(jié)點(diǎn)所在的位置。B、XPath是一種用于確定XML文檔中部分節(jié)點(diǎn)位置的語言。C、XPath匹配節(jié)點(diǎn)的方式與正則表達(dá)式匹配字符串的方式類似。D、XPath通過路徑表達(dá)式可以快速地定位與選取XML或HTML文檔中的一個(gè)節(jié)點(diǎn)或者一組節(jié)點(diǎn)集?!菊_答案】:C60.下列選項(xiàng)中,不屬于HTML元素組成的是()。A、開始標(biāo)簽B、內(nèi)容C、樣式D、結(jié)束標(biāo)簽【正確答案】:C61.下列選項(xiàng)中,關(guān)于網(wǎng)絡(luò)爬蟲實(shí)現(xiàn)技術(shù)的描述錯(cuò)誤的是()。A、只有Python語言能夠?qū)崿F(xiàn)爬蟲程序B、使用Python開發(fā)網(wǎng)絡(luò)爬蟲程序效率相對(duì)其他語言更高C、使用C++語言開發(fā)網(wǎng)絡(luò)爬蟲程序代碼成型速度慢D、Java提供了眾多解析網(wǎng)頁的技術(shù),對(duì)網(wǎng)頁解析有著良好的支持【正確答案】:A62.閱讀下面的程序:ImportjsonDemo_dict={"city":"北京","name":"小明"}Print(json.dumps(demo_dict,ensure_ascii=False))運(yùn)行程序,程序最終輸出的結(jié)果為()。A、{"city":"北京","name":"小明"}B、{"city":"\u5317\u4eac","name":"\u5c0f\u660e"}C、{}D、運(yùn)行錯(cuò)誤【正確答案】:A63.requests庫中,proxies參數(shù)傳入一個(gè)字典,該字典中包含了所需要的代理IP,其中字典的鍵為A、getB、ip地址C、協(xié)議類型(http或https)D、post【正確答案】:C64.關(guān)于響應(yīng)狀態(tài)碼的描述說法錯(cuò)誤的是()。A、響應(yīng)狀態(tài)碼代表服務(wù)器的響應(yīng)狀態(tài)B、響應(yīng)狀態(tài)碼的作用是告知客戶端請(qǐng)求Web資源的結(jié)果C、若服務(wù)器發(fā)生錯(cuò)誤,用戶便無法獲取響應(yīng)狀態(tài)碼D、當(dāng)響應(yīng)狀態(tài)碼為200時(shí)表示服務(wù)器接收請(qǐng)求并成功處理【正確答案】:C65.re模塊中,對(duì)正則表達(dá)式進(jìn)行預(yù)編譯,從而生成一個(gè)代表正則表達(dá)式的Pattern對(duì)象()。A、re.pattern()B、re.split()C、re.run()D、pile()【正確答案】:D66.下列選項(xiàng)中,關(guān)于Requests庫post()函數(shù)的說法錯(cuò)誤的是()A、如果請(qǐng)求數(shù)據(jù)類型為Json可通過參數(shù)json傳遞。B、post()函數(shù)會(huì)根據(jù)傳入的URL構(gòu)建一個(gè)請(qǐng)求并將該請(qǐng)求發(fā)送給服務(wù)器。C、post()函數(shù)通過參數(shù)data攜帶請(qǐng)求數(shù)據(jù)。D、post()函數(shù)既可以發(fā)送GET請(qǐng)求也可以發(fā)送POST請(qǐng)求?!菊_答案】:D67.下列狀態(tài)碼中,表示服務(wù)器拒絕訪問的是()。A、402B、403C、404D、405【正確答案】:B68.下列選項(xiàng)中,用于解析域名的協(xié)議是()。A、HTTPB、DNSC、FTPD、SMTP【正確答案】:B69.下列選項(xiàng)中,表示匹配的字符串開頭元字符是()A、*B、^C、$D、[]【正確答案】:B70.下列選項(xiàng)中,表示匹配前導(dǎo)字符0次或1次的是()A、?B、*C、+D、{n}【正確答案】:A71.以下選項(xiàng)中是HTTP請(qǐng)求行的是()A、GET/HTTP/1.1B、Connection:keep-aliveC、Accept-Language:zh-CN,zh;q=0.9D、User-Agent:Mozilla/5.0(WindowsNT10.0;Win64;x64)...【正確答案】:A72.bs4中,若已找到節(jié)點(diǎn)并存放于變量x中,能獲取節(jié)點(diǎn)內(nèi)容的是()A、x.textB、x.contentC、x.htmlD、x.attrs【正確答案】:A73.關(guān)于瀏覽器加載網(wǎng)頁過程的說法,下列描述錯(cuò)誤的是()A、瀏覽器通過DNS服務(wù)器查找被訪問服務(wù)器對(duì)應(yīng)的IP地址。B、瀏覽器向DNS服務(wù)器解析的IP地址發(fā)送HTTP請(qǐng)求。C、Web服務(wù)器將響應(yīng)的HTML頁面返回給DNS服務(wù)器。D、瀏覽器會(huì)對(duì)HTML頁面進(jìn)行渲染并呈現(xiàn)給用戶。【正確答案】:C74.下列選項(xiàng)中,用于在GET請(qǐng)求中傳遞查詢字符串的是()。A、paramsB、headersC、verifyD、timeout【正確答案】:A75.下列選項(xiàng)中,表示內(nèi)容類型的字段是()。A、Cache-ControlB、ConnectionC、Content-EncodingD、Content-Type【正確答案】:D76.以下哪個(gè)選項(xiàng)是文件傳輸協(xié)議,訪問共享主機(jī)的文件資源()。A、FileB、FTPC、HTTPD、Mailto【正確答案】:B1.CSS用于向網(wǎng)頁中添加交互行為。()A、正確B、錯(cuò)誤【正確答案】:B2.Python中的open()函數(shù)可以用于打開網(wǎng)頁并讀取網(wǎng)頁內(nèi)容。()A、正確B、錯(cuò)誤【正確答案】:B3.POST請(qǐng)求的請(qǐng)求參數(shù)會(huì)暴露在URL地址中。()A、正確B、錯(cuò)誤【正確答案】:B4.在BeautifulSoup中,.get_text()方法會(huì)返回標(biāo)簽內(nèi)所有文本內(nèi)容,但不包括任何子標(biāo)簽的內(nèi)容。()A、正確B、錯(cuò)誤【正確答案】:B5.在HTTP請(qǐng)求中,GET方法比POST方法更適合傳輸大量數(shù)據(jù)。()A、正確B、錯(cuò)誤【正確答案】:B6.get方法相比post方法能攜帶更多信息。()A、正確B、錯(cuò)誤【正確答案】:B7.在BeautifulSoup中,soup.find_all('div',class_='header')[1]會(huì)返回所有Class='header'的div標(biāo)簽中的第一個(gè)元素。()A、正確B、錯(cuò)誤【正確答案】:B8.JSONPath表達(dá)式$..*可以用來獲取JSON對(duì)象中所有字段的值。()A、正確B、錯(cuò)誤【正確答案】:A9.Selenium啟動(dòng)瀏覽器后,瀏覽器的窗口默認(rèn)以最大化的形式顯示。()A、正確B、錯(cuò)誤【正確答案】:B10.在XPath中,@*表示選取所有屬性,而//*表示選取所有節(jié)點(diǎn)。()A、正確B、錯(cuò)誤【正確答案】:A11.在實(shí)際應(yīng)用中,文件存儲(chǔ)和數(shù)據(jù)庫存儲(chǔ)各有利弊,文件存儲(chǔ)比較適合中小型網(wǎng)絡(luò)爬蟲,數(shù)據(jù)庫存儲(chǔ)比較適合大型網(wǎng)絡(luò)爬蟲A、正確B、錯(cuò)誤【正確答案】:A12.Robots協(xié)議可以從根本上約束爬蟲程序。()A、正確B、錯(cuò)誤【正確答案】:B13.soup.find('div',class_='header').find_all('p')可以選取class='header'的div標(biāo)簽下所有p標(biāo)簽。()A、正確B、錯(cuò)誤【正確答案】:A14.JSONPath只能解析JSON格式的數(shù)據(jù)。()A、正確B、錯(cuò)誤【正確答案】:A15.服務(wù)器端可以記住用戶的登錄狀態(tài),因此HTTP協(xié)議自身具有保持會(huì)話狀態(tài)的功能。()A、正確B、錯(cuò)誤【正確答案】:B16.soup.select('div.header>p')會(huì)選擇所有div標(biāo)簽下類名為header的元素的直接子元素p標(biāo)簽。()A、正確B、錯(cuò)誤【正確答案】:B17.HTTP協(xié)議是無狀態(tài)的,這意味著每次請(qǐng)求都是獨(dú)立的,不會(huì)記住之前的請(qǐng)求信息。(√)A、正確B、錯(cuò)誤【正確答案】:A18.soup.select('div#header')用于選取頁面中第一個(gè)id='header'的div標(biāo)簽。()A、正確B、錯(cuò)誤【正確答案】:B19.soup.find('p',{'class':'intro'}).find('a')會(huì)選取class='intro'的p標(biāo)簽下第一個(gè)A標(biāo)簽。()A、正確B、錯(cuò)誤【正確答案】:A20.requests.get()方法可以用來發(fā)送GET請(qǐng)求并返回一個(gè)包含響應(yīng)內(nèi)容的對(duì)象。()A、正確B、錯(cuò)誤【正確答案】:A21.re模塊在提取HTML標(biāo)簽中的特定信息時(shí)比BeautifulSoup或lxml會(huì)更高效。()A、正確B、錯(cuò)誤【正確答案】:B22.表層網(wǎng)頁是指傳統(tǒng)搜索引擎可以索引的頁面,主要以超鏈接可以到達(dá)的靜態(tài)網(wǎng)頁構(gòu)成的網(wǎng)頁。()A、正確B、錯(cuò)誤【正確答案】:A23.爬蟲可以通過模擬點(diǎn)擊事件來動(dòng)態(tài)獲取數(shù)據(jù),但如果沒有正確處理JavaScript渲染,它仍然無法抓取數(shù)據(jù)。()A、正確B、錯(cuò)誤【正確答案】:A24.XPath表達(dá)式//div[@class='header'][contains(text(),'Python')]會(huì)選擇Class='header'且包含文本Python的div標(biāo)簽。()A、正確B、錯(cuò)誤【正確答案】:A25.互聯(lián)網(wǎng)上每個(gè)文件都有一個(gè)唯一的URL。(√)A、正確B、錯(cuò)誤【正確答案】:A26.在XPath中,//div[@id='content']/text()可以選取id="content"的div標(biāo)簽中的所有文本節(jié)點(diǎn)。()A、正確B、錯(cuò)誤【正確答案】:B27.在BeautifulSoup中,soup.find_all('div',{'class':'header'})與Soup.find_all('div',class_='header')效果是相同的。()A、正確B、錯(cuò)誤【正確答案】:A28.爬蟲在抓取動(dòng)態(tài)內(nèi)容時(shí),如果直接使用requests庫獲取網(wǎng)頁源碼,能夠獲得所有渲染后的內(nèi)容。()A、正確B、錯(cuò)誤【正確答案】:B29.get方法比post方法速度更快。()A、正確B、錯(cuò)誤【正確答案】:A30.Selenium不支持瀏覽器的功能,它不需要與第三方瀏覽器結(jié)合使用。()A、正確B、錯(cuò)誤【正確答案】:B31.soup.select('divp#main')會(huì)選擇所有div標(biāo)簽中的id="main"的p標(biāo)簽。()A、正確B、錯(cuò)誤【正確答案】:A32.JSON比XML的語法更簡單,層次結(jié)構(gòu)更加清晰,易于閱讀。()A、正確B、錯(cuò)誤【正確答案】:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度果蔬冷鏈物流配送合同3篇
- 2025年度全網(wǎng)關(guān)鍵詞SEO優(yōu)化服務(wù)合同3篇
- 幼兒園教育活動(dòng)心得
- 裝飾工程水電工合同
- 北京語言大學(xué)《廣東自然地理》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年蒸洗箱項(xiàng)目可行性研究報(bào)告
- 2024年組合空調(diào)機(jī)組項(xiàng)目可行性研究報(bào)告
- 2025版挖掘機(jī)租賃與環(huán)境保護(hù)合作協(xié)議3篇
- 守校合同協(xié)議
- 北京中醫(yī)藥大學(xué)《園林制圖》2023-2024學(xué)年第一學(xué)期期末試卷
- 小學(xué)體育課件教學(xué)
- 2024年事業(yè)單位招聘考試計(jì)算機(jī)基礎(chǔ)知識(shí)復(fù)習(xí)題庫及答案(共600題)
- 西京學(xué)院《機(jī)械制造技術(shù)基礎(chǔ)》2022-2023學(xué)年第一學(xué)期期末試卷
- 2024新版《藥品管理法》培訓(xùn)課件
- 【初中語文】2024-2025學(xué)年新統(tǒng)編版語文七年級(jí)上冊(cè)期中專題12:議論文閱讀
- 信息科技大單元教學(xué)設(shè)計(jì)之七年級(jí)第一單元探尋互聯(lián)網(wǎng)新世界
- 四川新農(nóng)村建設(shè)農(nóng)房設(shè)計(jì)方案圖集川西部分
- OBE教育理念驅(qū)動(dòng)下的文學(xué)類課程教學(xué)創(chuàng)新路徑探究
- 2024年國家公務(wù)員考試《行測》真題卷(行政執(zhí)法)答案和解析
- 2024年首屆全國標(biāo)準(zhǔn)化知識(shí)競賽真題題庫導(dǎo)出版-下(判斷題部分)
- 一年級(jí)下數(shù)學(xué)教案-筆算兩位數(shù)減兩位數(shù)(退位減)-蘇教版秋
評(píng)論
0/150
提交評(píng)論