《爬蟲課程》練習題庫01-選擇題_第1頁
《爬蟲課程》練習題庫01-選擇題_第2頁
《爬蟲課程》練習題庫01-選擇題_第3頁
《爬蟲課程》練習題庫01-選擇題_第4頁
《爬蟲課程》練習題庫01-選擇題_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

《爬蟲課程》練習題庫01-選擇題基本信息:[矩陣文本題]*年級專業(yè):________________________學號:________________________姓名:________________________1、下列不屬于常見爬蟲類型的是()。[單選題]*A、淺層網(wǎng)絡爬蟲(正確答案)B、聚焦網(wǎng)絡爬蟲C、增量式網(wǎng)絡爬蟲D、通用網(wǎng)絡爬蟲2、下列哪項不屬于解析網(wǎng)頁的庫?()[單選題]*A、lxmlB、beautifulsoup4C、正則表達式D、requests(正確答案)3、通過設(shè)置HTTP請求的哪個參數(shù)可以實現(xiàn)偽裝成瀏覽器訪問網(wǎng)頁?()[單選題]*A、paramsB、dataC、headers(正確答案)D、timeout4、下列哪個函數(shù)可以實現(xiàn)合并URL?()[單選題]*A、urlpase()B、urlencode()C、urljoin()(正確答案)D、quote()5、下列不屬于Response對象屬性的是()。[單選題]*A、contentB、txt(正確答案)C、textD、encoding6、下列不屬于HTML標簽的是()。[單選題]*A、href(正確答案)B、headC、aD、li7、lxml庫中選取屬性的語法是()。[單選題]*A、@(正確答案)B、.C、*D、//8、能夠在字符串“aabaaabaaaab”中匹配“aab”,而不能匹配“aaab”和“aaaab”的正則表達式為()。[單選題]*A、a{1,3}bB、aa??b(正確答案)C、aaa??bD、a*?b9、beautifulsoup4庫中遍歷整個HTML文件,按照條件返回所有匹配的節(jié)點元素的方法是()[單選題]*A、find()B、select()C、find_all()(正確答案)D、search()10、下列關(guān)于XPath描述錯誤的是()。[單選題]*A、text()方法可提取節(jié)點的文本內(nèi)容B、text()方法可用于選取包含指定文本內(nèi)容的節(jié)點C、contains()方法可用于選取以特定值開頭的節(jié)點(正確答案)D、and可用于選取同時包含兩種指定值的節(jié)點11、下列關(guān)于beutiflsoup4中Tag對象描述錯誤的是().[單選題]*A、string屬性可獲取Tag對象中的文本字符串內(nèi)容B、attrs屬性可獲取Tag對象的HTML屬性,返回值為列表形式(正確答案)C、contents屬性可獲取Tag對象子標簽的內(nèi)容D、name屬性可獲取Tag對象的名稱12、下列關(guān)于json庫中dumps()方法描述錯誤的是()。[單選題]*A、設(shè)置indent參數(shù)為2時,輸出時縮進2個字符B、如果需要輸出中文字符,設(shè)置ensure_ascii參數(shù)為FalseC、dumps()方法可將JSON對象寫入文件內(nèi)(正確答案)D、dumps()方法可生成一個字符串13、逆向分析請求頁面和取動態(tài)加載數(shù)據(jù)時選擇Network面板的哪個選項查看JavaScript加載的文件?()[單選題]*A、CSSB、DocC、XHR(正確答案)D、Media14、Seleniumn中瀏覽器對象通過下列哪個屬性或方法獲取HTML源代碼?()[單選題]*A、textB、currenturlC、tagnameD、page_source(正確答案)15、通過設(shè)置HTTP請求的哪個參數(shù)可以實現(xiàn)使用代理IP訪問網(wǎng)頁?()[單選題]*A、headersB、proxies(正確答案)C、paramsD、data16、下列Selenium庫的方法中,不能通過節(jié)點屬性進行多元素定位的是()。[單選題]*A、find_element_by_name()(正確答案)B、find_elements_by_class_name()C、find_elements_by_name()D、find_elements_by_id()17、HTTP響應狀態(tài)碼中表示訪問成功的是()。[單選題]*A、200(正確答案)B、501C、503D、40418、以下選項中哪一個不是正則表達式的元字符().[單選題]*A、$B、@(正確答案)C、^D、*19、switch_to.frame()的作用是()[單選題]*A、切換到另一個瀏覽器B、切換到另一個框架(正確答案)C、切換到另一個標簽頁D、切換到windows系統(tǒng)桌面20、Selenium中提供了多種元素定位方法,但不包括以下選項中的()[單選題]*A、find_element_by_id()B、find_element_by_xpath()C、find_elementby_page()(正確答案)D、find_elementby_class_name()21、使用selenium模塊打開谷歌瀏覽器,以下選項中正確的是()[單選題]*A、webdriver.GoogleB、webdriver.Google()C、webdriver.ChromeD、webdriver.Chrome()(正確答案)22、Requests模塊中,headers參數(shù)的作用是()。[單選題]*A、輸入網(wǎng)址B、模擬瀏覽器(正確答案)C、提供ip代理D、設(shè)置超時時間23、以下正則表達式中,屬于非貪婪匹配,且允許出現(xiàn)0次的是()[單選題]*A、.B、.*C、.*?(正確答案)D、.+?24、正則表達式R[0-9]{3},能匹配出以下哪個字符串()[單選題]*A、R3B、R03C、R09D、R093(正確答案)25、下列哪項不屬于爬取網(wǎng)頁的庫?()[單選題]*A、lxml(正確答案)B、requestsC、seleniumD、urllib26、下列不屬于selenium庫模擬瀏覽器操作的方法是()。[單選題]*A、forward()B、click()(正確答案)C、maximize_window()D、minimize_window()27、下列哪個函數(shù)可以實現(xiàn)判斷網(wǎng)頁是否可以爬取?()[單選題]*A、read()B、detect()C、set_url()D、can_fetch()(正確答案)28、MongoDB數(shù)據(jù)庫默認端口號是()。[單選題]*A、27017(正確答案)B、1521C、8888D、330629、MySQL數(shù)據(jù)庫默認端口號是()。[單選題]*A、8888B、27017C、3306(正確答案)D、637930、下列哪個函數(shù)可以實現(xiàn)不同模式圖像之間的轉(zhuǎn)換。()[單選題]*A、show()B、convert()(正確答案)C、open()D、save()31、,使用selenium中的方法定位該標簽,以下選項中正確的是()。[單選題]*A、find_element_by_id("wrapper")(正確答案)B、find_element_by_id("wrapper_new")C、find_element_by_class("wrapper_new")D、以上都可以32、關(guān)于open函數(shù)的操作模式,以下選項中哪一種既可以讀也可以寫()。[單選題]*A、aB、wC、a+(正確答案)D、wb33、下列哪項表示禁止爬取ABC文件夾下的文件?()[單選題]*A、Disallow:/ABC/(正確答案)B、Disallow:/ABCC、Disallow:/*?ABC*D、Disallow:/ABC/*.htm34、下列哪個函數(shù)可以檢測字符的編碼類型?()[單選題]*A、decode()B、encode()C、detect()(正確答案)D、Request()35、下列Tag對象的哪個屬性返回標簽包含的屬性?()[單選題]*A、nameB、contentsC、attrs(正確答案)D、string36、pymongo庫中實現(xiàn)插入數(shù)據(jù)的方法是()。[單選題]*A、find_one()B、insert_one()(正確答案)C、sort()D、delete_one()37、HTTP狀態(tài)碼中表示訪問成功的是()。[單選題]*A、200(正確答案)B、501C、503D、40438、以下選項中哪一個不是正則表達式的元字符()。[單選題]*A、$B、@(正確答案)C、^D、*39、下列關(guān)于urllib庫的說法錯誤的是()。[單選題]*A、是一個Python的標準庫B、由三個模塊組成(正確答案)C、urllib.error模塊是異常處理模塊D、urllib.parse模塊是用來解析URL的40、下列關(guān)于urlopen()函數(shù)的說法錯誤的是()[單選題]*A、data參數(shù)是可選的B、可以用于對目標URL的訪問C、設(shè)置data參數(shù)時,以POST方式發(fā)送請求D、不設(shè)置data參數(shù)時,以POST方式發(fā)送請求(正確答案)41、下列關(guān)于Requests庫的說法錯誤的是()[單選題]*A、是一個Python標準庫(正確答案)B、能夠發(fā)送HTTP請求C、能夠抓取二進制數(shù)據(jù)D、能夠發(fā)送HTTP請求頭42、下列關(guān)于lxml庫的說法正確的是()[單選題]*A、lxml是一個網(wǎng)絡庫B、lxml是一款高性能的HTML/XML解析庫(正確答案)C、僅支持利用XPath來選取節(jié)點D、lxml是一個Python的標準庫43、下列關(guān)于XPath的語法說法錯誤的是()[單選題]*A、‘/’選取當前節(jié)點的直接子節(jié)點B、‘@’選取屬性C、‘..’選取父節(jié)點D、‘//’選取當前節(jié)點的子節(jié)點(正確答案)44、下列說法錯誤的是()[單選題]*A、‘//*’選取整個HTML所有的節(jié)點B、‘//li/a’選?。糽i>節(jié)點下的所有<a>節(jié)點C、XPath不能做多屬性過濾(正確答案)D、XPath中的索引是從1開始的45、下列關(guān)于XPath中功能函數(shù)描述錯誤的是()[單選題]*A、contains()方法可用于選取以指定值開頭的節(jié)點(正確答案)B、and()方法可用于選取同時包含兩種指定值的節(jié)點C、text()函數(shù)可用于選取包含指定文本內(nèi)容的節(jié)點D、text()函數(shù)可提取節(jié)點文本內(nèi)容46、在MySQL數(shù)據(jù)庫中,下列說法錯誤的是()[單選題]*A、使用showdatabase命令顯示所有數(shù)據(jù)庫(正確答案)B、使用update命名修改數(shù)據(jù)C、使用delete命名刪除數(shù)據(jù)D、使用insertinto命名插入數(shù)據(jù)47、下列關(guān)于Chrome開發(fā)者工具描述錯誤的是()[單選題]*A、元素面板可查看元素在頁面的對應位置B、源代碼面板可查看HTML源碼C、網(wǎng)絡面板無法查看HTML源碼(正確答案)D、網(wǎng)絡面板可查看HTTP頭部信息48、下列關(guān)于BeautifulSoup中對象類型

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論