南開(kāi)大學(xué)(答案)2024春學(xué)期(高起本1709-2103、專(zhuān)升本高起專(zhuān)2003-2103)《網(wǎng)絡(luò)爬蟲(chóng)與信息提取》在線作業(yè)_第1頁(yè)
南開(kāi)大學(xué)(答案)2024春學(xué)期(高起本1709-2103、專(zhuān)升本高起專(zhuān)2003-2103)《網(wǎng)絡(luò)爬蟲(chóng)與信息提取》在線作業(yè)_第2頁(yè)
南開(kāi)大學(xué)(答案)2024春學(xué)期(高起本1709-2103、專(zhuān)升本高起專(zhuān)2003-2103)《網(wǎng)絡(luò)爬蟲(chóng)與信息提取》在線作業(yè)_第3頁(yè)
南開(kāi)大學(xué)(答案)2024春學(xué)期(高起本1709-2103、專(zhuān)升本高起專(zhuān)2003-2103)《網(wǎng)絡(luò)爬蟲(chóng)與信息提取》在線作業(yè)_第4頁(yè)
南開(kāi)大學(xué)(答案)2024春學(xué)期(高起本1709-2103、專(zhuān)升本高起專(zhuān)2003-2103)《網(wǎng)絡(luò)爬蟲(chóng)與信息提取》在線作業(yè)_第5頁(yè)
已閱讀5頁(yè),還剩11頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

24春學(xué)期(高起本:1709-2103、專(zhuān)升本/高起專(zhuān):2003-2103)《網(wǎng)絡(luò)爬蟲(chóng)與信息提取》在線作業(yè) 共50道題總分:100分 100分 單選題 多選題 判斷題 一、單選題 共20題,40分 1 2分 PyMongo中邏輯查詢表示小于的符號(hào)是() A$gt B$lt C$gte$$lte 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 正則表達(dá)式的基本符號(hào) 2 2分 Scrapy_redis是Scrapy的“()”,它已經(jīng)封裝了使用Scrapy操作Redis的各個(gè)方法 A組件 B模塊 C控件 D單元 我的得分:2分 我的答案:A 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): Scrapy與Redis 3 2分 在Linux中哪個(gè)命令是添加權(quán)限的() Achmod Bsudo Ccp Dmkdir 我的得分:2分 我的答案:A 解析: 暫無(wú)內(nèi)容 4 2分 如果很多爬蟲(chóng)同時(shí)對(duì)一個(gè)網(wǎng)站全速爬取,那么其實(shí)就是對(duì)網(wǎng)站進(jìn)行了()攻擊 AXSS BDOS CDDOS D跨域 我的得分:2分 我的答案:C 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 階段案例——小說(shuō)網(wǎng)站爬蟲(chóng)開(kāi)發(fā) 5 2分 下列說(shuō)法錯(cuò)誤的是() A小程序的請(qǐng)求極其簡(jiǎn)單,基本上沒(méi)有驗(yàn)證信息 B用Python來(lái)請(qǐng)求小程序的后臺(tái)接口從而獲取數(shù)據(jù),比請(qǐng)求異步加載網(wǎng)頁(yè)的后臺(tái)接口要復(fù)雜很多。 C如果目標(biāo)網(wǎng)站有微信小程序,那么一定要優(yōu)先調(diào)查能否通過(guò)小程序的接口來(lái)抓取數(shù)據(jù)。 D小程序的反爬蟲(chóng)能力比網(wǎng)頁(yè)版的低很多。使用小程序的接口來(lái)爬數(shù)據(jù),能極大提高爬蟲(chóng)的開(kāi)發(fā)效率。 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 異步加載與請(qǐng)求頭 6 2分 Python中列表可以用()方法在末尾添加元素 Aadd Bappend Cplus D+ 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): Python基礎(chǔ) findall方法 Python編譯器 7 2分 使用UIAutomatorr點(diǎn)亮屏幕的操作是得到相應(yīng)控件后使用命令() Awakeup Blight Cbright Dsleep 我的得分:2分 我的答案:A 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 文件操作 8 2分 ()是一個(gè)傳遞信息的通道。它負(fù)責(zé)將爬取博文列表頁(yè)獲取到的信息傳遞給負(fù)責(zé)爬取正文頁(yè)的方法中。 Ameta Bhead Cheader Dbody 我的得分:2分 我的答案:A 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 階段案例——樂(lè)視網(wǎng)爬取視頻 9 2分 使用UIAutomator打開(kāi)微信的操作是獲取相應(yīng)圖標(biāo)后使用命令() Atouch Bclick Cpush Dhover 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 文件操作 10 2分 Scrapy中使用Xpath獲得的結(jié)果調(diào)用了.extract方法,結(jié)果以()形式生成 A列表 B元組 C字典 D集合 我的得分:2分 我的答案:A 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): Scrapy的使用 11 2分 HTTP常用狀態(tài)碼表明服務(wù)器內(nèi)部資源出故障了的是() A500 B503 C403 D404 我的得分:2分 我的答案:A 解析: 暫無(wú)內(nèi)容 12 2分 當(dāng)需要把Python里面的數(shù)據(jù)發(fā)送給網(wǎng)頁(yè)時(shí),應(yīng)先將其轉(zhuǎn)換成() AJson字符串 BGET CPOST DRequest 我的得分:2分 我的答案:A 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): Python基礎(chǔ) Python與數(shù)據(jù)庫(kù) Python編譯器 13 2分 Redis若要進(jìn)入交互環(huán)境,需要打開(kāi)終端輸入() Aredis-cli Bredis Credis-cmd Dredis-start 我的得分:2分 我的答案:A 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): Redis的使用 14 2分 在Scrapy的目錄下,哪個(gè)文件負(fù)責(zé)存放爬蟲(chóng)文件?() Aspiders文件夾 Bitem.py Cpipeline.py Dsettings.py 我的得分:2分 我的答案:A 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 文件操作 15 2分 Python操作CSV文件可通過(guò)()容器的方式操作單元格 A列表 B元組 C字典 D集合 我的得分:2分 我的答案:C 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 文件操作 16 2分 Python正則表達(dá)式模塊的findall方法返回結(jié)果為() A列表 B元組 C字典 D集合 我的得分:2分 我的答案:A 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): findall方法 17 2分 以下關(guān)于Charles的說(shuō)法正確的是() ACharles是一個(gè)跨平臺(tái)的HTTP抓包工具,可以截取HTTP或者HTTPS請(qǐng)求的數(shù)據(jù)包 BCharles有Windows32/64版和Linux64版,但是目前還沒(méi)有對(duì)MacOS進(jìn)行有效的支持。 CCharles上面滾動(dòng)的數(shù)據(jù)就是目前計(jì)算機(jī)發(fā)起的數(shù)據(jù)包。單擊工具欄上面的黃色笤帚圖標(biāo),可以清停止抓包。 D在Charles啟動(dòng)時(shí),系統(tǒng)自帶瀏覽器的部分HTTP流量不會(huì)經(jīng)過(guò)Charles。 我的得分:2分 我的答案:A 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 使用Charles抓取數(shù)據(jù)包 18 2分 如果使用Python的數(shù)據(jù)結(jié)構(gòu)來(lái)做類(lèi)比的話,MongoDB中庫(kù)相當(dāng)于一個(gè)() A列表 B元組 C字典 D集合 我的得分:2分 我的答案:C 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): MongoDB的使用 MongoDB 19 2分 Redis中讀取數(shù)據(jù)語(yǔ)句lrangechapter03,那么表示讀列表中()個(gè)值 A2 B3 C4 D5 我的得分:2分 我的答案:C 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): Python的條件語(yǔ)句和循環(huán)語(yǔ)句 20 2分 Python正則表達(dá)式模塊的findall方法提取內(nèi)容包含多個(gè),則返回結(jié)果的列表中會(huì)包含() A列表 B元組 C字典 D集合 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): findall方法 二、多選題 共10題,20分 1 2分 一個(gè)可行的自動(dòng)更換代理的爬蟲(chóng)系統(tǒng),應(yīng)該下列哪些功能? A有一個(gè)小爬蟲(chóng)ProxySpider去各大代理網(wǎng)站爬取免費(fèi)代理并驗(yàn)證,將可以使用的代理IP保存到數(shù)據(jù)庫(kù)中 B在發(fā)現(xiàn)某個(gè)請(qǐng)求已經(jīng)被設(shè)置過(guò)代理后,什么也不做,直接返回 C在ProxyMiddlerware的process_request中,每次從數(shù)據(jù)庫(kù)里面隨機(jī)選擇一條代理IP地址使用 D周期性驗(yàn)證數(shù)據(jù)庫(kù)中的無(wú)效代理,及時(shí)將其刪除 我的得分:2分 我的答案:ACD 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 帶權(quán)限管理的反向代理 2 2分 Python中有哪些實(shí)現(xiàn)多線程方法() Amultiprocess.dummy Bthreading.Thread Cprocess DPyMongoDB 我的得分:2分 我的答案:BA 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): findall方法 Python基礎(chǔ) Python編譯器 3 2分 以下哪些可以獨(dú)立成為Python編譯器() APycharm BIDLE CEclipse DVisualStudio2010 我的得分:2分 我的答案:AB 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): Python編譯器 4 2分 網(wǎng)絡(luò)爬蟲(chóng)的用途有() A收集數(shù)據(jù) B盡職調(diào)查 C提高流量 D攻擊服務(wù)器 我的得分:2分 我的答案:ABC 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 網(wǎng)絡(luò)爬蟲(chóng)的用途 5 2分 HTTP常用狀態(tài)碼表明請(qǐng)求被正常處理的有() A200 B301 C302 D204 我的得分:2分 我的答案:AD 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 請(qǐng)求頭 6 2分 下列關(guān)于在IOS上配置charles的說(shuō)法正確的是() A不同ios設(shè)備之間會(huì)有比較大的差別,所以配置的時(shí)候需要找到對(duì)應(yīng)的安裝證書(shū)的入口。 B手機(jī)和電腦需要在同一個(gè)局域網(wǎng)下。 CHTTP代理可以使用“自動(dòng)”選項(xiàng)。 D安裝好證書(shū)以后,打開(kāi)iOS設(shè)備上的任何一個(gè)App,可以看到Charles中有數(shù)據(jù)包在流動(dòng) 我的得分:2分 我的答案:BD 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 使用Charles抓取數(shù)據(jù)包 7 2分 Python中一個(gè)函數(shù)沒(méi)有返回值則可以寫(xiě)() A沒(méi)有return Breturn CreturnNone DreturnNULL 我的得分:2分 我的答案:ABC 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): Python函數(shù)的定義和使用 8 2分 最常見(jiàn)的HTTP請(qǐng)求類(lèi)型有() AGET BPOST CSEND DRECEIVE 我的得分:2分 我的答案:BA 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 請(qǐng)求頭 9 2分 HTTP常用狀態(tài)碼表明表明服務(wù)器本身發(fā)生錯(cuò)誤的有() A403 B404 C500 D503 我的得分:2分 我的答案:CD 解析: 暫無(wú)內(nèi)容 10 2分 自動(dòng)填充驗(yàn)證碼的方式有 A手動(dòng)識(shí)別填寫(xiě) B圖像識(shí)別 C打碼網(wǎng)站 D瀏覽器自動(dòng)識(shí)別 我的得分:2分 我的答案:BC 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 填充驗(yàn)證碼 三、判斷題 共20題,40分 1 2分 微信小程序的反爬蟲(chóng)能力要比網(wǎng)頁(yè)的高很多。 A對(duì) B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): App爬蟲(chóng)和小程序爬蟲(chóng) 2 2分 Python中寫(xiě)CSV文件的writerows方法參數(shù)為字典類(lèi)型 A對(duì) B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): Python編譯器 字典與集合 Python基礎(chǔ) 3 2分 Redis插入數(shù)據(jù)都是插入到列表右側(cè),因此讀取數(shù)據(jù)也是從右側(cè)讀取 A對(duì) B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): Redis的使用 4 2分 UIAutomatorViewer與Pythonuiautomator可以同時(shí)使用 A對(duì) B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): Python編譯器 Python與數(shù)據(jù)庫(kù) Python基礎(chǔ) 5 2分 robots.txt是一種規(guī)范,在法律范疇內(nèi) A對(duì) B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 爬蟲(chóng)開(kāi)發(fā)中的法律和道德問(wèn)題 6 2分 雖然MongoDB相比于MySQL來(lái)說(shuō),速度快了很多,但是頻繁讀寫(xiě)MongoDB還是會(huì)嚴(yán)重拖慢程序的執(zhí)行速度。 A對(duì) B錯(cuò) 我的得分:2分 我的答案:A 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): MongoDB MongoDB的使用 7 2分 上課傳紙條。A要把紙條傳給B,但是A與B距離太遠(yuǎn),于是讓C來(lái)轉(zhuǎn)交紙條。此時(shí),C先篡改紙條的內(nèi)容再傳給B,這是一種類(lèi)似抓包的方式。 A對(duì) B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 8 2分 默認(rèn)情況下,MongoDB可以通過(guò)外網(wǎng)訪問(wèn) A對(duì) B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): MongoDB的使用 MongoDB 9 2分 使用AJAX技術(shù),可以在不刷新網(wǎng)頁(yè)的情況下更新網(wǎng)頁(yè)數(shù)據(jù) A對(duì) B錯(cuò) 我的得分:2分 我的答案:A 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 簡(jiǎn)單的網(wǎng)頁(yè)爬蟲(chóng)方法 10 2分 Charles能截獲HTTP和HTTPS的數(shù)據(jù)包,如果網(wǎng)站使用websocket就可以截獲。 A對(duì) B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 使用Charles抓取數(shù)據(jù)包 11 2分 如果元組里面只有整數(shù)、浮點(diǎn)數(shù)、字符串、一個(gè)列表,就既不能添加數(shù)據(jù),也不能刪除數(shù)據(jù),還不能修改里面數(shù)據(jù)的值。 A對(duì) B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 字符串、列表、元組 12 2分 HTTP狀態(tài)碼302表示資源永久重定向。 A對(duì) B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 13 2分 對(duì)Charles設(shè)置代理時(shí),Ip可以設(shè)置為,端口為8888. A對(duì) B錯(cuò) 我的得分:2分 我的答案:A 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): 使用Charles抓取數(shù)據(jù)包 14 2分 使用Charles,可以輕松截獲手機(jī)App和微信小程序的數(shù)據(jù)包,從而開(kāi)發(fā)出直接抓取App后臺(tái)和小程序后臺(tái)的爬蟲(chóng)。 A對(duì) B錯(cuò) 我的得分:2分 我的答案:A 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): App爬蟲(chóng)和小程序爬蟲(chóng) 15 2分 在Windows中下若要運(yùn)行Redis可以運(yùn)行redis-server/usr/local/etc/redis.conf A對(duì) B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): Python的安裝和運(yùn)行 16 2分 PyMongoDB中排序方法sort第二個(gè)參數(shù)-1表示升序 A對(duì) B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無(wú)內(nèi)容 相關(guān)知識(shí)點(diǎn): findall方法 17 2分 Redis的集合與Python的集合一樣,沒(méi)有順序,值不重復(fù) A對(duì) B錯(cuò) 我的得分:2分 我的答案:A 解析: 暫無(wú)內(nèi)容 相

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論