數(shù)據(jù)采集1+x初級(jí)題庫(kù)(含答案)_第1頁(yè)
數(shù)據(jù)采集1+x初級(jí)題庫(kù)(含答案)_第2頁(yè)
數(shù)據(jù)采集1+x初級(jí)題庫(kù)(含答案)_第3頁(yè)
數(shù)據(jù)采集1+x初級(jí)題庫(kù)(含答案)_第4頁(yè)
數(shù)據(jù)采集1+x初級(jí)題庫(kù)(含答案)_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)采集1+x初級(jí)題庫(kù)(含答案)一、單選題(共40題,每題1分,共40分)1、以下選項(xiàng)中,不是Python語(yǔ)言特點(diǎn)的是A、黏性擴(kuò)展:Python語(yǔ)言能夠集成C、C.++等語(yǔ)言編寫的代碼B、變量聲明:Python語(yǔ)言具有使用變量需要先定義后使用的特點(diǎn)C、平臺(tái)無(wú)關(guān):Python程序可以在任何安裝了解釋器的操作系統(tǒng)環(huán)境中執(zhí)行D、強(qiáng)制可讀:Python語(yǔ)言通過強(qiáng)制縮進(jìn)來(lái)體現(xiàn)語(yǔ)句間的邏輯關(guān)系正確答案:B2、Scrapy中,用于自定義所有Scrapy組件的行為的是()。A、SpiderB、ItemC、piplineD、settings正確答案:D3、以下屬于應(yīng)用層協(xié)議的是()A、FTPB、IPC、TCPD、UDP正確答案:A4、下列不是手機(jī)操作系統(tǒng)的是?()A、WindowsVistaB、Window?MobileC、AndroidD、IOS正確答案:A5、使用scrapy框架編寫爬蟲,setting.py文件中有些配置項(xiàng)需要修改,比如ROBOTSTXT_OBEY的值一般情況下設(shè)置為A、1B、FalseC、TrueD、0正確答案:B6、關(guān)于Python,算法是指()A、程序設(shè)計(jì)語(yǔ)言的語(yǔ)句序列B、對(duì)問題的精確描述C、數(shù)學(xué)的計(jì)算公式D、解決問題的精確步驟正確答案:D7、服務(wù)器端響應(yīng)狀態(tài)碼中,表示“OK,文檔正確返回”的是A、304B、200C、302D、404正確答案:B8、Apache服務(wù)器運(yùn)行后會(huì)生成兩個(gè)日志文件,訪問日志是哪個(gè)文件()A、errors_logB、access_logC、error_logD、access_logs正確答案:B9、CSS中通過哪個(gè)屬性設(shè)定元素的背景圖像()A、imageB、background-attachmentC、background-positionD、background-image正確答案:D10、Python文件的后綴名是()。A、goB、doC、pyD、php正確答案:C11、下列不屬于操作系統(tǒng)類型的是()。A、實(shí)時(shí)系統(tǒng)B、分時(shí)系統(tǒng)C、批處理系統(tǒng)D、模擬系統(tǒng)正確答案:D12、python編寫爬蟲過程中,需要將爬取的網(wǎng)頁(yè)內(nèi)容轉(zhuǎn)換為哪種類型的對(duì)象才可以使用etree模塊的xpath方法()A、ResponseB、ElementC、DOMD、HTML正確答案:B13、以下選項(xiàng)中不是Python對(duì)文件的寫操作方法的是()A、write和seekB、writetextC、writelinesD、write正確答案:B14、當(dāng)前INTERNET上應(yīng)用最廣泛的服務(wù)是A、E-MailB、WWWC、40個(gè)以上D、30~40個(gè)正確答案:B15、正則表達(dá)式“[a-z_]”表示的含義是()A、取所有小寫英文字母以及_中的任意一個(gè)。B、取所有小寫英文字母以及_中的任意多個(gè)。C、取“a、-、z、_”中的任意一個(gè)。D、取“a、-、z、_”中的任意多個(gè)。正確答案:A16、關(guān)于異步請(qǐng)求的說法錯(cuò)誤的是A、通常用于獲取頁(yè)面局部的數(shù)據(jù),但需要對(duì)頁(yè)面整體進(jìn)行刷新B、通過XMLHttpRequest對(duì)象可以實(shí)現(xiàn)與服務(wù)器的異步交互C、通常使用JSON格式進(jìn)行數(shù)據(jù)的交互,但也有可能是其它格式D、能夠提升用戶的體驗(yàn)正確答案:A17、以下選項(xiàng)中符合Python語(yǔ)言變量命名規(guī)則的是A、AI!B、*iC、3_1D、Templist正確答案:D18、服務(wù)器端響應(yīng)狀態(tài)碼中,表示“NOTFOUND未找到”的是A、304B、302C、404D、200正確答案:C19、Python語(yǔ)言中用來(lái)定義函數(shù)的關(guān)鍵字是A、defineB、defC、functionD、return正確答案:B20、網(wǎng)絡(luò)層以上的中繼系統(tǒng)是()A、路由器B、轉(zhuǎn)發(fā)器C、網(wǎng)橋D、網(wǎng)關(guān)正確答案:D21、使用Xpath獲取一篇HTML文檔中所有超鏈接的href屬性,Xpath代碼為()。A、//@hrefB、/a/@hrefC、/a/hrefD、//a/@href正確答案:D22、以下聚合函數(shù)求平均數(shù)的是()A、COUNTB、AVGC、MAXD、SUM正確答案:B23、Python源程序執(zhí)行的方式()A、編譯執(zhí)行B、解析執(zhí)行C、直接執(zhí)行D、邊編譯邊執(zhí)行正確答案:B24、數(shù)據(jù)庫(kù)結(jié)構(gòu)的描述和定義是DBMS運(yùn)行的基本依據(jù),它們存儲(chǔ)于()A、封鎖表B、索引C、日志D、數(shù)據(jù)字典正確答案:D25、查找表結(jié)構(gòu)用以下哪一項(xiàng)A、SELETEB、ALTERC、FINDD、DESC正確答案:D26、關(guān)于數(shù)據(jù)類型,說法不正確的是()A、結(jié)構(gòu)化數(shù)據(jù)是指具有固定格式的數(shù)據(jù)B、非結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)不規(guī)則或不完整,沒有預(yù)定義的數(shù)據(jù)模型C、半結(jié)構(gòu)化數(shù)據(jù)介于結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)之間D、以上說法都不正確正確答案:D27、()是進(jìn)行數(shù)據(jù)清洗的工具。A、filebeatB、apacheC、tomcatD、logstash正確答案:D28、ARP協(xié)議主要作用是()A、域名地址到IP地址的解析B、IP地址到域名地址的解析C、物理地址到IP地址的解析D、IP地址到物理地址的解析正確答案:D29、在Internet上瀏覽時(shí),瀏覽器和WWW服務(wù)器之間傳輸網(wǎng)頁(yè)使用的協(xié)議是:A、WWWB、HTTPC、telnetD、ARP正確答案:B30、在操作系統(tǒng)中,多個(gè)進(jìn)程請(qǐng)求相同資源而引起的無(wú)休止的相互等待的過程叫做()A、掛起B(yǎng)、阻塞C、死鎖D、中斷正確答案:C31、分析以下SQL命令:SELECTpriceFROMinventoryWHEREpriceBETWEEN1AND50AND(priceIN(55.30.95);命令執(zhí)行后的最可能的輸出結(jié)果是A、30B、55C、95D、51正確答案:A32、“內(nèi)容為一個(gè)URL,標(biāo)識(shí)用戶從該URL代表的頁(yè)面出發(fā)訪問當(dāng)前請(qǐng)求的頁(yè)面”以上描述所指的消息頭是()。A、ConnectionB、User-AgentC、AcceptD、Referer正確答案:D33、Logstash的數(shù)據(jù)輸出中,標(biāo)準(zhǔn)輸出是下列哪個(gè)選項(xiàng)A、elasticsearchB、csvC、fileD、stdout正確答案:D34、層次型、網(wǎng)狀型和關(guān)系型數(shù)據(jù)庫(kù)劃分原則是()A、聯(lián)系的復(fù)雜程度B、文件的大小C、數(shù)據(jù)之間的聯(lián)系D、記錄長(zhǎng)度正確答案:C35、關(guān)于Python語(yǔ)言的注釋,以下選項(xiàng)中描述錯(cuò)誤的是A、Python語(yǔ)言的多行注釋以’’'(三個(gè)單引號(hào))開頭和結(jié)尾B、Python語(yǔ)言有兩種注釋方式:?jiǎn)涡凶⑨尯投嘈凶⑨孋、Python語(yǔ)言的單行注釋以單引號(hào)’開頭D、Python語(yǔ)言的單行注釋以#開頭正確答案:C36、Tomcat容器數(shù)據(jù)采集中檢查JDK的版本命令為()A、checkversionB、javacC、javaversionD、java-version正確答案:D37、FTP主要功能是()A、滿足應(yīng)用B、遠(yuǎn)程訪問C、文件傳輸D、電子商務(wù)正確答案:C38、下列哪些屬于()規(guī)范數(shù)據(jù)信息收集的方式與要求A、未經(jīng)用戶同意,電信業(yè)務(wù)經(jīng)營(yíng)者、互聯(lián)網(wǎng)信息服務(wù)提供者不得收集、使用用戶個(gè)人信息B、自然人的個(gè)人信息受法律保護(hù)C、網(wǎng)絡(luò)運(yùn)營(yíng)者應(yīng)當(dāng)對(duì)其收集的用戶信息嚴(yán)格保密,并建立健全用戶信息保護(hù)制度D、發(fā)現(xiàn)網(wǎng)絡(luò)運(yùn)營(yíng)者收集、存儲(chǔ)的其個(gè)人信息有錯(cuò)誤的,有權(quán)要求網(wǎng)絡(luò)運(yùn)營(yíng)者予以更正正確答案:B39、搜索引擎優(yōu)化和網(wǎng)絡(luò)營(yíng)銷的縮寫分別是()A、SEO和UEOB、UEO和SEMC、SEO和SEMD、SEM和SEO正確答案:C40、Python中,以下何者是不合法的布爾表達(dá)式?()A、3=aB、e>5and4==fC、(x-6)>5D、xinrange(6)正確答案:A二、多選題(共20題,每題1分,共20分)1、下列屬于Linux發(fā)行版操作系統(tǒng)的是()A、UbuntuB、CentosC、RedHatD、Solaris正確答案:ABC2、以下屬于jQuery選擇器的是()A、過濾選擇器B、.class選擇器C、元素選擇器D、id選擇器正確答案:ABCD3、以下CSS中,屬于font屬性的是()。A、font-styleB、font-weightC、sizeD、font-size正確答案:ABD4、對(duì)于日志類型的數(shù)據(jù)采集,常用的采集工具有A、logstashB、scrapyC、beautifulSoupD、filebeat正確答案:AD5、以下哪些是Python的保留字和關(guān)鍵字()。A、DefB、classC、importD、Global正確答案:BC6、BeautifulSoup支持Python標(biāo)準(zhǔn)庫(kù)中的HTML解析器以及一些第三方的解析器,常見的解析器有()。A、html5libB、lxmlHTML解析器C、lxmlXML解析器D、Python標(biāo)準(zhǔn)庫(kù)正確答案:ABCD7、數(shù)據(jù)采集的類型包括()A、結(jié)構(gòu)化數(shù)據(jù)B、半結(jié)構(gòu)化數(shù)據(jù)C、非結(jié)構(gòu)化數(shù)據(jù)D、以上都不屬于數(shù)據(jù)采集的類型正確答案:ABC8、下列哪些概念不是為了提高數(shù)據(jù)庫(kù)的訪問速度而存在()A、外鍵B、視圖C、關(guān)系D、索引正確答案:ABC9、網(wǎng)絡(luò)爬蟲按照系統(tǒng)結(jié)構(gòu)和實(shí)現(xiàn)技術(shù),可以有以下類型()。A、通用網(wǎng)絡(luò)爬蟲B、增量式網(wǎng)絡(luò)爬蟲C、深層頁(yè)面爬蟲D、聚焦網(wǎng)絡(luò)爬蟲正確答案:ABCD10、在CSS3里可以使用以下()方法,將樣式表的功能加到網(wǎng)頁(yè)里。A、嵌入外部樣式表B、鏈接外部樣式表C、定義標(biāo)記的style屬性D、定義內(nèi)部樣式正確答案:ABCD11、以下屬于CSS選擇器的是()A、類選擇器B、ID選擇器C、標(biāo)簽選擇器D、偽類選擇器正確答案:ABCD12、以下對(duì)網(wǎng)站排名有較大影響的因素是()A、服務(wù)器穩(wěn)定性B、Title標(biāo)簽C、網(wǎng)站內(nèi)容D、Keywords標(biāo)簽正確答案:ABC13、正則表達(dá)式中表示數(shù)量的元字符包括A、*B、.C、+D、?正確答案:ACD14、urllib的urlopen方法的參數(shù),至少是()或()中的一個(gè)。A、urlB、Request對(duì)象C、headersD、data正確答案:AB15、關(guān)于select語(yǔ)句下列說法正確的是()A、select(name)fromtableperson:所有記錄的name字段的值B、select(name)fromtablepersonwhereage=12;查找age=12的記錄的那個(gè)字段的值C、select(name,age)frompersonwhereage=12andname="aa";and并且D、select(name)frompersonwhereage=12orname="aa";or或者正確答案:CD16、以下選項(xiàng)中是操作系統(tǒng)的是()A、DOSB、Windows95C、RedhatD、MSWord正確答案:ABC17、業(yè)務(wù)系統(tǒng)中產(chǎn)生的日志數(shù)據(jù)有哪些作用()A、安全管理B、跟蹤系統(tǒng)的運(yùn)行C、優(yōu)化系統(tǒng)性能D、為企業(yè)應(yīng)用系統(tǒng)糾錯(cuò)正確答案:ABCD18、以下選項(xiàng)中,屬于jQuery事件方法的是()A、mouseover()B、focus()C、click()D、find()正確答案:ABC19、下面哪個(gè)不是Python合法的標(biāo)識(shí)符()A、int32B、3selfC、__name__D、40XL正確答案:BD20、Windows事件日志中的事件類型主要有信息事件和()。A、錯(cuò)誤事件B、失敗審核事件C、成功審核事件D、警告事件正確答案:ABCD三、判斷題(共40題,每題1分,共40分)1、在SDH傳輸網(wǎng)中,每個(gè)節(jié)點(diǎn)由TM構(gòu)成。A、正確B、錯(cuò)誤正確答案:B2、大數(shù)據(jù)采集一般數(shù)據(jù)量大、數(shù)據(jù)面廣,因此信息采集執(zhí)行效率相對(duì)低效且獲取數(shù)據(jù)不追求及時(shí)性A、正確B、錯(cuò)誤正確答案:B3、HTTP協(xié)議是以TCP協(xié)議為基礎(chǔ)的,因此瀏覽器與服務(wù)器會(huì)建立持久連接A、正確B、錯(cuò)誤正確答案:B4、list(map(str,[1,2,3]))的執(zhí)行結(jié)果為[1],[2],[3]A、正確B、錯(cuò)誤正確答案:B5、決定局域網(wǎng)特性的主要技術(shù)是傳輸介質(zhì)、拓?fù)浣Y(jié)構(gòu)和介質(zhì)訪問控制方法,其中最重要的是傳輸介質(zhì)A、正確B、錯(cuò)誤正確答案:B6、Scheduler(調(diào)度器)用于從特定的網(wǎng)頁(yè)中提取自己需要的信息,即所謂的實(shí)體(Item)。A、正確B、錯(cuò)誤正確答案:B7、事務(wù)的結(jié)束并提交能使用commit命令A(yù)、正確B、錯(cuò)誤正確答案:A8、絕對(duì)路徑名都是從根目錄開始。A、正確B、錯(cuò)誤正確答案:A9、傳輸層是通過建立物理連接來(lái)進(jìn)行數(shù)據(jù)傳輸?shù)腁、正確B、錯(cuò)誤正確答案:B10、Tomcat作為獨(dú)立服務(wù)器,請(qǐng)求來(lái)自于web瀏覽器。A、正確B、錯(cuò)誤正確答案:A11、RARP逆向地址解析協(xié)議主要用于傳輸差錯(cuò)及控制報(bào)文。A、正確B、錯(cuò)誤正確答案:B12、Apache默認(rèn)端口是8080,通過修改httpd.conf可以修改其端口A、正確B、錯(cuò)誤正確答案:B13、在數(shù)據(jù)庫(kù)的概念設(shè)計(jì)中,最常用的數(shù)據(jù)模型是實(shí)體聯(lián)系模型A、正確B、錯(cuò)誤正確答案:A14、type()函數(shù)是可以查看變量類型的Python內(nèi)置函數(shù)A、正確B、錯(cuò)誤正確答案:A15、類中的函數(shù)稱為方法A、正確B、錯(cuò)誤正確答案:A16、Oracle是一種是NoSQL數(shù)據(jù)庫(kù)。A、正確B、錯(cuò)誤正確答案:B17、BeautifulSoup是一個(gè)可以從HTML或XML文件中提取數(shù)據(jù)的Python庫(kù)。A、正確B、錯(cuò)誤正確答案:A18、基于交換機(jī)的端口劃分VLAN是靜態(tài)VLAN。A、正確B、錯(cuò)誤正確答案:A19、定義list1=[1,1,1,3,4],可執(zhí)行l(wèi)ist(set(list1)),去掉重復(fù)元素A、正確B、錯(cuò)誤正確答案:A20、HTTP的head消息“referer”的作用是告知服務(wù)器是從哪個(gè)資源轉(zhuǎn)到當(dāng)前資源上來(lái)的。A、正確B、錯(cuò)誤正確答案:A21、一級(jí)域名又稱頂級(jí)域名,域名一般由域名關(guān)鍵詞和域名類別兩部分組成,中間用點(diǎn)分隔開。A、正確B、錯(cuò)誤正確答案:A22、response請(qǐng)求模塊,用來(lái)處理客戶端發(fā)送到服務(wù)器端的請(qǐng)求。A、正確B、錯(cuò)誤正確答案:B23、在xpath中,位置路徑可以是絕對(duì)的,也可以是相對(duì)的。A、正確B、錯(cuò)誤正確答案:A24、數(shù)據(jù)加密DES的保密性僅取決于對(duì)密鑰的保密,而算法是公開的。A、正確B、錯(cuò)誤正確答案:A25、logstash工具是服務(wù)器A、正確B、錯(cuò)誤正確答案:B26、re模塊的search方法將對(duì)輸入的字符串整個(gè)掃描,對(duì)輸入的正則表達(dá)式進(jìn)行匹配,獲取匹配結(jié)果,否則輸出NoneA、正確B、錯(cuò)誤正確答案:A27、在數(shù)據(jù)庫(kù)中,允許空值的字段上可以定義主鍵約束

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論