數(shù)據(jù)采集1+x中級試題(附參考答案)_第1頁
數(shù)據(jù)采集1+x中級試題(附參考答案)_第2頁
數(shù)據(jù)采集1+x中級試題(附參考答案)_第3頁
數(shù)據(jù)采集1+x中級試題(附參考答案)_第4頁
數(shù)據(jù)采集1+x中級試題(附參考答案)_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

數(shù)據(jù)采集1+x中級試題(附參考答案)一、單選題(共63題,每題1分,共63分)1.Apache服務器中檢驗配置是否有語法錯誤代碼為()A、apachectlconfigtestB、apachectlconfigtest01C、apachectlD、testlog正確答案:A2.使用Web瀏覽器訪問FTP時A、只能下載文件,不能上傳文件B、用b瀏覽根本無法訪問TPC、只能上傳文件,不能下載文件D、既能上傳文件,也能下載文件正確答案:A3.scrapy框架的運行流程中,()組件是scrapy框架的核心組件A、DownLoaderB、ScrapyEngineC、SchedulerD、Spiders正確答案:B4.Apache服務器運行后會生成的日志文件,在()目錄中A、/etc/httpd/logs1/B、/etc/httpd/log/C、/etc/httpd/logs/D、httpd/logs/正確答案:C5.操作系統(tǒng)中,系統(tǒng)管理員常用的二進制命令文件,一般放置在()目錄下。A、/usr/sbinB、/sbinC、/bootD、/root正確答案:B6.使用Xpath獲取一篇HTML文檔中所有超鏈接的href屬性,Xpath代碼為()。A、/a/@hrefB、//a/@hrefC、//@hrefD、/a/href正確答案:B7.從傳統(tǒng)的公司網(wǎng)絡架構遷移到完全融合網(wǎng)絡后,很可能產(chǎn)生什么影響?A、可將本地模擬電話服務完全外包給收費更低的提供商B、以太網(wǎng)VLAN結(jié)構會簡化C、會形成共享的基礎架構,因此只需管理一個網(wǎng)絡D、語音數(shù)據(jù)流和視頻數(shù)據(jù)流爭奪帶寬的問題會減輕正確答案:C8.以下可用于日志數(shù)據(jù)采集的工具是()。A、八爪魚采集器B、filebeatC、logstashD、Wireshark正確答案:B9.Python中,下列標識符中哪個是合法的?()A、3QB、i'mC、_D、for正確答案:C10.關于網(wǎng)絡數(shù)據(jù)采集,描述正確的是()A、可通過網(wǎng)絡爬蟲技術從公開網(wǎng)站或API獲取數(shù)據(jù)信息B、網(wǎng)頁抓取過程中,會抓取所有滿足條件的URLC、爬取的數(shù)據(jù)經(jīng)適當處理后進行存儲D、以上都正確正確答案:D11.哪個表達式用來選取當前節(jié)點的父節(jié)點?A、..B、/C、.D、@正確答案:A12.假設某字段所要存儲的數(shù)值介于0~100,且不具備小數(shù),則此字段采用哪種數(shù)據(jù)類型最合適A、數(shù)值類型B、雙精度類型C、浮動數(shù)據(jù)類型D、整型類型正確答案:D13.以下選項中,不是Python對文件的打開模式的是()A、'w'B、'c'C、'+'D、'r'正確答案:B14.數(shù)字法表示的權限中數(shù)字5代表()A、寫運行B、讀寫運行C、讀運行D、讀寫正確答案:C15.在OSI的七層參考模型中,工作在第三層上的網(wǎng)絡設備是()A、集線器B、網(wǎng)關C、交換機D、路由器正確答案:D16.數(shù)據(jù)采集是利用一種裝置或程序從系統(tǒng)外部采集數(shù)據(jù)并輸入到系統(tǒng)內(nèi)部的一個()A、接口B、方式C、語言D、模型正確答案:A17.數(shù)據(jù)傳輸可靠性的指標是()A、頻帶利用率B、誤碼率C、信息容量D、傳輸率正確答案:B18.密碼(以字母開頭,長度在6~18之間,只能包含字母、數(shù)字和下劃線)是哪個?A、^[a-zA-Z]w{5.17}B、^[a-zA-Z]{5.17}$C、^[a-zA-Z]w{5.17}$D、^[a-zA-Z]w{6.18}$正確答案:C19.以下選項中,不符合Python語言變量命名規(guī)則的是A、_33keywordB、keyword33_C、33_keywordD、keyword_33正確答案:C20.以下關于xpath的描述,不正確的是A、使用Xpath技術可以獲取整個網(wǎng)頁的內(nèi)容B、它能在XML和HTML的樹狀結(jié)構中尋找結(jié)點C、XPath(XMLPath)是一種查詢語言D、用XPath從HTML源代碼中提取信息可以大大提高效率正確答案:A21.關于/etc/fstab文件下邊哪個描述是正確的()A、用于設置命名規(guī)則,是否使用可以用tab來命名一個文件B、用于管理文件系統(tǒng)信息C、系統(tǒng)啟動后,由系統(tǒng)自動產(chǎn)生D、保存硬件信息正確答案:B22.公司中有多個部門和多名職員,每個職員只能屬于一個部門,一個部門可以有多名職員,從部門到職員的聯(lián)系類型是()A、多對一B、一對一C、一對多D、多對多正確答案:C23.關于lambda函數(shù),以下選項中描述錯誤的是()A、lambda函數(shù)也稱為匿名函數(shù)B、定義了一種特殊的函數(shù)C、lambda不是Python的保留字D、lambda函數(shù)將函數(shù)名作為函數(shù)結(jié)果返回正確答案:C24.用"useraddstd命令添加一個用戶,這個用戶的主目錄是()"A、/etc/stdB、/home/stdC、/var/stdD、/bin/std正確答案:B25.以下選項中不可用作Python標識符的是A、NameB、PiC、姓名D、3.14正確答案:D26.在XPath中,有()種類型的節(jié)點?A、七B、八C、九D、六正確答案:A27.HTML文檔結(jié)構中,用于定義文檔顯示哪些內(nèi)容的標簽是()A、<frame></frame>B、<head></head>C、<HTML></HTML>D、<body></body>正確答案:D28.以下數(shù)據(jù)庫中,不是關系數(shù)據(jù)庫的為()。A、MysqlB、RedisC、SqlServerD、Oracle正確答案:B29.filebeat的默認配置文件名稱為()A、filebeatB、filebeat.configC、filebeat.cfgD、filebeat.yml正確答案:D30.以下哪個是關系型數(shù)據(jù)庫()。A、MySQLB、RedisC、NoSqlD、Hba正確答案:A31.以下選項中,Python語言中代碼注釋使用的符號是A、/……/B、!C、//D、#正確答案:D32.網(wǎng)絡監(jiān)測技術sFlow報文采用什么協(xié)議封裝A、UDPB、IPC、TCPD、HTTP正確答案:A33.表示商業(yè)公司的一級域名是A、netB、orgC、eduD、com正確答案:D34.以下關于模塊說法錯誤的是()A、任何一個普通的xx.py文件可以作為模塊導入B、模塊文件的擴展名不一定是.pyC、運行時會從制定的目錄搜索導入的模塊,如果沒有,會報錯異常D、一個xx.py就是一個模塊正確答案:B35.求負整數(shù)的表達式是哪個?A、^d+$?B、^-?d+$C、^d+$D、d+$正確答案:C36.一個典型的NetStream系統(tǒng)不包含哪一部分()A、網(wǎng)絡流數(shù)據(jù)輸出器NDEB、網(wǎng)絡流數(shù)據(jù)收集器NSCC、網(wǎng)絡流數(shù)據(jù)分析器NDAD、網(wǎng)絡流數(shù)據(jù)存儲器NDS正確答案:D37.Python中,設s="HappyNewYear.則s[3:8]的值為():"A、"pyNew"B、"ppyN"C、"pyNe"D、"ppyNe正確答案:C38.任何個人和組織不得從事非法侵入他人網(wǎng)絡、干擾他人網(wǎng)絡正常功能、竊取網(wǎng)絡數(shù)據(jù)等危害網(wǎng)絡安全的活動是在()法律中規(guī)定的A、《中華人民共和國網(wǎng)絡安全法》B、《民法總則》C、《電信和互聯(lián)網(wǎng)用戶個人信息保護規(guī)定》D、《用戶個人信息保護法》正確答案:A39.數(shù)據(jù)庫的特點之一是數(shù)據(jù)的共享,嚴格地講,這里的數(shù)據(jù)共享是指A、多個用戶共享一個數(shù)據(jù)文件B、同一個應用中的多個程序共享一個數(shù)據(jù)集合C、多種應用、多種語言、多個用戶相互覆蓋地使用數(shù)據(jù)集合D、多個用戶、同一種語言共享數(shù)據(jù)正確答案:C40.以下關于GET和POST請求的區(qū)別,錯誤的是A、Get執(zhí)行效率卻比Post方法好。B、Get限制Form表單的數(shù)據(jù)集的值必須為ASCII字符;而Post支持整個ISO10646字符集。C、Get傳送的數(shù)據(jù)量較小,這主要是因為受URL長度限制;Post傳送的數(shù)據(jù)量較大,一般被默認為不受限制。D、POST是form提交的默認方法。正確答案:D41.關于Python賦值語句,以下選項中不合法的是()。A、x=1;y=1B、x.y=y.xC、x=y=1D、x=(y=1)正確答案:D42.以下()命令可正確顯示shell環(huán)境變量PATH的值A、echoPATHB、echo$PATHC、catPATHD、cat$PATH正確答案:B43.在vi編輯器的命令模式中敲擊dd會()A、刪除2行B、復制2行C、刪除當前光標所在行D、復制當前光標所在行正確答案:C44.關于ATM描述正確的是()A、是分組交換和報文交換技術的組合B、是電路交換和分組交換技術的組合C、是分組交換和幀交換技術的組合D、是報文交換和電路交互技術的組合正確答案:B45.你給公司的新同事創(chuàng)建一個用戶,起指定他的賬號在30天過期,現(xiàn)在想更改過期時間,使用下邊哪個命令更合適()A、usermod-dB、usermod-aC、usermod-xD、usermod-e正確答案:D46.關于Python程序中與“縮進”有關的說法中,以下選項中正確的是()A、縮進統(tǒng)一為4個空格B、縮進是非強制性的,僅為了提高代碼可讀性C、縮進在程序中長度統(tǒng)一且強制使用D、縮進可以用在任何語句之后,表示語句間的包含關系正確答案:C47.哪種方式可以將外部CSS樣式文件嵌入網(wǎng)頁()A、<linktype="text/cssrel="stylesheet"src="外部樣式表的文件名稱">B、<linktype="text/css"rel="stylesheet"href="外部樣式表的文件名稱">C、<linkhref="外部樣式表的文件名稱">D、<linksrc="外部樣式表的文件名稱">正確答案:B48.下列不屬于操作系統(tǒng)類型的是()。A、批處理系統(tǒng)B、模擬系統(tǒng)C、實時系統(tǒng)D、分時系統(tǒng)正確答案:B49.關于Python語言的浮點數(shù)類型,以下選項中描述錯誤的是A、浮點數(shù)類型表示帶有小數(shù)的類型B、Python語言要求所有浮點數(shù)必須帶有小數(shù)部分C、小數(shù)部分不可以為0D、浮點數(shù)類型與數(shù)學中實數(shù)的概念一致正確答案:C50.關于MongoDB集合命名規(guī)則錯誤的是()。A、不能以“system.”開頭,因為這是系統(tǒng)集合的保留前綴B、集合名中不能含有保留字符$C、不能含是空字符串D、集合名稱最大值200字節(jié)正確答案:D51.關于數(shù)據(jù)采集的描述不正確的是()A、數(shù)據(jù)采集不在于掌握龐大的的數(shù)據(jù)信息,而在于對數(shù)據(jù)的智能處理,挖掘出有價值的信息B、數(shù)據(jù)采集來源廣泛,類型也豐富多樣,很看重數(shù)據(jù)處理的高效性和實時性C、數(shù)據(jù)采集,要注重數(shù)據(jù)質(zhì)量和數(shù)據(jù)采集性能提升,為數(shù)據(jù)的準確分析打下基礎D、以上描述都不正確正確答案:D52.下列哪個表達式是求整數(shù)?A、^-?d$B、^-d+$C、^-?d+$D、^-?d+正確答案:C53.在Linux環(huán)境下的Tomcat容器數(shù)據(jù)的采集中,啟動Tomcat容器的代碼是()A、startup.shB、logstashC、httpdD、filebeat正確答案:A54.為了得到所有的命令行輸入的參數(shù),我們可以使用變量()A、$!B、$*C、$0D、$#正確答案:B55.用于解析域名的協(xié)議是A、HTTPB、DNSC、FTPD、SMTP正確答案:B56.數(shù)據(jù)清洗是針對不符合要求的數(shù)據(jù)進行處理,以下不屬于數(shù)據(jù)清洗范圍的是()A、無缺失數(shù)據(jù)B、不完整的數(shù)據(jù)C、重復的數(shù)據(jù)D、錯誤的數(shù)據(jù)正確答案:A57.哪個軸可以選取當前節(jié)點的所有命名空間節(jié)點?A、namespaceB、ancestorC、childD、parent正確答案:A58.httpd.conf配置文件中服務其主機與端口代碼為()A、ServerNamelocalhost:80B、localhost80C、localhost8080D、ServerNamelocalhost正確答案:A59.下面對HBase的描述哪些是錯誤的?()。A、不是開源的B、是面向列的C、是分布式的D、是一種NoSQL數(shù)據(jù)庫正確答案:A60.以下不屬于ETL抽取數(shù)據(jù)步驟的是()A、數(shù)據(jù)的加載B、數(shù)據(jù)的清洗轉(zhuǎn)換C、數(shù)據(jù)挖掘D、數(shù)據(jù)抽取正確答案:C61.jQuery中,定義array的語法錯誤的是()A、newArray(size);B、newArray(ele0.ele1.....ele);C、newArray();D、newArray[];正確答案:D62.以下哪種爬蟲又稱為主題網(wǎng)絡爬蟲,是指選擇性的爬行那些與預先定義好的主題相關頁面的網(wǎng)絡爬蟲A、通用網(wǎng)絡爬蟲B、深層頁面爬蟲C、增量式網(wǎng)絡爬蟲D、聚焦網(wǎng)絡爬蟲正確答案:D63.選取價格高于35的price節(jié)點?A、/book[price>35]/priceB、/bookstore/book[price>35]C、/bookstore/book[price>35]/priceD、以上都可以正確答案:C二、多選題(共17題,每題1分,共17分)1.Python中,關于文件的打開方式,以下選項中描述錯誤的是()。A、文件只能選擇二進制打開B、所有文件都可能以二進制方式打開C、文本文件只能以文本方式打開D、所有文件都可能以文本方式打開正確答案:ACD2.進程的基本狀態(tài)有()。A、阻塞態(tài)B、運行態(tài)C、就緒態(tài)D、停止態(tài)正確答案:ABC3.根據(jù)網(wǎng)頁內(nèi)容獲取方式不同.可以將網(wǎng)頁分為()。A、靜態(tài)頁面B、專業(yè)型網(wǎng)頁C、標記型網(wǎng)頁D、動態(tài)頁面正確答案:AD4.在xpath中,基本值是()節(jié)點。A、有根B、無子C、無父D、沒有根正確答案:BC5.以下屬于常用爬蟲框架的是()。A、Spring框架B、Scrapy框架C、Pyspider框架D、CoB框架正確答案:BCD6.關系數(shù)據(jù)庫中,不是用來實現(xiàn)表與表之間聯(lián)系的是()A、參照完整性規(guī)則B、用戶自定義的完整性規(guī)則C、值域D、實體完整性規(guī)則正確答案:BCD7.以下選項中說法不正確的是()A、解釋是將源代碼轉(zhuǎn)換成目標代碼的過程B、靜態(tài)語言采用解釋方式執(zhí)行,腳本語言采用編譯方式執(zhí)行C、Python語言是腳本語言D、編譯是將源代碼逐條轉(zhuǎn)換成目標代碼同時逐條運行目標代碼的過程正確答案:ABD8.正則表達式是對()和()操作的一種邏輯公式?A、普通字符B、元字符正確答案:AB9.在Xpath中,元素節(jié)點可以有()個。A、0B、1C、多個D、以上都不對正確答案:ABC10.正則表達式中,下列哪些可以匹配由英文字母組成的字符串()。A、^[A-Z]+$B、^[a-z]+$C、^[A-Za-z]+$D、^[A-Za-z]正確答案:ABC11.CSS選擇器主要包括()。A、類選擇器B、標簽選擇器C、ID選擇器D、父選擇器正確答案:ABC12.下列哪種說法是錯誤的()。A、除字典類型外,所有標準對象均可以用于布爾測試B、空字符串的布爾值是TrueC、空列表對象的布爾值是FalseD、值為0的任何數(shù)字對象的布爾值是False正確答案:AB13.Apache容器數(shù)據(jù)采集中常用()工具完成數(shù)據(jù)采集。A、Apache服務器B、FilebeatC、logstashD、html正確答案:BC14.關系型數(shù)據(jù)庫中,()是用來查詢、添加、修改和刪除數(shù)據(jù)庫中數(shù)據(jù)的語句。A、SELECTB、INSERTC、UPDATED、DELETE正確答案:ABCD15.在XPath中,節(jié)點包括以下哪些類型()?A、元素B、文本C、屬性D、命名空間正確答案:ABCD16.以下屬于半結(jié)構化數(shù)據(jù)的是A、日志文件B、JSON格式文檔C、XML文檔D、MySQL中的數(shù)據(jù)表正確答案:ABC17.基本值是()節(jié)點?A、有根B、無子C、沒有根D、無父正確答案:BD三、判斷題(共27題,每題1分,共27分)1.HTTP請求報文結(jié)構包含請求行、請求頭部、空行和請求數(shù)據(jù)4部分。A、正確B、錯誤正確答案:A2.WHERENAMEISNOTNULL可以查找條件為:姓名不是NULL的記錄A、正確B、錯誤正確答案:A3.jQuery的核心功能不是根據(jù)選擇器查找HTML元素,然后對這些元素執(zhí)行相關的操作。A、正確B、錯誤正確答案:B4.filebeat可以采集Tomcat的日志文件A、正確B、錯誤正確答案:A5.HBase數(shù)據(jù)導入工具的是Inport。A、正確B、錯誤正確答案:A6.操作系統(tǒng)中,進程具備多種特性,如:動態(tài)性、順序性、獨立性和同步性。A、正確B、錯誤正確答案:B7.w與[0-9a-zA-Z]是等效的A、正確B、錯誤正確答案:B8.Net平臺提供了運行所必須的環(huán)境.NETFramework類庫以及CLRA、正確B、錯誤正確答案:A9.動態(tài)網(wǎng)頁是相對靜態(tài)網(wǎng)頁來說的,指使用動態(tài)網(wǎng)絡技術生成的網(wǎng)頁,動態(tài)網(wǎng)頁的后綴不僅僅是靜態(tài)文件常見的形式,通常在動態(tài)網(wǎng)址之后包含“?”符號。A、正確B、錯誤正確答案:A10.HBase的底層存儲為HDFS。A、正確B、錯誤正確答案:A11.候選關鍵字中的屬性稱為復合屬性A、正確B、錯誤正確答案:B12.查看數(shù)據(jù)表的結(jié)構信息,可以在指定的數(shù)據(jù)庫中使用“describe表名;”語句,通常簡寫為“desc表名;”A、正確B、錯誤正確答案:A13.Gallery是下拉列表組件。A、正確B、錯誤正確答案:B14.在關系A(S,SN,D)和B(D,CN,NM)中,A的主鍵是S,B

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論