![大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷6)_第1頁](http://file4.renrendoc.com/view/68f8ffd561a4b3012366586df3535b09/68f8ffd561a4b3012366586df3535b091.gif)
![大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷6)_第2頁](http://file4.renrendoc.com/view/68f8ffd561a4b3012366586df3535b09/68f8ffd561a4b3012366586df3535b092.gif)
![大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷6)_第3頁](http://file4.renrendoc.com/view/68f8ffd561a4b3012366586df3535b09/68f8ffd561a4b3012366586df3535b093.gif)
![大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷6)_第4頁](http://file4.renrendoc.com/view/68f8ffd561a4b3012366586df3535b09/68f8ffd561a4b3012366586df3535b094.gif)
![大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷6)_第5頁](http://file4.renrendoc.com/view/68f8ffd561a4b3012366586df3535b09/68f8ffd561a4b3012366586df3535b095.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
試卷科目:大數(shù)據(jù)挖掘技術(shù)練習(xí)大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷6)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)挖掘技術(shù)練習(xí)第1部分:單項選擇題,共144題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.將數(shù)據(jù)轉(zhuǎn)換為可視化的形式,便于直觀快速發(fā)現(xiàn)數(shù)據(jù)規(guī)律。的數(shù)據(jù)探索方法是()。A)匯總統(tǒng)計法B)概率統(tǒng)計法C)可視化法[單選題]2.在無線數(shù)據(jù)端到端指標(biāo)體系中,4G網(wǎng)絡(luò)HTTP下載速率的指標(biāo)定義是?A)HTTP話單的上傳下載數(shù)據(jù)總量除以上傳下載總傳輸時長(限制500KB以上文件大小)B)HTTP話單的總下載數(shù)據(jù)量除以總下載傳輸時長(限制1024KB以上文件大?。〤)HTTP話單的總下載數(shù)據(jù)量除以總下載傳輸時長(限制500KB以上文件大小)[單選題]3.下列說明錯誤的是()A)性別=?男?=>職業(yè)=?司機?,是布爾型關(guān)聯(lián)規(guī)則B)性別=?女?=>avg(收入)=2300,是一個數(shù)值型關(guān)聯(lián)規(guī)則C)肝炎=>ALT(丙氨酸轉(zhuǎn)氨酶)升高,是一個單層關(guān)聯(lián)規(guī)則D)性別=?女?=>職業(yè)=?秘書?,是多維關(guān)聯(lián)規(guī)則[單選題]4.VBA語言中,聲明變量的關(guān)鍵字是()。A)SET;B)C.ONSTC)PRIVATED)IM[單選題]5.以下敘述中()是正確的。A)分類和聚類都是有指導(dǎo)的學(xué)習(xí)B)分類和聚類都是無指導(dǎo)的學(xué)習(xí)C)分類是有指導(dǎo)的學(xué)習(xí),聚類是無指導(dǎo)的學(xué)習(xí)D)分類是無指導(dǎo)的學(xué)習(xí),聚類是有指導(dǎo)的學(xué)習(xí)[單選題]6.以下屬于關(guān)聯(lián)分析的是A)CPU性能預(yù)測B)購物籃分析C)自動判斷鳶尾花類別D)股票趨勢建模[單選題]7.分析顧客消費行業(yè),以便有針對性的向其推薦感興趣的服務(wù),屬于()問題A)關(guān)聯(lián)規(guī)則挖掘B)分類與回歸C)聚類分析D)時序預(yù)測[單選題]8.關(guān)于Tableau的特點,以下說法錯誤的是()A)學(xué)習(xí)成本低,簡單易用;B)圖表精美;C)開發(fā)快速,分享便捷;D)需要IT大量人員參與[單選題]9.已知x=([1],[2]),那么執(zhí)行語句x[0].append(3)后x的值為()A)([1],[2,3])B)([1],[3],[2])C)([1,3],[2])D)([1],[2],[3])[單選題]10.關(guān)于DBSCAN聚類算法的描述錯誤的是()A)是一種基于密度的聚類算法B)能夠處理各種形狀和大小的簇C)能夠處理密度變化較大的簇D)處理高維數(shù)據(jù)時開銷較大[單選題]11.以下有關(guān)回歸分析與時間序列分析的敘述中正確的是()A)時間序列分析方法明確強調(diào)變量值順序的重要性,而回歸分析方法不是B)時間序列各觀測值之間存在一定的依存關(guān)系,而回歸分析一般要求每一變量各自獨立C)時間序列是一組隨機變量的一次樣本實現(xiàn),而回歸分析的樣本值一般是對同一隨機變量進(jìn)行多次獨立重復(fù)實驗的結(jié)果D)以上都是正確的[單選題]12.分類變量使用以下哪個統(tǒng)計量進(jìn)行缺失值填補較合適A)均值B)最大值C)眾數(shù)D)中位數(shù)[單選題]13.下面哪個關(guān)鍵字用來定義函數(shù)?A)functionB)defineC)defD)class[單選題]14.在SQL語句中,可使用的通配符?_(下劃線)?表示______。A)一個字符B)純數(shù)字C)純文本D)多個字符[單選題]15.下面不屬于明細(xì)數(shù)據(jù)質(zhì)量評價指標(biāo)的是()。A)接入率;B)自動采集率C)及時率D)完整率[單選題]16.DBSCAN在最壞情況下的時間復(fù)雜度是()。A)O(m)B)O(m2)C)O(logD)O(m*log[單選題]17.在Excel工作表中,在某單元格內(nèi)輸入數(shù)值123,不正確的輸入形式是()A)123B)=123C)+123D)*123[單選題]18.lr.fit(X_train,y_train)語句的目的為()A)建立LR模型B)導(dǎo)入數(shù)據(jù)并觀察C)查看數(shù)據(jù)框D)用處理好的數(shù)據(jù)訓(xùn)練模型[單選題]19.給定歷史時間數(shù)據(jù),通過擬合時序模型,分析研究時序數(shù)據(jù)的發(fā)展變化規(guī)律,得出觀測數(shù)據(jù)的歷史統(tǒng)計特征,再據(jù)此進(jìn)行外推預(yù)測目標(biāo)的分析方法是()。A)聚類;B)回歸C)時間序列D)匯總統(tǒng)計[單選題]20.下面度量方法中不屬于評價不平衡類問題分類的是()。A)F1度量B)召回率C)精度D)廣度[單選題]21.下列是數(shù)據(jù)挖掘的是()A)看到醫(yī)院戴口罩人數(shù)增多,斷定近期患病人數(shù)多B)從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程C)分析得知價格高的茶葉銷量低,價格低的茶葉銷量高D)看到地面上有黃金和黏土,判斷黃金更珍貴撿起黃金[單選題]22.下面購物藍(lán)能夠提取的3-項集的最大數(shù)量是多少()TID項集1牛奶,啤酒,尿布2面包,黃油,牛奶3牛奶,尿布,餅干4面包,黃油,餅干5啤酒,餅干,尿布6牛奶,尿布,面包,黃油7面包,黃油,尿布8啤酒,尿布9牛奶,尿布,面包,黃油10啤酒,餅干A)1B)2C)3D)4[單選題]23.主成分分析的步驟是()。A)計算協(xié)方差矩陣-計算主成分矩陣-計算特征根-中心化數(shù)據(jù)集-得到降維后的數(shù)據(jù)集B)中心化數(shù)據(jù)集-計算主成分矩陣-計算協(xié)方差矩陣-計算特征根-得到降維后的數(shù)據(jù)集C)中心化數(shù)據(jù)集-計算協(xié)方差矩陣-計算特征根-計算主成分矩陣-得到降維后的數(shù)據(jù)集D)計算協(xié)方差矩陣-計算特征根-中心化數(shù)據(jù)集-計算主成分矩陣-得到降維后的數(shù)據(jù)集[單選題]24.市場部門提出高價值終端換機用戶的識別需求,利用某段時間的O域數(shù)據(jù)暫無法挖掘的特征是A)重度游戲用戶識別B)終端性能不匹配用戶識別C)高頻次換機用戶識別D)終端質(zhì)差用戶識別[單選題]25.若I={a,b,c,d},D中含有10個事務(wù),{a,b,c}是一個頻繁項集,則以下敘述中錯誤的是()A){a,b,c,d}一定是頻繁項集B){a,b}一定是頻繁項集C){a,c}一定是頻繁項集D)一定是頻繁項集[單選題]26.下列關(guān)于聚類分析的描述中,正確的是:A)如果一個對象不強屬于任何簇,那么該對象是基于聚類的離群點B)在聚類分析當(dāng)中,簇內(nèi)的相似性越大,簇間的差別越大,聚類的效果就越差C)K均值是一種產(chǎn)生劃分聚類的基于密度的聚類算法,簇的個數(shù)由算法自動地確定D)聚類分析可以看作是一種有監(jiān)督的分類[單選題]27.最小最大規(guī)范化方法MinMaxScaler屬于python中的哪個包()。A)numpyB)scipyC)pandasD)sklearn[單選題]28.表示職稱為副教授、性別為男的表達(dá)式為()A)職稱='副教授'OR性別='男'B)職稱='副教授'AND性別='男'C)BETWEEN'副教授'AND'男'D)IN('副教授','男')[單選題]29.檢查省公司統(tǒng)一DPI系統(tǒng)設(shè)備4A登錄使用率情況,4A登錄使用率應(yīng)不低于()A)80%B)90%C)95%D)99%[單選題]30.UE和MME間的RRC連接以及s1連接釋放后,UE的EMM和ECM狀態(tài)正確的是A)Deregistered;idleB)Registered;ConnectedC)Registered;idleD)Deregistered;Connected[單選題]31.下列有關(guān)Apriori算法的說法中不正確的是()A)Apriori算法是關(guān)聯(lián)分析中最常用的算法之一。B)應(yīng)用Apriori算法時,需要先設(shè)定模型的最小支持度、最小置信度等閾值。C)應(yīng)用Apriori算法時,輸入的數(shù)據(jù)可以是連續(xù)型數(shù)據(jù)也可以是離散型數(shù)據(jù)。D)Apriori算法掃描數(shù)據(jù)庫的次數(shù)依賴于最大頻繁項集中項的數(shù)量。[單選題]32.語音識別的突破在()A)用人類思維去做,讓機器認(rèn)識每個音節(jié)音素,然后通過音節(jié)音素去分辨字和單詞B)研發(fā)過程中,計算機工程師與科學(xué)家圍繞著語言學(xué)家進(jìn)行工作C)開創(chuàng)了統(tǒng)計學(xué)的模式,拋棄了模仿人類思維方式,不再通過總結(jié)思維規(guī)則的老路,研發(fā)過程中極少語言學(xué)家的參與,更多是計算機科學(xué)家與數(shù)學(xué)家的合作D)圖靈測試[單選題]33.下列不屬于分類算法的是()A)C4.5算法B)邏輯回歸C)KNN算法D)TF-TDF算法[單選題]34.下列不屬于分類方法的是()A)決策樹算法B)貝葉斯算法C)人工神經(jīng)網(wǎng)絡(luò)D)K均值算法[單選題]35.學(xué)習(xí)器在訓(xùn)練集上的誤差稱為?訓(xùn)練誤差?或(),在新樣本上的誤差稱為?泛化誤差?A)學(xué)習(xí)誤差B)經(jīng)驗誤差C)測試誤差D)檢驗誤差[單選題]36.有關(guān)數(shù)據(jù)倉庫物理模型設(shè)計的敘述中正確的是()。A)存儲結(jié)構(gòu)中不能存在任何數(shù)據(jù)冗余B)盡可能多地建立索引C)盡可能把在邏輯上關(guān)聯(lián)的數(shù)據(jù)放在一個表中D)以上都不對[單選題]37.《數(shù)據(jù)安全法》發(fā)布執(zhí)行時間()。A)2021年9月1日;B)2021年10月1日;C)2021年11月1日D)2021年12月1日[單選題]38.VoLTE始呼接續(xù)時長統(tǒng)計點為()A)從主叫側(cè)CSCF收到VoLTE語音或視頻的Invite始呼請求開始,到主叫側(cè)CSCF向主叫用戶成功轉(zhuǎn)發(fā)180響應(yīng)消息B)從主叫側(cè)SBC收到VoLTE語音或視頻的Invite始呼請求開始,到主叫側(cè)SBC向主叫用戶成功轉(zhuǎn)發(fā)180響應(yīng)消息C)從主叫側(cè)SBC收到VoLTE語音或視頻的Invite始呼請求開始,到主叫側(cè)SBC向主叫用戶成功轉(zhuǎn)發(fā)200響應(yīng)消息D)從主叫側(cè)CSCF收到VoLTE語音或視頻的Invite始呼請求開始,到主叫側(cè)CSCF向主叫用戶成功轉(zhuǎn)發(fā)200響應(yīng)消息[單選題]39.()是進(jìn)行項目投資效益評價的最終依據(jù)。A)現(xiàn)金流量B)盈虧平衡點C)凈現(xiàn)金流量D)現(xiàn)金流入量[單選題]40.可用作數(shù)據(jù)挖掘分析中的關(guān)聯(lián)規(guī)則算法有A)Apriori算法、FP-Tree算法B)K均值法、SOM神經(jīng)網(wǎng)絡(luò)C)決策樹、對數(shù)回歸、關(guān)聯(lián)模式D)RBF神經(jīng)網(wǎng)絡(luò)、K均值法、決策樹[單選題]41.Hbase是哪種數(shù)據(jù)庫?A)關(guān)系型數(shù)據(jù)庫B)Nosql數(shù)據(jù)庫C)網(wǎng)狀數(shù)據(jù)庫D)層次數(shù)據(jù)庫[單選題]42.下列Python庫或模塊中,支持正則表達(dá)式語法的是____。A)bs4B)lxmlC)reD)json[單選題]43.如果性能報表中沒有KPI數(shù)據(jù),不可能是以下哪種情況()A)采集周期內(nèi)沒有進(jìn)行相關(guān)的業(yè)務(wù)B)采集周期內(nèi)性能統(tǒng)計計劃處于掛起狀態(tài)C)pc進(jìn)程掛死D)FTP服務(wù)器與eNB之間ping不通[單選題]44.是一個觀測值,它與其他觀測值的差別如此之大,以至于懷疑它是由不同的機制產(chǎn)生的。A)邊界點B)質(zhì)心C)離群點D)核心點[單選題]45.邏輯回歸適用于以下哪種問題()A)回歸問題B)二分類問題C)聚類問題D)關(guān)聯(lián)規(guī)則[單選題]46.決策樹算法是一種()數(shù)據(jù)挖掘算法A)關(guān)聯(lián)分析B)預(yù)測C)分類D)聚類[單選題]47.關(guān)于機器學(xué)習(xí)下列不正確的是()A)機器學(xué)習(xí)致力于研究如何通過計算的手段,利用經(jīng)驗(歷史數(shù)據(jù))來改善系統(tǒng)自身的性能B)學(xué)習(xí)算法是從數(shù)據(jù)中產(chǎn)生模型的算法C)機器學(xué)習(xí)需要總結(jié)學(xué)習(xí)出模型D)以往經(jīng)驗獲得的數(shù)據(jù)無需任何處理即可直接使用[單選題]48.熵是為消除不確定性所需要獲得的信息量,投擲均勻正六面體骰子的熵是:A)1比特B)2.6比特C)3.2比特D)3.8比特[單選題]49.下列不屬于數(shù)據(jù)質(zhì)量問題的是()。A)缺失值B)不一致的值C)重復(fù)數(shù)據(jù)D)非結(jié)構(gòu)數(shù)據(jù)[單選題]50.相關(guān)分析與回歸分析的一個重要區(qū)別是()A)前者研究變量之間關(guān)系的密切程度,后者研究變量間的變動關(guān)系,并用方程式表示B)前者研究變量之間的變動關(guān)系,后者研究變量間關(guān)系的密切程度C)兩者都研究變量間的變動關(guān)系D)兩者都不研究變量間的變動關(guān)系[單選題]51.()將兩個簇的鄰近度定義為不同簇的所有點對的平均逐對鄰近度,它是一種凝聚層次聚類技術(shù)。A)MIN(單鏈)B)MAX(全鏈)C)組平均D)Ward方法[單選題]52.MME具備以下功能A)只有控制面功能B)只有用戶面管理功能C)同時有控制面和用戶面管理功能D)用戶面和控制面功能都不具備[單選題]53.在哪里能下載到hadoop軟件A)apache網(wǎng)站或者捐獻(xiàn)給apache使用的公開服務(wù)器B)oracle官網(wǎng)C)hadoop公司官網(wǎng)D)linux官網(wǎng)[單選題]54.根據(jù)高斯樸素貝葉斯計算后驗概覽比值,確定每個數(shù)據(jù)點可能性最大的標(biāo)簽,可以采用哪個評估器A)sklearn.naive_bayes.GaussianNBB)sklearn.naive_bayes.GaussianC)sklearn.naive_bayes.Predict_probaD)sklearn.naive_bayes.Predict_Set[單選題]55.數(shù)據(jù)預(yù)處理的任務(wù)不包括()。A)數(shù)據(jù)清洗B)數(shù)據(jù)規(guī)范化和離散化C)數(shù)據(jù)分類D)特征提取與特征選擇[單選題]56.設(shè)有如下所示的某商場購物記錄集合,每個購物籃中包含若干商品:現(xiàn)在要基于該數(shù)據(jù)集進(jìn)行關(guān)聯(lián)規(guī)則挖掘。如果設(shè)置最小支持度為60%,則如下頻繁項集中,符合條件的是()A)雞蛋,尿布B)面包,尿布,牛奶C)面包,牛奶D)面包,啤酒,尿布[單選題]57.有一個文件記錄了1000個人的高考成績總分,每一行信息長度是20個字節(jié),要想只讀取最后10行的內(nèi)容,不可能用到的函數(shù)是()A)seek()B)readline()C)open()D)read()[單選題]58.下列不屬于數(shù)據(jù)倉庫設(shè)計的三級數(shù)據(jù)模型的是()。A)概念模型B)邏輯模型C)物理模型D)關(guān)聯(lián)模型[單選題]59.以下哪個不是移動網(wǎng)數(shù)據(jù)XDR內(nèi)容A)公共信息B)移動網(wǎng)通用信息C)特定業(yè)務(wù)信息D)信令信息[單選題]60.()算法是最廣泛使用的聚類算法,算法簡單,易于理解和操作。A)gglomerativeB)C.UREC)K-meansD)k-中心點算法[單選題]61.根據(jù)《中國移動集中性能管理應(yīng)用落地手冊-有線寬帶端到端業(yè)務(wù)質(zhì)量分析》,要求信令數(shù)據(jù)的關(guān)聯(lián)回填率達(dá)到A)1B)0.9C)0.8D)0.7[單選題]62.2016年,集團(tuán)公司提出了()內(nèi)容質(zhì)量保障體系A(chǔ))四維三步法B)三維三步法C)四維四步法D)四維五步法[單選題]63.對于LTE系統(tǒng)KPI性能指標(biāo)描述錯誤的是(D)A)覆蓋類指標(biāo)主要關(guān)注RSRP、RS-CINR、覆蓋率B)呼叫建立和保持類主要關(guān)注RRC連接建立成功率、E-RAB建立成功率、無線接通率、E-RAB建立阻塞率、RRC連接異常掉話率C)移動性管理類主要包括eNB內(nèi)切換成功率、X2口切換成移動性管理類主要包括eNB內(nèi)切換成功率、X2口切換成功率、S1口切換成功率、系統(tǒng)間切換成功率(包含與GSM/WCDMA/TD/CDMA等系統(tǒng)的切換)、E-RAB掉話率D)系統(tǒng)資源類指標(biāo)主要關(guān)注上下行誤塊率、上下行MAC層重傳率等[單選題]64.在數(shù)據(jù)庫中已建立了tBook表,若查找圖書編號是?TP1134?和?TP1138?的記錄,則SELECT查詢的WHERE條件為______。A)圖書編號="TP1134"AND"TP1138"B)圖書編號NOTIN("TP1134","TP1138")C)圖書編號IN("TP1134","TP1138")D)圖書編號NOT("TP1134"AND"TP1138")[單選題]65.訂單表order包含用戶信息uid和產(chǎn)品信息pid等屬性列,以下語句能夠返回至少被訂購過三次的Pid是______。A)SELECTpidFROMorderWHEREcount(pid)>3;B)SELECTpidFROMorderWHEREmax(pid)>=3;C)SELECTpidFROMorderGROUPBYpidHAVINGcount(pid)>3;D)SELECTpidFROMorderGROUPBYpidHAVINGcount(pid)>=3;[單選題]66.下列哪一個TCP層指標(biāo)不反應(yīng)S1口以下的質(zhì)差問題?A)RTT上行時延B)RTT下行時延C)TCP下行重傳率D)TCP上行重傳率[單選題]67.下面列出的條目中,下列不是數(shù)據(jù)倉庫基本特征的是:()A)數(shù)據(jù)倉庫是面向主題的B)數(shù)據(jù)倉庫的數(shù)據(jù)是集成的C)數(shù)據(jù)倉庫的數(shù)據(jù)是非時變的D)數(shù)據(jù)倉庫的數(shù)據(jù)是非易失的[單選題]68.大數(shù)據(jù)的價值是通過數(shù)據(jù)共享、()、后獲取最大的數(shù)據(jù)價值A(chǔ))算法共享B)共享應(yīng)用C)數(shù)據(jù)交換D)交叉復(fù)用[單選題]69.AI是()的英文縮寫A)AutomaticIntelligenceB)ArtificialIntelligenceC)AutomaticInformationD)ArtificialInformation[單選題]70.感知器以一個()作為輸入,計算這些輸入的線性組合,然后如果結(jié)果大于某個閾值就輸出1,否則輸出-1A)實數(shù)B)線性組合C)實數(shù)值向量D)實例[單選題]71.ATTACH請求次數(shù)為統(tǒng)計一定的時間粒度及網(wǎng)元粒度下,ProcedureType為()的S1-MME接口XDR的個數(shù)A)1B)2C)3D)4[單選題]72.樸素貝葉斯算法的預(yù)測判定準(zhǔn)則為()A)對每個樣本選擇使條件風(fēng)險R(c∣x)最小的類別標(biāo)記B)保證某一單一樣本x的風(fēng)險最小C)以可能性最小的輸出作為輸入對應(yīng)輸出D)計算每一種輸出的可能性[單選題]73.數(shù)據(jù)集的重要特性A)維度B)稀疏性C)分辨率D)以上都是[單選題]74.下列關(guān)于計算機存儲容量單位的說法中,錯誤的是()A)1KB<1MB<1GBB)基本單位是字節(jié)(Byte)C)一個漢字需要一個字節(jié)的存儲空間D)一個字節(jié)能夠容納一個英文字符[單選題]75.下面關(guān)于Jarvis-Patrick(JP)聚類算法的說法不正確的是()。A)JPB)JPC)JPD)JP[單選題]76.生物制藥智能化應(yīng)用不包括開展()A)新藥設(shè)計、理化性質(zhì)預(yù)測B)藥劑分析、疾病診斷靶標(biāo)C)藥物組合使用D)人工檢核制藥過程[單選題]77.AttachRequest消息在S1-MME接口中被封裝在什么消息中A)RRCConnectionSetupRequestB)InitialUEMessageC)SecurityModeCommandD)SecurityModeComplete[單選題]78.下面哪個不是信息標(biāo)記的格式?A)JSONB)YAMLC)CSVD)HTML[單選題]79.IP報頭的最大長度是多少個字節(jié)A)20B)60C)64D)256[單選題]80.()是在貝葉斯算法的基礎(chǔ)上進(jìn)行了相應(yīng)的簡化,即假定給定目標(biāo)值時屬性之間相互條件獨立A)貝葉斯定理B)貝葉斯統(tǒng)計C)樸素貝葉斯方法D)貝葉斯分類器[單選題]81.Mapreduce適用于()A)任意應(yīng)用程序B)任意可在windowsservet2008上運行的程序C)可以串行處理的應(yīng)用程序D)可以并行處理的應(yīng)用程序[單選題]82.LTE中的TA概念哪個是錯誤的()A)TAI由MCC+MNC+TAC三部分組成B)TAC的FQDN格式為:tac-hb<x1x2>.tac-lb<x3x4>.tac.epc.mnc<MNC>.mcc<MCC>.3C)TAC與LAC可重疊使用D)一個TA可由一個或多個小區(qū)構(gòu)成[單選題]83.可通過以下信令消息中的哪個字段,識別手機是否支持VOLTEA)VoicePreferforE-UTRANB)VoicedomainforE-UTRANC)VoiceFirstforE-UTRAND)VoiceCallforE-UTRAN[單選題]84.S1-basedhandover流程中建立臨時數(shù)據(jù)轉(zhuǎn)發(fā)通道時,數(shù)據(jù)傳輸方向是A)SourceENB->SourcePGW->TargetPGW->TargetENBB)TargetENB->TargetSGW->SourceSGW->SourceENBC)SourceSGW->TargetSGW->TargetENBD)SourceENB->SourceSGW->TargetSGW->TargetENB[單選題]85.下面哪個說法是不正確的?A)Robots協(xié)議告知網(wǎng)絡(luò)爬蟲哪些頁面可以抓取,哪些不可以。B)Robots協(xié)議是互聯(lián)網(wǎng)上的國際準(zhǔn)則,必須嚴(yán)格遵守。C)Robots協(xié)議是一種約定。D)Robots協(xié)議可以作為法律判決的參考性?行業(yè)共識?。[單選題]86.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時,可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離?A)分類B)聚類C)關(guān)聯(lián)分析D)隱馬爾可夫鏈[單選題]87.聯(lián)機分析處理包括以下不是基本分析功能的為:()A)聚類B)切片C)轉(zhuǎn)軸D)切塊[單選題]88.統(tǒng)計表中所有記錄個數(shù)的聚合函數(shù)是______。A)AVGB)SUMC)MAXD)COUNT[單選題]89.k值通常是采用()來確定A)交叉檢驗B)線性回歸C)分類比較D)評估預(yù)測[單選題]90.關(guān)于決策樹算法,以下的敘述錯誤的是A)決策樹修剪技術(shù)有預(yù)修剪和后修剪B)決策樹層數(shù)越多,預(yù)測結(jié)果準(zhǔn)確性越高C)C5.0、CHAID、CART都屬于決策樹算法D)修剪技術(shù)是為了防止過擬合的問題[單選題]91.LTE中,對于頻分雙工(FDD)的操作,定義了4中隨機接入的前導(dǎo)格式,其中格式3的Tcp()μsA)203.13B)406.26C)101.3D)684.38[單選題]92.數(shù)據(jù)挖掘的英文簡寫是()A)DKDB)KDDC)DMD)DA[單選題]93.關(guān)于性能度量不正確的是()A)性能度量是衡量模型泛化能力的評價標(biāo)準(zhǔn),反映了任務(wù)需求B)在對比不同模型的能力時,使用不同的性能度量會導(dǎo)致不同的評判結(jié)果,這就意味著模型的?好壞?是相對的C)回歸任務(wù)最常用的性能度量是?均方誤差?D)性能度量實用意義不大[單選題]94.在基于圖的簇評估度量表里面,如果簇度量為proximity(Ci,C),簇權(quán)值為mi,那么它的類型是()。A)基于圖的凝聚度B)基于原型的凝聚度C)基于原型的分離度D)基于圖的凝聚度和分離度[單選題]95.神經(jīng)網(wǎng)絡(luò)算法是一種()數(shù)據(jù)挖掘算法。A)關(guān)聯(lián)分析B)預(yù)測C)分類D)聚類[單選題]96.終端品牌與以下哪個用戶特征無關(guān)A)性別B)ARPUC)上網(wǎng)習(xí)慣D)生活所在地理位置[單選題]97.三層神經(jīng)網(wǎng)絡(luò)中,()可以有一層或多層。A)輸入層B)輸出層C)隱藏層D)前饋層[單選題]98.來自集中性能管理系統(tǒng)的指標(biāo)是A)4G最差小區(qū)占比(%)B)交通樞紐VoLTE接通率(%)C)高利用率MGCF占比(%)D)網(wǎng)絡(luò)安全重大事件次數(shù)(次)[單選題]99.()是Google提出的用于處理海量數(shù)據(jù)的并行編程模式和大規(guī)模數(shù)據(jù)集的并行運算的軟件架構(gòu)。A)GFSB)MapReduceC)ChubbyD)BitTable[單選題]100.大數(shù)據(jù)科學(xué)關(guān)注大數(shù)據(jù)網(wǎng)絡(luò)發(fā)展和運營過程中()大數(shù)據(jù)的規(guī)律及其與自然和社會活動之間的關(guān)系。A)大數(shù)據(jù)網(wǎng)絡(luò)發(fā)展和運營過程B)規(guī)劃建設(shè)運營管理C)規(guī)律和驗證D)發(fā)現(xiàn)和驗證[單選題]101.在SELECT查詢語句中對字段排序的命令子句是______。A)ORDERBYB)GROUPBYC)INSERTD)UPDATA[單選題]102.若I={a,b,c,d},D中含有10個事務(wù),(a,b}和{a,c}是一個頻繁項集,則以下敘述中正確的是()。A){a,b,d}一定是頻繁項集B){a,b,c}一定是頻繁項集C){b,c}一定是頻繁項集D)以上都不對[單選題]103.通過代碼?fromsklearnimporttree?引入決策樹模塊,并通過代碼?clf=tree.DecisionTreeClassifier()?構(gòu)造分類器對象后,訓(xùn)練時要調(diào)用的方法是(),在訓(xùn)練后做預(yù)測時要調(diào)用的方法是()。A)clf.fit()B)clf.predict()C)clf.train()D)clf.learn()[單選題]104.個性化推薦系統(tǒng)是建立在海量數(shù)據(jù)挖掘基礎(chǔ)上的一種高級商務(wù)智能平臺,以幫助()為其顧客購物提供完全個性化的決策支持和信息服務(wù)。A)公司B)各單位C)跨國企業(yè)D)電子商務(wù)網(wǎng)站[單選題]105.下面哪項不是主流視頻實現(xiàn)模式()A)HPVB)HPDC)HLSD)HAS[單選題]106.描述一組對稱(或正態(tài))分布數(shù)據(jù)的離散程度時,最適宜選擇的指標(biāo)是()A)極差B)標(biāo)準(zhǔn)差C)均值D)變異系數(shù)[單選題]107.P(22,1,42,10),Q(20,0,36,8)為兩個向量對象,這兩個對象的閔可夫斯基距離(x=3)是()。A)11B)三次根號下233C)6D)根號下45[單選題]108.以下哪個指標(biāo)不能用于線性回歸中的模型比較()A)R方B)調(diào)整R方C)AICD)BIC[單選題]109.requests庫發(fā)送請求的get方法中,()參數(shù)來設(shè)置超時時間A)timeoutB)headersC)user_agentD)add[單選題]110.根據(jù)中國移動統(tǒng)一DPI設(shè)備規(guī)范,文件名中%A,代表___A)話單類型編碼B)文件序號C)分鐘D)秒鐘[單選題]111.運行以下代碼?importmatplotlib.pyplotasplt?引入plt后,要繪制餅狀圖,需要利用的函數(shù)為()。A)plt.hist()B)plt.pie()C)plt.plot()D)plt.bar()[單選題]112.我們把delta訓(xùn)練法則理解為訓(xùn)練一個()的感知器,也就是一個線性單元A)有閾值B)無閾值C)無限制D)有限制[單選題]113.DPI采集中,需要獲取LTE切換信息,不需要采集的接口是()A)S1-MMEB)X2C)S11D)S6a[單選題]114.使用requests庫發(fā)送請求后,返回response對象的屬性中,表示網(wǎng)頁內(nèi)容的是()A)status_codeB)encondingC)apprence_encondingD)text[單選題]115.以下不屬于互聯(lián)網(wǎng)電視性能分析指標(biāo)的是()A)卡頓時長B)掉話率C)緩沖時長D)卡頓次數(shù)[單選題]116.屬于定量的屬性類型是A)標(biāo)稱B)序數(shù)C)區(qū)間D)相異[單選題]117.基于《中國移動DPI識別能力規(guī)范》新浪微博屬于哪一類業(yè)務(wù)()A)微博社區(qū)B)即時通信C)社交D)網(wǎng)頁瀏覽[單選題]118.有如下的學(xué)生表和選課表,結(jié)構(gòu)分別為:student(學(xué)號,姓名,性別,出生日期)choose(學(xué)號,課程號,成績)計算?劉明?同學(xué)所有課程的平均成績,正確的SQL語句是______。A)SELECTAVG(成績)FROMchooseWHERE姓名="劉明";B)SELECTAVG(成績)FROMstudent,chooseWHERE姓名="劉明";C)SELECTAVG(choose.成績)FROMstudent,chooseWHEREstudent.姓名="劉明";D)SELECTAVG(choose.成績)FROMstudentINNERJOINchooseONstudent.學(xué)號=choose.學(xué)號ANDWHEREstudent.姓名="劉明";[單選題]119.假設(shè)文件不存在,如果使用open方法打開文件會報錯,那么該文件的打開方式是下列哪種模式?()A)rB)wC)aD)w+[單選題]120.物聯(lián)網(wǎng)端到端定界分析()法,可實現(xiàn)物聯(lián)網(wǎng)端到端業(yè)務(wù)質(zhì)量全流程無死角的分析A)四元四階B)七元四階C)五元五階D)六元四階[單選題]121.當(dāng)熵和條件熵中的概率由數(shù)據(jù)估計(特別是極大似然估計)得到時,所對應(yīng)的熵分別稱為()和()A)信息熵,信息條件熵B)經(jīng)驗熵,經(jīng)驗條件熵C)確定熵,確定條件熵D)極大熵,極大條件熵[單選題]122.維克托?邁爾-舍恩伯格在《大數(shù)據(jù)時代:生活、工作與思維的大變革》一書中,持續(xù)強調(diào)了一個觀點:大數(shù)據(jù)時代的到來,使我們無法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奧妙,與此同時,我們更應(yīng)該注重數(shù)據(jù)中的相關(guān)關(guān)系,而不是因果關(guān)系。其中,數(shù)據(jù)之間的相關(guān)關(guān)系可以通過以下哪個算法直接挖掘A)K-meansB)BayesNetworkC)4.5D)Apriori[單選題]123.馬云認(rèn)為,()是數(shù)據(jù)時代必須跨過的一個坎A)數(shù)據(jù)隱私B)數(shù)據(jù)服務(wù)C)數(shù)據(jù)獲取D)數(shù)據(jù)應(yīng)用[單選題]124.檢測一元正態(tài)分布中的離群點,屬于異常檢測中的基于()的離群點檢測。A)統(tǒng)計方法B)鄰近度C)密度D)聚類技術(shù)[單選題]125.關(guān)于數(shù)據(jù)倉庫設(shè)計,下列說法中正確的是()。A)不可能從用戶的需求出發(fā)來進(jìn)行數(shù)據(jù)倉庫的設(shè)計B)只能從各部門業(yè)務(wù)應(yīng)用的方式來設(shè)計數(shù)據(jù)模型C)在進(jìn)行數(shù)據(jù)倉庫主題數(shù)據(jù)模型設(shè)計時要強調(diào)數(shù)據(jù)的集成性D)在進(jìn)行數(shù)據(jù)倉庫概念模型設(shè)計時,必須要設(shè)計實體關(guān)系圖[單選題]126.能夠完全匹配字符串?gogo?和?kittykitty?,但不能完全匹配?gokitty?的正則表達(dá)式()A)r?\b(\w+)\b\s+\1\b?B)R?\w{2,5}\s*\1?C)r?(\S+)\s+\1?D)r?(\S{2,5})\s{1,}\1?[單選題]127.自動化高級分析實驗室,實現(xiàn)與統(tǒng)一數(shù)據(jù)資源庫互聯(lián),實現(xiàn)數(shù)據(jù)的自助組表、自助分析功能,滿足不同層級、不同水平的用戶需求的是()A)初級分析;B)綜合分析C)典型分析D)高級分析[單選題]128.在ID3算法中信息增益是指()A)信息的溢出程度B)信息的增加效益C)熵增加的程度最大D)熵減少的程度最大[單選題]129.LTE支持靈活的系統(tǒng)帶寬配置,以下哪種帶寬是LTE協(xié)議不支持的A)5MB)10MC)20MD)40M[單選題]130.根據(jù)《中國移動統(tǒng)一DPI設(shè)備技術(shù)規(guī)范》,數(shù)據(jù)上報接口采用什么協(xié)議進(jìn)行數(shù)據(jù)傳輸A)SDTPB)TCPC)UDPD)GTP[單選題]131.在字符串打印中,哪個是出現(xiàn)中文字符對不齊問題的原因?A)英文字體沒有與中文字體設(shè)為相同。B)沒有對Python源代碼作編碼約束,應(yīng)該在文件首行表示源代碼為UTF-8編碼C)Python3輸出對中文支持不好。D)中文字符占兩個位置,而英文字符只占一個位置。[單選題]132.ROC曲線凸向哪個角,代表模型越理想?A)左上角B)右上角C)左下角D)右下角[單選題]133.在BP神經(jīng)網(wǎng)絡(luò)中,只有相鄰的神經(jīng)層的各個單元之間有聯(lián)系,除了輸出層外,每一層都有一個()A)關(guān)聯(lián)B)連接C)偏置結(jié)點D)輸入[單選題]134.設(shè)有一個回歸方程為y=2-2.5x,則變量x增加一個單位時()A)y平均增加2.5個單位B)y平均增加2個單位C)y平均減少2.5個單位D)y平均減少2個單位[單選題]135.以下哪個聚類算法不是屬于基于原型的聚類A)CLIQUEB)模糊C均值C)EM算法D)SOM[單選題]136.對于DBSCAN,參數(shù)Eps固定,當(dāng)MinPts取值較大時,會導(dǎo)致()A)能很好的區(qū)分各類簇B)只有高密度的點的聚集區(qū)劃為簇,其余劃為噪聲C)低密度的點的聚集區(qū)劃為簇,其余的劃為噪聲D)無影響[單選題]137.決策樹算法很容易出現(xiàn)過擬合,我們通常會使用一些剪枝手段來改善這一現(xiàn)象。對于Sklearn.tree.DecisionTreeClassifier模型,下面這些參數(shù)哪個不能起到剪枝的作用()A)criterionB)max_depthC)min_samples_splitD)min_impurity_split[單選題]138.給定密度闕值為3,對象o的ξ鄰域中有5個對象,那么o是()。A)高密度點B)核心點C)集中點D)關(guān)鍵點[單選題]139.在數(shù)據(jù)分析和處理方面具有分析方法豐富、分析模型擴展強、數(shù)據(jù)挖掘能力強等特點的分析工具是()。A)WekaB)SPSSC)SASD)R[單選題]140.已知:importpandasaspddata={'a':[2,1,5,6],'b':['kl','d',1,'kl'],'c':[6,5,1,6]}df=pd.DataFrame(data)TF=[True,False,False,True]print(df.iloc[TF,1])A)0,kl3,klName:b,dtype:objectB)0,23,6Name:a,dtype:objectC)0,63,6Name:c,dtype:objectD)0,kl2,1Name:b,dtype:object[單選題]141.()框架是大數(shù)據(jù)的核心框架A)集中式計算B)隔離式計算C)分布式計算D)混合式計算[單選題]142.下列哪項不是TD-SCDMA系統(tǒng)的無線接口協(xié)議層()A)物理層PhysicallayerB)數(shù)據(jù)鏈路層DatalinklayerC)網(wǎng)絡(luò)層NetworklayerD)媒體層Medialayer[單選題]143.以下關(guān)于OLAP和OLTP的敘述中錯誤的是()A)OLTP事務(wù)量大,但事務(wù)內(nèi)容比較簡單且重復(fù)率高B)OLAP的最終數(shù)據(jù)來源與OLTP是完全不一樣的C)OLAP面對的是決策人員和高層管理人員D)OLTP以應(yīng)用為核心,是應(yīng)用驅(qū)動的[單選題]144.EXCEL中,求標(biāo)準(zhǔn)差的函數(shù)是()A)AVERAGEB)MEDIANC)MODED)STDEV第2部分:多項選擇題,共47題,每題至少兩個正確答案,多選或少選均不得分。[多選題]145.以下屬于聚類算法的是()A)K均值B)DBSCANC)AprioriD)knn[多選題]146.下列關(guān)于集成學(xué)習(xí)描述正確的是()A)集成學(xué)習(xí)本身并不是一個單獨的機器學(xué)習(xí)算法,而是通過構(gòu)建并結(jié)合多個機器學(xué)習(xí)器來完成學(xué)習(xí)任務(wù),以達(dá)到獲得比單個學(xué)習(xí)器更好的學(xué)習(xí)效果的一種機器學(xué)習(xí)方法。B)集成學(xué)習(xí)的基學(xué)習(xí)器要求使用不同算法C)集成學(xué)習(xí)的基學(xué)習(xí)器可以使用相同的算法生成D)集成學(xué)習(xí)主要分為Bagging、Boosting和Stacking[多選題]147.決策樹算法的優(yōu)點有()A)計算量簡單,可解釋性強B)比較適合處理有缺失屬性值的樣本C)能夠處理不相關(guān)的特征D)減小了過擬合現(xiàn)象[多選題]148.DBSCAN根據(jù)點的密度將點分為三類:()A)稠密區(qū)域內(nèi)部的點B)各樣本歸于最近的類中心點C)稠密區(qū)域邊緣上的點D)稀疏區(qū)域中的點[多選題]149.行業(yè)分析數(shù)據(jù)采集方法有()。A)一手資料B)實地考察法C)專家訪談法D)收集媒體信息[多選題]150.以下哪些屬于物聯(lián)網(wǎng)端到端定界分析?七元四階?法中七元A)用戶側(cè)系統(tǒng)B)終端C)無線D)物聯(lián)網(wǎng)基地[多選題]151.貝葉斯信念網(wǎng)絡(luò)()有如下哪些特點,()A)構(gòu)造網(wǎng)絡(luò)費時費力B)對模型的過分問題非常魯棒C)貝葉斯網(wǎng)絡(luò)不適合處理不完整的數(shù)據(jù)D)網(wǎng)絡(luò)結(jié)構(gòu)確定后,添加變量相當(dāng)麻煩[多選題]152.針對涉及多張表的取數(shù)需求,SQL查詢中至少因包含的關(guān)鍵字為A)selectB)joinC)createD)format[多選題]153.以下哪些是屬于數(shù)據(jù)挖掘的范疇?A)計算整個班級學(xué)生?數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)?這門課的平均分。B)根據(jù)歷史信息預(yù)測某公司的股票價格。C)根據(jù)歷史銷售數(shù)據(jù)和顧客經(jīng)常查看的商品,為顧客推薦其可能需要的商品。D)將一個很大的數(shù)進(jìn)行質(zhì)因數(shù)分解。[多選題]154.下面哪些聚類方法易于發(fā)現(xiàn)特殊形狀的簇?A)k均值聚類B)層次聚類C)基于密度的聚類方法D)DBSCAN[多選題]155.數(shù)據(jù)科學(xué)家的3C精神A)創(chuàng)造性地工作B)批判性地思考C)系統(tǒng)性地處理D)好奇性地提問[多選題]156.UMTS系統(tǒng)包括()A)UEB)UTRANC)CND)OMC[多選題]157.下列屬于互聯(lián)網(wǎng)金融的是()A)百度金融B)螞蟻金服C)騰訊金融D)京東金融[多選題]158.根據(jù)集中性能管理應(yīng)用《客戶滿意度畫像分析》落地手冊,客戶滿意度預(yù)測建議采用的是哪兩種算法?()A)FP-growthB)隨機森林C)邏輯回歸D)k-Means[多選題]159.區(qū)塊鏈特征包含有()A)分布式是區(qū)塊鏈技術(shù)區(qū)別于其他技術(shù)的核心要點,數(shù)據(jù)由系統(tǒng)中維護(hù)功能的節(jié)點共同維護(hù)B)區(qū)塊鏈技術(shù)通過數(shù)字加密算法進(jìn)行編排,節(jié)點相互聯(lián)系,沒有一個中心節(jié)點可以被打擊和篡改,穩(wěn)定性和安全性更高C)公有區(qū)塊鏈系統(tǒng)是對所有人開放的,任何人均可以通過端口進(jìn)行查詢和開發(fā),系統(tǒng)是公開透明的,從而也更容易形成共識D)區(qū)塊鏈技術(shù)節(jié)點之間交換遵循一定的算法,通過程序規(guī)則自行判斷,并形成一種信任,即使是在匿名的情況下,也會對對方產(chǎn)生基本的信任[多選題]160.缺失值的處理方法有哪些?()A)用平均值填充B)忽略缺失記錄C)以任意數(shù)據(jù)填充D)用默認(rèn)值填充[多選題]161.數(shù)據(jù)挖掘的挖掘方法包括:()A)聚類分析B)關(guān)聯(lián)分析C)回歸分析D)決策樹算法[多選題]162.下列公式正確的是()A)流動資金=流動資產(chǎn)-流動負(fù)債B)流動資產(chǎn)=應(yīng)收賬款+存貨C)流動負(fù)債=應(yīng)付賬款+預(yù)收賬款D)流動資金本年增加額=本年流動資金-上年流動資金[多選題]163.商業(yè)模式描述正確的是:A)B2B--商家對商家B)B2C--商家對人C)O2O--線上對線下D)C2C--人對人[多選題]164.KANO模型定義的顧客需求層次有()A)興奮型需求B)喜愛型需求C)基本型需求D)期望型需求[多選題]165.下表是一個購物籃,假定支持度閾值為40%,其中____是頻繁閉項集。TID項1abc2abcd3bce4acde5deA)abcB)adC)cdD)de[多選題]166.VoLTE業(yè)務(wù)對比起原有的2/3G及CSFB語音業(yè)務(wù),優(yōu)勢有A)通話質(zhì)量更清晰B)通話費用更低C)可以一邊通話一邊上網(wǎng)D)通話接續(xù)時延更短[多選題]167.TD-LTE異系統(tǒng)切換步驟A)測量B)切換判決C)切換準(zhǔn)備D)切換執(zhí)行[多選題]168.模型選擇有哪三個關(guān)鍵問題()A)評估方法。如何獲得測試結(jié)果B)性能度量。如何評估性能優(yōu)劣C)比較檢驗。如何判斷實質(zhì)差別D)實施分析。如何更快更好實施[多選題]169.在鑒權(quán)過程的非接入層消息當(dāng)中,哪些參數(shù)不會被返回給MME()A)IK&CKB)AUTNC)RANDD)RES[多選題]170.XDR共享審核記錄中,至少包括以下哪些共享信息A)系統(tǒng)名稱B)使用數(shù)據(jù)用途C)共享數(shù)據(jù)類型D)共享數(shù)據(jù)范圍[多選題]171.敏感性分析的計算指標(biāo)有()A)盈虧平衡點B)敏感度系數(shù)C)臨界點D)凈現(xiàn)值[多選題]172.靜態(tài)仿真能夠?qū)崿F(xiàn)的功能有()A)干擾分析B)覆蓋規(guī)劃C)容量規(guī)劃D)功率分析[多選題]173.下列關(guān)于QOS的描述正確的是()A)EPS是在HSS和PCRF中簽約QOSB)HSS里可以簽約用戶建立的所有承載的QOSC)在GPRS系統(tǒng)中,Qos簽約在HLR中,對于每個PDP上下文,都要分配各自相應(yīng)的QosD)如果默認(rèn)承載的Qos不能滿足某種業(yè)務(wù)的需求,UE需要為其請求建立一個專有承載,由PGW基于PCRF授予的Qos參數(shù)來決定分配給專有承載的Qos,所以沒有必要在HSS里簽約專有承載的Qos[多選題]174.基于內(nèi)容的推薦生成推薦的過程主要依靠()A)內(nèi)容分析器B)推薦系統(tǒng)C)文件學(xué)習(xí)器D)過濾部件[多選題]175.在作邏輯回歸時,如果區(qū)域這個變量,當(dāng)Region=A時Y取值均為1,無法確定是否出現(xiàn)的是哪個問題?A)共線性B)異常值C)擬完全分離(Quasi-completeseparation)D)缺失值[多選題]176.基礎(chǔ)能力建設(shè)是2017年集中性能重點工作,具體工作指A)DPI規(guī)則庫運營B)O域數(shù)據(jù)能力開放C)數(shù)據(jù)質(zhì)量治理大會戰(zhàn)D)應(yīng)用拓展能力[多選題]177.MySQL視圖包括______。A)普通視圖B)檢查視圖C)一般視圖D)虛表[多選題]178.決策樹算法很容易出現(xiàn)過擬合,我們通常會使用一些剪枝手段來改善這一現(xiàn)象。對于sklearn.tree.DecisionTreeClassifier模型,下面這些參數(shù)哪些能起到剪枝的作用()A)criterionB)max_depthC)min_samples_splitD)min_impurity_split[多選題]179.泛化錯誤率由哪三個構(gòu)成()A)誤差B)偏差C)方差D)噪聲[多選題]180.對視頻播放等待時長指標(biāo)質(zhì)差問題進(jìn)行下鉆定界時,可以進(jìn)一步分析以下哪些指標(biāo)?A)TCP建鏈時B)GET響應(yīng)時長C)初始緩沖時長D)下載速率[多選題]181.下列項目中,其變動可以改變盈虧平衡點位置的因素有()A)單價B)單位變動成本C)銷量D)固定成本[多選題]182.物聯(lián)網(wǎng)端到端業(yè)務(wù)質(zhì)量分析中系統(tǒng)功能需求中要求信令平臺至少包括A)關(guān)鍵指標(biāo)監(jiān)控B)用戶記錄查詢C)信令回溯D)用戶管理[多選題]183.配合一元線性回歸方程須具備下列前提條件()A)現(xiàn)象間確實存在數(shù)量上的相互依存關(guān)系B)現(xiàn)象間的關(guān)系是直線關(guān)系,這種直線關(guān)系可用散點圖來表示C)具備一組自變量與因變量的對應(yīng)資料,且能明確哪個是自變量,哪個是因變量D)兩個變量之間不是對等關(guān)系[多選題]184.以下關(guān)于皮爾森相關(guān)分析敘述正確的是()A)兩變量獨立,兩者的皮爾森相關(guān)系數(shù)必然等于0B)兩變量皮爾森相關(guān)系數(shù)不等于0,兩者必然不獨立C)皮爾森相關(guān)系數(shù)是否等于零,不能指明兩變量是否獨立D)兩變量不獨立,兩者的皮爾森相關(guān)系數(shù)必然不等于0[多選題]185.哪些算法可以用于流量預(yù)測?A)隨機森林B)BP神經(jīng)網(wǎng)絡(luò)C)時間序列D)F值分布[多選題]186.產(chǎn)品成本費用按其與產(chǎn)量變化的關(guān)系分為()A)可變成本B)固定成本C)付現(xiàn)成本D)沉沒成本[多選題]187.()都屬于簇有效性的監(jiān)督度量。A)輪廓系數(shù)B)共性分類相關(guān)系數(shù)C)熵D)F[多選題]188.關(guān)于CHAID算法,以下正確的是A)CHAID算法是一種決策樹算法B)CHAID的輸入變量和輸出變量只能是分類型變量C)CHAID只能建立二叉樹D)CHAID算法從統(tǒng)計顯著性檢驗角度確定了當(dāng)前最佳分組變量和分割點。[多選題]189.下列屬于不同的有序數(shù)據(jù)的有:()A)時序數(shù)據(jù)B)序列數(shù)據(jù)C)時間序列數(shù)據(jù)D)事務(wù)數(shù)據(jù)E)空間數(shù)據(jù)[多選題]190.IntelligentMiner的基本內(nèi)容包括A)對象B)函數(shù)C)數(shù)據(jù)D)架構(gòu)E)q[多選題]191.數(shù)據(jù)挖掘工具選取需要考慮的因素有()A)可產(chǎn)生的模式種類的數(shù)量B)解決復(fù)雜問題的能力C)操縱性能D)數(shù)據(jù)存取能力E)和其他產(chǎn)品的接口第3部分:判斷題,共55題,請判斷題目是否正確。[判斷題]192.如果一個對象不強屬于任何簇,那么該對象是基于聚類的離群點。A)正確B)錯誤[判斷題]193.在多元線性回歸模型中,變量顯著性檢驗(t檢驗)與方程顯著性檢驗(F檢驗)是一致的。A)正確B)錯誤[判斷題]194.如果路徑表達(dá)式以?/?開始,那么該路徑就代表著到達(dá)某個節(jié)點的絕對路徑。A)正確B)錯誤[判斷題]195.已知x和y是兩個等長的整數(shù)列表,那么表達(dá)式sum((i*jfori,jinzip(x,y)))的作用是計算這兩個列表所表示的向量的內(nèi)積。A)正確B)錯誤[判斷題]196.一組數(shù)據(jù)排序后處于25%和75%位置上的值稱為四分位數(shù)。A)正確B)錯誤[判斷題]197.數(shù)據(jù)倉庫系統(tǒng)的組成部分包括數(shù)據(jù)倉庫,倉庫管理,數(shù)據(jù)抽取,分析工具等四個部分.A)正確B)錯誤[判斷題]198.隨機森林中的每棵樹都不進(jìn)行剪枝,因此過擬合的風(fēng)險很高。A)正確B)錯誤[判斷題]199.已知列表x中包含超過5個以上的元素,那么語句x=x[:5]+x[5:]的作用是將列表x中的元素循環(huán)左移5位。A)正確B)錯誤[判斷題]200.將總體中的各單位按某一標(biāo)志排列,再依固定間隔抽選調(diào)查單位的抽樣方式為等距抽樣。A)正確B)錯誤[判斷題]201.在對不同項目進(jìn)行風(fēng)險衡量時,可以用標(biāo)準(zhǔn)差作為標(biāo)準(zhǔn),標(biāo)準(zhǔn)差越大,方案風(fēng)險水平越高。A)正確B)錯誤[判斷題]202.如果對象p從對象q出發(fā)時是直接密度可達(dá)的,則對象q從對象p出發(fā)時也是直接密度可達(dá)的。A)正確B)錯誤[判斷題]203.用于分類的離散化方法之間的根本區(qū)別在于是否使用類信息。A)正確B)錯誤[判斷題]204.requests庫python自帶的庫,不需要安裝。A)正確B)錯誤[判斷題]205.使用readlines方法把整個文件中的內(nèi)容進(jìn)行一次性讀取。A)正確B)錯誤[判斷題]206.元組是不可變的,不支持列表對象的inset()、remove()等方法,也不支持del命令刪除其中的元素,但可以使用del命令刪除整個元組對象。A)正確B)錯誤[判斷題]207.數(shù)據(jù)科學(xué)是基于計算機科學(xué)(數(shù)據(jù)庫、數(shù)據(jù)挖掘Q、機器學(xué)習(xí)等)、統(tǒng)計學(xué)、數(shù)學(xué)等學(xué)科的一門新興的交叉學(xué)科,也是指以數(shù)據(jù)為中心的科學(xué)。A)正確B)錯誤[判斷題]208.k近鄰算法中,如果k值選取過小,則結(jié)果會對噪聲點的影響特別敏感。()A)正確B)錯誤[判斷題]209.兩個不等長的數(shù)組不能相加A)正確B)錯誤[判斷題]210.《中華人民共和國數(shù)據(jù)安全法》是我國第一部有關(guān)數(shù)據(jù)安全的專門法律。A)正確B)錯誤[判斷題]211.在AGNES算法中,兩個簇合并的條件是兩個簇的數(shù)據(jù)點間最小距離是所有簇中最小的。A)正確B)錯誤[判斷題]212.給定由兩次運行K均值產(chǎn)生的兩個不同的簇集,誤差的平方和最大的那個應(yīng)該被視為較優(yōu)。()A)正確B)錯誤[判斷題]213.分類規(guī)則的挖掘方法通常有:決策樹法、貝葉斯法、人工神經(jīng)網(wǎng)絡(luò)法、粗糙集法和遺傳算法。()A)正確B)錯誤[判斷題]214.資金本身具有時間價值。()A)正確B)錯誤[判斷題]215.支持度表示前項與后項在一個數(shù)據(jù)集中同時出現(xiàn)的頻率。()A)正確B)錯誤[判斷題]216.從點作為個體簇開始,每一步合并兩個最接近的簇,這是一種分裂的層次聚類方法。A)正確B)錯誤[判斷題]217.線性回歸方程求出的參數(shù)是對實際樣本分布方程中參數(shù)的估計。A)正確B)錯誤[判斷題]218.檢索出職務(wù)中含有?授?的職工信息,完整的SQL語句為:SELECT*FROM教師WHERE職稱LIKE'%授%';。A)正確B)錯誤[判斷題]219.k中心點算法使用相對誤差標(biāo)準(zhǔn)作為度量聚類質(zhì)量的目標(biāo)函數(shù)。A)正確B)錯誤[判斷題]220.K均值聚類需要提前設(shè)定K值,而凝聚層次法不需要預(yù)先設(shè)置參數(shù)。A)正確B)錯誤[判斷題]221.可視化技術(shù)對于分析的數(shù)據(jù)類型通常不是專用性的。A)正確B)錯誤[判斷題]222.用距離來衡量對象之間的相似程度。距離越大,對象間的相似性就越大。A)正確B)錯誤[判斷題]223.267.先驗原理可以表述為:如果一個項集是頻繁的,那包含它的所有項集也是頻繁的。A)正確B)錯誤[判斷題]224.Python集合不支持使用下標(biāo)訪問其中的元素。A)正確B)錯誤[判斷題]225.對遺漏數(shù)據(jù)的處理方法主要有:忽略該條記錄;手工填補遺漏值;利用默認(rèn)值填補遺漏值;利用均值填補遺漏值;利用同類別均值填補遺漏值;利用最可能的值填充遺漏值。()A)正確B)錯誤[判斷題]226.正則表達(dá)式?[^abc]?可以一個匹配任意除?a?、?b?、?c?之外的字符。A)正確B)錯誤[判斷題]227.模式為正確數(shù)據(jù)集的全局性總結(jié),它正確整個測量空間的每一點做出描述;模型則正確變量變化空間的一個有限區(qū)域做出描述。A)正確B)錯誤[判斷題]228.序數(shù)類屬性值有大小或前后關(guān)系,可進(jìn)行大于或小于的比較運算A)正確B)錯誤[判斷題]229.已知x和y是兩個字符串,那么表達(dá)式sum((1fori,jinzip(x,y)ifi==j))可以用來計算兩個字符串中對應(yīng)位置字符相等的個數(shù)。A)正確B)錯誤[判斷題]230.聚類分析的過程中,聚類效果較好時屬于同一個簇的對象相似度很高,而屬于不同簇的對象相似度很低。A)正確B)錯誤[判斷題]231.利用項的概念層次信息,不僅可以發(fā)現(xiàn)涉及那些出現(xiàn)頻率比較低的商品的頻繁模式和關(guān)聯(lián)規(guī)則,而且還可以發(fā)現(xiàn)概括性更強的規(guī)則。A)正確B)錯誤[判斷題]232.信息增益是針對一個一個的特征而言的,就是看一個特征,系統(tǒng)有它和沒它的時候信息量各是多少,兩者的差值就是這個特征給系統(tǒng)帶來的信息增益。A)正確B)錯誤[判斷題]233.只能對列表進(jìn)行切片操作,不能對元組和字符串進(jìn)行切片操作。A)正確B)錯誤[判斷題]234.一個關(guān)聯(lián)規(guī)則既要滿足最小支持度,又要滿足最小置信度。A)正確B)錯誤[判斷題]235.已知x=list(range(20)),那么語句x[::2]=[]可以正常執(zhí)行。A)正確B)錯誤[判斷題]236.已知x=?hellowworld.?.encode(),那么表達(dá)式x.decode(?gbk?)的值為?hellowWorld.?。A)正確B)錯誤[判斷題]237.描述離散程度的統(tǒng)計量一般有方差、標(biāo)準(zhǔn)差和極差等。A)正確B)錯誤[判斷題]238.表達(dá)式?a?+1的值為?b?。A)正確B)錯誤[判斷題]239.SVM是這樣一個分類器,他尋找具有最小邊緣的超平面,因此它也經(jīng)常被稱為最小邊緣分類器(minimalmarginclassifier)()A)正確B)錯誤[判斷題]240.在函數(shù)內(nèi)部直接修改形參的值并不影響外部實參的值。A)正確B)錯誤[判斷題]241.屬性的測量值與屬性的值的意義是完全對等的A)正確B)錯誤[判斷題]242.刪除列表中重復(fù)元素最簡單的方法是將其轉(zhuǎn)換為集合后再重新轉(zhuǎn)換為列表。A)正確B)錯誤[判斷題]243.樸素貝葉斯分類基于貝葉斯定理的一種分類方法。A)正確B)錯誤[判斷題]244.假設(shè)x為列表對象,那么x.pop()和x.pop(-1)的作用是一樣的。A)正確B)錯誤[判斷題]245.如果對象p到q是關(guān)于Eps和MinPts密度相連的,則對象q到p是關(guān)于Eps和MinPts密度相連的。A)正確B)錯誤[判斷題]246.分類是總結(jié)已有類別對象的特點,并根據(jù)這些特點,進(jìn)行未知類別對象的類別預(yù)測的過程。又可稱為無監(jiān)督學(xué)習(xí)。A)正確B)錯誤第4部分:問答題,共14題,請在空白處填寫正確答案。[問答題]247.10000個人購買了產(chǎn)品,其中購買A產(chǎn)品的人是1000個,購買B產(chǎn)品的人是2000個,AB同時購買的人是800個。則規(guī)則A=>B的支持度為_____,置信度為_____,提升度為____。[問答題]248.常用的評估分類方法準(zhǔn)確率的技術(shù)有____和____[問答題]249.Python在調(diào)用efficient-apriori包中的apriori函數(shù)訓(xùn)練挖掘關(guān)聯(lián)規(guī)則時,設(shè)定最小支持度的參數(shù)是______。[問答題]250.用最小二乘法求得的回歸方程,必須進(jìn)行()的檢驗。[問答題]251.算法DIANA(自頂向下分裂算法)輸入:n個對象,終止條件簇的數(shù)目k。輸出:k個簇,達(dá)到終止條件規(guī)定簇數(shù)目。(1)將()整個當(dāng)成一個初始簇;(2)FOR(i=1;i≠k;i++)DOBEGIN(3)在所有簇中挑出具有()的簇C;(4)找出C中與其它點()最大的一個點p并把p放入分裂簇,剩余的放在C簇中;(5)REPEAT(6)在C簇里找出到最近的分裂簇中的點的距離()到C簇中最近點的距離的點,并將該點加入分裂簇。(7)UNTIL沒有新的C簇的點被分配給分裂簇;(8)分裂簇和C簇為被選中的簇分裂成的兩個簇,與其它簇一起組成新的簇集合。(9)END.[問答題]252.數(shù)據(jù)倉庫是一個面向主題的、集成的、()、()的數(shù)據(jù)集合,支持管理者的決策過程。[問答題]253.k均值算法的算法思想:1、從包含n個數(shù)據(jù)對象的數(shù)據(jù)集中隨機的選擇k個對象,每個對象初始的代表一個簇的____;2、對剩余的每個數(shù)據(jù)對象點根據(jù)其與各個簇中心的____,將它指派到____的簇;3、根據(jù)指派到簇的數(shù)據(jù)對象點,更新每個簇的____;4、重復(fù)指派和更新步驟,直到簇不發(fā)生_____。[問答題]254.在使用sklearn構(gòu)建復(fù)合評估器時,如果想根據(jù)數(shù)據(jù)類型選擇列,或使用正則表達(dá)式匹配列名稱,可以使用make_column_selector方法選擇列,該方法在sklearn的______模塊中定義。[問答題]255.使用切片操作在列表對象x的開始處增加一個元素3的代碼為___。[問答題]256.為了可以把多個評估器鏈接成一個復(fù)合評估器,sklearn中提供了PipeLine機制,管道中的所有評估器,除了最后一個評估器,管道的所有評估器必須都是轉(zhuǎn)換器,即要實現(xiàn)方法______和______。[問答題]257.分別取k=2和3,利用k-means聚類算法對以下的點聚類:(2,1),(1,2),(2,2),(3,2),(2,3),(3,3),(2,4),(3,5),(4,4),(5,3)并討論k值以及初始聚類中心對聚類結(jié)果的影響。[問答題]258.決策樹中包含的結(jié)點是根結(jié)點、()和()。[問答題]259.每次訓(xùn)練分類模型時,需要把樣本分成____和____。[問答題]260.使用列表推導(dǎo)式生成包含10個數(shù)字5的列表,語句可以寫為_____。1.答案:C解析:2.答案:C解析:3.答案:C解析:4.答案:D解析:5.答案:C解析:6.答案:B解析:7.答案:A解析:8.答案:D解析:9.答案:C解析:10.答案:C解析:11.答案:D解析:12.答案:C解析:13.答案:C解析:14.答案:A解析:15.答案:B解析:16.答案:B解析:17.答案:D解析:18.答案:D解析:19.答案:C解析:20.答案:D解析:21.答案:B解析:22.答案:C解析:23.答案:C解析:24.答案:C解析:25.答案:A解析:26.答案:A解析:27.答案:D解析:28.答案:B解析:29.答案:C解析:30.答案:A解析:31.答案:C解析:32.答案:C解析:33.答案:D解析:34.答案:D解析:35.答案:B解析:36.答案:D解析:37.答案:A解析:38.答案:B解析:39.答案:C解析:40.答案:A解析:41.答案:B解析:42.答案:C解析:43.答案:A解析:44.答案:C解析:45.答案:B解析:46.答案:C解析:47.答案:D解析:48.答案:B解析:49.答案:D解析:50.答案:A解析:51.答案:C解析:52.答案:A解析:53.答案:A解析:54.答案:A解析:55.答案:C解析:56.答案:C解析:57.答案:D解析:58.答案:D解析:59.答案:D解析:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年專業(yè)財務(wù)代理記賬合作協(xié)議
- 2025年區(qū)域快遞服務(wù)承包經(jīng)營合同范本
- 2025年臨時宿舍租賃協(xié)議書
- 2025年員工投資策劃入股合作協(xié)議書
- 2025年區(qū)域間互惠協(xié)議規(guī)范
- 2025年云計算服務(wù)購銷合同模板
- 2025年度股東墊付資金互助協(xié)議書模板
- 2025年信用協(xié)議示范文本索取
- 2025年個人經(jīng)營店鋪質(zhì)押貸款合同樣本
- 2025年企業(yè)人力資源專員聘用合同樣本
- 銷售代理商申請表
- 北京匯文中學(xué)新初一均衡分班語文試卷
- 《Visual Basic 6.0程序設(shè)計》課件
- 平臺革命:改變世界的商業(yè)模式
- 塑膠件銅螺母扭拉力標(biāo)準(zhǔn)
- 特殊特性關(guān)鍵工序重要特性區(qū)別教學(xué)課件
- 定密管理培訓(xùn)課件
- 2023-2024學(xué)年四川省涼山州小學(xué)語文二年級期末高分考試題詳細(xì)參考答案解析
- 超市商品4級分類表
- 管道開挖施工方案(修復(fù)的)
- 北師大版小學(xué)六年級下冊數(shù)學(xué)全冊教學(xué)設(shè)計
評論
0/150
提交評論