南開大學(xué)21秋學(xué)期數(shù)據(jù)科學(xué)導(dǎo)論在線作業(yè)72319_第1頁
南開大學(xué)21秋學(xué)期數(shù)據(jù)科學(xué)導(dǎo)論在線作業(yè)72319_第2頁
南開大學(xué)21秋學(xué)期數(shù)據(jù)科學(xué)導(dǎo)論在線作業(yè)72319_第3頁
南開大學(xué)21秋學(xué)期數(shù)據(jù)科學(xué)導(dǎo)論在線作業(yè)72319_第4頁
南開大學(xué)21秋學(xué)期數(shù)據(jù)科學(xué)導(dǎo)論在線作業(yè)72319_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

21秋學(xué)期(1709、1803、1809、1903、1909、2003、2009、2103)《數(shù)據(jù)科學(xué)導(dǎo)論》在線作業(yè)一、單選題1.通過變量標(biāo)準(zhǔn)化計算得到的回歸方程稱為()。A.標(biāo)準(zhǔn)化回歸方程B.標(biāo)準(zhǔn)化偏回歸方程C.標(biāo)準(zhǔn)化自回歸方程D.標(biāo)準(zhǔn)化多回歸方程答案:A.數(shù)據(jù)質(zhì)量檢驗的主要任務(wù)就是檢查原始數(shù)據(jù)中是否存在“臟數(shù)據(jù)”,概括性來說,臟數(shù)據(jù)不包括以下()A.普通值B.異常值C.不一致的值D.重復(fù)值答案:A.例如將工資收入屬性值映射到[-1,1]或者[0,1]內(nèi)屬于數(shù)據(jù)變換中的()A.簡單函數(shù)變換B.規(guī)范化C.屬性構(gòu)造D.連續(xù)屬性離散化答案:B.為了解決任何復(fù)雜的分類問題,使用的感知機(jī)結(jié)構(gòu)應(yīng)至少包含()個隱含層。A.1B.2C.3D.4答案:B.設(shè)X={1,2,3}是頻繁項集,則可由X產(chǎn)生()個關(guān)聯(lián)規(guī)則。A.4B.5C.6D.7答案:C.BFR聚類是用于處理數(shù)據(jù)集()的k-means變體。A.大B.中C.小D.所有答案:A.在k近鄰法中,選擇較小的k值時,學(xué)習(xí)的“近似誤差”會(),“估計誤差”會()。A.減小,減小.減小,增大C.增大,減小D.增大,增大答案:B.變量之間的關(guān)系一般可以分為確定性關(guān)系與()。A.非確定性關(guān)系.線性關(guān)系C.函數(shù)關(guān)系D.相關(guān)關(guān)系答案:A以下哪一項不是特征選擇常見的方法()A.過濾式B.封裝式C.嵌入式D.開放式答案:D.利用最小二乘法對多元線性回歸進(jìn)行參數(shù)估計時,其目標(biāo)為()。A.最小化方差#最小化標(biāo)準(zhǔn)差B.最小化殘差平方和C.最大化信息熵答案:C11.以下屬于關(guān)聯(lián)分析的是()A.CPU性能預(yù)測B.購物籃分析C.自動判斷鳶尾花類別D.股票趨勢建模答案:B.在一元線性回歸模型中,殘差項服從()分布。A.泊松B.正態(tài)C.線性D.非線性答案:B.通過構(gòu)造新的指標(biāo)-線損率,當(dāng)超出線損率的正常范圍,則可以判斷這條線路的用戶可能存在竊漏電等異常行為屬于數(shù)據(jù)變換中的()A.簡單函數(shù)變換B.規(guī)范化C.屬性構(gòu)造D.連續(xù)屬性離散化答案:C.下面不是分類的常用方法的有()A.K近鄰法B.樸素貝葉斯C.決策樹D.條件隨機(jī)場答案:D15.某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據(jù)挖掘的哪類問題?()A.關(guān)聯(lián)規(guī)則發(fā)現(xiàn)B.聚類C.分類D.自然語言處理答案:A16.具有偏差和至少()個S型隱含層加上一個()輸出層的網(wǎng)絡(luò)能夠逼近任何有理數(shù)。A.1,線性B.2,線性C.1,非線性D.2,非線性答案:A17.以下哪些不是缺失值的影響()A.數(shù)據(jù)建模將丟失大量有用信息B.數(shù)據(jù)建模的不確定性更加顯著C.對整體總是不產(chǎn)生什么作用D.包含空值的數(shù)據(jù)可能會使建模過程陷入混亂,導(dǎo)致異常的輸出答案:C18.BFR聚類用于在()歐氏空間中對數(shù)據(jù)進(jìn)行聚類A.高維B.中維C.低維D.中高維答案:A19.對于k近鄰法,下列說法錯誤的是()。A.不具有顯式的學(xué)習(xí)過程B.適用于多分類任務(wù)C.k值越大,分類效果越好D.通常采用多數(shù)表決的分類決策規(guī)則答案:C20.考 慮下面的頻繁3-項集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定數(shù)據(jù)集中只有5個項,采用合并策略,由候選產(chǎn)生過程得到4-項集不包含()A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5答案:C二、多選題.層次聚類的方法是()A.聚合方法B.分拆方法C.組合方法D.比較方法答案:AB.對于多層感知機(jī),()層擁有激活函數(shù)的功能神經(jīng)元。A.輸入層B.隱含層C.輸出層答案:BC.Apriori算法的計算復(fù)雜度受()影響。A.支持度閾值B.項數(shù)C.事務(wù)數(shù)D.事務(wù)平均寬度答案:ABCD.系統(tǒng)日志收集的基本特征有()A.高可用性B.高可靠性C.可擴(kuò)展性D.高效率答案:ABC.聚類的主要方法有()。A.劃分聚類B.層次聚類C.密度聚類D.距離聚類答案:ABC.下面例子屬于分類的是()A.檢測圖像中是否有人臉出現(xiàn)B.對客戶按照貸款風(fēng)險大小進(jìn)行分類C.識別手寫的數(shù)字D.估計商場客流量答案:ABC.K-means聚類中K值選取的方法是()。A.密度分類法.手肘法C.大腿法D.隨機(jī)選取答案:AB.數(shù)據(jù)科學(xué)具有哪些性質(zhì)()A.有效性B.可用性C.未預(yù)料D.可理解答案:ABCD.什么情況下結(jié)點不用劃分()A.當(dāng)前結(jié)點所包含的樣本全屬于同一類別B.當(dāng)前屬性集為空,或是所有樣本在所有屬性上取值相同C.當(dāng)前結(jié)點包含的樣本集為空D.還有子集不能被基本正確分類答案:ABC.相關(guān)性的分類,按照相關(guān)的方向可以分為()。A.正相關(guān)B.負(fù)相關(guān)C.左相關(guān)D.右相關(guān)答案:AB三、判斷題.當(dāng)訓(xùn)練集較大的時候,標(biāo)準(zhǔn)BP算法通常會更快的獲得更好的解。正確.給定一個數(shù)據(jù)集,如果存在某個超平面S能夠?qū)?shù)據(jù)集的部分正實例點和負(fù)實例點正確的劃分到超平面的兩側(cè),則稱該數(shù)據(jù)集是線性可分?jǐn)?shù)據(jù)集。錯誤.關(guān)聯(lián)規(guī)則可以用枚舉的方法產(chǎn)生。正確.具有雙隱層的感知機(jī)足以用于解決任何復(fù)雜的分類問題。正確.在數(shù)據(jù)預(yù)處理時,無論什么情況,都可以直接將異常值刪除錯誤.EDA可以最大化數(shù)據(jù)分析者對數(shù)據(jù)集和數(shù)據(jù)集底層結(jié)構(gòu)的洞察力,并且為分析者提供數(shù)據(jù)集中包含的各類信息。正確.支持度是衡量關(guān)聯(lián)規(guī)則重要性的一個指標(biāo)。正確.sigmoid函數(shù)屬于階躍函數(shù),是神經(jīng)網(wǎng)絡(luò)中常見的激活函數(shù)。錯誤.給定一組點,使用點之間的距離概念,將點分組為若干簇,不同簇的成員可以相同。錯誤.K-means算法采用貪心策略,通過迭代優(yōu)化來近似求解。正確.探索性數(shù)據(jù)分析的特點是研究從原始數(shù)據(jù)入手,完全以實際數(shù)據(jù)為依據(jù)。正確.K均值(K-Means)算法是密度聚類。錯誤.神經(jīng)網(wǎng)絡(luò)中誤差精度的提高可以通過增加隱含層中的神經(jīng)元數(shù)目來實現(xiàn)。正確.隨著特征維數(shù)的增加,特征空間呈指數(shù)倍增長,樣本密度急劇減小,樣本稀疏。正確.為了盡可能正確分類訓(xùn)練樣本,結(jié)點劃分過程將不斷重復(fù),有時會造成決策樹分支過少,以致于把訓(xùn)練集自身的一些特點當(dāng)作所有數(shù)據(jù)都具有的一般性質(zhì)而導(dǎo)致過擬合錯誤.方差過小的特征對數(shù)據(jù)的區(qū)分能力強(qiáng)錯誤.可信度是對關(guān)聯(lián)規(guī)則的準(zhǔn)確度的衡量。正確.獲取數(shù)據(jù)的方式有多種,可以從網(wǎng)頁、測量、數(shù)據(jù)庫、傳統(tǒng)媒體、監(jiān)控等等方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論