數(shù)據(jù)挖掘與石油勘探開發(fā)知到智慧樹章節(jié)測試課后答案2024年秋中國石油大學(xué)(華東)_第1頁
數(shù)據(jù)挖掘與石油勘探開發(fā)知到智慧樹章節(jié)測試課后答案2024年秋中國石油大學(xué)(華東)_第2頁
數(shù)據(jù)挖掘與石油勘探開發(fā)知到智慧樹章節(jié)測試課后答案2024年秋中國石油大學(xué)(華東)_第3頁
數(shù)據(jù)挖掘與石油勘探開發(fā)知到智慧樹章節(jié)測試課后答案2024年秋中國石油大學(xué)(華東)_第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余5頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)挖掘與石油勘探開發(fā)知到智慧樹章節(jié)測試課后答案2024年秋中國石油大學(xué)(華東)第一章單元測試

根據(jù)數(shù)據(jù)挖掘的對象不同,數(shù)據(jù)挖掘技術(shù)可分為分類規(guī)則挖掘、聚類規(guī)則挖掘和關(guān)聯(lián)規(guī)則挖掘等。()

A:錯B:對

答案:錯

第二章單元測試

數(shù)據(jù)倉庫的數(shù)據(jù)量通常較大,且強(qiáng)調(diào)數(shù)據(jù)可以進(jìn)行實時更新。()

A:對B:錯

答案:錯數(shù)據(jù)倉庫通常指一個數(shù)據(jù)環(huán)境,而不是指一件產(chǎn)品,它提供用戶用于決策支持的當(dāng)前和歷史數(shù)據(jù),這些數(shù)據(jù)在傳統(tǒng)的數(shù)據(jù)庫中通常不方便得到。()

A:錯B:對

答案:對ETL過程的作用是為了識別錯誤數(shù)據(jù),而不是處理它們。()

A:對B:錯

答案:對粒度是對數(shù)據(jù)倉庫中數(shù)據(jù)的綜合程度高低的一個衡量。粒度越小,細(xì)節(jié)程度越低,回答查詢的種類越豐富。()

A:錯B:對

答案:錯由于數(shù)據(jù)倉庫的設(shè)計是一個不斷改進(jìn)和完善的螺旋式發(fā)展過程,在剛開始時選擇部分比較重要的主題作為數(shù)據(jù)倉庫設(shè)計的起點是很有必要的。()

A:對B:錯

答案:對

第三章單元測試

知識評估的主要目的是評估所得知識是否符合商業(yè)目標(biāo)。()

A:錯B:對

答案:對數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清洗、缺失值處理、異常值檢測和處理等步驟,但不包括特征選擇和降維操作。()

A:對B:錯

答案:錯在數(shù)據(jù)分析中,分箱技術(shù)可用于將連續(xù)型變量離散化為若干個區(qū)間,并對每個區(qū)間進(jìn)行編碼。()

A:對B:錯

答案:對在數(shù)據(jù)預(yù)處理中,可以直接刪除包含缺失值的樣本,而不考慮填補(bǔ)缺失值的方法。()

A:錯B:對

答案:錯規(guī)范化(標(biāo)準(zhǔn)化)是數(shù)據(jù)預(yù)處理中常用的操作之一,通過將數(shù)據(jù)按比例縮放到特定的范圍,使得數(shù)據(jù)具有相似的尺度和分布。()

A:錯B:對

答案:對

第四章單元測試

數(shù)據(jù)可視化依照(),可以分為科學(xué)可視化和信息可視化。

A:信息傳遞方式B:數(shù)據(jù)對象C:數(shù)據(jù)類別D:數(shù)據(jù)屬性

答案:數(shù)據(jù)對象以下()不屬于格式塔理論的八大原則。

A:重復(fù)原則B:經(jīng)驗原則C:連續(xù)原則D:好圖原則

答案:重復(fù)原則數(shù)據(jù)清洗過程主要處理哪些數(shù)據(jù)()。

A:不一致數(shù)據(jù)B:最大值C:噪聲值D:缺失值

答案:不一致數(shù)據(jù);噪聲值;缺失值在可視化流程概念圖中,各個模塊的聯(lián)系僅僅是順序的線性聯(lián)系。()

A:對B:錯

答案:錯直接體繪制中使用到的光線投射算法是基于射線掃描過程的。()

A:錯B:對

答案:對

第五章單元測試

構(gòu)造分類模型的步驟是()。

A:方法評估標(biāo)準(zhǔn)B:選擇分類方法C:數(shù)據(jù)準(zhǔn)備D:選擇優(yōu)化方法

答案:方法評估標(biāo)準(zhǔn);選擇分類方法;數(shù)據(jù)準(zhǔn)備ID3算法的類別屬性可以取的值有()。

A:yesB:wrongC:falseD:success

答案:yes;false;success決策樹的缺點包括()

A:決策樹算法不穩(wěn)定(數(shù)據(jù)中很小的變化可能導(dǎo)致生成一個完全不同的樹)B:輸出屬性必須是分類性,不允許輸出連續(xù)屬性C:測試屬性選取問題D:數(shù)值型數(shù)據(jù)必須離散化

答案:決策樹算法不穩(wěn)定(數(shù)據(jù)中很小的變化可能導(dǎo)致生成一個完全不同的樹);輸出屬性必須是分類性,不允許輸出連續(xù)屬性;測試屬性選取問題;數(shù)值型數(shù)據(jù)必須離散化由于連續(xù)屬性沒有可劃分的結(jié)點,這個時候要用到連續(xù)屬性離散化技術(shù),最簡單的策略就是采用二分法(bi-partition)對連續(xù)屬性進(jìn)行處理,C4.5決策樹算法采用的就是這種機(jī)制。()

A:錯B:對

答案:對哪種方法是用于避免過擬合的決策樹剪枝策略?()。

A:特征選擇B:損失函數(shù)最小化C:聚類分析D:正則化

答案:正則化

第六章單元測試

在層次聚類中,聚類的停止標(biāo)準(zhǔn)可以是基于哪種方法?()。

A:密度B:方差C:距離D:類別數(shù)量

答案:距離按照聚類的尺度,聚類算法可以分為()

A:離散型數(shù)據(jù)聚類算法B:基于互聯(lián)性的聚類算法C:基于密度的聚類算法D:基于距離的聚類算法

答案:基于互聯(lián)性的聚類算法;基于密度的聚類算法;基于距離的聚類算法以下說法正確的是()

A:帶權(quán)的歐氏距離計算公式就是歐式距離計算公式中的每一個平方項都加一個權(quán)重。B:距離函數(shù)不需要要滿足同一性和對稱性。C:余弦相似度中,余弦值的范圍在[-1,1],值越接近1,兩個對象越不相似。D:基于在數(shù)據(jù)標(biāo)準(zhǔn)化后,兩個對象之間的差異程度可以由兩個對象之間的距離來確定,常用的距離計算公式有歐氏距離和Manhattan距離等。

答案:帶權(quán)的歐氏距離計算公式就是歐式距離計算公式中的每一個平方項都加一個權(quán)重。;基于在數(shù)據(jù)標(biāo)準(zhǔn)化后,兩個對象之間的差異程度可以由兩個對象之間的距離來確定,常用的距離計算公式有歐氏距離和Manhattan距離等。那個不是層次聚類方法的距離度量法:()。

A:最短距離B:最長距離C:相對距離D:中間距離

答案:相對距離k-means算法的缺點沒有什么:()。

A:計算方法復(fù)雜B:對孤立點敏感C:對噪聲敏感D:用戶需事先指定k的個數(shù)

答案:計算方法復(fù)雜

第七章單元測試

頻繁項集、最大頻繁項集之間的關(guān)系是:()

A:頻繁項集=最大頻繁項集B:沒有關(guān)系C:最大頻繁項集?頻繁項集D:頻繁項集?最大頻繁項集

答案:頻繁項集?最大頻繁項集下面的購物籃中,如果顧客購買了薯片,他們還會購買()

A:面包B:水果C:牛奶D:牛奶和面包

答案:牛奶事務(wù)數(shù)據(jù)庫如下所示,假定支持度閾值為50%,在產(chǎn)生候選3-項集時,候選2-項集中需要剪枝的是()

A:a、cB:b、dC:c、dD:a、d

答案:b、d;a、d關(guān)聯(lián)規(guī)則挖掘的最終目標(biāo)是發(fā)現(xiàn)滿足最小支持度的所有項集。()

A:錯B:對

答案:錯利用Apriori先驗性質(zhì)可以加快頻繁項集的生成過程。()

A:對B:錯

答案:對

第八章單元測試

計算TF-IDF時,某個單詞的詞頻越低,且包含該單詞的文章越多,則相應(yīng)的值()。

A:越小B:越大C:無影響

答案:越小計算TF-IDF時,中l(wèi)og里的分子和分母分別代表什么?()

A:分子表示文檔的數(shù)量,分母表示索引詞出現(xiàn)的文檔數(shù)量B:分子表示文檔中單詞的數(shù)量,分母表示文檔數(shù)量C:分子表示文檔的數(shù)量,分母表示文檔數(shù)量D:分子表示文檔中單詞的數(shù)量,分母表示索引詞出現(xiàn)的文檔數(shù)量

答案:分子表示文檔的數(shù)量,分母表示索引詞出現(xiàn)的文檔數(shù)量SVD矩陣分解后得到的Σ矩陣的主對角線元素的含義什么?()

A:無特殊意義B:用作標(biāo)記C:特征值D:用作計數(shù)

答案:特征值當(dāng)矩陣A為方陣時,對其進(jìn)行特征分解的結(jié)果為()。

A:B:C:D:

答案:當(dāng)矩陣A不是方陣時,對其進(jìn)行特征分解的結(jié)果為()。

A:B:C:D:

答案:

第九章單元測試

導(dǎo)致推薦算法變得火熱的主要原因為()。

A:信息爆炸導(dǎo)致信息過載,用戶需求不明確B:信息爆炸導(dǎo)致信息過載,用戶需求明確C:互聯(lián)網(wǎng)和數(shù)字化內(nèi)容的快速發(fā)展D:重要的商業(yè)價值

答案:信息爆炸導(dǎo)致信息過載,用戶需求不明確根據(jù)熱度排行榜為用戶進(jìn)行內(nèi)容推薦的方式屬于()。

A:根據(jù)用戶的手機(jī)信息B:利用用戶注冊信息C:利用物品的內(nèi)容信息D:利用非個性化推薦

答案:利用非個性化推薦基于用戶的協(xié)同過濾的特點有()。

A:適用于用戶較少的場合B:用戶有新行為不一定造成推薦結(jié)果的立即變化C:適用于物品數(shù)明顯小于用戶數(shù)的場合D:用戶有新行為一定會導(dǎo)致推薦結(jié)果的實時變化

答案:適用于用戶較少的場合;用戶有新行為不一定造成推薦結(jié)果的立即變化基于協(xié)同過濾的推薦系統(tǒng)一般應(yīng)用于有用戶評分的系統(tǒng)之中,通過分?jǐn)?shù)去刻畫用戶對于物品的喜好。()

A:錯B:對

答案:對大型成熟網(wǎng)站的推薦系統(tǒng)一般是基于各種推薦算法的優(yōu)缺點以及適合場景分析的情況下,選擇單一的推薦算法使用。()

A:對B:錯

答案:錯

第十章單元測試

根據(jù)網(wǎng)絡(luò)的定義與表示,以下哪些陳述是正確的?()

A:鄰接矩陣是分析網(wǎng)絡(luò)結(jié)構(gòu)的一個有效工具,其元素表示節(jié)點之間是否存在連邊。B:根據(jù)網(wǎng)絡(luò)中邊的有向性和是否有權(quán)重,網(wǎng)絡(luò)可以被分為無向無權(quán)、有向無權(quán)、無向有權(quán)和有向有權(quán)四種類型。C:在網(wǎng)絡(luò)科學(xué)中,一個網(wǎng)絡(luò)不能同時具有自環(huán)和重邊。D:圖提供了一種方法,通過抽象的點和線表示實際網(wǎng)絡(luò),使得研究者能夠通過現(xiàn)象看本質(zhì)。E:網(wǎng)絡(luò)的拓?fù)湫再|(zhì)與網(wǎng)絡(luò)中節(jié)點的具體物理特性無關(guān),而只與節(jié)點之間的連接方式有關(guān)。

答案:鄰接矩陣是分析網(wǎng)絡(luò)結(jié)構(gòu)的一個有效工具,其元素表示節(jié)點之間是否存在連邊。;根據(jù)網(wǎng)絡(luò)中邊的有向性和是否有權(quán)重,網(wǎng)絡(luò)可以被分為無向無權(quán)、有向無權(quán)、無向有權(quán)和有向有權(quán)四種類型。;圖提供了一種方法,通過抽象的點和線表示實際網(wǎng)絡(luò),使得研究者能夠通過現(xiàn)象看本質(zhì)。;網(wǎng)絡(luò)的拓?fù)湫再|(zhì)與網(wǎng)絡(luò)中節(jié)點的具體物理特性無關(guān),而只與節(jié)點之間的連接方式有關(guān)。在小世界網(wǎng)絡(luò)中,下列關(guān)于小世界現(xiàn)象的描述,哪個是正確的?()

A:任意兩個節(jié)點之間的平均距離與網(wǎng)絡(luò)的節(jié)點數(shù)量成線性關(guān)系增長。B:網(wǎng)絡(luò)的聚類系數(shù)接近0,表明網(wǎng)絡(luò)中幾乎沒有集聚成團(tuán)的現(xiàn)象。C:任意兩個節(jié)點之間的平均距離與網(wǎng)絡(luò)的節(jié)點數(shù)量的對數(shù)成比例增長。D:網(wǎng)絡(luò)的所有節(jié)點都直接相連,形成一個完全圖。

答案:任意兩個節(jié)點之間的平均距離與網(wǎng)絡(luò)的節(jié)點數(shù)量的對數(shù)成比例增長。關(guān)于網(wǎng)絡(luò)的基本性質(zhì),以下哪項描述是正確的?()

A:無向網(wǎng)絡(luò)的平均度與網(wǎng)絡(luò)中節(jié)點數(shù)量成正比。B:在無向網(wǎng)絡(luò)中,網(wǎng)絡(luò)的平均度是所有節(jié)點度數(shù)之和的兩倍除以節(jié)點總數(shù)。C:有向網(wǎng)絡(luò)中,節(jié)點的出度總是小于入度。D:在任何網(wǎng)絡(luò)中,所有節(jié)點的度都相同。

答案:在無向網(wǎng)絡(luò)中,網(wǎng)絡(luò)的平均度是所有節(jié)點度數(shù)之和的兩倍除以節(jié)點總數(shù)。介數(shù)中心性(BetweennessCentrality)主要衡量了一個節(jié)點

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論