大數(shù)據(jù)分析與應(yīng)用智慧樹知到期末考試答案章節(jié)答案2024年西安理工大學(xué)

上傳人：題*** IP屬地：浙江上傳時間：2024-07-27 格式：DOCX 頁數(shù)：18 大?。?8.97KB 積分：6 舉報 版權(quán)申訴

大數(shù)據(jù)分析與應(yīng)用智慧樹知到期末考試答案章節(jié)答案2024年西安理工大學(xué)_第2頁

大數(shù)據(jù)分析與應(yīng)用智慧樹知到期末考試答案章節(jié)答案2024年西安理工大學(xué)_第3頁

大數(shù)據(jù)分析與應(yīng)用智慧樹知到期末考試答案章節(jié)答案2024年西安理工大學(xué)_第4頁

大數(shù)據(jù)分析與應(yīng)用智慧樹知到期末考試答案章節(jié)答案2024年西安理工大學(xué)_第5頁

已閱讀5頁，還剩13頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

大數(shù)據(jù)分析與應(yīng)用智慧樹知到期末考試答案+章節(jié)答案2024年西安理工大學(xué)計量經(jīng)濟模型中的被解釋變量一定是，內(nèi)生變量。（）

答案:對蘭氏距離不僅克服了明氏距離與各指標(biāo)的量綱有關(guān)的缺點，而且也考慮了變量間的相關(guān)性。（）

答案:對在討論模型的準(zhǔn)確度時，通常對整個樣本外的區(qū)間進行預(yù)測，然后將其實際值比較，把它們的差異用某種方法加總。（）。

答案:對預(yù)測填充通過預(yù)測模型利用不存在缺失值的屬性來預(yù)測缺失值，分類方法填充數(shù)值屬性，回歸方法填充類別屬性。（）

答案:錯Apriori算法產(chǎn)生的關(guān)聯(lián)規(guī)則總是確定的。（）

答案:對數(shù)據(jù)倉庫的管理中不包括安全性管理。（）

答案:錯Aprior算法的優(yōu)點是算法步驟的時間比較長。（）

答案:錯密度可達(dá)是不具有傳遞性的。（）

答案:錯用戶喜好矩陣的兩個維度分別是用戶維度和產(chǎn)品維度。（）。

答案:對詞嵌入方法使用低維、稠密、實值的詞向量來表示每一個詞，從而賦予詞語豐富的語義含義，并使得計算詞語相關(guān)度成為可能。（）

答案:對在文本分析中，常使用數(shù)字來表示文本中的數(shù)據(jù)。（）

答案:錯K-Medoids是對K-means聚類算法的優(yōu)化，因此比K-means聚類法應(yīng)用更為廣泛。（）

答案:錯用戶滿意度可通過用戶問卷或者監(jiān)測用戶線上行為數(shù)據(jù)獲得。（）。

答案:對數(shù)據(jù)集市包含的數(shù)據(jù)量比較多。（）

答案:錯數(shù)據(jù)歸一化和標(biāo)準(zhǔn)化的區(qū)別是，數(shù)據(jù)歸一化是將數(shù)據(jù)縮放到特定區(qū)間，而數(shù)據(jù)標(biāo)準(zhǔn)化則沒有區(qū)間限制。（）

答案:對對于項集來說，置信度沒有意義。（）

答案:對屬于數(shù)據(jù)倉庫的基本組成的是（）。

答案:數(shù)據(jù)提前;數(shù)據(jù)應(yīng)用;數(shù)據(jù)定義;數(shù)據(jù)管理下列可以產(chǎn)生頻繁項集的算法有()

答案:Aprior算法；;FP-growth算法；在DBSCAN算法中，數(shù)據(jù)點分為哪幾類（）。

答案:核心點;噪音點;邊界點常見的權(quán)重組合的方法有（）。

答案:IC均值加權(quán);IR_IC加權(quán);等權(quán)加權(quán)數(shù)據(jù)歸一化作用？（）

答案:消除不同量變之間數(shù)量級差異;消除不同量變之間性質(zhì)差異;消除不同量變之間量綱差異以下關(guān)于聚類分析的陳述，哪些是正確的（）。

答案:不同的類間距會產(chǎn)生不同的遞推公式;進行聚類分析的統(tǒng)計數(shù)據(jù)有關(guān)于類的變量;遞推公式有利于運算速度的提高依據(jù)分析的數(shù)據(jù)類型，可將大數(shù)據(jù)分析模型分為（）。

答案:面向結(jié)構(gòu)化多維數(shù)據(jù)的多元分析;面向半結(jié)構(gòu)化圖數(shù)據(jù)的圖分析;面向非結(jié)構(gòu)化文本數(shù)據(jù)的文本分析決策樹算法的優(yōu)點？。（）

答案:以最大信息增益選擇分裂變量，模型顯示變量的相對重要性;面對大數(shù)據(jù)集可以處理的很好;可以處理連續(xù)型或類別型的變量;容易解釋和理解聚類效果衡量方法種以內(nèi)部指標(biāo)進行衡量的方法有哪些（）。

答案:DB指標(biāo);SC指標(biāo);CH指標(biāo)推薦部分主要學(xué)了什么算法（）。

答案:基于人口統(tǒng)計學(xué)的推薦;基于用戶的推薦；;基于內(nèi)容的推薦；;基于物品的推薦；大數(shù)據(jù)都包括哪些數(shù)據(jù)（）。

答案:公用設(shè)施所記錄的數(shù)據(jù);事業(yè)單位數(shù)據(jù);科研設(shè)備數(shù)據(jù);企業(yè)單位數(shù)據(jù)以下哪幾項是常用的分詞工具（）。

答案:jieba;THULAC;HanLP;SnowNLP數(shù)據(jù)抽樣有哪些方法？（）

答案:加權(quán)抽樣;系統(tǒng)抽樣;隨機抽樣;分層抽樣在聚類分析中，劃分型聚類的特征是（）。

答案:屬于各個簇的對象之間沒有交集下列關(guān)于文本分析的說法錯誤的是（）。

答案:無監(jiān)督關(guān)鍵詞提取方法將關(guān)鍵詞提取視為分類過程

答案:服從t(n-2)經(jīng)典的Apriori算法是逐層掃描的，也就是說它是（）優(yōu)先的。

答案:寬度；產(chǎn)生離群點的原因有？()

答案:其他三個選項均正確為什么基于統(tǒng)計和基于距離的離群點檢測方法對于非均勻分布的數(shù)據(jù)集不能得到很好的檢測效果？（）

答案:這兩種方法都依賴于給定數(shù)據(jù)集的全局分布根據(jù)判定系數(shù)R2與F統(tǒng)計量的關(guān)系可知，當(dāng)R2=1時有（）。

答案:F=∞距離判別法所用的距離是（）。

答案:馬氏距離FP-Growth算法的優(yōu)點是算法步驟的時間比較長。（）

答案:錯為評論者打分目的是根據(jù)指定的人員對每個人進行打分，找出最接近的匹配結(jié)果。（）。

答案:對大數(shù)據(jù)分析就是指應(yīng)用大數(shù)據(jù)分析的工具和方法對規(guī)模巨大的數(shù)據(jù)進行分析。（）

答案:對剩余變差，是未被回歸直線解釋的部分，是由解釋變量以外的因素造成的。（）

答案:對先進行數(shù)據(jù)清洗，再進行數(shù)據(jù)倉庫數(shù)據(jù)模型的優(yōu)化。（）

答案:錯在大數(shù)據(jù)分析中，想要從文本中獲取信息首先要將其轉(zhuǎn)換為結(jié)構(gòu)化的數(shù)據(jù)。（）

答案:對離群點分析方法有哪些？()

答案:基于密度的離群點分析;基于統(tǒng)計的離群點分析;基于距離的離群點分析;基于聚類的離群點分析基于統(tǒng)計的離群點檢測方法首先需要計算什么？()

答案:標(biāo)準(zhǔn)差;均值下列關(guān)于TF-IDF的說法正確的是（）。

答案:TF代表詞頻，表示某詞條在文本中出現(xiàn)的頻率;IDF代表逆向文件頻率，值越大，類別區(qū)分能力越好Aprior算法的關(guān)鍵步驟是（）

答案:連接步；;減枝步；預(yù)測的準(zhǔn)確度影響因素包括哪幾點？（）。

答案:預(yù)測者的分析判斷能力;影響預(yù)測對象的偶然因素;方法不恰當(dāng);資料的限制確定目標(biāo)用戶的相似用戶群流程是怎樣的（）。

答案:選取與目標(biāo)用戶相似度大于某一個門檻值的所有用戶；;"選取與目標(biāo)用戶相似度最大的K位用戶；;將用戶按照他們的打分向量聚類，選擇離目標(biāo)用戶最近的一類用戶數(shù)據(jù)分析涉及的技術(shù)相當(dāng)廣泛，主要包括（）。

答案:數(shù)據(jù)理解與提取;數(shù)據(jù)采集在離群點檢測中，對一維數(shù)據(jù)而言，使用基于什么的分析方法？()

答案:統(tǒng)計大數(shù)據(jù)分析并不是簡單的數(shù)據(jù)分析的延伸，對大數(shù)據(jù)進行分析需要高性能的（）。

答案:計算結(jié)構(gòu)和存儲庫以下哪種方法是定性預(yù)測方法？（）。

答案:主觀概率法；決策樹算法是一種貪心算法，是（）的逐次搜索方式，逐漸產(chǎn)生決策樹模型結(jié)構(gòu)。（）。

答案:由上至下訓(xùn)練數(shù)據(jù)集中對象的屬性分為哪兩類？（）。

答案:分類屬性和類別屬性按經(jīng)典假設(shè)，線性回歸模型中的解釋變量應(yīng)是非隨機變量，且（）。

答案:與隨機誤差項不相關(guān)模型的作用是（），以適于用戶使用的方式重新組織和展現(xiàn)。

答案:從數(shù)據(jù)中找到知識

答案:Y關(guān)于X的彈性以下使用標(biāo)準(zhǔn)統(tǒng)計分布且采用不和諧檢驗的分析方法是（）。

答案:基于統(tǒng)計的離群點分析LOF方法的核心思想是通過比較對象自己的密度與它領(lǐng)域中對象的平均密度來檢測離群點，簇的內(nèi)部越靠近核心點的對象相對密度越接近0。（）

答案:錯分類分析是指在已知研究對象已經(jīng)分為若干類的情況下，確定新的對象屬于哪一類。（）

答案:對經(jīng)典的計算用戶相似度可以用（）方法。

答案:皮爾遜相關(guān)度;調(diào)整余弦相似性;余弦相似性屬于數(shù)據(jù)倉庫的體系結(jié)構(gòu)的是（）。

答案:前端工具;數(shù)據(jù)模型;數(shù)據(jù)源和ETL工具;數(shù)據(jù)倉庫和元數(shù)據(jù)數(shù)據(jù)可視化根據(jù)數(shù)據(jù)類型可以分為（）。

答案:多維數(shù)據(jù)可視化;時空數(shù)據(jù)可視化;文本可視化;網(wǎng)絡(luò)可視化從二分類到多分類的三種策略？（）

答案:為C個類定義C個判別函數(shù);構(gòu)造C個兩類分類器;構(gòu)造C(C-1)個兩類分類器馬爾科夫過程具有以下哪幾個特征（）。

答案:遍歷性;平穩(wěn)性;馬爾科夫性數(shù)據(jù)預(yù)處理的步驟是（）

答案:數(shù)據(jù)抽樣和過濾→數(shù)據(jù)標(biāo)準(zhǔn)化和歸一化→數(shù)據(jù)清洗K-means算法中第二個循環(huán)做了什么（）。

答案:聚類中心的移動基于產(chǎn)品的協(xié)同過濾需要回答（）。

答案:其他三個選項均正確使用聚類方法確定最相似用戶群的時候，使用離目標(biāo)用戶（）一類用戶的中心處的打分。

答案:最近EM算法的引入是因為概率模型中包含（）。

答案:隱變量在具體的模型中，被認(rèn)為是具有一定概率分布的隨機變量是外生變量。（）

答案:錯基于統(tǒng)計的離群點分析建立在標(biāo)準(zhǔn)的統(tǒng)計學(xué)技術(shù)之上，對數(shù)據(jù)分布滿足某種概率分布的數(shù)值型單維數(shù)據(jù)集較為有效。（）

答案:對某一特定的X水平上，總體Y分布的離散度越大，即σ2越大，則是預(yù)測區(qū)間越窄，精度越低。（）

答案:錯基于統(tǒng)計的離群點分析需要預(yù)先知道?()

答案:分布參數(shù);數(shù)據(jù)集的統(tǒng)計分布;期望離群點的數(shù)目;離群點類型量化選股的模型有很多種，總的來說主要有（）。

答案:行業(yè)輪動模型;風(fēng)格輪動模型;多因子模型;資金流模型基于產(chǎn)品的協(xié)同過濾方法缺點（）。

答案:算法可擴展性問題;打分稀疏性問題;冷啟動問題離群點是指數(shù)值中，遠(yuǎn)離數(shù)值的一般水平的什么和什么？()

答案:極端大值;極端小值訓(xùn)練數(shù)據(jù)集的作用？（）。

答案:用于建立分類模型的數(shù)據(jù)置信度(confidence)是衡量興趣度度量（）的指標(biāo)。

答案:確定性；預(yù)測的準(zhǔn)確度是指預(yù)測模型擬合的好壞程度。（）。

答案:對國家大型公用設(shè)備所產(chǎn)生的數(shù)據(jù)是大數(shù)據(jù)的一種。（）

答案:對EM算法一定收斂。（）

答案:錯logistic回歸適用于因變量為（）。

答案:連續(xù)型定量變量;多分類無序變量;多分類有序變量;二分類變量預(yù)測的基本原理包括系統(tǒng)性原理、連貫性原理之外，還有哪些原理？（）。

答案:相關(guān)性原理;概率推斷原理;類推原理屬于多維數(shù)據(jù)模型的是（）。

答案:星型模式預(yù)測的基本要素不包括以下哪點？（）。

答案:發(fā)展趨勢符合度量屬性類型是（）。

答案:數(shù)值型推薦是（）決策的一種手段。

答案:輔助一個主題即可構(gòu)成數(shù)據(jù)倉庫。（）

答案:錯判別分析是多元統(tǒng)計分析中用于判別樣本類型的一種統(tǒng)計分析方法。（）

答案:對預(yù)測方法選擇原則（）。

答案:根據(jù)預(yù)測目標(biāo)的要求選擇預(yù)測方法;從經(jīng)濟、時間與適用性的角度選擇預(yù)測方法;根據(jù)預(yù)測結(jié)果的準(zhǔn)確程度選擇預(yù)測方法;根據(jù)預(yù)測對象資料的特征和規(guī)律選擇預(yù)測方法常用的決策樹算法有？（）

答案:CART;C4.5;ID3;Hunt某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn)，買啤酒的人很大概率也會購買尿布，這種屬于數(shù)據(jù)挖掘的哪類問題？（）

答案:關(guān)聯(lián)規(guī)則發(fā)現(xiàn)；下列屬于格式內(nèi)容清洗的是？（）

答案:非法字符檢測大眾化推薦是指在同樣的外部條件下，不同用戶獲得的推薦是一樣的。（）。

答案:對數(shù)據(jù)挖掘一般無需預(yù)先設(shè)定好的主題，主要是在現(xiàn)有數(shù)據(jù)上進行基于各種算法的計算，實現(xiàn)一些（）的需求。

答案:高級別數(shù)據(jù)分析推薦系統(tǒng)的構(gòu)成有哪些（）。

答案:其他三個選項均正確離群點分析只能為用戶提供可疑的數(shù)據(jù)，是否真正對應(yīng)實際的異常行為，需要由領(lǐng)域?qū)＜襾斫忉?。（?/p>

答案:對歐幾里德距離通過判斷兩組數(shù)據(jù)與某一直線擬合程度來判斷相似度。（）。

答案:錯傳統(tǒng)數(shù)據(jù)分析建模方法與大數(shù)據(jù)分析建模方法是對立的。（）

答案:錯數(shù)據(jù)倉庫的特點中包含查閱。（）

答案:對對大數(shù)據(jù)進行分析不需要高性能的計算架構(gòu)和存儲系統(tǒng)。（）

答案:錯Apriori算法是一種典型的關(guān)聯(lián)規(guī)則挖掘算法。（）

答案:對不確定性越大，得到的熵值越小。（）

答案:錯在多元線性回歸模型中，多重決定系數(shù)指回歸平方和與總離差平方和的比值，也就是在被解釋變量的總變差中能由解釋變量所解釋的那部分變差的比重。（）

答案:對對于多元數(shù)據(jù)，很難同時對多維數(shù)據(jù)進行基于統(tǒng)計的離群點分析。（）

答案:對數(shù)據(jù)質(zhì)量從一致性、完整性、時效性、同一性四個維度考慮。（）

答案:錯文本分析可應(yīng)用于垃圾郵件過濾系統(tǒng)。（）

答案:對過濾主要依賴隨機化技術(shù)篩選樣本，而抽樣則依據(jù)條件限制選取符合要求的數(shù)據(jù)。（）

答案:錯大數(shù)據(jù)的特點在于信息增長速度快，需要及時處理。（）

答案:錯預(yù)測就是根據(jù)過去和現(xiàn)在估計未來。（）。

答案:對決策樹中，所有的數(shù)據(jù)都會落到葉子節(jié)點上。（）

答案:對輪廓系數(shù)的值越趨近于1則代表緊密度和分離度都相對較優(yōu)，即聚類效果越好。（）

答案:對決策樹的剪枝策略通常有先剪枝和后剪枝兩種方法。（）

答案:對離群點分析是發(fā)現(xiàn)數(shù)據(jù)集中異常的少量的離群點。（）

答案:對灰色預(yù)測的數(shù)據(jù)是通過生成數(shù)據(jù)的模型所得到的預(yù)測值的逆處理結(jié)果（）。

答案:對概率推斷原理是指當(dāng)被推斷的結(jié)果能以較大的概率出現(xiàn)時，則認(rèn)為該結(jié)果成立。（）。

答案:對分詞結(jié)果極大依賴于分詞詞典的完備性。（）

答案:對回歸分析中估計回歸參數(shù)的方法主要有（）。

答案:矩估計法;最小二乘估計法;極大似然法常用的核函數(shù)有（）。（）

答案:Sigmoid核函數(shù);多項式核函數(shù);線性核函數(shù);徑向基核函數(shù)數(shù)據(jù)標(biāo)準(zhǔn)化與歸一化方法？（）

答案:反正切函數(shù);0-1標(biāo)準(zhǔn)化;Z-score標(biāo)準(zhǔn)化;log函數(shù)轉(zhuǎn)換K-means聚類法的局限性體現(xiàn)在（）。

答案:K-means聚類法對噪聲和離群點敏感;K-means聚類法對變量的要求也比較高;應(yīng)用K-means聚類法需要預(yù)先直到聚類個數(shù)近鄰距離度量的表示方法都有哪些？（）

答案:曼哈頓距離;切比雪夫距離;閔可夫斯基距離;歐氏距離離群點的類型有？()

答案:條件離群點;全局離群點;集體離群點屬于度量的類型的有（）。

答案:不確定性度量;不可加性度量;可加性度量;半可加性度量常用于關(guān)鍵詞提取的方法有（）。

答案:TF-IDF;TextRank;LDA主題模型數(shù)據(jù)倉庫是一個（）的數(shù)據(jù)集合。

答案:面向主題的;穩(wěn)定的;集成的;隨時間變化的推薦系統(tǒng)可以（）角度評估。

答案:多樣性;用戶滿意度;驚喜度;新穎性以下哪些屬于非結(jié)構(gòu)化數(shù)據(jù)（）。

答案:文本;視頻;圖像;音頻對樣本進行聚類，通常采用的相似性統(tǒng)計量（）。

答案:歐式距離;切比雪夫距離;絕對距離假設(shè)線性回歸模型滿足全部基本假設(shè)，則其參數(shù)的估計量具備（）。

答案:線性;有效性;無偏性以下哪幾項屬于分詞的方法（）。

答案:雙向最大匹配法;逆向最大匹配法;正向最大匹配法關(guān)聯(lián)規(guī)則挖掘的算法主要有()

答案:FP-Growth算法；;Apriori算法；發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的算法通常要經(jīng)過以下三個步驟：連接數(shù)據(jù)，作數(shù)據(jù)準(zhǔn)備：給定（），利用數(shù)據(jù)挖掘工具提供的算法發(fā)現(xiàn)關(guān)聯(lián)規(guī)則；可視化顯示、理解、評估關(guān)聯(lián)規(guī)則。

答案:最小可信度；;最小支持度；數(shù)據(jù)缺失值填充方法？（）

答案:刪除;統(tǒng)一填充;預(yù)測填充;統(tǒng)計填充Apriori算法的計算復(fù)雜度受()影響?

答案:支持度閥值；;項數(shù)（維度)；;事務(wù)平均寬度生理狀態(tài)；;事務(wù)數(shù)；實體識別解決的問題？（）

答案:冗余問題;重名問題以下哪幾種方式灰色系統(tǒng)常用的數(shù)據(jù)處理方式？（）。

答案:累減;累加文本特征項需要具備哪些特性（）。

答案:能夠標(biāo)識文本內(nèi)容ETL工具的功能有（）。

答案:其他三個選項均正確重名檢測是利用（）技術(shù)，通過考察實體屬性間的關(guān)聯(lián)程度，判定相同名稱的對象，是否屬于同一實體類。

答案:聚類以下哪種方法是定量預(yù)測方法？（）。

答案:灰色預(yù)測下面哪項是數(shù)據(jù)分組的依據(jù)？（）。

答案:分位數(shù)大數(shù)據(jù)時代的到來，使我們無法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奧妙，與此同時，我們更應(yīng)該注重數(shù)據(jù)中的相關(guān)關(guān)系，而不是因果關(guān)系。其中，數(shù)據(jù)之間的相關(guān)關(guān)系可以通過以下哪個算法直接挖掘（）

答案:FP-growth；系統(tǒng)性原理是指預(yù)測必須以系統(tǒng)的觀點為指導(dǎo)，采用哪種方法實現(xiàn)預(yù)測的系統(tǒng)目標(biāo)？()。

答案:系統(tǒng)分析；文本分析可應(yīng)用于哪些場景（）。

答案:其他三個選項均正確下列說法正確的是？（）。

答案:分裂屬性選擇時，選擇具有最小Ginisplit的屬性為分裂屬性數(shù)據(jù)倉庫的優(yōu)勢是（）。

答案:查詢性能高FP-tree對于Aprior算法的改進之處在于（）

答案:加速查找；基于產(chǎn)品的協(xié)同過濾方法優(yōu)點（）。

答案:A和B都是常用的文本特征選取方式有（）。

答案:其他三個選項均正確以下哪種屬于系統(tǒng)抽樣？（）

答案:在100個人中選取第2、12....92人數(shù)據(jù)理解與提取包括（）。

答案:非結(jié)構(gòu)化數(shù)據(jù)關(guān)于聚類算法K-means和DBSCAN的敘述中，不正確的是（）。

答案:當(dāng)簇的密度變化較大時，DBSCAN不能很好地處理，而K-means可以大數(shù)據(jù)的采集是指利用（）來接收發(fā)自客戶端的數(shù)據(jù)，并且用戶可以通過數(shù)據(jù)庫來進行簡單的查詢和處理工作。

答案:多個數(shù)據(jù)庫發(fā)展系數(shù)a的有效區(qū)間為？（）。

答案:（-2，2）下列關(guān)于同義和多義的說法中，正確的是（）。

答案:同義是指不同詞匯在一定背景下有著相同的意思抽樣和過濾的目的？（）

答案:減少數(shù)據(jù)處理量基于人口統(tǒng)計學(xué)的推薦主要思想是什么（）。

答案:一個用戶可能會喜歡與其相似的用戶所喜歡的東西；基于產(chǎn)品的協(xié)同過濾算法的主要優(yōu)點是計算量小，可以離線計算（）。

答案:對基于用戶的方法適用于物品數(shù)量巨大且頻繁更新的場景。（）。

答案:對基于內(nèi)容的推薦主要思想是什么（）。

答案:一個用戶可能會喜歡和他曾經(jīng)喜歡過的物品相似的物品；多樣性描述推薦系統(tǒng)對物品長尾的發(fā)掘能力。（）。

答案:錯基于物品的方法適用于用戶數(shù)量大大超過物品數(shù)量，且物品數(shù)量相對穩(wěn)定，不必頻繁更新的場景。（）。

答案:對收集用戶信息的行為記錄模塊負(fù)責(zé)記錄用戶的喜好行為。（）。

答案:對推薦系統(tǒng)可以用于哪些應(yīng)用（）。

答案:豆瓣;淘寶;騰訊;愛奇藝計算用戶相似度常用的方法（）。

答案:皮爾遜相關(guān)度;歐幾里德距離;accard系數(shù);曼哈頓距離覆蓋率描述推薦系統(tǒng)中推薦結(jié)果能否覆蓋用戶不同的興趣領(lǐng)域。（）。

答案:錯用于提取主題的文本分析方法包括（）。

答案:LDA;PLDA;LSA;PLSA中文分詞的難點是什么？（）

答案:規(guī)范問題;歧義問題;未登錄詞問題;計算問題某詞的IDF值越高，說明該詞越不常見。（）

答案:對可以通過詞匯來判斷文檔之間的相似度。（）

答案:對詞嵌入方法將詞表示為數(shù)值向量。（）

答案:對網(wǎng)絡(luò)上的信息錯綜復(fù)雜，沒有辦法對文本進行分析。（）

答案:錯詞的同義和多義現(xiàn)象是文本分析中存在的問題。（）

答案:對基于統(tǒng)計的方法使用句子出現(xiàn)的概率對句子的合理性進行評估。（）

答案:對以下哪些屬于文本分析模型？（）

答案:主題模型;統(tǒng)計語言模型;TextRank;TF-IDF主題抽取使得文本的處理大大簡化。（）

答案:對當(dāng)數(shù)據(jù)集包含不同密度的區(qū)域時，基于距離的離群點檢測方法不能很好地識別離群點。（）

答案:對基于聚類的離群點檢測可以分為幾類？（）。

答案:兩類；對于基于距離的離群點分析方法，其基本思想是一個對象如果遠(yuǎn)離大部分其它對象，那么它是離群的。（）

答案:對基于距離的離群點檢測方案簡單，不必知道數(shù)據(jù)的分布，計算量大。（）

答案:錯對于基于原型的聚類，評估對象屬于簇的程度主要有兩種方法：一是度量對象到簇原型的距離，二是考慮到簇具有不同的密度，可以度量簇到原型的相對距離。（）

答案:對基于密度的離群點檢測優(yōu)點是？（）。

答案:可以處理擁有不同密度區(qū)域的數(shù)據(jù)集；基于聚類的離群點檢測有什么缺點？（）。

答案:產(chǎn)生的離群點集非常依賴所用的簇的個數(shù)；基于聚類的離群點分析方法，在已有聚類結(jié)果的基礎(chǔ)上，計算量小，效率高，但是它的有效性也非常依賴聚類的結(jié)果。（）

答案:對基于距離的離群點分析可以處理多維數(shù)據(jù)。（）

答案:對在基于聚類的離群點檢測中，對象是否被認(rèn)為是離群點可能高度依賴于簇的個數(shù)。（）

答案:對馬爾科夫性中，n+1時刻的狀態(tài)的條件概率只依存哪種時刻的狀態(tài)（）。

答案:n預(yù)測分析的基本思路為：列出并分析現(xiàn)有數(shù)據(jù)-尋找計算手段-得出結(jié)論。（）。

答案:對在諸多的灰色模型中，哪種模型最常用？（）。

答案:GM(1，1)在馬爾科夫過程中，在給定當(dāng)前信息或知識時，過去對于預(yù)測未來是有關(guān)的。（）。

答案:錯馬爾科夫分析法是研究隨機事件變化趨勢的一種方法。（）。

答案:對預(yù)測分析主要對以下哪些方面的作用（）。

答案:績效管理;成本控制;自適應(yīng)管理;決策管理待定系數(shù)a稱為灰色作用量（）。

答案:錯預(yù)測的方法可以分為定性預(yù)測方法和定量預(yù)測方法。（）。

答案:對馬爾科夫過程是具有馬爾科夫性質(zhì)的離散隨機過程。（）。

答案:對以下哪幾點是預(yù)測分析的關(guān)鍵點（）。

答案:數(shù)據(jù)在時間上的持續(xù)性;數(shù)據(jù)的全面性;數(shù)據(jù)的數(shù)量K-Means算法需要用初始隨機種子點來做，不同起點結(jié)果不同，可能導(dǎo)致算法陷入局部最優(yōu)。（）

答案:對哪個方法不是類間距離的度量方法（）。

答案:歐式距離聚類分析是將樣品或變量按照它們在性質(zhì)上的什么進行分類的（）。

答案:親疏程度DBSCAN是基于密度的噪聲應(yīng)用空間聚類。（）

答案:對聚類與分類一樣，具有預(yù)測功能。（）

答案:錯緊密度和分離度是聚類分析評價的兩個原則。（）

答案:對哪些屬性可以通過取值的差來衡量相異度（）。

答案:比率屬性;區(qū)間屬性關(guān)于聚類分析下列說法正確的是（）。

答案:K-means屬于無監(jiān)督分類;系統(tǒng)幾類并不適合數(shù)據(jù)量很大的情形根據(jù)簇之間的關(guān)系，聚類分析可以分為（）。

答案:重疊聚類;層次型聚類;劃分型聚類閔可夫斯基距離λ可以取哪些值（）。

答案:其他三個選項均正確人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)包括？（）。

答案:輸入層;隱含層;輸出層隨機森林的訓(xùn)練過程分為？（）。

答案:投票過程;生長過程影響隨機森林分類性能的主要因素（）。

答案:單顆決策樹的分類強度;森林中決策樹的相關(guān)度樸素貝葉斯算法是貝葉斯算法中最簡單的一個算法，假設(shè)它里邊的各個類條件是（）。

答案:獨立的隨機森林結(jié)合策略有哪些？（）。

答案:加權(quán)平均法;簡單平均法;投票法關(guān)于樸素貝葉斯算法，下列說法正確的是（）。

答案:假設(shè)樣本各屬性之間是相互獨立的神經(jīng)網(wǎng)絡(luò)模型構(gòu)思來源于對人腦的模擬。（）

答案:對深度學(xué)習(xí)模型有哪些？（）。

答案:卷積神經(jīng)網(wǎng)絡(luò);循環(huán)神經(jīng)網(wǎng)絡(luò);深度神經(jīng)網(wǎng)絡(luò);生成-對抗神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)的各層之間的初始參數(shù)是如何設(shè)定的？（）。

答案:隨機產(chǎn)生單層神經(jīng)網(wǎng)絡(luò)有幾層？（）。

答案:2在回歸與相關(guān)分析中，因變量值隨自變量值的增大（減?。┒鴾p?。ㄔ龃螅┑默F(xiàn)象叫做（）

答案:負(fù)相關(guān)；購物籃分析中，數(shù)據(jù)是以（）的形式呈現(xiàn)

答案:不對稱二元變量；以下不屬于數(shù)據(jù)挖掘軟件的是（）

答案:ApacheSpark；給定關(guān)聯(lián)規(guī)則A-B，意味著：若A發(fā)生，B也會發(fā)生。（）

答案:錯關(guān)聯(lián)分析中表示關(guān)聯(lián)關(guān)系的方法主要有（）

答案:項集；;關(guān)聯(lián)規(guī)則；一個關(guān)聯(lián)規(guī)則同時滿足最小支持度和最小置信度，我們稱之為（）

答案:強規(guī)則；頻繁閉項集可用來無損壓縮頻繁項集。（）

答案:對關(guān)聯(lián)規(guī)則的評價度量主要有（）

答案:支持度；;置信度；下面購物籃能夠提取的最大項集和最小項集的數(shù)量是多少（）。ID購買項：1.牛奶，啤酒、2.面包，黃油，牛奶、3.牛奶，尿布，餅干、4.面包，黃油，餅干、5.啤酒，餅干，尿布、6.牛奶，尿布，面包，黃油、7.面包，黃油，尿布、8.啤酒，尿布、9.牛奶，尿布，面包，黃油、10.啤酒，餅干

答案:4；;3；不滿足給定評價度量的關(guān)聯(lián)規(guī)則是無趣的（）

答案:錯Logistic回歸可用于（）。

答案:其他三個選項均正確Logistic回歸系數(shù)與優(yōu)勢比OR的關(guān)系為（）。

答案:其他三個選項均正確在多元線性回歸模型中，若某個解釋變量對其余解釋變量的判定系數(shù)接近于1，則表明模型中存在（）。

答案:多重共線性

答案:回歸變差，或回歸平方和是指（）。

答案:被解釋變量的回歸值與平均值的離差平方和;被解釋變量的總變差與剩余變差之差;解釋變量變動所引起的被解釋變量的變差在由n=30的一組樣本估計的、包含3個解釋變量的線性回歸模型中，計算得多重決定系數(shù)為0.8500，則調(diào)整后的多重決定系數(shù)為（）。

答案:0.8327剩余變差是指（）。

答案:被解釋變量的實際值與回歸值的離差平方和;被解釋變量的變差中，回歸方程不能做出解釋的部分;被解釋變量的總變差與回歸平方和之差;隨機因素影響所引起的被解釋變量的變差解釋變量的實際值與平均值的離差平方和Logistic回歸中自變量如為多分類變量，宜將其按啞變量處理，與其他變量進行變量篩選時可用（）。

答案:應(yīng)將幾個啞變量作為一個因素，整體進出回歸方程半對數(shù)模型中，參數(shù)1的含義是（）。

答案:X的相對變化，引起Y的期望值絕對量變化關(guān)于經(jīng)濟計量模型進行預(yù)測出現(xiàn)誤差的原因，正確的說法是（）。

答案:既有隨機因素，又有系

人人文庫> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

大數(shù)據(jù)分析與應(yīng)用智慧樹知到期末考試答案章節(jié)答案2024年西安理工大學(xué)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔