




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第1頁,共1頁一、單項選擇題(本大題共10小題,每題3分,共30分)試卷(試卷(學年第1學期)考試科目機器學習-Python實踐(A卷)適用專業(yè)班級(年級)得分命題人:審閱人:班級學號姓名考試科目裝訂線1、如果使用線性回歸模型,下列說法正確的是?()A.檢查異常值是很重要的,因為線性回歸對離群效應很敏感B.線性回歸分析要求所有變量特征都必須具有正態(tài)分布C.線性回歸假設數(shù)據(jù)中基本沒有多重共線性D.以上說法都不對2、建立線性模型時,我們看變量之間的相關性。在尋找相關矩陣中的相關系數(shù)時,如果發(fā)現(xiàn)3對變量(Var1和Var2、Var2和Var3、Var3和Var1)之間的相關性分別為-0.98、0.45和1.23。我們能從中推斷出什么呢?()A.Var1和Var2具有很高的相關性B.Var1和Var2存在多重共線性,模型可以去掉其中一個特征C.Var3和Var1相關系數(shù)為1.23是不可能的D.以上都對3、下列哪種方法可以用來減小過擬合?(多選)()A.更多的訓練數(shù)據(jù)B.L1正則化C.L2正則化D.減小模型的復雜度4、向量X=[1,2,3,4,-9,0]的L1范數(shù)為?()A.1B.19C.6D.√1115、關于L1、L2正則化下列說法正確的是?()A.L2正則化能防止過擬合,提升模型的泛化能力,但L1做不到這點B.L2正則化技術又稱為LassoRegularizationC.L1正則化得到的解更加稀疏D.L2正則化得到的解更加稀疏6、有N個樣本,一般用于訓練,一般用于測試。若增大N值,則訓 練誤差和測試誤差之間的差距會如何變化?()A.增大B.減小C.不變D.以上均不對7、在回歸模型中,下列哪一項在權衡欠擬合(under-fitting)和過擬 合(over-fitting)中影響最大?()A.多項式階數(shù)B.更新權重w時,使用的是矩陣求逆還是梯度下降C.使用常數(shù)項D.學習率8、輸入層中的節(jié)點數(shù)為10,隱層為5。從輸入層到隱層的最大連接數(shù) 為?
()
A.50
B.Lessthan50
C.Morethan50
D.Itisanarbitraryvalue
9、如果我們希望預測n個類(p1,p2..pk)的概率,使得所有n的p 的和等于1,則以下哪個函數(shù)可以用作輸出層中的激活函數(shù)?
()
A.Softmax
B.ReLu
C.Sigmoid
D.Tanh
10、采取什么措施不可以防止過擬合?()
A.數(shù)據(jù)壓縮;
B.權值共享;
C.提前結束模型迭代;
D.采用dropout;二、判斷題(本大題共10小題,每題1分,共10分)1、FP——將負類預測為正類數(shù)。()2、交叉熵損失函數(shù)的好處是可以克服方差代價函數(shù)更新權重過慢的問 題。()3、邏輯回歸假設數(shù)據(jù)服從伯努利分布,通過極大化似然函數(shù)的方法, 運用梯度下降來求解參數(shù),來達到將數(shù)據(jù)二分類的目的。()4、SVM無法做多分類。()5、SVM不涉及核函數(shù)。()6、BGD計算根據(jù)全部樣本的構造出來的代價函數(shù)的梯度。()7、SGD計算根據(jù)全部樣本構造出來的代價函數(shù)的梯度。()8、Bagging:訓練集是在原始集中有放回抽取的,從原始集中選出的訓練集之間是獨立的。()9、Boosting:根據(jù)錯誤率不斷調整樣本的權值,錯誤率越大則權值越大。()10、Bagging:每個樣本的權重相等。()三、填空(本大題共10小題,每題3分,共30分)1、熵指的是體系的的程度。2、信息越有序,信息熵越。3、訓練過程中用到的數(shù)據(jù)叫。4、分類是預測,比如把人分為好人和壞人之類的學習任務。5、模型把訓練樣本學習“太好了”,可能把一些訓練樣本自身的特性當做了所有潛在樣本都有的一般性質,導致泛化能力下降叫。6、評判分類效果好壞的三個指標就是上面介紹的三個指標:,,。7、從已有的M個特征(Feature)中選擇N個特征使得系統(tǒng)的特定指標最優(yōu)化叫。8、Appriori屬性1:如果項目集X是頻繁項目集,那么它的所有非空子集都是。9、分類分析的三個步驟:、、。10、決策樹包含三種結點:、、。四、簡答題(本大題共3小題,共30分)1、決策樹的剪枝方法有哪些?2、SVM的超參數(shù)有哪些?3、討論深度學習的發(fā)展對推動機器學習的意義?一、選擇題1.A 2.D 3.ABCD 4.B 5.C 6.B 7.A 8.A 9.A 10.A二、判斷題1.對 2.對 3.對 4.錯 5.錯 6.對 7.錯 8.對 9.對 10.對 三、填空題1.混亂 2.低 3.訓練集 4.離散值 5.過擬合 6.正確率召回率F值 7.特征選擇 8.頻繁項目集 9.挖掘分類規(guī)則分類規(guī)則評估分類規(guī)則應用 10.根結點(矩形表示)內部結點(矩形表示)葉結點/終結點(橢圓表示)四、簡答題1、答
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 抗氧化項目可行性報告
- 2025至2030年中國知母數(shù)據(jù)監(jiān)測研究報告
- 2025-2030年中國隔音減震墊行業(yè)深度研究分析報告
- 2025至2030年中國三七膠囊數(shù)據(jù)監(jiān)測研究報告
- 2025年中國轎車門內裝飾板市場調查研究報告
- 2020-2025年中國低速電動汽車行業(yè)市場調研分析及投資戰(zhàn)略咨詢報告
- 2025年硅酮軟管行業(yè)深度研究分析報告
- 2023-2028年中國天然藥物行業(yè)市場深度評估及投資戰(zhàn)略規(guī)劃報告
- 山羊革項目可行性研究報告
- 鋁殼拉鉚槍行業(yè)市場發(fā)展及發(fā)展趨勢與投資戰(zhàn)略研究報告
- 學前兒童表演游戲的組織與指導(學前兒童游戲課件)
- 中小學教師校園安全培訓
- 2024年北京法院聘用制審判輔助人員招聘筆試參考題庫附帶答案詳解
- 建筑用真空陶瓷微珠絕熱系統(tǒng)應用技術規(guī)程
- (高清版)DZT 0276.13-2015 巖石物理力學性質試驗規(guī)程 第13部分:巖石比熱試驗
- (高清版)DZT 0214-2020 礦產(chǎn)地質勘查規(guī)范 銅、鉛、鋅、銀、鎳、鉬
- (高清版)DZT 0017-2023 工程地質鉆探規(guī)程
- 華為狼性培訓課件
- 江蘇省初中美術學業(yè)水平考試參考復習題庫(含答案)
- 短視頻運營實戰(zhàn):抖音短視頻運營
- 設備維保的關鍵績效指標與評估
評論
0/150
提交評論