版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第1頁,共1頁一、單項選擇題(本大題共10小題,每題3分,共30分)試卷(2021試卷(2021-2022學年第1學期)考試科目機器學習-Python實踐(A卷)適用專業(yè)班級(年級)得分命題人:審閱人:班級學號姓名考試科目裝訂線1、個人健康和年齡的相關(guān)系數(shù)是-1.09。根據(jù)這個你可以告訴醫(yī)生哪個結(jié)論?()A.年齡是健康程度很好的預測器B.年齡是健康程度很糟的預測器C.以上說法都不對D:兩者沒關(guān)系2、假如我們利用Y是X的3階多項式產(chǎn)生一些數(shù)據(jù)(3階多項式能很好地擬合數(shù)據(jù))。那么,下列說法正確的是(多選)?()A.簡單的線性回歸容易造成高偏差(bias)、低方差(variance)B.簡單的線性回歸容易造成低偏差(bias)、高方差(variance)C.3階多項式擬合會造成低偏差(bias)、高方差(variance)D.3階多項式擬合具備低偏差(bias)、低方差(variance)3、假如你在訓練一個線性回歸模型,有下面兩句話:()1.如果數(shù)據(jù)量較少,容易發(fā)生過擬合。2.如果假設空間較小,容易發(fā)生過擬合。關(guān)于這兩句話,下列說法正確的是?A.1和2都錯誤B.1正確,2錯誤C.1錯誤,2正確D.1和2都正確4、假如我們使用Lasso回歸來擬合數(shù)據(jù)集,該數(shù)據(jù)集輸入特征有100個(X1,X2,…,X100)。現(xiàn)在,我們把其中一個特征值擴大10倍(例如是特征X1),然后用相同的正則化參數(shù)對Lasso回歸進行修正。那么,下列說法正確的是?()A.特征X1很可能被排除在模型之外B.特征X1很可能還包含在模型之中C.無法確定特征X1是否被舍棄D.以上說法都不對5、假如使用邏輯回歸對樣本進行分類,得到訓練樣本的準確率和測試樣本的準確率?,F(xiàn)在,在數(shù)據(jù)中增加一個新的特征,其它特征保持不變。然后重新訓練測試。則下列說法正確的是?()A.訓練樣本準確率一定會降低B.訓練樣本準確率一定增加或保持不變C.測試樣本準確率一定會降低D.測試樣本準確率一定增加或保持不變6、下面這張圖是一個簡單的線性回歸模型,圖中標注了每個樣本點預測值與真實值的殘差。計算SSE(平方誤差和)為多少?()A.3.02B.0.75C.1.01D.0.6047、關(guān)于“回歸(Regression)”和“相關(guān)(Correlation)”,下列說法正確的是?注意:x是自變量,y是因變量。()A.回歸和相關(guān)在x和y之間都是互為對稱的B.回歸和相關(guān)在x和y之間都是非對稱的C.回歸在x和y之間是非對稱的,相關(guān)在x和y之間是互為對稱的D.回歸在x和y之間是對稱的,相關(guān)在x和y之間是非對稱的8、關(guān)于AdaBoost,下列說法中正確的是(多選):()A.它是一種集成學習算法B.每個分類器的權(quán)重和被它正確分類的樣本的權(quán)重相同C.后一個基學習器要依賴于前一個基學習器的分類錯誤率和樣本的權(quán)重D.后一個基學習器每次只學習前一個基學習器被分錯的樣本9、集成學習策略有哪些() A.投票法B.平均法C.學習法D.上述都有10、集成學習策略常用于分類的是:()A.投票法B.平均法C.學習法D.上述都有二、判斷題(本大題共10小題,每題1分,共10分)1、決策樹短時間內(nèi)處理大量數(shù)據(jù),得到可行且效果較好的結(jié)果。()樸素貝葉斯適合高維數(shù)據(jù)。()標量是0階張量。()協(xié)方差是衡量兩個變量線性相關(guān)性強度及變量尺度。()聯(lián)合分布可求邊緣分布,但若只知道邊緣分布,無法求得聯(lián)合分布。()隨機變量可以分為離散型隨機變量和連續(xù)型隨機變量。()矩陣的L0范數(shù):矩陣的非0元素的個數(shù),通常用它來表示稀疏,L0范數(shù)越小0元素越多,也就越稀疏。()Adaboost算法流程計算該分類器的錯誤率,根據(jù)錯誤率計算要給分類器分配的權(quán)重。()9、Adaboost算法流程將第一個分類器分錯誤的樣本權(quán)重增加。()10、Adaboost算法流程然后再用新的樣本權(quán)重訓練數(shù)據(jù),得到新的分類器。()三、填空(本大題共10小題,每題3分,共30分)1、一個表示一個單獨的數(shù),它不同于線性代數(shù)中研究的其他大部分對象(通常是多個數(shù)的數(shù)組)。2、馬式距離的特征則是:。3、p(x|θ)是給定參數(shù)θ的概率分布:。4、基尼指數(shù)(基尼不純度)=*。5、Gini指數(shù)越小表示集合中被選中的樣本被分錯的概率越小,也就是說集合的純度。6、表示在樣本集合中一個隨機選中的樣本被分錯的概率。7、算法在決策樹生成的過程中,用信息增益比來選擇特征。8、聚類結(jié)果評估:分析結(jié)果,如距離誤差和(SSE)等。9、人工神經(jīng)網(wǎng)絡(ArtificialNeuralNetworks,ANNs),也簡稱為神經(jīng)網(wǎng)絡(NNs),是模擬進行信息處理的一種數(shù)學模型,以對大腦的生理研究成果為基礎,其目的在于模擬大腦的某些機理與機制,實現(xiàn)一些特定的功能。10、生物
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度心理咨詢錄音保密與使用規(guī)范合同4篇
- 2025年度新能源材料買賣合同標準格式3篇
- 個人借貸反擔保協(xié)議(2024版)8篇
- 二零二五年度焊工焊接材料采購與聘用合同3篇
- 2025年廠房使用權(quán)轉(zhuǎn)讓合同模板4篇
- 2025屆甘肅省酒泉市瓜州縣重點中學初中生物畢業(yè)考試模擬沖刺卷含解析
- 2025屆江蘇省宿遷市市級名校中考聯(lián)考歷史試卷含解析
- 二零二五版擔保二手車買賣風險規(guī)避合同3篇
- 2025年度廠房租賃與產(chǎn)業(yè)孵化器服務協(xié)議4篇
- 2025年企業(yè)涉密協(xié)議
- GB/T 14864-2013實心聚乙烯絕緣柔軟射頻電纜
- 品牌策劃與推廣-項目5-品牌推廣課件
- 信息學奧賽-計算機基礎知識(完整版)資料
- 發(fā)煙硫酸(CAS:8014-95-7)理化性質(zhì)及危險特性表
- 數(shù)字信號處理(課件)
- 公路自然災害防治對策課件
- 信息簡報通用模板
- 火災報警應急處置程序流程圖
- 耳鳴中醫(yī)臨床路徑
- 安徽身份證號碼前6位
- 分子生物學在動物遺傳育種方面的應用
評論
0/150
提交評論