版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第第頁機器學習試題(一共30題,標有下劃線的,如3_1,3_2,只用選擇其中一題) 1.在回歸模型中,下列哪一項在權(quán)衡欠擬合(under-fitting)和過擬合(over-fitting)中影響最大?A.多項式階數(shù)B.更新權(quán)重w時,使用的是矩陣求逆還是梯度下降C.使用常數(shù)項2.假設(shè)你有以下數(shù)據(jù):輸入和輸出都只有一個變量。使用線性回歸模型(y=wx+b)來擬合數(shù)據(jù)。那么使用留一法(Leave-OneOut)交叉驗證得到的均方誤差是多少?A.10/27B.39/27C.49/27D.55/273_1.下列關(guān)于極大似然估計(MaximumLikelihoodEstimate,MLE),說法正確的是(多選)?A.MLE可能并不存在B.MLE總是存在C.如果MLE存在,那么它的解可能不是唯一的D.如果MLE存在,那么它的解一定是唯一的3_2.下列哪些假設(shè)是我們推導線性回歸參數(shù)時遵循的(多選)?A.X與Y有線性關(guān)系(多項式關(guān)系)B.模型誤差在統(tǒng)計學上是獨立的C.誤差一般服從0均值和固定標準差的正態(tài)分布D.X是非隨機且測量沒有誤差的4_1.為了觀察測試Y與X之間的線性關(guān)系,X是連續(xù)變量,使用下列哪種圖形比較適合?A.散點圖B.柱形圖C.直方圖D.以上都不對4_2.一般來說,下列哪種方法常用來預(yù)測連續(xù)獨立變量?A.線性回歸B.邏輯回顧C.線性回歸和邏輯回歸都行D.以上說法都不對5.個人健康和年齡的相關(guān)系數(shù)是-1.09。根據(jù)這個你可以告訴醫(yī)生哪個結(jié)論?A.年齡是健康程度很好的預(yù)測器B.年齡是健康程度很糟的預(yù)測器C.以上說法都不對6.下列哪一種偏移,是我們在最小二乘直線擬合的情況下使用的?圖中橫坐標是輸入X,縱坐標是輸出Y。A.垂直偏移(verticaloffsets)B.垂向偏移(perpendicularoffsets)C.兩種偏移都可以D.以上說法都不對7.假如我們利用Y是X的3階多項式產(chǎn)生一些數(shù)據(jù)(3階多項式能很好地擬合數(shù)據(jù))。那么,下列說法正確的是(多選)?A.簡單的線性回歸容易造成高偏差(bias)、低方差(variance)B.簡單的線性回歸容易造成低偏差(bias)、高方差(variance)C.3階多項式擬合會造成低偏差(bias)、高方差(variance)D.3階多項式擬合具備低偏差(bias)、低方差(variance)8_1.假如你在訓練一個線性回歸模型,有下面兩句話:1.如果數(shù)據(jù)量較少,容易發(fā)生過擬合。2.如果假設(shè)空間較小,容易發(fā)生過擬合。關(guān)于這兩句話,下列說法正確的是?A.1和2都錯誤B.1正確,2錯誤C.1錯誤,2正確D.1和2都正確8_2.假如我們使用Lasso回歸來擬合數(shù)據(jù)集,該數(shù)據(jù)集輸入特征有100個(X1,X2,...,X100)?,F(xiàn)在,我們把其中一個特征值擴大10倍(例如是特征X1),然后用相同的正則化參數(shù)對Lasso回歸進行修正。那么,下列說法正確的是?A.特征X1很可能被排除在模型之外B.特征X1很可能還包含在模型之中C.無法確定特征X1是否被舍棄D.以上說法都不對9_1.關(guān)于特征選擇,下列對Ridge回歸和Lasso回歸說法正確的是?A.Ridge回歸適用于特征選擇 B.Lasso回歸適用于特征選擇C.兩個都適用于特征選擇D.以上說法都不對9_2.如果在線性回歸模型中增加一個特征變量,下列可能發(fā)生的是(多選)?A.R-squared增大,AdjustR-squared增大B.R-squared增大,AdjustR-squared減小C.R-squared減小,AdjustR-squared減小D.R-squared減小,AdjustR-squared增大10.下面三張圖展示了對同一訓練樣本,使用不同的模型擬合的效果(藍色曲線)。那么,我們可以得出哪些結(jié)論(多選)?A.第1個模型的訓練誤差大于第2個、第3個模型B.最好的模型是第3個,因為它的訓練誤差最小C.第2個模型最為“健壯”,因為它對未知樣本的擬合效果最好D.第3個模型發(fā)生了過擬合E.所有模型的表現(xiàn)都一樣,因為我們并沒有看到測試數(shù)據(jù)11.下列哪些指標可以用來評估線性回歸模型(多選)?A.R-SquaredB.AdjustedR-SquaredC.FStatisticsD.RMSE/MSE/MAE12_1.線性回歸中,我們可以使用正規(guī)方程(NormalEquation)來求解系數(shù)。下列關(guān)于正規(guī)方程說法正確的是?A.不需要選擇學習因子B.當特征數(shù)目很多的時候,運算速度會很慢C.不需要迭代訓練12_2.如果Y是X(X1,X2,...,Xn)的線性函數(shù):Y=β0+β1X1+β2X2+···+βnXn則下列說法正確的是(多選)?A.如果變量Xi改變一個微小變量ΔXi,其它變量不變。那么Y會相應(yīng)改變βiΔXi。B.βi是固定的,不管Xi如何變化C.Xi對Y的影響是相互獨立的,且X對Y的總的影響為各自分量Xi之和13.構(gòu)建一個最簡單的線性回歸模型需要幾個系數(shù)(只有一個特征)?A.1個B.2個C.3個D.4個14.如果兩個變量相關(guān),那么它們一定是線性關(guān)系嗎?A.是B.不是15.兩個變量相關(guān),它們的相關(guān)系數(shù)r可能為0。這句話是否正確?A.正確B.錯誤16_1.加入使用邏輯回歸對樣本進行分類,得到訓練樣本的準確率和測試樣本的準確率?,F(xiàn)在,在數(shù)據(jù)中增加一個新的特征,其它特征保持不變。然后重新訓練測試。則下列說法正確的是?A.訓練樣本準確率一定會降低B.訓練樣本準確率一定增加或保持不變C.測試樣本準確率一定會降低D.測試樣本準確率一定增加或保持不變16_2.假設(shè)一個公司的薪資水平中位數(shù)是$35,000,排名第25%和75%的薪資分別是21000和
53,000。如果某人的薪水是$1,那么它可以被看成是異常值(Outlier)嗎?A.可以B.不可以C.需要更多的信息才能判斷D.以上說法都不對13.關(guān)于“回歸(Regression)”和“相關(guān)(Correlation)”,下列說法正確的是?注意:x是自變量,y是因變量。A.回歸和相關(guān)在x和y之間都是互為對稱的B.回歸和相關(guān)在x和y之間都是非對稱的C.回歸在x和y之間是非對稱的,相關(guān)在x和y之間是互為對稱的D.回歸在x和y之間是對稱的,相關(guān)在x和y之間是非對稱的14.僅僅知道變量的均值(Mean)和中值(Median),能計算的到變量的偏斜度(Skewness)嗎?A.可以B.不可以15.觀察樣本次數(shù)如何影響過擬合(多選)?注意:所有情況的參數(shù)都保持一致。A.觀察次數(shù)少,容易發(fā)生過擬合B.觀察次數(shù)少,不容易發(fā)生過擬合C.觀察次數(shù)多,容易發(fā)生過擬合D.觀察次數(shù)多,不容易發(fā)生過擬合16.假如使用一個較復(fù)雜的回歸模型來擬合樣本數(shù)據(jù),使用Ridge回歸,調(diào)試正則化參數(shù)λ,來降低模型復(fù)雜度。若λ較大時,關(guān)于偏差(bias)和方差(variance),下列說法正確的是?A.若λ較大時,偏差減小,方差減小B.若λ較大時,偏差減小,方差增大C.若λ較大時,偏差增大,方差減小D.若λ較大時,偏差增大,方差增大17.假設(shè)使用邏輯回歸進行n多類別分類,使用One-vs-rest分類法。下列說法正確的是?A.對于n類別,需要訓練n個模型B.對于n類別,需要訓練n-1個模型C.對于n類別,只需要訓練1個模型D.以上說法都不對18.在n維空間中(n>1),下列哪種方法最適合用來檢測異常值?A.正態(tài)概率圖B.箱形圖C.馬氏距離D.散點圖19_1.邏輯回歸與多元回歸分析有哪些不同之處?A.邏輯回歸用來預(yù)測事件發(fā)生的概率B.邏輯回歸用來計算擬合優(yōu)度指數(shù)C.邏輯回歸用來對回歸系數(shù)進行估計D.以上都是19_2.下列關(guān)于bootstrap說法正確的是?A.從總的M個特征中,有放回地抽取m個特征(m<M)B.
從總的M個特征中,無放回地抽取m個特征(m<M)C.從總的N個樣本中,有放回地抽取n個樣本(n<N)D.
從總的N個樣本中,無放回地抽取n個樣本(n<N)20."監(jiān)督式學習中存在過擬合,而對于非監(jiān)督式學習來說,沒有過擬合",這句話是否正確?A.正確B.錯誤21.關(guān)于k折交叉驗證,下列說法正確的是?A.k值并不是越大越好,k值過大,會降低運算速度B.選擇更大的k值,會讓偏差更小,因為k值越大,訓練集越接近整個訓練樣本C.選擇合適的k值,能減小驗方差D.以上說法都正確22.如果回歸模型中存在多重共線性(multicollinearity),應(yīng)該如何解決這一問題而不丟失太多信息(多選)?A.剔除所有的共線性變量B.剔除共線性變量中的一個C.通過計算方差膨脹因子(VarianceInflationFactor,VIF)來檢查共線性程度,并采取相應(yīng)措施D.刪除相關(guān)變量可能會有信息損失,我們可以不刪除相關(guān)變量,而使用一些正則化方法來解決多重共線性問題,例如Ridge或Lasso回歸。23.評估完模型之后,發(fā)現(xiàn)模型存在高偏差(highbias),應(yīng)該如何解決?A.減少模型的特征數(shù)量B.增加模型的特征數(shù)量C.增加樣本數(shù)量D.以上說法都正確24.在構(gòu)建一個決策樹模型時,我們對某個屬性分割節(jié)點,下面四張圖中,哪個屬性對應(yīng)的信息增益最大?A.outlookB.humidityC.windyD.temperature25.在決策樹分割結(jié)點的時候,下列關(guān)于信息增益說法正確的是(多選)?A.純度高的結(jié)點需要更多的信息來描述它B.
信息增益可以用”1比特-熵”獲得C.
如果選擇一個屬性具有許多特征值,那么這個信息增益是有偏差的26.如果一個SVM模型出現(xiàn)欠擬合,那么下列哪種方法能解決這一問題?A.增大懲罰參數(shù)C的值B.減小懲罰參數(shù)C的值C.減小核系數(shù)(gamma參數(shù))27.我們知道二元分類的輸出是概率值。一般設(shè)定輸出概率大于或等于0.5,則預(yù)測為正類;若輸出概率小于0.5,則預(yù)測為負類。那么,如果將閾值0.5提高,例如0.6,大于或等于0.6的才預(yù)測為正類。則準確率(Precision)和召回率(Recall)會發(fā)生什么變化(多選)?A.準確率(Precision)增加或者不變B.準確率(Precision)減小C.召回率(Recall)減小或者不變D.召回率(Recall)增大28_1.點擊率預(yù)測是一個正負樣本不平衡問題(例如99%的沒有點擊,只有1%點擊)。假如在這個非平衡的數(shù)據(jù)集上建立一個模型,得到訓練樣本的正確率是99%,則下列說法正確的是?A.模型正確率很高,不需要優(yōu)化模型了B.模型正確率并不高,應(yīng)該建立更好的模型C.無法對模型做出好壞評價D.以上說法都不對28_2.假設(shè)我們使用kNN訓練模型,其中訓練數(shù)據(jù)具有較少的觀測數(shù)據(jù)(下圖是兩個屬性x、y和兩個標記為“+”和“o”的訓練數(shù)據(jù))?,F(xiàn)在令
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國全木漿高檔雙面膠版紙市場調(diào)查研究報告
- 2025至2031年中國微電腦控制臺式高溫打樣機行業(yè)投資前景及策略咨詢研究報告
- 2025至2031年中國建筑五金行業(yè)投資前景及策略咨詢研究報告
- 2025至2030年中國鞋邊數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國鍋爐用耐火澆注料數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國竹制水果叉數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國普通鐳射激光標簽數(shù)據(jù)監(jiān)測研究報告
- 智能化物料堆場管理-深度研究
- 下一代防火墻的設(shè)計與實現(xiàn)-深度研究
- 2025至2030年中國冷媒自動回收機數(shù)據(jù)監(jiān)測研究報告
- 2024年湖南高速鐵路職業(yè)技術(shù)學院高職單招數(shù)學歷年參考題庫含答案解析
- 國旗班指揮刀訓練動作要領(lǐng)
- 2024年國家工作人員學法用法考試題庫及參考答案
- 國家公務(wù)員考試(面試)試題及解答參考(2024年)
- 《阻燃材料與技術(shù)》課件 第6講 阻燃纖維及織物
- 2021-2022學年遼寧省重點高中協(xié)作校高一上學期期末語文試題
- 同等學力英語申碩考試詞匯(第六版大綱)電子版
- 人教版五年級上冊遞等式計算100道及答案
- 墓地個人協(xié)議合同模板
- 2024年部編版初中語文各年級教師用書七年級(上冊)
- 2024年新課標全國Ⅰ卷語文高考真題試卷(含答案)
評論
0/150
提交評論