下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、精品文檔機(jī)器學(xué)習(xí)第一階段練習(xí)題一、選擇題1. 以下三階泰勒展開式錯(cuò)誤的一項(xiàng)是(B)精品文檔A. ex =1 x2 x32!3!C. sin x=xx33!1 213B. In(1 x) = x x x2 3123D.1 x x x1-x1 21 3分析:In(1 x)二 x- x x2 32. 以下不屬于凸函數(shù)一項(xiàng)的是( D)A. y=-log x B. y=x log xaxC. y=|x| p D. y=e分析:a應(yīng)該限定取值范圍:a> 1或aw 03. 以下說法錯(cuò)誤的一項(xiàng)是(C)A. 負(fù)梯度方向是使函數(shù)值下降最快的方向B. 當(dāng)目標(biāo)函數(shù)是凸函數(shù)時(shí),梯度下降法的解是全局最優(yōu)解C. 梯度
2、下降法比牛頓法收斂速度快D. 擬牛頓法不需要計(jì)算 Hesse矩陣分析:牛頓法需要二階求導(dǎo),梯度下降法只需一階,因此牛頓法比梯度下降法更快收斂4. 一般,k-NN最近鄰方法在(B)的情況下效果較好A.樣本較多但典型性不好B.樣本較少但典型性好C.樣本呈團(tuán)狀分布D. 樣本呈鏈狀分布分析:k近鄰算法對(duì)較多且典型不好的,團(tuán)狀,鏈狀的樣本不具有太大的優(yōu)勢(shì)5. 機(jī)器學(xué)習(xí)中L1正則化和L2正則化的區(qū)別是? ( A)A.使用L1可以得到稀疏的權(quán)值,使用L2可以得到平滑的權(quán)值B.使用L1可以得到平滑的權(quán)值,使用L2可以得到平滑的權(quán)值C使用L1可以得到平滑的權(quán)值,使用L2可以得到稀疏的權(quán)值D使用L1可以得到稀疏的
3、權(quán)值,使用L2可以得到稀疏的權(quán)值分析:L1正則化偏向于稀疏,它會(huì)自動(dòng)進(jìn)行特征選擇,去掉一些沒用的特征,也就是將這些特征對(duì)應(yīng)的權(quán)重置為 0。L2主要功能是為了防止過擬合,當(dāng)要求參數(shù)越小時(shí),說明模型越簡(jiǎn)單,而模型越簡(jiǎn)單則,越趨向于平滑,從而防止過擬合。二、公式推理題1. 請(qǐng)寫出通過條件概率公式和全概率公式推出貝葉斯公式的過程分析:條件概率:P( AB )P( AB )P(A|B)=P(B),P(B|A)(a)全概率:P( A)八 P(A| Bi )P( Bi )i貝葉斯公式:j2. 請(qǐng)寫出正態(tài)分布的概率密度函數(shù)、期望、以及方差1_一小2分析:概率密度函數(shù):f(x)=e 2ff2 , e 0;期望:
4、E(x)= 口;方差:D(x)= < v' 2 n(T四、簡(jiǎn)答題1.2. 求函數(shù)f(x)=xx,xR的最小值11分析:令t =xx,兩邊取對(duì)數(shù):Int =xlnx,兩邊對(duì)t求導(dǎo):-* t =1 n x x* , tx1令 t' =0 : Inx 1 = 0,那么:x = e,則 t = e e 即為 f(x)最小值。3. 欠擬合和過擬合的原因分別有哪些?如何避免?分析:欠擬合的原因:模型復(fù)雜度過低,不能很好的擬合所有的數(shù)據(jù),訓(xùn)練誤差大;避免欠擬合:增加模型復(fù)雜度,如采用高階模型(預(yù)測(cè))或者引入更多特征(分類)等。過擬合的原因:模型復(fù)雜度過高,訓(xùn)練數(shù)據(jù)過少,訓(xùn)練誤差小,測(cè)試
5、誤差大;避免過擬合:降低模型復(fù)雜度,如加上正則懲罰項(xiàng),如L1, L2,增加訓(xùn)練數(shù)據(jù)等。4. 列舉聚類算法有哪些相似性度量準(zhǔn)則及公式(至少四個(gè))n分析:曼哈頓距離:d(x,y)=(送 |x _y |P)Pd(x,y )| Xi - yi | ;歐氏距離:i#Jaccard 系數(shù):J( A,B ) = 一B1 ;余弦相似度:aTbcos 0|a| |b| Au B|皮爾森系數(shù):Pxy -;相對(duì)熵(K-L 距離):D( p | q) 一 E p( X)logox 5q(x)5. 若要對(duì)以下圖案進(jìn)行聚類分析需要采用哪種聚類方法,簡(jiǎn)述理由和該方法步驟分析:該圖案為非凸?fàn)畹模虼瞬荒苁褂没诰嚯x的聚類算法
6、(k-means、k-medoids等),可選擇密度聚類(DBSCA等)、網(wǎng)格聚類(STING等非距離的方法。6.7.簡(jiǎn)述UserCF和ItemCF算法的相同點(diǎn)與不同點(diǎn)分析:項(xiàng)目UserCFItemCF性能適用于用戶較少的場(chǎng)合,如果用戶 過多,計(jì)算用戶相似度矩陣的代價(jià) 交大適用于物品數(shù)明顯小于用戶數(shù)的場(chǎng)合,如果物品 很多,計(jì)算物品相似度矩陣的代價(jià)交大領(lǐng)域?qū)嵭砸蟾?,用戶個(gè)性化興趣要 求不咼長(zhǎng)尾物品豐富,用戶個(gè)性化需求強(qiáng)烈實(shí)時(shí)性用戶有新行為,不一定需要推薦結(jié)用戶有新行為,一定會(huì)導(dǎo)致推薦結(jié)果的實(shí)時(shí)變化果立即變化冷啟動(dòng)在新用戶對(duì)少的物品產(chǎn)生行為后, 不能立即對(duì)他進(jìn)行個(gè)性化推薦,因 為用戶相似度是離線計(jì)算的 新物品上線后一段時(shí)間,一旦有用 戶對(duì)物品產(chǎn)生行為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 家長(zhǎng)如何用報(bào)告指導(dǎo)孩子成長(zhǎng)
- 2025年度馬鈴薯種薯產(chǎn)業(yè)人才培養(yǎng)與引進(jìn)合同4篇
- 2025年度新型LED樓頂廣告字定制與安裝一體化服務(wù)合同4篇
- 2025版國際合作合同中的文化差異處理與國際法律適用4篇
- 二零二五年度醫(yī)藥健康產(chǎn)業(yè)高級(jí)管理人員聘用及研發(fā)創(chuàng)新協(xié)議3篇
- 2025年度領(lǐng)養(yǎng)兒童成長(zhǎng)保障與服務(wù)協(xié)議4篇
- 2025-2030年中國雞骨素行業(yè)十三五規(guī)劃及投資風(fēng)險(xiǎn)評(píng)估報(bào)告
- 2025-2030年中國香料香精市場(chǎng)發(fā)展趨勢(shì)及投資風(fēng)險(xiǎn)評(píng)估報(bào)告
- 2025-2030年中國防火板市場(chǎng)競(jìng)爭(zhēng)格局展望及投資策略分析報(bào)告
- 2025-2030年中國輪圈行業(yè)市場(chǎng)業(yè)發(fā)展現(xiàn)狀及前景趨勢(shì)分析報(bào)告
- 大型活動(dòng)聯(lián)合承辦協(xié)議
- 工程項(xiàng)目采購與供應(yīng)鏈管理研究
- 2024年吉林高考語文試題及答案 (2) - 副本
- 拆除電纜線施工方案
- 搭竹架合同范本
- Neo4j介紹及實(shí)現(xiàn)原理
- 焊接材料-DIN-8555-標(biāo)準(zhǔn)
- 工程索賠真實(shí)案例范本
- 重癥醫(yī)學(xué)科運(yùn)用PDCA循環(huán)降低ICU失禁性皮炎發(fā)生率品管圈QCC持續(xù)質(zhì)量改進(jìn)成果匯報(bào)
- 個(gè)人股權(quán)證明書
- 醫(yī)院運(yùn)送工作介紹
評(píng)論
0/150
提交評(píng)論