版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
chapter5突觸動(dòng)力學(xué)Ⅱ——
有監(jiān)督學(xué)習(xí)學(xué)號(hào):0622310213姓名:余景景本章內(nèi)容要點(diǎn)有監(jiān)督學(xué)習(xí)的理論解釋有監(jiān)督的函數(shù)估計(jì)有監(jiān)督的學(xué)習(xí)相當(dāng)于操作性條件反射有監(jiān)督的學(xué)習(xí)相當(dāng)于有先驗(yàn)知識(shí)的隨機(jī)模式學(xué)習(xí)前饋網(wǎng)絡(luò)的監(jiān)督學(xué)習(xí)算法感知器最小均方誤差(LMS)算法反向傳播(BP)算法第一部分內(nèi)容有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)有監(jiān)督的函數(shù)估計(jì)有監(jiān)督學(xué)習(xí)相當(dāng)于操作性條件反射有監(jiān)督學(xué)習(xí)相當(dāng)于有先驗(yàn)知識(shí)的隨機(jī)模式學(xué)習(xí)有監(jiān)督學(xué)習(xí)
給定一系列訓(xùn)練樣本,其中每個(gè)樣本都做上了標(biāo)記,比如說(shuō)標(biāo)記出這個(gè)樣本來(lái)自對(duì)一個(gè)蘋果的一次觀測(cè)。學(xué)習(xí)的目的是從這些帶有標(biāo)記的樣本中學(xué)習(xí)到一些概念,比如說(shuō)什么樣的數(shù)據(jù)對(duì)應(yīng)蘋果而不是香蕉,并且在未來(lái)給出新的樣本時(shí),能夠正確預(yù)測(cè)新樣本的標(biāo)記。無(wú)監(jiān)督學(xué)習(xí)給定一系列沒(méi)有任何標(biāo)記的訓(xùn)練樣本,學(xué)習(xí)的目的時(shí)發(fā)現(xiàn)隱藏在這些樣本中的某種結(jié)構(gòu),例如樣本的聚類情況。環(huán)境學(xué)習(xí)系統(tǒng)狀態(tài)向量有監(jiān)督的函數(shù)估計(jì)給定觀察得到的隨機(jī)矢量樣本對(duì):要估計(jì)一個(gè)未知函數(shù):
使得期望誤差函數(shù)E[J]最小。誤差=期望輸出-實(shí)際輸出有監(jiān)督的函數(shù)估計(jì)設(shè)N為一個(gè)神經(jīng)網(wǎng)絡(luò)的傳遞函數(shù),那么可以定義瞬時(shí)誤差為 ,這是一個(gè)隨機(jī)向量,由于我們不知道聯(lián)合概率密度函數(shù)p(x,y)無(wú)法求出 ,一般用均方差替代。隨機(jī)逼近用觀測(cè)到的隨機(jī)量來(lái)估計(jì)期望值,然后在離散的近似算法中使用這些估計(jì)量。用的比較多的近似算法是隨機(jī)梯度下降法。如本章將要講述的Widrow’sLMS算法中所用的就是隨機(jī)梯度。有監(jiān)督學(xué)習(xí)相當(dāng)于操作性條件反射操作性條件反射強(qiáng)化響應(yīng),如果輸入與期望的輸出不同,就調(diào)節(jié)權(quán)值m。無(wú)監(jiān)督學(xué)習(xí)相當(dāng)于傳統(tǒng)條件反射傳統(tǒng)條件反射強(qiáng)化刺激。這種神經(jīng)網(wǎng)絡(luò)直接把輸入x耦合到輸出y。例如,一個(gè)生物體學(xué)會(huì)了一刺激響應(yīng)對(duì):那么在條件刺激S中加一個(gè)條件B進(jìn)行學(xué)習(xí),得到
不斷強(qiáng)化刺激,直到輸入B時(shí)反應(yīng)為R。這樣就有:也就是學(xué)會(huì)了一條規(guī)則。如巴普洛夫條件反射試驗(yàn)。
有監(jiān)督學(xué)習(xí)相當(dāng)于
有先驗(yàn)知識(shí)的隨機(jī)模式學(xué)習(xí)模式:模式空間上的點(diǎn)時(shí)變模式:定義在中的軌跡線隨機(jī)模式學(xué)習(xí)由已知的樣本x(1),x(2)…x(n)來(lái)估計(jì)x的概率密度函數(shù)p(x)模式類:是的子集,也叫決策類,滿足:有監(jiān)督學(xué)習(xí)相當(dāng)于
有先驗(yàn)知識(shí)的隨機(jī)模式學(xué)習(xí)類的概率其中 ,是一個(gè)指示器函數(shù),定義為 指示函數(shù)指出了模式x的類隸屬關(guān)系。如果S是將映射到而不是。就稱模式x以不同的程度隸屬于不同的類。類的概率滿足區(qū)分學(xué)習(xí)類型的標(biāo)準(zhǔn):先驗(yàn)知識(shí)在有監(jiān)督和無(wú)監(jiān)督模式學(xué)習(xí)中,系統(tǒng)都不知道它們的區(qū)別在于是否有先驗(yàn)知識(shí)以及學(xué)習(xí)系統(tǒng)如何利用貝葉斯學(xué)習(xí)中用到了指示器函數(shù),是有監(jiān)督的學(xué)習(xí)噪聲隨機(jī)競(jìng)爭(zhēng)學(xué)習(xí)律:沒(méi)有使用類成員信息校正突觸矢量,是非監(jiān)督學(xué)習(xí)監(jiān)督隨
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學(xué)一年級(jí)20以內(nèi)連加連減口算練習(xí)題75道一張
- 小學(xué)數(shù)學(xué)一年級(jí)以內(nèi)加減法口算
- 自然辯證法復(fù)習(xí)題含答案完整版
- 內(nèi)蒙古阿拉善銀星風(fēng)力發(fā)電有限公司事故應(yīng)急預(yù)案
- 職稱述職報(bào)告
- 高考新課標(biāo)語(yǔ)文模擬試卷系列之72
- 技能競(jìng)賽與課外拓展活動(dòng)計(jì)劃
- 寵物用品行業(yè)安全工作總結(jié)
- 旅游行業(yè)的保安工作總結(jié)
- 兒童教育行業(yè)保育員培訓(xùn)心得
- 2024CSCO胰腺癌診療指南解讀
- 窗簾采購(gòu)?fù)稑?biāo)方案(技術(shù)方案)
- 電力安全工作規(guī)程考試試題(答案)
- 2024-2030年串番茄行業(yè)市場(chǎng)發(fā)展分析及前景趨勢(shì)與投資研究報(bào)告
- 城市燃?xì)夤芫W(wǎng)改造合同
- 2024-2025學(xué)年廣東省東莞市高三思想政治上冊(cè)期末試卷及答案
- 《水電站建筑物》課件
- 9-XX人民醫(yī)院樣本外送檢測(cè)管理制度(試行)
- 場(chǎng)地硬化合同范文
- 智力殘疾送教上門教案
- 2024北京市公安局平谷分局勤務(wù)輔警人員招聘筆試參考題庫(kù)含答案解析
評(píng)論
0/150
提交評(píng)論