![數(shù)據(jù)挖掘算法介紹_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/2/e7a627d8-2d23-4103-ab38-5e759f1f38c4/e7a627d8-2d23-4103-ab38-5e759f1f38c41.gif)
![數(shù)據(jù)挖掘算法介紹_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/2/e7a627d8-2d23-4103-ab38-5e759f1f38c4/e7a627d8-2d23-4103-ab38-5e759f1f38c42.gif)
![數(shù)據(jù)挖掘算法介紹_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/2/e7a627d8-2d23-4103-ab38-5e759f1f38c4/e7a627d8-2d23-4103-ab38-5e759f1f38c43.gif)
![數(shù)據(jù)挖掘算法介紹_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/2/e7a627d8-2d23-4103-ab38-5e759f1f38c4/e7a627d8-2d23-4103-ab38-5e759f1f38c44.gif)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、后向傳播“后向傳播如何工作?”后向傳播通過迭代地處理一組訓(xùn)練樣本,將每個樣本的網(wǎng)絡(luò)預(yù)測與實際知道的類標(biāo)號比較,進(jìn)行學(xué)習(xí)。對于每個訓(xùn)練樣本,修改權(quán),使得網(wǎng)絡(luò)預(yù)測和實際類之間的均方誤差最小。這種修改“后向”進(jìn)行,即由輸出層,經(jīng)每個隱藏層,到第一個隱 藏層(因此稱作后向傳播)。盡管不能保證,一般地,權(quán)將最終收斂,學(xué)習(xí)過程停止。算法 在圖7.8中給出。算法:后向傳播。使用后向傳播的神經(jīng)網(wǎng)絡(luò)分類學(xué)習(xí)。 輸入:訓(xùn)練樣本samples,學(xué)習(xí)率I,多層前饋神經(jīng)網(wǎng)絡(luò) network。 輸出:一個訓(xùn)練的、對樣本分類的神經(jīng)網(wǎng)絡(luò)。方法:1) 初始化network的權(quán)和偏置。2) while終止條件不滿足3) for
2、samples中的每個訓(xùn)練樣本X4) /向前傳播輸入5) for隱藏或輸出層每個單元j6) ij = 7 jWjjOj r ; /相對于前一層i,計算單元j的凈輸入7) Oj =1 (1 e);/計算每個單元j的輸出8) /后向傳播誤差9) for輸出層每個單元j10) Err j =0j(1 -Oj)(Tj - Oj) ; /計算誤差11) for由最后一個到第一個隱藏層,對于隱藏層每個單元j12) Errj =0j(1-Oj)v k ErgWjk ; 計算關(guān)于下一個較高層k的誤差13) for network 中每個權(quán) wij 14) Wj -(l)ErrjOi ; /權(quán)增值15) WjW
3、j ; / 權(quán)更新16) for network 中每個偏差-j 17) =(l)E; /偏差增值18) 可-可; /偏差更新19) 圖7.8后向傳播算法每一步的解釋如下:初始化權(quán):網(wǎng)絡(luò)的權(quán)被初始化為很小的隨機(jī)數(shù)(例如,由 -1.0到1.0,或由-0.5到0.5)。 每個單元有一個偏置,在下面解釋。偏置也類似地初始化為小隨機(jī)數(shù)。每個樣本X按以下步驟處理。向前傳播輸入:在這一步,計算隱藏層和輸出層每個單元的凈輸入和輸出。首先,訓(xùn)練樣本提供給網(wǎng)絡(luò)的輸入層。注意,對于輸入層的單元j,它的輸出等于它的輸入,即對于單兀j, Oj = ij。然后,隱藏層和輸出層的每個單元的凈輸入用其輸入的線性組合計算。為
4、 幫助解釋這一點,圖 7.9給出了一個隱藏層或輸出層單元。事實上,單元的輸入是連接它的 前一層的單元的輸出。為計算它的凈輸入,連接該單元的每個輸入乘以其對應(yīng)的權(quán),然后求和。給定隱藏層或輸出層的單元j,到單元j的凈輸入Ij是I LWjOi (7.13)其中,Wjj是由上一層的單元i到單元j的連接的權(quán);Oi是上一層單元i的輸出;而v j是 單元j的偏置。偏置充當(dāng)閾值,用來改變單元的活性。隱藏層和輸出層的每個單元取其凈輸入, 然后將一個賦活函數(shù)作用于它,如圖7.9所示。 該函數(shù)用符號表現(xiàn)單元代表的神經(jīng)元活性。使用logistic或simoid函數(shù)。給定單元j的凈輸入Ij,則單元j的輸出q用下式計算:
5、Oj =1 (1 eJj)(7.14)該函數(shù)又稱擠壓函數(shù),因為它將一個較大的輸入值域映射到較小的區(qū)間0到1。Logistic函數(shù)是非線性的和可微的,使得后向傳播算法可以對線性不可分的分類問題建模。向后傳播誤差:通過更新權(quán)和偏置以反映網(wǎng)絡(luò)預(yù)測的誤差,向后傳播誤差。對于輸出層單元j,誤差Errj用Err j = Oj(1 - Oj )(- Oj )(7.15)計算,其中Oj是單元j的輸出,而Tj是j基于給定訓(xùn)練樣本的已知類標(biāo)號的真正輸出。注意,Oj(1-Oj)是logistic函數(shù)的導(dǎo)數(shù)。為計算隱藏層單元j的誤差,考慮下一層中連接j的單元的誤差加權(quán)和。隱藏層單元j的誤差是Errj =Oj(1-Oj
6、) kErrkWkj(7.16)其中,wkj是由下一較高層中單元 k到單元j的連接權(quán),而Errk是單元k的誤差。 更新權(quán)和偏差,以反映傳播的誤差。權(quán)由下式更新,其中:Wij是權(quán)Wij的改變。Wj =(l)EOj(7.17)Wj 二 WjWj(7.18)7.18式中的I是學(xué)習(xí)率,通常取 0和1之間的一個常數(shù)值。 后向傳播學(xué)習(xí)使用梯度下降 法搜索權(quán)值的集合。這些權(quán)值可以對給定的分類問題建模,使得樣本的網(wǎng)絡(luò)預(yù)測和實際的類標(biāo)號距離平方的平均值最小。 學(xué)習(xí)率幫助避免陷入判定空間的局部最小 (即權(quán)值看上去收斂, 但不是最優(yōu)解),并有助于找到全局最小。如果學(xué)習(xí)率太小,學(xué)習(xí)將進(jìn)行得很慢。如果學(xué)習(xí)1 t。其中,
7、t率太大,可能出現(xiàn)在不適當(dāng)?shù)慕庵g擺動。一個經(jīng)驗規(guī)則是將學(xué)習(xí)率設(shè)置為是已對訓(xùn)練樣本集迭代的次數(shù)。偏置由下式更新,其中.r是偏置 引的改變: *j =(l)Errj( 7.19)巧-y j( 7.20)注意,這里我們每處理一個樣本就更新權(quán)和偏置,這稱作 實例更新(case update)。權(quán) 和偏置的增量也可以累積到變量中,使得可以在處理完訓(xùn)練集中的所有樣本之后再更新權(quán)和偏置。后一種策略稱作 周期更新(epoch update),掃描訓(xùn)練集的一次迭代是一個周期。理論 上,后向傳播的數(shù)學(xué)指導(dǎo)使用周期更新,而實踐中實例更新更常見,因為它通常產(chǎn)生更準(zhǔn)確的結(jié)果。權(quán)加權(quán)和偏置6 j輸出賦活函數(shù)輸入(前一層
8、的輸出)圖7.9 一個隱藏或輸出單元j: j的輸入是來自前一層的輸出;這些與對應(yīng)的權(quán)相乘,以形成加權(quán)和;加權(quán)和加到與單元j相聯(lián)的偏置上;一個非線性的賦活函數(shù)用于凈輸入終止條件:訓(xùn)練停止,如果前一周期所有的AWj都很小,小于某個指定的閾值,或前一周期未正確分類的樣本百分比小于某個閾值,或超過預(yù)先指定的周期數(shù)。實踐中,權(quán)收斂可能需要數(shù)十萬個周期。例7.4通過后向傳播算法學(xué)習(xí)的樣本計算。圖7.10給出了一個多層前饋神經(jīng)網(wǎng)絡(luò)。設(shè)學(xué)習(xí)率為0.9。該網(wǎng)絡(luò)的初始權(quán)值和偏置值以及第一個訓(xùn)練樣本X=1,0,1(其類標(biāo)號為1)在表7.3中給出。X1X2X3圖7.10多層前饋神經(jīng)網(wǎng)絡(luò)的一個例子表7.3初始輸入、權(quán)值
9、和偏差值X1X2X3W14W15W24W25W34W35W46W561010.2-0.30.40.1-0.50.2-0.3-0.2-0.40.20.1給定第一個訓(xùn)練樣本 X,該例展示后向傳播計算。首先將樣本提供給網(wǎng)絡(luò),計算每個單元的凈輸入和輸出。 這些值在表7.4中。計算每個單元的誤差,并后向傳播。誤差值在表7.51 (11 e0.105) = 0.474中,權(quán)和偏置的更新在表7.6中。單元j凈輸入Ij輸出Oj40.2+0-0.5-0.4=-0.71 (11 e0.7) =0.3325-0.3+0+0.2+0.2=0.11 (11 e.1) =0.525表7.4凈輸入和輸岀的計算表6(-0.3
10、)(0.332)-(0.2)(0.525)+0.1=-0.105表7.5計算每個節(jié)點的誤差單元jErrj6(0.474)(1-0.474)(1-0.474)=0.13115(0.525)(1-0.525)(0.1311)(-0.2)=-0.006540.474(1-0.332)(1.1311)(-0.3)=-0.0087表7.6計算權(quán)和偏置的更新權(quán)或偏差新值W56-0.2+(0.9)(0.1311)(0.525)=-0.138W140.2+(0.9)(-0.0087)(1)=0.192W15-0.3+(0.9)(0.0065)(1)=0.306W240.4+(0.9)(-0.0087)(0)=0.4W250.1+(0.9)(0.0065)(0)=0.1W34-0.5+(0.9)(-0.0087)(1)=-0.508W350.2+(0.9)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年外研版七年級物理下冊階段測試試卷
- 生殖系統(tǒng)炎癥病人的護(hù)理非特異性外陰炎病人的護(hù)理婦科護(hù)理講解
- 2025年徐州生物工程職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試近5年??及鎱⒖碱}庫含答案解析
- 2025年廣州康大職業(yè)技術(shù)學(xué)院高職單招高職單招英語2016-2024歷年頻考點試題含答案解析
- 2025年常州工業(yè)職業(yè)技術(shù)學(xué)院高職單招高職單招英語2016-2024歷年頻考點試題含答案解析
- 教育質(zhì)量年報
- 2025年河北省職業(yè)院校學(xué)生技能大賽養(yǎng)老照護(hù)(中職)賽項考試題庫(含答案)
- 2025年吉安職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 2025年高考語文備考之模擬考前作文復(fù)習(xí)(第一期)含題目解析及相關(guān)范文
- 2025年北京匯佳職業(yè)學(xué)院高職單招語文2018-2024歷年參考題庫頻考點含答案解析
- 9001內(nèi)審員培訓(xùn)課件
- 人教版五年級上冊小數(shù)除法豎式計算練習(xí)練習(xí)300題及答案
- 綜合素質(zhì)提升培訓(xùn)全面提升個人綜合素質(zhì)
- 如何克服高中生的社交恐懼癥
- 聚焦任務(wù)的學(xué)習(xí)設(shè)計作業(yè)改革新視角
- 《監(jiān)理安全培訓(xùn)》課件
- 2024高二語文期末試卷(選必上、中)及詳細(xì)答案
- 淋巴瘤患者的護(hù)理
- 水利工程建設(shè)管理概述課件
- 人美版初中美術(shù)知識點匯總九年級全冊
- 2022中和北美腰椎間盤突出癥診療指南的對比(全文)
評論
0/150
提交評論