![2023學年完整公開課版激活函數(shù)_第1頁](http://file4.renrendoc.com/view/2e34171faa43b69bf89c8d5f5d1de4d3/2e34171faa43b69bf89c8d5f5d1de4d31.gif)
![2023學年完整公開課版激活函數(shù)_第2頁](http://file4.renrendoc.com/view/2e34171faa43b69bf89c8d5f5d1de4d3/2e34171faa43b69bf89c8d5f5d1de4d32.gif)
![2023學年完整公開課版激活函數(shù)_第3頁](http://file4.renrendoc.com/view/2e34171faa43b69bf89c8d5f5d1de4d3/2e34171faa43b69bf89c8d5f5d1de4d33.gif)
![2023學年完整公開課版激活函數(shù)_第4頁](http://file4.renrendoc.com/view/2e34171faa43b69bf89c8d5f5d1de4d3/2e34171faa43b69bf89c8d5f5d1de4d34.gif)
![2023學年完整公開課版激活函數(shù)_第5頁](http://file4.renrendoc.com/view/2e34171faa43b69bf89c8d5f5d1de4d3/2e34171faa43b69bf89c8d5f5d1de4d35.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
激活函數(shù)主講:孫靜激活函數(shù)-屬性詳解本次課程介紹神經(jīng)網(wǎng)絡中激活函數(shù)的真正意義?一個激活函數(shù)需要具有哪些必要的屬性?還有哪些屬性是好的屬性但不必要的?激活函數(shù)-非線性即導數(shù)不是常數(shù)。這個條件是多層神經(jīng)網(wǎng)絡的基礎,保證多層網(wǎng)絡不退化成單層線性網(wǎng)絡。這也是激活函數(shù)的意義所在。激活函數(shù)-幾乎處處可微可微性保證了在優(yōu)化中梯度的可計算性。傳統(tǒng)的激活函數(shù)如sigmoid等滿足處處可微。對于分段線性函數(shù)比如ReLU,只滿足幾乎處處可微(即僅在有限個點處不可微)。對于SGD算法來說,由于幾乎不可能收斂到梯度接近零的位置,有限的不可微點對于優(yōu)化結(jié)果不會有很大影響。激活函數(shù)-計算簡單非線性函數(shù)有很多。極端的說,一個多層神經(jīng)網(wǎng)絡也可以作為一個非線性函數(shù),類似于NetworkInNetwork中把它當做卷積操作的做法。但激活函數(shù)在神經(jīng)網(wǎng)絡前向的計算次數(shù)與神經(jīng)元的個數(shù)成正比,因此簡單的非線性函數(shù)自然更適合用作激活函數(shù)。這也是ReLU之流比其它使用Exp等操作的激活函數(shù)更受歡迎的其中一個原因。激活函數(shù)-非飽和性飽和指的是在某些區(qū)間梯度接近于零(即梯度消失),使得參數(shù)無法繼續(xù)更新的問題。最經(jīng)典的例子是Sigmoid,它的導數(shù)在x為比較大的正值和比較小的負值時都會接近于0。更極端的例子是階躍函數(shù),由于它在幾乎所有位置的梯度都為0,因此處處飽和,無法作為激活函數(shù)。ReLU在x>0時導數(shù)恒為1,因此對于再大的正值也不會飽和。但同時對于x<0,其梯度恒為0,這時候它也會出現(xiàn)飽和的現(xiàn)象(在這種情況下通常稱為dyingReLU)。LeakyReLU和PReLU的提出正是為了解決這一問題激活函數(shù)-單調(diào)性即導數(shù)符號不變。這個性質(zhì)大部分激活函數(shù)都有,除了諸如sin、cos等。個人理解,單調(diào)性使得在激活函數(shù)處的梯度方向不會經(jīng)常改變,從而讓訓練更容易收斂。激活函數(shù)-幾乎處處可微有限的輸出范圍使得網(wǎng)絡對于一些比較大的輸入也會比較穩(wěn)定,這也是為什么早期的激活函數(shù)都以此類函數(shù)為主,如Sigmoid、TanH。但這導致了前面提到的梯度消失問題,而且強行讓每一層的輸出限制到固定范圍會限制其表達能力。因此現(xiàn)在這類函數(shù)僅用于某些需要特定輸出范圍的場合,比如概率輸出(此時loss函數(shù)中的log操作能夠抵消其梯度消失的影響)、LSTM里的gate函數(shù)。激活函數(shù)-接近恒等變換即約等于x。這樣的好處是使得輸出的幅值不會隨著深度的增加而發(fā)生顯著的增加,從而使網(wǎng)絡更為穩(wěn)定,同時梯度也能夠更容易地回傳。這個與非線性是有點矛盾的,因此激活函數(shù)基本只是部分滿足這個條件,比如TanH只在原點附近有線性區(qū)(在原點為0且在原點的導數(shù)為1),而ReLU只在x>0時為線性。這個性質(zhì)也讓初始化參數(shù)范圍的推導更為簡單。這種恒等變換的性質(zhì)也被其他一些網(wǎng)絡結(jié)構(gòu)設計所借鑒,比如CNN中的ResNet和RNN中的LSTM。激活函數(shù)-參數(shù)少大部分激活函數(shù)都是沒有參數(shù)的。像PReLU帶單個參數(shù)會略微增加網(wǎng)絡的大小。還有一個例外是Maxout,盡管本身沒有參數(shù),但在同樣輸出通道數(shù)下k路Maxout需要的輸入通道數(shù)是其它函數(shù)的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 雨雪天氣的應急預案
- 《運營管理 第7版》課件-chapt.05-選址與設施布置
- DB6528T 201-2024計量檢定校準服務規(guī)范
- 個體工商戶合伙創(chuàng)業(yè)合同書及細則
- 臨時勞動合同終止模板
- 個體出租車轉(zhuǎn)讓合同協(xié)議
- 專業(yè)版設備抵押合同范本大全
- 臨時攤位租賃合同樣本
- 中外技術(shù)合作開發(fā)合同
- 個人分期購車輛抵押借款協(xié)議合同
- 2025年春季學期學校德育工作計劃安排表(完整版)
- 2025年有機肥行業(yè)發(fā)展趨勢分析報告
- 2023-2024年員工三級安全培訓考試題及參考答案(綜合題)
- 2024年人教版初中英語九年級全冊單元測評與答案
- 【渞法】學會自我保護教學設計 七年級道德與法治下冊(統(tǒng)編版2024)
- 2025-2030年中國融雪劑行業(yè)運行動態(tài)及發(fā)展前景預測報告
- DB31∕T 1043-2017 暴雨強度公式與設計雨型標準
- 對口升學語文模擬試卷(6)-江西?。ń馕霭妫?/a>
- 五年級口算題卡每天100題帶答案
- 2024年全國初中數(shù)學聯(lián)合競賽試題參考答案及評分標準
- 工程造價績效考核KPI指標庫
評論
0/150
提交評論