版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
2024-2-51人工神經(jīng)網(wǎng)路
ArtificialNeuralNetworks2024-2-52主要內(nèi)容第一章:引論智能的概念、智能系統(tǒng)的特點及其描述基本模型,物理符號系統(tǒng)與連接主義的觀點及其比較;人工神經(jīng)網(wǎng)路的特點、發(fā)展歷史。
2024-2-53主要內(nèi)容第二章
人工神經(jīng)網(wǎng)路基礎(chǔ)本章在介紹了基本神經(jīng)元後,將概要介紹人工神經(jīng)網(wǎng)路的一般特性。主要包括,生物神經(jīng)網(wǎng)路模型,人工神經(jīng)元模型與典型的激勵函數(shù);人工神經(jīng)網(wǎng)路的基本拓?fù)涮匦?,存儲類型(CAM──LTM,AM──STM)及映象,Supervised訓(xùn)練與Unsupervised訓(xùn)練。2024-2-54主要內(nèi)容第三章
感知器感知器與人工神經(jīng)網(wǎng)路的早期發(fā)展;單層網(wǎng)能解決線性可分問題,而無法解決線形不可分問題,要想解決這一問題,必須引入多層網(wǎng);Hebb學(xué)習(xí)律,Delta規(guī)則,感知器的訓(xùn)練演算法。實驗:實現(xiàn)一個感知器。
2024-2-55主要內(nèi)容第四章
向後傳播BP(Backpropagation)網(wǎng)路的構(gòu)成及其訓(xùn)練過程;隱藏層權(quán)調(diào)整方法的直觀分析,BP訓(xùn)練演算法中使用的Delta規(guī)則(最速下降法)的理論推導(dǎo);演算法的收斂速度及其改進討論;BP網(wǎng)路中的幾個重要問題。實驗:實現(xiàn)BP演算法。
2024-2-56主要內(nèi)容第五章
對傳網(wǎng)生物神經(jīng)系統(tǒng)與異構(gòu)網(wǎng)的引入;對傳網(wǎng)的網(wǎng)路結(jié)構(gòu),Kohonen層與Grossberg層的正常運行,對傳網(wǎng)的輸入向量的預(yù)處理,Kohonen層的訓(xùn)練演算法及其權(quán)矩陣的初始化方法;Grossberg層的訓(xùn)練;完整的對傳網(wǎng)。實驗:實現(xiàn)基本的對傳網(wǎng)。
2024-2-57主要內(nèi)容第六章
統(tǒng)計方法統(tǒng)計方法是為了解決局部極小點問題而引入的,統(tǒng)計網(wǎng)路的基本訓(xùn)練演算法,模擬退火演算法與收斂分析,Cauchy訓(xùn)練,人工熱處理與臨界溫度在訓(xùn)練中的使用,BP演算法與Cauchy訓(xùn)練相結(jié)合。實驗:實現(xiàn)模擬退火演算法。
2024-2-58主要內(nèi)容第七章迴圈網(wǎng)路迴圈網(wǎng)路的組織,穩(wěn)定性分析;相聯(lián)存儲;統(tǒng)計Hopfield網(wǎng)與Boltzmann機;Hopfield網(wǎng)用於解決TSP問題。BAM(BidirectionalAssociativeMemory)用於實現(xiàn)雙聯(lián)存儲;基本雙聯(lián)存儲網(wǎng)路的結(jié)構(gòu)及訓(xùn)練;其他的幾種相聯(lián)存儲網(wǎng)路。實驗:實現(xiàn)一個Hopfield網(wǎng)。
2024-2-59主要內(nèi)容第八章
自適應(yīng)共振理論人腦的穩(wěn)定性與可塑性問題;ART模型的總體結(jié)構(gòu)與分塊描述;比較層與識別層之間的兩個聯(lián)接矩陣的初始化,識別過程與比較過程,查找的實現(xiàn);訓(xùn)練討論。
2024-2-510第1章
引言主要內(nèi)容:智能與人工智慧;ANN的特點;歷史回顧與展望重點:智能的本質(zhì);ANN是一個非線性大規(guī)模並行處理系統(tǒng)難點:對智能的刻畫
2024-2-511第1章
引言1.1人工神經(jīng)網(wǎng)路的提出1.2人工神經(jīng)網(wǎng)路的特點1.3歷史回顧2024-2-512第1章
引言人類對人工智慧的研究可以分成兩種方式對應(yīng)著兩種不同的技術(shù):傳統(tǒng)的人工智慧技術(shù)——心理的角度模擬基於人工神經(jīng)網(wǎng)路的技術(shù)——生理的角度模擬2024-2-5131.1人工神經(jīng)網(wǎng)路的提出
人工神經(jīng)網(wǎng)路(ArtificialNeuralNetworks,簡記作ANN),是對人類大腦系統(tǒng)的一階特性的一種描述。簡單地講,它是一個數(shù)學(xué)模型,可以用電子線路來實現(xiàn),也可以用電腦程式來模擬,是人工智慧研究的一種方法。
2024-2-5141.1人工神經(jīng)網(wǎng)路的提出1.1.1智能與人工智慧
一、
智能的含義智能是個體有目的的行為,合理的思維,以及有效的、適應(yīng)環(huán)境的綜合能力。
智能是個體認(rèn)識客觀事物和運用知識解決問題的能力。
人類個體的智能是一種綜合能力。2024-2-5151.1人工神經(jīng)網(wǎng)路的提出智能可以包含8個方面感知與認(rèn)識客觀事物、客觀世界和自我的能力感知是智能的基礎(chǔ)——最基本的能力
通過學(xué)習(xí)取得經(jīng)驗與積累知識的能力這是人類在世界中能夠不斷發(fā)展的最基本能力。理解知識,運用知識和經(jīng)驗分析、解決問題的能力這一能力可以算作是智能的高級形式。是人類對世界進行適當(dāng)?shù)母脑?,推動社會不斷發(fā)展的基本能力。2024-2-5161.1人工神經(jīng)網(wǎng)路的提出聯(lián)想、推理、判斷、決策語言的能力這是智能的高級形式的又一方面。預(yù)測和認(rèn)識“主動”和“被動”之分。聯(lián)想、推理、判斷、決策的能力是“主動”的基礎(chǔ)。運用進行抽象、概括的能力上述這5種能力,被認(rèn)為是人類智能最為基本的能力
2024-2-5171.1人工神經(jīng)網(wǎng)路的提出作為5種能力綜合表現(xiàn)形式的3種能力發(fā)現(xiàn)、發(fā)明、創(chuàng)造、創(chuàng)新的能力即時、迅速、合理地應(yīng)付複雜環(huán)境的能力預(yù)測、洞察事物發(fā)展、變化的能力
2024-2-5181.1人工神經(jīng)網(wǎng)路的提出二、人工智慧人工智慧:研究如何使類似電腦這樣的設(shè)備去模擬人類的這些能力。研究人工智慧的目的增加人類探索世界,推動社會前進的能力進一步認(rèn)識自己三大學(xué)術(shù)流派符號主義(或叫做符號/邏輯主義)學(xué)派聯(lián)接主義(或者叫做PDP)學(xué)派進化主義(或者叫做行動/回應(yīng))學(xué)派2024-2-5191.1人工神經(jīng)網(wǎng)路的提出1.1.2物理符號系統(tǒng)
人腦的反映形式化
現(xiàn)實資訊數(shù)據(jù)
物理系統(tǒng)物理符號系統(tǒng)
表現(xiàn)智能2024-2-5201.1人工神經(jīng)網(wǎng)路的提出Newell和Simon假說:一個物理系統(tǒng)表現(xiàn)智能行為的充要條件是它有一個物理符號系統(tǒng)概念:物理符號系統(tǒng)需要有一組稱為符號的實體組成,它們都是物理模型,可以在另一類稱為符號結(jié)構(gòu)的實體中作為成分出現(xiàn),以構(gòu)成更高級別的系統(tǒng)2024-2-5211.1人工神經(jīng)網(wǎng)路的提出困難:抽象——捨棄一些特性,同時保留一些特性形式化處理——用物理符號及相應(yīng)規(guī)則表達物理系統(tǒng)的存在和運行。局限:對全局性判斷、模糊資訊處理、多粒度的視覺資訊處理等是非常困難的。2024-2-5221.1人工神經(jīng)網(wǎng)路的提出1.1.3聯(lián)接主義觀點
核心:智能的本質(zhì)是聯(lián)接機制。
神經(jīng)網(wǎng)路是一個由大量簡單的處理單元組成的高度複雜的大規(guī)模非線性自適應(yīng)系統(tǒng)
ANN力求從四個方面去模擬人腦的智能行為物理結(jié)構(gòu)
計算模擬
存儲與操作
訓(xùn)練
2024-2-5231.1人工神經(jīng)網(wǎng)路的提出1.1.4兩種模型的比較
心理過程邏輯思維高級形式(思維的表像)
生理過程
形象思維
低級形式(思維的根本)
仿生
人工神經(jīng)網(wǎng)路聯(lián)結(jié)主義觀點物理符號系統(tǒng)2024-2-5241.1人工神經(jīng)網(wǎng)路的提出物理符號系統(tǒng)和人工神經(jīng)網(wǎng)路系統(tǒng)的差別
專案物理符號系統(tǒng)人工神經(jīng)網(wǎng)路處理方式邏輯運算模擬運算執(zhí)行方式串行並行動作離散連續(xù)存儲局部集中全局分佈2024-2-5251.1人工神經(jīng)網(wǎng)路的提出兩種人工智慧技術(shù)的比較專案傳統(tǒng)的AI技術(shù)
ANN技術(shù)
基本實現(xiàn)方式
串行處理;由程式實現(xiàn)控制
並行處理;對樣本數(shù)據(jù)進行多目標(biāo)學(xué)習(xí);通過人工神經(jīng)元之間的相互作用實現(xiàn)控制
基本開發(fā)方法
設(shè)計規(guī)則、框架、程式;用樣本數(shù)據(jù)進行調(diào)試(由人根據(jù)已知的環(huán)境去構(gòu)造一個模型)
定義人工神經(jīng)網(wǎng)路的結(jié)構(gòu)原型,通過樣本數(shù)據(jù),依據(jù)基本的學(xué)習(xí)演算法完成學(xué)習(xí)——自動從樣本數(shù)據(jù)中抽取內(nèi)涵(自動適應(yīng)應(yīng)用環(huán)境)
適應(yīng)領(lǐng)域
精確計算:符號處理,數(shù)值計算非精確計算:模擬處理,感覺,大規(guī)模數(shù)據(jù)並行處理模擬對象
左腦(邏輯思維)右腦(形象思維)2024-2-5261.2人工神經(jīng)網(wǎng)路的特點資訊的分佈表示運算的全局並行和局部操作處理的非線性
2024-2-5271.2.1人工神經(jīng)網(wǎng)路的概念1、定義
1)Hecht—Nielsen(1988年)人工神經(jīng)網(wǎng)路是一個並行、分佈處理結(jié)構(gòu),它由處理單元及其稱為聯(lián)接的無向訊號通道互連而成。這些處理單元(PE—ProcessingElement)具有局部記憶體,並可以完成局部操作。每個處理單元有一個單一的輸出聯(lián)接,這個輸出可以根據(jù)需要被分枝成希望個數(shù)的許多並行聯(lián)接,且這些並行聯(lián)接都輸出相同的信號,即相應(yīng)處理單元的信號,信號的大小不因分支的多少而變化。2024-2-5281.2.1人工神經(jīng)網(wǎng)路的概念(1)Hecht—Nielsen(1988年)(續(xù))處理單元的輸出信號可以是任何需要的數(shù)學(xué)模型,每個處理單元中進行的操作必須是完全局部的。也就是說,它必須僅僅依賴於經(jīng)過輸入聯(lián)接到達處理單元的所有輸入信號的當(dāng)前值和存儲在處理單元局部記憶體中的值。2024-2-5291.2.1人工神經(jīng)網(wǎng)路的概念強調(diào):
①
並行、分佈處理結(jié)構(gòu);②一個處理單元的輸出可以被任意分枝,且大小不變;③輸出信號可以是任意的數(shù)學(xué)模型;④處理單元完全的局部操作
2024-2-5301.2.1人工神經(jīng)網(wǎng)路的概念(2)Rumellhart,McClelland,Hinton的PDP1)
一組處理單元(PE或AN);2)
處理單元的啟動狀態(tài)(ai);3)
每個處理單元的輸出函數(shù)(fi);4)
處理單元之間的聯(lián)接模式;5)
傳遞規(guī)則(∑wijoi);6)
把處理單元的輸入及當(dāng)前狀態(tài)結(jié)合起來產(chǎn)生啟動值的啟動規(guī)則(Fi);7)
通過經(jīng)驗修改聯(lián)接強度的學(xué)習(xí)規(guī)則;8)
系統(tǒng)運行的環(huán)境(樣本集合)。
2024-2-5311.2.1人工神經(jīng)網(wǎng)路的概念(3)Simpson(1987年)人工神經(jīng)網(wǎng)路是一個非線性的有向圖,圖中含有可以通過改變權(quán)大小來存放模式的加權(quán)邊,並且可以從不完整的或未知的輸入找到模式。
2024-2-5321.2.1人工神經(jīng)網(wǎng)路的概念2、關(guān)鍵點(1)
資訊的分佈表示(2)
運算的全局並行與局部操作(3)
處理的非線性特徵3、對大腦基本特徵的模擬1)
形式上:神經(jīng)元及其聯(lián)接;BN對AN2)
表現(xiàn)特徵:資訊的存儲與處理2024-2-5331.2.1人工神經(jīng)網(wǎng)路的概念4、別名人工神經(jīng)系統(tǒng)(ANS)神經(jīng)網(wǎng)路(NN)自適應(yīng)系統(tǒng)(AdaptiveSystems)、自適應(yīng)網(wǎng)(AdaptiveNetworks)聯(lián)接模型(Connectionism)神經(jīng)電腦(Neurocomputer)2024-2-5341.2.2學(xué)習(xí)(Learning)能力人工神經(jīng)網(wǎng)路可以根據(jù)所在的環(huán)境去改變它的行為自相聯(lián)的網(wǎng)路異相聯(lián)的網(wǎng)路:它在接受樣本集合A時,可以抽取集合A中輸入數(shù)據(jù)與輸出數(shù)據(jù)之間的映射關(guān)係?!俺橄蟆惫δ?。不同的人工神經(jīng)網(wǎng)路模型,有不同的學(xué)習(xí)/訓(xùn)練演算法2024-2-5351.2.3基本特徵的自動提取
由於其運算的不精確性,表現(xiàn)成“去噪音、容殘缺”的能力,利用這種不精確性,比較自然地實現(xiàn)模式的自動分類。普化(Generalization)能力與抽象能力
2024-2-5361.2.4資訊的分佈存放資訊的分佈存提供容錯功能由於資訊被分佈存放在幾乎整個網(wǎng)路中,所以,當(dāng)其中的某一個點或者某幾個點被破壞時,資訊仍然可以被存取。系統(tǒng)在受到局部損傷時還可以正常工作。並不是說可以任意地對完成學(xué)習(xí)的網(wǎng)路進行修改。也正是由於資訊的分佈存放,對一類網(wǎng)來說,當(dāng)它完成學(xué)習(xí)後,如果再讓它學(xué)習(xí)新的東西,這時就會破壞原來已學(xué)會的東西。
2024-2-5371.2.5適應(yīng)性(Applicability)問題
擅長兩個方面:對大量的數(shù)據(jù)進行分類,並且只有較少的幾種情況;必須學(xué)習(xí)一個複雜的非線性映射。目前應(yīng)用:人們主要將其用於語音、視覺、知識處理、輔助決策等方面。在數(shù)據(jù)壓縮、模式匹配、系統(tǒng)建模、模糊控制、求組合優(yōu)化問題的最佳解的近似解(不是最佳近似解)等方面也有較好的應(yīng)用。
2024-2-5381.3歷史回顧
1.3.1萌芽期(20世紀(jì)40年代)人工神經(jīng)網(wǎng)路的研究最早可以追溯到人類開始研究自己的智能的時期,到1949年止。1943年,心理學(xué)家McCulloch和數(shù)學(xué)家Pitts建立起了著名的閾值加權(quán)和模型,簡稱為M-P模型。發(fā)表於數(shù)學(xué)生物物理學(xué)會刊《BulletinofMethematicalBiophysics》1949年,心理學(xué)家D.O.Hebb提出神經(jīng)元之間突觸聯(lián)繫是可變的假說——Hebb學(xué)習(xí)律。
2024-2-5391.3.2第一高潮期(1950~1968)
以MarvinMinsky,F(xiàn)rankRosenblatt,BernardWidrow等為代表人物,代表作是單級感知器(Perceptron)??捎秒娮泳€路模擬。人們樂觀地認(rèn)為幾乎已經(jīng)找到了智能的關(guān)鍵。許多部門都開始大批地投入此項研究,希望儘快佔領(lǐng)制高點。
2024-2-5401.3.3反思期(1969~1982)
M.L.Minsky和S.Papert,《Perceptron》,MITPress,1969年
異或”運算不可表示
二十世紀(jì)70年代和80年代早期的研究結(jié)果
認(rèn)識規(guī)律:認(rèn)識——實踐——再認(rèn)識
2024-2-5411.3.4第二高潮期(1983~1990)
1982年,J.Hopfield提出迴圈網(wǎng)路用Lyapunov函數(shù)作為網(wǎng)路性能判定的能量函數(shù),建立ANN穩(wěn)定性的判別依據(jù)闡明了ANN與動力學(xué)的關(guān)係用非線性動力學(xué)的方法來研究ANN的特性指出資訊被存放在網(wǎng)路中神經(jīng)元的聯(lián)接上
2024-2-5421.3.4第二高潮期(1983~1990)2)1984年,
J.Hopfield設(shè)計研製了後來被人們稱為Hopfield網(wǎng)的電路。較好地解決了著名的TSP問題,找到了最佳解的近似解,引起了較大的轟動。3)1985年,UCSD的Hinton、Sejnowsky、Rumelhart等人所在的並行分佈處理(PDP)小組的研究者在Hopfield網(wǎng)路中引入了隨機機制,提出所謂的Boltzmann機。
2024-2-5431.3.4第二高潮期(1983~1990)4)1986年,並行分佈處理小組的Rumelhart等研究者重新獨立地提出多層網(wǎng)路的學(xué)習(xí)演算法——BP演算法,較好地解決了多層網(wǎng)路的學(xué)習(xí)問題。(Paker1982和Werbos1974年)國內(nèi)首屆神經(jīng)網(wǎng)路大會是1990年12月在北京舉行的。
2024-2-5441.3.5再認(rèn)識與應(yīng)用研究期(1991~)
問題:1)應(yīng)用面還不夠?qū)?)結(jié)果不夠精確3)存在可信度的問題
2024-2-5451.3.5再認(rèn)識與應(yīng)用研究期(1991~)
研究:1)開發(fā)現(xiàn)有模型的應(yīng)用,並在應(yīng)用中根據(jù)實際運行情況對模型、演算法加以改造,以提高網(wǎng)路的訓(xùn)練速度和運行的準(zhǔn)確度。2)充分發(fā)揮兩種技術(shù)各自的優(yōu)勢是一個有效方法3)希望在理論上尋找新的突破,建立新的專用/通用模型和演算法。4)進一步對生物神經(jīng)系統(tǒng)進行研究,不斷地豐富對人腦的認(rèn)識。
2024-2-546第2章人工神經(jīng)網(wǎng)路基礎(chǔ)主要內(nèi)容:BN與AN;拓?fù)浣Y(jié)構(gòu);存儲;訓(xùn)練重點:AN;拓?fù)浣Y(jié)構(gòu);訓(xùn)練難點:訓(xùn)練2024-2-547第2章人工神經(jīng)網(wǎng)路基礎(chǔ)2.1生物神經(jīng)網(wǎng)2.2人工神經(jīng)元2.3人工神經(jīng)網(wǎng)路的拓?fù)涮匦?.4存儲與映射2.5人工神經(jīng)網(wǎng)路的訓(xùn)練2024-2-5482.1生物神經(jīng)網(wǎng)1、構(gòu)成胞體(Soma)枝蔓(Dendrite)胞體(Soma)
軸突(Axon)突觸(Synapse)2、工作過程2024-2-5492.1生物神經(jīng)網(wǎng)3、六個基本特徵:1)神經(jīng)元及其聯(lián)接;2)神經(jīng)元之間的聯(lián)接強度決定信號傳遞的強弱;3)神經(jīng)元之間的聯(lián)接強度是可以隨訓(xùn)練改變的;4)信號可以是起刺激作用的,也可以是起抑制作用的;5)一個神經(jīng)元接受的信號的累積效果決定該神經(jīng)元的狀態(tài);6)每個神經(jīng)元可以有一個“閾值”。2024-2-5502.2人工神經(jīng)元
神經(jīng)元是構(gòu)成神經(jīng)網(wǎng)路的最基本單元(構(gòu)件)。人工神經(jīng)元模型應(yīng)該具有生物神經(jīng)元的六個基本特性。
2024-2-5512.2.1人工神經(jīng)元的基本構(gòu)成
人工神經(jīng)元模擬生物神經(jīng)元的一階特性。輸入:X=(x1,x2,…,xn)聯(lián)接權(quán):W=(w1,w2,…,wn)T網(wǎng)路輸入:
net=∑xiwi向量形式:
net=XWxnwn∑x1w1x2w2net=XW…2024-2-5522.2.2啟動函數(shù)(ActivationFunction)
啟動函數(shù)——執(zhí)行對該神經(jīng)元所獲得的網(wǎng)路輸入的變換,也可以稱為激勵函數(shù)、活化函數(shù):o=f(net)
1、線性函數(shù)(LinerFunction)
f(net)=k*net+c
netooc2024-2-5532、非線性斜面函數(shù)(RampFunction)
γ ifnet≥θf(net)=k*net if|net|<θ -γ ifnet≤-θ
γ>0為一常數(shù),被稱為飽和值,為該神經(jīng)元的最大輸出。
2024-2-5542、非線性斜面函數(shù)(RampFunction)γ-γθ
-θ
net
o
2024-2-5553、閾值函數(shù)(ThresholdFunction)階躍函數(shù)
β ifnet>θf(net)= -γ ifnet≤θβ、γ、θ均為非負(fù)實數(shù),θ為閾值二值形式:
1 ifnet>θf(net)= 0 ifnet≤θ雙極形式:
1 ifnet>θf(net)= -1 ifnet≤θ
2024-2-5563、閾值函數(shù)(ThresholdFunction)階躍函數(shù)β
-γθonet02024-2-5574、S形函數(shù)
壓縮函數(shù)(SquashingFunction)和邏輯斯特函數(shù)(LogisticFunction)。f(net)=a+b/(1+exp(-d*net))a,b,d為常數(shù)。它的飽和值為a和a+b。最簡單形式為:f(net)=1/(1+exp(-d*net))
函數(shù)的飽和值為0和1。S形函數(shù)有較好的增益控制
2024-2-5584、S形函數(shù)
a+bo(0,c)netac=a+b/22024-2-5592.2.3M-P模型
x2w2
∑fo=f(net)xnwn…net=XWx1w1McCulloch—Pitts(M—P)模型,也稱為處理單元(PE)
2024-2-560上次課內(nèi)容回顧擅長兩個方面目前應(yīng)用語音、視覺、知識處理數(shù)據(jù)壓縮、模式匹配、系統(tǒng)建模、模糊控制、求組合優(yōu)化問題的最佳解的近似解(不是最佳近似解)輔助決策——預(yù)報與智能管理通信——自適應(yīng)均衡、回波抵消、路由選擇、ATM中的呼叫接納、識別與控制空間科學(xué)——對接、導(dǎo)航、制導(dǎo)、飛行程式優(yōu)化2024-2-561上次課內(nèi)容回顧發(fā)展過程萌芽期(20世紀(jì)40年代)M-P模型Hebb學(xué)習(xí)律第一高潮期(1950~1968)Perceptron的興衰反思期(1969~1982)第二高潮期(1983~1990)4個標(biāo)誌性成果再認(rèn)識與應(yīng)用研究期(1991~)2024-2-562上次課內(nèi)容回顧生物神經(jīng)網(wǎng)六個基本特徵神經(jīng)元及其聯(lián)接、信號傳遞、訓(xùn)練、刺激與抑制、累積效果、“閾值”。人工神經(jīng)元的基本構(gòu)成xnwn∑x1w1x2w2net=XW…2024-2-563上次課內(nèi)容回顧啟動函數(shù)與M-P模型
線性函數(shù)、非線性斜面函數(shù)、閾值函數(shù)
S形函數(shù)
M-P模型x2w2
∑fo=f(net)xnwn…net=XWx1w12024-2-5642.3人工神經(jīng)網(wǎng)路的拓?fù)涮匦?/p>
連接的拓?fù)浔硎?/p>
ANi wij ANj
2024-2-5652.3.1聯(lián)接模式
用正號(“+”,可省略)表示傳送來的信號起刺激作用,它用於增加神經(jīng)元的活躍度;用負(fù)號(“-”)表示傳送來的信號起抑制作用,它用於降低神經(jīng)元的活躍度。層次(又稱為“級”)的劃分,導(dǎo)致了神經(jīng)元之間的三種不同的互連模式:
2024-2-5662.3.1聯(lián)接模式
1、層(級)內(nèi)聯(lián)接層內(nèi)聯(lián)接又叫做區(qū)域內(nèi)(Intra-field)聯(lián)接或側(cè)聯(lián)接(Lateral)。用來加強和完成層內(nèi)神經(jīng)元之間的競爭2、
迴圈聯(lián)接回饋信號。
2024-2-5672.3.1聯(lián)接模式3、層(級)間聯(lián)接
層間(Inter-field)聯(lián)接指不同層中的神經(jīng)元之間的聯(lián)接。這種聯(lián)接用來實現(xiàn)層間的信號傳遞前饋信號回饋信號
2024-2-5682.3.2網(wǎng)路的分層結(jié)構(gòu)
單級網(wǎng)
簡單單級網(wǎng)
2024-2-569簡單單級網(wǎng)……x1x2…xno1o2omwnmw11w1mw2mwn1輸出層輸入層 2024-2-570簡單單級網(wǎng)W=(wij)輸出層的第j個神經(jīng)元的網(wǎng)路輸入記為netj:
netj=x1w1j+x2w2j+…+xnwnj其中,1≤j≤m。取NET=(net1,net2,…,netm)NET=XWO=F(NET)2024-2-571單級橫向回饋網(wǎng)輸出層x1o1w11w1mx2o2w2m………xnomwn1輸入層 V2024-2-572單級橫向回饋網(wǎng)
V=(vij)NET=XW+OVO=F(NET)時間參數(shù)——神經(jīng)元的狀態(tài)在主時鐘的控制下同步變化考慮X總加在網(wǎng)上的情況NET(t+1)=X(t)W+O(t)V O(t+1)=F(NET(t+1))O(0)=0考慮僅在t=0時加X的情況。
穩(wěn)定性判定2024-2-573多級網(wǎng)輸出層隱藏層輸入層o1o2om…x1x2xn………………2024-2-574層次劃分
信號只被允許從較低層流向較高層。層號確定層的高低:層號較小者,層次較低,層號較大者,層次較高。輸入層:被記作第0層。該層負(fù)責(zé)接收來自網(wǎng)路外部的資訊輸出層隱藏層輸入層o1o2om…x1x2xn………………2024-2-575第j層:第j-1層的直接後繼層(j>0),它直接接受第j-1層的輸出。輸出層:它是網(wǎng)路的最後一層,具有該網(wǎng)路的最大層號,負(fù)責(zé)輸出網(wǎng)路的計算結(jié)果。隱藏層:除輸入層和輸出層以外的其他各層叫隱藏層。隱藏層不直接接受外界的信號,也不直接向外界發(fā)送信號輸出層隱藏層輸入層o1o2om…x1x2xn………………2024-2-576約定
:輸出層的層號為該網(wǎng)路的層數(shù):n層網(wǎng)路,或n級網(wǎng)路。第j-1層到第j層的聯(lián)接矩陣為第j層聯(lián)接矩陣,輸出層對應(yīng)的矩陣叫輸出層聯(lián)接矩陣。今後,在需要的時候,一般我們用W(j)表示第j層矩陣。輸出層隱藏層輸入層o1o2om…x1x2xn………………W(1)W(2)W(3)W(h)2024-2-577多級網(wǎng)——h層網(wǎng)路輸出層隱藏層輸入層o1o2om…x1x2xn………………W(1)W(2)W(3)W(h)2024-2-578多級網(wǎng)非線性啟動函數(shù)
F(X)=kX+CF3(F2(F1(XW(1))W(2))W(3))2024-2-579迴圈網(wǎng)x1o1輸出層隱藏層輸入層x2o2omxn…………………2024-2-580迴圈網(wǎng)
如果將輸出信號回饋到輸入端,就可構(gòu)成一個多層的迴圈網(wǎng)路。輸入的原始信號被逐步地“加強”、被“修復(fù)”。大腦的短期記憶特徵——看到的東西不是一下子就從腦海裏消失的。穩(wěn)定:回饋信號會引起網(wǎng)路輸出的不斷變化。我們希望這種變化逐漸減小,並且最後能消失。當(dāng)變化最後消失時,網(wǎng)路達到了平衡狀態(tài)。如果這種變化不能消失,則稱該網(wǎng)路是不穩(wěn)定的。
2024-2-5812.4存儲與映射
空間模式(SpatialModel)時空模式(SpatialtemporalModel)空間模式三種存儲類型1、
RAM方式(RandomAccessMemory)隨機訪問方式是將地址映射到數(shù)據(jù)。2、
CAM方式(ContentAddressableMemory)內(nèi)容尋址方式是將數(shù)據(jù)映射到地址。3、
AM方式(AssociativeMemory)相聯(lián)存儲方式是將數(shù)據(jù)映射到數(shù)據(jù)。
2024-2-5822.4存儲與映射後續(xù)的兩種方式是人工神經(jīng)網(wǎng)路的工作方式。在學(xué)習(xí)/訓(xùn)練期間,人工神經(jīng)網(wǎng)路以CAM方式工作;權(quán)矩陣又被稱為網(wǎng)路的長期存儲(LongTermMemory,簡記為LTM)。網(wǎng)路在正常工作階段是以AM方式工作的;神經(jīng)元的狀態(tài)表示的模式為短期存儲(ShortTermMemory,簡記為STM)。
2024-2-5832.4存儲與映射自相聯(lián)(Auto-associative)映射:訓(xùn)練網(wǎng)路的樣本集為向量集合為{A1,A2,…,An}在理想情況下,該網(wǎng)路在完成訓(xùn)練後,其權(quán)矩陣存放的將是上面所給的向量集合。
2024-2-5842.4存儲與映射異相聯(lián)(Hetero-associative)映射
{(A1,B1),(A2,B2),…,(An,Bn)}該網(wǎng)路在完成訓(xùn)練後,其權(quán)矩陣存放的將是上面所給的向量集合所蘊含的對應(yīng)關(guān)係。當(dāng)輸入向量A不是樣本的第一的分量時,樣本中不存在這樣的元素(Ak,Bk),使得
Ai≤Ak≤A或者A≤Ak≤Aj且此時有
Ai≤A≤Aj則向量B是Bi與Bj的插值。
2024-2-5852.5人工神經(jīng)網(wǎng)路的訓(xùn)練
人工神經(jīng)網(wǎng)路最具有吸引力的特點是它的學(xué)習(xí)能力。1962年,Rosenblatt給出了人工神經(jīng)網(wǎng)路著名的學(xué)習(xí)定理:人工神經(jīng)網(wǎng)路可以學(xué)會它可以表達的任何東西。人工神經(jīng)網(wǎng)路的表達能力大大地限制了它的學(xué)習(xí)能力。人工神經(jīng)網(wǎng)路的學(xué)習(xí)過程就是對它的訓(xùn)練過程2024-2-5862.5.1無導(dǎo)師學(xué)習(xí)
無導(dǎo)師學(xué)習(xí)(UnsupervisedLearning)與無導(dǎo)師訓(xùn)練(UnsupervisedTraining)相對應(yīng)
抽取樣本集合中蘊含的統(tǒng)計特性,並以神經(jīng)元之間的聯(lián)接權(quán)的形式存於網(wǎng)路中。2024-2-5872.5.1無導(dǎo)師學(xué)習(xí)Hebb學(xué)習(xí)律、競爭與協(xié)同(CompetitiveandCooperative)學(xué)習(xí)、隨機聯(lián)接系統(tǒng)(RandomlyConnectedLearning)等。Hebb演算法[D.O.Hebb在1961年]的核心:當(dāng)兩個神經(jīng)元同時處於激發(fā)狀態(tài)時被加強,否則被減弱。數(shù)學(xué)運算式表示:Wij(t+1)=Wij(t)+αoi(t)oj(t)2024-2-5882.5.2有導(dǎo)師學(xué)習(xí)
有導(dǎo)師學(xué)習(xí)(SupervisedLearning)與有導(dǎo)師訓(xùn)練(SupervisedTraining)相對應(yīng)。輸入向量與其對應(yīng)的輸出向量構(gòu)成一個“訓(xùn)練對”。有導(dǎo)師學(xué)習(xí)的訓(xùn)練演算法的主要步驟包括:
1)
從樣本集合中取一個樣本(Ai,Bi);
2)
計算出網(wǎng)路的實際輸出O;
3)
求D=Bi-O;
4)
根據(jù)D調(diào)整權(quán)矩陣W;
5)對每個樣本重複上述過程,直到對整個樣本集來說,誤差不超過規(guī)定範(fàn)圍。
2024-2-589Delta規(guī)則
Widrow和Hoff的寫法:Wij(t+1)=Wij(t)+α(yj-aj(t))oi(t)也可以寫成:Wij(t+1)=Wij(t)+?Wij(t)?Wij(t)=αδjoi(t)δj=yj-aj(t)Grossberg的寫法為:?Wij(t)=αai(t)(oj(t)-Wij(t))更一般的Delta規(guī)則為:?Wij(t)=g(ai(t),yj,oj(t),Wij(t))2024-2-590其他再例學(xué)習(xí)外部環(huán)境對系統(tǒng)的輸出結(jié)果給出評價,學(xué)習(xí)系統(tǒng)通過強化受獎的動作來改善自身性能。學(xué)習(xí)規(guī)則誤差糾錯學(xué)習(xí)Hebb學(xué)習(xí)競爭學(xué)習(xí)2024-2-591練習(xí)題P291、4、6、10、15
2024-2-592上次課內(nèi)容回顧:網(wǎng)路的分層結(jié)構(gòu)聯(lián)接模式刺激聯(lián)接與抑制聯(lián)接前饋信號與回饋信號層(級)內(nèi)聯(lián)接迴圈聯(lián)接層(級)間聯(lián)接簡單單級網(wǎng):NET=XW;O=F(NET)單級橫向回饋網(wǎng):NET=XW+O(t)V;O(t)=F(NET)2024-2-593上次課內(nèi)容回顧:網(wǎng)路的分層結(jié)構(gòu)非迴圈多級網(wǎng)層次劃分非線性啟動函數(shù):
F3(F2(F1(XW1)W2)W3)迴圈網(wǎng)短期記憶特徵及其對輸入信號的修復(fù)作用時間參數(shù)與主時鐘穩(wěn)定性2024-2-594上次課內(nèi)容回顧:存儲與映射模式空間模式時空模式模式三種存儲類型RAM、CAM、AM模式的存儲與運行CAM——LTM——訓(xùn)練AM——STM——運行相聯(lián):自相聯(lián)映射、異相聯(lián)映射2024-2-595上次課內(nèi)容回顧:訓(xùn)練Rosenblatt的學(xué)習(xí)定理無導(dǎo)師學(xué)習(xí)抽取樣本集合中蘊含的統(tǒng)計特性樣本集:{A1,A2,…,An}Hebb演算法:Wij(t+1)=Wij(t)+αoi(t)oj(t)有導(dǎo)師學(xué)習(xí)抽取樣本蘊含的映射關(guān)係樣本集:{(A1,B1),(A2,B2),…,(An,Bn)}
訓(xùn)練演算法Delta規(guī)則2024-2-596第3章
感知器
主要內(nèi)容:感知器與人工神經(jīng)網(wǎng)路的早期發(fā)展;線性可分問題與線性不可分問題;Hebb學(xué)習(xí)律;Delta規(guī)則;感知器的訓(xùn)練演算法。重點:感知器的結(jié)構(gòu)、表達能力、學(xué)習(xí)演算法難點:感知器的表達能力
2024-2-597第3章
感知器3.1感知器與人工神經(jīng)網(wǎng)路的早期發(fā)展
3.2感知器的學(xué)習(xí)演算法
3.2.1離散單輸出感知器訓(xùn)練演算法
3.2.2離散多輸出感知器訓(xùn)練演算法3.2.3連續(xù)多輸出感知器訓(xùn)練演算法3.3線性不可分問題3.3.1異或(Exclusive–OR)問題
3.3.2線性不可分問題的克服
實現(xiàn)!問題的發(fā)現(xiàn)與解決!2024-2-5983.1感知器與ANN的早期發(fā)展McCulloch和Pitts1943年,發(fā)表第一個系統(tǒng)的ANN研究——閾值加權(quán)和(M-P)數(shù)學(xué)模型。1947年,開發(fā)出感知器。1949年,提出Hebb學(xué)習(xí)律。單輸出的感知器(M-P模型)x2
x1o
xn…2024-2-5993.1感知器與ANN的早期發(fā)展1962年,Rosenblatt宣佈:人工神經(jīng)網(wǎng)路可以學(xué)會它能表示的任何東西
o1多輸出感知器x1x2o2omxn…
………輸入層輸出層2024-2-51003.2感知器的學(xué)習(xí)演算法
感知器的學(xué)習(xí)是有導(dǎo)師學(xué)習(xí)感知器的訓(xùn)練演算法的基本原理來源於著名的Hebb學(xué)習(xí)律基本思想:逐步地將樣本集中的樣本輸入到網(wǎng)路中,根據(jù)輸出結(jié)果和理想輸出之間的差別來調(diào)整網(wǎng)路中的權(quán)矩陣
2024-2-51013.2.1離散單輸出感知器訓(xùn)練演算法
二值網(wǎng)路:引數(shù)及其函數(shù)的值、向量分量的值只取0和1函數(shù)、向量。權(quán)向量:W=(w1,w2,…,wn)輸入向量:X=(x1,x2,…,xn)訓(xùn)練樣本集:{(X,Y)|Y為輸入向量X對應(yīng)的輸出}2024-2-5102演算法3-1離散單輸出感知器訓(xùn)練演算法
1.初始化權(quán)向量W;2.重複下列過程,直到訓(xùn)練完成:
2.1對每個樣本(X,Y),重複如下過程:
2.1.1輸入X;
2.1.2計算o=F(XW);
2.1.3如果輸出不正確,則 當(dāng)o=0時,取W=W+X, 當(dāng)o=1時,取W=W-X2024-2-51033.2.2離散多輸出感知器訓(xùn)練演算法
樣本集:{(X,Y)|Y為輸入向量X對應(yīng)的輸出}輸入向量:X=(x1,x2,…,xn)理想輸出向量:Y=(y1,y2,…,ym)啟動函數(shù):F
權(quán)矩陣W=(wij)實際輸出向量:O=(o1,o2,…,om)o1多輸出感知器x1x2o2omxn…
………輸入層輸出層2024-2-5104演算法3-2離散多輸出感知器訓(xùn)練演算法
1.初始化權(quán)矩陣W;2.重複下列過程,直到訓(xùn)練完成:
2.1對每個樣本(X,Y),重複如下過程:
2.1.1輸入X;
2.1.2計算O=F(XW);
2.1.3forj=1tomdo執(zhí)行如下操作:
ifoj
≠yjthen ifoi
=0thenfori=1ton
wij=wij+xi
elsefori=1tondo
wij=wij-xi2024-2-5105演算法3-2離散多輸出感知器訓(xùn)練演算法演算法思想:將單輸出感知器的處理逐個地用於多輸出感知器輸出層的每一個神經(jīng)元的處理。第1步,權(quán)矩陣的初始化:一系列小偽亂數(shù)。
2024-2-5106演算法3-2離散多輸出感知器訓(xùn)練演算法第2步,迴圈控制。方法1:迴圈次數(shù)控制法:對樣本集執(zhí)行規(guī)定次數(shù)的迭代改進——分階段迭代控制:設(shè)定一個基本的迭代次數(shù)N,每當(dāng)訓(xùn)練完成N次迭代後,就給出一個中間結(jié)果2024-2-5107演算法3-2離散多輸出感知器訓(xùn)練演算法方法2:精度控制法:給定一個精度控制參數(shù)精度度量:實際輸出向量與理想輸出向量的對應(yīng)分量的差的絕對值之和;實際輸出向量與理想輸出向量的歐氏距離的和
“死迴圈”:網(wǎng)路無法表示樣本所代表的問題2024-2-5108演算法3-2離散多輸出感知器訓(xùn)練演算法方法3:綜合控制法:將這兩種方法結(jié)合起來使用
注意:精度參數(shù)的設(shè)置。根據(jù)實際問題選定;初始測試階段,精度要求低,測試完成後,再給出實際的精度要求。2024-2-51093.2.3連續(xù)多輸出感知器訓(xùn)練演算法
用公式wij=wij+α(yj-oj)xi取代了演算法3-2第2.1.3步中的多個判斷yj與oj之間的差別對wij的影響由α(yj-oj)xi表現(xiàn)出來好處:不僅使得演算法的控制在結(jié)構(gòu)上更容易理解,而且還使得它的適應(yīng)面更寬
2024-2-5110演算法3-3連續(xù)多輸出感知器訓(xùn)練演算法
1.用適當(dāng)?shù)男蝸y數(shù)初始化權(quán)矩陣W;2.初置精度控制參數(shù)ε,學(xué)習(xí)率α,精度控制變數(shù)d=ε+1;3.Whiled≥εdo3.1d=0;
3.2for每個樣本(X,Y)do 3.2.1輸入X(=(x1,x2,…,xn));
3.2.2求O=F(XW);
3.2.3修改權(quán)矩陣W:
fori=1ton,j=1tomdo wij=wij+α(yj-oj)xi;
3.2.4累積誤差
forj=1tomdo d=d+(yj-oj)22024-2-5111演算法3-3連續(xù)多輸出感知器訓(xùn)練演算法
1、程式實現(xiàn):ε、α、d、i、j、n、m為簡單變數(shù)來表示,W為n行m列的二維數(shù)組。樣本集二維數(shù)組2、系統(tǒng)的調(diào)試3、Minsky在1969年證明,有許多基本問題是感知器無法解決4、問題線性可分性可能與時間有關(guān)5、很難從樣本數(shù)據(jù)集直接看出問題是否線性可分6、未能證明,一個感知器究竟需要經(jīng)過多少步才能完成訓(xùn)練。2024-2-51123.3線性不可分問題
3.3.1異或(Exclusive–OR)問題
g(x,y)y01x0011102024-2-5113用於求解XOR的單神經(jīng)元感知器
xyo單神經(jīng)元感知器的圖像ax+by=θ1yx1(0,0)(1,1)2024-2-5114線性不可分函數(shù)變數(shù)函數(shù)及其值xyf1f2f3f4f5f6f7f8f9f10f11f12f13f14f15f160000000000111111110100001111000011111000110011001100111101010101010101012024-2-5115線性不可分函數(shù)R.O.Windner1960年
引數(shù)個數(shù)函數(shù)的個數(shù)線性可分函數(shù)的個數(shù)144216143256104465,536188254.3*10994,57261.8*10195,028,1342024-2-51163.3.2線性不可分問題的克服
用多個單級網(wǎng)組合在一起,並用其中的一個去綜合其他單級網(wǎng)的結(jié)果,我們就可以構(gòu)成一個兩級網(wǎng)路,該網(wǎng)路可以被用來在平面上劃分出一個封閉或者開放的凸域來一個非凸域可以拆分成多個凸域。按照這一思路,三級網(wǎng)將會更一般一些,我們可以用它去識別出一些非凸域來。解決好隱藏層的聯(lián)接權(quán)的調(diào)整問題是非常關(guān)鍵的
2024-2-5117兩級單輸出網(wǎng)在n維空間中劃分出m邊凸域
…x1ANmAN1ANoxn…o2024-2-5118第1次課堂測試(5分*4)Newell和Simon的物理符號系統(tǒng)所基於的假說是什麼?它在什麼層面上如何實現(xiàn)對人類智能的模擬?聯(lián)接主義觀點所基於的假說是什麼?它在什麼層面上如何實現(xiàn)對人類智能的模擬?畫出有導(dǎo)師演算法的流程圖。證明:一個啟動函數(shù)為線性函數(shù)的3級非迴圈網(wǎng)等價於一個單級網(wǎng)。2024-2-5119習(xí)題P381、62024-2-5120第1次課堂測試解答要點Newell和Simon的物理符號系統(tǒng)所基於的假說是什麼?它在什麼層面上如何實現(xiàn)對人類智能的模擬?要點:物理符號系統(tǒng);心理;符號對事務(wù)及變換的描述聯(lián)接主義觀點所基於的假說是什麼?它在什麼層面上如何實現(xiàn)對人類智能的模擬?
要點:聯(lián)接機制;生理;模式、聯(lián)接權(quán)的調(diào)整與對變換的表示2024-2-5121第1次課堂測試解答要點畫出有導(dǎo)師學(xué)習(xí)演算法的流程圖。
要點:如何處理精度與樣本集兩層迴圈證明:一個啟動函數(shù)為線性函數(shù)的3級非迴圈網(wǎng)等價於一個單級網(wǎng)。
要點:一級網(wǎng)與多級網(wǎng)的的數(shù)學(xué)模型2024-2-5122上次課內(nèi)容回顧:學(xué)習(xí)演算法離散單輸出感知器訓(xùn)練演算法W=W+X;W=W-XW=W+(Y-O)X離散多輸出感知器訓(xùn)練演算法Wj=Wj+(yj-oj)X連續(xù)多輸出感知器訓(xùn)練演算法wij=wij+α(yj-oj)xi2024-2-5123上次課內(nèi)容回顧:線性不可分問題ax+by=θ1yx1(0,0)(1,1)線性不可分問題的克服兩級網(wǎng)路可以劃分出封閉或開放的凸域多級網(wǎng)將可以識別出非凸域隱藏層的聯(lián)接權(quán)的調(diào)整問題是非常關(guān)鍵2024-2-5124第4章
BP網(wǎng)路
主要內(nèi)容:BP網(wǎng)路的構(gòu)成隱藏層權(quán)的調(diào)整分析Delta規(guī)則理論推導(dǎo)演算法的收斂速度及其改進討論BP網(wǎng)路中的幾個重要問題
重點:BP演算法難點:Delta規(guī)則的理論推導(dǎo)
2024-2-5125第4章
BP網(wǎng)路4.1概述
4.2基本BP演算法
4.3演算法的改進
4.4演算法的實現(xiàn)
4.5演算法的理論基礎(chǔ)
4.6幾個問題的討論
2024-2-51264.1概述
1、BP演算法的出現(xiàn)非迴圈多級網(wǎng)路的訓(xùn)練演算法UCSDPDP小組的Rumelhart、Hinton和Williams1986年獨立地給出了BP演算法清楚而簡單的描述1982年,Paker就完成了相似的工作1974年,Werbos已提出了該方法2、弱點:訓(xùn)練速度非常慢、局部極小點的逃離問題、演算法不一定收斂。3、優(yōu)點:廣泛的適應(yīng)性和有效性。2024-2-51274.2基本BP演算法
4.2.1網(wǎng)路的構(gòu)成
神經(jīng)元的網(wǎng)路輸入:
neti=x1w1i+x2w2i+…+xnwni神經(jīng)元的輸出:2024-2-5128輸出函數(shù)分析
0.5f′(net)0.25o01
1(0,0.5)
net(0,0)o應(yīng)該將net的值儘量控制在收斂比較快的範(fàn)圍內(nèi)可以用其他的函數(shù)作為啟動函數(shù),只要該函數(shù)是處處可導(dǎo)的2024-2-5129網(wǎng)路的拓?fù)浣Y(jié)構(gòu)x1o1輸出層隱藏層輸入層x2o2omxn…………………W(1)W(2)W(3)W(L)2024-2-5130網(wǎng)路的拓?fù)浣Y(jié)構(gòu)
BP網(wǎng)的結(jié)構(gòu)輸入向量、輸出向量的維數(shù)、網(wǎng)路隱藏層的層數(shù)和各個隱藏層神經(jīng)元的個數(shù)的決定實驗:增加隱藏層的層數(shù)和隱藏層神經(jīng)元個數(shù)不一定總能夠提高網(wǎng)路精度和表達能力。BP網(wǎng)一般都選用二級網(wǎng)路。2024-2-5131網(wǎng)路的拓?fù)浣Y(jié)構(gòu)x1o1輸出層隱藏層輸入層x2o2omxn…………WV2024-2-51324.2.2訓(xùn)練過程概述
樣本:(輸入向量,理想輸出向量)權(quán)初始化:“小亂數(shù)”與飽和狀態(tài);“不同”保證網(wǎng)路可以學(xué)。1、向前傳播階段:(1)從樣本集中取一個樣本(Xp,Yp),將Xp輸入網(wǎng)路;(2)計算相應(yīng)的實際輸出Op:
Op=Fl(…(F2(F1(XpW(1))W(2))…)W(L))2024-2-51334.2.2訓(xùn)練過程概述
2、向後傳播階段——誤差傳播階段:(1)計算實際輸出Op與相應(yīng)的理想輸出Yp的差;(2)按極小化誤差的方式調(diào)整權(quán)矩陣。(3)網(wǎng)路關(guān)於第p個樣本的誤差測度:(4)網(wǎng)路關(guān)於整個樣本集的誤差測度:2024-2-51344.2.3誤差傳播分析
1、輸出層權(quán)的調(diào)整wpq=wpq+?wpq?wpq=αδqop
=αfn′(netq)(yq-oq)op =αoq(1-oq)(yq-oq)op
wpqANpANq第L-1層第L層?wpq2024-2-51352、隱藏層權(quán)的調(diào)整
ANpANqANhvhp δpk-1δ1kwp1wpqδqkwpmδmk第k-2層第k層第k-1層……2024-2-51362、隱藏層權(quán)的調(diào)整δpk-1的值和δ1k,δ2k,…,δmk
有關(guān)不妨認(rèn)為δpk-1通過權(quán)wp1對δ1k做出貢獻,通過權(quán)wp2對δ2k做出貢獻,……通過權(quán)wpm對δmk做出貢獻。δpk-1=fk-1′(netp)(wp1δ1k+wp2δ2k+…+wpmδmk)2024-2-51372、隱藏層權(quán)的調(diào)整vhp=vhp+?vhp
?vhp=αδpk-1ohk-2 =αfk-1′(netp)(wp1δ1k+wp2δ2k+…+wpmδmk)ohk-2 =αopk-1(1-opk-1)(wp1δ1k+wp2δ2k+…+wpmδmk)ohk-2ANpANqANhvhp δpk-1δ1kwp1wpmδqkwpqδmk第k-2層第k層第k-1層……2024-2-5138上次課內(nèi)容回顧基本BP演算法neti=x1w1i+x2w2i+…+xnwni
2024-2-5139上次課內(nèi)容回顧x1o1輸出層隱藏層輸入層x2o2omxn…………WV2024-2-5140上次課內(nèi)容回顧樣本權(quán)初始化向前傳播階段Op=Fn(…(F2(F1(XpW(1))W(2))…)W(n))誤差測度2024-2-5141上次課內(nèi)容回顧向後傳播階段——誤差傳播階段輸出層權(quán)的調(diào)整?wpq=αδqop=αfn′(netq)(yq-oq)op
=αoq(1-oq)(yq-oq)op隱藏層權(quán)的調(diào)整ANpANqANhvhp δpk-1δ1kwp1wpqδqkwpmδmk……?vhp=αopk-1(1-opk-1)(wp1δ1k+wp2δ2k+…+wpmδmk)ohk-22024-2-51424.2.4基本的BP演算法
樣本集:S={(X1,Y1),(X2,Y2),…,(Xs,Ys)}
基本思想:逐一地根據(jù)樣本集中的樣本(Xk,Yk)計算出實際輸出Ok和誤差測度E1,對W(1)
,W(2)
,…,W(L)各做一次調(diào)整,重複這個迴圈,直到∑Ep<ε。用輸出層的誤差調(diào)整輸出層權(quán)矩陣,並用此誤差估計輸出層的直接前導(dǎo)層的誤差,再用輸出層前導(dǎo)層誤差估計更前一層的誤差。如此獲得所有其他各層的誤差估計,並用這些估計實現(xiàn)對權(quán)矩陣的修改。形成將輸出端表現(xiàn)出的誤差沿著與輸入信號相反的方向逐級向輸入端傳遞的過程
2024-2-5143演算法4-1
基本BP演算法
1fork=1toLdo 1.1初始化W(k);2初始化精度控制參數(shù)ε;3E=ε+1;4whileE>εdo
4.1E=0;
2024-2-5144演算法4-1
基本BP演算法
4.2對S中的每一個樣本(Xp,Yp):
4.2.1計算出Xp對應(yīng)的實際輸出Op;
4.2.2計算出Ep;
4.2.3E=E+Ep;
4.2.4根據(jù)相應(yīng)式子調(diào)整W(L);
4.2.5k=L-1;
4.2.6whilek≠0do 4.2.6.1根據(jù)相應(yīng)式子調(diào)整W(k);
4.2.6.2k=k-1
4.3E=E/2.0
2024-2-51454.3演算法的改進
1、BP網(wǎng)路接受樣本的順序?qū)τ?xùn)練結(jié)果有較大影響。它更“偏愛”較後出現(xiàn)的樣本2、給集中的樣本安排一個適當(dāng)?shù)捻樞?,是非常困難的。3、樣本順序影響結(jié)果的原因:“分別”、“依次”
4、用(X1,Y1),(X2,Y2),…,(Xs,Ys)的“總效果”修改W(1)
,W(2)
,…,W(L)。
?w(k)ij=∑?pw(k)ij
2024-2-5146演算法4-2消除樣本順序影響的BP演算法
1fork=1toLdo 1.1初始化W(k);2初始化精度控制參數(shù)ε;3E=ε+1;4whileE>εdo 4.1E=0; 4.2對所有的i,j,k:?w(k)ij=0;
2024-2-51474.3對S中的每一個樣本(Xp,Yp):
4.3.1計算出Xp對應(yīng)的實際輸出Op;
4.3.2計算出Ep;
4.3.3E=E+Ep;
4.3.4對所有i,j根據(jù)相應(yīng)式子計算?pw(L)ij;
4.3.5對所有i,j:?w(L)ij=?w(L)ij+?pw(L)ij;
4.3.6k=L-1;
4.3.7whilek≠0do 4.3.7.1對所有i,j根據(jù)相應(yīng)式子計算?pw(k)ij;
4.3.7.2對所有i,j:?w(k)ij=?w(k)ij+?pw(k)ij;
4.3.7.3k=k-1
4.4對所有i,j,k:w(k)ij=w(k)ij+?w(k)ij;4.5E=E/2.0
2024-2-5148演算法4-2分析
較好地解決了因樣本的順序引起的精度問題和訓(xùn)練的抖動問題
收斂速度:比較慢偏移量:給每一個神經(jīng)元增加一個偏移量來加快收斂速度衝量:聯(lián)接權(quán)的本次修改要考慮上次修改的影響,以減少抖動問題
2024-2-5149演算法4-2分析——衝量設(shè)置Rumelhart等人1986年?wij=αδjoi+β?wij′?wij′為上一次的修改量,β為衝量係數(shù),一般可取到0.9
Sejnowski與Rosenberg,1987年?wij=α((1-β)δjoi+β?wij′)
?wij′也是上一次的修改量,β在0和1之間取值
2024-2-51504.4演算法的實現(xiàn)
主要數(shù)據(jù)結(jié)構(gòu)W[H,m]——輸出層的權(quán)矩陣;V[n,H]——輸入(隱藏)層的權(quán)矩陣;?o[m]——輸出層各聯(lián)接權(quán)的修改量組成的向量;?h[H]——隱藏層各聯(lián)接權(quán)的修改量組成的向量;O1——隱藏層的輸出向量;O2——輸出層的輸出向量;(X,Y)——一個樣本。
2024-2-5151演算法的主要實現(xiàn)步驟
用不同的小偽亂數(shù)初始化W,V;初始化精度控制參數(shù)ε;學(xué)習(xí)率α;
迴圈控制參數(shù)E=ε+1;迴圈最大次數(shù)M;迴圈次數(shù)控制參數(shù)N=0;
whileE>ε&N<Mdo
4.1N=N+1;E=0;
4.2對每一個樣本(X,Y),執(zhí)行如下操作
2024-2-51524.2對每一個樣本(X,Y),執(zhí)行的操作
4.2.1計算:O1=F1(XV);O2=F2(O1W);4.2.2計算輸出層的權(quán)修改量
fori=1tom 4.2.2.1?o[i]=O2[i]*(1-O2[i])*(Y[i]-O2[i]);4.2.3計算輸出誤差:fori=1tom4.2.3.1E=E+(Y[i]-O2[i])2;2024-2-51534.2對每一個樣本(X,Y),執(zhí)行的操作4.2.4計算隱藏層的權(quán)修改量:fori=1toH 4.2.4.1Z=0;
4.2.4.2forj=1tomdoZ=Z+W[i,j]*?o[j];
4.2.4.3Δh[i]=Z*O1[i](1-O1[i])
;4.2.5修改輸出層權(quán)矩陣:fork=1toH&i=1tom 4.2.5.1W[k,i]=W[k,i]+α*O1[k]*?o[i];4.2.5修改隱藏層權(quán)矩陣:fork=1ton&i=1toH 4.2.5.1V[k,i]=V[k,i]+α*X[k]*?h[i];2024-2-5154建議
隱藏層的神經(jīng)元的個數(shù)H作為一個輸入?yún)?shù)同時將ε、迴圈最大次數(shù)M等,作為演算法的輸入?yún)?shù)在調(diào)試階段,最外層迴圈內(nèi),加一層控制,以探測網(wǎng)路是否陷入了局部極小點
2024-2-51554.5演算法的理論基礎(chǔ)基本假設(shè)網(wǎng)路含有L層聯(lián)接矩陣:W(1)
,W(2)
,…,W(L)第k層的神經(jīng)元:Hk個引數(shù)數(shù):n*H1+H1*H2+H2*H3+…+HL*m樣本集:S={(X1,Y1),(X2,Y2),…,(Xs,Ys)}
誤差測度: 2024-2-5156用E代表EP,用(X,Y)代表(XP,YP)
X=(x1,x2,…,xn) Y=(y1,y2,…,ym)該樣本對應(yīng)的實際輸出為
O=(o1,o2,…,om)誤差測度2024-2-5157誤差測度用理想輸出與實際輸出的方差作為相應(yīng)的誤差測度2024-2-5158最速下降法,要求E的極小點
wijE>0,此時Δwij<0取E<0,此時Δwij>0wij2024-2-5159而其中的
所以,
最速下降法,要求E的極小點2024-2-5160令所以Δwij=αδjoiα為學(xué)習(xí)率最速下降法,要求E的極小點2024-2-5161ANj為輸出層神經(jīng)元
oj=f(netj)
容易得到
從而
2024-2-5162ANj為輸出層神經(jīng)元2024-2-5163所以,故,當(dāng)ANj為輸出層的神經(jīng)元時,它對應(yīng)的聯(lián)接權(quán)wij應(yīng)該按照下列公式進行調(diào)整:ANj為輸出層神經(jīng)元2024-2-5164ANj為隱藏層神經(jīng)元
函數(shù)2024-2-5165ANj為隱藏層神經(jīng)元netk=oj…o2o1oHhnetk是oj下一級的神經(jīng)元的網(wǎng)路輸入2024-2-5166ANj為隱藏層神經(jīng)元2024-2-5167ANj為隱藏層神經(jīng)元2024-2-5168ANj為隱藏層神經(jīng)元2024-2-51694.6幾個問題的討論
收斂速度問題
局部極小點問題
逃離/避開局部極小點:修改W、V的初值——並不是總有效。逃離——統(tǒng)計方法;[Wasserman,1986]將Cauchy訓(xùn)練與BP演算法結(jié)合起來,可以在保證訓(xùn)練速度不被降低的情況下,找到全局極小點。
2024-2-51704.6幾個問題的討論
網(wǎng)路癱瘓問題
在訓(xùn)練中,權(quán)可能變得很大,這會使神經(jīng)元的網(wǎng)路輸入變得很大,從而又使得其啟動函數(shù)的導(dǎo)函數(shù)在此點上的取值很小。根據(jù)相應(yīng)式子,此時的訓(xùn)練步長會變得非常小,進而將導(dǎo)致訓(xùn)練速度降得非常低,最終導(dǎo)致網(wǎng)路停止收斂
穩(wěn)定性問題
用修改量的綜合實施權(quán)的修改連續(xù)變化的環(huán)境,它將變成無效的
2024-2-51714.6幾個問題的討論
步長問題
BP網(wǎng)路的收斂是基於無窮小的權(quán)修改量步長太小,收斂就非常慢步長太大,可能會導(dǎo)致網(wǎng)路的癱瘓和不穩(wěn)定自適應(yīng)步長,使得權(quán)修改量能隨著網(wǎng)路的訓(xùn)練而不斷變化。[1988年,Wasserman]
2024-2-5172練習(xí)P541、5、102024-2-5173上次課內(nèi)容回顧基本BP演算法演算法的改進用(X1,Y1),(X2,Y2),…,(Xs,Ys)的“總效果”修改W(1)
,W(2)
,…,W(L)?w(k)ij=∑?p
w(k)ij2024-2-5174上次課內(nèi)容回顧改進演算法有關(guān)問題抖動、收斂速度、偏移量、衝量演算法的實現(xiàn)迴圈控制、演算法的調(diào)試演算法的理論基礎(chǔ)2024-2-5175上次課內(nèi)容回顧問題的討論收斂速度局部極小點網(wǎng)路癱瘓穩(wěn)定性步長2024-2-5176第5章
對傳網(wǎng)
主要內(nèi)容:CPN的網(wǎng)路結(jié)構(gòu),正常運行,輸入向量的預(yù)處理,Kohonen層的訓(xùn)練演算法及其權(quán)矩陣的初始化方法;Grossberg層的訓(xùn)練;完整的對傳網(wǎng)重點:Kohonen層與Grossberg層的正常運行與訓(xùn)練難點:Kohonen層的訓(xùn)練演算法及其權(quán)矩陣的初始化方法
2024-2-5177第5章
對傳網(wǎng)
5.1網(wǎng)路結(jié)構(gòu)
5.2網(wǎng)路的正常運行
5.3Kohonen層的訓(xùn)練
5.4Kohonen層聯(lián)接權(quán)的初始化方法
5.5Grossberg層的訓(xùn)練
5.6補充說明
2024-2-5178第5章
對傳網(wǎng)RobertHecht-Nielson在1987年提出了對傳網(wǎng)(CounterpropagationNetworks,CPN)。CPN為異構(gòu)網(wǎng):Kohonen1981年提出的Self-organizationmapSOM——Kohonen層Grossberg1969年提出的Outstar——Grossberg層訓(xùn)練時間短:BP的1%。應(yīng)用面:比較窄讓網(wǎng)路的隱藏層執(zhí)行無導(dǎo)師學(xué)習(xí),是解決多級網(wǎng)路訓(xùn)練的另一個思路2024-2-51795.1網(wǎng)路結(jié)構(gòu)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 深圳股權(quán)轉(zhuǎn)讓合同(2025年版)4篇
- 商場LED顯示屏租賃合同(二零二五年)
- 二零二五年度國際法學(xué)與留學(xué)項目合同3篇
- 2025年度個人一手房買賣合同環(huán)保標(biāo)準(zhǔn)范本4篇
- 2025版戶外休閑場所草皮采購與租賃合同3篇
- 2025年智能家居系統(tǒng)產(chǎn)品銷售激勵協(xié)議書2篇
- 2025版團購樓房指標(biāo)轉(zhuǎn)讓與房地產(chǎn)咨詢代理合同3篇
- 2025版智能防蚊紗窗研發(fā)與銷售合作協(xié)議3篇
- 2025年度個人投資分紅收據(jù)模板制作服務(wù)協(xié)議4篇
- 2025年度互聯(lián)網(wǎng)金融服務(wù)提供商合作協(xié)議范本4篇
- 骨髓穿刺課件
- 鄉(xiāng)村治理中正式制度與非正式制度的關(guān)系解析
- 2024版義務(wù)教育小學(xué)數(shù)學(xué)課程標(biāo)準(zhǔn)
- 智能護理:人工智能助力的醫(yī)療創(chuàng)新
- 國家中小學(xué)智慧教育平臺培訓(xùn)專題講座
- 5G+教育5G技術(shù)在智慧校園教育專網(wǎng)系統(tǒng)的應(yīng)用
- VI設(shè)計輔助圖形設(shè)計
- 淺談小學(xué)勞動教育的開展與探究 論文
- 2023年全國4月高等教育自學(xué)考試管理學(xué)原理00054試題及答案新編
- 河北省大學(xué)生調(diào)研河北社會調(diào)查活動項目申請書
- JJG 921-2021環(huán)境振動分析儀
評論
0/150
提交評論