《神經(jīng)網(wǎng)絡(luò)控制》課件第6章

上傳人：1*** IP屬地：廣東上傳時(shí)間：2024-12-14 格式：PPT 頁數(shù)：250 大小：1.80MB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩245頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第6章神經(jīng)控制系統(tǒng)6.1神經(jīng)控制系統(tǒng)概述6.2神經(jīng)控制器的設(shè)計(jì)方法6.3神經(jīng)辨識(shí)器的設(shè)計(jì)方法6.4PID神經(jīng)控制系統(tǒng)6.5模型參考自適應(yīng)神經(jīng)控制系統(tǒng)6.6預(yù)測(cè)神經(jīng)控制系統(tǒng)6.7自校正神經(jīng)控制系統(tǒng)6.8內(nèi)模神經(jīng)控制系統(tǒng)6.9小腦模型神經(jīng)控制系統(tǒng)6.10小結(jié)習(xí)題與思考題

6.1神經(jīng)控制系統(tǒng)概述

把人工神經(jīng)網(wǎng)絡(luò)引進(jìn)到自動(dòng)控制領(lǐng)域，是神經(jīng)網(wǎng)絡(luò)學(xué)界和自動(dòng)控制學(xué)界共同努力的結(jié)果，它反映了兩個(gè)學(xué)科分支的共同心愿。神經(jīng)網(wǎng)絡(luò)學(xué)界急切希望找到自己的用武之地，自動(dòng)控制領(lǐng)域迫切希望實(shí)現(xiàn)更高層面上的自動(dòng)化。

把人工神經(jīng)網(wǎng)絡(luò)引進(jìn)到自動(dòng)控制領(lǐng)域，是因?yàn)闊o論從理論上還是實(shí)踐上，都已經(jīng)證明神經(jīng)網(wǎng)絡(luò)具有逼近任意連續(xù)有界非線性函數(shù)的能力。非線性系統(tǒng)本身具有明顯的不確定

行為，即便是線性系統(tǒng)，為了改善網(wǎng)絡(luò)的動(dòng)態(tài)特性，也常常需要在線性前饋網(wǎng)絡(luò)的隱層構(gòu)造非線性單元，形成非線性前饋網(wǎng)絡(luò)。6.1.1神經(jīng)控制系統(tǒng)的基本結(jié)構(gòu)

神經(jīng)控制系統(tǒng)的全稱是人工神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)，其主要系統(tǒng)形式依舊是負(fù)反饋調(diào)節(jié)，系統(tǒng)的基本結(jié)構(gòu)依舊劃分成開環(huán)和閉環(huán)兩類。它的一般結(jié)構(gòu)如圖6-1所示，圖中的控制器、

辨識(shí)器和反饋環(huán)節(jié)均可以用神經(jīng)網(wǎng)絡(luò)構(gòu)成。

人工神經(jīng)網(wǎng)絡(luò)使用二元邏輯，是一種數(shù)字網(wǎng)絡(luò)，神經(jīng)控制是一種數(shù)字控制，用數(shù)字量控制被控對(duì)象。神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)是一種數(shù)字控制系統(tǒng)，它具有數(shù)字控制系統(tǒng)的一般特征。和一般的微機(jī)系統(tǒng)一樣，它由硬件與軟件兩部分組成。圖6-1人工神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)的一般結(jié)構(gòu)6.1.2神經(jīng)網(wǎng)絡(luò)在神經(jīng)控制系統(tǒng)中的作用

神經(jīng)控制給非線性系統(tǒng)帶來一種新的控制方式。在神經(jīng)網(wǎng)絡(luò)進(jìn)入自控領(lǐng)域之前，控制系統(tǒng)的設(shè)計(jì)分析方法是首先建立數(shù)學(xué)模型，用數(shù)學(xué)表達(dá)式描述系統(tǒng)，然后對(duì)相應(yīng)的數(shù)學(xué)方程求解。古典控制理論形成了一整套利用拉氏變換求解微分方程的做法；現(xiàn)代控制理論則是狀態(tài)方程和矩陣求解。如果數(shù)學(xué)模型不正確，描述系統(tǒng)的數(shù)學(xué)式子不能反映系統(tǒng)的真實(shí)面貌，與真實(shí)系統(tǒng)相差太大，設(shè)計(jì)結(jié)果就不能使用。這就是系統(tǒng)設(shè)計(jì)失敗的原因。無論是古典控制系統(tǒng)，還是現(xiàn)代控制系統(tǒng)，控制器的設(shè)計(jì)都與被控制器的數(shù)學(xué)模型有直接的關(guān)系。神經(jīng)網(wǎng)絡(luò)從根本上改變了上述設(shè)計(jì)思路，因?yàn)樗恍枰豢刂茖?duì)象的數(shù)學(xué)模型。在控制系統(tǒng)中，神經(jīng)網(wǎng)絡(luò)是作為控制器或辨識(shí)器起作用的。

控制器具有智能行為的系統(tǒng)，稱為智能控制系統(tǒng)。在智能控制系統(tǒng)中，有一類具有學(xué)習(xí)能力的系統(tǒng)，被稱為學(xué)習(xí)控制系統(tǒng)。學(xué)習(xí)的過程是一個(gè)訓(xùn)練并帶有將訓(xùn)練結(jié)果記憶的過程，人工神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)就是一種學(xué)習(xí)控制系統(tǒng)。神經(jīng)控制器與古典控制器和現(xiàn)代控制器相比，有優(yōu)點(diǎn)也有缺點(diǎn)。優(yōu)點(diǎn)是神經(jīng)控制器的設(shè)計(jì)與被控制對(duì)象的數(shù)學(xué)模型無關(guān)，這是神經(jīng)控制器的最大優(yōu)點(diǎn)，也是神經(jīng)網(wǎng)絡(luò)能夠在自動(dòng)控制中立足的根本原因。缺點(diǎn)是神經(jīng)網(wǎng)絡(luò)需要在線或離線開展學(xué)習(xí)訓(xùn)練，并利用訓(xùn)練結(jié)果進(jìn)行系統(tǒng)設(shè)計(jì)。這種訓(xùn)練在很大程度上依賴訓(xùn)練樣本的準(zhǔn)確性，而訓(xùn)練樣本的選取依舊帶有人為的因素。

神經(jīng)辨識(shí)器用于辨識(shí)被控對(duì)象的非線性和不確定性。

不同的神經(jīng)控制系統(tǒng)有不同的配置：有的僅僅只需要神經(jīng)控制器；有的僅僅只需要神經(jīng)辨識(shí)器，有的既需要神經(jīng)控制器，又需要神經(jīng)辨識(shí)器。不同的配置按照不同的對(duì)象要求設(shè)定。

6.2神經(jīng)控制器的設(shè)計(jì)方法

神經(jīng)控制器的設(shè)計(jì)大致可以分為兩種類型，一類是與傳統(tǒng)設(shè)計(jì)手法相結(jié)合；一類是完全脫離傳統(tǒng)手法，另行一套。無論是哪一類，目前都未有固定的模式，很多問題都還在探討之中。究其原因是因?yàn)樯窠?jīng)控制還是一門新學(xué)科，在社會(huì)上并不普及，為數(shù)眾多的人甚至連“神經(jīng)控制”都還沒有聽說過，神經(jīng)系統(tǒng)的研究還處于摸索探討階段，神經(jīng)網(wǎng)絡(luò)雖然

有了一些所謂的“理論”，但并不成熟，甚至連隱層節(jié)點(diǎn)的作用機(jī)理這一類簡(jiǎn)單的理論問題都沒有搞清楚。而智能控制的“年齡”比神經(jīng)網(wǎng)絡(luò)還要年輕，現(xiàn)階段的智能控制就沒有理論。因此，神經(jīng)控制器沒有理論體系，更談不上完善的理論體系，相應(yīng)也就不存在系統(tǒng)化的設(shè)計(jì)方法。目前較為流行的神經(jīng)控制器設(shè)計(jì)過程是：設(shè)計(jì)人員根據(jù)自己的經(jīng)驗(yàn)選用神經(jīng)網(wǎng)絡(luò)、選擇訓(xùn)練方法，確定是否需要供訓(xùn)練使用的導(dǎo)師信號(hào)，設(shè)計(jì)算法并編制程序，然后上機(jī)運(yùn)行，得到仿真結(jié)果，根據(jù)結(jié)果決定是否需要進(jìn)一步修改相關(guān)參數(shù)或修改網(wǎng)絡(luò)體系。

從仿真到實(shí)際運(yùn)行，還有很長(zhǎng)一段路要走，需要解決的主要問題是仿真僅僅只是神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練運(yùn)行的結(jié)果，實(shí)際運(yùn)行需要帶動(dòng)被控制對(duì)象，其工作環(huán)境遠(yuǎn)比實(shí)驗(yàn)室仿真環(huán)

境惡劣且復(fù)雜得多。由于神經(jīng)控制器的設(shè)計(jì)與設(shè)計(jì)人員的素質(zhì)、理解能力和經(jīng)驗(yàn)有關(guān)，因此設(shè)計(jì)出來的產(chǎn)品都可以成為設(shè)計(jì)者的成果，這也是從事神經(jīng)控制較容易出成果的原因之一。隨著時(shí)間的推移，對(duì)設(shè)計(jì)結(jié)果的評(píng)價(jià)體系終會(huì)誕生，優(yōu)劣將更加清晰。

簡(jiǎn)單綜合起來，神經(jīng)控制器的設(shè)計(jì)方法大體有如下幾種：模型參考自適應(yīng)方法、自校正方法、內(nèi)模方法、常規(guī)控制方法、神經(jīng)網(wǎng)絡(luò)智能方法和神經(jīng)網(wǎng)絡(luò)優(yōu)化設(shè)計(jì)方法。6.2.1模型參考自適應(yīng)方法

模型參考自適應(yīng)方法設(shè)計(jì)出來的神經(jīng)控制器多用于被控制對(duì)象是線性對(duì)象，但也適合于被控制對(duì)象是非線性對(duì)象。兩種不同對(duì)象對(duì)神經(jīng)辨識(shí)器的要求不同。這種方式設(shè)計(jì)出的

系統(tǒng)基本結(jié)構(gòu)如圖6-2所示。從圖中可以看到，神經(jīng)網(wǎng)絡(luò)的功能是控制器，但是它的訓(xùn)練信號(hào)卻是參考模型信號(hào)與系統(tǒng)輸出信號(hào)之間的差值：

e=z－y

由此可以確定神經(jīng)控制器的訓(xùn)練目標(biāo)為參考模型輸出與被控對(duì)象輸出的差值最小。圖6-2模型參考自適應(yīng)神經(jīng)控制系統(tǒng)訓(xùn)練之前必須要先解決的問題是如何得到參考模型輸出與被控對(duì)象輸出，由于無法知道被控對(duì)象的數(shù)學(xué)模型，或者是引入神經(jīng)控制的目的就是不用知道被控對(duì)象的數(shù)學(xué)模型，

因而對(duì)象的特性未知，給訓(xùn)練帶來困難。解決辦法是在被控對(duì)象的兩邊增加神經(jīng)網(wǎng)絡(luò)辨識(shí)器，通過辨識(shí)器具有的在線辨識(shí)功能獲得被控對(duì)象的動(dòng)態(tài)特性。線性被控對(duì)象和非線性被

控對(duì)象的系統(tǒng)辨識(shí)是不相同的，對(duì)比之下，非線性被控對(duì)象的系統(tǒng)辨識(shí)要困難得多。

6.2.2自校正方法

用自校正方法設(shè)計(jì)出來的神經(jīng)控制系統(tǒng)既能用于線性對(duì)象，也能用于非線性對(duì)象。自校正神經(jīng)控制系統(tǒng)的基本結(jié)構(gòu)如圖6-3所示。其中自校正控制器由人工神經(jīng)網(wǎng)絡(luò)構(gòu)成，它的輸入有兩部分：一部分是偏差信號(hào)，一部分是辨識(shí)估計(jì)的輸出。辨識(shí)估計(jì)器能正確估計(jì)被控對(duì)象的動(dòng)態(tài)建模，在某種程度上，它是一個(gè)反饋部件。辨識(shí)估計(jì)器顯然應(yīng)當(dāng)由神經(jīng)網(wǎng)絡(luò)構(gòu)成。圖6-3自校正神經(jīng)控制系統(tǒng)自校正有直接控制和間接控制兩類。自校正直接控制往往只需要一個(gè)自校正控制器，結(jié)構(gòu)簡(jiǎn)單，常用于線性系統(tǒng)的實(shí)時(shí)控制。自校正直接控制器的設(shè)計(jì)方法有兩種：有模型設(shè)計(jì)和無模型設(shè)計(jì)。在有模型設(shè)計(jì)中，通常在系統(tǒng)中加入白噪聲信號(hào)，以獲得較好的控制效果。辨識(shí)過程常常出現(xiàn)飽和，影響辨識(shí)結(jié)果及跟蹤快慢。為了自動(dòng)適應(yīng)對(duì)快速變化的系統(tǒng)實(shí)時(shí)辨識(shí),使用經(jīng)過訓(xùn)練后的神經(jīng)網(wǎng)絡(luò),能及時(shí)準(zhǔn)確提取被控對(duì)象的參數(shù)，對(duì)干擾有較強(qiáng)的抵抗能力，對(duì)失誤有較強(qiáng)的容錯(cuò)能力。自校正間接控制器著重解決非線性系統(tǒng)的動(dòng)態(tài)建模。

用于線性對(duì)象的控制器常采用零極點(diǎn)配置進(jìn)行設(shè)計(jì)，這是一種常規(guī)的自適應(yīng)設(shè)計(jì)。用于非線性對(duì)象的控制器常采用I/O線性化或采用逆模型控制等設(shè)計(jì)。6.2.3內(nèi)模方法

內(nèi)模方法設(shè)計(jì)出來的內(nèi)模神經(jīng)控制系統(tǒng)主要用于非線性系統(tǒng)，內(nèi)模神經(jīng)控制器既要作用于被控對(duì)象，又要作用于被控對(duì)象的內(nèi)部模型。內(nèi)模神經(jīng)控制系統(tǒng)結(jié)構(gòu)如圖6-4所示，其穩(wěn)定的充分兼必要條件是控制器和被控對(duì)象都要穩(wěn)定。系統(tǒng)中的控制器和被控對(duì)象的內(nèi)部模型都由神經(jīng)網(wǎng)絡(luò)承擔(dān)。圖6-4內(nèi)模神經(jīng)控制系統(tǒng)6.2.4常規(guī)控制方法

常規(guī)控制方法使用古典控制理論、現(xiàn)代控制理論和智能控制中控制器的設(shè)計(jì)方法。這些方法較成熟，可以在設(shè)計(jì)過程中用神經(jīng)網(wǎng)絡(luò)取代設(shè)計(jì)出的控制器。取代不是簡(jiǎn)單的更換，而是確定神經(jīng)網(wǎng)絡(luò)的訓(xùn)練算法，做到快速衰減而又穩(wěn)定。這一類系統(tǒng)比較多，有神經(jīng)PID調(diào)節(jié)控制系統(tǒng)、神經(jīng)預(yù)測(cè)控制系統(tǒng)和變結(jié)構(gòu)控制系統(tǒng)等。圖6-5~圖6-7分別是這三種系統(tǒng)的結(jié)構(gòu)示意圖。圖6-5神經(jīng)PID調(diào)節(jié)控制系統(tǒng)圖6-6神經(jīng)預(yù)測(cè)控制系統(tǒng)圖6-7變結(jié)構(gòu)控制系統(tǒng)常規(guī)PID調(diào)節(jié)是古典控制理論中使用十分成熟且十分有效的工程控制方法。無論是古典控制理論、現(xiàn)代控制理論，還是智能控制，都離不開PID調(diào)節(jié)方式。對(duì)于結(jié)構(gòu)明了、參

數(shù)固定不變或基本不變的線性定常系統(tǒng)，PID調(diào)節(jié)的控制功能發(fā)揮得淋漓盡致。PID調(diào)節(jié)器既可以用運(yùn)算放大器等模擬芯片構(gòu)成，也可以用數(shù)字電路構(gòu)成，還可以用計(jì)算機(jī)構(gòu)成。

算法簡(jiǎn)單，易于實(shí)現(xiàn)。對(duì)于一些在控制過程中存在不確定性、存在非線性、存在時(shí)變的被控對(duì)象，由于數(shù)學(xué)模型不明確，常規(guī)PID調(diào)節(jié)器往往難以奏效，不能保證系統(tǒng)穩(wěn)定性。目前能夠想到的解決

辦法有兩個(gè)，兩個(gè)辦法都離不開神經(jīng)網(wǎng)絡(luò)。一個(gè)是對(duì)被控對(duì)象使用系統(tǒng)辨識(shí)，PID調(diào)節(jié)器繼續(xù)使用常規(guī)調(diào)節(jié)器，系統(tǒng)辨識(shí)由神經(jīng)網(wǎng)絡(luò)承擔(dān)；另一個(gè)是使用神經(jīng)PID調(diào)節(jié)器。在系統(tǒng)

中引入神經(jīng)網(wǎng)絡(luò)，相應(yīng)需要學(xué)習(xí)訓(xùn)練。神經(jīng)預(yù)測(cè)控制系統(tǒng)也是用于非線性、不確定性被控對(duì)象的系統(tǒng)，預(yù)測(cè)未來將要發(fā)生的事情，將來的事不可能今天就能確定下來。但是，如同今天是過去的繼續(xù)一樣，將來

是今天的繼續(xù)。利用今天統(tǒng)計(jì)規(guī)律獲得的知識(shí)能推導(dǎo)未來的發(fā)展趨勢(shì)。例如江河湖堤的水文分析，未來一周或下個(gè)月的天氣情況，十幾、幾十年后人口的出生狀況、受教育狀況、

就業(yè)狀況等等。在預(yù)測(cè)中引入基于學(xué)習(xí)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)，將不遜于基于模糊邏輯的專家系統(tǒng)，不遜于基于規(guī)則的人工智能。變結(jié)構(gòu)控制系統(tǒng)中的神經(jīng)網(wǎng)絡(luò)需要面對(duì)變參數(shù)、變結(jié)構(gòu)的被控對(duì)象，相應(yīng)控制方案要復(fù)雜一些。在這種系統(tǒng)中，神經(jīng)控制器和常規(guī)控制器并存，由于參數(shù)經(jīng)常發(fā)生變化，神經(jīng)網(wǎng)絡(luò)的主要功能將是識(shí)別參數(shù)的變化，為常規(guī)控制器決策提供依據(jù)。在傳統(tǒng)的模糊控制或人工智能中，跟蹤參數(shù)變化主要使用條件轉(zhuǎn)移語句，如類似于“IF…THEN…”或一些比較判別語句。這類語句本身并沒有什么大的問題，問題是條件帶有人為主觀因素，因而存在較大的系統(tǒng)誤差。神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)跟蹤系統(tǒng)的參數(shù)變化時(shí)，時(shí)時(shí)注意到控制參數(shù)與系統(tǒng)結(jié)構(gòu)之間的轉(zhuǎn)換，在訓(xùn)練過程中記憶系統(tǒng)參數(shù)的內(nèi)在聯(lián)系，系統(tǒng)的初始化更加易于實(shí)施，效果更加明顯，控制結(jié)果更加令人滿意，系統(tǒng)的魯棒性明顯增強(qiáng)。系統(tǒng)內(nèi)有一個(gè)樣本生成環(huán)節(jié)，用于生成訓(xùn)練樣本。由于參數(shù)隨時(shí)變化，需要一個(gè)樣本生成的參照系，參照系由神經(jīng)網(wǎng)絡(luò)承擔(dān)。

變結(jié)構(gòu)控制系統(tǒng)的不足之處是難于實(shí)施神經(jīng)網(wǎng)絡(luò)的在線訓(xùn)練。6.2.5神經(jīng)網(wǎng)絡(luò)智能方法

神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)功能是一種智能行為，它與其它智能學(xué)科有相同或相近的設(shè)計(jì)方式。將神經(jīng)網(wǎng)絡(luò)與模糊控制、人工智能、專家系統(tǒng)相結(jié)合，可構(gòu)成各具特色的模糊神經(jīng)控制、智能神經(jīng)控制、專家神經(jīng)系統(tǒng)等，它們形成了自己的設(shè)計(jì)方法。一種典型的模糊神經(jīng)控制系統(tǒng)的基本結(jié)構(gòu)如圖6-8所示。圖6-8模糊神經(jīng)控制系統(tǒng)6.2.6神經(jīng)網(wǎng)絡(luò)優(yōu)化設(shè)計(jì)方法

神經(jīng)網(wǎng)絡(luò)能夠復(fù)現(xiàn)各種復(fù)雜的優(yōu)化運(yùn)算，是因?yàn)閹щ[層的三層網(wǎng)絡(luò)能夠以任意精度逼近任何非線性函數(shù)。網(wǎng)絡(luò)能夠完成的優(yōu)化運(yùn)算有最優(yōu)化求解、矩陣求逆、Lyapunov方程求解、Riccati方程求解等。神經(jīng)計(jì)算目前已經(jīng)演變成一門學(xué)科分支。在最優(yōu)化過程中設(shè)計(jì)神經(jīng)算法的好處是更接近系統(tǒng)實(shí)際、迭代速度快、系統(tǒng)結(jié)構(gòu)清晰簡(jiǎn)明，尤其是有連續(xù)量與離散量并存的系統(tǒng)。具體實(shí)例有使用Hopfield網(wǎng)絡(luò)對(duì)廣義預(yù)測(cè)系統(tǒng)中的矩陣求逆問題進(jìn)行求解，對(duì)被控對(duì)象的數(shù)學(xué)模型進(jìn)行在線辨識(shí)等等。

6.3神經(jīng)辨識(shí)器的設(shè)計(jì)方法

系統(tǒng)辨識(shí)的基本任務(wù)就是尋求到滿足一定條件的一個(gè)模型。由于“一組給定模型”是人為給出的，如果內(nèi)部包括有與實(shí)際被控系統(tǒng)完全等價(jià)的模型，那么就完全用不著給出一組進(jìn)行辨識(shí)。事實(shí)上不可能找到與被控系統(tǒng)完全等價(jià)的模型，只能選一個(gè)相近的模型。這樣做當(dāng)然也會(huì)帶來一個(gè)問題，給出一組什么樣的“給定模型”是至關(guān)重要的。如果給出的一組模型中，個(gè)個(gè)都與實(shí)際被控系統(tǒng)相差巨大，那么再好的神經(jīng)辨識(shí)也無能為力。系統(tǒng)辨識(shí)的等價(jià)準(zhǔn)則是識(shí)別模型接近被控系統(tǒng)的誤差標(biāo)準(zhǔn)，在數(shù)學(xué)上為一個(gè)誤差的泛函，用

J=‖e‖

表示，其中最常見的是L2范數(shù)。

神經(jīng)辨識(shí)器的設(shè)計(jì)方法在于確定一個(gè)原則，選擇一個(gè)模型，將所選模型的動(dòng)態(tài)、靜態(tài)特性與被控系統(tǒng)的動(dòng)態(tài)、靜態(tài)特性最大限度地?cái)M合。圖6-9所示是神經(jīng)辨識(shí)系統(tǒng)的基本結(jié)構(gòu)。圖6-9神經(jīng)辨識(shí)系統(tǒng)

6.4PID神經(jīng)控制系統(tǒng)

PID控制是工業(yè)過程控制中使用歷史最為久遠(yuǎn)、范圍最為廣泛的控制調(diào)節(jié)方式。PID控制器具有魯棒性強(qiáng)、結(jié)構(gòu)簡(jiǎn)單、易于實(shí)現(xiàn)、控制過程直觀等優(yōu)點(diǎn)，在控制系統(tǒng)中不可被其它控制方式替代。但是，對(duì)于那些在復(fù)雜生產(chǎn)環(huán)境下的被控對(duì)象，由于存在非線性、干擾、不確定性等問題，致使常規(guī)PID控制難以獲得最佳調(diào)節(jié)參數(shù)。工業(yè)對(duì)象通常具有時(shí)變性，很難在全工作范圍或長(zhǎng)期工作時(shí)間內(nèi)始終保持最優(yōu)。為此，人們提出了一些改進(jìn)辦法，例如自適應(yīng)PID控制等。但是，自適應(yīng)控制主要用于線性情況。工業(yè)控制遇到的問題是非線性對(duì)象，用常規(guī)PID就難以達(dá)到目的。6.4.1PID神經(jīng)控制系統(tǒng)框圖

設(shè)被控對(duì)象的數(shù)學(xué)模型為

y(t)=f[y(t－1)，y(t－2)，…，y(t－n)，u(t－1)，u(t－2)，…，u(t－m)]

該模型表示被控系統(tǒng)是一個(gè)單輸入單輸出的非線性系統(tǒng)，f

［·］用來表示非線性關(guān)系，是一個(gè)未知量；y(t)是系統(tǒng)的輸出，階次為n；u(t)是系統(tǒng)的輸入，階次為m。

為了將未知的f［·］辨識(shí)出來，在PID神經(jīng)控制系統(tǒng)中，除了神經(jīng)控制器NNC外，還需要神經(jīng)辨識(shí)器NNI。由此組成的PID神經(jīng)控制系統(tǒng)的結(jié)構(gòu)框圖如圖6-10所示。圖6-10PID神經(jīng)控制系統(tǒng)從圖6-10中可以看到，PID神經(jīng)控制系統(tǒng)采用串-并聯(lián)結(jié)構(gòu)，PID神經(jīng)控制器與被控對(duì)象串聯(lián)連接，神經(jīng)辨識(shí)器與被控對(duì)象并聯(lián)連接。

神經(jīng)辨識(shí)器NNI采用3層BP網(wǎng)絡(luò)，接受兩個(gè)輸入，分別是u(t)和y(t)。將u(t)和y(t)合在一起用x(t)表示，寫成

x(t)=[y(t－1),y(t－2),…,y(t－n),u(t－1),u(t－2),…,u(t－m)]

NNI的輸入表達(dá)式x(t)表明網(wǎng)絡(luò)輸入層有n+m－1個(gè)神經(jīng)元。網(wǎng)絡(luò)隱層神經(jīng)元個(gè)數(shù)n0≥n+m－1，輸入輸出關(guān)系為Oi(t)=g［neti(t)］式中，wij為權(quán)系數(shù)，θi

是閾值，g［·］是作用函數(shù)，且g(x)=(1－e－x)/(1+e－x)。

NNI僅有一個(gè)輸出，分別送到兩個(gè)比較環(huán)節(jié)，在與控制系統(tǒng)的輸入r(t)和輸出y(t)比較后，分別成為神經(jīng)控制器和神經(jīng)辨識(shí)器的學(xué)習(xí)算法信號(hào)。輸出記為式中，z(t+1)是NNI的輸出，vi是權(quán)系數(shù)，α是閾值，學(xué)習(xí)性能指標(biāo)為當(dāng)取Jm極小值時(shí)，權(quán)系數(shù)調(diào)整規(guī)律為Δvi(t)=αε(t+1)Oi(t)+βΔvi(t－1)Δγ(t)=αε(t+1)+βΔγ(t－1)Δwij(t)=αε(t+1)g′［net(t)］vi(t)xj(t)+βΔwij(t－1)Δθij(t)=αε(t+1)g′［net(t)］vi(t)+βΔθij(t－1)ε(t+1)=y(t+1)－z(t＋1)g′(·)=0.5［1－g2(·)］Δu(t)=u(t)－u(t－1)式中，α、β分別是學(xué)習(xí)率和慣性系數(shù)，取值范圍為(0，1)。6.4.2PID神經(jīng)調(diào)節(jié)器的參數(shù)整定

PID神經(jīng)調(diào)節(jié)器與常規(guī)線性系統(tǒng)的PID調(diào)節(jié)器具有完全相同的形式。本節(jié)選擇一個(gè)帶隱層的三層神經(jīng)網(wǎng)絡(luò)作PID調(diào)節(jié)器，討論參數(shù)整定的方法。

當(dāng)PID調(diào)節(jié)器的控制參數(shù)基于算法來完成調(diào)整時(shí)，選用的常常是梯度下降法。設(shè)三層網(wǎng)絡(luò)調(diào)節(jié)器的輸入為e(t)，

e(t)－e(t－1)，e(t)－2e(t－1)+e(t－2)，

網(wǎng)絡(luò)的I/O關(guān)系式可寫出，調(diào)節(jié)器輸出增量用

Δu(t)=f［e(t)，e(t)－e(t－1)，e(t)－2e(t－1)+e(t－2)］

描述，等式右邊f(xié)［·］是非線性函數(shù)。相應(yīng)地，

u(t)=u(t－1)+Δu(t)權(quán)系數(shù)的調(diào)整公式為

Δwij(t)=αε(t+1)+g′［net(t)］vi(t)xj(t)+βΔwij(t－1)

式中，α、β分別為學(xué)習(xí)修正率及慣性系數(shù)，ε是誤差系數(shù)，g′［·］是作用函數(shù)。進(jìn)一步有

ε(t+1)=r(t+1)－y(t+1)=e(t+1)

學(xué)習(xí)修正率α的取值直接影響到學(xué)習(xí)速度，為了加快收斂速度，一般都采用改變修正率的措施，變步長(zhǎng)的方法如下：

(1)設(shè)計(jì)算性能指標(biāo)為檢查

J(t)＜βJ(t－1)是否成立。如果成立，則表明在u(t)作用下，系統(tǒng)的跟蹤誤差大大減小，實(shí)現(xiàn)J(t)的目標(biāo)也比較明顯。學(xué)習(xí)修正率α的調(diào)整公式如下：如果α(t)增大，則表示學(xué)習(xí)強(qiáng)度增強(qiáng)，收斂加快。

(2)如果J(t)＜βJ(t－1)不成立，應(yīng)保持學(xué)習(xí)修正率α(t)不變。

(3)慣性系統(tǒng)β的取值小些有利于收斂，如取0.2＜β＜0.7用于快速系統(tǒng)；取0.6＜β＜0.99用于慢速調(diào)節(jié)。β值的選取不必非得始終一致，取得小有利于快速，取得大有利于慢速平緩，為使系統(tǒng)響應(yīng)過程良好，可取β先大后小。

6.5模型參考自適應(yīng)神經(jīng)控制系統(tǒng)

反饋是保護(hù)系統(tǒng)穩(wěn)定的一種有效措施。當(dāng)控制對(duì)象參數(shù)發(fā)生變化或運(yùn)行環(huán)境發(fā)生變化時(shí)，為了保證系統(tǒng)具備良好的動(dòng)態(tài)性能，負(fù)反饋是一種有力的措施，由此產(chǎn)生了自適應(yīng)控制策略。由于負(fù)反饋的存在，自適應(yīng)才成為可能。如果被控對(duì)象屬于線性系統(tǒng)或可將其線性處理的非線性系統(tǒng)，有兩種不同的自適應(yīng)控制方式可供選擇：一種是參考自適應(yīng)控制，另一種是自校正控制。前一種是本節(jié)敘述的內(nèi)容，后一種在后面介紹。模型參考自適應(yīng)系統(tǒng)方案由美國MIT的Witark教授在1958年提出。這種系統(tǒng)的基本結(jié)構(gòu)由參考模型、反饋控制器、預(yù)處理環(huán)節(jié)等三部分組成，參考模型起前饋控制作用。

系統(tǒng)的基本框架圖如圖6-11所示。圖6-11模型參考自適應(yīng)系統(tǒng)基本結(jié)構(gòu)6.5.1兩種不同的自適應(yīng)控制方式

模型參考自適應(yīng)系統(tǒng)的基本結(jié)構(gòu)來源于一般線性對(duì)象自適應(yīng)系統(tǒng)。為了保證控制系統(tǒng)對(duì)給定值有良好的跟蹤能力和抑制干擾能力，通常將控制器分成前饋控制和反饋控制兩部

分。其中前饋控制按照期望輸出的要求產(chǎn)生控制信號(hào)，便于獲得良好的動(dòng)態(tài)響應(yīng)或針對(duì)擾動(dòng)產(chǎn)生合適的補(bǔ)償信號(hào)，用于良好的跟蹤和較強(qiáng)的抑制干擾。反饋控制器是根據(jù)期望輸出

與實(shí)際輸出之間的差值產(chǎn)生控制信號(hào)，兩者共同作用于被控對(duì)象。前饋控制器作參考模型使用，在經(jīng)過預(yù)處理后，能達(dá)到預(yù)期的動(dòng)態(tài)響應(yīng)。反饋控制器的參數(shù)整定依賴于期望輸出與實(shí)際輸出之差。因此模型參考自適應(yīng)系統(tǒng)的控制策略是：由

于實(shí)際輸出與期望輸出有差別，通過反饋控制的反饋調(diào)節(jié)，在參考模型的影響下，使實(shí)際輸出不斷地逼近期望輸出，逼近的方法采用梯度下降法。

梯度下降法雖然能夠調(diào)整控制器的參數(shù)，但卻不能確切地保證系統(tǒng)穩(wěn)定，因此在20世紀(jì)70年代又有人提出基于李雅普諾夫(Lyapunov)穩(wěn)定性和基于波波夫(Popov)超穩(wěn)定性的設(shè)計(jì)方法。模型參考自適應(yīng)系統(tǒng)最初是為線性系統(tǒng)或可線性化的非線性系統(tǒng)設(shè)計(jì)的，當(dāng)被控對(duì)象為非線性對(duì)象時(shí)，人們自然而然聯(lián)想到參考模型使用神經(jīng)網(wǎng)絡(luò)，神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器

應(yīng)運(yùn)而生，它是神經(jīng)網(wǎng)絡(luò)與自適應(yīng)控制方式結(jié)合的產(chǎn)物。

神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器的設(shè)計(jì)可以采用兩種方法：一種是直接法，要點(diǎn)是按照期望輸出與實(shí)際輸出之差去調(diào)節(jié)控制器參數(shù)，直接進(jìn)行控制；另一種是間接法，要點(diǎn)是通過系統(tǒng)

辨識(shí)獲得被控對(duì)象的數(shù)學(xué)模型，再按照事先提出的控制設(shè)計(jì)指標(biāo)設(shè)計(jì)控制器參數(shù)。神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器同樣需要學(xué)習(xí)訓(xùn)練。直接法設(shè)計(jì)的訓(xùn)練過程被稱為特定學(xué)習(xí)，這是一種邊控制邊學(xué)習(xí)的方法，把控制器設(shè)計(jì)與控制滿意程度緊密結(jié)合，神經(jīng)網(wǎng)絡(luò)加權(quán)值的調(diào)整依靠期望輸出與實(shí)際輸出之差來完成。這種訓(xùn)練有助于自動(dòng)適應(yīng)對(duì)象與環(huán)境的變化。

間接設(shè)計(jì)的訓(xùn)練過程被稱為泛化學(xué)習(xí)，這是一種利用被控對(duì)象的輸入輸出數(shù)據(jù)樣本對(duì)進(jìn)行學(xué)習(xí)的方法，學(xué)習(xí)被控對(duì)象的逆模型或預(yù)報(bào)模型。控制器的訓(xùn)練與控制分開進(jìn)行。訓(xùn)練階段的訓(xùn)練方法是：隨機(jī)產(chǎn)生一個(gè)控制信號(hào)加在被控制對(duì)象上，被控對(duì)象必然會(huì)產(chǎn)生一個(gè)輸出信號(hào)，利用此控制信號(hào)和此輸出信號(hào)來訓(xùn)練控制器，最終使控制器產(chǎn)生合適的控制

信號(hào)讓被控對(duì)象的輸出信號(hào)逼近期望輸出。間接設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器存在一個(gè)問題：由于訓(xùn)練階段不能保證被控對(duì)象的輸出在允許的工作范圍內(nèi)，那么在控制階段，被控對(duì)象的輸出就有可能超出允許的工作范圍，從而使控制出現(xiàn)失誤。產(chǎn)生這種失誤的原因只有一個(gè)，就是被控對(duì)象是動(dòng)態(tài)因果系統(tǒng)導(dǎo)致神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器難于等同它的逆系統(tǒng)。為了避免這種失誤，通常設(shè)定被控對(duì)象的動(dòng)態(tài)特性固定不變。如果被控對(duì)象的動(dòng)態(tài)特性實(shí)際上變化明顯，那么就不適合使用這種設(shè)計(jì)方法。

神經(jīng)網(wǎng)絡(luò)在模型參考自適應(yīng)系統(tǒng)中作辨識(shí)器和控制器使用，相應(yīng)地，按控制器的設(shè)計(jì)方法，也可以分成兩種：一種是直接調(diào)整加權(quán)值的直接設(shè)計(jì)模型參考自適應(yīng)系統(tǒng)；另一種是在線辨識(shí)間接設(shè)計(jì)控制器的間接設(shè)計(jì)模型參考自適應(yīng)系統(tǒng)。6.5.2間接設(shè)計(jì)模型參考自適應(yīng)神經(jīng)控制系統(tǒng)

間接設(shè)計(jì)模型參考自適應(yīng)神經(jīng)系統(tǒng)由參考模型、神經(jīng)網(wǎng)絡(luò)辨識(shí)器、神經(jīng)網(wǎng)絡(luò)控制器、非線性被控對(duì)象等部件組成，其原理框圖如圖6-12所示。在這種系統(tǒng)中，使用了兩個(gè)神經(jīng)網(wǎng)絡(luò)，一個(gè)用做辨識(shí)器，一個(gè)用做控制器。

神經(jīng)網(wǎng)絡(luò)辨識(shí)器的主要功能是利用截至目前為止的所有輸入模式樣本預(yù)報(bào)下一步對(duì)象的輸出y(k+1)，預(yù)報(bào)的準(zhǔn)確程度由偏差e(k+1)來度量：

e(k+1)=y(k+1)－ys(k+1)圖6-12間接設(shè)計(jì)模型參考自適應(yīng)系統(tǒng)

1.逆模型設(shè)計(jì)

所謂逆模型參考自適應(yīng)的含義在于：系統(tǒng)在輸入控制信號(hào)u(k)的控制下，使得非線性被控對(duì)象的輸出y(k)與參考模型的輸出ys(k)之差限制在給定的范圍之內(nèi)，即式中，ε是一個(gè)事先隨機(jī)產(chǎn)生的小的正數(shù)。這時(shí)，被控對(duì)象與參數(shù)模型有相同的輸入模式樣本。在間接設(shè)計(jì)模型參考自適應(yīng)系統(tǒng)中，參考模型由神經(jīng)網(wǎng)絡(luò)生成。辨識(shí)選用二次指標(biāo)準(zhǔn)則：線性系統(tǒng)的控制器設(shè)計(jì)一般定義在李雅普諾夫(Lyapunov)穩(wěn)定性或波波夫(Popov)穩(wěn)定性層面上，為穩(wěn)定而設(shè)置的負(fù)反饋成為控制器的主要結(jié)構(gòu)。

用神經(jīng)網(wǎng)絡(luò)構(gòu)成的控制器采用逆模型的方式實(shí)現(xiàn)控制，可以分成兩種不同的情況：

第一種，顯式逆模型控制，當(dāng)神經(jīng)控制器成功描述出系統(tǒng)動(dòng)力學(xué)特征后，如果被控對(duì)象的輸入控制信號(hào)是涵蓋神經(jīng)網(wǎng)絡(luò)輸出yq(k+1)的顯式函數(shù)：

u(k)=f[y(k)，y(k－1),…,u(k－1),…,u(k－n),yq(k+1)]

則神經(jīng)控制器將直接參與系統(tǒng)的控制作用，完成神經(jīng)顯式逆模型控制。第二種，隱式逆模型控制，適用于系統(tǒng)輸入u(k)，不能用y(k)，y(k－1)，…，y(k－n)，u(k－1)，…等顯函數(shù)表示出來，它們之間的關(guān)系只能用隱函數(shù)表示。在這種情況下，控制器可以在辨識(shí)器的基礎(chǔ)上開展訓(xùn)練，訓(xùn)練結(jié)果只求顯式關(guān)系清楚?？刂破饔糜谟?xùn)練的性能指標(biāo)?。菏街?，e為神經(jīng)網(wǎng)絡(luò)控制器的輸入偏差信號(hào)；t是控制周期，表示神經(jīng)控制器的參數(shù)每隔t步調(diào)整一次。控制周期與辨識(shí)周期相比通常前者小、后者大，這種設(shè)置來自于一些傳統(tǒng)自適應(yīng)控制的經(jīng)驗(yàn)?？刂浦芷诙桃馕吨刂谱饔妙l繁，辨識(shí)作用相對(duì)延緩，這樣有利于接近被控對(duì)象的控制規(guī)律。但是，兩個(gè)周期都不宜取過大的值，不宜拉大控制周期與辨識(shí)周期之間的差距，否則就有可能因被控對(duì)象不理睬而失控，使輸出誤差愈來愈大。

現(xiàn)用實(shí)例說明神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)。設(shè)被控對(duì)象的真實(shí)模型為

y(k+1)=f［y(k)，y(k－1)］+g［u(k)］對(duì)g［u(k)］，可分成幾種不同的情況。

1)g［u(k)］=u(k)

辨識(shí)神經(jīng)網(wǎng)絡(luò)選用4層前向網(wǎng)絡(luò)，各層節(jié)點(diǎn)數(shù)為2×20×10×1，f［·］為被辨識(shí)對(duì)象，辨識(shí)模型為

yq(k+1)=N1［y(k)，y(k－1)］+u(k)

式中，N1［·］是神經(jīng)網(wǎng)絡(luò)辨識(shí)器的輸入。為了保證系統(tǒng)輸入輸出有界，辨識(shí)所用的信號(hào)是均勻分布在［－2，2］區(qū)間上的輸入白噪聲序列。同時(shí)，為保證系統(tǒng)的穩(wěn)定性，選擇參考模型為低階線性模型，比如形式為

ym(k+1)=0.6ym(k)+0.2ym(k－1)+r(k)其中，r(k)是參考模型的參考輸入量，控制輸入u(k)能表示成y(k)，y(k+1)的顯函數(shù)，神經(jīng)網(wǎng)絡(luò)控制器就能在神經(jīng)網(wǎng)絡(luò)辨識(shí)器的基礎(chǔ)上直接復(fù)制，相應(yīng)的穩(wěn)定性要求是

u(k)=－N1［y(k)，y(k－1)］+0.6y(k)+0.2y(k－1)+r(k)

對(duì)應(yīng)閉環(huán)系統(tǒng)的誤差方程為

e(k+1)=0.6e(k)+0.2e(k)

由于，則系統(tǒng)漸近穩(wěn)定。

2)g［u(k)］=u3(k)

當(dāng)設(shè)計(jì)前f［·］和g［·］都未知時(shí)，可取辨識(shí)模型為

yb(k+1)=N1［y(k)，y(k－1)］+Nb［u(k)］

理想控制信號(hào)選擇成

u(k)=g－1{－N[y(k)，y(k－1)]+0.6y(k)+0.2y(k－1)+r(k)}

神經(jīng)控制器的設(shè)計(jì)需要考慮y(k)，y(k－1)等狀態(tài)的影響，可選擇神經(jīng)網(wǎng)絡(luò)控制器的輸入信號(hào)為

u(k)=Nc{－Nf[y(k)，y(k－1)]+0.6y(k)+0.2y(k－1)+r(k)}

式中，Nf[·]是反饋網(wǎng)絡(luò)的函數(shù)傳遞關(guān)系，r(k)是一個(gè)網(wǎng)絡(luò)值，大小為選擇r(k)的目的是為了滿足

N1［Nc(r)］=r

的需要，這樣可實(shí)現(xiàn)g［·］的近似逆。具體在進(jìn)行訓(xùn)練時(shí)，選擇u(k)為位于［－4，4］之間均勻分布的白噪聲，好處是神經(jīng)辨識(shí)器與神經(jīng)反饋網(wǎng)絡(luò)起作用的范圍延伸到非線性范圍，顯得更加廣泛，這時(shí)的辨識(shí)區(qū)間為［－2，2］。訓(xùn)練神經(jīng)控制器，做到Nb［Nc(r)］=r，網(wǎng)絡(luò)訓(xùn)練的方法既可以用常規(guī)BP算法，也可以用動(dòng)態(tài)BP算法。

2.逆模型不存在時(shí)的設(shè)計(jì)

前面介紹了逆模型存在時(shí)的設(shè)計(jì)過程，當(dāng)控制系統(tǒng)的逆模型不存在時(shí)，就不能使用上述方法。但可以把神經(jīng)網(wǎng)絡(luò)控制器的訓(xùn)練用兩個(gè)輸出信號(hào)之差來展開，設(shè)這個(gè)差值為e(t)，兩個(gè)輸出信號(hào)分別為系統(tǒng)辨識(shí)模型的輸出yb(t)和參考模型的輸出yc(t)：

e(t)=yb(t)－yc(t)

yb(t)既然是辨識(shí)模型的輸出,那它就不是被控對(duì)象的輸出y(t)。

有了誤差e(t)作導(dǎo)師信號(hào)進(jìn)行訓(xùn)練，還需要確定相應(yīng)的訓(xùn)練準(zhǔn)則，這里可選擇式中，ε是一個(gè)事先給定的任意小正數(shù)。

逆模型不存在時(shí)的控制系統(tǒng)結(jié)構(gòu)圖如圖6-13所示。

現(xiàn)舉例說明。設(shè)系統(tǒng)模型為

y(k+1)=f［y(k)］+g［u(k)］

f[u(k)]=[u(k)+1]u(k)[u(k)－1]設(shè)參考模型為

yc(k+1)=0.6y(k)+r(k)系統(tǒng)輸入為圖6-13逆模型不存在時(shí)的系統(tǒng)結(jié)構(gòu)圖因本例中的y[u(k)]不可逆，訓(xùn)練用動(dòng)態(tài)BP算法，取

a=0.25

神經(jīng)控制器選用4層2×20×20×1結(jié)構(gòu)，T=1，η=0.001，訓(xùn)練十萬步后參考模型的輸出yc將與網(wǎng)絡(luò)輸出yb達(dá)到一致。

a的作用是影響非線性范圍及訓(xùn)練時(shí)間，a越大，非線性范圍越大，訓(xùn)練時(shí)間將增加。在使用BP算法的過程中，為了加快訓(xùn)練速度，可以改用修正BP算法或用于辨識(shí)的非BP

算法。6.5.3直接設(shè)計(jì)模型參考自適應(yīng)神經(jīng)控制系統(tǒng)

直接設(shè)計(jì)模型參考自適應(yīng)系統(tǒng)是在加快學(xué)習(xí)速度的要求下引入的，這種自適應(yīng)方案可以省去“間接神經(jīng)網(wǎng)絡(luò)”，這樣就少訓(xùn)練一個(gè)網(wǎng)絡(luò)，節(jié)省一部分時(shí)間。需要說明的是：盡管少了一個(gè)神經(jīng)網(wǎng)絡(luò)，但并不表明這個(gè)網(wǎng)絡(luò)是多余的，而是在直接設(shè)計(jì)模型參考自適應(yīng)控制方案中，它用不需訓(xùn)練的功能電路代替。直接設(shè)計(jì)模型參考自適應(yīng)系統(tǒng)的基本結(jié)構(gòu)如圖6-14所示。

直接自適應(yīng)系統(tǒng)由神經(jīng)控制器、非線性被控對(duì)象、線性參考模型和線性增益控制器等幾部分組成，非線性被控對(duì)象的控制信號(hào)u(t)由三部分疊加而成：

u(t)=k1r(t)－kTxt(t)+un(t)圖6-14直接設(shè)計(jì)模型參考自適應(yīng)系統(tǒng)式中，k1是輸入增益矩陣，r(t)是系統(tǒng)的輸入，xp(t)是非線性被控對(duì)象的狀態(tài)矢量，k是線性參考模型的狀態(tài)反饋增益矩陣，un(t)是神經(jīng)控制器的輸出，且有

un(t)=f[tp(t)，xm(t)，r(t)]

式中，xm(t)是參考模型的狀態(tài)向量。神經(jīng)控制器的訓(xùn)練準(zhǔn)則為

式中，yp(k)和y1(k)分別是非線性被控對(duì)象和線性參考模型的輸出。使用的算法是基于梯度下降的BP算法。在利用誤差e(k)對(duì)神經(jīng)控制器的連接權(quán)進(jìn)行訓(xùn)練時(shí)，需要使用修正

值，以滿足誤差在通道上傳遞的需要。如果被控對(duì)象的Jacobian陣已知，選擇的連接權(quán)修正公式就為式中，η(k)是步長(zhǎng)，其大小可根據(jù)梯度矢量的大小調(diào)整，調(diào)整的方向選擇為加快收斂速度的方向。如果Jacobian陣未知，可選擇如下兩種方法修正連接權(quán)：一種是利用Jacobian陣的符號(hào)取代Jacobian陣，進(jìn)行連接權(quán)系數(shù)反向傳播修正；另一種是增加一個(gè)神經(jīng)網(wǎng)絡(luò)模擬被控

對(duì)象，相當(dāng)于改用間接神經(jīng)網(wǎng)絡(luò)參考模型自適應(yīng)調(diào)整，使用的神經(jīng)網(wǎng)絡(luò)僅僅當(dāng)作一個(gè)信息通道，在這個(gè)通道上，誤差信號(hào)由輸出端反傳到神經(jīng)控制器。Jacobian陣雖然未知，但卻

可以通過在線辨識(shí)獲得。辨識(shí)過程如下：

設(shè)非線性系統(tǒng)的描述方程為yp(k+1)=f[yp(k),…,yp(k－n+1),u(k),…,u(k－m+1)]辨識(shí)用神經(jīng)網(wǎng)絡(luò)為三層感知器，結(jié)構(gòu)為(n+m)×n×1，又設(shè)輸入層輸出層作用函數(shù)為線性函數(shù)，隱層作用函數(shù)取為雙曲正切函數(shù)tanhx，相應(yīng)神經(jīng)網(wǎng)絡(luò)輸出為式中，fq(k)就是一個(gè)雙曲正切函數(shù)：fq(k)中的各系數(shù)a、b均通過BP算法確定。由此得神經(jīng)網(wǎng)絡(luò)輸出的增量為

式中，被控對(duì)象的Jacobian陣瞬時(shí)值可以求得使用S(k)估算對(duì)象的Jacobian陣時(shí)，雖然存在不精確的地方，但能反映符號(hào)與幅值的變化。要想精確估計(jì)，可使用如下跟蹤模型：其中，S(k+1)是反映靈敏度的函數(shù)，αi、βj的計(jì)算公式不變?，F(xiàn)舉一個(gè)連續(xù)攪拌反應(yīng)釜的實(shí)例說明。當(dāng)采用直接設(shè)計(jì)模型參考自適應(yīng)系統(tǒng)控制方案時(shí)，連續(xù)時(shí)間非線性微分方程組可表示反應(yīng)釜的特性：式中，q是過程流量，Ca(t)是平衡濃度比，V是反應(yīng)釜體積，T0是入口溫度，T是加入的冷卻劑溫度。反應(yīng)釜的工作原理是：兩種化學(xué)性質(zhì)不同的物質(zhì)在釜內(nèi)發(fā)生化學(xué)反應(yīng)，生成濃度為Ca(t)的化合物，混合溫度設(shè)為T(t)。如果化學(xué)反應(yīng)是放熱反應(yīng)，相應(yīng)反應(yīng)速度必然減緩，為此應(yīng)加入冷卻劑降低溫度、加快反應(yīng)速度，允許加入的冷卻劑溫度發(fā)生變化，流量用q(t)表示。反應(yīng)釜系統(tǒng)內(nèi)還有一些物理參數(shù)，其常見值如表6-1所示。由于化學(xué)反應(yīng)過程不是線性過程，非線性狀態(tài)較為明顯，這時(shí)如果控制器選用線性的PID調(diào)節(jié)器，明顯不能滿足控制要求，研究結(jié)果表明，非線性突出表現(xiàn)在設(shè)定點(diǎn)附近阻尼比變化顯著，振蕩激烈。

直接式反應(yīng)釜自適應(yīng)系統(tǒng)結(jié)構(gòu)如圖6-15所示。

考慮到在控制方案中使用了線性參考模型，選擇的是線性比例調(diào)節(jié)，在神經(jīng)控制器剛進(jìn)入使用的初級(jí)階段，仍然有比較好的控制效果。選擇的控制規(guī)律用

q(t)=k［Cs(t)－Ca(t)］+f［Ca(t)，T(t)，Cs

(t)］+qr圖6-15直接反應(yīng)釜自適應(yīng)系統(tǒng)結(jié)構(gòu)式中，k是比例系數(shù)，Cs是給定值，Ca(t)是網(wǎng)絡(luò)輸出值，qr是穩(wěn)定狀態(tài)下穩(wěn)態(tài)濃度對(duì)應(yīng)的控制輸入，f［·］是3×40×1的三層BP網(wǎng)絡(luò)功能函數(shù)。

線性參考模型選用二階標(biāo)準(zhǔn)模型,角頻率ω=2.7rad/min,阻尼比ξ=1.0，傳遞函數(shù)為訓(xùn)練的目標(biāo)函數(shù)為建模所用神經(jīng)網(wǎng)絡(luò)為6×10×1，網(wǎng)絡(luò)輸出方程為

Ca(k+1)=f[Ca(k),Ca(k－1),…,q(k),g(k－1)，…]

反應(yīng)釜系統(tǒng)神經(jīng)控制器用估計(jì)Jacobian陣曲線，如圖6-16所示。由圖可見，在神經(jīng)網(wǎng)絡(luò)作用下，系統(tǒng)的高度非線性能很好地跟蹤線性參考模型。圖6-17是參考模型輸出與實(shí)際輸出相比較的情況。這時(shí)，設(shè)定點(diǎn)變化范圍為0.08～0.12mol／L。圖6-16神經(jīng)網(wǎng)絡(luò)估計(jì)Jacobian陣曲線圖6-17CSTR在NNMRAC下的響應(yīng)

6.6預(yù)測(cè)神經(jīng)控制系統(tǒng)

預(yù)測(cè)神經(jīng)控制系統(tǒng)的基本結(jié)構(gòu)如圖6-18所示。

預(yù)測(cè)神經(jīng)系統(tǒng)由被控對(duì)象、控制器、預(yù)測(cè)器、濾波器等部件組成，系統(tǒng)的基本結(jié)構(gòu)仍然是閉環(huán)負(fù)反饋調(diào)節(jié)結(jié)構(gòu)。

被控對(duì)象既可以是線性系統(tǒng)，也可以是非線性系統(tǒng)。線性系統(tǒng)的預(yù)測(cè)控制相對(duì)簡(jiǎn)單，已經(jīng)解決；非線性系統(tǒng)的預(yù)測(cè)控制還存在較多的困難。

控制器的功能針對(duì)不同的被控對(duì)象而異。對(duì)線性系統(tǒng)，它是一般的常規(guī)調(diào)節(jié)器，設(shè)置的目的是維護(hù)系統(tǒng)的穩(wěn)定；對(duì)非線性系統(tǒng)，它是一個(gè)優(yōu)化器，即實(shí)行最優(yōu)化控制。圖6-18預(yù)測(cè)神經(jīng)控制系統(tǒng)預(yù)測(cè)器用于提供輸出的預(yù)報(bào)值，它必須能夠模擬或描述被控對(duì)象的動(dòng)態(tài)行為。

濾波器是一個(gè)反饋部件，它把誤差信號(hào)

e1(t)=y(t)－x(t)

經(jīng)濾波后作負(fù)反饋信號(hào)。6.6.1預(yù)測(cè)控制的基本特征

預(yù)測(cè)控制是一種基于模型的控制方式，最早源于20世紀(jì)70年代末期，是一種較為新型的計(jì)算機(jī)控制算法。這種算法有三個(gè)特征：

建立預(yù)測(cè)模型、實(shí)現(xiàn)滾動(dòng)優(yōu)化和反饋校正預(yù)測(cè)。

1.建立預(yù)測(cè)模型

在系統(tǒng)中建立預(yù)測(cè)模型，就是要較為精確地描述系統(tǒng)的動(dòng)態(tài)過程，按照系統(tǒng)的輸入／輸出當(dāng)前值，預(yù)測(cè)系統(tǒng)的走向或輸出未來值。

對(duì)系統(tǒng)的輸出進(jìn)行預(yù)測(cè)，首要條件是知道系統(tǒng)的結(jié)構(gòu)及其數(shù)學(xué)描述。對(duì)于線性系統(tǒng)，可以充分利用其數(shù)學(xué)模型和狀態(tài)空間模型，利用系統(tǒng)的階躍響應(yīng)和脈沖響應(yīng)，使用疊加原理等手段，預(yù)測(cè)系統(tǒng)的未來輸出。

對(duì)于非線性系統(tǒng)，也必須充分利用其數(shù)學(xué)模型及其描述，利用對(duì)非線性方程的求解來推斷預(yù)測(cè)未來。由于非線性系統(tǒng)的數(shù)學(xué)模型難于確定，非線性系統(tǒng)的結(jié)構(gòu)經(jīng)常不能用常規(guī)方法描述，導(dǎo)致非線性系統(tǒng)的預(yù)測(cè)困難較大。目前，解決非線性系統(tǒng)預(yù)測(cè)控制的方法有兩個(gè)：一個(gè)是在允許的誤差范圍內(nèi)將非線性系統(tǒng)線性化；另一個(gè)是使用神經(jīng)網(wǎng)絡(luò)作預(yù)測(cè)器，因?yàn)樯窠?jīng)網(wǎng)絡(luò)通過辨識(shí)手段，能很好復(fù)現(xiàn)非線性過程。神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器的功能是在控制信號(hào)u(t)和系統(tǒng)輸出y(t)的作用下，為系統(tǒng)提供輸出預(yù)測(cè)值x(t+j／t)(j=N，N+1,…，P)，其中N為最小輸出預(yù)測(cè)區(qū)間，P為最大輸出預(yù)測(cè)區(qū)間。

2.實(shí)現(xiàn)滾動(dòng)優(yōu)化

實(shí)現(xiàn)滾動(dòng)優(yōu)化必須要求選擇性能指標(biāo)函數(shù)。在神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)控制中選擇的性能指標(biāo)函數(shù)為式中，ed(t)是未來誤差，其值等于未來時(shí)刻的期望值yd(t)與未來時(shí)刻的預(yù)測(cè)值x(t)之差：

ed(t+j)=yd(t+j)－y(t+j)M是控制范圍，又稱為控制長(zhǎng)度，表示未來控制量的考慮范圍；Δu是控制量u(t)的變化值；r是加權(quán)系數(shù)，表示控制量變化率Δu的重要程度。上式中未來時(shí)刻的預(yù)測(cè)值x(t+j)是由神經(jīng)預(yù)測(cè)器提供的。如果神經(jīng)預(yù)測(cè)器提供的預(yù)測(cè)值有足夠的精度，那么只需要未來時(shí)刻期望值yd(t)為已知，從指標(biāo)函數(shù)J(N，P，M)就能獲得未來控制量Δu(t)。

對(duì)于控制長(zhǎng)度M，在每個(gè)采樣點(diǎn)，能算出未來范圍的控制量所具有的時(shí)間長(zhǎng)度。

所謂滾動(dòng)優(yōu)化是指：每一步的控制只能算出當(dāng)前的控制量u(t)，控制過程是一步一步向前推進(jìn)的過程。在下一t時(shí)刻，重新計(jì)算出來的控制量必然不同于此前的控制量，因

此必須重新優(yōu)化。

3.反饋校正預(yù)測(cè)

引進(jìn)負(fù)反饋的目的是為了提高預(yù)測(cè)的穩(wěn)定性，反饋信號(hào)為被控對(duì)象的輸出y(t)與神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)量輸出x(t)之差：

e1(t)=y(t)－x(t)

式中，y(t)和x(t)都是當(dāng)前實(shí)際輸出值。6.6.2神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)算法

第一步，獲取未來期望輸出序列值yd(t+j)(j=N，N+1，…，P)；

第二步，從神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器獲取預(yù)測(cè)輸出x(t+j/t)；

第三步，以上一步的誤差為基礎(chǔ)，修正可能的誤差:第四步，計(jì)算未來誤差:第五步，將性能指標(biāo)極小化，獲得控制的最優(yōu)序列u(t+j)(j=0，1，2，…，M);第六步，將第一控制量u(t)作用于系統(tǒng)，返回第一步。6.6.3單神經(jīng)元預(yù)測(cè)器

能夠作預(yù)測(cè)器的神經(jīng)網(wǎng)絡(luò)有單神經(jīng)元、多層前向網(wǎng)絡(luò)、

輻射基函數(shù)網(wǎng)絡(luò)和Hopfield神經(jīng)網(wǎng)絡(luò)等。

利用自適應(yīng)單神經(jīng)元APE能夠?qū)ο到y(tǒng)的輸出完成預(yù)測(cè)，連接權(quán)調(diào)整的公式為

wi(t+1)=wi(t)+λie(t)pi(t)

式中，λi是學(xué)習(xí)步長(zhǎng)；wi(t)是t時(shí)刻連接權(quán)；e(t)是t+1時(shí)刻實(shí)際輸出值與預(yù)測(cè)值之差：

e(t)=y(t+1)－ym1(t+1)

式中，y(t+1)和ym1(t+1)分別是t+1時(shí)刻預(yù)測(cè)器的期望值和預(yù)測(cè)值。其中預(yù)測(cè)值可表示成

式中，k是連接權(quán)加權(quán)系數(shù)；pi(t)是第i次預(yù)測(cè)長(zhǎng)度；n是次數(shù)，設(shè)n=3，取三個(gè)狀態(tài)x1(t)、x2(t)、x3(t)分別為

p1(t)=ym1(t)

p2(t)=u(t)

p3(t)=1

在預(yù)測(cè)控制算法中常采取單值預(yù)測(cè)控制，以減少計(jì)算量并節(jié)省內(nèi)存容量。單值預(yù)測(cè)控制只預(yù)測(cè)以后的某一步輸出，例如第i步輸出yi(t+j)，此時(shí)能做出的輸出值預(yù)報(bào)為

Yd(t+j)=ym(t+j)+［y(t)－ym(t)］上式中j為預(yù)報(bào)的步長(zhǎng)，y(t)是系統(tǒng)的實(shí)際輸出，[y(t)－ym(t)]是對(duì)輸出預(yù)測(cè)值的反饋校正信號(hào)。

考慮到預(yù)測(cè)控制僅用當(dāng)前步作控制用，預(yù)測(cè)步數(shù)與控制步數(shù)之差決定了控制效果，因而控制步數(shù)可以選擇為1，表示成

u(t+i)=u(t)

式中，i的取值為［1，j－1］。第j步輸出為

ym(t+j)=w1ym(t)+w2u(t)+w3

式中，w1、w2、w3反映了各項(xiàng)的權(quán)重，它們的大小為

w1=w1(t+j－1)w2(t+j－2)…w1(t+1)w1(t)

w2=w1(t－1)w2(t)+w1(t+1)w2(t+1)+…

+w1(t+j－1)w2(t+j－2)+w2(t+j－1)

w3=w1(t+1)w3(t)+w1(t+2)w3(t+1)+…

+w1(t+j－1)w3(t+j－2)+w3(t+j－1)

若控制作用求解前，單神經(jīng)元已訓(xùn)練結(jié)束，進(jìn)入穩(wěn)態(tài)，則有

wi(t)=wi

i=1，2，3

有ym(t+j)=(w1*)pym(t)+[(j－1)w*1+1]w*2u(t)+[(j－1)w*1+1]

w*3控制器的設(shè)計(jì)考慮如下：用Sp表示期望設(shè)定值，跟蹤的參考軌跡采用指數(shù)型柔化形式：

yr(t+j)=ay(t)+(1－a)Sp

式中，yr(t+j)為在t時(shí)刻計(jì)算的t+j時(shí)刻的輸出參考軌跡；a是柔化系數(shù)，一般是一個(gè)小于1的正數(shù)。

當(dāng)預(yù)測(cè)控制器用單神經(jīng)元構(gòu)成時(shí)，其作用函數(shù)選用S型函數(shù)，學(xué)習(xí)算法的優(yōu)化目標(biāo)函數(shù)選擇為輸入輸出關(guān)系式為式中，f(·)為K為神經(jīng)元比例系數(shù)。連接權(quán)修正公式為

vi(t+1)=vi(t)+ηi(yr(t+j)－yc(t+j))xi(t)式中，ηi是學(xué)習(xí)步長(zhǎng)；u(t)是控制器輸出且有u(t)∈[－k，k]；xi(t)是輸入狀態(tài)，分別有

x1(t)=y1(t+j)－yc(t+j)

x2(t)=x1(t)－x1(t－1)

x3(t)=yr(t+j)將wi(t)=w*i用于單神經(jīng)元的學(xué)習(xí)算法時(shí)，設(shè)目標(biāo)函數(shù)為能讓Em達(dá)到極小，因?yàn)楸臼降葍r(jià)于連接權(quán)的增量

Δwi(t)=wi(t+1)－wi(t)=λie(t)Pi(t)可見wi(t)的修正方向沿Em關(guān)于wi(t)的負(fù)梯度進(jìn)行，顯然當(dāng)wi(t)=w*i時(shí)，Em能達(dá)到極小，由此，

minEm=0

按照同樣的證明方法，能夠證明優(yōu)化目標(biāo)函數(shù)選擇為時(shí)，只要設(shè)vi(t)=v*i，也能使Ec取極小值，且有

minEc=0單神經(jīng)元預(yù)測(cè)控制器所采用的算法中，其收斂性與系統(tǒng)的穩(wěn)定性是等價(jià)的，只要學(xué)習(xí)步長(zhǎng)小，誤差就能沿梯度方向下降，最終趨向極小值0，從而保證了系統(tǒng)的穩(wěn)定。6.6.4多層前向網(wǎng)絡(luò)預(yù)測(cè)器

使用多層前向網(wǎng)絡(luò)組成預(yù)測(cè)器時(shí)，通常利用階躍響應(yīng)數(shù)據(jù)，采用動(dòng)態(tài)矩陣控制方法進(jìn)行。本節(jié)介紹使用三層前向網(wǎng)絡(luò)預(yù)測(cè)未來時(shí)刻的輸出。

設(shè)系統(tǒng)階躍預(yù)測(cè)模型為{ai}(i=1，2，…)，則線性系統(tǒng)預(yù)測(cè)控制器為

ΔUM(k)=(ATQA+R)－1ATQ［Yd(t)－YP0(t)］

式中，Q，R是性能指標(biāo)

J=‖Yd(t)－YPM(t)‖Q+‖ΔUM‖R

的加權(quán)矩陣；A是動(dòng)態(tài)矩陣，元素為ai:Yd(t)是跟蹤期望矢量；YP0(t)是零輸入預(yù)測(cè)矢量；YPM(t)是跟蹤預(yù)測(cè)矢量；P和M分別是預(yù)測(cè)長(zhǎng)度和控制長(zhǎng)度。設(shè)三層前向網(wǎng)絡(luò)的輸入層有M個(gè)神經(jīng)元，輸出層有P個(gè)神經(jīng)元，隱層有NH個(gè)神經(jīng)元。為方便計(jì)，常選擇NH≥M。網(wǎng)絡(luò)輸入矢量設(shè)為

ΔUM(t)=[Δu(t，t)，Δu(t+1，t)，…，Δu(t+M－1，t)]T設(shè)控制器為

F=(ATQA+R)－1ATQ其輸入采用誤差矢量

E(t)=Yd(t)－YP0(t)

輸出就是控制增量矢量ΔUM(t)。ΔUM(t)用來改善控制性能，方法是改變u(t)，修正u(t)成為前M個(gè)時(shí)刻u(t，t－i+1)的信息加權(quán)平均值，用式子表示成式中，di為加權(quán)系數(shù)，通常取值為

d1=1＞d2＞d3＞…＞dM改進(jìn)BP算法的方法有以下幾點(diǎn)：

(1)先對(duì)BP網(wǎng)絡(luò)離線訓(xùn)練再投入系統(tǒng)運(yùn)行，減少在線學(xué)習(xí)機(jī)會(huì)。

(2)在控制算法中引入中斷，用中斷服務(wù)程序完成預(yù)測(cè)控制，BP算法放入主程序。這樣僅需調(diào)整中斷服務(wù)程序，主程序無需過多修改。

(3)在多個(gè)采樣周期內(nèi)完成一次學(xué)習(xí)，學(xué)習(xí)結(jié)束后再調(diào)整加權(quán)值。

舉例說明，設(shè)

y(t)=1.2y(t－1)－0.36y(t－2)+0.1u(t)+0.2u(t－1)選P=10，M=5，N=1，Q=1，R=0.11，校正系數(shù)hi=1(i=1～10)，di=e1－i(i=1～5)。

由此預(yù)測(cè)的系統(tǒng)響應(yīng)如圖6-19所示，圖中曲線1為僅加u(t)的原始算法，曲線2為改進(jìn)算法。圖6-19預(yù)測(cè)的系統(tǒng)響應(yīng)6.6.5輻射基函數(shù)網(wǎng)絡(luò)預(yù)測(cè)器

輻射基函數(shù)網(wǎng)絡(luò)簡(jiǎn)稱RBP網(wǎng)絡(luò)。與BP網(wǎng)絡(luò)一樣，RBP網(wǎng)絡(luò)也是一種多層前向網(wǎng)絡(luò)。與BP網(wǎng)絡(luò)不同的是，RBP采用的作用函數(shù)是輻射基函數(shù)，其特點(diǎn)是輸出對(duì)參數(shù)存在局部線性，因此網(wǎng)絡(luò)訓(xùn)練優(yōu)化可以避開非線性，不存在局部極小，學(xué)習(xí)速度遠(yuǎn)快于BP算法。

RBP網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)能在訓(xùn)練過程中確定。

設(shè)網(wǎng)絡(luò)的輸入有n個(gè)，輸出有m個(gè)，能實(shí)現(xiàn)的映射為式中，Φ(·)為輻射基函數(shù)；‖·‖為歐氏范數(shù)；X∈Rn；

Λ0∈Rm，為常偏置矢量；Λj∈Rm(j=1,2,…,M);Cj∈Rn(j=1,2，…，M)，為輻射基函數(shù)中心；M為選定的中心個(gè)數(shù)。

令

Λ=［λmj］T

j=0，1，2，…，M

則用三層網(wǎng)絡(luò)能實(shí)現(xiàn)f1(x)，輸入層、輸出層的作用函數(shù)選用線性函數(shù)，隱層作用函數(shù)選用

Φ(v)=v2logvRBP的連接權(quán)在線調(diào)節(jié)用最小二乘形式：式中，d(t)為期望輸出，Qi為參數(shù)，Pi(t)為回歸因子，e(t)為誤差。如果e(t)和Pi(t)不相關(guān)，則可用標(biāo)準(zhǔn)RLS算法在線調(diào)整神經(jīng)網(wǎng)絡(luò)的連接權(quán)。RLS算法為：

λ(t+1)=λ(t)+Δλ(t)使用PID形式的修正式以提高算法收斂性：式中，KP為比例系數(shù)，KI為積分系數(shù)，KD為微分系數(shù)。6.6.6Hopfield網(wǎng)絡(luò)預(yù)測(cè)器

考慮被控對(duì)象為SISO線性系統(tǒng)，脈沖響應(yīng)為{hi}，基于脈沖響應(yīng)的數(shù)學(xué)模型為

ym(t+1)=g1u(t)+g2u(t－1)+…+gNu(t－N+1)

=Gm(Z－1)u(t)

相應(yīng)算法如下:基于Gm(Z)的多步輸出預(yù)測(cè)為

yp(t+j)=ym(t+j)+hje(t)

式中，{yp(t)}是預(yù)測(cè)輸出序列；hj是誤差修正系數(shù)；e(t)=y(t)－ym(t)，是預(yù)測(cè)誤差；j=1，2，…，P；P是預(yù)測(cè)長(zhǎng)度。性能指標(biāo)函數(shù)取為式中，M為控制時(shí)域長(zhǎng)度；λj為加權(quán)系數(shù)；yr(t+j)為輸入?yún)⒖夹盘?hào)；N為模型長(zhǎng)度，常取P=M=N。將yp(t+j)表達(dá)式代入到J中，整理可得

J=J1+J2+J3+J4+J5+J6+J7式中，其中，xij，wij，mi，qi，ri，y(t+i)，λ均為中間變量。在t時(shí)刻，J2，J5，J6三項(xiàng)均為確定項(xiàng)。因而使J為最小等價(jià)于以下式為最?。篐opfield網(wǎng)絡(luò)的計(jì)算能量函數(shù)為對(duì)比J和E的表達(dá)式，可知u(t+i－1)與第i個(gè)神經(jīng)元的輸出vi相對(duì)應(yīng)。Tij和Ii分別是加權(quán)值及偏流，它們分別為

其中，i=1，2，…，N；當(dāng)i=N時(shí)，mi=0。

Hopfield網(wǎng)絡(luò)可由選擇加權(quán)值Tij和偏置Ii來實(shí)現(xiàn)，這時(shí)它的輸入偏置是系統(tǒng)輸出預(yù)測(cè)值yi(t+i)的濾波值，輸出是控制量u(t+i－1)，其中i=1，2，…，N。以線性系統(tǒng)為例，系統(tǒng)為

(1+0.5z－1)y(t)=(0.5+0.2z－1)u(t－2)+ξ(t)使用上述方法構(gòu)成控制器，取λ=0.5，hi=1，y(t)是輻值為1的方波，ξ(t)是方差0.001的隨機(jī)白噪聲，仿真結(jié)果令人滿意。

6.7自校正神經(jīng)控制系統(tǒng)

自校正控制(Self-TuningControl)簡(jiǎn)稱STC，主要用在兩種場(chǎng)合：

(1)被控對(duì)象是線性系統(tǒng)但不確定，且存在隨機(jī)干擾噪聲；

(2)被控對(duì)象是非線性系統(tǒng)。6.7.1自校正神經(jīng)控制系統(tǒng)的基本結(jié)構(gòu)

自校正控制系統(tǒng)有兩種基本結(jié)構(gòu)：直接型和間接型。

1.直接型自校正控制(DSTC)

DSTC是一種開環(huán)控制，其結(jié)構(gòu)如圖6-20所示。

神經(jīng)控制器位于前饋通道上，設(shè)被控對(duì)象的傳遞函數(shù)為p(z)，神經(jīng)控制的功能是實(shí)現(xiàn)構(gòu)成被控對(duì)象的逆模型。這種方式要求神經(jīng)控制器能在線調(diào)整，因此收斂速度較快的一些神經(jīng)網(wǎng)絡(luò)才有資格作神經(jīng)控制器。

被控對(duì)象既可以是線性結(jié)構(gòu)，也允許非線性結(jié)構(gòu)，但是一定要求其動(dòng)態(tài)可逆，不可逆的對(duì)象不適于使用DSTC。圖6-20直接型自校正控制結(jié)構(gòu)圖神經(jīng)逆模型辨識(shí)器的功能是實(shí)現(xiàn)被控對(duì)象p(z)的d階逆模型(設(shè)被控對(duì)象是一種非線性系統(tǒng)，有d≥1階時(shí)延且可逆)。在一般的意義上，神經(jīng)逆模型辨識(shí)器與神經(jīng)控制器具有相同的結(jié)構(gòu)與學(xué)習(xí)算法，逆模型的精確程度直接決定了系統(tǒng)給定值r制約系統(tǒng)輸出值y的精度。

控制信號(hào)與辨識(shí)器輸出之差成為控制器及辨識(shí)器的訓(xùn)練信號(hào)。

由于使用開環(huán)，系統(tǒng)不能有效制止或排除干擾信號(hào)。

2.間接型自校正控制(ISTC)

ISTC是一種閉環(huán)控制，其結(jié)構(gòu)如圖6-21所示。

間接自校正控制經(jīng)常簡(jiǎn)稱為自校正控制，這是因?yàn)樵谧孕Ｕ刂浦谢旧喜皇褂瞄_環(huán)控制，僅使用閉環(huán)控制。

從結(jié)構(gòu)上看，ISTC有三個(gè)特征：

(1)具有負(fù)反饋調(diào)節(jié)的所有系統(tǒng)特征，包括控制器參數(shù)的設(shè)定及穩(wěn)定性判斷。

(2)在結(jié)構(gòu)上存在兩個(gè)反饋回路。一個(gè)是系統(tǒng)輸出y的反饋，神經(jīng)控制器的偏差輸入e(t)為

e(t)=r(t)－y(t)圖6-21間接型自校正控制結(jié)構(gòu)圖另一個(gè)是控制器、辨識(shí)器的反饋?？刂破鞯墓δ苁菍?shí)現(xiàn)參數(shù)的自動(dòng)整定，辨識(shí)器的功能是將被控對(duì)象的參數(shù)進(jìn)行在線估計(jì)。通過辨識(shí)與控制器設(shè)計(jì)，可以獲得控制器的參數(shù)。

(3)通過辨識(shí)器對(duì)被控對(duì)象的參數(shù)在線估計(jì)，以及控制器對(duì)系統(tǒng)參數(shù)的自動(dòng)整定，實(shí)現(xiàn)自適應(yīng)控制。

自校正控制能夠?qū)崿F(xiàn)的關(guān)鍵問題是如何在線設(shè)計(jì)辨識(shí)器與控制器。6.7.2神經(jīng)自校正控制算法

現(xiàn)考慮在工程上常見的一類SISO仿射非線性離散系統(tǒng)作為被控對(duì)象：

y(k+1)=f0(·)+g0(·)u(k)

式中，

f0(·)=f[y(k)，y(k－1)，…，y(k－n+1)]

g0(·)=g[u(k－d)，…，u(k－d－m+1)]

且m≤n，在不包括原點(diǎn)的區(qū)域中有界；u是被控對(duì)象的輸入；y是被控對(duì)象的輸出；f0(·)和g0(·)均是非零光滑函數(shù)；

d是系統(tǒng)的相對(duì)階次。

1.d=1時(shí)

當(dāng)設(shè)相對(duì)階次d=1時(shí)，控制器的控制算法為式中，r(k)是期望跟蹤的參數(shù)信號(hào)，即期望輸出。從上式可以得知，若f

(·)和g0(·)已知，則可計(jì)算出控制量u(k)；如果f0(·)和g0(·)未知，則需要兩個(gè)神經(jīng)網(wǎng)絡(luò)Nf(·)和Ng(·)分別逼近f0(·)和g0(·)：

Nf(·)→f0(·)

Ng(·)→g0(·)方法是通過辨識(shí)器在線訓(xùn)練實(shí)現(xiàn)。由此控制算法變?yōu)槭街?，Nf(·)和Ng(·)是兩個(gè)非線性動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)辨識(shí)器。

2.d＞1時(shí)

當(dāng)設(shè)相對(duì)階次d＞1時(shí)，控制器的控制算法初步選擇為但這種選擇存在兩個(gè)問題：

(1)控制量u(t)依賴系統(tǒng)未來的輸入和輸出，在具體操作中難于實(shí)現(xiàn)；

(2)采用對(duì)消的方法易使系統(tǒng)變得不穩(wěn)定。為解決這些問題，首先將系統(tǒng)的輸入／輸出形式

y(k+1)=f0(·)+g0(·)u(k)改變成狀態(tài)空間形式：

xn(k+1)=f0[x(k)]+g0[x(k)]xn+m+1(k)

然后借助“零動(dòng)態(tài)響應(yīng)”研究收斂性。

首先選擇狀態(tài)變量

xi(k)=y(k－n+i)i=1，2，…，n

xn+i(k)=u(k－m－d+i)i=1，2，…，m+d－1

得狀態(tài)空間式：

xi(k+1)=xi+1(k)i=1，2，…，n－1

xn(k+1)=f0[x(k)]+g0[x(k)]xn+m+1(k)

xn+i(k+1)=xn+i+1(k)i=1，2，…，m+d－2

xn+m+d－1(k)=u(k)

y(k)=xm(k)當(dāng)d=1時(shí)，上面第2個(gè)式子可表示成

xn(k+1)=f0[x(k)]+g0[x(k)]u(k)

當(dāng)d＞1時(shí)，因系統(tǒng)的未來輸出能用狀態(tài)矢量x(k)的分量表示，且有

xn(k+1)=y(k+1)

系統(tǒng)算法能改寫成

式中，Z(k)是狀態(tài)變換的一種形式，F(xiàn)［·］、G［·］是Z(k)的無限可微函數(shù)。6.7.3神經(jīng)網(wǎng)絡(luò)逼近

如果非線性被控對(duì)象的結(jié)構(gòu)信息n、m、d均已知，但函數(shù)關(guān)系F［·］、G［·］未知，這時(shí)可用兩個(gè)多層前向神經(jīng)網(wǎng)絡(luò)來逼近未知的非線性關(guān)系。

1.學(xué)習(xí)方法與誤差

被控對(duì)象以輸入/輸出形式表示成：

y(k+d)=fd－1[x(k)]+gd－1[x(k)]u(k)

當(dāng)d=1時(shí)有

y(k+1)=f0[·]+g0[·]u(k)兩個(gè)中的每一個(gè)多層前向網(wǎng)絡(luò)選用三層，f0[·]和g0[·]的隱層分別設(shè)有p和q個(gè)神經(jīng)元，逼近用的神經(jīng)網(wǎng)絡(luò)起辨識(shí)作用。辨識(shí)器的輸入為［x(k)，u(k)］，輸出為式中，w(k)、v(k)是兩個(gè)網(wǎng)絡(luò)的連接權(quán)系：w(k)=［w0，w1(k)，w2(k)，…，w2p(k)］v(k)=［v0，v1(k)，v2(k)，…，v2p(k)］它們的網(wǎng)絡(luò)逼近結(jié)構(gòu)如圖6-22所示。圖6-22神經(jīng)網(wǎng)絡(luò)逼近結(jié)構(gòu)考慮到d≥1，兩個(gè)神經(jīng)網(wǎng)絡(luò)Nf和Ng能夠以任意精度逼近fd－1［x(k)］和gd－1［x(k)］，此時(shí)設(shè)r(k)為系統(tǒng)給定輸入，學(xué)習(xí)算法為在自校正系統(tǒng)結(jié)構(gòu)圖中，控制量u(k)同時(shí)施加在被控對(duì)象及神經(jīng)網(wǎng)絡(luò)辨識(shí)器上，神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法依靠網(wǎng)絡(luò)輸出與被控對(duì)象輸出的差值來進(jìn)行，如圖6-23所示。圖6-23神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法學(xué)習(xí)用的誤差定義成：

e*(k+1)=y*(k+1)－y(k+1)

式中，y(k+1)=fd－1[x(k－d+1)]+gd－1[x(k－d+1)]u(k－d+1)

2.修正學(xué)習(xí)算法

設(shè)

θ=［w，v］T

則參數(shù)修正規(guī)則為：式中，若定義一個(gè)死區(qū)函數(shù)Ｄ(ｅ)：

d0是死區(qū)寬度，為一個(gè)小于１的小正數(shù)。由此可得修正的學(xué)習(xí)算法：

３．仿真實(shí)例

設(shè)被控對(duì)象有非線性時(shí)變特征，仿真模型為用兩個(gè)神經(jīng)網(wǎng)絡(luò)對(duì)系統(tǒng)建模，其中是２×４×４×１的四層前向網(wǎng)絡(luò)，是單神經(jīng)元單層網(wǎng)，模型為在實(shí)現(xiàn)閉環(huán)控制前，選擇位于u(k)∈［－2.2，2.2］之間的隨機(jī)信號(hào)，神經(jīng)網(wǎng)絡(luò)的訓(xùn)練選用標(biāo)準(zhǔn)BP算法，誤差信號(hào)e(k+1)=y(k+1)－y*(k+1)對(duì)網(wǎng)絡(luò)訓(xùn)練10000次后，e(k)降至0.05以內(nèi)。測(cè)試次數(shù)過大，e(k)并無多大改進(jìn)。

仿真步驟如下：

(1)預(yù)先對(duì)神經(jīng)網(wǎng)絡(luò)訓(xùn)練20000次，此時(shí)的參數(shù)θ(k)記為θ(20000)。

(2)將大小為Δ的擾動(dòng)加到w(20000)和(20000)上，擾動(dòng)后系統(tǒng)初始輸出－2.0，對(duì)參考信號(hào)r(k)實(shí)行跟蹤，取r(k)=1.5sin(πk／50)。

(3)運(yùn)行6000次，檢測(cè)閉環(huán)系統(tǒng)跟蹤誤差是否收斂。

(4)繼續(xù)運(yùn)行8000次，進(jìn)一步觀測(cè)閉環(huán)系統(tǒng)跟蹤誤差的收斂性能。

(5)取MATLAB14位小數(shù)的精度，觀測(cè)網(wǎng)絡(luò)參數(shù)是否有變化，如果有，則沒有收斂；只有網(wǎng)絡(luò)參數(shù)無變化，才表明跟蹤誤差已收斂到死區(qū)內(nèi)。

仿真結(jié)果如表6-2所示，討論如下。

(1)當(dāng)Δ=0時(shí)，如果d0不能增加到0.075，即便無擾動(dòng)，誤差也不能收斂到0。

(2)當(dāng)d0維持0.075不變，逐漸增加Δ，結(jié)果是只有當(dāng)Δ＜0.088時(shí)，跟蹤誤差才收斂。

(3)當(dāng)Δ超過了0.088時(shí)，必須相應(yīng)增加d0。

從上面的討論可以看到，

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

《神經(jīng)網(wǎng)絡(luò)控制》課件第6章

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

《神經(jīng)網(wǎng)絡(luò)控制》課件第6章

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔