版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第6章神經(jīng)控制系統(tǒng)6.1神經(jīng)控制系統(tǒng)概述6.2神經(jīng)控制器的設(shè)計(jì)方法6.3神經(jīng)辨識(shí)器的設(shè)計(jì)方法6.4PID神經(jīng)控制系統(tǒng)6.5模型參考自適應(yīng)神經(jīng)控制系統(tǒng)6.6預(yù)測(cè)神經(jīng)控制系統(tǒng)6.7自校正神經(jīng)控制系統(tǒng)6.8內(nèi)模神經(jīng)控制系統(tǒng)6.9小腦模型神經(jīng)控制系統(tǒng)6.10小結(jié)習(xí)題與思考題
6.1神經(jīng)控制系統(tǒng)概述
把人工神經(jīng)網(wǎng)絡(luò)引進(jìn)到自動(dòng)控制領(lǐng)域,是神經(jīng)網(wǎng)絡(luò)學(xué)界和自動(dòng)控制學(xué)界共同努力的結(jié)果,它反映了兩個(gè)學(xué)科分支的共同心愿。神經(jīng)網(wǎng)絡(luò)學(xué)界急切希望找到自己的用武之地,自動(dòng)控制領(lǐng)域迫切希望實(shí)現(xiàn)更高層面上的自動(dòng)化。
把人工神經(jīng)網(wǎng)絡(luò)引進(jìn)到自動(dòng)控制領(lǐng)域,是因?yàn)闊o論從理論上還是實(shí)踐上,都已經(jīng)證明神經(jīng)網(wǎng)絡(luò)具有逼近任意連續(xù)有界非線性函數(shù)的能力。非線性系統(tǒng)本身具有明顯的不確定
行為,即便是線性系統(tǒng),為了改善網(wǎng)絡(luò)的動(dòng)態(tài)特性,也常常需要在線性前饋網(wǎng)絡(luò)的隱層構(gòu)造非線性單元,形成非線性前饋網(wǎng)絡(luò)。6.1.1神經(jīng)控制系統(tǒng)的基本結(jié)構(gòu)
神經(jīng)控制系統(tǒng)的全稱是人工神經(jīng)網(wǎng)絡(luò)控制系統(tǒng),其主要系統(tǒng)形式依舊是負(fù)反饋調(diào)節(jié),系統(tǒng)的基本結(jié)構(gòu)依舊劃分成開環(huán)和閉環(huán)兩類。它的一般結(jié)構(gòu)如圖6-1所示,圖中的控制器、
辨識(shí)器和反饋環(huán)節(jié)均可以用神經(jīng)網(wǎng)絡(luò)構(gòu)成。
人工神經(jīng)網(wǎng)絡(luò)使用二元邏輯,是一種數(shù)字網(wǎng)絡(luò),神經(jīng)控制是一種數(shù)字控制,用數(shù)字量控制被控對(duì)象。神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)是一種數(shù)字控制系統(tǒng),它具有數(shù)字控制系統(tǒng)的一般特征。和一般的微機(jī)系統(tǒng)一樣,它由硬件與軟件兩部分組成。圖6-1人工神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)的一般結(jié)構(gòu)6.1.2神經(jīng)網(wǎng)絡(luò)在神經(jīng)控制系統(tǒng)中的作用
神經(jīng)控制給非線性系統(tǒng)帶來一種新的控制方式。在神經(jīng)網(wǎng)絡(luò)進(jìn)入自控領(lǐng)域之前,控制系統(tǒng)的設(shè)計(jì)分析方法是首先建立數(shù)學(xué)模型,用數(shù)學(xué)表達(dá)式描述系統(tǒng),然后對(duì)相應(yīng)的數(shù)學(xué)方程求解。古典控制理論形成了一整套利用拉氏變換求解微分方程的做法;現(xiàn)代控制理論則是狀態(tài)方程和矩陣求解。如果數(shù)學(xué)模型不正確,描述系統(tǒng)的數(shù)學(xué)式子不能反映系統(tǒng)的真實(shí)面貌,與真實(shí)系統(tǒng)相差太大,設(shè)計(jì)結(jié)果就不能使用。這就是系統(tǒng)設(shè)計(jì)失敗的原因。無論是古典控制系統(tǒng),還是現(xiàn)代控制系統(tǒng),控制器的設(shè)計(jì)都與被控制器的數(shù)學(xué)模型有直接的關(guān)系。神經(jīng)網(wǎng)絡(luò)從根本上改變了上述設(shè)計(jì)思路,因?yàn)樗恍枰豢刂茖?duì)象的數(shù)學(xué)模型。在控制系統(tǒng)中,神經(jīng)網(wǎng)絡(luò)是作為控制器或辨識(shí)器起作用的。
控制器具有智能行為的系統(tǒng),稱為智能控制系統(tǒng)。在智能控制系統(tǒng)中,有一類具有學(xué)習(xí)能力的系統(tǒng),被稱為學(xué)習(xí)控制系統(tǒng)。學(xué)習(xí)的過程是一個(gè)訓(xùn)練并帶有將訓(xùn)練結(jié)果記憶的過程,人工神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)就是一種學(xué)習(xí)控制系統(tǒng)。神經(jīng)控制器與古典控制器和現(xiàn)代控制器相比,有優(yōu)點(diǎn)也有缺點(diǎn)。優(yōu)點(diǎn)是神經(jīng)控制器的設(shè)計(jì)與被控制對(duì)象的數(shù)學(xué)模型無關(guān),這是神經(jīng)控制器的最大優(yōu)點(diǎn),也是神經(jīng)網(wǎng)絡(luò)能夠在自動(dòng)控制中立足的根本原因。缺點(diǎn)是神經(jīng)網(wǎng)絡(luò)需要在線或離線開展學(xué)習(xí)訓(xùn)練,并利用訓(xùn)練結(jié)果進(jìn)行系統(tǒng)設(shè)計(jì)。這種訓(xùn)練在很大程度上依賴訓(xùn)練樣本的準(zhǔn)確性,而訓(xùn)練樣本的選取依舊帶有人為的因素。
神經(jīng)辨識(shí)器用于辨識(shí)被控對(duì)象的非線性和不確定性。
不同的神經(jīng)控制系統(tǒng)有不同的配置:有的僅僅只需要神經(jīng)控制器;有的僅僅只需要神經(jīng)辨識(shí)器,有的既需要神經(jīng)控制器,又需要神經(jīng)辨識(shí)器。不同的配置按照不同的對(duì)象要求設(shè)定。
6.2神經(jīng)控制器的設(shè)計(jì)方法
神經(jīng)控制器的設(shè)計(jì)大致可以分為兩種類型,一類是與傳統(tǒng)設(shè)計(jì)手法相結(jié)合;一類是完全脫離傳統(tǒng)手法,另行一套。無論是哪一類,目前都未有固定的模式,很多問題都還在探討之中。究其原因是因?yàn)樯窠?jīng)控制還是一門新學(xué)科,在社會(huì)上并不普及,為數(shù)眾多的人甚至連“神經(jīng)控制”都還沒有聽說過,神經(jīng)系統(tǒng)的研究還處于摸索探討階段,神經(jīng)網(wǎng)絡(luò)雖然
有了一些所謂的“理論”,但并不成熟,甚至連隱層節(jié)點(diǎn)的作用機(jī)理這一類簡單的理論問題都沒有搞清楚。而智能控制的“年齡”比神經(jīng)網(wǎng)絡(luò)還要年輕,現(xiàn)階段的智能控制就沒有理論。因此,神經(jīng)控制器沒有理論體系,更談不上完善的理論體系,相應(yīng)也就不存在系統(tǒng)化的設(shè)計(jì)方法。目前較為流行的神經(jīng)控制器設(shè)計(jì)過程是:設(shè)計(jì)人員根據(jù)自己的經(jīng)驗(yàn)選用神經(jīng)網(wǎng)絡(luò)、選擇訓(xùn)練方法,確定是否需要供訓(xùn)練使用的導(dǎo)師信號(hào),設(shè)計(jì)算法并編制程序,然后上機(jī)運(yùn)行,得到仿真結(jié)果,根據(jù)結(jié)果決定是否需要進(jìn)一步修改相關(guān)參數(shù)或修改網(wǎng)絡(luò)體系。
從仿真到實(shí)際運(yùn)行,還有很長一段路要走,需要解決的主要問題是仿真僅僅只是神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練運(yùn)行的結(jié)果,實(shí)際運(yùn)行需要帶動(dòng)被控制對(duì)象,其工作環(huán)境遠(yuǎn)比實(shí)驗(yàn)室仿真環(huán)
境惡劣且復(fù)雜得多。由于神經(jīng)控制器的設(shè)計(jì)與設(shè)計(jì)人員的素質(zhì)、理解能力和經(jīng)驗(yàn)有關(guān),因此設(shè)計(jì)出來的產(chǎn)品都可以成為設(shè)計(jì)者的成果,這也是從事神經(jīng)控制較容易出成果的原因之一。隨著時(shí)間的推移,對(duì)設(shè)計(jì)結(jié)果的評(píng)價(jià)體系終會(huì)誕生,優(yōu)劣將更加清晰。
簡單綜合起來,神經(jīng)控制器的設(shè)計(jì)方法大體有如下幾種:模型參考自適應(yīng)方法、自校正方法、內(nèi)模方法、常規(guī)控制方法、神經(jīng)網(wǎng)絡(luò)智能方法和神經(jīng)網(wǎng)絡(luò)優(yōu)化設(shè)計(jì)方法。6.2.1模型參考自適應(yīng)方法
模型參考自適應(yīng)方法設(shè)計(jì)出來的神經(jīng)控制器多用于被控制對(duì)象是線性對(duì)象,但也適合于被控制對(duì)象是非線性對(duì)象。兩種不同對(duì)象對(duì)神經(jīng)辨識(shí)器的要求不同。這種方式設(shè)計(jì)出的
系統(tǒng)基本結(jié)構(gòu)如圖6-2所示。從圖中可以看到,神經(jīng)網(wǎng)絡(luò)的功能是控制器,但是它的訓(xùn)練信號(hào)卻是參考模型信號(hào)與系統(tǒng)輸出信號(hào)之間的差值:
e=z-y
由此可以確定神經(jīng)控制器的訓(xùn)練目標(biāo)為參考模型輸出與被控對(duì)象輸出的差值最小。圖6-2模型參考自適應(yīng)神經(jīng)控制系統(tǒng)訓(xùn)練之前必須要先解決的問題是如何得到參考模型輸出與被控對(duì)象輸出,由于無法知道被控對(duì)象的數(shù)學(xué)模型,或者是引入神經(jīng)控制的目的就是不用知道被控對(duì)象的數(shù)學(xué)模型,
因而對(duì)象的特性未知,給訓(xùn)練帶來困難。解決辦法是在被控對(duì)象的兩邊增加神經(jīng)網(wǎng)絡(luò)辨識(shí)器,通過辨識(shí)器具有的在線辨識(shí)功能獲得被控對(duì)象的動(dòng)態(tài)特性。線性被控對(duì)象和非線性被
控對(duì)象的系統(tǒng)辨識(shí)是不相同的,對(duì)比之下,非線性被控對(duì)象的系統(tǒng)辨識(shí)要困難得多。
6.2.2自校正方法
用自校正方法設(shè)計(jì)出來的神經(jīng)控制系統(tǒng)既能用于線性對(duì)象,也能用于非線性對(duì)象。自校正神經(jīng)控制系統(tǒng)的基本結(jié)構(gòu)如圖6-3所示。其中自校正控制器由人工神經(jīng)網(wǎng)絡(luò)構(gòu)成,它的輸入有兩部分:一部分是偏差信號(hào),一部分是辨識(shí)估計(jì)的輸出。辨識(shí)估計(jì)器能正確估計(jì)被控對(duì)象的動(dòng)態(tài)建模,在某種程度上,它是一個(gè)反饋部件。辨識(shí)估計(jì)器顯然應(yīng)當(dāng)由神經(jīng)網(wǎng)絡(luò)構(gòu)成。圖6-3自校正神經(jīng)控制系統(tǒng)自校正有直接控制和間接控制兩類。自校正直接控制往往只需要一個(gè)自校正控制器,結(jié)構(gòu)簡單,常用于線性系統(tǒng)的實(shí)時(shí)控制。自校正直接控制器的設(shè)計(jì)方法有兩種:有模型設(shè)計(jì)和無模型設(shè)計(jì)。在有模型設(shè)計(jì)中,通常在系統(tǒng)中加入白噪聲信號(hào),以獲得較好的控制效果。辨識(shí)過程常常出現(xiàn)飽和,影響辨識(shí)結(jié)果及跟蹤快慢。為了自動(dòng)適應(yīng)對(duì)快速變化的系統(tǒng)實(shí)時(shí)辨識(shí),使用經(jīng)過訓(xùn)練后的神經(jīng)網(wǎng)絡(luò),能及時(shí)準(zhǔn)確提取被控對(duì)象的參數(shù),對(duì)干擾有較強(qiáng)的抵抗能力,對(duì)失誤有較強(qiáng)的容錯(cuò)能力。自校正間接控制器著重解決非線性系統(tǒng)的動(dòng)態(tài)建模。
用于線性對(duì)象的控制器常采用零極點(diǎn)配置進(jìn)行設(shè)計(jì),這是一種常規(guī)的自適應(yīng)設(shè)計(jì)。用于非線性對(duì)象的控制器常采用I/O線性化或采用逆模型控制等設(shè)計(jì)。6.2.3內(nèi)模方法
內(nèi)模方法設(shè)計(jì)出來的內(nèi)模神經(jīng)控制系統(tǒng)主要用于非線性系統(tǒng),內(nèi)模神經(jīng)控制器既要作用于被控對(duì)象,又要作用于被控對(duì)象的內(nèi)部模型。內(nèi)模神經(jīng)控制系統(tǒng)結(jié)構(gòu)如圖6-4所示,其穩(wěn)定的充分兼必要條件是控制器和被控對(duì)象都要穩(wěn)定。系統(tǒng)中的控制器和被控對(duì)象的內(nèi)部模型都由神經(jīng)網(wǎng)絡(luò)承擔(dān)。圖6-4內(nèi)模神經(jīng)控制系統(tǒng)6.2.4常規(guī)控制方法
常規(guī)控制方法使用古典控制理論、現(xiàn)代控制理論和智能控制中控制器的設(shè)計(jì)方法。這些方法較成熟,可以在設(shè)計(jì)過程中用神經(jīng)網(wǎng)絡(luò)取代設(shè)計(jì)出的控制器。取代不是簡單的更換,而是確定神經(jīng)網(wǎng)絡(luò)的訓(xùn)練算法,做到快速衰減而又穩(wěn)定。這一類系統(tǒng)比較多,有神經(jīng)PID調(diào)節(jié)控制系統(tǒng)、神經(jīng)預(yù)測(cè)控制系統(tǒng)和變結(jié)構(gòu)控制系統(tǒng)等。圖6-5~圖6-7分別是這三種系統(tǒng)的結(jié)構(gòu)示意圖。圖6-5神經(jīng)PID調(diào)節(jié)控制系統(tǒng)圖6-6神經(jīng)預(yù)測(cè)控制系統(tǒng)圖6-7變結(jié)構(gòu)控制系統(tǒng)常規(guī)PID調(diào)節(jié)是古典控制理論中使用十分成熟且十分有效的工程控制方法。無論是古典控制理論、現(xiàn)代控制理論,還是智能控制,都離不開PID調(diào)節(jié)方式。對(duì)于結(jié)構(gòu)明了、參
數(shù)固定不變或基本不變的線性定常系統(tǒng),PID調(diào)節(jié)的控制功能發(fā)揮得淋漓盡致。PID調(diào)節(jié)器既可以用運(yùn)算放大器等模擬芯片構(gòu)成,也可以用數(shù)字電路構(gòu)成,還可以用計(jì)算機(jī)構(gòu)成。
算法簡單,易于實(shí)現(xiàn)。對(duì)于一些在控制過程中存在不確定性、存在非線性、存在時(shí)變的被控對(duì)象,由于數(shù)學(xué)模型不明確,常規(guī)PID調(diào)節(jié)器往往難以奏效,不能保證系統(tǒng)穩(wěn)定性。目前能夠想到的解決
辦法有兩個(gè),兩個(gè)辦法都離不開神經(jīng)網(wǎng)絡(luò)。一個(gè)是對(duì)被控對(duì)象使用系統(tǒng)辨識(shí),PID調(diào)節(jié)器繼續(xù)使用常規(guī)調(diào)節(jié)器,系統(tǒng)辨識(shí)由神經(jīng)網(wǎng)絡(luò)承擔(dān);另一個(gè)是使用神經(jīng)PID調(diào)節(jié)器。在系統(tǒng)
中引入神經(jīng)網(wǎng)絡(luò),相應(yīng)需要學(xué)習(xí)訓(xùn)練。神經(jīng)預(yù)測(cè)控制系統(tǒng)也是用于非線性、不確定性被控對(duì)象的系統(tǒng),預(yù)測(cè)未來將要發(fā)生的事情,將來的事不可能今天就能確定下來。但是,如同今天是過去的繼續(xù)一樣,將來
是今天的繼續(xù)。利用今天統(tǒng)計(jì)規(guī)律獲得的知識(shí)能推導(dǎo)未來的發(fā)展趨勢(shì)。例如江河湖堤的水文分析,未來一周或下個(gè)月的天氣情況,十幾、幾十年后人口的出生狀況、受教育狀況、
就業(yè)狀況等等。在預(yù)測(cè)中引入基于學(xué)習(xí)訓(xùn)練的神經(jīng)網(wǎng)絡(luò),將不遜于基于模糊邏輯的專家系統(tǒng),不遜于基于規(guī)則的人工智能。變結(jié)構(gòu)控制系統(tǒng)中的神經(jīng)網(wǎng)絡(luò)需要面對(duì)變參數(shù)、變結(jié)構(gòu)的被控對(duì)象,相應(yīng)控制方案要復(fù)雜一些。在這種系統(tǒng)中,神經(jīng)控制器和常規(guī)控制器并存,由于參數(shù)經(jīng)常發(fā)生變化,神經(jīng)網(wǎng)絡(luò)的主要功能將是識(shí)別參數(shù)的變化,為常規(guī)控制器決策提供依據(jù)。在傳統(tǒng)的模糊控制或人工智能中,跟蹤參數(shù)變化主要使用條件轉(zhuǎn)移語句,如類似于“IF…THEN…”或一些比較判別語句。這類語句本身并沒有什么大的問題,問題是條件帶有人為主觀因素,因而存在較大的系統(tǒng)誤差。神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)跟蹤系統(tǒng)的參數(shù)變化時(shí),時(shí)時(shí)注意到控制參數(shù)與系統(tǒng)結(jié)構(gòu)之間的轉(zhuǎn)換,在訓(xùn)練過程中記憶系統(tǒng)參數(shù)的內(nèi)在聯(lián)系,系統(tǒng)的初始化更加易于實(shí)施,效果更加明顯,控制結(jié)果更加令人滿意,系統(tǒng)的魯棒性明顯增強(qiáng)。系統(tǒng)內(nèi)有一個(gè)樣本生成環(huán)節(jié),用于生成訓(xùn)練樣本。由于參數(shù)隨時(shí)變化,需要一個(gè)樣本生成的參照系,參照系由神經(jīng)網(wǎng)絡(luò)承擔(dān)。
變結(jié)構(gòu)控制系統(tǒng)的不足之處是難于實(shí)施神經(jīng)網(wǎng)絡(luò)的在線訓(xùn)練。6.2.5神經(jīng)網(wǎng)絡(luò)智能方法
神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)功能是一種智能行為,它與其它智能學(xué)科有相同或相近的設(shè)計(jì)方式。將神經(jīng)網(wǎng)絡(luò)與模糊控制、人工智能、專家系統(tǒng)相結(jié)合,可構(gòu)成各具特色的模糊神經(jīng)控制、智能神經(jīng)控制、專家神經(jīng)系統(tǒng)等,它們形成了自己的設(shè)計(jì)方法。一種典型的模糊神經(jīng)控制系統(tǒng)的基本結(jié)構(gòu)如圖6-8所示。圖6-8模糊神經(jīng)控制系統(tǒng)6.2.6神經(jīng)網(wǎng)絡(luò)優(yōu)化設(shè)計(jì)方法
神經(jīng)網(wǎng)絡(luò)能夠復(fù)現(xiàn)各種復(fù)雜的優(yōu)化運(yùn)算,是因?yàn)閹щ[層的三層網(wǎng)絡(luò)能夠以任意精度逼近任何非線性函數(shù)。網(wǎng)絡(luò)能夠完成的優(yōu)化運(yùn)算有最優(yōu)化求解、矩陣求逆、Lyapunov方程求解、Riccati方程求解等。神經(jīng)計(jì)算目前已經(jīng)演變成一門學(xué)科分支。在最優(yōu)化過程中設(shè)計(jì)神經(jīng)算法的好處是更接近系統(tǒng)實(shí)際、迭代速度快、系統(tǒng)結(jié)構(gòu)清晰簡明,尤其是有連續(xù)量與離散量并存的系統(tǒng)。具體實(shí)例有使用Hopfield網(wǎng)絡(luò)對(duì)廣義預(yù)測(cè)系統(tǒng)中的矩陣求逆問題進(jìn)行求解,對(duì)被控對(duì)象的數(shù)學(xué)模型進(jìn)行在線辨識(shí)等等。
6.3神經(jīng)辨識(shí)器的設(shè)計(jì)方法
系統(tǒng)辨識(shí)的基本任務(wù)就是尋求到滿足一定條件的一個(gè)模型。由于“一組給定模型”是人為給出的,如果內(nèi)部包括有與實(shí)際被控系統(tǒng)完全等價(jià)的模型,那么就完全用不著給出一組進(jìn)行辨識(shí)。事實(shí)上不可能找到與被控系統(tǒng)完全等價(jià)的模型,只能選一個(gè)相近的模型。這樣做當(dāng)然也會(huì)帶來一個(gè)問題,給出一組什么樣的“給定模型”是至關(guān)重要的。如果給出的一組模型中,個(gè)個(gè)都與實(shí)際被控系統(tǒng)相差巨大,那么再好的神經(jīng)辨識(shí)也無能為力。系統(tǒng)辨識(shí)的等價(jià)準(zhǔn)則是識(shí)別模型接近被控系統(tǒng)的誤差標(biāo)準(zhǔn),在數(shù)學(xué)上為一個(gè)誤差的泛函,用
J=‖e‖
表示,其中最常見的是L2范數(shù)。
神經(jīng)辨識(shí)器的設(shè)計(jì)方法在于確定一個(gè)原則,選擇一個(gè)模型,將所選模型的動(dòng)態(tài)、靜態(tài)特性與被控系統(tǒng)的動(dòng)態(tài)、靜態(tài)特性最大限度地?cái)M合。圖6-9所示是神經(jīng)辨識(shí)系統(tǒng)的基本結(jié)構(gòu)。圖6-9神經(jīng)辨識(shí)系統(tǒng)
6.4PID神經(jīng)控制系統(tǒng)
PID控制是工業(yè)過程控制中使用歷史最為久遠(yuǎn)、范圍最為廣泛的控制調(diào)節(jié)方式。PID控制器具有魯棒性強(qiáng)、結(jié)構(gòu)簡單、易于實(shí)現(xiàn)、控制過程直觀等優(yōu)點(diǎn),在控制系統(tǒng)中不可被其它控制方式替代。但是,對(duì)于那些在復(fù)雜生產(chǎn)環(huán)境下的被控對(duì)象,由于存在非線性、干擾、不確定性等問題,致使常規(guī)PID控制難以獲得最佳調(diào)節(jié)參數(shù)。工業(yè)對(duì)象通常具有時(shí)變性,很難在全工作范圍或長期工作時(shí)間內(nèi)始終保持最優(yōu)。為此,人們提出了一些改進(jìn)辦法,例如自適應(yīng)PID控制等。但是,自適應(yīng)控制主要用于線性情況。工業(yè)控制遇到的問題是非線性對(duì)象,用常規(guī)PID就難以達(dá)到目的。6.4.1PID神經(jīng)控制系統(tǒng)框圖
設(shè)被控對(duì)象的數(shù)學(xué)模型為
y(t)=f[y(t-1),y(t-2),…,y(t-n),u(t-1),u(t-2),…,u(t-m)]
該模型表示被控系統(tǒng)是一個(gè)單輸入單輸出的非線性系統(tǒng),f
[·]用來表示非線性關(guān)系,是一個(gè)未知量;y(t)是系統(tǒng)的輸出,階次為n;u(t)是系統(tǒng)的輸入,階次為m。
為了將未知的f[·]辨識(shí)出來,在PID神經(jīng)控制系統(tǒng)中,除了神經(jīng)控制器NNC外,還需要神經(jīng)辨識(shí)器NNI。由此組成的PID神經(jīng)控制系統(tǒng)的結(jié)構(gòu)框圖如圖6-10所示。圖6-10PID神經(jīng)控制系統(tǒng)從圖6-10中可以看到,PID神經(jīng)控制系統(tǒng)采用串-并聯(lián)結(jié)構(gòu),PID神經(jīng)控制器與被控對(duì)象串聯(lián)連接,神經(jīng)辨識(shí)器與被控對(duì)象并聯(lián)連接。
神經(jīng)辨識(shí)器NNI采用3層BP網(wǎng)絡(luò),接受兩個(gè)輸入,分別是u(t)和y(t)。將u(t)和y(t)合在一起用x(t)表示,寫成
x(t)=[y(t-1),y(t-2),…,y(t-n),u(t-1),u(t-2),…,u(t-m)]
NNI的輸入表達(dá)式x(t)表明網(wǎng)絡(luò)輸入層有n+m-1個(gè)神經(jīng)元。網(wǎng)絡(luò)隱層神經(jīng)元個(gè)數(shù)n0≥n+m-1,輸入輸出關(guān)系為Oi(t)=g[neti(t)]式中,wij為權(quán)系數(shù),θi
是閾值,g[·]是作用函數(shù),且g(x)=(1-e-x)/(1+e-x)。
NNI僅有一個(gè)輸出,分別送到兩個(gè)比較環(huán)節(jié),在與控制系統(tǒng)的輸入r(t)和輸出y(t)比較后,分別成為神經(jīng)控制器和神經(jīng)辨識(shí)器的學(xué)習(xí)算法信號(hào)。輸出記為式中,z(t+1)是NNI的輸出,vi是權(quán)系數(shù),α是閾值,學(xué)習(xí)性能指標(biāo)為當(dāng)取Jm極小值時(shí),權(quán)系數(shù)調(diào)整規(guī)律為Δvi(t)=αε(t+1)Oi(t)+βΔvi(t-1)Δγ(t)=αε(t+1)+βΔγ(t-1)Δwij(t)=αε(t+1)g′[net(t)]vi(t)xj(t)+βΔwij(t-1)Δθij(t)=αε(t+1)g′[net(t)]vi(t)+βΔθij(t-1)ε(t+1)=y(t+1)-z(t+1)g′(·)=0.5[1-g2(·)]Δu(t)=u(t)-u(t-1)式中,α、β分別是學(xué)習(xí)率和慣性系數(shù),取值范圍為(0,1)。6.4.2PID神經(jīng)調(diào)節(jié)器的參數(shù)整定
PID神經(jīng)調(diào)節(jié)器與常規(guī)線性系統(tǒng)的PID調(diào)節(jié)器具有完全相同的形式。本節(jié)選擇一個(gè)帶隱層的三層神經(jīng)網(wǎng)絡(luò)作PID調(diào)節(jié)器,討論參數(shù)整定的方法。
當(dāng)PID調(diào)節(jié)器的控制參數(shù)基于算法來完成調(diào)整時(shí),選用的常常是梯度下降法。設(shè)三層網(wǎng)絡(luò)調(diào)節(jié)器的輸入為e(t),
e(t)-e(t-1),e(t)-2e(t-1)+e(t-2),
網(wǎng)絡(luò)的I/O關(guān)系式可寫出,調(diào)節(jié)器輸出增量用
Δu(t)=f[e(t),e(t)-e(t-1),e(t)-2e(t-1)+e(t-2)]
描述,等式右邊f(xié)[·]是非線性函數(shù)。相應(yīng)地,
u(t)=u(t-1)+Δu(t)權(quán)系數(shù)的調(diào)整公式為
Δwij(t)=αε(t+1)+g′[net(t)]vi(t)xj(t)+βΔwij(t-1)
式中,α、β分別為學(xué)習(xí)修正率及慣性系數(shù),ε是誤差系數(shù),g′[·]是作用函數(shù)。進(jìn)一步有
ε(t+1)=r(t+1)-y(t+1)=e(t+1)
學(xué)習(xí)修正率α的取值直接影響到學(xué)習(xí)速度,為了加快收斂速度,一般都采用改變修正率的措施,變步長的方法如下:
(1)設(shè)計(jì)算性能指標(biāo)為檢查
J(t)<βJ(t-1)是否成立。如果成立,則表明在u(t)作用下,系統(tǒng)的跟蹤誤差大大減小,實(shí)現(xiàn)J(t)的目標(biāo)也比較明顯。學(xué)習(xí)修正率α的調(diào)整公式如下:如果α(t)增大,則表示學(xué)習(xí)強(qiáng)度增強(qiáng),收斂加快。
(2)如果J(t)<βJ(t-1)不成立,應(yīng)保持學(xué)習(xí)修正率α(t)不變。
(3)慣性系統(tǒng)β的取值小些有利于收斂,如取0.2<β<0.7用于快速系統(tǒng);取0.6<β<0.99用于慢速調(diào)節(jié)。β值的選取不必非得始終一致,取得小有利于快速,取得大有利于慢速平緩,為使系統(tǒng)響應(yīng)過程良好,可取β先大后小。
6.5模型參考自適應(yīng)神經(jīng)控制系統(tǒng)
反饋是保護(hù)系統(tǒng)穩(wěn)定的一種有效措施。當(dāng)控制對(duì)象參數(shù)發(fā)生變化或運(yùn)行環(huán)境發(fā)生變化時(shí),為了保證系統(tǒng)具備良好的動(dòng)態(tài)性能,負(fù)反饋是一種有力的措施,由此產(chǎn)生了自適應(yīng)控制策略。由于負(fù)反饋的存在,自適應(yīng)才成為可能。如果被控對(duì)象屬于線性系統(tǒng)或可將其線性處理的非線性系統(tǒng),有兩種不同的自適應(yīng)控制方式可供選擇:一種是參考自適應(yīng)控制,另一種是自校正控制。前一種是本節(jié)敘述的內(nèi)容,后一種在后面介紹。模型參考自適應(yīng)系統(tǒng)方案由美國MIT的Witark教授在1958年提出。這種系統(tǒng)的基本結(jié)構(gòu)由參考模型、反饋控制器、預(yù)處理環(huán)節(jié)等三部分組成,參考模型起前饋控制作用。
系統(tǒng)的基本框架圖如圖6-11所示。圖6-11模型參考自適應(yīng)系統(tǒng)基本結(jié)構(gòu)6.5.1兩種不同的自適應(yīng)控制方式
模型參考自適應(yīng)系統(tǒng)的基本結(jié)構(gòu)來源于一般線性對(duì)象自適應(yīng)系統(tǒng)。為了保證控制系統(tǒng)對(duì)給定值有良好的跟蹤能力和抑制干擾能力,通常將控制器分成前饋控制和反饋控制兩部
分。其中前饋控制按照期望輸出的要求產(chǎn)生控制信號(hào),便于獲得良好的動(dòng)態(tài)響應(yīng)或針對(duì)擾動(dòng)產(chǎn)生合適的補(bǔ)償信號(hào),用于良好的跟蹤和較強(qiáng)的抑制干擾。反饋控制器是根據(jù)期望輸出
與實(shí)際輸出之間的差值產(chǎn)生控制信號(hào),兩者共同作用于被控對(duì)象。前饋控制器作參考模型使用,在經(jīng)過預(yù)處理后,能達(dá)到預(yù)期的動(dòng)態(tài)響應(yīng)。反饋控制器的參數(shù)整定依賴于期望輸出與實(shí)際輸出之差。因此模型參考自適應(yīng)系統(tǒng)的控制策略是:由
于實(shí)際輸出與期望輸出有差別,通過反饋控制的反饋調(diào)節(jié),在參考模型的影響下,使實(shí)際輸出不斷地逼近期望輸出,逼近的方法采用梯度下降法。
梯度下降法雖然能夠調(diào)整控制器的參數(shù),但卻不能確切地保證系統(tǒng)穩(wěn)定,因此在20世紀(jì)70年代又有人提出基于李雅普諾夫(Lyapunov)穩(wěn)定性和基于波波夫(Popov)超穩(wěn)定性的設(shè)計(jì)方法。模型參考自適應(yīng)系統(tǒng)最初是為線性系統(tǒng)或可線性化的非線性系統(tǒng)設(shè)計(jì)的,當(dāng)被控對(duì)象為非線性對(duì)象時(shí),人們自然而然聯(lián)想到參考模型使用神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器
應(yīng)運(yùn)而生,它是神經(jīng)網(wǎng)絡(luò)與自適應(yīng)控制方式結(jié)合的產(chǎn)物。
神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器的設(shè)計(jì)可以采用兩種方法:一種是直接法,要點(diǎn)是按照期望輸出與實(shí)際輸出之差去調(diào)節(jié)控制器參數(shù),直接進(jìn)行控制;另一種是間接法,要點(diǎn)是通過系統(tǒng)
辨識(shí)獲得被控對(duì)象的數(shù)學(xué)模型,再按照事先提出的控制設(shè)計(jì)指標(biāo)設(shè)計(jì)控制器參數(shù)。神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器同樣需要學(xué)習(xí)訓(xùn)練。直接法設(shè)計(jì)的訓(xùn)練過程被稱為特定學(xué)習(xí),這是一種邊控制邊學(xué)習(xí)的方法,把控制器設(shè)計(jì)與控制滿意程度緊密結(jié)合,神經(jīng)網(wǎng)絡(luò)加權(quán)值的調(diào)整依靠期望輸出與實(shí)際輸出之差來完成。這種訓(xùn)練有助于自動(dòng)適應(yīng)對(duì)象與環(huán)境的變化。
間接設(shè)計(jì)的訓(xùn)練過程被稱為泛化學(xué)習(xí),這是一種利用被控對(duì)象的輸入輸出數(shù)據(jù)樣本對(duì)進(jìn)行學(xué)習(xí)的方法,學(xué)習(xí)被控對(duì)象的逆模型或預(yù)報(bào)模型。控制器的訓(xùn)練與控制分開進(jìn)行。訓(xùn)練階段的訓(xùn)練方法是:隨機(jī)產(chǎn)生一個(gè)控制信號(hào)加在被控制對(duì)象上,被控對(duì)象必然會(huì)產(chǎn)生一個(gè)輸出信號(hào),利用此控制信號(hào)和此輸出信號(hào)來訓(xùn)練控制器,最終使控制器產(chǎn)生合適的控制
信號(hào)讓被控對(duì)象的輸出信號(hào)逼近期望輸出。間接設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器存在一個(gè)問題:由于訓(xùn)練階段不能保證被控對(duì)象的輸出在允許的工作范圍內(nèi),那么在控制階段,被控對(duì)象的輸出就有可能超出允許的工作范圍,從而使控制出現(xiàn)失誤。產(chǎn)生這種失誤的原因只有一個(gè),就是被控對(duì)象是動(dòng)態(tài)因果系統(tǒng)導(dǎo)致神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器難于等同它的逆系統(tǒng)。為了避免這種失誤,通常設(shè)定被控對(duì)象的動(dòng)態(tài)特性固定不變。如果被控對(duì)象的動(dòng)態(tài)特性實(shí)際上變化明顯,那么就不適合使用這種設(shè)計(jì)方法。
神經(jīng)網(wǎng)絡(luò)在模型參考自適應(yīng)系統(tǒng)中作辨識(shí)器和控制器使用,相應(yīng)地,按控制器的設(shè)計(jì)方法,也可以分成兩種:一種是直接調(diào)整加權(quán)值的直接設(shè)計(jì)模型參考自適應(yīng)系統(tǒng);另一種是在線辨識(shí)間接設(shè)計(jì)控制器的間接設(shè)計(jì)模型參考自適應(yīng)系統(tǒng)。6.5.2間接設(shè)計(jì)模型參考自適應(yīng)神經(jīng)控制系統(tǒng)
間接設(shè)計(jì)模型參考自適應(yīng)神經(jīng)系統(tǒng)由參考模型、神經(jīng)網(wǎng)絡(luò)辨識(shí)器、神經(jīng)網(wǎng)絡(luò)控制器、非線性被控對(duì)象等部件組成,其原理框圖如圖6-12所示。在這種系統(tǒng)中,使用了兩個(gè)神經(jīng)網(wǎng)絡(luò),一個(gè)用做辨識(shí)器,一個(gè)用做控制器。
神經(jīng)網(wǎng)絡(luò)辨識(shí)器的主要功能是利用截至目前為止的所有輸入模式樣本預(yù)報(bào)下一步對(duì)象的輸出y(k+1),預(yù)報(bào)的準(zhǔn)確程度由偏差e(k+1)來度量:
e(k+1)=y(k+1)-ys(k+1)圖6-12間接設(shè)計(jì)模型參考自適應(yīng)系統(tǒng)
1.逆模型設(shè)計(jì)
所謂逆模型參考自適應(yīng)的含義在于:系統(tǒng)在輸入控制信號(hào)u(k)的控制下,使得非線性被控對(duì)象的輸出y(k)與參考模型的輸出ys(k)之差限制在給定的范圍之內(nèi),即式中,ε是一個(gè)事先隨機(jī)產(chǎn)生的小的正數(shù)。這時(shí),被控對(duì)象與參數(shù)模型有相同的輸入模式樣本。在間接設(shè)計(jì)模型參考自適應(yīng)系統(tǒng)中,參考模型由神經(jīng)網(wǎng)絡(luò)生成。辨識(shí)選用二次指標(biāo)準(zhǔn)則:線性系統(tǒng)的控制器設(shè)計(jì)一般定義在李雅普諾夫(Lyapunov)穩(wěn)定性或波波夫(Popov)穩(wěn)定性層面上,為穩(wěn)定而設(shè)置的負(fù)反饋成為控制器的主要結(jié)構(gòu)。
用神經(jīng)網(wǎng)絡(luò)構(gòu)成的控制器采用逆模型的方式實(shí)現(xiàn)控制,可以分成兩種不同的情況:
第一種,顯式逆模型控制,當(dāng)神經(jīng)控制器成功描述出系統(tǒng)動(dòng)力學(xué)特征后,如果被控對(duì)象的輸入控制信號(hào)是涵蓋神經(jīng)網(wǎng)絡(luò)輸出yq(k+1)的顯式函數(shù):
u(k)=f[y(k),y(k-1),…,u(k-1),…,u(k-n),yq(k+1)]
則神經(jīng)控制器將直接參與系統(tǒng)的控制作用,完成神經(jīng)顯式逆模型控制。第二種,隱式逆模型控制,適用于系統(tǒng)輸入u(k),不能用y(k),y(k-1),…,y(k-n),u(k-1),…等顯函數(shù)表示出來,它們之間的關(guān)系只能用隱函數(shù)表示。在這種情況下,控制器可以在辨識(shí)器的基礎(chǔ)上開展訓(xùn)練,訓(xùn)練結(jié)果只求顯式關(guān)系清楚??刂破饔糜谟?xùn)練的性能指標(biāo)取:式中,e為神經(jīng)網(wǎng)絡(luò)控制器的輸入偏差信號(hào);t是控制周期,表示神經(jīng)控制器的參數(shù)每隔t步調(diào)整一次??刂浦芷谂c辨識(shí)周期相比通常前者小、后者大,這種設(shè)置來自于一些傳統(tǒng)自適應(yīng)控制的經(jīng)驗(yàn)??刂浦芷诙桃馕吨刂谱饔妙l繁,辨識(shí)作用相對(duì)延緩,這樣有利于接近被控對(duì)象的控制規(guī)律。但是,兩個(gè)周期都不宜取過大的值,不宜拉大控制周期與辨識(shí)周期之間的差距,否則就有可能因被控對(duì)象不理睬而失控,使輸出誤差愈來愈大。
現(xiàn)用實(shí)例說明神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)。設(shè)被控對(duì)象的真實(shí)模型為
y(k+1)=f[y(k),y(k-1)]+g[u(k)]對(duì)g[u(k)],可分成幾種不同的情況。
1)g[u(k)]=u(k)
辨識(shí)神經(jīng)網(wǎng)絡(luò)選用4層前向網(wǎng)絡(luò),各層節(jié)點(diǎn)數(shù)為2×20×10×1,f[·]為被辨識(shí)對(duì)象,辨識(shí)模型為
yq(k+1)=N1[y(k),y(k-1)]+u(k)
式中,N1[·]是神經(jīng)網(wǎng)絡(luò)辨識(shí)器的輸入。為了保證系統(tǒng)輸入輸出有界,辨識(shí)所用的信號(hào)是均勻分布在[-2,2]區(qū)間上的輸入白噪聲序列。同時(shí),為保證系統(tǒng)的穩(wěn)定性,選擇參考模型為低階線性模型,比如形式為
ym(k+1)=0.6ym(k)+0.2ym(k-1)+r(k)其中,r(k)是參考模型的參考輸入量,控制輸入u(k)能表示成y(k),y(k+1)的顯函數(shù),神經(jīng)網(wǎng)絡(luò)控制器就能在神經(jīng)網(wǎng)絡(luò)辨識(shí)器的基礎(chǔ)上直接復(fù)制,相應(yīng)的穩(wěn)定性要求是
u(k)=-N1[y(k),y(k-1)]+0.6y(k)+0.2y(k-1)+r(k)
對(duì)應(yīng)閉環(huán)系統(tǒng)的誤差方程為
e(k+1)=0.6e(k)+0.2e(k)
由于,則系統(tǒng)漸近穩(wěn)定。
2)g[u(k)]=u3(k)
當(dāng)設(shè)計(jì)前f[·]和g[·]都未知時(shí),可取辨識(shí)模型為
yb(k+1)=N1[y(k),y(k-1)]+Nb[u(k)]
理想控制信號(hào)選擇成
u(k)=g-1{-N[y(k),y(k-1)]+0.6y(k)+0.2y(k-1)+r(k)}
神經(jīng)控制器的設(shè)計(jì)需要考慮y(k),y(k-1)等狀態(tài)的影響,可選擇神經(jīng)網(wǎng)絡(luò)控制器的輸入信號(hào)為
u(k)=Nc{-Nf[y(k),y(k-1)]+0.6y(k)+0.2y(k-1)+r(k)}
式中,Nf[·]是反饋網(wǎng)絡(luò)的函數(shù)傳遞關(guān)系,r(k)是一個(gè)網(wǎng)絡(luò)值,大小為選擇r(k)的目的是為了滿足
N1[Nc(r)]=r
的需要,這樣可實(shí)現(xiàn)g[·]的近似逆。具體在進(jìn)行訓(xùn)練時(shí),選擇u(k)為位于[-4,4]之間均勻分布的白噪聲,好處是神經(jīng)辨識(shí)器與神經(jīng)反饋網(wǎng)絡(luò)起作用的范圍延伸到非線性范圍,顯得更加廣泛,這時(shí)的辨識(shí)區(qū)間為[-2,2]。訓(xùn)練神經(jīng)控制器,做到Nb[Nc(r)]=r,網(wǎng)絡(luò)訓(xùn)練的方法既可以用常規(guī)BP算法,也可以用動(dòng)態(tài)BP算法。
2.逆模型不存在時(shí)的設(shè)計(jì)
前面介紹了逆模型存在時(shí)的設(shè)計(jì)過程,當(dāng)控制系統(tǒng)的逆模型不存在時(shí),就不能使用上述方法。但可以把神經(jīng)網(wǎng)絡(luò)控制器的訓(xùn)練用兩個(gè)輸出信號(hào)之差來展開,設(shè)這個(gè)差值為e(t),兩個(gè)輸出信號(hào)分別為系統(tǒng)辨識(shí)模型的輸出yb(t)和參考模型的輸出yc(t):
e(t)=yb(t)-yc(t)
yb(t)既然是辨識(shí)模型的輸出,那它就不是被控對(duì)象的輸出y(t)。
有了誤差e(t)作導(dǎo)師信號(hào)進(jìn)行訓(xùn)練,還需要確定相應(yīng)的訓(xùn)練準(zhǔn)則,這里可選擇式中,ε是一個(gè)事先給定的任意小正數(shù)。
逆模型不存在時(shí)的控制系統(tǒng)結(jié)構(gòu)圖如圖6-13所示。
現(xiàn)舉例說明。設(shè)系統(tǒng)模型為
y(k+1)=f[y(k)]+g[u(k)]
f[u(k)]=[u(k)+1]u(k)[u(k)-1]設(shè)參考模型為
yc(k+1)=0.6y(k)+r(k)系統(tǒng)輸入為圖6-13逆模型不存在時(shí)的系統(tǒng)結(jié)構(gòu)圖因本例中的y[u(k)]不可逆,訓(xùn)練用動(dòng)態(tài)BP算法,取
a=0.25
神經(jīng)控制器選用4層2×20×20×1結(jié)構(gòu),T=1,η=0.001,訓(xùn)練十萬步后參考模型的輸出yc將與網(wǎng)絡(luò)輸出yb達(dá)到一致。
a的作用是影響非線性范圍及訓(xùn)練時(shí)間,a越大,非線性范圍越大,訓(xùn)練時(shí)間將增加。在使用BP算法的過程中,為了加快訓(xùn)練速度,可以改用修正BP算法或用于辨識(shí)的非BP
算法。6.5.3直接設(shè)計(jì)模型參考自適應(yīng)神經(jīng)控制系統(tǒng)
直接設(shè)計(jì)模型參考自適應(yīng)系統(tǒng)是在加快學(xué)習(xí)速度的要求下引入的,這種自適應(yīng)方案可以省去“間接神經(jīng)網(wǎng)絡(luò)”,這樣就少訓(xùn)練一個(gè)網(wǎng)絡(luò),節(jié)省一部分時(shí)間。需要說明的是:盡管少了一個(gè)神經(jīng)網(wǎng)絡(luò),但并不表明這個(gè)網(wǎng)絡(luò)是多余的,而是在直接設(shè)計(jì)模型參考自適應(yīng)控制方案中,它用不需訓(xùn)練的功能電路代替。直接設(shè)計(jì)模型參考自適應(yīng)系統(tǒng)的基本結(jié)構(gòu)如圖6-14所示。
直接自適應(yīng)系統(tǒng)由神經(jīng)控制器、非線性被控對(duì)象、線性參考模型和線性增益控制器等幾部分組成,非線性被控對(duì)象的控制信號(hào)u(t)由三部分疊加而成:
u(t)=k1r(t)-kTxt(t)+un(t)圖6-14直接設(shè)計(jì)模型參考自適應(yīng)系統(tǒng)式中,k1是輸入增益矩陣,r(t)是系統(tǒng)的輸入,xp(t)是非線性被控對(duì)象的狀態(tài)矢量,k是線性參考模型的狀態(tài)反饋增益矩陣,un(t)是神經(jīng)控制器的輸出,且有
un(t)=f[tp(t),xm(t),r(t)]
式中,xm(t)是參考模型的狀態(tài)向量。神經(jīng)控制器的訓(xùn)練準(zhǔn)則為
式中,yp(k)和y1(k)分別是非線性被控對(duì)象和線性參考模型的輸出。使用的算法是基于梯度下降的BP算法。在利用誤差e(k)對(duì)神經(jīng)控制器的連接權(quán)進(jìn)行訓(xùn)練時(shí),需要使用修正
值,以滿足誤差在通道上傳遞的需要。如果被控對(duì)象的Jacobian陣已知,選擇的連接權(quán)修正公式就為式中,η(k)是步長,其大小可根據(jù)梯度矢量的大小調(diào)整,調(diào)整的方向選擇為加快收斂速度的方向。如果Jacobian陣未知,可選擇如下兩種方法修正連接權(quán):一種是利用Jacobian陣的符號(hào)取代Jacobian陣,進(jìn)行連接權(quán)系數(shù)反向傳播修正;另一種是增加一個(gè)神經(jīng)網(wǎng)絡(luò)模擬被控
對(duì)象,相當(dāng)于改用間接神經(jīng)網(wǎng)絡(luò)參考模型自適應(yīng)調(diào)整,使用的神經(jīng)網(wǎng)絡(luò)僅僅當(dāng)作一個(gè)信息通道,在這個(gè)通道上,誤差信號(hào)由輸出端反傳到神經(jīng)控制器。Jacobian陣雖然未知,但卻
可以通過在線辨識(shí)獲得。辨識(shí)過程如下:
設(shè)非線性系統(tǒng)的描述方程為yp(k+1)=f[yp(k),…,yp(k-n+1),u(k),…,u(k-m+1)]辨識(shí)用神經(jīng)網(wǎng)絡(luò)為三層感知器,結(jié)構(gòu)為(n+m)×n×1,又設(shè)輸入層輸出層作用函數(shù)為線性函數(shù),隱層作用函數(shù)取為雙曲正切函數(shù)tanhx,相應(yīng)神經(jīng)網(wǎng)絡(luò)輸出為式中,fq(k)就是一個(gè)雙曲正切函數(shù):fq(k)中的各系數(shù)a、b均通過BP算法確定。由此得神經(jīng)網(wǎng)絡(luò)輸出的增量為
式中,被控對(duì)象的Jacobian陣瞬時(shí)值可以求得使用S(k)估算對(duì)象的Jacobian陣時(shí),雖然存在不精確的地方,但能反映符號(hào)與幅值的變化。要想精確估計(jì),可使用如下跟蹤模型:其中,S(k+1)是反映靈敏度的函數(shù),αi、βj的計(jì)算公式不變?,F(xiàn)舉一個(gè)連續(xù)攪拌反應(yīng)釜的實(shí)例說明。當(dāng)采用直接設(shè)計(jì)模型參考自適應(yīng)系統(tǒng)控制方案時(shí),連續(xù)時(shí)間非線性微分方程組可表示反應(yīng)釜的特性:式中,q是過程流量,Ca(t)是平衡濃度比,V是反應(yīng)釜體積,T0是入口溫度,T是加入的冷卻劑溫度。反應(yīng)釜的工作原理是:兩種化學(xué)性質(zhì)不同的物質(zhì)在釜內(nèi)發(fā)生化學(xué)反應(yīng),生成濃度為Ca(t)的化合物,混合溫度設(shè)為T(t)。如果化學(xué)反應(yīng)是放熱反應(yīng),相應(yīng)反應(yīng)速度必然減緩,為此應(yīng)加入冷卻劑降低溫度、加快反應(yīng)速度,允許加入的冷卻劑溫度發(fā)生變化,流量用q(t)表示。反應(yīng)釜系統(tǒng)內(nèi)還有一些物理參數(shù),其常見值如表6-1所示。由于化學(xué)反應(yīng)過程不是線性過程,非線性狀態(tài)較為明顯,這時(shí)如果控制器選用線性的PID調(diào)節(jié)器,明顯不能滿足控制要求,研究結(jié)果表明,非線性突出表現(xiàn)在設(shè)定點(diǎn)附近阻尼比變化顯著,振蕩激烈。
直接式反應(yīng)釜自適應(yīng)系統(tǒng)結(jié)構(gòu)如圖6-15所示。
考慮到在控制方案中使用了線性參考模型,選擇的是線性比例調(diào)節(jié),在神經(jīng)控制器剛進(jìn)入使用的初級(jí)階段,仍然有比較好的控制效果。選擇的控制規(guī)律用
q(t)=k[Cs(t)-Ca(t)]+f[Ca(t),T(t),Cs
(t)]+qr圖6-15直接反應(yīng)釜自適應(yīng)系統(tǒng)結(jié)構(gòu)式中,k是比例系數(shù),Cs是給定值,Ca(t)是網(wǎng)絡(luò)輸出值,qr是穩(wěn)定狀態(tài)下穩(wěn)態(tài)濃度對(duì)應(yīng)的控制輸入,f[·]是3×40×1的三層BP網(wǎng)絡(luò)功能函數(shù)。
線性參考模型選用二階標(biāo)準(zhǔn)模型,角頻率ω=2.7rad/min,阻尼比ξ=1.0,傳遞函數(shù)為訓(xùn)練的目標(biāo)函數(shù)為建模所用神經(jīng)網(wǎng)絡(luò)為6×10×1,網(wǎng)絡(luò)輸出方程為
Ca(k+1)=f[Ca(k),Ca(k-1),…,q(k),g(k-1),…]
反應(yīng)釜系統(tǒng)神經(jīng)控制器用估計(jì)Jacobian陣曲線,如圖6-16所示。由圖可見,在神經(jīng)網(wǎng)絡(luò)作用下,系統(tǒng)的高度非線性能很好地跟蹤線性參考模型。圖6-17是參考模型輸出與實(shí)際輸出相比較的情況。這時(shí),設(shè)定點(diǎn)變化范圍為0.08~0.12mol/L。圖6-16神經(jīng)網(wǎng)絡(luò)估計(jì)Jacobian陣曲線圖6-17CSTR在NNMRAC下的響應(yīng)
6.6預(yù)測(cè)神經(jīng)控制系統(tǒng)
預(yù)測(cè)神經(jīng)控制系統(tǒng)的基本結(jié)構(gòu)如圖6-18所示。
預(yù)測(cè)神經(jīng)系統(tǒng)由被控對(duì)象、控制器、預(yù)測(cè)器、濾波器等部件組成,系統(tǒng)的基本結(jié)構(gòu)仍然是閉環(huán)負(fù)反饋調(diào)節(jié)結(jié)構(gòu)。
被控對(duì)象既可以是線性系統(tǒng),也可以是非線性系統(tǒng)。線性系統(tǒng)的預(yù)測(cè)控制相對(duì)簡單,已經(jīng)解決;非線性系統(tǒng)的預(yù)測(cè)控制還存在較多的困難。
控制器的功能針對(duì)不同的被控對(duì)象而異。對(duì)線性系統(tǒng),它是一般的常規(guī)調(diào)節(jié)器,設(shè)置的目的是維護(hù)系統(tǒng)的穩(wěn)定;對(duì)非線性系統(tǒng),它是一個(gè)優(yōu)化器,即實(shí)行最優(yōu)化控制。圖6-18預(yù)測(cè)神經(jīng)控制系統(tǒng)預(yù)測(cè)器用于提供輸出的預(yù)報(bào)值,它必須能夠模擬或描述被控對(duì)象的動(dòng)態(tài)行為。
濾波器是一個(gè)反饋部件,它把誤差信號(hào)
e1(t)=y(t)-x(t)
經(jīng)濾波后作負(fù)反饋信號(hào)。6.6.1預(yù)測(cè)控制的基本特征
預(yù)測(cè)控制是一種基于模型的控制方式,最早源于20世紀(jì)70年代末期,是一種較為新型的計(jì)算機(jī)控制算法。這種算法有三個(gè)特征:
建立預(yù)測(cè)模型、實(shí)現(xiàn)滾動(dòng)優(yōu)化和反饋校正預(yù)測(cè)。
1.建立預(yù)測(cè)模型
在系統(tǒng)中建立預(yù)測(cè)模型,就是要較為精確地描述系統(tǒng)的動(dòng)態(tài)過程,按照系統(tǒng)的輸入/輸出當(dāng)前值,預(yù)測(cè)系統(tǒng)的走向或輸出未來值。
對(duì)系統(tǒng)的輸出進(jìn)行預(yù)測(cè),首要條件是知道系統(tǒng)的結(jié)構(gòu)及其數(shù)學(xué)描述。對(duì)于線性系統(tǒng),可以充分利用其數(shù)學(xué)模型和狀態(tài)空間模型,利用系統(tǒng)的階躍響應(yīng)和脈沖響應(yīng),使用疊加原理等手段,預(yù)測(cè)系統(tǒng)的未來輸出。
對(duì)于非線性系統(tǒng),也必須充分利用其數(shù)學(xué)模型及其描述,利用對(duì)非線性方程的求解來推斷預(yù)測(cè)未來。由于非線性系統(tǒng)的數(shù)學(xué)模型難于確定,非線性系統(tǒng)的結(jié)構(gòu)經(jīng)常不能用常規(guī)方法描述,導(dǎo)致非線性系統(tǒng)的預(yù)測(cè)困難較大。目前,解決非線性系統(tǒng)預(yù)測(cè)控制的方法有兩個(gè):一個(gè)是在允許的誤差范圍內(nèi)將非線性系統(tǒng)線性化;另一個(gè)是使用神經(jīng)網(wǎng)絡(luò)作預(yù)測(cè)器,因?yàn)樯窠?jīng)網(wǎng)絡(luò)通過辨識(shí)手段,能很好復(fù)現(xiàn)非線性過程。神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器的功能是在控制信號(hào)u(t)和系統(tǒng)輸出y(t)的作用下,為系統(tǒng)提供輸出預(yù)測(cè)值x(t+j/t)(j=N,N+1,…,P),其中N為最小輸出預(yù)測(cè)區(qū)間,P為最大輸出預(yù)測(cè)區(qū)間。
2.實(shí)現(xiàn)滾動(dòng)優(yōu)化
實(shí)現(xiàn)滾動(dòng)優(yōu)化必須要求選擇性能指標(biāo)函數(shù)。在神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)控制中選擇的性能指標(biāo)函數(shù)為式中,ed(t)是未來誤差,其值等于未來時(shí)刻的期望值yd(t)與未來時(shí)刻的預(yù)測(cè)值x(t)之差:
ed(t+j)=yd(t+j)-y(t+j)M是控制范圍,又稱為控制長度,表示未來控制量的考慮范圍;Δu是控制量u(t)的變化值;r是加權(quán)系數(shù),表示控制量變化率Δu的重要程度。上式中未來時(shí)刻的預(yù)測(cè)值x(t+j)是由神經(jīng)預(yù)測(cè)器提供的。如果神經(jīng)預(yù)測(cè)器提供的預(yù)測(cè)值有足夠的精度,那么只需要未來時(shí)刻期望值yd(t)為已知,從指標(biāo)函數(shù)J(N,P,M)就能獲得未來控制量Δu(t)。
對(duì)于控制長度M,在每個(gè)采樣點(diǎn),能算出未來范圍的控制量所具有的時(shí)間長度。
所謂滾動(dòng)優(yōu)化是指:每一步的控制只能算出當(dāng)前的控制量u(t),控制過程是一步一步向前推進(jìn)的過程。在下一t時(shí)刻,重新計(jì)算出來的控制量必然不同于此前的控制量,因
此必須重新優(yōu)化。
3.反饋校正預(yù)測(cè)
引進(jìn)負(fù)反饋的目的是為了提高預(yù)測(cè)的穩(wěn)定性,反饋信號(hào)為被控對(duì)象的輸出y(t)與神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)量輸出x(t)之差:
e1(t)=y(t)-x(t)
式中,y(t)和x(t)都是當(dāng)前實(shí)際輸出值。6.6.2神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)算法
第一步,獲取未來期望輸出序列值yd(t+j)(j=N,N+1,…,P);
第二步,從神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器獲取預(yù)測(cè)輸出x(t+j/t);
第三步,以上一步的誤差為基礎(chǔ),修正可能的誤差:第四步,計(jì)算未來誤差:第五步,將性能指標(biāo)極小化,獲得控制的最優(yōu)序列u(t+j)(j=0,1,2,…,M);第六步,將第一控制量u(t)作用于系統(tǒng),返回第一步。6.6.3單神經(jīng)元預(yù)測(cè)器
能夠作預(yù)測(cè)器的神經(jīng)網(wǎng)絡(luò)有單神經(jīng)元、多層前向網(wǎng)絡(luò)、
輻射基函數(shù)網(wǎng)絡(luò)和Hopfield神經(jīng)網(wǎng)絡(luò)等。
利用自適應(yīng)單神經(jīng)元APE能夠?qū)ο到y(tǒng)的輸出完成預(yù)測(cè),連接權(quán)調(diào)整的公式為
wi(t+1)=wi(t)+λie(t)pi(t)
式中,λi是學(xué)習(xí)步長;wi(t)是t時(shí)刻連接權(quán);e(t)是t+1時(shí)刻實(shí)際輸出值與預(yù)測(cè)值之差:
e(t)=y(t+1)-ym1(t+1)
式中,y(t+1)和ym1(t+1)分別是t+1時(shí)刻預(yù)測(cè)器的期望值和預(yù)測(cè)值。其中預(yù)測(cè)值可表示成
式中,k是連接權(quán)加權(quán)系數(shù);pi(t)是第i次預(yù)測(cè)長度;n是次數(shù),設(shè)n=3,取三個(gè)狀態(tài)x1(t)、x2(t)、x3(t)分別為
p1(t)=ym1(t)
p2(t)=u(t)
p3(t)=1
在預(yù)測(cè)控制算法中常采取單值預(yù)測(cè)控制,以減少計(jì)算量并節(jié)省內(nèi)存容量。單值預(yù)測(cè)控制只預(yù)測(cè)以后的某一步輸出,例如第i步輸出yi(t+j),此時(shí)能做出的輸出值預(yù)報(bào)為
Yd(t+j)=ym(t+j)+[y(t)-ym(t)]上式中j為預(yù)報(bào)的步長,y(t)是系統(tǒng)的實(shí)際輸出,[y(t)-ym(t)]是對(duì)輸出預(yù)測(cè)值的反饋校正信號(hào)。
考慮到預(yù)測(cè)控制僅用當(dāng)前步作控制用,預(yù)測(cè)步數(shù)與控制步數(shù)之差決定了控制效果,因而控制步數(shù)可以選擇為1,表示成
u(t+i)=u(t)
式中,i的取值為[1,j-1]。第j步輸出為
ym(t+j)=w1ym(t)+w2u(t)+w3
式中,w1、w2、w3反映了各項(xiàng)的權(quán)重,它們的大小為
w1=w1(t+j-1)w2(t+j-2)…w1(t+1)w1(t)
w2=w1(t-1)w2(t)+w1(t+1)w2(t+1)+…
+w1(t+j-1)w2(t+j-2)+w2(t+j-1)
w3=w1(t+1)w3(t)+w1(t+2)w3(t+1)+…
+w1(t+j-1)w3(t+j-2)+w3(t+j-1)
若控制作用求解前,單神經(jīng)元已訓(xùn)練結(jié)束,進(jìn)入穩(wěn)態(tài),則有
wi(t)=wi
i=1,2,3
有ym(t+j)=(w1*)pym(t)+[(j-1)w*1+1]w*2u(t)+[(j-1)w*1+1]
w*3控制器的設(shè)計(jì)考慮如下:用Sp表示期望設(shè)定值,跟蹤的參考軌跡采用指數(shù)型柔化形式:
yr(t+j)=ay(t)+(1-a)Sp
式中,yr(t+j)為在t時(shí)刻計(jì)算的t+j時(shí)刻的輸出參考軌跡;a是柔化系數(shù),一般是一個(gè)小于1的正數(shù)。
當(dāng)預(yù)測(cè)控制器用單神經(jīng)元構(gòu)成時(shí),其作用函數(shù)選用S型函數(shù),學(xué)習(xí)算法的優(yōu)化目標(biāo)函數(shù)選擇為輸入輸出關(guān)系式為式中,f(·)為K為神經(jīng)元比例系數(shù)。連接權(quán)修正公式為
vi(t+1)=vi(t)+ηi(yr(t+j)-yc(t+j))xi(t)式中,ηi是學(xué)習(xí)步長;u(t)是控制器輸出且有u(t)∈[-k,k];xi(t)是輸入狀態(tài),分別有
x1(t)=y1(t+j)-yc(t+j)
x2(t)=x1(t)-x1(t-1)
x3(t)=yr(t+j)將wi(t)=w*i用于單神經(jīng)元的學(xué)習(xí)算法時(shí),設(shè)目標(biāo)函數(shù)為能讓Em達(dá)到極小,因?yàn)楸臼降葍r(jià)于連接權(quán)的增量
Δwi(t)=wi(t+1)-wi(t)=λie(t)Pi(t)可見wi(t)的修正方向沿Em關(guān)于wi(t)的負(fù)梯度進(jìn)行,顯然當(dāng)wi(t)=w*i時(shí),Em能達(dá)到極小,由此,
minEm=0
按照同樣的證明方法,能夠證明優(yōu)化目標(biāo)函數(shù)選擇為時(shí),只要設(shè)vi(t)=v*i,也能使Ec取極小值,且有
minEc=0單神經(jīng)元預(yù)測(cè)控制器所采用的算法中,其收斂性與系統(tǒng)的穩(wěn)定性是等價(jià)的,只要學(xué)習(xí)步長小,誤差就能沿梯度方向下降,最終趨向極小值0,從而保證了系統(tǒng)的穩(wěn)定。6.6.4多層前向網(wǎng)絡(luò)預(yù)測(cè)器
使用多層前向網(wǎng)絡(luò)組成預(yù)測(cè)器時(shí),通常利用階躍響應(yīng)數(shù)據(jù),采用動(dòng)態(tài)矩陣控制方法進(jìn)行。本節(jié)介紹使用三層前向網(wǎng)絡(luò)預(yù)測(cè)未來時(shí)刻的輸出。
設(shè)系統(tǒng)階躍預(yù)測(cè)模型為{ai}(i=1,2,…),則線性系統(tǒng)預(yù)測(cè)控制器為
ΔUM(k)=(ATQA+R)-1ATQ[Yd(t)-YP0(t)]
式中,Q,R是性能指標(biāo)
J=‖Yd(t)-YPM(t)‖Q+‖ΔUM‖R
的加權(quán)矩陣;A是動(dòng)態(tài)矩陣,元素為ai:Yd(t)是跟蹤期望矢量;YP0(t)是零輸入預(yù)測(cè)矢量;YPM(t)是跟蹤預(yù)測(cè)矢量;P和M分別是預(yù)測(cè)長度和控制長度。設(shè)三層前向網(wǎng)絡(luò)的輸入層有M個(gè)神經(jīng)元,輸出層有P個(gè)神經(jīng)元,隱層有NH個(gè)神經(jīng)元。為方便計(jì),常選擇NH≥M。網(wǎng)絡(luò)輸入矢量設(shè)為
ΔUM(t)=[Δu(t,t),Δu(t+1,t),…,Δu(t+M-1,t)]T設(shè)控制器為
F=(ATQA+R)-1ATQ其輸入采用誤差矢量
E(t)=Yd(t)-YP0(t)
輸出就是控制增量矢量ΔUM(t)。ΔUM(t)用來改善控制性能,方法是改變u(t),修正u(t)成為前M個(gè)時(shí)刻u(t,t-i+1)的信息加權(quán)平均值,用式子表示成式中,di為加權(quán)系數(shù),通常取值為
d1=1>d2>d3>…>dM改進(jìn)BP算法的方法有以下幾點(diǎn):
(1)先對(duì)BP網(wǎng)絡(luò)離線訓(xùn)練再投入系統(tǒng)運(yùn)行,減少在線學(xué)習(xí)機(jī)會(huì)。
(2)在控制算法中引入中斷,用中斷服務(wù)程序完成預(yù)測(cè)控制,BP算法放入主程序。這樣僅需調(diào)整中斷服務(wù)程序,主程序無需過多修改。
(3)在多個(gè)采樣周期內(nèi)完成一次學(xué)習(xí),學(xué)習(xí)結(jié)束后再調(diào)整加權(quán)值。
舉例說明,設(shè)
y(t)=1.2y(t-1)-0.36y(t-2)+0.1u(t)+0.2u(t-1)選P=10,M=5,N=1,Q=1,R=0.11,校正系數(shù)hi=1(i=1~10),di=e1-i(i=1~5)。
由此預(yù)測(cè)的系統(tǒng)響應(yīng)如圖6-19所示,圖中曲線1為僅加u(t)的原始算法,曲線2為改進(jìn)算法。圖6-19預(yù)測(cè)的系統(tǒng)響應(yīng)6.6.5輻射基函數(shù)網(wǎng)絡(luò)預(yù)測(cè)器
輻射基函數(shù)網(wǎng)絡(luò)簡稱RBP網(wǎng)絡(luò)。與BP網(wǎng)絡(luò)一樣,RBP網(wǎng)絡(luò)也是一種多層前向網(wǎng)絡(luò)。與BP網(wǎng)絡(luò)不同的是,RBP采用的作用函數(shù)是輻射基函數(shù),其特點(diǎn)是輸出對(duì)參數(shù)存在局部線性,因此網(wǎng)絡(luò)訓(xùn)練優(yōu)化可以避開非線性,不存在局部極小,學(xué)習(xí)速度遠(yuǎn)快于BP算法。
RBP網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)能在訓(xùn)練過程中確定。
設(shè)網(wǎng)絡(luò)的輸入有n個(gè),輸出有m個(gè),能實(shí)現(xiàn)的映射為式中,Φ(·)為輻射基函數(shù);‖·‖為歐氏范數(shù);X∈Rn;
Λ0∈Rm,為常偏置矢量;Λj∈Rm(j=1,2,…,M);Cj∈Rn(j=1,2,…,M),為輻射基函數(shù)中心;M為選定的中心個(gè)數(shù)。
令
Λ=[λmj]T
j=0,1,2,…,M
則用三層網(wǎng)絡(luò)能實(shí)現(xiàn)f1(x),輸入層、輸出層的作用函數(shù)選用線性函數(shù),隱層作用函數(shù)選用
Φ(v)=v2logvRBP的連接權(quán)在線調(diào)節(jié)用最小二乘形式:式中,d(t)為期望輸出,Qi為參數(shù),Pi(t)為回歸因子,e(t)為誤差。如果e(t)和Pi(t)不相關(guān),則可用標(biāo)準(zhǔn)RLS算法在線調(diào)整神經(jīng)網(wǎng)絡(luò)的連接權(quán)。RLS算法為:
λ(t+1)=λ(t)+Δλ(t)使用PID形式的修正式以提高算法收斂性:式中,KP為比例系數(shù),KI為積分系數(shù),KD為微分系數(shù)。6.6.6Hopfield網(wǎng)絡(luò)預(yù)測(cè)器
考慮被控對(duì)象為SISO線性系統(tǒng),脈沖響應(yīng)為{hi},基于脈沖響應(yīng)的數(shù)學(xué)模型為
ym(t+1)=g1u(t)+g2u(t-1)+…+gNu(t-N+1)
=Gm(Z-1)u(t)
相應(yīng)算法如下:基于Gm(Z)的多步輸出預(yù)測(cè)為
yp(t+j)=ym(t+j)+hje(t)
式中,{yp(t)}是預(yù)測(cè)輸出序列;hj是誤差修正系數(shù);e(t)=y(t)-ym(t),是預(yù)測(cè)誤差;j=1,2,…,P;P是預(yù)測(cè)長度。性能指標(biāo)函數(shù)取為式中,M為控制時(shí)域長度;λj為加權(quán)系數(shù);yr(t+j)為輸入?yún)⒖夹盘?hào);N為模型長度,常取P=M=N。將yp(t+j)表達(dá)式代入到J中,整理可得
J=J1+J2+J3+J4+J5+J6+J7式中,其中,xij,wij,mi,qi,ri,y(t+i),λ均為中間變量。在t時(shí)刻,J2,J5,J6三項(xiàng)均為確定項(xiàng)。因而使J為最小等價(jià)于以下式為最?。篐opfield網(wǎng)絡(luò)的計(jì)算能量函數(shù)為對(duì)比J和E的表達(dá)式,可知u(t+i-1)與第i個(gè)神經(jīng)元的輸出vi相對(duì)應(yīng)。Tij和Ii分別是加權(quán)值及偏流,它們分別為
其中,i=1,2,…,N;當(dāng)i=N時(shí),mi=0。
Hopfield網(wǎng)絡(luò)可由選擇加權(quán)值Tij和偏置Ii來實(shí)現(xiàn),這時(shí)它的輸入偏置是系統(tǒng)輸出預(yù)測(cè)值yi(t+i)的濾波值,輸出是控制量u(t+i-1),其中i=1,2,…,N。以線性系統(tǒng)為例,系統(tǒng)為
(1+0.5z-1)y(t)=(0.5+0.2z-1)u(t-2)+ξ(t)使用上述方法構(gòu)成控制器,取λ=0.5,hi=1,y(t)是輻值為1的方波,ξ(t)是方差0.001的隨機(jī)白噪聲,仿真結(jié)果令人滿意。
6.7自校正神經(jīng)控制系統(tǒng)
自校正控制(Self-TuningControl)簡稱STC,主要用在兩種場合:
(1)被控對(duì)象是線性系統(tǒng)但不確定,且存在隨機(jī)干擾噪聲;
(2)被控對(duì)象是非線性系統(tǒng)。6.7.1自校正神經(jīng)控制系統(tǒng)的基本結(jié)構(gòu)
自校正控制系統(tǒng)有兩種基本結(jié)構(gòu):直接型和間接型。
1.直接型自校正控制(DSTC)
DSTC是一種開環(huán)控制,其結(jié)構(gòu)如圖6-20所示。
神經(jīng)控制器位于前饋通道上,設(shè)被控對(duì)象的傳遞函數(shù)為p(z),神經(jīng)控制的功能是實(shí)現(xiàn)構(gòu)成被控對(duì)象的逆模型。這種方式要求神經(jīng)控制器能在線調(diào)整,因此收斂速度較快的一些神經(jīng)網(wǎng)絡(luò)才有資格作神經(jīng)控制器。
被控對(duì)象既可以是線性結(jié)構(gòu),也允許非線性結(jié)構(gòu),但是一定要求其動(dòng)態(tài)可逆,不可逆的對(duì)象不適于使用DSTC。圖6-20直接型自校正控制結(jié)構(gòu)圖神經(jīng)逆模型辨識(shí)器的功能是實(shí)現(xiàn)被控對(duì)象p(z)的d階逆模型(設(shè)被控對(duì)象是一種非線性系統(tǒng),有d≥1階時(shí)延且可逆)。在一般的意義上,神經(jīng)逆模型辨識(shí)器與神經(jīng)控制器具有相同的結(jié)構(gòu)與學(xué)習(xí)算法,逆模型的精確程度直接決定了系統(tǒng)給定值r制約系統(tǒng)輸出值y的精度。
控制信號(hào)與辨識(shí)器輸出之差成為控制器及辨識(shí)器的訓(xùn)練信號(hào)。
由于使用開環(huán),系統(tǒng)不能有效制止或排除干擾信號(hào)。
2.間接型自校正控制(ISTC)
ISTC是一種閉環(huán)控制,其結(jié)構(gòu)如圖6-21所示。
間接自校正控制經(jīng)常簡稱為自校正控制,這是因?yàn)樵谧孕U刂浦谢旧喜皇褂瞄_環(huán)控制,僅使用閉環(huán)控制。
從結(jié)構(gòu)上看,ISTC有三個(gè)特征:
(1)具有負(fù)反饋調(diào)節(jié)的所有系統(tǒng)特征,包括控制器參數(shù)的設(shè)定及穩(wěn)定性判斷。
(2)在結(jié)構(gòu)上存在兩個(gè)反饋回路。一個(gè)是系統(tǒng)輸出y的反饋,神經(jīng)控制器的偏差輸入e(t)為
e(t)=r(t)-y(t)圖6-21間接型自校正控制結(jié)構(gòu)圖另一個(gè)是控制器、辨識(shí)器的反饋??刂破鞯墓δ苁菍?shí)現(xiàn)參數(shù)的自動(dòng)整定,辨識(shí)器的功能是將被控對(duì)象的參數(shù)進(jìn)行在線估計(jì)。通過辨識(shí)與控制器設(shè)計(jì),可以獲得控制器的參數(shù)。
(3)通過辨識(shí)器對(duì)被控對(duì)象的參數(shù)在線估計(jì),以及控制器對(duì)系統(tǒng)參數(shù)的自動(dòng)整定,實(shí)現(xiàn)自適應(yīng)控制。
自校正控制能夠?qū)崿F(xiàn)的關(guān)鍵問題是如何在線設(shè)計(jì)辨識(shí)器與控制器。6.7.2神經(jīng)自校正控制算法
現(xiàn)考慮在工程上常見的一類SISO仿射非線性離散系統(tǒng)作為被控對(duì)象:
y(k+1)=f0(·)+g0(·)u(k)
式中,
f0(·)=f[y(k),y(k-1),…,y(k-n+1)]
g0(·)=g[u(k-d),…,u(k-d-m+1)]
且m≤n,在不包括原點(diǎn)的區(qū)域中有界;u是被控對(duì)象的輸入;y是被控對(duì)象的輸出;f0(·)和g0(·)均是非零光滑函數(shù);
d是系統(tǒng)的相對(duì)階次。
1.d=1時(shí)
當(dāng)設(shè)相對(duì)階次d=1時(shí),控制器的控制算法為式中,r(k)是期望跟蹤的參數(shù)信號(hào),即期望輸出。從上式可以得知,若f
0
(·)和g0(·)已知,則可計(jì)算出控制量u(k);如果f0(·)和g0(·)未知,則需要兩個(gè)神經(jīng)網(wǎng)絡(luò)Nf(·)和Ng(·)分別逼近f0(·)和g0(·):
Nf(·)→f0(·)
Ng(·)→g0(·)方法是通過辨識(shí)器在線訓(xùn)練實(shí)現(xiàn)。由此控制算法變?yōu)槭街?,Nf(·)和Ng(·)是兩個(gè)非線性動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)辨識(shí)器。
2.d>1時(shí)
當(dāng)設(shè)相對(duì)階次d>1時(shí),控制器的控制算法初步選擇為但這種選擇存在兩個(gè)問題:
(1)控制量u(t)依賴系統(tǒng)未來的輸入和輸出,在具體操作中難于實(shí)現(xiàn);
(2)采用對(duì)消的方法易使系統(tǒng)變得不穩(wěn)定。為解決這些問題,首先將系統(tǒng)的輸入/輸出形式
y(k+1)=f0(·)+g0(·)u(k)改變成狀態(tài)空間形式:
xn(k+1)=f0[x(k)]+g0[x(k)]xn+m+1(k)
然后借助“零動(dòng)態(tài)響應(yīng)”研究收斂性。
首先選擇狀態(tài)變量
xi(k)=y(k-n+i)i=1,2,…,n
xn+i(k)=u(k-m-d+i)i=1,2,…,m+d-1
得狀態(tài)空間式:
xi(k+1)=xi+1(k)i=1,2,…,n-1
xn(k+1)=f0[x(k)]+g0[x(k)]xn+m+1(k)
xn+i(k+1)=xn+i+1(k)i=1,2,…,m+d-2
xn+m+d-1(k)=u(k)
y(k)=xm(k)當(dāng)d=1時(shí),上面第2個(gè)式子可表示成
xn(k+1)=f0[x(k)]+g0[x(k)]u(k)
當(dāng)d>1時(shí),因系統(tǒng)的未來輸出能用狀態(tài)矢量x(k)的分量表示,且有
xn(k+1)=y(k+1)
系統(tǒng)算法能改寫成
式中,Z(k)是狀態(tài)變換的一種形式,F(xiàn)[·]、G[·]是Z(k)的無限可微函數(shù)。6.7.3神經(jīng)網(wǎng)絡(luò)逼近
如果非線性被控對(duì)象的結(jié)構(gòu)信息n、m、d均已知,但函數(shù)關(guān)系F[·]、G[·]未知,這時(shí)可用兩個(gè)多層前向神經(jīng)網(wǎng)絡(luò)來逼近未知的非線性關(guān)系。
1.學(xué)習(xí)方法與誤差
被控對(duì)象以輸入/輸出形式表示成:
y(k+d)=fd-1[x(k)]+gd-1[x(k)]u(k)
當(dāng)d=1時(shí)有
y(k+1)=f0[·]+g0[·]u(k)兩個(gè)中的每一個(gè)多層前向網(wǎng)絡(luò)選用三層,f0[·]和g0[·]的隱層分別設(shè)有p和q個(gè)神經(jīng)元,逼近用的神經(jīng)網(wǎng)絡(luò)起辨識(shí)作用。辨識(shí)器的輸入為[x(k),u(k)],輸出為式中,w(k)、v(k)是兩個(gè)網(wǎng)絡(luò)的連接權(quán)系:w(k)=[w0,w1(k),w2(k),…,w2p(k)]v(k)=[v0,v1(k),v2(k),…,v2p(k)]它們的網(wǎng)絡(luò)逼近結(jié)構(gòu)如圖6-22所示。圖6-22神經(jīng)網(wǎng)絡(luò)逼近結(jié)構(gòu)考慮到d≥1,兩個(gè)神經(jīng)網(wǎng)絡(luò)Nf和Ng能夠以任意精度逼近fd-1[x(k)]和gd-1[x(k)],此時(shí)設(shè)r(k)為系統(tǒng)給定輸入,學(xué)習(xí)算法為在自校正系統(tǒng)結(jié)構(gòu)圖中,控制量u(k)同時(shí)施加在被控對(duì)象及神經(jīng)網(wǎng)絡(luò)辨識(shí)器上,神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法依靠網(wǎng)絡(luò)輸出與被控對(duì)象輸出的差值來進(jìn)行,如圖6-23所示。圖6-23神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法學(xué)習(xí)用的誤差定義成:
e*(k+1)=y*(k+1)-y(k+1)
式中,y(k+1)=fd-1[x(k-d+1)]+gd-1[x(k-d+1)]u(k-d+1)
2.修正學(xué)習(xí)算法
設(shè)
θ=[w,v]T
則參數(shù)修正規(guī)則為:式中,若定義一個(gè)死區(qū)函數(shù)D(e):
d0是死區(qū)寬度,為一個(gè)小于1的小正數(shù)。由此可得修正的學(xué)習(xí)算法:
3.仿真實(shí)例
設(shè)被控對(duì)象有非線性時(shí)變特征,仿真模型為用兩個(gè)神經(jīng)網(wǎng)絡(luò)對(duì)系統(tǒng)建模,其中是2×4×4×1的四層前向網(wǎng)絡(luò),是單神經(jīng)元單層網(wǎng),模型為在實(shí)現(xiàn)閉環(huán)控制前,選擇位于u(k)∈[-2.2,2.2]之間的隨機(jī)信號(hào),神經(jīng)網(wǎng)絡(luò)的訓(xùn)練選用標(biāo)準(zhǔn)BP算法,誤差信號(hào)e(k+1)=y(k+1)-y*(k+1)對(duì)網(wǎng)絡(luò)訓(xùn)練10000次后,e(k)降至0.05以內(nèi)。測(cè)試次數(shù)過大,e(k)并無多大改進(jìn)。
仿真步驟如下:
(1)預(yù)先對(duì)神經(jīng)網(wǎng)絡(luò)訓(xùn)練20000次,此時(shí)的參數(shù)θ(k)記為θ(20000)。
(2)將大小為Δ的擾動(dòng)加到w(20000)和(20000)上,擾動(dòng)后系統(tǒng)初始輸出-2.0,對(duì)參考信號(hào)r(k)實(shí)行跟蹤,取r(k)=1.5sin(πk/50)。
(3)運(yùn)行6000次,檢測(cè)閉環(huán)系統(tǒng)跟蹤誤差是否收斂。
(4)繼續(xù)運(yùn)行8000次,進(jìn)一步觀測(cè)閉環(huán)系統(tǒng)跟蹤誤差的收斂性能。
(5)取MATLAB14位小數(shù)的精度,觀測(cè)網(wǎng)絡(luò)參數(shù)是否有變化,如果有,則沒有收斂;只有網(wǎng)絡(luò)參數(shù)無變化,才表明跟蹤誤差已收斂到死區(qū)內(nèi)。
仿真結(jié)果如表6-2所示,討論如下。
(1)當(dāng)Δ=0時(shí),如果d0不能增加到0.075,即便無擾動(dòng),誤差也不能收斂到0。
(2)當(dāng)d0維持0.075不變,逐漸增加Δ,結(jié)果是只有當(dāng)Δ<0.088時(shí),跟蹤誤差才收斂。
(3)當(dāng)Δ超過了0.088時(shí),必須相應(yīng)增加d0。
從上面的討論可以看到,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度交通安全員聘用與事故處理合同2篇
- 二零二五年度spa館品牌授權(quán)合作協(xié)議2篇
- 2025版能源領(lǐng)域:反商業(yè)賄賂廉潔能源合作協(xié)議書3篇
- 2025年甲基丙烯酸甲酯項(xiàng)目合作計(jì)劃書
- 2024年度專業(yè)護(hù)理月嫂服務(wù)合同范本大全3篇
- 2025年油氣水輸送管材專用料項(xiàng)目合作計(jì)劃書
- 2025年硫精砂合作協(xié)議書
- 2024年度招投標(biāo)部門全面職責(zé)及權(quán)限明確合作協(xié)議3篇
- 2024年餐飲業(yè)股份合作簡單協(xié)議書樣本
- 2025版凱悅酒店消防設(shè)施維修保養(yǎng)及檢測(cè)合同6篇
- 期末(試題)-2024-2025學(xué)年人教PEP版英語六年級(jí)上冊(cè)
- 2024年公安基礎(chǔ)知識(shí)考試題庫及答案
- 三創(chuàng)賽獲獎(jiǎng)-非遺文化創(chuàng)新創(chuàng)業(yè)計(jì)劃書
- 教你成為歌唱達(dá)人智慧樹知到期末考試答案2024年
- 2024分娩鎮(zhèn)痛ppt課件完整版
- 少年宮籃球活動(dòng)教案
- 國有建設(shè)企業(yè)《大宗材料及設(shè)備采購招標(biāo)管理辦法》
- 民間秘術(shù)絕招大全
- N摻雜TiO2納米管的合成及光催化性能研究
- 二沉池設(shè)計(jì)說明書
- (完整版)展廳展館博物館美術(shù)館設(shè)計(jì)標(biāo)招標(biāo)評(píng)分細(xì)則及打分表
評(píng)論
0/150
提交評(píng)論