智能控制_09神經(jīng)網(wǎng)絡(luò)控制_第1頁
智能控制_09神經(jīng)網(wǎng)絡(luò)控制_第2頁
智能控制_09神經(jīng)網(wǎng)絡(luò)控制_第3頁
智能控制_09神經(jīng)網(wǎng)絡(luò)控制_第4頁
智能控制_09神經(jīng)網(wǎng)絡(luò)控制_第5頁
已閱讀5頁,還剩102頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第9章 9.1 概述概述 神經(jīng)網(wǎng)絡(luò)是一種具有高度非線性的連續(xù)時間動力神經(jīng)網(wǎng)絡(luò)是一種具有高度非線性的連續(xù)時間動力系統(tǒng),它有著很強(qiáng)的自學(xué)習(xí)功能和對非線性系統(tǒng)的強(qiáng)系統(tǒng),它有著很強(qiáng)的自學(xué)習(xí)功能和對非線性系統(tǒng)的強(qiáng)大映射能力,已廣泛應(yīng)用于復(fù)雜對象的控制中。神經(jīng)大映射能力,已廣泛應(yīng)用于復(fù)雜對象的控制中。神經(jīng)網(wǎng)絡(luò)所具有的大規(guī)模并行性、冗余性、容錯性、本質(zhì)網(wǎng)絡(luò)所具有的大規(guī)模并行性、冗余性、容錯性、本質(zhì)的非線性及自組織、自學(xué)習(xí)、自適應(yīng)能力,給不斷面的非線性及自組織、自學(xué)習(xí)、自適應(yīng)能力,給不斷面臨挑戰(zhàn)的控制理論帶來生機(jī)。臨挑戰(zhàn)的控制理論帶來生機(jī)。 從控制角度來看,神經(jīng)網(wǎng)絡(luò)用于控制的優(yōu)越性主要從控制角度來看,神經(jīng)網(wǎng)絡(luò)

2、用于控制的優(yōu)越性主要表現(xiàn)為:表現(xiàn)為:(1 1)神經(jīng)網(wǎng)絡(luò)可是處理那些難以用模型或規(guī)則描述的)神經(jīng)網(wǎng)絡(luò)可是處理那些難以用模型或規(guī)則描述的對象;對象;(2)神經(jīng)網(wǎng)絡(luò)采用并行分布式信息處理方式,具有很)神經(jīng)網(wǎng)絡(luò)采用并行分布式信息處理方式,具有很強(qiáng)的容錯性;強(qiáng)的容錯性; (3 3)神經(jīng)網(wǎng)絡(luò)在本質(zhì)上是非線性系統(tǒng),可以實現(xiàn)任意)神經(jīng)網(wǎng)絡(luò)在本質(zhì)上是非線性系統(tǒng),可以實現(xiàn)任意非線性映射。神經(jīng)網(wǎng)絡(luò)在非線性控制系統(tǒng)中具有很大的非線性映射。神經(jīng)網(wǎng)絡(luò)在非線性控制系統(tǒng)中具有很大的發(fā)展前途;發(fā)展前途;(4 4)神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的信息綜合能力,它能夠同時)神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的信息綜合能力,它能夠同時處理大量不同類型的輸入,能夠很

3、好地解決輸入信息處理大量不同類型的輸入,能夠很好地解決輸入信息之間的互補(bǔ)性和冗余性問題;之間的互補(bǔ)性和冗余性問題;(5 5)神經(jīng)網(wǎng)絡(luò)的硬件實現(xiàn)愈趨方便。大規(guī)模集成電路)神經(jīng)網(wǎng)絡(luò)的硬件實現(xiàn)愈趨方便。大規(guī)模集成電路技術(shù)的發(fā)展為神經(jīng)網(wǎng)絡(luò)的硬件實現(xiàn)提供了技術(shù)手段,技術(shù)的發(fā)展為神經(jīng)網(wǎng)絡(luò)的硬件實現(xiàn)提供了技術(shù)手段,為神經(jīng)網(wǎng)絡(luò)在控制中的應(yīng)用開辟了廣闊的前景。為神經(jīng)網(wǎng)絡(luò)在控制中的應(yīng)用開辟了廣闊的前景。神經(jīng)網(wǎng)絡(luò)控制所取得的進(jìn)展為:神經(jīng)網(wǎng)絡(luò)控制所取得的進(jìn)展為:(1) 基于神經(jīng)網(wǎng)絡(luò)的系統(tǒng)辨識:可在已知常規(guī)模型結(jié)構(gòu)基于神經(jīng)網(wǎng)絡(luò)的系統(tǒng)辨識:可在已知常規(guī)模型結(jié)構(gòu)的情況下,估計模型的參數(shù);或利用神經(jīng)網(wǎng)絡(luò)的線性、的情況下,估計

4、模型的參數(shù);或利用神經(jīng)網(wǎng)絡(luò)的線性、非線性特性,建立線性、非線性系統(tǒng)的靜態(tài)、動態(tài)、非線性特性,建立線性、非線性系統(tǒng)的靜態(tài)、動態(tài)、逆動態(tài)及預(yù)測模型;逆動態(tài)及預(yù)測模型;(2) 神經(jīng)網(wǎng)絡(luò)控制器:神經(jīng)網(wǎng)絡(luò)作為控制器,可實現(xiàn)對神經(jīng)網(wǎng)絡(luò)控制器:神經(jīng)網(wǎng)絡(luò)作為控制器,可實現(xiàn)對不確定系統(tǒng)或未知系統(tǒng)進(jìn)行有效的控制,使控制系統(tǒng)不確定系統(tǒng)或未知系統(tǒng)進(jìn)行有效的控制,使控制系統(tǒng)達(dá)到所要求的動態(tài)、靜態(tài)特性;達(dá)到所要求的動態(tài)、靜態(tài)特性;(3) 神經(jīng)網(wǎng)絡(luò)與其他算法相結(jié)合:神經(jīng)網(wǎng)絡(luò)與專家系統(tǒng)、神經(jīng)網(wǎng)絡(luò)與其他算法相結(jié)合:神經(jīng)網(wǎng)絡(luò)與專家系統(tǒng)、模糊邏輯、遺傳算法等相結(jié)合可構(gòu)成新型控制器;模糊邏輯、遺傳算法等相結(jié)合可構(gòu)成新型控制器;(4)

5、 優(yōu)化計算:在常規(guī)控制系統(tǒng)的設(shè)計中,常遇到求解優(yōu)化計算:在常規(guī)控制系統(tǒng)的設(shè)計中,常遇到求解約束優(yōu)化問題,神經(jīng)網(wǎng)絡(luò)為這類問題提供了有效的途約束優(yōu)化問題,神經(jīng)網(wǎng)絡(luò)為這類問題提供了有效的途徑;徑;(5) 控制系統(tǒng)的故障診斷:利用神經(jīng)網(wǎng)絡(luò)的逼近特性,控制系統(tǒng)的故障診斷:利用神經(jīng)網(wǎng)絡(luò)的逼近特性,可對控制系統(tǒng)的各種故障進(jìn)行模式識別,從而實現(xiàn)控可對控制系統(tǒng)的各種故障進(jìn)行模式識別,從而實現(xiàn)控制系統(tǒng)的故障診斷。制系統(tǒng)的故障診斷。 神經(jīng)網(wǎng)絡(luò)控制在理論和實踐上,以下問題是研究神經(jīng)網(wǎng)絡(luò)控制在理論和實踐上,以下問題是研究的重點:的重點:(1) 神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性與收斂性問題;神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性與收斂性問題;(2) 神經(jīng)網(wǎng)絡(luò)

6、控制系統(tǒng)的穩(wěn)定性與收斂性問題;神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)的穩(wěn)定性與收斂性問題;(3) 神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法的實時性;神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法的實時性;(4) 神經(jīng)網(wǎng)絡(luò)控制器和辨識器的模型和結(jié)構(gòu)。神經(jīng)網(wǎng)絡(luò)控制器和辨識器的模型和結(jié)構(gòu)。 根據(jù)神經(jīng)網(wǎng)絡(luò)在控制器中的作用不同,神經(jīng)網(wǎng)絡(luò)控制根據(jù)神經(jīng)網(wǎng)絡(luò)在控制器中的作用不同,神經(jīng)網(wǎng)絡(luò)控制器可分為兩類,一類為神經(jīng)控制,它是以神經(jīng)網(wǎng)絡(luò)為基器可分為兩類,一類為神經(jīng)控制,它是以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)而形成的獨立智能控制系統(tǒng);另一類為混合神經(jīng)網(wǎng)絡(luò)礎(chǔ)而形成的獨立智能控制系統(tǒng);另一類為混合神經(jīng)網(wǎng)絡(luò)控制,它是指利用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和優(yōu)化能力來改善傳統(tǒng)控制,它是指利用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和優(yōu)化能力來改善傳統(tǒng)控制的智能

7、控制方法,如自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制等??刂频闹悄芸刂品椒ǎ缱赃m應(yīng)神經(jīng)網(wǎng)絡(luò)控制等。 綜合目前的各種分類方法,可將神經(jīng)網(wǎng)絡(luò)控制的結(jié)構(gòu)綜合目前的各種分類方法,可將神經(jīng)網(wǎng)絡(luò)控制的結(jié)構(gòu)歸結(jié)為以下七類。歸結(jié)為以下七類。9.2 神經(jīng)網(wǎng)絡(luò)控制結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)控制結(jié)構(gòu) 9.2.1 9.2.1 神經(jīng)網(wǎng)絡(luò)監(jiān)督控制神經(jīng)網(wǎng)絡(luò)監(jiān)督控制 通過對傳統(tǒng)控制器進(jìn)行學(xué)習(xí),然后用神經(jīng)網(wǎng)絡(luò)控制器逐漸通過對傳統(tǒng)控制器進(jìn)行學(xué)習(xí),然后用神經(jīng)網(wǎng)絡(luò)控制器逐漸取代傳統(tǒng)控制器的方法,稱為神經(jīng)網(wǎng)絡(luò)監(jiān)督控制。神經(jīng)網(wǎng)絡(luò)監(jiān)取代傳統(tǒng)控制器的方法,稱為神經(jīng)網(wǎng)絡(luò)監(jiān)督控制。神經(jīng)網(wǎng)絡(luò)監(jiān)督控制的結(jié)構(gòu)如圖督控制的結(jié)構(gòu)如圖9-19-1所示。所示。 神經(jīng)網(wǎng)絡(luò)控制器實際上是一個前饋

8、控制器,它建立的是被神經(jīng)網(wǎng)絡(luò)控制器實際上是一個前饋控制器,它建立的是被控對象的逆模型。神經(jīng)網(wǎng)絡(luò)控制器通過對傳統(tǒng)控制器的輸出進(jìn)控對象的逆模型。神經(jīng)網(wǎng)絡(luò)控制器通過對傳統(tǒng)控制器的輸出進(jìn)行學(xué)習(xí),在線調(diào)整網(wǎng)絡(luò)的權(quán)值,使反饋控制輸入趨近于零,從行學(xué)習(xí),在線調(diào)整網(wǎng)絡(luò)的權(quán)值,使反饋控制輸入趨近于零,從而使神經(jīng)網(wǎng)絡(luò)控制器逐漸在控制作用中占據(jù)主導(dǎo)地位,最終取而使神經(jīng)網(wǎng)絡(luò)控制器逐漸在控制作用中占據(jù)主導(dǎo)地位,最終取消反饋控制器的作用。一旦系統(tǒng)出現(xiàn)干擾,反饋控制器重新起消反饋控制器的作用。一旦系統(tǒng)出現(xiàn)干擾,反饋控制器重新起作用。這種前饋加反饋的監(jiān)督控制方法,不僅可以確??刂葡底饔谩_@種前饋加反饋的監(jiān)督控制方法,不僅可以

9、確??刂葡到y(tǒng)的穩(wěn)定性和魯棒性,而且可有效地提高系統(tǒng)的精度和自適應(yīng)統(tǒng)的穩(wěn)定性和魯棒性,而且可有效地提高系統(tǒng)的精度和自適應(yīng)能力。能力。NNC控制器對象+-+ tyd te ty tun tup tu圖9-1 神經(jīng)網(wǎng)絡(luò)監(jiān)督控制 圖圖9-2為神經(jīng)網(wǎng)絡(luò)直接逆控制的兩種結(jié)構(gòu)方案。為神經(jīng)網(wǎng)絡(luò)直接逆控制的兩種結(jié)構(gòu)方案。在圖在圖9-2(a)中,中,NN1和和NN2為具有完全相同的網(wǎng)絡(luò)結(jié)為具有完全相同的網(wǎng)絡(luò)結(jié)構(gòu),并采用相同的學(xué)習(xí)算法,分別實現(xiàn)對象的逆。構(gòu),并采用相同的學(xué)習(xí)算法,分別實現(xiàn)對象的逆。在圖在圖9-2(b)中,神經(jīng)網(wǎng)絡(luò)中,神經(jīng)網(wǎng)絡(luò)NN通過評價函數(shù)進(jìn)行學(xué)習(xí),通過評價函數(shù)進(jìn)行學(xué)習(xí),實現(xiàn)對象的逆控制。實現(xiàn)對象的

10、逆控制。 對象 tyd te ty tun tuNN1NN2+-對象 tyd tE ty tuNN評價函數(shù)(b) 9.2.3 神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制 與傳統(tǒng)自適應(yīng)控制相同,神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制也與傳統(tǒng)自適應(yīng)控制相同,神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制也分為神經(jīng)網(wǎng)絡(luò)自校正控制和神經(jīng)網(wǎng)絡(luò)模型參考自適應(yīng)分為神經(jīng)網(wǎng)絡(luò)自校正控制和神經(jīng)網(wǎng)絡(luò)模型參考自適應(yīng)控制兩種。自校正控制根據(jù)對系統(tǒng)正向或逆模型的結(jié)控制兩種。自校正控制根據(jù)對系統(tǒng)正向或逆模型的結(jié)果調(diào)節(jié)控制器內(nèi)部參數(shù),使系統(tǒng)滿足給定的指標(biāo),而果調(diào)節(jié)控制器內(nèi)部參數(shù),使系統(tǒng)滿足給定的指標(biāo),而在模型參考自適應(yīng)控制中,閉環(huán)控制系統(tǒng)的期望性能在模型參考自適應(yīng)控制中,閉環(huán)控制系統(tǒng)的期望性能由

11、一個穩(wěn)定的參考模型來描述。由一個穩(wěn)定的參考模型來描述。 (2 2)神經(jīng)網(wǎng)絡(luò)間接自校正控制)神經(jīng)網(wǎng)絡(luò)間接自校正控制 其結(jié)構(gòu)如圖其結(jié)構(gòu)如圖9-39-3所示。假設(shè)被控對象為如所示。假設(shè)被控對象為如下單變量仿射非線性系統(tǒng):下單變量仿射非線性系統(tǒng): 若利用神經(jīng)網(wǎng)絡(luò)對非線性函數(shù)若利用神經(jīng)網(wǎng)絡(luò)對非線性函數(shù) 和和 進(jìn)進(jìn)行逼近,得到行逼近,得到 和和 ,則控制器為:,則控制器為:其中其中 為為 時刻的期望輸出值。時刻的期望輸出值。kkkkuygyfy1kyfkygkyfkyg kkkygyfrku/11kr1k神經(jīng)網(wǎng)絡(luò)估計器常規(guī)控制器對象 tyd te tu ty+-g ,f圖圖9-3 9-3 神經(jīng)網(wǎng)絡(luò)間接自校

12、正控制神經(jīng)網(wǎng)絡(luò)間接自校正控制2. 2. 神經(jīng)網(wǎng)絡(luò)模型參考自適應(yīng)控制神經(jīng)網(wǎng)絡(luò)模型參考自適應(yīng)控制 分為直接模型參考自適應(yīng)控制和間接模型分為直接模型參考自適應(yīng)控制和間接模型參考自適應(yīng)控制兩種。參考自適應(yīng)控制兩種。(1 1)直接模型參考自適應(yīng)控制)直接模型參考自適應(yīng)控制 如圖如圖9-4所示。神經(jīng)網(wǎng)絡(luò)控制器的作用是使所示。神經(jīng)網(wǎng)絡(luò)控制器的作用是使被控對象與參考模型輸出之差為最小。但該方被控對象與參考模型輸出之差為最小。但該方法需要知道對象的法需要知道對象的 信息信息 。 Jacobianuy參考模型NNC對象 tr te tu ty+- tym tec+-圖圖9-4 9-4 神經(jīng)網(wǎng)絡(luò)直接模型參考自適應(yīng)控

13、制神經(jīng)網(wǎng)絡(luò)直接模型參考自適應(yīng)控制(2 2)間接模型參考自適應(yīng)控制)間接模型參考自適應(yīng)控制 如圖如圖9-59-5所示。神經(jīng)網(wǎng)絡(luò)辨識器所示。神經(jīng)網(wǎng)絡(luò)辨識器NNINNI向神經(jīng)向神經(jīng)網(wǎng)絡(luò)控制器網(wǎng)絡(luò)控制器NNCNNC提供對象的信息,用于控制器提供對象的信息,用于控制器NNCNNC的學(xué)習(xí)。的學(xué)習(xí)。參考模型NNC對象 tr te tu ty+- tym tec+-NNC+- tei tyn圖圖9-5 神經(jīng)網(wǎng)絡(luò)間接模型參考自適應(yīng)控制神經(jīng)網(wǎng)絡(luò)間接模型參考自適應(yīng)控制 9.2.4 9.2.4 神經(jīng)網(wǎng)絡(luò)內(nèi)??刂粕窠?jīng)網(wǎng)絡(luò)內(nèi)??刂?經(jīng)典的內(nèi)??刂茖⒈豢叵到y(tǒng)的正向模型和逆模型直經(jīng)典的內(nèi)模控制將被控系統(tǒng)的正向模型和逆模型直接

14、加入反饋回路,系統(tǒng)的正向模型作為被控對象的近接加入反饋回路,系統(tǒng)的正向模型作為被控對象的近似模型與實際對象并聯(lián),兩者輸出之差被用作反饋信似模型與實際對象并聯(lián),兩者輸出之差被用作反饋信號,該反饋信號又經(jīng)過前向通道的濾波器及控制器進(jìn)號,該反饋信號又經(jīng)過前向通道的濾波器及控制器進(jìn)行處理??刂破髦苯优c系統(tǒng)的逆有關(guān),通過引入濾波行處理??刂破髦苯优c系統(tǒng)的逆有關(guān),通過引入濾波器來提高系統(tǒng)的魯棒性。器來提高系統(tǒng)的魯棒性。 圖圖9-69-6為神經(jīng)網(wǎng)絡(luò)內(nèi)??刂?,被控對象的正向模型及為神經(jīng)網(wǎng)絡(luò)內(nèi)模控制,被控對象的正向模型及控制器均由神經(jīng)網(wǎng)絡(luò)來實現(xiàn)??刂破骶缮窠?jīng)網(wǎng)絡(luò)來實現(xiàn)。濾波器對象+- tyd te ty tu

15、神經(jīng)網(wǎng)絡(luò)控制器神經(jīng)網(wǎng)絡(luò)正向模型NN1NN2 tym+-d圖圖9-6 神經(jīng)網(wǎng)絡(luò)內(nèi)??刂粕窠?jīng)網(wǎng)絡(luò)內(nèi)??刂?9.2.5 9.2.5 神經(jīng)網(wǎng)絡(luò)預(yù)測控制神經(jīng)網(wǎng)絡(luò)預(yù)測控制 預(yù)測控制又稱為基于模型的控制,是預(yù)測控制又稱為基于模型的控制,是7070年代后期發(fā)年代后期發(fā)展起來的新型計算機(jī)控制方法,該方法的特征是預(yù)測展起來的新型計算機(jī)控制方法,該方法的特征是預(yù)測模型、滾動優(yōu)化和反饋校正。模型、滾動優(yōu)化和反饋校正。 神經(jīng)網(wǎng)絡(luò)預(yù)測控制的結(jié)構(gòu)如圖神經(jīng)網(wǎng)絡(luò)預(yù)測控制的結(jié)構(gòu)如圖9-79-7所示,神經(jīng)網(wǎng)絡(luò)預(yù)所示,神經(jīng)網(wǎng)絡(luò)預(yù)測器建立了非線性被控對象的預(yù)測模型,并可在線進(jìn)測器建立了非線性被控對象的預(yù)測模型,并可在線進(jìn)行學(xué)習(xí)修正。行

16、學(xué)習(xí)修正。 利用此預(yù)測模型,通過設(shè)計優(yōu)化性能指標(biāo),利用非利用此預(yù)測模型,通過設(shè)計優(yōu)化性能指標(biāo),利用非線性優(yōu)化器可求出優(yōu)化的控制作用線性優(yōu)化器可求出優(yōu)化的控制作用 。 tu非線性優(yōu)化器對象+- tyd te ty tu+d神經(jīng)網(wǎng)絡(luò)預(yù)測器濾波器 ty +-kty 圖9-7 神經(jīng)網(wǎng)絡(luò)預(yù)測控制9.2.6 9.2.6 神經(jīng)網(wǎng)絡(luò)自適應(yīng)評判控制神經(jīng)網(wǎng)絡(luò)自適應(yīng)評判控制 神經(jīng)網(wǎng)絡(luò)自適應(yīng)評判控制通常由兩個網(wǎng)絡(luò)組成,如神經(jīng)網(wǎng)絡(luò)自適應(yīng)評判控制通常由兩個網(wǎng)絡(luò)組成,如圖圖9-89-8所示。自適應(yīng)評判網(wǎng)絡(luò)通過不斷的獎勵、懲罰等所示。自適應(yīng)評判網(wǎng)絡(luò)通過不斷的獎勵、懲罰等再勵學(xué)習(xí),使自己逐漸成為一個合格的再勵學(xué)習(xí),使自己逐漸成

17、為一個合格的“教師教師”,學(xué)習(xí),學(xué)習(xí)完成后,根據(jù)系統(tǒng)目前的狀態(tài)和外部激勵反饋信號產(chǎn)生完成后,根據(jù)系統(tǒng)目前的狀態(tài)和外部激勵反饋信號產(chǎn)生一個內(nèi)部再勵信號,以對目前的控制效果作出評價。控一個內(nèi)部再勵信號,以對目前的控制效果作出評價??刂七x擇網(wǎng)絡(luò)相當(dāng)于一個在內(nèi)部再勵信號指導(dǎo)下進(jìn)行學(xué)習(xí)制選擇網(wǎng)絡(luò)相當(dāng)于一個在內(nèi)部再勵信號指導(dǎo)下進(jìn)行學(xué)習(xí)的多層前饋神經(jīng)網(wǎng)絡(luò)控制器,該網(wǎng)絡(luò)在進(jìn)行學(xué)習(xí)后,根的多層前饋神經(jīng)網(wǎng)絡(luò)控制器,該網(wǎng)絡(luò)在進(jìn)行學(xué)習(xí)后,根據(jù)編碼后的系統(tǒng)狀態(tài),在允許控制集中選擇下一步的控?fù)?jù)編碼后的系統(tǒng)狀態(tài),在允許控制集中選擇下一步的控制作用。制作用。自適應(yīng)評價網(wǎng)絡(luò)控制選擇網(wǎng)絡(luò)對象 tu ty編碼器 tr tr 內(nèi)部再

18、勵外部再勵反饋圖圖9-8 神經(jīng)網(wǎng)絡(luò)自適應(yīng)評判控制神經(jīng)網(wǎng)絡(luò)自適應(yīng)評判控制 9.2.7 9.2.7 神經(jīng)網(wǎng)絡(luò)混合控制神經(jīng)網(wǎng)絡(luò)混合控制 該控制方法是集成人工智能各分支的優(yōu)點,由神該控制方法是集成人工智能各分支的優(yōu)點,由神經(jīng)網(wǎng)絡(luò)技術(shù)與模糊控制、專家系統(tǒng)等相結(jié)合而形成的經(jīng)網(wǎng)絡(luò)技術(shù)與模糊控制、專家系統(tǒng)等相結(jié)合而形成的一種具有很強(qiáng)學(xué)習(xí)能力的智能控制系統(tǒng)。一種具有很強(qiáng)學(xué)習(xí)能力的智能控制系統(tǒng)。 由神經(jīng)網(wǎng)絡(luò)和模糊控制相結(jié)合構(gòu)成模糊神經(jīng)網(wǎng)絡(luò),由神經(jīng)網(wǎng)絡(luò)和模糊控制相結(jié)合構(gòu)成模糊神經(jīng)網(wǎng)絡(luò),由神經(jīng)網(wǎng)絡(luò)和專家系統(tǒng)相結(jié)合構(gòu)成神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)。由神經(jīng)網(wǎng)絡(luò)和專家系統(tǒng)相結(jié)合構(gòu)成神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)。神經(jīng)網(wǎng)絡(luò)混合控制可使控制系統(tǒng)同時具有

19、學(xué)習(xí)、推理神經(jīng)網(wǎng)絡(luò)混合控制可使控制系統(tǒng)同時具有學(xué)習(xí)、推理和決策能力。和決策能力。 9.3 單單9.3.1 單神經(jīng)元自適應(yīng)控制算法單神經(jīng)元自適應(yīng)控制算法 單神經(jīng)元自適應(yīng)控制的結(jié)構(gòu)如圖單神經(jīng)元自適應(yīng)控制的結(jié)構(gòu)如圖9-9所示。所示。圖圖9-9 單神經(jīng)元自適應(yīng)單神經(jīng)元自適應(yīng)PID控制結(jié)構(gòu)控制結(jié)構(gòu) 單神經(jīng)元自適應(yīng)控制器是通過對加權(quán)系數(shù)的調(diào)單神經(jīng)元自適應(yīng)控制器是通過對加權(quán)系數(shù)的調(diào)整來實現(xiàn)自適應(yīng)、自組織功能,控制算法為整來實現(xiàn)自適應(yīng)、自組織功能,控制算法為 如果權(quán)系數(shù)的調(diào)整按有監(jiān)督的如果權(quán)系數(shù)的調(diào)整按有監(jiān)督的Hebb學(xué)習(xí)規(guī)則實學(xué)習(xí)規(guī)則實現(xiàn),即在學(xué)習(xí)算法中加入監(jiān)督項現(xiàn),即在學(xué)習(xí)算法中加入監(jiān)督項 ,則神經(jīng)網(wǎng)絡(luò)權(quán)

20、,則神經(jīng)網(wǎng)絡(luò)權(quán)值學(xué)習(xí)算法為:值學(xué)習(xí)算法為:31)()() 1()(iiikxkwKkuku kz)()()() 1()()()()() 1()()()()() 1()(333222111kxkukzkwkwkxkukzkwkwkxkukzkwkw式中,式中, 為 學(xué) 習(xí) 速 率 ,為 學(xué) 習(xí) 速 率 , 為 神 經(jīng) 元 的 比 例 系為 神 經(jīng) 元 的 比 例 系數(shù),數(shù), 。 kekz)()(1kekx) 1()()(2kekekx) 2() 1(2)()()(23kekekekekxK0K 值的選擇非常重要。值的選擇非常重要。 越大,則快速性越好,越大,則快速性越好,但超調(diào)量大,甚至可能使系

21、統(tǒng)不穩(wěn)定。當(dāng)被控對象但超調(diào)量大,甚至可能使系統(tǒng)不穩(wěn)定。當(dāng)被控對象時延增大時,時延增大時, 值必須減少,以保證系統(tǒng)穩(wěn)定。值必須減少,以保證系統(tǒng)穩(wěn)定。 值選擇過小,會使系統(tǒng)的快速性變差。值選擇過小,會使系統(tǒng)的快速性變差。KKKK)(40.5sgn(sin)(tkrin9.3.2 9.3.2 仿真實例仿真實例 2)-(0.6321)-(0.102)-(0.261)-(0.368)(kukukykyky9.4 RBF9.4 RBF網(wǎng)絡(luò)監(jiān)督控制網(wǎng)絡(luò)監(jiān)督控制9.4.1 RBF9.4.1 RBF網(wǎng)絡(luò)監(jiān)督控制算法網(wǎng)絡(luò)監(jiān)督控制算法 基于RBF網(wǎng)絡(luò)的監(jiān)督控制系統(tǒng)結(jié)構(gòu)如圖9-14所示。 RBFPD控制對象+-+ k

22、r ke ky kun kup ku圖圖9-14 9-14 神經(jīng)網(wǎng)絡(luò)監(jiān)督控制神經(jīng)網(wǎng)絡(luò)監(jiān)督控制 在在RBFRBF網(wǎng)絡(luò)結(jié)構(gòu)中,取網(wǎng)絡(luò)的輸入為網(wǎng)絡(luò)結(jié)構(gòu)中,取網(wǎng)絡(luò)的輸入為 ,網(wǎng)絡(luò),網(wǎng)絡(luò)的徑向基向量為的徑向基向量為 , 為高斯基函數(shù):為高斯基函數(shù): krTmhh,1Hjh )2-exp(-22jjjbkrhC網(wǎng)絡(luò)的權(quán)向量為:網(wǎng)絡(luò)的權(quán)向量為: RBFRBF網(wǎng)絡(luò)的輸出為:網(wǎng)絡(luò)的輸出為: 其中其中 為為RBFRBF網(wǎng)絡(luò)隱層神經(jīng)元的個數(shù)。網(wǎng)絡(luò)隱層神經(jīng)元的個數(shù)。T1,mwwW mmjjnwhwhwhku11m控制律為:控制律為: kukukunp設(shè)神經(jīng)網(wǎng)絡(luò)調(diào)整的性能指標(biāo)為:設(shè)神經(jīng)網(wǎng)絡(luò)調(diào)整的性能指標(biāo)為: 221ku

23、kukEn采用梯度下降法調(diào)整網(wǎng)絡(luò)的權(quán)值:采用梯度下降法調(diào)整網(wǎng)絡(luò)的權(quán)值: kwkukwkujnjp近似地取近似地取由此所產(chǎn)生的不精確通過權(quán)值調(diào)節(jié)來補(bǔ)償。由此所產(chǎn)生的不精確通過權(quán)值調(diào)節(jié)來補(bǔ)償。神經(jīng)網(wǎng)絡(luò)權(quán)值的調(diào)整過程為:神經(jīng)網(wǎng)絡(luò)權(quán)值的調(diào)整過程為:其中其中 為學(xué)習(xí)速率,為學(xué)習(xí)速率, 為動量因子。為動量因子。 211kkkkkWWWWW khkukukwkukukukwkEkwjnjpnjj則則9.4.2 9.4.2 仿真實例仿真實例被控對象為:被控對象為:ssG1047087.35ss1000)(23RBF網(wǎng)絡(luò)監(jiān)督控制程序為網(wǎng)絡(luò)監(jiān)督控制程序為chap9_2.m 神經(jīng)間接自校正控制結(jié)構(gòu)如圖神經(jīng)間接自校正

24、控制結(jié)構(gòu)如圖9-17所示,所示,它由兩個回路組成:它由兩個回路組成:(1)自校正控制器與被控對象構(gòu)成的反饋回)自校正控制器與被控對象構(gòu)成的反饋回路。路。(2)神經(jīng)網(wǎng)絡(luò)辯識器與控制器設(shè)計,以得到)神經(jīng)網(wǎng)絡(luò)辯識器與控制器設(shè)計,以得到控制器的參數(shù)。控制器的參數(shù)。 辯識器與自校正控制器的在線設(shè)計是自校辯識器與自校正控制器的在線設(shè)計是自校正控制實現(xiàn)的關(guān)鍵。正控制實現(xiàn)的關(guān)鍵。圖圖9-17 9-17 神經(jīng)網(wǎng)絡(luò)間接自校正控制框圖神經(jīng)網(wǎng)絡(luò)間接自校正控制框圖9.5.2 9.5.2 自校正控制算法自校正控制算法 考慮被控對象:考慮被控對象:其中其中 , 分別為對象的輸入、輸出,分別為對象的輸入、輸出, 為非為非零函

25、數(shù)。零函數(shù)。 kukykygky1uy 1)(krgku g NkrNNgku1)( g g Ng N9.5.3 RBF9.5.3 RBF網(wǎng)絡(luò)自校正控制算法網(wǎng)絡(luò)自校正控制算法 采用兩個采用兩個RBF網(wǎng)絡(luò)分別實現(xiàn)未知項網(wǎng)絡(luò)分別實現(xiàn)未知項 、 的的辨識。辨識。RBF網(wǎng)絡(luò)辨識器的結(jié)構(gòu)如圖網(wǎng)絡(luò)辨識器的結(jié)構(gòu)如圖9-18所示,所示, 和和 分別為兩個神經(jīng)網(wǎng)絡(luò)的權(quán)值向量。分別為兩個神經(jīng)網(wǎng)絡(luò)的權(quán)值向量。 g WV圖圖9-18 9-18 神經(jīng)網(wǎng)絡(luò)辨識器神經(jīng)網(wǎng)絡(luò)辨識器 在在RBF網(wǎng)絡(luò)結(jié)構(gòu)中,取網(wǎng)絡(luò)的輸入為網(wǎng)絡(luò)結(jié)構(gòu)中,取網(wǎng)絡(luò)的輸入為 ,網(wǎng),網(wǎng)絡(luò)的徑向基向量為絡(luò)的徑向基向量為 , 為高斯基為高斯基函數(shù):函數(shù): 其中其

26、中 。 為節(jié)點為節(jié)點 的基寬度參數(shù),的基寬度參數(shù), , 為網(wǎng)絡(luò)第為網(wǎng)絡(luò)第 個結(jié)點的中心矢量,個結(jié)點的中心矢量, , 。 kyTmhh,1Hjh )2-exp(-22jjjbkyhCmj, 1jbj0jbjCjmjcc111,CTmbb,1B兩個兩個RBF網(wǎng)絡(luò)的輸出分別為:網(wǎng)絡(luò)的輸出分別為: mmjjwhwhwhkNg11 mmjjvhvhvhkN11m 1;1;1kukVkyNkWkyNgkym辨識后,對象的輸出為:辨識后,對象的輸出為:其中其中 為為RBF網(wǎng)絡(luò)隱層神經(jīng)元的個數(shù)。網(wǎng)絡(luò)隱層神經(jīng)元的個數(shù)。網(wǎng)絡(luò)的權(quán)向量為:網(wǎng)絡(luò)的權(quán)向量為:T1,mwwWT1,mvvV采用梯度下降法調(diào)整網(wǎng)絡(luò)的權(quán)值:采用

27、梯度下降法調(diào)整網(wǎng)絡(luò)的權(quán)值: khkykykwkEkwjmwjwj khkykykvkEkvjmvjvj設(shè)神經(jīng)網(wǎng)絡(luò)調(diào)整的性能指標(biāo)為:設(shè)神經(jīng)網(wǎng)絡(luò)調(diào)整的性能指標(biāo)為: 221kykykEm 神經(jīng)網(wǎng)絡(luò)自校正控制系統(tǒng)的結(jié)構(gòu)如圖神經(jīng)網(wǎng)絡(luò)自校正控制系統(tǒng)的結(jié)構(gòu)如圖9-19所示。所示。 神經(jīng)網(wǎng)絡(luò)權(quán)值的調(diào)整過程為:神經(jīng)網(wǎng)絡(luò)權(quán)值的調(diào)整過程為: 211kkkkkWWWWW 211kkkkkVVVVV其中其中 和和 為學(xué)習(xí)速率,為學(xué)習(xí)速率, 為動量因子。為動量因子。wv圖圖9-19 9-19 神經(jīng)網(wǎng)絡(luò)自校正控制框圖神經(jīng)網(wǎng)絡(luò)自校正控制框圖 9.5.4 仿真實例仿真實例 被控對象為:被控對象為:其中其中 , 。 ) 1(15

28、)1(sin(8 . 0)(kukyky 1sin8 . 0kykyg 15kyRBF網(wǎng)絡(luò)自校正控制程序為網(wǎng)絡(luò)自校正控制程序為chap9_3.m。 9.6 基于基于RBF網(wǎng)絡(luò)直接模型參考自適應(yīng)控制網(wǎng)絡(luò)直接模型參考自適應(yīng)控制9.6.1 基于基于RBF網(wǎng)絡(luò)的控制器設(shè)計網(wǎng)絡(luò)的控制器設(shè)計 控制系統(tǒng)的結(jié)構(gòu)如圖控制系統(tǒng)的結(jié)構(gòu)如圖9-23所示。所示。 設(shè)參考模型輸出為設(shè)參考模型輸出為 ,控制系統(tǒng)要求對,控制系統(tǒng)要求對象的輸出象的輸出 能夠跟蹤參考模型的輸出能夠跟蹤參考模型的輸出 。 kym ky kym則跟蹤誤差為:則跟蹤誤差為: kykykecm-參考模型RBF對象 kr ke ku ky+- kym k

29、ec+-圖圖9-23 基于基于RBF網(wǎng)絡(luò)的直接模型參考網(wǎng)絡(luò)的直接模型參考自適應(yīng)控制自適應(yīng)控制指標(biāo)函數(shù)為:指標(biāo)函數(shù)為: 控制器為控制器為RBF網(wǎng)絡(luò)的輸出:網(wǎng)絡(luò)的輸出: 其中其中 為為RBF網(wǎng)絡(luò)隱層神經(jīng)元的個數(shù),網(wǎng)絡(luò)隱層神經(jīng)元的個數(shù), 為第為第 個網(wǎng)絡(luò)隱層神經(jīng)元與輸出層之間的連接權(quán),個網(wǎng)絡(luò)隱層神經(jīng)元與輸出層之間的連接權(quán), 為第個為第個 隱層神經(jīng)元的輸出。隱層神經(jīng)元的輸出。 2k21eckE mmjjwhwhwhku11mjwjjhj在在RBF網(wǎng)絡(luò)結(jié)構(gòu)中,網(wǎng)絡(luò)結(jié)構(gòu)中, 為網(wǎng)絡(luò)的輸入為網(wǎng)絡(luò)的輸入向量。向量。RBF網(wǎng)絡(luò)的徑向基向量為網(wǎng)絡(luò)的徑向基向量為 ,為,為高斯基函數(shù):高斯基函數(shù): 其中其中 , 為節(jié)

30、點為節(jié)點 的基寬度參數(shù),的基寬度參數(shù), , 為網(wǎng)絡(luò)第為網(wǎng)絡(luò)第 個結(jié)點的中心矢量,個結(jié)點的中心矢量, , 。Tnxx,1XTmhh,1Hjh)2-exp(-22jjjbhCXmj, 1jbj0jbjCjjnjijjccc,1CTmbb,1B網(wǎng)絡(luò)的權(quán)向量為:網(wǎng)絡(luò)的權(quán)向量為: 按梯度下降法及鏈?zhǔn)椒▌t,可得權(quán)值的學(xué)按梯度下降法及鏈?zhǔn)椒▌t,可得權(quán)值的學(xué)習(xí)算法如下:習(xí)算法如下:其中其中 為學(xué)習(xí)速率,為學(xué)習(xí)速率, 為動量因子。為動量因子。T1,mwwW jjhkukyecwkEwkk kwwwwjjjjk1-kk同理,可得同理,可得RBF網(wǎng)絡(luò)隱層神經(jīng)元的高斯函數(shù)網(wǎng)絡(luò)隱層神經(jīng)元的高斯函數(shù)的中心參數(shù)及基的中心參

31、數(shù)及基寬的學(xué)習(xí)算法如下:寬的學(xué)習(xí)算法如下: 32-kkkjijjjjjjbchwkuykecbukuykecbkEkbx 2)-(k-1)-(k(1)-(k(k)jjjjjbbkbbb 2kkkjijijjijijijbcxhwkuykeccukuykecckEkc 2)-(kc-1)-(k(c1)-(k(k)ijijijijijkccc 在學(xué)習(xí)算法中,在學(xué)習(xí)算法中, 稱為稱為 信息,表示信息,表示系統(tǒng)的輸出對控制輸入的敏感性,其值可由神系統(tǒng)的輸出對控制輸入的敏感性,其值可由神經(jīng)網(wǎng)絡(luò)辨識而得。在神經(jīng)網(wǎng)絡(luò)算法中,對經(jīng)網(wǎng)絡(luò)辨識而得。在神經(jīng)網(wǎng)絡(luò)算法中,對 值的精確度要求不是很高,不精確部分可值的精確

32、度要求不是很高,不精確部分可通過網(wǎng)絡(luò)參數(shù)及權(quán)值的調(diào)整來修正,關(guān)鍵是其通過網(wǎng)絡(luò)參數(shù)及權(quán)值的調(diào)整來修正,關(guān)鍵是其符號,因此可用符號,因此可用 的正負(fù)號來代替,這樣的正負(fù)號來代替,這樣可使算法更加簡單??墒顾惴ǜ雍唵巍?kuykJacobian kuyk kuyk9.6.2 仿真實例仿真實例 被控對象為一非線性模型:被控對象為一非線性模型: 21-ky1/1-ku1-k0.10y-ky 取采樣周期為取采樣周期為 ,參考模型為,參考模型為 ,其中其中 為正弦信號,為正弦信號, 。msts1 krkykymm16 . 0 krtskkr2sin50. 0)(RBF網(wǎng)絡(luò)直接模型參考自適應(yīng)控制程序為網(wǎng)絡(luò)直

33、接模型參考自適應(yīng)控制程序為chap9_4.m 9.7 基于不確定逼近的基于不確定逼近的RBF網(wǎng)絡(luò)自適應(yīng)控制網(wǎng)絡(luò)自適應(yīng)控制 9.7.1 問題的提出問題的提出其中其中 為為 階正定慣性矩陣,階正定慣性矩陣, 為為 階慣性矩陣,階慣性矩陣, 其中為其中為 階慣性向量。階慣性向量。 如果模型建模精確,且如果模型建模精確,且 ,則控制律可設(shè)計為:則控制律可設(shè)計為: 通過對文獻(xiàn)通過對文獻(xiàn)18的控制方法進(jìn)行詳細(xì)推導(dǎo)及仿真分析,研究基于的控制方法進(jìn)行詳細(xì)推導(dǎo)及仿真分析,研究基于模型不確定逼近的模型不確定逼近的RBF網(wǎng)絡(luò)機(jī)器人自適應(yīng)控制的設(shè)計方法。網(wǎng)絡(luò)機(jī)器人自適應(yīng)控制的設(shè)計方法。 設(shè)設(shè)n關(guān)節(jié)機(jī)械手的動力學(xué)方程為

34、:關(guān)節(jié)機(jī)械手的動力學(xué)方程為:,D q qC q q qGqd(9.30) D qnn,C q q nn G q1n0d dvp,D qqk ek eC q q qG q(9.31) 其中其中 , , 。2p200kv2002k0 將控制律式(9.31)代入式(9.30)中,得到穩(wěn)定的閉環(huán)系統(tǒng)為 (9.32)其中 為理想的角度, , 。 在實際工程中,對象的實際模型很難得到,即無法得到精確的 、,只能建立理想的名義模型。 將機(jī)器人名義模型表示為 , , ,針對名義模型的控制律設(shè)計為: (9.33) 將控制律式(9.33)代入式(9.30)中,得 (9.34) 采用 分別減去上式左右兩邊,并取,

35、, 則vp0ek ek edqdeqqdeqq D q,C q q G q 0Dq0,Cq q 0Gq 0dvp00e, Dqqk ekCq q qGq 0dvp00,D q qC q q qG qDqqk ek eCq q qGqd 000,Dq qCq q qGq0DDD0CCC0GGG 由由式(式(9.359.35)可見,由于模型建模的不精確會導(dǎo)致控制性能的下降。因此,)可見,由于模型建模的不精確會導(dǎo)致控制性能的下降。因此,需要對建模不精確部分進(jìn)行逼近。需要對建模不精確部分進(jìn)行逼近。 式(式(9.359.35)中,取建模不精確部分為:)中,取建模不精確部分為: 假設(shè)模型不確定項為已知,則

36、可設(shè)計修正的控制律為:假設(shè)模型不確定項為已知,則可設(shè)計修正的控制律為: (9.37) 將控制律式(將控制律式(9.37)代入式()代入式(9.30)中,則可得到穩(wěn)定的閉環(huán)系統(tǒng))中,則可得到穩(wěn)定的閉環(huán)系統(tǒng)式(式(9.32)。)。 在實際工程中,模型不確定項在實際工程中,模型不確定項 為未知,為此,需要對不確定項為未知,為此,需要對不確定項進(jìn)行逼近,從而在控制律中實現(xiàn)對不確定項進(jìn)行逼近,從而在控制律中實現(xiàn)對不確定項 的補(bǔ)償。的補(bǔ)償。 10 f xDDqCqGd(9.36) 10 f xDDqCqGd f x f x f x9.7.2 模型不確定部分的模型不確定部分的RBF網(wǎng)絡(luò)逼近網(wǎng)絡(luò)逼近 采用采用

37、RBF網(wǎng)絡(luò)對不確定項網(wǎng)絡(luò)對不確定項 進(jìn)行自適應(yīng)逼近。進(jìn)行自適應(yīng)逼近。 RBF網(wǎng)絡(luò)算法為:網(wǎng)絡(luò)算法為: , (9.38) (9.39) 其中其中X為網(wǎng)絡(luò)的輸入信號,為網(wǎng)絡(luò)的輸入信號,Y為網(wǎng)絡(luò)的輸出信號,為網(wǎng)絡(luò)的輸出信號, 為高斯基函數(shù)的輸出,為高斯基函數(shù)的輸出,為神經(jīng)網(wǎng)絡(luò)權(quán)值。為神經(jīng)網(wǎng)絡(luò)權(quán)值。 由已知證明可知由已知證明可知19,20,在下述假設(shè)條件下,在下述假設(shè)條件下,RBF網(wǎng)絡(luò)針對連續(xù)函數(shù)在緊集范圍內(nèi)網(wǎng)絡(luò)針對連續(xù)函數(shù)在緊集范圍內(nèi)具有任意精度的逼近能力。具有任意精度的逼近能力。 假設(shè):假設(shè):(1)神經(jīng)網(wǎng)絡(luò)輸出為連續(xù);)神經(jīng)網(wǎng)絡(luò)輸出為連續(xù);(2)存在理想逼近的神經(jīng)網(wǎng)絡(luò)輸出,針對一個非常小的正數(shù),有

38、)存在理想逼近的神經(jīng)網(wǎng)絡(luò)輸出,針對一個非常小的正數(shù),有 f x22/xciiigbni,2 , 1 Ty x12,n (9.40) 其中,其中, , 為階矩陣,表示對為階矩陣,表示對 最佳逼近的神最佳逼近的神經(jīng)網(wǎng)絡(luò)權(quán)值。經(jīng)網(wǎng)絡(luò)權(quán)值。 取取 為理想神經(jīng)網(wǎng)絡(luò)的逼近誤差,即為理想神經(jīng)網(wǎng)絡(luò)的逼近誤差,即 (9.41) 由由RBF網(wǎng)絡(luò)的逼近能力可知,建模誤差網(wǎng)絡(luò)的逼近能力可知,建模誤差 為有界,假設(shè)其界為為有界,假設(shè)其界為 ,即,即 (9.42) 其中其中 (9.43) *0max,f x f x *arg minsup,xMxM f xf x * f x *,f xf x 0 0*sup,f xf x

39、 *T,f x x 控制器設(shè)計為 (9.44)其中 (9.45) (9.46)其中 為 的估計值, 。 由于 有界,則 有界,取 。 將控制律式(9.44)代入式(9.30)中,有9.7.3 控制器的設(shè)計及分析控制器的設(shè)計及分析12 10dvp00,Dqqk ek eCq q qGq 20,D q f x * T,f x x f x*maxF0dvp000,D q qC q q qGqDqqk ek eCq q qGqDq fd采用采用 分別減去上式左右兩邊,得:分別減去上式左右兩邊,得:即000,Dq qCq q qGq00dvp0, D q qC q q qGqdDq qDqqk ek e

40、Dq fx 0vp, D q qC q q qG qdDqek ek ef x 1vp0,ek ek ef x DqD q qC q q qG qd vp,ek ek efx fx采采取取 ,建模不精確部分為,建模不精確部分為 ,則,則上式可寫上式可寫為:為:Txee 10 f xDDqCqGd ,xAx B f xf x 其中其中 ,pv0IAkk0 BI 由于由于 則 (9.47) 定義Lyapunov函數(shù)為 (9.48) 其中 。 矩陣P為對稱正定矩陣,并滿足如下Lyapunov方程 (9.49) 其中 。 *TTT,f xf x f xf x f x f x x x x其中其中 。*

41、TxAxB x2T1122Vx Px0T PAA PQ0Q 定義定義22TT,trtriji jrRRRR R 其中其中 為矩陣的跡,則為矩陣的跡,則 tr2Ttr TTTTTTTTTTTTTTTTTTTTTTTTTTT11tr211tr211tr211tr2 x Pxx Px x P AxB xx A xBPx xPAA P xx PB xx PBx B Px B Px x Qxx B Px B Px V 其中其中 , TTTTx PB xx B PxTTTx PB B Px (9.51) 則 (9.52) 可以采用以下兩種自適應(yīng)律設(shè)計方法。 (1)自適應(yīng)律一 取自適應(yīng)律為: (9.53)其

42、中 。 則 由于由于 TTTTtr x B PxB Pxx TTTTTT11tr2V x QxB Pxx B Px TTTBP xx0Txx P B 由于 ,則 由已知 ,設(shè) 為矩陣Q特征值的最小值, 為矩陣特征值的最大值,則 (9.54)要使 ,需要 ,即X的收斂半徑為 TTT12V x Qx B PxT01BminQminQ2m in0m axm in0m ax12122V QxPxxQxP0Vmaxmin02PQxmax0min2PxQ 可見,當(dāng)Q的特征值越大、P的特征值越小、神經(jīng)網(wǎng)絡(luò)建模誤差 的上界 越小時,X的收斂半徑越小,跟蹤效果越好。但該方法不能保證權(quán)值 的有界性。為此,可采用自

43、適應(yīng)律二。 (2)自適應(yīng)律二 取自適應(yīng)律為: (9.56) 其中 , 。 將式(9.56)代入式(9.52)得:0*T1kx PBx 010kTTTT1TTTT111tr21tr2Vkk x Qxx B Pxx Qxx B Px根據(jù)根據(jù)F范數(shù)的性質(zhì),有范數(shù)的性質(zhì),有 ,則,則 則要使要使 ,需要滿足一下條件:,需要滿足一下條件:或或2TFFFtrxxxxxx2TTT*FFFtrtrtr 2T*TT1FFF22*min110maxFFF2min1max10maxFF22max1min1max0max1212121224 x Qxx B PxQxxxPxxQxPxQxPFVkkkkkkk0V 21

44、min0maxmax124kQxP 22max110maxmax24FkkP 即收斂條件為:或即收斂條件為:或 22max110maxmax24FkkP 22max110maxmax24FkkP 210maxmaxmin24kxPQ 2max10maxmaxF1124kkP 因此,采用自適應(yīng)律二,可保證權(quán)值的有界性,即解決神經(jīng)網(wǎng)絡(luò)權(quán)因此,采用自適應(yīng)律二,可保證權(quán)值的有界性,即解決神經(jīng)網(wǎng)絡(luò)權(quán)值的收斂問題。值的收斂問題。 從從 的收斂情況可知:當(dāng)?shù)氖諗壳闆r可知:當(dāng)Q的特征值越大、的特征值越大、P的特征值越小、神經(jīng)的特征值越小、神經(jīng)網(wǎng)絡(luò)建模誤差網(wǎng)絡(luò)建模誤差 的上界的上界 越小、越小、 越小時,則越小

45、時,則X的收斂半徑越小,跟的收斂半徑越小,跟蹤效果越好。蹤效果越好。x0max9.7.3 仿真實例仿真實例 選二關(guān)節(jié)機(jī)器人系統(tǒng)(不考慮摩擦力),其動力學(xué)模型為:選二關(guān)節(jié)機(jī)器人系統(tǒng)(不考慮摩擦力),其動力學(xué)模型為: ,D q qC q q qG qd 0120102201022012 coscoscosvqqqqqqqqqD q 其中其中 其中 , , , 。 誤差擾動、位置指令和系統(tǒng)的初始狀態(tài)分別為: 位置指令為: 被控對象的初值為 ,取 , , 的變化量為20%。0222021220212sinsin,sin0q qqqqqqq qqC q q 1121215 cos8.75 cos8.75

46、 cosgqgqqgqqG q33.13v018.98q028.75q8 . 9g6, 32321ddd,123dddee 1d2d10.2sin 0.510.2 cos 0.5qtqtTT1230.5qqqqDCG 仿真程序中,自適應(yīng)律取第1種,即,控制律取第3種,即,采用神經(jīng)網(wǎng)絡(luò)控制,控制參數(shù)?。?取 ,采用式(3.14)設(shè)計 , ,自適應(yīng)律參數(shù)取 , 高斯基函數(shù)參數(shù)的初始值分別取 和3.0。采用Simulink和S函數(shù)進(jìn)行控制系統(tǒng)的設(shè)計,仿真結(jié)果如圖9-25至圖9-28所示。50000050000050000050Q3 pkvk20 10.001k 21012圖圖9-

47、25 關(guān)節(jié)關(guān)節(jié)1的位置跟蹤的位置跟蹤 圖圖9-26 關(guān)節(jié)關(guān)節(jié)2的位置跟蹤的位置跟蹤圖圖9-27 關(guān)節(jié)關(guān)節(jié)1的模型不確定項及其估計的模型不確定項及其估計圖圖9-28 關(guān)節(jié)關(guān)節(jié)2的模型不確定項及其估計的模型不確定項及其估計 通過對文獻(xiàn)21的控制方法進(jìn)行詳細(xì)推導(dǎo)及仿真分析,研究基于模型整體逼近的機(jī)器人RBF網(wǎng)絡(luò)自適應(yīng)控制設(shè)計方法。9.8.1 問題的提出 設(shè)n關(guān)節(jié)機(jī)械手方程為: (9.57) 其中 為 階正定慣性矩陣, 為 階慣性矩陣,其中 為 階慣性向量, 為摩擦力, 為未知外加干擾, 為控制輸入。9.8 基于模型整體逼近的機(jī)器人基于模型整體逼近的機(jī)器人RBF網(wǎng)絡(luò)自適應(yīng)控制網(wǎng)絡(luò)自適應(yīng)控制 d,D q

48、 qC q q qG qF q D qnn,C q q nn G q1n F q d 跟蹤誤差為: 定義誤差函數(shù)為: (9.58) 其中 ,則 (9.59)其中 。 dttteqq reeT0d qrqedddddddd DrD qqeD qeDqD qeCqGFD qeCrC qeGFCrf ddf xD qeC qeGF 在實際工程中,模型不確定項f為未知,為此,需要對不確定項f進(jìn)行逼近。采用RBF網(wǎng)絡(luò)逼近f,根據(jù) 的表達(dá)式,網(wǎng)絡(luò)輸入取 設(shè)計控制律為: (9.60) 其中 為針對f進(jìn)行逼近的RBF網(wǎng)絡(luò)輸出值。 將控制律式(9.60)代入式(9.59),得: (9.61) fxTTTTTdd

49、dxeeqqq vfK r f xvdvdv0 DrCrfK rfKC rfKC r 如果定義Lyapunov函數(shù)則 這說明在 固定條件下,控制系統(tǒng)的穩(wěn)定依賴于 ,即 對 的逼近精度及干擾 的大小。 采用RBF網(wǎng)絡(luò)對不確定項f進(jìn)行逼近。理想的RBF網(wǎng)絡(luò)算法為:其中為網(wǎng)絡(luò)的輸入信號, 。T12L r DrTTTTTv011222L r Drr Drr K rrDC rr TT0vL r r K rvK0ffd22/iiigxc1,2,in12 nf ff y W x 跟蹤誤差為: 定義誤差函數(shù)為: (9.58)其中, 則 (9.59)其中 。 dttteqq reeT0d qrqeddddddd

50、d DrD qqeD qeDqD qeCqGFD qeCrC qeGFCrf ddf xD qeC qeGF 在實際工程中,模型不確定項f為未知,為此,需要對不確定項f進(jìn)行逼近。采用RBF網(wǎng)絡(luò)逼近,根據(jù)的表達(dá)式,網(wǎng)絡(luò)輸入取 設(shè)計控制律為: (9.60)其中 為針對f進(jìn)行逼近的RBF網(wǎng)絡(luò)輸出值。 將控制律式(9.60)代入式(9.59),得: (9.61)其中 , 。TTTTTdddxeeqqq vfK r f xvdvdv0 DrCrfK rfKC rfKC rfff0d f 如果定義Lyapunov函數(shù)則 這說明在 固定條件下,控制系統(tǒng)的穩(wěn)定依賴于 ,即 對f的逼近精度及干擾 的大小。 采用

51、RBF網(wǎng)絡(luò)對不確定項f進(jìn)行逼近。理想的RBF網(wǎng)絡(luò)算法為: 其中x為網(wǎng)絡(luò)的輸入信號, 。T12L r DrTTTTTv011222L r Drr Drr K rrDC rr TT0vL r r K rvK0fd22/iiigxc1,2,in y W x12 nf ff9.8.2 針對進(jìn)行逼近的控制針對進(jìn)行逼近的控制1控制器的設(shè)計控制器的設(shè)計 采用采用RBF網(wǎng)絡(luò)逼近,則網(wǎng)絡(luò)逼近,則RBF神經(jīng)網(wǎng)絡(luò)的輸出為:神經(jīng)網(wǎng)絡(luò)的輸出為: (9.62)取取 , 設(shè)計控制律為:設(shè)計控制律為: (9.63)其中其中 v 為用于克服神經(jīng)網(wǎng)絡(luò)逼近誤差為用于克服神經(jīng)網(wǎng)絡(luò)逼近誤差 的魯棒項。的魯棒項。 將控制律式(將控制律式

52、(9.63)代入式()代入式(9.59),得:),得: (9.64)其中其中 。 Tf xW xWWWmaxFWW vf xK rv Tvdv1 DrKC rW xvKC r T1dW xv 將魯棒項v設(shè)計為: (9.65)其中 , 。2穩(wěn)定性及收斂性分析穩(wěn)定性及收斂性分析 定義Lyapunov函數(shù): 則將(9.64)式代入上式,得 Ndsgnb vrNeddbTT111tr22Lr DrW F WTTT11tr2Lr Drr DrW F WTTT1TTvd12tr2L r K rrDC rWF Wrrv 根據(jù)機(jī)器人特性有 。取 ,即神經(jīng)網(wǎng)絡(luò)自適應(yīng)律為: (9.66)則由于則T20rDC rT

53、 WFrTWFrTTvdL r K rrvTTTTdddNd0rvrr vrr b0L 9.8.3 針對中各項分別逼近的控制 控制律仍采用式(9.63)。由式(9.59)知,被控對象中的項 可寫為:其中 , 。 采用RBF神經(jīng)網(wǎng)絡(luò)對 中的各項分別進(jìn)行逼近: f x 12,ttf xD q C q q G qF q 1dtqe 2dtqe f x TDDD qW qTCC,C q qW q q TGGG qW q TFFF qW q 則 (9.67) 其中 自適應(yīng)律?。?(9.68) (9.69) (9.70) (9.71)其中 , , , 。 DCTTTTD1C2GFGFttf xW W WW

54、 TABCDxTTTTTDCGFWWWWWTDDDDDDkWF rFr WTCCCCCCkWF rFr WTGGGGGGkWF rFr WTFFFFFFkWF rF r WD0k C0k G0k F0k 穩(wěn)定性分析:穩(wěn)定性分析: 定義Lyapunov函數(shù)為則 將式(9.64)代入上式,得 考慮機(jī)器人特性,并將神經(jīng)網(wǎng)絡(luò)自適應(yīng)律式(9.67)式(9.71)代入上式,得:T1T1T1T1DDDCCCGGGFFF11111trtrtrtr22222TLr MrW FWW FWW FWW FWTTT1T1T1T1DDDCCCGGGFFF1trtrtrtr2Lr Drr DrW FWW FWW FWW FWTTTTT1TvdDDDDT1TT1TT1TCCCCGGGGFFFF12tr2trtrtrL r K rrDC rrr vWF W rWF W rWF W rWF W r 由于考慮魯棒項(9.65),則TTTvDDDDCCCCTTTTGGG

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論