迭代學習控制_第1頁
迭代學習控制_第2頁
迭代學習控制_第3頁
迭代學習控制_第4頁
迭代學習控制_第5頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

迭代學習控制1、 刖言迭代學習控制(IterativeLearningControl,簡稱ILC)是指不斷重復一個同樣的軌跡的控制嘗試,并以此修正控制律,以得到非常好的控制效果的控制方法⑴。迭代學習控制是學習控制的一個重要分支,是一種新型學習控制策略。它通過反復應用先前試驗得到的信息來獲得能夠產(chǎn)生期望輸出軌跡的控制輸入,以改善控制質(zhì)量。與傳統(tǒng)的控制方法不同的是,迭代學習控制能以非常簡單的方式處理不確定度相當高的動態(tài)系統(tǒng),且僅需較少的先驗知識和計算量,同時適應性強,易于實現(xiàn);更主要的是,它不依賴于動態(tài)系統(tǒng)的精確數(shù)學模型,是一種以迭代產(chǎn)生優(yōu)化輸入信號,使系統(tǒng)輸出盡可能逼近理想值的算法。它的研究對那些有著非線性、復雜性、難以建模以及高精度軌跡控制問題有著非常重要的意義。最初的學習控制-迭代學習控制(ILC),由日本學者首倡于1978年。不像其他的的控制方法從線性受控對象起步,迭代學習控制開門見山就把非線性系統(tǒng)作為研究對象,且要在有限區(qū)間[0,T]上實現(xiàn)輸出完全追蹤的控制任務。這里完全追蹤(perfecttracking)指系統(tǒng)的輸出自始至終,無論是暫態(tài)還是穩(wěn)態(tài),都和目標軌道保持一致。顯然,迭代學習控制的起點要比其它控制方法高出一截可是,從二十年的發(fā)展歷程看,起點過高也有不利的一面:發(fā)展空間不足以及難以和主流控制方法相融合。而事實上,只要任務是可重復的,或系統(tǒng)干擾是周期性的,都可用ILC來解決實際問題。從迭代學習控制方法的產(chǎn)生至今已有二十多年的歷史它已經(jīng)發(fā)展成為智能控制領(lǐng)域的一個新的發(fā)展方向,它的研究對那些有著非線性、強耦合、難以建模以及高精度軌跡控制的問題有非常重要的意義。迭代學習控制適用于具有重復運動性質(zhì)的被控系統(tǒng),它的目標是實現(xiàn)有線區(qū)間上的完全跟蹤任務。它通過對被控系統(tǒng)進行控制嘗試,以輸出信號與給定目標的偏差修正不理想的控制信號,使得系統(tǒng)的跟蹤性能得以提高。迭代學習控制的研究對具有較強的非線性耦合、較高的位置重復精度、難以建模和高精度軌跡跟蹤控制要求的動力學系統(tǒng)有著非常重要的意義。2、 迭代學習控制的原理x(x(t)二f(x(t),u(t),t),y(t)二g(x(t),u(t),t) (1)式中,xeRn,yeRm,ueRy分別為系統(tǒng)的狀態(tài),輸出和輸入變量,fQg(?)為適當維數(shù)的向量函數(shù),其結(jié)構(gòu)與參數(shù)均未知。若期望控制uQ存在,則迭代學習控制的目標為:給定期望輸出yC)和每次運行的初始狀態(tài)x(0),要求在給定時間teb,T」內(nèi),按照一定的學習控制算法通過多次的重復運行,使控制輸入u()tu(),而系統(tǒng)輸出yC)tyC)第k次運行時,式(1)表示為:TOC\o"1-5"\h\zk d k dx(t)=f(x(t),u(t),t),y(t)二g(x(t),u(t),t) (2)k k k k k k

跟蹤誤差為:e0=yC)-yC) ⑶k d k迭代學習控制可分為開環(huán)學習和閉環(huán)學習。開環(huán)學習控制的方法是:第k+1次的控制等于第k次控制再加上第k次輸出誤差的校正項,即(4)(5)u(t)=L(uQe(t(4)(5)k+1 kk閉環(huán)學習策略是:取第K+1次運行的誤差作為學習的修正項,u(t)=L(uQeC))k+1 k k+1式中,L為線性或非線性算子。迭代學習控制的基本結(jié)構(gòu)如圖(1)所示圖1、迭代學習控制系統(tǒng)模型圖1中,系統(tǒng)輸入為uC)、輸出為yC),系統(tǒng)的期望輸入y迭代運算的次數(shù),即使得在時間telo,T]內(nèi),系統(tǒng)控制輸入作(udC),系統(tǒng)的輸出yQtyQ。所得的誤差eC)經(jīng)過迭代學習律得出下次的控制輸入uC)k d k k+1并存入控制存儲記憶單元,到下次控制時再調(diào)用。在每次迭代運算后,需要檢驗停止條件。若停止條件滿足,則停止迭代計算⑵。3、迭代學習控制算法Arimoto等首先給出了線性時變連續(xù)系統(tǒng)的D型迭代學習控制律TOC\o"1-5"\h\zuC)=u0+廠eC) (6)k+1 k k式中,r為常數(shù)增益矩陣。在D型算法的基礎(chǔ)上,相繼出現(xiàn)了P型、PI型、PO型迭代學習控制律。從一般意義上來看它們都是PID型迭代學習控制律的特殊形式。PID迭代學習控制律表示為uC)=uC)+reC)+①eC)+屮J1e(》t (7)k+1 k k k k式中,r,①,屮為學習增益矩陣。算法中的誤差信息使用稱為開環(huán)迭代學習控制,如果使用則稱為閉環(huán)迭代學習控制,如果同時使用則稱為開閉環(huán)迭代學習控制。此外,還有高階迭代學習控制算法、最優(yōu)迭代學習控制算法、遺忘因子迭代學習控制算法和反饋-前饋迭代學習控制算法等。4、迭代學習控制的關(guān)鍵技術(shù)4.1迭代學習控制的穩(wěn)定性和收斂性穩(wěn)定性與收斂性問題是研究當學習律與被控系統(tǒng)滿足什么條件時,迭代學習控制過程才是穩(wěn)定收斂的。算法的穩(wěn)定性保證了隨著學習次數(shù)的增加,控制系統(tǒng)不發(fā)散,但是,對于學習控制系統(tǒng)而言,僅僅穩(wěn)定是沒有實際意義的,只有使學習過程收斂到真值,才能保證得到的控制為某種意義下最優(yōu)的控制。收斂是對學習控制的最基本的要求,多數(shù)學者在提出新的學習律的同時,基于被控對象的一些假設,給出了收斂的條件。例如,Arimoto在最初提出PID型學習控制律時,僅針對線性系統(tǒng)在D型學習律下的穩(wěn)定性和收斂條件作了證明。4.2迭代學習控制的初值問題迭代學習控制的初值問題是迭代學習系統(tǒng)的基本問題之一。在設計迭代學習系統(tǒng)時,為保證系統(tǒng)收斂性,往往要求每次迭代開始時刻的迭代初值與期望初值一致。然而,在實際場合,在迭代時難免存在著迭代初值與期望初值不一致的現(xiàn)象。因此,研究任意初值條件下迭代學習系統(tǒng)設計方法是十分重要的⑶。目前關(guān)于初值問題的研究成果集中于壓縮映射方法,常用的方法有:基于PD學習律,在固定初態(tài)下,這種根軌跡能夠保證極限軌跡沿時間軸趨于零;含平均算子的學習律;帶初值脈沖作用的學習律,其中脈沖作用可以克服任意初值誤差,實現(xiàn)從零時刻開始的完全跟蹤;以及初值修正作用,提出的學習律實現(xiàn)從預先指定時刻起的完全跟蹤,初始修正作用的值是有限的,因而克服了初值脈沖作用的缺陷。目前已提出的迭代學習控制算法大多數(shù)要求被控系統(tǒng)每次運行時的初始狀態(tài)在期望軌跡對應的初始狀態(tài)上,當系統(tǒng)的初始狀態(tài)不在期望軌跡上,而在期望軌跡的某一很小的鄰域內(nèi)時,通常把這類問題歸結(jié)為學習控制的魯棒性問題研究。4.3迭代學習控制的魯棒性問題由于開環(huán)迭代學習控制算法只利用了系統(tǒng)前次運行的信息,所以對不可重復的干擾不具有魯棒性,對被控對象無鎮(zhèn)定作用,在學習過程中即使學習律滿足收斂條件也有可能產(chǎn)生很大的跟蹤誤差;而閉環(huán)迭代學習控制算法只利用了系統(tǒng)當前運行的信息,反饋增益必須大,才能精確的跟蹤期望軌跡,但實現(xiàn)中由于執(zhí)行器飽和等因素,使得高增益反饋失去意義⑴。所以從控制信息的使用方面看,兩者都存在一些缺陷⑴。為了增強迭代學習控制系統(tǒng)的魯棒性,常用的方法有:在開環(huán)PID型迭代學習器的基礎(chǔ)上引入一PID反饋控制器,構(gòu)成反饋-前饋迭代學習控制系統(tǒng)。4.4迭代學習控制的速度問題在迭代學習算法研究中,其收斂條件基本上都是在學習次數(shù)kT下給出的。而在實際應用場合,學習次數(shù)k顯然是沒有任何實際意義的。因此,如何使迭代學習過程更快地收斂于期望值是迭代學習控制研究中的另一個重要問題。迭代學習控制本質(zhì)上是一種前饋控制技術(shù),大部分學習律盡管證明了學習收斂的充分條件,但收斂速度還是很慢??衫枚啻螌W習過程中得到的知識來改進后續(xù)學習過程的速度,例如,采用高階迭代控制算法、帶遺忘因子的學習律、利用當前項或反饋配置等方法來構(gòu)造學習律,可使收斂速度大大加快。5、總結(jié)由于迭代學習控制模擬了人腦學習和自我調(diào)節(jié)的功能,因而是一種典型的智能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論