




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
復(fù)雜機(jī)電控制7-迭代學(xué)習(xí)控制-2013-11-19第一頁(yè),共39頁(yè)。第七章迭代學(xué)習(xí)控制
ILC(IterativeLearningControl)7.1迭代學(xué)習(xí)控制概述7.2迭代學(xué)習(xí)控制律7.3迭代學(xué)習(xí)控制簡(jiǎn)單實(shí)例第二頁(yè),共39頁(yè)。遺傳學(xué)習(xí)(RacialLearning):
具有生存能力的動(dòng)物,使那些在它的一生中,能被它所經(jīng)歷的環(huán)境所改造的動(dòng)物,一個(gè)能繁殖的動(dòng)物,至少能夠產(chǎn)生與它大略相似的動(dòng)物,這種從一代到下一代的種族學(xué)習(xí)或系統(tǒng)發(fā)育學(xué)習(xí).學(xué)習(xí)控制系統(tǒng):
它能通過(guò)與被控對(duì)象和環(huán)境的閉環(huán)交互作用,根據(jù)過(guò)去獲得的經(jīng)驗(yàn)信息,逐步改進(jìn)系統(tǒng)自身的未來(lái)性能。第三頁(yè),共39頁(yè)。第七章迭代學(xué)習(xí)控制
ILC(IterativeLearningControl)1978年,Uchiyama(內(nèi)山)在一篇有關(guān)機(jī)器人控制的論文中提出ILC思想(日文雜志Repetive),因文章是日文發(fā)表的,當(dāng)時(shí)并未引起人們的重視。1984年,Arimoto
(有本)和其合作者們將內(nèi)山的初步思想加以完善,建立了實(shí)用的算法,從理論上證明了這種算法的可行性而成為正規(guī)的迭代學(xué)習(xí)控制理論,并以英文發(fā)表了他們的研究成果,迭代學(xué)習(xí)控制ILC(IterativeLearningControl)才得以推廣。第四頁(yè),共39頁(yè)。迭代學(xué)習(xí)是模擬人的學(xué)習(xí)過(guò)程與特性,類(lèi)似于人的“循序漸進(jìn)”。
“Learningbytrail”邊學(xué)邊干的學(xué)習(xí)規(guī)律,使得對(duì)被控對(duì)象的動(dòng)力學(xué)描述和參數(shù)化估計(jì)的復(fù)雜計(jì)算均可以簡(jiǎn)化或省略。第五頁(yè),共39頁(yè)。第七章迭代學(xué)習(xí)控制
ILC(IterativeLearningControl)7.1迭代學(xué)習(xí)控制概述7.2迭代學(xué)習(xí)控制律7.3迭代學(xué)習(xí)控制簡(jiǎn)單實(shí)例第六頁(yè),共39頁(yè)。7.1迭代學(xué)習(xí)控制概述迭代學(xué)習(xí)控制適用的場(chǎng)合,以及與其它控制方法的區(qū)別1.適合場(chǎng)合
可用于不確定的對(duì)象或非線性系統(tǒng),但系統(tǒng)動(dòng)作過(guò)程應(yīng)具有自己的重復(fù)性。2.ILC和ANNC(人工神經(jīng)網(wǎng)絡(luò)控制)的區(qū)別
a.ANNC給定一樣本,包含輸入對(duì)應(yīng)的輸出結(jié)果。
b.ILC只給出期望的輸出,需要獲得合適的輸入達(dá)到或接近期望的輸出。兩者通常都是離線使用學(xué)習(xí)結(jié)果。第七頁(yè),共39頁(yè)。7.1迭代學(xué)習(xí)控制概述3.ILC和最優(yōu)控制的區(qū)別最優(yōu)控制通過(guò)對(duì)描述的數(shù)學(xué)模型的理論優(yōu)化得到所需的控制量。ILC是通過(guò)先前多次的實(shí)驗(yàn)結(jié)果改進(jìn),來(lái)獲得最優(yōu)的控制量。第八頁(yè),共39頁(yè)。7.1迭代學(xué)習(xí)控制概述4.ILC和自適應(yīng)控制的區(qū)別
兩者都是用來(lái)解決系統(tǒng)不確定的問(wèn)題,均基于在線的參數(shù)調(diào)整算法,都要使用與環(huán)境、對(duì)象閉環(huán)交互得到的實(shí)驗(yàn)信息。自適應(yīng)控制是在線的控制,用于緩慢的時(shí)變特性以及新型的控制局勢(shì),對(duì)嚴(yán)重的非線性問(wèn)題失效。ILC的控制是在線的,而學(xué)習(xí)是離線的,適合于建模不良的非線性系統(tǒng),但不宜用于時(shí)變動(dòng)態(tài)系統(tǒng)。
ILC是在每次試驗(yàn)后離線實(shí)現(xiàn)控制,而自適應(yīng)控制的算法是在線算法,且需要進(jìn)行大量的計(jì)算。第九頁(yè),共39頁(yè)。自適應(yīng)控制和常規(guī)的反饋控制和最優(yōu)控制一樣,也是一種基于數(shù)學(xué)模型的控制方法,所不同的只是自適應(yīng)控制所依據(jù)的關(guān)于模型和擾動(dòng)的先驗(yàn)知識(shí)比較少,需要在系統(tǒng)的運(yùn)行過(guò)程中去不斷提取有關(guān)模型的信息,使模型逐步完善。具體地說(shuō),可以依據(jù)對(duì)象的輸入輸出數(shù)據(jù),不斷地辨識(shí)模型參數(shù),這個(gè)過(guò)程稱(chēng)為系統(tǒng)的在線辯識(shí)。隨著生產(chǎn)過(guò)程的不斷進(jìn)行,通過(guò)在線辯識(shí),模型會(huì)變得越來(lái)越準(zhǔn)確,越來(lái)越接近于實(shí)際。在這個(gè)意義下,控制系統(tǒng)具有一定的適應(yīng)能力。比如說(shuō),當(dāng)系統(tǒng)在設(shè)計(jì)階段,由于對(duì)象特性的初始信息比較缺乏,系統(tǒng)在剛開(kāi)始投入運(yùn)行時(shí)可能性能不理想,但是只要經(jīng)過(guò)一段時(shí)間的運(yùn)行,通過(guò)在線辯識(shí)和控制以后,控制系統(tǒng)逐漸適應(yīng),最終將自身調(diào)整到一個(gè)滿(mǎn)意的工作狀態(tài)。再比如某些控制對(duì)象,其特性可能在運(yùn)行過(guò)程中要發(fā)生較大的變化,但通過(guò)在線辯識(shí)和改變控制器參數(shù),系統(tǒng)也能逐漸適應(yīng)。第十頁(yè),共39頁(yè)。7.1迭代學(xué)習(xí)控制概述ILC的定義1.從控制的角度定義它是通過(guò)對(duì)具有重復(fù)性的被控對(duì)象系統(tǒng),利用先前的控制經(jīng)驗(yàn)嘗試,以輸出的軌跡與給定的期望軌跡偏差修正不理想的控制信號(hào),最終找出一個(gè)理想的輸入特性曲線,使得系統(tǒng)跟蹤期望輸出結(jié)果的能力提高,最終達(dá)到所期望的輸出或接近于許可的輸出。第十一頁(yè),共39頁(yè)。7.1
迭代學(xué)習(xí)控制概述2.數(shù)學(xué)描述ILC在有限的時(shí)間域[0,T]內(nèi),給定的被控對(duì)象期望的響應(yīng)為yd(t),t∈[0,T],尋找某種給定的控制量uk(t),t∈[0,T],使其響應(yīng)yk(t),t∈[0,T],在某種意義上對(duì)y0(t)(可理解為yk-1(t))有所改善,其中k為尋找次數(shù),這樣的過(guò)程稱(chēng)為學(xué)習(xí)控制過(guò)程。第十二頁(yè),共39頁(yè)。7.1迭代學(xué)習(xí)控制概述3.ILC過(guò)程的機(jī)理是尋找并求得動(dòng)態(tài)控制系統(tǒng)的輸入、輸出之間比較簡(jiǎn)單的關(guān)系。執(zhí)行每一個(gè)由前一步控制學(xué)習(xí)結(jié)束更新的控制過(guò)程。改善每一個(gè)控制過(guò)程,使其性能優(yōu)于前一個(gè)過(guò)程。
希望通過(guò)重復(fù)執(zhí)行這種學(xué)習(xí)過(guò)程和記錄全過(guò)程的結(jié)果,能夠穩(wěn)步改善受控系統(tǒng)的性能。第十三頁(yè),共39頁(yè)。7.1迭代學(xué)習(xí)控制概述ILC的特點(diǎn)ILC適用于某種具有重復(fù)學(xué)習(xí)運(yùn)動(dòng)的被控對(duì)象,每次都做同樣的工作。可實(shí)現(xiàn)完全的跟蹤。學(xué)習(xí)過(guò)程只需要測(cè)量實(shí)際的輸出結(jié)果和期望的信號(hào),對(duì)被控對(duì)象的動(dòng)力學(xué)模型描述和參數(shù)估計(jì)的一些復(fù)雜計(jì)算均可簡(jiǎn)化或省略。在不明確已知(甚至未知)的被控對(duì)象動(dòng)力學(xué)特性的情況下設(shè)計(jì)控制器,故適合非線性系統(tǒng)。第十四頁(yè),共39頁(yè)。7.1迭代學(xué)習(xí)控制概述5.在線控制負(fù)擔(dān)小進(jìn)行快速的運(yùn)動(dòng)控制,實(shí)時(shí)性好6.具有記憶功能,遇到類(lèi)似的控制功能時(shí),它能根據(jù)記憶錄中的任務(wù),快速調(diào)整控制任務(wù)。7.對(duì)干擾和系統(tǒng)的變化量有一定的魯棒性。第十五頁(yè),共39頁(yè)。7.1迭代學(xué)習(xí)控制概述四.適用工業(yè)領(lǐng)域具備重復(fù)運(yùn)動(dòng)的場(chǎng)合:計(jì)算機(jī)搬運(yùn),裝配,生產(chǎn)線焊接工業(yè),噴涂工藝,機(jī)器人數(shù)控加工中間的送進(jìn)。第十六頁(yè),共39頁(yè)。第七章迭代學(xué)習(xí)控制
ILC(IterativeLearningControl)7.1迭代學(xué)習(xí)控制概述7.2迭代學(xué)習(xí)控制律7.3迭代學(xué)習(xí)控制簡(jiǎn)單實(shí)例第十七頁(yè),共39頁(yè)。7.2迭代學(xué)習(xí)控制律一、ILC的被控對(duì)象需滿(mǎn)足的具體條件每次運(yùn)行的時(shí)間間隔為固定的周期T;期望的給定輸出yd(t)是t∈[0,T]域內(nèi)的已知函數(shù);每次運(yùn)行前動(dòng)力系統(tǒng)的初始狀態(tài)Xk(0)相同,k是學(xué)習(xí)次數(shù),k=(1.2.3…);每次運(yùn)行的輸出yk(t)均可測(cè),誤差值可獲得e
k(t)=yd(t)–y
k(t);第十八頁(yè),共39頁(yè)。6.系統(tǒng)的動(dòng)力學(xué)結(jié)構(gòu)在一次運(yùn)行中保持不變ILC在線性定常系統(tǒng),線性時(shí)變系統(tǒng)和非線性的系統(tǒng)中均收斂,但對(duì)系統(tǒng)滯后等不收斂。
5.下一次運(yùn)行的給定uk+1(t)滿(mǎn)足以下遞推條件:一、ILC的被控對(duì)象需滿(mǎn)足的具體條件第十九頁(yè),共39頁(yè)。二、ILC的學(xué)習(xí)過(guò)程若第k次訓(xùn)練時(shí)期望輸出與實(shí)際輸出的誤差為ek(t)=yd(t)–yk(t);t∈[0,T]第k+1次訓(xùn)練的輸入控制uk+1(t)則為第k次訓(xùn)練的輸入控制uk(t)與輸出誤差e
k(t)的加權(quán)和uk+1(t)
=uk(t)
+we
k(t)
在ILC中,控制用的學(xué)習(xí)是通過(guò)對(duì)以往控制經(jīng)驗(yàn)(控制作用與誤差的加權(quán)和)的記憶實(shí)現(xiàn)的,算法的收斂性依賴(lài)加權(quán)因子w的確定。這種ILC的核心是系統(tǒng)不變的假設(shè)以及基于記憶單元間斷的重復(fù)訓(xùn)練過(guò)程,學(xué)習(xí)規(guī)律極為簡(jiǎn)單。第二十頁(yè),共39頁(yè)。反饋通道控制器被控對(duì)象加權(quán)因子反饋通道控制器被控對(duì)象加權(quán)因子+++++++----+記憶學(xué)習(xí)控制器學(xué)習(xí)控制器可有多種不同的變化加權(quán)因子也可以用學(xué)習(xí)控制量代替即(可用于不同的控制方法)ILC的學(xué)習(xí)過(guò)程第k次操作第k+1次操作第k+2次操作…第二十一頁(yè),共39頁(yè)。7.2迭代學(xué)習(xí)控制律三.迭代學(xué)習(xí)控制的任務(wù)
給出系統(tǒng)的當(dāng)前輸入和當(dāng)前輸出,確定寫(xiě)個(gè)期望輸入,使系統(tǒng)的實(shí)際輸出收斂于期望值。第二十二頁(yè),共39頁(yè)。7.2迭代學(xué)習(xí)控制律四、迭代學(xué)習(xí)控制律兩種基本形式的學(xué)習(xí)律是D型學(xué)習(xí)律和P型學(xué)習(xí)律,其中D型學(xué)習(xí)律是首先被提出來(lái)的一種。單純的D型學(xué)習(xí)律可調(diào)整的參數(shù)只有學(xué)習(xí)增益KD,當(dāng)KD確定后,學(xué)習(xí)系統(tǒng)的跟蹤性能和收斂速度也基本上隨之確定,為了提高收斂速度,改善跟蹤性能,需要在學(xué)習(xí)律中增添可調(diào)整的參數(shù)項(xiàng),因而產(chǎn)生了PD型、DI型學(xué)習(xí)律、PID型學(xué)習(xí)律,PID型學(xué)習(xí)律是三者中最為完善的學(xué)習(xí)律。第二十三頁(yè),共39頁(yè)。7.2迭代學(xué)習(xí)控制律迭代學(xué)習(xí)的PID控制律第二十四頁(yè),共39頁(yè)。7.2迭代學(xué)習(xí)控制律PID型學(xué)習(xí)控制律的增量算式:ek(t)=yd(t)–yk(t)對(duì)于采樣時(shí)刻t=nT(T為采樣時(shí)間)令第二十五頁(yè),共39頁(yè)。第二十六頁(yè),共39頁(yè)。7.2迭代學(xué)習(xí)控制律令u0(t)
=yd(t)
,將輸出轉(zhuǎn)化為增量形式:初始化條件為:第二十七頁(yè),共39頁(yè)。五、迭代學(xué)習(xí)控制律的算法流程(1)置k=0,給定并存儲(chǔ)期望的軌跡yd(t)以及初始的控制u0(t),t∈[0,T](2)通過(guò)初始的定位操作,使系統(tǒng)初始輸出位于yk(0),相應(yīng)的初態(tài)位于xk(0)(3)對(duì)被控對(duì)象施加輸入uk(t),t∈[0,T],開(kāi)始反復(fù)操作,同時(shí)采樣并存儲(chǔ)系統(tǒng)的輸出yk(t),t∈[0,T],(4)計(jì)算輸出的誤差ek(t)=yd(t)-yk(t),t∈[0,T](5)由學(xué)習(xí)控制律計(jì)算并存儲(chǔ)新的控制輸入uk+1(t)=uk(t)+△uk(t),t∈[0,T](6)將uk+1(t)施加給系統(tǒng),產(chǎn)生yk+1(t),ek+1(t)(7)檢驗(yàn)迭代停止條件:‖yd(t)-y0(t)‖<ε,式中ε為給定的允許跟蹤精度。若條件滿(mǎn)足則停止運(yùn)行,否則置k=k+1,轉(zhuǎn)步驟(2)第二十八頁(yè),共39頁(yè)。第七章迭代學(xué)習(xí)控制
ILC(IterativeLearningControl)7.1迭代學(xué)習(xí)控制概述7.2迭代學(xué)習(xí)控制律7.3迭代學(xué)習(xí)控制簡(jiǎn)單實(shí)例第二十九頁(yè),共39頁(yè)。7.3迭代學(xué)習(xí)控制簡(jiǎn)單實(shí)例例如直流電動(dòng)機(jī)驅(qū)動(dòng)的單自由度線形機(jī)械系統(tǒng),如下圖所示為系統(tǒng)方框圖,其中y(t)為電動(dòng)機(jī)的角速度,u(t)為輸入電壓。K1+-K2(1)系統(tǒng)描述該閉環(huán)系統(tǒng)用微分方程表示為:其中第三十頁(yè),共39頁(yè)。當(dāng)初始時(shí)刻取為零時(shí),方程的解為:(2)控制任務(wù)在區(qū)間[0,T]上給定一個(gè)期望的角速度yd(t),尋求電壓u(t)使得電機(jī)輸出角速度y(t)在[0,T]上與yd(t)盡可能一致(3)確定輸入數(shù)據(jù)選擇任何一個(gè)輸入電壓u0(t),t∈[0,T],將y
d(t)和u0(t)存入存儲(chǔ)器中,通過(guò)初始定位操作,使系統(tǒng)位于yk(0)(4)施加初始的輸入電壓u0(t)使系統(tǒng)運(yùn)行得到y(tǒng)0(t),則e0(t)=yd(t)-y0(t)第三十一頁(yè),共39頁(yè)。(5)以D型學(xué)習(xí)律計(jì)算新的輸入電壓,并獲得下一次誤差(6)迭代過(guò)程第三十二頁(yè),共39頁(yè)。y
k(t)t設(shè)期望軌跡為yd(t)=t,t∈[0,1],初始條件yk(t)=
yd(t)(k=0,1,2,…)下,選取初始控制u0(t)=0,迭代輸出軌跡如圖所示。圖中y9(t)與yd(t)(紅色的線)重合,即迭代第9次達(dá)到期望。第三十三頁(yè),共39頁(yè)。
移動(dòng)機(jī)器人軌跡跟蹤迭代學(xué)習(xí)控制
移動(dòng)機(jī)器人是一種在復(fù)雜的環(huán)境下工作的具有自規(guī)劃、自組織、自適應(yīng)能力的機(jī)器人。在移
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025合同范本 合同糾紛解決指南
- 2025年對(duì)合同法的新認(rèn)識(shí)與深度理解
- 2025勞動(dòng)合同范本全新版
- 工廠無(wú)菌器械管理制度
- 封閉軌道區(qū)域管理制度
- 黨委臺(tái)賬規(guī)范管理制度
- 學(xué)校設(shè)備臺(tái)賬管理制度
- 學(xué)校大餐運(yùn)營(yíng)管理制度
- 兒科用藥安全管理制度
- 出差公司日常管理制度
- 2025《學(xué)前教育法》宣傳月培訓(xùn)含講稿
- TCCEAS001-2022建設(shè)項(xiàng)目工程總承包計(jì)價(jià)規(guī)范
- 2025年體彩應(yīng)聘考試試題及答案
- 具有車(chē)架結(jié)構(gòu)車(chē)輛的怠速震動(dòng)分析外文文獻(xiàn)翻譯、中英文翻譯
- 上公司人力資源管理制度非常全面
- 小學(xué)數(shù)學(xué)命題研究
- summer-vibe-的中英歌詞
- 天津友發(fā)鋼管集團(tuán)有限公司鋼管
- 水工建筑物水閘課程設(shè)計(jì)
- 七年級(jí)英語(yǔ)知識(shí)競(jìng)賽
- 《生產(chǎn)計(jì)劃與控制》課程設(shè)計(jì).doc
評(píng)論
0/150
提交評(píng)論