復(fù)雜機(jī)電控制7-迭代學(xué)習(xí)控制-2013-11-19

上傳人：m*** IP屬地：浙江上傳時(shí)間：2023-04-16 格式：PPTX 頁(yè)數(shù)：39 大小：1.33MB 積分：20 舉報(bào) 版權(quán)申訴

復(fù)雜機(jī)電控制7-迭代學(xué)習(xí)控制-2013-11-19_第2頁(yè)

復(fù)雜機(jī)電控制7-迭代學(xué)習(xí)控制-2013-11-19_第3頁(yè)

復(fù)雜機(jī)電控制7-迭代學(xué)習(xí)控制-2013-11-19_第4頁(yè)

復(fù)雜機(jī)電控制7-迭代學(xué)習(xí)控制-2013-11-19_第5頁(yè)

已閱讀5頁(yè)，還剩34頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

復(fù)雜機(jī)電控制7-迭代學(xué)習(xí)控制-2013-11-19第一頁(yè)，共39頁(yè)。第七章迭代學(xué)習(xí)控制

ILC(IterativeLearningControl)7.1迭代學(xué)習(xí)控制概述7.2迭代學(xué)習(xí)控制律7.3迭代學(xué)習(xí)控制簡(jiǎn)單實(shí)例第二頁(yè)，共39頁(yè)。遺傳學(xué)習(xí)（RacialLearning）：

具有生存能力的動(dòng)物,使那些在它的一生中，能被它所經(jīng)歷的環(huán)境所改造的動(dòng)物，一個(gè)能繁殖的動(dòng)物，至少能夠產(chǎn)生與它大略相似的動(dòng)物，這種從一代到下一代的種族學(xué)習(xí)或系統(tǒng)發(fā)育學(xué)習(xí).學(xué)習(xí)控制系統(tǒng)：

它能通過(guò)與被控對(duì)象和環(huán)境的閉環(huán)交互作用，根據(jù)過(guò)去獲得的經(jīng)驗(yàn)信息，逐步改進(jìn)系統(tǒng)自身的未來(lái)性能。第三頁(yè)，共39頁(yè)。第七章迭代學(xué)習(xí)控制

ILC(IterativeLearningControl)1978年，Uchiyama（內(nèi)山）在一篇有關(guān)機(jī)器人控制的論文中提出ILC思想（日文雜志Repetive），因文章是日文發(fā)表的，當(dāng)時(shí)并未引起人們的重視。1984年，Arimoto

（有本）和其合作者們將內(nèi)山的初步思想加以完善，建立了實(shí)用的算法，從理論上證明了這種算法的可行性而成為正規(guī)的迭代學(xué)習(xí)控制理論，并以英文發(fā)表了他們的研究成果，迭代學(xué)習(xí)控制ILC(IterativeLearningControl）才得以推廣。第四頁(yè)，共39頁(yè)。迭代學(xué)習(xí)是模擬人的學(xué)習(xí)過(guò)程與特性，類(lèi)似于人的“循序漸進(jìn)”。

“Learningbytrail”邊學(xué)邊干的學(xué)習(xí)規(guī)律，使得對(duì)被控對(duì)象的動(dòng)力學(xué)描述和參數(shù)化估計(jì)的復(fù)雜計(jì)算均可以簡(jiǎn)化或省略。第五頁(yè)，共39頁(yè)。第七章迭代學(xué)習(xí)控制

ILC(IterativeLearningControl)7.1迭代學(xué)習(xí)控制概述7.2迭代學(xué)習(xí)控制律7.3迭代學(xué)習(xí)控制簡(jiǎn)單實(shí)例第六頁(yè)，共39頁(yè)。7.1迭代學(xué)習(xí)控制概述迭代學(xué)習(xí)控制適用的場(chǎng)合，以及與其它控制方法的區(qū)別1.適合場(chǎng)合

可用于不確定的對(duì)象或非線性系統(tǒng)，但系統(tǒng)動(dòng)作過(guò)程應(yīng)具有自己的重復(fù)性。2.ILC和ANNC（人工神經(jīng)網(wǎng)絡(luò)控制）的區(qū)別

a.ANNC給定一樣本，包含輸入對(duì)應(yīng)的輸出結(jié)果。

b.ILC只給出期望的輸出，需要獲得合適的輸入達(dá)到或接近期望的輸出。兩者通常都是離線使用學(xué)習(xí)結(jié)果。第七頁(yè)，共39頁(yè)。7.1迭代學(xué)習(xí)控制概述3.ILC和最優(yōu)控制的區(qū)別最優(yōu)控制通過(guò)對(duì)描述的數(shù)學(xué)模型的理論優(yōu)化得到所需的控制量。ILC是通過(guò)先前多次的實(shí)驗(yàn)結(jié)果改進(jìn)，來(lái)獲得最優(yōu)的控制量。第八頁(yè)，共39頁(yè)。7.1迭代學(xué)習(xí)控制概述4.ILC和自適應(yīng)控制的區(qū)別

兩者都是用來(lái)解決系統(tǒng)不確定的問(wèn)題，均基于在線的參數(shù)調(diào)整算法，都要使用與環(huán)境、對(duì)象閉環(huán)交互得到的實(shí)驗(yàn)信息。自適應(yīng)控制是在線的控制，用于緩慢的時(shí)變特性以及新型的控制局勢(shì)，對(duì)嚴(yán)重的非線性問(wèn)題失效。ILC的控制是在線的，而學(xué)習(xí)是離線的，適合于建模不良的非線性系統(tǒng)，但不宜用于時(shí)變動(dòng)態(tài)系統(tǒng)。

ILC是在每次試驗(yàn)后離線實(shí)現(xiàn)控制，而自適應(yīng)控制的算法是在線算法，且需要進(jìn)行大量的計(jì)算。第九頁(yè)，共39頁(yè)。自適應(yīng)控制和常規(guī)的反饋控制和最優(yōu)控制一樣，也是一種基于數(shù)學(xué)模型的控制方法，所不同的只是自適應(yīng)控制所依據(jù)的關(guān)于模型和擾動(dòng)的先驗(yàn)知識(shí)比較少，需要在系統(tǒng)的運(yùn)行過(guò)程中去不斷提取有關(guān)模型的信息，使模型逐步完善。具體地說(shuō)，可以依據(jù)對(duì)象的輸入輸出數(shù)據(jù)，不斷地辨識(shí)模型參數(shù)，這個(gè)過(guò)程稱(chēng)為系統(tǒng)的在線辯識(shí)。隨著生產(chǎn)過(guò)程的不斷進(jìn)行，通過(guò)在線辯識(shí)，模型會(huì)變得越來(lái)越準(zhǔn)確，越來(lái)越接近于實(shí)際。在這個(gè)意義下，控制系統(tǒng)具有一定的適應(yīng)能力。比如說(shuō)，當(dāng)系統(tǒng)在設(shè)計(jì)階段，由于對(duì)象特性的初始信息比較缺乏，系統(tǒng)在剛開(kāi)始投入運(yùn)行時(shí)可能性能不理想，但是只要經(jīng)過(guò)一段時(shí)間的運(yùn)行，通過(guò)在線辯識(shí)和控制以后，控制系統(tǒng)逐漸適應(yīng)，最終將自身調(diào)整到一個(gè)滿(mǎn)意的工作狀態(tài)。再比如某些控制對(duì)象，其特性可能在運(yùn)行過(guò)程中要發(fā)生較大的變化，但通過(guò)在線辯識(shí)和改變控制器參數(shù)，系統(tǒng)也能逐漸適應(yīng)。第十頁(yè)，共39頁(yè)。7.1迭代學(xué)習(xí)控制概述ILC的定義1.從控制的角度定義它是通過(guò)對(duì)具有重復(fù)性的被控對(duì)象系統(tǒng)，利用先前的控制經(jīng)驗(yàn)嘗試，以輸出的軌跡與給定的期望軌跡偏差修正不理想的控制信號(hào)，最終找出一個(gè)理想的輸入特性曲線，使得系統(tǒng)跟蹤期望輸出結(jié)果的能力提高，最終達(dá)到所期望的輸出或接近于許可的輸出。第十一頁(yè)，共39頁(yè)。7.1

迭代學(xué)習(xí)控制概述2.數(shù)學(xué)描述ILC在有限的時(shí)間域[0,T]內(nèi)，給定的被控對(duì)象期望的響應(yīng)為yd(t),t∈[0,T],尋找某種給定的控制量uk(t),t∈[0,T],使其響應(yīng)yk(t),t∈[0,T],在某種意義上對(duì)y0(t)（可理解為yk-1(t)）有所改善，其中k為尋找次數(shù)，這樣的過(guò)程稱(chēng)為學(xué)習(xí)控制過(guò)程。第十二頁(yè)，共39頁(yè)。7.1迭代學(xué)習(xí)控制概述3.ILC過(guò)程的機(jī)理是尋找并求得動(dòng)態(tài)控制系統(tǒng)的輸入、輸出之間比較簡(jiǎn)單的關(guān)系。執(zhí)行每一個(gè)由前一步控制學(xué)習(xí)結(jié)束更新的控制過(guò)程。改善每一個(gè)控制過(guò)程，使其性能優(yōu)于前一個(gè)過(guò)程。

希望通過(guò)重復(fù)執(zhí)行這種學(xué)習(xí)過(guò)程和記錄全過(guò)程的結(jié)果，能夠穩(wěn)步改善受控系統(tǒng)的性能。第十三頁(yè)，共39頁(yè)。7.1迭代學(xué)習(xí)控制概述ILC的特點(diǎn)ILC適用于某種具有重復(fù)學(xué)習(xí)運(yùn)動(dòng)的被控對(duì)象，每次都做同樣的工作。可實(shí)現(xiàn)完全的跟蹤。學(xué)習(xí)過(guò)程只需要測(cè)量實(shí)際的輸出結(jié)果和期望的信號(hào)，對(duì)被控對(duì)象的動(dòng)力學(xué)模型描述和參數(shù)估計(jì)的一些復(fù)雜計(jì)算均可簡(jiǎn)化或省略。在不明確已知（甚至未知）的被控對(duì)象動(dòng)力學(xué)特性的情況下設(shè)計(jì)控制器，故適合非線性系統(tǒng)。第十四頁(yè)，共39頁(yè)。7.1迭代學(xué)習(xí)控制概述5.在線控制負(fù)擔(dān)小進(jìn)行快速的運(yùn)動(dòng)控制，實(shí)時(shí)性好6.具有記憶功能，遇到類(lèi)似的控制功能時(shí)，它能根據(jù)記憶錄中的任務(wù)，快速調(diào)整控制任務(wù)。7.對(duì)干擾和系統(tǒng)的變化量有一定的魯棒性。第十五頁(yè)，共39頁(yè)。7.1迭代學(xué)習(xí)控制概述四.適用工業(yè)領(lǐng)域具備重復(fù)運(yùn)動(dòng)的場(chǎng)合：計(jì)算機(jī)搬運(yùn)，裝配，生產(chǎn)線焊接工業(yè)，噴涂工藝，機(jī)器人數(shù)控加工中間的送進(jìn)。第十六頁(yè)，共39頁(yè)。第七章迭代學(xué)習(xí)控制

ILC(IterativeLearningControl)7.1迭代學(xué)習(xí)控制概述7.2迭代學(xué)習(xí)控制律7.3迭代學(xué)習(xí)控制簡(jiǎn)單實(shí)例第十七頁(yè)，共39頁(yè)。7.2迭代學(xué)習(xí)控制律一、ILC的被控對(duì)象需滿(mǎn)足的具體條件每次運(yùn)行的時(shí)間間隔為固定的周期T;期望的給定輸出yd(t)是t∈[0,T]域內(nèi)的已知函數(shù);每次運(yùn)行前動(dòng)力系統(tǒng)的初始狀態(tài)Xk(0)相同，k是學(xué)習(xí)次數(shù)，k=(1.2.3…);每次運(yùn)行的輸出yk(t)均可測(cè)，誤差值可獲得e

k(t)=yd(t)–y

k(t);第十八頁(yè)，共39頁(yè)。6.系統(tǒng)的動(dòng)力學(xué)結(jié)構(gòu)在一次運(yùn)行中保持不變ILC在線性定常系統(tǒng)，線性時(shí)變系統(tǒng)和非線性的系統(tǒng)中均收斂，但對(duì)系統(tǒng)滯后等不收斂。

5.下一次運(yùn)行的給定uk+1(t)滿(mǎn)足以下遞推條件：一、ILC的被控對(duì)象需滿(mǎn)足的具體條件第十九頁(yè)，共39頁(yè)。二、ILC的學(xué)習(xí)過(guò)程若第k次訓(xùn)練時(shí)期望輸出與實(shí)際輸出的誤差為ek(t)=yd(t)–yk(t);t∈[0,T]第k+1次訓(xùn)練的輸入控制uk+1(t)則為第k次訓(xùn)練的輸入控制uk(t)與輸出誤差e

k(t)的加權(quán)和uk+1(t)

=uk(t)

+we

k(t)

在ILC中，控制用的學(xué)習(xí)是通過(guò)對(duì)以往控制經(jīng)驗(yàn)（控制作用與誤差的加權(quán)和）的記憶實(shí)現(xiàn)的，算法的收斂性依賴(lài)加權(quán)因子w的確定。這種ILC的核心是系統(tǒng)不變的假設(shè)以及基于記憶單元間斷的重復(fù)訓(xùn)練過(guò)程，學(xué)習(xí)規(guī)律極為簡(jiǎn)單。第二十頁(yè)，共39頁(yè)。反饋通道控制器被控對(duì)象加權(quán)因子反饋通道控制器被控對(duì)象加權(quán)因子+++++++----+記憶學(xué)習(xí)控制器學(xué)習(xí)控制器可有多種不同的變化加權(quán)因子也可以用學(xué)習(xí)控制量代替即（可用于不同的控制方法）ILC的學(xué)習(xí)過(guò)程第k次操作第k+1次操作第k+2次操作…第二十一頁(yè)，共39頁(yè)。7.2迭代學(xué)習(xí)控制律三.迭代學(xué)習(xí)控制的任務(wù)

給出系統(tǒng)的當(dāng)前輸入和當(dāng)前輸出，確定寫(xiě)個(gè)期望輸入，使系統(tǒng)的實(shí)際輸出收斂于期望值。第二十二頁(yè)，共39頁(yè)。7.2迭代學(xué)習(xí)控制律四、迭代學(xué)習(xí)控制律兩種基本形式的學(xué)習(xí)律是D型學(xué)習(xí)律和P型學(xué)習(xí)律，其中D型學(xué)習(xí)律是首先被提出來(lái)的一種。單純的D型學(xué)習(xí)律可調(diào)整的參數(shù)只有學(xué)習(xí)增益KD，當(dāng)KD確定后，學(xué)習(xí)系統(tǒng)的跟蹤性能和收斂速度也基本上隨之確定，為了提高收斂速度，改善跟蹤性能，需要在學(xué)習(xí)律中增添可調(diào)整的參數(shù)項(xiàng)，因而產(chǎn)生了PD型、DI型學(xué)習(xí)律、PID型學(xué)習(xí)律，PID型學(xué)習(xí)律是三者中最為完善的學(xué)習(xí)律。第二十三頁(yè)，共39頁(yè)。7.2迭代學(xué)習(xí)控制律迭代學(xué)習(xí)的PID控制律第二十四頁(yè)，共39頁(yè)。7.2迭代學(xué)習(xí)控制律PID型學(xué)習(xí)控制律的增量算式:ek(t)=yd(t)–yk(t)對(duì)于采樣時(shí)刻t=nT（T為采樣時(shí)間）令第二十五頁(yè)，共39頁(yè)。第二十六頁(yè)，共39頁(yè)。7.2迭代學(xué)習(xí)控制律令u0(t)

=yd(t)

，將輸出轉(zhuǎn)化為增量形式：初始化條件為：第二十七頁(yè)，共39頁(yè)。五、迭代學(xué)習(xí)控制律的算法流程(1)置k=0，給定并存儲(chǔ)期望的軌跡yd(t)以及初始的控制u0(t),t∈[0,T](2)通過(guò)初始的定位操作，使系統(tǒng)初始輸出位于yk(0)，相應(yīng)的初態(tài)位于xk(0)(3)對(duì)被控對(duì)象施加輸入uk(t),t∈[0,T],開(kāi)始反復(fù)操作，同時(shí)采樣并存儲(chǔ)系統(tǒng)的輸出yk(t)，t∈[0,T],(4)計(jì)算輸出的誤差ek(t)=yd(t)-yk(t),t∈[0,T](5)由學(xué)習(xí)控制律計(jì)算并存儲(chǔ)新的控制輸入uk+1(t)=uk(t)+△uk(t),t∈[0,T](6)將uk+1(t)施加給系統(tǒng)，產(chǎn)生yk+1(t)，ek+1(t)(7)檢驗(yàn)迭代停止條件：‖yd(t)-y0(t)‖<ε,式中ε為給定的允許跟蹤精度。若條件滿(mǎn)足則停止運(yùn)行，否則置k=k+1,轉(zhuǎn)步驟(2)第二十八頁(yè)，共39頁(yè)。第七章迭代學(xué)習(xí)控制

ILC(IterativeLearningControl)7.1迭代學(xué)習(xí)控制概述7.2迭代學(xué)習(xí)控制律7.3迭代學(xué)習(xí)控制簡(jiǎn)單實(shí)例第二十九頁(yè)，共39頁(yè)。7.3迭代學(xué)習(xí)控制簡(jiǎn)單實(shí)例例如直流電動(dòng)機(jī)驅(qū)動(dòng)的單自由度線形機(jī)械系統(tǒng)，如下圖所示為系統(tǒng)方框圖，其中y(t)為電動(dòng)機(jī)的角速度，u(t)為輸入電壓。K1+-K2（1）系統(tǒng)描述該閉環(huán)系統(tǒng)用微分方程表示為：其中第三十頁(yè)，共39頁(yè)。當(dāng)初始時(shí)刻取為零時(shí)，方程的解為：（2）控制任務(wù)在區(qū)間[0,T]上給定一個(gè)期望的角速度yd(t)，尋求電壓u(t)使得電機(jī)輸出角速度y(t)在[0,T]上與yd(t)盡可能一致（3）確定輸入數(shù)據(jù)選擇任何一個(gè)輸入電壓u0(t)，t∈[0,T]，將y

d(t)和u0(t)存入存儲(chǔ)器中，通過(guò)初始定位操作，使系統(tǒng)位于yk(0)（4）施加初始的輸入電壓u0(t)使系統(tǒng)運(yùn)行得到y(tǒng)0(t)，則e0(t)=yd(t)-y0(t)第三十一頁(yè)，共39頁(yè)。（5）以D型學(xué)習(xí)律計(jì)算新的輸入電壓，并獲得下一次誤差（6）迭代過(guò)程第三十二頁(yè)，共39頁(yè)。y

k(t)t設(shè)期望軌跡為yd(t)=t,t∈[0,1],初始條件yk(t)=

yd(t)(k=0,1,2,…)下，選取初始控制u0(t)=0，迭代輸出軌跡如圖所示。圖中y9(t)與yd(t)（紅色的線）重合，即迭代第9次達(dá)到期望。第三十三頁(yè)，共39頁(yè)。

移動(dòng)機(jī)器人軌跡跟蹤迭代學(xué)習(xí)控制

移動(dòng)機(jī)器人是一種在復(fù)雜的環(huán)境下工作的具有自規(guī)劃、自組織、自適應(yīng)能力的機(jī)器人。在移

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

復(fù)雜機(jī)電控制7-迭代學(xué)習(xí)控制-2013-11-19

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

復(fù)雜機(jī)電控制7-迭代學(xué)習(xí)控制-2013-11-19

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔