最優(yōu)控制理論讀書報(bào)告._第1頁(yè)
最優(yōu)控制理論讀書報(bào)告._第2頁(yè)
最優(yōu)控制理論讀書報(bào)告._第3頁(yè)
最優(yōu)控制理論讀書報(bào)告._第4頁(yè)
最優(yōu)控制理論讀書報(bào)告._第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、最優(yōu)控制理論讀書報(bào)告第一章最優(yōu)控制問(wèn)題與極大值原理最優(yōu)控制問(wèn)題具有廣泛性、多樣性及重要性,它可以應(yīng)用到不同的領(lǐng)域中,例如升降機(jī)的最快升降問(wèn) 題、防天攔截問(wèn)題、雷達(dá)跟蹤問(wèn)題及生產(chǎn)庫(kù)存控制問(wèn)題等等。通過(guò)對(duì)這些問(wèn)題的研究,我們可以看出它們 都具有如下共同的特點(diǎn):(1) 都有一個(gè)被控對(duì)象。它通常是由常微分方程組描述的動(dòng)態(tài)模型來(lái)表征的,即0 = f (x,u,t),tt,tf(1 1)X(to)= x其中xRn是狀態(tài)量,uUrRr是控制量,tto,tf是時(shí)間變量,f:Rn Urto,tf Rn,r, nZ*,r空n是描述被控對(duì)象動(dòng)態(tài)特征的矢值函數(shù),t0,tf分別是初始和終端時(shí)刻,通常t0為定值,而tf可

2、為定值,也可待求。通常假設(shè):對(duì)有限時(shí)間區(qū)間to,tf給定的任一分段連續(xù)矢值函數(shù)u(t) Ur,(1.1)都存在唯一解。(2) 都要求把被控系統(tǒng)的初態(tài)X。通過(guò)控制作用,在某個(gè)終端時(shí)刻tf to引導(dǎo)到某個(gè)終端狀態(tài) x(tf)。通常要求終端狀態(tài)x(tf)屬于Rn中某個(gè)點(diǎn)集S,S稱為目標(biāo)集,且S: = xg x t( t), =) gORp pn (1.2)(3) 都有一個(gè)容許控制集合。容許控制集合Ut0,tf為Ut0,tf :=u(t) u(t) =(U1(t),U2(t)ll,Ur(t)T,Ui(t)是定義在t0,tf上的分段連續(xù)函數(shù),i =1,2|,r;u(tr Ur,且把(1.1)的初態(tài)X。在

3、終端時(shí)刻tf引導(dǎo)到目標(biāo)集S上(1.3)(4) 都有一個(gè)表征系統(tǒng)品質(zhì)優(yōu)劣的性能指標(biāo)。由于它是一個(gè)依賴控制函數(shù)u(t)的“函數(shù)”,又稱為性能指標(biāo)泛函或代價(jià)泛函。記為Ju(),它是一個(gè)依賴于控制u()的有限實(shí)數(shù),即-:::::Ju()::一般說(shuō)Ju()的表達(dá)式中既應(yīng)包含依賴于終端時(shí)刻tf和終端狀態(tài)x(tf)的末值型項(xiàng),又應(yīng)包含依賴于整個(gè)控制過(guò)程的積分型項(xiàng),即tfJu() =K(x(tf),tf)t L(x(t),u(t),t)dt(1.4)to其中KR1, R1,即K,L皆為標(biāo)量函數(shù)。x(t)是(1.1)和x(to)=xo對(duì)應(yīng)于控制u(t)的解,又稱為軌線。歸納起來(lái)最優(yōu)控制問(wèn)題可敘述為:尋求一個(gè)容許

4、控制u(t)U匕G ,使得系統(tǒng)(1.1)在該控制作用下從初態(tài)x(to)= xo出發(fā),在某個(gè)大于to的終端時(shí)刻tf達(dá)到目標(biāo)集S上,且使性能指標(biāo)Ju()達(dá)到極小(若要求性能指標(biāo)達(dá)到極大時(shí),只要討論J二_ju()的極小便可)。如果最優(yōu)控制有解即使(1.4)達(dá)到極小的控制函數(shù)存在,記為u*(t),t to,tf。u*(t)稱為最優(yōu)控制,與u*(t)相對(duì)應(yīng)的系統(tǒng)(1.1)的解x*(t)稱為最優(yōu)軌線,相應(yīng)的性能指標(biāo)J*=Ju*(t)稱為最優(yōu)性能指標(biāo),(u*(t),x*( t)稱為最優(yōu)控制問(wèn)題(1.1)(1.4)的最優(yōu)解。從最優(yōu)控制問(wèn)題的敘述可知J*L ju*(t) lu(t), U(t) Ut0,tf。在

5、最優(yōu)控制問(wèn)題中,根據(jù)涉及的函數(shù)f (.), g(.), K(.), L(.)的不同,有幾種不同的稱謂。例如K(.J =0, L(.) =1時(shí)為快速控制問(wèn)題;當(dāng) f(.), g(.), K(.), L(.)都不顯含t,tf時(shí)為定常系統(tǒng)的最優(yōu)控制 問(wèn)題,否則為時(shí)變系統(tǒng)的最優(yōu)控制問(wèn)題;當(dāng)目標(biāo)集 S僅含一個(gè)固定點(diǎn)時(shí)為固定端點(diǎn)問(wèn)題;當(dāng) S=Rn時(shí)為自 由端點(diǎn)問(wèn)題;當(dāng)tf固定時(shí)為固定終端時(shí)刻問(wèn)題,否則為終端時(shí)刻自由問(wèn)題;當(dāng)L(.) 0 (K 0= 時(shí)為末值指標(biāo);當(dāng)L(.) =0, K(.) j0時(shí)為積分型指標(biāo);當(dāng) L(.) =0, K(.) -0時(shí)為混合型指標(biāo)。雖然最優(yōu)控制問(wèn)題的指標(biāo)有混合型、末值型和積分

6、型三種,但在某些條件下,三種指標(biāo)是可以相互轉(zhuǎn)換的,這種相互轉(zhuǎn)換在理論研究上是很有意義的,例如在最優(yōu)控制問(wèn)題的幾何解釋時(shí)就會(huì)用到這種轉(zhuǎn)換。以下我們分別介紹不同條件下的最優(yōu)控制問(wèn)題。一控制量不受約束的最優(yōu)控制問(wèn)題控制量不受約束的最優(yōu)控制問(wèn)題是指在前面最優(yōu)控制問(wèn)題的敘述中,控制量的取值范圍不受約,即rrrR或U ,Ur為R中的開(kāi)集。設(shè)最優(yōu)控制問(wèn)題敘述中所涉及的函數(shù)f (.), g(.), K(.), L(.)關(guān)于變?cè)际嵌芜B續(xù)可微的。1終端時(shí)刻tf固定,終端狀態(tài) x(tf)自由終端時(shí)刻固定是指tf是已知的,終端狀態(tài)自由是指 x(tf)不受任何約束,即x(tf)Rn。然后利用Ju*(t) Iu(t)

7、, -u(t) U t0,tf來(lái)討論最優(yōu)控制所應(yīng)滿足的必要條件,即如果最優(yōu)解(u *( t), x*( t)存在,(u*( t), x*( t)所應(yīng)滿足的條件。通過(guò)引入拉格朗日乘子矢值函數(shù),-(tr;1(t);2(t)jn? n(t)v Rn,將求Ju()的條件極小問(wèn)題化為求JQO =K(x(tf),tf) :L(x(t),u(t),t) - T(t)【x(t)-f(x,u,t)dtt0的無(wú)條件極小值問(wèn)題。其中 (t)為待定的矢值函數(shù)。利用分部積分,并且取哈密頓函數(shù)H(x,u? ,t-L(x,u,tp - Tf(x,u,t)。通過(guò)對(duì)JduO的變分計(jì)算,我們得到最優(yōu)控制問(wèn)題中x*( t), u*

8、(t)(t)所應(yīng)滿足的必要條件:(1) x*( t) = f (x*( t),u*( t), t)x*( to) = Xo ,-iT(t)一;:L(x*(t),u*( t),t)-T(t)f (x*(t),u*(t),t)dx-T(tf)=在u*(t)的一切連續(xù)時(shí)刻上皆有汨(xWWQt)二02H(x*叩)f 0,故哈 cucu密頓函數(shù)H (x,,t) =-L(x,u,t)-:T f (x, u,t)作為u的函數(shù)在u*(t)處取得極大。當(dāng)f(.), L(.)不 顯含 t 時(shí),有 H(x*(t),u*(t)(t),t) =H(x*(tf),u*(tf)(tf),tf)二常量。2終端時(shí)刻tf固定,終

9、端狀態(tài) x(tf)受約束設(shè)x(t) S,即g(x(tf),tf) =0。此時(shí)的最優(yōu)控制問(wèn)題是在約束(1.1)和(1.2)條件下求(1.4)的極小問(wèn)題。如前,通過(guò)引進(jìn)拉格朗日乘子矢值函數(shù)(th Rn和拉格朗日乘子 Rp,將求Ju()的條件極小問(wèn)題化為求2山()=K(x(tJ,tf)Tg(x(tf),tf):L(x(t),u(t),t) -T(t)x(t) - f(x,u,t)dtto的無(wú)條件極小值問(wèn)題。同樣取哈密頓函數(shù) H (x,u,,t) =-L(x, u,t)宀T f (x,u,t)。重復(fù)以上過(guò)程可得到最優(yōu)控制問(wèn)題中x*( t), u *( t),(t),所應(yīng)滿足的必要條件:(1) x*(t

10、)二 f(x*(t),u*(t),t),x*(t。)。(2) _M(x*(t),u*(t),即(t),t),屮 T(tf)墜T 勺(xtftf)。xx.x在u*(t)的一切連續(xù)時(shí)刻r t0,tf上皆有汨(x*(t),u*(t),t)=0,cu沖(x*(t),u;(t),-0十“。-u H(x;(t),u;(t),%),t)=H(x;(tf),u;(tf)(tf),tf)+f-mx;(t),u;(t),t)+b(t)f(x;(t),u;(t),t)dttfCtCt3終端時(shí)刻tf自由與控制量不受約束的極大值原理 3.1終端狀態(tài)x(tf)自由用類似于1中的方法,可得到該條件下最優(yōu)控制問(wèn)題中X;( t

11、),u;( t)? (t)所應(yīng)滿足的必要條件:(1) x*(t)二 f(x*(t),u*(t),t) , x*(t。)=X ,-|T(t) 汨(X*( t),u*(t)(t),t)ex-(tf*JK(X*(tf),tf*):x:x:x在 u*(t)的一切連續(xù)時(shí)刻 tt,tf上皆有;H(X (t),U (t),(t),t) =0 , cut St *。f2H(x*(t),u*(t)(t),t)0玉0.u(4)故哈密頓函數(shù)沿最優(yōu)軌線有H(x*(t),u*(t)(t),t)=H(x*(tf*),u*(tf*)(tf*),tf*):*JL(x*,u*,t) .tT(t)Jf(x*,u*,網(wǎng)K(x*(f

12、 *tf,*)H(x*(f *U, t* ( -*tf, “*=),*)%當(dāng) f (),L(.), K(.)不顯依賴于時(shí)間 t 時(shí),有 H(x*(t), u*( t)(t),t) =0。3.2終端狀態(tài)x(tf)受約束用類似于2中的方法,可得到該條件下最優(yōu)控制問(wèn)題中x*(t),u*(t)(t)rl所應(yīng)滿足的必要條件;除了將3.1.2中的橫截條件改為(tf*嚴(yán)代宀)小心),tf*)和exexH(x*(tf*),u*(tf*),- (tf*),tf*)二 K(x(tf),tf ).門 g(x tf ),tf ) tf-tf其余均與3.1中的相同。將以上結(jié)果綜合到一起,可得到如下控制量不受約束的極大值

13、原理:定理1給定時(shí)變最優(yōu)控制問(wèn)題(1.1)(1.4)。設(shè)f (),g(.), K(.), L()關(guān)于變?cè)际嵌芜B續(xù)可微的,且 Ur =Rr。記哈密頓函數(shù)為H(x,u,t)二-L(x,u,t) =Tf(x,u,t)。若(u*( t), x*(t)為最優(yōu)解,則一定存在矢值函數(shù) (tr Rn和矢值常量RP,使得x*(t),u*(t)(t)j 一起滿足:(1)x*( t)二 f(x*(t),u*( t),t),X*(t。),叩亠 H(x*(t),u*(t),屮(t),t)屮 丁葉)= 冰(x*(tf),u*(tf) y 切(xTtJtf)在u*( t)的一切連續(xù)時(shí)刻 r t0,tf上皆有:H(x*(

14、t),u*(t)廠 ,t) = 0,邙(x*(t),u;(t)(t)_0_t.t。.uH(x;(t),u;(t),屮(t),t)=H(x;(tf),u;(tf),屮(tf),tf) + _4x;,u;,。+屮刑耐;u;t)dttfctct“冰(x;(tf),tf)T wg(x;(tf),tf)(5)若 tf 自由時(shí),有 Hartjurtf): (tf),tf) 一丄一丄。當(dāng) f (.), L(.), K(.)不盤fctf顯依賴于時(shí)間t時(shí),有H (x;(t),u;( t),-:(t),t)二常量,若tf固定時(shí)這個(gè)常數(shù)可能不為零,但當(dāng)tf自由時(shí),這個(gè)常數(shù)一定為零。二控制量受約束的最優(yōu)控制問(wèn)題一一龐

15、德里亞金極大值原理控制變量受約束是指u(t) Ur R ,Ur是有界閉集。由于最優(yōu)控制的改變量特別是其取值不能是任意的,因此不可能按以上所討論方法來(lái)獲得最優(yōu)控制所應(yīng)滿足的必要條件。雖如此,但其處理問(wèn)題的思路和某些技巧,仍然可以被用來(lái)獲得控制量受約束條件下最優(yōu)控制應(yīng)滿足的必要條件。由于時(shí)變最優(yōu)控制問(wèn)題都可以通過(guò)引入新的狀態(tài)變量將其化為定常最優(yōu)控制問(wèn)題,故我們只給出了定常最優(yōu)控制問(wèn)題的極大值原理。定常最優(yōu)控制問(wèn)題可敘述如下:狀態(tài)方程為x = f(x, u),x(to)=滄(1.5)其中x- Rn是狀態(tài),uRr是控制,f Rn。目標(biāo)集為(x(tf)自由(1.6)容許控制集合Ut0,tf:=u(t)

16、u(t)的分量為分段連續(xù)函數(shù),且 u(t)URr,Ur為有界閉集。(1.7)記與u(t)對(duì)應(yīng)的軌線x(t),它滿足x(tj =x0性能指標(biāo)為Ju() = K(x(tf) +j L(x(t),u(t)dt(1.8)T0關(guān)于定常最優(yōu)控制問(wèn)題(1.5)(1.8)作如下假設(shè):設(shè)(1) f (x,u), L(x,u),K(x)關(guān)于變?cè)沁B續(xù)的,而關(guān)于x是連續(xù)可微的。(2) f (x,u),汗(x,u), :L(x,u)都是有界的。exex(龐我們分別就終端時(shí)刻tf固定與自由兩種情況進(jìn)行了討論,從而得到定常最優(yōu)控制問(wèn)題的極大值原理德里亞金極大值原理)。1定常最優(yōu)控制問(wèn)題的極大值原理(龐德里亞金極大值原理)

17、給定定常最優(yōu)控制問(wèn)題(1.5)(1.8)和目標(biāo)集g(x(tf)=O。設(shè)u(t). UrRr,Ur為有界閉集且(1) f(x,u),L(x,u),K(x),g(x)關(guān)于其變?cè)沁B續(xù)的,關(guān)于x是連續(xù)可微的。f(x,u),處旦,業(yè)巴都是有界的。記哈密頓函數(shù)為H (x,u)- -L(x,u) T f (x,u)若(u (t),x (t)是最優(yōu)解,則必存在n維矢值函數(shù)t(t)Rn和p維常矢值 RP,使得X (t),u (t),- (t)和J 一起滿足:(1) x (t)二 f(X (t),u (t),X (to) =Xo,r(t)汨(X(t),u 廠),八(tf) 一:K(X (tf)j ;:g(x (

18、tj)ex對(duì)u (t)在to,tf上的一切連續(xù)時(shí)刻t上有H(x (t),u (t) (t) =rmaxH(x (t),u? (t)(4) H(x (t),u (t)? (t)作為u的函數(shù)沿著最優(yōu)控制u (t)恒為常數(shù),即H(x (t),u (t) , t(常量,t t,tf當(dāng)終端時(shí)刻tf固定時(shí),這個(gè)常數(shù)可能不為零;但當(dāng)tf自由時(shí),這個(gè)常數(shù)必為零。由于時(shí)變最優(yōu)控制問(wèn)題都可以通過(guò)引入新的狀態(tài)變量將其化為定常最優(yōu)控制問(wèn)題,故我們可直接給出 時(shí)變最優(yōu)控制問(wèn)題的極大值原理。2時(shí)變最優(yōu)控制問(wèn)題的極大值原理(龐德里亞金極大值原理)給定時(shí)變最優(yōu)控制問(wèn)題:f (x,u,t), L(x,u,t),g(x(tf )

19、,tf), K(x(tf ),tf)。設(shè):(1) f (x, u,t), L(x,u,t), g(x,t),K(x,t)關(guān)于其變?cè)沁B續(xù)的,關(guān)于變?cè)獂,t是連續(xù)可微的。(2) f(x,u,t),不以川,許Xu乩以川,乩(XU。都是有界的。ctexct記哈密頓函數(shù)為H(x,u,t) =L(x,u,t) - Tf(x,u,t)如果u(t)Ur Rr,Ur為有界閉集且(u (t),x (t)是最優(yōu)解,則一定存在矢值函數(shù) (th Rn和常值矢量J RP,使得 x”(t),u”(t)(t)一起滿足:(1) x (t) = f(X (t),U (t),t),X (to) =x町(t)= 出(Xt),屮(t

20、),屮(t),t)屮 t()=冰(xtjtf) y 觀(xtjtf)次f次ex(3)對(duì)u (t)在to,tf上的一切連續(xù)時(shí)刻t上有H (x“(t),u “(t),- (t),t)二maxH(x (t),u,- (t),t)UT(tf)=_cT如果 u*(t), x* (t);- (t) 一起滿足H (x* (t), u* (t)(t),t) =max H (x*(t), u(t),t)即x* (t),u*(t),t(t)滿足極大值原理的所有條件,則u*(t)必是最優(yōu)控制。對(duì)給定的最優(yōu)控制問(wèn)題,能利用極大值原理求解其最優(yōu)控制的先決條件是其最優(yōu)控制的存在性,但并不是所有的最優(yōu)控制問(wèn)題都存在最優(yōu)控制

21、。實(shí)際上在所有的最優(yōu)控制問(wèn)題中,最優(yōu)控制不存在的情況可分 為兩類:(1) 給定狀態(tài)方程、目標(biāo)集和控制約束后,通過(guò)分析可得其容許控制集合Ut0,tfh-。由于容許控制不存在,當(dāng)然就不會(huì)存在最優(yōu)控制了。它反映了關(guān)于最優(yōu)控制問(wèn)題的提法是不合理的。(2) 雖然控制問(wèn)題的提法是合理的,即容許控制集合U 如tf鼻0,但最優(yōu)控制確實(shí)不存在。2極小值原理最優(yōu)控制所應(yīng)滿足的必要條件,除了極大值原理原理外,還有極小值原理。實(shí)際上,只要注意到兩種 敘述中哈密頓函數(shù)和共軛方程的終端條件的區(qū)別,可知這兩種敘述是等價(jià)的。現(xiàn)在我們以時(shí)變最優(yōu)控制問(wèn) 題的極大值原理為例來(lái)敘述其相對(duì)應(yīng)的極小值原理。定理3最優(yōu)控制所應(yīng)滿足的必要條

22、件一一極小值原理給定時(shí)變最優(yōu)控制問(wèn)題:f (x,u,t), L(x,u,t),K(x(tf),tf ),g(x(tf ),tf)。設(shè):x,t是連續(xù)可微的。(1) f (x,u,t), L(x,u,t), K(x(t),t), g(x(t),t)關(guān)于其變?cè)沁B續(xù)的,而關(guān)于變?cè)猣 (x,u,t),f (x,u,t)廳(x,u,t),乩(x,u,t),乩(x, u,t)都是有界的。 .1;:t記哈密頓函數(shù)為H (x, u, .*,t)二 L(x,u,t) f (x,u,t)如果u(t) UrRr,Ur為有界閉集,且(x*(t),u*(t)為最優(yōu)解,則一定存在矢量函數(shù)嚴(yán) Rn和常矢量Rp,使得 x*(

23、t),u*(t),和(t),u 起滿足:I*(1) x (tf (x (t),u (t),t),x (toxo呵(t)H(x*(t),u*(t)(t),t)Y(tf)jK(x(tf),tf)t 旳(x*(tf),tf)cXexcX 對(duì)u* (t)在to,tf上的一切連續(xù)時(shí)刻t均有* * *H(x (t),u ,唧(“t.mn(H(x(t),u,曲(t),t)U (丿二U r(4)哈密頓函數(shù)H(x,u,q,t)沿最優(yōu)解(x (t),u (t)具有性質(zhì)H(X*(t),U*(t), t),t) =H(X*(tf),U*(tf), i(tf),tf) t H(x (t),u (t), *(t),t)d

24、t%dx當(dāng)終端時(shí)刻tf自由時(shí),有H(x*(tf),u*(tf), :7(tf),tf)-:g(x* (tf ),tf )rtf-:K(x*(tf ),tf)T-urtf當(dāng)終端時(shí)刻tf固定時(shí),H(x*(tf),u*(tf);:T(tf),tf)無(wú)明確表達(dá)式。3奇異控制由極大值原理可知,若最優(yōu)控制存在,則哈密頓函數(shù)作為控制的函數(shù)在最優(yōu)控制處取得極大值,但是 如果存在一個(gè)容許控制和其相應(yīng)的軌線及共軛變量一起使得哈密頓變量作為控制的函數(shù)取極值時(shí)提供不出 最優(yōu)控制的任何信息,則這個(gè)容許控制稱為奇異控制,顯然奇異控制可能是最優(yōu)控制也可能不是最優(yōu)控制。 因此尋求奇異控制是最優(yōu)控制的必要條件是很有必要的。四動(dòng)

25、態(tài)規(guī)劃方法與極大值原理所謂最優(yōu)性原理,就是一個(gè)最優(yōu)過(guò)程的任何最后一段過(guò)程都是最優(yōu)的。顯然最優(yōu)性原理是最優(yōu)過(guò)程應(yīng) 滿足的一個(gè)必要條件。通過(guò)分析可知,如果且(u*(t),x*(t)為最優(yōu)解,tf *為最優(yōu)終端時(shí)刻,且 J(t,x)關(guān)于變?cè)沁B續(xù)可微的,那么貝爾曼方程也是最優(yōu)控制應(yīng)滿足的一個(gè)必要條件。其實(shí)如果貝爾曼方程式存在關(guān)于變?cè)芜B續(xù)可微 的解,那么就可以得出極大值原理的全部?jī)?nèi)容。雖然從理論上講通過(guò)求解帶終端條件的貝爾曼方程可獲得 最優(yōu)綜合函數(shù),然而求解一個(gè)非線性偏微分方程的解,特別是解析解是非常困難的,也就是說(shuō)只有當(dāng)最優(yōu) 控制問(wèn)題比較簡(jiǎn)單時(shí),我們才能求得其最優(yōu)綜合函數(shù)。總之,第一章我們對(duì)不同

26、條件下的最優(yōu)控制問(wèn)題進(jìn)行了相應(yīng)的討論,綜合討論結(jié)果我們得到了不同的 極大值原理,但是這些極大值原理都是最優(yōu)控制的必要條件,而非充分條件。然而若使得極大值原理是最 優(yōu)控制的充要條件的最優(yōu)控制問(wèn)題一定具有某些特殊的性質(zhì),包括其狀態(tài)方程、性能指標(biāo)和目標(biāo)集的特殊 性。接下來(lái)我們研究了一類特殊的最優(yōu)控制問(wèn)題的充分條件。其實(shí)利用極大值原理或者最優(yōu)控制的另外一 個(gè)必要條件貝爾曼方程求解最優(yōu)控制問(wèn)題都是一個(gè)非常復(fù)雜的過(guò)程,而我們知道并不是任何最優(yōu)控制問(wèn)題 都存在最優(yōu)控制,故如果能判斷出其最優(yōu)控制不存在也是很有意義的事情。本章所討論的最優(yōu)控制,無(wú)論是狀態(tài)方程、控制取值約束還是性能指標(biāo)、目標(biāo)集的描述都是非常一般

27、的。但是對(duì)給定的一個(gè)具體最優(yōu)控制問(wèn)題,如何應(yīng)用極大值原理具體求解出其最優(yōu)控制將是我們接下來(lái)兩 章所要討論的問(wèn)題。所謂利用極大值原理求解最優(yōu)控制,原則上講就是利用最優(yōu)控制所應(yīng)滿足的必要條件, 從容許控制集合中把最優(yōu)控制“挑出”來(lái),這就涉及到最優(yōu)控制是否存在,若存在是否唯一以及是否有顯式表達(dá)式等問(wèn)題。由此可知,為了具體確定出最優(yōu)控制問(wèn)題的最優(yōu)控制,必須對(duì)具體的最優(yōu)控制問(wèn)題的“極值控制”和最優(yōu)控制的一些特殊性質(zhì)進(jìn)行深入的了解。第二章快速控制問(wèn)題所謂快速控制問(wèn)題,是指最優(yōu)控制問(wèn)題的性能指標(biāo)取為狀態(tài)方程從初始狀態(tài)開(kāi)始運(yùn)動(dòng)第一次到達(dá)目標(biāo)tf集所用的時(shí)間,即其性能指標(biāo)為Ju() 1dt。為了弓I進(jìn)快速控制問(wèn)

28、題中的一些基本概念,我們首先討叫0論一類仿射非線性狀態(tài)方程的快速控制問(wèn)題。類仿射非線性系統(tǒng)的快速控制問(wèn)題一類仿射非線性系統(tǒng)的快速控制問(wèn)題可以敘述為:狀態(tài)方程x=f(x,t) B(x,t)u,x(to)(2.1)其中 fT(x,t) =f!(x,t), f2(x,t), |,fn(x,t), B(x,t)=(bj(x,t),i =1,2,111, n; j =1,2,川,r控制約束u Ur 二u|uT =(比山2,11),4),出 |/,i =1,2,111,r(2.2)目標(biāo)集S =(x(tf),tj |g(x(tf),tj =0,g Rq(2.3)性能指標(biāo).tfJu() = t 1dt(2.4

29、)t0假設(shè):(1) fi(x,t),bj(x,t),gk(x,t),(i =1,2, |,n;j =1,2,|,r; k =1,2 )H,q)關(guān)于其變?cè)际沁B續(xù)可微的。 fi(x,t),bj(x,t)2,埜,曲x,t),:bj(x,t)(i =1,2J|, n;j =1,2,川,r)都是有界的。x t xtn對(duì)于快速控制問(wèn)題(2.1)(2.4),我們可將其分為兩類:一類為正則快速控制問(wèn)題(每個(gè)q(t)=為bj(x*(t),t”(t)i=1都不存在零聚點(diǎn));另一類為奇異快速控制問(wèn)題(q(t)存在零聚點(diǎn))。記u*(t)是快速控制,x*(t)是相應(yīng)軌線, (t)是共軛變量;tf *為最優(yōu)終端時(shí)刻,那

30、么利用極大值原理可求得正則快速控制問(wèn)題的快速控制u*(t)L signB(x*(t),t) (t),t 0tf,t *而奇異快速控制問(wèn)題的快速控制亦可能存在且滿足極大值原理的諸項(xiàng)條件,只是不能從極大值原理的諸條件中將它確定出而已。故在利用極大值原理求解快去控制問(wèn)題時(shí), 人們必須從理論上回答三個(gè)問(wèn)題:快速控制是否存在,若存在是否唯一,快速控制問(wèn)題是否是正則的。但是對(duì)一般的f(x,t), B(x,t),g(x,t),上述三個(gè)問(wèn)題沒(méi)有有效的回答。然而當(dāng)狀態(tài)方程為線性時(shí),特別是線性 定常時(shí),我們得到了為回答上述問(wèn)題的重要結(jié)果。接下來(lái)我們將分別研究線性時(shí)變快速控制問(wèn)題、線性定 ??焖倏刂茊?wèn)題與奇異快速控

31、制問(wèn)題。二線性時(shí)變快速控制問(wèn)題線性時(shí)變快速控制問(wèn)題是指線性時(shí)變狀態(tài)方程的快速控制問(wèn)題。狀態(tài)方程為X=A(t)x B(t)u, X(to)=X( 2.5)其中 A(t) = Gj(t) Rn,B(t) (b (t) Rr 且,aj(t),bik(t),(i, j =1,2,|,n;k =1,2川 |,r)是 t 的連續(xù) 或分段連續(xù)函數(shù)。容許控制集合為Ut,tf二u(t) |u(tu1(t),U2(t)J|Ur(t),T,Ui(t)是 t 的分段連續(xù)函數(shù)且 |Ui(t)肚 1(2.6)目標(biāo)集為S =X | X(tf ) = 0( 2.7)性能指標(biāo)為tfJu( ) = 1dt =tf t( 2.8)

32、設(shè) A(t)=(aij(t)w Rnn,B(t)=(bik(t) RU 且 aj(t),bk(t),(i,j =1,2,|,n;k =1,2,|,r)關(guān)于 t有直 到n-1階的連續(xù)導(dǎo)數(shù)。如果對(duì)Rr空間中平行于坐標(biāo)軸的單位矢量q =0II)010HI0T Rr和tt,tf皆有RankB1(t)ej,B2(t)ej,|),Bn(t)ej二 n, j =1,2,川,r即最廣位置條件,則線性時(shí)變快速控制問(wèn)題(2.5)(2.8)是正則的,其中B1(t) = B(t)BQ A(t)BUt) Bt),k =2,3,川,n.那么由正則快速控制問(wèn)題的結(jié)論可知,此時(shí)最優(yōu)控制為u*(t)二sigrT:(tf,t)B

33、(t)T =signBT(t),(tf,t尸。三線性定??焖倏刂茊?wèn)題線性定??焖倏刂茊?wèn)題可敘述為:狀態(tài)方程X = Ax Bu, x t0 = Xj( 2.9)其中 A Rn n,B ngbJILbr)Rn r ,bjRn(j -1,2jP,r)是常矢量。容許控制集合U b ,tf Hu (t )1 u (t ) = u1 (t), u2(t),,ur (t)T ,ui(t)是 t 的分段連續(xù)函數(shù)且 Wi( t )戶 1(2.10)目標(biāo)集(2.11)S二x|x(tf)=O性能指標(biāo)為tfJu() = , 1dt=tf -to(2.12)記Gj U bj,Abj,AnJbj, j =1,2,r,則該

34、線性快速控制問(wèn)題是正則的的充要條件是RankG 二n, j =1,2H,r。如果該線性快速控制問(wèn)題是正則的,且其快速控制存在,那么快速控制必是唯一的,且快速控制為u*(t)二sigr(BT(t)GT(tf,t)i=sigr(BTeA(tfli,其中 u *( t)有三種取值:T+1足(tf,t)b(t)0W *(t)=1,,t)b(t)c0不定,卩T(tf,t)b(t)=0使Uj * t從1變成-1或由-1變成1的時(shí)刻稱為開(kāi)關(guān)時(shí)刻。所有uj * t的開(kāi)關(guān)次數(shù)之和稱為快速控制u* t的開(kāi)關(guān)次數(shù)。從工程實(shí)用考慮,由于快速控制的開(kāi)關(guān)都是通過(guò)一個(gè)裝置來(lái)實(shí)現(xiàn)的,顯然裝置的造價(jià)和具體 的開(kāi)關(guān)次數(shù)的多少有關(guān)

35、。因此每個(gè)開(kāi)關(guān)分量Uj* t的開(kāi)關(guān)次數(shù)的上限在工程實(shí)現(xiàn)快速控制時(shí)是一個(gè)很重要的指標(biāo)要求。在此我們有開(kāi)關(guān)次數(shù)定理: 線性定??焖倏刂剖钦齽t的且快速控制存在及快速控制U *( t)的第j個(gè)分量Uj*( t)的開(kāi)關(guān)次數(shù)為 Nj,若A的特征值皆為實(shí)的,貝y N L m?x Nj豈n -1,其中n為線性定常 控制系統(tǒng)(2.9)的階數(shù)。對(duì)于線性定??焖倏刂茊?wèn)題 (2.9)(2.12),其快速控制的存在性有如下定理:1對(duì)于線性定常快速控制問(wèn)題 (2.9)(2.12),如果存在一個(gè)容許控制在有限時(shí)間內(nèi)(tf -0)能把X(0) Rn引導(dǎo)到坐標(biāo)原點(diǎn)x(tf)=0,則一定存在一個(gè)在最短時(shí)間內(nèi)把x(0)Rn引導(dǎo)到坐

36、標(biāo)原點(diǎn)x(tf)=0的容許控制函數(shù),即快速控制存在。2設(shè)線性定常系統(tǒng)是完全能控的,即RankB,ABJ|,An4Bn,且A的所有特征值都具有負(fù)實(shí)部,則對(duì)任一 x(0) Rn , 一定存在容許控制u(t) e Uptf,在有限時(shí)間(tf 0)內(nèi)把x(0)運(yùn)Rn引導(dǎo)到Rn中的坐標(biāo)原點(diǎn)x(t f) = 0。3設(shè)線性定常系統(tǒng)是完全能控的,即RankB, ABjII, An4Bp n , A的所有特征值都具有非正實(shí)部,且A至少存在一個(gè)具有零實(shí)部的特征值,則對(duì)于任一x(0) e Rn,一定存在容許控制 u(t)壬U0,tf ,在有限4設(shè)線性定常系統(tǒng)是正則的,A的所有特征值皆具有非正實(shí)部,且A至少存在一個(gè)具

37、有零實(shí)部的特征值,則對(duì)任一初態(tài) x(0) Rn,皆存在著快速控制 u*(t),且u*( t)的分量皆為t的分段常值函數(shù)。線性定??焖倏刂茊?wèn)題的最優(yōu)性能指標(biāo)只依賴于初態(tài)x,而與初始時(shí)刻無(wú)關(guān),即J*(x)。如果能求得快速控制u*(t)和最優(yōu)軌線x*(t)以及初態(tài)x函數(shù)的最優(yōu)性能指標(biāo) J*(x),那么用哈密頓-雅可比-貝爾曼方二 0來(lái)判斷由極大值原理得到的結(jié)果是否正確時(shí)很有用的。四快速控制問(wèn)題的奇異性由第一節(jié)知道:若快速控制問(wèn)題(2.1)(2.4)是奇異的,必存在一個(gè)整數(shù)1 j C、f* ABRBt i_ctc_at化為若爾當(dāng)型,若氣1T21TnJ21(J0、J丿,則 K =TT _1。(4) 解線

38、性代數(shù)方程組。(5) 迭代逼近算法我們可根據(jù)黎卡提方程的形式的不同,采用不同的方法求解。雖然我們討論了最優(yōu)閉環(huán)系統(tǒng)的漸近穩(wěn)定性,但是卻不能保證其狀態(tài)有事先指定的衰減速度,然而在 實(shí)際工程中,我們總希望最優(yōu)閉環(huán)系統(tǒng)具有事先給定的衰減速度,故研究具有指定衰減速度的最優(yōu)調(diào)節(jié)問(wèn) 題就顯得尤為重要,這就是我們接下來(lái)要介紹的問(wèn)題。二具有指定衰減速度的最優(yōu)調(diào)節(jié)問(wèn)題所謂為線性定常系統(tǒng)設(shè)計(jì)具有指定衰減速度P (即lim x(t)e妝=0),指如下最優(yōu)控制問(wèn)題。*狀態(tài)方程X = Ax Bu,x(0) = x0(3.5)性能指標(biāo)1 - 2 t TtJ Ju()H- 0 e x (t)Qx(t) u (t)Ru(t)

39、dt(3.6)rt其中R 0,Q_0,u(t)U r = R。如果(代B)能控,對(duì)Q的任意分解Q=C C,(A, C)完全能觀測(cè),則存在唯一的具有指定衰減速度1的最優(yōu)調(diào)節(jié)器u*(x)二-RJBTK -x,使得最優(yōu)閉環(huán)系統(tǒng) (BR1BTK:)x,x(0) =x0的解x(t)滿足lim x(t)e = 0。其中 K為如下黎卡提代數(shù)方程(Aln)TK K(Aln) CTC -KBRBTK =0的唯一正定解。三線性系統(tǒng)的最優(yōu)輸出跟蹤問(wèn)題在前面我們已經(jīng)給出了線性系統(tǒng)的最優(yōu)跟蹤問(wèn)題(3.3)(3.4),我們?nèi)岳脴O大值原理來(lái)求解,得到如下結(jié)論。對(duì)于線性系統(tǒng)x 二 A(t)x B(t)u,y 二 C(t)x

40、, x(t)二冷(3.7)和性能指標(biāo)1 1 tfJu() (y(tf) -z(tf)TF(y(tf)-z(tf)(y(t) -z(t)TQ(t)(y(t)-z(t) u(t)TR(t)u(t)dt (3.8)2 2 10其中tf固定,z(t)是已知的被跟蹤信號(hào),A(t), B(t), C(t),Q(t), R(t)的元皆為t的連續(xù)或分段連續(xù)函數(shù),且Q t _O,R(t) 0,-t t,tf, F _0。如果u Ur =Rr,則最優(yōu)跟蹤器存在唯一,表達(dá)式為u* x, ,ti =R(t)BT(t)K(t)x-其中K(t), (t)分別是帶終端條件的黎卡提微分方程K KA(t) AT(t)K CT(t)Q(t)C(t)KB(t)R(t)BT(t)K =0K(tJ=CT(tf)Fz(tf)和帶終端條件的線性非齊次方程I AT(t)K(t)B(t)R(t)BT(t)CT(t)Q(t)z(t) =0(tf) =CT(tf)Fz(tf)的唯一解,對(duì)任意的初態(tài)x0 Rn,其最優(yōu)性能指標(biāo)為11J*xjK(t0)x。- T(t)X0(t)22這里(t)滿足如下帶終端條件的微分方程

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論