變分法及其在最優(yōu)控制中的應用_第1頁
變分法及其在最優(yōu)控制中的應用_第2頁
變分法及其在最優(yōu)控制中的應用_第3頁
變分法及其在最優(yōu)控制中的應用_第4頁
變分法及其在最優(yōu)控制中的應用_第5頁
已閱讀5頁,還剩92頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、一、泛函的定義 如果變量J對于某一函數(shù)類中的每一個函數(shù)x(t),都有一個 與之對應,那么就稱變量J為依賴于函數(shù)x(t)的泛函,記為:J=Jx(t)。確定的值說明:由于函數(shù)的值是由自變量的選取而確定的,而泛函的值是由自變量的函數(shù)的選取而確定的,所以將泛函理解為“函數(shù)的函數(shù)”。例1.1.1 函數(shù)的定積分10)( dttxJ是泛函。因為變量J的值是由函數(shù)的選取而確定的。例1.1.2 在平面上連接給定兩點A(ta,xa)和B(tb,xb)的曲線的弧長J是一個泛函,如圖1-1所示。 當曲線方程x=x(t)(滿足x(ta)= xa , x(tb)= xb )給定后,可算出它在A、B兩點間的弧長為:A(ta

2、,xa)x(t)B(tb,xb)xot圖11dtdtdxJbatt21例1.1.3 函數(shù)的不定積分 不是泛函。dxyt0)( 泛函的上述概念,可以推廣到含有幾個函數(shù)的泛函的情況,例如:10)()(dttytxJ從例1.1.2可以知道,連接A、B兩點的曲線之弧長的泛函,其被積函數(shù) 是未知函數(shù)導數(shù)的函數(shù)。在一般情況下,被積函數(shù)是自變量t,未知函數(shù)x(t)及其導數(shù) 的函數(shù)。所以最簡單的一類泛函可表示為: 求函數(shù)的極值時,微分或?qū)?shù)起著重要的作用。求泛函的極值時,變分起著類似的作用。我們將求泛函的極值問題稱為變分問題,其相應的方法稱為變分法。21x )(tx dtttxtxLtxJftt0),(),(

3、)()()()(0txtxtx(1.1.1)如圖1-2所示。二、泛函宗量的變分 泛函Jx(t)的宗量是函數(shù)x(t),其變分是指在同一函數(shù)類中的兩個函數(shù)間的差:x(t)xot圖12x0(t)x(t)t1t2x(t)xot圖13x0(t)t1t2)(tx )(0tx )()(, )()(00txtxtxtxx(t)xot圖 1 4x0(t)t1t2注意:一階相近的兩個函數(shù),必然是零階相近,反之不成立。)()(, )()(, )()()(0)(00txtxtxtxtxtxkk)()(max)(),(00txtxtxtxdbta)()(, )()(, )()(max)(),()(0)(000txtxt

4、xtxtxtxtxtxdkkbta顯然,式(1.1.5)定量地表示兩個函數(shù)之間的零階相近度,而式(1.1.6)定量地表示兩個函數(shù)之間的k階相近度。 連續(xù)泛函如果滿足下列條件: (1) Jx1(t)+ x2(t)= Jx1(t)+ Jx2(t) (2) Jcx(t)=c Jx(t)其中,c是任意常數(shù),就稱為線性泛函。例如21)()(sin)()(ttdttxtttxtxJ21)()()()()(ttdttxtqtxtptxJ2)()(ttxtxJ都滿足上述兩個條件,故均為線性泛函。五、泛函的變分如果連續(xù)泛函Jx(t)的增量可以表示為:(泰勒級數(shù)))()()()(txJtxtxJtxJ)(),()

5、(),(txtxrtxtxL其中,Lx(t),x(t)是關于x(t)的線性連續(xù)泛函,而rx(t),x(t)是關于x(t)的高階無窮小。 Lx(t),x(t)稱為泛函的變分,記為(1.1.9))(),(txtxLJ(1.1.10)也就是說,泛函的變分是泛函增量的線性主部。當一個泛函具有變分時,即泛函的增量可以用式(1.1.9)來表示時,稱該泛函是可微的。例如,泛函dttxtxJ)()(102的增量為:101022)()()(dttxdttxtxJ102)()()(2dttxtxtx10102)()()(2dttxdttxtx于是,其變分為:10)()(2dttxtxJ可以證明,泛函的變分是唯一的

6、。因為,若泛函的變分不是唯一的,則泛函的增量可以寫為:)(),()(),()(),()(),(2211txtxrtxtxLtxtxrtxtxLJ)(),()(),()(),(21txtxLtxtxLtxtxL引理1.1.1 泛函Jx(t)的變分為:0)()(txtxJJ證明:如上所述,泛函Jx(t)的增量為:)()()(txJtxtxJJ)(),()(),(txtxrtxtxL其中,(0 1)是一個參變量。由于Lx(t), x(t)是關于 x(t)的線性連續(xù)泛函,根據(jù)線性泛函的性質(zhì)(2),有(1.1.11))(),()(),(txtxLtxtxL又由于rx(t), x(t)是關于 x(t)的高

7、階無窮小,所以0)()()(),(lim)(),(lim00txtxtxtxrtxtxr利用上述兩點結論,便得JtxtxJ00lim)()(根據(jù)偏微分的定義)()()(lim0txJtxtxJ)(),()(),(lim0txtxrtxtxL)(),(lim)(),(lim00txtxrtxtxL)(),(lim0txtxL)(),(txtxL因為泛函Jx(t)的變分為:)(),(txtxLJ所以0)()(txtxJJQED0)()(txtxJJ0102)()(dttxtxdttxtx0102)()(dttxtxtx010)()()(210)()(2dttxtx例1.1.4 求泛函 的變分。10

8、2)( dttx根據(jù)式(1.1.11),該泛函的變分為:0)()(txtxJJ例1.1.5 求泛函 的變分 fttdtttxtxLJ0),(),(根據(jù)式(1.1.11),所求泛函的變分為:00),()(),()(fttdtttxtxtxtxLdtttxtxtxtxLftt00),()(),()(dttxtxtxttxtxtxtxLtxtxtxttxtxtxtxLftt0)()()(),()(),()()()()(),()(),()(0fttdttxtxttxtxLtxtxttxtxL0)()(),(),()()(),(),(若設 222)()(),(),(ttxtxttxtxL則dttxtxt

9、xtxJftt0)()()()(2六、泛函的極值 如果泛函Jx(t)在函數(shù)空間中點x=x0(t)的鄰域內(nèi),其增量為:0)()(0txJtxJJ就稱泛函Jx(t)在點x0(t)處達到極小值;如果泛函Jx(t)在函數(shù)空間中點x=x0(t)的鄰域內(nèi),其增量為:0)()(0txJtxJJ就稱泛函Jx(t)在點x0(t)處達到極大值; x0(t)的鄰域包含滿足條件: 的所有點x(t)的球(即以x0(t) 為圓心,以為半徑的球)。)(),(0txtxd) )()(max)(),(00txtxtxtxdbta)()(0txtx注意:所采用的函數(shù)間的距離的定義的不同,點 x0(t)的鄰域內(nèi)所包含的函數(shù)也不同。

10、 若強極值若) )()(, )()(max)(),(000txtxtxtxtxtxdbta)()()()(00txtxtxtx弱極值 顯然,如果泛函Jx(t)在點x0(t)處達到強極值,那么它在點x0(t)處也一定達到弱極值。反之不成立。定理1.1.1(必要條件)(必要條件) 若泛函Jx(t)是連續(xù)可微的,并且在點x0(t)處達到極值,則泛函在點x0(t)處的變分等于零,即0)(),(0txtxJ(1.1.12)證明: 對于任意給定的x(t),Jx0(t)+ x(t)既是函數(shù)x(t)的泛函,又是變量的函數(shù)。 泛函Jx0(t)+ x(t)在x0(t)處達到極值,也可看成是函數(shù)Jx0(t)+ x(

11、t)在 =0處達到極值,所以函數(shù)Jx0(t)+ x(t)對變量的偏導數(shù)在 =0處應等于零,即0)()(00txtxJ而由式(1.1.11)有000)()()(),(txtxJtxtxJ比較上面兩式,又考慮x(t)是任意給定的,所以,0)(),(0txtxJQED 從定理1.1.1的推證中可見,泛函達到強極值與弱極值的必要條件是相同的。應當指出:本節(jié)所討論的定義、引理和定理,稍加變動就可以應用于含有多個未知函數(shù)的泛函:Jx1(t), x2(t), xn(t) 最優(yōu)控制問題中,根據(jù)性能指標的類型(積分型性能指標、終值型性能指標、復合型性能指標)的不同,分別對應了古典變分法中的三類基本問題。fttd

12、tttxtxLtxJ0),(),()(),()(ffttxtxJfttffdtttxtxLttxtxJ0),(),(),()(固定端點的Lagrange問題問題描述:假定點A(t0,x0)和B(tf,xf)是所要尋求的泛函(1.2.1)的極值曲線x(t)的兩個固定端點,如圖1-5所示,其坐標為:ffxtxxtx)()(00(1.2.4)現(xiàn)在的問題是:從滿足邊界條件(1.2.4)的二階可微的函數(shù)中,選擇使泛函(1.2.1)達到極小值的函數(shù)x(t)。 解: 設x*(t)是使泛函(1.2.1)達到極小值且滿足邊界條件(1.2.4)的極值條件。現(xiàn)用)()(*)(txtxtx表示滿足邊界條件(1.2.4

13、)的極值曲線x*(t)的鄰域曲線。其中(1.2.5)x(t)是泛函宗量x(t)的變分,(01)是一參變量。為使x(t)是滿足邊界條件(1.2.4)的極值曲線x*(t)的鄰域曲線, x(t)應具有連續(xù)導數(shù)且滿足條件: x(t0)= x(tf)=0 (1.2.6)于是,由式(1.2.5)得到)()(*)(txtxtx(1.2.7) 由于x*(t)是極值曲線,所以泛函(1.2.1)在極值曲線x*(t)上的變分等于零(定理1.1.1),即0J由引理1.1.1知,泛函的變分為0)()(*txtxJJ(1.2.8)(1.2.9)將式(1.2.1)代入式(1.2.9),得0)()(*txtxJJ00),()

14、(*),()(*fttdtttxtxtxtxLdtttxtxtxtxLftt00),()(*),()(*fttdttxtxttxtxLtxtxttxtxL0)()(),(*),(*)()(),(*),(*xLxLfttxxdttxLtxL0)()(1.2.10) 對式(1.2.10)右端第二項進行分部積分dttxLdtdtxLdttxLxttttxttxfff)()()()(000(1.2.12)將式(1.2.11)代入式(1.2.10),并考慮式(1.2.8)得ffttttxxxtxLdttxLdtdL000)()()(利用條件(1.2.6),則上式變?yōu)椋?.2.13)fttxxdttxLd

15、tdL00)()((1.2.11)考慮到泛函宗量的變分x(t)是任意的函數(shù),不妨選擇xxLdtdLtwtx)()((1.2.14)其中w(t)是任一滿足下列條件的函數(shù):)(, 0)(020為某一函數(shù)ctttctttttwff將式(1.2.14)代入式(1.2.13),可得0)(20dtLdtdLtwfttxx由上式可見,一個非負的函數(shù)的定積分為零,只能是被積函數(shù)恒等于零,因此有0 xxLdtdL(1.2.15)將上式左端第二項展開,可得0 xxxxt xxLxLxLL (1.2.16)歐拉(Euler)方程歐拉方程式中2222,xLLxxLLxtLLxxxxt x 若 時,歐拉方程是一個二階微

16、分方程。0 xxL 定理1.2.1 若給定曲線x(t)的始端x(t0)= x0和終端x(tf)= xf,則泛函fttdtttxtxLtxJ0),(),()(達到極值的必要條件是,曲線x(t)滿足歐拉方程0 xxLdtdL其中x(t)應有連續(xù)的二階導數(shù), 則至少應是二次連續(xù)可微的。),(),(ttxtxLx ),(txLL ),(txLL),(xxLLcLxLxxxxxxxxxLxxLxLxLxLxLxLdtd 2)(0)(xxxxxLxLxLx 式(1.2.16)cLxLxx xtxtxL),(),( 對于向量空間的泛函,也存在著歐拉方程,不過是歐拉方程組(即向量歐拉方程)。定理1.2.2 在

17、n維函數(shù)空間中,若極值曲線X(t)=x1(t),x2(t),xn(t)T的始端X(t0)=x1(t0),x2(t0),xn(t0)T和終端X(tf)=x1(tf),x2(tf),xn(tf)T是給定的,則泛函fttdtttXtXLtXJ0),(),()(達到極值的必要條件是曲線X(t)滿足向量歐拉方程0XXLdtdL其中X(t)應有連續(xù)的二階導數(shù),而 則至少應是二次連續(xù)可微的。),(),(ttXtXL(1.2.18)例1.2.1 求泛函 滿足邊界條件 的極值函數(shù)。2022212121)2()(),(dtxxxxtxtxJ1)2(, 0)0(, 1)2(, 0)0(2211xxxx解:由式(1.

18、2.18)得:0022211211xxxxLdtdLxx 0022122122xxxxLdtdLxx )4(11xx 其特征方程為:014s特征根為:js, 1從而得tctcececxtctcececxttttcossincossin4321243211由給定的邊界條件得1, 03421cccc于是得極值函數(shù):ttxttxsin)(sin)(*2*1可以利用MATLAB符號工具箱求解,求解過程如下: syms x1 x2;s=dsolve(D2x1-x2=0,D2x2-x1=0,x1(0)=0,x1(pi/2)=1,x2(0)=0, x2(pi/2)=-1,t);x1=s.x1x2=s.x2運

19、行結果如下:x1 =sin(t)x1 =-sin(t)例1.2.2 最速降線(又稱捷線)問題 所謂最速降線問題是:設在豎直平面內(nèi)有兩點A和B,它們不在同一條鉛垂線上,現(xiàn)有一質(zhì)點受重力的作用自較高的A點向較低的B點滑動,如果不考慮各種阻力的影響,問應取怎樣的路徑,才能使所經(jīng)歷的時間最短?解:在A、B兩點所在的豎直平面內(nèi)選擇 一坐標系,如圖16所示。 A點為坐標原點 ,水平線為x軸,鉛垂線為y軸。設質(zhì)點的初速度為零,則由力學的知識可知,質(zhì)點在重力的作用下,不考慮各種阻力的影響,從A點向B點下滑的速度的大小為gydtdl2(1.2.19)xoyA(0,0)B(xf,yf)dxdydl圖16由圖16得

20、dxydydxdl2221)()((1.2.20)將式(1.2.20)代入式(1.2.19)中,并變換,得dxgyydt212對上式兩邊進行積分,可得質(zhì)點自點A(0,0)滑動到點B(xf,yf)所需的時間為dxgyyxytfx0221)((1.2.21) 設y=y(x)是連接點A(0,0)和點B(xf,yf)的任一光滑曲線,則最速降線問題的數(shù)學提法是:在XOY平面上確定一條滿足邊界條件ffyxyy)(, 0)0((1.2.22)的極值曲線y=y(x),使泛函dxgyyxyJfx0221)((1.2.23)達到極小值。這時被積函數(shù)為:gyyL212不顯含自變量x,由(1.2.17)知,它的首次積

21、分為cygyygyyLyLy)1 (221222化簡上式得212121,1gccycy這種方程宜于利用參數(shù)法求解,為此,令ctgy 于是,)2cos1 (2sin112121ccctgcy又由dcdcctgdcydydx)2cos1 (sin2cossin21211對上式積分,得2121)2sin2(2)22sin(ccccx由邊界條件y(0)知,c2=0,于是)2cos1 (2)2sin2(211cycx令2,211cr最后得)cos1 ()sin(ryrx 這是圓滾線的參數(shù)方程。式中r是滾動圓半徑,其值由另一邊界條件y(xf)=yf確定。所以,最速降線是一條圓滾線。當極值曲線x*(t)的端

22、點變化時,要使泛函 達到極小值, x*(t)首先應當滿足歐拉方程:fttttxtxLtxJ0),(),()(0 xxLdtdL若端點固定,可以利用端點條件:ffxtxxtx)()(00確定歐拉方程中的兩個待定的積分常數(shù)。問題:若端點可變,如何確定這兩個積分常數(shù)?橫截條件推導過程問題描述:假定極值曲線的始端A(t0,x0)是固定的,而終端B(tf,xf)是可變的,并沿著給定的曲線)()(ffttx(1.3.1)變動,如圖17所示。現(xiàn)在的問題是需要確定一條從給定的點A(t0,x0)到給定的曲線(1.3.1)上的某一點B(tf,xf)的連續(xù)可微的曲線x(t) ,使得泛函fttttxtxLtxJ0),

23、(),()(達到極小值。(1.3.2)txA(t0,x0)B(t*f,x*f)x*(t)x(t)(ft圖17解:設x*(t)是泛函(1.3.2)的極值曲線。 x*(t)的鄰域曲線可表示為:)()(*)()()(*)(txtxtxtxtxtx(1.3.3)(1.3.4)由圖1-7可見,每一條鄰域曲線x(t)都對應一個終端時刻tf ,設極值曲線x*(t)所對應的終端時刻為tf *,則鄰域曲線x(t)所對應的終端時刻tf可以表示為:fffdttt*(1.3.5)將式(1.3.3)(1.3.5)代入式(1.3.2),得ffdtttdtttxtxtxtxLJ*0),()(),()(*0),()(),()

24、(*fttdtttxtxtxtxLfffdtttdtttxtxtxtxL*),()(),()(*(1.3.6)根據(jù)泛函達到極值的必要條件0)()(0txtxJJ則有:0*0),()(),()(fttdtttxtxtxtxL0),()(),()(0*fffdtttdtttxtxtxtxL(1.3.7)式(1.3.7)左邊第一項相當于tf固定時的泛函的變分,按照上一節(jié)推導的結果可得0*0),()(),()(fttdtttxtxtxtxL*0*0)()()(ffttttxxxtxLdttxLdtdL(1.3.8)式(1.3.7)左邊第二項先利用中值定理,然后求導,則得fttdtttdtttxtxLd

25、tttxtxtxtxLffff*),(),(),()(),()(*0*(1.3.9)將式(1.3.8)和式(1.3.9)代入式(1.3.7),得0),(),()()()(*0*0*fttttttxxxdtttxtxLtxLdttxLdtdLfff考慮到歐拉方程和始端固定0)(, 00txLdtdLxx所以0),(),()(*fttfttxdtttxtxLtxLff(1.3.10)若x(t*f)與dtf互不相關,則由上式得00ffttttxLL(1.3.11)但是,終端點沿曲線(1.3.1)變動,所以x(t*f)與dtf相關。為了進一步簡化式(1.3.10),應當求出x(t*f)與dtf之間的關

26、系。 根據(jù)終端約束條件(1.3.1),應有)()()(*ffffffdttdttxdttx將上式對取偏導數(shù),并令=0,利用式(1.3.4),整理得fffffffffdttxttxdtttxdttx)()()()()()(*將上式代入式(1.3.10),可得0)(*fttxdtLxLf由于dtf是任意的,所以0)(*fttxLxL(1.3.12)橫截條件定理1.3.1 若曲線x(t)由一給定的點(t0,x0)到給定的曲線x(tf)=(tf)上的某一點(tf,xf),則泛函fttttxtxLtxJ0),(),()(達到極值的必要條件是, x(t)滿足歐拉方程0 xxLdtdL和橫截條件0)(*ft

27、txLxL其中x(t)應有連續(xù)的二階導數(shù), 則至少應是二次連續(xù)可微的,而(t) 則應有連續(xù)的一階導數(shù)。),(),(ttxtxL若極值曲線的始端不是固定的,并沿著曲線)()(00ttx(1.3.13)變動,則同樣可以推導出始端的橫截條件0)(*0ttxLxL(1.3.14) 根據(jù)定理1.3.1和式(1.3.14),可得到端點可變時,Lagrange問題的解,除有歐拉方程外,還有橫截條件:(1)始端、終端可變,即x(t0)=(t0), x(tf)=(tf),則橫截條件為:0)(*0ttxLxL0)(*fttxLxL(2) 當t0、 tf 可變,而x(t0) 與x(tf)固定時,則橫截條件為:, 0

28、*0ttxLxL0*fttxLxL(3)當t0、 tf 固定,而x(t0) 與x(tf)可變時,即始端與終端分別在t=t0、t=tf上滑動,則橫截條件為:0*0ttxL0*fttxL定理1.3.1和以上幾種情況的橫截條件,都可以將其推廣到n維函數(shù)向量X(t)=x1(t),x2(t),xn(t)T的泛函的情形。定理1.3.2 在n維函數(shù)空間中,若曲線X(t)=x1(t),x2(t),xn(t)T的始端X(t0)=x1(t0),x2(t0),xn(t0)T是固定的,而終端X(tf)=x1(tf), x2(tf), xn(tf)T是可變的,且在曲面X(tf)=(tf)上變動,則泛函fttdtttXt

29、XLtXJ0),(),()(達到極值的必要條件是,曲線X(t)滿足向量歐拉方程0XXLdtdL其中X(t)應有連續(xù)的二階導數(shù),而 則至少應是二次連續(xù)可微的,而(t)=1(t), 2(t), n(t)T則應有連續(xù)的一階導數(shù)。),(),(ttXtXL和橫截條件0)(*fttXTLXL 若曲線X(t)=x1(t),x2(t),xn(t)T的始端不是固定的,而是可變的,并在給定的曲面)()(00ttX上變動,其中 ,則同樣可以推導出始端的橫截條件為: Tntttt)(,),(),()(0020100)(*0ttXLXL例1.3.1 求t-x平面上由給定A(0,1)至給定直線x=2t的弧長最短的曲線方程

30、。o1212txA(0,1)dsx*(t)圖18解:由圖18,弧長dtxdxdtds2221)()(根據(jù)題意,目標泛函應選為:dtxJft021這是一個始端固定,終端可變的泛函的變分問題。由于泛函的被積函數(shù) 中不顯含x(t),所以Euler方程為:21xL2112221101ctcxcccxcxxxxdtd由初始條件x(0)=1,得c2=1,從而有11tcx由橫截條件(1.3.12),得01)1(122xxxx經(jīng)整理得 ,所以c1=1。最優(yōu)軌線方程為:1x 1)(* ttx最優(yōu)軌線與給定直線垂直。泛函二階變分推導過程: 給定泛函為其一階變分為fttdtttxtxLtxJ0),(),()(0),

31、()(),()(ttxtxtxtxJJdttxtxttxtxLtxtxttxtxLdtttxtxtxtxLdtttxtxtxtxLffftttttt000)()(),(),()()(),(),(),()(),()(),()(),()(00(1.4.1)(1.4.2)而二階變分為)(2JJdttxtxttxtxtxtxLtxtxttxtxtxtxLdttxtxttxtxtxtxLtxtxttxtxtxtxLttxtxtxtxJfftttt000)()(),()(),()()()(),()(),()()()(),()(),()()()(),()(),()(),()(),()(00dttxtxtxt

32、txtxLtxtxttxtxLtxtxttxtxLtxttxtxLtxtxdttxtxttxtxLtxtxtxtxttxtxLtxtxttxtxLfftttt)()()(),(),()()(),(),()()(),(),()(),(),( )()()()(),(),()()()()(),(),(2)()(),(),(222222222222200(1.4.3) 于是,為使泛函(1.4.1)在曲線x(t)上達到極?。ɑ驑O大)值,其一階變分(1.4.2)應為零,而其二階變分(1.4.3)必須為正(或負)。由此,得到下面的定理。定理1.4.1 若泛函fttdtttxtxLtxJ0),(),()(的一

33、階變分0J則Jx(t)達到極小值的充分條件是二階型矩陣)(),(),()()(),(),()()(),(),()(),(),(222222txttxtxLtxtxttxtxLtxtxttxtxLtxttxtxL(1.4.4)是正定的或半正定的;而Jx(t)達到極大值的充分條件是式(1.4.4)是負定的或半負定的。 定理1.4.1可以推廣到含有n個未知函數(shù)的泛函的情形。一、回顧等式約束條件下函數(shù)極值問題的解法 設有函數(shù)),(yxfZ (1.5.2)現(xiàn)在需要求函數(shù)Z在約束條件為0),(yxg(1.5.1)情況下的極值。(1)消元法:從約束條件(1.5.2)中將y解出來。用x表示y,即 y=y(x)

34、然后將y(x)代入f(x,y)中,得到 Z=fx, y(x) (1.5.3)這樣,函數(shù)Z就只含有一個自變量x了,在等式(1.5.2)約束條件下的函數(shù)(1.5.1)的極值問題,就變成無約束條件的函數(shù)(1.5.3)的極值問題了。但是,消元法存在兩個問題:從方程(1.5.2)中將y解出來往往是很困難的;對x和y這兩個自變量未能平等看待。(2)拉格朗日乘子法(Lagrange factor) 步驟如下: 作一個輔助函數(shù) F=f(x,y)+g(x,y) 式中, 是待定的常數(shù),稱為拉格朗日乘子; 求輔助函數(shù)F的無條件極值,即令0, 0yFxF(1.5.4) 聯(lián)立求解方程(1.5.2)和(1.5.4),求出

35、駐點( x0 ,y 0)和待定常數(shù)值; 判斷( x0 ,y 0)是否是函數(shù)f(x,y)的極值點。 拉格朗日乘子法對于求n元函數(shù) y=f(x1,x2,xn)在多個約束方程 gi(x1,x2,xn) =0,i=1,2, ,m; m n條件下的極值問題,同樣適用。二、等式約束條件下泛函極值問題的解法求泛函fttdtttXtXLJ0),(),((1.5.5)在約束方程為, 0),(),(0ftttttXtXf(1.5.6)和端點條件為ffXtXXtX)()(00(1.5.7)情況下的極值曲線。這里 X(t)=x1(t),x2(t),xn(t)T, f=f1,f2,fmT,m n。而 是x1(t),x2

36、(t),xn(t)和t的標量函數(shù)。),(),(ttXtXLdtttXtXftttXtXLJfttT0),(),()(),(),(0(1.5.8)),(),()(),(),(ttXtXftttXtXLFT0XXFdtdF說明: 利用拉格朗日乘子法求得的函數(shù)X(t),如果(1.5.8)達到極值,就一定是原泛函(1.5.5)的極值函數(shù)。因為由約束方程(1.5.6)和歐拉方程(1.5.10)聯(lián)立解出的向量函數(shù)X(t)和(t)一定滿足約束方程(1.5.6),所以必有J0=J,另外,當將所解出的(t)代入輔助泛函(1.5.8)時,函數(shù)X(t)將使輔助泛函(1.5.8)達到無條件極值,因為函數(shù)X(t)是輔助

37、泛函(1.5.8)的歐拉方程(1.5.10)的解。 上面的論述僅僅指出了利用拉格朗日乘子法求出的輔助泛函(1.5.8)的無條件的極值函數(shù),一定是原泛函(1.5.5)在等式(1.5.6)約束條件下的極值函數(shù)。但是,卻沒有說明原泛函(1.5.5)在等式(1.5.6)約束條件下的所有極值函數(shù)是否都能利用拉格朗日乘子法求出來?下面的定理將回答這個問題。定理1.5.1 如果n維向量函數(shù) X(t)=x1(t),x2(t),xn(t)T (1.5.11)能使泛函fttdtttXtXLJ0),(),((1.5.15)在等式約束, 0),(),(0ftttttXtXf(1.5.12)條件下達到極值,這里f是m維

38、向量函數(shù), m n,必存在適當?shù)膍維向量函數(shù) (t)= 1(t), 2(t), m (t)T (1.5.14)使泛函dtttXtXftttXtXLJfttT0),(),()(),(),(0(1.5.13)達到無條件極值。即函數(shù)X(t)是泛函(1.5.15)的歐拉方程0XXFdtdF的解,其中(1.5.16)( ),( ), ( ) ( ),( ), TFL X tX t tt f X tX t t而X(t)和(t)由歐拉方程(1.5.16)和約束方程(1.5.13)共同確定。說明: 定理1.5.1表明,泛函(1.5.12)在等式(1.5.13)約束條件下的極值函數(shù)X(t) ,同時也使泛函(1.

39、5.15)達到無條件極值。這就進一步說明泛函(1.5.12)在等式(1.5.13)約束條件下的極值函數(shù)X(t) 都可通過拉格朗日乘子法求得。 如果不僅將X(t) ,而且連函數(shù)(t)在內(nèi),都看成是泛函(1.5.15)的宗量,那么,約束方程(1.5.13)也可以看成是泛函(1.5.15)的歐拉方程。方程(1.5.13)和(1.5.16)共有n+m個方程,恰好可以解出n維和m維未知函數(shù)X(t) 和(t)。 當約束方程中(1.5.13)中的函數(shù)f不包括有 X(t)的導數(shù) 時,則式(1.5.13)便成為一種代數(shù)方程約束。定理1.5.1仍然成立。例1.5.1 已知受控系統(tǒng)的動態(tài)結構如圖19所示。求最優(yōu)控制

40、u*(t),使目標泛函202)(21dttxJ 取極小值。給定的邊界條件為0)2(, 1)0(, 0)2(, 1)0(xxxxx(t)u(t)21s圖19 雙積分對象解:令)()(),()(21txtxtxtx則得系統(tǒng)的狀態(tài)方程為:)()()()(221tutxtxtx現(xiàn)在的目標泛函為202)(21dttuJ應用拉格朗日乘子法,構造輔助泛函(1.5.17)202122120)()()()()()()(21dttxtutxtxtttuJ令)()()()()()()(21221212txtuttxtxttuF則向量形式的歐拉方程為111)(0)(11cttFdtdFxx21221)(0)()(22

41、ctctttFdtdFxx212)(0)()(ctctuttuFdtdFuu根據(jù)狀態(tài)方程(1.5.17),得3221221221ctctcxctcx4322311212161ctctctcxxx利用邊界條件,可得1, 1,27, 34321cccc所以,最優(yōu)控制273)(* ttu 對于最優(yōu)控制問題來說,當狀態(tài)變量和控制變量均不受約束,即 X(t)Rn,U(t) Rm時,是個在等式約束條件下求泛函極值的變分問題,因此,可以利用在上一節(jié)中介紹的拉格朗日乘子法來求解。在這一節(jié)中,利用拉格朗日乘子法求解最優(yōu)控制問題時,將引入哈密頓(Hamilton)函數(shù),推導出幾種典型的最優(yōu)控制問題應滿足的必要條件

42、。1.6.1 拉格朗日問題的解問題1.6.1 給定系統(tǒng)狀態(tài)方程),(),()(ttUtXftX(1.6.2)初始條件00)(XtX(1.6.1)終端條件:tf固定,X(tf)自由和性能泛函fttdtttUtXLJ0),(),(1.6.3)要求從容許控制U(t) Rm中確定最優(yōu)控制U*(t),使系統(tǒng)(1.6.1)從給定的初態(tài)X(t0)轉移到某個終態(tài)X(tf) ,并使性能泛函(1.6.3)達到極小值。這是拉格朗日問題,又稱為積分型最優(yōu)控制問題。 解:將狀態(tài)方程(1.6.1)改寫為0)(),(),(tXttUtXf(1.6.4)于是,上述最優(yōu)控制問題就變成為在微分方程(1.6.4)約束條件下求泛函(

43、1.6.3)極值的變分問題。利用拉格朗日乘子法,引入n維拉格朗日乘子向量 (t)= 1(t), 2(t), n (t)T (t)稱為協(xié)態(tài)變量,以便與狀態(tài)變量相對應。 構造輔助泛函fttTdttXttUtXftttUtXLJ0)(),(),()(),(),(0(1.6.5)dtttUttXtXFftt0),(),(),(),(其中,)(),(),()(),(),(),(),(),(),(tXttUtXftttUtXLttUttXtXFT(1.6.6)于是,求泛函(1.6.3)在等式(1.6.1)約束條件下的極值問題,就轉變成為求泛函(1.6.5)的無約束條件的極值問題。定義哈密頓(Hamilto

44、n)函數(shù)為),(),()(),(),(),(),(),(),(ttUtXftttUtXLttUttXtXHT(1.6.7)它是一標量函數(shù),則式(1.6.6)變?yōu)?()(),(),(),(),(),(),(),(tXtttUttXHttUttXtXFT)()(),(),(),(ttXttUttXHT 利用變分法可以寫出輔助泛函(1.6.5)的歐拉方程(1.6.8)000UFdtdUFFdtdFXFdtdXF將式(1.6.8)代入上式,得0),(),()()(UHttUtXfHtXXHt(1.6.11)(1.6.10)(1.6.9) 協(xié)態(tài)方程(或共軛方程)狀態(tài)方程規(guī)范方程(或正則方程)控制方程(1

45、.6.12)初始狀態(tài)為00)(XtX由于終端時刻tf固定,終端狀態(tài)X(tf)自由,所以橫截條件為 0fttXF考慮式(1.6.8),得0)(ft(1.6.13) 式(1.6.9)(1.6.13)就是式(1.6.1)(1.6.3)所給定的最優(yōu)控制問題的解應滿足的必要條件。這些條件也可以由求輔助泛函J0對狀態(tài)變量X(t)和控制變量U(t)的變分中推導出來。 聯(lián)立求解規(guī)范方程(1.6.9)和(1.6.10)可以得到兩個未知函數(shù)X(t)和 (t),其一個邊界在始端(1.6.12),另一個邊界在終端(1.6.13),故稱為混合邊界問題或兩點邊界值問題。,),(),(),()(ttttXUtXftX,),

46、(),(),()(ttttXUtXHXt說明: (1)對于兩點邊界值問題,一般難以求得其解析解,通常需要采用數(shù)值計算方法求其數(shù)值解。 (2)利用引入哈密頓函數(shù)的方法求解拉格朗日型最優(yōu)控制問題,是將求泛函(1.6.3)在等式(1.6.1)約束條件下對控制函數(shù)U(t)的條件極值問題轉化為求哈密頓函數(shù)H對控制變量U(t)的無條件極值問題。這種方法稱為哈密頓方法。定理1.6.1 設系統(tǒng)的狀態(tài)方程 ),(),()(ttUtXftX則為將系統(tǒng)從給定的初態(tài)00)(XtX轉移到終端時刻 tf固定,終端狀態(tài)X(tf)自由的某個終態(tài),并使性能泛函fttdtttUtXLJ0),(),(達到極小值的最優(yōu)控制應滿足的必

47、要條件是 (1)設U*(t)是最優(yōu)控制, X*(t)是對應于U*(t)的最優(yōu)軌線,則必存在一與U*(t)和X*(t)相對應的n維協(xié)態(tài)變量(t) ,使得X(t)與(t) 滿足規(guī)范方程),(),()(ttUtXfHtXXHt)(其中),(),()(),(),(ttUtXftttUtXLHT (2)邊界條件為00)(XtX0)(ft (3)哈密頓函數(shù)H對控制變量U(t)(t0ttf)取極值,即0UH* 沿著最優(yōu)控制和最優(yōu)軌線,哈密頓函數(shù)H對時間t求全導數(shù),得UUHHXXHtHdtdHTTTUUHXHHHXHtHTTTtH若H不顯含t時,則有 H(t)=常數(shù) tt0,tf; 也就是說,當H不顯含t時,

48、哈密頓函數(shù)H是不依賴于t的常數(shù)。例1.6.1 已知 系統(tǒng)方程和邊界條件為,2221uxxxx,1)0(1)0(21xx0) 1 (0) 1 (21xx求使性能泛函102)(21dttuJ為極小值的最優(yōu)控制函數(shù)與最優(yōu)軌線。 解:這是一個最小能量控制問題。其哈密頓函數(shù)為uxxuH22221221由控制方程02uUH得2u協(xié)態(tài)方程為01212解協(xié)態(tài)方程,得11c122212cecct于是teccu21由狀態(tài)方程teccxxxx212221解得tteccecx2132214213121cectcecxtt利用邊界條件0) 1 (, 0) 1 (, 1)0(, 1)0(2121xxxx求得積分常數(shù)為23

49、09.11,0335. 5,5288.30,2979.194321cccc于是,最優(yōu)控制與最優(yōu)軌線分別為tetu5288.302979.19)(*2309.112644.152979.190335. 5)(*1ttetetxtteetx2644.152979.190335. 5)(*2可以利用MATLAB符號工具箱求解上述微分方程,程序如下:syms l1 l2 x1 x2; s=dsolve(D1l1=0,D1l2=-l1-l2,D1x1=x2,D1x2=x2-l2,x1(0)=1, x2(0)=1,x1(1)=0,x2(1)=0,t)l1=s.l1, l2=s.l2,x1=s.x1,x2=

50、s.x2運行結果為:s = l1: 1x1 sym l2: 1x1 sym x1: 1x1 sym x2: 1x1 syml1 =-2*exp(1)/(exp(1)-3)l2=2*exp(1)/(exp(1)-3)-2*exp(1)/(exp(1)-3)*exp(-t)-2*exp(-t)*exp(1)/(exp(1)-1)/(exp(1)-3)x1=-exp(1)/(exp(1)-3)*exp(t)+2*exp(1)/(exp(1)-3)*t+exp(1)/(exp(1)-3)*exp(-t)+exp(1)/(exp(1)-1)/(exp(1)-3)*exp(t)+exp(-t)*exp(1

51、)/(exp(1)-1)/(exp(1)-3)-2*exp(1)/(exp(1)-1)/(exp(1)-3)+exp(t)x2=2*exp(1)/(exp(1)-3)-exp(1)/(exp(1)-3)*exp(-t)-exp(1)/(exp(1)-3)*exp(t)-exp(-t)*exp(1)/(exp(1)-1)/(exp(1)-3)+exp(1)/(exp(1)-1)/(exp(1)-3)*exp(t)+exp(t) 例1.6.2 問題同例1.6.1,只是終端條件為x1(1)=0,x2(1)自由,求該最優(yōu)控制問題。解:問題的規(guī)范方程和控制方程均與例1.6.1相同,但邊界條件變?yōu)?) 1

52、 (, 0) 1 (, 1)0(, 1)0(2121xxx由這些邊界條件求得的積分常數(shù)為1623. 6,2880. 0,7486. 9,5863. 34321cccc于是,所求得的最優(yōu)解為teu7486. 95863. 3*1623. 68743. 45863. 32880. 0*1ttetextteex8743. 45863. 32880. 0*2 由例1.6.1和例1.6.2可見,對于兩個相同的最優(yōu)控制問題,只是部分終端狀態(tài)不相同,所得到的最優(yōu)解則完全不同。1.6.2 波爾扎問題的解問題1.6.2 給定系統(tǒng)狀態(tài)方程),(),()(ttUtXftX(1.6.18)初始條件00)(XtX(1.

53、6.17)和性能泛函fttffdtttUtXLttXJ0),(),(),(1.6.19)要求從容許控制U(t) Rm中確定最優(yōu)控制U*(t),使系統(tǒng)(1.6.17)從給定的初態(tài)X(t0)轉移到某個終態(tài)X(tf) ,并使性能泛函(1.6.19)達到極小值。這是波爾扎問題,又稱為復合型最優(yōu)控制問題。 由于給定的端點條件不同,上述最優(yōu)控制問題的解將不同。下面根據(jù)三種不同的端點條件,分別予以討論。 1. 終端時刻tf固定,終端狀態(tài)X(tf) 自由的情況 構造輔助泛函為:),(0ffttXJfttTTdttXtttUtXftttUtXL0)()(),(),()(),(),(若令哈密頓函數(shù)為),(),()

54、(),(),(),(),(),(ttUtXftttUtXLttUttXHHT(1.6.20)(1.6.21)并對式(1.6.20)積分號內(nèi)第三項進行分部積分,則輔助泛函變?yōu)閒fttTttTfftXtdttXtttUttXHttXJ00)()()()(),(),(),(),(0dtXtttUttXHtXttXtttXfttTTffTff0)()(),(),(),()()()()(),(00(1.6.22)求上式對狀態(tài)變量X(t)和控制變量U(t)的變分,得fttTTTTffTfTfffdtXUUHXXHtXttXttXtXttXJ0)()()()()()(),(000(1.6.24)由于泛函J0

55、達到極值的必要條件為00J(1.6.23)由于X(t0)=0, X(tf)0, X(t)0, U(t)0,則由式(1.6.23)和(1.6.24)可得上述波爾扎型最優(yōu)控制問題的解應滿足的必要條件為00)(),(),()(0)(XtXttUtXfHtXUHXHt這些關系與拉格朗日型最優(yōu)控制問題的完全相同,所不同的只是橫截條件,即協(xié)態(tài)變量的終端值)(),()(fffftXttXt 2. 終端時刻tf固定,終端狀態(tài)X(tf) 受約束的情況 設終端狀態(tài)受到如下等式的約束0),(ffttX(1.6.25)其中為r(當L=0,rn-1;當L0,rn)維向量,即Tr,21這時,終端狀態(tài)X(tf)即不是固定的

56、,也不是完全自由的,只能在終端流型(1.6.25)上變動。在構造輔助泛函時,應考慮終端約束條件(1.6.25),為此,需要引入待定的拉格朗日乘子向量Tr,21于是,所構造的輔助泛函為),(),(0ffTffttXttXJfttTTdttXtttUtXftttUtXL0)()(),(),()(),(),(考慮到哈密頓函數(shù)為),(),()(),(),(),(),(),(ttUtXftttUtXLttUttXHHT(1.6.26)并對式(1.6.26)積分號內(nèi)第三項進行分部積分,則輔助泛函變?yōu)閐tXHtXttXtttXttXdtXHtXtttXttXJfffttTTffTffTffttTttTffTff000)()()()(),(),()()(),(),(000求J0對狀態(tài)變量X(t)和控制變量U(t)的變分,得ffttTTTTffTTfffTTfffttTTTTffTfTfffTfTfffdtXUUHXXHtXttXttXttXtXttXdtXUUHXXHtXttXttXtXttXtXtXttXJ00)()()()()(),()(),()()()()()()(),()()(),(00000考慮到 J0=0, X(t0)=0, X(tf

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論