變分法在最優(yōu)控制中的應(yīng)用_第1頁
變分法在最優(yōu)控制中的應(yīng)用_第2頁
變分法在最優(yōu)控制中的應(yīng)用_第3頁
變分法在最優(yōu)控制中的應(yīng)用_第4頁
變分法在最優(yōu)控制中的應(yīng)用_第5頁
免費預(yù)覽已結(jié)束,剩余42頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、關(guān)于變分法在最優(yōu)控制中的應(yīng)用現(xiàn)在學(xué)習(xí)的是第一頁,共47頁具有等式約束條件下的變分問題具有等式約束條件下的變分問題 (1/10)1/10)3.1 具有等式約束條件下的變分問題具有等式約束條件下的變分問題 q 具有等式約束條件下,多個宗量函數(shù)的泛函極值問題可表示如下。 等式約束變分問題等式約束變分問題 尋找一條連續(xù)可微的極值曲線,使性能泛函達(dá)到極值, 極值曲線 x(t) 滿足微分方程形式的等式約束 式中, 為m維 (mn) 關(guān)于t, x 和的非線性向量函數(shù)。 0( , ( ), ( )dfttJF ttttxx ( , ( ), ( )0tttxx ( , ( ), ( )tttxx 現(xiàn)在學(xué)習(xí)的是

2、第二頁,共47頁具有等式約束條件下的變分問題具有等式約束條件下的變分問題 (2/10)2/10)q 這里,極值曲線x(t)除滿足邊界條件和古典變分學(xué)中規(guī)定的連續(xù)可微條件外, 還須滿足該等式約束條件。 由于動態(tài)系統(tǒng)的狀態(tài)方程可歸為等式約束, 因此該等式約束變分問題是研究最優(yōu)控制的基礎(chǔ)。 下面就給出并證明處理等式約束變分問題的等式約束變等式約束變分定理。分定理?,F(xiàn)在學(xué)習(xí)的是第三頁,共47頁具有等式約束條件下的變分問題具有等式約束條件下的變分問題 (3/10)3/10)定理定理 4 4q 定理定理 4(等式約束變分定理) 如果n維向量函數(shù)x(t)能使等式約束變分問題取極值,那么,必存在待定的m維拉格

3、朗日乘子向量函數(shù) (t), 使泛函 達(dá)到無條件極值,即極值曲線x(t)是上述泛函所滿足的歐拉方程和等式約束條件 (47) 的解, 其中01( , ( ), ( ), ( )dfttJH tttttxxd0dHHtxx )(),(,()()(),(,()(),(),(,(tttttttFttttHxxxxxx( , ( ), ( )0(47)tttxx現(xiàn)在學(xué)習(xí)的是第四頁,共47頁具有等式約束條件下的變分問題具有等式約束條件下的變分問題 (4/10)4/10)q 引進(jìn)拉格朗日乘子可以將泛函的條件極值問題化為一個無條件的極值問題。 引入該定理的作用,僅僅是表明泛函J在等式約束條件下的極值曲線x(t)

4、,同時使得泛函J和J1達(dá)到無條件極值。 在后面還要詳細(xì)講解具有約束條件下求解極值問題的泛函變分問題?,F(xiàn)在學(xué)習(xí)的是第五頁,共47頁具有等式約束條件下的變分問題具有等式約束條件下的變分問題 (5/10)5/10)例例 7 7q 上述歐拉方程和約束條件共有n+m個方程,恰好可以解出n+m個未知函數(shù) x(t) 和 (t)。 通過邊界條件確定 x(t) 和 (t) 中的積分常數(shù)。 隨著終端條件的不同, 邊界條件也不同。 在 2.4節(jié)和 2.5節(jié)所討論橫截條件就能解決這個問題。q 例例 6 火箭在自由空間里的運動作用可用下列微分方程描述式中, u(t)為推力; (t)為角位移。)()(tut 現(xiàn)在學(xué)習(xí)的是

5、第六頁,共47頁具有等式約束條件下的變分問題具有等式約束條件下的變分問題 (6/10)6/10) 令x1(t)=(t), x2(t)=(t),可建立狀態(tài)方程如下 試求控制函數(shù) u(t),使系統(tǒng)從初始狀態(tài)經(jīng)過 t = 2s 轉(zhuǎn)移到狀態(tài)空間原點, 即且使如下性能指標(biāo)取極小。uxxx22112(0) = (0) = 1, (0) = (0) = 1xx12(2) = (2) =0, (2) = (2) = 0 xx202d)(21ttuJ現(xiàn)在學(xué)習(xí)的是第七頁,共47頁具有等式約束條件下的變分問題具有等式約束條件下的變分問題 (7/10)7/10)q 解解 該問題屬于終端固定的極值問題。 選擇向量拉格朗

6、日乘子函數(shù) (t)=1(t), 2(t),由定理4,利用拉格朗日乘子法可得如下輔助泛函指標(biāo)式中,式中狀態(tài)變量x(t)、控制函數(shù)u(t)和向量拉格朗日乘子函數(shù) (t)都為該泛函的宗量。 在一般形式中沒有宗量u(t), 實際上,我們可以把u(t)和x(t)一樣來處理,比如,在本例中可以定義u(t)=x3(t)。01( , ( ), ( ), ( ), ( )dfttJH ttt u tttxx2121221( , , , , ) () ()2H tuuxxuxx x現(xiàn)在學(xué)習(xí)的是第八頁,共47頁具有等式約束條件下的變分問題具有等式約束條件下的變分問題 (8/10)8/10) 那么,這些泛函的宗量必須

7、滿足如下歐拉方程111212221211222d0 ( )0dd0 ( ) ( )dd0( ) ( )dd0( )( )dd0( )( )dHHtxtxHHttxtxHHu ttutuHHx tx ttHHx tu tt 現(xiàn)在學(xué)習(xí)的是第九頁,共47頁具有等式約束條件下的變分問題具有等式約束條件下的變分問題 (9/10)9/10) 聯(lián)立求解上述歐拉方程,可得111212221211222d0 ( )0dd0 ( ) ( )dd0( ) ( )dd0( )( )dd0( )( )dHHtxtxHHttxt xHHu ttutuHHx tx ttHHx tu tt 11211212221232121

8、234 ( ) ( ) ( )d( )1( )( )d211( )( )d62tCtttC tCu tC tCx tu ttC tC tCx tx ttC tC tC tC 現(xiàn)在學(xué)習(xí)的是第十頁,共47頁具有等式約束條件下的變分問題具有等式約束條件下的變分問題 (10/10)10/10) 利用邊界條件可解得 因此, 最優(yōu)控制函數(shù)和狀態(tài)的最優(yōu)軌線12*32*27*( )3217*( )( )12437*( )( )22utttx tttttx tttt 123473112CCCC 現(xiàn)在學(xué)習(xí)的是第十一頁,共47頁末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題(1/12)

9、1/12)3.2 末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題q 這一節(jié)著重討論末態(tài)不受約束的最優(yōu)控制問題。 所謂末態(tài)不受約束, 是指末態(tài)x(tf)可在Rn空間中取任何值,即目標(biāo)集為整個狀態(tài)空間。 因此,該問題可描述如下。 末態(tài)無約束最優(yōu)控制問題 求一容許控制u(t)U,tt0,tf,在末態(tài)時刻tf固定,狀態(tài)x(tf)無約束,初始狀態(tài)x(t0)=x0以及被控系統(tǒng)等約束條件下,使如下復(fù)合型性能泛函指標(biāo)達(dá)到最小值。( )( ( ), ( ), )ttt txf xu0 ()( (),)( , ( ), ( )dftfftJSttL ttttuxxu現(xiàn)在學(xué)習(xí)的是第十二

10、頁,共47頁末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題(2/12)2/12)q 對該最優(yōu)控制問題,若將動態(tài)系統(tǒng)的狀態(tài)方程改寫成等式約束條件則可根據(jù)等式約束變分定理等式約束變分定理(定理4)求解該泛函極值問題,兩問題只是邊界條件不同而已。 引入拉格朗日乘子向量函數(shù) (t),將等式約束條件和原有的性能指標(biāo)泛函結(jié)合成一個新的泛函 泛函J1的極值問題與原泛函J的極值問題等價。 ( ( ), ( ), )( )0tt ttf xux 01 ()( (),) ( ( ), ( ), )( ) ( ( ), ( ), )( )dftfftJSttLtt tttt tttux

11、xuf xux 現(xiàn)在學(xué)習(xí)的是第十三頁,共47頁末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題(3/12)3/12) 為方便起見,定義一標(biāo)量函數(shù)如下 該標(biāo)量函數(shù)H稱為哈密頓(Hamilton)函數(shù)。因此,泛函J1可記為。( ( ), ( ), ( ), )( ( ), ( ), )( ) ( ( ), ( ), )Httt tLtt tttt txuxuf xu00100 ()( (),)( ( ), ( ), ( ), )( ) ( )d( (),)( ) ( )() ()( ( ), ( ), ( ), )( ) ( )dfftfftffffttJSttHttt

12、 ttttSttttttHttt ttttuxxuxxxxxux現(xiàn)在學(xué)習(xí)的是第十四頁,共47頁末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題(4/12)4/12)q 求泛函J1的極值問題, 可以直接用歐拉方程(49)來求得極值條件, 并且通過邊界條件確定由極值條件得到方程解的積分常數(shù), 如例 6中, 邊界條件為系統(tǒng)起點和終點狀態(tài)。 后面將會給出不同情況下的邊界條件。 當(dāng)然在確定泛函J1的極值條件時, 不是一定要利用歐拉方程 (49) 來求解, 可以根據(jù)實際情況進(jìn)行必要的簡化。 就泛函J1而言, 其宗量有 以及u(t)和 (t) ; 前面已經(jīng)指出, 不必對宗量 (t

13、)變分, 因為對 (t)的變分結(jié)果就是約束條件(系統(tǒng)狀態(tài)方程)。d0(49)dHHtxx0, ( ), ( )ft tx tx t現(xiàn)在學(xué)習(xí)的是第十五頁,共47頁末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題(5/12)5/12) 考慮到初始狀態(tài) (t0, x(t0), 末態(tài)時刻tf固定以及x(tf)自由,泛函J1對其所有的可變宗量的一階變分為 當(dāng)選擇 (t)滿足時,可惟一確定拉格朗日乘子函數(shù) (t)。 于是, 泛函J1的一階變分可變?yōu)閒ftttttHHSJ0d1uuxxxx( (),),()()ffffSttHtt xxxftttHJ0d1uu現(xiàn)在學(xué)習(xí)的是第十六頁

14、,共47頁末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題(6/12)6/12) 根據(jù)泛函極值的必要條件 J1=0, 考慮到變分u(t)的任意性, 由變分學(xué)的基本預(yù)備定理可得q 聯(lián)立上述方程以及動態(tài)系統(tǒng)的狀態(tài)方程和初始狀態(tài)條件x(t0)=x0,可解得 最優(yōu)控制函數(shù)u*(t)、 最優(yōu)狀態(tài)軌線x*(t)和 適當(dāng)?shù)睦窭嗜粘俗雍瘮?shù) (t)。 上述結(jié)果可歸納成如下定理。0HuftttHJ0d1uu現(xiàn)在學(xué)習(xí)的是第十七頁,共47頁末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題(7/12)7/12)定理定理 5 5q 定理定理 5(末態(tài)無約束最優(yōu)控制

15、定理) 末態(tài)無約束最優(yōu)控制問題的最優(yōu)控制函數(shù)u*(t), 最優(yōu)狀態(tài)軌線x*(t)和適當(dāng)選擇的拉格朗日乘子函數(shù) (t)須滿足如下條件:1) 規(guī)范方程2) 邊界條件3) 極值條件( )( ( ), ( ), )(60)( ) (61)Httt tHLt xf xufxxx00( (),)( ),()()ffffStttttxxxx0 (64)HufftttttHHSJ0d1uuxxxx現(xiàn)在學(xué)習(xí)的是第十八頁,共47頁末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題(8/12)8/12)q 在末態(tài)無約束最優(yōu)控制定理的結(jié)論中,由上述微分方程以及邊界條件可惟一確定出最優(yōu)狀態(tài)軌線

16、x*(t)和適當(dāng)選擇的拉格朗日乘子函數(shù) (t)。 上述關(guān)于x(t)和 (t)的微分方程通常被稱為規(guī)范方程,其中 (t)的微分方程又稱為協(xié)態(tài)方程(或共軛方程,伴隨方程), 相應(yīng)地,拉格朗日乘子函數(shù) (t)又稱為協(xié)態(tài)變量或共軛變量。 極值條件H/u=0是一代數(shù)方程, 由它聯(lián)立規(guī)范方程的解可求得具體的最優(yōu)控制函數(shù)u*(t)和最優(yōu)狀態(tài)軌線x*(t)?,F(xiàn)在學(xué)習(xí)的是第十九頁,共47頁末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題(9/12)9/12)q 下面討論哈密頓函數(shù)的一個重要性質(zhì)。 哈密頓函數(shù)對時間t的全導(dǎo)數(shù)為 考慮到規(guī)范方程,則有 再考慮到極值條件H/u=0,于是哈密

17、頓函數(shù)對時間t的全導(dǎo)數(shù)可表示為ddHHHHHttxuxu0 xxxxHHHHHHtHtHdd現(xiàn)在學(xué)習(xí)的是第二十頁,共47頁末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題(10/12)10/12)例例 7 7 上式表明,沿最優(yōu)軌線哈密頓函數(shù)H對時間的全導(dǎo)數(shù)等于對時間的偏導(dǎo)數(shù)。 因此,當(dāng)哈密頓函數(shù)H不顯含時間變量t時,則有H(t)=常數(shù) tt0,tfq 例例 7 已知被控系統(tǒng)為求最優(yōu)控制u*(t)使如下性能指標(biāo)泛函取極小。 00,( )xux tx02211()( )d0,22ftfftJCx tuttCt固定。tHtHdd現(xiàn)在學(xué)習(xí)的是第二十一頁,共47頁末態(tài)時刻固定

18、、末態(tài)無約束的最優(yōu)控制問題末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題(11/12)11/12)q 解解 這是一個具有tf 固定, x(tf)自由的終端約束的極值問題。 構(gòu)造哈密頓函數(shù)如下, 由極值條件H/u=0可解得u=-。 將其代入規(guī)范方程,可得并滿足如下邊界條件x(t0)=x0 (tf)=Cx(tf)從而解得21( , , , )2H t x u uu-0Hxux 現(xiàn)在學(xué)習(xí)的是第二十二頁,共47頁末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題末態(tài)時刻固定、末態(tài)無約束的最優(yōu)控制問題(12/12)12/12)式中,tf為某一確定的常數(shù)。 將u*(t)代入哈密頓函數(shù)H得其中(t)為常數(shù)。*00*00*000

19、0*0()1()( )()()1()( )( )1()()( )1()ffffffffxx tC ttCxttCx tC ttCxu ttC ttxCx ttx tC tt 2*)(21),(tuxtH現(xiàn)在學(xué)習(xí)的是第二十三頁,共47頁末態(tài)時刻和末態(tài)固定的問題末態(tài)時刻和末態(tài)固定的問題 (1/5)1/5)3.3 末態(tài)時刻和末態(tài)固定的問題末態(tài)時刻和末態(tài)固定的問題 q 對末態(tài)的要求不同將導(dǎo)致最優(yōu)控制問題的結(jié)論不同。 上面討論了無末態(tài)約束的問題, 這一小節(jié)將研究末態(tài)時刻tf和末態(tài)x(tf)固定的最優(yōu)控制問題。q 由于末態(tài)時刻tf和末態(tài)x(tf)已固定,即x(tf)=xf,因此,性能指標(biāo)泛函中的末值項S(

20、x(tf),tf)就沒有存在的必要。 在這種情況下,最優(yōu)控制問題的性能指標(biāo)泛函為如下積分型泛函fttttttLJ0d),(),()(uxu現(xiàn)在學(xué)習(xí)的是第二十四頁,共47頁末態(tài)時刻和末態(tài)固定的問題末態(tài)時刻和末態(tài)固定的問題 (2/5)2/5)q 因此,該最優(yōu)控制問題描述如下。 末態(tài)固定最優(yōu)控制問題末態(tài)固定最優(yōu)控制問題對于被控系統(tǒng)(51),始端狀態(tài)(t0,x(t0)和末態(tài)(tf, x(tf)固定時的性能指標(biāo)泛函(68)極小的最優(yōu)控制問題。q 與前面的推導(dǎo)過程類似,考慮到末值項S(x(tf),tf)=0,輔助泛函J1可定義為0( )( ( ), ( ), )(51) ()( ( ), ( ), )d(

21、68)fttttt tJLtt tt xf xuuxu01 ()( ( ), ( ), ( ), )( )( )dfttJHttt ttttuxux 就泛函J1而言,其宗量有 以及u(t)和 (t) 。 前面已經(jīng)指出,不必對宗量 (t)變分,因為對 (t)的變分結(jié)果就是系統(tǒng)狀態(tài)方程。0, ( ), ( )ft tx tx t現(xiàn)在學(xué)習(xí)的是第二十五頁,共47頁末態(tài)時刻和末態(tài)固定的問題末態(tài)時刻和末態(tài)固定的問題 (3/5)3/5) 因此,考慮到始端和末端固定,即x(tf)=x(t0)=0,泛函J1對其所有宗量的一階變分為 根據(jù)泛函極值的必要條件J1=0, 同樣可以導(dǎo)出0001( )( )ddffftt

22、 tt ttttHHJtttHHt xxuxuxuxu0d0fttHHt xuu現(xiàn)在學(xué)習(xí)的是第二十六頁,共47頁末態(tài)時刻和末態(tài)固定的問題末態(tài)時刻和末態(tài)固定的問題 (4/5)4/5) 當(dāng)x(tf)固定,即x(tf)=0時, 雖然變分u(t)不再是任意的。 但x(tf)固定是相對的,其值的確定具有任意性,因此,末態(tài)x(tf)固定時的最優(yōu)控制問題的極值條件仍然為 同上一節(jié)末態(tài)時刻tf固定,末態(tài)x(tf)無約束的變分問題相比,邊界條件在這里被取而代之的是x(tf)=xf。 綜合上述結(jié)論,有如下關(guān)于末態(tài)固定最優(yōu)控制問題末態(tài)固定最優(yōu)控制問題的定理。0Hu現(xiàn)在學(xué)習(xí)的是第二十七頁,共47頁末態(tài)時刻和末態(tài)固定的

23、問題末態(tài)時刻和末態(tài)固定的問題 (5/5)5/5)定理定理 6 6q 定理定理 6(末態(tài)固定最優(yōu)控制問題末態(tài)固定最優(yōu)控制問題) 末態(tài)固定最優(yōu)控制問題末態(tài)固定最優(yōu)控制問題的最優(yōu)控制函數(shù)u*(t)、最優(yōu)狀態(tài)軌線x*(t)和適當(dāng)選擇的拉格朗日乘子函數(shù) (t)在邊界條件x(t0)=x0 x(tf)=xf 下須滿足規(guī)范方程以及極值條件 0Hu( )( ( ), ( ), )( )Httt tHLt xf xufxxx現(xiàn)在學(xué)習(xí)的是第二十八頁,共47頁末態(tài)時刻末態(tài)時刻固定、末態(tài)受約束的問題固定、末態(tài)受約束的問題(1/10)1/10)3.4 末態(tài)時刻末態(tài)時刻固定、末態(tài)受約束的問題固定、末態(tài)受約束的問題q 本小節(jié)

24、討論末態(tài)時刻tf固定,末態(tài)x(tf)受等式約束的最優(yōu)控制問題。 該問題可描述為如下:q 末態(tài)約束最優(yōu)控制問題末態(tài)約束最優(yōu)控制問題 對于被控系統(tǒng) ,末態(tài)時刻tf固定,末態(tài)x(tf)受等式g(x(tf),tf)=0 約束,如下復(fù)合型性能指標(biāo)泛函取極小的最優(yōu)控制問題。0 ()( ( ),)( , ( ), ( )d(70)ftfftJSttL tttt uxxu),(),()(ttttuxfxfttffttttLttSJ0d)(),(,(),()(uxxu現(xiàn)在學(xué)習(xí)的是第二十九頁,共47頁末態(tài)時刻末態(tài)時刻固定、末態(tài)受約束的問題固定、末態(tài)受約束的問題(2/10)2/10)q 所謂末態(tài)約束, 即末態(tài)只允許

25、在末端流形(73)上變化。 上述約束條件中向量函數(shù)g(x(tf),tf)的維數(shù)為p,為使該最優(yōu)控制問題的解存在,當(dāng)性能指標(biāo)泛函中L=0時,pn-1;當(dāng)L0時,pn。q 上述最優(yōu)控制問題與3.2所討論的末態(tài)x(tf)無約束的問題相比,只是增加了末態(tài)約束條件(73)。 對 該 約 束 條 件 , 可 引 入 待 定 拉 格 朗 日 乘 子 向 量 =1 ,2,p, 定義如下新的輔助泛函式中,哈密頓函數(shù)H的定義與前面一致。g(x(tf),tf)=0 (73) fttfffftttttttHttttSJ0d)()(),(),(),(),(),()(1xuxxgxu現(xiàn)在學(xué)習(xí)的是第三十頁,共47頁末態(tài)時刻

26、末態(tài)時刻固定、末態(tài)受約束的問題固定、末態(tài)受約束的問題(3/10)3/10) 若令則泛函J1可表示為 與3.2所討論的末態(tài) x(tf) 無約束的問題一樣,可得規(guī)范方程、極值條件和邊界條件。 其中邊界條件為01( ( ),)( ( ),)( , , , )dftfffftJSttttHttx g xx u x),(),(),(ffffffttttSttSxgxxfttfftttttttHttSJ0d)()(),(),(),(),()(1xuxxuxxgxxxx)(),()(),()(),()(ffffffffffttttttStttSt現(xiàn)在學(xué)習(xí)的是第三十一頁,共47頁末態(tài)時刻末態(tài)時刻固定、末態(tài)受約

27、束的問題固定、末態(tài)受約束的問題(4/10)4/10)定理定理 7 7 泛函J1對其宗量的變分結(jié)果是x(tf)所滿足的等式約束條件g(x(tf),tf)=0,所以,在求泛函J1的變分J1時,和不需要對變分一樣,也不需要對 (t)的變分。q 綜上所述, 末態(tài)時刻tf固定、末態(tài)x(tf)受約束的最優(yōu)控制問題的結(jié)論可以歸納為以下定理。 定理定理 7(末態(tài)約束最優(yōu)控制定理)(末態(tài)約束最優(yōu)控制定理)末態(tài)約束最優(yōu)控制問末態(tài)約束最優(yōu)控制問題題的最優(yōu)控制函數(shù)u*(t)、最優(yōu)狀態(tài)軌線 x*(t) 和適當(dāng)選擇的拉格朗日乘子函數(shù) (t) 在邊界條件下滿足規(guī)范方程 (61)(62)以及極值條件(64)。 00( ),(

28、 (),)0( (),)( (),)()()()ffffffffftttStttttttxxg xxgxxx現(xiàn)在學(xué)習(xí)的是第三十二頁,共47頁末態(tài)時刻末態(tài)時刻固定、末態(tài)受約束的問題固定、末態(tài)受約束的問題(5/10)5/10)q 從定理定理 7 可知,末端受約束不改變該問題求解中的規(guī)范方程,只影響邊界條件。 與2節(jié)相比,增加了邊界條件中的末態(tài)條件,而且引入了拉格朗日乘子向量 , 其變量數(shù)和末態(tài)受約束條件個數(shù)相等。q 當(dāng)復(fù)合型性能指標(biāo)泛函中末值型指標(biāo)S(x(tf),tf)=0時,邊界條件可記為( (),)()()ffffttttgxx( )( ( ), ( ), )(60)( ) (61)Httt

29、tHLt xf xufxxx0 (64)Hu現(xiàn)在學(xué)習(xí)的是第三十三頁,共47頁末態(tài)時刻末態(tài)時刻固定、末態(tài)受約束的問題固定、末態(tài)受約束的問題(6/10)6/10) 由于g(x(tf),tf)/x(tf)為最優(yōu)軌線的末端約束流形上的方向場,即方向梯度,因此式(80)表明,在最優(yōu)軌線的末端, (tf)與末端目標(biāo)集正交, 即與g(x(tf),tf)=0規(guī)定的n-p維末端約束流形正交。 所以,邊界條件(80)常稱為橫截條件橫截條件。 而邊界條件(79)表示 (tf)既不與末端目標(biāo)集正交,亦不與之相切,因此,它常被稱為斜截條件斜截條件。 最后值得指出的是,由于末態(tài)固定x(tf)=xf可以視為末端約束條件g(

30、x(tf),tf)=0的一種特例,因此,本小節(jié)方法同樣適用于上一小節(jié)的末態(tài)固定的情況。( (),)( (),)()(79)()()( (),)()(80)()fffffffffffStttttttttttxgxxxgxx現(xiàn)在學(xué)習(xí)的是第三十四頁,共47頁末態(tài)時刻末態(tài)時刻固定、末態(tài)受約束的問題固定、末態(tài)受約束的問題(7/10)7/10)例例 8 8q 例例 8 對被控系統(tǒng)試求控制函數(shù)u(t),使系統(tǒng)從初始狀態(tài)x1(0)=0 x2(0)=0經(jīng)過1s轉(zhuǎn)移到目標(biāo)集x1(1)+x2(1)=1且使如下性能指標(biāo)取極小。uxxx221102d)(21ttuJ現(xiàn)在學(xué)習(xí)的是第三十五頁,共47頁末態(tài)時刻末態(tài)時刻固定、

31、末態(tài)受約束的問題固定、末態(tài)受約束的問題(8/10)8/10)q 解解 本例中末態(tài)約束條件為g(x(tf),tf)=x1(1)+x2(1)-1=0 因此,相應(yīng)的哈密頓函數(shù)和輔助性能指標(biāo)泛函中的末值項分別為 根據(jù)定理 7, 可得該最優(yōu)控制的如下方程和邊界條件uxxx221102d)(21ttuJ)()(21),(211212xuxxuutHxx1) 1 () 1 (),(21xxttSffx現(xiàn)在學(xué)習(xí)的是第三十六頁,共47頁末態(tài)時刻末態(tài)時刻固定、末態(tài)受約束的問題固定、末態(tài)受約束的問題(9/10)9/10)12211212121211222( )( )( )( ) ( )0 ( ) ( )(0)0(0

32、)0(1)(1)1 (1) (1)0 x tx tx tu tHtxHttxxxxxgxgxHuu 00( )( )( )( (),)0( (),)( (),)()()()0fffffffffHtHttttStttttttH xxxxg xxgxxxu現(xiàn)在學(xué)習(xí)的是第三十七頁,共47頁末態(tài)時刻末態(tài)時刻固定、末態(tài)受約束的問題固定、末態(tài)受約束的問題(10/10)10/10) 由上述方程可求得如下解析解12*32*236*( )7713( )14736( )147uttx tttx ttt 現(xiàn)在學(xué)習(xí)的是第三十八頁,共47頁末態(tài)時刻未定的問題末態(tài)時刻未定的問題 (1/8)1/8)3.5 末態(tài)時刻未定的問

33、題末態(tài)時刻未定的問題 q 末態(tài)時刻tf未定時,末態(tài)x(tf)又可分為自由、固定和受約束受約束3種情況。 這里僅討論末態(tài)x(tf)受約束的情況,末態(tài)x(tf)固定和自由兩種情況可以視為這一類情況的特例。 此外,這種情況下的優(yōu)化問題可視為前面末態(tài)時刻tf固定情況的一般化,通過本節(jié)的結(jié)論可以得到前幾節(jié)的結(jié)論。現(xiàn)在學(xué)習(xí)的是第三十九頁,共47頁末態(tài)時刻未定的問題末態(tài)時刻未定的問題 (2/8)2/8)q 末態(tài)時刻未定最優(yōu)控制問題末態(tài)時刻未定最優(yōu)控制問題 對于被控系統(tǒng) , 末態(tài)時刻tf未定,末態(tài)x(tf)受等式g(x(tf),tf)=0約束,如下性能指標(biāo)泛函取極小的最優(yōu)控制問題。q 與前面一樣,引入狀態(tài)約束

34、的拉格朗日乘子函數(shù) (t)和末態(tài)x(tf)約束的拉格朗日乘子向量 ,將系統(tǒng)狀態(tài)方程和性能指標(biāo)泛函結(jié)合成如下新的輔助泛函式中,哈密頓函數(shù)H的定義與前面一致。 ),(),()(ttttuxfxfttffttttLttSJ0d)(),(,(),()(uxxu01 ( )( ( ),)( ( ), ( ), ( ), )( )( ( ),)( )dftfffftJSttHttt tttttt uxxu g xx 現(xiàn)在學(xué)習(xí)的是第四十頁,共47頁末態(tài)時刻未定的問題末態(tài)時刻未定的問題 (3/8)3/8) 將泛函J1中最后一個積分項進(jìn)行分部積分,可得 定義則泛函J1可表示為0100 ()( (),)( (),

35、)( ) ( )() ()( ( ), ( ), ( ), )( ) ( )dfffffffttJSttgttttttHttt tttt uxxxxxux01( ( ),)( ( ),)( , , , )dftfffftJSttttHttx g xx u x ),(),(),(ffffffttttSttSxgxxfttfffftttttttHttttttSJ0d)()(),(),(),()()()()(),()(001xuxxxxu現(xiàn)在學(xué)習(xí)的是第四十一頁,共47頁末態(tài)時刻未定的問題末態(tài)時刻未定的問題 (4/8)4/8)q 就泛函J1而言,其宗量有 類似前面討論,對 (t)的變分結(jié)果是狀態(tài)方程。 因?qū)f視為一宗量,也要對它進(jìn)行變分。 考慮到初始狀態(tài) (t0,x(t0)固定,泛函J1對其所有的可變宗量的一階變分為0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論