第6章 最優(yōu)控制的基本理論及應(yīng)用_第1頁
第6章 最優(yōu)控制的基本理論及應(yīng)用_第2頁
第6章 最優(yōu)控制的基本理論及應(yīng)用_第3頁
第6章 最優(yōu)控制的基本理論及應(yīng)用_第4頁
第6章 最優(yōu)控制的基本理論及應(yīng)用_第5頁
已閱讀5頁,還剩139頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

,孑工常出版u

JSHINGHOUSEOFELECTRONICStNDUSTRV

第6章最優(yōu)控制的基本理論及應(yīng)用

6.1引言

6.2最優(yōu)控制問題的提出及數(shù)學(xué)描述

6?3變分法

6?4極小值原理

6?5動(dòng)態(tài)規(guī)戈ll法

6.6二次型最優(yōu)調(diào)節(jié)器

6.7最小時(shí)間控制

6.8應(yīng)用MATLAB解二次型最優(yōu)控制問題

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

6.1引言

最優(yōu)控制理論是現(xiàn)代控制理論的核心。

從數(shù)學(xué)的觀點(diǎn)看,最優(yōu)控制研究的問題是求解一

類帶有約束條件的泛函極值問題,本質(zhì)上是一個(gè)變分

學(xué)問題。變分法是數(shù)學(xué)的一個(gè)古老的分支,起源于17

世紀(jì)。經(jīng)典變分理論只能解決控制無約束即容許控制

屬于開集的一類最優(yōu)控制問題,但實(shí)際上遇到更多的

卻是容許控制為閉集的一類最優(yōu)控制問題。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

針對(duì)經(jīng)典變分法的局限性,美國學(xué)者貝爾曼在

1953?1957年間創(chuàng)立了“動(dòng)態(tài)規(guī)劃”,發(fā)展了變分學(xué)

中的哈密頓-雅可比理論,解決了控制有閉集約束的

變分問題;而前蘇聯(lián)學(xué)者龐特里亞金等則在1956?

1958年間創(chuàng)立了極小值原理,也發(fā)展了經(jīng)典變分原

理,成為處理控制有閉集約束的變分問題的強(qiáng)有力工

具。

八本章在介紹解決最優(yōu)控制問題3種基本方法(變分

法、極小值原理和動(dòng)態(tài)規(guī)劃)的基礎(chǔ)上,闡述兩類典

型最優(yōu)反饋系統(tǒng)的設(shè)計(jì),即線性二次型最優(yōu)控制和最

小時(shí)間控制。

,孑工常出版u

JSHINGHOUSEOFELECTRONICStNDUSTRV

6.2最優(yōu)控制問題的提出及數(shù)學(xué)描述

6.2.1最優(yōu)控制問題實(shí)例

1.最速升降問題

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

設(shè)有一物體M,作垂直升降

運(yùn)動(dòng),如圖6T所示,這里M

可以理解為一架直升飛機(jī)或

礦井中的升降機(jī)。假定在M

內(nèi)部裝有一個(gè)控制器,它可

以產(chǎn)生一個(gè)作用力〃⑺,從

而控制物體M的上下運(yùn)動(dòng),

由于作用力的大小有限,所

以應(yīng)滿足不等式,")|工友,圖6-1最速升降問題示意圖

其中人是常數(shù)。設(shè)已知四在:/

時(shí),離地面的高度為x?o),垂直運(yùn)動(dòng)的速度為交4),

問題是尋找作用力"(力的變化規(guī)律,使Af最快到達(dá)

地面,并使其到達(dá)地面時(shí)的速度為零。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

令物體M的質(zhì)量為加,用x⑺表示"離地面的高度,

其方向規(guī)定為地面上x⑺為正,在地面下x⑺為負(fù)。作

用力”⑺是向上為正,向下為負(fù),則物體M的運(yùn)動(dòng)方程

9

dx(Z)

........-=a3-mg

dt

式中,加g為物體所受重力,g為重力加速度。

_dY__

令"iQ)="Q)表示物體的高度,⑺=一表示

物體的升降速度,則上式可寫成狀態(tài)方程

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

x}。)=x2Q)

x2(t)=u(J)—mg

其初始條件是/。0)=/0,工2。0)=X20?,F(xiàn)需尋找

一個(gè)能使物體以最短時(shí)間從初態(tài)(乙。.2。)到達(dá)終態(tài)

(0,0)的控制〃⑺。定義系統(tǒng)的性能指標(biāo)為

J~=tf-"。

式中,%。為起始時(shí)刻,G為終止時(shí)刻。要求時(shí)間最短,

即使性能指標(biāo)/最小,這樣求得的控制即為最優(yōu)控制

“*⑺。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

2.攪拌槽問題

設(shè)有一盛放液體的連續(xù)

攪拌槽,如圖6-2所示。槽內(nèi)

裝有不停轉(zhuǎn)動(dòng)著的攪拌器S,

使液體經(jīng)常處于完全混合狀

態(tài),槽中原放。七的液體。

現(xiàn)需將其溫度升高,為此在

入口處送進(jìn)一定量的液體,

其溫度為〃(力,出口處流出圖6-2攪拌槽問題示意圖

等量的液體,以保持槽內(nèi)液

面恒定。試尋找"(方)的變化規(guī)律,使槽中液體溫度

經(jīng)1小時(shí)后上升到40℃,并要求散失的熱量最小。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

因假定槽中液體處于完全混合狀態(tài),故可用X⑺

表示其溫度。由熱力學(xué)知,槽中液體溫度的變化率與

溫差["0—XQ)]成正比,為簡(jiǎn)便計(jì)算,令比例系數(shù)為1,

于是有

dx(/)

----="Q)—x(t)x(0)=0

dt--------------------'

在1小時(shí)內(nèi)散失的熱量為

/9o

JQ)=fYqx(Z)+ru(Z)]d/

式中,都是正的常數(shù),%=。,G=1O因此該最優(yōu)控

制問題是:尋找〃⑺的變化規(guī)律,使槽中液體經(jīng)1小時(shí)

后從0。。上升到40。5并要求散失的熱量最小,即/(〃)

取最小值。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

6.2.2最優(yōu)控制問題的數(shù)學(xué)描述

綜觀以上實(shí)例,構(gòu)成最優(yōu)控制問題必須具備以下

幾個(gè)基本條件:

1.被控系統(tǒng)的數(shù)學(xué)模型,即動(dòng)態(tài)系統(tǒng)的狀態(tài)方程

狀態(tài)方程在最優(yōu)控制中為等式約束條件。

2.控制變量的約束條件(容許控制)

任何實(shí)際物理系統(tǒng),控制變量總是受約束的,一

般可寫成

u(t)^u(6-3)

式中,。表示一個(gè)封閉的點(diǎn)集合,稱為控制域。此時(shí)稱

"⑺為容許控制。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

3.狀態(tài)方程的邊界條件(初始狀態(tài)和終值狀態(tài))

在最優(yōu)控制問題中,"L時(shí)的初態(tài)通常是已知的,

X?O)=Xo(6-4)

而終值狀態(tài)可以是狀態(tài)空間中一個(gè)確定的點(diǎn),也可以

是狀態(tài)空間中某一個(gè)點(diǎn)集(目標(biāo)集)中的任一點(diǎn)。到

達(dá)終端的時(shí)間」和終值狀態(tài)X。/因問題而異。就終端

時(shí)間前來說,它可以是固定的,也可以是變動(dòng)的或自

由的。最通常的終值邊界條件是

x(tf.)=xf.(6-5)

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

但有時(shí)并不這樣簡(jiǎn)單,如用導(dǎo)彈攻擊運(yùn)動(dòng)的目標(biāo),

終值是可能運(yùn)動(dòng)軌跡上的一個(gè)點(diǎn),此時(shí)終值狀態(tài)是受

運(yùn)動(dòng)軌跡約束的,一般地約束可表示為

g.(xrtf)=O,i=l,2…,/(Z<n)(6-6)

4.性能指標(biāo),也稱性能泛函或目標(biāo)函數(shù)

性能指標(biāo)是衡量系統(tǒng)在任一容許控制作用下性能

好壞的尺度,在最優(yōu)控制中其代替了傳統(tǒng)的設(shè)計(jì)指標(biāo)

(如超調(diào)、調(diào)節(jié)時(shí)間、幅值裕度和相角裕度等)。

1)積分型性能泛函

J=廣L(x(t),u(t),t)At(6-7)

J"o

2)終值型性能泛函

J=(6-8)

3)復(fù)合型性能泛函

J=①[xQ/)"/]+『7L[xQ),M(Z),Z]d/(69)

國甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

最優(yōu)控制問題,就是從可供選擇的容許控制集

。中,尋求一個(gè)控制向量"(方),使被控系統(tǒng)在時(shí)間

域瓦4]內(nèi),從初態(tài)轉(zhuǎn)移到終態(tài)x(tf)或目標(biāo)集

Wtf)eCf時(shí),性能泛函/取最?。ù螅┲?。

6.3.2亦A

633

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

6.3.1變分法的基本概念

1.泛函

泛函是函數(shù)概念的一種擴(kuò)充。如果對(duì)于某一類函

數(shù)集合相⑺}中的每一個(gè)函數(shù)、(方),因變量J都有一個(gè)

確定的值與之對(duì)應(yīng),則稱因變量,為這個(gè)宗量函數(shù)X⑺

的泛函數(shù),簡(jiǎn)稱泛函,記作」=?。ㄎ???梢?若一個(gè)

因變量的宗量不是獨(dú)立自變量,而是另一些獨(dú)立自變

量的函數(shù),該因變量則為這個(gè)宗量函數(shù)的泛函,因此

泛函可理解為“函數(shù)的函數(shù)”,其值由宗量函數(shù)的選

取而定。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

與多元函數(shù)的宗量(自變量)多于一個(gè)相類似,

多元泛函的宗量函數(shù)則多于一個(gè),這些宗量函數(shù)可以

表示為一個(gè)向量。例如,在控制系統(tǒng)中,〃維狀態(tài)向

量X⑺為時(shí)間,的函數(shù),若取如下形式的積分型性能指

標(biāo)

J=廣L\^x(t)x(t),Z]dZ

“()f(6-11)

則/的數(shù)值取決于〃維向量函數(shù)工⑺,故式(6-n)為

(多元)泛函。

2.泛函的連續(xù)與線性泛函

(1)若對(duì)任給的£>。,存在3>。,使得當(dāng)

卜一45時(shí),就有

?7[%(0]-J[x*(0]<£(6-12)

則稱泛函在函數(shù)X*Q)處是連續(xù)的。

(2)連續(xù)泛函人燈若滿足以下條件

J\kx\—kJ\x\(6-13)

4均+X/=(6-14)

則稱JE是線性泛函。式中左是實(shí)數(shù),乙,為為函數(shù)空間

中的函數(shù)。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

3.泛函的變分

宗量函數(shù)變分的定義設(shè)為連續(xù)泛函,則

宗量函數(shù)x⑺的變分為屬于同一函數(shù)類中兩個(gè)函數(shù)

X⑺,“。0)之差,即

<5x(r)=xQ)-%Q)(6-17)

泛函變分的定義設(shè)J[xQ)]為〃維線性賦范空

間R"上的連續(xù)泛函,若其增量可表示為

A7[x]=J[x(t)+3xQ)]-(6—]8)

=3x(jy\+SxQty]

式中,以⑺為宗量函數(shù)X⑺的變分,區(qū)(次是以⑺

的線性連續(xù)泛函,。[xQ),?、薦是關(guān)于&Q)的高階無窮

小,則定義泛函增量的線性主部

3J=乙[x(t),<5"?)](6-19)

為泛函J[xQ)]的變分,記作“o若泛函有變分,則

稱該泛函可微。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

與函數(shù)的微分等于函數(shù)的導(dǎo)數(shù)與自變量的微分之

乘積相對(duì)應(yīng),泛函變分也可利用求導(dǎo)的方法來計(jì)算,即

a/J

3J=--(J[x(,)+£<ivQ)])o<£<i(6-20)

de2=0

【例6-1】求泛函J=J'%2⑺d.的變分,其中,工⑺

為標(biāo)量函數(shù)。

解由式(6-20)得

d,、td2

——(y[x(0+g&Q)])—[x(0+g&Q)]2dt\1

8J=VZ7——[%?)+£&(,)]

口c00

de£1=0de£*=0

=/,2[x(?)+£&(,)]&(,)dt=「/2jr(Z)<Sx(?)d?

"oe=0zo

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

4.泛函的極值與泛函極值的必要條件

如果泛函在任何一條與X*⑺接近的曲線上

所取的值不小于,即

A7=J[xQ)-J[x*(Z)]>0(6-21)

則稱泛函4xQ)]在曲線“*Q)上達(dá)到極小值。反之,

A7=-J[x*(/)]<0(6-22)

則稱泛函J[x(z)]在曲線X*⑺上達(dá)到極大值。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

定理6-1(泛函極值定理)若可微泛函4x(列在

工=%*?)上達(dá)至口極值,貝1JJ[xQ)]在x=x*Q)上的變

分等于零,即

6J=0(6-23)

定理6-1表明,泛函一次變分為零,是泛函達(dá)到極

值的必要條件。

綜上可見,變分在泛函研究中的作用,相當(dāng)于微

分在函數(shù)研究中的作用。事實(shí)上,求泛函極大(小)值

問題稱為變分問題,求泛函極值的方法稱為變分法

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

6.3.2用變分法求解無約束條件的泛函極值問題

設(shè)積分型性能泛函為

J=「/L^x(t)x(t)t^t(6-24)

%ff

在區(qū)間上0,。]上,被積函數(shù)4xQ),工Q"二次連續(xù)可微,

軌線工⑺有連續(xù)的二階導(dǎo)數(shù),雙…",對(duì)工⑺沒有任何

約束。要求確定極值軌跡x*Q),使泛函/為極值。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

1.始端時(shí)刻和終端時(shí)刻固定時(shí)的泛函極值問題

首先討論不僅初始時(shí)刻L、終端時(shí)刻)固定,而

且初始狀態(tài)x(t°)=~、終端狀態(tài)必斗)=壬固定這一最

簡(jiǎn)單情況下無約束條件的泛函極值向題(營優(yōu)控制的

基本問題)。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

定理6-2設(shè)初始時(shí)刻L和初始狀態(tài)x(t0)=x。

固定,且終端時(shí)刻的和終端狀態(tài)xQf)=z固定,貝I]

使性能泛函式(6-24)取極值的必要條件是:x⑺

為二階微分方程

手-"(歐拉方程)(6-25)

OXCitox

Ttf

(dL、

J取=°(橫截條件)(6-26)

,0

的解。其中在區(qū)間及上,"x?),工Q"二次連續(xù)可微,

了⑺有連續(xù)的二階導(dǎo)數(shù),xQ)e7T,對(duì)工⑺沒有任何約

束。

證明設(shè)X*(t)是使兩極小值J*的最佳軌跡曲線,

現(xiàn)在X*(t)鄰近作一^微小攝動(dòng),并令

xQ)=x*Q)+卬Q)(6-27)

式中房是一個(gè)很小的參數(shù),為任意選定的連續(xù)可微〃

維向量函數(shù)且滿足

,("o)=,Q/)=〃(6-28)

將x(t)=%*?)+£〃(t)和=,*?)+切Q)代入式

(6-24)可得

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

tdJc

J(£)=J,L[x(z)+刁Q),x(Z)+麗Q)"]d才

取泛函增量

A7(&)=J(&)—J(0)=j/Z[xQ)+切Q),\Q)+切Q),4d,—j/N[xQt),x(/),Qdt

將上式在2=0的鄰域內(nèi)展開成泰勒(Taylor)

級(jí)數(shù),則

t「dL,~\

所(%)+夫

23=%!二切⑺+|dz(6-29)

dxyJ

式中,夫表示泰勒(Taylor)級(jí)數(shù)展開式中的高階項(xiàng)。

國甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

如果定義X⑺和Wt)的一階變分為

dx=£"Q),dx=£力3(6-30)

由泛函變分的定義,泛函的一階變分為

T

(dL\(6-31)

3x+----Sx|d.

^dxy

對(duì)上式積分中第二項(xiàng)作分部積分后可得

T

t(3LdazV

6J=\f——Sxdt+----Sx(6-32)

%(Sxdtdx)

由定理6-1,泛函取極值的必要條件為其一次變分

為零,故令<v=o,并考慮到式(6-32)中必是任意的,

即可證得定理6-2的結(jié)論式(6-25)和式(6-26)。

在to、0、x(t0)=、x?f)=Xf均固定的情況

下,有)=〃和…)=。,這時(shí)定理6-2中的橫截條件

式(6-26)退化為已知的兩點(diǎn)邊界值*3)=%和x?f)=壬,

即求解歐拉方程的邊界條件為x(t0)=X。,x?f)=壬。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

在討論固定端點(diǎn)問題的基礎(chǔ)上,討論自由端點(diǎn)問

題。若小」均固定但有一個(gè)端點(diǎn)[x(t0)或xQf)]

或兩個(gè)端點(diǎn)自由時(shí),沒有約束條件的泛函式(6-24)

極值仍應(yīng)滿足式(6-25)所示的歐拉方程及式(6-26)

所示的橫截條件,求解歐拉方程所欠缺的邊界條件則

應(yīng)由橫截條件補(bǔ)足。例如,若小小x(t0)=x。均固

定,終端x(")自由,這時(shí)有3x(10)=0)彳)力0,則

由橫截條件式(6-26)有

叱=0(6-35)

"t=tf

式(6-35)和已知的始點(diǎn)邊界值~合起來構(gòu)成該

情況下的邊界條件。

【例6-2】設(shè)泛函為

7T

一22

J=]*/(文I+x2+2x1x2)dt

邊界條件為項(xiàng)(0)=x2(0)=0,x1(一)=x2(—)=1,

求/為極值時(shí)的曲線x*Q)。

解本例泛函為二元泛函,即“=卜與『,被積函數(shù)

22

L—xx+x2+2X}X2

「"1「"1廠.「廠1

IJllJ”T2x2naL1^1「2兄]色匹

2X

SxIILIJ派II\_2X2\dxdt[_2X2J|_2戈2_

1_"2」[質(zhì)2」

dLddL

代入歐拉方程..------=0

dxdtdx

「2與1「2%~|_「01

得_2xJ[2又2」—[。_

展開并聯(lián)立方程組為

o

X1--

X-x2

xlO

2-

其通解為

國甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

/、t一t.

Xj{t}=cxe+%e+c3sint+oncost

f-z

x2(Z)==c}e+c2e—c3sint—c4cost

代入已知的兩點(diǎn)邊界值,求出

111

/,C2=-/,CC。

q―產(chǎn)-產(chǎn)2sh5小?2sh5m34

*sh/

故極值曲線為X]Q)=%2Q)=/

sh(7r/2)

2.終端時(shí)刻未給定的泛函極值問題(可變端點(diǎn)問題)

若始端時(shí)刻前給定,始端狀態(tài)x(t。)固定或沿規(guī)定

的邊界曲線移動(dòng),而終端時(shí)刻」自由,終端狀態(tài)x(tf)

自由或沿規(guī)定的邊界曲線移動(dòng),則這類最優(yōu)控制問題

稱之為未給定終端時(shí)刻的泛函極值問題。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

定理6-3設(shè)軌線x⑺從固定始端工3)=%到達(dá)給

定終端曲線”f)=C(tf)上,使性能泛函

J=jz>(xQ),文?),,)力彳(6~36)

取極值的必要條件是:軌跡滿足下列方程

匹—色2=0(歐拉方程)(6-37)

dxdtdx

G+[C(t)-土Q)]—1=0(終端橫截條件)(6-38)

I"Jt=tf

式中,x(。應(yīng)具有連續(xù)的二階導(dǎo)數(shù),£至少應(yīng)二次連續(xù)可

微,。⑺應(yīng)具有連續(xù)的一階導(dǎo)數(shù)。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

關(guān)于定理6-3的說明:

(1)定理6-3適用于始端時(shí)刻t。、始端狀態(tài)x(t°)=%

給定,終端時(shí)刻tf自由但終態(tài)應(yīng)落在端點(diǎn)約束

x(tf)

曲線。⑺上(即終端約束方程為xQQ=CQ/))的情況,

這時(shí)僅已知始點(diǎn)%(%)=%,而終點(diǎn)未知,因止匕,求解歐

拉方程所欠缺的邊界條件應(yīng)由終端橫截條件式(6-38)

補(bǔ)足。式(6-38)確立了在終端處右⑺和及Q)之間的

關(guān)系,并影響著x*(t)和終端約束曲線。⑺在9時(shí)刻

的交點(diǎn)。

國甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

(2)可將定理6-3對(duì)x⑺是標(biāo)量函數(shù)時(shí)所得到的公式

推廣到x⑺、。⑺是〃維向量函數(shù)的情況,即可得向量形

式的泛函極值必要條件

匹—色匹=〃(歐拉方程)(6-39)

dxdtdx

L+[c(t)-x{ty]T—i=o(終端橫截條件)(6-40)

6.3.3有約束條件的泛函極值問題

求泛函在等式約束下的極值,稱為條件泛函極

值問題。應(yīng)用拉格朗日乘子法,可將這類條件泛函極

值問題轉(zhuǎn)化為無約束條件的泛函極值問題。

國甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

最優(yōu)控制問題中的性能泛函為

J=①[xQ/)工尸]+j[〃xQ),(6-41)

JJ"%

式中,泛函」所依賴的宗量函數(shù)”⑺、〃⑺受被控系統(tǒng)的

狀態(tài)方程約束,即

£。)=/[%。),〃(。訂(6-42)

工I中9xwR","三R',/[*(,),“(,),,](,)、〃(%)才口t

的〃維連續(xù)向量函數(shù)。最優(yōu)控制問題是尋求最優(yōu)控制

,⑴及最優(yōu)狀態(tài)軌跡-⑴,使系統(tǒng)式(6-42)從初始狀

態(tài)xQ0)=x0轉(zhuǎn)移到終端狀態(tài)”(不),并使/取極值。

若初始時(shí)刻,。及始端狀態(tài)x?o)=Xo給定,按照

終端狀態(tài)邊界條件,討論以下幾種情況。

■給定,終端xQ/)自由

■G給定,終端xQQ約束

■自由,終端xQ/)約束

國甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

1.1尸給定,終端x(%/)自由

將狀態(tài)方程式(6-42)寫成約束方程形式

/[xQ),w(/)9Z]-x(t)=0(6-43)

仿照求函數(shù)條件極值的拉格朗日乘子法,將等式約束

式(6-43)和原有的指標(biāo)泛函結(jié)合成增廣泛函

J'=中[x(0)""+£'{L[xQ),〃Q)"]+:7(,){/[XQ),x(t)}}dt

/J"o

(6-44)

式中,:(t)w”,為待定拉格朗日乘子向量函數(shù)。顯然,

不論:⑴取何種函數(shù),只要工⑺、〃⑺滿足等式約束(6-

43),即滿足系統(tǒng)的狀態(tài)方程式(6-42),則/與/總是等價(jià)

的。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

定義標(biāo)量函數(shù)

T(6-45)

/Z[x,W,=Z[AT,U?t\-\-X/[x,

為哈密頓(Hamilton)函數(shù),則增廣泛函式(6-44)可

寫為

J=①[xQ/),品]十f/z{7/[x(Z),o(Z),2(Z),t2—Ar?),")}(1%(6-46)

對(duì)式(4-46)右邊最后一項(xiàng)進(jìn)行分部積分,即

『一人也=『,「Xd,_:丁X'/(6-47)

%%?0

故增廣泛函式(6-44)可寫為

J'=/),,/]一2/(才)x(才)+j[{//[x(Z),?(/),2Q)"]+)7?)x(才)}d/

(6-48)

設(shè)xO),〃⑺相對(duì)于最優(yōu)值x*Q),〃*?)的變分分

別為必和(5〃,且注意到xQo)="0,則以(,0)=。,故式

(6-48)所示/的一階變分為

丁T,「dHdH丁.

"=(------)區(qū)(乙)一:區(qū)Q/)+「(——)T取+(——)堤+:T取dz

&rQ/.)Z°dxdu_

(6-49)

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

令獷=0,因?yàn)橐?、以?及前任意,則得增廣泛

函/取極值的必要條件,再由約束方程式(6-43)及定義

的哈密頓函數(shù)式(6-45),得在t0及始端狀態(tài)xQo)=X。給

定、弓給定、終端xQ/)自由情況下,滿足狀態(tài)方程式

(6-42(的泛函式(6-41)取極值的必要條件為同時(shí)滿足

X—---=f(X,U,(狀態(tài)方程)(6-50)

S2

dH(協(xié)態(tài)方程)(6-51)

dx

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

dH(控制方程)(6-52)

------=0

du

S①(橫截條件)(6-53)

:(tf)=

dx(tf)

)=X。(始端邊界條件)(6-54)

式(6-50)、式(6-51)和式(6-52)相當(dāng)于前面的歐拉方程,

式(6-53)為橫截條件。式(6-50)為系統(tǒng)狀態(tài)方程,其與式(6-

51)的右端均為哈密頓函數(shù)的適當(dāng)偏導(dǎo)數(shù),故式(6-50)和式

(6-51)合稱為哈密頓正則方程,簡(jiǎn)稱為正則方程。式(6-51)

則稱為伴隨方程或協(xié)態(tài)方程,相應(yīng)的拉格朗日乘子向量幺又

稱為伴隨向量或協(xié)態(tài)向量。式(6-52)表明,最優(yōu)控制"*?)使

哈密頓函數(shù)取駐值,故式(6-52)稱為控制方程。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

2.,/給定,終端x(G)約束

設(shè)終端狀態(tài)應(yīng)滿足如下目標(biāo)集等式約束條件

2V[x(G),品.]=°(6-55)

式中,.£巾,即終端狀態(tài)x(i)沿規(guī)定的邊界曲線移

動(dòng)?,F(xiàn)在存在狀態(tài)方程約束式(6-43)和終端邊界約束

式(6-55)這兩種類型的等式約束,為此除了引入待定的

〃維拉格朗日乘子向量函數(shù):⑴,再引入一個(gè)待定的乘

子向量分,且加R“,構(gòu)造增廣泛函

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

J'=中[x(G),0]+tfN.f)"/]+J,?(/),/]+A7M(O,d-£?)}}dz

=①[x?/),o]+B'N'x*?tf]+£:(a(x?),w(r),-乃⑺士⑺拉

=①[x(G),弓]+"7V[x(")"/]—/Q/)x?/)+JTa)xQ°)+J;(H(x()?(/),2(r),Z)+乃《)xQ)拉

(6~56)

式中,哈密頓函數(shù)R[x,〃,入口仍由式(6-45淀義。

同樣,設(shè)工⑺,〃⑺相對(duì)于最優(yōu)值x*?),"*Q)的變

分分別為必和3",且注意到〃Qo)=。,故式(6-56)所

示了的一階變分為

T、

s0dNT?t(OHQH丁

6J'=--+-------------fi~7。/.)取Q/.)++ASx+(-----)3uxi/

皿的)Sx(J)J°ISx)du

(6-57)

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

令獷=0,并由式(6-42)、式(6-55)及式(6-45),得

當(dāng)“0及始端狀態(tài)x?o)=*0給定、才/給定、終端狀態(tài)

xQf)受目標(biāo)集等式約束式(6-55)情況下,滿足狀態(tài)方程

式(6-42)的泛函式(6-41)取極值的必要條件為同時(shí)滿足

dH

正則方程.更x=-----=(6-58)

dx52

dH

控制方程------=0(6-59)

du

邊界條件與橫截條件

xQo)=Xo,7V[x(i)"/]=0(6-60)

S①[xQ/),Z/]dNT[AT(Z/]

=--------+------——P(6-61)

dx(t)dx^t.)

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

3.自由,終端x(G約束

在這一類問題中,終端時(shí)刻,/為待求的變量,且終

端狀態(tài)又受式(6-55)所示的目標(biāo)集等式約束。顯然,終

端時(shí)刻G自由時(shí)所討論的問題,除了)自由之外,其余

與終端時(shí)刻給定時(shí)所討論的內(nèi)容相同。

和弓給定時(shí)終端狀態(tài)受約束的最優(yōu)控制問題一樣,

引入待定的拉格朗日乘子向量:⑴右內(nèi)和"尺"構(gòu)造

增廣泛函(參見式(6-56))

「=①[X。/),G)"/]T7(弓)x(G)+/Q0)xQ0)+

z

J(2/(AT(Z),〃Q),2Q)")+尸Q)xQ))dZ

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

式中,哈密頓函數(shù)]仍按式(6-45)定義。但與

6給定情況不同的是,現(xiàn)在的也是需要進(jìn)行最優(yōu)選擇

的變量。設(shè)工⑺、〃⑺、的相對(duì)于其最優(yōu)值x*Q)、以*Q)、

了的變分分別為取>Su、拉,即

x?)=x*Q)+c5xQ),w(Z)=w*(t)+(5w(z),Zz.=Z*.+3tf(6-62)

且有如下近似關(guān)系式

dx(tz)=<5x(Z*)+文Q;)<5,/(6-63)

考慮到取Qo)=。,則由必、以(如)、du、3tf產(chǎn)生

的增廣泛函J'的一次變分為

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

/\

aoTdN

6J'=+P-------+H[x{t),u{t..),A(Z.),/z]

dt,---------dt,

\Jfy(6-64)

T

T

d①dNe\(dHdH下

1

++p~:(jf)——+6x+(--)---3u

Sx(t)dx{t)kdx7du

―/ff-/_**

令”=0,因?yàn)橐?、—Q/)、3"及為任意,則得增

廣泛函/取極值的必要條件,并由式(6-42)、式(6-55)及

式(6-45),得當(dāng)%。及始端狀態(tài)xQo)=x0給定、的自由、

終端狀態(tài)x(G)受式(6-55)約束情況下,滿足式(6-42)的

泛函式(6-41)取極值的必要條件為同時(shí)滿足

正貝ll方程一色-,x==(6-65)

dxaz

控制方程—(6-66)

du

邊界條件與橫截條件

(6-67)

xQo)=?,N[x(Jf)"/]=〃

S①[xQ]S7V丁

:(6?)=------------+----------------—一P(6-68)

dxQ,)dvQ/)

aa>[x(Z),/]S2V[xQ),/]

H[xQ),“Q),:?)"]+------------------—+p------------------—=0(6-69)

dtfdtf

式中,〃[x(o.),吟),“),金.]為哈密頓函數(shù)H在最優(yōu)

軌跡終端處的值。

【例6-3】設(shè)被控系統(tǒng)的狀態(tài)方程為

「。11「01

±Q)=xQ)+w(Z)

0oj|_1_

設(shè)初始狀態(tài)為x(0)=。,終端狀態(tài)約束曲線為

X,(l)+X2(l)-l=0,求使目標(biāo)函數(shù)J=取極小

時(shí)的最優(yōu)控制"*(,)和最優(yōu)軌跡『⑺o

解構(gòu)造哈密頓函數(shù)

H=L/f=—〃2+義“+九"

J1NN

2

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

正則方程為

dH.dH(協(xié)態(tài)方程)

A,———---------=0,A:

2=—4

dxxg

dHdH(狀態(tài)方程)

X?2------=u

叫弘

dH

控制方程------=u+義2=0

du

它們的通解為

義1=,義2

U——

1

1312

Xj=一Ct——C+C^t+C7,x

{42一G2-、+G

622

邊界條件與橫截條件

3(0)=0,、2(°)=。

X1(1)+%2⑴T=0

dNdN

刈(1)=------P=P乙(D=-------

9

dx](1)dx2(1)

代入通解,得G=/3,c2=2/3,c3=0,C4=o=—1

則最優(yōu)控制〃*Q)=一一,+—

77

最優(yōu)軌跡x/co=-—t3+—t2,%2*Q)=——J+-,

147147

6.4極小值原理

在用經(jīng)典變分法求解最優(yōu)控制問題時(shí),假定控制

變量〃⑺不受任何限制,即容許控制集合可以看成整

個(gè)「維控制空間開集,控制變分"是任意的,同時(shí)還

要求哈密頓函數(shù)H對(duì)“連續(xù)可微,在這種情況下,應(yīng)用

變分法求解最優(yōu)控制問題是行之有效的。

但是在大多數(shù)情況下,控制量的大小總是受限制

的,即

u\<a,(2=1,2,…,尸)(6-70)

這時(shí)容許控制"⑺的集合是一個(gè)升維有界閉集。一般總

可用如下不等式表示容許控制〃⑺的閉集約束條件,即

國甯孑工學(xué)出版4出

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

>0(6-71)

當(dāng)容許控制集合"⑺屬于有界閉集時(shí),控制變分0"

在容許控制集合邊界上不能任意,最優(yōu)控制的必要條

件=〃亦不滿足,則不能用經(jīng)典變分法處理。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

針對(duì)經(jīng)典變分法應(yīng)用條件過嚴(yán)的局限性,前蘇聯(lián)

學(xué)者龐特里亞金等發(fā)展了經(jīng)典變分原理,在1956?

1958年間創(chuàng)立了極小值原理。極小值原理由變分法引

伸而來,它的結(jié)論與經(jīng)典變分法的結(jié)論有許多相似之

處,這一方法當(dāng)控制變量"⑺受閉集約束時(shí)是行之有

效的,并且不要求哈密頓函數(shù)網(wǎng)"⑺連續(xù)可微,是

控制變量"⑺受限制時(shí)求解最優(yōu)控制問題的有力工具,

而且極小值原理也可用于解決控制不受約束的最優(yōu)控

制問題,因此其是解決最優(yōu)控制問題的更一般的方法。

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

定理6-4(極小值原理)設(shè)系統(tǒng)狀態(tài)方程為

土(t)=w(t),z](6-73)

初始條件為xQ0)=~固定,6固定(6-74)

控制約束為w(/)eU,g[x(t),〃(t)"]N0(6~75)

終端約束為,弓自由(6-76)

式中x(t)為〃維狀態(tài)向量;控制〃(t)屬于「維空間中的有

界閉集。,受不等式(6-75)約束;g為/維連續(xù)可微向量函

數(shù),/w〃;N為g維連續(xù)可微向量函數(shù)o

性能泛函為

J=中[x(金)"/]+『w(t),/]d/(6-77)

宣甯孑工學(xué)出版制?

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

式中,①和L為連續(xù)可微的標(biāo)量函數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論