




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第一章緒論
第一章緒論一、最優(yōu)控制簡介二、最優(yōu)控制發(fā)展過程三、最優(yōu)控制應用舉例四、小結(jié)五、本科程主要內(nèi)容返回主目錄一、最優(yōu)控制簡介
在生產(chǎn)過程、軍事行動、經(jīng)濟活動以及人類的其他有目的的活動中,常需要對被控系統(tǒng)或被控過程施加某種控制作用以使某個性能指標達到最優(yōu),這種控制作用稱為最優(yōu)控制。二、最優(yōu)控制發(fā)展過程
以後,拉塞爾(LaSalle)發(fā)展了時間最優(yōu)控制的理論,即所謂Bang—Bang控制理論。1953至1957年間美國學者貝爾曼(Bellman)創(chuàng)立了“動態(tài)規(guī)劃”理論,發(fā)展了變分學中的哈密頓—雅可比(Hamilton—Jacobi)理論。
上世紀五十年代初期布紹(Bushaw)研究了伺服系統(tǒng)的時間最優(yōu)控制問題。1956至1958年間蘇聯(lián)學者龐特裏雅金等創(chuàng)立了“極大值原理”。這兩種方法成為了目前最優(yōu)控制理論的兩個柱石。
時至今日,最優(yōu)控制理論的研究無論在深度上和廣度上都有了很大的發(fā)展,例如發(fā)展了對分佈參數(shù)系統(tǒng)、隨機系統(tǒng)、大系統(tǒng)的最優(yōu)控制理論的研究等等。三、最優(yōu)控制應用舉例例1-1火車快速運行問題。設(shè)有一列火車從甲地出發(fā),要求算出容許的控制使其到達乙地的時間最短?;疖嚨倪\動方程(1-1)
(1-2)式中,是火車的品質(zhì),是火車的加速度,為使旅客舒適,其值有限制。是產(chǎn)生加速度的控制作用(即推力),其值也應有限制,設(shè)選擇使為最小。初始條件(1-3)終端條件(1-4)性能指標(1-5)
月球軟著陸問題。為了使太空船在月球表面上實現(xiàn)軟著陸(即著陸時速度要為零),要尋求著陸過程中發(fā)動機推力的最優(yōu)控制規(guī)律,使得燃料的消耗最少。設(shè)飛船的品質(zhì)為,離月球表面的高度為,飛船的垂直速度為,發(fā)動機推力為,月球表面的重力加速度為,設(shè)不帶燃料的飛船品質(zhì)為,初始燃料的品質(zhì)為
,則飛船的運動方程可表示為(參見圖1-1)例1-2
圖1-1月球軟著陸最優(yōu)控制問題(1-6)式中
為比例係數(shù),表示了推力與燃料消耗率的關(guān)係。
控制目的是使燃料消耗量最小,即飛船在著陸時的品質(zhì)保持最大,即為最大。(1-10)
容許控制(1-9)
終端條件
(1-8)初始條件
(1-7)例1-3
是初始時刻的商品存貨量,且。從的實際意義來看,顯然必須選取生產(chǎn)率使得(1-13)
生產(chǎn)計畫問題。設(shè)表示商品存貨量,表示對商品的需求率,是已知函數(shù),表示生產(chǎn)率,它將由計畫人員來選取,故是控制變數(shù)。滿足下麵的微分方程(1-12)(1-11)其次,生產(chǎn)能力應該有限制,即容許控制為(1-14)這裏表示最大生產(chǎn)率,另外為了保證滿足需求,必須有
由到的總成本為要求尋找最優(yōu)控制,使總成本最小。(1-15)(1-16)
假定每單位時間的生產(chǎn)成本是生產(chǎn)率的函數(shù),即。設(shè)是單位時間儲存單位商品的費用,於是,單位時間的總成本為四、小結(jié):
由上面的例子可見,求解最優(yōu)控制問題時要給定系統(tǒng)的狀態(tài)方程,狀態(tài)變數(shù)所滿足的初始條件和終端條件,性能指標的形式(時間最短、消耗燃料最小,誤差平方積分最小等)以及控制作用的容許範圍等。其中,為維狀態(tài)向量,為維控制向量,為維向量函數(shù),它可以是非線性時變向量函數(shù),也可以是線性定常的向量函數(shù)。狀態(tài)方程必須精確的知道。
用數(shù)學語言來比較詳細地表達最優(yōu)控制問題的內(nèi)容:
(1)建立被控系統(tǒng)的狀態(tài)方程(1-17)
而到達終端的時刻和狀態(tài)則因問題而異。
(2)確定狀態(tài)方程的邊界條件。一個動態(tài)過程對應於維狀態(tài)空間中從一個狀態(tài)到另一個狀態(tài)的轉(zhuǎn)移,也就是狀態(tài)空間中的一條軌線。在最優(yōu)控制中初態(tài)通常是知道的,即(1-18)(1-19)例如,在流水線生產(chǎn)過程中,是固定的;在飛機快速爬高時,只規(guī)定爬高的高度,而是自由的,要求越小越好。終端狀態(tài)一般屬於一個目標集,即當終端狀態(tài)是固定的,即時,則目標集退化為維狀態(tài)空間中的一個點。而當終態(tài)滿足某些約束條件,即這時處在維狀態(tài)空間中某個超曲面上。若終態(tài)不受約束,則目標集便擴展到整個維空間,或稱終端狀態(tài)自由。(1-20)上述性能指標包括兩個部分,即積分指標和終端指標,這種綜合性指標所對應的最優(yōu)控制問題稱為波爾紮(Bolza)問題。當只有終端指標時,稱為邁耶爾(Mayer)問題;當只有積分指標時,稱為拉格朗日(Lagrange)問題。
(3)選定性能指標。性能指標一般有下麵的形式:(1-21)
性能指標的確定因問題的性質(zhì)而異。在導彈截擊目標的問題中,我們要求彈著點的散佈度最小,這時可用終端指標來表示。在快速控制問題時,要求系統(tǒng)從一個狀態(tài)過渡到另一個狀態(tài)的時間最短,即,這就是積分指標。
性能指標是控制作用的函數(shù),也就是函數(shù)的函數(shù),這種以函數(shù)為引數(shù)的函數(shù)稱為泛函,所以又稱為性能泛函。有的文獻中也把性能指標稱為代價函數(shù)、目標函數(shù)等等。(4)確定控制作用的容許範圍,即
是維控制空間中的一個集合。例如,控制飛機的舵偏角是受限制的,控制電機的電流是受限制的,即有。這時控制作用屬於一個閉集。當不受任何限制時,稱它屬於一個開集。下麵將看到處理這兩類問題的方法是不同的。可稱為容許集合,屬於的控制則稱為容許控制。(1-22)
(5)按一定的方法計算出容許控制將它施加於用狀態(tài)方程描述的系統(tǒng),使狀態(tài)從初態(tài)轉(zhuǎn)移到目標集中的某一個終態(tài),並使性能指標達到最大或最小,即達到某種意義下的最優(yōu)。五、本課程主要內(nèi)容
課程將介紹求解最優(yōu)控制問題的方法:經(jīng)典變分法,極大(?。┲翟恚瑒討B(tài)規(guī)劃法,線性二次型最優(yōu)控制(系統(tǒng)為線性,指標為狀態(tài)和控制的二次型),線性二次型高斯控制(系統(tǒng)為線性且有高斯雜訊,指標為二次型),奇異最優(yōu)控制,微分對策控制(系統(tǒng)受雙方控制),最優(yōu)魯棒控制等。本書還將介紹最優(yōu)控制的一些基本的數(shù)值求解方法,最後介紹一些MATLAB在求解最優(yōu)控制問題中的應用實例。第二章靜態(tài)優(yōu)化——函數(shù)的極值問題本章主要內(nèi)容:2.1無約束條件的函數(shù)極值問題2.2有約束條件的函數(shù)極值問題2.3小結(jié)2.4習題2.1無約束條件的函數(shù)極值問題一元函數(shù)極值問題二元函數(shù)極值問題多元函數(shù)極值問題一元函數(shù)的極值問題
一元函數(shù)在處取極值的必要條件為
(2-1)當
(2-2)
為極小。
當(2-3)
為極大。
為簡單起見,今後我們將只討論極小,式(2-1)和(2-2)一起構(gòu)成為極小值的充分條件。當時,也可能有極小值,不過要檢驗高階導數(shù)。
上述情況可用圖2-1來表示。R點是局部極小點,又是總體極小點,U只是局部極小點,T是局部極大點,S是拐點,不是極值點。圖2-1函數(shù)的極值點和拐點
例2-1求使
最小的x。解:
故解使達到極小。本例是著名的最小二乘問題。二元函數(shù)極值問題
下麵考慮二元函數(shù)的極值問題。設(shè)在處取得極小值,記,這裏(T表示轉(zhuǎn)置,X是列向量)。在處取得極小值的必要條件和充分條件可如下求得。將在周圍展開為泰勒級數(shù)
(2-4)式中
表示高階無窮小。將(2-4)式用向量矩陣形式表示
(2-5)式中,(2-6)
由(2-5)式可知,取極值的必要條件為
(2-7)
進一步,若(2-8)
則這個極值為極小值。由於是任意的不為零的向量,要使(2-8)式成立,由矩陣理論可知,二階導數(shù)矩陣(又稱為Hessian陣)必須是正定的。正定陣形式上可表示為(2-9)(2-7)和(2-9)一起構(gòu)成了在處取極小值的充分條件。
多元函數(shù)極值問題設(shè)n個變數(shù)的多元函數(shù)為
式中
則在處有極小值的必要條
件為一階導數(shù)向量等於零向量,即進一步,若二階導數(shù)矩陣是正定陣,即(2-11)則這個極值是極小。
式(2-10)和(2-11)一起構(gòu)成了多元函數(shù)在處取極小值的充分條件。由(2-11)式可知,是實對稱矩陣。判別實對稱矩陣是否為正定有兩個常用的方法。一是檢驗的特徵值,若特徵值全部為正,則是正定的。另一是應用塞爾維斯特(Sylvest)判據(jù)。根據(jù)此判據(jù),若的各階順序主子式均大於零,即
(2-12)則就是正定的。det表示A陣的行列式。例2-2求下麵的多元函數(shù)的極值點解
由上面三個方程求得可能的極值點為
二階導數(shù)陣為
用塞爾維斯特判據(jù)來檢驗,有
故為正定,在處,為極小。2.2有約束條件的函數(shù)極值問題
前面討論函數(shù)的極值問題時,向量的各個分量可獨立地選擇,相互間無約束。本節(jié)將討論的各分量滿足一定約束條件的情況。
設(shè)具有個n變數(shù)的多元函數(shù)為
X的各分量滿足下麵的m個等式約束方程
(2-13)
若能從m個約束方程中解出m個X的分量,即將它們用其他n-m個的X分量表示,那麼X中只剩下n-m個獨立變數(shù)。於是問題可化為求n-m個變數(shù)的多元函數(shù)的無約束極值問題。這就是所謂的“消去法”。
由於從m個方程(一般是非線性方程)求出m個分量常常是困難的,故經(jīng)常採用“拉格朗日乘子法”。為此,對個約束方程,引入個拉格朗日乘子,並作出一個輔助函數(shù)—拉格朗日函數(shù)。
若令
則(2-14)式可用向量形式表示為
(2-15)
於是的條件極值問題就化為的無條件極值問題。函數(shù)L有極值的必要條件為
例2-3求從原點(0,0,0)至平面
的最短距離。解原點至空間任何一點的距離的平方為
要使極小,而點必須在所規(guī)定的平面上。
這是一個條件極值問題。作拉格朗日函數(shù)
極值的必要條件為
聯(lián)立求解上面四個方程可得
可能的極值點座標為
根據(jù)問題的性質(zhì)可以判斷極小值存在且是唯一的。故上面的即是極小點的座標。將極小點座標代入函數(shù)中,即可求出最短距離的平方為此問題的約束方程是、、的線性函數(shù),因此容易用“消去法”來求極值點。
例如,從中解出,將它用、表示,於是問題就化為求二元函數(shù)的無條件極值問題。讀者可自行驗證這樣做的結(jié)果與拉格朗日乘子法的結(jié)果是一樣的。
例2-4動態(tài)控制問題的參數(shù)化法。設(shè)一個動態(tài)系統(tǒng)由下麵的非線性狀態(tài)方程描述給定,終止時間t=0.5s,要求算出最優(yōu)控制,它使得指標函數(shù)
為最小。解:這是動態(tài)控制問題,這裏將控制作用參數(shù)化,於是可用靜態(tài)最優(yōu)化的方法求解。
設(shè)控制作用可用下麵的級數(shù)來逼近是已知的時間函數(shù)集,如sin、cos、Hermite多項式等正交函數(shù)或其他線性無關(guān)的函數(shù)。於是可用N個參數(shù)來表示,即被參數(shù)化了。確定就等於確定N個參數(shù),使指標J最小。這裏可用數(shù)值尋優(yōu)的方法來確定參數(shù)。2.3小結(jié)
1.n個變數(shù)的多元函數(shù)取無約束極小值的必要條件為,充分條件為和。
2.在滿足約束條件時的極小值的求取,可用拉格朗日乘子法,令是拉格朗日乘子(列)向量。2.4習題
1.求使得最大的。
2.求使為極值的極值點。
3.求使為極值的極值點。
4.求使且
5.求原點到曲線的距離為最小。
6.求函數(shù)極值,若
7.在第一象限內(nèi)作橢球面
的切平面,使切平面與三座標面所圍成的四面體體積最小,求切點的座標。第三章用變分法解最優(yōu)控制
—泛函極值問題
本章主要內(nèi)容3.1變分法基礎(chǔ)3.2無約束條件的泛函極值問題3.3有約束條件的泛函極值——動態(tài)系 統(tǒng)的最優(yōu)控制問題3.4小結(jié)返回主目錄
在動態(tài)系統(tǒng)最優(yōu)控制問題中,性能指標是一個泛函,性能指標最優(yōu)即泛函達到極值。解決泛函極值問題的有力工具是變分法。所以下麵就來列出變分法中的一些主要結(jié)果,大部分不加證明,但讀者可對照微分學中的結(jié)果來理解。3.1變分法基礎(chǔ)
如果對某一類函數(shù)中的每一個函數(shù),有一個實數(shù)值與之相對應,則稱為依賴於函數(shù)的泛函,記為粗略來說,泛函是以函數(shù)為引數(shù)的函數(shù)。1、泛函:先來給出下麵的一些定義。
若對任給的,存在當時,就有則稱在處是連續(xù)的。
2、泛函的連續(xù)性:
滿足下麵條件的泛函稱為線性泛函這裏是實數(shù),和是函數(shù)空間中的函數(shù)。
3、線性泛函:
4、引數(shù)函數(shù)的變分:
引數(shù)函數(shù)的變分是指同屬於函數(shù)類中兩個函數(shù)、之差
這裏,t看作為參數(shù)。當為一維函數(shù)時,可用圖3-1來表示。圖3-1引數(shù)函數(shù)的變分
這裏,是的線性泛函,若時,有,則稱是泛函的變分。是的線性主部。
當引數(shù)函數(shù)有變分時,泛函的增量為
5、泛函的變分:6、泛函的極值:
若存在,對滿足的 一切X, 具有同一符號,則稱在處有極值。
定理:
在處有極值的必要條件是對於所有容許的增量函數(shù)(引數(shù)的變分),泛函在處的變分為零為了判別是極大還是極小,要計算二階變分。但在實際問題中根據(jù)問題的性質(zhì)容易判別是極大還是極小,故一般不計算。3.2無約束條件的泛函極值問題3.2.1泛函的引數(shù)函數(shù)為標量函數(shù)的情況
為簡單起見,先討論引數(shù)函數(shù)為標量函數(shù)(一維)的情況。我們要尋求極值曲線,使下麵的性能泛函取極值(3-1)於是泛函J的增量可計算如下(以下將*號省去)上式中是高階項。為此,讓引數(shù)函數(shù)、在極值曲線、附近發(fā)生微小變分、,即
根據(jù)定義,泛函的變分是的線性主部,即對上式第二項作分部積分,按公式可得(3-2)J取極值的必要條件是等於零。因是任意的,要使(3-2)中第一項(積分項)為零,必有(3-3)上式稱為歐拉——拉格朗日方程。(3-2)式中第二項為零的條件要分兩種情況來討論:
1、固定端點的情況
這時,它們不發(fā)生變化,所以。而(3-2)中第二項可寫成當時,(3-4)式自然為零。(3-4)2、自由端點的情況
這時和可以發(fā)生化,,而且可以獨立地變化。於是要使(3-2)中第二項為零,由(3-4)式可得(3-6)(3-5)
因為這裏討論是標量函數(shù)的情況,和也是標量,且是任意的,故(3-5)、(3-6)可化為(3-7)、(3-8)稱為橫截條件。(3-8)(3-7)
當邊界條件全部給定(即固定端點)時,不需要這些橫截條件。當 給定時,不要(3-8)。當 給定時,不要(3-7)。3.2.2泛函的引數(shù)函數(shù)為向量函數(shù)的情況
現(xiàn)在,將上面對是標量函數(shù)時所得到的公式推廣到是n維向量函數(shù)的情況。這時,性能泛函為(3-9)(3-10)式中
向量歐拉——拉格朗日方程為(3-11)式中泛函變分由(3-2)式改為
(當和時)橫截條件為(自由端點情況)
例3-1
取極值的軌跡。求通過點(0,0)及(1,1)且使
解
即它的通解形式為
式中:這是固定端點問題,相應的歐拉——拉格朗日方程為
由初始條件,可得A=0。再由終端條件,可得,因而極值軌跡為
例3-2
求使指標
取極值的軌跡,並要求,但對沒有限制。解即常數(shù)於是是常數(shù),則是時間的線性函數(shù),令
由可得,又終端是自由的,由式(3-7)可得橫截條件為這是終端自由的情況。歐拉—拉格朗日方程為容易驗證時,對應局部極?。粫r,,對應局部極大。由上式解得或。時的極值軌跡為;時的極值軌跡為。
即3.3有約束條件的泛函極值
——動態(tài)系統(tǒng)的最優(yōu)控制問題前面討論泛函極值問題時,對極值軌跡沒有附加任何約束條件。但在動態(tài)系統(tǒng)最優(yōu)控制問題中,極值軌跡必須滿足系統(tǒng)的狀態(tài)方程,也就是要受到狀態(tài)方程的約束??紤]下列系統(tǒng)(3-13)這是綜合指標。我們要求出最優(yōu)控制和滿足狀態(tài)方程的極值軌跡,使性能指標取極值。式中,為維狀態(tài)向量,為維控制向量(這裏假定不受限制.否則不能用變分法求解,而要用極小值原理或動態(tài)規(guī)劃法求解)是n維連續(xù)可微的向量函數(shù)。性能指標如下:(3-14)
在下面的討論中,假定初始時刻和初始狀態(tài) 是給定的,終端則可能有幾種情況。我們將就幾種常見的情況來討論,即給定,自由和自由,屬於一個約束集。3.3.1終端時刻給定,終端狀態(tài)自由(3-16)(3-15)與有約束條件的函數(shù)極值情況類似,引入待定的n維拉格朗日乘子向量函數(shù)
將狀態(tài)方程(3-13)寫成等式約束方程的形式
與以前不同的是,在動態(tài)問題中拉格朗日乘子向量是時間函數(shù)。在最優(yōu)控制中經(jīng)常將稱為伴隨變數(shù),協(xié)態(tài)(協(xié)狀態(tài)向量)或共軛狀態(tài)。引入後可作出下麵的增廣泛函(3-17)
於是有約束條件的泛函的極值問題化為無約束條件的增廣泛函的極值問題。(3-18)再引入一個標量函數(shù)它稱為哈密頓(Hamilton)函數(shù),在最優(yōu)控制中起著重要的作用
於是可寫成(3-19)對上式積分號內(nèi)第二項作分部積分後可得
設(shè)、相對於最優(yōu)值、的變分分別為和 因為自由,故還要考慮變分。下麵來計算由這些變分引起的泛函的變分 。
為極小的必要條件是:對任意的、、,變分等於零。由(3-18)及(3-20)可得下麵的一組關(guān)係式(協(xié)態(tài)方程)(3-21)(狀態(tài)方程)(3-22)(控制方程)(3-23)(橫截條件)(3-24)
(3-21)~(3-24)即為取極值的必要條件,由此即可求得最優(yōu)值,,。
(3-22)式即為狀態(tài)方程,這可由的定義式(3-18)看出,實際解題時無需求,只要直接用狀態(tài)方程即可,這裏為形式上對稱而寫成(3-22)式。(3-21)與(3-22)一起稱為哈密頓正則程。
(3-23)是控制方程,它表示在最優(yōu)控制處取極值。注意,這是在為任意時得出的方程,當有界且在邊界上取得最優(yōu)值時,就不能用這方程,這時要用極小值原理求解。
(3-24)是在固定、自由時得出的橫截條件。當固定時,,就不需要這個橫截條件了。橫截條件表示協(xié)態(tài)終端所滿足的條件。
在求解(3-21)~(3-24)時,我們只知道初值和由橫截條件(3-24)求得的協(xié)態(tài)終端值,這種問題稱為兩點邊值問題,一般情況下它們是很難求解的。
因為不知道,如果假定一個,然後正向積分(3-21)~(3-24),則在時的值一般與給定的不同,於是要反復修正的值,直至與給定值的差可忽略不計為止。
非線性系統(tǒng)最優(yōu)控制兩點邊值問題的數(shù)值求解是一個重要的研究領(lǐng)域。對於線性系統(tǒng)兩點邊值問題的求解,則可尋找缺少的邊界條件並只要進行一次積分,下麵的例3-4給出了求解過程。
例3-3
設(shè)系統(tǒng)狀態(tài)方程為的邊界條件為。求最優(yōu)控制,使下列性能指標為最小。
解
這裏、均給定,故不需要橫截條件(3-24)式。作哈密頓函數(shù)則協(xié)態(tài)方程和控制方程為即
故可得正則方程對正則方程進行拉氏變換,可得(3-25)(3-26)(3-27)由(3-25)式可求得
於是,解出為(3-28)代入(3-26),即得(3-29)反變換可求得
將(3-28)代入(3-26)可得
故
由,從上式可得把代入(3-29),可得,而最優(yōu)控制為設(shè)系統(tǒng)的狀態(tài)方程為要求確定最優(yōu)控制,使指標泛函例3-4初始條件為取極小值終端條件為自由
這裏是自由的,所以要用到橫截條件(3- 24)式,因終端指標
解:作哈密頓函數(shù)由(3-21)~(3-23)可求得所以(3-30)(3-31)將代入狀態(tài)方程,可得
即得(3-32)邊界條件為(3-37)(3-36)(3-35)(3-34)(3-33)
(3-39)(3-38)(3-40)(3-41)
可見這是兩點邊值問題,對正則方程(3-33)~(3-36)進行拉氏變換,可得代入初始條件,,可得故由(3-38)~(3-41)可解出
同樣可解得
利用終端條件,,由(3-42)、(3-43)可得(3-43)(3-42)
由上二式可解出
由(3-42)式可得最優(yōu)狀態(tài)軌跡
由(3-43)式可得最優(yōu)協(xié)態(tài)
由(3-32)式可得最優(yōu)控制同理還可求出圖3-2最優(yōu)控制和最優(yōu)狀態(tài)軌跡解
注意,這個系統(tǒng)是線性定常系統(tǒng),這種線性兩點邊值問題的解可以通過尋找缺少的邊界條件,並且進行一次積分而求得其解。
對非線性兩點邊值問題,則要借助於迭代方法產(chǎn)生一個序列,來多次修正缺少的初始條件的試探值,直到滿足兩點邊值的條件。圖3-2是最優(yōu)解的軌跡曲線。3.3.2終端時刻自由,終端狀態(tài)受約束
設(shè)終端狀態(tài)滿足下麵約束方程(3-46)(3-45)(3-44)性能指標為其中
引入n維拉格朗日乘子向量函數(shù)和維拉格朗日乘子向量,作出增廣性能泛函將代入(3-47),可得(3-49)(3-48)(3-47)引入哈密頓函數(shù)
與固定時的情況不同,現(xiàn)在由、、和所引起。這裏不再為零,而可計算如下(參見圖3-3):(3-51)則(3-50)令圖3-3各種變分的表示(3-52)令一是在時函數(shù)相對的變化.另一是因的變化所引起的函數(shù)值的變化量後者可用它的線性主部來近似。注意,這裏和不同,故*號不能省去。上式表明由兩部分組成:
現(xiàn)在來計算(只計算到一階小量)。
上式中方括弧外的下標*表示、、是最優(yōu)值、、。是上式的線性主部,故
對第三項作分部積分,可得
第四項可表示為(忽略二階小量)
上式最後一個等號用到了(3-52)式。表示的引數(shù)取最優(yōu)值時的值。根據(jù)上面的結(jié)果可得
取極值的必要條件為因、、、為任意,故得(省去*號)(協(xié)態(tài)方程)(3-53)(狀態(tài)方程)(3-54)(控制方程)(3-55)(橫截方程)(3-56)
與固定情況相比,這裏多了一個方程,,用它可求出最優(yōu)終端時間。
(3-57)要求確定最優(yōu)控制,使最小。例3-5設(shè)系統(tǒng)狀態(tài)方程為邊界條件為自由性能指標為
解這是自由問題。終端狀態(tài)固定,是滿足約束集的特殊情況,即作哈密頓函數(shù)正則方程是控制方程是將代入,可得因邊界條件全部給定,故不用橫截條件。確定最優(yōu)終端時刻的條件(3-57)式為
因為由正則方程,所以,於是最優(yōu)控制再由正則方程,可得由上式求得
由初始條件,求得,故最優(yōu)軌跡為以終端條件代入上式,即求得最優(yōu)終端時刻
火箭發(fā)射最優(yōu)程式問題。設(shè)火箭在垂直平面內(nèi)運動,加速度與水平面夾角為,是控制作用,見圖3-4。令
例3-6(水準速度)(垂直速度)(水準距離)(垂直高度)圖3-4火箭發(fā)射示意圖
忽略重力和空氣阻力時,系統(tǒng)的狀態(tài)方程和初始條件為(3-58)要求選擇最優(yōu)控制程式,使性能指標自由終端狀態(tài)為為最小。
因為要求最小,故是自由問題。由給 定的終端狀態(tài)可得三個約束方程為解(3-59)
作哈密頓函數(shù)協(xié)態(tài)方程為(3-60)
橫截條件為即上式右端矩陣中的引數(shù)已省略。由(3-59)式求出上式中的偏導數(shù),可得協(xié)態(tài)的終值為(3-61)
常數(shù)積分協(xié)態(tài)方程可得常數(shù)代入?yún)f(xié)態(tài)終值條件後,得故(3-62)由控制方程,得(3-63)即
下麵來積分狀態(tài)方程(3-58),為此將引數(shù)變成。由(3-63)式得
為了確定最優(yōu)程式,還需確定拉格朗日未定常數(shù)、。將上面關(guān)係代入狀態(tài)方程,即得積分上面兩式得由初始條件可求得(3-64)(3-65)
將上面的和代入狀態(tài)方程(3-58)的後兩式,積分並經(jīng)較複雜運算得(3-66)(3-67)
(注:另一解為,但這時由(3-67)式可得出與給定終端條件不符,故略去的解)由終端條件和(3-65)式得故(3-68)由(3-63)式得於是(3-70)故(3-69)
將終端條件和(3-69)式代入(3-64)式,可得(3-71)
將終端條件,(3-69)式和(3-71)式代入(3-67)式可得(3-72)
現(xiàn)在歸納一下所得的結(jié)果:由(3-72)式可確定,由(3-71)式確定最短時間,由(3-70)式即可求得最優(yōu)推力方向角。
由上面的計算可知,對於這樣一個比較簡單的例子求出解析解也是比較困難的。一般情況下可用數(shù)值積分法求解。3.4小結(jié) 1、
函數(shù)的函數(shù)叫做泛函。性能指標是控制作用的函數(shù),故稱為性能泛函。和微分類似可引入泛函的變分。取極值的必要條件為。2、
泛函(為向量)取無約束極值的必要條件為(歐拉——拉格朗日方程)當、自由時,還有橫截條件(當和時)3、
求解動態(tài)系統(tǒng)的最優(yōu)控制是一個求取有約束條件的泛函極值問題。系統(tǒng)的狀態(tài)方程就是狀態(tài)變數(shù)要滿足的一個約束方程,即
設(shè)系統(tǒng)狀態(tài)方程為,性能指標為,初始狀態(tài)給定,終端狀態(tài)滿足向量約束方程(包括給定的情況)。4、
則由變分法可得下麵的結(jié)果:
其中,稱為哈密頓函數(shù)。(1)終端時刻給定時,取極值的必要條件為(橫截條件)(控制方程)
正則方程有個變數(shù),積分時要個邊界條件,初始條件給定時提供了個邊界條件,若也完全給定則又提供了個邊界條件,這時可不需要橫截條件,見例3-3。
當自由或部分分量自由就要靠橫截條件來提供缺少的邊界條件,見例3-4。(2) 終端條件自由,取極值的必要條件與給定時的不同處,僅在於多一個求最優(yōu)終端時刻的條件(3-57)5、
用經(jīng)典變分法求解最優(yōu)控制時,假定不受限制,為任意,故得出控制方程
不滿足這種情況時,要用極小值原理或動態(tài)規(guī)劃求解。這些內(nèi)容在下面的章節(jié)仲介紹。第四章極小值原理及其應用
4.1經(jīng)典變分法的局限性
4.2連續(xù)系統(tǒng)的極小值原理4.3最短時間控制問題
4.4最少燃料控制問題4.5離散系統(tǒng)的極小值原理
4.6小結(jié)
4.1經(jīng)典變分法的局限性
上面我們用經(jīng)典變分法解最優(yōu)控制問題時,得出了最優(yōu)性的必要條件
在得出這個條件時,作了下麵的假定:是任意的,即不受限制,它遍及整個向量空間,是一個開集;是存在的。
在實際工程問題中,控制作用常常是有界的。如飛機舵面的偏角有限制,火箭的推力有限制,生產(chǎn)過程中的生產(chǎn)能力有限制等等。一般,我們可用下麵的不等式來表示iiMtu£)(這時屬於一個有界的閉集,寫成,為閉集。更一般的情況可用下麵的不等式約束來表示。
當屬於有界閉集,在邊界上取值時,就不是任意的了,因為無法向邊界外取值,這時就不一定是最優(yōu)解的必要條件??疾煊蓤D4-1所表示的幾種情況,圖中橫軸上每一點都表示一個標量控制函數(shù),其容許取值範圍為。圖4-1有界閉集內(nèi)函數(shù)的幾種形狀對於圖4-1(a)仍對應最優(yōu)解。對於圖4-1(b)所對應的解不是最優(yōu)解,最優(yōu)解在邊界上。對於圖4-1(c)常數(shù),由這個方程解不出最優(yōu)控制來(這種情況稱為奇異情況),最優(yōu)解在邊界上。另外,也不一定是存在的。例如狀態(tài)方程的右端對U的一階偏導數(shù)可能不連續(xù),或由於有些指標函數(shù),如燃料最優(yōu)控制問題中,具有下麵的形式這時對U的一階偏導數(shù)不連續(xù)。
經(jīng)典變分法無法處理上面的情況,必須另辟新的途徑。極小值原理就是解決這類問題的有力工具。用極小值原理求解控制無約束的最優(yōu)控制問題和古典變分法是完全一樣的。1956年前蘇聯(lián)學者龐特裏雅金提出這個原理時,把它稱為極大值原理,目前較多地採用極小值原理這個名字。下麵給出這個原理及其證明,並舉例說明其應用。4.2連續(xù)系統(tǒng)的極小值原理
由於可以利用擴充變數(shù)的方法將各類最優(yōu)控制問題化為定常系統(tǒng),末值型性能指標情況下的標準形式。我們這裏只就定常系統(tǒng)、末值型性能指標、固定、末端受約束情況下給出極小值原理的簡單證明。設(shè)系統(tǒng)的狀態(tài)方程為
(4-1)
初始條件為
(4-2)控制向量,並受下麵的約束
(4-3)末值狀態(tài)必須滿足的約束條件為
(4-4)
(4-5)其中性能指標函數(shù)為為待定列向量。在本節(jié)中,假設(shè)函數(shù),,,存在且連續(xù),並假定容許控制是在控制域內(nèi)取值的任何分段連續(xù)函數(shù)。這時如果選定了某一容許控制,則容易證明在任意的初始條件下,方程(4-1)唯一的確定了系統(tǒng)狀態(tài)的變化規(guī)律,且是連續(xù)的和分段可微的。在這些條件下,我們就定常系統(tǒng)、末值型性能指標、固定、末端受約束情況下給出極小值原理的簡單證明。證明:採用擾動法,即給最優(yōu)控制一個變分,它將引起最優(yōu)軌線的變分,並使性能指標有一增量,當為極小時,必有,由此即可導出最優(yōu)控制所應滿足的必要條件。在變分法中,是微量,即將最優(yōu)控制和鄰近的容許控制相比較,因而最多只能建立哈密頓函數(shù)的相對極小值性質(zhì)。龐特裏亞金極大值原理卻將最優(yōu)控制與控制域內(nèi)所有可能的值進行比較,因而得出結(jié)論,在整個控制域內(nèi)最優(yōu)控制使哈密頓函數(shù)成為絕對極小值。正是這個性質(zhì)使得龐特裏亞金極大值原理成為尋找最優(yōu)控制的有力工具。但是這樣,的改變量必須看成有限量,而不再是微量。如果讓改變的時間很短,則由此引起的最優(yōu)軌線的改變?nèi)允俏⒘浚阅苤笜说脑隽恳彩俏⒘?,因而對各關(guān)係式的數(shù)學處理仍是比較容易的。設(shè)為最優(yōu)控制,任選一時刻及一微量,在時間間隔中給一有限大小的改變量,且使得。現(xiàn)在研究由引起的最優(yōu)軌線的變化。分為三段考慮:1在這一段中,,因而。2系統(tǒng)的狀態(tài)方程(4-1)可在初始條件下直接積分。當時,當時,兩式相減可得這一段的(4-6)可以對的大小作估計由於是微量,所以也是微量,因而在精確到一階微量的情況下,下式成立(4-7)將式(4-7)代入(4-6),並注意到微量在微小時間間隔上的積分是高階微量,即得在第二段時間間隔得終點,則有或(4-8)其中表示二階以上的微量。3這時又有,系統(tǒng)的狀態(tài)方程為而狀態(tài)變數(shù)的變分滿足方程
(4-9)引入變數(shù)及哈密頓函數(shù)(4-10)
(4-11)
(4-12)顯然,方程(4-9)和(4-11)為共軛方程,立即求得積分或(4-13)即最終求得了由於的有限改變而引起的最優(yōu)軌線的變化,特別是末值狀態(tài)的變化。下麵研究由引起的最優(yōu)性能指標的改變量。由於故有(4-14)綜合(4-8)、(4-12)、(4-13)和(4-14)等式,可以建立與有限改變量之間的關(guān)係已知中的任意時刻,並以表示,當時,上式變?yōu)椋?/p>
,或用哈密頓函數(shù)的運算式(4-10)表示可得
(4-15)或於是定常系統(tǒng)、末值型性能指標、固定、末端受約束情況下極小值原理得以證明??偨Y(jié)上述討論,可將龐特裏雅金極小值原理寫為如下形式:定理(極小值原理):系統(tǒng)狀態(tài)方程(4-1)
初始條件
(4-2)控制向量,並受下麵的約束
(4-3)終端約束
(4-4)指標函數(shù)
(4-5)要求選擇最優(yōu)控制,使取極小值。取極小值的必要條件是、、和滿足下麵的一組方程1正則方程
(協(xié)態(tài)方程)(4-16)
(狀態(tài)方程)(4-17)2邊界條件
(4-18)3橫截條件
(4-19)
4最優(yōu)終端時刻條件
(4-20)在最優(yōu)軌線和最優(yōu)控制上哈密頓函數(shù)取極小值
(4-21)將上面的結(jié)果與用古典變分法所得的結(jié)果((3-34)~(3-38)式)對比可見,只是將這個條件用(4-21)代替,其他無變化。應該指出,當存在,且得出的絕對極小,如圖4-1(a)所示時,即為條件(4-21)式。所以極小值原理可以解決變分法所能解決的問題,還能解決變分法不能解決的問題。如何應用條件(4-21)式,這是一個關(guān)鍵,我們將用具體例子來說明。4.3最短時間控制問題
節(jié)省時間意味著提高生產(chǎn)率或先發(fā)制人取得軍事行動的勝利。所以人們很早就開始了對最短時間控制的研究,這方面的研究結(jié)果很多,這裏先就簡單的重積分系統(tǒng)的最短時間控制展開討論。在前面的緒論中列舉了火車快速行駛問題。設(shè)火車品質(zhì)m=1,把運動方程寫成狀態(tài)方程形式,令可化為下麵的最短時間控制問題。例4-1重積分系統(tǒng)的最短時間控制狀態(tài)方程
(4-22)初始條件為
(4-23)終端條件為
(4-24)控制約束為
(4-25)求出使性能指標
(4-26)取極小的最優(yōu)控制。解
;因為控制作用有限制(屬於有界閉集),故要用極小值原理求解。取哈密頓函數(shù)
(4-27)協(xié)態(tài)方程為
(4-28)
(4-29)積分上面兩個方程可得
(4-30)
(4-31)其中,、是積分常數(shù)。由的運算式(4-27)可見,若要選擇使取極小,只要使越負越好,而,故當,且與反號時,取極小,即最優(yōu)控制為由此可見,最優(yōu)解取邊界值+1或-1,是開關(guān)函數(shù)的形式。什麼時候發(fā)生開關(guān)轉(zhuǎn)換,將取決於的符號。而由(4-31)式可見,是的線性函數(shù),它有四種可能的形狀(見圖4-2),也相應有四種序列
由圖4-2可見,當為的線性函數(shù)時最多改變一次符號。圖4-2與的四種形狀從上面兩式消去t,即可得相軌跡方程
(4-33)當時,狀態(tài)方程的解為
(4-32)下麵來求出取不同值時的狀態(tài)軌跡(也稱為相軌跡)。在圖4-3中用實線表示,不同的C值可給出一簇曲線。由(4-32)第一式知增大時增大,故相軌跡進行方向是自下而上,如圖中曲線上箭頭所示。當時,狀態(tài)方程的解為
(4-34)消去,可得相軌跡方程圖4-3相軌跡圖在圖4-3中用虛線表示。因增大時,減少,故相軌跡進行方向是自上而下。兩簇曲線中,每一簇中有一條曲線的半支進入原點。在的曲線簇中,通過原點的曲線方程為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國便攜式DVD電池保護板市場調(diào)查研究報告
- 擴展檔案管理視野試題及答案
- 稅務(wù)師考試最終復習計劃試題及答案
- 經(jīng)典雞尾酒制作試題及答案
- 2025至2030年中國中密度纖維板生產(chǎn)線市場分析及競爭策略研究報告001
- 2025至2030年中國中農(nóng)抗菌王注射液市場分析及競爭策略研究報告
- 2024年小自考市場細分策略試題及答案
- 湛江三模數(shù)學試題及答案
- 2024年CPBA考試文獻收集策略試題及答案
- 多媒體設(shè)計師考試答題技巧試題及答案
- 2025-2030中國面巾紙行業(yè)運營模式與競爭格局分析研究報告
- 2025年各地低空經(jīng)濟政策匯編
- 希沃白板5考題及答案
- 邢臺2025年河北邢臺市高層次人才引進1025人筆試歷年參考題庫附帶答案詳解
- 第三單元 圓柱與圓錐 單元測試(含答案)2024-2025學年六年級下冊數(shù)學人教版
- XX鄉(xiāng)鎮(zhèn)履職事項清單表(1356項)
- 2025年共青團入團考試測試題庫及答案
- 2021年同等學力申碩《臨床醫(yī)學》試題真題及答案
- 地鐵保安服務(wù)投標方案(技術(shù)方案)
- 《企業(yè)研發(fā)費用稅前加計扣除政策解讀與應用課件》
- 2025年湖北國土資源職業(yè)學院單招職業(yè)技能測試題庫及答案一套
評論
0/150
提交評論