最優(yōu)控制理論及應(yīng)用_第1頁
最優(yōu)控制理論及應(yīng)用_第2頁
最優(yōu)控制理論及應(yīng)用_第3頁
最優(yōu)控制理論及應(yīng)用_第4頁
最優(yōu)控制理論及應(yīng)用_第5頁
已閱讀5頁,還剩125頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

最優(yōu)控制理論及應(yīng)用2023/7/141第1頁,課件共130頁,創(chuàng)作于2023年2月一基本概念最優(yōu)控制理論中心問題:給定一個控制系統(tǒng)(已建立的被控對象的數(shù)學(xué)模型),選擇一個容許的控制律,使被控對象按預(yù)定要求運(yùn)行,并使給定的某一性能指標(biāo)達(dá)到極小值(或極大值)第一章最優(yōu)控制問題的一般概念2023/7/142第2頁,課件共130頁,創(chuàng)作于2023年2月二最優(yōu)控制問題1例子

飛船軟著陸問題宇宙飛船在月球表面著陸時速度必須為零,即軟著陸,這要靠發(fā)動機(jī)的推力變化來完成。問題是如何選擇一個推力方案,使燃料消耗最小。m飛船的質(zhì)量,h高度,v垂直速度,g月球重力加速度常數(shù),M飛船自身質(zhì)量F燃料的質(zhì)量2023/7/143第3頁,課件共130頁,創(chuàng)作于2023年2月軟著陸過程開始時刻t為零K為常數(shù),初始狀態(tài)

末端條件

2023/7/144第4頁,課件共130頁,創(chuàng)作于2023年2月性能指標(biāo)控制約束任務(wù):滿足控制約束條件下,求發(fā)動機(jī)推力的最優(yōu)變化律,使登月艙由初始出發(fā)點到達(dá)目標(biāo)處(末態(tài)),并使性能指標(biāo)達(dá)到極值(燃耗量最?。?023/7/145第5頁,課件共130頁,創(chuàng)作于2023年2月例2火車快速運(yùn)行問題設(shè)火車從甲地出發(fā),求容許控制,使其到達(dá)乙地時間最短。m火車質(zhì)量;火車加速度;u(t)產(chǎn)生加速度的推力且

火車運(yùn)動方程

2023/7/146第6頁,課件共130頁,創(chuàng)作于2023年2月2問題描述(1)狀態(tài)方程一般形式為為n維狀態(tài)向量為r維控制向量

為n維向量函數(shù)

給定控制規(guī)律

滿足一定條件時,方程有唯一解

2023/7/147第7頁,課件共130頁,創(chuàng)作于2023年2月(2)容許控制:,(3)目標(biāo)集

n維向量函數(shù)

固定端問題自由端問題2023/7/148第8頁,課件共130頁,創(chuàng)作于2023年2月(4)性能指標(biāo)對狀態(tài)、控制以及終點狀態(tài)的要求,復(fù)合型性能指標(biāo)積分型性能指標(biāo),表示對整個狀態(tài)和控制過程的要求終點型指標(biāo),表示僅對終點狀態(tài)的要求2023/7/149第9頁,課件共130頁,創(chuàng)作于2023年2月最優(yōu)控制的應(yīng)用類型積分型1)最小時間控制2)最小燃耗控制3)最小能量控制2023/7/1410第10頁,課件共130頁,創(chuàng)作于2023年2月末值型復(fù)合型1)狀態(tài)調(diào)節(jié)器2)輸出跟蹤系統(tǒng)2023/7/1411第11頁,課件共130頁,創(chuàng)作于2023年2月最優(yōu)控制的研究方法解析法:適用于性能指標(biāo)及約束條件有明顯解析式數(shù)值計算方法:性能指標(biāo)比較復(fù)雜1)一維搜索法:適合單變量求極值2)多維搜索法:適合單變量求極值梯度法:解析與數(shù)值方法相結(jié)合1)無約束梯度法2)有約束梯度法2023/7/1412第12頁,課件共130頁,創(chuàng)作于2023年2月第二章最優(yōu)控制中的變分法2.1泛函與變分法基礎(chǔ)平面上兩點連線的長度問題其弧長為2023/7/1413第13頁,課件共130頁,創(chuàng)作于2023年2月一般來說,曲線不同,弧長就不同,即弧長依賴于曲線,記為。,稱為泛函。

,稱泛函的宗量

泛函定義:x(t)是自變量t的函數(shù),若對每個函數(shù)x(t),有一個J值與之對應(yīng),則變量J稱為依賴于x(t)的泛函,記J(x(t))例舉:2023/7/1414第14頁,課件共130頁,創(chuàng)作于2023年2月線性泛函與連續(xù)泛函:線性泛函泛函對宗量是線性的連續(xù)泛函

若定義在線性賦范空間上的泛函又滿足連續(xù)條件,稱J(x)為連續(xù)線性泛函2023/7/1415第15頁,課件共130頁,創(chuàng)作于2023年2月泛函與函數(shù)的幾何解釋

宗量的變分泛函的增量

泛函的變分

Jd=2023/7/1416第16頁,課件共130頁,創(chuàng)作于2023年2月定理2.1泛函的變分為

2023/7/1417第17頁,課件共130頁,創(chuàng)作于2023年2月例2.1求泛函的變分

2023/7/1418第18頁,課件共130頁,創(chuàng)作于2023年2月泛函的極值

定理2.2若泛函有極值,則必有2023/7/1419第19頁,課件共130頁,創(chuàng)作于2023年2月變分學(xué)預(yù)備定理2023/7/1420第20頁,課件共130頁,創(chuàng)作于2023年2月2.2歐拉方程

(1)無約束泛函極值的必要條件

定理2.3設(shè)有如下泛函極值問題:

及橫截條件2023/7/1421第21頁,課件共130頁,創(chuàng)作于2023年2月2.2歐拉方程

變分分部積分

證明:2023/7/1422第22頁,課件共130頁,創(chuàng)作于2023年2月例2.2求平面上兩固定點間連線最短的曲線,直線

2023/7/1423第23頁,課件共130頁,創(chuàng)作于2023年2月例2.3:

已知邊界條件為求使泛函達(dá)到極值的軌線

解:2023/7/1424第24頁,課件共130頁,創(chuàng)作于2023年2月2.2歐拉方程

(2)有等式約束泛函極值的必要條件

定理2.4設(shè)有如下泛函極值問題:

及橫截條件2023/7/1425第25頁,課件共130頁,創(chuàng)作于2023年2月例2.4:設(shè)人造地球衛(wèi)星姿態(tài)控制系統(tǒng)的狀態(tài)方程為2023/7/1426第26頁,課件共130頁,創(chuàng)作于2023年2月

2.3橫截條件

討論:

A.

B.

C.

D.2023/7/1427第27頁,課件共130頁,創(chuàng)作于2023年2月左端固定右端沿曲線變動橫截條件C的推導(dǎo)2023/7/1428第28頁,課件共130頁,創(chuàng)作于2023年2月

2023/7/1429第29頁,課件共130頁,創(chuàng)作于2023年2月

例2.5設(shè)性能指標(biāo)泛函

末值時刻

未定,已知

,解:由歐拉方程得由x(0)=1求出b=1;由橫截條件知2023/7/1430第30頁,課件共130頁,創(chuàng)作于2023年2月2023/7/1431第31頁,課件共130頁,創(chuàng)作于2023年2月2.4含有多個未知函數(shù)泛函的極值泛函

歐拉方程

邊界值

橫截條件

2023/7/1432第32頁,課件共130頁,創(chuàng)作于2023年2月2.5條件極值狀態(tài)方程泛函引進(jìn)乘子構(gòu)造新的函數(shù)和泛函

歐拉方程

約束方程2023/7/1433第33頁,課件共130頁,創(chuàng)作于2023年2月例2.6泛函約束方程邊界條件試求使泛函有極值。解:化為標(biāo)準(zhǔn)形式

把問題化為標(biāo)準(zhǔn)形式,令2023/7/1434第34頁,課件共130頁,創(chuàng)作于2023年2月約束方程可定為邊界條件為2023/7/1435第35頁,課件共130頁,創(chuàng)作于2023年2月引進(jìn)乘子構(gòu)造函數(shù)歐拉方程2023/7/1436第36頁,課件共130頁,創(chuàng)作于2023年2月解出其中,和為任意常數(shù)。代入約束方程,并求解可得將利用邊界條件,可得:2023/7/1437第37頁,課件共130頁,創(chuàng)作于2023年2月于是,極值曲線和為:2023/7/1438第38頁,課件共130頁,創(chuàng)作于2023年2月問題:確定最優(yōu)控制和最優(yōu)軌線,使系統(tǒng)由已知初態(tài)轉(zhuǎn)移到要求的目標(biāo)集

2.6變分法解最優(yōu)控制問題并使指定的目標(biāo)泛函達(dá)到極值2023/7/1439第39頁,課件共130頁,創(chuàng)作于2023年2月2.6.1末端時刻固定時最優(yōu)解的必要條件(1)末端受約束的情況引入拉格朗日乘子構(gòu)造廣義泛函

有構(gòu)造哈米頓函數(shù)2023/7/1440第40頁,課件共130頁,創(chuàng)作于2023年2月變分2023/7/1441第41頁,課件共130頁,創(chuàng)作于2023年2月

定理2.5:對于如下最優(yōu)控制問題:u(t)無約束,tf固定.最優(yōu)解的必要條件2023/7/1442第42頁,課件共130頁,創(chuàng)作于2023年2月

定理2.6:對于如下最優(yōu)控制問題:u(t)無約束,tf固定,x(tf)自由.最優(yōu)解的必要條件(2)末端自由的情況2023/7/1443第43頁,課件共130頁,創(chuàng)作于2023年2月

定理2.7:對于如下最優(yōu)控制問題:u(t)無約束,tf固定,x(tf)固定.最優(yōu)解的必要條件(3)末端固定的情況2023/7/1444第44頁,課件共130頁,創(chuàng)作于2023年2月例2.7考慮狀態(tài)方程和初始條件為的簡單一階系統(tǒng),其指標(biāo)泛函為,使其中,給定,試求最優(yōu)控制有極小值。0t,2023/7/1445第45頁,課件共130頁,創(chuàng)作于2023年2月,伴隨方程

邊界條件由必要條件解:引進(jìn)伴隨變量,構(gòu)造哈米頓函數(shù)2023/7/1446第46頁,課件共130頁,創(chuàng)作于2023年2月則最優(yōu)控制為得代入狀態(tài)方程求解得令,則有2023/7/1447第47頁,課件共130頁,創(chuàng)作于2023年2月邊界條件指標(biāo)泛函

哈米頓函數(shù)

伴隨方程,

例2.8重解例2.4

其解為2023/7/1448第48頁,課件共130頁,創(chuàng)作于2023年2月

2023/7/1449第49頁,課件共130頁,創(chuàng)作于2023年2月習(xí)題1:設(shè)一階系統(tǒng)方程為性能指標(biāo)取為式中常數(shù)試求使J取極小值的最優(yōu)控制和相應(yīng)的性能指標(biāo)習(xí)題2:設(shè)二階系統(tǒng)方程為性能指標(biāo)取為求系統(tǒng)由已知初態(tài)在轉(zhuǎn)移到目標(biāo)集且使J取極小的最優(yōu)控制和最優(yōu)軌跡2023/7/1450第50頁,課件共130頁,創(chuàng)作于2023年2月2.6.2末端時刻自由的最優(yōu)解問題tf有時是可變的,是指標(biāo)泛函,選控制使有tf極小值

變分2023/7/1451第51頁,課件共130頁,創(chuàng)作于2023年2月

,必要條件2023/7/1452第52頁,課件共130頁,創(chuàng)作于2023年2月例2.7

指標(biāo)泛函

哈米頓函數(shù)

伴隨方程

必要條件2023/7/1453第53頁,課件共130頁,創(chuàng)作于2023年2月第三章最大值原理3.1古典變分法的局限性u(t)受限的例子矛盾!!例3.1伴隨方程極值必要條件2023/7/1454第54頁,課件共130頁,創(chuàng)作于2023年2月3.2最大值原理且定理3.1(最小值原理)設(shè)為容許控制,為對應(yīng)的積分軌線,為使為最優(yōu)控制,為最優(yōu)軌線,必存在一向量函數(shù),使得和滿足正則方程2023/7/1455第55頁,課件共130頁,創(chuàng)作于2023年2月最小值原理只是最優(yōu)控制所滿足的必要條件。但對于線性系統(tǒng),最小值原理也是使泛函取最小值得充分條件。2023/7/1456第56頁,課件共130頁,創(chuàng)作于2023年2月例3.2重解例3.1

,哈密頓函數(shù)伴隨方程

由極值必要條件,知

,

又于是有2023/7/1457第57頁,課件共130頁,創(chuàng)作于2023年2月,

協(xié)態(tài)變量與控制變量的關(guān)系圖

2023/7/1458第58頁,課件共130頁,創(chuàng)作于2023年2月,,例3.3性能指標(biāo)泛函

哈密頓函數(shù)伴隨方程,

2023/7/1459第59頁,課件共130頁,創(chuàng)作于2023年2月上有

2023/7/1460第60頁,課件共130頁,創(chuàng)作于2023年2月協(xié)態(tài)變量與控制變量的關(guān)系圖

整個最優(yōu)軌線

2023/7/1461第61頁,課件共130頁,創(chuàng)作于2023年2月例3.4

把系統(tǒng)狀態(tài)在終點時刻轉(zhuǎn)移到性能指標(biāo)泛函

終點時刻是不固定的

哈米頓函數(shù)

伴隨方程

,,

2023/7/1462第62頁,課件共130頁,創(chuàng)作于2023年2月H是u的二次拋物線函數(shù),u在上一定使H有最小值,可能在內(nèi)部,也可能在邊界上。最優(yōu)控制可能且只能取三個值

此二者都不能使?fàn)顟B(tài)變量同時滿足初始條件和終點條件

2023/7/1463第63頁,課件共130頁,創(chuàng)作于2023年2月

,,

最優(yōu)控制最優(yōu)軌線

最優(yōu)性能指標(biāo)

2023/7/1464第64頁,課件共130頁,創(chuàng)作于2023年2月例3.5

使系統(tǒng)以最短時間從給定初態(tài)轉(zhuǎn)移到零態(tài)

哈米頓函數(shù)

伴隨方程

2023/7/1465第65頁,課件共130頁,創(chuàng)作于2023年2月最優(yōu)控制切換及最優(yōu)軌線示意圖

2023/7/1466第66頁,課件共130頁,創(chuàng)作于2023年2月3.3古典變分法與最小值原理古典變分法適用的范圍是對u無約束,而最小值原理一般都適用。特別當(dāng)u不受約束時,條件就等價于條件2023/7/1467第67頁,課件共130頁,創(chuàng)作于2023年2月

3.4極大值原理的應(yīng)用:快速控制系統(tǒng)在實際問題中,經(jīng)常發(fā)生以時間為性能指標(biāo)的控制問題。如,當(dāng)被控對象受干擾后,偏離了平衡狀態(tài),希望施加控制能以最短時間恢復(fù)到平衡狀態(tài)。凡是以運(yùn)動時間為性能指標(biāo)的最優(yōu)控制問題稱為最小時間控制。2023/7/1468第68頁,課件共130頁,創(chuàng)作于2023年2月3.4.1快速控制問題性能指標(biāo)

時間上限是可變的從狀態(tài)轉(zhuǎn)移平衡狀態(tài)所需時間最短構(gòu)造哈密頓函數(shù)

最小值原理

分段常值函數(shù)2023/7/1469第69頁,課件共130頁,創(chuàng)作于2023年2月例3.4.1有一單位質(zhì)點,在處以初速度2沿直線運(yùn)動?,F(xiàn)施加一力,,使質(zhì)點盡快返回原點,并停留在原點上。力簡稱為控制。若其它阻力不計,試求此控制力。質(zhì)點運(yùn)動方程

狀態(tài)方程哈密頓函數(shù)伴隨方程

2023/7/1470第70頁,課件共130頁,創(chuàng)作于2023年2月最優(yōu)控制

協(xié)態(tài)變量與控制函數(shù)4種情況示意圖2023/7/1471第71頁,課件共130頁,創(chuàng)作于2023年2月相軌線族示意圖開關(guān)曲線2023/7/1472第72頁,課件共130頁,創(chuàng)作于2023年2月開關(guān)曲線總時間初始狀態(tài)最優(yōu)控制狀態(tài)方程相軌線最優(yōu)控制

2023/7/1473第73頁,課件共130頁,創(chuàng)作于2023年2月3.4.2綜合問題

綜合是將最優(yōu)控制函數(shù)表示為狀態(tài)和時間的函數(shù)即上例之最優(yōu)綜合控制函數(shù)2023/7/1474第74頁,課件共130頁,創(chuàng)作于2023年2月例3.4.2

求快速返回原點的開關(guān)曲線和最優(yōu)綜合控制函數(shù)

構(gòu)造哈密頓函數(shù)

伴隨方程

最優(yōu)控制

2023/7/1475第75頁,課件共130頁,創(chuàng)作于2023年2月最優(yōu)控制與協(xié)態(tài)變量的變化情況

控制是“砰砰控制”,除了首尾之外,在和上的停留時間均為2023/7/1476第76頁,課件共130頁,創(chuàng)作于2023年2月備選最優(yōu)軌線族

兩族同心圓方程2023/7/1477第77頁,課件共130頁,創(chuàng)作于2023年2月相點沿軌線順時針方向運(yùn)動,其速度為開關(guān)曲線

2023/7/1478第78頁,課件共130頁,創(chuàng)作于2023年2月第二段開關(guān)曲線2023/7/1479第79頁,課件共130頁,創(chuàng)作于2023年2月整個開關(guān)曲線

2023/7/1480第80頁,課件共130頁,創(chuàng)作于2023年2月最優(yōu)綜合控制函數(shù)

2023/7/1481第81頁,課件共130頁,創(chuàng)作于2023年2月第四章線性二次型性能指標(biāo)的最優(yōu)控制用最大值原理求最優(yōu)控制,求出的最優(yōu)控制通常是時間的函數(shù),這樣的控制為開環(huán)控制當(dāng)用開環(huán)控制時,在控制過程中不允許有任何干擾,這樣才能使系統(tǒng)以最優(yōu)狀態(tài)運(yùn)行。在實際問題中,干擾不可能沒有,因此工程上總希望應(yīng)用閉環(huán)控制,即控制函數(shù)表示成時間和狀態(tài)的函數(shù)。求解這樣的問題一般來說是很困難的。。2023/7/1482第82頁,課件共130頁,創(chuàng)作于2023年2月但對一類線性的且指標(biāo)是二次型的動態(tài)系統(tǒng),卻得了完全的解決。不但理論比較完善,數(shù)學(xué)處理簡單,而且在工際中又容易實現(xiàn),因而在工程中有著廣泛的應(yīng)用。2023/7/1483第83頁,課件共130頁,創(chuàng)作于2023年2月4.1問題提法動態(tài)方程

指標(biāo)泛函

使求有最小值此問題稱線性二次型性能指標(biāo)的最優(yōu)控制問題通常稱為綜合控制函數(shù)2023/7/1484第84頁,課件共130頁,創(chuàng)作于2023年2月指標(biāo)泛函的物理意義積分項,被積函數(shù)由兩項組成,都是二次型。第一項過程在控制過程中,實際上是要求每個分量越小越好,但每一個分量不一定同等重要,所以用加權(quán)來調(diào)整,當(dāng)權(quán)為零時,對該項無要求。第二項控制能力能量消耗最小。對每個分量要求不一樣,因而進(jìn)行加權(quán)。要求正定,一方面對每個分量都應(yīng)有要求,否則會出現(xiàn)很大幅值,在實際工程中實現(xiàn)不了;另一方面,在計算中需要有逆存在。指標(biāo)中的第一項是對點狀態(tài)的要求,由于對每個分量要求不同,用加權(quán)陣來調(diào)整。2023/7/1485第85頁,課件共130頁,創(chuàng)作于2023年2月4.2.1末端自由問題構(gòu)造哈密頓函數(shù)

伴隨方程及邊界條件最優(yōu)控制應(yīng)滿足4.2狀態(tài)調(diào)節(jié)器2023/7/1486第86頁,課件共130頁,創(chuàng)作于2023年2月求導(dǎo)2023/7/1487第87頁,課件共130頁,創(chuàng)作于2023年2月(矩陣?yán)杩ㄌ嵛⒎址匠蹋?/p>

邊界條件

令最優(yōu)控制是狀態(tài)變量的線性函數(shù)借助狀態(tài)變量的線性反饋可實現(xiàn)閉環(huán)最優(yōu)控制最優(yōu)控制

對稱半正定陣2023/7/1488第88頁,課件共130頁,創(chuàng)作于2023年2月例4.1

性能指標(biāo)泛函

最優(yōu)控制黎卡提微分方程2023/7/1489第89頁,課件共130頁,創(chuàng)作于2023年2月最優(yōu)軌線

最優(yōu)控制最優(yōu)軌線的微分方程

2023/7/1490第90頁,課件共130頁,創(chuàng)作于2023年2月黎卡提方程的解

隨終點時間變化的黎卡提方程的解2023/7/1491第91頁,課件共130頁,創(chuàng)作于2023年2月4.2.2固定端問題(設(shè))指標(biāo)泛函

采用“補(bǔ)償函數(shù)”法

補(bǔ)償函數(shù)懲罰函數(shù)

邊界條件

黎卡提方程

逆黎卡提方程

2023/7/1492第92頁,課件共130頁,創(chuàng)作于2023年2月求導(dǎo)

黎卡提方程乘以逆黎卡提方程

解逆2023/7/1493第93頁,課件共130頁,創(chuàng)作于2023年2月4.2.3

的情況性能指標(biāo)無限長時間調(diào)節(jié)器問題

黎卡提方程

邊界條件最優(yōu)控制最優(yōu)指標(biāo)

2023/7/1494第94頁,課件共130頁,創(chuàng)作于2023年2月4.2.4定常系統(tǒng)完全可控

指標(biāo)泛函矩陣代數(shù)方程

最優(yōu)控制最優(yōu)指標(biāo)

2023/7/1495第95頁,課件共130頁,創(chuàng)作于2023年2月例4.2

黎卡提方程

2023/7/1496第96頁,課件共130頁,創(chuàng)作于2023年2月4.3輸出調(diào)節(jié)器輸出調(diào)節(jié)器問題狀態(tài)調(diào)節(jié)器問題指標(biāo)泛函

令2023/7/1497第97頁,課件共130頁,創(chuàng)作于2023年2月4.4跟蹤問題問題的提法

已知的理想輸出

偏差量

指標(biāo)泛函

尋求控制規(guī)律使性能指標(biāo)有極小值。物理意義在控制過程中,使系統(tǒng)輸出盡量趨近理想輸出,同時也使能量消耗最少。2023/7/1498第98頁,課件共130頁,創(chuàng)作于2023年2月指標(biāo)泛函

哈密頓函數(shù)2023/7/1499第99頁,課件共130頁,創(chuàng)作于2023年2月設(shè)并微分2023/7/14100第100頁,課件共130頁,創(chuàng)作于2023年2月的任意性

最優(yōu)控制2023/7/14101第101頁,課件共130頁,創(chuàng)作于2023年2月最優(yōu)軌線方程

最優(yōu)性能指標(biāo)

2023/7/14102第102頁,課件共130頁,創(chuàng)作于2023年2月例4.3

,性能指標(biāo)

2023/7/14103第103頁,課件共130頁,創(chuàng)作于2023年2月最優(yōu)控制

2023/7/14104第104頁,課件共130頁,創(chuàng)作于2023年2月,,最優(yōu)控制

極限解2023/7/14105第105頁,課件共130頁,創(chuàng)作于2023年2月閉環(huán)控制系統(tǒng)結(jié)構(gòu)2023/7/14106第106頁,課件共130頁,創(chuàng)作于2023年2月兩種方法

龐特里雅金

前蘇聯(lián)學(xué)者

極大值原理

貝爾曼

美國學(xué)者

動態(tài)規(guī)劃應(yīng)用在過程控制、國防建設(shè)、經(jīng)濟(jì)規(guī)劃、管理

多個分支分布參數(shù)的最優(yōu)控制、隨機(jī)最優(yōu)控制、大系統(tǒng)最優(yōu)控制以及多方多層次的微分對策和主從對策等

返回2023/7/14107第107頁,課件共130頁,創(chuàng)作于2023年2月第五章動態(tài)規(guī)劃

動態(tài)規(guī)劃是求解最優(yōu)控制的又一種方法,特別對離散型控制系統(tǒng)更為有效,而且得出的是綜合控制函數(shù)。這種方法來源于多決策過程,并由貝爾曼首先提出,故稱貝爾曼動態(tài)規(guī)劃。

2023/7/14108第108頁,課件共130頁,創(chuàng)作于2023年2月5.1多級決策過程與最優(yōu)性原理作為例子,首先分析最優(yōu)路徑問題(a)(b)(c)試分析(a),(b)和(c)三種情況的最優(yōu)路徑,即從走到所需時間最少。規(guī)定沿水平方向只能前進(jìn)不能后退。2023/7/14109第109頁,課件共130頁,創(chuàng)作于2023年2月(a)中只有兩條路徑,從起點開始,一旦選定路線,就直達(dá)終點,選最優(yōu)路徑就是從兩條中選一條,使路程所用時間最少。這很容易辦到,只稍加計算,便可知道,上面一條所需時間最少。(b)共有6條路徑可到達(dá)終點,若仍用上面方法,需計算6次,將每條路線所需時間求出,然后比較,找出一條時間最短的路程。(c)需計算20次,因為這時有20條路徑,由此可見,計算量顯著增大了。2023/7/14110第110頁,課件共130頁,創(chuàng)作于2023年2月逆向分級計算法

逆向是指計算從后面開始,分級是指逐級計算。逆向分級就是從后向前逐級計算。

以(c)為例

從倒數(shù)第一級開始,狀態(tài)有兩個,分別為

在處,只有一條路到達(dá)終點,其時間是;在

處,也只有一條,時間為1。后一條時間最短,將此時間相應(yīng)地標(biāo)在點上。并將此點到終點的最優(yōu)路徑畫上箭頭。

2023/7/14111第111頁,課件共130頁,創(chuàng)作于2023年2月然后再考慮第二級只有一種選擇,到終點所需時間是有兩條路,比較后選出時間最少的一條,即4+1=5。用箭頭標(biāo)出也標(biāo)出最優(yōu)路徑和時間依此類推,最后計算初始位置求得最優(yōu)路徑最短時間為132023/7/14112第112頁,課件共130頁,創(chuàng)作于2023年2月最優(yōu)路徑示意圖

2023/7/14113第113頁,課件共130頁,創(chuàng)作于2023年2月多級過程

多級決策過程

目標(biāo)函數(shù)控制目的

選擇決策序列

使目標(biāo)函數(shù)取最小值或最大值實際上就是離散狀態(tài)的最優(yōu)控制問題

2023/7/14114第114頁,課件共130頁,創(chuàng)作于2023年2月最優(yōu)性原理

在一個多級決策問題中的最優(yōu)決策具有這樣的性質(zhì),不管初始級、初始狀態(tài)和初始決策是什么,當(dāng)把其中任何一級和狀態(tài)做為初始級和初始狀態(tài)時,余下的決策對此仍是最優(yōu)決策。2023/7/14115第115頁,課件共130頁,創(chuàng)作于2023年2月指標(biāo)函數(shù)多是各級指標(biāo)之和,即具有可加性最優(yōu)性原理的數(shù)學(xué)表達(dá)式2023/7/14116第116頁,課件共130頁,創(chuàng)作于2023年2月5.2離散系統(tǒng)動態(tài)規(guī)劃階離散系統(tǒng)

性能指標(biāo)

求決策向量

使有最小值(或最大值),其終點可自由,也可固定或受約束。2023/7/14117第117頁,課件共130頁,創(chuàng)作于2023年2月引進(jìn)記號

應(yīng)用最優(yōu)性原理

可建立如下遞推公式

貝爾曼動態(tài)規(guī)劃方程

2023/7/1411

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論