最優(yōu)控制理論及應(yīng)用

上傳人：卓*** IP屬地：廣東上傳時間：2023-07-14 格式：PPT 頁數(shù)：130 大小：7.19MB 積分：25 舉報 版權(quán)申訴

已閱讀5頁，還剩125頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

最優(yōu)控制理論及應(yīng)用2023/7/141第1頁，課件共130頁，創(chuàng)作于2023年2月一基本概念最優(yōu)控制理論中心問題：給定一個控制系統(tǒng)（已建立的被控對象的數(shù)學(xué)模型），選擇一個容許的控制律，使被控對象按預(yù)定要求運(yùn)行，并使給定的某一性能指標(biāo)達(dá)到極小值（或極大值）第一章最優(yōu)控制問題的一般概念2023/7/142第2頁，課件共130頁，創(chuàng)作于2023年2月二最優(yōu)控制問題1例子

飛船軟著陸問題宇宙飛船在月球表面著陸時速度必須為零，即軟著陸，這要靠發(fā)動機(jī)的推力變化來完成。問題是如何選擇一個推力方案，使燃料消耗最小。m飛船的質(zhì)量，h高度，v垂直速度，g月球重力加速度常數(shù)，M飛船自身質(zhì)量F燃料的質(zhì)量2023/7/143第3頁，課件共130頁，創(chuàng)作于2023年2月軟著陸過程開始時刻t為零K為常數(shù)，初始狀態(tài)

末端條件

2023/7/144第4頁，課件共130頁，創(chuàng)作于2023年2月性能指標(biāo)控制約束任務(wù)：滿足控制約束條件下，求發(fā)動機(jī)推力的最優(yōu)變化律，使登月艙由初始出發(fā)點到達(dá)目標(biāo)處（末態(tài)），并使性能指標(biāo)達(dá)到極值（燃耗量最?。?023/7/145第5頁，課件共130頁，創(chuàng)作于2023年2月例2火車快速運(yùn)行問題設(shè)火車從甲地出發(fā)，求容許控制，使其到達(dá)乙地時間最短。m火車質(zhì)量；火車加速度；u（t）產(chǎn)生加速度的推力且

火車運(yùn)動方程

2023/7/146第6頁，課件共130頁，創(chuàng)作于2023年2月2問題描述(1)狀態(tài)方程一般形式為為n維狀態(tài)向量為r維控制向量

為n維向量函數(shù)

給定控制規(guī)律

滿足一定條件時，方程有唯一解

2023/7/147第7頁，課件共130頁，創(chuàng)作于2023年2月(2)容許控制：,(3)目標(biāo)集

n維向量函數(shù)

固定端問題自由端問題2023/7/148第8頁，課件共130頁，創(chuàng)作于2023年2月(4)性能指標(biāo)對狀態(tài)、控制以及終點狀態(tài)的要求，復(fù)合型性能指標(biāo)積分型性能指標(biāo)，表示對整個狀態(tài)和控制過程的要求終點型指標(biāo)，表示僅對終點狀態(tài)的要求2023/7/149第9頁，課件共130頁，創(chuàng)作于2023年2月最優(yōu)控制的應(yīng)用類型積分型1）最小時間控制2）最小燃耗控制3）最小能量控制2023/7/1410第10頁，課件共130頁，創(chuàng)作于2023年2月末值型復(fù)合型1）狀態(tài)調(diào)節(jié)器2）輸出跟蹤系統(tǒng)2023/7/1411第11頁，課件共130頁，創(chuàng)作于2023年2月最優(yōu)控制的研究方法解析法：適用于性能指標(biāo)及約束條件有明顯解析式數(shù)值計算方法：性能指標(biāo)比較復(fù)雜1）一維搜索法：適合單變量求極值2）多維搜索法：適合單變量求極值梯度法：解析與數(shù)值方法相結(jié)合1)無約束梯度法2)有約束梯度法2023/7/1412第12頁，課件共130頁，創(chuàng)作于2023年2月第二章最優(yōu)控制中的變分法2.1泛函與變分法基礎(chǔ)平面上兩點連線的長度問題其弧長為2023/7/1413第13頁，課件共130頁，創(chuàng)作于2023年2月一般來說，曲線不同，弧長就不同，即弧長依賴于曲線，記為。，稱為泛函。

，稱泛函的宗量

泛函定義：x(t)是自變量t的函數(shù)，若對每個函數(shù)x(t)，有一個J值與之對應(yīng)，則變量J稱為依賴于x(t)的泛函，記J(x(t))例舉：2023/7/1414第14頁，課件共130頁，創(chuàng)作于2023年2月線性泛函與連續(xù)泛函：線性泛函泛函對宗量是線性的連續(xù)泛函

若定義在線性賦范空間上的泛函又滿足連續(xù)條件，稱J(x)為連續(xù)線性泛函2023/7/1415第15頁，課件共130頁，創(chuàng)作于2023年2月泛函與函數(shù)的幾何解釋

宗量的變分泛函的增量

泛函的變分

Jd=2023/7/1416第16頁，課件共130頁，創(chuàng)作于2023年2月定理2.1泛函的變分為

2023/7/1417第17頁，課件共130頁，創(chuàng)作于2023年2月例2.1求泛函的變分

2023/7/1418第18頁，課件共130頁，創(chuàng)作于2023年2月泛函的極值

定理2.2若泛函有極值，則必有2023/7/1419第19頁，課件共130頁，創(chuàng)作于2023年2月變分學(xué)預(yù)備定理2023/7/1420第20頁，課件共130頁，創(chuàng)作于2023年2月2.2歐拉方程

(1)無約束泛函極值的必要條件

定理2.3設(shè)有如下泛函極值問題：

及橫截條件2023/7/1421第21頁，課件共130頁，創(chuàng)作于2023年2月2.2歐拉方程

變分分部積分

證明：2023/7/1422第22頁，課件共130頁，創(chuàng)作于2023年2月例2.2求平面上兩固定點間連線最短的曲線，直線

2023/7/1423第23頁，課件共130頁，創(chuàng)作于2023年2月例2.3：

已知邊界條件為求使泛函達(dá)到極值的軌線

解：2023/7/1424第24頁，課件共130頁，創(chuàng)作于2023年2月2.2歐拉方程

(2)有等式約束泛函極值的必要條件

定理2.4設(shè)有如下泛函極值問題：

及橫截條件2023/7/1425第25頁，課件共130頁，創(chuàng)作于2023年2月例2.4：設(shè)人造地球衛(wèi)星姿態(tài)控制系統(tǒng)的狀態(tài)方程為2023/7/1426第26頁，課件共130頁，創(chuàng)作于2023年2月

2.3橫截條件

討論：

D.2023/7/1427第27頁，課件共130頁，創(chuàng)作于2023年2月左端固定右端沿曲線變動橫截條件C的推導(dǎo)2023/7/1428第28頁，課件共130頁，創(chuàng)作于2023年2月

2023/7/1429第29頁，課件共130頁，創(chuàng)作于2023年2月

例2.5設(shè)性能指標(biāo)泛函

末值時刻

未定，已知

，解：由歐拉方程得由x(0)=1求出b=1；由橫截條件知2023/7/1430第30頁，課件共130頁，創(chuàng)作于2023年2月2023/7/1431第31頁，課件共130頁，創(chuàng)作于2023年2月2.4含有多個未知函數(shù)泛函的極值泛函

歐拉方程

邊界值

橫截條件

2023/7/1432第32頁，課件共130頁，創(chuàng)作于2023年2月2.5條件極值狀態(tài)方程泛函引進(jìn)乘子構(gòu)造新的函數(shù)和泛函

歐拉方程

約束方程2023/7/1433第33頁，課件共130頁，創(chuàng)作于2023年2月例2.6泛函約束方程邊界條件試求使泛函有極值。解：化為標(biāo)準(zhǔn)形式

把問題化為標(biāo)準(zhǔn)形式，令2023/7/1434第34頁，課件共130頁，創(chuàng)作于2023年2月約束方程可定為邊界條件為2023/7/1435第35頁，課件共130頁，創(chuàng)作于2023年2月引進(jìn)乘子構(gòu)造函數(shù)歐拉方程2023/7/1436第36頁，課件共130頁，創(chuàng)作于2023年2月解出其中，和為任意常數(shù)。代入約束方程，并求解可得將利用邊界條件，可得：2023/7/1437第37頁，課件共130頁，創(chuàng)作于2023年2月于是，極值曲線和為：2023/7/1438第38頁，課件共130頁，創(chuàng)作于2023年2月問題：確定最優(yōu)控制和最優(yōu)軌線，使系統(tǒng)由已知初態(tài)轉(zhuǎn)移到要求的目標(biāo)集

2.6變分法解最優(yōu)控制問題并使指定的目標(biāo)泛函達(dá)到極值2023/7/1439第39頁，課件共130頁，創(chuàng)作于2023年2月2.6.1末端時刻固定時最優(yōu)解的必要條件（1）末端受約束的情況引入拉格朗日乘子構(gòu)造廣義泛函

有構(gòu)造哈米頓函數(shù)2023/7/1440第40頁，課件共130頁，創(chuàng)作于2023年2月變分2023/7/1441第41頁，課件共130頁，創(chuàng)作于2023年2月

定理2.5：對于如下最優(yōu)控制問題：u(t)無約束，tf固定.最優(yōu)解的必要條件2023/7/1442第42頁，課件共130頁，創(chuàng)作于2023年2月

定理2.6：對于如下最優(yōu)控制問題：u(t)無約束，tf固定，x(tf)自由.最優(yōu)解的必要條件（2）末端自由的情況2023/7/1443第43頁，課件共130頁，創(chuàng)作于2023年2月

定理2.7：對于如下最優(yōu)控制問題：u(t)無約束，tf固定，x(tf)固定.最優(yōu)解的必要條件（3）末端固定的情況2023/7/1444第44頁，課件共130頁，創(chuàng)作于2023年2月例2.7考慮狀態(tài)方程和初始條件為的簡單一階系統(tǒng)，其指標(biāo)泛函為，使其中，給定，試求最優(yōu)控制有極小值。0t，2023/7/1445第45頁，課件共130頁，創(chuàng)作于2023年2月，伴隨方程

邊界條件由必要條件解:引進(jìn)伴隨變量，構(gòu)造哈米頓函數(shù)2023/7/1446第46頁，課件共130頁，創(chuàng)作于2023年2月則最優(yōu)控制為得代入狀態(tài)方程求解得令，則有2023/7/1447第47頁，課件共130頁，創(chuàng)作于2023年2月邊界條件指標(biāo)泛函

哈米頓函數(shù)

伴隨方程，

例2.8重解例2.4

其解為2023/7/1448第48頁，課件共130頁，創(chuàng)作于2023年2月

2023/7/1449第49頁，課件共130頁，創(chuàng)作于2023年2月習(xí)題1：設(shè)一階系統(tǒng)方程為性能指標(biāo)取為式中常數(shù)試求使J取極小值的最優(yōu)控制和相應(yīng)的性能指標(biāo)習(xí)題2：設(shè)二階系統(tǒng)方程為性能指標(biāo)取為求系統(tǒng)由已知初態(tài)在轉(zhuǎn)移到目標(biāo)集且使J取極小的最優(yōu)控制和最優(yōu)軌跡2023/7/1450第50頁，課件共130頁，創(chuàng)作于2023年2月2.6.2末端時刻自由的最優(yōu)解問題tf有時是可變的，是指標(biāo)泛函，選控制使有tf極小值

變分2023/7/1451第51頁，課件共130頁，創(chuàng)作于2023年2月

，必要條件2023/7/1452第52頁，課件共130頁，創(chuàng)作于2023年2月例2.7

指標(biāo)泛函

哈米頓函數(shù)

伴隨方程

必要條件2023/7/1453第53頁，課件共130頁，創(chuàng)作于2023年2月第三章最大值原理3.1古典變分法的局限性u(t)受限的例子矛盾!!例3.1伴隨方程極值必要條件2023/7/1454第54頁，課件共130頁，創(chuàng)作于2023年2月3.2最大值原理且定理3.1(最小值原理)設(shè)為容許控制，為對應(yīng)的積分軌線，為使為最優(yōu)控制，為最優(yōu)軌線，必存在一向量函數(shù)，使得和滿足正則方程2023/7/1455第55頁，課件共130頁，創(chuàng)作于2023年2月最小值原理只是最優(yōu)控制所滿足的必要條件。但對于線性系統(tǒng)，最小值原理也是使泛函取最小值得充分條件。2023/7/1456第56頁，課件共130頁，創(chuàng)作于2023年2月例3.2重解例3.1

，哈密頓函數(shù)伴隨方程

由極值必要條件，知

，

又于是有2023/7/1457第57頁，課件共130頁，創(chuàng)作于2023年2月，

協(xié)態(tài)變量與控制變量的關(guān)系圖

2023/7/1458第58頁，課件共130頁，創(chuàng)作于2023年2月,，例3.3性能指標(biāo)泛函

哈密頓函數(shù)伴隨方程，

2023/7/1459第59頁，課件共130頁，創(chuàng)作于2023年2月上有

2023/7/1460第60頁，課件共130頁，創(chuàng)作于2023年2月協(xié)態(tài)變量與控制變量的關(guān)系圖

整個最優(yōu)軌線

2023/7/1461第61頁，課件共130頁，創(chuàng)作于2023年2月例3.4

把系統(tǒng)狀態(tài)在終點時刻轉(zhuǎn)移到性能指標(biāo)泛函

終點時刻是不固定的

哈米頓函數(shù)

伴隨方程

，，

2023/7/1462第62頁，課件共130頁，創(chuàng)作于2023年2月H是u的二次拋物線函數(shù)，u在上一定使H有最小值，可能在內(nèi)部，也可能在邊界上。最優(yōu)控制可能且只能取三個值

此二者都不能使?fàn)顟B(tài)變量同時滿足初始條件和終點條件

2023/7/1463第63頁，課件共130頁，創(chuàng)作于2023年2月

，，

最優(yōu)控制最優(yōu)軌線

最優(yōu)性能指標(biāo)

2023/7/1464第64頁，課件共130頁，創(chuàng)作于2023年2月例3.5

使系統(tǒng)以最短時間從給定初態(tài)轉(zhuǎn)移到零態(tài)

哈米頓函數(shù)

伴隨方程

2023/7/1465第65頁，課件共130頁，創(chuàng)作于2023年2月最優(yōu)控制切換及最優(yōu)軌線示意圖

2023/7/1466第66頁，課件共130頁，創(chuàng)作于2023年2月3.3古典變分法與最小值原理古典變分法適用的范圍是對u無約束，而最小值原理一般都適用。特別當(dāng)u不受約束時，條件就等價于條件2023/7/1467第67頁，課件共130頁，創(chuàng)作于2023年2月

3.4極大值原理的應(yīng)用：快速控制系統(tǒng)在實際問題中，經(jīng)常發(fā)生以時間為性能指標(biāo)的控制問題。如，當(dāng)被控對象受干擾后，偏離了平衡狀態(tài)，希望施加控制能以最短時間恢復(fù)到平衡狀態(tài)。凡是以運(yùn)動時間為性能指標(biāo)的最優(yōu)控制問題稱為最小時間控制。2023/7/1468第68頁，課件共130頁，創(chuàng)作于2023年2月3.4.1快速控制問題性能指標(biāo)

時間上限是可變的從狀態(tài)轉(zhuǎn)移平衡狀態(tài)所需時間最短構(gòu)造哈密頓函數(shù)

最小值原理

分段常值函數(shù)2023/7/1469第69頁，課件共130頁，創(chuàng)作于2023年2月例3.4.1有一單位質(zhì)點，在處以初速度2沿直線運(yùn)動?，F(xiàn)施加一力，，使質(zhì)點盡快返回原點，并停留在原點上。力簡稱為控制。若其它阻力不計，試求此控制力。質(zhì)點運(yùn)動方程

狀態(tài)方程哈密頓函數(shù)伴隨方程

2023/7/1470第70頁，課件共130頁，創(chuàng)作于2023年2月最優(yōu)控制

協(xié)態(tài)變量與控制函數(shù)4種情況示意圖2023/7/1471第71頁，課件共130頁，創(chuàng)作于2023年2月相軌線族示意圖開關(guān)曲線2023/7/1472第72頁，課件共130頁，創(chuàng)作于2023年2月開關(guān)曲線總時間初始狀態(tài)最優(yōu)控制狀態(tài)方程相軌線最優(yōu)控制

2023/7/1473第73頁，課件共130頁，創(chuàng)作于2023年2月3.4.2綜合問題

綜合是將最優(yōu)控制函數(shù)表示為狀態(tài)和時間的函數(shù)即上例之最優(yōu)綜合控制函數(shù)2023/7/1474第74頁，課件共130頁，創(chuàng)作于2023年2月例3.4.2

求快速返回原點的開關(guān)曲線和最優(yōu)綜合控制函數(shù)

構(gòu)造哈密頓函數(shù)

伴隨方程

最優(yōu)控制

2023/7/1475第75頁，課件共130頁，創(chuàng)作于2023年2月最優(yōu)控制與協(xié)態(tài)變量的變化情況

控制是“砰砰控制”，除了首尾之外，在和上的停留時間均為2023/7/1476第76頁，課件共130頁，創(chuàng)作于2023年2月備選最優(yōu)軌線族

兩族同心圓方程2023/7/1477第77頁，課件共130頁，創(chuàng)作于2023年2月相點沿軌線順時針方向運(yùn)動，其速度為開關(guān)曲線

2023/7/1478第78頁，課件共130頁，創(chuàng)作于2023年2月第二段開關(guān)曲線2023/7/1479第79頁，課件共130頁，創(chuàng)作于2023年2月整個開關(guān)曲線

2023/7/1480第80頁，課件共130頁，創(chuàng)作于2023年2月最優(yōu)綜合控制函數(shù)

2023/7/1481第81頁，課件共130頁，創(chuàng)作于2023年2月第四章線性二次型性能指標(biāo)的最優(yōu)控制用最大值原理求最優(yōu)控制，求出的最優(yōu)控制通常是時間的函數(shù)，這樣的控制為開環(huán)控制當(dāng)用開環(huán)控制時，在控制過程中不允許有任何干擾，這樣才能使系統(tǒng)以最優(yōu)狀態(tài)運(yùn)行。在實際問題中，干擾不可能沒有，因此工程上總希望應(yīng)用閉環(huán)控制，即控制函數(shù)表示成時間和狀態(tài)的函數(shù)。求解這樣的問題一般來說是很困難的。。2023/7/1482第82頁，課件共130頁，創(chuàng)作于2023年2月但對一類線性的且指標(biāo)是二次型的動態(tài)系統(tǒng)，卻得了完全的解決。不但理論比較完善，數(shù)學(xué)處理簡單，而且在工際中又容易實現(xiàn)，因而在工程中有著廣泛的應(yīng)用。2023/7/1483第83頁，課件共130頁，創(chuàng)作于2023年2月4.1問題提法動態(tài)方程

指標(biāo)泛函

使求有最小值此問題稱線性二次型性能指標(biāo)的最優(yōu)控制問題通常稱為綜合控制函數(shù)2023/7/1484第84頁，課件共130頁，創(chuàng)作于2023年2月指標(biāo)泛函的物理意義積分項，被積函數(shù)由兩項組成，都是二次型。第一項過程在控制過程中，實際上是要求每個分量越小越好，但每一個分量不一定同等重要，所以用加權(quán)來調(diào)整，當(dāng)權(quán)為零時，對該項無要求。第二項控制能力能量消耗最小。對每個分量要求不一樣，因而進(jìn)行加權(quán)。要求正定，一方面對每個分量都應(yīng)有要求，否則會出現(xiàn)很大幅值，在實際工程中實現(xiàn)不了；另一方面，在計算中需要有逆存在。指標(biāo)中的第一項是對點狀態(tài)的要求，由于對每個分量要求不同，用加權(quán)陣來調(diào)整。2023/7/1485第85頁，課件共130頁，創(chuàng)作于2023年2月4.2.1末端自由問題構(gòu)造哈密頓函數(shù)

伴隨方程及邊界條件最優(yōu)控制應(yīng)滿足4.2狀態(tài)調(diào)節(jié)器2023/7/1486第86頁，課件共130頁，創(chuàng)作于2023年2月求導(dǎo)2023/7/1487第87頁，課件共130頁，創(chuàng)作于2023年2月（矩陣?yán)杩ㄌ嵛⒎址匠蹋?/p>

邊界條件

令最優(yōu)控制是狀態(tài)變量的線性函數(shù)借助狀態(tài)變量的線性反饋可實現(xiàn)閉環(huán)最優(yōu)控制最優(yōu)控制

對稱半正定陣2023/7/1488第88頁，課件共130頁，創(chuàng)作于2023年2月例4.1

性能指標(biāo)泛函

最優(yōu)控制黎卡提微分方程2023/7/1489第89頁，課件共130頁，創(chuàng)作于2023年2月最優(yōu)軌線

最優(yōu)控制最優(yōu)軌線的微分方程

解

2023/7/1490第90頁，課件共130頁，創(chuàng)作于2023年2月黎卡提方程的解

隨終點時間變化的黎卡提方程的解2023/7/1491第91頁，課件共130頁，創(chuàng)作于2023年2月4.2.2固定端問題（設(shè)）指標(biāo)泛函

采用“補(bǔ)償函數(shù)”法

補(bǔ)償函數(shù)懲罰函數(shù)

邊界條件

黎卡提方程

逆黎卡提方程

2023/7/1492第92頁，課件共130頁，創(chuàng)作于2023年2月求導(dǎo)

黎卡提方程乘以逆黎卡提方程

解逆2023/7/1493第93頁，課件共130頁，創(chuàng)作于2023年2月4.2.3

的情況性能指標(biāo)無限長時間調(diào)節(jié)器問題

黎卡提方程

邊界條件最優(yōu)控制最優(yōu)指標(biāo)

2023/7/1494第94頁，課件共130頁，創(chuàng)作于2023年2月4.2.4定常系統(tǒng)完全可控

指標(biāo)泛函矩陣代數(shù)方程

最優(yōu)控制最優(yōu)指標(biāo)

2023/7/1495第95頁，課件共130頁，創(chuàng)作于2023年2月例4.2

黎卡提方程

2023/7/1496第96頁，課件共130頁，創(chuàng)作于2023年2月4.3輸出調(diào)節(jié)器輸出調(diào)節(jié)器問題狀態(tài)調(diào)節(jié)器問題指標(biāo)泛函

令2023/7/1497第97頁，課件共130頁，創(chuàng)作于2023年2月4.4跟蹤問題問題的提法

已知的理想輸出

偏差量

指標(biāo)泛函

尋求控制規(guī)律使性能指標(biāo)有極小值。物理意義在控制過程中，使系統(tǒng)輸出盡量趨近理想輸出，同時也使能量消耗最少。2023/7/1498第98頁，課件共130頁，創(chuàng)作于2023年2月指標(biāo)泛函

哈密頓函數(shù)2023/7/1499第99頁，課件共130頁，創(chuàng)作于2023年2月設(shè)并微分2023/7/14100第100頁，課件共130頁，創(chuàng)作于2023年2月的任意性

最優(yōu)控制2023/7/14101第101頁，課件共130頁，創(chuàng)作于2023年2月最優(yōu)軌線方程

最優(yōu)性能指標(biāo)

2023/7/14102第102頁，課件共130頁，創(chuàng)作于2023年2月例4.3

，性能指標(biāo)

2023/7/14103第103頁，課件共130頁，創(chuàng)作于2023年2月最優(yōu)控制

2023/7/14104第104頁，課件共130頁，創(chuàng)作于2023年2月，，最優(yōu)控制

極限解2023/7/14105第105頁，課件共130頁，創(chuàng)作于2023年2月閉環(huán)控制系統(tǒng)結(jié)構(gòu)2023/7/14106第106頁，課件共130頁，創(chuàng)作于2023年2月兩種方法

龐特里雅金

前蘇聯(lián)學(xué)者

極大值原理

貝爾曼

美國學(xué)者

動態(tài)規(guī)劃應(yīng)用在過程控制、國防建設(shè)、經(jīng)濟(jì)規(guī)劃、管理

多個分支分布參數(shù)的最優(yōu)控制、隨機(jī)最優(yōu)控制、大系統(tǒng)最優(yōu)控制以及多方多層次的微分對策和主從對策等

返回2023/7/14107第107頁，課件共130頁，創(chuàng)作于2023年2月第五章動態(tài)規(guī)劃

動態(tài)規(guī)劃是求解最優(yōu)控制的又一種方法，特別對離散型控制系統(tǒng)更為有效，而且得出的是綜合控制函數(shù)。這種方法來源于多決策過程，并由貝爾曼首先提出，故稱貝爾曼動態(tài)規(guī)劃。

2023/7/14108第108頁，課件共130頁，創(chuàng)作于2023年2月5.1多級決策過程與最優(yōu)性原理作為例子，首先分析最優(yōu)路徑問題(a)(b)(c)試分析(a),(b)和(c)三種情況的最優(yōu)路徑，即從走到所需時間最少。規(guī)定沿水平方向只能前進(jìn)不能后退。2023/7/14109第109頁，課件共130頁，創(chuàng)作于2023年2月(a)中只有兩條路徑，從起點開始，一旦選定路線，就直達(dá)終點，選最優(yōu)路徑就是從兩條中選一條，使路程所用時間最少。這很容易辦到，只稍加計算，便可知道，上面一條所需時間最少。(b)共有6條路徑可到達(dá)終點，若仍用上面方法，需計算6次，將每條路線所需時間求出，然后比較，找出一條時間最短的路程。(c)需計算20次，因為這時有20條路徑，由此可見，計算量顯著增大了。2023/7/14110第110頁，課件共130頁，創(chuàng)作于2023年2月逆向分級計算法

逆向是指計算從后面開始，分級是指逐級計算。逆向分級就是從后向前逐級計算。

以(c)為例

從倒數(shù)第一級開始，狀態(tài)有兩個，分別為

和

在處，只有一條路到達(dá)終點，其時間是；在

處，也只有一條，時間為1。后一條時間最短，將此時間相應(yīng)地標(biāo)在點上。并將此點到終點的最優(yōu)路徑畫上箭頭。

2023/7/14111第111頁，課件共130頁，創(chuàng)作于2023年2月然后再考慮第二級只有一種選擇，到終點所需時間是有兩條路，比較后選出時間最少的一條，即4+1=5。用箭頭標(biāo)出也標(biāo)出最優(yōu)路徑和時間依此類推，最后計算初始位置求得最優(yōu)路徑最短時間為132023/7/14112第112頁，課件共130頁，創(chuàng)作于2023年2月最優(yōu)路徑示意圖

2023/7/14113第113頁，課件共130頁，創(chuàng)作于2023年2月多級過程

多級決策過程

目標(biāo)函數(shù)控制目的

選擇決策序列

使目標(biāo)函數(shù)取最小值或最大值實際上就是離散狀態(tài)的最優(yōu)控制問題

2023/7/14114第114頁，課件共130頁，創(chuàng)作于2023年2月最優(yōu)性原理

在一個多級決策問題中的最優(yōu)決策具有這樣的性質(zhì)，不管初始級、初始狀態(tài)和初始決策是什么，當(dāng)把其中任何一級和狀態(tài)做為初始級和初始狀態(tài)時，余下的決策對此仍是最優(yōu)決策。2023/7/14115第115頁，課件共130頁，創(chuàng)作于2023年2月指標(biāo)函數(shù)多是各級指標(biāo)之和，即具有可加性最優(yōu)性原理的數(shù)學(xué)表達(dá)式2023/7/14116第116頁，課件共130頁，創(chuàng)作于2023年2月5.2離散系統(tǒng)動態(tài)規(guī)劃階離散系統(tǒng)

性能指標(biāo)

求決策向量

使有最小值（或最大值），其終點可自由，也可固定或受約束。2023/7/14117第117頁，課件共130頁，創(chuàng)作于2023年2月引進(jìn)記號

應(yīng)用最優(yōu)性原理

可建立如下遞推公式

貝爾曼動態(tài)規(guī)劃方程

2023/7/1411

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最優(yōu)控制理論及應(yīng)用

文檔簡介

溫馨提示

最新文檔

評論

最優(yōu)控制理論及應(yīng)用

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔