3.2最優(yōu)控制理論ppt課件_第1頁
3.2最優(yōu)控制理論ppt課件_第2頁
3.2最優(yōu)控制理論ppt課件_第3頁
3.2最優(yōu)控制理論ppt課件_第4頁
3.2最優(yōu)控制理論ppt課件_第5頁
已閱讀5頁,還剩115頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、最優(yōu)控制理論主講:羅文廣授課內(nèi)容1、最優(yōu)控制概述2、最優(yōu)控制中的變分法3、極小值原理及其應(yīng)用4、動(dòng)態(tài)規(guī)劃5、線性最優(yōu)狀態(tài)調(diào)節(jié)器6、線性最優(yōu)輸出調(diào)節(jié)器與跟蹤系統(tǒng)考核方式一、小設(shè)計(jì)論文30) 1、選題:每人自選一個(gè)與最優(yōu)控制相關(guān)的實(shí)際小問題,在小組討論中初步確定選題。小組45人,自行成立。2、解題:通過建模、編程和仿真,獲得問題的最優(yōu)解;或者通過制作實(shí)物、編程,對(duì)對(duì)象實(shí)現(xiàn)最優(yōu)控制。3、論文:通過以上工作,完成一篇小論文。論文撰寫格式按照廣西工學(xué)院學(xué)報(bào)的格式要求。4、報(bào)告和答辯:每人約用10分鐘對(duì)所做選題進(jìn)行匯報(bào)和答辯5、時(shí)間要求: 題目確定:第6周,個(gè)人上交自擬的題目。 答辯時(shí)間:12周以后。 最

2、后完成時(shí)間:本學(xué)期最后一周。6、上交材料:(1編制的程序、仿真結(jié)果,或制作的實(shí)物;(2小論文。由班長(zhǎng)統(tǒng)一上交含統(tǒng)計(jì)表)二、考試70) 開卷方式第1章 導(dǎo)論 1.1 引言一、現(xiàn)代控制理論一、現(xiàn)代控制理論 現(xiàn)代控制理論是研究系統(tǒng)狀態(tài)的控制和觀測(cè)的理論,主要包括現(xiàn)代控制理論是研究系統(tǒng)狀態(tài)的控制和觀測(cè)的理論,主要包括5 5個(gè)方個(gè)方面:面: 1 1、線性系統(tǒng)理論:研究線性系統(tǒng)的性質(zhì),能觀性、能控性、穩(wěn)定性、線性系統(tǒng)理論:研究線性系統(tǒng)的性質(zhì),能觀性、能控性、穩(wěn)定性等。以狀態(tài)空間法為主要工具研究多變量線性系統(tǒng)的理論。等。以狀態(tài)空間法為主要工具研究多變量線性系統(tǒng)的理論。 2 2、系統(tǒng)辨識(shí):根據(jù)輸入、輸出觀測(cè)確

3、定系統(tǒng)數(shù)學(xué)模型。、系統(tǒng)辨識(shí):根據(jù)輸入、輸出觀測(cè)確定系統(tǒng)數(shù)學(xué)模型。 3 3、最優(yōu)控制:尋找最優(yōu)控制向量、最優(yōu)控制:尋找最優(yōu)控制向量u(t)u(t)。根據(jù)給定的目標(biāo)函數(shù)和約束。根據(jù)給定的目標(biāo)函數(shù)和約束條件條件, ,尋求最優(yōu)的控制規(guī)律的問題。尋求最優(yōu)的控制規(guī)律的問題。 4 4、最佳濾波卡爾曼濾波、最優(yōu)估計(jì)):存在噪聲情況下,如何根、最佳濾波卡爾曼濾波、最優(yōu)估計(jì)):存在噪聲情況下,如何根據(jù)輸入、輸出估計(jì)狀態(tài)變量。據(jù)輸入、輸出估計(jì)狀態(tài)變量。 5 5、適應(yīng)控制:利用辨識(shí)系統(tǒng)動(dòng)態(tài)特性的方法隨時(shí)調(diào)整控制規(guī)律以實(shí)、適應(yīng)控制:利用辨識(shí)系統(tǒng)動(dòng)態(tài)特性的方法隨時(shí)調(diào)整控制規(guī)律以實(shí)現(xiàn)最優(yōu)控制,即在參數(shù)擾動(dòng)情況下,控制器的設(shè)

4、計(jì)問題。現(xiàn)最優(yōu)控制,即在參數(shù)擾動(dòng)情況下,控制器的設(shè)計(jì)問題。 把魯棒控制、預(yù)測(cè)控制均納入到現(xiàn)代控制理論的范疇。把魯棒控制、預(yù)測(cè)控制均納入到現(xiàn)代控制理論的范疇。第1章 導(dǎo)論 1.1 引言 二、最優(yōu)控制的發(fā)展簡(jiǎn)史先期工作:1948年,維納(N.Wiener)發(fā)表控制論,引進(jìn)了信息、反饋和控制等重要概念,奠定了控制論(Cybernetics)的基礎(chǔ)。并提出了相對(duì)于某一性能指標(biāo)進(jìn)行最優(yōu)設(shè)計(jì)的概念。1950年,米頓納爾(Medona1)首先將這個(gè)概念用于研究繼電器系統(tǒng)在單位階躍作用下的過渡過程的時(shí)間最短最優(yōu)控制問題。1954年,錢學(xué)森編著工程控制論(上下冊(cè)),作者系統(tǒng)地揭示了控制論對(duì)自動(dòng)化、航空、航天、電

5、子通信等科學(xué)技術(shù)的意義和重大影響。其中“最優(yōu)開關(guān)曲線等素材,直接促進(jìn)了最優(yōu)控制理論的形成和發(fā)展。第1章 導(dǎo)論 1.1 引言n理論形成階段:理論形成階段:n 自動(dòng)控制聯(lián)合會(huì)自動(dòng)控制聯(lián)合會(huì)(IFAC)(IFAC)第一屆世界大會(huì)于第一屆世界大會(huì)于19601960年召開年召開, ,卡爾曼卡爾曼KalmanKalman)、貝爾曼)、貝爾曼R.BellmanR.Bellman和龐特里亞金和龐特里亞金PontryaginPontryagin分分別在會(huì)上作了別在會(huì)上作了“控制系統(tǒng)的一般理論控制系統(tǒng)的一般理論”、“動(dòng)態(tài)規(guī)劃動(dòng)態(tài)規(guī)劃和和“最優(yōu)控制最優(yōu)控制理論理論的報(bào)告的報(bào)告, ,宣告了最優(yōu)控制理論的誕生宣告了最優(yōu)

6、控制理論的誕生, ,人們也稱這三個(gè)工作是現(xiàn)人們也稱這三個(gè)工作是現(xiàn)代控制理論的三個(gè)里程碑。代控制理論的三個(gè)里程碑。n1953195319571957年,貝爾曼年,貝爾曼(R.E.Bellman)(R.E.Bellman)創(chuàng)建創(chuàng)建“動(dòng)態(tài)規(guī)劃動(dòng)態(tài)規(guī)劃原理。原理。為了解決多階段決策過程逐步創(chuàng)立的,依據(jù)最優(yōu)化原理,用一組基本為了解決多階段決策過程逐步創(chuàng)立的,依據(jù)最優(yōu)化原理,用一組基本的遞推關(guān)系式使過程連續(xù)地最優(yōu)轉(zhuǎn)移。的遞推關(guān)系式使過程連續(xù)地最優(yōu)轉(zhuǎn)移?!皠?dòng)態(tài)規(guī)劃動(dòng)態(tài)規(guī)劃對(duì)于研究最優(yōu)控對(duì)于研究最優(yōu)控制理論的重要性,表現(xiàn)于可得出離散時(shí)間系統(tǒng)的理論結(jié)果和迭代算法。制理論的重要性,表現(xiàn)于可得出離散時(shí)間系統(tǒng)的理論結(jié)

7、果和迭代算法。n 第1章 導(dǎo)論n1 9 5 61 9 5 6 1 9 5 81 9 5 8 年 , 龐 特 里 亞 金 創(chuàng) 立年 , 龐 特 里 亞 金 創(chuàng) 立 “ 極 小 值 原 理極 小 值 原 理 ” 。它是最優(yōu)控制理論的主要組成部分和該理論發(fā)展史上的一個(gè)里程碑。它是最優(yōu)控制理論的主要組成部分和該理論發(fā)展史上的一個(gè)里程碑。對(duì)于對(duì)于“最大值原理最大值原理”,由于放寬了有關(guān)條件的使得許多古典變分法和,由于放寬了有關(guān)條件的使得許多古典變分法和動(dòng)態(tài)規(guī)劃方法無法解決的工程技術(shù)問題得到解決,所以它是解決最優(yōu)動(dòng)態(tài)規(guī)劃方法無法解決的工程技術(shù)問題得到解決,所以它是解決最優(yōu)控制問題的一種最普遍的有效的方法。

8、同時(shí),龐特里亞金在控制問題的一種最普遍的有效的方法。同時(shí),龐特里亞金在 著作中已經(jīng)把最優(yōu)控制理論初步形成了一個(gè)完整的體著作中已經(jīng)把最優(yōu)控制理論初步形成了一個(gè)完整的體系。系。n此外,構(gòu)成最優(yōu)控制理論及現(xiàn)代最優(yōu)化技術(shù)理論基礎(chǔ)的代表性工作,此外,構(gòu)成最優(yōu)控制理論及現(xiàn)代最優(yōu)化技術(shù)理論基礎(chǔ)的代表性工作, 還有不等式約束條件下的非線性最優(yōu)必要條件還有不等式約束條件下的非線性最優(yōu)必要條件( (庫恩庫恩圖克定理圖克定理) )以及以及卡 爾 曼 的 關(guān) 于 隨 機(jī) 控 制 系 統(tǒng) 最 優(yōu) 濾 波 器 等 。卡 爾 曼 的 關(guān) 于 隨 機(jī) 控 制 系 統(tǒng) 最 優(yōu) 濾 波 器 等 。第1章 導(dǎo)論 1.2 最優(yōu)控制問

9、題一、問題的描述已知被控系統(tǒng)的狀態(tài)方程以及給定的初始狀態(tài)規(guī)定的目標(biāo)集為S(例如 )求一容許控制 ,使系統(tǒng)在該控制的作用下由初態(tài)出發(fā),在某個(gè)大于t0 的終端時(shí)刻tf 達(dá)到目標(biāo)集S上,并使性能指標(biāo) 達(dá)到最小。,),(0fttttfuxx0 xx)(0tnptSpf, 0),(RxxrUufttffdtttutxLttxuJ0),(),(),()(第1章 導(dǎo)論 1.2 最優(yōu)控制問題從以上最優(yōu)控制問題的描述中可見:從以上最優(yōu)控制問題的描述中可見:1 1、有一個(gè)被控對(duì)象系統(tǒng)數(shù)學(xué)模型)、有一個(gè)被控對(duì)象系統(tǒng)數(shù)學(xué)模型) 它通常由常微分方程組描述的動(dòng)態(tài)模型來表征,即它通常由常微分方程組描述的動(dòng)態(tài)模型來表征,即

10、其初態(tài)一般是給定的,即其初態(tài)一般是給定的,即2 2、有一目標(biāo)集及邊界條件、有一目標(biāo)集及邊界條件 目標(biāo)集:在控制目標(biāo)集:在控制u u的作用下,把被控對(duì)象的初態(tài)的作用下,把被控對(duì)象的初態(tài)x0 x0在某個(gè)在某個(gè)終端時(shí)刻轉(zhuǎn)移到某個(gè)終端狀態(tài)終端時(shí)刻轉(zhuǎn)移到某個(gè)終端狀態(tài)x(tf)x(tf)。 x(tf)x(tf)通常受幾何通常受幾何約束。例如考慮它是一個(gè)點(diǎn)集,在約束條件約束。例如考慮它是一個(gè)點(diǎn)集,在約束條件 下下 目標(biāo)集為目標(biāo)集為,),(0fttttfuxx0 xx)(0t0),(ftxnptSpf, 0),(Rxx第1章 導(dǎo)論 1.2 最優(yōu)控制問題邊界條件:邊界條件:初始狀態(tài):初始時(shí)刻初始狀態(tài):初始時(shí)刻t

11、0t0和和x(t0),x(t0),通常是已知的。通常是已知的。末端狀態(tài):末端時(shí)刻末端狀態(tài):末端時(shí)刻tftf和和x(tf) x(tf) ,通常是未知的。,通常是未知的。3 3、容許控制集、容許控制集控制向量控制向量u u的各個(gè)分量的各個(gè)分量uiui往往是具有不同物理屬性的控制量。往往是具有不同物理屬性的控制量。在實(shí)際控制問題中,大多數(shù)控制量受客觀條件的限制只能在實(shí)際控制問題中,大多數(shù)控制量受客觀條件的限制只能取值于一定的范圍,將控制約束條件的點(diǎn)集稱為控制取值于一定的范圍,將控制約束條件的點(diǎn)集稱為控制域域 ,則將在閉區(qū)間,則將在閉區(qū)間t0,tft0,tf上有定義,且在控制域內(nèi)上有定義,且在控制域內(nèi)

12、取值的每個(gè)控制函數(shù)取值的每個(gè)控制函數(shù)u(t)u(t)稱為容許控制,記做稱為容許控制,記做u第1章 導(dǎo)論 1.2 最優(yōu)控制問題4 4、性能指標(biāo)、性能指標(biāo) 為了能在各種控制律中尋找到效果最好的控制,需要建立為了能在各種控制律中尋找到效果最好的控制,需要建立一種評(píng)價(jià)控制效果好壞或控制品質(zhì)優(yōu)劣的性能指標(biāo)函數(shù)。一種評(píng)價(jià)控制效果好壞或控制品質(zhì)優(yōu)劣的性能指標(biāo)函數(shù)。又稱代價(jià)本錢,目的函數(shù)或泛函,記做又稱代價(jià)本錢,目的函數(shù)或泛函,記做 ,它是一個(gè)依賴于控制的有限實(shí)數(shù),一般的表達(dá)式為:它是一個(gè)依賴于控制的有限實(shí)數(shù),一般的表達(dá)式為: 該表達(dá)式包括了依賴于終端時(shí)刻該表達(dá)式包括了依賴于終端時(shí)刻tftf和終端狀態(tài)和終端狀

13、態(tài)x(tf)x(tf)的末的末值型項(xiàng),以及依賴于這個(gè)控制過程的積分型項(xiàng)。因而,可值型項(xiàng),以及依賴于這個(gè)控制過程的積分型項(xiàng)。因而,可將最優(yōu)控制問題的性能指標(biāo)分為:混合型、末值型和積分將最優(yōu)控制問題的性能指標(biāo)分為:混合型、末值型和積分型。不同的控制問題,應(yīng)取不同的性能指標(biāo):型。不同的控制問題,應(yīng)取不同的性能指標(biāo): )(uJfttffdtttutxLttxuJ0),(),(),()(第1章 導(dǎo)論 1.2 最優(yōu)控制問題(1 1積分型性能指標(biāo):積分型性能指標(biāo): a.a.最短時(shí)間控制:最短時(shí)間控制: b.b.最少燃燒控制:最少燃燒控制: c.c.最小能量控制最小能量控制: :(2 2末值型性能指標(biāo)末值型性

14、能指標(biāo)(3 3混合型性能指標(biāo)混合型性能指標(biāo)fttfttdtuJttutxL00)(, 1),(),(fttdtttutxLuJ0),(),()(mjjtuttutxL1)(),(),( fttmjjdttuJ01)(fttTdttutuJ0)()()()(),(),(tututtutxLT),()(ffttxuJfttffdtttutxLttxuJ0),(),(),()(第1章 導(dǎo)論 1.2 最優(yōu)控制問題二、對(duì)最優(yōu)控制問題的進(jìn)一步說明二、對(duì)最優(yōu)控制問題的進(jìn)一步說明 如果最優(yōu)控制問題有解,即如果最優(yōu)控制問題有解,即: :使使 達(dá)到極小值的控制達(dá)到極小值的控制函數(shù)存在,記為函數(shù)存在,記為 ,稱為最

15、優(yōu)控制;,稱為最優(yōu)控制;相應(yīng)的狀態(tài)軌跡相應(yīng)的狀態(tài)軌跡x x* *(t)(t)稱為最優(yōu)軌跡;性能指標(biāo)稱為最優(yōu)軌跡;性能指標(biāo) 稱為最優(yōu)性能指標(biāo)。稱為最優(yōu)性能指標(biāo)。三、舉例三、舉例 月球上的軟著陸問題最小燃耗問題)月球上的軟著陸問題最小燃耗問題))(uJ)(*uJJ,)(0*fttttu飛船靠其發(fā)動(dòng)機(jī)產(chǎn)生一與月球重力方向相反的推力飛船靠其發(fā)動(dòng)機(jī)產(chǎn)生一與月球重力方向相反的推力u(t)u(t),以使飛船在月球表面實(shí)現(xiàn)軟著陸,要尋求發(fā),以使飛船在月球表面實(shí)現(xiàn)軟著陸,要尋求發(fā)動(dòng)機(jī)推力的最優(yōu)控制規(guī)律,以便使燃料的消耗為最動(dòng)機(jī)推力的最優(yōu)控制規(guī)律,以便使燃料的消耗為最少。少。第1章 導(dǎo)論 1.2 最優(yōu)控制問題設(shè)飛

16、船質(zhì)量為設(shè)飛船質(zhì)量為m(t)m(t),高度為,高度為h(t)h(t),垂直速度為,垂直速度為v(t)v(t),發(fā)動(dòng)機(jī)推力為,發(fā)動(dòng)機(jī)推力為u(t)u(t),月球表面的重力加,月球表面的重力加速度為常數(shù)速度為常數(shù)g g。設(shè)不帶燃料的飛船質(zhì)量為。設(shè)不帶燃料的飛船質(zhì)量為M M, 初初始燃料的總質(zhì)量為始燃料的總質(zhì)量為F F初始高度為初始高度為h0h0,初始的垂,初始的垂直速度為直速度為v0v0,那么飛船的運(yùn)動(dòng)方程式可以表示為:,那么飛船的運(yùn)動(dòng)方程式可以表示為:)()()()()()()(tkutmtmtugtvtvth初始條件 FMmvvhh)0()0()0(00終端條件終端條件 0)(0)(fftvt

17、h性能指標(biāo)是使燃料消耗為最小,即性能指標(biāo)是使燃料消耗為最小,即 約束條件)(0tu)(ftmJ 達(dá)到最大值 第2章 最優(yōu)控制中的變分法變分法是求解泛函極值的一種經(jīng)典方法,因此也是研究最優(yōu)控制問題的一種重要工具。本章的中心內(nèi)容是介紹經(jīng)典變分法的基本原理,并加以推廣,用以求解某些最優(yōu)控制問題。盡管經(jīng)典變分法有其局限性,但本章所涉及的有關(guān)內(nèi)容,在最優(yōu)控制理論中是最基本的東西。第2章 最優(yōu)控制中的變分法 2.1 泛函與變分(1泛函定義: 給定函數(shù)空間U,若對(duì)于任何函數(shù)x(t) U,總有一個(gè)確定的值J(x(t)與之對(duì)應(yīng),則稱J(x(t)是函數(shù)x(t)的泛函。這里x(t)常被稱做宗量。從定義中可以發(fā)現(xiàn),泛

18、函是變量與函數(shù)之間的關(guān)系,常稱之為“函數(shù)的函數(shù)”。例: 是一個(gè)泛函,當(dāng)x(t)=t時(shí),J=0.5; 而不定積分 不是一個(gè)泛函。 10)( dttxJdttxJ)(第2章 最優(yōu)控制中的變分法 2.1 泛函與變分函數(shù):對(duì)于變量t的某一變域中的每一個(gè)值,x都有一個(gè)值與之相對(duì)應(yīng),那么變量x稱作變量t的函數(shù)。記為: x=f (t)t稱為函數(shù)的自變量自變量的微分:dt=t-t0 (增量足夠小時(shí))泛函:對(duì)于某一類函數(shù)x()中的每一個(gè)函數(shù)x(t),變量J都有一個(gè)值與之相對(duì)應(yīng),那么變量J稱作依賴于函數(shù)x(t)的泛函。記為: J=J x(t)x(t)稱為泛函的宗量宗量的變分:)()(0txtxx函數(shù)與泛函比較:第

19、2章 最優(yōu)控制中的變分法 2.1 泛函與變分關(guān)于變分,可將泛函的變分概念看成是函數(shù)微分概念的推廣,其作用如同微分在函數(shù)中的作用。(2變分定義: 若連續(xù)泛函J(x(t)的增量可表示為 其中第一項(xiàng)是 的連續(xù)線性泛函,第二項(xiàng)是關(guān)于 的高階無窮小,則稱上式第一項(xiàng)為泛函的變分,記做 如同函數(shù)的微分是函數(shù)增量的線性主部一樣,泛函的變分就是泛函增量的線性主部。)(),()(),()()()(txtxrtxtxLtxJtxtxJJ)(),(txtxLJ)(tx)(tx第2章 最優(yōu)控制中的變分法 2.1 泛函與變分顯然,直接用定義求泛函的變分 很困難。因此必須尋求一種計(jì)算方法。(3計(jì)算泛函變分的公式定理21 如

20、果連續(xù)泛函J(x(t)的變分存在,那么證明: (見P12) 例子:(見P12 )為了確定泛函的極小值或極大值,需要考察泛函的二次變分:(4二次變分定義:P12(5求解二次變分定理:P12J10,),(00 xxJJ第2章 最優(yōu)控制中的變分法 2.1 泛函與變分例:求下列泛函的變分fttdttxJ0)(2dttxtxdttxtxtxdttxtxtxtxJJffftttttt)()(2|)()()( 2|)()(|)()(0000020第2章 最優(yōu)控制中的變分法 2.1 泛函與變分(6泛函極值定義:定義215對(duì)于與x0(t)接近的曲線x(t),泛函Jx(t) 的增量(7泛函極值的必要條件:定理23

21、(8泛函極小值的充要條件:定理24(9變分引理:定理25 則泛函Jx(t) 在曲線x0(t)上達(dá)到極值。0)()(0)()(00txJtxJJtxJtxJJ或0J泛函極值定理: 若可微泛函Jx(t)在x0(t)上達(dá)到極值,則在x= x0(t)上的變分為零。即第2章 最優(yōu)控制中的變分法 2.2 歐拉方程主要討論:(1無約束和有約束情況下,泛函極值存在的必要條件歐拉方程;(2泛函極小值的充分條件勒讓德條件。2.2.1 無約束泛函極值的必要條件這里所提到的約束或無約束是指狀態(tài)x(t)的約束問題。無約束:指求解最優(yōu)控制解時(shí)狀態(tài)無約束,即無狀態(tài)方程的約束。1、所定義的問題問題2-1:無約束泛函極值問題為

22、)172()(),(,min0fttxdttxtxtLJ問題為:確定一個(gè)函數(shù)x(t),使Jx(t) 達(dá)到極小大值。這條能使泛函Jx(t) 達(dá)到極值的曲線稱為極值曲線軌線),記作:x*(t),見圖2-2。對(duì)于端點(diǎn)固定的情況,容許軌線x(t)應(yīng)滿足下列邊界條件:第2章 最優(yōu)控制中的變分法 2.2 歐拉方程2、極值的必要條件定理26:極值軌線x(t)滿足歐拉方程證明:P16.注意名詞:橫截條件第3節(jié)討論)例22:(求極值軌線)2.2.2 有等式約束的泛函極值的必要條件在最優(yōu)控制問題中,泛函Jx(t)所依賴的函數(shù)x(t)往往會(huì)受到一定約束條件的限制。在動(dòng)態(tài)最優(yōu)化問題中,由于受控系統(tǒng)的數(shù)學(xué)模型往往用微分

23、方程來描述,所以等式約束就是系統(tǒng)的狀態(tài)方程。等式約束:系統(tǒng)的運(yùn)動(dòng)微分方程)162()()(00ffxtxxtx)212(0)(xLdtdxL第2章 最優(yōu)控制中的變分法 2.2 歐拉方程1、定義的問題問題描述:?jiǎn)栴}222、極值的必要條件解決有約束問題方法:將有約束問題轉(zhuǎn)化為無約束問題,利用無約束的結(jié)論。通過引入拉格朗日乘子向量,解決這個(gè)問題。定理27:(主要的問題:將有約束問題轉(zhuǎn)化為無約束問題后的拉格朗日乘子向量定義、計(jì)算)這里,為了將有約束條件的泛函極值問題轉(zhuǎn)化為無約束條件的泛函極值問題,應(yīng)用拉格朗日乘子法。為此,引入待定的n維拉格朗日乘子向量(t),即證明:P18例2-3:Tntttt)()

24、()()(21第2章 最優(yōu)控制中的變分法 2.2 歐拉方程2.2.3 泛函極小值的充分條件(1無約束情況定理2-8:(2有約束情況定理2-9:例2-4:第2章 最優(yōu)控制中的變分法 2.3 橫截條件橫截條件:兩點(diǎn)邊界滿足的條件。例如式226) 前面討論的是最簡(jiǎn)單的情況:兩端固定初始狀態(tài)和末端狀態(tài)且初始時(shí)刻和末端時(shí)刻都固定,在工程實(shí)際中存在許多復(fù)雜的情況,討論如下:2.3.1 末端時(shí)刻固定時(shí)的橫截條件末端時(shí)刻tf固定,存在以下幾種情況:見表2-12.3.2 末端時(shí)刻自由時(shí)的橫截條件橫截條件:式2-53)末端時(shí)刻tf自由,存在以下幾種情況:見表2-22.3.3 初始時(shí)刻自由時(shí)的橫截條件橫截條件:式2

25、-62)初始時(shí)刻自由,存在以下幾種情況:見表2-20),()(x)(x.*00fttTftTttxxLtxLtxLff橫截條件:0)(x)(x00txLtxLtTftTf0),()(x)(x0.*000ttxxxxLtxLtxLttTftTf第2章 最優(yōu)控制中的變分法 2.4 用變分法解最優(yōu)控制問題用變分法求解連續(xù)系統(tǒng)最優(yōu)控制問題:(1)具有等式約束條件的泛函極值問題,只要把受控系統(tǒng)的數(shù)學(xué)模型看成是最優(yōu)軌線x(t) 應(yīng)滿足的等式約束條件即可;(2)控制變量不受約束;(3末端時(shí)刻固定和末端時(shí)刻自由時(shí)最優(yōu)解的必要條件和充分條件。一、可用變分法求解的最優(yōu)控制問題一般描述,非線性時(shí)變系統(tǒng)狀態(tài)方程為),

26、(tux,fx 初始狀態(tài))()(00ttttxx其中,x 為n 維狀態(tài)向量; u 為m 維控制向量; f 為n 維向量函數(shù)。要求在控制空間中尋求一個(gè)最優(yōu)控制向量 (不受約束) ,使以下性能指標(biāo))(tu沿最優(yōu)軌線 取極小值。)(tx*tttJfttfd),()(0uxLx目標(biāo)集末端狀態(tài)集)0),(ffttx第2章 最優(yōu)控制中的變分法 2.4 用變分法解最優(yōu)控制問題二、末端時(shí)刻固定時(shí)的最優(yōu)解問題的描述:P301、末端受約束情況兩個(gè)約束:狀態(tài)受系統(tǒng)狀態(tài)方程約束,末端狀態(tài)受目標(biāo)集約束。引入兩個(gè)拉格朗日乘子向量(t)、(t),構(gòu)造廣義泛函無條件極值):tttttttJTttfTfafdx), u, x(

27、f)(), u, x(L)()()(x0), u, x(f )(), u, x(L), , u, x(ttttHT定義哈密頓函數(shù)(關(guān)于該函數(shù)的說明P31)tttuxHtttJTttfTfafd(t)x)(),()()()(x0代入上式得式中的第三項(xiàng)進(jìn)行分部積分,得tttttHtttJTttttTttfTfafffdx)(x)(d), , u, x()()()(x000當(dāng)泛函J 取極值時(shí),其一次變分等于零。 即0aJ第2章 最優(yōu)控制中的變分法 2.4 用變分法解最優(yōu)控制問題H(t)xxH)()(00ttttxx可以變分的量:uuu)()(ttxxx)()(tt)()()(ffftttxxx求出J

28、 的一次變分并令其為零0dxuuxx)()()()()(0tHHtttxtxtxJTTTttfffTffTaf廣義泛函取極值的必要條件是定理210)正則方程:邊界條件:極值條件控制方程):)()()()(ffTffttxtxt0),(ffttx0uH不可以變分的量:0tft)(0tx)( t(t)第2章 最優(yōu)控制中的變分法 2.4 用變分法解最優(yōu)控制問題幾點(diǎn)說明:1實(shí)際上,(2-73式和2-74式為歐拉方程。xfxLxH因?yàn)?uH0ufuL推導(dǎo)過程:如果令廣義泛函的積分內(nèi)的函數(shù))x),u,x(f)(),u,x(L),u,x(ttttHT簡(jiǎn)記成xfLTHxfxL由歐拉方程得到0ddxxHtH0)

29、(xfxL即第2章 最優(yōu)控制中的變分法 2.4 用變分法解最優(yōu)控制問題而275式和初始條件266就是橫截條件。0dduuHtH0ufuL2) 是泛函取極值的必要條件,是否為極小值還需要二次變分 來判斷, 則泛函J 取極小值。0JJ202J第2章 最優(yōu)控制中的變分法 2.4 用變分法解最優(yōu)控制問題3) 哈密頓函數(shù)沿最優(yōu)軌線隨時(shí)間的變化率tHHHHtHTTTuuxxdd在最優(yōu)控制 、最優(yōu)軌線 下,有 和*u*x0uH(270式的哈密頓函數(shù)對(duì) 求偏導(dǎo),結(jié)果為 0 xxxxHHHHHHTTTT 由277式可得于是tHtHddx), ux,(ft第2章 最優(yōu)控制中的變分法 2.4 用變分法解最優(yōu)控制問題

30、 即哈密頓函數(shù)H 沿最優(yōu)軌線對(duì)時(shí)間的全導(dǎo)數(shù)等于它對(duì)時(shí)間的偏導(dǎo)數(shù)。記為 那么)(), ,u,x(*tHtHttHHdd對(duì)上式積分,得到dHtHtHfttf*0*0)()(當(dāng)哈密頓函數(shù)不顯含 t 時(shí),得consttHtHf)()(*第2章 最優(yōu)控制中的變分法 2.4 用變分法解最優(yōu)控制問題2、末端自由情況廣義泛函取極值的必要條件是定理211)正則方程:邊界條件:極值條件:H(t)xxH)()(fftxt00)(xtx0uH3、末端固定情況廣義泛函取極值的必要條件是定理212)正則方程:邊界條件:極值條件:末端時(shí)刻固定時(shí)最優(yōu)解的充分條件:定理213H(t)xxHffxtx)(00)(xtx0uH第2

31、章 最優(yōu)控制中的變分法 2.4 用變分法解最優(yōu)控制問題三、末端時(shí)刻自由時(shí)的最優(yōu)解推導(dǎo)過程與末端時(shí)刻固定時(shí)一樣,只不過不同在于可以變分的量:uuu)()(ttxxx)()(tt)()()(ffftttxxxfffttt不可以變分的量:0t)(0tx)(t末端受約束情況:定理214末端自由情況:定理215末端固定時(shí)情況:定理216注意與末端時(shí)刻固定的情況不同。第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.1 連續(xù)系統(tǒng)的極小值原理連續(xù)系統(tǒng)的極小值原理問題的提出問題的提出 用變分法求解最優(yōu)控制時(shí),認(rèn)用變分法求解最優(yōu)控制時(shí),認(rèn)為控制向量為控制向量 不受限制。但是不受限制。但是實(shí)際的系統(tǒng),控制信號(hào)

32、都是受到實(shí)際的系統(tǒng),控制信號(hào)都是受到某種限制的。某種限制的。)(tu 因而,應(yīng)用控制方程因而,應(yīng)用控制方程來確定最優(yōu)控制,可能出錯(cuò)。來確定最優(yōu)控制,可能出錯(cuò)。0uHa)a)圖中所示,圖中所示,H H 最小值出現(xiàn)在左側(cè),最小值出現(xiàn)在左側(cè),不滿足控制方程。不滿足控制方程。b)b)圖中不存在圖中不存在 0uHrRUt )(u第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.1 連續(xù)系統(tǒng)的極小值原理連續(xù)系統(tǒng)的極小值原理( )min ( ) ( )fu tJ ux t. .s t( )( , ),x tf x u00( ),x tx0 ,fttt( )x t( ) t( )Hx t( )Htx 一、

33、自由末端的極小值原理一、自由末端的極小值原理定理定理3-13-1:對(duì)應(yīng)如下定常系統(tǒng)、末值型性能指標(biāo)、末端自由、控制受約束:對(duì)應(yīng)如下定常系統(tǒng)、末值型性能指標(biāo)、末端自由、控制受約束的最優(yōu)控制問題的最優(yōu)控制問題 及及滿足下述正則方程滿足下述正則方程: :對(duì)于最優(yōu)解和最優(yōu)末端時(shí)刻、最優(yōu)軌線,存在非零的對(duì)于最優(yōu)解和最優(yōu)末端時(shí)刻、最優(yōu)軌線,存在非零的n n維向量函數(shù)維向量函數(shù) 使使( ) t第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.1 連續(xù)系統(tǒng)的極小值原理連續(xù)系統(tǒng)的極小值原理( , , )( ) ( , )TH x ut f x u( )x t( ) t00()()()ffx txtx t*(

34、 )( , )min( , , )u tH x uH x u式中哈密頓函數(shù)式中哈密頓函數(shù)及及滿足邊界條件滿足邊界條件哈密頓函數(shù)相對(duì)最優(yōu)控制為極小值哈密頓函數(shù)相對(duì)最優(yōu)控制為極小值ft*( ( ),( ), ( )( ( ),( ), ( )fffH x t u ttH x tu ttconstft*(),(), ()0ffftttH x tu tt哈密頓函數(shù)沿最優(yōu)軌跡線保持為常數(shù)哈密頓函數(shù)沿最優(yōu)軌跡線保持為常數(shù)固定時(shí)固定時(shí)當(dāng)當(dāng)自由時(shí)自由時(shí)當(dāng)當(dāng)?shù)诘?章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.1 連續(xù)系統(tǒng)的極小值原理連續(xù)系統(tǒng)的極小值原理/0Hu *( )( ( ),( ), ( )( ( ),

35、 ( ), ( )u tH x t u ttH x t u tt上述極小值原理與變分法主要區(qū)別在于條件上述極小值原理與變分法主要區(qū)別在于條件。當(dāng)控制無約束時(shí),。當(dāng)控制無約束時(shí),相應(yīng)條件為相應(yīng)條件為 ;不再成立,而代之為不再成立,而代之為當(dāng)控制有約束時(shí),當(dāng)控制有約束時(shí),/0Hu 極小值原理的重要意義:(極小值原理的重要意義:(P51)(1容許控制條件放寬了。容許控制條件放寬了。(2最優(yōu)控制使哈密頓函數(shù)取全局極小值。最優(yōu)控制使哈密頓函數(shù)取全局極小值。(3極小值原理不要求哈密頓函數(shù)對(duì)控制的可微性。極小值原理不要求哈密頓函數(shù)對(duì)控制的可微性。(4極小值原理給出了最優(yōu)控制的必要而非充分條件。極小值原理給出

36、了最優(yōu)控制的必要而非充分條件。例例31:說明:說明:1 1極小值原理給出的只是最優(yōu)控制應(yīng)該滿足的必要條件。極小值原理給出的只是最優(yōu)控制應(yīng)該滿足的必要條件。2 2極小值原理與用變分法求解最優(yōu)問題相比,差別僅在于極值條件。極小值原理與用變分法求解最優(yōu)問題相比,差別僅在于極值條件。3 3這里給出了極小值原理,而在龐德里亞金著作論述的是極大值原理。因?yàn)榍筮@里給出了極小值原理,而在龐德里亞金著作論述的是極大值原理。因?yàn)榍笮阅苤笜?biāo)性能指標(biāo)J J的極小值與求的極小值與求J J的極大值等價(jià)。的極大值等價(jià)。4 4非線性時(shí)變系統(tǒng)也有極小值原理。非線性時(shí)變系統(tǒng)也有極小值原理。第第3章章 極小值原理及其應(yīng)用極小值原理

37、及其應(yīng)用 3.1 連續(xù)系統(tǒng)的極小值原理連續(xù)系統(tǒng)的極小值原理二、極小值原理的一些推廣形式二、極小值原理的一些推廣形式1、時(shí)變問題、時(shí)變問題定義:描述最優(yōu)控制問題的相關(guān)函數(shù)顯含時(shí)間,稱為時(shí)變問題。定義:描述最優(yōu)控制問題的相關(guān)函數(shù)顯含時(shí)間,稱為時(shí)變問題。解決辦法:引入新狀態(tài)變量,將時(shí)變問題轉(zhuǎn)為定常問題,利用定理解決辦法:引入新狀態(tài)變量,將時(shí)變問題轉(zhuǎn)為定常問題,利用定理3-1。( )min( ) (),ffu tJ ux tt. .st( )( , , ),x tf x u t00( )x tx0 ,fftt tt未知定理定理3-23-2: ( )Hx t( )Htx 滿足下述正則方程滿足下述正則方程

38、: :( )x t( ) t及及式中哈密頓函數(shù)式中哈密頓函數(shù)( , , , )( ) ( , , )TH xu tt f x u t第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.1 連續(xù)系統(tǒng)的極小值原理連續(xù)系統(tǒng)的極小值原理( )x t( ) t00()()()ffx txtx t及及滿足邊界條件滿足邊界條件哈密頓函數(shù)相對(duì)最優(yōu)控制為極小值哈密頓函數(shù)相對(duì)最優(yōu)控制為極小值在最優(yōu)軌線末端哈密頓函數(shù)應(yīng)滿足在最優(yōu)軌線末端哈密頓函數(shù)應(yīng)滿足*( ) ( ), ( ),( ), min ( ), ( ), ( ), u tH x tt u t tH x tt u t t*( ),( ), ( ),( )

39、,fffffffx ttH x ttu ttt*( , , , ) ( ), ( ), ( ), ( ), ( ), ( ), ftfffftH xuH x tt u t tH x ttu ttd沿最優(yōu)軌線哈密頓函數(shù)變化率沿最優(yōu)軌線哈密頓函數(shù)變化率定理定理3 32 2與定理與定理3 31 1的區(qū)別:的區(qū)別:P61P61第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.1 連續(xù)系統(tǒng)的極小值原理連續(xù)系統(tǒng)的極小值原理2 2、積分型性能指標(biāo)問題、積分型性能指標(biāo)問題. .st( )( , , ),x tf x u t00( )x tx0 ,fftt tt未知定理定理3-33-3: ( )Hx t(

40、)Htx 滿足下述正則方程滿足下述正則方程: :( )x t( ) t及及式中哈密頓函數(shù)式中哈密頓函數(shù)0( )min( ) ( ), ( )fttu tJ uL x t u t dt( )x t( ) t及及滿足邊界條件滿足邊界條件00()x tx()0ft)u, x(f )()u, x(L), u, x(tHT第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.1 連續(xù)系統(tǒng)的極小值原理連續(xù)系統(tǒng)的極小值原理哈密頓函數(shù)相對(duì)最優(yōu)控制為極小值哈密頓函數(shù)相對(duì)最優(yōu)控制為極小值ft*( ( ),( ), ( )( ( ),( ), ( )fffH x t u ttH x tu ttconstft*(),

41、(), ()0ffftttH x tu tt哈密頓函數(shù)沿最優(yōu)軌跡線保持為常數(shù)哈密頓函數(shù)沿最優(yōu)軌跡線保持為常數(shù)固定時(shí)固定時(shí)當(dāng)當(dāng)自由時(shí)自由時(shí)當(dāng)當(dāng)*( )( ), ( ),( )min( ), ( ), ( )u tH x tt u tH x tt u t第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.1 連續(xù)系統(tǒng)的極小值原理連續(xù)系統(tǒng)的極小值原理例例3-23-2:試求:試求: 時(shí)的時(shí)的 ,解:定常系統(tǒng)、積分型解:定常系統(tǒng)、積分型 , 固定,固定, 自在,自在, 受約束。取哈密頓函數(shù)受約束。取哈密頓函數(shù) tutxtx 50 x 15 . 0tu min10dttutxJ*u*xJft)(ftxu

42、 uxuxuxH11 5 . 01*tu11 1xHt 1tcet 0111ceec 11tte由協(xié)態(tài)方程由協(xié)態(tài)方程由邊界條件由邊界條件注:控制的切換點(diǎn)為注:控制的切換點(diǎn)為(ts)=1第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.1 連續(xù)系統(tǒng)的極小值原理連續(xù)系統(tǒng)的極小值原理 10st 111stset307. 0st 5 . 01*tu00.307t 1307. 0 t控制的切換點(diǎn)處控制的切換點(diǎn)處00.307t 1307. 0 t 5 . 0121ttecectx00.307t 1307. 0 t5 . 037. 414*tteex00.307t 1307. 0 t根據(jù)邊界條件繼續(xù)求出

43、:根據(jù)邊界條件繼續(xù)求出: 5 . 01txtxtx 代入狀態(tài)方程得代入狀態(tài)方程得第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.1 連續(xù)系統(tǒng)的極小值原理連續(xù)系統(tǒng)的極小值原理 tt72. 11307. 0105 . 01307. 01t*u0 tx*t1307.0044.653 .12第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.1 連續(xù)系統(tǒng)的極小值原理連續(xù)系統(tǒng)的極小值原理最優(yōu)性能指標(biāo)為:最優(yōu)性能指標(biāo)為: 1307. 0307. 0010*68. 8) 137. 4()24(dtedtedttutxJtt例例3-3:3、末端受約束的情況、末端受約束的情況做法與前面得一樣,引入兩個(gè)拉

44、格朗日乘子向量,構(gòu)造廣義泛函,做法與前面得一樣,引入兩個(gè)拉格朗日乘子向量,構(gòu)造廣義泛函,在滿足末端約束條件下,泛函取得極值是等價(jià)的。在滿足末端約束條件下,泛函取得極值是等價(jià)的。定理定理3-4:(定常系統(tǒng)):(定常系統(tǒng))定理定理3-5:(時(shí)變系統(tǒng))(時(shí)變系統(tǒng))4、復(fù)合型性能指標(biāo)情況、復(fù)合型性能指標(biāo)情況定理定理36:表表3-1,3-2例例35:第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.2 離散系統(tǒng)的極小值原理離散系統(tǒng)的極小值原理一、離散歐拉方程一、離散歐拉方程控制序列不受約束時(shí),利用離散變分法求解離散系統(tǒng)的最優(yōu)控制問題??刂菩蛄胁皇芗s束時(shí),利用離散變分法求解離散系統(tǒng)的最優(yōu)控制問題。1,

45、.,1 , 0,),(),() 1(Nkkkukxfkx1010),1(),(),(NkkNkLkkxkukxLJ設(shè)系統(tǒng)的差分方程為:設(shè)系統(tǒng)的差分方程為:系統(tǒng)的性能指標(biāo)為:系統(tǒng)的性能指標(biāo)為:離散泛函取得極值的必要條件歐拉方程)離散泛函取得極值的必要條件歐拉方程)0)(0)()(1kuLkxLkxLkkk離散橫截條件為:離散橫截條件為:0)0()()()(01xkxLNxkxLTkkTNkk若始端固定,末端自由,若始端固定,末端自由,由離散橫截條件得邊界條件:由離散橫截條件得邊界條件:例例36:0)( 1),(),1(),1(,)0(0NxNNxNuNxLxx第第3章章 極小值原理及其應(yīng)用極小值

46、原理及其應(yīng)用 3.2 離散系統(tǒng)的極小值原理離散系統(tǒng)的極小值原理二、離散極小值原理二、離散極小值原理先給出控制序列不受約束時(shí)得離散極小值原理,然后推廣到控制序列受先給出控制序列不受約束時(shí)得離散極小值原理,然后推廣到控制序列受約束的情況。約束的情況。1、末端狀態(tài)受等式約束、末端狀態(tài)受等式約束1,.,1 , 0,),(),() 1(Nkkkukxfkx10),1(),(),(),(NkkkxkukxLNNxJ定理定理3-7:3-7:設(shè)離散系統(tǒng)狀態(tài)方程設(shè)離散系統(tǒng)狀態(tài)方程系統(tǒng)的性能指標(biāo)為:系統(tǒng)的性能指標(biāo)為:目標(biāo)集:目標(biāo)集:0),(NNx取得極值的必要條件:取得極值的必要條件:( )x k( )k( )(

47、1)(1)H kx kk( )( )( )H kkx k( ) ( ), ( ),(1), H kH x ku kkk ( ), ( ), (1) ( ), ( ), TL x k u k kkf x k u k k和和滿足下列差分方程滿足下列差分方程: :式中離散哈密頓函數(shù)式中離散哈密頓函數(shù)第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.2 離散系統(tǒng)的極小值原理離散系統(tǒng)的極小值原理( )x k( )k0(0)xx (),0 x NN ( ), ( ),( )( )( )Tx N Nx N NNx Nx N*( )u k*( ),( ), (1), H xkukkk*( )min( ),

48、 ( ), (1), u kH x k u kkk( )0( )H ku k和和滿足邊界條件滿足邊界條件離散哈密頓函數(shù)對(duì)最優(yōu)控制離散哈密頓函數(shù)對(duì)最優(yōu)控制取極小值取極小值控制序列不受約束時(shí)控制序列不受約束時(shí)2 2、末端狀態(tài)自由時(shí)、末端狀態(tài)自由時(shí)定理定理3 38 8:例例3 37 7:第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.3 時(shí)間最優(yōu)控制時(shí)間最優(yōu)控制時(shí)間最優(yōu)控制:如果性能指標(biāo)是系統(tǒng)由初態(tài)轉(zhuǎn)移到目標(biāo)集的運(yùn)動(dòng)時(shí)間,則使時(shí)間最優(yōu)控制:如果性能指標(biāo)是系統(tǒng)由初態(tài)轉(zhuǎn)移到目標(biāo)集的運(yùn)動(dòng)時(shí)間,則使轉(zhuǎn)移時(shí)間為最短的控制稱為時(shí)間最優(yōu)控制。轉(zhuǎn)移時(shí)間為最短的控制稱為時(shí)間最優(yōu)控制。一、一類非線性系統(tǒng)的時(shí)間最優(yōu)

49、控制一、一類非線性系統(tǒng)的時(shí)間最優(yōu)控制最短時(shí)間控制問題的提法:最短時(shí)間控制問題的提法: 設(shè)受控系統(tǒng)狀態(tài)方程為設(shè)受控系統(tǒng)狀態(tài)方程為 )(),(),()(tuttxBttxftx 給定終端約束條件為給定終端約束條件為 0),()(00ffttxxtx 尋求尋求m m維有界閉集中的最優(yōu)控制維有界閉集中的最優(yōu)控制u u* *(t)(t),滿足不等式約束,滿足不等式約束 ),.,2 , 1(1)(mjtuj 使系統(tǒng)從已知初始狀態(tài)使系統(tǒng)從已知初始狀態(tài) 轉(zhuǎn)移到目標(biāo)集中某一狀態(tài)轉(zhuǎn)移到目標(biāo)集中某一狀態(tài) 時(shí),時(shí),如如下目標(biāo)泛函取極小值,其中下目標(biāo)泛函取極小值,其中 未知未知 )(0tx)(ftxft00)(fttf

50、ttdttuJ 屬于時(shí)變系統(tǒng)、積分型性能指標(biāo)、終端受約束的最優(yōu)控制問題屬于時(shí)變系統(tǒng)、積分型性能指標(biāo)、終端受約束的最優(yōu)控制問題 第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.3 時(shí)間最優(yōu)控制時(shí)間最優(yōu)控制應(yīng)用極小值原理,系統(tǒng)的哈密爾頓函數(shù)為:應(yīng)用極小值原理,系統(tǒng)的哈密爾頓函數(shù)為:)(1),(),(),(BufttuttxHT在使在使J J最小以實(shí)現(xiàn)最優(yōu)控制的必要條件中,側(cè)重分析極值條件最小以實(shí)現(xiàn)最優(yōu)控制的必要條件中,側(cè)重分析極值條件),.,2 , 1()(),(min)(),()(1min)(1*1)(*1)(*mjtuttxBtuttxBBufBufTtuTTtuTjj將上式中的矩陣表達(dá)

51、式展開成分量形式將上式中的矩陣表達(dá)式展開成分量形式mjniiijjmnmnnmmnbuuuubbbbbbbbb112121222211121121.jg則極值條件可寫為:則極值條件可寫為:mjjjumjjjguguj1*11*min第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.3 時(shí)間最優(yōu)控制時(shí)間最優(yōu)控制由上式可見,由于由上式可見,由于 是確定的,故使是確定的,故使 取極小值的最優(yōu)控制為取極小值的最優(yōu)控制為*jgmjjjgu1*00101*jjjjgggu不定或簡(jiǎn)寫為:或簡(jiǎn)寫為:niiijjbguj1*sgnsgn 根據(jù)根據(jù) 是否為零,將系統(tǒng)分為兩種情形:正常平凡)、奇異非平凡)是否為

52、零,將系統(tǒng)分為兩種情形:正常平凡)、奇異非平凡)(砰(砰- -砰控制)砰控制)*jg*jg*ju011第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.3 時(shí)間最優(yōu)控制時(shí)間最優(yōu)控制正常平凡最短時(shí)間控正常平凡最短時(shí)間控制系統(tǒng)定義制系統(tǒng)定義3 31 1) 只是在各個(gè)孤立的瞬只是在各個(gè)孤立的瞬刻才取零值,刻才取零值, 是有第一是有第一類間斷點(diǎn)的分段常數(shù)函數(shù)類間斷點(diǎn)的分段常數(shù)函數(shù)。奇異非平凡最短時(shí)奇異非平凡最短時(shí)間控制系統(tǒng)定義間控制系統(tǒng)定義3 32 2)并不意味著在該區(qū)間內(nèi)并不意味著在該區(qū)間內(nèi)最優(yōu)控制不存在,僅表最優(yōu)控制不存在,僅表明,從必要條件不能推明,從必要條件不能推出確切關(guān)系式。出確切關(guān)系式

53、。*jg*ju定理定理3 39 9:砰:砰- -砰控制原理砰控制原理第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.3 時(shí)間最優(yōu)控制時(shí)間最優(yōu)控制二、線性定常系統(tǒng)的時(shí)間最優(yōu)控制二、線性定常系統(tǒng)的時(shí)間最優(yōu)控制線性時(shí)間最優(yōu)調(diào)節(jié)器問題的提法問題線性時(shí)間最優(yōu)調(diào)節(jié)器問題的提法問題3 32 2):): 設(shè)受控系統(tǒng)狀態(tài)方程為設(shè)受控系統(tǒng)狀態(tài)方程為 )()()(tButAxtx 給定終端約束條件為給定終端約束條件為 0)()0()(0ftxaxtx 尋求尋求m m維有界閉集中的最優(yōu)控制維有界閉集中的最優(yōu)控制u u* *(t)(t),滿足不等式約束,滿足不等式約束 ),.,2 , 1(1)(mjtuj 使系統(tǒng)

54、以最短時(shí)間從初始狀態(tài)使系統(tǒng)以最短時(shí)間從初始狀態(tài) 轉(zhuǎn)移到狀態(tài)空間原點(diǎn)。目標(biāo)泛轉(zhuǎn)移到狀態(tài)空間原點(diǎn)。目標(biāo)泛函取極小值函取極小值)0(x根據(jù)上一節(jié)的結(jié)論,可得極值條件為:根據(jù)上一節(jié)的結(jié)論,可得極值條件為:)(sgnsgn*tbguTjjj00)(fttfttdttuJ第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.3 時(shí)間最優(yōu)控制時(shí)間最優(yōu)控制對(duì)于線性定常系統(tǒng)的最短時(shí)間控制問題,經(jīng)過理論推導(dǎo)和證明,可得如對(duì)于線性定常系統(tǒng)的最短時(shí)間控制問題,經(jīng)過理論推導(dǎo)和證明,可得如下重要結(jié)論:下重要結(jié)論:(1 1系統(tǒng)正常平凡的充要條件定理系統(tǒng)正常平凡的充要條件定理3 31111):當(dāng)且僅當(dāng)):當(dāng)且僅當(dāng)m m個(gè)矩陣

55、個(gè)矩陣中全部為非奇異矩陣時(shí),系統(tǒng)是正常平凡的。(至少有一個(gè)為奇異中全部為非奇異矩陣時(shí),系統(tǒng)是正常平凡的。(至少有一個(gè)為奇異矩陣時(shí),系統(tǒng)是奇異的定理矩陣時(shí),系統(tǒng)是奇異的定理3 31010) )定理定理3-11:3-11:當(dāng)且僅當(dāng)當(dāng)且僅當(dāng) 問題問題3-23-2是正常是正常的的 mjbAbAAbbGjnjjjj , 2 , 1.,1,2,(2 2系統(tǒng)最優(yōu)解存在的條件:常數(shù)矩陣系統(tǒng)最優(yōu)解存在的條件:常數(shù)矩陣A A的特征值全部具有非正實(shí)部。的特征值全部具有非正實(shí)部。(3 3最優(yōu)解唯一性定理:系統(tǒng)是平凡的且最短時(shí)間控制存在,則最短最優(yōu)解唯一性定理:系統(tǒng)是平凡的且最短時(shí)間控制存在,則最短時(shí)間控制必然是唯一的

56、。時(shí)間控制必然是唯一的。( (定理定理3-12)3-12)(4 4開關(guān)次數(shù)定理:系統(tǒng)是平凡的且最短時(shí)間控制存在,則最優(yōu)控制開關(guān)次數(shù)定理:系統(tǒng)是平凡的且最短時(shí)間控制存在,則最優(yōu)控制u u* *的任一分量的任一分量 的切換次數(shù)最多為的切換次數(shù)最多為n-1n-1次。(次。(n n為系統(tǒng)維數(shù))為系統(tǒng)維數(shù))( (定理定理3-14)3-14)*junbAbAAbbrankrankGjnjjjj.,1,2,第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.3 時(shí)間最優(yōu)控制時(shí)間最優(yōu)控制三、雙積分模型的最短時(shí)間控制問題三、雙積分模型的最短時(shí)間控制問題雙積分模型的物理意義:慣性負(fù)載在無阻力環(huán)境中運(yùn)動(dòng)例雙積分模

57、型的物理意義:慣性負(fù)載在無阻力環(huán)境中運(yùn)動(dòng)例3 38 8) 作用力位移,質(zhì)量,)()(tftym負(fù)載運(yùn)動(dòng)方程:負(fù)載運(yùn)動(dòng)方程: )()(tftym )()(),()(21tytxtytx傳遞函數(shù):傳遞函數(shù): 21)()()(mssFsYsG(由兩個(gè)積分環(huán)節(jié)組成)(由兩個(gè)積分環(huán)節(jié)組成) 定義定義u(t)=f(t)/m , u(t)=f(t)/m , 則上式變?yōu)椋簞t上式變?yōu)椋?)()(tuty 取狀態(tài)變量取狀態(tài)變量 )()()()(221tutxtxtx則有則有 矩陣形式為:矩陣形式為: )(10)(0010)(tutxtx第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.3 時(shí)間最優(yōu)控制時(shí)間最優(yōu)

58、控制( )( )( )Hx tAx tBu t( )( )THtAtx ( , , ) 1( )( )( )TH xut Ax tBu t 0(0)xx( )0fx t*1,( )0( )sgn( )1,( )0TjTjjTjbtu tbtbt 當(dāng)當(dāng)H*()0fHt定理定理3-153-15正則方程正則方程式中哈密頓函數(shù)式中哈密頓函數(shù)邊界條件邊界條件, 極小值條件極小值條件函數(shù)變化率函數(shù)變化率第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.3 時(shí)間最優(yōu)控制時(shí)間最優(yōu)控制雙積分模型最短時(shí)間控制問題的提法:雙積分模型最短時(shí)間控制問題的提法: 已知二階系統(tǒng)的狀態(tài)方程為已知二階系統(tǒng)的狀態(tài)方程為 給定

59、端點(diǎn)約束條件為給定端點(diǎn)約束條件為 TfTtxxxx00)()0(2010 尋求有界閉集中的最優(yōu)控制尋求有界閉集中的最優(yōu)控制u u* *(t)(t),滿足不等式約束,滿足不等式約束 1)(tu 使系統(tǒng)從以最短時(shí)間從任意初態(tài)轉(zhuǎn)移到終態(tài)。使系統(tǒng)從以最短時(shí)間從任意初態(tài)轉(zhuǎn)移到終態(tài)。)()()()(221tutxtxtx0110ABBG)(10)(0010)(tutxtx先判斷該系統(tǒng)是否平凡?先判斷該系統(tǒng)是否平凡?第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.3 時(shí)間最優(yōu)控制時(shí)間最優(yōu)控制由上節(jié)重要結(jié)論可知:由上節(jié)重要結(jié)論可知:(1 1本系統(tǒng)為正常平凡最短時(shí)間控制系統(tǒng)本系統(tǒng)為正常平凡最短時(shí)間控制系統(tǒng)

60、(2 2其時(shí)間最優(yōu)控制必然存在且唯一其時(shí)間最優(yōu)控制必然存在且唯一(3 3時(shí)間最優(yōu)控制時(shí)間最優(yōu)控制u(t)u(t)至多切換一次至多切換一次 最優(yōu)控制表達(dá)式:最優(yōu)控制表達(dá)式:)(sgn)(sgn2*ttBuT 下面利用協(xié)態(tài)方程求解下面利用協(xié)態(tài)方程求解)(2t12211)(0)(xHtxHtuxfHT2211121211)()(ctctct1)sgn(1020*tu0)(, 10)(, 1)(sgn(222*tttu當(dāng)當(dāng) 哈密頓函數(shù):哈密頓函數(shù): 最優(yōu)控制:最優(yōu)控制:第第3章章 極小值原理及其應(yīng)用極小值原理及其應(yīng)用 3.3 時(shí)間最優(yōu)控制時(shí)間最優(yōu)控制1)(*tu)0(21)0(21)(221221xx

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論