運(yùn)籌學(xué)課件：空中交通系統(tǒng)動(dòng)態(tài)規(guī)劃

上傳人：熊*** IP屬地：山東上傳時(shí)間：2023-12-09 格式：PPTX 頁(yè)數(shù)：99 大小：580.97KB 積分：25 舉報(bào) 版權(quán)申訴

運(yùn)籌學(xué)課件：空中交通系統(tǒng)動(dòng)態(tài)規(guī)劃_第2頁(yè)

運(yùn)籌學(xué)課件：空中交通系統(tǒng)動(dòng)態(tài)規(guī)劃_第3頁(yè)

運(yùn)籌學(xué)課件：空中交通系統(tǒng)動(dòng)態(tài)規(guī)劃_第4頁(yè)

運(yùn)籌學(xué)課件：空中交通系統(tǒng)動(dòng)態(tài)規(guī)劃_第5頁(yè)

已閱讀5頁(yè)，還剩94頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

空中交通系統(tǒng)優(yōu)化與管理動(dòng)態(tài)規(guī)劃什么是動(dòng)態(tài)規(guī)劃動(dòng)態(tài)規(guī)劃是解決多階段決策過程最優(yōu)化的一種方法。1951年美國(guó)數(shù)學(xué)家貝爾曼（R·Bellman）等人提出了解決這類問題的“最優(yōu)化原理”，并研究了許多實(shí)際問題。什么是動(dòng)態(tài)規(guī)劃在工程技術(shù)、企業(yè)管理、工農(nóng)業(yè)生產(chǎn)及軍事部門中都有廣泛應(yīng)用：解決最優(yōu)路徑問題、資源分配問題、生產(chǎn)調(diào)度問題、庫(kù)存問題、裝載問題、排序問題、設(shè)備更新問題、生產(chǎn)過程最優(yōu)控制問題等等。動(dòng)態(tài)規(guī)劃模型分類：離散確定型、離散隨機(jī)型、連續(xù)確定型、連續(xù)隨機(jī)型。5.1多階段決策問題的最優(yōu)化多階段決策問題，是指可將過程劃分為若干個(gè)互相聯(lián)系的階段，在它的每一個(gè)階段都需要作出決策，并且一個(gè)階段的決策確定以后，常影響下一階段的決策，從而影響整個(gè)過程的活動(dòng)。各個(gè)階段所確定的決策就構(gòu)成一個(gè)決策序列，通常稱為策略。由于每一個(gè)階段可供選擇的決策往往不只一個(gè)，因而就有許多策略可供選擇。多階段的決策問題，就是要在允許選擇的那些策略中，選擇一個(gè)最優(yōu)策略，使在預(yù)定的標(biāo)準(zhǔn)下達(dá)到最好的效果。5.1多階段決策問題的最優(yōu)化5.1多階段決策問題的最優(yōu)化階段往往可以用時(shí)段來表示。在各個(gè)時(shí)間階段，采用不同的決策是隨時(shí)間而變動(dòng)的，這就有“動(dòng)態(tài)”的含義。它是在時(shí)間的推移過程中要在每一段選擇最恰當(dāng)?shù)臎Q策，以期整體上達(dá)到最優(yōu)。5.1多階段決策問題的最優(yōu)化

動(dòng)態(tài)規(guī)劃在一定條件下也可以解決一些與時(shí)間無關(guān)的問題，只要人為地引進(jìn)"時(shí)段"因素以后，這些問題就可變?yōu)橐粋€(gè)多階段決策問題。5.1多階段決策問題的最優(yōu)化

例1

生產(chǎn)與存貯問題

某工廠每月需供應(yīng)市場(chǎng)一定數(shù)量的產(chǎn)品，并將所余產(chǎn)品存入倉(cāng)庫(kù)。一般某月適當(dāng)增加產(chǎn)量可降低生產(chǎn)成本，但超產(chǎn)部分存入倉(cāng)庫(kù)會(huì)增加庫(kù)存費(fèi)用。要求確定一個(gè)逐月的生產(chǎn)計(jì)劃，在滿足需求條件下，使一年的生產(chǎn)與存貯費(fèi)用之和最小。

全年分為12個(gè)階段逐次決策。5.1多階段決策問題的最優(yōu)化例2投資決策問題某公司現(xiàn)有資金Q萬元，在今后5年內(nèi)考慮給A，B，C，D

4個(gè)項(xiàng)目投資，這些項(xiàng)目投資的回收期限、回報(bào)率均不相同，問該公司應(yīng)如何確定這些項(xiàng)目每年的投資額，使到第5年末擁有資金的本利總額最大。這是一個(gè)5階段決策問題。5.1多階段決策問題的最優(yōu)化例3設(shè)備更新問題

企業(yè)在使用設(shè)備時(shí)都要考慮設(shè)備的更新問題，因?yàn)樵O(shè)備越陳舊所需的維修費(fèi)用越多，但購(gòu)買新設(shè)備則要一次性支出較大的費(fèi)用；現(xiàn)某企業(yè)要決定一臺(tái)設(shè)備未來8年的更新計(jì)劃，已預(yù)測(cè)了第j年購(gòu)買設(shè)備的價(jià)格為Kj，設(shè)Gj為設(shè)備經(jīng)過j年后的殘值，Cj為設(shè)備連續(xù)使用j-1年后在第j年的維修費(fèi)(j＝1，2，…，8)，問應(yīng)在哪些年更新設(shè)備可使總費(fèi)用最小。這是一個(gè)8階段決策問題

例4：最短路線問題5.1多階段決策問題的最優(yōu)化圖5-35.2動(dòng)態(tài)規(guī)劃的基本概念和基本原理動(dòng)態(tài)規(guī)劃的基本概念使用動(dòng)態(tài)規(guī)劃方法解決多階段決策問題，首先要將實(shí)際問題寫成動(dòng)態(tài)規(guī)劃模型，此時(shí)要用到以下概念：階段；狀態(tài)；決策和策略；(4)狀態(tài)轉(zhuǎn)移；(5)指標(biāo)函數(shù)。

例4最短路線問題5.2.1 動(dòng)態(tài)規(guī)劃的基本概念圖5—3如圖5-3所示，給定一個(gè)線路網(wǎng)絡(luò)圖，要從A地向F地鋪設(shè)一條輸油管道，各點(diǎn)間連線上的數(shù)字表示距離，問應(yīng)選擇什么路線，可使總距離最短。階段和階段變量：將所給問題的過程，按時(shí)間或空間特征分解成若干互相聯(lián)系的階段，以便按次序去求每階段的解，常用字母k表示階段變量。例4中，從A到F,

可以分成從A到B(B有兩種選擇)，從B到C(C有四種選擇)，從C到D(D有三種選擇)，從D到E(E有兩種選擇)，再?gòu)腅到F,五個(gè)階段。k＝1，2，3，4，5。5.2.1 動(dòng)態(tài)規(guī)劃的基本概念動(dòng)態(tài)規(guī)劃的基本概念狀態(tài)和狀態(tài)變量：狀態(tài)表示某一階段初所處的位置或狀況。通常一個(gè)階段包含若干個(gè)狀態(tài)。描述狀態(tài)的變量稱為狀態(tài)變量，常用sk表示第k階段的某一狀態(tài)，狀態(tài)變量sk的集合稱為狀態(tài)集合，用Sk表示。5.2.1 動(dòng)態(tài)規(guī)劃的基本概念在例4中，第一階段狀態(tài)為A,第二階段狀態(tài)：B1，B2，或s1=A， s21=B1 ，s22= B2。狀態(tài)變量的集合:S1 = {A}S2 ＝ {B1，B2 }S3 ＝ {C1，C2， C3，C4 }S4＝{D1，D2，D3}S5＝{E1，E2 }動(dòng)態(tài)規(guī)劃中的狀態(tài)應(yīng)具有如下性質(zhì)：代表性。能夠反映過程的演變特征?？芍?。能夠通過某種方式，直接或間接地確定下來。無后效性。所謂無后效性，是指某階段的狀態(tài)，只對(duì)該階段狀態(tài)以后過程的演變起作用，而不受以前各階段狀態(tài)的影響。這就是說，過程的過去歷史只能通過當(dāng)前的狀態(tài)去影響它的未來的發(fā)展，當(dāng)前的狀態(tài)就是未來過程的初始狀態(tài)5.2.1 動(dòng)態(tài)規(guī)劃的基本概念5.2.1 動(dòng)態(tài)規(guī)劃的基本概念要正確地定義狀態(tài)變量，就必須對(duì)問題具有深入的觀察和理解，可以從下面兩個(gè)方面來考慮：把階段連系在一起的因素是什么?需要用什么信息來進(jìn)行當(dāng)前的決策，而不用檢查以前階段所作決策的可行性。5.2.1 動(dòng)態(tài)規(guī)劃的基本概念決策和決策變量:

決策就是某階段狀態(tài)給定以后，從該狀態(tài)演變到下一階段某狀態(tài)的選擇。描述決策的變量，稱為決策變量。常用uk(sk)表示第k階段當(dāng)狀態(tài)為sk時(shí)的決策變量。在實(shí)際問題中，決策變量的取值往往限制在一定范圍內(nèi)，我們稱此范圍為允許決策集合，常用Dk(sk)表示第k階段從狀態(tài)sk出發(fā)的允許決策集合，顯然有：uk(sk)

Dk(sk) 。5.2.1 動(dòng)態(tài)規(guī)劃的基本概念5.2.1 動(dòng)態(tài)規(guī)劃的基本概念在例4中，從第二階段的狀態(tài)集合為S2={B1,B2}

，從B1出發(fā)，允許決策集合為：D2(B1)＝{C1，C2，C3}如我們決定選擇C3：，則可表為：u2(B1)＝C3策略和最優(yōu)策略:由第1階段開始到最后一個(gè)階段終點(diǎn)為止的過程，稱為問題的全過程。由每階段的決策uk(sk)組成的決策序列就構(gòu)成一個(gè)全過程策略，簡(jiǎn)稱為策略，記為P1,n：P1,n(s1)={u1(s1),u2(s2),…

,un(sn)}由過程的第k階段開始到終點(diǎn)為止的過程，稱為原過程的后部子過程(或稱為k子過程)。其決策函數(shù)序列稱為k子過程策略，簡(jiǎn)稱子策略，記為Pk,n

即：Pk,n(sk)={uk(sk),uk+1(sk+1),…

,un(sn)}5.2.1 動(dòng)態(tài)規(guī)劃的基本概念– 允許策略集合用P表示。從允許策略集合中找出達(dá)到最優(yōu)效果的策略稱為最優(yōu)策略。在上圖中，用P1,5={A，B1，C2，D2，E1，F(xiàn)}是一個(gè)策略，P3,5={C2，D2，E1，F(xiàn)}

是P1,5的一個(gè)子策略。5.2.1 動(dòng)態(tài)規(guī)劃的基本概念狀態(tài)轉(zhuǎn)移方程動(dòng)態(tài)規(guī)劃中本階段的狀態(tài)往往是上一階段狀態(tài)和上一階段的決策結(jié)果。如果給定了第k段的狀態(tài)sk

，則第k+1段的狀態(tài)sk+1

也就完全確定。狀態(tài)轉(zhuǎn)移方程：由k段到k十l段的狀態(tài)轉(zhuǎn)移規(guī)律,sk+1

=Tk

(sk,uk)。例4中，狀態(tài)轉(zhuǎn)移方程為：sk+1

= uk(sk)5.2.1 動(dòng)態(tài)規(guī)劃的基本概念動(dòng)態(tài)規(guī)劃的基本概念指標(biāo)函數(shù)及最優(yōu)指標(biāo)函數(shù)在多階段決策過程最優(yōu)化問題中，用來衡量所實(shí)現(xiàn)過程的優(yōu)劣的數(shù)量指標(biāo)，稱為指標(biāo)函數(shù)；它是一個(gè)定義在全過程和所有后部子過程上的確定的數(shù)量函數(shù)，常用Vk,n表示．即：Vk,n=

Vk,n（sk,sk+1,…,sn）指標(biāo)函數(shù)Vk,n的最優(yōu)值，稱為相應(yīng)的最優(yōu)指標(biāo)函數(shù)，記為fk(sk)。5.2動(dòng)態(tài)規(guī)劃的基本概念和基本原理5.1.2.動(dòng)態(tài)規(guī)劃的基本原理Bellman最優(yōu)化原理作為整個(gè)過程的最優(yōu)策略具有這樣的性質(zhì)：即無論過去的狀態(tài)和決策如何，對(duì)前面的決策所形成的狀態(tài)而言，余下的諸決策必須構(gòu)成最優(yōu)策略。結(jié)合例4最短路線問題介紹動(dòng)態(tài)規(guī)劃的基本思想。從過程的最后一段開始，用逆序遞推方法求解，逐步求各段各點(diǎn)到終點(diǎn)廠的最短路線，最后求得A點(diǎn)到F點(diǎn)的最短路線。5.1.2.動(dòng)態(tài)規(guī)劃的基本原理

第一步，從s＝5開始，狀態(tài)變量s5可取兩種狀態(tài)E1，E2，它們到F點(diǎn)的路長(zhǎng)分別為f5

(E1

)

4 f5

(E2

)

3第二步，k＝4，狀態(tài)變量s5可取三個(gè)值D1，D2，D3，這是經(jīng)過一個(gè)中途點(diǎn)到達(dá)終點(diǎn)F的兩級(jí)決策問題，從D1到F只有兩條路線，需加以比較，取其中最短的，即：

1 2 5 2

1 1 5 1

min

d(D,E)

) 3

d(D

E )

(E )

(D1

)

min

2 2 5 2

d(D

E )

f(E

)

(D2

)

(E1

)f4(D2)

min14 1u*(D)

E2u*(D )

E4 2

min

3 2 5 2

d(D,E)

f(E

)

(D3,

)

(E1

)f4

(D3

)

minu*(D)

E4 3 1u*(C)

D3 4 3f3

(C4

)

9u*(C)

D3 3 2f3

(C3

)

8u*(C)

D3 2 2f3

(C2

)

103 1 1u*(C)

D3 1k

3時(shí),

)

122 2 3u*(B)

Cf2

(B2

)

152u*(B)

C2 1k

2時(shí),

(B1

)

132 11d

(

)

f (B

min

2 2 2

(

)

f (B

)

1時(shí),

(

min最短路為17,路徑為A

Fu*(A)

B1 1圖7-2

(s6

)

f (s )} k

5,4,3,2,1k

1 k

1(sk,

ukkfk(sk)

min{duk動(dòng)態(tài)規(guī)劃方法的基本思想：將多階段決策過程劃分階段，恰當(dāng)?shù)剡x取狀態(tài)變量、決策變量及定義最優(yōu)指標(biāo)函數(shù)，從而把問題化成一族同類型的子問題，然后逐個(gè)求解。求解時(shí)從邊界條件開始，逆(或順)過程行進(jìn)方向，逐段遞推尋優(yōu)。在每一個(gè)子問題求解時(shí)，都要使用它前面已求出的子問題的最優(yōu)結(jié)果，最后一個(gè)子問題的最優(yōu)解，就是整個(gè)問題的最優(yōu)解。動(dòng)態(tài)規(guī)劃方法是既把當(dāng)前一段與未來各段分開，又把當(dāng)前效益和未來效益結(jié)合起來考慮的一種最優(yōu)化方法，因此每段的最優(yōu)決策選取是從全局考慮的，與該段的最優(yōu)選擇一般是不同的。5.1.2.動(dòng)態(tài)規(guī)劃的基本原理Bellman最優(yōu)化原理：作為整個(gè)過程的最優(yōu)策略具有這樣的性質(zhì)：即無論過去的狀態(tài)和決策如何，對(duì)前面的決策所形成的狀態(tài)而言，余下的諸決策必須構(gòu)成最優(yōu)策略。

1(s )

動(dòng)態(tài)規(guī)劃的基本方程是遞推逐段求解的根據(jù)，一般的動(dòng)態(tài)規(guī)劃基本方程可以表為：

fk(sk

)

opt {vk(sk,

uk)

1(sk

)}

Dk(

sk)

1,...,15.1.2.動(dòng)態(tài)規(guī)劃的基本原理動(dòng)態(tài)規(guī)劃的基本解題步驟如下：第一步：劃分階段；第二步：確定狀態(tài)變量及其取值范圍；代表性。2)可知性。3)無后效性。第三步：確定決策變量及其取值范圍；第四步：建立狀態(tài)轉(zhuǎn)移方程；第五步：確定指標(biāo)函數(shù)第六步：建立動(dòng)態(tài)規(guī)劃基本方程，然后從k＝n開始，逐段向前推移，直到求出f1(s1)時(shí)，就得到了整個(gè)過程的最優(yōu)解，包括最優(yōu)策略和相應(yīng)的最優(yōu)指標(biāo)函數(shù)值5.1.2.動(dòng)態(tài)規(guī)劃的基本原理動(dòng)態(tài)規(guī)劃模型的建立與求解動(dòng)態(tài)規(guī)劃模型的建立

資源分配問題例5 某公司有資金10萬元，若投資于項(xiàng)目j(j＝1，2，3)的投資額為xi時(shí)，其收益分別為g1(x1)3＝4x1，g2(x2)＝9x2，g3(x3)＝2x

2，問應(yīng)如何分配投資數(shù)額才能使總收益最大?

0 (i

1,2,3)

103maxz

4x1

9x2

2x2且滿足約束這是一個(gè)與時(shí)間無明顯關(guān)系的靜態(tài)最優(yōu)化問題，可列出其靜態(tài)模型：求x1，x2，x2：，使5.3.1動(dòng)態(tài)規(guī)劃模型的建立

用動(dòng)態(tài)規(guī)劃方法求解：基本方程：3階段k：k=1,2,3狀態(tài)變量sk

：第k段可以投資于第k項(xiàng)到第3個(gè)項(xiàng)目的資金數(shù)。決策變量xk

：決定給第k個(gè)項(xiàng)目投資的資金數(shù)。狀態(tài)轉(zhuǎn)移方程：

sk+1＝

。指標(biāo)函數(shù)：Vk

(

k最優(yōu)指標(biāo)函數(shù)人fk(sk)：當(dāng)可投資金數(shù)為sk時(shí)，投資第k——3項(xiàng)所得的最大收益數(shù)k k k k k

1 k

skf (

s )

max

{g (

x )

f (

s )} k

2,1

f4(

s4)

05.3.1動(dòng)態(tài)規(guī)劃模型的建立收益船廠012345A035789B046899C0137910例6 船舶總公司擬將5萬元資金投放到下屬A、B、C三個(gè)船廠，各船廠在獲得資金后的收益如表5-1所示。試用動(dòng)態(tài)規(guī)劃方法求使總收益最大的投資分配方案。表5-15.3.1動(dòng)態(tài)規(guī)劃模型的建立解：階段k：k=1,2,3狀態(tài)變量sk

：第k段可以投資于第k項(xiàng)到第3個(gè)項(xiàng)目的資金數(shù)。

{5}

,1,

5} k

k決策變量xk

:為第k階段分配給第k個(gè)船廠的資金數(shù)。顯然:Dk(sk)

{0,1,2,3,

5} k

3– 狀態(tài)轉(zhuǎn)移方程：sk

1,2,

xk5.3.1動(dòng)態(tài)規(guī)劃模型的建立xk

Dk(sk

)–指標(biāo)函數(shù)：階段指標(biāo)函數(shù)gk(sk)如表5-1所示–最優(yōu)指標(biāo)函數(shù)人fk(sk)：當(dāng)可投資金數(shù)為sk時(shí)，投資第

k——3項(xiàng)所得的最大收益數(shù)–基本方程：

fk(sk

)

ax {gk(xk

)

(

)}4 4k

f (

s )

用逆序法由最后一階段向前推進(jìn)計(jì)算。5.3.1動(dòng)態(tài)規(guī)劃模型的建立x3f3

(s3

)

max{g3

(x3

)

(s4

)}K=3時(shí)：階段s3g3

(x3)f3

(s3

)f4(s4

)x3

*k=300000111012330237703499045101005階段s2x2g2(x2

(

)f3(s2

)x2

*k=20000001000+1=1f3(1)=1144+0=4f3(0)=012000+3=3f3(2)=3144f3(1)=1266f3(0)=023007f3(3)=7147f3(2)=3267f3(1)=1388f3(0)=034009f3(4)=91411f3(3)=71269f3(2)=3389f3(1)=1499f3(0)=050010f3(5)=101413f3(4)=

912613f3(3)=723811f3(2)=34910f3(1)=1599f3(0)=0階段s1x1g1

(x1

)f2

)x1

*k=1500131313141112513837136481245990f1

(5)

14(萬元)最優(yōu)策略(對(duì)船廠A、B、C的資金分配序列)是：分給船廠A 1萬元，分給船廠B 1萬元，分給船廠C3萬元最大收益是14萬元。由上述計(jì)算結(jié)果可知:最大收益是：

例4的順序解法：5.3.2.

逆序法與順序法

從k＝0開始，f0

(s1

)

(

k＝2時(shí)，f2

(s3

) 定義有：

(C1

)

(B1

)

(B1

)

u (C)

2 1 1是邊界條件

k＝1時(shí)，f1

(s2

) 定義有：

f1(B1)

(B2

)

u1(B1)

u1(B2)

(B1

)

(B1

)f2(C2)

min3

min

d(B

C )

f(B

)

2 2 1 2

u (C )

2 2 1

(B1

,C3

)

(B1

)2 36

4f (C)

min

d(B,C)

f(B

)

2 3 1 2

u(C)

2 3 1

(C4

)

(B2

)

(B2

)

u2(C4)

B2類似有：

(D1

)

11f3

(D2

)

12f3

(D3

)

14f4

(E1

)

14f4

(E2

)

14f5

)

17u3

(D1

)

C1或C2u3

(D2

)

C2u3(D3)

C3u4(E1)

D1u4(E2)

D2u5(F

)

E2路徑為:

F動(dòng)態(tài)規(guī)劃模型的求解：1)離散變量的分段窮舉算法動(dòng)態(tài)規(guī)劃模型中的狀態(tài)變量與決策變量若被限定只能取離散值，則可采用分段窮舉法。用分段窮舉法求最優(yōu)指標(biāo)函數(shù)值時(shí)，要正確確定每段狀態(tài)變量取值范圍及允許決策集合的范圍。連續(xù)變量的解法當(dāng)動(dòng)態(tài)規(guī)劃模型中狀態(tài)變量與決策變量為連續(xù)變量，就要根據(jù)方程的具體情況靈活選取求解方法，如經(jīng)典解析方法、線性規(guī)劃方法、非線性規(guī)劃法或其它數(shù)值計(jì)算方法等?？捎媚嫘蚪夥ê晚樞蚪夥▉砬蠼?。連續(xù)變量的離散化解法5.3.2.

逆序法與順序法

3,2,10

sk例5

某公司有資金10萬元，若投資于項(xiàng)目j(j＝1，2，3)的投資額為xi時(shí)，其收益分別為g1(x1)＝4x1，g2(x2)＝9x2，g3(x3)＝2x32，問應(yīng)如何分配投資數(shù)額才能使總收益最大?解：階段k=1,2,3;狀態(tài)變量sk

為第k段可以投資于第k項(xiàng)到第3個(gè)項(xiàng)目的資金數(shù)；決策變量xk

決定給第k個(gè)項(xiàng)目投資的資金數(shù)；狀態(tài)轉(zhuǎn)移方程：

sk+1

＝

；最優(yōu)指標(biāo)函數(shù)fk(sk)表示當(dāng)可投資金數(shù)為sk時(shí)，投資第k到第3項(xiàng)所得的最大收益數(shù)；f1(s1)

為所求的總收益；遞推方程：

fk(

sk)

max{gk(xk

)

(

)}4 4

f (

s )

0(a)用逆序解法解例5 3 3 33 30

sk＝3時(shí)，f (s

)

max

{2x2}k＝2時(shí)，

2(s

x )2}2 222 3

2s2}

max

{9x

max

{9x0

s20

s222 2f (s )

max

{9x

(s3)}0

s222

4(s2

)

0令 h2

(s2

)

9x2

2(sdh22

0 x2

29 d

h4 d

2xx2

2則極大值在[0,

s ]端點(diǎn)取得f (0)

2s2

f (s )

9s2 2 2 2 294dx是極小值x*

時(shí),

有最大值2s23 3 32 22 2 22 22 2 222當(dāng)s

時(shí),

f (0)

f (s ),

此時(shí)x*

02s

時(shí),

f (0)

f (s ),

此時(shí)x*

sk＝1時(shí)，f1(s1)

max{4

(

s2)} 當(dāng)f2

(

)

9s2時(shí),但此時(shí)

與s2

2矛盾故舍去0

s11f1

(10)

max{4x1

9s1

9x1

)}

max{9s1

5x1

)}

9s1x*

10 0

102令f (0)

f (s

)時(shí),2s2

, 則s

92 2 2 2 2 22 2 2 11 1 10

10當(dāng)f (s )

2時(shí),

(10)

max

2(s

x )2

}211 1 1 1 1 1

4(s1

x1)

01d

2hdx2解得x1

而

所以x1

1是極小點(diǎn).1比較[0,10]兩個(gè)端點(diǎn),

0時(shí),

(10)

200x

10時(shí),

(10)

所以,

01 1 1再由狀態(tài)方程順推,

102 1 1因?yàn)閟

所以x*

102 2 3 2 2所以 x*

103 3max

200萬元令h

x )

2(s

x ) ,由dhdx階段劃分和決策變量設(shè)置同逆序法；

狀態(tài)變量sk+1

表示可用于第1個(gè)到第k個(gè)項(xiàng)目投資的資金數(shù):s4＝10，s3＝s4–x3，s2＝s3–x2，s1＝s2–x1

;狀態(tài)轉(zhuǎn)移方程：

sk＝

sk+1

；最優(yōu)指標(biāo)函數(shù)fk(sk+1)表示第k階段投資金數(shù)為sk+1時(shí)，投資第1到第k項(xiàng)所得的最大收益數(shù)；

遞推方程：

(

)

1,2,3max {gk(xk

)

(

)}0

10 1

f (s)

0 (b)用順序解法解例5 1 20

s2當(dāng)k

f1(s2

)

max{g1(

x1)

(s1

)}1 2

max

{4x

}

4s0

max

{5x2

4s3

}

9s30

4(s3

)}

max{9x2

4s2

}

max

{9x20

s3 0

s30

s3當(dāng)k

(s3

)

max

{9x2

f1(s2

)}x*

s1 2x*

s2 33

x )}4

9(s2 3 33 4 3f (

s )

max

f (

s )}

max

s4 0

s4當(dāng)k=3時(shí)93所以x*

103dx2則極大值在[0,

]端點(diǎn)取得當(dāng)x3

0時(shí),

(10)

90,當(dāng)x3

10時(shí)f3

(10)

200d2h

0 則x3

是極小點(diǎn)3解得x

4333令 h(s,x)

2x2

9(s

)4 3 3 4dx由 dh

0再由狀態(tài)方程逆推,

03 3x*

0, x*

02 2 3 2 1同逆序法結(jié)果相同max

200萬元xksk

skk kk k k

1 k

skf (

s )

max

{g (

x )

f (

s )} k

n,n

1,...,1

(

)

0狀態(tài)轉(zhuǎn)移方程 :

1,2,...,

an3)連續(xù)變量的離散化解法投資分配問題的一般靜態(tài)模型為：max

(

1動(dòng)態(tài)規(guī)劃模型，其基本方程為：5.3.2.

逆序法與順序法由于sk與xk都是連續(xù)變量，當(dāng)各階段指標(biāo)gk(xk)沒有特殊性質(zhì)而較為復(fù)雜時(shí)，要求出fk(sk)會(huì)比較困難，這時(shí)常常把連續(xù)變量離散化求其數(shù)值解。具體做法如下：把a(bǔ)分成m份，每份

大小。Sk的取值范圍為：{0

，2

,…,m

}

，

的大小可依據(jù)問題所要求的精度以及計(jì)算機(jī)的容量來定。決策變量xk也在離散點(diǎn)0，

，2

， … ，m

上取值，相應(yīng)的指標(biāo)函數(shù)fk(sk)就被定義在這些離散值上，于是:02

a(m

)… …012qmq

＝sk，

xk＝p

5.3.2.

逆序法與順序法(c)按逆序（或順序）方法，逐步遞推求出fn(sn),

…，f1(s1) ，最后求出最優(yōu)資金分配方案。

0 (i

1,2,3)

10maxz

2x2 且滿足約束1 2 3解: 令

＝2，將區(qū)間[0，l0]分割成0，2，4，6，8，10六個(gè)點(diǎn)，即狀態(tài)變量sk集合為{0，2，4，6，8，10}；允許決策集合為0

，xk與sk均在分割點(diǎn)上取值。例5

n,n

1,...,1p

,1,

,...,

(

)

fk(

sk)

max {gk(

)

(

)}其中q

＝

，

＝p

遞推方程就變?yōu)榱耍菏街衳3與s3的集合均為：{0，2，4，6, 8，10}。計(jì)算結(jié)果見表7—1。3 3 30

s3當(dāng)k＝3時(shí)，

f (s

)

max

{2x2}

表7-1階段skxkvkvkn=vk+fk+1fkPkn

*30022x3

=0000228882443232324667272726881281281288101020020020010指標(biāo) 最優(yōu)指標(biāo)

最優(yōu)決策

表7-2階段skxkvkvkn=vk+fk+1fkPkn

*2009x2=000020002-022x9=1818+0184000+32=324-022x9=1818+8=2644x9=3636+0=36366000+72=72720-622x9=1818+32=5044x9=3636+8=4465454+0=54810指標(biāo)計(jì)算結(jié)果見表7

2最優(yōu)指標(biāo)

最優(yōu)決策k

2時(shí),

(s2

)

max{9x2

f3(s2

)}0

s2階段skxkvkvkn=vk+fk+1fkPkn

*28000+128=1281280-822x9=1818+72=9044x9=3636+32=6865454+8=6287272+0=7210000+200=2002000-1022x9=1818+1282=14644x9=3636+72=10865454+32=8687272+8=80109090+0=90

表7-2指標(biāo)計(jì)算結(jié)果見表7

2最優(yōu)指標(biāo)

最優(yōu)決策k

2時(shí),

(s2

)

max{9x2

f3(s2

)}0

表7-3階段skxkvkvkn=vk+fk+1fkPkn

*11004x1=00+200=2002000-0-10288+128=13644x4=1624+36=6062454+32=8683232+18=50104040+0=40最優(yōu)指標(biāo)

最優(yōu)決策x1

)} 計(jì)算結(jié)果見表7

3指標(biāo)k

1時(shí),

(s1

)

max{4x1

(s10

10計(jì)算結(jié)果表明，最優(yōu)決策為：x1*＝0，x2*＝0，x3*＝10，最大收益為f1(10)＝200，與例5結(jié)論完全相同。5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用5.4.1背包問題（裝載問題）n一位旅行者攜帶背包去登山，已知他所能承受的背包重量限度為a千克，現(xiàn)有n種物品可供他選擇裝入背包，第i種物品的單件重量為ai千克，其價(jià)值(可以是表明本物品對(duì)登山的重要性的數(shù)量指標(biāo))是攜帶件數(shù)xi的函數(shù)ci(xi)

(i=1,2,...,n),問旅行者應(yīng)如何選擇攜帶各種物品的件數(shù)，以使總價(jià)值最大？靜態(tài)數(shù)學(xué)模型：

max

(xi

1ns.t.i ia

0 且為整數(shù)(i

2,...,

n)5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用

1狀態(tài)轉(zhuǎn)移方程：sk

xk0 1k

1,2,...,

f (s)

0xk允許決策集合：Dk

(

)

{xk

0,1,

2,...,[

]}–最優(yōu)指標(biāo)函數(shù)：

(

)–基本方程：

(

)

max{ck

(

)

(

)}

動(dòng)態(tài)規(guī)劃順序法：–階段k：(k=1,2,…,n)

按裝入物品排序–狀態(tài)變量sk

：第k段開始時(shí)裝入前k種物品的總重量。–決策變量xk

:裝入第k件物品的件數(shù)。5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用狀態(tài)轉(zhuǎn)移方程：

skak

xkn

1 n

n,...,

2,1xk允許決策集合：Dk(xk)

{0,1,2,...,[sk

/ak]}–最優(yōu)指標(biāo)函數(shù)：

(

)–基本方程：

(

)

max{ck

(

)

(

)}

s )

動(dòng)態(tài)規(guī)劃逆序法：–階段k：(k=1,2,…,n)

按裝入物品排序–狀態(tài)變量sk

：第k段開始時(shí)剩余的空間。–決策變量xk

:裝入第k件物品的件數(shù)。5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用例7

今有三種貨物需要裝船，各種貨物的重量與運(yùn)輸利潤(rùn)關(guān)系如圖5-7所示。船的最大裝載能力為w＝6(t)，問應(yīng)如何裝載才能使總利潤(rùn)最大?貨物種類(i)貨物質(zhì)量(Wi)(t)利潤(rùn)(vi)(千元）12823133418動(dòng)態(tài)規(guī)劃逆序法：階段k：(k=1,2,3)

按裝入物品排序狀態(tài)變量sk

：第k段開始時(shí)剩余的空間(可裝載第k種至第n種的載貨量。決策變量xk

:裝入第k件貨物的數(shù)量。5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用狀態(tài)轉(zhuǎn)移方程： sk

skwk

指標(biāo)函數(shù)：階段指標(biāo)即為第k階段裝載xk件貨物時(shí)所創(chuàng)的利潤(rùn)vkxk。– 基本方程：xk

Dk(sk

)sk

,1,...,6}

fk(sk

)

max {vk

(

)}

Dk(sk

)sk

,1,...,6}

max {vk

1(sk

wkxk)}k

2,1

f (

s )

4 4

5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用K=3時(shí)：s3s4=s3-4x3K=2時(shí)：K=1時(shí)：5.4.2

生產(chǎn)存貯問題（庫(kù)存問題）

如果已知某企業(yè)所生產(chǎn)產(chǎn)品的生產(chǎn)費(fèi)用、存貯費(fèi)用和市場(chǎng)的需要量，在其生產(chǎn)能力和存貯能力許可的前提下，正確確定各個(gè)時(shí)期的生產(chǎn)量，使既完成交貨計(jì)劃，又使總支出最少，這就是生產(chǎn)與存貯問題。例8

某船廠根據(jù)合同，從當(dāng)年起連續(xù)4年年末要為客戶提供規(guī)格型號(hào)相同的大型客貨船，每年的交船數(shù)及生產(chǎn)每艘船的生產(chǎn)費(fèi)用如表5—5所示。5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用4i

di該廠的生產(chǎn)能力為每年6艘船。在進(jìn)行生產(chǎn)的年度，船廠還要支出經(jīng)常費(fèi)用60萬元。若造出的船當(dāng)年不交貨，則每艘船每積壓一年造成的積壓損失費(fèi)為40萬元。假定開始時(shí)及第四年年未交貸后均無積壓船只，問船廠應(yīng)如何安排這四年的生產(chǎn)計(jì)劃，使所花的總費(fèi)用為最低?解：動(dòng)態(tài)規(guī)劃逆序法：階段k：(k=1,2,3,4)狀態(tài)變量sk

：第k階段初貯存(積壓)的船數(shù)。–決策變量xk

:為第k階段生產(chǎn)的船數(shù)。sk

k s1

0xk

最大庫(kù)存量4xk

dii

kxk

kksk

6(k

dii

15.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用狀態(tài)轉(zhuǎn)移方程：sk

dk k

1,2,3,

4– 基本方程：k

1 k

f (

s )} k

1,2,3,

4k kk kk0

6f (

s )

min

{v (

s ,

f5(s5)

0– 指標(biāo)函數(shù)vk

：就是第k年度的生產(chǎn)成本(包括生產(chǎn)費(fèi)用與存貯費(fèi)用兩部分)。

0.6

ckxk

0.4

sk 若xk

0vk(sk,xk)

1,2,3,

4k k

0.4

s 若x

0k＝2時(shí)，d2＝3k＝1時(shí)，x1*＝1，x2*=5，x3*＝0，x4*＝25.4.3

設(shè)備更新問題

設(shè)備更新問題一般提法：在已知一臺(tái)設(shè)備的效益函數(shù)r(t)，維修費(fèi)用函數(shù)u(t)及更新費(fèi)用函數(shù)c(t)條件下，要求在n年內(nèi)的每年年初作出決策,

是繼續(xù)使用舊設(shè)備還是更換一臺(tái)新的，使n年總效益最大。rk(t)：在第k年設(shè)備已使用過t年(或稱役齡為t年)，再使用1年時(shí)的效益。uk(t)：在第k年設(shè)備役齡為t年，再使用一年的維修費(fèi)用。ck(t)：在第k年賣掉一臺(tái)役齡為t年的設(shè)備，買進(jìn)一臺(tái)新設(shè)備的更新凈費(fèi)用。a為折扣因子(0

1)，表示一年以后的單位收入價(jià)值相當(dāng)于現(xiàn)年的a單位。5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用動(dòng)態(tài)規(guī)劃模型：階段k：表示計(jì)劃使用該設(shè)備的年限數(shù)。(k=1,…,n)狀態(tài)變量sk

：第k年初設(shè)備已使用過的年數(shù)，即役齡。決策變量xk

:是第k年初更新(Replacement)，還是保留使用(keep)舊設(shè)備，分別用R與K表示。狀態(tài)轉(zhuǎn)移方程為：5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用–階段指標(biāo)為：k

1ks

1 當(dāng)xk

K(keep

)

1 當(dāng)xk

(

Replacement

)v (s ,

x )

rk(sk)

uk(sk

)若xk

Kj k kk k kk

r(0)

u (0)

c (s ) 若x

R5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用–指標(biāo)函數(shù)為：k kj kf (

s )

max

{v (

skk

1 k

x )

f (

s )} k

n,n

...,1

或R

(

)

0實(shí)際上：–最優(yōu)指標(biāo)函數(shù)為：Vk

,n(k

1,2,...,

n)nj

vj(sk,

xk)k k k

kr (

s )

uk(

sk)

1)fk(sk)

max當(dāng)xk

Kkk kk

r (0)

u (0)

c (

s )

kk(1) 當(dāng)x

s )

1 n

1例：設(shè)某臺(tái)新設(shè)備的年效益及年均維修費(fèi)用、更新凈費(fèi)用如下表，試確定今后五年內(nèi)的更新策略，使總效益最大。（設(shè)a=1）（單位：萬元）役齡項(xiàng)目012345效益

rk(t)54.543.7532.5運(yùn)行費(fèi)

uk(t)0.511.522.53更新費(fèi)

ck(t)0.51.52.22.533.55.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用解：n=55 5 5 55 5r(s)

u(s

)

5 f(s)

max

Kx5

(0)

(s5

)狀態(tài)變量s5可取1，2，3，4f (1)

max

(1)

(1) x5

K逆序法55 5 55

r(0)

u (0)

c (1) x

max

4.5

3.5x (1)

0.5

1.5

f (2)

max

(2)

(2)x5

K55 555

r(0)

u (0)

(2) x

max

1.5

2.5x(2)

0.5

2.2

f (3)

max

r5(3)

(3) x5

K55 5 55

r(0)

u (0)

c (3) x

max

3.75

2 x (3)

0.5

2.5

f(4)

max

r5(4)

(4)x5

K55 555

r(0)

u(0)

(4) x

max

2.5

1.5x(4)

0.5

5 5 5 5x5

Kx5

R5 5r(s)

u(s

)

5 f(s)

max

(0)

(s5

)r4

(s4

)

(s4

)

(s4

1)x4

K4 44 4 4 54k

4 f (s )

max

r(0)

u (0)

(s )

f (1) x

狀態(tài)變量s4可取1，2，35 4x4

Kx4

R4r4

(

)

(

)

f (

1)4

max

4.5

2.5

6.5x (1)

0.5

1.5

3.5

f (1)

maxs4

(0)

c4(

)

(1)

Kx4

R4r4(s4)

u4(s4)

f5(s4

1)4

max

1.5

5.8x (2)

0.5

2.2

3.5

f (2)

maxs4

r4(0)

(0)

(s4

)

(1)

(s4

)

(s4

)

(s4

1)x4

K4 44 4 4 54k

4f (s )

max

r(0)

u (0)

(s )

f (1) x

r4(s4)

u4(s4)

f5(s4

1)x4

Kx4

R4s4

34f (3)

max

3.75

1.5

5.5x(3)

0.5

2.5

3.5

(0)

(s4

)

(1)

3 3 3 3 4 3x3

Kx3

R3 3r(s)

u(s)

f(s

1)k

3 f(s)

max

(0)

(s3

)

(1)此時(shí)s3可取1或24 3r3

(

)

(

)

f (s

1)x3

Kx3

R3s3

13f (1)

max

4.5

5.8

9.5x (1)

0.5

1.5

6.5

(0)

(

)

4(1)

4 3r3

(

)

(

s3)

f (

1)x3

Kx3

R3s3

23f (2)

max

1.5

5.5

8.8x (2)

0.5

2.2

6.5

(0)

(

)

4(1)

(

)

(

)

(

1)x2

R2s2

12f (1)

max

4.5

8.8

12.5x (1)

0.5

1.5

9.5

(0)

c2(

s2)

(1)

f (s

)

max

(s2

)

(s2

)

(s2

1)x2

K2 22 2 2 32k

r(0)

u (0)

c(s)

f (1) x

2由于狀態(tài)s2只能取1，所以有f(s)

max

r1(s1)

u1(s1

)

f2(s1

1)x1

K1 11 1 1 21k

r(0)

u(0)

c(s

)

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

運(yùn)籌學(xué)課件：空中交通系統(tǒng)動(dòng)態(tài)規(guī)劃

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

運(yùn)籌學(xué)課件：空中交通系統(tǒng)動(dòng)態(tài)規(guī)劃

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔