動(dòng)態(tài)規(guī)劃相關(guān)知識(shí)

上傳人：1*** IP屬地：浙江上傳時(shí)間：2025-03-09 格式：PPTX 頁數(shù)：68 大?。?90.77KB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩63頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

動(dòng)態(tài)規(guī)劃(Dynamicprogramming)動(dòng)態(tài)規(guī)劃的基本思想最短路徑問題投資分配問題背包問題

動(dòng)態(tài)規(guī)劃是解決多階段決策過程最優(yōu)化問題的一種方法。由美國(guó)數(shù)學(xué)家貝爾曼（Ballman）等人在20世紀(jì)50年代提出。他們針對(duì)多階段決策問題的特點(diǎn)，提出了解決這類問題的“最優(yōu)化原理”，并成功地解決了生產(chǎn)管理、工程技術(shù)等方面的許多實(shí)際問題。動(dòng)態(tài)規(guī)劃是現(xiàn)代企業(yè)管理中的一種重要決策方法，可用于最優(yōu)路徑問題、資源分配問題、生產(chǎn)計(jì)劃和庫存問題、投資問題、裝載問題、排序問題及生產(chǎn)過程的最優(yōu)控制等。動(dòng)態(tài)規(guī)劃模型的分類：以“時(shí)間”角度可分成：

離散型和連續(xù)型。從信息確定與否可分成：

確定型和隨機(jī)型。從目標(biāo)函數(shù)的個(gè)數(shù)可分成：

單目標(biāo)型和多目標(biāo)型。7-1動(dòng)態(tài)規(guī)劃的基本原理多階段決策過程最優(yōu)化多階段決策過程是指這樣一類特殊的活動(dòng)過程，他們可以按時(shí)間順序分解成若干相互聯(lián)系的階段，在每個(gè)階段都要做出決策，全部過程的決策是一個(gè)決策序列，所以多階段決策問題也稱為序貫決策問題。例7-1生產(chǎn)與存儲(chǔ)問題某工廠每月需供應(yīng)市場(chǎng)一定數(shù)量的產(chǎn)品。供應(yīng)需求所剩余產(chǎn)品應(yīng)存入倉庫，一般地說，某月適當(dāng)增加產(chǎn)量可降低生產(chǎn)成本，但超產(chǎn)部分存入倉庫會(huì)增加庫存費(fèi)用，要確定一個(gè)每月的生產(chǎn)計(jì)劃，在滿足需求條件下，使一年的生產(chǎn)與存儲(chǔ)費(fèi)用之和最小。例7-2投資決策問題某公司現(xiàn)有資金Q億元，在今后5年內(nèi)考慮給A、B、C、D四個(gè)項(xiàng)目投資，這些項(xiàng)目的投資期限、回報(bào)率均不相同，問應(yīng)如何確定這些項(xiàng)目每年的投資額，使到第五年末擁有資金的本利總額最大。例7-3設(shè)備更新問題企業(yè)在使用設(shè)備時(shí)都要考慮設(shè)備的更新問題，因?yàn)樵O(shè)備越陳舊所需的維修費(fèi)用越多，但購(gòu)買新設(shè)備則要一次性支出較大的費(fèi)用?，F(xiàn)在某企業(yè)要決定一臺(tái)設(shè)備未來8年的更新計(jì)劃，已預(yù)測(cè)到第j年購(gòu)買設(shè)備的價(jià)格為Kj，Gj為設(shè)備經(jīng)過j年后的殘值，Cj為設(shè)備連續(xù)使用j-1年后在第j年的維修費(fèi)用(j=1,2…8)，問應(yīng)在哪年更新設(shè)備可使總費(fèi)用最小。動(dòng)態(tài)規(guī)劃的基本概念階段；狀態(tài)；決策和策略；狀態(tài)轉(zhuǎn)移；指標(biāo)函數(shù)。例7-4（不定階段最短路線問題）如圖是一個(gè)五座城市的及其相連道路的交通圖，線上的數(shù)字是對(duì)應(yīng)的路長(zhǎng)。問：應(yīng)如何選擇行駛路線，才能使從A、B、C、D各城市到E城市的行駛路程最短？AEDCB252755610.53從圖中可以看出，任意兩座城市之間都有道路相通。我們把從一座城市直達(dá)另一座城市作為一個(gè)階段。例從A城市到E城市的階段數(shù)，少則一個(gè)（例從A城市直達(dá)E城市），多則無限（例從A城市通過其他B、C、D三城市循環(huán)到E城市）。為避免循環(huán)，加上約束條件：每個(gè)城市至多經(jīng)過一次。于是從A城市到達(dá)E城市的階段數(shù)有下列四種情形：1.從A城市直達(dá)E城市，一個(gè)階段。于是從A城市到達(dá)E城市的階段數(shù)有下列四種情形：1.從A城市直達(dá)E城市，一個(gè)階段。2.從A城市通過其他B、C、D三城市之一到E城市，二個(gè)階段。于是從A城市到達(dá)E城市的階段數(shù)有下列四種情形：3.從A城市通過其他B、C、D三城市之二到E城市，三個(gè)階段。于是從A城市到達(dá)E城市的階段數(shù)有下列四種情形：3.從A城市通過其他B、C、D三城市之二到E城市，三個(gè)階段。4.從A城市通過其他B、C、D三城市各一次到E城市，四個(gè)階段。例7-5（一定階段最短路問題）

W先生每天駕車去公司上班。如圖，W先生的住所位于A，公司位于F，圖中的直線段代表公路，交叉點(diǎn)代表路口，直線段上的數(shù)字代表兩路口之間的平均行駛時(shí)間?，F(xiàn)在W先生的問題是要確定一條最省時(shí)的上班路線。A3B14C13D14532B22C23D2E11234C34D35E22FAB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF1階段（Stage）

將所給問題的過程，按時(shí)間或空間特征分解成若干個(gè)相互聯(lián)系的階段，以便按次序去求每階段的解，常用k表示階段變量。我們把從A到F看成一個(gè)五階段問題。2狀態(tài)（State）

各階段開始時(shí)的客觀條件叫做狀態(tài)。描述各階段狀態(tài)的變量稱為狀態(tài)變量，常用sk表示第k階段的狀態(tài)變量，狀態(tài)變量的取值集合稱為狀態(tài)集合，用Sk表示。

動(dòng)態(tài)規(guī)劃中的狀態(tài)具有如下性質(zhì)：

當(dāng)某階段狀態(tài)給定以后，在這階段以后的過程的發(fā)展不受這段以前各段狀態(tài)的影響。即：過程的過去歷史只能通過當(dāng)前狀態(tài)去影響它未來的發(fā)展，這稱為無后效性。如果所選定的變量不具備無后效性，就不能作為狀態(tài)變量來構(gòu)造動(dòng)態(tài)規(guī)劃模型。3決策和策略（DecisionandPolicy）

當(dāng)各段的狀態(tài)確定以后，就可以做出不同的決定（或選擇），從而確定下一階段的狀態(tài)，這種決定稱為決策。決策變量用dk(Sk)表示，允許決策集合用Dk(Sk)表示。

各個(gè)階段決策確定后，整個(gè)問題的決策序列就構(gòu)成一個(gè)策略，用p1,n(d1,d2,…dn)表示。對(duì)每個(gè)實(shí)際問題，可供選擇的策略有一定的范圍，稱為允許策略集合，用P表示。使整個(gè)問題達(dá)到最優(yōu)效果的策略就是最優(yōu)策略。4狀態(tài)轉(zhuǎn)移方程

動(dòng)態(tài)規(guī)劃中本階段的狀態(tài)往往是上一階段的決策結(jié)果。如果給定了第k段的狀態(tài)Sk，本階段決策為dk(Sk)，則第k+1段的狀態(tài)Sk+1由公式：Sk+1=Tk（

Sk，dk）確定，稱為狀態(tài)轉(zhuǎn)移方程。5指標(biāo)函數(shù)

用于衡量所選定策略優(yōu)劣的數(shù)量指標(biāo)稱為指標(biāo)函數(shù)。最優(yōu)指標(biāo)函數(shù)記為fk(Sk)。

動(dòng)態(tài)規(guī)劃的基本思想：

從過程的最后一段開始，用逆序遞推方法求解，逐步求出各段各點(diǎn)到終點(diǎn)E最短路線，最后求出A點(diǎn)到E點(diǎn)的最短路線。AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF當(dāng)K=5時(shí)，此時(shí)d5(S5)=F，其初始狀態(tài)E1或E2，故f5(E1)=4,f5(E2)=2用d5*(S5)表示最優(yōu)決策。AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF當(dāng)K=4時(shí)，有兩個(gè)階段，初始狀態(tài)S4可以是D1、D2或D3。如果S4=D1，則下一步只能取E1，故f4(D1)=r(D1,E1)+f5(E1)=2+4=6最短路線：D1——E1——F最優(yōu)解：d4*(D1)=E1AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF如果S4=D2，則下一步能取E1或E2，故f4(D2)=Minr(D2,E1)+f5(E1)

r(D2,E2)+f5(E2)=Min（4+4，3+2）=5最短路線：D2——E2——F最優(yōu)解：d4*(D2)=E2AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF如果S4=D3，則下一步只能取E2，故f4(D3)=r(D3,E2)+f5(E2)=5+2=7最短路線：D3——E2——F最優(yōu)解：d4*(D3)=E2AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF當(dāng)K=3時(shí)，還有三個(gè)階段，初始狀態(tài)S3可以是C1、C2或C3。如果S3=C1，則下一步能取D1或D2，故f3(C1)=Minr(C1,D1)+f4(D1)

r(C1,D2)+f4(D2)=Min（3+6，3+5）=8最短路線：C1——D2——E2——F最優(yōu)解：d3*(C1)=D2AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF如果S3=C2，則下一步能取D2或D3，故f3(C2)=Minr(C2,D2)+f4(D2)r(C2,D3)+f4(D3)=Min（3+5，2+7）=8最短路線：C2——D2——E2——F最優(yōu)解：d3*(C2)=D2AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF如果S3=C3，則下一步只能取D3，故f3(C3)=r(C3,D3)+f4(D3)=（4+7）=11最短路線：C3——D3——E2——F最優(yōu)解：d3*(C3)=D3AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF當(dāng)K=2時(shí)，還有四個(gè)階段，初始狀態(tài)S2可以是B1或B2。如果S2=B1，則下一步能取C1或C2，故f2(B1)=Minr(B1,C1)+f3(C1)

r(B1,C2)+f3(C2)=Min（4+8，5+8）=12最短路線：B1——C1——D2——E2——F最優(yōu)解：d2*(B1)=C1AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF如果S2=B2，則下一步能取C2或C3，故f2(B2)=Minr(B2,C2)+f3(C2)

r(B2,C3)+f3(C3)=Min（2+8，1+11）=10最短路線：B2——C2——D2——E2——F最優(yōu)解：d2*(B2)=C2AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF當(dāng)K=1時(shí)，五個(gè)階段的原問題，初始狀態(tài)S1是A。則下一步能取B1或B2，故f1(A)=Minr(A,B1)+f2(B1)

r(A,B2)+f2(B2)=Min（3+12，4+10）=14最短路線：A——B2——C2——D2——E2——F最優(yōu)解：d1*(A)=B2，最短用時(shí)14.AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEFAB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEFAB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEFAB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEFAB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEFAB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF動(dòng)態(tài)規(guī)劃的函數(shù)方程（DP）

建立DP函數(shù)方程是指確定過程的階段及階段數(shù)，規(guī)定狀態(tài)變量和決策變量的取法，給出各階段的狀態(tài)集合，允許決策集合，狀態(tài)轉(zhuǎn)移方程和指標(biāo)函數(shù)等。在上面的計(jì)算過程中，利用了第k階段與第k+1階段的關(guān)系：fk(Sk)=Minr(Sk,dk(Sk))+fk+1(Sk+1)

dk(Sk)k=1,2,3,4,5f6(S6)=0

這種遞推關(guān)系稱為動(dòng)態(tài)規(guī)劃的函數(shù)基本方程。貝爾曼(Ballman)最優(yōu)化原理

作為整個(gè)過程的最優(yōu)策略具有這樣的性質(zhì)，即無論過去的狀態(tài)和決策如何，對(duì)前面的決策所形成的狀態(tài)而言，余下的諸決策必須構(gòu)成最優(yōu)策略。這就是說，不管引導(dǎo)到這個(gè)現(xiàn)時(shí)狀態(tài)的頭一個(gè)狀態(tài)和決策是什么，所有的未來決策應(yīng)是最優(yōu)的。動(dòng)態(tài)規(guī)劃的優(yōu)點(diǎn)：可把一個(gè)N維優(yōu)化問題化成N個(gè)一維優(yōu)化問題求解。動(dòng)態(tài)規(guī)劃的優(yōu)點(diǎn)：可把一個(gè)N維優(yōu)化問題化成N個(gè)一維優(yōu)化問題求解。DP方程中附加某些約束條件，可使求解更加容易。動(dòng)態(tài)規(guī)劃的優(yōu)點(diǎn)：可把一個(gè)N維優(yōu)化問題化成N個(gè)一維優(yōu)化問題求解。DP方程中附加某些約束條件，可使求解更加容易。求得最優(yōu)解以后，可得所有子問題的最優(yōu)解。動(dòng)態(tài)規(guī)劃的缺點(diǎn)：“一個(gè)”問題，“一個(gè)”模型，“一個(gè)”求解方法。且求解技巧要求比較高，沒有統(tǒng)一處理方法。動(dòng)態(tài)規(guī)劃的缺點(diǎn)：“一個(gè)”問題，“一個(gè)”模型，“一個(gè)”求解方法。且求解技巧要求比較高，沒有統(tǒng)一處理方法。狀態(tài)變量維數(shù)不能太高，一般要求小于6。

謝謝大家！9、春去春又回，新桃換舊符。在那桃花盛開的地方，在這醉人芬芳的季節(jié)，愿你生活像春天一樣陽光，心情像桃花一樣美麗，日子像桃子一樣甜蜜。3月-253月-25Sunday,March9,2025

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

動(dòng)態(tài)規(guī)劃相關(guān)知識(shí)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

動(dòng)態(tài)規(guī)劃相關(guān)知識(shí)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔