![運籌學之決策論-課件_第1頁](http://file4.renrendoc.com/view/2a35fb9542fa5b64e51867e7055acc76/2a35fb9542fa5b64e51867e7055acc761.gif)
![運籌學之決策論-課件_第2頁](http://file4.renrendoc.com/view/2a35fb9542fa5b64e51867e7055acc76/2a35fb9542fa5b64e51867e7055acc762.gif)
![運籌學之決策論-課件_第3頁](http://file4.renrendoc.com/view/2a35fb9542fa5b64e51867e7055acc76/2a35fb9542fa5b64e51867e7055acc763.gif)
![運籌學之決策論-課件_第4頁](http://file4.renrendoc.com/view/2a35fb9542fa5b64e51867e7055acc76/2a35fb9542fa5b64e51867e7055acc764.gif)
![運籌學之決策論-課件_第5頁](http://file4.renrendoc.com/view/2a35fb9542fa5b64e51867e7055acc76/2a35fb9542fa5b64e51867e7055acc765.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第11章決策論TheoryofDecision11.1決策分析的基本問題11.2確定型和非確定型決策11.3風險型決策
11.4效用理論11.5馬爾可夫決策
運籌學
Operations
Research
第11章決策論11.1決策分析的基本問題
11.1決策分析的基本問題11.1決策分析的基本問題決策(DecisionMaking)是一種對已知目標和方案的選擇過程,當人們已知確定需實現(xiàn)的目標是什么,根據(jù)一定的決策準則,在供選方案中做出決策的過程。諾貝爾獎獲得者西蒙認為,管理就是決策,他認為決策是對稀有資源備選分配方案進行選擇排序的過程。學者Gregory在《決策分析》中提及,決策是對決策者將采取的行動方案的選擇過程。決策科學包括決策心理學、決策的數(shù)量化方法、決策評價以及決策支持系統(tǒng)、決策自動化等。隨著計算機和信息通信技術的發(fā)展,決策分析的研究也得到極大的促進,隨之產(chǎn)生了計算機輔助決策支持系統(tǒng)(DecisionSupportSystem),許多問題在計算機的幫助下得以解決,在一定程度上代替了人們對一些常見問題的決策分析過程。11.1決策分析的基本問題決策(DecisionMaking)是一種對已知目標和方案11.1.1決策分析基本概念決策狹義決策認為決策就是作決定,單純強調(diào)最終結(jié)果;廣義決策認為將管理過程的行為都納入決策范疇,決策貫穿于整個管理過程中。決策目標決策者希望達到的狀態(tài),工作努力的目的。一般而言,在管理決策中決策者追求的當然是利益最大化。決策準則決策判斷的標準,備選方案的有效性度量。決策屬性決策方案的性能、質(zhì)量參數(shù)、特征和約束,如技術指標、重量、年齡、聲譽等,用于評價它達到目標的程度和水平??茖W決策過程任何科學決策的形成都必須執(zhí)行科學的決策程序,如圖11-1所示。決策最忌諱的就是決策者拍腦袋決策,只有經(jīng)歷過圖11-1所示的“預決策→決策→決策后”三個階段,才有可能產(chǎn)生科學的決策11.1決策分析的基本問題11.1.1決策分析基本概念決策狹義決策認為決策就是作11.1決策分析的基本問題調(diào)查研究確定決策目標搜集有關的信息資料預測技術預測未來的可能情況擬訂各種可行方案可行性研究方案評估決策準則方案選擇方案實施預決策決策實施情況反饋意見決策后圖11-1科學決策過程11.1決策分析的基本問題調(diào)查研究確定決策目標搜集有關11.1決策分析的基本問題決策系統(tǒng)狀態(tài)空間、策略空間、損益函數(shù)構成了決策系統(tǒng)。①狀態(tài)空間不以人的意志為轉(zhuǎn)移的客觀因素,設一個狀態(tài)為Si,有m種不同狀態(tài),其集合記為:S稱狀態(tài)空間,S的元素Si稱為狀態(tài)變量。②策略空間人們根據(jù)不同的客觀情況,可能做出主觀的選擇,記一種策略方案為Ui,有n種不同的策略,其集合為:U稱為策略空間;U的元素Uj稱為決策變量。③損益函數(shù)當狀態(tài)處在Si情況下,人們做出Uj決策,從而產(chǎn)生的損益值Vij,顯然Vij是Si,Uj的函數(shù),即:11.1決策分析的基本問題決策系統(tǒng)狀態(tài)空間、策略空間、損11.1決策分析的基本問題當狀態(tài)變量是離散型變量時,損益值構成的矩陣叫損益矩陣上述三個主要素組成了決策系統(tǒng),決策系統(tǒng)可以表示為三個主要素的函數(shù):D=D(S,U,V)人們將根據(jù)不同的判斷標準原則,求得實現(xiàn)系統(tǒng)目標的最優(yōu)(或滿意)決策方案。11.1決策分析的基本問題當狀態(tài)變量是離散型變量時,損益值11.1決策分析的基本問題11.1.2決策分析基本原則1.最優(yōu)化(滿意)原則2.系統(tǒng)原則3.可行性原則4.信息對稱、準全原則11.1決策分析的基本問題11.1.2決策分析基本原則111.1.3決策分析基本分類表11-1按影響范圍戰(zhàn)略決策、戰(zhàn)役決策、戰(zhàn)術決策按狀態(tài)空間確定型決策、非確定型決策、風險型決策按決策時間程序化決策、半程序化決策、非程序化決策按描述方法定性化決策、定量化決策按目標數(shù)量單目標決策、多目標決策按連續(xù)性單級決策、序貫決策按決策者數(shù)量個人決策、群決策按問題大小宏觀決策、微觀決策表11-2程序化、非程序化、半程序化決策決策類型傳統(tǒng)方法現(xiàn)代方法程序化現(xiàn)有的規(guī)章制度運籌學、管理信息系統(tǒng)(MIS)半程序化經(jīng)驗、直覺灰色系統(tǒng)、模糊數(shù)學等方法非程序化經(jīng)驗、應急創(chuàng)新能力人工智能、風險應變能力培訓11.1決策分析的基本問題11.1.3決策分析基本分類表11-1按影響范圍戰(zhàn)略決策、下一節(jié):確定型和非確定型決策11.1決策分析的基本問題下一節(jié):確定型和非確定型決策11.1決策分析的基本問題11.2確定型和非確定型決策11.2確定型和非確定型決策11.2確定型和非確定型決策11.2.1確定型決策確定型決策是指決策的未來狀態(tài)是已知的,只需從備選的決策方案中,挑選出最優(yōu)方案?!纠?1-1】某企業(yè)根據(jù)市場需要,需添置一臺數(shù)控機床,可采用的方式有三種:甲方案:引進外國進口設備,固定成本1000萬元,產(chǎn)品每件可變成本為12元;乙方案:用較高級的國產(chǎn)設備,固定成本800萬元,產(chǎn)品每件可變成本為15元;丙方案:用一般國產(chǎn)設備,固定成本600萬元,產(chǎn)品每件可變成本為20元;試確定在不同生產(chǎn)規(guī)模情況下的購置機床的最優(yōu)方案。11.2確定型和非確定型決策11.2.1確定型決策確定型【解】此題為確定型決策.利用經(jīng)濟學知識,選取最優(yōu)決策.最優(yōu)決策也就是在不同生產(chǎn)規(guī)模條件下,選擇總成本較低的方案.各方案的總成本線如圖11-2.圖11-2TC甲=F甲+Cv甲Q=1000+12QTC乙=F乙+Cv乙Q=800+15QTC丙=F丙+Cv丙Q=600+20Q圖中出現(xiàn)了A、B、C三個交點,其中A點經(jīng)濟意義:在A點采用甲方案與丙方案成本相同TC甲=TC丙,F(xiàn)甲+Cv甲QA=F丙+Cv丙QA
Q=5011.2確定型和非確定型決策【解】此題為確定型決策.利用經(jīng)濟學知識,選取最優(yōu)決策.最優(yōu)同理:B點TC乙=TC丙,F(xiàn)乙+Cv乙QB=F丙+Cv丙QB
C點:TCL甲=TC乙,F(xiàn)甲+Cv甲QC=F乙+Cv乙QC
B點經(jīng)濟意義為:當生產(chǎn)40萬件時,采用乙方案和采用丙方案成本相同均為1400萬元.圖11-211.2確定型和非確定型決策同理:B點TC乙=TC丙,F(xiàn)乙+Cv乙QB=F丙+Cv丙QB得到生產(chǎn)規(guī)模最優(yōu)方案為:當生產(chǎn)規(guī)模產(chǎn)量小于40萬件時,采用丙方案;當生產(chǎn)規(guī)模產(chǎn)量大于40萬件,小于200/3萬件時,采用乙方案;當生產(chǎn)規(guī)模產(chǎn)量大于200/3萬件時,采用甲方案.其經(jīng)濟意義為:當生產(chǎn)規(guī)模為萬件時,采用甲、乙方案成本相同.從圖中可知:當生產(chǎn)規(guī)?!躋B時,采用丙方案;當QB<生產(chǎn)規(guī)?!躋C時,采用乙方案;當QC<生產(chǎn)規(guī)模時,采用甲方案.圖11-211.2確定型和非確定型決策得到生產(chǎn)規(guī)模最優(yōu)方案為:當生產(chǎn)規(guī)模產(chǎn)量小于40萬件時,采用丙11.2.2非確定型決策(1)狀態(tài)空間是指不以人的意志為轉(zhuǎn)移的客觀因素,設一個狀態(tài)為Si,有m種不同狀態(tài),其集合記為:S稱狀態(tài)空間;S的元素Si稱為狀態(tài)變量.由于在非確定決策中,各種決策環(huán)境是不確定的,所以對于同一個決策問題,用不同的方法求值,將會得到不同的結(jié)論,在現(xiàn)實生活中,同一個決策問題,決策者的偏好不同,也會使得處理相同問題的原則方法不同.(2)策略空間是指人們根據(jù)不同的客觀情況,可能做出主觀的選擇,記一種策略方案為Ui,有n種不同的策略,其集合11.2確定型和非確定型決策11.2.2非確定型決策(1)狀態(tài)空間是指不以人的意志為U稱為策略空間;U的元素Uj稱為決策變量.(3)損益函數(shù)是指當狀態(tài)處在Si情況下,人們做出Uj決策,從而產(chǎn)生的損益值Vij,顯然Vij是Si、Uj的函數(shù),即當狀態(tài)變量是離散型變量時,損益值構成的矩陣叫損益矩陣.11.2確定型和非確定型決策U稱為策略空間;U的元素Uj稱為決策變量.(3)損益函數(shù)或簡記為上述三個主要素組成了決策系統(tǒng),決策系統(tǒng)可以表示為三個主要素的函數(shù):D=D(S,U,V)常用的非確定型準則有5種:1.悲觀準則2.樂觀準則3.折衷法、實用主義準則4.等可能性準則5.最小機會損失(后悔)準則11.2確定型和非確定型決策或簡記為上述三個主要素組成了決策系統(tǒng),決策系統(tǒng)可以表示為三個【例11-2】某公司為經(jīng)營業(yè)務的需要,決定要在現(xiàn)有生產(chǎn)條件不變的情況下,生產(chǎn)一種新產(chǎn)品,現(xiàn)可供開發(fā)生產(chǎn)的產(chǎn)品有I、II、III、IV四種不同產(chǎn)品,對應的方案為A1,A2,A3,A4.由于缺乏相關資料背景,對產(chǎn)品的市場需求只能估計為大中小三種狀態(tài),而且對于每種狀態(tài)出現(xiàn)的概率無法預測,每種方案在各種自然狀態(tài)下的效益值表,如表11-3所示.表11-3效益值表(單位:萬元)
自然狀態(tài)供選方案Ai需求量大S1需求量中S2需求量小S3A1:生產(chǎn)產(chǎn)品I800320-250A2:生產(chǎn)產(chǎn)品II600300-200A3:生產(chǎn)產(chǎn)品III30015050A4:生產(chǎn)產(chǎn)品IV40025010011.2確定型和非確定型決策【例11-2】某公司為經(jīng)營業(yè)務的需要,決定要在現(xiàn)有生產(chǎn)條件不(1)小中取大法(悲觀主義準則maxmin)
則對應的A4方案為決策方案,即生產(chǎn)產(chǎn)品IV.自然狀態(tài)供選方案Ai需求量大S1需求量中S2需求量小S3minmax生產(chǎn)產(chǎn)品I800320-250-250生產(chǎn)產(chǎn)品II600300-200-200生產(chǎn)產(chǎn)品III3001505050生產(chǎn)產(chǎn)品IV400250100100100策略值為11.2確定型和非確定型決策(1)小中取大法(悲觀主義準則maxmin)則對應的A4方(2)大中取大法(樂觀主義準則maxmax)
則對應的A1方案為決策方案,即生產(chǎn)產(chǎn)品I.自然狀態(tài)供選方案Ai需求量大S1需求量中S2需求量小S3maxmax生產(chǎn)產(chǎn)品I800320-250800800生產(chǎn)產(chǎn)品II600300-200600生產(chǎn)產(chǎn)品III30015050300生產(chǎn)產(chǎn)品IV400250100400策略值為11.2確定型和非確定型決策(2)大中取大法(樂觀主義準則maxmax)則對應的A1方(3)最小機會損失準則(Minimaxregret
criterion)
編制機會損失表:找出每個方案的最大機會損失Zi:選擇最小的機會損失值:對應的方案l即為所決策方案
自然狀態(tài)
生產(chǎn)方案需求量大S1需求量中S2需求量小S3Maximum決策結(jié)果A1:生產(chǎn)產(chǎn)品I00350350
A2:生產(chǎn)產(chǎn)品II20020300300生產(chǎn)產(chǎn)品IIA3:生產(chǎn)產(chǎn)品III50017050500
A4:生產(chǎn)產(chǎn)品IV400700400
則應選對應的A2方案為決策方案,即生產(chǎn)產(chǎn)品Ⅱ11.2確定型和非確定型決策(3)最小機會損失準則(Minimaxregretcr策略值為(4)等可能性決策準則(Equallikelihoodcriterion)自然狀態(tài)供選方案Ai需求量大S1需求量中S2需求量小S3E(Ai)max生產(chǎn)產(chǎn)品I800320-250290290生產(chǎn)產(chǎn)品II600300-200700/3生產(chǎn)產(chǎn)品III30015050500/3生產(chǎn)產(chǎn)品IV400250100250則應選擇對應的A1方案為決策方案,即生產(chǎn)產(chǎn)品I11.2確定型和非確定型決策策略值為(4)等可能性決策準則(Equallikeliho(5)折衷法,現(xiàn)實主義準則(Hurwiczcriterion)maxmin法是當=0時狀態(tài),maxmax是=1時狀態(tài).原則:決策者給出樂觀系數(shù)則說明決策者越接近悲觀;則說明決策者越接近樂觀.
自然狀態(tài)
0.30.7
生產(chǎn)方案需求量大S1需求量中S2需求量小S3MaxMin加權平均決策結(jié)果A1:生產(chǎn)產(chǎn)品I800320-250800-25065
A2:生產(chǎn)產(chǎn)品II600300-200600-20040
A3:生產(chǎn)產(chǎn)品III3001505030050125
A4:生產(chǎn)產(chǎn)品IV400250100400100190生產(chǎn)產(chǎn)品IV則應選擇對應的決策方案A4,即生產(chǎn)產(chǎn)品IV。11.2確定型和非確定型決策(5)折衷法,現(xiàn)實主義準則(Hurwiczcriter下一節(jié):風險型決策11.2確定型和非確定型決策作業(yè):教材P268T1、2下一節(jié):風險型決策11.2確定型和非確定型決策作業(yè):教材P11.3風險型決策11.3風險型決策11.3風險型決策風險型決策是指每種自然狀態(tài)出現(xiàn)的概率大體可以估計,并可算出在不同狀態(tài)下的效益值.11.3.1期望值準則(Expectedvaluecriterion)求效益期望值EMV。效益期望值=∑條件效益值×概率,即選擇最大效益期望值所對應的方案為決策方案1.最大效益期望值準則11.3風險型決策風險型決策是指每種自然狀態(tài)出現(xiàn)的概率大11.3風險型決策【例11-3】在例11-2中,假設市場需求大、中、小的概率如表11-5所示,那么工廠應生產(chǎn)哪種產(chǎn)品,才能使其收益最大.
表11-5效益表(單位:萬元)自然狀態(tài)供選方案Ai需求量大S1p1=0.35需求量中S2p2=0.4需求量小S3p2=0.25A1:生產(chǎn)產(chǎn)品I800320-250A2:生產(chǎn)產(chǎn)品II600300-200A3:生產(chǎn)產(chǎn)品III30015050A4:生產(chǎn)產(chǎn)品IV40025010011.3風險型決策【例11-3】在例11-2中,假設市場11.3風險型決策【解】效益的期望值表如下
因此選擇相應方案,即開發(fā)A1產(chǎn)品。自然狀態(tài)供選方案Ai需求量大S1需求量中S2需求量小S3期望效益EMViA1:生產(chǎn)產(chǎn)品I800320-250345.5A2:生產(chǎn)產(chǎn)品II600300-200280A3:生產(chǎn)產(chǎn)品III30015050177.5A4:生產(chǎn)產(chǎn)品IV400250100265狀態(tài)概率0.350.40.2511.3風險型決策【解】效益的期望值表如下因此選擇相應求每個方案的期望后悔值,最小期望后悔值對應的方案即為所選方案。求解過程留給同學們作練習。除了前面7種決策準則外,還有完全信息期望值準則(EVPI:Expectedvalueofperfectinformation)樣本信息期望值準則Expectedvalueofsampleinformation(EVSI)完全信息后悔值期望值準則Expectedregretvalueofperfectinformation2最小期望后悔值準則(Expectedregretvalue)11.3風險型決策求每個方案的期望后悔值,最小期望后悔值對應的方案即為所選方案11.3風險型決策11.3.2決策樹法(DecisionTree)決策樹是由決策點、事件點及結(jié)果構成的樹形圖,一般應用于序列決策中?!?表示決策點,也稱為樹根,由它引發(fā)的分枝稱之為方案分枝,方案節(jié)點被稱為樹枝.n條分枝表示有n種供選方案.〇:表示策略點,其上方數(shù)字表示該方案的最優(yōu)收益期望值,由其引出的m條線稱為概率枝表示有m種自然狀態(tài),其發(fā)生的概率已標明在分枝上.△:表示每個方案在相應自然狀態(tài)的效益值.╫:表示經(jīng)過比較選擇此方案被刪除掉了,稱之為剪枝.方法:①根據(jù)題意作出決策樹圖;11.3風險型決策11.3.2決策樹法(Decisio②從右向左計算各方案期望值,并進行標注;③對期望值進行比較,選出最大效益期望值,寫在□上方,表明其所對應方案為決策方案,同時在其它方案上打上╫刪除.HH1HiHmE(H1)E(Hi)E(Hm)V11
V1j
V1n
Vi1
Vij
Vin
Vm1
Vmj
Vmn
pjpnp1pjpnp1pjpn圖14-3決策樹圖max{E(Hi)}11.3風險型決策p1…………………………………………②從右向左計算各方案期望值,并進行標注;③對期望值進行比較【例11-4】某廠決定生產(chǎn)某產(chǎn)品,要對機器進行改造.投入不同數(shù)額的資金進行改造有三種方法,分別為購新機器、大修和維護,根據(jù)經(jīng)驗,銷路好發(fā)生的概率為0.6.相關投入額及不同銷路情況下的效益值如表11-6所示,請選擇最佳方案.表11-6效益值表(單位:萬元)
供選方案投資額Ti銷路好p1=0.6銷路不好p2=0.4A1:購新1225-20A2:大修820-12A3:維護515-811.3風險型決策【例11-4】某廠決定生產(chǎn)某產(chǎn)品,要對機器進行改造.投入不同供選方案投資額Ti銷路好p1=0.6銷路不好p2=0.4A1:購新1225-20A2:大修820-12A3:維護515-8【解】
①根據(jù)題意,作出決策樹,見圖11-4.②計算各方案的效益期望值:③最大值為選對應方案A3,即維護機器,并將A1,A2剪枝.11.3風險型決策供選方案投資額Ti銷路好p1=0.6銷路不好p2=0.4A1供選方案投資額Ti銷路好p1=0.6銷路不好p2=0.4期望值A1:購新1225-20-5A2:大修820-12-0.8A3:維護515-80.8A0.8A1A2A3-5-0.80.825好0.6-2020-1215-8不好0.4圖14-4決策樹圖好0.6不好0.4好0.6不好0.4購新大修維護11.3風險型決策供選方案投資額Ti銷路好p1=0.6銷路不好p2=0.4期望多級決策問題【例11-5】某公司由于市場需求增加,使得公司決定要擴大公司規(guī)模,供選方案有三種:第一種方案,新建一個大工廠,需投資250萬元;第二種方案,新建一個小工廠,需投資150萬元;第三種方案,新建一個小工廠,2年后若產(chǎn)品銷路好再考慮擴建,擴建需追加120萬元,后3年收益與新建大工廠間.如表11-7所示,根據(jù)預測該產(chǎn)品前三年暢銷和滯銷的概率分別為0.6,0.4.若前2年暢銷,則后3年暢銷后滯銷概率為0.8,0.2;若前2年滯銷,則后3年一定滯銷.請對方案做出選擇.11.3風險型決策多級決策問題【例11-5】某公司由于市場需求增加,使得公司決表11-7效益值(單位:萬元)
自然狀態(tài)概率供選方案與效益前2年后3年大工廠小工廠先小后大前2年后3年暢銷0.6暢銷0.8滯銷0.21508080150滯銷0.4暢銷0滯銷1-502020-50成本250150150120【解】(1)畫決策樹11.3風險型決策表11-7效益值(單位:萬元)自然狀態(tài)概率供選方案與效暢銷0.8150滯銷0.2-5053306-150滯銷1-50228暢銷0.6滯銷0.4暢銷0.880滯銷0.2207204860滯銷1203108.4暢銷0.6滯銷0.4暢銷0.8150滯銷0.2-502101220411210擴建不擴建9暢銷0.8滯銷0.2802041020滯銷1暢銷0.6滯銷0.460后3年前2年1112大工廠小工廠先小后大112圖11-11決策樹圖【解】(1)畫決策樹120150150250暢銷0.8150滯銷0.2-5053306-150滯銷1比較方案,E(4)最大,則取最大值112,對應的方案是先小后大作為選定方案,即先建小廠,后擴建大工廠的方案為最終方案11.3風險型決策11.3.3貝葉斯決策BayesianDecision開始人們對原來的狀態(tài)參數(shù)提出某一概率分布。后來通過調(diào)查又獲得許多信息,只要原來信息不是錯誤的,則應該用后來的補充信息修正原來的認識。用補充的情報改進原來的概率分布。將依據(jù)過去的信息或經(jīng)驗由決策者估計的概率稱之為主觀概率.比較方案,E(4)最大,則取最大值112,對應的方案是先小后未收到新信息時根據(jù)已有信息和經(jīng)驗,估計出的概率分布稱為先驗概率;用隨機試驗確定出的概率稱為客觀概率.收到新信息,修正后的概率分布稱為后驗概率事件B已經(jīng)發(fā)生的條件下,事件A發(fā)生的概率,稱為事件A在給定B下的條件概率
貝葉斯公式:若A1、A2、…構成一個完備事件,P(Ai)>0,則對任何概率不為零的事件B,有11.3風險型決策未收到新信息時根據(jù)已有信息和經(jīng)驗,估計出的概率分布稱為先驗概更一般地此公式為后驗概率11.3風險型決策貝葉斯公式:若A1、A2、…構成一個完備事件,P(Ai)>0,則對任何概率不為零的事件B,有更一般地此公式為后驗概率11.3風險型決策貝葉斯公式:若產(chǎn)品需求量x0100200300400先驗概率p(xi)0.050.150.30.250.25例如,根據(jù)以往的經(jīng)驗,產(chǎn)品需求量的概率為產(chǎn)品進入市場2個月的試銷后,需求量的樣本信息(比例)為產(chǎn)品需求量0100200300400需求量比例0.050.150.350.250.2011.3風險型決策這里的需求量比例通過試驗得到的客觀概率,它與先驗概率不一定完全相等。作決策時兩種概率都要用到,計算出后驗概率再作決策。參看下面的引例。產(chǎn)品需求量x0100200300400先驗概率p(xi)0.【引例】盒子里有100枚均勻的硬幣,有60枚是正常的,40枚兩面都是徽。從盒子中任取一枚讓你猜是哪一類硬幣。猜中得10元,猜不中不得錢。你猜是哪一類?B1(正常)B1(雙徽)先驗概率3/52/5A1(猜正常)100A2(猜雙徽)010獲利的期望值V(A1)=10×3/5+0×2/5=6V(A2)=0×3/5+10×2/5=4正確的決策是:應該選擇猜正常11.3風險型決策【引例】盒子里有100枚均勻的硬幣,有60枚是正常的,40枚如果現(xiàn)在拋擲3次,3次都出現(xiàn)徽,你又如何猜?該硬幣是正常的概率為多少,是雙徽的概率為多少。設H為3次出現(xiàn)反面這一隨機事件,B1為硬幣是正常,B2為硬幣是雙徽,則(客觀概率)3次都出現(xiàn)雙徽的概率為:11.3風險型決策后驗概率(貝葉斯公式)為如果現(xiàn)在拋擲3次,3次都出現(xiàn)徽,你又如何猜?該硬幣是正常的概B1(正常)B1(雙徽)后驗概率3/1916/19A1(猜正常)100A2(猜雙徽)010用后驗概率代替原來的概率,決策矩陣為:獲利的期望值V(A1)=10×3/19+0×2/5=30/19V(A2)=0×3/5+10×16/19=160/19正確的決策是:應該選擇猜雙徽11.3風險型決策B1(正常)B1(雙徽)后驗概率3/1916/19A1(猜正根據(jù)過去經(jīng)驗可知當自然狀態(tài)為Nj條件下調(diào)查結(jié)果為Zk的條件概率再利用貝葉斯公式和全概率公式,求當結(jié)果為ZK的條件下自然狀態(tài)為Nj的條件概率11.3風險型決策根據(jù)過去經(jīng)驗可知當自然狀態(tài)為Nj條件下調(diào)查結(jié)果為Zk的條件概在后驗分析中用代替先驗分析中的P(Nj),利用期望值準則計算出Ek再根據(jù)全概率公式,可知結(jié)果為Zk的概率為因此,后驗分析的效益期望值為11.3風險型決策在后驗分析中用代替先驗分析中的P(Nj),利用期望值準則計算當狀態(tài)只有兩個時,后驗概率及期望收益可用快捷公式計算。記先驗概率向量為P,條件概率矩陣為A,后驗概率矩陣為B,收益矩陣為V,有則先驗收益期望值向量為EMV1=PTV后驗收益期望值矩陣為Ek=BV11.3風險型決策當狀態(tài)只有兩個時,后驗概率及期望收益可用快捷公式計算。記先驗【例11-6】某廠對一臺機器的換代問題做決策,有三種方案:A1為買另一臺新機器;A2為對老機器進行改建;A3是維護加強.輸入不同質(zhì)量的原料,三種方案的收益見表11-8.約有30%的原料是質(zhì)量好的,還可以花600元對原料的質(zhì)量進行測試,這種測試可靠性見表11-9.求最優(yōu)方案.11.3風險型決策原料的實際質(zhì)量N1好N2差測試結(jié)果Z1好0.80.3Z2差0.20.7原料質(zhì)量Ni購新機器A1改建老機器A2維護老機器A3N1好(0.3)31.00.8N2差(0.7)-1.50.50.6表11-9測試可靠性
表11-8收益表(單位:萬元)【例11-6】某廠對一臺機器的換代問題做決策,有三種方案:11.3風險型決策【解】(1)若不做測試,各方案的先驗收益應選方案3,維護老機器。(2)計算后驗概率已知聯(lián)合概率為:11.3風險型決策【解】(1)若不做測試,各方案的先驗11.3風險型決策邊際概率為代入(11-2)從而可得后驗概率11.3風險型決策邊際概率為代入(11-2)從而可得后11.3風險型決策則有即當測試結(jié)果為原料的質(zhì)量好,則購買新機器;若測試結(jié)果為原材料的質(zhì)量差,則維護老機器。決策為:應花600元進行測試,測試后若質(zhì)量好,購入新機器生產(chǎn);若質(zhì)量差,維護老機器生產(chǎn)11.3風險型決策則有即當測試結(jié)果為原料的質(zhì)量好,則購買【例】石油開發(fā)決策問題收益勘探-250鉆探-150賣出收益90有油時收益800干涸時收益011.3風險型決策【例】石油開發(fā)決策問題收益勘探-250鉆探-150賣出收益911.3風險型決策自然狀態(tài)先驗概率好(FSS)不好(USS)有油(Oil)P(O)=0.6P(F|O)=0.8P(U|O)=0.2干涸(Dry)P(D)=0.4P(F|D)=0P(U|D)=1P(Finding勘探結(jié)果|State自然狀態(tài))后驗概率P(自然狀態(tài)|勘探結(jié)果)勘探結(jié)果邊際概率有油(Oil)干涸(Dry)好(F)不好(U)勘探好的概率:P(F)=P(O)*P(F|O)+P(D)*P(F|D)=0.6×0.8+0.4×0=0.48勘探好的概率:P(U)=P(O)*P(U|O)+P(D)*P(U|D)=0.6×0.2+0.4×1=0.52勘探好時有油的概率P(O|F)=P(O)*P(F|O)/[P(O)*P(F|O)+P(D)*P(F|D)]=0.6×0.8/0.48=1勘探好時干涸的概率P(D|F)=P(D)*P(F|D)/[P(O)*P(F|O)+P(D)*P(F|D)]=0.4×0/0.48=0勘探不好時有油的概率P(O|U)=P(O)*P(U|O)/[P(O)*P(U|O)+P(D)*P(U|D)]=0.6×0.2/0.52=0.2037勘探不好時干涸的概率P(D|U)=P(D)*P(U|D)/[P(O)*P(U|O)+P(D)*P(U|D)]=0.4×1/0.52=0.76920.480.5210.23076900.769231決策樹參看文件:DATA\chpt11\ch11.xls11.3風險型決策自然狀態(tài)先驗概率好(FSS)不好(US下一節(jié):效用理論作業(yè):教材習題11.3~11.811.3風險型決策下一節(jié):效用理論作業(yè):教材習題11.3~11.811.11.4效用理論UtilityTheory11.4效用理論11.4.1效用貝努利(D.Berneulli)首次提出效用概念,他用圖11-7表示出人們對錢財?shù)恼鎸崈r值的考慮與其錢財擁有量之間有對數(shù)關系.效用是一種相對的指標值,它的大小表示決策者對于風險的態(tài)度,對某事物的傾向、偏差等主觀因素的強弱程度用于量度決策者對于風險的態(tài)度.效用U貨幣M圖11-7貝努利效用曲線11.4效用理論UtilityTheory11.4.1效用貝努利(D.Berneulli)首次提出效【例】(1)方案A1;穩(wěn)獲100元。方案B1:用拋擲硬幣的方法,猜對得250元,猜錯不得錢。(2)方案A2;穩(wěn)獲100元。方案B2:用拋擲硬幣的方法,直到出現(xiàn)正面為止,第n次出現(xiàn)正面得到2n元。大多數(shù)選擇A1、A2.通過計算有E(B1)>E(A1),E(B2)>E(A2)一般來說效用值在[0,1]之間取值.凡是決策者最看好、最傾向、最愿意的事物(事件)的效用值可取1;反之,效用值取0.當各方案期望值相同時,一般用最大效用值決策準則,選擇效用值最大的方案.11.4效用理論UtilityTheory【例】(2)方案A2;穩(wěn)獲100元。方案B2:用拋擲硬幣的方通過效用指標將某些難于量化、有質(zhì)的區(qū)別的事件給予量化,得到各方案的綜合效用值,選擇效用值最大的方案作為決策準則。11.4.2效用曲線確定效用曲線的基本方法有兩種:一種是直接提問法,需要決策者回答提問,主觀衡量.應用較少;第二種是對比提問法,此法使用較多.設現(xiàn)有A0,A1兩種方案供選.A0表示決策者不需要花費任何風險可獲益x0;而A1有兩種自然狀態(tài),可以概率P獲得收益x1,以概率(1-P)獲得收益x2;且x1>x0>x2.令yi表示效益xi的效用值.則x0,x1,x2的效用值分別表示為y0,y1,y2.若在某條件下,決策者認為A0,A1兩方案等價,則有:11.4效用理論UtilityTheory通過效用指標將某些難于量化、有質(zhì)的區(qū)別的事件給予量化,得到各4個數(shù)p,x0,x1,x2中給定3個,提問第4個變量由決策者確定,求出效用值。一般采用改進V-M(VonNeumann-Morgenstern)方法,固定P=0.5,x1,x2改變x0三次,得出相應的y的值,確定三點,作出效用曲線.11.4效用理論UtilityTheory4個數(shù)p,x0,x1,x2中給定3個,提問第4個變量由決策者【例11-7】x1=-100,x2=400,取y(x1)=0,y(x2)=1-100400第一次提問:x0為何值時,上式成立?答:“0”y(0)=0.5×0+0.5×1=0.51(0,0.5)第二次提問:x0為何值時,上式成立?答:“200”y(200)=0.5×y(0)+0.5×1=0.5×0.5+0.5×1=0.75第三次提問:x0為何值時,上式成立?答:“100”y(100)=0.5×y(0)+0.5×y(200)=0.5×0.5+0.5×0.75=0.625(200,0.75)(100,0.625)100200300011.4效用理論UtilityTheory【例11-7】x1=-100,x2=400,取y(x1)=0不同決策者對待風險態(tài)度不同,因而會得到不同形狀的效用曲線.一般可分為保守型Ⅰ、中間型Ⅱ、風險型Ⅲ,如下圖.y1IIIx(Xmax,1)(Xmin,0)XmaxXmin011.4.3效用曲線類型圖中I為保守型,其特點為:當收益值較小時,效用值增加較快;隨收益值增大時,效用值增加速度變慢,表明決策者不求大利,謹慎小心,保守.圖中II為中間型,其特點為:收益值和效用值成正比,表明決策者完全按機遇辦事,心平氣和.圖中III為風險型,其特點為與I保守型恰好相反,當收益值較小時,效用值增加較慢;隨收益值增大時,效用值增加速度變快,表明決策者對增加收益反應敏感,愿冒較大風險,謀求大利,不怕冒險.III11.4效用理論UtilityTheory不同決策者對待風險態(tài)度不同,因而會得到不同形狀的效用曲線.一常用的效用函數(shù):11.4效用理論UtilityTheory常用的效用函數(shù):11.4效用理論11.4.4效用值的應用【例11-8】若某決策問題的決策樹如下圖所示,其決策者的效用期望值同時附在效益期望值后,請做出決策.E(2)=0.5×300+0.5×(-200)=50E(3)=0.5×200+0.5×(-100)=50根據(jù)最大效益期望值準則,無法判斷優(yōu)劣.y2=0.5×1+0.5×0=0.5,y3=0.5×0.9+0.5×0.3=0.6【解】:(1)計算效益期望值分別為11.4效用理論UtilityTheory11.4.4效用值的應用【例11-8】若某決策問題的決A2方案效用值>A1方案效用值,因此取A2方案為決策方案.繪制效用曲線圖見下圖,可知,該決策者偏向于保守型,不求大利,謹慎小心.11.4效用理論UtilityTheory-20030010100200-100yxA2方案效用值>A1方案效用值,因此取A2方案為決策方案.111.5馬爾可夫決策
MarkovDecision11.5馬爾可夫決策11.5馬爾可夫決策MarkovDecision11.5.1馬爾可夫鏈用X(t)表示隨機系統(tǒng)在時刻t的狀態(tài),狀態(tài)序列為一隨機過程,如果系統(tǒng)當前的轉(zhuǎn)移概率只與當前的運行狀態(tài)有關,而與以前的狀態(tài)無關,即:對隨機過程若對任意的0<t1<t2…<tn<tn+1及ti∈T,X(tn+1)關于X(t1),…,X(tn)的條件概率恰好等于X(tn+1)關于X(tn)的條件概率,用數(shù)學符號表示為:11.5馬爾可夫決策11.5.1馬爾可夫鏈用X(t)表則稱具有馬爾可夫性.隨機過程稱為馬爾可夫過程。所有可能的全體取值稱為過程的狀態(tài)空間。若馬氏過程的狀態(tài)空間為非負整數(shù)集E={0,1,2,…},稱為馬氏鏈。例如,今天下雨這一狀態(tài)用“0”表示,不下雨用“1”表示,則狀態(tài)空間為E={0,1}。天氣變化過程符合Markov性。11.5.2轉(zhuǎn)移概率記Pij為從狀態(tài)X(n)=i轉(zhuǎn)移到下一個狀態(tài)X(n+1)=j的概率,一步轉(zhuǎn)移概率矩陣為11.5馬爾可夫決策MarkovDecision則稱具【例11-9】有3家電器公司分別生產(chǎn)三種不同牌子的空調(diào)。各自開展廣告攻勢促銷本公司產(chǎn)品。各公司所占的市場比例是隨時間變化的。X={Xn,n≥0}構成一個以E={1,2,3}為狀態(tài)空間的Markov鏈。假設在任一時刻,公司1能留住它的1/2的老顧客,其余的則對半購買另兩個公司的產(chǎn)品;公司2的一半顧客能留下,
30%轉(zhuǎn)向公司1,20%轉(zhuǎn)向公司3;公司3有3/4能留下,其余流向公司2。Markov鏈的轉(zhuǎn)移概率矩陣和轉(zhuǎn)移圖:①②③1/21/41/43/101/21/43/411.5馬爾可夫決策MarkovDecision1/5【例11-9】有3家電器公司分別生產(chǎn)三種不同牌子的空調(diào)。各自求n期后公司i的市場占有率,n→∞時的市場占有率。記Pj(n)=P(Xn=j)為Markov鏈X時刻n處于狀態(tài)j的概率,P為初始分布?!径ɡ怼縓={Xn,n≥0}為一個Markov鏈,則有對任意m,n≥0,有對任意i,j∈E,有此方程稱為Champan-Kolmogorov方程,簡稱C-K方程11.5.3轉(zhuǎn)移狀態(tài)11.5馬爾可夫決策MarkovDecision求n期后公司i的市場占有率,n→∞時的市場占有率。記Pj(n遍歷性:如果一個齊次的馬爾可夫鏈{X(n),n=1,2,…}的n步轉(zhuǎn)移概率為Pij(n),對于一切狀態(tài)i,j,存在著不依賴于初始狀態(tài)i的常數(shù)Pj,使得成立,則稱此馬爾可夫鏈具有遍歷性.也就是說,一個具有遍歷性的馬爾可夫鏈,當轉(zhuǎn)移的次數(shù)n極大時,此系統(tǒng)轉(zhuǎn)移到狀態(tài)j的概率為一個常數(shù)Pj,而與初始狀態(tài)無關.求【引理】設m階矩陣P具有m個線性無關的特征向量B=(b1,b2,…,bm)對應的特征值為λ1,λ2,…,λm,則B可逆且有P=BΛB-1,Pn=BΛnB-1.其中Λ=diag(λ1,λ2,…,λm)11.5馬爾可夫決策MarkovDecision遍歷性:如果一個齊次的馬爾可夫鏈{X(n),n=1,2,11.5馬爾可夫決策MarkovDecision對于具有遍歷性的馬爾可夫鏈,經(jīng)若干步轉(zhuǎn)移后到達穩(wěn)定狀態(tài),對式取極限得到應用:(1)利用式(11-15),當初始狀態(tài)G(0)和轉(zhuǎn)移概率矩陣P已知,就可以求出n步以后系統(tǒng)所處的狀態(tài)G(n)(2)利用式(11-16),當初始狀態(tài)G(0)和轉(zhuǎn)移概率矩陣P已知,通過解方程G=GP和g1+…+gm=1或引理可以求出穩(wěn)態(tài)下的狀態(tài)概率向量G(11-15)(11-16)11.5馬爾可夫決策對于具有遍歷性的馬爾可夫鏈,經(jīng)若干步轉(zhuǎn)【例11-10】假設3個公司開始的市場占有率為(0.3,0.35,0.35),求5個月后的市場占有率(狀態(tài))。【解】G(0)=(0.3,0.35,0.35)11.5馬爾可夫決策MarkovDecision【例11-10】假設3個公司開始的市場占有率為(0.3,0.上例中,求Pn及求轉(zhuǎn)移概率矩陣P的特征值及特征向量。由|λI-P|=0得特征值及特征向量矩陣為11.5馬爾可夫決策MarkovDecision上例中,求Pn及求轉(zhuǎn)移概率矩陣P的特征值及特征向量。由|λI則有11.5馬爾可夫決策MarkovDecision則有11.5馬爾可夫決策長期后市場占有率各占1/3由得【解】方程得到穩(wěn)定狀態(tài)的概率G11.5馬爾可夫決策MarkovDecision長期后市場占有率各占1/3由得【解】方程得到穩(wěn)定狀態(tài)的概率G【例11-10】在例11-9中,假設3個公司開始的市場占有率為(0.3,0.35,0.35).求:(1)5個月后的市場占有率(狀態(tài));(2)長期以后(穩(wěn)態(tài))的市場占有率?!窘狻?/p>
(1)G(0)=(0.3,0.35,0.35),由11.5馬爾可夫決策MarkovDecision【例11-10】在例11-9中,假設3個公司開始的市場占有率11.5馬爾可夫決策MarkovDecision(2)求長期以后的市場占有率G有兩種方法。第一種方法:設G=(g1,g2,g3),利用式(11-16)解方程組及
容易證明,前3個方程不是獨立的,取第1、2、4個方程求解即可,解得即長期后(穩(wěn)態(tài))三個公司的市場占有率分別為1/5、1/3及7/15。11.5馬爾可夫決策(2)求長期以后的市場占有率G有兩種方11.5馬爾可夫決策MarkovDecision第二種方法:求轉(zhuǎn)移概率矩陣P的特征值及特征向量。由|λI-P|=0得特征值及特征向量矩陣B為11.5馬爾可夫決策第二種方法:求轉(zhuǎn)移概率矩陣P的特征值及11.5馬爾可夫決策MarkovDecision與第一種計算方法結(jié)果相同。11.5馬爾可夫決策與第一種計算方法結(jié)果相同。11.5.4收益預測模型設系統(tǒng)在第n個時期處于狀態(tài)X(n)=i,轉(zhuǎn)移到過程終結(jié)時的總期望收益為rij表示從狀態(tài)X(n)=i轉(zhuǎn)移到下一個狀態(tài)X(n+1)=j相應的收益,則有:πn表示從第n個時期到過程終結(jié)的決策規(guī)則δ的序列其中δn為第n個時期的決策規(guī)則,11.5馬爾可夫決策MarkovDecision11.5.4收益預測模型設系統(tǒng)在第n個時期處于狀態(tài)q(i)表示由狀態(tài)i作一次轉(zhuǎn)移的期望報酬,即狀態(tài)的即時期望報酬.則令或11.5馬爾可夫決策MarkovDecisionq(i)表示由狀態(tài)i作一次轉(zhuǎn)移的期望報酬,即狀態(tài)的即時期若記數(shù)從末端開始,上式的逆序?qū)懛椋簞t11.7馬爾可夫決策MarkovDecisionfi(n)為第1期到第n期的收益若記數(shù)從末端開始,上式的逆序?qū)懛椋簞t11.7馬爾可夫決11.7馬爾可夫決策MarkovDecision【例】商品的轉(zhuǎn)移概率矩陣和利潤表如下暢銷滯銷暢銷0.50.5滯銷0.40.6暢銷滯銷暢銷5010滯銷20-20轉(zhuǎn)移概率表利潤表(萬元)q1=0.5×50+0.5×10=30,q2=0.4×20+0.6×(-20)=-411.7馬爾可夫決策【例】商品的轉(zhuǎn)移概率矩陣和利潤表如下暢n123456f1(n)304454.365.4376.54387.6543f2(n)-45.616.5627.65638.765649.87656期利潤預測11.5.5最優(yōu)策略模型Markov決策由五重組來描述:1.狀態(tài)i2.策略集,狀態(tài)i的策略規(guī)則為3.轉(zhuǎn)移概率矩陣P4.報酬,狀態(tài)i的策略規(guī)則為轉(zhuǎn)移到狀態(tài)j的報酬為期望即時報酬為5.目標函數(shù)V(n)11.5馬爾可夫決策MarkovDecisionn123456f1(n)304454.365.4376.54Markov決策(MD)描述在某一時刻(階段)隨機變量X處于狀態(tài)i,決策者選擇某個策略使目標最優(yōu)。MD常用的目標有3種:1.有限階段目標;2.折扣目標;3.平均目標有限階段目標最大。通過Z變換:11.5馬爾可夫決策MarkovDecision記Markov決策(MD)描述在某一時刻(階段i=1,2,…,m(11-19)解方程組求出變量fi與v
采用迭代計算:(1)選擇一個初始策,每一個狀態(tài)i(i=1,2…,m)選擇一個決策規(guī)則使其決策,令n=0;(2)對已知策略,令,求解方程組(11-19),得相應的策略獲利v(n)和相對值f(n),(i=1,2,…,m;n=0,1,2…);11.5馬爾可夫決策MarkovDecisioni=1,2,…,m(11-19)解方程組(3)應用上一策略已求得的,尋求一個新的策略規(guī)則δn+1,對每一個狀態(tài)i,使由此得新的策略(4)若所得策略與前次迭代所得策略完全相等,則停止迭代,已得到了最優(yōu)策略;否則回到步驟2,令n=n+1.11.5馬爾可夫決策MarkovDecision(3)應用上一策略已求得的,尋求一個新的【例11-12】某水泥廠有一臺窯爐處于兩種運行狀態(tài),即運轉(zhuǎn)和故障,窯爐工人每年定期檢查設備一次.若窯爐正常則選擇維護或不維護;若窯爐故障則選擇大修或常規(guī)維修,其轉(zhuǎn)移概率與相應的報酬如下表,試求該廠應采取的最佳策略使在無限期的未來每年所獲平均收入最大.表11.12轉(zhuǎn)移概率和報酬狀態(tài)I決策轉(zhuǎn)移概率報酬期望即時報酬1.運轉(zhuǎn)1.(不維護)2.(維護)0.50.90.5022.故障1.(大修)2.(常修)0.80.60.20.4-5-300-4-1.811.5馬爾可夫決策MarkovDecision【例11-12】某水泥廠有一臺窯爐處于兩種運行狀態(tài),即運轉(zhuǎn)和【解】此問題共有兩種狀態(tài),每個狀態(tài)有兩種決策,因此共有四種可行決策。為運轉(zhuǎn)時不維護;為運轉(zhuǎn)時維護為故障時大修;為故障時進行常規(guī)維修(1)選取初始策略即當運轉(zhuǎn)時不維護,而故障時大修,則有11.7馬爾可夫決策MarkovDecision【解】此問題共有兩種狀態(tài),每個狀態(tài)有兩種決策,因此共有四種11.5馬爾可夫決策MarkovDecision(2)開始定值運算,并估計初始策略,利用式(11-19)令f2=0,解上述方程組,得v(0)=13.85,(3)進入策略改進程序,求改進策略.對狀態(tài)1,尋求策略,使選取決策,,當窯爐運轉(zhuǎn),采取維護策略,11.5馬爾可夫決策(2)開始定值運算,并估計初始策略對狀態(tài)2,尋求新策略,使選取決策,當窯爐故障時,采取大修策略.求得改進策略為:策略與策略不同,所以還沒有得到最優(yōu)策略,須繼續(xù)迭代.11.5馬爾可夫決策MarkovDecision對狀態(tài)2,尋求新策略,使選取決策(4)再進行定值運算求解方程得:v(1)=37.96,(5)尋求改進策略,對狀態(tài)1,有:仍取策略11.5馬爾可夫決策MarkovDecision(4)再進行定值運算求解方程得:v(1)=37.96,對狀態(tài)2,有:仍取策略因此得到:這與前一次迭代結(jié)果完全一樣,因而求得了最優(yōu)策略即為:運轉(zhuǎn)時的決策是進行維護,故障時進行大修,工廠未來每年期望報酬為37.96萬元.11.5馬爾可夫決策MarkovDecision對狀態(tài)2,有:仍取策略因此得到:這與前一次迭代結(jié)果完全11.5馬爾可夫決策MarkovDecision作業(yè):教材習題11.9,11.10,11.11TheEndofChapter11
11.5馬爾可夫決策作業(yè):教材習題11.9,11第11章決策論TheoryofDecision11.1決策分析的基本問題11.2確定型和非確定型決策11.3風險型決策
11.4效用理論11.5馬爾可夫決策
運籌學
Operations
Research
第11章決策論11.1決策分析的基本問題
11.1決策分析的基本問題11.1決策分析的基本問題決策(DecisionMaking)是一種對已知目標和方案的選擇過程,當人們已知確定需實現(xiàn)的目標是什么,根據(jù)一定的決策準則,在供選方案中做出決策的過程。諾貝爾獎獲得者西蒙認為,管理就是決策,他認為決策是對稀有資源備選分配方案進行選擇排序的過程。學者Gregory在《決策分析》中提及,決策是對決策者將采取的行動方案的選擇過程。決策科學包括決策心理學、決策的數(shù)量化方法、決策評價以及決策支持系統(tǒng)、決策自動化等。隨著計算機和信息通信技術的發(fā)展,決策分析的研究也得到極大的促進,隨之產(chǎn)生了計算機輔助決策支持系統(tǒng)(DecisionSupportSystem),許多問題在計算機的幫助下得以解決,在一定程度上代替了人們對一些常見問題的決策分析過程。11.1決策分析的基本問題決策(DecisionMaking)是一種對已知目標和方案11.1.1決策分析基本概念決策狹義決策認為決策就是作決定,單純強調(diào)最終結(jié)果;廣義決策認為將管理過程的行為都納入決策范疇,決策貫穿于整個管理過程中。決策目標決策者希望達到的狀態(tài),工作努力的目的。一般而言,在管理決策中決策者追求的當然是利益最大化。決策準則決策判斷的標準,備選方案的有效性度量。決策屬性決策方案的性能、質(zhì)量參數(shù)、特征和約束,如技術指標、重量、年齡、聲譽等,用于評價它達到目標的程度和水平。科學決策過程任何科學決策的形成都必須執(zhí)行科學的決策程序,如圖11-1所示。決策最忌諱的就是決策者拍腦袋決策,只有經(jīng)歷過圖11-1所示的“預決策→決策→決策后”三個階段,才有可能產(chǎn)生科學的決策11.1決策分析的基本問題11.1.1決策分析基本概念決策狹義決策認為決策就是作11.1決策分析的基本問題調(diào)查研究確定決策目標搜集有關的信息資料預測技術預測未來的可能情況擬訂各種可行方案可行性研究方案評估決策準則方案選擇方案實施預決策決策實施情況反饋意見決策后圖11-1科學決策過程11.1決策分析的基本問題調(diào)查研究確定決策目標搜集有關11.1決策分析的基本問題決策系統(tǒng)狀態(tài)空間、策略空間、損益函數(shù)構成了決策系統(tǒng)。①狀態(tài)空間不以人的意志為轉(zhuǎn)移的客觀因素,設一個狀態(tài)為Si,有m種不同狀態(tài),其集合記為:S稱狀態(tài)空間,S的元素Si稱為狀態(tài)變量。②策略空間人們根據(jù)不同的客觀情況,可能做出主觀的選擇,記一種策略方案為Ui,有n種不同的策略,其集合為:U稱為策略空間;U的元素Uj稱為決策變量。③損益函數(shù)當狀態(tài)處在Si情況下,人們做出Uj決策,從而產(chǎn)生的損益值Vij,顯然Vij是Si,Uj的函數(shù),即:11.1決策分析的基本問題決策系統(tǒng)狀態(tài)空間、策略空間、損11.1決策分析的基本問題當狀態(tài)變量是離散型變量時,損益值構成的矩陣叫損益矩陣上述三個主要素組成了決策系統(tǒng),決策系統(tǒng)可以表示為三個主要素的函數(shù):D=D(S,U,V)人們將根據(jù)不同的判斷標準原則,求得實現(xiàn)系統(tǒng)目標的最優(yōu)(或滿意)決策方案。11.1決策分析的基本問題當狀態(tài)變量是離散型變量時,損益值11.1決策分析的基本問題11.1.2決策分析基本原則1.最優(yōu)化(滿意)原則2.系統(tǒng)原則3.可行性原則4.信息對稱、準全原則11.1決策分析的基本問題11.1.2決策分析基本原則111.1.3決策分析基本分類表11-1按影響范圍戰(zhàn)略決策、戰(zhàn)役決策、戰(zhàn)術決策按狀態(tài)空間確定型決策、非確定型決策、風險型決策按決策時間程序化決策、半程序化決策、非程序化決策按描述方法定性化決策、定量化決策按目標數(shù)量單目標決策、多目標決策按連續(xù)性單級決策、序貫決策按決策者數(shù)量個人決策、群決策按問題大小宏觀決策、微觀決策表11-2程序化、非程序化、半程序化決策決策類型傳統(tǒng)方法現(xiàn)代方法程序化現(xiàn)有的規(guī)章制度運籌學、管理信息系統(tǒng)(MIS)半程序化經(jīng)驗、直覺灰色系統(tǒng)、模糊數(shù)學等方法非程序化經(jīng)驗、應急創(chuàng)新能力人工智能、風險應變能力培訓11.1決策分析的基本問題11.1.3決策分析基本分類表11-1按影響范圍戰(zhàn)略決策、下一節(jié):確定型和非確定型決策11.1決策分析的基本問題下一節(jié):確定型和非確定型決策11.1決策分析的基本問題11.2確定型和非確定型決策11.2確定型和非確定型決策11.2確定型和非確定型決策11.2.1確定型決策確定型決策是指決策的未來狀態(tài)是已知的,只需從備選的決策方案中,挑選出最優(yōu)方案。【例11-1】某企業(yè)根據(jù)市場需要,需添置一臺數(shù)控機床,可采用的方式有三種:甲方案:引進外國進口設備,固定成本1000萬元,產(chǎn)品每件可變成本為12元;乙方案:用較高級的國產(chǎn)設備,固定成本800萬元,產(chǎn)品每件可變成本為15元;丙方案:用一般國產(chǎn)設備,固定成本600萬元,產(chǎn)品每件可變成本為20元;試確定在不同生產(chǎn)規(guī)模情況下的購置機床的最優(yōu)方案。11.2確定型和非確定型決策11.2.1確定型決策確定型【解】此題為確定型決策.利用經(jīng)濟學知識,選取最優(yōu)決策.最優(yōu)決策也就是在不同生產(chǎn)規(guī)模條件下,選擇總成本較低的方案.各方案的總成本線如圖11-2.圖11-2TC甲=F甲+Cv甲Q=1000+12QTC乙=F乙+Cv乙Q=800+15QTC丙=F丙+Cv丙Q=600+20Q圖中出現(xiàn)了A、B、C三個交點,其中A點經(jīng)濟意義:在A點采用甲方案與丙方案成本相同TC甲=TC丙,F(xiàn)甲+Cv甲QA=F丙+Cv丙QA
Q=5011.2確定型和非確定型決策【解】此題為確定型決策.利用經(jīng)濟學知識,選取最優(yōu)決策.最優(yōu)同理:B點TC乙=TC丙,F(xiàn)乙+Cv乙QB=F丙+Cv丙QB
C點:TCL甲=TC乙,F(xiàn)甲+Cv甲QC=F乙+Cv乙QC
B點經(jīng)濟意義為:當生產(chǎn)40萬件時,采用乙方案和采用丙方案成本相同均為1400萬元.圖11-211.2確定型和非確定型決策同理:B點TC乙=TC丙,F(xiàn)乙+Cv乙QB=F丙+Cv丙QB得到生產(chǎn)規(guī)模最優(yōu)方案為:當生產(chǎn)規(guī)模產(chǎn)量小于40萬件時,采用丙方案;當生產(chǎn)規(guī)模產(chǎn)量大于40萬件,小于200/3萬件時,采用乙方案;當生產(chǎn)規(guī)模產(chǎn)量大于200/3萬件時,采用甲方案.其經(jīng)濟意義為:當生產(chǎn)規(guī)模為萬件時,采用甲、乙方案成本相同.從圖中可知:當生產(chǎn)規(guī)?!躋B時,采用丙方案;當QB<生產(chǎn)規(guī)?!躋C時,采用乙方案;當QC<生產(chǎn)規(guī)模時,采用甲方案.圖11-211.2確定型和非確定型決策得到生產(chǎn)規(guī)模最優(yōu)方案為:當生產(chǎn)規(guī)模產(chǎn)量小于40萬件時,采用丙11.2.2非確定型決策(1)狀態(tài)空間是指不以人的意志為轉(zhuǎn)移的客觀因素,設一個狀態(tài)為Si,有m種不同狀態(tài),其集合記為:S稱狀態(tài)空間;S的元素Si稱為狀態(tài)變量.由于在非確定決策中,各種決策環(huán)境是不確定的,所以對于同一個決策問題,用不同的方法求值,將會得到不同的結(jié)論,在現(xiàn)實生活中,同一個決策問題,決策者的偏好不同,也會使得處理相同問題的原則方法不同.(2)策略空間是指人們根據(jù)不同的客觀情況,可能做出主觀的選擇,記一種策略方案為Ui,有n種不同的策略,其集合11.2確定型和非確定型決策11.2.2非確定型決策(1)狀態(tài)空間是指不以人的意志為U稱為策略空間;U的元素Uj稱為決策變量.(3)損益函數(shù)是指當狀態(tài)處在Si情況下,人們做出Uj決策,從而產(chǎn)生的損益值Vij,顯然Vij是Si、Uj的函數(shù),即當狀態(tài)變量是離散型變量時,損益值構成的矩陣叫損益矩陣.11.2確定型和非確定型決策U稱為策略空間;U的元素Uj稱為決策變量.(3)損益函數(shù)或簡記為上述三個主要素組成了決策系統(tǒng),決策系統(tǒng)可以表示為三個主要素的函數(shù):D=D(S,U,V)常用的非確定型準則有5種:1.悲觀準則2.樂觀準則3.折衷法、實用主義準則4.等可能性準則5.最小機會損失(后悔)準則11.2確定型和非確定型決策或簡記為上述三個主要素組成了決策系統(tǒng),決策系統(tǒng)可以表示為三個【例11-2】某公司為經(jīng)營業(yè)務的需要,決定要在現(xiàn)有生產(chǎn)條件不變的情況下,生產(chǎn)一種新產(chǎn)品,現(xiàn)可供開發(fā)生產(chǎn)的產(chǎn)品有I、II、III、IV四種不同產(chǎn)品,對應的方案為A1,A2,A3,A4.由于缺乏相關資料背景,對產(chǎn)品的市場需求只能估計為大中小三種狀態(tài),而且對于每種狀態(tài)出現(xiàn)的概率無法預測,每種方案在各種自然狀態(tài)下的效益值表,如表11-3所示.表11-3效益值表(單位:萬元)
自然狀態(tài)供選方案Ai需求量大S1需求量中S2需求量小S3A1:生產(chǎn)產(chǎn)品I800320-250A2:生產(chǎn)產(chǎn)品II600300-200A3:生產(chǎn)產(chǎn)品III30015050A4:生產(chǎn)產(chǎn)品IV40025010011.2確定型和非確定型決策【例11-2】某公司為經(jīng)營業(yè)務的需要,決定要在現(xiàn)有生產(chǎn)條件不(1)小中取大法(悲觀主義準則maxmin)
則對應的A4方案為決策方案,即生產(chǎn)產(chǎn)品IV.自然狀態(tài)供選方案Ai需求量大S1需求量中S2需求量小S3minmax生產(chǎn)產(chǎn)品I800320-250-250生產(chǎn)產(chǎn)品II600300-200-200生產(chǎn)產(chǎn)品III3001505050生產(chǎn)產(chǎn)品IV400250100100100策略值為11.2確定型和非確定型決策(1)小中取大法(悲觀主義準則maxmin)則對應的A4方(2)大中取大法(樂觀主義準則maxmax)
則對應的A1方案為決策方案,即生產(chǎn)產(chǎn)品I.自然狀態(tài)供選方案Ai需求量大S1需求量中S2需求量小S3maxmax生產(chǎn)產(chǎn)品I800320-250800800生產(chǎn)產(chǎn)品II600300-200600生產(chǎn)產(chǎn)品III30015050300生產(chǎn)產(chǎn)品IV400250100400策略值為11.2確定型和非確定型決策(2)大中取大法(樂觀主義準則maxmax)則對應的A1方(3)最小機會損失準則(Minimaxregret
criterion)
編制機會損失表:找出每個方案的最大機會損失Zi:選擇最小的機會損失值:對應的方案l即為所決策方案
自然狀態(tài)
生產(chǎn)方案需求量大S1需求量中S2需求量小S3Maximum決策結(jié)果A1:生產(chǎn)產(chǎn)品I00350350
A2:生產(chǎn)產(chǎn)品II20020300300生產(chǎn)產(chǎn)品IIA3:生產(chǎn)產(chǎn)品III50017050500
A4:生產(chǎn)產(chǎn)品IV400700400
則應選對應的A2方案為決策方案,即生產(chǎn)產(chǎn)品Ⅱ11.2確定型和非確定型決策(3)最小機會損失準則(Minimaxregretcr策略值為(4)等可能性決策準則(Equallikelihoodcriterion)自然狀態(tài)供選方案Ai需求量大S1需求量中S2需求量小S3E(Ai)max生產(chǎn)產(chǎn)品I800320-250290290生產(chǎn)產(chǎn)品II600300-200700/3生產(chǎn)產(chǎn)品III30015050500/3生產(chǎn)產(chǎn)品IV400250100250則應選擇對應的A1方案為決策方案,即生產(chǎn)產(chǎn)品I11.2確定型和非確定型決策策略值為(4)等可能性決策準則(Equallikeliho(5)折衷法,現(xiàn)實主義準則(Hurwiczcriterion)maxmin法是當=0時狀態(tài),maxmax是=1時狀態(tài).原則:決策者給出樂觀系數(shù)則說明決策者越接近悲觀;則說明決策者越接近樂觀.
自然狀態(tài)
0.30.7
生產(chǎn)方案需求量大S1需求量中S2需求量小S3MaxMin加權平均決策結(jié)果A1:生產(chǎn)產(chǎn)品I800320-250800-25065
A2:生產(chǎn)產(chǎn)品II600300-200600-20040
A3:生產(chǎn)產(chǎn)品III3001505030050125
A4:生產(chǎn)產(chǎn)品IV400250100400100190生產(chǎn)產(chǎn)品IV則應選擇對應的決策方案A4,即生產(chǎn)產(chǎn)品IV。11.2確定型和非確定型決策(5)折衷法,現(xiàn)實主義準則(Hurwiczcriter下一節(jié):風險型決策11.2確定型和非確定型決策作業(yè):教材P268T1、2下一節(jié):風險型決策11.2確定型和非確定型決策作業(yè):教材P11.3風險型決策11.3風險型決策11.3風險型決策風險型決策是指每種自然狀態(tài)出現(xiàn)的概率大體可以估計,并可算出在不同狀態(tài)下的效益值.11.3.1期望值準則(Expectedvaluecriterion)求效益期望值EMV。效益期望值=∑條件效益值×概率,即選擇最大效益期望值所對應的方案為決策方案1.最大效益期望值準則11.3風險型決策風險型決策是指每種自然狀態(tài)出現(xiàn)的概率大11.3風險型決
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 軟件安全人才隊伍建設研究-詳解洞察
- 梧州2025年廣西梧州市事業(yè)單位招聘1257人筆試歷年參考題庫附帶答案詳解
- 2025年中國塑鋼垂簾軌市場調(diào)查研究報告
- 2025年針織橫機配件項目可行性研究報告
- 廣州廣東廣州市花都區(qū)花山鎮(zhèn)和郁小學臨聘教師招聘筆試歷年參考題庫附帶答案詳解
- 廣東廣東海洋大學后勤保障部招聘非編制水電維修工(第二次)筆試歷年參考題庫附帶答案詳解
- 2025年球衣網(wǎng)布項目可行性研究報告
- 2025年水電解器架項目可行性研究報告
- 2025至2031年中國旋風式二級回收裝置行業(yè)投資前景及策略咨詢研究報告
- 2025年抗菌防霉乳膠漆項目可行性研究報告
- 剪映短視頻剪輯入門教程
- 衛(wèi)生部關于發(fā)布《綜合醫(yī)院組織編制原則試行草案》的通知((78)衛(wèi)醫(yī)字第1689號)
- 中式面點師初級(五級)教學計劃、大綱
- 新外研版九年級上冊英語 Module 1 Unit 2 重點習題課件
- Q∕SY 03026-2019 石腦油-行業(yè)標準
- 浙江共同富裕哪些值得關注
- 元宵節(jié)猜燈謎PPT
- 錦州市主要環(huán)境問題論文
- 東風4型內(nèi)燃機車檢修規(guī)程
- 藥品經(jīng)營企業(yè)GSP計算機系統(tǒng)培訓PPT課件
- 建筑工程冬期施工規(guī)程JGJT1042011
評論
0/150
提交評論