版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
8對策論教學(xué)目的與要求通過對本章的學(xué)習(xí),使學(xué)生對博弈論的產(chǎn)生、發(fā)展和研究現(xiàn)狀有較全面的了解,對博弈論在現(xiàn)代物流管理中的運用有較全面的認(rèn)識,掌握博弈論的概念、特點、分類和基本要素,掌握博弈論最基本的矩陣對策模型的建立,掌握矩陣對策的純策略和混合策略的運用,掌握矩陣對策中圖解法和線性規(guī)劃解法,能夠運用博弈論的方法對物流管理問題進行分析、建模并求解。對策論也稱游戲理論、競賽論、博弈論,源自英文“GameTheory”?,F(xiàn)廣為學(xué)術(shù)界接受的是博弈論這一名稱。作為現(xiàn)代數(shù)學(xué)的一個新分支和運籌學(xué)中的一個重要學(xué)科,它主要研究的是決策者在決策主體各方面相互作用的情況下如何進行決策及有關(guān)這種決策的均衡問題,其強調(diào)的是決策主體各方策略的相互依存性及其最優(yōu)組合。簡單地說就是對方如何行動,而我們又將如何應(yīng)對。由于它提供了一種研究人類理性行為的通用方法,運用這些方法可以更為清晰完整地分析各種社會經(jīng)濟力量沖突與合作的形勢,因此,博弈論在經(jīng)濟學(xué)、社會學(xué)、心理學(xué)、政治學(xué)等各類社會科學(xué)中得到了廣泛運用,對進化生物學(xué)和計算機科學(xué)等自然科學(xué)也產(chǎn)生了重要影響。8對策論教學(xué)目的與要求通過對本章的學(xué)習(xí),使學(xué)生對18對策論8.1對策問題的提出8.2對策論模型8.3矩陣對策的解法◎知識歸納◎習(xí)題與思考題8對策論8.1對策問題的提出28.1對策問題的提出8.1.1對策論概述作為一門現(xiàn)代學(xué)科,博弈論建立的時間并不長,然而博弈的思想源遠流長,博弈現(xiàn)象無處不有。小到棋牌之類的游戲,中到經(jīng)濟生活中的各種交易,大到國家之間的征伐斗爭,無不涉及人與人之間的斗智。博弈論的產(chǎn)生正是來自于人類對這種斗智現(xiàn)象的觀察與思考?,F(xiàn)代博弈論起源于19世紀(jì)末20世紀(jì)初,二戰(zhàn)后發(fā)展成為一門完整而豐富的理論學(xué)科。學(xué)術(shù)界一般將其發(fā)展歷程分為以下幾個階段:(1)萌芽階段從19世紀(jì)末到20世紀(jì)30年代可以說是博弈論的萌芽期,表現(xiàn)為學(xué)者們對社會經(jīng)濟理論和現(xiàn)實的一些思考,研究者以數(shù)學(xué)家為主。(2)產(chǎn)生階段20世紀(jì)四五十年代可說是博弈論的體系建立時期。1944年諾依曼和摩根斯坦的巨著《博弈論和經(jīng)濟行為》的出版,標(biāo)志著博弈論作為一門學(xué)科的建立,也被視為數(shù)理經(jīng)濟學(xué)學(xué)科建立的里程碑。巨著出版前后的若干年中,合作博弈理論的研究得到了迅速的發(fā)展,提出了各種概念,并在20世紀(jì)50年代達到了研究的高峰。不久,庫克于1950年定義了“囚徒的困境”,納什在1950年和1951年發(fā)表了兩篇關(guān)于非合作博弈的重要文章,這兩位學(xué)者的研究工作,特別是納什的研究工作奠定了非合作博弈論的基礎(chǔ),所提出的納什均衡概念,在非合作博弈論中起著核心作用。8.1對策問題的提出8.1.1對策論概述作3(3)發(fā)展階段20世紀(jì)60至80年代是博弈論體系的發(fā)展壯大時期。一方面,研究的領(lǐng)域從軍事戰(zhàn)略戰(zhàn)術(shù)問題推廣應(yīng)用到經(jīng)濟領(lǐng)域;另一方面,研究的內(nèi)容也不斷發(fā)展出新。合作博弈理論繼續(xù)得到充實和豐富,而非合作博弈理論更是發(fā)展迅速,成為博弈論研究和應(yīng)用的主流。(4)成熟階段20世紀(jì)80年代至今是博弈論的完善和應(yīng)用期。此間博弈論本身發(fā)展成為了一個相對完善、內(nèi)容豐富的理論體系,羽翼已豐的非合作博弈理論在理論研究和實踐應(yīng)用中都占據(jù)了主導(dǎo)地位。更重要的是,博弈理論在各種經(jīng)濟學(xué)科中都得到了深入的應(yīng)用,在政治學(xué)、生物學(xué)、計算機科學(xué)、道德哲學(xué)、社會學(xué)等領(lǐng)域內(nèi)也產(chǎn)生了重要影響。1994年,納什、澤爾騰、海薩尼三人因博弈論及其在經(jīng)濟應(yīng)用方面的突出貢獻而榮獲諾貝爾經(jīng)濟學(xué)獎,1996年諾貝爾經(jīng)濟學(xué)獎再度授予了在博弈論研究方面作出突出貢獻的維克里和莫里斯。由此,吸引了更多的學(xué)者投入到博弈論的研究當(dāng)中,使得博弈論成為世界范圍內(nèi)的研究熱點,博弈論也逐步趨于完善和成熟。2001年,研究博弈論的學(xué)者再一次獲得諾貝爾經(jīng)濟學(xué)獎。美國教授喬治·阿克爾洛夫、邁克爾·斯彭斯和約瑟夫·斯蒂格利茨在20世紀(jì)70年代奠定了對充滿不對稱信息市場進行分析的理論基礎(chǔ),正是由于他們在“對充滿不對稱信息市場進行分析”領(lǐng)域所做出的重要貢獻,而分享了2001年諾貝爾經(jīng)濟學(xué)獎。
(3)發(fā)展階段48.1.2對策論在現(xiàn)代物流管理中的運用在現(xiàn)代物流管理實踐中,決策者們?yōu)榱酥\求自身的不斷發(fā)展,保持自身的競爭優(yōu)勢,必須不斷地審時度勢、不停地進行選擇和作出決定,以保證最大限度地降低物流成本、提高物流效率及服務(wù)水平。他們的選擇和決定會影響到競爭對手的決策結(jié)果,同樣競爭對手的選擇和決定也直接影響著他們的決策結(jié)果。也就是說,決策者在決策時必須要考慮到對手的策略,因此,博弈論的思想已完全融入到現(xiàn)代物流管理的每一個環(huán)節(jié)中。博弈論在現(xiàn)代物流管理中的運用主要有物流項目投資、物流市場競爭對策、物流服務(wù)價格策略、物流中心選址、物流運輸規(guī)劃、物流倉儲優(yōu)化等內(nèi)容。以下僅就本書涉及到的有關(guān)博弈論中矩陣對策的例子作簡要介紹。(1)物流市場競爭博弈【例8.1】兩個競爭對手A公司和B公司,都計劃在某一個城市增加產(chǎn)品的銷售點,地點可選擇安排在城市中心或城市郊區(qū)。如果兩個對手都決定在城市中心建立銷售點,那么每年A公司產(chǎn)品的利潤要比B公司產(chǎn)品的利潤多10000元;如果兩個公司都決定在城市郊區(qū)建立銷售點,那么A公司產(chǎn)品的利潤要比B公司產(chǎn)品的利潤要少20000元;如果A公司安排在城市郊區(qū),而B公司安排在城市中心,那么A公司的利潤要比B公司的利潤多40000元;如果A公司安排在城市中心,而B公司安排在城市郊區(qū),那么A公司的利潤要比B公司少30000元。試問各公司安排銷售點的最好位置是哪里?在選擇自己銷售點位置時,不得不考慮對手銷售點的選擇,因為它對我們的銷售會產(chǎn)生很大的影響。最好位置的含義是使雙方都能發(fā)揮最大的能力,而不是使總銷售額達到最高,當(dāng)然,所謂“最好”在這里也是相對的。此外對位置的選擇可以有不同的解釋,這就是博弈了。8.1.2對策論在現(xiàn)代物流管理中的運用在現(xiàn)5(2)物流倉儲優(yōu)化策略【例8.2】一倉儲供應(yīng)中心為其下游的一家生產(chǎn)企業(yè)供應(yīng)某種原料。生產(chǎn)企業(yè)根據(jù)產(chǎn)品訂單情況對原料的需求進行分析,分別有淡季、旺季和正常三種情況,在正常情況下需要原料15噸,在淡季和旺季情況下分別需要原料10噸和20噸;而原料的價格與原料市場的需求有關(guān),在淡季、正常、旺季三種情況下,每噸原料的價格分別為100元、150元和200元,已知此時每噸原料的價格為100元。問在生產(chǎn)企業(yè)對原料的需求沒有確定預(yù)知的條件下,此時應(yīng)采購多少噸原料才能使倉儲供應(yīng)中心的總成本最少(不計存儲費用)?這個問題可看成一個博弈問題。即倉儲供應(yīng)中心針對可能出現(xiàn)的三種不同的原料需求狀況,運用三種儲量策略來進行應(yīng)對,通過對各種情況下成本費用的計算,找出最佳的策略來。在現(xiàn)代物流管理中,這種不同策略的相互應(yīng)對非常普遍,如投資與外包等。(3)物流運輸對策分析【例8.3】甲、乙兩個貨物運輸公司在同一地區(qū)從事運輸。兩個公司都想通過改革經(jīng)營管理以獲取更多運輸市場的份額。甲公司考慮的策略措施有:①降低運輸價格;②提高運輸質(zhì)量;③推出新的運輸方式。乙公司考慮的策略措施有:①增加廣告費用;②增設(shè)服務(wù)網(wǎng);③改進原有設(shè)備。假定市場份額一定,由于各自采取的策略措施不同,相應(yīng)的兩個公司的市場占有份額將會發(fā)生變化。如經(jīng)預(yù)測,當(dāng)甲公司采用①策略,乙公司采用①策略時,甲公司市場份額會有10%的增長,相應(yīng)還會有其他各種策略對應(yīng)的預(yù)測值。那么甲、乙兩公司的選擇是什么呢?和上面的例題一樣,我們通過競爭對策分析,就可以確定兩個公司各自的最優(yōu)策略了。由此可見,博弈就是競爭過程中,參與競爭者理性地選擇自身策略的過程。那么有效地預(yù)測對手的策略,全面地分析策略的得失,是博弈取勝的關(guān)鍵。返回(2)物流倉儲優(yōu)化策略返回68.2對策論模型博弈論分析的是人們進行決策時策略選擇的相互影響,現(xiàn)實中存在著極其多樣的這種形勢。為了進行規(guī)范分析,有必要從中抽象出最基本的組成要素構(gòu)成最簡單的模型,利用數(shù)學(xué)工具進行求解,分析結(jié)論的現(xiàn)實意義,然后再逐步加入更復(fù)雜的因素,使模型更能描述現(xiàn)實。這樣最簡單的對策模型,一般都有以下三個基本要素。8.2.1對策模型的基本要素(1)局中人在一個對策行為中,有權(quán)決定自己行動方案的對策參加者被稱為局中人。局中人除了理解為個人外還可以理解為集體,如球隊、交戰(zhàn)國、企業(yè)公司等,也可以把大自然理解為局中人(因為人類經(jīng)常處于和大自然斗爭的狀態(tài)中);另外,還假定局中人都是聰明的,有理智的和利己的。同時,為使所研究的問題更加清晰,把那些利益完全一致的參加者們看做一個局中人,因為他們利害一致,必使他們齊心合力,相互配合行動如一個人。例如,橋牌游戲中,東西雙方利益一致,南北兩方得失相當(dāng),所以雖有四人參加,只能算有兩個局中人。一個對策中一般要求至少有兩個局中人。每個局中人用i表示,局中人的集合用字母I表示,則I={1,2,…,n}。我們稱只有兩個局中人的對策現(xiàn)象為“兩人對策”,如象棋、橋牌等,顯然上述齊王賽馬中局中人也是兩人,即I={1,2}。而多于兩個局中人的對策稱為“多人對策”。另外根據(jù)局中人之間是否允許進行合作,還可有“結(jié)盟對策”和“不結(jié)盟對策”,或稱為“合作博弈”和“非合作博弈”。8.2對策論模型博弈論分析的是人們進行決策時7(2)策略在一局對策中,可供局中人選擇的一個實際可行的自始至終通盤籌劃的完整行動方案稱為這個局中人的一個“策略”。參加對策的局中人i(i∈I)的所有可供選擇的策略的全體所構(gòu)成的集合叫做局中人i的“策略集”,簡記作Si。(3)贏得函數(shù)一局對策結(jié)束之后,對每個局中人來說,不外乎是勝利或失敗,名次的前后,以及其他物質(zhì)的收入或支出等,這些可以統(tǒng)稱為“得失”或“益損”。在齊王與田忌賽馬的例子中,最后田忌贏得一千金,而齊王損失一千金,即為這局對策(結(jié)局時)雙方的“得失”。實際上,每個局中人在一局對策結(jié)束時的得失,與局中人所選定的策略有關(guān)。例如,上述賽馬的例子中,當(dāng)齊王出策略“上、中、下”,田忌出策略“下、上、中”時,田忌得千金;而如果與田忌都出策略“上、中、下”時,田忌就得付出三千金了。因此,在一局對策中,當(dāng)局勢給定以后,對策的結(jié)果也就確定了。一局對策結(jié)束時,每個局中人的“得失”是全體局中人所決定的一組策略即“局勢”的函數(shù),我們稱之為“贏得函數(shù)”。在最終局勢ω下,局中人i∈I的贏得函數(shù)記作:H(i,ω)。在一局對策中,如果在任一“局勢”中,全體局中人的“得失”相加總和為零,就稱該對策為“零和對策”,否則,就稱為“非零和對策”。上述齊王與田忌賽馬的例子中,不論比賽雙方的策略如何,比賽的結(jié)果,一方的所得必為另一方的所失,因此該對策就是一個零和對策。一般來說,當(dāng)上述三個基本要素確定以后,一個對策模型就確定了。(2)策略88.2.2對策的分類對策的種類很多,可以依據(jù)不同的原則進行分類。如前所述,根據(jù)參與博弈的局中人的數(shù)量可分為二人對策和多人對策;根據(jù)局中人之間是否允許進行合作(一般是多人博弈中),可分為合作博弈和非合作博弈;根據(jù)局中人策略集中策略的有限或無限,可分為有限對策和無限對策;根據(jù)各局中人贏得函數(shù)值的和是否為零,可分為零和對策和非零和對策,非零和又可分為常和對策與變和對策;此外,根據(jù)對策與時間的關(guān)系可將凈對策分為靜態(tài)對策和動態(tài)對策;根據(jù)大家是否都清楚各種對局情況下每個局中人的得益,可分為完全信息對策和不完全信息對策;根據(jù)對策的數(shù)學(xué)模型的類型可分為矩陣對策、連續(xù)對策、微分對策、陣地對策、隨機對策等。目前世界比較流行的一種分類方式是把靜態(tài)與動態(tài)、完全信息與不完全信息這四種基本的對策組合起來形成四類博弈:完全信息靜態(tài)博弈,完全信息動態(tài)博弈,不完全信息靜態(tài)博弈,不完全信息動態(tài)博弈。完全信息是指博弈中的決策者對于博弈整體結(jié)構(gòu)有著充分的了解,唯一需要考慮的就是策略選擇問題;不完全信息則是指博弈中的決策者對博弈結(jié)構(gòu)中某些部分的了解不充分;靜態(tài)博弈是指博弈中每個決策者的策略選擇僅進行一次,在選擇時不知道其他人的策略選擇;動態(tài)博弈則引入了決策的先后次序,局中人在進行選擇時可以得到關(guān)于行動歷史的一些信息。這四類博弈一個比一個精彩,也一個比一個難。主要對策模型的分類見圖8.1。8.2.2對策的分類對策的種類很多,可以依9圖8.1對策模型分類圖8.1對策模型分類10在眾多的對策模型中,完全信息靜態(tài)模型中的有限二人零和對策占有重要地位。這類對策也叫矩陣對策,它是到目前為止在理論研究和求解方法方面都比較完善的一類對策,而且這類對策的研究思想和理論結(jié)果又是研究其他對策模型的基礎(chǔ)。這里我們僅討論矩陣對策模型。在眾多的對策模型中,完全信息靜態(tài)模型中的有限二118.2.3矩陣對策的基本模型矩陣對策是指對策中只有兩個局中人,每個局中人各有有限個可供選擇的策略。在每個對局中,兩個局中人獨立的選擇一個策略(互相都不知道對方所選的策略),而兩人的收益總和(“得失”相加)為零。這種對策中,兩個局中人的利益是完全相反的,即一個局中人的贏得值恰好是另一個人所損失的值。局中人雙方的利益是沖突的,因此不存在合作的可能,所以矩陣對策又稱為有限對抗對策。這種對策比較簡單,在理論上也比較成熟,而且這些理論奠定了研究“對策現(xiàn)象”的基本思路,所以矩陣對策是對策論的基礎(chǔ)。下面繼續(xù)討論齊王賽馬的例子:以α1(上、中、下)表示齊王以“先用上等馬、再用中等馬、最后用下等馬”次序參加比賽。也就是說它是齊王的一個策略。于是齊王共有6個策略(3的全排列P3=3!=3×2×1=6),即:α1(上、中、下)α2(上、下、中)α3(中、上、下)α4(中、下、上)α5(下、中、上)α6(下、上、中)同理,對田忌來講也有6個策略,分別是:β1(上、中、下)β2(上、下、中)β3(中、上、下)β4(中、下、上)β5(下、中、上)β6(下、上、中)8.2.3矩陣對策的基本模型矩陣對策是指對策12當(dāng)齊王選取策略α1(上、中、下),田忌選取策略β1(上、中、下)進行比賽,就形成了一個局勢(α1,β1)。這時由于在同級的馬中,田忌的馬不如齊王的馬,所以齊王在這一局勢下每個等級的馬都勝過田忌的馬,齊王可以得到三千金。同樣,在局勢(α1,β2)下齊王可以得到一千金,而在局勢(α1,β6)下田忌可以得到一千金。齊王在不同局勢下的不同得失可用矩陣表示為矩陣中的元素1和3是表示齊王得到的千金數(shù),同時也是田忌應(yīng)付的千金數(shù);-1是齊王應(yīng)付的千金數(shù),同時也是田忌所得到的千金數(shù)。對于矩陣對策來說,局中人的贏得矩陣給定之后,兩個局中人就便于各自考慮選取最合適的策略,以謀取最大的收益。一般的,用Ⅰ、Ⅱ表示兩個局中人,局中人Ⅰ有m個策略,即α1,α2…,αm;局中人Ⅱ有n個策略,即β1,β2,…,βn。則局中人Ⅰ、Ⅱ的策略集分別為當(dāng)齊王選取策略α1(上、中、下),田忌選取策13S1={α1,α2,…,αm}S2={β1,β2,…,βn}當(dāng)Ⅰ選取策略αi,Ⅱ選取策略βj,就形成一個局勢(αi,βj),這時局中人Ⅰ的收益為αij,局中人Ⅱ的收益為-αij(共有m×n個局勢)。矩陣A=(αij)稱為局中人Ⅰ的贏得矩陣,即當(dāng)局中人Ⅰ、Ⅱ和策略集S1、S2及局中人的贏得矩陣A確定后,一個矩陣對策就給定了。通常我們將矩陣對策記作:G={Ⅰ,Ⅱ;S1,S2;A}返回S1={α1,α2,…,αm}148.3矩陣對策的解法矩陣對策求解的方法很多,有圖解法、拉格朗日乘數(shù)法、方程組法和線性規(guī)劃法等。本節(jié)給出最常用的求解矩陣對策的方法:圖解法和線性規(guī)劃法。在介紹這兩種解法前我們首先講解一下關(guān)于矩陣對策的純策略和混合策略。8.3.1矩陣對策的純策略當(dāng)矩陣對策給定后,兩局中人所面臨的問題是該問題是否存在對自己最為有利的純策略,如果存在,局中人該如何選取對自己最為有利的純策略,以及求得在該策略下自己的最大的贏得值(或是最少的損失值)是多少。下面通過分析具體的矩陣對策的例子來回答上述問題。【例8.4】設(shè)有一矩陣對策,局中人Ⅰ的贏得矩陣為8.3矩陣對策的解法矩陣對策求解的方法很多15試研究雙方策略。解由A可以看出,局中人Ⅰ的最大收益值是9,要想達到這個目的,他就得選策略α3。然而局中人Ⅱ也在考慮,因為局中人Ⅰ有出α3的心理狀態(tài),要想使自己有較大的贏得,就想選β3作為對策。這樣不僅使局中人Ⅰ得不到9,反而會失去10(即得-10)。同樣,局中人Ⅰ也會想Ⅱ有出β3的可能,于是Ⅰ想出α4來對付Ⅱ,使他不但得不到10反而輸?shù)?……這樣一來,雙方都必然要考慮風(fēng)險,考慮對方會設(shè)法使自己收入最小;因此,都應(yīng)當(dāng)從最壞處著想,去盡量爭取最好的結(jié)果。這就是所謂的保守準(zhǔn)則,保證最小收益,即maxmin準(zhǔn)則。對局中人Ⅰ來說,若他選擇策略α1,他的收益可能就是-8(當(dāng)Ⅱ選擇策略β3),這是他選擇α1時能保證得到的最小收益。同樣,他選擇α2、α3、α4時,能保證得到的最小收益分別是2、-10、-3,即對應(yīng)行的最小元素;因此,當(dāng)他選擇策略α2時,他可以保證收益至少為2,而當(dāng)他選擇其他策略時,他的收益可能少于2。在這個意義下(也即maxmin準(zhǔn)則),我們說α2是Ⅰ的最優(yōu)策略。同樣,局中人Ⅱ選擇策略β1、β2、β3時,他的損失分別為9、2、6,即對應(yīng)列的最大元素。因此,他的最優(yōu)策略(按minmax準(zhǔn)則)是β2,可保證損失不超過2。試研究雙方策略。16結(jié)果,局中人Ⅰ按maxmin準(zhǔn)則選取策略α2,局中人Ⅱ按minmax準(zhǔn)則選取β2,雙方都得到了他們預(yù)想的收益,這是一種最穩(wěn)妥的行為。我們把(α2,β2)稱為對策G的最優(yōu)局勢。求最優(yōu)策略的過程用數(shù)學(xué)式子描述如下:對局中人Ⅰ來講,就先在矩陣A每一行元素中取最小值,即第一行:min{-6,1,-8}=-8第二行:min{3,2,4}=2第三行:min{9,-1,-10}=-10第四行:min{-3,0,6}=-3再從這些最小值中取最大值,即max{-8,2,-10,-3}=2因此,由上面矩陣A可知,局中人Ⅰ的最優(yōu)策略為α2。對局中人Ⅱ來講,先在矩陣A每一列元素中取最大值,即第一列:max{-6,3,9,-3}=9第二列:max{1,2,-1,0}=2第三列:max{-8,4,-10,6}=6再從這些最大值中取最小值,即min{9,2,6}=2因此,由上面可知,對局中人Ⅱ來講最優(yōu)策略為β2。2是對策G的值,對策值用VG表示,即VG=2
結(jié)果,局中人Ⅰ按maxmin準(zhǔn)則選取策略17一般的,設(shè)局中人Ⅰ、Ⅱ都采用保守準(zhǔn)則保證最小收益,即maxmin準(zhǔn)則。那么對局中人Ⅰ來說,他應(yīng)對自己每一種可以選擇的策略求出其最小的收益,再選擇最小收益中收益最大的那個策略。對贏得矩陣A=(aij)來說,就是先在每一行中求最小值,再在這些最小值中選出最大值。即
對局中人Ⅱ來說,A是他的損失矩陣,他的收益是-αij,所以他對A使用保守準(zhǔn)則時,應(yīng)當(dāng)先在每一列中求出最大值,再在這些最大值中選擇最小的那個,即
通過上面的討論可以看到:在對策中,局中人Ⅰ、Ⅱ都采用保守準(zhǔn)則,最后出現(xiàn)了一個平衡局勢(αi*,βj*),這個局勢雙方均可接受,且對雙方來說都是一個最穩(wěn)妥的結(jié)果。我們把這個平衡局勢(αi*,βj*)稱為鞍點。鞍點的定義:設(shè)對策G的贏得矩陣為A=(αij),若,且等于矩陣元素αi*j*;那么,(αi*,βj*)稱為對策G的一個鞍點,αi*稱為局中人Ⅰ的最優(yōu)純策略,βj*稱為局中人Ⅱ的最優(yōu)純策略,VG=αi*j*稱為對策G的值。=一般的,設(shè)局中人Ⅰ、Ⅱ都采用保守準(zhǔn)則保證最小188.3.2矩陣對策的混合策略由上面的討論可知,在一個矩陣對策A=(αij)中,局中人Ⅰ能保證最小可得為局中人Ⅱ能保證的最大所失為一般而言,局中人Ⅰ的收益不會多于局中人Ⅱ的所失,所以總有v1≤v2即有8.3.2矩陣對策的混合策略由上面的討論可知19若等號成立,即v1=v2時,矩陣對策在純策略意義下有解,且VG=v1=v2。然而,實際中出現(xiàn)的更多情況是等號不成立,即為若等號成立,即v1=v2時,矩陣對策在純策208.3.3矩陣對策圖示法現(xiàn)在討論矩陣對策的圖解法,這種方法不僅為贏得矩陣為2×n和m×2階的對策問題提供了一個直觀的解法而且通過這種方法的討論可以使我們在幾何上理解對策論的思想。下面利用例子來說明如何求出最優(yōu)策略。【例8.8】設(shè)有對策矩陣,其中矩陣中的元素表示局中人Ⅰ的得分,即試求出每個局中人的最優(yōu)策略,并問其對策值是多少?解我們知道,在上面對策中,局中人Ⅰ有2種策略,局中人Ⅱ有3種策略。假定p是局中人Ⅰ選取第一行的概率,那么1-p是他選取第二行的概率。下面依據(jù)p來計算局中人Ⅰ的期望收益值。如果局中人選擇第一列,那么局中人Ⅰ的期望收益值等于4p-(1-p),即E1=5p-1(圖8.2中直線①)類似的,若局中人選擇第二列和第三列,則局中人Ⅰ的期望收益值分別為E1=4-5p(圖8.2中直線②)E1=2-2p(圖8.2中直線③)8.3.3矩陣對策圖示法現(xiàn)在討論矩陣對策的21另外,我們以E1為y軸,p為x軸,作出直線①、直線②和直線③。以局中人Ⅱ的角度來看,他希望局中人Ⅰ得分盡可能少,因為這樣能使自己得分盡可能多。因此,局中人Ⅱ?qū)⑦x擇這樣的策略(直線)使其高度最低。由于每條直線的高度表示局中人Ⅰ的得分多少。換言之,局中人Ⅱ的最優(yōu)策略即是圖8.2中粗黑的折線A1AA2A3。圖8.2例8.8最優(yōu)策略選擇示意圖另外,我們以E1為y軸,p為x軸,作出直線①22局中人Ⅰ認(rèn)識到這一點,就將選擇p的值,使自己能獲得更多的分?jǐn)?shù)。這樣p的值出現(xiàn)在直線①和直線③的交點A處,交點坐標(biāo)為p=3/7,E1=8/7于是局中人Ⅰ的最優(yōu)策略是以37的概率選擇第一行和以47的概率選擇第二行。在這種情況下,這個對策的值是E1=8/7。為求出局中人Ⅱ的最優(yōu)策略,要注意局中人Ⅰ的最優(yōu)策略是根據(jù)對策矩陣的第一列和第三列所計算出的得分?jǐn)?shù)而得到的,在例8.8的矩陣中刪去第二列所構(gòu)成的矩陣為現(xiàn)在,由式(82)可求出局中人Ⅱ的最優(yōu)策略為q1=2/7,q2=0,q3=5/7于是局中人Ⅱ的最優(yōu)策略是以27的概率選擇第一列,以5/7的概率選擇第三列,而始終不選擇第二列(即被刪除的列)。局中人Ⅰ認(rèn)識到這一點,就將選擇p的值,使自己238.3.4矩陣對策線性規(guī)劃法前面討論了圖解法,解決了贏得矩陣為2×n和m×2階對策問題的求解。對于一般的矩陣對策問題,可以用線性規(guī)劃法來進行求解,因為這種方法可以求解任何矩陣對策。若一個矩陣對策中,局中人Ⅰ的贏得矩陣為A,則他的最優(yōu)混合策略x=(x1,x2,…,xm)是線性規(guī)劃問題的解;而局中人Ⅱ的最優(yōu)策略y=(y1,y2,…ym)是問題8.3.4矩陣對策線性規(guī)劃法前面討論了圖解法24的解,容易驗證問題(P)和問題(D)是互為對偶的線性規(guī)劃問題。這樣求解矩陣對策可等價地轉(zhuǎn)化為對偶的線性規(guī)劃問題(P)和(D)。在問題(P)中,令x′I=xi/v1,i=1,2,…,m(不妨設(shè)v1>0)(8.3)則問題(P)的約束條件變?yōu)榈慕?,容易驗證問題(P)和問題(D)是互為對偶25故問題(P)等價于問題(P′)同理,令
y′j=yj/v2,j=1,2,…,m(不妨設(shè)v2>0)(8.4)可知問題(D)等價于問題(D′)故問題(P)等價于問題(P′)同理,令26顯然問題(P′)和(D′)是互為對偶的線性規(guī)劃,可利用單純形法和對偶單純形法求解。求解后再通過式(8.3)和式(8.4)進行變換,即可求得矩陣對策的解和對策值。返回顯然問題(P′)和(D′)是互為對偶的線性規(guī)劃27知識歸納1.對策論主要研究的是決策者在決策主體各方相互作用情況下如何進行決策及有關(guān)這種決策的均衡問題,它所強調(diào)的是競爭。2.對策模型包括局中人、策略和贏得函數(shù)三個要素。它是我們研究對策問題的基礎(chǔ)。3.矩陣對策指對策中包含兩個局中人,各自的策略集均由有限個策略組成,且一方所得恰為對方所失。其模型(贏得矩陣)為一般記為G={Ⅰ,Ⅱ;S1,S2;A}。知識歸納1.對策論主要研究的是決策者在決策主體各方相284.矩陣對策的純策略是指其滿足,此時矩陣有鞍點。5.矩陣對策的混合策略是指當(dāng)(一般為<),此時矩陣無鞍點,雙方都無最優(yōu)策略,只能采用混合策略。6.矩陣對策的解法。(1)如果贏得矩陣有鞍點則通過maxmin準(zhǔn)則求解。(2)如果贏得矩陣無鞍點先通過優(yōu)勢準(zhǔn)則進行簡化。對于2×2贏得矩陣直接用下面公式求解。
對于2×n或m×2贏得矩陣直接用圖解法進行求解。對于一般贏得矩陣采用線性規(guī)劃法進行求解。返回4.矩陣對策的純策略是指其滿足29習(xí)題與思考題
8.1已知A、B兩人進行對抗,A的贏得矩陣如下,求雙方的最優(yōu)策略和對策值。習(xí)題與思考題8.1已知A、B兩人進行對抗,A308.2用圖解法求下列對策
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年游艇租賃合同(含旅游行程安排)3篇
- 2024年度食堂承包合同(大路特色風(fēng)味)3篇
- 2024年度企業(yè)年金計劃員工購房貸款提前還款合同3篇
- 2024年度版權(quán)轉(zhuǎn)讓合同:某作家將其作品轉(zhuǎn)讓給出版社的協(xié)議3篇
- 2024年度一環(huán)路(永定河路)道路突發(fā)事件應(yīng)急預(yù)案合同2篇
- 2024年度生物技術(shù)成果保密及許可合同3篇
- 2024全新集裝箱運輸合同終止協(xié)議書模板下載3篇
- 2024年校園綠化病蟲害防治定期維護合同2篇
- 2024全新房屋買賣合同樣本下載附家具家電清單3篇
- 2024年度共同財產(chǎn)贈與合同3篇
- 口腔護理膏在治療口腔潰瘍的臨床研究
- 眩暈的中醫(yī)診治課件
- 一輪復(fù)習(xí)人教版 第9單元 高頻考點進階課 5.生態(tài)系統(tǒng)的結(jié)構(gòu)與功能 課件(53張)
- 部編版二年級數(shù)學(xué)上冊知識點匯總復(fù)習(xí)統(tǒng)編課件ppt
- T∕ASC 17-2021 電動汽車充換電設(shè)施系統(tǒng)設(shè)計標(biāo)準(zhǔn)
- 機動車排放檢驗檢測方法內(nèi)部審批程序
- 讓生命之花綻放光彩——“生命教育”主題班會ppt
- 并網(wǎng)光伏電站調(diào)試報告
- 預(yù)計體育課運動生理負(fù)荷脈搏曲線圖
- MTK平臺modem配置
- 夾套反應(yīng)釜-課程設(shè)計
評論
0/150
提交評論