第九章 運(yùn)籌學(xué)博弈論_第1頁(yè)
第九章 運(yùn)籌學(xué)博弈論_第2頁(yè)
第九章 運(yùn)籌學(xué)博弈論_第3頁(yè)
第九章 運(yùn)籌學(xué)博弈論_第4頁(yè)
第九章 運(yùn)籌學(xué)博弈論_第5頁(yè)
已閱讀5頁(yè),還剩71頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第九章博弈論引言完全信息靜態(tài)博弈(有鞍點(diǎn)的博弈,混合策略,納什均衡)完全信息靜態(tài)博弈(非零和的情況,納什均衡)教學(xué)目的與要求:理解具有競(jìng)爭(zhēng)性問(wèn)題的博弈思想,對(duì)納什均衡概念有初步的認(rèn)識(shí),掌握矩陣博弈的求解方法.重點(diǎn)與難點(diǎn):有鞍點(diǎn)的靜態(tài)博弈和無(wú)鞍點(diǎn)的靜態(tài)博弈,難點(diǎn)是納什均衡的概念.教學(xué)方法:通過(guò)大量的實(shí)例講解相關(guān)概念和解法,并進(jìn)行課堂討論.思考題,討論題,作業(yè):兩個(gè)課堂討論題,本章習(xí)題.參考資料:見(jiàn)前言.學(xué)時(shí)分配:6學(xué)時(shí).引言§1.在社會(huì)活動(dòng),經(jīng)濟(jì)和經(jīng)濟(jì)管理,軍事活動(dòng)中,經(jīng)常會(huì)遇到具有競(jìng)爭(zhēng)性或利益相對(duì)抗的現(xiàn)象,例如下棋,打橋牌,體育競(jìng)賽,市場(chǎng)競(jìng)爭(zhēng),廣告戰(zhàn),價(jià)格戰(zhàn),軍事斗爭(zhēng)等.競(jìng)爭(zhēng)的各方總是想用最好的策略擊敗對(duì)方,取得盡可能好的結(jié)果,這就是博弈現(xiàn)象.博弈現(xiàn)象是一種特殊的決策,在不確定決策分析中,決策者的對(duì)手是”大自然”,它對(duì)決策者的各種策略不產(chǎn)生反應(yīng),但在博弈現(xiàn)象中,代替”大自然”的是”有理性的人”,因而任何一方做出的決定都必須充分考慮其他對(duì)手可能作出的反應(yīng).早期的博弈實(shí)例是中國(guó)春秋戰(zhàn)國(guó)時(shí)代的齊王和田忌賽馬的故事:齊王有上,中,下三等馬,他麾下的大將也有上,中,下三等馬,但是同等級(jí)的馬都比齊王差一些.賽馬時(shí)齊王表示按上,中,下的順序出馬,而田忌的謀士讓他按下,上,中的順序出馬,比賽結(jié)果田忌贏了一千金.請(qǐng)思考:這是一種什么類(lèi)型的博弈?理論上齊王不會(huì)輸,但他為什么輸了?在國(guó)外,1912年E.Zermelo用集合論研究過(guò)下棋問(wèn)題,四十年代由于生產(chǎn)和戰(zhàn)爭(zhēng)的需要,博弈理論得到了發(fā)展,系統(tǒng)博弈理論的形成則以1944年V.Neumann,O.Morgensten合著的《博弈論和經(jīng)濟(jì)行為》一書(shū)為標(biāo)志.1994年瑞士皇家科學(xué)院決定將諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予納什(Nash),哈薩尼(Harsanyi)和澤爾騰(Selten)三人,表彰他們?cè)诓┺睦碚摵蛻?yīng)用研究方面作出的杰出貢獻(xiàn).目前,博弈論在定價(jià),招投標(biāo),拍賣(mài),委托代理以及很多重要的經(jīng)營(yíng)決策中得到應(yīng)用,它已成為現(xiàn)代經(jīng)濟(jì)學(xué)的重要基礎(chǔ).約翰·納什(JOHNF.NASH)美國(guó)人(1928-),由于他與另外兩位數(shù)學(xué)家在非合作博弈的均衡分析理論方面做出了開(kāi)創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響,而獲得1994年諾貝爾經(jīng)濟(jì)獎(jiǎng)。約翰·海薩尼(JOHNC.HARSANYI)美國(guó)人,由于他與另外兩位數(shù)學(xué)家在非合作博弈的均衡分析理論方面做出了開(kāi)創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響,由此獲得諾貝爾經(jīng)學(xué)獎(jiǎng)。

約翰·納什

1928年生于美國(guó)約翰·海薩尼

1920年生于美國(guó)

萊因哈德·澤爾騰

1930年生于德國(guó)

三人在非合作博弈的均衡分析理論方面做出了開(kāi)創(chuàng)性貢獻(xiàn)對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響

瑞典諾貝爾基金會(huì)官方網(wǎng)站透露了近20年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主名單及其主要貢獻(xiàn)(即獲獎(jiǎng)理由):

2004年挪威經(jīng)濟(jì)學(xué)家芬恩-基德蘭德(FinnE.Kydland)和美國(guó)經(jīng)濟(jì)學(xué)家愛(ài)德華-普雷斯科特(EdwardC.Prescott)

獲獎(jiǎng)理由:在動(dòng)態(tài)宏觀經(jīng)濟(jì)學(xué)方面做出了巨大貢獻(xiàn)。

2003年美國(guó)經(jīng)濟(jì)學(xué)家羅伯特-恩格爾(RobertF.EngleIII)和英國(guó)經(jīng)濟(jì)學(xué)家克萊夫-格蘭杰(CliveW.J.Granger)

獲獎(jiǎng)理由:在經(jīng)濟(jì)時(shí)間數(shù)列中運(yùn)用了統(tǒng)計(jì)學(xué)的方法。

2002年美國(guó)學(xué)者丹尼爾-卡尼曼(DanielKahneman)和弗農(nóng)-史密斯(VernonL.Smith)

獲獎(jiǎng)理由:在心理和實(shí)驗(yàn)經(jīng)濟(jì)學(xué)研究方面做出了開(kāi)創(chuàng)性工作。

2001年三位美國(guó)學(xué)者喬治-阿克爾洛夫(GeorgeA.Akerlof)、邁克爾-斯彭斯(A.MichaelSpence)和約瑟夫-斯蒂格利茨(JosephE.Stiglitz)

獲獎(jiǎng)理由:在“對(duì)充滿(mǎn)不對(duì)稱(chēng)信息市場(chǎng)進(jìn)行分析”領(lǐng)域做出了重要貢獻(xiàn)。

2000年美國(guó)芝加哥大學(xué)的詹姆斯-赫克曼(JamesJ.Heckman)和加州大學(xué)伯克利分校的丹尼爾-麥克法登(DanielL.McFadden)

獲獎(jiǎng)理由:在微觀計(jì)量經(jīng)濟(jì)學(xué)領(lǐng)域做出了重大貢獻(xiàn)。

1999年加拿大著名經(jīng)濟(jì)學(xué)家羅伯特-蒙代爾教授(RobertA.Mundell)

獲獎(jiǎng)理由:對(duì)不同匯率體制下的貨幣和財(cái)政政策以及最優(yōu)貨幣區(qū)域的分析做出了偉大貢獻(xiàn)。

1998年印度籍經(jīng)濟(jì)學(xué)家阿馬蒂亞-森(AmartyaSen)

獲獎(jiǎng)理由:對(duì)福利經(jīng)濟(jì)學(xué)以及發(fā)展經(jīng)濟(jì)學(xué)做出了突破性貢獻(xiàn)。

1997年美國(guó)經(jīng)濟(jì)學(xué)家邁倫-斯科爾斯(MyronS.Scholes)和羅伯特-默頓(RobertC.Merton)

獲獎(jiǎng)理由:前者給出了著名的布萊克-斯科爾斯期權(quán)定價(jià)公式,該法則已成為金融機(jī)構(gòu)涉及金融新產(chǎn)品的思想方法;后者對(duì)布萊克-斯科爾斯公式所依賴(lài)的假設(shè)條件做了進(jìn)一步減弱,在許多方面對(duì)其做了推廣。

1996年英國(guó)人(JamesA.Mirrlees)和美國(guó)人威廉-維克瑞(WilliamVickrey)

獲獎(jiǎng)理由:前者在信息經(jīng)濟(jì)學(xué)理論領(lǐng)域做出了重大貢獻(xiàn),尤其是不對(duì)稱(chēng)信息條件下的經(jīng)濟(jì)激勵(lì)理論的論述;后者在信息經(jīng)濟(jì)學(xué)、激勵(lì)理論、博弈論等方面都做出了重大貢獻(xiàn)。

1995年美國(guó)人羅伯特-盧卡斯(RobertE.LucasJr.)

獲獎(jiǎng)理由:倡導(dǎo)和發(fā)展了理性預(yù)期與宏觀經(jīng)濟(jì)學(xué)研究的運(yùn)用理論,深化了人們對(duì)經(jīng)濟(jì)政策的理解,并對(duì)經(jīng)濟(jì)周期理論提出了獨(dú)到的見(jiàn)解。

1994年美國(guó)人約翰-海薩尼(JohnC.Harsanyi)和美國(guó)人約翰-納什(JohnF.NashJr.)以及德國(guó)人萊因哈德-澤爾騰(ReinhardSelten)

獲獎(jiǎng)理由:在非合作博弈的均衡分析理論方面做出了開(kāi)創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。

1993年美國(guó)人羅伯特-福格爾(RobertW.Fogel)和道格拉斯-諾斯(DouglassC.North)

獲獎(jiǎng)理由:前者用經(jīng)濟(jì)史的新理論及數(shù)理工具重新詮釋了過(guò)去的經(jīng)濟(jì)發(fā)展過(guò)程;后者建立了包括產(chǎn)權(quán)理論、國(guó)家理論和意識(shí)形態(tài)理論在內(nèi)的“制度變遷理論”。

1992年美國(guó)人加里-貝克(GaryS.Becker)

獲獎(jiǎng)理由:揭示并澄清了經(jīng)濟(jì)制度結(jié)構(gòu)和函數(shù)中交易費(fèi)用和產(chǎn)權(quán)的重要性。

1990年美國(guó)人哈里-馬科維茨(HarryM.Markowitz)、默頓-米勒(MertonH.Miller)和威廉-夏普(WilliamF.Sharpe)

獲獎(jiǎng)理由:在金融經(jīng)濟(jì)學(xué)方面做出了開(kāi)創(chuàng)性工作。

1989年挪威人特里夫-哈維默(TrygveHaavelmo)

獲獎(jiǎng)理由:建立了現(xiàn)代經(jīng)濟(jì)計(jì)量學(xué)的基礎(chǔ)性指導(dǎo)原則。

1988年法國(guó)人莫里斯-阿萊斯(MauriceAllais)

獲獎(jiǎng)理由:在市場(chǎng)理論及資源有效利用方面做出了開(kāi)創(chuàng)性貢獻(xiàn),并對(duì)一般均衡理論重新做了系統(tǒng)闡述。

1987年美國(guó)人羅伯特-索洛(RobertM.Solow)

獲獎(jiǎng)理由:對(duì)增長(zhǎng)理論做出貢獻(xiàn)。提出長(zhǎng)期的經(jīng)濟(jì)增長(zhǎng)主要依靠技術(shù)進(jìn)步,而不是依靠資本和勞動(dòng)力的投入。

1986年美國(guó)人詹姆斯-布坎南(JamesM.BuchananJr.)

獲獎(jiǎng)理由:將政治決策的分析同經(jīng)濟(jì)理論結(jié)合起來(lái),使經(jīng)濟(jì)分析擴(kuò)大和應(yīng)用到社會(huì),政治法規(guī)的選擇

1985年意大利人弗蘭科-莫迪利安尼(FrancoModigliani)

獲獎(jiǎng)理由:第一個(gè)提出儲(chǔ)蓄的生命周期假設(shè),這一假設(shè)在研究家庭和企業(yè)儲(chǔ)蓄中得到了廣泛應(yīng)用。什么是博弈論?所謂博弈是指局中人按一定規(guī)則,在充分考慮其他局中人可能采取的策略的基礎(chǔ)上,從自己的策略集中選取相應(yīng)策略,并從中得到回報(bào)的過(guò)程.博弈是一種特殊的決策,在決策論中,決策者的對(duì)手是大自然,在博弈論中,代替大自然的是有理性的人,因而任何一方做出決定時(shí),都必須考慮其他對(duì)手可能作出的反應(yīng).構(gòu)成博弈的三個(gè)要素:1.局中人(Players):是指參與競(jìng)爭(zhēng)的各方,它可以是一個(gè)人,也可以是一個(gè)集團(tuán),但局中人必須是有決策權(quán)的主體,而不是參謀或從屬人員.在博弈中局中人可以有兩方,稱(chēng)為二人博弈;也可以有多方,稱(chēng)為多人博弈,在多人博弈中又可分為結(jié)盟和不結(jié)盟的情況.2.策略(Strategies):指局中人所擁有的對(duì)付其他局中人的手段,方案的集合.在靜態(tài)博弈中,策略必須是一個(gè)獨(dú)立的完整的行動(dòng),而不能是若干相關(guān)行動(dòng)中的某一步.例如在齊王和田忌賽馬的博弈中,雙方都有六個(gè)策略:(上,中,下),(上,下,中),(中,上,下),(中,下,上),(下,中,上),(下,上,中),這六個(gè)策略形成一個(gè)策略集合.在一局對(duì)策中,局中人的策略只有有限個(gè),稱(chēng)為有限策略,否則為無(wú)限策略.相應(yīng)每個(gè)局中人的策略選擇形成的策略組稱(chēng)為一個(gè)局勢(shì).3.收益函數(shù)(Payofffunction):指一局博弈后各局中人的輸贏得失,用正的數(shù)字表示局中人的贏得,負(fù)的數(shù)字表示局中人的損失.顯然,收益函數(shù)的取值與局中人選定的策略有關(guān),于是一局博弈的”得失”是”局勢(shì)”的函數(shù).博弈論的研究建立在下述假設(shè)前提下:即參與博弈的各局中人都是理性的.對(duì)”理性”的理解:”理性人是指有一個(gè)很好定義的偏好,在面臨給定的約束條件下最大化自己的偏好.”“博弈中一個(gè)理性的決策必定建立在預(yù)測(cè)其他局中人的反應(yīng)之上.一個(gè)局中人將自己置身于其他局中人的位置并為他著想從而預(yù)測(cè)其他局中人將選擇的行為,在這個(gè)基礎(chǔ)上該局中人決定自己最理想的行動(dòng).”博弈的三個(gè)要素,即局中人,策略集和收益函數(shù)構(gòu)成了博弈信息,根據(jù)不同信息可對(duì)博弈做如下分類(lèi):1.按局中人對(duì)信息掌握情況分為:完全信息博弈和不完全信息博弈;2.按局中人采取行動(dòng)的次序分為:如果同時(shí)采取行動(dòng)或在互相保密情況下采取行動(dòng),稱(chēng)為靜態(tài)博弈;如果采取行動(dòng)有先后,后采取行動(dòng)的人可以觀察到前面人采取的行動(dòng),稱(chēng)為動(dòng)態(tài)博弈.我們只研究完全信息靜態(tài)博弈.§2.完全信息靜態(tài)博弈(一)設(shè)博弈中只有局中人A,B;局中人A的策略集為

局中人B的策略集為完全信息是指所有局中人對(duì)其他局中人各自策略集以及不同局勢(shì)下的收益函數(shù)都有完全的了解.一.二人零和博弈博弈的三個(gè)要素的矩陣表示(局中人A的收益)

局中人B局中人A策略策略局中人A的收益函數(shù)可用如下的矩陣表示:二人零和博弈也稱(chēng)為矩陣博弈.博弈可表為例1寫(xiě)出”石頭,剪子,布”游戲的收益矩陣.石頭贏剪刀1分,布贏石頭1分,剪刀贏布1分.解:甲的策略集為{石頭,布,剪刀}乙的策略集為{石頭,布,剪刀}乙甲石頭布剪刀石頭布剪刀0-1110-1-110例2寫(xiě)出齊王和田忌賽馬中齊王的收益矩陣.贏一場(chǎng)得一千金.解:田忌齊王二.具有鞍點(diǎn)的博弈通過(guò)下面的例3說(shuō)明,什么是局中人的最優(yōu)純策略,如何求出這個(gè)純策略以及博弈解和博弈值的概念.乙甲博弈過(guò)程的描述:從收益表中可知,甲方的最大收益是19,他當(dāng)然希望得到這個(gè)值,于是甲使用策略對(duì)付乙.但是乙方已估計(jì)到甲方的心理而使用策略對(duì)付甲,使他不但得不到19,反而要輸?shù)?2.此時(shí)甲也估計(jì)到乙方的心理,使用策略,使乙得不到12反而輸?shù)?.當(dāng)甲方使用策略時(shí),乙方使用任何策略都要輸,當(dāng)然他希望輸?shù)纳僖恍?因此乙方只能使用策略,這時(shí)甲贏得2,乙輸?shù)?,達(dá)到了平衡,博弈結(jié)束.我們注意到,博弈論是研究有理智的局中人在每一個(gè)局勢(shì)下采取的行動(dòng).他們?cè)谶x擇策略時(shí),要考慮到對(duì)方總是采取對(duì)自己最不利的策略來(lái)對(duì)抗.基于這一原則,最優(yōu)策略不是冒險(xiǎn)性的結(jié)果,而是審慎的留有余地的周密安排.如果雙方都不存在冒險(xiǎn)心理,為了達(dá)到最佳結(jié)局,甲必須計(jì)算他的每個(gè)策略與乙的各策略博弈后的結(jié)果,從而求出使用每個(gè)策略帶來(lái)的最壞收益,再?gòu)倪@些最壞收益中選出一個(gè)最大收益值,這個(gè)值對(duì)應(yīng)的行策略就是甲方的最優(yōu)純策略.同樣乙方應(yīng)從收益表中每列找出最大正數(shù)(恰為乙方輸?shù)舻臄?shù)值),為了減少損失,應(yīng)從這些數(shù)字中求出最小數(shù),它所對(duì)應(yīng)的列策略為乙方的最優(yōu)純策略.計(jì)算過(guò)程如下:幾點(diǎn)說(shuō)明:1.在有鞍點(diǎn)的矩陣博弈中,鞍點(diǎn)可以不唯一.例如2.策略的優(yōu)超性.策略的優(yōu)超性的定義:說(shuō)明:這種做法可能會(huì)丟掉一些最優(yōu)解,但不會(huì)影響博弈的結(jié)論,如果上面的不等式有嚴(yán)格不等式,就不會(huì)出現(xiàn)丟解的現(xiàn)象了.利用策略的優(yōu)超性化簡(jiǎn)下面的矩陣博弈,并求出局中人的最優(yōu)純策略和博弈值.3.有鞍點(diǎn)的博弈是少數(shù)情況,大量的博弈問(wèn)題不存在鞍點(diǎn),齊王的收益矩陣就不存在鞍點(diǎn).博弈問(wèn)題的實(shí)例1:百貨商店的選址問(wèn)題.假設(shè)有一條街道,居民對(duì)各種日用品的需求是均勻的,為一個(gè)常數(shù),且愿意就近購(gòu)買(mǎi).現(xiàn)有兩家百貨商店,分別想沿街道選定自己的位置,問(wèn)如何選址對(duì)雙方最有利(將街道看成一條曲線).博弈問(wèn)題的實(shí)例2:某城市由匯合的三條河分割為三個(gè)區(qū),城市居民中40%住在A區(qū),30%住在B區(qū),30%住在C區(qū).現(xiàn)有甲,乙兩公司要在市內(nèi)修建超級(jí)市場(chǎng),甲公司建兩個(gè),乙公司建一個(gè).每個(gè)公司都知道,如果在一個(gè)區(qū)內(nèi)建兩個(gè)超市,則兩個(gè)市場(chǎng)平分該區(qū)業(yè)務(wù),如果某區(qū)建一個(gè)超市,則獨(dú)攬?jiān)搮^(qū)業(yè)務(wù),若某區(qū)無(wú)超市其業(yè)務(wù)平均分散在三個(gè)超市中,每個(gè)公司都想把超市建在營(yíng)業(yè)額最多的地方.(1)將該問(wèn)題表達(dá)成一個(gè)二人零和博弈,并寫(xiě)出甲公司的收益矩陣;(2)甲,乙兩公司的最優(yōu)策略是什么,在兩公司都取得最優(yōu)策略時(shí),它們各占有多大的市場(chǎng)份額?三.無(wú)鞍點(diǎn)矩陣博弈的混合策略1.2×2無(wú)鞍點(diǎn)矩陣博弈的特殊解法例4乙甲行最小值634834(max)列最大值68(min)該矩陣博弈顯然不存在鞍點(diǎn).對(duì)他們的博弈過(guò)程作出如下的描述:2.無(wú)鞍點(diǎn)矩陣博弈的線性規(guī)劃解法BA例5BA901001101101009012010080解:設(shè)A的混合策略為B的混合策略為解得到例6求齊王與田忌賽馬中雙方的最優(yōu)混合策略解:齊王的線性規(guī)劃為解得齊王的最優(yōu)混合策略為問(wèn)題:理論上齊王應(yīng)贏得一千金,但是實(shí)際比賽中他為什么輸?shù)粢磺Ы?在無(wú)鞍點(diǎn)的矩陣博弈中,雙方采取何種純策略是應(yīng)當(dāng)保密的.3.無(wú)鞍點(diǎn)矩陣博弈的布朗(Brown)算法布朗(Brown)算法是一種近似算法,給定局中人A的收益矩陣算法步驟:1.甲方任選一行,然后乙方選擇與該行中最小元素相對(duì)應(yīng)的那一列;2.在第1步里乙方所選的列中,與最大元素相對(duì)應(yīng)的行即為甲方應(yīng)選的行;3.乙方把到目前為止甲方選擇的各行求和,并選擇與最小和元素對(duì)應(yīng)的列;4.甲方把到目前為止乙方選擇的列求和,并選擇與最大和元素對(duì)應(yīng)的行.如果要求迭代的次數(shù)已達(dá)到,轉(zhuǎn)第5步,否則轉(zhuǎn)回第3步;5.分別計(jì)算博弈值的上界和下界6.令是甲方選擇i行的次數(shù)比例;是乙方選擇j列的次數(shù)比例.分別為甲,乙的近似混合策略.例7用布朗算法求解矩陣博弈(迭代10次)1234567891013-2211632105311361557197823992711103113111234567891031475314710-21-1-303642013457911121314四.納什均衡(Nashequilibrium)納什均衡是博弈論的基礎(chǔ).在二人零和博弈中,雙方尋求的最優(yōu)解是一種均衡解,達(dá)到這種均衡時(shí),無(wú)論是純策略解還是混合策略解,只要其他局中人不改變自己的策略,則任何一方單獨(dú)改變自己的策略只能帶來(lái)收益或效用的減少,因此這些均衡解也稱(chēng)為納什均衡,換言之,納什均衡是一種策略組合,它是每個(gè)局中人的策略對(duì)其他局中人策略的最優(yōu)反應(yīng).納什證明了在任何非合作有限博弈中,都存在至少一個(gè)納什均衡.§3.完全信息靜態(tài)博弈(二)現(xiàn)在研究二人非零和博弈BA策略策略一.用劃線法求具有純策略的納什均衡例7二人博弈如下表所示BA解:先利用策略的優(yōu)超性簡(jiǎn)化雙元矩陣.BA納什均衡是每個(gè)局中人策略對(duì)其他局中人策略的最優(yōu)反應(yīng).對(duì)于A來(lái)說(shuō),針對(duì)B分別采取策略時(shí),A的最優(yōu)反應(yīng)分別是策略其收益值分別是5,6,4.按劃線法,在這幾個(gè)數(shù)字下分別劃一橫線;對(duì)于B來(lái)說(shuō),相對(duì)于A采取的策略,B的最優(yōu)反應(yīng)策略是,分別在對(duì)應(yīng)的收益值6,6下劃?rùn)M線.如果收益值下都有橫線,這一對(duì)值就是納什均衡解,對(duì)應(yīng)的策略組合為本題中,納什均衡解為(4,6),對(duì)應(yīng)的策略組為BA納什均衡解為(4,6),對(duì)應(yīng)的策略組為二.兩個(gè)著名的博弈例子例8囚徒困境問(wèn)題:(1950年數(shù)學(xué)家塔克任美國(guó)斯坦福大學(xué)教授,在給一些心理學(xué)家講演時(shí),對(duì)當(dāng)時(shí)正在研究的博弈問(wèn)題作了形象的描述)設(shè)有甲,犯乙兩名嫌疑因同一樁罪行被捕,警方希望他們坦白并提供對(duì)方犯罪證據(jù),規(guī)定如兩人均坦白各判刑3年;如一方坦白另一方不坦白,坦白一方從輕釋放,不坦白一方判刑8年;如兩人均不坦白,由于犯罪事實(shí)證據(jù)很多不能成立,只能每人各判1年,分析甲,乙兩名犯罪嫌疑人的各自策略和納什均衡解.解:乙甲坦白不坦白坦白不坦白(-3,-3)(0,-8)(-8,0)(-1,-1)根據(jù)劃線法納什均衡解是(坦白,坦白).但是從表中明顯看出,兩名犯罪嫌疑人最好的結(jié)局是(-1,-1),即雙方均不坦白.如何理解這一矛盾的結(jié)果呢?這個(gè)例子說(shuō)明,就個(gè)人利益和群體利益而言,在考慮最優(yōu)解時(shí),出發(fā)點(diǎn)不同,結(jié)果也不同,個(gè)人的理性選擇與群體的理性選擇是不一

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論