博弈論的幾個(gè)經(jīng)典模型詳解演示文稿

上傳人：基*** IP屬地：廣東上傳時(shí)間：2023-05-23 格式：PPT 頁(yè)數(shù)：76 大?。?.07MB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩71頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

博弈論的幾個(gè)經(jīng)典模型詳解演示文稿目前一頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)優(yōu)選博弈論的幾個(gè)經(jīng)典模型目前二頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)博弈論的應(yīng)用領(lǐng)域十分廣泛，在經(jīng)濟(jì)學(xué)、政治科學(xué)（國(guó)內(nèi)的以及國(guó)際的）、軍事戰(zhàn)略問(wèn)題、進(jìn)化生物學(xué)以及當(dāng)代的計(jì)算機(jī)科學(xué)等領(lǐng)域都已成為重要的研究和分析工具。此外,它還與會(huì)計(jì)學(xué)、統(tǒng)計(jì)學(xué)、數(shù)學(xué)基礎(chǔ)、社會(huì)心理學(xué)以及諸如認(rèn)識(shí)論與倫理學(xué)等哲學(xué)分支有重要聯(lián)系。引言目前三頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)按照Aumann所撰寫的《新帕爾格雷夫經(jīng)濟(jì)學(xué)大辭典》“博弈論”辭條的看法，標(biāo)準(zhǔn)的博弈論分析出發(fā)點(diǎn)是理性的，而不是心理的或社會(huì)的角度。不過(guò)，近30年來(lái)結(jié)合心理學(xué)和行為科學(xué)、實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的研究成就而對(duì)博弈論進(jìn)行一定改造的行為博弈論(behavoiralgametheory)也日益興起。引言目前四頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)失火了，你往哪個(gè)門跑——這就是博弈論

一天晚上，你參加一個(gè)派對(duì)，屋里有很多人，你玩得很開(kāi)心。這時(shí)候，屋里突然失火，火勢(shì)很大，無(wú)法撲滅。此時(shí)你想逃生。你的面前有兩個(gè)門，左門和右門，你必須在它們之間選擇。但問(wèn)題是，其他人也要爭(zhēng)搶這兩個(gè)門出逃。如果你選擇的門是很多人選擇的，那么你將因人多擁擠、沖不出去而燒死；相反，如果你選擇的是較少人選擇的，那么你將逃生。這里我們不考慮道德因素，你將如何選擇？目前五頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)你的選擇必須考慮其他人的選擇，而其他人的選擇也考慮你的選擇。你的結(jié)果——博弈論稱之為支付，不僅取決于你的行動(dòng)選擇——博弈論稱之為策略選擇，同時(shí)取決于他人的策略選擇。你和這群人構(gòu)成一個(gè)博弈（game）。上述博弈是一個(gè)叫張翼成的中國(guó)人在1997年提出的一個(gè)博弈論模型，被稱之為少數(shù)者博弈或少數(shù)派博弈（MinorityGame）。生活中博弈的案例很多，你會(huì)見(jiàn)到很多例子。只要涉及到人群的互動(dòng)，就有博弈。

引言目前六頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)什么叫博弈？博弈的英文為game，我們一般將它翻譯成“游戲”。而在西方，game的意義不同于漢語(yǔ)中的游戲。在英語(yǔ)中，game即是人們遵循一定規(guī)則下的活動(dòng)，進(jìn)行活動(dòng)的人的目的是使自己“贏”。奧林匹克運(yùn)動(dòng)會(huì)叫OlympicGames。在英文中，game有競(jìng)賽的意思，進(jìn)行g(shù)ame的人是很認(rèn)真的，不同于漢語(yǔ)中游戲的概念。在漢語(yǔ)中，游戲有兒戲的味道。因此將關(guān)于game的理論，即gametheory翻譯成博弈論或者對(duì)策論，是恰當(dāng)?shù)摹?/p>

引言目前七頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)博弈論的出現(xiàn)只有60多年的歷史。博弈論的開(kāi)創(chuàng)者為諾意曼與摩根斯坦，他們1944年出版了《博弈論與經(jīng)濟(jì)行為》。博弈論天才納什（JohnNash）的開(kāi)創(chuàng)性論文《n人博弈的均衡點(diǎn)》(1950)、《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。今天博弈論已發(fā)展成一個(gè)較完善的學(xué)科。博弈論對(duì)于社會(huì)科學(xué)有著重要的意義，它正成為社會(huì)科學(xué)研究范式中的一種核心工具，以至于我們可稱博弈論是“社會(huì)科學(xué)的數(shù)學(xué)”，或者說(shuō)是關(guān)于社會(huì)的數(shù)學(xué)。引言目前八頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)

1994年經(jīng)濟(jì)學(xué)諾貝爾獎(jiǎng)?lì)C發(fā)給三位博弈論專家：納什、塞爾屯(R.Selten)、海薩尼（JohnC.Harsanyi），而像1985年獲得諾貝爾獎(jiǎng)的公共選擇學(xué)派的領(lǐng)導(dǎo)者布坎南，1995年獲得諾貝爾獎(jiǎng)的理性主義學(xué)派的領(lǐng)袖盧卡斯（Lukas），其理論與博弈論都有著較深的聯(lián)系?，F(xiàn)在博弈論正滲透到各門社會(huì)科學(xué)，更重要的是它正深刻地改變著人們的思維。引言目前九頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)汪賢裕、肖玉明編著，博弈論及其應(yīng)用，科學(xué)出版社，2008年2月潘天群著，博弈生存（第二版），中央編譯出版社，2004年10月王春永編著，博弈論的詭計(jì)，中國(guó)發(fā)展出版社，2007年1月參考書目前十頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)博弈論研究的對(duì)象：是理性的行動(dòng)者或參與者如何選擇策略或如何作出行動(dòng)的決定。理性的人是對(duì)現(xiàn)實(shí)的人的基本假定，即假定參與者努力用自己的推理能力使自己的目標(biāo)最大化?！袄硇缘摹迸c“道德的”不是一回事,理性的與道德的有時(shí)會(huì)發(fā)生沖突，但是理性的人不一定是不道德的。基本術(shù)語(yǔ)目前十一頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)博弈涉及哪些內(nèi)容呢？博弈涉及至少兩個(gè)獨(dú)立的博弈參與者(player)。博弈涉及行動(dòng)者存在著策略（strategy）選擇的可能，博弈論用策略空間來(lái)表示參與者可以選擇的策略。

參與者在不同策略組合下會(huì)得到一定的支付（payoff）。對(duì)于博弈參與者來(lái)說(shuō)，存在著一博弈結(jié)果。博弈涉及均衡。重要的均衡——納什均衡?；拘g(shù)語(yǔ)目前十二頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)根據(jù)參與者能否形成約束性的協(xié)議，以便集體行動(dòng)，博弈可分為合作性博弈和非合作性博弈。納什等博弈論專家研究得更多的是非合作性博弈。合作性博弈：是指參與者從自己的利益出發(fā)與其他參與者談判達(dá)成協(xié)議或形成聯(lián)盟，其結(jié)果對(duì)聯(lián)盟方均有利；

非合作性博弈：是指參與者在行動(dòng)選擇時(shí)無(wú)法達(dá)成約束性的協(xié)議。人們分工與交換的經(jīng)濟(jì)活動(dòng)就是合作性的博弈，而囚徒困境則是非合作性的博弈。博弈的類型目前十三頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)博弈又可分靜態(tài)博弈和動(dòng)態(tài)博弈。靜態(tài)博弈：指參與者同時(shí)采取行動(dòng)，或者盡管參與者行動(dòng)的采取有先后順序，但后行動(dòng)的人不知道先采取行動(dòng)的人采取的是什么行動(dòng)。動(dòng)態(tài)博弈：指參與者的行動(dòng)有先后順序，并且后采取行動(dòng)的人可以知道先采取行動(dòng)的人所采取的行動(dòng)。

博弈的類型目前十四頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)從知識(shí)的擁有程度來(lái)看，博弈分為完全信息博弈和不完全信息博弈。信息是博弈論中重要的內(nèi)容。完全信息博弈：參與者對(duì)所有參與者的策略空間及策略組合下的支付有“完全的了解”,否則是不完全信息博弈。嚴(yán)格地講，完全信息博弈是指參與者的策略空間及策略組合下的支付,是博弈中所有參與者的“公共知識(shí)”的博弈。不完全信息博弈：參與者所做的是努力使自己的期望支付或期望效用最大化。

博弈的類型目前十五頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)例：豬圈里有兩只豬，一只比較大，一只比較小。豬圈狹長(zhǎng)，豬食槽在一頭，豬食按鈕在另一頭，按一下會(huì)有10個(gè)單位的豬食落進(jìn)槽里。由于按鈕和食槽距離較遠(yuǎn)，按按鈕的體力耗費(fèi)相當(dāng)于2個(gè)單位的食物。

模型一、智豬博弈/完全信息靜態(tài)博弈

小豬大豬按不按(等待)按(5，1)(5，3)不按(等待)(9，-1)(0，0)大豬和小豬分別該如何選擇。

目前十六頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)選擇等待是小豬的占優(yōu)策略。大豬的最佳選擇取決于小豬的行動(dòng)，如果小豬去按，大豬最好選擇等待；如果小豬不去按,則最佳選擇是大豬親自去按。也就是說(shuō)，在智豬博弈中，大豬沒(méi)有占優(yōu)策略,而小豬有占優(yōu)策略，它的最佳選擇就是耐心等待大豬去按鈕，才能獲得最佳結(jié)果?！靶∝i躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每次落下的事物數(shù)量和踏板與投食口之間的距離。模型一、智豬博弈/完全信息靜態(tài)博弈目前十七頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)如果改變一下核心指標(biāo)，豬圈里還會(huì)出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎？試試看。改變方案一：減量方案。改變方案二：增量方案。改變方案三：減量加移位方案。投食僅原來(lái)的一半分量，但同時(shí)將投食口移到踏板附近。結(jié)果呢，小豬和大豬都在拼命地?fù)屩忍ぐ濉５却卟坏檬?而多勞者多得。每次的收獲剛好消費(fèi)完。

對(duì)于游戲設(shè)計(jì)者，這是一個(gè)最好的方案。成本不高，但收獲最大。模型一、智豬博弈/完全信息靜態(tài)博弈目前十八頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)在博弈論中，含有占優(yōu)戰(zhàn)略均衡的一個(gè)著名例子是由塔克給出的“囚徒困境”（prisoners’dilemma）博弈模型。該模型用一種特別的方式為我們講述了一個(gè)警察與小偷的故事。模型二、囚徒困境/非合作博弈目前十九頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)假設(shè)：有兩個(gè)小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊，對(duì)每一個(gè)犯罪嫌疑人，警方給出的政策是：如果一個(gè)犯罪嫌疑人坦白了罪行，交出了贓物，于是證據(jù)確鑿，兩人都被判有罪。如果另一個(gè)犯罪嫌疑人也作了坦白，則兩人各被判刑8年；如果另一個(gè)犯罪嫌人沒(méi)有坦白而是抵賴,則以妨礙公務(wù)罪（因已有證據(jù)表明其有罪）再加刑2年，而坦白者有功被減刑8年，立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪，但可以私入民宅的罪名將兩人各判入獄1年。模型二、囚徒困境/非合作博弈目前二十頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)不難看出，“坦白”是任一犯罪嫌疑人的占優(yōu)戰(zhàn)略，而（坦白，坦白）是一個(gè)占優(yōu)戰(zhàn)略均衡。模型二、囚徒困境/非合作博弈乙

甲坦白抵賴坦白(-8，-8)(0，-10)抵賴(-10，0)(-1，-1)目前二十一頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)對(duì)于兩個(gè)犯罪嫌疑人總體而言，他們?cè)O(shè)想的最好的策略可能是都不交代。但任何一個(gè)犯罪嫌疑人在選擇不交代的策略時(shí)，都要冒很大的風(fēng)險(xiǎn)，一旦自己不交代而另一犯罪嫌疑人交代了，自己就將可能處于非常不利的境地。對(duì)于A而言,不管B采取何種策略，他的最佳策略都是交代。對(duì)于B而言也是如此。最后兩人都會(huì)選擇交代。模型二、囚徒困境/非合作博弈目前二十二頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)該博弈刻劃了兩大難題：沖突情形下，參與人的目標(biāo)是什么？是采用(作為個(gè)人)他自己的最好策略，還是采用(作為集體的一員)他們共同的最好策略？前者導(dǎo)致均衡策略(坦白，坦白)，支付為(-8，-8)；后者的最好策略是(抵賴，抵賴)，支付為(-1，-1)。這里反映了個(gè)體理性行為與集體理性行為之間的矛盾、沖突。此博弈只進(jìn)行一次還是重復(fù)進(jìn)行？如果博弈只進(jìn)行一次，參與人似乎只有坦白才是最好的策略，因?yàn)闆](méi)有理由相信對(duì)手會(huì)對(duì)你有信心，他總認(rèn)為你自己會(huì)坦白；因此，雙方都采取坦白策略。然而，若博弈進(jìn)行多次，則結(jié)論將會(huì)發(fā)生變化。模型二、囚徒困境/非合作博弈目前二十三頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)囚徒困境可以用來(lái)說(shuō)明許多現(xiàn)象。寡頭定價(jià)拍賣出價(jià)推銷員的努力政治上的討價(jià)還價(jià)軍備競(jìng)賽等（沖突中出現(xiàn)兩敗俱傷的情況,往往要考慮到囚徒困境）

*（純策略）納什均衡模型二、囚徒困境/非合作博弈目前二十四頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)什么是博弈論？試舉兩個(gè)你生活中的例子說(shuō)明。某年在荷蘭召開(kāi)了一次“合作及社會(huì)兩難困境研討會(huì)”，與會(huì)者都是博弈論的專家。當(dāng)大會(huì)結(jié)束之后，有兩個(gè)學(xué)者，麥息克和路特提議大家玩一個(gè)游戲。他們將一個(gè)大信封拿出來(lái)，請(qǐng)?jiān)趫?chǎng)的４３位專家拿出金錢裝到這個(gè)信封里。如果到最后這信封里的錢超過(guò)２５０元，麥息克和路特將自己掏腰包，退還每人１０元。不過(guò)，如果最后信封內(nèi)的錢不足２５０元，就統(tǒng)統(tǒng)沒(méi)收，大家拿不到半毛錢。

仔細(xì)想一想，如果你也在場(chǎng)，你會(huì)奉獻(xiàn)多少錢呢？問(wèn)題與思考目前二十五頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)什么是海薩尼轉(zhuǎn)換？海薩尼提出了一種處理不完全信息博弈的方法,即引入一個(gè)虛擬的局中人——“自然”。自然首先行動(dòng)，它決定每個(gè)局中人的特征。每個(gè)局中人知道自己的特征，但不知道別的局中人特征。這種方法將不完全信息靜態(tài)博弈變成一個(gè)兩階段動(dòng)態(tài)博弈，第一個(gè)階段是自然N的行動(dòng)選擇，第二階段是除N外的局中人的靜態(tài)博弈。這種轉(zhuǎn)換被稱為“海薩尼轉(zhuǎn)換”，這個(gè)轉(zhuǎn)換把“不完全信息”轉(zhuǎn)變成為完全但不完美信息，從而可以用分析完全信息博弈的方法進(jìn)行分析。模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈目前二十六頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)海薩尼轉(zhuǎn)換的具體方法一個(gè)虛擬的參與人“自然”,自然首先決定參與人的類型，賦予各參與人的類型向量，其中；

自然告知參與者自己的類型，卻不告訴其他參與者的類型；參與者同時(shí)選擇行動(dòng),每一參與者從可行集中選擇行動(dòng)方案；各方得到收益。借助于第一步和第二步中虛構(gòu)的參與者“自然”的行動(dòng)，我們可以把一個(gè)不完全信息的博弈表述為一個(gè)不完美信息的博弈。模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈目前二十七頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)海薩尼轉(zhuǎn)換分析海薩尼轉(zhuǎn)換是處理不完全信息博弈的標(biāo)準(zhǔn)方法。一般地,“自然”在博弈開(kāi)始的時(shí)候選擇參與人的類型，參與人的某個(gè)類型包括表征類型的各個(gè)特征如策略空間、信息集、得益函數(shù)等，這些又稱為該類型參與人所擁有的個(gè)人信息。不完全信息意味著博弈各方中至少有一個(gè)參與人有多個(gè)類型。模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈目前二十八頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)通過(guò)海薩尼轉(zhuǎn)換，博弈開(kāi)始時(shí)，所有參與人有關(guān)“自然”的行動(dòng)有一致的信念，即都知道所有參與人類型的概率分布函數(shù)，此即“海薩尼公理”。

模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈目前二十九頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)經(jīng)典案例解析例：某一市場(chǎng)原來(lái)被A企業(yè)所壟斷?，F(xiàn)在B企業(yè)考慮是否進(jìn)入。B企業(yè)知道，A企業(yè)是否允許它進(jìn)入，取決于A企業(yè)阻撓B企業(yè)進(jìn)入所花費(fèi)的成本。如果阻撓的成本低，那么，正如下表后兩列所表示的，A企業(yè)的占優(yōu)戰(zhàn)略是阻撓，博弈有重復(fù)剔除的占優(yōu)戰(zhàn)略均衡——A阻撓，B不進(jìn)入。如果阻撓的成本高，那么，正如下表前兩列所表示的，A企業(yè)的占優(yōu)戰(zhàn)略是默許B進(jìn)入，博弈有重復(fù)剔除的占優(yōu)戰(zhàn)略均衡——A默許，B進(jìn)入。B企業(yè)所不知道的，是A企業(yè)的阻撓成本是高是低。這里，某一參與人本人知道、其他參與人則不知道的信息稱為私人信息。某一參與人所擁有的全部私人信息稱為他的類型。在本例中，阻撓成本就是A的私人信息。高阻撓成本和低阻撓成本則是兩種不同的類型。模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈目前三十頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)海薩尼轉(zhuǎn)換后的市場(chǎng)進(jìn)入博弈：模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈

AB高成本低成本默許阻撓默許阻撓進(jìn)入(40,50)(-10,0)(30,100)(-10,140)不進(jìn)入(0,300)(0,300)(0,400)(0,400)顯然，在這里，B所遇到的，是不確定性條件下的選擇問(wèn)題。因?yàn)锽不僅不知道A的類型（是高還是低），而且不知道不同類型的分布概率。目前三十一頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)

按照海薩尼的方法，所有參與人的真實(shí)類型都是給定的。其他參與人雖然不清楚某一參與人的真實(shí)類型，但知道這些可能出現(xiàn)的類型的分布概率，而且這種概率是公共知識(shí)。用本例來(lái)說(shuō)，公共知識(shí)不僅意味著B(niǎo)企業(yè)知道A企業(yè)高阻撓成本與低阻撓成本的分布概率，而且意味著A也清楚B知道這一概率。模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈目前三十二頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈N低成本高成本ABB(50,40)(300,0)(0,-10)(300,0)(100,30)(400,0)(140,-10)(400,0)ABB默許默許阻撓阻撓進(jìn)入不進(jìn)入進(jìn)入進(jìn)入進(jìn)入不進(jìn)入不進(jìn)入不進(jìn)入*貝葉斯納什均衡

目前三十三頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)言語(yǔ)博弈中的“威脅”與“承諾”

在現(xiàn)實(shí)中，我們經(jīng)?？吹铰暦Q的策略決定，但是這些聲稱的策略可信嗎？聲稱的策略包括“威脅”與“承諾”。在國(guó)際核武器問(wèn)題上,我國(guó)及其他一些國(guó)家承諾“不首先使用核武器”就是一種言語(yǔ)承諾。博弈論中,經(jīng)常用“可置信”和“不可置信”的“威脅”或“承諾”來(lái)區(qū)分行動(dòng)者說(shuō)出來(lái)的策略，我們?cè)趯?duì)動(dòng)態(tài)博弈的分析中會(huì)分析什么樣的策略是可置信的,什么樣的策略是不可置信的。而分析“威脅”或“承諾”是可置信的還是不可置信的方法是倒推法。模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈

目前三十四頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)倒推法（backwardinduction）也叫逆向歸納法。那么什么是倒推法？要理解什么是倒推法，先來(lái)看一下商界里經(jīng)常見(jiàn)到的博弈。在某個(gè)城市假定只有一家房地產(chǎn)開(kāi)發(fā)商A,我們知道任何沒(méi)有競(jìng)爭(zhēng)下的壟斷利潤(rùn)是很高的，假定A此時(shí)每年的壟斷利潤(rùn)是10億元。模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈

目前三十五頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)現(xiàn)在假定有另外一個(gè)企業(yè)B，準(zhǔn)備從事房地產(chǎn)開(kāi)發(fā)。面對(duì)著B(niǎo)要進(jìn)入其壟斷的行業(yè)，A想：一旦B進(jìn)入，A的利潤(rùn)將受損很多，B最好不要進(jìn)入。所以A向B表示，你進(jìn)入的話，我將阻撓你進(jìn)入。假定當(dāng)B進(jìn)入時(shí)A阻撓的話,A的利潤(rùn)降低到2，B的利潤(rùn)是-1。而如果A不阻撓的話，A的利潤(rùn)是4，B的利潤(rùn)也是4。模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈

目前三十六頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)這樣一個(gè)博弈可用下圖表示：模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈

B進(jìn)入不進(jìn)入AA：10；B：0阻撓不阻撓A：2；B：－1A：4；B：4目前三十七頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)

上圖稱之為博弈樹(shù)。由上圖可見(jiàn)，這個(gè)博弈由兩階段構(gòu)成。我們稱之為動(dòng)態(tài)博弈，或者兩階段的動(dòng)態(tài)博弈。博弈樹(shù)是表示動(dòng)態(tài)博弈的一個(gè)好方法。

現(xiàn)在讓我們回到房地產(chǎn)開(kāi)發(fā)商之間的博弈問(wèn)題。A的最好結(jié)局是“B不進(jìn)入”，而B(niǎo)的最好結(jié)局是“進(jìn)入”而A“不阻撓”。這兩個(gè)最好的結(jié)局不能構(gòu)成均衡。那么結(jié)果是什么呢？模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈

目前三十八頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)A向B發(fā)出威脅：如果你進(jìn)入，我將阻撓。而對(duì)B來(lái)說(shuō)，如果進(jìn)入，A真的阻撓的話，它將受損失-1（假定-1是它的機(jī)會(huì)成本），當(dāng)然此時(shí)A也有損失。對(duì)于B來(lái)說(shuō)，問(wèn)題是：A的威脅可置信嗎？B通過(guò)分析得出：A的威脅是不可置信的。原因是：當(dāng)B進(jìn)入的時(shí)候，A阻撓的收益是2，而不阻撓的收益是4。4>2，理性人是不會(huì)選擇做非理性的事情的。也就是說(shuō)，一旦B進(jìn)入，A的最好策略是合作，而不是阻撓。因此，通過(guò)分析，B選擇了進(jìn)入，而A選擇了合作。雙方的收益各為4。模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈

目前三十九頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)

在這個(gè)博弈中，B采用的方法為倒推法，或者說(shuō)逆向歸納法，即：當(dāng)參與者作出決策時(shí)，他要通過(guò)對(duì)最后階段的分析，準(zhǔn)確預(yù)測(cè)對(duì)方的行為，從而確定自己的行為。在這里，雙方必須都是理性的。如果不滿足這個(gè)條件，就無(wú)法進(jìn)行分析了。這個(gè)例子只是簡(jiǎn)單的兩階段博弈，而三階段或更多階段的博弈，可用同樣方法加以分析。在動(dòng)態(tài)博弈中，涉及“威脅”與“承諾”是不是可信的問(wèn)題。靜態(tài)地看，一博弈存在許多均衡。模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈

目前四十頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)上述“進(jìn)入——阻撓”問(wèn)題的博弈樹(shù)可用支付矩陣表示：模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈

BA進(jìn)入阻撓阻撓(2，-1)(10，0)不阻撓(4，4)(10，0)在這個(gè)矩陣中，納什均衡點(diǎn)有兩個(gè)：(合作，進(jìn)入)和(阻撓，不進(jìn)入)。我們可以驗(yàn)證，在這兩點(diǎn)上誰(shuí)都不愿意改變策略。然而(阻撓，不進(jìn)入)這個(gè)均衡是達(dá)不到的。因?yàn)檫@是動(dòng)態(tài)博弈，在這個(gè)動(dòng)態(tài)博弈中，存在著先后策略選擇順序。目前四十一頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)這里分析的是完全且完美信息下的動(dòng)態(tài)博弈。所謂完全信息是指：博弈的支付函數(shù)是“公共知識(shí)”。本書中未涉及不完全信息的博弈問(wèn)題，如囚徒困境這樣的靜態(tài)博弈也是完全信息博弈。完美信息是針對(duì)動(dòng)態(tài)博弈而言的，指參與者知道博弈的所有歷史。倒推法是動(dòng)態(tài)博弈中有用的工具，它可以說(shuō)是理性的人自然的推理方式。然而倒推法面臨著一個(gè)困難,這就是蜈蚣博弈的悖論。模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈

目前四十二頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)前面我們分析了“威脅”是否可信，我們也可用同樣的思路分析一個(gè)“承諾”是否可信?！安皇紫仁褂煤宋淦鳌钡某兄Z可信嗎？

*子博弈完美納什均衡模型四、Stackelberg雙寡頭競(jìng)爭(zhēng)模型/完全且完美信息動(dòng)態(tài)博弈

目前四十三頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)光天化日之下的違法行為為什么總能成功？

人類有許多關(guān)于猴子的故事，比如朝三暮四，殺雞給猴看。其實(shí)猴子是沒(méi)有思維的,它們有一定的群體意識(shí)，但沒(méi)有社會(huì)意識(shí)，人們關(guān)于它們的故事其實(shí)是說(shuō)人自己的。我們這里也講一個(gè)猴子的故事……。在現(xiàn)實(shí)社會(huì)中，竊賊在公共場(chǎng)所比如公共汽車上偷東西時(shí)，車上的乘客看到了，但不敢吭聲。沒(méi)有被偷的人想，反正被偷的待宰猴群的結(jié)局人不是我，我反抗了，我得不到任何好處,反而遭到傷害；而不反抗雖不得益，但也不受損，我何必要反抗呢？這就是光天化日之下的偷竊行為為什么總能成功的原因。模型五、信號(hào)博弈/不完全信息動(dòng)態(tài)博弈目前四十四頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)竊賊在偷東西時(shí)發(fā)出這樣的信號(hào)：如果誰(shuí)反抗，將毆打誰(shuí)。乘客想，竊賊的威脅是可信的：因?yàn)槿绻麄€(gè)別乘客反抗，而竊賊不毆打該乘客的話，就會(huì)有更多的乘客抓竊賊，竊賊將有可能被抓，因此竊賊必然歐打反抗的乘客。乘客的策略及可能的支付為：反抗,有可能被毆打甚至受傷；不反抗，無(wú)所得也無(wú)所失。模型五、信號(hào)博弈/不完全信息動(dòng)態(tài)博弈目前四十五頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)乘客反抗不反抗偷東西竊賊竊賊毆打不毆打乘客：受傷竊賊：可能被抓，可能逃脫乘客：無(wú)所得，無(wú)所失竊賊：被抓竊賊毆打不毆打乘客：受傷竊賊：得到贓物乘客：無(wú)所得，無(wú)所失竊賊：得到贓物目前四十六頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)

對(duì)于乘客來(lái)說(shuō)，竊賊的威脅是可信的，因而乘客的最優(yōu)策略是“不反抗”；而對(duì)于竊賊來(lái)說(shuō)，乘客“不反抗”下的“不毆打”策略為最憂。這一博弈的結(jié)果是，竊賊偷東西時(shí)“乘客不反抗，竊賊不敢打”，這是一“子精煉納什均衡”。這樣一種群體不反抗的結(jié)果將使社會(huì)風(fēng)氣惡化，偷竊之風(fēng)盛行。對(duì)個(gè)體來(lái)說(shuō)，雖然這一次被偷的不是你,但下次你被偷的幾率增加了。這使得我們都如同待宰的猴子，我們不知道什么時(shí)候輪到我們自己。這樣，我們每個(gè)人的處境比以前更差。模型五、信號(hào)博弈/不完全信息動(dòng)態(tài)博弈目前四十七頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)如何從這種困境中擺脫出來(lái)？我們看到，使乘客采取“反抗”策略，而非“不反抗”策略在于加大采取“反抗”策略的獲益，而減少不反抗的獲益。當(dāng)“反抗”策略下的獲益大于“不反抗”策略下的獲益時(shí)，乘客就會(huì)采取“反抗”的策略。加大道德宣傳，培養(yǎng)人的道德感可以解決這個(gè)囚徒困境。模型五、信號(hào)博弈/不完全信息動(dòng)態(tài)博弈目前四十八頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)乘客反抗不反抗偷東西竊賊竊賊毆打不毆打乘客：受傷,但沒(méi)有道德滿足感竊賊：可能被抓，可能逃脫乘客：沒(méi)有受傷并有道德滿足感竊賊：被抓竊賊毆打不毆打乘客：受傷,并有道德恥辱感竊賊：得到贓物乘客：道德恥辱感竊賊：得到贓物上述博弈過(guò)程為：目前四十九頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)這樣，當(dāng)小偷偷東西時(shí)，盡管乘客認(rèn)為竊賊的威脅是可信的，但是如果乘客是道德感強(qiáng)的人,那么博弈結(jié)果是“乘客反抗，小偷毆打”,從而小偷有可能被抓住，這也是一“子精煉納什均衡”。博弈論對(duì)不合作的博弈結(jié)果的預(yù)測(cè)是令人悲哀的。但是，從這個(gè)例子我們看到，道德就是由群體實(shí)施的對(duì)所謂“非道德”的行為進(jìn)行非強(qiáng)制性的懲罰機(jī)制，而法律及實(shí)施法律的國(guó)家的形成與改進(jìn)就是建立一個(gè)對(duì)所謂“違法行為”實(shí)施的中心懲罰機(jī)制。

*精煉貝葉斯納什均衡；混同均衡；分離均衡模型五、信號(hào)博弈/不完全信息動(dòng)態(tài)博弈目前五十頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)哪種策略更能贏?假定我們的社會(huì)已經(jīng)形成約束行動(dòng)者的道德規(guī)范。如果對(duì)不道德的行為不能產(chǎn)生即時(shí)的懲罰，不道德的行為在社會(huì)中往往能給行為者帶來(lái)好處。這表現(xiàn)在一次性的非合作的博弈中,行為者理性地選取對(duì)自己有利的行動(dòng)。但是，如果存在重復(fù)博弈，參與者之間對(duì)不合作行為就會(huì)形成懲罰機(jī)制。對(duì)囚徒困境進(jìn)行無(wú)限次的重復(fù)博弈，什么樣的策略會(huì)贏?模型六、有效工資率/重復(fù)博弈

目前五十一頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)這里涉及參與者以什么樣的態(tài)度對(duì)待對(duì)方的不合作策略。在博弈論里，有兩個(gè)著名的策略。如果一方采取不合作的策略另一方隨即也采取不合作策略并且永遠(yuǎn)采取不合作策略，在博弈論里面稱之為觸發(fā)策略，或稱冷酷策略，英文叫triggerstrategy。模型六、有效工資率/重復(fù)博弈

乙甲不合作合作不合作(1，1)(4，0)合作(0，4)(2，2)目前五十二頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)如果對(duì)方知道你的策略是觸發(fā)策略，那么對(duì)方將不敢采取不合作策略，因?yàn)橐坏┧扇×瞬缓献鞑呗?，雙方便永遠(yuǎn)進(jìn)入不合作的困境。因此，只要有人采取觸發(fā)策略，那么雙方均愿意采取合作策略。但是這個(gè)策略面臨著這樣一個(gè)問(wèn)題：如果雙方存在誤解，或者由于一方發(fā)生選擇性的錯(cuò)誤，這個(gè)錯(cuò)誤是無(wú)意的，那么結(jié)果將是雙方均采取不合作的策略。也就是說(shuō)，這種策略不給對(duì)方一個(gè)改正錯(cuò)誤或解釋錯(cuò)誤的機(jī)會(huì)。模型六、有效工資率/重復(fù)博弈

目前五十三頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)第二種策略是，若你采取不合作策略，我也采取不合作策略，但是如果你采取了合作策略，我也采取合作策略。這叫“一報(bào)還一報(bào)”策略，或者稱之為“針?shù)h相對(duì)”，英文叫tit-for-tat。美國(guó)密執(zhí)安大學(xué)的羅伯特·?？怂沽_德(RobertAxerold)主持了一次計(jì)算機(jī)比賽，看誰(shuí)寫出來(lái)的程序能夠贏。參加者有政治學(xué)家、數(shù)學(xué)家、經(jīng)濟(jì)學(xué)家、社會(huì)學(xué)家，他們都詳細(xì)研究過(guò)囚徒困境。獲勝者是加拿大多倫多大學(xué)的拉波波特寫出的tit-for-tat策略。這個(gè)程序非常簡(jiǎn)單：第一步采取合作，接著對(duì)方采取什么策略，他便跟著做什么。模型六、有效工資率/重復(fù)博弈

目前五十四頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)

當(dāng)然有多種策略，如對(duì)方采取了不合作,但自己永遠(yuǎn)采取合作策略，這個(gè)策略可以叫做“以德報(bào)怨”策略。這個(gè)策略對(duì)行動(dòng)者最為不利，因?yàn)閷?duì)方知道你采取這種策略，他會(huì)永遠(yuǎn)采取不合作的策略，因而理性的人是不會(huì)采取這種“以德報(bào)怨”策略的。然而，極端道德的人是超越理性的限制的,此時(shí)他會(huì)采取“以德報(bào)怨”策略。佛說(shuō)：“我不入地獄,誰(shuí)入地獄？”基督說(shuō)：“愛(ài)你的敵人?！彼麄儛?ài)一切人而不會(huì)計(jì)算他愛(ài)的行動(dòng)會(huì)給他帶來(lái)利益或?yàn)?zāi)難，而是希望他的行動(dòng)感化眾生。模型六、有效工資率/重復(fù)博弈

目前五十五頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)

如果是有限次的囚徒困境，那么情況就不同于上述無(wú)限次的囚徒困境的重復(fù)博弈。當(dāng)臨近博弈的終點(diǎn)時(shí)，采取不合作策略的可能性加大，如果參與人以前的所有策略均為合作策略，并且被告知下一次博弈是最后一次，那么雙方肯定采取不合作的策略。

這可以解釋許多商業(yè)行為。一次性的買賣往往發(fā)生在雙方以后不再有買賣機(jī)會(huì)的時(shí)候,盡量謀取高利并且?guī)垓_性是其特點(diǎn)。而靠“熟客”、“回頭客”便是通過(guò)薄利行為使得雙方能繼續(xù)合作下去。模型六、有效工資率/重復(fù)博弈

目前五十六頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)

非合作博弈理論把存在于如銀行業(yè)經(jīng)營(yíng)、國(guó)際融資選擇、商業(yè)周期出現(xiàn)、社會(huì)習(xí)俗形成和中介機(jī)構(gòu)出現(xiàn)及制度設(shè)計(jì)等各經(jīng)濟(jì)領(lǐng)域的協(xié)調(diào)問(wèn)題模型化為協(xié)調(diào)博弈，存在多個(gè)嚴(yán)格納什均衡是這類博弈根本特點(diǎn),協(xié)調(diào)博弈成為了繼囚徒困境博弈之后又一被廣泛研究的博弈類型。多重均衡是對(duì)傳統(tǒng)經(jīng)濟(jì)理論的一個(gè)挑戰(zhàn)，也是非合作博弈理論致命之所在，為尋找解決協(xié)調(diào)問(wèn)題的方法，學(xué)者們從理論上對(duì)協(xié)調(diào)博弈進(jìn)行了廣泛而深入的探討。協(xié)調(diào)博弈理論研究有助于解決非合作博弈的多重均衡問(wèn)題，在近十幾年成了為學(xué)術(shù)界關(guān)注的焦點(diǎn)。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前五十七頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)

對(duì)稱協(xié)調(diào)博弈是指無(wú)角色區(qū)分的參與之間進(jìn)行的協(xié)調(diào)博弈，它表現(xiàn)在支付函數(shù)的對(duì)稱上，策略集是一樣的。從形式上看：對(duì)稱協(xié)調(diào)博弈就是博弈支付矩陣主對(duì)角線上的元素都是納什均衡的博弈。協(xié)調(diào)博弈的均衡選擇并不涉及到激勵(lì)問(wèn)題而依賴于參與人之間對(duì)博弈如何進(jìn)行有充分相似的信念。正是由于信念形成是一個(gè)相對(duì)復(fù)雜的過(guò)程，所以對(duì)協(xié)調(diào)博弈均衡問(wèn)題的研究也就顯得非常復(fù)雜,不同的信念形成過(guò)程動(dòng)態(tài)就會(huì)產(chǎn)生不同的均衡。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前五十八頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)

對(duì)稱協(xié)調(diào)博弈是一類特殊的博弈，均衡選擇不僅要滿足預(yù)期的一致性，而且要滿足行動(dòng)的一致性，因此，博弈結(jié)果必定收斂到純策略而非混合策略納什均衡。更為重要的是，協(xié)調(diào)博弈還有策略互補(bǔ)性及支付外溢性這兩個(gè)重要特征，它是分析協(xié)調(diào)博弈多重均衡問(wèn)題的出發(fā)點(diǎn)。對(duì)稱協(xié)調(diào)博弈分成三類：支付占優(yōu)與風(fēng)險(xiǎn)占優(yōu)不一致；支付占優(yōu)與風(fēng)險(xiǎn)占優(yōu)一致（嚴(yán)格納什均衡可進(jìn)行帕累托排序均衡）;無(wú)占優(yōu)性可比的協(xié)調(diào)博弈。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前五十九頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)支付占優(yōu)與風(fēng)險(xiǎn)占優(yōu)不一致的協(xié)調(diào)博弈這類博弈最典型的例子就是獵鹿博弈。有兩個(gè)打獵人，他們可以合作去獵鹿也可以單獨(dú)去獵兔，如果合作獵鹿，那么兩個(gè)都可以分得4個(gè)單位的支付；如果一個(gè)人去獵鹿而另一個(gè)人去獵兔，那么前者支付為0（因?yàn)楂C鹿需要兩個(gè)人合作可以成功）后者的支付為2；如果兩個(gè)人不合作都去獵兔，那么他們都可以得到3單位的支付。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈獵鹿獵兔獵鹿4，40，2獵兔2，03，3目前六十頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)

顯然該博弈有兩個(gè)純策略嚴(yán)格納什均衡,即要么兩個(gè)合作獵鹿，要么兩人去獵兔與一個(gè)混合策略納什均衡。按HarsayiandSelten(1988)的定義，純策略獵鹿是支付占優(yōu)納什均衡、純策略獵兔是風(fēng)險(xiǎn)占優(yōu)納什均衡。獵兔策略是一個(gè)保險(xiǎn)策略，而獵鹿博弈則是一個(gè)帕累托效率策略，但行動(dòng)的不確定性使獵鹿策略具有較大的風(fēng)險(xiǎn)。因此，均衡選擇取決于參與人對(duì)風(fēng)險(xiǎn)的態(tài)度。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前六十一頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)

由于存在兩個(gè)純策略納什均衡，現(xiàn)實(shí)中究竟哪個(gè)均衡會(huì)出現(xiàn)就是一個(gè)問(wèn)題，這是多重納什均衡下的困境。通過(guò)比較“獵鹿博弈”,明顯的事實(shí)是:兩人一起去獵鹿的好處比各自打兔的好處要大得多。用一個(gè)經(jīng)濟(jì)學(xué)術(shù)語(yǔ)來(lái)說(shuō),兩人起去人頭獵鹿比各自去打兔更符合帕累托最優(yōu)原則。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前六十二頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)這一案例中有一個(gè)隱含的假設(shè)：兩個(gè)獵人的能力和貢獻(xiàn)差不多，所以雙方均分獵物。但是實(shí)際情況顯然不會(huì)這么簡(jiǎn)單。如果一個(gè)獵人的能力強(qiáng)、貢獻(xiàn)大，他就會(huì)要求得到較大的一份,這樣分配的結(jié)果就可能是（14,6）或（15,5）。但有一點(diǎn)是肯定的，能力較差的獵人的所得，至少要多于他獨(dú)自打獵的所獲，否則他就沒(méi)有合作的動(dòng)機(jī)。假設(shè)獵人甲在獵鹿過(guò)程中幾乎承擔(dān)了全部的工作,他據(jù)此要求最后的分配結(jié)果是（17,3）。這時(shí)模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前六十三頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)相對(duì)于分別獵兔的收益（4,4），合作獵鹿就不具有帕累托優(yōu)勢(shì)。雖然這樣17比4多，改善了很多，17+3也比4+4大得多，獵人總體收益也改善了很多，但是由于3比4小，獵人乙的境遇不僅沒(méi)有改善，反而惡化。也就是說(shuō)他的收益受到了損害。所以站在乙的立場(chǎng)，（17,3）沒(méi)有（4,4）好。如果合作結(jié)果是這樣，那么,乙一定不愿合作。所以，為了實(shí)現(xiàn)帕累托最優(yōu)，就必須充分照顧到合作者的利益，使他的收益大于不合作時(shí)，他才會(huì)愿意選擇合作,從而實(shí)現(xiàn)雙贏的最佳結(jié)局。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前六十四頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)協(xié)調(diào)、合作與互動(dòng)

在許多研究中，人們通常把協(xié)調(diào)與合作看作同一個(gè)事物，容易引起混淆，但博弈論卻能夠很好地進(jìn)行區(qū)分，下面以囚徒困境與獵鹿博弈來(lái)給予說(shuō)明，支付矩陣如下表4表5：模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈1，13，0欺騙0，32，2合作欺騙合作表4：囚徒困境博弈3，32，0獵兔0，24，4獵鹿獵兔獵鹿表5：獵鹿博弈目前六十五頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)

協(xié)調(diào)博弈解決的是源于參與人之間策略不確定性以及由此引起的行為預(yù)期問(wèn)題。

獵鹿博弈中，如果一個(gè)參與人選擇獵兔,另一個(gè)參與人選擇獵鹿，那么前者得到支付2,后者得到支付0，獵兔策略不是占優(yōu)策略。由于不能夠確定其他參與人是否會(huì)選擇獵鹿策略，盡管每個(gè)參與人都意識(shí)到這樣可以帶來(lái)更多的支付，但他們不會(huì)選擇有較高風(fēng)險(xiǎn)的獵鹿策略，因而系統(tǒng)難以達(dá)到帕累托效率均衡，因此，解決協(xié)調(diào)問(wèn)題就要參與人相信其他人會(huì)選擇帕累托效率策略，在這里需要強(qiáng)化參與人之間的相互信任。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前六十六頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)

囚徒困境博弈研究的是處于競(jìng)爭(zhēng)關(guān)系兩參與人之間的合作問(wèn)題，如果一個(gè)參與人選擇欺騙，另一個(gè)參與人選擇合作，那么前者得到支付3，后者得到支付0，欺騙策略是占優(yōu)的。求解囚徒困境博弈的困難在于個(gè)人激勵(lì)與群體目標(biāo)并不一致，因而，要求參與人把個(gè)人目標(biāo)放到第二位，而把集體目標(biāo)放在第一位。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈目前六十七頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)協(xié)調(diào)博弈與囚徒困境博弈存在著兩種不同形式的互動(dòng)：協(xié)調(diào)互動(dòng)合作互動(dòng)協(xié)調(diào)互動(dòng)是指一個(gè)參與人獲得的支付依賴于其他參與人是否選擇了相同行動(dòng)，如左行右行博弈，如果兩個(gè)相對(duì)而行的參與人選擇不同的方向行進(jìn)，那么他們會(huì)相碰，而選擇相同方向則可以順利通過(guò)。模型七、價(jià)格競(jìng)爭(zhēng)博弈/協(xié)調(diào)博弈合作互動(dòng)是指既存在協(xié)調(diào)又存在沖突的博弈，協(xié)調(diào)是因?yàn)閮蓚€(gè)參與同時(shí)改變行動(dòng)可以變得更好，沖突是因?yàn)楸M管其他參與人承諾行動(dòng)，也不一定有利于該參與人支付的增加，前者可能引起無(wú)效率，后者則意意味著無(wú)效率狀態(tài)會(huì)成為均衡，目前六十八頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)獵鹿類型協(xié)調(diào)博弈，由策略不確定性所引起的均衡結(jié)果依賴于參與人之間的行為預(yù)期、博弈支付與策略風(fēng)險(xiǎn)；當(dāng)時(shí)也是最小努力類型協(xié)調(diào)博弈支付占優(yōu)與風(fēng)險(xiǎn)占優(yōu)是統(tǒng)一的，均衡結(jié)果依賴于行為預(yù)期與博弈支付?，F(xiàn)在進(jìn)一步分析支付值x的變化對(duì)合作與協(xié)調(diào)的影響。囚徒困境博弈中，隨著支付值x的增加，不合作的激勵(lì)就會(huì)越大，追求個(gè)人理性的參與人使系統(tǒng)更易于偏離集體目標(biāo)。獵鹿類型博弈中，參與人對(duì)系統(tǒng)達(dá)到支付占優(yōu)均衡的期望值會(huì)隨著支付值x的增加而減少，選擇合作的風(fēng)險(xiǎn)就會(huì)越來(lái)越大；最小努力類型博弈中，盡管結(jié)果（欺騙,欺騙）是一個(gè)均衡，但x的下降使欺騙策略會(huì)面臨更大的風(fēng)險(xiǎn)。合作欺騙合作2，20，x欺騙x，01，1當(dāng)時(shí)就是囚徒困境博弈，個(gè)人理性并不追求集體最大化目標(biāo)，唯一的均衡是（欺騙,欺騙）；當(dāng)時(shí)就是目前六十九頁(yè)\總數(shù)七十六頁(yè)\編于十八點(diǎn)夏普里(Shapley)值與夏普里一蘇比克權(quán)力指數(shù)夏普里一蘇比克權(quán)力指數(shù)是最早提出的一種權(quán)力指數(shù)，它是夏普里和蘇比克在1954年的一篇文章“評(píng)價(jià)委員會(huì)中權(quán)力分布的一個(gè)方法”中提出

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

博弈論的幾個(gè)經(jīng)典模型詳解演示文稿

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

博弈論的幾個(gè)經(jīng)典模型詳解演示文稿

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔