經(jīng)濟(jì)博弈論概述VIP

上傳人：1*** IP屬地：湖北上傳時(shí)間：2024-12-05 格式：PPTX 頁(yè)數(shù)：244 大小：11.88MB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩239頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

經(jīng)濟(jì)博弈論

參考書《博弈與信息》艾里克·拉斯繆森著，北京大學(xué)出版社《博弈論》Drew.Fudenberg&JeanTirol,[美]朱?弗登博格，[法]讓?梯若爾,經(jīng)濟(jì)科學(xué)出版社《博弈論—矛盾沖突分析》RogerB.Myerson,中國(guó)經(jīng)濟(jì)出版社《博弈論基礎(chǔ)》Gibbons,R1992PricetonUniv.Press《博弈論與信息經(jīng)濟(jì)學(xué)》張維迎，北京大學(xué)出版社《博弈論》施錫銓上海財(cái)經(jīng)大學(xué)出版社《經(jīng)濟(jì)博弈論》謝識(shí)予，復(fù)旦大學(xué)出版社著名經(jīng)濟(jì)學(xué)家泰勒爾(JeanTirole)說(shuō):“正如理性預(yù)期使宏觀經(jīng)濟(jì)學(xué)發(fā)生革命一樣,博弈論廣泛而深遠(yuǎn)地改變了經(jīng)濟(jì)學(xué)家的思維方式”如果情況確實(shí)如此，對(duì)今天的經(jīng)濟(jì)學(xué)家來(lái)說(shuō)，不懂得博弈論顯然是不行了。博弈論為何如此熱門?諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)偏愛(ài)博弈論研究1994年諾貝爾經(jīng)濟(jì)學(xué)授予約翰·納什

約翰·海薩尼

萊因哈德·澤爾騰

1996年諾貝爾經(jīng)濟(jì)學(xué)授予威廉·維克瑞詹姆斯·莫里斯2001年諾貝爾經(jīng)濟(jì)學(xué)授予喬治.A.阿克洛爾夫A.斯潘塞約瑟夫.Ｅ.斯蒂格尼茲2005諾貝爾經(jīng)濟(jì)學(xué)授予羅伯特·奧曼托馬斯·謝林2007年:諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予赫維茨(Hurwicz）馬斯金（Maskin）梅耶森（Myerson）2012年:諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予埃爾文·羅斯（AlvinRoth）羅伊德·夏普利（LloydShapley）。埃爾文·羅斯（AlvinE.Roth）

羅伊德·夏普利（LloydS.Shapley）他們的貢獻(xiàn)：

穩(wěn)定的匹配理論與市場(chǎng)設(shè)計(jì)的實(shí)踐經(jīng)濟(jì)學(xué)是研究資源最優(yōu)配置問(wèn)題的，而真實(shí)世界里配置資源的方式多種多樣，市場(chǎng)、價(jià)格機(jī)制是經(jīng)濟(jì)學(xué)研究最多的。但是有一些市場(chǎng)里頭，價(jià)格的作用受到多種限制，可能是來(lái)自法律等正式規(guī)則的限制，也可能是來(lái)自習(xí)俗或倫理道德等非正式制度的限制。例如：找對(duì)象，不是價(jià)高者得，而是情投意合才能結(jié)成夫妻。問(wèn)題是情投意合這種分配方式講究“配對(duì)”，而且這種配對(duì)最好還需要“穩(wěn)定”，麻煩的是還不能依靠傳統(tǒng)的價(jià)格機(jī)制，在這種情況下經(jīng)濟(jì)學(xué)應(yīng)該怎么辦呢？2012年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)就授給了夏普利（L.S.Shapley）和羅斯（A.E.Roth），表彰他們?cè)凇癴orthetheoryofstableallocationsandthepracticeofmarketdesign”夏普利與夏普利值我們熟悉的夏普利，是他在合作博弈上所做的貢獻(xiàn)，即夏普利值。在前六次的諾獎(jiǎng)獲得者中，他們都可以說(shuō)是在非合作博弈領(lǐng)域的大家（我們這門課實(shí)際上也是討論在非合作博弈理論基礎(chǔ)上的經(jīng)濟(jì)層面的應(yīng)用問(wèn)題），而夏普利則是合作博弈領(lǐng)域的巨頭。所謂非合作和合作博弈的區(qū)分，簡(jiǎn)單來(lái)說(shuō)就是非合作主要是個(gè)體之間的博弈，而合作博弈則處理群體與群體之間的博弈，例如醫(yī)生與醫(yī)院、學(xué)生與學(xué)校這類群體間的博弈。夏普利值也是這個(gè)合作博弈領(lǐng)域最為突出的貢獻(xiàn)，不過(guò)有意思的是，這一次的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的貢獻(xiàn)卻沒(méi)有頒給“夏普利值”，而是穩(wěn)定配對(duì)理論。合作博弈

在博弈論中，合作的概念是重要的。我們現(xiàn)在能夠閱讀到的各種版本的博弈論教科書，以及本課程將要介紹的主要是經(jīng)典博弈理論，都是建立在參與人理性的、非合作基礎(chǔ)之上的。事實(shí)上，在非合作博弈理論還沒(méi)有完全建立起來(lái)之前，合作博弈理論一直是博弈論專家們研究關(guān)注的領(lǐng)域。合作博弈的概念是馮·諾依曼（JohnvonNeumann）和摩根斯頓（OskarMorgenstern）在他們的《博弈論與經(jīng)濟(jì)行為》（1944）一書中首次提出。到50年代，合作博弈理論的發(fā)展到達(dá)鼎盛時(shí)期,其中包括納什（Nash,1950）和夏普利（Shapley,1953）的“討價(jià)還價(jià)模型”，Gillies和Shapley(1953)關(guān)于合作博弈中的“核”的概念，以及其他一些人的貢獻(xiàn)。一般觀點(diǎn)認(rèn)為合作博弈理論要比非合作博弈理論更為重要，因?yàn)?，如果人們的合作是有利可圖的，參與博弈的理性人怎么會(huì)放棄合作而采取非合作態(tài)度呢？我們知道，在任何真實(shí)的博弈局勢(shì)中，無(wú)論合作博弈還是非合作博弈，如果我們仔細(xì)地考察人們?yōu)檫_(dá)成一個(gè)協(xié)議而能做什么的話，那么原則上我們就應(yīng)該有可能把它模型化，然后通過(guò)分析這個(gè)博弈的均衡（解）來(lái)預(yù)測(cè)其結(jié)果。不幸得很，在合作博弈理論中，各種合作博弈解的概念是針對(duì)不同情況、不同理由給出了不同的解釋，如核心（core）、沙普利值（Shapelyvalue）、核仁（nucleolus）、核（kernel）、談判集以及穩(wěn)定集（stableset）等等，但沒(méi)有一種解能夠具有納什均衡在非合作博弈中具有的核心地位，也許正是這一點(diǎn)使合作博弈理論的應(yīng)用研究受到了極大地挑戰(zhàn)。不僅如此，在現(xiàn)實(shí)社會(huì)中，競(jìng)爭(zhēng)是一切社會(huì)、經(jīng)濟(jì)關(guān)系的根本基礎(chǔ)，不合作是基本的，而合作常常又是令人難以捉摸的、是有條件的和暫時(shí)的。即便如此，人們并沒(méi)有放棄對(duì)合作博弈理論研究的興趣。因?yàn)?，在現(xiàn)實(shí)社會(huì)中，確實(shí)存在有很多類似于“為共同目的而一起行動(dòng)”的合作問(wèn)題，如各種形式的聯(lián)盟。聯(lián)盟通常是那些有著共同利益的一群（兩個(gè)或兩個(gè)以上）人，為了試圖增進(jìn)他們的共同利益一起行動(dòng)所組成的集團(tuán)如個(gè)體廠商為了獲得更高利潤(rùn)，期待通過(guò)集團(tuán)形成賣方壟斷；消費(fèi)者為了尋求更低的價(jià)格，期待通過(guò)集團(tuán)形成買方壟斷；工人們?yōu)榱说玫礁叩墓べY待遇，期待通過(guò)工會(huì)形成討價(jià)還價(jià)的勢(shì)力等等。以夏普利值為例來(lái)看合作問(wèn)題例題1假定某議會(huì)共有100個(gè)席位，議員分屬4個(gè)黨派：紅黨43席，藍(lán)黨33席，綠黨16席，白黨8席；假定對(duì)于一般議題的任何提案，議會(huì)實(shí)行一人一票并且多數(shù)通過(guò)的投票規(guī)則。假設(shè)由于黨紀(jì)的約束，議員對(duì)于任何議題，都只能按照黨的意志投票。議會(huì)共有4個(gè)“議會(huì)黨團(tuán)”，每1個(gè)議會(huì)黨團(tuán)，都有可能面對(duì)其他3個(gè)議會(huì)黨團(tuán)組成的各種可能的聯(lián)盟。其他3個(gè)議會(huì)黨團(tuán)的各種聯(lián)盟組合，一共有7種：一種是3個(gè)議會(huì)黨團(tuán)各自成“團(tuán)”有3個(gè)聯(lián)盟一種是3個(gè)議會(huì)黨團(tuán)兩兩抱團(tuán)有3個(gè)聯(lián)盟一種是3個(gè)議會(huì)黨團(tuán)抱成一團(tuán)有1個(gè)聯(lián)盟每個(gè)黨團(tuán)面對(duì)其他3個(gè)黨可能組成的聯(lián)盟三個(gè)聯(lián)盟兩兩聯(lián)盟兩兩聯(lián)盟兩兩聯(lián)盟單獨(dú)聯(lián)盟單獨(dú)聯(lián)盟單獨(dú)聯(lián)盟紅黨43席藍(lán)綠白57藍(lán)綠49藍(lán)白41綠白24藍(lán)33綠16白8藍(lán)黨33席紅綠白67紅綠59紅白51綠白24紅43綠16白8綠黨16席紅藍(lán)白84紅藍(lán)76紅白51藍(lán)白41紅43藍(lán)33白8白黨8席紅藍(lán)綠92紅藍(lán)76紅綠59藍(lán)綠49紅43藍(lán)33綠16面對(duì)其他3個(gè)議會(huì)黨團(tuán)所有7種情形的聯(lián)盟，我們要看看有幾種情形他成為決定性的議會(huì)黨團(tuán)，即加入聯(lián)盟就能夠讓聯(lián)盟的議案通過(guò)不加入聯(lián)盟就可以阻止聯(lián)盟的議案通過(guò)，并且把成為決定性議會(huì)黨團(tuán)的數(shù)目叫做這個(gè)議會(huì)黨團(tuán)的“權(quán)力指數(shù)”。計(jì)算4個(gè)黨派在議會(huì)的“權(quán)力指數(shù)”權(quán)力指數(shù)：即在不同情況他加入或者退出一個(gè)投票聯(lián)盟足以改變投票結(jié)果的情況是多少。先看紅黨：有43席，可能面對(duì)的是7種情況：藍(lán)綠白聯(lián)盟57票藍(lán)綠聯(lián)盟49票、藍(lán)白聯(lián)盟41票、綠白聯(lián)盟24藍(lán)黨33票、綠黨16票、白黨8票。在這7種情況下，有6種情況他加入聯(lián)盟,聯(lián)盟就會(huì)獲勝、不加入聯(lián)盟，聯(lián)盟就會(huì)失敗，于是我們說(shuō)紅黨的權(quán)力指數(shù)是6。再看藍(lán)黨：有33席，也面對(duì)7種情況：紅綠白聯(lián)盟67票紅綠聯(lián)盟59票、紅白聯(lián)盟51票、綠白聯(lián)盟24票單獨(dú)的紅黨43票、綠黨16票和白黨8票。在這7種情況下，他只有面對(duì)綠白聯(lián)盟24票或者單獨(dú)的紅黨43票這2種情況，才是決定議案是否通過(guò)的議會(huì)黨團(tuán)，從而藍(lán)黨的權(quán)力指數(shù)是2。運(yùn)用同樣的方法，可以知道綠黨的權(quán)力指數(shù)是2，白黨的權(quán)力指數(shù)也是2.。結(jié)果是足以讓人口呆目瞪的：在這個(gè)議會(huì)里面，議員數(shù)目33的藍(lán)黨，與議員數(shù)目差不多只有他三分之一的白黨，權(quán)力指數(shù)竟然一樣，都是2。事實(shí)上，上面的例子告訴我們，操縱一項(xiàng)提案是否能夠通過(guò)的“能力”，與議員黨團(tuán)成員數(shù)目，并不成正比。四個(gè)黨的議員數(shù)目之比是43：33：16：8，而“權(quán)力指數(shù)”之比卻是6：2：2：2。夏普利值就是在分析這類問(wèn)題時(shí)建立的概念和有力的工具，其中理論上最容易說(shuō)明的，就是上述議會(huì)黨團(tuán)的權(quán)力指數(shù)，其他情況的夏普利值，會(huì)復(fù)雜很多。夏普利值的應(yīng)用非常廣泛比較淺白的應(yīng)用，包括加裝電梯的成本如何在不同樓層的公寓之間分?jǐn)?，以及同一路線上遠(yuǎn)近不同的同事長(zhǎng)期固定合伙乘出租車上下班如何分?jǐn)傑囐M(fèi)等等。上面例子當(dāng)中的權(quán)力指數(shù)是6：2：2：2。如果你喜歡“圓整”的權(quán)力指數(shù)，也可以都除以6＋2＋2＋2＝12，把它們定義為總和為一的6/12：2/12：2/12：2/12，即1/2：1/6：1/6：1/6。美國(guó)的總統(tǒng)選舉，在各州是贏者通吃的，一個(gè)州的多數(shù)選民選A君，那么這個(gè)州的選舉團(tuán)里面的每一個(gè)人，都必須選A君。上述關(guān)于權(quán)力指數(shù)的討論，也有助于讀者理解在各州贏者通吃的這種間接選舉中，選民比較多的候選人何以未必勝出。代議制民主里面有一些這樣的情況。這是關(guān)于合作、投票、分配、合作剩余、夏普利值等的討論。穩(wěn)定的匹配理論嚴(yán)格來(lái)說(shuō)，并不是經(jīng)濟(jì)學(xué)家首先提出并在理論上解決這一問(wèn)題的1962年，數(shù)學(xué)家蓋爾（D.Gale）和博弈論學(xué)者夏普利在《美國(guó)數(shù)學(xué)月刊》（AmericanMathematicalMonthly）發(fā)表了一篇名為《大學(xué)錄取和婚姻穩(wěn)定》的文章，首先提出了后來(lái)被稱為蓋爾-夏普利算法的穩(wěn)定配對(duì)（stablematching）問(wèn)題。穩(wěn)定配對(duì)是說(shuō)不存在兩個(gè)人，他們都更中意于彼此、勝過(guò)他們當(dāng)前的配對(duì)者。通俗來(lái)說(shuō)，就是你的配偶是你所獲得的最愛(ài)。因?yàn)榫驼麄€(gè)市場(chǎng)而言，如果婚姻市場(chǎng)上有數(shù)量大致相當(dāng)?shù)倪m婚男女，男的知曉所有女的信息，女的也一樣。然后男的對(duì)女的有一個(gè)排序，女的也對(duì)男的排序。接下來(lái)一方發(fā)起求婚，另一方對(duì)照自己的偏好排序表，如果是最愛(ài)的就接受，不是的就拒絕。在交易費(fèi)用為零和配對(duì)時(shí)間不限的情況下，最終蘿卜青菜各有所愛(ài)，每個(gè)人總能找到自己的伴侶，并且這種配對(duì)是穩(wěn)定的，即沒(méi)有人想分手，不會(huì)出現(xiàn)出軌的現(xiàn)象。為什么呢？讓我們假設(shè)有X男和Y女出軌了，X與原來(lái)的M女分手，這說(shuō)明X更偏好Y，這違反了預(yù)設(shè)的偏好穩(wěn)定。當(dāng)然這可能意味著X之前沒(méi)有向Y求過(guò)婚，同樣對(duì)Y來(lái)說(shuō)選擇X也意味著更偏好X，但每個(gè)人都是按照自己的偏好排序來(lái)求婚的，就違反了偏好排序。所以如果是穩(wěn)定配對(duì)，就不存在出軌現(xiàn)象。在這里，我們應(yīng)該注意到：這其實(shí)和經(jīng)濟(jì)學(xué)對(duì)理性人的偏好穩(wěn)定及偏好可排序假設(shè)沒(méi)有任何區(qū)別，無(wú)非是這里并不是用價(jià)格，而是用配對(duì)來(lái)配置婚姻資源。GS算法（蓋爾-夏普利）對(duì)多人參與的合作博弈如何分配資源的問(wèn)題有重要的貢獻(xiàn)和啟示。羅斯的貢獻(xiàn)對(duì)經(jīng)濟(jì)學(xué)來(lái)說(shuō)，不僅僅存在個(gè)體與個(gè)體之間的交換，而且還存在大量群體參與的交換，這個(gè)時(shí)候如何讓供需雙方穩(wěn)定配對(duì)，并不是簡(jiǎn)單的事情。從抽象的理論到市場(chǎng)制度的實(shí)際設(shè)計(jì)的發(fā)展，考慮如何匹配不同的市場(chǎng)主體。例如學(xué)生如何與學(xué)校匹配，人體器官的捐獻(xiàn)者如何與需要器官移植的患者匹配。經(jīng)濟(jì)學(xué)家要在這篇數(shù)學(xué)論文發(fā)表差不多20年后，才開(kāi)始將其中的原理逐步應(yīng)用到真實(shí)世界的市場(chǎng)里。而這個(gè)工作最主要的代表者就是羅斯。1984年羅斯的論文發(fā)表了一篇關(guān)于實(shí)習(xí)醫(yī)生的文章，將夏普利的理論應(yīng)用到解釋實(shí)際經(jīng)濟(jì)問(wèn)題中。在醫(yī)學(xué)領(lǐng)域，學(xué)生通常在后幾年學(xué)習(xí)生涯中需要去醫(yī)院實(shí)習(xí)。40年代，美國(guó)的醫(yī)院系統(tǒng)開(kāi)始大規(guī)模發(fā)展，但醫(yī)學(xué)院學(xué)生的數(shù)量很少，醫(yī)院之間的競(jìng)爭(zhēng)導(dǎo)致對(duì)醫(yī)學(xué)院學(xué)生需求的急劇增加，于是很多醫(yī)院就讓學(xué)生提前實(shí)習(xí)，甚至在這些學(xué)生還沒(méi)有選定專業(yè)領(lǐng)域的情況下就參加實(shí)習(xí)。但如果學(xué)生拒絕一個(gè)醫(yī)院，往往導(dǎo)致醫(yī)院再去找第二個(gè)學(xué)生就太遲了，因?yàn)榈诙€(gè)人可能已經(jīng)被另一個(gè)醫(yī)院搶走了。市場(chǎng)在這種情況下是極為不穩(wěn)定的，因?yàn)獒t(yī)院往往會(huì)設(shè)定一個(gè)最后申請(qǐng)期限，迫使學(xué)生在不曉得是否還有其他機(jī)會(huì)之前就做出選擇。由于醫(yī)院未能及時(shí)給所有學(xué)生提供機(jī)會(huì)，而學(xué)生也未能向所有醫(yī)院提出及時(shí)申請(qǐng)，雙方都未能極大化自己的利益。NRMP全國(guó)住院醫(yī)師配對(duì)項(xiàng)目到了1950年代，為了解決這個(gè)問(wèn)題，美國(guó)設(shè)立了一個(gè)集中的清算所（Clearinghouse），也就是全國(guó)住院醫(yī)師配對(duì)項(xiàng)目（NRMP：NationalResidentMatchingProgram）的項(xiàng)目。在1984年的論文中，羅斯發(fā)現(xiàn)這個(gè)清算所采用的就是蓋爾-夏普利算法，從而達(dá)到有效而穩(wěn)定的配對(duì)。市場(chǎng)設(shè)計(jì)跟著這個(gè)發(fā)現(xiàn)，羅斯隨后考察了英國(guó)的醫(yī)院和醫(yī)生配對(duì)情況，發(fā)現(xiàn)有些地區(qū)是穩(wěn)定的，而有一些則不然。那么隨之而來(lái)的問(wèn)題就是為什么會(huì)有這些差異呢？原來(lái)英國(guó)不同的地方采用的配對(duì)算法不同，而如何有一個(gè)算法使得配對(duì)穩(wěn)定下來(lái)，就成為成功的關(guān)鍵。如何改進(jìn)算法，不僅要利用每一個(gè)市場(chǎng)的信息，也要借助計(jì)算機(jī)技術(shù)的進(jìn)步，將理論和實(shí)際聯(lián)系起來(lái)，這促成和發(fā)展了經(jīng)濟(jì)學(xué)的一個(gè)分支：市場(chǎng)設(shè)計(jì)。市場(chǎng)設(shè)計(jì)在拍賣領(lǐng)域得到了最廣泛的應(yīng)用，2007年克拉克獎(jiǎng)得主阿西（S.C.Athey）就是自然資源領(lǐng)域拍賣設(shè)計(jì)的領(lǐng)軍人物。而Google公司的在線廣告拍賣也得到了首席經(jīng)濟(jì)學(xué)家范里安的幫助。醫(yī)生夫婦的問(wèn)題美國(guó)的NRMP項(xiàng)目一開(kāi)始很成功，但隨后又遇上了一個(gè)意想不到的問(wèn)題。那就是醫(yī)生夫婦的問(wèn)題，因?yàn)?950年代中期之后，醫(yī)學(xué)院的女生數(shù)量開(kāi)始增長(zhǎng)，這導(dǎo)致了醫(yī)學(xué)院學(xué)生中夫妻學(xué)生數(shù)量也開(kāi)始增長(zhǎng)，他們?cè)谡覍?shí)習(xí)機(jī)會(huì)的時(shí)候，總是傾向于在一起，而采用NRMP系統(tǒng)找實(shí)習(xí)的話，兩個(gè)人很可能分開(kāi)，因?yàn)橥粋€(gè)醫(yī)院對(duì)兩個(gè)人的排序是有差異的。羅斯新的設(shè)計(jì)這種情況下夫妻學(xué)生檔開(kāi)始繞過(guò)NRMP找工作，這就重新導(dǎo)致了市場(chǎng)的不穩(wěn)定。由于NRMP系統(tǒng)青睞醫(yī)院勝過(guò)學(xué)生，招致了大量的批評(píng)。羅斯在1995年應(yīng)NRMP的要求，重新設(shè)計(jì)了配對(duì)系統(tǒng)，加入對(duì)學(xué)生配偶考慮，這項(xiàng)調(diào)整使得清算所穩(wěn)定配對(duì)的功能得以繼續(xù)發(fā)揮。NRMP于1997年采用了羅斯新的設(shè)計(jì)，現(xiàn)在每年能為約2萬(wàn)個(gè)學(xué)生有效匹配醫(yī)院實(shí)習(xí)職位。但這里還有一個(gè)問(wèn)題：如果學(xué)生夫妻可以抗拒最初的NRMP項(xiàng)目來(lái)達(dá)到改變項(xiàng)目的目的，那么是不是也有人可以通過(guò)系統(tǒng)地操縱算法來(lái)獲得更好的收益，例如通過(guò)先隱藏自己的真實(shí)偏好并使他人境況變差來(lái)獲得更好的收益。對(duì)市場(chǎng)設(shè)計(jì)而言，最重要的除了穩(wěn)定（stability）之外，還要激勵(lì)兼容（incentivecompatibility），也就是說(shuō)沒(méi)有人有激勵(lì)說(shuō)謊話，這樣除了能真實(shí)揭示出每個(gè)參與者的偏好排序外，也避免了有人系統(tǒng)性地操縱市場(chǎng)。羅斯后來(lái)的工作表明要系統(tǒng)實(shí)現(xiàn)操縱NRMP項(xiàng)目是不可能的，不僅因?yàn)樾碌乃惴ū苊饬藢W(xué)生這種“錯(cuò)誤表達(dá)偏好”的可能，也避免了醫(yī)院系統(tǒng)操縱NRMP項(xiàng)目的可能，因?yàn)槌杀咎?。關(guān)于激勵(lì)兼容的研究，是2007年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主赫維茨、馬斯金和梅耶森的貢獻(xiàn)了。而羅斯后來(lái)的主要工作是將博弈論、經(jīng)驗(yàn)證據(jù)和實(shí)驗(yàn)室研究結(jié)合起來(lái)，這個(gè)領(lǐng)域之前的獲獎(jiǎng)?wù)呤?002年的弗農(nóng)·史密斯。我們已經(jīng)知道找對(duì)象和找工作都是雙向配對(duì)的，但是有一些真實(shí)世界的問(wèn)題卻不是雙向的，而是單向的。例如對(duì)器官移植而言，就是完全單向的，病人是等待者，而捐贈(zèng)者捐出之后，最好能又快又好地進(jìn)行移植手術(shù)，才能最大化捐贈(zèng)人和受贈(zèng)人的利益。在這個(gè)市場(chǎng)上，等待器官移植的人由于受到法律和道德的限制，不能實(shí)施價(jià)高者得，而且可能實(shí)施起來(lái)的成本也不低，所以必須要有另外的配置資源的方式。那么在器官移植這種問(wèn)題上，如何提高效率呢？市場(chǎng)設(shè)計(jì)在這里也有可為之處夏普利和蓋爾提出了另一種算法，叫做“首位交易循環(huán)”（TTC:toptradingcycle）。TTC機(jī)制除了在器官移植領(lǐng)域廣泛應(yīng)用外，在學(xué)生擇校領(lǐng)域也有廣泛應(yīng)用。TTC是說(shuō)先進(jìn)行之前提到的穩(wěn)定配對(duì)，已經(jīng)配對(duì)完成的參與者就從市場(chǎng)中移除。說(shuō)真話機(jī)制這個(gè)簡(jiǎn)單的限定在偏好穩(wěn)定且可以排序的情況下，就導(dǎo)致沒(méi)有人愿意說(shuō)假話掩蓋自己的偏好并試圖操縱市場(chǎng)了，因?yàn)檎f(shuō)真話揭示自己的真實(shí)偏好是唯一優(yōu)勝的策略。在生死攸關(guān)的器官移植問(wèn)題上，這一算法簡(jiǎn)單卻又實(shí)用的保證了配對(duì)穩(wěn)定和資源分配的效率。這里的挑戰(zhàn)有兩個(gè)：一是捐贈(zèng)的器官是不是與受助者兼容；二是移除配對(duì)完成的參與者也需要時(shí)間。盡管如此，美國(guó)有大量的州已經(jīng)實(shí)行這一TTC機(jī)制多年，為大量患者帶去了福音。這類市場(chǎng)設(shè)計(jì)可以被推廣到大量?jī)r(jià)格的作用受限的市場(chǎng)里其中最主要的一類應(yīng)用是學(xué)生擇校。學(xué)生要選到自己的理想學(xué)校，而學(xué)校也想挑選最佳學(xué)生，這顯然屬于兩個(gè)群體之間如何最優(yōu)配對(duì)且能穩(wěn)定配對(duì)的問(wèn)題。中國(guó)有不少研究高考擇校問(wèn)題的學(xué)者，已經(jīng)在這方面做了一些探索，比較不同的擇校機(jī)制之間的優(yōu)劣。事實(shí)上，夏普利和后來(lái)的研究者已經(jīng)將蓋爾-夏普利算法做了改進(jìn)，也可以被應(yīng)用到價(jià)格起作用的市場(chǎng)中，例如拍賣，尤其是網(wǎng)絡(luò)拍賣，有競(jìng)價(jià)，有大量的信息，以及便捷的技術(shù)，這個(gè)領(lǐng)域正在產(chǎn)出大量有意思的新問(wèn)題和文章。機(jī)制設(shè)計(jì)理論2007年:諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予赫維茨(Hurwicz）馬斯金（Maskin）梅耶森（Myerson）是因?yàn)樗麄儭盀闄C(jī)制設(shè)計(jì)理論奠定了基礎(chǔ)”。機(jī)制設(shè)計(jì)理論是研究在自由選擇、自愿交換、信息不完全及決策分散化的條件下，能否設(shè)計(jì)一套規(guī)則或制度來(lái)達(dá)到既定目標(biāo)的理論，深遠(yuǎn)地影響了現(xiàn)代經(jīng)濟(jì)學(xué)發(fā)展。從一個(gè)單位的激勵(lì)機(jī)制的設(shè)計(jì)，到整個(gè)社會(huì)和國(guó)家的制度設(shè)計(jì)，都可以用一個(gè)統(tǒng)一的模型來(lái)考慮。萊昂尼德·赫維奇（被譽(yù)為“機(jī)制設(shè)計(jì)理論之父”）赫維茨早在上世紀(jì)40年代就以研究博弈論出名。他論文《資源配置中的最優(yōu)化與信息效率》，拉開(kāi)“機(jī)制設(shè)計(jì)理論”的序幕；1973年赫維奇在最著名的《美國(guó)經(jīng)濟(jì)評(píng)論》雜志上發(fā)表論文《資源分配的機(jī)制設(shè)計(jì)理論》，奠定了機(jī)制設(shè)計(jì)理論這門學(xué)問(wèn)的框架。埃里克·馬斯金馬斯金最大的一個(gè)貢獻(xiàn)就是對(duì)有一個(gè)委托人兼有許多代理人的情況下，達(dá)到一個(gè)給定的目標(biāo)，需要的充分必要條件是什么，這是一個(gè)很了不起的成果。因?yàn)樗@個(gè)理論的前提是任何一個(gè)給定的目標(biāo)。在機(jī)制設(shè)計(jì)理論方面，馬斯金最出名的工作則是“納什均衡可實(shí)施機(jī)制”，為人們尋找可行的規(guī)則提出一種標(biāo)準(zhǔn)，被稱為馬斯金定理。之前，莫里斯在1971年發(fā)表了《最優(yōu)所得稅理論的探索》的論文都堪稱這方面的經(jīng)典之作，贏得了1996年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。羅杰·邁爾森

邁爾森最大的貢獻(xiàn)就是奠定了最優(yōu)合同理論的機(jī)制。最優(yōu)合同理論是機(jī)制設(shè)計(jì)的一個(gè)分支。前幾年拿諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的這些人，實(shí)際上是在赫維茨的框架下做?，F(xiàn)年56歲的芝加哥大學(xué)經(jīng)濟(jì)系教授邁爾森開(kāi)發(fā)出了分析選舉的數(shù)學(xué)模型并發(fā)表了70多篇有關(guān)博弈論和其他課題的論文。他在獲獎(jiǎng)當(dāng)天于芝加哥舉行的新聞發(fā)布會(huì)上表示，“我們認(rèn)識(shí)到不僅資源的制約很重要，激勵(lì)的制約也很重要?，F(xiàn)在這些已經(jīng)被理解為經(jīng)濟(jì)學(xué)問(wèn)題的基本組成部分?！睓C(jī)制設(shè)計(jì)思想

“機(jī)制設(shè)計(jì)理論”解答的問(wèn)題，是不同的制度或配置機(jī)制如何發(fā)揮作用？以實(shí)現(xiàn)社會(huì)福利或個(gè)人營(yíng)利之類特定目標(biāo)的最佳效益。機(jī)制設(shè)計(jì)理論可以看作是博弈論和社會(huì)選擇理論的綜合運(yùn)用。所羅門王的故事

《圣經(jīng)》上所羅門王的故事：兩個(gè)女人為爭(zhēng)奪一個(gè)孩子吵到所羅門王那里，都說(shuō)孩子是自己的。所羅門王見(jiàn)她們爭(zhēng)執(zhí)不下，便喝令侍衛(wèi)拿一把劍來(lái)，要把孩子劈成兩半，一個(gè)人一半。這時(shí)其中一個(gè)女人趕緊說(shuō)：“大王，不要?dú)⑺篮⒆?。把孩子給她吧，我不和她爭(zhēng)了”。所羅門王聽(tīng)了卻說(shuō)：“這個(gè)女人才是真的母親，把孩子給她。”假如故事中的假母親和真母親說(shuō)同樣的話，那所羅門王該怎么辦呢？所羅門王可以向其中任一母親（稱為A）提問(wèn)孩子是不是她的。如果A說(shuō)不是她的，那么孩子給另一個(gè)女人（稱為B），GAMEOVER。如果A說(shuō)孩子是她的，那么所羅門王可以接著問(wèn)B是否反對(duì)。如果B不反對(duì)，則孩子歸A，GAMEOVER。如果B反對(duì)，則所羅門就要她提出一個(gè)賭注，然后向A收取罰金。比較罰金和賭注，如果罰金高于賭注，則孩子給A，她只須交給所羅門王賭注那么多錢，而B(niǎo)要交給他罰金的錢；如果罰金比賭注低，則孩子給B，她給所羅門王賭注的錢，A的罰金也歸他。不難推出，在A是真母親的情形下，她的策略是說(shuō)孩子是她的，然后B不反對(duì)。因?yàn)樗磳?duì)的結(jié)果只會(huì)導(dǎo)致她要多交錢，因?yàn)锳為了得到孩子并避免白白給出罰金，必然會(huì)真實(shí)地根據(jù)孩子對(duì)她的價(jià)值拿出罰金；在A是假母親的情形下，她的策略是承認(rèn)孩子不是她的，因?yàn)槿绻f(shuō)孩子是她的，B必然會(huì)反對(duì)，并且B為了得到孩子并少付錢，一定會(huì)真實(shí)出價(jià)，而A只有出高出孩子對(duì)她的真正價(jià)值的錢才會(huì)得到孩子，可這就不合乎她的偏好了。“沒(méi)有規(guī)矩，不成方圓”方不方、圓不圓很大程度上取決于“規(guī)矩”的好壞，而如何去評(píng)價(jià)“規(guī)矩”，如何去創(chuàng)造個(gè)好“規(guī)矩”就是機(jī)制設(shè)計(jì)理論研究的課題。某種程度上看，機(jī)制設(shè)計(jì)理論似乎比我們熟知的傳統(tǒng)經(jīng)濟(jì)理論更加抽象和高深，大部分經(jīng)濟(jì)學(xué)家都是習(xí)慣于在一個(gè)“既定框架”下研究各種最優(yōu)化問(wèn)題，而赫維茨等人研究的恰恰就是這個(gè)“既定框架”本身。機(jī)制設(shè)計(jì)是不完全信息下委托代理問(wèn)題

經(jīng)濟(jì)社會(huì)活動(dòng)中，存在著大量一方委托另一方完成特定工作的情況。其特征是委托方利益與被委托方的行為有密切關(guān)系，而且委托方不能直接控制被委托方的行為。只能通過(guò)報(bào)酬等間接影響被委托方的行為。除了有書面合同、協(xié)議，或至少有口頭委托的明顯委托關(guān)系以外，還有大量經(jīng)濟(jì)社會(huì)關(guān)系雖然沒(méi)有明顯的委托關(guān)系，但一方利益與另一方的行為有關(guān)，也可以用委托代理理論來(lái)加以研究。當(dāng)對(duì)代理人付出的努力不能進(jìn)行完全的檢驗(yàn)，代理人有可能試圖只付出少于他能夠付出的努力時(shí)（偷懶）；當(dāng)一個(gè)只根據(jù)行動(dòng)而不兼顧結(jié)果支付報(bào)償?shù)钠跫s建立時(shí)，潛在的道德風(fēng)險(xiǎn)立即產(chǎn)生。

委托代理的核心是兩人動(dòng)態(tài)博弈，基本問(wèn)題是代理人問(wèn)題。是指由于代理人目標(biāo)函數(shù)與委托人目標(biāo)函數(shù)不一致，加上存在不確定性和信息不對(duì)稱，代理人可能偏離委托人的目標(biāo)函數(shù)，而出現(xiàn)損害委托人收益和非效率現(xiàn)象。就委托人而言，如何設(shè)計(jì)最優(yōu)契約激勵(lì)代理人是問(wèn)題的關(guān)鍵。因此這種問(wèn)題也稱為“激勵(lì)機(jī)制設(shè)計(jì)”或“機(jī)制設(shè)計(jì)”。在非合作博弈的均衡分析理論方面做出了開(kāi)創(chuàng)性的貢獻(xiàn)，對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。約翰·納什,1928年生于美國(guó)

1994年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)得主在非合作博弈的均衡分析理論方面做出了開(kāi)創(chuàng)性的貢獻(xiàn)，對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。約翰·海薩尼，1920年生于美國(guó)1994年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)得主在非合作博弈的均衡分析理論方面做出了開(kāi)創(chuàng)性的貢獻(xiàn)，對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。萊因哈德·澤爾騰，1930年生于德國(guó)1994年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)得主背景馮·諾依曼（VonNeumann），摩根斯坦恩（Morgenstern）（1944），博弈論和經(jīng)濟(jì)行為（TheTheoryofGamesandEconomicBehavior）。標(biāo)志著博弈理論的初步形成Nash（1950，1951）兩篇關(guān)于非合作博弈的重要文章，在非常一般的意義下，定義了非合作博弈及其均衡解，并證明了均衡解的存在。基本上奠定了現(xiàn)代非合作博弈論的基石。他們主要的貢獻(xiàn)1994年：在非合作博弈的均衡分析理論方面做出了開(kāi)創(chuàng)性德貢獻(xiàn)對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響1996年：在信息經(jīng)濟(jì)學(xué)理論領(lǐng)域做出了重大貢獻(xiàn)，尤其是不對(duì)稱信息條件下的經(jīng)濟(jì)激勵(lì)理論（莫里斯）；在信息經(jīng)濟(jì)學(xué)、激勵(lì)理論、博弈論等方面都做出了重大貢獻(xiàn)（維克瑞）2001年：為不對(duì)稱信息市場(chǎng)的一般理論奠定了基石。他們的理論迅速得到了應(yīng)用，從傳統(tǒng)的農(nóng)業(yè)市場(chǎng)到現(xiàn)代的金融市場(chǎng)。他們的貢獻(xiàn)來(lái)自于現(xiàn)代信息經(jīng)濟(jì)學(xué)的核心部分。

2005年:諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予擁有以色列和美國(guó)雙重國(guó)籍的羅伯特·奧曼和美國(guó)人托馬斯·謝林，以表彰他們運(yùn)用博弈論推進(jìn)了人們對(duì)沖突與合作的理解。2007年:諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予以美國(guó)經(jīng)濟(jì)學(xué)家赫維茨、馬斯金、羅杰-B-邁爾森，以表彰他們激勵(lì)機(jī)制設(shè)計(jì)理論所作出的貢獻(xiàn)與奠定基礎(chǔ)。獲得2001諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)

對(duì)不對(duì)稱信息理論的貢獻(xiàn)獲得2001諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)加利福尼亞大學(xué)GeorgeAkerlof斯坦福大學(xué)MichaelSpence美國(guó)哥倫比亞大學(xué)JosephStiglitz他們?nèi)说呢暙I(xiàn)是提出了當(dāng)買方和賣方具有不對(duì)稱信息時(shí)市場(chǎng)運(yùn)作的理論，這一理論的應(yīng)用非常廣泛，從傳統(tǒng)的農(nóng)業(yè)市場(chǎng)到現(xiàn)代的金融市場(chǎng)均有涵蓋。雖然過(guò)去經(jīng)濟(jì)學(xué)家對(duì)不完全信息早有研究，但他們研究的是更為復(fù)雜的不對(duì)稱信息

奧曼和謝林利用博弈論解決了一個(gè)世紀(jì)難題即為何有的人、組織或國(guó)家在推進(jìn)合作方面表現(xiàn)出色，而另一些人則深受沖突之苦。在核競(jìng)賽盛行的20世紀(jì)50年代后期，謝林出版了《沖突戰(zhàn)略》一書，奠定了博弈論作為社會(huì)科學(xué)的方法論的地位。他指出，沖突中的一方可以通過(guò)自陷絕境從而加強(qiáng)自己的地位；擁有報(bào)復(fù)手段比抵抗手段更重要；難以預(yù)料的報(bào)復(fù)手段比已知的報(bào)復(fù)手段更有效。這些論斷在一些地區(qū)沖突的解決和避免戰(zhàn)爭(zhēng)的斡旋中被證明是正確的。謝林的理論推進(jìn)了博弈論在社會(huì)科學(xué)領(lǐng)域的發(fā)展，并被應(yīng)用于從企業(yè)競(jìng)爭(zhēng)到政治談判的廣泛領(lǐng)域。奧曼的貢獻(xiàn)--在于創(chuàng)造了重復(fù)博弈理論他的理論著重解釋這樣一些問(wèn)題：為何參與者太多合作就變得困難；參與者何時(shí)會(huì)偶爾互動(dòng)一下；何時(shí)這種互動(dòng)會(huì)瓦解等。重復(fù)博弈論解釋了經(jīng)濟(jì)沖突—如價(jià)格戰(zhàn)、貿(mào)易戰(zhàn)的原因，也說(shuō)明了為何一些政府比另一些政府能更好地管理公共資源。重復(fù)博弈理論已被用于從行業(yè)協(xié)會(huì)到有組織犯罪、從勞資談判到國(guó)際貿(mào)易條約等領(lǐng)域。

2007年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)按照亞當(dāng)·斯密的設(shè)想，市場(chǎng)這只看不見(jiàn)的手在理想情境中能有效分配資源。但現(xiàn)實(shí)中總有各種各樣的制度約束，導(dǎo)致市場(chǎng)不能發(fā)揮作用。

1991年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主科斯指出市場(chǎng)存在交易費(fèi)用，不能有效發(fā)揮作用，于是有企業(yè)這樣的機(jī)制作為替代。因此不同類型的制度如何最大化個(gè)人或社會(huì)的福利就成為經(jīng)濟(jì)學(xué)的一個(gè)重要問(wèn)題。這就是激勵(lì)機(jī)制設(shè)計(jì)理論產(chǎn)生的背景。激勵(lì)理論的兩個(gè)方面通常而言，激勵(lì)理論涉及兩個(gè)方面:一個(gè)是最優(yōu)機(jī)制，即機(jī)制的目標(biāo)是最大化個(gè)人的預(yù)期收益。另一個(gè)可以稱為效率機(jī)制，即設(shè)計(jì)者的目標(biāo)不是個(gè)人收益最大化，而是社會(huì)整體的福利最大化。激勵(lì)機(jī)制設(shè)計(jì)理論激勵(lì)機(jī)制設(shè)計(jì)理論不僅在理論上將博弈論引入到新制度經(jīng)濟(jì)學(xué)中，推動(dòng)了理論的發(fā)展；在現(xiàn)實(shí)中，也有助于人們找出有效的交易機(jī)制、管制手段和投票程序，豐富了現(xiàn)實(shí)中可以選擇的經(jīng)濟(jì)制度。各種預(yù)測(cè)雖然都沒(méi)有猜中獲獎(jiǎng)名單，但赫維茨、馬斯金和梅耶森的獲獎(jiǎng)是“意料之外，情理之中”。1.博弈論概述1.1如何描述一個(gè)博弈問(wèn)題1.2優(yōu)勢(shì)策略1.3納什均衡1.4納什均衡應(yīng)用舉例1.5計(jì)算納什均衡1.1如何描述一個(gè)博弈問(wèn)題Case1.guesscoin

-1，11，-11，-1-1，1

正面

反面猜硬幣方蓋硬幣方正面反面

博弈方：蓋硬幣方和猜硬幣方；可選策略：正面和反面；幾乎同時(shí)決策；所得利益

:猜對(duì)者得1元，蓋者輸1元；猜錯(cuò)者輸1元，蓋方得1元。Case2.prisoners’dilemma-1，-1-8，00，-8-5，-5不坦白坦白不坦白坦白囚犯2囚犯1博弈方：

囚犯1、2可選策略：坦白與不坦白幾乎同時(shí)決策所得利益：

若兩人同時(shí)坦白各判5年；若一個(gè)坦白一個(gè)不坦白，坦白放人，不坦白被判8年；若兩人同時(shí)不坦白各被判1年。Case3.boxedpigs5，14，49，-10，0按等待按等待小豬

大豬博弈方：大豬和小豬；可選策略：按和等待；幾乎同時(shí)決策所得利益：按一下按紐會(huì)有10個(gè)豬食進(jìn)槽，但誰(shuí)按誰(shuí)要支付成本2個(gè)單位。若大豬先到，大豬吃9個(gè)，小豬吃1個(gè)；若同時(shí)到，大豬吃7個(gè)，小豬吃3個(gè)；若小豬先到，大豬吃6個(gè)，小豬吃4個(gè)。Case4.夫妻之爭(zhēng)4，50，01，15，4看足球看芭蕾

看足球看芭蕾夫

妻博弈方：丈夫和妻子；可選策略：看足球和看芭蕾；幾乎同時(shí)決策所得利益Case4.Chickengame

-3，-32，00，20，0進(jìn)退AB進(jìn)

退博弈方：兩個(gè)人A，B；可選策略：進(jìn)或退。決策次序：幾乎同時(shí)決策所得利益：若兩繼續(xù)前進(jìn)則兩敗俱傷；若一方前進(jìn)另一方退下來(lái)，前進(jìn)者取得勝利，退下來(lái)者丟面子；若兩人都退下來(lái)，兩Case5.石頭剪子布的博弈博弈方1，2；可選策略：石頭、剪子和布；幾乎同時(shí)決策；所得利益：0表示沒(méi)有輸贏；1表示贏；-1表示輸。0，01，-1-1，1-1，10，01，-11，-1-1，10，0博弈方2石頭剪子布博弈方1石頭剪子布Case6無(wú)限策略博弈古諾寡頭模型中(需求函數(shù)：p=a-Q，其中Q=q1+q2)兩廠商博弈方可選擇策略：產(chǎn)量q1、q2支付函數(shù)為：u=pq-cq=(p-c)qui=[a-(q1+q2)-c]qi=(a-c)qi-q1qi-q2qii=1,2

如果假設(shè)a=8,c=2,則有

u1=6q1-q1q2-

q12u2=6q2-q1q2-q22 Case7.市場(chǎng)進(jìn)入與阻撓

Player1：在位者Player2：進(jìn)入者

:初始結(jié)Player2有兩個(gè)可選策略：進(jìn)入與不進(jìn)決策結(jié)Player1面臨兩個(gè)可選策略:斗爭(zhēng)與合作(a,b)為支付向量21

不進(jìn)

進(jìn)入斗爭(zhēng)合作

（0,300)(-10,0)(40,50)

BasicfactorsofGamePlayersStrategies&strategiessetOrderofgameInformationPayoff&payofffunctionOutcome&EquilibriumCasesPlayers

決策主體：?jiǎn)稳瞬┺?、兩人博弈和多人博弈可以是自然人或團(tuán)體，如企業(yè)、國(guó)家、OPEC、EU、NATO等目的是通過(guò)選擇行動(dòng)或策略以最大化自己的支付或效用水平重要的是每個(gè)決策主體必須有可供選擇的行動(dòng)或策略和一個(gè)很好定義的偏好函數(shù)而不做決策的被動(dòng)主體只當(dāng)作環(huán)境參數(shù)單人博弈——只有一個(gè)博弈方的博弈例：?jiǎn)稳嗣詫m入口AB出口(獎(jiǎng)金M)A,1B,1右左右左M00擴(kuò)展形Strategies

是博弈中各博弈方可以選擇的行動(dòng)方案，即對(duì)行為或者經(jīng)濟(jì)活動(dòng)水平等等的可能的選擇，或決策內(nèi)容。不同的博弈問(wèn)題中各博弈方可選策略的多少不同，一般分為：有限策略博弈和無(wú)限策略博弈有限策略博弈即策略數(shù)有限，且兩三個(gè)可選策略的博弈最為常見(jiàn)；有限策略博弈往往用支付矩陣、擴(kuò)展形法將所有策略、結(jié)果及支付羅列出來(lái)。見(jiàn)博弈的表述式無(wú)限策略博弈其策略數(shù)種往往是一個(gè)連續(xù)統(tǒng)，只能用數(shù)集或函數(shù)式加以表示見(jiàn)Case6。博弈的表述式策略式和結(jié)果式矩陣策略式是由每一種可能的策略組合所產(chǎn)生的支付情況,通常用支付矩陣表示;結(jié)果式表明的是每一種可能的行動(dòng)組合產(chǎn)生的支付情況擴(kuò)展式和博弈樹(shù)參與人1參與人2參與人2（參與人1，參與人2）Information

是Player有關(guān)博弈的知識(shí)，它是重要的決策依據(jù)和決定博弈結(jié)果的重要因素完美信息與不完美信息完美博弈

N大小

開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)BBBB

（4，4）（8，0）（0，8）（0，0）（-3，-3）（1，0）（0，1）（0，0）

不完美博弈

N大小

開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)BBBB

（4，4）（8，0）（0，8）（0，0）（-3，-3）（1，0）（0，1）（0，0）

開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)不完美博弈

N大小

開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)BBBB

（4，4）（8，0）（0，8）（0，0）（-3，-3）（1，0）（0，1）（0，0）

開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)不完美博弈

N大小

開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)A

（4，4）（8，0）（0，8）（0，0）（-3，-3）（1，0）（0，1）（0，0）

開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)確定性信息與不確定性信息參與人1參與人2參與人2（參與人1，參與人2）對(duì)稱信息與不對(duì)稱信息完全信息與不完全信息TheorderofPlayStaticGamemeans：每個(gè)博弈參與人幾乎同時(shí)行動(dòng)（不是時(shí)間概念）DynamicGamemeans：每個(gè)博弈參與人選擇行動(dòng)或策略有先后之分重要的是后行動(dòng)方通過(guò)觀察先行動(dòng)方的行動(dòng)來(lái)獲取信息，從而使得博弈分析成為預(yù)測(cè)人的行為的一個(gè)強(qiáng)有力的工具RepeatedGame：是指同一個(gè)博弈反復(fù)進(jìn)行所構(gòu)成的博弈過(guò)程構(gòu)成重復(fù)博弈的一次性博弈稱為“原博弈”或“階段博弈”Payoff它是指在一個(gè)特定的策略組合下player得到的確定的效用水平，或者指參與人得到的期望效用水平這是player真正關(guān)心的東西，是player博弈后所得利益他的目標(biāo)就是在自己可以選擇的策略集合里，選擇某個(gè)戰(zhàn)略以最大化自己的期望效用函數(shù)。UtilityFunction如果有n人博弈，令ui為Playeri

的支付，u=(u1,…ui…un)為支付組合payoffprofile,博弈的一個(gè)基本特征是一個(gè)參與人的支付不僅取決于自己的策略選擇，而且取決于所有其他參與人的策略選擇，即ui是所有參與人的策略選擇的函數(shù)：

ui=ui(s1,,…si,…sn)

其中si是Playeri

的策略選擇。Outcome&Equilibrium博弈的結(jié)果是所有博弈方所關(guān)心的，如均衡策略組合，均衡行動(dòng)組合，均衡支付組合。均衡是所有參與人的最優(yōu)策略的組合，一般記為S*=（S1*，…,Si*,…,Sn*)

其中，Si*

是Playeri

在均衡情況下的最優(yōu)策略。要做的事后面要討論1.2優(yōu)勢(shì)策略從數(shù)學(xué)上講,就是:囚犯1和囚犯251囚犯1囚犯25-588(-5,-5)8501.3納什均衡個(gè)案多重納什均衡純策略納什均衡隨機(jī)策略的納什均衡強(qiáng)、弱納什均衡個(gè)案：智豬博弈、建模者困境和性別戰(zhàn)Case.boxedpigs5，14，49，-10，0按等待按等待小豬

大豬求解這個(gè)博弈問(wèn)題：1.下劃線法2.重復(fù)剔除嚴(yán)格劣策略納什均衡：（按，等待）這個(gè)博弈有占優(yōu)策略？Case.建模者困境Case.性別戰(zhàn)三帕累托有效博弈的一個(gè)結(jié)果是帕累托有效（Paretoefficient）,當(dāng)且僅當(dāng)不存在另一個(gè)能使所有參與人的狀況更好的結(jié)果。囚徒困境可以說(shuō)是一個(gè)存在帕累托改善（或者說(shuō)無(wú)效均衡）的例子。納什均衡是博弈的結(jié)局，它指博弈中每個(gè)局中人均不能因單方面改變自己的策略選擇而獲益。納什均衡是一個(gè)僵局：給定別人不動(dòng)的情況下，沒(méi)有人有興趣動(dòng)。納什均衡可以理解為一種具有自我強(qiáng)制力的協(xié)議，即這種協(xié)議沒(méi)有外加力量保證實(shí)施卻使每個(gè)參與者都自愿遵守，原因就在背叛協(xié)議無(wú)利可圖。NE的哲學(xué)思想

“當(dāng)事人會(huì)自覺(jué)遵守這個(gè)協(xié)議”，等于說(shuō)這個(gè)協(xié)議構(gòu)成一個(gè)NE：即給定別人遵守協(xié)議的情況下，沒(méi)有人有積極性偏離這個(gè)協(xié)議規(guī)定的自己的行動(dòng)準(zhǔn)則如果一個(gè)協(xié)議不構(gòu)成NE，它就不可能自動(dòng)實(shí)施，因?yàn)橹辽儆幸粋€(gè)參與人會(huì)違背這個(gè)協(xié)議，不滿足NE要求，這個(gè)協(xié)議是沒(méi)有意義，這就是NE的哲學(xué)思想。NE的正式定義G={S1,…Sn;u1…un}是個(gè)n人博弈，策略組合s*=（s1*，…,si*,…,sn*)是一個(gè)NE，如果對(duì)每一個(gè)i，si*是給定其他參與人選擇

s-i*=(s1*,…s-1*,si+1*,…sn*)的情況下第i個(gè)參與人的最優(yōu)策略，即：

ui(si*,s-i*)≥ui(si,s-i*)si∈Si，對(duì)所有的i

則s*=（s1*，…,si*,…,sn*)是NE。這是一個(gè)弱納什均衡（weaklyNE）定義。NE有強(qiáng)弱之分StrictorstrongNE,如果給定其他參與人的策略，每一個(gè)參與人的最優(yōu)選擇是唯一的，就是說(shuō)，

s*=（s1*，…,si*,…,sn*)是一個(gè)strictNE，當(dāng)只當(dāng)對(duì)于所有的i，si’≠si*,

ui(si*,s-i*)>ui(si’,s-i*)

則s*=（s1*，…,si*,…,sn*)是一個(gè)StrictNE。1.4計(jì)算納什均衡納什均衡是一個(gè)策略組合，也是最優(yōu)策略組合；即在給定條件下，每一個(gè)博弈方最大化自己效用選擇的結(jié)果。如在G={S1,…Sn;u1,…un}中，如果有策略組合（S1*，…,Si*,…,Sn*)，其中任一博弈方i的策略Si*都是對(duì)其余博弈方的策略組合

S-i*=（S1*，…,S*i-1,S*i+1…,Sn*)的最佳對(duì)策,則這個(gè)策略組合就是博弈的解。博弈問(wèn)題解法劃線法-有限策略博弈的解法反應(yīng)函數(shù)-無(wú)限策略博弈的解法重復(fù)剔除嚴(yán)格劣策略或嚴(yán)格下策反復(fù)消去法混合策略下列博弈問(wèn)題的解如果以劃線法解上述博弈問(wèn)題，則發(fā)現(xiàn)：猜硬幣——無(wú)解囚徒的困境——有唯一穩(wěn)定的解智豬博弈——有一個(gè)解斗雞博弈——有兩個(gè)解但不唯一石頭剪子布的博弈——無(wú)穩(wěn)定解齊威王與田忌賽馬——無(wú)穩(wěn)定解反應(yīng)函數(shù)法古諾寡頭模型中(需求函數(shù)：p=a-Q，其中Q=q1+q2)兩廠商為博弈方1,2可選擇策略：產(chǎn)量q1、q2(無(wú)限策略型)支付函數(shù)為：u=pq-cq=(p-c)q如果假設(shè)a=8,c=2,則有

u1(q1,q2)=6q1-q1q2-

q12u2(q1,q2)

=6q2-q1q2-q22 以CournotModel為例這是一個(gè)完全信息的博弈模型Reactionfunction

q1*=R(q2*)=(6-q2*)/2——反應(yīng)函數(shù)

q2*=R(q1*)=(6-q1*)/2——反應(yīng)函數(shù)反應(yīng)函數(shù)——是指當(dāng)支付payoff是策略的多元連續(xù)函數(shù)時(shí):u=u(s1…si…sn)，我們可以求得每個(gè)博弈方針對(duì)其他博弈方最佳策略的最佳反應(yīng)構(gòu)成的函數(shù)，即通過(guò)du/dsi=o,求出每個(gè)博弈策略Si*=R(S1*,…Si-1*,Si+1*,…Sn*),這就是反應(yīng)函數(shù)。博弈的解——就是各個(gè)反應(yīng)函數(shù)的交點(diǎn)（如果有）古諾博弈解的幾何意義q10q1*q2*E(q1*,q2*)q1*=R(q2*)q2*=R(q1*)q2進(jìn)一步閱讀的例子反應(yīng)函數(shù)的概念和思路可以應(yīng)用到一般的無(wú)限多種策略博弈的求解中，可以使博弈問(wèn)題的解法簡(jiǎn)約如產(chǎn)業(yè)組織理論研究中經(jīng)典的模型：Bertrand雙寡頭模型。它與CournotModel不同的是，該模型中廠商的可選策略是價(jià)格而不是產(chǎn)量。Hotelling價(jià)格競(jìng)爭(zhēng)模型?；旌喜呗砸圆掠矌挪┺臑槔?這是一個(gè)零和博弈，沒(méi)有NE。其顯著的特征是每一個(gè)博弈方都想掌握對(duì)方選擇策略的規(guī)律性，而對(duì)方又不想讓對(duì)方掌握自己特征，他最好的選擇是隨機(jī)選擇策略，即按一定的概率分布選擇自己的策略。在本例中，如果蓋硬幣方以概率p選擇正面，1-p選擇反面，但如果p>1-p或P>1/2，即蓋方出正面多于出反面，在這種情況下，他的期望收益：

E=p·1+(1-p)·(-1)=2(P-1/2)>0

就平均而方，猜方獲利機(jī)會(huì)要多，這樣對(duì)蓋方不利。如何計(jì)算猜硬幣博弈的解？對(duì)蓋方來(lái)說(shuō)，最好的方法是設(shè)計(jì)一個(gè)概率分布，使猜方無(wú)法掌握其蓋的規(guī)律性，即使猜方的EU正=EU反，這樣猜方就不會(huì)依據(jù)你對(duì)策略的偏好占到你任何便宜。同樣，猜方也以相同概率隨機(jī)選擇策略。在本博弈中，博弈雙方的決策內(nèi)容都不是確定性的具體策略，而是以一定的概率分布隨機(jī)選擇策略，這樣的決策被稱為隨機(jī)策略或混合策略MixedStrategy。為了區(qū)別，將有確定性的決策內(nèi)容的博弈問(wèn)題中的策略稱為“純策略”，其均衡也為“純策略納什均衡”。混合策略的定義在G={S1,…Sn;u1,…un}中，博弈方i的策略為Si={si1,…sik},則博弈方i以概率分布pi=(pi1,…pik)隨機(jī)選擇其k個(gè)可選擇策略，則這Pi就稱為一個(gè)隨機(jī)策略或混合策略，其中0≤pij≤1,j=1,…k都成立，且pi1+···pik=1.斗雞博弈的混合策略設(shè)A方以概率pA（進(jìn)）+pA（退）=1設(shè)B方以概率pB（進(jìn)）+pB（退）=1A、B如何選擇PA，PB？對(duì)A方來(lái)說(shuō)，他設(shè)計(jì)的概率要使B方在選擇每一種策略時(shí)無(wú)差異：

EB進(jìn)=pA進(jìn)·（-3）+pA退·

（2）

EB退=pA進(jìn)·（0）+pA退·

（0）-3，-32，00，20，0進(jìn)退B

進(jìn)退

A令EB進(jìn)=EB退

-3pA進(jìn)+2pA退=0pA進(jìn)+pA退=1

則pA進(jìn)=0.6，pA退=0.4同理，pB進(jìn)=0.6，pB退=0.4隨機(jī)策略決策的基本原則第一個(gè)原則不能讓對(duì)方知道或猜到自己的選擇，因而必須在決策時(shí)利用隨機(jī)性。第二個(gè)原則他們選擇每種策略的概率一定要恰好使對(duì)方無(wú)機(jī)可乘，即讓對(duì)方無(wú)法通過(guò)有針對(duì)性地傾向某一策略而在博弈中占上風(fēng)。斗雞博弈的隨機(jī)策略均衡在純策略中，NE是一組最優(yōu)策略組合S*=（S1*…Si*…Sn*)如囚徒困境中，（坦白，坦白）是一個(gè)納什均衡，其支付為（-5，-5）。在隨機(jī)策略中，NE也是一組策略組合，但是以概率大小來(lái)選擇相應(yīng)最優(yōu)策略。以斗雞博弈來(lái)看，A方以(0.6、0.4)分別選擇進(jìn)和退，B方也(0.6、0.4)概率分別選擇進(jìn)和退，這就是混合策略的NE。其支付分別為各自期望收益（EA、EB）（-0.6,-0.6):監(jiān)督博弈博弈方：代理人A、委托人P代理商的可選策略：工作W，偷懶S

工資w,工作的花費(fèi)g,且w>g委托人的可選策略：檢查I，不檢查N

委托人檢查的費(fèi)用h,

增加的價(jià)值為v（v>w）假定g>h>0其支付矩陣如圖所示

0，-h

w,-w

w-g,v-w-hw-g,v-w檢查不檢查偷懶工作

代理商委托人監(jiān)督博弈的隨機(jī)策略均衡用下劃線求解，可知本博弈無(wú)純策略NE。設(shè)代理商:偷懶的概率為x,工作概率為1-xp1=(x,1-x)設(shè)委托人:檢查的概率為y,不檢查的概率為1-yp2=(y,1-y)對(duì)代理商來(lái)說(shuō)他設(shè)計(jì)的概率p1=(x,1-x)，應(yīng)該使委托人在不同策略選擇下的期望收益相等，即EUPI=EUPN

EUPI=x(-h)+(1-x)(v-w-h)EUPN=x(-w)+(1-x)(v-w)

令EUPI=EUPN，則求出x=h/w同理對(duì)委托人他的概率p2=(y,1-y)，也使EUAW=EUAS，則y=g/w因此,本博弈混合策略的NE為（h/w,1-h/w),(g/w,1-g/w)均衡時(shí)的期望

人人文庫(kù)> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

經(jīng)濟(jì)博弈論概述VIP

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔