




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
經(jīng)濟(jì)博弈論
參考書《博弈與信息》艾里克·拉斯繆森著,北京大學(xué)出版社《博弈論》Drew.Fudenberg&JeanTirol,[美]朱?弗登博格,[法]讓?梯若爾,經(jīng)濟(jì)科學(xué)出版社《博弈論—矛盾沖突分析》RogerB.Myerson,中國(guó)經(jīng)濟(jì)出版社《博弈論基礎(chǔ)》Gibbons,R1992PricetonUniv.Press《博弈論與信息經(jīng)濟(jì)學(xué)》張維迎,北京大學(xué)出版社《博弈論》施錫銓上海財(cái)經(jīng)大學(xué)出版社《經(jīng)濟(jì)博弈論》謝識(shí)予,復(fù)旦大學(xué)出版社著名經(jīng)濟(jì)學(xué)家泰勒爾(JeanTirole)說(shuō):“正如理性預(yù)期使宏觀經(jīng)濟(jì)學(xué)發(fā)生革命一樣,博弈論廣泛而深遠(yuǎn)地改變了經(jīng)濟(jì)學(xué)家的思維方式”如果情況確實(shí)如此,對(duì)今天的經(jīng)濟(jì)學(xué)家來(lái)說(shuō),不懂得博弈論顯然是不行了。博弈論為何如此熱門?諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)偏愛(ài)博弈論研究1994年諾貝爾經(jīng)濟(jì)學(xué)授予約翰·納什
約翰·海薩尼
萊因哈德·澤爾騰
1996年諾貝爾經(jīng)濟(jì)學(xué)授予威廉·維克瑞詹姆斯·莫里斯2001年諾貝爾經(jīng)濟(jì)學(xué)授予喬治.A.阿克洛爾夫A.斯潘塞約瑟夫.E.斯蒂格尼茲2005諾貝爾經(jīng)濟(jì)學(xué)授予羅伯特·奧曼托馬斯·謝林2007年:諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予赫維茨(Hurwicz)馬斯金(Maskin)梅耶森(Myerson)2012年:諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予埃爾文·羅斯(AlvinRoth)羅伊德·夏普利(LloydShapley)。埃爾文·羅斯(AlvinE.Roth)
羅伊德·夏普利(LloydS.Shapley)他們的貢獻(xiàn):
穩(wěn)定的匹配理論與市場(chǎng)設(shè)計(jì)的實(shí)踐經(jīng)濟(jì)學(xué)是研究資源最優(yōu)配置問(wèn)題的,而真實(shí)世界里配置資源的方式多種多樣,市場(chǎng)、價(jià)格機(jī)制是經(jīng)濟(jì)學(xué)研究最多的。但是有一些市場(chǎng)里頭,價(jià)格的作用受到多種限制,可能是來(lái)自法律等正式規(guī)則的限制,也可能是來(lái)自習(xí)俗或倫理道德等非正式制度的限制。例如:找對(duì)象,不是價(jià)高者得,而是情投意合才能結(jié)成夫妻。問(wèn)題是情投意合這種分配方式講究“配對(duì)”,而且這種配對(duì)最好還需要“穩(wěn)定”,麻煩的是還不能依靠傳統(tǒng)的價(jià)格機(jī)制,在這種情況下經(jīng)濟(jì)學(xué)應(yīng)該怎么辦呢?2012年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)就授給了夏普利(L.S.Shapley)和羅斯(A.E.Roth),表彰他們?cè)凇癴orthetheoryofstableallocationsandthepracticeofmarketdesign”夏普利與夏普利值我們熟悉的夏普利,是他在合作博弈上所做的貢獻(xiàn),即夏普利值。在前六次的諾獎(jiǎng)獲得者中,他們都可以說(shuō)是在非合作博弈領(lǐng)域的大家(我們這門課實(shí)際上也是討論在非合作博弈理論基礎(chǔ)上的經(jīng)濟(jì)層面的應(yīng)用問(wèn)題),而夏普利則是合作博弈領(lǐng)域的巨頭。所謂非合作和合作博弈的區(qū)分,簡(jiǎn)單來(lái)說(shuō)就是非合作主要是個(gè)體之間的博弈,而合作博弈則處理群體與群體之間的博弈,例如醫(yī)生與醫(yī)院、學(xué)生與學(xué)校這類群體間的博弈。夏普利值也是這個(gè)合作博弈領(lǐng)域最為突出的貢獻(xiàn),不過(guò)有意思的是,這一次的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的貢獻(xiàn)卻沒(méi)有頒給“夏普利值”,而是穩(wěn)定配對(duì)理論。合作博弈
在博弈論中,合作的概念是重要的。我們現(xiàn)在能夠閱讀到的各種版本的博弈論教科書,以及本課程將要介紹的主要是經(jīng)典博弈理論,都是建立在參與人理性的、非合作基礎(chǔ)之上的。事實(shí)上,在非合作博弈理論還沒(méi)有完全建立起來(lái)之前,合作博弈理論一直是博弈論專家們研究關(guān)注的領(lǐng)域。合作博弈的概念是馮·諾依曼(JohnvonNeumann)和摩根斯頓(OskarMorgenstern)在他們的《博弈論與經(jīng)濟(jì)行為》(1944)一書中首次提出。到50年代,合作博弈理論的發(fā)展到達(dá)鼎盛時(shí)期,其中包括納什(Nash,1950)和夏普利(Shapley,1953)的“討價(jià)還價(jià)模型”,Gillies和Shapley(1953)關(guān)于合作博弈中的“核”的概念,以及其他一些人的貢獻(xiàn)。一般觀點(diǎn)認(rèn)為合作博弈理論要比非合作博弈理論更為重要,因?yàn)?,如果人們的合作是有利可圖的,參與博弈的理性人怎么會(huì)放棄合作而采取非合作態(tài)度呢?我們知道,在任何真實(shí)的博弈局勢(shì)中,無(wú)論合作博弈還是非合作博弈,如果我們仔細(xì)地考察人們?yōu)檫_(dá)成一個(gè)協(xié)議而能做什么的話,那么原則上我們就應(yīng)該有可能把它模型化,然后通過(guò)分析這個(gè)博弈的均衡(解)來(lái)預(yù)測(cè)其結(jié)果。不幸得很,在合作博弈理論中,各種合作博弈解的概念是針對(duì)不同情況、不同理由給出了不同的解釋,如核心(core)、沙普利值(Shapelyvalue)、核仁(nucleolus)、核(kernel)、談判集以及穩(wěn)定集(stableset)等等,但沒(méi)有一種解能夠具有納什均衡在非合作博弈中具有的核心地位,也許正是這一點(diǎn)使合作博弈理論的應(yīng)用研究受到了極大地挑戰(zhàn)。不僅如此,在現(xiàn)實(shí)社會(huì)中,競(jìng)爭(zhēng)是一切社會(huì)、經(jīng)濟(jì)關(guān)系的根本基礎(chǔ),不合作是基本的,而合作常常又是令人難以捉摸的、是有條件的和暫時(shí)的。即便如此,人們并沒(méi)有放棄對(duì)合作博弈理論研究的興趣。因?yàn)?,在現(xiàn)實(shí)社會(huì)中,確實(shí)存在有很多類似于“為共同目的而一起行動(dòng)”的合作問(wèn)題,如各種形式的聯(lián)盟。聯(lián)盟通常是那些有著共同利益的一群(兩個(gè)或兩個(gè)以上)人,為了試圖增進(jìn)他們的共同利益一起行動(dòng)所組成的集團(tuán)如個(gè)體廠商為了獲得更高利潤(rùn),期待通過(guò)集團(tuán)形成賣方壟斷;消費(fèi)者為了尋求更低的價(jià)格,期待通過(guò)集團(tuán)形成買方壟斷;工人們?yōu)榱说玫礁叩墓べY待遇,期待通過(guò)工會(huì)形成討價(jià)還價(jià)的勢(shì)力等等。以夏普利值為例來(lái)看合作問(wèn)題例題1假定某議會(huì)共有100個(gè)席位,議員分屬4個(gè)黨派:紅黨43席,藍(lán)黨33席,綠黨16席,白黨8席;假定對(duì)于一般議題的任何提案,議會(huì)實(shí)行一人一票并且多數(shù)通過(guò)的投票規(guī)則。假設(shè)由于黨紀(jì)的約束,議員對(duì)于任何議題,都只能按照黨的意志投票。議會(huì)共有4個(gè)“議會(huì)黨團(tuán)”,每1個(gè)議會(huì)黨團(tuán),都有可能面對(duì)其他3個(gè)議會(huì)黨團(tuán)組成的各種可能的聯(lián)盟。其他3個(gè)議會(huì)黨團(tuán)的各種聯(lián)盟組合,一共有7種:一種是3個(gè)議會(huì)黨團(tuán)各自成“團(tuán)”有3個(gè)聯(lián)盟一種是3個(gè)議會(huì)黨團(tuán)兩兩抱團(tuán)有3個(gè)聯(lián)盟一種是3個(gè)議會(huì)黨團(tuán)抱成一團(tuán)有1個(gè)聯(lián)盟每個(gè)黨團(tuán)面對(duì)其他3個(gè)黨可能組成的聯(lián)盟三個(gè)聯(lián)盟兩兩聯(lián)盟兩兩聯(lián)盟兩兩聯(lián)盟單獨(dú)聯(lián)盟單獨(dú)聯(lián)盟單獨(dú)聯(lián)盟紅黨43席藍(lán)綠白57藍(lán)綠49藍(lán)白41綠白24藍(lán)33綠16白8藍(lán)黨33席紅綠白67紅綠59紅白51綠白24紅43綠16白8綠黨16席紅藍(lán)白84紅藍(lán)76紅白51藍(lán)白41紅43藍(lán)33白8白黨8席紅藍(lán)綠92紅藍(lán)76紅綠59藍(lán)綠49紅43藍(lán)33綠16面對(duì)其他3個(gè)議會(huì)黨團(tuán)所有7種情形的聯(lián)盟,我們要看看有幾種情形他成為決定性的議會(huì)黨團(tuán),即加入聯(lián)盟就能夠讓聯(lián)盟的議案通過(guò)不加入聯(lián)盟就可以阻止聯(lián)盟的議案通過(guò),并且把成為決定性議會(huì)黨團(tuán)的數(shù)目叫做這個(gè)議會(huì)黨團(tuán)的“權(quán)力指數(shù)”。計(jì)算4個(gè)黨派在議會(huì)的“權(quán)力指數(shù)”權(quán)力指數(shù):即在不同情況他加入或者退出一個(gè)投票聯(lián)盟足以改變投票結(jié)果的情況是多少。先看紅黨:有43席,可能面對(duì)的是7種情況:藍(lán)綠白聯(lián)盟57票藍(lán)綠聯(lián)盟49票、藍(lán)白聯(lián)盟41票、綠白聯(lián)盟24藍(lán)黨33票、綠黨16票、白黨8票。在這7種情況下,有6種情況他加入聯(lián)盟,聯(lián)盟就會(huì)獲勝、不加入聯(lián)盟,聯(lián)盟就會(huì)失敗,于是我們說(shuō)紅黨的權(quán)力指數(shù)是6。再看藍(lán)黨:有33席,也面對(duì)7種情況:紅綠白聯(lián)盟67票紅綠聯(lián)盟59票、紅白聯(lián)盟51票、綠白聯(lián)盟24票單獨(dú)的紅黨43票、綠黨16票和白黨8票。在這7種情況下,他只有面對(duì)綠白聯(lián)盟24票或者單獨(dú)的紅黨43票這2種情況,才是決定議案是否通過(guò)的議會(huì)黨團(tuán),從而藍(lán)黨的權(quán)力指數(shù)是2。運(yùn)用同樣的方法,可以知道綠黨的權(quán)力指數(shù)是2,白黨的權(quán)力指數(shù)也是2.。結(jié)果是足以讓人口呆目瞪的:在這個(gè)議會(huì)里面,議員數(shù)目33的藍(lán)黨,與議員數(shù)目差不多只有他三分之一的白黨,權(quán)力指數(shù)竟然一樣,都是2。事實(shí)上,上面的例子告訴我們,操縱一項(xiàng)提案是否能夠通過(guò)的“能力”,與議員黨團(tuán)成員數(shù)目,并不成正比。四個(gè)黨的議員數(shù)目之比是43:33:16:8,而“權(quán)力指數(shù)”之比卻是6:2:2:2。夏普利值就是在分析這類問(wèn)題時(shí)建立的概念和有力的工具,其中理論上最容易說(shuō)明的,就是上述議會(huì)黨團(tuán)的權(quán)力指數(shù),其他情況的夏普利值,會(huì)復(fù)雜很多。夏普利值的應(yīng)用非常廣泛比較淺白的應(yīng)用,包括加裝電梯的成本如何在不同樓層的公寓之間分?jǐn)?,以及同一路線上遠(yuǎn)近不同的同事長(zhǎng)期固定合伙乘出租車上下班如何分?jǐn)傑囐M(fèi)等等。上面例子當(dāng)中的權(quán)力指數(shù)是6:2:2:2。如果你喜歡“圓整”的權(quán)力指數(shù),也可以都除以6+2+2+2=12,把它們定義為總和為一的6/12:2/12:2/12:2/12,即1/2:1/6:1/6:1/6。美國(guó)的總統(tǒng)選舉,在各州是贏者通吃的,一個(gè)州的多數(shù)選民選A君,那么這個(gè)州的選舉團(tuán)里面的每一個(gè)人,都必須選A君。上述關(guān)于權(quán)力指數(shù)的討論,也有助于讀者理解在各州贏者通吃的這種間接選舉中,選民比較多的候選人何以未必勝出。代議制民主里面有一些這樣的情況。這是關(guān)于合作、投票、分配、合作剩余、夏普利值等的討論。穩(wěn)定的匹配理論嚴(yán)格來(lái)說(shuō),并不是經(jīng)濟(jì)學(xué)家首先提出并在理論上解決這一問(wèn)題的1962年,數(shù)學(xué)家蓋爾(D.Gale)和博弈論學(xué)者夏普利在《美國(guó)數(shù)學(xué)月刊》(AmericanMathematicalMonthly)發(fā)表了一篇名為《大學(xué)錄取和婚姻穩(wěn)定》的文章,首先提出了后來(lái)被稱為蓋爾-夏普利算法的穩(wěn)定配對(duì)(stablematching)問(wèn)題。穩(wěn)定配對(duì)是說(shuō)不存在兩個(gè)人,他們都更中意于彼此、勝過(guò)他們當(dāng)前的配對(duì)者。通俗來(lái)說(shuō),就是你的配偶是你所獲得的最愛(ài)。因?yàn)榫驼麄€(gè)市場(chǎng)而言,如果婚姻市場(chǎng)上有數(shù)量大致相當(dāng)?shù)倪m婚男女,男的知曉所有女的信息,女的也一樣。然后男的對(duì)女的有一個(gè)排序,女的也對(duì)男的排序。接下來(lái)一方發(fā)起求婚,另一方對(duì)照自己的偏好排序表,如果是最愛(ài)的就接受,不是的就拒絕。在交易費(fèi)用為零和配對(duì)時(shí)間不限的情況下,最終蘿卜青菜各有所愛(ài),每個(gè)人總能找到自己的伴侶,并且這種配對(duì)是穩(wěn)定的,即沒(méi)有人想分手,不會(huì)出現(xiàn)出軌的現(xiàn)象。為什么呢?讓我們假設(shè)有X男和Y女出軌了,X與原來(lái)的M女分手,這說(shuō)明X更偏好Y,這違反了預(yù)設(shè)的偏好穩(wěn)定。當(dāng)然這可能意味著X之前沒(méi)有向Y求過(guò)婚,同樣對(duì)Y來(lái)說(shuō)選擇X也意味著更偏好X,但每個(gè)人都是按照自己的偏好排序來(lái)求婚的,就違反了偏好排序。所以如果是穩(wěn)定配對(duì),就不存在出軌現(xiàn)象。在這里,我們應(yīng)該注意到:這其實(shí)和經(jīng)濟(jì)學(xué)對(duì)理性人的偏好穩(wěn)定及偏好可排序假設(shè)沒(méi)有任何區(qū)別,無(wú)非是這里并不是用價(jià)格,而是用配對(duì)來(lái)配置婚姻資源。GS算法(蓋爾-夏普利)對(duì)多人參與的合作博弈如何分配資源的問(wèn)題有重要的貢獻(xiàn)和啟示。羅斯的貢獻(xiàn)對(duì)經(jīng)濟(jì)學(xué)來(lái)說(shuō),不僅僅存在個(gè)體與個(gè)體之間的交換,而且還存在大量群體參與的交換,這個(gè)時(shí)候如何讓供需雙方穩(wěn)定配對(duì),并不是簡(jiǎn)單的事情。從抽象的理論到市場(chǎng)制度的實(shí)際設(shè)計(jì)的發(fā)展,考慮如何匹配不同的市場(chǎng)主體。例如學(xué)生如何與學(xué)校匹配,人體器官的捐獻(xiàn)者如何與需要器官移植的患者匹配。經(jīng)濟(jì)學(xué)家要在這篇數(shù)學(xué)論文發(fā)表差不多20年后,才開(kāi)始將其中的原理逐步應(yīng)用到真實(shí)世界的市場(chǎng)里。而這個(gè)工作最主要的代表者就是羅斯。1984年羅斯的論文發(fā)表了一篇關(guān)于實(shí)習(xí)醫(yī)生的文章,將夏普利的理論應(yīng)用到解釋實(shí)際經(jīng)濟(jì)問(wèn)題中。在醫(yī)學(xué)領(lǐng)域,學(xué)生通常在后幾年學(xué)習(xí)生涯中需要去醫(yī)院實(shí)習(xí)。40年代,美國(guó)的醫(yī)院系統(tǒng)開(kāi)始大規(guī)模發(fā)展,但醫(yī)學(xué)院學(xué)生的數(shù)量很少,醫(yī)院之間的競(jìng)爭(zhēng)導(dǎo)致對(duì)醫(yī)學(xué)院學(xué)生需求的急劇增加,于是很多醫(yī)院就讓學(xué)生提前實(shí)習(xí),甚至在這些學(xué)生還沒(méi)有選定專業(yè)領(lǐng)域的情況下就參加實(shí)習(xí)。但如果學(xué)生拒絕一個(gè)醫(yī)院,往往導(dǎo)致醫(yī)院再去找第二個(gè)學(xué)生就太遲了,因?yàn)榈诙€(gè)人可能已經(jīng)被另一個(gè)醫(yī)院搶走了。市場(chǎng)在這種情況下是極為不穩(wěn)定的,因?yàn)獒t(yī)院往往會(huì)設(shè)定一個(gè)最后申請(qǐng)期限,迫使學(xué)生在不曉得是否還有其他機(jī)會(huì)之前就做出選擇。由于醫(yī)院未能及時(shí)給所有學(xué)生提供機(jī)會(huì),而學(xué)生也未能向所有醫(yī)院提出及時(shí)申請(qǐng),雙方都未能極大化自己的利益。NRMP全國(guó)住院醫(yī)師配對(duì)項(xiàng)目到了1950年代,為了解決這個(gè)問(wèn)題,美國(guó)設(shè)立了一個(gè)集中的清算所(Clearinghouse),也就是全國(guó)住院醫(yī)師配對(duì)項(xiàng)目(NRMP:NationalResidentMatchingProgram)的項(xiàng)目。在1984年的論文中,羅斯發(fā)現(xiàn)這個(gè)清算所采用的就是蓋爾-夏普利算法,從而達(dá)到有效而穩(wěn)定的配對(duì)。市場(chǎng)設(shè)計(jì)跟著這個(gè)發(fā)現(xiàn),羅斯隨后考察了英國(guó)的醫(yī)院和醫(yī)生配對(duì)情況,發(fā)現(xiàn)有些地區(qū)是穩(wěn)定的,而有一些則不然。那么隨之而來(lái)的問(wèn)題就是為什么會(huì)有這些差異呢?原來(lái)英國(guó)不同的地方采用的配對(duì)算法不同,而如何有一個(gè)算法使得配對(duì)穩(wěn)定下來(lái),就成為成功的關(guān)鍵。如何改進(jìn)算法,不僅要利用每一個(gè)市場(chǎng)的信息,也要借助計(jì)算機(jī)技術(shù)的進(jìn)步,將理論和實(shí)際聯(lián)系起來(lái),這促成和發(fā)展了經(jīng)濟(jì)學(xué)的一個(gè)分支:市場(chǎng)設(shè)計(jì)。市場(chǎng)設(shè)計(jì)在拍賣領(lǐng)域得到了最廣泛的應(yīng)用,2007年克拉克獎(jiǎng)得主阿西(S.C.Athey)就是自然資源領(lǐng)域拍賣設(shè)計(jì)的領(lǐng)軍人物。而Google公司的在線廣告拍賣也得到了首席經(jīng)濟(jì)學(xué)家范里安的幫助。醫(yī)生夫婦的問(wèn)題美國(guó)的NRMP項(xiàng)目一開(kāi)始很成功,但隨后又遇上了一個(gè)意想不到的問(wèn)題。那就是醫(yī)生夫婦的問(wèn)題,因?yàn)?950年代中期之后,醫(yī)學(xué)院的女生數(shù)量開(kāi)始增長(zhǎng),這導(dǎo)致了醫(yī)學(xué)院學(xué)生中夫妻學(xué)生數(shù)量也開(kāi)始增長(zhǎng),他們?cè)谡覍?shí)習(xí)機(jī)會(huì)的時(shí)候,總是傾向于在一起,而采用NRMP系統(tǒng)找實(shí)習(xí)的話,兩個(gè)人很可能分開(kāi),因?yàn)橥粋€(gè)醫(yī)院對(duì)兩個(gè)人的排序是有差異的。羅斯新的設(shè)計(jì)這種情況下夫妻學(xué)生檔開(kāi)始繞過(guò)NRMP找工作,這就重新導(dǎo)致了市場(chǎng)的不穩(wěn)定。由于NRMP系統(tǒng)青睞醫(yī)院勝過(guò)學(xué)生,招致了大量的批評(píng)。羅斯在1995年應(yīng)NRMP的要求,重新設(shè)計(jì)了配對(duì)系統(tǒng),加入對(duì)學(xué)生配偶考慮,這項(xiàng)調(diào)整使得清算所穩(wěn)定配對(duì)的功能得以繼續(xù)發(fā)揮。NRMP于1997年采用了羅斯新的設(shè)計(jì),現(xiàn)在每年能為約2萬(wàn)個(gè)學(xué)生有效匹配醫(yī)院實(shí)習(xí)職位。但這里還有一個(gè)問(wèn)題:如果學(xué)生夫妻可以抗拒最初的NRMP項(xiàng)目來(lái)達(dá)到改變項(xiàng)目的目的,那么是不是也有人可以通過(guò)系統(tǒng)地操縱算法來(lái)獲得更好的收益,例如通過(guò)先隱藏自己的真實(shí)偏好并使他人境況變差來(lái)獲得更好的收益。對(duì)市場(chǎng)設(shè)計(jì)而言,最重要的除了穩(wěn)定(stability)之外,還要激勵(lì)兼容(incentivecompatibility),也就是說(shuō)沒(méi)有人有激勵(lì)說(shuō)謊話,這樣除了能真實(shí)揭示出每個(gè)參與者的偏好排序外,也避免了有人系統(tǒng)性地操縱市場(chǎng)。羅斯后來(lái)的工作表明要系統(tǒng)實(shí)現(xiàn)操縱NRMP項(xiàng)目是不可能的,不僅因?yàn)樾碌乃惴ū苊饬藢W(xué)生這種“錯(cuò)誤表達(dá)偏好”的可能,也避免了醫(yī)院系統(tǒng)操縱NRMP項(xiàng)目的可能,因?yàn)槌杀咎?。關(guān)于激勵(lì)兼容的研究,是2007年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主赫維茨、馬斯金和梅耶森的貢獻(xiàn)了。而羅斯后來(lái)的主要工作是將博弈論、經(jīng)驗(yàn)證據(jù)和實(shí)驗(yàn)室研究結(jié)合起來(lái),這個(gè)領(lǐng)域之前的獲獎(jiǎng)?wù)呤?002年的弗農(nóng)·史密斯。我們已經(jīng)知道找對(duì)象和找工作都是雙向配對(duì)的,但是有一些真實(shí)世界的問(wèn)題卻不是雙向的,而是單向的。例如對(duì)器官移植而言,就是完全單向的,病人是等待者,而捐贈(zèng)者捐出之后,最好能又快又好地進(jìn)行移植手術(shù),才能最大化捐贈(zèng)人和受贈(zèng)人的利益。在這個(gè)市場(chǎng)上,等待器官移植的人由于受到法律和道德的限制,不能實(shí)施價(jià)高者得,而且可能實(shí)施起來(lái)的成本也不低,所以必須要有另外的配置資源的方式。那么在器官移植這種問(wèn)題上,如何提高效率呢?市場(chǎng)設(shè)計(jì)在這里也有可為之處夏普利和蓋爾提出了另一種算法,叫做“首位交易循環(huán)”(TTC:toptradingcycle)。TTC機(jī)制除了在器官移植領(lǐng)域廣泛應(yīng)用外,在學(xué)生擇校領(lǐng)域也有廣泛應(yīng)用。TTC是說(shuō)先進(jìn)行之前提到的穩(wěn)定配對(duì),已經(jīng)配對(duì)完成的參與者就從市場(chǎng)中移除。說(shuō)真話機(jī)制這個(gè)簡(jiǎn)單的限定在偏好穩(wěn)定且可以排序的情況下,就導(dǎo)致沒(méi)有人愿意說(shuō)假話掩蓋自己的偏好并試圖操縱市場(chǎng)了,因?yàn)檎f(shuō)真話揭示自己的真實(shí)偏好是唯一優(yōu)勝的策略。在生死攸關(guān)的器官移植問(wèn)題上,這一算法簡(jiǎn)單卻又實(shí)用的保證了配對(duì)穩(wěn)定和資源分配的效率。這里的挑戰(zhàn)有兩個(gè):一是捐贈(zèng)的器官是不是與受助者兼容;二是移除配對(duì)完成的參與者也需要時(shí)間。盡管如此,美國(guó)有大量的州已經(jīng)實(shí)行這一TTC機(jī)制多年,為大量患者帶去了福音。這類市場(chǎng)設(shè)計(jì)可以被推廣到大量?jī)r(jià)格的作用受限的市場(chǎng)里其中最主要的一類應(yīng)用是學(xué)生擇校。學(xué)生要選到自己的理想學(xué)校,而學(xué)校也想挑選最佳學(xué)生,這顯然屬于兩個(gè)群體之間如何最優(yōu)配對(duì)且能穩(wěn)定配對(duì)的問(wèn)題。中國(guó)有不少研究高考擇校問(wèn)題的學(xué)者,已經(jīng)在這方面做了一些探索,比較不同的擇校機(jī)制之間的優(yōu)劣。事實(shí)上,夏普利和后來(lái)的研究者已經(jīng)將蓋爾-夏普利算法做了改進(jìn),也可以被應(yīng)用到價(jià)格起作用的市場(chǎng)中,例如拍賣,尤其是網(wǎng)絡(luò)拍賣,有競(jìng)價(jià),有大量的信息,以及便捷的技術(shù),這個(gè)領(lǐng)域正在產(chǎn)出大量有意思的新問(wèn)題和文章。機(jī)制設(shè)計(jì)理論2007年:諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予赫維茨(Hurwicz)馬斯金(Maskin)梅耶森(Myerson)是因?yàn)樗麄儭盀闄C(jī)制設(shè)計(jì)理論奠定了基礎(chǔ)”。機(jī)制設(shè)計(jì)理論是研究在自由選擇、自愿交換、信息不完全及決策分散化的條件下,能否設(shè)計(jì)一套規(guī)則或制度來(lái)達(dá)到既定目標(biāo)的理論,深遠(yuǎn)地影響了現(xiàn)代經(jīng)濟(jì)學(xué)發(fā)展。從一個(gè)單位的激勵(lì)機(jī)制的設(shè)計(jì),到整個(gè)社會(huì)和國(guó)家的制度設(shè)計(jì),都可以用一個(gè)統(tǒng)一的模型來(lái)考慮。萊昂尼德·赫維奇(被譽(yù)為“機(jī)制設(shè)計(jì)理論之父”)赫維茨早在上世紀(jì)40年代就以研究博弈論出名。他論文《資源配置中的最優(yōu)化與信息效率》,拉開(kāi)“機(jī)制設(shè)計(jì)理論”的序幕;1973年赫維奇在最著名的《美國(guó)經(jīng)濟(jì)評(píng)論》雜志上發(fā)表論文《資源分配的機(jī)制設(shè)計(jì)理論》,奠定了機(jī)制設(shè)計(jì)理論這門學(xué)問(wèn)的框架。埃里克·馬斯金馬斯金最大的一個(gè)貢獻(xiàn)就是對(duì)有一個(gè)委托人兼有許多代理人的情況下,達(dá)到一個(gè)給定的目標(biāo),需要的充分必要條件是什么,這是一個(gè)很了不起的成果。因?yàn)樗@個(gè)理論的前提是任何一個(gè)給定的目標(biāo)。在機(jī)制設(shè)計(jì)理論方面,馬斯金最出名的工作則是“納什均衡可實(shí)施機(jī)制”,為人們尋找可行的規(guī)則提出一種標(biāo)準(zhǔn),被稱為馬斯金定理。之前,莫里斯在1971年發(fā)表了《最優(yōu)所得稅理論的探索》的論文都堪稱這方面的經(jīng)典之作,贏得了1996年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。羅杰·邁爾森
邁爾森最大的貢獻(xiàn)就是奠定了最優(yōu)合同理論的機(jī)制。最優(yōu)合同理論是機(jī)制設(shè)計(jì)的一個(gè)分支。前幾年拿諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的這些人,實(shí)際上是在赫維茨的框架下做?,F(xiàn)年56歲的芝加哥大學(xué)經(jīng)濟(jì)系教授邁爾森開(kāi)發(fā)出了分析選舉的數(shù)學(xué)模型并發(fā)表了70多篇有關(guān)博弈論和其他課題的論文。他在獲獎(jiǎng)當(dāng)天于芝加哥舉行的新聞發(fā)布會(huì)上表示,“我們認(rèn)識(shí)到不僅資源的制約很重要,激勵(lì)的制約也很重要?,F(xiàn)在這些已經(jīng)被理解為經(jīng)濟(jì)學(xué)問(wèn)題的基本組成部分?!睓C(jī)制設(shè)計(jì)思想
“機(jī)制設(shè)計(jì)理論”解答的問(wèn)題,是不同的制度或配置機(jī)制如何發(fā)揮作用?以實(shí)現(xiàn)社會(huì)福利或個(gè)人營(yíng)利之類特定目標(biāo)的最佳效益。機(jī)制設(shè)計(jì)理論可以看作是博弈論和社會(huì)選擇理論的綜合運(yùn)用。所羅門王的故事
《圣經(jīng)》上所羅門王的故事:兩個(gè)女人為爭(zhēng)奪一個(gè)孩子吵到所羅門王那里,都說(shuō)孩子是自己的。所羅門王見(jiàn)她們爭(zhēng)執(zhí)不下,便喝令侍衛(wèi)拿一把劍來(lái),要把孩子劈成兩半,一個(gè)人一半。這時(shí)其中一個(gè)女人趕緊說(shuō):“大王,不要?dú)⑺篮⒆?。把孩子給她吧,我不和她爭(zhēng)了”。所羅門王聽(tīng)了卻說(shuō):“這個(gè)女人才是真的母親,把孩子給她。”假如故事中的假母親和真母親說(shuō)同樣的話,那所羅門王該怎么辦呢?所羅門王可以向其中任一母親(稱為A)提問(wèn)孩子是不是她的。如果A說(shuō)不是她的,那么孩子給另一個(gè)女人(稱為B),GAMEOVER。如果A說(shuō)孩子是她的,那么所羅門王可以接著問(wèn)B是否反對(duì)。如果B不反對(duì),則孩子歸A,GAMEOVER。如果B反對(duì),則所羅門就要她提出一個(gè)賭注,然后向A收取罰金。比較罰金和賭注,如果罰金高于賭注,則孩子給A,她只須交給所羅門王賭注那么多錢,而B(niǎo)要交給他罰金的錢;如果罰金比賭注低,則孩子給B,她給所羅門王賭注的錢,A的罰金也歸他。不難推出,在A是真母親的情形下,她的策略是說(shuō)孩子是她的,然后B不反對(duì)。因?yàn)樗磳?duì)的結(jié)果只會(huì)導(dǎo)致她要多交錢,因?yàn)锳為了得到孩子并避免白白給出罰金,必然會(huì)真實(shí)地根據(jù)孩子對(duì)她的價(jià)值拿出罰金;在A是假母親的情形下,她的策略是承認(rèn)孩子不是她的,因?yàn)槿绻f(shuō)孩子是她的,B必然會(huì)反對(duì),并且B為了得到孩子并少付錢,一定會(huì)真實(shí)出價(jià),而A只有出高出孩子對(duì)她的真正價(jià)值的錢才會(huì)得到孩子,可這就不合乎她的偏好了。“沒(méi)有規(guī)矩,不成方圓”方不方、圓不圓很大程度上取決于“規(guī)矩”的好壞,而如何去評(píng)價(jià)“規(guī)矩”,如何去創(chuàng)造個(gè)好“規(guī)矩”就是機(jī)制設(shè)計(jì)理論研究的課題。某種程度上看,機(jī)制設(shè)計(jì)理論似乎比我們熟知的傳統(tǒng)經(jīng)濟(jì)理論更加抽象和高深,大部分經(jīng)濟(jì)學(xué)家都是習(xí)慣于在一個(gè)“既定框架”下研究各種最優(yōu)化問(wèn)題,而赫維茨等人研究的恰恰就是這個(gè)“既定框架”本身。機(jī)制設(shè)計(jì)是不完全信息下委托代理問(wèn)題
經(jīng)濟(jì)社會(huì)活動(dòng)中,存在著大量一方委托另一方完成特定工作的情況。其特征是委托方利益與被委托方的行為有密切關(guān)系,而且委托方不能直接控制被委托方的行為。只能通過(guò)報(bào)酬等間接影響被委托方的行為。除了有書面合同、協(xié)議,或至少有口頭委托的明顯委托關(guān)系以外,還有大量經(jīng)濟(jì)社會(huì)關(guān)系雖然沒(méi)有明顯的委托關(guān)系,但一方利益與另一方的行為有關(guān),也可以用委托代理理論來(lái)加以研究。當(dāng)對(duì)代理人付出的努力不能進(jìn)行完全的檢驗(yàn),代理人有可能試圖只付出少于他能夠付出的努力時(shí)(偷懶);當(dāng)一個(gè)只根據(jù)行動(dòng)而不兼顧結(jié)果支付報(bào)償?shù)钠跫s建立時(shí),潛在的道德風(fēng)險(xiǎn)立即產(chǎn)生。
委托代理的核心是兩人動(dòng)態(tài)博弈,基本問(wèn)題是代理人問(wèn)題。是指由于代理人目標(biāo)函數(shù)與委托人目標(biāo)函數(shù)不一致,加上存在不確定性和信息不對(duì)稱,代理人可能偏離委托人的目標(biāo)函數(shù),而出現(xiàn)損害委托人收益和非效率現(xiàn)象。就委托人而言,如何設(shè)計(jì)最優(yōu)契約激勵(lì)代理人是問(wèn)題的關(guān)鍵。因此這種問(wèn)題也稱為“激勵(lì)機(jī)制設(shè)計(jì)”或“機(jī)制設(shè)計(jì)”。在非合作博弈的均衡分析理論方面做出了開(kāi)創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。約翰·納什,1928年生于美國(guó)
1994年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)得主在非合作博弈的均衡分析理論方面做出了開(kāi)創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。約翰·海薩尼,1920年生于美國(guó)1994年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)得主在非合作博弈的均衡分析理論方面做出了開(kāi)創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。萊因哈德·澤爾騰,1930年生于德國(guó)1994年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)得主背景馮·諾依曼(VonNeumann),摩根斯坦恩(Morgenstern)(1944),博弈論和經(jīng)濟(jì)行為(TheTheoryofGamesandEconomicBehavior)。標(biāo)志著博弈理論的初步形成Nash(1950,1951)兩篇關(guān)于非合作博弈的重要文章,在非常一般的意義下,定義了非合作博弈及其均衡解,并證明了均衡解的存在。基本上奠定了現(xiàn)代非合作博弈論的基石。他們主要的貢獻(xiàn)1994年:在非合作博弈的均衡分析理論方面做出了開(kāi)創(chuàng)性德貢獻(xiàn)對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響1996年:在信息經(jīng)濟(jì)學(xué)理論領(lǐng)域做出了重大貢獻(xiàn),尤其是不對(duì)稱信息條件下的經(jīng)濟(jì)激勵(lì)理論(莫里斯);在信息經(jīng)濟(jì)學(xué)、激勵(lì)理論、博弈論等方面都做出了重大貢獻(xiàn)(維克瑞)2001年:為不對(duì)稱信息市場(chǎng)的一般理論奠定了基石。他們的理論迅速得到了應(yīng)用,從傳統(tǒng)的農(nóng)業(yè)市場(chǎng)到現(xiàn)代的金融市場(chǎng)。他們的貢獻(xiàn)來(lái)自于現(xiàn)代信息經(jīng)濟(jì)學(xué)的核心部分。
2005年:諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予擁有以色列和美國(guó)雙重國(guó)籍的羅伯特·奧曼和美國(guó)人托馬斯·謝林,以表彰他們運(yùn)用博弈論推進(jìn)了人們對(duì)沖突與合作的理解。2007年:諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予以美國(guó)經(jīng)濟(jì)學(xué)家赫維茨、馬斯金、羅杰-B-邁爾森,以表彰他們激勵(lì)機(jī)制設(shè)計(jì)理論所作出的貢獻(xiàn)與奠定基礎(chǔ)。獲得2001諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)
對(duì)不對(duì)稱信息理論的貢獻(xiàn)獲得2001諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)加利福尼亞大學(xué)GeorgeAkerlof斯坦福大學(xué)MichaelSpence美國(guó)哥倫比亞大學(xué)JosephStiglitz他們?nèi)说呢暙I(xiàn)是提出了當(dāng)買方和賣方具有不對(duì)稱信息時(shí)市場(chǎng)運(yùn)作的理論,這一理論的應(yīng)用非常廣泛,從傳統(tǒng)的農(nóng)業(yè)市場(chǎng)到現(xiàn)代的金融市場(chǎng)均有涵蓋。雖然過(guò)去經(jīng)濟(jì)學(xué)家對(duì)不完全信息早有研究,但他們研究的是更為復(fù)雜的不對(duì)稱信息
奧曼和謝林利用博弈論解決了一個(gè)世紀(jì)難題即為何有的人、組織或國(guó)家在推進(jìn)合作方面表現(xiàn)出色,而另一些人則深受沖突之苦。在核競(jìng)賽盛行的20世紀(jì)50年代后期,謝林出版了《沖突戰(zhàn)略》一書,奠定了博弈論作為社會(huì)科學(xué)的方法論的地位。他指出,沖突中的一方可以通過(guò)自陷絕境從而加強(qiáng)自己的地位;擁有報(bào)復(fù)手段比抵抗手段更重要;難以預(yù)料的報(bào)復(fù)手段比已知的報(bào)復(fù)手段更有效。這些論斷在一些地區(qū)沖突的解決和避免戰(zhàn)爭(zhēng)的斡旋中被證明是正確的。謝林的理論推進(jìn)了博弈論在社會(huì)科學(xué)領(lǐng)域的發(fā)展,并被應(yīng)用于從企業(yè)競(jìng)爭(zhēng)到政治談判的廣泛領(lǐng)域。奧曼的貢獻(xiàn)--在于創(chuàng)造了重復(fù)博弈理論他的理論著重解釋這樣一些問(wèn)題:為何參與者太多合作就變得困難;參與者何時(shí)會(huì)偶爾互動(dòng)一下;何時(shí)這種互動(dòng)會(huì)瓦解等。重復(fù)博弈論解釋了經(jīng)濟(jì)沖突—如價(jià)格戰(zhàn)、貿(mào)易戰(zhàn)的原因,也說(shuō)明了為何一些政府比另一些政府能更好地管理公共資源。重復(fù)博弈理論已被用于從行業(yè)協(xié)會(huì)到有組織犯罪、從勞資談判到國(guó)際貿(mào)易條約等領(lǐng)域。
2007年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)按照亞當(dāng)·斯密的設(shè)想,市場(chǎng)這只看不見(jiàn)的手在理想情境中能有效分配資源。但現(xiàn)實(shí)中總有各種各樣的制度約束,導(dǎo)致市場(chǎng)不能發(fā)揮作用。
1991年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主科斯指出市場(chǎng)存在交易費(fèi)用,不能有效發(fā)揮作用,于是有企業(yè)這樣的機(jī)制作為替代。因此不同類型的制度如何最大化個(gè)人或社會(huì)的福利就成為經(jīng)濟(jì)學(xué)的一個(gè)重要問(wèn)題。這就是激勵(lì)機(jī)制設(shè)計(jì)理論產(chǎn)生的背景。激勵(lì)理論的兩個(gè)方面通常而言,激勵(lì)理論涉及兩個(gè)方面:一個(gè)是最優(yōu)機(jī)制,即機(jī)制的目標(biāo)是最大化個(gè)人的預(yù)期收益。另一個(gè)可以稱為效率機(jī)制,即設(shè)計(jì)者的目標(biāo)不是個(gè)人收益最大化,而是社會(huì)整體的福利最大化。激勵(lì)機(jī)制設(shè)計(jì)理論激勵(lì)機(jī)制設(shè)計(jì)理論不僅在理論上將博弈論引入到新制度經(jīng)濟(jì)學(xué)中,推動(dòng)了理論的發(fā)展;在現(xiàn)實(shí)中,也有助于人們找出有效的交易機(jī)制、管制手段和投票程序,豐富了現(xiàn)實(shí)中可以選擇的經(jīng)濟(jì)制度。各種預(yù)測(cè)雖然都沒(méi)有猜中獲獎(jiǎng)名單,但赫維茨、馬斯金和梅耶森的獲獎(jiǎng)是“意料之外,情理之中”。1.博弈論概述1.1如何描述一個(gè)博弈問(wèn)題1.2優(yōu)勢(shì)策略1.3納什均衡1.4納什均衡應(yīng)用舉例1.5計(jì)算納什均衡1.1如何描述一個(gè)博弈問(wèn)題Case1.guesscoin
-1,11,-11,-1-1,1
正面
反面猜硬幣方蓋硬幣方正面反面
博弈方:蓋硬幣方和猜硬幣方;可選策略:正面和反面;幾乎同時(shí)決策;所得利益
:猜對(duì)者得1元,蓋者輸1元;猜錯(cuò)者輸1元,蓋方得1元。Case2.prisoners’dilemma-1,-1-8,00,-8-5,-5不坦白坦白不坦白坦白囚犯2囚犯1博弈方:
囚犯1、2可選策略:坦白與不坦白幾乎同時(shí)決策所得利益:
若兩人同時(shí)坦白各判5年;若一個(gè)坦白一個(gè)不坦白,坦白放人,不坦白被判8年;若兩人同時(shí)不坦白各被判1年。Case3.boxedpigs5,14,49,-10,0按等待按等待小豬
大豬博弈方:大豬和小豬;可選策略:按和等待;幾乎同時(shí)決策所得利益:按一下按紐會(huì)有10個(gè)豬食進(jìn)槽,但誰(shuí)按誰(shuí)要支付成本2個(gè)單位。若大豬先到,大豬吃9個(gè),小豬吃1個(gè);若同時(shí)到,大豬吃7個(gè),小豬吃3個(gè);若小豬先到,大豬吃6個(gè),小豬吃4個(gè)。Case4.夫妻之爭(zhēng)4,50,01,15,4看足球看芭蕾
看足球看芭蕾夫
妻博弈方:丈夫和妻子;可選策略:看足球和看芭蕾;幾乎同時(shí)決策所得利益Case4.Chickengame
-3,-32,00,20,0進(jìn)退AB進(jìn)
退博弈方:兩個(gè)人A,B;可選策略:進(jìn)或退。決策次序:幾乎同時(shí)決策所得利益:若兩繼續(xù)前進(jìn)則兩敗俱傷;若一方前進(jìn)另一方退下來(lái),前進(jìn)者取得勝利,退下來(lái)者丟面子;若兩人都退下來(lái),兩Case5.石頭剪子布的博弈博弈方1,2;可選策略:石頭、剪子和布;幾乎同時(shí)決策;所得利益:0表示沒(méi)有輸贏;1表示贏;-1表示輸。0,01,-1-1,1-1,10,01,-11,-1-1,10,0博弈方2石頭剪子布博弈方1石頭剪子布Case6無(wú)限策略博弈古諾寡頭模型中(需求函數(shù):p=a-Q,其中Q=q1+q2)兩廠商博弈方可選擇策略:產(chǎn)量q1、q2支付函數(shù)為:u=pq-cq=(p-c)qui=[a-(q1+q2)-c]qi=(a-c)qi-q1qi-q2qii=1,2
如果假設(shè)a=8,c=2,則有
u1=6q1-q1q2-
q12u2=6q2-q1q2-q22 Case7.市場(chǎng)進(jìn)入與阻撓
Player1:在位者Player2:進(jìn)入者
:初始結(jié)Player2有兩個(gè)可選策略:進(jìn)入與不進(jìn)決策結(jié)Player1面臨兩個(gè)可選策略:斗爭(zhēng)與合作(a,b)為支付向量21
不進(jìn)
進(jìn)入斗爭(zhēng)合作
(0,300)(-10,0)(40,50)
BasicfactorsofGamePlayersStrategies&strategiessetOrderofgameInformationPayoff&payofffunctionOutcome&EquilibriumCasesPlayers
決策主體:?jiǎn)稳瞬┺?、兩人博弈和多人博弈可以是自然人或團(tuán)體,如企業(yè)、國(guó)家、OPEC、EU、NATO等目的是通過(guò)選擇行動(dòng)或策略以最大化自己的支付或效用水平重要的是每個(gè)決策主體必須有可供選擇的行動(dòng)或策略和一個(gè)很好定義的偏好函數(shù)而不做決策的被動(dòng)主體只當(dāng)作環(huán)境參數(shù)單人博弈——只有一個(gè)博弈方的博弈例:?jiǎn)稳嗣詫m入口AB出口(獎(jiǎng)金M)A,1B,1右左右左M00擴(kuò)展形Strategies
是博弈中各博弈方可以選擇的行動(dòng)方案,即對(duì)行為或者經(jīng)濟(jì)活動(dòng)水平等等的可能的選擇,或決策內(nèi)容。不同的博弈問(wèn)題中各博弈方可選策略的多少不同,一般分為:有限策略博弈和無(wú)限策略博弈有限策略博弈即策略數(shù)有限,且兩三個(gè)可選策略的博弈最為常見(jiàn);有限策略博弈往往用支付矩陣、擴(kuò)展形法將所有策略、結(jié)果及支付羅列出來(lái)。見(jiàn)博弈的表述式無(wú)限策略博弈其策略數(shù)種往往是一個(gè)連續(xù)統(tǒng),只能用數(shù)集或函數(shù)式加以表示見(jiàn)Case6。博弈的表述式策略式和結(jié)果式矩陣策略式是由每一種可能的策略組合所產(chǎn)生的支付情況,通常用支付矩陣表示;結(jié)果式表明的是每一種可能的行動(dòng)組合產(chǎn)生的支付情況擴(kuò)展式和博弈樹(shù)參與人1參與人2參與人2(參與人1,參與人2)Information
是Player有關(guān)博弈的知識(shí),它是重要的決策依據(jù)和決定博弈結(jié)果的重要因素完美信息與不完美信息完美博弈
N大小
AA
開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)BBBB
(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)
不完美博弈
N大小
AA
開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)BBBB
(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)
開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)不完美博弈
N大小
AA
開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)BBBB
(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)
開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)不完美博弈
N大小
BB
開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)A
(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)
開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)開(kāi)發(fā)不開(kāi)確定性信息與不確定性信息參與人1參與人2參與人2(參與人1,參與人2)對(duì)稱信息與不對(duì)稱信息完全信息與不完全信息TheorderofPlayStaticGamemeans:每個(gè)博弈參與人幾乎同時(shí)行動(dòng)(不是時(shí)間概念)DynamicGamemeans:每個(gè)博弈參與人選擇行動(dòng)或策略有先后之分重要的是后行動(dòng)方通過(guò)觀察先行動(dòng)方的行動(dòng)來(lái)獲取信息,從而使得博弈分析成為預(yù)測(cè)人的行為的一個(gè)強(qiáng)有力的工具RepeatedGame:是指同一個(gè)博弈反復(fù)進(jìn)行所構(gòu)成的博弈過(guò)程構(gòu)成重復(fù)博弈的一次性博弈稱為“原博弈”或“階段博弈”Payoff它是指在一個(gè)特定的策略組合下player得到的確定的效用水平,或者指參與人得到的期望效用水平這是player真正關(guān)心的東西,是player博弈后所得利益他的目標(biāo)就是在自己可以選擇的策略集合里,選擇某個(gè)戰(zhàn)略以最大化自己的期望效用函數(shù)。UtilityFunction如果有n人博弈,令ui為Playeri
的支付,u=(u1,…ui…un)為支付組合payoffprofile,博弈的一個(gè)基本特征是一個(gè)參與人的支付不僅取決于自己的策略選擇,而且取決于所有其他參與人的策略選擇,即ui是所有參與人的策略選擇的函數(shù):
ui=ui(s1,,…si,…sn)
其中si是Playeri
的策略選擇。Outcome&Equilibrium博弈的結(jié)果是所有博弈方所關(guān)心的,如均衡策略組合,均衡行動(dòng)組合,均衡支付組合。均衡是所有參與人的最優(yōu)策略的組合,一般記為S*=(S1*,…,Si*,…,Sn*)
其中,Si*
是Playeri
在均衡情況下的最優(yōu)策略。要做的事后面要討論1.2優(yōu)勢(shì)策略從數(shù)學(xué)上講,就是:囚犯1和囚犯251囚犯1囚犯25-588(-5,-5)8501.3納什均衡個(gè)案多重納什均衡純策略納什均衡隨機(jī)策略的納什均衡強(qiáng)、弱納什均衡個(gè)案:智豬博弈、建模者困境和性別戰(zhàn)Case.boxedpigs5,14,49,-10,0按等待按等待小豬
大豬求解這個(gè)博弈問(wèn)題:1.下劃線法2.重復(fù)剔除嚴(yán)格劣策略納什均衡:(按,等待)這個(gè)博弈有占優(yōu)策略?Case.建模者困境Case.性別戰(zhàn)三帕累托有效博弈的一個(gè)結(jié)果是帕累托有效(Paretoefficient),當(dāng)且僅當(dāng)不存在另一個(gè)能使所有參與人的狀況更好的結(jié)果。囚徒困境可以說(shuō)是一個(gè)存在帕累托改善(或者說(shuō)無(wú)效均衡)的例子。納什均衡是博弈的結(jié)局,它指博弈中每個(gè)局中人均不能因單方面改變自己的策略選擇而獲益。納什均衡是一個(gè)僵局:給定別人不動(dòng)的情況下,沒(méi)有人有興趣動(dòng)。納什均衡可以理解為一種具有自我強(qiáng)制力的協(xié)議,即這種協(xié)議沒(méi)有外加力量保證實(shí)施卻使每個(gè)參與者都自愿遵守,原因就在背叛協(xié)議無(wú)利可圖。NE的哲學(xué)思想
“當(dāng)事人會(huì)自覺(jué)遵守這個(gè)協(xié)議”,等于說(shuō)這個(gè)協(xié)議構(gòu)成一個(gè)NE:即給定別人遵守協(xié)議的情況下,沒(méi)有人有積極性偏離這個(gè)協(xié)議規(guī)定的自己的行動(dòng)準(zhǔn)則如果一個(gè)協(xié)議不構(gòu)成NE,它就不可能自動(dòng)實(shí)施,因?yàn)橹辽儆幸粋€(gè)參與人會(huì)違背這個(gè)協(xié)議,不滿足NE要求,這個(gè)協(xié)議是沒(méi)有意義,這就是NE的哲學(xué)思想。NE的正式定義G={S1,…Sn;u1…un}是個(gè)n人博弈,策略組合s*=(s1*,…,si*,…,sn*)是一個(gè)NE,如果對(duì)每一個(gè)i,si*是給定其他參與人選擇
s-i*=(s1*,…s-1*,si+1*,…sn*)的情況下第i個(gè)參與人的最優(yōu)策略,即:
ui(si*,s-i*)≥ui(si,s-i*)si∈Si,對(duì)所有的i
則s*=(s1*,…,si*,…,sn*)是NE。這是一個(gè)弱納什均衡(weaklyNE)定義。NE有強(qiáng)弱之分StrictorstrongNE,如果給定其他參與人的策略,每一個(gè)參與人的最優(yōu)選擇是唯一的,就是說(shuō),
s*=(s1*,…,si*,…,sn*)是一個(gè)strictNE,當(dāng)只當(dāng)對(duì)于所有的i,si’≠si*,
ui(si*,s-i*)>ui(si’,s-i*)
則s*=(s1*,…,si*,…,sn*)是一個(gè)StrictNE。1.4計(jì)算納什均衡納什均衡是一個(gè)策略組合,也是最優(yōu)策略組合;即在給定條件下,每一個(gè)博弈方最大化自己效用選擇的結(jié)果。如在G={S1,…Sn;u1,…un}中,如果有策略組合(S1*,…,Si*,…,Sn*),其中任一博弈方i的策略Si*都是對(duì)其余博弈方的策略組合
S-i*=(S1*,…,S*i-1,S*i+1…,Sn*)的最佳對(duì)策,則這個(gè)策略組合就是博弈的解。博弈問(wèn)題解法劃線法-有限策略博弈的解法反應(yīng)函數(shù)-無(wú)限策略博弈的解法重復(fù)剔除嚴(yán)格劣策略或嚴(yán)格下策反復(fù)消去法混合策略下列博弈問(wèn)題的解如果以劃線法解上述博弈問(wèn)題,則發(fā)現(xiàn):猜硬幣——無(wú)解囚徒的困境——有唯一穩(wěn)定的解智豬博弈——有一個(gè)解斗雞博弈——有兩個(gè)解但不唯一石頭剪子布的博弈——無(wú)穩(wěn)定解齊威王與田忌賽馬——無(wú)穩(wěn)定解反應(yīng)函數(shù)法古諾寡頭模型中(需求函數(shù):p=a-Q,其中Q=q1+q2)兩廠商為博弈方1,2可選擇策略:產(chǎn)量q1、q2(無(wú)限策略型)支付函數(shù)為:u=pq-cq=(p-c)q如果假設(shè)a=8,c=2,則有
u1(q1,q2)=6q1-q1q2-
q12u2(q1,q2)
=6q2-q1q2-q22 以CournotModel為例這是一個(gè)完全信息的博弈模型Reactionfunction
q1*=R(q2*)=(6-q2*)/2——反應(yīng)函數(shù)
q2*=R(q1*)=(6-q1*)/2——反應(yīng)函數(shù)反應(yīng)函數(shù)——是指當(dāng)支付payoff是策略的多元連續(xù)函數(shù)時(shí):u=u(s1…si…sn),我們可以求得每個(gè)博弈方針對(duì)其他博弈方最佳策略的最佳反應(yīng)構(gòu)成的函數(shù),即通過(guò)du/dsi=o,求出每個(gè)博弈策略Si*=R(S1*,…Si-1*,Si+1*,…Sn*),這就是反應(yīng)函數(shù)。博弈的解——就是各個(gè)反應(yīng)函數(shù)的交點(diǎn)(如果有)古諾博弈解的幾何意義q10q1*q2*E(q1*,q2*)q1*=R(q2*)q2*=R(q1*)q2進(jìn)一步閱讀的例子反應(yīng)函數(shù)的概念和思路可以應(yīng)用到一般的無(wú)限多種策略博弈的求解中,可以使博弈問(wèn)題的解法簡(jiǎn)約如產(chǎn)業(yè)組織理論研究中經(jīng)典的模型:Bertrand雙寡頭模型。它與CournotModel不同的是,該模型中廠商的可選策略是價(jià)格而不是產(chǎn)量。Hotelling價(jià)格競(jìng)爭(zhēng)模型?;旌喜呗砸圆掠矌挪┺臑槔?這是一個(gè)零和博弈,沒(méi)有NE。其顯著的特征是每一個(gè)博弈方都想掌握對(duì)方選擇策略的規(guī)律性,而對(duì)方又不想讓對(duì)方掌握自己特征,他最好的選擇是隨機(jī)選擇策略,即按一定的概率分布選擇自己的策略。在本例中,如果蓋硬幣方以概率p選擇正面,1-p選擇反面,但如果p>1-p或P>1/2,即蓋方出正面多于出反面,在這種情況下,他的期望收益:
E=p·1+(1-p)·(-1)=2(P-1/2)>0
就平均而方,猜方獲利機(jī)會(huì)要多,這樣對(duì)蓋方不利。如何計(jì)算猜硬幣博弈的解?對(duì)蓋方來(lái)說(shuō),最好的方法是設(shè)計(jì)一個(gè)概率分布,使猜方無(wú)法掌握其蓋的規(guī)律性,即使猜方的EU正=EU反,這樣猜方就不會(huì)依據(jù)你對(duì)策略的偏好占到你任何便宜。同樣,猜方也以相同概率隨機(jī)選擇策略。在本博弈中,博弈雙方的決策內(nèi)容都不是確定性的具體策略,而是以一定的概率分布隨機(jī)選擇策略,這樣的決策被稱為隨機(jī)策略或混合策略MixedStrategy。為了區(qū)別,將有確定性的決策內(nèi)容的博弈問(wèn)題中的策略稱為“純策略”,其均衡也為“純策略納什均衡”。混合策略的定義在G={S1,…Sn;u1,…un}中,博弈方i的策略為Si={si1,…sik},則博弈方i以概率分布pi=(pi1,…pik)隨機(jī)選擇其k個(gè)可選擇策略,則這Pi就稱為一個(gè)隨機(jī)策略或混合策略,其中0≤pij≤1,j=1,…k都成立,且pi1+···pik=1.斗雞博弈的混合策略設(shè)A方以概率pA(進(jìn))+pA(退)=1設(shè)B方以概率pB(進(jìn))+pB(退)=1A、B如何選擇PA,PB?對(duì)A方來(lái)說(shuō),他設(shè)計(jì)的概率要使B方在選擇每一種策略時(shí)無(wú)差異:
EB進(jìn)=pA進(jìn)·(-3)+pA退·
(2)
EB退=pA進(jìn)·(0)+pA退·
(0)-3,-32,00,20,0進(jìn)退B
進(jìn)退
A令EB進(jìn)=EB退
-3pA進(jìn)+2pA退=0pA進(jìn)+pA退=1
則pA進(jìn)=0.6,pA退=0.4同理,pB進(jìn)=0.6,pB退=0.4隨機(jī)策略決策的基本原則第一個(gè)原則不能讓對(duì)方知道或猜到自己的選擇,因而必須在決策時(shí)利用隨機(jī)性。第二個(gè)原則他們選擇每種策略的概率一定要恰好使對(duì)方無(wú)機(jī)可乘,即讓對(duì)方無(wú)法通過(guò)有針對(duì)性地傾向某一策略而在博弈中占上風(fēng)。斗雞博弈的隨機(jī)策略均衡在純策略中,NE是一組最優(yōu)策略組合S*=(S1*…Si*…Sn*)如囚徒困境中,(坦白,坦白)是一個(gè)納什均衡,其支付為(-5,-5)。在隨機(jī)策略中,NE也是一組策略組合,但是以概率大小來(lái)選擇相應(yīng)最優(yōu)策略。以斗雞博弈來(lái)看,A方以(0.6、0.4)分別選擇進(jìn)和退,B方也(0.6、0.4)概率分別選擇進(jìn)和退,這就是混合策略的NE。其支付分別為各自期望收益(EA、EB)(-0.6,-0.6):監(jiān)督博弈博弈方:代理人A、委托人P代理商的可選策略:工作W,偷懶S
工資w,工作的花費(fèi)g,且w>g委托人的可選策略:檢查I,不檢查N
委托人檢查的費(fèi)用h,
增加的價(jià)值為v(v>w)假定g>h>0其支付矩陣如圖所示
0,-h
w,-w
w-g,v-w-hw-g,v-w檢查不檢查偷懶工作
代理商委托人監(jiān)督博弈的隨機(jī)策略均衡用下劃線求解,可知本博弈無(wú)純策略NE。設(shè)代理商:偷懶的概率為x,工作概率為1-xp1=(x,1-x)設(shè)委托人:檢查的概率為y,不檢查的概率為1-yp2=(y,1-y)對(duì)代理商來(lái)說(shuō)他設(shè)計(jì)的概率p1=(x,1-x),應(yīng)該使委托人在不同策略選擇下的期望收益相等,即EUPI=EUPN
EUPI=x(-h)+(1-x)(v-w-h)EUPN=x(-w)+(1-x)(v-w)
令EUPI=EUPN,則求出x=h/w同理對(duì)委托人他的概率p2=(y,1-y),也使EUAW=EUAS,則y=g/w因此,本博弈混合策略的NE為(h/w,1-h/w),(g/w,1-g/w)均衡時(shí)的期望
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年Android性能優(yōu)化最佳實(shí)踐分享一點(diǎn)面試小經(jīng)驗(yàn)-android 縮短inflate時(shí)間
- 建筑施工特種作業(yè)-建筑架子工附著式腳手架真題庫(kù)-7
- 森林消防演練題目及答案
- 如皋中考語(yǔ)文題目及答案
- 04《運(yùn)動(dòng)和力的關(guān)系》-2025高中物理水平合格考備考知識(shí)清單+習(xí)題鞏固
- 2023-2024學(xué)年云南省玉溪市高二下學(xué)期期末教學(xué)質(zhì)量檢測(cè)數(shù)學(xué)試卷(解析版)
- 2024-2025學(xué)年山西省部分地市高二上學(xué)期期末考試語(yǔ)文試題(解析版)
- 店面房屋租賃合同范本-房屋店面租賃合同模板-店面租賃合同范本
- 中國(guó)石油新疆油田油氣儲(chǔ)運(yùn)分公司環(huán)境影響后評(píng)價(jià)報(bào)告書
- 上呼吸道感染的治療講課件
- 嵐皋縣某鈦磁鐵礦初步詳查設(shè)計(jì)
- 物業(yè)防盜應(yīng)急預(yù)案
- 2024用于水泥和混凝土中的焚燒飛灰
- 23秋國(guó)家開(kāi)放大學(xué)《液壓與氣壓傳動(dòng)》形考任務(wù)1-2參考答案
- 消防泵房閥門更換施工方案
- 生效的法律文書
- 《路由交換技術(shù)》部署和實(shí)施企業(yè)網(wǎng)絡(luò)互聯(lián)(任務(wù)2)
- 工程量清單及招標(biāo)控制價(jià)編制服務(wù)采購(gòu)實(shí)施方案(技術(shù)標(biāo))
- 汽修廠配件材料管理制度
- 初中畢業(yè)生簡(jiǎn)歷模板
- 云南特崗教師小學(xué)體育歷年真題
評(píng)論
0/150
提交評(píng)論