完全信息動(dòng)態(tài)博弈2_第1頁(yè)
完全信息動(dòng)態(tài)博弈2_第2頁(yè)
完全信息動(dòng)態(tài)博弈2_第3頁(yè)
完全信息動(dòng)態(tài)博弈2_第4頁(yè)
完全信息動(dòng)態(tài)博弈2_第5頁(yè)
已閱讀5頁(yè),還剩51頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

演示文稿完全信息動(dòng)態(tài)博弈目前一頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)(優(yōu)選)完全信息動(dòng)態(tài)博弈目前二頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)博弈的戰(zhàn)略表述案例-房地產(chǎn)開(kāi)發(fā)項(xiàng)目-假設(shè)有A、B兩家開(kāi)發(fā)商市場(chǎng)需求:可能大,也可能小投入:1億假定市場(chǎng)上有兩棟樓出售:需求大時(shí),每棟售價(jià)1.4億,需求小時(shí),售價(jià)7千萬(wàn);如果市場(chǎng)上只有一棟樓需求大時(shí),可賣1.8億需求小時(shí),可賣1.1億目前三頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)博弈戰(zhàn)略表述4000,40008000,00,80000,0不開(kāi)發(fā)開(kāi)發(fā)商A開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)-3000,-30001000,00,10000,0不開(kāi)發(fā)開(kāi)發(fā)商B開(kāi)發(fā)商A開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)開(kāi)發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述目前四頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)博弈的擴(kuò)展式表述擴(kuò)展式表述所“擴(kuò)展”的主要是參與人的戰(zhàn)略空間戰(zhàn)略式表述簡(jiǎn)單地給出參與人有些什么戰(zhàn)略可以選擇,而擴(kuò)展式表述要給出每個(gè)戰(zhàn)略的動(dòng)態(tài)描述:誰(shuí)在什么時(shí)候行動(dòng),每次行動(dòng)時(shí)有些什么具體行動(dòng)方案可供選擇,以及知道些什么此時(shí)的戰(zhàn)略:如果你這樣,我將怎樣目前五頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)博弈的擴(kuò)展式表述要素:參與人集合參與人的行動(dòng)順序參與人的行動(dòng)空間參與人的信息集參與人的支付函數(shù)外生事件(即“自然”的選擇)的概率分布目前六頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)A開(kāi)發(fā)不開(kāi)發(fā)NN大小1/21/2大小1/2BBBB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人(A,B,N)戰(zhàn)略支付參與人集合參與人行動(dòng)順序參與人的行動(dòng)空間參與人的信息集參與人的支付函數(shù)外生事件的概率分布房地產(chǎn)開(kāi)發(fā)博弈結(jié),決策結(jié)結(jié),終點(diǎn)結(jié)枝結(jié),初始結(jié)

信息集結(jié):包括決策結(jié)和終點(diǎn)結(jié)兩類;決策結(jié)是參與人行動(dòng)的始點(diǎn),終點(diǎn)結(jié)是決策人行動(dòng)的終點(diǎn).結(jié)滿足傳遞性和非對(duì)稱性x之前的所有結(jié)的集合,稱為x的前列集P(x),x之后的所有結(jié)的集合稱為x的后續(xù)集T(x)。枝:枝是從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個(gè)枝代表參與人的一個(gè)行動(dòng)選擇.信息集:每個(gè)信息集是決策結(jié)集合的一個(gè)子集,該子集包括所有滿足下列條件的決策結(jié):1每個(gè)決策結(jié)都是同一個(gè)參與人的決策結(jié);2該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié).目前七頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)信息集:房地產(chǎn)博弈IIA

開(kāi)發(fā)不開(kāi)發(fā)

大小大小開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2

B1

B2

B3

B4B在決策時(shí)不確切地知道自然的選擇;B的決策結(jié)由4個(gè)變?yōu)?個(gè)目前八頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)信息集:房地產(chǎn)博弈IIIA

開(kāi)發(fā)不開(kāi)發(fā)

大小大小開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2

B1

B2

B3

B4B知道自然的選擇;但不知道A的選擇(或A、B同時(shí)決策)

目前九頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)信息集:房地產(chǎn)博弈IVN

大小

開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)B1B2

A1A2A3A4目前十頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)博弈擴(kuò)展式表述只包含一個(gè)決策結(jié)的信息集稱為單結(jié)信息集,如果博弈樹(shù)的所有信息都是單結(jié)的,該博弈稱為完美信息博弈。自然總是假定是單結(jié)的,因?yàn)樽匀辉趨⑴c人決策之后行動(dòng)等價(jià)于自然在參與人之前行動(dòng)但參與人不能觀測(cè)到自然的行動(dòng)。不同的博弈樹(shù)可以代表相同的博弈,但是有一個(gè)基本規(guī)則:一個(gè)參與人在決策之前知道的事情,必須出現(xiàn)在該參與人決策結(jié)之前。目前十一頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)AB坦白抵賴BBAA坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)坦白抵賴坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)囚徒困境博弈的擴(kuò)展式表述囚徒困境博弈的擴(kuò)展式表述目前十二頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)智豬博弈的擴(kuò)展式表述?5,14,49,-10,0等待小豬大豬按等待按案例2-智豬博弈目前十三頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)動(dòng)態(tài)博弈的戰(zhàn)略的表述戰(zhàn)略:參與人在給定信息集的情況下選擇行動(dòng)的規(guī)則,它規(guī)定參與人在什么情況下選擇什么行動(dòng),是參與人的“相機(jī)行動(dòng)方案”。在靜態(tài)博弈中,戰(zhàn)略和行動(dòng)是相同的。作為一種行動(dòng)規(guī)則,戰(zhàn)略必須是完備的。目前十四頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)性別戰(zhàn)博弈的擴(kuò)展式表述男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx’女足球芭蕾男男芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx’目前十五頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)擴(kuò)展式表述博弈的戰(zhàn)略足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx男的策略:{足球,芭蕾}選擇足球;還是選擇芭蕾。女的策略:(足球,芭蕾),(芭蕾,足球)(芭蕾,芭蕾),(足球,足球)1、追隨策略:他選擇什么,我就選擇什么2、對(duì)抗策略:他選擇什么,我就偏不選什么3、芭蕾策略:不管他選什么,我都選芭蕾;4、足球策略:不管他選什么,我都選足球。策略即:如果他選擇什么,我就怎樣行動(dòng)的相機(jī)行動(dòng)方案。在擴(kuò)展式博弈里,參與人是相機(jī)行事,即“等待”博弈到達(dá)一個(gè)自己的信息集(包含一個(gè)或多個(gè)決策結(jié))后,再采取行動(dòng)方案。目前十六頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)擴(kuò)展式表述博弈的納什均衡若A先行動(dòng),B在知道A的行動(dòng)后行動(dòng),則A有一個(gè)信息集,兩個(gè)可選擇的行動(dòng),戰(zhàn)略空間為:(開(kāi)發(fā),不開(kāi)發(fā));B有兩個(gè)信息集,四個(gè)可選擇的行動(dòng),B有四個(gè)純戰(zhàn)略:開(kāi)發(fā)策略:不論A開(kāi)發(fā)不開(kāi)發(fā),我開(kāi)發(fā);追隨策略:A開(kāi)發(fā)我開(kāi)發(fā),A不開(kāi)發(fā)我不開(kāi)發(fā);對(duì)抗策略:A開(kāi)發(fā)我不開(kāi)發(fā),A不開(kāi)發(fā)我開(kāi)發(fā);不開(kāi)發(fā)策略不論A開(kāi)發(fā)不開(kāi)發(fā)我不開(kāi)發(fā),簡(jiǎn)寫為:(開(kāi)發(fā),開(kāi)發(fā)),(開(kāi)發(fā),不開(kāi)發(fā)),(不開(kāi)發(fā),開(kāi)發(fā)),(不開(kāi)發(fā),不開(kāi)發(fā)),括號(hào)內(nèi)的第一個(gè)元素對(duì)應(yīng)A選擇“開(kāi)發(fā)”時(shí)B的選擇,第二個(gè)元素對(duì)應(yīng)A選擇“不開(kāi)發(fā)”時(shí)B的選擇。A開(kāi)發(fā)不開(kāi)發(fā)BB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(-3,-3)(1,0)(0,1)(0,0)不開(kāi)發(fā)xx’什么是參與人的戰(zhàn)略?目前十七頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)擴(kuò)展式-3,-3-3,-31,01,00,10,00,10,0{開(kāi)發(fā),開(kāi)發(fā)}{開(kāi)發(fā),不開(kāi)發(fā)}{不開(kāi)發(fā),開(kāi)發(fā)}{不開(kāi)發(fā),不開(kāi)發(fā)}開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)商B開(kāi)發(fā)商A戰(zhàn)略式A開(kāi)發(fā)不開(kāi)發(fā)BB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(-3,-3)(1,0)(0,1)(0,0)不開(kāi)發(fā)xx’路徑在擴(kuò)展式博弈中,所有n個(gè)參與人的一個(gè)純戰(zhàn)略組合決定了博弈樹(shù)上的一個(gè)路徑。(開(kāi)發(fā),{不開(kāi)發(fā),開(kāi)發(fā)})決定了博弈的路徑為A—開(kāi)發(fā)—B—不開(kāi)發(fā)--(1,0)(不開(kāi)發(fā),{開(kāi)發(fā),開(kāi)發(fā)})決定了路徑:?目前十八頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)課堂練習(xí):

參與人1(丈夫)和參與人2(妻子)必須獨(dú)立決定出門時(shí)是否帶傘。他們知道下雨和不下雨的可能性均為50%,支付函數(shù)為:如果只有一人帶傘,下雨時(shí)帶傘者的效用為-2.5,不帶傘者的效用為-3;不下雨時(shí)帶傘的效用為-1,不帶的效用為0;如兩人都不帶傘,下雨時(shí)每人的效用為-5,不下雨時(shí)每人的效用為1;給出下列四種情況下的擴(kuò)展式及戰(zhàn)略式表述:(1)兩人出門前都不知道是否會(huì)下雨;并且兩人同時(shí)決定是否帶傘(即每一方在決策時(shí)都不知道對(duì)方的決策);(2)兩人在出門前都不知道是否會(huì)下雨,但丈夫先決策,妻子觀察到丈夫是否帶傘后才決定自己是否帶傘;(3)丈夫出門前知道是否會(huì)下雨,但妻子不知道,但丈夫先決策,妻子后決策;(4),同(3),但妻子先決策,丈夫后決策.目前十九頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)完全信息動(dòng)態(tài)博弈-子博弈完美納什均衡

澤爾騰(1965)考慮下列問(wèn)題:一個(gè)博弈可能有多個(gè)(甚至無(wú)窮多個(gè))納什均衡,究竟哪個(gè)更合理?納什均衡假定每一個(gè)參與人在選擇自己的最優(yōu)戰(zhàn)略時(shí)假定所有其他參與人的戰(zhàn)略是給定的,但是如果參與人的行動(dòng)有先有后,后行動(dòng)者的選擇空間依賴于前行動(dòng)者的選擇,前行動(dòng)者在選擇時(shí)不可能不考慮自己的行動(dòng)對(duì)后行動(dòng)者的影響。子博弈完美納什均衡的一個(gè)重要改進(jìn)是將“合理納什均衡”與“不合理納什均衡”分開(kāi)。目前二十頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)完全信息動(dòng)態(tài)博弈-子博弈完美納什均衡(舉例)澤爾騰(1965)進(jìn)入者進(jìn)入不進(jìn)入(0,300)在位者合作(40,50)斗爭(zhēng)(-10,0)市場(chǎng)進(jìn)入阻撓博弈樹(shù)特點(diǎn):剔除博弈中包含的不可置信威脅。

承諾行動(dòng)-破釜沉舟-背水一戰(zhàn)給定進(jìn)入者進(jìn)入,剔除(進(jìn)入,斗爭(zhēng)),(進(jìn)入,默許)是唯一的子博弈完美納什均衡不可置信威脅支付函數(shù)行動(dòng)目前二十一頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)子博弈完美納什均衡一個(gè)納什均衡稱為完美納什均衡,當(dāng)只當(dāng)參與人的戰(zhàn)略在每個(gè)子博弈中都構(gòu)成納什均衡,也就是說(shuō),組成完美納什均衡的戰(zhàn)略必須在每一個(gè)子博弈中都是最優(yōu)的。一個(gè)完美納什均衡首先必須是一個(gè)納什均衡,但納什均衡不一定是完美納什均衡。承諾行動(dòng)-當(dāng)事人使自己的威脅戰(zhàn)略變得可置信的行動(dòng)。目前二十二頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)完全信息動(dòng)態(tài)博弈-子博弈完美納什均衡

澤爾騰(1965)澤爾騰引入子博弈完美納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈的一個(gè)合理的預(yù)測(cè)結(jié)果,簡(jiǎn)單說(shuō),子博弈完美納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個(gè)信息集上是最優(yōu)的。目前二十三頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)子博弈完美納什均衡-不可置信威脅美國(guó)普林斯頓大學(xué)古爾教授在1997年的《經(jīng)濟(jì)學(xué)透視》里發(fā)表文章,提出一個(gè)例子說(shuō)明威脅的可信性問(wèn)題:兩兄弟老是為玩具吵架,哥哥老是要搶弟弟的玩具,不耐煩的父親宣布政策:好好去玩,不要吵我,不管你們誰(shuí)向我告狀,我都把你們兩個(gè)關(guān)起來(lái),關(guān)起來(lái)比沒(méi)有玩具更可怕?,F(xiàn)在,哥哥又把弟弟的玩具搶去玩了,弟弟沒(méi)有辦法,只好說(shuō):快把玩具還我,不然我就要去告訴爸爸。哥哥想,你真要告訴爸爸,我是要倒霉的,可是你不告狀不過(guò)沒(méi)有玩具玩,而告了狀卻要被關(guān)禁閉,告狀會(huì)使你的境遇變得更壞,所以你不會(huì)告狀,因此哥哥對(duì)弟弟的警告置之不理。的確,如果弟弟是會(huì)算計(jì)自己利益的理性人,在這樣的環(huán)境下,還是不告狀的好??梢?jiàn),弟弟是理性人,他的告狀威脅是不可置信的。目前二十四頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)子博弈完美納什均衡A開(kāi)發(fā)不開(kāi)發(fā)BB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(-3,-3)(1,0)(0,1)(0,0)不開(kāi)發(fā)(不開(kāi)發(fā),(開(kāi)發(fā),開(kāi)發(fā))),(開(kāi)發(fā),(不開(kāi)發(fā),開(kāi)發(fā)),(開(kāi)發(fā),(不開(kāi)發(fā),不開(kāi)發(fā)))

如果A選擇開(kāi)發(fā),B的最優(yōu)選擇是不開(kāi)發(fā),如果A選擇不開(kāi)發(fā),B的最優(yōu)選擇是開(kāi)發(fā),A預(yù)測(cè)到自己的選擇對(duì)B的影響,因此開(kāi)發(fā)是A的最優(yōu)選擇。子博弈完美納什均衡結(jié)果是:A選擇開(kāi)發(fā),B選擇不開(kāi)發(fā)。xx’

對(duì)于(不開(kāi)發(fā),(開(kāi)發(fā),開(kāi)發(fā))),這個(gè)組合之所以構(gòu)成納什均衡,是因?yàn)锽威脅不論A開(kāi)發(fā)還是不開(kāi)發(fā),他都將選擇開(kāi)發(fā),A相信了B的威脅,不開(kāi)發(fā)是最優(yōu)選擇,但是A為什么要相信B的威脅呢?畢竟,如果A真開(kāi)發(fā),B選擇開(kāi)發(fā)得-3,不開(kāi)發(fā)得0,所以B的最優(yōu)選擇是不開(kāi)發(fā)。如果A知道B是理性的,A將選擇開(kāi)發(fā),逼迫B選擇不開(kāi)發(fā)。自己得1,B得0,即納什均衡(不開(kāi)發(fā),(開(kāi)發(fā),開(kāi)發(fā)))是不可置信的。因?yàn)樗蕾囉贐的一個(gè)不可置信的威脅。同樣:(不開(kāi)發(fā),不開(kāi)發(fā))也是一個(gè)不可置信威脅,納什均衡(開(kāi)發(fā),(不開(kāi)發(fā),不開(kāi)發(fā)))是不合理的。目前二十五頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)子博弈完美納什均衡澤爾騰引入子博弈完美納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈的一個(gè)合理的預(yù)測(cè)結(jié)果,簡(jiǎn)單說(shuō),子博弈完美納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個(gè)信息集上是最優(yōu)的。什么是子博弈,什么是子博弈完美納什均衡?有沒(méi)有更好的方法找到子博弈完美納什均衡?目前二十六頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)子博弈由一個(gè)決策結(jié)x和所有該決策結(jié)的后續(xù)結(jié)T(x)(包括終點(diǎn)結(jié))組成,它滿足下列條件:(1)x是一個(gè)單結(jié)信息集;(2)子博弈不改變?cè)┺牡男畔⒓椭Ц断蛄孔硬┺臈l件1說(shuō)的是一個(gè)子博弈必需從一個(gè)單結(jié)信息集開(kāi)始。即:(1)當(dāng)且僅當(dāng)決策者在原博弈中確切地知道博弈進(jìn)入一個(gè)特定的決策結(jié)時(shí),該決策結(jié)才能作為一個(gè)子博弈的開(kāi)始。(2)如果一個(gè)信息集包含兩個(gè)以上決策結(jié),沒(méi)有任何一個(gè)決策結(jié)可以作為子博弈的初始結(jié)。A

開(kāi)發(fā)不開(kāi)發(fā)

大小大小開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2B1B2B3B4A

開(kāi)發(fā)不開(kāi)發(fā)

大小大小開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2

B1

B2

B3

B4條件2說(shuō)的是,子博弈的信息集和支付向量都直接繼承自原博弈,并不會(huì)發(fā)生任何變化。這意味著子博弈不能分割原博弈的信息集。A

開(kāi)發(fā)不開(kāi)發(fā)

大小大小開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2

B1

B2

B3

B4目前二十七頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)完全信息動(dòng)態(tài)博弈-子博弈完美納什均衡

澤爾騰(1965)不開(kāi)發(fā)A開(kāi)發(fā)不開(kāi)發(fā)BB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(1,0)(0,1)(0,0)(-3,-3)xx’不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)(1,0)(-3,-3)x開(kāi)發(fā)(0,1)(0,0)x’子博弈I子博弈II房地產(chǎn)開(kāi)發(fā)博弈找出房地產(chǎn)開(kāi)發(fā)博弈的子博弈(不開(kāi)發(fā),(開(kāi)發(fā),開(kāi)發(fā))),(開(kāi)發(fā),(不開(kāi)發(fā),開(kāi)發(fā)),(開(kāi)發(fā),(不開(kāi)發(fā),不開(kāi)發(fā)))目前二十八頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)完全信息動(dòng)態(tài)博弈-子博弈完美納什均衡

澤爾騰(1965)子博弈完美納什均衡:擴(kuò)展式博弈的戰(zhàn)略組合是一個(gè)子博弈完美納什均衡,如果:(1)它是原博弈的納什均衡;(2)它在每一個(gè)子博弈上給出納什均衡。目前二十九頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)A開(kāi)發(fā)不開(kāi)發(fā)BB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(1,0)(0,1)(0,0)(-3,-3)xx’房地產(chǎn)開(kāi)發(fā)博弈開(kāi)發(fā)不開(kāi)發(fā)(1,0)(-3,-3)x開(kāi)發(fā)(0,1)(0,0)x’子博弈I子博弈II(不開(kāi)發(fā),(開(kāi)發(fā),開(kāi)發(fā))),(開(kāi)發(fā),(不開(kāi)發(fā),開(kāi)發(fā)),(開(kāi)發(fā),(不開(kāi)發(fā),不開(kāi)發(fā)))在c上構(gòu)成均衡,在b上不構(gòu)成;在b和c上都構(gòu)成在b上構(gòu)成均衡,在c上不構(gòu)成完全信息動(dòng)態(tài)博弈-子博弈完美納什均衡

澤爾騰(1965)不開(kāi)發(fā)

判斷下列均衡結(jié)果哪個(gè)構(gòu)成子博弈完美納什均衡?不開(kāi)發(fā)bc目前三十頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)子博弈精煉納什均衡可信性問(wèn)題子博弈和逆向歸納法子博弈精煉納什均衡應(yīng)用舉例有同時(shí)選擇的兩階段動(dòng)態(tài)博弈目前三十一頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)可信性:開(kāi)金礦博弈

甲在開(kāi)采一價(jià)值4萬(wàn)元的金礦時(shí)缺1萬(wàn)元資金,而乙正好有1萬(wàn)元資金可以投資。甲希望乙能將1萬(wàn)元資金借給自己用于開(kāi)礦,并許諾在采到金子后與乙對(duì)半分成,乙是否該將錢借給甲呢?目前三十二頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)開(kāi)金礦I——無(wú)法律的博弈

借不借

分不分(2,2)(0,4)(1,0)目前三十三頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)開(kāi)金礦II——有法律保障的博弈

借不借

分不分(2,2)

打不打(1,0)(0,4)(1,0)目前三十四頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)逆向歸納法開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(-3,-3)(1,0)(0,1)(0,0)ABB房地產(chǎn)開(kāi)發(fā):需求小逆向歸納法就是從動(dòng)態(tài)博弈的最后一個(gè)階段或最后一個(gè)子博弈開(kāi)始,逐步向前倒推以求解動(dòng)態(tài)博弈的方法。目前三十五頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)122左右ABCD(3,1)(5,6)(4,2)(2,7)h1h12h22122左右BD(5,6)(2,7)h1h12h2212左B(5,6)h1h12目前三十六頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)用逆向歸納法求解的子博弈完美納什均衡也要求“所有的參與人是理性的”是共同知識(shí)。如果博弈由多個(gè)階段組成,則從逆向歸納法得到的均衡可能并不非常令人信服。目前三十七頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)子博弈精煉納什均衡擴(kuò)展式博弈的戰(zhàn)略組合s*=(s1*,…,si*,…,sn*)是一個(gè)子博弈精煉納什均衡,如果:(1)它是原博弈的納什均衡;(2)它在每一個(gè)子博弈上給出納什均衡。一個(gè)戰(zhàn)略組合是一個(gè)子博弈精煉納什均衡,當(dāng)只當(dāng)它在每一個(gè)子博弈上都構(gòu)成一個(gè)納什均衡目前三十八頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)子博弈精煉納什均衡應(yīng)用舉例斯坦克爾伯格(Stackelberg)寡頭競(jìng)爭(zhēng)模型勞資博弈討價(jià)還價(jià)博弈目前三十九頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)Stackelberg寡頭競(jìng)爭(zhēng)模型一個(gè)市場(chǎng)上只有兩個(gè)企業(yè),他們的行動(dòng)都是選擇產(chǎn)量,但行動(dòng)有先后順序。企業(yè)1(領(lǐng)頭企業(yè),Leader)首先選擇產(chǎn)量q10;企業(yè)2(尾隨企業(yè),F(xiàn)ollower)觀測(cè)到q1,然后選擇自己的產(chǎn)量q20。設(shè)總產(chǎn)量Q=q1+q2,兩個(gè)企業(yè)有相同的不變單位成本c0,需求函數(shù)P(Q)=a-Q=a-(q1+q2)。問(wèn)題:兩個(gè)企業(yè)應(yīng)如何決策?目前四十頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)庫(kù)諾特模型與斯氏模型比較庫(kù)諾特模型均衡結(jié)果:q1*=q2*=1/3(a-c)q1*+q2*=2/3(a-c)1*=2*=1/9(a-c)2斯氏模型均衡結(jié)果:q1*=1/2(a-c)q2*=1/4(a-c)q1*+q2*=3/4(a-c)1*=1/8(a-c)22*=1/16(a-c)2張教材107頁(yè)張教材43頁(yè)目前四十一頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)勞資博弈工會(huì)決定工資水平,但企業(yè)決定雇用多少人。工會(huì)不只追求高工資,還希望被雇人數(shù)多。不喜歡高工資高失業(yè),也不喜歡低工資低失業(yè)。工會(huì)方的效用是工資水平和雇用人數(shù)兩者的函數(shù)u=u(w,L)。工會(huì)的目標(biāo)是最大化總效用假設(shè)收益是勞動(dòng)雇用量的函數(shù)R(L)(邊際效益遞減),再假設(shè)只有勞動(dòng)成本,工廠的利潤(rùn)函數(shù)為π=π(w,L)=R(L)-w×L目前四十二頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)討價(jià)還價(jià)博弈(1)假設(shè)有甲乙兩人就如何分割1萬(wàn)元進(jìn)行談判,并且已定下了如下規(guī)則:首先,由甲提出一個(gè)分割比例,對(duì)此,乙可以接受也可以拒絕;如果乙拒絕,則乙自己應(yīng)提出另一個(gè)方案,讓甲選擇接受與否。如此循環(huán)。在循環(huán)中,只要有任何一方接受對(duì)方的方案博弈就告結(jié)束,而如果方案被拒絕,則被拒絕的方案與以后的討價(jià)還價(jià)過(guò)程不再有關(guān)系。目前四十三頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)討價(jià)還價(jià)博弈(2)每次一方提出一個(gè)方案和另一方選擇是否接受為一個(gè)階段。再假設(shè)討價(jià)還價(jià)每多進(jìn)行一個(gè)階段,由于談判費(fèi)用和利息損失等,雙方的得益都要打一次折扣,折扣率為,0<<1,稱為消耗系數(shù)。如果限制討價(jià)還價(jià)最多只能進(jìn)行三個(gè)階段,到第三階段乙必須接受甲的方案,這就是一個(gè)三階段討價(jià)還價(jià)博弈。目前四十四頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)

接受不接受,出S

乙必須接受討價(jià)還價(jià)博弈(3)甲出S1乙

接受不接受,出S2

甲(S1,10000-S1)[S2,(10000-S2)][2S,2(10000-S)]第一階段第二階段第三階段目前四十五頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)輪流出價(jià)的討價(jià)還價(jià)模型分蛋糕的動(dòng)態(tài)博弈游戲規(guī)則:第一輪由第一個(gè)參與人(小鵑)提出條件,第二個(gè)參與人小明可以接受,從而游戲結(jié)束,也可以不接受,則游戲進(jìn)入第二輪;小明提出條件,小鵑可以接受,從而結(jié)束游戲,也可以不接受,從而進(jìn)入第三輪;蛋糕融化呈線性,游戲結(jié)束,蛋糕融化……第一種情況:假設(shè)博弈只有一步,小鵑提出分配方案,如果小明同意,兩個(gè)人按照約定分蛋糕,如果小明不同意,兩人什么也得不到。結(jié)果會(huì)怎樣?目前四十六頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)輪流出價(jià)的討價(jià)還價(jià)模型第二種情況:桌上放了一個(gè)冰淇淋蛋糕,但兩輪談判過(guò)后,蛋糕將完全融化。博弈結(jié)果如何?第三種情況:桌上的冰淇淋蛋糕在三輪談判后將完全融化,結(jié)果又如何?第四種情況:桌上的冰淇淋蛋糕在四輪談判后將完全融化,或者在五輪談判、六輪……,100輪談判后將完全融化,結(jié)果又如何?

博弈的結(jié)果是:假如“輪數(shù)”是偶數(shù),雙方各得一半,假若輪數(shù)是奇數(shù),則小鵑得到(n+1)/2n;小明得到(n-1)/(2n)目前四十七頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)囚徒的救贖好萊圬大片《肖申克的救贖》是一部很好看的電影,主要內(nèi)容是一個(gè)被冤屈的囚犯如何憑著堅(jiān)定的信念和聰明才智逃出牢房。我們的“囚犯”也可以通過(guò)好的策略合作,擺脫“困境”的詛咒。目前四十八頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)囚徒的救贖-一報(bào)還一報(bào)一報(bào)還一報(bào)能夠贏得競(jìng)賽不是靠打擊對(duì)方,而是靠從對(duì)方引出使雙方都有好處的行為。如果重復(fù)博弈多次,就有報(bào)復(fù)的機(jī)會(huì),這種懲罰的規(guī)則是:人家對(duì)你怎么做,你就對(duì)他怎么做,如果他上次背叛了你,你這次背叛他,如果上次他與你合作,你這次就選擇與他合作。艾克謝羅德認(rèn)為,一報(bào)還一報(bào)體現(xiàn)了這個(gè)策略符合四個(gè)優(yōu)點(diǎn):清晰、善意、報(bào)復(fù)性和寬恕性。這一法則不會(huì)引發(fā)作弊,所以是善意的;它不會(huì)讓作弊者逍遙法外,所以是報(bào)復(fù)的;它不會(huì)長(zhǎng)時(shí)間懷恨在心,只要作弊者改正,就愿意恢復(fù)合作,所以是寬恕的。一報(bào)還一報(bào)從自己的不可欺負(fù)性得到好處,還放棄了占他人便宜的可能性目前四十九頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)囚徒的救贖重復(fù)囚徒困境的幾個(gè)建議:1、不要嫉妒2、不要首先背叛3、對(duì)合作和背叛都要給予回報(bào)4、不要耍小聰明目前五十頁(yè)\總數(shù)五十六頁(yè)\編于二點(diǎn)旅行者困境-做人不要太精明哈佛大學(xué)巴羅教授:兩個(gè)旅行者從一個(gè)以生產(chǎn)細(xì)瓷花瓶聞名的地方旅

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論