版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
完全信息動(dòng)態(tài)博弈第一頁(yè),共五十七頁(yè),2022年,8月28日4.1子博弈精煉納什均衡對(duì)于動(dòng)態(tài)博弈模型而言,納什均衡是否為該博弈結(jié)果的合理預(yù)測(cè)。市場(chǎng)進(jìn)入問(wèn)題設(shè)房地產(chǎn)市場(chǎng)上有甲乙兩個(gè)開(kāi)發(fā)商。甲開(kāi)發(fā)商首先決定開(kāi)發(fā)還是不開(kāi)發(fā)。乙在了解甲所選擇的行動(dòng)后,再?zèng)Q定開(kāi)發(fā)還是不開(kāi)發(fā)。博弈樹(shù)如圖4-1所示。不開(kāi)發(fā)I11圖4-1不開(kāi)發(fā)開(kāi)發(fā)開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)
I22②①②第二頁(yè),共五十七頁(yè),2022年,8月28日局中人甲的策略集合開(kāi)發(fā)或不開(kāi)發(fā)},局中人乙的策略集合開(kāi)發(fā)或不開(kāi)發(fā)}。支付矩陣為:
該博弈有三個(gè)納什均衡:1.(開(kāi)發(fā),(不開(kāi)發(fā),不開(kāi)發(fā)));2.(不開(kāi)發(fā),(開(kāi)發(fā),開(kāi)發(fā)));3.(開(kāi)發(fā),(不開(kāi)發(fā),開(kāi)發(fā)))。博弈的最終結(jié)局應(yīng)出現(xiàn)哪個(gè)均衡,需要我們分析在這三個(gè)均衡中哪個(gè)合理,哪個(gè)不合理。1(開(kāi)發(fā),(不開(kāi)發(fā),不開(kāi)發(fā)))不是合理的納什均衡。2(不開(kāi)發(fā),(開(kāi)發(fā),開(kāi)發(fā)))也不是合理的納什均衡。3(開(kāi)發(fā),(不開(kāi)發(fā),開(kāi)發(fā)))是合理的納什均衡。第三頁(yè),共五十七頁(yè),2022年,8月28日此均衡表示甲先采取開(kāi)發(fā)的行動(dòng)。乙的策略是,如甲開(kāi)發(fā),他就不開(kāi)發(fā);如甲不開(kāi)發(fā),他就開(kāi)發(fā)。實(shí)際上,如甲開(kāi)發(fā),乙若開(kāi)發(fā)利潤(rùn)為-3,乙若不開(kāi)發(fā)利潤(rùn)為0。因此甲若開(kāi)發(fā),乙不開(kāi)發(fā)為其理性的選擇;如甲不開(kāi)發(fā),乙若開(kāi)發(fā),利潤(rùn)為1,乙若不開(kāi)發(fā),利潤(rùn)為0,因而開(kāi)發(fā)為乙的理性選擇。這說(shuō)明乙的策略(不開(kāi)發(fā),開(kāi)發(fā))是可置信的策略。從此例我們可以看到:在動(dòng)態(tài)博弈中會(huì)出現(xiàn)多重納什均衡的情形,而其中可能包含了不合理的均衡。我們面臨的任務(wù)是如何剔除不合理的均衡除而精煉出合理的均衡。為此,需引入由澤爾騰(ReinhardSelten)提出的子博弈精煉納什均衡的概念。第四頁(yè),共五十七頁(yè),2022年,8月28日子博弈精煉納什均衡(SPE)的定義定義4.1稱(chēng)擴(kuò)展型博弈G的策略組合為子博弈精煉納什均衡,如果它限制在G的每個(gè)子博弈上都是該子博弈的納什均衡。因?yàn)槊總€(gè)博弈都是自己的子博弈。因而子博弈精煉納什均衡必為納什均衡,但納什均衡不一定是子博弈精煉納什均衡。對(duì)于具有完美信息的擴(kuò)展型博弈模型,我們用子博弈精煉納什均衡預(yù)測(cè)博弈的結(jié)果。子博弈精煉納什均衡的存在性定理4.1(Zormello1931,Kuhn1953)有限、完美信息的擴(kuò)展型博弈必存在純策略意義下的子博弈精煉納什均衡。第五頁(yè),共五十七頁(yè),2022年,8月28日逆向歸納法如下假設(shè)已知的擴(kuò)展型博弈共分k步完成。1.對(duì)于第k步上的信息集,選擇行動(dòng),使相應(yīng)的參與人支付值最大,并將由此信息集出發(fā)達(dá)到的終點(diǎn)的支付向量賦值給該信息集對(duì)應(yīng)的決策的節(jié)點(diǎn)。2.利用第k步上節(jié)點(diǎn)的賦值,對(duì)屬于k-1步的信息集所對(duì)應(yīng)的節(jié)點(diǎn)同樣賦值。由于博弈是有限的,必可在有限步內(nèi)使博弈樹(shù)所有節(jié)點(diǎn)都賦與了支付值。3.將具有相同支付值的相鄰接的節(jié)點(diǎn)與終點(diǎn)用粗線連接起來(lái),即可得到已知擴(kuò)展型博弈的子博弈精煉納什均衡。節(jié)點(diǎn)上的賦值給出了從此節(jié)點(diǎn)出發(fā)的子博弈的納什均衡支付結(jié)果。特別,點(diǎn)支付值給出了整個(gè)博弈的子博弈精煉納什均衡的支付結(jié)果。逆向歸納法實(shí)際是從最后階段的博弈開(kāi)始,序貫地求子博弈的納什均衡的過(guò)程。第六頁(yè),共五十七頁(yè),2022年,8月28日例4.1再考慮房地產(chǎn)開(kāi)發(fā)問(wèn)題。博弈樹(shù)上每個(gè)節(jié)點(diǎn)的賦值如圖4-2所示??傻米硬┺木珶捈{什均衡:(開(kāi)發(fā),(不開(kāi)發(fā),開(kāi)發(fā)))。不開(kāi)發(fā)例4.2求如圖4-3所示的擴(kuò)展型博弈的子博弈精煉貝葉斯均衡
不開(kāi)發(fā)I11圖4-2不開(kāi)發(fā)開(kāi)發(fā)開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)
I22①②②I21
圖4-3TU①①②DD’U’RL第七頁(yè),共五十七頁(yè),2022年,8月28日1.對(duì)對(duì)應(yīng)的節(jié)點(diǎn)賦值;2.對(duì)對(duì)應(yīng)的節(jié)點(diǎn)賦值;3.對(duì)對(duì)應(yīng)的節(jié)點(diǎn)賦值,用粗線連接具有相同賦值的節(jié)點(diǎn).如圖4-4所示,子博弈納什均衡為。即局中人1處于信息集上時(shí),選行動(dòng)U,處于信息集上時(shí),選行動(dòng)U’;局中人2在其信息集上選擇行動(dòng)L。兩局中人都執(zhí)行這種策略組合中的相應(yīng)策略,可分別得到支付值2與0。
圖4-4TULR①①②DD’U’第八頁(yè),共五十七頁(yè),2022年,8月28日
例4.3求由圖4-5所示的擴(kuò)展型博弈的子博弈精煉納什均衡1.對(duì)對(duì)應(yīng)的節(jié)點(diǎn)賦值,;對(duì)對(duì)應(yīng)的節(jié)點(diǎn)賦值,;2.對(duì)對(duì)應(yīng)的節(jié)點(diǎn)賦值,。3.用粗線連接具有相同賦值的節(jié)點(diǎn),得到子博弈精煉納什均衡,,,,見(jiàn)圖4-6。I11圖4-5
I22RL’LR’R’①②L’②I11圖4-6
I22L’RL’LR’R’I21①②②第九頁(yè),共五十七頁(yè),2022年,8月28日4.2斯坦克伯格雙寡頭壟斷模型斯坦克伯格(Stackelberg,1934)將古諾模型動(dòng)態(tài)化提出一個(gè)雙寡頭壟斷模型,博弈時(shí)序如下:1.企業(yè)1選擇產(chǎn)量;2.企業(yè)2觀察到,然后選擇產(chǎn)量;企業(yè)的利潤(rùn)函數(shù)為
=,。其中,為市場(chǎng)產(chǎn)品供給總量,為價(jià)格函數(shù),為企業(yè)的成本函數(shù)。設(shè)C為凸函數(shù)。斯坦克爾伯格模型可以歸結(jié)為,,的信息完全且完美的動(dòng)態(tài)博弈模型。故可用逆向歸納法求解子博弈精煉納什均衡,用t表示階段變量第十頁(yè),共五十七頁(yè),2022年,8月28日
.企業(yè)2觀察到企業(yè)1的產(chǎn)量,選擇產(chǎn)量,最大化利潤(rùn)函數(shù),即對(duì)于固定的求解最大化問(wèn)題:由于關(guān)于是凹函數(shù),故1階條件對(duì)于最大化而言是充要條件。由有:(1)
從(1)可解得企業(yè)2關(guān)于企業(yè)1的反映函數(shù)第十一頁(yè),共五十七頁(yè),2022年,8月28日
.企業(yè)1預(yù)期到企業(yè)2的反映函數(shù)選擇
,最大化自己的利潤(rùn)函數(shù),即求解最大化問(wèn)題:
1階條件為:
(2)聯(lián)立(1)、(2)兩式,可解出子博弈精煉納什均衡。特別,當(dāng),。且由(1)式可得企業(yè)2關(guān)于企業(yè)1的反應(yīng)函數(shù)
。第十二頁(yè),共五十七頁(yè),2022年,8月28日由(2)式可得。故斯坦克爾伯格的子博弈精煉納什均衡為:,。當(dāng)兩個(gè)局中人都執(zhí)行該均衡中的策略時(shí),可得均衡結(jié)果,。先動(dòng)優(yōu)勢(shì)特別地,當(dāng)時(shí),兩個(gè)均衡結(jié)果為,。可以算出企業(yè)1的利潤(rùn)為,企業(yè)2的利潤(rùn)為,故有。由于企業(yè)1是首先行動(dòng)的,我們稱(chēng)企業(yè)1具有先動(dòng)優(yōu)勢(shì)。這個(gè)先動(dòng)優(yōu)勢(shì)是在特殊的價(jià)格函數(shù)與成本函數(shù)下得出的,但我們可以證明有關(guān)先動(dòng)優(yōu)勢(shì)的一般性結(jié)論。第十三頁(yè),共五十七頁(yè),2022年,8月28日命題4.1
假設(shè)
.是的嚴(yán)格遞減函數(shù),是的嚴(yán)格遞減函數(shù)。
.反應(yīng)曲線向下傾斜,即嚴(yán)格遞減,。則企業(yè)總是偏好于領(lǐng)頭企業(yè),而不是跟隨企業(yè)。第十四頁(yè),共五十七頁(yè),2022年,8月28日4.3價(jià)格領(lǐng)先博弈模型設(shè)市場(chǎng)上有兩家企業(yè)生產(chǎn)不同質(zhì)的產(chǎn)品,但兩種產(chǎn)品有較強(qiáng)的替代性。一個(gè)企業(yè)首先制定產(chǎn)品價(jià)格,另一個(gè)企業(yè)看到這個(gè)價(jià)格后,再選擇自己產(chǎn)品的價(jià)格,這時(shí)兩個(gè)企業(yè)進(jìn)行動(dòng)態(tài)價(jià)格競(jìng)爭(zhēng)博弈。設(shè)企業(yè)1先行,企業(yè)2跟隨。我們?nèi)钥捎媚嫦驓w納法求子博弈精煉納什均衡。價(jià)格領(lǐng)先博弈模型的子博弈精煉納什均衡
.企業(yè)2已觀察到,選擇,使自己利潤(rùn)最大,即求解最大化問(wèn)題:可解得反應(yīng)函數(shù):。
.在博弈的第1階段,企業(yè)1預(yù)期到企業(yè)2的價(jià)格反應(yīng)函數(shù),選擇價(jià)格,使其利潤(rùn)最大,即求解解得。從而得到子博弈精煉納什均衡以及均衡結(jié)果,第十五頁(yè),共五十七頁(yè),2022年,8月28日價(jià)格領(lǐng)先博弈問(wèn)題的先動(dòng)與后動(dòng)優(yōu)勢(shì)命題4.2
設(shè)關(guān)于遞增,。1.若企業(yè)的反映曲線向下傾斜,價(jià)格領(lǐng)先仍被企業(yè)所偏好。2.如果兩個(gè)企業(yè)具有向上傾斜的反映曲線,若有一個(gè)企業(yè)偏好于價(jià)格領(lǐng)先,另一個(gè)企業(yè)必然偏好于價(jià)格跟隨.3.如果兩個(gè)企業(yè)的成本、需求函數(shù)相同,且反應(yīng)曲線向上傾斜,每個(gè)企業(yè)都偏好價(jià)格跟隨。第十六頁(yè),共五十七頁(yè),2022年,8月28日例4.4
設(shè)在價(jià)格領(lǐng)先博弈模型中,兩個(gè)企業(yè)的需求函數(shù)分別為
,具有相同的成本函數(shù)。
,企業(yè)觀察到了,求,最大化自己的利潤(rùn)函數(shù)由1階條件,可得向上傾斜的反應(yīng)函數(shù),企業(yè)1預(yù)期到,選擇,最大化由1階條件,解得。代入?yún)⑴c人2的價(jià)格反應(yīng)函數(shù)得??捎?jì)算出,。易見(jiàn),,后動(dòng)優(yōu)勢(shì)成立。第十七頁(yè),共五十七頁(yè),2022年,8月28日4.4具有同時(shí)選擇的兩階段動(dòng)態(tài)博弈具有同時(shí)選擇的兩階段動(dòng)態(tài)博弈模型時(shí)序如下:1.局中人1和2同時(shí)從自己的行動(dòng)集合中選擇行動(dòng)和。2.局中人3和4觀察到,然后同時(shí)從自己的行動(dòng)集和中選擇行動(dòng)。3.對(duì)于選出的行動(dòng),局中人獲得支付。該博弈中每個(gè)參與人在選擇行動(dòng)時(shí)對(duì)博弈的歷史完全了解,因而是信息完美的動(dòng)態(tài)博弈模型。在這個(gè)博弈中,參與人1,2的策略與行動(dòng)等同。參與人3,4的策略是的映射,即,,,。許多經(jīng)濟(jì)學(xué)問(wèn)題都符合以上特點(diǎn),下面給出兩個(gè)例子。第十八頁(yè),共五十七頁(yè),2022年,8月28日4.4.1銀行擠兌問(wèn)題設(shè)有兩個(gè)投資者,每人存入銀行一筆存款D,銀行將這筆存款投資于一個(gè)長(zhǎng)期項(xiàng)目。如果在該項(xiàng)目到期之前,存款人提前支取、銀行被迫變現(xiàn),共可收回。這里。如果銀行等待長(zhǎng)期項(xiàng)目到期支取,可回收,。設(shè)有2個(gè)提款日期,,項(xiàng)目到期前,兩個(gè)投資者都提款,則每人可得r;如果只有1個(gè)投資者在t=1提款,他可得D,另一人得2r-D。如果兩人都未在t=1提款,在t=2,兩人都提款,則每人得R;如果只有一個(gè)人在t=2提款,他得2R-D,另一人得D;如果t=2時(shí),兩個(gè)投資者都不提款,銀行向每個(gè)投資者返還R。該博弈的博弈樹(shù)如圖4-7所示.第十九頁(yè),共五十七頁(yè),2022年,8月28日?qǐng)D4-7
不提I21提提提不提不提I12不提提提提不提不提I11①①②②②②第二十頁(yè),共五十七頁(yè),2022年,8月28日用逆向歸納法求解
,考慮子博弈:納什均衡為(提款,提款)。當(dāng),考慮博弈:可得兩個(gè)納什均衡:(提款,提款),(不提款,不提款)。故可得出兩個(gè)子博弈精煉納什均衡路徑(結(jié)果)
1(提款,提款),支付函數(shù)值為;
2(不提,不提,提款,提款),支付值為。第二十一頁(yè),共五十七頁(yè),2022年,8月28日4.4.2關(guān)稅和國(guó)際市場(chǎng)的不完全競(jìng)爭(zhēng)問(wèn)題設(shè)有兩個(gè)國(guó)家,每個(gè)國(guó)家各有1個(gè)企業(yè),分別稱(chēng)為企業(yè)1、企業(yè)2。生產(chǎn)既可內(nèi)銷(xiāo)、又可出口的同質(zhì)產(chǎn)品。兩個(gè)國(guó)家中的消費(fèi)者在各自國(guó)家的市場(chǎng)上購(gòu)買(mǎi)本國(guó)產(chǎn)品或外國(guó)產(chǎn)品,引入以下記號(hào)。1.表示國(guó)家i市場(chǎng)上的商品供給量,。這里表示i國(guó)的內(nèi)銷(xiāo)量;表示j國(guó)出口量。2.。表示市場(chǎng)i的出清價(jià)格。3.為企業(yè)i的總成本。其中表示兩國(guó)相同的生產(chǎn)成本;為i國(guó)的進(jìn)口關(guān)稅,i=1,2。第二十二頁(yè),共五十七頁(yè),2022年,8月28日
該博弈的時(shí)序?yàn)椋篢=1,兩國(guó)政府分別選擇關(guān)稅。T=2 ,兩國(guó)企業(yè)在觀察到關(guān)稅后,決定內(nèi)銷(xiāo)量與出口量。對(duì)于給定的(),企業(yè)i可獲利潤(rùn)
=。上式表明企業(yè)的利潤(rùn)可被劃分為國(guó)內(nèi)利潤(rùn)、國(guó)外利潤(rùn)、關(guān)稅三個(gè)部分。政府作為博弈的局中人,所關(guān)心的社會(huì)福利由政府關(guān)稅收入、企業(yè)利潤(rùn)、消費(fèi)者剩余這三部分組成,i國(guó)福利函數(shù)為:,第二十三頁(yè),共五十七頁(yè),2022年,8月28日用逆向歸納法求解關(guān)稅博弈的子博弈精煉納什均衡T=2,企業(yè)1、2觀察到關(guān)稅與值,企業(yè)i最大化利潤(rùn),即求解最大化問(wèn)題:解得
,同理有
,聯(lián)立以上4個(gè)等式,可解得(1)第二十四頁(yè),共五十七頁(yè),2022年,8月28日T=1時(shí),兩國(guó)同時(shí)選擇關(guān)稅,。政府i選擇,i=1,2,最大化福利函數(shù)。解得均衡關(guān)稅,代入(1)式,得均衡內(nèi)銷(xiāo)產(chǎn)量與出口量由于的解為,因而
不是帕累托最優(yōu)的。因而關(guān)稅博弈也具有囚徒困境問(wèn)題的性質(zhì)。第二十五頁(yè),共五十七頁(yè),2022年,8月28日第五章重復(fù)博弈5.1重復(fù)博弈(repeatedgame)重復(fù)博弈是指同一個(gè)博弈重復(fù)進(jìn)行有限或無(wú)限次。每次被重復(fù)的博弈稱(chēng)之為階段博弈。重復(fù)博弈的定義定義4.2
設(shè)G為階段博弈,用表示將重復(fù)次的重復(fù)博弈。稱(chēng)其為無(wú)限次重復(fù)博弈,t有限稱(chēng)其為有限次重復(fù)博弈。,其中是局中人的貼現(xiàn)因子。在t階段的初期,t階段前的博弈歷史都可被局中人觀察到。局中人在中的支付函數(shù)為階段支付的貼現(xiàn)和,即第二十六頁(yè),共五十七頁(yè),2022年,8月28日
重復(fù)博弈的策略無(wú)論是有限還是無(wú)限的重復(fù)博弈,局中人的策略都是指一個(gè)完整的行動(dòng)計(jì)劃。它給出在任何情況下,局中人所選擇的行動(dòng)。在中,局中人i的一個(gè)策略系指在每一階段t,局中人i的t期前的歷史,到t期行動(dòng)的映射:。這里表示參與人i在t期采取的行動(dòng)。而表示t期的行動(dòng)組合,。重復(fù)博弈的子博弈當(dāng)博弈進(jìn)行到t階段,t前歷史是局中人的共同知識(shí),因而重復(fù)博弈是信息完美的動(dòng)態(tài)博弈。從t階段開(kāi)始直到博弈的終止的博弈稱(chēng)為原博弈的子博弈。在中,由t+1階段開(kāi)始的子博弈為將G重復(fù)T-t次的重復(fù)博弈。到達(dá)t+1階段的歷史有多少,就有多少子博弈。子博弈精煉納什均衡在每個(gè)子博弈上都給出納什均衡。第二十七頁(yè),共五十七頁(yè),2022年,8月28日例5.1
有限次重復(fù)的囚徒困境問(wèn)題。設(shè)階段博弈為由以下支付矩陣給出的囚徒困境問(wèn)題:
子博弈精煉納什均衡我們求的子博弈精煉納什均衡。其博弈樹(shù)如圖4-9第二十八頁(yè),共五十七頁(yè),2022年,8月28日?qǐng)D4-9二次重復(fù)囚徒困境博弈樹(shù)I11DCDDCCCDCDCCCCCCCCCDCDDDDDDDI1.5I14I13I12I22I25I24I21I23DD①①①①①②②②②②②②②②②第二十九頁(yè),共五十七頁(yè),2022年,8月28日利用納什均衡不變性知:有限次重復(fù)的囚徒困境問(wèn)題的子博弈精煉納什均衡是每個(gè)局中人在各種情況下都采取“坦白”的行動(dòng)。上例結(jié)果是以下定理的一個(gè)特例。定理5.1若階段博弈G有唯一的納什均衡,對(duì)任何正整數(shù),
也有唯一的子博弈精煉納什均衡,即各局中人在每個(gè)階段都選擇階段博弈的納什均衡策略。在以上定理中,G有唯一的納什均衡是個(gè)重要條件,如果G的均衡不唯一,則以上定理不一定成立。時(shí),以上定理也不一定成立。第三十頁(yè),共五十七頁(yè),2022年,8月28日蜈蚣博弈(centipedegame)的分析
蜈蚣博弈最早是Rosenthsal于1981年提出來(lái)的,兩個(gè)局中人1和2輪流進(jìn)行選擇,選擇的策略和支付如圖所示。由于形狀上的特點(diǎn),被稱(chēng)為蜈蚣博弈(Rosenthsal,1981)。這個(gè)博弈應(yīng)該成為序貫博弈(sequentialgame))…D(1,1)U12RL(0,3)DDUURLRL(98,98)(97,100)(99,99)(98,101)(100,100)1212采用逆向歸納法,子博弈完美納什均衡為局中人1開(kāi)始就選擇D從而結(jié)束博弈,兩個(gè)局中人的支付均為1。第三十一頁(yè),共五十七頁(yè),2022年,8月28日例5.3無(wú)限次重復(fù)的囚徒困境問(wèn)題。對(duì)于階段博弈重復(fù)進(jìn)行無(wú)限次,考慮局中人的如下觸發(fā)策略當(dāng)時(shí),選擇抗拒(合作);在階段,如前面?zhèn)€階段中出現(xiàn)的行動(dòng)組合都是(抗拒,抗拒),仍選擇抗拒,否則,選擇坦白(不合作)??梢宰C明,當(dāng)充分大時(shí),兩個(gè)局中人的觸發(fā)策略組合是子博弈精煉納什均衡。第三十二頁(yè),共五十七頁(yè),2022年,8月28日表4.3t12……
甲乙……乙的收益-1-1……1兩個(gè)局中人的觸發(fā)策略構(gòu)成納什均衡這只需說(shuō)明若甲采取觸發(fā)策略,乙若偏離觸發(fā)策略,不能使自己的收益提高,反之亦然。設(shè)甲采取了觸發(fā)策略,乙也采取觸發(fā)策略。甲、乙的行動(dòng)組合序列及乙的階段收益如表4.3:從而,乙的支付為第三十三頁(yè),共五十七頁(yè),2022年,8月28日若乙在第k階段偏離了觸發(fā)策略,對(duì)乙最有利的甲、乙的行動(dòng)組合序列及乙的階段收益如表4.4:表4.4T12…k-1kk+1k+2…
甲乙……乙的收益-1-1…-10-8-8…第三十四頁(yè),共五十七頁(yè),2022年,8月28日從第k階段算起乙的支付為只要,就有。這時(shí),若甲采取觸發(fā)策略,乙也會(huì)采取觸發(fā)策略。反之,若乙采取觸發(fā)策略,甲也不會(huì)偏離觸發(fā)策略。故兩個(gè)局中人的觸發(fā)策略組合構(gòu)成納什均衡。第三十五頁(yè),共五十七頁(yè),2022年,8月28日2兩個(gè)局中人的觸發(fā)策略構(gòu)成子博弈精煉納什均衡注意到每一個(gè)從起始的子博弈都屬于以下兩類(lèi)之一。1.前階段行動(dòng)組合都是(抗拒,抗拒),同前面的證明一樣可以證明觸發(fā)策略組合在這類(lèi)子博弈上構(gòu)成納什均衡。2.前階段行動(dòng)組合中至少有一行動(dòng)組合不是(抗拒,抗拒)。甲乙雙方在子博弈上都執(zhí)行觸發(fā)策略的行動(dòng)組合序列及乙的收益如表4.5:
t+1t+2t+3……
甲乙……乙的收益
-8-8-8……第三十六頁(yè),共五十七頁(yè),2022年,8月28日
若乙在第t+k階段偏離了觸發(fā)策略,甲、乙雙方對(duì)乙最有利的行動(dòng)組合及乙的收益如表4.6t+1t+2t+3……t+kt+k+1……
甲乙…………乙的收益
-8-8-8……-10-8……顯然,乙的收益不會(huì)提高。同理,對(duì)甲也是這樣。因此,觸發(fā)策略組合在第2類(lèi)子博弈上也構(gòu)成納什均衡。從而我們證明了觸發(fā)策略是子博弈精煉納什均衡。例4.6表明:在無(wú)限次重復(fù)的囚徒困境問(wèn)題中,對(duì)雙方都有利的Parecto最優(yōu)的結(jié)果可以實(shí)現(xiàn)。(針?shù)h相對(duì)(TFT)策略)第三十七頁(yè),共五十七頁(yè),2022年,8月28日例5.4無(wú)限次重復(fù)的古諾模型在古諾模型中,古諾均衡為,。默契合謀下最優(yōu)產(chǎn)量為。合謀利潤(rùn)為??梢宰C明,當(dāng)時(shí),下面的觸發(fā)策略構(gòu)成無(wú)限次重復(fù)古諾模型的子博弈精煉納什均衡。時(shí),企業(yè)選擇合謀產(chǎn)量;期時(shí),若前面t-1階段兩個(gè)企業(yè)的產(chǎn)量序列都是(),則仍選,否則選擇產(chǎn)量。第三十八頁(yè),共五十七頁(yè),2022年,8月28日例5.5設(shè)階段博弈G為如下的“假貨問(wèn)題”
該博弈有唯一的納什均衡:(不購(gòu)買(mǎi),假貨)??紤]將階段博弈G重復(fù)無(wú)限次的博弈。當(dāng)時(shí),下述觸發(fā)策略組合為子博弈精煉納什均衡。廠商策略:時(shí),出售真貨。時(shí),如期兩個(gè)參與人的行動(dòng)為(真貨,購(gòu)買(mǎi)),則出售真貨。否則,自期始,永遠(yuǎn)出售假貨。消費(fèi)者策略:t=1期購(gòu)買(mǎi),時(shí),期兩個(gè)參與人的行動(dòng)為(真貨,購(gòu)買(mǎi)),則購(gòu)買(mǎi)。否則,自t期始永不購(gòu)買(mǎi)。均衡的結(jié)果是在每一階段上,廠商出售真貨,消費(fèi)者購(gòu)買(mǎi)。《霧里看花》第三十九頁(yè),共五十七頁(yè),2022年,8月28日5.2佚名定理(folktheorem)一個(gè)佚名定理的特例任何介于古諾產(chǎn)量與合謀產(chǎn)量(n表示企業(yè)個(gè)數(shù))之間的產(chǎn)量,都可以作為觸發(fā)策略的結(jié)果而實(shí)現(xiàn)。我們以為例給以證明。設(shè)企業(yè)采取以下的觸發(fā)策略:第四十頁(yè),共五十七頁(yè),2022年,8月28日(1),產(chǎn)量為;(2)在期,若前階段產(chǎn)量序列都是(),則生產(chǎn)量仍為;否則,產(chǎn)量為。用表示產(chǎn)量為時(shí)相應(yīng)的企業(yè)利潤(rùn);用表示對(duì)手產(chǎn)量為,而本企業(yè)在對(duì)手產(chǎn)量為的條件下使本企業(yè)利潤(rùn)最大化的產(chǎn)量。首先,設(shè)甲、乙兩個(gè)企業(yè)都采取上述觸發(fā)策略時(shí),產(chǎn)量組合序列及乙企業(yè)的利潤(rùn)如表4.7:表4.7
t123…
甲…
乙…
乙的利潤(rùn)…
第四十一頁(yè),共五十七頁(yè),2022年,8月28日乙的利潤(rùn)貼現(xiàn)為。當(dāng)時(shí),有。故乙不會(huì)偏離觸發(fā)策略。同理,當(dāng)乙采取觸發(fā)策略時(shí),甲也不會(huì)偏離觸發(fā)策略。這表明甲、乙都采取觸發(fā)策略構(gòu)成納什均衡。還可證明它是一個(gè)子博弈精煉納什均衡。因而()在博弈的每一階段都可以實(shí)現(xiàn)。第四十二頁(yè),共五十七頁(yè),2022年,8月28日
平均支付(1)若局中人每一階段博弈的支付都為,則規(guī)定無(wú)限次重復(fù)博弈的平均支付也是。此時(shí)局中人的支付貼現(xiàn)為。(2)若局中人的階段博弈支付序列為,當(dāng)支付貼現(xiàn),或時(shí),定義的平均支付為。平均支付有兩個(gè)優(yōu)點(diǎn)。其一,它消除了時(shí)間的因素,因而可與階段支付相比較。其二是平均支付是現(xiàn)值支付的倍,因而平均支付最大化與現(xiàn)值支付最大化是等價(jià)的。第四十三頁(yè),共五十七頁(yè),2022年,8月28日可行支付設(shè)博弈有個(gè)n局中人,稱(chēng)為可行支付向量,當(dāng)v為階段博弈G的純策略支付的凸組合,即G若共有m個(gè)純策略組合支付向量,有,其中,。所有的可行支付向量用V表示:為G的可行支付向量}。佚名定理定理5.3佚名定理(Friedman1971)G為無(wú)限次重復(fù)博弈G(∞,δ)的階段博弈,α*
為G的納什均衡。α*
對(duì)應(yīng)的支付向量為π=(π1,π2,…..πn)
。對(duì)于任何可行支付v∈V,v=(v1,v2,…vn),且
πi>vi,必存在δ*<1,當(dāng)δ
≥δ*,時(shí),v=(v1,v2,…vn)
是一個(gè)特定的子博弈精煉納什均衡的平均支付結(jié)果。第四十四頁(yè),共五十七頁(yè),2022年,8月28日例如,對(duì)于無(wú)限次重復(fù)的囚徒困境博弈,圖4-10中陰影部分上任何一點(diǎn),都是某個(gè)特定的子博弈精煉納什均衡的結(jié)果。--8-10-1-8
圖4-10
第四十五頁(yè),共五十七頁(yè),2022年,8月28日5.3討價(jià)還價(jià)博弈模型魯賓斯坦輪流出價(jià)討價(jià)還價(jià)模型有限期討價(jià)還價(jià)模型設(shè)兩個(gè)局中人通過(guò)以下輪流出價(jià)的討價(jià)還價(jià)方式分配一項(xiàng)利益。t=1,局中人1選擇-局中人欲占有的利益份額;局中人2如接受,則產(chǎn)生分配結(jié)果;否則t=2,局中人2選擇—同意局中人1分得的利益份額。如果局中人1同意,則產(chǎn)生分配結(jié)果,此處為局中人i的時(shí)間貼現(xiàn)因子。否則t=3,局中人1提出,局中人2如同意,則分配結(jié)果為,否則t=4,局中人2提出,局中人1如接受,分配結(jié)果為;否則,博弈結(jié)束,誰(shuí)也沒(méi)分配到利益,其結(jié)果為(0,0)。兩局中人輪流出價(jià)的討價(jià)還價(jià)模型的博弈樹(shù)如圖4-11所示。第四十六頁(yè),共五十七頁(yè),2022年,8月28日(拒絕x1x4x3x2接受接受接受接受(x1,1-x1)拒絕拒絕拒絕(0,0)圖4-11①①①②②第四十七頁(yè),共五十七頁(yè),2022年,8月28日逆向歸納法在輪流出價(jià)的討價(jià)還價(jià)博弈中,理性局中人的行為是希望自己所提出的價(jià)格能被對(duì)手接受,既要在對(duì)手感到接受比拒絕好的條件下,使自己的利益最大化。在這種行為假設(shè)下,可用逆向歸納法求解該博弈的子博弈精煉納什均衡。,局中人2提出局中人1的利益份額,希望局中人1接受,且使自己利益最大。即求解最大化問(wèn)題:最優(yōu)解為于是分配結(jié)果為(,并將其賦值于圖4-11相應(yīng)的節(jié)點(diǎn)。第四十八頁(yè),共五十七頁(yè),2022年,8月28日
,局中人1提出的份額應(yīng)是以下最大化問(wèn)題的解最優(yōu)解為。對(duì)應(yīng)的分配結(jié)果為(),并將其賦值于相應(yīng)的節(jié)點(diǎn)。,局中人2提出,需滿(mǎn)足以下優(yōu)化問(wèn)題:解得。相應(yīng)的分配結(jié)果為
=,將其賦值于相應(yīng)的節(jié)點(diǎn)。第四十九頁(yè),共五十七頁(yè),2022年,8月28日
,局中人1提出的份額應(yīng)為以下最大化問(wèn)題的解。
解得。相應(yīng)的分配結(jié)果為,。并將其賦值于圖4-11的節(jié)點(diǎn)上。子博弈精煉納什均衡的結(jié)果是:局中人1提出自己的份額為,局中人2同意局中人1的選擇,自己獲得利益份額。用以上方法,可以求得任何有限次輪流出價(jià)的討價(jià)還價(jià)博弈的結(jié)果如表4.9。第五十頁(yè),共五十七頁(yè),2022年,8月28日表4.9T(博弈次數(shù))2345
第五十一頁(yè),共五十七頁(yè),2022年,8月28日子博弈精煉納什均衡結(jié)果與及的關(guān)系從表4.9中我們可以歸納出輪流出價(jià)的討價(jià)還價(jià)博弈模型的子博弈精煉納什均衡結(jié)果與及的關(guān)系:(1),。當(dāng)局中人2的時(shí)間貼現(xiàn)因子為0時(shí),不論局中人1的時(shí)間貼現(xiàn)因子為何值,局中人1可獨(dú)占這份利益。(2),,,。若局中人1的貼現(xiàn)因子為0。局中人2的時(shí)間貼現(xiàn)因子為正數(shù),利益分配取決于值。,局中人2多得,,局中人1多得。
(3)第五十二頁(yè),共五十七頁(yè),2
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 運(yùn)營(yíng)助理的年終總結(jié)
- 新生兒輕度窒息的護(hù)理
- 福建省2024八年級(jí)數(shù)學(xué)上冊(cè)第12章整式的乘除12.2整式的乘法3.多項(xiàng)式與多項(xiàng)式相乘課件新版華東師大版
- 人事測(cè)評(píng)課件教學(xué)課件
- 2.1.2碳酸鈉和碳酸氫鈉 說(shuō)課課件 高一上學(xué)期化學(xué)人教版(2019)必修第一冊(cè)
- 洗地機(jī)行業(yè)現(xiàn)狀分析報(bào)告
- 如何寫(xiě)年終述職報(bào)告
- 肱骨遠(yuǎn)段骨折康復(fù)治療
- 不樣的我教案反思
- 2025文旅景區(qū)蛇年新年國(guó)潮非遺年貨大集主題活動(dòng)策劃方案-111P
- 安全培訓(xùn)總結(jié)及效果評(píng)價(jià)
- 系統(tǒng)集成項(xiàng)目管理工程師(基礎(chǔ)知識(shí)、應(yīng)用技術(shù))合卷軟件資格考試(中級(jí))試題及解答參考(2025年)
- 通信業(yè)務(wù)協(xié)議
- 2024新信息科技七年級(jí)《第一單元 探尋互聯(lián)網(wǎng)新世界》大單元整體教學(xué)設(shè)計(jì)2022課標(biāo)
- 部編版道德與法治三年級(jí)上冊(cè)第8課《安全記心上》精美課件
- 工作人員外出審批單
- DB1331T 080-2024 雄安新區(qū)零碳建筑技術(shù)標(biāo)準(zhǔn)
- 河北省衡水市棗強(qiáng)縣2024-2025學(xué)年九年級(jí)上學(xué)期10月月考物理試題
- 時(shí)代樂(lè)章-第2課 科技之光(課件)2024-2025學(xué)年人教版(2024)初中美術(shù)七年級(jí)上冊(cè) -
- 《8 課余生活真豐富》教學(xué)設(shè)計(jì)-2024-2025學(xué)年道德與法治一年級(jí)上冊(cè)統(tǒng)編版
- 2024年網(wǎng)絡(luò)安全知識(shí)競(jìng)賽考試題庫(kù)500題(含答案)
評(píng)論
0/150
提交評(píng)論