完全信息動(dòng)態(tài)博弈

上傳人：農(nóng)*** IP屬地：廣東上傳時(shí)間：2023-02-02 格式：PPT 頁(yè)數(shù)：56 大小：4.71MB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩51頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

完全信息動(dòng)態(tài)博弈第一頁(yè)，共五十七頁(yè)，2022年，8月28日4.1子博弈精煉納什均衡對(duì)于動(dòng)態(tài)博弈模型而言，納什均衡是否為該博弈結(jié)果的合理預(yù)測(cè)。市場(chǎng)進(jìn)入問(wèn)題設(shè)房地產(chǎn)市場(chǎng)上有甲乙兩個(gè)開(kāi)發(fā)商。甲開(kāi)發(fā)商首先決定開(kāi)發(fā)還是不開(kāi)發(fā)。乙在了解甲所選擇的行動(dòng)后，再?zèng)Q定開(kāi)發(fā)還是不開(kāi)發(fā)。博弈樹(shù)如圖4-1所示。不開(kāi)發(fā)I11圖4-1不開(kāi)發(fā)開(kāi)發(fā)開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)

I22②①②第二頁(yè)，共五十七頁(yè)，2022年，8月28日局中人甲的策略集合開(kāi)發(fā)或不開(kāi)發(fā)}，局中人乙的策略集合開(kāi)發(fā)或不開(kāi)發(fā)}。支付矩陣為：

該博弈有三個(gè)納什均衡：1.（開(kāi)發(fā)，（不開(kāi)發(fā)，不開(kāi)發(fā)））；2.（不開(kāi)發(fā)，（開(kāi)發(fā)，開(kāi)發(fā)））；3.（開(kāi)發(fā)，（不開(kāi)發(fā)，開(kāi)發(fā)））。博弈的最終結(jié)局應(yīng)出現(xiàn)哪個(gè)均衡，需要我們分析在這三個(gè)均衡中哪個(gè)合理，哪個(gè)不合理。1（開(kāi)發(fā)，（不開(kāi)發(fā)，不開(kāi)發(fā)））不是合理的納什均衡。2（不開(kāi)發(fā)，（開(kāi)發(fā)，開(kāi)發(fā)））也不是合理的納什均衡。3（開(kāi)發(fā)，（不開(kāi)發(fā)，開(kāi)發(fā)））是合理的納什均衡。第三頁(yè)，共五十七頁(yè)，2022年，8月28日此均衡表示甲先采取開(kāi)發(fā)的行動(dòng)。乙的策略是，如甲開(kāi)發(fā)，他就不開(kāi)發(fā)；如甲不開(kāi)發(fā)，他就開(kāi)發(fā)。實(shí)際上，如甲開(kāi)發(fā)，乙若開(kāi)發(fā)利潤(rùn)為-3，乙若不開(kāi)發(fā)利潤(rùn)為0。因此甲若開(kāi)發(fā)，乙不開(kāi)發(fā)為其理性的選擇；如甲不開(kāi)發(fā)，乙若開(kāi)發(fā)，利潤(rùn)為1，乙若不開(kāi)發(fā)，利潤(rùn)為0，因而開(kāi)發(fā)為乙的理性選擇。這說(shuō)明乙的策略(不開(kāi)發(fā)，開(kāi)發(fā))是可置信的策略。從此例我們可以看到：在動(dòng)態(tài)博弈中會(huì)出現(xiàn)多重納什均衡的情形，而其中可能包含了不合理的均衡。我們面臨的任務(wù)是如何剔除不合理的均衡除而精煉出合理的均衡。為此，需引入由澤爾騰（ReinhardSelten）提出的子博弈精煉納什均衡的概念。第四頁(yè)，共五十七頁(yè)，2022年，8月28日子博弈精煉納什均衡(SPE)的定義定義4.1稱擴(kuò)展型博弈G的策略組合為子博弈精煉納什均衡，如果它限制在G的每個(gè)子博弈上都是該子博弈的納什均衡。因?yàn)槊總€(gè)博弈都是自己的子博弈。因而子博弈精煉納什均衡必為納什均衡，但納什均衡不一定是子博弈精煉納什均衡。對(duì)于具有完美信息的擴(kuò)展型博弈模型，我們用子博弈精煉納什均衡預(yù)測(cè)博弈的結(jié)果。子博弈精煉納什均衡的存在性定理4.1（Zormello1931，Kuhn1953）有限、完美信息的擴(kuò)展型博弈必存在純策略意義下的子博弈精煉納什均衡。第五頁(yè)，共五十七頁(yè)，2022年，8月28日逆向歸納法如下假設(shè)已知的擴(kuò)展型博弈共分k步完成。1.對(duì)于第k步上的信息集，選擇行動(dòng)，使相應(yīng)的參與人支付值最大，并將由此信息集出發(fā)達(dá)到的終點(diǎn)的支付向量賦值給該信息集對(duì)應(yīng)的決策的節(jié)點(diǎn)。2.利用第k步上節(jié)點(diǎn)的賦值，對(duì)屬于k-1步的信息集所對(duì)應(yīng)的節(jié)點(diǎn)同樣賦值。由于博弈是有限的，必可在有限步內(nèi)使博弈樹(shù)所有節(jié)點(diǎn)都賦與了支付值。3.將具有相同支付值的相鄰接的節(jié)點(diǎn)與終點(diǎn)用粗線連接起來(lái)，即可得到已知擴(kuò)展型博弈的子博弈精煉納什均衡。節(jié)點(diǎn)上的賦值給出了從此節(jié)點(diǎn)出發(fā)的子博弈的納什均衡支付結(jié)果。特別，點(diǎn)支付值給出了整個(gè)博弈的子博弈精煉納什均衡的支付結(jié)果。逆向歸納法實(shí)際是從最后階段的博弈開(kāi)始，序貫地求子博弈的納什均衡的過(guò)程。第六頁(yè)，共五十七頁(yè)，2022年，8月28日例4.1再考慮房地產(chǎn)開(kāi)發(fā)問(wèn)題。博弈樹(shù)上每個(gè)節(jié)點(diǎn)的賦值如圖4-2所示?？傻米硬┺木珶捈{什均衡：（開(kāi)發(fā)，（不開(kāi)發(fā)，開(kāi)發(fā)））。不開(kāi)發(fā)例4.2求如圖4-3所示的擴(kuò)展型博弈的子博弈精煉貝葉斯均衡

不開(kāi)發(fā)I11圖4-2不開(kāi)發(fā)開(kāi)發(fā)開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)

I22①②②I21

圖4-3TU①①②DD’U’RL第七頁(yè)，共五十七頁(yè)，2022年，8月28日1.對(duì)對(duì)應(yīng)的節(jié)點(diǎn)賦值；2.對(duì)對(duì)應(yīng)的節(jié)點(diǎn)賦值；3.對(duì)對(duì)應(yīng)的節(jié)點(diǎn)賦值，用粗線連接具有相同賦值的節(jié)點(diǎn).如圖4-4所示，子博弈納什均衡為。即局中人1處于信息集上時(shí)，選行動(dòng)U，處于信息集上時(shí)，選行動(dòng)U’；局中人2在其信息集上選擇行動(dòng)L。兩局中人都執(zhí)行這種策略組合中的相應(yīng)策略，可分別得到支付值2與0。

圖4-4TULR①①②DD’U’第八頁(yè)，共五十七頁(yè)，2022年，8月28日

例4.3求由圖4-5所示的擴(kuò)展型博弈的子博弈精煉納什均衡1.對(duì)對(duì)應(yīng)的節(jié)點(diǎn)賦值，；對(duì)對(duì)應(yīng)的節(jié)點(diǎn)賦值，；2.對(duì)對(duì)應(yīng)的節(jié)點(diǎn)賦值，。3.用粗線連接具有相同賦值的節(jié)點(diǎn)，得到子博弈精煉納什均衡，，，，見(jiàn)圖4-6。I11圖4-5

I22RL’LR’R’①②L’②I11圖4-6

I22L’RL’LR’R’I21①②②第九頁(yè)，共五十七頁(yè)，2022年，8月28日4.2斯坦克伯格雙寡頭壟斷模型斯坦克伯格（Stackelberg,1934）將古諾模型動(dòng)態(tài)化提出一個(gè)雙寡頭壟斷模型，博弈時(shí)序如下：1.企業(yè)1選擇產(chǎn)量；2.企業(yè)2觀察到，然后選擇產(chǎn)量；企業(yè)的利潤(rùn)函數(shù)為

=，。其中，為市場(chǎng)產(chǎn)品供給總量,為價(jià)格函數(shù),為企業(yè)的成本函數(shù)。設(shè)C為凸函數(shù)。斯坦克爾伯格模型可以歸結(jié)為，，的信息完全且完美的動(dòng)態(tài)博弈模型。故可用逆向歸納法求解子博弈精煉納什均衡,用t表示階段變量第十頁(yè)，共五十七頁(yè)，2022年，8月28日

.企業(yè)2觀察到企業(yè)1的產(chǎn)量,選擇產(chǎn)量，最大化利潤(rùn)函數(shù),即對(duì)于固定的求解最大化問(wèn)題：由于關(guān)于是凹函數(shù)，故1階條件對(duì)于最大化而言是充要條件。由有：（1）

從（1）可解得企業(yè)2關(guān)于企業(yè)1的反映函數(shù)第十一頁(yè)，共五十七頁(yè)，2022年，8月28日

.企業(yè)1預(yù)期到企業(yè)2的反映函數(shù)選擇

,最大化自己的利潤(rùn)函數(shù),即求解最大化問(wèn)題：

1階條件為：

（2）聯(lián)立（1）、（2）兩式，可解出子博弈精煉納什均衡。特別，當(dāng)，。且由（1）式可得企業(yè)2關(guān)于企業(yè)1的反應(yīng)函數(shù)

。第十二頁(yè)，共五十七頁(yè)，2022年，8月28日由（2）式可得。故斯坦克爾伯格的子博弈精煉納什均衡為：，。當(dāng)兩個(gè)局中人都執(zhí)行該均衡中的策略時(shí)，可得均衡結(jié)果，。先動(dòng)優(yōu)勢(shì)特別地，當(dāng)時(shí)，兩個(gè)均衡結(jié)果為，?？梢运愠銎髽I(yè)1的利潤(rùn)為，企業(yè)2的利潤(rùn)為，故有。由于企業(yè)1是首先行動(dòng)的，我們稱企業(yè)1具有先動(dòng)優(yōu)勢(shì)。這個(gè)先動(dòng)優(yōu)勢(shì)是在特殊的價(jià)格函數(shù)與成本函數(shù)下得出的，但我們可以證明有關(guān)先動(dòng)優(yōu)勢(shì)的一般性結(jié)論。第十三頁(yè)，共五十七頁(yè)，2022年，8月28日命題4.1

假設(shè)

.是的嚴(yán)格遞減函數(shù)，是的嚴(yán)格遞減函數(shù)。

.反應(yīng)曲線向下傾斜,即嚴(yán)格遞減，。則企業(yè)總是偏好于領(lǐng)頭企業(yè)，而不是跟隨企業(yè)。第十四頁(yè)，共五十七頁(yè)，2022年，8月28日4.3價(jià)格領(lǐng)先博弈模型設(shè)市場(chǎng)上有兩家企業(yè)生產(chǎn)不同質(zhì)的產(chǎn)品，但兩種產(chǎn)品有較強(qiáng)的替代性。一個(gè)企業(yè)首先制定產(chǎn)品價(jià)格，另一個(gè)企業(yè)看到這個(gè)價(jià)格后，再選擇自己產(chǎn)品的價(jià)格，這時(shí)兩個(gè)企業(yè)進(jìn)行動(dòng)態(tài)價(jià)格競(jìng)爭(zhēng)博弈。設(shè)企業(yè)1先行，企業(yè)2跟隨。我們?nèi)钥捎媚嫦驓w納法求子博弈精煉納什均衡。價(jià)格領(lǐng)先博弈模型的子博弈精煉納什均衡

.企業(yè)2已觀察到,選擇,使自己利潤(rùn)最大,即求解最大化問(wèn)題：可解得反應(yīng)函數(shù)：。

.在博弈的第1階段，企業(yè)1預(yù)期到企業(yè)2的價(jià)格反應(yīng)函數(shù)，選擇價(jià)格，使其利潤(rùn)最大，即求解解得。從而得到子博弈精煉納什均衡以及均衡結(jié)果,第十五頁(yè)，共五十七頁(yè)，2022年，8月28日價(jià)格領(lǐng)先博弈問(wèn)題的先動(dòng)與后動(dòng)優(yōu)勢(shì)命題4.2

設(shè)關(guān)于遞增，。1.若企業(yè)的反映曲線向下傾斜，價(jià)格領(lǐng)先仍被企業(yè)所偏好。2.如果兩個(gè)企業(yè)具有向上傾斜的反映曲線，若有一個(gè)企業(yè)偏好于價(jià)格領(lǐng)先，另一個(gè)企業(yè)必然偏好于價(jià)格跟隨.3.如果兩個(gè)企業(yè)的成本、需求函數(shù)相同，且反應(yīng)曲線向上傾斜，每個(gè)企業(yè)都偏好價(jià)格跟隨。第十六頁(yè)，共五十七頁(yè)，2022年，8月28日例4.4

設(shè)在價(jià)格領(lǐng)先博弈模型中，兩個(gè)企業(yè)的需求函數(shù)分別為

,具有相同的成本函數(shù)。

,企業(yè)觀察到了，求，最大化自己的利潤(rùn)函數(shù)由1階條件，可得向上傾斜的反應(yīng)函數(shù)，企業(yè)1預(yù)期到，選擇，最大化由1階條件，解得。代入?yún)⑴c人2的價(jià)格反應(yīng)函數(shù)得?？捎?jì)算出，。易見(jiàn)，，后動(dòng)優(yōu)勢(shì)成立。第十七頁(yè)，共五十七頁(yè)，2022年，8月28日4.4具有同時(shí)選擇的兩階段動(dòng)態(tài)博弈具有同時(shí)選擇的兩階段動(dòng)態(tài)博弈模型時(shí)序如下：1.局中人1和２同時(shí)從自己的行動(dòng)集合中選擇行動(dòng)和。2.局中人３和４觀察到，然后同時(shí)從自己的行動(dòng)集和中選擇行動(dòng)。3.對(duì)于選出的行動(dòng),局中人獲得支付。該博弈中每個(gè)參與人在選擇行動(dòng)時(shí)對(duì)博弈的歷史完全了解，因而是信息完美的動(dòng)態(tài)博弈模型。在這個(gè)博弈中，參與人1，2的策略與行動(dòng)等同。參與人3，4的策略是的映射，即，,，。許多經(jīng)濟(jì)學(xué)問(wèn)題都符合以上特點(diǎn)，下面給出兩個(gè)例子。第十八頁(yè)，共五十七頁(yè)，2022年，8月28日4.4.１銀行擠兌問(wèn)題設(shè)有兩個(gè)投資者，每人存入銀行一筆存款D，銀行將這筆存款投資于一個(gè)長(zhǎng)期項(xiàng)目。如果在該項(xiàng)目到期之前，存款人提前支取、銀行被迫變現(xiàn)，共可收回。這里。如果銀行等待長(zhǎng)期項(xiàng)目到期支取，可回收，。設(shè)有２個(gè)提款日期，,項(xiàng)目到期前，兩個(gè)投資者都提款，則每人可得r；如果只有1個(gè)投資者在t=1提款，他可得D，另一人得2r-D。如果兩人都未在t=1提款，在t=2，兩人都提款，則每人得R；如果只有一個(gè)人在t=2提款，他得2R-D，另一人得D；如果t=2時(shí)，兩個(gè)投資者都不提款，銀行向每個(gè)投資者返還R。該博弈的博弈樹(shù)如圖4-7所示.第十九頁(yè)，共五十七頁(yè)，2022年，8月28日?qǐng)D4-7

不提I21提提提不提不提I12不提提提提不提不提I11①①②②②②第二十頁(yè)，共五十七頁(yè)，2022年，8月28日用逆向歸納法求解

，考慮子博弈：納什均衡為（提款，提款）。當(dāng)，考慮博弈：可得兩個(gè)納什均衡:（提款,提款）,（不提款,不提款）。故可得出兩個(gè)子博弈精煉納什均衡路徑（結(jié)果）

1（提款，提款），支付函數(shù)值為；

2（不提，不提，提款，提款），支付值為。第二十一頁(yè)，共五十七頁(yè)，2022年，8月28日4.4.2關(guān)稅和國(guó)際市場(chǎng)的不完全競(jìng)爭(zhēng)問(wèn)題設(shè)有兩個(gè)國(guó)家，每個(gè)國(guó)家各有1個(gè)企業(yè)，分別稱為企業(yè)1、企業(yè)2。生產(chǎn)既可內(nèi)銷、又可出口的同質(zhì)產(chǎn)品。兩個(gè)國(guó)家中的消費(fèi)者在各自國(guó)家的市場(chǎng)上購(gòu)買本國(guó)產(chǎn)品或外國(guó)產(chǎn)品，引入以下記號(hào)。1.表示國(guó)家i市場(chǎng)上的商品供給量，。這里表示i國(guó)的內(nèi)銷量；表示j國(guó)出口量。2.。表示市場(chǎng)i的出清價(jià)格。3.為企業(yè)i的總成本。其中表示兩國(guó)相同的生產(chǎn)成本；為i國(guó)的進(jìn)口關(guān)稅，i=1，2。第二十二頁(yè)，共五十七頁(yè)，2022年，8月28日

該博弈的時(shí)序?yàn)椋篢=1，兩國(guó)政府分別選擇關(guān)稅。T=2 ,兩國(guó)企業(yè)在觀察到關(guān)稅后，決定內(nèi)銷量與出口量。對(duì)于給定的（），企業(yè)i可獲利潤(rùn)

=。上式表明企業(yè)的利潤(rùn)可被劃分為國(guó)內(nèi)利潤(rùn)、國(guó)外利潤(rùn)、關(guān)稅三個(gè)部分。政府作為博弈的局中人，所關(guān)心的社會(huì)福利由政府關(guān)稅收入、企業(yè)利潤(rùn)、消費(fèi)者剩余這三部分組成，i國(guó)福利函數(shù)為：，第二十三頁(yè)，共五十七頁(yè)，2022年，8月28日用逆向歸納法求解關(guān)稅博弈的子博弈精煉納什均衡T=2，企業(yè)1、2觀察到關(guān)稅與值，企業(yè)i最大化利潤(rùn)，即求解最大化問(wèn)題：解得

,同理有

,聯(lián)立以上4個(gè)等式，可解得（1）第二十四頁(yè)，共五十七頁(yè)，2022年，8月28日T=1時(shí)，兩國(guó)同時(shí)選擇關(guān)稅，。政府i選擇，i=1,2,最大化福利函數(shù)。解得均衡關(guān)稅，代入（1）式，得均衡內(nèi)銷產(chǎn)量與出口量由于的解為，因而

不是帕累托最優(yōu)的。因而關(guān)稅博弈也具有囚徒困境問(wèn)題的性質(zhì)。第二十五頁(yè)，共五十七頁(yè)，2022年，8月28日第五章重復(fù)博弈5.1重復(fù)博弈(repeatedgame)重復(fù)博弈是指同一個(gè)博弈重復(fù)進(jìn)行有限或無(wú)限次。每次被重復(fù)的博弈稱之為階段博弈。重復(fù)博弈的定義定義4.2

設(shè)G為階段博弈，用表示將重復(fù)次的重復(fù)博弈。稱其為無(wú)限次重復(fù)博弈，t有限稱其為有限次重復(fù)博弈。，其中是局中人的貼現(xiàn)因子。在t階段的初期，t階段前的博弈歷史都可被局中人觀察到。局中人在中的支付函數(shù)為階段支付的貼現(xiàn)和，即第二十六頁(yè)，共五十七頁(yè)，2022年，8月28日

重復(fù)博弈的策略無(wú)論是有限還是無(wú)限的重復(fù)博弈，局中人的策略都是指一個(gè)完整的行動(dòng)計(jì)劃。它給出在任何情況下，局中人所選擇的行動(dòng)。在中，局中人i的一個(gè)策略系指在每一階段t，局中人i的t期前的歷史，到t期行動(dòng)的映射：。這里表示參與人i在t期采取的行動(dòng)。而表示t期的行動(dòng)組合，。重復(fù)博弈的子博弈當(dāng)博弈進(jìn)行到t階段，t前歷史是局中人的共同知識(shí)，因而重復(fù)博弈是信息完美的動(dòng)態(tài)博弈。從t階段開(kāi)始直到博弈的終止的博弈稱為原博弈的子博弈。在中，由t+1階段開(kāi)始的子博弈為將G重復(fù)T-t次的重復(fù)博弈。到達(dá)t+1階段的歷史有多少，就有多少子博弈。子博弈精煉納什均衡在每個(gè)子博弈上都給出納什均衡。第二十七頁(yè)，共五十七頁(yè)，2022年，8月28日例5.1

有限次重復(fù)的囚徒困境問(wèn)題。設(shè)階段博弈為由以下支付矩陣給出的囚徒困境問(wèn)題：

子博弈精煉納什均衡我們求的子博弈精煉納什均衡。其博弈樹(shù)如圖4-9第二十八頁(yè)，共五十七頁(yè)，2022年，8月28日?qǐng)D4-9二次重復(fù)囚徒困境博弈樹(shù)I11DCDDCCCDCDCCCCCCCCCDCDDDDDDDI1.5I14I13I12I22I25I24I21I23DD①①①①①②②②②②②②②②②第二十九頁(yè)，共五十七頁(yè)，2022年，8月28日利用納什均衡不變性知：有限次重復(fù)的囚徒困境問(wèn)題的子博弈精煉納什均衡是每個(gè)局中人在各種情況下都采取“坦白”的行動(dòng)。上例結(jié)果是以下定理的一個(gè)特例。定理5.1若階段博弈G有唯一的納什均衡，對(duì)任何正整數(shù),

也有唯一的子博弈精煉納什均衡,即各局中人在每個(gè)階段都選擇階段博弈的納什均衡策略。在以上定理中,G有唯一的納什均衡是個(gè)重要條件，如果G的均衡不唯一，則以上定理不一定成立。時(shí),以上定理也不一定成立。第三十頁(yè)，共五十七頁(yè)，2022年，8月28日蜈蚣博弈(centipedegame)的分析

蜈蚣博弈最早是Rosenthsal于1981年提出來(lái)的，兩個(gè)局中人1和2輪流進(jìn)行選擇，選擇的策略和支付如圖所示。由于形狀上的特點(diǎn)，被稱為蜈蚣博弈（Rosenthsal，1981）。這個(gè)博弈應(yīng)該成為序貫博弈（sequentialgame））…D(1,1)U12RL(0,3)DDUURLRL(98,98)(97,100)(99,99)(98,101)(100,100)1212采用逆向歸納法，子博弈完美納什均衡為局中人1開(kāi)始就選擇D從而結(jié)束博弈，兩個(gè)局中人的支付均為1。第三十一頁(yè)，共五十七頁(yè)，2022年，8月28日例5.3無(wú)限次重復(fù)的囚徒困境問(wèn)題。對(duì)于階段博弈重復(fù)進(jìn)行無(wú)限次,考慮局中人的如下觸發(fā)策略當(dāng)時(shí),選擇抗拒(合作);在階段,如前面?zhèn)€階段中出現(xiàn)的行動(dòng)組合都是(抗拒,抗拒),仍選擇抗拒,否則,選擇坦白(不合作)?？梢宰C明,當(dāng)充分大時(shí),兩個(gè)局中人的觸發(fā)策略組合是子博弈精煉納什均衡。第三十二頁(yè)，共五十七頁(yè)，2022年，8月28日表4.3t12……

甲乙……乙的收益-1-1……1兩個(gè)局中人的觸發(fā)策略構(gòu)成納什均衡這只需說(shuō)明若甲采取觸發(fā)策略，乙若偏離觸發(fā)策略，不能使自己的收益提高，反之亦然。設(shè)甲采取了觸發(fā)策略，乙也采取觸發(fā)策略。甲、乙的行動(dòng)組合序列及乙的階段收益如表4.3：從而，乙的支付為第三十三頁(yè)，共五十七頁(yè)，2022年，8月28日若乙在第k階段偏離了觸發(fā)策略，對(duì)乙最有利的甲、乙的行動(dòng)組合序列及乙的階段收益如表4.4：表4.4T12…k-1kk+1k+2…

甲乙……乙的收益-1-1…-10-8-8…第三十四頁(yè)，共五十七頁(yè)，2022年，8月28日從第k階段算起乙的支付為只要，就有。這時(shí)，若甲采取觸發(fā)策略，乙也會(huì)采取觸發(fā)策略。反之，若乙采取觸發(fā)策略，甲也不會(huì)偏離觸發(fā)策略。故兩個(gè)局中人的觸發(fā)策略組合構(gòu)成納什均衡。第三十五頁(yè)，共五十七頁(yè)，2022年，8月28日2兩個(gè)局中人的觸發(fā)策略構(gòu)成子博弈精煉納什均衡注意到每一個(gè)從起始的子博弈都屬于以下兩類之一。1.前階段行動(dòng)組合都是（抗拒，抗拒），同前面的證明一樣可以證明觸發(fā)策略組合在這類子博弈上構(gòu)成納什均衡。2.前階段行動(dòng)組合中至少有一行動(dòng)組合不是（抗拒，抗拒）。甲乙雙方在子博弈上都執(zhí)行觸發(fā)策略的行動(dòng)組合序列及乙的收益如表4.5：

t+1t+2t+3……

甲乙……乙的收益

-8-8-8……第三十六頁(yè)，共五十七頁(yè)，2022年，8月28日

若乙在第t+k階段偏離了觸發(fā)策略，甲、乙雙方對(duì)乙最有利的行動(dòng)組合及乙的收益如表4.6t+1t+2t+3……t+kt+k+1……

甲乙…………乙的收益

-8-8-8……-10-8……顯然，乙的收益不會(huì)提高。同理，對(duì)甲也是這樣。因此，觸發(fā)策略組合在第2類子博弈上也構(gòu)成納什均衡。從而我們證明了觸發(fā)策略是子博弈精煉納什均衡。例4.6表明：在無(wú)限次重復(fù)的囚徒困境問(wèn)題中，對(duì)雙方都有利的Parecto最優(yōu)的結(jié)果可以實(shí)現(xiàn)。（針?shù)h相對(duì)（TFT）策略）第三十七頁(yè)，共五十七頁(yè)，2022年，8月28日例5.4無(wú)限次重復(fù)的古諾模型在古諾模型中，古諾均衡為，。默契合謀下最優(yōu)產(chǎn)量為。合謀利潤(rùn)為?？梢宰C明，當(dāng)時(shí)，下面的觸發(fā)策略構(gòu)成無(wú)限次重復(fù)古諾模型的子博弈精煉納什均衡。時(shí)，企業(yè)選擇合謀產(chǎn)量；期時(shí)，若前面t-1階段兩個(gè)企業(yè)的產(chǎn)量序列都是（），則仍選，否則選擇產(chǎn)量。第三十八頁(yè)，共五十七頁(yè)，2022年，8月28日例5.5設(shè)階段博弈G為如下的“假貨問(wèn)題”

該博弈有唯一的納什均衡：（不購(gòu)買，假貨）?？紤]將階段博弈G重復(fù)無(wú)限次的博弈。當(dāng)時(shí)，下述觸發(fā)策略組合為子博弈精煉納什均衡。廠商策略：時(shí)，出售真貨。時(shí)，如期兩個(gè)參與人的行動(dòng)為（真貨，購(gòu)買），則出售真貨。否則，自期始，永遠(yuǎn)出售假貨。消費(fèi)者策略：t=1期購(gòu)買，時(shí)，期兩個(gè)參與人的行動(dòng)為（真貨，購(gòu)買），則購(gòu)買。否則，自t期始永不購(gòu)買。均衡的結(jié)果是在每一階段上，廠商出售真貨，消費(fèi)者購(gòu)買。《霧里看花》第三十九頁(yè)，共五十七頁(yè)，2022年，8月28日5.2佚名定理(folktheorem)一個(gè)佚名定理的特例任何介于古諾產(chǎn)量與合謀產(chǎn)量（n表示企業(yè)個(gè)數(shù)）之間的產(chǎn)量，都可以作為觸發(fā)策略的結(jié)果而實(shí)現(xiàn)。我們以為例給以證明。設(shè)企業(yè)采取以下的觸發(fā)策略：第四十頁(yè)，共五十七頁(yè)，2022年，8月28日（1），產(chǎn)量為；（2）在期，若前階段產(chǎn)量序列都是（），則生產(chǎn)量仍為；否則，產(chǎn)量為。用表示產(chǎn)量為時(shí)相應(yīng)的企業(yè)利潤(rùn)；用表示對(duì)手產(chǎn)量為，而本企業(yè)在對(duì)手產(chǎn)量為的條件下使本企業(yè)利潤(rùn)最大化的產(chǎn)量。首先，設(shè)甲、乙兩個(gè)企業(yè)都采取上述觸發(fā)策略時(shí)，產(chǎn)量組合序列及乙企業(yè)的利潤(rùn)如表4.7：表4.7

t123…

甲…

乙…

乙的利潤(rùn)…

第四十一頁(yè)，共五十七頁(yè)，2022年，8月28日乙的利潤(rùn)貼現(xiàn)為。當(dāng)時(shí)，有。故乙不會(huì)偏離觸發(fā)策略。同理，當(dāng)乙采取觸發(fā)策略時(shí)，甲也不會(huì)偏離觸發(fā)策略。這表明甲、乙都采取觸發(fā)策略構(gòu)成納什均衡。還可證明它是一個(gè)子博弈精煉納什均衡。因而（）在博弈的每一階段都可以實(shí)現(xiàn)。第四十二頁(yè)，共五十七頁(yè)，2022年，8月28日

平均支付（1）若局中人每一階段博弈的支付都為，則規(guī)定無(wú)限次重復(fù)博弈的平均支付也是。此時(shí)局中人的支付貼現(xiàn)為。（2）若局中人的階段博弈支付序列為，當(dāng)支付貼現(xiàn)，或時(shí)，定義的平均支付為。平均支付有兩個(gè)優(yōu)點(diǎn)。其一，它消除了時(shí)間的因素，因而可與階段支付相比較。其二是平均支付是現(xiàn)值支付的倍，因而平均支付最大化與現(xiàn)值支付最大化是等價(jià)的。第四十三頁(yè)，共五十七頁(yè)，2022年，8月28日可行支付設(shè)博弈有個(gè)n局中人，稱為可行支付向量，當(dāng)v為階段博弈G的純策略支付的凸組合,即G若共有m個(gè)純策略組合支付向量,有，其中，。所有的可行支付向量用V表示：為G的可行支付向量}。佚名定理定理5.3佚名定理（Friedman1971）G為無(wú)限次重復(fù)博弈G(∞,δ)的階段博弈,α*

為G的納什均衡。α*

對(duì)應(yīng)的支付向量為π=(π1,π2,…..πn)

。對(duì)于任何可行支付v∈V,v=(v1,v2,…vn)，且

πi>vi,必存在δ*<1，當(dāng)δ

≥δ*，時(shí)，v=(v1,v2,…vn)

是一個(gè)特定的子博弈精煉納什均衡的平均支付結(jié)果。第四十四頁(yè)，共五十七頁(yè)，2022年，8月28日例如，對(duì)于無(wú)限次重復(fù)的囚徒困境博弈，圖4-10中陰影部分上任何一點(diǎn)，都是某個(gè)特定的子博弈精煉納什均衡的結(jié)果。--8-10-1-8

圖4-10

第四十五頁(yè)，共五十七頁(yè)，2022年，8月28日5.3討價(jià)還價(jià)博弈模型魯賓斯坦輪流出價(jià)討價(jià)還價(jià)模型有限期討價(jià)還價(jià)模型設(shè)兩個(gè)局中人通過(guò)以下輪流出價(jià)的討價(jià)還價(jià)方式分配一項(xiàng)利益。t=1，局中人1選擇－局中人欲占有的利益份額；局中人2如接受，則產(chǎn)生分配結(jié)果；否則t=2，局中人2選擇—同意局中人1分得的利益份額。如果局中人1同意，則產(chǎn)生分配結(jié)果，此處為局中人i的時(shí)間貼現(xiàn)因子。否則t=3，局中人1提出，局中人2如同意，則分配結(jié)果為，否則t=4，局中人2提出，局中人1如接受，分配結(jié)果為；否則，博弈結(jié)束，誰(shuí)也沒(méi)分配到利益，其結(jié)果為（0，0）。兩局中人輪流出價(jià)的討價(jià)還價(jià)模型的博弈樹(shù)如圖4-11所示。第四十六頁(yè)，共五十七頁(yè)，2022年，8月28日（拒絕x1x4x3x2接受接受接受接受（x1，1-x1）拒絕拒絕拒絕（0，0）圖4-11①①①②②第四十七頁(yè)，共五十七頁(yè)，2022年，8月28日逆向歸納法在輪流出價(jià)的討價(jià)還價(jià)博弈中，理性局中人的行為是希望自己所提出的價(jià)格能被對(duì)手接受，既要在對(duì)手感到接受比拒絕好的條件下，使自己的利益最大化。在這種行為假設(shè)下，可用逆向歸納法求解該博弈的子博弈精煉納什均衡。，局中人2提出局中人1的利益份額，希望局中人1接受，且使自己利益最大。即求解最大化問(wèn)題：最優(yōu)解為于是分配結(jié)果為（，并將其賦值于圖4-11相應(yīng)的節(jié)點(diǎn)。第四十八頁(yè)，共五十七頁(yè)，2022年，8月28日

，局中人1提出的份額應(yīng)是以下最大化問(wèn)題的解最優(yōu)解為。對(duì)應(yīng)的分配結(jié)果為（），并將其賦值于相應(yīng)的節(jié)點(diǎn)。，局中人2提出，需滿足以下優(yōu)化問(wèn)題：解得。相應(yīng)的分配結(jié)果為

=，將其賦值于相應(yīng)的節(jié)點(diǎn)。第四十九頁(yè)，共五十七頁(yè)，2022年，8月28日

，局中人1提出的份額應(yīng)為以下最大化問(wèn)題的解。

解得。相應(yīng)的分配結(jié)果為，。并將其賦值于圖4-11的節(jié)點(diǎn)上。子博弈精煉納什均衡的結(jié)果是：局中人1提出自己的份額為，局中人2同意局中人1的選擇，自己獲得利益份額。用以上方法，可以求得任何有限次輪流出價(jià)的討價(jià)還價(jià)博弈的結(jié)果如表4.9。第五十頁(yè)，共五十七頁(yè)，2022年，8月28日表4.9T（博弈次數(shù)）2345

第五十一頁(yè)，共五十七頁(yè)，2022年，8月28日子博弈精煉納什均衡結(jié)果與及的關(guān)系從表4.9中我們可以歸納出輪流出價(jià)的討價(jià)還價(jià)博弈模型的子博弈精煉納什均衡結(jié)果與及的關(guān)系：（1），。當(dāng)局中人2的時(shí)間貼現(xiàn)因子為0時(shí)，不論局中人1的時(shí)間貼現(xiàn)因子為何值，局中人1可獨(dú)占這份利益。（2），，，。若局中人1的貼現(xiàn)因子為0。局中人2的時(shí)間貼現(xiàn)因子為正數(shù)，利益分配取決于值。，局中人2多得，，局中人1多得。

(3)第五十二頁(yè)，共五十七頁(yè)，2

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

完全信息動(dòng)態(tài)博弈

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

完全信息動(dòng)態(tài)博弈

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔