高級(jí)微觀14貝葉斯均衡

上傳人：1*** IP屬地：湖北上傳時(shí)間：2022-04-28 格式：PPT 頁數(shù)：37 大小：1MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩32頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1第十二章貝葉斯納什均衡及其精煉第一節(jié)第一節(jié) 不完全信息博弈與貝葉斯納什均衡不完全信息博弈與貝葉斯納什均衡第二節(jié)第二節(jié) 精煉貝葉斯納什均衡精煉貝葉斯納什均衡第三節(jié)第三節(jié) 信號(hào)傳遞博弈信號(hào)傳遞博弈 2第一節(jié)第一節(jié) 不完全信息博弈與貝葉斯納什均衡不完全信息博弈與貝葉斯納什均衡一、不完全信息博弈一、不完全信息博弈完全信息博弈指博弈中的參與人對所有其他參與人的支付完全信息博弈指博弈中的參與人對所有其他參與人的支付（偏好）函數(shù)有完全的了解，并且支付函數(shù)是所有參與人的共同（偏好）函數(shù)有完全的了解，并且支付函數(shù)是所有參與人的共同知識(shí)（知識(shí)（common knowledgecommon knowl

2、edge）的博弈。反之，不滿足完全信息博弈）的博弈。反之，不滿足完全信息博弈假設(shè)的博弈稱為不完全信息博弈。假設(shè)的博弈稱為不完全信息博弈。3 二、海薩尼轉(zhuǎn)換二、海薩尼轉(zhuǎn)換在博弈中，信息不完全使得博弈參與人必須預(yù)測其他參與在博弈中，信息不完全使得博弈參與人必須預(yù)測其他參與人的類型。至于人的類型。至于“類型類型”概念，以兩個(gè)企業(yè)博弈的例子說明。概念，以兩個(gè)企業(yè)博弈的例子說明。假設(shè)參與人假設(shè)參與人1 1為在位者企業(yè)，參與人為在位者企業(yè)，參與人2 2為進(jìn)入者企業(yè)。進(jìn)入者依為進(jìn)入者企業(yè)。進(jìn)入者依據(jù)在位者的生產(chǎn)成本高低選擇是否進(jìn)入該行業(yè)，高則進(jìn)，低則據(jù)在位者的生產(chǎn)成本高低選擇是否進(jìn)入該行業(yè)，高則進(jìn)，低則不

3、進(jìn)。但是進(jìn)入者不知道在位者的成本是高還是低。因此，進(jìn)不進(jìn)。但是進(jìn)入者不知道在位者的成本是高還是低。因此，進(jìn)入者必須預(yù)測在位者的成本入者必須預(yù)測在位者的成本“類型類型”，究竟是高成本的還是低，究竟是高成本的還是低成本的。海薩尼提出通過引入成本的。海薩尼提出通過引入“自然自然”概念解決這個(gè)問題。由概念解決這個(gè)問題。由自然實(shí)現(xiàn)行動(dòng)，確定其他參與人的類型，從而轉(zhuǎn)換成我們已討自然實(shí)現(xiàn)行動(dòng)，確定其他參與人的類型，從而轉(zhuǎn)換成我們已討論過的擴(kuò)展式動(dòng)態(tài)博弈結(jié)構(gòu)。即通過自然選擇類型，實(shí)現(xiàn)不完論過的擴(kuò)展式動(dòng)態(tài)博弈結(jié)構(gòu)。即通過自然選擇類型，實(shí)現(xiàn)不完全信息向完全信息的轉(zhuǎn)換，我們稱之為海薩尼轉(zhuǎn)換。全信息向完全信息的轉(zhuǎn)換，

4、我們稱之為海薩尼轉(zhuǎn)換。 4不完全信息意味著，至少有一個(gè)參與人擁有多種類型不完全信息意味著，至少有一個(gè)參與人擁有多種類型。用i表示參與人表示參與人i的一個(gè)特定類型，的一個(gè)特定類型，i表示參與人表示參與人i所有可能類型的所有可能類型的集合，集合，ii，并假定并假定nii1取自某個(gè) 客觀的分布函數(shù)取自某個(gè) 客觀的分布函數(shù)),(1nP。為簡化假定只有參與人為簡化假定只有參與人i本人觀察到自己的類型本人觀察到自己的類型i，其他人都不能察到其他人都不能察到i。我們假定分布函數(shù)我們假定分布函數(shù)),(1nP是所有參與是所有參與人的共同知識(shí)，在博弈開始時(shí)，

5、所有參與人關(guān)于自然行動(dòng)的信念人的共同知識(shí)，在博弈開始時(shí)，所有參與人關(guān)于自然行動(dòng)的信念是相同的。是相同的。我們用我們用),(111niii表示除表示除i之外的所有參與之外的所有參與人的類型組合，這樣，人的類型組合，這樣，),(),(1iin。定義定義)(iiip為為參與人參與人i的條件概率即給定參與人的條件概率即給定參與人i屬于類型屬于類型i的條件下，其他參的條件下，其他參與人屬于與人屬于i的概率。的概率。 5根據(jù)條件概率規(guī)則：根據(jù)條件概率規(guī)則： iiiiiiiiiiiiiiiippppp),(),()(),()( （12.1）這里，這里，)(iip是邊緣概率。如果類型的分布是獨(dú)立的，是

6、邊緣概率。如果類型的分布是獨(dú)立的，)()(iiiiipp。 6三、戰(zhàn)略表達(dá)式三、戰(zhàn)略表達(dá)式不完全信息靜態(tài)博弈又稱靜態(tài)貝葉斯博弈。如同在完全信息靜不完全信息靜態(tài)博弈又稱靜態(tài)貝葉斯博弈。如同在完全信息靜態(tài)博弈中一樣，靜態(tài)貝葉斯博弈的所有參與人同時(shí)行動(dòng)，參與人態(tài)博弈中一樣，靜態(tài)貝葉斯博弈的所有參與人同時(shí)行動(dòng)，參與人i的戰(zhàn)略空間的戰(zhàn)略空間iS等同于他的行動(dòng)空間等同于他的行動(dòng)空間iA。所不同的是，參與人所不同的是，參與人i的的行動(dòng)空間行動(dòng)空間iA可能依賴于他的類型可能依賴于他的類型i，即行動(dòng)空間是類型依存的。即行動(dòng)空間是類型依存的。用用)(iiA表示參與人表示參與人i的類型依存行動(dòng)空間

7、，的類型依存行動(dòng)空間，)()(iiiiAa表示表示i的一個(gè)特定行動(dòng)。類似地，參與人的一個(gè)特定行動(dòng)。類似地，參與人i的支付函數(shù)也是類型依存的。的支付函數(shù)也是類型依存的。我們用我們用),(iiiiaau表示參與人表示參與人i的效用函數(shù)。于是，可以用下列戰(zhàn)的效用函數(shù)。于是，可以用下列戰(zhàn)略式表述靜態(tài)貝葉斯博弈。其定義為：略式表述靜態(tài)貝葉斯博弈。其定義為： 7n人靜態(tài)貝葉斯博弈的戰(zhàn)略式表述包括：參與人的類型空間人靜態(tài)貝葉斯博弈的戰(zhàn)略式表述包括：參與人的類型空間n,1，條件概率條件概率npp,1，類型依存戰(zhàn)略空間類型依存戰(zhàn)略空間)(.),(11nnAA，和類型依存支付函數(shù)和類型依存支付函數(shù));,(,)

8、,;,(1111nnnnaauaau。參與人參與人i知知道自己的類型道自己的類型ii，條件概率條件概率)(iiiipp描述給定自己屬描述給定自己屬于于i的情況下，參與人的情況下，參與人i有關(guān)其他參與人類型有關(guān)其他參與人類型ii的不確定性。不確定性。,;,;,;.,1111nnnnuuppAAG代表這個(gè)博弈。代表這個(gè)博弈。靜態(tài)貝葉斯博弈的時(shí)間順序如下：靜態(tài)貝葉斯博弈的時(shí)間順序如下：（1 1）自然選擇類型向量自然選擇類型向量),(1n，其中其中ii，參與人參與人i觀測到觀測到i，但參與人但參與人)( ij 只知道只知道)(jjjp，觀測不到觀測不到i。（2 2）n個(gè)參與人同時(shí)選擇行動(dòng)個(gè)參與

9、人同時(shí)選擇行動(dòng)),(1naaa，其中其中iiAa 。（3 3）參與人參與人i得到得到);,(1iniaau。 8給出四點(diǎn)討論給出四點(diǎn)討論（1 1）如果所有參與人的類型空間只包含一個(gè)元素，即對于所）如果所有參與人的類型空間只包含一個(gè)元素，即對于所有的有的i，i，不完全信息靜態(tài)博弈就退化為完全信息靜態(tài)博弈，不完全信息靜態(tài)博弈就退化為完全信息靜態(tài)博弈，所以后者是前者的一個(gè)特例。所以后者是前者的一個(gè)特例。（2 2）我們給出參與人類型相互獨(dú)立的意義在于其保證不完全）我們給出參與人類型相互獨(dú)立的意義在于其保證不完全信息的存在。信息的存在。（3 3）準(zhǔn)確地說，其他參與人不知道參與人）準(zhǔn)確地說，其他

10、參與人不知道參與人i的支付函數(shù)是指，的支付函數(shù)是指，其不知道參與人其不知道參與人i的支付函數(shù) 是的支付函數(shù) 是);,(1iniaau，還是還是);,(1iniaau，這里這里ii，ii，ii。（4 4）參與人）參與人i的期望效用函數(shù)為的期望效用函數(shù)為： ),);(),()(iiiiiiiiiiiaaupvi） 9四、貝葉斯納什均衡四、貝葉斯納什均衡 n人不完全信息靜態(tài)博弈人不完全信息靜態(tài)博弈 ,;,;,;.,1111nnnnuuppAAG 的純戰(zhàn)略貝葉斯納什均衡是一個(gè)類型依存戰(zhàn)略組合的純戰(zhàn)略貝葉斯納什均衡是一個(gè)類型依存戰(zhàn)略組合niiia1)(，

11、其其中每個(gè)參與人中每個(gè)參與人i在給定自己類型在給定自己類型i和其他參與人類型依存戰(zhàn)略和其他參與人類型依存戰(zhàn)略)(iia的情況下最大化自己的期望效用函數(shù)的情況下最大化自己的期望效用函數(shù)iv。換言之，戰(zhàn)略組合換言之，戰(zhàn)略組合)(,),(11nnaaa 是一個(gè)貝葉斯納什是一個(gè)貝葉斯納什均衡，如果對于所有的均衡，如果對于所有的i，)(iiiAa，有：有： ),);(),()(maxarg)(iiiiiiiiiiaiiaaupai （12.3） 10五、一個(gè)例子：不完全信息古諾模型五、一個(gè)例子：不完全信息古諾模型 1.1.基本假定。參與人的類型是成本函數(shù)，假定逆需求函數(shù)為基本假定。參與人的類型是成本函

12、數(shù)，假定逆需求函數(shù)為21qqaP，令令ic為企業(yè)企業(yè)i的單位成本，那么企業(yè)的利潤函數(shù)為：的單位成本，那么企業(yè)的利潤函數(shù)為： )(21iiicqqaq，2 , 1i （12.412.4）假定企業(yè)假定企業(yè) 1 1 只有一種類型，企業(yè)只有一種類型，企業(yè) 2 2 有兩種類型，企業(yè)有兩種類型，企業(yè) 1 1 的單位的單位成本成本1c是共同是共同知識(shí)，企業(yè)知識(shí)，企業(yè) 2 2 的單位成本是私人信息。企業(yè)的單位成本是私人信息。企業(yè) 2 2 知道自知道自己的真實(shí)成本類型，而企業(yè)己的真實(shí)成本類型，而企業(yè) 1 1 只知道只知道Lcc22的概率為的概率為，Hcc22的的概率為概率為)1 (；是共同知識(shí)。是共同知識(shí)

13、。為了簡化討論，進(jìn)一步假定為了簡化討論，進(jìn)一步假定2a，11c，432Lc，452Hc，21。 112.2.均衡求解。均衡求解。給定企業(yè)給定企業(yè) 2 2 知道企業(yè)知道企業(yè) 1 1 的成本，企業(yè)的成本，企業(yè) 2 2 將選擇將選擇2q以最大化利潤以最大化利潤函數(shù)：函數(shù)：)(2122qqtq，其中其中4543 at或或4345 at，依賴于企業(yè)依賴于企業(yè) 2 2 的實(shí)際成本。由一階條件，得到企業(yè)的實(shí)際成本。由一階條件，得到企業(yè) 2 2 的反應(yīng)函數(shù)為：的反應(yīng)函數(shù)為： )(21);(112qttqq （12.612.6）這意味著，企業(yè)這意味著，企業(yè) 2 2 的最優(yōu)產(chǎn)量不僅依賴于企業(yè)的最

14、優(yōu)產(chǎn)量不僅依賴于企業(yè) 1 1 的產(chǎn)量，而且的產(chǎn)量，而且依賴于自己的成本（或類型）。依賴于自己的成本（或類型）。Lq2為45t時(shí)企業(yè)時(shí)企業(yè) 2 2 的最優(yōu)產(chǎn)量，的最優(yōu)產(chǎn)量，Hq2為為43t時(shí)企業(yè)時(shí)企業(yè) 2 2 的最優(yōu)產(chǎn)量。那么，的最優(yōu)產(chǎn)量。那么， )45(2112qqL，)43(2112qqH （12.712.7） 12企業(yè)企業(yè) 1 1 不知道企業(yè)不知道企業(yè) 2 2 的真實(shí)成本，進(jìn)而無法判斷企業(yè)的真實(shí)成本，進(jìn)而無法判斷企業(yè) 2 2 的反應(yīng)的反應(yīng)函數(shù)是函數(shù)是Lq2還是還是Hq2，因此企業(yè)因此企業(yè) 1 1 將選擇將選擇1q最大化下面的期望效用函最大化下面的期望效用函數(shù)：數(shù)： )1 (21)1

15、 (212112111HLqqqqqqE （12.812.8）解最優(yōu)化的一階條件，得到企業(yè)解最優(yōu)化的一階條件，得到企業(yè) 1 1 的反應(yīng)函數(shù)為：的反應(yīng)函數(shù)為： )1 (21)21211 (212221EqqqqHL （12.912.9）均衡意味著兩個(gè)反應(yīng)函數(shù)同時(shí)成立，解兩個(gè)反應(yīng)函數(shù)得到貝葉均衡意味著兩個(gè)反應(yīng)函數(shù)同時(shí)成立，解兩個(gè)反應(yīng)函數(shù)得到貝葉斯均衡為：斯均衡為： 311q；24112Lq，2452Hq 133.3.結(jié)論。結(jié)論。比較不完全信息下貝葉斯均衡與完全信息下的納什均衡，會(huì)比較不完全信息下貝葉斯均衡與完全信息下的納什均衡，會(huì)有助于我們對二者區(qū)別與聯(lián)系的理解。完全信息下，如果企業(yè)有助于我

16、們對二者區(qū)別與聯(lián)系的理解。完全信息下，如果企業(yè) 2 2的成本是的成本是432c，而且企業(yè)而且企業(yè) 1 1 知道知道432c，則反應(yīng)函數(shù)分別為：則反應(yīng)函數(shù)分別為： )45(21)1 (211221qqqq （12.1012.10）納什均衡產(chǎn)量為：納什均衡產(chǎn)量為：411NELq，212NELq，其中下標(biāo)中的其中下標(biāo)中的L表表示企業(yè)示企業(yè) 2 2 為低成本的情況。為低成本的情況。 14類似可以得到，當(dāng)類似可以得到，當(dāng)452c時(shí)，納什均衡產(chǎn)量為：時(shí)，納什均衡產(chǎn)量為：1251NEHq，612NEHq。因此，我們有：因此，我們有： 314111qqNEL，24112122LNELqq 3112511

17、qqNEH，2456122HNEHqq 在不完全信息情況下，低成本企業(yè)的產(chǎn)量相對較低，而高成本在不完全信息情況下，低成本企業(yè)的產(chǎn)量相對較低，而高成本企業(yè)的產(chǎn)量卻相對較高。其原因在于，企業(yè)企業(yè)的產(chǎn)量卻相對較高。其原因在于，企業(yè) 1 1 不知道企業(yè)不知道企業(yè) 2 2 的真實(shí)的真實(shí)類型，因此只能生產(chǎn)預(yù)期的最優(yōu)產(chǎn)量，追求期望效用函數(shù)的最大化。類型，因此只能生產(chǎn)預(yù)期的最優(yōu)產(chǎn)量，追求期望效用函數(shù)的最大化。圖圖 12121 1 對上述討論給出了一個(gè)直觀的表示。對上述討論給出了一個(gè)直觀的表示。 1516第二節(jié)第二節(jié) 精煉貝葉斯納什均衡精煉貝葉斯納什均衡一、基本思想一、基本思想精煉貝葉斯均衡是不完全

18、信息動(dòng)態(tài)博弈均衡的基本均衡概念，精煉貝葉斯均衡是不完全信息動(dòng)態(tài)博弈均衡的基本均衡概念，它是澤爾騰的完全信息動(dòng)態(tài)博弈子博弈精煉納什均衡和海薩尼的不它是澤爾騰的完全信息動(dòng)態(tài)博弈子博弈精煉納什均衡和海薩尼的不完全信息靜態(tài)博弈貝葉斯均衡的結(jié)合。精煉貝葉斯均衡要求，給定完全信息靜態(tài)博弈貝葉斯均衡的結(jié)合。精煉貝葉斯均衡要求，給定有關(guān)其他參與人的類型的信念，參與人的戰(zhàn)略在每一個(gè)信息集開始有關(guān)其他參與人的類型的信念，參與人的戰(zhàn)略在每一個(gè)信息集開始的的“后續(xù)博弈后續(xù)博弈”上構(gòu)成貝葉斯均衡；并且，在所有可能的情況下，上構(gòu)成貝葉斯均衡；并且，在所有可能的情況下，參與人使用貝葉斯法則修正有關(guān)其他參與人類型的信念。參與

19、人使用貝葉斯法則修正有關(guān)其他參與人類型的信念。精煉貝葉斯均衡是貝葉斯均衡、子博弈精煉均衡和貝葉斯推斷精煉貝葉斯均衡是貝葉斯均衡、子博弈精煉均衡和貝葉斯推斷的結(jié)合。它要求：的結(jié)合。它要求：（1 1）在每一個(gè)信息集上，決策者必須有一個(gè)定義在屬于該信）在每一個(gè)信息集上，決策者必須有一個(gè)定義在屬于該信息集的所有決策結(jié)上的一個(gè)概率分布（信念）；息集的所有決策結(jié)上的一個(gè)概率分布（信念）；（2 2）給定該信息集上的概率分布和其他參與人的后續(xù)戰(zhàn)略，）給定該信息集上的概率分布和其他參與人的后續(xù)戰(zhàn)略，參與人的行動(dòng)必須是最優(yōu)的；參與人的行動(dòng)必須是最優(yōu)的；（3 3）每一個(gè)參與人根據(jù)貝葉斯法則和均衡戰(zhàn)略修正后驗(yàn)

20、概率。）每一個(gè)參與人根據(jù)貝葉斯法則和均衡戰(zhàn)略修正后驗(yàn)概率。17二、貝葉斯法則二、貝葉斯法則貝葉斯法則正是根據(jù)新的信息從先驗(yàn)概率得到后驗(yàn)概率的基本貝葉斯法則正是根據(jù)新的信息從先驗(yàn)概率得到后驗(yàn)概率的基本方法。方法。首先假定參與人的類型是獨(dú)立分布的，首先假定參與人的類型是獨(dú)立分布的，i有有K個(gè)可能的類型，個(gè)可能的類型，有有H個(gè)可能的行動(dòng)。個(gè)可能的行動(dòng)。k和和ha分別代表一個(gè)特定的類型和一個(gè)特定分別代表一個(gè)特定的類型和一個(gè)特定的行動(dòng)，假定的行動(dòng)，假定i屬于類型屬于類型k的先驗(yàn)概率是的先驗(yàn)概率是0)(kp，1)(1Kkkp；給定給定i屬于屬于k，i選擇選擇ha的條件概率為的條件概率為)(khap，1

21、)(hkhap。那么那么i選擇選擇ha的邊緣概率為：的邊緣概率為： 18KkkkhKKhhhpappappapaob111)()()()(,)()(Pr （12.1112.11）即參與人即參與人i選擇行動(dòng)選擇行動(dòng)ha的“總”概率是每一種的“總”概率是每一種i選擇選擇ha的條件概的條件概率率)(khap的加權(quán)平均，權(quán)數(shù)是他屬于每種類型的加權(quán)平均，權(quán)數(shù)是他屬于每種類型k的先驗(yàn)概率的先驗(yàn)概率)(kp。如果觀察到如果觀察到i選擇了選擇了ha，那么那么i屬于類型屬于類型k的后驗(yàn)概率可以記為的后驗(yàn)概率可以記為Prhkaob，表示給定表示給定ha的情況下的情況下i屬于類型屬于類型k的概率。根據(jù)概率的

22、概率。根據(jù)概率公式：公式： PrPr)()(,Prhhkkkhkhaobaobpapaob （12.1212.12） 19即即i屬于屬于k并選擇并選擇ha的聯(lián)合概率等于的聯(lián)合概率等于i屬于屬于k的先驗(yàn)概率的先驗(yàn)概率乘以乘以k類型的參與人選類型的參與人選擇ha的概率，或等于的概率，或等于i選擇選擇ha的總概率的總概率乘以給定乘以給定ha的情況下的情況下i屬于屬于k的后驗(yàn)概率。的后驗(yàn)概率。 Kjjjhkkhhkkhhkpappapaobpapaob1)()()()(Pr)()(Pr （12.1312.13）精煉貝葉斯均衡假定參與人根據(jù)貝葉斯法則修正先驗(yàn)概率。精煉貝葉斯均衡假定參與人根據(jù)貝葉斯法則

23、修正先驗(yàn)概率。不過貝葉斯法則要求不過貝葉斯法則要求 0Prhaob，即參與人即參與人 i i 必須以正的概率選擇必須以正的概率選擇ha，否則后驗(yàn)概率沒有定義。如果否則后驗(yàn)概率沒有定義。如果 0Prhaob，我們允許在我們允許在00，11區(qū)間取任何值，只要該取值與均衡戰(zhàn)略相容。在動(dòng)態(tài)博弈中，區(qū)間取任何值，只要該取值與均衡戰(zhàn)略相容。在動(dòng)態(tài)博弈中， 0Prhaob對應(yīng)著非均衡路徑上的信息集。對應(yīng)著非均衡路徑上的信息集。 20三、精煉貝葉斯均衡三、精煉貝葉斯均衡假定有假定有n個(gè)參與人，參與人個(gè)參與人，參與人i的類型是的類型是ii，i是私人信息，是私人信息，)(iiip是屬于類是屬于類型i的參與人的

24、參與人i認(rèn)為其他認(rèn)為其他1n個(gè)參與人屬于類型個(gè)參與人屬于類型),(111niii的先驗(yàn)概率的先驗(yàn)概率。令令iS是參與人是參與人i的戰(zhàn)略空間，的戰(zhàn)略空間，iiSs 是一個(gè) 依賴于類型是一個(gè) 依賴于類型i的特定的戰(zhàn) 略的特定的戰(zhàn) 略。),(111hnhihihhiaaaaa是在第是在第h個(gè)信息集個(gè)信息集i觀察到其他觀察到其他1n個(gè)個(gè)參與人的行動(dòng)組合，參與人的行動(dòng)組合，它是戰(zhàn)略組合它是戰(zhàn)略組合),(111niiisssss所規(guī)定所規(guī)定的行動(dòng)的一部分。的行動(dòng)的一部分。)(hiiiap是在觀察到是在觀察到hia的情況下，參與人的情況下，參與人i認(rèn)認(rèn)為其他為其他

25、1n個(gè)參與人屬于類型個(gè)參與人屬于類型),(111niii的后驗(yàn)概的后驗(yàn)概率。率。ip是所有后驗(yàn)概率是所有后驗(yàn)概率)(hiiiap的集合，的集合，),(iiiissu表示參與人表示參與人i的效用函數(shù)。于是，精煉貝葉斯均衡可以定義如下：的效用函數(shù)。于是，精煉貝葉斯均衡可以定義如下： 21精煉貝葉斯均衡是一個(gè)戰(zhàn)略組合精煉貝葉斯均衡是一個(gè)戰(zhàn)略組合)(,),()(11nnsss和一和一個(gè)后驗(yàn)概率組合個(gè)后驗(yàn)概率組合),(1nppp，滿足：滿足： (P)(P)對于所有參與人對于所有參與人i，在每一個(gè)信息集在每一個(gè)信息集h， );,()(maxarg),(iiiihiiisiiissuapssii (B)(B

26、)(hiiiap是使用貝葉斯法則從先驗(yàn)概率是使用貝葉斯法則從先驗(yàn)概率)(iiip，觀測到的觀測到的hia和最和最優(yōu)戰(zhàn)略優(yōu)戰(zhàn)略)(is得到的（在可能的情況下）。得到的（在可能的情況下）。對上述定義給出五點(diǎn)討論對上述定義給出五點(diǎn)討論 (1)(1)(P)(P)是精煉條件是精煉條件。即給定其他參與人的戰(zhàn)略即給定其他參與人的戰(zhàn)略),(111niiisssss和參與人和參與人i的后驗(yàn)概率的后驗(yàn)概率)(hiiiap，每個(gè)參與人每個(gè)參與人i的戰(zhàn)略在所有從信息集的戰(zhàn)略在所有從信息集h開始開始的后續(xù)博弈上都是最優(yōu)的，或者說所有參與人都是序貫理性的的后續(xù)博弈上都是最優(yōu)的，或者說所有參與人都是序貫理性的。 2

27、2（2 2）(B)(B)對應(yīng)的是貝葉斯法則的應(yīng)用。對應(yīng)的是貝葉斯法則的應(yīng)用。如果參與人是多次行動(dòng)的，修正概率涉及到貝葉斯法則的重復(fù)如果參與人是多次行動(dòng)的，修正概率涉及到貝葉斯法則的重復(fù)運(yùn)用。應(yīng)該注意，戰(zhàn)略作為行動(dòng)規(guī)則而非行動(dòng)本身，它是不可觀察運(yùn)用。應(yīng)該注意，戰(zhàn)略作為行動(dòng)規(guī)則而非行動(dòng)本身，它是不可觀察的，因此的，因此參與人參與人i只能根據(jù)觀測到的只能根據(jù)觀測到的),(111niiiaaaaa修正修正概率，但他假定所觀測到的行動(dòng) 是最優(yōu) 戰(zhàn) 略概率，但他假定所觀測到的行動(dòng) 是最優(yōu) 戰(zhàn) 略),(111niiisssss規(guī)定的行動(dòng)。規(guī)定的行

28、動(dòng)。限制條件“在可能的情況下”的含義是：如果限制條件“在可能的情況下”的含義是：如果ia不是均衡戰(zhàn)不是均衡戰(zhàn)略下的行動(dòng)，觀測到的略下的行動(dòng)，觀測到的ia是一個(gè)零概率事件，此時(shí)貝葉斯法則對是一個(gè)零概率事件，此時(shí)貝葉斯法則對后驗(yàn)概率沒有定義，任何后驗(yàn)概率沒有定義，任何 1 , 0 )(hiiiap都是允許的，只要保證與都是允許的，只要保證與均衡戰(zhàn)略相容。均衡戰(zhàn)略相容。 23（3 3）上述定義的要點(diǎn)）上述定義的要點(diǎn)是，精煉貝葉斯均衡是均衡戰(zhàn)略和均衡是，精煉貝葉斯均衡是均衡戰(zhàn)略和均衡信念的結(jié)合：給定信念信念的結(jié)合：給定信念),(1nppp，戰(zhàn)略戰(zhàn)略),(1nsss是最優(yōu)是最優(yōu)的；給定戰(zhàn)略的；給定戰(zhàn)略

29、),(1nsss，信念信念),(1nppp是使用貝葉斯法是使用貝葉斯法則從均衡戰(zhàn)略和所觀測到的行動(dòng)得到的。因此精煉貝葉斯均衡是一則從均衡戰(zhàn)略和所觀測到的行動(dòng)得到的。因此精煉貝葉斯均衡是一個(gè)對應(yīng)的不動(dòng)點(diǎn)：個(gè)對應(yīng)的不動(dòng)點(diǎn)：)(spss；)(pspp （12.1412.14）（4 4）需要特別強(qiáng)調(diào)，）需要特別強(qiáng)調(diào)，因?yàn)榫珶捸惾~斯均衡是一個(gè)不動(dòng)點(diǎn)，后因?yàn)榫珶捸惾~斯均衡是一個(gè)不動(dòng)點(diǎn)，后驗(yàn)概率依賴于戰(zhàn)略，戰(zhàn)略依賴于后驗(yàn)概率。由于我們無法知道先行驗(yàn)概率依賴于戰(zhàn)略，戰(zhàn)略依賴于后驗(yàn)概率。由于我們無法知道先行動(dòng)者的選擇，也就無法知道后行動(dòng)者的選擇，因此完全信息博弈中動(dòng)者的選擇，也就無法知道后行動(dòng)者的選擇，因此完

30、全信息博弈中采用的逆向歸納法（采用的逆向歸納法（backward inductionbackward induction）求解精煉均衡的方法并）求解精煉均衡的方法并不適用。我們必須使用前向法（不適用。我們必須使用前向法（forward mannerforward manner）進(jìn)行貝葉斯修正。）進(jìn)行貝葉斯修正。（5 5）注意，）注意，我們在此只寫出純戰(zhàn)略均衡，上述定義也適用于我們在此只寫出純戰(zhàn)略均衡，上述定義也適用于混合戰(zhàn)略（行為戰(zhàn)略）概念。混合戰(zhàn)略（行為戰(zhàn)略）概念。 24第三節(jié)第三節(jié) 信號(hào)傳遞博弈信號(hào)傳遞博弈一、基本理論分析框架一、基本理論分析框架 1.1.基本假定?；炯俣ā２┺闹杏袃蓚€(gè)

31、參與人博弈中有兩個(gè)參與人，2 , 1i；參與人參與人 1 1 稱為信稱為信號(hào)發(fā)送者，參與人號(hào)發(fā)送者，參與人 2 2 稱為信號(hào)接收者。參與人稱為信號(hào)接收者。參與人 1 1 的類型是私人信息，的類型是私人信息，參與人參與人 2 2 的類型是公共信息。的類型是公共信息。 2.2.行動(dòng)順序。行動(dòng)順序。該博弈的行動(dòng)順序如下：該博弈的行動(dòng)順序如下：（ 1 1） “ 自然 ” 首先選擇參與人） “ 自然 ” 首先選擇參與人 1 1 的類型的類型，其中其中,1K是參與人是參與人 1 1 的類型空間，參與人的類型空間，參與人 1 1 知道知道，但參與人但參與人2

32、 2 不知道不知道，只知道參與人只知道參與人 1 1 屬于屬于的先驗(yàn)概率的先驗(yàn)概率)(pp ，1)(kkp。只有參與人只有參與人 1 1 的類型為私人信息，所以可以將表示的類型為私人信息，所以可以將表示參與人的下標(biāo)參與人的下標(biāo) i 省去省去不寫。 25（2 2）參與人）參與人 1 1 在觀測到類型在觀測到類型后選擇發(fā)出信號(hào)后選擇發(fā)出信號(hào)Mm（而不是（而不是類型類型），這里），這里,1JmmM是信號(hào)空間。是信號(hào)空間。（3 3）參與人）參與人 2 2 觀測到參與人觀測到參與人 1 1 發(fā)出的信號(hào)發(fā)出的信號(hào)m后，由貝葉斯法后，由貝葉斯法則從先驗(yàn)概率則從先驗(yàn)概率)(pp 得到后驗(yàn)概率得到后驗(yàn)概率

33、)(mpp，然后選擇行動(dòng)然后選擇行動(dòng)Aa，這里這里,1HaaA是參與人是參與人 2 2 的行動(dòng)空間。的行動(dòng)空間。（4 4）兩個(gè)參與人的支付函數(shù)分別為）兩個(gè)參與人的支付函數(shù)分別為),(1amu和),(2amu。圖圖 12122 2 給出了一個(gè)簡單的信號(hào)傳遞博弈的擴(kuò)展式表述，其中給出了一個(gè)簡單的信號(hào)傳遞博弈的擴(kuò)展式表述，其中2HJK，)(11mpp，)(21mpq。圖中省略了支付向量。圖中省略了支付向量。 26273.3.定義。定義。令令)(m是參與人是參與人 1 1 類型依存的信號(hào)戰(zhàn)略，類型依存的信號(hào)戰(zhàn)略，)(ma是參是參與人與人 2 2 的行動(dòng)戰(zhàn)略，（這里，仍然允許混合戰(zhàn)略的存在，如參與

34、人的行動(dòng)戰(zhàn)略，（這里，仍然允許混合戰(zhàn)略的存在，如參與人 1 1以某種概率隨機(jī)地選擇不同信號(hào)，參與人以某種概率隨機(jī)地選擇不同信號(hào)，參與人 2 2 以某種概率隨機(jī)地選擇以某種概率隨機(jī)地選擇行動(dòng)）。信號(hào)傳遞博弈精煉貝葉斯均衡可以定義如下：行動(dòng)）。信號(hào)傳遞博弈精煉貝葉斯均衡可以定義如下：信號(hào)傳遞博弈的精煉貝葉斯均衡是戰(zhàn)略組合信號(hào)傳遞博弈的精煉貝葉斯均衡是戰(zhàn)略組合)(),(mam和和后驗(yàn)概率后驗(yàn)概率)(mp的結(jié)合，其滿足：的結(jié)合，其滿足： (P(P1 1) ),()(maxarg)(2amumpmaa (P(P2 2) ),(,(maxarg)(1mamumm (B)(B)(mp是參與人是參與人

35、 2 2 使用貝葉斯法則從先驗(yàn)概率使用貝葉斯法則從先驗(yàn)概率)(p，觀測觀測到的信號(hào)到的信號(hào)m和參與人和參與人 1 1 的最優(yōu)戰(zhàn)略的最優(yōu)戰(zhàn)略)(m得到的（在可能的情況得到的（在可能的情況下）。下）。 28 (P (P1 1) )和和(P(P2 2) )等價(jià)于精煉貝葉斯均衡定義中的（等價(jià)于精煉貝葉斯均衡定義中的（P P），是精煉條），是精煉條件。件。(P(P1 1) )是說給定后驗(yàn)概率是說給定后驗(yàn)概率(B)(B)(mp，參與人參與人 2 2 對參與人對參與人 1 1 發(fā)出發(fā)出的信號(hào)作出最優(yōu)反應(yīng)；的信號(hào)作出最優(yōu)反應(yīng)；(P2)(P2)是說預(yù)測到參與人是說預(yù)測到參與人 2 2 的最優(yōu)反應(yīng)的最優(yōu)反

36、應(yīng))(ma，參與人參與人 1 1 選擇自己的最優(yōu)戰(zhàn)略。選擇自己的最優(yōu)戰(zhàn)略。 (B)(B)是貝葉斯法則的應(yīng)用。是貝葉斯法則的應(yīng)用。限制條件“在可能的情況下”的含義是與前述定義中相同。限制條件“在可能的情況下”的含義是與前述定義中相同。 294.4.均衡分類。均衡分類。信號(hào)傳遞博弈的所有可能的精煉貝葉斯均衡可以劃信號(hào)傳遞博弈的所有可能的精煉貝葉斯均衡可以劃分為三類，即：分離均衡、混同均衡和準(zhǔn)分離均衡。分為三類，即：分離均衡、混同均衡和準(zhǔn)分離均衡。（1 1）分離均衡：）分離均衡：不同類型的發(fā)送者（不同類型的發(fā)送者（參與人參與人 1 1）以）以 1 1 的概率選擇的概率選擇不同的信號(hào)，或者說，沒有

37、任何類型選擇與其他類型相同的信號(hào)。在不同的信號(hào)，或者說，沒有任何類型選擇與其他類型相同的信號(hào)。在分離均衡之下，信號(hào)準(zhǔn)確的揭示類型。假定分離均衡之下，信號(hào)準(zhǔn)確的揭示類型。假定2 JK（即只有兩個(gè)類（即只有兩個(gè)類型，兩個(gè)信號(hào)），那么分離均衡意味著：如果型，兩個(gè)信號(hào)），那么分離均衡意味著：如果1m是類型是類型1的最優(yōu)選擇，的最優(yōu)選擇，1m就不可能是類型就不可能是類型2的最優(yōu)選擇，并且的最優(yōu)選擇，并且2m一定是類型一定是類型2的最優(yōu)選的最優(yōu)選擇。擇。用公式表示為：用公式表示為： ),(,(),(,(121111mamumamu；),(,(),(,(211221mamumamu；因此，后驗(yàn)概率是

38、：因此，后驗(yàn)概率是： 1)(11mp，0)(21mp，0)(12mp，1)(22mp 30（2 2）混同均衡：）混同均衡：不同類型的發(fā)送者（不同類型的發(fā)送者（參與人參與人 1 1）選擇相同的信）選擇相同的信號(hào)，或者說，沒有任何類型選擇與其他類型不同的信號(hào)。因此，號(hào)，或者說，沒有任何類型選擇與其他類型不同的信號(hào)。因此，參參與人與人 1 1 的信號(hào)選擇沒有信息量，的信號(hào)選擇沒有信息量，接收者（接收者（參與人參與人 2 2）不據(jù)此修正先）不據(jù)此修正先驗(yàn)概率。驗(yàn)概率。假定假定jm是均衡戰(zhàn)略，那么：是均衡戰(zhàn)略，那么： ),(,(),(,(1111mamumamuj；),(,(),(,(2121mamum

39、amuj； )()(kjkpmp （3 3）準(zhǔn)分離均衡：）準(zhǔn)分離均衡：一些類型的發(fā)送者隨機(jī)地選擇信號(hào)，另一一些類型的發(fā)送者隨機(jī)地選擇信號(hào)，另一些類型的發(fā)送者選擇特定的信號(hào)。假定類型些類型的發(fā)送者選擇特定的信號(hào)。假定類型1的發(fā)送者隨機(jī)地選擇的發(fā)送者隨機(jī)地選擇1m和和2m，其選擇其選擇1m的概率為的概率為；類型類型2的發(fā)送者以的發(fā)送者以 1 1 的概率選擇的概率選擇2m，如果這個(gè)戰(zhàn)略組合是均衡戰(zhàn)略組合，那么滿足：如果這個(gè)戰(zhàn)略組合是均衡戰(zhàn)略組合，那么滿足： 31),(,(),(,(121111mamumamu ),(,(),(,(221211mamumamu1)(0)()()(21111pppmp

40、)()(1)()1 ()()1 ()(121121ppppmp )()(1)()1 ()(1)(221222ppppmp 32參與人參與人 2 2 根據(jù)參與人根據(jù)參與人 1 1 的信號(hào)選擇修正信念的規(guī)則是：如的信號(hào)選擇修正信念的規(guī)則是：如果觀測到果觀測到1m，則認(rèn)定參與人則認(rèn)定參與人 1 1 的類型一定是的類型一定是1，因?yàn)轭愋鸵驗(yàn)轭愋?不不會(huì)選擇會(huì)選擇1m；如果觀測到如果觀測到2m，參與人，參與人 2 2 不能準(zhǔn)確地知道參與人不能準(zhǔn)確地知道參與人1 1 的真實(shí)類型，但是他會(huì)推斷其屬于類型的真實(shí)類型，但是他會(huì)推斷其屬于類型1的概率下降了，而的概率下降了，而屬于類型屬于類型2的概率上升了。的

41、概率上升了。這個(gè)思想是易于理解的。這個(gè)思想是易于理解的。 33 二、應(yīng)用舉例：用負(fù)債比率顯示企業(yè)質(zhì)量二、應(yīng)用舉例：用負(fù)債比率顯示企業(yè)質(zhì)量 1.1.模型簡介。模型簡介。羅斯模型中，假設(shè)企業(yè)經(jīng)理知道企業(yè)利潤的分布函數(shù)，而羅斯模型中，假設(shè)企業(yè)經(jīng)理知道企業(yè)利潤的分布函數(shù)，而外部投資者不知道；企業(yè)的利潤的分布函數(shù)是一階隨機(jī)占優(yōu)排外部投資者不知道；企業(yè)的利潤的分布函數(shù)是一階隨機(jī)占優(yōu)排序的。經(jīng)理的效用函數(shù)是企業(yè)市場價(jià)值的增函數(shù)，是企業(yè)破產(chǎn)序的。經(jīng)理的效用函數(shù)是企業(yè)市場價(jià)值的增函數(shù)，是企業(yè)破產(chǎn)概率的減函數(shù)。經(jīng)理使用企業(yè)的負(fù)債比例向投資者傳遞企業(yè)利概率的減函數(shù)。經(jīng)理使用企業(yè)的負(fù)債比例向投資者傳遞企業(yè)利潤分布的

42、信息。負(fù)債比例之所以能夠傳遞企業(yè)質(zhì)量的信息是基潤分布的信息。負(fù)債比例之所以能夠傳遞企業(yè)質(zhì)量的信息是基于投資者如下的信念：企業(yè)破產(chǎn)概率與企業(yè)質(zhì)量負(fù)相關(guān)，與企于投資者如下的信念：企業(yè)破產(chǎn)概率與企業(yè)質(zhì)量負(fù)相關(guān)，與企業(yè)負(fù)債率正相關(guān)，只有高質(zhì)量的企業(yè)才有能力承擔(dān)較高負(fù)債率，業(yè)負(fù)債率正相關(guān)，只有高質(zhì)量的企業(yè)才有能力承擔(dān)較高負(fù)債率，而低質(zhì)量的企業(yè)不敢用過度舉債的辦法模仿高質(zhì)量企業(yè)。換言而低質(zhì)量的企業(yè)不敢用過度舉債的辦法模仿高質(zhì)量企業(yè)。換言之，越是好企業(yè)，負(fù)債率越高。之，越是好企業(yè)，負(fù)債率越高。342 2. .基基本本假假定定。假假定定有有兩兩個(gè)個(gè)時(shí)時(shí)期期，兩兩個(gè)個(gè)參參與與人人，即即經(jīng)經(jīng)理理和和投投資資者者。

43、企企業(yè)業(yè)第第二二時(shí)時(shí)期期的的利利潤潤記記作作，在在區(qū)區(qū)間間, 0上上服服從從均均勻勻分分布布；經(jīng)經(jīng)理理知知道道企企業(yè)業(yè)類類型型，投投資資者者只只知知道道的的概概率率分分布布)(而而不不知知道道的的真真實(shí)實(shí)情情況況。第第一一時(shí)時(shí)期期，經(jīng)經(jīng)理理首首先先選選擇擇負(fù)負(fù)債債水水平平D并并向向投投資資者者發(fā)發(fā)布布這這一一信信號(hào)號(hào)，投投資資者者據(jù)據(jù)此此決決定定企企業(yè)業(yè)是是市市場場價(jià)價(jià)值值0V；在在第第二二時(shí)時(shí)期期，企企業(yè)業(yè)利利潤潤實(shí)實(shí)現(xiàn)現(xiàn)。我我們們僅僅分分析析第第一一時(shí)時(shí)期期，這這是是一一個(gè)個(gè)兩兩階階段段博博弈弈。經(jīng)經(jīng)理理的的目目標(biāo)標(biāo)是是最最大大化化企企業(yè)業(yè) 第第一一時(shí)時(shí) 期期的的市市場場價(jià)價(jià) 值值和和扣扣減減破破產(chǎn)產(chǎn) 懲懲罰罰后后的的第第二二時(shí)時(shí) 期期期期望望價(jià)價(jià)值值的的加加權(quán)權(quán)平平均均數(shù)數(shù)。即即： )2()()1 (),(,(00DLDVDVDu （12.1

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

高級(jí)微觀14貝葉斯均衡

文檔簡介

溫馨提示

最新文檔

評論

高級(jí)微觀14貝葉斯均衡

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔