高級微觀14貝葉斯均衡_第1頁
高級微觀14貝葉斯均衡_第2頁
高級微觀14貝葉斯均衡_第3頁
高級微觀14貝葉斯均衡_第4頁
高級微觀14貝葉斯均衡_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1第十二章 貝葉斯納什均衡及其精煉 第一節(jié)第一節(jié) 不完全信息博弈與貝葉斯納什均衡不完全信息博弈與貝葉斯納什均衡 第二節(jié)第二節(jié) 精煉貝葉斯納什均衡精煉貝葉斯納什均衡 第三節(jié)第三節(jié) 信號傳遞博弈信號傳遞博弈 2第一節(jié)第一節(jié) 不完全信息博弈與貝葉斯納什均衡不完全信息博弈與貝葉斯納什均衡 一、不完全信息博弈一、不完全信息博弈 完全信息博弈指博弈中的參與人對所有其他參與人的支付完全信息博弈指博弈中的參與人對所有其他參與人的支付(偏好)函數(shù)有完全的了解,并且支付函數(shù)是所有參與人的共同(偏好)函數(shù)有完全的了解,并且支付函數(shù)是所有參與人的共同知識(知識(common knowledgecommon knowl

2、edge)的博弈。反之,不滿足完全信息博弈)的博弈。反之,不滿足完全信息博弈假設(shè)的博弈稱為不完全信息博弈。假設(shè)的博弈稱為不完全信息博弈。3 二、海薩尼轉(zhuǎn)換二、海薩尼轉(zhuǎn)換 在博弈中,信息不完全使得博弈參與人必須預(yù)測其他參與在博弈中,信息不完全使得博弈參與人必須預(yù)測其他參與人的類型。至于人的類型。至于“類型類型”概念,以兩個企業(yè)博弈的例子說明。概念,以兩個企業(yè)博弈的例子說明。假設(shè)參與人假設(shè)參與人1 1為在位者企業(yè),參與人為在位者企業(yè),參與人2 2為進入者企業(yè)。進入者依為進入者企業(yè)。進入者依據(jù)在位者的生產(chǎn)成本高低選擇是否進入該行業(yè),高則進,低則據(jù)在位者的生產(chǎn)成本高低選擇是否進入該行業(yè),高則進,低則不

3、進。但是進入者不知道在位者的成本是高還是低。因此,進不進。但是進入者不知道在位者的成本是高還是低。因此,進入者必須預(yù)測在位者的成本入者必須預(yù)測在位者的成本“類型類型”,究竟是高成本的還是低,究竟是高成本的還是低成本的。海薩尼提出通過引入成本的。海薩尼提出通過引入“自然自然”概念解決這個問題。由概念解決這個問題。由自然實現(xiàn)行動,確定其他參與人的類型,從而轉(zhuǎn)換成我們已討自然實現(xiàn)行動,確定其他參與人的類型,從而轉(zhuǎn)換成我們已討論過的擴展式動態(tài)博弈結(jié)構(gòu)。即通過自然選擇類型,實現(xiàn)不完論過的擴展式動態(tài)博弈結(jié)構(gòu)。即通過自然選擇類型,實現(xiàn)不完全信息向完全信息的轉(zhuǎn)換,我們稱之為海薩尼轉(zhuǎn)換。全信息向完全信息的轉(zhuǎn)換,

4、我們稱之為海薩尼轉(zhuǎn)換。 4不完全信息意味著,至少有一個參與人擁有多種類型不完全信息意味著,至少有一個參與人擁有多種類型。用i表示參與人表示參與人i的一個特定類型,的一個特定類型,i表示參與人表示參與人i所有可能類型的所有可能類型的集 合 ,集 合 ,ii, 并 假 定并 假 定nii1取 自 某 個 客 觀 的 分 布 函 數(shù)取 自 某 個 客 觀 的 分 布 函 數(shù)),(1nP。 為簡化假定只有參與人為簡化假定只有參與人i本人觀察到自己的類型本人觀察到自己的類型i,其他人都不能察到其他人都不能察到i。我們假定分布函數(shù)我們假定分布函數(shù)),(1nP是所有參與是所有參與人的共同知識,在博弈開始時,

5、所有參與人關(guān)于自然行動的信念人的共同知識,在博弈開始時,所有參與人關(guān)于自然行動的信念是相同的。是相同的。 我們用我們用),(111niii表示除表示除i之外的所有參與之外的所有參與人的類型組合,這樣,人的類型組合,這樣,),(),(1iin。定義定義)(iiip為為參與人參與人i的條件概率即給定參與人的條件概率即給定參與人i屬于類型屬于類型i的條件下, 其他參的條件下, 其他參與人屬于與人屬于i的概率。的概率。 5根據(jù)條件概率規(guī)則:根據(jù)條件概率規(guī)則: iiiiiiiiiiiiiiiippppp),(),()(),()( (12.1) 這里,這里,)(iip是邊緣概率。如果類型的分布是獨立的,是

6、邊緣概率。如果類型的分布是獨立的,)()(iiiiipp。 6三、戰(zhàn)略表達式三、戰(zhàn)略表達式 不完全信息靜態(tài)博弈又稱靜態(tài)貝葉斯博弈。如同在完全信息靜不完全信息靜態(tài)博弈又稱靜態(tài)貝葉斯博弈。如同在完全信息靜態(tài)博弈中一樣, 靜態(tài)貝葉斯博弈的所有參與人同時行動, 參與人態(tài)博弈中一樣, 靜態(tài)貝葉斯博弈的所有參與人同時行動, 參與人i的戰(zhàn)略空間的戰(zhàn)略空間iS等同于他的行動空間等同于他的行動空間iA。 所不同的是, 參與人所不同的是, 參與人i的的行動空間行動空間iA可能依賴于他的類型可能依賴于他的類型i,即行動空間是類型依存的。即行動空間是類型依存的。 用用)(iiA表示參與人表示參與人i的類型依存行動空間

7、,的類型依存行動空間,)()(iiiiAa表示表示i的一個特定行動。類似地,參與人的一個特定行動。類似地,參與人i的支付函數(shù)也是類型依存的。的支付函數(shù)也是類型依存的。我們用我們用),(iiiiaau表示參與人表示參與人i的效用函數(shù)。于是,可以用下列戰(zhàn)的效用函數(shù)。于是,可以用下列戰(zhàn)略式表述靜態(tài)貝葉斯博弈。其定義為:略式表述靜態(tài)貝葉斯博弈。其定義為: 7n人靜態(tài)貝葉斯博弈的戰(zhàn)略式表述包括:參與人的類型空間人靜態(tài)貝葉斯博弈的戰(zhàn)略式表述包括:參與人的類型空間n,1, 條件概率條件概率npp,1, 類型依存戰(zhàn)略空間類型依存戰(zhàn)略空間)(.),(11nnAA,和類型依存支付函數(shù)和類型依存支付函數(shù));,(,)

8、,;,(1111nnnnaauaau。 參與人參與人i知知道自己的類型道自己的類型ii,條件概率條件概率)(iiiipp描述給定自己屬描述給定自己屬于于i的情況下,參與人的情況下,參與人i有關(guān)其他參與人類型有關(guān)其他參與人類型ii的不確定性。不確定性。,;,;,;.,1111nnnnuuppAAG代表這個博弈。代表這個博弈。 靜態(tài)貝葉斯博弈的時間順序如下:靜態(tài)貝葉斯博弈的時間順序如下: (1 1)自然選擇類型向量自然選擇類型向量),(1n,其中其中ii,參與人參與人i觀測到觀測到i,但參與人但參與人)( ij 只知道只知道)(jjjp,觀測不到觀測不到i。 (2 2)n個參與人同時選擇行動個參與

9、人同時選擇行動),(1naaa,其中其中iiAa 。 (3 3)參與人參與人i得到得到);,(1iniaau。 8給出四點討論給出四點討論 (1 1)如果所有參與人的類型空間只包含一個元素,即對于所)如果所有參與人的類型空間只包含一個元素,即對于所有的有的i,i, 不完全信息靜態(tài)博弈就退化為完全信息靜態(tài)博弈,不完全信息靜態(tài)博弈就退化為完全信息靜態(tài)博弈,所以后者是前者的一個特例。所以后者是前者的一個特例。 (2 2)我們給出參與人類型相互獨立的意義在于其保證不完全)我們給出參與人類型相互獨立的意義在于其保證不完全信息的存在。信息的存在。 (3 3)準確地說,其他參與人不知道參與人)準確地說,其他

10、參與人不知道參與人i的支付函數(shù)是指,的支付函數(shù)是指,其 不 知 道 參 與 人其 不 知 道 參 與 人i的 支 付 函 數(shù) 是的 支 付 函 數(shù) 是);,(1iniaau, 還 是還 是);,(1iniaau,這里這里ii,ii,ii。 (4 4)參與人)參與人i的期望效用函數(shù)為的期望效用函數(shù)為: ),);(),()(iiiiiiiiiiiaaupvi) 9四、貝葉斯納什均衡四、貝葉斯納什均衡 n人不完全信息靜態(tài)博弈人不完全信息靜態(tài)博弈 ,;,;,;.,1111nnnnuuppAAG 的純戰(zhàn)略貝葉斯納什均衡是一個類型依存戰(zhàn)略組合的純戰(zhàn)略貝葉斯納什均衡是一個類型依存戰(zhàn)略組合niiia1)(,

11、其其中每個參與人中每個參與人i在給定自己類型在給定自己類型i和其他參與人類型依存戰(zhàn)略和其他參與人類型依存戰(zhàn)略)(iia的情況下最大化自己的期望效用函數(shù)的情況下最大化自己的期望效用函數(shù)iv。 換言之,戰(zhàn)略組合換言之,戰(zhàn)略組合)(,),(11nnaaa 是一個貝葉斯納什是一個貝葉斯納什均衡,如果對于所有的均衡,如果對于所有的i,)(iiiAa,有:有: ),);(),()(maxarg)(iiiiiiiiiiaiiaaupai (12.3) 10五、一個例子:不完全信息古諾模型五、一個例子:不完全信息古諾模型 1.1.基本假定。參與人的類型是成本函數(shù),假定逆需求函數(shù)為基本假定。參與人的類型是成本函

12、數(shù),假定逆需求函數(shù)為21qqaP,令令ic為企業(yè)企業(yè)i的單位成本,那么企業(yè)的利潤函數(shù)為:的單位成本,那么企業(yè)的利潤函數(shù)為: )(21iiicqqaq,2 , 1i (12.412.4) 假定企業(yè)假定企業(yè) 1 1 只有一種類型,企業(yè)只有一種類型,企業(yè) 2 2 有兩種類型,企業(yè)有兩種類型,企業(yè) 1 1 的單位的單位成本成本1c是共同是共同知識,企業(yè)知識,企業(yè) 2 2 的單位成本是私人信息。企業(yè)的單位成本是私人信息。企業(yè) 2 2 知道自知道自己的真實成本類型, 而企業(yè)己的真實成本類型, 而企業(yè) 1 1 只知道只知道Lcc22的概率為的概率為,Hcc22的的概率為概率為)1 (;是共同知識。是共同知識

13、。 為了簡化討論,進一步假定為了簡化討論,進一步假定2a,11c,432Lc,452Hc,21。 112.2.均衡求解。均衡求解。 給定企業(yè)給定企業(yè) 2 2 知道企業(yè)知道企業(yè) 1 1 的成本, 企業(yè)的成本, 企業(yè) 2 2 將選擇將選擇2q以最大化利潤以最大化利潤函數(shù):函數(shù):)(2122qqtq,其中其中4543 at或或4345 at,依賴于企業(yè)依賴于企業(yè) 2 2 的實際成本。 由一階條件, 得到企業(yè)的實際成本。 由一階條件, 得到企業(yè) 2 2 的反應(yīng)函數(shù)為:的反應(yīng)函數(shù)為: )(21);(112qttqq (12.612.6) 這意味著,企業(yè)這意味著,企業(yè) 2 2 的最優(yōu)產(chǎn)量不僅依賴于企業(yè)的最

14、優(yōu)產(chǎn)量不僅依賴于企業(yè) 1 1 的產(chǎn)量,而且的產(chǎn)量,而且依賴于自己的成本 (或類型) 。依賴于自己的成本 (或類型) 。Lq2為45t時企業(yè)時企業(yè) 2 2 的最優(yōu)產(chǎn)量,的最優(yōu)產(chǎn)量,Hq2為為43t時企業(yè)時企業(yè) 2 2 的最優(yōu)產(chǎn)量。那么,的最優(yōu)產(chǎn)量。那么, )45(2112qqL,)43(2112qqH (12.712.7) 12企業(yè)企業(yè) 1 1 不知道企業(yè)不知道企業(yè) 2 2 的真實成本,進而無法判斷企業(yè)的真實成本,進而無法判斷企業(yè) 2 2 的反應(yīng)的反應(yīng)函數(shù)是函數(shù)是Lq2還是還是Hq2,因此企業(yè)因此企業(yè) 1 1 將選擇將選擇1q最大化下面的期望效用函最大化下面的期望效用函數(shù):數(shù): )1 (21)1

15、 (212112111HLqqqqqqE (12.812.8) 解最優(yōu)化的一階條件,得到企業(yè)解最優(yōu)化的一階條件,得到企業(yè) 1 1 的反應(yīng)函數(shù)為:的反應(yīng)函數(shù)為: )1 (21)21211 (212221EqqqqHL (12.912.9) 均衡意味著兩個反應(yīng)函數(shù)同時成立,解兩個反應(yīng)函數(shù)得到貝葉均衡意味著兩個反應(yīng)函數(shù)同時成立,解兩個反應(yīng)函數(shù)得到貝葉斯均衡為:斯均衡為: 311q;24112Lq,2452Hq 133.3.結(jié)論。結(jié)論。 比較不完全信息下貝葉斯均衡與完全信息下的納什均衡,會比較不完全信息下貝葉斯均衡與完全信息下的納什均衡,會有助于我們對二者區(qū)別與聯(lián)系的理解。完全信息下,如果企業(yè)有助于我

16、們對二者區(qū)別與聯(lián)系的理解。完全信息下,如果企業(yè) 2 2的成本是的成本是432c, 而且企業(yè)而且企業(yè) 1 1 知道知道432c, 則反應(yīng)函數(shù)分別為:則反應(yīng)函數(shù)分別為: )45(21)1 (211221qqqq (12.1012.10) 納什均衡產(chǎn)量為:納什均衡產(chǎn)量為:411NELq,212NELq,其中下標中的其中下標中的L表表示企業(yè)示企業(yè) 2 2 為低成本的情況。為低成本的情況。 14類似可以得到,當類似可以得到,當452c時,納什均衡產(chǎn)量為:時,納什均衡產(chǎn)量為:1251NEHq,612NEHq。因此,我們有:因此,我們有: 314111qqNEL,24112122LNELqq 3112511

17、qqNEH,2456122HNEHqq 在不完全信息情況下,低成本企業(yè)的產(chǎn)量相對較低,而高成本在不完全信息情況下,低成本企業(yè)的產(chǎn)量相對較低,而高成本企業(yè)的產(chǎn)量卻相對較高。其原因在于,企業(yè)企業(yè)的產(chǎn)量卻相對較高。其原因在于,企業(yè) 1 1 不知道企業(yè)不知道企業(yè) 2 2 的真實的真實類型, 因此只能生產(chǎn)預(yù)期的最優(yōu)產(chǎn)量, 追求期望效用函數(shù)的最大化。類型, 因此只能生產(chǎn)預(yù)期的最優(yōu)產(chǎn)量, 追求期望效用函數(shù)的最大化。圖圖 12121 1 對上述討論給出了一個直觀的表示。對上述討論給出了一個直觀的表示。 1516第二節(jié)第二節(jié) 精煉貝葉斯納什均衡精煉貝葉斯納什均衡 一、基本思想一、基本思想 精煉貝葉斯均衡是不完全

18、信息動態(tài)博弈均衡的基本均衡概念,精煉貝葉斯均衡是不完全信息動態(tài)博弈均衡的基本均衡概念,它是澤爾騰的完全信息動態(tài)博弈子博弈精煉納什均衡和海薩尼的不它是澤爾騰的完全信息動態(tài)博弈子博弈精煉納什均衡和海薩尼的不完全信息靜態(tài)博弈貝葉斯均衡的結(jié)合。精煉貝葉斯均衡要求,給定完全信息靜態(tài)博弈貝葉斯均衡的結(jié)合。精煉貝葉斯均衡要求,給定有關(guān)其他參與人的類型的信念,參與人的戰(zhàn)略在每一個信息集開始有關(guān)其他參與人的類型的信念,參與人的戰(zhàn)略在每一個信息集開始的的“后續(xù)博弈后續(xù)博弈”上構(gòu)成貝葉斯均衡;并且,在所有可能的情況下,上構(gòu)成貝葉斯均衡;并且,在所有可能的情況下,參與人使用貝葉斯法則修正有關(guān)其他參與人類型的信念。參與

19、人使用貝葉斯法則修正有關(guān)其他參與人類型的信念。 精煉貝葉斯均衡是貝葉斯均衡、子博弈精煉均衡和貝葉斯推斷精煉貝葉斯均衡是貝葉斯均衡、子博弈精煉均衡和貝葉斯推斷的結(jié)合。它要求:的結(jié)合。它要求: (1 1)在每一個信息集上,決策者必須有一個定義在屬于該信)在每一個信息集上,決策者必須有一個定義在屬于該信息集的所有決策結(jié)上的一個概率分布(信念);息集的所有決策結(jié)上的一個概率分布(信念); (2 2)給定該信息集上的概率分布和其他參與人的后續(xù)戰(zhàn)略,)給定該信息集上的概率分布和其他參與人的后續(xù)戰(zhàn)略,參與人的行動必須是最優(yōu)的;參與人的行動必須是最優(yōu)的; (3 3)每一個參與人根據(jù)貝葉斯法則和均衡戰(zhàn)略修正后驗

20、概率。)每一個參與人根據(jù)貝葉斯法則和均衡戰(zhàn)略修正后驗概率。17二、貝葉斯法則二、貝葉斯法則 貝葉斯法則正是根據(jù)新的信息從先驗概率得到后驗概率的基本貝葉斯法則正是根據(jù)新的信息從先驗概率得到后驗概率的基本方法。方法。 首先假定參與人的類型是獨立分布的,首先假定參與人的類型是獨立分布的,i有有K個可能的類型,個可能的類型,有有H個可能的行動。個可能的行動。k和和ha分別代表一個特定的類型和一個特定分別代表一個特定的類型和一個特定的行動,假定的行動,假定i屬于類型屬于類型k的先驗概率是的先驗概率是0)(kp,1)(1Kkkp;給定給定i屬于屬于k,i選擇選擇ha的條件概率為的條件概率為)(khap,1

21、)(hkhap。那么那么i選擇選擇ha的邊緣概率為:的邊緣概率為: 18KkkkhKKhhhpappappapaob111)()()()(,)()(Pr (12.1112.11) 即參與人即參與人i選擇行動選擇行動ha的“總”概率是每一種的“總”概率是每一種i選擇選擇ha的條件概的條件概率率)(khap的加權(quán)平均, 權(quán)數(shù)是他屬于每種類型的加權(quán)平均, 權(quán)數(shù)是他屬于每種類型k的先驗概率的先驗概率)(kp。 如果觀察到如果觀察到i選擇了選擇了ha,那么那么i屬于類型屬于類型k的后驗概率可以記為的后驗概率可以記為Prhkaob,表示給定表示給定ha的情況下的情況下i屬于類型屬于類型k的概率。根據(jù)概率的

22、概率。根據(jù)概率公式:公式: PrPr)()(,Prhhkkkhkhaobaobpapaob (12.1212.12) 19即即i屬于屬于k并選擇并選擇ha的聯(lián)合概率等于的聯(lián)合概率等于i屬于屬于k的先驗概率的先驗概率乘以乘以k類型的參與人選類型的參與人選擇ha的概率,或等于的概率,或等于i選擇選擇ha的總概率的總概率乘以給定乘以給定ha的情況下的情況下i屬于屬于k的后驗概率。的后驗概率。 Kjjjhkkhhkkhhkpappapaobpapaob1)()()()(Pr)()(Pr (12.1312.13) 精煉貝葉斯均衡假定參與人根據(jù)貝葉斯法則修正先驗概率。精煉貝葉斯均衡假定參與人根據(jù)貝葉斯法則

23、修正先驗概率。不過貝葉斯法則要求不過貝葉斯法則要求 0Prhaob, 即參與人即參與人 i i 必須以正的概率選擇必須以正的概率選擇ha,否則后驗概率沒有定義。如果否則后驗概率沒有定義。如果 0Prhaob,我們允許在我們允許在00,11區(qū)間取任何值,只要該取值與均衡戰(zhàn)略相容。在動態(tài)博弈中,區(qū)間取任何值,只要該取值與均衡戰(zhàn)略相容。在動態(tài)博弈中, 0Prhaob對應(yīng)著非均衡路徑上的信息集。對應(yīng)著非均衡路徑上的信息集。 20三、精煉貝葉斯均衡三、精煉貝葉斯均衡 假定有假定有n個參與人,參與人個參與人,參與人i的類型是的類型是ii,i是私人信息,是私人信息,)(iiip是屬于類是屬于類型i的參與人的

24、參與人i認為其他認為其他1n個參與人屬于類型個參與人屬于類型),(111niii的先驗概率的先驗概率。 令令iS是參與人是參與人i的戰(zhàn)略空間,的戰(zhàn)略空間,iiSs 是 一 個 依 賴 于 類 型是 一 個 依 賴 于 類 型i的 特 定 的 戰(zhàn) 略的 特 定 的 戰(zhàn) 略 。),(111hnhihihhiaaaaa是在第是在第h個信息集個信息集i觀察到其他觀察到其他1n個個參與人的行動組合,參與人的行動組合,它是戰(zhàn)略組合它是戰(zhàn)略組合),(111niiisssss所規(guī)定所規(guī)定的行動的一部分。的行動的一部分。)(hiiiap是在觀察到是在觀察到hia的情況下,參與人的情況下,參與人i認認為其他為其他

25、1n個參與人屬于類型個參與人屬于類型),(111niii的后驗概的后驗概率。率。ip是所有后驗概率是所有后驗概率)(hiiiap的集合,的集合,),(iiiissu表示參與人表示參與人i的效用函數(shù)。于是,精煉貝葉斯均衡可以定義如下:的效用函數(shù)。于是,精煉貝葉斯均衡可以定義如下: 21精煉貝葉斯均衡是一個戰(zhàn)略組合精煉貝葉斯均衡是一個戰(zhàn)略組合)(,),()(11nnsss和一和一個后驗概率組合個后驗概率組合),(1nppp,滿足:滿足: (P)(P)對于所有參與人對于所有參與人i,在每一個信息集在每一個信息集h, );,()(maxarg),(iiiihiiisiiissuapssii (B)(B

26、)(hiiiap是使用貝葉斯法則從先驗概率是使用貝葉斯法則從先驗概率)(iiip,觀測到的觀測到的hia和最和最優(yōu)戰(zhàn)略優(yōu)戰(zhàn)略)(is得到的(在可能的情況下) 。得到的(在可能的情況下) 。 對上述定義給出五點討論對上述定義給出五點討論 (1)(1)(P)(P)是精煉條件是精煉條件。 即給定其他參與人的戰(zhàn)略即給定其他參與人的戰(zhàn)略),(111niiisssss和參與人和參與人i的后驗概率的后驗概率)(hiiiap,每個參與人每個參與人i的戰(zhàn)略在所有從信息集的戰(zhàn)略在所有從信息集h開始開始的后續(xù)博弈上都是最優(yōu)的,或者說所有參與人都是序貫理性的的后續(xù)博弈上都是最優(yōu)的,或者說所有參與人都是序貫理性的。 2

27、2(2 2)(B)(B)對應(yīng)的是貝葉斯法則的應(yīng)用。對應(yīng)的是貝葉斯法則的應(yīng)用。 如果參與人是多次行動的,修正概率涉及到貝葉斯法則的重復(fù)如果參與人是多次行動的,修正概率涉及到貝葉斯法則的重復(fù)運用。應(yīng)該注意,戰(zhàn)略作為行動規(guī)則而非行動本身,它是不可觀察運用。應(yīng)該注意,戰(zhàn)略作為行動規(guī)則而非行動本身,它是不可觀察的,因此的,因此參與人參與人i只能根據(jù)觀測到的只能根據(jù)觀測到的),(111niiiaaaaa修正修正概 率 , 但 他 假 定 所 觀 測 到 的 行 動 是 最 優(yōu) 戰(zhàn) 略概 率 , 但 他 假 定 所 觀 測 到 的 行 動 是 最 優(yōu) 戰(zhàn) 略),(111niiisssss規(guī)定的行動。規(guī)定的行

28、動。 限制條件“在可能的情況下”的含義是:如果限制條件“在可能的情況下”的含義是:如果ia不是均衡戰(zhàn)不是均衡戰(zhàn)略下的行動,觀測到的略下的行動,觀測到的ia是一個零概率事件,此時貝葉斯法則對是一個零概率事件,此時貝葉斯法則對后驗概率沒有定義,任何后驗概率沒有定義,任何 1 , 0 )(hiiiap都是允許的,只要保證與都是允許的,只要保證與均衡戰(zhàn)略相容。均衡戰(zhàn)略相容。 23(3 3)上述定義的要點)上述定義的要點是,精煉貝葉斯均衡是均衡戰(zhàn)略和均衡是,精煉貝葉斯均衡是均衡戰(zhàn)略和均衡信念的結(jié)合:給定信念信念的結(jié)合:給定信念),(1nppp,戰(zhàn)略戰(zhàn)略),(1nsss是最優(yōu)是最優(yōu)的;給定戰(zhàn)略的;給定戰(zhàn)略

29、),(1nsss,信念信念),(1nppp是使用貝葉斯法是使用貝葉斯法則從均衡戰(zhàn)略和所觀測到的行動得到的。因此精煉貝葉斯均衡是一則從均衡戰(zhàn)略和所觀測到的行動得到的。因此精煉貝葉斯均衡是一個對應(yīng)的不動點:個對應(yīng)的不動點:)(spss;)(pspp (12.1412.14) (4 4)需要特別強調(diào),)需要特別強調(diào),因為精煉貝葉斯均衡是一個不動點,后因為精煉貝葉斯均衡是一個不動點,后驗概率依賴于戰(zhàn)略,戰(zhàn)略依賴于后驗概率。由于我們無法知道先行驗概率依賴于戰(zhàn)略,戰(zhàn)略依賴于后驗概率。由于我們無法知道先行動者的選擇,也就無法知道后行動者的選擇,因此完全信息博弈中動者的選擇,也就無法知道后行動者的選擇,因此完

30、全信息博弈中采用的逆向歸納法(采用的逆向歸納法(backward inductionbackward induction)求解精煉均衡的方法并)求解精煉均衡的方法并不適用。我們必須使用前向法(不適用。我們必須使用前向法(forward mannerforward manner)進行貝葉斯修正。)進行貝葉斯修正。 (5 5)注意,)注意,我們在此只寫出純戰(zhàn)略均衡,上述定義也適用于我們在此只寫出純戰(zhàn)略均衡,上述定義也適用于混合戰(zhàn)略(行為戰(zhàn)略)概念?;旌蠎?zhàn)略(行為戰(zhàn)略)概念。 24第三節(jié)第三節(jié) 信號傳遞博弈信號傳遞博弈一、基本理論分析框架一、基本理論分析框架 1.1.基本假定?;炯俣?。博弈中有兩個

31、參與人博弈中有兩個參與人,2 , 1i;參與人參與人 1 1 稱為信稱為信號發(fā)送者, 參與人號發(fā)送者, 參與人 2 2 稱為信號接收者。 參與人稱為信號接收者。 參與人 1 1 的類型是私人信息,的類型是私人信息,參與人參與人 2 2 的類型是公共信息。的類型是公共信息。 2.2.行動順序。行動順序。該博弈的行動順序如下:該博弈的行動順序如下: ( 1 1) “ 自 然 ” 首 先 選 擇 參 與 人) “ 自 然 ” 首 先 選 擇 參 與 人 1 1 的 類 型的 類 型,其 中其 中,1K是參與人是參與人 1 1 的類型空間,參與人的類型空間,參與人 1 1 知道知道,但參與人但參與人2

32、 2 不知道不知道,只知道參與人只知道參與人 1 1 屬于屬于的先驗概率的先驗概率)(pp ,1)(kkp。只有參與人只有參與人 1 1 的類型為私人信息,所以可以將表示的類型為私人信息,所以可以將表示參與人的下標參與人的下標 i 省去省去不寫。 25(2 2)參與人)參與人 1 1 在觀測到類型在觀測到類型后選擇發(fā)出信號后選擇發(fā)出信號Mm(而不是(而不是類型類型) ,這里) ,這里,1JmmM是信號空間。是信號空間。 (3 3)參與人)參與人 2 2 觀測到參與人觀測到參與人 1 1 發(fā)出的信號發(fā)出的信號m后,由貝葉斯法后,由貝葉斯法則從先驗概率則從先驗概率)(pp 得到后驗概率得到后驗概率

33、)(mpp,然后選擇行動然后選擇行動Aa,這里這里,1HaaA是參與人是參與人 2 2 的行動空間。的行動空間。 (4 4)兩個參與人的支付函數(shù)分別為)兩個參與人的支付函數(shù)分別為),(1amu和),(2amu。 圖圖 12122 2 給出了一個簡單的信號傳遞博弈的擴展式表述,其中給出了一個簡單的信號傳遞博弈的擴展式表述,其中2HJK,)(11mpp,)(21mpq。圖中省略了支付向量。圖中省略了支付向量。 26273.3.定義。定義。令令)(m是參與人是參與人 1 1 類型依存的信號戰(zhàn)略,類型依存的信號戰(zhàn)略,)(ma是參是參與人與人 2 2 的行動戰(zhàn)略, (這里,仍然允許混合戰(zhàn)略的存在,如參與

34、人的行動戰(zhàn)略, (這里,仍然允許混合戰(zhàn)略的存在,如參與人 1 1以某種概率隨機地選擇不同信號,參與人以某種概率隨機地選擇不同信號,參與人 2 2 以某種概率隨機地選擇以某種概率隨機地選擇行動) 。信號傳遞博弈精煉貝葉斯均衡可以定義如下:行動) 。信號傳遞博弈精煉貝葉斯均衡可以定義如下: 信號傳遞博弈的精煉貝葉斯均衡是戰(zhàn)略組合信號傳遞博弈的精煉貝葉斯均衡是戰(zhàn)略組合)(),(mam和和后驗概率后驗概率)(mp的結(jié)合,其滿足:的結(jié)合,其滿足: (P(P1 1) ),()(maxarg)(2amumpmaa (P(P2 2) ),(,(maxarg)(1mamumm (B)(B)(mp是參與人是參與人

35、 2 2 使用貝葉斯法則從先驗概率使用貝葉斯法則從先驗概率)(p,觀測觀測到的信號到的信號m和參與人和參與人 1 1 的最優(yōu)戰(zhàn)略的最優(yōu)戰(zhàn)略)(m得到的(在可能的情況得到的(在可能的情況下) 。下) 。 28 (P (P1 1) )和和(P(P2 2) )等價于精煉貝葉斯均衡定義中的(等價于精煉貝葉斯均衡定義中的(P P) ,是精煉條) ,是精煉條件。件。(P(P1 1) )是說給定后驗概率是說給定后驗概率(B)(B)(mp,參與人參與人 2 2 對參與人對參與人 1 1 發(fā)出發(fā)出的信號作出最優(yōu)反應(yīng);的信號作出最優(yōu)反應(yīng);(P2)(P2)是說預(yù)測到參與人是說預(yù)測到參與人 2 2 的最優(yōu)反應(yīng)的最優(yōu)反

36、應(yīng))(ma, 參與人參與人 1 1 選擇自己的最優(yōu)戰(zhàn)略。選擇自己的最優(yōu)戰(zhàn)略。 (B)(B)是貝葉斯法則的應(yīng)用。是貝葉斯法則的應(yīng)用。限制條件“在可能的情況下”的含義是與前述定義中相同。限制條件“在可能的情況下”的含義是與前述定義中相同。 294.4.均衡分類。均衡分類。信號傳遞博弈的所有可能的精煉貝葉斯均衡可以劃信號傳遞博弈的所有可能的精煉貝葉斯均衡可以劃分為三類,即:分離均衡、混同均衡和準分離均衡。分為三類,即:分離均衡、混同均衡和準分離均衡。 (1 1)分離均衡:)分離均衡:不同類型的發(fā)送者(不同類型的發(fā)送者(參與人參與人 1 1)以)以 1 1 的概率選擇的概率選擇不同的信號,或者說,沒有

37、任何類型選擇與其他類型相同的信號。在不同的信號,或者說,沒有任何類型選擇與其他類型相同的信號。在分離均衡之下,信號準確的揭示類型。假定分離均衡之下,信號準確的揭示類型。假定2 JK(即只有兩個類(即只有兩個類型,兩個信號) ,那么分離均衡意味著:如果型,兩個信號) ,那么分離均衡意味著:如果1m是類型是類型1的最優(yōu)選擇,的最優(yōu)選擇,1m就不可能是類型就不可能是類型2的最優(yōu)選擇,并且的最優(yōu)選擇,并且2m一定是類型一定是類型2的最優(yōu)選的最優(yōu)選擇。擇。 用公式表示為:用公式表示為: ),(,(),(,(121111mamumamu;),(,(),(,(211221mamumamu; 因此,后驗概率是

38、:因此,后驗概率是: 1)(11mp,0)(21mp,0)(12mp,1)(22mp 30(2 2)混同均衡:)混同均衡:不同類型的發(fā)送者(不同類型的發(fā)送者(參與人參與人 1 1)選擇相同的信)選擇相同的信號,或者說,沒有任何類型選擇與其他類型不同的信號。因此,號,或者說,沒有任何類型選擇與其他類型不同的信號。因此,參參與人與人 1 1 的信號選擇沒有信息量,的信號選擇沒有信息量,接收者(接收者(參與人參與人 2 2)不據(jù)此修正先)不據(jù)此修正先驗概率。驗概率。假定假定jm是均衡戰(zhàn)略,那么:是均衡戰(zhàn)略,那么: ),(,(),(,(1111mamumamuj;),(,(),(,(2121mamum

39、amuj; )()(kjkpmp (3 3)準分離均衡:)準分離均衡:一些類型的發(fā)送者隨機地選擇信號,另一一些類型的發(fā)送者隨機地選擇信號,另一些類型的發(fā)送者選擇特定的信號。假定類型些類型的發(fā)送者選擇特定的信號。假定類型1的發(fā)送者隨機地選擇的發(fā)送者隨機地選擇1m和和2m,其選擇其選擇1m的概率為的概率為;類型類型2的發(fā)送者以的發(fā)送者以 1 1 的概率選擇的概率選擇2m,如果這個戰(zhàn)略組合是均衡戰(zhàn)略組合,那么滿足:如果這個戰(zhàn)略組合是均衡戰(zhàn)略組合,那么滿足: 31),(,(),(,(121111mamumamu ),(,(),(,(221211mamumamu1)(0)()()(21111pppmp

40、)()(1)()1 ()()1 ()(121121ppppmp )()(1)()1 ()(1)(221222ppppmp 32參與人參與人 2 2 根據(jù)參與人根據(jù)參與人 1 1 的信號選擇修正信念的規(guī)則是:如的信號選擇修正信念的規(guī)則是:如果觀測到果觀測到1m, 則認定參與人則認定參與人 1 1 的類型一定是的類型一定是1, 因為類型因為類型2不不會選擇會選擇1m;如果觀測到如果觀測到2m,參與人,參與人 2 2 不能準確地知道參與人不能準確地知道參與人1 1 的真實類型,但是他會推斷其屬于類型的真實類型,但是他會推斷其屬于類型1的概率下降了,而的概率下降了,而屬于類型屬于類型2的概率上升了。的

41、概率上升了。這個思想是易于理解的。這個思想是易于理解的。 33 二、應(yīng)用舉例:用負債比率顯示企業(yè)質(zhì)量二、應(yīng)用舉例:用負債比率顯示企業(yè)質(zhì)量 1.1.模型簡介。模型簡介。 羅斯模型中,假設(shè)企業(yè)經(jīng)理知道企業(yè)利潤的分布函數(shù),而羅斯模型中,假設(shè)企業(yè)經(jīng)理知道企業(yè)利潤的分布函數(shù),而外部投資者不知道;企業(yè)的利潤的分布函數(shù)是一階隨機占優(yōu)排外部投資者不知道;企業(yè)的利潤的分布函數(shù)是一階隨機占優(yōu)排序的。經(jīng)理的效用函數(shù)是企業(yè)市場價值的增函數(shù),是企業(yè)破產(chǎn)序的。經(jīng)理的效用函數(shù)是企業(yè)市場價值的增函數(shù),是企業(yè)破產(chǎn)概率的減函數(shù)。經(jīng)理使用企業(yè)的負債比例向投資者傳遞企業(yè)利概率的減函數(shù)。經(jīng)理使用企業(yè)的負債比例向投資者傳遞企業(yè)利潤分布的

42、信息。負債比例之所以能夠傳遞企業(yè)質(zhì)量的信息是基潤分布的信息。負債比例之所以能夠傳遞企業(yè)質(zhì)量的信息是基于投資者如下的信念:企業(yè)破產(chǎn)概率與企業(yè)質(zhì)量負相關(guān),與企于投資者如下的信念:企業(yè)破產(chǎn)概率與企業(yè)質(zhì)量負相關(guān),與企業(yè)負債率正相關(guān),只有高質(zhì)量的企業(yè)才有能力承擔較高負債率,業(yè)負債率正相關(guān),只有高質(zhì)量的企業(yè)才有能力承擔較高負債率,而低質(zhì)量的企業(yè)不敢用過度舉債的辦法模仿高質(zhì)量企業(yè)。換言而低質(zhì)量的企業(yè)不敢用過度舉債的辦法模仿高質(zhì)量企業(yè)。換言之,越是好企業(yè),負債率越高。之,越是好企業(yè),負債率越高。342 2. .基基本本假假定定。假假定定有有兩兩個個時時期期,兩兩個個參參與與人人,即即經(jīng)經(jīng)理理和和投投資資者者。

43、企企業(yè)業(yè)第第二二時時期期的的利利潤潤記記作作,在在區(qū)區(qū)間間, 0上上服服從從均均勻勻分分布布;經(jīng)經(jīng)理理知知道道企企業(yè)業(yè)類類型型,投投資資者者只只知知道道的的概概率率分分布布)(而而不不知知道道的的真真實實情情況況。第第一一時時期期,經(jīng)經(jīng)理理首首先先選選擇擇負負債債水水平平D并并向向投投資資者者發(fā)發(fā)布布這這一一信信號號,投投資資者者據(jù)據(jù)此此決決定定企企業(yè)業(yè)是是市市場場價價值值0V;在在第第二二時時期期,企企業(yè)業(yè)利利潤潤實實現(xiàn)現(xiàn)。 我我們們僅僅分分析析第第一一時時期期,這這是是一一個個兩兩階階段段博博弈弈。經(jīng)經(jīng)理理的的目目標標是是最最大大 化化 企企 業(yè)業(yè) 第第 一一 時時 期期 的的 市市 場場 價價 值值 和和 扣扣 減減 破破 產(chǎn)產(chǎn) 懲懲 罰罰 后后 的的 第第 二二 時時 期期 期期 望望價價值值的的加加權(quán)權(quán)平平均均數(shù)數(shù)。即即: )2()()1 (),(,(00DLDVDVDu (12.1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論