完美貝葉斯均衡_第1頁
完美貝葉斯均衡_第2頁
完美貝葉斯均衡_第3頁
完美貝葉斯均衡_第4頁
完美貝葉斯均衡_第5頁
已閱讀5頁,還剩93頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

Lecture12:

perfectBayesianequilibrium1第12講:完美貝葉斯均衡0.引言1.完美貝葉斯均衡的要求2.完美貝葉斯均衡的初步解釋2.1兩方兩階段不完全信息動態(tài)博弈2.2三方三階段不完全信息動態(tài)博弈2第12講:完美貝葉斯均衡0.引言3第12講:完美貝葉斯均衡完全且完美信息的二手車交易模型411122好不好賣不賣不賣賣買不買買不買(0,0)(2,1)(0,0)(1,-1)(-1,0)(0,0)完全且完美信息的二手車交易模型第12講:完美貝葉斯均衡完全但不完美信息的二手車交易模型51112好差賣不賣不賣賣買不買買不買(0,0)(2,1)(0,0)(1,-1)(-1,0)(0,0)完全但不完美信息的二手車交易模型第12講:完美貝葉斯均衡由于完全但不完美信息動態(tài)博弈中存在“多節(jié)點信息集”,因此子博弈概念的理解和逆推歸納法的應(yīng)用都需要作一些修正。不完美信息動態(tài)博弈的擴展形必然包含多節(jié)點信息集,至少部分階段不構(gòu)成子博弈。6第12講:完美貝葉斯均衡均衡策略組合對任何種類博弈的分析都是關(guān)鍵,對不完美信息動態(tài)博弈也不例外。對一個動態(tài)博弈來講,“可信性”始終是均衡的一個中心問題,理想的均衡必須能夠排除任何不可信的威脅或承諾。7第12講:完美貝葉斯均衡核心均衡概念完全信息靜態(tài)博弈:納什均衡完全且完美信息動態(tài)博弈:子博弈完美納什均衡完全但不完美信息動態(tài)博弈:完美貝葉斯均衡8第12講:完美貝葉斯均衡完美貝葉斯均衡(perfectBayesianequilibrium)9第12講:完美貝葉斯均衡10貝葉斯(Bayes)公式:設(shè){A1,…,An}為必然事件的一個分割,P(Ai)>0,i=1,…,n。又設(shè)P(B)>0,則注意(貝葉斯公式是專門用來計算后驗概率的):

(1)條件概率P(Ai|B),…,P(An|B)稱為A1,…,An的后驗概率,因為它們是在知道事件B發(fā)生之后,事件A1,…,An發(fā)生的概率。

(2)對應(yīng)地,P(A1),…,P(An)稱為A1,…,An的先驗概率。

(3)由于B的發(fā)生提供了新的信息,因而產(chǎn)生了從先驗概率到后驗概率的變化。第12講:完美貝葉斯均衡完全但不完美信息的二手車交易模型“逆推歸納法”的分析結(jié)果(設(shè)p(g)≠0,1):(1)若賣方(博弈方1)在車況“差”時選擇“賣”的概率p(s|b)<p(g)/[1-p(g)],那么買方(博弈方2)對賣方(博弈方1)決定賣車時車況“好”的“判斷”p(g|s)>1/2,此時博弈方2在第三階段總是選擇“買”,博弈方1在第二階段總是選擇“賣”;博弈方1是主動選擇和理性行為的,因此概率分布p(s|g)和p(s|b)取決于博弈方1的理性策略。111112好差賣不賣不賣賣買不買買不買(0,0)(2,1)(0,0)(1,-1)(-1,0)(0,0)第12講:完美貝葉斯均衡

(2)若賣方(博弈方1)在車況“差”時選擇“賣”的概率p(s|b)>p(g)/[1-p(g)],那么買方(博弈方2)對賣方(博弈方1)決定賣車時車況“好”的“判斷”p(g|s)<1/2,此時博弈方2在第三階段總是選擇“不買”,博弈方1在第二階段總是選擇“不賣”。

博弈方1是主動選擇和理性行為的,因此概率分布p(s|g)和p(s|b)取決于博弈方1的理性策略。121112好差賣不賣不賣賣買不買買不買(0,0)(2,1)(0,0)(1,-1)(-1,0)(0,0)第12講:完美貝葉斯均衡1.完美貝葉斯均衡的要求13第12講:完美貝葉斯均衡完美貝葉斯均衡的要求要求1:在每個信息集,輪到選擇的博弈方必須具有一個關(guān)于博弈達到該信息集中每個節(jié)點可能性的“判斷”(Belief)。

(a)對于多節(jié)點信息集,“判斷”就是博弈達到該信息集中各個節(jié)點可能性的概率分布;

(b)對于單節(jié)點信息集,則可理解為“判斷”博弈達到該節(jié)點的概率為1。141112好差賣不賣不賣賣買不買買不買(0,0)(2,1)(0,0)(1,-1)(-1,0)(0,0)第12講:完美貝葉斯均衡要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。

(a)在各個信息集,給定輪到選擇博弈方的判斷和其他博弈方的“后續(xù)策略”,該博弈方的行為及以后階段的“后續(xù)策略”,必須使自己的得益或期望得益最大。

(b)此處所謂“后續(xù)策略”即相應(yīng)的博弈方在所討論信息集以后的階段中,針對所有可能情況如何行為的完整計劃。151112好差賣不賣不賣賣買不買買不買(0,0)(2,1)(0,0)(1,-1)(-1,0)(0,0)第12講:完美貝葉斯均衡要求3:在均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方的均衡策略決定。要求4:在不處于均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方在此處可能有的均衡策略決定。161112好差賣不賣不賣賣買不買買不買(0,0)(2,1)(0,0)(1,-1)(-1,0)(0,0)第12講:完美貝葉斯均衡完美貝葉斯均衡要求1:在每個信息集,輪到選擇的博弈方必須具有一個關(guān)于博弈達到該信息集中每個節(jié)點可能性的“判斷”(Belief)。要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。要求3:在均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方的均衡策略決定。要求4:在不處于均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方在此處可能有的均衡策略決定。17第12講:完美貝葉斯均衡當(dāng)某策略組合及相應(yīng)的判斷滿足這樣四個要求時,稱為一個“完美貝葉斯均衡”。18第12講:完美貝葉斯均衡當(dāng)某策略組合及相應(yīng)的判斷滿足這樣四個要求時,稱為一個“完美貝葉斯均衡”。為什么稱這種均衡為完美貝葉斯均衡?19第12講:完美貝葉斯均衡完美貝葉斯均衡要求1:在每個信息集,輪到選擇的博弈方必須具有一個關(guān)于博弈達到該信息集中每個節(jié)點可能性的“判斷”(Belief)。要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。要求3:在均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方的均衡策略決定。要求4:在不處于均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方在此處可能有的均衡策略決定。20第12講:完美貝葉斯均衡當(dāng)某策略組合及相應(yīng)的判斷滿足這樣四個要求時,稱為一個“完美貝葉斯均衡”。為什么稱這種均衡為完美貝葉斯均衡?21第12講:完美貝葉斯均衡為什么稱這種均衡為完美貝葉斯均衡?首先,因為它的第二個要求“序列理性”,與子博弈完美納什均衡中的子博弈完美性要求相似;22第12講:完美貝葉斯均衡2323要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。

(a)即,在各個信息集,給定輪到選擇博弈方的判斷和其他博弈方的“后續(xù)策略”,該博弈方的行為及以后階段的“后續(xù)策略”,必須使自己的得益或期望得益最大。

(b)此處所謂“后續(xù)策略”即相應(yīng)的博弈方在所討論信息集以后的階段中,針對所有可能情況如何行為的完整計劃。1112好差賣不賣不賣賣買不買買不買(0,0)(2,1)(0,0)(1,-1)(-1,0)(0,0)第12講:完美貝葉斯均衡為什么稱這種均衡為完美貝葉斯均衡?首先,因為它的第二個要求“序列理性”,與子博弈完美納什均衡中的子博弈完美性要求相似;其次,因為要求3和要求4規(guī)定“判斷”的形成必須符合貝葉斯法則。24第12講:完美貝葉斯均衡25要求3:在均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方的均衡策略決定。要求4:在不處于均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方在此處可能有的均衡策略決定。1112好差賣不賣不賣賣買不買買不買(0,0)(2,1)(0,0)(1,-1)(-1,0)(0,0)第12講:完美貝葉斯均衡完全且完美信息動態(tài)博弈:子博弈完美納什均衡完全但不完美信息動態(tài)博弈:完美貝葉斯均衡26第12講:完美貝葉斯均衡完全且完美信息動態(tài)博弈子博弈完美納什均衡完全但不完美信息動態(tài)博弈完美貝葉斯均衡27第12講:完美貝葉斯均衡子博弈完美納什均衡是完美貝葉斯均衡在完全且完美信息動態(tài)博弈中的特例。28第12講:完美貝葉斯均衡子博弈完美納什均衡是完美貝葉斯均衡在完全且完美信息動態(tài)博弈中的特例。即,在完全且完美信息動態(tài)博弈中,完美貝葉斯均衡就是子博弈完美納什均衡。29第12講:完美貝葉斯均衡完美貝葉斯均衡要求1:在每個信息集,輪到選擇的博弈方必須具有一個關(guān)于博弈達到該信息集中每個節(jié)點可能性的“判斷”(Belief)。要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。要求3:在均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方的均衡策略決定。要求4:在不處于均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方在此處可能有的均衡策略決定。30第12講:完美貝葉斯均衡子博弈完美納什均衡是完美貝葉斯均衡在完全且完美信息動態(tài)博弈中的特例。序列理性在子博弈中就是子博弈完美性,再在整個博弈中就是納什均衡,而在完全且完美信息動態(tài)博弈中,所有輪到選擇博弈方的信息集都是單節(jié)點的,他們對博弈到達該節(jié)點的“判斷”都是概率等于1,這些判斷當(dāng)然都是滿足貝葉斯法則和以其他博弈方的后續(xù)策略為基礎(chǔ)的。31第12講:完美貝葉斯均衡更進一步,完美貝葉斯均衡在靜態(tài)博弈中就是納什均衡。32第12講:完美貝葉斯均衡完美貝葉斯均衡要求1:在每個信息集,輪到選擇的博弈方必須具有一個關(guān)于博弈達到該信息集中每個節(jié)點可能性的“判斷”(Belief)。要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。要求3:在均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方的均衡策略決定。要求4:在不處于均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方在此處可能有的均衡策略決定。3333第12講:完美貝葉斯均衡2.完美貝葉斯均衡的初步解釋2.1兩方兩階段不完全信息動態(tài)博弈2.2三方三階段不完全信息動態(tài)博弈34第12講:完美貝葉斯均衡對四個條件的分析“要求1”是解決完全但不完美信息動態(tài)博弈的基本前提。在多節(jié)點信息集處輪到選擇的博弈方,至少必須對其中每個節(jié)點達到的可能性大小有一個基本判斷,否則其決策就會失去根據(jù),從而也不可能存在策略的穩(wěn)定性,更談不上均衡。35第12講:完美貝葉斯均衡36完美貝葉斯均衡要求1:在每個信息集,輪到選擇的博弈方必須具有一個關(guān)于博弈達到該信息集中每個節(jié)點可能性的“判斷”(Belief)。要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。要求3:在均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方的均衡策略決定。要求4:在不處于均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方在此處可能有的均衡策略決定。第12講:完美貝葉斯均衡對四個條件的分析“要求2”的序列理性相當(dāng)于子博弈完美納什均衡中的子博弈完美性要求,實際上在子博弈中(不完美信息動態(tài)博弈中也可能存在子博弈)就是子博弈完美性,而在多節(jié)點信息集開始的不構(gòu)成子博弈的部分中,序列理性通過要求各博弈方遵守最大利益原則而排除博弈方策略中不可信的威脅或承諾。37第12講:完美貝葉斯均衡對四個條件的分析當(dāng)然,序列理性首先要求策略組合在給定的各方判斷下是納什均衡。38第12講:完美貝葉斯均衡對四個條件的分析序列理性要求對保證完美貝葉斯均衡的真正穩(wěn)定性是很重要的。39第12講:完美貝葉斯均衡40完美貝葉斯均衡要求1:在每個信息集,輪到選擇的博弈方必須具有一個關(guān)于博弈達到該信息集中每個節(jié)點可能性的“判斷”(Belief)。要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。要求3:在均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方的均衡策略決定。要求4:在不處于均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方在此處可能有的均衡策略決定。第12講:完美貝葉斯均衡2.1兩方兩階段不完全信息動態(tài)博弈41第12講:完美貝葉斯均衡4212RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡完美貝葉斯均衡要求1:在每個信息集,輪到選擇的博弈方必須具有一個關(guān)于博弈達到該信息集中每個節(jié)點可能性的“判斷”(Belief)。要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。要求3:在均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方的均衡策略決定。要求4:在不處于均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方在此處可能有的均衡策略決定。第12講:完美貝葉斯均衡完美貝葉斯均衡的初步解釋“要求1”的必要性博弈方2在多節(jié)點信息集處對兩個節(jié)點,也就是兩條路徑的“判斷”是決策的必要基礎(chǔ),從而也是均衡策略的基礎(chǔ)。4412RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡45完美貝葉斯均衡要求1:在每個信息集,輪到選擇的博弈方必須具有一個關(guān)于博弈達到該信息集中每個節(jié)點可能性的“判斷”(Belief)。要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。要求3:在均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方的均衡策略決定。要求4:在不處于均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方在此處可能有的均衡策略決定。第12講:完美貝葉斯均衡“要求2”的必要性如果沒有“要求2”,只要求滿足納什均衡和子博弈完美性,則博弈方2有一個可為自己爭取到最大利益3,但包含不可信承諾的均衡策略。4612RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求2”的必要性即,博弈方2威脅在輪到自己選擇時將唯一地只選D。4712RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求2”的必要性即,博弈方2威脅在輪到自己選擇時將唯一地只選D。如果博弈方2采取這個策略,博弈方1的最佳對策就是第一階段選擇R從而使博弈結(jié)束,雙方得益是(1,3)。4812RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求2”的必要性策略組合:博弈方2威脅在輪到自己選擇時將唯一地只選D;博弈方1在第一階段選擇R。上述策略組合顯然是一個納什均衡,由于本博弈沒有子博弈,因此子博弈完美性要求自動滿足,它也是一個子博弈完美納什均衡。4912RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求2”的必要性但是,博弈方2在博弈方1不選擇R的情況下只選D的策略,在博弈方1選L的概率很大時明顯是一個不可信的威脅,因為這時博弈方2選擇D的期望得益比選U的要小得多,選D不符合最大利益原則。5012RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求2”的必要性因此,“要求2”對于保證不完美信息動態(tài)博弈的均衡策略中沒有不可信的威脅或承諾具有關(guān)鍵作用。5112RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求2”的必要性“要求2”保證各個博弈方在單節(jié)點信息集和多節(jié)點信息集處都會按照最大利益原則選擇。5212RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求2”的必要性因此當(dāng)博弈方2在博弈方1第一階段沒有選R的情況下,“判斷”博弈方1選L的概率p大于選M的概率1-p時,博弈方2必須選擇U而非D。這時,博弈方1在第一階段的選擇就應(yīng)該是L而非M,也非R。5312RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求2”的必要性博弈方1第一階段選L,博弈方2在博弈方1第一階段未選R的情況下選擇U,加上博弈方2對博弈方1選L、M的概率判斷p和1-p(p≥1-p),構(gòu)成一個滿足序列理性要求的策略組合。5412RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。

(a)即,在各個信息集,給定輪到選擇博弈方的判斷和其他博弈方的“后續(xù)策略”,該博弈方的行為及以后階段的“后續(xù)策略”,必須使自己的得益或期望得益最大。

(b)此處所謂“后續(xù)策略”即相應(yīng)的博弈方在所討論信息集以后的階段中,針對所有可能情況如何行為的完整計劃。55第12講:完美貝葉斯均衡56完美貝葉斯均衡要求1:在每個信息集,輪到選擇的博弈方必須具有一個關(guān)于博弈達到該信息集中每個節(jié)點可能性的“判斷”(Belief)。要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。要求3:在均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方的均衡策略決定。要求4:在不處于均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方在此處可能有的均衡策略決定。第12講:完美貝葉斯均衡“要求3”和“要求4”有“均衡路徑”和“非均衡路徑”一對概念。在完全且完美信息動態(tài)博弈中,所謂在均衡路徑上的信息集是指如果博弈按照均衡策略進行,則該信息集一定會達到,不在均衡路徑上的信息集則肯定不會達到。57第12講:完美貝葉斯均衡“要求3”和“要求4”有“均衡路徑”和“非均衡路徑”一對概念。在不完美信息博弈中,由于至少對一個博弈方階段來說,博弈實際達到何處是無法看到的,因此即使按均衡策略進行博弈,某些信息集是否一定達到也不確定。58第12講:完美貝葉斯均衡“要求3”和“要求4”有“均衡路徑”和“非均衡路徑”一對概念。所以,在不完美信息博弈中所謂“在均衡路徑上”的信息集意味著如果博弈按照均衡策略進行,則該信息集會以正的概率達到,而“不在均衡路徑上”的信息集就意味著博弈按均衡策略進行時絕不可能達到,或者達到的概率為0。59第12講:完美貝葉斯均衡“要求3”的必要性假設(shè):均衡策略組合是“博弈方1在第一階段選擇L,博弈方2在第二階段選擇U”。6012RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求3”的必要性假設(shè):均衡策略組合是“博弈方1在第一階段選擇L,博弈方2在第二階段選擇U”。首先,因為該博弈中只有博弈方2有一個兩節(jié)點信息集,因此要求3實際上針對的就是博弈方2在其兩節(jié)點信息集處的“判斷”。6112RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求3”的必要性假設(shè):均衡策略組合是“博弈方1在第一階段選擇L,博弈方2在第二階段選擇U”。其次,本博弈兩博弈方的選擇都是主動選擇,因此不需要額外信息幫助“判斷”。6212RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求3”的必要性假設(shè):均衡策略組合是“博弈方1在第一階段選擇L,博弈方2在第二階段選擇U”。第三,在本博弈中博弈方2的“判斷”是直接針對博弈方1的上期選擇的,因此不存在條件概率問題,貝葉斯法則自動滿足。6312RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求3”的必要性假設(shè):均衡策略是“博弈方1在第一階段選擇L,博弈方2在第二階段選擇U”。第四,“要求3”要求博弈方2對博弈方1的上期選擇的“判斷”,符合各博弈方的均衡策略,在這里就是符合博弈方1第一階段的選擇和博弈方2自己本階段的選擇。6412RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求3”的必要性假設(shè):均衡策略組合是“博弈方1在第一階段選擇L,博弈方2在第二階段選擇U”。由于博弈方1的均衡策略在第一階段選擇的是L,因此只有博弈方2的“判斷”是“博弈方1選擇L的概率p=1”才與博弈方1的策略相符合,而且這種判斷也與博弈方2自己在本階段的選擇U相符合,因此該判斷正是博弈方2決策和雙方策略均衡的穩(wěn)定基礎(chǔ)。65第12講:完美貝葉斯均衡“要求3”的必要性假設(shè):均衡策略組合是“博弈方1在第一階段選擇L,博弈方2在第二階段選擇U”。如果博弈方2“判斷”p=0.75,則首先與博弈方1的選擇不完全符合,而且這種判斷對博弈方2選U的信心有不良影響,從而均衡就有不穩(wěn)定性。6612RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求3”的必要性假設(shè):均衡策略組合是“博弈方1在第一階段選擇L,博弈方2在第二階段選擇U”。如果博弈方2“判斷”p=0.25,則與所設(shè)均衡策略組合“博弈方1在第一階段選擇L,博弈方2在第二階段選擇U”是完全矛盾的,因為該判斷下博弈方2的最佳選擇不是U而是D,而博弈方1也不會選擇L而選擇R,因此“判斷”與策略之間的矛盾會完全破壞策略的均衡,這時候上述策略組合根本不可能是真正的均衡。67第12講:完美貝葉斯均衡“要求3”的必要性在不完美信息博弈中,“判斷”和均衡策略之間的相互依存關(guān)系,只有兩者是一致的、協(xié)調(diào)的,才可能是真正的均衡。68第12講:完美貝葉斯均衡69完美貝葉斯均衡要求1:在每個信息集,輪到選擇的博弈方必須具有一個關(guān)于博弈達到該信息集中每個節(jié)點可能性的“判斷”(Belief)。要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。要求3:在均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方的均衡策略決定。要求4:在不處于均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方在此處可能有的均衡策略決定。第12講:完美貝葉斯均衡“要求4”的必要性首先,對于均衡策略組合“博弈方1在第一階段選擇L,博弈方2在第二階段選擇U”來說,因為博弈方2的多節(jié)點信息集在均衡路徑上,不存在不在均衡路徑上的需要“判斷”的信息集,因此要求4自動滿足。7012RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求4”的必要性假設(shè)納什均衡策略組合:“博弈方1第一階段選擇R,博弈方2第二階段選擇D”。在該均衡策略下,博弈方2的兩節(jié)點信息集就是不在均衡路徑上的信息集。7112RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求4”的必要性假設(shè)納什均衡策略組合:“博弈方1第一階段選擇R,博弈方2第二階段選擇D”。“要求4”要求博弈方2此時在兩節(jié)點信息集的判斷,也要滿足貝葉斯法則和雙方的均衡策略。7212RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求4”的必要性假設(shè)納什均衡策略組合:“博弈方1第一階段選擇R,博弈方2第二階段選擇D”。同于“要求3”,貝葉斯法則自動滿足,因此我們只需要討論博弈方2的“判斷”與雙方在此處可能有的均衡策略的一致性。7312RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求4”的必要性假設(shè)納什均衡策略組合:“博弈方1第一階段選擇R,博弈方2第二階段選擇D”。我們只需要討論博弈方2的“判斷”與雙方在此處可能有的均衡策略的一致性。如果萬一博弈方1在第一階段偏離了上述均衡策略R,博弈方2“判斷”博弈方1選擇L的概率p=1是不符合要求4的,因為這與博弈方2自己的均衡策略D不符合。因此博弈方2此時的判斷只能是博弈方1選擇M的概率1-p=1,這樣博弈方2的“判斷”就與自己的策路相一致了。74第12講:完美貝葉斯均衡“要求4”的必要性假設(shè)納什均衡策略組合:“博弈方1第一階段選擇R,博弈方2第二階段選擇D”。我們只需要討論博弈方2的“判斷”與雙方在此處可能有的均衡策略的一致性。但是,博弈方2“判斷”1-p=1,意味著博弈方1肯定選擇了M。這顯然是有問題的,因為對于博弈方1來說,M既是相對于R的下策,也是相對于L的下策,即使他不愿選R,也只會選L而不選M。75第12講:完美貝葉斯均衡“要求4”的必要性假設(shè)納什均衡策略組合:“博弈方1第一階段選擇R,博弈方2第二階段選擇D”。我們只需要討論博弈方二的“判斷”與雙方在此處可能有的均衡策略的一致性。因此,博弈方2的“判斷”1-p=1雖然可以與自己的策略D相符合,但卻無法與博弈方1在此處可能有的均衡策略相符合,這意味著該“判斷”也不滿足要求4。7612RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡“要求4”的必要性假設(shè)納什均衡策略組合:“博弈方1第一階段選擇R,博弈方2第二階段選擇D”。事實上,在上述得益結(jié)構(gòu)下,該博弈不可能存在與均衡策略組合“博弈方1第一階段選擇R,博弈方2第二階段選擇D”相符合的不在均衡路徑上的博弈方“判斷”,這實際上就意味著該策略組合不可能是該博弈具有真正穩(wěn)定性的完美貝葉斯均衡。7712RM(1-p)L(p)UDUD(1,3)(2,1)(0,0)(0,0)(0,1)第12講:完美貝葉斯均衡78完美貝葉斯均衡要求1:在每個信息集,輪到選擇的博弈方必須具有一個關(guān)于博弈達到該信息集中每個節(jié)點可能性的“判斷”(Belief)。要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。要求3:在均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方的均衡策略決定。要求4:在不處于均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方在此處可能有的均衡策略決定。第12講:完美貝葉斯均衡2.2三方三階段不完全信息動態(tài)博弈79第12講:完美貝葉斯均衡三方三階段不完全信息動態(tài)博弈第一階段博弈方1有F和B兩種選擇,他的選擇博弈方2和博弈方3都能看到。第二階段博弈方2有L和R兩種選擇,跟在后面的博弈方3卻看不見他的選擇。博弈方3在第三階段有U和D兩種選擇,他的信息集為一兩節(jié)點信息集。

(1)這反映了博弈方3的信息不完美性。

(2)假設(shè)博弈方3“判斷”博弈方2選擇L和R的概率分別為p和1-p。80123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)第12講:完美貝葉斯均衡三方三階段不完全信息動態(tài)博弈(利用逆推歸納法的思路分析)首先,考慮博弈方3的選擇,則他

(1)選擇U的期望得益為p·1+(1-p)·2=2-p;

(2)選擇D的期望得益為p·3+(1-p)·1=1+2p。

(3)因此,當(dāng)p<1/3時他選擇U,當(dāng)p>1/3時他選擇D,當(dāng)p=1/3時選U,D或者混合策略都可以。81123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)第12講:完美貝葉斯均衡其次,考慮博弈方2的選擇,則

(1)博弈方2的選擇必然是策略L;

(2)因為L是博弈方2的嚴格上策;

(3)博弈方2無需考慮博弈方3在第三階段的選擇。此時,再回頭看博弈方3的“判斷”:

(1)判斷“p>1/3”是符合博弈方2的策略的;

(2)更精確地講,完全符合博弈方2均衡策略的博弈方3的“判斷”是p=1。

(3)因此,博弈方3肯定選擇D。82123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)第12講:完美貝葉斯均衡最后,考慮博弈方1的選擇,則

(1)博弈方1知道從博弈方2的選擇開始的子博弈的均衡策略組合必然為(L,D);

(2)那么,博弈方1選擇F可以獲得3單位得益,選擇B可以獲得2單位得益;

(3)因此,博弈方1的均衡策略是F。83123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)第12講:完美貝葉斯均衡三方三階段不完全信息動態(tài)博弈利用逆推歸納法的分析結(jié)果總結(jié):博弈存在一個均衡策略組合(F,L,D),以及與之相應(yīng)的博弈方3的“判斷”p=1。?該均衡策略組合是否符合完美貝葉斯均衡的要求84123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)第12講:完美貝葉斯均衡完美貝葉斯均衡的要求要求1:在每個信息集,輪到選擇的博弈方必須具有一個關(guān)于博弈達到該信息集中每個節(jié)點可能性的“判斷”(Belief)。

(a)對于多節(jié)點信息集,“判斷”就是博弈達到該信息集中各個節(jié)點可能性的概率分布;

(b)對于單節(jié)點信息集,則“判斷”就是博弈達到該節(jié)點的概率為1。85博弈存在一個均衡策略組合(F,L,D),以及與之相應(yīng)的博弈方3的“判斷”p=1。123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)第12講:完美貝葉斯均衡要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。

(a)即在各個信息集,給定輪到選擇博弈方的判斷和其他博弈方的“后續(xù)策略”,該博弈方的行為及以后階段的“后續(xù)策略”,必須使自己的得益或期望得益最大。

(b)此處所謂“后續(xù)策略”即相應(yīng)的博弈方在所討論信息集以后的階段中,針對所有可能情況如何行為的完整計劃。86博弈存在一個均衡策略組合(F,L,D),以及與之相應(yīng)的博弈方3的“判斷”p=1。123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)第12講:完美貝葉斯均衡要求3:在均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方的均衡策略決定。87博弈存在一個均衡策略組合(F,L,D),以及與之相應(yīng)的博弈方3的“判斷”p=1。123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)第12講:完美貝葉斯均衡要求4:在不處于均衡路徑上的信息集處,“判斷”由貝葉斯法則和各博弈方在此處可能有的均衡策略決定。88博弈存在一個均衡策略組合(F,L,D),以及與之相應(yīng)的博弈方3的“判斷”p=1。123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)第12講:完美貝葉斯均衡?“要求4”的必要性考查策略組合(B,L,U),及相關(guān)的博弈方3“判斷”p=0。首先,該策略組合是一個納什均衡:

(1)因為,沒有博弈方可以通過單獨改變自己的策略而改善得益;

(2)事實上,當(dāng)博弈方1選擇B之后,其他兩博弈方根本沒有選擇的機會,而對博弈方1來說,當(dāng)其他兩方的策略是(L,U)時,當(dāng)然是選擇B合算。89123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)第12講:完美貝葉斯均衡其次,該策略組合滿足要求1。90要求1:在每個信息集,輪到選擇的博弈方必須具有一個關(guān)于博弈達到該信息集中每個節(jié)點可能性的“判斷”(Belief)。

(a)對于多節(jié)點信息集,“判斷”就是博弈達到該信息集中各個節(jié)點可能性的概率分布;

(b)對于單節(jié)點信息集,則“判斷”就是博弈達到該節(jié)點的概率為1。123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)第12講:完美貝葉斯均衡然后,在博弈方3對博弈方2的“判斷”是p=0時,(B,L,U)是序列理性的,因此滿足要求2。91要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。

(a)即在各個信息集,給定輪到選擇博弈方的判斷和其他博弈方的“后續(xù)策略”,該博弈方的行為及以后階段

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論