第10章貝葉斯博弈與貝葉斯Nash均衡

上傳人：e*** IP屬地：湖北上傳時(shí)間：2023-01-12 格式：PPT 頁(yè)數(shù)：151 大?。?68KB 積分：21 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩146頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三部分：不完全信息靜態(tài)博弈主要內(nèi)容：一、貝葉斯博弈二、貝葉斯Nash均衡三、貝葉斯Nash均衡的應(yīng)用四、關(guān)于混合戰(zhàn)略Nash均衡的一個(gè)解釋第十章貝葉斯博弈與貝葉斯Nash均衡DepartmentofMathematicsNorthwestUniversity一、貝葉斯博弈前面兩部分我們討論了完全信息博弈問(wèn)題，但在現(xiàn)實(shí)生活中我們遇到更多的可能是不完全信息博弈問(wèn)題。DepartmentofMathematicsNorthwestUniversity例如在“新產(chǎn)品開(kāi)發(fā)”博弈中，企業(yè)對(duì)市場(chǎng)的需求可能并不清楚；在連鎖店博弈中，潛在的進(jìn)入者可能并不知道連鎖店在市場(chǎng)上的盈利情況，等等。DepartmentofMathematicsNorthwestUniversity

新產(chǎn)品開(kāi)發(fā)博弈：考察一種新產(chǎn)品開(kāi)發(fā)：兩個(gè)企業(yè)準(zhǔn)備各自開(kāi)發(fā)同一種新產(chǎn)品，并投放市場(chǎng)。開(kāi)發(fā)中企業(yè)的投入、產(chǎn)出如圖

企業(yè)1開(kāi)發(fā)（a）：投資2000不開(kāi)發(fā)（b）需求大需求小企業(yè)2不開(kāi)發(fā)，獲利800企業(yè)2開(kāi)發(fā)，獲利300企業(yè)2不開(kāi)發(fā)，獲利200企業(yè)2開(kāi)發(fā)，賠400DepartmentofMathematicsNorthwestUniversity某著名品牌的連鎖店(不妨稱為參與人A)在K個(gè)城市中有分店，城市標(biāo)號(hào)為1,…,K。在每個(gè)城市k(k=1,…,K)有惟一一個(gè)潛在競(jìng)爭(zhēng)者(稱為參與人k)，該競(jìng)爭(zhēng)者決定是否與參與人A競(jìng)爭(zhēng)——進(jìn)入(用I表示)和不進(jìn)入(用O表示)。如果參與人k決定去競(jìng)爭(zhēng)，那么參與人A可以抵制(用F表示)也可以不抵制(用C表示)。連鎖店博弈DepartmentofMathematicsNorthwestUniversity不完全信息博弈問(wèn)題將博弈開(kāi)始時(shí)就存在事前不確定性的博弈問(wèn)題稱為不完全信息博弈問(wèn)題。DepartmentofMathematicsNorthwestUniversity例子：斗雞博弈兩個(gè)所謂的勇士舉著長(zhǎng)槍，準(zhǔn)備從獨(dú)木橋的兩端沖上橋中央進(jìn)行決斗。每位勇士都有兩種選擇：沖上去(用U表示)，或退下來(lái)(用D表示)。若兩人都沖上去，則兩敗俱傷；若一方上去而另一方退下來(lái)，沖上去者取得勝利(至少心理上是這樣的)，退下來(lái)的丟了面子；若兩人都退下來(lái)，兩人都丟面子。

DepartmentofMathematicsNorthwestUniversity考察這樣的情形：假設(shè)參與人可能有這樣的兩種性格特征(類型)——“強(qiáng)硬”(用s表示)或“軟弱”(用w表示)。所謂“強(qiáng)硬”的參與人是指那些喜歡爭(zhēng)強(qiáng)好勝、不達(dá)目的誓不罷休的決斗者；而“軟弱”的參與人是指那些膽小怕事、遇事希望息事寧人的決斗者。DepartmentofMathematicsNorthwestUniversity顯然，當(dāng)具有不同性格特征的決斗者相遇時(shí)，所表現(xiàn)出來(lái)的博弈情形是不同的。令U表示沖上去；D表示退下去，則每種情況下博弈情形如下圖所示。DepartmentofMathematicsNorthwestUniversity當(dāng)參與人都為強(qiáng)硬者時(shí)博弈存在兩個(gè)純戰(zhàn)略Nash均衡——(U，D)和(D,U)。解釋：雙方都爭(zhēng)強(qiáng)好勝，但都不愿意發(fā)生直接沖突，都希望在自己沖上去時(shí)，對(duì)方退下來(lái)。DepartmentofMathematicsNorthwestUniversity當(dāng)參與人1為強(qiáng)硬者參與人2為軟弱者時(shí)博弈存在唯一的Nash均衡——(U,D)。軟弱的決斗者膽小怕事，總是退下來(lái)，因此，強(qiáng)硬的決斗者選擇沖上去。DepartmentofMathematicsNorthwestUniversity當(dāng)參與人1為軟弱者參與人2為強(qiáng)硬者時(shí)博弈存在唯一的Nash均衡——(D,U)。DepartmentofMathematicsNorthwestUniversity當(dāng)參與人都為軟弱者時(shí)博弈存在唯一的Nash均衡——(D,D)。雙方都息事寧人，希望和平共處，因此雙方都選擇退下來(lái)。DepartmentofMathematicsNorthwestUniversity(1)參與人都為強(qiáng)硬者(2)參與人1為強(qiáng)硬者參與人2為軟弱者(3)參與人1為軟弱者參與人2為強(qiáng)硬者(4)參與人都為軟弱者DepartmentofMathematicsNorthwestUniversity在“斗雞博弈”中，雖然在博弈開(kāi)始之前每位決斗者都了解(知道)自己的性格特征，但對(duì)對(duì)手的性格特征往往不甚了解或了解不全。在這種情況下即使所有的決斗者都看到了上面的四個(gè)戰(zhàn)略式博弈，但對(duì)決斗者來(lái)講，仍存在著所謂的事前不確定性即博弈開(kāi)始之前就不知道的信息。DepartmentofMathematicsNorthwestUniversity對(duì)于“強(qiáng)硬”的參與人1來(lái)講，雖然他看到了上面的戰(zhàn)略式博弈，但他不知道對(duì)手是“強(qiáng)硬”的還是“軟弱”的，所以博弈開(kāi)始之前他無(wú)法確定博弈是根據(jù)(1)還是(2)進(jìn)行。這意味著“強(qiáng)硬”的參與人1面臨著事前無(wú)法確定的信息。DepartmentofMathematicsNorthwestUniversity同樣，“軟弱”的參與人1也會(huì)面臨類似的問(wèn)題。此時(shí)，“斗雞博弈”就是一個(gè)不完全信息博弈問(wèn)題。DepartmentofMathematicsNorthwestUniversity對(duì)于不完全信息博弈問(wèn)題，是不可能應(yīng)用前面兩部分介紹的方法進(jìn)行求解的。DepartmentofMathematicsNorthwestUniversity這是因?yàn)榻o定參與人1為“強(qiáng)硬”的決斗者，如果對(duì)手是“軟弱”的，那么博弈就只存在惟一的Nash均衡(U,D)，參與人1有惟一的最優(yōu)選擇“沖上去”；如果對(duì)手是“強(qiáng)硬”的，則博弈就會(huì)出現(xiàn)兩個(gè)Nash均衡(U,D)和(D,U)，參與人1的最優(yōu)選擇取決于對(duì)手的選擇。DepartmentofMathematicsNorthwestUniversity但由于參與人1不知道對(duì)手究竟是“強(qiáng)硬”的還是“軟弱”的，因此，此時(shí)的參與人1就覺(jué)得自己似乎是在與兩個(gè)決斗者進(jìn)行決斗，一個(gè)是“強(qiáng)硬”的，另一個(gè)是“軟弱”的。當(dāng)一個(gè)參與人并不知道在與誰(shuí)博弈時(shí)，博弈的規(guī)則是沒(méi)有意義的。DepartmentofMathematicsNorthwestUniversity如何處理不完全信息博弈問(wèn)題？DepartmentofMathematicsNorthwestUniversityHarsanyi轉(zhuǎn)換為了方便分析，對(duì)“斗雞博弈”進(jìn)行簡(jiǎn)化。假設(shè)參與人1是“強(qiáng)硬”的決斗者，參與人2可能是“強(qiáng)硬”的也可能是“軟弱”的，參與人1不知道但參與人2清楚參與人2的性格，而且這一假設(shè)為所有的參與人所知道。

DepartmentofMathematicsNorthwestUniversityHarsanyi轉(zhuǎn)換：在原博弈中引入一個(gè)“虛擬”參與人——“自然”(nature，用N表示)，構(gòu)造一個(gè)參與人為兩個(gè)決斗者和“自然”的三人博弈。DepartmentofMathematicsNorthwestUniversityHarsanyi轉(zhuǎn)換“自然”首先行動(dòng)決定參與人2的性格特征(即選擇參與人2是“強(qiáng)硬”的還是“軟弱”的)，“自然”的選擇參與人1不知道，但參與人2知道。DepartmentofMathematicsNorthwestUniversity在“自然”選擇后，參與人1和2再進(jìn)行“斗雞博弈”。

DepartmentofMathematicsNorthwestUniversity在新構(gòu)造的三人博弈中，“自然”的支付不必考慮。參與人1和2的支付由“斗雞博弈”決定。DepartmentofMathematicsNorthwestUniversity如果“自然”選擇參與人2的性格特征是“強(qiáng)硬”的，則意味著參與人1與“強(qiáng)硬”的參與人2進(jìn)行決斗，博弈進(jìn)入決策結(jié)x1，其支付(1)決定；DepartmentofMathematicsNorthwestUniversity如果“自然”選擇參與人2的性格特征是“軟弱”的，則意味著參與人1與“軟弱”的參與人2進(jìn)行決斗，博弈進(jìn)入決策結(jié)x2，其支付由(2)決定。DepartmentofMathematicsNorthwestUniversityHarsanyi通過(guò)引入“虛擬”參與人，將博弈的起始點(diǎn)由x1(或x2)提前至x0，從而將原博弈中參與人的事前不確定性轉(zhuǎn)變?yōu)椴┺拈_(kāi)始后的不確定性(即參與人1不知道“自然”的選擇)。這種通過(guò)引入“虛擬”參與人來(lái)處理不完全信息博弈問(wèn)題的方法亦稱Harsanyi轉(zhuǎn)換。DepartmentofMathematicsNorthwestUniversity注意：盡管通過(guò)Harsanyi轉(zhuǎn)換可將不完全信息博弈轉(zhuǎn)換為完全信息博弈，但是，此時(shí)仍然不能利用前面的完全信息博弈問(wèn)題的處理方法求解。原因在于，虛擬的參與人沒(méi)有支付，因而其選擇是隨機(jī)的。DepartmentofMathematicsNorthwestUniversity考察不完全信息博弈問(wèn)題參與人的決策用p1表示參與人1認(rèn)為“自然”選擇參與人2為“強(qiáng)硬”的概率；用x表示“強(qiáng)硬”的決斗者2選擇行動(dòng)U的概率。v1(U)和v1(D)分別表示參與人1認(rèn)為自己選擇行動(dòng)U和D時(shí)所能得到的期望收益；DepartmentofMathematicsNorthwestUniversityDepartmentofMathematicsNorthwestUniversityv1(U)的計(jì)算：強(qiáng)硬的參與人2：（p1）策略---概率：（U,U）---x（U,D）---1-x支付：-4，-42，-2參與人1期望支付：-4x+2(1-x)軟弱的參與人2：

（1-p1）由于參與人1為強(qiáng)硬，而當(dāng)他預(yù)感到參與人2為軟弱時(shí)，參與人只會(huì)選擇退縮，即策略：（U,D）支付：2，0期望支付：2DepartmentofMathematicsNorthwestUniversityv1(D)的計(jì)算：強(qiáng)硬的參與人2：（p1）策略---概率：（D,U）---x（D,D）---1-x支付：-2,20,0參與人1期望支付：-2x+0(1-x)軟弱的參與人2：

（1-p1）由于參與人1為強(qiáng)硬，而當(dāng)他預(yù)感到參與人2為軟弱時(shí)，參與人2只會(huì)退縮，即策略：（D,D）支付：0，1期望支付：0DepartmentofMathematicsNorthwestUniversity當(dāng)即時(shí)，對(duì)參與人1來(lái)講，其最優(yōu)選擇是U(即“沖上去”)。解釋：由于，所以要保證取到所有可能概率值，需，即，也就是說(shuō)，當(dāng)參與人1認(rèn)為參與人2是“強(qiáng)硬”決斗者的可能性不超過(guò)1/2時(shí)，就會(huì)選擇“沖上去”。DepartmentofMathematicsNorthwestUniversity考察參與人2的選擇軟弱的參與人2只會(huì)選擇行動(dòng)D；強(qiáng)硬的參與人2的最優(yōu)選擇與參與人1的選擇有關(guān)：一方面與參與人1關(guān)于“自然”選擇的推斷有關(guān)，另一方面，還與自己關(guān)于“參與人1關(guān)于“自然”的推斷p1”的推斷有關(guān)。用q1表示參與人2關(guān)于“參與人1關(guān)于‘自然’選擇的推斷”的推斷，即q1表示參與人2認(rèn)為“參與人1認(rèn)為參與人2是‘強(qiáng)硬’的”概率。DepartmentofMathematicsNorthwestUniversity類似前面的分析：如果，則參與人2認(rèn)為“U(即‘沖上去’)是參與人1的最優(yōu)選擇”；與此同時(shí)，如果，則參與人1的最優(yōu)選擇與參與人2的預(yù)測(cè)一致。但是，如果而，則參與人1的最優(yōu)選擇就可能與參與人2的預(yù)測(cè)不一致，此時(shí)，就無(wú)法對(duì)問(wèn)題進(jìn)行分析。DepartmentofMathematicsNorthwestUniversity在Harsanyi轉(zhuǎn)換中規(guī)定：參與人關(guān)于“自然”選擇的推斷為共同知識(shí)。也就是說(shuō)，兩個(gè)決斗者不僅同時(shí)一起看到了“自然”隨機(jī)選擇參與人2的性格特征，而且同時(shí)一起看到了“自然”以何種概率分布隨機(jī)選擇參與人2的性格特征。DepartmentofMathematicsNorthwestUniversity不完全信息博弈經(jīng)Harsanyi轉(zhuǎn)換之后得到的完全但不完美信息博弈。(x,y)表示參與人1的性格特征為x，參與人2的性格特征為y；pxy表示“自然”選擇(x,y)的概率，這里pxy為共同知識(shí)。

DepartmentofMathematicsNorthwestUniversity在應(yīng)用Harsanyi轉(zhuǎn)換時(shí)，需要注意以下問(wèn)題：

(1)“自然”的選擇。在一般的不完全信息博弈問(wèn)題中，Harsanyi轉(zhuǎn)換規(guī)定“自然”選擇的是參與人的類型(type)。除了根據(jù)參與人的支付來(lái)劃分參與人的類型以外，還可以根據(jù)參與人的行動(dòng)空間，甚至根據(jù)參與人掌握信息的多少(或程度)來(lái)來(lái)劃分參與人的類型。但是，需要注意的是，參與人的類型必須是其個(gè)人特征的一個(gè)完備描述，這種描述只有自己才能夠觀測(cè)到，其他的參與人觀測(cè)不到。

DepartmentofMathematicsNorthwestUniversity用ti表示參與人i的一個(gè)特定的類型，Ti表示參與人i所有類型的集合(亦稱類型空間，typespace)，即，t=(t1,…,tn)表示一個(gè)所有參與人的類型組合，t-i=(t1,…,ti-1,…,tn)表示除參與人i之外其他參與人的類型組合。所以，t=(ti,t-i)。DepartmentofMathematicsNorthwestUniversity2)參與人關(guān)于“自然”選擇的推斷。用p(t1,…,tn)表示定義在參與人類型組合上的一個(gè)聯(lián)合分布密度函數(shù)，Harsanyi轉(zhuǎn)換假定：對(duì)于一個(gè)給定的不完全信息博弈問(wèn)題，存在一個(gè)參與人關(guān)于“自然”選擇的推斷p(t1,…,tn)，且p(t1,…,tn)為共同知識(shí)。也就是說(shuō)，Harsanyi轉(zhuǎn)換假定所有參與人關(guān)于“自然”行動(dòng)的信念(belief)是相同的，并且為共同知識(shí)。DepartmentofMathematicsNorthwestUniversity用表示參與人i在知道自己類型為ti的情況下，關(guān)于其他參與人類型的推斷(即條件概率)，則有(貝葉斯公式)其中，為邊緣密度函數(shù)。DepartmentofMathematicsNorthwestUniversity假設(shè)pss=0.2，psw=0.3，pws=0.25，pww=0.25。雖然決斗者1不知道決斗者2的類型，但由于決斗者1知道自己的類型，因此他可以根據(jù)貝葉斯公式推知決斗者2的類型分布。DepartmentofMathematicsNorthwestUniversity例如根據(jù)貝葉斯規(guī)則，“強(qiáng)硬”的決斗者1可以推知：決斗者2是“強(qiáng)硬”的概率為決斗者2是“軟弱”的概率為“軟弱”的決斗者1可以推知：決斗者2是“強(qiáng)硬”的概率為決斗者2是“軟弱”的概率為DepartmentofMathematicsNorthwestUniversity這里不同類型的決斗者1所形成的關(guān)于“自然”選擇的推斷是不同的，究其原因，Harsanyi認(rèn)為：雖然理性的參與人在掌握同樣的信息時(shí)對(duì)同一事件會(huì)形成相同的概率推斷，但參與人各自掌握的信息不同時(shí)對(duì)同一事件就會(huì)形成不同的概率推斷。DepartmentofMathematicsNorthwestUniversity這說(shuō)明在Harsanyi轉(zhuǎn)換中，盡管參與人對(duì)包括自己在內(nèi)的所有參與人的類型的聯(lián)合概率推斷(分布)都是一樣的，但由于參與人掌握的私人信息不同，使得各自對(duì)其他參與人的類型的概率分布的推斷不同。DepartmentofMathematicsNorthwestUniversity貝葉斯博弈(thestaticBayesiangame)是關(guān)于不完全信息靜態(tài)博弈的一種建模方式，也是不完全信息靜態(tài)博弈的標(biāo)準(zhǔn)式描述。DepartmentofMathematicsNorthwestUniversity貝葉斯博弈的定義貝葉斯博弈包含以下五個(gè)要素：參與人集合；參與人的類型集T1,…,T2；參與人關(guān)于其他參與人類型的推斷

…,；(4)參與人類型相依的行動(dòng)集A(t1),…,A(tn)；(5)參與人類型相依的支付函數(shù)

,…,。DepartmentofMathematicsNorthwestUniversity參與人的推斷來(lái)源于一個(gè)共同的參與人關(guān)于“自然”選擇的推斷p(t1,…,tn)，且p(t1,…,tn)為共同知識(shí)。所以，貝葉斯博弈中參與人所具有的關(guān)于其他參與人的類型的推斷是一致的。如果，即所有參與人的類型只有一個(gè)，那么不完全信息靜態(tài)博弈就退化為完全信息靜態(tài)博弈。DepartmentofMathematicsNorthwestUniversity規(guī)定貝葉斯博弈的時(shí)間順序如下：“自然”選擇參與人的類型組合t=(t1,…,tn)；參與人i觀測(cè)到“自然”關(guān)于自己類型ti的選擇；雖然參與人i觀測(cè)不到“自然”關(guān)于其他參與人類型t-i的選擇，但參與人i具有關(guān)于其他參與人類型的推斷；參與人同時(shí)選擇行動(dòng)，每個(gè)參與人i從行動(dòng)集Ai(ti)中選擇行動(dòng)ai(ti)；參與人i得到。DepartmentofMathematicsNorthwestUniversity貝葉斯博弈中的戰(zhàn)略在貝葉斯博弈中，參與人i的一個(gè)戰(zhàn)略是從參與人的類型集Ti到其行動(dòng)集的一個(gè)函數(shù)si(ti)，它包含了當(dāng)自然賦予i的類型為ti時(shí)，i將從可行的行動(dòng)集Ai(ti)中選擇的行動(dòng)。DepartmentofMathematicsNorthwestUniversity“斗雞博弈”的貝葉斯模型參與人為決斗者1和2；用s表示決斗者是“強(qiáng)硬”的，w表示決斗者是“軟弱”的，所以T1=T2={s,w}。用pxy表示“自然”選擇類型組合(x,y)的概率，并假設(shè)pxy為共同知識(shí)，則每位決斗者i關(guān)于其對(duì)手類型的推斷pi(x|y)可利用貝葉斯公式計(jì)算。每位決斗者i關(guān)于類型相依的行動(dòng)空間Ai(x)={U,D}。每位決斗者i的支付由前面的圖決定。DepartmentofMathematicsNorthwestUniversity在貝葉斯博弈中參與人的戰(zhàn)略可定義為戰(zhàn)略——“強(qiáng)硬”的決斗者i選擇行動(dòng)U，“軟弱”的決斗者選擇行動(dòng)U

，即(U,U)；戰(zhàn)略——“強(qiáng)硬”的決斗者選擇行動(dòng)U

，“軟弱”的決斗者選擇行動(dòng)D，即(U,D)；戰(zhàn)略——“強(qiáng)硬”的決斗者選擇行動(dòng)D，“軟弱”的決斗者選擇行動(dòng)U

，即(D,U)；戰(zhàn)略——“強(qiáng)硬”的決斗者選擇行動(dòng)D，“軟弱”的決斗者選擇行動(dòng)D，即(D,D)。DepartmentofMathematicsNorthwestUniversity問(wèn)題：

1.如何定義貝葉斯博弈的解：

2.如何求解貝葉斯博弈？DepartmentofMathematicsNorthwestUniversity主要內(nèi)容：一、貝葉斯博弈二、貝葉斯Nash均衡三、貝葉斯Nash均衡的應(yīng)用四、關(guān)于混合戰(zhàn)略Nash均衡的一個(gè)解釋第十章貝葉斯博弈與貝葉斯Nash均衡DepartmentofMathematicsNorthwestUniversity以斗雞博弈為例：用x表示“強(qiáng)硬”的決斗者2選擇行動(dòng)U的概率，y表示決斗者1選擇行動(dòng)U的概率。決斗者1選擇行動(dòng)U和D的期望收益分別為：，這里p為“自然”選擇決斗者2為“強(qiáng)硬”的概率。決斗者1的最優(yōu)戰(zhàn)略為：如果，則選擇y=1(即選擇行動(dòng)U)；如果，則選擇y=0(即選擇行動(dòng)D)；如果，則選擇(即選擇任一混合戰(zhàn)略)。

DepartmentofMathematicsNorthwestUniversity考察“強(qiáng)硬”決斗者2的選擇?！皬?qiáng)硬”決斗者2選擇行動(dòng)U和D的期望收益分別為，“強(qiáng)硬”決斗者2的最優(yōu)戰(zhàn)略為：如果y<1/2，則選擇x=1(即選擇行動(dòng)U)；如果y>1/2，則選擇x=0(即選擇行動(dòng)D)；如果y=1/2，則選擇(即選擇任一混合戰(zhàn)略)。DepartmentofMathematicsNorthwestUniversity不完美信息博弈存在如下兩個(gè)純戰(zhàn)略Nash均衡決斗者1選擇行動(dòng)U，“強(qiáng)硬”決斗者2選擇行動(dòng)D，“軟弱”決斗者2選擇行動(dòng)D；決斗者1選擇行動(dòng)D，“強(qiáng)硬”決斗者2選擇行動(dòng)U，“軟弱”決斗者2選擇行動(dòng)D。此外，博弈還存在一個(gè)混合戰(zhàn)略Nash均衡，即決斗者1以1/2的概率選擇行動(dòng)U，“強(qiáng)硬”決斗者2以的概率1/(2p)選擇行動(dòng)U，“軟弱”決斗者2選擇行動(dòng)D。DepartmentofMathematicsNorthwestUniversity用表示給定其他參與人的戰(zhàn)略，類型為ti的參與人i選擇行動(dòng)ai時(shí)的期望效用，則其中，對(duì)，為給定t-i時(shí)由s-i所確定的其他參與人的行動(dòng)組合DepartmentofMathematicsNorthwestUniversity“斗雞博弈”中，“強(qiáng)硬”的決斗者1關(guān)于對(duì)手類型的推斷為DepartmentofMathematicsNorthwestUniversity所以，當(dāng)決斗者2的戰(zhàn)略為(即(U,U))，則“強(qiáng)硬”的決斗者1選擇行動(dòng)U和D時(shí)的期望效用分別為DepartmentofMathematicsNorthwestUniversity當(dāng)決斗者2的戰(zhàn)略為(即(U,D))，則“強(qiáng)硬”的決斗者1選擇行動(dòng)U和D時(shí)的期望效用分別為DepartmentofMathematicsNorthwestUniversity在貝葉斯博弈中，對(duì)于一個(gè)理性的參與人i，當(dāng)他只知道自己的類型ti而不知道其他參與人的類型時(shí)，給定其他參與人的戰(zhàn)略s-i，他將選擇使自己期望效用(支付)最大化的行動(dòng)，其中DepartmentofMathematicsNorthwestUniversity純戰(zhàn)略貝葉斯Nash均衡貝葉斯博弈的純戰(zhàn)略貝葉斯Nash均衡是一個(gè)類型相依的行動(dòng)組合，其中每個(gè)參與人在給定自己的類型ti和其他參與人的類型相依行動(dòng)的情況下最大化自己的期望效用。也就是，行動(dòng)組合是一個(gè)純戰(zhàn)略貝葉斯Nash均衡，如果對(duì)，DepartmentofMathematicsNorthwestUniversity存在性結(jié)論定理一個(gè)有限的貝葉斯博弈一定存在貝葉斯Nash均衡。DepartmentofMathematicsNorthwestUniversity貝葉斯Nash均衡的求解先以簡(jiǎn)化的“斗雞博弈”為例。用p表示決斗者1關(guān)于決斗者2的類型的推斷。DepartmentofMathematicsNorthwestUniversity(x,(y,z))：x表示當(dāng)決斗者2選擇該方格所對(duì)應(yīng)的戰(zhàn)略時(shí)，決斗者1選擇該方格所對(duì)應(yīng)的戰(zhàn)略規(guī)定的行動(dòng)所得到的期望支付；y和z分別表示當(dāng)決斗者1選擇該方格所對(duì)應(yīng)的戰(zhàn)略時(shí)，“強(qiáng)硬”決斗者2和“軟弱”決斗者2選擇該方格所對(duì)應(yīng)的戰(zhàn)略規(guī)定的行動(dòng)所得到的期望支付。DepartmentofMathematicsNorthwestUniversity給定決斗者1選擇戰(zhàn)略U，“軟弱”決斗者2選擇行動(dòng)D的期望支付為0，選擇行動(dòng)U的期望支付為-4，行動(dòng)D優(yōu)于行動(dòng)U；給定決斗者1選擇戰(zhàn)略D，“軟弱”決斗者2選擇行動(dòng)D的期望支付為1，選擇行動(dòng)U的期望支付為0，所以，行動(dòng)D優(yōu)于行動(dòng)U。這意味著戰(zhàn)略(U,U)和(D,U)為決斗者2的劣戰(zhàn)略。DepartmentofMathematicsNorthwestUniversity剔除劣戰(zhàn)略后，有DepartmentofMathematicsNorthwestUniversity下面根據(jù)p的大小，求解博弈的純戰(zhàn)略貝葉斯Nash均衡。若，無(wú)論決斗者2選擇戰(zhàn)略(U,D)還是(D,D)，決斗者1的最優(yōu)行動(dòng)都是U。因此，D是決斗者1的劣戰(zhàn)略。顯然此時(shí)，決斗者2選擇(D,D)占優(yōu)。給定決斗者1的選擇U，“強(qiáng)硬”決斗者2的最優(yōu)行動(dòng)為D。所以，博弈存在惟一的純戰(zhàn)略貝葉斯Nash均衡——決斗者1選擇行動(dòng)U，“強(qiáng)硬”決斗者2選擇行動(dòng)D，“軟弱”決斗者2選擇行動(dòng)D。DepartmentofMathematicsNorthwestUniversity若，博弈存在如下兩個(gè)純戰(zhàn)略貝葉斯Nash均衡：(1)決斗者1選擇行動(dòng)U，“強(qiáng)硬”決斗者2選擇行動(dòng)D，“軟弱”決斗者2選擇行動(dòng)D；(2)決斗者1選擇行動(dòng)D，“強(qiáng)硬”決斗者2選擇行動(dòng)U，“軟弱”決斗者2選擇行動(dòng)D。DepartmentofMathematicsNorthwestUniversity求解“斗雞博弈”的貝葉斯Nash均衡假設(shè)“強(qiáng)硬”決斗者1關(guān)于決斗者2的類型推斷；“軟弱”決斗者1關(guān)于決斗者2的類型推斷；“強(qiáng)硬”決斗者2關(guān)于決斗者1的類型推斷；“軟弱”決斗者2關(guān)于決斗者1的類型推斷；DepartmentofMathematicsNorthwestUniversity的含義是：x1和x2分別表示當(dāng)決斗者2選擇該方格所對(duì)應(yīng)的戰(zhàn)略時(shí)，“強(qiáng)硬”決斗者1和“軟弱”決斗者1選擇該方格所對(duì)應(yīng)的戰(zhàn)略規(guī)定的行動(dòng)所得到的期望支付；y1和y2分別表示當(dāng)決斗者1選擇該方格所對(duì)應(yīng)的戰(zhàn)略時(shí)，“強(qiáng)硬”決斗者2和“軟弱”決斗者2選擇該方格所對(duì)應(yīng)的戰(zhàn)略規(guī)定的行動(dòng)所得到的期望支付。DepartmentofMathematicsNorthwestUniversityDepartmentofMathematicsNorthwestUniversity對(duì)于“軟弱”決斗者1，無(wú)論決斗者2選擇什么戰(zhàn)略，其最優(yōu)行動(dòng)都是D。所以，戰(zhàn)略(U,U)和(D,U)為決斗者1的劣戰(zhàn)略?；谕瑯拥脑?，戰(zhàn)略(U,U)和(D,U)為決斗者2的劣戰(zhàn)略。

DepartmentofMathematicsNorthwestUniversityDepartmentofMathematicsNorthwestUniversity對(duì)于“強(qiáng)硬”決斗者1，無(wú)論決斗者2選擇什么戰(zhàn)略，其最優(yōu)行動(dòng)都是U。所以，戰(zhàn)略(D,D)為決斗者1的劣戰(zhàn)略。給定決斗者1選擇戰(zhàn)略(U,D)，對(duì)于決斗者2戰(zhàn)略(D,U)和(D,D)是無(wú)差異的。DepartmentofMathematicsNorthwestUniversity所以，博弈存在如下兩個(gè)純戰(zhàn)略Nash均衡：“強(qiáng)硬”的決斗者1和2選擇行動(dòng)U，“軟弱”的決斗者1和2選擇行動(dòng)D；“強(qiáng)硬”的決斗者1選擇行動(dòng)U，“軟弱”的決斗者1選擇行動(dòng)D；“強(qiáng)硬”的決斗者2和“軟弱”的決斗者2選擇行動(dòng)D。DepartmentofMathematicsNorthwestUniversity貝葉斯Nash均衡定義的另一種表示方式在靜態(tài)貝葉斯博弈中，戰(zhàn)略組合是一個(gè)純戰(zhàn)略貝葉斯Nash均衡，如果對(duì)及,滿足即沒(méi)有參與人愿意改變自己的戰(zhàn)略，即使這種改變只涉及一種類型下的一個(gè)行動(dòng)。DepartmentofMathematicsNorthwestUniversity簡(jiǎn)化的“斗雞博弈”的純戰(zhàn)略貝葉斯Nash均衡為：如果p<1/2，博弈的純戰(zhàn)略貝葉斯Nash均衡為(U,(D,D))；如果p>1/2，博弈的純戰(zhàn)略貝葉斯Nash均衡為(U,(D,D))和(D,(U,D))。DepartmentofMathematicsNorthwestUniversity“斗雞博弈”的純戰(zhàn)略貝葉斯Nash均衡為：((U,D),(U,D))和((U,D),(D,D))。DepartmentofMathematicsNorthwestUniversity主要內(nèi)容：一、貝葉斯博弈二、貝葉斯Nash均衡三、貝葉斯Nash均衡的應(yīng)用四、關(guān)于混合戰(zhàn)略Nash均衡的一個(gè)解釋第十章貝葉斯博弈與貝葉斯Nash均衡DepartmentofMathematicsNorthwestUniversity1.不完全信息古諾模型在Cournot模型中，每一個(gè)企業(yè)對(duì)其他企業(yè)的成本和自己的成本是已知的，因而信息是完全的。然而在實(shí)際中，企業(yè)往往很難知道其他企業(yè)的成本。當(dāng)Cournot模型中至少有一個(gè)企業(yè)不知道其他企業(yè)的成本時(shí)所對(duì)應(yīng)的模型即為不完全信息的Cournot模型。參與人類型——成本函數(shù)。DepartmentofMathematicsNorthwestUniversity假設(shè)：企業(yè)1的成本函數(shù)為共同知識(shí)：企業(yè)2的成本函數(shù)為私人信息：其中，企業(yè)1知道企業(yè)2是的概率為p，是的的概率是1-p，p和1-p為共同知識(shí)。DepartmentofMathematicsNorthwestUniversity市場(chǎng)需求：DepartmentofMathematicsNorthwestUniversity進(jìn)一步假設(shè)：DepartmentofMathematicsNorthwestUniversity企業(yè)2：DepartmentofMathematicsNorthwestUniversity令則DepartmentofMathematicsNorthwestUniversity企業(yè)2的反應(yīng)函數(shù)DepartmentofMathematicsNorthwestUniversity不僅與企業(yè)1的產(chǎn)量有關(guān)，而且與自己的成本有關(guān)。DepartmentofMathematicsNorthwestUniversityDepartmentofMathematicsNorthwestUniversity企業(yè)1：企業(yè)1不知道企業(yè)2的真實(shí)成本，因而也不知道企業(yè)2的最優(yōu)反應(yīng)是企業(yè)將選擇使期望利潤(rùn)最大化的產(chǎn)量。DepartmentofMathematicsNorthwestUniversityDepartmentofMathematicsNorthwestUniversity由最優(yōu)化一階條件得：即企業(yè)1的反應(yīng)函數(shù)。DepartmentofMathematicsNorthwestUniversity聯(lián)立求解兩個(gè)反應(yīng)函數(shù)，得貝葉斯Nash均衡為：DepartmentofMathematicsNorthwestUniversity兩種均衡的比較：企業(yè)2為低成本：DepartmentofMathematicsNorthwestUniversity企業(yè)2為高成本：DepartmentofMathematicsNorthwestUniversity均衡比較示意圖NEBNE1/3q1

企業(yè)1的反應(yīng)函數(shù)低成本的企業(yè)2的反應(yīng)函數(shù)高成本的企業(yè)2的反應(yīng)函數(shù)DepartmentofMathematicsNorthwestUniversity假設(shè)：共同知識(shí)DepartmentofMathematicsNorthwestUniversity企業(yè)1——低成本類型(l)DepartmentofMathematicsNorthwestUniversity企業(yè)1——低成本類型(l)的反應(yīng)函數(shù)DepartmentofMathematicsNorthwestUniversity企業(yè)1——高成本類型(H)DepartmentofMathematicsNorthwestUniversity企業(yè)2——低成本類型(l)DepartmentofMathematicsNorthwestUniversity企業(yè)2——高成本類型(H)DepartmentofMathematicsNorthwestUniversity聯(lián)立求解(1.1)~(1.4)，即可得貝葉斯Nash均衡。DepartmentofMathematicsNorthwestUniversity2.不完全信息下的公共產(chǎn)品提供參與人類型——成本函數(shù)。兩個(gè)參與人1、2同時(shí)決定是否提供公共產(chǎn)品，每個(gè)參與人面臨的是一個(gè)0－1決策問(wèn)題，即提供或不提供。DepartmentofMathematicsNorthwestUniversity公共產(chǎn)品博弈DepartmentofMathematicsNorthwestUniversity假設(shè)：公共產(chǎn)品的好處(每人一個(gè)單位)為共同知識(shí)，但每人的成本只有自己知道；c1和c2具有相同的、獨(dú)立定義在上的分布函數(shù)P(·)，其中，P(·)為共同知識(shí)。DepartmentofMathematicsNorthwestUniversity參與人的純戰(zhàn)略a(ci)定義為其中，0表示不提供，1表示提供。參與人的支付為：DepartmentofMathematicsNorthwestUniversity兩個(gè)參與人1、2同時(shí)決定是否提供公共產(chǎn)品，每個(gè)參與人面臨的是一個(gè)0－1決策問(wèn)題，即提供或不提供。DepartmentofMathematicsNorthwestUniversityDepartmentofMathematicsNorthwestUniversity令表示均衡狀態(tài)下參與人j提供的概率。DepartmentofMathematicsNorthwestUniversity參與人i的反應(yīng)函數(shù)應(yīng)是：對(duì)方提供，則不提供；對(duì)方不提供則考慮提供。DepartmentofMathematicsNorthwestUniversity參與人i的提供的預(yù)期收益為：因此，只有當(dāng)時(shí)，參與人i才會(huì)提供。DepartmentofMathematicsNorthwestUniversityDepartmentofMathematicsNorthwestUniversity因此，存在使得只有當(dāng)時(shí)，參與人i才會(huì)提供。同理，存在使得只有當(dāng)時(shí)，參與人j才會(huì)提供。DepartmentofMathematicsNorthwestUniversity由于DepartmentofMathematicsNorthwestUniversity所以同理DepartmentofMathematicsNorthwestUniversity由于以上兩式可知，都必須滿足具體的均衡取決與分布函數(shù)P(·)的形式。DepartmentofMathematicsNorthwestUniversityDepartmentofMathematicsNorthwestUniversity11222/32/3公共產(chǎn)品提供區(qū)域完全信息下新增區(qū)域公共產(chǎn)品提供：完全信息與

人人文庫(kù)> 全部分類> 專業(yè)文獻(xiàn) > 工程機(jī)械

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第10章貝葉斯博弈與貝葉斯Nash均衡

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第10章 貝葉斯博弈與貝葉斯Nash均衡

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

第10章貝葉斯博弈與貝葉斯Nash均衡