




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三部分:不完全信息靜態(tài)博弈主要內(nèi)容:一、貝葉斯博弈二、貝葉斯Nash均衡三、貝葉斯Nash均衡的應(yīng)用四、關(guān)于混合戰(zhàn)略Nash均衡的一個(gè)解釋第十章貝葉斯博弈與貝葉斯Nash均衡DepartmentofMathematicsNorthwestUniversity一、貝葉斯博弈前面兩部分我們討論了完全信息博弈問(wèn)題,但在現(xiàn)實(shí)生活中我們遇到更多的可能是不完全信息博弈問(wèn)題。DepartmentofMathematicsNorthwestUniversity例如在“新產(chǎn)品開(kāi)發(fā)”博弈中,企業(yè)對(duì)市場(chǎng)的需求可能并不清楚;在連鎖店博弈中,潛在的進(jìn)入者可能并不知道連鎖店在市場(chǎng)上的盈利情況,等等。DepartmentofMathematicsNorthwestUniversity
新產(chǎn)品開(kāi)發(fā)博弈:考察一種新產(chǎn)品開(kāi)發(fā):兩個(gè)企業(yè)準(zhǔn)備各自開(kāi)發(fā)同一種新產(chǎn)品,并投放市場(chǎng)。開(kāi)發(fā)中企業(yè)的投入、產(chǎn)出如圖
企業(yè)1開(kāi)發(fā)(a):投資2000不開(kāi)發(fā)(b)需求大需求小企業(yè)2不開(kāi)發(fā),獲利800企業(yè)2開(kāi)發(fā),獲利300企業(yè)2不開(kāi)發(fā),獲利200企業(yè)2開(kāi)發(fā),賠400DepartmentofMathematicsNorthwestUniversity某著名品牌的連鎖店(不妨稱為參與人A)在K個(gè)城市中有分店,城市標(biāo)號(hào)為1,…,K。在每個(gè)城市k(k=1,…,K)有惟一一個(gè)潛在競(jìng)爭(zhēng)者(稱為參與人k),該競(jìng)爭(zhēng)者決定是否與參與人A競(jìng)爭(zhēng)——進(jìn)入(用I表示)和不進(jìn)入(用O表示)。如果參與人k決定去競(jìng)爭(zhēng),那么參與人A可以抵制(用F表示)也可以不抵制(用C表示)。連鎖店博弈DepartmentofMathematicsNorthwestUniversity不完全信息博弈問(wèn)題將博弈開(kāi)始時(shí)就存在事前不確定性的博弈問(wèn)題稱為不完全信息博弈問(wèn)題。DepartmentofMathematicsNorthwestUniversity例子:斗雞博弈兩個(gè)所謂的勇士舉著長(zhǎng)槍,準(zhǔn)備從獨(dú)木橋的兩端沖上橋中央進(jìn)行決斗。每位勇士都有兩種選擇:沖上去(用U表示),或退下來(lái)(用D表示)。若兩人都沖上去,則兩敗俱傷;若一方上去而另一方退下來(lái),沖上去者取得勝利(至少心理上是這樣的),退下來(lái)的丟了面子;若兩人都退下來(lái),兩人都丟面子。
DepartmentofMathematicsNorthwestUniversity考察這樣的情形:假設(shè)參與人可能有這樣的兩種性格特征(類型)——“強(qiáng)硬”(用s表示)或“軟弱”(用w表示)。所謂“強(qiáng)硬”的參與人是指那些喜歡爭(zhēng)強(qiáng)好勝、不達(dá)目的誓不罷休的決斗者;而“軟弱”的參與人是指那些膽小怕事、遇事希望息事寧人的決斗者。DepartmentofMathematicsNorthwestUniversity顯然,當(dāng)具有不同性格特征的決斗者相遇時(shí),所表現(xiàn)出來(lái)的博弈情形是不同的。令U表示沖上去;D表示退下去,則每種情況下博弈情形如下圖所示。DepartmentofMathematicsNorthwestUniversity當(dāng)參與人都為強(qiáng)硬者時(shí)博弈存在兩個(gè)純戰(zhàn)略Nash均衡——(U,D)和(D,U)。解釋:雙方都爭(zhēng)強(qiáng)好勝,但都不愿意發(fā)生直接沖突,都希望在自己沖上去時(shí),對(duì)方退下來(lái)。DepartmentofMathematicsNorthwestUniversity當(dāng)參與人1為強(qiáng)硬者參與人2為軟弱者時(shí)博弈存在唯一的Nash均衡——(U,D)。軟弱的決斗者膽小怕事,總是退下來(lái),因此,強(qiáng)硬的決斗者選擇沖上去。DepartmentofMathematicsNorthwestUniversity當(dāng)參與人1為軟弱者參與人2為強(qiáng)硬者時(shí)博弈存在唯一的Nash均衡——(D,U)。DepartmentofMathematicsNorthwestUniversity當(dāng)參與人都為軟弱者時(shí)博弈存在唯一的Nash均衡——(D,D)。雙方都息事寧人,希望和平共處,因此雙方都選擇退下來(lái)。DepartmentofMathematicsNorthwestUniversity(1)參與人都為強(qiáng)硬者(2)參與人1為強(qiáng)硬者參與人2為軟弱者(3)參與人1為軟弱者參與人2為強(qiáng)硬者(4)參與人都為軟弱者DepartmentofMathematicsNorthwestUniversity在“斗雞博弈”中,雖然在博弈開(kāi)始之前每位決斗者都了解(知道)自己的性格特征,但對(duì)對(duì)手的性格特征往往不甚了解或了解不全。在這種情況下即使所有的決斗者都看到了上面的四個(gè)戰(zhàn)略式博弈,但對(duì)決斗者來(lái)講,仍存在著所謂的事前不確定性即博弈開(kāi)始之前就不知道的信息。DepartmentofMathematicsNorthwestUniversity對(duì)于“強(qiáng)硬”的參與人1來(lái)講,雖然他看到了上面的戰(zhàn)略式博弈,但他不知道對(duì)手是“強(qiáng)硬”的還是“軟弱”的,所以博弈開(kāi)始之前他無(wú)法確定博弈是根據(jù)(1)還是(2)進(jìn)行。這意味著“強(qiáng)硬”的參與人1面臨著事前無(wú)法確定的信息。DepartmentofMathematicsNorthwestUniversity同樣,“軟弱”的參與人1也會(huì)面臨類似的問(wèn)題。此時(shí),“斗雞博弈”就是一個(gè)不完全信息博弈問(wèn)題。DepartmentofMathematicsNorthwestUniversity對(duì)于不完全信息博弈問(wèn)題,是不可能應(yīng)用前面兩部分介紹的方法進(jìn)行求解的。DepartmentofMathematicsNorthwestUniversity這是因?yàn)榻o定參與人1為“強(qiáng)硬”的決斗者,如果對(duì)手是“軟弱”的,那么博弈就只存在惟一的Nash均衡(U,D),參與人1有惟一的最優(yōu)選擇“沖上去”;如果對(duì)手是“強(qiáng)硬”的,則博弈就會(huì)出現(xiàn)兩個(gè)Nash均衡(U,D)和(D,U),參與人1的最優(yōu)選擇取決于對(duì)手的選擇。DepartmentofMathematicsNorthwestUniversity但由于參與人1不知道對(duì)手究竟是“強(qiáng)硬”的還是“軟弱”的,因此,此時(shí)的參與人1就覺(jué)得自己似乎是在與兩個(gè)決斗者進(jìn)行決斗,一個(gè)是“強(qiáng)硬”的,另一個(gè)是“軟弱”的。當(dāng)一個(gè)參與人并不知道在與誰(shuí)博弈時(shí),博弈的規(guī)則是沒(méi)有意義的。DepartmentofMathematicsNorthwestUniversity如何處理不完全信息博弈問(wèn)題?DepartmentofMathematicsNorthwestUniversityHarsanyi轉(zhuǎn)換為了方便分析,對(duì)“斗雞博弈”進(jìn)行簡(jiǎn)化。假設(shè)參與人1是“強(qiáng)硬”的決斗者,參與人2可能是“強(qiáng)硬”的也可能是“軟弱”的,參與人1不知道但參與人2清楚參與人2的性格,而且這一假設(shè)為所有的參與人所知道。
DepartmentofMathematicsNorthwestUniversityHarsanyi轉(zhuǎn)換:在原博弈中引入一個(gè)“虛擬”參與人——“自然”(nature,用N表示),構(gòu)造一個(gè)參與人為兩個(gè)決斗者和“自然”的三人博弈。DepartmentofMathematicsNorthwestUniversityHarsanyi轉(zhuǎn)換“自然”首先行動(dòng)決定參與人2的性格特征(即選擇參與人2是“強(qiáng)硬”的還是“軟弱”的),“自然”的選擇參與人1不知道,但參與人2知道。DepartmentofMathematicsNorthwestUniversity在“自然”選擇后,參與人1和2再進(jìn)行“斗雞博弈”。
DepartmentofMathematicsNorthwestUniversity在新構(gòu)造的三人博弈中,“自然”的支付不必考慮。參與人1和2的支付由“斗雞博弈”決定。DepartmentofMathematicsNorthwestUniversity如果“自然”選擇參與人2的性格特征是“強(qiáng)硬”的,則意味著參與人1與“強(qiáng)硬”的參與人2進(jìn)行決斗,博弈進(jìn)入決策結(jié)x1,其支付(1)決定;DepartmentofMathematicsNorthwestUniversity如果“自然”選擇參與人2的性格特征是“軟弱”的,則意味著參與人1與“軟弱”的參與人2進(jìn)行決斗,博弈進(jìn)入決策結(jié)x2,其支付由(2)決定。DepartmentofMathematicsNorthwestUniversityHarsanyi通過(guò)引入“虛擬”參與人,將博弈的起始點(diǎn)由x1(或x2)提前至x0,從而將原博弈中參與人的事前不確定性轉(zhuǎn)變?yōu)椴┺拈_(kāi)始后的不確定性(即參與人1不知道“自然”的選擇)。這種通過(guò)引入“虛擬”參與人來(lái)處理不完全信息博弈問(wèn)題的方法亦稱Harsanyi轉(zhuǎn)換。DepartmentofMathematicsNorthwestUniversity注意:盡管通過(guò)Harsanyi轉(zhuǎn)換可將不完全信息博弈轉(zhuǎn)換為完全信息博弈,但是,此時(shí)仍然不能利用前面的完全信息博弈問(wèn)題的處理方法求解。原因在于,虛擬的參與人沒(méi)有支付,因而其選擇是隨機(jī)的。DepartmentofMathematicsNorthwestUniversity考察不完全信息博弈問(wèn)題參與人的決策用p1表示參與人1認(rèn)為“自然”選擇參與人2為“強(qiáng)硬”的概率;用x表示“強(qiáng)硬”的決斗者2選擇行動(dòng)U的概率。v1(U)和v1(D)分別表示參與人1認(rèn)為自己選擇行動(dòng)U和D時(shí)所能得到的期望收益;DepartmentofMathematicsNorthwestUniversityDepartmentofMathematicsNorthwestUniversityv1(U)的計(jì)算:強(qiáng)硬的參與人2:(p1)策略---概率:(U,U)---x(U,D)---1-x支付:-4,-42,-2參與人1期望支付:-4x+2(1-x)軟弱的參與人2:
(1-p1)由于參與人1為強(qiáng)硬,而當(dāng)他預(yù)感到參與人2為軟弱時(shí),參與人只會(huì)選擇退縮,即策略:(U,D)支付:2,0期望支付:2DepartmentofMathematicsNorthwestUniversityv1(D)的計(jì)算:強(qiáng)硬的參與人2:(p1)策略---概率:(D,U)---x(D,D)---1-x支付:-2,20,0參與人1期望支付:-2x+0(1-x)軟弱的參與人2:
(1-p1)由于參與人1為強(qiáng)硬,而當(dāng)他預(yù)感到參與人2為軟弱時(shí),參與人2只會(huì)退縮,即策略:(D,D)支付:0,1期望支付:0DepartmentofMathematicsNorthwestUniversity當(dāng)即時(shí),對(duì)參與人1來(lái)講,其最優(yōu)選擇是U(即“沖上去”)。解釋:由于,所以要保證取到所有可能概率值,需,即,也就是說(shuō),當(dāng)參與人1認(rèn)為參與人2是“強(qiáng)硬”決斗者的可能性不超過(guò)1/2時(shí),就會(huì)選擇“沖上去”。DepartmentofMathematicsNorthwestUniversity考察參與人2的選擇軟弱的參與人2只會(huì)選擇行動(dòng)D;強(qiáng)硬的參與人2的最優(yōu)選擇與參與人1的選擇有關(guān):一方面與參與人1關(guān)于“自然”選擇的推斷有關(guān),另一方面,還與自己關(guān)于“參與人1關(guān)于“自然”的推斷p1”的推斷有關(guān)。用q1表示參與人2關(guān)于“參與人1關(guān)于‘自然’選擇的推斷”的推斷,即q1表示參與人2認(rèn)為“參與人1認(rèn)為參與人2是‘強(qiáng)硬’的”概率。DepartmentofMathematicsNorthwestUniversity類似前面的分析:如果,則參與人2認(rèn)為“U(即‘沖上去’)是參與人1的最優(yōu)選擇”;與此同時(shí),如果,則參與人1的最優(yōu)選擇與參與人2的預(yù)測(cè)一致。但是,如果而,則參與人1的最優(yōu)選擇就可能與參與人2的預(yù)測(cè)不一致,此時(shí),就無(wú)法對(duì)問(wèn)題進(jìn)行分析。DepartmentofMathematicsNorthwestUniversity在Harsanyi轉(zhuǎn)換中規(guī)定:參與人關(guān)于“自然”選擇的推斷為共同知識(shí)。也就是說(shuō),兩個(gè)決斗者不僅同時(shí)一起看到了“自然”隨機(jī)選擇參與人2的性格特征,而且同時(shí)一起看到了“自然”以何種概率分布隨機(jī)選擇參與人2的性格特征。DepartmentofMathematicsNorthwestUniversity不完全信息博弈經(jīng)Harsanyi轉(zhuǎn)換之后得到的完全但不完美信息博弈。(x,y)表示參與人1的性格特征為x,參與人2的性格特征為y;pxy表示“自然”選擇(x,y)的概率,這里pxy為共同知識(shí)。
DepartmentofMathematicsNorthwestUniversity在應(yīng)用Harsanyi轉(zhuǎn)換時(shí),需要注意以下問(wèn)題:
(1)“自然”的選擇。在一般的不完全信息博弈問(wèn)題中,Harsanyi轉(zhuǎn)換規(guī)定“自然”選擇的是參與人的類型(type)。除了根據(jù)參與人的支付來(lái)劃分參與人的類型以外,還可以根據(jù)參與人的行動(dòng)空間,甚至根據(jù)參與人掌握信息的多少(或程度)來(lái)來(lái)劃分參與人的類型。但是,需要注意的是,參與人的類型必須是其個(gè)人特征的一個(gè)完備描述,這種描述只有自己才能夠觀測(cè)到,其他的參與人觀測(cè)不到。
DepartmentofMathematicsNorthwestUniversity用ti表示參與人i的一個(gè)特定的類型,Ti表示參與人i所有類型的集合(亦稱類型空間,typespace),即,t=(t1,…,tn)表示一個(gè)所有參與人的類型組合,t-i=(t1,…,ti-1,…,tn)表示除參與人i之外其他參與人的類型組合。所以,t=(ti,t-i)。DepartmentofMathematicsNorthwestUniversity2)參與人關(guān)于“自然”選擇的推斷。用p(t1,…,tn)表示定義在參與人類型組合上的一個(gè)聯(lián)合分布密度函數(shù),Harsanyi轉(zhuǎn)換假定:對(duì)于一個(gè)給定的不完全信息博弈問(wèn)題,存在一個(gè)參與人關(guān)于“自然”選擇的推斷p(t1,…,tn),且p(t1,…,tn)為共同知識(shí)。也就是說(shuō),Harsanyi轉(zhuǎn)換假定所有參與人關(guān)于“自然”行動(dòng)的信念(belief)是相同的,并且為共同知識(shí)。DepartmentofMathematicsNorthwestUniversity用表示參與人i在知道自己類型為ti的情況下,關(guān)于其他參與人類型的推斷(即條件概率),則有(貝葉斯公式)其中,為邊緣密度函數(shù)。DepartmentofMathematicsNorthwestUniversity假設(shè)pss=0.2,psw=0.3,pws=0.25,pww=0.25。雖然決斗者1不知道決斗者2的類型,但由于決斗者1知道自己的類型,因此他可以根據(jù)貝葉斯公式推知決斗者2的類型分布。DepartmentofMathematicsNorthwestUniversity例如根據(jù)貝葉斯規(guī)則,“強(qiáng)硬”的決斗者1可以推知:決斗者2是“強(qiáng)硬”的概率為決斗者2是“軟弱”的概率為“軟弱”的決斗者1可以推知:決斗者2是“強(qiáng)硬”的概率為決斗者2是“軟弱”的概率為DepartmentofMathematicsNorthwestUniversity這里不同類型的決斗者1所形成的關(guān)于“自然”選擇的推斷是不同的,究其原因,Harsanyi認(rèn)為:雖然理性的參與人在掌握同樣的信息時(shí)對(duì)同一事件會(huì)形成相同的概率推斷,但參與人各自掌握的信息不同時(shí)對(duì)同一事件就會(huì)形成不同的概率推斷。DepartmentofMathematicsNorthwestUniversity這說(shuō)明在Harsanyi轉(zhuǎn)換中,盡管參與人對(duì)包括自己在內(nèi)的所有參與人的類型的聯(lián)合概率推斷(分布)都是一樣的,但由于參與人掌握的私人信息不同,使得各自對(duì)其他參與人的類型的概率分布的推斷不同。DepartmentofMathematicsNorthwestUniversity貝葉斯博弈(thestaticBayesiangame)是關(guān)于不完全信息靜態(tài)博弈的一種建模方式,也是不完全信息靜態(tài)博弈的標(biāo)準(zhǔn)式描述。DepartmentofMathematicsNorthwestUniversity貝葉斯博弈的定義貝葉斯博弈包含以下五個(gè)要素:參與人集合;參與人的類型集T1,…,T2;參與人關(guān)于其他參與人類型的推斷
…,;(4)參與人類型相依的行動(dòng)集A(t1),…,A(tn);(5)參與人類型相依的支付函數(shù)
,…,。DepartmentofMathematicsNorthwestUniversity參與人的推斷來(lái)源于一個(gè)共同的參與人關(guān)于“自然”選擇的推斷p(t1,…,tn),且p(t1,…,tn)為共同知識(shí)。所以,貝葉斯博弈中參與人所具有的關(guān)于其他參與人的類型的推斷是一致的。如果,即所有參與人的類型只有一個(gè),那么不完全信息靜態(tài)博弈就退化為完全信息靜態(tài)博弈。DepartmentofMathematicsNorthwestUniversity規(guī)定貝葉斯博弈的時(shí)間順序如下:“自然”選擇參與人的類型組合t=(t1,…,tn);參與人i觀測(cè)到“自然”關(guān)于自己類型ti的選擇;雖然參與人i觀測(cè)不到“自然”關(guān)于其他參與人類型t-i的選擇,但參與人i具有關(guān)于其他參與人類型的推斷;參與人同時(shí)選擇行動(dòng),每個(gè)參與人i從行動(dòng)集Ai(ti)中選擇行動(dòng)ai(ti);參與人i得到。DepartmentofMathematicsNorthwestUniversity貝葉斯博弈中的戰(zhàn)略在貝葉斯博弈中,參與人i的一個(gè)戰(zhàn)略是從參與人的類型集Ti到其行動(dòng)集的一個(gè)函數(shù)si(ti),它包含了當(dāng)自然賦予i的類型為ti時(shí),i將從可行的行動(dòng)集Ai(ti)中選擇的行動(dòng)。DepartmentofMathematicsNorthwestUniversity“斗雞博弈”的貝葉斯模型參與人為決斗者1和2;用s表示決斗者是“強(qiáng)硬”的,w表示決斗者是“軟弱”的,所以T1=T2={s,w}。用pxy表示“自然”選擇類型組合(x,y)的概率,并假設(shè)pxy為共同知識(shí),則每位決斗者i關(guān)于其對(duì)手類型的推斷pi(x|y)可利用貝葉斯公式計(jì)算。每位決斗者i關(guān)于類型相依的行動(dòng)空間Ai(x)={U,D}。每位決斗者i的支付由前面的圖決定。DepartmentofMathematicsNorthwestUniversity在貝葉斯博弈中參與人的戰(zhàn)略可定義為戰(zhàn)略——“強(qiáng)硬”的決斗者i選擇行動(dòng)U,“軟弱”的決斗者選擇行動(dòng)U
,即(U,U);戰(zhàn)略——“強(qiáng)硬”的決斗者選擇行動(dòng)U
,“軟弱”的決斗者選擇行動(dòng)D,即(U,D);戰(zhàn)略——“強(qiáng)硬”的決斗者選擇行動(dòng)D,“軟弱”的決斗者選擇行動(dòng)U
,即(D,U);戰(zhàn)略——“強(qiáng)硬”的決斗者選擇行動(dòng)D,“軟弱”的決斗者選擇行動(dòng)D,即(D,D)。DepartmentofMathematicsNorthwestUniversity問(wèn)題:
1.如何定義貝葉斯博弈的解:
2.如何求解貝葉斯博弈?DepartmentofMathematicsNorthwestUniversity主要內(nèi)容:一、貝葉斯博弈二、貝葉斯Nash均衡三、貝葉斯Nash均衡的應(yīng)用四、關(guān)于混合戰(zhàn)略Nash均衡的一個(gè)解釋第十章貝葉斯博弈與貝葉斯Nash均衡DepartmentofMathematicsNorthwestUniversity以斗雞博弈為例:用x表示“強(qiáng)硬”的決斗者2選擇行動(dòng)U的概率,y表示決斗者1選擇行動(dòng)U的概率。決斗者1選擇行動(dòng)U和D的期望收益分別為:,這里p為“自然”選擇決斗者2為“強(qiáng)硬”的概率。決斗者1的最優(yōu)戰(zhàn)略為:如果,則選擇y=1(即選擇行動(dòng)U);如果,則選擇y=0(即選擇行動(dòng)D);如果,則選擇(即選擇任一混合戰(zhàn)略)。
DepartmentofMathematicsNorthwestUniversity考察“強(qiáng)硬”決斗者2的選擇?!皬?qiáng)硬”決斗者2選擇行動(dòng)U和D的期望收益分別為,“強(qiáng)硬”決斗者2的最優(yōu)戰(zhàn)略為:如果y<1/2,則選擇x=1(即選擇行動(dòng)U);如果y>1/2,則選擇x=0(即選擇行動(dòng)D);如果y=1/2,則選擇(即選擇任一混合戰(zhàn)略)。DepartmentofMathematicsNorthwestUniversity不完美信息博弈存在如下兩個(gè)純戰(zhàn)略Nash均衡決斗者1選擇行動(dòng)U,“強(qiáng)硬”決斗者2選擇行動(dòng)D,“軟弱”決斗者2選擇行動(dòng)D;決斗者1選擇行動(dòng)D,“強(qiáng)硬”決斗者2選擇行動(dòng)U,“軟弱”決斗者2選擇行動(dòng)D。此外,博弈還存在一個(gè)混合戰(zhàn)略Nash均衡,即決斗者1以1/2的概率選擇行動(dòng)U,“強(qiáng)硬”決斗者2以的概率1/(2p)選擇行動(dòng)U,“軟弱”決斗者2選擇行動(dòng)D。DepartmentofMathematicsNorthwestUniversity用表示給定其他參與人的戰(zhàn)略,類型為ti的參與人i選擇行動(dòng)ai時(shí)的期望效用,則其中,對(duì),為給定t-i時(shí)由s-i所確定的其他參與人的行動(dòng)組合DepartmentofMathematicsNorthwestUniversity“斗雞博弈”中,“強(qiáng)硬”的決斗者1關(guān)于對(duì)手類型的推斷為DepartmentofMathematicsNorthwestUniversity所以,當(dāng)決斗者2的戰(zhàn)略為(即(U,U)),則“強(qiáng)硬”的決斗者1選擇行動(dòng)U和D時(shí)的期望效用分別為DepartmentofMathematicsNorthwestUniversity當(dāng)決斗者2的戰(zhàn)略為(即(U,D)),則“強(qiáng)硬”的決斗者1選擇行動(dòng)U和D時(shí)的期望效用分別為DepartmentofMathematicsNorthwestUniversity在貝葉斯博弈中,對(duì)于一個(gè)理性的參與人i,當(dāng)他只知道自己的類型ti而不知道其他參與人的類型時(shí),給定其他參與人的戰(zhàn)略s-i,他將選擇使自己期望效用(支付)最大化的行動(dòng),其中DepartmentofMathematicsNorthwestUniversity純戰(zhàn)略貝葉斯Nash均衡貝葉斯博弈的純戰(zhàn)略貝葉斯Nash均衡是一個(gè)類型相依的行動(dòng)組合,其中每個(gè)參與人在給定自己的類型ti和其他參與人的類型相依行動(dòng)的情況下最大化自己的期望效用。也就是,行動(dòng)組合是一個(gè)純戰(zhàn)略貝葉斯Nash均衡,如果對(duì),DepartmentofMathematicsNorthwestUniversity存在性結(jié)論定理一個(gè)有限的貝葉斯博弈一定存在貝葉斯Nash均衡。DepartmentofMathematicsNorthwestUniversity貝葉斯Nash均衡的求解先以簡(jiǎn)化的“斗雞博弈”為例。用p表示決斗者1關(guān)于決斗者2的類型的推斷。DepartmentofMathematicsNorthwestUniversity(x,(y,z)):x表示當(dāng)決斗者2選擇該方格所對(duì)應(yīng)的戰(zhàn)略時(shí),決斗者1選擇該方格所對(duì)應(yīng)的戰(zhàn)略規(guī)定的行動(dòng)所得到的期望支付;y和z分別表示當(dāng)決斗者1選擇該方格所對(duì)應(yīng)的戰(zhàn)略時(shí),“強(qiáng)硬”決斗者2和“軟弱”決斗者2選擇該方格所對(duì)應(yīng)的戰(zhàn)略規(guī)定的行動(dòng)所得到的期望支付。DepartmentofMathematicsNorthwestUniversity給定決斗者1選擇戰(zhàn)略U,“軟弱”決斗者2選擇行動(dòng)D的期望支付為0,選擇行動(dòng)U的期望支付為-4,行動(dòng)D優(yōu)于行動(dòng)U;給定決斗者1選擇戰(zhàn)略D,“軟弱”決斗者2選擇行動(dòng)D的期望支付為1,選擇行動(dòng)U的期望支付為0,所以,行動(dòng)D優(yōu)于行動(dòng)U。這意味著戰(zhàn)略(U,U)和(D,U)為決斗者2的劣戰(zhàn)略。DepartmentofMathematicsNorthwestUniversity剔除劣戰(zhàn)略后,有DepartmentofMathematicsNorthwestUniversity下面根據(jù)p的大小,求解博弈的純戰(zhàn)略貝葉斯Nash均衡。若,無(wú)論決斗者2選擇戰(zhàn)略(U,D)還是(D,D),決斗者1的最優(yōu)行動(dòng)都是U。因此,D是決斗者1的劣戰(zhàn)略。顯然此時(shí),決斗者2選擇(D,D)占優(yōu)。給定決斗者1的選擇U,“強(qiáng)硬”決斗者2的最優(yōu)行動(dòng)為D。所以,博弈存在惟一的純戰(zhàn)略貝葉斯Nash均衡——決斗者1選擇行動(dòng)U,“強(qiáng)硬”決斗者2選擇行動(dòng)D,“軟弱”決斗者2選擇行動(dòng)D。DepartmentofMathematicsNorthwestUniversity若,博弈存在如下兩個(gè)純戰(zhàn)略貝葉斯Nash均衡:(1)決斗者1選擇行動(dòng)U,“強(qiáng)硬”決斗者2選擇行動(dòng)D,“軟弱”決斗者2選擇行動(dòng)D;(2)決斗者1選擇行動(dòng)D,“強(qiáng)硬”決斗者2選擇行動(dòng)U,“軟弱”決斗者2選擇行動(dòng)D。DepartmentofMathematicsNorthwestUniversity求解“斗雞博弈”的貝葉斯Nash均衡假設(shè)“強(qiáng)硬”決斗者1關(guān)于決斗者2的類型推斷;“軟弱”決斗者1關(guān)于決斗者2的類型推斷;“強(qiáng)硬”決斗者2關(guān)于決斗者1的類型推斷;“軟弱”決斗者2關(guān)于決斗者1的類型推斷;DepartmentofMathematicsNorthwestUniversity的含義是:x1和x2分別表示當(dāng)決斗者2選擇該方格所對(duì)應(yīng)的戰(zhàn)略時(shí),“強(qiáng)硬”決斗者1和“軟弱”決斗者1選擇該方格所對(duì)應(yīng)的戰(zhàn)略規(guī)定的行動(dòng)所得到的期望支付;y1和y2分別表示當(dāng)決斗者1選擇該方格所對(duì)應(yīng)的戰(zhàn)略時(shí),“強(qiáng)硬”決斗者2和“軟弱”決斗者2選擇該方格所對(duì)應(yīng)的戰(zhàn)略規(guī)定的行動(dòng)所得到的期望支付。DepartmentofMathematicsNorthwestUniversityDepartmentofMathematicsNorthwestUniversity對(duì)于“軟弱”決斗者1,無(wú)論決斗者2選擇什么戰(zhàn)略,其最優(yōu)行動(dòng)都是D。所以,戰(zhàn)略(U,U)和(D,U)為決斗者1的劣戰(zhàn)略?;谕瑯拥脑?,戰(zhàn)略(U,U)和(D,U)為決斗者2的劣戰(zhàn)略。
DepartmentofMathematicsNorthwestUniversityDepartmentofMathematicsNorthwestUniversity對(duì)于“強(qiáng)硬”決斗者1,無(wú)論決斗者2選擇什么戰(zhàn)略,其最優(yōu)行動(dòng)都是U。所以,戰(zhàn)略(D,D)為決斗者1的劣戰(zhàn)略。給定決斗者1選擇戰(zhàn)略(U,D),對(duì)于決斗者2戰(zhàn)略(D,U)和(D,D)是無(wú)差異的。DepartmentofMathematicsNorthwestUniversity所以,博弈存在如下兩個(gè)純戰(zhàn)略Nash均衡:“強(qiáng)硬”的決斗者1和2選擇行動(dòng)U,“軟弱”的決斗者1和2選擇行動(dòng)D;“強(qiáng)硬”的決斗者1選擇行動(dòng)U,“軟弱”的決斗者1選擇行動(dòng)D;“強(qiáng)硬”的決斗者2和“軟弱”的決斗者2選擇行動(dòng)D。DepartmentofMathematicsNorthwestUniversity貝葉斯Nash均衡定義的另一種表示方式在靜態(tài)貝葉斯博弈中,戰(zhàn)略組合是一個(gè)純戰(zhàn)略貝葉斯Nash均衡,如果對(duì)及,滿足即沒(méi)有參與人愿意改變自己的戰(zhàn)略,即使這種改變只涉及一種類型下的一個(gè)行動(dòng)。DepartmentofMathematicsNorthwestUniversity簡(jiǎn)化的“斗雞博弈”的純戰(zhàn)略貝葉斯Nash均衡為:如果p<1/2,博弈的純戰(zhàn)略貝葉斯Nash均衡為(U,(D,D));如果p>1/2,博弈的純戰(zhàn)略貝葉斯Nash均衡為(U,(D,D))和(D,(U,D))。DepartmentofMathematicsNorthwestUniversity“斗雞博弈”的純戰(zhàn)略貝葉斯Nash均衡為:((U,D),(U,D))和((U,D),(D,D))。DepartmentofMathematicsNorthwestUniversity主要內(nèi)容:一、貝葉斯博弈二、貝葉斯Nash均衡三、貝葉斯Nash均衡的應(yīng)用四、關(guān)于混合戰(zhàn)略Nash均衡的一個(gè)解釋第十章貝葉斯博弈與貝葉斯Nash均衡DepartmentofMathematicsNorthwestUniversity1.不完全信息古諾模型在Cournot模型中,每一個(gè)企業(yè)對(duì)其他企業(yè)的成本和自己的成本是已知的,因而信息是完全的。然而在實(shí)際中,企業(yè)往往很難知道其他企業(yè)的成本。當(dāng)Cournot模型中至少有一個(gè)企業(yè)不知道其他企業(yè)的成本時(shí)所對(duì)應(yīng)的模型即為不完全信息的Cournot模型。參與人類型——成本函數(shù)。DepartmentofMathematicsNorthwestUniversity假設(shè):企業(yè)1的成本函數(shù)為共同知識(shí):企業(yè)2的成本函數(shù)為私人信息:其中,企業(yè)1知道企業(yè)2是的概率為p,是的的概率是1-p,p和1-p為共同知識(shí)。DepartmentofMathematicsNorthwestUniversity市場(chǎng)需求:DepartmentofMathematicsNorthwestUniversity進(jìn)一步假設(shè):DepartmentofMathematicsNorthwestUniversity企業(yè)2:DepartmentofMathematicsNorthwestUniversity令則DepartmentofMathematicsNorthwestUniversity企業(yè)2的反應(yīng)函數(shù)DepartmentofMathematicsNorthwestUniversity不僅與企業(yè)1的產(chǎn)量有關(guān),而且與自己的成本有關(guān)。DepartmentofMathematicsNorthwestUniversityDepartmentofMathematicsNorthwestUniversity企業(yè)1:企業(yè)1不知道企業(yè)2的真實(shí)成本,因而也不知道企業(yè)2的最優(yōu)反應(yīng)是企業(yè)將選擇使期望利潤(rùn)最大化的產(chǎn)量。DepartmentofMathematicsNorthwestUniversityDepartmentofMathematicsNorthwestUniversity由最優(yōu)化一階條件得:即企業(yè)1的反應(yīng)函數(shù)。DepartmentofMathematicsNorthwestUniversity聯(lián)立求解兩個(gè)反應(yīng)函數(shù),得貝葉斯Nash均衡為:DepartmentofMathematicsNorthwestUniversity兩種均衡的比較:企業(yè)2為低成本:DepartmentofMathematicsNorthwestUniversity企業(yè)2為高成本:DepartmentofMathematicsNorthwestUniversity均衡比較示意圖NEBNE1/3q1
q2
企業(yè)1的反應(yīng)函數(shù)低成本的企業(yè)2的反應(yīng)函數(shù)高成本的企業(yè)2的反應(yīng)函數(shù)DepartmentofMathematicsNorthwestUniversity假設(shè):共同知識(shí)DepartmentofMathematicsNorthwestUniversity企業(yè)1——低成本類型(l)DepartmentofMathematicsNorthwestUniversity企業(yè)1——低成本類型(l)的反應(yīng)函數(shù)DepartmentofMathematicsNorthwestUniversity企業(yè)1——高成本類型(H)DepartmentofMathematicsNorthwestUniversity企業(yè)2——低成本類型(l)DepartmentofMathematicsNorthwestUniversity企業(yè)2——高成本類型(H)DepartmentofMathematicsNorthwestUniversity聯(lián)立求解(1.1)~(1.4),即可得貝葉斯Nash均衡。DepartmentofMathematicsNorthwestUniversity2.不完全信息下的公共產(chǎn)品提供參與人類型——成本函數(shù)。兩個(gè)參與人1、2同時(shí)決定是否提供公共產(chǎn)品,每個(gè)參與人面臨的是一個(gè)0-1決策問(wèn)題,即提供或不提供。DepartmentofMathematicsNorthwestUniversity公共產(chǎn)品博弈DepartmentofMathematicsNorthwestUniversity假設(shè):公共產(chǎn)品的好處(每人一個(gè)單位)為共同知識(shí),但每人的成本只有自己知道;c1和c2具有相同的、獨(dú)立定義在上的分布函數(shù)P(·),其中,P(·)為共同知識(shí)。DepartmentofMathematicsNorthwestUniversity參與人的純戰(zhàn)略a(ci)定義為其中,0表示不提供,1表示提供。參與人的支付為:DepartmentofMathematicsNorthwestUniversity兩個(gè)參與人1、2同時(shí)決定是否提供公共產(chǎn)品,每個(gè)參與人面臨的是一個(gè)0-1決策問(wèn)題,即提供或不提供。DepartmentofMathematicsNorthwestUniversityDepartmentofMathematicsNorthwestUniversity令表示均衡狀態(tài)下參與人j提供的概率。DepartmentofMathematicsNorthwestUniversity參與人i的反應(yīng)函數(shù)應(yīng)是:對(duì)方提供,則不提供;對(duì)方不提供則考慮提供。DepartmentofMathematicsNorthwestUniversity參與人i的提供的預(yù)期收益為:因此,只有當(dāng)時(shí),參與人i才會(huì)提供。DepartmentofMathematicsNorthwestUniversityDepartmentofMathematicsNorthwestUniversity因此,存在使得只有當(dāng)時(shí),參與人i才會(huì)提供。同理,存在使得只有當(dāng)時(shí),參與人j才會(huì)提供。DepartmentofMathematicsNorthwestUniversity由于DepartmentofMathematicsNorthwestUniversity所以同理DepartmentofMathematicsNorthwestUniversity由于以上兩式可知,都必須滿足具體的均衡取決與分布函數(shù)P(·)的形式。DepartmentofMathematicsNorthwestUniversityDepartmentofMathematicsNorthwestUniversity11222/32/3公共產(chǎn)品提供區(qū)域完全信息下新增區(qū)域公共產(chǎn)品提供:完全信息與
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 供水保障項(xiàng)信息化項(xiàng)目背景與意義
- 人民醫(yī)院科院區(qū)建設(shè)社會(huì)影響分析
- 廠房屋頂分布式光伏項(xiàng)目風(fēng)險(xiǎn)分析與應(yīng)對(duì)措施
- 鎖購(gòu)銷合同范本
- 我國(guó)城市主要區(qū)域的環(huán)境噪音標(biāo)準(zhǔn)是怎樣規(guī)定的
- 科技企業(yè)如何構(gòu)建高效的數(shù)據(jù)安全防護(hù)體系
- 修建住房合同范本
- 佛山2025年廣東佛山市中醫(yī)院三水醫(yī)院招聘工作人員73人筆試歷年參考題庫(kù)附帶答案詳解
- 云南2025年云南省藥品監(jiān)督管理局所屬事業(yè)單位招聘11人筆試歷年參考題庫(kù)附帶答案詳解
- 知產(chǎn)保護(hù)與經(jīng)濟(jì)發(fā)展的關(guān)系研究
- 2025年合肥職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)完整版
- 2025年湖南城建職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)新版
- 企業(yè)級(jí)軟件開(kāi)發(fā)作業(yè)指導(dǎo)書
- 《中國(guó)古代文學(xué)史及作品選II》教學(xué)大綱
- 代工生產(chǎn)合同范本
- 瑜伽課程合同轉(zhuǎn)讓協(xié)議書范本
- 個(gè)人經(jīng)營(yíng)性貸款合同模板
- 人教版英語(yǔ)2025七年級(jí)下冊(cè) Unit1Animal Friends教師版 語(yǔ)法講解+練習(xí)
- DeepSeek新手入門教程
- 課件:《教育強(qiáng)國(guó)建設(shè)規(guī)劃綱要(2024-2035年)》學(xué)習(xí)宣講
- 2025年山東化工職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試近5年常考版參考題庫(kù)含答案解析
評(píng)論
0/150
提交評(píng)論