中級(jí)微觀經(jīng)濟(jì)學(xué)-博弈論_第1頁(yè)
中級(jí)微觀經(jīng)濟(jì)學(xué)-博弈論_第2頁(yè)
中級(jí)微觀經(jīng)濟(jì)學(xué)-博弈論_第3頁(yè)
中級(jí)微觀經(jīng)濟(jì)學(xué)-博弈論_第4頁(yè)
中級(jí)微觀經(jīng)濟(jì)學(xué)-博弈論_第5頁(yè)
已閱讀5頁(yè),還剩38頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四講博弈論概論到目前為止,我們對(duì)經(jīng)濟(jì)活動(dòng)的考察沒(méi)有考慮人們之間行為的相互影響。其實(shí),現(xiàn)實(shí)中一個(gè)人的行為總是受到其他人行為的影響和制約,人們?cè)谧分鹱约豪娴倪^(guò)程中難免要與他人發(fā)生利益沖突或矛盾。如何克服和解決人們之間的利益沖突?如何才能實(shí)現(xiàn)一種既能讓每個(gè)人都實(shí)現(xiàn)自己的利益,又能讓每個(gè)人都不妨礙和傷害他人利益的互利互惠的和諧局面?博弈論(GameTheory)為解決這些問(wèn)題提供了一種有力的科學(xué)分析框架。什么是博弈論自20世紀(jì)80年代以來(lái),博弈論在經(jīng)濟(jì)學(xué)中得到了廣泛應(yīng)用,在揭示人們經(jīng)濟(jì)行為的相互影響和相互制約方面取得了重大進(jìn)展。大部分經(jīng)濟(jì)活動(dòng)都可以用博弈論加以解釋?zhuān)踔吝B市場(chǎng)調(diào)節(jié)與宏觀調(diào)控這樣的重大問(wèn)題都可以看成是特殊的博弈現(xiàn)象,納入到博弈論的范圍加以研究。博弈論的思想方法博大精深,已經(jīng)成為經(jīng)濟(jì)學(xué)的一個(gè)必不可少的組成部分。

Game參與人參與人的策略參與人的支付目標(biāo)函數(shù)規(guī)則下的行動(dòng)(期望)效用例子:田忌賽馬剪刀石頭布古諾斯塔克伯格思考:參與人數(shù)支付相抵策略數(shù)量同時(shí)開(kāi)始類(lèi)型博弈論是研究在策略性環(huán)境中如何進(jìn)行策略性決策和采取策略性行動(dòng)的科學(xué)。其中策略性環(huán)境是指每個(gè)人進(jìn)行的決策和采取的行動(dòng)都會(huì)對(duì)其他人產(chǎn)生影響。博弈的標(biāo)準(zhǔn)形式博弈的基本要素:局中人(玩家)、策略、收益。局中人的目標(biāo):收益最大化。策略博弈(gameofstrategies):局中人以策略定勝負(fù)。博弈的標(biāo)準(zhǔn)形式(normalformofagame):G=(Xi,

fi)n,其中

n

為局中人總數(shù),

Xi

為局中人

i

的策略集合,S

=X1X2Xn

為G的局勢(shì)集合,fi:SR為局中人

i

的收益函數(shù)。局勢(shì):由各局中人的策略組成的n元組

(x1,

x2,,

xn)(其中xiXi)。博弈的分類(lèi)一般按照博弈的基本要素進(jìn)行分類(lèi)。按局中人數(shù)分:二人博弈、多人博弈按策略集合分:有限博弈、無(wú)限博弈按收益函數(shù)分:常和(零和)博弈、變和博弈按博弈性質(zhì)分:非合作博弈、合作博弈按行動(dòng)次序分:同時(shí)移動(dòng)博弈、先后移動(dòng)博弈(序貫博弈)

以上分類(lèi)可以結(jié)合起來(lái),形成更仔細(xì)的分類(lèi)。比如,二人零和有限博弈(矩陣博弈)、多人非合作無(wú)限博弈等等。矩陣博弈

博弈是一種普遍的日常現(xiàn)象。當(dāng)人們工作的時(shí)候,總是會(huì)有意識(shí)或潛意識(shí)地運(yùn)用博弈論思維。比如,企業(yè)在經(jīng)營(yíng)決策中總是要考慮競(jìng)爭(zhēng)對(duì)手的反應(yīng),個(gè)人與政府之間又存在著“上有政策,下有對(duì)策”的博弈跡象,金融監(jiān)管與金融創(chuàng)新則猶如“貓鼠博弈”。在人們休閑時(shí),博弈又作為消遣性的游戲讓人們從中取得快樂(lè),甚至獲得智慧,例如下棋、玩牌、打麻將等。一般來(lái)講,博弈的特征表現(xiàn)為兩個(gè)或兩個(gè)以上具有利益沖突的當(dāng)事人處于一種不相容狀態(tài)中,一方的行動(dòng)取決于對(duì)方的行動(dòng),每個(gè)當(dāng)事人的收益都取決于所有當(dāng)事人的行動(dòng)。當(dāng)所有當(dāng)事人都拿定主意作出決策時(shí),博弈的局勢(shì)便得以確定。博弈論正是要研究人們之間的這種不相容的行為,它推廣了標(biāo)準(zhǔn)的一人決策理論。博弈論關(guān)注的問(wèn)題是:在每個(gè)當(dāng)事人的收益都依賴(lài)于其他當(dāng)事人的選擇的情況下,追求個(gè)人收益最大化的當(dāng)事人應(yīng)該如何采取行動(dòng)。我們先以最簡(jiǎn)單的矩陣博弈為重點(diǎn)來(lái)討論這個(gè)問(wèn)題,建立博弈論的基本思路和分析框架。

因此,甲和乙的二人零和有限博弈G=(X,f;Y,g)可表示為G=(X,Y,f)。特別是當(dāng)策略集合X和Y既定時(shí),可直接用甲的收益矩陣表示這個(gè)博弈G

,并稱(chēng)作“矩陣博弈

f”。

便士匹配

甲和乙在玩一種游戲,每人手中都有一枚硬幣,每人都有兩種選擇:出示硬幣正面、出示硬幣反面。

游戲規(guī)則:甲和乙各自獨(dú)立決定是出示正面還是出示反面。如果都出示正面或都出示反面,那么甲贏1元,乙輸1元;如果一人出示正面,而另一人出示反面,那么甲輸1元,乙贏1元。這個(gè)游戲就是通常所說(shuō)的便士匹配博弈(MatchingPennies),它類(lèi)似于小孩子玩的“手心手背”游戲。其標(biāo)準(zhǔn)形式如下:

乙甲出示正面出示反面出示正面1(甲)1(乙)1(甲)1(乙)出示反面1(甲)1(乙)1(甲)1(乙)便士匹配博弈收益表古諾均衡局中人的目標(biāo):選擇合適的策略以使自己的收益(對(duì)方的損失)達(dá)到最大,也就是要讓對(duì)方的收益(自己的損失)達(dá)到最小。我們來(lái)分析局中人的博弈過(guò)程以揭示博弈的最優(yōu)解。假定:甲和乙都彼此了解對(duì)方的收益矩陣,即雙方都清楚自己的收益就是對(duì)方的損失——利益沖突。博弈過(guò)程:既然每個(gè)局中人都要根據(jù)對(duì)方的行動(dòng)來(lái)調(diào)整和確定自己的行動(dòng),那么博弈過(guò)程必然是這樣的策略調(diào)整與選擇過(guò)程:每個(gè)人都要不斷地在對(duì)方選定了策略的情況下來(lái)調(diào)整自己的策略以使自己的收益達(dá)到最大。博弈結(jié)局:當(dāng)策略調(diào)整達(dá)到了這樣的局勢(shì)

(xh,yk)使得

xh是甲在乙選定yk的情況下的收益最大策略,同時(shí)yk是乙甲在選定xh的情況下的收益最大策略的時(shí)候,局中人雙方的策略調(diào)整得以結(jié)束,博弈的解得以確定,這個(gè)解即所謂的古諾均衡。即古諾均衡局中人的目標(biāo):選擇合適的策略以使自己的收益(對(duì)方的損失)達(dá)到最大,也就是要讓對(duì)方的收益(自己的損失)達(dá)到最小。假定:甲和乙都彼此了解對(duì)方的收益矩陣,即雙方都清楚自己的收益就是對(duì)方的損失——利益沖突。博弈過(guò)程:既然每個(gè)局中人都要根據(jù)對(duì)方的行動(dòng)來(lái)調(diào)整和確定自己的行動(dòng),那么博弈過(guò)程必然是這樣的策略調(diào)整與選擇過(guò)程:每個(gè)人都要不斷地在對(duì)方選定了策略的情況下來(lái)調(diào)整自己的策略以使自己的收益達(dá)到最大。博弈結(jié)局:當(dāng)策略調(diào)整達(dá)到了這樣的局勢(shì)

(xh,yk)使得

xh是甲在乙選定yk的情況下的收益最大策略,同時(shí)yk是乙甲在選定xh的情況下的收益最大策略的時(shí)候,局中人雙方的策略調(diào)整得以結(jié)束,博弈的解得以確定,這個(gè)解即所謂的古諾均衡。即古諾均衡:最小最大原理鞍點(diǎn)定理(最小最大原理)

是矩陣的鞍點(diǎn)(即博弈局勢(shì)(xh,yk)是矩陣博弈f的古諾均衡)當(dāng)且僅當(dāng)下述等式成立:

鞍點(diǎn)定理表明,要找到矩陣博弈的古諾均衡(即最優(yōu)解),只需按照如下步驟進(jìn)行:第一,從矩陣各行的最小元中找出最大元,稱(chēng)為最大最小元;第二,從矩陣各列的最大元中找出最小元,稱(chēng)為最小最大元;第三,如果最大最小元與最小最大元一致,那么該元素就是矩陣的鞍點(diǎn),代表矩陣博弈的古諾均衡。

乙甲作廣告不作廣告作廣告3030不作廣告2020例2.廣告競(jìng)爭(zhēng)的古諾均衡單位:萬(wàn)元古諾均衡:穩(wěn)妥策略與不穩(wěn)定性

最小最大原理指出,只有在收益矩陣的最大最小元與最小最大元一致的情況下,矩陣博弈才有最優(yōu)解。注意,最大最小元和最小最大元總是存在的,但最大最小元與最小最大元未必總是一致。這樣一來(lái),矩陣博弈就可能沒(méi)有最優(yōu)解。比如,便士匹配博弈就沒(méi)有最優(yōu)解:該博弈的收益矩陣的最大最小元為和,最小最大元為和,結(jié)果最大最小元與最小最大元不一致,從而便士匹配博弈沒(méi)有最優(yōu)解。矩陣博弈可能沒(méi)有最優(yōu)解的真正原因是什么?

為了分析這個(gè)問(wèn)題,我們把收益矩陣的最大最小元叫做甲的穩(wěn)妥策略;把收益矩陣的最小最大元叫做乙的穩(wěn)妥策略。矩陣博弈可能沒(méi)有最優(yōu)解的原因是穩(wěn)妥策略可能不穩(wěn)定:未必能使策略調(diào)整過(guò)程結(jié)束。因此,即使甲和乙都選擇穩(wěn)定策略,也未必能保證博弈達(dá)到古諾均衡。

古諾均衡:混合均衡

古諾均衡未必存在,這不是我們的期望。另外,實(shí)際中,局中人常常希望行動(dòng)隱秘而不被對(duì)手覺(jué)察。為了解決這兩個(gè)問(wèn)題,人們提出了混合策略,即設(shè)計(jì)一種連自己都不知道會(huì)采取哪種策略的隨機(jī)策略,對(duì)手就更不得而知,從而使得局中人的行動(dòng)變得詭秘。

混合策略(mixedstrategies)

考慮二人有限博弈G=(X,f;Y,g)。X={x1,x2,…,xm}可叫做甲的純策略集合,Y={y1,y2,…,yn}可叫做乙的純策略集合,S=X

Y便為博弈G

的純局勢(shì)集合。甲可采取隨機(jī)選擇:以概率pi選擇純策略xi(

i=

1,

2,…,

m),從而可用概率分布p=(p1,p2,…,pm)來(lái)表示甲的這一選擇。這種以概率分布表示的策略叫做混合策略,集合叫做甲的混合策略集合。同樣,可給出乙的混合策略集合。集合就叫做博弈G的混合局勢(shì)集合。

甲和乙的收益矩陣分別為:。博弈G的混合擴(kuò)充為博弈:定理博弈G=(X,f;Y,g)為常和博弈當(dāng)且僅當(dāng)G

的混合擴(kuò)充為常和博弈。當(dāng)G

是常和博弈時(shí),G

與具有相同的收入常和。

G的混合擴(kuò)充的古諾均衡(最優(yōu)解)叫做G的混合均衡(混合最優(yōu)解)。換句話說(shuō),G的混合局勢(shì)(p*,q*)叫做的混合均衡(混合最優(yōu)解),是指(p*,q*)滿(mǎn)足如下條件:

定理(混合均衡的存在性)任何矩陣博弈都有混合均衡。例

便士匹配的混合最優(yōu)解

便士匹配博弈中,甲的收益矩陣為f。

尋找便士匹配博弈的混合最優(yōu)解,就是去找出使得。

矩陣博弈混合均衡的存在性以及鞍點(diǎn)定理保證了博弈值V(G)是一個(gè)良好定義的數(shù),并且當(dāng)(p*,q*)是的混合最優(yōu)解時(shí),必有V(G)

=Ef(p*,q*)。博弈值在解釋最優(yōu)解的性質(zhì)以及求解混合最優(yōu)解方面相當(dāng)有用,還可以通過(guò)博弈值來(lái)證明矩陣博弈G的混合均衡集(混合最優(yōu)解集)具有下述定理所述的特點(diǎn)。博弈值

定理

對(duì)于甲和乙的矩陣博弈G=(X,Y,f)來(lái)說(shuō),T=

T1T2

且混合均衡集

T是空間的非空有界閉凸子集,從而甲的混合最優(yōu)策略集T1是的非空有界閉凸子集,乙的混合最優(yōu)策略集T2是的非空有界閉凸子集。

矩陣博弈僅僅是一類(lèi)簡(jiǎn)單又典型的二人常和博弈,經(jīng)濟(jì)學(xué)中遇到的博弈往往都是變和博弈。矩陣博弈理論之所以重要,是因?yàn)樗鼮檠芯孔兒筒┺奶峁┝撕芎玫姆治鏊悸泛涂蚣堋,F(xiàn)在,我們來(lái)在矩陣博弈理論的基礎(chǔ)上建立一般的二人博弈理論。

二人有限博弈例

囚徒難題博弈乙甲合作背叛合作3000300004000背叛4000010001000囚徒難題博弈收益表古諾均衡(納什均衡)二人有限博弈:最小最大原理失效乙甲y1y2x15532x24366博弈GA:古諾均衡與最大最小元不一致乙甲y1y2x15637x24554博弈GB:不存在均衡,但存在最大最小元二人有限博弈:混合策略例

性別之戰(zhàn):性別差異導(dǎo)致效用收益差異定理(混合均衡的存在性)

任何二人有限博弈都有混合均衡??ǚ蛉氵_(dá)話劇足球話劇2100足球0012混合均衡:茹達(dá)和卡夫的預(yù)期收益都為2/3。意味著“男女平等”。

二人無(wú)限博弈現(xiàn)在考慮二人無(wú)限博弈G=(X,f;Y,g),其中X和Y

分別任意集合,局勢(shì)集合S=X

Y

是無(wú)限集合。顯然,二人有限博弈的混合擴(kuò)充就是二人無(wú)限博弈。二人無(wú)限博弈的混合擴(kuò)充依然是二人無(wú)限博弈。因此,在無(wú)限博弈的情形,無(wú)需專(zhuān)門(mén)討論混合擴(kuò)充。二人博弈的古諾均衡是滿(mǎn)足如下條件的局勢(shì)(x*,

y*):XYRf

(x*,

y*)(x*,

y*)x*y*古諾均衡二人無(wú)限博弈:古諾均衡存在性假設(shè)G1甲的策略集合X

是某個(gè)拓?fù)湎蛄靠臻gV1的非空緊凸子集,乙的策略集合Y

也是某個(gè)拓?fù)湎蛄靠臻gV2的非空緊凸子集,從而局勢(shì)集合S是拓?fù)湎蛄靠臻gV1V2的非空緊凸子集。假設(shè)G2甲的收益函數(shù)

f

(x,y)連續(xù)且關(guān)于策略變?cè)?/p>

x

弱擬凹;乙的收益函數(shù)連續(xù)

g(x,y)且關(guān)于策略變?cè)獃

弱擬凹。范格不動(dòng)點(diǎn)定理

設(shè)T是拓?fù)湎蛄靠臻g的非空緊凸子集,F(xiàn):TT是集值映射。如果F上半連續(xù)且對(duì)任何xT,F(xiàn)(x)都是非空閉凸集,則F

有不動(dòng)點(diǎn),即(tT)(t=F(t))。定理(古諾均衡的存在性)任何滿(mǎn)足假設(shè)G1和G2的二人無(wú)限博弈都有古諾均衡。二人無(wú)限博弈:反應(yīng)函數(shù)

當(dāng)乙采取策略y時(shí),甲對(duì)乙的這一行動(dòng)的反應(yīng)是要確定甲的相應(yīng)對(duì)策x以使收益f

(x,y)在乙選擇y的情況下達(dá)到最大:f

(x,y)=max{

f

(x,y):xX}。這就確定了一個(gè)映射x=

(

y),叫做甲對(duì)乙的反應(yīng)函數(shù)。同樣,可以確定乙對(duì)甲的反應(yīng)函數(shù)

y=

(

x):g(x,y)=max{g(x,y):yY}。由“x*=

(

y*)&y*=

(

x*)”確定的局勢(shì)(x*,y*)的就是博弈G的均衡。

二人無(wú)限博弈的一種特殊情況:甲和乙的策略集合X和Y都是實(shí)數(shù)區(qū)間,收益函數(shù)f:XR和g:YR可微。則反應(yīng)函數(shù)由下述方程確定:比如,重復(fù)博弈

雖然我們已經(jīng)對(duì)二人博弈的最優(yōu)解作了研究,但讓局中人找到最優(yōu)解卻不是一個(gè)容易的過(guò)程,需要反復(fù)實(shí)踐和鍛煉,就好像棋手下棋一樣,需要反復(fù)不斷地下,才能越來(lái)越達(dá)到最優(yōu)解??梢?jiàn),博弈是可以重復(fù)進(jìn)行的。但到目前為止,我們所研究的博弈都是一次性博弈。因此,有必要研究博弈的重復(fù)。事實(shí)上,當(dāng)博弈可以重復(fù)進(jìn)行的時(shí)候,其最優(yōu)結(jié)局可能會(huì)與一次性博弈的均衡有所差異。下面以囚徒難題博弈為例來(lái)說(shuō)明這個(gè)問(wèn)題,分兩種情況討論:博弈重復(fù)有限次博弈重復(fù)無(wú)限次重復(fù)博弈:有限次重復(fù)

每個(gè)局中人都知道博弈將重復(fù)一個(gè)固定的次數(shù)??紤]最后一次博弈中局中人的推理:每個(gè)人都認(rèn)為他們此時(shí)是在進(jìn)行一次性博弈,這是最后一次行動(dòng),因而古諾均衡的標(biāo)準(zhǔn)邏輯推理得以應(yīng)用,其結(jié)果是局中人雙方選擇“背叛”。再考慮倒數(shù)第二次博弈,這里似乎每個(gè)局中人都重視合作,可以向?qū)Ψ桨l(fā)出“善意”的合作信號(hào),以便能在下一次博弈中繼續(xù)合作。但局中人作為理性人,他清楚地知道最后一次博弈中對(duì)方必然背叛,因此他在倒數(shù)第二次博弈中采取合作就沒(méi)有優(yōu)勢(shì)可言,故要選擇背叛。同樣,在倒數(shù)第三次博弈中,局中人的推理與倒數(shù)第二輪博弈中的推理一樣,結(jié)果在倒數(shù)第三輪博弈中,局中人依然采取背叛。采用這種從后往前的“逆向歸納法(backwardinduction)”,便可知道每次博弈中,局中人雙方都要選擇“背叛”策略??梢?jiàn),在有限次重復(fù)博弈中,最優(yōu)的局勢(shì)依然是古諾均衡,也就是說(shuō),古諾均衡是局中人雙方的短期利益所在。重復(fù)博弈:無(wú)限次重復(fù)每個(gè)局中人都知道博弈要無(wú)限重復(fù)進(jìn)行下去。此時(shí),每個(gè)局中人的策略都是一個(gè)函數(shù)序列,它表明每個(gè)人在每個(gè)階段策略選擇都是此階段之前的博弈歷史的函數(shù)。這樣,局中人的收益是各階段收益的貼現(xiàn)值之和(向時(shí)刻0貼現(xiàn)):。R:局中人永不背叛的收益;RT:局中人第T次背叛的收益。

只要貼現(xiàn)率r<2,那么RT<R

,即采取背叛無(wú)利可圖,還是合作為好。收入的貼現(xiàn)率小于2是平常的,可見(jiàn)通常情況下,只要博弈能夠無(wú)限次重復(fù)下去,那么就可實(shí)現(xiàn)“(合作,合作)”的更好結(jié)局,這說(shuō)明“(合作,合作)”是局中人雙方的長(zhǎng)期利益所在。

非合作博弈

二人一次性博弈是典型的非合作博弈,局中人之間沒(méi)有串通和勾結(jié),各個(gè)局中人都是獨(dú)立決策和獨(dú)立行動(dòng)。

20世紀(jì)50年代,美國(guó)數(shù)學(xué)家納什成功地將這種博弈模式推廣到多人情形,接連發(fā)表了多篇研究論文,為現(xiàn)代博弈論的形成和發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。納什對(duì)多人非合作博弈作出了明確界定,提出了多人非合作博弈的納什均衡概念,并證明了納什均衡的存在性。由于納什均衡是對(duì)矩陣博弈的古諾均衡概念的推廣,因此人們也常常把納什均衡稱(chēng)作古諾-納什均衡。納什均衡存在性定理的重要意義在于其結(jié)論可以直接向經(jīng)濟(jì)系統(tǒng)推廣,并且這種推廣是阿羅和德布羅重建瓦爾拉一般均衡理論大廈的關(guān)鍵所在。多人有限非合作博弈

定理(納什定理)

任何n人有限博弈都有(非合作)混合最優(yōu)解。多人連續(xù)博弈

對(duì)于多人無(wú)限博弈,人們更關(guān)注連續(xù)博弈,即在博弈的局勢(shì)集合上賦予了某種拓?fù)浣Y(jié)構(gòu),并且在該拓?fù)浣Y(jié)構(gòu)下各個(gè)局中人的收益函數(shù)都是連續(xù)函數(shù)。連續(xù)性表明:只要局中人行動(dòng)變化不大,局中人收益也就變化不大。

定理x*S是納什均衡

x*

(x*)(即x*為的不動(dòng)點(diǎn))。假設(shè)G1局中人

i

的策略集合Xi是某個(gè)拓?fù)湎蛄靠臻gVi的非空緊凸子集,從而局勢(shì)集合S是拓?fù)湎蛄靠臻gV1Vn的非空緊凸子集。假設(shè)G2連續(xù)且關(guān)于策略變?cè)?/p>

xi弱擬凹。定理(均衡存在性)

任何滿(mǎn)足假設(shè)G1和G2的n

人非合作博弈都有納什均衡。帶約束條件的納什均衡

假設(shè)G3在受約束的博弈G

=

(Xi,

fi,

Bi)iI中,每個(gè)局中人

i

的約束集映Bi:SXi都是連續(xù)的集值映射,同時(shí)對(duì)任何xS,Bi(x)都是Xi的非空閉凸子集,并且Bi(x)與局中人i在局勢(shì)x中的策略無(wú)關(guān)。帶約束條件的納什均衡存在性定理

任何滿(mǎn)足假設(shè)G1、G2和G3的

n

人非合作博弈都有納什均衡。納什均衡:合作博弈

當(dāng)博弈從二人發(fā)展到多人參與的時(shí)候,局中人就不再像二人博弈那樣只是獨(dú)立行動(dòng),而是可以開(kāi)展合作,一些局中人聯(lián)合起來(lái)對(duì)抗另外一些局中人。他們出于某種動(dòng)機(jī)或需要而結(jié)成聯(lián)盟,互通情報(bào)信息,采取一致行動(dòng),以便取得對(duì)自己有利的結(jié)果。這種相互配合、彼此協(xié)作、結(jié)成聯(lián)盟的現(xiàn)象就是合作博弈的原型。在合作博弈中,局中人自己的策略選擇已經(jīng)不再是什么重要問(wèn)題,重要的是聯(lián)盟如何選擇策略,如何采取一致行動(dòng),聯(lián)盟的收入如何向其成員進(jìn)行分配。收入分配問(wèn)題至關(guān)重要,它決定著局中人能否形成聯(lián)盟,盟外人又是否愿意加入到聯(lián)盟中來(lái)?,F(xiàn)在,我們來(lái)討論這些問(wèn)題,建立多人合作博弈的理論。我們將以有限博弈為對(duì)象展開(kāi)討論,至于無(wú)限博弈的情形,這里的理論和方法都可以自然地推廣過(guò)去。

合作博弈:聯(lián)盟對(duì)抗

博弈

G=(Xi,

ui)iI

的局中人集合為

I

=

{1,2,,n}。局中人的合作表現(xiàn)為結(jié)盟,即形成聯(lián)盟,這個(gè)聯(lián)盟就是

I

的子集。定義

博弈

G

中的一個(gè)聯(lián)盟是指局中人集合

I

的一個(gè)子集。對(duì)于這個(gè)定義,以下三點(diǎn)值得注意:

通過(guò)結(jié)盟,合作博弈可轉(zhuǎn)化為非合作博弈:若A是聯(lián)盟,那么G就成為聯(lián)盟

A

和其余聯(lián)盟

B的非合作博弈。即可把A和B都看成局中人:A

B

的策略集合分別為

XA=

iAXi和

XB=

iBXi,局勢(shì)集合為X=

iIXi=

XA

XB,局勢(shì)

x

=

(x1,,

xn)

=

(xA,

xB),A

B

的收益函數(shù)分別為

uA(x)

=

iA

ui(x)和

uB(x)

=

iB

ui(x),于是G

轉(zhuǎn)化為GA=

(XA,

uA;XB,

uB)。如果

A

是聯(lián)盟,那么

B

=

I

A

也是聯(lián)盟,稱(chēng)為聯(lián)盟

A

的余聯(lián)盟。任何聯(lián)盟

A

都把局中人分成兩個(gè)聯(lián)盟:聯(lián)盟

A

和余聯(lián)盟

B。

I

和空集

都是聯(lián)盟且互為余聯(lián)盟。我們把空集

稱(chēng)為空聯(lián)盟。只含一個(gè)局中人的集合也是聯(lián)盟,叫做單人聯(lián)盟。這是聯(lián)盟的特殊情形,實(shí)際上單人聯(lián)盟并沒(méi)有真正的結(jié)盟意義。合作博弈:特征函數(shù)

通過(guò)聯(lián)盟A,多人合作博弈G簡(jiǎn)化為二人非合作博弈GA

=

(XA,

uA;XB,

uB),由此可引出博弈G的特征函數(shù)V:P

(I

)R:

V(A)是

A的收益函數(shù)uA在鞍點(diǎn)處的值。事實(shí)上,V(A)是二人零和博弈(XA,

uA;XB,

uA)的古諾均衡中局中人

A

的收益。馮·諾伊曼據(jù)此提出了如上的特征函數(shù)概念。特征函數(shù)V(A)具有以下基本性質(zhì):性質(zhì)1對(duì)于空聯(lián)盟來(lái)說(shuō),V()

=

0。(這是因?yàn)?/p>

u

=

0)性質(zhì)2若A,

BP

(I

)

AB

=,則V(AB

)

V(A)

+

V(B)。性質(zhì)3當(dāng)G為零和博弈時(shí),V(I

)

=

0

且(AP

(I

))(V(I

A)

=

V(A))。如果把性質(zhì)2中的不等式換為等式,即

V(AB

)

=

V(A)

+

V(B)

對(duì)一切不相交的聯(lián)盟

A和B都成立,則稱(chēng)特征函數(shù)V

具有可加性。當(dāng)V具有可加性時(shí),

V(A)

=

iA

V({i})對(duì)一切聯(lián)盟

A

成立,

這表明結(jié)盟與不結(jié)盟沒(méi)有什么差別,從而博弈中合作沒(méi)有什么意義。這種具有可加特征函數(shù)的博弈,稱(chēng)為非本質(zhì)博弈,人們感興趣的是本質(zhì)博弈。合作博弈:收入分配

特征函數(shù)表示聯(lián)盟總收入,那么這筆收入在聯(lián)盟內(nèi)部如何分配呢?為了研究聯(lián)盟內(nèi)的收入分配問(wèn)題,首先給出收入分配的含義。

定義

博弈

G

=

(Xi,

ui)n

的收入分配(簡(jiǎn)稱(chēng)分配)是一個(gè)滿(mǎn)足如下條件的n維向量(r1,

r2,,

rn):V(I

)

=

iI

ri且ri

vi=V({i})

(i

=1,2,,n)。定義中的條件

V(I

)

=

iI

ri意味著局中人全體組成統(tǒng)一聯(lián)盟,并從這個(gè)聯(lián)盟中得到收入;vi=V({i})表示局中人單干的收入,即不與其他人結(jié)盟的情況下的收入;條件ri

vi意味著局中人參加聯(lián)盟所得到的收入不低于單干的收入,聯(lián)盟的吸引力就在于參加聯(lián)盟能夠得到更多的收入。向量v

=

(v1,

v2,,

vn)就叫做單干收入向量,根據(jù)特征函數(shù)的性質(zhì)可知,V(I

)

iI

vi。收入分配具有下述一些性質(zhì)。性質(zhì)1向量(r1,

r2,,

rn)

是G

的分配當(dāng)且僅當(dāng)存在向量(a1,

a2,,

an)

0

使得ri=

vi

+

ai(i

=1,2,,n)

且iI

ai=V(I

)

iI

vi。性質(zhì)2

n

人非本質(zhì)博弈的分配只有單干收入向量v

=

(v1,

v2,,

vn)。性質(zhì)3本質(zhì)博弈的分配有無(wú)限多個(gè)。合作博弈:核心最優(yōu)解

局中人結(jié)盟是因?yàn)榻Y(jié)盟能夠提高聯(lián)盟成員的收入。因此,對(duì)于任何一種收入分配

t

=

(t1,

t2,,

tn),如果存在AP

(I

)

及另一種收入分配r

=

(r1,

r2,,

rn)

使得V(A)

iA

ri

且ri

>

ti對(duì)一切

iA

成立,

那么

A中的局中人就會(huì)結(jié)盟一致反對(duì)收入分配

t以達(dá)到提高收入的目的,這個(gè)聯(lián)盟

A

就叫做收入分配

t

的反對(duì)者聯(lián)盟。一種收入分配只有不存在反對(duì)者聯(lián)盟的時(shí)候,才能被所有局中人接受。這種收入分配就是合作博弈的最優(yōu)解——核心最優(yōu)解。由所有核心最優(yōu)解構(gòu)成的集合,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論