第二章策略型博弈_第1頁(yè)
第二章策略型博弈_第2頁(yè)
第二章策略型博弈_第3頁(yè)
第二章策略型博弈_第4頁(yè)
第二章策略型博弈_第5頁(yè)
已閱讀5頁(yè),還剩69頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二部分非合作博弈理論 第二章第二章 策略型博弈策略型博弈第三章第三章 擴(kuò)展型博弈擴(kuò)展型博弈第四章第四章 貝葉斯博弈貝葉斯博弈第五章第五章 動(dòng)態(tài)貝葉斯博弈動(dòng)態(tài)貝葉斯博弈 主要內(nèi)容主要內(nèi)容第一節(jié)第一節(jié) 策略型博弈的表示策略型博弈的表示第二節(jié)第二節(jié) 重復(fù)剔除嚴(yán)格劣策略均衡重復(fù)剔除嚴(yán)格劣策略均衡第三節(jié)第三節(jié) 納什均衡納什均衡第四節(jié)第四節(jié) 混合策略納什均衡混合策略納什均衡第五節(jié)第五節(jié) 納什均衡的存在性納什均衡的存在性 第二章第二章 策略型博弈策略型博弈 同時(shí)行動(dòng),如何決策同時(shí)行動(dòng),如何決策 策略型策略型( (標(biāo)準(zhǔn)型)表述標(biāo)準(zhǔn)型)表述 適合表示靜態(tài)博弈適合表示靜態(tài)博弈擴(kuò)展型表述擴(kuò)展型表述 適合表示動(dòng)態(tài)博

2、弈適合表示動(dòng)態(tài)博弈 博弈有兩種表述方法博弈有兩種表述方法一、策略型博弈的含義一、策略型博弈的含義 完全信息靜態(tài)博弈又稱為策略型博弈完全信息靜態(tài)博弈又稱為策略型博弈。完全信息完全信息是指是指局中人對(duì)自己與其他局中人的所有與博弈有關(guān)的事前信息局中人對(duì)自己與其他局中人的所有與博弈有關(guān)的事前信息(策略空間、支付函數(shù)等)有充分的了解(策略空間、支付函數(shù)等)有充分的了解( (局中人的支付函局中人的支付函數(shù)是共同知識(shí)數(shù)是共同知識(shí)) )。靜態(tài)博弈靜態(tài)博弈是指在博弈中,局中人同時(shí)采取是指在博弈中,局中人同時(shí)采取行動(dòng),或者局中人的行動(dòng)有先有后,但后行動(dòng)者不能知道行動(dòng),或者局中人的行動(dòng)有先有后,但后行動(dòng)者不能知道先

3、行動(dòng)者的行動(dòng)選擇。先行動(dòng)者的行動(dòng)選擇。 第一節(jié)第一節(jié) 二、策略型博弈的三個(gè)要素:二、策略型博弈的三個(gè)要素: 1 1、局中人(、局中人(Players): 1, 2, , nPlayers): 1, 2, , n; 2 2、策略(、策略(Strategies): Strategies): ; ; 3 3、支付函數(shù)、支付函數(shù) (Payoff Payoff functions)functions)表示為:表示為: 第一節(jié)第一節(jié) niSsii,.,2 , 1, ,.,;,.,11nnuuSSG 1 1、有限博弈:、有限博弈: (1) (1) 博弈中局中人人數(shù)有限博弈中局中人人數(shù)有限; ; (2) (2

4、) 每個(gè)局中人只有有限個(gè)策略。每個(gè)局中人只有有限個(gè)策略。 2 2、零和博弈:、零和博弈: 博弈中局中人所獲支付之和為零,即一方博弈中局中人所獲支付之和為零,即一方所得為另一方所失。所得為另一方所失。 三三1 1、局中人、局中人:甲,乙:甲,乙2 2、策、策 略略: 坦白坦白, ,不坦白不坦白 3 3、支付函數(shù)、支付函數(shù)支付矩陣支付矩陣(雙人有限博弈)(雙人有限博弈) 每個(gè)位置上第一個(gè)數(shù)字表示局中人每個(gè)位置上第一個(gè)數(shù)字表示局中人1 1在對(duì)應(yīng)的策略組合在對(duì)應(yīng)的策略組合中得到的支付,第二個(gè)數(shù)字表示局中人中得到的支付,第二個(gè)數(shù)字表示局中人2 2的相應(yīng)所獲支付。的相應(yīng)所獲支付。 例例2.1 2.1 乙甲

5、SS 乙乙 甲甲坦白坦白不坦白不坦白坦白坦白-6 -6,-6 -6-1 -1,-8 -8不坦白不坦白-8 -8,-1 -1-2 -2,-2 -2 乙乙 甲甲石頭石頭剪刀剪刀布布石頭石頭0 0,0 01 1,-1 -1-1 -1,1 1剪刀剪刀-1 -1,1 10 0,0 01 1,-1 -1布布1 1,-1 -1-1 -1,1 10 0,1 1 田忌田忌 齊王齊王上中下上中下上下中上下中中上下中上下中下上中下上下上中下上中下中上下中上上中下上中下3 3,-3 -31 1,-1 -11 1,-1 -11 1,-1 -1-1 -1,1 11 1,-1 -1上下中上下中1 1,-1 -13 3,-3

6、 -31 1,-1 -11 1,-1 -11 1,-1 -1-1 -1,1 1中上下中上下1 1,-1 -1-1 -1,1 13 3,-3 -31 1,-1 -11 1,-1 -11 1,-1 -1中下上中下上-1 -1,1 11 1,-1 -11 1,-1 -13 3,-3 -31 1,-1 -11 1,-1 -1下上中下上中1 1,-1 -11 1,-1 -11 1,-1 -1-1 -1,1 13 3,-3 -31 1,-1 -1下中上下中上1 1,-1 -11 1,-1 -1-1 -1,1 11 1,-1 -11 1,-1 -13 3,-3 -3 局中人局中人:男,女:男,女 策策 略略

7、:男:看足球,看芭蕾:男:看足球,看芭蕾 女:看足球,看芭蕾女:看足球,看芭蕾 支付矩陣支付矩陣:見(jiàn)下一頁(yè):見(jiàn)下一頁(yè) 例例2.4 性別大戰(zhàn)(性別大戰(zhàn)(battle of the sexes) 女女 男男足球足球芭蕾芭蕾足球足球3 3,2 21 1,1 1芭蕾芭蕾-1 -1,-1 -12 2,3 3 性別大戰(zhàn)的支付矩陣性別大戰(zhàn)的支付矩陣一、基本思想:一、基本思想: 如果一個(gè)局中人在任何情況下從某種策略中得到的支付如果一個(gè)局中人在任何情況下從某種策略中得到的支付均小于從另一種策略中得到的支付,那么顯然對(duì)他而言,前均小于從另一種策略中得到的支付,那么顯然對(duì)他而言,前一種策略劣于后一種策略。一種策略劣

8、于后一種策略。 從個(gè)人利益出發(fā),被剔除的策略不會(huì)被局中人采用。從從個(gè)人利益出發(fā),被剔除的策略不會(huì)被局中人采用。從而可以利用剔除嚴(yán)格劣策略的概念來(lái)簡(jiǎn)化博弈局勢(shì),可能會(huì)而可以利用剔除嚴(yán)格劣策略的概念來(lái)簡(jiǎn)化博弈局勢(shì),可能會(huì)得到博弈的解。得到博弈的解。第二節(jié)第二節(jié) 重復(fù)剔除嚴(yán)格劣策略均衡重復(fù)剔除嚴(yán)格劣策略均衡 , ,如果存在如果存在 ,對(duì)于所有的,對(duì)于所有的都有都有 且其中至少有一個(gè)為嚴(yán)格不等式且其中至少有一個(gè)為嚴(yán)格不等式 ,則稱,則稱 是第是第i i個(gè)個(gè)局中人的一個(gè)局中人的一個(gè)嚴(yán)格劣策略嚴(yán)格劣策略。 二、嚴(yán)格劣策略的定義二、嚴(yán)格劣策略的定義iiSs iiSs ),.,.(),.,.(111111ni

9、iiniiiSSSSSsssss),(),(iiiiiissussu is 1 1、根據(jù)、根據(jù)理性的局中人不會(huì)選擇嚴(yán)格劣策略理性的局中人不會(huì)選擇嚴(yán)格劣策略這一原則,可這一原則,可以通過(guò)重復(fù)剔除嚴(yán)格劣策略的方法對(duì)博弈進(jìn)行求解。以通過(guò)重復(fù)剔除嚴(yán)格劣策略的方法對(duì)博弈進(jìn)行求解。 2 2、其方法是其方法是:對(duì)每個(gè)局中人尋找嚴(yán)格劣策略,由于它不:對(duì)每個(gè)局中人尋找嚴(yán)格劣策略,由于它不會(huì)被局中人選擇實(shí)施,所以找到一種后就可以將其從博弈會(huì)被局中人選擇實(shí)施,所以找到一種后就可以將其從博弈局勢(shì)中剔除,從而得到一種新的縮減后的博弈局勢(shì),對(duì)這局勢(shì)中剔除,從而得到一種新的縮減后的博弈局勢(shì),對(duì)這種新局勢(shì)重復(fù)上述過(guò)程,直到無(wú)

10、法找到新的嚴(yán)格劣策略為種新局勢(shì)重復(fù)上述過(guò)程,直到無(wú)法找到新的嚴(yán)格劣策略為止止。 三、重復(fù)剔除嚴(yán)格劣策略三、重復(fù)剔除嚴(yán)格劣策略 對(duì)局中人甲而言,無(wú)論局中人乙采取何種策略,采用對(duì)局中人甲而言,無(wú)論局中人乙采取何種策略,采用“不坦白不坦白”策略得到的支付都小于采用策略得到的支付都小于采用“坦白坦白”策略。策略。局中人甲的局中人甲的“不坦白不坦白”策略嚴(yán)格劣于策略嚴(yán)格劣于“坦白坦白”策略策略. . “ “不坦白不坦白”策略都是一種嚴(yán)格劣策略,從而可以剔除。策略都是一種嚴(yán)格劣策略,從而可以剔除。博弈中局中人各自從自身利益出發(fā)的理性選擇(博弈均博弈中局中人各自從自身利益出發(fā)的理性選擇(博弈均衡解)就是衡解

11、)就是(坦白,坦白)(坦白,坦白)。 四四 乙乙 甲甲坦白坦白不坦白不坦白坦白坦白-6 -6,-6 -6-1 -1,-8 -8不坦白不坦白-8 -8,-1 -1-2 -2,-2 -2甲:甲:“不坦白不坦白”相對(duì)于相對(duì)于“坦白坦白”是嚴(yán)格劣策略是嚴(yán)格劣策略 乙乙 甲甲坦白坦白不坦白不坦白坦白坦白-6 -6,-6 -6-1 -1,-8 -8乙:乙:“不坦白不坦白”相對(duì)于相對(duì)于“坦白坦白”是嚴(yán)格劣策略是嚴(yán)格劣策略 乙乙 甲甲坦白坦白坦白坦白-6 -6,-6 -6 例例2.52.5 利用重復(fù)剔除嚴(yán)格劣策略求解利用重復(fù)剔除嚴(yán)格劣策略求解 乙乙 甲甲左左中中右右上上1 1,0 01 1,2 20 0,1

12、1下下0 0,3 30 0,1 12 2,0 0乙:乙:“右右”相對(duì)于相對(duì)于“中中”是嚴(yán)格劣策略是嚴(yán)格劣策略 乙乙 甲甲左左中中右右上上1 1,0 01 1,2 20 0,1 1下下0 0,3 30 0,1 12 2,0 0甲:甲:“下下”相對(duì)于相對(duì)于“上上”是嚴(yán)格劣策略是嚴(yán)格劣策略 乙乙 甲甲左左中中上上1 1,0 01 1,2 2下下0 0,3 30 0,1 1乙:乙:“左左”相對(duì)于相對(duì)于“中中”是嚴(yán)格劣策略是嚴(yán)格劣策略 乙乙 甲甲左左中中上上1 1,0 01 1,2 2 重復(fù)剔除重復(fù)剔除嚴(yán)格劣策略均衡是嚴(yán)格劣策略均衡是( (上上, ,中中) ) 乙乙 甲甲中中上上1 1,2 21 1、每

13、一步剔除需要局中人間相互了解的更進(jìn)一步假定,、每一步剔除需要局中人間相互了解的更進(jìn)一步假定,如果我們把這一過(guò)程應(yīng)用到任意多步,需要假定如果我們把這一過(guò)程應(yīng)用到任意多步,需要假定“局中人局中人是理性的是理性的”是共同知識(shí)。是共同知識(shí)。2 2、這一方法對(duì)博弈結(jié)果的預(yù)測(cè)經(jīng)常是不準(zhǔn)確的、這一方法對(duì)博弈結(jié)果的預(yù)測(cè)經(jīng)常是不準(zhǔn)確的. . 五、重復(fù)剔除嚴(yán)格劣策略有兩個(gè)缺陷五、重復(fù)剔除嚴(yán)格劣策略有兩個(gè)缺陷 乙乙 甲甲石頭石頭剪刀剪刀布布石頭石頭0 0,0 01 1,-1 -1-1 -1,1 1剪刀剪刀-1 -1,1 10 0,0 01 1,-1 -1布布1 1,-1 -1-1 -1,1 10 0,0 0 利用重

14、復(fù)剔除嚴(yán)格劣策略無(wú)法求解利用重復(fù)剔除嚴(yán)格劣策略無(wú)法求解 例例2.62.6 利用重復(fù)剔除嚴(yán)格劣策略無(wú)法求解利用重復(fù)剔除嚴(yán)格劣策略無(wú)法求解 乙乙 甲甲左左中中右右上上0 0,4 44 4,0 05 5,3 3中中4 4,0 00 0,4 45 5,3 3下下3 3,5 53 3,5 56 6,6 6F大多數(shù)的博弈局勢(shì)中使用剔除嚴(yán)格劣策略的大多數(shù)的博弈局勢(shì)中使用剔除嚴(yán)格劣策略的方法能夠?qū)Σ┺木謩?shì)進(jìn)行簡(jiǎn)化,但可能得不方法能夠?qū)Σ┺木謩?shì)進(jìn)行簡(jiǎn)化,但可能得不到博弈的均衡解。到博弈的均衡解。F需要引入非合作博弈理論中的核心概念需要引入非合作博弈理論中的核心概念 納什均衡納什均衡 ( (Nash Equili

15、briumNash Equilibrium) )。 六、注意六、注意一、納什均衡的思想一、納什均衡的思想 “雙贏雙贏” ” 或或 “ “多贏多贏” ” 第三節(jié)第三節(jié) 納什均衡納什均衡它是關(guān)于博弈結(jié)局的一致性預(yù)測(cè)它是關(guān)于博弈結(jié)局的一致性預(yù)測(cè) 如果所有局中人預(yù)測(cè)一個(gè)特定的納什均衡會(huì)出如果所有局中人預(yù)測(cè)一個(gè)特定的納什均衡會(huì)出現(xiàn),那么這種均衡就會(huì)出現(xiàn)。現(xiàn),那么這種均衡就會(huì)出現(xiàn)。 只有納什均衡才能使每個(gè)局中人均認(rèn)可這種結(jié)只有納什均衡才能使每個(gè)局中人均認(rèn)可這種結(jié)局,而且他們均知道其他局中人也認(rèn)可這種結(jié)局。局,而且他們均知道其他局中人也認(rèn)可這種結(jié)局。 二、納什均衡的意義二、納什均衡的意義 1 1、博弈的納什

16、均衡博弈的納什均衡是這樣一種最優(yōu)策略組合,是這樣一種最優(yōu)策略組合,是一種你好、我好大家都好的理性結(jié)局,其中每一是一種你好、我好大家都好的理性結(jié)局,其中每一個(gè)局中人均不能也不想單方面改變自己的策略而增個(gè)局中人均不能也不想單方面改變自己的策略而增加收益,每個(gè)局中人選擇的策略是對(duì)其他局中人所加收益,每個(gè)局中人選擇的策略是對(duì)其他局中人所選策略的最佳反應(yīng)。選策略的最佳反應(yīng)。 三、納什均衡的定義三、納什均衡的定義 2 2、數(shù)學(xué)定義:、數(shù)學(xué)定義: 在策略型博弈在策略型博弈 中,如果對(duì)于每個(gè)局中中,如果對(duì)于每個(gè)局中人人i i,存在,存在 ,都有,都有 或或 則稱策略組合則稱策略組合 是此博弈是此博弈G G的一

17、個(gè)的一個(gè)納什均衡納什均衡。iiSs iiiiiiiiSsssussu),(),(),.,(1nss,.,;,.,11nnuuSSG nissusiiiSsiii,.,2 , 1, ),(maxarg 三、納什均衡的定義三、納什均衡的定義1 1、雙人有限博弈:雙劃線法、雙人有限博弈:雙劃線法 首先對(duì)局中人首先對(duì)局中人2 2的每一個(gè)策略,局中人的每一個(gè)策略,局中人1 1尋找支付最大尋找支付最大的策略,在其對(duì)應(yīng)支付下劃線;的策略,在其對(duì)應(yīng)支付下劃線; 然后對(duì)局中人然后對(duì)局中人1 1進(jìn)行相應(yīng)的步驟;進(jìn)行相應(yīng)的步驟; 最后,凡是兩個(gè)局中人支付下均被劃線的結(jié)局就是納最后,凡是兩個(gè)局中人支付下均被劃線的結(jié)局

18、就是納什均衡。什均衡。 四、納什均衡的求法四、納什均衡的求法用雙劃線法可以求出納什均衡用雙劃線法可以求出納什均衡: (坦白,坦白),(坦白,坦白),(-6 -6,-6 -6)意義:揭示個(gè)人理性與集體理性之間的矛盾意義:揭示個(gè)人理性與集體理性之間的矛盾。 例例2.12.1 乙乙 甲甲坦白坦白不坦白不坦白坦白坦白-6 -6,-6 -6-1 -1,-8 -8不坦白不坦白-8 -8,-1 -1-2 -2,-2 -2 乙乙 甲甲坦白坦白不坦白不坦白坦白坦白-6 -6,-6 -6-1 -1,-8 -8不坦白不坦白-8 -8,-1 -1-2 -2,-2 -2 乙乙 甲甲坦白坦白不坦白不坦白坦白坦白-6 -6

19、,-6 -6-1 -1,-8 -8不坦白不坦白-8 -8,-1 -1-2 -2,-2 -2 局中人:大豬,小豬局中人:大豬,小豬 策策 略:大豬:按,等待略:大豬:按,等待 小豬:按,等待小豬:按,等待 支付矩陣:見(jiàn)下一頁(yè)支付矩陣:見(jiàn)下一頁(yè) 納什均衡:納什均衡:(按,等待)(按,等待) 例例2.72.7 智豬博弈(智豬博弈(boxed pigs)boxed pigs) 小豬小豬 大豬大豬按按等待等待按按5 5,1 14 4,4 4等待等待9 9,-1 -10 0,0 0 例例2.72.7 智豬博弈的支付矩陣智豬博弈的支付矩陣 小豬小豬 大豬大豬按按等待等待按按5 5,1 14 4,4 4等待等

20、待9 9,-1 -10 0,0 0 小豬小豬 大豬大豬按按等待等待按按5 5,1 14 4,4 4等待等待9 9,-1 -10 0,0 0 女女 男男足球足球芭蕾芭蕾足球足球3 3,2 21 1,1 1芭蕾芭蕾-1 -1,-1 -12 2,3 3 例例2.42.4 性別大戰(zhàn)博弈的支付矩陣性別大戰(zhàn)博弈的支付矩陣 女女 男男足球足球芭蕾芭蕾足球足球3 3,2 21 1,1 1芭蕾芭蕾-1 -1,-1 -12 2,3 3 女女 男男足球足球芭蕾芭蕾足球足球3 3,2 21 1,1 1芭蕾芭蕾-1 -1,-1 -12 2,3 3 局中人局中人:甲,乙:甲,乙 策策 略略:甲:放左手,放右手:甲:放左手

21、,放右手 乙:猜左手,猜右手乙:猜左手,猜右手 支付矩陣支付矩陣:見(jiàn)下一頁(yè):見(jiàn)下一頁(yè) 沒(méi)有納什均衡沒(méi)有納什均衡 例例2.82.8 猜左右手游戲猜左右手游戲 乙乙 甲甲猜左手猜左手猜右手猜右手放左手放左手-1 -1,1 11 1,-1 -1放右手放右手1 1,-1 -1-1 -1,1 1 乙乙 甲甲猜左手猜左手猜右手猜右手放左手放左手-1 -1,1 11 1,-1 -1放右手放右手1 1,-1 -1-1 -1,1 1 乙乙 甲甲猜左手猜左手猜右手猜右手放左手放左手-1 -1,1 11 1,-1 -1放右手放右手1 1,-1 -1-1 -1,1 12 2、連續(xù)性博弈納什均衡的求法、連續(xù)性博弈納什均

22、衡的求法 首先求出每個(gè)局中人對(duì)其他局中人策略組合的首先求出每個(gè)局中人對(duì)其他局中人策略組合的反應(yīng)函數(shù)反應(yīng)函數(shù)即在其他局中人策略組合給定時(shí)極大即在其他局中人策略組合給定時(shí)極大化自己的支付,得到的最佳反應(yīng)策略表現(xiàn)為其他局化自己的支付,得到的最佳反應(yīng)策略表現(xiàn)為其他局中人策略組合的函數(shù);中人策略組合的函數(shù); 然后將這些反應(yīng)函數(shù)聯(lián)立求解即得到博弈的納然后將這些反應(yīng)函數(shù)聯(lián)立求解即得到博弈的納什均衡解。什均衡解。 四、納什均衡的求法四、納什均衡的求法 局中人:局中人:廠商廠商1 1,廠商,廠商2 2 策策 略:略:廠商廠商1 1:選擇產(chǎn)量:選擇產(chǎn)量 廠商廠商2 2:選擇產(chǎn)量:選擇產(chǎn)量 假假 設(shè):設(shè):價(jià)格價(jià)格

23、支付函數(shù)支付函數(shù) ( (利潤(rùn)函數(shù)利潤(rùn)函數(shù)) ) : 例例2.92.9 兩寡頭產(chǎn)量競(jìng)爭(zhēng)兩寡頭產(chǎn)量競(jìng)爭(zhēng)CournotCournot(18381838)模型)模型1q2q)(21qqap)(),(211211cqqaqqq)(),(212212cqqaqqq CournotCournot 模型求解模型求解)(),(max2112111cqqaqqqq)(),(max2122122cqqaqqqq02) 1()(),(2*1*12*11211cqqaqcqqaqqq02) 1()(),(*11*2*212212cqqaqcqqaqqq 反應(yīng)函數(shù)反應(yīng)函數(shù): : 納什均衡:納什均衡:)(2121cqaq)

24、(2112cqaq)(31),(31),(21cacaqq221)(91ca CournotCournot 模型求解模型求解 假設(shè)兩寡頭可以串謀,共同確定產(chǎn)量假設(shè)兩寡頭可以串謀,共同確定產(chǎn)量Q Q使總利潤(rùn)最大化,使總利潤(rùn)最大化,利潤(rùn)函數(shù)為:利潤(rùn)函數(shù)為: (Q)=Q(a-Q-c)(Q)=Q(a-Q-c) 總利潤(rùn)最大的產(chǎn)量為:總利潤(rùn)最大的產(chǎn)量為: 稱為稱為契約曲線契約曲線 總利潤(rùn)為:總利潤(rùn)為: 比較及含義:比較及含義: 兩寡頭產(chǎn)量串謀模型兩寡頭產(chǎn)量串謀模型)(21caQm)(2121caQQQm2)(41cam221)(92cam)(3221caqqQm Q1 廠商廠商2 2的反應(yīng)曲線的反應(yīng)曲線

25、納什均衡納什均衡 契約曲線契約曲線 廠商廠商1 1的反應(yīng)曲線的反應(yīng)曲線 O Q2 圖圖1 1 反應(yīng)曲線、納什均衡與契約曲線反應(yīng)曲線、納什均衡與契約曲線)(21ca)(21ca)(31ca)(31ca局中人局中人:廠商:廠商1 1,廠商,廠商2 2 策策 略略:廠商:廠商1 1選擇價(jià)格選擇價(jià)格 ;廠商;廠商2 2選擇價(jià)格選擇價(jià)格假假 設(shè)設(shè): : 兩寡頭固定成本都為兩寡頭固定成本都為0 0,邊際成本為常數(shù),邊際成本為常數(shù)c, c, 消費(fèi)者對(duì)廠商消費(fèi)者對(duì)廠商1 1和和2 2生產(chǎn)產(chǎn)品的需求量分別為:生產(chǎn)產(chǎn)品的需求量分別為: ; ; 例例2.102.10 兩寡頭價(jià)格競(jìng)爭(zhēng)兩寡頭價(jià)格競(jìng)爭(zhēng)BertrandBe

26、rtrand(18831883)模型)模型1p2p21211),(bppappq12212),(bppappq支付(利潤(rùn))函數(shù):支付(利潤(rùn))函數(shù): 最優(yōu)化的一階條件是最優(yōu)化的一階條件是: : BertrandBertrand(18831883)模型及求解)模型及求解)(),(121211cpbppapp)(),(212212cpbppapp02)()(1(),(2*12*1*11211cbppabppacpppp02)()(1(),(1*21*2*22212cbppabppacpppp 反應(yīng)函數(shù):反應(yīng)函數(shù): 納什均衡價(jià)格:納什均衡價(jià)格: bcabcapp2,2),(21)(2121cbpap)

27、(2112cbpap BertrandBertrand(18831883)模型及求解)模型及求解 在在n n個(gè)局中人的策略型博弈中,個(gè)局中人的策略型博弈中, 1 1、如果重復(fù)剔除嚴(yán)格劣策略剔除掉除策略組合、如果重復(fù)剔除嚴(yán)格劣策略剔除掉除策略組合s s以外的以外的所有策略,則這一策略組合所有策略,則這一策略組合s s為該博弈的唯一的納什均衡。為該博弈的唯一的納什均衡。 2 2、如果策略組合、如果策略組合s s是一個(gè)納什均衡,那么它就不會(huì)被重是一個(gè)納什均衡,那么它就不會(huì)被重復(fù)剔除嚴(yán)格劣策略所剔除。復(fù)剔除嚴(yán)格劣策略所剔除。 納什均衡是比重復(fù)剔除嚴(yán)格劣策略更強(qiáng)的解概念。納什均衡是比重復(fù)剔除嚴(yán)格劣策略更

28、強(qiáng)的解概念。五、納什均衡與重復(fù)剔除嚴(yán)格劣策略均衡五、納什均衡與重復(fù)剔除嚴(yán)格劣策略均衡 一、舉例說(shuō)明混合策略納什均衡一、舉例說(shuō)明混合策略納什均衡 例例2.82.8 猜左右手游戲猜左右手游戲 第四節(jié)第四節(jié) 混合策略納什均衡混合策略納什均衡 乙乙 甲甲(q q)猜左手猜左手(1-q1-q)猜右手猜右手(p p)放左手放左手-1,-1, 1 11, 1, -1 -1(1-p1-p)放右手放右手1, 1, -1 -1-1,-1, 1 1 在甲選在甲選 ,乙選,乙選 這種策略時(shí),這種策略時(shí),他們的期望效用分別為:他們的期望效用分別為: 混合策略與期望效用混合策略與期望效用( ,1)pp甲( ,1)qq乙,

29、)( 1)(1) 1(1)1 (1)(1) ( 1)4221Eupqpqp qpqpqpq 甲甲乙(,)1(1) ( 1)(1)( 1)(1)(1) 14221Eupqpqp qpqpqpq 乙甲乙(甲和乙的目標(biāo)是甲和乙的目標(biāo)是: :最優(yōu)化的一階條件是最優(yōu)化的一階條件是: : 1224),(maxqppqpEup乙甲甲 混合策略納什均衡混合策略納什均衡1224),(maxqppqpEuq乙甲乙024),(qppEu乙甲甲024),(pqpEu乙甲乙 混合策略納什均衡為:混合策略納什均衡為: 2121,2121),(,乙甲21p21q 混合策略納什均衡混合策略納什均衡1 1、混合策略、混合策略(

30、mixed Strategy) 局中人局中人 i i 的一個(gè)混合策略的一個(gè)混合策略 是在其純策略空是在其純策略空間間 上的一個(gè)概率分布,其中上的一個(gè)概率分布,其中 是是 i i 選擇策選擇策略略 的概率。局中人的概率。局中人 i i的混合策略空間的混合策略空間 是他的所有混合策略是他的所有混合策略構(gòu)成的集合。構(gòu)成的集合。 純策略可以理解為混合策略的特例。如純策略可以理解為混合策略的特例。如 等價(jià)于等價(jià)于 二、混合策略納什均衡二、混合策略納什均衡),.,(1ikii),.,(1ikiissS )(ijiijsijsi1is)0,.,0 , 1 (i 在混合策略組合在混合策略組合 下,局中人下,局

31、中人 i i的期望效用的期望效用函數(shù)為:函數(shù)為: 其中其中 2 2、期望效用函數(shù)、期望效用函數(shù)),.,()(),(11),.,(1nijjnjssiiissusEun),(ii),.,.,(111nnni 在策略型博弈在策略型博弈 中,如果對(duì)于每個(gè)中,如果對(duì)于每個(gè)局中人局中人 i i,存在,存在 ,都有,都有 或或 則稱則稱 是博弈是博弈G G的一個(gè)的一個(gè)混合策略納什均衡混合策略納什均衡。iiiiiiiiiiEuEu),(),(),.,(1n,.,;,.,11nnuuSSG niEuiiiiii,.,2 , 1, ),(maxarg 3 3、混合策略納什均衡、混合策略納什均衡 奇數(shù)定理奇數(shù)定理

32、 (Wilson 1971) (Wilson 1971) :幾乎所有的有限博弈:幾乎所有的有限博弈都有奇數(shù)個(gè)納什均衡。都有奇數(shù)個(gè)納什均衡。 4 4、奇數(shù)定理、奇數(shù)定理例例2.112.11 社會(huì)保障博弈社會(huì)保障博弈 局中人局中人:政府和下崗工人:政府和下崗工人 策策 略略:政:政 府:救濟(jì),不救濟(jì)府:救濟(jì),不救濟(jì) 下崗工人:找工作,不找工作下崗工人:找工作,不找工作 支付矩陣支付矩陣為:為: 三、應(yīng)用舉例三、應(yīng)用舉例 工人工人 政府政府找工作找工作不找不找救濟(jì)救濟(jì)3 3,2 2-1 -1,3 3不救濟(jì)不救濟(jì)-1 -1,1 10 0,0 0 女女 男男足球足球芭蕾芭蕾足球足球3 3,2 21 1,

33、1 1芭蕾芭蕾-1 -1,-1 -12 2,3 3 求出性別大戰(zhàn)博弈的混合策略納什均衡求出性別大戰(zhàn)博弈的混合策略納什均衡 定理定理1 1:(Nash,Nash, 19501950)每個(gè)有限策略型博弈至少)每個(gè)有限策略型博弈至少存在一個(gè)納什均衡(純策略的或混合策略的)。存在一個(gè)納什均衡(純策略的或混合策略的)。 第五節(jié)第五節(jié) 納什均衡的存在性納什均衡的存在性 BrouwerBrouwer不動(dòng)點(diǎn)定理不動(dòng)點(diǎn)定理:如果:如果X X是非空的有界閉凸集,是非空的有界閉凸集,f(x)f(x)是是X X到自身的連續(xù)映射,那么至少存在一個(gè)到自身的連續(xù)映射,那么至少存在一個(gè)x xX X,使得,使得 f(xf(x )=x)=x ,x x 稱為不動(dòng)點(diǎn)。稱為不動(dòng)點(diǎn)。 KakutaniKakutani不動(dòng)點(diǎn)定理不動(dòng)點(diǎn)定理:設(shè)設(shè)f(X)f(X)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論