第三章混合策略納什均衡ppt課件_第1頁(yè)
第三章混合策略納什均衡ppt課件_第2頁(yè)
第三章混合策略納什均衡ppt課件_第3頁(yè)
第三章混合策略納什均衡ppt課件_第4頁(yè)
第三章混合策略納什均衡ppt課件_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2022年7月17日博弈論第三章第一講 概念與方法1社會(huì)福利博弈:無(wú)納什平衡 漂泊漢 尋覓任務(wù) 游蕩 救援政府 不救援3,2-1,3-1,10,0他救援,他就游蕩;他游蕩,他就不救援2022年7月17日博弈論第三章第一講 概念與方法2社會(huì)福利博弈的特征不存在納什平衡類(lèi)似:父母與啃老族回望:另一個(gè)不正常的博弈情侶博弈兩個(gè)納什平衡2022年7月17日博弈論第三章第一講 概念與方法3思索如何分析“不存在納什平衡或存在多個(gè)納什平衡的博弈?2022年7月17日博弈論第三章第一講 概念與方法4第三章 混合戰(zhàn)略納什平衡第一節(jié) 根本概念:混合戰(zhàn)略與期望支付2022年7月17日博弈論第三章第一講 概念與方法5第

2、一節(jié) 混合戰(zhàn)略與期望支付一、混合戰(zhàn)略一案例:小偷與守衛(wèi)的貓鼠博弈 守衛(wèi) 睡 不睡 偷 小偷 不偷8,-2-2,00,80,02022年7月17日博弈論第三章第一講 概念與方法6小偷與守衛(wèi)博弈無(wú)納什平衡,如何分析?2022年7月17日博弈論第三章第一講 概念與方法7第一節(jié) 混合戰(zhàn)略與期望支付一、混合戰(zhàn)略二混合戰(zhàn)略1.表述參與人按照一定概率,隨機(jī)從戰(zhàn)略組合中選擇一種戰(zhàn)略作為實(shí)踐行動(dòng)隨機(jī)行動(dòng)的目的:使本人的行為不被對(duì)手預(yù)測(cè)2022年7月17日博弈論第三章第一講 概念與方法8混合戰(zhàn)略小偷的混合戰(zhàn)略以p的概率偷,p,1-p守衛(wèi)的混合戰(zhàn)略以q的概率睡q,1-q2022年7月17日博弈論第三章第一講 概念與

3、方法9第一節(jié) 混合戰(zhàn)略與期望支付一、混合戰(zhàn)略二混合戰(zhàn)略2.相對(duì)概念:純戰(zhàn)略每個(gè)參與人的非隨機(jī)性選擇純粹行動(dòng)方案,p=100%,1-p=02022年7月17日博弈論第三章第一講 概念與方法10第一節(jié) 混合戰(zhàn)略與期望支付一、混合戰(zhàn)略二混合戰(zhàn)略3.數(shù)學(xué)描寫(xiě)給定博弈G=S1,,Sn;u1,un以及參與人i的純戰(zhàn)略Si= si1,sik概率分布pi=pi1,pik為混合戰(zhàn)略其中:0 pik 1, pik=1, pik=p sik 混合戰(zhàn)略組合p=p1,pi,pn2022年7月17日博弈論第三章第一講 概念與方法11第一節(jié) 混合戰(zhàn)略與期望支付二、期望支付一分析1.概率偷,睡的概率:pq偷,不睡的概率:p(

4、1-q)不偷,睡的概率:(1-p)q不偷,不睡的概率:(1-p)(1-q)2022年7月17日博弈論第三章第一講 概念與方法12第一節(jié) 混合戰(zhàn)略與期望支付二、期望支付一分析2.期望支付U小偷=8pq+-2p(1-q)+0(1-p)q+0(1-p)(1-q)=2p(5q-1)U守衛(wèi)= -2 pq+0p(1-q)+8(1-p)q+0(1-p)(1-q)=2q(4-5p)2022年7月17日博弈論第三章第一講 概念與方法13第一節(jié) 混合戰(zhàn)略與期望支付二、期望支付二數(shù)學(xué)描寫(xiě)2022年7月17日博弈論第三章第一講 概念與方法14第一節(jié) 混合戰(zhàn)略與期望支付三、混合戰(zhàn)略納什平衡給定戰(zhàn)略式博弈G=S1,,Sn

5、;u1,un以及混合戰(zhàn)略組合p*=p1*,pi*,pn*對(duì)于一切i和pii, ii的混合戰(zhàn)略空間假設(shè)有:i(pi*,p-i*)i(pi,p-i*)那么:混合戰(zhàn)略組合p*=p1*,pi*,pn*為G的混合戰(zhàn)略納什平衡2022年7月17日博弈論第三章第一講 概念與方法15第二節(jié) 研討方法:反響函數(shù)法最正確反響函數(shù)曲線交叉法一、案例:麥琪的禮物 Dela 剪發(fā)q 保管1-q 賣(mài)表pJim 保管1-p-2,-22,22,20,02022年7月17日博弈論第三章第一講 概念與方法16二、研討方法:反響函數(shù)法二、期望支付1.UJim=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2

6、p(1-3q)+2q整理原那么:一項(xiàng)含p,一項(xiàng)不含p2.UDel=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2q(1-3p)+2p整理原那么:一項(xiàng)含q,一項(xiàng)不含q2022年7月17日博弈論第三章第一講 概念與方法17二、研討方法:反響函數(shù)法三、反響函數(shù)1.Jim:Dela剪發(fā)的概率越小,Jim賣(mài)表越好UJim=2p(1-3q)+2q2022年7月17日博弈論第三章第一講 概念與方法18二、研討方法:反響函數(shù)法三、反響函數(shù)2. Dela : Jim賣(mài)表的概率越小, Dela 剪發(fā)越好UDel=2q(1-3p)+2p2022年7月17日博弈論第三章第一講 概念與方法19

7、二、研討方法:反響函數(shù)法四、反響函數(shù)曲線1.交點(diǎn)1,0雙方支付為22.交點(diǎn)0,1雙方支付為23.交點(diǎn)1/3,1/3雙方支付為2/3qp11/31/31相互為對(duì)方著想,期望支付變小2022年7月17日博弈論第三章第一講 概念與方法20作業(yè)利用反響函數(shù)法求解“社會(huì)福利博弈能否需求調(diào)整數(shù)據(jù)?可得出有關(guān)社會(huì)保證體系改革的結(jié)論?2022年7月17日博弈論第三章第二講多重納什平衡21友軍博弈 英 國(guó) 支持巴頓 支持蒙帥 支持巴頓美國(guó) 支持蒙帥4,32,21,13,42022年7月17日博弈論第三章第二講多重納什平衡22友軍博弈特征兩個(gè)多個(gè)納什平衡問(wèn)題:博弈的最終結(jié)果?2022年7月17日博弈論第三章第二講

8、多重納什平衡23第三章 混合戰(zhàn)略納什平衡第三節(jié) 多重納什平衡的選擇規(guī)范2022年7月17日博弈論第三章第二講多重納什平衡24第三節(jié) 多重納什平衡的選擇規(guī)范一、帕累托優(yōu)勢(shì)規(guī)范:得益更大一案例:戰(zhàn)爭(zhēng)與和平 C國(guó) 鷹戰(zhàn)略 鴿戰(zhàn)略 鷹戰(zhàn)略 A國(guó) 鴿戰(zhàn)略-5,-58,-10-10,810,102022年7月17日博弈論第三章第二講多重納什平衡25第三節(jié) 多重納什平衡的選擇規(guī)范一、帕累托優(yōu)勢(shì)規(guī)范:得益更大二納什平衡的選擇規(guī)范帕累托優(yōu)勢(shì)規(guī)范按照支付大小挑選納什平衡-5,-58,-10-10,810,102022年7月17日博弈論第三章第二講多重納什平衡26第三節(jié)多重納什平衡的選擇規(guī)范二、風(fēng)險(xiǎn)優(yōu)勢(shì)規(guī)范:風(fēng)險(xiǎn)更

9、???一案例:串通作弊博弈 學(xué)生乙 作弊 不作弊 作弊學(xué)生甲 不作弊9,90,88,07,7帕累托優(yōu)勢(shì)?2022年7月17日博弈論第三章第二講多重納什平衡27第三節(jié)多重納什平衡的選擇規(guī)范二、風(fēng)險(xiǎn)優(yōu)勢(shì)規(guī)范:風(fēng)險(xiǎn)更小二分析:偏離損失比較法1.甲:?jiǎn)为?dú)偏離平衡的損失1偏離“作弊:9-8=12偏離“不作弊:7-0=7 9,90,88,07,72022年7月17日博弈論第三章第二講多重納什平衡28第三節(jié)多重納什平衡的選擇規(guī)范二、風(fēng)險(xiǎn)優(yōu)勢(shì)規(guī)范:風(fēng)險(xiǎn)更小二分析:偏離損失比較法2.乙:?jiǎn)为?dú)偏離平衡的損失1偏離“作弊:9-8=12偏離“不作弊:7-0=7 9,90,88,07,72022年7月17日博弈論第三章第

10、二講多重納什平衡29第三節(jié)多重納什平衡的選擇規(guī)范二、風(fēng)險(xiǎn)優(yōu)勢(shì)規(guī)范:風(fēng)險(xiǎn)更小二分析:偏離損失比較法3.偏離損失比較方法:偏離“作弊的損失VS偏離“不作弊的損失1177 9,90,88,07,72022年7月17日博弈論第三章第二講多重納什平衡30第三節(jié)多重納什平衡的選擇規(guī)范二、風(fēng)險(xiǎn)優(yōu)勢(shì)規(guī)范:風(fēng)險(xiǎn)更小二分析:偏離損失比較法4.結(jié)論1偏離不作弊,不作弊的損失更大:492不偏離不作弊,不作弊 9,90,88,07,72022年7月17日博弈論第三章第二講多重納什平衡31第三節(jié)多重納什平衡的選擇規(guī)范二、風(fēng)險(xiǎn)優(yōu)勢(shì)規(guī)范:風(fēng)險(xiǎn)更小三納什平衡的選擇規(guī)范:風(fēng)險(xiǎn)優(yōu)勢(shì)規(guī)范比較不同納什平衡之間的風(fēng)險(xiǎn)情況,風(fēng)險(xiǎn)小的納什平

11、衡優(yōu)先 9,90,88,07,72022年7月17日博弈論第三章第二講多重納什平衡32第三節(jié)多重納什平衡的選擇規(guī)范三、聚點(diǎn)平衡一案例:城市分組博弈參與人: 甲 乙戰(zhàn)略:把上海、長(zhǎng)春、南京、哈爾濱四個(gè)城市分成兩組,每組2個(gè)城市支付:甲乙分法一樣獎(jiǎng)勵(lì)100元;甲乙分法不同獎(jiǎng)勵(lì)0元2022年7月17日博弈論第三章第二講多重納什平衡33第三節(jié)多重納什平衡的選擇規(guī)范三、聚點(diǎn)平衡二聚點(diǎn)平衡1.規(guī)范運(yùn)用社會(huì)文化習(xí)慣、博弈歷史等信息到達(dá)平衡1、10、66、8882.本質(zhì)規(guī)律性2022年7月17日博弈論第三章第二講多重納什平衡34第三節(jié)多重納什平衡的選擇規(guī)范四、相關(guān)平衡一案例:“地域連坐下的產(chǎn)質(zhì)量量博弈 企業(yè)乙

12、 好產(chǎn)品 差產(chǎn)品 好產(chǎn)品企業(yè)甲 差產(chǎn)品4,4-8,-2-2,-8-2,-22022年7月17日博弈論第三章第二講多重納什平衡35第三節(jié)多重納什平衡的選擇規(guī)范四、相關(guān)平衡二相關(guān)平衡參與人自動(dòng)設(shè)計(jì)某種方式的選擇機(jī)制,構(gòu)成制度安排,從而確定最終平衡“三鹿事件出現(xiàn)后,河北省其他食品企業(yè)以后如何做?4,4-8,-2-2,-8-2,-22022年7月17日博弈論第三章第二講多重納什平衡36第三節(jié)多重納什平衡的選擇規(guī)范五、抗共謀平衡一案例:籠統(tǒng)的選擇 乙 左 右 上甲 下 乙 左 右 上甲 下0,0,10-5,-5,0-5,-5,01,1,-5丙:A-2,-2,0-5,-5,0-5,-5,0-1,-1,5丙

13、:B2022年7月17日博弈論第三章第二講多重納什平衡37第三節(jié)多重納什平衡的選擇規(guī)范五、抗共謀平衡二共謀偏離集體偏離平衡的鼓勵(lì)1.假設(shè)集體偏離上,左,A1原因:甲、乙集體偏離,選下,右,A2結(jié)果:甲的支付01,乙的支付013結(jié)論:甲、乙有集體偏離的動(dòng)機(jī), 上,左,A非抗共謀平衡2022年7月17日博弈論第三章第二講多重納什平衡38第三節(jié)多重納什平衡的選擇規(guī)范五、抗共謀平衡二共謀偏離集體偏離平衡的鼓勵(lì)2.假設(shè)集體偏離下,右,B1假設(shè)甲、乙集體偏離,選上,左,B-1-2, -1-22假設(shè)甲、丙集體偏離,選上,右,A-1-5, 503假設(shè)乙、丙集體偏離,選下,左,A-1-5, 504結(jié)論:缺乏集體

14、偏離的鼓勵(lì), 下,右,B為抗共謀平衡2022年7月17日博弈論第三章第二講多重納什平衡39獵鹿博弈:何為抗共謀平衡? 乙 獵鹿 打兔 獵鹿 甲 打兔10,100,44,04,42022年7月17日博弈論第三章第二講多重納什平衡40金無(wú)足赤,人無(wú)完人人總是要犯錯(cuò)誤的,所以要對(duì)他人寬容2022年7月17日博弈論第三章第二講多重納什平衡41經(jīng)得起考驗(yàn)的納什平衡在其他參與人選擇了錯(cuò)誤戰(zhàn)略的情況下,某參與人仍能實(shí)現(xiàn)納什平衡他人不犯錯(cuò)誤,他能實(shí)現(xiàn)最優(yōu);他人犯錯(cuò)誤,他仍能實(shí)現(xiàn)最優(yōu)2022年7月17日博弈論第三章第二講多重納什平衡42第三節(jié)多重納什平衡的選擇規(guī)范六、顫抖手精煉平衡Trembling-hand

15、perfect equilibrium一顫抖手某一參與人的非蓄意錯(cuò)誤博弈偏離平衡途徑的緣由一個(gè)人用手抓東西時(shí),手一顫抖,就能夠抓不住他想抓的東西:非蓄意錯(cuò)誤2022年7月17日博弈論第三章第二講多重納什平衡43第三節(jié)多重納什平衡的選擇規(guī)范六、顫抖手精煉平衡二顫抖手平衡1.根本思想給定一切參與人均能夠犯錯(cuò)誤的情況下,假設(shè)某一戰(zhàn)略組合仍是每一個(gè)參與人的最優(yōu)戰(zhàn)略組合,那么實(shí)現(xiàn)顫抖手平衡如何了解?2022年7月17日博弈論第三章第二講多重納什平衡44第三節(jié)多重納什平衡的選擇規(guī)范六、顫抖手精煉平衡二顫抖手平衡2.定義: mmistaken人博弈中,對(duì)于每一個(gè)博弈方i,存在嚴(yán)厲混合戰(zhàn)略序列 ,使以下條件得到滿足:1雖然每一個(gè)博弈方能夠犯錯(cuò)誤,但錯(cuò)誤收斂于零總有一天能勝利2022年7月17日博弈論第三章第二講多重納什平衡45穿針引線功夫不負(fù)有心人將一條線穿入針眼,手在不停顫抖,不大能夠一下子穿進(jìn)去但假設(shè)試的次數(shù)足夠大,總是可以勝利2022年7月17日博弈論第三章第二講多重納什平衡46第三節(jié)多重納什平

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論