第三章混合策略納什均衡ppt課件

上傳人：A*** IP屬地：廣東上傳時(shí)間：2022-07-17 格式：PPT 頁(yè)數(shù)：48 大?。?05KB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩43頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2022年7月17日博弈論第三章第一講概念與方法1社會(huì)福利博弈：無(wú)納什平衡漂泊漢尋覓任務(wù) 游蕩救援政府不救援3，2-1，3-1，10，0他救援，他就游蕩；他游蕩，他就不救援2022年7月17日博弈論第三章第一講概念與方法2社會(huì)福利博弈的特征不存在納什平衡類(lèi)似：父母與啃老族回望：另一個(gè)不正常的博弈情侶博弈兩個(gè)納什平衡2022年7月17日博弈論第三章第一講概念與方法3思索如何分析“不存在納什平衡或存在多個(gè)納什平衡的博弈？2022年7月17日博弈論第三章第一講概念與方法4第三章混合戰(zhàn)略納什平衡第一節(jié) 根本概念：混合戰(zhàn)略與期望支付2022年7月17日博弈論第三章第一講概念與方法5第

2、一節(jié) 混合戰(zhàn)略與期望支付一、混合戰(zhàn)略一案例：小偷與守衛(wèi)的貓鼠博弈守衛(wèi) 睡不睡偷小偷不偷8，-2-2，00，80，02022年7月17日博弈論第三章第一講概念與方法6小偷與守衛(wèi)博弈無(wú)納什平衡，如何分析？2022年7月17日博弈論第三章第一講概念與方法7第一節(jié) 混合戰(zhàn)略與期望支付一、混合戰(zhàn)略二混合戰(zhàn)略1.表述參與人按照一定概率，隨機(jī)從戰(zhàn)略組合中選擇一種戰(zhàn)略作為實(shí)踐行動(dòng)隨機(jī)行動(dòng)的目的：使本人的行為不被對(duì)手預(yù)測(cè)2022年7月17日博弈論第三章第一講概念與方法8混合戰(zhàn)略小偷的混合戰(zhàn)略以p的概率偷，p，1-p守衛(wèi)的混合戰(zhàn)略以q的概率睡q，1-q2022年7月17日博弈論第三章第一講概念與

3、方法9第一節(jié) 混合戰(zhàn)略與期望支付一、混合戰(zhàn)略二混合戰(zhàn)略2.相對(duì)概念：純戰(zhàn)略每個(gè)參與人的非隨機(jī)性選擇純粹行動(dòng)方案，p=100%,1-p=02022年7月17日博弈論第三章第一講概念與方法10第一節(jié) 混合戰(zhàn)略與期望支付一、混合戰(zhàn)略二混合戰(zhàn)略3.數(shù)學(xué)描寫(xiě)給定博弈G=S1，,Sn;u1,un以及參與人i的純戰(zhàn)略Si= si1,sik概率分布pi=pi1,pik為混合戰(zhàn)略其中：0 pik 1， pik=1， pik=p sik 混合戰(zhàn)略組合p=p1,pi,pn2022年7月17日博弈論第三章第一講概念與方法11第一節(jié) 混合戰(zhàn)略與期望支付二、期望支付一分析1.概率偷，睡的概率：pq偷，不睡的概率：p(

4、1-q)不偷，睡的概率：(1-p)q不偷，不睡的概率：(1-p)(1-q)2022年7月17日博弈論第三章第一講概念與方法12第一節(jié) 混合戰(zhàn)略與期望支付二、期望支付一分析2.期望支付U小偷=8pq+-2p(1-q)+0(1-p)q+0(1-p)(1-q)=2p(5q-1)U守衛(wèi)= -2 pq+0p(1-q)+8(1-p)q+0(1-p)(1-q)=2q(4-5p)2022年7月17日博弈論第三章第一講概念與方法13第一節(jié) 混合戰(zhàn)略與期望支付二、期望支付二數(shù)學(xué)描寫(xiě)2022年7月17日博弈論第三章第一講概念與方法14第一節(jié) 混合戰(zhàn)略與期望支付三、混合戰(zhàn)略納什平衡給定戰(zhàn)略式博弈G=S1，,Sn

5、;u1,un以及混合戰(zhàn)略組合p*=p1*,pi*,pn*對(duì)于一切i和pii， ii的混合戰(zhàn)略空間假設(shè)有：i(pi*,p-i*)i(pi,p-i*)那么：混合戰(zhàn)略組合p*=p1*,pi*,pn*為G的混合戰(zhàn)略納什平衡2022年7月17日博弈論第三章第一講概念與方法15第二節(jié) 研討方法：反響函數(shù)法最正確反響函數(shù)曲線交叉法一、案例：麥琪的禮物 Dela 剪發(fā)q 保管1-q 賣(mài)表pJim 保管1-p-2，-22，22，20，02022年7月17日博弈論第三章第一講概念與方法16二、研討方法：反響函數(shù)法二、期望支付1.UJim=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2

6、p(1-3q)+2q整理原那么：一項(xiàng)含p，一項(xiàng)不含p2.UDel=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2q(1-3p)+2p整理原那么：一項(xiàng)含q，一項(xiàng)不含q2022年7月17日博弈論第三章第一講概念與方法17二、研討方法：反響函數(shù)法三、反響函數(shù)1.Jim：Dela剪發(fā)的概率越小，Jim賣(mài)表越好UJim=2p(1-3q)+2q2022年7月17日博弈論第三章第一講概念與方法18二、研討方法：反響函數(shù)法三、反響函數(shù)2. Dela ： Jim賣(mài)表的概率越小， Dela 剪發(fā)越好UDel=2q(1-3p)+2p2022年7月17日博弈論第三章第一講概念與方法19

7、二、研討方法：反響函數(shù)法四、反響函數(shù)曲線1.交點(diǎn)1，0雙方支付為22.交點(diǎn)0，1雙方支付為23.交點(diǎn)1/3，1/3雙方支付為2/3qp11/31/31相互為對(duì)方著想，期望支付變小2022年7月17日博弈論第三章第一講概念與方法20作業(yè)利用反響函數(shù)法求解“社會(huì)福利博弈能否需求調(diào)整數(shù)據(jù)？可得出有關(guān)社會(huì)保證體系改革的結(jié)論？2022年7月17日博弈論第三章第二講多重納什平衡21友軍博弈英國(guó) 支持巴頓支持蒙帥支持巴頓美國(guó) 支持蒙帥4，32，21，13，42022年7月17日博弈論第三章第二講多重納什平衡22友軍博弈特征兩個(gè)多個(gè)納什平衡問(wèn)題：博弈的最終結(jié)果？2022年7月17日博弈論第三章第二講

8、多重納什平衡23第三章混合戰(zhàn)略納什平衡第三節(jié) 多重納什平衡的選擇規(guī)范2022年7月17日博弈論第三章第二講多重納什平衡24第三節(jié) 多重納什平衡的選擇規(guī)范一、帕累托優(yōu)勢(shì)規(guī)范：得益更大一案例：戰(zhàn)爭(zhēng)與和平 C國(guó) 鷹戰(zhàn)略鴿戰(zhàn)略鷹戰(zhàn)略 A國(guó) 鴿戰(zhàn)略-5，-58，-10-10，810，102022年7月17日博弈論第三章第二講多重納什平衡25第三節(jié) 多重納什平衡的選擇規(guī)范一、帕累托優(yōu)勢(shì)規(guī)范：得益更大二納什平衡的選擇規(guī)范帕累托優(yōu)勢(shì)規(guī)范按照支付大小挑選納什平衡-5，-58，-10-10，810，102022年7月17日博弈論第三章第二講多重納什平衡26第三節(jié)多重納什平衡的選擇規(guī)范二、風(fēng)險(xiǎn)優(yōu)勢(shì)規(guī)范：風(fēng)險(xiǎn)更

9、??？一案例：串通作弊博弈學(xué)生乙作弊不作弊作弊學(xué)生甲不作弊9，90，88，07，7帕累托優(yōu)勢(shì)？2022年7月17日博弈論第三章第二講多重納什平衡27第三節(jié)多重納什平衡的選擇規(guī)范二、風(fēng)險(xiǎn)優(yōu)勢(shì)規(guī)范：風(fēng)險(xiǎn)更小二分析：偏離損失比較法1.甲：?jiǎn)为?dú)偏離平衡的損失1偏離“作弊：9-8=12偏離“不作弊：7-0=7 9，90，88，07，72022年7月17日博弈論第三章第二講多重納什平衡28第三節(jié)多重納什平衡的選擇規(guī)范二、風(fēng)險(xiǎn)優(yōu)勢(shì)規(guī)范：風(fēng)險(xiǎn)更小二分析：偏離損失比較法2.乙：?jiǎn)为?dú)偏離平衡的損失1偏離“作弊：9-8=12偏離“不作弊：7-0=7 9，90，88，07，72022年7月17日博弈論第三章第

10、二講多重納什平衡29第三節(jié)多重納什平衡的選擇規(guī)范二、風(fēng)險(xiǎn)優(yōu)勢(shì)規(guī)范：風(fēng)險(xiǎn)更小二分析：偏離損失比較法3.偏離損失比較方法：偏離“作弊的損失VS偏離“不作弊的損失1177 9，90，88，07，72022年7月17日博弈論第三章第二講多重納什平衡30第三節(jié)多重納什平衡的選擇規(guī)范二、風(fēng)險(xiǎn)優(yōu)勢(shì)規(guī)范：風(fēng)險(xiǎn)更小二分析：偏離損失比較法4.結(jié)論1偏離不作弊，不作弊的損失更大：492不偏離不作弊，不作弊 9，90，88，07，72022年7月17日博弈論第三章第二講多重納什平衡31第三節(jié)多重納什平衡的選擇規(guī)范二、風(fēng)險(xiǎn)優(yōu)勢(shì)規(guī)范：風(fēng)險(xiǎn)更小三納什平衡的選擇規(guī)范：風(fēng)險(xiǎn)優(yōu)勢(shì)規(guī)范比較不同納什平衡之間的風(fēng)險(xiǎn)情況，風(fēng)險(xiǎn)小的納什平

11、衡優(yōu)先 9，90，88，07，72022年7月17日博弈論第三章第二講多重納什平衡32第三節(jié)多重納什平衡的選擇規(guī)范三、聚點(diǎn)平衡一案例：城市分組博弈參與人：甲乙戰(zhàn)略：把上海、長(zhǎng)春、南京、哈爾濱四個(gè)城市分成兩組，每組2個(gè)城市支付：甲乙分法一樣獎(jiǎng)勵(lì)100元；甲乙分法不同獎(jiǎng)勵(lì)0元2022年7月17日博弈論第三章第二講多重納什平衡33第三節(jié)多重納什平衡的選擇規(guī)范三、聚點(diǎn)平衡二聚點(diǎn)平衡1.規(guī)范運(yùn)用社會(huì)文化習(xí)慣、博弈歷史等信息到達(dá)平衡1、10、66、8882.本質(zhì)規(guī)律性2022年7月17日博弈論第三章第二講多重納什平衡34第三節(jié)多重納什平衡的選擇規(guī)范四、相關(guān)平衡一案例：“地域連坐下的產(chǎn)質(zhì)量量博弈企業(yè)乙

12、好產(chǎn)品差產(chǎn)品好產(chǎn)品企業(yè)甲差產(chǎn)品4，4-8，-2-2，-8-2，-22022年7月17日博弈論第三章第二講多重納什平衡35第三節(jié)多重納什平衡的選擇規(guī)范四、相關(guān)平衡二相關(guān)平衡參與人自動(dòng)設(shè)計(jì)某種方式的選擇機(jī)制，構(gòu)成制度安排，從而確定最終平衡“三鹿事件出現(xiàn)后，河北省其他食品企業(yè)以后如何做？4，4-8，-2-2，-8-2，-22022年7月17日博弈論第三章第二講多重納什平衡36第三節(jié)多重納什平衡的選擇規(guī)范五、抗共謀平衡一案例：籠統(tǒng)的選擇乙左右上甲下乙左右上甲下0，0，10-5，-5，0-5，-5，01，1，-5丙：A-2，-2，0-5，-5，0-5，-5，0-1，-1，5丙

13、：B2022年7月17日博弈論第三章第二講多重納什平衡37第三節(jié)多重納什平衡的選擇規(guī)范五、抗共謀平衡二共謀偏離集體偏離平衡的鼓勵(lì)1.假設(shè)集體偏離上，左，A1原因：甲、乙集體偏離，選下，右，A2結(jié)果：甲的支付01，乙的支付013結(jié)論：甲、乙有集體偏離的動(dòng)機(jī)，上，左，A非抗共謀平衡2022年7月17日博弈論第三章第二講多重納什平衡38第三節(jié)多重納什平衡的選擇規(guī)范五、抗共謀平衡二共謀偏離集體偏離平衡的鼓勵(lì)2.假設(shè)集體偏離下，右，B1假設(shè)甲、乙集體偏離，選上，左，B-1-2， -1-22假設(shè)甲、丙集體偏離，選上，右，A-1-5， 503假設(shè)乙、丙集體偏離，選下，左，A-1-5， 504結(jié)論：缺乏集體

14、偏離的鼓勵(lì)，下，右，B為抗共謀平衡2022年7月17日博弈論第三章第二講多重納什平衡39獵鹿博弈：何為抗共謀平衡？乙獵鹿打兔獵鹿甲打兔10，100，44，04，42022年7月17日博弈論第三章第二講多重納什平衡40金無(wú)足赤，人無(wú)完人人總是要犯錯(cuò)誤的，所以要對(duì)他人寬容2022年7月17日博弈論第三章第二講多重納什平衡41經(jīng)得起考驗(yàn)的納什平衡在其他參與人選擇了錯(cuò)誤戰(zhàn)略的情況下，某參與人仍能實(shí)現(xiàn)納什平衡他人不犯錯(cuò)誤，他能實(shí)現(xiàn)最優(yōu)；他人犯錯(cuò)誤，他仍能實(shí)現(xiàn)最優(yōu)2022年7月17日博弈論第三章第二講多重納什平衡42第三節(jié)多重納什平衡的選擇規(guī)范六、顫抖手精煉平衡Trembling-hand

15、perfect equilibrium一顫抖手某一參與人的非蓄意錯(cuò)誤博弈偏離平衡途徑的緣由一個(gè)人用手抓東西時(shí)，手一顫抖，就能夠抓不住他想抓的東西：非蓄意錯(cuò)誤2022年7月17日博弈論第三章第二講多重納什平衡43第三節(jié)多重納什平衡的選擇規(guī)范六、顫抖手精煉平衡二顫抖手平衡1.根本思想給定一切參與人均能夠犯錯(cuò)誤的情況下，假設(shè)某一戰(zhàn)略組合仍是每一個(gè)參與人的最優(yōu)戰(zhàn)略組合，那么實(shí)現(xiàn)顫抖手平衡如何了解？2022年7月17日博弈論第三章第二講多重納什平衡44第三節(jié)多重納什平衡的選擇規(guī)范六、顫抖手精煉平衡二顫抖手平衡2.定義: mmistaken人博弈中，對(duì)于每一個(gè)博弈方i，存在嚴(yán)厲混合戰(zhàn)略序列，使以下條件得到滿足：1雖然每一個(gè)博弈方能夠犯錯(cuò)誤，但錯(cuò)誤收斂于零總有一天能勝利2022年7月17日博弈論第三章第二講多重納什平衡45穿針引線功夫不負(fù)有心人將一條線穿入針眼，手在不停顫抖，不大能夠一下子穿進(jìn)去但假設(shè)試的次數(shù)足夠大，總是可以勝利2022年7月17日博弈論第三章第二講多重納什平衡46第三節(jié)多重納什平

人人文庫(kù)> 全部分類(lèi)> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第三章混合策略納什均衡ppt課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第三章混合策略納什均衡ppt課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔