混合策略納什均衡概述_第1頁(yè)
混合策略納什均衡概述_第2頁(yè)
混合策略納什均衡概述_第3頁(yè)
混合策略納什均衡概述_第4頁(yè)
混合策略納什均衡概述_第5頁(yè)
已閱讀5頁(yè),還剩44頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2022年12月28日1社會(huì)福利博弈:無(wú)納什均衡

流浪漢尋找工作游蕩救濟(jì)政府不救濟(jì)3,2-1,3-1,10,0你救濟(jì),他就游蕩;你游蕩,他就不救濟(jì)2022年12月28日2社會(huì)福利博弈的特征不存在納什均衡類(lèi)似:父母與啃老族回望:另一個(gè)不正常的博弈情侶博弈——兩個(gè)納什均衡2022年12月28日3思考如何分析“不存在”納什均衡或存在多個(gè)納什均衡的博弈?2022年12月28日4第三章混合策略納什均衡第一節(jié)基本概念:混合策略與期望支付2022年12月28日5第一節(jié)混合策略與期望支付一、混合策略(一)案例:小偷與守衛(wèi)的貓鼠博弈守衛(wèi)睡不睡偷小偷不偷8,-2-2,00,80,02022年12月28日6小偷與守衛(wèi)博弈無(wú)納什均衡,如何分析?2022年12月28日7第一節(jié)混合策略與期望支付一、混合策略(二)混合策略1.表述參與人按照一定概率,隨機(jī)從策略組合中選擇一種策略作為實(shí)際行動(dòng)隨機(jī)行動(dòng)的目的:使自己的行為不被對(duì)手預(yù)測(cè)2022年12月28日8混合策略小偷的混合策略以p的概率偷,(p,1-p)守衛(wèi)的混合策略以q的概率睡(q,1-q)2022年12月28日9第一節(jié)混合策略與期望支付一、混合策略(二)混合策略2.相對(duì)概念:純策略每個(gè)參與人的非隨機(jī)性選擇純粹行動(dòng)計(jì)劃,p=100%,1-p=02022年12月28日10第一節(jié)混合策略與期望支付一、混合策略(二)混合策略3.數(shù)學(xué)刻畫(huà)給定博弈G={S1,…,Sn;u1,…,un}以及參與人i的純策略Si={si1,…,sik}概率分布pi=(pi1,…,pik)為混合策略其中:0≤pik≤1,∑pik=1,pik=p(sik

)混合策略組合p=(p1,…,pi,…pn)2022年年12月月25日日11第一一節(jié)節(jié)混混合合策策略略與與期期望望支支付付二、、期期望望支支付付(一一))分分析析1.概率率(偷偷,,睡睡))的的概概率率::pq(偷偷,,不不睡睡))的的概概率率::p(1-q)(不不偷偷,,睡睡))的的概概率率::(1-p)q(不不偷偷,,不不睡睡))的的概概率率:(1-p)(1-q)2022年12月25日12第一節(jié)混混合合策略與與期望支支付二、期望望支付(一)分分析2.期望支付付U小偷=8pq+(-2)p(1-q)+0(1-p)q+0(1-p)(1-q)=2p(5q-1)U守衛(wèi)=(-2)pq+0p(1-q)+8(1-p)q+0(1-p)(1-q)=2q(4-5p)2022年12月25日13第一節(jié)混混合合策略與與期望支支付二、期望望支付(二)數(shù)數(shù)學(xué)刻畫(huà)畫(huà)2022年12月25日14第一節(jié)混混合合策略與與期望支支付三、混合合策略納納什均衡衡給定策略略式博弈弈G={S1,…,Sn;u1,…,un}以及混混合策略略組合p*=(p1*,…,pi*,…pn*)對(duì)于所有有i和pi∈∑i,∑i——i的混合策策略空間間如果有::πi(pi*,p-i*)≥ππi(pi’,p-i*)則:混合合策略組組合p*=(p1*,…,pi*,…pn*)為G的混合策策略納什什均衡2022年12月25日日15第二節(jié)研研究方法::反應(yīng)函數(shù)法法——最佳反應(yīng)函數(shù)數(shù)曲線交叉法法一、案例:麥麥琪的禮物Dela剪發(fā)q保留(1-q)賣(mài)表pJim保留(1-p)-2,-22,22,20,02022年12月25日日16二、研究方法法:反應(yīng)函數(shù)數(shù)法二、期望支付付1.UJim=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2p(1-3q)+2q整理原則:一一項(xiàng)含p,一項(xiàng)不含p2.UDel=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2q(1-3p)+2p整理原則:一一項(xiàng)含q,一項(xiàng)不含q2022年12月25日日17二、研究方法法:反應(yīng)函數(shù)數(shù)法三、反應(yīng)函數(shù)數(shù)1.Jim:Dela剪發(fā)的概率越越小,Jim賣(mài)表越好UJim=2p(1-3q)+2q2022年12月25日日18二、研究方法法:反應(yīng)函數(shù)數(shù)法三、反應(yīng)函數(shù)數(shù)2.Dela:Jim賣(mài)表的概率越越小,Dela剪發(fā)越好UDel=2q(1-3p)+2p2022年12月25日日19二、研究方法法:反應(yīng)函數(shù)數(shù)法四、反應(yīng)函數(shù)數(shù)曲線1.交點(diǎn)(1,0)雙方支付為22.交點(diǎn)(0,1)雙方支付為23.交點(diǎn)(1/3,1/3)雙方支付為2/3qp11/31/31互相為對(duì)方著著想,期望支支付變小2022年12月25日日20作業(yè)利用反應(yīng)函數(shù)數(shù)法求解“社會(huì)福利博弈弈”是否需要調(diào)整整數(shù)據(jù)?可得出有關(guān)社社會(huì)保障體系系改革的結(jié)論論?2022年年12月25日21友軍博弈英國(guó)國(guó)支持巴頓支支持蒙帥帥支持巴頓美國(guó)支持蒙帥4,32,21,13,42022年年12月25日22友軍博弈特特征兩個(gè)(多個(gè)個(gè))納什均均衡問(wèn)題:博弈弈的最終結(jié)結(jié)果?2022年年12月25日23第三章混混合策略略納什均衡衡第三節(jié)多多重納什什均衡的選選擇標(biāo)準(zhǔn)2022年年12月25日24第三節(jié)多多重納什均均衡的選擇擇標(biāo)準(zhǔn)一、帕累托托優(yōu)勢(shì)標(biāo)準(zhǔn)準(zhǔn):得益更大(一)案例例:戰(zhàn)爭(zhēng)與與和平C國(guó)鷹戰(zhàn)略鴿鴿戰(zhàn)戰(zhàn)略鷹戰(zhàn)略A國(guó)鴿戰(zhàn)略-5,-58,-10-10,810,102022年年12月25日25第三節(jié)多多重納什均均衡的選擇擇標(biāo)準(zhǔn)一、帕累托托優(yōu)勢(shì)標(biāo)準(zhǔn)準(zhǔn):得益更更大(二)納什什均衡的選選擇標(biāo)準(zhǔn)帕累托優(yōu)勢(shì)勢(shì)標(biāo)準(zhǔn)按照支付大小篩選納什均均衡-5,-58,-10-10,810,102022年年12月25日26第三節(jié)多重重納什均衡衡的選擇標(biāo)標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)優(yōu)勢(shì)標(biāo)準(zhǔn)::風(fēng)險(xiǎn)更小?。浚ㄒ唬┌咐捍ㄗ髯鞅撞┺膶W(xué)生乙作弊不不作弊弊作弊學(xué)生甲不作弊9,90,88,07,7帕累托優(yōu)勢(shì)勢(shì)?2022年年12月25日27第三節(jié)多重重納什均衡衡的選擇標(biāo)標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)優(yōu)勢(shì)標(biāo)準(zhǔn)::風(fēng)險(xiǎn)更小?。ǘ┓治鑫觯浩x損損失比較法法1.甲:?jiǎn)为?dú)偏離均均衡的損失(1)偏離“作弊”:9-8=1(2)偏離“不作弊”:7-0=79,90,88,07,72022年年12月25日28第三節(jié)多重重納什均衡衡的選擇標(biāo)標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)優(yōu)勢(shì)標(biāo)準(zhǔn)::風(fēng)險(xiǎn)更小?。ǘ┓治鑫觯浩x損損失比較法法2.乙:?jiǎn)为?dú)偏離均均衡的損失(1)偏離“作弊”:9-8=1(2)偏離“不作弊”:7-0=79,90,88,07,72022年年12月25日29第三節(jié)多重重納什均衡衡的選擇標(biāo)標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)優(yōu)勢(shì)標(biāo)準(zhǔn)::風(fēng)險(xiǎn)更小?。ǘ┓治鑫觯浩x損損失比較法法3.偏離損失比比較方法:偏離離“作弊”的損失VS偏離“不作弊”的損失1×1<7×79,90,88,07,72022年年12月25日30第三節(jié)多重重納什均衡衡的選擇標(biāo)標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)優(yōu)勢(shì)標(biāo)準(zhǔn)::風(fēng)險(xiǎn)更小?。ǘ┓治鑫觯浩x損損失比較法法4.結(jié)論(1)偏離(不不作弊,不不作弊)的的損失更大大:49(2)不偏離((不作弊,,不作弊))9,90,88,07,72022年年12月月25日日31第三三節(jié)節(jié)多多重重納納什什均均衡衡的的選選擇擇標(biāo)標(biāo)準(zhǔn)準(zhǔn)二、、風(fēng)風(fēng)險(xiǎn)險(xiǎn)優(yōu)優(yōu)勢(shì)勢(shì)標(biāo)標(biāo)準(zhǔn)準(zhǔn)::風(fēng)風(fēng)險(xiǎn)險(xiǎn)更更小小(三三))納納什什均均衡衡的的選選擇擇標(biāo)標(biāo)準(zhǔn)準(zhǔn)::風(fēng)風(fēng)險(xiǎn)險(xiǎn)優(yōu)優(yōu)勢(shì)勢(shì)標(biāo)標(biāo)準(zhǔn)準(zhǔn)比較較不不同同納納什什均均衡衡之之間間的的風(fēng)風(fēng)險(xiǎn)險(xiǎn)狀狀況況,,風(fēng)風(fēng)險(xiǎn)險(xiǎn)小小的的納納什什均均衡衡優(yōu)優(yōu)先先9,90,88,07,72022年年12月月25日日32第三三節(jié)節(jié)多多重重納納什什均均衡衡的的選選擇擇標(biāo)標(biāo)準(zhǔn)準(zhǔn)三、、聚聚點(diǎn)點(diǎn)均均衡衡(一一))案案例例::城城市市分分組組博博弈弈參與與人人::甲甲乙乙策略略::把把上上海海、、長(zhǎng)長(zhǎng)春春、、南南京京、、哈哈爾爾濱濱四四個(gè)個(gè)城城市市分分成成兩兩組組,,每每組組2個(gè)城城市市支付付::甲甲乙乙分分法法相相同同———獎(jiǎng)勵(lì)勵(lì)100元;;甲甲乙乙分分法法不不同同———獎(jiǎng)勵(lì)勵(lì)0元2022年12月25日日33第三節(jié)多重納納什均衡的選選擇標(biāo)準(zhǔn)三、聚點(diǎn)均衡衡(二)聚點(diǎn)均均衡1.標(biāo)準(zhǔn)使用社會(huì)文化化習(xí)慣、博弈弈歷史等信息息達(dá)到均衡1、10、66、8882.實(shí)質(zhì)規(guī)律性2022年12月25日日34第三節(jié)多重納納什均衡的選選擇標(biāo)準(zhǔn)四、相關(guān)均衡衡(一)案例::“地域連坐”下的產(chǎn)品質(zhì)量量博弈企業(yè)乙好產(chǎn)品差差產(chǎn)品好產(chǎn)品企業(yè)甲差產(chǎn)品4,4-8,-2-2,-8-2,-22022年12月25日日35第三節(jié)多重納納什均衡的選選擇標(biāo)準(zhǔn)四、相關(guān)均衡衡(二)相關(guān)均均衡參與人主動(dòng)設(shè)設(shè)計(jì)某種形式式的選擇機(jī)制制,形成制度度安排,從而而確定最終均均衡“三鹿”事件出現(xiàn)后,,河北省其他他食品企業(yè)以以后如何做??4,4-8,-2-2,-8-2,-22022年12月25日日36第三節(jié)多重納納什均衡的選選擇標(biāo)準(zhǔn)五、抗共謀均均衡(一)案例::抽象的選擇擇乙左右右上甲下乙左右右上甲下0,0,10-5,-5,0-5,-5,01,1,-5丙:A-2,-2,0-5,-5,0-5,-5,0-1,-1,5丙:B2022年12月25日日37第三節(jié)多重納納什均衡的選選擇標(biāo)準(zhǔn)五、抗共謀均均衡(二)共謀偏偏離(集體偏偏離)均衡的的激勵(lì)1.如果集體偏離(上,左,A)(1)起因:甲、、乙集體偏離離,選(下,,右,A)(2)結(jié)果:甲的的支付0→1,乙的支付0→1(3)結(jié)論:甲、、乙有集體偏偏離的動(dòng)機(jī),,(上,左左,A)非抗共謀均均衡2022年12月25日日38第三節(jié)多重納納什均衡的選選擇標(biāo)準(zhǔn)五、抗共謀均均衡(二)共謀偏偏離(集體偏偏離)均衡的的激勵(lì)2.如果集體偏離(下,右,B)(1)若甲、乙集集體偏離,選選(上,左,,B)-1→-2,-1→-2(2)若甲、丙集集體偏離,選選(上,右,,A)-1→-5,5→0(3)若乙、丙集集體偏離,選選(下,左,,A)-1→-5,5→0(4)結(jié)論:缺乏乏集體偏離的的激勵(lì),(下,右,B)為抗共謀均衡2022年12月25日日39獵鹿博弈:何何為抗共謀均均衡?乙獵鹿打打兔兔獵鹿甲打兔10,100,44,04,42022年年12月25日日40金無(wú)足足赤,,人無(wú)無(wú)完人人人總是是要犯犯錯(cuò)誤誤的,,所以以要對(duì)對(duì)別人人寬容容2022年年12月25日日41經(jīng)得起起考驗(yàn)驗(yàn)的納納什均均衡在其他參參與人人選擇擇了錯(cuò)錯(cuò)誤策策略的情況況下,,某參參與人人仍能能實(shí)現(xiàn)現(xiàn)納什什均衡衡他人不不犯錯(cuò)錯(cuò)誤,,你能能實(shí)現(xiàn)現(xiàn)最優(yōu)優(yōu);他他人犯犯錯(cuò)誤誤,你你仍能能實(shí)現(xiàn)現(xiàn)最優(yōu)優(yōu)2022年年12月25日日42第三節(jié)節(jié)多重重納什什均衡衡的選選擇標(biāo)標(biāo)準(zhǔn)六、顫顫抖手手精煉煉均衡衡Trembling-handperfectequilibrium(一))顫抖抖手某一參參與人人的非蓄意意錯(cuò)誤博弈偏偏離均均衡路路徑的的原因因一個(gè)人用手抓東西時(shí),手一顫抖,就可能抓不住他想抓的東西:非蓄意錯(cuò)誤2022年年12月25日日43第三節(jié)節(jié)多重重納什什均衡衡的選選擇標(biāo)標(biāo)準(zhǔn)六、顫顫抖手手精煉煉均衡衡(二))顫抖抖手均均衡1.基本思思想給定所有參參與人人均可可能犯犯錯(cuò)誤誤的情況況下,,如果果某一一策略略組合合仍是是每一一個(gè)參參與人人的最最優(yōu)策策略組組合,,則實(shí)實(shí)現(xiàn)顫顫抖手手均衡衡如何理解?2022年年12月25日日44第三節(jié)節(jié)多重重納什什均衡衡的選選擇標(biāo)標(biāo)準(zhǔn)六、顫顫抖手手精煉煉均衡衡(二))顫抖抖手均均衡2.定義:m——mistaken人博弈弈中,,對(duì)于于每一一個(gè)博博弈方方i,存在在嚴(yán)格格混合合策略略序列列,,使使下列列條件件得到到滿足足:(1)盡管每每一個(gè)個(gè)博弈弈方可可能犯犯錯(cuò)誤誤,但但錯(cuò)誤誤收斂斂于零零——總有一一天能能成功功2022年年12月25日日45穿針引引線——功夫不不負(fù)有有心人人將一條條線穿穿入針針眼,,手在在不停停顫抖抖,不不大可可能一一下子子穿進(jìn)進(jìn)去但如果果試的的次數(shù)數(shù)足夠夠大,,總是是能夠夠成功功2022年年12月25日日46第三節(jié)節(jié)多重重納什什均衡衡的選選擇標(biāo)標(biāo)準(zhǔn)六、顫顫抖手手精煉煉均衡衡(二))顫抖抖手均均衡2.定義::m——mistaken人博弈弈中,,對(duì)于于每一一個(gè)博博弈方方i,存在在嚴(yán)格格混合合策略略序列列,,使使下列列條件件得到到滿足足:(2)對(duì)于于任何何可選選擇的的混合合策略略2022年12月25日47穿針引線線——學(xué)會(huì)寬容容納什均衡衡:每一一個(gè)人都都把線穿穿入針眼眼寬容:某某參與人人不能因因?yàn)槠渌麉⑴c人人可能暫暫時(shí)無(wú)法法把線穿穿進(jìn)針眼眼而故意意不把線線穿進(jìn)針針眼寬容是一種美德2022年12月25日48本章作業(yè)業(yè)P143-1461、7、11、19、20、21、22、24、259、靜靜夜夜四四無(wú)無(wú)鄰鄰,,荒荒居居舊舊業(yè)業(yè)貧貧。。。。12月月-2212月月-22Sunday,December25,202210、雨雨中中黃黃葉葉樹(shù)樹(shù),,燈燈下下白白頭頭人人。。。。04:47:0404:47:0404:4712/25/20224:47:04AM11、以以我我獨(dú)獨(dú)沈沈久久,,愧愧君君相相見(jiàn)見(jiàn)頻頻。。。。12月-2204:47:0404:47Dec-2225-Dec-2212、故人江江海別,,幾度隔隔山川。。。04:47:0404:47:0404:47Sunday,December25,202213、乍見(jiàn)翻翻疑夢(mèng),,相悲各各問(wèn)年。。。12月-2212月-2204:47:0404:47:04December25,202214、他鄉(xiāng)生白發(fā)發(fā),舊國(guó)見(jiàn)青青山。。25十二月月20224:47:04上午04:47:0412月-2215、比不了得就就不比,得不不到的就不要要。。。十二月224:47上上午12月-2204:47December25,202216、行動(dòng)出成成果,工作作出財(cái)富。。。2022/12/254:47:0404:47:0425December202217、做前,能能夠環(huán)視四四周;做時(shí)時(shí),你只能能或者最好好沿著以腳腳為起點(diǎn)的的射線向前前。。4:47:04上上午4:47上上午04:47:0412月-229、沒(méi)沒(méi)有有失失敗敗,,只只有有暫暫時(shí)時(shí)停停止止成成功功?。?。。12月月-2212月月-22Sunday,December25,202210、很很多多事事情情努努力力了了未未必必有有結(jié)結(jié)果果,,但但是是不不努努力力卻卻什什么么改改變變也也沒(méi)沒(méi)有有。。。。04:47:0404:47:0404:4712/25/20224:47:04AM11、成成功功就就是是日日復(fù)復(fù)一一日日那那一一點(diǎn)點(diǎn)點(diǎn)點(diǎn)小小小小努努力力的的積積累累。。。。12月月-2204:47:0404:47Dec-2225-Dec-2212、世間成成事,不不求其絕絕對(duì)圓滿滿,留一一份不足足,可得得無(wú)限完完美。。。04:47:0404:47:0404:47Sunday,December25,202213、不知香香積寺,,數(shù)里入入云峰。。。12月-2212月-2204:47:0404:47:04December25,202214、意志志堅(jiān)強(qiáng)強(qiáng)的人人能把把世界界放在在手中中像泥泥塊一一樣任任意揉揉捏。。25十十二二月20224:47:04上上午04:47:0412月月-2215、楚塞三湘湘接,荊門(mén)門(mén)九派通。。。。十二月224:47上上午12月-2204:47December25,202216、少年十五五二十時(shí),,步行奪得得胡馬騎。。。2022/12/254:47:0404:47:0425December202217、空山新雨雨后,天氣氣晚來(lái)秋。。。4:47:04上上午4:47上上午04:47:0412月-229、楊柳散散和風(fēng),,青山澹澹吾慮。。。12月-2212月-22Sun

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論