版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
11第四章純策略同時(shí)行動(dòng)博弈(Ⅰ):離散策略情形小組成員張曼麗吳杰張幸孫玥吳蓉蓉虞玲玉王安東王丹萍22內(nèi)容提要4.1-4.2基本概念張曼麗4.3-4.5兩人參與的同時(shí)博弈的分析方法吳蓉蓉4.6-4.8多種類型的同時(shí)行動(dòng)博弈王丹萍、王安東3344.1離散型策略同時(shí)行動(dòng)博弈的描述純策略同時(shí)行動(dòng)博弈(Ⅰ):離散策略情形45同時(shí)行動(dòng)博弈的概念:參與人在同一時(shí)間選擇他們各自的行動(dòng)或者即使不是同時(shí)行動(dòng),但參與人在分別選擇各自行動(dòng)時(shí),不清楚其他人所做的和將要做的選擇,那么這樣的博弈也叫同時(shí)行動(dòng)博弈。同時(shí)行動(dòng)博弈的例子:選民投票(同時(shí)進(jìn)行的)、商家再?zèng)Q定各自的產(chǎn)品決策時(shí)(非同時(shí))。54.1離散型策略同時(shí)行動(dòng)博弈的描述6策略(strategies):一套完整的行動(dòng)計(jì)劃?;旌喜呗?mixedstrategies):隨機(jī)選擇的行動(dòng)。純策略(purestrategies):最初定義的行動(dòng)。離散型策略:每個(gè)參與人只擁有有限個(gè)離散型純策略供其選擇。連續(xù)性策略:每個(gè)參與人的純策略可以是一個(gè)連續(xù)區(qū)域中的任意一個(gè)數(shù)。64.1離散型策略同時(shí)行動(dòng)博弈的描述行動(dòng)博弈表(gametable):博弈的規(guī)范式或策略式。7表4-1博弈表特點(diǎn):當(dāng)涉及兩個(gè)人的決策時(shí)博弈表便是二維的。74.1離散型策略同時(shí)行動(dòng)博弈的描述8零和博弈(zero-sum):博弈雙方的利益完全相對(duì)。特點(diǎn):一方個(gè)人的支付就是另一個(gè)人的支付相反數(shù)。表4-2零和博弈情況下博弈表的形式84.1離散型策略同時(shí)行動(dòng)博弈的描述94.2納什均衡910納什均衡(Nashequilibrium):博弈中的一個(gè)策略組合,在其他參與人都堅(jiān)守這個(gè)策略組合中的策略不變的情況下,沒有參與人可以通過改變自己的策略而得到一個(gè)更高的支付。均衡(equilibrium):意味著每個(gè)參與人所采取的策略都是對(duì)于其他人策略的最優(yōu)反應(yīng)。104.2納什均衡同時(shí)博弈VS最優(yōu)反應(yīng)是否矛盾?114.2納什均衡如何理解沒有參與人可以通過改變自己的策略使其支付更高?注意:1.納什均衡不要求構(gòu)成均衡的策略嚴(yán)格優(yōu)于其他策略2.納什均衡并不是指所有參與人的支付最優(yōu)需要澄清的誤區(qū):(以上我們提到的,在納什均衡中每個(gè)參與人的選擇都是對(duì)其他人策略的最優(yōu)反應(yīng))怎么能在不知道其他參與人選擇的情況下,做出反應(yīng)呢?可以進(jìn)行盲目猜測(cè),并且期望這些猜測(cè)是有效的;依據(jù)經(jīng)驗(yàn)和觀察;使用“想其他人之所想”的邏輯。博弈學(xué)家將博弈的參與人都獲得了關(guān)于其他人在同時(shí)博弈中選擇的認(rèn)識(shí)的這一過程稱之為“信念”。124.2納什均衡13從信念角度理解納什均衡:策略組合有兩個(gè)性質(zhì)每個(gè)參與人都對(duì)其他參與人的策略有正確的信念;給定每個(gè)參與人關(guān)于其他參與人策略的信念,自己所選擇的策略式最優(yōu)的。這樣理解納什均衡的優(yōu)點(diǎn):最優(yōu)反應(yīng)不再具有邏輯上的缺陷。每個(gè)參與人都選擇了基于自己業(yè)已形成的關(guān)于其他人行動(dòng)的信念的最優(yōu)反應(yīng),而不是對(duì)沒有觀察到的其他參與人真實(shí)行動(dòng)的最優(yōu)反應(yīng)。134.2納什均衡144.3占優(yōu)策略選擇1415兩個(gè)人都存在占有策略的情形對(duì)于丈夫和妻子來說,“認(rèn)罪”都是占有策略,因此(認(rèn)罪,認(rèn)罪)這個(gè)結(jié)果可以被預(yù)見,且這也是一個(gè)納什均衡,因?yàn)樗腥硕歼x擇了他或她的最優(yōu)策略。16只有一個(gè)參與者存在占有策略的情形
在這個(gè)博弈中,聯(lián)邦儲(chǔ)備銀行不存在占有策略,國(guó)會(huì)的選擇很清楚,無論銀行做什么選擇,它選擇“預(yù)算赤字”的支付都將大于選擇“預(yù)算平衡”的支付,所以聯(lián)邦儲(chǔ)備銀行也會(huì)考慮到國(guó)會(huì)將會(huì)選擇其占有策略(預(yù)算赤字),并在此信念上做出自己的最優(yōu)策略,即“高利率”。表4-5貨幣政策——財(cái)政政策的博弈17重復(fù)剔除劣策略在參與人可選擇策略大于兩個(gè)的時(shí)候,參與者可以通過剔除劣于占優(yōu)策略的其他某些策略來縮小規(guī)模,求得均衡?!爸貜?fù)剔除劣策略”就是不斷剔除劣策略,知道不能進(jìn)一步剔除為止的過程,如果這個(gè)過程只剩下唯一的結(jié)果,則這個(gè)博弈就是“占優(yōu)可解”,這個(gè)結(jié)果就是納什均衡。18弱的劣策略剔除如上表,對(duì)于行而言,“下”弱優(yōu)占于“上”,對(duì)于列而言,“右”弱優(yōu)占于“左”,這樣,我們使用占優(yōu)可解時(shí),獲得的納什均衡是(下,右),但是(上,右)和(下,左)也是納什均衡,所以運(yùn)用若占優(yōu)來剔除某些策略時(shí),要逐格檢查單元格。表4-7弱的劣策略的剔除194.4最優(yōu)反應(yīng)分析1920最優(yōu)反應(yīng)分析:根據(jù)其他人的可選策略來決定自己在別人的決策下的最優(yōu)策略,是一種全面搜索納什均衡的方法。4.4最優(yōu)反應(yīng)分析214.5零和博弈的最大值最小值方法2122Max=10Min=2Min=5.6Min=1Min=-2Max=5.6Max=13在零和博弈中,博弈雙方的利益是完全對(duì)立的,對(duì)手的最優(yōu)策略對(duì)自己則是最不利的,于是參與者會(huì)從最糟糕的選擇中選出最好的結(jié)果。基于之一特征,我們使用最小最大值方法來替代最優(yōu)反應(yīng)分析。4.5零和博弈的最大值最小值方法234.6三人參與的博弈234.6三人參與的博弈該博弈的三個(gè)參與人Emily,Nina和Talia分別要決定是否為花園的新建作貢獻(xiàn)。若三人同時(shí)都作貢獻(xiàn),花園是最大和最美的;若只有兩人作貢獻(xiàn),花園的規(guī)模和美麗程度中等;若僅一人作貢獻(xiàn)花園是最小的且不美麗。純策略納什均衡的分析方法適用于包含任何數(shù)目參與人的同時(shí)行動(dòng)博弈。兩人博弈三人博弈:街心花園博弈很顯然,三者都希望自己能做出盡可能小的貢獻(xiàn)的同時(shí)獲得最大的效用,然而她們?cè)谶x擇是否作貢獻(xiàn)時(shí)都不清楚對(duì)方的行動(dòng),這是一個(gè)三人參與的同時(shí)行動(dòng)博弈。4.6三人參與的博弈我們通過兩個(gè)頁面來表示街心花園博弈的三維支付表。Talia作貢獻(xiàn)Talia不作貢獻(xiàn)4.6三人參與的博弈1.考察各個(gè)參與人是否存在占優(yōu)策略Talia作貢獻(xiàn)
Talia不作貢獻(xiàn)從Emily角度看,論其他人如何選擇,她的最優(yōu)選擇都是不作貢獻(xiàn)。同樣的,Nina和Talia的占優(yōu)策略也是不作貢獻(xiàn)。所以,納什均衡:三人都選擇不作貢獻(xiàn)。4.6三人參與的博弈2.使用逐個(gè)單元格檢查的方法例如我們考察支付結(jié)果為(3,3,6)的這一個(gè)單元格Talia作貢獻(xiàn)
Talia不作貢獻(xiàn)
Emily和Nina均可以通過單邊改變策略使自己情況變好,從而確定該單元格非納什均衡的結(jié)果。4.6三人參與的博弈3.用最優(yōu)反應(yīng)策略分析Talia作貢獻(xiàn)Talia不作貢獻(xiàn)294.7純策略博弈的多重均衡294.7純策略博弈的多重均衡我們用協(xié)調(diào)博弈來說明有些博弈可能包含多個(gè)均衡的情況,其中參與人之間存在某些共同但不完全一致的利益,但由于他們的決策是相互獨(dú)立的。要協(xié)調(diào)一致以達(dá)到共同偏好的結(jié)構(gòu)并不容易。現(xiàn)在我們?cè)O(shè)想有這樣一件事,兩個(gè)大學(xué)生Sally和Harry在圖書館相遇并且聊得非常愉快。待要各自回教室上課時(shí),兩人還意猶未盡,于是相約4:30下課后兩人一起喝咖啡??墒莾扇嘶厝ズ蟀l(fā)現(xiàn)剛剛忘記約定見面的地方,兩個(gè)可能的地方——星巴克和本地咖啡店位于相反的地方,所以不能同時(shí)去到,兩人因?yàn)榻粨Q手機(jī)號(hào)碼而又無法聯(lián)系,他們?cè)撛趺催x擇呢?OR4.7.1Harry會(huì)遇見Sally嗎?完全協(xié)調(diào)博弈采取哪一種行動(dòng)不重要,重要的是行動(dòng)要協(xié)調(diào)一致——所以將該博弈稱為完全協(xié)調(diào)博弈。然而,他們能夠行動(dòng)統(tǒng)一么?4.7.2Harry會(huì)遇見Sally嗎?在哪兒遇見?安全博弈假設(shè)他們都更喜歡本地咖啡店,那么我們將他們?cè)诒镜乜Х鹊晗嘤龅闹Ц陡臑?,如下表所示當(dāng)且僅當(dāng)參與人對(duì)對(duì)方選擇適當(dāng)?shù)男袆?dòng)具有充分信心時(shí),才能達(dá)到雙方都更偏好的均衡,因此,這個(gè)博弈又稱為安全博弈。4.7.3Harry會(huì)遇見Sally嗎?在哪兒遇見?性別戰(zhàn)假設(shè)兩個(gè)參與人渴望相遇,但他們分別喜歡的是不同的咖啡店。若在星巴克相遇,Harry可以達(dá)到為2的支付,而Sally只能得到為1的支付;若在本地咖啡店會(huì)面則相反。我們稱此新的博弈為性別戰(zhàn)。在性別戰(zhàn)中,協(xié)調(diào)失敗的風(fēng)險(xiǎn)要更大一些。在兩個(gè)納什均衡上,他們的支付是不對(duì)稱的,各自對(duì)兩個(gè)均衡的偏好是有沖突的。表現(xiàn)強(qiáng)硬與表現(xiàn)溫和4.7.4James會(huì)遇見Dean嗎?懦夫博弈懦夫博弈也是一個(gè)協(xié)調(diào)博弈,但它強(qiáng)調(diào)的是參與人要盡量避免而不是選擇那些一致的行動(dòng)。懦夫博弈的支付取決于參與人對(duì)“壞”結(jié)果的評(píng)價(jià)和認(rèn)可程度,是車毀人亡更“壞”,還是被認(rèn)為是懦夫更“壞”。下圖的支付結(jié)構(gòu)是對(duì)認(rèn)為尊嚴(yán)受損比車毀人亡好一些的情形的刻畫。354.8不存在純策略納什均衡的情形
NoEquilibriumInPureStrategies354.8不存在純策略納什均衡的情形EachofthegamesconsideredsofarhashadatleastoneNashEquilibrium(納什均衡)inpurestrategies(純策略).Unfortunately,notallgamesthatwecomeacrossinthestudyofstrategyandgametheorywillhaveaNashEquilibrium.純策略均衡不存在的情形InthisStrategyGame,whatisimportantisnotwhatplayersshoulddo,butwhatplayersshouldnotdo.Ifoneplayeralwaysengagesinone
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年全民國(guó)防教育日活動(dòng)總結(jié)
- 2024年婦產(chǎn)科醫(yī)生年度個(gè)人工作總結(jié)范文
- 2024年學(xué)校校本研修工作總結(jié)
- 信息資源共享模式-洞察分析
- 新型隔音材料開發(fā)-洞察分析
- 通便靈包裝設(shè)計(jì)優(yōu)化-洞察分析
- 輿情信息傳播策略-洞察分析
- 遠(yuǎn)程教育學(xué)習(xí)行為模式-洞察分析
- 網(wǎng)絡(luò)安全風(fēng)險(xiǎn)評(píng)估體系-洞察分析
- 小行星成因研究-洞察分析
- 資本論重點(diǎn)思考題參考答案
- 石化企業(yè)恐怖襲擊事件應(yīng)急預(yù)案
- 高校PPT課件:證券投資學(xué)(第五版)
- m7130平面磨床電氣控制畢業(yè)設(shè)計(jì)
- 會(huì)計(jì)基礎(chǔ)一點(diǎn)通-張志鳳
- 牙科診所復(fù)診患者就診流程圖
- 人教版初中語文名著導(dǎo)讀復(fù)習(xí)資料
- 湘藝版 四年級(jí)上冊(cè)音樂教案- 第五課 踩雨
- 魔方社團(tuán)活動(dòng)記錄-副本
- D502-15D502等電位聯(lián)結(jié)安裝圖集
- 設(shè)計(jì)風(fēng)速、覆冰的基準(zhǔn)和應(yīng)用
評(píng)論
0/150
提交評(píng)論