版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、博弈論與信息經(jīng)濟(jì)學(xué),中國(guó)科學(xué)院研究生院管理學(xué)院,張玲玲,第1章概述-生活中的處處博弈第1章非合作博弈第2章完全信息靜態(tài)信息博弈-納什均衡第3章完全信息動(dòng)態(tài)博弈-子博弈精煉納什均衡第4章不完全信息靜態(tài)博弈-貝葉斯納什均衡第5章不完全信息動(dòng)態(tài)博弈-精煉貝葉斯納什均衡第6章信息經(jīng)濟(jì)學(xué)的委托代理理論(一)第7章委托代理理論(二)第8章逆向選擇與信號(hào)傳遞, 主要內(nèi)容簡(jiǎn)介,第二章完全信息靜態(tài)信息博弈納什均衡,一個(gè)博弈的基本概念和戰(zhàn)略表達(dá),兩個(gè)顯性戰(zhàn)略均衡,三個(gè)重復(fù)淘汰的顯性均衡,四個(gè)納什均衡和五個(gè)納什均衡應(yīng)用實(shí)例,案例1囚徒困境,囚徒困境,坦白,否認(rèn),坦白,否認(rèn),顯性戰(zhàn)略均衡。 囚徒困境是對(duì)一些非常常見(jiàn)和
2、有趣的情況的抽象。在這些情況下,從個(gè)人角度來(lái)看,背叛是最好的選擇,但雙方的背叛都會(huì)導(dǎo)致不理想的結(jié)果。第二,主導(dǎo)戰(zhàn)略是平衡的,第二次世界大戰(zhàn)的勝利在望。然而,為了給自己爭(zhēng)光,一個(gè)飛行大隊(duì)的指揮官無(wú)休止地發(fā)布任務(wù)配額來(lái)提高他的下屬,這讓每個(gè)人都感到恐慌。轟炸機(jī)塞里安不想成為勝利前夕的最后一名受害者,他想盡一切辦法逃避任務(wù)。他的上級(jí)問(wèn):“如果我的士兵都像你一樣思考,我們?cè)趺创蜻@場(chǎng)仗?”但特別是塞里安回答說(shuō):“如果我不這樣想,我會(huì)不會(huì)變成一個(gè)大傻瓜?”第二,主導(dǎo)戰(zhàn)略均衡,注:如果每個(gè)人都有一個(gè)(嚴(yán)格的)主導(dǎo)戰(zhàn)略,那么主導(dǎo)戰(zhàn)略均衡是唯一可以預(yù)測(cè)的均衡。主導(dǎo)策略只要求每個(gè)參與者都是理性的,而不要求每個(gè)參與
3、者都知道其他參與者是理性的(也就是說(shuō),理性不要求是常識(shí))。為什么?第二章,完全信息靜態(tài)信息博弈納什均衡,一個(gè)博弈的基本概念和策略表達(dá),兩個(gè)顯性戰(zhàn)略均衡,三個(gè)重復(fù)淘汰的顯性均衡,四個(gè)重復(fù)淘汰的納什均衡,三個(gè)重復(fù)淘汰的顯性均衡,以及重復(fù)淘汰的嚴(yán)格劣策略:思路:首先找到一個(gè)玩家的劣策略(假設(shè)它存在),淘汰這個(gè)劣策略,重構(gòu)一個(gè)沒(méi)有淘汰策略的新博弈,然后淘汰這個(gè)新博弈中的一個(gè)。唯一剩下的戰(zhàn)略組合是這一博弈的均衡解,稱(chēng)為“重復(fù)淘汰的主導(dǎo)均衡”。三個(gè)重復(fù)排除的優(yōu)勢(shì)均衡,等待,小豬,大豬,按,等待,按,案例2-智能豬的游戲,“按”是大豬的優(yōu)勢(shì)策略,納什均衡:大豬按,小豬按,三個(gè)重復(fù)排除的優(yōu)勢(shì)均衡,M,列老師,
4、行老師,U。行:L優(yōu)于列D:沒(méi)有優(yōu)勢(shì)策略消除D,M優(yōu)于L,(U,M)是重復(fù)消除的優(yōu)勢(shì)均衡,以及三個(gè)重復(fù)消除的優(yōu)勢(shì)均衡。俾斯麥海戰(zhàn)役于1943年發(fā)生在南太平洋,日本海軍上將木村奉命將日本軍隊(duì)運(yùn)送到新幾內(nèi)亞,在此期間他不得不穿越俾斯麥海。美國(guó)海軍上將肯尼想要轟炸日本運(yùn)輸船。通過(guò)俾斯麥海到新幾內(nèi)亞有兩條路線。木村必須從中選擇一個(gè),而肯尼必須決定把他的飛機(jī)送到哪里去搜尋日本人。如果肯尼把他的飛機(jī)送錯(cuò)了路線,他可以召回它們,但是轟炸的可用天數(shù)將會(huì)減少。木村,肯尼,北,南,北,南,第二章完全信息靜態(tài)信息博弈納什均衡,基本概念和戰(zhàn)略描述一局兩優(yōu)戰(zhàn)略均衡三優(yōu)均衡重復(fù)淘汰四納什均衡五納什均衡應(yīng)用實(shí)例,四納什均衡
5、,通俗地說(shuō),納什均衡的意思是:給定你的戰(zhàn)略,我的戰(zhàn)略就是最好的戰(zhàn)略;根據(jù)我的策略,你的策略也是你最好的策略。也就是說(shuō),雙方都不愿意在給定的策略下調(diào)整自己的策略。四、納什均衡、美蘇導(dǎo)彈危機(jī)和古巴冷戰(zhàn)時(shí)期最嚴(yán)重的美蘇霸權(quán)危機(jī)。蘇聯(lián):面臨撤回導(dǎo)彈或堅(jiān)持在古巴部署導(dǎo)彈的選擇;美國(guó):挑起戰(zhàn)爭(zhēng)或容忍蘇聯(lián)的挑釁行為。結(jié)果:蘇聯(lián)從古巴撤出導(dǎo)彈,成為“撤退的雞”,而美國(guó)堅(jiān)持自己的戰(zhàn)略,成為“不撤退的雞”,但象征性地從土耳其撤出一些導(dǎo)彈,給了蘇聯(lián)一點(diǎn)面子。杜牧橋,四個(gè)納什均衡,尋找納什均衡,C2,R1,R2,C1,C3,R3,玩家B,玩家A,(R3,C3)是納什均衡,不同均衡概念之間的關(guān)系,顯性均衡DSE,重復(fù)消
6、除顯性均衡IEDE,純戰(zhàn)略納什均衡PNE,四個(gè)納什均衡,第二章完全信息基本概念和戰(zhàn)略表達(dá)一局兩個(gè)顯性戰(zhàn)略均衡三個(gè)重復(fù)拒絕顯性均衡四個(gè)納什均衡五個(gè)混合戰(zhàn)略納什均衡的存在及相關(guān)討論,五個(gè)混合戰(zhàn)略納什均衡,社會(huì)福利博弈, 流浪,無(wú)家可歸,政府,救濟(jì),沒(méi)有救濟(jì),找工作,沒(méi)有一個(gè)戰(zhàn)略組合構(gòu)成納什均衡,五個(gè)混合戰(zhàn)略納什均衡,相反,正面,背面,正面,猜謎游戲兩個(gè)孩子各拿一枚硬幣。 如果他們同時(shí)朝上或朝下,甲給乙1美分,如果只有一面朝上,乙給甲1美分。零和游戲:游戲中的玩家輸贏,但結(jié)果總是0。沒(méi)有戰(zhàn)略組合形成納什均衡,五個(gè)混合戰(zhàn)略納什均衡,警察和小偷,銀行,酒吧,警察,小偷,2萬(wàn)元,1萬(wàn)元,東,西,什么是警察
7、和小偷的最佳策略?上述博弈的特點(diǎn)是在這類(lèi)博弈中不存在純納什均衡。參與者的報(bào)酬取決于其他參與者的策略;以一定的概率分布隨機(jī)選擇不同的動(dòng)作。每個(gè)參與者都想猜測(cè)對(duì)方的策略,但每個(gè)參與者都不愿意讓對(duì)方猜測(cè)自己的策略。這個(gè)游戲是什么類(lèi)型的?如何找到平衡?五混合策略納什均衡,請(qǐng)給出一些這樣的例子:石頭,剪刀,布游戲老虎,粗棍,雞,蠕蟲(chóng)游戲撲克游戲足球游戲戰(zhàn)爭(zhēng),西,東,西,東五混合策略納什均衡,警察抽簽決定是去銀行還是去酒吧,三分之二的機(jī)會(huì)去銀行,三分之一的機(jī)會(huì)去酒吧;同樣,小偷也抽簽決定是去銀行還是去酒吧,三分之二的機(jī)會(huì)去酒吧,三分之一的機(jī)會(huì)去銀行。五混合策略納什均衡,社會(huì)福利博弈,流浪,流浪,政府,救濟(jì)
8、,無(wú)救濟(jì),找工作,集合:政府救濟(jì)的概率:1/2;無(wú)法緩解的概率:1/2。流浪漢:求職的預(yù)期效用:1/22 1/2 1=1.5流浪的預(yù)期效用:1/23 1/2 0=1.5因此,流浪漢的任何策略都是對(duì)政府混合策略、五種混合策略納什均衡、社會(huì)福利博弈、流浪者、流浪漢、政府、救濟(jì)、無(wú)救濟(jì)、求職和政府救濟(jì)的最佳回應(yīng)。流浪漢:找到工作的概率:0.2;游走概率:0.8每個(gè)參與者的策略是給定對(duì)方的混合策略的最佳策略,納什均衡的五種混合策略,消極的,積極的,消極的,積極的,兩個(gè)孩子在猜謎游戲中的最佳策略是采用每種策略??赡苄允?/2;每個(gè)孩子策略的一半是納什均衡。零和游戲,五混合戰(zhàn)略納什均衡,請(qǐng)給出一些這樣的例
9、子:石頭,剪刀,布游戲,老虎,粗棍,雞,蠕蟲(chóng)游戲,撲克游戲,足球游戲,這種游戲在戰(zhàn)爭(zhēng)中的均衡是混合戰(zhàn)略納什均衡,五混合戰(zhàn)略納什均衡,戰(zhàn)略:規(guī)則為參與者選擇行動(dòng),在給定的信息集,它規(guī)定了參與者在什么情況下選擇什么行動(dòng),是參與者的“相機(jī)行動(dòng)計(jì)劃”純戰(zhàn)略:如果一個(gè)戰(zhàn)略規(guī)定參與者只選擇一個(gè)特定的行動(dòng),在每個(gè)給定的信息下,這個(gè)戰(zhàn)略就是純戰(zhàn)略。混合策略:如果一個(gè)策略規(guī)定參與者在給定信息的情況下以一定的概率分布隨機(jī)選擇不同的行動(dòng),那么這個(gè)策略就是一個(gè)混合策略?;旌喜呗约{什均衡,混合策略:如果一個(gè)策略規(guī)定參與者在給定的信息下以一定的概率分布隨機(jī)選擇不同的行動(dòng),那么這個(gè)策略就是一個(gè)混合策略。五種混合策略納什均衡
10、,純策略可以理解為混合策略的一種特殊情況,即在許多策略中,選擇這種純策略的概率si為1,而選擇其他純策略的概率為0。等等,豬,大豬,出版社,等等,出版社,負(fù),正,負(fù),正,五混合策略納什均衡如何找到混合策略納什均衡?支付最大化與支付等價(jià)因?yàn)榛旌喜呗园殡S著支付的不確定性,參與者關(guān)心其預(yù)期效用。最優(yōu)混合策略:指使期望效用函數(shù)最大化的混合策略(給定彼此的混合策略)。在兩人博弈中,混合策略的納什均衡是兩個(gè)參與者的最優(yōu)混合策略的組合。五種混合策略納什均衡,流浪,流浪,政府,救濟(jì),不救濟(jì),找工作,也就是說(shuō),流浪漢選擇找工作的概率為0.2,流浪的概率為0.8。同樣,政府的最優(yōu)混合策略可以根據(jù)流浪漢的期望效用函
11、數(shù)來(lái)找到。支付最大化方法,五種混合策略的納什均衡,社會(huì)福利博弈,流浪,流浪,政府救濟(jì),無(wú)救濟(jì),找工作,集合:政府救濟(jì)的概率:1/2;無(wú)法緩解的概率:1/2。流浪漢:找到工作的概率:0.2;游走概率:0.8每個(gè)參與者的策略是給定對(duì)方混合策略的最優(yōu)策略。五種混合策略是納什均衡。假設(shè)最優(yōu)混合策略存在,給定不定期船的混合策略選擇(R,1- r),政府選擇純策略救濟(jì)的預(yù)期效用為3r (-1)(1-r)=4r-1。選擇無(wú)救濟(jì)的純策略的效用為-1r0 (1 4r-1=-r r=0.2,流浪,流浪,政府,救濟(jì),無(wú)救濟(jì),求職,報(bào)酬等值法,五種混合策略的納什均衡,社會(huì)福利博弈,流浪,流浪,政府,救濟(jì),無(wú)救濟(jì),求職
12、,設(shè)定:政府救濟(jì)的概率:1/2;無(wú)法緩解的概率:1/2。流浪漢:找到工作的概率:0.2;徘徊概率:0.8。每個(gè)參與者的策略是給定彼此混合策略的最佳策略。五混合策略納什均衡,正確解釋?zhuān)喝绻麩o(wú)家可歸者尋找工作的概率小于0.2,那么政府選擇不提供救濟(jì);如果它大于0.2,政府選擇救濟(jì),只有當(dāng)概率等于0.2。政府將選擇混合策略或任何純策略。解釋*=0.5如果政府救助的概率大于0.5,無(wú)家可歸者的最佳選擇是流浪;如果政府救濟(jì)的概率小于0.5,無(wú)家可歸者的最佳選擇就是找工作。五種混合策略納什均衡,混合策略納什均衡的含義:納什均衡要求每個(gè)參與者的混合策略是給定彼此的混合策略的最佳選擇。因此,在社會(huì)福利博弈中,
13、*=0.5是唯一的混合策略納什均衡。相反,如果政府認(rèn)為無(wú)家可歸者選擇找工作的概率嚴(yán)格來(lái)說(shuō)小于0.2,那么政府唯一的最佳選擇就是純粹的策略:不救濟(jì);如果政府選擇不提供救濟(jì)的概率為1,無(wú)家可歸者的最佳選擇是找工作,這將導(dǎo)致政府選擇救濟(jì)策略,而無(wú)家可歸者選擇流浪。等等。五個(gè)混合策略納什均衡,負(fù),正,負(fù),正。使用以上方法:找出這個(gè)猜謎游戲的混合策略納什均衡,并練習(xí):模擬下面的拳擊游戲:-作業(yè)3兩個(gè)老朋友一起喝酒,每個(gè)人有四個(gè)純策略:粗棍,老虎,雞和蟲(chóng)子,輸贏規(guī)則。如果一個(gè)打敗另一個(gè),獲勝的效用是1,失敗的效用是-1,否則,效用是0。寫(xiě)出這個(gè)游戲的支付矩陣。這個(gè)博弈有純戰(zhàn)略均衡嗎?計(jì)算其混合策略納什均衡
14、。第二章是完全信息靜態(tài)信息博弈納什均衡,一個(gè)博弈的基本概念和戰(zhàn)略表達(dá),兩個(gè)優(yōu)勢(shì)戰(zhàn)略均衡,三個(gè)重復(fù)消除的優(yōu)勢(shì)均衡,四個(gè)納什均衡,五個(gè)混合戰(zhàn)略納什均衡,六個(gè)納什均衡的存在性及相關(guān)討論,不同均衡概念之間的關(guān)系,優(yōu)勢(shì)均衡DSE,以及優(yōu)勢(shì)均衡IEDE的重復(fù)消除。摘要:純戰(zhàn)略納什均衡,混合戰(zhàn)略納什均衡,六種納什均衡的存在性及相關(guān)討論,納什均衡存在定理:每個(gè)有限博弈至少有一個(gè)納什均衡(純戰(zhàn)略或混合戰(zhàn)略)。六個(gè)納什均衡的存在及相關(guān)討論,一個(gè)博弈可能有多個(gè)均衡:兩個(gè)人分蛋糕;性別戰(zhàn)爭(zhēng)中的游戲;納什均衡的多重性:博弈論沒(méi)有一個(gè)通用的理論來(lái)證明納什均衡結(jié)果會(huì)出現(xiàn)。芭蕾、女、男、足球、芭蕾、足球、六個(gè)納什均衡的存在及
15、相關(guān)討論,如何保證均衡出現(xiàn):1。“聚集點(diǎn)”均衡:參與者可以使用一些抽象的信息來(lái)實(shí)現(xiàn)“聚集點(diǎn)均衡”。兩個(gè)人分蛋糕;性別戰(zhàn)爭(zhēng)中的游戲;兩個(gè)人同時(shí)互相呼叫,六個(gè)納什均衡的存在和相關(guān)的討論,2。廉價(jià)談判“協(xié)調(diào)博弈”并不能保證談判中達(dá)成協(xié)議,即使達(dá)成了協(xié)議,也不一定會(huì)被觀察到,但在某些博弈中,事先的談判實(shí)際上會(huì)出現(xiàn)一些均衡。r,b,a,u,d,l,u,d,l,聚集點(diǎn),六個(gè)納什均衡的存在及相關(guān)討論,獵人博弈及帕累托優(yōu)勢(shì):獵兔,獵人b,獵人a,獵鹿,獵兔,獵鹿,有兩個(gè)納什可以認(rèn)為:(10,10)優(yōu)于(4,4),六個(gè)納什均衡的存在及相關(guān)討論,以及大流士陰謀推翻波斯王國(guó)的故事:當(dāng)時(shí), 一群波斯貴族聚集在一起,決定推翻國(guó)王,在此期間,一些人提議休會(huì),大流士站起來(lái),大聲呼喊,說(shuō)如果休會(huì)是休會(huì),有人會(huì)去國(guó)王講故事,因?yàn)槿绻渌瞬贿@樣做。 這個(gè)反叛的故事也為協(xié)調(diào)游戲提供了一個(gè)出路。殺死國(guó)王后,貴族們想選擇自己的一個(gè)國(guó)王。他們決定不自相殘殺,而是在佛祖破曉時(shí)去山上,誰(shuí)的馬先叫他做國(guó)王。大流士的新郎篡改了這個(gè)隨機(jī)的安排,成為國(guó)王。六個(gè)納什均衡的存在性及相關(guān)討論。3
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《市場(chǎng)營(yíng)銷(xiāo)策劃概述》課件
- 《社區(qū)康復(fù)知識(shí)講座》課件
- 單位管理制度集合大全【員工管理篇】
- 單位管理制度集粹選集【人員管理篇】
- 單位管理制度范文大全人力資源管理篇
- 單位管理制度范例匯編【職員管理】
- 《藥學(xué)專(zhuān)業(yè)知識(shí)(二)》高頻考點(diǎn)
- 《證人與證人證言》課件
- 農(nóng)學(xué)新篇章模板
- 酒店設(shè)施維護(hù)與管理培訓(xùn)
- GB/T 20200-2022α-烯基磺酸鈉
- 光伏電池組件跟蹤光源的PLC控制課件
- 圓周率1000000位-完整版
- 廣東某監(jiān)理公司檢測(cè)儀器設(shè)備管理規(guī)定
- 2023財(cái)務(wù)部年度工作總結(jié)(7篇)
- ZL50型輪胎裝載機(jī)液壓系統(tǒng)
- 在線投票管理系統(tǒng)的開(kāi)題報(bào)告
- 媒介融合概論
- 2023-2024學(xué)年廣東省深圳市小學(xué)數(shù)學(xué)五年級(jí)上冊(cè)期末評(píng)估試卷
- 新求精中級(jí)I聽(tīng)力原文
- 煤礦安全管理機(jī)構(gòu)結(jié)構(gòu)圖
評(píng)論
0/150
提交評(píng)論