版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、2014年11月14日任 光博弈與策略二、博弈與策略一、博弈論的相關(guān)概念三、混合策略納什均衡小結(jié)博弈與策略四、完全信息動(dòng)態(tài)博弈五、不完全信息博弈薩繆爾森:你要想在現(xiàn)代社會(huì)做一個(gè)有價(jià)值的人,就必須對(duì)博弈論有個(gè)大致的了解一、博弈論的相關(guān)概念沒(méi)有選擇就沒(méi)有繁榮有選擇 就有優(yōu)化一、博弈論的相關(guān)概念有選擇 就有博弈現(xiàn)代社會(huì),時(shí)時(shí)有選擇,處處有博弈博弈就是優(yōu)化石頭-剪刀-布一、博弈論的相關(guān)概念 用簡(jiǎn)單的例子,說(shuō)明博弈論的解題基本框架與要素石頭-剪刀-布1. 局中人2. 策略空間3. 盈利函數(shù) 局中人 2 0 2 5 局 中 人 1 0 0, 0+1,-1-1,+1 2-1,+10, 0+1,-1 5+1,
2、-1-1,+10, 0一、博弈論的相關(guān)概念零和博弈局中人、策略空間、盈利函數(shù)靜態(tài)分析動(dòng)態(tài)分析(博弈思維的分析)AB1/2肯德基很紅火例:海灘小販01B3/4A1/4一、博弈論的相關(guān)概念根據(jù)博弈論:決策結(jié)果, “麥當(dāng)勞”就開(kāi)在肯德基 旁邊用例子,說(shuō)明博弈論的思維方式類似的例子航空公司航班的安排電視臺(tái)節(jié)目之間的競(jìng)爭(zhēng)一、博弈論的相關(guān)概念 馮諾依曼和摩根斯頓1944年出版博弈論與經(jīng)濟(jì)行為 納什(John Nash),海薩尼(John C. Harsanyi)澤爾滕(R. Selten)因?qū)Σ┺恼摰淖吭截暙I(xiàn),1994年獲得諾貝爾獎(jiǎng)海薩尼 納什澤爾滕 一、博弈論的相關(guān)概念一、博弈論的相關(guān)概念n 人博弈的一
3、般數(shù)學(xué)表示局中人: N=1,2,n策略集: S1,S2,Sn決策集: DS=S1S2Sn盈利函數(shù): f1, f2,fn:DR用一個(gè)熟悉的例子,解釋博弈的數(shù)學(xué)表示田忌賽馬一、博弈論的相關(guān)概念案例:田忌賽馬局中人: N=齊王,田忌,一、博弈論的相關(guān)概念案例:田忌賽馬局中人: N=齊王,田忌,齊王策略集: S齊= (上中下),(中下上),(下上中), (上下中),(中上下),(下中上)決策集: DS=S齊S田盈利函數(shù): f齊(上中下), (下上中)=0 f田(上中下), (下上中)=1 田忌策略集: S田=(上中下),(中下上),(下上中), (上下中),(中上下),(下中上)囚徒困境(Prison
4、ers Dilemma)1.局中人2.策略空間3.盈利函數(shù)二、博弈與策略囚徒困境(Prisoners Dilemma)5, 5交代不交代交代不交代8 , 00 , 81 , 1囚徒 1囚徒21. 考慮問(wèn)題的方法:知人者智二、博弈與策略5, 5交代不交代交代不交代8 , 00 , 81 , 1囚徒 1囚徒 2引進(jìn)記號(hào)系統(tǒng)1. 考慮問(wèn)題的方法:知人者智二、博弈與策略在競(jìng)爭(zhēng)對(duì)手的選擇決定后,博弈方選擇自己的最好的策略。如果均衡存在,就是納什均衡。2.納什均衡 廠商B 做廣告 不做廣告 廠商A 做廣告 10,5 15,0 不做廣告 6,8 10,2 廣告博弈的得益矩陣二、博弈與策略猜硬幣游戲 B 正面
5、 反面 A 正面 -1,+1 +1,-1 反面 +1,-1 -1,+1 猜硬幣游戲的得益矩陣2.納什均衡二、博弈與策略簡(jiǎn)單納什均衡不存在的例子存在混合納什均衡A和B各出一枚硬幣5, 5交代不交代交代不交代8 , 00 , 81 , 1Prisoner 1Prisoner 2囚徒困境的得益矩陣2. 納什均衡雙方都選擇交代,是納什均衡二、博弈與策略Cost to press button = 2 unitsWhen button is pressed, food given = 10 units智豬博弈(boxed pig game) 二、博弈與策略5 , 1PressWaitPressWait9
6、 , -14 , 40 , 0Little PigBigPig2.納什均衡假設(shè)對(duì)方選定,選自己收益最大的策略二、博弈與策略對(duì)某博弈方來(lái)說(shuō),不管其他博弈方采取什么策略,他所采取的策略,能給他帶來(lái)最大得益 兩家廠商都選擇做廣告的策略。 廠商B 做廣告 不做廣告 廠商A 做廣告 10,5 15,0 不做廣告 6,8 10,2 廣告博弈的得益矩陣3. 上策二、博弈與策略5 , 1PressWaitPressWait9 , -14 , 40 , 0Little PigBigPig3. 上策小豬有上策,大豬沒(méi)有上策二、博弈與策略搭便車(Free rider),農(nóng)村修路多勞不多得,少勞不少得5, 5交代不交
7、代交代不交代8 , 00 , 81 , 1Prisoner 1Prisoner 2囚徒困境的得益矩陣3. 上策雙方都選擇交代,也是上策均衡4.多個(gè)納什均衡的博弈 新興產(chǎn)業(yè)市場(chǎng) 在位企業(yè) 允 許 不允許 進(jìn) 入 40,50 -10,5 不進(jìn)入 0 ,200 0,200 市場(chǎng)進(jìn)入博弈 潛在企業(yè)存在兩個(gè)納什均衡博弈雙方都沒(méi)有上策在給定競(jìng)爭(zhēng)對(duì)手的選擇行為后,博弈方選擇了自己的最好的策略5.上策均衡與納什均衡每一個(gè)上策均衡一定是納什均衡,但并非每一個(gè)納什均衡都是上策均衡。上策均衡是納什均衡的特例。 廠商B 做廣告 不做廣告 廠商A 做廣告 10,5 15,0 不做廣告 6,8 10,2 廣告博弈的得益矩
8、陣5 , 1PressWaitPressWait9 , -14 , 40 , 0Little PigBigPig是納什均衡,不是上策均衡二、博弈與策略5.上策均衡與納什均衡6. 極大化極小策略論語(yǔ)不患人之不己知,患不知人也。二、博弈與策略6. 極大化極小策略在最小得益中求取得益的“最大化” 博弈方2 左 右 上 2,0 1,1 下 -1000,0 3,1 極大化極小策略博弈方1納什均衡中的問(wèn)題如果博弈方2選擇懲罰策略博弈方1損失巨大為規(guī)避風(fēng)險(xiǎn),可選擇極大化極小策略存在納什均衡,博弈方2有上策6. 極大化極小策略博弈方1和博弈方2如果都采取極大化極小策略,均衡解就是(1,1); 而(3,1)是唯
9、一的納什均衡。 在最小得益中求取得益的“最大化”。 博弈方2 左 右 上 2,0 1,1 下 -1000,0 3,1 極大化極小策略博弈方1 博弈方2 左 右 上 2,0 1,1 下 -1000,0 3,1 極大化極小策略博弈方1納什均衡假設(shè)對(duì)方選我收益最小的策略假設(shè)對(duì)方選定,我選自己收益最大的策略楊佳襲警案知人者智,不知人者傻楊佳選擇啥策略?1980年8月27日生,漢族,北京市人。中專文化程度,未婚,無(wú)正當(dāng)職業(yè)。 2007年10月5日晚,楊佳騎一輛無(wú)牌無(wú)證自行車,被民警盤查 督察支隊(duì)兩次赴京對(duì)楊佳進(jìn)行法制宣傳和疏導(dǎo)勸解工作 6.極大化極小策略誰(shuí)更傻?為啥?7. tit for tat(對(duì)等策
10、略)定價(jià)博弈 “對(duì)等策略”: 廠 商2 低價(jià) 高價(jià) 低價(jià) 24,24 40,8 高價(jià) 8,40 32,32 定價(jià)博弈廠商1廠商1定高價(jià),只要對(duì)方合作也會(huì)定高價(jià)廠商1就會(huì)一直保持高價(jià)任何一方定低價(jià),另一廠商也會(huì)跟著定低價(jià)7. tit for tat(對(duì)等策略)定價(jià)博弈 “對(duì)等策略”:孟子君之視臣如手足,則臣視君如腹心;君之視臣如犬馬,則臣視君如國(guó)人;君之視臣如土芥,則臣視君如寇仇君要臣死,臣不死是為不忠;父叫子亡,子不亡則為不孝。8. 序列博弈 廠 商2 多糖型 少糖型 多糖型 -5,-5 10,20 少糖型 20,10 -5,-5 產(chǎn)品選擇博弈 廠 商1一方在決策時(shí),會(huì)考慮到另一方的反應(yīng)行為,
11、并在此基礎(chǔ)上進(jìn)行自己的當(dāng)前決策通過(guò)博弈分析,可知廠商1的最佳策略是選擇生產(chǎn)少糖型飲料,廠商2則生產(chǎn)多糖型飲料。 多糖型 -5,-5 多糖型 廠商2 少糖型 10,20 多糖型 20,10 少糖型 廠商2 少糖型 -5,-5廠商1(1)(2)(2)9. 不完全信息博弈(貝葉斯均衡) 在位企業(yè) 在位企業(yè) 默 許 斗 爭(zhēng) 默 許 斗 爭(zhēng) 進(jìn) 入 40,50 -10,0 進(jìn) 入 30,100 -10,140 不進(jìn)入 0,300 0,300 不進(jìn)入 0,400 0,400 (a)高成本情況 (b)低成本情況 市場(chǎng)進(jìn)入博弈上圖的博弈中,在位企業(yè)屬于高成本類型的企業(yè)的概率大于0.2時(shí),潛在企業(yè)選擇進(jìn)入才是最
12、優(yōu)的。 潛在企業(yè)潛在企業(yè)在給定自己類型和對(duì)手類型的概率分布的情況下,每個(gè)參與者的期望效用達(dá)到了最大化,從而沒(méi)有參與者愿意改變自己的行為或策略。三、混合策略納什均衡 廠商B 做廣告 不做廣告 廠商A 做廣告 10,5 15,0 不做廣告 6,8 10,2 廣告博弈的得益矩陣納什均衡回顧猜硬幣游戲 B 正面 反面 A 正面 -1,+1 +1,-1 反面 +1,-1 -1,+1 猜硬幣游戲的得益矩陣三、混合策略納什均衡猜硬幣游戲 B 正面 反面 A 正面 -1,+1 +1,-1 r 反面 +1,-1 -1,+1 1-r q 1-q如果q0.5,局中人A取r=0局中人A的期望收益=+1q+(-1)(1
13、-q)=2q-1三、混合策略納什均衡猜硬幣游戲 B 正面 反面 A 正面 -1,+1 +1,-1 r 反面 +1,-1 -1,+1 1-r q 1-q如果q0.5,局中人A取r=0局中人A的最佳策略RA(q)如果q=0.5,局中人A取0r1期望收益1-2q2q-1三、混合策略納什均衡猜硬幣游戲 B 正面 反面 A 正面 -1,+1 +1,-1 r 反面 +1,-1 -1,+1 1-r q 1-q如果r0.5,局中人B取q=1局中人B的最佳策略RB(r)期望收益1-2r2r-1期望收益1-2q2q-1局中人B的期望收益=-1r+1(1-r)=1-2r局中人A的期望收益=+1r+(-1)(1-r)
14、=2r-1三、混合策略納什均衡猜硬幣游戲 B 正面 反面 A 正面 -1,+1 +1,-1 r 反面 +1,-1 -1,+1 1-r q 1-q如果r0.5,局中人B取q=1局中人B的最佳策略RB(r)如果r=0.5,局中人B取0q1期望收益1-2r2r-1期望收益1-2q2q-1三、混合策略納什均衡猜硬幣游戲 B 正面 反面 A 正面 -1,+1 +1,-1 r 反面 +1,-1 -1,+1 1-r q 1-qA取r=0.5,B最佳對(duì)策也是取q=0.5驗(yàn)證22112展開(kāi)博弈樹(shù)四、完全信息動(dòng)態(tài)博弈四、完全信息動(dòng)態(tài)博弈. 后退歸納法2C12(2,0)(1,1)(0,0.5)(2,2)(3,1)L
15、BAEDFR市場(chǎng)進(jìn)入阻撓博弈 在位企業(yè) 默 許 斗 爭(zhēng) 進(jìn) 入 40,50 -10,0 不進(jìn)入 0,300 0,300 市場(chǎng)進(jìn)入博弈潛在企業(yè) 在位企業(yè) 默 許 斗 爭(zhēng) 進(jìn) 入 40,50 -10,0 不進(jìn)入 0,300 0,300 市場(chǎng)進(jìn)入博弈潛在企業(yè)姑娘戀愛(ài),父親干涉 父親 斷絕 不斷絕 愛(ài)下去 70,-100 100,-20 兩 斷 -100,20 -100, 20 愛(ài)情博弈姑娘五、不完全信息博弈(貝葉斯均衡) 在位企業(yè) 在位企業(yè) 默 許 斗 爭(zhēng) 默 許 斗 爭(zhēng) 進(jìn) 入 40,50 -10,0 進(jìn) 入 30,100 -10,140 不進(jìn)入 0,300 0,300 不進(jìn)入 0,400 0,400 (a)高成本情況 (b)低成本情況 市場(chǎng)進(jìn)入博弈上圖的博弈中假定在位企業(yè)屬于高成本類型的企業(yè)的概率大于0.2,潛在企業(yè)選擇進(jìn)入才是最優(yōu)的。 潛在企業(yè)潛在企業(yè)貝葉斯納什均衡 在位企業(yè) 在位企業(yè) 默 許 斗 爭(zhēng) 默 許 斗 爭(zhēng) 進(jìn) 入 40,50 -10,0 進(jìn) 入 30,100
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025安徽省建筑安全員-B證考試題庫(kù)附答案
- 2025湖南省安全員A證考試題庫(kù)及答案
- 2025年甘肅省安全員知識(shí)題庫(kù)及答案
- 建設(shè)施工檢查重點(diǎn)(課件)
- 《口才與溝通》課件
- DB61T-巖溶熱儲(chǔ)地?zé)嵛菜毓嗉夹g(shù)要求編制說(shuō)明
- 三年級(jí)關(guān)聯(lián)詞的使用
- 七年級(jí) 銷售打折應(yīng)用題
- 路基的基本性質(zhì)教學(xué)課件
- 單位人力資源管理制度佳作匯編十篇
- Unit 5 Dinner's ready Read and write(說(shuō)課稿)-2024-2025學(xué)年人教PEP版英語(yǔ)四年級(jí)上冊(cè)
- 第3章智能網(wǎng)聯(lián)汽車高精度地圖與定位技術(shù)
- 2018年國(guó)家公務(wù)員行測(cè)考試真題-省級(jí)(含答案)
- 2024中華人民共和國(guó)學(xué)前教育法學(xué)習(xí)解讀課件
- 計(jì)量經(jīng)濟(jì)學(xué)復(fù)習(xí)資料-概念和問(wèn)答
- 2024年秋新人教PEP版3年級(jí)上冊(cè)英語(yǔ)教學(xué)課件 Unit 4 第4課時(shí) Part B Let's talk
- 企業(yè)發(fā)展部部門管理手冊(cè)
- 2024新版(外研版三起孫有中)三年級(jí)英語(yǔ)上冊(cè)單詞帶音標(biāo)
- 2023年員工手冊(cè)范本(適用于公司全體員工手冊(cè))
- 2025屆安徽省合肥市一六八中高二數(shù)學(xué)第一學(xué)期期末經(jīng)典試題含解析
- 自來(lái)水廠考試題庫(kù)單選題100道及答案解析
評(píng)論
0/150
提交評(píng)論