




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第十章 博弈論初步第一部分 教材配套習(xí)題本習(xí)題詳解一、簡答題什么是納什均衡?納什均衡一定是最優(yōu)的嗎?解答:()所謂納什均衡,是參與人的一種策略組合,在該策略組合上, 任何參與人單獨(dú)改變策略都不會得到好處。()不一定。如果納什均衡存在,納什均衡可能是最優(yōu)的,也可能不是最優(yōu)的。例如,在存在多個納什均衡的情況下,其中有一些納什均衡就不是 最優(yōu)的;即使在納什均衡是唯一時,它也可能不是最優(yōu)的,因?yàn)榕c它相對應(yīng)的支付組合可能會小于與其他策略組合相對應(yīng)的支付組合。如:囚徒 困境。在只有兩個參與人且每個參與人都只有兩個策略可供選擇的情況下, 純策略的納什均衡最多可有幾個?為什么?解答:在只有兩個參與人 (如 和
2、 )且每個參與人都只有兩個策略可供選擇的情況下,純策略的納什均衡最多可有四個。例如,當(dāng)與的支付矩陣可分別表示如下時,總的支付矩陣中所有四個單元格的兩個數(shù)字均有下劃線,從而,總共有四個納什均衡。A的支付矩陣B的支付矩陣?yán)纾篴11=a12=a21=a22,b11=b12=b21=b22就會得到以上四個納什均衡。具體事例為: 在只有兩個參與人且每個參與人都只有兩個策略可供選擇的情況下,純策略的納什均衡可能有三個。試舉一例說明。解答:在只有兩個參與人且每個參與人都只有兩個策略可供選擇的情況下,純策略的 納什均衡可能有個、個、個、個和0個五種情況,所以可能有個。例如,當(dāng)參與 人與的支付矩陣可分別表示如
3、下時,總的支付矩陣中恰好有三個單元格的兩個數(shù)字均有下劃線,從而,總共有三個納什均衡。A的支付矩陣B的支付矩陣A、B共同的支付矩陣 具體事例為: 在只有兩個參與人且每個參與人都只有兩個策略可供選擇的情況下,如何找到所 有的純策略納什均衡?解答:可使用條件策略下劃線法。具體步驟如下:首先,把整個博弈的支付矩陣分解 為兩個參與人的支付矩陣;其次,在第一個 (即位于整個博弈矩陣左方的)參與人的支付矩陣中,找出每一列的最大者,并在其下畫線;再次,在第二個 (在位于整個博弈矩陣上 方的)參與人的支付矩陣中,找出每一行的最大者,并在其下畫線;然后,將已經(jīng)畫好線的兩個參與人的支付矩陣再合并起來,得到帶有下劃線
4、的整個博弈的支付矩陣;最后,在帶有下劃線的整個的支付矩陣中,找到兩個數(shù)字之下均畫有線的支付組合。由該支付組合 代表的策略組合就是博弈的納什均衡。設(shè)有、兩個參與人。對于參與人的每一個策略,參與人的條件策略有無 可能不止一個?試舉一例說明。解答:例如,在如表的二人同時博弈中,當(dāng)參與人 選擇上策略時,參與人 既可以選擇左策略,也可以選擇右策略,因?yàn)樗藭r選擇這兩個策略的支付是完全一樣 的。因此,對于參與人的上策略,參與人的條件策略有兩個,即左策略和右策略。 表如果無論其他人選擇什么策略,某個參與人都只選擇某個策略,則該策略就是該參與人的絕對優(yōu)勢策略 (簡稱優(yōu)勢策略)。試舉一例說明某個參與人具有某個優(yōu)
5、勢策略的情況。解答:例如,在如表的二人同時博弈中,無論參與人 是選擇上策略還是選擇下策略,參與人總是選擇左策略,因?yàn)樗藭r選擇左策略的支付總是大于選擇右策略。因此,在這一博弈中,左策略就是參與人的絕對優(yōu)勢策略。同時下策略是的絕對優(yōu)勢策略。 表混合策略博弈與純策略博弈有什么不同?解答:在純策略博弈中,所有參與人對策略的選擇都是 “確定”的,即總是以100的可能性來選擇某個策略,而在混合策略博弈中,參與人則是以一定的可能性來選擇某個策略,又以另外的可能性選擇另外一些策略。在這種情況下,參與人選擇的就不再是原來的100的確定策略 (如上策略或下策略),而是一個概率向量 (如以某個概率選擇上策略,以另
6、外一個概率選擇下策略)。純策略博弈可以看成是混合策略博弈的一種特例。條件混合策略與條件策略有什么不同?解答:例如,在一個只包括參與人 與參與人 的二人同時博弈中,參與人的條件策略是在選擇某個既定策略時所選擇的可以使其支付達(dá)到最大的策略。相應(yīng)地, 參與人的條件混合策略是在選擇某個既定的混合策略時所選擇的可以使其期望支付達(dá)到最大的混合策略?;旌喜呗约{什均衡與純策略納什均衡有什么不同?解答:在純策略博弈中,納什均衡是參與人的一種策略組合,在該策略組合上,任何 參與人單獨(dú)改變其策略都不會得到好處。在混合策略博弈中,納什均衡是參與人的一種概率向量組合,在該概率向量組合上, 任何參與人單獨(dú)改變其概率向量都
7、不會得到好處。10設(shè)某個純策略博弈的納什均衡是有限的。試問:相應(yīng)的混合策略博弈的納什均衡會是無限的嗎?試舉一例說明。解答:當(dāng)純策略博弈的納什均衡為有限時,相應(yīng)的混合策略博弈的納什均衡既可能是有限的,也可能是無限的。例如,在只包括與的二人同時博弈中,混合策略納什均衡的 “集合”可以是單位平面、三條線段、兩條線段、一條線段、三個點(diǎn)、兩個點(diǎn)和一個點(diǎn),其中,前四種情況就意味著存在無限多個納什均衡。11在完全信息動態(tài)博弈中,納什均衡與逆向歸納策略有什么不同?解答:與同時博弈一樣,在序貫博弈中,納什均衡也是指這樣一些策略組合,在這些 策略組合中,沒有哪一個參與人會單獨(dú)改變自己的策略。同樣,在序貫博弈中,納
8、什均衡 也可能不止一個。在這種情況下,可以通過逆向歸納法對納什均衡進(jìn)行 “精煉”,即從多個納什均衡中,排除掉那些不合理的納什均衡,或者,從眾多的納什均衡中進(jìn)一步確定“更好”的納什均衡。經(jīng)由逆向歸納法的精煉而得到的納什均衡就是所謂的逆向歸納策略。二、論述題1設(shè)某個純策略博弈的納什均衡不存在。試問:相應(yīng)的混合策略博弈的納什均衡會存在嗎?試舉一例說明。解答:在同時博弈中,純策略的納什均衡可能存在,也可能不存在,但相應(yīng)的混合策略納什均衡總是存在的。例如,在表的二人同時博弈中,根據(jù)條件策略下劃線法可 知,由于沒有一個單元格中兩個數(shù)字之下均有下劃線,故純策略的納什均衡不存在,但是,相應(yīng)的混合策略納什均衡卻
9、是存在的。 表B的策略q1左策略1-q1右策略A的策略p1上策略3,67,31-P1下策略9,22,8首先,分別計(jì)算與的條件混合策略。EA3p1q19p1(1q1)7(1p1)q12(1p1)(1q1)3p1q19p19p1q17q17p1q122q12p12p1q17p111p1q15q12p1(711q1)5q12EB6p1q12p1(1q1)3(1p1)q18(1p1)(1q1)6p1q12p12p1q13q13p1q188q18p18p1q19p1q185q16p1q1(9p15)6p18其次,分別計(jì)算A和B的條件混合策略。p1 q1 最后,混合策略納什均衡參見圖中的點(diǎn)。圖2在下面的博
10、弈樹中 (見圖),確定納什均衡和逆向歸納策略。解答:納什均衡和逆向歸納策略都是同一個,即與支付向量 (,)相應(yīng)的策略組合(決策,決策)。圖3用逆向歸納法確定下面的 “蜈蚣博弈”的結(jié)果 (見圖)。在該博弈中,第 步是決策:如果決定結(jié)束博弈,則得到支付,得到支付,如果決定繼續(xù)博 弈,則博弈進(jìn)入到第步,由做決策。此時,如果決定結(jié)束博弈,則得到支付, 得到支付,如果決定繼續(xù)博弈,則博弈進(jìn)入到第步,又由做決策,如此等等, 直到最后,博弈進(jìn)入到第9999步,由做決策。此時,如果決定結(jié)束博弈,則得 到支付9999,得到支付;如果 決定繼續(xù)博弈,則 得到支付,得到支付10000。圖解答:首先考慮第9999步
11、的決策。此時,肯定會結(jié)束博弈結(jié)束博弈 可以 得到支付9999,否則只能得到0。于是,我們可以把該博弈中最后一條水平線段刪除;其次考慮第9998步的決策。此時,也肯定會結(jié)束博弈,結(jié)束博弈可以得到,9998, 否則只能得到0。于是,我們可以把該博弈中倒數(shù)第二條水平線段 (以及它后面的最后一 條垂直線段)也刪除。這樣倒推下來的結(jié)果是,任何一個人在輪到自己決策時都會決定結(jié)束博弈。因此,整個博弈的結(jié)果是:在第步,就決定結(jié)束博弈,于是,得到,得到。4在圖103所示的情侶博弈中,如果將第二個支付向量 (0,0)改為 (0,1.5), 納什均衡和逆向歸納法策略會有什么變化?改為 (0,1)呢?解答:(1)當(dāng)?shù)?/p>
12、二個支付向量不變,仍然為 (,)時,有兩個納什均衡,即 (足球,足球)和 (芭蕾,芭蕾),逆向歸納策略為 (足球,足球)。 (2)將第二個支付向量由 (0,0)改為 (0,1.5)后,納什均衡和逆向歸納法策略都是 (芭蕾,芭蕾)。(3)如果將第二個支付向量改為 (0,1),則納什均衡仍然為(足球,足球)和 (芭蕾,芭蕾),但逆向歸納法失效:當(dāng)男方選擇芭蕾時,女方也選擇芭蕾,從而,男方可得 到支付,但是,當(dāng)男方選擇足球時,女方既可以選擇足球,也可以選擇芭蕾,如果女方 選擇足球,則男方可以得到更大的2,如果女方選擇芭蕾,則男方只能得到更小的0。圖5.在只有兩個參與人且每個參與人都有三個策略可供選擇
13、的情況下,純策略的納什均衡最多可有幾個?解答:在只有兩個參與人且每個參與人都只有三個策略可供選擇的情況下,純策略的納什均衡最多可有九個。例如,當(dāng)參與人與的策略不同,但各自的支付相同,則有九個支付相同的納什均衡。6.設(shè)有兩個參與人x 和y。x 有兩個純策略x1 和x2,y 有兩個純策略y1 和y2。當(dāng)y 選擇y1 和y2 時,x 選擇x1 得到的支付分別為x11 和x12,選擇x2 得到的支付分別為x21 和x22;當(dāng)x 選擇x1 和x2 時,y 選擇y1 得到的支付分別為y11 和y21,選擇y2 得到的支付分別為y12和y22。(1)試給出相應(yīng)的博弈矩陣。(2)這種博弈矩陣的表示是唯一的嗎?
14、 為什么?解答:(1)x的支付矩陣B的支付矩陣A、B共同的支付矩陣(2) 這種博弈矩陣的表示不是唯一的。也可以表示為以下形式:y的策略y1策略y1策略x的策略x1策略x11, y11x12, y12x2策略x21, y21x22, y227. 根據(jù)表10-1的二人同時博弈模型求:(1)參與人A與B的期望支付(2)參與人A與B的條件混合策略。(3)納什均衡。表101B的策略q11-q1左策略右策略A的策略p1上策略3,21,11-p1下策略0,02,3解答(1)分別計(jì)算與的期望支付:EA3p1q1p1(1q1)0(1p1)q12(1p1)(1q1)3p1q1p1p1q122q12p12p1q14
15、p1q1p12q12p1(4q11)-2q12EB2p1q1p1(1q1)0(1p1)q13(1p1)(1q1)2p1q1p1p1q133q13p13p1q14p1q13q12p13q1(4p13)2p13(2)分別計(jì)算A和B的條件混合策略。(3)混合策略納什均衡見圖中e和m點(diǎn)q1 1 eB的條件混 A的條件混合策略曲線 合策略曲線1/4 m 0 3/4 1 p18.根據(jù)表10-的二人同時博弈模型求:(1)參與人A與B的期望支付(2)參與人A與B的條件混合策略。(3)納什均衡。8. 表102B的策略q11-q1左策略右策略A的策略p1上策略3,02,11-p1下策略3,21,1解答(1)分別計(jì)
16、算與的期望支付:EA3p1q12p1(1q1)3(1p1)q1 (1p1)(1q1)3p1q12p12p1q13 q13 p1q1+1p1- q1p1q1-p1q1+p1+2q11p1(1q1)+2q11EB0p1q1p1(1q1)2(1p1)q1 (1p1)(1q1)p1p1q12 q12 p1q1+1p1- q1p1q1-2p1q1q11q1(12p1)1(2)分別計(jì)算A和B的條件混合策略。(3)虛線MBC為A的條件混合策略曲線,實(shí)線MDNC為A的條件混合策略曲線,混合策略納什均衡為圖中線段重合部分MD段,重合部分MD段部分上每一點(diǎn)都代表一個混合策略納什均衡, C點(diǎn)也是混合策略納什均衡。納
17、什均衡為(p1,1-p1),(q1,1-q1)=(0,0.5,0.5,1,(1,0) ),(1,0)(0,1)q11 M D B B的條件混 A的條件混合策略曲線 合策略曲線 N C0 1/2 1 p19. 根據(jù)圖10 4的博弈樹模型求: (1)納什均衡。(2)逆向歸納策略。決策384參與人Bd決策1b決策422參與人A ae決策311f決策2c參與人B決策448g圖104解答(1)納什均衡是(8,4),(4,8)。這個結(jié)論可以通過下劃線方法得到。也可以通過納什均衡定義得到這個結(jié)論。若當(dāng)前策略組合是d,參與人A選擇對策1時,參與人B改變策略,由決策3改為決策4,策略組合變?yōu)閑,顯然參與人B支付
18、減少,參與人B不會改變決策。若當(dāng)前策略組合是d,參與人B選擇決策3,參與人A也不會改變對策1的對策。所以d(8,4)是納什均衡。同理,g點(diǎn)也是納什均衡。B的策略決策3決策4A的策略決策18,42,2決策21,14,8(2)逆向歸納策略是(8,4)。逆向歸納法第一步,在d和e中進(jìn)行選擇,刪除e,選擇d;在f和g中進(jìn)行選擇,刪除f,選擇g。逆向歸納法第二步,在d和g中進(jìn)行選擇,由于參與人A具有先行優(yōu)勢,參與人A選擇決策1,參與人B只能選擇決策3。所以d(8,4)是逆向歸納策略。10. 根據(jù)圖10 5的博弈樹模型求:(1)納什均衡。 (2)逆向歸納策略。決策348參與人Bd決策1b決策411參與人A ae決策322f決策2c參與人B決策484g圖105解答(1)納什均衡是(4,8) , (8,4)。這個結(jié)論可以通過下劃線方法得到。也可以通過納什均衡定義得到這個結(jié)論。若當(dāng)前策略組
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度職業(yè)教育培訓(xùn)機(jī)構(gòu)導(dǎo)師聘用合同
- 2025年度綠色能源合資項(xiàng)目合同范本
- 二零二五年度時尚服飾店門面房買賣協(xié)議
- 二零二五年度演出活動主辦方觀眾免責(zé)協(xié)議模板
- 二零二五年度綜合醫(yī)院與??漆t(yī)院雙向轉(zhuǎn)診合作協(xié)議書
- 2025年度航空航天知識產(chǎn)權(quán)保護(hù)及保密合同
- 二零二五年度退股股權(quán)變更與風(fēng)險控制協(xié)議
- 2025年度裝修公司拖欠工資無勞動合同糾紛解決協(xié)議
- 二零二五年度金融科技內(nèi)部股東股權(quán)轉(zhuǎn)讓合同范本
- 二零二五年度石英石采礦權(quán)轉(zhuǎn)讓合同
- GB/T 678-2023化學(xué)試劑乙醇(無水乙醇)
- 影視鑒賞-第一章-認(rèn)識電影-課件
- 船舶塢修廠修工程單審批稿
- 教科版小學(xué)科學(xué)三年級上冊《空氣》單元解讀與試教課件
- 困境兒童走訪調(diào)查表、致困原因確定參考標(biāo)準(zhǔn)、困境兒童評估報告
- 電機(jī)學(xué)同步電機(jī)-全套課件
- 農(nóng)產(chǎn)品電商營銷與運(yùn)營PPT完整全套教學(xué)課件
- 2023年福建省中考英語真題及參考答案
- 新譯林牛津版英語八年級上冊Unit1-Friends復(fù)習(xí)優(yōu)質(zhì)課公開課課件
- 公路工程施工安全管理及其實(shí)例
- 麻醉科醫(yī)師晉升副主任(主任)醫(yī)師高級職稱病例分析專題報告(全麻期間心跳驟停)
評論
0/150
提交評論