博弈論練習(xí)1答案_第1頁
博弈論練習(xí)1答案_第2頁
博弈論練習(xí)1答案_第3頁
博弈論練習(xí)1答案_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、博弈論練習(xí)一答案一、名詞解釋博弈:一些個人、隊(duì)組或其他組織,面對一定的環(huán)境條件,在一定的規(guī)則下, 同時或先后,一次或多次,從各自允許選擇的行為或策略中進(jìn)行選擇并加以實(shí) 施,各自取得相應(yīng)結(jié)果的過程。零和博弈:所有博弈方在每種策略組合下的得益的總和始終為0的博弈。 完全信息靜態(tài)博弈:納什均衡:定義 在博棄G = Si,,S ; 9中如果由各個得棄方的 各一個策略組成的某個策略組合(* ,,$;)中,任一誨棄方的策略, 都是對其余博棄方策略的紀(jì)合(s,葉$二,)的最佳對策,也 即 ,S; 1 ,( , 5二I ,,S;,,S二1 Sy 5云,5;)對 任意七e 5都成立,則稱(sj ,,Q為G的一個

2、“的什H(Nash Equilibrium) 混合策略:定義 在博G= Si,,$.* ,,“中,博弈才i的策略空間為 St = s, 1s共,則博棄方i以概率分布pi 3詛隨機(jī)在其k 個可逸策略中選擇的“策略”,稱為一個“混合策略,其中0 W A, W1對 j = 1 ,,為都成立,且pn + p* = 1。納什定理:無限次重復(fù)博弈民間定理:設(shè)G是一個完全佶息的錚態(tài)將棄。用 (1,e”)記G的融什均衡的得益,用(11,,xj表示G的任意可 實(shí)現(xiàn)得益。如果刀%對任意博棄方都成立,而3足夠接近1,那么無 限次重復(fù)博奔G(8. S)中一定存在一個子博奔完美的納什均衡,各博棄 方的平均得益能是Si,

3、,x) 動態(tài)博弈除了各博奔方同時決策的靜態(tài)博弈以外,也有大量現(xiàn)實(shí)決策活動構(gòu) 成的博弈中,各博弈方的選擇和行動不僅有先后次序,而且后選擇、后行 動的博弈方在自己選擇、行動之前,可以看到其他博弈方的選擇、行動,甚 至還包括自己的選擇和行動。這種博弈無論在哪種意義上都無法看作問 時決策的靜態(tài)博弈,我們把這種博弈稱為“動態(tài)博棄”(Dynamic Games)子博弈:由一個動態(tài)博弈第一階段以外的某階段開始的后續(xù)博弈階段構(gòu)成的, 有初始信息集和進(jìn)行博弈所需要的全部信息,能夠自成一個博弈的原博弈的一 部分,稱為原動態(tài)博弈的一個“子博弈”。子博弈完美納什均衡:如果在一個完美信息動態(tài)博弈中,各博弈方的策略構(gòu)成

4、的一個策略組合滿足,在整個動態(tài)博弈及它的所有子博弈中都構(gòu)成納什均衡, 那么這個策略組合稱為該動態(tài)博弈的一個“子博弈完美納什均衡”。逆推歸納法:從動態(tài)博弈的最后一個階段博弈方的行為開始分析,逐步倒推回 前一個階段相應(yīng)博弈方的行為選擇,一直到第一個階段的分析方法,稱為逆推 歸納法。二、填空題1、零和博弈、常和博弈和變和博弈2、靜態(tài)博弈、動態(tài)博弈和重復(fù)博弈3、一直預(yù)測性4、上策均衡、嚴(yán)格下策反復(fù)消去法、劃線法和箭頭法5、可信性問題三、判斷題lx 2x 3x 4寸 四、單選題IB 2D 3C 4D 5D 五、計(jì)算分析題1丈夫時裝足球妻子2,10, 00, 01, 3時裝足球(1)該博弈的純策略納什均衡

5、為(時裝,時裝)和(足球,足球)(4分)(2)設(shè)混合策略納什均衡中妻子采取時裝、足球的概率分別為pl、p2,(丈夫 采取時裝、足球的概率分別為ql、q2,)則對丈夫來講,其2個純策略的得益相 同,可得:pl=3p2, 乂pl+p2 =1,可得pl=3/4, p2=l/4,同理可得,ql=l/3, q2=2/3(4分)(3)妻子的得益= 2/3,丈夫的得益= 3/4,相比純策略納什均衡得益均減小。(2分)(1)該博弈為零和博弈,各博弈方嚴(yán)格競爭,由劃線法可知該博弈無純策略 納什均衡。(4分)(2)設(shè)混合策略納什均衡中博弈方1采取石頭、剪刀、布的概率分別為pl、p2、P3,博弈方2采取石頭、剪刀、

6、布的概率分別為ql、q2、q3,則對博弈方2來 講,其3個純策略的得益相同,可得:p2-p3=p3-pl=pl-p2, Xpl+p2+p3=l,可得pl=p2=p3 = l/3,同理q1=q2=q3 = 1/3 (4分)(3)博弈方1的得益=博弈方2的得益= l/3(0+l-l)=0o (2分)(1)乙(借,打)、甲(分)和乙(不借,不打)、甲(不分)為該博弈的 納什均衡(4分)(2)該博弈的子博弈完美納什均衡為乙(不借,不打)、甲(不分)(4分)(3)納什均衡包含子博弈完美納什均衡,子博弈完美納什均衡相較于納什均衡 在每一個子博弈中都是納什均衡,排除了不可信威脅。(2分)4廠商1 的得益ul

7、=(6-ql-q2)ql,廠商2的得益u2= (6-ql-q2) q2,己知ql, max u2,可得q2=(6-ql)/2,將其代入ul, max ul,可得ql = 3, 乂可求得 q2 = l. 5o7, 1該動態(tài)博弈的子博弈完美均衡為:第一階段廠商1的產(chǎn)量為3,第二階段廠商2 的產(chǎn)量為1.5。(10分)12, 2對代理人:激勵相容約束條件:w(E)-Ew(S)-S參與約束條件: w(E)-E0, w(S)-S0對委托人:委托條件:R(E)-w(E)R(O), R(S)-w(S)R(O)R(E)-w(E)=12, w(E)-E=2, R(S)-w(S) =7, w(S)-S=l, R(0

8、)=0,見上圖,由 逆推歸納法,可知,該博弈的子博弈完美納什均衡為委托人選擇委托,代理人 選擇接受并努力工作,委托人和代理人的得益分別為(12, 2) o (5分)六、簡答題1對一個一般的博弈,只要得益是策略的多元連續(xù)函數(shù),我們都可以求每個博 一方策略的最佳反應(yīng)構(gòu)成的函數(shù),也就是反應(yīng)函數(shù),而解出的各個博弈方反應(yīng) 函數(shù)的交點(diǎn)就是納什均衡,這種利用反應(yīng)函數(shù)求博弈的納什均衡的方法稱為反 應(yīng)函數(shù)法。在許多博弈中,博弈方的策略是有限且非連續(xù)時,其得益函數(shù)不是連續(xù)可導(dǎo)函 數(shù),無法求得反應(yīng)函數(shù),從而不能通過解方程組的方法求得納什均衡。即使得 益函數(shù)可以求導(dǎo),也可能各博弈方的得益函數(shù)比較復(fù)雜,因此各自的反應(yīng)函數(shù) 也比較復(fù)雜,并不總能保證各博弈方的反應(yīng)函數(shù)有交點(diǎn),特別不能保證有唯一 的交點(diǎn)。2如果有限策略博棄的一個納什均衡Ji.,缶)滿足對每個博介ZH

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論