完整word版,博弈論期末復(fù)習(xí)題_第1頁(yè)
完整word版,博弈論期末復(fù)習(xí)題_第2頁(yè)
完整word版,博弈論期末復(fù)習(xí)題_第3頁(yè)
完整word版,博弈論期末復(fù)習(xí)題_第4頁(yè)
完整word版,博弈論期末復(fù)習(xí)題_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余15頁(yè)可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、、支付矩陣1、試給出下述戰(zhàn)略式表述博弈的納什均衡1,32,54,16,2LRA UD解:由劃線解得知有一個(gè)純戰(zhàn)略均衡(D, R)再看看它是否有混合戰(zhàn)略均衡,1)玩混合戰(zhàn)略,則有451均衡條件:Va(U)2(1 ) 2Va(D)6(1 ) 6 2這是不可能的,故無混合戰(zhàn)略均衡,只有這一個(gè)純戰(zhàn)略均衡。2、試將題一中的支付作一修改使其有混合戰(zhàn)略均衡解:由奇數(shù)定理,若使它先有兩個(gè)純戰(zhàn)略均衡,則很可能就有另一個(gè)混合戰(zhàn)略均衡。5,62,54,162LRA UD將博弈改成上述模型,則2(1)46(1同樣,設(shè)A的混合戰(zhàn)略為(,1),則61 (1)52(1于是混合戰(zhàn)略均衡為1 12,24 1 O5,520二、逆

2、向歸納法1、用逆向歸納法 的思路求解下述 不完美信息博弈的子博弈精煉均衡認(rèn)為2選a的概率為P,1設(shè)在1的第二個(gè)信息集上,則1選L的支付 5P2(1P) 2 3P1選R的支付 6P3(1P) 3 3 P 2 3P故1必選R 。給定1在第二個(gè)決策結(jié)上選 R , 2在左邊決策結(jié)上會(huì)選a,故子博弈精煉均衡L,R,(a,d)四、兩個(gè)廠商生產(chǎn)相同產(chǎn)品在市場(chǎng)上進(jìn)行競(jìng)爭(zhēng)性銷售。第個(gè)廠商的成本函數(shù)為c1 q1,其中q1為廠商1的產(chǎn)量。第2個(gè)廠商的成本函數(shù)為 c2cq2,其中q2為廠商2的產(chǎn)量,c為其常數(shù)邊際成本。兩個(gè)廠商的固定成本都為零。廠商 廠商2的“私人信息”,廠商1認(rèn)為c在彳,% 上呈均勻分布。2的邊際成

3、本c是設(shè)市場(chǎng)需求函數(shù)為P 4 q1 q2,其中P為價(jià)格,兩個(gè)廠商都以其產(chǎn)量為純戰(zhàn)略,問純戰(zhàn)略貝葉斯均衡為何?解:給定maxq2,廠商1的冋題是1 (P 1)q1(4 qiq2 1)q1因q2q2(c)。廠商3/2(41不知道c,故目標(biāo)函數(shù)為max 1qi 2q1q2(c) 1)q1dcmaxq13q2q13/2q1 1 q2 (c)dc"2一階條件:3 2q1得q13/21 q2 (c)dc 0"2313/2-1 q2(c)dc2 2 1(1)廠商2的問題是:maxq2(Pc)q2(4qi q2 c)q2(4c)q2 qq?q;一階條件:(4 c)q12q20q2(c)代入

4、式(1):3q1 23212123/2 4 c q1 dc1 23/2 4q1123/2,cdc4"得qi 1代入式(2):q2(c)若c 1,則q1q2若信息是完全的且31,則古諾博弈均衡為q1q231,152725這說明信息不完全帶來的高效率。樹找子2、完美信息動(dòng)態(tài)博弈。會(huì)用策略式表達(dá)、擴(kuò)展式表達(dá)。用方框找納什均衡,博弈精煉均衡。講理由,看例題?!? , -3”3 , -31 . 01 , 00, 10, 00. 10, 0f環(huán)a入 > 畐金.不遊人)1旗人; 進(jìn)人A不進(jìn)入該博弈中有三個(gè)納什均衡:不進(jìn)入,(進(jìn)入,進(jìn)入)進(jìn)入,(不進(jìn)入,進(jìn)入)進(jìn)入,(不進(jìn)入,不進(jìn)入)Bo Bo

5、前兩個(gè)均衡的結(jié)果(進(jìn)入,不進(jìn)入),即A進(jìn)入,B不進(jìn)入;第二個(gè)均衡結(jié)果是 (不進(jìn)入,進(jìn)入),即A不進(jìn)入,B進(jìn)入即參如果理論得到這樣的結(jié)果,無助于預(yù)測(cè)博弈參與人的行為。此外,納什均衡假定,每一個(gè)參與人選擇的最優(yōu)戰(zhàn)略是在所有其他參與人的戰(zhàn)略選擇給定時(shí)的最優(yōu)反應(yīng), 當(dāng)A選擇不進(jìn)入時(shí),B仍選擇進(jìn)入(B威脅無論如何都不進(jìn)入市場(chǎng))。顯然,當(dāng)A選擇與人并不考慮自己的選擇對(duì)其他人選擇的影響,因而納什均衡很難說是動(dòng)態(tài)博弈的合理解。必須在多個(gè)納什均衡中剔除不合理的均衡解,即所謂“不可置信威脅”。子博弈精煉納什均衡是對(duì)納什均衡概念的最重要的改進(jìn)。它的目的是把動(dòng)態(tài)博弈中的 “合理納什均衡”與“不合理納什均衡”分開。正如

6、納什均衡是完全信息靜態(tài)博弈解的基本慨念一樣,子博弈精煉納什均衡是完全信息動(dòng)態(tài)博弈解的基本概念。不進(jìn)入,(進(jìn)入,進(jìn)入)進(jìn)入,(不進(jìn)入,進(jìn)入)進(jìn)入,(不進(jìn)入,不進(jìn)入)逬不B 0B-O:B前邊得到的三個(gè)納什均衡中,均衡意味著當(dāng) A不進(jìn)入時(shí),B選擇進(jìn)入;而當(dāng)A選擇進(jìn)入時(shí),B仍選擇進(jìn)入(B威脅無論如何都要進(jìn)入市場(chǎng))。顯然,當(dāng)A選擇進(jìn)入時(shí),B仍選擇進(jìn)入是不合理的,如果A進(jìn)入市場(chǎng),B選擇“不進(jìn)入”比選擇“進(jìn)入”收益要更大,理性的B不會(huì)選擇進(jìn)入,而 A知道B是理性的,因此也不會(huì)把該戰(zhàn)略視為 B會(huì)選擇的戰(zhàn)略。因此,戰(zhàn)略(進(jìn)入,進(jìn)入)是不可置信威脅。不進(jìn)入,(進(jìn)入,進(jìn)入)進(jìn)入,(不進(jìn)入,進(jìn)入)進(jìn)入,(不進(jìn)入,不進(jìn)

7、入)均衡意味著當(dāng)A進(jìn)入時(shí),B選擇不進(jìn)入;而不進(jìn)入時(shí),B仍選擇不進(jìn)入是不合理的,B的戰(zhàn)略是不可置信的。只有均衡是合理的:如果 A進(jìn)入,B不進(jìn)入;如果 A不進(jìn)入,B進(jìn)入。因?yàn)锳是先行動(dòng)者,理性的A會(huì)選擇“進(jìn)入”(他知道B是理性的,B不會(huì)選擇“進(jìn)入”), 而理性的B選擇“不進(jìn)入”。觀察博弈樹上的三個(gè)均衡中,B的不可置信戰(zhàn)略中的反應(yīng),在第二階段B開B的戰(zhàn)略在所有子博弈中都是始行動(dòng)的兩個(gè)子博弈中不是最優(yōu);而合理的納什均衡中,最優(yōu)的,與A的第一階段可能選擇的行動(dòng)構(gòu)成該子博弈的納什均衡。解:有四種可能:混同均衡timi,t2mi分離均衡tim2,t2m2timi,t2m2tim2,t2mi設(shè)u(mi)為接收

8、者看見mi時(shí)認(rèn)為發(fā)送者是t1的后驗(yàn)概率???timi, t2mi則u(mi)0.5,非均衡路徑上u(m2)0,1當(dāng)接收者看見m1,選 a1 的支付為0.5 20.51 1.5選 a2 的支付為0.58 0.5 77.5 1.5故選 a2 。當(dāng)接收者看見 m2 ,選 a1 的支付為u(m2) 1 (1u(m2) 5 54u(m2)選 a2 的支付為u(m2) 7 (1u(m2) 3 34u(m2)當(dāng)t1選mr,接收者會(huì)選a2, t1得支付10,要求 t1 不選 m2 ,對(duì) u(m2 ) 無要求,因t1 總會(huì)選 m1 。當(dāng) t2 選 m1 ,接收者會(huì)選 a2 , t2 得支付3,要求 t2 不選

9、m2 是不可能的,因 t2 選 m2是占優(yōu)于選 m1 的,故此混同均衡 t1m1 ,t2m1 不存在。再看混同均衡t1m2 , t2 m2此時(shí) u(m1)0,1 為非均衡路徑上的后驗(yàn)概率,u(m2)0.5當(dāng)接收者看見 m2 ,選 a1 的支付為0.5 1 0.5 5 3選 a2 的支付為0.5 7 0.5 3 5 3故接收者必選 a2 。當(dāng)接收者看見 m1 時(shí),選 a1 的支付為u(m1) 2(1u(m1) 11 u(m1)選 a2 的支付為u(m1) 8(1u(m1) 77 u(m1)1 u(m1)故必選 a2 。這樣,無論發(fā)送者發(fā)出m1 或 m2 信號(hào),接收者總選 a2 ,給定接收者總是選

10、a2 。t1會(huì)選m1, t2會(huì)選m2。m2,t2m2不是混同均衡。看分離均衡t1 m1,t2m2u(mi)1 , u(m2)0接收者看見接收者看見m1時(shí),必選a2m2時(shí),必選a1此時(shí),t1選m1, t2選m2故t1m1,t2 m2是一個(gè)分離均衡。最后看分離均衡t1m2, t2m1u(m1)0, u(m2)1接收者看見mi時(shí),必選a2接收者看見m2時(shí),必選a2給定接收者總選a2t1m1,t2m2故t1m2,t2 m1不是分離均衡。故只有一個(gè)純戰(zhàn)略子博弈精煉分離均衡t1m1t2m2鷹-鴿(Hawk-Dove)博弈(1)參與人:爭(zhēng)食的兩只動(dòng)物 -動(dòng)物1和動(dòng)物2。動(dòng)物1和動(dòng)物2的行動(dòng)空間都是一樣的,即

11、:Ai=鷹,鴿 i=1,2支付矩陣如下:動(dòng)物2盧H+-鵠*1, 4p3-(2)此博弈屬于完全信息靜態(tài)博弈,根據(jù)奇數(shù)定理知道共有三個(gè)納什均衡,兩個(gè)純策略納什均衡和一個(gè)混合策略納什均衡。兩個(gè)純策略納什均衡是:(鷹,鴿)和(鴿,鷹)?;旌喜呗约{什均衡是:動(dòng)物1和動(dòng)物2分別以50%的概率隨機(jī)地選擇鷹(象鷹一樣行動(dòng))或者鴿(象鴿一樣行動(dòng))。純策略納什均衡可以用劃線法或箭頭法求解。混合策略納什均衡則可根據(jù)無差異原則求解概率分布,即:首先,動(dòng)物1應(yīng)該以q的概率選擇鷹,以1-q的概率選擇鴿,使得動(dòng)物2在鷹或者鴿之間無差異,那么可得q* :由 4(1-q) = q+3(1-q)得 q*=50% ;其次,動(dòng)物2應(yīng)

12、該以a的概率選擇鷹,以1-a的概率選擇鴿,使得動(dòng)物1在鷹或者鴿之間無差異,那么可得a* :由 4(1-a) = a+3(1-a)得 a*=50%。(3)此博弈實(shí)際就是一個(gè)斗雞博弈,在現(xiàn)實(shí)生活許多現(xiàn)象都與此類似,如市場(chǎng)進(jìn)入、前蘇聯(lián)與美國(guó)在世界各地爭(zhēng)搶地盤等。七、狩獵博弈此博弈同樣是一個(gè)完全信息靜態(tài)博弈,參與人是兩個(gè)獵人,他們的行動(dòng)是選擇獵鹿或者獵兔。支付矩陣如下:II屮500, 500t0, lOh100, 2100,汕血根據(jù)劃線或箭頭法我們可以很容易地知道此博弈有兩個(gè)純策略納什均衡,即:(鹿,鹿)和(兔,兔),也就是兩個(gè)獵人同時(shí)獵鹿或同時(shí)獵兔都是純策略納什均衡。由于存在兩個(gè)純策略納什均衡,現(xiàn)實(shí)

13、中究竟哪個(gè)均衡會(huì)出現(xiàn)就是一個(gè)問題,這是多重納什均衡下的困境。但是,比較兩個(gè)納什均衡, 很容易發(fā)現(xiàn)兩人都獵鹿帕累托優(yōu)于兩人都獵兔,所以,對(duì)兩個(gè)獵人而言,都獵鹿是一個(gè)“更好”的納什均衡,因此,在現(xiàn)實(shí)中兩個(gè)人都決定獵鹿的可能性要更大一些。然而,正如盧梭所言,如果一只野兔碰巧經(jīng)過他們中的一個(gè)人附近,那么也許這個(gè)人會(huì)去獵兔而使獵鹿失敗,因?yàn)閮蓚€(gè)人都獵兔也是個(gè)納什均衡,這就是人的自私性。此外,在多個(gè)納什均衡下,博弈之外的其他因素有助于我們判斷哪個(gè)均衡會(huì)出現(xiàn)。比如,兩個(gè)獵人是好朋友,經(jīng)常合作,那么我們幾乎可以100%的肯定他們都會(huì)同時(shí)選擇獵鹿。如果他們是仇敵,那么我們可以肯定他們不會(huì)合作獵鹿,因此他們都會(huì)選

14、擇各自獵兔。來源:考試大-考博考試不完全信息夫妻博弈混合策略均衡給定妻子分別以q,1-q的概率選擇時(shí)裝、足球,丈夫選擇時(shí)裝、足球的期望收益相等,1.q+0.(1-q)=0.q+3.(1-q),解得妻子選擇時(shí)裝、足球的概率分別為(3/4,1/4)案例性另L戰(zhàn)則即匸夫15 00,®LS給定丈夫分別以p,1-P的概率選擇時(shí)裝、足球, 則妻子選擇時(shí)裝、足球的期望收益相等,即2.P+0.(1-p)=0.p+1.(1-p),解得妻子選擇時(shí)裝、足球的概率分別為(1/3,2/3)當(dāng)妻子以(3/4,1/4)的概率分布隨機(jī)選擇時(shí)裝表演和足球,丈夫以(1/3,2/3)的概率隨機(jī)選擇時(shí)裝表演和足球時(shí),雙方都

15、無法通過單獨(dú)改變策略,即單獨(dú)改變隨機(jī)選擇純策略的概率分布而提高利益,因此雙方的上述概率分布的組合構(gòu)成一個(gè)混合策略納什均-一"片li衡。該混合策略納什均衡給妻子和丈夫各自帶來的期望收益分別為:q.p .2+q.(1- p).0+(1-q). p. 0+(1-q).(1- p).1=2/3;q.p .1+q.(1- p).0+(1-q). p. 0+(1-q).(1- p).3=3/4雙方的期望收益均小于純策略時(shí)的期望收益。某些靜態(tài)貝葉斯博弈的例子1、市場(chǎng)進(jìn)入博弈一個(gè)完全壟斷企業(yè) B正在壟斷一個(gè)行業(yè)市場(chǎng),另一個(gè)潛在的試圖進(jìn)入該行業(yè)的企業(yè)A,稱A為進(jìn)入者,B為在位者。A不知道B的成本特征,

16、設(shè) B有兩種可能的成本,即高成本和低成本。兩種成本情況下的博弈矩陣如表6.1。表6.1市場(chǎng)進(jìn)入博弈高成本低成本進(jìn)入40,50-10,030,80-10,1000,3000,3000, 400默認(rèn)斗爭(zhēng)默認(rèn)斗爭(zhēng)不進(jìn)入假定B知道進(jìn)入者A的成本為高成本,且與B為高成本時(shí)的成本相同。假若信息是完全的,則當(dāng)B為高成本時(shí),唯一的精煉納什均衡為(進(jìn)入,默認(rèn)),另一納什均衡(不進(jìn)入,斗爭(zhēng))是含有不可置信的威脅。當(dāng)B為低成本時(shí),唯一的納什均衡為(不進(jìn)入,斗爭(zhēng)),即若A進(jìn)入行業(yè),具有低成本優(yōu)勢(shì)的 B將通過降低價(jià)格將 A逐出市場(chǎng)。由于存在行業(yè)進(jìn)入成本,所以A被逐出市場(chǎng)后將有凈的 10單位進(jìn)入成本的損失。當(dāng)A不知道B的

17、成本情況時(shí),他的選擇將依賴于他對(duì) B的成本類型的主觀概率或先驗(yàn)概率密度。1 P。設(shè)A對(duì)B是高成本的先驗(yàn)概率判斷為P ,則A認(rèn)為B為低成本的概率為如果A進(jìn)入,其期望支付為P(40)(1P)( 10)如果1不進(jìn)入,其期望支付為當(dāng)且僅當(dāng)P(40)(1P)( 10)0或P1時(shí),A選擇進(jìn)入;反之,當(dāng)P5A不進(jìn)入。于是,貝葉斯均衡為:(進(jìn)入,默認(rèn)),高成本,(進(jìn)入,斗爭(zhēng)),低成本,1515(不進(jìn)入,*), P 15其中*表示可以是斗爭(zhēng),也可以是默認(rèn)。2成本信息不對(duì)稱的古諾博弈例3.10給出的古諾博弈中,每個(gè)廠商的成本函數(shù)是共同知識(shí)。這里,我們假設(shè)每個(gè)廠商的成本函數(shù)是私人信息,具體規(guī)定如下:兩個(gè)企業(yè)生產(chǎn)相同

18、產(chǎn)品在同一市場(chǎng)上進(jìn)行競(jìng)爭(zhēng)性銷售,市場(chǎng)需求函數(shù)為 Q a P , a 0,P為產(chǎn)品價(jià)格,Q為市場(chǎng)需求量。 假設(shè)a充分大時(shí)總有a P 0,企業(yè)i的成本函數(shù)為Ci biqi,其中Ci為企業(yè)i的總 成本,qi為其產(chǎn)量,bi為其平均成本,bi為常數(shù)且bi 0,故bi也是邊際成本。bi是 企業(yè)i的私人信息,企業(yè)j不知道bi但認(rèn)為bj在d,e上呈均勻分布,d 0,e 0, d e。且進(jìn)一步假定bi在d,e呈均勻分布是共同知識(shí),i j,i j 1,2。企業(yè)i的支付函數(shù)是其利潤(rùn)函數(shù)qQ) q bi qPqi(a因 Q q1 故i (aq2q1設(shè)靜態(tài)貝葉斯均衡為qiqi(bi), iq2)qibqiq* i 1,

19、2,則由均衡戰(zhàn)略的類型依存性有1,2于是(a qi (bi) i(bj)q;(b2)q*(bi) biq*(b)i的期望支付為Ui P(bj|bi)Hj顯然P(bj | bi)P (bj),由概率分布密度 P (bj)的歸一化條件i(bj)dbjP (bj)dbj1Hj及bj在d,e上呈均勻分布假設(shè),有P (bj) dbj 1Hj或e dP(bj)11e d即 P(bj)于是,Ui1門(a q,)(e d) Hq(bj)dbj q hqi(e d)一階條件:Ul1q (e d)(a bi)(e d)qqi2(e d)同樣由對(duì)稱性有(6.5)(a bj)(e d) qi qj2(e d)(6.6)在上式兩端對(duì)bj進(jìn)行積分e2 d2a(e d) -qiqj 2(6.7)在式(6.5)兩端對(duì)bi積分2 .2/小 e da(e d) 2qj2(6.8)將式(6.7)代入式(6.8)的右端,得e da Jed)(6.9)由對(duì)稱性有 qjqid)代入式(6.5)得e d(a bi)(e*qi d)d)2(e d)e d2a 3bi 26(e d)qi (a qi)(e d) qj(bj)dbj b (e d) 0Hj較低。e d2a 3bj 同理有q i 62a 3bi于是得靜態(tài)貝葉斯均衡為 (6 當(dāng)a充分大時(shí),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論