博弈論期末復(fù)習(xí)題_第1頁
博弈論期末復(fù)習(xí)題_第2頁
博弈論期末復(fù)習(xí)題_第3頁
博弈論期末復(fù)習(xí)題_第4頁
博弈論期末復(fù)習(xí)題_第5頁
已閱讀5頁,還剩12頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、一、支付矩陣1、試給出下述戰(zhàn)略式表述博弈的納什均衡B再看看它是否有混合戰(zhàn)略均衡設(shè)b以(y,i 尸)玩混合戰(zhàn)略,則有均衡條件:VA(U) =12(1 - )=2-Va(D) =46(1 - )=6-22 - =6 -2得¥ =4>1 ,這是不可能的,故無混合戰(zhàn)略均衡,只有這一個(gè)純戰(zhàn)略均衡。2、試將題一中的支付作一修改使其有混合戰(zhàn)略均衡解:由奇數(shù)定理,若使它先有兩個(gè)純戰(zhàn)略均衡,則很可能就有另一個(gè)混合戰(zhàn)略均衡。5.62,54,16,2LRA UD將博弈改成上述模型,則52(1 - 戶46(1 -)2 3丁6-2得=4 5同樣,設(shè)A的混合戰(zhàn)略為(日,1一日),則6i 1(1 -與=5i

2、 2(1 - 1)1 5 1-2 31-12于是混合戰(zhàn)略均衡為二、逆向歸納法1、用逆向歸納法的思路求解下述不完美信息博弈的子博弈精煉均衡設(shè)在1的第二個(gè)信息集上,1認(rèn)為2選a的概率為P , 則 1 選 L'的支付=5P +2(1 P) =2 +3P1 選 R'的支付=6P +3(1 P) =3 +3P >2 + 3P故1必選R'。二 給定1在第二個(gè)決策結(jié)上選 R', 2在左邊決策結(jié)上會(huì)選 a,故子博弈精煉均衡為【R(a,d”四、兩個(gè)廠商生產(chǎn)相同產(chǎn)品在市場(chǎng)上進(jìn)行競(jìng)爭(zhēng)性銷售。第1個(gè)廠商的成本函數(shù)為Ci,其中q1為廠商1的產(chǎn)量。第2個(gè)廠商的成本函數(shù)為 C2 = c

3、q2,其中q2為廠商2的產(chǎn)量,c為其常數(shù)邊際成本。兩個(gè)廠商的固定成本都為零。廠商2的邊際成本c是廠商2的“私人信息”,廠商1認(rèn)為c在J;,% 上呈均勻分布。設(shè)市場(chǎng)需求函數(shù)為P =4-q1 -q2,其中P為價(jià)格,兩個(gè)廠商都以其產(chǎn)量為純戰(zhàn)略,問純戰(zhàn)略貝葉斯均衡為何?解:給定q2,廠商1的問題是max 二 1 二 (P 7)q1=(4 - q1 - q2 - 1)q1因q2 =q2(c)。廠商1不知道c ,故目標(biāo)函數(shù)為3/2max 1 (4 -。-q2(c) -1)qdcqi 223/2= mqax 3q -q -q- q2(c)dc一階條件:3/23-2q1-j q2(c)dc=0 "2

4、31 3/2得 q =一 - I q2(c)dc(1)22 2廠商2的問題是:max二2 = (P -c)q2q2二(4 -q -q2 -c)q2二(4 -c)q2 -qg -q2一階條件:(4 -c) -q1 -2q2 =03q2(c)=4 - c - q12(2)代入式(1):3例=21 3/24-c-qi , 一i dc2 121 3/2 4 -qi21 丁1 3/21 cdc4 23 一行+耶)2/1248 pJ22.) _得 q1 =1代入式(2):3 -c q2(c)=-2若 c =1 ,則 q1 = q2 = 11 ;- 2 二1 327若信息是完全的且c=1,則古諾博弈均衡為q

5、1 =q2=±<1,n1 =n2=27A1。525這說明信息不完全帶來的高效率。2、完美信息動(dòng)態(tài)博弈。會(huì)用策略式表達(dá)、 擴(kuò)展式表達(dá)。用方框找納什均衡,用 樹找子博弈精煉均衡。講理由,看例題。17該博弈中有三個(gè)納什均衡:不進(jìn)入,(進(jìn)入,進(jìn)入)進(jìn)入,(不進(jìn)入,進(jìn)入)進(jìn)入,(不進(jìn)入,不進(jìn)入)(不前兩個(gè)均衡的結(jié)果(進(jìn)入,不進(jìn)入),即A進(jìn)入,B不進(jìn)入;第二個(gè)均衡結(jié)果是 進(jìn)入,進(jìn)入),即A不進(jìn)入,B進(jìn)入如果理論得到這樣的結(jié)果,無助于預(yù)測(cè)博弈參與人的行為。此外,納什均衡假定,每一個(gè)參與人選擇的最優(yōu)戰(zhàn)略是在所有其他參與人的戰(zhàn)略選擇給定時(shí)的最優(yōu)反應(yīng),即參與人并不考慮自己的選擇對(duì)其他人選擇的影響,

6、因而納什均衡很難說是動(dòng)態(tài)博弈的合理解。必須在多個(gè)納什均衡中剔除不合理的均衡解,即所謂“不可置信威脅” 。子博弈精 煉納什均衡是對(duì)納什均衡概念的最重要的改進(jìn)。它的目的是把動(dòng)態(tài)博弈中的 “合理納什均衡”與“不合理納什均衡”分開。正如納什均衡是完全信息靜態(tài)博弈解的基本慨念一 樣,子博弈精煉納什均衡是完全信息動(dòng)態(tài)博弈解的基本概 念。不進(jìn)入,(進(jìn)入,進(jìn)入)進(jìn)入,(不進(jìn)入,進(jìn)入)進(jìn)入,(不進(jìn)入, 不進(jìn)入)前邊得到的三個(gè)納什均衡中,均衡意味著當(dāng) A不進(jìn)入時(shí),B選擇進(jìn)入;而當(dāng)A選擇進(jìn)入時(shí),B仍選擇進(jìn)入(B威脅無論如何都要進(jìn)入市場(chǎng))。顯然,當(dāng)A選擇進(jìn)入時(shí),B仍選擇進(jìn)入是不合理的, 如果A進(jìn)入市場(chǎng),B選擇“不進(jìn)入

7、”比選擇“進(jìn)入”收益要更大,理性的B不會(huì)選擇進(jìn)入,而 A知道B是理性的,因此也不會(huì)把該戰(zhàn)略視為 B會(huì)選擇的戰(zhàn)略。因此, B的 戰(zhàn)略(進(jìn)入,進(jìn)入)是不可置信威脅。不進(jìn)入,(進(jìn)入,進(jìn)入)進(jìn)入,(不進(jìn)入,進(jìn)入)進(jìn)入,(不進(jìn)入,不進(jìn)入)均衡意味著當(dāng) A進(jìn)入時(shí),B選擇不進(jìn)入;而當(dāng)A選擇不進(jìn)入時(shí),B仍選擇進(jìn)入(B威脅無論如何都不進(jìn)入市場(chǎng))。顯然,當(dāng)A選擇 不進(jìn)入時(shí),B仍選擇不進(jìn)入是不合理的,B的戰(zhàn)略是不可置信的。只有均衡是合理的:如果 A進(jìn)入,B不進(jìn)入;如果 A不進(jìn)入,B進(jìn)入。因 為A是先行動(dòng)者,理性的A會(huì)選擇“進(jìn)入”(他知道B是理性的,B不會(huì)選擇“進(jìn)入”), 而理性的B選擇“不進(jìn)入”。觀察博弈樹上的三個(gè)

8、均衡中,B的不可置信戰(zhàn)略中的反應(yīng),在第二階段B開始行動(dòng)的兩個(gè)子博弈中不是最優(yōu);而合理的納什均衡中,B的戰(zhàn)略在所有子博弈中都是最優(yōu)的,與A的第一階段可能選擇的行動(dòng)構(gòu)成該子博弈的納什均衡。解:有四種可能:混同均衡11T m1, 12 T m1tl T m2 , 12 T m2分離均衡 11T m1, 12 T m2tT m2 , 12 T mi設(shè)u(mi)為接收者看見mi時(shí)認(rèn)為發(fā)送者是t1的后驗(yàn)概率???ti t m,t2 t mi則u(mi) =0.5,非均衡路徑上 u(m2)=0,1當(dāng)接收者看見m1,選a1的支付為0.5 2 0.5 1 =1.5選22的支付為0.5父8+0.5父7= 7.5

9、>1.5故選a2。當(dāng)接收者看見 m2,選ai的支付為u(m2) 1 (1 - u(m2) 5=5-4u(m2)選a2的支付為u(m2) 7 (1 -u(m2) 3 =3 - 4u(m2)當(dāng)t1選m1,接收者會(huì)選a2, t1得支付10,要求t1不選m2,對(duì)u(m2)無要求,因 3總會(huì)選m1。當(dāng)t2選m1,接收者會(huì)選a2, t2得支付3,要求t2不選m2是不可能的,因t2選m2 是占優(yōu)于選 m1的,故此混同均衡 L t m)1, 12 T m1不存在。再看混同均衡 11Tm2 , 12 T m2此時(shí)u(m1)=0,1為非均衡路徑上的后驗(yàn)概率,u(m2) = 0.5當(dāng)接收者看見 m2,選a1的

10、支付為0.5 1 0.5 5=3選a2的支付為0.5 7 0.5 3 =5 3故接收者必選a2o當(dāng)接收者看見 m1時(shí),選a1的支付為u(m1) 2 (1 u(m1) 1 =1 u(m1)選a2的支付為u(m1) 8 (1 -u(m1) 7 =7 u(m1) 1 u(m1)故必選a2。這樣,無論發(fā)送者發(fā)出 m1或m2信號(hào),接U者總選a2 ,二給定接收者總是選a2。t1會(huì)選m1 ,t2會(huì)選m2 0口故t1 t m2, 12 T m2不是混同均衡。看分離均衡11Tm1, 12 T m2u(m1) =1 , u(m2) = 0接收者看見 mi時(shí),必選a2接收者看見m2時(shí),必選a1此時(shí),ti選mi, t

11、2選m2二 故11T m1, 12 T m2是一個(gè)分離均衡。最后看分離均衡11Tm2, 12 T m1u(m1) = 0 , u(m2) =1接收者看見m1時(shí),必選a2接收者看見m2時(shí),必選a2二給定接收者總選a211Tm1, 12 T m2二 故t1 t m2 , 12 Tmi不是分離均衡。故只有一個(gè)純戰(zhàn)略子博弈精煉分離均衡t1 ' m1t2 , m2鷹-鴿(Hawk-Dove)博弈(1)參與人:爭(zhēng)食的兩只動(dòng)物 -動(dòng)物1和動(dòng)物2。動(dòng)物1和動(dòng)物2的行動(dòng)空間都是一樣的,即: Ai=鷹,鴿 i=1 , 2支付矩陣如下:第動(dòng)物H動(dòng)物Q鴿口,匹3鴿小h 4小3, 3口(2)此博弈屬于完全信息靜

12、態(tài)博弈,根據(jù)奇數(shù)定理知道共有三個(gè)納什均衡,兩個(gè)純策略 納什均衡和一個(gè)混合策略納什均衡。兩個(gè)純策略納什均衡是:(鷹,鴿)和(鴿,鷹)?;旌喜呗约{什均衡是:動(dòng)物 1和動(dòng)物2 分別以50%的概率隨機(jī)地選擇鷹(象鷹一樣行動(dòng))或者鴿(象鴿一樣行動(dòng))。純策略納什均衡可以用劃線法或箭頭法求解。混合策略納什均衡則可根據(jù)無差異原則求解概率分布,即:首先,動(dòng)物1應(yīng)該以q的概率選擇鷹,以1-q的概率選擇鴿,使得動(dòng)物2在鷹或者鴿之間無差異,那么可得 q* :由4(1-q) = q+3(1-q)得q*=50% ;其次,動(dòng)物2應(yīng)該以a的概率選擇鷹,以1-a的概率選擇鴿,使得動(dòng)物1在鷹或者鴿之間無差異,那么可得 a*:由4

13、(1-a) = a+3(1-a)得a*=50%。(3)此博弈實(shí)際就是一個(gè)斗雞博弈,在現(xiàn)實(shí)生活許多現(xiàn)象都與此類似,如市場(chǎng)進(jìn)入、前蘇聯(lián)與美國(guó)在世界各地爭(zhēng)搶地盤等。七、狩獵博弈此博弈同樣是一個(gè)完全信息靜態(tài)博弈,參與人是兩個(gè)獵人,他們的行動(dòng)是選擇獵鹿或者獵兔。支付矩陣如下:獵人2a獵人3鹿。鹿。500, 500p0, 1叩心兔一100,100, 1。戶根據(jù)劃線或箭頭法我們可以很容易地知道此博弈有兩個(gè)純策略納什均衡,即:(鹿,鹿)和(兔,兔),也就是兩個(gè)獵人同時(shí)獵鹿或同時(shí)獵兔都是純策略納什均衡。由于存在兩個(gè)純策略納什均衡,現(xiàn)實(shí)中究竟哪個(gè)均衡會(huì)出現(xiàn)就是一個(gè)問題,這是多重納什均衡下的困境。 但是,比較兩個(gè)納

14、什均衡, 很容易發(fā)現(xiàn)兩人都獵鹿帕累托優(yōu)于兩人都 獵兔,所以,對(duì)兩個(gè)獵人而言,都獵鹿是一個(gè)“更好”的納什均衡,因此,在現(xiàn)實(shí)中兩 個(gè)人都決定獵鹿的可能性要更大一些。然而,正如盧梭所言,如果一只野兔碰巧經(jīng)過他們中的一個(gè)人附近,那么也許這個(gè)人會(huì)去獵兔而使獵鹿失敗,因?yàn)閮蓚€(gè)人都獵兔也是一個(gè)納什均衡,這就是人的自私性。此外,在多個(gè)納什均衡下,博弈之外的其他因素有助于我們判斷哪個(gè)均衡會(huì)出現(xiàn)。比如,兩個(gè)獵人是好朋友,經(jīng)常合作,那么我們幾乎可以100%的肯定他們都會(huì)同時(shí)選擇獵鹿。 如果他們是仇敵,那么我們可以肯定他們不會(huì)合作獵鹿,因此他們都會(huì)選擇各自獵兔。不完全信息夫妻博弈混合策略均衡給定妻子分別以q,1-q的

15、概率選擇時(shí)裝、足球,則丈夫選擇時(shí)裝、足球的期望收益相等,即來源:考試大-考博考試1.q+0.(1-q)=0.q+3.(1-q),解得妻子選擇時(shí)裝、足球的概率分別為(3/4, 1/4)給定丈夫分別以p,1-p的概率選擇時(shí)裝、足球,夫妻之爭(zhēng)兩博弈 方的反應(yīng)威迪££“3,1變子選符網(wǎng)裝的 期生捋益小于逢異足球邸t 去了南宏每早球.t31q=0;如 果則支子法界時(shí)裝的期 呈杵益為大于造瘠足球的卷 瑞詵g ,即pT則妻子選擇時(shí)裝、足球的期望收益相等,即2.p+0.(1-p)=0.p+1.(1-p),解得妻子選擇時(shí)裝、 足球的概率分別為(1/3, 2/3)當(dāng)妻子以(3/4, 1/4)的

16、概率分布隨機(jī)選擇時(shí)裝表p產(chǎn)箝可;=")p5演和足球,丈夫以(1/3, 2/3)的概率隨機(jī)選擇時(shí)裝表 演和足球時(shí),雙方都無法通過單獨(dú)改變策略,即單獨(dú)改變隨機(jī)選擇純策略的概率分布而提高利益,因此雙方的上述概率分布的組合構(gòu)成一個(gè)混合策略納什均 衡。該混合策略納什均衡給妻子和丈夫各自帶來的期望收益分別為:q.p.2+q.(1-p).0+(1-q).p.0+(1-q).(1-p).1=2/3;q.p.1+q.(1-p).0+(1-q).p.0+(1-q).(1-p).3=3/4 雙方的期望收益均小于純策略時(shí)的期望收益。某些靜態(tài)貝葉斯博弈的例子1、市場(chǎng)進(jìn)入博弈一個(gè)完全壟斷企業(yè) B正在壟斷一個(gè)行業(yè)

17、市場(chǎng),另一個(gè)潛在的試圖進(jìn)入該行業(yè)的企 業(yè)A,稱A為進(jìn)入者,B為在位者。A不知道B的成本特征,設(shè)B有兩種可能的成本, 即高成本和低成本。兩種成本情況下的博弈矩陣如表6.1。表6.1市場(chǎng)進(jìn)入博弈B高成本低成本默認(rèn)斗爭(zhēng)默認(rèn)斗爭(zhēng)進(jìn)入40,50-10,030,80-10,100A不進(jìn)入0,3000,3000, 400假定B知道進(jìn)入者A的成本為高成本,且與B為高成本時(shí)的成本相同。 假若信息 是完全的,則當(dāng)B為高成本時(shí),唯一的精煉納什均衡為(進(jìn)入,默認(rèn)),另一納什均衡(不進(jìn)入,斗爭(zhēng))是含有不可置信的威脅。當(dāng) B為低成本時(shí),唯一的納什均衡為(不 進(jìn)入,斗爭(zhēng)),即若A進(jìn)入行業(yè),具有低成本優(yōu)勢(shì)的B將通過降低價(jià)格將

18、 A逐出市場(chǎng)。由于存在行業(yè)進(jìn)入成本,所以A被逐出市場(chǎng)后將有凈的 10單位進(jìn)入成本的損失。當(dāng)A不知道B的成本情況時(shí),他的選擇將依賴于他對(duì) B的成本類型的主觀概率或 先驗(yàn)概率密度。設(shè)A對(duì)B是高成本的先驗(yàn)概率判斷為P ,則A認(rèn)為B為低成本的概率為1 - P。如果A進(jìn)入,其期望支付為P(40) (1 -P)( -10)如果1不進(jìn)入,其期望支付為 0。11當(dāng)且僅當(dāng)P(40) +(1 P)(10)之0或P之一時(shí),A選擇進(jìn)入;反之,當(dāng)P<一時(shí), 55A不進(jìn)入。于是,貝葉斯均衡為:一 1(進(jìn)入,默認(rèn)),高成本,P之一;5,、,小 ,一 一1(進(jìn)入,斗爭(zhēng)),低成本,P之一;51(不進(jìn)入,*), P <

19、; -5其中*表不'可以是斗爭(zhēng),也可以是默認(rèn)。2成本信息不對(duì)稱的古諾博弈例3.10給出的古諾博弈中,每個(gè)廠商的成本函數(shù)是共同知識(shí)。這里,我們假設(shè)每 個(gè)廠商的成本函數(shù)是私人信息,具體規(guī)定如下:兩個(gè)企業(yè)生產(chǎn)相同產(chǎn)品在同一市場(chǎng)上進(jìn)行競(jìng)爭(zhēng)性銷售,市場(chǎng)需求函數(shù)為 Q =a-P, a>0, P為產(chǎn)品價(jià)格,Q為市場(chǎng)需求量。假設(shè)a充分大時(shí)總有a -P >0 ,企業(yè)i的成本函數(shù)為Ci = b0i ,其中Ci為企業(yè)i的總 成本,qi為其產(chǎn)量,bi為其平均成本,bi為常數(shù)且bi >0 ,故bi也是邊際成本。bi是 企業(yè)i的私人信息,企業(yè) j不知道bi但認(rèn)為bi在d,e上呈均勻分布,d &g

20、t;0 , e>0, d We。且進(jìn)一步假定 bi在d,e呈均勻分布是共同知識(shí),i # j , i = j =1,2。企業(yè)i的支付函數(shù)是其利潤(rùn)函數(shù)ni二 i =Pqi -G=(a -Q)q -biqi因 Q =q1 q2故二i =(a - qi -q2)qi -hqi設(shè)靜態(tài)貝葉斯均衡為 %*苴2,則由均衡戰(zhàn)略的類型依存性有 * ,qi =qi (bi), i =1,2于是,*二i 二(a - qi (bi) -q2(b2)q (bi) -biQi (b)=i (bj )i的期望支付為Ui = . P(bj |bi)二i(bj)dbjHj顯然P(bj | bi) = P(bj),由概率分布

21、密度 P(bj)的歸一化條件P(bj)dbj -1Hj及bj在d,e上呈均勻分布假設(shè),有P(bj) dbj =1Hj或e-dP(bj) =11即 P(bj)=一;e -d111于正,Ui = (a q)(e d)qj (bj)dbj q bqi (e d),e-d ILHjJ一階條件:-:Ui _1P (e-d)- 1 (ed)qi +(aqi)(e d) - qj (bj)dbj h(e d) =0Hj(a -bi)(e -d) - qqi 二2(e-d)同樣由對(duì)稱性有(a - bj )(e - d ) - . qi(6.5)qj =2(e -d)(6.6)在上式兩端對(duì)bj進(jìn)行積分,.、e2 d2a(e -d) - qiqj :2(6.7)在式(6.5)兩端對(duì)bi積分2 d 2a(e-d) - - qjqi =2(6.8)將式(6.7)代入式(6.8)的右端,得e daqi =2(e-d)3(6.9)由對(duì)稱性有e d a 2qj = v = -(e-d)3代入式(6.5)得e da (a - bi )(e - d) 2 (e - d)*3qi :32(e-d)2a -3bi2a -3bj同理有qj二26e de d2a - 3b1 2a - 3b2 于是得靜態(tài)貝葉斯均衡為 (22-)。6'6一. 、一 一, * *當(dāng)a充分大時(shí),qi和qj均為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論