博弈論期末復(fù)習(xí)題

上傳人：1*** IP屬地：江蘇上傳時(shí)間：2023-05-21 格式：DOC 頁數(shù)：16 大小：2.97MB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩11頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

PAGEPAGE4一、支付矩陣1、試給出下述戰(zhàn)略式表述博弈的納什均衡BALRU1,32,5D4,16,2解：由劃線解得知有一個(gè)純戰(zhàn)略均衡（）再看看它是否有混合戰(zhàn)略均衡設(shè)以玩混合戰(zhàn)略，則有均衡條件：得，這是不可能的，故無混合戰(zhàn)略均衡，只有這一個(gè)純戰(zhàn)略均衡。2、試將題一中的支付作一修改使其有混合戰(zhàn)略均衡解：由奇數(shù)定理，若使它先有兩個(gè)純戰(zhàn)略均衡，則很可能就有另一個(gè)混合戰(zhàn)略均衡。BALRU5,62,5D4,16,2將博弈改成上述模型，則得同樣，設(shè)的混合戰(zhàn)略為，則于是混合戰(zhàn)略均衡為。二、逆向歸納法1、用逆向歸納法的思路求解下述不完美信息博弈的子博弈精煉均衡1212(5,8)(6,7)(2,0)(3,4)(1,2)(3,4)解12112(5,8)(6,7)(2,0)(3,4)(1,2)(3,4)設(shè)在1的第二個(gè)信息集上，1認(rèn)為2選的概率為，則1選的支付1選的支付前兩個(gè)均衡的結(jié)果(進(jìn)入，不進(jìn)入)，即A進(jìn)入，B不進(jìn)入；第二個(gè)均衡結(jié)果是(不進(jìn)入，進(jìn)入)，即A不進(jìn)入，B進(jìn)入如果理論得到這樣的結(jié)果，無助于預(yù)測(cè)博弈參與人的行為。此外，納什均衡假定，每一個(gè)參與人選擇的最優(yōu)戰(zhàn)略是在所有其他參與人的戰(zhàn)略選擇給定時(shí)的最優(yōu)反應(yīng)，即參與人并不考慮自己的選擇對(duì)其他人選擇的影響，因而納什均衡很難說是動(dòng)態(tài)博弈的合理解。必須在多個(gè)納什均衡中剔除不合理的均衡解，即所謂“不可置信威脅”。子博弈精煉納什均衡是對(duì)納什均衡概念的最重要的改進(jìn)。它的目的是把動(dòng)態(tài)博弈中的“合理納什均衡”與“不合理納什均衡”分開。正如納什均衡是完全信息靜態(tài)博弈解的基本慨念一樣，子博弈精煉納什均衡是完全信息動(dòng)態(tài)博弈解的基本概念。①{不進(jìn)入，（進(jìn)入，進(jìn)入）}②{進(jìn)入，（不進(jìn)入，進(jìn)入）}③{進(jìn)入，（不進(jìn)入，不進(jìn)入）}前邊得到的三個(gè)納什均衡中，均衡①意味著當(dāng)A不進(jìn)入時(shí)，B選擇進(jìn)入；而當(dāng)A選擇進(jìn)入時(shí)，B仍選擇進(jìn)入（B威脅無論如何都要進(jìn)入市場(chǎng)）。顯然，當(dāng)A選擇進(jìn)入時(shí)，B仍選擇進(jìn)入是不合理的，如果A進(jìn)入市場(chǎng)，B選擇“不進(jìn)入”比選擇“進(jìn)入”收益要更大，理性的B不會(huì)選擇進(jìn)入，而A知道B是理性的，因此也不會(huì)把該戰(zhàn)略視為B會(huì)選擇的戰(zhàn)略。因此，B的戰(zhàn)略（進(jìn)入，進(jìn)入）是不可置信威脅。①{不進(jìn)入，（進(jìn)入，進(jìn)入）}②{進(jìn)入，（不進(jìn)入，進(jìn)入）}③{進(jìn)入，（不進(jìn)入，不進(jìn)入）}均衡③意味著當(dāng)A進(jìn)入時(shí)，B選擇不進(jìn)入；而當(dāng)A選擇不進(jìn)入時(shí)，B仍選擇進(jìn)入（B威脅無論如何都不進(jìn)入市場(chǎng)）。顯然，當(dāng)A選擇不進(jìn)入時(shí)，B仍選擇不進(jìn)入是不合理的，B的戰(zhàn)略是不可置信的。只有均衡②是合理的：如果A進(jìn)入，B不進(jìn)入；如果A不進(jìn)入，B進(jìn)入。因?yàn)锳是先行動(dòng)者，理性的A會(huì)選擇“進(jìn)入”（他知道B是理性的，B不會(huì)選擇“進(jìn)入”），而理性的B選擇“不進(jìn)入”。觀察博弈樹上的三個(gè)均衡中，B的不可置信戰(zhàn)略中的反應(yīng)，在第二階段B開始行動(dòng)的兩個(gè)子博弈中不是最優(yōu)；而合理的納什均衡中，B的戰(zhàn)略在所有子博弈中都是最優(yōu)的，與A的第一階段可能選擇的行動(dòng)構(gòu)成該子博弈的納什均衡。五、試給出下述信號(hào)博弈的純戰(zhàn)略均衡中的混同均衡和分離均衡(8,1)(1,2)發(fā)送者(2,7)(10,8)接收者自然接收者(6,5)（4,1）發(fā)送者(7,3)(3,7)解：有四種可能：混同均衡，，分離均衡，，設(shè)為接收者看見時(shí)認(rèn)為發(fā)送者是的后驗(yàn)概率?？矗瑒t，非均衡路徑上當(dāng)接收者看見，選的支付為選的支付為故選。當(dāng)接收者看見，選的支付為選的支付為當(dāng)選，接收者會(huì)選，得支付10，要求不選，對(duì)無要求，因總會(huì)選。當(dāng)選，接收者會(huì)選，得支付3，要求不選是不可能的，因選是占優(yōu)于選的，故此混同均衡，不存在。再看混同均衡，此時(shí)為非均衡路徑上的后驗(yàn)概率，當(dāng)接收者看見，選的支付為選的支付為故接收者必選。當(dāng)接收者看見時(shí)，選的支付為選的支付為故必選。這樣，無論發(fā)送者發(fā)出或信號(hào)，接收者總選，給定接收者總是選。會(huì)選，會(huì)選。故，不是混同均衡?？捶蛛x均衡，，接收者看見時(shí)，必選接收者看見時(shí)，必選此時(shí)，選，選故，是一個(gè)分離均衡。最后看分離均衡，，接收者看見時(shí)，必選接收者看見時(shí)，必選給定接收者總選，故，不是分離均衡。故只有一個(gè)純戰(zhàn)略子博弈精煉分離均衡鷹-鴿(Hawk-Dove)博弈

(1)

參與人：爭(zhēng)食的兩只動(dòng)物-動(dòng)物1和動(dòng)物2。

動(dòng)物1和動(dòng)物2的行動(dòng)空間都是一樣的，即：Ai={鷹，鴿}

i=1，2

支付矩陣如下：

(2)

此博弈屬于完全信息靜態(tài)博弈，根據(jù)奇數(shù)定理知道共有三個(gè)納什均衡，兩個(gè)純策略納什均衡和一個(gè)混合策略納什均衡。

兩個(gè)純策略納什均衡是：(鷹，鴿)和(鴿，鷹)?；旌喜呗约{什均衡是：動(dòng)物1和動(dòng)物2分別以50%的概率隨機(jī)地選擇鷹(象鷹一樣行動(dòng))或者鴿(象鴿一樣行動(dòng))。

純策略納什均衡可以用劃線法或箭頭法求解?；旌喜呗约{什均衡則可根據(jù)無差異原則求解概率分布，即：

首先，動(dòng)物1應(yīng)該以q的概率選擇鷹，以1-q的概率選擇鴿，使得動(dòng)物2在鷹或者鴿之間無差異，那么可得q*：由4(1-q)

q+3(1-q)

得q*=50%；

其次，動(dòng)物2應(yīng)該以a的概率選擇鷹，以1-a的概率選擇鴿，使得動(dòng)物1在鷹或者鴿之間無差異，那么可得a*：由4(1-a)

a+3(1-a)

得a*=50%。

(3)

此博弈實(shí)際就是一個(gè)斗雞博弈，在現(xiàn)實(shí)生活許多現(xiàn)象都與此類似，如市場(chǎng)進(jìn)入、前蘇聯(lián)與美國在世界各地爭(zhēng)搶地盤等。

七、狩獵博弈

此博弈同樣是一個(gè)完全信息靜態(tài)博弈，參與人是兩個(gè)獵人，他們的行動(dòng)是選擇獵鹿或者獵兔。支付矩陣如下：

根據(jù)劃線或箭頭法我們可以很容易地知道此博弈有兩個(gè)純策略納什均衡，即：(鹿，鹿)和(兔，兔)，也就是兩個(gè)獵人同時(shí)獵鹿或同時(shí)獵兔都是純策略納什均衡。

由于存在兩個(gè)純策略納什均衡，現(xiàn)實(shí)中究竟哪個(gè)均衡會(huì)出現(xiàn)就是一個(gè)問題，這是多重納什均衡下的困境。但是，比較兩個(gè)納什均衡，很容易發(fā)現(xiàn)兩人都獵鹿帕累托優(yōu)于兩人都獵兔，所以，對(duì)兩個(gè)獵人而言，都獵鹿是一個(gè)“更好”的納什均衡，因此，在現(xiàn)實(shí)中兩個(gè)人都決定獵鹿的可能性要更大一些。然而，正如盧梭所言，如果一只野兔碰巧經(jīng)過他們中的一個(gè)人附近，那么也許這個(gè)人會(huì)去獵兔而使獵鹿失敗，因?yàn)閮蓚€(gè)人都獵兔也是一個(gè)納什均衡，這就是人的自私性。

此外，在多個(gè)納什均衡下，博弈之外的其他因素有助于我們判斷哪個(gè)均衡會(huì)出現(xiàn)。比如，兩個(gè)獵人是好朋友，經(jīng)常合作，那么我們幾乎可以100%的肯定他們都會(huì)同時(shí)選擇獵鹿。如果他們是仇敵，那么我們可以肯定他們不會(huì)合作獵鹿，因此他們都會(huì)選擇各自獵兔。來源:考試大-考博考試不完全信息夫妻博弈混合策略均衡給定妻子分別以q,1-q的概率選擇時(shí)裝、足球，則丈夫選擇時(shí)裝、足球的期望收益相等，即1.q+0.(1-q)=0.q+3.(1-q)，解得妻子選擇時(shí)裝、足球的概率分別為（3/4，1/4）給定丈夫分別以p,1-p的概率選擇時(shí)裝、足球，則妻子選擇時(shí)裝、足球的期望收益相等，即2.p+0.(1-p)=0.p+1.(1-p)，解得妻子選擇時(shí)裝、足球的概率分別為（1/3，2/3）當(dāng)妻子以（3/4，1/4）的概率分布隨機(jī)選擇時(shí)裝表演和足球，丈夫以（1/3，2/3）的概率隨機(jī)選擇時(shí)裝表演和足球時(shí)，雙方都無法通過單獨(dú)改變策略，即單獨(dú)改變隨機(jī)選擇純策略的概率分布而提高利益，因此雙方的上述概率分布的組合構(gòu)成一個(gè)混合策略納什均衡。該混合策略納什均衡給妻子和丈夫各自帶來的期望收益分別為：q.p.2+q.(1-p).0+(1-q).p.0+(1-q).(1-p).1=2/3;q.p.1+q.(1-p).0+(1-q).p.0+(1-q).(1-p).3=3/4雙方的期望收益均小于純策略時(shí)的期望收益。某些靜態(tài)貝葉斯博弈的例子1、市場(chǎng)進(jìn)入博弈一個(gè)完全壟斷企業(yè)B正在壟斷一個(gè)行業(yè)市場(chǎng)，另一個(gè)潛在的試圖進(jìn)入該行業(yè)的企業(yè)A，稱A為進(jìn)入者，B為在位者。A不知道B的成本特征，設(shè)B有兩種可能的成本，即高成本和低成本。兩種成本情況下的博弈矩陣如表6.1。表6.1市場(chǎng)進(jìn)入博弈B高成本低成本默認(rèn)斗爭(zhēng)默認(rèn)斗爭(zhēng)A進(jìn)入40,50-10,030,80-10,100不進(jìn)入0,3000,3000,400假定B知道進(jìn)入者A的成本為高成本，且與B為高成本時(shí)的成本相同。假若信息是完全的，則當(dāng)B為高成本時(shí)，唯一的精煉納什均衡為（進(jìn)入，默認(rèn)），另一納什均衡（不進(jìn)入，斗爭(zhēng)）是含有不可置信的威脅。當(dāng)B為低成本時(shí)，唯一的納什均衡為（不進(jìn)入，斗爭(zhēng)），即若A進(jìn)入行業(yè)，具有低成本優(yōu)勢(shì)的B將通過降低價(jià)格將A逐出市場(chǎng)。由于存在行業(yè)進(jìn)入成本，所以A被逐出市場(chǎng)后將有凈的10單位進(jìn)入成本的損失。當(dāng)A不知道B的成本情況時(shí)，他的選擇將依賴于他對(duì)B的成本類型的主觀概率或先驗(yàn)概率密度。設(shè)A對(duì)B是高成本的先驗(yàn)概率判斷為，則A認(rèn)為B為低成本的概率為。如果A進(jìn)入，其期望支付為如果1不進(jìn)入，其期望支付為0。當(dāng)且僅當(dāng)或時(shí)，A選擇進(jìn)入；反之，當(dāng)時(shí)，A不進(jìn)入。于是，貝葉斯均衡為：（進(jìn)入，默認(rèn)），高成本，；（進(jìn)入，斗爭(zhēng)），低成本，；（不進(jìn)入，*），其中*表示可以是斗爭(zhēng)，也可以是默認(rèn)。2成本信息不對(duì)稱的古諾博弈例3.10給出的古諾博弈中，每個(gè)廠商的成本函數(shù)是共同知識(shí)。這里，我們假設(shè)每個(gè)廠商的成本函數(shù)是私人信息，具體規(guī)定如下：兩個(gè)企業(yè)生產(chǎn)相同產(chǎn)品在同一市場(chǎng)上進(jìn)行競(jìng)爭(zhēng)性銷售，市場(chǎng)需求函數(shù)為，，為產(chǎn)品價(jià)格，Q為市場(chǎng)需求量。假設(shè)充分大時(shí)總有，企業(yè)的成本函數(shù)為，其中為企業(yè)的總成本，為其產(chǎn)量，為其平均成本，為常數(shù)且，故也是邊際成本。是企業(yè)的私人信息，企業(yè)不知道但認(rèn)為在上呈均勻分布，，，。且進(jìn)一步假定在呈均勻分布是共同知識(shí)，，。企業(yè)的支付函數(shù)是其利潤(rùn)函數(shù)因故設(shè)靜態(tài)貝葉斯均衡為，則由均衡戰(zhàn)略的類型依存性有于是的期望支付為顯然，由概率分布密度的歸一化條件及在上呈均勻分布假設(shè)，有或即于是，一階條件：（6.5）同樣由對(duì)稱性有（6.6）在上式兩端對(duì)進(jìn)行積分（6.7）在式（6.5）兩端對(duì)積分

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

博弈論期末復(fù)習(xí)題

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

博弈論期末復(fù)習(xí)題

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔