版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
PAGEPAGE4一、支付矩陣1、試給出下述戰(zhàn)略式表述博弈的納什均衡BALRU1,32,5D4,16,2解:由劃線解得知有一個(gè)純戰(zhàn)略均衡()再看看它是否有混合戰(zhàn)略均衡設(shè)以玩混合戰(zhàn)略,則有均衡條件:得,這是不可能的,故無(wú)混合戰(zhàn)略均衡,只有這一個(gè)純戰(zhàn)略均衡。2、試將題一中的支付作一修改使其有混合戰(zhàn)略均衡解:由奇數(shù)定理,若使它先有兩個(gè)純戰(zhàn)略均衡,則很可能就有另一個(gè)混合戰(zhàn)略均衡。BALRU5,62,5D4,16,2將博弈改成上述模型,則得同樣,設(shè)的混合戰(zhàn)略為,則于是混合戰(zhàn)略均衡為。二、逆向歸納法1、用逆向歸納法的思路求解下述不完美信息博弈的子博弈精煉均衡1212(5,8)(6,7)(2,0)(3,4)(1,2)(3,4)解12112(5,8)(6,7)(2,0)(3,4)(1,2)(3,4)設(shè)在1的第二個(gè)信息集上,1認(rèn)為2選的概率為,則1選的支付1選的支付前兩個(gè)均衡的結(jié)果(進(jìn)入,不進(jìn)入),即A進(jìn)入,B不進(jìn)入;第二個(gè)均衡結(jié)果是(不進(jìn)入,進(jìn)入),即A不進(jìn)入,B進(jìn)入如果理論得到這樣的結(jié)果,無(wú)助于預(yù)測(cè)博弈參與人的行為。此外,納什均衡假定,每一個(gè)參與人選擇的最優(yōu)戰(zhàn)略是在所有其他參與人的戰(zhàn)略選擇給定時(shí)的最優(yōu)反應(yīng),即參與人并不考慮自己的選擇對(duì)其他人選擇的影響,因而納什均衡很難說(shuō)是動(dòng)態(tài)博弈的合理解。必須在多個(gè)納什均衡中剔除不合理的均衡解,即所謂“不可置信威脅”。子博弈精煉納什均衡是對(duì)納什均衡概念的最重要的改進(jìn)。它的目的是把動(dòng)態(tài)博弈中的“合理納什均衡”與“不合理納什均衡”分開(kāi)。正如納什均衡是完全信息靜態(tài)博弈解的基本慨念一樣,子博弈精煉納什均衡是完全信息動(dòng)態(tài)博弈解的基本概念。①{不進(jìn)入,(進(jìn)入,進(jìn)入)}②{進(jìn)入,(不進(jìn)入,進(jìn)入)}③{進(jìn)入,(不進(jìn)入,不進(jìn)入)}前邊得到的三個(gè)納什均衡中,均衡①意味著當(dāng)A不進(jìn)入時(shí),B選擇進(jìn)入;而當(dāng)A選擇進(jìn)入時(shí),B仍選擇進(jìn)入(B威脅無(wú)論如何都要進(jìn)入市場(chǎng))。顯然,當(dāng)A選擇進(jìn)入時(shí),B仍選擇進(jìn)入是不合理的,如果A進(jìn)入市場(chǎng),B選擇“不進(jìn)入”比選擇“進(jìn)入”收益要更大,理性的B不會(huì)選擇進(jìn)入,而A知道B是理性的,因此也不會(huì)把該戰(zhàn)略視為B會(huì)選擇的戰(zhàn)略。因此,B的戰(zhàn)略(進(jìn)入,進(jìn)入)是不可置信威脅。①{不進(jìn)入,(進(jìn)入,進(jìn)入)}②{進(jìn)入,(不進(jìn)入,進(jìn)入)}③{進(jìn)入,(不進(jìn)入,不進(jìn)入)}均衡③意味著當(dāng)A進(jìn)入時(shí),B選擇不進(jìn)入;而當(dāng)A選擇不進(jìn)入時(shí),B仍選擇進(jìn)入(B威脅無(wú)論如何都不進(jìn)入市場(chǎng))。顯然,當(dāng)A選擇不進(jìn)入時(shí),B仍選擇不進(jìn)入是不合理的,B的戰(zhàn)略是不可置信的。只有均衡②是合理的:如果A進(jìn)入,B不進(jìn)入;如果A不進(jìn)入,B進(jìn)入。因?yàn)锳是先行動(dòng)者,理性的A會(huì)選擇“進(jìn)入”(他知道B是理性的,B不會(huì)選擇“進(jìn)入”),而理性的B選擇“不進(jìn)入”。觀察博弈樹(shù)上的三個(gè)均衡中,B的不可置信戰(zhàn)略中的反應(yīng),在第二階段B開(kāi)始行動(dòng)的兩個(gè)子博弈中不是最優(yōu);而合理的納什均衡中,B的戰(zhàn)略在所有子博弈中都是最優(yōu)的,與A的第一階段可能選擇的行動(dòng)構(gòu)成該子博弈的納什均衡。五、試給出下述信號(hào)博弈的純戰(zhàn)略均衡中的混同均衡和分離均衡(8,1)(1,2)發(fā)送者(2,7)(10,8)接收者自然接收者(6,5)(4,1)發(fā)送者(7,3)(3,7)解:有四種可能:混同均衡,,分離均衡,,設(shè)為接收者看見(jiàn)時(shí)認(rèn)為發(fā)送者是的后驗(yàn)概率。看,則,非均衡路徑上當(dāng)接收者看見(jiàn),選的支付為選的支付為故選。當(dāng)接收者看見(jiàn),選的支付為選的支付為當(dāng)選,接收者會(huì)選,得支付10,要求不選,對(duì)無(wú)要求,因總會(huì)選。當(dāng)選,接收者會(huì)選,得支付3,要求不選是不可能的,因選是占優(yōu)于選的,故此混同均衡,不存在。再看混同均衡,此時(shí)為非均衡路徑上的后驗(yàn)概率,當(dāng)接收者看見(jiàn),選的支付為選的支付為故接收者必選。當(dāng)接收者看見(jiàn)時(shí),選的支付為選的支付為故必選。這樣,無(wú)論發(fā)送者發(fā)出或信號(hào),接收者總選,給定接收者總是選。會(huì)選,會(huì)選。故,不是混同均衡??捶蛛x均衡,,接收者看見(jiàn)時(shí),必選接收者看見(jiàn)時(shí),必選此時(shí),選,選故,是一個(gè)分離均衡。最后看分離均衡,,接收者看見(jiàn)時(shí),必選接收者看見(jiàn)時(shí),必選給定接收者總選,故,不是分離均衡。故只有一個(gè)純戰(zhàn)略子博弈精煉分離均衡鷹-鴿(Hawk-Dove)博弈
(1)
參與人:爭(zhēng)食的兩只動(dòng)物-動(dòng)物1和動(dòng)物2。
動(dòng)物1和動(dòng)物2的行動(dòng)空間都是一樣的,即:Ai={鷹,鴿}
i=1,2
支付矩陣如下:
(2)
此博弈屬于完全信息靜態(tài)博弈,根據(jù)奇數(shù)定理知道共有三個(gè)納什均衡,兩個(gè)純策略納什均衡和一個(gè)混合策略納什均衡。
兩個(gè)純策略納什均衡是:(鷹,鴿)和(鴿,鷹)?;旌喜呗约{什均衡是:動(dòng)物1和動(dòng)物2分別以50%的概率隨機(jī)地選擇鷹(象鷹一樣行動(dòng))或者鴿(象鴿一樣行動(dòng))。
純策略納什均衡可以用劃線法或箭頭法求解?;旌喜呗约{什均衡則可根據(jù)無(wú)差異原則求解概率分布,即:
首先,動(dòng)物1應(yīng)該以q的概率選擇鷹,以1-q的概率選擇鴿,使得動(dòng)物2在鷹或者鴿之間無(wú)差異,那么可得q*:由4(1-q)
=
q+3(1-q)
得q*=50%;
其次,動(dòng)物2應(yīng)該以a的概率選擇鷹,以1-a的概率選擇鴿,使得動(dòng)物1在鷹或者鴿之間無(wú)差異,那么可得a*:由4(1-a)
=
a+3(1-a)
得a*=50%。
(3)
此博弈實(shí)際就是一個(gè)斗雞博弈,在現(xiàn)實(shí)生活許多現(xiàn)象都與此類(lèi)似,如市場(chǎng)進(jìn)入、前蘇聯(lián)與美國(guó)在世界各地爭(zhēng)搶地盤(pán)等。
七、狩獵博弈
此博弈同樣是一個(gè)完全信息靜態(tài)博弈,參與人是兩個(gè)獵人,他們的行動(dòng)是選擇獵鹿或者獵兔。支付矩陣如下:
根據(jù)劃線或箭頭法我們可以很容易地知道此博弈有兩個(gè)純策略納什均衡,即:(鹿,鹿)和(兔,兔),也就是兩個(gè)獵人同時(shí)獵鹿或同時(shí)獵兔都是純策略納什均衡。
由于存在兩個(gè)純策略納什均衡,現(xiàn)實(shí)中究竟哪個(gè)均衡會(huì)出現(xiàn)就是一個(gè)問(wèn)題,這是多重納什均衡下的困境。但是,比較兩個(gè)納什均衡,很容易發(fā)現(xiàn)兩人都獵鹿帕累托優(yōu)于兩人都獵兔,所以,對(duì)兩個(gè)獵人而言,都獵鹿是一個(gè)“更好”的納什均衡,因此,在現(xiàn)實(shí)中兩個(gè)人都決定獵鹿的可能性要更大一些。然而,正如盧梭所言,如果一只野兔碰巧經(jīng)過(guò)他們中的一個(gè)人附近,那么也許這個(gè)人會(huì)去獵兔而使獵鹿失敗,因?yàn)閮蓚€(gè)人都獵兔也是一個(gè)納什均衡,這就是人的自私性。
此外,在多個(gè)納什均衡下,博弈之外的其他因素有助于我們判斷哪個(gè)均衡會(huì)出現(xiàn)。比如,兩個(gè)獵人是好朋友,經(jīng)常合作,那么我們幾乎可以100%的肯定他們都會(huì)同時(shí)選擇獵鹿。如果他們是仇敵,那么我們可以肯定他們不會(huì)合作獵鹿,因此他們都會(huì)選擇各自獵兔。來(lái)源:考試大-考博考試不完全信息夫妻博弈混合策略均衡給定妻子分別以q,1-q的概率選擇時(shí)裝、足球,則丈夫選擇時(shí)裝、足球的期望收益相等,即1.q+0.(1-q)=0.q+3.(1-q),解得妻子選擇時(shí)裝、足球的概率分別為(3/4,1/4)給定丈夫分別以p,1-p的概率選擇時(shí)裝、足球,則妻子選擇時(shí)裝、足球的期望收益相等,即2.p+0.(1-p)=0.p+1.(1-p),解得妻子選擇時(shí)裝、足球的概率分別為(1/3,2/3)當(dāng)妻子以(3/4,1/4)的概率分布隨機(jī)選擇時(shí)裝表演和足球,丈夫以(1/3,2/3)的概率隨機(jī)選擇時(shí)裝表演和足球時(shí),雙方都無(wú)法通過(guò)單獨(dú)改變策略,即單獨(dú)改變隨機(jī)選擇純策略的概率分布而提高利益,因此雙方的上述概率分布的組合構(gòu)成一個(gè)混合策略納什均衡。該混合策略納什均衡給妻子和丈夫各自帶來(lái)的期望收益分別為:q.p.2+q.(1-p).0+(1-q).p.0+(1-q).(1-p).1=2/3;q.p.1+q.(1-p).0+(1-q).p.0+(1-q).(1-p).3=3/4雙方的期望收益均小于純策略時(shí)的期望收益。某些靜態(tài)貝葉斯博弈的例子1、市場(chǎng)進(jìn)入博弈一個(gè)完全壟斷企業(yè)B正在壟斷一個(gè)行業(yè)市場(chǎng),另一個(gè)潛在的試圖進(jìn)入該行業(yè)的企業(yè)A,稱(chēng)A為進(jìn)入者,B為在位者。A不知道B的成本特征,設(shè)B有兩種可能的成本,即高成本和低成本。兩種成本情況下的博弈矩陣如表6.1。表6.1市場(chǎng)進(jìn)入博弈B高成本低成本默認(rèn)斗爭(zhēng)默認(rèn)斗爭(zhēng)A進(jìn)入40,50-10,030,80-10,100不進(jìn)入0,3000,3000,400假定B知道進(jìn)入者A的成本為高成本,且與B為高成本時(shí)的成本相同。假若信息是完全的,則當(dāng)B為高成本時(shí),唯一的精煉納什均衡為(進(jìn)入,默認(rèn)),另一納什均衡(不進(jìn)入,斗爭(zhēng))是含有不可置信的威脅。當(dāng)B為低成本時(shí),唯一的納什均衡為(不進(jìn)入,斗爭(zhēng)),即若A進(jìn)入行業(yè),具有低成本優(yōu)勢(shì)的B將通過(guò)降低價(jià)格將A逐出市場(chǎng)。由于存在行業(yè)進(jìn)入成本,所以A被逐出市場(chǎng)后將有凈的10單位進(jìn)入成本的損失。當(dāng)A不知道B的成本情況時(shí),他的選擇將依賴(lài)于他對(duì)B的成本類(lèi)型的主觀概率或先驗(yàn)概率密度。設(shè)A對(duì)B是高成本的先驗(yàn)概率判斷為,則A認(rèn)為B為低成本的概率為。如果A進(jìn)入,其期望支付為如果1不進(jìn)入,其期望支付為0。當(dāng)且僅當(dāng)或時(shí),A選擇進(jìn)入;反之,當(dāng)時(shí),A不進(jìn)入。于是,貝葉斯均衡為:(進(jìn)入,默認(rèn)),高成本,;(進(jìn)入,斗爭(zhēng)),低成本,;(不進(jìn)入,*),其中*表示可以是斗爭(zhēng),也可以是默認(rèn)。2成本信息不對(duì)稱(chēng)的古諾博弈例3.10給出的古諾博弈中,每個(gè)廠商的成本函數(shù)是共同知識(shí)。這里,我們假設(shè)每個(gè)廠商的成本函數(shù)是私人信息,具體規(guī)定如下:兩個(gè)企業(yè)生產(chǎn)相同產(chǎn)品在同一市場(chǎng)上進(jìn)行競(jìng)爭(zhēng)性銷(xiāo)售,市場(chǎng)需求函數(shù)為,,為產(chǎn)品價(jià)格,Q為市場(chǎng)需求量。假設(shè)充分大時(shí)總有,企業(yè)的成本函數(shù)為,其中為企業(yè)的總成本,為其產(chǎn)量,為其平均成本,為常數(shù)且,故也是邊際成本。是企業(yè)的私人信息,企業(yè)不知道但認(rèn)為在上呈均勻分布,,,。且進(jìn)一步假定在呈均勻分布是共同知識(shí),,。企業(yè)的支付函數(shù)是其利潤(rùn)函數(shù)因故設(shè)靜態(tài)貝葉斯均衡為,則由均衡戰(zhàn)略的類(lèi)型依存性有于是的期望支付為顯然,由概率分布密度的歸一化條件及在上呈均勻分布假設(shè),有或即于是,一階條件:(6.5)同樣由對(duì)稱(chēng)性有(6.6)在上式兩端對(duì)進(jìn)行積分(6.7)在式(6.5)兩端對(duì)積分
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權(quán)】 ISO/IEC 18181-3:2025 EN Information technology - JPEG XL image coding system - Part 3: Conformance testing
- 2025-2030年中國(guó)植物蛋白飲料市場(chǎng)運(yùn)行狀況及前景趨勢(shì)分析報(bào)告
- 2025-2030年中國(guó)柴胡行業(yè)運(yùn)行狀況及投資前景趨勢(shì)分析報(bào)告
- 2025-2030年中國(guó)智能無(wú)功功率補(bǔ)償控制器市場(chǎng)發(fā)展趨勢(shì)與十三五規(guī)劃研究報(bào)告
- 2025-2030年中國(guó)扁平材市場(chǎng)前景分析及投資策略研究報(bào)告
- 2025-2030年中國(guó)可再分散乳膠粉行業(yè)市場(chǎng)運(yùn)行動(dòng)態(tài)分析與營(yíng)銷(xiāo)策略研究報(bào)告
- 2025-2030年中國(guó)冰晶石市場(chǎng)規(guī)模分析及投資策略研究報(bào)告
- 2025-2030年中國(guó)三元乙丙橡膠防水材料市場(chǎng)發(fā)展?fàn)顩r及投資策略研究報(bào)告
- 二零二五版建筑安裝工程節(jié)能評(píng)估合同模板2篇
- 二零二五年機(jī)關(guān)單位勞動(dòng)合同續(xù)簽與解約操作指南3篇
- 山東萊陽(yáng)核電項(xiàng)目一期工程水土保持方案
- 白熊效應(yīng)(修訂版)
- 小學(xué)數(shù)學(xué)知識(shí)結(jié)構(gòu)化教學(xué)
- 視頻監(jiān)控維保項(xiàng)目投標(biāo)方案(技術(shù)標(biāo))
- 社會(huì)組織能力建設(shè)培訓(xùn)
- 立項(xiàng)報(bào)告蓋章要求
- 2022年睪丸腫瘤診斷治療指南
- 被執(zhí)行人給法院執(zhí)行局寫(xiě)申請(qǐng)范本
- 主變壓器試驗(yàn)報(bào)告模板
- 安全防護(hù)通道施工方案
- 視覺(jué)元素對(duì)心理感知的影響
評(píng)論
0/150
提交評(píng)論