版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第二章 完全信息靜態(tài)博弈 本章介紹完全信息靜態(tài)博弈。完全信息靜態(tài)博弈各博弈方同時決策,且所有博弈方對各方得益都了解的博弈。囚徒的困境、齊威王田忌賽馬、猜硬幣、石頭剪子布、古諾產(chǎn)量決策都屬于這種博弈。完全信息靜態(tài)博弈屬于非合作博弈最基本的類型。本章介紹完全信息靜態(tài)博弈的一般分析方法、納什均衡概念、各種經(jīng)典模型及其應(yīng)用等。 1本章分六節(jié)2.1基本分析思路和方法2.2納什均衡2.3無限策略博弈分析和反應(yīng)函數(shù)2.4混合策略和混合策略納什均衡2.5納什均衡的存在性2.6納什均衡的選擇和分析方法擴(kuò)展22.1 基本分析思路和方法2.1.1 上策均衡2.1.2 嚴(yán)格下策反復(fù)消去法2.1.3 劃線法2.1.4
2、箭頭法32.1.1 上策均衡基本分析思路和方法 在某個博弈中,如果不管其它博弈方選擇什么策略,一博弈方的某個策略給他帶來的得益始終高于其他策略,至少不低于其他策略。這時我們不難理解,上述“某個策略”必然是該博弈方愿意選擇的策略。例如囚徒困境博弈中的“坦白”就是這樣的策略(對兩個博弈方都成立)。4Cont我們稱這種策略為該博弈方的一個“上策”(Dominant-strategy)。 進(jìn)一步,如果一個博弈的某個策略組合中的所有策略都是各個博弈方各自的上策,那么這個策略組合肯定是所有博弈方都愿意選擇的,必然是該博弈比較穩(wěn)定的果。5Cont我們稱這樣的策略組合為該博弈的一個“上策均衡”( Domina
3、nt-strategy Equilibrium)。上策均衡是博弈分析中最基本的均衡概念之一,上策均衡分析是最基本的博弈分析方法。囚徒的困境中的(坦白,坦白)實際上就是一個上策均衡“坦白”對該博弈的兩個博弈方來說都是上策。62.1.1 上策均衡應(yīng)用上策:不管其它博弈方選擇什么策略,一博弈方的某個策略給他帶來的得益始終高于其它的策略,至少不低于其他策略的策略。 囚徒的困境中的“坦白”;雙寡頭削價中“低價”。-5, -50, -8-8, 0-1, -1坦 白不坦白坦 白不坦白兩個罪犯的得益矩陣囚徒 2囚徒17Cont100,10020,105150,2070,70高 價低 價高 價低 價寡頭2寡頭1
4、雙寡頭的得益矩陣8上策均衡上策均衡:一個博弈的某個策略組合中的所有策略都是各個博弈方各自的上策,必然是該博弈比較穩(wěn)定的結(jié)果上策均衡不是普遍存在的9Cont100,10020,105150,2070,70高 價低 價高 價低 價寡頭2寡頭1雙寡頭的得益矩陣5,14,49,-10,0按等待按等待小豬大豬智豬博弈的得益矩陣102.1.2基本分析思路和方法- 嚴(yán)格下策反復(fù)消去法一、思路和原理 反思上策均衡分析的思路,不難發(fā)現(xiàn)上策均衡分析采用的決策思路是一種選擇法的思路,是在所有可選擇策略中選出最好一種地思路。實際上,選擇是指人們在決策活動所運用的一種策略思路而不是全部的決策思路,人們在決策活動中還會采
5、用另外的決策思慮。排除的思路,也就是所謂的排除法,就是其中最常運用的一種。11續(xù)排除法與選擇法在形式上正好相反,它是通過對可選策略的相互比較,把不可能采用的較差策略排除掉,從而篩選出較好的策略,或者至少縮小候選策略的范圍。這種排除法的思路導(dǎo)出了博弈分析中的嚴(yán)格下策反復(fù)消去法。 對囚徒的困境博弈中的兩個博弈方來說不管對方的策略如何,各自兩種可選策略中的“坦白”策略都比“不坦白”策略來得好。12續(xù)這時我們稱“不坦白”是兩個博弈中的相對于“坦白”策略的 “嚴(yán)格下策”。一般地,如果在一個博弈中,不管其他博弈方的策略如何變化,一個博弈方的某種策略給他帶來的得益,總是比另一種策略給他帶來的得益要小,那么我
6、們稱前一種策略為相對于后一種策略的一個“嚴(yán)格下策”。若對一個博弈運用嚴(yán)格下策反復(fù)消去法后,整個博弈方只有唯一的策略幸存下來,那么該策略將是該博弈方的唯一選擇,如果該博弈的策略組合中只有唯一一個幸存下來,這個策略組合就是該博弈的結(jié)果。如囚徒的困境的博弈中的(坦白,坦白)。13 2.1.2 嚴(yán)格下策反復(fù)消去法應(yīng)用嚴(yán)格下策:不管其它博弈方的策略如何變化,給一個博弈方帶來的收益總是比另一種策略給他帶來的收益小的策略嚴(yán)格下策反復(fù)消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中142.1.3 劃線法的基本思想博弈方的最終目標(biāo)都是實現(xiàn)自身的最大得益。在具有策略
7、和利益相互依存性的博弈問題中,各個博弈方的得益既取決于自己選擇的策略,還與其他博弈方選擇的策略有關(guān),因此,博弈方在決策時必須考慮其他博弈方的存在和策略選擇。根據(jù)這種思想,科學(xué)的決策思路應(yīng)該是:先找出自己針對其他博弈方每種策略或策略組合配合,給自己帶來最大得益的策略(這種相對最佳對策總是存在的,不過不一定惟一),然后在此基礎(chǔ)上,通過對其他博弈方策略選擇的判斷,包括對其他博弈方對自己策略判斷的判斷等,預(yù)測博弈的可能結(jié)果和確定自己的最優(yōu)策略。152.1.3 劃線法應(yīng)用1, 01, 30, 10, 40, 22, 0-5, -50, -8-8, 0-1, -1囚徒困境-1, 11, -11, -1-1
8、, 1猜硬幣2, 10, 00, 01, 3性別之爭162.1.4 箭頭法的基本思想與應(yīng)用1, 01, 30, 10, 40, 22, 0-5, -50, -8-8, 0-1, -1囚徒困境-1, 11, -11, -1-1, 1猜硬幣2, 10, 00, 01, 3夫妻之爭172.2 納什均衡2.2.1 納什均衡的定義2.2.2 納什均衡的一致預(yù)測性質(zhì)2.2.3 納什均衡與嚴(yán)格下策反復(fù)消去法182.2.1 納什均衡的定義策略空間:博弈方 的第 個策略:博弈方 的得益:博弈:納什均衡:在博弈 中,如果由各個博弈方的各一個策略組成的某個策略組合 中,任一博弈方 的策略,都是對其余博弈方策略的組合
9、 的最佳對策,也即 對任意 都成立,則稱 為 的一個納什均衡19納什均衡:給定你的策略,我的策略是最優(yōu)的,給定我的策略,你的策略是最優(yōu)的或者用另外一種形式表示, 是下述最大化問題的解注意到上述定義中,可以取等號,這樣的納什均衡稱為弱納什均衡。如果 則稱 是一個強(qiáng)(strict or strong)納什均衡.也就是說一個納是均衡什強(qiáng)的,給定其它人的略,每個參與人的最優(yōu)策略是唯一的。20納什均衡de具體表述(低價,低價)是納什均衡100,10020,105150,2070,70高 價低 價高 價低 價寡頭2寡頭1雙寡頭的得益矩陣21納什均衡的直觀理解納什均衡 的每一個策略稱為納什均衡戰(zhàn)略 ,那么沒
10、有任何一個戰(zhàn)略嚴(yán)格優(yōu)于納什均衡戰(zhàn)略。為了理解納什均衡,從另一個角度思考:假設(shè)在博弈之前n個參與人達(dá)成一個協(xié)議,規(guī)定每一個參與人選擇一個特定的策略,令 代表這個協(xié)議。我們要問在其他參與人都遵守這個協(xié)議,在沒有外在強(qiáng)制的情況下是否有任何參與人有積極性不遵守這個協(xié)議?顯然理性的參與人只有在遵守協(xié)議帶來的效用大于不遵守協(xié)議帶來的效用時,一個人才會遵守這個協(xié)議。如果沒有任何人有積極性不遵守這個協(xié)議,那么這個協(xié)議是可以22納什均衡的直觀理解(續(xù))自動實施的(self-enforcing),這個協(xié)議就構(gòu)成一個納什均衡。自動實施的(self-enforcing)在團(tuán)隊中的應(yīng)用。232.2.2 納什均衡的一致預(yù)
11、測性質(zhì)一致預(yù)測:如果所有博弈方都預(yù)測一個特定博弈結(jié)果會出現(xiàn),所有博弈方都不會利用該預(yù)測或者這種預(yù)測能力選擇與預(yù)測結(jié)果不一致的策略,即沒有哪個博弈方有偏離這個預(yù)測結(jié)果的愿望,因此預(yù)測結(jié)果會成為博弈的最終結(jié)果只有納什均衡才具有一致預(yù)測的性質(zhì)一致預(yù)測性是納什均衡的本質(zhì)屬性一致預(yù)測并不意味著一定能準(zhǔn)確預(yù)測,因為有多重均衡,預(yù)測不一致的可能242.2.3 納什均衡與嚴(yán)格下策反復(fù)消去法上策均衡定是納什均衡,但納什均衡不一定是上策均衡命題2.1:在n個博弈方的博弈 中,如果嚴(yán)格下策反復(fù)消去法排除了除 之外的所有策略組合,那么 一定是該博弈的唯一的納什均衡命題2.2:在n個博弈方的博弈中 中,如果 是 的 一
12、個納什均衡,那么嚴(yán)格下策反復(fù)消去法一定不會將它消去 上述兩個命題保證在進(jìn)行納什均衡分析之前先通過嚴(yán)格下策反復(fù)消去法簡化博弈是可行的25尋找納什均衡一個應(yīng)用模型描述:略納什均衡:(進(jìn)入,默許) 強(qiáng)納什均衡 (不進(jìn)入,斗爭)弱納什均衡40,50-10,00,3000,300默許斗爭進(jìn)入不進(jìn)入在位者進(jìn)入者市場進(jìn)入博弈262.3 無限策略分析和反應(yīng)函數(shù)2.3.1 古諾的寡頭模型2.3.2 反應(yīng)函數(shù)2.3.3 伯特蘭德寡頭模型2.3.4 公共資源問題2.3.5 反應(yīng)函數(shù)的問題和局限性272.3.1 古諾的寡頭模型二企業(yè)Cournot模型 (無限策略博弈) 古諾( Cournot ,1838),比納什(1
13、950)的定義早100年假設(shè)條件:在一個寡頭市場上兩企業(yè)生產(chǎn)銷售同質(zhì)產(chǎn)品,市場總產(chǎn)量Q = q1+q2 (兩寡頭企業(yè)就是指這兩家企業(yè)壟斷了某一行業(yè)的市場) 市場出清價格 P = 8 - Q生產(chǎn)無固定成本,邊際成本 c=c1=c2=2兩企業(yè)同時獨立地決定各自的生產(chǎn)產(chǎn)量(q1, q2)問題:兩家企業(yè)應(yīng)如何決策?28古諾的寡頭模型分析企業(yè)1的利潤(得益):u 1 (q1, q2) = Pq1 c1q1 = (8-Q) q1 - 2q1 = 6 q1- q1 q2- q12 企業(yè)2的得益:u 2 (q1, q2) = Pq2 c2q2 = (8-Q) q2 - 2q2 = 6 q2- q1 q2- q
14、2229古諾的寡頭模型分析(續(xù))設(shè)(q1*, q2*)是一納什均衡,由聯(lián)立求解: max q1 u 1 (q1, q2*) = max q1 (6 q1- q1 q2*- q12) max q2 u 2 (q1*, q2) = max q2 (6 q2- q1* q2- q22) 有 6- q2*- 2q1* =0 6- q1*- 2q2* =0其靜態(tài)博弈模型有唯一納什均衡:(q1*, q2*) =(2, 2)使市場總產(chǎn)量 Q* =q1*+q2*=4,市場出清價格 P*= 8 - Q*得二企業(yè)總得益:U *= u 1* + u 2*=4 +4=830古諾的寡頭模型分析(續(xù))二企業(yè)總得益:U =
15、 QP (Q) - cQ = 6Q- Q2有 6 - 2Q* =0 , 使最大產(chǎn)量Q* =3 , 即(q1*, q2*) =(1.5, 1.5)使二企業(yè)最大總得益:U* = u 1* + u 2*=4 .5 + 4.5 = 9 8 結(jié)論: 根據(jù)總體利益最大化確定的產(chǎn)量效率高于根據(jù)企業(yè)個體利益最大化確定的產(chǎn)量效率.314.5,4.55,3.753.75,54,4不突破突破廠商2不突破 突破廠商1以自身最大利益為目標(biāo):各生產(chǎn)2單位產(chǎn)量,各自得益為4以兩廠商總體利益最大:各生產(chǎn)1.5單位產(chǎn)量,各自得益為4.5兩寡頭間的囚徒困境博弈322.3.2 反應(yīng)函數(shù)古諾模型的反應(yīng)函數(shù)(3,0)(6,0)(0,3
16、)(0,6)古諾模型的反應(yīng)函數(shù)圖示理性局限和古諾調(diào)整332.3.3 伯特蘭德(Bertrand)寡頭模型價格競爭寡頭的博弈模型產(chǎn)品無差別,消費者對價格不十分敏感342.3.3 伯特蘭德(Bertrand)寡頭模型(續(xù))解方程組得到納什均衡:P81也是囚徒困境模型(自己推導(dǎo))應(yīng)用(1)家電價格戰(zhàn) (2)失敗的彩電高峰會352.3.4 公共資源問題公共草地養(yǎng)羊問題以三農(nóng)戶為例 n=3,c=436合作:總體利益最大化競爭:個體利益最大化372.3.5 反應(yīng)函數(shù)的問題和局限性在許多博弈中,博弈方的策略是有限且非連續(xù)時,其得益函數(shù)不是連續(xù)可導(dǎo)函數(shù),無法求得反應(yīng)函數(shù),從而不能通過解方程組的方法求得納什均衡
17、。即使得益函數(shù)可以求導(dǎo),也可能各博弈方的得益函數(shù)比較復(fù)雜,因此各自的反應(yīng)函數(shù)也比較復(fù)雜,并不總能保證各博弈方的反應(yīng)函數(shù)有交點,特別不能保證有唯一的交點。382.4 混合策略和混合策略納什均衡2.4.1 嚴(yán)格競爭博弈和混合策略的引進(jìn)2.4.2 多重均衡博弈和混合策略2.4.3 混合策略和嚴(yán)格下策反復(fù)消去法2.4.4 混合策略反應(yīng)函數(shù)392.4.1 嚴(yán)格競爭博弈和混合策略的引進(jìn)一、猜硬幣博弈-1, 11, -11, -1-1, 1正 面反 面猜硬幣方蓋硬幣方正 面反 面(1)不存在前面定義的納什均衡策略組合(2)關(guān)鍵是不能讓對方猜到自己策略這類博弈很多,引出混合策略納什均衡概念40二、混合策略、混
18、合策略博弈 和混合策略納什均衡 混合策略:在博弈 中,博弈方 的策略空間為 ,則博弈方 以概率分布 隨機(jī)在其 個可選策略中選擇的“策略”,稱為一個“混合策略”,其中 對 都成立,且 混合策略擴(kuò)展博弈:博弈方在混合策略的策略空間(概率分布空間)的選擇看作一個博弈,就是原博弈的“混合策略擴(kuò)展博弈)。 混合策略納什均衡:包含混合策略的策略組合,構(gòu)成納什均衡。41三、一個例子該博弈無純策略納什均衡,可用混合策略納什均衡分析博弈方1的混合策略博弈方2的混合策略2, 35, 23, 11, 5CDAB博弈方2博弈方1 策略 得益博弈方1 (0.8,0.2) 2.6博弈方2 (0.8,0.2) 2.642四
19、、齊威王田忌賽馬3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,1 1,-11,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3pa上中下pb上中下pc上中下pd上中下pe上中下pf上中下pg上中下ph上中下pi上中下pj上中下pk上中下pl上中下田 忌齊威王得益矩陣431、齊威王田忌賽馬的博弈分析(Cont )Emperor Qi 的策略由上到下分別稱為策略a,b,c,d,e和f, Tian Ji 的策略由左到右分別
20、稱為策略g,h,i,j,k和l當(dāng)齊威王分別以概率pa,pb,pc,pd,pe,pf選擇策略a,b,c,d,e和f時,田忌 選擇g的期望得益-3pa-pb-pc+pd-pe-pf 選擇h的期望得益-pa-3pb+pc-pd-pe-pf 選擇i的期望得益-pa-pb-3pc-pd-pe+pf 選擇j的期望得益-pa-pb-pc-3pd+pe-pf 選擇k的期望得益pa-pb-3pc-pd-3pe-pf 選擇l的期望得益-pa+pb-pc-pd-pe-3pf44齊威王田忌賽馬的博弈分析(Cont )從這些表達(dá)式可以看出:田忌的期望得益是受齊威王選擇的概率的影響。所以齊威王希望他選擇的概率分布(pa,
21、pb,pc,pd,pe,pf)使田忌選任何策略都無可乘之機(jī)。也就是說上面6個期望得益相等。 解之得: pa=pb=pc=pd=pe=pf, 又因為: pa+pb+pc+pd+pe+pf=1 所以: pa=pb=pc=pd=pe=pf =1/6452、田忌賽馬結(jié)果No Nash equilibrium solution exist From the reward matrix, we can find the probability that Emperor Qi would have won the game is 30/36 = 5/6.The optimal strategy of Emp
22、eror Qi and Tian Ji is (1/6, 1/6, 1/6, 1/6, 1/6, 1/6) respectively46五、小偷和守衛(wèi)的博弈1996年3月Professor Selten于上海471、小偷和守衛(wèi)的博弈模型1、模型的描述 如小偷偷竊,守衛(wèi)睡覺,則小偷偷得臟物V (V0),守衛(wèi)有負(fù)效用D (政府對守衛(wèi)的懲罰 D0) 如小偷偷竊,守衛(wèi)不睡覺,則小偷被抓有負(fù)效用P (政府對小偷的懲罰 P0), 守衛(wèi)有效用 如小偷不偷竊,守衛(wèi)睡覺,則小偷有效用,守衛(wèi)有正效用S (S0) 如小偷不偷竊,守衛(wèi)不睡覺,則小偷與守衛(wèi)各有效用 V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷482
23、、小偷和守衛(wèi)的博弈特征(無純策略Nash均衡)非對稱的零和博弈,因為他們的得益沒有猜硬幣那樣對稱,但本質(zhì)上是一樣的,一是在一次性博弈中沒有自動實施的純策略Nash均衡;二是不能讓對對方預(yù)先猜測到自己的策略。 因此博弈方應(yīng)該隨機(jī)的方法來選擇策略不能讓對方有可乘之機(jī)。怎樣來隨機(jī)選擇各自的策略呢? 一是:代數(shù)方法;二是:圖示方法V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷493、小偷和守衛(wèi)的博弈分析一是:代數(shù)方法 假設(shè)小偷選擇“偷”策略的概率為pt ,選擇“不偷”策略的概率為1 pt ; 假設(shè)守衛(wèi)選擇 “睡” 策略的概率為pg ,選擇“不睡”策略的概率為1 pg;50小偷和守衛(wèi)的博弈分析(代數(shù)方
24、法) (續(xù))小偷的期望得益為: U1 = pt pg* V + (1 - pg*) (-P) + (1 - pt) 0守衛(wèi)的期望得益為: U2 = pg pt* (-D)+ (1 pt*) S + (1 pg) 0由小偷和守衛(wèi)期望得益最大化的一階條件:U1/ pt = 0 和 U2/ pg = 0,我們有 pt* = S / (S+D) 和 pg* = P / (V+P) 51小偷和守衛(wèi)的博弈分析(代數(shù)方法一) (續(xù)) 偷 pt* = S / (S+D) 和睡 pg* = P / (V+P) 小偷分別以概率pt* = S / (S+D)和 1- pt* = D / (S+D) 選擇“偷”與“不
25、偷” 策略, 即( S / (S+D) , D / (S+D) )守衛(wèi)分別以概率 pg* = P / (V+P)和 1- pg* = V / (V+P) 選擇“睡”與“不睡” 策略 即( P / (V+P) ,V / (V+P) )( S / (S+D) , D / (S+D) ), ( P / (V+P) ,V / (V+P) )構(gòu)成了小偷和守衛(wèi)博弈的唯一混合策略納什均衡 52小偷和守衛(wèi)的博弈分析(代數(shù)方法二) (續(xù))小偷選擇“偷”策略的概率為pt ,選擇“不偷”策略的概率為1 pt ;使得守衛(wèi)選擇睡與不睡無差異,即對 守衛(wèi): pt* (-D)+ (1 pt*) S =0整理得: -(D+S
26、) pt* + S =0同樣可分析小偷的得益(略)534、小偷和守衛(wèi)的博弈分析(圖示方法)小偷的決策:U守衛(wèi)睡 = pt (-D)+ (1 pt) S 前面分析時知道:小偷選擇“偷”與“不偷”時:U守衛(wèi)不睡 =0于是:直線與橫軸的交點就是小偷的最佳決策pt* 。V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷54Cont.0- D- D守衛(wèi)得益(睡)SPt 小偷偷的概率155小偷的決策(cont.)注意到:如果小偷偷,守衛(wèi)睡,則守衛(wèi)有D個單位的懲罰,若D增大到D ,則小偷的最佳決策偷將減少。V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷56Cont.0- D- D守衛(wèi)得益(睡)SPt 小偷偷
27、的概率157小偷和守衛(wèi)的博弈分析(圖示方法)(Cont)守衛(wèi)的決策: U小偷偷 = pgV + (1 - pg) (-P) 前面分析時知道:守衛(wèi)選擇“睡”與“不”時:U不偷 =0于是:直線與橫軸的交點就是守衛(wèi)的最佳決策pg* 。V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷58Cont0- P- P小偷得益(偷)VPg 守衛(wèi)睡的概略159守衛(wèi)的決策(cont.)注意到:如果守衛(wèi)不睡,小偷偷,則小偷被抓住有P個單位的懲罰,若P增大到P ,則守衛(wèi)的最佳決策睡將增加。V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷60Cont0- P- P小偷得益(偷)VPg 守衛(wèi)睡的概略1615、結(jié)果與實踐意義
28、激勵的悖論 (P97)通過前面的分析,增加對守衛(wèi)的懲罰作用,可以之犯罪有很好的作用。但小偷的懲罰D由于守衛(wèi)的收入P無關(guān)。為什么守衛(wèi)不睡呢?實踐:(1)黑農(nóng)江的污染事件(2)礦難62練習(xí)1: 社會福利博弈63練習(xí)2:監(jiān)督博弈642.4.2 多重均衡博弈和混合策略一、夫妻之爭的混合策略納什均衡2, 10, 00, 01, 3時 裝足 球時裝足球丈 夫妻子夫妻之爭妻子的混合策略丈夫的混合策略65夫妻之爭的混合策略納什均衡(cont.)夫妻之爭博弈的混合策略納什均衡 博弈方1 (0.75,0.25) 博弈方2 (1/3,2/3)考察在該混合均衡下的雙方得益妻子:pw(C)ph(C)*2+ph(F)*0
29、+pw(F)ph(C)*0+ph(F)*1 =3/4*1/3*2+1/4*2/3*1=0.67丈夫: pw(C)ph(C)*1+ph(F)*0+pw(F)ph(C)*0+ph(F)*3 =3/4*1/3*1+1/4*2/3*3=0.75若兩人協(xié)商選擇(時裝,時裝),(足球,足球)的一個其收益都大于0.67,0.75。溝通的重要性:夫妻,團(tuán)隊,人際關(guān)系,一些制式66二、制式問題-不同的原理or技術(shù)標(biāo)準(zhǔn)or.實踐意義:引進(jìn)技術(shù)、投資、開發(fā)產(chǎn)品等決策時,必 須以大局為重,各自為政會導(dǎo)致低效率。例如:重復(fù)建設(shè),產(chǎn)品不能相互帶動。1, 30, 00, 02, 2ABAB公司2公司1制式問題 制式問題混合
30、策略納什均衡 A B 得益廠商1: 0.4 0.6 0.664廠商2: 0.67 0.33 1.29667三、市場機(jī)會博弈-50,-50100,00,1000,0進(jìn)不 進(jìn)進(jìn)不進(jìn)廠商2廠商1市場機(jī)會 進(jìn) 不進(jìn) 得益廠商1: 2/3 1/3 0廠商2: 2/3 1/3 0682.4.3 混合策略和嚴(yán)格下策反復(fù)消去法結(jié)論:嚴(yán)格下策反復(fù)消去法既不會消去純策略Nash均衡也不會消去混合策略Nash均衡。對博弈方1和博弈方2,都沒有嚴(yán)格下策。但是博弈方1采用混合策略(1/2,1/2,0)時,博弈方2采用純策略L時,博弈方1的得益:U1=1/2*3+1/2*0+0*1=3/23, 10, 20, 23, 3
31、1, 31, 1LRUMD博弈方2博弈方169混合策略和嚴(yán)格下策反復(fù)消去法(cont)即使博弈方2也采用混合(q,1-q),博弈方1的得益:U1=1/2*q*3+1/2*(1-q)*0+1/2*q*0+ 1/2*(1-q)*3=3/2表明:策略D是相對于混合策略(1/2,1/2,0)的嚴(yán)格下策。于是刪去策略D得到又變得博弈。3, 10, 20, 23, 3LRUM博弈方2博弈方1702.4.4 混合策略de反應(yīng)函數(shù)反應(yīng)函數(shù)一博弈方對另一博弈方每種可能的決策內(nèi)容的最佳反應(yīng)決策構(gòu)成的函數(shù)。在混合策略中,博弈方的決策是概率分布,因此反應(yīng)函數(shù)是一方對另一方的概率分布的反應(yīng)。例1:猜硬幣博弈 用(r,1
32、-r)表示蓋硬幣方 的混合策略,用(q,1-q)表 示蓋硬幣方的混合策略。 那么反應(yīng)函數(shù)就是r和q的關(guān)系-1, 11, -11, -1-1, 1正 面q反 面1-q猜硬幣方正面 r反面1-r猜硬幣博弈蓋硬幣方712.4.4 混合策略反應(yīng)函數(shù) 猜硬幣博弈rq111/21/2(r,1-r):蓋硬幣方選擇正反面的混合策略概率分布(q,1-q):猜硬幣方選擇正反面的混合策略概率分布-1, 11, -11, -1-1, 1正 面q反 面1-q猜硬幣方正面 r反面1-r猜硬幣博弈蓋硬幣方72例2:夫妻之爭博弈2, 10, 00, 01, 3時裝q足球1-q丈夫時裝r球1-r妻子夫妻之爭rq111/31/3
33、(r,1-r):丈夫的混合策略概率分布(q,1-q):妻子的混合策略概率分布732.5 納什均衡的存在性Nash 定理(1950,Nash的存在性定理1 ): 在一個博弈G =S1, Sn ; u1, un ,如博弈方個數(shù)n有限, 博弈方的策略空間Si都為有限集,則該博弈至少存在一個Nash均衡,但可能包含混合策略Nash 定理:每一個有限博弈至少存在一個純策略的或混合策略的納什均衡。教材106頁證明。主要根據(jù)是布魯威爾和角谷的不動點定理。納什均衡的普遍存在性正是納什均衡成為非合作博弈分析核心概念的根本原因之一。742.5 納什均衡的存在性(Cont)納什均衡的奇數(shù)定理 威爾遜(Wilson)
34、在1971年證明,幾乎所有有限博弈都有有限奇數(shù)個納什均衡。如果一個博弈有2m(即偶數(shù)個)純策略納什均衡,則一定存在第2m+1個(即奇數(shù)個)混合策略納什均衡。 752.6 納什均衡的選擇和分析方法擴(kuò)展2.6.1 多重納什均衡博弈的分析2.6.2 共謀和防共謀均衡762.6.1 多重納什均衡博弈的分析帕累托上策均衡風(fēng)險上策均衡聚點均衡相關(guān)均衡77一、帕累托上策均衡有些博弈問題雖然存在著多個Nash均衡,但是所有博弈方明顯都對其中一個Nash均衡有相同的偏好,這個均衡稱為帕累托上策均衡例1:鷹鴿博弈經(jīng)典博弈 鷹鴿博弈并不是鷹鴿兩種動物之間的博弈,恰恰是同一物種、種群內(nèi)部競爭和沖突問題。78模型描述:
35、這個博弈中有兩個純策略納什均衡,(鷹,鷹)和(鴿,鴿)顯然后者帕累托優(yōu)于前者,所以, (鴿,鴿)是本博弈的一個帕累托上策均衡。(v-c/2), (v-c/2)c/3, v/3V/3, c/3v, v鷹鴿博弈方2鷹鴿博弈方1戰(zhàn)爭與和平79例2:國家之間的戰(zhàn)爭與和平問題這個博弈中有兩個純策略納什均衡,(戰(zhàn)爭,戰(zhàn)爭)和(和平,和平),顯然后者帕累托優(yōu)于前者,所以,(和平,和平)是本博弈的一個帕累托上策均衡。注意到:實際中, (和平,和平)并不容易實現(xiàn)。-5, -5-10, 88, -1010, 10戰(zhàn)爭和平國家2戰(zhàn)爭和平國家1戰(zhàn)爭與和平80例3:寡頭市場的價格競爭價格競爭類似國家的戰(zhàn)爭與和平的選擇。
36、于是人們常說:“價格戰(zhàn)”。價格戰(zhàn)企業(yè)核心競爭力81二、風(fēng)險上策均衡博弈模型1:純策略Nash均衡(U,L) and(D,R),且(U,L)為帕累托上策均衡?;旌喜呗訬ash均衡(7/8,1/8),( 7/8,1/8 )(求法略)注: (U,L)均衡一定能實現(xiàn)嗎?9, 98, 00, 87, 7LR博弈方2UD博弈方1風(fēng)險上策均衡(D,R)82風(fēng)險上策均衡的定義:雖然某個Nash均衡帕累托優(yōu)于另一個Nash均衡,但風(fēng)險卻要高于后者,為了規(guī)避風(fēng)險,博弈方必然趨于選擇后一個Nash均衡策略,這個Nash均衡稱為“風(fēng)險上策均衡”(Risk-dominant Equilibrium)例如:上例中(D,R
37、)為“風(fēng)險上策均衡”83獵鹿博弈(Stag-hunting game)模型描述P112(略)5, 53, 00, 33, 3鹿兔子獵人2鹿兔子獵人1獵鹿博弈風(fēng)險上策均衡(兔子,兔子)84三、聚點均衡(Focal Points Equilibrium)利用博弈設(shè)定以外的信息和依據(jù)選擇的均衡文化、習(xí)慣或者其他各種特征都可能是聚點均衡的依據(jù)城市博弈(城市分組相同)時間博弈(報出相同的時間)是聚點均衡的典型例子85四、相關(guān)均衡在博弈中遇到多重Nash均衡的難題時,博弈方就應(yīng)設(shè)計某種形式的均衡選擇機(jī)制,“相關(guān)均衡”就是在這種機(jī)制下選擇出的Nash均衡。86一個例子模型1:納什均衡:(U,L)、(D,R)
38、得益相差很大,雙方都不會妥協(xié)選擇某一個。聚點均衡(天氣,拋硬幣),但仍不理想。5, 14, 40, 01, 5LR博弈方2UD博弈方1相關(guān)均衡例子三個納什均衡:(U,L)、(D,R)和混合策略均衡(1/2,1/2),(1/2,1/2)結(jié)果都不理想,不如(D,L)。87Cont.同時混合策略也不是理想的結(jié)果。因為雙方的期望得益只有2.5。由于這3個Nash均衡都不會實現(xiàn)。必須設(shè)計一種機(jī)制:一是排出較差的組合(U,R),二是希望達(dá)到更好的組合(D,L).甑么11111論叢林88Cont.發(fā)出“相關(guān)信號”的相關(guān)裝置:1、各以1/3概率選擇A、B、C三種信號;2、博弈方1看到是否A,博弈方2看到是否C3、博弈方1見A采用U,否則D;博弈方2見C采用R,否則L。5, 14, 40, 01, 5LR博弈方2UD博弈方1相關(guān)均衡例子89Cont.該機(jī)制具有以下性質(zhì):(1)U,R不會同時出現(xiàn)(為什么?)即排出(U,R)(2)(U,L),(D,L),(D,R)各以1/3的概率出現(xiàn)。從而兩博弈方的期望得益達(dá)到10/3。(3)該裝置是一個Nash均衡。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度鋁合金門窗企業(yè)品牌戰(zhàn)略規(guī)劃與實施合同4篇
- 專項委托購買合同2024年版本3篇
- 個人提供翻譯服務(wù)2024年度合同2篇
- 二零二五年度芒果采摘與冷鏈物流一體化服務(wù)合同4篇
- 二零二五版基礎(chǔ)設(shè)施建設(shè)項目勞務(wù)分包招標(biāo)文件2篇
- 山西?。ㄌR汾地區(qū))重點名校2025屆中考一模生物試題含解析
- 2025屆江蘇省揚州市翠崗中考四模生物試題含解析
- 2025年度數(shù)碼配件代銷合作協(xié)議4篇
- 2025年度遺體告別儀式現(xiàn)場布置與用品供應(yīng)合同2篇
- 二零二五版國際教育交流項目合作協(xié)議3篇
- 滬教版數(shù)學(xué)六年級(上)第二章分?jǐn)?shù)課課練和單元練習(xí)卷及參考答案
- 承包意向書2024年
- 小學(xué)心理健康教師資格考試面試2024年下半年試題與參考答案
- (正式版)QC∕T 1206.2-2024 電動汽車動力蓄電池?zé)峁芾硐到y(tǒng) 第2部分:液冷系統(tǒng)
- (正式版)CB∕T 4550-2024 船舶行業(yè)企業(yè)安全設(shè)備設(shè)施管理規(guī)定
- 完整版肺癌護(hù)理查房課件
- 正規(guī)光伏屋頂租賃合同
- 敘事護(hù)理活動方案設(shè)計
- 小小科學(xué)家《物理》模擬試卷A(附答案)
- 醫(yī)療器械經(jīng)銷商會議
- 完整版-九年級科學(xué)科學(xué)公式
評論
0/150
提交評論