版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二講
完全信息靜態(tài)博弈
本章介紹完全信息靜態(tài)博弈。完全信息靜態(tài)博弈即各博弈方同時(shí)決策,且所有博弈方對(duì)各方得益都了解的博弈。囚徒的困境、齊威王田忌賽馬、猜硬幣、石頭剪子布、古諾產(chǎn)量決策都屬于這種博弈。完全信息靜態(tài)博弈屬于非合作博弈最基本的類(lèi)型。本章介紹完全信息靜態(tài)博弈的一般分析方法、納什均衡概念、各種經(jīng)典模型及其應(yīng)用等。
2.1基本分析思路和方法2.1.1上策均衡2.1.2嚴(yán)格下策反復(fù)消去法2.1.3劃線法2.1.4箭頭法2.1.1上策均衡上策:不管其它博弈方選擇什么策略,一博弈方的某個(gè)策略給他帶來(lái)的得益始終高于其它的策略,至少不低于其他策略的策略囚徒的困境中的“坦白”;雙寡頭削價(jià)中“低價(jià)”。上策均衡:一個(gè)博弈的某個(gè)策略組合中的所有策略都是各個(gè)博弈方各自的上策,必然是該博弈比較穩(wěn)定的結(jié)果.上策均衡不是普遍存在的
2.1.2嚴(yán)格下策反復(fù)消去法嚴(yán)格下策:不管其它博弈方的策略如何變化,給一個(gè)博弈方帶來(lái)的收益總是比另一種策略給他帶來(lái)的收益小的策略。嚴(yán)格下策反復(fù)消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中2.1.3劃線法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬幣2,10,00,01,3夫妻之爭(zhēng)2.2納什均衡2.2.1納什均衡的定義2.2.2納什均衡的一致預(yù)測(cè)性質(zhì)2.2.3納什均衡與嚴(yán)格下策反復(fù)消去法2.2.1納什均衡及應(yīng)用舉例關(guān)于納什均衡納什均衡是著名博弈論專(zhuān)家納什(JohnNash)對(duì)博弈論的重要貢獻(xiàn)之一。納什在1950年和1951年的兩篇重要論文中,在一般意義上給定了非合作博弈及其均衡解,并證明了解的存在性。納什的這一貢獻(xiàn)奠定了非合作博弈論的理論基礎(chǔ),納什所定義的均衡被稱(chēng)為“納什均衡”。諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者薩繆爾森有一句幽默的話:你可以將一只鸚鵡訓(xùn)練成經(jīng)濟(jì)學(xué)家,因?yàn)樗枰獙W(xué)習(xí)的只有兩個(gè)詞:供給與需求。博弈論專(zhuān)家坎多瑞引申說(shuō):要成為現(xiàn)代經(jīng)濟(jì)學(xué)家,這只鸚鵡必須再多學(xué)一個(gè)詞,這個(gè)詞就是“納什均衡”。通俗地說(shuō),納什均衡含義就是:給定你的策略,我的策略是最好的策略;給定我的策略,你的策略也是你最好的策略,即雙方在對(duì)方給定的策略下不愿意調(diào)整自己的策略。納什均衡符號(hào)解釋策略空間:博弈方的第個(gè)策略:博弈方的得益:博弈:在博弈中,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策略組合中,任一博弈方的策略si*,都是對(duì)其余博弈方策略的組合的最佳對(duì)策,即對(duì)任意都成立,則稱(chēng)為的一個(gè)“納什均衡”。2.2.2納什均衡的一致預(yù)測(cè)性質(zhì)
一致預(yù)測(cè):如果所有博弈方都預(yù)測(cè)一個(gè)特定博弈結(jié)果會(huì)出現(xiàn),所有博弈方都不會(huì)利用該預(yù)測(cè)或者這種預(yù)測(cè)能力選擇與預(yù)測(cè)結(jié)果不一致的策略,即沒(méi)有哪個(gè)博弈方有偏離這個(gè)預(yù)測(cè)結(jié)果的愿望,因此預(yù)測(cè)結(jié)果會(huì)成為博弈的最終結(jié)果只有納什均衡才具有一致預(yù)測(cè)的性質(zhì)一致預(yù)測(cè)性是納什均衡的本質(zhì)屬性一致預(yù)測(cè)并不意味著一定能準(zhǔn)確預(yù)測(cè),因?yàn)橛卸嘀鼐?,預(yù)測(cè)不一致的可能占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略占優(yōu)戰(zhàn)略是指一個(gè)參與人所有可選擇的戰(zhàn)略中嚴(yán)格優(yōu)于其他戰(zhàn)略的那個(gè)戰(zhàn)略,即是i的占優(yōu)戰(zhàn)略意味著對(duì)于所有的2.2納什均衡及應(yīng)用舉例重復(fù)剔除的占優(yōu)均衡注:重復(fù)剔除嚴(yán)格劣戰(zhàn)略的思路是,首先找到某個(gè)參與人的劣戰(zhàn)略(假定存在),把這個(gè)劣戰(zhàn)略剔除掉,重新構(gòu)建一個(gè)不包含已剔除戰(zhàn)略的新的博弈;然后再剔除掉這個(gè)新博弈中的某個(gè)參與人的劣戰(zhàn)略,一直到只剩下一個(gè)唯一的戰(zhàn)略組合為止。2.3納什均衡的應(yīng)用2.3.1古諾的寡頭模型2.3.2反應(yīng)函數(shù)2.3.3伯特蘭德寡頭模型2.3.4公共資源問(wèn)題2.3.5反應(yīng)函數(shù)的問(wèn)題和局限性2.3.1古諾的寡頭模型基本假設(shè)
1.一個(gè)市場(chǎng)有兩家廠商生產(chǎn)同一種產(chǎn)品,產(chǎn)量分為q1和q2。市場(chǎng)總產(chǎn)量為Q=q1十q2。
2.市場(chǎng)出清價(jià)格P(即可以將產(chǎn)品全部賣(mài)出去的價(jià)格)是市場(chǎng)總產(chǎn)量的函數(shù)P=P(Q)=a-q1-q2=8-Q。3.兩廠商沒(méi)有固定成本且單位生產(chǎn)成本相同,即4.兩廠商同時(shí)決定各自產(chǎn)量,即決策前不知道另一方產(chǎn)量。該博弈中兩博弈方的得益(即兩廠商各目的利潤(rùn))分別為:2.3.1古諾的寡頭模型如果假設(shè)策略組合(q1*,q2*)是本博弈的最終結(jié)果,則(q1*,q2*)必使得兩博弈方的得益達(dá)到最大值,即滿足:2.3.1古諾的寡頭模型兩式分別對(duì)q1、q2求偏導(dǎo)并令偏導(dǎo)數(shù)都等于零,由此可得q1*,q2*應(yīng)滿足方程組:解之得該方程組唯一的一組解:兩博弈方的均衡得益(利潤(rùn))分別為:當(dāng)有均衡總產(chǎn)量為:2.3.1古諾的寡頭模型若對(duì)上述博弈結(jié)果作效率評(píng)價(jià),可以再?gòu)膬蓮S商總體利益最大化的角度作一次產(chǎn)量選擇,根據(jù)市場(chǎng)條件求實(shí)現(xiàn)總得益(總利潤(rùn))最大的總產(chǎn)量。設(shè)總產(chǎn)量為Q,則總得益為:U=PQ-cQ=Q(8-Q)-2Q=6Q-Q2很容易求得使總得益最大的總產(chǎn)量:Q*=3最大總得益:U*=9172.3.1古諾的寡頭模型結(jié)論1結(jié)論2兩廠商的總體來(lái)看,根據(jù)總體利益最大化確定產(chǎn)量效率更高。換句話說(shuō),如果兩廠商更多考慮合作,先定出使總利益最大的產(chǎn)量,后各自生產(chǎn)1.5單位,則各自可分享到的利益為4.5,比只考慮自身利益的獨(dú)立決策行為得到的利益要高。
在獨(dú)立決策、缺乏協(xié)調(diào)機(jī)制的兩個(gè)企業(yè)之間,上述合作的結(jié)果并不容易實(shí)現(xiàn),即使實(shí)現(xiàn)了也往往是不穩(wěn)定的。原因主要是,在這個(gè)策略組合下,雙力都可以通過(guò)獨(dú)自改變(增加)自己的產(chǎn)量而得到更高的利潤(rùn)。184.5,4.53.75,55,3.754,4廠商2不突破突破以自身最大利益為目標(biāo):各生產(chǎn)2單位,各自得益為4以?xún)蓮S商總體利益最大:各生產(chǎn)1.5單位,各自得益為4.5如果將遵守限額還是突破限額作為廠商面臨的選擇,這實(shí)際上也是一種“囚徒困境”。2.3.1古諾的寡頭模型在上面討論的兩寡頭古諾模型中,對(duì)廠商2的任意產(chǎn)量q2
,廠商1的最佳對(duì)策產(chǎn)量q1
,就是使白己在廠商2生產(chǎn)q2的情況下利潤(rùn)最大化的產(chǎn)量,即q1是最大化問(wèn)題:的解。上式對(duì)q1求導(dǎo)并令導(dǎo)數(shù)等于0由此得:2.3.2反應(yīng)函數(shù)這樣我們得到了廠商1對(duì)于廠商2的每—個(gè)可能q2的最佳產(chǎn)量的計(jì)算公式,它是q2的一個(gè)連續(xù)函數(shù),我們稱(chēng)這個(gè)連續(xù)函數(shù)為廠商1對(duì)廠商2產(chǎn)量的一個(gè)“反應(yīng)函數(shù)”。由于這兩個(gè)反應(yīng)函數(shù)都是連續(xù)的線性函數(shù),因此可以用坐標(biāo)平面上的兩條直線表示它們,如圖:同樣,我們可再求出廠商2對(duì)廠商1產(chǎn)量的反應(yīng)函數(shù):2.3.2反應(yīng)函數(shù)q26363(2,2)從圖中可以看出,當(dāng)一方的產(chǎn)量選擇為0時(shí),另一方的最佳反應(yīng)為3。是實(shí)現(xiàn)市場(chǎng)總利潤(rùn)最大的產(chǎn)量,這時(shí)候等于由一個(gè)廠商壟斷市場(chǎng),市場(chǎng)總體利潤(rùn)就是該廠商的利益;當(dāng)一方的產(chǎn)量達(dá)到6時(shí),另一方被迫選擇0,因?yàn)檫@時(shí)后者堅(jiān)持生產(chǎn)已經(jīng)無(wú)利可圖。在兩個(gè)反應(yīng)函數(shù)對(duì)應(yīng)的兩條直線上,只有它們的交點(diǎn)(2,2)代表的產(chǎn)量組合,是由相互對(duì)對(duì)方的最佳反應(yīng)產(chǎn)量構(gòu)成的,與前面得到的結(jié)論完全—樣,是該模型的“均衡產(chǎn)量”。注:R1(q2)上的所有點(diǎn)(q1,q2),q1是對(duì)q2的最佳反應(yīng),但q2
不是對(duì)q1的最佳反應(yīng),而R2(q1)上的點(diǎn)則剛好相反。q26363q1(2,2)2.3.2反應(yīng)函數(shù)2.3.3反應(yīng)函數(shù)的局限性反應(yīng)函數(shù)法的概念和思路非常簡(jiǎn)單明了,它可以分析一般的具有無(wú)限多種策略,有連續(xù)策略空間的博弈模型,因此反應(yīng)函數(shù)法在博弈分析中非常有用。但這并不等于說(shuō)有了反應(yīng)函數(shù)的概念,就可以解決所有博弈的分析,或者分析出所有博弈的最終結(jié)果。因?yàn)樵谠S多博弈中,博弈方的策略是很有限的而不是很多的,更不是連續(xù)的,博弈方的得益函數(shù)并不是連續(xù)的可導(dǎo)函數(shù),所以無(wú)法用先求導(dǎo)找出各個(gè)博弈方的反應(yīng)函數(shù),再解聯(lián)立方程組的方法求均衡,反應(yīng)函數(shù)法在分析這樣的博弈模型時(shí)不能發(fā)揮作用。在有些博弈問(wèn)題中,各個(gè)博弈方的得益函數(shù)比較復(fù)雜,因而各自的反應(yīng)函數(shù)也比較復(fù)雜,并不總是能夠保證各個(gè)博弈方的反應(yīng)函數(shù)有交點(diǎn),特別是不能保證有惟一的交點(diǎn)。將反應(yīng)函數(shù)擴(kuò)展到混臺(tái)策略時(shí),就很容易出現(xiàn)多重交點(diǎn)反應(yīng)函數(shù)的圖形。(a)(b)2.3.4伯特蘭德寡頭模型基本假設(shè)1.雙寡頭壟斷市場(chǎng)2.產(chǎn)品有一定差別(同類(lèi)產(chǎn)品,但在品牌、質(zhì)量和包裝等方面有所不同,產(chǎn)品之間有很強(qiáng)的替代性,但又不是完全可替代。)3.兩廠商無(wú)固定成本,邊際生產(chǎn)成本分別為c1和c2。4.兩廠商同時(shí)決策。伯特蘭德1883年提出了另一種形式的寡占模型,這種模型與選擇產(chǎn)量的古諾模型的區(qū)別在于,伯特蘭德模型中各廠商所選擇的是價(jià)格而不是產(chǎn)量。當(dāng)廠商1和廠商2價(jià)格分別為P1和P2時(shí),它們各自的需求函數(shù)為:2.3.4伯特蘭德寡頭模型其中d1、d2>0是兩廠商產(chǎn)品的替代系數(shù),
從上式可以看出產(chǎn)品之間是有差別的。兩博弈方的得益函數(shù)分別為:求出兩廠商對(duì)對(duì)方策略(價(jià)格)的反應(yīng)函數(shù)分別為:用反應(yīng)函數(shù)法分析這個(gè)博弈。上兩式分別對(duì)P1和P2求偏導(dǎo),并令偏導(dǎo)數(shù)為0,得:2.3.4伯特蘭德寡頭模型
均衡(P1*,P2*)是兩反應(yīng)函數(shù)的交點(diǎn),即必須滿足:求解此方程組:記:2.3.4伯特蘭德寡頭模型將P1*,P2*代入得益函數(shù)則可進(jìn)一步得到兩廠商的均衡得益。具體地,如果進(jìn)一步假設(shè)模型中的參數(shù)分別為:則可以得到:
P1*=P2*=20,u1*=u2*=324。2.3.4伯特蘭德寡頭模型可以驗(yàn)證,這種價(jià)格決策與古諾模型中的產(chǎn)量決策一樣,其納什均衡也不如各博弈方通過(guò)協(xié)商、合作得到的最佳結(jié)果,因此也是囚徒困境的一種。上述模型是伯特蘭德模型較簡(jiǎn)單的情況,可以推廣到n個(gè)寡頭的價(jià)格決策,并且產(chǎn)品也可以是無(wú)差別的?;炯僭O(shè)長(zhǎng)度為1的線性城市,消費(fèi)者均勻分布在[0,1]區(qū)間。兩個(gè)商店,商店1在x=0處,商店2在x=1處,他們出售相同的產(chǎn)品。兩商店的單位成本均為c;價(jià)格分別為p1,p2,需求分別為D1,D2。消費(fèi)者購(gòu)買(mǎi)商品的旅行成本與離商店的距離成正比,單位距離成本為t。消費(fèi)者具有單位需求,即消費(fèi)1個(gè)單位或者0個(gè)單位。現(xiàn)在考慮兩商店之間價(jià)格競(jìng)爭(zhēng)的納什均衡。如果住在x處的消費(fèi)者在兩個(gè)商店之間是無(wú)差異的,即住在其左邊的都在商店1購(gòu)買(mǎi),住在其右邊的都在商店2購(gòu)買(mǎi),則且此時(shí)有2.3.5豪泰林(Hotelling)價(jià)格競(jìng)爭(zhēng)模型01商店1商店2x顧客注:上述模型中,產(chǎn)品的差異即消費(fèi)者的位置差異,也就是消費(fèi)者的旅行成本。成本越高,產(chǎn)品的差異越大,每個(gè)商店的壟斷越強(qiáng),均衡價(jià)格和利潤(rùn)越大。上面的分析假定兩商店分別位于城市的兩個(gè)極端。事實(shí)上,均衡結(jié)果對(duì)于商店的位置是很敏感的。考慮另一個(gè)極端,若兩商店在同一個(gè)位置,則他們出售的是完全一樣的產(chǎn)品,則消費(fèi)者關(guān)心的只是價(jià)格,均衡結(jié)果就會(huì)變?yōu)?.3.5豪泰林(Hotelling)價(jià)格競(jìng)爭(zhēng)模型模型拓展商店1在x=a(>0)處,商店2在x=1-b(b>0)處,且假定a<1-b,即商店1在商店2的左邊。消費(fèi)者的旅行成本為二次式其他假設(shè)不變。2.3.5豪泰林(Hotelling)價(jià)格競(jìng)爭(zhēng)模型2,10,00,01,2芭蕾女男足球芭蕾足球性別戰(zhàn)博弈納什均衡:足球,足球;芭蕾,芭蕾先動(dòng)優(yōu)勢(shì)2.3.6納什均衡一些其他應(yīng)用舉例-3,-32,00,20,0退BA進(jìn)退進(jìn)獨(dú)木橋納什均衡:A進(jìn),B退;A退,B進(jìn)。斗雞博弈村子里有兩戶富戶,有兩種可能:一家修,另一家就不修;一家不修,另一家就得修。冷戰(zhàn)期間美蘇搶占地盤(pán):一方搶占一塊地盤(pán),另一方就占另一塊。夫妻吵架,一方厲害,另一方就出去躲躲。注意:在混合戰(zhàn)略納什均衡條件下,也可能兩敗俱傷。2.3.6納什均衡一些其他應(yīng)用舉例5,14,49,-10,0等待小豬大豬按等待按4大于10大于-1智豬博弈納什均衡:大豬按,小豬等待,各得四個(gè)單位(4,4)。多勞者不多得!2.3.6納什均衡一些其他應(yīng)用舉例類(lèi)似的例子大豬小豬博弈股份公司中大股東小股東監(jiān)督納什均衡:大股東擔(dān)當(dāng)監(jiān)督經(jīng)理的責(zé)任,小股東搭便車(chē)村中的富人窮人修路納什均衡:大戶修路股市的大戶小戶炒股納什均衡:大戶搜集信息,小戶跟大戶2.3.6納什均衡一些其他應(yīng)用舉例公共地悲劇
設(shè)某村莊有n個(gè)農(nóng)戶,該村有一片大家都可以自由放牧羊群的公共草地。出于這片草地的面積有限,因此只能讓不超過(guò)某一數(shù)量的羊群吃飽,如果在這片草地上放牧羊只的實(shí)際數(shù)量超過(guò)這個(gè)限度,則每只羊都無(wú)法吃飽,從而每只羊的產(chǎn)出(毛、皮、肉的總價(jià)值)就會(huì)減少,甚至只能勉強(qiáng)存活或要餓死。2.3.6納什均衡一些其他應(yīng)用舉例模型假設(shè)假設(shè)1:各農(nóng)戶在決定自己的養(yǎng)羊數(shù)量時(shí)不知道其他農(nóng)戶養(yǎng)羊數(shù)的,即決策是同時(shí)作出的。假設(shè)2:所有農(nóng)戶都清楚這片公共草地最多能養(yǎng)多少只羊和在羊只總數(shù)的不同水平下每只羊的產(chǎn)出。這就構(gòu)成了n個(gè)農(nóng)戶之間關(guān)于養(yǎng)羊數(shù)的一個(gè)博弈問(wèn)題,并且是一個(gè)靜態(tài)博弈。在此博弈中,博弈方是n個(gè)農(nóng)戶;他們各自的策略空間就是他們可選擇的養(yǎng)羊數(shù)目的取值范圍。
當(dāng)各農(nóng)戶養(yǎng)羊數(shù)為q1、q2、…、qn時(shí),在公共草地上放牧羊只的總數(shù)為Q=q1+q2+…+qn
根據(jù)前面的介紹,每只羊的產(chǎn)出是羊只總數(shù)Q的減函數(shù)V=V(Q)=V(q1,q2,…,qn)
假設(shè)購(gòu)買(mǎi)和照料每只羊的成本對(duì)每個(gè)農(nóng)戶都是相同的不變常數(shù)c,則農(nóng)戶i養(yǎng)qi只羊的得益函數(shù)為:2.3.6納什均衡一些其他應(yīng)用舉例為了使討論比較簡(jiǎn)單及能得到直觀的結(jié)論,對(duì)模型做進(jìn)一步設(shè)定:在技術(shù)上把羊的數(shù)量看做是連續(xù)可分,則分別求三農(nóng)戶各自對(duì)其他兩農(nóng)戶策略(養(yǎng)羊數(shù))的反應(yīng)函數(shù),得:
反應(yīng)函數(shù)的交點(diǎn)(q1*,q2*,q3*)就是博弈的納什均衡。求得q1*=q2*=q3*=24,u1*=u2*=u3*=576。2.3.6納什均衡一些其他應(yīng)用舉例為了對(duì)公共資源的利用效率作出評(píng)價(jià),我們同樣也可討論總體利益最大的最佳羊只數(shù)量。設(shè)在該草地上羊只的總數(shù)為Q。則總得益為:
使總得益u最大的養(yǎng)羊數(shù)Q*必使總得益函數(shù)的一階導(dǎo)數(shù)為0,求得:
Q*
=48,u*
=2304
該結(jié)果比三農(nóng)戶各自獨(dú)自決定時(shí)得益的總和576×3=1728大了許多。而此時(shí)的養(yǎng)羊數(shù)Q*
=48則比三農(nóng)戶獨(dú)立決策時(shí)草地上的羊只總數(shù)3×24=72小。因此,三農(nóng)戶獨(dú)立決策時(shí)實(shí)際上使草地處于過(guò)度放牧的情況,浪費(fèi)了資源,農(nóng)戶也沒(méi)有獲到最好的效益。
如果各農(nóng)戶能將養(yǎng)羊數(shù)自覺(jué)限制在48/3=16只,則他們都能得到更多的利益。他們面臨的也是—種囚徒困境的局面,這個(gè)例子再一次證明了納什均衡,或者說(shuō)非合作博弈的結(jié)果有可能是低效率的。2.3.6納什均衡一些其他應(yīng)用舉例這個(gè)例子證明了很多經(jīng)濟(jì)學(xué)家很早就認(rèn)識(shí)到的一個(gè)問(wèn)題:如果一種資源沒(méi)有排他性的所有權(quán),就會(huì)導(dǎo)致這種資源的過(guò)度使用。表現(xiàn)在公共資源上就是,人們完全從自利動(dòng)機(jī)出發(fā)時(shí),公共資源傾向于被過(guò)度利用、低效率使用和浪費(fèi),且過(guò)度利用會(huì)達(dá)到任何利用它們的人都無(wú)法得到實(shí)際好處的程度。公共資源利用方面常會(huì)出現(xiàn)這樣的悲劇,原因是每個(gè)可以利用公共資源的人都面臨著一種囚徒的困境。類(lèi)似的例子:工廠污染治理、公海捕撈……
防止辦法:制度、道德納什均衡及應(yīng)用舉例練習(xí)——尋找納什均衡6,63,53,55,30,44,05,34,00,4C2R1R2C1C3R3參與人B參與人A練習(xí)——尋找納什均衡練習(xí)——找出兩對(duì)夫妻的納什均衡0,00,66,00,0死了妻子相互仇恨夫妻活著死了活著丈夫0,00,-6-6,02,2死了恩愛(ài)夫妻活著死了活著妻子丈夫練習(xí)——尋找納什均衡2.4混合策略和混合策略納什均衡例1:社會(huì)福利博弈(支付矩陣如下表)流浪漢找工作游蕩政府救濟(jì)3,2-1,3不救濟(jì)-1,10,0顯然,該博弈沒(méi)有納什均衡。2.4混合策略和混合策略納什均衡例2:猜硬幣博弈-1,11,-11,-1-1,1正面反面猜硬幣方蓋硬幣方正面反面該博弈是一個(gè)零和博弈,沒(méi)有納什均衡。如(正面,正面)不是納什均衡,因?yàn)榻o定B選正面,A的最優(yōu)選擇是反面。類(lèi)似地,(反面,正面)、(反面,反面)、(正面,反面)都不是納什均衡。這兩個(gè)例子雖然不存在上面所定義的納什均衡,但具有混合策略納什均衡。猜對(duì)則猜者贏1元,蓋者輸1元反之,猜者輸1元,蓋者贏1元2.4混合策略和混合策略納什均衡取勝關(guān)鍵:1、不能讓另一方猜到自己的策略,盡可能猜出對(duì)方策略2、博弈方一定要避免自己的選擇帶有規(guī)律性3、以一定的概率選擇策略納什均衡的弱點(diǎn):1、多重性。同一博弈里有時(shí)會(huì)出現(xiàn)多個(gè)納什均衡,即一般懷況下不能保證其唯一性.2、有些納什均衡并不合理。2.4混合策略和混合策略納什均衡石頭、剪子、布游戲老虎、杠子、雞、蟲(chóng)子游戲撲克游戲橄欖球賽戰(zhàn)爭(zhēng)中2.4.1純策略和混合策略納什均衡混合策略定義在博弈中,博弈方的策略空間為,則博弈方以概率分布隨機(jī)在其個(gè)可選策略中選擇的“策略”,稱(chēng)為一個(gè)“混合策略”,其中對(duì)都成立,且
如果一個(gè)策略規(guī)定參與人在每一個(gè)給定的信息情況下只選擇一種特定的行動(dòng),則稱(chēng)該策略為純策略。若一個(gè)策略規(guī)定參與人在給定信息情況下以某種概率分布隨機(jī)地選擇不同的行動(dòng),則稱(chēng)該策略為混合策略。在博弈的策略式表述中,混合策略可定義為在純策略空間上的概率分布。2.4.2混合戰(zhàn)略納什均衡—求解方法如何尋找混合戰(zhàn)略納什均衡?支付最大化法支付等值法由于混合戰(zhàn)略伴隨的是支付的不確定性,因此參與人關(guān)心的是其期望效用。最優(yōu)混合戰(zhàn)略:是指使期望效用函數(shù)最大的混合戰(zhàn)略(給定對(duì)方的混合戰(zhàn)略)在兩人博弈里,混合戰(zhàn)略納什均衡是兩個(gè)參與人的最優(yōu)混合戰(zhàn)略的組合。2.4.2混合戰(zhàn)略納什均衡—求解方法
23,
3-1,
1-1,
00,流浪流浪漢政府救濟(jì)不救濟(jì)尋找工作同樣,可以根據(jù)流浪漢的期望效用函數(shù)找到政府的最優(yōu)混合戰(zhàn)??例1:社會(huì)福利博弈2.4.2混合戰(zhàn)略納什均衡—求解方法同樣可以求出政府救濟(jì)的概率:1/2;不救濟(jì)的概率:1/2。流浪漢:尋找工作的概率:0.2;流浪的概率:0.8每個(gè)參與人的戰(zhàn)略都是給定對(duì)方混合戰(zhàn)略時(shí)的最優(yōu)戰(zhàn)略即:流浪漢以0.2的概率選擇尋找工作,0.8的概率選擇游蕩2.4.2混合戰(zhàn)略納什均衡—求解方法假定最優(yōu)混合戰(zhàn)略存在,給定流浪漢選擇混合戰(zhàn)略(r,1-r),政府選擇純戰(zhàn)略救濟(jì)的期望效用為:3r+(-1)(1-r)=4r-1選擇純戰(zhàn)略不救濟(jì)的效用為:-1r+0(1-r)=-r如果一個(gè)混合戰(zhàn)略(而不是純戰(zhàn)略)是政府的最優(yōu)選擇,一定意味著政府在救濟(jì)與不救濟(jì)之間是無(wú)差異的。
4r-1=-rr=0.2同理,假定最優(yōu)混合戰(zhàn)略存在,給定政府的選擇混合戰(zhàn)略(s,1-s),流浪漢選擇純戰(zhàn)略尋找工作的期望效用為:2s+(1)(1-s)=s+1選擇純戰(zhàn)略流浪的效用為:3s+0(1-s)=3s如果一個(gè)混合戰(zhàn)略(而不是純戰(zhàn)略)是政府的最優(yōu)選擇,一定意味著政府在救濟(jì)與不救濟(jì)之間是無(wú)差異的。
s+1=3ss=0.52.4.2混合戰(zhàn)略納什均衡—求解方法對(duì)的解釋?zhuān)喝绻骼藵h以找工作的概率小于0.2,則政府選擇不救濟(jì),如果大于0.2,政府選擇救濟(jì),只有當(dāng)概率等于0.2時(shí),政府才會(huì)選擇混合戰(zhàn)略或任何純戰(zhàn)略.對(duì)*=0.5的解釋如果政府救濟(jì)的概率大于0.5,流浪漢的最優(yōu)選擇是流浪,如果政府救濟(jì)的概率小于0.5,流浪漢的最優(yōu)選擇是尋找工作.2.4.2混合戰(zhàn)略納什均衡—求解方法混合戰(zhàn)略納什均衡的含義:納什均衡要求每個(gè)參與人的混合戰(zhàn)略是給定對(duì)方的混合戰(zhàn)略下的最優(yōu)選擇。因此在社會(huì)福利博弈中,,*=0.5是唯一的混合戰(zhàn)略納什均衡。從反面來(lái)說(shuō),如果政府認(rèn)為流浪漢選擇尋找工作的概率嚴(yán)格小于0.2,那么政府唯一最優(yōu)選擇是純戰(zhàn)略,不救濟(jì);如果政府以1的概率選擇不救濟(jì),流浪漢的最優(yōu)選擇是尋找工作,這又將導(dǎo)致政府選擇救濟(jì)的戰(zhàn)略,流浪漢則選擇游蕩。如此等等。政府的目的:救濟(jì)不救窮流浪漢尋找工作的概率小于0.2政府概率為1:不救濟(jì)流浪漢尋找工作政府救濟(jì)2.4.2混合戰(zhàn)略納什均衡—求解方法
令蓋硬幣方以r的概率選正面,以1-r的概率選反面,即P蓋=(r,1-r);猜硬幣方以q的概率猜正面,以1-q的概率猜反面,即P猜=(q,1-q),有:
V蓋(p蓋,p猜)=r[(-1)×q+1×(1-q)]+(1-r)[1×q+(-1)×(1-q)]=-4qr+2q+2r-1例2:猜硬幣博弈猜硬幣博弈模型的混合戰(zhàn)略
V猜(p蓋,p猜)=q[1×r+(-1)×(1-r)]+(1-q)[(-1)×r+1×(1-r)]=4qr-2q-2r+1解:MaxV蓋(p蓋,p猜)r得:q*=1/2MaxV猜(p蓋,p猜)q得:r*=1/2
猜硬幣博弈模型的混合戰(zhàn)略混合策略NE是蓋方在策略空間{正面,反面}上以概率分布P蓋*,=(1/2,1/2)進(jìn)行選擇,猜方也在策略空間{正面,反面上以概率p猜*=(1/2,1/2)進(jìn)行選擇。混合戰(zhàn)略與反應(yīng)函數(shù)當(dāng)q<1/2r*=R(q)=1當(dāng)q=1/2[0,1]當(dāng)q>1/20猜方的最優(yōu)反應(yīng)反應(yīng),記為q*=R(r)混合戰(zhàn)略與反應(yīng)函數(shù)當(dāng)r<1/2q*=R(r)=0,當(dāng)r=1/2[0,1],當(dāng)r>1/21,作為NE,各個(gè)參與人的反應(yīng)應(yīng)該同時(shí)為最優(yōu),那么只要求兩個(gè)反應(yīng)對(duì)應(yīng)的交點(diǎn),用圖示法:混合戰(zhàn)略與反應(yīng)函數(shù)rq01(正面)1(正面)1/21/2r*=R(q)q*=R(r)例3監(jiān)督博弈
監(jiān)督博弈來(lái)自于監(jiān)督檢查存在成本,因而監(jiān)督者不會(huì)總是對(duì)被監(jiān)督者的所有情形都實(shí)施檢查,而是隨機(jī)地采取檢查或不檢查的策略,被監(jiān)督者也知道監(jiān)督者的這種策略選擇,因而也以隨機(jī)的方式選擇努力或不努力的策略。這樣,監(jiān)督者與被監(jiān)督者之間就展開(kāi)混合戰(zhàn)略博弈,我們現(xiàn)在感興趣的是找出這種博弈的均衡。
a是應(yīng)稅款,C是檢查成本,F(xiàn)是罰款。假設(shè):a<C+F此博弈無(wú)純戰(zhàn)略Nash均衡設(shè)雙方的混合戰(zhàn)略分別為:則由可得:收稅方與納稅方的反應(yīng)函數(shù)分別為:納稅方收稅方逃稅C不逃稅D檢查A(a-c+F,-a-F)(a-c,a)不檢查B(0,0)(a,-a)例4:小偷和守衛(wèi)的博弈V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重對(duì)守衛(wèi)的處罰:短期中的效果是使守衛(wèi)真正盡職在長(zhǎng)期中并不能使守衛(wèi)更盡職,但會(huì)降低盜竊發(fā)生的概率0-D-D’守衛(wèi)得益((睡)SPt小偷偷的概率1V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重對(duì)小偷的處罰:短期內(nèi)能抑制盜竊發(fā)生率長(zhǎng)期并不能降低盜竊發(fā)生率,但會(huì)是的守衛(wèi)更多的偷懶0-P-P’小偷得益(偷)VPg守衛(wèi)睡的概略1例5:夫妻之爭(zhēng)的混合策略反應(yīng)函數(shù)及納什均衡2,10,00,01,3時(shí)裝1/3足球2/3丈夫q時(shí)裝3/4足球1/4妻子r夫妻之爭(zhēng)qr3/4r=R1(q)q=R2(r)1/311例6:水污染博弈舉例分析
假設(shè)在沒(méi)有政府監(jiān)管的環(huán)境里,有A,B兩個(gè)企業(yè),存在完全信息靜態(tài)博弈,企業(yè)對(duì)外不排污的情況下收益分別為:Ia和Ib,企業(yè)對(duì)外排污時(shí)收益分別Pa,Pb.由于環(huán)境改善的長(zhǎng)期性和正的外部性,使得對(duì)環(huán)保投資往往大于從其中得到的短期的直接得益,即Ia<Pa,Ib<Pb。構(gòu)造收益矩陣如表1所示,最終達(dá)到納什均衡(Ia,Ib),即策略組合(排污,排污)構(gòu)成企業(yè)排污的惟一納什均衡解,最終導(dǎo)致水環(huán)境的惡化,經(jīng)濟(jì)學(xué)上典型的私人最優(yōu)與社會(huì)最優(yōu)背離最終帶來(lái)負(fù)外部性效應(yīng)。
例6:水污染博弈舉例分析例6:水污染博弈舉例分析
從上述分析可看出在完全市場(chǎng)情況下,包括政府不干涉市場(chǎng)機(jī)制和地方保護(hù)主義作用下,阻止企業(yè)排污上失靈。企業(yè)作為追求私人利益最大化的理性人在環(huán)境保護(hù)問(wèn)題上必然采取非合作博弈,最終達(dá)到的均衡是建立在環(huán)境的負(fù)收益的基礎(chǔ)上。為了公眾以及下一代利益,流域水環(huán)境保護(hù)權(quán)責(zé)應(yīng)交由政府承擔(dān)。這時(shí)政府必須作為代表公眾利益的博弈方,它的任務(wù)就是執(zhí)行各種制度規(guī)則,制止企業(yè)排污,保證公眾的生活環(huán)境質(zhì)量。
例6:水污染博弈舉例分析
政府管制下水環(huán)境博弈模型
該博弈格局參與主體為排污企業(yè)以及代表流域公眾利益的政府。這是個(gè)不確定性的動(dòng)態(tài)博弈,企業(yè)先進(jìn)行排污或凈化的選擇,只有企業(yè)在選擇排污策略時(shí),政府與企業(yè)之間的博弈關(guān)系才存在。隨后政府可采取的策略主要有:直接管制、排污削減補(bǔ)貼、排污收費(fèi)以及排污交交易四種。例6:水污染博弈舉例分析
直接管制是指政府依據(jù)流域最優(yōu)排污量直接限定企業(yè)的排污量,直接體現(xiàn)政府的管理職能;排污削減補(bǔ)貼是指政府提供排污凈化補(bǔ)貼給排污企業(yè)以激勵(lì)企業(yè)自行治污,其相當(dāng)于市場(chǎng)機(jī)制中將排污權(quán)賦予排污企業(yè)情形,而政府則作為公眾代表向企業(yè)支付補(bǔ)償;排污收費(fèi)是指政府對(duì)排污企業(yè)課稅或?qū)嵭惺召M(fèi),其實(shí)質(zhì)是開(kāi)征所謂的庇古稅,利用行政手段實(shí)現(xiàn)外部效應(yīng)內(nèi)部化;排污交易是指政府在確定最優(yōu)排污量基礎(chǔ)上,引入市場(chǎng)機(jī)制允許排污企業(yè)交易排污指標(biāo),這實(shí)則是一種政府管制與市場(chǎng)機(jī)制的雙重結(jié)合。
例6:水污染博弈舉例分析與其他動(dòng)態(tài)博弈不同的是,此博弈格局中政府扮演著管制者的角色,處于一種相對(duì)強(qiáng)勢(shì)地位,也就是說(shuō)政府的策略既定后,企業(yè)可選的策略很少,只能在既定范圍內(nèi)抉擇。因此在這種特殊格局下,博弈最優(yōu)均衡直接取決于政府可選策略與現(xiàn)實(shí)條件配合的優(yōu)劣程度(見(jiàn)圖1)。
例6:水污染博弈舉例分析1.排污收費(fèi)下的混合策略博弈分析
在排污問(wèn)題上,政府和企業(yè)的利益是根本對(duì)立的,政府設(shè)法控制企業(yè)排污,而企業(yè)設(shè)法瞞過(guò)政府排污這樣政府和企業(yè)就構(gòu)成了排污博弈事件的兩個(gè)參與人。假設(shè)政府管制費(fèi)用為h,企業(yè)在不排污時(shí)發(fā)生的治理成本c,政府對(duì)企業(yè)的罰金為d,這里的罰金是政府則作為公眾代表向企業(yè)支付補(bǔ)償,即排污收費(fèi)。排污帶來(lái)的企業(yè)形象損失為m,政府因不監(jiān)管排污企業(yè)造成對(duì)聲譽(yù)的影響為n,這里我們考慮的是企業(yè)排污會(huì)帶來(lái)惡劣的社會(huì)影響,因?yàn)槊襟w的存在,這個(gè)影響?yīng)毩⒂谡谋O(jiān)管,即不論政府監(jiān)管與否,只要企業(yè)排污,必對(duì)企業(yè)造成負(fù)面的影響。如果政府在這種情況下采取監(jiān)管,則增加聲譽(yù),反之減少聲譽(yù)。聲譽(yù)由媒體和上級(jí)政府共同評(píng)定。其中政府對(duì)企業(yè)排污時(shí)的處罰稅應(yīng)高于政府的監(jiān)管費(fèi)用,即d>h,政府監(jiān)管與企業(yè)排污博弈矩陣如表2所示。
例6:水污染博弈舉例分析對(duì)支付矩陣分析可知,該博弈圖不存在純策略的納什均衡,現(xiàn)從定義出發(fā)求混合策略的納什均衡解。設(shè)企業(yè)排污的概率為x,不排污的概率為(1-x),政府監(jiān)管的概率為y,不監(jiān)管的概率為(1-y),x,分別y滿足O<x<1,O<y<1。
例6:水污染博弈舉例分析企業(yè)的期望效用函數(shù)為:u(x,1-x)=[y(-d-m)+(1一y)(-m)]+(1-x)[y(-c)+(1-y)(-c)]對(duì)X求偏導(dǎo)得,au/ax=-yd-m+c,令其偏導(dǎo)等于0。得y=(c-m)/d;當(dāng)y<(c-m)/d時(shí)企業(yè)選擇不排污,當(dāng)y>(c—m)/d時(shí),企業(yè)選擇排污,當(dāng)y=(c-m)/d時(shí),企業(yè)對(duì)排污與否持無(wú)所謂態(tài)度。例6:水污染博弈舉例分析
對(duì)y分析,ay/ac>0,即政府的管制概率與企業(yè)的治理排污成本成正比,企業(yè)的治理污染費(fèi)用越高,企業(yè)越傾向排污,而政府也越傾向于管制;ay/am<0;8y/8d<0,政府的管制概率與企業(yè)對(duì)自身形象的重視度和政府對(duì)其排污的罰金數(shù)額成反比,即企業(yè)對(duì)自身形象越重視,政府的治污力度越大,企業(yè)越不傾向排污,政府的管制力度也會(huì)相應(yīng)降低。這種情況在大企業(yè)中較多,大排污者由于被查處排污所繳的稅金與罰款較多,加上自己資金相對(duì)雄厚,受公眾的關(guān)注較多,對(duì)自身的形象更重視,因此一般是污染在內(nèi)部進(jìn)行治理;而對(duì)于中小企業(yè),由于資金有限加上稅金低,企業(yè)注重的只是眼前的發(fā)展,公眾對(duì)企業(yè)的輿論影響微乎其微,在這種情況下,小企業(yè)一般是把污染排放于環(huán)境,政府應(yīng)通過(guò)對(duì)其稅收集中治理。
例6:水污染博弈舉例分析政府的期望效用函數(shù)為:v(y,1-y)=y[x(-h+d+n)+(1-x)(-n)]+(1-y)[x(-h)+(1-x)*0],對(duì)y求偏導(dǎo),得av/ay=2xn+xd-h,令其偏導(dǎo)等于0,得x=h/2n+d;當(dāng)x>h/2n+d時(shí),政府選擇監(jiān)管;當(dāng)x<h/2n+d時(shí),政府不予監(jiān)管;當(dāng)x=h/2n+d時(shí),政府對(duì)監(jiān)管與否持無(wú)所謂態(tài)度。
例6:水污染博弈舉例分析
對(duì)x分析,ax/Oh>0,即企業(yè)排污的概率與政府的管制費(fèi)用成正比,即政府對(duì)企業(yè)的管制成本越大,企業(yè)越傾向于排污;ax/an<0,ax/ad<0,企業(yè)排污的概率同排污對(duì)政府造成的信譽(yù)影響和政府在企業(yè)排污時(shí)的處罰金額成反比,即政府對(duì)自身形象越重視,對(duì)企業(yè)排污處罰力度增大時(shí),企業(yè)越傾向于不排污。如果政府的上級(jí)部門(mén)對(duì)政府的績(jī)效考核的標(biāo)準(zhǔn)是綠色GDP,而不是簡(jiǎn)單的GDP的增長(zhǎng)率,那么政府會(huì)增加對(duì)排污企業(yè)的監(jiān)管力度;如果公眾特別是媒體能充分發(fā)揮監(jiān)督作用,在輿論壓力下政府也會(huì)增加監(jiān)管力度。
例6:水污染博弈舉例分析2.排污交易下的博弈分析
排污權(quán)交易是政府將環(huán)境污染物分割為一定標(biāo)準(zhǔn)單位,然后在市場(chǎng)上公開(kāi)標(biāo)價(jià)出售一定數(shù)量的污染權(quán),即實(shí)行污染權(quán)交易,每一份污染權(quán)允許購(gòu)買(mǎi)者可排放一單位的污染物。同時(shí),政府允許企業(yè)之間對(duì)污染權(quán)進(jìn)行有償交易。當(dāng)治理成本高于排污權(quán)市場(chǎng)價(jià)格時(shí),排污者傾向于少治理而多購(gòu)買(mǎi)排污權(quán);反之,排污者會(huì)多治理,余出更多的排污權(quán)在市場(chǎng)出售。這樣,既節(jié)約了治理成本,充分發(fā)揮水環(huán)境容量的效益,又可以促進(jìn)治污技術(shù)更新與發(fā)展。
排污權(quán)交易制度的排污權(quán)具有可交易性,使得排污權(quán)交易處于排污收費(fèi)制度。排污收費(fèi)是由政府確定排污價(jià)格,各排污企業(yè)只是接受價(jià)格,無(wú)權(quán)重新調(diào)整資源配置、改變資源價(jià)格;而排污交易是排污企業(yè)在市場(chǎng)激勵(lì)的作用下,通過(guò)價(jià)格變動(dòng)、重新調(diào)整產(chǎn)權(quán)、實(shí)現(xiàn)資源的最優(yōu)化配置。排污權(quán)交易市場(chǎng)供求關(guān)系與價(jià)格可調(diào)整由圖2所示。
例7:水污染博弈舉例分析2.5
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《平衡記分卡的應(yīng)用》課件
- 《企業(yè)人力績(jī)效管理》課件
- 2024-2025學(xué)年天津市紅橋區(qū)高一上學(xué)期期中考試歷史試卷(解析版)
- 單位管理制度分享匯編人事管理
- 單位管理制度分享大全人力資源管理十篇
- 單位管理制度范例選集人力資源管理篇
- 《磺達(dá)肝癸鈉》課件
- 單位管理制度呈現(xiàn)大合集人力資源管理十篇
- 《市場(chǎng)營(yíng)銷(xiāo)學(xué)案例分》課件
- 《投資經(jīng)濟(jì)學(xué)》教學(xué)大綱
- 梅溪湖給排水計(jì)算書(shū)(施工圖)
- 有色金屬工業(yè)安裝工程質(zhì)量檢驗(yàn)評(píng)定標(biāo)準(zhǔn)(共1004頁(yè))
- 組織架構(gòu)圖可編輯
- 口腔材料學(xué)課件
- 工資審核流程
- 手工鎢極氬弧焊焊接工藝指導(dǎo)書(shū)
- 北師大七年級(jí)上數(shù)學(xué)易錯(cuò)題(共8頁(yè))
- 供應(yīng)商供方履約評(píng)價(jià)表(參考模板)
- 徒步行軍pt課件
- 國(guó)家電網(wǎng)公司電網(wǎng)設(shè)備缺陷管理規(guī)定國(guó)網(wǎng)(運(yùn)檢3)(文號(hào)國(guó)家電網(wǎng)企管
- 輸血科(血庫(kù))儀器設(shè)備使用、保養(yǎng)記錄表
評(píng)論
0/150
提交評(píng)論