




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第二講
完全信息靜態(tài)博弈
本章介紹完全信息靜態(tài)博弈。完全信息靜態(tài)博弈即各博弈方同時決策,且所有博弈方對各方得益都了解的博弈。囚徒的困境、齊威王田忌賽馬、猜硬幣、石頭剪子布、古諾產(chǎn)量決策都屬于這種博弈。完全信息靜態(tài)博弈屬于非合作博弈最基本的類型。本章介紹完全信息靜態(tài)博弈的一般分析方法、納什均衡概念、各種經(jīng)典模型及其應(yīng)用等。
2.1基本分析思路和方法2.1.1上策均衡2.1.2嚴(yán)格下策反復(fù)消去法2.1.3劃線法2.1.4箭頭法2.1.1上策均衡上策:不管其它博弈方選擇什么策略,一博弈方的某個策略給他帶來的得益始終高于其它的策略,至少不低于其他策略的策略囚徒的困境中的“坦白”;雙寡頭削價中“低價”。上策均衡:一個博弈的某個策略組合中的所有策略都是各個博弈方各自的上策,必然是該博弈比較穩(wěn)定的結(jié)果.上策均衡不是普遍存在的
2.1.2嚴(yán)格下策反復(fù)消去法嚴(yán)格下策:不管其它博弈方的策略如何變化,給一個博弈方帶來的收益總是比另一種策略給他帶來的收益小的策略。嚴(yán)格下策反復(fù)消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中2.1.3劃線法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬幣2,10,00,01,3夫妻之爭2.2納什均衡2.2.1納什均衡的定義2.2.2納什均衡的一致預(yù)測性質(zhì)2.2.3納什均衡與嚴(yán)格下策反復(fù)消去法2.2.1納什均衡及應(yīng)用舉例關(guān)于納什均衡納什均衡是著名博弈論專家納什(JohnNash)對博弈論的重要貢獻之一。納什在1950年和1951年的兩篇重要論文中,在一般意義上給定了非合作博弈及其均衡解,并證明了解的存在性。納什的這一貢獻奠定了非合作博弈論的理論基礎(chǔ),納什所定義的均衡被稱為“納什均衡”。諾貝爾經(jīng)濟學(xué)獎獲得者薩繆爾森有一句幽默的話:你可以將一只鸚鵡訓(xùn)練成經(jīng)濟學(xué)家,因為它所需要學(xué)習(xí)的只有兩個詞:供給與需求。博弈論專家坎多瑞引申說:要成為現(xiàn)代經(jīng)濟學(xué)家,這只鸚鵡必須再多學(xué)一個詞,這個詞就是“納什均衡”。通俗地說,納什均衡含義就是:給定你的策略,我的策略是最好的策略;給定我的策略,你的策略也是你最好的策略,即雙方在對方給定的策略下不愿意調(diào)整自己的策略。納什均衡符號解釋策略空間:博弈方的第個策略:博弈方的得益:博弈:在博弈中,如果由各個博弈方的各一個策略組成的某個策略組合中,任一博弈方的策略si*,都是對其余博弈方策略的組合的最佳對策,即對任意都成立,則稱為的一個“納什均衡”。2.2.2納什均衡的一致預(yù)測性質(zhì)
一致預(yù)測:如果所有博弈方都預(yù)測一個特定博弈結(jié)果會出現(xiàn),所有博弈方都不會利用該預(yù)測或者這種預(yù)測能力選擇與預(yù)測結(jié)果不一致的策略,即沒有哪個博弈方有偏離這個預(yù)測結(jié)果的愿望,因此預(yù)測結(jié)果會成為博弈的最終結(jié)果只有納什均衡才具有一致預(yù)測的性質(zhì)一致預(yù)測性是納什均衡的本質(zhì)屬性一致預(yù)測并不意味著一定能準(zhǔn)確預(yù)測,因為有多重均衡,預(yù)測不一致的可能占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略占優(yōu)戰(zhàn)略是指一個參與人所有可選擇的戰(zhàn)略中嚴(yán)格優(yōu)于其他戰(zhàn)略的那個戰(zhàn)略,即是i的占優(yōu)戰(zhàn)略意味著對于所有的2.2納什均衡及應(yīng)用舉例重復(fù)剔除的占優(yōu)均衡注:重復(fù)剔除嚴(yán)格劣戰(zhàn)略的思路是,首先找到某個參與人的劣戰(zhàn)略(假定存在),把這個劣戰(zhàn)略剔除掉,重新構(gòu)建一個不包含已剔除戰(zhàn)略的新的博弈;然后再剔除掉這個新博弈中的某個參與人的劣戰(zhàn)略,一直到只剩下一個唯一的戰(zhàn)略組合為止。2.3納什均衡的應(yīng)用2.3.1古諾的寡頭模型2.3.2反應(yīng)函數(shù)2.3.3伯特蘭德寡頭模型2.3.4公共資源問題2.3.5反應(yīng)函數(shù)的問題和局限性2.3.1古諾的寡頭模型基本假設(shè)
1.一個市場有兩家廠商生產(chǎn)同一種產(chǎn)品,產(chǎn)量分為q1和q2。市場總產(chǎn)量為Q=q1十q2。
2.市場出清價格P(即可以將產(chǎn)品全部賣出去的價格)是市場總產(chǎn)量的函數(shù)P=P(Q)=a-q1-q2=8-Q。3.兩廠商沒有固定成本且單位生產(chǎn)成本相同,即4.兩廠商同時決定各自產(chǎn)量,即決策前不知道另一方產(chǎn)量。該博弈中兩博弈方的得益(即兩廠商各目的利潤)分別為:2.3.1古諾的寡頭模型如果假設(shè)策略組合(q1*,q2*)是本博弈的最終結(jié)果,則(q1*,q2*)必使得兩博弈方的得益達到最大值,即滿足:2.3.1古諾的寡頭模型兩式分別對q1、q2求偏導(dǎo)并令偏導(dǎo)數(shù)都等于零,由此可得q1*,q2*應(yīng)滿足方程組:解之得該方程組唯一的一組解:兩博弈方的均衡得益(利潤)分別為:當(dāng)有均衡總產(chǎn)量為:2.3.1古諾的寡頭模型若對上述博弈結(jié)果作效率評價,可以再從兩廠商總體利益最大化的角度作一次產(chǎn)量選擇,根據(jù)市場條件求實現(xiàn)總得益(總利潤)最大的總產(chǎn)量。設(shè)總產(chǎn)量為Q,則總得益為:U=PQ-cQ=Q(8-Q)-2Q=6Q-Q2很容易求得使總得益最大的總產(chǎn)量:Q*=3最大總得益:U*=9172.3.1古諾的寡頭模型結(jié)論1結(jié)論2兩廠商的總體來看,根據(jù)總體利益最大化確定產(chǎn)量效率更高。換句話說,如果兩廠商更多考慮合作,先定出使總利益最大的產(chǎn)量,后各自生產(chǎn)1.5單位,則各自可分享到的利益為4.5,比只考慮自身利益的獨立決策行為得到的利益要高。
在獨立決策、缺乏協(xié)調(diào)機制的兩個企業(yè)之間,上述合作的結(jié)果并不容易實現(xiàn),即使實現(xiàn)了也往往是不穩(wěn)定的。原因主要是,在這個策略組合下,雙力都可以通過獨自改變(增加)自己的產(chǎn)量而得到更高的利潤。184.5,4.53.75,55,3.754,4廠商2不突破突破以自身最大利益為目標(biāo):各生產(chǎn)2單位,各自得益為4以兩廠商總體利益最大:各生產(chǎn)1.5單位,各自得益為4.5如果將遵守限額還是突破限額作為廠商面臨的選擇,這實際上也是一種“囚徒困境”。2.3.1古諾的寡頭模型在上面討論的兩寡頭古諾模型中,對廠商2的任意產(chǎn)量q2
,廠商1的最佳對策產(chǎn)量q1
,就是使白己在廠商2生產(chǎn)q2的情況下利潤最大化的產(chǎn)量,即q1是最大化問題:的解。上式對q1求導(dǎo)并令導(dǎo)數(shù)等于0由此得:2.3.2反應(yīng)函數(shù)這樣我們得到了廠商1對于廠商2的每—個可能q2的最佳產(chǎn)量的計算公式,它是q2的一個連續(xù)函數(shù),我們稱這個連續(xù)函數(shù)為廠商1對廠商2產(chǎn)量的一個“反應(yīng)函數(shù)”。由于這兩個反應(yīng)函數(shù)都是連續(xù)的線性函數(shù),因此可以用坐標(biāo)平面上的兩條直線表示它們,如圖:同樣,我們可再求出廠商2對廠商1產(chǎn)量的反應(yīng)函數(shù):2.3.2反應(yīng)函數(shù)q26363(2,2)從圖中可以看出,當(dāng)一方的產(chǎn)量選擇為0時,另一方的最佳反應(yīng)為3。是實現(xiàn)市場總利潤最大的產(chǎn)量,這時候等于由一個廠商壟斷市場,市場總體利潤就是該廠商的利益;當(dāng)一方的產(chǎn)量達到6時,另一方被迫選擇0,因為這時后者堅持生產(chǎn)已經(jīng)無利可圖。在兩個反應(yīng)函數(shù)對應(yīng)的兩條直線上,只有它們的交點(2,2)代表的產(chǎn)量組合,是由相互對對方的最佳反應(yīng)產(chǎn)量構(gòu)成的,與前面得到的結(jié)論完全—樣,是該模型的“均衡產(chǎn)量”。注:R1(q2)上的所有點(q1,q2),q1是對q2的最佳反應(yīng),但q2
不是對q1的最佳反應(yīng),而R2(q1)上的點則剛好相反。q26363q1(2,2)2.3.2反應(yīng)函數(shù)2.3.3反應(yīng)函數(shù)的局限性反應(yīng)函數(shù)法的概念和思路非常簡單明了,它可以分析一般的具有無限多種策略,有連續(xù)策略空間的博弈模型,因此反應(yīng)函數(shù)法在博弈分析中非常有用。但這并不等于說有了反應(yīng)函數(shù)的概念,就可以解決所有博弈的分析,或者分析出所有博弈的最終結(jié)果。因為在許多博弈中,博弈方的策略是很有限的而不是很多的,更不是連續(xù)的,博弈方的得益函數(shù)并不是連續(xù)的可導(dǎo)函數(shù),所以無法用先求導(dǎo)找出各個博弈方的反應(yīng)函數(shù),再解聯(lián)立方程組的方法求均衡,反應(yīng)函數(shù)法在分析這樣的博弈模型時不能發(fā)揮作用。在有些博弈問題中,各個博弈方的得益函數(shù)比較復(fù)雜,因而各自的反應(yīng)函數(shù)也比較復(fù)雜,并不總是能夠保證各個博弈方的反應(yīng)函數(shù)有交點,特別是不能保證有惟一的交點。將反應(yīng)函數(shù)擴展到混臺策略時,就很容易出現(xiàn)多重交點反應(yīng)函數(shù)的圖形。(a)(b)2.3.4伯特蘭德寡頭模型基本假設(shè)1.雙寡頭壟斷市場2.產(chǎn)品有一定差別(同類產(chǎn)品,但在品牌、質(zhì)量和包裝等方面有所不同,產(chǎn)品之間有很強的替代性,但又不是完全可替代。)3.兩廠商無固定成本,邊際生產(chǎn)成本分別為c1和c2。4.兩廠商同時決策。伯特蘭德1883年提出了另一種形式的寡占模型,這種模型與選擇產(chǎn)量的古諾模型的區(qū)別在于,伯特蘭德模型中各廠商所選擇的是價格而不是產(chǎn)量。當(dāng)廠商1和廠商2價格分別為P1和P2時,它們各自的需求函數(shù)為:2.3.4伯特蘭德寡頭模型其中d1、d2>0是兩廠商產(chǎn)品的替代系數(shù),
從上式可以看出產(chǎn)品之間是有差別的。兩博弈方的得益函數(shù)分別為:求出兩廠商對對方策略(價格)的反應(yīng)函數(shù)分別為:用反應(yīng)函數(shù)法分析這個博弈。上兩式分別對P1和P2求偏導(dǎo),并令偏導(dǎo)數(shù)為0,得:2.3.4伯特蘭德寡頭模型
均衡(P1*,P2*)是兩反應(yīng)函數(shù)的交點,即必須滿足:求解此方程組:記:2.3.4伯特蘭德寡頭模型將P1*,P2*代入得益函數(shù)則可進一步得到兩廠商的均衡得益。具體地,如果進一步假設(shè)模型中的參數(shù)分別為:則可以得到:
P1*=P2*=20,u1*=u2*=324。2.3.4伯特蘭德寡頭模型可以驗證,這種價格決策與古諾模型中的產(chǎn)量決策一樣,其納什均衡也不如各博弈方通過協(xié)商、合作得到的最佳結(jié)果,因此也是囚徒困境的一種。上述模型是伯特蘭德模型較簡單的情況,可以推廣到n個寡頭的價格決策,并且產(chǎn)品也可以是無差別的?;炯僭O(shè)長度為1的線性城市,消費者均勻分布在[0,1]區(qū)間。兩個商店,商店1在x=0處,商店2在x=1處,他們出售相同的產(chǎn)品。兩商店的單位成本均為c;價格分別為p1,p2,需求分別為D1,D2。消費者購買商品的旅行成本與離商店的距離成正比,單位距離成本為t。消費者具有單位需求,即消費1個單位或者0個單位?,F(xiàn)在考慮兩商店之間價格競爭的納什均衡。如果住在x處的消費者在兩個商店之間是無差異的,即住在其左邊的都在商店1購買,住在其右邊的都在商店2購買,則且此時有2.3.5豪泰林(Hotelling)價格競爭模型01商店1商店2x顧客注:上述模型中,產(chǎn)品的差異即消費者的位置差異,也就是消費者的旅行成本。成本越高,產(chǎn)品的差異越大,每個商店的壟斷越強,均衡價格和利潤越大。上面的分析假定兩商店分別位于城市的兩個極端。事實上,均衡結(jié)果對于商店的位置是很敏感的。考慮另一個極端,若兩商店在同一個位置,則他們出售的是完全一樣的產(chǎn)品,則消費者關(guān)心的只是價格,均衡結(jié)果就會變?yōu)?.3.5豪泰林(Hotelling)價格競爭模型模型拓展商店1在x=a(>0)處,商店2在x=1-b(b>0)處,且假定a<1-b,即商店1在商店2的左邊。消費者的旅行成本為二次式其他假設(shè)不變。2.3.5豪泰林(Hotelling)價格競爭模型2,10,00,01,2芭蕾女男足球芭蕾足球性別戰(zhàn)博弈納什均衡:足球,足球;芭蕾,芭蕾先動優(yōu)勢2.3.6納什均衡一些其他應(yīng)用舉例-3,-32,00,20,0退BA進退進獨木橋納什均衡:A進,B退;A退,B進。斗雞博弈村子里有兩戶富戶,有兩種可能:一家修,另一家就不修;一家不修,另一家就得修。冷戰(zhàn)期間美蘇搶占地盤:一方搶占一塊地盤,另一方就占另一塊。夫妻吵架,一方厲害,另一方就出去躲躲。注意:在混合戰(zhàn)略納什均衡條件下,也可能兩敗俱傷。2.3.6納什均衡一些其他應(yīng)用舉例5,14,49,-10,0等待小豬大豬按等待按4大于10大于-1智豬博弈納什均衡:大豬按,小豬等待,各得四個單位(4,4)。多勞者不多得!2.3.6納什均衡一些其他應(yīng)用舉例類似的例子大豬小豬博弈股份公司中大股東小股東監(jiān)督納什均衡:大股東擔(dān)當(dāng)監(jiān)督經(jīng)理的責(zé)任,小股東搭便車村中的富人窮人修路納什均衡:大戶修路股市的大戶小戶炒股納什均衡:大戶搜集信息,小戶跟大戶2.3.6納什均衡一些其他應(yīng)用舉例公共地悲劇
設(shè)某村莊有n個農(nóng)戶,該村有一片大家都可以自由放牧羊群的公共草地。出于這片草地的面積有限,因此只能讓不超過某一數(shù)量的羊群吃飽,如果在這片草地上放牧羊只的實際數(shù)量超過這個限度,則每只羊都無法吃飽,從而每只羊的產(chǎn)出(毛、皮、肉的總價值)就會減少,甚至只能勉強存活或要餓死。2.3.6納什均衡一些其他應(yīng)用舉例模型假設(shè)假設(shè)1:各農(nóng)戶在決定自己的養(yǎng)羊數(shù)量時不知道其他農(nóng)戶養(yǎng)羊數(shù)的,即決策是同時作出的。假設(shè)2:所有農(nóng)戶都清楚這片公共草地最多能養(yǎng)多少只羊和在羊只總數(shù)的不同水平下每只羊的產(chǎn)出。這就構(gòu)成了n個農(nóng)戶之間關(guān)于養(yǎng)羊數(shù)的一個博弈問題,并且是一個靜態(tài)博弈。在此博弈中,博弈方是n個農(nóng)戶;他們各自的策略空間就是他們可選擇的養(yǎng)羊數(shù)目的取值范圍。
當(dāng)各農(nóng)戶養(yǎng)羊數(shù)為q1、q2、…、qn時,在公共草地上放牧羊只的總數(shù)為Q=q1+q2+…+qn
根據(jù)前面的介紹,每只羊的產(chǎn)出是羊只總數(shù)Q的減函數(shù)V=V(Q)=V(q1,q2,…,qn)
假設(shè)購買和照料每只羊的成本對每個農(nóng)戶都是相同的不變常數(shù)c,則農(nóng)戶i養(yǎng)qi只羊的得益函數(shù)為:2.3.6納什均衡一些其他應(yīng)用舉例為了使討論比較簡單及能得到直觀的結(jié)論,對模型做進一步設(shè)定:在技術(shù)上把羊的數(shù)量看做是連續(xù)可分,則分別求三農(nóng)戶各自對其他兩農(nóng)戶策略(養(yǎng)羊數(shù))的反應(yīng)函數(shù),得:
反應(yīng)函數(shù)的交點(q1*,q2*,q3*)就是博弈的納什均衡。求得q1*=q2*=q3*=24,u1*=u2*=u3*=576。2.3.6納什均衡一些其他應(yīng)用舉例為了對公共資源的利用效率作出評價,我們同樣也可討論總體利益最大的最佳羊只數(shù)量。設(shè)在該草地上羊只的總數(shù)為Q。則總得益為:
使總得益u最大的養(yǎng)羊數(shù)Q*必使總得益函數(shù)的一階導(dǎo)數(shù)為0,求得:
Q*
=48,u*
=2304
該結(jié)果比三農(nóng)戶各自獨自決定時得益的總和576×3=1728大了許多。而此時的養(yǎng)羊數(shù)Q*
=48則比三農(nóng)戶獨立決策時草地上的羊只總數(shù)3×24=72小。因此,三農(nóng)戶獨立決策時實際上使草地處于過度放牧的情況,浪費了資源,農(nóng)戶也沒有獲到最好的效益。
如果各農(nóng)戶能將養(yǎng)羊數(shù)自覺限制在48/3=16只,則他們都能得到更多的利益。他們面臨的也是—種囚徒困境的局面,這個例子再一次證明了納什均衡,或者說非合作博弈的結(jié)果有可能是低效率的。2.3.6納什均衡一些其他應(yīng)用舉例這個例子證明了很多經(jīng)濟學(xué)家很早就認(rèn)識到的一個問題:如果一種資源沒有排他性的所有權(quán),就會導(dǎo)致這種資源的過度使用。表現(xiàn)在公共資源上就是,人們完全從自利動機出發(fā)時,公共資源傾向于被過度利用、低效率使用和浪費,且過度利用會達到任何利用它們的人都無法得到實際好處的程度。公共資源利用方面常會出現(xiàn)這樣的悲劇,原因是每個可以利用公共資源的人都面臨著一種囚徒的困境。類似的例子:工廠污染治理、公海捕撈……
防止辦法:制度、道德納什均衡及應(yīng)用舉例練習(xí)——尋找納什均衡6,63,53,55,30,44,05,34,00,4C2R1R2C1C3R3參與人B參與人A練習(xí)——尋找納什均衡練習(xí)——找出兩對夫妻的納什均衡0,00,66,00,0死了妻子相互仇恨夫妻活著死了活著丈夫0,00,-6-6,02,2死了恩愛夫妻活著死了活著妻子丈夫練習(xí)——尋找納什均衡2.4混合策略和混合策略納什均衡例1:社會福利博弈(支付矩陣如下表)流浪漢找工作游蕩政府救濟3,2-1,3不救濟-1,10,0顯然,該博弈沒有納什均衡。2.4混合策略和混合策略納什均衡例2:猜硬幣博弈-1,11,-11,-1-1,1正面反面猜硬幣方蓋硬幣方正面反面該博弈是一個零和博弈,沒有納什均衡。如(正面,正面)不是納什均衡,因為給定B選正面,A的最優(yōu)選擇是反面。類似地,(反面,正面)、(反面,反面)、(正面,反面)都不是納什均衡。這兩個例子雖然不存在上面所定義的納什均衡,但具有混合策略納什均衡。猜對則猜者贏1元,蓋者輸1元反之,猜者輸1元,蓋者贏1元2.4混合策略和混合策略納什均衡取勝關(guān)鍵:1、不能讓另一方猜到自己的策略,盡可能猜出對方策略2、博弈方一定要避免自己的選擇帶有規(guī)律性3、以一定的概率選擇策略納什均衡的弱點:1、多重性。同一博弈里有時會出現(xiàn)多個納什均衡,即一般懷況下不能保證其唯一性.2、有些納什均衡并不合理。2.4混合策略和混合策略納什均衡石頭、剪子、布游戲老虎、杠子、雞、蟲子游戲撲克游戲橄欖球賽戰(zhàn)爭中2.4.1純策略和混合策略納什均衡混合策略定義在博弈中,博弈方的策略空間為,則博弈方以概率分布隨機在其個可選策略中選擇的“策略”,稱為一個“混合策略”,其中對都成立,且
如果一個策略規(guī)定參與人在每一個給定的信息情況下只選擇一種特定的行動,則稱該策略為純策略。若一個策略規(guī)定參與人在給定信息情況下以某種概率分布隨機地選擇不同的行動,則稱該策略為混合策略。在博弈的策略式表述中,混合策略可定義為在純策略空間上的概率分布。2.4.2混合戰(zhàn)略納什均衡—求解方法如何尋找混合戰(zhàn)略納什均衡?支付最大化法支付等值法由于混合戰(zhàn)略伴隨的是支付的不確定性,因此參與人關(guān)心的是其期望效用。最優(yōu)混合戰(zhàn)略:是指使期望效用函數(shù)最大的混合戰(zhàn)略(給定對方的混合戰(zhàn)略)在兩人博弈里,混合戰(zhàn)略納什均衡是兩個參與人的最優(yōu)混合戰(zhàn)略的組合。2.4.2混合戰(zhàn)略納什均衡—求解方法
23,
3-1,
1-1,
00,流浪流浪漢政府救濟不救濟尋找工作同樣,可以根據(jù)流浪漢的期望效用函數(shù)找到政府的最優(yōu)混合戰(zhàn)??例1:社會福利博弈2.4.2混合戰(zhàn)略納什均衡—求解方法同樣可以求出政府救濟的概率:1/2;不救濟的概率:1/2。流浪漢:尋找工作的概率:0.2;流浪的概率:0.8每個參與人的戰(zhàn)略都是給定對方混合戰(zhàn)略時的最優(yōu)戰(zhàn)略即:流浪漢以0.2的概率選擇尋找工作,0.8的概率選擇游蕩2.4.2混合戰(zhàn)略納什均衡—求解方法假定最優(yōu)混合戰(zhàn)略存在,給定流浪漢選擇混合戰(zhàn)略(r,1-r),政府選擇純戰(zhàn)略救濟的期望效用為:3r+(-1)(1-r)=4r-1選擇純戰(zhàn)略不救濟的效用為:-1r+0(1-r)=-r如果一個混合戰(zhàn)略(而不是純戰(zhàn)略)是政府的最優(yōu)選擇,一定意味著政府在救濟與不救濟之間是無差異的。
4r-1=-rr=0.2同理,假定最優(yōu)混合戰(zhàn)略存在,給定政府的選擇混合戰(zhàn)略(s,1-s),流浪漢選擇純戰(zhàn)略尋找工作的期望效用為:2s+(1)(1-s)=s+1選擇純戰(zhàn)略流浪的效用為:3s+0(1-s)=3s如果一個混合戰(zhàn)略(而不是純戰(zhàn)略)是政府的最優(yōu)選擇,一定意味著政府在救濟與不救濟之間是無差異的。
s+1=3ss=0.52.4.2混合戰(zhàn)略納什均衡—求解方法對的解釋:如果流浪漢以找工作的概率小于0.2,則政府選擇不救濟,如果大于0.2,政府選擇救濟,只有當(dāng)概率等于0.2時,政府才會選擇混合戰(zhàn)略或任何純戰(zhàn)略.對*=0.5的解釋如果政府救濟的概率大于0.5,流浪漢的最優(yōu)選擇是流浪,如果政府救濟的概率小于0.5,流浪漢的最優(yōu)選擇是尋找工作.2.4.2混合戰(zhàn)略納什均衡—求解方法混合戰(zhàn)略納什均衡的含義:納什均衡要求每個參與人的混合戰(zhàn)略是給定對方的混合戰(zhàn)略下的最優(yōu)選擇。因此在社會福利博弈中,,*=0.5是唯一的混合戰(zhàn)略納什均衡。從反面來說,如果政府認(rèn)為流浪漢選擇尋找工作的概率嚴(yán)格小于0.2,那么政府唯一最優(yōu)選擇是純戰(zhàn)略,不救濟;如果政府以1的概率選擇不救濟,流浪漢的最優(yōu)選擇是尋找工作,這又將導(dǎo)致政府選擇救濟的戰(zhàn)略,流浪漢則選擇游蕩。如此等等。政府的目的:救濟不救窮流浪漢尋找工作的概率小于0.2政府概率為1:不救濟流浪漢尋找工作政府救濟2.4.2混合戰(zhàn)略納什均衡—求解方法
令蓋硬幣方以r的概率選正面,以1-r的概率選反面,即P蓋=(r,1-r);猜硬幣方以q的概率猜正面,以1-q的概率猜反面,即P猜=(q,1-q),有:
V蓋(p蓋,p猜)=r[(-1)×q+1×(1-q)]+(1-r)[1×q+(-1)×(1-q)]=-4qr+2q+2r-1例2:猜硬幣博弈猜硬幣博弈模型的混合戰(zhàn)略
V猜(p蓋,p猜)=q[1×r+(-1)×(1-r)]+(1-q)[(-1)×r+1×(1-r)]=4qr-2q-2r+1解:MaxV蓋(p蓋,p猜)r得:q*=1/2MaxV猜(p蓋,p猜)q得:r*=1/2
猜硬幣博弈模型的混合戰(zhàn)略混合策略NE是蓋方在策略空間{正面,反面}上以概率分布P蓋*,=(1/2,1/2)進行選擇,猜方也在策略空間{正面,反面上以概率p猜*=(1/2,1/2)進行選擇?;旌蠎?zhàn)略與反應(yīng)函數(shù)當(dāng)q<1/2r*=R(q)=1當(dāng)q=1/2[0,1]當(dāng)q>1/20猜方的最優(yōu)反應(yīng)反應(yīng),記為q*=R(r)混合戰(zhàn)略與反應(yīng)函數(shù)當(dāng)r<1/2q*=R(r)=0,當(dāng)r=1/2[0,1],當(dāng)r>1/21,作為NE,各個參與人的反應(yīng)應(yīng)該同時為最優(yōu),那么只要求兩個反應(yīng)對應(yīng)的交點,用圖示法:混合戰(zhàn)略與反應(yīng)函數(shù)rq01(正面)1(正面)1/21/2r*=R(q)q*=R(r)例3監(jiān)督博弈
監(jiān)督博弈來自于監(jiān)督檢查存在成本,因而監(jiān)督者不會總是對被監(jiān)督者的所有情形都實施檢查,而是隨機地采取檢查或不檢查的策略,被監(jiān)督者也知道監(jiān)督者的這種策略選擇,因而也以隨機的方式選擇努力或不努力的策略。這樣,監(jiān)督者與被監(jiān)督者之間就展開混合戰(zhàn)略博弈,我們現(xiàn)在感興趣的是找出這種博弈的均衡。
a是應(yīng)稅款,C是檢查成本,F(xiàn)是罰款。假設(shè):a<C+F此博弈無純戰(zhàn)略Nash均衡設(shè)雙方的混合戰(zhàn)略分別為:則由可得:收稅方與納稅方的反應(yīng)函數(shù)分別為:納稅方收稅方逃稅C不逃稅D檢查A(a-c+F,-a-F)(a-c,a)不檢查B(0,0)(a,-a)例4:小偷和守衛(wèi)的博弈V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重對守衛(wèi)的處罰:短期中的效果是使守衛(wèi)真正盡職在長期中并不能使守衛(wèi)更盡職,但會降低盜竊發(fā)生的概率0-D-D’守衛(wèi)得益((睡)SPt小偷偷的概率1V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重對小偷的處罰:短期內(nèi)能抑制盜竊發(fā)生率長期并不能降低盜竊發(fā)生率,但會是的守衛(wèi)更多的偷懶0-P-P’小偷得益(偷)VPg守衛(wèi)睡的概略1例5:夫妻之爭的混合策略反應(yīng)函數(shù)及納什均衡2,10,00,01,3時裝1/3足球2/3丈夫q時裝3/4足球1/4妻子r夫妻之爭qr3/4r=R1(q)q=R2(r)1/311例6:水污染博弈舉例分析
假設(shè)在沒有政府監(jiān)管的環(huán)境里,有A,B兩個企業(yè),存在完全信息靜態(tài)博弈,企業(yè)對外不排污的情況下收益分別為:Ia和Ib,企業(yè)對外排污時收益分別Pa,Pb.由于環(huán)境改善的長期性和正的外部性,使得對環(huán)保投資往往大于從其中得到的短期的直接得益,即Ia<Pa,Ib<Pb。構(gòu)造收益矩陣如表1所示,最終達到納什均衡(Ia,Ib),即策略組合(排污,排污)構(gòu)成企業(yè)排污的惟一納什均衡解,最終導(dǎo)致水環(huán)境的惡化,經(jīng)濟學(xué)上典型的私人最優(yōu)與社會最優(yōu)背離最終帶來負(fù)外部性效應(yīng)。
例6:水污染博弈舉例分析例6:水污染博弈舉例分析
從上述分析可看出在完全市場情況下,包括政府不干涉市場機制和地方保護主義作用下,阻止企業(yè)排污上失靈。企業(yè)作為追求私人利益最大化的理性人在環(huán)境保護問題上必然采取非合作博弈,最終達到的均衡是建立在環(huán)境的負(fù)收益的基礎(chǔ)上。為了公眾以及下一代利益,流域水環(huán)境保護權(quán)責(zé)應(yīng)交由政府承擔(dān)。這時政府必須作為代表公眾利益的博弈方,它的任務(wù)就是執(zhí)行各種制度規(guī)則,制止企業(yè)排污,保證公眾的生活環(huán)境質(zhì)量。
例6:水污染博弈舉例分析
政府管制下水環(huán)境博弈模型
該博弈格局參與主體為排污企業(yè)以及代表流域公眾利益的政府。這是個不確定性的動態(tài)博弈,企業(yè)先進行排污或凈化的選擇,只有企業(yè)在選擇排污策略時,政府與企業(yè)之間的博弈關(guān)系才存在。隨后政府可采取的策略主要有:直接管制、排污削減補貼、排污收費以及排污交交易四種。例6:水污染博弈舉例分析
直接管制是指政府依據(jù)流域最優(yōu)排污量直接限定企業(yè)的排污量,直接體現(xiàn)政府的管理職能;排污削減補貼是指政府提供排污凈化補貼給排污企業(yè)以激勵企業(yè)自行治污,其相當(dāng)于市場機制中將排污權(quán)賦予排污企業(yè)情形,而政府則作為公眾代表向企業(yè)支付補償;排污收費是指政府對排污企業(yè)課稅或?qū)嵭惺召M,其實質(zhì)是開征所謂的庇古稅,利用行政手段實現(xiàn)外部效應(yīng)內(nèi)部化;排污交易是指政府在確定最優(yōu)排污量基礎(chǔ)上,引入市場機制允許排污企業(yè)交易排污指標(biāo),這實則是一種政府管制與市場機制的雙重結(jié)合。
例6:水污染博弈舉例分析與其他動態(tài)博弈不同的是,此博弈格局中政府扮演著管制者的角色,處于一種相對強勢地位,也就是說政府的策略既定后,企業(yè)可選的策略很少,只能在既定范圍內(nèi)抉擇。因此在這種特殊格局下,博弈最優(yōu)均衡直接取決于政府可選策略與現(xiàn)實條件配合的優(yōu)劣程度(見圖1)。
例6:水污染博弈舉例分析1.排污收費下的混合策略博弈分析
在排污問題上,政府和企業(yè)的利益是根本對立的,政府設(shè)法控制企業(yè)排污,而企業(yè)設(shè)法瞞過政府排污這樣政府和企業(yè)就構(gòu)成了排污博弈事件的兩個參與人。假設(shè)政府管制費用為h,企業(yè)在不排污時發(fā)生的治理成本c,政府對企業(yè)的罰金為d,這里的罰金是政府則作為公眾代表向企業(yè)支付補償,即排污收費。排污帶來的企業(yè)形象損失為m,政府因不監(jiān)管排污企業(yè)造成對聲譽的影響為n,這里我們考慮的是企業(yè)排污會帶來惡劣的社會影響,因為媒體的存在,這個影響?yīng)毩⒂谡谋O(jiān)管,即不論政府監(jiān)管與否,只要企業(yè)排污,必對企業(yè)造成負(fù)面的影響。如果政府在這種情況下采取監(jiān)管,則增加聲譽,反之減少聲譽。聲譽由媒體和上級政府共同評定。其中政府對企業(yè)排污時的處罰稅應(yīng)高于政府的監(jiān)管費用,即d>h,政府監(jiān)管與企業(yè)排污博弈矩陣如表2所示。
例6:水污染博弈舉例分析對支付矩陣分析可知,該博弈圖不存在純策略的納什均衡,現(xiàn)從定義出發(fā)求混合策略的納什均衡解。設(shè)企業(yè)排污的概率為x,不排污的概率為(1-x),政府監(jiān)管的概率為y,不監(jiān)管的概率為(1-y),x,分別y滿足O<x<1,O<y<1。
例6:水污染博弈舉例分析企業(yè)的期望效用函數(shù)為:u(x,1-x)=[y(-d-m)+(1一y)(-m)]+(1-x)[y(-c)+(1-y)(-c)]對X求偏導(dǎo)得,au/ax=-yd-m+c,令其偏導(dǎo)等于0。得y=(c-m)/d;當(dāng)y<(c-m)/d時企業(yè)選擇不排污,當(dāng)y>(c—m)/d時,企業(yè)選擇排污,當(dāng)y=(c-m)/d時,企業(yè)對排污與否持無所謂態(tài)度。例6:水污染博弈舉例分析
對y分析,ay/ac>0,即政府的管制概率與企業(yè)的治理排污成本成正比,企業(yè)的治理污染費用越高,企業(yè)越傾向排污,而政府也越傾向于管制;ay/am<0;8y/8d<0,政府的管制概率與企業(yè)對自身形象的重視度和政府對其排污的罰金數(shù)額成反比,即企業(yè)對自身形象越重視,政府的治污力度越大,企業(yè)越不傾向排污,政府的管制力度也會相應(yīng)降低。這種情況在大企業(yè)中較多,大排污者由于被查處排污所繳的稅金與罰款較多,加上自己資金相對雄厚,受公眾的關(guān)注較多,對自身的形象更重視,因此一般是污染在內(nèi)部進行治理;而對于中小企業(yè),由于資金有限加上稅金低,企業(yè)注重的只是眼前的發(fā)展,公眾對企業(yè)的輿論影響微乎其微,在這種情況下,小企業(yè)一般是把污染排放于環(huán)境,政府應(yīng)通過對其稅收集中治理。
例6:水污染博弈舉例分析政府的期望效用函數(shù)為:v(y,1-y)=y[x(-h+d+n)+(1-x)(-n)]+(1-y)[x(-h)+(1-x)*0],對y求偏導(dǎo),得av/ay=2xn+xd-h,令其偏導(dǎo)等于0,得x=h/2n+d;當(dāng)x>h/2n+d時,政府選擇監(jiān)管;當(dāng)x<h/2n+d時,政府不予監(jiān)管;當(dāng)x=h/2n+d時,政府對監(jiān)管與否持無所謂態(tài)度。
例6:水污染博弈舉例分析
對x分析,ax/Oh>0,即企業(yè)排污的概率與政府的管制費用成正比,即政府對企業(yè)的管制成本越大,企業(yè)越傾向于排污;ax/an<0,ax/ad<0,企業(yè)排污的概率同排污對政府造成的信譽影響和政府在企業(yè)排污時的處罰金額成反比,即政府對自身形象越重視,對企業(yè)排污處罰力度增大時,企業(yè)越傾向于不排污。如果政府的上級部門對政府的績效考核的標(biāo)準(zhǔn)是綠色GDP,而不是簡單的GDP的增長率,那么政府會增加對排污企業(yè)的監(jiān)管力度;如果公眾特別是媒體能充分發(fā)揮監(jiān)督作用,在輿論壓力下政府也會增加監(jiān)管力度。
例6:水污染博弈舉例分析2.排污交易下的博弈分析
排污權(quán)交易是政府將環(huán)境污染物分割為一定標(biāo)準(zhǔn)單位,然后在市場上公開標(biāo)價出售一定數(shù)量的污染權(quán),即實行污染權(quán)交易,每一份污染權(quán)允許購買者可排放一單位的污染物。同時,政府允許企業(yè)之間對污染權(quán)進行有償交易。當(dāng)治理成本高于排污權(quán)市場價格時,排污者傾向于少治理而多購買排污權(quán);反之,排污者會多治理,余出更多的排污權(quán)在市場出售。這樣,既節(jié)約了治理成本,充分發(fā)揮水環(huán)境容量的效益,又可以促進治污技術(shù)更新與發(fā)展。
排污權(quán)交易制度的排污權(quán)具有可交易性,使得排污權(quán)交易處于排污收費制度。排污收費是由政府確定排污價格,各排污企業(yè)只是接受價格,無權(quán)重新調(diào)整資源配置、改變資源價格;而排污交易是排污企業(yè)在市場激勵的作用下,通過價格變動、重新調(diào)整產(chǎn)權(quán)、實現(xiàn)資源的最優(yōu)化配置。排污權(quán)交易市場供求關(guān)系與價格可調(diào)整由圖2所示。
例7:水污染博弈舉例分析2.5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 信息整合2024年計算機二級考試試題及答案
- 嬰兒特需護理試題及答案
- 極地地區(qū)的地理環(huán)境與生物試題及答案
- 數(shù)據(jù)庫設(shè)計技巧試題及答案分析
- 中職電子商務(wù)職業(yè)生涯規(guī)劃試題及答案
- 2024年陪診師考試醫(yī)學(xué)知識試題及答案
- 寵物遺體保存方法試題及答案詳解
- 人力資源管理師考前測試試題及答案2024
- 人力資源管理師考試技巧試題及答案
- 2024年員工激勵方案試題及答案
- (3月省質(zhì)檢)福建省2025屆高三畢業(yè)班適應(yīng)性練習(xí)卷英語試卷(含答案)
- 秸稈破壁菌酶研發(fā)項目可行性研究報告(范文參考)
- 2025年上半年貴州黔東南州各縣(市)事業(yè)單位招聘工作人員1691人筆試易考易錯模擬試題(共500題)試卷后附參考答案
- 2025新疆機場(集團)有限責(zé)任公司阿克蘇管理分公司第一季度招聘(75人)筆試參考題庫附帶答案詳解
- 2025年阿斯利康能力測試題及答案
- 東莞市勞動合同模板6篇
- 《醫(yī)療機構(gòu)重大事故隱患判定清單(試行)》知識培訓(xùn)
- TCACM 1470-2023 胃癌前病變治未病干預(yù)指南
- Unit 4 Eat Well(大單元教學(xué)設(shè)計)2024-2025學(xué)年七年級英語下冊同步備課系列(人教版2024)
- 全國計算機等級考試《三級信息安全技術(shù)》專用教材【考綱分析+考點精講+真題演練】
- 2024年天翼云認(rèn)證運維工程師考試復(fù)習(xí)題庫(含答案)
評論
0/150
提交評論