均衡演進與占座行為的博弈分析_第1頁
均衡演進與占座行為的博弈分析_第2頁
均衡演進與占座行為的博弈分析_第3頁
均衡演進與占座行為的博弈分析_第4頁
均衡演進與占座行為的博弈分析_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

均衡演進與占座行為的博弈分析

在缺乏資源的現實中,使用座位和類似座位的現象很普遍,人們的認可也是不可否認的事實。如國家對專利知識產權的保護,美蘇兩國冷戰(zhàn)時期在世界范圍內的地盤爭奪戰(zhàn)等,都蘊含著相似的特征。經濟學家研究制度產生并不斷演進的過程,目的即在于剖析其引導和規(guī)范人們行為的機理,從而設計出更為完善的機制。本文從微觀和演化的角度,通過建立占座行為的博弈模型,闡明了占座行為獲得人們的普遍承認有其一定的必然性,這種制度安排在特定條件下是演化穩(wěn)定的納什均衡。1占座者的博弈建模占座現象在高校的自習教室中非常普遍,不外乎包括以下兩個過程:先到者找到空位,要么坐下來學習,要么在座位上放上物品表示已被占用,然后去處理別的事情。后達者找不到空座位,面對已有物品占據的地方,可以選擇離開,也可以把別人的東西往邊上挪一挪,等占座者回來后再作道理。當占座者返回時,雙方將同時面臨要么據理力爭,要么放棄座位的選擇。該過程翻譯成博弈論語言,可抽象為如圖1所示的模型。其中:Ⅰ,Ⅱ表示參與人1和2;U表示使用座位,O表示占用座位,F表示針鋒相對,而Y表示放棄占有機會。假設使用座位可獲效用v,而先占后用可獲額外收益a(a>0)。雙方爭斗時,參與人1獲勝的概率為p,參與人2的獲勝概率為1-p。雙方蒙受的損失,如丟臉、情緒受影響等,記為c。倘若雙方都克制忍讓,每一方將有同等機會占有該座位。2研究范式的確立演化博弈論是1980年代發(fā)展起來的策略分析方法,其核心思想始于M.Smith的演化穩(wěn)定概念。它跳出了完全理性人對策選擇的研究范式;分析一群有限理性的個體重復進行某個博弈時,系統(tǒng)整體的行動、規(guī)則或策略的分布特征。策略的演化穩(wěn)定要求在特定時刻任何少數個體采用其他策略都不比堅持原策略更有效率;結果原策略個體就沒有積極性偏離,而其它行為個體有向既定策略遷移的動機。這表現為社會行為中的某種常識或傳統(tǒng)的形成。2.1擴大博弈b分析從圖1中的結點③以下的子博弈開始,寫成策略形式,如表1所示。為避免雷同,假設使用該座位的直接效用小于雙方爭奪可能帶來的損失(v<c)。1)p>c/(v+c),爭斗子博弈有嚴格占優(yōu)納什均衡(F;Y)。此時系統(tǒng)存在唯一的全局子博弈精煉納什均衡(O,F;Y,Y):先到者占座,后達者離開;占座者發(fā)現投機者使用他占的座位據理力爭,投機者選擇退卻。這表明當輿論默許占座行為的合法性時,占座者占座,投機者放棄投機成為共識。這種制度安排是演化穩(wěn)定的。2)p<v/(v+c),爭斗子博弈有嚴格占優(yōu)納什均衡(Y;F)。(1)a≤v,此時存在唯一的子博弈精煉納什均衡(U,Y;U,F):先到者選擇使用策略,一旦進入第二階段則選擇退卻,后達者找到座位就利用,等占座者返回時據理力爭。(2)a>v,離開座位去做某事對先到者來說更重要時,先到者傾向于在第一階段采用先占后用策略,一旦博弈進入第二階段,考慮到輿論對占座持反對態(tài)度(p較小),占座者的最佳策略為收拾東西走人。后達者相應的均衡策略為:見到物品占據的座位不妨先利用,等占座者返回再作理論。這種情況通常見于明令禁止占座的閱覽室。3)vv+c<p<cv+c,爭斗子博弈存在3個納什均衡:純策略均衡(F;Y),(Y;F)和混合策略均衡(x;y)。其中x=(x1,x2)T,y=(y1,y2)T,且:{x1=12v/[(p-12)v+pc]?y1=12v/[(12-p)v+(1-p)c].(1)那么博弈究竟是如何進行的呢?上述過程在結構上的不對稱性,使得目前的分析技術無法對其進行深入的探討。為此需要作進一步的假設:假設該博弈重復發(fā)生(與現實相符),且參與雙方以同等概率扮演占座者和投機者,即這次扮演占座者的個體可能在下次遭遇中扮演投機者。這樣就可將上述非對稱的爭斗子博弈G包含在一個更大的對稱博弈Г中。如圖2所示,在Г中的第一步是由自然等概率地隨機分配進入博弈的兩個參與者分別扮演占座者和投機者。擴展博弈Г中的策略是原博弈G中占座者策略和投機者策略的選擇性組合;而支付由兩者的期望值綜合決定。不妨以π[σ1,σ2]表示擴展博弈Г中策略σ1和σ2相遇時的支付。需要說明的是,Г中的策略和原子博弈G中的策略對雖然形式相同,含義卻不同;如(F;Y)策略在Г中表示個體扮演占座者時選擇針鋒相對,而扮演投機者時選擇退卻。通過運算,不難得到如表2所示的支付關系。表2中的列對應在位策略,行表示侵入的變異策略,相應的數值表示系統(tǒng)的支付。由于v/(v+c)<p<c/(v+c),可得(1-p)v-pc<0,pv-(1-p)c>0;因此策略(F;Y)和(Y;F)嚴格占優(yōu)且演化穩(wěn)定。此外,π[(Y;Y),(F;F)]>π[(F;F),(F;F)]?(2)π[(F;Y),(Y;Y)]>π[(Y;Y),(Y;Y)].(3)表明策略(F;F)易被策略(Y;Y)侵入,而策略(Y;Y)又易被策略(F;Y)侵入,所以兩者均無法在進化壓力下保持穩(wěn)定。那么混合策略(x;y)的情況又是如何呢?由表1可以看出,當雙方分別采用混合戰(zhàn)略x和y時,(x;y)構成子博弈的納什均衡,且支付分別為:uⅠ(x,y)=12v+a-12v2/(v-2pv-2pc+2c),(4)uⅡ(x,y)=12v-12v2/(2pv+2pc-v).(5)根據假設,參與博弈的個體相互平等,則擴展博弈中混合策略均衡的期望效用為π[(x,y),(x,y)]=12uⅠ(x,y)+12uⅡ(x,y)=12(v+a)-14v2v-2pv-2pc+2c-14v22pv+2pc-v.(6)此外,按照定義計算可得:已知v/(v+c)<p<c/(v+c),則(v+c)p-v>0,pv+pc-1/2v>0,1/2v+c-pv-pc>0;所以π[(x,y),(F;Y)]<12(v+a)=π[(F;Y),(F;Y)].(9)可見混合策略(x;y)易被策略(F;Y)侵入,無法保持演化穩(wěn)定。這解釋了在現實生活中,參與博弈的個體為什么采用單一的爭斗或退卻策略,而不是混合策略。當爭斗的損失大于使用座位的效用時,與其爭得面紅耳赤,不如下次變換角色再搏一把(尤其在考試階段)。對局時雙方的選擇傾向,除個人因素外,主要取決于當時的制度安排。如果大家默許占座,占座者理直氣壯,以(F;Y)結束博弈的可能性較大。反之若制度明顯反對占座,則更可能以(Y;F)結束博弈。2.2占座行為的演化下面通過對系統(tǒng)均衡點的遷移和穩(wěn)定進行攝動分析,進一步揭示占座制度的產生、變遷和確立的過程。假設一開始不存在占座制度,博弈雙方爭斗取勝的概率僅取決于個體自身,從平均程度不妨認為p≈0.5。該p對應于v/(v+c)<p<c/(v+c),爭斗子博弈存在3個納什均衡(F;Y),(x;y)和(Y;F)。分析從(x;y)開始。為使博弈順利進入第二階段,并收斂于均衡(x;y),需滿足條件:uⅠ(x,y)=v(pv+pc-v)v-2pv-2pc+2c+a>v,(10)uⅡ(x,y)=v(pv+pc-v)2pv+2pc-v>0.(11)式(11)自動滿足,而式(10)則要求a>a*=v2+12v2/[(1-2p)v+2(1-p)c].(12)顯然a*與p之間存在著某種正比關系,da*dp=(v+c)v2[(1-2p)v+2(1-p)c]2>0.(13)假設公眾對占座行為的態(tài)度略有改變,如傾向于默許Δp>0,此時為保持均衡(x;y),占座者采用先占后用策略需要額外效用的閾值a*進一步提高。這可能促使式(10)無法滿足或滿足該式的個體數將減少;另一方面p越大,占座者在子博弈G中越有積極性采取爭斗策略。這兩方面的因素都促使子博弈繼續(xù)向(F;Y)遷移。均衡一旦偏離(x;y)遷往(F;Y),先到者就更有積極性在第一階段占座,博弈順利進入到第二階段。雙方在隨后的爭斗中越是出現(F;Y)的結果,越是增強先達者的占座意識,從而也越是提升占座者的自信和輿論對此的支持。占座者在這里顯示出來的先動優(yōu)勢反過來會影響實施投機的個體,他們將力圖在下次爭斗中扮演占座者。整個合法化過程表現出顯著的自增強特征,也正是通過這樣一個不斷演化的過程,占座行為逐漸得到大家的默許,并發(fā)展成為一種預定俗稱的制度形式,在資源稀缺的社會長期存在。反之,倘若最初的變動為Δp<0,根據式(11),閾值a*將變小,從而式(10)更易滿足或有更多的個體將滿足此式。雖然p值的減小,可能會促使子博弈從均衡(x;y)向(Y;F)遷移,然而由于博弈要順利進入第二階段尚需滿足條件a>v,這無疑為遷移設置了障礙,不滿足此條件的個體將在第一階段結束博弈。此外,當p落在區(qū)間(vv+c,cv+c)時a*的最大值為v,因此滿足子博弈均衡(Y;F)條件的一定滿足(x;y)的條件。這使博弈從均衡點(x;y)向(Y;F)的遷移變得尤為困難。另一方面,即使在初期明令禁止占座(p≈0),且個體從占座獲得的額外收益大于使用效用(a>v),系統(tǒng)最初收斂于(O,Y;U,F)。只要監(jiān)督者稍有松懈,對占座行為的態(tài)度稍有不明(p值增加),爭斗子博弈就很有可能從該點向(x;y)遷移,并隨占座者自信的增強,不斷推動系統(tǒng)向(O,F;Y,Y)演進。上述演變的發(fā)展速度與c和v之間的對比關系直接相關。c相對于v越大,監(jiān)督者的態(tài)度落在區(qū)間(vv+c,cv+c)的可能性越大,上述遷移就越容易發(fā)生。這和我們在高校中觀察到的越是臨近期末考試,大家越是默許占座行為的情況是相吻合的。由此可見,占座制度的確立具有一定的適應和演變過程,它的產生和變遷具有某種路徑依賴性。在資源稀缺的情況下,要使人們自覺反對占座行為,提高資源的實際利用率,監(jiān)督者可能需要支付高昂的監(jiān)督成本。3企業(yè)間的爭奪占座博弈模型除用于分析和解釋占座現象外,還可用于分析其它經濟現象。譬如企業(yè)之間專用技術(專利)泄密問題:兩家企業(yè)研究開拓新市場的專用技術,甲先開發(fā)成功。它將面臨要么馬上組織生產并投放市場,要么申請專利,同時調查需求及研究投產方案,謀求在適當時機投放市場。乙在甲申請專利后不久取得該項技術,它同樣面臨要么放棄,要么生產的選擇。這時企業(yè)甲和乙在市場上的爭奪類似占座博弈。博弈的結果很大程度上取決于國家對專有技術的保護力度。這個例子也從一個側面解釋了專利保護制度的由來,類似的還有國內屢禁不止的盜版問題、子女爭奪父母遺產問題等。另一個形象的例子是冷戰(zhàn)時期,美蘇兩個超級大國在世界各地爭奪地盤。鑒于沖突可能帶來毀滅性的后果(c?v),雙方狹路相逢時,一般都采取敵進我退,敵退我進的策略。從前面的分析可以看出該策略演化穩(wěn)定。所以雖然冷戰(zhàn)時期美蘇爭斗不休,卻沒有發(fā)生大規(guī)模的沖突,且維持了相當長的一段時間,直到蘇聯(lián)解體。金融投資領域的一個例子是當投資者發(fā)現某新興市場時,他可以采取直接投資的方式占據該市場,并確立起領先地位,也可通過先抽調部分資金培育市場的方式介入。當它籌集資金試圖全面開發(fā)時,可能發(fā)現已有其它企業(yè)進入該市場,于是一番爭奪在所難免。爭奪的過程將如何展開,雙方可能會采取什么樣的策略,有待根據具體的情況討論。與占座博弈不同的是,此時a表示先期投資的企業(yè)在爭斗中可能擁有的先動優(yōu)勢。4確立和完善知識產權保護制度,切實保障改借助演化博弈的思想和分析技術,建立了普遍存在的占座行為的兩階段模型,探討了系統(tǒng)演化和適應的過程。在資源稀缺情況下,占座或類似占座的非正規(guī)制度的形成和發(fā)展具有演化穩(wěn)定的特征。這種安排雖然在一定程度上降低了資源的利用率,卻明顯具有存在的惰性(合理性)。要想減少這種效率損失,只有依靠建立更具權威、能切實實施和便于監(jiān)督的新的制度形式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論