第6章 重復(fù)博弈與合作行為_第1頁
第6章 重復(fù)博弈與合作行為_第2頁
第6章 重復(fù)博弈與合作行為_第3頁
第6章 重復(fù)博弈與合作行為_第4頁
第6章 重復(fù)博弈與合作行為_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第6章重復(fù)博弈與合作行為張維迎 教授北京大學(xué)國家發(fā)展研究院2015年4月14日上一章:The ultimatum game 兩人之間分配一筆錢,其中一個(gè)人提出方案,另一個(gè)人可以接受,也可以拒絕;如果接受,每人得到方案規(guī)定的份額;如果拒絕,沒有人得到任何東西。 什么是這個(gè)博弈的精練納什均衡? 實(shí)驗(yàn)結(jié)果:1.同班同學(xué) 總數(shù) 給對(duì)方 最低接受 10 4.9 3.39 100 48.17 35.64 1000 463.08 363.45 10000 4537.43 3595.13 2北京大學(xué)同學(xué)總數(shù) 給對(duì)方 最低接受10 4.57 3.74 100 43.26 37.72 1000 409.26 37

2、0.17 10000 3880.78 3539.68 3.陌生人總數(shù) 給對(duì)方 最低接受 10 4.09 4.05 100 35.41 35.04 1000 343.11 342.67 10000 3134.37 3127.78 實(shí)驗(yàn)告訴我們什么? 利他主義? 人類有關(guān)“公平”的觀念對(duì)討價(jià)還價(jià)具有重要意義; 休謨的“自然美德”和亞當(dāng).斯密的道德情感? 或許,討價(jià)還價(jià)是多次博弈中的一次。序慣博弈與重復(fù)博弈 序慣博弈(sequential game):參與人在前一個(gè)決策點(diǎn)的選擇決定隨后的子博弈的結(jié)構(gòu),因此,從后一個(gè)決策點(diǎn)開始的子博弈不同于從前一個(gè)決策點(diǎn)開始的子博弈,或者說,同樣結(jié)構(gòu)的子博弈只出現(xiàn)一次

3、; 重復(fù)博弈(repeated game):同樣結(jié)構(gòu)的博弈重復(fù)多次,其中的每次博弈被稱為“階段博弈” (stage game).重復(fù)博弈的三個(gè)特征 階段博弈之間沒有物質(zhì)上的聯(lián)系,也就是說,前一階段的博弈不改變后一階段的結(jié)構(gòu); 所有參與人觀察到博弈過去的歷史; 參與人的總支付(報(bào)酬)是所有階段博弈支付的貼現(xiàn)值之和;重復(fù)博弈和合作問題 如果博弈不是一次的,而是重復(fù)進(jìn)行的,參與人過去行動(dòng)的歷史是可以觀察到的,參與人就可以將自己的選擇依賴于其他人之前的行動(dòng),因而有了更多的戰(zhàn)略可以選擇,均衡結(jié)果可能與一次博弈大不相同。 合作無處不在! 重復(fù)博弈理論的最大貢獻(xiàn)是對(duì)人們之間的合作行為提供了理性解釋;在囚徒困

4、境中,一次博弈的唯一均衡是不合作(即坦白)。但如果博弈無限重復(fù),合作就可能出現(xiàn)。囚徒困境博弈合作不合作合作不合作3,3-1,44,-10,0AB重復(fù)博弈與戰(zhàn)略空間的擴(kuò)展 假定上屬博弈重復(fù)多次或無限次;那么,每個(gè)參與人有多個(gè)可以選擇的戰(zhàn)略:僅舉幾例: All-D: 不論過去什么發(fā)生,總是選擇不合作; All-C: 不論過去什么發(fā)生,總是選擇合作; 合作-不合作交替進(jìn)行; tit-for-tat: 從合作開始,之后每次選擇對(duì)方前一階段的行動(dòng); trigger strategies: 從合作開始,一直到有一方不合作,然后永遠(yuǎn)選擇不合作?!扒敉嚼Ь场钡囊话惚硎竞献鞑缓献骱献鞑缓献鱐,TS,RR,SP,

5、P滿足:RTPS; (S+R)T+T支付函數(shù) 雙方都不合作: 對(duì) 的解釋: 貼現(xiàn)率; 博弈繼續(xù)的概率; 二者的結(jié)合; 一般化:未來收益的重要程度11.d)-alld,-all(32PPPPPV無名氏定理(Folk Theorem) 在無限次重復(fù)博弈中,如果參與人對(duì)未來足夠重視( 足夠大),那么,任何程度的合作都可以通過一個(gè)特定的子博弈精煉納什均衡得到。 這里“合作程度”定義為整個(gè)博弈中合作出現(xiàn)的頻率。 50年代就人所共知,但無人有發(fā)明權(quán);Tit-for-tat 納什均衡,但不是精煉納什均衡:11.TFT)TFT,(32TTTTTV1.TFT)D,-All(32PRPPPRVWhy Not A

6、Perfect NE 假定A在t=5的時(shí)候,沒有合作。根據(jù)TFT戰(zhàn)略,在t=6,B應(yīng)該選擇懲罰(不合作)。B會(huì)這樣嗎? 如果B相信A采取的是TFT戰(zhàn)略,那么:如果B對(duì)A實(shí)施懲罰,預(yù)期的收入流為: 反之,如果B原諒A,,.,RSRSR,.,TTTTTAxelrod (1984) Tit-for-tat 是成功率最高的戰(zhàn)略:Robert Axelrod在1981年和1984年間發(fā)表的非常著名的論文,報(bào)告了他在囚徒困境重復(fù)博弈中比較各種策略的實(shí)驗(yàn)結(jié)果:在第一組的14種戰(zhàn)略當(dāng)中,Anatol Rapoport提交的TFT戰(zhàn)略是最成功的,得分最高;在第二組的所有62種戰(zhàn)略中,TFT戰(zhàn)略也是最成功的。 演

7、化博弈的解釋(第14章討論)。 Trigger strategies 如果未來足夠重要,精煉納什均衡:11.trigger)(32TTTTTV 合作,1.trigger)(32PRPPPRV 不合作,合作的條件 如果下列條件滿足,合作就是均衡結(jié)果:111PRTPRTR解釋 R-T可以理解為不合作的誘惑; R-P是合作的剩余(利益); 條件說明: 給定未來的重要程度,不合作的一次性誘惑(R-T)相對(duì)于合作帶來的利益(R-P)越小,合作的可能性越大; 給定不合作的誘惑和合作帶來的利益,未來越重要,合作的可能性越大;寡頭競(jìng)爭(zhēng)中的合謀行為 一次性博弈中,唯一的均衡是古諾均衡或伯川德均衡; 但長期博弈中

8、,競(jìng)爭(zhēng)者可能選擇“合作”(合謀)。行為的信息傳遞 假如欺騙兩次才被發(fā)現(xiàn):1)1 (.trigger)(2432PRPPPRRV 不合作,PRTRPRTR含義 欺騙行為越難以被發(fā)現(xiàn),欺騙發(fā)生的可能性越大;或者說,合作越困難; 在前面的例子,R=4, T=3, P=0. 如果欺騙一次就被發(fā)現(xiàn),只要 合作就會(huì)出現(xiàn);而如果欺騙兩次才被發(fā)現(xiàn),只有當(dāng) 時(shí),合作才可能出現(xiàn); 一般地,欺騙行為越不容易被發(fā)現(xiàn),合作越困難。25. 004345 . 0懲罰與合作 Abreu(1986):最大合作戰(zhàn)略是使用最嚴(yán)厲的可信懲罰(the strongest credible punishment); 維護(hù)合作并不需要無限

9、期的懲罰;只要懲罰期足夠長就可以了; 蘿卜加大棒(stick and carrot): 從合作開始,一直合作直到:如果有任何一方在t期不合作,在t+1期,前期合作者選擇“不合作”來實(shí)施懲罰,前期不合作者選擇合作;如果該合作的沒有合作或者該懲罰的沒有懲罰,在t+2期繼續(xù)按照上述t+1期的戰(zhàn)略規(guī)定博弈;否則,合作恢復(fù)。解釋 在合作子博弈,合作的條件是: 在懲罰子博弈,合作的條件是:STTRSRTTSTSPSPTS不可信的懲罰:壟斷廠家客戶商家不購買購買誠實(shí)欺騙(5,5)(1,7)(0,0)不確定性下的最優(yōu)處罰 在確定的情況下,懲罰越嚴(yán)厲,越有助于合作。因?yàn)榫馇闆r下,欺騙從來不會(huì)發(fā)生,所以懲罰實(shí)際

10、上是沒有成本的。 但在不確定的情況下,即使每個(gè)人都選擇合作,“壞結(jié)果”也會(huì)出現(xiàn)。如果壞結(jié)果總是觸發(fā)懲罰,就會(huì)冤枉好人,過重的懲罰反到導(dǎo)致不合作;但如果總是原諒,合作也不會(huì)發(fā)生。寬容的懲罰 寬容的冷酷戰(zhàn)略:如果對(duì)方背叛,先懲罰幾次,然后再恢復(fù)合作。 寬容的以牙還牙:永遠(yuǎn)以合作的態(tài)度來回報(bào)對(duì)方的合作。當(dāng)遇到背叛時(shí),以某一概率與對(duì)方進(jìn)行合作;多重交易關(guān)系與合作行為合作不合作合作不合作3,3-1,44,-10,0合作不合作合作不合作5,50,99,04,4交易關(guān)系I交易關(guān)系II合作條件 在交易關(guān)系I中,合作要求 在交易關(guān)系II中,合作要求 如果兩種交易在同樣的兩個(gè)人之間進(jìn)行,只要, ,兩 種交易中都會(huì)

11、合作; 設(shè)想實(shí)際的 ,那么如果兩種交易發(fā)生在不同的人之間,合作只出現(xiàn)在市場(chǎng)I,不會(huì)出現(xiàn)于市場(chǎng)II。但如果兩人之間同時(shí)存在兩種交易,合作存在于兩個(gè)市場(chǎng)。25.08 . 056. 06 . 0社會(huì)關(guān)系與合作行為 更一般地講,市場(chǎng)交易常常鑲嵌在復(fù)雜的社會(huì)關(guān)系中。這種關(guān)系可以提高交易的合作程度。這也是人們?cè)敢獍l(fā)展社會(huì)關(guān)系的原因。舉例 在交易關(guān)系II中,假定除了這一交易外,當(dāng)事人雙方之間還存在另外的社會(huì)關(guān)系,這一社會(huì)關(guān)系對(duì)每一方的現(xiàn)值是V。如果交易中出現(xiàn)欺騙,這一價(jià)值就不存在。合作條件為:VV54應(yīng)用 家庭血緣關(guān)系; 朋友關(guān)系; 同學(xué)關(guān)系; 老鄉(xiāng)關(guān)系(保姆市場(chǎng));經(jīng)濟(jì)誘惑非非合合作作區(qū)區(qū)域域 100合合

12、作作區(qū)區(qū)域域 0.5 感情系數(shù)家族企業(yè)的困境;“殺熟” 如果懲罰對(duì)懲罰者本身的損害太大,懲罰就是不可信的。這與投鼠忌器是一個(gè)道理,你討厭老鼠,但是你沒有辦法,因?yàn)槟阈奶勰莻€(gè)盤子,那個(gè)器皿。投鼠忌器在我們企業(yè)內(nèi)部很多環(huán)節(jié)都會(huì)發(fā)生,導(dǎo)致懲罰不可信,所以對(duì)方就不會(huì)太注重信譽(yù)。家族成員有時(shí)候比非家族成員更不可信任,更不守規(guī)矩,就是這個(gè)道理。 朋友專門騙朋友,是“殺熟”。問題也與懲罰的不可信有關(guān)。小結(jié):合作的條件 重復(fù)博弈; 足夠耐心; 相對(duì)確定的環(huán)境; 欺騙可以被觀察到(信息問題); 受騙人有積極性懲罰; (多重交易關(guān)系;) (集體行為規(guī)范。)眼前利益與長遠(yuǎn)利益欺騙的短期收益信譽(yù)的長期收益時(shí)間第三方實(shí)

13、施的懲罰 前面假定了固定的一對(duì)參與人進(jìn)行重復(fù)博弈,對(duì)不合作的懲罰是由“受害人”本人實(shí)施的,稱為“second-party enforcement”,或者“personal enforcement”; 但更經(jīng)常的情況是參與人不固定的情況。此時(shí),懲罰要由第三方實(shí)施(third-party enforcement); 問題是第三方懲罰欺騙別人的人的同時(shí),自己可能失去合作帶來的好處?!皊econd-order prisoners dilemma”.長期參與人與不固定的短期參與人 最簡單的例子是廠家與消費(fèi)者之間的博弈:每個(gè)消費(fèi)者一般只購買一次,而廠家重復(fù)出售產(chǎn)品給眾多的消費(fèi)者。 此時(shí),只要消費(fèi)者足夠多,

14、并且每個(gè)消費(fèi)者能觀察到前一個(gè)消費(fèi)者購買的產(chǎn)品的質(zhì)量,合作仍然可以出現(xiàn)。產(chǎn)品質(zhì)量博弈購買不購買高質(zhì)量低質(zhì)量1,1-1,20,00,0Klein-Leffler Model 如果 ,下列戰(zhàn)略組合構(gòu)成一個(gè)精煉納什均衡:廠家開始生產(chǎn)高質(zhì)量;繼續(xù)生產(chǎn)高質(zhì)量,除非曾經(jīng)生產(chǎn)過低質(zhì)量;如果上一期生產(chǎn)了低質(zhì)量,之后永遠(yuǎn)生產(chǎn)低質(zhì)量;消費(fèi)者:第一個(gè)消費(fèi)者購買;只要低質(zhì)量事件沒有發(fā)生過,之后的消費(fèi)者繼續(xù)購買;但一旦發(fā)現(xiàn)低質(zhì)量,之后的消費(fèi)者不再購買; 結(jié)果:(購買,高質(zhì)量) 解釋連鎖點(diǎn)5 . 0社團(tuán)內(nèi)的博弈BHEGFACD社團(tuán)內(nèi)的博弈BHEGFACDThird-party enforcement problem 如果A

15、欺騙了B,其他成員是否應(yīng)該懲罰A? 如果C懲罰A,C就失去了與A合作的機(jī)會(huì),C為什么要替B懲罰A?社會(huì)規(guī)范:集體抵制 Boycott: 每個(gè)人都應(yīng)該誠實(shí);都有責(zé)任懲罰騙過人的人;不參與懲罰的人應(yīng)該受到懲罰;如:假定B在t期欺騙了A ,C在t+1期就不應(yīng)該與B合作,否則,D在t+2期就不應(yīng)該與C合作;如果C在t+1期與B合作,而D在t+2期又與C合作,E在t+3期就不應(yīng)該與D合作,如此等等; (美國對(duì)不參與伊拉克戰(zhàn)爭(zhēng)的國家的態(tài)度);敵友規(guī)則 開始把所有的人當(dāng)朋友;t期的朋友關(guān)系繼續(xù)保持到t+1期,當(dāng)只當(dāng)他在t期不曾騙過任何人并不曾與你的敵人合作; 朋友的朋友是朋友; 朋友的敵人是敵人; 敵人的朋

16、友是敵人; 敵人的敵人未必是朋友。PNE Milgrom, North and Weingast (1990), Econ and Poli; Kandori (1992), Review of Econ Stud; Mahoney and Sanchirico (2003), Cal L R; 如果每個(gè)人的行為是公共信息,合作是一個(gè)精煉納什均衡。 信息問題為理解法律的出現(xiàn)提供了一個(gè)原因。法律機(jī)關(guān)的一個(gè)功能是通過集中化信息使得信譽(yù)機(jī)制可以更好得發(fā)揮作用。傳統(tǒng)社會(huì)的個(gè)人信譽(yù) 在傳統(tǒng)社會(huì),人們常年生活在封閉的村莊,村民之間彼此非常熟悉,欺騙行為很容易識(shí)別,人們之間的口頭交流足以使任何欺騙行為廣為而

17、知,每個(gè)人的歷史都存儲(chǔ)在別人的腦海里,對(duì)欺騙行為的懲罰即使不能施加于欺騙者本人,也可以通過家庭成員而實(shí)現(xiàn),前面講的幾個(gè)條件基本是可以得到滿足。因此,即使沒有法律,村民之間也可以建立起高度的信任,欺騙行為很少發(fā)生。商業(yè)社會(huì)的問題 現(xiàn)在社會(huì)被稱為“匿名社會(huì)”(anonymous society),與鄉(xiāng)村社會(huì)不同,居民的流動(dòng)性大,交易雙方通常并不認(rèn)識(shí),相互之間也缺少如鄉(xiāng)村社會(huì)中存在的其他制約關(guān)系,使得受害人的懲罰措施受到很大限制;開放的社會(huì)也使得人們較不在乎閑言碎語的議論。凡此種種,使得傳統(tǒng)的以個(gè)人為基礎(chǔ)的信譽(yù)機(jī)制失靈,這也是都市社會(huì)犯罪率高的一個(gè)重要原因。但是,西方市場(chǎng)經(jīng)濟(jì)只所以能發(fā)達(dá)到今天的程度

18、,除了較完善的司法制度之外,是因?yàn)樗麄冊(cè)诟叩男螒B(tài)上復(fù)制出了前面講的四個(gè)條件。企業(yè)作為信譽(yù)的載體 個(gè)人的生命是有限的 “企業(yè)”將一次性博弈變成長期博弈 欺騙行為更容易被觀察和傳播 用“廟”的聲譽(yù)約束“和尚”的行為 企業(yè)的唯一資產(chǎn)就是信譽(yù) 有了企業(yè),大量的交易就可以通過信譽(yù)機(jī)制進(jìn)行,無須通過法律;即使需要法律的介入,其成本也大大降低一個(gè)實(shí)例分析 2001年2月14日,魏女士到北京建設(shè)銀行甘家口分理處支取了5萬元現(xiàn)金,隨即到相距不到30米的工商銀行甘家口儲(chǔ)蓄所存入。工商銀行工作人員從中驗(yàn)出兩張100元的假鈔。魏女士稱,兩張假鈔是剛在建行取出的一正捆1萬元的現(xiàn)金中發(fā)現(xiàn)的,當(dāng)時(shí)封條都沒有拆。魏女士立即

19、返回建設(shè)銀行要求賠償,但銀行稱,錢出了大門,難以確認(rèn)假鈔是從哪一個(gè)環(huán)節(jié)出現(xiàn)的,銀行不能承擔(dān)責(zé)任。魏女士因此向法院提出訴訟,法院判決魏女士敗訴。為什么假定銀行更講信譽(yù)? 銀行作為一個(gè)組織,其真正的價(jià)值就在于它的信譽(yù)。對(duì)單個(gè)的儲(chǔ)戶而言,用假幣行騙的成本是很小的,因?yàn)榻^大多數(shù)的交易對(duì)手是不認(rèn)識(shí)個(gè)人客戶的,有關(guān)單個(gè)人的欺騙行為的信息很難流傳開來。銀行不同,記住它的名字很容易,傳播它的壞消息也不難。如果一個(gè)銀行連續(xù)多次被客戶指控發(fā)出假鈔,這個(gè)銀行就可能完旦了-如果有競(jìng)爭(zhēng)對(duì)手的話。因此,即使就個(gè)案而言魏女士手中的假鈔確實(shí)來自銀行,但在缺乏足夠證據(jù)的情況下,法院判決她敗訴也是合理的。企業(yè)信譽(yù)的三個(gè)條件 企業(yè)必須有所有者:所有者就是企業(yè)信譽(yù)價(jià)值的索取者 企業(yè)必須能被交易(所有權(quán)可以出售):

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論