第7章+不完全信息與聲譽.ppt_第1頁
第7章+不完全信息與聲譽.ppt_第2頁
第7章+不完全信息與聲譽.ppt_第3頁
第7章+不完全信息與聲譽.ppt_第4頁
第7章+不完全信息與聲譽.ppt_第5頁
已閱讀5頁,還剩28頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第7章不完全信息與聲譽,張維迎 教授 北京大學(xué)光華管理學(xué)院,有限次博弈,第6章證明,只要未來足夠重要,合作行為可以是無限次重復(fù)博弈的精煉納什均衡。 但是,現(xiàn)實中許多博弈是有限次的,不是無限次的。 如果博弈重復(fù)的次數(shù)是有限的,無論重復(fù)多少次,合作都不會出現(xiàn)。,“連鎖店悖論”(chain-store paradox),Selten (1978);,進入者,在位者,進入,不進入,默許,斗爭,(40,50),(-10,0),(0,100),逆向歸納,假定在位者有20個市場。直觀告訴我們,如果進入者在第一個市場進入,在位者應(yīng)該選擇斗爭,因為盡管從一個市場看,斗爭是不值得的,但這樣做可以遏止進入者在其他市

2、場上的進入。 唯一的精煉納什均衡是:進入者總是進入;在位者總是默許。,Axelrod 實驗,Axelrod(1981)實驗表明:即使在有限次博弈中,合作行為也頻繁出現(xiàn)。,問題在哪里?,一個可能的原因在于:我們前面假定不僅參與人的理性是共同知識,而且每個參與人可以選擇的戰(zhàn)略和效用函數(shù)都是共同知識。但現(xiàn)實不是這樣。 可能性:逆向歸納方法的問題(理性共識);信息不完全; 正如我們前面討論的談判情況:如果信息是完全的,談判一開始就達成協(xié)議,但現(xiàn)實中的談判不是這樣,原因在于信息不對稱。,不完全信息,KMRW模型(1982); 如果參與人對其他參與人的效用函數(shù)和戰(zhàn)略空間的信息不完全,即使博弈重復(fù)的次數(shù)是有

3、限的,人們也有積極性建立一個合作的聲譽(reputation),合作會出現(xiàn)。,單方不完全信息,假定有兩個參與人,A和B,進行囚徒困境博弈。如下圖。 參與人A有兩中可能的類型:“非理性”型:只有一種戰(zhàn)略,tit-for-tat (TFT),或者grim strategy, 概率為p; “理性”型:可以選擇任何戰(zhàn)略,概率為(1-p); 參與人B有一種類型:理性型。,對“非理性”的解釋,特殊的成本函數(shù)或效用函數(shù); 講義氣、重情誼的人;內(nèi)在化了 reciprocity 社會規(guī)范的人; 認知問題;,囚徒困境博弈,合作,背叛,合作,背叛,3,3,-1,4,4,-1,0,0,A,B,博弈重復(fù)兩次,t=1,t

4、=2,A,非理性(p),理性型(1-p),B (理性型),合作,X,背叛,背叛,X,背叛,第2階段,參與人A:如果是理性的,選擇“背叛”;如果是非理性的,選擇B在第1階段的行動(X); 參與人B:選擇“背叛”。,第1階段,參與人A:如果是非理性的,選擇“合作”;如果是理性的,選擇“背叛”; 參與人B:如果選擇合作,面臨被背叛的風(fēng)險,但如果A是非理性的,可以換來第2階段的合作。,B在第2階段的選擇,選擇合作,期望效用是: 3p+(-1)(1-p)+4p+0(1-p)=8p-1 如果選擇背叛,期望效用函數(shù)是: 4p+0(1-p)+0=4p 最優(yōu)選擇是合作,如果:p=0.25; 結(jié)論:如果B認為A非

5、理性的概率不小于0.25, B在第1階段會選擇合作,即使博弈只重復(fù)兩次。,博弈重復(fù)3次,t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X,?,背叛,X,X,t=3,X,背叛,背叛,參與人A(理性)的選擇,如果A是理性的,在第2階段和第3階段一定會選擇背叛,但第1階段也可能選擇合作,因為建立一個合作的形象可以換取B在第2階段的合作; 如果p=0.25, 并且A認為B在第1階段會合作,給定A在第2階段合作的話B在在第2階段也會合作,那么A選擇合作得到:3+4+0=5; 如果A選擇背叛,得到:4+0+0=4; 所以合作是最優(yōu)的。,參與人B的選擇,B有四種戰(zhàn)略: (合作,合

6、作,背叛); (合作,背叛,背叛); (背叛,背叛,背叛); (背叛,合作,背叛),(合作,合作,背叛),t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X=合作,合作,背叛,X=合作,X=合作,t=3,X=合作,背叛,背叛,3+ 3p+(-1)(1-p)+ 4p+0=8p+2,預(yù)期效用=,(合作,背叛,背叛),t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X=合作,合作,背叛,X=合作,X=背叛,t=3,X=背叛,背叛,背叛,3+ 4p+0(1-p)+ 0= 4p+3,預(yù)期效用=,(背叛,背叛,背叛),t=1,t=2,A,非理性(p),理

7、性型(1-p),B (理性型),合作,X=背叛,合作,背叛,X=背叛,X=背叛,t=3,X=背叛,背叛,背叛,4+ 0 +0= 4,預(yù)期效用=,(背叛,合作,背叛),t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X=背叛,合作,背叛,X=背叛,X=合作,t=3,X=合作,背叛,背叛,4+ (-1) +4p+0(1-p)= 4p+3,預(yù)期效用=,P=1,8p+2 (合作,合作,背叛),0.2,4p+3 (合作,合作,背叛) (背叛,合作,背叛),=4(背叛,背叛,背叛),結(jié)論,只要p=0.25, 下表所列戰(zhàn)略組合是一個精煉納什均衡: 理性型A在第1階段選擇合作,然后在

8、第2和第3階段選擇背叛; B在第1和第2階段選擇合作,然后在第3階段背叛。,精煉納什均衡,t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X=合作,合作,背叛,X=合作,X=合作,t=3,X=合作,背叛,背叛,一般結(jié)論,可以證明:如果博弈重復(fù)T次,只要p=0.25, 對于所有的T=3, 下列戰(zhàn)略組合構(gòu)成一個精煉納什均衡:理性型A在t=1.T-2階段選擇合作,在T-1和T階段選擇背叛;B在t=1.T-1階段選擇合作,在最后階段T選擇背叛。 背叛只在最后兩階段出現(xiàn)。,雙方不完全信息,在單方不完全信息下,只要p0.25,不論博弈重復(fù)多少次,合作都不會出現(xiàn)。 但如果雙方信息不

9、完全,即使小小的不確定性也會導(dǎo)致合作行為,只要博弈重復(fù)的次數(shù)足夠多(但不需要是無限次); 原因在于,如果博弈重復(fù)的次數(shù)足夠長,沒有任何一方愿意一開始就把自己的名聲搞壞。,Grim Strategies,假定非理性型選擇grim strategy; 如果A在一開始就選擇背叛,暴露了自己是非合作型的,從第2期開始的唯一的均衡是每個人都背叛;所以A的最大預(yù)期收益為: 4+0+0+=4; 假定選擇如下戰(zhàn)略:開始選擇合作,直到對方選擇不合作,之后永遠背叛。最小預(yù)期收益是: p(3T)+(1-p)(-1+0+0+)=p(3T)-(1-p),合作條件,(p)(3T)-(1-p)=4; T*=(5-p)/p; 所以,無論p多小,只要博弈重復(fù)的次數(shù)足夠大,一開始就選擇背叛不是最優(yōu)的。,KMRW定理,在不完全信息的情況下,只要博弈重復(fù)的次數(shù)足夠長,參與人就有積極性在博弈的早期建立一個“合作”的聲譽;只是在博弈的后期,才會選擇背叛;并且,非合作階段的數(shù)量只與p有關(guān),而與博弈的次數(shù)T無關(guān)。 看似不理性的行為其實是理性的;,“大智若愚”,應(yīng)該樹立什么樣的形象? 合作與非合作; 強硬與懦弱; 對“不理智”(情緒

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論