第四章重復(fù)博弈a.doc_第1頁
第四章重復(fù)博弈a.doc_第2頁
第四章重復(fù)博弈a.doc_第3頁
第四章重復(fù)博弈a.doc_第4頁
第四章重復(fù)博弈a.doc_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第四章_重復(fù)博弈a第四章 重復(fù)博弈本章主要內(nèi)容: 1 重復(fù)博弈的概念; 2 作為一種特殊的動(dòng)態(tài)博弈,有限次和無限次重復(fù) 博弈的子博弈完美納什均衡的求解方法; 3 無限次重復(fù)博弈古諾模型和效率工資模型。本章主要結(jié)論(民間定理): 由于參與者在重復(fù)博弈中具有了長期利益,可以通過在后面階段中采取的報(bào)復(fù)策略使得威脅變得可信,從而擺脫靜態(tài)博弈中“追求自身利益最大化”導(dǎo)致的囚徒困境,實(shí)現(xiàn)長期合作的結(jié)局。經(jīng)濟(jì)博弈論 徐寅峰 教授第一節(jié) 幾個(gè)概念重復(fù)博弈的概念有限次重復(fù)博弈的概念經(jīng)濟(jì)博弈論 徐寅峰 教授4.1.1 重復(fù)博弈的概念 1 由簡單的靜態(tài)博弈(或動(dòng)態(tài)博弈)的有限次(或無限次)重復(fù)進(jìn)行構(gòu)成的。 2 每一

2、階段博弈方、策略集合、規(guī)則和得益都相 同。 3 包括:有限次重復(fù)博弈和無限次重復(fù)博弈 4 例子: 多場決勝負(fù)的體育比賽(有限次) 兩寡頭市場上兩個(gè)廠商之間的競爭(無限次) 商場與顧客交易經(jīng)濟(jì)博弈論 徐寅峰 教授4.1.2 有限次重復(fù)博弈的概念 定義:給定一個(gè)博弈g,重復(fù)進(jìn)行t次g,并且在每次重復(fù)之前各博弈方都能觀察到以前博弈的結(jié)果,稱為g的一個(gè)“t次重復(fù)博弈”,記為g(t)。其中,g成為g(t)的原博弈。每次重復(fù)稱為g(t)的一個(gè)階段。經(jīng)濟(jì)博弈論 徐寅峰 教授4.1.2 有限次重復(fù)博弈的概念 幾個(gè)概念:1 子博弈:從某一階段(不包括第一階段)開始,包含以后所有階段的原重復(fù)博弈的一部分。2 策略

3、:博弈方在每個(gè)階段針對(duì)每種情況如何行動(dòng)的計(jì)劃(注:在每一階段之前,博弈方是可以觀察到以前博弈的結(jié)果的)。經(jīng)濟(jì)博弈論 徐寅峰 教授4.1.2 有限次重復(fù)博弈的概念3 路徑: 是每個(gè)階段博弈結(jié)果(原博弈的一個(gè)策略組合)連接而成。對(duì)于具有n個(gè)策略組合的原博弈,重復(fù)t次的路徑數(shù)為nt,重復(fù)博弈的求解即找出具有穩(wěn)定性的均衡路徑。4 得益:不同于一般的動(dòng)態(tài)博弈,重復(fù)博弈的得益為各個(gè)階段得益的加總??紤]到時(shí)間的價(jià)值,需要引進(jìn)“貼現(xiàn)系數(shù)”將未來的得益折算成當(dāng)期得益的價(jià)值。經(jīng)濟(jì)博弈論 徐寅峰 教授第二節(jié) 有限次重復(fù)博弈有限次重復(fù)的猜硬幣博弈原博弈為零和博弈有限次重復(fù)的囚徒困境博弈原博弈有唯一的純策略納什均衡有多

4、個(gè)納什均衡的重復(fù)博弈的策略設(shè)計(jì)觸發(fā)策略有多個(gè)納什均衡重復(fù)博弈的得益范圍民間定理經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.1 有限次重復(fù)的猜硬幣博弈 在零和博弈中,雙方不存在合作的可能性,因此在長期進(jìn)行的重復(fù)博弈中,子博弈完美納什均衡由各個(gè)階段原博弈的納什均衡構(gòu)成(例,在猜硬幣博弈中以0.5的概率選擇正面或者反面,即采取混合策略)。 實(shí)際上,所有以零和博弈為原博弈所構(gòu)成的重復(fù)博弈與猜硬幣博弈構(gòu)成的重復(fù)博弈一樣,各博弈方的正確策略就是在每次重復(fù)中都采用一次性博弈中的納什均衡策略。經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.2 有限次重復(fù)的囚徒困境博弈 圖41 囚徒困境求解思路:對(duì)于有限次重復(fù)囚徒困境博弈,根據(jù)動(dòng)態(tài)博弈的

5、逆推歸納法可以求解。1,18, 0 0, 85,5坦白不坦白 坦白 不坦白經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.2 有限次重復(fù)的囚徒困境博弈 以兩階段(以該博弈作為原博弈g重復(fù)兩次)為例:分析最后一階段,子博弈即為原博弈,唯一的均衡為(5,5);分析第一階段,將最后階段的收益(5)添加到第一階段的矩陣中,即:此時(shí),博弈的納什均衡仍是(坦白,坦白)。 坦白 不坦白坦白不坦白6,613, 5 5, 1310,10經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.2 有限次重復(fù)的囚徒困境博弈結(jié)論: 在有限次重復(fù)博弈g(t)中,如果原博弈g存在唯一的純策略納什均衡組合,則重復(fù)博弈的唯一的子博弈完美納什均衡解為各博弈方在每階段

6、都采取的原博弈納什均衡策略。含義:在原博弈具有唯一均衡的有限次重復(fù)博弈中,由于完全理性的博弈方具有“共同知識(shí)”的分析推理能力,因此在從最后階段開始的逆推過程中,仍然無法擺脫囚徒困境。經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.2 有限次重復(fù)的囚徒困境博弈如果原博弈存在唯一的純策略納什均衡組合,則有限次重復(fù)博弈的唯一的均衡解即各博弈方在每階段(即每次重復(fù))中都采用原博弈的納什均衡策略。由于在這樣的雙方策略下,均衡路徑中的每個(gè)階段都不存在不可信的威脅或許諾,因此這種均衡是子博弈完美納什均衡。經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.2 有限次重復(fù)的囚徒困境博弈 定理 設(shè)原博弈g有唯一的純策略納什均衡,則對(duì)任意正整數(shù)t,

7、重復(fù)博弈g(t)有唯一的子博弈完美的解,即各博弈方每個(gè)階段都采用g的納什均衡策略。各博弈方在g(t)中的總得益為在g中得益的t倍,平均每階段得益等于原博弈g中的得益。經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.3 有兩個(gè)納什均衡的重復(fù)博弈例 兩個(gè)廠商1和2,同時(shí)面臨兩個(gè)市場機(jī)會(huì)a和9><>b。假設(shè)每個(gè)廠商都只有能力選擇一市場發(fā)展,即他們的可選擇策略都是a或<>b,其得益矩陣如圖所示。 此博弈具有2個(gè)純策略納什均衡(1,4)、(4,1)和混合策略納什均衡概率(0.5,0.5)。 a <>ba <>b0,04,11, 43,3圖42 兩廠商差別市場博弈經(jīng)濟(jì)

8、博弈論 徐寅峰 教授4.2.3 有兩個(gè)納什均衡的重復(fù)博弈 考慮三次重復(fù)博弈各策略組合子博弈納什均衡路徑: 1.由原博弈的納什均衡組合而成的路徑,如采取輪換策略(在上述的協(xié)調(diào)博弈中,雙方輪換采取純納什均衡策略,路徑為(a,<>b),(<>b,a),(a,<>b).不考慮時(shí)間的價(jià)值(貼現(xiàn)系數(shù)),每階段的平均得益為(41)/2 2.5,高于混合策略的得益2。 2.觸發(fā)策略,博弈方首先采取合作行為,如果發(fā)現(xiàn)對(duì)方?jīng)]有進(jìn)行合作,那么在后續(xù)階段的博弈中采取不合作策略進(jìn)行懲罰。經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.3 有兩個(gè)納什均衡的重復(fù)博弈 在圖42中,觸發(fā)策略的設(shè)計(jì)為:(1)

9、博弈方1的策略是第一階段合作a,如果發(fā)現(xiàn)對(duì)方采取<>b不合作,則第二階段采取不合作的<>b策略懲罰,否則第二階段繼續(xù)合作;第三階段無條件采取<>b策略。(2)博弈方2的策略是第一階段合作a,如果發(fā)現(xiàn)對(duì)方采取<>b不合作,則后續(xù)兩個(gè)階段一直采取不合作的<>b策略;如果發(fā)現(xiàn)對(duì)方采取合作a,則第二階段采取不合作<>b,第三階段采取合作a。 經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.3 有兩個(gè)納什均衡的重復(fù)博弈 策略設(shè)計(jì)分析: (1)在博弈方1和2中,在第一階段都采取了合作行為a,并針對(duì)對(duì)方的不合作行為<>b,都設(shè)計(jì)了在后續(xù)2個(gè)

10、階段采取不合作<>b的相應(yīng)懲罰措施; (2)如果對(duì)方在第一階段中采取了合作行為,在后續(xù)階段的策略設(shè)計(jì)中要保證博弈結(jié)局具有穩(wěn)健性。因此,針對(duì)第一階段的合作行為,后續(xù)階段的策略設(shè)計(jì)是為了實(shí)現(xiàn)雙方的行動(dòng)協(xié)調(diào),以保證實(shí)現(xiàn)納什均衡(<>b,a)或(a,<>b)。經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.3 有兩個(gè)納什均衡的重復(fù)博弈 結(jié)果分析: 子博弈路徑(a,a),(a,<>b),(<>b,a)為子博弈納什均衡。 因?yàn)楹罄m(xù)兩階段的結(jié)局(a,<>b)和(<>b,a)為納什均衡,而第一階段的合作結(jié)局(a,a)是由于觸發(fā)策略針對(duì)對(duì)方偏離

11、合作的行為設(shè)計(jì)了后續(xù)兩階段都不合作的懲罰措施,其單方面偏離的路徑(<>b,a)(<>b,<>b)(<>b,<>b)收益并不增加,因此不存在偏離的動(dòng)機(jī)。經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.4 民間定理問題的提出:由于具有多個(gè)納什均衡的重復(fù)博弈可以設(shè)計(jì)多種策略,在雙方缺乏溝通的情況下,結(jié)局具有不確定性。因此,這里討論具有多個(gè)納什均衡的重復(fù)博弈可以實(shí)現(xiàn)的收益范圍。個(gè)體理性得益:不管對(duì)方采取何種行動(dòng),只要自己的行為合理就可以保證實(shí)現(xiàn)的收益。可實(shí)現(xiàn)得益:各純策略組合得益的加權(quán)平均數(shù)組。注意:并非一定是均衡策略的組合得益,因此在圖42中,(3,3)也

12、是可實(shí)現(xiàn)得益。經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.4 民間定理 用wi記博弈方i在一次性博弈中最差的均衡得益,用w記各博弈方的wi構(gòu)成的得益數(shù)組。結(jié)合“個(gè)體理性得益”和“可實(shí)現(xiàn)得益”,則有限但次數(shù)很多的重復(fù)博弈有如下民間定理: 定理:將一次性博弈中最差的均衡得益數(shù)組記為w,如果原博弈g的一次性博弈有均衡得益數(shù)組優(yōu)于w,那么在有限次重復(fù)博弈g(t)中,所有個(gè)體理性得益和可實(shí)現(xiàn)得益都至少有一個(gè)子博弈完美納什均衡來實(shí)現(xiàn)。經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.4 民間定理 在圖4-2一次性博弈中,博弈方均衡得益分別為純策略的得益(1,4),(4,1)和混合策略的得益(2,2),最差的均衡得益數(shù)組為w=(1,1)

13、。 圖4-3 民間定理 (1,4) (3,3)(1,1)(4,1)廠商2得益廠商1得益經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.4 民間定理 在圖4-3中,通過不同得益的組合,陰影部分(包括連線)的得益都是可實(shí)現(xiàn)得益。 民間定理揭示出:在有限次重復(fù)博弈中,可以通過設(shè)計(jì)觸發(fā)策略來實(shí)現(xiàn)(或者逼近)陰影部分的得益。經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.4 民間定理 定理分析:民間定理表明,在具有多個(gè)納什均衡的有限次重復(fù)博弈中,通過設(shè)計(jì)具有可信威脅的觸發(fā)策略(即在第一階段采取合作行為,當(dāng)對(duì)方不合作時(shí)通過在后續(xù)階段采取相應(yīng)的不合作策略進(jìn)行懲罰;當(dāng)對(duì)方合作時(shí),在最后階段采取一次性原博弈的納什均衡策略作為穩(wěn)定的結(jié)局。),可

14、以使得博弈方在重復(fù)博弈的過程中具有了一定學(xué)習(xí)能力,從而達(dá)到博弈的帕累托前沿得益。經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.4 民間定理例(兩人各三種可選策略): l m r l m r 圖44多種策略博弈的重復(fù)博弈 該博弈具有兩個(gè)純策略納什均衡和一個(gè)混合策略納什均衡,但是雙方存在一個(gè)更好的得益(4,4)。對(duì)于二次重復(fù)博弈,根據(jù)民間定理可以設(shè)計(jì)一個(gè)觸發(fā)策略來實(shí)現(xiàn)這個(gè)得益。3,30,00,00,04,40,50,05,01,1經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.4 民間定理 觸發(fā)策略:博弈方1在第一階段采取m策略,如果對(duì)方合作,則第二階段采取r策略作為獎(jiǎng)勵(lì);否則第二階段采取l策略進(jìn)行懲罰(注意(l,l)也是納什

15、均衡,因此具有穩(wěn)定性)。博弈方2也采取同樣策略。 策略分析:如果任何一方在第一階段偏離,僅僅多獲得541單位得益,而在第二階段的得益(l,l)僅僅為1;如果在第一階段合作,第二階段的得益為3。因此雙方不存在偏離該策略的動(dòng)機(jī)。經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.4 民間定理例(雙方各五種可選策略重復(fù)博弈): l m r p q l m r p q 圖45雙方各五種可選策略重復(fù)博弈1/2,40,00,00,00,00,04,1/20,00,00,00,00,03,30,00,00,00,00,04,40,50,00,00,05,01,1經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.4 民間定理 該博弈具有4個(gè)純策略

16、納什均衡,在二次重復(fù)博弈中,觸發(fā)策略設(shè)計(jì):第一階段雙方采取(m,m)策略,如果博弈方1偏離此策略,那么第二階段采取(q,q)策略對(duì)博弈方1進(jìn)行懲罰,對(duì)博弈方2進(jìn)行獎(jiǎng)勵(lì);同理,如果博弈方2偏離了此策略,那么采取(p,p)策略對(duì)博弈方2進(jìn)行懲罰,對(duì)博弈方1進(jìn)行獎(jiǎng)勵(lì)。如果雙方都沒有偏離,那么第二階段采取具有較高收益的納什均衡(r,r)策略。如果雙方都偏離了此策略,第二階段同樣采取納什均衡的(r,r)策略。經(jīng)濟(jì)博弈論 徐寅峰 教授4.2.4 民間定理 策略分析:與圖44例子相比較,由于博弈的特殊結(jié)構(gòu),這個(gè)觸發(fā)策略的設(shè)計(jì)對(duì)偏離行為和合作行為分別進(jìn)行懲罰和獎(jiǎng)勵(lì),因此策略具有很強(qiáng)的可信性。而在圖4-4例子中

17、,針對(duì)對(duì)方的偏離行為采取了(l,l)策略進(jìn)行懲罰,但是懲罰對(duì)方的同時(shí),自身的利益也受到了損害,因此可信性不強(qiáng)。經(jīng)濟(jì)博弈論 徐寅峰 教授第三節(jié) 無限次重復(fù)博弈在有限次重復(fù)博弈中, (1)由于完全理性的博弈方可以運(yùn)用逆推歸納法,因此對(duì)于原博弈具有唯一納什均衡(如囚徒困境博弈)的有限次重復(fù)博弈,重復(fù)博弈結(jié)局尚無法擺脫囚徒困境; (2)但是對(duì)于原博弈具有多個(gè)納什均衡的有限次重復(fù)博弈,根據(jù)民間定理可以設(shè)計(jì)出具有可信威脅的觸發(fā)策略,達(dá)到帕累托最優(yōu)的博弈結(jié)局。經(jīng)濟(jì)博弈論 徐寅峰 教授第三節(jié) 無限次重復(fù)博弈在本節(jié)的無限次重復(fù)博弈中,由于無法運(yùn)用逆推歸納法,因此對(duì)于原博弈具有唯一納什均衡(如囚徒困境博弈)的無限

18、次重復(fù)博弈,考慮到時(shí)間的價(jià)值后,也可以設(shè)計(jì)出具有可信威脅的觸發(fā)策略,擺脫囚徒困境,達(dá)到帕累托最優(yōu)的博弈結(jié)局。經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.1 幾個(gè)概念無限次重復(fù)博弈求解存在的問題:(1)由于不存在最后一個(gè)階段,無法運(yùn)用逆推歸納法求解;(2)如果不考慮時(shí)間的價(jià)值,在無限次重復(fù)加總過程中,幾乎所有子博弈路徑的總得益都為無窮大,因此無法比較不同路徑的優(yōu)劣。解決方法:考慮到時(shí)間的價(jià)值,人們更為注重近期的得益,引入貼現(xiàn)系數(shù) ,將未來階段的收益折算到當(dāng)期階段。這樣在無限次重復(fù)博弈中,總收益值將是一個(gè)有限數(shù),可以加以比較。經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.1 幾個(gè)概念貼現(xiàn)系數(shù): 1/(1+),其中為以一階段

19、為期限的市場利率。 給定貼現(xiàn)系數(shù),若無限次重復(fù)博弈一路徑的某博弈方各階段的收益為 ,則該博弈方在該無限次重復(fù)博弈中的總收益為各階段博弈中得益的“現(xiàn)在值”: 經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.1 幾個(gè)概念定義:給定一博弈g,無限次重復(fù)進(jìn)行g(shù)博弈的過程稱為g的“無限次重復(fù)博弈”,記為g(,),其中是各博弈方得益共同的貼現(xiàn)系數(shù)。并且,對(duì)任意的t,在進(jìn)行第t階段(第t次重復(fù))博弈之前,所有博弈方都能看到前(t1)階段博弈的結(jié)果。各博弈方在g(,)中的“得益”等于各階段得益的現(xiàn)在值。經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.2 無限次重復(fù)的囚徒困境博弈在有限次重復(fù)囚徒困境博弈中, 雙方采取背叛策略(l,l)將是 唯

20、一的子博弈完美均衡路徑。 現(xiàn)在分析無限次重復(fù)博弈中, 觸發(fā)策略是否會(huì)帶來更好的結(jié)局?觸發(fā)策略:雙方在第一階段采取合作的策略r,如果前(t1)都是合作,那么繼續(xù)合作;否則,如果對(duì)方背叛,則在后續(xù)階段一直采取背叛策略l作為懲罰。4,40,55, 0 1,1l rlr圖46經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.2 無限次重復(fù)的囚徒困境博弈策略分析: 如果一方背叛,那么其路徑(l,r),(l,l),(l,l).的總收益為: 如果一方一直采取合作策略,那么總收益為: 當(dāng)滿足條件 時(shí),博弈方采取合作 策略將獲得更大的總收益,求解可得:經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.2 無限次重復(fù)的囚徒困境博弈結(jié)論:在原博弈具有

21、唯一納什均衡的無限次重復(fù)博弈中,在滿足一定條件下 ,采取觸發(fā)策略可以擺脫囚徒困境。這個(gè)條件表明貼現(xiàn)系數(shù)較大,博弈方比較看重未來階段的收益。直觀上看,當(dāng)博弈方注重長期利益時(shí),通過采取觸發(fā)策略可以實(shí)現(xiàn)長期合作的圓滿結(jié)局。經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.3 無限次重復(fù)博弈的民間定理 本節(jié)介紹無限次重復(fù)博弈的一個(gè)基本結(jié)論,為此先介紹“無限次重復(fù)博弈的平均得益”概念,“可實(shí)現(xiàn)得益”概念已經(jīng)在4.2.4節(jié)加以介紹。 可實(shí)現(xiàn)得益:階段博弈各種純策略組合得益的加權(quán)平均所構(gòu)成的得益數(shù)組,其中權(quán)數(shù)非負(fù)且總合為1,記為 。經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.3 無限次重復(fù)博弈的民間定理 在圖46的囚徒困境例子中,圖47

22、陰影部分即為可實(shí)現(xiàn)得益。 圖47 可實(shí)現(xiàn)得益 (0,5)(1,1)(4,4)(5,0)博弈方2博弈方1經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.3 無限次重復(fù)博弈的民間定理無限次重復(fù)博弈平均得益的定義:如果有一常數(shù),它作為一無限次重復(fù)博弈每個(gè)階段的得益能產(chǎn)生與該博弈無限次重復(fù)中某博弈方的無窮得益數(shù)列1,2,相同的貼現(xiàn)值,則稱為1,2,的平均得益。經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.3 無限次重復(fù)博弈的民間定理平均得益的計(jì)算: 給定貼現(xiàn)系數(shù),每階段得益都為時(shí),無限次重復(fù)博弈的貼現(xiàn)值為: 如果每階段的得益為1,2,,無限次重復(fù)博弈的貼現(xiàn)值為: 兩式聯(lián)立,可以解得: 經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.3 無限次重復(fù)

23、博弈的民間定理 無限次重復(fù)博弈的民間定理:設(shè)g是一個(gè)完全信息的靜態(tài)博弈,其一個(gè)納什均衡的得益記為(e1,en),其可實(shí)現(xiàn)得益記為( x1,xn )。如果對(duì)于任意博弈方i都有xi &gt; ei,并且足夠接近于1,那么無限次重復(fù)博弈g(,)一定存在一個(gè)子博弈完美納什均衡路徑,能實(shí)現(xiàn)大小為( x1,xn )的重復(fù)博弈中各博弈方平均得益。經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.3 無限次重復(fù)博弈的民間定理幾點(diǎn)說明: 1.定理表明,以得益較低的納什均衡(e1,en)作為可信的威脅,無限次重復(fù)博弈中可以實(shí)現(xiàn)更好的收益( x1,xn )。 由于對(duì)于任意博弈方i都有xi &gt; ei,因此這個(gè)得益

24、是帕累托改進(jìn)的。 2.定理的條件為足夠接近于1,即博弈方都比較看重未來長期合作的得益,因此避免了短期行為。 3.不同于有限次重復(fù)博弈的民間定理,這里并不要求原博弈具有多個(gè)納什均衡。經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.3 無限次重復(fù)博弈的民間定理 圖例分析:原博弈為 圖46的囚徒困境博 弈,在菱形區(qū)域的可 實(shí)現(xiàn)得益區(qū)間中,只 有陰影部分才滿足對(duì) 于任意博弈方i都有 xi &gt; ei的帕累托改進(jìn) 條件,因此,當(dāng)足夠 大時(shí),無限次重復(fù)博弈 總有一個(gè)路徑實(shí)現(xiàn)陰影部分的收益。(4,4)(0,5)(1,1)(5,0)博弈方2博弈方1圖48經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.4 無限次重復(fù)博弈的古諾模型

25、回憶靜態(tài)博弈的古諾模型: (1)市場總產(chǎn)量為qq1+q2,兩廠商的策略是制定各自的產(chǎn)量q1和q2,市場需求函數(shù)為p(q)=8q,廠商無固定成本,邊際成本為2,求解納什均衡策略?根據(jù)利潤最大化原則,廠商1和2的利潤函數(shù):u1p(q)×q1c× q1 q1×8(q1q2)2 q16 q1 q1 q2 q12u2p(q)×q2c1× q2 q2×8(q1q2) 2 q26 q2 q1 q2 q22 對(duì)利潤函數(shù)求導(dǎo),得最大值: 經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.4 無限次重復(fù)博弈的古諾模型聯(lián)立解得,雙方均衡產(chǎn)量(古諾產(chǎn)量):q2* q1*2,雙

26、方各自利潤分別為: u1 u24。(2)如果兩廠商合謀,在市場上形成一個(gè)壟斷廠商,追求總利潤的最大化: u= p(q)×qc×q q(8q)2q6qq2 求導(dǎo)得:最大的總產(chǎn)量q*3,最大的總利潤u*=9,每個(gè)廠商的平均產(chǎn)量為1.5,平均利潤為u1u24.5,大于不合作情況下古諾產(chǎn)量的利潤4。經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.4 無限次重復(fù)博弈的古諾模型 下面分析無限次重復(fù)博弈古諾模型的3個(gè)策略。觸發(fā)策略1:第一階段各自生產(chǎn)壟斷產(chǎn)量1.5,如果雙方在前(t1)階段都進(jìn)行合作,保持了壟斷產(chǎn)量(1.5,1.5),那么第t階段繼續(xù)合作;否則生產(chǎn)具有較低收益的作為納什均衡的古諾產(chǎn)量2。

27、經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.4 無限次重復(fù)博弈的古諾模型 策略1分析: 如果雙方一直保持合作,則每階段的壟斷收益都為4.5,因此總收益: 4.5(12)4.5/(1) (1) 如果一方在第一階段偏離合作,其應(yīng)在對(duì)方采取壟斷產(chǎn)量1.5情況下,采取使其利潤最大化的產(chǎn)量,即: max(81.5q2)q22q2max(4.5q2).q2 解得q22.25,此時(shí)利潤 u max(4.5q2).q25.0625;經(jīng)濟(jì)博弈論 徐寅峰 教授無限次重復(fù)博弈的古諾模型 但是在后續(xù)階段中只能得到古諾產(chǎn)量下的利潤 4,因此總收益: 5.06254(2)5.06254/(1) (2) 如果得益滿足(1)&g

28、t;(2),觸發(fā)策略下保持合 作的壟斷產(chǎn)量將構(gòu)成子博弈完美納什均衡,可以解 得:9/17經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.4 無限次重復(fù)博弈的古諾模型關(guān)于觸發(fā)策略的更一般結(jié)論:在觸發(fā)策略1中,如果滿足條件9/17,博弈方可以通過古諾產(chǎn)量作為威脅,迫使對(duì)方合作達(dá)成帕累托最優(yōu)的壟斷產(chǎn)量。但是,如果為了達(dá)到其它利潤較低的可實(shí)現(xiàn)得益,相應(yīng)的貼現(xiàn)系數(shù)要求是否可以降低(即博弈方是否可以不那么看重未來長期利益)?下面討論兩者之間的關(guān)系。觸發(fā)策略2:第一階段生產(chǎn)q*,如果前(t1)階段結(jié)局都是(q*,q*),那么繼續(xù)生產(chǎn)q* ,否則采取納什均衡的古諾產(chǎn)量2。經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.4 無限次重復(fù)博弈的古

29、諾模型策略2分析:如果雙方一直合作,利潤: *(82q*)q*2q* (62q*)q*總得益: (62q*)q*(12) (62q*)q* /(1) (3) 如果一方在第一階段偏離合作,其應(yīng)在對(duì)方采取q*產(chǎn)量的情況下,采取使其利潤最大化的產(chǎn)量,即:max(8q*q2)q22q2, 對(duì)q2求導(dǎo)解得q2 (6q*) /2,此時(shí)利潤u (6q*)2 /4;經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.4 無限次重復(fù)博弈的古諾模型但是在后續(xù)階段中只能得到古諾產(chǎn)量下的利潤4,因此總收益: (6q*)2/4 4(2) (6q*)2/4 4/(1) (4) 如果得益滿足(3)&gt;(4),觸發(fā)策略下保持合作的產(chǎn)

30、量q*將構(gòu)成子博弈完美納什均衡,可以解得: q*2(95)/(9) 經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.4 無限次重復(fù)博弈的古諾模型結(jié)論:對(duì)于不同的貼現(xiàn)系數(shù),無限次重復(fù)博弈的古諾模型可以相應(yīng)的實(shí)現(xiàn)不同的可實(shí)現(xiàn)得益,兩者之間的關(guān)系為 q*2(95)/(9) 其中,當(dāng)9/17 時(shí),q*1.5,即為觸發(fā)策略1; 當(dāng)0 時(shí),q*2,即為一次性博弈中納什均衡的古諾產(chǎn)量。經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.4 無限次重復(fù)博弈的古諾模型一種胡蘿卜加大棒的策略3:第一階段雙方生產(chǎn)壟斷產(chǎn)量1.5,如果在第(t1)階段結(jié)果為(1.5,1.5),沒有發(fā)生偏離,則繼續(xù)保持合作;如果雙方同時(shí)偏離并產(chǎn)量相等,也既往不咎,繼續(xù)保持

31、壟斷產(chǎn)量1.5;如果對(duì)方單方面偏離,則采取懲罰性的高產(chǎn)量x。經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.4 無限次重復(fù)博弈的古諾模型策略3分析:如果一方在第一階段中偏離壟斷產(chǎn)量,其應(yīng)在對(duì)方采取壟斷產(chǎn)量1.5情況下,采取使其利潤最大化的產(chǎn)量,即: max(81.5q2)q22q2max(4.5q2).q2 解得q22.25,此時(shí)利潤 u max(4.5q2).q25.0625; 相對(duì)于合作壟斷產(chǎn)量(1.5,1.5)的得益4.5,第一階段偏離后得益的增加值為: 5.06254.50.5625 (5)經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.4 無限次重復(fù)博弈的古諾模型 這一偏離行為在第二階段中將面臨著來自對(duì)方的懲罰性高

32、產(chǎn)量x。根據(jù)策略設(shè)計(jì),如果在第二階段也采取同樣的產(chǎn)量x,那么在第三階段以后將繼續(xù)保持合作壟斷的結(jié)局。因此,第二階段也采取懲罰性高產(chǎn)量x,此階段得益為: (82x)x2x 6x2x2。 經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.4 無限次重復(fù)博弈的古諾模型 相對(duì)于合作壟斷產(chǎn)量的得益4.5,考慮貼現(xiàn)系數(shù)后,此階段的得益損失為: (4.5 6x2x2) (6) 當(dāng)?shù)靡鏉M足(5)&gt;(6)時(shí),保持合作的壟斷產(chǎn)量將構(gòu)成子博弈完美納什均衡,解得: 0.5625/(4.5 6x2x2)經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.4 無限次重復(fù)博弈的古諾模型 結(jié)論:上式表明,博弈方是否采取偏離行為,不僅與貼現(xiàn)系數(shù)有關(guān),

33、而且與懲罰性產(chǎn)量x的大小有關(guān)。當(dāng)0.5時(shí),只有滿足x 2.25才能保證博弈方不發(fā)生偏離。 注意:由于納什均衡的古諾產(chǎn)量為2,因此 x2.25高于納什均衡產(chǎn)量,故稱為懲罰性高產(chǎn)量。經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.4 無限次重復(fù)博弈的古諾模型比較策略2和策略3:策略2表明了在無限次重復(fù)博弈的古諾模型中,采取觸發(fā)策略下雙方是否能夠達(dá)成合作的壟斷產(chǎn)量,取決于貼現(xiàn)系數(shù)和可實(shí)現(xiàn)得益的相應(yīng)產(chǎn)量q,兩者之間存在替代關(guān)系,即 q*2(95)/(9) 。策略3表明了采取胡蘿卜加大棒策略下雙方是否能夠達(dá)成合作的壟斷產(chǎn)量,取決于貼現(xiàn)系數(shù)和“大棒”的懲罰力度,兩者之間也存在替代關(guān)系(即,加大懲罰力度x可以相應(yīng)的降低貼現(xiàn)

34、系數(shù)), 0.5625/(4.5 6x2x2)。經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.5 無限次重復(fù)博弈的效率工資模型問題提出:廠商提供較高的工資w,可以促進(jìn)工人努力工作,但是也增加了成本,因此需要確定一個(gè)適當(dāng)?shù)墓べY率;工人根據(jù)自己的能力決定拒絕或接受這個(gè)工資水平。如果工人接受工作,可以選擇努力工作或者偷懶。經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.5 無限次重復(fù)博弈的效率工資模型原博弈的結(jié)構(gòu)(原博弈為一個(gè)兩階段動(dòng)態(tài)博弈):工資率w廠商個(gè)體戶w0努力工作偷懶工人拒絕接受接受(0,w0)(yw,we)(pyw,w)經(jīng)濟(jì)博弈論 徐寅峰 教授4.3.5 無限次重復(fù)博弈的效率工資模型原博弈結(jié)構(gòu)的說明:如果工人努力工作,其付出的代價(jià)為e,但會(huì)獲得一個(gè)y&gt;0的高產(chǎn)量;如果工人偷懶,其僅僅有概率p獲得高產(chǎn)量,而獲得低產(chǎn)量的概率為(1p)。廠商只能通過產(chǎn)量判斷工人的努力程度。(產(chǎn)品的價(jià)格為1)一次性博弈的結(jié)局:在廠商必須支付工

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論