ch3 納什均衡的擴(kuò)展與精煉_第1頁(yè)
ch3 納什均衡的擴(kuò)展與精煉_第2頁(yè)
ch3 納什均衡的擴(kuò)展與精煉_第3頁(yè)
ch3 納什均衡的擴(kuò)展與精煉_第4頁(yè)
ch3 納什均衡的擴(kuò)展與精煉_第5頁(yè)
已閱讀5頁(yè),還剩71頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第3章

納什均衡的擴(kuò)展與精煉1不完全信息靜態(tài)博弈完全且完美信息動(dòng)態(tài)博弈重復(fù)博弈不完全信息動(dòng)態(tài)博弈2第2章討論了完全信息的靜態(tài)博弈以及納什均衡的概念.然而,在現(xiàn)實(shí)的經(jīng)濟(jì)生活和社會(huì)活動(dòng)中,這樣簡(jiǎn)單的博弈是很少的.這是因?yàn)?在博弈中,局中人對(duì)于其它局中人的了解和認(rèn)識(shí)往往不可能是完全清楚的;在博弈過(guò)程中,局中人采取行動(dòng)也不一定是同時(shí)的.基于這樣的現(xiàn)實(shí)情況,有必要對(duì)完全信息下的靜態(tài)博弈做進(jìn)一步的擴(kuò)展研究.相應(yīng)地,對(duì)納什均衡的概念也要進(jìn)行擴(kuò)展和精煉.3如何擴(kuò)展首先對(duì)靜態(tài)博弈在不完全信息下進(jìn)行擴(kuò)展,將納什均衡擴(kuò)展到貝葉斯納什均衡.其次,將完全信息下的靜態(tài)博弈擴(kuò)展到完全信息下的動(dòng)態(tài)博弈,將一般納什均衡精煉為子博弈完美納什均衡.第三,討論不完全信息下的動(dòng)態(tài)博弈,給出精煉貝葉斯納什均衡的概念.4信息集每一個(gè)信息集是決策結(jié)集合的子集,由滿足以下條件的決策結(jié)組成:–一定是同一個(gè)參與人的決策結(jié);–該參與人知道博弈進(jìn)入該集合中的某個(gè)決策結(jié),但不知道自己處于哪一個(gè)決策結(jié);–一個(gè)參與人在屬于同一個(gè)信息集的每一個(gè)決策結(jié)上的行動(dòng)空間是相同的.5開(kāi)發(fā)商A不知道市場(chǎng)需求的大小開(kāi)發(fā)商B不知道市場(chǎng)需求的大小6完全信息(completeinformation)—指每個(gè)參與人沒(méi)有私人信息,即他的行動(dòng)空間、支付函數(shù)為所有其他參與人所知.(參與者的信息特征)完美信息(perfectinformation)—是指一個(gè)局中人對(duì)其他局中人(包括虛擬參與人“自然”)的行動(dòng)選擇有了準(zhǔn)確的了解(對(duì)前面所發(fā)生的情況很清楚),并且沒(méi)有同時(shí)的行動(dòng),即每個(gè)信息集只含有一個(gè)元素.(博弈的結(jié)構(gòu)特征)例如,如果兩個(gè)參與人都知道對(duì)方的支付函數(shù),行動(dòng)空間,以及市場(chǎng)需求是大,還是小,則信息是完全的,但如果A不知B的行動(dòng)選擇,則A的信息是不完美的.完美信息與完全信息7策略策略是參與人在給定的信息集的情況下的行動(dòng)規(guī)則.—因?yàn)閰⑴c人的每個(gè)信息集實(shí)質(zhì)上代表了參與人可能會(huì)遇到的幾種情況,因此必須給出所有可能情況下的行動(dòng)規(guī)則.每個(gè)參與人的一個(gè)策略,合在一起形成一個(gè)策略組合。83.1不完全信息的靜態(tài)博弈不完全信息博弈與海薩尼轉(zhuǎn)換例3.1.1不完全信息的行業(yè)博弈假定行業(yè)內(nèi)有一個(gè)在位者(局中人1)和一個(gè)潛在的進(jìn)入者(局中人2).局中人1決定是否在某地建立一個(gè)新工廠,同時(shí)局中人2決定是否在該地進(jìn)入該行業(yè).假定局中人2不知道局中人1建廠的成本是高還是低,但局中人1自己知道.這個(gè)博弈的收益如表3.1.1所示.局中人2的收益取決于局中人1是否建廠,而不是直接取決于局中人1的成本.當(dāng)且僅當(dāng)局中人1不建廠時(shí),局中人2進(jìn)入才有利可圖.9表3.1.1不完全信息的行業(yè)博弈規(guī)范式在本例,進(jìn)入者似乎是在與兩個(gè)不同的在位者博弈:高成本建廠的在位者,低成本建廠的在位者.(如果在位者有T種可能的不同成本函數(shù),進(jìn)入者就似乎是在與T個(gè)不同的在位者博弈)在1967年以前,博弈論專家認(rèn)為這樣的不完全信息博弈是沒(méi)法分析的,因?yàn)楫?dāng)—個(gè)局中人并不知道他在與誰(shuí)博弈時(shí),博弈的規(guī)則是沒(méi)有定義的.1967年,海薩尼提出了海薩尼轉(zhuǎn)換解決了這個(gè)問(wèn)題.進(jìn)入不進(jìn)入進(jìn)入不進(jìn)入建廠(0,-1)(2,0)(1.5,-2)(3.5,0)不建廠(2,1)(3,0)(2,1)(3,0)局中人1的建廠成本高局中人1的建廠成本低局中人1局中人2局中人210海薩尼轉(zhuǎn)換(1)引入一個(gè)虛擬的局中人—“自然”(nature),他不用考慮自己的得失,他的唯一作用就是賦予博弈中各局中人的類型向量t=(t1,t2,…,tn),其中ti屬于可行類型空間Ti(Ti為局中人i的特征的完備描述);(2)自然只把局中人i的真實(shí)的類型ti告訴局中人i本人,卻不讓其他局中人知道.但“自然”將把在t=(t1,t2,…,tn)上的概率分布p(t1,t2,…,tn)告訴每一個(gè)局中人;(3)所有局中人同時(shí)行動(dòng),局中人i從自己的策略空間Si中選擇si其中局中人i的策略空間Si與局中人i的類型ti有關(guān),一般記為Si(ti);(4)各局中人除“自然”外的支付函數(shù)為ui=ui(s1,…,sn;ti),i=1,2,…,n.11借助(1)和(2)中“自然”的行動(dòng),就把一個(gè)不完全信息的靜態(tài)博弈轉(zhuǎn)化成了一個(gè)完全但不完美信息的博弈;該博弈由兩個(gè)階段構(gòu)成:第一階段是準(zhǔn)備階段:“自然”選擇行動(dòng),它決定概率向量p(t1,…,tn);第二階段則是實(shí)際博弈階段:由n個(gè)局中人同時(shí)行動(dòng),他們雖然各自知道“自然”為自己選定的類型ti,卻不知道“自然”為其他局中人(至少一個(gè)其他局中人)選定的類型,因此至少有一個(gè)局中人對(duì)“自然”的行動(dòng)是具有不完美信息的.不過(guò)每一個(gè)局中人的類型空間Ti及其概率分布Pi(t-i|ti),是共同知識(shí).

這樣,就可以運(yùn)用概率論的知識(shí)(尤其是“貝葉斯法則”),對(duì)不完全信息博弈問(wèn)題進(jìn)行分析.12有了海薩尼轉(zhuǎn)換,在例3.1.1中,自然決定了局中人1有兩種類型,“高成本”和“低成本”.自然決定了局中人2有一種類型.若局中人1屬于“高成本”類型,而局中人2只有一種類型,則構(gòu)成表3.1.1中左邊一個(gè)標(biāo)準(zhǔn)的完全信息下的靜態(tài)博弈.若局中人1屬于“低成本”類型而局中人2只有一種類型,則構(gòu)成下表中左邊一個(gè)標(biāo)準(zhǔn)的完全信息下的靜態(tài)博弈.局中人1知道自己的類型,而局中人2則不知道局中人1的類型,但兩個(gè)局中人對(duì)“自然”決定的局中人1的類型的概率分布具有一致的判斷.假設(shè)P(高成本)=2/3,P(底成本)=1/3.進(jìn)入不進(jìn)入進(jìn)入不進(jìn)入建廠(0,-1)(2,0)(1.5,-2)(3.5,0)不建廠(2,1)(3,0)(2,1)(3,0)局中人1的建廠成本高局中人1的建廠成本低局中人1局中人2局中人213規(guī)范式表述和貝葉斯納什均衡通過(guò)海薩尼轉(zhuǎn)換可將不完全信息博弈轉(zhuǎn)換成不同局中人類型下的博弈,但這種結(jié)果依賴于局中人的類型.利用完全信息靜態(tài)博弈的規(guī)范式表述,可以給出不完全信息靜態(tài)博弈的規(guī)范式表示.定義3.1.1

不完全信息靜態(tài)博弈包括如下4個(gè)要素.1.局中人集合N={1,2,…,n};2.每個(gè)局中人有個(gè)類型空間Ti={ti},i∈N,以及在全體類型空間上的概率分布P(t1,t2,…,tn);3.每個(gè)局中人有(與自身的類型ti相關(guān)的)策略集Si={si},i∈N.且策略集Si與其它局中人的類型無(wú)關(guān).4.每一個(gè)局中人都有其收益函數(shù)ui(s1,s2,…,sn,ti),即收益函數(shù)不僅依賴于策略組合(s1,s2,…,sn),也依賴于自身的類型ti.14以上4個(gè)因素都是共同知識(shí).局中人在以上情況下同時(shí)選擇策略以追求自身收益最大化.將這種博弈稱為不完全信息的靜態(tài)博弈,也稱為貝葉斯靜態(tài)博弈,記為G=[N,{Ti},P,{Si(ti)},{ui}].定義3.1.2在貝葉斯靜態(tài)博弈G=[N,{Ti},P,{Si(ti)},{ui}]中,若是一個(gè)策略組合,且對(duì)每一個(gè)i∈N,對(duì)任意si∈Si都有:則稱策略組合是一個(gè)貝葉斯納什均衡.15(1)貝葉斯納什均衡用貝葉斯公式得到的,以概率分布作為依據(jù),考慮自己的期望收益.貝葉斯靜態(tài)博弈中的期望收益是對(duì)其它局中人不同類型下的期望收益,而不是自己類型下的期望收益(所有的局中人知道自己的類型).(2)貝葉斯納什均衡研究的是局中人的策略選擇,并且這種策略選擇依賴于自身的類型,當(dāng)類型不同時(shí),它們選擇的策略就不一樣.定義3.1.2只給出了貝葉斯納什均衡的定義,但未給出在什么條件下貝葉斯納什均衡一定存在.類似于完全信息靜態(tài)博弈中純策略納什均衡的存在性討論,有下面一些概念和定理.貝葉斯均衡是Nash均衡在不完全信息博弈中的自然擴(kuò)展.貝葉斯納什均衡概念與一般納什均衡概念相比有兩個(gè)不同點(diǎn):16定義3.1.3設(shè)u是凸集XRn上的函數(shù),對(duì)任意的x1,x2∈X及任意的λ∈[0,1],若有u(λx1+(1-λ)x2)≥λu(x1)+(1-λ)u(x2)(3.1.4)則稱u為X上的凹函數(shù).若(3.1.4)中不等號(hào)為嚴(yán)格不等號(hào),則稱u為X上的嚴(yán)格凹函數(shù).**一個(gè)凹函數(shù)一定是擬凹函數(shù).**如果u(x1,x2,…,xn)是一個(gè)Rn中的函數(shù),若對(duì)任意的xi都有,則函數(shù)u是變量xi的凹函數(shù).定理3.1.1設(shè)u1和u2都是凸集XRn上的凹函數(shù),則對(duì)任意,函數(shù)(3.1.5)也是x的凹函數(shù).17定理3.1.2在貝葉斯靜態(tài)博弈G=[N,{Ti},P,{Si(ti)},{ui}]中,若局中人i策略集Si(ti)是有界閉凸集,其收益函數(shù)ui(s-i,si,ti),對(duì)局中人i的任何類型ti以及對(duì)任意s-i都是si的凹函數(shù),則博弈G一定存在貝葉斯納什均衡.局中人i在類型為ti的情況下,全部混合策略集記為Xi(ti).混合策略:在貝葉斯博弈G=[N,{Ti},P,{Si(ti)},{ui}]中,局中人i在類型ti∈Ti下的純策略集為:,若局中人i以概率選擇純策略,則稱為局中人i在類型ti下的一個(gè)混合策略.在不引起混淆的情況下,簡(jiǎn)記為,其中18在混合策略下,貝葉斯納什均衡的定義如下:定義3.1.4在貝葉斯靜態(tài)博弈G=[N,{Ti},P,{Si(ti)},{ui}]中,若是一個(gè)混合策略組合,且對(duì)每一個(gè)i∈N和對(duì)任意的xi(ti)∈Xi(ti)都有則稱混合策略組合是一個(gè)混合策略下的貝葉斯納什均衡.i在混合策略組合下對(duì)其ui求期望.對(duì)類型求期望19定理3.1.3在貝葉斯靜態(tài)博弈G=[N,{Ti},P,{Si(ti)},{ui}]中,是G的一個(gè)混合策略下的貝葉斯納什均衡的充分必要條件是:對(duì)每一個(gè)局中人i和每一個(gè)純策略有定理3.1.4在貝葉斯靜態(tài)博弈G=[N,{Ti},P,{Si(ti)},{ui}]中,必有混合策略下的貝葉斯納什均衡.20例3.1.1假定行業(yè)內(nèi)有一個(gè)在位者(局中人1)和一個(gè)潛在的進(jìn)入者(局中人2).局中人1決定是否在某地建立一個(gè)新工廠,同時(shí)局中人2決定是否在該地進(jìn)入該行業(yè).假定局中人2不知道局中人1建廠的成本是高還是低,但局中人1自己知道.這個(gè)博弈的收益如表3.1.1所示.局中人2的收益取決于局中人1是否建廠,而不是直接取決于局中人1的成本.當(dāng)且僅當(dāng)局中人1不建廠時(shí),局中人2進(jìn)入才有利可圖.求該博弈的所有納什均衡.進(jìn)入不進(jìn)入進(jìn)入不進(jìn)入建廠(0,-1)(2,0)(1.5,-2)(3.5,0)不建廠(2,1)(3,0)(2,1)(3,0)局中人1的建廠成本高局中人1的建廠成本低局中人1局中人2局中人221進(jìn)入不進(jìn)入進(jìn)入不進(jìn)入建廠(0,-1)(2,0)(1.5,-2)(3.5,0)不建廠(2,1)(3,0)(2,1)(3,0)局中人1的建廠成本高局中人1的建廠成本低局中人1局中人2局中人2如果局中人2在觀察到1的行動(dòng)后在作決定,信息集如何畫(huà)?擴(kuò)展式表示22局中人類型:在位者(局中人1)有兩種類型T1={t11,t12},t11代表高成本,t12代表低成本;潛在進(jìn)入者(局中人2)只有1種類型,T2={t2}.自然決定局中人1類型的概率分布為:P(高成本)=2/3P(低成本)=1/3策略集設(shè)高成本時(shí)局中人1的策略集為代表建廠,表示不建廠.局中人1采用策略的概率為x1,采用策略的概率為1-x1.設(shè)低成本時(shí)局中人1的策略集為代表建廠,表示不建廠.局中人1采用策略的概率為x2,采用策略的概率為1-x2.設(shè)局中人2的策略集為,代表進(jìn)入,表示不進(jìn)入.局中人2采用策略的概率為y,采用策略 的概率為1-y.23收益局中人1在高成本時(shí)期望收益記為,在低成本時(shí)的期望收益為,局中人2的期望收益記為.(3.1.8)(3.1.9)(3.1.10)混合策略下的貝葉斯納什均衡的計(jì)算設(shè)混合策略下的貝葉斯納什均衡為:((x1,1-x1),(x2,1-x2),(y,1-y))由定理3.1.3,該貝葉斯納什均衡應(yīng)滿足下列不等式組:24(3.1.11)(3.1.12)(3.1.13)(3.1.14)(3.1.15)(3.1.16)由(3.1.8)(3.1.9)(3.1.10)25對(duì)上述不等式化簡(jiǎn)可得如下等價(jià)關(guān)系由(3.1.11)(3.1.12)(Ⅰ)由(3.1.13)(3.1.14)(Ⅱ)由(3.1.15)(3.1.16)(Ⅲ)26由不等式組(Ⅰ)可得x1=0,將x1=0帶入不等式組(Ⅲ),有(Ⅲ’)用作圖法解不等式組(Ⅱ)和(Ⅲ’).混合策略貝葉斯納什均衡求解不等式組(Ⅱ)不等式組(Ⅲ’)滿足不等式組(Ⅱ)和(Ⅲ’)的(x,y)點(diǎn)為A點(diǎn)和DE線段.27不等式組(Ⅱ)不等式組(Ⅲ’)滿足不等式組(Ⅱ)和(Ⅲ’)的(x,y)點(diǎn)為A點(diǎn)和DE線段.混合策略貝葉斯納什均衡集為:(3.1.17)該博弈的混合策略貝葉斯納什均衡包含兩個(gè)純策略貝葉斯納什均衡:(1)在位者為高成本和低成本都不建廠,而進(jìn)入者進(jìn)入.(2)在位者為高成本時(shí)不建廠,為低成本時(shí)建廠,而進(jìn)入者不進(jìn)入.另有無(wú)窮多個(gè)混合策略下的貝葉斯納什均衡:在位者為高成本時(shí)不建廠,為低成本時(shí)建廠.進(jìn)入者以y的概率進(jìn)入,以1-y的概率不進(jìn)入,.28設(shè)市場(chǎng)上有1、2兩個(gè)廠商,生產(chǎn)同一種產(chǎn)品.廠商1、2生產(chǎn)的商品的數(shù)量分別為q1和q2.他們有不同的不變邊際成本.廠商1的邊際成本為c1=1,廠商2有兩種邊際成本,低成本為c2L=3/4,高成本為c2H=5/4.但廠商2的邊際成本是低成本還是高成本,只有廠商2自己知道,廠商1不知道.即廠商2有自己成本的私人信息.廠商1對(duì)廠商2的成本是高還是低有一個(gè)判斷信念,即高成本的可能性為μ,低成本的可能性為1-μ,這里假定μ=0.5.同時(shí),市場(chǎng)的逆需求函數(shù)p=a-(q1+q2).a是大于邊際成本的一個(gè)常數(shù),這里取a=2.兩個(gè)廠商在沒(méi)有任何協(xié)議和約定的情況下,同時(shí)分別決定生產(chǎn)產(chǎn)量,以追求市場(chǎng)利潤(rùn)最大化.例3.1.2不完全信息下的古諾模型29利用不完全信息博弈海薩尼轉(zhuǎn)換方法,可以視為“自然”決定廠商類型,廠商1有1種類型,廠商2有兩種類型{低成本,高成本},自然將廠商2的類型通知了廠商2,并且給出了在類型空間上的概率分布:p(低成本)=0.5,p(低成本)=0.5.廠商2在低成本類型下生產(chǎn)q2L時(shí)的收益函數(shù)為:廠商2在高成本類型下生產(chǎn)q2H時(shí)的收益函數(shù)為:(3.1.18)(3.1.19)廠商1只有一種類型,對(duì)廠商2的兩種類型,它生產(chǎn)q1的期望收益為:(3.1.20)30上述三個(gè)函數(shù)對(duì)自身變量都是凹函數(shù),分別求并令其為0解該方程組,得:(3.1.21)(3.1.22)31因此,廠商1生產(chǎn)產(chǎn)量為,廠商2在低成本類型時(shí)生產(chǎn)產(chǎn)量為,在高成本類型時(shí)生產(chǎn)產(chǎn)量為.將代入即可求得解的具體值.32例3.1.4獨(dú)立私人價(jià)值下的一級(jí)密封拍賣假設(shè):有兩個(gè)競(jìng)標(biāo)人:競(jìng)標(biāo)人1和競(jìng)標(biāo)人2.令競(jìng)標(biāo)人i對(duì)拍賣物的估價(jià)為vi,出價(jià)為bi(vi),i=1,2.只有競(jìng)標(biāo)人i自己知道vi是多少.bi(vi)為競(jìng)標(biāo)人i的策略,即Si=[0,vi].這里“自然”確定了投標(biāo)人i的類型vi,并給出了vi的概率分布.兩個(gè)競(jìng)標(biāo)人都知道自己的估價(jià)vi.并假定v1和v2都是[0,1]上的獨(dú)立均勻分布.競(jìng)標(biāo)人都是風(fēng)險(xiǎn)中性的.上述假定都是共同知識(shí).在獨(dú)立私人價(jià)值下的一級(jí)密封拍賣中,每一個(gè)競(jìng)標(biāo)者對(duì)拍賣物有一個(gè)自己的估價(jià);這個(gè)估價(jià)是競(jìng)標(biāo)者的私人信息,其他競(jìng)標(biāo)人是不知道的.競(jìng)標(biāo)人的估價(jià)不僅決定了報(bào)價(jià)的多少,也決定了競(jìng)標(biāo)人在得到拍賣物后的凈收益.在一級(jí)密封拍賣中,每個(gè)競(jìng)標(biāo)人只獨(dú)立地出一個(gè)價(jià).這樣,多個(gè)競(jìng)標(biāo)人為獲得競(jìng)標(biāo)物構(gòu)成了一個(gè)不完全信息下的靜態(tài)博弈.33競(jìng)標(biāo)人i的收益函數(shù):(3.1.39)競(jìng)標(biāo)人i在自己的類型為vi,出價(jià)為bi的情況下,其期望收益為:(3.1.40)對(duì)局中人i的策略bi(vi)作如下規(guī)定:bi(vi)=ai+civiai,ci為常數(shù),ci>0,i=1,2(3.1.41)這里ai可視為競(jìng)標(biāo)人i的最低標(biāo)價(jià).由于i的出價(jià)低于j最低的可能的出價(jià)沒(méi)有意義,而又不應(yīng)該高于j最高的可能出價(jià),因此有:aj≤bi≤aj+cji,j=1,2i≠j(3.1.42)34假設(shè)競(jìng)標(biāo)人j采取策略bj(vj)=aj+cjvj,對(duì)一個(gè)給定的vi值,競(jìng)標(biāo)人i的最優(yōu)反應(yīng)為下式的解.(3.1.43)(3.1.39)(3.1.40)這兩項(xiàng)均為0求解(3.1.43),得:(3.1.44)35由于bi(vi)=ai+civi用同樣的方法,可得:由此可得:(3.1.45)上式表明,在上述假定下,兩個(gè)競(jìng)標(biāo)人的出價(jià)都為自己估價(jià)的一半.363.2完全且完美信息動(dòng)態(tài)博弈完全信息(completeinformation)指每個(gè)局中人沒(méi)有私人信息,即他的行動(dòng)空間、支付函數(shù)和類型為所有其他局中人所知.(信息特征)完美信息(perfectinformation)指每個(gè)局中人對(duì)其他局中人(包括虛擬參與人自然)的行動(dòng)選擇有了準(zhǔn)確的了解(對(duì)前面所發(fā)生的情況很清楚),并且沒(méi)有同時(shí)的行動(dòng),即每個(gè)信息集只含有一個(gè)元素.(博弈的結(jié)構(gòu)特征)動(dòng)態(tài)博弈可以按博弈中局中人對(duì)信息的認(rèn)識(shí)和了解分為完全信息和不完全信息博弈,完美信息和不完美信息博弈.動(dòng)態(tài)博弈存在局中人行動(dòng)先后順序的博弈.37在完全且完美信息下,動(dòng)態(tài)博弈的中心問(wèn)題是可信任性.若動(dòng)態(tài)博弈按靜態(tài)博弈分析,所求出的納什均衡一些是可信任的,而一些是不可信任的.因此需要對(duì)靜態(tài)博弈中所求出的納什均衡進(jìn)行“精煉”,去掉不可信任的納什均衡,保留下的是可信任的納什均衡,并稱為子博弈完美納什均衡.38例3.2.1借債與還債博弈該博弈中有2個(gè)局中人.第一階段,局中人2向局中人1借款2萬(wàn)元,并承諾一年后還給局中人1連本帶息共3萬(wàn)元.局中人1面臨借款還是不借錢給局中人2.若局中人1答應(yīng)借錢給局中人2,則博弈進(jìn)行到第二個(gè)階段.這時(shí),局中人2靠這筆錢共賺到4萬(wàn)元.他面臨著到底履行諾言還是不履行諾言.若不履行諾言,則博弈進(jìn)入到第三階段,這時(shí)局中人1是將局中人2告上法庭還是不告上法庭.若告上法庭,則局中人1可以要回自己2萬(wàn)元,而局中人2則分文得不到.若不告上法庭,則局中人獨(dú)占4萬(wàn)元.在這個(gè)博弈中,局中人1和局中人2分別應(yīng)采取什么策略呢?39動(dòng)態(tài)博弈的特征(P77)1.階段和行動(dòng)順序動(dòng)態(tài)博弈中,局中人是依照一定的規(guī)則依次進(jìn)行行動(dòng).每個(gè)階段至少有一個(gè)局中人要選擇行動(dòng),這里允許一個(gè)階段中有多人行動(dòng).402.行動(dòng)與策略動(dòng)態(tài)博弈中,輪到某個(gè)局中人行動(dòng)時(shí),他在自己的行動(dòng)集中選擇一個(gè)行動(dòng).局中人i的行動(dòng)集一般記為Ai.在不同的狀態(tài)下和不同的階段,局中人的行動(dòng)集可能不一樣.動(dòng)態(tài)博弈的策略是指局中人在這個(gè)博弈前對(duì)自己各階段行動(dòng)的一個(gè)完整計(jì)劃.在靜態(tài)博弈中,只有一個(gè)階段,局中人的策略集與行動(dòng)集是一致的.但動(dòng)態(tài)博弈中策略集與行動(dòng)集是不同的.3.行動(dòng)組合和策略組合動(dòng)態(tài)博弈中,每個(gè)局中人在每個(gè)階段出一個(gè)行動(dòng)構(gòu)成一個(gè)行動(dòng)組合,而每個(gè)局中人出一個(gè)策略則構(gòu)成策略組合.414.收益函數(shù)在動(dòng)態(tài)博弈中,為了分析方便,局中人i的收益函數(shù)是所有行動(dòng)組合到實(shí)數(shù)集的映射.如果博弈的局中人為n個(gè)人,則每個(gè)行動(dòng)組合對(duì)應(yīng)一個(gè)n維實(shí)數(shù)向量.但若動(dòng)態(tài)博弈是用策略式表示,其收益函數(shù)仍是策略組合到實(shí)數(shù)集的映射.在完全信息動(dòng)態(tài)博弈中,博弈的收益函數(shù)是一個(gè)共同知識(shí)。5.信息在動(dòng)態(tài)博弈中,當(dāng)每個(gè)局中人行動(dòng)時(shí),它對(duì)此前各局中人的行動(dòng)組合是完全了解和知道的,稱為完美信息博弈.反之,則稱為不完美信息博弈.42納什均衡的可信性與不可信性跟隨領(lǐng)頭羊大軟驅(qū)與小軟驅(qū)局中人1先行動(dòng),局中人2在觀察到局中人1的行動(dòng)后再選擇.43局中人2(大,大)(大,小)(小,大)(小,小)局中人1大(2,2)(2,2)(-1,-1)(-1,-1)小(-1,-1)(1,1)(-1,-1)(1,1)局中人2的策略集:1.(1選大,2選大;1選小,2選大)2.(1選大,2選大;1選小,2選小)3.(1選大,2選小;1選小,2選大)4.(1選大,2選小;1選小,2選小)三個(gè)純策略納什均衡44三個(gè)規(guī)范式表述的納什均衡均衡策略結(jié)果E1(大,(大,大))都選大E2(大,(大,小))都選大E3(小,(小,小))都選小局中人21234局中人1大(2,2)(2,2)(-1,-1)(-1,-1)小(-1,-1)(1,1)(-1,-1)(1,1)E1E2E345E3:(小,(小,小))是一個(gè)合理的均衡嗎?考慮均衡E3中的策略(小,小).如果局中人1偏離均衡而選擇了大,就沒(méi)有理由再讓局中人2堅(jiān)持選小.相反,他也會(huì)選擇大.如果局中人1預(yù)期到了對(duì)方的反應(yīng)是大,那么他從一開(kāi)始就會(huì)選擇大.因此,E3是一個(gè)不可信任的納什均衡.46E1(大,(大,大))考慮均衡E1中的策略(大,大).如果局中人1偏離均衡而選擇了小,就沒(méi)有理由再讓局中人2堅(jiān)持選大.相反,他也會(huì)選擇小.如果局中人1預(yù)期到了對(duì)方的反應(yīng)是小,那么他從一開(kāi)始就會(huì)選擇小.因此,E1是一個(gè)不可信任的納什均衡.E1:(大,(大,大))是一個(gè)合理的均衡嗎?47哪一個(gè)納什均衡最合理?E2(大,(大,小))考慮均衡E2中的策略(大,小).如果局中人1選大,局中人2當(dāng)然也會(huì)選大;如果局中人1偏離均衡而選擇了小,局中人2會(huì)堅(jiān)持選小.由于2>1,局中人1會(huì)選擇大,因此,E2是一個(gè)合理的納什均衡.48從該例還可以看出,對(duì)簡(jiǎn)單的動(dòng)態(tài)博弈,使用博弈的擴(kuò)展式,可以使分析問(wèn)題的思路和理解更直觀.因此,我們盡可能地使用擴(kuò)展式來(lái)分析動(dòng)態(tài)博弈.從上例中可以看出,在動(dòng)態(tài)博弈中,采用靜態(tài)博弈的方法求出來(lái)的納什均衡,并不一定是可信的.必須對(duì)其進(jìn)行“精煉”,求出可信的納什均衡.49子博弈與子博弈完美納什均衡動(dòng)態(tài)博弈的擴(kuò)展型表述定義3.2.1一個(gè)動(dòng)態(tài)博弈的擴(kuò)展式包括:(1)博弈中的局中人,必要時(shí)包括“自然”局中人;(2)局中人的行動(dòng)順序;(3)局中人的行為空間(行動(dòng)集),若“自然”局中人的行動(dòng),即它賦予其它局中人i不同類型,則同時(shí)應(yīng)給出不同行動(dòng)的概率分布;(4)每次輪到某一局中人行動(dòng)時(shí),他所了解的信息;(5)對(duì)局中人可能選擇的每一行動(dòng)組合相對(duì)應(yīng)的各局中人的收益;(6)“自然”對(duì)局中人類型確定的概率分布.以上各要點(diǎn)均是共同知識(shí).由于本大節(jié)討論的完全且完美信息的動(dòng)態(tài)博弈,因此無(wú)“自然”局中人.50對(duì)于博弈的擴(kuò)展式描述,可通過(guò)博弈樹(shù)來(lái)表示.在擴(kuò)展式表示的博弈中,我們更關(guān)心的是各局中人在各階段中的行動(dòng),因此也稱其為行為博弈.對(duì)應(yīng)地,將使用行動(dòng)、行動(dòng)組合、行動(dòng)組合上的收益函數(shù)等概念.子博弈與子博弈完美納什均衡定義3.2.2擴(kuò)展式博弈中,滿足下面三個(gè)條件的博弈,稱為該博弈的一個(gè)子博弈:(1)始于單節(jié)信息集的決策結(jié)點(diǎn)n(但不包括博弈的第一個(gè)決策結(jié)點(diǎn));(2)包含博弈樹(shù)中n之下所有的決策結(jié)點(diǎn)和終結(jié)點(diǎn)(但不在n下面的除外);(3)沒(méi)有對(duì)任何信息集形成分割.(即如果博弈樹(shù)中n之下有一個(gè)決策結(jié)點(diǎn)n’,則和n’處于同一信息集的其他決策結(jié)點(diǎn)也必須在n之下,從而也必須包含于該子博弈中.)51圖3.2.3存在著信息集分割的博弈樹(shù)在定義中要加上(3)的限制,是希望能夠把子博弈當(dāng)成一個(gè)獨(dú)立的博弈進(jìn)行分析,并且分析的結(jié)果能用于原博弈.在上圖中,如果我們?cè)囍丫种腥?左邊的決策節(jié)看成一個(gè)子博弈的起點(diǎn),則在我們制造的這一個(gè)“子博弈”中,局中人3不僅不知道參與者2的行動(dòng),也不知道局中人l的行動(dòng).對(duì)這樣一個(gè)子博弈就無(wú)法進(jìn)行分析了,這樣違規(guī)制造的“子博弈”是沒(méi)有分析價(jià)值的.子博弈52在完全且完美信息的動(dòng)態(tài)博弈中,由于在每一階段需行動(dòng)的局中人對(duì)該階段以前的行動(dòng)組合是完全了解的,因此它的擴(kuò)展式博弈表示中,該決策結(jié)點(diǎn)一定是單信息集結(jié)點(diǎn).因此,在完全且完美信息的動(dòng)態(tài)博弈中,從任何一個(gè)結(jié)點(diǎn)(不含最頂端的結(jié)點(diǎn)和終端結(jié)點(diǎn))出發(fā),都存在一個(gè)子博弈.有兩個(gè)子博弈的博弈樹(shù)53例3.2.1的博弈擴(kuò)展式與它的子博弈54定義3.2.3(澤爾騰,1965)在完全且完美信息的動(dòng)態(tài)博弈中,如果局中人的策略組合或行動(dòng)組合在每一個(gè)子博弈中都構(gòu)成了納什均衡,則稱納什均衡是子博弈精煉的,并稱為原博弈的子博弈納什均衡.(大,(大,小))子博弈納什均衡55子博弈完美納什均衡與逆向歸納法完全且完美信息動(dòng)態(tài)博弈的主要特點(diǎn)是:(1)行動(dòng)是順序發(fā)生的;(2)下一步行動(dòng)選擇之前,所有以前的行動(dòng)都可以被觀察到;(3)每個(gè)可能的行動(dòng)組合下局中人的收益是共同知識(shí).下面分析只有兩個(gè)階段的完全且完美信息動(dòng)態(tài)博弈.這時(shí)的博弈為:(1)局中人1從可行集A1中選擇一個(gè)行動(dòng)a1;(2)局中人2觀察到a1之后從可行集A2中選擇一個(gè)行動(dòng)a2;(3)兩人的收益分別為u1(a1,a2)和u2(a1,a2).對(duì)完全且完美信息的兩階段動(dòng)態(tài)博弈,可以使用逆向歸納法對(duì)其進(jìn)行求解.56求解思路:在這樣的博弈中,局中人1在第一階段很難給出自己的最優(yōu)行動(dòng).因此可以倒過(guò)來(lái)分析.假設(shè)局中人1在第一階段選擇了行動(dòng)a1,在博弈的第二階段局中人2行動(dòng)時(shí),考慮到其前局中人1若選擇行動(dòng)a1,他面臨的決策問(wèn)題可用下式表示:若每個(gè)a1∈A1,局中人2的這一最優(yōu)化問(wèn)題只有唯一解,用R2(a1)表示,這是局中人2對(duì)局中人1的行動(dòng)的(最優(yōu))反應(yīng).因?yàn)榫种腥?可以預(yù)測(cè)到局中人2對(duì)自己每個(gè)可能的行動(dòng)a1∈A1做出的反應(yīng),這樣局中人1在第一階段要解決的問(wèn)題可歸結(jié)為假定局中人1的這一最優(yōu)化問(wèn)題同樣有唯一解,表示為a1*,再將a1*帶回R2(a1)中得到R2(a1*).這樣就得到兩個(gè)局中人的行動(dòng)組合(a1*,a2*).57稱(a1*,a2*)為這個(gè)博弈的逆向歸納解.跟隨領(lǐng)頭羊該博弈的子博弈完美納什均衡:(大,(大,小))58逆向歸納解不含有不可置信的威脅:局中人1預(yù)測(cè)局中人2將對(duì)1可能選擇的任何行動(dòng)a1做出最優(yōu)反應(yīng),選擇行動(dòng)R2(a1);這一預(yù)測(cè)排除了局中人2的不可置信的威脅,即排除了局中人2將在第二階段到來(lái)時(shí)做出不符合自身利益的反應(yīng).因此,逆向歸納解就是完全且完美信息的動(dòng)態(tài)博弈的子博弈完美納什均衡.局中人2威脅小,不可信.局中人2威脅大,不可信.59對(duì)有多個(gè)階段的完全且完美信息的動(dòng)態(tài)博弈的子博弈完美納什均衡的尋求,可以仿照兩階段的情形逆向推導(dǎo).若完全且完美信息動(dòng)態(tài)博弈用擴(kuò)展式表示,只需從最后的子博弈逐層向上推導(dǎo).對(duì)于有限完全且完美信息的擴(kuò)展式動(dòng)態(tài)博弈,逆向歸納法是求解子博弈精煉納什均衡的一個(gè)簡(jiǎn)便方法.逆向歸納法從動(dòng)態(tài)博弈的最后一個(gè)階段或最后一個(gè)子博弈開(kāi)始,逐步向前倒推一直倒推到博弈的起點(diǎn).在倒推過(guò)程中,局中人選擇使自己的支付最大的策略,最終得到一條從博弈起點(diǎn)到某一終點(diǎn)的每一階段的路徑,該路徑集就是此博弈的逆向歸納解.這種從動(dòng)態(tài)博弈的最后一步分析局中人的理性行為而往回推以求解該博弈的子博弈完美納什均衡的方法稱為逆向歸納法.60例3.2.1借債與還債博弈的子博弈完美納什均衡該博弈有兩個(gè)子博弈,設(shè)為(1),(2),按如下步驟求其子博弈完美納什均衡.1.子博弈(1)子博弈(1)612.子博弈(2)子博弈(2)的簡(jiǎn)化3.原博弈原博弈的簡(jiǎn)化624.原博弈的子博弈完美納什均衡借債與還債博弈63用逆向歸納法求解出的子博弈完美納什均衡并不是一條以樹(shù)的根為起點(diǎn)的完整路徑,但是它對(duì)每個(gè)局中人在各個(gè)階段的行動(dòng)選擇給予了描述,并且是每個(gè)局中人策略的一種完整表述.假若只考慮(借,履行諾言)這一完整路徑,它顯然不能構(gòu)成均衡.因?yàn)榫种腥?的“起訴”行為是一個(gè)可信任的威脅,若缺少局中人1在第三階段這一可信的威脅,局中人2在第二階段就不會(huì)采取“履行諾言”的行為,進(jìn)而在第一階段局中人1也就可能會(huì)“不借”.對(duì)完全且完美動(dòng)態(tài)博弈,利用逆向歸納法,很容易求得逆向歸納解,而逆向歸納解又是子博弈完美納什均衡.這就奠定了在完全且完美動(dòng)態(tài)博弈中逆向歸納法的重要作用.64跟隨領(lǐng)頭羊65完全且完美信息動(dòng)態(tài)博弈的應(yīng)用例3.2.2斯塔克爾貝格雙寡頭競(jìng)爭(zhēng)模型斯塔克爾貝格(Stackelberg,1934)提出了雙寡頭壟斷的動(dòng)態(tài)模型,其中一個(gè)支配企業(yè)(領(lǐng)導(dǎo)者)首先行動(dòng),然后從屬企業(yè)(追隨者)行動(dòng).根據(jù)斯塔克爾貝格的假定,模型中企業(yè)選擇其產(chǎn)量(與古諾模型的相同點(diǎn):選擇產(chǎn)量;不同點(diǎn):古諾模型中企業(yè)是同時(shí)行動(dòng)的,這里是序貫行動(dòng)).博弈順序:首先,企業(yè)1選擇產(chǎn)量q1≥0,然后,企業(yè)2在觀測(cè)到q1后,并選擇產(chǎn)量q1≥0;企業(yè)i的收益由下面的利潤(rùn)函數(shù)給出這里p(Q)=a-Q,p是市場(chǎng)上的總產(chǎn)量Q=q1+q2時(shí)的市場(chǎng)出清價(jià)格,c是兩個(gè)企業(yè)生產(chǎn)的邊際成本,為一常數(shù)(令固定成本為0).66這是完全且完美信息兩階段博弈,逆向歸納法求解.假設(shè)企業(yè)1有產(chǎn)量q1,首先計(jì)算企業(yè)2對(duì)企業(yè)1任意產(chǎn)量的最優(yōu)反應(yīng),q2=R2(q1)應(yīng)滿足:由上式可得這與古諾模型中,得到的R2(q1)相同,兩者不同的在于,這里得到的R2(q1)是企業(yè)2對(duì)假定企業(yè)1產(chǎn)量為q1時(shí)的最優(yōu)反應(yīng).由于企業(yè)1考慮到當(dāng)它產(chǎn)量為q1時(shí),企業(yè)2的最優(yōu)反應(yīng)為R2(q1).那么,在博弈的第一階段,企業(yè)1要先行決定自己的產(chǎn)量,因而企業(yè)1面臨的問(wèn)題可表示為:67由上式可得斯塔克爾貝格博弈是一個(gè)二階段的完全且完美信息動(dòng)態(tài)博弈,也稱為主從博弈.第一階段選擇行動(dòng)的局中人稱為主局中人,第二階段選擇行動(dòng)的局中人稱為從局中人.至于主局中人是否具有先動(dòng)優(yōu)勢(shì),這與具體的博弈有關(guān).是斯塔克爾貝格雙寡頭壟斷博弈的逆向歸納解.68例3.2.5制造商與銷售商的博弈設(shè)有一個(gè)由制造商和銷售商組成的二級(jí)供應(yīng)鏈,為市場(chǎng)提供某種商品,該商品的市場(chǎng)需求函數(shù)設(shè)為Q=a-p.其中p為商品的價(jià)格,Q為市場(chǎng)對(duì)商品需求數(shù)量,a為一常數(shù),其經(jīng)濟(jì)意義是商品的最高需求量.制造商提供給銷售商的批發(fā)價(jià)為每件ω元.制造商和銷售商都有不變的邊際成本c1和c2.制造商和銷售商的博弈順序規(guī)定如下:制造商先確定產(chǎn)品的批發(fā)價(jià)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論