第八章-可置信性與序貫理性_第1頁(yè)
第八章-可置信性與序貫理性_第2頁(yè)
第八章-可置信性與序貫理性_第3頁(yè)
第八章-可置信性與序貫理性_第4頁(yè)
第八章-可置信性與序貫理性_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第八章可置信性與序貫理性本章重點(diǎn):

理解序貫理性,并能將其運(yùn)用于博弈求解過(guò)程

理解子博弈,運(yùn)用子博弈完美納什均衡求解非完美信息博弈

古諾模型和斯塔科爾伯格的聯(lián)系與區(qū)別,以及在求解二者的過(guò)程中所體現(xiàn)的博弈過(guò)程

本章主要內(nèi)容一、序貫理性和逆向歸納1、序貫理性2、逆向歸納法與逆向歸納解二、子博弈完美納什均衡1、逆向歸納法適用范圍2、子博弈和子博弈完美納什均衡三、子博弈完美納什均衡:舉例1、蜈蚣博弈2、斯塔科爾伯格競(jìng)爭(zhēng)3、時(shí)間不一致偏好

一、序貫理性和逆向歸納

1、序貫理性定義:給定i的對(duì)手的策略

,我們稱

是序貫理性的,當(dāng)且僅當(dāng)i在其每一個(gè)信息集上都針對(duì)

采取了最優(yōu)反應(yīng)。也即,參與人在博弈樹上每一個(gè)信息集都使用最優(yōu)的策略。它表明參與人在博弈序列的每一個(gè)階段都是理性的,而無(wú)論是在博弈的均衡或非均衡路徑上使用這一定義我們可以重新考慮一下性別戰(zhàn)博弈,參與人2在其每個(gè)信息集上的最優(yōu)反應(yīng)是什么?答案是很明顯的:如果參與人1采取O,那么參與人2應(yīng)當(dāng)選擇o,而如果參與人1選擇F,那么參與人2應(yīng)當(dāng)選擇f。參與人2的任何其他策略至少在一個(gè)信息集上不是最優(yōu)反應(yīng),這說(shuō)明具有序貫理性的參與人2應(yīng)該選擇of這一純策略。我們重回這個(gè)博弈的根,即參與人1必須在O和F之間進(jìn)行選擇??紤]參與人2的序貫理性之后,參與人1應(yīng)該得出這樣的結(jié)論:選擇O會(huì)帶來(lái)支付(2,1),而選擇F會(huì)帶來(lái)支付(1,2)?,F(xiàn)在,若對(duì)參與人1也施加序貫理性的話,就要要求正確預(yù)測(cè)了參與人2行為的參與人1應(yīng)當(dāng)選擇O。因此,從這一過(guò)程中可以得到的唯一的預(yù)測(cè)就是這樣的博弈路徑:參與人1選擇O,緊接著參與人2選擇o。也即,納什均衡(O,of)是經(jīng)過(guò)序貫理性條件檢測(cè)之后還余下的唯一的一個(gè)策略對(duì)。2、逆向歸納法定義:從那些直接與博弈終點(diǎn)相連接的節(jié)點(diǎn)開始,然后沿著博弈樹逆向歸納的處理程序,被稱之為博弈逆向歸納法。命題:任一完美信息有限博弈有一個(gè)逆向歸納解,該解是序貫理性的。進(jìn)而言之,如果沒有兩個(gè)終點(diǎn)結(jié)為任一參與人預(yù)先給出相同的支付,那么逆向歸納解就是唯一的。疑問(wèn):為什么是針對(duì)任一參與人,而不是最后行動(dòng)的參與人?推論:任一完美信息有限博弈都至少有一個(gè)純策略序貫理性納什均衡。進(jìn)而言之,如果沒有兩個(gè)終點(diǎn)結(jié)為任一參與人預(yù)先給出相同的支付,那么該博弈就有唯一的序貫理性納什均衡。二、子博弈完美納什均衡1、逆向歸納法適用范圍逆向歸納在完美信息有限博弈中尋找序貫理性納什均衡上是一個(gè)有用的方法。然而在不完美信息博弈中,逆向歸納法的運(yùn)用就與遇到較大的問(wèn)題,因?yàn)槲覀兪褂媚嫦驓w納,需要首先分辨出終點(diǎn)結(jié)前面的“最后參與人”集合,然后選擇行動(dòng)在這個(gè)階段最大化其支付。同時(shí)在無(wú)限次重復(fù)博弈中,逆向歸納法亦無(wú)法適用。在此博弈中完美就無(wú)法使用逆向歸納法,因?yàn)閰⑴c人2在終點(diǎn)結(jié)之前有一個(gè)并非單點(diǎn)的信息集。因此,他的最優(yōu)反應(yīng)并非明確界定的,沒有為這個(gè)參與人就參與人1實(shí)際上選擇了什么賦予一個(gè)信念,而且這些信念并非逆向選擇過(guò)程的一部分。真子博弈:擴(kuò)展式博弈

的一個(gè)真子博弈(propersubgame)G由僅有的一個(gè)單點(diǎn)(singlenode)和其具有如下性質(zhì)的所有前行結(jié)點(diǎn)構(gòu)成:如果

,那么

。這個(gè)子博弈G自身也是一個(gè)博弈樹,其信息集和支付都源自

。也即子博弈從原博弈中的一個(gè)單點(diǎn)信息集開始,且子博弈不能切割原博弈的信息集。子博弈是整體博弈中的一個(gè)獨(dú)立的博弈。完美信息博弈的子博弈分析在圖8.3所描述的博弈中,兩個(gè)“最小的”子博弈是從結(jié)點(diǎn)

開始的。一個(gè)“更大”的子博弈是從

點(diǎn)開始的,它包括從結(jié)點(diǎn)

開始的兩個(gè)子博弈。最后,“最大的”子博弈始自初始博弈的根

,包括所有其他的子博弈。不完美信息博弈的子博弈分析在這個(gè)博弈中有兩個(gè)真子博弈:整個(gè)博弈(根據(jù)定義它總是一個(gè)真子博弈),以及從結(jié)點(diǎn)

開始的子博弈。值得注意的是,

都不可能是子博弈的根,因?yàn)樗鼈儗儆谕粋€(gè)信息集。子博弈概念可以將整體博弈變成一系列更小的博弈,這種方法反過(guò)來(lái)也可以允許我們將序貫理性的概念應(yīng)用到不完美信息博弈上來(lái)。正如圖8.4的自愿性別戰(zhàn)博弈所證明的那樣,逆向歸納的問(wèn)題在于我們無(wú)法將它應(yīng)用到博弈的最后,因?yàn)橛幸粋€(gè)信息集包含先行于終點(diǎn)結(jié)的兩個(gè)結(jié)點(diǎn),也即

。不過(guò),我們所能做的就是將關(guān)注點(diǎn)集中在從結(jié)點(diǎn)

開始的子博弈上,從而要求在這個(gè)子博弈中博弈行為是理性的。那么,我們就可以在這個(gè)“終結(jié)博弈”使用理性的行動(dòng)概念進(jìn)行逆推,并運(yùn)用序貫理性。子博弈完美納什均衡根據(jù)子博弈完美均衡的定義,每一個(gè)子博弈完美均衡都是一個(gè)納什均衡。但是,不是所有的納什均衡都必然是子博弈完美均衡,這說(shuō)明子博弈完美均衡精煉了納什均衡集,在做出更多精煉后給出了對(duì)行為的預(yù)測(cè)。性別戰(zhàn)博弈的再次分析如我們此前所看到的,這個(gè)博弈有三個(gè)純策略納什均衡(O,oo),(F,ff)和(O,of)。但只有(O,of)滿足下面這個(gè)條件:它是整體博弈中每個(gè)真子博弈的納什均衡,因此(O,oo)和(F,ff)是納什均衡,但不是子博弈完美的。對(duì)于任一完美信息有限博弈而言,子博弈完美納什均衡的集合與經(jīng)過(guò)逆向歸納剩下的納什均衡集合是一致的。對(duì)于不完美信息博弈,我們需要使用經(jīng)過(guò)修正后的逆向歸納法來(lái)分析這類博弈,將真子博弈看成是逆向歸納過(guò)程中的相關(guān)階段。作為例子,我們考慮一下圖8.4描述的自愿性別戰(zhàn)博弈。在這個(gè)博弈中,參與人1有四個(gè)純策略其中YO意思是參與人1計(jì)劃在x1

選擇Y,在x2選擇O。另一方面,參與人2只有兩個(gè)策略

,因?yàn)樗仨氃诓恢绤⑴c人1選擇的情況做出選擇。在這個(gè)博弈中有三個(gè)純策略納什均衡,由集合

給出,其中只有兩個(gè)策略對(duì)構(gòu)成子博弈完美均衡,因此子博弈完美均衡策略集是原因在于在這個(gè)從結(jié)點(diǎn)x1開始的子博弈中,唯有的構(gòu)成納什均衡的受到約束的策略對(duì)是(O,o)和(F,f)。故而,當(dāng)我們集中關(guān)注從結(jié)點(diǎn)x1

開始的子博弈時(shí),剖面(NO,f)不是納什均衡。

三、子博弈完美納什均衡舉例1、蜈蚣博弈我們來(lái)看圖8.8描述的完美信息博弈。這個(gè)博弈應(yīng)該從左向右讀:參與人1可以在他的第一個(gè)信息集上通過(guò)選擇N馬上終結(jié)該博弈,或者通過(guò)選擇C繼續(xù)博弈。緊接著參與人2也面對(duì)著同樣的選擇(使用小寫字母來(lái)表示他的選擇),而如果參與人2選擇繼續(xù),那么這個(gè)球又踢回給了參與人1,他再次選擇終結(jié)還是踢回給參與人2,然后在這個(gè)階段參與人2通過(guò)第二次選擇n或c來(lái)結(jié)束整個(gè)博弈。對(duì)于參與人們而言,能夠一直繼續(xù)到終點(diǎn),可以得到(3,3)的支付,這當(dāng)然是最好的。但是,逆向歸納告訴我們,這是不可能出現(xiàn)的。在參與人2的最后一個(gè)信息集,他將選擇n來(lái)得到4而不是3,。預(yù)期到這一點(diǎn),參與人1會(huì)在前一個(gè)階段選擇N以得到2而不是1,這個(gè)邏輯一直持續(xù)下去,知道參與人1的第一個(gè)信息集為止,在這個(gè)信息集上他會(huì)選擇N,兩個(gè)參與人都得到1的支付。理性的詛咒:由于自利的打算,最后一個(gè)階段上最后一個(gè)參與人將希望終止最大化參與人總支付的選擇,逆向歸納法表明這一決策是可以為他之前的參與人預(yù)期到,并按照這種預(yù)期選擇其行動(dòng),以此類推,直到行動(dòng)最終回到令人倍感絕望的結(jié)果(1,1)。評(píng)論:實(shí)驗(yàn)證據(jù)表明,參與人并不會(huì)按照逆向歸納所給出的預(yù)測(cè)那樣行事。原因至少有兩個(gè):(1)他們的確關(guān)心其他人的支付。對(duì)于很多參與人是匿名的情況,這個(gè)解釋可能不那么可信,但是也不能輕易的排除。(2)是參與人并沒有享有關(guān)于理性的共同知識(shí)。2、斯塔科爾伯格競(jìng)爭(zhēng)古諾模型和斯塔科爾伯格模型都是研究雙寡頭廠商產(chǎn)量競(jìng)爭(zhēng)的模型。但前者是靜態(tài)的,表現(xiàn)在求解上就是求出各自的最優(yōu)反應(yīng)函數(shù)后,直接求解聯(lián)立方程組。后者則是動(dòng)態(tài)的,后行動(dòng)者在觀察到先行動(dòng)者的產(chǎn)量后再做出產(chǎn)量決策,表現(xiàn)在求解上便是,求出最優(yōu)反應(yīng)函數(shù)后,將后行動(dòng)者的反應(yīng)函數(shù)代入先行動(dòng)者的反應(yīng)函數(shù)(這體現(xiàn)了逆向歸納法),然后根據(jù)一階導(dǎo)數(shù)求先行動(dòng)者最優(yōu)產(chǎn)量,進(jìn)而求出后行動(dòng)者的產(chǎn)量。假設(shè)市場(chǎng)需求為

,對(duì)于

,有

。我們已經(jīng)通過(guò)最大化每個(gè)企業(yè)的利潤(rùn)函數(shù)求得了最優(yōu)反應(yīng)函數(shù),因此每一個(gè)i都求解:最優(yōu)反應(yīng)由一階條件給出,我們可以將之寫為:假設(shè)參與人1首先選擇q1

,參與人2在他選擇q2之前觀察到了參與人1的選擇。我們先從分析這個(gè)博弈的逆向歸納解開始分析。從參與人2已知q1

來(lái)最大化其利潤(rùn)這一條件可知,參與人2會(huì)遵守其最優(yōu)反應(yīng)函數(shù)這一點(diǎn)應(yīng)該是很清楚的,因此序貫理性表明:我們將8.1式代入到廠商1的反應(yīng)函數(shù)中,將q2消去,然后根據(jù)求解廠商1的最優(yōu)產(chǎn)量企業(yè)1的這個(gè)解可以由(8.2)中的一階條件給出,該式為:解得:,其最終的利潤(rùn)為在此博弈中,企業(yè)1先行動(dòng),相應(yīng)的其獲得了更多的利潤(rùn),也即先行動(dòng)者占優(yōu)。3、時(shí)間不一致偏好時(shí)間一致性是指在t期為t+n期做一個(gè)最優(yōu)決策,在t+n期實(shí)施該決策時(shí),此決策仍是最優(yōu)的一個(gè)決策。我們來(lái)看其效用函數(shù)

的參與人,他需要在三個(gè)時(shí)期上對(duì)一個(gè)給定的預(yù)算K進(jìn)行配置。由于他不會(huì)浪費(fèi)任何預(yù)算,所以可以得到下式

,從而求解下面這個(gè)問(wèn)題:為了求解這一問(wèn)題,我們要來(lái)求解以下兩個(gè)一階條件:和最終可解的:該參與人選擇在早前時(shí)期消費(fèi)更多,因?yàn)樗诹顣r(shí)間上消費(fèi)的邊際效用相等,并考慮了未來(lái)時(shí)期的折現(xiàn)問(wèn)題。下面這個(gè)問(wèn)題是很有意思的:如果該參與人在時(shí)間上計(jì)劃其未來(lái)消費(fèi),那么他會(huì)選擇在消費(fèi)了

之后還堅(jiān)持其原來(lái)的行動(dòng)計(jì)劃嗎?為了回答這一問(wèn)題,我們假設(shè)該參與人已經(jīng)消費(fèi)了,這意味著在時(shí)期

還剩下預(yù)算:現(xiàn)在我們來(lái)看在時(shí)期t=2該參與人的最大化問(wèn)題,此時(shí)他剩下的預(yù)算為

該參與人問(wèn)題的解為:或根據(jù)初始的預(yù)算K來(lái)求解對(duì)

的選擇,從而得到:這和最初給出的該參與人最初對(duì)

的選擇是一致的。在上述例子中我們效用的折現(xiàn)因子為,現(xiàn)在我們還額外增加使用一個(gè)折現(xiàn)因子以對(duì)所有與當(dāng)前消費(fèi)相對(duì)的未來(lái)進(jìn)行折現(xiàn)。利用我們的這個(gè)三時(shí)期例子來(lái)看,該參與人修改后當(dāng)前折現(xiàn)值問(wèn)題為:簡(jiǎn)單而言,當(dāng)參與人展望未來(lái)時(shí),他在時(shí)期t=1和t=2之間使用的折現(xiàn)因子要比他在時(shí)期t=2和t=3之間使用的折現(xiàn)因子來(lái)的大。雙曲線折現(xiàn)會(huì)帶來(lái)自我控制問(wèn)題(self-control),因?yàn)閰⑴c人計(jì)劃做一件事,稍后會(huì)選擇來(lái)修改其計(jì)劃。假設(shè)該參與人非常了解自我控制問(wèn)題——在時(shí)期t=1他對(duì)時(shí)期t=2和t=3以比率

進(jìn)行折現(xiàn),但是他知道當(dāng)明天(t=2)到來(lái)時(shí),他會(huì)以比率

來(lái)折現(xiàn)t=3。換言之,參與人在t=1(稱他為參與人1)清楚的知道他是在和在t=2“未來(lái)的自己”(稱他為參與人2)進(jìn)行博弈,而未來(lái)的這個(gè)自己在時(shí)間上表現(xiàn)出了不同的偏好。在這種情況下,一個(gè)理性的、前瞻的參與人1會(huì)運(yùn)用逆向歸納對(duì)其問(wèn)題進(jìn)行求解;換言之,他會(huì)求解這一動(dòng)態(tài)博弈的子博弈完美均衡。若我們?nèi)?,在最初的例子中參與人會(huì)選擇將其消費(fèi)在時(shí)間上均等化,因此在所有

上有

。現(xiàn)在我們來(lái)看一個(gè)使用

以及

,對(duì)修改后的雙曲線折現(xiàn)問(wèn)題進(jìn)行求解:其一階條件為:解得:和因此,參與人2所做的選擇

正是始于參與人2剩余預(yù)算

的結(jié)點(diǎn)上(無(wú)窮多)子博弈中任意一個(gè)的解。現(xiàn)在我們移動(dòng)到該博弈的根,這里參與人1要對(duì)如何在其自己的選擇和參與人2的選擇上進(jìn)行配置而做出決策,他必須求解以下這一問(wèn)題:其一階條件為:解得:這一結(jié)果與指數(shù)折現(xiàn)(第一種情形)的基準(zhǔn)相比是非常不同的,在后者(

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論