版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 . . . . 9/9 一:子博弈精煉納什均衡 在給出子博弈精煉Nash均衡的正式定義之前,我們需要先介紹“子博弈這個(gè)概念。子博弈subgame:由一個(gè)單結(jié)信息集X開始的與所有該決策結(jié)的后續(xù)結(jié)包括終點(diǎn)結(jié)組成的,能夠自成一個(gè)博弈的原博弈的一局部。即給定“歷史,每一個(gè)行動(dòng)選擇開始至博弈完畢構(gòu)成了的一個(gè)博弈,稱為原動(dòng)態(tài)博弈的一個(gè)“子博弈。子博弈可以作為一個(gè)獨(dú)立的博弈進(jìn)展分析,并且與原博弈具有一樣的信息結(jié)構(gòu)。為了表達(dá)方便,一般用表示博弈樹中開始于決策結(jié)的子博弈。 譬如圖3.5,該博弈存在3個(gè)子博弈:除了原博弈自己以外,還存在兩個(gè)子博弈圖3.6a子博弈和圖3.6b子博弈。 在靜態(tài)博弈分析時(shí),我們所說的
2、戰(zhàn)略是指參與人聲明他將做出何種選擇,而他們往往也是按照聲明做出實(shí)際選擇的;在動(dòng)態(tài)博弈中,戰(zhàn)略盡管仍然具有這種含義,但博弈在行動(dòng)選擇上參與人具有選擇行動(dòng)的先后順序情況下,參與人有了一種額外的選擇事后機(jī)會(huì)主義,后動(dòng)的局中人完全可以根據(jù)博弈進(jìn)展到此時(shí)對局中人最為有利的方式選擇行動(dòng),而放棄事前所聲明的戰(zhàn)略所規(guī)定的行動(dòng)選擇選擇其行動(dòng)。這意味著,在動(dòng)態(tài)博弈中,即使參與人人按事前所聲明的戰(zhàn)略組合構(gòu)成一個(gè)納什均衡,而這些均衡戰(zhàn)略又規(guī)定了各個(gè)參與人在其所有信息集上的行動(dòng)選擇,這些行動(dòng)選擇也可能并非參與人在對應(yīng)信息集上的最優(yōu)行動(dòng)選擇。而當(dāng)博弈實(shí)際進(jìn)展到那些由納什均衡戰(zhàn)略規(guī)定的行動(dòng)并非最優(yōu)行動(dòng)選擇的信息集時(shí),按照理
3、性人假設(shè),可以想象參與人屆時(shí)并不會(huì)按納什均衡戰(zhàn)略所規(guī)定的方式去選擇行動(dòng),而是機(jī)會(huì)主義地選擇最優(yōu)的行動(dòng)。這樣,具有這種特點(diǎn)的納什均衡就是不可信的,即不能作為模型的預(yù)測結(jié)果,按照“精煉納什均衡的思想,應(yīng)當(dāng)將其消掉。定義3.1:子博弈精煉納什均衡SPNE: 擴(kuò)展式博弈的策略組合S*=(S1*,Si*,Sn*)是一個(gè)子博弈精煉納什均衡當(dāng)且僅當(dāng):如果它是原博弈的納什均衡;它在每一個(gè)子博弈上也都構(gòu)成納什均衡。如果一個(gè)完美信息的動(dòng)態(tài)博弈中,各博弈方的策略構(gòu)成的一個(gè)策略組合滿足:在整個(gè)動(dòng)態(tài)博弈與它的所有子博弈中都構(gòu)成納什均衡,那么這個(gè)策略組合稱為該動(dòng)態(tài)博弈的一個(gè)“子博弈完美納什均衡。這也意味著原博弈的Nash
4、均衡并不一定是子博弈精煉Nash均衡,除非它還對所有子博弈構(gòu)成Nash均衡。例如前文的煤電博弈,提價(jià),承受和不提價(jià),承受均為納什均衡,但后者并未滿足在整個(gè)動(dòng)態(tài)博弈與它的所有子博弈中都構(gòu)成納什均衡這一要件,因而理性的煤炭企業(yè)一定會(huì)選擇提價(jià)。博弈:一個(gè)擴(kuò)展式表示博弈的子博弈G是由一個(gè)單結(jié)信息集x開始的與所有該決策結(jié)的后續(xù)結(jié)(包括終點(diǎn)結(jié))組成的能自成一個(gè)博弈的原博弈的一局部。對于擴(kuò)展式博弈的策略組合S*=(S1*,Si*,Sn*) ,如果它是原博弈的納什均衡;它在每一個(gè)子博弈上也都構(gòu)成納什均衡,那么它是一個(gè)子博弈精煉納什均衡。 HYPERLINK :/baike.baidu /view/18930.
5、htm t :/baike.baidu /_blank 博弈論專家常常使用“序貫理性(Sequential rationality):指不論過去發(fā)生了什么,參與人應(yīng)該在博弈的每個(gè)時(shí)點(diǎn)上最優(yōu)化自己的策略。子博弈精煉納什均衡所要求的正是參與人應(yīng)該是序慣理性的。對于有限完美信息博弈, HYPERLINK :/baike.baidu /view/1370329.htm t :/baike.baidu /_blank 逆向歸納法是求解子博弈精煉納什均衡的最簡便的方法。因?yàn)橛邢尥昝佬畔⒉┺牡拿恳粋€(gè)決策結(jié)都開始一個(gè)子博弈。求解方法:最后一個(gè)結(jié)點(diǎn)上的子博弈納什均衡倒數(shù)第二個(gè)納什均衡 初始結(jié)點(diǎn)上的子博弈納什均衡
6、。上圖摘自維迎的博弈論與信息經(jīng)濟(jì)學(xué)P 7在此圖中,我們可以看出博弈論大概分為四類,每種類別都有固定的納什均衡。這道題中所問的“如何分辨子博弈,是求解子博弈精煉納什均衡的根底。而“貝葉斯法那么是求解精煉貝葉斯均衡的根底。所以,如果擴(kuò)展一下是屬于如何求解完全信息動(dòng)態(tài)博弈的子博弈精煉納什均衡,以與如何求解不完全信息動(dòng)態(tài)博弈的精煉貝葉斯納什均衡。在下面分開討論。一、完全信息動(dòng)態(tài)的子博弈精煉納什均衡完全信息動(dòng)態(tài)一般用擴(kuò)展式表述。子博弈精煉納什均衡要求1它在原博弈上是納什均衡2它在每一個(gè)子博弈上都是納什均衡。所以,如何分辨一個(gè)擴(kuò)展式有幾個(gè)子博弈,關(guān)鍵在于看一個(gè)擴(kuò)展式表述的博弈中有幾個(gè)單節(jié)信息集。同時(shí),子博
7、弈不能切割原博弈的信息集。通過下面幾個(gè)圖來解釋:圖 1在此博弈中,有三個(gè)參與者,分別是A、N自然、B。共有七個(gè)決策點(diǎn),A有一個(gè)。N有兩個(gè),B有四個(gè)。這七個(gè)決策點(diǎn)分割成七個(gè)信息集,每個(gè)信息集都只包括一個(gè)決策點(diǎn)。表示,所有參與者在參與時(shí)準(zhǔn)確知道自己處于哪個(gè)決策結(jié)。子博弈由每個(gè)決策結(jié)與其后續(xù)結(jié)構(gòu)成,所以在圖一中,共有七個(gè)子博弈。注意:任何博弈本身成為其自身的一個(gè)子博弈。圖 2圖2與圖1一樣,也有三個(gè)參與者,A、N自然、B。不同的是,B在選擇時(shí)并不知道N的選擇,也就是說B知道A選擇了開發(fā)或者不開發(fā),但是不知道N選擇了大還是小。因?yàn)锽不知道自己處在N選擇了大還是小的決策結(jié)上,用虛線表示。此時(shí),B有兩個(gè)信
8、息集,但是每個(gè)信息集有兩個(gè)決策點(diǎn)??偨Y(jié)來說,在圖2中,A有一個(gè)信息集,只包含一個(gè)決策結(jié);N有兩個(gè)信息集,各包含一個(gè)決策結(jié);B有兩個(gè)信息集,各包含兩個(gè)決策結(jié)。所以,圖2共有三個(gè)單節(jié)信息集,那么也就可以判斷圖2有三個(gè)子博弈。圖 3在同樣三個(gè)參與者的圖中,圖3代表A決策時(shí)不知道N決策的結(jié)果;B知道自然的選擇,但是不知道A的選擇。在圖3中,根據(jù)“子博弈不能切割原博弈信息集的規(guī)那么,圖3只有一個(gè)子博弈就是原博弈本身。圖3的博弈還可以用另外的方式來表達(dá),可能更容易理解。圖 4圖4和圖3代表的完全是同一個(gè)博弈。A決策時(shí)不知道N決策的結(jié)果;B知道自然的選擇,但是不知道A的選擇。在這個(gè)圖中,根據(jù)之前的“有幾個(gè)單
9、節(jié)信息集就有幾個(gè)子博弈的判斷方法,可以知道只有一個(gè)子博弈就是原博弈本身?;蛘哒f,只有一個(gè)子博弈,即N有一個(gè)信息集只包含一個(gè)決策點(diǎn)。二、貝葉斯法那么的理解如何理解貝葉斯法那么在博弈論中的應(yīng)用,我覺得維迎博弈論與信息經(jīng)濟(jì)學(xué)中舉的一個(gè)例子很好,我先把這局部截圖放在下面。摘自維迎博弈論與信息經(jīng)濟(jì)學(xué) P182P183三:信號(hào)博弈與貝葉斯法那么的運(yùn)用信號(hào)博弈Signaling game,是一種由一個(gè)發(fā)送者S和另一個(gè)接收者R所組成的 HYPERLINK ://wiki/%E5%8A%A8%E6%80%81%E5%8D%9A%E5%BC%88 o 動(dòng)態(tài)博弈 動(dòng)態(tài)博弈。一開始這個(gè)
10、發(fā)送者有一個(gè)給定的類型t,接著發(fā)送者會(huì)觀察這個(gè)沒有其他人好比說接收者知道的類型,去從訊息堆 M = m1, m2, m3,., mj 中選擇送出一個(gè)訊息m,接著接收者會(huì)觀察這個(gè)訊息后從他可行的動(dòng)作中 A = a1, a2, a3, ak 選一個(gè)作為反響動(dòng)作a,這里要注意的是接收者除了訊息之外其他都無法得知如發(fā)送者的類型t,接著根據(jù)t, m, a的組合來決定雙方會(huì)獲得的報(bào)酬或回報(bào)。用貝葉斯法那么求解精煉貝葉斯納什均衡最典型的例子應(yīng)該是用在信號(hào)博弈上??梢詤⒖剂_云峰主編的博弈論教程,第十三章1、2小節(jié)。我覺得這本書相對講的清楚些。這是之前上課用到的一個(gè)例子,把它放在下面。首先,在這個(gè)博弈中,有三個(gè)
11、參與者,分別是N、S、R。Sender有兩種類型,他是哪種類型是其私有信息。也就是說,receiver不知道sender是哪種類型,知道的是1/2的可能性是t1,另外1/2的可能性是t2,同時(shí)Receiver可以根據(jù)Sender的行動(dòng)來修正自己的判斷。Sender有兩個(gè)行動(dòng)的可能性,L或者R;Receiver有兩個(gè)行動(dòng)的可能性,u或者d。1.假設(shè)無論是Sender t1,還是Sender t2,都會(huì)選擇L。這一假設(shè)條件可以表示為 pL t1= pLt2= 1。又知Sender 1/2的可能性是t1,另外1/2的可能性是t2,即p t1= pt2= 0.5 那么這個(gè)時(shí)候,根據(jù)貝葉斯法那么。他選擇
12、U,受益是1/2*3+1/2*4=3.5。如果他選擇d,收益是1/2*0+1/2*1=0.5。所以,在Sender選L的情況下,Receiver會(huì)選u。在Receiver選U的情況下,Sender t1 選L的收益是1,Sender t2選L的收益是2.以上結(jié)論,建立在“無論是Sender t1,還是Sender t2,都會(huì)選擇L,這一假設(shè)上,那么要使上述結(jié)論成立,首先這個(gè)假設(shè)要成立。如何讓這個(gè)假設(shè)成立呢?就需要保證,如果Receiver選擇u,那么無論對哪種類型的Sender來說,選L一定比選R好。因此,當(dāng)Sender選擇R時(shí),Receiver做出的反響使得任何類型Sender得到的收益,都
13、小于其選擇L得到的收益。當(dāng)Sender選擇R時(shí),只有Receiver選擇d 才能保證任何類型的Sender收益都小于其選擇L的收益。所以,必須保證當(dāng)Sender選擇R時(shí),Receiver一定選擇d。要想保證Receiver一定選擇d呢,那么一定要使Sender選R時(shí),Receiver選u的預(yù)期收益小于其選d的預(yù)期收益。即q+1-q*0 0*q + 2(1- q), 即q 2/3.所以,這種情況下的精煉貝葉斯均衡是 無論是Sender t1,還是Sender t2,都會(huì)選擇L;當(dāng)Sender選擇L時(shí),Receiver 選u,當(dāng)Sender選R時(shí),Receiver選d;p=0.5;q 2/32.
14、假設(shè)無論是Sender t1,還是Sender t2,都會(huì)選擇R這一假設(shè)條件可以表示為 pR t1= pRt2= 1。又知Sender 1/2的可能性是 t1,另外1/2的可能性是t2,即p t1= pt2= 0.5 那么這個(gè)時(shí)候,根據(jù)貝葉斯法那么。他選擇u,受益是1/2*1+1/2*0=0.5。如果他選擇d,收益是1/2*0+1/2*2=1。所以,在sender選L的情況下,Receiver會(huì)選d。在Receiver選d 的情況下,sender t1 選R的收益是0,sender t2選R的收益是1。如果Sender選擇L,那么Receiver選擇u總是優(yōu)于其選擇d,所以Receiver一定
15、會(huì)選擇u。而當(dāng)Receiver選擇u是,sender t1 收益是1,sender t2的收益是2。所以這種情況,Sender選L總是優(yōu)于其選R。與假設(shè)相悖,不存在均衡。3.如果是Sender t1,會(huì)選擇L:如果是Sender t2,會(huì)選擇R。在這種情況下,根據(jù)貝葉斯法那么,p=1 q=0如果Receiver發(fā)現(xiàn)Sender的選擇是L,就會(huì)知道是Sender t1,如果發(fā)現(xiàn)選擇的是R就能判斷出是R在Sender t1選擇L時(shí),Receiver會(huì)選擇u,Sender獲得收益1;當(dāng)Sender t2選擇R時(shí),Receiver會(huì)選擇d,Sender獲得收益1。需要檢驗(yàn),當(dāng)確定Receiver選擇u
16、、d時(shí), Sender做出與假設(shè)不一樣的選擇是否會(huì)得到更高的收益。當(dāng)Receiver會(huì)選擇u,Sender t1選擇R收益少于選L可以;當(dāng)Receiver會(huì)選擇d,Sender t2選擇L收益大于R。因此,Sender t2會(huì)選擇L,與假設(shè)相悖。所以,這種均衡不存在4.如果是Sender t1,會(huì)選擇R:如果是Sender t2,會(huì)選擇L。在這種情況下,根據(jù)貝葉斯法那么,p=0 q=1在Sender t1選擇R時(shí),Receiver會(huì)選擇u,Sender獲得收益2;當(dāng)Sender t2選擇L時(shí),Receiver會(huì)選擇u,Sender獲得收益2。再次檢驗(yàn),當(dāng)確定Receiver選擇uL,uR時(shí),
17、兩類型Sender做出與假設(shè)不一樣的選擇是否會(huì)得到更高的收益。當(dāng)Receiver會(huì)選擇u,Sender t1選擇L收益少于選R可以;當(dāng)Receiver會(huì)選擇u,Sender t2選擇R收益小于L可以。所以,這種均衡存在: Rt1, Lt2,uL, uR,p=0, q=1三:貼現(xiàn)因子與其在重復(fù)博弈中的運(yùn)用一般來說,當(dāng) HYPERLINK :/baike.baidu /view/142631.htm t :/baike.baidu /_blank 利率為r時(shí),承諾T年之后支付R美元的現(xiàn)值是R美元/ (1+r)T。因此,即使沒有 HYPERLINK :/baike.baidu /view/4017.
18、htm t :/baike.baidu /_blank 通貨膨脹,將來1美元的價(jià)值也小于現(xiàn)在1美元的價(jià)值,必須按某一數(shù)額貼現(xiàn),該數(shù)額取決于 HYPERLINK :/baike.baidu /view/142631.htm t :/baike.baidu /_blank 利率的上下和收到貨幣的時(shí)間長短。其中1/ (1+r)T被稱為未來T時(shí)期的貨幣的貼現(xiàn)因子(discount factor)。貼現(xiàn)因子(discount factor),也稱 HYPERLINK :/baike.baidu /view/544078.htm t :/baike.baidu /_blank 折現(xiàn)系數(shù)、折現(xiàn)參數(shù)。所謂貼現(xiàn)
19、因子,就是將來的 HYPERLINK :/baike.baidu /view/9881.htm t :/baike.baidu /_blank 現(xiàn)金流量折算成現(xiàn)值的介于01之間的一個(gè)數(shù)。貼現(xiàn)因子在數(shù)值上可以理解為 HYPERLINK :/baike.baidu /view/93166.htm t :/baike.baidu /_blank 貼現(xiàn)率,就是1個(gè)份額經(jīng)過一段時(shí)間后所等同的現(xiàn)在份額。這個(gè)貼現(xiàn)因子不同于金融學(xué)或者財(cái)務(wù)學(xué)的 HYPERLINK :/baike.baidu /view/93166.htm t :/baike.baidu /_blank 貼現(xiàn)率之處在于,它是由參與人的“耐心程度
20、所決定的。“耐心實(shí)質(zhì)上是講參與人的心理和經(jīng)濟(jì)承受能力,不同的參與人在談判中的 HYPERLINK :/baike.baidu /view/4141513.htm t :/baike.baidu /_blank 心理承受能力可能各不一樣,心理承受能力強(qiáng)的可能最終會(huì)獲得更多的廉價(jià);同樣,如果有比其他參與人更強(qiáng)的經(jīng)濟(jì)承受能力,也會(huì)占得更多的廉價(jià)。貼現(xiàn)因子=1/(1+r)T 01,r是利率。貼現(xiàn)值為1/(1+)T注:T表示T次方學(xué)者在 HYPERLINK :/baike.baidu /view/18930.htm t :/baike.baidu /_blank 博弈論對貼現(xiàn)因子的定義:貼現(xiàn)因子是討價(jià) HYPERLINK :/baike.baidu /view/2728374.htm t :/baike.baidu /_blank 還價(jià) HYPERLINK :/baike.baidu /view/150886.htm t :/baike.baidu /_blank 博弈
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 15972.33-2024光纖試驗(yàn)方法規(guī)范第33部分:機(jī)械性能的測量方法和試驗(yàn)程序應(yīng)力腐蝕敏感性參數(shù)
- 管材購銷合同范例
- 2025房屋居室裝修裝潢合同
- 政府采購法合同范例
- 混凝土基礎(chǔ)施工合同范例
- 美甲店股合同范例
- 承包宅基地合同范例
- 民間借貸借條合同范例
- 老人輪流照顧合同范例
- 協(xié)會(huì)活動(dòng)贊助合同范例
- 《中國陶瓷鑒賞與器物陳設(shè)》復(fù)習(xí)考試題庫(帶答案)
- 五金標(biāo)準(zhǔn)件手冊
- 園林植物栽培與環(huán)境
- 寺廟消防安全規(guī)定
- 學(xué)會(huì)正當(dāng)防衛(wèi)課件
- 溫室大棚改造施工方案及日光大棚設(shè)計(jì)方案
- 木質(zhì)吸音板施工工藝
- 博物館綜合安保系統(tǒng)技術(shù)方案-工程投標(biāo)型
- 1紀(jì)委監(jiān)委執(zhí)紀(jì)審查案件卷宗模版檢查卷模版
- 文華財(cái)經(jīng)-半自動(dòng)程序化交易使用指南101212
- 急診科建設(shè)與管理指南2023年
評(píng)論
0/150
提交評(píng)論