第三講完全信息動態(tài)博弈(共25張PPT)精選

上傳人：青*** IP屬地：江西上傳時間：2022-11-27 格式：PPTX 頁數(shù)：25 大小：299.46KB 積分：12 舉報 版權(quán)申訴

已閱讀5頁，還剩20頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

第三(dìsān)講完全信息動態(tài)博弈第一頁，共25頁。一、子博弈(bóyì)精煉納什均衡子博弈精煉納什均衡的創(chuàng)立者.——1994年諾貝爾經(jīng)濟學(xué)獎獲獎?wù)摺⑷R茵哈德·澤爾騰。

澤爾騰則在60年代中期將納什均衡概念引入動態(tài)分析。在1965年發(fā)表《需求減少條件下寡頭壟斷模型的對策論描述》一文，提出了“子博弈精煉納什均衡”的概念，又稱“子對策完美納什均衡”。這一研究(yánjiū)對納什均衡進行了第一次改進，選擇了更具說服力的均衡點。海薩尼在60年代末把不完全信息引入博弈分析。第二頁，共25頁。將納什均衡中包含的不可置信的威脅策略剔除出去。它要求參與(cānyù)者的決策在任何時點上都是最優(yōu)的，決策者要“隨機應(yīng)變”，“向前看”，而不是固守舊略。

由于剔除了不可置信的威脅，在許多情況下，精煉納什均衡也就縮小了納什均衡的個數(shù)。這一點對預(yù)測分析是非常有意義的。

用動態(tài)博弈理論來討論實際究竟發(fā)生哪個納什均衡。

只有當(dāng)參與(cānyù)人的策略在每一個子博弈中都構(gòu)成納什均衡叫做精煉納什均衡?；蛘哒f，組成精煉納什均衡的策略必須在每一個子博弈中都是最優(yōu)的。第三頁，共25頁。在動態(tài)博弈中，參與人的行動有先后順序，后行動的參與人在自己行動之前就可以觀察到先行動者（參與人）的行為，并在此基礎(chǔ)上選擇相應(yīng)的策略。而且，由于先行動者擁有后行動者可能選擇策略的完全信息，因而先行動者在選擇自己的策略時，就可以預(yù)先考慮自己的選擇對后行動者選擇的影響(yǐngxiǎng)，并采取相應(yīng)的對策。第四頁，共25頁。因而Ｂ的策略一（無論Ａ是否開發(fā)，Ｂ都要開發(fā)）就構(gòu)成了對Ａ的確信威脅，因此，無論Ａ是否選擇開發(fā)，Ｂ都會選擇開發(fā)。由于剔除了不可置信的威脅，在許多情況下，精煉納什均衡也就縮小了納什均衡的個數(shù)。策略(cèlüè)四：無論Ａ是否選擇開發(fā)，Ｂ都選擇不開發(fā)?；蛘哒f，組成精煉納什均衡的策略必須在每一個子博弈中都是最優(yōu)的。從表3－1可以知道，該博弈有兩個納什均衡，即（Ａ開發(fā)，Ｂ不開發(fā)）和（Ａ不開發(fā)，Ｂ開發(fā)），我們無法確定(quèdìng)是開發(fā)商Ａ選擇開發(fā)，開發(fā)商Ｂ選擇不開發(fā)，還是恰恰相反的結(jié)果。例如(lìrú)，在表3－1中，每一行或每一列都是整個博弈的一個子博弈。以上的分析，就是子博弈精煉納什均衡解的過程。由此可以看出，在完全信息靜態(tài)博弈(bóyì)下，Ｂ選擇開發(fā)是一個占優(yōu)策略。策略(cèlüè)三：若Ａ選擇開發(fā)，Ｂ就選擇不開發(fā)；如果Ａ、Ｂ雙方都選擇合作，都保持定高價，則雙方在每個階段的收益均為３０個單位，記為（３０，３０，３０，…）；我們關(guān)于房地產(chǎn)開發(fā)的例子，討論子博弈精煉納什均衡。在這里，Ｂ選擇的策略稱為“冷酷策略”（grimstrategies）。第二十二頁，共25頁。即在倒數(shù)第二階段博弈中，所有參與人都會選擇占優(yōu)策略。只有當(dāng)參與(cānyù)人的策略在每一個子博弈中都構(gòu)成納什均衡叫做精煉納什均衡。三、動態(tài)博弈策略(cèlüè)行動在上述房地產(chǎn)開發(fā)博弈的例子中，開發(fā)商Ａ選擇開發(fā)后的子博弈甲不同于開發(fā)商Ａ選擇不開發(fā)后的子博弈乙，當(dāng)開發(fā)商Ａ選擇開發(fā)后，子博弈乙就被排除了。我們關(guān)于房地產(chǎn)開發(fā)的例子，討論子博弈精煉納什均衡。表3－1給出了靜態(tài)條件下雙方參與(cānyù)人的收益情況。表3－1房地產(chǎn)開發(fā)博弈（靜態(tài)）的收益矩陣

第五頁，共25頁。從表3－1可以知道，該博弈有兩個納什均衡，即（Ａ開發(fā)，Ｂ不開發(fā)）和（Ａ不開發(fā)，Ｂ開發(fā)），我們無法確定(quèdìng)是開發(fā)商Ａ選擇開發(fā)，開發(fā)商Ｂ選擇不開發(fā)，還是恰恰相反的結(jié)果。現(xiàn)在，我們討論動態(tài)博弈。假定房地產(chǎn)開發(fā)商Ａ是先行動者。在行動之前，開發(fā)商Ａ對對手開發(fā)商Ｂ的策略進行了預(yù)測。在行動開始之前的Ａ看來，如果不計得失，Ｂ有四種策略可供選擇：第六頁，共25頁。策略(cèlüè)一：無論Ａ是否選擇開發(fā)，Ｂ選擇開發(fā)。策略(cèlüè)二：若Ａ選擇開發(fā)，Ｂ也選擇開發(fā)；若Ａ選擇不開發(fā)，Ｂ也選擇不開發(fā)。策略(cèlüè)三：若Ａ選擇開發(fā)，Ｂ就選擇不開發(fā)；若Ａ選擇不開發(fā)，Ｂ就選擇開發(fā)。策略(cèlüè)四：無論Ａ是否選擇開發(fā)，Ｂ都選擇不開發(fā)。第七頁，共25頁。在表3－1的基礎(chǔ)上，結(jié)合Ａ先行動，Ｂ可能選擇的四種策略，不難得出表3－2。表3－2先行動者Ａ對Ｂ預(yù)測結(jié)果的收益矩陣第一列為策略一收益展示(zhǎnshì)（也就是說第一列兩個收益組合對應(yīng)策略一），第二列為策略二收益展示(zhǎnshì)，以此類推第八頁，共25頁。由表3－2可以看出，在開發(fā)商Ａ先行動的情況下，開發(fā)商Ｂ可供選擇的策略中，策略一只包括了上述兩個(liǎnɡɡè)納什均衡中的后一種均衡，即（Ａ不開發(fā)，Ｂ開發(fā)），而沒有包括前一種納什均衡，即（Ａ開發(fā)，Ｂ不開發(fā)）；策略二上述兩種納什均衡都沒有包括；策略四只包括了上述兩種納什均衡中的前一種均衡，即（Ａ開發(fā)，Ｂ不開發(fā)），而未包括后一種納什均衡，即（Ａ不開發(fā)，Ｂ開發(fā)）；只有策略三既包括了上述兩種納什均衡中的前一種均衡，又包括了后一種均衡。也就是說，如果Ｂ選擇策略三，那么，無論Ａ作出什么選擇，Ｂ的回應(yīng)都能達(dá)到納什均衡。反過來，在給定Ｂ會選擇策略三來回應(yīng)Ａ的選擇的前提下，開發(fā)是Ａ的占優(yōu)選擇。因此，Ａ一定會選擇開發(fā)。第九頁，共25頁。以上的分析，就是子博弈精煉納什均衡解的過程。策略（Ａ開發(fā)，Ｂ不開發(fā)）就是上述子博弈精煉納什均衡解。所謂“子博弈”（sub-game）是指它本身可以作為一個獨立的博弈進行分析，它是原博弈的一部分。例如(lìrú)，在表3－1中，每一行或每一列都是整個博弈的一個子博弈。而且，任何博弈本身可被稱為自身的一個子博弈。只有當(dāng)某一策略組合在每一個子博弈（包括原博弈）上都構(gòu)成一個納什均衡，這一策略組合才是子博弈精煉納什均衡解。顯然，如果整個博弈是惟一的子博弈，納什均衡與子博弈精煉納什均衡是完全相同的。第十頁，共25頁。二、重復(fù)(chóngfù)博弈上述子博弈精煉納什均衡有這樣一個特征，這就是(jiùshì)，參與人在前一個階段的行動選擇決定了隨后的子博弈的結(jié)構(gòu)。因此，同樣結(jié)構(gòu)的子博弈只出現(xiàn)一次。在上述房地產(chǎn)開發(fā)博弈的例子中，開發(fā)商Ａ選擇開發(fā)后的子博弈甲不同于開發(fā)商Ａ選擇不開發(fā)后的子博弈乙，當(dāng)開發(fā)商Ａ選擇開發(fā)后，子博弈乙就被排除了。這樣的動態(tài)博弈稱為“序貫博弈”（sequentialgames）。動態(tài)博弈中另一類特殊但非常重要的博弈是所謂的“重復(fù)博弈”（repeatedgames）。顧名思義，重復(fù)博弈是指同樣結(jié)構(gòu)的博弈重復(fù)許多次，其中的每次博弈稱為“階段博弈”（stagegames）第十一頁，共25頁。以下我們用一個產(chǎn)品定價的例子討論重復(fù)博弈。表3－3給出了一次性完全(wánquán)信息靜態(tài)博弈的收益矩陣。表3－3產(chǎn)品定價博弈的收益矩陣第十二頁，共25頁。Ａ、Ｂ兩個參與人都有兩種定價代選擇：定高價或定低價。如果兩個參與人都定低價，則每個參與人的收益均為２０個單位；如果兩人都定高價，則每人的收益均為３０個單位；如果其中某一參與人定低價，而另一參與人定高價，則定低價的參與人有占有更多的市場份額獲得(huòdé)４０個單位的收益，定高價的參與人由于失去一部分市場份額而只獲得(huòdé)１０個單位的收益。顯然，在這個一次性完全信息靜態(tài)博弈中，兩個參與人均有占優(yōu)策略，占優(yōu)策略均衡為Ａ、Ｂ雙方都定低價。第十三頁，共25頁。如果Ａ、Ｂ之間的定價博弈是多次進行的，那么，問題就不是如此簡單了。我們(wǒmen)先來分析博弈重復(fù)次數(shù)為無限次的情況。第十四頁，共25頁。如果Ａ、Ｂ雙方都選擇合作，都保持定高價，則雙方在每個階段的收益均為３０個單位，記為（３０，３０，３０，…）；如果Ａ、Ｂ中有一方（如Ａ）采取(cǎiqǔ)投機行為，在實際定價中選擇不與對方合作，在第一階段就通過選擇定價策略使得選擇高價策略的對手Ｂ受損，則受損的一方Ｂ一定會在第二階段及其以后的定價中也選擇低價策略，加以報復(fù)，這樣一來，首先選擇不合作的一方Ａ在個階段的收益為（４０，２０，２０，…），顯然，其總收益遠(yuǎn)遠(yuǎn)小于合作、維持高價情況下的總收益。因為，首選選擇不合作的一方Ａ，只是在第一階段獲得了“額外”收益，但在以后個階段的收益將因為對手Ｂ的報復(fù)性選擇而減少，并且，重復(fù)若干此后，首先選擇不合作的一方Ａ將得不償失。第十五頁，共25頁。在這里，Ｂ選擇的策略稱為“冷酷策略”（grimstrategies）。冷酷策略是指重復(fù)博弈中的任何參與人的一次性不合作將引起(yǐnqǐ)其他參與人的永遠(yuǎn)不合作，從而導(dǎo)致所有參與人的收益減少。因此，所有參與人具有維持合作的積極性。我們再來討論博弈重復(fù)次數(shù)為有限時的情況。第十六頁，共25頁。重復(fù)次數(shù)有限博弈與重復(fù)次數(shù)無限博弈之間的惟一區(qū)別，是所有參與人都可以明確無誤地了解重復(fù)的次數(shù)，即可以準(zhǔn)確地預(yù)測到最后一個階段博弈。而在最后階段的博弈中，任何一個參與人選擇不合作，不會導(dǎo)致其他參與人的報復(fù)。因此，所有參與人都會在最后階段的博弈中選擇自己的占優(yōu)策略，那就是不合作。上例中，在最后階段博弈中選擇低價是所有參與人的占優(yōu)策略。既然所有參與人都會在最后階段選擇不合作，那么(nàme)，在倒數(shù)第二階段博弈中任何參與人也就沒有必要擔(dān)心由于自己選擇不合作，導(dǎo)致其他參與人在最后階段博弈中的報復(fù)。因此所有參與人在倒數(shù)第二階段博弈中，也都會選擇不合作。即在倒數(shù)第二階段博弈中，所有參與人都會選擇占優(yōu)策略。第十七頁，共25頁。由此類推，可以得出以下(yǐxià)結(jié)論：在階段性博弈存在惟一的納什均衡時，階段博弈的納什均衡解就是重復(fù)次數(shù)有限博弈的唯一子博弈精煉納什均衡解。即重復(fù)次數(shù)有限博弈的每個階段的均衡解都是一次性博弈的納什均衡解。注意，上述推論成立的前提條件是階段性博弈納什均衡的惟一性。例如，在上例中，每個階段博弈的收益矩陣都與表3－3完全一致，納什均衡都是每個參與人選擇低價。第十八頁，共25頁。三、動態(tài)博弈策略(cèlüè)行動在動態(tài)博弈中，由于參與人的行動有先后順序，而參與人行動順序直接影響博弈的結(jié)果。因此，參與人為了使其他參與人的選擇對自己有利，往往會主動采取一些行動影響其他參與人對自己行為(xíngwéi)的預(yù)期，從而達(dá)到對自己有利的結(jié)果。參與人所采取的這些行為(xíngwéi)稱之為“策略行”（strategicmove）。第十九頁，共25頁。以下通過兩個例子加以說明。１、先行優(yōu)勢（first-moveadvantage）所謂現(xiàn)行優(yōu)勢是指在博弈中首先(shǒuxiān)作出策略選擇并采取相應(yīng)行動的參與人可以獲得更多的利益。在上面提到的性別戰(zhàn)中，存在兩個納什均衡，即男女雙方一起去看足球賽或一起去逛商店。我們無法確定結(jié)果到底如何。在這種情況下，如果男方首先(shǒuxiān)采取行動，在約會前就買好足球票，就會對女方產(chǎn)生影響。女方可能因為男方的這一行動表明“男朋友十分想看這場足球比賽”或因“既然已經(jīng)買了票，不看怪可惜”，從而接受雙方一起看足球賽的選擇。第二十頁，共25頁。２、確信威脅（credible）確信威脅是指博弈的某一參與人通過承諾某種行動改變自己的收益函數(shù)，使得其他參與人認(rèn)為自己的威脅確實可信，從而迫使(pòshǐ)其他參與人在充分考慮自己的承諾的情況下作出相應(yīng)的選擇。例如，在上述房地產(chǎn)開發(fā)博弈中，如果房地產(chǎn)開發(fā)商Ｂ在房地產(chǎn)開始Ａ作出選擇之前就采取行動，與客戶簽訂合同，規(guī)定Ｂ在一定期限內(nèi)，向客戶交付一定面積的住房，倘若Ｂ不能按時履約，則總共賠償客戶６個單位。在有這樣一個承諾的情況下，上述表3－1和表3－2就相應(yīng)地變成了表3－4和表3－5。第二十一頁，共25頁。海薩尼在60年代末把不完全信息引入博弈分析。在上述房地產(chǎn)開發(fā)博弈的例子中，開發(fā)商Ａ選擇開發(fā)后的子博弈甲不同于開發(fā)商Ａ選擇不開發(fā)后的子博弈乙，當(dāng)開發(fā)商Ａ選擇開發(fā)后，子博弈乙就被排除了。因為，首選選擇不合作的一方Ａ，只是在第一階段獲得了“額外”收益，但在以后個階段的收益將因為對手Ｂ的報復(fù)性選擇而減少，并且，重復(fù)若干此后，首先選擇不合作的一方Ａ將得不償失。若Ａ選擇不開發(fā)，Ｂ也選擇不開發(fā)。因而Ｂ的策略一（無論Ａ是否開發(fā)，Ｂ都要開發(fā)）就構(gòu)成了對Ａ的確信威脅，因此，無論Ａ是否選擇開發(fā)，Ｂ都會選擇開發(fā)。這樣的動態(tài)博弈稱為“序貫博弈”（sequentialgames）。上例中，在最后階段博弈中選擇低價是所有參與人的占優(yōu)策略。同時，由于Ａ對Ｂ這一選擇有一個正確的預(yù)測，因此，Ａ一定會選擇不開發(fā)。三、動態(tài)博弈策略(cèlüè)行動顧名思義，重復(fù)博弈是指同樣結(jié)構(gòu)的博弈重復(fù)許多次，其中的每次博弈稱為“階段博弈”（stagegames）因為，首選選擇不合作的一方Ａ，只是在第一階段獲得了“額外”收益，但在以后個階段的收益將因為對手Ｂ的報復(fù)性選擇而減少，并且，重復(fù)若干此后，首先選擇不合作的一方Ａ將得不償失。顧名思義，重復(fù)博弈是指同樣結(jié)構(gòu)的博弈重復(fù)許多次，其中的每次博弈稱為“階段博弈”（stagegames）若Ａ選擇不開發(fā)，Ｂ就選擇開發(fā)。第二十三頁，共25頁。例如，在上述房地產(chǎn)開發(fā)博弈中，如果房地產(chǎn)開發(fā)商Ｂ在房地產(chǎn)開始Ａ作出選擇之前就采取行動，與客戶簽訂合同，規(guī)定Ｂ在一定期限內(nèi)，向客戶交付一定面積的住房，倘若Ｂ不能按時履約，則總共賠償客戶６個單位。表3－4Ｂ承諾(chéngnuò)后的腹地開發(fā)博弈的收益矩陣表3－5Ｂ

人人文庫> 全部分類> 專業(yè)文獻(xiàn) > 工業(yè)制造

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第三講完全信息動態(tài)博弈(共25張PPT)精選

文檔簡介

溫馨提示

最新文檔

評論

第三講完全信息動態(tài)博弈(共25張PPT)精選

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔