北京大學(xué)博弈論課件第3章-完全信息動(dòng)態(tài)博弈

上傳人：2*** IP屬地：貴州上傳時(shí)間：2023-08-03 格式：PPT 頁(yè)數(shù)：61 大?。?21.09KB 積分：25 舉報(bào) 版權(quán)申訴

北京大學(xué)博弈論課件第3章-完全信息動(dòng)態(tài)博弈_第2頁(yè)

北京大學(xué)博弈論課件第3章-完全信息動(dòng)態(tài)博弈_第3頁(yè)

北京大學(xué)博弈論課件第3章-完全信息動(dòng)態(tài)博弈_第4頁(yè)

北京大學(xué)博弈論課件第3章-完全信息動(dòng)態(tài)博弈_第5頁(yè)

已閱讀5頁(yè)，還剩56頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章

完全信息動(dòng)態(tài)博弈第三章

完全信息動(dòng)態(tài)博弈在完全信息動(dòng)態(tài)博弈中，博弈參與者的行動(dòng)存在先后順序?？梢杂貌┺臉?shù)表示完全信息動(dòng)態(tài)博弈。可以通過(guò)逆向歸納法求解完全信息動(dòng)態(tài)博弈的子博弈精煉納什均衡，剔除不可置信的威脅。在完全信息動(dòng)態(tài)博弈中，博弈參與者的行動(dòng)存在先后順序。第一節(jié)完全信息動(dòng)態(tài)博弈概述一、完全信息動(dòng)態(tài)博弈的定義在完全信息靜態(tài)博弈中，博弈參與者同時(shí)采取行動(dòng)。但在完全信息動(dòng)態(tài)博弈中，博弈參與者的行動(dòng)存在先后順序。從信息角度上，完全信息動(dòng)態(tài)博弈與完全信息靜態(tài)博弈類似，博弈參與者對(duì)博弈結(jié)構(gòu)、博弈順序、雙方收益等信息都具備完全了解。第一節(jié)完全信息動(dòng)態(tài)博弈概述一、完全信息動(dòng)態(tài)博弈的定義二、博弈樹(shù)在動(dòng)態(tài)博弈中，由于博弈參與者的行動(dòng)存在先后順序，因此可以用更形象的方法來(lái)表示動(dòng)態(tài)博弈：博弈樹(shù)（GameTree）。通過(guò)支付矩陣的形式表示的博弈通常被稱為策略型或正則型博弈（NormalFormGame）。通過(guò)博弈樹(shù)表示的博弈通常被稱為擴(kuò)展型博弈（ExtensiveFormGame）。二、博弈樹(shù)在動(dòng)態(tài)博弈中，由于博弈參與者的行動(dòng)存在先后順序，因動(dòng)態(tài)市場(chǎng)爭(zhēng)奪戰(zhàn)博弈的擴(kuò)展型表達(dá)方式如圖所示“市場(chǎng)爭(zhēng)奪戰(zhàn)”博弈的擴(kuò)展型表達(dá)形式動(dòng)態(tài)市場(chǎng)爭(zhēng)奪戰(zhàn)博弈的擴(kuò)展型表達(dá)方式如圖所示“市場(chǎng)爭(zhēng)奪戰(zhàn)”博弈1．博弈樹(shù)的構(gòu)成要素（1）博弈參與者（2）行動(dòng)順序：在動(dòng)態(tài)博弈中，博弈參與者的行動(dòng)存在先后次序。（3）行動(dòng)策略空間（ActionSet）：指博弈參與者可以采取的所有可能策略。（4）信息集（InformationSet）：指博弈參與者在博弈過(guò)程中所知道的信息。（5）支付函數(shù)指博弈參與者采用特定策略與所能得到的收益之間的關(guān)系。1．博弈樹(shù)的構(gòu)成要素（1）博弈參與者2．博弈樹(shù)的結(jié)構(gòu)（1）博弈樹(shù)的構(gòu)造方法首先行動(dòng)的一方位于博弈樹(shù)的最上端，根據(jù)動(dòng)態(tài)博弈過(guò)程中各方的行動(dòng)順序，博弈數(shù)自上至下延展。也有學(xué)者習(xí)慣自左至右構(gòu)造博弈樹(shù)。橫向博弈樹(shù)2．博弈樹(shù)的結(jié)構(gòu)（1）博弈樹(shù)的構(gòu)造方法橫向博弈樹(shù)博弈樹(shù)中包含若干“節(jié)點(diǎn)”，節(jié)點(diǎn)用小圓圈表示。位于博弈樹(shù)最上端的節(jié)點(diǎn)稱為“初始節(jié)點(diǎn)”。初始節(jié)點(diǎn)用空心小圓圈表示，其他節(jié)點(diǎn)均用實(shí)心小圓圈表示。在每個(gè)節(jié)點(diǎn)處均對(duì)應(yīng)某個(gè)博弈參與者，將節(jié)點(diǎn)對(duì)應(yīng)的博弈參與者標(biāo)識(shí)在節(jié)點(diǎn)旁邊。例如：在“市場(chǎng)爭(zhēng)奪戰(zhàn)”博弈中，因?yàn)闈撛谶M(jìn)入者先行動(dòng)，因此初始節(jié)點(diǎn)處對(duì)應(yīng)的博弈參與者為潛在進(jìn)入者。將潛在進(jìn)入者標(biāo)識(shí)在博弈樹(shù)初始節(jié)點(diǎn)旁邊。當(dāng)潛在進(jìn)入者決策之后，輪到在位者進(jìn)行決策。在位者所在的節(jié)點(diǎn)稱為“后續(xù)節(jié)點(diǎn)”。在位者位于兩個(gè)后續(xù)節(jié)點(diǎn)上。在位者都有兩種策略選擇：“斗爭(zhēng)”和“默許”。博弈樹(shù)中包含若干“節(jié)點(diǎn)”，節(jié)點(diǎn)用小圓圈表示。如果初始節(jié)點(diǎn)處的博弈參與者存在N種策略，那么就從初始節(jié)點(diǎn)處分出N條路徑。路徑用線段表示。在線段旁注明相應(yīng)的策略。在“市場(chǎng)爭(zhēng)奪戰(zhàn)”博弈中，首先行動(dòng)的潛在進(jìn)入者可以采取兩種策略：“不進(jìn)入”和“進(jìn)入”。因此，從初始節(jié)點(diǎn)處引出兩條線段，在兩條線段旁分別標(biāo)識(shí)“不進(jìn)入”和“進(jìn)入”。當(dāng)潛在進(jìn)入者選擇結(jié)束后，達(dá)到在位者的節(jié)點(diǎn)。在位者有兩個(gè)選擇：“斗爭(zhēng)”和“默許”。因此，從在位者的節(jié)點(diǎn)處引出兩條線段，在兩條線段旁分別標(biāo)識(shí)“斗爭(zhēng)”和“默許”。如果初始節(jié)點(diǎn)處的博弈參與者存在N種策略，那么就從初始節(jié)點(diǎn)當(dāng)博弈不再有后續(xù)節(jié)點(diǎn)時(shí)，需要將博弈的收益標(biāo)識(shí)在博弈樹(shù)末端。將博弈參與者的收益放在括號(hào)里。需要注意的是：各博弈參與者的收益需要按照各參與者行動(dòng)順序進(jìn)行排列。先行動(dòng)的博弈參與者的收益寫(xiě)在左邊，依次類推，從左到右，最后行動(dòng)的博弈參與者的收益寫(xiě)在最右邊。各個(gè)博弈參與者的收益之間用逗號(hào)分割。當(dāng)博弈不再有后續(xù)節(jié)點(diǎn)時(shí)，需要將博弈的收益標(biāo)識(shí)在博弈樹(shù)末端。（2）博弈樹(shù)與博弈順序博弈樹(shù)各節(jié)點(diǎn)之間存在順序關(guān)系，博弈樹(shù)由上至下的節(jié)點(diǎn)順序表示各博弈參與者進(jìn)行決策的順序。（2）博弈樹(shù)與博弈順序從博弈樹(shù)的節(jié)點(diǎn)可以引出多條線段，但不能從博弈樹(shù)多個(gè)節(jié)點(diǎn)共同到達(dá)博弈樹(shù)下方同一個(gè)后續(xù)節(jié)點(diǎn)。錯(cuò)誤的博弈樹(shù)構(gòu)造方法從博弈樹(shù)的節(jié)點(diǎn)可以引出多條線段，但不能從博弈樹(shù)多個(gè)節(jié)點(diǎn)共同到正確的博弈樹(shù)構(gòu)造方法正確的博弈樹(shù)構(gòu)造方法正確的博弈樹(shù)構(gòu)造方法正確的博弈樹(shù)構(gòu)造方法構(gòu)造博弈樹(shù)時(shí)只能按照由上至下的路徑，而不能存在由下向上的路徑，也不能形成循環(huán)路徑?；厮萋窂轿ㄒ恍栽谇蠼馔耆畔?dòng)態(tài)博弈時(shí)非常重要。因?yàn)樵谇蠼鈩?dòng)態(tài)博弈均衡時(shí)，一個(gè)很重要的方法是“逆向歸納法（BackwardInduction）”。只有首先確保從博弈樹(shù)任何最終節(jié)點(diǎn)向上回溯時(shí)路徑唯一，才能確保逆向歸納法的可操作性。構(gòu)造博弈樹(shù)時(shí)只能按照由上至下的路徑，而不能存在由下向上的路徑正確的博弈樹(shù)構(gòu)造方法正確的博弈樹(shù)構(gòu)造方法正確的博弈樹(shù)構(gòu)造方法正確的博弈樹(shù)構(gòu)造方法錯(cuò)誤的博弈樹(shù)構(gòu)造方法錯(cuò)誤的博弈樹(shù)構(gòu)造方法錯(cuò)誤的博弈樹(shù)構(gòu)造方法錯(cuò)誤的博弈樹(shù)構(gòu)造方法三、信息集與三人罷工博弈在完全信息動(dòng)態(tài)博弈中，如果將博弈樹(shù)的多個(gè)節(jié)點(diǎn)用虛線連接起來(lái)，表明這多個(gè)節(jié)點(diǎn)位于同一個(gè)博弈信息集中。也就是說(shuō)：博弈參與者不知道自己位于同一個(gè)信息中的哪個(gè)博弈節(jié)點(diǎn)上。可以通過(guò)“三人罷工博弈”來(lái)說(shuō)明信息集的含義以及信息集在動(dòng)態(tài)博弈中的重要性。三、信息集與三人罷工博弈在完全信息動(dòng)態(tài)博弈中，如果將博弈樹(shù)的1．三人罷工博弈的定義三人罷工博弈的博弈樹(shù)1．三人罷工博弈的定義三人罷工博弈的博弈樹(shù)2．三人罷工博弈的策略選擇與信息員工2只有一個(gè)信息集的博弈樹(shù)2．三人罷工博弈的策略選擇與信息員工2只有一個(gè)信息集的博員工3不能觀察到員工2的決策策略員工3不能觀察到員工2的決策策略員工3不知道員工1的決策策略員工3不知道員工1的決策策略員工3不知道員工1和員工2的決策策略員工3不知道員工1和員工2的決策策略三名員工都只有一個(gè)信息集的博弈三名員工都只有一個(gè)信息集的博弈四、博弈樹(shù)與靜態(tài)博弈博弈樹(shù)的方法不僅能表示動(dòng)態(tài)博弈，還能表示靜態(tài)博弈。所謂的“博弈先后順序”，它主要是一個(gè)信息的概念，而不是一個(gè)純時(shí)間先后的概念。用博弈樹(shù)表示囚徒困境四、博弈樹(shù)與靜態(tài)博弈博弈樹(shù)的方法不僅能表示動(dòng)態(tài)博弈，還能表示下面三種博弈表達(dá)方式所表達(dá)的博弈內(nèi)涵相同嫌疑人乙坦白不坦白嫌疑人甲坦白（5，5）（1，10）不坦白（10，1）（2，2）下面三種博弈表達(dá)方式所表達(dá)的博弈內(nèi)涵相同嫌疑人乙坦白不坦白嫌第二節(jié)完全且完美信息動(dòng)態(tài)博弈概述在完全且完美信息動(dòng)態(tài)博弈（DynamicGamewithPerfectandCompleteInformation）中，每個(gè)博弈參與者均知道在自己之前進(jìn)行決策的參與者選擇的策略和博弈結(jié)構(gòu)。博弈樹(shù)中每個(gè)節(jié)點(diǎn)都獨(dú)立構(gòu)成一個(gè)信息集，沒(méi)有虛線連接兩個(gè)或多個(gè)博弈樹(shù)節(jié)點(diǎn)。求解完全且完美信息動(dòng)態(tài)博弈的重要方法之一是：逆向歸納法?？梢酝ㄟ^(guò)“海盜分寶博弈”這個(gè)生動(dòng)有趣的故事對(duì)“逆向歸納法”進(jìn)行一個(gè)直觀介紹。第二節(jié)完全且完美信息動(dòng)態(tài)博弈概述在完全且完美信息動(dòng)態(tài)博弈一、海盜分寶博弈1．海盜分寶博弈的規(guī)則五個(gè)海盜首先進(jìn)行抽簽，確定決策順序。五個(gè)海盜按照決策順序依次提出對(duì)100個(gè)金幣的分配方案。第一個(gè)海盜提出一個(gè)分配方案，如超過(guò)半數(shù)的海盜（包括提出分配方案的海盜）同意第一個(gè)海盜的分配方案，即大于等于3名海盜同意第一個(gè)海盜的分配方案時(shí)，那么該方案被通過(guò)，博弈結(jié)束。如果第一個(gè)海盜提出的分配方案沒(méi)有得到超過(guò)半數(shù)海盜的同意，那么第一個(gè)海盜將被扔到海里喂鯊魚(yú)。接下來(lái)由第二個(gè)海盜提出分配方案，如果超過(guò)半數(shù)的海盜同意第二個(gè)海盜的分配方案時(shí)，那么該方案被通過(guò)，博弈結(jié)束。一、海盜分寶博弈1．海盜分寶博弈的規(guī)則如果第二個(gè)海盜提出的分配方案沒(méi)有得到超過(guò)半數(shù)海盜的同意，那么第二個(gè)海盜也將被扔到海里喂鯊魚(yú)。接下來(lái)由第三個(gè)海盜提出分配方案，如果超過(guò)半數(shù)的海盜，即大于等于2名海盜，同意第三個(gè)海盜的分配方案時(shí)，那么該方案被通過(guò)，博弈結(jié)束。如果第三個(gè)海盜提出的分配方案沒(méi)有得到超過(guò)半數(shù)海盜的同意，那么第三個(gè)海盜也將被扔到海里喂鯊魚(yú)。接下來(lái)由第四個(gè)海盜提出分配方案。如果超過(guò)半數(shù)的海盜同意第四個(gè)海盜的分配方案時(shí)，那么該方案被通過(guò)，博弈結(jié)束。如果第二個(gè)海盜提出的分配方案沒(méi)有得到超過(guò)半數(shù)海盜的同意，那么如果第四個(gè)海盜提出的分配方案沒(méi)有得到超過(guò)半數(shù)海盜的同意，那么第四個(gè)海盜也將被扔到海里喂鯊魚(yú)。這時(shí)就只剩下第五個(gè)海盜了，第五個(gè)海盜將獨(dú)吞搶劫來(lái)的100個(gè)金幣，博弈結(jié)束。在這種分配規(guī)則下，第一個(gè)海盜將提出怎樣的分配方案？第一個(gè)海盜提出的分配方案需要滿足兩個(gè)條件。第一，保證超過(guò)半數(shù)的海盜同意第一個(gè)海盜的分配方案。第二：第一個(gè)海盜最大化自己能分到的金幣。如果直接從第一個(gè)海盜的決策策略入手，此問(wèn)題相對(duì)復(fù)雜。不妨從第五個(gè)海盜入手，然后按照從后向前的順序依次逆向考察海盜的策略選擇。如果第四個(gè)海盜提出的分配方案沒(méi)有得到超過(guò)半數(shù)海盜的同意，那么2．求解海盜分寶博弈的均衡第一個(gè)海盜將提出怎樣的分配方案？此分配方案在保證能得到超過(guò)半數(shù)海盜同意的前提下應(yīng)最大化第一個(gè)海盜的利益。輪次分配方案提出者分配方案最后一輪海盜5自己獨(dú)吞全部100個(gè)金幣倒數(shù)第二輪海盜4任何分配方案都得不到通過(guò)倒數(shù)第三輪海盜3分配給第三個(gè)海盜100個(gè)金幣，第四個(gè)海盜0個(gè)金幣，第五個(gè)海盜0個(gè)金幣。倒數(shù)第四輪海盜2分配給自己98個(gè)金幣，第三個(gè)海盜0個(gè)金幣，第四個(gè)海盜1個(gè)金幣、第5個(gè)海盜1個(gè)金幣。通過(guò)逆向歸納法推導(dǎo)出的財(cái)寶分配方案2．求解海盜分寶博弈的均衡第一個(gè)海盜將提出怎樣的分配方案？此3．海盜分寶博弈的均衡第一個(gè)海盜的分配方案可以有兩種。分配方案1：分配給自己97個(gè)金幣，給第二個(gè)海盜0個(gè)金幣，給第三個(gè)海盜1個(gè)金幣，給第四個(gè)海盜2個(gè)金幣，給第五個(gè)海盜0個(gè)金幣。分配方案2：分配給自己97個(gè)金幣，給第二個(gè)海盜0個(gè)金幣，給第三個(gè)海盜1個(gè)金幣，給第四個(gè)海盜0個(gè)金幣，給第五個(gè)海盜2個(gè)金幣。如果第一個(gè)海盜提出分配方案1，那么第二個(gè)海盜和第五個(gè)海盜將反對(duì)，而第一個(gè)、第三個(gè)和第四個(gè)海盜將同意，因此第一個(gè)海盜的提議將獲得通過(guò)。如果第一個(gè)海盜提出分配方案2，那么第二個(gè)海盜和第四個(gè)海盜將反對(duì)，而第一個(gè)、第三個(gè)和第五個(gè)海盜將同意，因此第一個(gè)海盜的提議將獲得通過(guò)。3．海盜分寶博弈的均衡第一個(gè)海盜的分配方案可以有兩種。二、擴(kuò)展形式博弈的策略表達(dá)方式1．將擴(kuò)展形式的博弈改寫(xiě)為策略形式動(dòng)態(tài)博弈的擴(kuò)展表達(dá)形式二、擴(kuò)展形式博弈的策略表達(dá)方式1．將擴(kuò)展形式的博弈改寫(xiě)為策略參與者2UV參與者1L（a1，b1）（a2，b2）R（a3，b3）（a4，b4

）錯(cuò)誤的動(dòng)態(tài)博弈策略表達(dá)形式參與者2UV參與者1L（a1，b1）（a2，b2）R（a參與者2（U，U）（U，V）（V，U）（V，V）參與者1L（a1，b1）（a1，b1）（a2，b2）（a2，b2）R（a3，b3）（a4，b4）（a3，b3）（a4，b4）動(dòng)態(tài)博弈的策略表達(dá)形式參與者2（U，U）（U，V）（V，U）（V，V）參與者1L（參與者2(U,U,U)(U,U,V)(U,V,U)(U,V,V)(V,U,U)(V,U,V)(V,V,U)(V,V,V)參與者1L（a1,b1）（a1,b1）（a1,b1）（a1,b1）（a2,b2）（a2,b2）（a2,b2）（a2,b2）M（a3,b3）（a3,b3）（a4,b4）（a4,b4）（a3,b3）（a3,b3）（a4,b4）（a4,b4）R（a5,b5）（a6,b6）（a5,b5）（a6,b6）（a5,b5）（a6,b6）（a5,b5）（a6,b6）動(dòng)態(tài)博弈的擴(kuò)展表達(dá)形式動(dòng)態(tài)博弈的策略表達(dá)形式參與者2(U,U,U)(U,U,V)(U,V,U)(U,V,2．?dāng)U展形式轉(zhuǎn)化為策略形式時(shí)的規(guī)律參與者1的純策略空間為：參與者2的純策略空間為：參與者3的純策略空間為：2．?dāng)U展形式轉(zhuǎn)化為策略形式時(shí)的規(guī)律參與者1的純策略空間為參與者2的純策略空間為：參與者1的純策略空間為：參與者2的純策略空間為：第三節(jié)子博弈與逆向歸納法在圖中，用虛線框起來(lái)的部分稱作一個(gè)子博弈（Sub-Game）。第三節(jié)子博弈與逆向歸納法在圖中，用虛線框起來(lái)的部分稱作一一、子博弈子博弈是原始動(dòng)態(tài)博弈的一部分。子博弈包含博弈所需的各種信息，能獨(dú)立構(gòu)成一個(gè)博弈。一個(gè)博弈的子博弈需要滿足四個(gè)條件。1．子博弈的起始節(jié)點(diǎn)不能是原來(lái)博弈的起始節(jié)點(diǎn)2．子博弈不能分割信息集3．有些博弈包含多個(gè)子博弈4．有些博弈沒(méi)有子博弈一、子博弈子博弈是原始動(dòng)態(tài)博弈的一部分。子博弈包含博弈所需的二、逆向歸納法1．逆向歸納法的定義和求解方法逆向歸納法指：在求解動(dòng)態(tài)博弈時(shí)，首先找到博弈順序在最后的子博弈，找到子博弈中博弈參與者的策略選擇，然后按博弈順序由后向前逆向歸納，直至博弈樹(shù)的初始節(jié)點(diǎn)，從而找到博弈的均衡。二、逆向歸納法1．逆向歸納法的定義和求解方法1．逆向歸納法的定義和求解方法逆向歸納法指：在求解動(dòng)態(tài)博弈時(shí)，首先找到博弈順序在最后的子博弈，找到子博弈中博弈參與者的策略選擇，然后按博弈順序由后向前逆向歸納，直至博弈樹(shù)的初始節(jié)點(diǎn)，從而找到博弈的均衡。1．逆向歸納法的定義和求解方法北京大學(xué)博弈論ppt課件第3章-完全信息動(dòng)態(tài)博弈2．通過(guò)逆向歸納法求解博弈均衡實(shí)例2．通過(guò)逆向歸納法求解博弈均衡實(shí)例三、斯塔貝爾伯格寡頭博弈斯塔貝爾伯格博弈（StackelbergDuopolyGame）是寡頭博弈的一種常見(jiàn)形式，是一種完全信息動(dòng)態(tài)博弈。1．斯塔貝爾伯格寡頭博弈的定義斯塔貝爾伯格寡頭博弈：市場(chǎng)中有兩個(gè)廠商。廠商1先行動(dòng)，選擇自身產(chǎn)量。廠商2觀察到廠商1選擇的產(chǎn)量后，再?zèng)Q策自己的產(chǎn)量。廠商1通常被稱為領(lǐng)先者，廠商2通常被稱為跟隨者。三、斯塔貝爾伯格寡頭博弈斯塔貝爾伯格博弈（Stackelbe2．求解斯塔貝爾伯格寡頭博弈根據(jù)逆向歸納法，首先考慮廠商2如何選擇自己的產(chǎn)量.作為領(lǐng)先者，廠商1在決定自己的產(chǎn)量時(shí)會(huì)考慮自己的決策產(chǎn)量對(duì)廠商2的影響。求解得到：作為領(lǐng)先者的廠商1的產(chǎn)量為：作為跟隨者的廠商2的產(chǎn)量為：2．求解斯塔貝爾伯格寡頭博弈根據(jù)逆向歸納法，首先考慮廠商23．古諾寡頭博弈與斯塔貝爾伯格寡頭博弈在古諾寡頭博弈中，市場(chǎng)需求函數(shù)和廠商成本函數(shù)與斯塔貝爾伯格博弈均相同。二者的主要區(qū)別是：在古諾寡頭博弈中，兩家廠商同時(shí)進(jìn)行決策，是一個(gè)完全信息靜態(tài)博弈。在斯塔貝爾伯格寡頭博弈中，廠商1先行動(dòng)，廠商2后行動(dòng)，是一個(gè)完全信息動(dòng)態(tài)博弈。古諾寡頭博弈的均衡是：斯坦貝爾伯格寡頭博弈的均衡是：3．古諾寡頭博弈與斯塔貝爾伯格寡頭博弈在古諾寡頭博弈中，市場(chǎng)斯塔貝爾博弈寡頭博弈均衡示意圖斯塔貝爾博弈寡頭博弈均衡示意圖第四節(jié)子博弈精煉納什均衡澤爾滕（Selten）在1965年提出了“子博弈精煉納什均衡（SubgamePerfectNashEquilibrium）”的概念。子博弈精煉納什均衡也被稱為子博弈完美納什均衡。子博弈精煉納什均衡與納什均衡不同。納什均衡要求：給定其他參與者在均衡處的策略，任何一方博弈參與者在均衡處選擇的策略都是自己所能選擇的最優(yōu)策略，沒(méi)有博弈參與者有動(dòng)機(jī)改變自己在均衡時(shí)的策略。子博弈精煉納什均衡不僅要求均衡解是納什均衡，而且要求均衡解在每一個(gè)信息集上都是最優(yōu)解。第四節(jié)子博弈精煉納什均衡澤爾滕（Selten）在196一、子博弈精煉納什均衡的含義通過(guò)逆向歸納法求解博弈樹(shù)得到的均衡是子博弈精煉納什均衡。納什均衡僅需要在均衡處，每個(gè)博弈參與者沒(méi)有動(dòng)機(jī)改變自己的策略。子博弈納什均衡不僅要求均衡滿足納什均衡要求的條件，還要求在動(dòng)態(tài)博弈中，此均衡是每個(gè)子博弈的最優(yōu)解。也就是說(shuō)：納什均衡只對(duì)均衡處的策略有要求。子博弈精煉納什均衡不僅對(duì)均衡處的策略有要求，而且對(duì)到達(dá)均衡的路徑有要求。要求從博弈初始節(jié)點(diǎn)開(kāi)始，博弈參與者到達(dá)均衡處所經(jīng)過(guò)的路徑也必須是最優(yōu)的。一、子博弈精煉納什均衡的含義通過(guò)逆向歸納法求解博弈樹(shù)得到的均在“市場(chǎng)爭(zhēng)奪戰(zhàn)”博弈中，如果在位者選擇“斗爭(zhēng)”，那么潛在進(jìn)入者會(huì)選擇“不進(jìn)入”。如果在位者選擇“默許”，那么潛在進(jìn)入者會(huì)選擇“進(jìn)入”。對(duì)潛在進(jìn)入者來(lái)說(shuō)，在位者的“斗爭(zhēng)”策略是一種不可置信的威脅（NoncredibleThreat）或空洞的威脅（EmptyThreat）。子博弈精煉納什均衡就是把包含不可置信威脅的納什均衡從可能的均衡中剔除出去。顧名思義，“子博弈精練納什均衡”是對(duì)納什均衡的“精練”。通過(guò)剔除包含不可置信威脅的納什均衡，減少納什均衡的數(shù)目。在“市場(chǎng)爭(zhēng)奪戰(zhàn)”博弈中，如果在位者選擇“斗爭(zhēng)”，那么潛在進(jìn)入二、不可置信的威脅在很多完全信息動(dòng)態(tài)博弈中，都存在不可置信的威脅。1．“市場(chǎng)爭(zhēng)奪戰(zhàn)”博弈在“市場(chǎng)爭(zhēng)奪戰(zhàn)”博弈中，（潛在進(jìn)入者不進(jìn)入，在位者斗爭(zhēng)）這個(gè)納什均衡包含不可置信的威脅，因此不是一個(gè)子博弈精練納什均衡。如果在位者把“斗爭(zhēng)”變成一個(gè)可置信的威脅（CredibleThreat），那么博弈的均衡就會(huì)不同。二、不可置信的威脅在很多完全信息動(dòng)態(tài)博弈中，都存在不可置信的2．斯塔貝爾伯格寡頭博弈如果后行動(dòng)的跟隨者做出一個(gè)“威脅”：不管先行動(dòng)的領(lǐng)先者選擇何種產(chǎn)量，自己都會(huì)將產(chǎn)量定在對(duì)于領(lǐng)先者廠商來(lái)說(shuō)，這是一個(gè)可置信的威脅如果跟隨者在具有法律約束力的公證機(jī)構(gòu)簽署一項(xiàng)承諾：不管領(lǐng)先者選取何種產(chǎn)量水平，自己都會(huì)將產(chǎn)量定在，如果自己違反承諾，那么將自動(dòng)捐出的收益。跟隨者廠商的承諾變?yōu)橐粋€(gè)可置信的承諾。跟隨者廠商不可置信的威脅不會(huì)影響到先行動(dòng)的領(lǐng)先者廠商的產(chǎn)量決策。然而跟隨者可置信的威脅的確會(huì)影響到先行動(dòng)的領(lǐng)先者廠商的產(chǎn)量決策，進(jìn)而影響博弈均衡。2．斯塔貝爾伯格寡頭博弈如果后行動(dòng)的跟隨者做出一個(gè)“威脅”：三、逆向歸納法的擴(kuò)展應(yīng)用逆向歸納法不僅在求解完全且完美信息動(dòng)態(tài)博弈時(shí)非常有用，在某些完全但不完美信息動(dòng)態(tài)博弈中，逆向歸納法也有一定用武之地。三、逆向歸納法的擴(kuò)展應(yīng)用逆向歸納法不僅在求解完全且完美信息動(dòng)完全且完美信息動(dòng)態(tài)博弈博弈的均衡路徑是：參與者1選擇策略R，然后參與者2進(jìn)行決策參與者2選擇策略T，博弈結(jié)束。參與者1得到收益3、參與者2得到收益1。完全且完美信息動(dòng)態(tài)博弈博弈的均衡路徑是：四、逆向歸納法的局限和“蜈蚣博弈”雖然逆向歸納法是求解動(dòng)態(tài)博弈子博弈精煉納什均衡的有力工具，但根據(jù)逆向歸納法求解出的均衡有時(shí)卻是和常理相悖的?；蛘哒f(shuō)：通過(guò)逆向歸納法有時(shí)也會(huì)求解出“不合理”的均衡。經(jīng)濟(jì)學(xué)家羅森賽爾（Rosenthsal）提出的“蜈蚣博弈（CentipedeGame）”就是這樣一個(gè)典型例證。雖然通過(guò)逆向歸納法可以求出蜈蚣博弈的均衡解，但此均衡解的合理性受到了普遍挑戰(zhàn)。因此，蜈蚣博弈有時(shí)也被稱為“蜈蚣博弈悖論”，簡(jiǎn)稱“蜈蚣悖論（CentipedeParadox）”。四、逆向歸納法的局限和“蜈蚣博弈”雖然逆向歸納法是求解動(dòng)態(tài)博1．蜈蚣博弈的定義假設(shè)有兩名博弈參與者：參與者1和參與者2。兩名參與者輪流進(jìn)行決策：首先由參與者1進(jìn)行決策，然后是參與者2，再次是博弈參與者1，然后是博弈參與者2，依次類推。在博弈的初始節(jié)點(diǎn)處，參與者1有兩個(gè)策略可以選擇：T和C。策略T表示結(jié)束博弈（Terminate），策略C表示繼續(xù)（Continue）博弈。當(dāng)參與者1選擇策略T時(shí)，博弈結(jié)束。參與者1得到收益1，參與者2得到收益1。當(dāng)參與者1選擇策略C時(shí)，輪到博弈參與者2進(jìn)行決策。參與者2同樣面臨兩個(gè)策略選擇：策略T

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

北京大學(xué)博弈論課件第3章-完全信息動(dòng)態(tài)博弈

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

北京大學(xué)博弈論課件第3章-完全信息動(dòng)態(tài)博弈

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔